• 563.01 KB
  • 22页

水资源短缺的综合分析和预测(定稿)学位论文.doc

  • 22页
  • 关注公众号即可免费下载文档
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档由网友投稿或网络整理,如有侵权请及时联系我们处理。
'水资源短缺的综合分析和预测吴清柏钱咪咪庞新摘要水是人类社会发展的支柱没有水.随着社会的不断发展,人们对水资源的需求量不断增长,因此水资源紧缺程度不断增大,现如今已成为影响社会发展的主要制约因素之一.所以对水资源的分析与预测已经成为不可避免的热门话题.本文从以北京市为例,分析各个行业对水资源短缺的影响趋势,建立数学模型具体分析与判断.对于问题一采用灰色关联分析判断影响水资源短缺的主要影响因素,再用熵权值的方法来来确定权重系数验证.得到各个有效数值进行比较,然后判断在众多因素中的重要因素.对于问题二采用模糊概率理论进行分析,对水资源短缺风险发生的概率和缺水影响程度进行综合分析.构造隶属函数,利用logistic回归模型模拟.而后建立水资源短缺风险模型.对于问题三采用多元线性模型,最小二乘的方法得到未来几年内北京水资源情况的相关数据进行判断与预测并提出相应的措施.关键词:熵值法SPSS软件模糊概率法多元线性回归最小二乘 一、问题重述水资源,是指可供人类直接利用,能够不断更新的天然水体。主要包括陆地上的地表水和地下水。近年来,我国、特别是北方地区水资源短缺问题日趋严重,水资源成为焦点话题。以北京市为例,北京是世界上水资源严重缺乏的大都市之一,其人均水资源占有量不足300m3,为全国人均的1/8,世界人均的1/30,属重度缺水地区,附表中所列的数据给出了1979年至2000年北京市水资源短缺的状况。政府采取了一系列措施积极解决水资源短缺问题,如南水北调工程建设,建立污水处理厂,产业结构调整等。但是,气候变化和经济社会的不断发展,水资源短缺始终存在。北京各年的《统计年鉴》及市政统计资料提供了北京市水资源的相关信息(网上可获得)。利用这些资料和你自己可获得的其他资料,建立数学模型讨论以下问题:1、影响北京市水资源短缺的主要因素有哪些?2、对北京市水资源短缺的影响因素进行综合分析。3、对北京市未来几年的水资源短缺进行预测,并提出应对措施。二、问题分析问题一:为了寻找到影响北京水资源严重短缺的主要影响因素。在收集整理好各类数据后,我们可以通过求解其关联度来进一步确定影响事物的本质因素,使各种影响因素之间的“灰色”关系量化,同时我们规定缺水量=总用水量-水资源总量。问题二:水资源系统复杂,含有随机性和模糊性.采用logistic回归模型模拟和预测水资源短缺风险的概率基于模糊概率的资源短缺模型.进行判断. 问题三:通过利用线性回归和最小二乘的方法,进行分析.而后进行数据线性拟合预测未来水资源短缺问题.三、基本假设1、假设在未来的两年中不会发生重大自然灾害,如洪水、地震等.2、假设水资源总量全部为北京市地表水地下水量没有外部供水影响.3、假设所查找的数据真实有效.4、假设影响水资源短缺的各因素之间是相互独立的.四、符号说明为缺水系统中最小缺水量缺水系统中最大缺水量为供水量为需水量f(x)为风险发生的概率密度函数R为水资源短缺风险E总方差 五、模型的建立与求解问题一5.1.1在本题中,我们在提供的工业用水、农业用水、第三产业及其他用水几个影响因子基础上还增加了降水量,人口数量,污染处理能力,平均气温,工业污染,居民消费指数等九个影响因子。通过对1979年至2009年各个因素数据的分析,采用灰色关联分析对影响进行粗略的判断主要风险因子,再运用熵值法来确定权重系数的方法验证。由于熵值越小,表明指标值的变异程度越大,提供的信息量越多,在综合评价中所起的作用越大,其权重也越大,故我们最后可以通过各个因素的熵值大小,比较得出各个因子的权重大小,从而得到影响北京水资源短缺的主要风险因子。3.1.2灰色关联分析表1.1979-2000年北京市水资源短缺情况:年 份总用水量(亿立方米)农业用水(亿立方米)工业用水(亿立方米)第三产业及生活等其它用水(亿立方米)水资源总量(亿方)降水量(毫米)平均气温(摄氏度)污水处理能力(万立方米/日)人口数量(万人)居民消费价格指数缺水量(亿立方米)197942.9224.1814.374.3738.23718.411.123897101.84.69198050.5431.8313.774.9426380.7112390410624.54198148.1131.612.214.324393.212.325919101.324.11198247.2228.8113.894.5236.6544.412.325935101.810.62198347.5631.611.244.7234.7489.91325950100.512.86198440.0521.8414.3764.01739.31488.811.925965102.20.74198531.7110.1217.24.393872111.525981117.6-6.29198636.5519.469.917.1827.03665.312.1261028106.89.52198730.959.6814.017.2638.66683.912.3261047108.6-7.71198842.4321.9914.046.439.18673.912.7261061120.43.25198944.6424.4213.776.4521.55442.213.2261075117.223.09199041.1221.7412.347.0435.86697.312.7301086105.45.26199142.0322.711.97.4342.29747.912.5301094111.9-0.26199246.4319.9415.5110.9822.44541.512.851102109.923.99199345.2220.3515.289.5919.67506.7135112011925.55199445.8720.9314.5710.3745.42813.213.7251125124.90.45199544.8819.3313.7811.7730.34572.513.3591251117.314.54199640.0118.9511.769.345.87700.912.7591259111.6-5.86199740.3218.1211.111.122.25430.913.1591240105.318.07199840.4317.3910.8412.237.7731.713.1591246102.42.73199941.7118.4510.5612.714.22266.913.1591257100.627.49 200040.416.4910.5213.3916.86371.112.81291364103.523.54根据以上数据绘制曲线图如图一所示,由曲线可大致得出缺水量与各因子的影响大小,由图可知人口数量与降水量的曲线都与缺水量的曲线形状较接近,故具关联度。即可粗略得出人口数量与降水量为缺水量的主要因子。1999.001997.001995.001993.001991.001989.001987.001985.001983.001981.001979.00年份1400.001200.001000.00800.00600.00400.00200.000.00Mean居民消?价格指?工?污染平均气?污水?理能力人口?量降水量第三产业及生活其它用水工业用水农业用水缺水量5.1.2熵值法确定权重系数在确定评价指标的权重时,往往多采用主观确定权重的方法,如AHP方法等。这样就会造成评价结果可能由于人的主观因素而形成偏差。在信息论中,熵值反映了信息无序化程度,其值越小,系统无序度越小,故可用信息熵评价所获系统信息的有序度及其效用,即由评价指标值构成的判断矩阵来确定指标权重,它能尽量消除各指标权重计算的人为干扰,使评价结果更符合实际。其计算步骤如下:(1)构建m个事物n个评价指标的判R=()nm(i=1,2,…,n;j=1,2,…,m)。(2)将判断矩阵归一化处理,得到归一化判断矩阵B 式中:、分别为同指标下不同事物中最满意者或最不满意者(越小越满意或越大越满意)。(3)根据熵的定义,m个评价事物n个评价指标,可以确定评价指标的熵为:为使有意义,当=0时,根据风险评价的实际意义,可以理解为一较大的数值,与相乘趋于0,故可认为=0。但当=1,也等于0,这显然与熵所反映的信息无序化程度相悖,不切合实际,故需对加以修正,将其定义为:(4)计算评价指标的熵权W,且满足5.1.3权重的求解及主要风险因子的确定我们通过3.1.2中涉及的熵值求权重的方法,运用MATLAB编程得到了各个因素的熵值,通过比较可以得到影响北京市水资源短缺的主要风险因子。熵值法的主要运算结果见下表:表二:各个风险因子归一化后的 年份 农业用水 工业用水人口数量 降水量平均气温 工业污染 第三产业及生活用水居民消费指标价格 污水处理能力19790.36370.25350.4110.24040.17210.19910.14360.37180.306819800.39350.25260.360.193280.18290.25680.14760.31980.2964 19810.33130.260.29430.15260.20220.2390.19310.30380.285 19820.27550.26190.3310.22720.2190.25640.22880.28040.280919830.26560.26190.30210.22040.23740.29770.23480.26790.2667 19840.25580.27130.26730.24080.26040.31910.25550.26380.272319850.24270.31810.24410.25090.28210.27880.25730.21790.1956 19860.22960.4210.22870.25770.30850.22740.26730.25580.165619870.21640.46780.20550.28480.340.31930.27720.18590.157919880.19680.50510.20550.30520.34420.39820.28720.20590.1534表二:各个风险因子的熵以及熵权  农业用水 第三产业及生活用水工业用水居民消费指标价格  人口数量 降水量污水处理能力平均气温 工业污染H0.13890.14980.14120.15730.15940.15920.15560.14130.1249W0.11220.11080.11190.10980.10960.10960.11010.11190.1141由上表可知:农业用水、第三产业及生活用水,工业用水、居民消费指标价格 ,人口数量、降水量、污水处理能力、平均气温、工业污染的熵权值分别为:0.1122、0.1108、0.1119、0.1098、0.1096、0.1096、0.1101、0.1119、0.1141。由于熵值越小影响越大,其权重也越大的原则,我们可以很清楚的知道:在影响北京水资源短缺的众多因素中,北京市人口总数以及北京市降雨量对其影响程度较大。问题二就风险的含义来说,应包括以下两个方面:第一,指事故发生的可能性,或事故发生的不确定性;第二,只事故本身。因此对风险的度量有两个方法:一是以风险率度量,即系统实施的可能性;而是衡量风险破坏深度、历时等的指标,即系统失事的结果。但风险R不仅是风险事件发生的概率P的函数,而且是风险发生事件所产生的后果的函数。这一点很容易理解,一个事故发生风险的概率可能很高,但产生的后果损失很小的风险事件其风险不一定很高;相反,虽然某一个风险发生的概率不是很高,但是它的损失可能很大。同理,水资源系统是一个复杂的大系统,广泛存在着随机性和模糊性,由于随机性是因果律的破缺、模糊性是排中率的破缺,所以应在水资源短缺风险评价模型的设计中同时考虑这两种因素的影响。以下我们就这两个方面进行讨论(一).水资源短缺风险的模糊性:对于水资源系统来说,所谓的风险就是供水量小于需水量,从而使得整个水资源系统处于水资源短缺状态,即发生了水资源短缺风险。基于水资源的模糊不确定性,构造一个合适的隶属函数来描述水资源短缺带来的损失。定义模糊集如下: =式中:x为缺水量,x=—,为缺水量在模糊集上的隶属函数,构造如下:0,,(1)1,式中:、分别为水资源总量和需水总量;为缺水系统中最小缺水量;为缺水系统中最大缺水量;p为大于1的正整数。通过北京1979-2009年数据可知,为0.45,为27.49,而此时的p取8。则上的隶属函数可化作:0,,(2)1,(二).水资源短缺风险的模拟概率分布因为Logistic回归方法具有对因变量数据要求低、计算结果唯一、模型精度高等优点,所以在此采用Logistic回归模型来模拟缺水量系列的概率分布。则关于缺水量的Logistic回归模型可写为:(3)式中:分别为自变量的系数和常数,此时的称为Logistic回归系数;e为自然对数。用SPSS软件进行Logistic回归分析的具体流程图如下:1、样品处理摘要:案例处理汇总未加权的案例aN百分比选定案例包括在分析中31100.0 缺失案例0.0总计31100.0未选定的案例0.0总计31100.0a.如果权重有效,请参见分类表以获得案例总数。2、因变量编码:这是很重要的信息,告诉我们不同年份的缺水结果。我们用1表示缺水,用0表示不缺水,也就是说,在这次SPSS分析过程中便于分析。因变量编码初始值内部值.0001.001块0:起始块3、初始分类表;Logistic建模如同其他很多种建模方式一样,首先对模型参数赋予初始值,然后借助迭代计算寻找最佳值。以误差最小为原则,或者以最大似然为原则,促使迭代过程收敛。当参数收敛到稳定值之后,就给出了我们需要的比较理想的参数值。下面是用初始值给出的预测和分类结果。这个结果主要用于对比,比较模型参数收敛前后的效果。分类表a,b已观测已预测VAR000060.001.00百分比校正步骤0VAR000060.0005.01.00026100.0总计百分比83.9a.模型中包括常量。b.切割值为.500 4、初始化方程中的变量:从这个表中可以看到系统对模型的最初赋值方式。。最开始仅仅对常数项赋值,结果为B=1.649,标准误差为S.E.=0.488,于是Wald值为11.3898,后面的df为自由度,即df=1;Sig.为P值,Sig.=0.001。注意Sig.值越低越好,一般要求小于0.05。Exp(E)是B还原之后数值为5.200;方程中的变量BS.E,WalsdfSig.Exp(B)步骤0常量1.6490.48811.39810.0015.2005、不在初始方程中的变量:得到的得分数值满足要求。不在方程中的变量得分dfSig.步骤0变量VAR0001214.59910.000总统计量14.59910.000块1:方法=输入6、模型系数的混合检验:模型系数的综合检验卡方dfSig.步骤1步骤27.39210.000块27.39210.000模型27.39210.0007,、模型摘要:模型摘要中给出最大似然平方的对数、Cox-Snell拟合优度以及Nagelkerke拟合优度值。最大似然平方的对数值(-2loglikelihood=9.173)用于检验模型的整体性拟合效果,该值在理论上服从卡方分布,上面给出的卡方临界值5.991,因此,最大似然对数值检验通过。ModelSumm模型汇总步骤-2对数似然值Cox&SnellR方NagelkerkeR方 19.173a0.6340.903(拟合度为0.903)8、Hosmer和Lemeshow检验:分类表a已观测已预测VAR000060.001.00百分比校正步骤1VAR000060.0050100.01.0012594.2总计百分比96.8a.切割值为.500(总的预测正确率为96.8%,全部31组数据30个预测准确,1个预测失败,模拟效果良好)10、对应于Hosmer-Lemeshow检验的列联表:方程中的变量BS.E,WalsdfSig.Exp(B)步骤1aVAR000120.38913.1390.00110.9780.974常量230.37516.2050.00010.9941E+015a.在步骤1中输入的变量:VAR00012.(自变量系数为230.37常数为0.389.)即b0=230.37,b1=0.389;则用Logistic回归模型求出的缺水概率函数为(4)(三)利用模糊概率法评价水资源短缺风险的综合评价将水资源短缺风险定义为模糊事件发生的概率,及模糊概率为(5)式中:为n维欧氏空间,为模糊事件的隶属函数;P为概率测定。 如果,则(6)其中是随机变量y的概率密度函数。水资源短缺风险的定义可表示为(7)从式(5)—(7)可知:上述风险定义将水资源短缺风险存在的模糊性和随机性联系在一起,其中,随机不确定性体现了水资源短缺风险发生的概率,而模糊不确定性则体现了水资源短缺风险的影响程度。根据式(2)、(4)、(7)建立的水资源短缺风险评价模型,得到北京市1979—2009年的水资源短缺风险的计算结果如图2所示。图2北京市1979-2009年的水资源短缺风险由图可以看出,1982、1984、1985、1987、1991、1994、1996、2008年的风险值均非常小,接近于0.而1980、1989、1999年的风险值较大,均大于0.8。而2008-2009年的风险有升高的趋势。以上分析说明模型的计算与实际情形是吻合的,可以付诸实践。 问题三要求对北京市未来两年水资源的短缺风险进行预测,并提出应对措施。在对北京市未来两年水资源的短缺风险进行预测中,建立了多元线性回归模型来预测。多元线性回归从多个方面考虑各种因素对水资源短缺风险的影响,通过线性拟合得到各个因素影响下供求差值的走势图。最后得到对北京市未来两年水资源短缺风险的预测预测。表三.2000-2008年北京市水资源短缺情况:年份农业用水工业用水第三产业及生活用水人口规模降水量年污水再生量200016.4910.5213.391364371.1129200117.49.212.31385338.9144200215.57.511.61423370.4181200313.88.413.61456444.9215200413.57.713.41493483.5255200513.26.814.51583410.7324200612.86.215.31581318331200712.45.816.61633483.93532008125.217.91695626.33295.3.1多元线性回归模型(一)多元线性回归模型的概念在许多实际问题重中,我们所研究的因变量的变动可能不仅与一个解释变量有关,因此,有必要考虑线性模型的更一般形式,即多元线性回归模型:在这个模型中,Y由X1,X2,X3,…,XK解释,有K+1个未知参数。这里,“斜率”βj的含义是在其他变量不变的情况下,Xj改变一个单位对因变量所产生的影响。回到一般模型即对于n组观测值,有…… 其矩阵形式为:其中(二).多元线性回归模型的估计多元线性回归模型的估计与双变量线性模型类似,仍采用最小二乘法。计算要复杂得多,通常要借助计算机。理论推导需借助矩阵代数。下面给出最小二乘法应用于多元线性回归模型的假设条件、估计结果及所得到的估计量的性质。1.假设条件(1)E(ut)=0,t=1,2,…,n(2)E(uiuj)=0,i≠j(3)E(ut2)=,t=1,2,…,n(4)Xjt是非随机量,j=1,2,…,k;t=1,2,…,n除上面4条外,在多个解释变量的情况下,还有两个条件需要满足:(5)(K+1)