• 77.00 KB
  • 37页

《水资源管理》课程单元辅导(上).doc

  • 37页
  • 关注公众号即可免费下载文档
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档由网友投稿或网络整理,如有侵权请及时联系我们处理。
'—————————————————————精品文档————————————————————《水资源管理》课程单元辅导(上)37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————《水资源管理》课程单元辅导(上)37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————《水资源管理》课程单元辅导(上)37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————《水资源管理》课程单元辅导(上)37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————水资源管理课程辅导一  1.泰森多边形法的概念  在水文计算中,常需要推求大面积或全流域的降雨量。泰森多边形法是推求流域降雨量的一种方法。  该法先将流域内相邻的雨量站用直线连接起来(见文字教材图2.9中的实线段),然后作各条连线的垂直平分线(图中虚线),将流域划分为若干个多边形(此时每个多边形内都有一个雨量站)。以各多边形的面积为权数,可求得各雨量站同时段降雨量的平均值,并将其作为流域平均降雨量。  泰森多边形法应用较广,但当降雨空间分布很不均匀时,计算精度将降低。  2.水资源的形成与径流有何关系?径流形成的过程是怎样的?明确了径流形成过程后,可以得到哪些认识?  如前述,自然界中的水是在不断运动着的。因为存在着水循环,所以一个区域的水资源具有再生性。水资源是指某一地区逐年可以恢复和更新的,可以被利用的淡水资源。水资源包括地表水和地下水。  一个地区的地表水资源数量可以用地面径流的多年平均年径流量表示。地下水资源量可以按多年平均的地下水年补给水量或排泄水量计算(见第10章)。  因此,一个区域水资源的形成,实际上可以看为地面径流与地下径流的形成过程。  我国大部分地区由降雨形成径流。当一次降雨开始后,部分雨水被植物的枝叶拦截,成为植物截留量。超过植物截留能力的雨水降落到地面,其中部分在低洼地带形成积水,成为填洼量。  当地下水埋藏较深时,大部分土壤地下水面以上的土体中包含着空气,是土、水和空气组成的三相体,称为包气带。降雨降落到包气带表面后,通过土壤的空隙渗入地下,使包气带中的土壤含水量增大。  在开始阶段,只有少量直接降落到河、湖中的降水产生径流,而植物截留、填洼、渗入土壤中的水均不能产生径流,称为降雨形成径流的损失量。  当降雨持续降落,使土壤含水量超过田间持水量时,渗入的水将在重力作用下下渗,补充地下水。  在土壤中,并在第一稳定隔水层以上,具有自由水面的地下水称为浅层地下水,又称潜水。  处于稳定隔水层之间,并位于透水层以上的地下水称为深层地下水。深层地下水一般具有压力水头,可形成自流水或非自流水,并可作为地下径流注入河流。深层地下水的补给周期可能长达数万年或更长时间,是在漫长的地质年代中形成的。  当降落到地表的降雨使植物截留、洼地蓄水和表层土壤储存水都得到满足,且后续降雨强度超过下渗强度时,超过下渗强度的降雨开始沿坡面流动,这种坡面漫流注入河槽便形成地面径流。  包气带的上层,通常由于植物根系的存在,成为疏松的表土层,其入渗能力远高于下层土壤,使两层土壤间形成相对的不透水层。在降雨强度超过下渗强度后,会有一部分水沿包气带的上层流动,并注入河槽中,成为表层径流(又称壤中流)。表层径流是地面径流的组成部分。  降雨形成的径流汇集到河网中后,从河流的上游流向下游。当降雨和坡面漫流停止后,表层径流将在一段时间内继续补充河槽中的径流,而后逐渐消退,继而河流完全由浅层和深层地下水补给。  明确了以上径流形成过程后,可以得到以下认识。  (1)在径流形成过程中,大气降水、地表水、地下水是相互联系,并不断相互转化的。这种转化在水资源分析中称为“三水转化”37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————。  (2)形成径流的降水过程相对较短,变化较快,而径流过程长于降雨过程,同时变化过程较降水平缓,且明显滞后。另外,由于水量损失的存在,流域出口断面的径流总量小于流域的降水量。  (3)径流包括地面径流和地下径流。降雨降落到地面后,沿坡面流动,并经过沟涧流入河道,以及降水渗入土壤表面,沿包气带形成表层径流注入河槽,最终流到河流出口断面,形成地面径流。而降水渗入地下,补充地下水,并以渗流方式补给河道水体,形成地下径流。  (4)因地下水流速小,地下径流较地面径流变化缓慢,且能在更长期间内对河流进行补充。当河流河床下切较深时,地下径流稳定,成为河流水量的基础部分,故地下径流又称为基流。  (5)地下水中的深层地下水虽然有可能补充地表水,但因其是在漫长的地质年代中形成的,其补给周期可能长达数万年或更长时间,实际上并没有加入以年或更短时间为周期的水循环,一旦被耗用后很难得到补给和恢复。因此,在水资源数量评价中,一般不计入深层地下水。  以上介绍中的包气带、降雨形成径流的损失量、浅层地下水(潜水)、深层地下水、地面径流、表层径流、三水转化、基流等内容十分重要,应注意掌握。  3.产流与汇流的概念  在水文分析计算中,将径流的形成过程概化为产流和汇流两个阶段。从降雨降落到流域地面而产生径流,称为产流,包括流域地面径流产流和地下径流产流。降落到地面的雨水,从流域各处向流域出口断面汇集的过程称为汇流,包括地面径流汇流和地下径流汇流。地面径流的汇流又包括坡面汇流(含地表径流汇流和壤中流汇流)以及河网汇流。  径流的形成过程还可以概化为产流和汇流两个阶段。从降雨降落到流域表面到产生径流的过程,称为产流。降落到地面的雨水,从流域各处向流域出口断面汇集的过程称为汇流。  需要说明,把径流过程划分为产流与汇流两个阶段是为了便于进行有关的分析计算。实际上,产流与汇流是交错进行,不能截然分开的。  4.如何学习“水文测验与水文调查”37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————这部分内容?  水利水电工程与管理专业学习水文测验与水文调查这部分内容,最主要的目的是了解水文资料是如何得来的。也就是说,学习这部分内容的目的主要是为了便于分析和应用水文资料,如果工作中需要进行实际的水文测验或调查,还需要补充更多的有关知识。  学习这部分内容的重点,可以放在流量测验和流量资料整编上。对于流量资料整编,需要明确它的目的和意义,以及水位流量关系的不同情况和延长水位流量关系的基本方法。  如有条件,可组织学员到水文站参观,实地了解和学习水文测验方法及有关知识。课程辅导二水文统计方法1.学习水文统计方法要注意什么?水文统计方法十分重要。因为水文统计的一些基本概念、基本方法,比如随机事件、随机变量、概率、统计规律、频率曲线、适线法、相关分析等,不但在水资源管理这门课程中要经常用到,而且是水利专业人员应当掌握的最基本的知识。这部分内容又比较抽象,而且在认识具有随机性的事物时,要求在思维方法上有所转变,更增加了学习的难度。以上两方面使得水文统计方法成为本课程中既是重点又是难点的内容。在学习水文统计方法时,一方面要充分重视,注意多下一些功夫,另一方面仍要着重理解和掌握基本概念、基本理论、基本方法,并注意掌握一些最实用的内容。2.什么是随机事件和概率(1)随机事件在客观世界中,不断地出现和发生一些事物和现象。这些事物和现象可以统称为事件。时间的发生有一定的条件。 37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————经分析,就因果关系来看,有一类事件是在一定的条件下必然发生的。这种在一定的条件下必然发生的事件称为必然事件。另有一类事件在一定的条件下是必然不发生的。这种在一定的条件下必然不发生的事件称为不可能事件。必然事件或不可能事件虽然不同,但又具有共性,即在因果关系上都具有确定性。除了必然事件和不可能事件以外,在客观世界中还有另外一类事件,这类事件发生的条件和事件的发生与否之间没有确定的因果关系。这种发生的条件和发生与否之间没有确定的因果关系的事件称为随机事件。在长期的实践中人们发现,虽然对随机事件作一两次或少数几次观察,随机事件的发生与否没有什么规律,但如果进行大量的观察或试验,又可以发现随机事件具有一定的规律性。比如一枚硬币,投掷一次或几次的时候看不出什么规律,但是在同样的条件下反复多次进行试验,把硬币投掷成千上万次,就会发现硬币落地时正面朝上和反面朝上的次数大致是相等的。再比如,一条河流的某一个断面的年径流量在各个年份是不相同的,但进行长期观测(如观测30年、50年、80年),就会发现年径流量的多年平均值是一个稳定数值。随机事件所具有的这种规律称为统计规律。具有统计规律的随机事件的范围是很广泛的。随机事件可以是具有属性性质的,比如投掷硬币落地的时候哪一面朝上,出生的婴儿是男孩还是女孩,天气是晴、是阴,有没有雨、雪,商业上股票买卖的盈亏,城市里交通事故的发生等等。随机事件也可以是具有数量性质的,比如射手打靶的环数,建筑结构试件破坏的强度,某条河流发生洪水的洪峰流量等等。(2)概率概率论和数理统计是数学中的两个分支。研究随机事件统计规律的学科称为概率论。由随机现象的一部分实测资料研究和推求随机事件全体的规律的学科称为数理统计。概率是表示统计规律的方式。用概率可以表示和度量在一定条件下随机事件出现或发生的可能性。针对不同的情况,概率有不同的定义。按照数理统计的观点,事物和现象都可以看为是试验的结果。如果试验只有有限个不同的试验结果,并且它们发生的机会都是相同的,又是相互排斥的,则事件概率的计算公式为式中P(A)——随机事件A的概率;n——进行试验可能发生结果的总数;m——进行试验中可能发生事件A的结果数。例如,掷骰子(俗称“掷色子”37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————)的情况就符合以上公式的条件。因掷骰子可能发生的结果是有限的(1到6点),试验可能发生结果的总数是6;同时骰子是一个均匀的6面体,掷骰子掷成1点到6点的可能性都是相同的,又是相互排斥的(一次掷一个骰子不可能同时出现两个点)。如果定义Z为随即事件“掷骰子的点数大于2”,则符合Z的结果为3、4、5、6点4种情况,即事件Z可能发生的结果数是4。按照上述公式,Z的概率像这种比较简单的,等可能性、相互排斥的情况,是概率论初期的主要研究对象。故按上面公式确定的事件概率称为古典概率。在客观世界里中,随机事件并不都是等可能性的。如射手打靶打中的环数是随机事件,但打中0环到10环各环的可能性并不相同,优秀的射手打中9环、10环的可能性大,而新手打中1环、2环的可能性就较大。一条河流出现大洪水的可能性和一般洪水的可能性显然也是不同的。为了表示不是等可能性情况的统计规律,概率论中对概率给出了更一般的定义。在同样条件下进行试验,将事件A出现的次数μ称为频数,将频数μ与试验次数n的比值称为频率,记为P(A),则大量的实践证明,当着试验的次数充分大的时候,随机事件的频率会趋于稳定。概率的统计定义如下:在一组不变的条件下,重复作n次试验,记μ是事件A发生的次数,当试验次数很大时,如果频率μ/n稳定地在某一数值p的附近摆动,而且一般说来随着试验次数的增多,这种摆动的幅度愈变愈小,则称A为随机事件,并称数值p为随机事件A的概率,记作P(A)=37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————p(以上可简单地说成,频率具有稳定性的事件叫做随机事件,频率的稳定值叫作随机事件的概率)。概率的统计定义它既适用于事件出现机会相等的情况,又适用于事件出现机会不相等的一般情况。前述的必然事件和不可能事件发生的可能性也可以用概率表示。必然事件的概率等于1.0(表示事件必然发生);不可能事件的概率等于0(表示事件发生的可能性是0,必然不发生);一般随机事件的概率介于0和1.0之间。对于概率的统计定义还需注意,进行统计试验的条件必须是不变的。如果条件发生了变化,即使试验的次数再多,也不能求得随机事件真正的概率。如要确定某一个射手打靶射中不同环数的概率,必须让射手在同样的条件下进行射击,如射击的射程、靶型、武器、风力等都不应改变。类似地,进行水文统计时,水文现象的各种有关因素也应当是不变的。如果流域的自然地理条件已经发生了比较大的变化,还把不同条件下的水文资料放在一起进行统计就不合理了(第4章中将要介绍,发生这种情况的时候,应当把实测水文资料进行必要的还原和修正以后,再进行统计计算。3.什么是随机变量,怎样表示随机变量的概率分布?要进行水资源管理工作及对水资源进行配置、节约和保护,必须了解和掌握水资源的规律,必须预测未来水资源的情势。但因影响水资源的因素十分众多和复杂,目前还难于通过成因分析,对水资源进行准确的长期预报。实际工作中采用的基本方法是对于水文实测资料进行分析、计算,研究和掌握水文现象的统计规律,然后按照统计规律对未来的水资源情势进行估计。而这样做,需要对随机事件定量化地表示,为此引入随机变量。按照概率论理论,随机变量是对应于试验结果,表示试验结果的数量。如在工地上检验一批钢筋,可以随机抽取几组试件进行检验,每一组试件检验不合格的根数就是随机变量。又如某条河流,其历年的最大洪峰流量、最高水位、洪水持续时间等都可看为随机变量。随机变量的数学定义为:在一组不变的条件下,试验的每一个可能结果都唯一对应到一个实数值,则称实数变量为随机变量(“唯一对应”又称“一一对应”,是指每一个试验结果,就只对应一个数据,而每一个数据,又只对应一个试验结果)。随机变量常用大写字母来表示,如随机变量X(注意这里大写的X是变量,X的取值可以是x1、x2、……xn,即X表示随机取值的系列x1、x2、……xn)。随机变量可以分为两类:37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————(1)离散型随机变量如果随机变量是可数的,即随机变量的取值是和自然数一一对应的,就称为离散型随机变量。离散型随机变量不能在两个相邻随机变量取值之间取值。离散型随机变量可以是有限的,也可以是无限的,但必须是可数的。(2)连续型随机变量如果随机变量的取值是不可数的,也就是在有限区间里面,随机变量可以取任何值,就称为连续型随机变量。比如,某一个长途汽车站,每隔30分钟有一班车发往某地。对于一位不知道长途汽车时刻表的旅客,来车站等车到出发的时间是一个随机变量,这个随机变量取值可以是从0到30分钟区间的任意值,所以是一个连续型随机变量。连续型随机变量是普遍存在的。水文变量,如降雨量、降雨时间、蒸发量、河流的流量、水量、水位等等,都是连续型随机变量。对于随机变量,仅仅知道它的可能取值是不够的,更为重要的是了解各种取值出现的可能性有多大,也就是明确随机变量各种取值的概率,掌握它的统计规律。随机变量取值与其概率的对应关系称为随机变量的概率分布。对于离散型随机变量,可以用列举的方式表示它的概率分布。列举的方法可以是列表,画图等,文字教材中举了例子。对于连续型随机变量,因为它是不可数的,不能一一列举,所以也就也不能用列举的方法表示概率分布。比如前面提到的乘客在长途汽车站等车的例子,等车时间可以是0到30分钟区间里的任何时间,故无法列举所有的随机变量及其相应概率。实际上,等车时间在0到30分钟的任何时间的可能性是相等的,对于这个区间的任意时间,其概率等于无穷大分之一,即近似等于0。从这个例子可以看出,列举连续型随机变量各个值的概率不仅做不到,而且实际上是没有意义的。为此,我们转而研究和分析连续性随机变量在某一个区间取值的概率。在工程水文里面,习惯于研究某一水文变量大于或等于某一数值的概率。对于一个随机变量,大于或等于不同数值的概率是不同的。当随机变量取为不同数值时,随机变量大于等于此值的概率也随之而变,即概率是随机变量取值的函数。这一函数称之为随机变量的概率分布函数。分布函数的公式为F(x)=P(X≥x)式中X——随机变量;x——随机变量X的取值;P(X≥x)——随机变量X取值大于或等于x的概率;F(x)——随机变量X的分布函数。随机变量的分布函数可用曲线的形式表示。在工程水文里面,又习惯于将水文变量取值大于或等于某一数值的概率称为该变量的频率,同时将表示水文变量分布函数的曲线称为频率曲线。分布函数、水文变量的频率,以及频率曲线这些概念均十分重要,需注意理解和掌握。对于连续性随机变量,还有另一种表示概率分布的形式—概率密度函数。按照概率论的定义,概率密度函数是分布函数的导数。概率密度函数在某一个区间的积分值,表示随机变量在这个区间取值的概率。在工程水文中,频率是水文变量取值大于或等于某一数值的概率,因此,水文变量的频率就是概率密度函数从变量取值到正无穷大区间的积分值。用公式表示,水文变量频率和概率密度函数之间的关系可以写为(此式中,F(x)是随机变量X的分布函数值,也就是水文变量X取值为x时候的的频率,而p(x)是概率密度函数。如前述,水文变量的分布函数可以用频率曲线表示。类似地,概率密度函数也可以用概率密度函数曲线表示。因分布函数和概率密度函数之间存在着对应关系,频率曲线和概率密度函数曲线之间也存在着对应关系,这种对应关系可以用文字教材的图3.3表示。图37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————3.3中,左面是概率密度函数曲线,右面是频率曲线。图中两面的纵坐标均表示随机变量的取值,左面的横坐标表示概率密度函数值,右面的横坐标表示频率。左面随机变量取值的概率密度函数值越大,表明随机变量在这个值附近区间取值的概率越大。因频率F(xi)是概率密度函数从xi到正无穷大这个区间的积分,所以,右面的F(xi)等于左图中xi以上的阴影面积。从图中可以看到,xi取值越小,阴影面积越大,频率F(xi)取值也越大。这显然是合理的,因为随机变量取值越小,大与等于这个取值的可能性越大。对这张图里面表示的各种关系一定要注意掌握。4.经常听到“多少年一遇的洪水”、“多少年一遇的干旱”这样的说法,如何正确理解?“多少年一遇”,实际上是“重现期”,是工程和生产上,用来表示随机变量统计规律的概念。重现期表示在长时间内,随机事件发生的平均周期。即在很长的一段时间内,随机事件平均多少年发生一次。重现期这个名词听起来比较通俗,但需注意理解:第一,重现期和概率一样,都表明随机事件或随机变量的统计规律。说某一条河流发生了“百年一遇洪水”,是指从很长一个时期来看,大于或等于这次洪水的情况,平均100年出现一次。重现期是对于类似于洪水这样的随机事件发生的可能性的一种定量描述。不能理解为百年一遇的洪水每隔100年一定出现一次。实际上,百年一遇洪水可能间隔100年以上时间发生,也可能连续两年接连发生。第二,水文随机变量是连续型随机变量,水文变量的频率是水文变量大于或等于某个数值的概率。对应于频率,水文变量的重现期是指水文变量在某一个范围内取值的周期。如某条河流百年一遇的洪水洪峰流量是1000m3/s,是指这条河流洪峰流量大于或等于1000m3/s的洪水重现期是100年,而不是指洪峰流量恰恰等于1000m3/s的洪水重现期是100年。第三,水利工程中所说的重现期,是指对工程不利情况的重现期。对于洪水、多水的情况,水越大对工程越不利。此时,重现期是指水文随机变量大于或等于某一数值这一随机事件发生的平均周期。如用大写的T表示重现期,用大写的P表示频率,按照频率和周期互为倒数的关系,可知洪水、多水时,重现期计算公式为因洪水、多水的时候,频率P小于或等于50%,此公式的适用条件又可写为P≤37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————50%。对于枯水、少水的情况,水越小对工程越不利,此时重现期是指水文随机变量小于或等于某一数值的平均周期。按照概率论理论,随机变量“小于或等于某一数值”是“大于或等于某一数值”的对立事件,“小于或等于某一数值”的概率等于1-P,故此时重现期的计算公式为(P≥50%)因枯水、少水时,频率大于或等于50%,第二个公式的适用条件又可以写为P≥37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————50%。5.什么是统计参数,什么是理论频率曲线,统计参数和理论频率曲线有什么作用?(1)统计参数。知道了随机变量的概率分布函数或者概率密度函数,就掌握了随机变量在各个取值区间的概率,也就掌握了随机变量的统计规律。但在实际工作里,求得概率分布函数或者概率密度函数往往比较困难,有时甚至求不出来。但是,有一些数字具有特征意义,可以简明地表示随机变量的统计规律和特性。在概率论里,把这些数字称为随机变量的数字特征,在工程水文中,习惯于把这些数字称为统计参数。在文字教材中介绍了以下几种最常用的统计参数:1)均值均值又称为期望,它表示随机变量平均数的概念;2)均方差、和离势系数Cv均方差和离势系数都表示随机变量的离散情况,但均方差和随机变量取值的大小有关,而离势系数是一个无因次的量,排除了随机变量自身大小的影响;3)偏态系数Cs偏态系数反映随机变量的分布对于均值是否对称。Cs是一个无因次量;4)众数众数是随机变量取值概率最大,或者概率密度函数最大的数;5)中位数随机变量大于或等于以及小于或等于中位数的概率都为0.5。文字教材中介绍了以上面统计参数的定义式。统计参数可简明地表示随机变量概率分布的特性。文字教材的图3.5表明了随机变量的统计参数均值和Cv、Cs发生变化的时候,随机变量的概率密度函数曲线变化的情形。由图3.5可以看到,当随机变量分布的类型不变时,如果上面三个统计参数之中的一个参数发生变化,另外两个参数不变,则均值增大,表明随机变量取值的平均水平增高,概率密度函数曲线沿横轴向右平行移动;而离势系数Cv增大,表明随机变量分布相对于均值更为分散,概率密度函数曲线从较为尖瘦变为较为矮胖;若偏态系数Cs=0时,概率密度函数曲线对称于均值分布,Cs<0时,分布的均值小于众数Eo(X)(称为负偏),Cs>0时,分布的均值大于众数Eo(X)(称为正偏,水文变量的分布大多数是正偏)。(2)理论概率曲线客观世界中的随机变量具有不同的概率分布规律。经过研究和分析,可以对某些概率分布给出数学表达式,并得到相应的频率曲线。具有数学表达式的频率曲线称为理论频率曲线。理论频率曲线对应于以后将要介绍的经验频率曲线。在文字教材里,介绍了两种最为常用的理论频率曲线:1)正态分布文字教材的图3.6是正态分布的概率密度函数曲线。该曲线为单峰,曲线对称于均值,同时曲线两端以x轴为渐近线,趋向于正、负无穷大。正态分布有两个参数,即均值μ和均方差σ,当这两个参数确定后,分布就唯一确定了。实践经验和理论分析表明,可以用正态分布描述许多随机变量的概率分布。如各种测量、检测的误差,因多种偶然因素形成的偏差(比如设备正常运转情况下产品的质量指标、正常施工情况下混凝土试件的强度等),都服从或者可以近似地看为服从正态分布。2)皮尔逊Ⅲ型分布文字教材的图3.7是皮尔逊Ⅲ型分布概率密度函数曲线。英国生物学家、统计学家皮尔逊分析了生物、物理以及经济领域里的许多随机变量,归纳出一系列概率分布,其中有一种在水文分析中用得较多,称为皮尔逊Ⅲ37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————型分布。皮尔逊Ⅲ型分布的概率密度函数曲线也是单峰的,曲线的一端有限,另一端无限,形状是不对称的。皮尔逊Ⅲ型分布有3个参数,这3个参数与统计参数均值、离势系数Cv、偏态系数Cs之间存在着函数关系。所以,只要能够确定皮尔逊Ⅲ型分布的均值和Cv和Cs,就可以确定随机变量的概率分布。文字教材的3.1对正态分布和皮尔逊Ⅲ型分布的概率密度函数公式、概率密度函数曲线、分布的性质等作了介绍。为了实际应用皮尔逊Ⅲ型分布,必须对它的概率密度函数进行积分,这样才能得到随机变量在某个区间取值的概率。在工程水文里,要求出水文变量的频率,即水文变量从某一个取值到正无穷大个概率,因此需计算从随机变量的各个取值到无穷大的积分。因皮尔逊Ⅲ型分布的概率密度函数十分复杂,进行积分相当困难。为了能够在实际工作中运用皮尔逊Ⅲ型分布,有人制作了皮尔逊Ⅲ型分布的积分表格,文字教材中介绍的福斯特—雷布京表就是这样的表格。幅斯特—雷布京表又叫做离均系数Ф值表,文字教材中介绍了离均系数Ф的概念,以及使用福斯特—雷布京表的方法,并提供了例题。当确定了皮尔逊Ⅲ型分布的统计参数以后,可以按照Cs值从离均系数Ф值表查到对应于某一个频率P的离均系数Ф,同时可以由随机变量的均值和离势系数Cv,求出相应的随机变量值。亦即,确定了皮尔逊Ⅲ型分布的统计参数后,就可以借助离均系数Ф值表,查出对应于各个频率的水文变量值,从而绘制出水文变量的频率曲线。为了更方便地进行频率分析计算,又有人根据皮尔逊Ⅲ型分布的离均系数表制作了模比系数表。模比系数是随机变量取值x与均值的比值。如用k表示模比系数,则运用皮尔逊Ⅲ型分布的模比系数表,可以直接查出常用Cv、Cs取值情况下,对应于某个频率P的模比系数kp,也就可以求出相应的随机变量xp。离均系数Ф37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————值表和模比系数表已作为附录编入文字教材。这两个表是经常要用到的,应熟练掌握它们的使用方法。关于理论频率曲线,还有一个问题需要说明,即所谓理论频率曲线只是一些具有数学表达式频率曲线。把理论频率曲线用于水文分析计算,并不是已经从理论上严格证明了水文现象的概率分布应当服从某种理论频率曲线。用某种理论频率曲线描述水文变量概率分布仅仅是根据经验。6.什么是总体和样本,什么是抽样误差?客观世界中存在着许多具有随机性的事物。在数理统计中,把所研究的对象的全体称为总体,把总体中的每一个基本单位称为个体。如一条河流,当我们研究年径流量的时候,河流有史以来的各年年径流量的全体就是总体,各个年的年径流量就是个体。如果所研究的随机事物对应着实数,则总体就是一个随机变量(可以记为X),而个体就是随机变量的一个取值(可以记为xi)。一般情况下,总体是未知的。或者,因为不能对总体进行普查研究,总体实际上是无法得到。比如,我们无法掌握一条河流在其形成以来漫长的地质年代中所有年份的年径流量。我们也不能对工地上所有的钢筋都进行破坏性试验检验钢筋的强度。为了解和掌握总体的统计规律,通常是从总体中抽取一部分个体,对其进行观察和研究,并且由这部分个体对总体进行推断,从而掌握总体的性质和规律。这种方法称为抽样法。从总体中抽取的部分个体称为样本。当总体是随机变量的时候,所抽取的每一个样本是一组数字。比如随机变量X的一个样本Xj就由数字x1,x2,…,xi,…xn组成。样本里面包含个体的个数n,称为样本容量。当抽取样本时随意抽取,不带有任何主观成分时,所得到的样本称为随机样本。水文变量总体是无限的,现有的水文观测资料可以认为是水文变量总体的随机样本。样本只是总体的一部分,由样本来推断总体的统计规律显然会有误差。这种由样本推断总体统计规律而产生的误差称为抽样误差。一般说来,样本容量增大的时候,样本的抽样误差会减小。所以,应当尽可能地增大样本容量。7.37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————什么是水文变量的频率?什么是无偏估计?什么是经验频率曲线?实测水文变量系列是水文变量总体的样本。如将水文变量系列的各个变量从大到小顺序排列,则每一个变量都有一个序号m37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————。某一个水文变量的序号m不但表示了变量在样本里面的大小顺序,而且表示了在样本里面,取值大于或等于这个变量个体的个数,即累计次数。变量序号m和样本n的比值则表示在样本中,变量大于或等于某一个变量的频率,简称频率,如果把频率记作P,则有频率P表示在样本里面,变量取值大于等于某个变量这一事件出现的机会或可能性。但是,由样本求出的频率还不能作为总体的频率。文字教材中介绍了,用样本频率计算公式估算总体频率时,可能出现不合理的情况。按照数理统计理论,从样本推断总体的统计规律的时候,应当使用无偏估计计算式,或者说,从样本计算总体的各种统计参数的时候,应当计算总体统计参数的无偏估计值。只有用无偏估计值作为总体统计参数的估算值才是合理的。如果从总体里面抽取大量的样本,对各个样本都用无偏估计计算式计算总体某种统计参数的估算值,则计算所得到的统计参数估算值将形成一个新的随机变量,这个随机变量的均值恰等于总体的统计参数,这就是无偏估计的含义。文字教材中介绍了,按照现行的水文计算规范,应当采用数学期望公式估算水文变量总体的概率。数学期望公式就是频率的无偏估计计算式,它和样本频率的计算公式是不同的。因为以上频率是由实测资料计算出来的,故习惯上称之为经验频率。水文变量的经验频率可用曲线的形式表示,称为经验频率曲线。8.适线法的基本思路是什么?适线法是现行水文频率计算的基本方法。由实测水文变量系列求得的经验频率曲线,是对水文变量总体概率分布的推断和描述。但如直接把经验频率曲线用于解决工程实际问题,还存在着一定的局限性。因我国目前的水文实测资料一般不超过几十年,算出的经验频率至多相当于几十年一遇。而在工程规划设计里面,常需要确定更为稀遇的水文变量值,这些稀遇值无法从经验频率曲线直接查出。为解决这样的问题,目前的做法是借助于理论频率曲线对经验频率曲线进行延长,求得稀遇洪水或枯水水文特征值的频率分布。为了借助理论频率曲线对经验频率曲线进行延长,需要找到一条和水文变量经验频率点据拟合比较好的理论频率曲线(即该曲线在实测资料范围内表示出的统计规律和实测资料是一致的),同时认为,该理论频率曲线能够表示水文变量总体的统计规律,这就是适线法的基本思路。9.适线时,如何估算和调整水文变量的统计参数?如前述,理论频率曲线是具有数学表达式的频率曲线,理论频率曲线的参数和随机变量的统计参数有一定关。所以,为了延长经验频率曲线,首先应当估算随机变量的统计参数,有了统计参数,便可确定理论频率曲线。因水文变量的总体是未知的,故对其统计参数不能够直接计算。但如掌握了水文变量的实测资料,则可将实测资料作为样本,并由样本推求水文变量总体的统计参数。由实测资料推求水文变量总体的统计参数的时候,也必须使用无偏估计计算式。在我国,理论频率曲线一般采用皮尔逊Ⅲ型曲线。文字教材中介绍了估算皮尔逊统计参数的时候应当采用的计算公式,同时介绍了,直接由公式计算水文变量总体的值误差很大,故对于一般是拟定一个与的倍比,按倍比确定值。在适线时,应当按照统计参数变化对理论频率曲线的影响趋势有目的地调整统计参数。文字教材的图3.9~图3.11表明了,当均值、离势系数Cv和Cs这三个统计参数中有一个参数发生变化,另外两个不变的时候频率曲线发生变化的情况。由图3.9图可以看到,如均值37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————增大,其余两参数不变,频率曲线将沿水平轴向右方平移;由图3.10可以看到,如离势系数Cv增大,其余两个参数不变,频率曲线将顺时针转动;由图3.11可以看到,如偏态系数Cs增大,其余两个参数不变,频率曲线上端坡度变陡,下端坡度变缓,曲线的两端上翘,中间段下沉。水文变量频率曲线的变化情况,是和前述概率密度函数变化的情况相联系的。适线法在实际工作里应用很广,需注意很好地学习和掌握。10.什么是相关分析,它有什么作用?在客观世界里,事物之间往往是相互联系的。反映客观事物的变量(包括随机变量)之间也可能存在着一定的联系。研究分析两个或两个以上随机变量之间的关系称为相关分析。当两个水文变量系列存在着一定的物理联系,同时又有一段时间的同期观测资料时,可分析两水文变量之间的相关关系,并借助相关关系由较长的水文系列插补和展延较短的水文系列。展延、插补水文变量系列,是相关分析在水文分析计算里面的主要用途。相关关系有不同的类型。文字教材中比较详细地介绍了直线简相关建立回归方程式的方法,以及回归分析里面回归系数r的意义。实际上,目前流行的一些计算机软件,许多都具有统计分析功能(如微软公司办公套件中的MicrosoftExcel就具有相关分析计算功能),在实际工作中可选用合适的计算机软件进行相关分析计算。11.相关检验的作用是什么,什么是“显著性水平”和“置信度”?对于相关分析,文字教材中还介绍了相关检验的内容。在回归分析里面,相关系数r是由实测样本资料计算出来的。因由样本推求总体的统计规律时存在着抽样误差,故当计算所得的相关系数r不为0(反映出两个随机变量之间存在着一定的直线相关关系)时,可能两随机变量的总体实际上并不具有直线相关关系。在数理统计里,针对这种情况提出了一种检验方法,即相关检验。在我们的文字教材3.3中有一个表,即不同显著水平下的相关系数临界值rα表。利用此表可对回归分析的成果进行检验。进行相关检验的时候,涉及到“显著性水平”、“置信度”37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————的概念,为帮助理解,举例进行说明。如某人准备出门旅行时,有人赠送给他一张飞机票,同时很郑重地告诉他,飞机失事的概率是两万分之一。那末,此人是否接受这张机票呢?估计一般人都是会接受的,因为他会想,飞机失事的可能性如此之小,我就乘这么一次飞机,不会失事。应当说,这样想是合乎情理的。按照数理统计的观点,某人的这一想法实际上是出于一个假设,即小概率事件在一次试验中是不会发生的。这一假设显然也是合乎情理的,但这一假设是有可能犯错误的,犯错误的概率就是小概率事件发生的概率。对于此例,因飞机失事的概率是2万分之一,所以,假定“飞机不会失事”犯错误的概率就是两万分之一(即5/100000),而假定“飞机不会失事”正确的概率是1减5/100000,即99995/100000。假设检验中的显著性水平就相当于上面例子中假定“飞机不会失事”犯错误的概率,而置信度就相当于假定“飞机不会失事”正确的概率。进行水文变量相关检验的时候,一般可取显著性水平α=0.05或α=0.1。如果取α=0.05,则显著性水平为5%,置信度则为95%。当进行相关分析计算,求得的相关系数的绝对值大于从相关系数临界值表里面查到的临界值rα的时候,就可以判断,所分析的随机变量具有直线相关关系。同时可知,作出这个判断正确的概率(即置信度)是95%。而做出这个结论发生错误的概率(即显著性水平)为5%。以上就是显著性水平和置信度的含义。在实际的水文分析计算中还应当注意,除了按照上面的方法进行检验以外,一般还要求相关系数的绝对值大于或等于0.8,所求得的直线相关关系才能实际应用。关于这一点,文字教材也作了介绍。课程辅导三水资源估算37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————1.什么是水量平衡原理,学习水量平衡原理有何作用?    水量平衡原理是物理中的普遍规律物质不灭定律的一种表现形式。    我们文字教材的第3章第1节介绍了水量平衡的概念。对于任一区域,在给定的时段内,各种输入水量总量应等于输出水量总量与区域内时段始末储水量变化的代数和,即区域在水循环中收支平衡,这就是水量平衡原理。    影响水资源的因素十分复杂,水资源的许多有关问题,难于由有关的成因因素直接计算求解,而运用水量平衡关系,往往可以使问题得到解决。因此,水量平衡原理在水文分析计算和水资源规划的分析计算中有广泛的应用。比如,在本章和以后介绍的水资源需求分析、区域水资源估算、年径流分析计算、洪水分析计算、水库兴利调节计算、水库防洪调节计算、水库调度、水资源合理调配等部分,都直接或间接地用到了水量平衡原理。对于不同的区域、不同的时段、不同的课题,表示水量平衡关系的水量平衡方程式形式不同。比如,本章介绍了全球范围的水量平衡方程式,以及一个地区水循环中的水量平衡方程式。在以上提到的不同课题中采用的水量平衡方程式,其形式都不尽相同。  对于水量平衡原理及不同形式的水量平衡方程式,需注意掌握。2.水资源估算有何意义,其基本方法是什么?    我们文字教材的第3章第2节介绍了水资源估算,第14章第4节介绍的区域水资源规划,也包含了水资源估算的内容。    所谓水资源估算,实际上是对水资源的数量进行评价。    水资源数量评价具有十分重要的意义。我们国家水资源短缺的现实决定了,在配置水资源的时候,要遵循“以供定需”的原则。所谓“以供定需”就是在进行城市建设和工农业生产布局的时候,要充分考虑水资源的承受能力。要科学合理地确定城市发展规划、发展方向,以及农业种植结构,建立与水资源条件相适应的经济结构和产业布局。比如,党中央已经做出西部大开发的战略部署。而在西部的一个地区,在制定规划的时候,必须考虑本地区的资源条件,尤其是水资源的条件。一般来说,西部地区的生态环境原本就比较脆弱,制定开发方案要切忌盲目性,每个地区的开发方案都应当符合本地区的客观条件,有自己的特点。37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————    对于水资源评价,目前我国已经有一个行业标准,即1999年5月开始施行的中华人民共和国行业标准《水资源评价导则》(SL/T238-1999)。    按照《水资源评价导则》,一个区域的水资源数量包括地表水资源数量和地下水资源数量,对于这两部分水资源可以分别分析计算。进行地表水资源数量计算的时候,可以采用不同方法计算分区年径流系列。当有水文站控制的时候,可以按照实测径流资料计算;在没有测站控制的地区,可以利用区域水文模型或者降雨径流关系,由降雨资料推求径流系列。    对于地下水资源很难直接观测它的数量。水资源估算中,地下水资源数量可以通过分析计算地下水资源的补给量,或者分析计算地下水资源的排泄水量求得。    分析和计算地下水资源量的时候,一个十分关键的问题是如何正确确定地下水资源分析计算的水文地质参数,有条件的时候,这些参数可以通过对于径流试验站的实测资料进行分析确定。在缺乏实测资料的时候,也可以直接采用一些分区经验系数。我们的文字教材和其他一些专业书籍,给出了一些水文地质参数数值,可以参考使用。    在进行水资源评价的时候,有一个问题需要特别注意的,就是我国的许多地区,由于大规模人类活动的影响,使区域下垫面条件(下垫面条件的概念将在第6章介绍)发生了明显变化。也就是说,由于人类活动的影响,地面径流和地下径流的产流、汇流条件都发生了变化,水资源形成的机制也相应发生了变化。对于这种情况,进行水资源数量评价的时候必需充分注意,妥善处理。当然,这个问题比较复杂,而且是当前需要研究和解决的问题。    还有一点需要说明,就是关于深层地下水的问题。前面介绍水资源形成过程时,曾经提到,深层地下水有可能补充地面径流。但深层地下水本身的补给是十分困难的。深层地下水是在漫长的地质年代中形成的,它的补给周期可能长达数万年或更长时间。也就是说,深层地下水实际上并没有加入以年或者更短时间为周期的水循环。深层地下水一旦被耗用后很难得到补给和恢复,所以37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————计算地下水资源量时,一般不计入深层地下水量。即在进行区域水资源评价时,只把深层地下水作为一种后备水资源。    我们的文字教材对于水资源估算的具体方法作了比较详细的介绍,而且提供了对淮河流域一个灌区进行水资源估算的实例。3.国民经济各部门需水量估算的基本方法是什么?    国民经济用水可以分为农业用水、工业用水、人民生活用水和生态环境用水等。    目前,我国农业用水量占总水资源利用量的70%以上。因此农业需水量分析计算具有重要意义。    通常所说的农业水资源利用量主要指农业灌溉用水量。而从广义上讲,农业用水量还包括林业、渔业和农村人畜用水以及干旱地区的非耕地灌溉用水。    计算农业用水量主要是计算农业灌溉用水。基本方法是先计算农作物需水量,然后利用水量平衡方法,计算扣除有效降雨和地下水、土壤水利用量之后的农田灌溉需水量。对其他方面的农业用水量则单独计算。    推求农业作物需水量的方法,是在田间灌溉试验的基础上,经过分析作物需水量和主要影响因素之间的关系,总结出适合某一地区的经验公式,或根据当地情况对已有经验公式进行修正。我们文字教材的第4章第1节介绍了几种作物需水量的计算方法。这些方法中,有的公式比较复杂,对此主要需理解公式及其参数的意义和确定各项参数的方法,并注意各种方法的适用条件。    灌溉需水量是指从水源处向灌溉土地供给的水量。通常先根据作物根系活动层的范围确定一个计划湿润层,再确定计划湿润层的最高、最低含水量,并按照水量平衡原理计算出单一作物的灌水定额、灌水时间、灌水次数(农田水利学中称为作物灌溉制度),从而确定单一作物以及各种作物总的净需水量。在此基础上,可考虑输水的损失情况,确定灌区的毛用水量,并将其作为灌区的灌溉需水量。我们的文字教材介绍了有关计算方法。    对于农村人畜及乡镇企业用水量、城市工业及生活用水量等进行估算的基本方法,是结合各地具体情况,按照用水量标准进行估算。我们的文字教材中,介绍了各项用水量标准,在实际工作中可参考使用。4.如何学习课程中有关节水的内容?    首先应当明确节水在水资源管理中的重要意义。面对我国水资源的严峻形势,必须做好水资源的配置、节约、保护。节水是水资源管理的重要工作内容。    我们的文字教材介绍了,与发达国家相比,我国农业、工业和生活用水的利用率都还很低,节水的潜力很大。同时,如前所述,农业用水在我国水资源用水量中所占比重最大,农业节水具有重要意义和显著作用。    文字教材的第4章介绍了国民经济各部门节水的各种工程技术措施,第17章第2节介绍了制定合理水价对节水的作用。    学习这部分内容的时候,应掌握节水的基本工程技术措施。同时应当注意,在实际工作中,需采取大量的非工程措施推进节水工作。在社会主义市场经济条件下,尤其要研究和注意运用经济杠杆的作用,推进节水的实现。课程辅导四水文统计方法1.学习水文统计方法要注意什么?水文统计方法部分内容这部分内容十分重要。因为水文统计的一些基本概念、基本方法,比如37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————随机事件、随机变量、概率、统计规律、频率曲线、适线法、相关分析等,不但在水资源管理这门课程中要经常用到,而且是水利工程专业人员应当掌握的最基本的知识。水文统计方法这部分内容又比较抽象,而且在认识具有随机性的事物时,要求在思维方法上有所转变,更增加了学习的难度。这就使得水文统计方法成为既是重点又是难点的内容。在学习水文统计方法时,一方面要充分重视,注意多下一些功夫,另一方面仍要着重理解和掌握基本概念、基本理论、基本方法,并注意掌握一些最实用的内容。2.什么是随机事件和概率(1)随机事件在客观世界中,不断地出现和发生一些事物和现象。这些事物和现象可以统称为事件。时间的发生有一定的条件。经分析,就因果关系来看,有一类事件是在一定的条件下必然发生的(如水到0度会结冰,一年会有四个季节)。这种在一定的条件下必然发生的事件称为必然事件。另有一类事件在一定的条件下是必然不发生的(如石头不能孵化成小鸡,太阳不会从西边出来)。这种在一定的条件下必然不发生的事件称为不可能事件。必然事件或不可能事件虽然不同,但又具有共性,即在因果关系上都具有确定性。除了必然事件和不可能事件以外,在客观世界中还有另外一类事件,这类事件发生的条件和事件的发生与否之间没有确定的因果关系。这种发生的条件和发生与否之间没有确定的因果关系的事件称为随机事件。在长期的实践中人们发现,虽然对随机事件作一两次或少数几次观察,随机事件的发生与否没有什么规律,但如果进行大量的观察或试验,又可以发现随机事件具有一定的规律性。比如一枚硬币,投掷一次或几次的时候看不出什么规律,但是在同样的条件下反复多次进行试验,把硬币投掷成千上万次,就会发现硬币落地时正面朝上和反面朝上的次数大致是相等的。再比如,一条河流的某一个断面的年径流量在各个年份是不相同的,但进行长期观测,如观测30年、50年、80年,就会发现年径流量的多年平均值是一个稳定数值。随机事件所具有的这种规律称为统计规律。具有统计规律的随机事件的范围是很广泛的。随机事件可以是具有属性性质的,比如投掷硬币落地的时候哪一面朝上,出生的婴儿是男孩还是女孩,天气是晴、是阴,有没有雨、雪,商业上股票买卖的盈亏,城市里交通事故的发生等等。随机事件也可以是具有数量性质的,比如射手打靶的环数,建筑结构试件破坏的强度,某条河流发生洪水的洪峰流量等等。(2)概率在数学中有两个分支,即概率论和数理统计。研究随机事件统计规律的学科称为概率论。由随机现象的一部分实测资料研究和推求随机事件全体的规律的学科称为数理统计。概率是表示统计规律的方式。用概率可以表示和度量在一定条件下随机事件出现或发生的可能性。针对不同的情况,概率有不同的定义。按照数理统计的观点,事物和现象都可以看为是试验的结果。如果试验只有有限个不同的试验结果,并且它们发生的机会都是相同的,又是相互排斥的,则事件概率的计算公式为式中P(A)——随机事件A的概率;n——进行试验可能发生结果的总数;m——进行试验中可能发生事件A的结果数。例如,掷骰子(俗称“掷色子”)的情况就符合以上公式的条件。因掷骰子可能发生的结果是有限的(1到6点),试验可能发生结果的总数是6;同时骰子是一个均匀的6面体,掷骰子掷成1点到6点的可能性都是相同的,又是相互排斥的(一次掷一个骰子不可能同时出现两个点)。如果定义Z为随即事件“掷骰子的点数大于2”,则符合Z的结果为3、4、5、6点4种情况,即事件Z可能发生的结果数是4。按照上述公式,Z的概率37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————像这种比较简单的,等可能性、相互排斥的情况,是概率论初期的主要研究对象。故按上面公式确定的事件概率称为古典概率。在客观世界里中,随机事件并不都是等可能性的。如射手打靶打中的环数是随机事件,但打中0环到10环各环的可能性并不相同,优秀的射手打中9环、10环的可能性大,而新手打中1环、2环的可能性就较大。一条河流出现大洪水的可能性和一般洪水的可能性显然也是不同的。为了表示不是等可能性情况的统计规律,概率论中队概率给出了更一般的定义。在同样条件下进行试验,将事件A出现的次数μ称为频数,将频数μ与试验次数n的比值称为频率,记为P(A),则大量的实践证明,当着试验的次数充分大的时候,随机事件的频率会趋于稳定。概率的统计定义如下:在一组不变的条件下,重复作n次试验,记μ是事件A发生的次数,当试验次数很大时,如果频率μ/n稳定地在某一数值p的附近摆动,而且一般说来随着试验次数的增多,这种摆动的幅度愈变愈小,则称A为随机事件,并称数值p为随机事件A的概率,记作P(A)=p37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————(以上可简单地说成,频率具有稳定性的事件叫做随机事件,频率的稳定值叫作随机事件的概率)。概率的统计定义它既适用于事件出现机会相等的情况,又适用于事件出现机会不相等的一般情况。前述的必然事件和不可能事件发生的可能性也可以用概率表示。必然事件的概率等于1.0(表示事件必然发生);不可能事件的概率等于0(表示事件发生的可能性是0,必然不发生);一般随机事件的概率介于0和1.0之间。对于概率的统计定义还需注意,进行统计试验的条件必须是不变的。如果条件发生了变化,即使试验的次数再多,也不能求得随机事件真正的概率。如要确定某一个射手打靶射中不同环数的概率,必须让射手在同样的条件下进行射击,如射击的射程、靶型、武器、风力等都不应改变。类似地,进行水文统计时,水文现象的各种有关因素也应当是不变的。如果流域的自然地理条件已经发生了比较大的变化,还把不同条件下的水文资料放在一起进行统计就不合理了。下面将要介绍,发生这种情况的时候,应当把实测水文资料进行必要的还原和修正以后,再进行统计计算。3.什么是随机变量,怎样表示随机变量的概率分布?要进行水资源管理工作及对水资源进行配置、节约和保护,必须了解和掌握水资源的规律,必须预测未来水资源的情势。但因影响水资源的因素十分众多和复杂,目前还难于通过成因分析,对水资源进行准确的长期预报。实际工作中采用的基本方法是对于水文实测资料进行分析、计算,研究和掌握水文现象的统计规律,然后按照统计规律对未来的水资源情势进行估计。而这样做,需要对随机事件定量化地表示,为此引入随机变量。按照概率论理论,随机变量是对应于试验结果,表示试验结果的数量。如在工地上检验一批钢筋,可以随机抽取几组试件进行检验,每一组试件检验不合格的根数就是随机变量。又如某条河流,其历年的最大洪峰流量、最高水位、洪水持续时间等都可看为随机变量。随机变量的数学定义为:在一组不变的条件下,试验的每一个可能结果都唯一对应到一个实数值,则称实数变量为随机变量(“唯一对应”又称“一一对应”,是指每一个试验结果,就只对应一个数据,而每一个数据,又只对应一个试验结果)。随机变量常用大写字母来表示,如随机变量X(注意这里大写的X是变量,X的取值可以是x1、x2、……xn,即X表示随机取值的系列x1、x2、……xn)。随机变量可以分为两类:37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————(1)离散型随机变量如果随机变量是可数的,即随机变量的取值是和自然数一一对应的,就称为离散型随机变量。离散型随机变量不能在两个相邻随机变量取值之间取值。离散型随机变量可以是有限的,也可以是无限的,但必须是可数的。(2)连续型随机变量如果随机变量的取值是不可数的,也就是在有限区间里面,随机变量可以取任何值,就称为连续型随机变量。比如,某一个长途汽车站,每隔30分钟有一班车发往某地。对于一位不知道长途汽车时刻表的旅客,来车站等车到出发的时间是一个随机变量,这个随机变量取值可以是从0到30分钟区间的任意值,所以是一个连续型随机变量。连续型随机变量是普遍存在的。水文变量,如降雨量、降雨时间、蒸发量、河流的流量、水量、水位等等,都是连续型随机变量。对于随机变量,仅仅知道它的可能取值是不够的,更为重要的是了解各种取值出现的可能性有多大,也就是明确随机变量各种取值的概率,掌握它的统计规律。随机变量取值与其概率的对应关系称为随机变量的概率分布。对于离散型随机变量,可以用列举的方式表示它的概率分布。列举的方法可以是列表,画图等。我们的文字教材中举了例子。对于连续型随机变量,因为它是不可数的,不能一一列举,所以也就也不能用列举的方法表示概率分布。比如前面提到的乘客在长途汽车站等车的例子,等车时间可以是0到30分钟区间里的任何时间,故无法列举所有的随机变量及其相应概率。实际上,等车时间在0到30分钟的任何时间的可能性是相等的,对于这个区间的任意时间,其概率等于无穷大分之一,即近似等于0。从这个例子可以看出,列举连续型随机变量各个值的概率不仅做不到,而且实际上是没有意义的。为此,我们转而研究和分析连续性随机变量在某一个区间取值的概率。在工程水文里面,就是研究某一水文变量大于或等于某一数值的概率。对于一个随机变量,大于或等于不同数值的概率是不同的。当随机变量取为不同数值时,随机变量大于等于此值的概率也随之而变,即概率是随机变量取值的函数。这一函数称之为随机变量的概率分布函数。分布函数的公式为F(x)=P(X≥x)式中X——随机变量;x——随机变量X的取值;P(X≥x)——随机变量X取值大于或等于x的概率;F(x)——37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————随机变量X的分布函数。随机变量的分布函数可用曲线的形式表示。在工程水文里面,又习惯于将水文变量取值大于或等于某一数值的概率称为该变量的频率,同时将表示水文变量分布函数的曲线称为频率曲线。分布函数、水文变量的频率,以及频率曲线这些概念均十分重要,需注意理解和掌握。对于连续性随机变量,还有另一种表示概率分布的形式——概率密度函数。按照概率论的定义,概率密度函数是分布函数的导数。概率密度函数在某一个区间的积分值,表示随机变量在这个区间取值的概率。在工程水文中,频率是水文变量取值大于或等于某一数值的概率,因此,水文变量的频率就是概率密度函数从变量取值到正无穷大区间的积分值。用公式表示,水文变量频率和概率密度函数之间的关系可以写为(字幕)此式中,F(x)是随机变量X的分布函数值,也就是水文变量X取值为x时候的的频率,而p(x)是概率密度函数。如前述,水文变量的分布函数可以用频率曲线表示。类似地,概率密度函数也可以用概率密度函数曲线表示。因分布函数和概率密度函数之间存在着对应关系,频率曲线和概率密度函数曲线之间也存在着对应关系,这种对应关系可以用文字教材的图5.3表示。图5.3中,左边是概率密度函数曲线,右边是频率曲线。图中两边的纵坐标均表示随机变量的取值,左边的横坐标表示概率密度函数值,右图的横坐标表示频率。左边随机变量取值的概率密度函数值越大,表明随机变量在这个值附近区间取值的概率越大。因频率F(xi)是概率密度函数从xi到正无穷大这个区间的积分,所以,右边中的F(xi)等于左图中xi以上的阴影面积。从图中可以看到,xi取值越小,阴影面积越大,频率F(xi)取值也越大。这显然是合理的,因为随机变量取值越小,大与等于这个取值的可能性越大。对这张图里面表示的各种关系大家一定要弄清楚。4.经常听到“多少年一遇的洪水”、“多少年一遇的干旱”这样的提法,如何正确理解?“多少年一遇”,或者“重现期”37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————,都是工程和生产上,用来表示随机变量统计规律的概念。重现期表示在长时间内,随机事件发生的平均周期。即在很长的一段时间内,随机事件平均多少年发生一次。重现期这个名词听起来很通俗,但需注意理解:第一,重现期和概率一样,都表明随机事件或随机变量的统计规律。说某一条河流发生了“百年一遇洪水”,是指从很长一个时期来看,大于或等于这次洪水的情况,平均100年出现一次。重现期是对于类似于洪水这样的随机事件发生的可能性的一种定量描述。不能理解为百年一遇的洪水每隔100年一定出现一次。实际上,百年一遇洪水可能间隔100年以上时间发生,也可能连续两年接连发生。第二,水文随机变量是连续型随机变量,水文变量的频率是水文变量大于或等于某个数值的概率。对应于频率,水文变量的重现期是指水文变量在某一个范围内取值的周期。如某条河流百年一遇的洪水洪峰流量是1000m3/s,是指这条河流洪峰流量大于或等于1000m3/s的洪水重现期是100年,而不是指洪峰流量恰恰等于1000m3/s的洪水重现期是100年。第三,水利工程中所说的重现期,是指对工程不利情况的重现期。对于洪水、多水的情况,水越大对工程越不利。此时,重现期是指水文随机变量大于或等于某一数值这一随机事件发生的平均周期。如用大写的T表示重现期,用大写的P表示频率,按照频率和周期互为倒数的关系,可知洪水、多水时,重现期计算公式为因洪水、多水的时候,频率P小于或等于50%,此公式的适用条件又可写为P≤50%。对于枯水、少水的情况,水越小对工程越不利,此时重现期是指水文随机变量小于或等于某一数值的平均周期。按照概率论理论,随机变量“小于或等于某一数值”是“大于或等于某一数值”的对立事件,“小于或等于某一数值”的概率等于1-P,故此时重现期的计算公式为(P≥50%)因枯水、少水时,频率大于或等于50%,第二个公式的适用条件又可以写为P≥37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————50%。5.什么是统计参数,什么是理论频率曲线,统计参数和理论频率曲线有什么作用?(1)统计参数。知道了随机变量的概率分布函数或者概率密度函数,就掌握了随机变量在各个取值区间的概率,也就掌握了随机变量的统计规律。但在实际工作里,求出概率分布函数或者概率密度函数往往比较困难,有时甚至求不出来。但是,有一些数字具有特征意义,可以简明地表示随机变量的统计规律和特性。在概率论里,把这些数字称为随机变量的数字特征,在工程水文中,习惯于把这些数字称为统计参数。在文字教材中介绍了以下几种最常用的统计参数:1)均值均值又称为期望,它表示随机变量平均数的概念;2)均方差、和离势系数Cv均方差和离势系数都表示随机变量的离散情况,但均方差和随机变量取值的大小有关,而离势系数是一个无因次的量,排除了随机变量自身大小的影响;3)偏态系数Cs偏态系数反映随机变量的分布对于均值是否对称。Cs是一个无因次量;4)众数众数是随机变量取值概率最大,或者概率密度函数最大的数;5)中位数随机变量大于或等于以及小于或等于中位数的概率都为0.5。文字教材中介绍了以上面统计参数的定义式。统计参数可简明地表示随机变量概率分布的特性。文字教材的图5.5表明了随机变量的统计参数均值和Cv、Cs发生变化的时候,随机变量的概率密度函数曲线变化的情形。由图5.5可以看到,当随机变量分布的类型不变的时候,如果上面三个统计参数之中的一个参数发生变化,另外两个参数不变时,如果均值增大,表明随机变量取值的平均水平增高,概率密度函数曲线沿横轴向右平行移动;如果离势系数Cv增大,表明随机变量分布相对于均值更为分散,概率密度函数曲线从较为尖瘦变为较为矮胖;如果偏态系数Cs=0时,概率密度函数曲线对称于均值分布,Cs<0时,分布的均值小于众数Eo(X),分布称为负偏,Cs>0时,分布的均值37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————大于众数Eo(X),分布称为正偏(水文变量的分布大多数是正偏)。(2)理论概率曲线客观世界中的随机变量具有不同的概率分布规律。经过研究和分析,可以对某些概率分布给出数学表达式,并得到相应的频率曲线。具有数学表达式的频率曲线称为理论频率曲线。理论频率曲线对应于以后将要介绍的经验频率曲线。在文字教材里,介绍了两种最为常用的理论频率曲线:1)正态分布文字教材的图5.6是正态分布的概率密度函数曲线。该曲线为单峰,曲线对称于均值,同时曲线两端以x轴为渐近线,趋向于正、负无穷大。正态分布有两个参数,即均值μ和均方差σ,当这两个参数确定后,分布就唯一确定了。实践经验和理论分析表明,可以用正态分布描述许多随机变量的概率分布。如各种测量、检测的误差,因多种偶然因素形成的偏差(比如设备正常运转情况下产品的质量指标、正常施工情况下混凝土试件的强度等),都服从或者可以近似地看为服从正态分布。2)皮尔逊Ⅲ型分布文字教材的图5.7是皮尔逊Ⅲ型分布概率密度函数曲线。英国生物学家、统计学家皮尔逊分析了生物、物理以及经济领域里的许多随机变量,归纳出一系列概率分布,其中有一种在水文里面用得较多,称为皮尔逊Ⅲ型分布。皮尔逊Ⅲ型分布的概率密度函数曲线也是单峰的,曲线的一端有限,另一端无限,形状是不对称的。皮尔逊Ⅲ型分布有3个参数,这3个参数和统计参数均值、离势系数Cv、偏态系数Cs之间,存在着函数关系。所以,只要能够确定皮尔逊Ⅲ型分布的均值和Cv和Cs,就可以确定随机变量的概率分布。我们文字教材的第5章第1节对正态分布和皮尔逊Ⅲ型分布的概率密度函数公式、概率密度函数曲线、分布的性质等都作了介绍。为了实际应用皮尔逊Ⅲ37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————型分布,必须对它的概率密度函数进行积分,这样才能得到随机变量在某个区间取值的概率。在工程水文里,要求出水文变量的频率,即水文变量从某一个取值到正无穷大个概率,因此需计算从随机变量的各个取值到无穷大的积分。因皮尔逊Ⅲ型分布的概率密度函数十分复杂,进行积分相当困难。为了能够在实际工作中运用皮尔逊Ⅲ型分布,有人制作了皮尔逊Ⅲ型分布的积分表格,我们文字教材中介绍的福斯特—雷布京表就是这样的表格。幅斯特—雷布京表又叫做离均系数Ф值表,文字教材中介绍了离均系数Ф的概念,以及使用福斯特—雷布京表的方法,并提供了例题。当确定了皮尔逊Ⅲ型分布的统计参数以后,可以按照Cs值从离均系数Ф值表查到对应于某一个频率P的离均系数Ф,同时可以由随机变量的均值和离势系数Cv,求出相应的随机变量值。亦即,确定了皮尔逊Ⅲ型分布的统计参数后,就可以借助离均系数Ф值表,查出对应于各个频率的水文变量值,从而绘制出水文变量的频率曲线。为了更方便地进行频率分析计算,又有人根据皮尔逊Ⅲ型分布的离均系数表制作了模比系数表。模比系数是随机变量取值x与均值的比值。如用k表示模比系数,则运用皮尔逊Ⅲ型分布的模比系数表,可以直接查出常用Cv、Cs取值情况下,对应于某个频率P的模比系数kp,也就可以求出相应的随机变量xp。离均系数Ф37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————值表和模比系数表已作为第5章的附表编入文字教材。这两个表是经常要用到的,应熟练掌握它们的使用方法。关于理论频率曲线,还有一个问题需要说明一下,就是所谓理论频率曲线只是一些具有数学表达式频率曲线。把理论频率曲线用于水文分析计算,并不是已经从理论上严格证明了水文现象的概率分布应当服从某种理论频率曲线。用某种理论频率曲线描述水文变量概率分布仅仅是根据经验。6.什么是总体和样本,什么是抽样误差?客观世界中存在着许多具有随机性的事物。在数理统计中,把所研究的对象的全体称为总体,把总体中的每一个基本单位称为个体。如一条河流,当我们研究年径流量的时候,河流有史以来的各年年径流量的全体就是总体,各个年的年径流量就是个体。如果所研究的随机事物对应着实数,则总体就是一个随机变量(可以记为X),而个体就是随机变量的一个取值(可以记为xi)。一般情况下,总体是未知的。或者,因为不能对总体进行普查研究,总体实际上是无法得到。比如,我们无法掌握一条河流在其形成以来漫长时期内所有年份的年径流量。我们也不能对工地上所有的钢筋都进行破坏性试验检验钢筋的强度。为了了解和掌握总体的统计规律,通常是从总体中抽取一部分个体,对这部分个体进行观察和研究,并且由这部分个体对总体进行推断,从而掌握总体的性质和规律。这种方法称为抽样法。从总体中抽取的部分个体称为样本。当总体是随机变量的时候,所抽取的每一个样本是一组数字。比如随机变量X的一个样本Xj就由数字x1,x2,…,xi,…xn组成。样本里面包含个体的个数n,称为样本容量。当抽取样本时随意抽取,不带有任何主观成分时,所得到的样本称为随机样本。水文变量总体是无限的,现有的水文观测资料可以认为是水文变量总体的随机样本。样本只是总体的一部分,由样本来推断总体的统计规律显然会有误差。这种由样本推断总体统计规律而产生的误差称为抽样误差。一般说来,样本容量增大的时候,样本的抽样误差会减小。所以,应当尽可能地增大样本容量。7.什么是水文变量的经验频率曲线,它有什么意义?实测水文变量系列是水文变量总体的样本。如将水文变量系列的各个变量从大到小顺序排列,则每一个变量都有一个序号m。某一个水文变量的序号m不但表示了变量在样本里面的大小顺序,而且表示了在样本里面,取值大于或等于这个变量个体的个数,即累计次数。变量序号m和样本n的比值则表示在样本里面,变量大于或等于某一个变量的频率,简称频率,如果把频率记作P,则有37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————频率P表示在样本里面,变量取值大于等于某个变量这一事件出现的机会或可能性。但是,由样本求出的频率还不能作为总体的频率。文字教材中介绍了,用样本频率计算公式估算总体频率时,可能出现不合理的情况。按照数理统计理论,从样本推断总体的统计规律的时候,应当使用无偏估计计算式,或者说,从样本计算总体的各种统计参数的时候,应当计算总体统计参数的无偏估计值。只有用无偏估计值作为总体统计参数的估算值才是合理的。如果从总体里面抽取大量的样本,对各个样本都用无偏估计计算式计算总体某种统计参数的估算值,则计算所得到的统计参数估算值将形成一个新的随机变量,这个随机变量的均值恰等于总体的统计参数,这就是无偏估计的含义。文字教材中介绍了,按照现行的水文计算规范,应当采用数学期望公式估算水文变量总体的概率。数学期望公式就是频率的无偏估计计算式,它和样本频率的计算公式是不同的。因为以上频率是由实测资料计算出来的,故习惯上称之为经验频率。水文变量的经验频率可用曲线的形式表示,称为经验频率曲线。8.适线法它的基本思路是什么?适线法是现行水文频率计算的基本方法。由实测水文变量系列求得的经验频率曲线,是对水文变量总体概率分布的推断和描述。但如直接把经验频率曲线用于解决工程实际问题,还存在着一定的局限性。因我国目前的水文实测资料一般不超过几十年,算出的经验频率至多相当于几十年一遇。而在工程规划设计里面,常需要确定更为稀遇的水文变量值,这些稀遇值无法从经验频率曲线直接查出。为解决这样的问题,目前的做法是借助于理论频率曲线对经验频率曲线进行延长,求得稀遇洪水或枯水水文特征值的频率分布。为了借助理论频率曲线对经验频率曲线进行延长,需要找到一条和水文变量经验频率点据拟合比较好的理论频率曲线,即该曲线在实测资料范围内表示出的统计规律和实测资料是一致的。同时认为,该理论频率曲线能够表示水文变量总体的统计规律,这就是适线法的基本思路。9.适线时,如何估算和调整水文变量的统计参数?37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————如前述,理论频率曲线是具有数学表达式的频率曲线,理论频率曲线的参数和随机变量的统计参数有一定关。所以,为了延长经验频率曲线,首先应当估算随机变量的统计参数,有了统计参数,便可确定理论频率曲线。因水文变量的总体是未知的,故对其统计参数不能够直接计算。但如掌握了水文变量的实测资料,则可将实测资料作为样本,并由样本推求水文变量总体的统计参数。由实测资料推求水文变量总体的统计参数的时候,也必须使用无偏估计计算式。在我国,理论频率曲线一般采用皮尔逊Ⅲ型曲线。文字教材介绍了估算皮尔逊统计参数的时候应当采用的计算公式,同时介绍了,直接由公式计算水文变量总体的值误差很大,故对于一般是拟定一个与的倍比,按倍比确定值。在适线时,应当按照统计参数变化对理论频率曲线的影响趋势有目的地调整统计参数。文字教材的图5.9~图5.11表明了,当均值、离势系数Cv和Cs这三个统计参数中有一个参数发生变化,另外两个不变的时候频率曲线发生变化的情况。由图5.9图可以看到,如均值增大,其余两参数不变,频率曲线将沿水平轴向右方平移;由图5.10可以看到,如离势系数Cv增大,其余两个参数不变,频率曲线将顺时针转动;由图5.11可以看到,如偏态系数Cs增大,其余两个参数不变,频率曲线上端坡度变陡,下端坡度变缓,曲线的两端上翘,中间段下沉。水文变量频率曲线的变化情况,是和前述概率密度函数变化的情况相联系的。适线法在实际工作里应用很广,需注意很好地学习和掌握。10.什么是相关分析,它有什么作用?在客观世界里,事物之间往往是相互联系的。反映客观事物的变量(包括随机变量)之间也可能存在着一定的联系。研究分析两个或两个以上随机变量之间的关系称为相关分析。当两个水文变量系列存在着一定的物理联系,同时又有一段时间的同期观测资料时,可分析两水文变量之间的相关关系,并借助相关关系由较长的水文系列插补和展延较短的水文系列。展延、插补水文变量系列,是相关分析在水文分析计算里面的主要用途。相关关系有不同的类型。文字教材中比较详细地介绍了直线简相关建立回归方程式的方法,以及回归分析里面回归系数r的意义。实际上,目前流行的一些计算机软件,许多都具有统计分析功能(如微软公司办公套件中的Microsoft37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————Excel就具有相关分析计算功能),在实际工作中可选用合适的计算机软件进行相关分析计算。11.相关检验的作用是什么,什么是“显著性水平”和“置信度”?对于相关分析,文字教材中还介绍了相关检验的内容。在回归分析里面,相关系数r是由实测样本资料计算出来的。因由样本推求总体的统计规律时存在着抽样误差,故当计算所得的相关系数r不为0时(反映出两个随机变量之间存在着一定的直线相关关系),可能两随机变量的总体实际上并不具有直线相关关系。在数理统计里,针对这种情况提出了一种检验方法,即相关检验。在我们的文字教材的第5章第3节有一个表,即不同显著水平下的相关系数临界值rα表。利用这个表可对回归分析的成果进行检验。进行相关检验的时候,涉及到“显著性水平”、“置信度”的概念,为帮助大家理解,举一个例子进行说明。如某人准备出门去旅行时,有人赠送给他一张飞机票,同时很郑重地告诉他,飞机失事的概率是两万分之一。那末,此人是否接受这张机票呢?估计一般人都是会接受的,因为他会想,飞机失事的可能性如此之小,我就坐这么一次飞机,怎么会失事呢?应当说,这样想是合乎情理的。按照数理统计的观点,某人的这一想法实际上是出于一个假设,即小概率事件在一次试验中是不会发生的。这一假设显然也是合乎情理的,但这一假设是有可能犯错误的,犯错误的概率就是小概率事件发生的概率。对于机票这个例子,因飞机失事的概率是2万分之一,所以,假定“飞机不会失事”犯错误的概率就是两万分之一(即5/100000),而假定“飞机不会失事”正确的概率是1减5/100000,即99995/100000。假设检验中的显著性水平就相当于上面例子中假定“飞机不会失事”犯错误的概率,而置信度就相当于假定“飞机不会失事”正确的概率。进行水文变量相关检验的时候,一般可取显著性水平α=0.05或α=0.1。如果取α=0.05,则显著性水平为5%,置信度则为95%。当进行相关分析计算,求得的相关系数的绝对值大于从相关系数临界值表里面查到的临界值rα37—————————————————————精品文档———————————————————— —————————————————————精品文档————————————————————的时候,就可以判断,所分析的随机变量具有直线相关关系。同时可知,作出这个判断正确的概率(即置信度)是95%。而做出这个结论发生错误的概率(即显著性水平)为5%。以上就是显著性水平和置信度的含义。在实际的水文分析计算中还应当注意,除了按照上面的方法进行检验以外,一般还要求相关系数的绝对值大于或等于0.8,所求得的直线相关关系才能实际应用。关于这一点,我们的文字教材也作了介绍。37—————————————————————精品文档————————————————————'