(2: 武汉大学水资源与水电工程科学国家重点实验室, 武汉 430072)
(2: State Key Laboratory of Water Resources and Hydropower Engineering Science, Wuhan University, Wuhan 430072, P. R. China)
三峡工程是治理长江和开发利用长江水资源的关键性骨干工程,具有巨大的防洪、发电、航运、供水等综合效益[1]。准确、及时的入库洪水预报,对三峡水库综合效益的发挥和长江流域水旱灾害防御、水资源利用、流域综合管理等具有重要作用。三峡水库集水面积达100万km2,涉及多个气候区,暴雨洪水特性复杂,大规模控制性水库群的建成运用亦对径流过程造成显著影响,因此其入库洪水预报是世界性难题。目前制作和使用的三峡入库洪水预报是确定性的,以确定单一数值形式输出给用户,形式上易于理解,但忽略了水文预报过程中存在的不确定性。统计决策理论指出,只有在考虑了预报不确定度的决策中,水文预报的价值才始终是正的[2]。概率预报方法通过使用概率分布对预报量进行描述,表述了预报结果的不确定性,从而让决策者更好地评估风险,成为当前水文预报领域的研究热点之一[3-4]。因此,开展三峡水库入库洪水概率预报方法研究与应用,具有重要的理论和现实意义。
众多学者通过综述国内外相关研究,概括了洪水概率预报的2类途径:一类是集合概率分析途径,基于Monte-Carlo抽样的概率预报法[5]、贝叶斯模型加权平均法(BMA)[6]、集合模型输出统计法(EMOS)[7]等属于该类范畴,其输入一般是降雨、蒸发、参数等水文模型所需数据,重点是集合预报样本的充分模拟及后处理技术,优点是能甄别预报的不确定性来源,但计算量巨大,且对输入要求较高,难以满足实时作业预报的要求;另一类是总误差分析途径,该法的输入是确定性预报,重点是预报量的后验密度函数推求,其缺点是对历史样本依赖性强,但计算快捷,使用方便,贝叶斯预报系统(BFS)[8]、Coupla-BFS模型[9]是其中代表性研究,近年来一些学者聚焦通过分析不同预见期、流量级下预报误差的分布规律来量化预报的不确定性[10],但其中的多数研究忽略了分布参数的可变性。梁忠民等[11]提出的考虑误差异分布的概率预报方法,加入了预报误差分布参数的可变信息,但误差分布形式作为该研究的基础是通过假定提出,具有一定局限性。
为此,本文提出一种基于误差最优分布估计的洪水概率预报方法,通过分布函数的假设检验,推求预报误差的最优分布形式,在最优分布函数的概率密度函数基础上推导预报要素的后验概率密度函数,利用历史样本分析分布参数与确定预报值的函数关系,从而构建三峡水库入库洪水概率预报模型,并进行典型洪水过程概率预报业务试验探讨。
1 基于误差最优分布估计的洪水概率预报方法 1.1 误差最优分布估计分布函数完整描述了随机变量的统计性规律,是分析误差特性的重要工具之一。洪水预报误差的描述可分为绝对误差和相对误差两类,根据水文要素的误差特性,通常流量选择相对误差,水位选择绝对误差。确定误差描述方式后,以实况值和预报值序列为依据,采用相应的计算公式即可得到预报误差序列χ,见下式:
$ \chi_t= \begin{cases}m_t-y_t & \text { (绝对误差) } \\ \frac{m_t-y_t}{y_t} & (\text { 相对误差) }\end{cases} $ | (1) |
式中, yt和mt分别表示预报要素的实况值和确定性预报值,t为序列编号,定义n为样本长度,则t=1, 2, …, n;定义Yt0和Mt0分别表示历史空间中的实况系列与确定性预报系列。
水文统计中的常见分布包括指数分布(EXP)、伽玛分布(GAM)、正态分布(NOR)、广义极值分布(GEV)、广义帕雷托分布(GPA)、耿贝尔分布(GUM)、皮尔森Ⅲ型分布(PⅢ)、Logistic分布(LOG)[12]等,不同分布的概率函数及相关参数详见附表Ⅰ。不同预报对象、预报要素的误差往往符合不同的分布形式,选取最优的误差分布形式对于分析预报误差特性具有重要意义。本节选取上述常见分布进行假设检验,通过比较优选出最适合预报误差序列χ概率分布的分布形式。
由数据样本估算概率分布参数的常见拟合法主要包括矩法、最大似然法和L-矩法,通常采用离差平方和(OLS)最小准则与赤池信息准则(AIC)[13]对各分布函数进行拟合优度评价,选取OLS及AIC最小的分布函数作为误差序列χ服从的最优分布形式。其中,OLS及AIC的定义如下:
$ OLS = \sqrt {\frac{{\sum\limits_i^n {{{\left( {{p_{{\rm{e}}i}} - {p_i}} \right)}^2}} }}{n}} $ | (2) |
式中, pi、pEi分别为分布的理论频率和经验频率。
$ A I C=n \ln \frac{\sum\limits_i^n\left(p_{\mathrm{e} i}-p_i\right)^2}{n}+2 k $ | (3) |
式中, k为待估参数个数。
1.2 预报要素的概率密度函数推求由以上分析可知,预报误差序列χ的先验分布可近似为某一分布,其概率密度函数为f(x),为考虑其分布参数的可变性,可利用历史样本空间分析分布参数与确定预报值系列的函数关系,以此加入分布参数的未来时变信息。
若x和σx2分别为误差样本X的均值和方差,根据分布的概率密度函数,推求各参数Pari与均值、方差期望值的函数关系Fi:
$ Par_i=F_i\left[E(\bar{x}), E\left(\sigma_x^2\right)\right], \quad i=1, 2, \cdots, k $ | (4) |
研究及实践表明[10-11],对不同量级或不同预见期的洪水预报分类j而言,预报误差的统计规律有所差异,假定:
$ \overline{x_j}=h_{1, j}\left(M_{t 0}\right) $ | (5) |
$ \sigma_j=h_{2, j}\left(M_{t 0}\right) $ | (6) |
式中,j=1, 2, …, l,l为总的分类数;h1(Mt0) 和h2(Mt0) 不局限于某一特定形式,可以随Mt0变化,也可以为定值。
由式(4)、式(5)和式(6)可得,
$ Par_{i, j}=F_{i, j}\left[h_{1, j}\left(M_{t 0}\right), h_{2, j}\left(M_{t 0}\right)\right] $ | (7) |
联立式(7)和概率密度函数即可推导得预报误差的后验概率密度函数为:
$ f\left(x \mid Y_{t 0}, M_{t 0}\right)=f\left(h_{1, j}\left(M_{t 0}\right), h_{2, j}\left(M_{t 0}\right)\right) $ | (8) |
依据预报误差的后验概率密度函数,利用预报要素实况值与预报误差的函数关系即可获得预报要素的后验概率密度函数。
预报要素实况yt与误差随机变量x的函数可表达为:
$ y_t=\Phi(x) $ | (9) |
具体选择形式参见式(1),可求得其反函数:
$ x=\Phi^{-1}\left(y_t\right) $ | (10) |
根据随机变量函数的概率密度推求公式,并联立式(9)、式(10)可推导预报要素的后验概率密度函数,即概率预报模型,公式如下:
$ g_j\left(y_t \mid m_{t, } Y_{t 0}, M_{t 0}\right)=f\left(x \mid Y_{t 0}, M_{t 0}\right) \cdot\left|x^{\prime}\right|=f\left(\Phi^{-1}\left(y_t\right), h_{1, j}\left(M_{t 0}\right), h_{2, j}\left(M_{t 0}\right)\right) \cdot\left|\left[\Phi^{-1}\left(y_t\right)\right]^{\prime}\right| $ | (11) |
以三峡水库入库流量为预报要素,以相对误差为误差形式,基于上述方法构建概率预报模型并进行概率预报业务试验。
2.1 三峡入库洪水概率预报模型构建长江水利委员会水文局采用三峡水库预报调度模型[14]与人工经验相结合的方式,依据每日8:00实况水雨情、预见期降雨信息和上游水库群调度信息,制作并发布未来1~5 d 8:00洪水确定性预报。随着预见期的延长,确定性预报的相对误差总体上呈增长趋势,其中预见期1~3 d预报成果的平均相对误差均小于10 %,预见期4~5 d预报成果的平均相对误差均小于15 %;预见期1~3 d的预报相对误差随预报入库流量级别的增加呈先增加后下降趋势,预见期4~5 d的预报相对误差随预报入库流量级别的增加呈增加趋势。
收集2003—2018年三峡水库入库流量预见期为1~5 d的短期预报成果及报汛实况建立历史样本空间,不同预见期下样本总数为1363个,预报值为每日8:00入库流量。
2.1.1 预报误差的最优分布推求以预见期1 d为例,推求入库流量预报误差的最优分布,各分布函数的假设检验结果见表 1,由表可知:无论是OLS或AIC的统计值,Logistic分布计算的值均为最小,分别为0.0314和-9427,且其参数个数仅为2个,可将其作为误差序列χ服从的最优分布形式,预见期2~5 d亦可得到相同结论。
由上分析可知,三峡水库入库流量误差序列χ的先验分布可近似为Logistic分布,其概率密度函数[16]为:
$ f(x)=\frac{\mathrm{e}^{-\frac{x-\mu}{\delta}}}{\delta \cdot\left(1+\mathrm{e}^{-\frac{x-\mu}{\delta}}\right)^2} $ | (12) |
式中:μ为位置参数,δ为尺度参数。推求误差样本X的均值和方差,其期望值分别为:
$ E(\bar{x})=\mu, E\left(\sigma_x^2\right)=\frac{\pi^2 \cdot \delta^2}{3} $ | (13) |
流量yt为相对误差随机变量x的函数,公式如下:
$ y_t=\Phi(x)=\frac{m_t}{x+1} $ | (14) |
其反函数为:
$ \Phi^{-1}\left(y_t\right)=x=\frac{m_t}{y_t}-1 $ | (15) |
由式(11)、式(15)和式(16)可推导三峡入库流量的后验概率密度模型为:
$ \begin{aligned} g\left(y_t \mid m_t, Y_{t 0}, M_{t 0}\right)= & f\left(\Phi^{-1}\left(y_t\right) \mid Y_{t 0}, M_{t 0}\right) \cdot\left|\left[\Phi^{-1}\left(y_t\right)\right]^{\prime}\right| \\ = & \frac{\pi \cdot m_t \cdot \mathrm{e}^{-\frac{\pi^{-} \cdot\left(\frac{m_t}{y_t}-1-h_1\left(M_{t0}\right)\right.}{\sqrt{3} \cdot h_2\left(M_{t0}\right)}}}{\sqrt{3} \cdot h_2\left(M_{t 0}\right) \cdot y_t^2 \cdot\left(1+\mathrm{e}^{-\frac{\pi \cdot\left(\frac{m_t}{y_t}-1-h_h\left(M_{t0}\right)\right.}{\sqrt{3} \cdot h_2\left(M_{t0}\right)}}\right)^2} \end{aligned} $ | (16) |
为分析预报误差的统计规律,利用前述的误差样本,绘制误差均值、方差随确定性预报流量的变化趋势图,见图 1。
由图 1可知:误差的方差σ2变幅较小,可认为其为恒定值0.0043,由式(6)分析可得,h2(Mt0)=σ=0.0656;误差均值x则随确定性预报系列呈一定的线性变化,具体拟合公式如下:
$ h_1\left(M_{t 0}\right)=-3 \times 10^{-7} m_t+0.016 $ | (17) |
联立式(16)、式(17)可推导出预见期1 d的三峡水库入库流量概率预报模型:
$ g\left( {{y_t}\mid {m_t}, {Y_{t0}}, {M_{t0}}} \right) = \frac{{\pi \cdot {m_t} \cdot {{\rm{e}}^{ - \frac{{\pi \cdot \left( {\frac{{{m_t}}}{{{y_t}}} - 3 \times {{10}^{ - 7}}{m_t} - 0.984} \right)}}{{0.1136}}}}}}{{0.1136 \cdot y_t^2 \cdot {{\left( {1 + {{\rm{e}}^{ - \frac{{\pi \cdot \left( {\frac{{{m_t}}}{{{y_t}}} - 3 \times {{10}^{ - 7}}{m_t} - 0.994} \right)}}{{0.1136}}}}} \right)}^2}}} $ | (18) |
考虑到实时作业预报需获得预见期内的连续流量过程线而非单一预见期时刻的预报值,参照上述方法亦可构建预见期2~5 d的三峡水库入库洪水概率预报模型,见表 2和式(16)。
选取“2010·7”和“2018·7”两场典型洪水过程,采用发布的预见期为1~5 d的确定性预报值作为输入,用表 2和式(16)计算流量的概率密度,量化预报的不确定性信息,进行三峡水库入库洪水概率预报初步试验,本研究置信度取90 % 为例计算概率区间预报成果,同时以0.5分位数预报作为定值预报结果,并与确定性预报结果进行对比,结果如表 3、图 3所示。
对两场洪水而言,概率预报(中位数预报)相比确定性预报,确定性系数有所提高,预见期1 d提高幅度为0.1 % ~0.5 %,预见期2 d提高0.3 % ~0.62 %,预见期3 d提高0.2 % ~0.44 %,预见期4~5 d则提高1.3 % ~3.4 %;预见期1~3 d,虽然洪峰误差略有增加,但幅度不大,概率预报与确定性预报总体在同一水平,预见期4~5 d,概率预报的洪峰误差缩小2.8 % ~4.1 %;对于水库而言,水量的误差才是关注重点,不同预见期下的次洪洪量误差分别比确定性预报均不同程度减少,预见期1 d减小幅度为0~0.1 %,预见期2 d减小0.1 % ~1.46 %,预见期3 d减小0.7 % ~1.46 %,预见期4~5 d减小2.4 % ~4.8 %;在过程线图对比中,有部分实况流量点仍在90 % 区间预报范围外,预见期越长,覆盖率呈下降趋势,究其原因是长预见期条件下,降雨和上游水库调度的不确定性增大,导致确定性预报偏差较大,但相比确定性预报,概率预报涵盖的不确定性信息更丰富,可望给调度决策提供更多风险参考。
2.2.2 洪水概率预报业务试验制作实时作业预报时,需对预见期内的洪水过程做出完整预测,并据此进行洪水预警,为调度决策提供支撑。分别以“长江2010年第1号洪水”期间的7月16日、17日、18日为预报依据时间,以及“长江2018年第2号洪水”期间的7月9日、10日、11日为预报依据时间,制作5 d预见期的确定性洪水预报,作为三峡水库入库洪水概率预报模型输入,计算得到未来1~5 d预见期内各时刻的入库流量概率预报区间及概率中值预报过程线,进行洪水概率预报业务试验,见图 4。
如图 4可分析:2010年7月16日,概率中值预报显示三峡入库流量在未来第5天(21日)将超过56700 m3/s,根据《长江水情预警发布管理办法(试行)》,发布长江上游三峡库区洪水黄色预警,确定预报则显示三峡入库在未来第4天(20日)将超过50000 m3/s,发布蓝色预警,但5天内未到黄色预警标准,实况为7月19日三峡入库流量58000 m3/s,已达到荆江河段的补偿调度标准,为黄色预警标准洪水;7月17日、7月18日,概率中值预报和确定预报均预报出未来3天内将出现黄色预警标准洪水,但概率中值预报的洪峰值更贴近实况。可见,在本场编号洪水期间,确定预报可提前3天发布出蓝色预警,提前2天发布出黄色预警,概率预报中值产品则比确定预报提前1天就判断出本次洪水为黄色预警标准洪水,更早预见出三峡和清江梯级水库需联合为荆江河段防洪补偿调度,可为调度决策争取更多时间。
由图 4分析可知:2018年7月9日和7月10日,概率中值预报显示三峡入库在未来5天内将超过50000 m3/s,发布长江上游三峡库区洪水蓝色预警,同时90 % 的概率区间预报提示出未来第4~5天内三峡入库流量有超过56700 m3/s的风险,可为提前部署三峡和清江梯级水库的调度策略提供参考,而确定性预报未来5天内最大流量为45000 m3/s,未到发布预警标准,亦无法为决策提供风险信息;7月11日,概率中值预报和确定性预报成果均显示,三峡入库在第3天将超过56700 m3/s,发布洪水黄色预警。总体而言,在本场编号洪水期间,概率预报中值产品提前4天较好预报出蓝色预警标准洪水(比确定性预报提前2天),提前3天准确发布黄色预警,90 % 的概率区间预报提前5天提示出需为荆江河段实施补偿调度的风险,显示出了比确定性预报更好的预警效果。
3 结论本文提出一种基于误差最优分布估计的洪水概率预报方法,在推求预报误差最优分布的基础上,加入了参数的时变信息,实现了以概率分布的形式描述洪水预报的不确定性,能够给出指定置信度的洪水概率区间预报和概率中值预报,可根据洪水量级动态调整预报误差信息,在一定程度上提高了洪水预报预警精度。
以三峡水库入库洪水为例进行了方法验证,结果表明:本文所提方法科学可行,计算快捷,使用方便,便于在实时作业预报中应用推广;依据本文方法计算的典型洪水过程概率预报结果较确定性预报结果,在水量预报、预警效果等方面均有所改善,1~5 d预见期预报的确定性系数提高0.1 % ~3.4 %,水量误差减少0.1 % ~4.8 %,可为三峡水库调度提供更可靠的预报信息;本文所提出的三峡水库入库洪水概率预报业务化产品,可提供更多风险信息,为三峡水库的科学精细调度,尤其是洪水资源化利用提供更好的优化决策支撑。
4 附录附表Ⅰ见电子版(DOI: 10.18307/2023.0228)。
[1] |
长江防汛抗旱总指挥部办公室. 三峡水库试验蓄水期综合利用调度研究. 北京: 中国水利水电出版社, 2015.
|
[2] |
Chen ST. Real-time probabilistic forecasting of flood stages. Journal of Hydrology, 2007, 340(1/2): 63-77. DOI:10.1016/j.jhydrol.2007.04.008 |
[3] |
Liu ZJ, Guo SL, Xu XF et al. Bayesian probabilistic hydrological forecasting: Progress and prospects. Journal of Hydraulic Engineering, 2019, 50(12): 1467-1478. [刘章君, 郭生练, 许新发等. 贝叶斯概率水文预报研究进展与展望. 水利学报, 2019, 50(12): 1467-1478.] |
[4] |
Ba HH, Guo SL, Zhong YX et al. Comparative study on probabilistic ensemble flood forecasting considering precipitation forecasts for the Three Gorges Reservoir. Advances in Water Science, 2019, 30(2): 186-197. [巴欢欢, 郭生练, 钟逸轩等. 考虑降水预报的三峡入库洪水集合概率预报方法比较. 水科学进展, 2019, 30(2): 186-197.] |
[5] |
Kuczera G, Kavetski D, Franks S et al. Towards a Bayesian total error analysis of conceptual rainfall-runoff models: Characterising model error using stormdependent parameters. Journal of Hydrology, 2006, 331(1-2): 161-177. DOI:10.1016/j.jhydrol.2010.02.014 |
[6] |
Dong LH, Xiong LH, Wan M. Detemination of ultimate bearing capacity of rock-socketed pile based on H-B strength criterion. Journal of Hydraulic Engineering, 2011, 42: 1065-1074. [董磊华, 熊立华, 万民. 基于贝叶斯模型加权平均方法的水文模型不确定性分析. 水利学报, 2011, 42: 1065-1074.] |
[7] |
Gneiting T, Raftery AE, Westveld AH Ⅲ et al. Calibrated probabilistic forecasting using ensemble model output statistics and minimum CRPS estimation. Monthly Weather Review, 2005, 133(5): 1098-1118. DOI:10.1175/mwr2904.1 |
[8] |
Krzysztofowicz R. Bayesian theory of probabilistic forecasting via deterministic hydrologic model. Water Resources Research, 1999, 35(9): 2739-2750. DOI:10.1029/1999WR900099 |
[9] |
Liu ZJ, Guo SL, Li TY et al. Comparative study of Bayesian probabilistic flood forecasting models. Journal of Hydraulic Engineering, 2014, 45(9): 1019-1028. [刘章君, 郭生练, 李天元等. 贝叶斯概率洪水预报模型及其比较应用研究. 水利学报, 2014, 45(9): 1019-1028.] |
[10] |
Diao YF, Wang BD, Liu J. Study on distribution of flood forecasting errors by the method based on maximum entropy. Journal of Hydraulic Engineering, 2007, 38(5): 591-595. [刁艳芳, 王本德, 刘冀. 基于最大熵原理方法的洪水预报误差分布研究. 水利学报, 2007, 38(5): 591-595. DOI:10.3321/j.issn:0559-9350.2007.05.012] |
[11] |
Liang ZM, Jiang XL, Qian MK et al. Probabilistic flood forecasting considering heterogeneity of error distributions. Journal of Hydroelectric Engineering, 2017, 36(4): 18-25. [梁忠民, 蒋晓蕾, 钱名开等. 考虑误差异分布的洪水概率预报方法研究. 水力发电学报, 2017, 36(4): 18-25.] |
[12] |
Jin GY. Two new models for hydrologic frequency distribution: Pareto distribution and Logistic distribution. Hydrology, 2005, 25(1): 29-33, 45. [金光炎. 两种新的水文频率分布模型: Pareto分布和Logistic分布. 水文, 2005, 25(1): 29-33, 45.] |
[13] |
Feng P, Li X. Bivariate frequency analysis of non-stationary flood time series based on Copula methods. Journal of Hydraulic Engineering, 2013, 44: 1137-1147. [冯平, 李新. 基于Coupla函数的非一致性洪水峰量联合分析. 水利学报, 2013, 44: 1137-1147.] |
[14] |
Zhang J, Min YW, Chen L et al. Determination of highest water level for flood routing based on dynamic reservoir capacity curves. Hydrology, 2016, 36(5): 63-68. [张俊, 闵要武, 陈力. 基于动库容曲线的水库调洪高水位查算方法研究. 水文, 2016, 36(5): 63-68.] |
[15] |
Xu YS, Li YR, Min YW. Analysis of hydro-meteorological forecasting uncertainty of Three Gorges Reservoir and error distribution. Yangtze River, 2015, 46(21): 27-32. [许银山, 李玉荣, 闵要武. 三峡水库水文气象预报不确定性及误差分布分析. 人民长江, 2015, 46(21): 27-32.] |
[16] |
宋娜. 多元Logistic分布及其参数估计[学位论文]. 北京: 北京工业大学, 2007.
|