肖梓明,張行南,方園皓
(河海大學(xué)水文水資源學(xué)院,南京210098)
近年來隨著人口上漲、農(nóng)業(yè)產(chǎn)業(yè)升級(jí),農(nóng)業(yè)灌溉對(duì)水資源的需求越來越大,為了解決水資源短缺問題,水資源規(guī)劃管理愈發(fā)重要。為了構(gòu)建合適的水資源規(guī)劃管理模型,實(shí)現(xiàn)準(zhǔn)確的水文模擬必不可少,例如徐宗學(xué)、程磊[1]認(rèn)為,灌區(qū)模擬問題難以運(yùn)用傳統(tǒng)的方法進(jìn)行研究,考慮時(shí)空變異的分布式水文模型能夠處理這一問題。在流域水文模型中,降水作為重要的數(shù)據(jù)輸入,對(duì)水文模擬的準(zhǔn)確性起著至關(guān)重要的作用;在農(nóng)業(yè)灌溉中,準(zhǔn)確的降雨對(duì)灌溉制度及灌溉決策起著指導(dǎo)作用,例如孫晉鍇等[2]基于多年降雨數(shù)據(jù)對(duì)豫東地區(qū)夏玉米灌溉制度進(jìn)行了優(yōu)化;侯靜文等[3]對(duì)桂林市降雨預(yù)報(bào)準(zhǔn)確度進(jìn)行了分析,并應(yīng)用到當(dāng)?shù)厮竟喔葲Q策中。傳統(tǒng)的水文模擬中,降水?dāng)?shù)據(jù)主要采用地面站點(diǎn)的觀測(cè)值,存在著空間分布性差、站點(diǎn)布設(shè)受地形限制等諸多問題,導(dǎo)致數(shù)據(jù)獲取及準(zhǔn)確性方面存在影響,進(jìn)而影響水文模擬。所以如果能在流域尺度上提供準(zhǔn)確的降水?dāng)?shù)據(jù),將會(huì)使水文模擬的準(zhǔn)確性大大提高。
大氣環(huán)流模式(GCM)作為當(dāng)前全球氣候模擬的有力工具,是獲取降雨數(shù)據(jù)的重要來源之一,其準(zhǔn)確性、可靠性和精度也獲得了眾多學(xué)者的肯定[4,5],但是由于計(jì)算條件的限制,GCM 一般在比較低的空間分辨率下進(jìn)行運(yùn)行(通常是2°或者更低),有學(xué)者[6]認(rèn)為0.125°的空間分辨率才能滿足流域尺度的水文模擬,因此不能將GCM 的降雨數(shù)據(jù)直接運(yùn)用在水文模擬中。
此前,已有不少學(xué)者將GCM 降雨數(shù)據(jù)運(yùn)用到水文模型中的先例,例如:張徐杰[7]采用GCM 集合數(shù)據(jù),在降尺度處理下,利用SWAT 水文模型對(duì)蘭江流域未來的徑流量進(jìn)行了模擬,發(fā)現(xiàn)蘭江流域徑流量和可利用水資源量在未來有減小的趨勢(shì);宣偉棟[8]通過LARS-WG 天氣發(fā)生器對(duì)5 種全球氣候模式的結(jié)果進(jìn)行降尺度,對(duì)奴下等站點(diǎn)未來降雨徑流進(jìn)行模擬,做出趨勢(shì)分析;宋小園[9]對(duì)于最新的CMIP5 氣候模式,將氣候情景預(yù)測(cè)結(jié)果和SWAT 水文模型耦合,構(gòu)建了未來徑流模擬,效果顯著。由此可見,GCM 降雨數(shù)據(jù)作為水文模型降雨輸入存在一定的合理性。但是為了彌補(bǔ)GCM 降雨數(shù)據(jù)在流域尺度上分辨率過低的問題,還需要經(jīng)過降尺度處理,將尺度大分辨率低的數(shù)據(jù)轉(zhuǎn)化為尺度小分辨率高的數(shù)據(jù),使其滿足流域尺度要求。
為了應(yīng)對(duì)GCM 數(shù)據(jù)分辨率過低問題,本文以橫江流域?yàn)槔?,運(yùn)用統(tǒng)計(jì)降尺度方法,結(jié)合4種機(jī)器學(xué)習(xí)方法,對(duì)歐洲中期天氣預(yù)報(bào)中心(ECMWF)發(fā)布的ERA5 再分析數(shù)據(jù)中的降水?dāng)?shù)據(jù),結(jié)合19個(gè)大氣環(huán)流因子建立模型,進(jìn)行降尺度分析,并將結(jié)果輸入新安江水文模型[10],進(jìn)行徑流模擬,以此分析ERA5 再分析數(shù)據(jù)降尺度后作為流域水文模型降水?dāng)?shù)據(jù)來源的可靠性,以此來確定是否可以為農(nóng)業(yè)灌溉提供數(shù)據(jù)支撐。
橫江是長(zhǎng)江上游金沙江下游一級(jí)支流,源自貴州威寧草海,位于東經(jīng)103°18′至105°57′、北緯26°45′至28°36′之間,全長(zhǎng)307 km,流域面積約為1.486 萬km2,多年平均降雨量1 150.9 mm,年內(nèi)降水集中在6-10月,占全年降水的80%左右,以橫江水文站為控制站。圖1為流域概況圖。橫江流域境內(nèi)主要農(nóng)作物為水稻、冬小麥、玉米、甘薯、馬鈴薯等,農(nóng)業(yè)需水量大,需要合理的水資源規(guī)劃管理。
圖1 橫江流域概況Fig.1 Overview of Hengjiang River Basin
(1)ERA5再分析數(shù)據(jù)。ERA5是ECMWF發(fā)布的第五代再分析全球氣候數(shù)據(jù),空間分辨率0.25°×0.25°,本文所采用的降水?dāng)?shù)據(jù)下載地址為https://cds.climate.copernicus.eu/cdsapp#!/search?type=dataset,數(shù)據(jù)集為“ERA5 hourly data on single levels from 1979 to present”。
(2)大氣環(huán)流因子數(shù)據(jù)。本文所采用的大氣環(huán)流因子來自于ECMWF 發(fā)布的TIGGE 數(shù)據(jù)集,空間分辨率0.5°×0.5°,數(shù)據(jù)下載地址為https://apps.ecmwf.int/datasets/data/tigge/levtype=sfc/type=cf/。
(3)實(shí)測(cè)水文數(shù)據(jù)。降雨數(shù)據(jù)為橫江流域內(nèi)的10 個(gè)水文(雨量)站的實(shí)測(cè)數(shù)據(jù),分別為豆沙關(guān)、甘海子、橫江、龍海、龍街子、墨石驛、牛場(chǎng)、箐口塘、下壩、新泉;徑流數(shù)據(jù)為橫江水文站實(shí)測(cè)徑流數(shù)據(jù)。以上數(shù)據(jù)均摘錄自水文年鑒,數(shù)據(jù)的時(shí)間長(zhǎng)度為2009年1月1日至2014年12月31日。
在建立統(tǒng)計(jì)降尺度模型時(shí),我們認(rèn)為局地降雨與大氣環(huán)流因子存在某種統(tǒng)計(jì)關(guān)系,即:
式中:Y為局地降雨數(shù)據(jù);F為統(tǒng)計(jì)關(guān)系;xi為大氣環(huán)流因子。
因子詳情如表1 所示。建立統(tǒng)計(jì)關(guān)系的示意圖如圖2 所示(●代表氣象格點(diǎn),★代表雨量站),氣象格點(diǎn)為ERA5降雨數(shù)據(jù),雨量站點(diǎn)為實(shí)測(cè)雨量數(shù)據(jù)。每個(gè)氣象格點(diǎn)的控制范圍如圖中陰影區(qū)域,為每個(gè)雨量站匹配大氣環(huán)流因子時(shí),保證距離最近,即雨量站要被陰影所覆蓋。由于因子數(shù)量較多,確定統(tǒng)計(jì)關(guān)系式時(shí)較為復(fù)雜,本文借助機(jī)器學(xué)習(xí)方法進(jìn)行關(guān)系擬合,共選取四種機(jī)器學(xué)習(xí)方法:人工神經(jīng)網(wǎng)絡(luò)(ANN)[11]、支持向量機(jī)(SVM)[12]、決策樹(DT)[13]、隨機(jī)森林(RF)[14],以2009-2013年為訓(xùn)練集,2014年為測(cè)試集,檢驗(yàn)降尺度后的降雨數(shù)據(jù)精度,并將結(jié)果輸入至新安江模型,檢驗(yàn)其在水文模擬中的效果。
圖2 統(tǒng)計(jì)關(guān)系建立示意圖Fig.2 Schematic diagram of statistical relationship establishment
表1 大氣環(huán)流因子信息表Tab.1 Predictor information table
本文所采用的4種機(jī)器學(xué)習(xí)方法的具體模型如下:
ANN模型為:
式中:y(t)為模型t時(shí)刻輸出的降雨;xi(t)為t時(shí)刻第i個(gè)因子值;vij為連接輸入層和隱層的權(quán)重;wj為連接隱層和輸出層的權(quán)重;n為因子個(gè)數(shù);m為隱層維數(shù);θj為隱層閾值;θ0為輸出層閾值;f為Sigmoid函數(shù):f(x)=(1+ e-x)-1。
SVM模型為:
式中:ai、a*i、b為最優(yōu)超平面參數(shù);N為支持向量數(shù);樣本空間X和Xi經(jīng)映射得到。
DT 模型的核心思想為切分點(diǎn)確定,本文以最小二乘法為切分點(diǎn)選擇原則。RF 則是以多個(gè)決策樹組成,每個(gè)決策樹之間互不影響,其最重要的參數(shù)為決策樹個(gè)數(shù)和隨機(jī)選擇特征的最大數(shù)量,目標(biāo)則是均方誤差最小和決定系數(shù)最大。
由于降雨量為0時(shí)會(huì)對(duì)機(jī)器學(xué)習(xí)的回歸運(yùn)算產(chǎn)生影響,所以本文將整個(gè)降尺度過程分為3步,首先利用機(jī)器學(xué)習(xí)的分類思想,對(duì)ERA5降水?dāng)?shù)據(jù)進(jìn)行晴雨準(zhǔn)確率(即是否有雨)的模型運(yùn)算;其次利用機(jī)器學(xué)習(xí)的回歸思想,對(duì)第一部分有雨的部分進(jìn)行降雨量準(zhǔn)確率的模型運(yùn)算;最后將前兩部分整合,得出整個(gè)ERA5降雨數(shù)據(jù)的降尺度結(jié)果。
本文所采用的水文模型為新安江模型。新安江模型是河海大學(xué)趙人俊于1973年提出的水文模型,該模型主要運(yùn)用于濕潤(rùn)半濕潤(rùn)地區(qū),產(chǎn)流方式為蓄滿產(chǎn)流,蓄水容量曲線為核心部分,其結(jié)構(gòu)分為蒸散發(fā)、產(chǎn)流、分水源、匯流。經(jīng)過眾多學(xué)者的不懈努力,已成為國(guó)內(nèi)廣泛運(yùn)用的流域水文模型。
ERA5 的空間分辨率為0.25°×0.25°,而預(yù)測(cè)因子的空間分辨率為0.5°×0.5°,為了保證模型在同樣的分辨率下進(jìn)行,對(duì)數(shù)據(jù)進(jìn)行插值處理,保證其分辨率相同。
(1)晴雨準(zhǔn)確率。將所有的降雨數(shù)據(jù)分為兩類:有雨和無雨,采用機(jī)器學(xué)習(xí)的分類思想進(jìn)行模型運(yùn)算。在質(zhì)量評(píng)估方面采用TS 評(píng)分進(jìn)行評(píng)價(jià),ERA5 降尺度后在10 個(gè)站點(diǎn)的TS評(píng)分如圖3 所示。從圖3 可以得出以下結(jié)論:①ERA5 數(shù)據(jù)降尺度前的TS 評(píng)分大多在0.4~0.6 之間,只有在龍海站的TS 評(píng)分較高,達(dá)到了0.726,總體效果并不是很理想;②ANN、SVM、DT、RF 4 種方法在10 個(gè)站的均值分別為0.737、0.745、0.684、0.746,而ERA5 在降尺度前的均值為0.508,可以看出,在4 種降尺度方法下TS 評(píng)分均有較大幅度的提高,以SVM 和RF 效果最優(yōu),DT 效果最差;③ERA5 對(duì)橫江流域的晴雨準(zhǔn)確率并不理想,但可以選用SVM 和RF 方法對(duì)其進(jìn)行優(yōu)化,優(yōu)化后的效果更為準(zhǔn)確。
圖3 各個(gè)站點(diǎn)晴雨準(zhǔn)確率TS評(píng)分Fig.3 TS scores of sunny or rainy accuracy at various stations
(2)降雨量準(zhǔn)確率。在晴雨準(zhǔn)確率的基礎(chǔ)上,對(duì)有雨部分進(jìn)行降雨量計(jì)算。在質(zhì)量評(píng)估方面采用相關(guān)系數(shù)r、平均絕對(duì)誤差MAE進(jìn)行評(píng)價(jià),ERA5 降尺度后在10 個(gè)站點(diǎn)的兩項(xiàng)指標(biāo)如圖4 和圖5 所示。從圖中可以得出以下結(jié)論:①ERA5 數(shù)據(jù)降尺度前與實(shí)測(cè)站點(diǎn)的相關(guān)系數(shù)大多在0.5~0.7 之間,屬于顯著相關(guān),在橫江站更是達(dá)到了0.721,只有在龍街子和下壩較低,分別為0.492和0.441,而在平均絕對(duì)誤差方面,大多集中在3~5 mm 之間,下壩更是達(dá)到了7.398 mm,誤差較大,精度較低;②ANN、SVM、DT、RF 4種方法在10個(gè)站的相關(guān)系數(shù)均值分別為0.578、0.632、0.431、0.553,而ERA5 為0.596,可以看出ANN 和RF 方法在降尺度后仍然保持著相當(dāng)?shù)南嚓P(guān)性,SVM 有所提高,DT 則大幅度下降;在平均絕對(duì)誤差方面,4 種方法的均值分別為4.813、4.283、5.670、4.779,而ERA5 為5.063,可以看出ANN、SVM、RF 均有所提高,SVM更是提高了0.78 mm,反觀DT 精度有所下降;③綜合以上可以得出結(jié)論:ERA5 在橫江流域的降雨精度不足,在降尺度方法方面可以選擇SVM 方法,使得結(jié)果在相關(guān)系數(shù)和平均絕對(duì)誤差上均有所提高。
圖4 各個(gè)站點(diǎn)降雨量相關(guān)系數(shù)Fig.4 Correlation coefficients of rainfall at various stations
圖5 各個(gè)站點(diǎn)降雨量平均絕對(duì)誤差Fig.5 Average absolute error of rainfall at each station
為了檢驗(yàn)4 種方法對(duì)ERA5 降尺度后的降雨數(shù)據(jù)在水文模擬中的效果,本文計(jì)算了4種降雨結(jié)果在研究區(qū)的面雨量,再將面雨量輸入新安江模型進(jìn)行徑流模擬。面雨量的計(jì)算采用泰森多邊形法。
橫江流域以橫江水文站為控制站,以其實(shí)測(cè)流量作為橫江流域的出口斷面流量,同樣的將2009-2013年劃分為率定期,2014 劃分為驗(yàn)證期,基于率定期實(shí)測(cè)數(shù)據(jù)對(duì)新安江模型的各項(xiàng)參數(shù)進(jìn)行率定。新安江模型有16 項(xiàng)參數(shù),其中敏感參數(shù)率定結(jié)果詳見表2。表中參數(shù)意義如下:KC為蒸散發(fā)折算系數(shù)、SM為自由水蓄水容量、KG為自由水蓄水庫(kù)對(duì)地下水的日出流系數(shù)、KI為自由水蓄水庫(kù)對(duì)壤中流的日出流系數(shù)、CG為地下水消退系數(shù)、CI為壤中流消退系數(shù)、CS為地面徑流消退系數(shù)。
表2 敏感參數(shù)率定結(jié)果Tab.2 Calibration results of sensitive parameters
在模擬精度方面采用納什效率系數(shù)(NSE)、徑流深相對(duì)誤差(Bias)、均方根誤差(RMSE)對(duì)驗(yàn)證期徑流模擬結(jié)果進(jìn)行評(píng)估。圖6為徑流模擬過程。在不同方法下徑流模擬結(jié)果如表3 所示。從圖表中可以看出,實(shí)測(cè)降雨在驗(yàn)證期的表現(xiàn)良好,NSE達(dá)到了0.61,Bias也控制在正負(fù)5%以內(nèi),為-1.17%。而ERA5 的模擬效果很差,NSE為-0.36,Bias為59.44%,從圖6可以看出,ERA5模擬徑流與觀測(cè)徑流整體過程基本吻合,造成NSE和Bias效果差的原因可能是ERA5 的整體雨量較大,造成了模擬值比實(shí)測(cè)值偏高的情況。4種降尺度方法在模擬精度上,相對(duì)ERA5 都有不同幅度的提高,其中ANN 和RF 方法較好,ANN的NSE相對(duì)實(shí)測(cè)數(shù)據(jù)提高了0.07,Bias相對(duì)實(shí)測(cè)數(shù)據(jù)下降了1.81%,RF 的NSE與實(shí)測(cè)數(shù)據(jù)相同,但在Bias上比實(shí)測(cè)數(shù)據(jù)低了6.1%。SVM 方法在汛期表現(xiàn)很差,存在著峰值嚴(yán)重低估的情況,在水文模擬中不可取。DT 方法與ERA5 存在著相同的問題,即徑流過程較好,但整體水量偏高。
圖6 徑流過程模擬Fig.6 Runoff process simulation
表3 不同方法下的徑流模擬結(jié)果Tab.3 Runoff simulation results under different methods
(1)ERA5 降雨數(shù)據(jù)在橫江流域精度較低,在水文模擬上雖然統(tǒng)計(jì)指標(biāo)較差,但徑流過程與實(shí)測(cè)吻合,造成這種現(xiàn)象的原因可能是整體水量偏大,在模擬過程中可適當(dāng)調(diào)大蒸散發(fā)折算系數(shù)KC,在農(nóng)業(yè)灌溉中,可根據(jù)當(dāng)日降水量適當(dāng)減小計(jì)算需灌水量。
(2)建立了從ERA5低分辨率的網(wǎng)格到實(shí)測(cè)站點(diǎn)的統(tǒng)計(jì)降尺度模型,并從晴雨準(zhǔn)確率和降雨量準(zhǔn)確率兩個(gè)方面檢驗(yàn)降尺度后的數(shù)據(jù)精度,結(jié)果表明:在晴雨準(zhǔn)確率和降雨量準(zhǔn)確率方面,可選用SVM進(jìn)行降尺度研究。
(3)在水文模擬中,4種降尺度方法表現(xiàn)各不相同,使用ANN方法進(jìn)行降尺度的效果最優(yōu),驗(yàn)證了將ERA5降雨數(shù)據(jù)降尺度后,作為流域水文模型降水輸入的可行性,進(jìn)一步為農(nóng)業(yè)灌溉提供數(shù)據(jù)支撐。