李治軍,王華凡,侯 岳,黃佳俊
(1.黑龍江大學(xué) 水利電力學(xué)院,黑龍江 哈爾濱 150080;2.黑龍江大學(xué)寒區(qū)地下水研究所,黑龍江 哈爾濱 150080)
降雨量數(shù)據(jù)是進行產(chǎn)匯流計算的重要基礎(chǔ),是進行地區(qū)水文循環(huán)規(guī)律研究、水資源供需平衡分析和旱澇災(zāi)害預(yù)警機制建設(shè)的重要支撐[1-2]。我國幅員遼闊,氣候條件復(fù)雜多樣,水文氣象觀測站點少且分布不均,存在許多縣區(qū)僅擁有一個水文氣象觀測站點的現(xiàn)象。
本文以無資料流域水文預(yù)報(PUB)計劃為切入點,探討適用于缺資料地區(qū)降雨量求算的空間插值方法,以位于黑龍江省同江縣等9個偏遠縣區(qū)的9個氣象觀測站點2000—2014年的降雨量數(shù)據(jù)為基礎(chǔ),在考慮高程和樣本點間距離等影響因素的情況下,采用反距離權(quán)重法(IDW),薄板樣條函數(shù)插值法(Splines),全局多項式插值法(GPI),局部多項式插值法(LPI),普通克里金插值法(OK)和協(xié)同克里金插值法(CK),借助地理信息系統(tǒng)(GIS)的地理空間分析工具,對研究區(qū)進行年降雨量、各年7月降雨量及次降雨量的空間插值計算,經(jīng)交叉驗證分析,優(yōu)選出針對不同降雨量大小的精確度最高的空間插值方法,為缺資料地區(qū)降雨量空間插值提供理論指導(dǎo),為產(chǎn)匯流計算研究提供降雨量數(shù)據(jù)獲取的方法參考。
空間插值是根據(jù)已有的一定數(shù)量的反映空間某種要素分布特征的樣本,對未知空間進行預(yù)測的一種算法。按照推求的空間范圍,可分為內(nèi)插和外推??臻g內(nèi)插通過已知點數(shù)據(jù)推求同一區(qū)域未知點的數(shù)據(jù),而空間外推則通過已知區(qū)域的數(shù)據(jù)推求同域外未知點的數(shù)據(jù)。按照插值結(jié)果實現(xiàn)的數(shù)學(xué)原理,可分為確定性插值法和地統(tǒng)計插值法(又稱克里金插值),確定性插值法以研究區(qū)內(nèi)部相似程度或平滑度為基礎(chǔ),由已知樣本點創(chuàng)建插值表面。地統(tǒng)計插值法在量化樣本點之間的空間自相關(guān)的基礎(chǔ)上,利用頻率分布、方差和均值等統(tǒng)計特性,進一步解釋說明了采樣點在預(yù)測區(qū)域的空間分布情況[3-5]。張莉莉等基于海南島18個觀測站點的氣象數(shù)據(jù),應(yīng)用GIS中的插值工具,通過交叉驗證,對比分析,得出混合插值法最優(yōu)于海南島氣象要素空間插值的結(jié)論[6]。蔣育昊等考慮高程、坡向和距離等影響降雨量大小的因素,利用PRISM模型對北京西北山區(qū)的月降雨量進行插值分析,論證了在復(fù)雜地形條件下PRISM插值方法相對于其他方法,能夠更加準(zhǔn)確地描述降雨的空間分布[7]。陳雅婷和劉奧博以中國1915個氣象站30年的平均降水量為數(shù)據(jù)基礎(chǔ),利用經(jīng)驗貝葉斯克里金法、泛克里金法和多項式法等插值方法進行全國范圍內(nèi)的降雨量插值精度分析,經(jīng)誤差分析驗證,結(jié)果表明,通過估計基礎(chǔ)半變異函數(shù)來表示數(shù)據(jù)誤差的經(jīng)驗貝葉斯克里金法插值效果最好,輸出表面最為光滑[8]。降雨量空間插值方法眾多,不同方法得出的插值輸出表面效果差異較大,輸入數(shù)據(jù)聚類情況、樣本點數(shù)量和研究區(qū)地形地貌類別等因素都直接影響插值的精度。本文對上述各類插值方法的特點進行歸納,有助于進一步?jīng)Q策選取何種方法進行插值計算,見表1。
表1 常用插值方法特點歸納
反距離權(quán)重插值法(IDW)基于相近相似的地理學(xué)原理,利用樣本點被賦予的不同權(quán)重,進行插值計算。該法假定插值表面特性取決于局部變化,如采樣點均勻分布,不存在聚類現(xiàn)象,則插值效果最佳。
薄板樣條函數(shù)插值法(Splines)基于使經(jīng)過所有樣本點的預(yù)測表面達到最小曲率的思想,進行插值點的數(shù)據(jù)預(yù)測。該法要求采樣點數(shù)據(jù)準(zhǔn)確,預(yù)測表面在短距離內(nèi)各點數(shù)據(jù)值不能相差太大。
全局多項式插值法(GPI)依據(jù)多項式擬合的一個插值表面,形成具有數(shù)值分布的采樣區(qū),結(jié)合最小二乘法原理,利用采樣區(qū)地理坐標(biāo)(x,y),推求降雨量z的數(shù)值,以此進行數(shù)據(jù)擬合并估計待測點值。該法計算簡便,結(jié)果精度較低。
局部多項式插值法(LPI )使用位于指定重疊領(lǐng)域的多個多項式進行插值表面擬合,對具有多種形狀的擬合表面,多個多項式的擬合效果會明顯優(yōu)于單個多項式。
普通克里金插值法(Ordinary Kriging)基于變量的空間相關(guān)性,依賴于克里金法的將感興趣變量空間自相關(guān)作為距離的函數(shù),利用樣本點的原始數(shù)據(jù)與變異函數(shù)的結(jié)構(gòu)特點,對待插點進行無偏,最優(yōu)化估計。該法要求觀測數(shù)據(jù)服從正態(tài)分布,參數(shù)較多,確定最佳參數(shù)形成最佳插值表面相對復(fù)雜。
協(xié)同克里金插值法(Co-Kriging)將區(qū)域化變量從單一屬性發(fā)展至兩個及以上的協(xié)同屬性,可在降雨預(yù)測模擬中納入風(fēng)向和地形等影響因子,進一步認識降雨的潛在空間特征,提高降雨插值精度,引入高程影響因素的協(xié)同克里金插值法。
交叉驗證將樣本點分為訓(xùn)練集和驗證集,使用訓(xùn)練集做插值分析,利用驗證集測試插值效果,通過比較預(yù)測值與觀測值的誤差,進而評估插值結(jié)果和方法的優(yōu)劣。本文采用交叉驗證方法中的平均誤差、均方根誤差和標(biāo)準(zhǔn)化均方根誤差綜合優(yōu)選不同雨量條件下的插值方法。
本文的研究區(qū)位于黑龍江省東北部的三江平原,選取位于集賢縣、寶清縣、綏濱縣、同江市、富錦市、雙鴨山市、饒河縣、密山市和虎林市的9個氣象站點。
根據(jù)實測的氣象站點的降雨量數(shù)據(jù),在整個考察年份內(nèi),9個氣象站點記錄的多年平均年降雨量值大多在500.0 mm左右,最大值位于虎林市,為610.8 mm,最小值位于富錦市,為488.3 mm。
為進一步考察各氣象站點記錄的降雨量年內(nèi)分布情況,對考察年份內(nèi)的月降雨量進行統(tǒng)計分析,結(jié)果表明,年內(nèi)降雨多集中在7月和8月,其中7月份的多年平均月降雨量年內(nèi)占比最大,9個氣象站點均超過20.00%,最大值為寶清縣的25.75%。
空間插值分析主要包括獲取原始數(shù)據(jù)、分析數(shù)據(jù)、選擇合適的預(yù)測模型和驗證插值結(jié)果的合理性,其中分析數(shù)據(jù)部分包括檢驗數(shù)據(jù)是否服從正態(tài)分布、全局趨勢性分析和各向異性分析等。本文運用ArcGIS軟件地理統(tǒng)計分析模塊對各氣象站點的年降雨量、各年7月降雨量及選取的場次降雨量數(shù)據(jù)進行相關(guān)性分析,利用QQ plot 分布圖檢驗數(shù)據(jù)的正態(tài)分布情況,驗證是否存在離群值,利用全局趨勢分析,對數(shù)據(jù)的趨勢效應(yīng)進行分析。通過對各站點年、月和場次降雨量進行正態(tài)分布及趨勢分布檢驗。分析結(jié)果表明,除部分站點某年或某月降雨量值存在離群點,其他數(shù)據(jù)均具有良好的正態(tài)分布和趨勢分布效果。本文立意于缺資料地區(qū)降雨量插值計算研究,樣本數(shù)據(jù)較為稀缺,且各站點數(shù)據(jù)均為氣象臺站觀測所得,故在插值處理時不剔除離群點和引起趨勢變化較大的點,節(jié)選的樣本點不同雨量下的趨勢分布和正態(tài)分見圖1~圖3。
圖1 年降雨量
圖2 月降雨量
圖3 場次降雨量
通過ArcGIS軟件中的地理統(tǒng)計分析工具,運用上文提到的各種插值方法,對研究區(qū)的降雨數(shù)據(jù)進行插值分析,經(jīng)交叉驗證,并對結(jié)果進行轉(zhuǎn)換分析,得到各種方法在不同雨量情況下的誤差情況,具體結(jié)果見表2。
表2 不同雨量情況下插值方法誤差結(jié)果 mm
由表2可知,在數(shù)值較大的年降雨量插值模擬中,OK法和CK法得出的插值誤差結(jié)果優(yōu)于其他方法。為進一步優(yōu)選出各雨量情況下最好的插值方法,對OK法和CK法的插值結(jié)果進行均方根誤差標(biāo)準(zhǔn)化的計算,進一步預(yù)測標(biāo)準(zhǔn)誤差的有效性,經(jīng)計算,OK法的結(jié)果為0.95,CK法的結(jié)果為1.17,參照數(shù)值結(jié)果與1越近效果越好的判斷標(biāo)準(zhǔn),可得出OK法最適合缺資料地區(qū)年降雨量的空間插值計算。在數(shù)值大小居中的各年7月降雨量插值模擬中,CK法得出的插值誤差結(jié)果優(yōu)于其他插值方法,在樣本點數(shù)據(jù)較少并結(jié)合研究區(qū)高程數(shù)據(jù)的情況下,該法可充分考慮地形地貌對降雨量數(shù)據(jù)的影響,避免了插值時同一組樣本數(shù)據(jù)過于分散造成插值誤差較大的結(jié)果。在數(shù)值較小的場次降雨量插值模擬中,OK法得出的插值結(jié)果優(yōu)于其他插值方法。本文采用考察期內(nèi)各氣象站點每年夏季第一場連續(xù)三天的降雨數(shù)值為樣本,雨量值集中分布在50 mm以下,各氣象站點數(shù)值差較小,OK法在場次降雨量的插值計算中,相對于確定性插值方法,該法利用樣本點擬合的線性方程來推求未知點的降雨量數(shù)值時,加權(quán)值不僅考慮了觀測點與未知點的距離,同時考慮了位置和空間結(jié)構(gòu)關(guān)系,擬合精度更高,插值誤差更小。
(1) 在充分考慮研究區(qū)地形地貌和樣本點數(shù)據(jù)空間自相關(guān)的情況下,普通克里金法和協(xié)同克里金法的插值結(jié)果明顯優(yōu)于其他方法,誤差較小,插值結(jié)果圖更加平滑美觀。
(2) 在年降雨量插值模擬分析中,降雨量大小呈現(xiàn)由研究區(qū)東南向西北遞減的趨勢;在各年七月和場次降雨量插值模擬分析中,降雨量大小呈現(xiàn)由東北向西南遞減的趨勢。由此可見,同一研究區(qū)域在不同降雨量情況下的插值結(jié)果有很大區(qū)別,地形地貌及氣候條件對地區(qū)降雨量大小的影響較大。
(3) 因插值樣本點較少,反距離權(quán)重法得出的插值結(jié)果表面具有明顯的“牛眼”現(xiàn)象,觀測點數(shù)據(jù)對全局性的插值結(jié)果影響較大,多項式法和薄板樣條插值法得出的插值結(jié)果表面分層現(xiàn)象嚴重,平滑度較低,普通克里金法和協(xié)同克里金法得出的插值結(jié)果表面存在個別圖像存在較小范圍內(nèi)的“牛眼”和分層現(xiàn)象,但全局平滑性整體優(yōu)于確定性插值方法得出的插值表面。
(4) 本文因插值樣本點較少,故無法考慮不同樣本點情況下的各種插值方法的優(yōu)劣,隨著降雨量空間插值分析的不斷深入,多尺度和多要素地對降雨量影響因子分析的愈加全面,缺資料地區(qū)降雨量空間插值計算結(jié)果將更加精確。