曾廣建
(廣東省水文局汕頭水文分局,廣東 汕頭 515041)
降雨是研究流域或地區(qū)水文循環(huán)系統(tǒng)的關(guān)鍵要素,對于工農(nóng)業(yè)生產(chǎn)、水利開發(fā)、江河防洪和工程管理等方面作用很大,降雨量的多少直接影響到人類的生產(chǎn)和生活。受地形地貌、技術(shù)手段、財力等因素限制,大部分地區(qū)空間位置上的雨量數(shù)據(jù)是無法實測獲取的。根據(jù)已有的地面離散站點的降雨數(shù)據(jù),選擇合理的空間插值方法得到整個區(qū)域的降雨空間分布是研究者探索的熱點[1-6],如房林東等研究了反距離權(quán)重插值法在貴州西部地區(qū)插值分析,得出在山區(qū)、平原混合地形區(qū),普通的反距離權(quán)重插值法精度較高[1];王旭等研究了自適應(yīng)距離的反距離權(quán)重法,并在灤河流域進行了應(yīng)用[2];吳曉燕等應(yīng)用5種插值方法對新疆天山山區(qū)降雨量進行分析,得出西部復(fù)雜山區(qū)考慮地形因素的協(xié)同克里金法最優(yōu)[3];莊立偉等對東北降雨量數(shù)據(jù)進行空間插值方法比較,認為IDW插值方法優(yōu)于克里金插值法[4]。
已有研究表明[4-7,11],由于研究區(qū)域、數(shù)據(jù)集、時間尺度等的差異,不同的插值方法適應(yīng)性不同,無普遍適用的插值方法和固定的參數(shù)取值。大多數(shù)研究者在平坦內(nèi)陸地區(qū)或者中等尺度的復(fù)雜山區(qū)進行分析,在沿海地區(qū)進行分析的較少,而粵東地區(qū)地勢北高南低,西北部和東北部主要是山地丘陵地帶,平原主要分布在南部和東南部沿海地帶,這種復(fù)雜的地形及沿海氣候特征,受地形因子、氣候多變、技術(shù)手段和現(xiàn)有站點數(shù)目少等多種因素的限制,致使對粵東地區(qū)降雨空間分布特征的認識不完整,制約了該地區(qū)與降雨規(guī)律相關(guān)的各種水文分析研究,因此積極探索一種適用于粵東地區(qū)的降雨插值方法是必然的、迫切的。本文以粵東地區(qū)70個雨量站點1980—2019年降雨資料為基礎(chǔ),采用反距離權(quán)重法(IDW)、徑向基函數(shù)插值法(RBF)、普通克里金插值法(OK)、回歸克里金法(RK),分別對粵東地區(qū)降雨量進行空間插值計算,采用站點驗證法進行插值結(jié)果評估,尋求最適合該區(qū)域的降雨空間插值方法,為進一步研究粵東地區(qū)水文模型、水生態(tài)環(huán)境、水資源管理等工作奠定數(shù)據(jù)基礎(chǔ)。
粵東地區(qū)地處廣東省東南部,南臨南海,北靠蓮花山脈,地勢北高南低,西北部和東北部主要是山地丘陵地帶,平原主要分布在南部和東南部沿海地帶,包括汕頭、潮州、揭陽、汕尾4個地級市,總面積為 15 516萬km2。屬東南亞季風(fēng)區(qū),雨熱同季,是全國光、熱和水資源較豐富的地區(qū),降雨主要集中在4—9月。受海洋性東南季風(fēng)影響,雨量充沛,其中海豐、陸豐、揭西等雨量高區(qū)是省暴雨高區(qū)之一?;洊|沿海也是西太平洋和南海熱帶氣旋和臺風(fēng)經(jīng)常登陸及影響的地區(qū),風(fēng)暴潮災(zāi)害時有發(fā)生。
數(shù)據(jù)為粵東地區(qū)70個省水文局參編雨量站點40 a(1980—2019年)的逐月降水資料和坐標(biāo)數(shù)據(jù),時間序列連續(xù),滿足可靠性;樣本容量大于30 a,滿足代表性;對逐月降水資料進行統(tǒng)計處理,計算各站點年平均降水量和月平均降水量,并驗證其正確性。
數(shù)字高程模型(DEM)為ASTER GDEM,是由NASA和MFTI于2009年6月共同發(fā)布的最新的全球高程數(shù)據(jù)。覆蓋了99%的地球陸地面積,是迄今最完整的DEM數(shù)據(jù)。該DEM數(shù)據(jù)水平分辨率為30 m,垂直精度為±20 m,置信度均為95%[12]。利用ARCGIS軟件進行數(shù)據(jù)拼接和掩膜裁剪得到粵東地區(qū)數(shù)字高程模型(見圖1)。
圖1 粵東地區(qū)雨量站點分布示意
本文中站點海拔高度、坡度、坡向等地形因子的提取、計算及降水量的空間插值和制圖都在GIS軟件ArcMap10.5下進行;多元線性回歸分析采用SPSS軟件。
采用站點檢驗法分別對4種方法在粵東沿海地區(qū)的插值結(jié)果進行評估。選取58個站點作為樣本點用于降水插值計算,另12個站點數(shù)據(jù)作為實測值對空間插值得出的預(yù)測值進行誤差分析。采用平均絕對誤差(MAE)、均方根誤差(RMSE)、皮爾遜相關(guān)系數(shù)(PPMCC)3種指標(biāo)進行評估[13]。
(1)
(2)
(3)
式中:
Rei、Roi——第i個站點的預(yù)測值和實際觀測值;
σe、σo——降雨量預(yù)測值和觀測值的標(biāo)準(zhǔn)差。
影響降水的因素很多,如地理位置、大氣、地形、洋流、植被及水文狀況、人類活動等。多元線性回歸常用于一種現(xiàn)象與多種因素相聯(lián)系,由多個自變量的最優(yōu)組合共同來估計因變量,比只用某一個自變量進行估計更有效,更符合實際,用這種方法估算降水量不依賴于周圍站點的密度,在各因子相關(guān)較強的情況下可以得到精度較高的模擬結(jié)果[14]。
本文將58個樣本點的月平均降雨量、年平均降雨量分別與站點的經(jīng)度、緯度以及通過DEM提取或得的坡度、坡向、海拔高度進行線性回歸分析。表1中列出了粵東地區(qū)平均年降水量和平均月降水量分別與各地形因子的多元線性回歸方程的回歸系數(shù)??梢钥闯?,平均降水量與經(jīng)度顯著負相關(guān),尤其是年平均降水量和3—10月的月平均降水量,系數(shù)范圍為-479.121~-15.724,表明平均降水量隨著經(jīng)度的增加而減少,遞減率為479.1 mm/10E;月平均降水量在1—4月、7—10月和年平均降水量與緯度表現(xiàn)為正相關(guān),系數(shù)范圍為4.825~130.854,表明平均降水量大部分時候是隨著緯度增加而增大;平均降水量與海拔高度全年表現(xiàn)為正相關(guān),其中在1月、2月、7—12月以及年平均降水量表現(xiàn)為顯著正相關(guān),系數(shù)為0.013~0.523,表明降水量隨海拔升高而變大;而平均降水量與坡度、坡向相關(guān)性都較差。綜合得出,平均降雨與某一地形因子相關(guān)性并不是很穩(wěn)定,隨季節(jié)的變化存在差異性,而平均雨量與多地形因子構(gòu)成的復(fù)相關(guān)系數(shù)全年除11月之外都為顯著相關(guān),復(fù)相關(guān)系數(shù)為0.327~0.763,明顯優(yōu)于某一地形因子相關(guān)性。
表1 粵東地區(qū)平均降水量與各地形因子的多元線性回歸方程的回歸系數(shù)
經(jīng)上述分析,平均降水量及其變化情況需要通過經(jīng)度、緯度、坡度、坡向海拔高度這些地形要素有效組合才可以反應(yīng)出來,因此平均降水量的多元線性回歸方程可表示為:
R=aE+bN+cS+dA+eH+Q
(4)
式中:
R——降水量;
E、N、S、A和H——分別是經(jīng)度、緯度、坡度、坡向和海拔高度;
a、b、c、d、e——回歸系數(shù);
Q——常數(shù)項。
表2為粵東地區(qū)月、年平均降水量多元線性回歸模型。
表2 粵東地區(qū)各月及年平均降水量多元線性回歸模型
2.3.1反距離權(quán)重法(IDW)
反距離權(quán)重法以待插值點到樣本點間的距離為權(quán)重進行加權(quán)平均,認為與插值點距離越接近的若干樣本點的權(quán)重越大,其貢獻與距離成反比[6]。缺點是其計算值易受數(shù)據(jù)點集的影響,從而使計算結(jié)果常出現(xiàn)孤立點數(shù)據(jù)明顯高于周圍數(shù)據(jù)點的情況[7]。
2.3.2徑向基函數(shù)插值法(RBF)
徑向基函數(shù)插值法一種精確插值器,可以根據(jù)大量數(shù)據(jù)點生成平滑表面,可預(yù)測大于最大測量值和小于最小測量值的值。有薄板樣條函數(shù)、張力樣條函數(shù)、規(guī)則樣條函數(shù)、高次曲面函數(shù)、反高次曲面函數(shù)五種基函數(shù),這些函數(shù)可為平緩變化的表面生成很好的結(jié)果。缺點是表面值在短距離內(nèi)出現(xiàn)劇烈變化和懷疑樣本值很可能有測量誤差或不確定性時這種插值方法不適用。
2.3.3普通克里金插值法(OK)
普通克里金是最早被提出和系統(tǒng)研究的克里金法,并隨著地統(tǒng)計學(xué)的發(fā)展衍生出一系列變體和改進算法[8]。通過利用區(qū)域化變量的原始數(shù)據(jù)和變異數(shù)據(jù)的結(jié)構(gòu)特點對未采樣點的取值進行線性無偏最優(yōu)估計[5]。
2.3.4回歸克里金插值法(RK)
回歸克里金是線性回歸模型和克里金法相結(jié)合的算法,也是最常見的混合算法[9]?;貧w克里金首先使用建立輔助變量與目標(biāo)變量之間的回歸方程,然后利用回歸方程對目標(biāo)變量進行預(yù)測,并計算目標(biāo)變量的殘差,對殘差進行克里金插值后,將殘差的插值數(shù)據(jù)加到目標(biāo)變量的回歸值中從而得到一個新的預(yù)測值[5]。
本文中IDW插值冪指數(shù)為2,站點最大搜索范圍為臨近15站,最小范圍為臨近10站;RBF插值中,利用GIS地統(tǒng)計工具依次對5種徑向基函數(shù)進行插值預(yù)測,經(jīng)交叉驗證誤差比較得出采用薄板樣條函數(shù)進行插值效果最佳;對于OK插值,在考慮方向性的前提下依次利用GIS地統(tǒng)計工具對3種理論半方差模型進行了對比分析,得出在不考慮向異性的前提下用球面函數(shù)插值效果最佳;RK插值法由趨勢項和殘差項構(gòu)成,趨勢項為以降雨量為因變量,經(jīng)度、海拔高度為自變量,建立的線性模型,殘差項為對殘差建立的克里金模型。4種插值結(jié)果見表3,站點檢驗法的各項誤差及相關(guān)系數(shù)見表4。
表3 12個檢驗站點年平均降水量不同插值方法結(jié)果
表4 4種插值方法的檢驗誤差及相關(guān)系數(shù)
綜上,考慮MAE和RMSE時,優(yōu)劣順序均為RK>RBF>OK>IDM,4種插值方法的預(yù)測值與實測值的相關(guān)系數(shù)都表現(xiàn)為顯著相關(guān)。在年平均降水插值中,考慮了經(jīng)度、緯度、高程、坡度和坡向的回歸克里金法(RK)插值精度最好,其次是RBF法,再者是OK法,最差的為IDW法,分析原因為粵東地區(qū)為平原和山區(qū)混合地形,經(jīng)緯度、海拔高度等地形因子對降水影響明顯,RK法比較全面的考慮了這些影響因子,又通過較好的半方差模型的普通克里金插值法來修正殘差,因此得到較好的插值效果(4種插值方法分別生成的粵東區(qū)域年平均降水量空間分布示意見圖2)。
由圖2可以看出,粵東地區(qū)雨量北多南少,西北部和東北部主要山地丘陵地帶降雨量豐富,成為粵東地區(qū)降雨最多的地方,南部和東南部沿海地帶的平原地帶雨量最少。RK插值法受回歸變量影響明顯,呈現(xiàn)出與經(jīng)度顯著負相關(guān),與海拔高度正相關(guān),導(dǎo)致模擬的降水量存在空間變異比較大,有大數(shù)值雨量區(qū)分布在海拔較高地帶(圖2 a中的紅色部分),但也在一定程度上說明高海拔區(qū)域的小范圍氣候特征,且最大值大于其他3種插值方法模擬的降水量最大值500 mm左右,可以得出線性模型會造成模擬數(shù)據(jù)出現(xiàn)不太符合實際的極值情況,但現(xiàn)有站點并不能有效驗證這種情況[5]。OK插值和RBF插值法模擬結(jié)果圖表現(xiàn)為降水的空間連續(xù)性很強,總體趨勢平滑且相近,插值結(jié)果基本一致。IDW插值法模擬結(jié)果圖都有明顯的極小值點,有圓形區(qū)域和條帶區(qū)域[5],即有明顯的“鋸齒”和“牛眼”現(xiàn)象[10]。
a 回歸克里金插值法
為了研究不同的插值方法在豐水期和枯水期時的插值效果,使用年平均降水相同的插值方法及參數(shù),分別對58個樣本站點月平均降水進行插值計算,采用MAE、RMSE、PPMCC3種指標(biāo)對12個檢驗站點實測值和預(yù)測值進行評估,結(jié)果見圖3。
a MAE
由圖3可得,RK插值方法整體精度最高,MAE為1.98~21.50 mm,均值為9.85 mm,RMSE為2.57~28.23 mm,均值為13.46 mm,PPMCC為0.797~0.951,全年表現(xiàn)顯著相關(guān);其次為OK插值方法,MAE為2.78~22.70 mm,均值為10.06,RMSE為3.63~29.90 mm,均值為13.84 mm;再者為RBF插值方法,MAE為2.50~24.13 mm,均值為10.68,RMSE為3.28~31.13 mm,均值為14.18 mm;IDW插值方法精度最差,MAE為2.49~27.37 mm,均值為12.60 mm,RMSE為3.42~34.40 mm,均值為16.07 mm。在豐水期(7—9月,月降雨量大于200 mm),RK插值方法精度高的效果明顯好于IDW、RBF法,和OK法,5月、6月,OK法略優(yōu)于RK法;在枯水期,1月、12月(月平均降雨量小于40 mm),IDW插值法效果最好,略優(yōu)于RK法,指標(biāo)PPMCC值更是在1月為0.965,為所有月份中擬合程度最好的;而在2月、3月,RBF插值法效果最佳。從圖3中還可以看出,無論采用何種插值方法,不同月份插值精度相差較大,例如反映預(yù)測值和實測值的擬合程度的指標(biāo)PPMCC在1月份為0.924~0.965,而在10月份為0.732~0.797,這說明插值精度不僅僅取決于插值方法還與數(shù)據(jù)本身的自相關(guān)性等有關(guān)系。
以70個雨量站點40 a降水資料為基礎(chǔ),采用IDW插值法、RBF插值法、OK插值法、RK插值法,對粵東地區(qū)年平均降水量和月平均降水量分別進行空間插值,采用站點驗證法對插值結(jié)果進行評估研究,主要結(jié)論有:
1) 將月平均降雨量、年平均降雨量分別與站點的經(jīng)度、緯度以及通過DEM提取或得的坡度、坡向、海拔高度進行線性回歸分析。得到平均降水量與經(jīng)度顯著負相關(guān),在豐水期表現(xiàn)尤為明顯;與緯度在1—4月、7—10月和年平均降水量表現(xiàn)為正相關(guān);與海拔高度全年表現(xiàn)為正相關(guān),其中在1月、2月、7—12月以及年平均降水量表現(xiàn)為顯著正相關(guān);與坡度、坡向相關(guān)性都較差。綜合分析得出,粵東地區(qū)平均降雨與某一地形因子相關(guān)性并不是很穩(wěn)定,隨季節(jié)的變化存在差異性,需要通過經(jīng)度、緯度、海拔高度這些地形要素有效組合才可以反映出來。
2) 在年平均降水插值中考慮了經(jīng)度、緯度、海拔高度的RK插值法精度最好,其次是RBF法,再者是OK法,最差的為IDW法,分析原因為粵東地區(qū)為平原和山區(qū)混合地形,經(jīng)緯度、海拔高度等地形因子對降水影響明顯,RK插值法比較全面的考慮了這些影響因子,又通過較好的半方差模型的OK插值法來修正殘差,因此得到較好的插值效果。
3) 在豐水期,RK插值法和OK插值法精度明顯好于RBF和IDW插值法。在枯水期,四種插值方法精度都比較高,RBF插值法和IDW插值法效果略好。