符 靜,易臻照,趙 莎
(1. 衡陽(yáng)師范學(xué)院古村古鎮(zhèn)文化遺產(chǎn)數(shù)字化傳承協(xié)同創(chuàng)新中心,湖南 衡陽(yáng) 421002;2. 衡陽(yáng)師范學(xué)院城市與旅游學(xué)院,湖南 衡陽(yáng) 421002)
受地理?xiàng)l件限制,難以建立數(shù)量龐大且均勻分布的氣象站點(diǎn),從而為獲取大范圍降水空間分布信息,降水空間插值成為研究區(qū)域降水格局變化的重要手段[1-3]。氣象數(shù)據(jù)空間插值方法常見(jiàn)的有克里金法、反距離權(quán)重法、樣條函數(shù)法、趨勢(shì)面法以及局部多項(xiàng)式法等[4],基本原理是通過(guò)數(shù)學(xué)建模利用離散數(shù)據(jù)來(lái)模擬連續(xù)的空間信息。
然而不同的插值方法在區(qū)域適用性上存在較大差異,近年來(lái),大量學(xué)者利用已有觀測(cè)資料,對(duì)各插值方法進(jìn)行誤差分析以獲得區(qū)域最優(yōu)插值方案。靳國(guó)棟等基于中國(guó)某煤礦礦區(qū)煤層數(shù)據(jù),對(duì)比了距離加權(quán)反比插值法和普通克里金插值法,認(rèn)為克里金法優(yōu)于距離加權(quán)反比法[5]。李軍龍等采用OK、Spline、IDS進(jìn)行空間插值,得出OK法對(duì)年均溫、年降雨量及年積溫的插值精度均最高[6]。Garcia等使用反距離加權(quán)(IDW)和多重二次諧波(MQB)方法進(jìn)行插值實(shí)驗(yàn),結(jié)果證實(shí)MQB在所有條件下插值精度都優(yōu)于IDW[7]。魯振宇[8]、仲嘉亮[9]、林金煌[10]、宋麗瓊[11]等分別以黃河源區(qū)、新疆地區(qū)、福建省、深圳市為例,對(duì)比幾種常規(guī)的插值方法,結(jié)果表明普通克里金法精度較高。Chen等為獲取中國(guó)地區(qū)日降水柵格數(shù)據(jù),通過(guò)對(duì)比不同插值方法,得出基于季節(jié)半變異函數(shù)的普通克里金法插值效果最佳[12]。董曉華等以清江流域?yàn)檠芯繀^(qū),插值結(jié)果表明協(xié)同克里格法要優(yōu)于普通克里金法,而反距離加權(quán)法明顯不如兩種克里金法[13]。殷嘉霖等基于湖南省及其周邊50個(gè)氣象站點(diǎn)多年平均降水進(jìn)行空間插值,得出局部多項(xiàng)式法插值精度最高[14]。何文英等以新安江流域?yàn)檠芯繀^(qū),得出年尺度上殘差克里金法插值精度最高,而月尺度上則需要基于不同的數(shù)據(jù)條件或地理?xiàng)l件選擇最佳的插值方案[15]。王天華[16]、解恒燕[17]等以月尺度降雨量為基礎(chǔ),插值實(shí)驗(yàn)證實(shí)反距離權(quán)重法插值精度較高。
綜上,結(jié)合區(qū)域?qū)嶋H對(duì)比不同插值方法的模擬精度,篩選適合區(qū)域的插值方法,進(jìn)而模擬降水空間分布信息,對(duì)于區(qū)域生態(tài)系統(tǒng)管理以及生態(tài)安全等有重要意義。本文采用反距離權(quán)重法(IDW)、普通克里金法(OK)、樣條函數(shù)法(Spline)以及趨勢(shì)面法(Trend)對(duì)湖南省1960-2015年年均降水進(jìn)行空間插值實(shí)驗(yàn),進(jìn)而對(duì)模擬結(jié)果進(jìn)行交叉檢驗(yàn)和站點(diǎn)驗(yàn)證,探討了適合研究區(qū)降水的插值方法,并分析了區(qū)域降水空間分布特征。
選取1960-2015年湖南省87個(gè)氣象站點(diǎn)所記錄的逐月降水資料,來(lái)源于湖南省氣象局。在Excel 2013軟件中計(jì)算生成標(biāo)準(zhǔn)化數(shù)據(jù),對(duì)少量缺測(cè)或無(wú)效數(shù)據(jù)進(jìn)行線性插補(bǔ),進(jìn)而通過(guò)計(jì)算獲得各站點(diǎn)年尺度降水?dāng)?shù)據(jù),并統(tǒng)計(jì)多年降水平均值,其中,南岳站降水量最大為2 023.4 mm,新晃站最少為1 164.3 mm。將站點(diǎn)數(shù)據(jù)導(dǎo)入ArcGIS 10.2中,利用坐標(biāo)信息轉(zhuǎn)換為Shapefile數(shù)據(jù),采用隨機(jī)交叉驗(yàn)證抽樣方法,選取20%的站點(diǎn)數(shù)據(jù)作為驗(yàn)證樣本,剩余80%作為插值樣本(圖1),考慮到數(shù)據(jù)對(duì)內(nèi)插誤差的影響,在選取驗(yàn)證樣本時(shí)會(huì)去掉誤差較大的站點(diǎn)。其他數(shù)據(jù)還包括湖南省行政區(qū)矢量數(shù)據(jù)、地形數(shù)據(jù)以及社會(huì)經(jīng)濟(jì)數(shù)據(jù)等。
1.2.1 反距離權(quán)重法(IDW)
反距離權(quán)重法原理是基于地理學(xué)第一定律,依據(jù)相近相似原理,利用預(yù)測(cè)點(diǎn)和采樣點(diǎn)之間的距離進(jìn)行加權(quán),距離預(yù)測(cè)點(diǎn)越近,采樣點(diǎn)給出的權(quán)重也就越大。計(jì)算公式如下:
(1)
式中:Z表示降水量的預(yù)測(cè)值;Zi表示第i(i=1,2,3,…,n)個(gè)實(shí)測(cè)值;di為預(yù)測(cè)點(diǎn)到i點(diǎn)的距離;p為距離的冪,通常為2;n為參與插值的樣本數(shù)。
1.2.2 普通克里金法(OK)
普通克里金法又稱地統(tǒng)計(jì)法,是一種無(wú)偏估計(jì)的插值方法。其原理是利用已知樣本的加權(quán)平均值估計(jì)平面上的未知點(diǎn)值,使估計(jì)值等于實(shí)際值的數(shù)學(xué)期望值,且方差最小。計(jì)算公式如下:
(2)
式中:Z為降雨量的預(yù)測(cè)值;λ表示克里金法權(quán)重系數(shù);Z(Xi)表示實(shí)測(cè)點(diǎn)Xi處的降雨量。
1.2.3 樣條函數(shù)法(Spline)
樣條函數(shù)法基本原理是采用多項(xiàng)式擬合樣本數(shù)據(jù)生成光滑插值曲線的一種插值方法。計(jì)算公式如下:
(3)
式中:Z為降雨量預(yù)測(cè)值;n為樣本數(shù);λi為線性方程組求解系數(shù);di為預(yù)測(cè)點(diǎn)到i點(diǎn)的距離;x,y分別表示平面直角坐標(biāo)系的橫、縱坐標(biāo)值;R(di)表示di為自變量的方程;T(x,y)表示x,y為自變量二元線性方程組。
1.2.4 趨勢(shì)面法(Trend)
趨勢(shì)面法是基于多項(xiàng)式回歸分析原理,得到一個(gè)適合地理要素空間分布的光滑層面,而后依據(jù)面方程計(jì)算預(yù)測(cè)點(diǎn)的屬性值。計(jì)算公式如下:
(4)
式中:Z(x,y)為降雨量預(yù)測(cè)值;n0表示多項(xiàng)式階數(shù);ε表示隨機(jī)誤差;ak,j為觀測(cè)點(diǎn)值確定系數(shù);x,y分別表示平面直角坐標(biāo)系的橫、縱坐標(biāo)值。
1.2.5 插值精度驗(yàn)證
為檢驗(yàn)研究區(qū)不同插值方法的預(yù)測(cè)精度,選取研究區(qū)20%的站點(diǎn)數(shù)據(jù)作為驗(yàn)證樣本,剩余80%作為插值樣本,用來(lái)分析預(yù)測(cè)值與驗(yàn)證點(diǎn)實(shí)測(cè)值之間的相關(guān)性,并驗(yàn)證年平均降水量空間插值結(jié)果的準(zhǔn)確度。結(jié)合區(qū)域?qū)嶋H,精度評(píng)價(jià)采用平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)兩種常用的指標(biāo),二者計(jì)算公式如下:
(5)
(6)
式中:Zi表示驗(yàn)證樣本點(diǎn)降雨量觀測(cè)值;n為驗(yàn)證樣本數(shù)量;Z(X)為降雨量預(yù)測(cè)值。為了更好地檢驗(yàn)預(yù)測(cè)點(diǎn)與觀測(cè)點(diǎn)之間的誤差,選擇將降雨量觀測(cè)值與預(yù)測(cè)值導(dǎo)入SPSS軟件或者Excel軟件進(jìn)行誤差檢驗(yàn)和分析。MAE和RMSE值越小,表明誤差越小,插值精度越高。
降水空間插值的不確定性主要來(lái)源于氣象站點(diǎn)數(shù)目、觀測(cè)數(shù)據(jù)時(shí)空尺度、插值方法差異以及插值運(yùn)算等誤差特性。利用SPSS軟件,基于湖南省87個(gè)氣象站點(diǎn)降水?dāng)?shù)據(jù)繪制Q-Q正態(tài)分布圖(圖略),分析得出降水與海拔有很強(qiáng)的相關(guān)性。例如,南岳、安化、桂東三站的海拔及降水量均與周邊其他站點(diǎn)差別較大,導(dǎo)致其正態(tài)分布偏差較大,而其余站點(diǎn)都集中于一條直線,數(shù)據(jù)近似符合正態(tài)分布。因此,在進(jìn)行降水空間插值交叉驗(yàn)證時(shí)采用的樣本需要剔除南岳、安化和桂東等,以免異常值導(dǎo)致誤差偏大。此外,湖南省降水在時(shí)空尺度上分配不均,采用IDW、OK、Spline和Trend四種方法對(duì)該區(qū)域年均降水量進(jìn)行空間插值,通過(guò)對(duì)比不同插值模型的均方根誤差和平均絕對(duì)誤差,從而獲取適合該區(qū)域降水的最優(yōu)插值方案。
采用普通克里金法、反距離權(quán)重法、樣條函數(shù)法和趨勢(shì)面法進(jìn)行插值實(shí)驗(yàn)對(duì)比分析(表1)。其中,普通克里金法采用了5種半變異模型(球面函數(shù)、三角函數(shù)、指數(shù)函數(shù)、高斯函數(shù)、線性函數(shù)),其他參數(shù)設(shè)置為默認(rèn)。反距離權(quán)重法,其搜索區(qū)域形狀、冪指數(shù)以及鄰近站點(diǎn)數(shù)的取值對(duì)插值結(jié)果有一定的影響,選取冪指數(shù)2、4、6、8和鄰近站點(diǎn)數(shù)12。樣條函數(shù)法選用REGULARIZED和TENSION兩種模式。趨勢(shì)面法取階為1和2。
表1 不同插值結(jié)果誤差分析Tab.1 Different interpolation methods validate the results of correlation test between measured and predicted values
交叉驗(yàn)證結(jié)果表明,不同插值方法的實(shí)測(cè)結(jié)果與預(yù)測(cè)結(jié)果有顯著相關(guān)性。由表1可知,整體上,樣條函數(shù)法、趨勢(shì)面法、克里金插值法的均方根誤差最小值分別為2.52、4.53、4.36 ,平均絕對(duì)誤差最小值分別為49.22、60.74、60.12 mm,均大于反距離權(quán)重法的均方根誤差和平均絕對(duì)誤差的最小值,表明反距離權(quán)重誤差較小,插值精度較高。具體地,克里金法采用的插值模型不同,平均絕對(duì)誤差也不同,其中,誤差最小的是三角函數(shù)模型(MAE=60.12),最大的是球面函數(shù)模型(MAE=61.51),由低到高排列依次為三角函數(shù)、高斯函數(shù)、線性函數(shù)、指數(shù)函數(shù)、球面函數(shù),同樣地,三角函數(shù)模型的均方根誤差也小于指數(shù)函數(shù)、高斯函數(shù)、線性函數(shù)和球面函數(shù)。樣條函數(shù)選取TENSION模型產(chǎn)生的誤差遠(yuǎn)遠(yuǎn)小于REGULARIZED模型。趨勢(shì)面插值隨著階數(shù)的增加誤差逐漸降低。反距離權(quán)重法的插值精度隨著冪值的增大有所提高,冪指數(shù)為4時(shí)誤差最小,之后隨著冪指數(shù)增大,誤差逐漸變大,誤差值排序?yàn)椋篒DW4 通過(guò)對(duì)比同一種插值方法的不同插值模型以及不同插值方法的交叉驗(yàn)證結(jié)果,得出反距離權(quán)重法(IDW4)插值結(jié)果誤差最小,精度較高,基于TENSION模型的樣條函數(shù)法次之,基于三角函數(shù)模型的克里金法精度略差,階為2的趨勢(shì)面法插值精度最差。由此可見(jiàn),樣條函數(shù)法、克里金法和趨勢(shì)面法并不是湖南省年均降水量理想的插值方法,而反距離權(quán)重法(IDW4)插值精度最高,是適合該區(qū)域的一種相對(duì)較好的插值方法。 為了直觀地比較普通克里金法、反距離權(quán)重法、樣條函數(shù)法和趨勢(shì)面法的降水插值結(jié)果,選取IDW4、基于三角函數(shù)模型的OK、基于TENSION模型的Spline和階為2的Trend,運(yùn)用ArcGIS 10.2軟件的Spatial Analyst模塊對(duì)湖南省多年平均降水量進(jìn)行插值實(shí)驗(yàn)。 由圖2可知,4種插值方法一定程度上均能反映湖南省年均降水量的空間分布特征,總體大致呈自東南向西北逐漸減少趨勢(shì),研究區(qū)東部和東南部降水較多,西部和西北部降水相對(duì)較少,梯度變化較為明顯,地域降水分布不均勻。而由于降水插值精度與插值方法的選擇、插值模型參數(shù)設(shè)置以及樣本的空間布局緊密相關(guān),因此,不同插值方法空間插值結(jié)果存在明顯的差異性。具體來(lái)看,反距離權(quán)重法和樣條函數(shù)法的插值結(jié)果基本一致,插值面較為光滑,顯示出研究區(qū)東部、東南部及南部地區(qū)降水多,北部洞庭湖區(qū)、衡邵地區(qū)以及西部降水相對(duì)較少,同時(shí)受地形因素影響較大,形成了明顯的“牛眼”格局[圖2(a)和圖2(c)]?;谌呛瘮?shù)模型的OK插值相比較其他三種插值模型,插值面效果較為粗糙,可能與其參數(shù)設(shè)置默認(rèn)有關(guān),降水空間分布與反距離權(quán)重法及樣條函數(shù)法的插值結(jié)果類似,顯示研究區(qū)東部和南部降水相對(duì)較多,北部洞庭湖區(qū)、中部和西部部分地區(qū)降水偏少[圖2(b)]。趨勢(shì)面法顯示出區(qū)域降水空間分布較為單調(diào),表現(xiàn)為明顯的自東南向西北遞減趨勢(shì)[圖2(d)]。 基于1960-2015年湖南省87個(gè)氣象站點(diǎn)資料,采用克里金法、反距離權(quán)重法、樣條函數(shù)法和趨勢(shì)面法對(duì)研究區(qū)年均降水量進(jìn)行空間插值分析,主要結(jié)論如下: (1)湖南省降水空間插值具有不確定性,主要與氣象站點(diǎn)數(shù)量、觀測(cè)數(shù)據(jù)時(shí)空尺度、插值方法差異以及插值運(yùn)算等誤差特性有關(guān)。 (2)湖南省降水空間插值誤差分析顯示冪值為4時(shí)的反距離權(quán)重法插值結(jié)果誤差最小,精度較高,基于TENSION模型的樣條函數(shù)法次之,基于三角函數(shù)模型的克里金法精度略差,階為2的趨勢(shì)面法插值精度最差,表明IDW4是適合該區(qū)域的一種相對(duì)較好的插值方法。 (3)基于三角函數(shù)模型的克里金法、IDW4、基于TENSION模型的樣條函數(shù)法和階為2的趨勢(shì)面法一定程度上均能反映湖南省年降水量空間分布特征,總體上大致呈自東南向西北逐漸減少趨勢(shì),梯度變化較為明顯,地域降水分布不均勻。 (4)反距離權(quán)重法和樣條函數(shù)法的插值面較為光滑,受地形因素影響,形成了明顯的“牛眼”格局?;谌呛瘮?shù)模型的普通克里金法插值面較為粗糙。趨勢(shì)面法顯示區(qū)域降水空間分布較為單調(diào),表現(xiàn)為明顯的自東南向西北遞減趨勢(shì)。 □2.3 降水空間分布對(duì)比分析
3 結(jié) 論