楊 慧,黃 瑾,羅明良,何昀霞,鄧 婕
(西華師范大學(xué) a.地理科學(xué)學(xué)院,b.四川省干旱河谷土壤侵蝕監(jiān)測與控制工程實驗室,四川 南充 637009)
隨著城市化與現(xiàn)代化進程的快速推進及社會經(jīng)濟的迅速發(fā)展,各類能源大幅度消耗和大量污染物排放,導(dǎo)致了嚴重的生態(tài)環(huán)境問題,其中大氣污染尤為突出[1]。近年來,我國大部分地區(qū)在冬季時常會出現(xiàn)大范圍的霧霾現(xiàn)象。PM2.5和PM10是霧霾的主要組分,其粒徑小,比表面積大,富含大量的有毒、有害物質(zhì),且在大氣中停留的時間長、輸送的距離遠,并可隨著人們的呼吸進入體內(nèi);PM2.5和PM10不僅會導(dǎo)致空氣質(zhì)量和能見度下降,人長期暴露于高濃度PM2.5和PM10環(huán)境中,還會引發(fā)心血管疾病[2-3]、呼吸系統(tǒng)疾病,甚至肺癌[4]。因此,對PM2.5與PM10進行監(jiān)測,研究其分布特征非常必要。PM2.5與PM10作為區(qū)域空氣質(zhì)量的參考,能夠反映出區(qū)域大氣顆粒物污染的狀況[5]。但空氣質(zhì)量測量站點分布有限,因此利用有限的觀測數(shù)據(jù),借助插值方法估計合理的顆粒物(PM2.5、PM10)濃度分布具有重要的現(xiàn)實意義[6-7]。
空間插值利用觀測點上獲得的數(shù)據(jù)來估算其他點的數(shù)值,通過插值可以將點數(shù)據(jù)生成柵格表面數(shù)據(jù)[8]。利用ArcGIS的地統(tǒng)計分析工具(Geostatistical Analyst)對城市空氣質(zhì)量監(jiān)測點數(shù)據(jù)進行插值以生成連續(xù)的空氣質(zhì)量分布表面[9]。丁卉等[10]在區(qū)域空氣質(zhì)量空間插值方法對比研究中得出普通克里金法(Ordinary Kriging,OK)能得到整體最優(yōu)插值精度。胡穩(wěn)等[11]基于對貴陽市冬季大氣中PM2.5和PM10濃度空間插值及分布研究得出,三角函數(shù)是PM2.5空間插值的最適合模型,指數(shù)函數(shù)是PM10空間插值最適合模型。許珊等[12]基于協(xié)同克里金與徑向基函數(shù)(Radial Basis Functions,RBF)神經(jīng)網(wǎng)絡(luò)的PM2.5濃度空間估算結(jié)果較好展示了污染的分異特征,且前者較后者更為平滑。湯宇磊等[13]通過機器學(xué)習(xí)的方法研究了四川盆地PM2.5與PM10高分辨率時空分布及關(guān)聯(lián)分析。杜彥彥和黃青[14]通過OK法分析了河南省PM2.5的時間和空間分布特征。
前人的研究大多是大尺度空間上的研究[15-18],對于小尺度鄉(xiāng)鎮(zhèn)的研究較少。同時,普通克里金法、泛克里金法(Universal Kriging,UK)、反距離加權(quán)法(Inverse Distance Weighted,IDW)、RBF插值法作為常用的插值分析方法,對其插值結(jié)果的相似性和差異性有待進一步研究。因此本文選取河南省信陽市172個鄉(xiāng)鎮(zhèn)的PM2.5與PM10濃度數(shù)據(jù)為數(shù)據(jù)源,通過ArcGIS平臺使用OK、UK、IDW和RBF插值方法,分別對采樣數(shù)據(jù)進行插值,分析不同插值方法的插值精度以及插值結(jié)果相似性。
研究區(qū)為信陽市的2個市轄區(qū)以及8個市轄縣,如圖1。信陽市為亞熱帶季風(fēng)氣候向暖溫帶過渡氣候,空氣濕度高,空氣質(zhì)量較好[19]。依據(jù)信陽市人民政府發(fā)布的2020年5月各鄉(xiāng)鎮(zhèn)空氣質(zhì)量數(shù)據(jù)作為數(shù)據(jù)源,對信陽市的PM2.5濃度和PM10濃度進行空間插值模擬。
對獲取的空氣質(zhì)量采樣點數(shù)據(jù)進行檢查,分析數(shù)據(jù)特點。采用直方圖、正態(tài)QQ圖檢驗數(shù)據(jù)的分布,確定數(shù)據(jù)是否需要變換以及變換的方式,使其符合正態(tài)分布;然后,進行趨勢分析,獲得數(shù)據(jù)的全局趨勢。探索數(shù)據(jù)的半變異/協(xié)方差云,了解數(shù)據(jù)的空間自相關(guān)情況和方向影響。
采用OK、UK、IDW、RBF 4種方法對信陽市PM2.5及PM10濃度數(shù)據(jù)進行空間插值。(1)OK插值:利用那些將要用來插值的離散點集合建立一個變量圖,變量圖通常包括兩個部分:一個是根據(jù)實驗獲得的變量圖,另一個是模型變量圖。模型變量圖是運用一個簡單的數(shù)學(xué)函數(shù)來模擬實驗獲得的變量圖趨勢。OK的權(quán)重不是基于任意的距離函數(shù),而是基于模型變量圖[20]。(2)UK插值:通過運用一個漂移項來臨時使用固定條件,這個漂移項是運用一個簡單的多項式函數(shù)來模擬離散點的平均值,殘差是漂移和離散點實際值之差[21]。(3)IDW插值:IDW基于相似相近原理,即兩個物體越接近,兩者的性質(zhì)就越相似,反之,離得越遠的相似性越小。IDW以插值點和樣本點之間的距離作為權(quán)重進行加權(quán)平均,離插值點越近的樣本點,賦予的權(quán)重就越大[22]。(4)RBF插值:RBF使用五種基函數(shù)(高斯曲面函數(shù)、多項式函數(shù)、線性函數(shù)、立體曲面函數(shù)、薄板曲面函數(shù))之一處理每一個測量采樣值,從而創(chuàng)建精確插值表面[23]
依據(jù)插值實現(xiàn)的數(shù)學(xué)原理分類,IDW與RBF屬于確定性的局部插值方法,OK與UK屬于地統(tǒng)計插值;依據(jù)是否能保證創(chuàng)建的表面經(jīng)過所有的采樣點分類,IDW與RBF屬于精確性插值,OK與UK屬于非精確性插值[24]。
本文采用平均誤差(ME)、均方根誤差(RMSE)作為插值結(jié)果的評價標(biāo)準。ME指測量值與預(yù)測值之間的平均差值,反映預(yù)測誤差的整體分布情況,其絕對值越趨于0,準確性越高。RMSE指模型預(yù)測結(jié)果與測量值的接近程度,此值越小越好[25]。
4種插值方法在相同單元上所得到的插值結(jié)果并不一致。當(dāng)兩種插值方法相互比較時,選擇一種為基準插值方法,另一種為比較插值方法。相對差系數(shù)的計算公式為:[26]
基準插值方法和比較插值方法采用斜率為1的直線來擬合,相對差系數(shù)反映了比較插值法和基準插值法之間整體的偏離程度。若α=1,兩種插值方法所得結(jié)果一致,插值方法之間不存在差異;若0<α<1,α值越小,兩種插值方法之間的差異就越大;若α<0,兩種插值方法之間沒有可比性。α的值取決于哪種插值方法被視為基準插值方法,由于基準插值方法不同,每一對被比較的插值方法都將會產(chǎn)生2個α。
散點圖直觀地以圖形方式表示2個數(shù)據(jù)集之間的相似性和相關(guān)性,揭示算法之間的函數(shù)關(guān)系[27]。以一種插值方法得到的濃度為X軸,另一種插值方法得到的濃度為Y軸,就能得到關(guān)于PM2.5和PM10不同插值方法的插值結(jié)果XY散點圖。如果兩種插值方法的結(jié)果一致,則散點圖表現(xiàn)為斜率為1的直線,函數(shù)關(guān)系為Y=X;如果兩種插值方法的插值結(jié)果不完全相同但有一定聯(lián)系,則線性回歸后的函數(shù)關(guān)系為Y=aX+b。
PM2.5與PM10濃度數(shù)據(jù)統(tǒng)計特征值見表1。PM2.5與PM10濃度數(shù)據(jù)都不符合正態(tài)分布,最大值分別為48、77 μg·m-3,最小值分別為10、37 μg·m-3,均值分別為28.38、54.90 μg·m-3。
表1 PM2.5與PM10的統(tǒng)計特征值Table 1 Statistical characteristic values of PM2.5 and PM10
4種插值方法設(shè)置參數(shù)均為默認,得到的插值誤差特征值見表2:對于PM2.5及PM10濃度數(shù)據(jù),OK和UK插值精度基本相同;4種插值方法的ME均為負,說明這4種插值整體上略低于實測值,其中,RBF的ME絕對值最接近于0,說明其精度最高;從RMSE看,4種插值方法的插值精度相差不大,但PM2.5的插值精度明顯高于PM10。
表2 不同插值方法的插值誤差特征值Table 2 Interpolation error eigenvalues of different interpolation methods (單位:μg·m-3)
不同插值方法的相對差系數(shù)如表3所示:不同插值方法得到的PM2.5和PM10濃度的相對差系數(shù)值具有一定的相似性。當(dāng)以IDW、RBF作為基準與OK、UK比較時,相對差系數(shù)α的值大部分小于0.6,說明IDW、RBF與OK、UK的插值結(jié)果差異性較大,其中IDW與OK的插值結(jié)果差異性最大。同時OK與UK、IDW與RBF的插值結(jié)果相對差系數(shù)值均較大,表明OK與UK、IDW與RBF的插值結(jié)果具有較高的相似性。相同類型的插值方法得到的插值結(jié)果相似性高,而不同類型插值方法得到的插值結(jié)果相似性低。同時結(jié)合插值誤差特征值的分析結(jié)果,RBF與IDW的插值結(jié)果更優(yōu)。
表3 PM2.5與PM10不同插值方法的相對差系數(shù)Table 3 Relative difference coefficient of different interpolation methods for PM2.5 and PM10
散點圖擬合的函數(shù)關(guān)系如表4所示。以線性回歸的相關(guān)系數(shù)R2作為評價的標(biāo)準,R2越高說明其回歸模擬的效果越好,兩種插值方法的相關(guān)性也越高。從表中可以看出,不同類型的插值方法的R2都較小,相同類型的插值方法的R2都偏大。對于PM2.5和PM10的插值結(jié)果,R2都大于0.5,說明這4種插值方法都具有一定的相關(guān)性;R2最高的是IDW與RBF,其值約為0.98,OK與UK次之,表明相關(guān)性最高的是IDW和RBF,OK與UK次之。
表4 PM2.5和PM10不同插值方法的函數(shù)關(guān)系Table 4 Functional relation between different interpolation methods of PM2.5 and PM10
本文基于信陽市各鄉(xiāng)鎮(zhèn)2020年5月的PM2.5與PM10平均濃度數(shù)據(jù),探討了OK、UK、IDW、RBF 4種插值方法模擬PM2.5與PM10濃度的誤差特征與不同插值方法模擬結(jié)果的相似性。插值結(jié)果的誤差特征值表明,RBF的插值誤差較小,RBF插值法是逼近理論中的一個有利工具,它最初是散亂數(shù)據(jù)插值的一種方法,具有計算格式簡單、節(jié)點配置靈活、計算工作量小、精度相對較高等優(yōu)點[28]。本文研究數(shù)據(jù)為信陽市各鄉(xiāng)鎮(zhèn)站點PM2.5與PM10的月平均數(shù)據(jù),在空間分布較散亂,因此RBF插值方法的插值結(jié)果較優(yōu)。
插值結(jié)果的相似性分析表明,不同插值方法對PM2.5、PM10模擬的結(jié)果并不一致。其中模擬PM2.5和PM10結(jié)果中最為相似的是RBF與IDW兩種插值方法,相對差系數(shù)為0.97或0.98,線性回歸相關(guān)系數(shù)也約為0.98;相似性最差的為IDW和OK兩種方法。同時依據(jù)插值分類可以看出,相似性分析結(jié)果與插值的分類方法相符合。盡管不同插值方法模擬PM2.5、PM10的統(tǒng)計指標(biāo)接近,但值得注意的是插值結(jié)果的相似性存在明顯差異。
在數(shù)據(jù)獲取和處理的過程中,不可避免會出現(xiàn)多種誤差,在一定程度上影響插值精度。同時,由于數(shù)據(jù)有限,對于PM2.5、PM10的每小時濃度與日均濃度數(shù)據(jù)的插值研究有待進一步探討,不同地區(qū)的插值可能會呈現(xiàn)不同的結(jié)果,其他的插值方法對PM2.5、PM10插值的對比分析等問題還有待考究。