周智敏 孫丹 喻琴昆
摘? 要:文章利用氣象要素和PM2.5質(zhì)量濃度數(shù)據(jù),對四川省PM2.5的時空變化和定量模擬進行了研究。結(jié)果表明:西、北地區(qū)PM2.5污染最輕,污染呈改善趨勢,四季變化不明顯;東、南地區(qū)污染較重,四季變化明顯,其中成都、巴中空氣質(zhì)量改善較大,宜賓、內(nèi)江和自貢空氣質(zhì)量改善不明顯。同時,混合效應(yīng)模型會顯著提高氣象要素與PM2.5之間的相關(guān)性,綿陽模擬效果最好,交叉驗證后,R2為0.82,RMSE為7.32 μg/m3,PRE為13.39%;宜賓最差,三者分別為0.74、23.61 μg/m3和34.54%;八地市平均為0.78、16.31 μg/m3和26.68%。
關(guān)鍵詞:四川省;時空演化;定量模擬;混合效應(yīng)模型;十折交叉驗證
中圖分類號:X513;TP391.9? ? ? ? ? ? ?文獻標識碼:A 文章編號:2096-4706(2021)19-0111-06
The Spatiotemporal Evolution Characteristics and Quantitative Simulation of PM2.5 in Sichuan Province
ZHOU Zhimin1, SUN Dan1, YU Qinkun2
(1.ABA Teachers University, Aba? 623002, China; 2.Zigong Meteorological Office, Zigong? 610072, China)
Abstract: This paper studies the spatiotemporal evolution and quantitative simulation of PM2.5 in Sichuan Province by using meteorological elements and PM2.5 mass concentration data. The results show: PM2.5 pollution in Sichuans western and northern regions is the lightest and displays a trend of continual improvement, and the change in four seasons is not obvious; the eastern and southern regions are heavily polluted, with obvious changes in four seasons. Among them, the air quality in Chengdu and Bazhong has improved greatly, the air quality in Yibin, Neijiang and Zigong has not improved significantly. At the same time, the mixed effect model will significantly improve the correlation between meteorological elements and PM2.5, Mianyang has the best simulation effect. After the cross validation, R2 is 0.82, RMSE is 7.32 μg/m3 and PRE is 13.39%; Yibin is the worst, the three index are respectively 0.74, 23.61 μg/m3 and 34.54%; the average value of eight cities are 0.78, 16.31 μg/m3 and 26.68%.
Keywords: Sichuan Province; spatiotemporal evolution; quantitative simulation; mixed effect model; 10-fold cross-validation
0? 引? 言
近數(shù)十年,我國社會經(jīng)濟及城市化的飛速發(fā)展,導(dǎo)致了環(huán)境空氣質(zhì)量日益惡化,其中以津京冀、長三角、珠三角以及四川盆地最為突出[1,2]。諸多研究表明,細顆粒物(PM2.5)是大氣污染問題的決定性影響因素之一,且城市大氣污染儼然已發(fā)展成重大民生問題之一[3]。對此,2017年,國務(wù)院常務(wù)會議部署了對大氣重污染研究項目,并由環(huán)保部(現(xiàn)生態(tài)環(huán)境部)結(jié)合科技部、中科院、氣象、高校等部委和多單位協(xié)同攻關(guān),設(shè)立了大氣重污染成因與治理攻關(guān)項目,旨在解析津京冀地區(qū)“2+26”城市大氣重污染成因以及治理管控技術(shù)[4],隨著攻關(guān)項目的開展,現(xiàn)已擴大到覆蓋四川盆地等全部四大重污染區(qū)域。
PM2.5濃度的時空變化是研究大氣污染的基礎(chǔ),但針對區(qū)域污染,通常只能采用“以點代面”的方法進行研究[5]。對此,發(fā)展了諸多反演技術(shù),如衛(wèi)星遙感反演[6,7]、氣象要素反演[8,9]、能見度反演[10]、自回歸預(yù)測[11,12]、機器學(xué)習(xí)[13-15]等。
目前的反演統(tǒng)計學(xué)模型基本為確定性模型,通常選取與PM2.5密切相關(guān)的因子進行建模,如風(fēng)、降水、溫度、相對濕度等[16],該類模型的精度受制于因子的時空易變性難以提升。針對PM2.5模擬,Lee等[17]首次提出了混合效應(yīng)模型,并取得了更優(yōu)的擬合度。Zheng等[18]和Xie等[6]將其引進我國,模擬出與實測值更貼近的PM2.5濃度,但主要在北方運用,且通常基于AOD數(shù)據(jù),部分地區(qū)難以業(yè)務(wù)化,本文將改用易獲取的氣象要素來反演,具有一定的實用價值。
1? 資料與方法
1.1? 資料獲取
PM2.5濃度數(shù)據(jù)來源于四川省各國控站點2014年1月—2018年12月的逐日數(shù)據(jù)以及2019年1月—2019年4月的逐時數(shù)據(jù);氣象數(shù)據(jù)來自NCDC(美國國家氣候數(shù)據(jù)中心),ftp://ftp.ncdc.noaa.gov/pub/data/noaa/isd-lite/,選取同時空范圍內(nèi)的站點數(shù)據(jù)。
經(jīng)數(shù)據(jù)質(zhì)控,將缺失6小時或連續(xù)4小時以上的天剔除,共得到485天數(shù)據(jù),選取數(shù)據(jù)匹配度不低于70%的城市(即配對天數(shù)≥340天),包括成都、綿陽、樂山、宜賓、內(nèi)江、瀘州、達州和雅安8地市。
1.2? 研究方法
1.2.1? 混合效應(yīng)模型介紹
混合效應(yīng)模型是固定效應(yīng)和隨機效應(yīng)的組合模型。固定效應(yīng)認為各獨立研究的結(jié)果基本相同,無顯著性差異;隨機效應(yīng)則是頻率派(所有樣本均來源于一個無限的群體)結(jié)合貝葉斯模型(視固定系數(shù)為服從正態(tài)分布的隨機變量)的體現(xiàn),是經(jīng)典線性模型的推廣;部分學(xué)者認為混合效應(yīng)模型實質(zhì)上是經(jīng)驗貝葉斯或半貝葉斯模型。同時,隨機效應(yīng)可使模型的自由度(df)變小,這對于高維數(shù)據(jù)分析有著至關(guān)重要的作用。
1.2.2? 混合效應(yīng)方法
諸多研究結(jié)果顯示,利用混合效應(yīng)模型預(yù)測PM2.5濃度效果更優(yōu)[6,17,18]。為探究研究區(qū)內(nèi)PM2.5與其影響因子隨時間的變化特性,本研究中采用混合效應(yīng)模型來模擬四川各區(qū)市PM2.5的濃度分布。
在研究中,首先找到影響各地區(qū)PM2.5濃度的氣象因子,建立PM2.5預(yù)報因子(Pre-forecast index, Pfi),因此,混合效應(yīng)模型Pfi-PM2.5的具體表達式為:
(1)
式中,PM2.5ij表示第i個點位第j天的濃度;α、μj為固定截距、隨機截距,β、vj為固定斜率、隨機斜率,Pfiij為PM2.5預(yù)報因子集合Pfi的向量表征,Si為站點i的空間隨機效應(yīng),εij為站點i在第j天的隨機效應(yīng)誤差項,以及隨機效應(yīng)的方差—協(xié)方差矩陣。模型中固定效應(yīng)部分不隨時間、站點變化;隨機效應(yīng)μj、vj僅隨時間變化,體現(xiàn)了Pfi-PM2.5隨時間的變化關(guān)系;隨機效應(yīng)Si僅隨站點變化,表征了Pfi-PM2.5關(guān)系的空間差異。
1.2.3? 驗證方法
十折交叉驗證常常用評估預(yù)測模型的準確性,隨機打亂數(shù)據(jù)排序,然后將其平分為10份,分別利用9份訓(xùn)練模型,一份做測試,重復(fù)10次,最后將10次結(jié)果求平均,視為該模型的準確度。
本研究用預(yù)測、實際值之間的相關(guān)系數(shù)R2、均方誤差(RMSE)和相對預(yù)測誤差(RPE)作為評估預(yù)測模型的準確度。其中,RMSE和RPE的表達式如下:
(2)
RPE=RMSE/mean(PMobs)×100%? ? ? ? ? ? ? ? ?(3)
式中,obs代表實際觀測,model代表模型預(yù)測,n為樣本總量,mean(PMobs)表示實際PM2.5濃度的平均值。
2? 結(jié)果與討論
2.1? 四川省PM2.5時間變化特征
圖1給出了2014—2019年四川省PM2.5質(zhì)量濃度的時間變化特征及空間分布情況。根據(jù)四川省各國控站點PM2.5數(shù)據(jù),通過反距離權(quán)重插值方法,得到四川省PM2.5空間分布圖。從整體空間分布上看,四川省西、北部地區(qū)的甘孜、阿壩以及涼山州等地區(qū)污染最輕,東、南部地區(qū)的污染明顯偏重,這與四川省內(nèi)工業(yè)發(fā)展密切相關(guān)。從年際演變上看:2013年污染最嚴重的地區(qū)為東南部瀘州以及中部成都地區(qū);2014年主要是巴中、成都及資陽地區(qū);2015—2018年內(nèi)江和自貢地區(qū)污染最重,與鄧中慈等[19]研究結(jié)論一致;2019年根據(jù)1—4月的數(shù)據(jù)顯示,污染較重的區(qū)域為宜賓、樂山、自貢以及達州等地區(qū)。其中,成都和巴中市空氣質(zhì)量改善最為明顯,宜賓、內(nèi)江和自貢等地區(qū)空氣質(zhì)量改善相對最差。
圖2顯示了四川省PM2.5濃度的四季分布圖,整體上還是東部地區(qū)污染更嚴重。從圖中可看出,大部分地區(qū)PM2.5四季存在明顯變化,均是冬季污染最嚴重,其次是春季,夏季污染相對最小。從各地區(qū)來看,甘孜、阿壩、涼山以及攀枝花地區(qū)四季PM2.5濃度變化較小,其余地區(qū)變化均較大,特別是成都、內(nèi)江、自貢、達州、瀘州以及宜賓等地區(qū)。
2.2? 模型擬合及交叉驗證結(jié)果
利用混合效應(yīng)模型對各站點進行空氣質(zhì)量模擬,并進行十折交叉驗證,其中南充市數(shù)據(jù)匹配較好(配對天數(shù)381天),但由于空氣質(zhì)量站點與氣象觀測站點距離過大,導(dǎo)致各站點的模擬結(jié)果偏差均很大。
2.2.1? 八地市結(jié)果偏差分析
表1中統(tǒng)計了各監(jiān)測站點的隨機偏差值,其中距離表示空氣質(zhì)量監(jiān)測站距氣象要素觀測站的直線距離(km),樣本表示PM2.5與Pfi預(yù)報因子配對天數(shù),為方便各地市之間的橫向?qū)Ρ龋涣谐隽烁鞯厥袠颖玖颗琶?的站點。經(jīng)統(tǒng)計發(fā)現(xiàn),大部分預(yù)報因子Pfi不是能見度的站點,也即意味著使用溫度、風(fēng)速等氣象要素作為混合效應(yīng)模型的預(yù)報因子,大多取得的效果低于能見度。
由表1還可看出,通常數(shù)據(jù)樣本量越大,模擬值的偏差相對越小,而空氣質(zhì)量站點離氣象觀測站點越遠,其偏差也相對較大;但也存在完全相反的情況,如達州鳳凰小區(qū)站與市環(huán)境監(jiān)測站,造成該結(jié)果的可能與數(shù)據(jù)質(zhì)量有關(guān)。成都、綿陽、雅安等地區(qū)部分站點偏差出現(xiàn)明顯負值,表明這些站點的PM2.5濃度會受到周圍地區(qū)污染物傳輸?shù)挠绊?。這表明了站點的隨機效應(yīng)能一定程度上反饋在模型結(jié)果上,但當距離過遠時,其結(jié)果誤差會顯著變大;同時還受制于數(shù)據(jù)的樣本量。
2.2.2? 混合模型與交叉驗證結(jié)果分析
圖3給出了成都市模型擬合的PM2.5濃度值與實測值之間的相關(guān)關(guān)系圖,從中可發(fā)現(xiàn),混合效應(yīng)模型中相關(guān)系數(shù)R2為0.87,RMSE和PRE分別為10.62 μg/m3、14.26%;交叉驗證后的R2降低到0.76,RMSE和PRE分別增高到17.74 μg/m3和26.5%,比確定性統(tǒng)計模型在成都地區(qū)的結(jié)果提高,表明氣象要素的時間和空間變化確實能造成一定程度上的變異。經(jīng)過交叉驗證后,R2降低,RMSE和PRE比驗證前有所增大,表明了混合模型確實存在一定的過擬合現(xiàn)象,而交叉驗證能一定程度上降低過擬合。
表2給出了八地市,混合效應(yīng)模型擬合與交叉驗證的R2、RMSE和PRE。從表中可看出,各站點混合效應(yīng)模型的R2介于0.77~0.91,擬合結(jié)果相關(guān)性最好的綿陽0.91,最差的是宜賓0.77,經(jīng)過交叉驗證后,R2介于0.74~0.82之間,擬合相關(guān)性最好和最差仍然是綿陽和宜賓。各地區(qū)混合效應(yīng)擬合R2和交叉驗證擬合R2的差距介于0.02~0.09之間,再次證明了混合效應(yīng)模型存在一定的過擬合現(xiàn)象。從均方誤差上看,各地區(qū)的RMSE介于5.95 μg/m3~ 16.88 μg/m3之間,平均為12.26 μg/m3;交叉驗證后的RMSE介于7.32 μg/m3 ~ 23.61 μg/m3之間,平均為16.31 μg/m3。從相對預(yù)測誤差上看,各地區(qū)的PRE介于10.89%~24.97%之間,平均為19.83%;經(jīng)校驗驗證后PRE介于13.39%~34.54%,平均為26.68%。
3? 討? 論
目前,存在多種要素反演地面PM2.5質(zhì)量濃度的方法,其中較為全面的為衛(wèi)星AOD反演,但AOD產(chǎn)品的下載以及后處理需要耗費大量時間,因此,利用觀測站氣象要素反演地面PM2.5質(zhì)量濃度則是其中最為便捷的方法之一。
混合效應(yīng)模型擅長建立處理時間序列,諸多研究也發(fā)現(xiàn)該模型對時間變化效應(yīng)的校準大于空間變化效應(yīng),但也能在一定程度上反應(yīng)出空間變化效應(yīng)的影響。從本文構(gòu)建的模型來看,考慮了監(jiān)測站點的隨機效應(yīng)后,能一定程度上消除空間尺度差異所導(dǎo)致的預(yù)測誤差。但不能完全消除空間差異,即成都、綿陽、雅安等地區(qū)多個站點的偏差均為負數(shù)。
本文利用的PM2.5監(jiān)測數(shù)據(jù)均來自于城區(qū)的國控站點,分布密集,區(qū)域代表性不強,隨著國家監(jiān)測站點網(wǎng)絡(luò)的逐步完善,可加入更多的省控、市控監(jiān)測站點,以提高訓(xùn)練樣本的區(qū)域代表性。
4? 結(jié)? 論
利用氣象要素數(shù)據(jù)和國控站點PM2.5質(zhì)量濃度數(shù)據(jù),首先討論了四川省地區(qū)PM2.5的時空變化規(guī)律,然后基于混合效應(yīng)模型結(jié)合十折交叉驗證,針對2018—2019年1—4月四川省八地市氣象要素反演PM2.5質(zhì)量濃度進行了建模。結(jié)果表明:
(1)從整體上看,四川省西、北部地區(qū)的甘孜、阿壩以及涼山州等地區(qū)PM2.5污染最輕,東、南部地區(qū)的污染明顯偏重,這與四川省內(nèi)工業(yè)發(fā)展密切相關(guān)。從年際演變上看,污染較輕的西、北部地區(qū)改善較大,污染較重的東、南部部分地區(qū)有改善,如成都和巴中市空氣質(zhì)量改善最為明顯,宜賓、內(nèi)江和自貢等地區(qū)空氣質(zhì)量改善相;從四季變化上看,PM2.5污染較重的東、南部地區(qū),其濃度值四季存在明顯變化,均是冬季污染最嚴重,其次是春季,夏季污染相對最小,甘孜、阿壩、涼山等西、北部地區(qū),四季PM2.5濃度變化則很小。
(2)氣象要素與PM2.5之間的直接相關(guān)性通常不高,在采用混合效應(yīng)模型擬合的R2最低為0.77,最高為0.91,經(jīng)過交叉驗證后R2介于0.74~0.82,說明混合效應(yīng)模型能較大程度上提高二者之間的相關(guān)性;模型均方誤差RMSE平均為12.26 μg/m3;交叉驗證后的RMSE平均為16.31 μg/m3。從相對預(yù)測誤差上看,各地區(qū)的PRE平均為19.83%;經(jīng)校驗驗證后PR平均為26.68%。即模型能較好地預(yù)測一定范圍內(nèi)的地面PM2.5質(zhì)量濃度。
參考文獻:
[1] 吳兌,吳曉京,李菲,等.1951—2005年中國大陸霾的時空變化 [J].氣象學(xué)報,2010,68(5):680-688.
[2] 吳丹,于亞鑫,夏俊榮,等.我國灰霾污染的研究綜述 [J].環(huán)境科學(xué)與技術(shù),2014,37(S2):295-304.
[3] 張小曳,孫俊英,王亞強,等.我國霧-霾成因及其治理的思考 [J].科學(xué)通報,2013,58(13):1178-1187.
[4] 楊婷,王自發(fā),何立濤,等.衡水市大氣污染成因研究及治理經(jīng)驗 [J].環(huán)境科學(xué)研究,2019,32(10):1730-1738.
[5] 陶金花,張美根,陳良富,等.一種基于衛(wèi)星遙感AOT估算近地面顆粒物的方法 [J].中國科學(xué):地球科學(xué),2013,43(1):143-154.
[6] XIE Y Y,WANG Y X,ZHANG K,et al. Daily Estimation of Ground-Level PM2.5 Concentrations over Beijing Using 3 km Resolution MODIS AOD [J].Environmental Science & Technology,2015:49(20):12280-12288.
[7] FANG X,ZOU B,LIU X P,et al. Satellite-based ground PM2.5 estimation using timely structure adaptive modeling [J].Remote Sensing of Environment,2016,186:152-163.
[8] 張晨雷,陳報章,王瑾.WRF模式氣象數(shù)據(jù)在遙感反演PM(2.5)中的應(yīng)用研究 [J].地理空間信息,2018,16(2):45-47+11.
[9] 黃善斌.關(guān)于PM2.5與氣象條件關(guān)系及其預(yù)報研究 [D].濟南:齊魯工業(yè)大學(xué),2017.
[10] 崔蕾,倪長健,孫歡歡,等.能見度反演PM(2.5)質(zhì)量濃度方法的對比分析 [J].生態(tài)與農(nóng)村環(huán)境學(xué)報,2016,32(2):338-341.
[11] 李為東,李莉,徐巖.基于時間序列分析的北京地區(qū)PM2.5濃度研究 [J].運籌學(xué)學(xué)報,2018,22(2):115-126.
[12] 宋國君,國瀟丹,楊嘯,等.沈陽市PM(2.5)濃度ARIMA-SVM組合預(yù)測研究 [J].中國環(huán)境科學(xué),2018,38(11):4031-4039.
[13] SUN Q,ZHU Y M,CHEN X M,et al. A hybrid deep learning model with multi-source data for PM2.5 concentration forecast [J].Air Quality Atmosphere & Health,2021,14:503-513.
[14] 范竣翔,李琦,朱亞杰,等.基于RNN的空氣污染時空預(yù)報模型研究 [J].測繪科學(xué),2017,42(7):76-83+120.
[15] FENG R. Investigating wintertime air pollution in Hangzhou,China [J].Air Quality,Atmosphere & Health,2020,13(3):321-328.
[16] 孫歡歡,倪長健,崔蕾,等.成都市大氣顆粒物污染特征及與氣象因子的關(guān)聯(lián)性分析 [J].環(huán)境污染與防治,2016,38(5):55-60.
[17] LEE H J,LIU Y,COULL B A,et al. A novel calibration approach of MODIS AOD data to predict PM2.5 concentrations [J].Atmospheric Chemistry & Physics,2011,11(15):7991-2011.
[18] ZHENG Y Y,ZHANG Q,LIU Y,et al. Estimating ground-level PM2.5 concentrations over three megalopolises in China using satellite-derived aerosol optical depth measurements [J].Atmospheric environment,2016,124:232-242.
[19] 鄧中慈,康平,胡成媛,等.四川盆地PM(2.5)時空分布及影響因子研究 [J].環(huán)境污染與防治,2020,42(11):1334-1337.
作者簡介:周智敏(1991—),女,漢族,廣東梅州人,科員,碩士研究生,主要研究方向:大氣環(huán)境污染;通訊作者:孫丹(1986—),女,漢族,重慶萬州人,科長,碩士研究生,主要研究方向:機器圖像與視覺、模式識別。