曾江毅,李志生,歐耀春,金宇凱
(廣東工業(yè)大學(xué) 土木與交通工程學(xué)院, 廣東 廣州 510006)
隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展,空氣污染逐漸對(duì)人們的工作和生活造成嚴(yán)重影響[1],其中以霧霾為首的大氣污染問(wèn)題尤為突出,而PM2.5作為霧霾的主要成因之一,對(duì)人體造成各種程度的危害。PM2.5指的是在空氣中當(dāng)量直徑小于等于2.5 μm的顆粒物,其來(lái)源十分廣泛,包括化石燃料的燃燒、垃圾焚燒、工業(yè)粉塵、廚房煙氣等[2-3]。近年來(lái),有不少國(guó)內(nèi)外學(xué)者運(yùn)用了多種預(yù)測(cè)模型對(duì)PM2.5質(zhì)量濃度進(jìn)行了預(yù)測(cè)研究。張洪[4]結(jié)合風(fēng)速、風(fēng)向、氣溫、相對(duì)濕度等因素,Xu 等[5]還結(jié)合了道路信息,運(yùn)用站點(diǎn)預(yù)測(cè)模型和網(wǎng)格預(yù)測(cè)模型對(duì)京津冀地區(qū)的PM2.5質(zhì)量濃度進(jìn)行了預(yù)測(cè); Masood等[6]結(jié)合氣象因素及大氣污染物建立了支持向量機(jī)(Support Vector Machine)模型和人工神經(jīng)網(wǎng)絡(luò)模型,對(duì)印度德里的PM2.5質(zhì)量濃度進(jìn)行了預(yù)測(cè);張怡文等[7]運(yùn)用主成分分析法結(jié)合BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)對(duì)合肥市的PM2.5質(zhì)量濃度進(jìn)行了預(yù)測(cè)分析,說(shuō)明了PM2.5質(zhì)量濃度受季節(jié)因素的影響較大,由于不同季節(jié)的氣象有不同的特征,對(duì)PM2.5質(zhì)量濃度的影響也不同; He等[8]和Asha[9]均運(yùn)用了多元逐步回歸,并分別結(jié)合其他方法,對(duì)上海市和印度馬哈拉施特拉邦的PM2.5質(zhì)量濃度進(jìn)行了預(yù)測(cè)。
上述研究主要探究了PM2.5質(zhì)量濃度與大氣污染物、氣象因子之間的相關(guān)性,并對(duì)PM2.5質(zhì)量濃度進(jìn)行了預(yù)測(cè),結(jié)果顯示大部分城市的PM2.5質(zhì)量濃度均存在季節(jié)性變化規(guī)律。同時(shí),文獻(xiàn)[10-11]的結(jié)論也顯示PM2.5質(zhì)量濃度具有明顯的季節(jié)變化趨勢(shì)。針對(duì)這一現(xiàn)象,若能夠?qū)鹘y(tǒng)的預(yù)測(cè)模型進(jìn)行改良,使其能夠適應(yīng)這種季節(jié)性變化規(guī)律,便可在一定程度上提高預(yù)測(cè)精度。廣州作為廣東省的省會(huì)、我國(guó)重要的中心城市,空氣污染等環(huán)境問(wèn)題備受關(guān)注,且廣州地處亞熱帶季風(fēng)氣候區(qū),氣象因素具有明顯季節(jié)性變化,具有廣泛代表性。據(jù)廣東省2021年第七次全國(guó)人口普查數(shù)據(jù)[12]顯示,廣州市常住人口位居全省第一,具有一定的研究意義。因此針對(duì)廣州市的PM2.5質(zhì)量濃度變化情況,本文將引入季節(jié)指數(shù)概念,改進(jìn)傳統(tǒng)的多元線性回歸模型、多層感知器預(yù)測(cè)模型,建立一個(gè)改良的預(yù)測(cè)模型用于廣州市PM2.5質(zhì)量濃度的預(yù)測(cè),為PM2.5質(zhì)量濃度預(yù)測(cè)和防治工作提供一定的理論基礎(chǔ)和改進(jìn)思路。
本文所使用的污染物數(shù)據(jù)來(lái)自于廣州市生態(tài)環(huán)境局的實(shí)測(cè)數(shù)據(jù)(http://sthjj.gz.gov.cn/),原始數(shù)據(jù)為2015~2019年廣州市PM2.5、PM10、NO2等污染物月數(shù)據(jù);氣象數(shù)據(jù)來(lái)自于中國(guó)氣象數(shù)據(jù)網(wǎng)(http://data.cma.cn/),原始數(shù)據(jù)為2015~2019年廣州市氣溫、濕度等月數(shù)據(jù)。
PM2.5質(zhì)量濃度會(huì)因?yàn)闇囟取穸鹊纫蛩爻尸F(xiàn)出一種周期性的變化。例如在夏季,降水可以在一定程度上清除大氣污染物,而冬季降水相對(duì)較少,很難達(dá)到稀釋大氣污染物的效果。此外,風(fēng)也可以在一定程度上減少大氣污染物,風(fēng)速越大越有利于大氣污染物的稀釋擴(kuò)散[13]。分析廣州市生態(tài)環(huán)境局以月為單位統(tǒng)計(jì)的PM2.5質(zhì)量濃度的發(fā)展趨勢(shì),2015~2019年廣州市PM2.5質(zhì)量濃度的季節(jié)性變化規(guī)律如圖1所示。
圖1 2015~2019年廣州市PM2.5質(zhì)量濃度季節(jié)性變化規(guī)律圖Fig.1 Seasonal variation pattern of PM2.5 concentration in Guangzhou from 2015 to 2019
其變化特征表現(xiàn)為以下幾個(gè)方面:(1) 趨勢(shì)下降性:據(jù)圖1所示,在同一統(tǒng)計(jì)月,部分年份的PM2.5質(zhì)量濃度有下降的趨勢(shì)。主要原因是近年來(lái)廣州市推進(jìn)公交車電動(dòng)化,也加大了城市揚(yáng)塵的污染防控力度,城市大氣顆粒污染物得到一定的控制。(2) 季節(jié)變化性:據(jù)圖1所示,在同一年度,隨著月份的變化,PM2.5質(zhì)量濃度呈現(xiàn)出季節(jié)性變化。主要表現(xiàn)為4~8月,隨著月降水量的增加,雨水可以更好地洗刷空氣中的污染物,PM2.5質(zhì)量濃度下降較快;6月PM2.5質(zhì)量濃度最低。12月至次年1月氣溫達(dá)到最低,PM2.5質(zhì)量濃度上升速率較快;大部分年份在1月出現(xiàn)高峰;PM2.5最高質(zhì)量濃度約為最低的2~3倍。數(shù)據(jù)分析說(shuō)明季節(jié)因素對(duì)于城市PM2.5質(zhì)量濃度有一定的影響。
月度PM2.5質(zhì)量濃度統(tǒng)計(jì)的時(shí)間跨度較長(zhǎng),容易受氣候、假期等穩(wěn)定因素的影響,大氣中的PM2.5質(zhì)量濃度呈現(xiàn)出一種非線性的下降趨勢(shì)。
能夠處理這種季節(jié)性波動(dòng)的方法有3種,分別是小波分解、滑動(dòng)平均法和惠普濾波分解。而惠普濾波分解是相對(duì)簡(jiǎn)單的方法,它通過(guò)有限的數(shù)據(jù)分解信號(hào),不僅可以捕捉一般趨勢(shì),而且可以表征時(shí)間序列數(shù)據(jù)集中的季節(jié)因素。
1.3.1 季節(jié)指數(shù)
季節(jié)指數(shù)法既考慮了季節(jié)指數(shù)的趨勢(shì)性變化,又充分利用了已知數(shù)據(jù)信息,因此廣泛應(yīng)用于能源、疾病等方面的預(yù)測(cè)[14-15],是一種較好的預(yù)測(cè)季節(jié)性波動(dòng)時(shí)間序列的一般方法[16]。假設(shè)PM2.5的月質(zhì)量濃度是由2部分組成,分別是趨勢(shì)部分和周期性部分。其公式為
式中:Yt為第t個(gè)月的PM2.5質(zhì)量濃度實(shí)際值;Y為第t個(gè)月的PM2.5質(zhì)量濃度趨勢(shì)值;Y為PM2.5質(zhì)量濃度周期值。
由于該時(shí)間序列的趨勢(shì)部分相對(duì)平滑,所以在使用惠普濾波器從初始的時(shí)間序列中分離趨勢(shì)分量時(shí),約束條件相當(dāng)于式(2)的最小值問(wèn)題。
季節(jié)指數(shù)能夠描述時(shí)間序列的季節(jié)性周期變化特征[18]。一般來(lái)說(shuō),季節(jié)因素對(duì)同一季節(jié)的影響相對(duì)穩(wěn)定,因此季節(jié)指數(shù)可以通過(guò)計(jì)算每個(gè)月PM2.5質(zhì)量濃度的實(shí)際值與趨勢(shì)部分的比值得到。
式中:st為第t個(gè)月的季節(jié)指數(shù);Yt為第t個(gè)月的PM2.5質(zhì)量濃度實(shí)際值;Y為第t個(gè)月的PM2.5質(zhì)量濃度趨勢(shì)值。
1.3.2 多層感知器
多層感知器(Multilayer Perceptron ,MLP)包括輸入層、輸出層和多個(gè)隱藏層,是一種多層前饋人工神經(jīng)網(wǎng)絡(luò)。其結(jié)構(gòu)簡(jiǎn)單,有良好的容錯(cuò)性、魯棒性和極強(qiáng)的非線性映射能力[19]。人工神經(jīng)元是MLP模型的信息處理節(jié)點(diǎn),是MLP模型的最基本處理單元。神經(jīng)元之間的連接強(qiáng)度稱為連接權(quán)值,信息處理機(jī)制為
1.3.3 多元線性回歸模型
線性回歸是利用數(shù)理統(tǒng)計(jì)中的回歸分析來(lái)確定2種或2種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法,運(yùn)用十分廣泛?;貧w分析中包括2個(gè)或2個(gè)以上的自變量,且因變量和自變量之間是線性關(guān)系,該模型一般形式為
式中:y為因變量;x1···xk為 非隨機(jī)變量;β0···βk為回歸系數(shù);ξ 為隨機(jī)誤差項(xiàng)。
本文采用廣州市2015~2019年的PM2.5月質(zhì)量濃度數(shù)據(jù),根據(jù)1.3.1部分,通過(guò)Eviews10進(jìn)行惠普濾波分解,將原始的時(shí)間序列分成趨勢(shì)部分與周期性部分。結(jié)果如圖2所示。
圖2 2015~2019年廣州市PM2.5質(zhì)量濃度惠普濾波分解圖Fig.2 HP filter decomposition diagram of PM2.5 concentration in Guangzhou from 2015 to 2019
如圖2所示,廣州市的PM2.5質(zhì)量濃度具有緩慢下降的趨勢(shì),也存在明顯的季節(jié)性波動(dòng),2017年表現(xiàn)的最為明顯。通過(guò)式(3)對(duì)原始數(shù)據(jù)進(jìn)行處理,即得到每個(gè)月份的季節(jié)指數(shù)。
2.2.1 MLP模型構(gòu)建
將PM2.5月質(zhì)量濃度作為因變量,PM10、NO2、SO2、O3、CO、平均氣溫、平均風(fēng)速、平均氣壓、平均相對(duì)濕度、雨天數(shù)(均為月度數(shù)據(jù))作為協(xié)變量[20-22],且協(xié)變量均作正態(tài)化處理。構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)為9-16-16-1,即模型包括1個(gè)輸入層、2個(gè)隱藏層和1個(gè)輸出層。輸入層有9個(gè)神經(jīng)元,隱藏1層有16個(gè)神經(jīng)元,隱藏2層有16個(gè)神經(jīng)元,輸出層有1個(gè)神經(jīng)元。隱藏層的激活函數(shù)均為S型函數(shù)。模型的樣本數(shù)和誤差見(jiàn)表1。
表1 廣州市PM2.5(趨勢(shì)部分)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型情況Table 1 PM2.5 (trend part) neural network prediction model in Guangzhou
多層感知器神經(jīng)網(wǎng)絡(luò)會(huì)對(duì)自變量的重要性進(jìn)行排序,結(jié)果顯示“SO2”“平均相對(duì)濕度”“CO”重要性占比較高。其原因可能是PM2.5與SO2和CO具有同源性,均來(lái)源于城市機(jī)動(dòng)車尾氣。
2.2.2 多元線性回歸分析
研究表明,PM2.5與PM10、NO2、SO2、O3、CO、平均氣溫、平均風(fēng)速、平均氣壓、平均相對(duì)濕度、雨天數(shù)具有較好的相關(guān)性[23]。將2.1所求得的各月季節(jié)指數(shù)結(jié)合隨機(jī)變量(廣州市的PM10、NO2、SO2、O3、CO、平均氣溫、平均風(fēng)速、平均氣壓、平均相對(duì)濕度、雨天數(shù))計(jì)算各自的回歸系數(shù),得出回歸方程為
式中:s為季節(jié)指數(shù);x1為 PM10質(zhì)量濃度;x2為NO2質(zhì)量濃度;x3為 SO2質(zhì)量濃度;x4為 O3質(zhì)量濃度;x5為CO質(zhì)量濃度;x6為平均氣溫;x7為平均風(fēng)速;x8為平均氣壓;x9為平均相對(duì)濕度;x10為雨天數(shù)。
利用上述模型,可以得到各月的PM2.5質(zhì)量濃度趨勢(shì)值以及對(duì)應(yīng)季節(jié)指數(shù)的預(yù)測(cè)值,將上文計(jì)算結(jié)果按照式(8)進(jìn)行整合。
式中:Y0,t為 第t個(gè)月的預(yù)測(cè)值;s0,t為第t個(gè)月季節(jié)指數(shù)的預(yù)測(cè)值;Y為第t個(gè)月趨勢(shì)部分的預(yù)測(cè)值。
整合后即可得出組合模型的預(yù)測(cè)值,組合模型預(yù)測(cè)值與實(shí)際值的變化曲線如圖3所示。
圖3 廣州市2015年~2019年P(guān)M2.5質(zhì)量濃度組合模型預(yù)測(cè)值與實(shí)際值變化曲線Fig.3 Change curve between PM2.5 calculated value of combination model and actual value in Guangzhou from 2015 to 2019
為驗(yàn)證模型的準(zhǔn)確性,用3個(gè)指標(biāo)檢驗(yàn)?zāi)P偷木龋壕礁`差(Root Mean Square Error, RMSE)、平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)、平均絕對(duì)誤差(Mean Absolute Error, MAE)[24-25],見(jiàn)式(9)~(11)。
式中:e(i)=Yt-Y0為 誤差;Yt為實(shí)際數(shù)據(jù)值;Y0為預(yù)測(cè)數(shù)據(jù)值。
為了驗(yàn)證本模型的性能,采用多層感知器與多元線性回歸分別對(duì)原始數(shù)據(jù)進(jìn)行一次計(jì)算(各模型參數(shù)與組合模型相同),多層感知器與多元線性回歸模型的計(jì)算值與實(shí)際值的變化曲線對(duì)比如圖4所示,各模型的預(yù)測(cè)精度如表2所示。
圖4 廣州市2015年~2019年P(guān)M2.5質(zhì)量濃度其他模型計(jì)算值與實(shí)際值變化曲線Fig.4 Change curve between PM2.5 calculated value of other models and actual value in Guangzhou from 2015 to 2019
表2 各模型預(yù)測(cè)精度Table 2 Prediction accuracy of each model
由圖3和圖4可以看出,3個(gè)模型預(yù)測(cè)的結(jié)果和實(shí)際值總體來(lái)說(shuō)符合情況較好,其中經(jīng)過(guò)季節(jié)指數(shù)優(yōu)化后的組合模型預(yù)測(cè)精度高于優(yōu)化前的預(yù)測(cè)精度,根據(jù)表2中的3個(gè)指標(biāo)可以看出,組合模型的RMSE、MAPE、MAE分別比多層感知器模型減少了23.1%、31%、24.2%;比多元線性回歸模型減少了35.3%、41.3%、41%。
本文根據(jù)PM2.5質(zhì)量濃度具有明顯的季節(jié)性變化這一特點(diǎn),借助惠普濾波分解器,引入了季節(jié)指數(shù),組合優(yōu)化傳統(tǒng)的多元線性回歸模型和多層感知器模型,構(gòu)建了基于季節(jié)指數(shù)改進(jìn)的多元線性回歸和多層感知器模型,以用于PM2.5質(zhì)量濃度預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,該模型精度均優(yōu)于傳統(tǒng)的多元線性回歸模型和多層感知器模型。