摘要:為了提高大氣重污染潛勢(shì)預(yù)報(bào)的精準(zhǔn)性,提出基于敏感因子的大氣重污染潛勢(shì)分級(jí)預(yù)報(bào)技術(shù)。選取大氣通風(fēng)量、垂直溫度梯度和風(fēng)速垂直切變作為大氣重污染敏感因子,采用隨機(jī)森林(Random Forest,RF)算法分析大氣重污染的潛在變量。依據(jù)大氣重污染的日增量,進(jìn)行數(shù)據(jù)預(yù)處理,建立最優(yōu)多元線性回歸(Multiple Linear Regression,MLR)模型,篩選出最佳變量組合對(duì)大氣背景場(chǎng)進(jìn)行聚類處理,通過(guò)最優(yōu)子集回歸法得到重污染潛勢(shì)預(yù)報(bào)模型。試驗(yàn)結(jié)果表明,定量預(yù)報(bào)大氣重污染潛勢(shì)時(shí),所提技術(shù)的預(yù)報(bào)正確率為92.35%;預(yù)測(cè)大氣重污染潛勢(shì)等級(jí)時(shí),不同等級(jí)下的均方誤差(Mean Squared Error,MSE)均低于0.2,該技術(shù)具有較高的應(yīng)用價(jià)值。
關(guān)鍵詞:敏感因子;大氣重污染;潛勢(shì)定量預(yù)報(bào);隨機(jī)森林(RF);垂直溫度梯度
中圖分類號(hào):P456 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1008-9500(2024)11-0213-05
Research on the Grading and Forecasting Technology of Atmospheric Heavy Pollution Potential Based on Sensitive Factors
ZHANG Xu
(Bayannur Branch of Inner Mongolia Autonomous Region Environmental Monitoring Station, Bayannur 015000, China)
Abstract: In order to improve the accuracy of atmospheric heavy pollution potential forecasting, a classification forecasting technology for atmospheric heavy pollution potential based on sensitive factors is proposed. Selecting atmospheric ventilation rate, vertical temperature gradient and wind speed vertical shear as sensitive factors for heavy air pollution, the Random Forest (RF) algorithm is used to analyze the potential variables of heavy air pollution. Based on the daily increase of heavy air pollution, data preprocessing is carried out to establish the optimal Multiple Linear Regression (MLR) model, and the optimal variable combination is selected for clustering of the atmospheric background field, and the heavy pollution potential prediction model is obtained through the optimal subset regression method. The experimental results show that the accuracy of the proposed technology for quantitatively predicting the potential of heavy air pollution is 92.35%; when predicting the potential level of heavy air pollution, the Mean Squared Error (MSE) at different levels is less than 0.2, indicating that this technology has high application value.
Keywords: sensitive factors; heavy air pollution; potential quantitative forecasting; Random Forest (RF); vertical temperature gradient
大氣重污染會(huì)導(dǎo)致區(qū)域環(huán)境質(zhì)量下降,嚴(yán)重時(shí)會(huì)危害人體健康。及時(shí)地預(yù)報(bào)大氣重污染潛勢(shì),有利于提早實(shí)施大氣污染防治措施,從而有效控制大氣污染,改善空氣質(zhì)量[1]。目前,大氣重污染潛勢(shì)的定量預(yù)報(bào)有多種研究。喻謙花等[2]提出,建立空氣污染的量化指標(biāo),對(duì)大氣污染的長(zhǎng)期變化進(jìn)行預(yù)測(cè),并按照設(shè)定的判別條件,對(duì)大氣污染指數(shù)進(jìn)行定義,從而對(duì)大氣重污染潛勢(shì)進(jìn)行預(yù)測(cè)。該方法預(yù)報(bào)的準(zhǔn)確性較高,但需要的數(shù)據(jù)較多,使用過(guò)程較為復(fù)雜,因此具有一定的局限性。王馨陸等[3]提出,選取潛勢(shì)因子,根據(jù)天氣學(xué)原理,對(duì)污染物遷移擴(kuò)散進(jìn)行分析,明確污染物擴(kuò)散情況,從而對(duì)大氣污染潛勢(shì)進(jìn)行預(yù)報(bào)。該方法對(duì)參數(shù)的要求較高,預(yù)報(bào)準(zhǔn)確率一般,但預(yù)報(bào)過(guò)程較為簡(jiǎn)單,經(jīng)常被運(yùn)用于各類大氣污染潛勢(shì)預(yù)報(bào)中。毛卓成等[4]提出,對(duì)冬半年的大氣對(duì)流擴(kuò)散情況進(jìn)行計(jì)算,預(yù)測(cè)大氣邊界層氣流的垂直擴(kuò)散情況,然后對(duì)大氣重污染潛勢(shì)進(jìn)行預(yù)報(bào)。該方法過(guò)程簡(jiǎn)單,預(yù)報(bào)結(jié)果較為準(zhǔn)確,具有較好的應(yīng)用性。在大氣污染潛勢(shì)預(yù)報(bào)的研究中,敏感因子是一個(gè)關(guān)鍵的概念。敏感因子指的是影響大氣污染物生成和傳輸?shù)沫h(huán)境因素,如氣象條件、地形地貌和人口密度等。敏感因子分析可以使人更好地理解大氣污染的形成機(jī)理和傳播規(guī)律,并據(jù)此進(jìn)行預(yù)測(cè)。因此,有必要基于敏感因子,探索新型大氣重污染潛勢(shì)分級(jí)預(yù)報(bào)技術(shù)。
1 大氣重污染潛勢(shì)分級(jí)預(yù)報(bào)技術(shù)
1.1 大氣重污染敏感因子的確定
大氣重污染敏感因子是影響大氣污染形成和傳輸?shù)年P(guān)鍵因素,包括氣象因素,如風(fēng)速、濕度和溫度等。其中,風(fēng)速和風(fēng)向決定污染物傳播范圍,而溫度和濕度影響化學(xué)反應(yīng)速率。為預(yù)報(bào)冬半年大氣重污染,重點(diǎn)關(guān)注3個(gè)敏感因子,即大氣通風(fēng)量、垂直溫度梯度和風(fēng)速垂直切變。其中,大氣通風(fēng)量反映空氣清潔能力,垂直溫度梯度影響對(duì)流運(yùn)動(dòng),風(fēng)速垂直切變則關(guān)聯(lián)湍流擴(kuò)散和污染物輸送。為了提高大氣重污染事件的預(yù)測(cè)準(zhǔn)確度和及時(shí)性,對(duì)敏感因子的敏感氣象要素進(jìn)行計(jì)算。敏感氣象要素的計(jì)算流程如圖1所示。高度層的大氣壓為850~925 hPa,敏感氣象要素詳情如表1所示。對(duì)大氣通風(fēng)量、垂直溫度梯度以及風(fēng)速垂直切變進(jìn)行計(jì)算,按照3個(gè)參數(shù)進(jìn)行大氣的定量預(yù)報(bào)[5]。大氣通風(fēng)量為氣壓差,表示大氣流通能力,數(shù)值越大表示通風(fēng)能力越強(qiáng)。垂直溫度梯度表示每升高100 m的氣溫變化量,負(fù)值表示氣溫隨高度升高而降低。風(fēng)速垂直切變表示每升高1 km的風(fēng)速變化量,正值表示風(fēng)速隨高度升高而增加。
1.2 重污染潛勢(shì)分級(jí)預(yù)報(bào)
1.2.1 重污染潛勢(shì)預(yù)報(bào)模型的建立
根據(jù)大氣重污染敏感因子,建立基于隨機(jī)森林(Random Forest,RF)的重污染潛勢(shì)預(yù)報(bào)模型。在此基礎(chǔ)上,對(duì)敏感氣象要素因子的變量進(jìn)行初步選定并進(jìn)行排列,其過(guò)程如圖2所示。其間需要建立3種模型,即多元線性回歸(Multiple Linear Regression,MLR)模型、神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)模型和RF模型。在模型建立的過(guò)程中,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,聚焦于大氣重污染的日增量,降低其他因素對(duì)數(shù)據(jù)的噪聲干擾,提高模型對(duì)大氣重污染潛勢(shì)的預(yù)測(cè)精確度。在此基礎(chǔ)上,將相關(guān)系數(shù)大于0.7的數(shù)據(jù)刪除,進(jìn)而實(shí)現(xiàn)模型訓(xùn)練。數(shù)據(jù)預(yù)處理流程如圖3所示。
為了進(jìn)一步提高預(yù)測(cè)模型的準(zhǔn)確性,建立最優(yōu)MLR模型,對(duì)變量進(jìn)行組合。篩選最佳變量組合,去除無(wú)用或冗余的變量,并保留對(duì)目標(biāo)變量有更大解釋能力的變量。因?yàn)椴煌諝忸愋偷谋尘碍h(huán)境可能對(duì)敏感因子的影響不同,所以在最佳變量組合的基礎(chǔ)上,對(duì)大氣背景場(chǎng)進(jìn)行聚類處理,將大氣溫度分為3種空氣類型,更精確地預(yù)測(cè)不同空氣類型的重污染潛勢(shì)。聚類后,大氣環(huán)流氣壓變溫特征如圖4所示。按照聚類結(jié)果,合成變溫因子數(shù)據(jù),并以大氣中冷空氣為主,選取具有代表性的數(shù)據(jù),作為分類指標(biāo)數(shù)據(jù)。采用最優(yōu)子集回歸法,建立最佳模型,從而得到重污染潛勢(shì)預(yù)報(bào)模型。
1.2.2 大氣重污染潛勢(shì)等級(jí)劃分
根據(jù)重污染潛勢(shì)預(yù)報(bào)模型對(duì)敏感因子進(jìn)行定量計(jì)算,進(jìn)而完成大氣重污染潛勢(shì)等級(jí)劃分。其中,等壓面厚度采用式(1)計(jì)算,根據(jù)式(2)得到其平流擴(kuò)散因子。按照平流擴(kuò)散因子,可以根據(jù)式(3)計(jì)算因子綜合影響程度。根據(jù)因子影響程度,考慮空氣質(zhì)量指數(shù)(Air Quality Index,AQI)的日增量,結(jié)合因子的權(quán)重將潛勢(shì)等級(jí)分為5級(jí),具體分類如表2所示。按照大氣重污染潛勢(shì)等級(jí)進(jìn)行分級(jí)判別,得到大氣重污染潛勢(shì)分級(jí)預(yù)報(bào)結(jié)果。
(1)
s=m×0.5(u1+u2)(2)
v=s×∑(d1+d2+d3)(3)
式中:m為等壓面厚度;s為平流擴(kuò)散因子;v為因子綜合影響程度;z為氣體常數(shù);x為邊界層的標(biāo)準(zhǔn)氣壓參數(shù);c1為邊界層的污染氣體擴(kuò)散速度;c2為等壓面的標(biāo)準(zhǔn)氣體擴(kuò)散速度;u1為地面的標(biāo)準(zhǔn)氣壓;u2為邊界層沉降速度;d1為大氣通風(fēng)量因子容差;d2為垂直溫度梯度因子容差;d3為風(fēng)速垂直切變因子容差。
2 試驗(yàn)與分析
2.1 試驗(yàn)設(shè)置
選擇某地區(qū)的大氣污染源排放清單數(shù)據(jù)作為試驗(yàn)數(shù)據(jù)。根據(jù)區(qū)域空氣質(zhì)量監(jiān)測(cè)結(jié)果,重污染日占全部污染日的8%。首要污染物占比分布顯示,O3為首要污染物的占比最大,為39.7%,其次是PM2.5,占比為36.3%,以PM10為首的占比是21.5%,NO2和CO為首要污染物的占比分別為2.3%和0.3%。2023年,污染物質(zhì)量濃度的月度變化如圖5所示。對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行歸一化處理,以重污染的氣體濃度為其對(duì)數(shù),進(jìn)行正態(tài)分布分析,并對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練。
2.2 結(jié)果分析
使用所提技術(shù)和兩種對(duì)比方法,對(duì)比方法1是基于機(jī)器學(xué)習(xí)的預(yù)報(bào)技術(shù),對(duì)比方法2是基于Bayes判別分析的預(yù)報(bào)技術(shù)。分別利用3種方法進(jìn)行預(yù)報(bào),得到預(yù)報(bào)值與實(shí)際觀測(cè)值,如圖6所示。在PM2.5的預(yù)報(bào)中,相比其他兩種技術(shù),所提技術(shù)的預(yù)報(bào)值更加接近實(shí)際觀測(cè)值,預(yù)報(bào)偏差較小。對(duì)不同污染物的預(yù)報(bào)情況進(jìn)行統(tǒng)計(jì),按照五分級(jí)對(duì)其進(jìn)行預(yù)測(cè),可以得到大氣污染潛勢(shì)判別函數(shù)系數(shù),如表3所示。按照判別函數(shù),對(duì)預(yù)報(bào)正確率進(jìn)行計(jì)算,將其代入預(yù)報(bào)的函數(shù)模型,得到所提技術(shù)的預(yù)報(bào)正確率為92.35%,相對(duì)較高,說(shuō)明預(yù)報(bào)的準(zhǔn)確率較高。
使用對(duì)比方法1對(duì)大氣重污染潛勢(shì)進(jìn)行預(yù)報(bào),可以得到其判別函數(shù)系數(shù),如表4所示。將判別系數(shù)代入預(yù)報(bào)函數(shù)模型,對(duì)其進(jìn)行計(jì)算,可以得到預(yù)報(bào)的綜合準(zhǔn)確率為82.36%,相對(duì)較低,說(shuō)明對(duì)比方法1的預(yù)報(bào)準(zhǔn)確率有所下降。使用對(duì)比方法2進(jìn)行預(yù)報(bào),可以得到判別函數(shù)系數(shù),如表5所示。將判別系數(shù)代入函數(shù)模型進(jìn)行計(jì)算,可以得到其預(yù)報(bào)的綜合正確率為67.25%,說(shuō)明使用對(duì)比方法2進(jìn)行預(yù)報(bào),其預(yù)報(bào)的正確率較低,預(yù)報(bào)誤差較大。
為了進(jìn)一步驗(yàn)證所提技術(shù)的實(shí)用性,選用均方誤差(Mean Squared Error,MSE)作為評(píng)估指標(biāo)。MSE越小,表明方法的預(yù)測(cè)能力越強(qiáng)。試驗(yàn)結(jié)果如圖7所示。經(jīng)分析,3種方法對(duì)不同大氣重污染潛勢(shì)等級(jí)的均方誤差不同。其中,對(duì)比方法1在預(yù)測(cè)2級(jí)大氣重污染潛勢(shì)時(shí)的MSE值較大,表明該方法對(duì)2級(jí)的預(yù)測(cè)能力較差;對(duì)比方法2在預(yù)測(cè)3級(jí)大氣重污染潛勢(shì)時(shí)的MSE值較大,表明該方法對(duì)3級(jí)的預(yù)測(cè)能力較差。相比兩種對(duì)比方法,所提技術(shù)在進(jìn)行大氣重污染潛勢(shì)等級(jí)預(yù)測(cè)時(shí),不同等級(jí)的MSE均保持在0.2以下,表明所提技術(shù)預(yù)測(cè)能力強(qiáng),具有較好的實(shí)用性。
3 結(jié)論
利用某地區(qū)大氣污染源排放清單數(shù)據(jù)作為試驗(yàn)數(shù)據(jù),選取大氣通風(fēng)量、垂直溫度梯度和風(fēng)速垂直切變作為大氣重污染敏感因子,建立重污染潛勢(shì)預(yù)報(bào)模型,并結(jié)合大氣重污染潛勢(shì)劃分等級(jí),完成大氣重污染潛勢(shì)分級(jí)預(yù)報(bào)技術(shù)設(shè)計(jì)。試驗(yàn)結(jié)果表明,在PM2.5的預(yù)報(bào)中,所提技術(shù)更加接近實(shí)際觀測(cè)值,預(yù)報(bào)偏差較小。所提技術(shù)預(yù)報(bào)正確率為92.35%,相對(duì)較高,說(shuō)明預(yù)報(bào)的準(zhǔn)確性較好。采用所提技術(shù)預(yù)測(cè)大氣重污染潛勢(shì)等級(jí)時(shí),不同等級(jí)下MSE均保持在0.2以下,表明所提技術(shù)的預(yù)測(cè)能力強(qiáng),具有較好的實(shí)用性。
參考文獻(xiàn)
1 周須文,高旭旭,于長(zhǎng)文,等.基于Bayes判別分析的大氣污染潛勢(shì)定量預(yù)報(bào)[J].氣象,2022(8):1032-1042.
2 喻謙花,康暑雨,韓 艷.開(kāi)封市空氣重污染典型天氣背景分析與潛勢(shì)預(yù)報(bào)模型研究[J].氣象與環(huán)境科學(xué),2020(3):84-92.
3 王馨陸,黃 冉,張?chǎng)?,?基于機(jī)器學(xué)習(xí)方法的臭氧和PM2.5污染潛勢(shì)預(yù)報(bào)模型:以成都市為例[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2021(5):938-950.
4 毛卓成,瞿元昊,許建明,等.斜剖面圖的設(shè)計(jì)及在PM2.5中期潛勢(shì)預(yù)報(bào)中的應(yīng)用[J].中國(guó)環(huán)境科學(xué),2020(8):3312-3321.
5 陳澤鑫,古金霞,霍光耀,等.天津市揮發(fā)性有機(jī)物污染特征與來(lái)源及其O3生成潛勢(shì)[J].環(huán)境污染與防治,2022(2):201-205.