摘 要:近年來,臭氧(O3)污染日益嚴重,因此分析了黃石市地面O3濃度的變化特征及其與環(huán)境要素之間的關系,并應用機器學習方法構建了一套適用于本地區(qū)的O3濃度高精度預測模型。結果表明:(1)黃石市O3污染以輕度污染為主,3—10月均出現臭氧污染日,其中5、6、9月出現O3中度污染日,9月O3污染日數和O3濃度水平均最高。(2)從O3污染日環(huán)境要素進行分析,黃石市多年O3-8 h濃度平均值為93.5 μg·m-3,當發(fā)生O3污染時,SO2、PM10、PM2.5、CO的平均質量濃度,以及日平均氣溫、日最高氣溫、日照時數均會明顯上升。相反,NO2的平均質量濃度和氣壓、相對濕度均有顯著下降。(3)高溫、充足的陽光和較高的相對濕度是黃石市O3濃度變化的關鍵驅動因素。PM2.5和NO2也會對O3-8 h濃度產生影響,但相較于氣象因素,這兩者的重要性明顯較低。(4)梯度提升樹回歸模型在預測黃石市O3濃度方面表現出最佳的性能,但對于極高和極低的O3濃度,預測值與觀測值存在一定的偏差,需要進一步探索和優(yōu)化模型,以提高其對極高值或極低值的預測準確性。
關鍵詞:臭氧(O3);污染特征;氣象因素;機器學習;預測模型
中圖分類號:X515 文獻標志碼:B 文章編號:2095–3305(2024)12–0-03
臭氧(O3)是典型的二次污染物,主要通過碳氫化合物和氮氧化物(NO)之間的光化學反應生成。在有利的氣象條件下,如太陽輻射強、天空晴朗、溫度高、相對濕度低等,O3容易形成和累積。特定的天氣類型,如高壓后部、地面倒槽和鋒前暖區(qū),同樣易造成O3污染。此外,O3還可通過垂直空氣輸送從平流層進入對流層,同時也可以隨盛行風進行遠距離水平輸送[1]。
與CO和NO2等典型的一次污染物相比,O3在城市間的相關性更強。因此,準確預測O3濃度變化不僅對保護公共健康、維護生態(tài)平衡至關重要,還能為有效管理環(huán)境和制定污染防控策略提供支持。
近年來,隨機森林(Random Forest,RF)、卷積神經網絡(Convolutional Neural Network,CNN)、人工神
經網絡(Artificial Neural Network,ANN)等機器學習方法被應用于預測大氣污染物(O3、PM2.5、NOx、NH3等)濃度以及分析大氣污染的成因。這種方法主要通過建立O3濃度與氣象因子、污染源和其他相關變量之間的關系模型來進行預測[2]。與傳統(tǒng)方法相比,機器學習方法能夠自動識別數據中的復雜非線性關系,無需詳細的物理化學過程知識,因此在大氣污染預測領域具有廣闊的應用前景。
黃石市位于湖北省東南部,地勢西南高、東北低,屬典型的亞熱帶大陸性季風氣候,四季分明,雨量充沛。黃石市近幾年環(huán)境狀況公報顯示,O3作為首要污染物的比例顯著上升。基于此,通過應用機器學習方法,結合了2017—2021年黃石市地面O3濃度和相關氣象因素的數據,分析了黃石市O3的污染特征及其與主要氣象因素之間的關系,并對比了線性回歸、 K近鄰算法(KNN)、隨機森林和梯度提升樹等機器學習方法在O3濃度預測中的表現,以選擇最優(yōu)的預測模型,為黃石市及其他類似城市提供一種有效的O3污染預測和管理工具。
1 數據來源與分析方法
1.1 數據來源
大氣污染物監(jiān)測數據來自黃石市5個國控站點(沈家營、陳家灣、新下陸、鐵山、團城山),選取2017—2021年逐日SO2、NO2、CO、PM10、PM2.5、O3-8 h質量濃度資料和逐時O3質量濃度資料。氣象數據為黃石市國家基本氣象觀測站同期溫度、相對濕度、2 min平均風速、氣壓和日照時數等日均值。
1.2 分析方法
根據《環(huán)境空氣質量標準》(GB 3095—2012),當O3日最大8 h平均質量濃度超過160 μg·m-3時,即為O3污染。根據《環(huán)境空氣質量指數(AQI)技術規(guī)定(試行)》(HJ 633—2012),當污染日首要污染物為O3時,定義為O3污染日。
采用Pearson相關系數和Spearman相關系數,分析氣象因素和其他大氣污染物與O3-8 h濃度之間的相關性。選用線性回歸、K最鄰近(KNN)回歸、隨機森林和梯度提升樹回歸4種機器學習方法預測O3濃度,使用均方根誤差(RMSE)和決定系數(R2)作為評價指標,評估不同模型的預測性能,選擇表現最優(yōu)的模型作為黃石市O3濃度預測的最終模型,并對最優(yōu)模型進行檢驗。RMSE和R2的計算公式如下[3]:
RMSE=(1)
R2=1-∑(yi-y*)2/∑(yi-y)2(2)
式(1)、(2)中,n為樣本數量,yi為實際觀測值,y*為預測值,∑為求和,y為實況平均值。
2 結果與分析
2.1 O3污染特征
2.1.1 黃石市O3月變化特征
黃石市的O3污染以輕度污染為主,3—10月均出現臭氧污染日,其中5、6、9月出現O3中度污染日,9月O3污染日數累計高達37 d(圖1)。此外,5—9月是O3質量濃度較高的月份,9月的O3濃度最高,其次是8月,這兩個月的O3-8 h平均質量濃度分別達到130.6、123.1 μg·m-3。根據黃石市天氣氣候特征可知,5—9月為汛期,常受副熱帶高壓控制,若無熱帶天氣系統(tǒng)影響,則天氣晴朗、云量較少、日照充足、氣溫較高;6月中下旬至7月下旬為江淮梅雨季,降雨天氣較多,由于降水過程有助于清除大氣中的污染物,因此7月的O3濃度相對較低[4]。
2.1.2 黃石市O3污染日環(huán)境要素分析
從2017—2021年黃石市O3污染處于不同程度時各環(huán)境要素的平均統(tǒng)計特征值(表1)可知,可以看出黃石市多年O3-8 h濃度平均值為93.5 μg·m-3,當發(fā)生O3污染時,SO2、PM10、PM2.5、CO、AQL的平均質量濃度均呈上升趨勢,而NO2的平均質量濃度略有下降,這可能是由于O3的生成會消耗一部分的NO2。此外,當發(fā)生O3污染時,PM10、PM2.5的質量濃度仍維持在較低水平。從氣象條件來看,黃石市多年日平均氣壓為
1 011.7 hPa,多年日平均氣溫和最高氣溫分別為18.3、23.0 ℃,多年平均相對濕度為76.8%,多年平均風速為
1.5 m/s,多年平均日照時數為4.6 h。與無污染日相比,臭氧污染日氣壓和相對濕度均有顯著下降,日平均氣溫、日最高氣溫及日照時數則明顯上升。這表明在氣溫較高、日照充足的天氣條件下,黃石市易出現O3污染日。
2.2 環(huán)境要素對O3質量濃度的影響
O3污染程度受特定環(huán)境條件的影響和調控,以O3濃度值為因變量,以相對應的逐日環(huán)境要素為自變量,通過綜合運用Pearson和Spearman相關性分析,探討環(huán)境要素與O3濃度之間的相關性。在分析前,所有數據均經過標準化處理,以排除量綱對結果的影響。
日平均氣溫、日最高氣溫、日照時數、SO2與O3-8 h
濃度呈正相關關系,氣壓、相對濕度、NO2、PM2.5、CO與O3-8 h濃度呈負相關關系,上述各環(huán)境要素均滿足99%的置信區(qū)間的顯著相關,這表明以上環(huán)境要素對O3形成和變化有一定影響(表2)。2 min平均風速、PM10與O3-8 h濃度之間的相關性不顯著,表明在此研究區(qū)域內,風速和PM10濃度變化對O3濃度的直接影響較小。
2.3 基于機器學習構建O3濃度預測模型
2.3.1 模型比較
為深入了解不同環(huán)境要素與黃石市O3濃度之間的定量關系,采用機器學習方法分析了2017—2021年黃石市的1 754個數據樣本,基于上述通過顯著性檢驗的環(huán)境因子(氣壓、日平均氣溫、日最高氣溫、相對濕度、日照時數、NO2、PM2.5、SO2、CO)構建O3濃度預測模型,通過綜合比較這些模型的均方根誤差(RMSE)與決定系數R2,從而選出預測性能最優(yōu)的模型。
不同O3濃度預測模型的性能(表3)結果表明,隨機森林和梯度提升樹回歸兩種模型在預測O3濃度方面均具有顯著的優(yōu)勢。兩個模型的決定系數R2均為0.82,這一性能表現明顯優(yōu)于其他兩種模型,但梯度提升樹回歸模型的均方根誤差(RMSE)更小,在處理此研究中的復雜非線性環(huán)境數據時具有更高的準確性,因此選擇梯度提升樹回歸模型作為最優(yōu)模型。
2.3.2 模型檢驗
為檢驗梯度提升樹回歸模型的預測效果,以2022年黃石市O3-8 h實況數據和氣象觀測數據作為檢驗數據,將O3-8 h預測值與實況值(圖2)進行比較,發(fā)現梯度提升樹回歸模型能夠較好地預測O3濃度變化趨勢,O3-8 h的預測值與實況值的均方根誤差(RMSE)為26.25,具有較高的預測精度。但對于一些極高值或極低值,模型預測的準確性有所下降,這可能是受某些特殊的氣象條件或其他未考慮的環(huán)境因素的影響,在未來的研究中需要進一步探索和優(yōu)化模型,以提高其對極高值或極低值的預測準確性。
2.3.3 環(huán)境要素的正態(tài)化重要性分析
基于梯度提升樹回歸模型,進一步探討了各環(huán)境要素對模型預測能力的貢獻度。通過正態(tài)化重要性分析,評估了各環(huán)境要素對O3-8 h濃度預測準確性的影響。日最高氣溫在所有考慮的環(huán)境要素中對O3-8 h濃度預測的影響最大,其正態(tài)化重要性達到48.5%,與相關性分析的結果較為一致,表明較高的氣溫是O3濃度上升的必要條件,該條件會使O3前體物的反應速率加快,從而使O3濃度升高(圖3)。日照時數次之,占比22.6%,表明光化學反應在O3生成過程中具有關鍵作用。相對濕度的正態(tài)化重要性占比為15.6%,高濕度條件下會導致O3消耗增加、生成減少。日平均氣溫對O3-8 h濃度也有一定的影響,氣壓的重要性百分比相對較低,表明其對O3-8 h濃度的直接影響較為有限。大氣污染物對O3-8 h濃度產生的影響較低,其中PM2.5和NO2的重要性占比均高于CO,SO2對O3-8 h濃度影響的重要性程度較低。
3 結論
(1)黃石市O3污染以輕度污染為主,3—10月均出現臭氧污染日,其中5、6、9月出現O3中度污染日,9月O3污染日數和O3濃度水平均最高。
(2)從O3污染日環(huán)境要素進行分析,黃石市多年O3-8 h濃度平均值為93.5 μg·m-3,當發(fā)生O3污染時,SO2、PM10、PM2.5、CO的平均質量濃度,以及日平均氣溫、日最高氣溫及日照時數均會明顯上升。相反,NO2的平均質量濃度和氣壓、相對濕度均有顯著下降。
(3)高溫、充足的陽光和較高的相對濕度是黃石市O3濃度變化的關鍵驅動因素。PM2.5和NO2也會對O3-8 h
濃度產生影響,但相比于氣象因素這兩者的重要性明顯較低。
(4)梯度提升樹回歸模型在預測黃石市O3濃度方面表現出最佳的性能,但對于極高和極低的O3濃度,預測值與觀測值存在一定的偏差,需要進一步探索和優(yōu)化模型,以提高其預測極高值或極低值的準確性。
參考文獻
[1] 鄭彬,陳月娟,施春華.平流層臭氧緯向分布季節(jié)變化和行星波的關系[J].高原氣象,2006(3):366-374.
[2] 馬偉.基于機器學習的臭氧預報及生成敏感性研究[D].廣州:華南理工大學,2022.
[3] 何琰,林惠娟,曹舒婭,等.城市臭氧污染特征與高影響氣象因子:以蘇州為例[J].環(huán)境科學,2023,44(1):85-93.
[4] 宋鴿,羅嘉,涂姍姍.近47年黃石市降水變化特征分析[J].安徽農業(yè)科學,2022,50(7):207-210.
收稿日期:2024-09-13
基金項目:黃石市氣象局2022年度自立科研課題“基于機器學習的黃石市臭氧污染特征及預報研究”(202201)。
作者簡介:張東(1997—),女,河南南陽人,助理工程師,研究方向為環(huán)境氣象。