摘 要:從底層模型框架和約束條件著手,通過對(duì)4種常用的大氣源解析受體模型進(jìn)行了深入分析,得出以下結(jié)論:在源已知的情況下,CMB模型能夠有效地用于監(jiān)測(cè)異常情況。在源未知的情況下,PMF模型和Unmix模型展現(xiàn)出優(yōu)于APCA-MLR模型的穩(wěn)健性,因此,PMF模型和Unmix模型成為進(jìn)行大氣源解析的更佳選擇。由于操作簡(jiǎn)便,PMF模型在實(shí)際應(yīng)用中獲得了更廣泛的應(yīng)用和認(rèn)可。此外,合理引入約束性條件和有效地整合更多維度的數(shù)據(jù),對(duì)提升受體模型的精確度至關(guān)重要。
關(guān)鍵詞:大氣污染;源解析;受體模型;約束條件
中圖分類號(hào):X51 文獻(xiàn)標(biāo)志碼:B 文章編號(hào):2095–3305(2024)09–0-03
隨著工業(yè)化和城市化的推進(jìn),大氣污染問題日益凸顯。尤其是由PM2.5、SO2、O3和VOCs(揮發(fā)性有機(jī)化合物)等污染物導(dǎo)致的霧霾,對(duì)公眾生活和健康構(gòu)成了嚴(yán)重危險(xiǎn)。此外,有機(jī)化合物(VOCs)所引起的光化學(xué)污染和近地層臭氧污染日益成為不容忽視的環(huán)境問題。面對(duì)復(fù)雜的污染物及其形成機(jī)理,對(duì)污染源進(jìn)行精確評(píng)價(jià)和有效管控顯得尤為迫切,然而這個(gè)過程充滿挑戰(zhàn)。
傳統(tǒng)的源模型,如CMAQ和CAMx側(cè)重于預(yù)測(cè)和預(yù)警,對(duì)污染源排放數(shù)據(jù)與研究者的計(jì)算能力要求較高,模型的復(fù)雜性也提高了從業(yè)者的入門門檻,即使在監(jiān)測(cè)技術(shù)不斷進(jìn)步的背景下,源解析工作的進(jìn)展依然受限。因此,發(fā)展一種基于觀測(cè)數(shù)據(jù)、操作簡(jiǎn)便的方法,合理分配觀測(cè)到的污染物濃度至各污染源成為當(dāng)前的研究重點(diǎn)。這類方法統(tǒng)稱為受體模型,與源模型不同,受體模型更側(cè)重于影響點(diǎn)的環(huán)境行為??偨Y(jié)了幾種常用的大氣源解析受體模型的形成過程和應(yīng)用背景,并介紹了一些近年來(lái)提出的受體模型源解析方法,同時(shí)展望了未來(lái)的研究方向。
1 受體模型的基本框架
在受體模型的早期發(fā)展階段,研究者缺乏明確的原則定律作為指導(dǎo)。因此,為了實(shí)現(xiàn)降維,最初的受體模型往往采用簡(jiǎn)單的主成分分析(PCA)方法結(jié)合軸旋轉(zhuǎn)進(jìn)行降維處理。隨后,有學(xué)者基于質(zhì)量守恒定律,提出污染源排放濃度與監(jiān)測(cè)濃度之間應(yīng)滿足一定的等式關(guān)系,這一發(fā)現(xiàn)促使傳統(tǒng)的最小二乘法(OLS)被廣泛應(yīng)用于解決相關(guān)方程。由于OLS假設(shè)觀測(cè)樣本不存在測(cè)量誤差,與實(shí)際情況不符合,因此后續(xù)的研究將測(cè)量誤差納入目標(biāo)函數(shù),這一改進(jìn)成為當(dāng)時(shí)的研究重點(diǎn)。
基于這一思想,化學(xué)計(jì)量領(lǐng)域的研究者改進(jìn)了因子模型,開發(fā)了目標(biāo)轉(zhuǎn)換因子分析法(TTFA)。隨后,為了解決解集過大的問題,研究重心放到非負(fù)約束上。至20世紀(jì)90年代,基于ALS(交替最小二乘法)設(shè)計(jì)了PMF模型(Positive Matrix Factorization,PMF),基于奇異值分解設(shè)計(jì)了Unmix模型,且被相關(guān)研究者通過實(shí)驗(yàn)驗(yàn)證了其準(zhǔn)確性,至此受體模型的框架得到了基本確定。
目前,受體模型基于質(zhì)量守恒前提,通過質(zhì)量平衡分析確定和劃分大氣中各污染成分的來(lái)源。受體模型的核心在于處理和分析由不同污染源排放所形成的混合大氣樣本,其目標(biāo)是提取污染特征,即識(shí)別各污染源及其對(duì)總污染的貢獻(xiàn),而不是單純對(duì)污染樣本進(jìn)行分組。因此,從現(xiàn)代數(shù)據(jù)處理的視角來(lái)看,受體模型在本質(zhì)上屬于一種降維模型。
為了保證受體模型的科學(xué)性和有效性,模型的構(gòu)建必須滿足下述4條約束條件:(1)模型的結(jié)果能為觀測(cè)結(jié)果給出準(zhǔn)確的解釋;(2)預(yù)測(cè)的污染源成分濃度必須是非負(fù)的;(3)計(jì)算得到的每個(gè)污染源對(duì)污染物的貢獻(xiàn)應(yīng)當(dāng)是非負(fù)的;(4)所有計(jì)算出的污染源每種污染物總和必須≤測(cè)得的每種污染物的總量。
受體模型的通式如公式(1)和(2)所示。
Xij=Gik·Fkj+Eij=Cij+Eij#(1)
s.t:Gik≥0,F(xiàn)kj≥0,Eij≥0#(2)
其中,Xij是第j種污染物在第i個(gè)樣本中的濃度,F(xiàn)kj是第j種污染物在污染源p排放的物質(zhì)中的濃度,Gik是第p個(gè)源對(duì)樣本的貢獻(xiàn),Eij是殘差,而Cij是通過模擬的監(jiān)測(cè)濃度。通過上述約束,受體模型能夠在保證合理性的前提下,為大氣污染源解析提供一種有效的數(shù)學(xué)工具。通過上述模型表達(dá)及其約束條件,受體模型能夠在保證物理合理性的前提下,為大氣污染源解析提供一種有效的數(shù)學(xué)工具,進(jìn)而為大氣污染防治提供科學(xué)依據(jù)。
2 受體模型的分類
常用的受體模型根據(jù)是否需要輸入已知污染源信息分為兩類:源已知受體模型和源未知受體模型。
2.1 源已知受體模型
在源已知受體模型中,化學(xué)質(zhì)量平衡模型(CMB)較為典型。CMB模型通過構(gòu)建潛在污染源與大氣污染物濃度之間的線性方程組并求解,以獲取污染源因子及其貢獻(xiàn)。CMB模型的原理簡(jiǎn)明,類似于簡(jiǎn)單的“機(jī)器學(xué)習(xí)”過程。在已知污染源信息可靠、準(zhǔn)確的情況下,不需要大量的樣本即可得到準(zhǔn)確的因子和貢獻(xiàn),因此適用于識(shí)別主要?dú)庀髮W(xué)條件和當(dāng)?shù)匕l(fā)生的異常狀況(火災(zāi)、沙塵暴等)對(duì)分析結(jié)果的影響[1]。
然而,CMB模型對(duì)共線性問題較為敏感,同時(shí)計(jì)算結(jié)果可能包含負(fù)值,且CMB模型高度依賴準(zhǔn)確的污染源信息,信息準(zhǔn)確性或完整性不足將極大影響分析結(jié)果[2]。因此,由于難以獲取完整的污染源信息,CMB模型在大氣源解析領(lǐng)域的應(yīng)用相對(duì)受限。
2.2 源未知的受體模型
在源未知的受體模型中,PMF、Unmix和絕對(duì)主成分—多元回歸模型(APCA-MIR)等模型得到了廣泛應(yīng)用。APCA-MLR模型是對(duì)PCA模型改良后形成的模型,它通過將PCA模型與多元線性回歸結(jié)合,解決了PCA模型計(jì)算結(jié)果可能出現(xiàn)負(fù)值的問題。雖然嚴(yán)格來(lái)說(shuō),APCA-MLR模型不屬于受體模型,但因其操作簡(jiǎn)便,在其他受體模型尚未被封裝成軟件程序前,APCA-MLR模型被廣泛使用。而PMF模型和Unmix模型作為新一代源未知受體模型,因其被美國(guó)環(huán)保署(EPA)封為應(yīng)用程序EPA-PMF和EPA-Unmix,操作簡(jiǎn)便,成為現(xiàn)階段大氣源解析研究中的主流模型[3]。
在實(shí)際研究中,有些研究者同時(shí)采用PMF模型和Unmix模型進(jìn)行分析,以獲取更可信的源分析結(jié)果。相比Unmix模型,盡管PMF模型更能克服降維模型的“取短補(bǔ)長(zhǎng)”的弱點(diǎn),但當(dāng)采集的數(shù)據(jù)質(zhì)量好且數(shù)量足夠時(shí),在不太準(zhǔn)確的定量分析方面,兩者差異不大。PMF模型允許研究人員估計(jì)每個(gè)污染樣本的不確定度,因此,具有良好的穩(wěn)健性。
盡管PMF模型可能引發(fā)旋轉(zhuǎn)模糊度問題,即解的多重性可能導(dǎo)致解釋困難或收斂性差。但在實(shí)際應(yīng)用中,因?yàn)楸环治龅奈廴疚锓N類繁多、樣本數(shù)量充足,難以解釋的情況很少發(fā)生。同時(shí),EPA-PMF開發(fā)得較為完善,不僅提供了BS-DI SPC蒙特卡洛誤差估計(jì)區(qū)間(BS,DISP,BS-DISP)評(píng)估旋轉(zhuǎn)模糊度,還能添加約束方程以減少解空間,這些優(yōu)勢(shì)使得PMF模型在大氣源解析的應(yīng)用更為廣泛。
3 受體模型的應(yīng)用與改進(jìn)
有研究表明,影響受體模型源解析研究的關(guān)鍵因素包括用于分析大氣污染樣本的標(biāo)曲里污染物的種類和采樣的時(shí)間分辨率。雖然模型選擇和參數(shù)設(shè)置看似并不重要,但這并不意味著受體模型的改進(jìn)空間有限。目前的研究并不僅限于通過模型得出污染源矩陣的分析,還通過將源解析結(jié)果與其他參數(shù)和模型結(jié)合,以確定污染源并分析其影響。
隨著監(jiān)測(cè)技術(shù)的進(jìn)步和大氣溯源需求的增加,對(duì)受體模型的結(jié)果要求更加準(zhǔn)確、全面?,F(xiàn)階段,研究方法是將源解析結(jié)果與其他模型耦合,以滿足不同的需求。例如,為了分析污染源的本地空間分布,研究者引入了條件性雙變量概率函數(shù)(CBPF)和非參數(shù)風(fēng)回歸模型。李如梅[4]利用CBPF模型分析得出,太原市VOCs本地排放源主要是機(jī)動(dòng)車尾氣,而工業(yè)源則主要來(lái)自城市外圍,這為太原市內(nèi)VOCs的防控提供了重要依據(jù)。
若要挖掘污染源的時(shí)序周期性,可耦合Lomb-Scargle譜分解模型進(jìn)行時(shí)序分析,美國(guó)研究團(tuán)隊(duì)通過時(shí)序分析發(fā)現(xiàn)了硫酸鹽和硝酸銨的季節(jié)性行為在夏季和冬季節(jié)呈現(xiàn)出截然相反的模式,從而揭示了背后的大氣化學(xué)機(jī)制。將受體模型的結(jié)果與CMAQ-Chem等源模型結(jié)合,可以得到更加全面的污染影響分析結(jié)果[5]。有學(xué)者將PMF結(jié)果與氣象參數(shù)相結(jié)合,通過Cmaq-Chem模型模擬了采樣期間的O3和NO2濃度,發(fā)現(xiàn)模擬濃度和實(shí)際濃度吻合良好,從而驗(yàn)證了實(shí)驗(yàn)結(jié)果的準(zhǔn)確性;韓國(guó)相關(guān)研究團(tuán)隊(duì)通過將PMF結(jié)果與Cmaq-wrf耦合,對(duì)首爾周邊地區(qū)的VOCs和PM污染進(jìn)行了區(qū)域性模擬,為當(dāng)?shù)匚廴究刂铺峁└娴馁Y料。
若要進(jìn)行長(zhǎng)距離潛在源的分析,則常將受體模型與PSCF(Potential Source Contribution Function)模型結(jié)合使用[6]。通過對(duì)這些模型的統(tǒng)計(jì)分析,揭示污染物跨區(qū)域傳輸?shù)穆窂?。有學(xué)者通過PSCF模型得出北京市春季VOCs區(qū)域污染主要來(lái)自西北方向的內(nèi)蒙古和山西地區(qū),它們的煤炭燃燒和二次生成是影響城市環(huán)境質(zhì)量的關(guān)鍵因素。
為了評(píng)估VOCs污染物對(duì)大氣O3濃度的影響可以結(jié)合OBM(Observation Based Model)大氣光化學(xué)模型進(jìn)行分析[7]。有學(xué)者的研究表明,在北京城區(qū),燃料揮發(fā)和液化石油氣的使用對(duì)O3 的形成貢獻(xiàn)相對(duì)較小,而汽車尾氣的排放對(duì)O3濃度的貢獻(xiàn)較大。
隨著機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,不少研究開始將受體模型的結(jié)果與機(jī)器學(xué)習(xí)方法相結(jié)合,以構(gòu)建低成本且實(shí)時(shí)的污染溯源系統(tǒng)。例如,浙江大學(xué)團(tuán)隊(duì)通過PMF模型與機(jī)器學(xué)習(xí)方法的融合,僅需依據(jù)4種污染物數(shù)據(jù)就能完成污染溯源工作,這極大地提高了大氣污染防控的效率[8]。
這些“耦合式”的改進(jìn)方法因其易于上手和實(shí)用性強(qiáng),已被廣泛應(yīng)用于大氣污染源解析工作,它們?yōu)榄h(huán)境監(jiān)測(cè)及污染控制領(lǐng)域的研究人員提供了強(qiáng)有力的工具。然而,需要注意的是,盡管這些方法有效地?cái)U(kuò)展了受體模型的應(yīng)用范圍,它們更多的是在現(xiàn)有結(jié)果基礎(chǔ)上進(jìn)行延伸,并沒有對(duì)原始模型結(jié)果進(jìn)行優(yōu)化或進(jìn)行根本性的改進(jìn)。
南開大學(xué)團(tuán)隊(duì)針對(duì)這一問題,在將大氣邊界層高度作為PMF的預(yù)處理參數(shù)的基礎(chǔ)上,創(chuàng)新性地構(gòu)建了DN-PMF(Dispersion Normalized PMF)模型。此后,他們還通過預(yù)處理補(bǔ)償?shù)姆绞綄⒐饣瘜W(xué)等參數(shù)納入分析并取得良好的VOCs源解析效果。同時(shí),直接修改受體模型以減少誤差的研究也取得了進(jìn)展,比如,通過3階張量處理檢測(cè)過程中的相關(guān)性誤差,顯著縮小了污染因子和貢獻(xiàn)的誤差范圍。
隨著計(jì)算機(jī)算力的提升和研究范式的迭代,現(xiàn)代研究更加側(cè)重于計(jì)算機(jī)和統(tǒng)計(jì)學(xué)方法的應(yīng)用[9]。貝葉斯模型框架在新的受體模型建模中得到了較為廣泛的應(yīng)用,主要是因?yàn)樗试S研究者根據(jù)不同的情況設(shè)計(jì)先驗(yàn)分布,通過先驗(yàn)參數(shù)估計(jì)和蒙特卡洛的模擬生成的DN-PMF和F矩陣,使得結(jié)果更精準(zhǔn)且符合實(shí)際。Eun Sug Park[10]通過貝葉斯框架設(shè)計(jì)的“分位數(shù)分解”模型,以及對(duì)誤差的先驗(yàn)重尾分布設(shè)定,成功識(shí)別了污染源的異常排放并排除了異常值的干擾。
不論是“耦合式”還是“改進(jìn)式”受體模型研究方法的核心目標(biāo),皆是通過同化更多維度的數(shù)據(jù)或設(shè)計(jì)更多的先驗(yàn)約束,獲得更加準(zhǔn)確、全面的解析結(jié)果。例如,通過提升時(shí)間分辨率,增加監(jiān)測(cè)物種類和假設(shè)源排放符合正態(tài)分布等手段,旨在豐富結(jié)果所包含的信息維度。這種方法論體現(xiàn)了“沒有免費(fèi)的午餐定理”,即如果不向模型中引入額外信息,就不可能構(gòu)建出更準(zhǔn)確和符合現(xiàn)實(shí)的模型。
此外,模型的集合封裝也顯得至關(guān)重要。大多數(shù)研究者可能缺乏足夠的信息技術(shù)背景,這限制了他們對(duì)新技術(shù)的應(yīng)用。在此方面,EPA-PMF和EMP-Unmix提供了良好的范例。這些模型通過友好的用戶界面和封裝良好的操作流程,極大地降低了研究者在實(shí)際應(yīng)用中的技術(shù)門檻。
4 結(jié)束語(yǔ)
在過去的十年間,我國(guó)在受體模型技術(shù)方面取得了顯著的進(jìn)步,并已廣泛應(yīng)用于源解析領(lǐng)域,這為大氣防治工作帶來(lái)了積極成效。隨著對(duì)大氣污染控制要求的不斷提升,以及大氣污染源的日益復(fù)雜化,對(duì)大氣污染源解析的需求也日益增長(zhǎng)。
近年來(lái),隨著大氣污染物采樣技術(shù)的發(fā)展,能夠低成本、高效率地深入了解各受體模型的優(yōu)劣和技術(shù)發(fā)展現(xiàn)狀,推動(dòng)受體模型技術(shù)的進(jìn)一步發(fā)展,更精準(zhǔn)地識(shí)別和量化污染源。同時(shí),機(jī)器學(xué)習(xí)領(lǐng)域的飛速進(jìn)展為數(shù)據(jù)處理提供了新的范式和方法,為受體模型技術(shù)的進(jìn)一步發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
未來(lái),受體模型將不再追求簡(jiǎn)潔化和“輕量化”,而應(yīng)回歸源模型分析的思路,強(qiáng)調(diào)對(duì)污染排放、遷移過程和檢測(cè)手段的準(zhǔn)確描述。受體模型應(yīng)當(dāng)超越定性分析框架,通過深入刻畫污染傳輸過程細(xì)節(jié),同化更多層次的數(shù)據(jù),實(shí)現(xiàn)精確的定量溯源。這種方法不僅能夠提供更為全面的分析結(jié)果,還能夠滿足對(duì)精準(zhǔn)防治的需求,從而為我國(guó)的大氣污染防治工作做出更大的貢獻(xiàn)。
參考文獻(xiàn)
[1] 楊妍妍,李金香,梁云平,等.應(yīng)用受體模型(CMB)對(duì)北京市大氣PM2.5來(lái)源的解析研究[J].環(huán)境科學(xué)學(xué)報(bào),2015,35 (9):2693-2700.
[2] 朱坦,吳琳,畢曉輝,等.大氣顆粒物源解析受體模型優(yōu)化技術(shù)研究[J].中國(guó)環(huán)境科學(xué),2010,30(7):865-870.
[3] 蔡美全,常淼,丁萌萌,等.大氣揮發(fā)性有機(jī)物受體模型來(lái)源解析研究進(jìn)展[J].環(huán)境科學(xué)與技術(shù),2024,47(2):224-237.
[4] 李如梅,閆雨龍,王成,等.太原市城區(qū)夏季VOCs來(lái)源及其對(duì)O3生成的貢獻(xiàn)[J].中國(guó)環(huán)境科學(xué),2021,41(6):2515-2525.
[5] 張樹憲,李洋,張眾志,等.基于CMAQ/ISAM空氣質(zhì)量模型的北京市夏季臭氧來(lái)源解析研究[J].環(huán)境科學(xué)研究, 2022,35(5):1183-1192.
[6] 羅菊英,張儀,劉希文.結(jié)合源解析的大氣污染相關(guān)氣象要素特征分析[J].環(huán)境科學(xué)與技術(shù),2020,43(5):65-73.
[7] 龐曉蝶.關(guān)中平原傳統(tǒng)工業(yè)城市大氣VOCs污染特征及來(lái)源解析[D].北京:中國(guó)環(huán)境科學(xué)研究院,2023.
[8] 石展宏.典型精細(xì)化工園區(qū)基于機(jī)器學(xué)習(xí)的VOCs排放特征分析與溯源研究[D].杭州:浙江大學(xué),2024.
[9] 王慶.基于貝葉斯受體模型的排水管網(wǎng)外水來(lái)源解析[J].綠色科技,2023,25(10):102-107.
[10] Park E S,Oh M-S. Bayesian quantile multivariate receptor modeling[J]. Chemometrics and intelligent laboratory systems, 2016 (159): 174-180.
收稿日期:2024-06-19
作者簡(jiǎn)介:金泉至(1998—),男,湖北武漢人,研究方向?yàn)榇髿鈸]發(fā)性有機(jī)物來(lái)源解析。#通信作者:楊利娟,E-mail:1018788995@qq.com。