盧亞靈,李勃,范朝陽,王建童,張鴻宇,蔣洪強(qiáng)*
(1.生態(tài)環(huán)境部環(huán)境規(guī)劃院國家環(huán)境保護(hù)環(huán)境規(guī)劃與政策模擬重點(diǎn)實(shí)驗(yàn)室,北京 100012;2.生態(tài)環(huán)境部環(huán)境規(guī)劃院京津冀區(qū)域環(huán)境聯(lián)合研究中心,北京 100012;3.天津大學(xué)環(huán)境科學(xué)與工程學(xué)院,天津 300072;4.南開大學(xué)環(huán)境科學(xué)與工程學(xué)院,天津 300350)
大氣污染對(duì)生態(tài)系統(tǒng)和人類正常生存與發(fā)展造成嚴(yán)重危害[1,2]。大氣污染物主要包括氣態(tài)物質(zhì)和顆粒物質(zhì)兩類[3],大量的研究表明,短時(shí)間暴露在高濃度大氣污染物中會(huì)引起眼部不適、呼吸困難、心肺疾病和早產(chǎn)嬰兒夭折等嚴(yán)重的短期健康風(fēng)險(xiǎn)[4,5],長時(shí)間暴露極有可能引發(fā)癌癥,會(huì)給身體免疫系統(tǒng)、神經(jīng)系統(tǒng)和呼吸系統(tǒng)帶來永久健康風(fēng)險(xiǎn)[6,7]。隨著工業(yè)化、城鎮(zhèn)化的快速發(fā)展,大氣污染治理面臨嚴(yán)峻挑戰(zhàn),近年來,政府和公眾對(duì)空氣質(zhì)量實(shí)時(shí)、準(zhǔn)確和快速預(yù)測(cè)的需求日益增加??諝赓|(zhì)量預(yù)測(cè)技術(shù)對(duì)大氣污染物在給定時(shí)間空間范圍內(nèi)的濃度進(jìn)行科學(xué)預(yù)測(cè),以支撐開展工程減排、結(jié)構(gòu)減排和管理減排等措施,達(dá)到降低大氣污染物濃度的目的;實(shí)時(shí)的空氣質(zhì)量預(yù)測(cè)技術(shù)可以通過減少污染物排放和提升健康效應(yīng),為個(gè)人、組織、社區(qū)帶來巨大的社會(huì)經(jīng)濟(jì)價(jià)值[3]。空氣質(zhì)量預(yù)測(cè)技術(shù)主要可以分為兩類——數(shù)值模擬和統(tǒng)計(jì)學(xué)習(xí),數(shù)值模擬通??梢苑譃榈谝淮?、第二代和第三代空氣質(zhì)量模型,統(tǒng)計(jì)學(xué)習(xí)可以分為簡單經(jīng)驗(yàn)統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)。兩類方法的目的都是盡可能真實(shí)、準(zhǔn)確地實(shí)現(xiàn)特定時(shí)間、特定區(qū)域范圍內(nèi)大氣污染物濃度的預(yù)測(cè),但兩類方法的原理算法差異較大。數(shù)值模擬從大氣環(huán)境基礎(chǔ)理論出發(fā),以高斯模型、拉格朗日模型和歐拉模型等為內(nèi)核,以氣象場(chǎng)為驅(qū)動(dòng),構(gòu)建模擬真實(shí)大氣環(huán)境變化的系統(tǒng),從而預(yù)測(cè)大氣污染物濃度的時(shí)空變化規(guī)律;統(tǒng)計(jì)學(xué)習(xí)從統(tǒng)計(jì)理論出發(fā),以回歸、分類、擬合和過濾等算法為內(nèi)核,以歷史數(shù)據(jù)為驅(qū)動(dòng),尋找多源異構(gòu)數(shù)據(jù)變化的規(guī)律,從而預(yù)測(cè)大氣污染物濃度的時(shí)空變化規(guī)律。一直以來,數(shù)值模擬方法使用更廣泛,但近年來隨著人工智能技術(shù)的崛起,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)在空氣質(zhì)量預(yù)測(cè)技術(shù)領(lǐng)域的應(yīng)用已逐漸成為研究熱點(diǎn)。
1955年6月,為防止大面積空氣污染事件的發(fā)生,洛杉磯地區(qū)空氣質(zhì)量管理局(LACAPCD)針對(duì)洛杉磯重度煙霧污染建立了O3和其他3 項(xiàng)污染物的三級(jí)煙霧預(yù)測(cè)預(yù)警,這被認(rèn)為是實(shí)時(shí)空氣質(zhì)量預(yù)測(cè)技術(shù)的開端[3]。20 世紀(jì)60 年代,美、日、德等發(fā)達(dá)國家均開始了關(guān)于空氣質(zhì)量預(yù)測(cè)技術(shù)的理論和應(yīng)用研究,并在隨后的幾十年中衍生出數(shù)十種空氣質(zhì)量預(yù)測(cè)模型,多以高斯模型、拉格朗日模型或歐拉模型為理論基礎(chǔ),形成了一套完整技術(shù)體系暨嵌套氣象場(chǎng)模擬—網(wǎng)格化排放清單制作—空氣質(zhì)量濃度模擬,并完成了三個(gè)代際的迭代,預(yù)測(cè)范圍、預(yù)測(cè)時(shí)序和預(yù)測(cè)精度也隨之逐步提高。另外,統(tǒng)計(jì)學(xué)習(xí)理論在空氣質(zhì)量預(yù)測(cè)領(lǐng)域也得到廣泛應(yīng)用,逐步成為空氣質(zhì)量模型技術(shù)體系中的第2 條分支。近年來以數(shù)值模擬為基礎(chǔ),結(jié)合統(tǒng)計(jì)學(xué)習(xí)的集成模型逐漸成為研究熱點(diǎn),成為空氣質(zhì)量模型技術(shù)體系中第3 條分支。據(jù)此,該領(lǐng)域形成了以數(shù)值模擬為主,統(tǒng)計(jì)學(xué)習(xí)和集成模型并駕齊驅(qū)的空氣質(zhì)量模型技術(shù)體系。
(1)20 世紀(jì)60—70 年代。模型發(fā)展初期,第一代城市/區(qū)域尺度空氣質(zhì)量模型如ISC、AERMOD、ADMS 等高斯模型初步建立并發(fā)展,此后研發(fā)的ADMS、AERMOD、CALPUFF 等模型的理論內(nèi)核也是這一階段的成果。20 世紀(jì)60 年代,美國天氣管理局(USWB)第一次通過運(yùn)用數(shù)值天氣預(yù)報(bào)模型(NWP)對(duì)大氣停滯和大氣污染潛發(fā)性進(jìn)行了預(yù)測(cè)。隨后美國國家海洋與大氣管理局(NOAA)在1965 年成立,第二年25 個(gè)國家代表齊聚倫敦參加第一屆世界清潔空氣代表大會(huì),商討關(guān)于大氣污染和清潔空氣等議題[8],空氣污染問題逐步走進(jìn)公眾視野,空氣質(zhì)量預(yù)測(cè)技術(shù)的研究熱度逐漸上升。隨著美國國家環(huán)境局(U.S.EPA)等一系列機(jī)構(gòu)的成立,一些基于歷史空氣質(zhì)量數(shù)據(jù)構(gòu)建的空氣質(zhì)量預(yù)測(cè)經(jīng)驗(yàn)統(tǒng)計(jì)模型也得到發(fā)展[9-11],其中20 世紀(jì)70 年代早期誕生了第一代城市/區(qū)域尺度空氣質(zhì)量模型,20 世紀(jì)70 年代晚期誕生了第一代全球尺度空氣質(zhì)量模型。第一代模型主要以擴(kuò)散參數(shù)曲線為基礎(chǔ),采用簡單的、參數(shù)化的線性機(jī)制描述復(fù)雜的大氣物理過程,對(duì)于模擬惰性污染物的長期平均濃度有較好的效果[12]。
(2)20 世紀(jì)80—90 年代。20 世紀(jì)80 年代開始,隨著大氣邊界層中非線性光化學(xué)反應(yīng)研究的推進(jìn)[13,14],對(duì)于空氣質(zhì)量預(yù)測(cè)精度的更高需求推動(dòng)了第二代短期和長期全尺度(城市—區(qū)域—全球)大氣污染物濃度3D 數(shù)值模擬模式的發(fā)展,并在20 世紀(jì)90 年代早期成功應(yīng)用于短期O3的模擬預(yù)測(cè)。然而很多國家對(duì)于空氣質(zhì)量預(yù)測(cè)的需求不斷增加,因此在建立覆蓋全國的大氣污染物濃度監(jiān)測(cè)、預(yù)測(cè)網(wǎng)絡(luò)的推動(dòng)下,空氣質(zhì)量預(yù)測(cè)模型在20 世紀(jì)90 年代中期進(jìn)一步更新迭代,形成了第三代短期和長期全尺度3D 數(shù)值模擬模型。在相關(guān)國家及權(quán)威機(jī)構(gòu)的支持下,大氣污染物預(yù)測(cè)技術(shù)得到更加廣泛的應(yīng)用,例如U.S.EPA 修改了AQI指數(shù)并建立了AIRNow 項(xiàng)目,向公眾提供實(shí)時(shí)空氣質(zhì)量預(yù)測(cè)結(jié)果,隨后還發(fā)布了關(guān)于開展O3濃度預(yù)測(cè)的指南;加拿大氣象服務(wù)局(MSC)針對(duì)加拿大東部地區(qū)開展了空氣質(zhì)量預(yù)測(cè);劍橋大學(xué)首次使用大氣污染濃度預(yù)測(cè)模型支撐了兩個(gè)平流層局地觀測(cè)實(shí)驗(yàn)的規(guī)劃應(yīng)用。
(3)21 世紀(jì)至今。進(jìn)入21 世紀(jì),美國通過相關(guān)法案與國會(huì)授權(quán)等政策手段大力推動(dòng)了第三代3D 數(shù)值模擬模式的發(fā)展,并通過NOAA 和U.S.EPA 的科研活動(dòng)進(jìn)一步推廣模型的應(yīng)用。2002 年,NOAA 在美國能源政策法案(the Energy Policy Act)和國會(huì)的授權(quán)支持下與U.S.EPA 合作開發(fā)覆蓋全美的3D 數(shù)值模擬模式,并把預(yù)測(cè)結(jié)果發(fā)布給各州和其所屬的預(yù)測(cè)機(jī)構(gòu)[15-22];2003 年,U.S.EPA 發(fā)布了關(guān)于開展PM2.5濃度預(yù)測(cè)技術(shù)的指南;2004 年NOAA 資助了新英格蘭地區(qū)開展O3和PM2.5濃度預(yù)測(cè)集成模擬[18,19],同年由NOAA 和U.S.EPA 聯(lián)合開發(fā)的國家實(shí)時(shí)空氣質(zhì)量預(yù)測(cè)系統(tǒng)(NRT-AQFC)正式部署運(yùn)行,該系統(tǒng)是第一個(gè)由CMAQ 模型構(gòu)成的大氣污染濃度預(yù)測(cè)業(yè)務(wù)化平臺(tái)[20];2005 年歐盟開發(fā)了FUMAPEX UAQIFS 模型,該模型耦合了城市氣象、空氣質(zhì)量和人口暴露模型,并在歐洲6 個(gè)城市得到業(yè)務(wù)化運(yùn)用;2006 年有學(xué)者開發(fā)了基于神經(jīng)網(wǎng)絡(luò)的PM10預(yù)測(cè)模型[23];2007 年科隆大學(xué)首次把大尺度反演模型和復(fù)雜3D 數(shù)值模擬模型集成起來進(jìn)行大氣污染濃度預(yù)測(cè)。
相較于國際而言,國內(nèi)空氣質(zhì)量模型技術(shù)的研究起步較晚,直到20 世紀(jì)90 年代才開始引進(jìn)空氣質(zhì)量預(yù)測(cè)技術(shù)等相關(guān)概念,學(xué)習(xí)使用第一代、第二代、第三代大氣污染物濃度數(shù)值模擬模型,但國內(nèi)空氣質(zhì)量模型應(yīng)用研究發(fā)展迅速,中國科學(xué)院大氣物理研究所、清華大學(xué)和南京大學(xué)等各類型研究、教學(xué)機(jī)構(gòu)都開發(fā)了自主的空氣質(zhì)量預(yù)測(cè)模型系統(tǒng),并通過大量實(shí)踐和研究開展了模型技術(shù)文件和參數(shù)化方案的本地化,逐步開展法規(guī)化空氣質(zhì)量模型基礎(chǔ)數(shù)據(jù)、技術(shù)文件、參數(shù)化方案等標(biāo)準(zhǔn)化研究,逐步形成我國自主的空氣質(zhì)量模型技術(shù)體系。
(1)20 世紀(jì)60—80 年代。1973 年我國召開第一次全國環(huán)境保護(hù)會(huì)議,隨后成立了原國務(wù)院環(huán)境保護(hù)領(lǐng)導(dǎo)小組,大氣污染問題逐步得到重視[21]。因環(huán)境管理和決策的重大需求,大氣環(huán)境容量[22]與空氣質(zhì)量預(yù)測(cè)[12]研究逐步發(fā)展起來。這個(gè)階段我國大氣環(huán)境領(lǐng)域主要針對(duì)大氣環(huán)境容量、光化學(xué)污染機(jī)理、酸雨污染機(jī)理和消除煙塵污染技術(shù)等幾個(gè)方面開展了大量理論和實(shí)證研究,為日后開展空氣質(zhì)量預(yù)測(cè)奠定了良好的理論基礎(chǔ)。
(2)20 世紀(jì)90 年代至今。90 年代我國煤炭消費(fèi)量大幅上升,SO2排放量和大氣中SO2濃度隨之快速上升,長江以南出現(xiàn)大面積酸雨區(qū),大氣污染防治主要對(duì)象為SO2和懸浮顆粒物[21]。大氣環(huán)境問題的加重促進(jìn)了相關(guān)標(biāo)準(zhǔn)的制定及污染物監(jiān)測(cè)水平的提升,1996 年對(duì)《大氣環(huán)境質(zhì)量標(biāo)準(zhǔn)》進(jìn)行第一次修訂,將可吸入顆粒物(PM10)納入常規(guī)污染物[1,2]。隨著監(jiān)測(cè)手段的完善,精確的監(jiān)測(cè)數(shù)據(jù)保證了我國空氣預(yù)測(cè)模型得到進(jìn)一步發(fā)展,針對(duì)模型普適性檢驗(yàn)的大量研究為之后的模型改進(jìn)打下了基礎(chǔ)。如孫大偉[24]應(yīng)用ADMS 模型計(jì)算了朝陽市在不同氣象條件下的SO2日均濃度,結(jié)果顯示ADMS 模型可以得到與實(shí)測(cè)濃度一致的結(jié)果;楊洪斌等[25]在沈陽開展了AERMOD 空氣擴(kuò)散模型的應(yīng)用和驗(yàn)證。此外,不同地區(qū)的科研人員也致力于方法和模型改良,根據(jù)當(dāng)?shù)貧庀筇攸c(diǎn)或污染物種類的選擇改進(jìn)模擬方法和模型,使模擬更具針對(duì)性,區(qū)域模型的精度不斷提高。梁秀婷等[26]根據(jù)呼和浩特市1994—1998 年5 年間每天的空氣質(zhì)量級(jí)別和氣象歷史資料創(chuàng)立了一個(gè)半定量的大氣污染潛式預(yù)報(bào)模型,通過與同時(shí)期5 個(gè)監(jiān)測(cè)點(diǎn)TSP 和SO2平均濃度對(duì)比,準(zhǔn)確率高達(dá)82.7%。這種預(yù)測(cè)模式的優(yōu)點(diǎn)是計(jì)算量小,對(duì)特殊天氣的預(yù)報(bào)精準(zhǔn)度較高,但由于在建模的時(shí)候不會(huì)考慮污染源的位置及污染物排放量,可能會(huì)導(dǎo)致對(duì)具有潛在高污染的地區(qū)預(yù)測(cè)誤差率較高。
早期的統(tǒng)計(jì)預(yù)測(cè)模式探索了污染物與污染物、氣象要素之間的相關(guān)性,滕浩宇[27]根據(jù)南京市和吉林市2014 年的日均觀測(cè)數(shù)據(jù),建立了基于統(tǒng)計(jì)方法的PM2.5與溫度、風(fēng)力、氣象因素及常規(guī)污染物之間的多元回歸模型,通過模擬預(yù)測(cè)發(fā)現(xiàn)PM2.5與風(fēng)力、天氣、溫度、CO、NO2、PM10、SO2等因素具有相關(guān)性,其中CO 濃度與PM2.5的濃度呈現(xiàn)極大的相關(guān)性。大尺度的污染物源解析也是空氣質(zhì)量模型領(lǐng)域的一個(gè)熱點(diǎn),Hao 等[28]利用ISC3 模式確定了北京市機(jī)動(dòng)車排放對(duì)空氣質(zhì)量的貢獻(xiàn),薛志剛等[29]利用ISC3 模式分析了電廠脫硫后的大氣環(huán)境影響。高怡等[30]、朱凌云等[31]和王書肖等[32]應(yīng)用Model-3/CMAQ 模型對(duì)不同區(qū)域、不同時(shí)期和不同減排情景下,不同污染物的濃度模擬進(jìn)行了應(yīng)用和研究,取得較好的效果。韓素芹等[33]、周廣強(qiáng)等[34]和龐楊等[35]應(yīng)用WRF-Chem模型對(duì)京津冀、長三角等地大氣污染物濃度進(jìn)行數(shù)值模擬。
進(jìn)入21 世紀(jì)我國結(jié)合獨(dú)特地域條件,創(chuàng)立多個(gè)數(shù)值預(yù)測(cè)模型,如氣象科學(xué)院研發(fā)的CAPPS 和中國科學(xué)院建立的基于RADM 模型的高分辨率對(duì)流層化學(xué)模式HRCM。生態(tài)環(huán)境部環(huán)境規(guī)劃院區(qū)域空氣質(zhì)量實(shí)時(shí)模擬與管控平臺(tái)集成了WRF 氣象模型和CMAQ、CAMx 空氣質(zhì)量模型,對(duì)全國338 個(gè)城市空氣質(zhì)量進(jìn)行預(yù)測(cè)預(yù)報(bào)。中國科學(xué)院大氣物理研究所研發(fā)了RAQM 和NAQPMS,目前上海、北京、深圳等城市已經(jīng)開始應(yīng)用以NAQPMS 為代表的嵌套網(wǎng)格空氣質(zhì)量預(yù)報(bào)模式,并對(duì)中國中東部地區(qū)霧霾和東亞酸雨中和效應(yīng)的時(shí)空分布進(jìn)行模擬分析[36,37]。南京大學(xué)開發(fā)了城市空氣質(zhì)量數(shù)值預(yù)報(bào)模式系統(tǒng)(NJU-CAQPS),并引入氣溶膠模塊,實(shí)現(xiàn)冬夏兩季PM2.5濃度時(shí)空分布特征的模擬預(yù)測(cè),并依托該模型以南京市為研究對(duì)象,對(duì)城市尺度空氣質(zhì)量和灰霾預(yù)測(cè)開展大量研究[38,39]。清華大學(xué)、華南理工大學(xué)受EPA 委托,開發(fā)了空氣質(zhì)量達(dá)標(biāo)評(píng)估工具(SMAT-CE)和空氣污染控制健康效益評(píng)估工具(BenMAP-CE),可以對(duì)不同污染減排情景下的空氣質(zhì)量點(diǎn)位是否滿足空氣質(zhì)量達(dá)標(biāo)要求和健康效應(yīng)進(jìn)行量化評(píng)估。中山大學(xué)依托大氣科學(xué)、海洋科學(xué)領(lǐng)域的學(xué)科優(yōu)勢(shì)對(duì)局部地區(qū)不同污染源對(duì)空氣質(zhì)量的貢獻(xiàn)與影響機(jī)制開展了相關(guān)研究[40,41]。
(1)第一代模型。第一代模型誕生于20 世紀(jì)70年代早期,并在70 年代晚期從城市/區(qū)域尺度發(fā)展到全球尺度。第一代模型主要是基于質(zhì)量守恒定律的箱式模型、基于湍流擴(kuò)散統(tǒng)計(jì)理論的高斯模型和拉格朗日軌跡模型[12],其中高斯模型有ISC、AERMOD 和ADMS 等,拉格朗日軌跡模型有EMKA 和CALPUFF等。第一代模型具有運(yùn)算速度快、算力要求小、易于操作和長期模擬濃度高的特點(diǎn),現(xiàn)在仍然得到廣泛的運(yùn)用;但其結(jié)構(gòu)簡單,對(duì)于大氣環(huán)境中大氣化學(xué)、大氣物理過程的模擬效果較差,無法滿足短期、高精度大氣污染物濃度模擬的需求。
(2)第二代模型。第二代模型誕生于20 世紀(jì)80—90 年代,其主要是基于梯度輸送理論的歐拉模型,使用了網(wǎng)格系統(tǒng)把模擬區(qū)域分為三維網(wǎng)格單元,針對(duì)每一個(gè)網(wǎng)格單元進(jìn)行模擬與計(jì)算,主要有CIT、UAM、RADM、ROM 和ADMO 等。第二代模型相比第一代實(shí)現(xiàn)了更精細(xì)化的空氣質(zhì)量預(yù)測(cè),針對(duì)每個(gè)三維網(wǎng)格單元考慮了復(fù)雜的大氣化學(xué)、大氣物理過程,模擬結(jié)果也更準(zhǔn)確;但其結(jié)構(gòu)更復(fù)雜,并且只考慮大氣環(huán)境中單一的大氣化學(xué)、大氣物理過程,沒有考慮對(duì)于不同大氣污染物本身之間的產(chǎn)生、反應(yīng)和消除機(jī)制,仍有一定局限性。
(3)第三代模型。第三代全尺度模型于20 世紀(jì)90 年代誕生,其主要是在第二代模型的基礎(chǔ)上構(gòu)建了基于“一個(gè)大氣”理念的多模塊集成、多尺度網(wǎng)格嵌套三維歐拉模型[12],模型突破了單一物種、單一模塊的限制,針對(duì)多尺度網(wǎng)格嵌套單元進(jìn)行模擬與計(jì)算,主要有Model-3/CMAQ、CAMx、WRF-Chem 和NAQPMS 等。在應(yīng)用過程中,4 階離散變分方法、卡爾曼濾波和集成模擬等方法被廣泛地與模型進(jìn)行耦合來提升大氣污染濃度預(yù)測(cè)的效率。Elbern 等首次使用4階離散變分方法對(duì)O3和NO2觀測(cè)數(shù)據(jù)進(jìn)行資料同化,并用作大氣污染濃度預(yù)測(cè)模型輸入[42];Vautard 等首次把CHIMERE 和NWPs 模型集成起來進(jìn)行O3濃度預(yù)測(cè)[43];Doraiswamy 等使用CMAQ 集成耦合WRF和MM5 模型對(duì)紐約開展O3和PM2.5濃度預(yù)測(cè);取得了較好效果,并發(fā)現(xiàn)采用權(quán)重和偏差校正后可以顯著提升預(yù)測(cè)結(jié)果的準(zhǔn)確性[44];San José 等嘗試耦合計(jì)算流體力學(xué)模型與大氣污染濃度預(yù)測(cè)模型,并在水平方向上建立分辨率為1~10m 的模擬網(wǎng)格[45,46],很多研究開始關(guān)注于耦合大氣污染濃度預(yù)測(cè)數(shù)值模型與統(tǒng)計(jì)模型,以提高大氣污染濃度預(yù)測(cè)的準(zhǔn)確性[47-50]。第三代模型精細(xì)化程度進(jìn)一步提高,針對(duì)每個(gè)三維網(wǎng)格單元考慮其復(fù)雜的大氣化學(xué)、大氣物理過程,可以實(shí)現(xiàn)特定時(shí)間、特定區(qū)域?qū)崟r(shí)大氣污染物濃度模擬,但其結(jié)構(gòu)復(fù)雜,算力要求高,操作難度大。
自20 世紀(jì)70 年代以來,統(tǒng)計(jì)模型一直被運(yùn)用在空氣質(zhì)量預(yù)測(cè)領(lǐng)域,包括多元線性回歸、分類樹、人工神經(jīng)網(wǎng)絡(luò)、模糊邏輯和卡爾曼濾波器等多種算法,統(tǒng)計(jì)模型一般需要大量的歷史數(shù)據(jù)作為模型輸入,不同的算法可以解決不同的空氣質(zhì)量預(yù)測(cè)問題。在統(tǒng)計(jì)學(xué)習(xí)中一類是簡單經(jīng)驗(yàn)統(tǒng)計(jì),另一類是機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)是在簡單經(jīng)驗(yàn)統(tǒng)計(jì)的基礎(chǔ)上,通過算法實(shí)現(xiàn)計(jì)算機(jī)模擬人類學(xué)習(xí)行為,具有重新組織已有知識(shí)結(jié)構(gòu)使之不斷改善自身的性能,相比簡單經(jīng)驗(yàn)統(tǒng)計(jì),機(jī)器學(xué)習(xí)具有自學(xué)習(xí)的特點(diǎn),在空氣質(zhì)量預(yù)測(cè)技術(shù)領(lǐng)域,通過大量歷史數(shù)據(jù)的輸入,訓(xùn)練計(jì)算機(jī)找到歷史數(shù)據(jù)特定區(qū)域、特定時(shí)間內(nèi)的變化規(guī)律,并以此作為依據(jù)對(duì)未來空氣質(zhì)量進(jìn)行預(yù)測(cè)。
2.2.1 簡單經(jīng)驗(yàn)統(tǒng)計(jì)
簡單經(jīng)驗(yàn)統(tǒng)計(jì)方法主要有3 種:持續(xù)模型(persistence)、氣候?qū)W模型(climatology)和經(jīng)驗(yàn)?zāi)P停╡mpiricism)。持續(xù)模型基于一個(gè)假設(shè),即今日大氣污染物濃度監(jiān)測(cè)值等于明天的預(yù)測(cè)值[49],模型輸入需要前一天的大氣污染物濃度監(jiān)測(cè)值,持續(xù)模型具有計(jì)算快、大氣環(huán)境穩(wěn)態(tài)下精度高、使用便捷和成本低等優(yōu)點(diǎn),但無法適用于天氣、排放和空氣質(zhì)量等因素突變下的預(yù)測(cè)情景,一般只作為其他預(yù)測(cè)方法的參考使用。氣候?qū)W模型與持續(xù)模型很相似,但主要基于大氣污染物濃度與氣候?qū)W特征高度相關(guān)的假設(shè),該模型需要數(shù)年大氣污染物濃度和氣候?qū)W歷史數(shù)據(jù),優(yōu)缺點(diǎn)與持續(xù)模型類似,無法對(duì)短期、突變的情景進(jìn)行有效預(yù)測(cè)。經(jīng)驗(yàn)?zāi)P褪窃跉夂驅(qū)W模型的基礎(chǔ)上,進(jìn)一步建立氣象要素的臨界值與大氣污染物濃度之間的關(guān)系,即達(dá)到某一氣象要素的某一臨界值表示某一大氣污染物到達(dá)某一濃度,需要?dú)庀笠氐臍v史數(shù)據(jù)和預(yù)報(bào)數(shù)據(jù)。這種模型具備其他簡單經(jīng)驗(yàn)統(tǒng)計(jì)方法的優(yōu)點(diǎn),應(yīng)用十分廣泛,如Wolff 等[21]在1978 年開發(fā)了經(jīng)驗(yàn)統(tǒng)計(jì)模型用于預(yù)測(cè)美國東北地區(qū)臭氧最大日濃度,而且準(zhǔn)確度有所提高,是一種有效預(yù)測(cè)重污染天氣的方法。但該模型無法預(yù)測(cè)大氣污染物濃度的具體數(shù)值,無法預(yù)測(cè)多種復(fù)雜氣象條件下高敏感度污染物的濃度。
2.2.2 機(jī)器學(xué)習(xí)
(1)分類回歸樹(CART)。CART 是決策樹的一種實(shí)現(xiàn),是一種二分遞歸分割技術(shù),把當(dāng)前樣本劃分為兩個(gè)子樣本,使得生成的每個(gè)非葉結(jié)點(diǎn)都有兩個(gè)分支,因此CART 算法生成的決策樹是結(jié)構(gòu)簡潔的二叉樹。CART 算法主要分為兩個(gè)步驟,包括將樣本遞歸劃分進(jìn)行建樹過程,以及生成決策樹后用驗(yàn)證數(shù)據(jù)進(jìn)行剪枝的過程。在空氣質(zhì)量預(yù)測(cè)中,通過選取特征,計(jì)算每個(gè)特征的基尼系數(shù),選擇基尼系數(shù)最小的特征及其對(duì)應(yīng)的切分點(diǎn)作為最優(yōu)特征與最優(yōu)切分點(diǎn),然后再重復(fù)以上計(jì)算步驟,直到葉節(jié)點(diǎn)滿足停止條件。Burrows 等[22]開發(fā)了基于決策樹的夏季地表臭氧濃度統(tǒng)計(jì)預(yù)測(cè)模型,通過輸入多年氣象站點(diǎn)數(shù)據(jù),決策樹模型找到近地層中與夏季地表臭氧濃度具有高度相關(guān)性的氣象因子,以達(dá)到準(zhǔn)確預(yù)測(cè)夏季地表臭氧濃度是否超過最大地表臭氧濃度限值標(biāo)準(zhǔn),此模型在加拿大多地得到實(shí)證應(yīng)用。分類回歸樹具有計(jì)算快、分類準(zhǔn)確、算力要求低等優(yōu)點(diǎn),也能保證一定的準(zhǔn)確度,但無法準(zhǔn)確預(yù)測(cè)大氣污染物濃度極值,在觀測(cè)數(shù)據(jù)受限的情況下模型使用也同樣受限。
(2)回歸模型(Regression)?;貧w模型從一組數(shù)據(jù)出發(fā),確定某些變量之間的定量關(guān)系式,建立數(shù)學(xué)模型并估計(jì)未知參數(shù),回歸的目的是預(yù)測(cè)數(shù)值型的目標(biāo)值。它的目標(biāo)是接受連續(xù)數(shù)據(jù),尋找最適合數(shù)據(jù)的方程,并能夠?qū)μ囟ㄖ颠M(jìn)行預(yù)測(cè)。常見的回歸模型包括線性回歸、局部加權(quán)線性回歸、嶺回歸和邏輯回歸等。Coburn 等[51]基于多元非線性回歸開發(fā)了臭氧濃度預(yù)測(cè)模型,使用五年歷史數(shù)據(jù)對(duì)模型進(jìn)行校驗(yàn)以后,模型對(duì)日1 小時(shí)最大臭氧濃度的預(yù)測(cè)效果得到較好提升,平均絕對(duì)誤差(MAE)穩(wěn)定在21.7~12.1ppb①ppb(part per billion),1ppb=10-9,即十億分之一,是一個(gè)無量綱量。?;貧w模型具有計(jì)算快、易操作、運(yùn)行成本低等優(yōu)點(diǎn)。但空氣質(zhì)量預(yù)測(cè)中存在大量簡單線性回歸模型無法模擬的非線性問題,且回歸模型通常需要大量、連續(xù)的歷史數(shù)據(jù),對(duì)數(shù)據(jù)數(shù)量、質(zhì)量要求較高。
(3)人工神經(jīng)網(wǎng)絡(luò)(ANNs)。人工神經(jīng)網(wǎng)絡(luò)是基于生物學(xué)中神經(jīng)網(wǎng)絡(luò)的基本原理,在理解和抽象了人腦結(jié)構(gòu)和外界刺激響應(yīng)機(jī)制后,以網(wǎng)絡(luò)拓?fù)渲R(shí)為理論基礎(chǔ),模擬人腦的神經(jīng)系統(tǒng)對(duì)復(fù)雜信息的處理機(jī)制的一種數(shù)學(xué)模型,也被稱作深度學(xué)習(xí)模型。它實(shí)際上是一個(gè)由大量簡單元件相互連接而成的復(fù)雜網(wǎng)絡(luò),具有高度的非線性,能夠進(jìn)行復(fù)雜的邏輯操作和非線性關(guān)系實(shí)現(xiàn)的系統(tǒng)。神經(jīng)網(wǎng)絡(luò)系統(tǒng)分為三層結(jié)構(gòu):輸入層、隱含層和輸出層,其主要的處理過程是在輸入層輸入樣本數(shù)據(jù),在隱含層處理數(shù)據(jù),在輸出層得到結(jié)果,如果誤差過大則需要調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值返還到隱含層里繼續(xù)處理,直至結(jié)果符合預(yù)期。在空氣質(zhì)量預(yù)測(cè)中,人工神經(jīng)網(wǎng)絡(luò)模型與傳統(tǒng)的預(yù)測(cè)模型相比具有自適應(yīng)學(xué)習(xí)能力,可以有效處理大氣環(huán)境中的非線性問題,而且其計(jì)算成本較數(shù)值模擬更低;但人工神經(jīng)網(wǎng)絡(luò)對(duì)于污染物濃度極值模擬效果較差,其模擬準(zhǔn)確度直接與計(jì)算成本相關(guān),計(jì)算成本投入越多準(zhǔn)確度越高,而且在建立模型的過程中會(huì)出現(xiàn)無法收斂的問題。其中基于長短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM)的時(shí)間序列預(yù)測(cè)是一類重要應(yīng)用,LSTM 是一類特殊的遞歸神經(jīng)網(wǎng)絡(luò),其核心特點(diǎn)是用上一時(shí)刻學(xué)習(xí)到的信息進(jìn)行當(dāng)前時(shí)刻的學(xué)習(xí),因此對(duì)于空氣質(zhì)量數(shù)據(jù)的時(shí)間序列預(yù)測(cè)效果較好。近年來相關(guān)研究逐漸增多,如Perez 等[23]開發(fā)了一種基于人工神經(jīng)網(wǎng)絡(luò)的統(tǒng)計(jì)預(yù)測(cè)模型,對(duì)PM10濃度進(jìn)行了預(yù)測(cè),并在智利得到實(shí)證應(yīng)用;VIOTTI 等[52]和Sang[53]等利用BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型對(duì)空氣中的臭氧進(jìn)行濃度預(yù)測(cè),結(jié)果表明這種模型對(duì)空間濃度的變化趨勢(shì)預(yù)報(bào)準(zhǔn)確。隨著人工智能技術(shù)的崛起,近年來基于人工神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量預(yù)測(cè)再度成為研究焦點(diǎn),其可能成為解決“情景減排—濃度預(yù)測(cè)—來源解析—響應(yīng)措施—減排落地”分鐘級(jí)響應(yīng)的關(guān)鍵技術(shù)。
(4)模糊邏輯(FL)。模糊邏輯模型是一種讓人工智能按照人的思考方式去考慮推理模糊概念問題的模型。通過模糊集合,使得一個(gè)變量可能同時(shí)屬于多個(gè)集合,每個(gè)集合部分占有這個(gè)變量,將一個(gè)具體的離散值模糊化,再通過許多不同角度的模糊規(guī)則去解釋模糊集合,使模糊集合中的變量計(jì)算得到一個(gè)確定的值,達(dá)到去模糊化的目的。模糊邏輯模型在空氣質(zhì)量預(yù)測(cè)中運(yùn)用較少,部分國外學(xué)者通過引用模糊克里金模型中的半統(tǒng)計(jì)隸屬函數(shù)對(duì)空氣質(zhì)量進(jìn)行預(yù)測(cè),并結(jié)合進(jìn)化遺傳算法(GAs)匹配不同污染物與不同函數(shù)關(guān)系,以達(dá)到提高模型預(yù)測(cè)效率的目的[54,55]。該模型與人工神經(jīng)網(wǎng)絡(luò)特點(diǎn)類似。
(5)卡曼濾波(KF)??鼮V波是一種對(duì)含有不確定信息的動(dòng)態(tài)系統(tǒng)走向做出有根據(jù)的預(yù)測(cè)的模型。在連續(xù)變化的系統(tǒng)中使用卡爾曼濾波是非常理想的,它具有占用內(nèi)存小的優(yōu)點(diǎn),并且速度很快,很適合應(yīng)用于實(shí)時(shí)問題和嵌入式系統(tǒng)。Chenevez 等[56]在丹麥氣象學(xué)院的資助下開發(fā)了基于卡爾曼濾波器的臭氧濃度預(yù)測(cè)模型,并于丹麥氣象學(xué)院數(shù)值模型(DMIHIRLAM)結(jié)合實(shí)現(xiàn)空氣質(zhì)量預(yù)測(cè),該模型的回歸方程通過6 個(gè)空氣質(zhì)量監(jiān)測(cè)站點(diǎn)數(shù)據(jù)校驗(yàn),形成了4 類回歸方程組合,預(yù)測(cè)效果較好,并在哥本哈根得到應(yīng)用??鼮V波模型可以在考慮不確定性的基礎(chǔ)上給出準(zhǔn)確的預(yù)測(cè),特別是基于時(shí)間序列的空氣質(zhì)量預(yù)測(cè),其缺點(diǎn)是對(duì)于高度非線性的系統(tǒng)模擬效果較差。
在數(shù)值模擬和統(tǒng)計(jì)學(xué)習(xí)的基礎(chǔ)上,有學(xué)者嘗試把兩類方法結(jié)合,以實(shí)現(xiàn)快速、準(zhǔn)確的實(shí)時(shí)大氣污染物濃度模擬。這類模型主要是通過統(tǒng)計(jì)學(xué)習(xí)的方法對(duì)數(shù)值模擬結(jié)果進(jìn)行評(píng)估、修正,大量的數(shù)值模擬歷史數(shù)據(jù)可以作為統(tǒng)計(jì)模型的輸入。
國內(nèi)相關(guān)研究從20 世紀(jì)90 年代開始逐漸起步,王芳等[57]構(gòu)建的北京市PM10的遺傳神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)精度與美國第三代空氣質(zhì)量模型CMAQ 進(jìn)行比較,結(jié)果表明兩者預(yù)測(cè)結(jié)果精度相當(dāng);Zhu[58]等使用ARMA 預(yù)測(cè)PM2.5的濃度,并使用BP 神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)ARMA 預(yù)測(cè)的誤差,最終PM2.5濃度的預(yù)測(cè)值即為二者加和。這些基于數(shù)值預(yù)測(cè)構(gòu)建的模型科學(xué)性極強(qiáng),能夠?qū)臻g污染物濃度的時(shí)間和空間進(jìn)行定量分析,但是需要很多相關(guān)數(shù)據(jù),且計(jì)算困難,同時(shí)海量數(shù)據(jù)的輸入也需要大量的時(shí)間。經(jīng)過一段時(shí)間的耦合,可以通過統(tǒng)計(jì)模型替代一部分?jǐn)?shù)值模擬運(yùn)算,以達(dá)到減少數(shù)值模擬次數(shù)、降低運(yùn)算成本的效果。清華大學(xué)王書肖教授課題組[59]借助統(tǒng)計(jì)方法對(duì)“排放—濃度”非線性關(guān)系進(jìn)行了顯示表征,建立了高階多項(xiàng)式的響應(yīng)曲面模型(pf-RSM),將化學(xué)傳輸模式(CTM)仿真次數(shù)減少60%?;谠摮晒鯐ふn題組與微軟亞太研究院[59]合作采用卷積神經(jīng)網(wǎng)絡(luò)的方法(CNN)建立了基于深度學(xué)習(xí)方法的響應(yīng)曲面模型(deepRSM),該研究基于兩個(gè)CTM 模擬的濃度空間分布建立各網(wǎng)格點(diǎn)“排放—濃度”響應(yīng)函數(shù),大大提高了計(jì)算效率,擴(kuò)展了該模型的應(yīng)用范圍。
(1)空氣質(zhì)量預(yù)測(cè)技術(shù)發(fā)展迅速,技術(shù)門檻不斷提高,使用成本不斷增加。數(shù)值模擬是空氣質(zhì)量預(yù)測(cè)技術(shù)的主流方法,其經(jīng)過三代模型迭代,已形成成熟的技術(shù)體系,即嵌套氣象場(chǎng)模擬—網(wǎng)格化排放清單制作—空氣質(zhì)量模擬,氣象場(chǎng)是模型的驅(qū)動(dòng)場(chǎng),網(wǎng)格化排放清單把各類污染源排放按照一定機(jī)制分配到網(wǎng)格中,污染物濃度模擬是使用模型對(duì)大氣環(huán)境中的復(fù)雜大氣物理、大氣化學(xué)反應(yīng)進(jìn)行模擬。隨著計(jì)算機(jī)技術(shù)的發(fā)展,空氣質(zhì)量預(yù)測(cè)技術(shù)門檻不斷提高,構(gòu)建一套大氣污染物濃度數(shù)值模擬與預(yù)測(cè)技術(shù)體系需要完成模型集成部署、代碼編譯、參數(shù)化方法調(diào)試、模型運(yùn)行和結(jié)果驗(yàn)證等步驟,以上均需要在基于Linux 系統(tǒng)的高性能計(jì)算服務(wù)器上開展,是一個(gè)計(jì)算機(jī)科學(xué)、大氣科學(xué)和環(huán)境科學(xué)等多學(xué)科交叉的領(lǐng)域,對(duì)于模型使用者的綜合能力要求較高;基于統(tǒng)計(jì)理論的機(jī)器學(xué)習(xí)等方法,對(duì)于大氣環(huán)境的復(fù)雜反應(yīng)機(jī)理知識(shí)要求不高,但要求模型使用者可以有機(jī)地結(jié)合統(tǒng)計(jì)與算法理論,正確、準(zhǔn)確地使用、調(diào)試各類機(jī)器學(xué)習(xí)算法,從數(shù)據(jù)的角度發(fā)現(xiàn)歷史數(shù)據(jù)分布、發(fā)展、運(yùn)行的規(guī)律,從而對(duì)未來進(jìn)行模擬預(yù)測(cè)。機(jī)器學(xué)習(xí)模型的性能與超參數(shù)直接相關(guān),超參數(shù)是在建立模型時(shí)用于控制算法行為的參數(shù),超參數(shù)調(diào)優(yōu)的越好,得到的模型就越好,超參數(shù)調(diào)整的過程不確定性較大,不同參數(shù)組合下的模型運(yùn)行結(jié)果往往無法重復(fù)。另外,決策機(jī)構(gòu)和管理機(jī)構(gòu)對(duì)于空氣質(zhì)量預(yù)測(cè)的速度和準(zhǔn)確度需求不斷提高,對(duì)于數(shù)值模擬來說是投入更多、更快的高性能計(jì)算機(jī)服務(wù)器,對(duì)于統(tǒng)計(jì)學(xué)習(xí)來說是輸入大量的歷史數(shù)據(jù)、使用更復(fù)雜的迭代算法,以上都會(huì)極大地增加空氣質(zhì)量預(yù)測(cè)的成本。
(2)原始數(shù)據(jù)多源異構(gòu),模型輸入數(shù)據(jù)欠缺標(biāo)準(zhǔn)化。對(duì)數(shù)值模擬和統(tǒng)計(jì)學(xué)習(xí)方法來說,多源異構(gòu)的原始數(shù)據(jù)都會(huì)造成模擬結(jié)果不具有可比性。數(shù)值模擬方法中網(wǎng)格化清單的制作需要收集區(qū)域、行業(yè)、部門的大氣污染物排放量數(shù)據(jù),其網(wǎng)格化過程中需要收集交通、能源、產(chǎn)業(yè)和自然資源等社會(huì)經(jīng)濟(jì)數(shù)據(jù)。目前排放量數(shù)據(jù)和社會(huì)經(jīng)濟(jì)數(shù)據(jù)數(shù)出多門,原始數(shù)據(jù)多源異構(gòu),根據(jù)原始數(shù)據(jù)制作的網(wǎng)格化排放清單也就有所差異。例如,中國環(huán)境科學(xué)研究院、清華大學(xué)和中國科學(xué)研究院大氣物理研究所等機(jī)構(gòu)均有獨(dú)立的排放清單數(shù)據(jù),同一研究區(qū)域內(nèi)使用不同排放清單數(shù)據(jù)所得到的大氣污染物濃度模擬結(jié)果往往差異較大。對(duì)于統(tǒng)計(jì)學(xué)習(xí)方法來說,統(tǒng)計(jì)學(xué)習(xí)通常把長周期氣象數(shù)據(jù)和大氣污染物監(jiān)測(cè)數(shù)據(jù)作為輸入數(shù)據(jù),多源異構(gòu)的原始數(shù)據(jù)作為輸入數(shù)據(jù)投喂給模型進(jìn)行訓(xùn)練所引起的模型預(yù)測(cè)結(jié)果波動(dòng)大,同一學(xué)習(xí)擬合過程難以重復(fù)。
(3)模型參數(shù)化方案缺少技術(shù)規(guī)范指導(dǎo),預(yù)測(cè)模擬結(jié)果可比性差。數(shù)值模型方法需要針對(duì)給定區(qū)域和給定時(shí)間的模型選取不同的參數(shù)化方案,目前國內(nèi)很多研究在開展空氣質(zhì)量預(yù)測(cè)時(shí)對(duì)于參數(shù)化方案的選擇僅限于通用方案。我國大氣污染物濃度監(jiān)測(cè)網(wǎng)絡(luò)的建設(shè)近年取得顯著成果,但PM2.5、PM10和O3等主要大氣污染物的歷史監(jiān)測(cè)數(shù)據(jù)還比較欠缺,缺乏長周期的觀測(cè)數(shù)據(jù)對(duì)于參數(shù)本地化造成較大困難。參數(shù)本地化的工作開展也較少,生態(tài)環(huán)境管理部門也未針對(duì)參數(shù)化方案的選取給出相應(yīng)的技術(shù)規(guī)范指導(dǎo)。通過數(shù)值模擬方法開展空氣質(zhì)量預(yù)測(cè)還處在“百家爭鳴”的階段。統(tǒng)計(jì)學(xué)習(xí)算法模型中有大量參數(shù)需要調(diào)試,我國目前對(duì)于使用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等經(jīng)典算法開展空氣質(zhì)量預(yù)測(cè)的核心參數(shù)率定的研究還較少,大量研究的參數(shù)方案無法復(fù)制。
(4)模擬結(jié)果評(píng)估指標(biāo)和方法不一,模擬結(jié)果業(yè)務(wù)化程度低。針對(duì)數(shù)值模擬和統(tǒng)計(jì)學(xué)習(xí)兩類方法的預(yù)測(cè)和模擬均可以采用離散統(tǒng)計(jì)和分類統(tǒng)計(jì)來進(jìn)行統(tǒng)計(jì)學(xué)評(píng)估,以達(dá)到理想的模擬預(yù)測(cè)效果。目前國內(nèi)外研究所采用的統(tǒng)計(jì)評(píng)估指標(biāo)多達(dá)數(shù)十種,離散統(tǒng)計(jì)包括相關(guān)系數(shù)、平均偏離(MB)、平均絕對(duì)總誤差(MAGE),分類統(tǒng)計(jì)包括準(zhǔn)確率、偏離率、虛警率等。評(píng)估指標(biāo)是決定模擬預(yù)測(cè)結(jié)果的重要手段,直接決定預(yù)測(cè)模擬結(jié)果是否科學(xué)、有效。不同統(tǒng)計(jì)指標(biāo)評(píng)估的預(yù)測(cè)結(jié)果難以具有可比性,導(dǎo)致模擬結(jié)果業(yè)務(wù)化的程度較低。
(5)模型技術(shù)文件與工具解讀不一,缺乏本土化、標(biāo)準(zhǔn)化模型輔助技術(shù)文件。模型技術(shù)文件與工具包是模型使用最重要的參考資料,目前針對(duì)空氣質(zhì)量模型的技術(shù)文件和工具包大多是基于國外原版文件的翻譯,對(duì)于模型本土化的應(yīng)用缺乏本土化、標(biāo)準(zhǔn)化的技術(shù)文件和工具包支撐,某種程度會(huì)導(dǎo)致模型“水土不服”、模擬結(jié)果誤差較大和結(jié)果難以重復(fù)等問題。另外,不同科研工作者對(duì)于模型技術(shù)文件和工具包的使用解讀也存在偏差,造成模型在不同領(lǐng)域、不同專業(yè)的使用和推廣有所差異,進(jìn)而出現(xiàn)模型使用“百家爭鳴”的局面。
(1)推動(dòng)機(jī)器學(xué)習(xí)等人工智能方法在空氣質(zhì)量預(yù)測(cè)領(lǐng)域的應(yīng)用。統(tǒng)計(jì)學(xué)習(xí)方法一直在空氣質(zhì)量預(yù)測(cè)領(lǐng)域有所應(yīng)用,近年來機(jī)器學(xué)習(xí)等人工智能方法在該領(lǐng)域的應(yīng)用重新成為熱點(diǎn)。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)被看作滿足分鐘級(jí)快速、準(zhǔn)確空氣質(zhì)量預(yù)測(cè)的解決方案之一。機(jī)器學(xué)習(xí)從統(tǒng)計(jì)理論和數(shù)據(jù)科學(xué)的角度出發(fā),不考慮大氣環(huán)境中大氣化學(xué)等復(fù)雜反應(yīng)機(jī)理,而是通過產(chǎn)品產(chǎn)量、資源消耗和氣象要素大數(shù)據(jù)輸入,通過算法尋找輸入數(shù)據(jù)的分布規(guī)律,并對(duì)未來大氣污染物濃度進(jìn)行預(yù)測(cè)。因此計(jì)算速度大幅提升,計(jì)算成本大幅下降。機(jī)器學(xué)習(xí)方法的深化應(yīng)用,是豐富空氣質(zhì)量預(yù)測(cè)方法的重要方向,也是服務(wù)生態(tài)環(huán)境管理部門科學(xué)、精準(zhǔn)治污需求的重要手段。
(2)推進(jìn)搭建數(shù)值模擬和統(tǒng)計(jì)學(xué)習(xí)兩類方法集成的預(yù)測(cè)技術(shù)體系。隨著管理決策部門對(duì)于濃度預(yù)測(cè)更加精細(xì)化的需求,構(gòu)建結(jié)合數(shù)值模擬與統(tǒng)計(jì)學(xué)習(xí)的空氣質(zhì)量預(yù)測(cè)技術(shù)方法體系是未來的發(fā)展方向。通過數(shù)值模擬實(shí)現(xiàn)對(duì)大氣環(huán)境中大氣環(huán)境復(fù)雜反應(yīng)機(jī)制的模擬,以機(jī)器學(xué)習(xí)等人工智能方法進(jìn)行評(píng)估和檢驗(yàn),縮短數(shù)值計(jì)算時(shí)間,降低計(jì)算成本。目前已經(jīng)有很多學(xué)者開展了兩類方法集成預(yù)測(cè)的技術(shù)方法,建議針對(duì)大氣污染物濃度模擬的新形勢(shì),推進(jìn)相關(guān)集成預(yù)測(cè)技術(shù)體系業(yè)務(wù)化落地。由于收集特定范圍尺度內(nèi)具有時(shí)間序列的數(shù)據(jù)是一大難點(diǎn),因此如何將多源異構(gòu)數(shù)據(jù)在空間、時(shí)間上進(jìn)行融合并構(gòu)建標(biāo)準(zhǔn)化排放清單也是未來研究需要解決的問題。
(3)建立全面的空氣質(zhì)量預(yù)測(cè)方法技術(shù)規(guī)范體系。2020 年生態(tài)環(huán)境部發(fā)布《環(huán)境空氣質(zhì)量數(shù)值預(yù)報(bào)技術(shù)規(guī)范》(HJ 1130—2020),該標(biāo)準(zhǔn)對(duì)環(huán)境空氣質(zhì)量數(shù)值預(yù)報(bào)模式的基本要求、運(yùn)算處理、效果評(píng)估等內(nèi)容進(jìn)行了規(guī)定,是該領(lǐng)域首次發(fā)布相關(guān)技術(shù)規(guī)范標(biāo)準(zhǔn),是我國空氣質(zhì)量預(yù)測(cè)模擬業(yè)務(wù)化標(biāo)準(zhǔn)體系建設(shè)的重要開端。目前該標(biāo)準(zhǔn)僅針對(duì)數(shù)值模擬方法提出了相應(yīng)的技術(shù)規(guī)范和指導(dǎo),機(jī)器學(xué)習(xí)等新一代人工智能方法相關(guān)技術(shù)規(guī)范還是空缺,建議加快推進(jìn)空氣質(zhì)量預(yù)測(cè)方法技術(shù)規(guī)范體系的構(gòu)建,把數(shù)據(jù)輸入、模型訓(xùn)練和結(jié)果評(píng)估等模擬預(yù)測(cè)過程標(biāo)準(zhǔn)化。