朱微微
(浙江工貿(mào)職業(yè)技術(shù)學(xué)院,浙江 溫州 325003)
國(guó)家環(huán)境空氣質(zhì)量自動(dòng)監(jiān)測(cè)站(簡(jiǎn)稱國(guó)站)的采樣儀器能夠自動(dòng)、有效地對(duì)空氣進(jìn)行采樣,各單位檢測(cè)出的數(shù)據(jù)基于同一標(biāo)準(zhǔn)且數(shù)據(jù)結(jié)果可追溯到同一源頭,使得監(jiān)測(cè)結(jié)果準(zhǔn)確、可信。由于國(guó)站布控較少,檢測(cè)用時(shí)長(zhǎng)、數(shù)據(jù)發(fā)布存在時(shí)間滯后較長(zhǎng),以及花費(fèi)較大等問(wèn)題,無(wú)法滿足對(duì)實(shí)時(shí)空氣質(zhì)量的監(jiān)測(cè)和預(yù)報(bào)。微型空氣質(zhì)量檢測(cè)儀(簡(jiǎn)稱企站)可以彌補(bǔ)上述不足,能夠?qū)崿F(xiàn)網(wǎng)格化監(jiān)控。
國(guó)站對(duì)可吸入顆粒物和大氣環(huán)境進(jìn)行監(jiān)測(cè),主要包括PM2.5 與PM10 兩種顆粒物和CO、NO2、SO2及O3四種氣體(簡(jiǎn)稱“兩顆四氣”)。企站除監(jiān)測(cè)“兩顆四氣”,同時(shí)還可監(jiān)測(cè)溫度、濕度、風(fēng)速、氣壓、降水等氣象參數(shù)。目前,微型空氣質(zhì)量檢測(cè)儀尚存在精度不高這一不足。如何提高微型空氣質(zhì)量檢測(cè)儀的檢測(cè)精度成為迫切需要解決的問(wèn)題。
本文以國(guó)站發(fā)布的數(shù)據(jù)為比較對(duì)象,建立數(shù)據(jù)校準(zhǔn)模型,對(duì)微型空氣質(zhì)量檢測(cè)儀所檢測(cè)的數(shù)據(jù)(包括PM2.5 等)進(jìn)行校準(zhǔn),并通過(guò)誤差分析對(duì)模型的精度進(jìn)行檢驗(yàn)。第一部分為神經(jīng)網(wǎng)絡(luò)模型介紹;第二部分是神經(jīng)網(wǎng)絡(luò)模型的建立及其誤差分析;第三部分介紹應(yīng)用BP 神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)空氣質(zhì)量數(shù)據(jù)校準(zhǔn)的方法。
人工神經(jīng)網(wǎng)絡(luò)是模擬生物神經(jīng)網(wǎng)絡(luò)進(jìn)行信息處理的一種數(shù)學(xué)模型,目前已研究出近40種人工神經(jīng)網(wǎng)絡(luò)模型。[4]本文僅使用BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)來(lái)研究空氣質(zhì)量數(shù)據(jù)的校準(zhǔn)方法問(wèn)題。
BP 神經(jīng)網(wǎng)絡(luò)是一種三層或三層以上的多層神經(jīng)網(wǎng)絡(luò),其中包含一個(gè)輸入層、一個(gè)或多個(gè)隱含層以及一個(gè)輸出層,它采用“誤差逆?zhèn)鞑ニ惴ā睂?duì)誤差進(jìn)行修正,從而不斷降低模擬誤差。[5,6]
圖1 三層的BP神經(jīng)網(wǎng)絡(luò)模型
BP 算法的學(xué)習(xí)過(guò)程由信號(hào)的正向傳播和誤差的反向傳播兩個(gè)過(guò)程組成。正向傳播時(shí),把樣本的特征從輸入層輸入,信號(hào)經(jīng)各個(gè)隱含層的處理后,從輸出層傳出。對(duì)于網(wǎng)絡(luò)的實(shí)際輸出與期望輸出之間的誤差,把誤差信號(hào)從最后一層逐層反傳,從而獲得各個(gè)層的誤差學(xué)習(xí)信號(hào),再據(jù)此修正各層神經(jīng)元的權(quán)值。
所以我們?cè)谑褂肂P 算法的時(shí)候,第一步根據(jù)網(wǎng)絡(luò)預(yù)測(cè)的誤差計(jì)算最后一層的學(xué)習(xí)信號(hào),第二步計(jì)算倒數(shù)第二層的學(xué)習(xí)信號(hào),第三步計(jì)算倒數(shù)第三層的學(xué)習(xí)信號(hào),以此類推,從后向前計(jì)算,這也是BP 算法名稱的由來(lái)。計(jì)算得到每一層的學(xué)習(xí)信號(hào)后,計(jì)算每一層的權(quán)值矩陣如何調(diào)整,最后對(duì)所有層的權(quán)值矩陣進(jìn)行更新。[7]
徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)最早是由Moody 和Darken 于1988 年提出的。該神經(jīng)網(wǎng)絡(luò)的非線性擬合能力非常強(qiáng),學(xué)習(xí)規(guī)則也簡(jiǎn)單,具有很強(qiáng)的函數(shù)逼近能力、分類能力和學(xué)習(xí)速度,因而得到了廣泛的應(yīng)用。[8,9]
RBF神經(jīng)網(wǎng)絡(luò)是由輸入層、隱含層、輸出層組成的三層前饋式網(wǎng)絡(luò),輸入層到隱含層通過(guò)非線性映射連接,隱含層到輸出層通過(guò)線性映射連接。
建模思路:(1)把企站分鐘級(jí)數(shù)據(jù)轉(zhuǎn)化為小時(shí)級(jí)數(shù)據(jù),與國(guó)站數(shù)據(jù)一一對(duì)應(yīng)起來(lái),作為輸入數(shù)據(jù)為下一步建模做好準(zhǔn)備。(2)建立神經(jīng)網(wǎng)絡(luò)模型,以企站11 個(gè)因素(6 個(gè)空氣質(zhì)量因素,及5 個(gè)氣象因素)作為輸入層的11維輸入變量,以國(guó)站的某個(gè)空氣質(zhì)量數(shù)據(jù)作為輸出層的一維輸出變量。(3)采集第t日之前的n日數(shù)據(jù)作為建模數(shù)據(jù)。(4)從建模數(shù)據(jù)中留下最后1 個(gè)數(shù)據(jù)作誤差檢驗(yàn),其余數(shù)據(jù)作網(wǎng)絡(luò)訓(xùn)練。(5)采用“等維逐日新陳代謝”思想,即使用第t日之前的n日數(shù)據(jù)作網(wǎng)絡(luò)訓(xùn)練和誤差檢驗(yàn),再對(duì)第t日的數(shù)據(jù)進(jìn)行校準(zhǔn)并發(fā)布,接著,使用第t+1 日之前的n日數(shù)據(jù)作網(wǎng)絡(luò)訓(xùn)練和誤差檢驗(yàn),再對(duì)第t+1 日的數(shù)據(jù)進(jìn)行校準(zhǔn)并發(fā)布,以此類推。(6)誤差檢驗(yàn)指標(biāo)為相對(duì)誤差絕對(duì)值。
圖2 RNF神經(jīng)網(wǎng)絡(luò)模型
企站的數(shù)據(jù)是分鐘級(jí)數(shù)據(jù)(不足5 分鐘發(fā)布一次),而國(guó)站數(shù)據(jù)是小時(shí)級(jí)數(shù)據(jù)。為了對(duì)企站數(shù)據(jù)進(jìn)行校準(zhǔn),就需要以國(guó)站數(shù)據(jù)為參考標(biāo)準(zhǔn),于是必須將企站的分鐘級(jí)數(shù)據(jù)轉(zhuǎn)化為小時(shí)級(jí)數(shù)據(jù)。
設(shè)y0為國(guó)站發(fā)布的某指標(biāo)空氣質(zhì)量數(shù)據(jù),y1為企站發(fā)布的該指標(biāo)的空氣質(zhì)量數(shù)據(jù),y2為企站發(fā)布的該指標(biāo)的空氣質(zhì)量數(shù)據(jù)的校準(zhǔn)值,則校準(zhǔn)前企站該指標(biāo)的相對(duì)誤差絕對(duì)值為
校準(zhǔn)后企站該指標(biāo)的相對(duì)誤差絕對(duì)值為
由于最舊的數(shù)據(jù)對(duì)未來(lái)的預(yù)測(cè)價(jià)值最小,相反,最新的數(shù)據(jù)對(duì)未來(lái)的預(yù)測(cè)價(jià)值最大,于是從歷史數(shù)據(jù)中僅僅截取最近幾天的小時(shí)級(jí)數(shù)據(jù)用于建模。在建模時(shí),從全部建模數(shù)據(jù)中留下最后1 個(gè)數(shù)據(jù)作誤差檢驗(yàn),其余數(shù)據(jù)用于網(wǎng)絡(luò)訓(xùn)練。
2.3.1 BP神經(jīng)網(wǎng)絡(luò)模型的建立與求解
以PM2.5為例。BP神經(jīng)網(wǎng)絡(luò)算法如下:
第1 步,令滯后天數(shù)最大值T=30;滯后天數(shù)i=1。
第2步,將過(guò)去i天的國(guó)站PM2.5指標(biāo)作為輸出變量,將對(duì)應(yīng)的企站6個(gè)空氣質(zhì)量指標(biāo)和5個(gè)氣象指標(biāo)作為輸入變量。數(shù)據(jù)總數(shù)n=24i。留下最后1個(gè)數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù),其余的n-1個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。計(jì)算校準(zhǔn)前企站PM2.5的相對(duì)誤差絕對(duì)值α1。
第3步,令相對(duì)誤差絕對(duì)值α=+∞;隱含層的神經(jīng)元個(gè)數(shù)最大值M=20;令隱含層的神經(jīng)元個(gè)數(shù)j=1。
第4步,訓(xùn)練BP數(shù)據(jù)網(wǎng)絡(luò),并輸出隱含層的神經(jīng)元個(gè)數(shù)j、校準(zhǔn)后的PM2.5數(shù)據(jù)y2、校準(zhǔn)后企站PM2.5的相對(duì)誤差絕對(duì)值α2。
第5步,如果α2<α,則α=α2。
第6 步,j=j+1。如果j≤M,則返回第4步,否則執(zhí)行第7步。
第7 步,i=i+1。如果i≤T,則返回第2 步,否則執(zhí)行第8步。
第8 步,從滯后天數(shù)i=1,2,...,T中,選擇相對(duì)誤差絕對(duì)值α2最小的那一天,以及對(duì)應(yīng)的隱含層的神經(jīng)元個(gè)數(shù)j、校準(zhǔn)后的PM2.5數(shù)據(jù)y2,結(jié)束。
BP神經(jīng)網(wǎng)絡(luò)模型的計(jì)算結(jié)果如表1所示。
表1 BP神經(jīng)網(wǎng)絡(luò)模型的計(jì)算結(jié)果
從表1 可知,與校準(zhǔn)前相比,校準(zhǔn)后的數(shù)據(jù)誤差有大幅度的降低。
2.3.2 RBF神經(jīng)網(wǎng)絡(luò)模型的建立與求解
仍然以PM2.5為例。RBF神經(jīng)網(wǎng)絡(luò)算法如下:
第1 步,令滯后天數(shù)最大值T=30;滯后天數(shù)i=1。
第2步,將過(guò)去i天的國(guó)站PM2.5指標(biāo)作為輸出變量,將對(duì)應(yīng)的企站6個(gè)空氣質(zhì)量指標(biāo)和5個(gè)氣象指標(biāo)作為輸入變量。數(shù)據(jù)總數(shù)n=24i。留下最后1個(gè)數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù),其余的n-1個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。計(jì)算校準(zhǔn)前企站PM2.5的相對(duì)誤差絕對(duì)值α1。
圖3 BP神經(jīng)網(wǎng)絡(luò)算法流程圖
圖4 RBF神經(jīng)網(wǎng)絡(luò)流程圖
第3 步,訓(xùn)練RBF數(shù)據(jù)網(wǎng)絡(luò),并輸出校準(zhǔn)后的PM2.5 數(shù)據(jù)y2、校準(zhǔn)后企站PM2.5 的相對(duì)誤差絕對(duì)值α2。
第4 步,i=i+1。如果i≤T,則返回第2 步,否則執(zhí)行第5步。
第5 步,從滯后天數(shù)i=1,2,...,T中,選擇相對(duì)誤差絕對(duì)值α2最小的那一天,以及對(duì)應(yīng)的校準(zhǔn)后的PM2.5數(shù)據(jù)y2,結(jié)束。
RBF神經(jīng)網(wǎng)絡(luò)模型的計(jì)算結(jié)果如表2所示。
表2 RBF神經(jīng)網(wǎng)絡(luò)模型的計(jì)算結(jié)果
從表2 可知,RBF 神經(jīng)網(wǎng)絡(luò)模型在PM10、CO、NO2、O3上的校準(zhǔn)是有效的,而在PM2.5、SO2上的校準(zhǔn)是無(wú)效的。
從表1 和表2 可知,BP 神經(jīng)網(wǎng)絡(luò)模型針對(duì)空氣質(zhì)量監(jiān)測(cè)指標(biāo)PM2.5、PM10、CO、NO2、SO2、O3的數(shù)據(jù)校準(zhǔn)都是有效的,而RBF神經(jīng)網(wǎng)絡(luò)模型只有在PM10、CO、NO2、O3上的校準(zhǔn)是有效的,所以相比之下,BP 神經(jīng)網(wǎng)絡(luò)優(yōu)于RBF 神經(jīng)網(wǎng)絡(luò)。因此,在實(shí)際數(shù)據(jù)校準(zhǔn)中,選擇BP 神經(jīng)網(wǎng)絡(luò)模型,并選用表1的參數(shù)。
以空氣質(zhì)量指標(biāo)PM2.5 的數(shù)據(jù)校準(zhǔn)為例,使用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行校準(zhǔn)并發(fā)布的方法如下:
第1步,采集國(guó)站PM2.5第t-22 至第t日(共23天)的小時(shí)級(jí)數(shù)據(jù)。
第2 步,采集企站空氣質(zhì)量指標(biāo)PM2.5、PM10、CO、NO2、SO2、O3以及氣象指標(biāo)溫度、濕度、風(fēng)速、氣壓、降水的第t-22 至第t日(共23天)的分鐘級(jí)數(shù)據(jù),并使用Shepard 方法把分鐘級(jí)數(shù)據(jù)整合成小時(shí)級(jí)數(shù)據(jù)。
第3步,建立BP神經(jīng)網(wǎng)絡(luò)模型,隱含層的神經(jīng)元個(gè)數(shù)取9,把國(guó)站PM2.5 指標(biāo)小時(shí)級(jí)數(shù)據(jù)作為輸出變量,把企站6 個(gè)空氣質(zhì)量指標(biāo)和5 個(gè)氣象指標(biāo)的小時(shí)級(jí)數(shù)據(jù)作為輸入變量,使用23天的數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)。
第4 步,把企站PM2.5 指標(biāo)第t+1 日的分鐘級(jí)數(shù)據(jù)代入訓(xùn)練好的BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行校準(zhǔn),獲得校準(zhǔn)值,然后發(fā)布,結(jié)束。
綜上,本文得出結(jié)論:BP 神經(jīng)網(wǎng)絡(luò)模型不但能夠?qū)? 個(gè)空氣質(zhì)量指標(biāo)進(jìn)行校準(zhǔn),而且校準(zhǔn)后的數(shù)據(jù)誤差非常小。在此基礎(chǔ)上給出了應(yīng)用BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)企站發(fā)布的空氣質(zhì)量分鐘級(jí)數(shù)據(jù)進(jìn)行校準(zhǔn)的方法。