賈佳美,池凱凱+,吳哲翔
(1.浙江工業(yè)大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,浙江 杭州 310000; 2.國網(wǎng)浙江省電力公司 金華供電公司,浙江 金華 321000)
隨著工業(yè)化程度的提升,空氣污染問題日益嚴重,尤其以直徑小于2.5 μm的顆粒物為主,學(xué)名PM2.5,極大影響著居民的身體健康,帶來心血管、支氣管炎、哮喘等諸多呼吸類疾病。因此,對空氣PM2.5濃度做出精確預(yù)測是預(yù)防疾病、指導(dǎo)高質(zhì)量生活出行的關(guān)鍵步驟。
空氣質(zhì)量與污染的影響因素較為復(fù)雜,目前PM2.5濃度預(yù)測主要分為兩種:機理模型和非機理模型。機理模型是基于物理化學(xué)原理對污染物的理化反應(yīng)進行模擬分析,其預(yù)測準確度主要由污染源排放數(shù)值、空氣質(zhì)量監(jiān)測數(shù)據(jù)等因素決定,如:預(yù)報模型[1]、多尺度質(zhì)量模型[2]、多模式預(yù)報模型[3]等均是常用機理模型。機理模型預(yù)測的實時性較好,準確性也較高,但所涉及的空氣、污染物等相關(guān)因素的理化反應(yīng)較為復(fù)雜,成本高,實用性較差。非機理模型是基于機器學(xué)習(xí)和統(tǒng)計學(xué)的預(yù)測模型,通過歷史數(shù)據(jù)特征發(fā)現(xiàn)變化規(guī)律,極大簡化了PM2.5預(yù)測的相關(guān)影響因素,應(yīng)用也越來越成熟。目前非機理預(yù)測模型主要有:多元線性回歸模型[4,5]、支持向量機模型SVM[6,7]、灰色理論模型[8,9]和BP神經(jīng)網(wǎng)絡(luò)模型[10,11]等。多元線性回歸和灰色理論模型在預(yù)測PM2.5上具有一定適用性,但由于影響PM2.5的污染物因子間具有相互作用,體現(xiàn)強烈非線性特征,故其預(yù)測準確度不高。相對而言,BP神經(jīng)網(wǎng)絡(luò)更加適用于具有明確非線性環(huán)境的預(yù)測模型,已廣泛應(yīng)用于諸多領(lǐng)域。如:文獻[10]設(shè)計了基于BP神經(jīng)網(wǎng)絡(luò)的非線性回歸PM2.5預(yù)測模型,將空氣中的幾種污染物考慮為神經(jīng)網(wǎng)絡(luò)的輸入層節(jié)點數(shù),但作者對BP神經(jīng)網(wǎng)絡(luò)本身易于陷入局部最優(yōu)的不足未作優(yōu)化。文獻[11]同時考慮氣象因素和大氣污染物,通過融合粒子群優(yōu)化和遺傳優(yōu)化對BP神經(jīng)網(wǎng)絡(luò)的權(quán)重和閾值進行尋優(yōu),提升了算法的收斂速度和預(yù)測準度,但對群體智能算法本身易于早熟的不足未作優(yōu)化,這會導(dǎo)致神經(jīng)網(wǎng)絡(luò)訓(xùn)練出現(xiàn)“過訓(xùn)練”。文獻[12]考慮大氣環(huán)境的復(fù)雜多變和不確定性,利用遺傳算法對支持向量機SVM進行參數(shù)尋優(yōu),進而完成對空氣指數(shù)的實時預(yù)測。文獻[13]引入混沌思想改進粒子群的尋優(yōu)性能,再基于改進粒子群對BP神經(jīng)網(wǎng)絡(luò)的參數(shù)進行優(yōu)化,以提升PM2.5預(yù)測模型的預(yù)測精度,但混沌僅提升了種群跳出局部最優(yōu)的能力,種群的多樣性、粒子的局部開發(fā)和全局搜索能力間的均衡,均沒有得到改善,這樣導(dǎo)致神經(jīng)網(wǎng)絡(luò)的訓(xùn)練質(zhì)量依然有待改善。
對此,提出在改進粒子群尋優(yōu)精度和效率基礎(chǔ)上,設(shè)計改進BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型,進而設(shè)計可用于空氣PM2.5濃度預(yù)測的有效模型。具體做法是:利用改進的粒子群尋優(yōu)機制對BP神經(jīng)網(wǎng)絡(luò)層次間的權(quán)值和閾值進行最優(yōu)化求解,克服其易于陷入局部最優(yōu)、收斂速度慢的不足,最后以配置最優(yōu)參數(shù)的神經(jīng)網(wǎng)絡(luò)進行PM2.5濃度預(yù)測,提升預(yù)測準確度。最后選取某市某一時期的PM2.5日均濃度數(shù)據(jù)作為樣本進行實驗分析,驗證了該預(yù)測模型和算法可以有效提升PM2.5濃度的預(yù)測精度,且算法迭代速度更快。
BP神經(jīng)網(wǎng)絡(luò)是一種依據(jù)誤差反向傳播算法訓(xùn)練的多層次前饋神經(jīng)網(wǎng)絡(luò),使用最為廣泛,模型如圖1所示。在信息正向傳播中,若令輸入樣本為X={x1,x2,…,xn},它將順次通過輸入層、隱含層,最后傳輸至輸出層。網(wǎng)絡(luò)學(xué)習(xí)過程包括信息正向傳播和誤差反向傳播,通過反復(fù)訓(xùn)練,迭代地在相對誤差函數(shù)梯度下降的方向上,不斷修正網(wǎng)絡(luò)參數(shù),使實際輸出值向期望輸出值迭代式逼近。圖1中,V和W分別表示輸入層與隱含層之間、隱含層與輸出層之間的網(wǎng)絡(luò)權(quán)值集,|W|=n×q,|V|=q×m。令網(wǎng)絡(luò)輸出為Y={y1,y2,…,ym},n為輸入層節(jié)點數(shù),q為隱含層節(jié)點數(shù),m為輸出層節(jié)點數(shù)。BP神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型和執(zhí)行步驟可以參考相關(guān)文獻,此處不做詳細描述。
圖1 BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)根據(jù)梯度下降法對輸入層與隱含層權(quán)值、隱含層與輸出層權(quán)值以及隱含層和輸出層的閾值進行更新,但是其使用的方式對于歷史權(quán)值和閾值沒有記憶能力,在增加學(xué)習(xí)樣本時,網(wǎng)絡(luò)訓(xùn)練需要重新開始。這一特性使得傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)易于生成局部最優(yōu)解,用于空氣質(zhì)量預(yù)測,會導(dǎo)致最終的PM2.5濃度預(yù)測值與期望值相差較遠,其預(yù)測精度有待提高。
粒子群算法PSO是一種面向種群的隨機尋優(yōu)算法,實現(xiàn)了自然界中鳥群和魚群的捕食社會行為,種群中每個個體稱為一個粒子,群體成員通過自身及種群其它成員的搜索經(jīng)驗,不斷改變搜索方向和位置,協(xié)作搜索最優(yōu)目標。
(1)
(2)
首先從初始種群分布、避免局部最優(yōu)解以及均衡全局搜索與局部開發(fā)能力3個方面對傳統(tǒng)PSO進行改進,從而獲取更好的尋優(yōu)性能:
(1)基于對立學(xué)習(xí)機制的種群初始化
傳統(tǒng)PSO以隨機方式進行種群初始化,逐步迭代搜索全局最優(yōu)解。然而,PSO尋優(yōu)速度與初始種群密切相關(guān)。當初始種群分布多樣且包含較多優(yōu)質(zhì)解時,可以加快算法收斂。為此,算法在種群初始化中引入對立學(xué)習(xí)機制。對立學(xué)習(xí)通過同步考慮當前解及其對立解改善候選解質(zhì)量,將隨機初始解和對立解均考慮在初始種群中,不僅可以保證種群多樣性,還可以加快搜索速度。以下對相關(guān)概念進行描述:
定義1 對立數(shù)。令x為[l,u]內(nèi)的實數(shù),其對立數(shù)x’為x’=u+l-x。
初始化步驟如下:
算法1
(1)輸入:S個粒子
(2)輸出:初始種群X
(3)隨機生成規(guī)模S的初始種群{X}
(4)fori=1 toSdo//遍歷所有粒子
(5)forj=1 toddo//遍歷所有維度
(7)endfor
(8)endfor
(9)X’’=X∪X’//原始種群和對立粒子種群進行聯(lián)立
(10)計算X’’的適應(yīng)度,根據(jù)適應(yīng)度對X’’做降序排列
(11)選擇排序前S的粒子種群X作為最終初始種群
(2)融入混沌Tent映射的搜索機制
由粒子速度更新式(1)可知,速度更新通過兩個隨機變量r1和r2確保其多樣性,但其全局勘探不夠充分,易于陷入局部最優(yōu)解。為此,引入混沌Tent映射機制改進粒子速度更新機制?;煦缡且环N非線性的動態(tài)隨機非重復(fù)決策系統(tǒng),表示對初始條件的敏感依賴性。由于混沌系統(tǒng)的可遍歷性、非重復(fù)性,混沌序列可以實現(xiàn)比隨機搜索(隨機值r1、r2決定)更廣泛的搜索過程。將混沌映射融入PSO可以增強算法搜索能力,更好預(yù)防局部最優(yōu)。改進算法利用Tent混沌映射生成混沌序列,表示為
(3)
式中:混沌參數(shù)u=0.7。
氣壓傳感器一旦發(fā)生了故障,就會導(dǎo)致氣象站不能夠準確獲取氣壓信息,一般情況下氣壓傳感器發(fā)生了故障之后需要及時進行斷電處理,將氣壓傳感器的供電電源快速切斷。氣壓傳感器的主要故障表現(xiàn)為氣壓值具體數(shù)值起伏不定,脫離正常的數(shù)值范圍,此時就需要查看氣壓傳感器的接線狀況。首先需要檢車各個部件的鏈接,以及通氣口是否暢通,部分的故障是由通氣口存在異物造成的。如果不是外界的因素影響到了氣壓傳感器導(dǎo)致故障的產(chǎn)生,那么可能是傳感器自身的老化和損壞,需要進行更換新設(shè)備。
利用混沌系統(tǒng)生成隨機數(shù)序列提升粒子搜索速度,基本方法是:利用Tent映射生成的混沌序列替換速度更新中的隨機值r。則改進粒子速度更新方式為
(4)
(3)自適應(yīng)控制的慣性權(quán)重機制
慣性權(quán)重w決定先代粒子對于速度更新的影響。當w取值較大時,利于PSO的粒子全局勘探能力;當w取值較小時,則利于粒子的局部開發(fā)能力。而傳統(tǒng)PSO的慣性權(quán)重w是定值模式,使得兩種搜索模式切換缺乏平滑性,不利于均衡粒子搜索迭代中全局勘探和局部開發(fā)過程。算法引入自適應(yīng)慣性權(quán)重機制,將慣性權(quán)重定義為
(5)
式中:wmax和wmin分別為慣性權(quán)重的最大值與最小值,t為當前迭代數(shù),Tmax為最大迭代。由上式可知,在迭代初期,粒子具有更大的慣性權(quán)重,可以進行充分的全局搜索,確保種群多樣性;迭代后期,慣性權(quán)重逐漸減小,局部開發(fā)能力增強,這樣可以使算法更快收斂在最優(yōu)解處。
基于IPSO-BP的PM2.5預(yù)測模型可分3個階段:確定網(wǎng)絡(luò)結(jié)構(gòu)、改進粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)和PM2.5濃度預(yù)測。
確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(使用最為常用的3層結(jié)構(gòu)),即確定神經(jīng)網(wǎng)絡(luò)的輸入層、隱含層和輸出層節(jié)點數(shù)量,即n-q-m。由于輸出層的結(jié)果得到的是某一天的PM2.5濃度預(yù)測值,所以該層節(jié)點數(shù)m=1。輸入層節(jié)點數(shù)決定于影響PM2.5的污染物因素和氣象因素。研究表明,PM2.5的濃度在不同溫度、風(fēng)速、季節(jié)變化、降水、濕度以及空氣中其它污染物平均濃度下顯示出不同的變化。對于夏季高溫天氣,空氣中污染物顆粒運動更加劇烈,擴展更快,因此其PM2.5日均濃度更低;而冬季低溫天氣下,日均PM2.5濃度是最高的,春秋兩季較為接近,總體而言,PM2.5濃度值的季節(jié)排序是:冬季>秋季>春季>夏季。風(fēng)速越快時,PM2.5污染物擴散越快,污染隨之下降。而降水增加時,PM2.5顆粒物會隨雨水下沉,相應(yīng)污染也減輕??諝鉂穸仍礁邥r,空氣流動減弱,不利于污染物擴展,PM2.5濃度越高。除以上氣象因素外,空氣中的其它污染物也會對PM2.5濃度產(chǎn)生影響。主要的空氣污染物包括:二氧化硫SO2、臭氧O3、二氧化氮NO2、一氧化碳CO、PM10及往日PM2.5濃度等。
為了對輸入變量進行篩選,引入平均影響值MIV方法評價相關(guān)因素的相關(guān)性,從而決定輸入層節(jié)點數(shù)。選取溫度、風(fēng)速、降水量、空氣濕度、SO2、CO、O3、NO2、PM10和PM2.5濃度作為原始數(shù)據(jù),基于MIV方法進行輸入變量篩選的具體過程是:首先,輸入以上變量進行BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,以原值為基礎(chǔ)將相應(yīng)變量分別增加和減少10%,形成兩個新樣本數(shù)據(jù);然后,利用原始數(shù)據(jù)訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)對兩個新樣本數(shù)據(jù)進行測試,得出測試結(jié)果;最后,對于兩次訓(xùn)練結(jié)果的差值,得出該變量的影響變化值IV,并求取在所有樣本數(shù)據(jù)上的均值結(jié)果,即為一個影響因素所對應(yīng)的MIV。根據(jù)文獻[14]的研究結(jié)果,可選取MIV累計值在85%以上的變量作為篩選的變量數(shù)量。經(jīng)過選取后文表1中某市某段時間內(nèi)的氣象數(shù)據(jù)和污染物數(shù)據(jù),經(jīng)過網(wǎng)絡(luò)訓(xùn)練分析,以MIV累計值85%為臨界點,最終選取SO2、CO、O3、NO2、PM10和PM2.5濃度、以及最低氣溫、最高氣溫、濕度作為影響PM2.5濃度的預(yù)測因子。因此,BP神經(jīng)網(wǎng)絡(luò)的輸入層的節(jié)點對應(yīng)于預(yù)測因子數(shù)量,即n=9。
對于隱含層的節(jié)點數(shù),根據(jù)以下經(jīng)驗公式確定
(6)
式中:α為常量,取值范圍為0<α<10。由此可見,隱含層節(jié)點數(shù)并不能提前準確預(yù)知,此時可根據(jù)試湊法以確保誤差相對更小的原則確定其取值。依據(jù)選取相同樣本進行測試,再根據(jù)均方差最小為原則,可得q=5為隱含層的最優(yōu)節(jié)點數(shù)。
綜上,BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)模型為9-5-1。此外,隱含層的激活函數(shù)使用tansig函數(shù),輸出層的激活函數(shù)使用purelin函數(shù),學(xué)習(xí)函數(shù)和訓(xùn)練函數(shù)可以使用BP神經(jīng)網(wǎng)絡(luò)的默認函數(shù)即可。
利用改進粒子群優(yōu)化算法IPSO實現(xiàn)對BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化,首先需要確定粒子位置的編碼結(jié)構(gòu)。由3.1節(jié)中確定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型9-5-1可知,神經(jīng)網(wǎng)絡(luò)的權(quán)值數(shù)量為:輸入層與隱含層間權(quán)值為9×5=45,隱含層與輸出層間權(quán)值為5×1=5,則總權(quán)值數(shù)量為45+5=50;隱含層與輸出層的閾值數(shù)量為5+1=6。在IPSO算法中采用實數(shù)值對粒子個體位置進行編碼,維度d即對應(yīng)于權(quán)值數(shù)量與閾值數(shù)量之和,為50+6=56。以下描述IPSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的具體步驟:
步驟1依據(jù)MIV方法,確定影響PM2.5濃度變化的污染物因素和氣象因素,從而確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括輸入層、隱含層和輸出層的節(jié)點數(shù),及相應(yīng)激活函數(shù)、學(xué)習(xí)函數(shù)及訓(xùn)練函數(shù)。
步驟2初始化IPSO算法的初始參數(shù),包括:種群規(guī)模S、權(quán)重最大值wmax、權(quán)重最小值wmin、與網(wǎng)絡(luò)結(jié)構(gòu)對應(yīng)的粒子位置維度d、學(xué)習(xí)因子c1和c2、種群的最大迭代數(shù)Tmax、初始速度和位置、位置和速度范圍[xmin,xmax]和[vmin,vmax]。
步驟3根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)對粒子進行編碼,以對立學(xué)習(xí)機制進行種群初始化。定義粒子適應(yīng)度為BP神經(jīng)網(wǎng)絡(luò)預(yù)測的均方誤差函數(shù)MSE,表示為
(7)
步驟4計算適應(yīng)度,確定當前迭代的全局最優(yōu)解gbest和個體最優(yōu)解pbest;將當前pbest與前次迭代中所經(jīng)歷的局部最優(yōu)作比較,若適應(yīng)度更佳,則更新pbest;然后與全局最優(yōu)作比較,若適應(yīng)度更佳,則更新gbest;否則,均保持不變。
步驟5根據(jù)式(3)和式(5)重新計算Tent混沌值和慣性權(quán)重w,然后分別根據(jù)式(4)和式(2)更新粒子速度和位置。
步驟6判斷個體位置維度是否越界,若出現(xiàn)越界,則以相應(yīng)位置上下限修正粒子位置。
步驟7判斷終止條件,若滿足,返回至步驟4;否則,停止算法迭代,輸出最優(yōu)權(quán)值和閾值。
步驟8以步驟7生成的權(quán)值和閾值對BP神經(jīng)網(wǎng)絡(luò)初始化,并利用訓(xùn)練樣本和測試樣本檢測預(yù)測精度,得到PM2.5濃度預(yù)測值。
由于所篩選的9個預(yù)測因子的量綱不同,衡量單位不一,首先需要對數(shù)據(jù)進行歸一化處理,將所有預(yù)測因子映射至統(tǒng)一區(qū)間[0,1]范圍內(nèi)。利用max-min映射函數(shù)進行數(shù)據(jù)歸一化處理,函數(shù)形式如下
(8)
式中:z*表示預(yù)測因子歸一化處理后的數(shù)值,z表示原始數(shù)值,min表示每個預(yù)測因子的最小值,max表示每個預(yù)測因子的最大值。
基于IPSO-BP模型的PM2.5濃度預(yù)測過程如圖2所示。
圖2 PM2.5濃度預(yù)測過程
通過Matlab進行仿真實驗,選擇傳統(tǒng)BP神經(jīng)網(wǎng) 絡(luò)[10]、傳統(tǒng)粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)PSO-BP[11]以及遺傳優(yōu)化支持向量機GA-SVM[12]這3種預(yù)測模型進行實驗對比分析。對于本文提出的IPSO-BP預(yù)測模型,參數(shù)設(shè)置如下:種群規(guī)模S=50,慣性權(quán)重最大值wmax=0.9,最小值wmin=0.4,兩個學(xué)習(xí)因子c1=c2=1.5,粒子位置范圍[-1,1],速度范圍[-0.02,0.02],最大迭代數(shù)Tmax=400,混沌參數(shù)u=0.7,BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為9-6-1。為了公平性,PSO-BP算法的參數(shù)同上。對于GA-SVM預(yù)測模型的參數(shù)設(shè)置如下:交叉概率pc=0.4,變異概率pm=0.1。支持向量機SVM中,核函數(shù)參數(shù)設(shè)置為0.05,懲罰因子設(shè)置為5,不損失函數(shù)值為0.01,核函數(shù)采用徑向基函數(shù),交叉驗證參數(shù)設(shè)置為5。對于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,其參數(shù)可以使用系統(tǒng)庫中的默認參數(shù)。另外,定義神經(jīng)網(wǎng)絡(luò)的訓(xùn)練目標誤差為10-4,訓(xùn)練次數(shù)為2000次,學(xué)習(xí)率為0.1。
選取環(huán)保部環(huán)境監(jiān)測站空氣質(zhì)量發(fā)布平臺中的提供的數(shù)據(jù)作為驗證算法的數(shù)據(jù)源(通過Adroid手機天氣預(yù)測App即可查詢相應(yīng)數(shù)據(jù)),選取某市在2017年5月1日~2017年7月31日一共92個樣本數(shù)據(jù)進行實驗觀察。具體數(shù)據(jù)包括3個氣象數(shù)據(jù)(最低氣溫、最高氣溫和空氣相對濕度)和大氣中6個污染物濃度數(shù)據(jù)(SO2、CO、O3、NO2、PM10和PM2.5)。數(shù)據(jù)簡況見表1,由于篇幅限制,未將數(shù)據(jù)全部列出。
表1 原始樣本數(shù)據(jù)
表1中,6個污染物濃度數(shù)據(jù)的單位是μg/m3,氣溫單位為℃,濕度為相對濕度,單位%。樣本數(shù)據(jù)值均為日均值。將以上92個樣本數(shù)據(jù)進行歸一化處理后,將數(shù)據(jù)隨機均分為兩組,每組數(shù)據(jù)46個樣本,一組作為訓(xùn)練樣本進行IPSO-BP模型中神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,另一組作為測試樣本檢驗IPSO-BP對于PM2.5濃度預(yù)測的準確性。
除了選取PM2.5濃度的實際值與預(yù)測值、個體適應(yīng)度作為預(yù)測模型的評價指標外,引一步引入平均相對誤差MAPE(單位為%)、平均絕對誤差MAE(單位為μg/m3)和均方根誤差RMSE(單位為μg/m3)進行比較,全方位比較預(yù)測精度。3個指標分別定義為
(9)
(10)
(11)
選取樣本數(shù)據(jù)中一個10天的時間段進行PM2.5濃度預(yù)測,選擇為6月的前10天進行預(yù)測。4種算法的預(yù)測結(jié)果如圖3所示。表2是4種算法的MAPE、MAE和RMSE這3個指標的統(tǒng)計結(jié)果??梢钥吹?,不同的訓(xùn)練方法對于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測精度還是具有較大影響的,IPSO-BP得到的濃度預(yù)測值是4種算法模型中最接近其實際值的,其預(yù)測精度通過改進的粒子群尋優(yōu)性能得到了有效的提升。從平均相對誤差指標上看,僅有本文IPSO-BP和GA-SVM得到的相對誤差在10%以下,小于10%的誤差說明預(yù)測精度是較為可觀的,高于20%的誤差基本可以認為其預(yù)測過程是較為失敗的。除了6月的前10天的預(yù)測數(shù)據(jù),作者還對46個樣本中的剩余36個數(shù)據(jù)進行預(yù)測實驗分析,最終得到平均相對誤差指標低于10%的有28組,剩余8組的MAPE水平介于10%~15%之間,說明高精度預(yù)測占據(jù)全部預(yù)測樣本的80%左右。以上結(jié)果表明IPSO-BP模型在預(yù)測PM2.5濃度上是有效可行的,較3種對比模型可以明顯提升預(yù)測精度。
圖3 PM2.5濃度的實際值與預(yù)測值對比
表2 指標統(tǒng)計結(jié)果
除了預(yù)測精度,進一步通過適應(yīng)度的變化觀察模型的收斂速度和效率表現(xiàn),結(jié)果如圖4所示。由適應(yīng)度式(7)可知,適應(yīng)度取值越小,說明模型對于PM2.5濃度的預(yù)測誤差越小,表明模型性能越優(yōu)秀。從結(jié)果可以看到,本文的IPSO-BP模型得到的適應(yīng)度均值是最小的,且可在約200次迭代時搜索到最優(yōu)值,說明此時求得了神經(jīng)網(wǎng)絡(luò)模型的最優(yōu)權(quán)重和閾值。BP神經(jīng)網(wǎng)絡(luò)模型、PSO-BP模型、GA-SVM模型收斂的迭代數(shù)分別在約310次、280次和250次。綜合來看,對于粒子群優(yōu)化在種群初始化操作、粒子速度更新以及慣性權(quán)重3個方面的改進可以較好改善算法的尋優(yōu)精度和收斂速度,進化更好地實現(xiàn)BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和學(xué)習(xí)過程,對PM2.5濃度做出更精準的預(yù)測。
圖4 模型的適應(yīng)度均值
為了準確預(yù)測空氣中PM2.5的濃度,本文提出在改進粒子群尋優(yōu)精度和效率的基礎(chǔ)上,設(shè)計優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型,進而設(shè)計新的PM2.5濃度預(yù)測模型。具體地,利用改進的粒子群尋優(yōu)機制對BP神經(jīng)網(wǎng)絡(luò)層次間的權(quán)值和閾值進行最優(yōu)化求解,克服其易于陷入局部最優(yōu)、收斂速度慢的不足,最后以配置最優(yōu)參數(shù)的神經(jīng)網(wǎng)絡(luò)進行PM2.5預(yù)測,有效避免神經(jīng)網(wǎng)絡(luò)訓(xùn)練時陷入局部最優(yōu),提升預(yù)測準確度。選取某市一個時段的PM2.5日均濃度數(shù)據(jù)作為樣本進行實驗分析,結(jié)果表明,IPSO-BP不僅收斂速度更快,而且預(yù)測精度更高。進一步的研究可以考慮健全預(yù)測因子,并結(jié)合空間因素對PM2.5濃度進行預(yù)測,從而進一步提升預(yù)測精度。