付彥麗
摘要:針對(duì)使用傳統(tǒng)預(yù)測(cè)方式,對(duì)空氣中PM2.5的質(zhì)量濃度進(jìn)行預(yù)測(cè),難以獲得準(zhǔn)確的結(jié)果這樣的問(wèn)題,提出了一種基于誤差反向傳播神經(jīng)網(wǎng)絡(luò)的PM2.5預(yù)測(cè)方法。將寶雞市空氣質(zhì)量監(jiān)測(cè)站的歷史監(jiān)測(cè)數(shù)據(jù)作為分析對(duì)象,進(jìn)行PM2.5小時(shí)濃度預(yù)測(cè)建模。BP神經(jīng)網(wǎng)絡(luò)能夠使用梯度下降法不斷對(duì)網(wǎng)絡(luò)連接權(quán)值和閾值進(jìn)行修正,針對(duì)PM2.5質(zhì)量濃度預(yù)測(cè)這種非線性的問(wèn)題具備較為精準(zhǔn)的分析處理能力。仿真結(jié)果證明,使用BP神經(jīng)網(wǎng)絡(luò)對(duì)PM2.5質(zhì)量濃度進(jìn)行預(yù)測(cè),其結(jié)果具備一定的有效性和精準(zhǔn)度。
關(guān)鍵詞:PM2.5預(yù)測(cè);誤差反向傳播;神經(jīng)網(wǎng)絡(luò)
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)33-0180-02
1 引言
近年以來(lái),空氣質(zhì)量指數(shù)(air quality index,AQI)已經(jīng)開(kāi)始成為衡量我們生活環(huán)境質(zhì)量最重要的標(biāo)準(zhǔn),而PM2.5則是造成空氣質(zhì)量降低的一個(gè)主要因素。PM即英文Particulate Matter的縮寫(xiě),其中文譯為顆粒物,PM2.5指的是在空氣動(dòng)力學(xué)中,其等效直徑等于或小于2.5微米的大氣顆粒物[1],這種顆粒物也就是我們常說(shuō)的細(xì)微顆粒。PM2.5造成的最直觀的危害就是引發(fā)霧霾天的增加,除此之外,它還能改變降水和氣溫的模式,減少日照以及降低能見(jiàn)度,更會(huì)對(duì)我們的身體健康產(chǎn)生不良的影響[2]。因?yàn)镻M2.5帶來(lái)的這些危害,1997年時(shí),美國(guó)就在空氣質(zhì)量監(jiān)測(cè)標(biāo)準(zhǔn)中加入了PM2.5這一項(xiàng),之后意大利、加拿大、英國(guó)、日本、西班牙等一些國(guó)家,也接連在國(guó)家標(biāo)準(zhǔn)污染物檢測(cè)系統(tǒng)中加入了PM2.5質(zhì)量濃度。而我國(guó)則在2012年將PM2.5檢測(cè)指標(biāo)加入到了《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》中,并對(duì)其濃度進(jìn)行了限制。因此,尋求PM2.5質(zhì)量濃度的預(yù)測(cè)具有極為重要的意義。
2 PM2.5預(yù)測(cè)原理
PM2.5其形成原因復(fù)雜、污染物來(lái)源廣泛,是一種化學(xué)成分復(fù)雜且可變的空氣污染物,其組成成分也并不單一,主要包括了:土壤塵埃、有機(jī)碳、元素碳等一次粒子,以及由各類(lèi)污染物經(jīng)過(guò)各種物理化學(xué)反應(yīng)而形成的銨鹽、硝酸鹽、硫酸鹽和半揮發(fā)性有機(jī)物等二次粒子[3]。所以,PM2.5其本身的濃度與空氣中存在其他污染物的密不可分,故PM2.5質(zhì)量濃度預(yù)測(cè)問(wèn)題,是一個(gè)具有顯著不確定性的非線性問(wèn)題。
對(duì)區(qū)域內(nèi)每小時(shí)的PM2.5濃度進(jìn)行預(yù)測(cè),其原理就是將影響其質(zhì)量濃度因素的歷史檢測(cè)數(shù)據(jù)進(jìn)行預(yù)處理后建模,將歷史數(shù)據(jù)作為訓(xùn)練樣本進(jìn)行訓(xùn)練,最終得到一個(gè)關(guān)系函數(shù),使用該函數(shù)對(duì)未來(lái)某時(shí)刻的PM2.5進(jìn)行預(yù)測(cè),其公式如下:
3 BP神經(jīng)網(wǎng)絡(luò)
BP是Back Propagation的英文縮寫(xiě),譯為反向傳播,BP算法是在20世紀(jì)80年代中期提出的,之后Geoffrey Hinton、David Rnmelhart等人在其基礎(chǔ)上又研究發(fā)展出了BP神經(jīng)網(wǎng)絡(luò),也就是使用BP算法的神經(jīng)網(wǎng)絡(luò),簡(jiǎn)稱(chēng)BP網(wǎng)絡(luò)。BP算法的主要特點(diǎn)是,使用了度下降法在誤差向后傳播的過(guò)程中不斷對(duì)網(wǎng)絡(luò)的閾值和連接權(quán)值這些參數(shù)進(jìn)行修改,使得網(wǎng)絡(luò)的輸出結(jié)果不斷向期望值靠攏[4],其網(wǎng)絡(luò)的主要特點(diǎn)是:輸入信號(hào)正向傳播、誤差信號(hào)反向傳遞,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示:
從圖1中可以看出,BP神經(jīng)網(wǎng)絡(luò)一共有輸入層(input layer)、隱含層(hidden layer)、輸出層(output)三層,其中隱含層的數(shù)量可以是一層也可以是多層,輸入量和輸出量的維度,決定了輸入層和輸出層神經(jīng)元的個(gè)數(shù)。輸入量[X=[x1, x2,x3,…, xi]]由輸入層輸入到網(wǎng)絡(luò)中,在隱含層中進(jìn)行逐層處理后,最后得到輸出值。整個(gè)BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練可以被分為兩個(gè)階段:輸入信號(hào)正向傳播、誤差信號(hào)反向傳播,這兩個(gè)階段在迭代的過(guò)程中不斷被交替執(zhí)行,最終完成整個(gè)網(wǎng)絡(luò)的訓(xùn)練[5]。
當(dāng)輸入信號(hào)正向傳播時(shí),我們選中的影響因子數(shù)據(jù)會(huì)從輸入層進(jìn)入到網(wǎng)絡(luò)中,然后經(jīng)過(guò)各層的加權(quán)求和以及激活函數(shù)的各種變換后,再由輸出層輸出,此時(shí)每一層神經(jīng)元的輸入只受前一層神經(jīng)元輸出的影響,并且網(wǎng)絡(luò)的權(quán)值和閾值不會(huì)發(fā)生變化;當(dāng)網(wǎng)絡(luò)得到的輸出結(jié)果yd與期望得到的記過(guò)ye之間的誤差沒(méi)有達(dá)到目標(biāo)時(shí),則會(huì)進(jìn)入誤差信號(hào)反向傳播的階段,誤差信號(hào)由輸出層延原網(wǎng)絡(luò)方向向輸入層逐層反向傳播,在這個(gè)階段中網(wǎng)絡(luò)的權(quán)值和閾值會(huì)根據(jù)誤差的梯度值進(jìn)行調(diào)整,逐步降低網(wǎng)絡(luò)的輸出結(jié)果和期望結(jié)果的誤差,向期望值逼近,這樣兩個(gè)階段不斷的循環(huán)迭代,最終得到網(wǎng)絡(luò)的期望輸出。
4 基于BP神經(jīng)網(wǎng)絡(luò)的PM2.5預(yù)測(cè)仿真
使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)分析,首先需要確定網(wǎng)絡(luò)每層的神經(jīng)元的個(gè)數(shù),其輸入層神經(jīng)元個(gè)數(shù)是由選擇的影響因子的個(gè)數(shù)來(lái)確定的,本預(yù)測(cè)中選取了6個(gè)影響因子,故輸入層網(wǎng)絡(luò)的神經(jīng)元個(gè)數(shù)為6;輸出層神經(jīng)元個(gè)數(shù)是由輸出結(jié)果的數(shù)量決定的,本預(yù)測(cè)中只需要輸出PM2.5的預(yù)測(cè)值,故輸出層神經(jīng)元個(gè)數(shù)為1。神經(jīng)網(wǎng)絡(luò)的隱含層,可以是一層也可以是多層,但是隱含層過(guò)多會(huì)導(dǎo)致網(wǎng)絡(luò)的訓(xùn)練速度過(guò)慢,還會(huì)造成網(wǎng)絡(luò)過(guò)擬合現(xiàn)象,使得網(wǎng)絡(luò)擬合結(jié)果和測(cè)試結(jié)果相差過(guò)大,根據(jù)Kosmogorov定理,當(dāng)網(wǎng)絡(luò)參數(shù)及結(jié)構(gòu)設(shè)計(jì)合理時(shí),單隱含層的神經(jīng)網(wǎng)絡(luò)就可以完成任意m維到n維的映射[6],故本預(yù)測(cè)中選擇單一隱含層。隱含層的神經(jīng)元的數(shù)量可以說(shuō)是一個(gè)神經(jīng)網(wǎng)絡(luò)中最難以確定的,通常是使用試錯(cuò)法加上經(jīng)驗(yàn)公式來(lái)確定的,其經(jīng)驗(yàn)公式如下:
根據(jù)表2中的結(jié)果可以發(fā)現(xiàn),當(dāng)隱含層神經(jīng)元個(gè)數(shù)為9時(shí),網(wǎng)絡(luò)的訓(xùn)練誤差最小為18.27,故確定隱含層神經(jīng)元的個(gè)數(shù)為9。
5 Matlab下PM2.5預(yù)測(cè)仿真
在Matlab下對(duì)PM2.5每小時(shí)的質(zhì)量濃度進(jìn)行預(yù)測(cè)分析,BP神經(jīng)網(wǎng)絡(luò)采用6-9-1的結(jié)構(gòu),也就是輸入層、隱含層、輸出層的神經(jīng)元數(shù)量分別是6個(gè)、9個(gè)、1個(gè),確定隱含層、輸出層、訓(xùn)練及閾值和權(quán)值學(xué)習(xí)函數(shù)分別選擇logsig、purelin、traingdx、learngd,網(wǎng)絡(luò)迭代100次。將采集的800條歷史數(shù)據(jù)進(jìn)行篩選后,將其中的640條作為訓(xùn)練集數(shù)據(jù)、160條作為測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,得到如下結(jié)果: