【摘 要】環(huán)保監(jiān)測(cè)數(shù)據(jù)的更新是一個(gè)不斷變化的動(dòng)態(tài)過程,隨著數(shù)據(jù)量的增加,數(shù)據(jù)所反映的信息也更加完善,給人民的生活和生產(chǎn)帶來了重要的影響。利用灰色GM(1,1)系統(tǒng)建模理論和新陳代謝建模原理,建立基于動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的灰色GM(1,1)新陳代謝模型。該模型根據(jù)空氣質(zhì)量指數(shù)的動(dòng)態(tài)數(shù)據(jù)更新,去掉舊數(shù)據(jù)加入新數(shù)據(jù),弱化了對(duì)數(shù)據(jù)服從怎樣統(tǒng)計(jì)規(guī)律這一要求,避免了模型與數(shù)據(jù)統(tǒng)計(jì)規(guī)律不適應(yīng)的難題,使得模型預(yù)測(cè)精度較傳統(tǒng)GM(1,1)、線性模型及BP神經(jīng)網(wǎng)絡(luò)模型要好得多。
【關(guān)鍵詞】空氣質(zhì)量 GM(1,1)模型 線性模型BP 神經(jīng)網(wǎng)絡(luò)
【中圖分類號(hào)】TV139.1 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1674-4810(2015)27-0032-02
空氣質(zhì)量指數(shù)(Air Quality Index,簡(jiǎn)稱AQI)是定量描述空氣質(zhì)量狀況的無量綱指數(shù),通過空氣質(zhì)量指數(shù)的變化可直觀地評(píng)價(jià)大氣環(huán)境的質(zhì)量狀況,并對(duì)空氣污染的控制和管理進(jìn)行指導(dǎo)。目前,我國(guó)已有367個(gè)城市建立了全國(guó)城市空氣質(zhì)量日?qǐng)?bào)和小時(shí)報(bào)制度,實(shí)時(shí)公布相應(yīng)城市的空氣質(zhì)量指數(shù)、級(jí)別和首要污染物,為工農(nóng)業(yè)生產(chǎn)和人民生活提供幫助。因此,對(duì)空氣質(zhì)量指數(shù)的預(yù)測(cè)研究在實(shí)際生產(chǎn)和生活中顯得非常重要。
一 模型選擇分析
目前,監(jiān)測(cè)部門對(duì)環(huán)境監(jiān)測(cè)數(shù)據(jù)只是在實(shí)時(shí)更新相關(guān)環(huán)境指標(biāo)數(shù)據(jù),沒有對(duì)其相應(yīng)的指標(biāo)進(jìn)行預(yù)測(cè),這給人民生活和工業(yè)生產(chǎn)造成了一定的影響。例如,居民如果不知道明天的PM2.5的預(yù)測(cè)濃度,也就不能對(duì)明天的生活進(jìn)行合理地安排。環(huán)保部門沒有對(duì)未來幾天空氣質(zhì)量指數(shù)及空氣污染指數(shù)的預(yù)測(cè)數(shù)據(jù),從而不能對(duì)一些工業(yè)生產(chǎn)進(jìn)行有效地控制,一定程度上造成處于被動(dòng)的局面。
對(duì)空氣質(zhì)量指數(shù)的預(yù)測(cè)研究大多利用統(tǒng)計(jì)學(xué)知識(shí)從大量數(shù)據(jù)中找到數(shù)據(jù)變化規(guī)律,再利用此規(guī)律找到匹配的數(shù)學(xué)模型。采用較多的預(yù)測(cè)模型主要有線性回歸模型、自回歸求和滑動(dòng)平均模型(ARIMA)、自回歸條件異方差類模型(ARCH類)、神經(jīng)網(wǎng)絡(luò)方法、灰色預(yù)測(cè)模型。這些模型存在兩方面的不足:一是這些模型建模過程中的數(shù)據(jù)均固定不變,沒有體現(xiàn)數(shù)據(jù)的不斷更新;二是在選模型之前首先統(tǒng)計(jì)分析數(shù)據(jù)規(guī)律,若得出的規(guī)律與模型的適用性不匹配則仍用該模型進(jìn)行建模預(yù)測(cè)難度較大,模型選擇失效。
為克服這兩點(diǎn)不足,將動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)原理與新陳代謝理論相結(jié)合,建立基于動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的灰色GM(1,1)新陳代謝模型,該模型在不斷補(bǔ)充新信息的同時(shí),要及時(shí)地去掉舊信息,使數(shù)據(jù)不斷更新;同時(shí),該模型解決了建模運(yùn)算量不斷增大的困難,GM(1,1)模型對(duì)數(shù)據(jù)服從怎樣統(tǒng)計(jì)規(guī)律這一要求較弱,避免了模型與數(shù)據(jù)統(tǒng)計(jì)規(guī)律不適應(yīng)的難題。
二 模型選擇與建立
在環(huán)保部網(wǎng)站選取2014年12月1日到2015年6月19日四川省瀘州市空氣質(zhì)量指數(shù)共199個(gè)數(shù)據(jù)建模,預(yù)測(cè)2015年6月20日至2015年6月29日共10個(gè)數(shù)據(jù),分析模型預(yù)測(cè)。
1.灰色GM(1,1)模型
設(shè)原始數(shù)據(jù)序列為嚴(yán)格的指數(shù)序列,即:x(0)(k)=Ae-a(k-1),k=1,2,…N
建立GM(1,1)模型最終擬合結(jié)果為:
利用MATLAB7.0編程,建立GM(1,1)模型,預(yù)測(cè)結(jié)果見表1:
————————————————————————
* 瀘州市社科聯(lián)2015年哲學(xué)社會(huì)科學(xué)研究規(guī)劃項(xiàng)目(LZ15A17)、四川省教育廳2014年度科學(xué)研究計(jì)劃項(xiàng)目(14ZB0397)、瀘州職業(yè)技術(shù)學(xué)院2013年度院級(jí)科研資助金項(xiàng)目(K-1302)
2.基于動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的灰色GM(1,1)新陳代謝模型
定義:設(shè)原始序列X(0)=(x(0)(1),x(0)(2),…x(0)(n))。(1)用X(0)=(x(0)(1),x(0)(2),…x(0)(n))建立傳統(tǒng)GM(1,1)模型稱為GM(1,1);(2) ,用X(0)=(x(0)(k0),x(0)(k0+1),…x(0)(n))建立的GM(1,1)模型稱為部分?jǐn)?shù)據(jù)GM(1,1)模型;(3)設(shè)x(0)(n+1)為最新信息,將x(0)(n+1)加入到X(0)中,再利用X(0)=(x(0)(1),x(0)(2),…x(0)(n+1))建立的GM(1,1)模型稱為新信息GM(1,1);(4)加入最新信息x(0)(n+1),刪除最老的信息x(0)(1),將這個(gè)過程稱為新陳代謝。利用新陳代謝理論和數(shù)據(jù)X(0)=(x(0)(2),x(0)(3),…x(0)(n+1))建立的GM(1,1)模型稱為基于動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的灰色GM(1,1)新陳代謝模型。
該模型隨著舊的數(shù)據(jù)刪除,新的數(shù)據(jù)加入,數(shù)據(jù)序列得到不斷更新,雖然數(shù)據(jù)總量和建模方法未發(fā)生變化,但是在新舊數(shù)據(jù)的更換過程中使得數(shù)據(jù)特征發(fā)生量變甚至質(zhì)變,新形成的數(shù)據(jù)序列更能反映當(dāng)前數(shù)據(jù)的特征,因此新陳代謝方法是可行的。根據(jù)灰色GM(1,1)模型中的步驟進(jìn)行,利用Matlab7.0編程可得預(yù)測(cè)數(shù)據(jù),預(yù)測(cè)結(jié)果見表1。
3.線性回歸模型
為與其他預(yù)測(cè)效果進(jìn)行比較,利用Eviews5.0軟件建立自回歸AR模型,該模型為線性模型,其參數(shù)估計(jì)方法為普通的最小二乘法。預(yù)測(cè)結(jié)果見表2。
X(t)=104.6622621+0.7883649588*X(t-1)+εt,t=2,…199。
X(t)為原始數(shù)據(jù)t時(shí)刻數(shù)據(jù),εt為隨機(jī)擾動(dòng)項(xiàng)。
4.神經(jīng)網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)模型是利用某種連接方法將各信息處理部分連接為一個(gè)計(jì)算系統(tǒng),該系統(tǒng)對(duì)進(jìn)入的信息進(jìn)行處理,通過處理后的信息模擬類似人腦的神經(jīng)網(wǎng)絡(luò)。使用該模型網(wǎng)絡(luò)對(duì)信息進(jìn)行分析和建模。該神經(jīng)網(wǎng)絡(luò)模型具有較高的非線性擬合能力和良好的泛化能力,對(duì)非線性數(shù)據(jù)具有較高的擬合度。瀘州市空氣質(zhì)量指數(shù)數(shù)據(jù)有非線性特征,故采用三層BP神經(jīng)網(wǎng)絡(luò)模型對(duì)其擬合和預(yù)測(cè),預(yù)測(cè)結(jié)果見表1。BP神經(jīng)網(wǎng)絡(luò)模型調(diào)用格式如下:net=newff([-11;-11],[2,5],{'tansig','pureline'},'trainbr','learngdm','msereg')
三 預(yù)測(cè)結(jié)果比較和結(jié)論
1.預(yù)測(cè)結(jié)果
用均方誤差和平均絕對(duì)百分比誤差來分析模型預(yù)測(cè)效果,預(yù)測(cè)結(jié)果及比較見表1。
表1 各模型預(yù)測(cè)結(jié)果
日期真值線性模型BP神經(jīng)網(wǎng)絡(luò)模型GM(1,1)模型新陳代謝GM(1,1)模型
6.207088777373
6.217391817272
6.225094837271
6.234996867269
6.245598897268
6.255399697167
6.2655101737166
6.2762101767165
6.2869102807164
6.2968103837063
表2 預(yù)測(cè)效果比較
MSE38.352322.020414.074811.8152
MAPE64.510134.778521.091217.7961
2.結(jié)論
第一,因原始數(shù)據(jù)成非線性特征,若采用線性模型進(jìn)行擬合預(yù)測(cè),會(huì)造成建模偏差,使得預(yù)測(cè)誤差加大,甚至失去可靠性。第二,在采用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行建模預(yù)測(cè)時(shí),考慮了數(shù)據(jù)的非線性特征,預(yù)測(cè)精度優(yōu)于線性模型。但受數(shù)據(jù)量較小的影響,神經(jīng)網(wǎng)絡(luò)建立不夠完善,因此此模型預(yù)測(cè)精度較基于動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的灰色GM(1,1)新陳代謝模型預(yù)測(cè)精度較差。第三,在利用基于動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的灰色GM(1,1)新陳代謝模型建模過程中既考慮了數(shù)據(jù)的實(shí)時(shí)更新,又能將老的信息及時(shí)刪除并增加新信息在系統(tǒng)中,盡量讓建模數(shù)據(jù)充分反映數(shù)據(jù)的最新特征,其預(yù)測(cè)精度優(yōu)于線性模型、BP神經(jīng)網(wǎng)絡(luò)模型及GM(1,1)模型。第四,使用基于動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的灰色GM(1,1)新陳代謝模型對(duì)瀘州市空氣質(zhì)量指數(shù)進(jìn)行動(dòng)態(tài)預(yù)測(cè)分析,可以及時(shí)掌握空氣質(zhì)量指數(shù)的變化,根據(jù)預(yù)測(cè)數(shù)據(jù)采取相應(yīng)措施應(yīng)對(duì)環(huán)境的變化。
參考文獻(xiàn)
[1]鄧聚龍.灰色理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2002
[2]李夢(mèng)梅、朱家明、楊光等.西安市環(huán)境空氣質(zhì)量評(píng)價(jià)與預(yù)測(cè)[J].貴州師范學(xué)院學(xué)報(bào),2014(3):11~15
[3]張延利、張德生、井霞霞等.基于無偏灰色馬爾科夫模型的人民幣/美元匯率短期預(yù)測(cè)模型[J].陜西科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2011(6):135~139
[4]楊建剛、儲(chǔ)慶中.對(duì)人工智能未來發(fā)展的幾點(diǎn)思考[J].甘肅科技縱,2006(6):125~126
[5]王夢(mèng)冬.人民幣匯率短期組合預(yù)測(cè)研究[D].天津大學(xué),2008
〔責(zé)任編輯:林勁〕