馮曉秀,高志文,李風軍,虎雪嬌
1.寧夏大學數(shù)學計算機學院,寧夏 銀川 750021
2.西安建筑科技大學環(huán)境與市政工程學院,陜西 西安 710055
基于LS?SVR、BP?ANN和MLR模型的PM10濃度預測
馮曉秀1,高志文1,李風軍1,虎雪嬌2
1.寧夏大學數(shù)學計算機學院,寧夏 銀川 750021
2.西安建筑科技大學環(huán)境與市政工程學院,陜西 西安 710055
利用寧東能源化工基地PM10和氣象監(jiān)測數(shù)據(jù),分別采用LS?SVR、BP?ANN和傳統(tǒng)MLR模型預測PM10濃度變化。結果表明,較BP?ANN模型、MLR模型,LS?SVR模型能更好地刻畫PM10濃度與各氣象因素間的非線性相依關系,更準確地預測PM10濃度。
LS?SVR;BP?ANN;MLR;PM10;預測
為了解未來空氣質量狀況,合理安排工作與出行,環(huán)境空氣質量預測和預報具有重要意義[1?7]。環(huán)境空氣質量已有的預測方法[1?4]基本上需要構造影響因素與預測結果間的函數(shù)關系,并合理確定權重值。多元線性回歸(MLR)模型[1?2],可以對一些線性關系的濃度變化趨勢進行很好的預測,而對PM10濃度與氣象條件之間呈較強的非線性關系的情況就具有很大的局限性。人工神經(jīng)網(wǎng)絡(ANN),雖可以克服這一缺陷,能建立非常復雜的非線性映射,較好地反映PM10濃度與氣象參數(shù)之間的非線性關系,但其拓撲結構需要結合經(jīng)驗試湊,很難小樣本訓練,在訓練過程中易陷入局部極小值。
支持向量機(SVM)以小樣本的統(tǒng)計學習理論(SLT)為基礎,具有簡潔的數(shù)學形式、直觀的幾何解釋以及良好的泛化能力,有效避免了局部極值,克服了“維數(shù)災難”,且人為設置的參數(shù)少,便于使用。最小二乘優(yōu)化的支持向量回歸機(LS? SVR)已廣泛應用于圖像噪聲處理、結構探傷等研究領域[9?11],但在環(huán)境領域的應用鮮有報道。該文以寧東能源化工基地PM10濃度為例,分別利用基于LS?SVR、帶誤差反傳算法(BP)的ANN及MLR進行PM10的預測和比較分析,以期為空氣質量預測預報探索適合的模型算法。
1.1 SVR原理
利用SVM解決非線性映射問題與分類問題類似,還是通過引入核函數(shù)將低維的非線性回歸問題轉化為高維的線性回歸問題。其原理是根據(jù)給定的訓練集:
式中:xi∈X=Rn是輸入,yi∈Y=R是輸出,尋找一個實值函數(shù)f(x),并用來推斷任一輸入x所對應的輸出y[9]。分類問題所求的超平面,實際上就是回歸問題的解。這樣的SVM稱為支持向量回歸機(SVR)。
SVM的拓撲的結構與一個3層前饋神經(jīng)網(wǎng)絡的結構類似。其中隱層節(jié)點對應于輸入樣本與一個支持向量的內積核函數(shù),而輸出節(jié)點對應于隱層輸出的線性組合。圖1給出了SVM的拓撲結構示意圖。
圖1 SVM拓撲結構
回歸問題的求解可利用最小二乘法,用以加快求解速度,能更好更快地進行預報,這樣的模型稱為LS?SVR[9]。
1.2 數(shù)據(jù)源
利用寧東環(huán)境監(jiān)測站4個環(huán)境空氣點位的PM10濃度小時值,監(jiān)測時段分別為冬季(2012年1月1—31日)、春季(2012年3月15日至4月15日)、夏季(2012年6月10日至7月15日)、秋季(2012年8月20日至9月22日),每天監(jiān)測24 h。同時收集氣象數(shù)據(jù)包括風速、溫度、相對濕度、日照、降雨量等。所有的模型選取其中的1 000組原始數(shù)據(jù)用于學習訓練,另外選取800組數(shù)據(jù)用于驗證。
2.1 輸入信號選取
大氣顆粒物PM10的濃度受多種氣象條件的影響,通過參考文獻[3?5]以及實地調研,決定選取的輸入?yún)?shù)有初始濃度風速(v,m/s)、溫度(T,℃)、相對濕度(H,%)、壓力(p,kPa)、降雨量(R,mm)、日照(S,h)。
2.2 LS?SVR預測模型
采用Matlab7.8建立LS?SVR模型,LS?SVR模型中的核函數(shù)一般需要構造,且必須滿足Mercer定理,考慮到適用性以及便捷性,選取徑向基函數(shù)中的Gauss函數(shù):
式中:xi為訓練數(shù)據(jù)點,σ為函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍,這一寬度越小,就越具有選擇性[1]。
建立模型時要對搜集到的輸入數(shù)據(jù)進行歸一化,常用的歸一化函數(shù)有指數(shù)函數(shù)法、最大最小值法[3]等,研究采用最大最小值法進行歸一化處理。歸一化處理后,使用交叉驗證的方法選擇參數(shù)(σ,c)=(10,5)作為模型參數(shù)對模型進行訓練和驗證,最后通過計算預測結果的相對誤差來評價模型精度。
2.3 BP?ANN預測模型
利用Matlab7.8中的ANN工具箱建立BP?ANN預測模型。BP?ANN預測模型中輸入信號與LS?SVR模型相同,即輸入層有7個節(jié)點;輸出層為PM10濃度,所以只有一個節(jié)點;隱層節(jié)點的選取利用經(jīng)驗公式
式中:n為輸入層神經(jīng)元數(shù),m為輸出層神經(jīng)元數(shù)[11]。傳遞函數(shù)選取最常用的S型函數(shù):
2.4 MLR預測模型
利用Matlab 7.8統(tǒng)計工具箱建立MLR模型,來與LS?SVR及BP?ANN建立的模型進行比較。利用的多元線性回歸模型如下:
式中:xi為第i個輸入變量的值;y為實測PM10濃度;常數(shù)項b0和回歸系數(shù)bi通過最小二乘法獲得;εi為回歸誤差,回歸求解的過程事實上就是使平均誤差ε最小的過程。
3.1 模型精度比較
表1給出了3種模型的預測統(tǒng)計結果,在方差相同的情況下,LS?SVR模型的預測相對誤差最小,命中率最高。
表1 預測統(tǒng)計結果
圖2給出了3種模型預測值與實測值相關性,圖2(a)、圖2(b)、圖2(c)分別為MLR、BP?ANN、LS?SVR預測模型的結果。經(jīng)顯著性水平α=0.05相關系數(shù)顯著性檢驗后,MLR預測模型的相關系數(shù)(r)僅為0.50,BP?ANN預測模型R為0.83,LS?SVR預測模型(r)最高為0.97,且斜率也更接近于1,說明該模型預測值與實測值具有顯著相關性。
圖3利用全年實測值以及各模型預測值的24 h各時刻均值,展示了各模型在時間序列下的擬合程度,其誤差比較見表2??梢?,LS?SVR預測模型曲線更切合實測值曲線,能更好地預測PM10濃度變化;BP?ANN模型整體預測效果也較為理想,但是傍晚時段的預測結果偏差較大;MLR預測模型與實際結果的擬合程度相差太多,該模型僅僅能預測PM10濃度的平均變化趨勢。
圖3 預測值與實際測量值全年24 h變化
表2 不同預測模型的誤差比較
3.2 影響因素分析
因為LS?SVR、BP?ANN模型均為非線性映射,所以無法直接輸出每個影響參數(shù)的權值大小,但由MLR預測模型可粗略看出各參數(shù)影響。利用Matlab7.8統(tǒng)計工具箱建立的MLR預測模型如下:
式中:ρ(PM10)為預測質量濃度,ρ(PM010)為初始質量濃度,可見,初始濃度、降雨量、風速、溫度、壓力等是影響PM10濃度的重要因素。
利用LS?SVR模型進行預測,給出了不同降雨量下大氣顆粒物PM10濃度模擬值的24 h變化,見圖4。
圖4 不同降雨量下PM10濃度模擬值的24 h變化
降雨量增加可以明顯降低PM10濃度,平均減少量為17.28%。但是如果繼續(xù)增加降雨量,PM10濃度減少量也將會下降,不會呈現(xiàn)等差比例的下降。說明可以通過增加降水或者類降水(灑水車)的方法來降低PM10濃度。PM10濃度影響因素有很多,各因素之間是一種非線性關系,所以當降水的影響因素飽和之后,它的影響將逐漸減少,而其他因素將會占主導地位,這也是持續(xù)增加降水量PM10濃度減少量變小的原因。
較BP?ANN模型、傳統(tǒng)的MLR模型,LS?SVR預測模型可以很好預測大氣顆粒物PM10濃度,可以作為預測PM10濃度的首選算法??刂聘魑廴驹矗ㄈ缁痣?、煤礦、煤化工等)的排放,增加降水或者類降水可有效降低PM10濃度。
[1]石靈芝.城市大氣顆粒物PM10源解析與濃度預測及氣象因素影響研究[D].長沙:中南大學,2011.
[2]石靈芝,鄧啟紅,路嬋,等.基于BP人工神經(jīng)網(wǎng)絡的大氣顆粒物PM10質量濃度預測[J].中南大學學報:自然科學版,2012.5,43(5):1 969?1 974.
[3]周國亮,劉希玉,武魯英.BP神經(jīng)網(wǎng)絡模型在空氣質量級別評價中的應用[J].計算機工程與設計,2009,30(2):392?394.
[4]王燦星,侯樹強.杭州市區(qū)大氣中PM10等污染物的預測研究[J].儀器儀表學報,2004,25(4):780?781.
[5]龔識懿,馮加良.上海地區(qū)大氣相對濕度與PM10濃度和大氣能見度的相關性分析[J].環(huán)境科學研究,2012,25(6):628?632.
[6]殷永文,程金平,段玉森,等.上海市霾期間PM2.5、PM10污染與呼吸科、兒童呼吸科門診人數(shù)的相關分析[J].環(huán)境科學,2011,32(7):1 894?1 898.
[7]包貞,馮銀廠,焦荔,等.杭州市大氣PM2.5和PM10污染特征及來源解析[J].中國環(huán)境監(jiān)測,2010,26(2):44?48.
[8]Tecer L H.Prediction of SO2and PM10concentrations in a coastal mining area using an artificial neural network[J].Polish Journal of Environmental Studies,2007,16(4):633?638.
[9]漸令.支持向量機在高爐爐溫預報中的應用[D].杭州:浙江大學,2006.
[10]孫紅星,趙楠楠,徐心和.基于SVM的模糊推理在圖像降噪中的建模與仿真[J].系統(tǒng)仿真學報,2006,18(26):3 276?3 279.
[11]韓立群.人工神經(jīng)網(wǎng)絡教程[M].北京:北京郵電大學出版社,2007.
[12]Mouhammd A,Alaa F S,Hossam F.Prediction of PM10and TSP airpollution parametersusing artificial network autoregressive,external input model:a case syudy in Salt,Jordan[J].Middle?East Journal of Scientific Research,2013,14(7):999?1 009.
[13]Ana R,F(xiàn)rank R,Pedro G L.Air quality prediction using neural networks with stochastic variables[J]. Atmospheric Environment,2013(79):822?830.
Prediction of PM10Concentrations Based on LS?SVR,BP?ANN and MLR Models
FENG Xiao?xiu1,GAO Zhi?wen1,LI Feng?jun1,HU Xue?jiao2
1.School of Mathematics and Computer Science,Ningxia University,Yinchuan 750021,China
2.College of Environmental and Municipal Engineering,Xi’an University of Architecture and Technology,Xi’an 710055,China
Using ambient PM10concentrations and meteorological data of Ningdong Energy and Chemistry Industry Base,predicted PM10concentrations variation based on LS?SVR,BP?ANN and traditional MLR models,respectively.It was shown that the LS?SVR model could better depict the nonlinear dependency relationship between PM10concentrations and meteorological factors,more accurately predict PM10concentrations,comparing to BP?ANN and MLR.
LS?SVR;BP?ANN;MLR;PM10;prediction
X831.03
A
1002?6002(2014)06?0138?04
2013?11?20;
2014?04?14
國家自然科學基金資助項目(61063020,11261042)
馮曉秀(1990?),女,寧夏鹽池人,在讀碩士研究生.
李風軍