李曉英+蘇志偉+周華+賈曉菲+葉根苗+蔡晨凱
摘要:針對城市需水預測模型中需水量影響因子多、影響因子之間普遍存在多重共線問題,以及BP神經網絡收斂速度慢、易陷入局部最優(yōu)等缺點,提出一種由主成分分析、遺傳算法及BP神經網絡三者相結合的改進預測模型。以泰州市為實例,建立以主成分分析篩選需水量主要影響因子,遺傳算法優(yōu)化BP網絡連接權值和閾值的需水預測模型,預測結果與BP神經網絡預測模型預測結果做對比。結果表明:改進預測模型對泰州市2003-2014年需水量預測的平均相對誤差為0564%,最大相對誤差為1681%,精度優(yōu)于BP神經網絡預測模型;改進預測模型預測值與實際泰州市需水量吻合良好且訓練速度更快、預測精度更高,可作為需水預測的一種有效方法。
關鍵詞:主成分分析;BP神經網絡;遺傳算法;GABP模型;需水預測
中圖分類號:TV211文獻標識碼:A文章編號:
16721683(2017)06003906
Abstract:There are too many impact factors of water demand in the urban water demand prediction model and most of the factors are multicollinearBesides,the BP neural network has slow convergence rate and easily gets into a local optimumTo tackle these problems,we proposed an improved prediction model by combining the principal component analysis (PCA),genetic algorithm (GA),and back propagation neural network (BPNN)Taizhou city was taken as a case for studyWe established a water demand prediction model that selects the main impact factors of water demand by principal component analysis and optimizes the connection weights and thresholds of the BP neural network by genetic algorithmThe BP neural network prediction model was set up as the contrast modelThe results showed that the average relative error and the maximum relative error of water demand prediction by the improved model in 20032014 in Taizhou city were 0564% and 1681% respectivelyThe precision was superior to that of the BP neural network prediction modelThe results predicted by the GABP model matched with the actual water demand data of Taizhou city,and the model had faster calculation speed and higher precisionIt can be used as an effective method for water demand prediction
Key words: principal component analysis;BP neutral network;genetic algorithm;GABP model;water demand prediction
需水預測是一個由區(qū)域總人口、產業(yè)結構、各產業(yè)發(fā)展水平、社會經濟發(fā)展程度等共同作用的多因素、多層次復雜非線性系統(tǒng)[1]?,F有的需水預測方法主要有粒子群算法、人工神經網絡、灰色模型理論、小波神經網絡、回歸分析模型、支持向量機、隨機森林模型等[29],目前尚不存在公認的普適性預測方法。城市需水量是一個受諸多因素影響的變量,因其外生變量(城市人口、產業(yè)結構等)受人為規(guī)劃和實踐的影響,具有較強的不確定性和模糊性[10]。自JMBates等[11]在1969年提出組合預測模型的理論及方法以來,已有許多學者應用組合模型進行城市需水預測。鞏琳琳[12]采用遺傳模擬退火算法的神經網絡模型對陜西省進行需水預測,有效提高了預測精度;舒媛媛等[13]采用基于主成分分析的BP神經網絡預測模型對延安市進行預測分析,有效簡化了網絡;崔東文[14]將相空間重構原理與遺傳算法相結合,建立了城市需水預測模型,消除了變量間的多重共線問題,有效提高了預測精度;張倩等[15]將灰色理論和回歸分析相結合,對大鵬半島進行了需水預測。已有研究中,對于人工神經網絡收斂速度慢、易陷入局部最優(yōu)等問題的處理有待進一步優(yōu)化。為此,本文針對上述問題,提出了基于主成分分析的GABP需水預測模型,即通過主成分分析篩選出需水量主要影響因子,達到簡化網絡結構的目的;采用遺傳算法優(yōu)化BP神經網絡的連接權值和閾值,達到提高網絡收斂速度及避免網絡陷入局部最優(yōu)的目的,為城市需水預測提供一種新的思路方法。
第15卷 總第93期·南水北調與水利科技·2017年12月
李曉英等·基于主成分分析的GABP模型在城市需水預測中的應用endprint
1方法原理
11主成分分析法
主成分分析法是通過數學降維方法,從眾多原始變量中找出幾個綜合性強的變量來替代原始變量,這些綜合性強的幾個變量彼此間互不相關且能盡可能地反映原始變量的信息量。
主成分分析計算步驟[16]如下。
步驟1:對原始數據進行標準化處理并計算其相關系數矩陣。
步驟2:計算特征值與特征向量。求出相關系數矩陣的特征值λi(i=1,2,…,p),并使其按大小順序排列,即λ1≥λ2≥…≥λp≥0,然后分別求出對應于特征值的特征向量ei(i=1,2…,p),其中p為相關系數矩陣的階數。
步驟3:計算主成分貢獻率與累計貢獻率。經過篩選分析,選取累計貢獻率達到85%以上的因子作為需水量的主要影響因子即主成分。
步驟4:計算主成分載荷。表示原始數據的協(xié)方差矩陣的特征值。
12BP神經網絡
BP神經網絡[17]的學習過程分為兩個階段,正向學習階段和反向學習階段。其學習規(guī)則采用梯度下降算法,輸入向量首先正向傳遞到隱含層,經過傳遞函數計算,將結果傳遞到輸出層即得到輸出結果。若實際輸出結果與期望輸出結果存在誤差時,則進行誤差反向傳遞,根據預測誤差來調整網絡權值與閾值,從而使BP神經網絡預測輸出不斷逼近期望誤差,最終達到設定期望誤差或設定學習次數作為網絡學習終止條件。BP神經網絡訓練過程基本步驟如下。
步驟1: 初始化網絡。包括網絡輸入向量確定、隱含層數確定、輸出層確定、權值和閾值的初始化。
步驟2: 隱含層輸出計算。由輸入向量、權值及閾值計算隱含層輸出。
步驟3: 輸出層輸出計算。由隱含層輸出及權值與閾值,計算神經網絡的預測輸出。
步驟4: 預測誤差計算。由輸出層輸出與期望輸出作差即得到預測誤差。
步驟5: 權值、閾值更新。由預測誤差反向傳遞更新網絡的權值、閾值。
步驟6: 由終止條件判斷迭代是否結束,若沒有結束,則返回步驟2。
13GABP神經網絡模型
遺傳算法和BP神經網絡均具有極強解決問題的能力[1822],遺傳算法優(yōu)化BP神經網絡是采用遺傳算法來優(yōu)化BP神經網絡的初始值與閾值,使優(yōu)化后的BP神經網絡能夠更好地預測函數輸出。網絡建立步驟如下[23]。
步驟1: 確定編碼長度S及輸入層個數R、隱含層個數S1、輸出層個數S2。
S=R·S1+S1·S2+S1+S2(1)
步驟2: 種群初始化。包括種群規(guī)模、迭代次數、交叉概率、變異概率的確定。
步驟3: 適應度函數確定。本文把預測輸出和實際值的絕對誤差值之和作為個體適應度值。
步驟4: 種群迭代,生成新的種群并計算其適應度值,直到迭代次數達到設定值結束。
步驟5: 將種群中最優(yōu)個體進行解碼,作為BP神經網絡的權值和閾值。
步驟6: 設定神經網絡參數,進行神經網絡模型的訓練、檢驗、預測。
2實例應用
21研究區(qū)域概況
泰州位于江蘇省中部,長江北岸,北部與鹽城毗鄰,東鄰南通,西接揚州,是蘇中入江達海5條航道的交匯處。全境屬于亞熱帶季風氣候,四季分明,雨量夏豐冬少,如何合理充分利用水資源,對社會經濟及城市的發(fā)展具有重要的影響。因此,對泰州市進行需水量預測可為城市合理分配水資源提供依據。
22主要影響因子確定
以2003-2014年為時間序列,依據《泰州市水資源公報2003-2014》社會經濟和水資源利用相關數據,初步選取10個影響因子做為泰州市需水預測的影響因子,見表1。
基于MATLAB軟件編寫主成分分析法程序并運行程序,得到標準化后的數據見表2,影響因子主成分特征值和貢獻率及累計貢獻率見表3,主成分載荷矩陣見表4。由表3可見,前4個因子的累計貢獻率達93414%,由此表明,前4個因子代表了原來10個因子90%以上的信息,即選用GDP、人口、農業(yè)用水量、工業(yè)用水量4個影響因子作為主成分替代原影響因子。另外從表4可以看到X10即耕地面積與主成分X1相關系數達到0772 4,X8即第三產業(yè)值與主成分X2相關系數達到0761 3,而其余變量與主成分之間相關系數較低,小于06,因此耕地面積與第三產業(yè)值也選作為主影響因子。綜上,選取GDP、人口、農業(yè)用水量、工業(yè)用水量、耕地面積、第三產業(yè)值6個因子作為需水預測模型的輸入量。
23需水預測模型建立
231GABP需水預測模型
將選取的6個因子作為GABP模型的輸入量,泰州市總需水量作為輸出量,建立3層的神經網絡模型。從樣本中選取2003-2010年數據作為訓練樣本,2011-2014年數據作為檢驗樣本。由于樣本數據的量綱及數量級不相同,首先需對樣本數據進行歸一化處理,再輸入到GABP模型中進行學習訓練。其中,網絡參數設定如下:隱含層神經元個數經過試算取10,種群規(guī)模取40[24],遺傳迭代次數取80,交叉概率取04,變異概率取008,網絡訓練函數采用traindm,性能函數采用mse,設定期望均方差為0001,通過學習訓練后得到預測模型。
232BP神經網絡需水預測模型
將選取的6個因子作為BP神經網絡的輸入量,泰州市總需水量輸出量,建立3層的神經網絡模型。從樣本中選取2003-2010年數據作為訓練樣本,2011-2014年數據作為檢驗樣本。對樣本數據進行歸一化處理后輸入到BP神經網絡模型中進行學習訓練。其中,網絡參數設定如下:隱含層神經元個數經過試算取8,網絡訓練函數采用traindm,學習率取01,性能函數采用mse,期望均方差為0001,通過學習訓練后得到預測模型。endprint
24模型評價指標
選用平均相對誤差eMRE及最大相對誤差emaxMRE作為需水預測模型評價的標準,其計算公式如下:
eMRE=[SX(]1[]n∑[DD(]n[]i=1[DD)][SX(]|[AKx^]i-xi|[]xi(2)
emaxMRE=[SX(]|[AKx^]i-xi|[]xi(1≤i≤n)(3)
式中:[AKx^]i為第i個樣本的預測值;xi為第i個樣本的實際值。
25需水預測結果及分析
利用訓練好的GABP需水預測模型和BP需水預測模型對泰州市2003-2014年需水量進行預測,預測結果及實際需水量見表5。模型訓練中的誤差變化曲線見圖1、圖2。
由表5可見,GABP需水預測模型對樣本的擬合效果及對檢驗樣本的預測性能均優(yōu)于BP神經網絡需水預測模型,GABP需水預測模型對檢驗樣本(2011-2014年)的平均相對誤差和最大相對誤差分別為10961%和16807%,對整體樣本(2003-2014年)的平均相對誤差和最大誤差分別為05640%和16807%,此四項數據均優(yōu)于BP神經網絡預測模型預測結果。可見,GABP需水預測模型具有較高的預測精度和泛化能力。由圖1、圖2可以看到,GABP神經網絡在訓練213步時達到了目標誤差值0001,而BP神經網絡訓練次數到1174步時才達到目標誤差值0001,可以看出,GABP神經網絡在經過權值和閾值的優(yōu)化后能快速收斂到目標值,對網絡的優(yōu)化效果非常顯著。
參考文獻(References):
[1]魯鳳,徐建華,王占永合肥市需水預測遺傳小波神經網絡模型研究[J]測繪科學,2013,38(5):2831(LU F,XU J H,WANG Z YResearch on Hefei water demand prediction model based on wavelet neural network[J]Science of Surveying and Mapping,2013,38(5):2831(in Chinese)) DOI:1016251jcnki10092307201305002
[2]郭華,鄭侃,林占東,等粒子群算法在城市需水預測模型中的應用[J]中國農村水利水電,2008(12):6365(GUO H,ZHENG N,LIN Z D,et alApplication of particle swarm optimization in urban water demand forecasting[J]China Rural Water and Hydropower,2008(12):6365(in Chinese))
[3]俞亭超,張土喬,毛根海,等預測城市用水量的人工神經網絡模型研究[J]浙江大學學報(工學版),2004,38(9):5560(YU T C,[JP3]ZHANG T Q,MAO G H,et alStudy of artificial neutral network model for forecasting urban water demand[J]Journal of Zhejiang University(Engineering Science),2004,38(9):5560(in Chinese))
[4]屈遲文,傅彥銘,戴俊改進的CSGRNN模型在城市需水量預測中的應用[J]西南師范大學學報(自然科學版),2014,39(9):127132(QU C W,FU Y M,DAI JOn application of generalized regression neural network potimized by chckoo search algorithm in urban water demand prediction[J]Journal of Southwest China Normal University(Natural Science Edition),2014,39(9):127132DOI:1013718jcnkixsxb201409022
[5]王弘宇,馬放,楊開,等灰色新陳代謝GM(1,1)模型在中長期城市需水量預測中的應用研究[J]武漢大學學報(工學版),2004,37(6):3235(WANG H Y,MA F,YANG K,et alA study of information renewal GM(1,1) model for predicting urban medium and longterm water demand[J]Engineering Journal of Wuhan University(Engineering Science),2004,37(6):3235(in Chinese))
[6]佟長福,史海濱,包小慶,等基于小波分析理論組合模型的農業(yè)需水量預測[J]農業(yè)工程學報,2011,27(5):9398(TONG C F,SHI H B,BAO X Q,et alApplication of a combined model based on wavelet analysis for predicting crop water requirement[J]Transactions of the CSAE,2011,27(5):9398(in Chinese)) DOI:103969jissn10026819201105015
[7]王春娟,馮利華,羅偉,等主成分回歸在需水預測中的應用[J]水資源與水工程學報,2013,24(1):5053(WANG C J,FENG L H,LUO W,et alApplication of principle component regression model to water demand forecast[J]Journal of Water Resources and Water Engineering,2013,24(1):5053(in Chinese))endprint
[8]張日俊,董增川,郭慧芳基于支持向量機的鄱陽湖環(huán)湖區(qū)需水預測模型[J]水電能源科學,2010,28(4):2223,55(ZHANG R J,DONG Z C,GUO H FWater demand forecast model of Poyang lake area based on support vector machine[J]Water Resources and Power,2010,28(4):2223,55(in Chinese))
[9]王盼,陸寶宏,張瀚文,等基于隨機森林模型的需水預測模型及其應用[J]水資源保護,2014,30(1):3437,89(WANG P,LU B H,ZHANG H W,et alWater demand prediction based on random forests model and its application[J]Water Resources Protection,2014,30(1):3437,89(in Chinese)) DOI:103969 jissn10046933201401007
[10][ZK(#]張靈,陳曉宏,劉丙軍,等基于AGA的SVM需水預測模型研究[J]水文,2008,28(1):3842,46(ZHANG L,CHEN X H,LIU B J,et alSVM Model of Water Demand Prediction Based on AVG[J]Journal of China Hydrology,2008,28(1):3842,46(in Chinese))
[11]BATES J M,GRANGER C W JThe combination of forecast[J]Operation Research Quarterly,1969,20:451468
[12]鞏琳琳基于遺傳模擬退火算法的神經網絡模型在陜西省需水預測中的應用[J]地下水,2006,28(5):1013,20(GONG L LThe NN Model based on annealing arithmetic of genetic simulation under the application of waterdemand forecast in Shaanxi province[J]Ground Water,2006,28(5):1013,20(in Chinese))
[13]舒媛媛,周維博,劉雷,等基于主成分分析的BP神經網絡在延安市需水預測中的應用[J]水資源與水工程學報,2012,23[JP3](6):172175(SHU Y Y,ZHOU W B,LIU L,et alApplication of BP neutral networks to water demand forecast of Yanan City based on principle component analysis[J]Journal of Water Resources and Water Engineering,2012,23(6):172175(in Chinese))
[14]崔東文基于相空間重構原理的遺傳神經網絡模型在城市需水預測中的應用[J]水利水電科技進展,2014,34(1):8589(CUI D WApplication of genetic neural network model to urban water demand prediction based on theory of space reconstruction[J]Advances in Science and Technology of Water Resources,2014,34(1):8589(in Chinese)) DOI:103880jissn10067647201401018
[15]張倩,沈利,蔡煥杰,等基于灰色理論和回歸分析的需水量組合預測研究[J]西北農林科技大學學報(自然科學版),2010,38(8):223227(ZHANG Q,SHEN L,CAI H J,et alCombination forecast research on water demand based on the grey theory and regression analysis[J]Journal of Northwest A & F University(Natural Science),2010,38(8):223227(in Chinese))
[16]萬金保,曾海燕,朱邦輝主成分分析法在樂安河水質評價中的應用[J]中國給水排水,2009,25(16):104108(WAN J B,ZENG H Y,ZHU B HApplication of principal component analysis in evaluation of water quality of Lean river[J]China Water and Waste Water,2009,25(16):104108(in Chinese))
[17]楊建剛人工神經網絡實用教程[M]杭州:浙江大學出版社,2003:4445(YANG J GArtificial neural network practical tutorial[M]Hangzhou:Zhejiang University Press,2003:4445(in Chinese))
[18]崔東文基于BP神經網絡的文山州水資源承載能力評價分析[J]長江科學院院報,2012,29(5):915(CUI D WEvaluation and analysis of water resources carrying capacity in Wenshan prefecture based on BP neural network[J]Journal of Yangtze River Scientific Research Institute,2012,29(5):915(in Chinese)) DOI:103969jissn10015485201205003endprint
[19]王小川,史峰,郁磊,等MATLAB神經網絡30個案例分析[M]北京:[JP3]北京航空航天出版社,2002(WANG X C,SHI F,YU L,et alAnalysis of 30 cases of MATLAB neural network[M]Beijing:Beijing Aerospace University Press,2002(in Chinese))
[20]何斌,張澎輝,梁國華,等基于BP神經網絡的場次洪水河道沙量預報[J]南水北調與水利科技,2015,13(3) :406408,416(HE B,ZHANG P H,LIANG G H,et alFlood and sediment prediction based on BP neural network[J]SouthtoNorth Water Transfers and Water Science & Technology,2015,13(3):408,416(in Chinese)) DOI:101:3476jcnkinsbdqk201503002
[21]苑希民,李鴻雁,劉樹坤,等神經網絡和遺傳算法在水科學領域的應用[M]北京:中國水利水電出版社,2002(YUAN X M,LI H Y,LIU S K,et alApplication of neural network and genetic algorithm in water science[M]Beijing:China Water power Press,2002(in Chinese))
[22]張德豐MATLAB神經網絡應用設計[M]北京:機械工業(yè)出版社,2009(ZHANG D FMATLAB neural network design[M]Beijing:Mechanical Industry Press,2009(in Chinese))
[23]蔡臣,黃濤,李云禎基于GABP神經網絡水下隧道涌水量預測及應用[J]路基工程,2013(1):3942(CAI C,HUANG T,LI Y ZForecast and application on water inflow of underwater tunnel based on GABP neural network[J]Subgrade Engineering,2013(1):3942(in Chinese)) DOI:103969jissn10038825201301010
[24]劉曉霞種群規(guī)模對遺傳算法性能的研究[D]保定:華北電力大學,2010(LIU X XResearch of population size on the performance of genetic[D]Baoding:North China Electric Power University,2010(in Chinese))endprint