褚桂紅
(山西省水利水電科學(xué)研究院山西太原030002)
水資源短缺已成為制約我國工業(yè)發(fā)展的重要因素,而要實(shí)現(xiàn)經(jīng)濟(jì)的快速發(fā)展,就必須解決好水的供需關(guān)系。需水量預(yù)測是制訂供水決策的重要參考目標(biāo),可為水資源規(guī)劃和管理提供必要的依據(jù)。工業(yè)取水量預(yù)測可以采用BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,但該模型采用的是沿梯度下降的搜索求解算法,這就不可避免地存在收斂速度慢、容易陷入局部最優(yōu)等缺陷。由Moody J和Darken C于20世紀(jì)80年代末提出的徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)[1]是一種典型的局部逼近人工神經(jīng)網(wǎng)絡(luò),能夠避免傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)的缺點(diǎn),因而得到了更廣泛的應(yīng)用。本文建立了基于RBF神經(jīng)網(wǎng)絡(luò)的工業(yè)取水量預(yù)測模型,并以某市為例進(jìn)行了研究。
徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)是一種以函數(shù)逼近理論為基礎(chǔ)的三層前饋網(wǎng)絡(luò),具有很強(qiáng)的生物學(xué)背景,也是當(dāng)前國際學(xué)術(shù)界前沿研究領(lǐng)域,在模式識別、圖像處理、預(yù)測預(yù)報、故障診斷、信號處理、優(yōu)化計算、專家系統(tǒng)與人工智能等方面得到了廣泛的應(yīng)用[2,3]。
RBF網(wǎng)絡(luò)的結(jié)構(gòu)與三層BP網(wǎng)絡(luò)相似,分為輸入層、隱含層和輸出層,如圖1所示。輸入層節(jié)點(diǎn)傳遞輸入信號到隱層,隱層節(jié)點(diǎn)由像高斯函數(shù)那樣的輻射狀作用函數(shù)構(gòu)成,而輸出層節(jié)點(diǎn)通常是簡單的線性函數(shù)。RBF網(wǎng)絡(luò)的最顯著的特點(diǎn)是隱節(jié)點(diǎn)的基函數(shù)采用距離函數(shù),使用徑向基函數(shù)作為激活函數(shù)。徑向基函數(shù)關(guān)于維空間的一個中心點(diǎn)具有徑向?qū)ΨQ性,而且神經(jīng)元的輸入離該中心點(diǎn)越遠(yuǎn),神經(jīng)元的激活程度就越低,即徑向基函數(shù)對輸入信號在局部產(chǎn)生響應(yīng)。函數(shù)的輸入信號靠近函數(shù)的中央范圍時,隱層節(jié)點(diǎn)將產(chǎn)生較大的輸出,因此,RBF網(wǎng)絡(luò)無論在逼近能力、分類能力和學(xué)習(xí)速度等方面均優(yōu)于BP網(wǎng)絡(luò),能夠避免局部收斂,實(shí)現(xiàn)快速全局收斂[3]。
圖1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
RBF神經(jīng)網(wǎng)絡(luò)的基本思想是:把徑向基函數(shù)作為隱單元的“基”,構(gòu)成隱含層空間,隱含層對輸入矢量進(jìn)行變換,將低維的模式輸入數(shù)據(jù)變換到高維空間內(nèi),使得在低維空間內(nèi)的線性不可分問題在高維空問內(nèi)線性可分[4]。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBF)是一種前饋神經(jīng)網(wǎng)絡(luò),輸入層節(jié)點(diǎn)只傳遞輸入信號到隱層,輸出層通常是簡單的線性函數(shù)[5,7],隱層節(jié)點(diǎn)常由高斯函數(shù)構(gòu)成。
式中:x為n維輸入向量;cj為第j個隱含層節(jié)點(diǎn)的基函數(shù)中心,與x具有相同的維數(shù)的向量;n是感知單元的個數(shù),也就是隱含層節(jié)點(diǎn)的個數(shù);σj為第j個隱含層節(jié)點(diǎn)的基函數(shù)寬度參數(shù);‖x-cj‖為矩陣歐式范數(shù),通常表示x與cj之間的距離;φ(x)在cj處有一個唯一的最大值,隨著‖x-cj‖的增大,φ(x)會迅速衰減到零。
對于給定的輸入,只有一小部分靠近x的中心被激活。設(shè)輸入層的輸人為(X=x1,x2,…,xj,…,xn),實(shí)際輸出為(Y=y1,y2,…,yj,…,yM)。輸入層實(shí)現(xiàn)從 X→φ(x)的非線性映射,輸出層實(shí)現(xiàn)從φ(x)→yk的線性映射。
式中:Wjk為隱含層節(jié)點(diǎn)j至輸出層節(jié)點(diǎn)k的鏈接權(quán)值;φj為隱含層節(jié)點(diǎn)的輸出值;m為輸出層節(jié)點(diǎn)數(shù)。
確定RBF網(wǎng)絡(luò)的聚類中心cj、權(quán)值Wjk后,就可求出某一輸入對應(yīng)的輸出值。
從構(gòu)造RBF網(wǎng)絡(luò)的結(jié)構(gòu)可以看出,構(gòu)造訓(xùn)練RBF網(wǎng)絡(luò)的過程,就是通過學(xué)習(xí)確定隱含層神經(jīng)元的數(shù)目和每個隱含層神經(jīng)元的中心、寬度以及輸出權(quán)值的過程。根據(jù)徑向基函數(shù)中心選擇方法的不同,RBF網(wǎng)絡(luò)有多種學(xué)習(xí)方法,其中隨機(jī)算法和自組織學(xué)習(xí)算法適用于靜態(tài)模式的離線學(xué)習(xí),不能用于動態(tài)輸入模式的在線學(xué)習(xí),網(wǎng)絡(luò)隱含層單元的節(jié)點(diǎn)數(shù)要事先人為確定,而最近鄰聚類學(xué)習(xí)算法是一種在線自適應(yīng)聚類學(xué)學(xué)習(xí)算法[8]。此算法隱含層單元節(jié)點(diǎn)數(shù)不需要事先人為確定,隨著輸入樣本的變化,隱含層單元的節(jié)點(diǎn)數(shù)也隨之而變,訓(xùn)練樣本學(xué)習(xí)結(jié)束,隱含層單元的節(jié)點(diǎn)數(shù)隨之確定下來。
影響工業(yè)取水量預(yù)測的因子很多,建立這些影響因子與取水量的精確數(shù)學(xué)模型較為困難,而神經(jīng)網(wǎng)絡(luò)具有廣泛的從輸入到輸出的映射能力,是一種能夠找到正確反映現(xiàn)實(shí)系統(tǒng)輸人、輸出及它們之間外在關(guān)系的有效工具。神經(jīng)網(wǎng)絡(luò)應(yīng)用于預(yù)測領(lǐng)域,最普遍采用的是多層前饋神經(jīng)網(wǎng)絡(luò)模型,即BP網(wǎng)絡(luò)。BP網(wǎng)絡(luò)采用反向傳播算法,不僅收斂速度慢,而且會遇到局部極小值問題,因此這里采用徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)模型。
RBF神經(jīng)網(wǎng)絡(luò)工業(yè)取水量預(yù)測模型是建立在歷年用水量的基礎(chǔ)上,經(jīng)過樣本學(xué)習(xí),確定網(wǎng)絡(luò)模型結(jié)構(gòu),因此在進(jìn)行取水量預(yù)測之前,應(yīng)先對歷年用水量進(jìn)行分析。
工業(yè)取水量與用水戶的生產(chǎn)規(guī)模、產(chǎn)業(yè)性質(zhì)、技術(shù)水平、用水效率、用水定額等有關(guān)。通過對某市工業(yè)取水量變化規(guī)律進(jìn)行分析,得到影響工業(yè)取水量的主要影響因素有:工業(yè)總產(chǎn)值、工業(yè)復(fù)用水量、工業(yè)總用水量、萬元產(chǎn)值取水量、萬元產(chǎn)值用水量、總復(fù)用率、排水量和耗水量8項(xiàng)指標(biāo),這些取水量預(yù)測影響因子與工業(yè)取水量之間呈復(fù)雜的非線性關(guān)系,要用精確的數(shù)學(xué)函數(shù)關(guān)系表達(dá)這樣的非線性關(guān)系相當(dāng)困難。RBF神經(jīng)網(wǎng)絡(luò)具有并行處理、容錯性和很好的處理非線性問題等多種優(yōu)良性能,可實(shí)現(xiàn)任意函數(shù)的逼近?;赗BF神經(jīng)網(wǎng)絡(luò)的工業(yè)取水量預(yù)測模型,通過對樣本的學(xué)習(xí),可以實(shí)現(xiàn)工業(yè)取水量預(yù)測影響因子與取水量預(yù)測的非線性映射關(guān)系。
采用某市1990-2000年共11年的資料,以1990-1997年8年的資料為訓(xùn)練樣本,1998-2000年3年的資料為檢驗(yàn)樣本,訓(xùn)練前需對輸入指標(biāo)進(jìn)行無量綱化處理,即數(shù)據(jù)的歸一化。
式中:xi為歸一化后輸入或輸出值;xi為輸入或輸出的樣本值;xmax、xmin為樣本數(shù)據(jù)中變化范圍內(nèi)的最大值和最小值。
根據(jù)資料條件,選用8個取水量預(yù)測因子作為徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入,隱含層的節(jié)點(diǎn)數(shù)由最近鄰聚類算法通過樣本的學(xué)習(xí)確定,同時得到RBF網(wǎng)絡(luò)連接權(quán)值,輸出層輸出工業(yè)取水量。訓(xùn)練前需對輸入指標(biāo)進(jìn)行歸一化處理,歸一化后的樣本數(shù)據(jù)見表1。
表1 歸一化后的樣本數(shù)據(jù)
預(yù)測模型中網(wǎng)絡(luò)訓(xùn)練樣本輸入層節(jié)點(diǎn)數(shù)為8個,輸出層節(jié)點(diǎn)數(shù)為1個,利用Matlab軟件編程對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,經(jīng)過訓(xùn)練網(wǎng)絡(luò)誤差達(dá)到誤差要求。用訓(xùn)練好的網(wǎng)絡(luò)預(yù)測1998、1999和2000年的工業(yè)取水量,取水量預(yù)測因子見表2。
表2 工業(yè)取水量預(yù)測因子
利用訓(xùn)練好的網(wǎng)絡(luò)對某市1998、1999和2000年工業(yè)取水量進(jìn)行預(yù)測檢驗(yàn),預(yù)測結(jié)果見表3。由預(yù)測結(jié)果可知,RBF神經(jīng)網(wǎng)絡(luò)預(yù)測精度均高于BP神經(jīng)網(wǎng)絡(luò),這說明RBF網(wǎng)絡(luò)模型具有較高的預(yù)測精度,模型泛化能力強(qiáng),可用于工業(yè)取水量預(yù)測等領(lǐng)域。
表3 模型預(yù)測結(jié)果
本文利用RBF神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性逼近能力建立了RBF神經(jīng)網(wǎng)絡(luò)取水量預(yù)測模型,該模型有較強(qiáng)非線性處理能力和逼近能力,采用最近鄰聚類學(xué)習(xí)算法選取聚類中心,具有學(xué)習(xí)時間短、網(wǎng)絡(luò)運(yùn)算速度快、性能穩(wěn)定等優(yōu)點(diǎn),避免傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu)的缺點(diǎn)。
[1]Moody J and Darken C.Fast learning in networks of locally tuned processing [J].Neural Computation,1989(1):281-289.
[2]焦李成.神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論[M].西安:西安電子科技大學(xué)出版社.1996:26-36.
[3]魏海坤.神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計的理論與方法[M].北京:國防工業(yè)出版社,2005:46-73.
[4]高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實(shí)例[M].北京:機(jī)械工業(yè)出版社,2003:55-63.
[5]M J D Powell.Radial basis functions for multivariable interpolation:a review[C].J C Mason G Cox.Algorithms for approximation.New York:Clarendon Press,1987:146-167.
[6]C A Micchelli.Interpolation of scattered data Distance matrices and conditionally positive definite functions[J].Constructive Approximation,1986(2):11-22.
[7]劉旭,于國祥,沈西挺.基于神經(jīng)網(wǎng)絡(luò)德爾預(yù)測模型的比較研究[J].河北省科學(xué)院學(xué)報,2007(12):7-12.
[8]朱明星,張德龍.RBF網(wǎng)絡(luò)基函數(shù)中心選取算法的研究[J].安徽大學(xué)學(xué)報(自然科學(xué)報),2000,24(1):74-78.