□劉曉璐(河北省石家莊水文水資源勘測局)
水文預報時間序列神經(jīng)網(wǎng)絡模型
□劉曉璐(河北省石家莊水文水資源勘測局)
水文時間序列表述的是水文水資源系統(tǒng)在氣象環(huán)境、流域下墊面以及人類活動等因素綜合作用后的輸出結果,其變化規(guī)律呈現(xiàn)隨機性和確定性特點。在大尺度條件下,水文時間序列的傳統(tǒng)預報模型簡單,且很少考慮環(huán)境噪音因素的影響。伴隨現(xiàn)代化科學技術的快速進步,國民經(jīng)濟的管理部門提出了更高的水文水資源預報要求,在要求短期預報更精準的基礎上,對中長期預報的要求要越來越嚴格。由于受到相關科技水平的制約和諸多復雜因素的影響,當前的中長期水文水資源預報還處于發(fā)展、探究階段。
水文預報;時間序列;神經(jīng)網(wǎng)絡
水文水資源預報表述了水文水資源系統(tǒng)所測的實時數(shù)據(jù)以及根據(jù)實時數(shù)據(jù)預測的水文水資源的變化特征的實測數(shù)據(jù)和變化特征。水文本質是一種自然表現(xiàn)跡象,水文時間序列是對其進行觀測后得出的一個信息樣本,具有離散信號特性。水文時間序列通常包含兩種成分:一種為確定性成分,具體表現(xiàn)為水文資源的周期性變化和發(fā)展趨勢變化;另一種為隨機性成分,具體表現(xiàn)為水文資源的純隨機變化和相依性特點。運用不同的數(shù)學模型去表述水文現(xiàn)象成分,已成為水文時間序列研究的重點內容。
當前的水文資源時間序列預報中,應用的數(shù)學模型可分為兩大類:第一大類為用于平穩(wěn)性時間序列的分析模型,主要有MA(滑動平均模型)、AR(自回歸模型)、ARMA(自回歸滑動平均模型)等主;第二大類為具備非線性辨識能力的模型,如:雙線性模型和神經(jīng)網(wǎng)絡模型。從實質上看,自然水文過程具有顯著的不平穩(wěn)性,其時間序列呈現(xiàn)出顯著非線性特征,因而,根據(jù)水文時間序列預報的數(shù)學模型特點,能準確表達水文時間序列的實際特征的神經(jīng)網(wǎng)絡模型最具優(yōu)勢。通常情況下,水文時間序列預報的神經(jīng)網(wǎng)絡數(shù)學模型的基本定義為:
式中:Xt為t時刻之前的不間斷n個時間點的時間序列來預測t時刻的相關未知量,Gt為t時刻時間序列數(shù)學模型的誤差值。
不同時刻的同一水文要素都存在較大數(shù)值差別,比如:洪峰流量數(shù)值經(jīng)常是基流量數(shù)值的成百上千倍,這種差異的存在,就會導致水文時間序列神經(jīng)網(wǎng)絡數(shù)學模型的輸入樣本存在較大的數(shù)量級差別。所以在神經(jīng)網(wǎng)絡模型的訓練中,必須參照全局數(shù)據(jù)誤差修正網(wǎng)絡模型權重。為了同時滿足小樣本和大樣本的要求,就必須通過增加模型的訓練次數(shù)來修正網(wǎng)絡權重值。
除上述外,各訓練樣本在不同量級上存在不一樣的分配。訓練后,網(wǎng)絡權重保存的信息能夠呈現(xiàn)出訓練樣本中占比較高的樣本特點。實踐中,若輸入量和訓練樣本中占比偏高的數(shù)量級樣本,則擁有理想的預測效果。否則,效果則比較差。怎樣加快神經(jīng)網(wǎng)絡訓練,降低訓練樣本分配于不同量級上對神經(jīng)網(wǎng)絡帶來的影響,這是水文時間序列引進神經(jīng)網(wǎng)絡必然要思考的問題。本研究通過梳理前人的研究成果,提出了以趨勢辨識理論為主導的神經(jīng)網(wǎng)絡模型。
隨機函數(shù),一般是根據(jù)時間t選擇離散值,因而叫做隨機或者是時間序列。具體來看,離散型隨機過程即叫做時間序列。水文時間序列X,通常包含確定性、隨機性兩個主要成分。通過線性疊加對水文時間序列予以描述,可得下式:
式中:iV為確定性非周期成分(如趨勢、突變或者是跳躍);確定性周期成分,即純隨機成分。
水文時間序列主要研究因變量(預報對象)內在變化所遵循的某種規(guī)律,但并沒有牽涉到其他變量。換句話說,水文時間序列即從因變量身上提取和未來掛鉤的某些信息。
若某水文序列適應平穩(wěn)性要求,則其統(tǒng)計特性不會根據(jù)絕對時間的改變而發(fā)生改變。預報實際上是構建前后期數(shù)據(jù)相適應的定量關系式,以線性模型最具典型。
設有一中心化的水文平穩(wěn)序列:
式中:Xt′代表前1個到前P個時間間隔之間的數(shù)據(jù),和加權系數(shù)之間的乘積相加。白噪聲,通??勺鳛閿M合誤差,也就是:
式中:at~N(0,σ2);假設at和之前所得的觀測數(shù)據(jù)X′n(n<t)沒有關聯(lián),則:
該模型,又被叫做階自回歸模型,稱AR(p)。
自回歸模型,是由GV.yule最早予以提出,時間為1927年。他將諧波序列和隨機噪聲相互疊加的過程,稱為自回歸過程。1931年,將該種模型產(chǎn)生的序列叫做相關項序列。1944年,M.GKendall將其命名為線性自回歸序列。目前,通常叫做自回歸模型。.AR(p)數(shù)學表達式,可改寫:
人工神經(jīng)網(wǎng)絡,通過學習能夠對任意非線性進行映射,以預報非線性系統(tǒng),其具有顯著的優(yōu)越性。熟悉的人工神經(jīng)網(wǎng)絡模型,主要包含BP、RBF模型。
2.3.1 BP網(wǎng)絡
BP網(wǎng)絡,又被叫做多層前饋神經(jīng)網(wǎng)絡。根據(jù)網(wǎng)絡權值遵循的調整規(guī)則,選擇后向傳播學習算法,也就是BP學習算法。
BP網(wǎng)絡,包含3層甚至更多的神經(jīng)網(wǎng)絡。BP網(wǎng)絡主要由輸入層、輸出層以及中間層(隱層)三個部分組成,每層均包含多個節(jié)點。上下量層相互連接,每層神經(jīng)元則相互開放。當網(wǎng)絡接收學習樣本后,神經(jīng)元對應的激活值便會從輸入層,通過中間層直接傳播到輸出層,輸出層對應得各神經(jīng)元便能夠響應網(wǎng)絡輸入指令。根據(jù)降低目標輸出和具體誤差,通過中間層分別對各連接權值予以修正,然后可返回到輸出層。該算法也被叫做“誤差逆?zhèn)鞑ニ惴ā?,又被稱為BP算法。該誤差修正的持續(xù),有助于更好地提升網(wǎng)絡響應輸入模式的準確率。
2.3.2 RBF網(wǎng)絡
20世紀80年代末期,J.Moody、C.Darken兩人首次提出徑向基函數(shù)RBF神經(jīng)網(wǎng)絡(又被叫做徑向基網(wǎng)絡)。作為三層前饋網(wǎng)絡,它包含單隱層。實踐表明,徑向基網(wǎng)絡可以通過任意精度向所有連續(xù)函數(shù)予以逼近。
目前,學者已提出神經(jīng)網(wǎng)絡相關的多種模型,最常見的,有反向傳播、最小能量、自適應共振和雙向聯(lián)想模型等諸多模型?,F(xiàn)實中,上述模型均發(fā)揮十分重要的作用。神經(jīng)元,是難度較小的處理元件。神經(jīng)網(wǎng)絡中,通過神經(jīng)元來處理各類信息。單個神經(jīng)元包含多種輸入通道,信息利用該類通道便可輸入至神經(jīng)元,相加和轉換函數(shù)后便能夠將信息成功輸出。該種輸出信息,加權后可向下個神經(jīng)元予以傳輸。不同神經(jīng)元,利用通道可實現(xiàn)有效連接。
圖1 前向式多層網(wǎng)絡圖
式中:{Zt},t=1,2,…用以代表平穩(wěn)時間序列;a1,…,an代表常數(shù)或者時變參數(shù);根據(jù)誤差方差最小值,或者是AIC準則最終明確模型。水文預報時間序列相關的單輸入模型,如下:
式中:Zt為t=1,2,…,N;N表示序列樣本容量;Z表示非線性函數(shù);kεt+k代表任意正整數(shù)(也就是預報步數(shù));根據(jù)神經(jīng)網(wǎng)絡(圖2)中包含的非線性映射予以實現(xiàn)。
圖2 單輸出水文預報時序神經(jīng)網(wǎng)絡圖
圖l中,擁有隱含層(也就是中間層)。隱含層中,囊括很多非線性狀態(tài)的隱含元。正因為隱含元的上述特征,導致網(wǎng)絡輸入/出間產(chǎn)生的映射同樣具有非線性,且相對較復雜,這為構建水文預報時間序列模型帶來了幫助。圖中x,i(=1,…,。)主要代表輸入數(shù)據(jù);y,(j一1,一m)則代表輸出數(shù)據(jù);h、(k一1,一n m)則用以代表隱含元輸出值。其關系如下表:
根據(jù)經(jīng)驗、知識層次等,在闡述系統(tǒng)發(fā)展所具有的變化規(guī)律前提下,通過水文水資源、數(shù)學、計算機等理論及相關方法,可預報水文水資源系統(tǒng)在未來某個階段內潛在的變化趨勢,從而為水文決策系統(tǒng)提供可靠的保障。通常,預報方法需要構建1個模型,且包含較多的樣本數(shù)據(jù),用以明確模型參數(shù)。不過部分情況下很難明確模型的結構。所以,相關人員應重視研究新的建模方法。
TV124
B
1673-8853(2017)10-0043-02
劉曉璐(1981.12-),女,工程師,主要從事水文情報預報、旱情監(jiān)測、地下水監(jiān)測等方面工作。
2017-8-7
編輯:劉 青