【摘要】徑流是水文循環(huán)中的重要環(huán)節(jié),對徑流時間序列分析預測是掌握徑流變化特征以及合理優(yōu)化配置水資源的重要途徑。人們目前掌握了越來越多的分析預測方法,其中用于徑流序列的分析預測方法主要有傳統(tǒng)時間序列分析法,不確定性分析法與非線性方法。本文簡要介紹傳統(tǒng)時間序列分析法,不確定性分析法中的馬爾科夫模型,灰色系統(tǒng)法與集對分析法,非線性方法中的人工神經網絡以及混沌等幾種常用的分析預測方法。通過對這些方法梳理歸納,簡述各種方法的優(yōu)勢與不足,幫助讀者了解徑流預測領域的現(xiàn)狀,引發(fā)讀者對該領域研究新的思考,尋得新的突破點。
【關鍵詞】時間序列模型;馬爾科夫模型;灰色系統(tǒng)理論;人工神經網絡;混沌理論
河川徑流是水文循環(huán)非常重要的環(huán)節(jié),對水資源開發(fā)利用,國民經濟以及生態(tài)環(huán)境具有廣泛的影響力。近年來,由于氣候的劇烈變化以及人類活動的影響,徑流發(fā)生了顯著的改變,徑流時間序列的非線性特征愈加明顯。為了合理優(yōu)化利用水資源,對徑流時間序列進行分析預測已非常重要,徑流的非線性特征使得目前越來越多的分析預測方法應用于該領域。近年來,許多新穎獨特的方法進入到人們的視野當中,尤其是非線性方法的應用最為明顯。
1、傳統(tǒng)時間序列分析法
時間序列是指所觀察的事物按照時間順序排列觀察值的一組數(shù)字序列。通過對事物過去的發(fā)展趨勢和演變規(guī)律,進行數(shù)據(jù)分析,得出事物發(fā)展與時間的關系,從而獲得未來的發(fā)展趨勢。利用數(shù)據(jù)內在的規(guī)律進行預測,是時間序列分析的重要任務。
1.1. 時間序列模型
時間序列模型主要分為兩大類:平穩(wěn)時間序列分析與非平穩(wěn)時間序列分析。其差別在于,只有時間序列中的相關系數(shù)或數(shù)學期望中有一個隨時間的變化而改變,那么它就是非平穩(wěn)時間序列。目前將非平穩(wěn)時間序列轉換為平穩(wěn)時間序列的方法有差分法與參數(shù)法。目前的平穩(wěn)序列時間分析模型分析主要以AR模型、MA模型、ARMA模型為主。非平穩(wěn)模型分析這里只使用ARIMA模型。對于AR模型而言,所求值是過去值的線性組合和白噪聲序列之和。而MA模型為各時刻的白聲噪擾動項的線性組合。時間序列的現(xiàn)在值如果與過去時刻系統(tǒng)中的擾動存在關系,則這時候就形成了ARMA模型。ARIMA模型則是適用于非平穩(wěn)時間序列進行分析的方法。ARIMA模型實質上是利用差分的方法將非平穩(wěn)時間序列轉換為平穩(wěn)時間序列,然后利用ARMA模型進行處理,ARIMA模型有廣泛的應用,比如對松華壩水庫入流的預測,在國外也曾有使用ARIMA模型預測對巴西的tapajó河-亞馬遜河段的水位預測。
2、不確定性分析法
在這個信息量豐富的時代,許多不確定性現(xiàn)象出現(xiàn)在人們的視野中。近年來,人們投入許多精力用于研究不確定性現(xiàn)象,誕生了許多不確定性分析法。國內學者對不確定現(xiàn)象展開大量研究,目前已有許多新型的方法如灰色理論和集對分析法等。
2.1 馬爾科夫模型
若隨機變化過程中某時刻的數(shù)據(jù)結果已知,且與之前的數(shù)據(jù)結果無關,則稱這種隨機過程為馬爾科夫過程。具有馬爾科夫性質的隨機離散過程的事件,即稱之為馬爾科夫鏈。由于許多水文現(xiàn)象大部分符合馬爾科夫特性,所以馬爾科夫鏈預測方法可以用來研究水文水資源方面的問題。
馬爾科夫鏈預測方法分為基于絕對分布的馬爾科夫鏈預測方法,疊加馬爾科夫鏈預測方法和加權馬爾科夫鏈預測方法。第三種方法預測最為準確,對序列進行了馬爾科夫特性驗證之后,使用各種步長的馬爾科夫鏈對未知時段的數(shù)據(jù)進行預測,之后按照序列對不同步長的契合程度,對預測結果進行加權求和。
現(xiàn)在應用比較多的基本上是以馬爾科夫思想為基礎的改進模型。比如由貝克實現(xiàn)語音處理應用程序使用的隱馬爾科夫模型,用來展示時間變化發(fā)展趨勢的灰色馬爾科夫模型,在灰色馬爾科夫模型基礎上的改進型灰色馬爾科夫模型,還有與神經網絡模型相結合的BP神經網絡馬爾科夫預測模型。馬爾科夫模型具有預測精度比較高,較為簡單,運用較為靈活方便等特點。
2.2 灰色系統(tǒng)理論
灰色系統(tǒng)理論是鄧聚龍教授提出的一門研究非確定性系統(tǒng)的理論。它以信息殘缺的“小樣本”為研究對象,通過系統(tǒng)解析,提取有用信息,實現(xiàn)對系統(tǒng)衍變的有效控制?;疑獹M(1,1)模型是灰色系統(tǒng)理論的核心模型體系,它通過對單一時間序列的模型建立和系統(tǒng)預測,揭示系統(tǒng)內在的變化規(guī)律。其特點就是所需樣本數(shù)據(jù)少,但對數(shù)據(jù)有一定要求,數(shù)據(jù)序列需通過累加處理使數(shù)據(jù)的隨機性弱化并呈現(xiàn)出指數(shù)變化規(guī)律,因此,該模型并不適合長期預測,尤其是隨機性和波動性較大的系統(tǒng)預測。
灰色系統(tǒng)內同時存在已知和未知兩類信息。徑流序列是一種相依性弱又高度繁雜的非線性動力系統(tǒng),但在水文變化過程中龐雜的時空分布和對其觀測記錄的不完整而具有灰色特性,因此,把徑流系統(tǒng)看作灰色系統(tǒng)并引入灰色系統(tǒng)理論建模分析,無疑是一種新思想?;疑碚摲治鍪欠治鱿到y(tǒng)的變化趨勢,短期預測精度較高。但是由于模型具有快速衰減或遞增的特性,故時效性有限,不適合長期的預測或分析。
2.3 集對分析法
1989年,我國學者趙克勤提出了一種新的不確定性理論——集對分析法。它的核心思想是把確定與不確定視為一個確定不確定系統(tǒng),以聯(lián)系度表達式μ=a﹢bi﹢cj來描述問題的各種不確定性。集對分析法已經廣泛應用于現(xiàn)代科學管理、系統(tǒng)控制、決策分析、人工智能以及水文各領域等。目前利用集對分析進行分析預測的方法主要有基于集對分析的相似預測、基于聯(lián)系度的集對分析聚類預測法、以及許多將集對分析與其他預測方法結合而成的優(yōu)化預測方法。由于水文系統(tǒng)本身就存在確定與不確定等因素,所以集對分析十分適用于水文系統(tǒng)的分析預測。大量的研究表明,集對分析與基于集對分析的預測方法具有靈活多變,概念清晰,計算簡便以及預測精度較高的特點,所以集對分析在水文領域中具有較高的應用價值。
3、非線性方法
水文系統(tǒng)具有復雜性與非線性,利用一般傳統(tǒng)預測模型進行徑流預測的結果存在精度不高、說服力不強等缺點,而非線性方法正好能夠解決這樣的問題。下面介紹人工神經網絡和混沌理論兩類非線性方法。
3.1 人工神經網絡
人工神經網絡是旨在模仿人類大腦結構和功能的一種信息處理系統(tǒng)。ANN由大量神經元組成,神經元模型種類較多,McCulloch-Pitts模型是最早提出的神經元模型,它考慮了到加權、求和、轉移三個功能。
如圖1,對于第i個神經元,X1、X2...Xn是神經元的輸入,而ωi1、ωi2...ωin是連接強度,也稱為權,θ為閾值,Y1、Y2...Yn為神經元的輸出,輸入和輸出之間的關系為
Yi = f(Sj),Sj = ∑ωij Xi ﹣θj(i=1,2,3...n)
式中:f(x)為轉移函數(shù)(激活函數(shù)),應用較多的是對數(shù)S型(sigmoid)函數(shù)。
BP網絡應用最廣,但由于收斂速度慢且易陷入局部極小值,從而導致結果非最優(yōu)。Hopfield網絡是研究最多的模型之一,包含離散型和連續(xù)型,區(qū)別在于方程模型是差分還是微分。Ali Osman 與H.Kerem 分別采用ANN混合模型、ARIMA、ARIMAX研究Ceyhan和Syhan流域月徑流系數(shù)的變化進而預測徑流序列。C.L.Wu與K.W.Chau 通過將ANN與單一光譜分析結合來構造降雨-徑流模型(RR),結果表明SSA有效地改善了預測模型的表現(xiàn)并消除了延遲作用。
基于人工神經網絡具有的自學習、自組織、自適應能力等特性,能反映出事件之間復雜的非線性關系。
3.2 混沌理論
混沌產生于非線性的確定性系統(tǒng)中,是一種表面無規(guī)則的現(xiàn)象,在運動形式上顯現(xiàn)出對初始值的敏感性。1987年,Hense A將混沌帶入到水文領域中,近年來,混沌理論在水文系統(tǒng)中的研究有了顯著改變。
混沌理論對水文系統(tǒng)的研究分為兩大內容:混沌性分析與時間序列的預測。對水文時間序列進行混沌分析的關鍵在于Packard提出的相空間重構及混沌特性識別。常用相空間重構的方法——時間延遲坐標法的關鍵在于延遲時間和嵌入維數(shù)的確定,由于確定延遲時間和嵌入維數(shù)的方法具有很強主觀性,如何確定相空間參數(shù)成為熱門話題。混沌性識別的常用方法有PCA法、飽和關聯(lián)維數(shù)法、最大Lyapunov指數(shù)法以及K熵法等,人們往往結合多種方法進行混沌特性識別以提高說服力?;煦珙A測方法是在重構相空間內找一個非線性的模型去迫近系統(tǒng)的動態(tài)特征,實現(xiàn)短期預測。隨著混沌系統(tǒng)在水文領域的發(fā)展,廣大學者在傳統(tǒng)的混沌預測方法上結合非線性預測方法,豐富了混沌理論?;煦缋碚撘褟V泛應用于各大領域,但其研究尚處于初級階段,需要廣大學者繼續(xù)豐富和發(fā)展。
4、結語
徑流序列明顯的非線性特性,對其進行分析預測意義重大。本文對不同分析預測方法進行梳理歸納,展現(xiàn)預測領域的發(fā)展與改變。許多非線性方法(人工神經網絡,混沌理論),不確定性分析方法(灰色系統(tǒng)理論,集對分析法)逐步在預測領域得到應用,以及傳統(tǒng)的時間序列模型,馬爾科夫模型等逐步完善,未來的預測領域是一個復雜的網絡。由于單一方法不可避免的局限性,許多研究結合已有多種方法對時間序列分析預測,例如混沌神經網絡法,基于灰色關聯(lián)的混沌局域預測等,它們打破了單一方法預測的局限性,提高了預測精度,所以多方法結合預測必將成為研究的熱點,這也將是未來研究的主攻方向。
參考文獻:
[1] 姜珊. 嫩江流域中長期徑流預報方法比較研究[D]. 吉林: 吉林大學, 2011.
[2] Rabiner, L. R. A tutorial on hidden Markov models and selected applications in speech recognition[J]. Proceedings of the IEEE, 1989, 77(2) : 267-296.
[3] 劉思峰. 灰色系統(tǒng)理論的產生與發(fā)展[J]. 南京航空航天大學學報, 2004, 36(2): 267-272.
[4] 趙克勤. 集對分析及其初步應用[J]. 大自然探索, 1994, 13(1) : 18-23.
[5] Pekta?, A. O., Cigizoglu, H. K. ANN hybrid model versus ARIMA and ARIMAX models of runoff coefficient[J]. Journal of Hydrology, 2013, 500(11) : 21-36.
[6] Elshorbagy, A., Simonovic, S. P., Panu, U. S. Estimation of missing streamflow data using principles of chaos theory.[J] Journal of Hydrology. 2002, 255(1) : 123-133.