何 露,王士軍, ,谷艷昌, ,龐 瓊, ,吳云星,
(1.南京水利科學研究院,江蘇 南京 210029;2.水利部大壩安全管理中心,江蘇 南京 210029)
我國現(xiàn)有水庫大壩98 002 座,其中90%以上為土石壩。據(jù)《全國水庫垮壩登記冊》資料顯示,自1954 年以來,我國土石壩潰決數(shù)量占所有壩型潰壩數(shù)量的98%以上。土石壩潰壩原因包括漫頂、滲透破壞、基礎(chǔ)抗剪強度不足等。其中,滲流破壞導(dǎo)致的事故占37.1%。壩體滲壓水位是評價土石壩滲流特性的重要物理量[1-5],土石壩壩體滲壓水位極值預(yù)測,是監(jiān)控與判斷土石壩滲流安全的主要途徑之一。
國內(nèi)外對土石壩滲壓水位極值的預(yù)測開展了一系列研究,為早期識別大壩隱患,基于實測資料分析的預(yù)測方法準確度不斷提高。目前用于該極值預(yù)測的方法主要有線性回歸法、神經(jīng)網(wǎng)絡(luò)法和其他機器學習算法等[6]。此類方法共同的特點是,使用時需給出正確的自變量。當滲流水位極值與上游水位相關(guān)性不明確時,此類方法的預(yù)測精度將難以保證?;煦缋碚摰奶攸c是可對時間序列進行相空間重構(gòu),本文引入混沌理論用于建立無自變量的預(yù)測模型,開展基于混沌理論和隨機過程的土石壩滲壓水位極值無自變量預(yù)測模型研究,為自變量不明確的測值序列提供預(yù)測方法。
土石壩滲壓水位的變化具有以下特點:(1)土顆??紫端畨毫Φ南⒒蚍e聚都是漸進的過程,壩內(nèi)滲壓水位的變化相較上、下游水位都有一定的滯后性;(2)筑壩土石料或地質(zhì)條件的非均一性及滲流機理的復(fù)雜性,滲壓水位與上、下游水位間關(guān)系為非線性;(3)壩體材料、上游泥沙淤積情況和邊界條件都有變異性,滲流場系統(tǒng)持續(xù)變化,可能具有混沌性?;煦缧允侵竿潦瘔螡B流系統(tǒng)具有內(nèi)在隨機性,原因是系統(tǒng)中各影響要素的相互作用,各要素間并不完全相互獨立。上、下游水位,泥沙淤積情況,筑壩材料,地質(zhì)情況可能導(dǎo)致不同的滲壓水位變化趨勢?;煦缧詫Τ跏紬l件具有敏感依賴性,影響因素的細微變化,會導(dǎo)致系統(tǒng)結(jié)果以指數(shù)倍變化,這樣的變化方式是貌似無序性,實則有序性的體現(xiàn)。
基于實測資料,對土石壩滲壓水位極值進行預(yù)測,首先要對水位序列的特征進行判斷。當要使用混沌理論對水位序列進行預(yù)測時,需對序列的混沌特性進行鑒別。當要使用隨機過程評估預(yù)測模型誤差時,也需對誤差序列的隨機特性進行檢驗。
如上文所述,混沌性是無序與有序相交融[6-7],其無序性在于系統(tǒng)局部不穩(wěn)定性。不穩(wěn)定的局部系統(tǒng)軌道在空間中無數(shù)次交疊,形成了奇怪吸引子,幾何姿態(tài)奇特。奇怪吸引子的真實維數(shù)很難知曉,因此,為研究混沌時間序列,需對該序列的相空間進行重構(gòu)。其有序性在于,混沌系統(tǒng)軌道的變化速度可以用特征值來衡量[8-10],比如Lyapunov 指數(shù)等[11]??衫孟到y(tǒng)的有序性,對滲壓水位的變化進行預(yù)測。
要分析滲壓水位這一混沌時間序列,相空間重構(gòu)是基礎(chǔ)。重構(gòu)相空間所需的參數(shù)是時延 τ和嵌入維m,其確定方法主要分為兩類:一類將 τ和m看作互不影響的物理量,分別選取,此類方法有自相關(guān)法、假近鄰法等;另一類認為 τ和m不應(yīng)相互獨立,而是相互關(guān)聯(lián),此類方法有嵌入窗法、C-C 法等。本文使用C-C 法進行相空間重構(gòu)。
為衡量滲流系統(tǒng)的動力學特性,要對系統(tǒng)的特征量進行研究。Lyapunov 指數(shù)是混沌系統(tǒng)的特征量之一[11-12],準確求得Lyapunov 指數(shù)是研究系統(tǒng)性質(zhì)和對系統(tǒng)進行預(yù)測的關(guān)鍵。Lyapunov 指數(shù)是描述系統(tǒng)軌道分離或靠近的物理量。當時間序列有限且包含噪聲,只需求最大Lyapunov 指數(shù)時,優(yōu)選小數(shù)據(jù)量法。Grebegi 證明只要最大的Lyapunov 指數(shù)大于零,就可以肯定混沌的存在。根據(jù)該指數(shù),可對混沌序列進行預(yù)測[13]。預(yù)測要建立合適的相空間,因預(yù)測時間T和延遲時間 τ屬于同量級,與滲流序列時間長度相比,T和τ都很小,所以有空間近鄰等距假設(shè)。對于時間序列{x(ti)}(i=1,2,···,m),在預(yù)測步長T≤τ時,X(tm+T)的s維分量中,只有x(tm+T)是未知的,則預(yù)測式為
式中:s為向量維度,只有一個未知量x(tm+T),即為預(yù)測值。
土石壩滲壓水位預(yù)測模型誤差序列的隨機性,是有序性系統(tǒng)中的不規(guī)則變化,此類誤差的特點是將來誤差值不受過去誤差值的影響[13-14],無內(nèi)在系統(tǒng)性。此特征與隨機過程中馬爾可夫過程的核心特征相吻合[15-16],所以本文選用馬爾可夫過程對該模型的隨機性進行模擬和預(yù)測。馬爾可夫過程中,時間與狀態(tài)皆為離散集的稱為馬氏鏈。使用馬氏鏈前需鑒別序列馬氏性。
一步轉(zhuǎn)移的齊次馬氏鏈應(yīng)用最為廣泛,指標序列各狀態(tài)間轉(zhuǎn)移概率是必需參數(shù),其具體數(shù)值通常根據(jù)實測資料估計得出。設(shè)可討論的馬爾可夫指標值序列X1,X2,···,Xn,有m種可能狀態(tài),記為E={1,2,···,m},fij表示從狀態(tài)a經(jīng)過一步轉(zhuǎn)移到狀態(tài)b的頻數(shù),一步的步長可以是1,2,···,m個時間單位。由fij組成的矩陣稱為轉(zhuǎn)移頻數(shù)矩陣。轉(zhuǎn)移頻率由轉(zhuǎn)移頻數(shù)矩陣計算得出,即將i行j列元素除以該行各元素之和。
對隨機序列進行馬氏性檢驗,是利用馬氏鏈模型分析和解決問題的必要前提。對離散序列的馬氏鏈,可用統(tǒng)計量 χ2來檢驗其馬氏性。統(tǒng)計量 χ2服從自由度為(m?1)2的χ2分布。給定顯著性水平α,查卡方檢驗臨界值表,即可檢驗序列馬氏性。
設(shè)馬氏鏈的狀態(tài)空間為E,Pij(n)是n步轉(zhuǎn){移概率},若對一切i,j∈E,存在不依賴于i的常數(shù) πj,使得,則稱此馬氏鏈具有遍歷性,式中為此鏈的平穩(wěn)分布。
存在定理:E含義同上,如果存在正整數(shù)n0,使對一切i,j∈E都有Pij(n0)非負,則此馬氏鏈是遍歷的,且求得的{}是唯一解??衫闷椒€(wěn)分布評價預(yù)測模型的誤差序列。
基于上述論述,建立基于混沌理論和隨機過程的土石壩滲壓水位極值無自變量預(yù)測模型的方法如下:
(1)利用C-C 法求得時延和嵌入維,重構(gòu)測值序列的相空間。
(2)計算測值序列空間的最大Lyapunov 指數(shù),若該指數(shù)為正值,則可判斷測值序列為混沌序列,可基于混沌理論進行預(yù)測。
(3)利用求得的最大Lyapunov 指數(shù),根據(jù)預(yù)測式(1)進行預(yù)測。
(5)按上述分級指標,對資料序列中的各指標劃分狀態(tài),然后對狀態(tài)、步長、轉(zhuǎn)移概率進行統(tǒng)計,得到馬氏鏈轉(zhuǎn)移概率矩陣。
(6)對序列進行馬氏性檢驗,基于序列的一步轉(zhuǎn)移頻數(shù)矩陣、一步轉(zhuǎn)移頻率矩陣計算統(tǒng)計量χ2值,計算式為
(7)分析該馬氏鏈的遍歷性、平穩(wěn)分布,評價預(yù)測模型。
選取某土石壩下游坡測點B的測值序列為算例,開展基于滲壓水位實測資料的極值預(yù)測分析,測點B位置見圖1。測值數(shù)據(jù)序列起止時間分別為2003 年10 月、2009 年10 月。選出時間序列中測值的每月極大值,組成72 個極大值的時間序列。將該時間序列分為2003 年10 月至2008 年4 月、2008 年5 月至2009 年10 月兩段,前一段測值序列用于建立預(yù)測模型,后一段用于檢驗預(yù)測模型。
圖1 測點位置(單位:m)Fig.1 Location map of measuring points (unit:m)
3.1.1 線性回歸預(yù)測模型 土石壩滲壓水位極值的最主要影響因素是上游水位,且上游水位對滲壓水位測值的影響有滯后性,所以選擇與滲壓水位相對應(yīng)的當日上游水位和前一周平均上游水位作為自變量x1,x2,滲壓水位測值作為因變量y,建立線性回歸方程如式(3),回歸系數(shù)為0.26,表明該模型擬合效果欠佳,預(yù)測效果較差。原因可能是線性回歸模型無法模擬因變量與自變量間的非線性關(guān)系,或是因變量與自變量相關(guān)性不明顯。
3.1.2 神經(jīng)網(wǎng)絡(luò)預(yù)測模型 選擇與上文相同的自變量和因變量,利用BP 神經(jīng)網(wǎng)絡(luò)建立滲壓水位序列的非線性預(yù)測模型。回歸系數(shù)為0.57,BP 網(wǎng)絡(luò)擬合值與實測值的對比見圖2。由圖2 可見,該網(wǎng)絡(luò)預(yù)測效果欠佳。較低的回歸系數(shù)表明自變量對因變量的影響較小,因變量與自變量間的相關(guān)性不明顯,這是該模型預(yù)測精度低的可能原因。因此,下面建立無自變量的預(yù)測模型,以證實該可能原因。
圖2 BP 網(wǎng)絡(luò)預(yù)測值與實測值的對比Fig.2 Comparison between predicted value and measured value of BP network
3.1.3 基于混沌理論的預(yù)測模型 利用混沌理論建立滲壓水位序列的預(yù)測模型,首先用C-C 法計算重構(gòu)相空間的時延τ和嵌入維m。圖3 中選取S(t)的第1 個局部極小點即為τ,τ為4。C(t)的全局最小點即為嵌入窗,根據(jù)嵌入窗與嵌入維的關(guān)系計算可得,嵌入維m為2。
圖3 C-C 法重構(gòu)相空間參數(shù)確定Fig.3 Parameter determination of phase space reconstruction by C-C method
根據(jù)時延、嵌入維構(gòu)造滲壓水位序列的相空間,該重構(gòu)相空間即為預(yù)測空間。計算該時間序列的最大Lyapunov 指數(shù),值為0.934 8。最大Lyapunov 指數(shù)大于0,可以肯定該時間序列為混沌時間序列。利用式(1)對2008 年5 月至2009 年10 月的滲壓水位進行預(yù)測(預(yù)測時間小于時延),滲壓水位預(yù)測結(jié)果見圖4?;煦缒P团c神經(jīng)網(wǎng)絡(luò)模型的絕對誤差對比見表1。
圖4 混沌模型預(yù)測值與實測值的對比Fig.4 Comparison between predicted value and measured value of chaos model
由圖4 可見,基于混沌理論的預(yù)測模型的規(guī)律更接近實測值規(guī)律,顯著優(yōu)于前文兩模型。由表1 絕對誤差的對比可知,混沌模型的最大絕對誤差為2.24 m,神經(jīng)網(wǎng)絡(luò)模型和多元回歸模型的最大絕對誤差分別為3.52 m、3.21 m,最大誤差顯著降低。數(shù)據(jù)對比證實了因變量與自變量間的相關(guān)性不明顯是模型預(yù)測精度的原因之一。解決這種原因?qū)е碌念A(yù)測精度欠佳,本文提出的無自變量預(yù)測模型有其優(yōu)越性。
分析基于混沌理論的預(yù)測模型的誤差序列,將實測值與混沌模型預(yù)測值作差,所得18 個差值如表1所示。
3.2.1 狀態(tài)分類 18 個相對誤差的均值為1.50%,均方差為4.80%,按照前文所述方法,α2,α3分別取0.3、0.6,區(qū)間及狀態(tài)的對應(yīng)關(guān)系見表2。
3.2.2 馬氏性檢驗 按表2 所建立的分級指標,資料序列中各月相對誤差所對應(yīng)的狀態(tài)如表1 中最后一欄所示。根據(jù)表1 提供的資料,可對18 個月的相對誤差序列作馬氏性檢驗。可算得步長為1 的一步轉(zhuǎn)移頻數(shù)矩陣和頻率矩陣如下:
表1 模型誤差序列及其狀態(tài)Tab.1 Errors of sequence and their states
表2 相對誤差分級Tab.2 Relative error classification table
根據(jù)fij、pij值計算可得:統(tǒng)計量 χ2的值為9.88。給定顯著性水平α=0.05,查卡方檢驗臨界值表可得分位點,故相對誤差序列滿足馬氏性。
3.2.3 平穩(wěn)分布與各狀態(tài)重現(xiàn)期 以2008 年5 月至2009 年10 月的相對誤差序列中,相依性較強的步長為1 的馬氏鏈為例分析可知,此鏈的狀態(tài)互通,且是非周期的,其全部3 個狀態(tài)構(gòu)成一個閉集,狀態(tài)空間無真子閉集,故此鏈為不可約正常反鏈,是遍歷的。因此,此鏈存在唯一的平穩(wěn)分布。依照步長為1 的轉(zhuǎn)移概率矩陣,可得到平穩(wěn)分布與各狀態(tài)的重現(xiàn)期。
狀態(tài)Ⅰ、Ⅱ、Ⅲ的重現(xiàn)期分別是98.7、66.0 和123.9 d。由此可見,狀態(tài)Ⅱ出現(xiàn)的機會最多,狀態(tài)Ⅲ出現(xiàn)的可能性最小,狀態(tài)Ⅰ出現(xiàn)的機會較大。結(jié)合3 種狀態(tài)的分類標準可說明,混沌理論預(yù)測模型的相對誤差主要出現(xiàn)在[0.06%,4.37%],次之出現(xiàn)在[?6.66%,0.06%],較少出現(xiàn)在[4.37%,13.39%]。據(jù)此可評價:混沌理論預(yù)測模型的精度較好。
(1)當滲壓水位極值序列與上游水位序列相關(guān)性弱時,線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型這兩種常規(guī)預(yù)測方法的擬合及預(yù)測效果欠佳,提出一種僅考慮測值序列、不考慮自變量的滲壓水位極值預(yù)測方法,提高了預(yù)測精度。
(2)本文建立的基于混沌理論的無自變量預(yù)測模型,因僅有極值序列而無法使用復(fù)相關(guān)系數(shù)、回歸系數(shù)等常規(guī)評價手段對模型進行評價。為解決該問題,提出基于隨機過程評價預(yù)測模型的誤差序列,評價結(jié)果合理,為無自變量的預(yù)測模型提供一種新的評價方法。
(3)實踐表明,基于混沌理論的預(yù)測方法,及基于隨機過程的相應(yīng)評價方法相結(jié)合,可形成精度較高、實用性強的無自變量預(yù)測方法,彌補常規(guī)預(yù)測方法的弱預(yù)測能力區(qū)域,為自變量不明確的土石壩滲流極值序列提供了一種可靠的建模方法。