潘中建
摘要:依據(jù)黃河下游沖淤河道水沙過程的歷史數(shù)據(jù),對黃河下游沖淤河道的水位進行信息處理,給出了構(gòu)建非線性耦合隨機數(shù)據(jù)模型的分析過程??紤]到?jīng)_淤河道水位過程自身的復(fù)雜性,為使模型更有效,引入了自回歸項和隨機擾動項——維納過程,從而有效降低信息處理模型誤差。
關(guān)鍵詞:非線性;隨機數(shù)據(jù)模型;水位信息處理
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2018)04-0237-03
Application of Nonlinear Stochastic Coupling Model in Water Level Fitting
PAN Zhong-jian
(Jiangsu Vocational College of Business, Nantong 226011, China)
Abstract: Based on the Yellow River water sediment historical data of erodible-bed channel, fitted the water level, given the construction of coupled nonlinear stochastic hydrological model analysis. We considered the own complexity of the water level of erodible-bed channel, in order to make model effective we has joined in the auto regression item and Wiener process , thus reduces the fitting model error effectively.
Key words: nonlinear; stochastic model; the water level fitting
1 概述
自然界中的水體運動是一個非線性系統(tǒng),是一個復(fù)雜的不確定過程。水文學(xué)和水力學(xué)主要是研究水體的運動、循環(huán)和時空變化規(guī)律,揭示水的自然屬性和社會屬性,以及人類合理利用水資源,防治水災(zāi)害問題[1]。黃河下游是沖淤性河道,沖淤河道的水沙過程受到很多因素的共同作用,各因素本身及因素間的變化規(guī)律復(fù)雜。若對黃河水系統(tǒng)進行有效控制和支配,以及精確的預(yù)測黃河的水位,就必須用數(shù)學(xué)方法對水體進行分析,建立合理科學(xué)的水文模型[2]。依據(jù)黃河下游沖淤河道水沙過程的歷史數(shù)據(jù),對黃河下游沖淤河道的水位進行信息處理,給出了構(gòu)建非線性耦合隨機數(shù)據(jù)模型的分析過程??紤]到?jīng)_淤河道水位過程自身的復(fù)雜性,引入耦合項、自回歸項等方法,逐步有效降低了最終模型的隨機誤差,引入了;其次,黃河下游水沙質(zhì)點的運動受許多隨機力的作用,水沙過程中的隨機擾動具有維納過程特性,在原模型基礎(chǔ)上引入刻畫水沙過程中的隨機擾動,從而有效降低了信息處理模型誤差。
2 初始模型的構(gòu)建
依據(jù)水文學(xué)科相關(guān)理論,水體的下游水位相應(yīng)的影響因素主要有:該水體上斷面出現(xiàn)的水位,含沙量,流量,和下游同時水位,含沙量,流量。為得到合理的初始模型,首先需最大限度的考慮水位變化的影響因素,給出全因素的非線性模型即:
在模型的基礎(chǔ)上,分析各個影響因素的相關(guān)程度,逐步的替代或剔除弱影響因素。
2.1 影響因素線性分析、非線性分析
在解決工程問題時,耦合影響因素越來越受到重視,水文過程的影響因素復(fù)雜,僅靠單純的幾個單因素難以符合實際物理背景,簡單的多元線性關(guān)系僅僅反映的是單因素的片面結(jié)果,所以要找出潛在的影響因素,就要注重耦合因素的交互影響。選取黃河花園口-夾河灘1980-1993年與、、、、、的對應(yīng)值,把看作隨機影響的白噪聲過程,確定信息處理分析模型。由于影響因素較多,分析過程較長。這里僅給出一個耦合項及二階單因素變量與因變量的散點圖和信息處理模型過程。
從圖1中可以看到,下游水位的變化與上游水位的變化的平方近似有非線性拋物線的關(guān)系,在較短的期間內(nèi)變動,且這一區(qū)間離坐標原點較遠,在這一區(qū)間上該拋物線曲率已非常小,可以得到簡單的信息處理模型:
,
經(jīng)過對影響因素的初步分析,逐步篩選出有價值的影響因素,并在原有基礎(chǔ)上進行因素替代,非線性轉(zhuǎn)化為線性替代,剔除單因素和的單因素影響,組成初始的復(fù)合非線性耦合方程,其初始模型可以表示為:
其中,為待定參數(shù),為隨機誤差。
2.2 因素的共線性分析
根據(jù)水文預(yù)報的要求,構(gòu)建的模型在于信息處理的精度高,并非模型越復(fù)雜越好,因此這里主要分析模型中因素間的共線性,從而剔除模型中的重復(fù)因素,得到簡化的模型。
從復(fù)合非線性項兩兩之間的關(guān)系,可以得到與、與有較強的共線關(guān)系,所以在簡化模型過程中,可以逐步的剔除、兩項。經(jīng)過線性轉(zhuǎn)化之后的與和與有著強線性關(guān)系,所以可以剔除、,同樣與具有近似的共線性關(guān)系,可以剔除含有的項。同時引入對因變量的自回歸項,得到改進模型:
從水文學(xué)和水力學(xué)的理論分析,在水位變化的過程中,其隨機變量可以看成一個隨機過程。每一個變量可以認為有其變動的隨機空間,基于此可以簡化非線性模型為:
其中,為期望函數(shù),為相應(yīng)的回歸向量或是自變量向量,可以看作隨機變量的白噪聲過程。維納過程是工程中布朗運動的數(shù)學(xué)描述,水沙過程中的隨機擾動具有維納過程特性,適合使用維納過程刻畫。為了盡可能在預(yù)測模型中做到科學(xué)合理,且能從實際物理背景中反映水文的變化,從而假定這個白噪聲過程為維納過程,設(shè):
引入的滯后項構(gòu)成的信息處理模型。即
其中為待定參數(shù),表示為維納過程。
3 參數(shù)的率定
針對模型的參數(shù)率定,由于考慮到共線性的問題,運用嶺估計對參數(shù)進行率定。因為嶺估計是在自變量信息矩陣的主對角線元素上人為加入一個非負因子,從而使回歸系數(shù)的估計稍有偏差、而估計的穩(wěn)定性卻可能明顯提高的一種估計方法,它是最小二乘法的一種補充,嶺估計可以修復(fù)病態(tài)矩陣,達到較好的效果。
3.1 值的選擇
根據(jù)文獻嶺估計的參數(shù)估計方法,適當(dāng)?shù)闹颠x取直接影響著回歸的結(jié)果,表1是六個回歸系數(shù)在取0~0.0228的一些嶺跡,由表1可知,隨著的增加,回歸系數(shù)有的逐漸增大,有的逐漸減小,取0.02之后的數(shù)據(jù)已經(jīng)基本穩(wěn)定,變化比較小,所以取k=0.02。
一般認為如果的值低于10,則認為信息處理精度較高。由以上公式計算得到:, ,可見模型的信息處理效果比較高。
信息處理誤差絕對值的最大值為0.17632,誤差絕對值的平均值為0.048156。可見所構(gòu)建的復(fù)合非線性隨機信息處理模型是有效的,該構(gòu)建模型的方法是科學(xué)合理的。因為該模型考慮的因素比較全面,且加入了對的分析,信息處理誤差絕對值最大值符合工科學(xué)中的精度要求。
5 結(jié)論
介紹了復(fù)合非線性隨機數(shù)據(jù)模型的構(gòu)建過程,其理論依據(jù)是建立在多元回歸模型、逐步回歸模型、自回歸模型、嶺估計以及維納過程的基礎(chǔ)上;從科學(xué)的角度出發(fā),綜合多個模型的特點,構(gòu)建合理的復(fù)合非線性隨機數(shù)據(jù)模型。從對模型的分析來看,模型是在前人研究的基礎(chǔ)上引入自回歸項和隨機擾動項——維納過程,逐步深化模型的適用程度,提高模型的信息處理檢驗精度。水位的信息處理模型是為了進一步用于預(yù)測水位,所以對水位預(yù)測有一定的參考價值。
參考文獻:
[1] 葛守西. 現(xiàn)代洪水預(yù)報技術(shù)[M]. 北京:中國水利水電出版社, 2000.
[2] 時政華. 復(fù)雜數(shù)據(jù)分類和EV模型應(yīng)用研究[D]. 河海大學(xué)碩士學(xué)位論文, 2005.
[3] 芮孝芳, 陳潔云, 常星源, 等. 黃河下游水位預(yù)報模型及其應(yīng)用[J]. 水科學(xué)進展, 1998, 9(3):245-250.
[4] 柳麗, 魏慶諍, 趙樹安. 回歸分析中多重共線性的診斷與處理[J]. 中國衛(wèi)生統(tǒng)計, 1994,11(1):5-7.