劉 碩, 王江榮
(蘭州石化職業(yè)技術(shù)大學(xué)信息處理與控制工程學(xué)院,甘肅 蘭州 730060)
高速公路路基邊坡存在施工期和工后運(yùn)營期邊坡變形控制問題,解決該問題的關(guān)鍵在于能及時(shí)準(zhǔn)確地預(yù)測出公路路基邊坡的水平位移和豎直位移(或沉降量)??茖W(xué)監(jiān)測并以監(jiān)測所得時(shí)間序列為基礎(chǔ),構(gòu)建高精度預(yù)測模型是解決此類問題的保障。受監(jiān)測條件(水文地質(zhì)、周邊環(huán)境、氣溫、降雨、監(jiān)測儀器精度等)影響,監(jiān)測時(shí)間序列往往具有非線性、非平穩(wěn)性、相依性和相關(guān)性等特點(diǎn),選擇理想的數(shù)學(xué)模型(用以表述此類序列)和模型參數(shù)估計(jì)方法就顯得尤為重要。ARIMA模型(Auto-Regression Integrated Moving Average)對非平穩(wěn)序列有較好的適用性,因此本文選用該模型來擬合預(yù)測這類時(shí)間序列。ARIMA模型與回歸分析模型、灰色理論模型、組合模型和統(tǒng)計(jì)模型[1-4]類似,都是建立在各次觀測相互獨(dú)立、觀測誤差數(shù)學(xué)期望為零、方差相等且隨機(jī)誤差呈正態(tài)分布這些假設(shè)基礎(chǔ)上的。但實(shí)際觀測數(shù)據(jù)往往出現(xiàn)波動(dòng)性大、呈異方差現(xiàn)象,難以滿足這些假設(shè)條件,在這種情況下如果采用最小二乘回歸法估算模型參數(shù)會造成模型穩(wěn)健性變差、預(yù)測誤差偏大,從而失去對工程實(shí)踐的指導(dǎo)性。若采用分位數(shù)回歸估算模型參數(shù),則對模型隨機(jī)誤差分布不做任何假設(shè)(或不做任何要求),而且分位數(shù)回歸估參還具有高精度、高效率及穩(wěn)健性強(qiáng)等特點(diǎn)[5-7],克服了傳統(tǒng)最小二乘估計(jì)的缺陷(要求隨機(jī)誤差項(xiàng)滿足齊方差正態(tài)同分布)。其次,為了提升分位數(shù)回歸的穩(wěn)健性,消除預(yù)測模型厚尾誤差對模型參數(shù)估值的影響,可通過對觀測序列中的異常值賦予較小的權(quán)值以削弱其對分位數(shù)回歸參數(shù)估值的影響(或干擾);而對正常觀測值或優(yōu)質(zhì)觀測值則賦予較大的權(quán)值以突出其估值的作用和地位[8-9]。相對于非線性估參的MA、ARMA及ARIMA等模型,AR模型是線性估參,該模型估值更容易且參數(shù)意義便于解釋,故在實(shí)際建模時(shí)可用高階AR模型替換ARIMA模型[10]。實(shí)證分析也表明加權(quán)分位數(shù)回歸參數(shù)估計(jì)的AR(p)模型具有較高的預(yù)測精度,優(yōu)于其他一些預(yù)測模型。
由Koenker等人于1978年提出的分位數(shù)回歸模型參數(shù)估計(jì)是一種全面數(shù)據(jù)統(tǒng)計(jì)分析方法[11],是對傳統(tǒng)最小二乘法的發(fā)展,具有很強(qiáng)的穩(wěn)健性和抗干擾能力(不易受監(jiān)測數(shù)據(jù)列中異常點(diǎn)的影響),且對時(shí)間序列模型的隨機(jī)誤差項(xiàng)無任何要求。該方法最大的優(yōu)勢在于能夠保留變量之間的大部分信息,同時(shí)還能夠較好地解決異方差問題,使所建模型更具魯棒性[12]。
設(shè)路基邊坡變形監(jiān)測時(shí)間序列Yt(t=1,2,…,n)的p階自回歸AR(p)模型為:
Yt=θ1Yt-1+θ2Yt-2+…+θpYt-p+ζt,
(t=p+1,3,…,n)
(1)
式中:θ=[θ1,θ2,…,θp]為模型參數(shù);ζt為模型隨機(jī)誤差項(xiàng)。
設(shè)FYt|(Yt-1,Yt-2,…,Yt-p)(y)(t≥p+1)是建立在隨機(jī)變量(Yt-1,Yt-2,…,Yt-p)基礎(chǔ)上Yt的條件分布函數(shù),則Yt在分位點(diǎn)τ∈(0,1)的條件分位數(shù)為
Qτ(Yt|Yt-1,Yt-2,…,Yt-p)=
(2)
其中inf(·)是下確界函數(shù)。
顯然,在(Yt-1,Yt-2,…,Yt-p)(t≥p+1)條件下,Yt在分位點(diǎn)τ的條件分位數(shù)為Yt-1,Yt-2,…,Yt-p的線性函數(shù),即Qτ(Yt|Yt-1,Yt-2,…,Yt-p)=θ1Yt-1+θ2Yt-2+…+θpYt-p,則參數(shù)向量θ(τ)在分位點(diǎn)τ的分位數(shù)估計(jì)值為
(θ1Yt-1+θ2Yt-2+…+θpYt-p))
(3)
另外,式(3)等價(jià)于下面的式(4),即
(4)
顯然,隨著分位點(diǎn)τ的改變,分位數(shù)回歸所估算出的模型參數(shù)也會不同,因而可求得不同自回歸AR(p)方程(傳統(tǒng)回歸法只能得到一個(gè)回歸方程,會造成數(shù)據(jù)信息丟失),從而使路基邊坡監(jiān)測數(shù)據(jù)中的大部分有用信息能夠被提取出來,增加了模型預(yù)測結(jié)果的可靠性和可信度。
為了進(jìn)一步加強(qiáng)和提升分位數(shù)回歸的穩(wěn)健性,削弱AR(p)模型厚尾誤差對模型估參的影響,本文通過給損失函數(shù)賦權(quán)(即對觀測異常點(diǎn)賦予較小的權(quán)值,而對正常點(diǎn)或優(yōu)質(zhì)點(diǎn)則賦予較大的權(quán)值)使所估算出的模型參數(shù)更加貼近理想值,從而提高模型的預(yù)測精度。
對式(3)中損失函數(shù)加權(quán)后得到AR(p)模型位于分位點(diǎn)τ的參數(shù)估計(jì)值為
(θ1Yt-1+θ2Yt-2+…+θpYt-p))
(5)
式(5)中權(quán)函數(shù)ωt為[13]:
(6)
數(shù)據(jù)來自于重慶奉云高速公路K1360+500-+660段,位于滑坡中部ZK2-3附近JC1-6監(jiān)測點(diǎn)的累計(jì)水平位移,工程概況詳見文獻(xiàn)[14]。表1給出了2015年3月21日至2015年11月23日,所完成的37期監(jiān)測數(shù)據(jù)。在37期的累計(jì)水平位移序列中,取前33前期樣本數(shù)據(jù)用于建模,后4期樣本數(shù)據(jù)用于檢驗(yàn)?zāi)P偷臏?zhǔn)確性。按表1中數(shù)據(jù)繪制累計(jì)水平位移時(shí)序圖,繪制結(jié)果如圖1所示。
表1 JC1-6監(jiān)測點(diǎn)的水平位移 mm
圖1 監(jiān)測點(diǎn)JC1-6的累計(jì)水平位移
從圖1可看出,受周邊工程開挖、水文氣象條件等因素影響,監(jiān)測出的累計(jì)水平位移時(shí)間序列出現(xiàn)了較大的波動(dòng)性,呈現(xiàn)出明顯的非線性和非平穩(wěn)性,適合用ARIMA模型表征描述。另外,在利用EViews軟件對表1中時(shí)間序列進(jìn)行自相關(guān)(ACF)及偏自相關(guān)(PACF)分析時(shí)發(fā)現(xiàn)自相關(guān)具有拖尾性,而偏自相關(guān)具有階截尾性,因此可用AR(p)模型擬合預(yù)測此時(shí)間序列。分別計(jì)算AR(1)、AR(2)、AR(3)、AR(4)、AR(5)、……的AIC值(Akaike Information Criterion,赤池信息準(zhǔn)則法),得到的結(jié)果分別為5.721 6、5.741 2、5.791 8、5.608 4、5.653 8、5.707 6、5.761 6……,并以最小的AIC值所對應(yīng)的模型為選定模型[15]。最終選定AR(4)為本例分析模型。
設(shè)時(shí)間序列模型AR(4):Yt=θ1Yt-1+θ2Yt-2+θ3Yt-3+θ4Yt-4+ζt,選用5個(gè)不同分位點(diǎn)τ=[0.1,0.3,0.5,0.7,0.9]進(jìn)行討論;結(jié)合分位數(shù)回歸與遺傳算法,估算模型參數(shù)θ=[θ1,θ2,θ3,θ4]。按式(5)定義適應(yīng)度函數(shù)(即目標(biāo)函數(shù)):
(θ1Yt-1+θ2Yt-2+θ3Yt-3+θ4Yt-4))
(7)
式(7)中Yt(t=1,2,…,32,33)來自表1中前33期的監(jiān)測數(shù)據(jù)(即建模樣本數(shù)據(jù))。
利用MATLAB編寫適應(yīng)度函數(shù)程序(函數(shù)名記為finess.m,具體程序在此略去),在計(jì)算權(quán)函數(shù)ωt時(shí),可用MATLAB自帶函數(shù)prctile確定C1和C2(本例經(jīng)試算k=25最優(yōu),即需計(jì)算25%和75%的分位數(shù)值);模型參數(shù)的搜索范圍為[-1.5,1.5]。當(dāng)權(quán)函數(shù)ωt≡1(t=1,2,3,…)時(shí),由式(7)得到的參數(shù)值為非加權(quán)分位數(shù)回歸估值,結(jié)果見表2。
表2 非加權(quán)不同分位點(diǎn)AR(4)模型參數(shù)估計(jì)值
將表2中各組參數(shù)值代入式(1),并用得到的AR(4)模型對表1中后4期數(shù)(即34~37)的監(jiān)測值進(jìn)行預(yù)測和分析,結(jié)果見表3和表4。
從表3和表4可看出,在非加權(quán)條件下,AR(4)在不同分位數(shù)的預(yù)測結(jié)果及精度各不同,其中以分位數(shù)0.5得出的AR(4)預(yù)測效果最優(yōu)(預(yù)測值整體
表3 非加權(quán)不同分位點(diǎn)AR(4)水平位移預(yù)測值 mm
表4 加權(quán)和非加權(quán)AR(4)水平位移預(yù)測精度
更接近實(shí)測值,即平均精度更高)。接下來再給出加權(quán)條件下,模型參數(shù)估計(jì)值及所得模型對表1后4期水平位移的預(yù)測值,分別見表4~表6。
表5 加權(quán)不同分位點(diǎn)下AR(4)模型參數(shù)估計(jì)值
表6 加權(quán)不同分位點(diǎn)AR(4)水平位移預(yù)測值 mm
從表4~表6可以看出,加權(quán)分位數(shù)回歸估值,按各分位點(diǎn)(τ=0.1、0.3、0.5、0.7、0.9)得到的AR(4)模型預(yù)測精度均有了較大提高,整體優(yōu)勢明顯。以上結(jié)果表明,引入權(quán)函數(shù)ωt對提高模型的擬合預(yù)測精度發(fā)揮了重要作用:抑制了隨機(jī)誤差異方差性對模型精度的影響,使估算出的模型參數(shù)值更接近理想值。值得注意的是,在加權(quán)條件下,各分位數(shù)自回歸AR(4)模型的擬合優(yōu)度值均大于0.9,說明得出的擬合預(yù)測值具有較高的可信度,可根據(jù)實(shí)際工程對精度要求,靈活選擇所需模型。本文選擇τ=0.5對應(yīng)的加權(quán)分位數(shù)自回歸模型(見式(8),為本例最終模型)與其他模型(式(9)~式(10))進(jìn)行對比分析。
yt=1.394 9yt-1-0.374 4yt-2+
0.301 1yt-3-0.326 1yt-4(t=5,6,7…)
(8)
基于最小二乘參數(shù)估計(jì)的AR(4)模型為:
yt=1.171 9yt-1-0.095 9yt-2+
0.296 7yt-3-0.342 4yt-4(t=5,6,7…)
(9)
一階差自回歸移動(dòng)平均ARIMA(2,1,2)(借助AIC信息準(zhǔn)則識別法確定)模型:
yt=13.051 16+1.885 423yt-1-0.912 305yt-2+
ζt+0.969 266ζt-1-0.288 398ζt-2(t=3,4,5…)
(10)
不同模型的預(yù)測結(jié)果及精度分析見表7、表8。
表7 不同模型的預(yù)測結(jié)果及比較 mm
表8 不同模型的預(yù)測精度
根據(jù)四種模型的預(yù)測結(jié)果及預(yù)測精度來看,本文模型(式(8))具有明顯優(yōu)勢,預(yù)測效果遠(yuǎn)好于其他三種模型。當(dāng)模型隨機(jī)誤差項(xiàng)存在異方差性時(shí),用最小二乘法(要求模型隨機(jī)誤差項(xiàng)具有同方差、同分布且誤差均值為0)估算出的模型參數(shù)偏離了理想值,即最小二乘估計(jì)對含異常點(diǎn)的數(shù)據(jù)列適應(yīng)能力也較差,進(jìn)而影響了模型的預(yù)測精度;建立在“LS-Least Squares(NLS and ARMA)”參數(shù)估算的AMIMA模型同樣存在這樣的問題;分位數(shù)回歸則具有很強(qiáng)的數(shù)據(jù)適應(yīng)能力,同時(shí)對模型隨機(jī)誤差項(xiàng)不做任何要求和假設(shè)(對建模數(shù)據(jù)的平穩(wěn)性要求不高),因此具有很強(qiáng)的穩(wěn)健性和抗干擾能力。另外,隨著權(quán)函數(shù)的引入使分位回歸估算出的參數(shù)值更接近理想值,從而增強(qiáng)了模型的穩(wěn)健性,提升了模型的預(yù)測精度。更重要的是,本文模型除了精度較高外,還具有結(jié)構(gòu)簡單、使用方便的特點(diǎn),便于工程技術(shù)人員借鑒。
加權(quán)分位數(shù)回歸拓展了時(shí)間序列模型AR(p)參數(shù)估值方法,可按不同分位點(diǎn)估出多組參數(shù)值,使得模型在土木工程變形預(yù)測時(shí)有更多選擇,可按施工期和工后使用期靈活選用。由于權(quán)函數(shù)僅受監(jiān)測數(shù)據(jù)列的驅(qū)動(dòng),對模型殘差具有調(diào)節(jié)作用,因此可有效抑制異常數(shù)據(jù)點(diǎn)對模型參數(shù)估值的干擾,進(jìn)而增強(qiáng)分位數(shù)回歸參數(shù)估值和所得模型的穩(wěn)健性。分位數(shù)回歸對模型的隨機(jī)誤差項(xiàng)統(tǒng)計(jì)特性無任何要求,具有很強(qiáng)的數(shù)據(jù)適應(yīng)能力,要優(yōu)于最小二乘估計(jì)。工程實(shí)例分析表明,基于加權(quán)分位數(shù)回歸參數(shù)估值的自回歸AR(p)模型具有很高的預(yù)測能力(外推能力),用于工程實(shí)踐完全可行。另外,對于非等間隔時(shí)間序列,可先等間隔化后再按本文方法建模;對非平穩(wěn)非線性時(shí)間序列采用高階自回歸AR(p)作為預(yù)測模型同樣完全可行,進(jìn)一步拓寬了本文分位回歸建模方法的使用范圍。