王江榮,趙 睿,任泰明,袁維紅
(1.蘭州石化職業(yè)技術(shù)學(xué)院 信息處理與控制工程系,甘肅 蘭州 730060;2.蘭州石化職業(yè)技術(shù)學(xué)院 土木工程系,甘肅 蘭州 730060)
基于分位數(shù)自回歸的路基沉降數(shù)據(jù)預(yù)測分析
王江榮1,趙 睿1,任泰明1,袁維紅2
(1.蘭州石化職業(yè)技術(shù)學(xué)院 信息處理與控制工程系,甘肅 蘭州 730060;2.蘭州石化職業(yè)技術(shù)學(xué)院 土木工程系,甘肅 蘭州 730060)
高填方路基存在施工期穩(wěn)定控制和工后沉降控制問題。解決這兩個(gè)問題的關(guān)鍵在于及時(shí)準(zhǔn)確地預(yù)測出高填方路基的沉降量。通過對路基沉降時(shí)間序列分析,建立了自回歸AR(1)擬合預(yù)測模型。采取分位數(shù)回歸法和最小二乘法進(jìn)行模型參數(shù)估計(jì)和比較分析,結(jié)果表明分位數(shù)回歸法在模型參數(shù)估計(jì)時(shí)有明顯的優(yōu)勢,預(yù)測精度遠(yuǎn)高于多變量灰色MGM( )模型和基于最小二乘估計(jì)的自回歸AR(1)模型。工程實(shí)例分析表明,分位數(shù)自回歸模型具有很好的預(yù)測和應(yīng)變能力,完全可以用于路基沉降數(shù)據(jù)預(yù)測分析。
路基沉降;分位數(shù)回歸;AR(p)模型;預(yù)測分析
高填方路基存在施工期穩(wěn)定控制和工后沉降控制問題。解決這兩個(gè)問題的關(guān)鍵在于及時(shí)準(zhǔn)確地預(yù)測出高填方路基的沉降量。目前,國內(nèi)外公路路基沉降預(yù)測主要采用回歸分析模型、統(tǒng)計(jì)模型和組合模型等[1-3]。這些數(shù)學(xué)模型往往具有統(tǒng)計(jì)特性, 并建立在觀測誤差的數(shù)學(xué)期望值為零 、各次觀測互相獨(dú)立、方差相等以及觀測誤差呈正態(tài)分布的假設(shè)基礎(chǔ)上。事實(shí)上,影響路基沉降的因素是多方面的[4-5],監(jiān)測數(shù)據(jù)往往會(huì)出現(xiàn)波動(dòng)大、異方差現(xiàn)象,致使這些假設(shè)缺乏合理性,在這種情況下如果采用最小二乘回歸法估算模型系數(shù)時(shí)穩(wěn)健性較差、模型預(yù)測誤差會(huì)較大,難以滿足實(shí)際工程需要。與傳統(tǒng)的回歸方法相比,分位數(shù)回歸以其高精度、高效率及穩(wěn)健性強(qiáng)等特點(diǎn)被廣泛應(yīng)用于各類數(shù)據(jù)的預(yù)測分析中[6-8],而且用分位數(shù)回歸法估計(jì)模型的參數(shù)時(shí),對隨機(jī)誤差的分布不做任何要求。另外,傳統(tǒng)回歸法只能得到一個(gè)回歸方程,容易丟失數(shù)據(jù)信息,不能對預(yù)測量進(jìn)行準(zhǔn)確預(yù)測,也不能精確描述自變量對預(yù)測量條件分布形狀的影響情況。分位數(shù)回歸能夠得到一組不同分?jǐn)?shù)下的回歸方程,能夠準(zhǔn)確描述自變量對不同部分的預(yù)測量分布產(chǎn)生的不同影響,全面捕獲預(yù)測量的分布特征。由于路基沉降監(jiān)測數(shù)據(jù)是時(shí)間序列,數(shù)據(jù)具有相依性和相關(guān)性,可用時(shí)間序列分析法——自回歸AR(p)模型預(yù)測未來的沉降量,并利用分位數(shù)回歸進(jìn)行參數(shù)估計(jì),得到了不同分位點(diǎn)下的時(shí)間序列預(yù)測模型,由于在不同的分位點(diǎn)上預(yù)測的結(jié)果不同,可為決策者提供更加符合實(shí)際的選擇。另外,本文建立的基于分位數(shù)自回歸路基沉降預(yù)測模型與其他時(shí)間序列預(yù)測模型相比,可得到更加完整的路基沉降信息,預(yù)測精度更高。
傳統(tǒng)的回歸方法實(shí)質(zhì)為均值回歸,KOENKER 等(1978)提出了分位數(shù)回歸(quantile regression)理論[9],其實(shí)質(zhì)是對傳統(tǒng)以條件均值模型為基礎(chǔ)的最小二乘法的發(fā)展,能夠依據(jù)因變量Y的條件分位數(shù)對自變量X進(jìn)行回歸。該方法最大的優(yōu)勢在于保留了變量之間大部分信息的同時(shí),在一定程度上消除了異方差問題。
設(shè)Y為實(shí)值隨機(jī)變量,分布函數(shù)為F(y)=P(Y≤y),對任意0<τ<1有:
則稱Q(τ)為Y的τ分位數(shù),當(dāng)τ取0.5時(shí),即為中位數(shù)回歸。中位數(shù)常常和均值共同來反映數(shù)據(jù)的位置信息。最小二乘回歸是通過最小化殘差平方和來估算模型參數(shù)值,即:
式中,yi(1,2,…,n)為Y的一組隨機(jī)樣本;ξ為擬合值(模型的計(jì)算值);β?(向量)是模型的參數(shù)估計(jì)值。分位數(shù)回歸則是通過最小化樣本值與擬合值的加權(quán)誤差絕對值之和來估算模型參數(shù),即
式(3)還可以表示為:
分位數(shù)回歸優(yōu)點(diǎn)主要體現(xiàn)在以下3個(gè)方面[10]:
1)分位數(shù)回歸對時(shí)間序列模型的隨機(jī)誤差項(xiàng)不做任何要求,使得所建模型具有很強(qiáng)的數(shù)據(jù)適應(yīng)能力。
2)分位數(shù)回歸的模型參數(shù)估計(jì)值不易受數(shù)據(jù)列中異常點(diǎn)(離群值)的影響,使得建立的模型具有較強(qiáng)的穩(wěn)健性(魯棒性)。
3)分位數(shù)回歸對不同的分位點(diǎn),都能估計(jì)出相應(yīng)模型的參數(shù)值,進(jìn)而得到不同的回歸方程,使得數(shù)據(jù)中的大部分信息都能被提取出來。
對平穩(wěn)的時(shí)間序列建模,通常采用自回歸移動(dòng)平均ARMA(p,q)模型:
1)當(dāng)θ1=θ2=…=θq=0時(shí),模型即為自回歸模型AR(p):
2)當(dāng)β0=β1=…=βp=0時(shí),模型為移動(dòng)平均模型MA(q):
在實(shí)際應(yīng)用中,可以利用時(shí)間序列模型的ACF、PACF統(tǒng)計(jì)特性識(shí)別模型,具體見表1。
表1 平穩(wěn)時(shí)間序列的統(tǒng)計(jì)特性表
另外,還可以利用AKAIKE給出的信息準(zhǔn)則法識(shí)別模型,即AR(p)、MA(q)和ARMA(p,q) 的AIC值最小者可作為時(shí)間序列預(yù)測模型。
3.1 數(shù)據(jù)來源
數(shù)據(jù)源自京哈(G102線)公路長春至德惠路段的K1144+240斷面上的1個(gè)監(jiān)測點(diǎn)A,觀測以15 d為1個(gè)周期,在A處共測12個(gè)周期,所得數(shù)據(jù)見表2[11]。在12個(gè)周期的累計(jì)沉降數(shù)據(jù)序列中取前9個(gè)數(shù)據(jù)(序號1-9)用于建模,后3個(gè)數(shù)據(jù)(序號10-12)用于檢驗(yàn)預(yù)測值的準(zhǔn)確性。
3.2 數(shù)據(jù)平穩(wěn)性檢驗(yàn)
利用EViews6.0軟件對表1中的建模數(shù)據(jù)列(序號1~9)進(jìn)行單位根法平穩(wěn)性檢驗(yàn),得到檢驗(yàn)的P值為0.004 8,檢驗(yàn)T統(tǒng)計(jì)量-5.527 624小于1%、5%及10%的顯著性水平下的臨界值,所以可認(rèn)為建模數(shù)據(jù)列是平穩(wěn)的。因此可采用時(shí)間序列自回歸 AR(p)模型 、平均移動(dòng)MA(q)模型和自回歸平均移動(dòng)ARMA(p,q)模型對沉降數(shù)據(jù)進(jìn)行分析及預(yù)測。
表2 A點(diǎn)觀測數(shù)據(jù)
觀測建模數(shù)據(jù)列的自相關(guān)系數(shù)ACF和偏自相關(guān)系數(shù)PACF圖的特征(ACF和PACF圖由軟件EViews6.0獲得,在此略去),ACF具有一階拖尾性,PACF具有一階截尾性;另外采用AIC信息準(zhǔn)則法求得模型AR(1)、MA(1)和ARMA(1,1) 的AIC值分別為4.628 535、8.178 238和4.854 747,按AIC值最小原則選取時(shí)間序列模型。 AR(1)模型滿足上述兩方面的特性和要求,所以選AR(1)模型作為本文路基沉降時(shí)間序列預(yù)測模型。
3.3 基于分位數(shù)自回歸模型參數(shù)估計(jì)
依據(jù)分位數(shù)回歸的思想,構(gòu)造損失函數(shù)為:
式中,p=1,n=9為建模數(shù)據(jù)列長度。則AR(1)模型的參數(shù)估計(jì)值
3.4 分位數(shù)自回歸AR(1)模型預(yù)測分析
表3 不同分位點(diǎn)下AR(1)對應(yīng)系數(shù)估計(jì)值
可以看出各個(gè)分位點(diǎn)對應(yīng)著不同的系數(shù),由此得到了時(shí)間序列分位數(shù)模型。接下來對模型的殘差進(jìn)行檢驗(yàn),如果殘差是白噪聲序列,則表明模型是合適的。用 Ljung-Box 檢驗(yàn)法檢驗(yàn)殘差是否為白噪聲序列,結(jié)果如表4所示。
表4 Ljung-Box檢驗(yàn)的p值
表中的p值均很大,不能拒絕原假設(shè)(原假設(shè):殘差序列為白噪聲序列,即互不相關(guān)序列),說明這些殘差序列都是白噪聲,因此建立的模型是顯著有效的。用得到的模型對表1中序號10~12的測試數(shù)據(jù)進(jìn)行預(yù)測和分析,結(jié)果見表5。
表5 不同分位點(diǎn)對應(yīng)的路基沉降量預(yù)測值/mm
從表5可以看出,AR(1)在0.1、0.3、0.5、0.7、0.9 5個(gè)分位數(shù)下的預(yù)測結(jié)果,其精度均高于基于最小二乘的AR(1)模型yt=29.937 12+0.747 708yt-1(t=2,3,…),尤其以0.5分位下的預(yù)測精度最高,誤差絕對值之和的平均值為0.626 7,其精度遠(yuǎn)高于基于最小二乘AR(1)模型的預(yù)測精度。所以本文取AR(1)模型在0.5分位時(shí)建立的分位數(shù)回歸模型作為最終的預(yù)測模型yt=2.924 393+0.928 138yt-1(t=2,3,…),該模型對建模數(shù)據(jù)列的擬合程度和殘差情況如圖1所示,除了有一個(gè)異常點(diǎn)外,其他擬合效果都很好(沒有受異常點(diǎn)的影響)。另外,文獻(xiàn)[11]采用多變量灰色模型MGM(1,3) 對表2中的測試數(shù)據(jù)的預(yù)測結(jié)果為(30.34,31.56,33.38),其誤差絕對值之和的平均值為1.046 7,顯然預(yù)測精度不如本文模型。由此表明,將分位數(shù)回歸用于路基沉降量預(yù)測分析完全可行,能夠滿足工程需要。這里需要指出的是如果采集到的沉降數(shù)據(jù)列非平穩(wěn)時(shí),可采用差分等方法將數(shù)據(jù)平穩(wěn)化,再用本文方法建模。
圖1 分位點(diǎn)0.5的自回歸模型擬合效果圖
分位數(shù)回歸拓展了平穩(wěn)時(shí)間序列模型(ARMA)參數(shù)估計(jì)方法,而且按不同分位點(diǎn)可得多組估計(jì)量,使得模型在沉降量預(yù)測時(shí)有更多選擇。由于分位數(shù)回歸時(shí)對模型的隨機(jī)誤差項(xiàng)不做任何假設(shè),同時(shí)具有很強(qiáng)的數(shù)據(jù)適應(yīng)能力,對數(shù)據(jù)的平穩(wěn)性要求不高(近似平穩(wěn)即可),使得模型的應(yīng)用范圍更加廣泛。另外,可利用Eviews6.0軟件和MATLAB等軟件方便地完成模型的建立和最終模型的選取。工程實(shí)例表明,基于分位數(shù)回歸的AR模型預(yù)測結(jié)果優(yōu)于基于最小二乘估計(jì)的AR模型,也優(yōu)于多變量灰色時(shí)間序列預(yù)測模型MGM( ),為路基沉降數(shù)據(jù)分析研究提供了一種新思路、新方法。需要指出的是不同的分位點(diǎn)(可分為低分位和高分位)代表了不同的路基沉降發(fā)展水平,按施工期和工后期的不同狀態(tài)選擇不同分位數(shù)下的預(yù)測模型會(huì)更符合實(shí)際,效果會(huì)更佳,對此需要進(jìn)一步研究。
[1] 鄭建國,王婷,張繼文.黃土路基沉降量預(yù)測方法的研究[J].巖土力學(xué),2010,31(1):321-326
[2] 甄京山.曲線擬合法在軟土路基沉降預(yù)測中的應(yīng)用[J].公路交通科技,2012(11):195-197
[3] 張濤,蔡國軍,劉松玉.基于Weibull模型的軟土路基沉降預(yù)測方法[J].巖土工程學(xué)報(bào),2013,35(S1):212-216
[4] 崔曉如.高填方路基沉降變形分析與預(yù)測及其控制標(biāo)準(zhǔn)研究[D].長沙:長沙理工大學(xué),2010
[5] 梅源.濕陷性黃土高填方地基處理技術(shù)及穩(wěn)定性試驗(yàn)研究[D].西安:西安建筑科技大學(xué),2013
[6] 陳雪蓉.復(fù)雜數(shù)據(jù)下分位數(shù)回歸建模及其應(yīng)用[D].昆明:云南大學(xué),2012
[7] 姜成飛.分位數(shù)回歸方法綜述[J].科技信息,2013(25):185-240
[8] 彭良玉.分位數(shù)回歸在時(shí)間序列中的應(yīng)用[D].天津:天津大學(xué),2010
[9] PARZEN E.Quantile Probability and Statistical Data Modeling[J].Statistical Science,2004,19(4):625-662
[10] 盛選義,彭良玉.分位數(shù)回歸在時(shí)間序列中的應(yīng)用[J].太原師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2011,10(3):25-29
[11] 向一鳴,吳輝.基于多變量灰色模型的路基沉降預(yù)測[J].交通科技,2013(5):58-60
P258
B文章編號:1672-4623(2017)06-0081-03
10.3969/j.issn.1672-4623.2017.06.025
王江榮,教授,主要從事基路沉降、控制理論與應(yīng)用方面的研究。
2016-02-02。
項(xiàng)目來源:蘭州市科學(xué)技術(shù)局計(jì)劃項(xiàng)目(蘭財(cái)建發(fā)[2015]85號);蘭州石化職業(yè)技術(shù)學(xué)院科技資助項(xiàng)目(院發(fā)〔2015〕69號);甘肅省科技廳項(xiàng)目 ( 1204GKCA004 );甘肅省財(cái)政廳專項(xiàng)資金立項(xiàng)資助項(xiàng)目(甘財(cái)教[2013]116號)。