孫 曉,王清梅,楚敬敬
(1.青島科技大學(xué) 自動(dòng)化與電子工程學(xué)院,山東 青島 266061;2.中國科學(xué)院國家天文臺,北京 100012)
500 m口徑球面射電望遠(yuǎn)鏡FAST(five-hundredmeter aperture spherical telescope)為具有主動(dòng)反射面的球冠狀大型射電望遠(yuǎn)鏡[1],建設(shè)于我國貴州,望遠(yuǎn)鏡空間跨度大、結(jié)構(gòu)復(fù)雜,為確保結(jié)構(gòu)安全,使用傳感器對其支撐鋼結(jié)構(gòu)關(guān)鍵點(diǎn)應(yīng)力信息進(jìn)行監(jiān)測以評價(jià)其健康狀態(tài)。其中,用于主索及圈梁鋼結(jié)構(gòu)應(yīng)力監(jiān)測的光纖Bragg光柵傳感器共計(jì)416個(gè)[2]。應(yīng)力信號可根據(jù)歷史數(shù)據(jù)的變化趨勢,對未來的結(jié)構(gòu)應(yīng)力進(jìn)行預(yù)測,有助于提早發(fā)現(xiàn)結(jié)構(gòu)可能存在的故障,進(jìn)行預(yù)警或排查處理,提高結(jié)構(gòu)安全性能。
目前國內(nèi)外對于信號預(yù)測的主要方法有人工智能法、物理模型參數(shù)法、時(shí)間序分析列法等[3]。ZHANG等[4]利用有限元建模的方法,根據(jù)荷載來預(yù)測金屬構(gòu)件焊接面處的應(yīng)力,用于識別薄板粘結(jié)構(gòu)件的破壞。OZGUR等[5]使用機(jī)器學(xué)習(xí)中全卷積網(wǎng)絡(luò)模型,結(jié)合材料本身特性對彈性材料中應(yīng)力進(jìn)行了預(yù)測,利用斷裂力學(xué)可評估材料的強(qiáng)度。王培德等[6]提出利用多個(gè)當(dāng)前荷載作為輸入,基于位置神經(jīng)網(wǎng)絡(luò)模型預(yù)測風(fēng)電機(jī)組應(yīng)力極值的方法,來提高風(fēng)電機(jī)組的應(yīng)力預(yù)測精度。王蘇健等[7]使用歷史數(shù)據(jù)與隨機(jī)森林的方法對礦井圍巖應(yīng)力進(jìn)行了預(yù)測,將其用于監(jiān)測數(shù)據(jù)缺失插值,取得了較好的插值效果。薛磊等[8]基于BP神經(jīng)網(wǎng)絡(luò)和改進(jìn)后的PSO-BP神經(jīng)網(wǎng)絡(luò)、GABP神經(jīng)網(wǎng)絡(luò)研究了風(fēng)電塔筒應(yīng)力預(yù)測,通過測試選取了最優(yōu)的預(yù)測模型。相關(guān)研究均取得了較好的預(yù)測效果,但部分方法需要詳細(xì)的結(jié)構(gòu)特性信息,或相關(guān)荷載信號作為參考輸入。其中人工智能法容易陷入局部最優(yōu),影響預(yù)測精度;物理模型參數(shù)法參數(shù)評估較為困難且建模過程復(fù)雜;時(shí)間序列法應(yīng)用中運(yùn)算速度較快,但在長期預(yù)測中精度易受影響。
時(shí)間序列分析法[9]是從自相關(guān)的角度揭示信號序列的發(fā)展規(guī)律,認(rèn)為任何一個(gè)時(shí)間序列都可以分解為確定性序列和隨機(jī)項(xiàng)序列的疊加,擬合恰當(dāng)?shù)臄?shù)學(xué)模型來描述序列值之間的統(tǒng)計(jì)規(guī)律,挖掘時(shí)間序列數(shù)據(jù)的趨勢、周期性、循環(huán)規(guī)律等,進(jìn)而利用這個(gè)模型來預(yù)測序列未來的趨勢。ARIMA模型(autoregressive integrated moving average model)即差分自回歸移動(dòng)平均模型[10],用于描述依賴于時(shí)間的隨機(jī)變量之間的延續(xù)性和相關(guān)性[11],是單變量的時(shí)間序列預(yù)測分析方法之一。與傳統(tǒng)方法相比,不僅考慮了數(shù)據(jù)時(shí)間上的依存性,也考慮了隨機(jī)波動(dòng)的干擾,具有模型構(gòu)建簡單,只依賴數(shù)據(jù)本身內(nèi)生變量即可實(shí)現(xiàn)預(yù)測等優(yōu)點(diǎn)。
FAST大型射電望遠(yuǎn)鏡在工作過程中,若望遠(yuǎn)鏡工作狀態(tài)發(fā)生改變,如進(jìn)行主動(dòng)反射面變形,結(jié)構(gòu)拓?fù)鋵l(fā)生改變,同一測點(diǎn)的結(jié)構(gòu)受力規(guī)律將有較大變化。其結(jié)構(gòu)應(yīng)力監(jiān)測信號的預(yù)測,主要關(guān)注短期內(nèi)的信號估值,即數(shù)分鐘后的結(jié)構(gòu)信息,以此進(jìn)行狀態(tài)估計(jì)與預(yù)警,而非長期預(yù)測。本研究選擇時(shí)間序列分析法,基于ARIMA模型,研究FAST結(jié)構(gòu)應(yīng)力監(jiān)測信號的預(yù)測方法,使用二階差分將信號平穩(wěn)化,結(jié)合信號自相關(guān)與偏自相關(guān)圖以及赤池信息準(zhǔn)則對模型完成定階,并應(yīng)用實(shí)測數(shù)據(jù)評價(jià)了模型預(yù)測效果。
光纖Bragg光柵應(yīng)變計(jì)輸出原始信息為調(diào)制的波長信號,與被測點(diǎn)應(yīng)變值存在對應(yīng)關(guān)系,當(dāng)溫度、應(yīng)變變化范圍不大時(shí),傳感器輸出波長信號為
其中:ΔT為溫度荷載變化值,Δε為監(jiān)測應(yīng)力變化值,KT為溫度靈敏系數(shù),Kε為應(yīng)變靈敏系數(shù),KC為常數(shù)。實(shí)際應(yīng)用中,溫度項(xiàng)對應(yīng)變的干擾可通過溫度補(bǔ)償剔除,為簡化分析,本研究直接使用傳感器輸出原始波長信號進(jìn)行預(yù)測。
提取2019年7月17日1號測點(diǎn)原始輸出波長信息,由于監(jiān)測信息采樣周期較短為1 s,經(jīng)數(shù)據(jù)采集系統(tǒng)剔除無效異常值后,數(shù)據(jù)庫中每日數(shù)據(jù)累計(jì)近7萬條,為降低數(shù)據(jù)量,先對數(shù)據(jù)進(jìn)行采樣壓縮處理。作為結(jié)構(gòu)應(yīng)力測點(diǎn),其主要有效負(fù)荷變化周期較長,選擇采樣壓縮周期Ts為120 s,滿足采樣定理fs>2fmax要求。設(shè)原始數(shù)據(jù)樣本索引為i,原始數(shù)據(jù)序列為λorigin,序列長度為Norigin,保留每個(gè)數(shù)據(jù)點(diǎn)對應(yīng)的實(shí)際采樣時(shí)刻,采樣后數(shù)據(jù)序列λs為
原始測量信號中,常包含測量誤差、系統(tǒng)誤差、噪聲干擾和局部跳變等問題,致使數(shù)據(jù)存在不平滑異常。對壓縮數(shù)據(jù)使用移動(dòng)平均(moving average,MA)[12]消除壓縮數(shù)據(jù)中此類異常的影響,使數(shù)據(jù)曲線更為平滑。移動(dòng)平均可過濾系統(tǒng)中存在的高頻和周期性誤差,常用計(jì)算方法有,簡單移動(dòng)平均和加權(quán)移動(dòng)平均等類型,使用簡單移動(dòng)平均法,計(jì)算公式為
其中:λ(t)為變量λs(t)移動(dòng)平均后的值,N是移動(dòng)平均窗口的大小。選擇N=10,對壓縮數(shù)據(jù)序列λs進(jìn)行移動(dòng)平均后,得到移動(dòng)平均信號數(shù)據(jù)序列λ作為本研究實(shí)際監(jiān)測值,壓縮數(shù)據(jù)與移動(dòng)平均數(shù)據(jù)如圖1所示。
圖1 壓縮數(shù)據(jù)與移動(dòng)平均數(shù)據(jù)Fig.1 Compressed data and moving average data
ARIMA模型是在自回歸模型(AR)和滑動(dòng)平均模型(MA)基礎(chǔ)上發(fā)展出的方法,通過差分法將非平穩(wěn)時(shí)間序列平穩(wěn)化,克服AR模型和MA模型僅可處理平穩(wěn)時(shí)間序列的缺點(diǎn),廣泛應(yīng)用于經(jīng)濟(jì)增長、人口數(shù)量變化、市場價(jià)格變化、工程監(jiān)測信號預(yù)測等領(lǐng)域[13-14]。ARIMA模型記為ARIMA(p,d,q)算法模型一般表達(dá)式為
其中:B為差分延遲算子,Φ(B)為自回歸系數(shù)多項(xiàng)式,Θ(B)為移動(dòng)平均系數(shù)多項(xiàng)式,Xt為原始信號,εt是均值為0的白噪聲序列,p為AR模型階數(shù),q為MA模型階數(shù),d為差分階數(shù),當(dāng)q為0時(shí)模型退化為AR模型,d為0時(shí)退化為ARMA模型,p為0時(shí)模型退化為MA模型,其更一般的表達(dá)形式為
其中:yt為算法在t時(shí)刻的輸入信號的預(yù)測值,可輸入差分信號,φi,θj均為待估參數(shù)。在實(shí)際應(yīng)用中,主要包括檢驗(yàn)時(shí)間序列平穩(wěn)性與處理,模型定階,模型檢驗(yàn)及預(yù)測4個(gè)步驟。
觀察作為實(shí)際值的原始信號數(shù)據(jù)序列λ可見其存在明顯的趨勢并不平穩(wěn),對其做一階與二階差分,組成兩個(gè)新的序列,d次差分方程:
其中:B為延遲算子,ωt為差分后的數(shù)列。
利用單位根檢驗(yàn)法(ADF檢驗(yàn))對其進(jìn)行平穩(wěn)性檢驗(yàn),若存在單位根,說明序列不平穩(wěn)。檢驗(yàn)結(jié)果如表1所示,分析可知,一階與二階差分信號檢驗(yàn)結(jié)果為-3.979 292與-6.636 427,均小于各水平臨界值,檢驗(yàn)統(tǒng)計(jì)量接近于0,拒絕原假設(shè),不存在單位根,屬于平穩(wěn)信號,其中二階差分平穩(wěn)性更好,本例選二階差分作為輸入信號,定階d為2。
表1 ADF單位根檢驗(yàn)Table 1 ADF Test
通過繪制自相關(guān)ACF與偏自相關(guān)PACF圖像,分析偏自相關(guān)函數(shù)圖的拖尾性、截尾性,通過曲線第一次穿過上置信區(qū)間的橫坐標(biāo)確定p、q值,自相關(guān)ρk與偏自相關(guān)φkk函數(shù)表達(dá)式[15]為
其中:yt表示t時(shí)刻隨機(jī)序列取值,ˉy表示其均值,φkk=φk-1,φkkφk-j,二階差分信號自相關(guān)圖(ACF)與偏自相關(guān)圖(PACF)如圖2所示。
圖2 二階差分信號自相關(guān)與偏自相關(guān)圖Fig.2 ACF and PACF of second order differential signal
可見ACF圖在9、10、11階有異常凸起,PACF在9、10、20、30、40處也有明顯凸起,并非完全截尾。進(jìn)一步確定參數(shù)可結(jié)合最小AIC準(zhǔn)則即赤池信息準(zhǔn)則[16]確定,選擇AIC值最小的模型,AIC一般計(jì)算公式為
其中:K為參數(shù)數(shù)量,L為似然函數(shù)。
最終選擇p,q為4,9,建立ARIMA(4,2,9)模型,其AIC值為-6 453.6。使用信號二階差分序列進(jìn)行訓(xùn)練得模型系數(shù)為
常數(shù)項(xiàng):0.224 871 8;
AR系數(shù):-28.824 789 52,-17.974 262 53,-16.771 701 12,-21.589 047 91;
MA系數(shù):0,0,0,0,0,1.836 826 01,0,3.078 208 63,3.798 704 94。
為評價(jià)模型預(yù)測結(jié)果,使用均方根誤差RMSE進(jìn)行評價(jià),考慮了真實(shí)值與誤差值的差值與樣本容量的比值,公式為
其中:λactual為真實(shí)值序列即λ,λpredicted為模型預(yù)測差分值還原后對應(yīng)的預(yù)測信號序列。差分信號實(shí)際值與預(yù)測值如圖3所示。
圖3 二階差分信號實(shí)際值與預(yù)測值Fig.3 Actual value and predicted value of second order differential signal
可見差分信號的實(shí)際值與預(yù)測值規(guī)律一致,但是幅值有較大差別,實(shí)際上,差值與原始信號比值非常小,還原為原始序列后,如圖4所示,圖中為方便區(qū)別,預(yù)測值向左平移繪制。還原后模型擬合曲線與真實(shí)值幾乎完全重合,RMSE=0.001 3 nm,可見模型預(yù)測效果良好。
圖4 實(shí)際值與模型擬合預(yù)測值Fig.4 Actual value and model predicted value
應(yīng)用該模型進(jìn)行短期預(yù)測,每次預(yù)測為使用歷史數(shù)據(jù)對下一采樣周期值的預(yù)測,對應(yīng)實(shí)際信號,預(yù)測的提前時(shí)間為120 s,可見短期內(nèi)信號預(yù)測效果良好。也可使用模型預(yù)測值本身,對未來較長一個(gè)時(shí)間段內(nèi)進(jìn)行預(yù)測,應(yīng)用ARIMA(4,2,9)模型,將實(shí)際值數(shù)據(jù)序列λ進(jìn)行分割,前70%數(shù)據(jù)作為訓(xùn)練集進(jìn)行訓(xùn)練,使用模型對剩下30%的測試集部分進(jìn)行預(yù)測并比較,重復(fù)前述步驟,結(jié)果如圖5所示。
圖5 長期預(yù)測實(shí)際值與預(yù)測值Fig.5 Actual value and model predicted value in long-term
預(yù)測結(jié)果在一定程度上可反映信號變化趨勢,但是預(yù)測值與真實(shí)值之間存在較大偏差,RMSE=0.179 1 nm。主要由于數(shù)據(jù)采樣點(diǎn)較密集,30%測試序列包含了160個(gè)數(shù)據(jù)點(diǎn),監(jiān)測值變化與數(shù)值本身數(shù)據(jù)量比值較小,接近千分之一,差分信號內(nèi)在趨勢規(guī)律不夠明顯。長期預(yù)測中,預(yù)測結(jié)果與對模型階數(shù)非常敏感,容易出現(xiàn)過擬合狀態(tài),需合理定階。
使用ARIMA模型對FAST結(jié)構(gòu)應(yīng)力監(jiān)測信號進(jìn)行預(yù)測,需對信號進(jìn)行差分平穩(wěn)化,預(yù)測結(jié)果還原后,在長期預(yù)測中,ARIMA模型可以反應(yīng)信號變化趨勢,但存在較大誤差。但短期內(nèi)預(yù)測結(jié)果RMSE=0.001 3 nm,模型預(yù)測精度高。本研究中預(yù)測提前時(shí)間為2 min,若想延長預(yù)測時(shí)間,在數(shù)據(jù)壓縮階段可增加采樣周期,如改為600 s,即可實(shí)現(xiàn)提前10 min的預(yù)測,測試依然具有較高的預(yù)測精度,滿足FAST結(jié)構(gòu)應(yīng)力監(jiān)測信號的應(yīng)用需求。
方法利用結(jié)構(gòu)應(yīng)力信號時(shí)序上的依存性,采用ARIMA模型,僅依賴監(jiān)測數(shù)據(jù)本身內(nèi)生變量實(shí)現(xiàn)結(jié)構(gòu)應(yīng)力的預(yù)測,不需要復(fù)雜的結(jié)構(gòu)物理模型建模或其他相關(guān)荷載信息的支持,既考慮了應(yīng)力的發(fā)展趨勢規(guī)律,也考慮了隨機(jī)波動(dòng)信號的干擾,其預(yù)測結(jié)果有利于結(jié)構(gòu)異常狀態(tài)的早期預(yù)警。