劉 翔
中國石油天然氣股份有限公司華北油田分公司,河北任丘 062550
目前,研究人員針對管道應(yīng)力安全性進行了大量研究[1-3],張航[4]采用非線性土彈簧模型建立滑坡作用下管道的受力模型,得到了不同滑坡作用下的受力規(guī)律;何亞瑩[5]采用光纖傳感技術(shù)對管道應(yīng)力進行監(jiān)測,并通過有限元分析驗證了光纖傳感技術(shù)的準確性;El-ABBASY等[6]采用ANN神經(jīng)網(wǎng)絡(luò)對管道狀態(tài)進行了預(yù)測,根據(jù)健康狀態(tài)定義了衰退曲線;劉玉卿等[7]采用振弦傳感器分析了管道軸向應(yīng)力分量與真實軸向應(yīng)力的關(guān)系,推導(dǎo)出了監(jiān)測值與軸向應(yīng)力的關(guān)系公式。以上研究多涉及如何建立傳感器與管道應(yīng)力應(yīng)變關(guān)系的模型,以及短期管道應(yīng)力的預(yù)測,對于監(jiān)測數(shù)據(jù)本身的挖掘不夠,且對于今后是否發(fā)生管土分離或管道位移無法判斷。應(yīng)力監(jiān)測數(shù)據(jù)屬于時間序列,具有非線性特征,而傳統(tǒng)的時間序列預(yù)測模型的預(yù)測方法是線性的,且未考慮不同因素對監(jiān)測數(shù)據(jù)的影響。綜上,將自回歸滑動平均(ARIMA)模型與長短時記憶(LSTM)模型進行組合,分別用于預(yù)測應(yīng)力監(jiān)測數(shù)據(jù)的線性和非線性部分,并采用自適應(yīng)人工魚群算法(IAFSA)對LSTM模型的關(guān)鍵參數(shù)進行求解,為后續(xù)管道的安全評價提供理論依據(jù)。
應(yīng)力監(jiān)測數(shù)據(jù)受之前狀態(tài)和外部環(huán)境擾動影響,時間序列中既包含自回歸模型(AR),也包含滑動平均模型(MA),加入差分變換對時間序列進行平穩(wěn)性檢驗,最終形成ARIMA模型[8-10]。定義自回歸階數(shù)p、差分次數(shù)d和滑動平均階數(shù)q,得到:
式中:φ(B)為AR多項式;B為后移算子;?為長期高階差分算子;yt為時間序列;θ(B)為MA多項式;εt為服從正態(tài)分布的均為0的誤差項;φp和θq分別為自回歸系數(shù)和滑動平均系數(shù)。
LSTM模型是循環(huán)神經(jīng)網(wǎng)絡(luò)的變體,解決了循環(huán)神經(jīng)網(wǎng)絡(luò)易出現(xiàn)梯度消散和梯度爆炸的問題[11]。通過引入“門”進行邏輯控制以決定數(shù)據(jù)是丟棄還是更新,使LSTM模型適用于長時間序列的記憶[12]。LSTM模型中包含更新門ot、輸出門it和遺忘門ft,每個門控結(jié)構(gòu)均由Sigmoid激活函數(shù)和點積操作組成。
定義wf、wi、wc、wo分別為遺忘門、更新門、長程記憶單元、輸出門在t-1時刻h(h為各門控結(jié)構(gòu)的輸出狀態(tài))的權(quán)重,即循環(huán)層權(quán)重;uf、ui、uc、uo分別為遺忘門、更新門、長程記憶單元、輸出門在t時刻x(x為各門控結(jié)構(gòu)的輸入狀態(tài))的權(quán)重,即輸入層權(quán)重;bf、bi、bc、bo分別為遺忘門、更新門、長程記憶單元、輸出門的偏置參數(shù)。遺忘門是輸入數(shù)據(jù)進入LSTM模型中經(jīng)過的第一道門結(jié)構(gòu),可去除單元狀態(tài)中的無用歷史信息,見式(2):
式中:ft為遺忘門的激活值;ht-1為t-1時刻的輸出;xt為t時刻的輸入。
更新門用于決定哪些信息存儲至單元狀態(tài),分別通過Sigmoid和Tanh激活函數(shù)更新,見式(3)、式(4):
式中:it為輸入門的激活值;表示單元狀態(tài)在t時刻的更新數(shù)據(jù)。
輸出門決定哪些有用信息需保留,見式(5):
式中:ot更新門的激活值。
LSTM模型中隱含層神經(jīng)元個數(shù)、時間步長和dropout參數(shù)的選取,直接影響模型的預(yù)測精度。為減少人為選取參數(shù)對模型魯棒性的影響,采用IAFSA算法對其求解。
AFSA算法是模仿水中魚群捕食行為的仿生學(xué)算法,具有并行性、簡單性、全局性和快速性的特點,且對初值選取不敏感,不易陷入局部最優(yōu),包括覓食、群聚和追尾三個行為。
覓食行為是基于魚群向食物更多的水域移動,定義魚的當(dāng)前位置為Li,魚的隨機位置為Lj,當(dāng)Lj的適應(yīng)度值Fj優(yōu)于Li的適應(yīng)度值,魚從Li向Lj移動一個步長,否則反復(fù)覓食,達到迭代次數(shù)后仍沒有移動,則隨機移動一步,見式(6):
式中:v為魚的感知范圍;rand為0~1的隨機數(shù)。
群聚行為是基于落單的個體向群體聚集,當(dāng)周邊伙伴的中心位置Lc狀態(tài)較優(yōu)且不擁擠時,魚從Li向Lc移動一個步長,否則執(zhí)行覓食行為。
追尾行為是基于每個個體會追隨周邊最活躍的個體,當(dāng)周邊伙伴的最優(yōu)位置Lr不擁擠時,魚從Li向Lr移動一個步長,否則執(zhí)行覓食行為。
以上行為分別產(chǎn)生了覓食、群聚、追尾和自身的適應(yīng)度值Fj、Fc、Fr、Fi,選擇上述最優(yōu)的適應(yīng)度值,記為Fp,將Fp與初始化魚群參數(shù)得到的適應(yīng)度值Fg進行對比,如優(yōu)于Fg,則將Fp覆蓋Fg并寫入公告板,否則進行下一次迭代計算。
由式(7)可知,魚的感知范圍v直接影響覓食行為,為保證魚群個體具有全局搜索和局部開發(fā)的特點,保證結(jié)果在大面積范圍內(nèi)更新,將v進行自適應(yīng)改進,見式(7):
式中:vn和vn+1分別為本次迭代和下次迭代的魚的感知范圍;u和umax分別為當(dāng)前迭代次數(shù)和最大迭代次數(shù)。以迭代次數(shù)1 000,初始v=2.5進行模擬,見圖1。IAFSA算法相比傳統(tǒng)AFSA算法,在迭代初期收斂速度較快,在后期收斂速度較慢,符合全局和局部搜索的要求。
圖1 感知范圍變化曲線
具體預(yù)測步驟如下:
(1)線性部分采用ARIMA模型預(yù)測,對時間序列yt進行單步預(yù)測。
(2)根據(jù)應(yīng)力監(jiān)測原理列出影響等效應(yīng)力的因素,進行相關(guān)性分析,篩選構(gòu)建LSTM模型的輸入變量,對等效應(yīng)力進行非線性部分預(yù)測。
(3)在構(gòu)建LSTM模型的過程中,將隱含層單元個數(shù)、時間步長、dropout參數(shù)作為優(yōu)化對象,將均方誤差(MSE)作為適應(yīng)度函數(shù),采用IAFSA算法得到最優(yōu)的LSTM模型。
(4)通過權(quán)重系數(shù)將ARIMA和LSTM模型的預(yù)測結(jié)果相結(jié)合,采用誤差平方和最小計算權(quán)重系數(shù),將預(yù)測精度較大的模型賦予較大的權(quán)重,反之亦然,見式(8):
式中:Wi、Ei分別為第i種預(yù)測模型的權(quán)重和誤差平方和;m為預(yù)測模型種類,本文取2,一種為ARMIN,另一種為LSTM。
以某壓氣站內(nèi)壓縮機組出口管道彎頭處的應(yīng)力監(jiān)測結(jié)果為例進行介紹。管道管徑1 219 mm,壁厚15.2 mm,監(jiān)測系統(tǒng)由傳感器、數(shù)據(jù)采集器和監(jiān)測軟件等組成。其中,傳感器采用雙相直角電阻應(yīng)變片,沿管道0、3、6、9點鐘方向分別安裝,為防止應(yīng)變片失效,采用“一用一備”的方式安裝;數(shù)據(jù)采集器采用DH5971型分布式監(jiān)測系統(tǒng);監(jiān)測軟件為采集器自帶。
應(yīng)變片的測量原理是管道在外力作用下發(fā)生形變,應(yīng)變片的電阻與應(yīng)變呈正比,根據(jù)應(yīng)變與應(yīng)力的關(guān)系可求得應(yīng)力值。但當(dāng)環(huán)境溫度、運行壓力發(fā)生變化時,電阻絲因線脹系數(shù)與構(gòu)件材料不同會產(chǎn)生附加的壓縮或拉伸,即附加應(yīng)力,此時根據(jù)Wheatstone bridge原理進行溫度補償,采用半橋連接法,一根橋臂連接應(yīng)變片,一根橋臂連接溫度補償電阻。
將管道視為薄壁圓筒,其徑向應(yīng)力遠小于軸向應(yīng)力,故被測管道視為二向應(yīng)力狀態(tài),根據(jù)廣義胡克定律確定等效應(yīng)力σ:
式中:σα、σh、σ分別為軸向應(yīng)力、周向應(yīng)力、等效應(yīng)力,MPa;E為彈性模量,MPa;μ為泊松比;εα、εh分別為軸向應(yīng)變、周向應(yīng)變。
最終監(jiān)測到的等效應(yīng)力數(shù)據(jù)見圖2。將2021年3月8日~14日的數(shù)據(jù)作為訓(xùn)練樣本,將3月15日~18日作為預(yù)測樣本。
圖2 管道等效應(yīng)力監(jiān)測結(jié)果
進行ARIMA預(yù)測前需判斷時間序列的穩(wěn)定性,對圖2序列進行ADF單位根檢驗,結(jié)果見表1。原序列的顯著性檢驗概率P值大于0.01,且ADF的三個顯著性水平值也小于t檢驗臨界值,說明原序列存在單位根,為非平穩(wěn)序列,需進行拆分、對數(shù)或差分處理,但差分階數(shù)越大,信息損失越大,一般只進行一階或二階差分處理。對原序列取對數(shù)后,進行二階差分,見圖3。
表1 原序列的ADF檢驗結(jié)果
圖3 二階差分時間序列
二階差分后顯著性檢驗概率P值小于0.01,且ADF的三個顯著性水平值也均大于t檢驗臨界值,分別對應(yīng)有90%、95%和99%的把握拒絕原假設(shè)(原假設(shè)為序列存在單位根),說明差分后序列已具有良好平穩(wěn)性,即d=2。對平穩(wěn)序列進行高斯白噪聲檢驗,檢驗結(jié)果中概率P為5.413 5×10-5,小于0.01,說明處理后的樣本序列不是白噪聲序列,可以進行之后的模式識別和參數(shù)估計。
求解平穩(wěn)時間序列的自相關(guān)(ACF)系數(shù)和偏相關(guān)(PACF)系數(shù)進行初步的模型識別,判斷5%顯著性水平下ACF系數(shù)和PACF系數(shù)的個數(shù),見圖4、圖5。
圖4 ACF圖
圖5 PACF圖
ACF和PACF圖均呈拖尾現(xiàn)象,ACF系數(shù)在3階后截尾,但在5階時又達到了2倍標準差范圍的邊界;PACF系數(shù)在2階后截尾,但在5階、6階時又超過2倍標準差范圍。綜上所述,經(jīng)初步估算得知p≤6、q≤5。
采用最小信息準則(AIC)和貝葉斯準則(BIC)對p、q的具體取值進行分析,見表2。其中AIC值是模型擬合精度和參數(shù)個數(shù)的加權(quán)函數(shù),但AIC的擬合誤差隨樣本容量的增加而變大,BIC值考慮了樣本容量,可防止模型過擬合,AIC值、BIC值越小,說明模型的效果越優(yōu)。當(dāng)p=3、q=3時,AIC和BIC值最小(表2中紅色字體數(shù)值),由此確定ARIMA的模型參數(shù)為(3,2,3)。
預(yù)測結(jié)果見圖6,ARIMA模型的原理是通過前一時刻的序列集合預(yù)測下一時刻的數(shù)據(jù)變化,故前期數(shù)據(jù)點的預(yù)測值與真實值趨勢一致,后期預(yù)測值在波動中迅速收斂,最后形成一條直線,擬合效果較差,說明ARIMA模型只適合短期線性預(yù)測,對于非線性時間序列的適應(yīng)性不好。
表2 AIC、BIC統(tǒng)計結(jié)果
圖6 ARIMA預(yù)測結(jié)果
由式(9)~式(11)可知,管道等效應(yīng)力與軸向應(yīng)變、周向應(yīng)變相關(guān),此外管道在運行中還會受到壓力載荷和熱載荷的影響,將等效應(yīng)力與影響因素進行Person相關(guān)性分析,見表3。序列的長度,設(shè)置為[1,40];dropout參數(shù)包括輸入連接、失活參數(shù)和遞歸連接,故2層包括6個dropout參數(shù),設(shè)置為[0.01,0.5]。
設(shè)置人工魚群數(shù)量為10,移動步長為5,覓食次數(shù)為20,擁擠因子為0.5,感知范圍為1,迭代次數(shù)為200,允許誤差為10-3。設(shè)置好初始參數(shù)后,將訓(xùn)練樣本代入LSTM模型,并分別采用AFSA算法和IAFSA算法計算迭代情況,見圖7。AFSA算法和IAFSA算法分別在177次和120次迭代計算滿足允許誤差要求,且IAFSA算法在迭代過程中MSE值不斷下降,說明改進算法具有較快的收斂速度和較優(yōu)的收斂精度。收斂后其每層神經(jīng)元的個數(shù)分別為5、12,時間步長大小為5,dropout參數(shù)為[0.16,0.42,0.37,0.28,0.43,0.05]。
圖7 AFSA和IAFSA算法的迭代過程
表3 等效應(yīng)力相關(guān)性分析
軸向應(yīng)變與等效應(yīng)力的相關(guān)性最強,選擇相關(guān)系數(shù)大于0.5的因素,將軸向應(yīng)變、周向應(yīng)變、測試點溫度、壓力作為LSTM模型的輸入變量,將等效應(yīng)力作為LSTM模型的輸出變量。設(shè)置LSTM模型的層數(shù)為2,每層神經(jīng)元的個數(shù)根據(jù)Kolmogorov定理設(shè)置為[3,13];時間步長大小為輸入時間
將上述模型參數(shù)用于LSTM模型預(yù)測,見圖8。LSTM模型對等效應(yīng)力的預(yù)測效果較好,可以反映輸入與輸出節(jié)點之間的非線性關(guān)系,但仍存在部分的離群點,且有些數(shù)據(jù)點出現(xiàn)放棄和平移現(xiàn)象。放棄現(xiàn)象,即預(yù)測值圍繞某一點出現(xiàn)上下波動;平移現(xiàn)象,即預(yù)測值重復(fù)上一個預(yù)測值,類似預(yù)測滯后,見圖8放大圖中的綠色框部分。
圖8 LSTM預(yù)測結(jié)果
將ARIMA和LSTM模型進行組合,將訓(xùn)練樣本每個時間點的等效應(yīng)力權(quán)重值取算術(shù)平均,得到ARIMA模型和LSTM模型的權(quán)重系數(shù)分別為0.351 2、0.648 8。從預(yù)測結(jié)果看,組合模型的非線性預(yù)測能力有所改善,無較大的離群點,放棄和平移現(xiàn)象也得到改善,見圖9。以均方根誤差和決定系數(shù)作為指標評價模型的優(yōu)劣性(見表4)其中組合模型的均方根誤差最小,決定系數(shù)最大,說明預(yù)測曲線可真實反映實際應(yīng)力的長期變化情況,模型具有科學(xué)性和穩(wěn)定性。
圖9 組合模型預(yù)測結(jié)果
表4 不同模型預(yù)測效果對比
(1)采用電阻應(yīng)變片對管道應(yīng)力進行了監(jiān)測,根據(jù)監(jiān)測結(jié)果,分別采用ARIMA和LSTM模型進行預(yù)測,其中ARIMA模型在前期預(yù)測效果較好,后期較差;LSTM模型整體預(yù)測效果較好,但存在部分點預(yù)測結(jié)果不穩(wěn)定。
(2)通過相關(guān)系數(shù)分析,確定測試點的等效應(yīng)力與軸向應(yīng)力、周向應(yīng)力、測試點溫度、壓力等因素相關(guān)。
(3)ARIMA-LSTM模型的均方根誤差最小為0.09 MPa,決定系數(shù)最大為0.982 1,說明組合模型可用于長期應(yīng)力監(jiān)測,模型具有科學(xué)性和可行性。