駱正山,秦越,張新生,畢傲睿
(西安建筑科技大學(xué) 管理學(xué)院,西安 710055)
在役海底油氣管線通常處于復(fù)雜惡劣的海洋環(huán)境中,管段經(jīng)常會(huì)遭受嚴(yán)重腐蝕,從而造成管段結(jié)構(gòu)破壞與經(jīng)濟(jì)損失[1]。對(duì)于陸上管道,可通過各種檢測(cè)方法了解管道的腐蝕狀況,但對(duì)海洋環(huán)境中管道的檢測(cè)相對(duì)困難,利用機(jī)器學(xué)習(xí)算法預(yù)測(cè)管道腐蝕速率是一種較為理想的方法[2-3]。因此,研究海底管道的腐蝕機(jī)理和規(guī)律,建立準(zhǔn)確、有效的預(yù)測(cè)模型具有十分重要的現(xiàn)實(shí)意義。
目前,國(guó)內(nèi)學(xué)者對(duì)海底油氣管道的腐蝕行為進(jìn)行了大量研究。駱正山等[4]建立了海底油氣管道腐蝕速率預(yù)測(cè)的Frechet 分布模型,該模型只預(yù)測(cè)了油氣管道的腐蝕深度和管道壽命,未表明預(yù)測(cè)誤差。同時(shí),駱正山等[5]建立了基于誤差補(bǔ)償?shù)腉M-RBF 海底輸油管道腐蝕速率的預(yù)測(cè)模型,該研究將GM 模型用于預(yù)測(cè)腐蝕速率,但模型預(yù)測(cè)誤差較大。王慶鋒[6]等基于GM(1,1)模型建立了無偏灰色GM(1,1)模型,構(gòu)建的無偏灰色馬爾可夫鏈組合模型可對(duì)管線腐蝕剩余壽命進(jìn)行預(yù)測(cè)。但傳統(tǒng)單維灰色模型分析法以時(shí)間序列為軸線,未能表明其他環(huán)境因素的相互聯(lián)系及其對(duì)響應(yīng)變量的具體影響。鄧志安等[7]建立了GRA-FNN模型,對(duì)海洋管線腐蝕速率進(jìn)行了預(yù)測(cè),但灰色關(guān)聯(lián)分析中的各指標(biāo)均需人為確定,主觀性強(qiáng)。李響等[8]構(gòu)建了遺傳算法SVM 模型,對(duì)海洋環(huán)境腐蝕速率進(jìn)行了預(yù)測(cè),解決了BP 神經(jīng)網(wǎng)絡(luò)等智能算法需要大量訓(xùn)練樣本的問題,但SVM 參數(shù)選取較為復(fù)雜,收斂速度不夠快。以上的研究均存在諸如影響因素考慮欠全面、算法迭代速度較慢和預(yù)測(cè)精度不夠高等問題。
鑒于此,本文提出了一種將套索回歸(LASSO)、鯨魚優(yōu)化算法(WOA)和最小二乘支持向量機(jī)(LSSVM)有機(jī)結(jié)合的海底管道腐蝕預(yù)測(cè)新方法。采用LASSO 回歸,約簡(jiǎn)樣本指標(biāo),提取主要變量,并使用WOA 對(duì)LSSVM 的核函數(shù)寬度和懲罰因子兩個(gè)參數(shù)進(jìn)行了優(yōu)化,建立了LASSO-WOA-LSSVM 的海底管道腐蝕速率預(yù)測(cè)模型,以海洋掛片實(shí)驗(yàn)數(shù)據(jù)為例進(jìn)行實(shí)證研究,通過指標(biāo)和對(duì)比,對(duì)模型性能進(jìn)行驗(yàn)證和分析。
影響海底管道腐蝕速率的因素眾多,其主要影響因素為以下五項(xiàng):海水溫度[9]、溶解氧含量[10]、鹽度[11]、pH 值[12]和氧化還原電位[13]。
在建立腐蝕回歸模型時(shí),若將某些對(duì)因變量影響較小的影響因子選入模型,會(huì)降低模型的預(yù)測(cè)精確度[14]。故在腐蝕失效預(yù)測(cè)前,應(yīng)先對(duì)海洋管線的各腐蝕因素進(jìn)行分析,篩選出關(guān)鍵因素。
LASSO(Least Absolute Shrinkage and Selection Operator)即最小絕對(duì)值壓縮選擇算法[15-17],是Tishirani 提出的一種非負(fù)干擾激勵(lì)的變量選擇方法。該方法通過構(gòu)造懲罰函數(shù)來壓縮變量系數(shù),使壓縮后某些絕對(duì)值較小的系數(shù)直接變?yōu)榱?,這些變量將被刪除,從而同時(shí)達(dá)到降維與參數(shù)選擇的目的。
假設(shè)給定數(shù)據(jù)集(X,Y),X是自變量向量,Xi(i=1,2, …,n),Y是因變量向量,Yi(i=1, 2, …,n),系數(shù)向量為β(β1,β2, …,βm)。令β=(β1,β2, …,βm)T,則LASSO 的估計(jì)量為:
式中,Xi是第i組自變量,Yi是對(duì)應(yīng)于Xi的因變量的值,Xi經(jīng)標(biāo)準(zhǔn)化后得到Xij,βj是回歸系數(shù),n為組數(shù),t為非負(fù)調(diào)整參數(shù)。λ是正則化參數(shù),λ越小,懲罰項(xiàng)的力度越小,模型保留變量越多;λ越大,懲罰項(xiàng)的力度越大,模型保留變量越少。
最小二乘支持向量機(jī)(LSSVM)[18-19]是一種基于傳統(tǒng) SVM 算法的改進(jìn)算法,在對(duì)偶空間中,LSSVM 通過用等式代替不等式約束,并將線性最小二乘準(zhǔn)則應(yīng)用于損失函數(shù)優(yōu)化,實(shí)現(xiàn)了凸二次規(guī)劃問題向線性方程組問題的求解轉(zhuǎn)變,提高了收斂速度[20]。LSSVM 的實(shí)現(xiàn)過程如下:
(1)給定訓(xùn)練集D={(xi,yi)|i=1, 2, …,n},xi∈Rn是第i個(gè)輸入樣本,yi∈{-1,+1}是輸出變量組。
(2)在高維空間中構(gòu)造回歸函數(shù):ω為可調(diào)權(quán)向量,φ(x)是非線性核映射函數(shù),b為偏差參數(shù)。
(3)根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小準(zhǔn)則,最優(yōu)ω和b可經(jīng)下述函數(shù)最小化得到:
其中,C是平衡訓(xùn)練誤差與模型適應(yīng)度的正則化參數(shù),ξi是隨機(jī)誤差。
(4)為解決LSSVM 的優(yōu)化問題,構(gòu)造如下拉格朗日函數(shù):
此處的αi是Lagrange 乘子。根據(jù)KKT(Karush-Kuhn-Tucker)條件,分別求解L(ω,b,ξ,α)對(duì)ω、b、ξ、α的偏微分,可得:
(5)消除ω和ξi,并以矩陣形式表達(dá):
(6)最后,在求解優(yōu)化問題后,得到函數(shù)估計(jì)的線性模型:
鯨魚優(yōu)化算法(WOA)是澳大利亞學(xué)者Seyedali Mirjalili 于2016 年提出的一種新的元啟發(fā)式算法[21-24]。在發(fā)現(xiàn)獵物后,座頭鯨先潛入獵物的底部,然后沿著圓圈形路徑形成獨(dú)特的氣泡,如圖1 所示。與此同時(shí),座頭鯨從上游到達(dá)海面,通過氣泡將獵物圍在較小的范圍內(nèi)吞食。WOA 的工作分為以下三個(gè)部分:收縮包圍、氣泡網(wǎng)狩獵和搜索獵物。
圖1 座頭鯨螺旋氣泡攻擊捕獵行為示意Fig.1 Spiral bubble attack hunting behavior of humpback whales
在收縮包圍階段,座頭鯨首先會(huì)對(duì)獵物進(jìn)行環(huán)繞式包圍,該過程可用以下方程描述:
式中,t為迭代的次數(shù),X*(t)為當(dāng)前鯨魚的最優(yōu)位置向量,X(t)為當(dāng)前鯨魚的位置向量,X(t+1)代表迭代后下一次的目標(biāo)位置向量,A、C為系數(shù)向量,定義如式(12)、(13)。
式中,r是區(qū)間[0,1]內(nèi)的隨機(jī)向量,a值由2 線性減小至0。
其次是開發(fā)階段,該過程實(shí)現(xiàn)了收縮包圍機(jī)制和螺旋更新位置機(jī)制,其數(shù)學(xué)模型如下:(1)收縮包圍機(jī)制,在該過程中,A是在[a,–a]之間的某隨機(jī)數(shù),其值隨迭代過程由2 減小至0。(2)螺旋更新位置機(jī)制,在該機(jī)制中,座頭鯨以螺旋狀運(yùn)動(dòng)方式接近獵物,該過程的模擬方程如式(14)所示。
式中,D′=|X*(t)–X(t)|,代表鯨魚與當(dāng)前最優(yōu)位置間的距離,常數(shù)b表征螺旋線的形狀,l是一個(gè)在[–1,1]中的隨機(jī)數(shù)。
座頭鯨在進(jìn)行捕獵時(shí),按照50%的概率實(shí)施以上兩種捕食策略,其過程如下式所示:
其中,p代表[0,1]之間的隨機(jī)變量,a值會(huì)隨著鯨魚靠近獵物而減小。若|A|<1,鯨魚將進(jìn)攻獵物;若|A|>1,鯨魚將會(huì)放棄獵物并重新進(jìn)行搜尋。
最后是探索階段。設(shè)定隨機(jī)值|A|≥1,該階段的數(shù)學(xué)模型如下:
其中,Xrand是所在種群中的隨機(jī)代理位置向量。
在LSSVM 模型中,模型預(yù)測(cè)性能受懲罰因子C和核函數(shù)寬度σ兩個(gè)參數(shù)的影響較大,故本文采用WOA 對(duì)參數(shù)進(jìn)行優(yōu)化,以提高模型的回歸性能。具體過程描述如下。
首先對(duì)樣本集進(jìn)行歸一化,并設(shè)定初始參數(shù),即對(duì)運(yùn)行過程中4 個(gè)參數(shù)的初值進(jìn)行設(shè)置,分別是鯨魚種群規(guī)模、最大迭代次數(shù)Tmax、鯨魚種群位置的上限與下限。其次,對(duì)種群位置進(jìn)行初始化,定義適應(yīng)度函數(shù),即將預(yù)測(cè)值與實(shí)際值的均方差作為適應(yīng)度函數(shù),并對(duì)個(gè)體適應(yīng)度進(jìn)行計(jì)算,選擇出當(dāng)前最優(yōu)適應(yīng)度個(gè)體,設(shè)置該個(gè)體的位置為當(dāng)前最優(yōu)。若t 圖2 腐蝕預(yù)測(cè)流程Fig.2 Flow chart of corrosion prediction 為了驗(yàn)證WOA-LSSVM 模型的預(yù)測(cè)效果,本文選擇以下三項(xiàng)指標(biāo)對(duì)模型性能進(jìn)行分析,即均方根誤差(Root Mean Square Error, RMSE)、平均絕對(duì)百分誤差(Mean Absolute Percentage Error, MAPE)和決定系數(shù)(Coefficient of Determination,R2)。計(jì)算公式如下: 其中,n是樣本總量,iy為測(cè)試樣本的預(yù)測(cè)值,yi為真實(shí)值。決定系數(shù)R2介于0 到1 之間,且越接近1,模型擬合度越高,性能越優(yōu)良。 表1 提供了在不同海水環(huán)境參數(shù)下50 組海洋掛片腐蝕速率的數(shù)據(jù)[25],以電流密度(1 μA/cm2)為單位來表征腐蝕速率,鋼材腐蝕情況見圖3。 圖3 鋼材腐蝕形貌圖Fig.3 Corrosion morphology of steel 表1 海洋掛片腐蝕數(shù)據(jù)Tab.1 Test data of marine corrosion 首先通過交叉驗(yàn)證法確定LASSO 回歸模型的懲罰力度,由圖4 可知,經(jīng)交叉驗(yàn)證得到的正則化參數(shù)λ為0.297 15。圖5 為在λ為不同取值下各變量懲罰函數(shù)值的變化情況及篩選結(jié)果。由圖5 可知,當(dāng)λ為0.297 15 時(shí),有兩個(gè)變量的懲罰函數(shù)值收斂為0,故將這兩個(gè)變量剔除,篩選后,得到海洋管線腐蝕速率的影響變量為溫度、溶解氧含量和pH 值。 圖4 交叉驗(yàn)證過程Fig.4 Cross validation process 圖5 LASSO 擬合的系數(shù)軌跡Fig.5 Coefficient trajectories fitted by LASSO 將經(jīng)篩選后的數(shù)據(jù)分為兩組,選取其中42 組作為WOA-LSSVM 的訓(xùn)練集,其余8 組為檢測(cè)集,模型在訓(xùn)練中的迭代進(jìn)化過程如圖6 所示。經(jīng)迭代尋優(yōu)后的最優(yōu)參數(shù)Cbest=619.2068,σ2best=14.8045,并將兩參數(shù)代入到LSSVM 中進(jìn)行預(yù)測(cè)。 圖6 WOA-LSSVM 迭代過程Fig.6 Iteration process of WOA-LSSVM 圖7 預(yù)測(cè)結(jié)果對(duì)比圖Fig.7 Comparison of prediction results 為檢驗(yàn)WOA-LSSVM 模型的預(yù)測(cè)精度,選用FOA-LSSVM 和LSSVM 兩個(gè)模型與之進(jìn)行對(duì)比,結(jié)果如圖7 所示,相對(duì)誤差對(duì)比結(jié)果見圖8 和表2。由圖7 可以看出,相較于LSSVM 和FOA-LSSVM 兩個(gè)模型,WOA-LSSVM 的預(yù)測(cè)值與真實(shí)值的差距較小,擬合效果更佳。結(jié)合圖8 和表2 的分析可知,除第7、8 兩組數(shù)據(jù)外,WOA-LSSVM 的預(yù)測(cè)相對(duì)誤差均小于其余兩個(gè)模型。且就相對(duì)誤差的平均值來看,LSSVM、FOA-LSSVM、WOA-LSSVM 的平均相對(duì)誤差分別為8.01%、6.28%、2.23%,WOA-LSSVM 的平均相對(duì)誤差值明顯低于另外兩者,亦可證明該模型的預(yù)測(cè)精度最高。 為進(jìn)一步評(píng)價(jià)模型的預(yù)測(cè)性能,采用前文所述的三個(gè)統(tǒng)計(jì)學(xué)指標(biāo)對(duì)模型進(jìn)行評(píng)價(jià),其分析結(jié)果見表3。從均方根誤差(RMSE)這個(gè)指標(biāo)來看,WOA-LSSVM分別比FOA-LSSVM 和LSSVM 減少了0.6107 和0.8939;從平均絕對(duì)百分誤差(MAPE)這個(gè)指標(biāo)來看,WOA-LSSVM 又分別比兩者降低了 4.06%和5.79%。而 WOA-LSSVM 的決定系數(shù)R2達(dá)到了0.9708,遠(yuǎn)高于兩個(gè)對(duì)照模型,說明模型的擬合度較高,預(yù)測(cè)效果更好。 圖8 相對(duì)誤差對(duì)比圖Fig.8 Comparison of relative errors 表2 預(yù)測(cè)相對(duì)誤差結(jié)果分析Tab.2 Analysis of relative error results 表3 模型預(yù)測(cè)性能指標(biāo)對(duì)比Tab.3 Comparison of model performance indicators 由于海洋環(huán)境復(fù)雜多變,影響管道腐蝕速率的因素較多,且某些指標(biāo)難以測(cè)量和定量化,故在實(shí)際研究中無法將海洋掛片數(shù)據(jù)的所有影響指標(biāo)納入分析。未來可根據(jù)綜合指標(biāo)的管線腐蝕數(shù)據(jù)進(jìn)行分析預(yù)測(cè),進(jìn)一步提高海洋管線外腐蝕速率預(yù)測(cè)的精確性和科學(xué)性。 1)采用LASSO 回歸算法,確定海底管道腐蝕速率的主要影響指標(biāo),降低了LSSVM 輸入變量的維度。作為傳統(tǒng)支持向量機(jī)的改良,使用最小二乘支持向量機(jī)避免了二次規(guī)劃問題的求解,提高了收斂速度,節(jié)約了運(yùn)算成本。 2)使用WOA 對(duì)LSSVM 的懲罰因子C和核函數(shù)寬度σ2兩個(gè)參數(shù)進(jìn)行優(yōu)化,將預(yù)測(cè)的平均相對(duì)誤差降低至2.23%,提高了迭代速度和預(yù)測(cè)精度,證明了模型具有較高的可靠性和良好的預(yù)測(cè)性能,也為深海油氣集輸系統(tǒng)平臺(tái)等結(jié)構(gòu)的安全風(fēng)險(xiǎn)預(yù)警與防范提供了較為可靠的數(shù)據(jù)和理論支持。2.3 模型驗(yàn)證指標(biāo)
3 實(shí)例應(yīng)用
3.1 數(shù)據(jù)準(zhǔn)備
3.2 LASSO 變量選擇
3.3 結(jié)果分析與模型對(duì)比
4 結(jié)論