高 帥
(中海石油(中國(guó)) 有限公司深圳分公司, 廣東 深圳 518000)
海底油氣輸送管道作為海上油氣田開發(fā)生產(chǎn)系統(tǒng)與處理系統(tǒng)的重要連接部分, 是海上油氣運(yùn)輸?shù)闹匾ǖ馈?海水中含有大量腐蝕性較強(qiáng)的天然電解質(zhì), 為電化學(xué)反應(yīng)創(chuàng)造了條件,海底管道一旦泄漏, 會(huì)造成重大的經(jīng)濟(jì)損失和環(huán)境污染[1-2]。 目前, 對(duì)于海底管道完整性的研究多偏向內(nèi)腐蝕, 但在復(fù)雜多變的海洋環(huán)境中,外腐蝕也是造成海底管道失效的原因之一[3]。 因此, 梳理海水腐蝕因素, 建立可靠的外腐蝕速率預(yù)測(cè)模型對(duì)于提高管道完整性管理水平有著重要意義。
目前, 國(guó)內(nèi)外學(xué)者針對(duì)海底管道腐蝕問(wèn)題開展了一系列研究。 張新生等[4]在考慮隨機(jī)效應(yīng)的前提下, 應(yīng)用貝葉斯網(wǎng)絡(luò)對(duì)腐蝕深度進(jìn)行預(yù)測(cè); 畢傲睿等[5]采用主成分分析對(duì)影響管道腐蝕的土壤因素進(jìn)行了篩選, 并結(jié)合維納退化過(guò)程對(duì)管道剩余壽命進(jìn)行了預(yù)測(cè); 王奇等[6]采用BP 神經(jīng)網(wǎng)絡(luò)對(duì)外腐蝕速率進(jìn)行了預(yù)測(cè); 者娜等[7]采用支持向量機(jī)模型對(duì)管道腐蝕速率進(jìn)行了預(yù)測(cè)。 以上成果對(duì)于海底管道腐蝕的研究具有一定意義, 但貝葉斯網(wǎng)絡(luò)、 BP 神經(jīng)網(wǎng)絡(luò)及支持向量機(jī)模型結(jié)構(gòu)復(fù)雜, 在訓(xùn)練過(guò)程中容易陷入局部最優(yōu)解; 主成分分析主要解決線性問(wèn)題, 對(duì)于海洋環(huán)境而言, 海底管道受多種腐蝕因素影響, 主成分分析無(wú)法適應(yīng)非線性、 小樣本的數(shù)據(jù)降維和映射問(wèn)題。 基于此, 采用核主成分分析(kernel principal components analysis,KPCA) 對(duì)影響海底管道腐蝕的因素進(jìn)行篩選, 并將數(shù)據(jù)代入極限學(xué)習(xí)機(jī) (extreme learning machine,ELM) 進(jìn)行訓(xùn)練[8], 采用遺傳算法(genetic algorithm,GA) 對(duì)ELM 的輸入權(quán)值和隱含層偏差進(jìn)行優(yōu)化, 建立外腐蝕速率預(yù)測(cè)模型, 以期為海底管道的安全運(yùn)行提供理論依據(jù)。
KPCA 在主成分分析基礎(chǔ)上引入核函數(shù)的概念, 對(duì)樣本xk(k=1,2,3,…m) 采用非線性函數(shù)φ (xk) 進(jìn)行變換, 將其從低維空間映射到高維空間F, 此時(shí)特征空間的協(xié)方差矩陣為
式中: a——核矩陣K 的特征向量。
由于徑向基函數(shù)可將數(shù)據(jù)映射到無(wú)限高維空間, 故選用該函數(shù)作為核函數(shù)。 經(jīng)計(jì)算, 提取累積方差百分比≥90%的主成分作為影響海底管道外腐蝕速率的主要因素。
ELM 算法[9]由黃廣斌教授提出, 用于訓(xùn)練單隱含層的前饋神經(jīng)網(wǎng)絡(luò), 可用于分類、 預(yù)測(cè)和回歸分析。 與BP 神經(jīng)網(wǎng)絡(luò)不同, ELM 算法的輸入權(quán)值和隱含層偏差均隨機(jī)產(chǎn)生, 輸出權(quán)值依據(jù)廣義逆矩陣?yán)碚摻馕銮蟪觯?無(wú)需誤差反向傳播訓(xùn)練權(quán)值, 具有訓(xùn)練參數(shù)少、 學(xué)習(xí)速度快、 魯棒性強(qiáng)的特點(diǎn)。
在KPCA 數(shù)據(jù)降維的基礎(chǔ)上, 利用ELM 算法挖掘腐蝕因素與腐蝕速率之間的內(nèi)在聯(lián)系, 從而預(yù)測(cè)腐蝕速率。 模型如下:
式中: yi——樣本輸出值;
xi——樣本輸入值;
wij——第i 個(gè)輸入層節(jié)點(diǎn)與第j 個(gè)隱含層節(jié)點(diǎn)之間的權(quán)值, 即輸入權(quán)值;
bj——隱含層神經(jīng)元偏差;
βjk——第j 個(gè)隱含層節(jié)點(diǎn)與第k 個(gè)輸出層節(jié)點(diǎn)之間的權(quán)值, 即輸出權(quán)值;
g (x) ——隱含層激活函數(shù);
m——隱含層節(jié)點(diǎn)數(shù), 當(dāng)給定隱含層的節(jié)點(diǎn)數(shù)后, 可依據(jù)廣義逆矩陣?yán)碚撚?jì)算輸出權(quán)值βjk, 使預(yù)測(cè)輸出值yi的誤差最小。
為動(dòng)態(tài)求解ELM 算法中的輸入權(quán)值和隱含層偏差, 采用GA 算法對(duì)其進(jìn)行優(yōu)化處理。 GA算法是模擬達(dá)爾文的生物進(jìn)化自然選擇和孟德爾的遺傳進(jìn)化過(guò)程來(lái)搜索最優(yōu)解, 屬于并行、 全局搜索方式, 可在搜索過(guò)程中自動(dòng)累積先驗(yàn)知識(shí),并自適應(yīng)控制搜索過(guò)程以獲得全局最優(yōu)解[10-11]。
為進(jìn)一步提高遺傳算法在不同階段的進(jìn)化適應(yīng)性, 對(duì)GA 算法進(jìn)行改進(jìn)。 引入反余弦函數(shù)改變交叉、 變異因子的計(jì)算方法, 在保證種群多樣性和穩(wěn)定性的前提下, 避免出現(xiàn)局部最優(yōu)解。 改進(jìn)公式如下:
式中: Pc和Pm——交叉、 變異因子;
Pcmax、 Pcmin——交叉因子的最大值和最小值;
Pmmax和Pmmin——變異因子的最大值和最小值;
Si——當(dāng)前適應(yīng)度;
Savg——適應(yīng)度平均值。
本研究提出的基于KPCA-GA-ELM 算法的腐蝕預(yù)測(cè)模型詳細(xì)流程如下:
(1) 數(shù)據(jù)預(yù)處理, 構(gòu)建海底管道外腐蝕評(píng)價(jià)指標(biāo)體系, 對(duì)數(shù)據(jù)進(jìn)行歸一化處理。 假設(shè)有N個(gè)腐蝕樣本, 影響因素為m 個(gè), (xi, yi) 為第i 個(gè)樣本數(shù)據(jù), 其中xi= [xi1, xi2, …xim] 作為輸入,yi作為輸出, 采用極值法進(jìn)行歸一化處理,
式中: x′ie——第i 個(gè)樣本的第e 個(gè)影響因素歸一化后的數(shù)據(jù);
xie——?dú)w一化前的原始數(shù)據(jù);
xemax和xemin——樣本范圍內(nèi)第e 個(gè)影響因素的最大值和最小值。
(2) 將處理后的數(shù)據(jù)代入KPCA 模型中進(jìn)行數(shù)據(jù)優(yōu)選。
(3) 將步驟 (2) 中數(shù)據(jù)分為訓(xùn)練集和驗(yàn)證集, 隨機(jī)抽取前者為44 組, 后者為6 組, 將訓(xùn)練集代入ELM 模型, 以預(yù)測(cè)值和真實(shí)值之間的平均相對(duì)變動(dòng)率(ARV) 作為適應(yīng)度函數(shù), 通過(guò)GA 模型的選擇、 交叉和變異, 經(jīng)多次迭代后不斷優(yōu)化ELM 算法中的輸入權(quán)值和隱含層偏差,得到最優(yōu)的GA-ELM 模型。
(4) 將驗(yàn)證集數(shù)據(jù)代入訓(xùn)練好的GA-ELM模型, 并采用均方誤差 (MSE)、 平均相對(duì)誤差(MAPE) 和相關(guān)系數(shù)R2評(píng)價(jià)預(yù)測(cè)結(jié)果, 其中MSE、 MAPE 的數(shù)值越小, 模型偏差越??; R2的值越接近1, 預(yù)測(cè)值與實(shí)際值之間的相關(guān)性越大, 擬合優(yōu)度越好。 公式如下,
式中: N——腐蝕樣本個(gè)數(shù);
yi——第i 個(gè)樣本的腐蝕速率實(shí)際值;
y*i——第i 個(gè)樣本的腐蝕速率預(yù)測(cè)值。
海底管道腐蝕主要與海洋環(huán)境中的物理、化學(xué)和生物因素有關(guān), 其中SRB (硫酸鹽還原菌) 和真菌等微生物對(duì)管道的腐蝕作用主要體現(xiàn)在細(xì)菌的新陳代謝上, 微生物產(chǎn)生硫化物,從而改變海水的氧含量和pH 值, 故不再對(duì)微生物進(jìn)行單獨(dú)考慮。 基于此, 選擇鹽度、 溫度、 溶解氧、 氧化還原電位、 pH 值、 流速、硫化物和海洋生物附著度等8 個(gè)因素作為影響海底管道外腐蝕速率的主要因素。 對(duì)某海底管道沿線設(shè)置50 組掛片進(jìn)行實(shí)海掛片試驗(yàn), 掛片尺寸100 mm×100 mm×5 mm, 在200 天后得到管道沿線不同海洋環(huán)境下的腐蝕數(shù)據(jù), 部分?jǐn)?shù)據(jù)見表1。
對(duì)表1 中的數(shù)據(jù)進(jìn)行歸一化處理后代入KPCA 模型, 對(duì)數(shù)據(jù)采用相關(guān)性矩陣和規(guī)劃分析計(jì)算特征值和方差百分比, 計(jì)算結(jié)果見表2 和圖1。
圖1 主成分分析碎石圖
表1 某海底管道沿線腐蝕數(shù)據(jù)統(tǒng)計(jì)結(jié)果
表2 KPCA 分析結(jié)果
從圖1 可知, 前5 個(gè)主成分之間的特征值差異較大, 且累積貢獻(xiàn)率為94.17%, 超過(guò)90%,因此可以選取前5 個(gè)主成分代替原先的8 個(gè)影響因素, 根據(jù)主成分的系數(shù)矩陣對(duì)數(shù)據(jù)進(jìn)行重組,樣本數(shù)據(jù)由之前的8 維變?yōu)? 維, 重組后的樣本數(shù)據(jù)見表3。
表3 重組后的樣本數(shù)據(jù)
根據(jù)Kolomogorov 定理, 確定隱含層的節(jié)點(diǎn)數(shù)為15, 選取Sigmoid 函數(shù)作為激活函數(shù), 對(duì)GA 種群進(jìn)行初始化操作, 設(shè)置種群個(gè)數(shù)50, 交叉因子區(qū)間[0.5, 1], 變異因子區(qū)間[0.002, 0.005],最大迭代次數(shù)200, 對(duì)GA 算法的進(jìn)化過(guò)程進(jìn)行迭代計(jì)算, 迭代過(guò)程如圖2 所示。 隨著迭代次數(shù)的增加, 適應(yīng)度函數(shù)ARV 不斷減小, 改進(jìn)前后的GA 算法分別在152 次和48 次達(dá)到收斂條件,穩(wěn)態(tài)誤差分別為0.186 1 和0.062 4, 說(shuō)明改進(jìn)后的GA 算法收斂速度更快, 尋優(yōu)效果更好。
圖2 GA 算法迭代過(guò)程示意圖
為驗(yàn)證KPCA-GA-ELM 算法的預(yù)測(cè)精度,將預(yù)測(cè)結(jié)果與ELM 模型、 KPCA-ELM 模型和BP 模型進(jìn)行對(duì)比, 驗(yàn)證集的預(yù)測(cè)結(jié)果見表4,不同預(yù)測(cè)模型的相對(duì)誤差如圖3 所示。
圖3 不同預(yù)測(cè)模型的相對(duì)誤差對(duì)比
表4 不同預(yù)測(cè)模型的預(yù)測(cè)結(jié)果
由表4 和圖3 可知, BP 模型的預(yù)測(cè)精度最差, 最大相對(duì)誤差17.40%; ELM 模型由于權(quán)值范數(shù)較小, 減少了對(duì)網(wǎng)絡(luò)中所有參數(shù)的迭代過(guò)程, 模型相對(duì)可獲得更好的泛化性能, 故預(yù)測(cè)精度有所提高, 最大相對(duì)誤差8.58%; KPCA-ELM模型對(duì)影響因素進(jìn)行了數(shù)據(jù)降維, 避免了無(wú)效數(shù)據(jù)的使用和訓(xùn)練, 節(jié)省了算力, 預(yù)測(cè)精度進(jìn)一步提高, 最大相對(duì)誤差3.21%; 而KPCA-GA-ELM模型通過(guò)對(duì)ELM 模型參數(shù)的不斷尋優(yōu), 預(yù)測(cè)精度最高, 其驗(yàn)證集樣本內(nèi)的相對(duì)誤差均小于其余3 種模型, 最大相對(duì)誤差為2.43%。
進(jìn)一步分析4 種模型的MSE、 MAPE 和R2,見表5。 其中, KPCA-GA-ELM 模型的MSE 和MAPE 分別為0.148 33 和1.15, 均比其余3 種模型小, 且相關(guān)系數(shù)R2=0.998 8, 在模型中最大,說(shuō)明KPCA-GA-ELM 模型的預(yù)測(cè)性能和魯棒性較好, 可以用來(lái)預(yù)測(cè)海底管道外腐蝕情況, 可為有效評(píng)估管道完整性和制定維護(hù)策略提供實(shí)際指導(dǎo)。
表5 不同預(yù)測(cè)模型評(píng)價(jià)指標(biāo)對(duì)比
(1) 采用KPCA 對(duì)影響海底管道外腐蝕的海洋環(huán)境因素進(jìn)行了篩選, 結(jié)合改進(jìn)的GA 模型對(duì)ELM 模型的輸入權(quán)值和隱含層偏差進(jìn)行優(yōu)化處理, 經(jīng)實(shí)例驗(yàn)證, KPCA-GA-ELM 模型最大相對(duì)誤差2.43%, MSE 和MAPE 分別為0.148 33和1.15, 預(yù)測(cè)精度最高;
(2) 在迭代的過(guò)程中, ELM 模型的隱含層節(jié)點(diǎn)數(shù)和激活函數(shù)采用經(jīng)驗(yàn)確定, 但這兩個(gè)參數(shù)對(duì)模型的計(jì)算結(jié)果影響較大, 今后應(yīng)將此作為研究方向進(jìn)一步優(yōu)化模型算法。