楊旭東,周艷麗,劉志娟,陸 亮,于天齊,劉 勇
中國石油天然氣股份有限公司華北油田分公司第一采油廠,河北任丘 062552
近年來,我國油氣管道呈現(xiàn)跨越式發(fā)展,截至2017年底,我國油氣管道總里程超過12.5×104km。目前,我國大多數(shù)油氣管道服役時(shí)間已超過20 a,因土壤、大氣以及水體等多方面的影響,腐蝕成為危害管道安全、造成管道失效的重要因素,腐蝕缺陷不僅會(huì)引起管材的力學(xué)特性發(fā)生變化,而且會(huì)對(duì)管道的應(yīng)力分布產(chǎn)生影響,因此,需要根據(jù)腐蝕情況對(duì)在役管道的剩余強(qiáng)度進(jìn)行有效評(píng)價(jià)和預(yù)測(cè),從而進(jìn)一步判斷管道是否需要降壓運(yùn)行或進(jìn)入維修及更換階段[1-2]。
目前,國內(nèi)外相關(guān)學(xué)者已對(duì)腐蝕管道的剩余強(qiáng)度展開了大量研究。美國AGA管道研究委員會(huì)提出了基于斷裂力學(xué)的NG-18環(huán)向失效應(yīng)力計(jì)算公式,Kiefner等[3]以此為基礎(chǔ),提出了用于單一腐蝕缺陷剩余強(qiáng)度計(jì)算的B31G準(zhǔn)則,后來美國ASME組織對(duì)其進(jìn)行了多次修改,最為常用的是ASME B31G-2009版本[4],此外挪威船級(jí)社制定了DNV-F101評(píng)價(jià)標(biāo)準(zhǔn)[5],國內(nèi)石油行業(yè)制定了SY/T 6151—2009評(píng)價(jià)標(biāo)準(zhǔn)[6],這些評(píng)價(jià)標(biāo)準(zhǔn)可有效預(yù)測(cè)腐蝕管道的剩余強(qiáng)度,但普遍保守性強(qiáng),容易造成對(duì)管道不必要的更換和維修。近年來,有限元分析成為計(jì)算管道剩余強(qiáng)度的有效手段,白清東[7]、Hoang Van Thanh等[8]均采用ANSYS對(duì)腐蝕管道進(jìn)行了有限元分析,但該方法需要對(duì)不同的網(wǎng)格節(jié)點(diǎn)進(jìn)行劃分,對(duì)于工程實(shí)踐來說,操作過于繁瑣,一般人不易掌握。綜上所述,無論是公式還是有限元分析,對(duì)管道剩余強(qiáng)度的計(jì)算都存在一定的弊端,且計(jì)算的數(shù)據(jù)與真實(shí)的水壓爆破數(shù)據(jù)存在一定的誤差,保守性過強(qiáng),造成過早的更換管道,浪費(fèi)資金。
隨著機(jī)器學(xué)習(xí)、人工智能的興起,利用相關(guān)算法實(shí)現(xiàn)對(duì)腐蝕管道剩余強(qiáng)度的有效預(yù)測(cè)是可行的。SVM(Support Vector Machine,支持向量機(jī))是目前應(yīng)用最為廣泛的機(jī)器算法之一,可以有效解決小樣本的分類和回歸問題,但樣本數(shù)據(jù)的準(zhǔn)確性會(huì)影響預(yù)測(cè)的精度和魯棒性,因此需要利用RS(粗糙集)屬性約簡理論[9],對(duì)冗余和重復(fù)的影響因素進(jìn)行篩除;而SVM中最重要的是懲罰因子C和核系數(shù)g的尋優(yōu),采用人工試算費(fèi)時(shí)費(fèi)力,可以采用改進(jìn)的PSO(粒子群)算法[10]對(duì)參數(shù)進(jìn)行尋優(yōu)。因此,利用RS-PSO-SVM算法構(gòu)建腐蝕管道剩余強(qiáng)度預(yù)測(cè)模型,可為管道完整性及延壽運(yùn)行提供較好的理論依據(jù)。
RS(粗糙集)主要是利用二維信息表對(duì)信息進(jìn)行有效表達(dá),基本公式為S={U,R,V,f},其中U為論域;R是屬性的集合,R=C∪D,C和D分別為條件屬性集和決策屬性集;V=∪Vr是Vr屬性值的集合,Vr為屬性r的值域;f:U×R→V是一個(gè)信息函數(shù),代表論域中的對(duì)象x的各種屬性值。S={U,R,V,f}對(duì)應(yīng)的二維數(shù)據(jù)即為決策表。
并非所有的條件屬性都是必要的,在不影響決策屬性的前提下,利用屬性約簡去除掉冗余信息,可以有效降低后期計(jì)算的時(shí)間和對(duì)噪聲處理的困難。對(duì)于S={U,R,V,f},設(shè)r0∈R,如果IND(R-{r0}) =IND(R),則稱屬性r0在R中是冗余的,r0為冗余屬性;反之,r0為必要屬性。
PSO屬于仿生算法,根據(jù)鳥類捕食經(jīng)驗(yàn)而來,通過群體中不同個(gè)體(n個(gè)粒子)的互相協(xié)作和信息共享來實(shí)現(xiàn)尋求最優(yōu)解,PSO被廣泛用于神經(jīng)網(wǎng)絡(luò)、遺傳算法、模糊理論等算法優(yōu)化和參數(shù)尋優(yōu)。標(biāo)準(zhǔn)PSO的算法流程如下:
(1)初始化所有粒子并評(píng)價(jià)每個(gè)粒子的適應(yīng)度,包括粒子的隨機(jī)位置向量和速度向量。
(2) 與局部最優(yōu)位置pbest進(jìn)行比較,如果較好,選擇pbest位置。
(3) 與全局最優(yōu)位置gbest進(jìn)行比較,如果較好,選擇gbest位置。
(4)根據(jù)下面兩個(gè)公式不斷調(diào)整粒子的位置和速度向量:
式中:xi為當(dāng)前粒子位置;vi為當(dāng)前粒子速度;ωi為慣性因子;c1、c2為學(xué)習(xí)因子,取值2;rand()為(0,1)之間的隨機(jī)數(shù)。
(5)當(dāng)達(dá)到設(shè)置的最大迭代次數(shù)或?qū)で蟮阶顑?yōu)解時(shí)停止計(jì)算,否則返回第(2)步。
在標(biāo)準(zhǔn)PSO計(jì)算中,慣性因子ωi采用線性遞減方式,但會(huì)造成迭代后期局部搜索能力變差,因此采用非線性遞減方式變化進(jìn)行改進(jìn),公式如下:
在標(biāo)準(zhǔn)PSO計(jì)算中,學(xué)習(xí)因子c1=c2=2,但實(shí)際c1和c2分別體現(xiàn)了對(duì)局部最優(yōu)解和全局最優(yōu)解的不斷學(xué)習(xí),隨著迭代次數(shù)的增加,這兩個(gè)值應(yīng)為非線性變化而不是定值,c1應(yīng)遞減,c2應(yīng)遞增,因此引入余弦函數(shù)改進(jìn)學(xué)習(xí)因子,公式如下:
式中:c1、c2的取值范圍為(0,2)。
SVM專門處理小樣本條件下的非線性擬合和分類問題,對(duì)于腐蝕管道剩余強(qiáng)度預(yù)測(cè)問題,由于可查閱的真實(shí)水壓爆破試驗(yàn)數(shù)據(jù)較少,因此可以利用SVM模型進(jìn)行預(yù)測(cè)。基本原理是通過引入非線性函數(shù),將低維空間的非線性擬合問題映射到高維空間中,并在高維空間中建立相應(yīng)的模型進(jìn)行線性擬合計(jì)算。擬合函數(shù)為:
式中:x為樣本的輸入向量;w為樣本的權(quán)值向量;b為樣本的擬合誤差。
為了減少訓(xùn)練樣本誤差,引入了兩個(gè)非負(fù)值的松弛變量ξ和ξ*,將上述公式轉(zhuǎn)化為規(guī)劃問題:
式中:C為懲罰因子;ε為不敏感參數(shù)。
引入拉格朗日乘子函數(shù)后,將上述的函數(shù)優(yōu)化問題轉(zhuǎn)化為對(duì)偶問題,整理上述公式后得到:
式中:ai和a*i為拉格朗日乘子,k(xi,xj) 為核函數(shù)。核函數(shù)的作用是將樣本映射到高維空間中,常用的3種核函數(shù)分別是:多項(xiàng)式核函數(shù)、徑向基核函數(shù)和S形核函數(shù)。研究表明:對(duì)于不同的數(shù)據(jù)類型,不同核函數(shù)表現(xiàn)不盡相同,徑向基核函數(shù)在大多數(shù)數(shù)據(jù)處理方面表現(xiàn)優(yōu)秀,因此,本文采用徑向基核函數(shù):
采用RS的屬性約簡理論,對(duì)剩余強(qiáng)度影響因素進(jìn)行數(shù)據(jù)降維,將主要因素進(jìn)行歸一化處理后輸入SVM模型進(jìn)行訓(xùn)練,為了縮小誤差,利用改進(jìn)后的PSO對(duì)SVM中的懲罰因子C和核系數(shù)g進(jìn)行尋優(yōu),最后建立RS-PSO-SVM算法的腐蝕管道剩余強(qiáng)度預(yù)測(cè)模型,預(yù)測(cè)流程如圖1所示。
圖1 腐蝕管道剩余強(qiáng)度預(yù)測(cè)流程
為了保證預(yù)測(cè)模型的準(zhǔn)確性,采用文獻(xiàn)[11]中79組真實(shí)的水壓爆破試驗(yàn)數(shù)據(jù),該組數(shù)據(jù)基本覆蓋了X42~X100低強(qiáng)度到高強(qiáng)度鋼級(jí)中常見的管道類型,將數(shù)據(jù)分為兩組,其中隨機(jī)抽取69組作為訓(xùn)練樣本,剩余10組作為測(cè)試樣本,采用平均絕對(duì)誤差和均方根誤差2個(gè)評(píng)價(jià)指標(biāo)值分析模型的預(yù)測(cè)性能,公式如下:
式中:MAPE為平均絕對(duì)百分誤差;RMSE為均方根誤差,MPa;為剩余強(qiáng)度預(yù)測(cè)值,MPa;y為水壓爆破實(shí)際值,MPa。
通過查閱相關(guān)文獻(xiàn),提取了影響腐蝕管道剩余強(qiáng)度的7項(xiàng)主要評(píng)價(jià)指標(biāo),分別是管道鋼級(jí)、管徑、壁厚、屈服強(qiáng)度、拉伸強(qiáng)度、缺陷長度、缺陷深度等,將剩余強(qiáng)度作為評(píng)價(jià)目標(biāo),構(gòu)建了相應(yīng)指標(biāo)體系,如圖2所示。
圖2 腐蝕管道剩余強(qiáng)度指標(biāo)體系
將剩余強(qiáng)度按照由小到大分為4個(gè)等級(jí),將文獻(xiàn)[11]中的79組數(shù)據(jù)按照表1的標(biāo)準(zhǔn)進(jìn)行離散化處理,得到剩余強(qiáng)度預(yù)測(cè)決策表,其中U為樣本序號(hào)即論域;C={C1,C2,C3,C4,C5,C6,C7}為條件屬性,剩余強(qiáng)度D為決策屬性,將離散化的數(shù)據(jù)輸入Matlab中進(jìn)行編程,采用Johnson約簡算法分析后得到約簡條件屬性集為{C1,C2,C3,C6,C7},即降維后影響腐蝕管道剩余強(qiáng)度的主要因素有管道鋼級(jí)、管徑、壁厚、腐蝕深度、腐蝕長度。屈服強(qiáng)度和拉伸強(qiáng)度被去除,主要原因是這兩者在剩余強(qiáng)度計(jì)算中主要影響的是流變應(yīng)力,在管道鋼級(jí)一定的情況下,屈服強(qiáng)度和拉伸強(qiáng)度的變化范圍固定,流變應(yīng)力也呈同趨勢(shì)變化,因此管道鋼級(jí)這一評(píng)價(jià)指標(biāo)實(shí)際上包含了屈服強(qiáng)度和拉伸強(qiáng)度的大部分信息,管道鋼級(jí)可以列入最優(yōu)屬性集中。
表1 腐蝕管道剩余強(qiáng)度指標(biāo)離散化標(biāo)準(zhǔn)
由于各指標(biāo)之間的單位和數(shù)量級(jí)都不盡相同,因此需要將屬性約簡后的指標(biāo)進(jìn)行歸一化處理。將處理后的69組訓(xùn)練樣本代入RS-PSO-SVM模型中,利用改進(jìn)后的PSO對(duì)參數(shù)C和g進(jìn)行尋優(yōu),其中設(shè)粒子數(shù)n=100,初始迭代次數(shù)N=0,最大迭代次數(shù)N=200,ωmax=0.8,ωmin=0.2,粒子維度D=1。分別對(duì)標(biāo)準(zhǔn)PSO和改進(jìn)后的PSO進(jìn)行對(duì)比,發(fā)現(xiàn)隨著迭代次數(shù)的增加,兩種模型的平均絕對(duì)百分誤差都趨于最小值,其中標(biāo)準(zhǔn)PSO在175次迭代后達(dá)到收斂狀態(tài),平均絕對(duì)百分誤差為2.101 2%,改進(jìn)后的PSO在141次迭代后達(dá)到收斂狀態(tài),平均絕對(duì)百分誤差為0.865 8%,可見改進(jìn)后的PSO尋優(yōu)和收斂速度更快,精度更高,具體見圖3所示。此時(shí)的懲罰因子C和核系數(shù)g分別取85.914和0.765。
圖3 標(biāo)準(zhǔn)PSO和改進(jìn)PSO的平均絕對(duì)百分誤差
隨后再將剩余10組測(cè)試樣本代入訓(xùn)練好的RS-PSO-SVM模型中進(jìn)行預(yù)測(cè),并利用mapminmax函數(shù)進(jìn)行反歸一化數(shù)據(jù)處理,為了更好對(duì)比和評(píng)價(jià)模型的準(zhǔn)確性,與BP神經(jīng)網(wǎng)絡(luò)、PSO-WNN和ASME B31G的計(jì)算結(jié)果進(jìn)行了對(duì)比,四種模型的預(yù)測(cè)結(jié)果如圖4所示。
由圖4可知,ASME B31G評(píng)價(jià)方法結(jié)果最為保守,與實(shí)際值擬合度最差,如采用該方法會(huì)造成管道過早地進(jìn)行維修和更換,其余3種模型中RS-PSO-SVM的相關(guān)系數(shù)最大(R=0.999 93),證明可以預(yù)測(cè)99.993%的樣本模型,只有總變異0.007%的數(shù)據(jù)樣本不能被解釋,與實(shí)際值的擬合度最高。除ASME B31G之外,其余3種模型的預(yù)測(cè)絕對(duì)誤差對(duì)比見圖5,平均絕對(duì)百分誤差和均方根誤差對(duì)比見圖6。
圖5 預(yù)測(cè)絕對(duì)誤差對(duì)比
圖6 平均絕對(duì)百分誤差和均方根誤差對(duì)比
由圖5和圖6可知:從準(zhǔn)確性分析——BP神經(jīng)網(wǎng)絡(luò)和PSO-WNN模型的預(yù)測(cè)絕對(duì)誤差波動(dòng)較大,RS-PSO-SVM的平均絕對(duì)百分誤差為1.23%,均方根誤差為0.17 MPa,均小于另外兩種模型;與BP神經(jīng)網(wǎng)絡(luò)相比,RS可以很好去除高維數(shù)據(jù)的冗余信息;與PSO-WNN相比,SVM在精度上比WNN更適合管道剩余強(qiáng)度的預(yù)測(cè)。從保守性分析,RS-PSO-SVM、BP神經(jīng)網(wǎng)絡(luò)和PSO-WNN的預(yù)測(cè)結(jié)果中大于實(shí)際值的數(shù)據(jù)樣本數(shù)量分別為0、5、2,由此可見,RS-PSO-SVM模型還具有較好的保守性。綜上所述,幾種模型相比,RS-PSO-SVM在維持保守性的同時(shí),還能保持最大的準(zhǔn)確性,因此該模型的泛化能力更強(qiáng),預(yù)測(cè)準(zhǔn)確度更高,可為腐蝕管道剩余強(qiáng)度預(yù)測(cè)提供安全、準(zhǔn)確的預(yù)測(cè)數(shù)據(jù)。
(1)針對(duì)單一腐蝕缺陷管道的剩余強(qiáng)度樣本數(shù)據(jù)少、公式計(jì)算保守性強(qiáng)、有限元分析過于復(fù)雜等特點(diǎn),將RS、PSO和SVM算法模型有機(jī)結(jié)合,構(gòu)建了腐蝕管道剩余強(qiáng)度預(yù)測(cè)模型。通過RS屬性約簡,有效提取了影響管道剩余強(qiáng)度的關(guān)鍵性指標(biāo)因素,隨后應(yīng)用改進(jìn)的PSO算法對(duì)SVM的參數(shù)進(jìn)行了尋優(yōu),避免了人工試算法造成的誤差和訓(xùn)練時(shí)間過長;與其余幾種算法模型相比,保守性和準(zhǔn)確性都較為優(yōu)越,模型的魯棒性和預(yù)測(cè)性更好。
(2)PSO算法同樣存在容易陷入局部最優(yōu)的缺點(diǎn),今后可加強(qiáng)改進(jìn)相關(guān)算法,提高算法尋優(yōu)的準(zhǔn)確性,減少訓(xùn)練時(shí)間。