馬夢桐,趙 琢
(1.西安石油大學(xué)石油工程學(xué)院,陜西 西安 710065;2.中海油安全技術(shù)服務(wù)有限公司,天津 300450)
對于石油化工企業(yè)而言,為了生產(chǎn)的需要會建設(shè)大量的工藝管道,受到工藝管道內(nèi)介質(zhì)、外界環(huán)境等因素的影響,工藝管道運(yùn)行一定的時間后必然會出現(xiàn)大量的腐蝕問題。而影響工藝管道腐蝕速率的相關(guān)因素較多,且這些影響因素與工藝管道腐蝕速率之間的關(guān)系相對較為復(fù)雜,很難總結(jié)出工藝管道腐蝕速率的影響因素與腐蝕速率之間的數(shù)學(xué)關(guān)系。另一方面,工藝管道腐蝕速率的影響因素并不是一成不變的,影響因素數(shù)據(jù)無時無刻不在變化,這使得總結(jié)影響因素與腐蝕速率之間的數(shù)學(xué)關(guān)系難度增加。事實上,為了保障石油化工企業(yè)工藝管道的安全運(yùn)行,研究工藝管道腐蝕速率的預(yù)測方法十分關(guān)鍵。
目前,國內(nèi)外學(xué)者對于管道的腐蝕問題進(jìn)行了大量的研究,提出了眾多可用于管道腐蝕速率預(yù)測的智能算法。如程浩力等對灰色系統(tǒng)理論和最小二乘理論進(jìn)行了全面的總結(jié),在此基礎(chǔ)上,使用Excel軟件建立了用于油氣管道腐蝕速率預(yù)測的GM(1,1)模型,并通過實例驗證發(fā)現(xiàn),該模型的預(yù)測精度和可靠性都相對較好,可以用于油氣管道腐蝕速率的預(yù)測;Biezma等提出了一種模糊邏輯方法,使用該方法對管道的外腐蝕速率進(jìn)行了預(yù)測研究,并在預(yù)測研究的過程中采用了油氣管道外腐蝕速率的6項影響因素,其預(yù)測誤差相對較低;許宏良等通過對管道腐蝕的機(jī)理進(jìn)行深入分析,使用粒子群算法對BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行了全面的優(yōu)化,并使用優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)算法對油氣管道CO和HS的腐蝕速率進(jìn)行了預(yù)測研究,結(jié)果發(fā)現(xiàn)該模型算法預(yù)測結(jié)果的誤差可以控制在5%之內(nèi),利用該模型可以很好地對油氣管道的腐蝕速率進(jìn)行預(yù)測;曲志豪等對HS環(huán)境下油氣管道的腐蝕機(jī)理和腐蝕產(chǎn)物進(jìn)行了全面的研究,在此基礎(chǔ)上,使用網(wǎng)格搜索算法對隨機(jī)森林算法進(jìn)行了優(yōu)化,并使用優(yōu)化后的隨機(jī)森林算法對油氣管道HS的腐蝕速率進(jìn)行了預(yù)測研究,結(jié)果表明優(yōu)化后的隨機(jī)森林算法可以很好地對油氣管道HS的腐蝕速率和產(chǎn)物類型進(jìn)行預(yù)測。在相關(guān)向量機(jī)(RVM)算法的應(yīng)用方面,馬佳良曾使用蜂群算法對RVM算法進(jìn)行了優(yōu)化,并使用優(yōu)化后的組合模型對原油儲罐底部的腐蝕速率進(jìn)行了預(yù)測,預(yù)測結(jié)果顯示該組合模型與其他模型相比,其預(yù)測誤差相對較小,在充分考慮影響因素的前提下可以使用該組合模型對儲罐底部的腐蝕速率進(jìn)行預(yù)測。在雞群優(yōu)化(CSO)算法與RVM算法的組合方面,付華等曾對兩種類型智能算法的組合方法進(jìn)行了全面的研究,并使用這兩種算法組合后的模型對瓦斯的涌出量進(jìn)行了預(yù)測,其預(yù)測精度相對較好,證明這兩種算法可以進(jìn)行組合使用。
通過對國內(nèi)外油氣管道腐蝕速率預(yù)測研究現(xiàn)狀進(jìn)行分析后發(fā)現(xiàn),現(xiàn)有的預(yù)測方法較為單一,且在使用的過程中并沒有全面考慮油氣管道腐蝕的影響因素,也沒有考慮眾多影響因素的冗余性,這使得預(yù)測結(jié)果存在較大的誤差。此外,這些預(yù)測方法在使用的過程中對數(shù)據(jù)量的要求較高,而現(xiàn)實中獲取的油氣管道腐蝕速率及其影響因素的數(shù)據(jù)十分有限。針對目前研究中存在的問題,本次提出一種基于核主成分分析(KPCA)算法、雞群優(yōu)化(CSO)算法、相關(guān)向量機(jī)(RVM)算法組合模型的工藝管道腐蝕速率預(yù)測方法,即KPCA-CSO-RVM組合模型,并驗證了該方法的預(yù)測精度。該方法先使用KPCA算法對工藝管道腐蝕速率的影響因素進(jìn)行優(yōu)選,然后使用CSO算法對RVM算法中的參數(shù)進(jìn)行優(yōu)選,再將現(xiàn)場獲取的工藝管道腐蝕速率及其影響因素數(shù)據(jù)分為兩組,分別為訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集,并使用訓(xùn)練數(shù)據(jù)集對組合模型進(jìn)行訓(xùn)練,對驗證數(shù)據(jù)集數(shù)據(jù)進(jìn)行預(yù)測,計算預(yù)測誤差,同時與其他模型的預(yù)測結(jié)果進(jìn)行對比,以此證明該組合模型的可行性和先進(jìn)性。
x
進(jìn)行合理的非線性轉(zhuǎn)變φ
(x
),進(jìn)而將所有的數(shù)據(jù)轉(zhuǎn)換到高維空間F
中,此時數(shù)據(jù)樣本的協(xié)方差矩陣可以表示為(1)
數(shù)據(jù)樣本的協(xié)方差矩陣特征向量和特征值λ
將會滿足以下計算公式:λ
-=0(2)
此時引進(jìn)非線性的函數(shù)φ
(x
),就可以得到:λφ
(x
)-φ
(x
)=0(3)
數(shù)據(jù)樣本的協(xié)方差矩陣的特征向量可以使用非線性函數(shù)φ
(x
)進(jìn)行表示,進(jìn)而可以得到:(4)
在此引入核函數(shù)K
=K
(x
,x
)=φ
(x
)φ
(x
),并將公式(2)和(4)都代入到公式(3)中,簡化后可以得到:mλ
-=0(5)
式中:表示核函數(shù)矩陣的特征向量。對于任意的數(shù)據(jù)樣本而言,在高維空間F
中非線性函數(shù)φ
(x
)的投影可以表示為(6)
(7)
式中:表示m
×m
階的矩陣,其系數(shù)為1/m
。相關(guān)向量機(jī)(Relevance Vector Machine,RVM)算法是一種基于貝葉斯理論的機(jī)器學(xué)習(xí)方法,由國外學(xué)者Tipping在2000年提出,該算法主要是通過對先驗數(shù)據(jù)進(jìn)行一定的篩選,進(jìn)而刪除不相干的點,保留可以體現(xiàn)數(shù)據(jù)特征的相關(guān)向量,最終得到稀疏化的數(shù)學(xué)模型。RVM算法與支持向量機(jī)(SVM)算法具有一定的相似之處,但是該算法在對核函數(shù)進(jìn)行選擇的過程中,并不需要遵從Mercer定理的約束,進(jìn)而使得核函數(shù)的計算量大幅下降,計算過程將更加的高效。
(8)
式中:表示數(shù)學(xué)模型的權(quán)重向量,=(ω
,ω
,…,ω
);K
(x
,x
)表示模型的核函數(shù);ω
表示偏差;ε
表示遵循高斯分布(0,σ
)的噪聲,該噪聲滿足ε
~N
(0,σ
)。由于t
屬于一個獨(dú)立的分布樣本,所以該樣本的似然估計可表示為(9)
式中:表示權(quán)重向量矩陣;表示樣本矩陣;表示核函數(shù)的矩陣,=[φ
,φ
,…,φ
],其中φ
表示基函數(shù),φ
=[1,K
(x
,x
),…,K
(x
,x
)]。為了防止在使用RVM模型的過程中出現(xiàn)過學(xué)習(xí)的問題,所以該模型中的權(quán)重向量將會滿足高斯先驗概率的基本分布:(10)
式中:表示超參數(shù)向量,=[α
,α
,…,α
],該向量與權(quán)重向量之間呈現(xiàn)出相互對應(yīng)的關(guān)系,同時也將直接決定權(quán)重向量的先驗分布情況。通過使用Bayesian理論,權(quán)重向量的后驗分布可表示為(11)
式中:表示均值向量,=σ
∑;∑表示協(xié)方差矩陣,∑=(σ
+)-1,其中表示對角矩陣,=diag(α
,α
,…,α
),M
=N
+1。在對公式(11)中的進(jìn)行積分后,就可以得到由、σ
兩項參數(shù)所決定的邊緣分布:(12)
此時、σ
兩項參數(shù)的邊緣似然估計可表示為p
(|,σ
)=N
(0,R
)(13)
式中:R
=σ
+,其中表示單位矩陣。由于無法得到公式(13)的解析解,所以需要對其進(jìn)行迭代計算,在計算過程中,參數(shù)σ
、的最優(yōu)解可表示為(14)
(15)
式中:∑表示協(xié)方差矩陣∑之中第i
個對角所對應(yīng)的元素。在已經(jīng)給定訓(xùn)練樣本數(shù)據(jù)的前提下,首先對參數(shù)、σ
的初值進(jìn)行假定,通過使用公式(14)和(15)對其進(jìn)行迭代,直到相關(guān)參數(shù)都已經(jīng)收斂為止,此時RVM模型就已經(jīng)訓(xùn)練完成。在使用RVM模型算法的過程中,核函數(shù)的選擇將會對模型的訓(xùn)練及預(yù)測效果產(chǎn)生重要的影響,因此本次研究中將會選用高斯徑向基核函數(shù)作為RVM模型的核函數(shù),該核函數(shù)具有很強(qiáng)的非線性處理能力。高斯徑向基核函數(shù)K
(x
,x
)可表示為K
(x
,x
)=exp[-‖x
-x
‖/
(2γ
)](16)
式中:γ
表示核函數(shù)的寬度。G
代,在第G
代之后就會進(jìn)行更新,更新就是根據(jù)雞群的適應(yīng)度對子群進(jìn)行重新的劃分。首先假設(shè)雞群的搜索空間維數(shù)為D
,雞群中共有N
個個體,其中公雞的數(shù)量為N
,母雞的數(shù)量為N
,雛雞的數(shù)量為N
,雛雞與母雞之間存在母子關(guān)系的母雞數(shù)量為N
,N
將會在N
個母雞之中隨機(jī)地進(jìn)行選擇。由于在所有子群之中公雞的適應(yīng)度相對較好,所以對公雞位置進(jìn)行更新的模型可以用以下公式表示:x
,(t
+1)=x
,(t
)[1+randn(0,σ
)](17)
其中:
(18)
上式中:x
,(t
+1)表示第t
+1次迭代過程中第i
只公雞在第j
維空間中的位置;x
,(t
)表示第t
次迭代過程中第i
只公雞在第j
維空間中的位置;randn(0,σ
)的平均值為0,其標(biāo)準(zhǔn)差σ
將會服從高斯分布;ε
表示一個相對較小的常量;f
表示第i
只公雞所對應(yīng)的適應(yīng)度;f
表示第r
只公雞所對應(yīng)的適應(yīng)度;r
∈[1,N
],但r
≠i
。在子群之中,母雞的適應(yīng)度低于公雞,所以母雞的覓食將會受到公雞的嚴(yán)重影響,同時也會對其他雞發(fā)現(xiàn)的食物進(jìn)行偷取,在進(jìn)行食物競爭的過程中,適應(yīng)度高的母雞更具有優(yōu)勢。母雞所對應(yīng)的位置可以用以下公式進(jìn)行更新:
(19)
其中:
S
=exp[(f
-f
)/
(|f
|+ε
)](20)
S
=exp(f
2-f
)(21)
上式中:rand表示區(qū)間[0,1]之內(nèi)的任意數(shù);r
表示第i
只母雞所對應(yīng)子群之中的公雞;r
表示除了雛雞以外子群中的任意個體,r
≠r
;f
表示r
的適應(yīng)度;f
表示r
的適應(yīng)度。由于雛雞的適應(yīng)度最低,因此雛雞只能跟隨與自身具有母子關(guān)系的母雞進(jìn)行覓食,覓食的范圍相對較小,雛雞的位置可以用以下公式表示:
x
,(t
+1)=x
,(t
)+FL
[x
,(t
)-x
,(t
)](22)
式中:m
表示第i
只雛雞所跟隨的母雞;x
,(t
)表示雛雞跟隨母雞所在的位置;FL
表示跟隨系數(shù),其可以在區(qū)間[0,2]之內(nèi)進(jìn)行取值。γ
。CSO-RVM組合模型的構(gòu)建流程如圖1所示。圖1 CSO-RVM組合模型的構(gòu)建流程
使用KPCA-CSO-RVM組合模型對工藝管道腐蝕速率進(jìn)行預(yù)測研究的過程中,KPCA算法可以對工藝管道腐蝕速率的影響因素進(jìn)行優(yōu)化,從而優(yōu)選出對工藝管道腐蝕速率產(chǎn)生影響的主要因素,這將有利于簡化工藝管道腐蝕速率預(yù)測模型,降低模型預(yù)測的難度。在使用RVM算法對工藝管道腐蝕速率及其影響因素數(shù)據(jù)進(jìn)行學(xué)習(xí)及預(yù)測的過程中,部分參數(shù)需要設(shè)定,如果人為地進(jìn)行參數(shù)設(shè)定會使得模型的預(yù)測精度降低,因此本次研究通過引入了CSO算法,對RVM算法中的相關(guān)參數(shù)進(jìn)行優(yōu)化,確定最佳的參數(shù),并將參數(shù)輸入到RVM算法中,以提高工藝管道腐蝕速率預(yù)測的精度。
在本次研究中,所使用的工藝管道腐蝕速率及其影響因素數(shù)據(jù)來自于我國東北地區(qū)某石油化工企業(yè)內(nèi)的3條原油工藝管道,該3條原油工藝管道在不同條件下的腐蝕速率及其影響因素數(shù)據(jù),見表1。其中,工藝管道腐蝕速率數(shù)據(jù)通過電阻探針獲??;部分影響因素數(shù)據(jù)通過采樣的方式獲?。还艿肋\(yùn)行壓力和運(yùn)行溫度數(shù)據(jù)通過現(xiàn)場的監(jiān)測儀表獲取。對于該石油化工企業(yè)而言,影響工藝管道腐蝕速率的因素主要可以分為8項,分別是管道的運(yùn)行壓力、運(yùn)行溫度,原油中的硫含量、CO含量、氮含量、氧含量,原油的流速和pH值。本次研究將每條工藝管道看作為一個數(shù)據(jù)集,共有3個數(shù)據(jù)集,每個數(shù)據(jù)集中含有24組數(shù)據(jù)。為了驗證本文所提出的基于KPCA-CSO-RVM組合模型的工藝管道腐蝕速率預(yù)測方法的預(yù)測效果,在每個數(shù)據(jù)集中選擇20組數(shù)據(jù)對模型進(jìn)行訓(xùn)練,對數(shù)據(jù)集中剩余4組數(shù)據(jù)進(jìn)行預(yù)測,并對3個數(shù)據(jù)集預(yù)測結(jié)果的平均相對誤差進(jìn)行了計算,以檢驗該組合模型的可行性和先進(jìn)性。
表1 3條工藝管道的部分腐蝕速率及其影響因素數(shù)據(jù)
使用上述介紹的KPCA算法對工藝管道腐蝕速率及其影響因素數(shù)據(jù)進(jìn)行訓(xùn)練處理,進(jìn)而可以得到對工藝管道腐蝕速率影響相對較大的因素,并根據(jù)每個影響因素的貢獻(xiàn)率,計算累計貢獻(xiàn)率,其計算結(jié)果見表2。
表2 工藝管道腐蝕速率不同影響因素的特征值和累計貢獻(xiàn)率
通過對表2中數(shù)據(jù)進(jìn)行分析可以發(fā)現(xiàn),前4個影響因素的累計貢獻(xiàn)率已經(jīng)超過了85%,因此在接下來的研究中可以使用前4個影響因素作為CSO-RVM模型的輸入,進(jìn)而建立CSO-RVM組合模型。另外,通過對原始樣本進(jìn)行分析可以發(fā)現(xiàn),在使用KPCA算法的過程中,可以最大程度地保留原始樣本的基本信息,進(jìn)而實現(xiàn)影響因素的降維處理,即將原來的8個影響因素減少為4個,使得影響因素之間的冗余性得到了降低,這為建立CSO-RVM組合模型進(jìn)行下一步的研究奠定了基礎(chǔ)。
γ
進(jìn)行優(yōu)選,其取值范圍為[0.01,1]。在使用CSO算法的過程中,將該算法的迭代次數(shù)設(shè)定為100次,共進(jìn)行10代更新,雞群中公雞、母雞以及雛雞的個數(shù)分別設(shè)定為10只、20只、20只,其中與雛雞之間存在母子關(guān)系的母雞數(shù)量為5只。使用CSO算法對核函數(shù)寬度γ
進(jìn)行優(yōu)選的過程中,其迭代曲線見圖2。圖2 雞群優(yōu)化(CSO)算法迭代曲線
通過對圖2進(jìn)行分析可以發(fā)現(xiàn),當(dāng)CSO算法迭代到27次時,迭代曲線已經(jīng)收斂,所以優(yōu)選的核函數(shù)寬度γ
為0.639 4,在對核函數(shù)寬度進(jìn)行優(yōu)選以后,即可建立RVM模型。為了對本研究所提出的預(yù)測方法進(jìn)行驗證,將該3條工藝管道的腐蝕速率及其影響因素數(shù)據(jù)看作3個數(shù)據(jù)集,利用每個數(shù)據(jù)集中的20組數(shù)據(jù)對模型進(jìn)行訓(xùn)練,對數(shù)據(jù)集中剩余的4組工藝管道腐蝕速率數(shù)據(jù)進(jìn)行預(yù)測,使用CSO-RVM組合模型對3條工藝管道腐蝕速率進(jìn)行預(yù)測的結(jié)果見圖3至圖5。
圖3 工藝管道a的4組腐蝕速率CSO-RVM組合模型預(yù)測值與真實值對比
圖4 工藝管道b的4組腐蝕速率CSO-RVM組合模型預(yù)測值與真實值對比
圖5 工藝管道c的4組腐蝕速率CSO-RVM組合模型預(yù)測值與真實值對比
由圖3至圖5可見,工藝管道a、b、c腐蝕速率的預(yù)測值與真實值基本一致,每組驗證數(shù)據(jù)集的預(yù)測結(jié)果都可以很好地逼近工藝管道腐蝕速率的真實值,證明本文所提出的基于KPCA-CSO-RVM組合模型的工藝管道腐蝕速率預(yù)測方法具有可行性。
為了進(jìn)一步證明本文所提出的預(yù)測方法的先進(jìn)性,使用每個數(shù)據(jù)集中的20組數(shù)據(jù)對KPCA-CSO-RVM組合模型、RVM模型、常見的SVM(支持向量機(jī))模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,對每個數(shù)據(jù)集中剩余的4組工藝管道腐蝕速率數(shù)據(jù)進(jìn)行預(yù)測,統(tǒng)計每種預(yù)測模型預(yù)測結(jié)果的最大相對誤差,并計算所有預(yù)測模型預(yù)測結(jié)果的平均相對誤差、均方根誤差,得到不同預(yù)測模型的誤差對比,見表3。
表3 不同預(yù)測模型的誤差對比
通過對表3中數(shù)據(jù)進(jìn)行分析可以發(fā)現(xiàn),本文所提出的KPCA-CSO-RVM組合模型在對工藝管道腐蝕速率進(jìn)行預(yù)測的過程中,其預(yù)測結(jié)果的最大相對誤差、平均相對誤差、均方根誤差均小于其他3種預(yù)測模型,證明本文提出的KPCA-CSO-RVM組合模型具有先進(jìn)性。
針對工藝管道腐蝕速率預(yù)測問題,本文提出了一種基于KPCA-CSO-RVM組合模型的工藝管道腐蝕速率預(yù)測方法,該方法首先對KPCA算法、CSO算法和RVM算法進(jìn)行了理論介紹,提出了3種算法的組合方法;然后使用我國某石油化工企業(yè)內(nèi)3條原油管道腐蝕速率及其影響因素的一部分?jǐn)?shù)據(jù)對該組合模型進(jìn)行了訓(xùn)練,對另一部分?jǐn)?shù)據(jù)進(jìn)行了預(yù)測驗證,得到以下結(jié)論:
(1) 通過使用KPCA算法對工藝管道腐蝕速率的影響因素進(jìn)行分析可以發(fā)現(xiàn),溫度、pH值、氧含量和CO含量是影響工藝管道腐蝕的4大重要因素,這4個影響因素對工藝管道腐蝕速率的累計貢獻(xiàn)率超過了85%,并使用KPCA算法對工藝管道腐蝕速率影響因素進(jìn)行降維處理,將原來的8個影響因素減少為4個,使得影響因素之間的冗余性得到了降低。
(2) 使用KPCA-CSO-RVM組合模型對工藝管道腐蝕速率進(jìn)行預(yù)測的過程中,工藝管道a、b、c腐蝕速率的預(yù)測值與真實值基本一致,每組驗證數(shù)據(jù)集的預(yù)測結(jié)果都可以很好地逼近工藝管道腐蝕速率的真實值,證明本文所提出的基于KPCA-CSO-RVM組合模型的工藝管道腐蝕速率預(yù)測方法具有可行性。
(3) 將本文所提出的基于KPCA-CSO-RVM組合模型的工藝管道腐蝕速率的預(yù)測結(jié)果與其他常見模型的預(yù)測結(jié)果進(jìn)行對比后發(fā)現(xiàn),本文所提出的KPCA-CSO-RVM組合模型對工藝管道腐蝕速率預(yù)測結(jié)果的最大相對誤差、平均相對誤差、均方根誤差均小于其他3種預(yù)測模型,證明本文所提出的組合模型具有先進(jìn)性。