魯中歧, 肖文生, 崔俊國(guó)*, 張楊, 王魁濤, 尹豐
(1.中國(guó)石油大學(xué)(華東)機(jī)電工程學(xué)院, 青島 266580;2.中海油研究總院有限責(zé)任公司, 北京 100028)
油氣資源開(kāi)采逐漸向深海轉(zhuǎn)移,海底油氣管道擔(dān)任起油氣運(yùn)輸?shù)闹厝?,但在運(yùn)作過(guò)程中不可避免地會(huì)出現(xiàn)因腐蝕等原因?qū)е碌男孤┦?,污染自然環(huán)境,甚至危害工作人員生命安全,因此一種海底管道腐蝕泄漏預(yù)測(cè)技術(shù)的開(kāi)發(fā)極有必要。該預(yù)測(cè)技術(shù)的研發(fā),在海洋油氣運(yùn)輸安全方面具有重要意義。
目前中外學(xué)者在該領(lǐng)域已展開(kāi)深入研究,提出了灰色預(yù)測(cè)模型,灰色理論與馬爾可夫鏈結(jié)合的預(yù)測(cè)模型以及一些機(jī)器學(xué)習(xí)算法,如隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等也逐漸應(yīng)用于海底管道腐蝕泄漏的預(yù)測(cè)中。Valor等[1]提出了兩種利用馬爾可夫鏈建立的不同的點(diǎn)蝕模型,對(duì)點(diǎn)蝕坑的生長(zhǎng)進(jìn)行了預(yù)測(cè); Ren等[2]將反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)應(yīng)用于長(zhǎng)輸管道腐蝕速率的預(yù)測(cè),建立管道內(nèi)腐蝕速率預(yù)測(cè)模型,預(yù)測(cè)結(jié)果較為可靠。還有許多學(xué)者將多種算法綜合運(yùn)用,提出了組合預(yù)測(cè)模型。駱正山等[3]提出了一種利用隨機(jī)森林(random forest,RF)篩選腐蝕因素相關(guān)變量,蝗蟲(chóng)算法(grasshopper optimization algorithm,GOA)優(yōu)化相關(guān)向量機(jī)(relevant vector machine,RVM)的預(yù)測(cè)模型,穩(wěn)定度和準(zhǔn)確度相比于傳統(tǒng)單一模型得到了提高;駱正山等[4]還采取主成分分析法(principal component analysis,PCA)對(duì)試驗(yàn)所得數(shù)據(jù)進(jìn)行降維,用天牛須搜索(beetle antennae search,BAS)算法優(yōu)化投影尋蹤回歸(projection pursuit regression,PPR)預(yù)測(cè)模型對(duì)海底管道腐蝕速率展開(kāi)預(yù)測(cè),為管道腐蝕預(yù)測(cè)提供了新思路;張新生等[5]在對(duì)腐蝕數(shù)據(jù)進(jìn)行因子分析降維處理以后,建立了改進(jìn)的隨機(jī)森林模型對(duì)海底管道腐蝕速率進(jìn)行預(yù)測(cè),該模型穩(wěn)定性較好。
目前,一些模型的單一應(yīng)用或多或少的會(huì)出現(xiàn)誤差較大、欠學(xué)習(xí)、過(guò)擬合等問(wèn)題,而組合模型存在未考慮變量之間相互影響關(guān)系、過(guò)多考慮預(yù)測(cè)精度導(dǎo)致計(jì)算量增加、專(zhuān)注于模型穩(wěn)定性導(dǎo)致預(yù)測(cè)精度下降等問(wèn)題?;谝陨蠁?wèn)題,采用斯皮爾曼相關(guān)系數(shù)尋找各自變量因素中相關(guān)性較高的因素,采用隨機(jī)森林(random forest,RF 重要性評(píng)估的方法在各腐蝕影響因素對(duì)腐蝕速率的貢獻(xiàn)度方面進(jìn)行排序,并剔除相關(guān)性較高的因素中對(duì)腐蝕速率貢獻(xiàn)度較低的變量因素,選用篩選后的影響因素建立粒子群(particle swarm optimization,PSO)算法優(yōu)化的前饋神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)預(yù)測(cè)模型進(jìn)行腐蝕速率的預(yù)測(cè)。以期為海底管道泄漏風(fēng)險(xiǎn)的精準(zhǔn)預(yù)測(cè)以及高效控制提供依據(jù)。
斯皮爾曼相關(guān)系數(shù)可以用來(lái)衡量?jī)蓚€(gè)變量之間的相關(guān)性,取值范圍為[-1,1],計(jì)算公式為
(1)
式(1)中:rs為斯皮爾曼相關(guān)系數(shù);n為樣本數(shù);di為排序(升序或降序)好后的兩個(gè)變量之間的等級(jí)差。
當(dāng)一個(gè)變量表現(xiàn)為增加趨勢(shì)時(shí),另一個(gè)變量同樣趨向于增加,則相關(guān)系數(shù)為正,反之為負(fù),相關(guān)系數(shù)的絕對(duì)值越接近于1,相關(guān)性越強(qiáng),越接近于0,相關(guān)性越弱。
通常情況下,一個(gè)數(shù)據(jù)集往往有多個(gè)特征,如何選擇對(duì)結(jié)果影響較大的那幾個(gè)特征,以此來(lái)縮減建立模型時(shí)的特征數(shù)是一個(gè)問(wèn)題,選用隨機(jī)森林重要性評(píng)估的方法對(duì)影響腐蝕速率的多個(gè)因素進(jìn)行重要度排序。
隨機(jī)森林在選取數(shù)據(jù)集訓(xùn)練決策樹(shù)時(shí),采用對(duì)輸入樣本集合進(jìn)行多次放回重復(fù)抽樣[6]的方法,該方法會(huì)導(dǎo)致樣本集合中有數(shù)據(jù)多次重復(fù)出現(xiàn),同時(shí)也說(shuō)明在一個(gè)樣本集合中,會(huì)有部分?jǐn)?shù)據(jù)不參與決策樹(shù)訓(xùn)練,該部分?jǐn)?shù)據(jù)稱(chēng)之為袋外數(shù)據(jù),在特征變量選擇中,就是基于袋外數(shù)據(jù)對(duì)每個(gè)特征變量重要性進(jìn)行計(jì)算,然后排序,選擇重要性較高的特征為后續(xù)模型的建立做準(zhǔn)備。其中,對(duì)于某個(gè)特征的重要性計(jì)算步驟如下[7]。
Step1選擇每一棵決策樹(shù)相應(yīng)的袋外數(shù)據(jù)進(jìn)行袋外數(shù)據(jù)誤差計(jì)算,記為Error1i。
Step2隨機(jī)加入干擾信號(hào),重復(fù)步驟1,記為Error2i。
Step3假設(shè)森林中有N棵樹(shù),則該特征的重要性I可表示為
(2)
若干擾信號(hào)加入后,袋外數(shù)據(jù)準(zhǔn)確率下降幅度較大,說(shuō)明該特征重要程度較高。
PSO屬于進(jìn)化算法的一種,其算法規(guī)則較為簡(jiǎn)單,具有實(shí)現(xiàn)容易、收斂快、精度高等優(yōu)點(diǎn)[8]。該算法中粒子根據(jù)種群最優(yōu)和個(gè)體最優(yōu)兩個(gè)因素來(lái)實(shí)現(xiàn)自我更新,在找到這兩個(gè)最優(yōu)值后,粒子通過(guò)以下公式實(shí)現(xiàn)自己速度和位置的更新[9-11]。
速度更新公式為
vi=ωvi+c1rand(·)(pbesti-xi)+
c2rand(·)(gbesti-xi)
(3)
式(3)中:vi為粒子速度;i=1,2,…,N′,其中N′為粒子總數(shù);ω為慣性因子;c1、c2為學(xué)習(xí)因子,通常取2;rand(·)為[1 2]的隨機(jī)數(shù);pbesti為個(gè)體最優(yōu);gbesti為種群最優(yōu);xi為當(dāng)前粒子所在位置。
位置更新公式為
xi=xi+vi
(4)
輸入、輸出層及隱層構(gòu)成神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),各層之間有相應(yīng)連接權(quán)值[11-12], BP神經(jīng)網(wǎng)絡(luò)的主要思想是:輸入學(xué)習(xí)樣本,經(jīng)反復(fù)訓(xùn)練,使輸出值與期望值盡可能地接近,當(dāng)誤差低于指定要求后,將網(wǎng)絡(luò)權(quán)值和偏差進(jìn)行保存,完成訓(xùn)練[13]。具體步驟如圖1所示。
W、b分別為各層之間的權(quán)值、閾值矩陣圖1 神經(jīng)網(wǎng)絡(luò)模型建立流程圖Fig.1 Flow chart of neural network model establishment
圖2 預(yù)測(cè)模型建立流程圖Fig.2 Flow chart of prediction model establishment
對(duì)海底管道腐蝕速率的影響因素進(jìn)行斯皮爾曼相關(guān)性分析,隨后采用隨機(jī)森林袋外數(shù)據(jù)誤差進(jìn)行影響因素重要性排序,篩選重要性高的特征參與粒子群優(yōu)化-反向傳播神經(jīng)網(wǎng)絡(luò)(particle swarm optimization-back propagation neural network,PSO-BPNN)預(yù)測(cè)模型的建立,完整模型的建立流程圖如圖2所示。
基于RF-PSO-BPNN海底管道腐蝕預(yù)測(cè)模型,經(jīng)數(shù)據(jù)篩選后,避免了大量強(qiáng)相關(guān)性數(shù)據(jù)影響建模的冗余度及精確度問(wèn)題,數(shù)據(jù)維度的降低有助于提高模型優(yōu)化及訓(xùn)練的速度,具體運(yùn)行過(guò)程如下。
Step1數(shù)據(jù)預(yù)處理。計(jì)算初始樣本各影響因素之間斯皮爾曼相關(guān)系數(shù),分析其相關(guān)性,找出相關(guān)性較大的特征;將初始樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,利用隨機(jī)森林袋外數(shù)據(jù)誤差進(jìn)行各影響因素的重要性排序,剔除上述相關(guān)性較大的因素中重要性較小者,并按照重要性排序選取重要性較大的特征進(jìn)行后續(xù)建模。
Step2模型參數(shù)的確定。設(shè)定粒子群種群規(guī)模、進(jìn)化次數(shù)、權(quán)重因子等參數(shù),完成粒子位置、速度的初始化;確定神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、訓(xùn)練次數(shù)、學(xué)習(xí)速率及訓(xùn)練目標(biāo)等參數(shù)。
Step3模型訓(xùn)練。將篩選后的數(shù)據(jù)進(jìn)行歸一化處理后,分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于模型的訓(xùn)練,測(cè)試集用于模型的檢驗(yàn)。
Step4模型檢驗(yàn)。根據(jù)測(cè)試集預(yù)測(cè)結(jié)果,計(jì)算均方誤差、平均絕對(duì)誤差等來(lái)對(duì)所建立的模型進(jìn)行評(píng)價(jià)。
為驗(yàn)證RF-PSO-BPNN海底管道腐蝕預(yù)測(cè)模型的預(yù)測(cè)精度,采用平均絕對(duì)誤差(mean absolute error,MAE)、均方誤差(mean square error,MSE)以及決定系數(shù)R2來(lái)對(duì)模型進(jìn)行檢驗(yàn)評(píng)價(jià),計(jì)算公式為
(5)
(6)
(7)
以某海底管段為例,進(jìn)行實(shí)海腐蝕掛片實(shí)驗(yàn),部分腐蝕實(shí)驗(yàn)數(shù)據(jù)如表1[4]所示。
用式(1)計(jì)算n1~n7影響因素中兩兩之間的斯皮爾曼相關(guān)系數(shù),相關(guān)系數(shù)矩陣如圖3所示。
由圖3可知,部分影響因素之間存在較強(qiáng)的相關(guān)性,而強(qiáng)相關(guān)性的因素不僅會(huì)增加模型的冗余度還會(huì)影響模型精度,因此分析相關(guān)性后需進(jìn)行降維處理,圖中斯皮爾曼相關(guān)系數(shù)超過(guò)0.55的有pH(n5)和氧化還原電位(n4)、pH(n5)和附著海洋生物(n6)、溫度(n1)和附著海洋生物(n6)。接下來(lái)采用隨機(jī)森林計(jì)算各影響因素對(duì)腐蝕速率的重要度。首先用式(8)將表1中的腐蝕數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
(8)
確定隨機(jī)森林參數(shù)葉子大小及決策樹(shù)的數(shù)量,分別取葉子大小為5、10、20、50、100,決策樹(shù)數(shù)量為200,將訓(xùn)練數(shù)據(jù)按照式(8)進(jìn)行標(biāo)準(zhǔn)化處理,以消除不同因素量綱不同對(duì)模型精度的影響,代入標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練結(jié)果如圖4所示。
由圖4可知,紅色線(xiàn)始終處于最低位,即在上述5種葉子大小中,當(dāng)葉子大小為5時(shí)均方誤差最小,各曲線(xiàn)在樹(shù)的數(shù)量到達(dá)50時(shí)便不再有大幅度的下降,故在該模型中,葉子大小選取5,決策樹(shù)的數(shù)量選取50較為合適。選取以上參數(shù)建立隨機(jī)森林模型,進(jìn)行各影響因素重要度計(jì)算并排序,如圖5所示。
圖3 斯皮爾曼相關(guān)系數(shù)矩陣Fig.3 Spearman correlation coefficient matrix
圖4 RF模型參數(shù)擇優(yōu)Fig.4 RF model parameter optimization
表1 部分腐蝕試驗(yàn)數(shù)據(jù)Table 1 Partial corrosion test data
圖5 變量重要性排序Fig.5 Importance ranking of variables
由圖5可知,變量重要性依次為:pH(n5)、附著海洋生物(n6)、溶氧量(n2)、含鹽度(n3)、溫度(n1)、海水流速(n7)、氧化還原電位(n4)。結(jié)合上述斯皮爾曼相關(guān)性分析,pH(n5)和氧化還原電位(n4)、附著海洋生物(n6)相關(guān)性較強(qiáng),而pH重要性較高,故剔除氧化還原電位和附著海洋生物兩項(xiàng)影響因素,剔除后按照重要性排序選取前4項(xiàng)影響因素分別為:pH(n5)、溶氧量(n2)、含鹽度(n3)、溫度(n1)。
3.2.1 RFR模型參數(shù)確定
根據(jù)圖5及3.1節(jié)的分析,選取葉子大小為5,決策樹(shù)數(shù)量為50建立隨機(jī)森林回歸模型,當(dāng)樣本數(shù)量足夠大時(shí),由于隨機(jī)森林采用放回抽樣加交叉驗(yàn)證,所以一般不會(huì)出現(xiàn)過(guò)擬合的現(xiàn)象,而樣本數(shù)量較少時(shí),不劃分訓(xùn)練集、測(cè)試集大概率會(huì)出現(xiàn)過(guò)擬合現(xiàn)象,因此在此選用總樣本的75%作為訓(xùn)練集,剩下的25%作為測(cè)試集進(jìn)行隨機(jī)森林回歸模型的建立。
3.2.2 BPNN模型參數(shù)確定
將篩選后的數(shù)據(jù)進(jìn)行歸一化處理,神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)集的劃分,若訓(xùn)練集劃分過(guò)少容易出現(xiàn)訓(xùn)練力度不足的問(wèn)題,若訓(xùn)練集過(guò)多,測(cè)試集過(guò)少則無(wú)法確定所訓(xùn)練模型的好壞。根據(jù)現(xiàn)有數(shù)據(jù)規(guī)模,選取總樣本集的75%作為訓(xùn)練集,25%作為測(cè)試集。依據(jù)上述篩選出的數(shù)據(jù),將4個(gè)影響因素作為輸入,腐蝕速率作為輸出。故BP神經(jīng)網(wǎng)絡(luò)中輸入層神經(jīng)元個(gè)數(shù)為4,輸出層神經(jīng)元個(gè)數(shù)為1,隱層神經(jīng)元個(gè)數(shù)的確定至關(guān)重要,根據(jù)經(jīng)驗(yàn)公式[式(9)]確定為10,最大迭代次數(shù)為300次,期望誤差為0.000 1,學(xué)習(xí)速率設(shè)置為0.01,激活函數(shù)選擇Sigmoid函數(shù),計(jì)算公式為
(9)
式(9)中:l為隱層神經(jīng)元個(gè)數(shù);m為輸入層神經(jīng)元個(gè)數(shù);nneu為輸出層神經(jīng)元個(gè)數(shù);a為隱層神經(jīng)元個(gè)數(shù)計(jì)算經(jīng)驗(yàn)公式的輔助計(jì)算參數(shù),取值為1~10。
(10)
所建立的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)鋱D如圖6所示。
x1~x4為輸入變量;y為輸出變量; W1、W2分別為輸入層到隱層、隱層到輸出層的權(quán)值矩陣; b1、b2分別為輸入層到隱層、隱層到輸出層的閾值矩陣圖6 神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖Fig.6 Topology of neural network
3.2.3 PSO參數(shù)確定
按照文獻(xiàn)[14],c1、c2取2,種群規(guī)模為30,迭代次數(shù)為150,為避免陷入局部最優(yōu)或全局最優(yōu),設(shè)置動(dòng)態(tài)權(quán)重因子w,其表達(dá)式為
(11)
式(11)中:we、ws為粒子群優(yōu)化算法中動(dòng)態(tài)權(quán)重因子的調(diào)節(jié)系數(shù),ws取0.9,we取0.1;i為當(dāng)前迭代次數(shù);mtotal為總迭代次數(shù)。
按照3.2節(jié)參數(shù)設(shè)置,帶入篩選后的數(shù)據(jù)分別進(jìn)行5次模型訓(xùn)練,MAE、MSE和R2分別按照式(5)~式(7)來(lái)進(jìn)行計(jì)算,并計(jì)算5次訓(xùn)練結(jié)果的平均值,其中BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型各評(píng)判標(biāo)準(zhǔn)如表2所示,預(yù)測(cè)結(jié)果與實(shí)際值曲線(xiàn)如圖7所示。
測(cè)試集預(yù)測(cè)結(jié)果曲線(xiàn)如圖8所示,隨機(jī)森林回歸預(yù)測(cè)模型5次訓(xùn)練的各評(píng)判標(biāo)準(zhǔn)如表3所示。
由表2、表3可知,隨機(jī)森林回歸預(yù)測(cè)模型MAE和MSE的5次訓(xùn)練結(jié)果平均值分別為1.289 96、2.804 12,均低于BP神經(jīng)網(wǎng)絡(luò)模型的1.593 46和3.370 44,可見(jiàn)該模型誤差較小,但決定系數(shù)為0.620 62,較神經(jīng)網(wǎng)絡(luò)模型低0.13,即預(yù)測(cè)值與實(shí)際值的相關(guān)性較弱,擬合度較差,在進(jìn)行長(zhǎng)期預(yù)測(cè)時(shí),難免會(huì)出現(xiàn)較大誤差,反觀BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,由圖7、圖8可知,預(yù)測(cè)值與實(shí)際值趨勢(shì)較為一致,因此只需優(yōu)化算法進(jìn)行優(yōu)化,提高預(yù)測(cè)精度即可,采用粒子群優(yōu)化算法來(lái)優(yōu)化神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,建立了PSO-BPNN預(yù)測(cè)模型,預(yù)測(cè)結(jié)果如下。
表2 BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果分析Table 2 Analysis of prediction results of BP neural network model
圖7 神經(jīng)網(wǎng)絡(luò)測(cè)試集預(yù)測(cè)結(jié)果曲線(xiàn)Fig.7 Curves of prediction results of neural network test set
圖8 隨機(jī)森林回歸模型測(cè)試集預(yù)測(cè)結(jié)果曲線(xiàn)Fig.8 Curves of prediction results of test set of random forest regression model
根據(jù)3.2節(jié)設(shè)置好的參數(shù)進(jìn)行粒子群算法的迭代過(guò)程,如圖9所示。其中以神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值誤差作為適應(yīng)度值,由圖9可知,在迭代次數(shù)進(jìn)行到約20次時(shí),已達(dá)最優(yōu),將優(yōu)化好的權(quán)值、閾值重新賦予BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,再次進(jìn)行訓(xùn)練建模,模型評(píng)判指標(biāo)如表4所示,預(yù)測(cè)值與真實(shí)值曲線(xiàn)如圖10所示。
表3 隨機(jī)森林回歸模型預(yù)測(cè)結(jié)果分析Table 3 Analysis of prediction results of random forest regression model
圖9 粒子群算法迭代過(guò)程Fig.9 Iterative process of particle swarm optimization algorithm
表4 PSO-BPNN模型預(yù)測(cè)結(jié)果分析Table 4 Analysis of prediction results of PSO-BPNN model
由表4可知,經(jīng)優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型MAE、MSE分別為0.790 09、0.729 37,比未優(yōu)化的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型提高了0.803 37、2.641 07,預(yù)測(cè)精度有了顯著提升,R2為0.915 1,接近于“1”,相比于隨機(jī)森林和未優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)兩種模型也都有了顯著的提高,證明了PSO-BPNN海底管道腐蝕預(yù)測(cè)模型預(yù)測(cè)性能更優(yōu),可為海底管道腐蝕泄漏預(yù)測(cè)研究提供參考。
基于以上所建立模型,編制了一款集神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林以及粒子群優(yōu)化下的神經(jīng)網(wǎng)絡(luò)為一體的多模型管道腐蝕預(yù)測(cè)軟件,該軟件包括隨機(jī)森林回歸預(yù)測(cè)、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)和粒子群優(yōu)化下的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)3個(gè)模塊,操作過(guò)程如下。
圖11為登錄界面,用戶(hù)輸入相應(yīng)賬號(hào)及密碼即可進(jìn)入軟件。
首先進(jìn)入軟件主界面,如圖12所示,用戶(hù)根據(jù)自己需要選擇合適的模型,點(diǎn)擊左側(cè)欄相應(yīng)模型下的確認(rèn)按鈕即可進(jìn)入該模型進(jìn)行預(yù)測(cè)。
軟件各預(yù)測(cè)模塊截面如圖13所示,將經(jīng)驗(yàn)數(shù)據(jù)讀取后,輸入各模型相應(yīng)參數(shù),即可完成模型的訓(xùn)練,在右側(cè)欄及模型檢驗(yàn)處可查看該次訓(xùn)練模型的優(yōu)劣,模型訓(xùn)練完成后,讀取所要預(yù)測(cè)數(shù)據(jù),點(diǎn)擊預(yù)測(cè)按鈕即可實(shí)現(xiàn)該讀入數(shù)據(jù)的預(yù)測(cè)。
圖10 PSO-BPNN預(yù)測(cè)模型預(yù)測(cè)結(jié)果分析Fig.10 Analysis of prediction results of PSO-BPNN prediction model
圖11 登錄界面Fig.11 Login interface
圖12 軟件主界面Fig.12 Software main interface
圖13 軟件預(yù)測(cè)界面Fig.13 Software prediction interface
該軟件與所述模型相對(duì)應(yīng),用戶(hù)可根據(jù)不同需求選擇不同的預(yù)測(cè)模型來(lái)實(shí)現(xiàn)相應(yīng)的功能,模型的訓(xùn)練不需反復(fù)的去調(diào)整程序,只需簡(jiǎn)單的修改界面參數(shù)即可完成,方便快捷,上手簡(jiǎn)單,易于操作,極大節(jié)省了不同條件下的數(shù)據(jù)預(yù)測(cè)時(shí)模型的建立時(shí)間。
針對(duì)現(xiàn)有管道腐蝕預(yù)測(cè)模型的局限性,提出了一種基于RF-PSO-BPNN的海底管道腐蝕泄漏預(yù)測(cè)模型,并驗(yàn)證了其可行性,得出如下結(jié)論。
(1)影響海底管道腐蝕速率的因素有許多,且一些影響因素間存在較強(qiáng)相關(guān)性,在此先采用斯皮爾曼相關(guān)系數(shù)對(duì)影響因素間的相關(guān)性進(jìn)行分析,找出相關(guān)性較強(qiáng)的因素,隨后采用隨機(jī)森林進(jìn)行影響因素重要性排序,剔除掉相關(guān)性較強(qiáng)且重要性較小的因素,成功篩選出重要性較高且相關(guān)性較弱的四項(xiàng)因素,有效降低了因素間相關(guān)性及因素的冗余性對(duì)預(yù)測(cè)精度的影響。
(2)對(duì)比BPNN和RFR兩種預(yù)測(cè)模型,發(fā)現(xiàn)BPNN預(yù)測(cè)模型較RFR擬合度較好,但預(yù)測(cè)精度稍差,因此采用PSO優(yōu)化算法對(duì)BPNN的權(quán)值、閾值進(jìn)行優(yōu)化,建立了PSO-BPNN預(yù)測(cè)模型,該模型MAE僅為0.790 09,比未優(yōu)化的模型提高了0.803 77,MSE提高了2.641 07,且R2為0.915 14,接近于1,可見(jiàn)優(yōu)化后的模型在預(yù)測(cè)精度及擬合度等方面都有了顯著的提高??蓪?duì)不同工況下的油氣運(yùn)輸管道腐蝕泄漏風(fēng)險(xiǎn)進(jìn)行較為精準(zhǔn)的預(yù)測(cè),延長(zhǎng)海底油氣管道的生命周期。
(3)基于所建立模型,編制了管道腐蝕預(yù)測(cè)軟件,使管道腐蝕泄漏預(yù)測(cè)工作更為簡(jiǎn)單方便。