呂瑞宏,王春云,趙藝偉,王晨麗
(沈陽工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,沈陽 110870)
由于土壤腐蝕和自然環(huán)境的影響,長(zhǎng)輸埋地管道防腐層產(chǎn)生的裂紋易使管道金屬層出現(xiàn)損傷,從而導(dǎo)致管道泄漏、斷裂甚至爆炸,因此對(duì)管道防腐層進(jìn)行裂紋損傷識(shí)別具有重要意義[1-2]。管道防腐層損傷檢測(cè)是保障管道安全運(yùn)輸?shù)闹匾芯績(jī)?nèi)容,利用超聲導(dǎo)波技術(shù)檢測(cè)管道防腐層缺陷具有明顯優(yōu)勢(shì)[3-4]。
目前,李強(qiáng)林等證明了超聲導(dǎo)波檢測(cè)技術(shù)可用于埋地管道的快速檢測(cè)[5];張廣純等應(yīng)用超聲導(dǎo)波檢測(cè)技術(shù)識(shí)別了鋁板缺陷的類型、大小及位置信息[6];楊辰等將位移值和固有頻率值相互融合成一種新的損傷特征向量矩陣,該方法可以有效地對(duì)損傷位置以及程度進(jìn)行識(shí)別和評(píng)估[7];劉文光等[8]提出以固有頻率為損傷特征向量的裂縫識(shí)別方式;王紅君等提出一種基于集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD,ensemble empirical mode decomposition)小波閾值去噪和布谷鳥算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的方法,實(shí)現(xiàn)了風(fēng)電機(jī)組齒輪箱中故障的診斷[9];楊曉暉等提出基于多粒度級(jí)聯(lián)孤立森林(IForest,isolation forest)的檢測(cè)模型,提高了在高維數(shù)據(jù)中異常值檢測(cè)的精確度[10];吳小姣等[11]將缺失森林(MF,miss forest)填補(bǔ)法與貝葉斯線性回歸法、蒙特卡洛多重填補(bǔ)法、K鄰近填補(bǔ)法進(jìn)行對(duì)比,結(jié)果表明缺失森林在缺失數(shù)據(jù)中填補(bǔ)優(yōu)勢(shì)最大;李仙琳[12]等利用核主成分分析(KPCA,kernel principal components analysis)算法對(duì)鉆井各參數(shù)進(jìn)行信息整合,結(jié)果表明基于KPCA優(yōu)化的模型較其他模型具有較高的溢流診斷率及模型泛化能力;夏田等[13]采用小波包分解與梯度提升樹(GBDT,gradient boosting decision tree)算法相結(jié)合的方法對(duì)軸承故障進(jìn)行損傷識(shí)別,結(jié)果表明此方法在軸承損傷識(shí)別方面表現(xiàn)優(yōu)異;李超[14]采用極端梯度提升(XGBoost,extreme gradient boosting)算法構(gòu)建爆管風(fēng)險(xiǎn)評(píng)估模型,結(jié)果證明基于XGBoost的管道爆管風(fēng)險(xiǎn)評(píng)估模型具有較高的精準(zhǔn)性與穩(wěn)定度。
基于以上研究,針對(duì)管道防腐層結(jié)構(gòu)的固有頻率值對(duì)于不同損傷長(zhǎng)度的裂紋的敏感程度不同,本文以頻域特征固有頻率值作為管道防腐層裂紋損傷識(shí)別的特征向量,利用孤立森林和缺失森林對(duì)頻域特征值進(jìn)行異常檢測(cè)和數(shù)據(jù)補(bǔ)全,并應(yīng)用KPCA對(duì)得到的損傷數(shù)據(jù)庫進(jìn)行特征降維,獲取優(yōu)化后的裂紋損傷數(shù)據(jù)集,構(gòu)建基于XGBoost的管道防腐層裂紋損傷識(shí)別模型,實(shí)現(xiàn)裂紋損傷長(zhǎng)度的判定,并通過有限元仿真與現(xiàn)場(chǎng)實(shí)驗(yàn)驗(yàn)證其有效性。
在管道防腐層裂紋損傷識(shí)別中,采集到的原始裂紋損傷信號(hào)s(t)是非線性的,設(shè)定s(t)為:
s(t)=x(t)+n(t)
(1)
式中,x(t)為裂紋損傷信號(hào),n(t)為噪聲信號(hào)。為了從混疊的s(t)中提取裂紋損傷信息,消除噪聲的干擾,本文選用EEMD方法對(duì)s(t)進(jìn)行去噪分解,在EEMD中引入噪聲輔助信號(hào)分析,可以有效解決經(jīng)驗(yàn)?zāi)B(tài)分解(EMD,empirical mode decomposition)中可能出現(xiàn)的模態(tài)混疊現(xiàn)象。EMD是將原始信號(hào)X(t)分解為一系列本征模態(tài)函數(shù)mi(t)和一個(gè)殘余量rN(t)之和,表達(dá)式為:
(2)
式中,mi(t)為本征模態(tài)函數(shù),rN(t)為殘余量。
EEMD在s(t)中添加白噪聲輔助分析,將s(t)分解為多個(gè)尺度分量之后繼續(xù)進(jìn)行總體平均運(yùn)算,去除白噪聲的干擾,獲取最終的信號(hào)分解量[15]?;镜膶?shí)施流程如下:首先選擇集總平均次數(shù)N和標(biāo)準(zhǔn)高斯白噪聲的標(biāo)準(zhǔn)差σ生成均值為0、標(biāo)準(zhǔn)差為σstd(x)的高斯白噪聲并加入到s(t)中,然后對(duì)合成信號(hào)進(jìn)行EMD處理并重復(fù)上述步驟共N次,最后取N次分解得到的IMF分量的平均作為EEMD的IMF分量。
對(duì)采集的s(t)進(jìn)行EEMD時(shí)頻分析,得到10個(gè)IMF分量M1(t),…,M10(t)和1個(gè)殘余分量R1(t),由于前六階IMF分量構(gòu)成了s(t)的主要瞬時(shí)信號(hào),后四階IMF分量的能量分布較小,其對(duì)于s(t)的影響可忽略不計(jì),因此本文只取前6個(gè)IMF分量M1(t),…,M6(t)進(jìn)行分析。
對(duì)上述經(jīng)過EEMD時(shí)頻分析處理后獲得的M1(t),…,M6(t)進(jìn)行FFT頻域特征處理,提取裂紋損傷信號(hào)的頻域特征值Ci(k),i=1,2,…,6,公式如式(3)所示:
FFT[ac1(t)+bc2(t)+…]=aC1(k)+bC2(k)+…
(3)
式中,a與b均為常數(shù),通過FFT計(jì)算得到各個(gè)分量的頻域特征C1(k),…,C6(k)構(gòu)成管道防腐層裂紋損傷數(shù)據(jù)集S,表達(dá)式為:
S={C1,C2,C3,C4,C5,C6}
(4)
其中:C1,…,C6為裂紋損傷信號(hào)的六階頻域特征值。
在對(duì)管道防腐層雙層結(jié)構(gòu)進(jìn)行健康檢測(cè)的過程中,不可避免地會(huì)受到環(huán)境影響或人為因素的干擾,可能導(dǎo)致采集到的管道損傷數(shù)據(jù)中存在異常值。管道損傷數(shù)據(jù)集中的異常值會(huì)影響后續(xù)進(jìn)行管道損傷的類型與尺寸識(shí)別,為減小管道損傷檢測(cè)的誤差,需要對(duì)管道損傷數(shù)據(jù)集進(jìn)行異常值識(shí)別,檢測(cè)出損傷數(shù)據(jù)集中的異常值并進(jìn)行剔除。
孤立森林(IForest)異常值檢測(cè)算法的基學(xué)習(xí)器是決策樹[16],IForest的核心是將S中的異常值孤立出來[17],該算法在損傷數(shù)據(jù)異常識(shí)別中性能表現(xiàn)優(yōu)異。IForest定義異常樣本為離群點(diǎn),離群點(diǎn)離分布密集的正常樣本的距離較遠(yuǎn),而且離群樣本通常呈現(xiàn)稀疏分布。IForset針對(duì)異常值的孤立方法如圖1所示,對(duì)S進(jìn)行多次樣本分割,因異常點(diǎn)分布稀疏的特性,只需要極少次的分割就能夠?qū)⑵錂z測(cè)出來。
圖1 運(yùn)用孤立森林進(jìn)行異常檢測(cè)
利用IForest進(jìn)行異常檢測(cè)時(shí),首先對(duì)S隨機(jī)抽樣并進(jìn)行訓(xùn)練,設(shè)定孤立樹為100棵,異常值比例為0.05,此時(shí)S為6維數(shù)據(jù)。應(yīng)用IForest對(duì)S進(jìn)行異常檢測(cè)可視化時(shí),由于結(jié)果圖受2維平面的限制,因此選擇S中的兩維特征進(jìn)行可視化操作,結(jié)果圖如圖2所示。
圖2 裂紋損傷數(shù)據(jù)集異常檢測(cè)可視化
從統(tǒng)計(jì)學(xué)的角度分析,裂紋損傷數(shù)據(jù)中的正常值分布在稀疏區(qū)域的機(jī)率很小,因此能夠確定分布在稀疏區(qū)域的裂紋損傷數(shù)據(jù)為異常值,應(yīng)用IForest將S中的異常值識(shí)別并剔除后構(gòu)建新的裂紋損傷數(shù)據(jù)集X。
由于應(yīng)用IForest對(duì)S進(jìn)行異常值檢測(cè)后剔除異常數(shù)據(jù)會(huì)導(dǎo)致數(shù)據(jù)缺失,因此需要通過數(shù)據(jù)補(bǔ)全的方法補(bǔ)全X。傳統(tǒng)的數(shù)據(jù)補(bǔ)全方式有均值填補(bǔ)、中位數(shù)填補(bǔ)以及眾數(shù)填補(bǔ)等,而采用傳統(tǒng)的填補(bǔ)方式來補(bǔ)全X與S相比會(huì)產(chǎn)生較大的誤差,故本文選擇缺失森林(MF)算法對(duì)X進(jìn)行數(shù)據(jù)補(bǔ)全。MF算法彌補(bǔ)了傳統(tǒng)的數(shù)據(jù)補(bǔ)全方法的不足,MF是基于隨機(jī)森林的一種較為常用的數(shù)據(jù)補(bǔ)全算法,首先通過完整部分的X訓(xùn)練出隨機(jī)森林預(yù)測(cè)模型,然后對(duì)X中缺失的損傷數(shù)據(jù)進(jìn)行預(yù)測(cè),最后通過不斷迭代來補(bǔ)全X中全部缺失的損傷數(shù)據(jù)。在缺失森林算法參數(shù)的設(shè)定中,決策樹數(shù)量為500,選擇有放回采樣,并行決策樹數(shù)量為1。
裂紋損傷數(shù)據(jù)集X的數(shù)據(jù)補(bǔ)全過程如下:
1)利用傳統(tǒng)填補(bǔ)方式,例如均值填補(bǔ)、眾數(shù)填補(bǔ)對(duì)X進(jìn)行填補(bǔ);
2)X的缺失列按缺失率進(jìn)行排序,缺失列的指標(biāo)集記為M;
3)當(dāng)不滿足停止準(zhǔn)則γ時(shí):
(4)依次對(duì)M中缺失數(shù)據(jù)進(jìn)行數(shù)據(jù)補(bǔ)全,直到滿足停止準(zhǔn)則γ或已達(dá)到最大的迭代次數(shù)。
4)最終對(duì)X進(jìn)行數(shù)據(jù)補(bǔ)全,構(gòu)建補(bǔ)全后的裂紋損傷數(shù)據(jù)集為D。
為了更全面反映裂紋損傷信號(hào)中包含的信息,需要盡可能多的采集裂紋特征參數(shù),然而由于原始特征參數(shù)的維數(shù)過大和相關(guān)性會(huì)為后續(xù)進(jìn)行裂紋損傷長(zhǎng)度識(shí)別造成影響,因此本文利用KPCA對(duì)裂紋損傷數(shù)據(jù)集D進(jìn)行有效性分析,篩選出最能表征不同缺陷差異的裂紋特征參數(shù),并將高維原始特征空間降維到低維特征空間。
KPCA是一種基于線性PCA的非線性擴(kuò)展降維方法,KPCA原理是將D的樣本空間映射到更高維度的空間,再進(jìn)行PCA處理。假設(shè)裂紋損傷樣本d1,d2…dM,{di}表示裂紋損傷樣本空間,通過KPCA的映射為Φ,公式定義:
Φ=Rd′→F
daξ=Φ(d)
(5)
樣本空間d到F的映射通過核函數(shù)實(shí)現(xiàn),由核函數(shù)映射的樣本空間滿足中心化條件為:
(6)
則特征空間中的協(xié)方差矩陣為:
(7)
得到C的特征值λ(λ≥0)和特征向量v為:
(8)
則有:
(9)
其中:v=1,2,…,M。定義M×M維矩陣K:
Kμν=(Φ(dμ)·Φ(dv))
(10)
則式(9)簡(jiǎn)化為:
MλKα=K2α
(11)
由此可得λ和v,對(duì)于裂紋損傷樣本在特征向量空間Vk中映射為:
(12)
將核函數(shù)替換內(nèi)積,則有:
(13)
當(dāng)式(6)不成立時(shí),需調(diào)整核矩陣為:
(14)
本文采用KPCA方法對(duì)裂紋損傷數(shù)據(jù)集D進(jìn)行特征提取,處理過程如下:
首先獲取n個(gè)指標(biāo),其中每個(gè)指標(biāo)均有m個(gè)裂紋損傷樣本,記為m×n維裂紋損傷數(shù)據(jù)矩陣,然后選擇高斯徑向核函數(shù)并計(jì)算核矩陣K,通過公式(14)來調(diào)整核矩陣并計(jì)算裂紋損傷數(shù)據(jù)的特征值λ1,…λn以及對(duì)應(yīng)的特征向量v1,…vn;將特征值進(jìn)行排序,對(duì)損傷特征向量正交化得到α1,…αn,計(jì)算損傷特征值貢獻(xiàn)度B1,…Bn并對(duì)貢獻(xiàn)度低的維度進(jìn)行降維處理;最后通過K計(jì)算裂紋損傷特征向量投影Y=KL·α,其中α=(α1,…,αt),Y即為經(jīng)過KPCA降維優(yōu)化后的裂紋損傷數(shù)據(jù)集。
裂紋損傷數(shù)據(jù)集D中包含6維頻域特征向量,對(duì)其進(jìn)行KPCA特征降維,計(jì)算裂紋各個(gè)損傷特征的特征值和貢獻(xiàn)度分別如圖3和圖4所示,其中PC1到PC6對(duì)應(yīng)D中的6維裂紋損傷特征。
圖3 各損傷特征的特征值
圖4 各損傷特征的貢獻(xiàn)率
由圖3可知,PC6的特征值可以忽略不計(jì),由圖4可知,PC1到PC5的貢獻(xiàn)率累加能夠覆蓋99%的裂紋損傷特征信息,所以本文選取前5階裂紋損傷特征向量構(gòu)建新的裂紋損傷數(shù)據(jù)集Y={Y1,…,Y5}。
由于上述構(gòu)建的裂紋損傷數(shù)據(jù)集Y是非線性的,因此本文選擇非線性逼近能力優(yōu)秀、預(yù)測(cè)準(zhǔn)確率高且訓(xùn)練時(shí)間短的極端梯度提升樹(XGBoost)算法進(jìn)行裂紋損傷長(zhǎng)度識(shí)別。XGBoost算法是在GBDT算法上進(jìn)行優(yōu)化,通過多棵決策樹來組合擬合上次回歸預(yù)測(cè)反饋的殘差,是一種基于串行的集成學(xué)習(xí)算法[18-21]。
XGBoost的基學(xué)習(xí)器選擇分類回歸樹(CART),模型公式如下:
(15)
其中:Ψ={f(x)=wq(x)}(q:Rm→T,w∈RT),q表示分類回歸樹映射損傷樣本到葉節(jié)點(diǎn)的分?jǐn)?shù),wq(x)表示所以分類回歸樹映射分?jǐn)?shù)的集合,T代表分類回歸樹葉節(jié)點(diǎn)的數(shù)量,則模型的目標(biāo)函數(shù)為:
(16)
(17)
決策樹預(yù)測(cè)的殘差值被生成的決策樹擬合,當(dāng)t棵決策樹生成后,得到的公式為:
(18)
將目標(biāo)函數(shù)記為:
(19)
提取第t棵分類回歸樹的預(yù)測(cè)值進(jìn)行優(yōu)化,可以使用二階泰勒展開近似表示為:
(20)
公式(20)中g(shù)i和hi分別為i第個(gè)樣本預(yù)測(cè)值的一階梯度和二階梯度:
(21)
(22)
移除ft(xi)無關(guān)項(xiàng),定義Ij={i|q(xi)=j}為第t棵決策樹中第j個(gè)葉子節(jié)點(diǎn)所在的損傷樣本,對(duì)損失函數(shù)進(jìn)行簡(jiǎn)化得到:
(23)
計(jì)算得到第t次迭代中損失函數(shù)極值點(diǎn)的值為:
(24)
(25)
由于原始裂紋損傷信號(hào)s(t)是非線性的,因此采用EEMD方法對(duì)s(t)進(jìn)行去噪分解,得到多個(gè)IMF分量,IMF分量中同時(shí)包含了裂紋損傷信息和噪聲信息,應(yīng)用FFT提取頻域特征固有頻率值并構(gòu)建裂紋損傷數(shù)據(jù)集S,利用S作為模型輸入直接進(jìn)行裂紋長(zhǎng)度識(shí)別時(shí)會(huì)導(dǎo)致數(shù)據(jù)精準(zhǔn)度下降從而產(chǎn)生誤判,因此需要對(duì)S進(jìn)行數(shù)據(jù)優(yōu)化。由于S的復(fù)雜程度較高,采集過程又存在環(huán)境影響和人工失誤等因素,可能會(huì)造成S中存在異常值。為了消除異常值,采用IForest算法對(duì)S進(jìn)行異常值檢測(cè)。通過IForest識(shí)別并剔除異常值后,構(gòu)建的裂紋損傷數(shù)據(jù)集X中存在缺失值,采用缺失森林算法對(duì)X進(jìn)行數(shù)據(jù)補(bǔ)全,構(gòu)建裂紋損傷數(shù)據(jù)集D。KPCA能夠優(yōu)化裂紋損傷數(shù)據(jù),提取主要損傷特征向量,得到5階裂紋損傷固有頻率值Y作為裂紋損傷長(zhǎng)度識(shí)別的特征向量。因此,本文提出了IF、MF、KPCA優(yōu)化XGBoost的管道防腐層裂紋損傷識(shí)別算法,由以上分析提出基于XGBoost的裂紋損傷長(zhǎng)度識(shí)別模型的流程圖如圖5所示。
圖5 裂紋損傷長(zhǎng)度識(shí)別模型流程圖
當(dāng)管道的半徑足夠大時(shí),可將管道防腐層雙層結(jié)構(gòu)看作管道-防腐層雙層板狀結(jié)構(gòu)來進(jìn)行研究,管道防腐層雙層結(jié)構(gòu)微體元模型如圖6所示,其中鋼制管道內(nèi)徑R1、外徑R2,防腐層厚度為hv=(R-R2),鋼管厚度為hE=(R2-R1),取鋼制管道中厚度為R-R1、寬度為d、體積為V的單元體可看作寬度為d的鋼板-防腐層雙層板狀結(jié)構(gòu)。
圖6 管道防腐層雙層結(jié)構(gòu)微體元分解圖
工程中,3PE防腐層因其電絕緣、防水性好、耐腐蝕等優(yōu)點(diǎn)已成為管道防腐涂層的首選。由于環(huán)氧樹脂的物理聲學(xué)參數(shù)與3PE防腐層相近,因此本實(shí)驗(yàn)平臺(tái)采用鋼板與環(huán)氧樹脂板結(jié)合形成雙層板狀結(jié)構(gòu)來模擬管道防腐層雙層結(jié)構(gòu)進(jìn)行損傷分析,其中含裂紋缺陷的鋼板-環(huán)氧樹脂板模型在仿真計(jì)算中的參數(shù)如表1所示。
表1 鋼板-環(huán)氧樹脂板雙層結(jié)構(gòu)參數(shù)
利用COMSOL仿真軟件構(gòu)建含裂紋缺陷的鋼板-環(huán)氧樹脂板雙層結(jié)構(gòu)仿真模型,其中鋼板的長(zhǎng)×寬×高為0.4 m×0.3 m×0.006 m,環(huán)氧樹脂板的長(zhǎng)×寬×高為0.4 m×0.3 m×0.004 m。
利用COMSOL仿真軟件加載幅值為0.1 mm、頻率2.5 MHz的正弦交變力作為鋼板-環(huán)氧樹脂板結(jié)構(gòu)的激勵(lì)源,超聲波激勵(lì)信號(hào)如公式(26)所示:
(26)
通過COMSOL仿真依次均勻改變裂紋的長(zhǎng)度,長(zhǎng)度范圍為4 cm到40 cm,間隔0.8 cm,對(duì)鋼板-環(huán)氧樹脂板雙層結(jié)構(gòu)進(jìn)行動(dòng)態(tài)仿真,通過超聲導(dǎo)波進(jìn)行缺陷檢測(cè)獲取損傷狀態(tài)下的固有頻率值,其動(dòng)態(tài)仿真結(jié)構(gòu)圖如圖7所示。
圖7 含裂紋缺陷的鋼板-環(huán)氧樹脂板動(dòng)態(tài)仿真結(jié)構(gòu)圖
由于六維裂紋損傷特征向量的可視化在二維平面中受限,因此以裂紋損傷數(shù)據(jù)集中的第三階固有頻率值為例進(jìn)行分析,得到含不同損傷長(zhǎng)度的裂紋的鋼板-環(huán)氧樹脂板雙層結(jié)構(gòu)的固有頻率值的變化如圖8所示。
圖8 不同裂紋長(zhǎng)度的管道-防腐層結(jié)構(gòu)固有頻率值
由圖8可知,在鋼板-環(huán)氧樹脂板雙層結(jié)構(gòu)中,結(jié)構(gòu)的固有頻率值隨著裂紋長(zhǎng)度的增大呈現(xiàn)出逐漸減少的趨勢(shì),表明結(jié)構(gòu)的固有頻率值與裂紋損傷長(zhǎng)度之間存在相關(guān)性,為后續(xù)使用XGBoost回歸算法實(shí)現(xiàn)管道防腐層裂紋損傷長(zhǎng)度判定提供了理論基礎(chǔ)。
含有裂紋缺陷的管道-防腐層雙層板狀結(jié)構(gòu)設(shè)計(jì)為為雙層板上層為鋼板,下層為環(huán)氧樹脂板,鋼板的長(zhǎng)×寬×高為0.4 m×0.3 m×0.006 m,環(huán)氧樹脂板的長(zhǎng)×寬×高為0.4 m×0.3 m×0.004 m。在鋼板上放置發(fā)送和接收兩個(gè)探頭,現(xiàn)場(chǎng)實(shí)驗(yàn)中選取頻率為2.5 MHz,K=2的斜探頭激發(fā)超聲導(dǎo)波,其中斜探頭的指標(biāo)如表2所示。
表2 超聲導(dǎo)波斜探頭指標(biāo)
利用超聲導(dǎo)波接收探頭采集含裂紋缺陷的超聲回波信號(hào)并使用示波器顯示信號(hào)波形,分別對(duì)采集到的裂紋回波信號(hào)進(jìn)行分析與處理,能夠獲取代表裂紋損傷特征的信息,其中不同損傷長(zhǎng)度的裂紋具有不同的損傷特征。
實(shí)驗(yàn)中保持環(huán)氧樹脂板中裂紋的寬度為4 mm,高度為3 mm,通過依次均勻改變環(huán)氧樹脂板上裂紋的長(zhǎng)度,分別采集裂紋長(zhǎng)度從4 cm到40 cm(間隔0.8 cm)的超聲回波信號(hào),本文以裂紋長(zhǎng)度為8 cm為例來分析,接收到的原始裂紋損傷信號(hào)對(duì)其進(jìn)行EEMD時(shí)頻分析,得到的結(jié)果圖如圖9所示。
圖9 原始裂紋損傷信號(hào)EEMD6階分解
在管道-防腐層雙層結(jié)構(gòu)裂紋損傷識(shí)別中,首先分別對(duì)接收到的原始裂紋損傷信號(hào)進(jìn)行時(shí)頻分析,然后通過快速傅里葉變換分別對(duì)其進(jìn)行頻域的損傷特征提取,得到與損傷相對(duì)應(yīng)的頻域特征值。本文以裂紋長(zhǎng)度為8 cm為例,對(duì)接收到的回波信號(hào)分別進(jìn)行EEMD時(shí)頻分析并將前6個(gè)IMF分量進(jìn)行FFT變換,提取裂紋損傷信號(hào)頻域特征量,如圖10所示為管道防腐層雙層結(jié)構(gòu)裂紋損傷前后的信號(hào)頻域特征量的對(duì)比。
圖10 管道防腐層結(jié)構(gòu)裂紋損傷前后的頻域特征值
由圖10可知,當(dāng)管道防腐層結(jié)構(gòu)出現(xiàn)裂紋缺陷時(shí),結(jié)構(gòu)的頻域特征值減小,驗(yàn)證了管道防腐層裂紋損傷動(dòng)態(tài)仿真結(jié)論,為后續(xù)使用XGBoost算法對(duì)裂紋進(jìn)行長(zhǎng)度識(shí)別提供了支持。
針對(duì)管道防腐層裂紋損傷長(zhǎng)度識(shí)別,采用裂紋損傷長(zhǎng)度為4~40 cm(間隔0.8 cm)的46組樣本,輸入的頻域特征值采用經(jīng)過IForest異常檢測(cè)、MF數(shù)據(jù)補(bǔ)全、KPCA降維優(yōu)化后的損傷數(shù)據(jù)。
如圖11和圖12標(biāo)準(zhǔn)XGBoost 分類算法出現(xiàn)相對(duì)較多的測(cè)試誤差,對(duì)管道防腐層進(jìn)行損傷類型識(shí)別的精度相對(duì)較低,而應(yīng)用IForest+MF+KPCA+XGBoost 分類算法的識(shí)別精度達(dá)到 90.9%,相比只采用標(biāo)準(zhǔn)XGBoost 分類算法的精度提高了 12.2%。其中,橫坐標(biāo)為樣本數(shù)量,單位是(個(gè)),縱坐標(biāo)1,2,3分別表示裂紋,孔洞,剝離三種損傷類型。
圖11 基于標(biāo)準(zhǔn) XGBoost分類算法的結(jié)構(gòu)損傷類型識(shí)別結(jié)果
圖12 基于IForest+MF+KPCA+XGBoost分類算法的結(jié)構(gòu)損傷類型識(shí)別結(jié)果
本文分別采用XGBoost、GBDT、Random Forest三種算法對(duì)管道防腐層裂紋損傷長(zhǎng)度進(jìn)行判定,從上述構(gòu)建的46組樣本中選取36組樣本作為訓(xùn)練樣本,剩余的10組樣本作為測(cè)試樣本,選取均方誤差和決定系數(shù)為性能度量。裂紋長(zhǎng)度識(shí)別結(jié)果的均方誤差(MSE)和決定系數(shù)分別如圖13和圖14所示。
圖13 MSE對(duì)比結(jié)果圖
圖14 決定系數(shù)對(duì)比結(jié)果圖
由圖13和圖14可知,XGBoost回歸算法的均方誤差最小且決定系數(shù)最大,表明在管道防腐層裂紋長(zhǎng)度識(shí)別中,XGBoost回歸算法的效果最優(yōu),泛化能力最強(qiáng)。
XGBoost回歸算法對(duì)裂紋損傷長(zhǎng)度識(shí)別的結(jié)果圖如圖15所示,橫坐標(biāo)為對(duì)比數(shù)量,單位是(個(gè)),在使用XGBoost回歸算法對(duì)裂紋損傷長(zhǎng)度進(jìn)行判定時(shí),設(shè)定max_depth為5,初始學(xué)習(xí)率為0.01,回歸樹的個(gè)數(shù)為500個(gè)。
圖15 裂紋損傷長(zhǎng)度識(shí)別結(jié)果
XGBoost回歸算法對(duì)管道防腐層的裂紋進(jìn)行損傷長(zhǎng)度識(shí)別輸出的具體結(jié)果如表3所示。
表3 裂紋損傷長(zhǎng)度識(shí)別輸出結(jié)果
根據(jù)表3可知,裂紋損傷長(zhǎng)度的識(shí)別輸出值與測(cè)試結(jié)果的最大相對(duì)誤差在4.37厘米以內(nèi),平均誤差為 1.706厘米表明使用XGBoost算法在管道防腐層裂紋長(zhǎng)度識(shí)別方面表現(xiàn)良好。
本文引入集合經(jīng)驗(yàn)?zāi)B(tài)分解、孤立森林、缺失森林、核主成分分析等方法,提出一種基于XGBoost的管道防腐層裂紋損傷長(zhǎng)度識(shí)別方法。采用IForest+MF+KPCA+XGBoost 分類算法的識(shí)別精度達(dá)到 90.9%,相比只采用標(biāo)準(zhǔn)XGBoost 分類算法的精度提高了 12.2%,選取裂紋損傷信號(hào)的五階固有頻率作為管道防腐層裂紋損傷長(zhǎng)度識(shí)別的特征向量,分別采用XGBoost、GBDT、RF三種回歸算法對(duì)管道防腐層裂紋損傷長(zhǎng)度進(jìn)行判定。實(shí)驗(yàn)結(jié)果表明:應(yīng)用XGBoost回歸算法對(duì)裂紋損傷長(zhǎng)度進(jìn)行識(shí)別時(shí),均方誤差最小,決定系數(shù)最大,回歸最大相對(duì)誤差在4.37厘米以內(nèi),為管道防腐層結(jié)構(gòu)裂紋智能化損傷檢測(cè)提供了有效的識(shí)別方法。