鄭 林 ,張紅星 ,句海洋
(1.太原衛(wèi)星發(fā)射中心,山西 太原 036303;2.中電智能科技有限公司,北京 102209;3.華北計算機系統(tǒng)工程研究所,北京 100083;4.北京工業(yè)大學,北京 100124)
埋地管道是最有效的油氣輸送手段之一,對在役管道進行無損檢測和安全評價已受到各國的高度重視[1]。 管道在鋪設和運行后,由于腐蝕、第三方破壞以及自然災害等因素的影響,不可避免地會形成一些損傷,需要通過相關(guān)的檢測方法及時檢測缺陷,并評估其對管道安全的影響。 常規(guī)管道檢測中常用的無損檢測(NDT)技術(shù)有超聲波檢測(UT)和漏磁檢測(MFL)[2],屬于管道內(nèi)檢測(ILI)范疇,ILI需要克服管道運行壓力、流量、變形和管道清潔度對檢測精度的影響,而傳統(tǒng)的內(nèi)部檢測技術(shù)僅適用于已形成的宏觀缺陷,對鐵磁材料的應力集中和損傷早期診斷無效[3]。 另外,大多數(shù)埋地管道都具有限制清管的特點,因此在非開挖狀態(tài)下,管道缺陷的檢測是一個亟待解決的問題。
目前,可用的一些外部檢測技術(shù)包括渦流(EC)方法[4]、導波檢測(GWT)[5]、瞬變電磁法(TEM)[6]和射線掃描法[7],以上方法稱為主動式(有激勵信號源)檢測,但以上方法均為外部電磁激勵檢測方法,增加了現(xiàn)場檢測的難度,且對于管道損傷等級的劃分精度方面存在較大問題。
相關(guān)學者從不同的角度對管道缺陷處產(chǎn)生的缺陷磁信號與缺陷參數(shù)大小關(guān)系進行了實驗和研究,針對金屬磁記憶檢測管道缺陷判定準則的局限性,易方等人[8]構(gòu)造了五維支持向量機輸入特征向量:區(qū)域信號的峰峰值、修正傅里葉系數(shù)、小波包頻帶能量增量、信號的檢測切向梯度和檢測法向梯度。管道狀態(tài)劃分為應力集中、微觀缺陷和宏觀缺陷3個等級。 張軍等[9]選取磁信號的峰峰值和梯度值作為特征向量來描述缺陷信號特征,通過BP 神經(jīng)網(wǎng)絡實現(xiàn)了套管故障風險等級的非線性分類,實驗驗證了方法的有效性。 邢海燕[10]針對焊縫不同等級的磁記憶特征提取及定量評價難題,引入能夠反映焊縫損傷程度的奇異譜熵、功率譜熵和小波空間能譜熵,首次提出信息熵帶與D-S 理論聯(lián)合的磁記憶定量評價模型。 然而,以上文獻中所使用的管道缺陷識別方法存在實驗樣本少、識別模型普適性不足以及無現(xiàn)場實際驗證等問題。
鑒于以上問題,為彌補現(xiàn)有埋地管道缺陷損傷程度分類問題的不足, 本文提出基于稀疏建模和SVM 的管道缺陷損傷程度分類模型,采用稀疏模型提取管道缺陷的本質(zhì)特征向量,并將缺陷特征向量通過改進的多分類支持向量機分類,為埋地鋼質(zhì)管道在非開挖情況的管體損傷缺陷檢測提供了一種有效的方法。
通過實驗獲取的管道缺陷信號,可以利用VMD算法將其分解為本征模態(tài)函數(shù)(IMF),IMF 是不同頻率的正弦成分的合成信號,字典D=[d1;d2;…;dN]∈RN×M基元可以設計成具有不同頻率、 不同相位、不同延時的信號。
1.1.1 字典初始化方法
聚類分析是數(shù)據(jù)處理領(lǐng)域常用的方法之一,K-means 是無監(jiān)督學習的聚類算法,能夠很好地處理均衡數(shù)據(jù)的聚類問題。 為確保字典學習快速收斂,使得不同原子間具備較小的相關(guān)度,并且提高字典學習的稀疏建模能力,采用基于K-means 算法對由本征模態(tài)函數(shù)構(gòu)成的訓練集進行分類。
首先,計算訓練樣本中所包含的本征模態(tài)函數(shù)之間的相關(guān)度,相關(guān)度可以表示為:
學習字典的相關(guān)度是指字典中各個原子之間相關(guān)度的最大值,可以表示為:
其次,計算每個本征模態(tài)函數(shù)與其他本征模態(tài)函數(shù)間的平均相關(guān)度。
然后,假設字典的維度為D∈RN×M,將平均相關(guān)度最小的M 個本征模態(tài)函數(shù)看作初始聚類中心。若在這M 個本征模態(tài)函數(shù)中, 任兩個本征模態(tài)函數(shù)的相關(guān)度高于其各自相關(guān)度的均值,則將其他本征模態(tài)函數(shù)中相關(guān)度μˉ最小的本征模態(tài)函數(shù)取代以上兩個本征模態(tài)函數(shù)中ˉμ的本征模態(tài)函數(shù), 重復以上過程直至收斂。
再次, 將上述得到原子作為初始聚類的中心,做進一步聚類處理,以μˉ作為衡量標準,并采用 K-means 作為聚類算法, 并將最終聚類中心作為初始字典D 中的原子。
最后,字典初始化,實現(xiàn)字典全部更新。
1.1.2 K 奇異值分解的字典更新方法
為防止字典更新時對矩陣的逆運算,本文采用K 奇異值分解(KSVD)算法,該算法與最優(yōu)方向算法相似,均是根據(jù)迭代算法更新字典,均包含字典更新和稀疏編碼。 不同之處在于, K 奇異值分解算法對字典進行按列更新時,其對應的稀疏系數(shù)同步更細,更有助于算法收斂。 更新每列原子 aj0及其對應的系數(shù),其 中,表示矩陣 X 的第 j 行,求解公式可以表示為:
式中:Y 表示訓練集;A 為稀疏模型集合;dj為字典D 中的第 j 個原子;ak為稀疏模型集 A 的第 k 行。
對于稀疏模型的求解問題可以通過三類方法實現(xiàn),分別是貪心算法、凸松弛方法以及快速近似法。常用的貪心算法有匹配追蹤、正交匹配追蹤、弱匹配追蹤以及閾值等算法,計算信號和原子之間的內(nèi)積,從而獲取信號的稀疏模型,計算效率高,適用于對計算速度有要求的實際應用問題。
本節(jié)所構(gòu)建的管道缺陷信號稀疏模型是為下一小節(jié)處理提供更加簡潔的表達,因此,采用基于貪心算法理論的迭代閾值收縮(Iterative Thresholding,IT)算法,該算法可以準確表示管道缺陷信號。 為了高效、快速地處理字典中的信息,采用正則化正交匹配追蹤(Regularized Orthogonal Matching Pursuit,ROMP)算法,將D 中的原子的相關(guān)系數(shù)分為若干組:
在以上分組中,計算分組內(nèi)的各列向量與其殘差的內(nèi)積,選擇絕對值低于最小值二倍以下的數(shù)據(jù)放入到支撐集中,保證支撐集具備能量最大化的特點。
管道缺陷信號被表示成由VMD 分解得到IMF線性組合,所得到的模態(tài)信號近似正交,不可以直接通過分解后的信號獲得稀疏模型。 在本小節(jié)借鑒層級稀疏建模理論,提出管道缺陷信號層次稀疏建模方法,在層次稀疏建模中,對可以表示成分量信號線性組合形式的混合信號,每個分量信號都有其對應的字典,故可以分別對分量信號進行稀疏建模,進而由分量信號的子字典組成混合信號的字典,可以有效且準確地對信號進行稀疏處理。
在1.1 節(jié)中,已經(jīng)完成了本征模態(tài)函數(shù)基字典的構(gòu)建,可以得到表征原始數(shù)據(jù)特征的各個模態(tài)分量信號,因此,在管道缺陷信號的稀疏建模中,只需對其稀疏度加以約束條件即可,可將正則項省略掉,得到比采用基于層級稀疏建模理論復雜度更低的模型。 在本節(jié)提出基于本征模態(tài)函數(shù)基字典(IMFBD)的管道缺陷信號建模方法中,利用基于正則化正交匹配追蹤對管道信號建模,可以確保稀疏建模的準確度以及計算效率。
根據(jù)實際管道信號特征,本文構(gòu)建一個仿真信號如下:
為了驗證所建立稀疏模型的性能,對公式(6)中仿真信號進行稀疏建模處理,圖1(b)表示稀疏建模過程中的一個原子,重構(gòu)后信號均方根誤差為0.130、標準差為0.129、相關(guān)系數(shù)為0.993、互信息為4.27,圖1(d)是重構(gòu)信號與原始信號的對比分析。
正交匹配追蹤在稀疏建模是基于貪婪算法理論, 將尋優(yōu)問題轉(zhuǎn)換為搜索和字典 D中原子最大內(nèi)積問題,通過迭代方式求得全局最優(yōu)解。 具體實現(xiàn)途徑是,選擇一個與信號y 最為匹配的原子,構(gòu)建一個稀疏逼近,并求出其殘差,選擇與殘差最為相關(guān)的原子放入到支撐集中,然后對集合中的原子做施密特變換,進而將信號y 映射到更新后的字典中,獲取信號y 在集合中的分量,在信號y中減掉該分量,從而得到殘差信號,重復以上過程繼續(xù)分解殘差信號,直至達到預設條件終止。
壓縮感知技術(shù)是一種重要的信號處理方法,其改變了信號的傳統(tǒng)處理方式, 在將信號稀疏建模后,通過壓縮感知方法處理實現(xiàn)了信號的采樣和壓縮同步,對于管道缺陷信號的壓縮感知可以分為稀疏建模、壓縮處理以及信號重構(gòu)。 通過壓縮處理將稀疏后的信號映射到相應的矩陣中,所得到的矩陣即為測量矩陣,測量值可以表示為:
圖1 仿真信號稀疏建模
式 中 ,Ω ∈RT×N為測量矩陣,T表示測量次數(shù),N是信號長度。
基于IMFBD 對測量信號稀疏建模表示如下:
對于企業(yè)來說,安全生產(chǎn)事關(guān)經(jīng)濟效益和生產(chǎn)效率的提高,事關(guān)企業(yè)的可持續(xù)、健康發(fā)展。對于員工來說,安全事關(guān)生命,也是企業(yè)對員工的基本承諾。而對于海外項目而言,安全已經(jīng)成為隊伍能否進入國際服務市場首先必須跨越的一道門檻;沒有高標準的安全管理體系和良好的業(yè)績就很難通過招投標資格預審,更別說拿到項目合同。
通過公式(7)和(8)可以將測量值(也被稱為感知特征系數(shù))表示為:
本征模態(tài)函數(shù)基字典的稀疏表達磁異常信號特征提取模型流程如圖2 所示,首先,對 IMF 進行字典學習;然后,建立基于IMFBD 的磁異常信號稀疏模型,并給出IMFBD 字典學習方法,包括字典初始化、基于迭代閾值收縮(IT)算法的稀疏建模以及基于 K 奇異值分解(KSVD)的字典更新;在此基礎(chǔ)上,借鑒層級稀疏建模的思想,提出基于層次稀疏建模思想的磁異常信號稀疏建模方法。
稀疏模型由其基函數(shù)確定,基函數(shù)確定后,對感知矩陣進行測量,進而得出其測量值。 在信號重構(gòu)過程中,測量值的每一個元素同等重要,因此,其中的一個或幾個元素缺失依然可以對管道缺陷信號重構(gòu),解決特征信號的分類識別問題。
圖2 基于本征模態(tài)函數(shù)基字典的稀疏模型信號特征提取過程
本文所構(gòu)建的多分類支持向量機選用的核函數(shù)由多項式核函數(shù)和RBF 核函數(shù)構(gòu)成,該模型具有更強的學習能力和泛化能力,對于樣本數(shù)據(jù)的分類能力更加準確。 通過將不同的核函數(shù)組合學習,可以使多分類SVM 達到適時選取恰當核函數(shù)的目的, 實現(xiàn)輸入樣本數(shù)據(jù)集到核函數(shù)維度的準確映射,并提高SVM 在管體損傷缺陷識別與分類中的精度。
為了使支持向量機具備局部最優(yōu)和全局最優(yōu)的性能,引入權(quán)重因子η,使其在不同情況合理選擇核函數(shù),通過輸入的訓練樣本數(shù)據(jù)確定合理的權(quán)重因子,從而構(gòu)建多分類SVM,表示形式如下:
式中,Kmix(X,Y)為多分類 SVM 的核函數(shù);Kg(X,Y)為全局核函數(shù);Kl(X,Y)為局部核函數(shù);η 為權(quán)重因子,0<η<1。
SVM 的參數(shù)選擇對其分類準確度和學習速度有重要影響,不合理的參數(shù)將導致SVM 陷入局部最優(yōu)或無法得到預期結(jié)果。 由于SVM 算法自身不足性,一些學者研究采用相關(guān)的優(yōu)化算法來對其進行改造。 目前,比較常用的有遺傳算法和粒子群算法等,本文結(jié)合以上兩種算法,構(gòu)建 GAPSO 優(yōu)化模型,取其各自優(yōu)點組成新的混合智能算法。
GAPSO 算法終止的原則:(1)達到優(yōu)化迭代次數(shù);(2)適應度函數(shù)的容差值連續(xù)60 次小于其預設值,即全局最優(yōu)解。 初始參數(shù)設置中慣性權(quán)重參數(shù)的選擇極為關(guān)鍵,慣性參數(shù)較大時有較好的全局搜索性能,而局部搜索能力對應著較小的慣性權(quán)重,因此,隨著優(yōu)化迭代次數(shù)的增加,κ 逐漸減小,確保了在算法初始具備良好的全局尋優(yōu)能力,在后期具有良好的局部尋優(yōu)能力。 本文 κ 值采用隨迭代次數(shù)由 0.9 線性遞減到 0.3 的方式 ,即 κi=0.9-0.6i/max.num。 另外,粒子群規(guī)模設置為 20,進化代數(shù)設置為 200,交叉概率設置為 0.3,變異概率為 0.015;為了平衡隨機因素影響,將學習因子設為c1=c2=1.5。 為了對比分析 GA、PSO 以及 GAPSO 的計算效率,圖3 采用以上設定參數(shù)對同一種群進行了計算。
圖3 GA、PSO 以及 GAPSO 性能對比分析
在 GAPSO-SVM 模型中,采用 GAPSO 算法來優(yōu)化懲罰參數(shù) c、權(quán)重因子 η 以及核函 σ1和 σ2,并構(gòu)建初始粒子群向量Y:
為了得到SVM 良好的分類性能,其訓練數(shù)據(jù)集的分類精度 E(yi)的適應度函數(shù) F(yi)為:
式中,F(xiàn)(xi)為第 i 個個體粒子的適應度值;E(yi)為第i 個個體粒子對應的 SVM 的分類精準度。
為了確保種群在合理范圍內(nèi)搜索,將位置和速度固定在預設區(qū)間內(nèi),即 c 和 g 取值為[0.1,100]。GAPSO-SVM 算法流程如圖4 所示。
圖5 所示是所建立的埋地管道缺陷磁異常檢測的簡化檢測模型。
圖4 GAPSO-SVM 算法流程
圖5 實驗檢測模型示意圖
實驗管采用 Q235 鋼材料制成,壁厚3 mm,直徑75 mm。 為了研究不同缺陷的磁異常信號,在管道的不同位置制作了6 個缺陷,分別是軸向刻槽、橫向刻槽、矩形刻槽、通孔、盲孔和 45°刻槽,實驗檢測時提離距離是管道直徑的 5 倍,如圖6 所示。
為了獲取SVM 的訓練樣本和驗證樣本數(shù)據(jù)集,對實驗管道進行缺陷識別試驗,并將管道缺陷損傷程度分為三種:低等風險、中等風險以及高等風險,其中,數(shù)據(jù)集采用3.1 節(jié)所描述的管道檢測數(shù)據(jù)。對檢測數(shù)據(jù)進行稀疏建模后,對樣本數(shù)據(jù)與管道缺陷特征進行標記,采用管體缺陷信號的特征向量表示不同的損傷程度,每種損傷等級采集100 組樣本,共 300 組樣本,其中將每種等級的前 50 組作為訓練樣本,后 50 組作為測試樣本。 根據(jù)訓練樣本缺陷信號與管道缺陷損傷程度對應關(guān)系,將歸一化梯度能量指數(shù)(NGEI)分為三個區(qū)間,即[0,0.2]、[0.2,06]以及[0.6,1.0],分別對應管道缺陷實際損傷程度為低等風險、中等風險以及高等風險,列舉部分訓練樣本(管體缺陷信號的特征向量)見表1。
在選用GAPSO 優(yōu)化多分類支持向量機的參數(shù)之前,首先通過人工隨機選取的權(quán)重因子η、懲罰參數(shù) c 及核函數(shù) σ1和 σ2的方式構(gòu)建多分類 SVM模型,其中權(quán)重因子 η 取值范圍為[0,1],懲罰參數(shù) c 取值區(qū)間為[1,100], 核函數(shù) σ1和 σ2取值分別為[0.5,100]和[0.1,2]。 通過表2 統(tǒng)計試驗結(jié)果,可以看出分類識別率最高達到了92.36%, 最低為72.49%。 通過分析得出,隨機選取的 SVM 參數(shù)難以得到穩(wěn)定且準確度較高的分類識別率,受人為主觀影響因素較大。
在采用基于 GAPSO 算法優(yōu)化SVM 參數(shù)選取過程中,假設權(quán)重因子 η 取值為[0,1],核函數(shù)參數(shù) σ1和σ2取范圍是[0,10],懲罰參數(shù) c 的取值為[0,100],確 定種群數(shù)目為 20,最大迭代次數(shù)為 200。 為了避免隨機誤差的出現(xiàn),利用GAPSO 算法優(yōu)化 SVM 相關(guān)參數(shù)的分別計算 10 次,通過 GAPSO 確定懲罰參數(shù)值為 30.28、權(quán)重因子 η 為 0.4 以及核函數(shù)參數(shù)σ1為2.63、σ2為 0.96, 采用優(yōu)化后的參數(shù)代入由多項式核函數(shù)和高斯徑向基核函數(shù)組成的SVM 中,構(gòu)建管道缺陷損傷程度診斷模型,然后對測試樣本進行分析。
進一步分析GAPSO-SVM 的性能,將該模型與未進行優(yōu)化的 SVM、 增量型極限學習機(Increased Extreme Learning Machine,I-ELM) 以 及 BP (Back-Propagation)神經(jīng)網(wǎng)絡算法的處理結(jié)果對比分析。 為了避免偶然誤差造成的影響,分別將各個模型計算10 次取平均值,計算結(jié)果見表3,采用 BP 算法和I-ELM 算法模型的平均精度分別是 79.70% 和82.74%,且不同實驗組別的結(jié)果波動也較大;采用GAPSO-SVM 模型的準確率可達 93.93%,高于采用未經(jīng)過參數(shù)優(yōu)化的SVM 模型的結(jié)果, 且每次計算結(jié)果較為穩(wěn)定。 因此,GAPSO-SVM 模型在應用于埋地管道缺陷識別和等級劃分。
圖6 缺陷在在實驗管道上的具體位置
表1 管道缺陷特征信息表
表2 SVM 在不同參數(shù)下分類準確度對比
表3 測試集分類準確率(%)分析
2017 年 10 月 30 日,對華北油田某采油廠站內(nèi)消防管線開展地磁檢測現(xiàn)場實驗,該管線鋪設運營時間已經(jīng)超過十年,現(xiàn)處于在役狀態(tài)。
檢測結(jié)果如圖7 所示,管體損傷高風險區(qū)2 處,其位置在 21.5 m 和 26.9 m;中等風險區(qū)域 3 處,分別在 42.5 m、78.0 m 以及 95.6 m 處;低等風險區(qū)域2 處,分別 在 62.0~65.7 m 和 81.2 m 處。 經(jīng) 過 開 挖驗證,符合本次檢測分析給出的結(jié)論。
本文針對埋地管道非開挖缺陷損傷程度分類問題, 提出了一種基于稀疏建模和SVM 的分類模型。 通過實驗數(shù)據(jù),對比分析了使用所提出的分類模型和其他模型的缺陷識別能力,并在實際現(xiàn)場中驗證了該模型的可行性。 本文得出以下結(jié)論:
(1)為了準確提取管道損傷信號的本質(zhì)特征,本文提出了基于本征模態(tài)函數(shù)基字典(IMFBD)的管道缺陷信號稀疏建模方法,采用本征模態(tài)函數(shù)(IMF)進行字典學習,并構(gòu)建基于 IMFBD 的學習字典。 在以上工作基礎(chǔ)之上,通過壓縮感知算法,對管道缺陷信號稀疏模型進行分析,提取其特征系數(shù),并通過實驗對信號重構(gòu)即特征提取進行驗證分析。
(2)在管道缺陷信號稀疏模型的特征提取結(jié)束后,采用基于GAPSO 的多分類支持向量機對管道損傷程度進行分類, 根據(jù)GAPSO 算法快速全局優(yōu)化和支持向量機結(jié)構(gòu)風險最小化的特點,構(gòu)建基于稀疏建模和SVM 算法的管道缺陷損傷程度評價模型。 通過試驗分析表明,本文提出的分類方法具備較高的精準度,且相比其他常用算法在決策穩(wěn)定性和準確度方面具備一定優(yōu)勢,可以有效解決埋地管道損傷等級劃分問題。
圖7 埋地管道管體損傷等級劃分
綜上,本文提出的管道缺陷分類方法可以在不開挖的情況下直接識別管體缺陷,表明該方法是一種有效的管道本體外檢測技術(shù)。