夏太武,張文艷,王 飛,王 峰,陳 墨,張 煒
(1.中國石油西南油氣田分公司集輸工程技術研究所,四川 成都 610042;2.中國石油西南油氣田分公司管道管理部,四川 成都 610042)
隨著天然氣廣泛使用于千家萬戶,埋地燃氣管道已遍布城市大街小巷,受城市軌道交通、廢棄物排放等因素影響,以鋼質(zhì)管道為主的燃氣管網(wǎng)經(jīng)過多年運營后,其腐蝕泄漏已成為燃氣企業(yè)安全生產(chǎn)無法回避的問題,十分有必要對埋地燃氣管道實施陰極保護措施[1].強制電流作為陰極保護的重要措施之一,常被用于埋地鋼制管道的特殊區(qū)域[2-3],但強制電流陰極保護在運行過程中不可避免出現(xiàn)各種各樣的問題,導致陰極保護系統(tǒng)不能正常運行,危害管道的安全[4-5],而產(chǎn)生強制電流的恒電位儀是否有效運行便成為整個陰保系統(tǒng)的重中之重.恒電位儀故障通常由恒電位儀內(nèi)部電子元器件或電路受到電磁干擾而顯示異常、結(jié)構(gòu)損壞等引起[6],遺憾的是陰保系統(tǒng)目前還比較缺乏基于專家系統(tǒng)的故障智能診斷技術,恒電位本身的技術問題主要還依托其生產(chǎn)廠家來解決.本文正是基于此情況,借助大數(shù)據(jù)分析技術,研究建立針對恒電位儀的故障診斷模型,一方面為陰保系統(tǒng)預測預警提供支撐,另一方面解決管道生產(chǎn)企業(yè)陰保專業(yè)技術人員配置不足的問題.
恒電位儀是陰極保護系統(tǒng)的控制中心和電源輸出端.通過恒電位儀的正極電纜與輔助陽極相連接,通電后在地下形成一個半球面電場,負極接在被保護管道上,參比電極接線柱與參比電極相連接,參比電極埋設在管道附近,測量輸氣管道電位,監(jiān)測保護效果.恒電位保護開啟后,保護電流從恒電位儀正極流出,經(jīng)過輔助陽極進入土壤,再流到管道上,又沿陰極導線回到電源負極,從而起到保護管道的作用.
根據(jù)統(tǒng)計,恒電位儀故障在陰保系統(tǒng)全部故障種類中占比最高,且一旦發(fā)生對系統(tǒng)正常運行的影響也最為嚴重.如果恒電位儀故障不能及時進行預警和診斷,從而根據(jù)腐蝕情況進行動態(tài)調(diào)整,有時可能會加速管道的腐蝕,給企業(yè)生產(chǎn)埋下安全隱患.因此,借助于人工智能的技術手段積極開展陰極保護的智能故障診斷是企業(yè)安全和可持續(xù)發(fā)展的重要途徑.
但現(xiàn)有簡單的機器學習系統(tǒng)和專家系統(tǒng)主要依賴低維度小數(shù)據(jù)集進行訓練,或者依賴專家在燃氣管道領域基礎知識和故障維護的固有經(jīng)驗規(guī)則形成,存在一定的局限,無法將故障模型與監(jiān)測數(shù)據(jù)有效結(jié)合,嚴重影響了故障定位和分析的效率.
當前恒電位儀故障智能診斷中存在四個較為突出的技術問題,具體表現(xiàn)在[7]:
1)不能對恒電位儀運行過程中涉及多知識領域、無量綱和高度離散的數(shù)據(jù)進行合理的量化和針對性的特征處理,顯著降低了數(shù)據(jù)集信息采集維度,嚴重限制了后續(xù)神經(jīng)網(wǎng)絡建模的擬合復雜度,影響分析準確性.
2)不能對恒電位儀運行過程中的高密度連續(xù)過程運行數(shù)據(jù)進行時序分析,只能進行概率統(tǒng)計分析,顯著降低了數(shù)據(jù)集信息采集維度,限制了后續(xù)神經(jīng)網(wǎng)絡建模的擬合復雜度,影響了分析準確性.
3)因受采集數(shù)據(jù)集規(guī)模的限制,較多地依靠專家針對應用場景進行人工數(shù)據(jù)分析和特征提取,無法完全依靠采集數(shù)據(jù)自動生成恒電位儀故障分析神經(jīng)網(wǎng)絡模型,系統(tǒng)的移植性和適配性較差.
4)因受數(shù)據(jù)分析能力的限制,只能依靠多個小模型對恒電位儀不同來源的數(shù)據(jù)進行分離式分析及分析結(jié)論融合,分析準確度低、操作強度大、操作所需的技術門檻較高,系統(tǒng)的應用受限.
為了實現(xiàn)針對陰保系統(tǒng)恒電位儀的智能故障診斷,融合技術人員在長期陰極保護研究中積累的經(jīng)驗,并利用監(jiān)測點數(shù)據(jù)的時序特點,本文提出利用圖卷積神經(jīng)網(wǎng)絡和Transformer 模型結(jié)合的智能診斷系統(tǒng),提高燃氣管道陰保系統(tǒng)恒電位儀故障的診斷精度.
文獻[8]提出了基于信號的故障診斷方法,文獻[9]對基于解析模型的故障診斷方法、基于信號的故障診斷方法、基于知識的故障診斷方法、混合與主動故障診斷方法進行了分析總結(jié).考慮在恒電位儀故障診斷中,檢測位點之間具有復雜的邏輯關系,檢測點位上的數(shù)據(jù)長遠來說會趨于自動采集,且具備時序數(shù)據(jù)的特點,加之在長期的現(xiàn)場工作中已經(jīng)總結(jié)出一套恒電位儀故障的經(jīng)驗模型.因此本文綜合了文獻[9]中的四種障診斷方法,提出通過圖積神經(jīng)網(wǎng)絡對圖結(jié)構(gòu)的故障診斷經(jīng)驗模型進行復雜邏輯關系的建模,通過時序Transformer 對故障圖中的檢測點時序信號進行建模,通過網(wǎng)絡空間結(jié)構(gòu)和時間序列結(jié)構(gòu)兩個方向的建模,進行恒電位儀故障類別的診斷推理.
圖積神經(jīng)網(wǎng)絡相比于傳統(tǒng)的深度學習方法只擅長提取歐氏空間數(shù)據(jù)特征,它能夠建模非歐式空間生成的數(shù)據(jù),而傳統(tǒng)的深度學習方法在處理非歐式空間數(shù)據(jù)上的表現(xiàn)卻仍難以使人滿意.例如,在故障診斷經(jīng)驗模型中,一個基于圖(Graph)的學習系統(tǒng)能夠利用故障節(jié)點數(shù)據(jù)和故障節(jié)點邏輯關系的交互來做出非常準確的推理,但廣義圖的復雜性使得現(xiàn)有的深度學習算法在處理時面臨著巨大的挑戰(zhàn).這是因為圖是不規(guī)則的,每個圖都有一個大小可變的無序節(jié)點,圖中的每個節(jié)點都有不同數(shù)量的相鄰節(jié)點,導致一些重要的操作(例如卷積)在圖像(Image)上很容易計算,但不再適合直接用于圖.此外,現(xiàn)有深度學習算法的一個核心假設是數(shù)據(jù)樣本之間彼此獨立.然而,對于圖來說,情況并非如此,圖中的每個數(shù)據(jù)樣本(節(jié)點)都會有邊與圖中其他實數(shù)據(jù)樣本(節(jié)點)相關,這些信息可用于捕獲實例之間的相互依賴關系.
Transformer 網(wǎng)絡是一種只用自注意力機制構(gòu)建的神經(jīng)網(wǎng)絡結(jié)構(gòu),相比于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(RNN)和卷積神經(jīng)網(wǎng)絡(CNN),具備更好的遠距離時序特征抽取和隱式強關聯(lián)數(shù)據(jù)融合能力,通過在時間序列上的建模調(diào)整,使用模型除具備過程數(shù)據(jù)的統(tǒng)計特征分析能力外還兼具時間序列的特征分析能力,從而有效擴展了數(shù)據(jù)的分析維度,提高故障分類的精確度[10].
故障診斷模型的核心任務流程圍繞大數(shù)據(jù)驅(qū)動的混合神經(jīng)網(wǎng)絡進行展開,可分為決策單元、訓練單元和輔助單元.三類任務單元互為支撐,共同完成數(shù)據(jù)分析任務[11],如圖1所示.
圖1 大數(shù)據(jù)驅(qū)動的智能故障診斷任務流程Fig.1 Big data driven intelligent fault diagnosis task process
圖1 中,決策單元的核心部分是在線模型庫,其中包含故障判斷的神經(jīng)網(wǎng)絡模型,神經(jīng)網(wǎng)絡模型是基于統(tǒng)計數(shù)據(jù)生成的判決參數(shù)網(wǎng)絡,其構(gòu)建過程只與數(shù)據(jù)的統(tǒng)計概率有關,而與模塊功能之間邏輯相似性無關;訓練單元的核心部分主要是數(shù)據(jù)統(tǒng)計功能和離線訓練功能,數(shù)據(jù)統(tǒng)計功能是系統(tǒng)持續(xù)進行神經(jīng)網(wǎng)絡模型訓練優(yōu)化的數(shù)據(jù)基礎,因此大數(shù)據(jù)處理功能對大系統(tǒng)持續(xù)提交的各種場景下的新運行數(shù)據(jù)進行統(tǒng)計分析,自主完成運行數(shù)據(jù)的分類標定,并將帶有分類標定的新數(shù)據(jù)傳送至離線訓練,保證數(shù)據(jù)分析模塊適用于所有的已有數(shù)據(jù);輔助單元的核心部分主要是程序運行后臺、數(shù)據(jù)庫和數(shù)據(jù)接口.這些基于數(shù)據(jù)分析模塊工作流和數(shù)據(jù)流形成的基本架構(gòu)是支撐故障診斷模型正常運行的必要條件[12].
首先根據(jù)恒電位儀故障的經(jīng)驗模型構(gòu)建一套診斷圖譜,圖譜的節(jié)點為檢測位點,邊為節(jié)點之間的關系;然后利用GCN 對圖譜結(jié)構(gòu)進行建模,再利用時序Transformer 網(wǎng)絡對圖卷神經(jīng)網(wǎng)絡的輸出進行時序建模,最后輸出故障診斷信息,如圖2所示.
圖2 恒電位儀故障診斷技術路線圖Fig.2 Technology roadmap diagram of potentiostat fault dagnosis
具體方案如下[13-14]:
1)通過分析人工對陰極保護系統(tǒng)恒電位儀類無正常輸出故障的研究,將故障分為外部供電故障、恒電位儀輸入保險管熔斷穩(wěn)壓電源變壓器保險管熔斷、恒電位儀輸出保險管熔斷、陰極保護外圍電纜回路短路四種故障類型.每種故障類型中均包含多種可能的原因以及對應的解決指導原則.因此可以構(gòu)建不同監(jiān)測點位與故障原因、故障類別之間的關系圖譜,將故障診斷的邏輯進行結(jié)構(gòu)化存儲,便于下一步進行推理和計算.
2)結(jié)構(gòu)化的恒電位儀故障圖譜中節(jié)點由監(jiān)測點位、故障原因、故障類別構(gòu)成,邊由他們之間的指向關系構(gòu)成,邊的數(shù)值表示概率大小.采集到的監(jiān)測點數(shù)值賦值給故障圖譜中對應的節(jié)點,然后通過使用GCN對每個節(jié)點上數(shù)值進行迭代更新,得到節(jié)點的最新表示.
3)將每個時間點上三層GCN 的輸出構(gòu)建成Transformer 模型的輸入,通過Transformer 模型的計算輸出每個節(jié)點的概率大小.
4)通過將Transformer 輸出的概率和實際節(jié)點的類別計算cross entropy loss,得到梯度后調(diào)整Transformer 和GCN 網(wǎng)絡的參數(shù)權(quán)重,直到loss 低于設定值則停止訓練.
5)將訓練好的模型應用于新的監(jiān)測數(shù)據(jù),將故障圖譜上對應節(jié)點的值賦值為監(jiān)測得到的數(shù)據(jù),然后使用GCN 對節(jié)點進行更新,再通過Transformer 模型計算每個故障原因節(jié)點的輸出概率,選擇最大概率的故障原因作為輸出.
按照2.2 的技術路線,恒電位儀故障診斷模型建立過程如下[15]:
1)依據(jù)對恒電位儀故障系統(tǒng)經(jīng)驗模型的研究,將根據(jù)系統(tǒng)故障診斷技術、系統(tǒng)智能預警及控制技術、系統(tǒng)智能分析構(gòu)建燃氣管網(wǎng)智能陰極保護系統(tǒng)知識圖譜G,如圖3、圖4所示.
圖3 模型結(jié)構(gòu)圖Fig.3 Model structure diagram
圖4 恒電位儀故障診斷知識圖譜形成過程Fig.4 Formation process of knowledge graph for potentiostat fault diagnosis
2) 將上一步驟的故障知識圖譜結(jié)構(gòu)化為G=(V,E),其中V 表示圖譜G 上m 個檢測節(jié)點,E表示節(jié)點之間的邊,鄰接矩陣A∈Rm×m表示節(jié)點的連接,元素為0/1.定義特征矩陣X∈Rm×P,p 表示節(jié)點屬性特征的數(shù)量(歷史時間序列的長度).
3)給定鄰接矩陣A 和特征矩陣X,圖卷積神經(jīng)網(wǎng)絡通過一階鄰居節(jié)點更新節(jié)點信息,圖卷積神經(jīng)網(wǎng)絡每層的輸出可以表示為:
4)采用三層GCN 網(wǎng)絡來抽取圖譜的空間特征,將上一步驟中網(wǎng)絡進行疊加后輸出為:
其中,f(X,A)表示整個圖譜的空間特征,W0∈RP×H表示從輸入到隱藏層的權(quán)重矩陣,W0表示隱藏層到輸出層的權(quán)重矩陣,P 是特征矩陣的長度,H 是隱藏層的單元數(shù),ReLU 表示非線性激活函數(shù).
5)將GCN 網(wǎng)絡輸出的t-n 到t 時刻空間特征f(A,Xt)作為輸入序列,輸入到Transformer 模型中,通過多頭注意力機制(如圖5所示),輸出MultiHead 值如下:
圖5 Transformer 結(jié)構(gòu)和多頭注意力機制結(jié)構(gòu)圖Fig.5 Transformer structure and multi head attention mechanism structure diagram
6)將上步驟的輸出MultiHead 輸入到前饋網(wǎng)絡Feed Forward 層和歸一化層Layer Normalization 后得到最終的模型輸出,計算公式如下:
最后輸出通過線性模型和softmax 層后輸出故障類別的概率分布,選擇其中概率最大的故障作為預測值.
7)將上步驟的輸出和實際節(jié)點的分類計算損失,損失函數(shù)定義如下:
其中,y表示模型的輸出分類,表示模型真實分類.
采用Adam 優(yōu)化方法進行梯度優(yōu)化,反向傳播修改網(wǎng)絡參數(shù)的權(quán)重.
8)當loss 低于0.01 或者迭代步數(shù)超過10 000 步時,則停止訓練,將訓練好的模型應用于恒電位儀故障診斷.
以恒電位儀無輸出故障場景為例,為了分離提取故障特征維度,首先需要對原始數(shù)據(jù)特征進行預處理,如圖6所示進行缺失值的填充,統(tǒng)計每個特征維度數(shù)據(jù)中非缺失值的數(shù)量.
圖6 “恒電位儀無輸出”狀態(tài)下有效特征維度統(tǒng)計示意圖Fig.6 Statistical schematic diagram of effective feature dimensions in the state of "no output from thepotentiostat"
缺失值的具體位置如圖7所示,圖中“true”為有缺失值.
圖7 “恒電位儀無輸出”狀態(tài)下統(tǒng)計缺失值具體位置示意圖Fig.7 Schematic diagram of the specific location of missing values in the state of "no output from thepotentiostat"
其次是特征選擇,需要過濾掉上一步驟中缺失值過多特征(共18 個),對非參數(shù)型數(shù)據(jù)進行數(shù)值量化后采用皮爾遜相關性計算兩兩特征之間相關性,獲取特征之間的相關性,如圖8所示.
圖8 特征選擇過濾后的數(shù)據(jù)統(tǒng)計示意圖Fig.8 Statistical diagram of filtered data of feature selection
計算過程中發(fā)現(xiàn)有6 項特征與其他特征的相關性高于0.9,且經(jīng)過圖卷積神經(jīng)網(wǎng)絡分析此6 項特征有關的關鍵步驟聚集度低于0.3,因此可以去除此6項特征維度,最后獲取64 維特征可與構(gòu)建“恒電位儀無輸出”故障場景的層次化對等模型進行超參數(shù)匹配,如圖9所示.
圖9 “恒電位儀無輸出”狀態(tài)下特征相關性熱圖Fig.9 Characteristic correlation heat map in the state of "no output from thepotentiostat"
最后進行模型訓練,為了增強系統(tǒng)性能,需要進行樣本訓練持續(xù)更新網(wǎng)絡中的參數(shù).例如針對數(shù)據(jù)集的訓練,數(shù)據(jù)采樣維度為87 維,每種維度具有13 500條采樣記錄.總迭代輪數(shù)設置為1 000 輪,每訓練10輪計算并記錄一次模型對測試集的準確率與損失值.訓練過程統(tǒng)計如圖10所示.
通過上一節(jié)的數(shù)據(jù)預處理和本文提出的GCN +Transformer 模型訓練,得到恒電位儀無輸出狀態(tài)的預測結(jié)果如表1所示,其中對比方法為SVM,LSTM +CRF,Transformer 模型.
表1 恒電位儀無輸出狀態(tài)預測結(jié)果對比Table 1 Comparison of predictive resultson “no output from the potentiostat”
從表1 中可以看出,本文提出的GCN +Transformer 模型在大部分類別中能夠提升準確性,只在“外電輸入故障”類別要低于Transformer 模型0.9,但是本文所提出的模型在F1 值上能夠超越所有對比模型,證明該模型在恒電位儀無輸出狀態(tài)預測的先進性.而其他模型由于缺乏GCN 進行節(jié)點圖結(jié)構(gòu)的推理,無法很好地建模各節(jié)點之間的關系,導致預測性能較低.
1)基于現(xiàn)有恒電位儀的故障監(jiān)測理論和技術方法,從數(shù)據(jù)采集范圍、自動故障特征提取方法和故障分析方法等方面對恒電位儀的智能故障監(jiān)測進行了優(yōu)化.
2)基于圖卷積神經(jīng)網(wǎng)絡與Transformer 網(wǎng)絡的過程數(shù)據(jù)處理能力,對恒電位儀運行中的長期過程數(shù)據(jù)進行監(jiān)控,大幅度提高故障識別準確度.
3)基于知識圖譜的離散數(shù)據(jù)處理能力,對恒電位儀運行中的全口徑過程數(shù)據(jù)進行監(jiān)控,大幅度提高故障識別準確度.
4)本文提出的故障診斷模型可用于燃氣管道陰保系統(tǒng)恒電位儀器故障適應性分析,對恒電位儀運行狀態(tài)數(shù)據(jù)進行自主學習和分析,并提取故障特征,無須人工干預,對陰保系統(tǒng)的人員編制規(guī)模和知識儲備要求顯著降低.