摘 要 提出了一種數(shù)據(jù)驅(qū)動(dòng)的故障根因分析方法,旨在通過(guò)數(shù)據(jù)處理和可解釋相關(guān)性分析,準(zhǔn)確識(shí)別系統(tǒng)故障的根本原因。首先,采用基于神經(jīng)網(wǎng)絡(luò)的變量挑選方法,通過(guò)深度學(xué)習(xí)技術(shù)自動(dòng)挑選出與故障相關(guān)的關(guān)鍵變量,以提高數(shù)據(jù)的有效性。隨后,運(yùn)用沙普利加法解釋模型對(duì)挑選出的變量進(jìn)行可解釋相關(guān)性分析,分析各個(gè)變量對(duì)故障發(fā)生時(shí)系統(tǒng)的貢獻(xiàn)度。接著,引入偏交叉映射方法進(jìn)行因果關(guān)系分析,探索變量之間的因果關(guān)系,找出導(dǎo)致故障的關(guān)鍵因素,定位和識(shí)別導(dǎo)致故障發(fā)生的根本原因變量。最后在兩個(gè)案例應(yīng)用中證明了該方法的適用性。
關(guān)鍵詞 故障診斷 根因分析 故障相關(guān)變量 可解釋相關(guān)性分析
中圖分類(lèi)號(hào) TP277" "文獻(xiàn)標(biāo)志碼 A" "文章編號(hào) 1000-3932(2024)06-1035-10
故障診斷是工業(yè)過(guò)程監(jiān)測(cè)中的重要一環(huán),在工業(yè)過(guò)程發(fā)生故障時(shí),分析故障發(fā)生的原因并定位故障的根源至關(guān)重要,這也是保障系統(tǒng)正常運(yùn)行的關(guān)鍵任務(wù)之一[1~3]。變量故障可能隨生產(chǎn)蔓延到整個(gè)過(guò)程,導(dǎo)致其他變量偏離正常范圍,為了準(zhǔn)確定位故障發(fā)生的位置并及時(shí)做出糾正,在故障檢測(cè)后,對(duì)所檢測(cè)故障的根本原因進(jìn)行分析是十分必要的[4~6]。基于貢獻(xiàn)圖的方法是一種常見(jiàn)的故障診斷方法[7]。貢獻(xiàn)圖方法根據(jù)故障發(fā)生時(shí),故障相關(guān)變量對(duì)故障檢測(cè)統(tǒng)計(jì)量的貢獻(xiàn)度選取候選故障變量。通過(guò)對(duì)貢獻(xiàn)度從高到低的排名,實(shí)現(xiàn)故障的診斷。ELSHENAWY L M等提出了一種基于多變量貢獻(xiàn)分析的自適應(yīng)診斷方法來(lái)診斷時(shí)變過(guò)程中的故障[8]。HE Y等針對(duì)非線性過(guò)程提出了基于核PCA檢測(cè)的貢獻(xiàn)圖故障定位方法[9]。ZHOU P等對(duì)于非線性過(guò)程提出了基于核PLS的故障識(shí)別方法,在統(tǒng)計(jì)量的新樣本中引入比例因子向量,從而構(gòu)建監(jiān)測(cè)指標(biāo)函數(shù)定位變量[10]。QIAN J C等提出了一種局部線性反向傳播的非線性過(guò)程故障診斷方法,基于貢獻(xiàn)重構(gòu)的基本思想,利用反向傳播算法描述故障信息的傳播[11]。ZHAO H等對(duì)于間歇過(guò)程的多變量統(tǒng)計(jì)過(guò)程控制的貢獻(xiàn)圖進(jìn)行了深入研究[12]。但是基于貢獻(xiàn)圖的方法有涂抹效應(yīng),即變量故障經(jīng)過(guò)傳播使多個(gè)變量對(duì)故障的貢獻(xiàn)度都有所增加,這對(duì)故障診斷十分不利。稀疏方法應(yīng)用正則化技術(shù),是故障診斷的一個(gè)新的研究方向。為了緩解診斷涂抹效應(yīng),WANG K等提出了一種基于稀疏負(fù)載的貢獻(xiàn)圖,以提高診斷性能[13]。JIANG J等提出了一種基于Lasso的高效故障識(shí)別框架[14]。ZHENG K等提出了一個(gè)與群Lasso結(jié)合的廣義貢獻(xiàn)圖框架,無(wú)需先驗(yàn)知識(shí)[15]。但是上述方法沒(méi)有對(duì)故障傳播的路徑進(jìn)行分析,從而無(wú)法對(duì)根因變量進(jìn)行更精準(zhǔn)的定位。
因果推理方法能夠更好地分析動(dòng)態(tài)多變量系統(tǒng),從而準(zhǔn)確地分析故障傳播路徑[16]。常見(jiàn)的因果分析方法包含格蘭杰因果關(guān)系[17](Granger Causality,GC)、向量自回歸[18,19]、方差分解[20]、動(dòng)態(tài)貝葉斯推理[21]和相互交叉映射。LINDNER B等在一個(gè)大范圍振蕩的工業(yè)案例中比較了轉(zhuǎn)移熵和格蘭杰因果關(guān)系,發(fā)現(xiàn)轉(zhuǎn)移熵更為精確,因果關(guān)系圖更易于直觀解釋?zhuān)煌瑫r(shí)認(rèn)為格蘭杰因果關(guān)系更容易實(shí)現(xiàn)自動(dòng)化,計(jì)算成本更低,也更容易解釋所獲得值的含義[22]。LIBONI L H B等提出了一種用于識(shí)別斷裂轉(zhuǎn)子線棒的診斷方法,該方法基于正交分量分解技術(shù),可以高效地提取故障特征[23]。LI C Z等利用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的概念,建立了一個(gè)用于診斷和預(yù)報(bào)的多功能概率模型,動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)用于跟蹤隨時(shí)間變化的變量的演變并校準(zhǔn)隨時(shí)間變化的變量[24]。這些方法通過(guò)建模來(lái)探究系統(tǒng)內(nèi)部的動(dòng)態(tài)特性,但是無(wú)法分離具有相關(guān)性的動(dòng)態(tài)變量,尤其是GC方法依賴(lài)于線性隨機(jī)系統(tǒng)因果關(guān)系可分離的假設(shè),會(huì)將間接因果關(guān)系錯(cuò)誤地判定為直接因果關(guān)系,從而導(dǎo)致故障傳播路徑分析錯(cuò)誤[25]。偏交叉映射(Partial Cross Mapping,PCM)可以區(qū)別直接和間接的因果關(guān)系,準(zhǔn)確地推斷出非線性系統(tǒng)間的因果關(guān)系。因此,筆者將PCM方法應(yīng)用于故障發(fā)生后的根本原因溯源。
筆者提出一種綜合應(yīng)用神經(jīng)網(wǎng)絡(luò)、沙普利加法解釋模型和偏交叉映射方法的故障根因分析方法,以提高故障分析的準(zhǔn)確性和可解釋性。首先,為了初步定位與故障發(fā)生相關(guān)的變量,采用基于神經(jīng)網(wǎng)絡(luò)的變量挑選方法,以故障監(jiān)測(cè)框架輸出的過(guò)程監(jiān)測(cè)統(tǒng)計(jì)量Q作為回歸變量,通過(guò)深度學(xué)習(xí)從海量數(shù)據(jù)中挑選出與故障相關(guān)的關(guān)鍵變量。其次,利用沙普利加法解釋模型(SHapley Additive exPlanations,SHAP)對(duì)所挑選出的變量進(jìn)行可解釋相關(guān)性分析,揭示各個(gè)變量對(duì)故障統(tǒng)計(jì)量的貢獻(xiàn)程度,從而更加清晰地理解故障發(fā)生時(shí)系統(tǒng)的運(yùn)行機(jī)制。最后,通過(guò)偏交叉映射方法對(duì)挑選出的變量進(jìn)行因果關(guān)系分析,分析故障傳播路徑,確定影響系統(tǒng)正常運(yùn)行的根本原因。
1 相關(guān)知識(shí)
1.1 基于神經(jīng)網(wǎng)絡(luò)的變量挑選
工業(yè)過(guò)程的故障通常是由少量變量引起的,但隨著時(shí)間的變化,故障變量的影響會(huì)擴(kuò)散,其他的測(cè)量變量會(huì)隨著故障變量的變化發(fā)生改變[26~28],因此在尋找故障發(fā)生的根本原因之前,首先要對(duì)故障進(jìn)行初步的隔離,挑選出與故障發(fā)生相關(guān)的特征。基于神經(jīng)網(wǎng)絡(luò)的變量挑選首先獲取非線性系統(tǒng)生產(chǎn)數(shù)據(jù),計(jì)算測(cè)量變量和回歸變量之間的互信息,并向神經(jīng)網(wǎng)絡(luò)中引入隨機(jī)變量進(jìn)行錯(cuò)誤發(fā)現(xiàn)率(False Discovery Rate,F(xiàn)DR)估計(jì)處理。具體步驟如下。
第一步 計(jì)算所有候選變量與回歸變量之間的互信息(Mutual Information,MI)來(lái)初步去除不相關(guān)的特征。為了更好地刪除不相關(guān)的特征,這里引入d個(gè)隨機(jī)變量,首先計(jì)算所有變量與回歸變量之間的互信息MI:
MI(x,y)=■■p(x,y)log■(1)
其中,x和y為兩個(gè)變量,p(x)和p(y)分別表示x和y的邊緣概率密度,p(x,y)表示x和y的聯(lián)合概率密度,將MI小于閾值th的變量刪去,th的計(jì)算方法為:
th≥θ■·MI■(2)
其中,θ■為預(yù)先給定的超參數(shù),MI■為隨機(jī)變量與目標(biāo)變量之間的MI值。
第二步 訓(xùn)練變量選擇的深度神經(jīng)網(wǎng)絡(luò),計(jì)算每個(gè)特征的重要性S■,并刪除重要性排在末尾的k個(gè)特征:
S■=■■■(y■,f(x■))■(3)
其中,■(y■,f(x■))表示損失函數(shù)L對(duì)變量x■的第i個(gè)樣本的偏導(dǎo)數(shù)值,f(x■)為網(wǎng)絡(luò)對(duì)x■的第i個(gè)樣本的預(yù)測(cè)值,n為樣本的個(gè)數(shù)。當(dāng)前步驟刪除變量的個(gè)數(shù)e計(jì)算方法如下:
e=ε■·1-■·r■(4)
其中,ε■為超參數(shù),用來(lái)調(diào)節(jié)變量篩選速度;
η■表示當(dāng)前截止的FDR;■表示當(dāng)前估計(jì)出的FDR;r■為當(dāng)前步驟剩余的隨機(jī)變量個(gè)數(shù)。
第三步 進(jìn)行FDR估計(jì)處理,計(jì)算FDR的值。如果當(dāng)前FDR的值小于終止條件η■,則認(rèn)為特征選擇已經(jīng)完成。反之,返回第二步繼續(xù)進(jìn)行。計(jì)算FDR的公式如下:
■=■·■(5)
其中,q表示原變量個(gè)數(shù),r表示剩余變量個(gè)數(shù)。
通過(guò)對(duì)相關(guān)性小的變量不斷地迭代刪除,最后保留的是與回歸變量相關(guān)性強(qiáng)的特征,通過(guò)與回歸變量進(jìn)行回歸,可以有效地篩選出相關(guān)變量。
1.2 沙普利加法解釋模型
在1.1節(jié)可以得到變量挑選模型,使用SHAP進(jìn)行可解釋相關(guān)性分析。SHAP是一種用于解釋機(jī)器學(xué)習(xí)模型預(yù)測(cè)的開(kāi)創(chuàng)性方法[29],它基于合作博弈論中的Shapley值概念,旨在為模型中每個(gè)特征的貢獻(xiàn)提供公平而一致的分配[30]。Shapley值的核心思想是測(cè)量每個(gè)特征對(duì)于模型輸出的貢獻(xiàn),并考慮到特征之間的相互影響。對(duì)于一個(gè)給定的預(yù)測(cè),Shapley值考慮了所有可能的特征子集,并計(jì)算了每個(gè)特征在這些子集中的平均貢獻(xiàn)[31]。一個(gè)線性模型預(yù)測(cè)的表達(dá)式為:
f(x)=b■+b■x■+…+b■x■(6)
其中,b■為模型系數(shù)。
對(duì)特征x=[x■,x■,…,x■],第k個(gè)特征第j個(gè)采樣點(diǎn)的平均影響估計(jì)為:
?準(zhǔn)(j)=b■x■-E(b■x■)(7)
其中,E()為期望。
每一個(gè)特征的每一個(gè)采樣點(diǎn),都會(huì)計(jì)算出一個(gè)Shapley值來(lái)衡量當(dāng)前采樣點(diǎn)對(duì)模型預(yù)測(cè)的貢獻(xiàn)度。對(duì)于第k個(gè)特征,Shapley值的定義為:
y■=y■+g(x■)+g(x■)+…+g(x■)(8)
其中,y■表示所有樣本預(yù)測(cè)的Shapley平均值,x■表示第k個(gè)特征的第j個(gè)采樣點(diǎn),g(x■)表示采樣點(diǎn)x■的Shapley值。Shapley絕對(duì)值越大,特征就越重要。
2 基于偏交叉映射的根因分析方法
基于偏交叉映射的根因分析方法總流程如圖1所示。
流程主要分為以下3個(gè)步驟。
第一步 基于神經(jīng)網(wǎng)絡(luò)的故障相關(guān)特征選擇。在這個(gè)步驟中,使用神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)選擇與系統(tǒng)故障相關(guān)的關(guān)鍵變量。神經(jīng)網(wǎng)絡(luò)能夠在大量數(shù)據(jù)中找到復(fù)雜的模式和關(guān)系?;谏窠?jīng)網(wǎng)絡(luò)的特征選擇方法,通過(guò)學(xué)習(xí)和理解數(shù)據(jù)之間的復(fù)雜關(guān)系,來(lái)挑選出與系統(tǒng)故障最相關(guān)的關(guān)鍵特征。過(guò)程監(jiān)測(cè)統(tǒng)計(jì)量Q是工業(yè)過(guò)程控制中常用的一種量化指標(biāo),用于度量系統(tǒng)運(yùn)行狀態(tài)的穩(wěn)定性或異常程度。在系統(tǒng)運(yùn)行正常時(shí),統(tǒng)計(jì)量Q通常保持在一個(gè)較低的水平,而在系統(tǒng)發(fā)生故障或異常時(shí),這個(gè)統(tǒng)計(jì)量會(huì)顯著增加。因此,Q可以作為一個(gè)很好的回歸變量,用于指導(dǎo)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和訓(xùn)練。在這個(gè)網(wǎng)絡(luò)中,通過(guò)最小化網(wǎng)絡(luò)預(yù)測(cè)值與真實(shí)值之間的均方誤差(Mean Square Error,MSE)來(lái)訓(xùn)練:
f(w,b)=■■‖Q■-■■‖■(9)
其中,N為樣本數(shù),w為權(quán)重,b為偏置,■為網(wǎng)絡(luò)預(yù)測(cè)值。
回歸分析是一種預(yù)測(cè)性的建模技術(shù),它研究的是因變量(Q)和自變量(特征)之間的關(guān)系。在這里,目標(biāo)是找出那些與Q(也就是系統(tǒng)故障)最相關(guān)的變量。通過(guò)MI對(duì)原始數(shù)據(jù)X■進(jìn)行初步篩選,刪除互信息值小于閾值th的變量,得到初步篩選后的數(shù)據(jù)集X■。接著引入n■個(gè)隨機(jī)變量,生成數(shù)據(jù)集{X■,Q}作為挑選變量神經(jīng)網(wǎng)絡(luò)的輸入與輸出。這里,變量篩選的截止條件是由錯(cuò)誤發(fā)現(xiàn)率η■決定的。神經(jīng)網(wǎng)絡(luò)每次迭代時(shí)根據(jù)式(5)計(jì)算FDR,下一步迭代的FDR為:
■■=(r■-m)×■(10)
其中,m為刪除變量的數(shù)量。
由式(4)得到需要?jiǎng)h除的變量個(gè)數(shù)e,當(dāng)■小于η■時(shí),神經(jīng)網(wǎng)絡(luò)對(duì)變量的挑選結(jié)束,反之則繼續(xù)迭代刪除不相關(guān)變量。通過(guò)對(duì)Q進(jìn)行回歸分析,用于變量挑選的神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)到每個(gè)輸入變量對(duì)Q的影響程度,從而確定出與系統(tǒng)故障最相關(guān)的關(guān)鍵特征?;谏窠?jīng)網(wǎng)絡(luò)的特征選擇方法流程如圖2所示,結(jié)合神經(jīng)網(wǎng)絡(luò)和回歸分析,可以有效挑選出與系統(tǒng)故障最相關(guān)的關(guān)鍵特征,為后續(xù)的故障診斷提供有價(jià)值的信息。
第二步 在挑選出關(guān)鍵特征后,使用沙普利加法解釋模型來(lái)分析這些變量對(duì)系統(tǒng)故障的貢獻(xiàn)度。通過(guò)量化每個(gè)變量對(duì)系統(tǒng)故障的貢獻(xiàn)度,并且確定特征在故障發(fā)生時(shí)對(duì)系統(tǒng)是正相關(guān)還是負(fù)相關(guān),更深入地理解這些特征在系統(tǒng)故障中的作用。
第三步 偏交叉映射方法進(jìn)行因果關(guān)系分析。在這個(gè)步驟中,使用偏交叉映射方法來(lái)探索變量之間的因果關(guān)系。這一步的目標(biāo)是找出導(dǎo)致系統(tǒng)故障的關(guān)鍵因素,并識(shí)別出導(dǎo)致故障發(fā)生的根本原因變量。偏交叉映射可以消除間接因果關(guān)系的影響,并獲取直接因果關(guān)系。在真實(shí)的系統(tǒng)中,存在直接和間接的因果關(guān)系。圖3描述了兩個(gè)
變量之間直接和間接關(guān)系的定義。X與Y有直接的因果關(guān)系,而Z不參與;Y和X之間的因果關(guān)系通過(guò)Z進(jìn)行,這定義為間接因果關(guān)系[32]。
給定3個(gè)長(zhǎng)度為L(zhǎng)的時(shí)間序列數(shù)據(jù)X={x■}■■、
Y={y■}■■和Z={z■}■■,可以通過(guò)應(yīng)用Takens-Ma?觡é的延遲坐標(biāo)嵌入獲得3個(gè)影流形,分別為M■={x■}■■、
M■={y■}■■和M■={z■}■■,向量如下:
x■=(x■,x■,…,x■)
y■=(y■,y■,…,x■)(11)
z■=(z■,z■,…,z■)
其中,E■、E■和E■是嵌入維數(shù),可以通過(guò)最假近鄰法(False Nearest Neighbor,F(xiàn)NN)確定;τ■、τ■和τ■是時(shí)滯,可以通過(guò)延遲互信息方法(Delayed Mutual Information,DMI)確定。對(duì)于任何一對(duì)變量ξ和η={x,y,z},一個(gè)通用的公式描述為:
■■(η■)={η■|ξ■∈N(ξ■)}(12)
其中,■■(η■)是一組ξ■包含在相應(yīng)影流形中
的最近鄰點(diǎn)的集合。對(duì)于ξ=η,■■(η■)的形式變?yōu)镹(η■)。在ξ≠η的情況下,■■(η■)表示N(ξ■)一個(gè)交叉映射最近鄰點(diǎn)。從N(ξ■)到■■(η■)的依賴(lài)性表示從η■到ξ■的因果效應(yīng)。在互交叉映射(Mutual Cross Mapping,MCM)的框架下,間接因果系數(shù)計(jì)算式為:
Q■=|Corr(η■,■■■)|(13)
其中,■■■=E[■■(η■)],■■■代表ξ■的映射,E[·]
是在每個(gè)集合中的所有采樣點(diǎn)處采取適當(dāng)?shù)募訖?quán)平均。如果x和y的相關(guān)系數(shù)大于給定的閾值T,根據(jù)MCM框架的規(guī)則,存在從X到Y(jié)的因果影響。在真實(shí)系統(tǒng)中,從一個(gè)變量引發(fā)的對(duì)另一個(gè)變量的因果影響可能有時(shí)間延遲。因此,在計(jì)算一對(duì)變量之間的因果關(guān)系時(shí),尋找最優(yōu)的時(shí)滯系數(shù)以最大化因果系數(shù)。
為了消除因果傳遞效應(yīng),定義直接因果系數(shù)如下:
Q■=|Pcc(x■,■■■|■)|(14)
其中,■■■為時(shí)間序列y和x的映射關(guān)系,通過(guò)應(yīng)用兩次MCM獲得■,它通過(guò)Z提取間接因果關(guān)系;Pcc(·,·|·)是描述前兩個(gè)變量之間的相關(guān)度的偏相關(guān)系數(shù),其中第3個(gè)變量的相關(guān)信息被抵消:
Pcc(X,■■|■)=■
(15)
總體上,基于PCM的因果關(guān)系推斷整體步驟如下:
a. 在歸一化后的數(shù)據(jù)上使用FNN和DMI來(lái)確定嵌入維數(shù)E和時(shí)滯?子。
b. 計(jì)算直接因果系數(shù)Q■和間接因果系數(shù)Q■。
c. 設(shè)定經(jīng)驗(yàn)閾值T,并推算每對(duì)變量之間的因果關(guān)系,因果關(guān)系可以根據(jù)以下規(guī)則確定。
Q■≥Q■≥T→從X到Y(jié)有直接因果關(guān)系Q■≥T≥Q■→從X到Y(jié)有間接因果關(guān)系T≥Q■≥Q■→從X到Y(jié)沒(méi)有因果關(guān)系(16)
d. 根據(jù)直接因果關(guān)系,繪制變量傳播路徑圖,并使用機(jī)理知識(shí)進(jìn)行分析驗(yàn)證。
3 實(shí)驗(yàn)結(jié)果與分析
實(shí)驗(yàn)驗(yàn)證包含2個(gè)部分,第1部分是青霉素仿真數(shù)據(jù),第2部分是青霉素實(shí)際生產(chǎn)過(guò)程數(shù)據(jù)。
3.1 青霉素仿真數(shù)據(jù)
青霉素仿真數(shù)據(jù)變量見(jiàn)表1[33],采樣200個(gè),在第50個(gè)采樣點(diǎn)分別引入攪拌器功率階躍故障和攪拌器功率斜坡故障。本實(shí)驗(yàn)使用仿真軟件生成青霉素發(fā)酵過(guò)程的批次數(shù)據(jù),其中包括8批引入故障數(shù)據(jù)。根據(jù)先驗(yàn)知識(shí),12個(gè)觀測(cè)變量被分為4個(gè)輸入變量和8個(gè)狀態(tài)變量。
3.1.1 階躍故障
首先基于神經(jīng)網(wǎng)絡(luò)對(duì)變量進(jìn)行挑選,挑選出的特征為{x■,u■,u■},挑選出的特征對(duì)過(guò)程故障的影響使用SHAP進(jìn)行可解釋相關(guān)性分析,結(jié)果如圖4所示。每一個(gè)特征的采樣點(diǎn)都被清晰地標(biāo)注出來(lái),而采樣點(diǎn)的顏色則代表了特征值的大小,橫軸表示每個(gè)采樣點(diǎn)的Shapley值。從圖4可以清楚地看到,對(duì)于攪拌器功率這個(gè)特征,紅色的采樣點(diǎn)(代表較大的特征值)均勻地分布在Shapley平均值的右側(cè),而藍(lán)色采樣點(diǎn)(代表較小的特征值)則主要聚集在Shapley平均值的左側(cè)。這個(gè)分布模式表明攪拌器功率特征值的大小與其對(duì)應(yīng)的Shapley值有正相關(guān)關(guān)系,證明了它在反映故障統(tǒng)計(jì)量中的重要性。更進(jìn)一步地,從圖4右側(cè)圖可以確認(rèn),攪拌器功率在所有特征中的重要性最大。
使用PCM對(duì)挑選出的變量進(jìn)行因果關(guān)系分析,并根據(jù)變量之間的直接因果關(guān)系推出故障傳播路徑。如圖5a所示,從第100個(gè)時(shí)間戳開(kāi)始,隨著攪拌器功率階躍式地增加,溶解氧濃度也呈現(xiàn)階躍變化,通氣率則呈現(xiàn)下降的趨勢(shì)。根據(jù)圖5b的因果分析(綠色方塊代表兩個(gè)變量間具有直接因果關(guān)系)畫(huà)出了圖5c所示的故障傳播路徑,可見(jiàn)引起這次故障的根因變量是攪拌器功率。
3.1.2 斜坡故障
青霉素仿真數(shù)據(jù)的斜坡故障,在攪拌器功率第50個(gè)采樣點(diǎn)開(kāi)始引入。挑選出的變量為{x5,x6,u1,u2,u3},同樣對(duì)變量對(duì)故障發(fā)生統(tǒng)計(jì)量的影響進(jìn)行可解釋相關(guān)性分析,結(jié)果如圖6所示。從圖6可以清楚地看到,對(duì)于攪拌器功率這個(gè)特征,紅色的采樣點(diǎn)(代表較大的特征值)均勻地分布在Shapley平均值的右側(cè),而藍(lán)色采樣點(diǎn)(代表較小的特征值)則主要聚集在Shapley平均值的左側(cè)。這個(gè)分布模式表明攪拌器功率特征值的大小與其對(duì)應(yīng)的Shapley值有正相關(guān)關(guān)系,證明了它在反映故障統(tǒng)計(jì)量中的重要性。更進(jìn)一步地,從圖6右側(cè)圖可以確認(rèn),攪拌器功率在所有特征中的重要性最大。通氣率、pH值與Shapley值是負(fù)相關(guān)。攪拌器功率對(duì)Shapley值的影響明顯高于其他特征。
使用PCM對(duì)挑選出的變量進(jìn)行因果關(guān)系分析,并根據(jù)變量之間的直接因果關(guān)系推出故障傳播路徑。如圖7a所示,從第100個(gè)時(shí)間戳開(kāi)始,隨著攪拌器功率斜坡式地增加,基質(zhì)進(jìn)料速度和通氣率呈現(xiàn)下降的趨勢(shì)。根據(jù)圖7b的因果關(guān)系圖,其中綠色方塊代表了兩個(gè)變量間具有直接因果關(guān)系,并根據(jù)直接因果關(guān)系畫(huà)出了圖7c所示的故障傳播路徑,可見(jiàn)引起這次故障的根因變量是攪拌器功率。
3.2 青霉素實(shí)際生產(chǎn)過(guò)程數(shù)據(jù)
本實(shí)驗(yàn)使用的是在50 L生物反應(yīng)器中進(jìn)行的實(shí)際補(bǔ)料分批青霉素發(fā)酵過(guò)程數(shù)據(jù)。從鹽補(bǔ)充過(guò)程的中后期開(kāi)始的13批數(shù)據(jù),每批數(shù)據(jù)長(zhǎng)度在
10 000~11 000之間。采樣間隔設(shè)置為10,且在過(guò)程進(jìn)入更穩(wěn)定狀態(tài)后開(kāi)始采樣,起始點(diǎn)為2 000,共有878個(gè)采樣點(diǎn)。在第140~240個(gè)和450~800個(gè)采樣點(diǎn)增加了一批尾氧作為故障。青霉素實(shí)際生產(chǎn)過(guò)程中,分別在第50~100個(gè)和150~200個(gè)采樣點(diǎn)增加尾氧濃度。青霉素仿真數(shù)據(jù)變量見(jiàn)表2。根據(jù)先驗(yàn)知識(shí),12個(gè)觀測(cè)變量被分為4個(gè)輸入變量和8個(gè)狀態(tài)變量。
首先對(duì)青霉素實(shí)際生產(chǎn)過(guò)程中的變量做特征挑選,挑選出來(lái)的特征為{x■,x■,x■,u■,u■,u■}。使用SHAP對(duì)挑選后的變量做特征重要性排序和變量選擇可解釋相關(guān)性分析,結(jié)果如圖8所示。
從圖8a可以看出,最重要的變量是尾氧,紅色采樣點(diǎn)大多在平均值的右側(cè),這代表尾氧值較高的情況。而藍(lán)色采樣點(diǎn)大多在Shapley平均值的左側(cè),這代表尾氧值較低的情況。這種分布意味著尾氧是與故障統(tǒng)計(jì)量正相關(guān)的,即尾氧值越高,故障統(tǒng)計(jì)量越大。同理,尾碳也是與故障統(tǒng)計(jì)量正相關(guān)的。氧傳遞系數(shù)的紅色采樣點(diǎn)多分布在Shapley平均值左側(cè),藍(lán)色采樣點(diǎn)分布在平均值右側(cè),是與故障統(tǒng)計(jì)量負(fù)相關(guān)的。同時(shí)溶解氧、累積硫酸銨濃度也是與故障統(tǒng)計(jì)量正相關(guān)的。這一結(jié)果可以證明變量挑選的合理性。
使用PCM對(duì)挑選出的變量進(jìn)行因果關(guān)系分析,并推出故障傳播的路徑,如圖9所示,可以看出尾氧與累積苯乙酸濃度和累積硫酸銨濃度有直接因果關(guān)系。在發(fā)酵過(guò)程中,尾氧的水平可以影響苯乙酸的吸收和利用。尾氧水平過(guò)高,可能會(huì)導(dǎo)致苯乙酸過(guò)度氧化,降低苯乙酸的利用效率。反之,如果尾氧水平過(guò)低,可能會(huì)導(dǎo)致青霉菌的代謝不足,也會(huì)影響苯乙酸的利用。硫酸銨提供了青霉菌生長(zhǎng)所需的氮源。在發(fā)酵過(guò)程中,尾氧的水平也可以影響硫酸銨的吸收和利用。尾氧水平過(guò)高,可能會(huì)導(dǎo)致硫酸銨過(guò)度氧化,降低硫酸銨的利用效率。反之,如果尾氧水平過(guò)低,可能會(huì)導(dǎo)致青霉菌的代謝不足,也會(huì)影響硫酸銨的利用。傳播路徑中顯示,溶解氧和苯乙酸的濃度會(huì)影響KLA的大小。累積糖水濃度和累積硫酸銨濃度之間也會(huì)互相影響,糖水是提供能量和碳源的主要物質(zhì),而硫酸銨則是提供必需的氮源。當(dāng)累積糖水濃度過(guò)高時(shí),會(huì)抑制硫酸銨的吸收,使得青霉菌的生長(zhǎng)和代謝受到限制;反之,硫酸銨的過(guò)度累積也可能會(huì)影響糖水的利用。通過(guò)傳播路徑圖分析可得引起故障的根因變量是尾氧,同時(shí)路徑符合青霉素發(fā)酵過(guò)程的機(jī)理知識(shí)。
4 結(jié)束語(yǔ)
提出了一種復(fù)合方法來(lái)分析系統(tǒng)故障發(fā)生時(shí)的根本原因。這種方法深入解析了系統(tǒng)故障的原因,并在青霉素的仿真與實(shí)際過(guò)程中得到了驗(yàn)證。筆者提出的過(guò)程監(jiān)測(cè)框架和故障溯源方法是基于數(shù)據(jù)角度出發(fā)的,沒(méi)有與已有的基于機(jī)理知識(shí)和專(zhuān)家經(jīng)驗(yàn)的研究方法相結(jié)合。在基于數(shù)據(jù)驅(qū)動(dòng)的方法快速發(fā)展的同時(shí),如何結(jié)合機(jī)理知識(shí)進(jìn)行數(shù)據(jù)和機(jī)理的融合建模,從而進(jìn)一步提升故障檢測(cè)模型的準(zhǔn)確性和有效性,使得故障溯源工作更加符合實(shí)際,將會(huì)是一項(xiàng)值得探索的工作。
參 考 文 獻(xiàn)
[1]" "SONG P,ZHAO C,HUANG B.MPGE and RootRank:A sufficient root cause characterization and quantification framework for industrial process faults[J].Neural Networks,2023,161:397-417.
[2]" "ARUNTHAVANATHAN R, KHAN F, AHMED S,et al.Autonomous Fault Diagnosis and Root Cause Analysis for the Processing System Using One-Class SVM and NN Permutation Algorithm[J].Industrial amp; Engineering Chemistry Research,2022,61(3):1408-1422.
[3]" "張弛,李浩,胡海濤,等.基于自動(dòng)特征工程的飛行器軸承故障診斷[J].化工學(xué)報(bào), 2021, 72(S1): 430-436;569.
[4]" "劉遠(yuǎn)紅,黃穎濤.基于全局約束的局部融合線性嵌入算法的軸承故障診斷[J].化工自動(dòng)化及儀表,2023, 50(4):529-537.
[5]" "馬重,趙眾.基于數(shù)據(jù)驅(qū)動(dòng)方法的控制閥故障診斷[J].化工自動(dòng)化及儀表,2023,50(2):181-187;230.
[6]" "郭金玉,王哲,李元.基于核熵獨(dú)立成分分析的故障檢測(cè)方法[J].化工學(xué)報(bào),2022,73(8):3647-3658;3787.
[7]" "YANG L,LI K P,ZHAO D,et al.A Network Method for Identifying the Root Cause of High-Speed Rail Faults Based on Text Data[J].Energies,2019,12(10):1908.
[8]" "ELSHENAWY L M,MAHMOUD T A,CHAKOUR C.Simultaneous Fault Detection and Diagnosis Using Adaptive Principal Component Analysis and Multivariate Contribution Analysis[J].Industrial amp; Engineering Chemistry Research,2020,59(47):20798-20815.
[9]" "HE Y, YE L Z, ZHU X J, et al.Feature extraction based on PSO-FC optimizing KPCA and wear fault identification of planetary gear[J].Journal of Mechanical Science and Technology,2021,35(6):2347-2357.
[10]" "ZHOU P,ZHANG R Y,LIANG M Y,et al.Fault identification for quality monitoring of molten iron in blast furnace ironmaking based on KPLS with improved contribution rate[J].Control Engineering Practice,2020, 97:104354.
[11]" "QIAN J C,JIANG L,SONG Z H.Locally linear back-propagation based contribution for nonlinear process fault diagnosis[J].IEEE/CAA Journal of Automatica Sinica,2020,7(3):764-775.
[12]" "ZHAO H,JIA J,KOLTUN V.Exploring self-attention for image recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.2020:10073-10082.
[13]" "WANG K,CHEN J,SONG Z.A sparse loading-based contribution method for multivariate control performa-nce diagnosis[J].Journal of Process Control,2020,85:199-213.
[14]" "JIANG J,CHEN R,ZHANG C,et al.Dynamic Fault Prediction of Power Transformers Based on Lasso Regression and Change Point Detection by Dissolved Gas Analysis[J].IEEE Transactions on Dielectrics and Electrical Insulation,2020,27(6):2130-2137.
[15]" "ZHENG K,LI T L,SU Z Q,et al.Sparse Elitist Group Lasso Denoising in Frequency Domain for Bearing Fault Diagnosis[J].IEEE Transactions on Industrial Informatics,2021,17(7):4681-4691.
[16]" "唐鵬,彭開(kāi)香,董潔.一種新穎的深度因果圖建模及其故障診斷方法[J].自動(dòng)化學(xué)報(bào),2022,48(6):1616-1624.
[17]" "ARATUO D N,ETIENNE X L.Industry level analysis of tourism-economic growth in the United States[J].Tourism Management,2019,70(7):333-340.
[18]" "QIN M, ZHANG X J, LI Y M, et al. Blockchain market and green finance:The enablers of carbon neutrality in China[J].Energy Economics,2023,118:106501.
[19]" "WANG R,QI Z Y,SHU Y M.Multiple relationships between fixed-asset investment and industrial structure evolution in China-Based on Directed Acyclic Graph (DAG) analysis and VAR model[J].Structural Change and Economic Dynamics,2020,55:222-231.
[20]" KAMALOV F.Orthogonal variance decomposition based feature selection[J].Expert Systems with App-lications,2021,182(4):115191.
[21]" "BARAUSKAITE K,NGUYEN A D M.Global interse-ctoral production network and aggregate fluctuations[J].Economic Modelling,2021,102:105577.
[22]" "LINDNER B,AURET L,BAUER M, et al.Comparat-ive analysis of Granger causality and transfer entropy to present a decision flow for the application of oscillation diagnosis[J].Journal of Process Control,2019,79:72-84.
[23]" "LIBONI L H B, FLAUZINO R A, DA SILVA I N,et al.Efficient feature extraction technique for diagnosingbroken bars in three-phase induction machines[J].Measurement,2019,134:825-834.
[24]" "LI C Z, MAHADEVAN S,LING Y, et al. Dynamic Bayesian Network for Aircraft Wing Health Monitor-ing Digital Twin[J].Aiaa Journal,2017,55(3):930-941.
[25]" "馬亮,彭開(kāi)香,董潔.工業(yè)過(guò)程故障根源診斷與傳播路徑識(shí)別技術(shù)綜述[J].自動(dòng)化學(xué)報(bào),2022,48(7):1650-1663.
[26]" CHO H-W. Identification of contributing variables using kernel-based discriminant modeling and reconstruction[J].Expert Systems with Applications,2007,33(2):274-285.
[27]" "ZHANG Y,YANG N,LI S.Fault Isolation of Nonlinear Processes Based on Fault Directions and Features[J].IEEE Transactions on Control Systems Techno-logy,2014,22(4):1567-1572.
[28]" "YU J,YE L,ZHOU L,et al.Dynamic Process Monito-ring Based on Variational Bayesian Canonical Variate Analysis[J].IEEE Transactions on Systems,Man,and Cybernetics:Systems,2022,52(4):2412-2422.
[29]" "XUE Y,DENG Y.A real Shapley value for evidential games with fuzzy characteristic function[J].Engineering Applications of Artificial Intelligence,2021,104(5):104350.
[30]" WU W, ZHU J, CHEN Y, et al.Modified Shapley Value-Based Profit Allocation Method for Wind Power Accommodation and Deep Peak Regulation of Thermal Power[J].IEEE Transactions on Industry Applications,2023,59(1):276-288.
[31]" "AAS K, JULLUM M,L?覫LAND A.Explaining individ-ual predictions when features are dependent: More accurate approximations to Shapley values[J].Artificial Intelligence,2021,298:103502.
[32]" "LENG S Y,MA H F,KURTHS J,et al.Partial cross mapping eliminates indirect causal influences[J].Nature Communications,2020,11(1):2632.
[33]" "BIROL G, ?譈NDEY C, ?覶INAR A.A modular simulat-ion package for fed-batch fermentation:penicillin production[J].Computers amp; Chemical Engineering,2002,26(11):1553-1565.
(收稿日期:2024-06-13,修回日期:2024-10-21)
Fault’s Root Causes Diagnosis of the Industrial Process Based on the Causality Analysis of Fault Related Variables
SUN Li-hua, WANG Wen-jing, ZHU Hong-tao, JIANG Qing-chao
(College of Information Science and Engineering, East China University of Science and Technology)
Abstract" "In this paper, a data-driven root cause analysis method for system faults was proposed to accurately identify the root causes of system faults through data processing and interpretive correlation analysis. In which, through making use of deep learning techniques, having a neural network-based variable selection method employed to automatically select key variables related to faults so as to enhance the efficacy of the data; and then, having the Shapley additive model used to interpretively analyze correlation of the variables selected and examine their contributions to the system during faults occur. In addition, the partial cross-mapping method was introduced to causality analysis and the causal relationship among variables was investigated, including identifying the root causes which incurring the faults. This method’s application in two cases proves its applicability.
Key words" "fault diagnosis, root cause analysis, fault correlation variable, interpretable correlation analysis