張愛華,呂承聰,高聞孝
(渤海大學工學院,遼寧錦州121013)
隨著科技的進步和發(fā)展,大規(guī)模機械化生產(chǎn)已經(jīng)到來,自動化機械系統(tǒng)隨著智能化的發(fā)展也變得越來越復雜.因此,機械正常穩(wěn)定的運行十分重要,一旦發(fā)生故障所帶來的后果則是不可估量的.例如:2019年3月埃塞俄比亞的客機波音737-MAX8型,由于無法操縱飛機,飛機自動俯沖造成墜機,客機上所有的人都沒能逃脫;2005年11月吉林市雙苯廠由于其P-102塔發(fā)生堵塞循環(huán)不暢導致了爆炸,造成經(jīng)濟損失的同時也帶來了巨大的污染;2019年3月江蘇中丹化工技術(shù)有限公司污水車間廢水儲罐發(fā)生火災事故,在帶來經(jīng)濟損失的同時,更重要的是導致生命的消逝.因此,對工業(yè)系統(tǒng)進行性能的監(jiān)控,有效的防止各類故障所帶來的危害至關(guān)重要的.在過去的幾十年中,諸多研究者對此進行了深入的研究,并提出了可行的解決辦法,例如,基于解析模型的非系統(tǒng)性的性能監(jiān)控方法受到廣泛地關(guān)注,并且廣泛地應用于航天器以及機器人等相關(guān)領(lǐng)域中[1-3].但由于現(xiàn)在工業(yè)系統(tǒng)構(gòu)造和原理的復雜性日益增強,特別是化工相關(guān)的生產(chǎn)系統(tǒng),導致難以在短期內(nèi)建立精準的模型.隨著計算機和傳感器的迅速發(fā)展,系統(tǒng)在運行時很多相關(guān)的數(shù)據(jù)會被采集到,使得基于數(shù)據(jù)驅(qū)動的故障檢測技術(shù)受到研究者的關(guān)注,并成功的廣泛應用于過程監(jiān)測中,例如在化工、冶金、醫(yī)藥等領(lǐng)域[4-9].
基于數(shù)據(jù)驅(qū)動的方法中包括機器學習、信號處理、多元統(tǒng)計等方法.其中多元統(tǒng)計方法由于依托統(tǒng)計學的知識,對系統(tǒng)無需了解過多的先驗性知識和精準的模型,而受到研究者的關(guān)注并將其應用于復雜系統(tǒng)中[10-14].基于多元統(tǒng)計的數(shù)據(jù)驅(qū)動方法主要理論涉及主元分析(Principle component analysis,PCA)、偏最小二乘(Partial least squares,PLS)等[15].PCA算法在降低維度的同時,也因此簡化了故障的檢測.但是只要PCA檢測到系統(tǒng)發(fā)生變化就會立即報警,會產(chǎn)生過度敏感的問題.然而在現(xiàn)實情況中,有些過程變量的變化并不會引起產(chǎn)品質(zhì)量的改變,但這種與質(zhì)量無關(guān)變量變化所引起的故障,仍然會指示系統(tǒng)故障發(fā)生的報警.這種誤報警會迫使龐大的工業(yè)系統(tǒng)停止生產(chǎn),進行檢修.這樣不僅增加了檢修的費用,同時停產(chǎn)也會帶來損失.雖然研究者也發(fā)現(xiàn)了此問題,并進行了基于質(zhì)量變量和過程變量的故障診斷方法研究,主要涉及多元線性回歸(Multiple linear regression,MLR)[16-17]、PLS[17,18]、規(guī)范變量分析(Canonical variable analysis,CVA)[19,20]、主元回歸分析(Principle component regression,PCR)[21-24]等.其中文獻[18]所提出的改進PLS方法就可以用來處理質(zhì)量相關(guān)故障問題,文獻[22]IPCR是在PLS的基礎上更徹底的分解過程變量X,使得檢測更準確.
本文所提出的MPCR可以在排除一些與質(zhì)量不相關(guān)的變量后,進行基于數(shù)據(jù)的建模.該方法在降低了檢測數(shù)據(jù)維度的同時,也簡化了對工業(yè)系統(tǒng)故障的檢測方式.在TEP故障檢測中,利用其普遍存在兩個變量作為質(zhì)量相關(guān)變量,具體變量的選取在TEP仿真中有詳細介紹.在此之上,將兩次檢測得到的T2取均值用來判斷是否有故障發(fā)生.為了驗證所提出的算法的有效性,采用IPCR和PCA在TEP過程中進行性能的檢測的對比.可以看到在TEP的故障5和故障7中,所提出來的MPCR效果明顯的好,同時,對于其他類故障也有較好的檢測結(jié)果.實驗證明相比單一的質(zhì)量相關(guān)變量而言,兩個質(zhì)量相關(guān)變量能更好的實現(xiàn)工業(yè)系統(tǒng)性能的監(jiān)測,并且本文所提出的MPCR性能監(jiān)測方法優(yōu)于PCA、IPCR.
針對之前一些傳統(tǒng)算法不能建立起質(zhì)量變量與過程變量之間的關(guān)系,以及由此所導致的無論是否兩變量質(zhì)量相關(guān),只要有故障發(fā)生,哪怕是不影響工業(yè)系統(tǒng)的正常運行與生產(chǎn),檢測系統(tǒng)都會報警,從而會帶來不必要的經(jīng)濟損失.因此,有研究者提出基于PCR的相關(guān)故障的檢測,有效的解決無關(guān)故障所帶來的誤報警問題.隨著系統(tǒng)的復雜度增加,有研究者提出了修正PCR性能檢測方法,如文獻[22]提出了IPCR,從其大量的仿真結(jié)果來看IPCR有著較好的檢測結(jié)果.根據(jù)定義算法中涉及的輸入變量和質(zhì)量變量,即輸入變量由X=[x1,…,xN]T RN×m表示,輸出變量由來Y=[y1,…,yN]T RN×l表示,則IPCR的算法如下.
首先,根據(jù)的PCR算法得到質(zhì)量變量之間的系數(shù)矩陣M,具體過程可以參考文獻[22].
其中X和?分別代表變量的主元部分和殘差部分并且彼此互相正交.
其次,對MMT進行奇異分解,可以得到如下結(jié)果
其中X表示其與Y高度的相關(guān)?表示其與Y高度的不相關(guān).Tre代表X的得分矩陣,Tun表示?的得分矩陣.在線檢測時,IPCR將樣本同樣分解成兩部分,然后由式(5-6)得到tre和tun.
由此可以確定X和?的T2統(tǒng)計量
若置信限設置為α,則的閾值為
其中(Fm,N-m,α)表示自由度為m和N m的F分布.
最后,根據(jù)閾值式(15-16)來判斷發(fā)生故障的類型,詳細算法過程如下:
互信息描述的是一個隨機變量中包含的關(guān)于另一個隨機變量的信息量.它不僅限于簡單的線性關(guān)系,而且可以用來評價兩個隨機變量之間的非線性相關(guān)程度.兩個變量之間的相關(guān)性越強,相互信息的值越大.若兩個變量相互獨立,那么互信息值為0.因此,系統(tǒng)性能監(jiān)測或故障診斷中可選用互信息來篩選出與質(zhì)量更相關(guān)的過程變量.其公式如下
其中p(x)和p(y)分別是X和Y的邊緣概率分布函數(shù),而p(x,y)為X和Y的聯(lián)合概率分布函數(shù).然而在實際計算過程中,概率密度函數(shù)通常難以計算,因此,互信息采用
計算獲取.其中H(x)和H(y)是邊緣熵,H(x,y)是聯(lián)合熵.H(x)、H(y)、H(x,y)可由
確定.此外,特別需要說明的是對于取得前K個變量要滿足
其中n為備選x的個數(shù),k為選出變量的個數(shù).
基于PCR的IPCR算法很好的構(gòu)造了質(zhì)量變量與過程變量之間的關(guān)系,整體上也能表達系統(tǒng)總體狀況,但其仍存在一定的缺陷,例如在無關(guān)故障中報警率過大,以及不能及時反映系統(tǒng)真實情況等.本文針對不足的問題提出了MPCR對其改進,具體對不足的改進與效果將在TEP仿真實驗中詳細的進行分析與論證.MPCR方法,首先要對樣本輸入到IPCR模型之前采用互信息對其進行篩選處理,依據(jù)式(22)剔除不需要的變量;其次將過程變量與兩個質(zhì)量變量分別建模,并取得所有統(tǒng)計量的均值;最后,在通過閾值式(15)判斷,實現(xiàn)系統(tǒng)故障的精確診斷.具體的算法步驟如下.
步驟1對X與Y進行標準化處理;
步驟2對X和Y1與Y2進行互信息運算選出與Y相關(guān)程度較大的X;
步驟3將選出的X與Y1代入到IPCR模型根據(jù)式(5)得到Tre1;
步驟4將選出的X與Y2代入到IPCR模型根據(jù)式(5)得到Tre2;
在線監(jiān)測
步驟5由式(15)設置質(zhì)量相關(guān)故障統(tǒng)計量的閾值
步驟6將已選好的在線樣本X和Tre1代入式(9-13)中求得;
步驟7將已選好的在線樣本X和Tre2代入式(9-13)中求得
步驟8將取均值后得到Tre2;
步驟9若Tre2大于則產(chǎn)生質(zhì)量相關(guān)故障,反之無質(zhì)量相關(guān)故障發(fā)生.
為便于描術(shù)本文所提出一種修正標準主成分回歸的質(zhì)量相關(guān)故障檢測方法,此出給出故障檢測過程的流程圖如圖1所示.
TEP是由伊斯曼公司提供一個測試平臺,它是基于真實的化工過程創(chuàng)建的仿真模型.由于該過程較好的反映出實際復雜工業(yè)過程出現(xiàn)的問題,因此,該測試平臺被廣泛的應用于工業(yè)系統(tǒng)的過程性能監(jiān)控和故障檢測與診斷等相關(guān)領(lǐng)域中,TEP模型如圖2所示[22].此過程主要有5個生產(chǎn)單元,8種反應成分,其中B是惰性氣體.反應過程如下所示
式(23)過程一共有22個測量變量、12個操作變量和19個成分變量,整個過程設置了21個故障,其中故障1-15為已知故障,其中質(zhì)量相關(guān)故障有故障1、2、5、6、7、8、10、12、13,其余為質(zhì)量無關(guān)故障.MPCR中質(zhì)量變量選擇的是成分變量XMEAS(35)和XMEAS(38),原因是諸多文獻以及文獻[25]的質(zhì)量變量選擇均在上述變量中選擇作為質(zhì)量變量,本文后續(xù)仿真實驗即利用上述已知故障來進行仿真驗證.其中α的取值為0.99,δ取值為0.55,由文獻[25]TEP仿真部分可知δ取值略小于0.55效果變化不大,但是略大于0.55效果明顯變差,因此,系統(tǒng)測試在選擇變量個數(shù)時要盡量滿足δ取值在小于0.55處向0.55無限接近.綜上,過程變量是在測量變量和操作變量共計33個量中選出17個與質(zhì)量變量相關(guān)程度較大的變量.PCA和IPCR的過程變量按文獻[22]取33個,α的取值為0.99.實驗數(shù)據(jù)包括故障數(shù)據(jù)和正常數(shù)據(jù),正常數(shù)據(jù)用于建模,故障數(shù)據(jù)用來檢測,故障數(shù)的樣本數(shù)一共960個,其中前160為正常數(shù)據(jù).
由于TEP系統(tǒng)中存在著許多閉環(huán)反饋機制,因此,在有些故障發(fā)生之后系統(tǒng)會逐漸恢復正常,其中故障5和7就是此類故障.以故障7為例,利用格拉布斯(Grubbs)檢驗法對兩個質(zhì)量變量進行異常值的分析,其中建模部分所采用的數(shù)據(jù)是前160個正常的樣本,參數(shù)g0的取值是按照正常樣本無異常來確定的,檢測結(jié)果如圖3和圖4所示.圖3-4中紅線代表閾值,超過閾值則報警.
從圖3中可以明顯的看出XMEAS(35)在將近400點已經(jīng)恢復正常,從圖4中可以明顯的看出XMEAS(38)也在600點左右恢復正常.此外,從圖3-4還可見當故障7發(fā)生時質(zhì)量變量發(fā)生明顯的改變,因此故障7也是質(zhì)量相關(guān)的故障.IPCR對故障7的檢測結(jié)果由圖5可明顯的看出在靠近800點左右的兩部分有明顯的報警,圖6中PCA對故障7的檢測雖然也有回歸的趨勢但是仍然一直報警.而圖7中MPCR對故障7的檢測結(jié)果更加符合質(zhì)量變量的變化的情況,在600多點以后不再報警.可見MPCR在對故障7的檢測結(jié)果中更加貼近質(zhì)量變量的變化,因此在故障7中MPCR的檢測結(jié)果優(yōu)于IPCR和PCA.
此外在故障5中質(zhì)量變量也是在400點左右恢復正常的,然而IPCR對質(zhì)量相關(guān)故障5的檢測卻一直報警,如圖8所示,PCA也是斷斷續(xù)續(xù)的報警,而MPCR卻也能很好的反應系統(tǒng)的真實情況如圖10所示.
經(jīng)過仿真統(tǒng)計在TEP的15個已知故障中檢測效果優(yōu)于IPCR的有故障(2-10、12、15)共計11個,其中無關(guān)故障3和相關(guān)故障10的效果通過圖11-16容易的看出,無關(guān)故障MPCR的報警率少,相關(guān)故障MPCR的報警率高和理論的趨勢相符合,在PCA中無論相關(guān)故障10或者無關(guān)故障3報警率都比較高,因此MPCR對于故障檢測的結(jié)果更優(yōu)越于IPCR.為進一步說明本文所提出的故障檢測方法MPCR的有效性,此處增加對余下故障檢測結(jié)果統(tǒng)計分析,詳見表1-2.通過表2質(zhì)量無關(guān)故障的檢測率,可以看出MPCR對無關(guān)故障的檢測率成倍數(shù)的小于IPCR的檢測率,個別的檢測率幾乎接近0,而PCA的報警率是非常高的,然而對無關(guān)故障的檢測的理論值應該為0,進一步證明了MPCR故障檢測方法的優(yōu)越性.
從表1中可知,MPCR對于一些質(zhì)量相關(guān)故障的檢測率也高于IPCR的檢測率,即使個別質(zhì)量相關(guān)故障的檢測率低于IPCR的檢測率也做到大部分的報警.雖然大部分PCA的報警率高于MPCR但是在無關(guān)檢測中PCA對故障的檢測率也高于MPCR,說明了PCA對所有故障都比較敏感,正如之前所提到的該方法無法明確的區(qū)分質(zhì)量相關(guān)和無關(guān)故障,只要發(fā)生變化就會產(chǎn)生警報.綜上可見本文所提出來的MPCR算法優(yōu)于PCA和IPCR.
表1 TEP的相關(guān)故障的檢測率
表2 TEP的無關(guān)故障的檢測率
本文提出的MPCR算法,首先利用互信息壓縮輸入矩陣后又用兩個質(zhì)量變量同時對系統(tǒng)檢測,增強了對故障檢測的效果,與IPCR和PCA比尤其在TEP具有反饋調(diào)節(jié)型的故障5和7的檢測中能更好的體現(xiàn)出質(zhì)量變量的變化,即在質(zhì)量變量回歸正常時,MPCR也停止報警,因此MPCR能比較好的用于TEP系統(tǒng)的相關(guān)故障檢測.