黃 健, 楊 旭
(北京科技大學(xué) 自動(dòng)化學(xué)院;工業(yè)過程知識(shí)自動(dòng)化教育部重點(diǎn)實(shí)驗(yàn)室,北京 100083)
在現(xiàn)代工業(yè)中,生產(chǎn)過程安全和產(chǎn)品質(zhì)量是最為關(guān)注的兩個(gè)問題,隨著生產(chǎn)規(guī)模的擴(kuò)大和過程變量的增加,現(xiàn)代工業(yè)對(duì)過程監(jiān)控提出了較高的要求[1-6].近年來,多元統(tǒng)計(jì)過程監(jiān)測(cè)引起了廣泛的關(guān)注,其主要思想是將高維數(shù)據(jù)投影到低維空間,并保留原始數(shù)據(jù)的主要信息[1-2, 7].在目前的研究中,最常用的多元統(tǒng)計(jì)方法是主成分分析(PCA)和獨(dú)立成分分析(ICA)[3, 8-10].
傳統(tǒng)的多元統(tǒng)計(jì)方法(如PCA和ICA),通常認(rèn)為其統(tǒng)計(jì)過程處于靜態(tài),過程當(dāng)前時(shí)刻的狀態(tài)不受之前時(shí)刻的影響.然而,在實(shí)際工業(yè)過程中,當(dāng)前時(shí)刻幾乎不會(huì)保持穩(wěn)定狀態(tài),從而使過程變量呈現(xiàn)動(dòng)態(tài)特性.因此,傳統(tǒng)的監(jiān)測(cè)模型無法明確表達(dá)過程數(shù)據(jù)的動(dòng)態(tài)特性.Ku等[11]在模型構(gòu)建過程中采用時(shí)滯變換策略來改善動(dòng)態(tài)特性.Huang等[12]提出了結(jié)合動(dòng)態(tài)PCA、動(dòng)態(tài)ICA和Bayesian推理的動(dòng)態(tài)過程監(jiān)測(cè)方法.然而,動(dòng)態(tài)過程的時(shí)變特性可能對(duì)不同的變量產(chǎn)生不同的影響,基于擴(kuò)展矩陣的方式無法從根本上克服過程的動(dòng)態(tài)特性.慢特征分析(SFA)[13-14]是一種無監(jiān)督學(xué)習(xí)算法,其優(yōu)化目標(biāo)是提取隨時(shí)間變化的慢特征.Shang等[13]指出動(dòng)態(tài)性是表征過程變化的重要指標(biāo).Shang等[14]提出一種自適應(yīng)過程監(jiān)控的遞歸SFA算法,該算法通過更新模型參數(shù)和監(jiān)控統(tǒng)計(jì)信息來自適應(yīng)時(shí)變過程.Guo等[15]提出了概率SFA過程監(jiān)測(cè)算法.Zhang等[16]將核SFA算法用于非線性間歇過程監(jiān)測(cè).上述研究采用SFA進(jìn)行過程監(jiān)測(cè),取得了良好的監(jiān)測(cè)結(jié)果.但是,這些文獻(xiàn)幾乎沒有討論如何在降維步驟中選擇與故障相關(guān)的信息.
與此同時(shí),生產(chǎn)過程監(jiān)測(cè)需要建立可靠的模型.在基于數(shù)據(jù)的思想進(jìn)行建模時(shí),特征數(shù)據(jù)的選擇對(duì)監(jiān)測(cè)模型的準(zhǔn)確性有著至關(guān)重要的作用.當(dāng)前有很多算法應(yīng)用于特征選擇,汪嘉晨等[17]在關(guān)于對(duì)軸承技術(shù)參數(shù)的診斷問題中,提出一種用模型判斷特征并通過閾值進(jìn)行特征選擇的方法.利用標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行離線訓(xùn)練,訓(xùn)練完成后利用所選擇的特征構(gòu)造統(tǒng)計(jì)量進(jìn)行故障檢測(cè)等工作.然而在實(shí)際工業(yè)過程中,特征空間并非保持一成不變,因此,離線建立的系統(tǒng)模型不能很好地反映每個(gè)采樣時(shí)刻的系統(tǒng)性能,無法根據(jù)離線建立的系統(tǒng)模型對(duì)每個(gè)樣本的狀態(tài)進(jìn)行準(zhǔn)確地故障檢測(cè).Zhou等[18]提出一種基于自適應(yīng)密度鄰域關(guān)系的新在線流特征選擇方法,即在進(jìn)行在線選擇的過程中,忽略過程的動(dòng)態(tài)信息.Huang等[19]提出了基于在線特征重排和特征選擇的慢特征分析故障檢測(cè)算法,但在選擇故障信息方面仍有不足.因此,深入研究凸顯過程中的故障信息是非常重要的.
本文針對(duì)傳統(tǒng)算法在監(jiān)測(cè)動(dòng)態(tài)過程中產(chǎn)生的未充分利用故障信息的問題,提出在線加權(quán)SFA故障檢測(cè)算法.采用SFA算法提取慢特征數(shù)據(jù),為動(dòng)態(tài)特征設(shè)計(jì)閾值.在進(jìn)行在線監(jiān)測(cè)時(shí),將超過閾值的特征認(rèn)為是較為明顯的、可能包含故障信息的嫌疑特征,將這些嫌疑特征選擇到主空間進(jìn)行進(jìn)一步監(jiān)測(cè).為了凸顯故障信息,引入權(quán)重系數(shù)的統(tǒng)計(jì)量計(jì)算方法,根據(jù)特征數(shù)值的大小給所有的嫌疑特征值賦予不同的權(quán)重系數(shù),并根據(jù)這些帶有明顯故障信息的嫌疑特征計(jì)算控制閾值,以達(dá)到提高算法故障檢測(cè)率的目的.
給定一個(gè)輸入信號(hào)向量x(t),SFA算法的目標(biāo)是找到一個(gè)特征函數(shù)g(x),使得特征變量s(t)=g(x(t))隨時(shí)間的變化較慢.m維的輸入信號(hào)在時(shí)間范圍t∈[t0,t1]內(nèi)可以表示為x(t)=[x1(t)x2(t)…xm(t)]T,采用g(x)=[g1(x)g2(x)…gm(x)]T和s(t)=[s1(t)s2(t)…sm(t)]T表示特征函數(shù)和慢特征,其關(guān)系表示為si(t)=gi(x(t)),i=1,2,…,m.SFA算法的優(yōu)化問題由下式表示[13-14]:
(5)
式(1)表示的是SFA算法提取慢特征時(shí)間變化最小化的優(yōu)化目標(biāo).
SFA算法從正常數(shù)據(jù)中提取緩慢變化的部分,對(duì)每個(gè)慢特征進(jìn)行線性特征轉(zhuǎn)化,此過程可以表示如下[13,19]:
(6)
i=1,2,…,m
式中:wi為負(fù)載向量.因此,所有的慢特征可以寫成原始變量的線性組合形式:
s=Wx
(7)
式中:W為負(fù)載矩陣,
W=[w1w2…wm]T
進(jìn)行SFA算法計(jì)算時(shí),第1步是進(jìn)行白化處理以消除變量之間的相關(guān)關(guān)系.使用奇異值分解實(shí)現(xiàn)白化操作,假設(shè)x(t)是原始數(shù)據(jù),并且
R=〈x(t)xT(t)〉t
表示為其協(xié)方差矩陣,R的奇異值分解可以寫為
R=UΛUT
(8)
式中:Λ和U分別為特征值對(duì)角陣和特征矩陣.白化矩陣可以寫作Q=Λ-1/2UT.同時(shí)白化過程可由下式描述:
z=Λ-1/2UTx=Qx
(9)
結(jié)合式(7)和(9),可以推導(dǎo)出
s=Wx=WQ-1z=Pz
(10)
這里P=WQ-1,顯然有〈zzT〉t=Q〈xxT〉QT=I以及〈z〉t=0.又由于約束(2)和(3)的存在,可以得到下式:
〈ssT〉t=I
(11)
則式(11)可以寫為
〈ssT〉t=P〈zzT〉PT=PPT=I
(12)
(13)
式中:pi為特征向量.實(shí)際過程中,樣本數(shù)據(jù)是在離散的時(shí)間狀態(tài)下采集到的.基于時(shí)間的導(dǎo)數(shù)可以由差分近似,計(jì)算如下:
(14)
式中:Δt為時(shí)間間隔.通過使用協(xié)方差矩陣的奇異值分解來解決優(yōu)化問題,在這種情況下,奇異值分解可以表示為
(15)
可知,負(fù)載矩陣的計(jì)算可以由下式表示:
W=PQ=PΛ-1/2UT
(16)
采集樣本數(shù)據(jù)后,可以使用SFA算法提取過程中不同的動(dòng)態(tài)水平特征.在實(shí)際動(dòng)態(tài)工業(yè)過程中,故障可能發(fā)生在部分動(dòng)態(tài)特征中,因此通過SFA算法進(jìn)行動(dòng)態(tài)特征提取時(shí),需要選擇重要特征對(duì)數(shù)據(jù)進(jìn)行降維.由于SFA算法是一種線性的特征提取方法,通常認(rèn)為權(quán)重矩陣中,具有較大L2范數(shù)的行對(duì)應(yīng)慢特征能夠捕捉到過程的變化.
若k個(gè)重要慢特征可表示為sk,采用S2和SPE統(tǒng)計(jì)量進(jìn)行故障檢測(cè),兩個(gè)統(tǒng)計(jì)量的計(jì)算如下:
(19)
式中:yi為來自數(shù)據(jù)集的觀測(cè)值;n為樣本數(shù)量;b為帶寬;G(·)為核函數(shù).選擇核函數(shù)為Gaussian核函數(shù),表達(dá)式如下:
(20)
在線特征選擇時(shí),故障嫌疑選擇結(jié)果比較依賴于控制限的選擇.如果控制限的選擇過高,將導(dǎo)致故障相關(guān)特征數(shù)據(jù)挑選不足,容易忽略在線數(shù)據(jù)特征中包含故障信息的部分,導(dǎo)致最后的系統(tǒng)故障信息體現(xiàn)不明確,影響故障檢測(cè)的正確率.相反地,如果控制限的選擇過低,將會(huì)篩選出大量的未包含故障信息的冗余特征數(shù)據(jù),這會(huì)降低故障相關(guān)特征數(shù)據(jù)的比重,也容易導(dǎo)致系統(tǒng)的故障信息體現(xiàn)不明確,進(jìn)而影響故障檢測(cè)結(jié)果.
在線特征選擇利用離線計(jì)算的控制限對(duì)每個(gè)慢特征監(jiān)控統(tǒng)計(jì)量進(jìn)行逐個(gè)判斷,將超出平均控制限的部分?jǐn)?shù)據(jù)選擇出來,認(rèn)為其是有故障嫌疑的部分,將其放入主空間進(jìn)行監(jiān)測(cè),計(jì)算統(tǒng)計(jì)量和控制限.選擇條件如下:
(21)
式中:σ為松弛系數(shù),σ∈(0,1].松弛系數(shù)的作用是放寬控制限的篩選嚴(yán)格度,避免控制限過高導(dǎo)致丟失故障信息.考慮到控制限的選擇對(duì)故障檢測(cè)結(jié)果有著較為重要的影響,為了避免控制限選取的過高而導(dǎo)致在線選擇的特征數(shù)據(jù)有缺失,應(yīng)給松弛系數(shù)賦予一個(gè)合適的值.
慢特征作為潛變量,包含了采樣的過程變量的諸多信息.然而由式(21)可知,引入了松弛系數(shù)可能使得更多的慢特征被認(rèn)定為嫌疑變量.如果特征選擇過程中確定的控制限較低,將會(huì)導(dǎo)致有些篩選出來的特征是不含故障信息的,即篩選出很多冗余信息.這降低了包含故障信息的特征數(shù)據(jù)的比重,使故障信息的體現(xiàn)不明確,可能會(huì)導(dǎo)致無法有效地檢測(cè)出故障.為了解決上述問題,凸顯故障信息,在計(jì)算在線監(jiān)測(cè)統(tǒng)計(jì)量時(shí)引入權(quán)重系數(shù),即給每個(gè)特征賦予一定權(quán)重,將數(shù)值大的、可能包含更多故障信息的特征數(shù)據(jù)賦予較高的權(quán)值,而對(duì)數(shù)值小的、可能包含較少或不包含故障信息的特征數(shù)據(jù)賦予較低權(quán)值,將故障信息盡可能地突顯出來.
(22)
(23)
此多變量的數(shù)值仿真系統(tǒng)是由Ku等[11]提出并經(jīng)過Lee等[20]加以優(yōu)化.系統(tǒng)如下所示:
(24)
y(q)=a(q)+v(q)
(25)
(26)
式中:輸入h為隨機(jī)向量,服從在區(qū)間(-2,2)上的均勻分布;輸出y等于a加上隨機(jī)噪聲向量v;噪聲v服從均值為0和方差為0.1的Gaussian分布;輸入u和輸出y都可測(cè),a和h不可測(cè).本文生成960個(gè)樣本用于分析,每個(gè)樣本包含5個(gè)變量(y1,y2,y3,u1,u2).用于監(jiān)測(cè)的故障均是從第161個(gè)樣本開始引入,即1~160的樣本為正常數(shù)據(jù),161~960的樣本為故障數(shù)據(jù),故障創(chuàng)建如下:
故障1h2處引入值為2的階躍故障.
故障2h1引入0.01(q-160)的斜坡故障.
在進(jìn)行特征選擇時(shí),利用傳統(tǒng)SFA算法選擇的離線特征不一定全是包含故障信息的特征.故障1的所有慢特征如圖1所示,其中SF1~5代表特征1~5.由圖1可知,特征1和4在故障發(fā)生時(shí)有明顯的上升趨勢(shì),包含故障信息,而靠前的特征2和3并沒有顯示出明顯的故障信息.嫌疑特征加權(quán)前后的統(tǒng)計(jì)量如圖2所示.由圖2可知,特征1、2、4是挑選出的故障嫌疑變量.權(quán)重系數(shù)對(duì)篩選出來的慢特征進(jìn)行了權(quán)重賦值,特征1和4所占比重增加,使含有故障信息的特征數(shù)據(jù)體現(xiàn)地更加明顯.所提出的在線特征選擇的策略,可以挑選出包含故障信息最明顯的特征,經(jīng)過特征加權(quán),凸顯了故障信息.
圖1 故障1的所有慢特征
圖2 各個(gè)嫌疑特征統(tǒng)計(jì)量
過程監(jiān)測(cè)過程的松弛系數(shù)取0.8.PCA算法使用T2和SPE統(tǒng)計(jì)量,SFA算法以及OWSFA算法3種方法對(duì)不同故障的故障檢測(cè)率如表1所示,其中最佳檢測(cè)結(jié)果由粗體標(biāo)出.故障1是h2處引入值為2的階躍擾動(dòng),3種方法的監(jiān)控結(jié)果如圖3所示.由圖3可知,OWSFA算法由于有著在線特征選擇,挑選到了包含較多故障信息的部分?jǐn)?shù)據(jù)特征,所以檢測(cè)結(jié)果較好,整體檢測(cè)率相比其余兩種方法有著一定程度的提升.
圖3 故障1監(jiān)測(cè)結(jié)果
表1 3種方法的故障檢測(cè)率
故障2是h1引入0.01(q-160)的斜坡擾動(dòng),3種方法的監(jiān)測(cè)結(jié)果如圖4所示.由于斜坡故障是隨著時(shí)間推移逐漸變大的,其產(chǎn)生的初始時(shí)刻并不明顯.由圖4可知,PCA和SFA算法統(tǒng)計(jì)量最早在大約第350次采樣處明顯分辨出故障,而OWSFA算法能夠在大約第300次取樣處分辨出系統(tǒng)故障,有著一定的優(yōu)勢(shì).由于斜坡故障在開始產(chǎn)生時(shí)并不十分明顯,所以包含其故障信息的特征數(shù)據(jù)開始時(shí)不易被檢測(cè),OWSFA算法在進(jìn)行特征選擇時(shí)引入的閾值系數(shù)放寬了控制標(biāo)準(zhǔn),將上述不易檢測(cè)的故障信息也選擇了進(jìn)來,又通過權(quán)重賦值使故障信息突顯.由此,OWSFA算法對(duì)此斜坡故障有著更高的檢測(cè)率.
圖4 故障2監(jiān)測(cè)結(jié)果
TE模型是由Downs等[21]提出,隨后,Lyman 等[22]對(duì)TE 過程的控制系統(tǒng)進(jìn)行了改進(jìn).TE過程有5個(gè)主要的單元操作:反應(yīng)器、冷凝器、汽液分離器、循環(huán)壓縮機(jī)和產(chǎn)品汽提器.TE過程共有33個(gè)過程變量.基準(zhǔn)數(shù)據(jù)集包含500個(gè)樣本,故障模擬器可以生成21種不同類型的故障.對(duì)于每個(gè)故障,前160個(gè)樣本是正常數(shù)據(jù),樣本161~960是故障數(shù)據(jù).故障檢測(cè)過程的松弛系數(shù)取0.8.
對(duì)于故障1、2、4、6、12、13、14、18,3種方法都有著很好的檢測(cè)率,基本都能達(dá)到95%以上.故障3、9、15用3種方法都較難檢測(cè)出.相比于PCA算法和SFA算法,OWSFA算法對(duì)于故障10、11、20、21有較為明顯的優(yōu)勢(shì).OWSFA算法,由于結(jié)合了SFA算法的動(dòng)態(tài)信息表達(dá)和在線加權(quán)的優(yōu)勢(shì),能夠檢測(cè)出更多的故障.3種監(jiān)測(cè)算法的檢測(cè)率如表2所示,其中,對(duì)監(jiān)控結(jié)果有著明顯優(yōu)勢(shì)的部分進(jìn)行了加粗處理.下面針對(duì)故障10和11進(jìn)行詳細(xì)分析.
表2 TE過程故障檢測(cè)率
故障10是C進(jìn)料溫度的隨機(jī)變化.PCA,SFA,OWSFA算法的監(jiān)測(cè)結(jié)果如圖5所示.由圖5可知,PCA算法的T2統(tǒng)計(jì)量檢測(cè)率只有45%,檢測(cè)效果不佳.SFA算法相比于PCA算法有著小幅度的優(yōu)化.而OWSFA算法在原本SFA算法的基礎(chǔ)上有了很大的進(jìn)步,檢測(cè)率可以達(dá)到92%.由于故障10屬于隨機(jī)變化故障,其故障值有時(shí)可能并不能明顯體現(xiàn),采用在線特征選擇策略,引入權(quán)重系數(shù)計(jì)算統(tǒng)計(jì)量,能夠突顯故障信息,所以O(shè)WSFA算法可以顯著地提高故障檢測(cè)率.
圖5 故障10監(jiān)測(cè)結(jié)果
故障11是反應(yīng)器冷卻水入口溫度的隨機(jī)變化.PCA、SFA、OWSFA算法的監(jiān)測(cè)結(jié)果如圖6所示.由圖6可知,PCA和SFA算法的檢測(cè)率均低于70%,相比于PCA和SFA算法,OWSFA算法的S2統(tǒng)計(jì)量和SPE統(tǒng)計(jì)量檢測(cè)率均有著一定程度的提高,故障檢測(cè)率超過了80%.
圖6 故障11監(jiān)測(cè)結(jié)果
綜上,SFA算法由于包含了動(dòng)態(tài)信息,較傳統(tǒng)的PCA算法有著一定程度的進(jìn)步.OWSFA算法保留了原有SFA算法的監(jiān)控優(yōu)勢(shì),由于在線故障嫌疑特征選擇和特征加權(quán)對(duì)故障檢測(cè)有著極其重要的影響,使得故障檢測(cè)模型更加有效,所以O(shè)WSFA算法有著更高的檢測(cè)率.
鑒于傳統(tǒng)多元統(tǒng)計(jì)方法忽略了時(shí)變動(dòng)態(tài)信息,無法為過程數(shù)據(jù)的動(dòng)態(tài)行為提供明確的表示.此外,由于傳統(tǒng)算法在進(jìn)行特征選擇時(shí),沒有利用在線故障信息,導(dǎo)致檢測(cè)結(jié)果不佳.本文提出了一種基于在線加權(quán)SFA的故障檢測(cè)方法,通過判斷在線監(jiān)測(cè)特征是否超過閾值來選擇故障嫌疑變量,并且計(jì)算統(tǒng)計(jì)量時(shí)引入權(quán)重系數(shù)以凸顯故障信息,實(shí)現(xiàn)了對(duì)過程系統(tǒng)的故障檢測(cè).利用慢特征分析算法提取過程系統(tǒng)的動(dòng)態(tài)信息,在線嫌疑特征選擇策略充分利用過程故障信息,引入松弛系數(shù)這一特征選擇參數(shù)和權(quán)重系數(shù)這一統(tǒng)計(jì)量計(jì)算參數(shù),很大程度上降低了選擇在線特征時(shí)對(duì)閾值的依賴.根據(jù)TE過程仿真和數(shù)值系統(tǒng)仿真的結(jié)果,驗(yàn)證了本方法的可行性.