張 成,郭青秀,馮立偉,李 元
(1.沈陽(yáng)化工大學(xué) 數(shù)理系,沈陽(yáng) 110142; 2.沈陽(yáng)化工大學(xué) 技術(shù)過(guò)程故障診斷與安全性研究中心,沈陽(yáng) 110142)
隨著現(xiàn)代工業(yè)技術(shù)的發(fā)展,工業(yè)過(guò)程規(guī)模不斷擴(kuò)大、復(fù)雜度逐漸提升。為保證生產(chǎn)安全及產(chǎn)品質(zhì)量,故障檢測(cè)技術(shù)在工業(yè)生產(chǎn)過(guò)程中變得尤為重要。
主元分析(Principal Component Analysis, PCA)作為一種多元統(tǒng)計(jì)故障檢測(cè)方法已被廣泛應(yīng)用于工業(yè)過(guò)程監(jiān)控中[1-4]。PCA通過(guò)線性變換將原始空間分為主元子空間和殘差子空間,分別應(yīng)用統(tǒng)計(jì)量Hotelling’s T2和平方預(yù)測(cè)誤差(Square Prediction Error, SPE)對(duì)上述空間進(jìn)行監(jiān)控。由于其統(tǒng)計(jì)量T2和SPE計(jì)算時(shí)假設(shè)數(shù)據(jù)服從單模態(tài)的多元高斯分布,且PCA忽略了變量沿時(shí)間序列上的相關(guān)性,所以其使用范圍受到了一定的限制。針對(duì)非線性問(wèn)題,核主元分析(kernel Principal Component Analysis, kPCA)方法被引入到過(guò)程監(jiān)控中[5],其基本思想是通過(guò)非線性映射將數(shù)據(jù)映射到高維特征空間,然后在高維的特征空間上進(jìn)行主元分析[6]。與傳統(tǒng)的PCA相比,kPCA具有主成份特征明顯、貢獻(xiàn)率集中等優(yōu)點(diǎn),其性能優(yōu)于PCA。由于kPCA仍然使用T2和SPE兩個(gè)統(tǒng)計(jì)量進(jìn)行過(guò)程監(jiān)視,因此它在多模態(tài)過(guò)程故障檢測(cè)中同樣具有相應(yīng)的局限性[7]。針對(duì)非線性和多工況等特征,He等[8]提出了基于K近鄰的故障檢測(cè)(Fault Detection based onKNearest Neighbors, FD-KNN)方法,利用局部距離之和D2進(jìn)行檢測(cè),提高了非線性和多模態(tài)中大尺度故障的檢測(cè)能力;但當(dāng)數(shù)據(jù)為多模態(tài)且方差差異較大時(shí),該方法的故障檢測(cè)能力降低。針對(duì)工業(yè)過(guò)程的動(dòng)態(tài)特性,Ku等[9]提出動(dòng)態(tài)主元分析(Dynamic Principal Component Analysis, DPCA)方法,通過(guò)引入延時(shí)測(cè)量值構(gòu)成增廣矩陣,再對(duì)其進(jìn)行PCA建模。DPCA消除了樣本自相關(guān)性導(dǎo)致的統(tǒng)計(jì)量不平穩(wěn)現(xiàn)象,但沒(méi)有考慮多模態(tài)數(shù)據(jù)模態(tài)切換時(shí)過(guò)程變量在時(shí)間上存在的自相關(guān)特性[10],同時(shí)DPCA的統(tǒng)計(jì)量T2和SPE同樣需要數(shù)據(jù)滿足多元高斯分布。
針對(duì)數(shù)據(jù)為多模態(tài)且時(shí)序相關(guān)的過(guò)程監(jiān)控問(wèn)題,本文提出了局部近鄰標(biāo)準(zhǔn)化(Local Neighborhood Standardized, LNS)和DPCA相結(jié)合的故障檢測(cè)方法LNS-DPCA。首先對(duì)數(shù)據(jù)進(jìn)行局部近鄰標(biāo)準(zhǔn)化處理,對(duì)每個(gè)樣本采用其局部近鄰均值和標(biāo)準(zhǔn)差進(jìn)行標(biāo)準(zhǔn)化處理以消除多模態(tài)特征;接下來(lái)對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)應(yīng)用DPCA建立模型和進(jìn)行故障檢測(cè)。LNS-DPCA不僅具備DPCA處理樣本自相關(guān)性的能力,還繼承了LNS能夠?qū)⒍嗄B(tài)數(shù)據(jù)融合為單模態(tài)數(shù)據(jù)的優(yōu)勢(shì),可以有效地對(duì)具有多模態(tài)和相關(guān)性特征的工業(yè)過(guò)程進(jìn)行故障檢測(cè),提高生產(chǎn)過(guò)程的可靠性。
在DPCA中,通常認(rèn)為當(dāng)前時(shí)刻樣本與過(guò)去時(shí)刻樣本相關(guān),因此可以構(gòu)造當(dāng)前時(shí)刻樣本X(k)增廣向量如下:
Xk(l)=[X(k),X(k-1),…,X(k-l)]
(1)
(2)
其中:P∈Rm×A是主元負(fù)載矩陣,由X(l)協(xié)方差矩陣的前A個(gè)特征向量構(gòu)成,A為主元的個(gè)數(shù);T∈Rm×A是得分矩陣。在主元空間和殘差子空間分別使用Hotelling’s T2和平方預(yù)測(cè)誤差SPE進(jìn)行故障檢測(cè)。
T2=tΛ-1tT
(3)
SPE=[X(l)-X(l)PPT]2
(4)
其中:t=X(l)P為當(dāng)前時(shí)刻樣本得分向量;Λ為X(l)協(xié)方差矩陣的前A個(gè)特征值構(gòu)成的對(duì)角陣。記:xi(i=1,2,…,n)為訓(xùn)練增廣矩陣X(l)中的第i個(gè)變量,當(dāng)變量xi服從多元高斯分布時(shí),T2和SPE統(tǒng)計(jì)指標(biāo)的控制限可以由式(5)、(6)確定[11]。
(5)
(6)
其中:T2近似服從自由度為A和m-A的F分布;SPE近似服從自由度為h的χ2分布;如果將訓(xùn)練數(shù)據(jù)SPE統(tǒng)計(jì)指標(biāo)的均值和方差分別記為a和b,那么參數(shù)g=b/(2a),同時(shí)h=2a2/b;α為置信水平,通常選取為0.99或0.95。
首先,在主題上存在問(wèn)題。通過(guò)研究可以看出,在一些微課教學(xué)中存在著主題不明確的問(wèn)題。究其原因就是教師在教學(xué)中并沒(méi)有對(duì)微課教育產(chǎn)生正確的認(rèn)識(shí),這樣也就使得微課教育的正常開(kāi)展開(kāi)受到了影響。其次,教學(xué)目標(biāo)不準(zhǔn)確。一般來(lái)說(shuō)微課的教學(xué)目標(biāo)大多是從知識(shí)技能目標(biāo)上提出來(lái)的,主要是因?yàn)檫@一環(huán)節(jié)是學(xué)生最容易產(chǎn)生疑問(wèn)的地方。但是從實(shí)際上來(lái)說(shuō),由于一些目標(biāo)在設(shè)計(jì)上以情感目標(biāo)為主,這樣也就使得在有限的時(shí)間里難以讓學(xué)生所理解,而影響到了教學(xué)的開(kāi)展效果[1]。
DPCA雖然可以獲取數(shù)據(jù)的動(dòng)態(tài)聯(lián)系信息,但它也如同PCA一樣使用T2和SPE兩個(gè)統(tǒng)計(jì)量實(shí)現(xiàn)過(guò)程監(jiān)控。工業(yè)過(guò)程數(shù)據(jù)的多模態(tài)、動(dòng)態(tài)性特征將影響DPCA方法中T2和SPE的過(guò)程故障檢測(cè)性能。
在進(jìn)行故障檢測(cè)之前,通常應(yīng)用Z-score標(biāo)準(zhǔn)化方法對(duì)采樣數(shù)據(jù)進(jìn)行預(yù)處理。Z-score方法能夠?qū)?shù)據(jù)的中心平移到坐標(biāo)系原點(diǎn)且消除變量量綱不同的影響。由于Z-score標(biāo)準(zhǔn)化計(jì)算時(shí)使用的是全局的均值和標(biāo)準(zhǔn)差,所以在處理模態(tài)方差顯著不同的多模態(tài)數(shù)據(jù)時(shí),達(dá)不到消除多模態(tài)特征的目的。為了降低多模態(tài)結(jié)構(gòu)對(duì)故障檢測(cè)結(jié)果的影響,可以使用樣本所在模態(tài)的均值和標(biāo)準(zhǔn)差進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化,但實(shí)際中很難確定數(shù)據(jù)集的模態(tài)信息,故文獻(xiàn)[12-13]提出了局部近鄰標(biāo)準(zhǔn)化的方法。
LNS方法首先確定原始數(shù)據(jù)訓(xùn)練集X中每個(gè)樣本Xi的K近鄰集n(Xi);接下來(lái)計(jì)算此近鄰集的均值m(n(Xi))和標(biāo)準(zhǔn)差s(n(Xi));最后應(yīng)用式(7)對(duì)樣本Xi進(jìn)行局部近鄰標(biāo)準(zhǔn)化處理。
(7)
LNS方法在消除多模態(tài)數(shù)據(jù)中心差異的同時(shí)可以將數(shù)據(jù)處理為近似服從單模態(tài)多元高斯分布,這為后續(xù)的數(shù)據(jù)分析奠定了良好的基礎(chǔ)。
為了提高DPCA方法對(duì)多模態(tài)、動(dòng)態(tài)性過(guò)程的監(jiān)控能力,本文提出一種LNS和DPCA相結(jié)合的故障檢測(cè)方法LNS-DPCA,主要包含兩個(gè)階段:模型建立和在線檢測(cè)。
1)在訓(xùn)練集X中,查找每個(gè)樣本Xi的K近鄰集n(Xi),同時(shí)應(yīng)用式(7)進(jìn)行標(biāo)準(zhǔn)化處理;
2)在已標(biāo)準(zhǔn)化數(shù)據(jù)集X中,應(yīng)用式(1)確定增廣矩陣X(l);
3)應(yīng)用式(2)將X(l)分解為主元子空間和殘差子空間,并根據(jù)式(3)、(4)計(jì)算T2和SPE統(tǒng)計(jì)值;
對(duì)于一個(gè)測(cè)試樣本X*:
1)在訓(xùn)練集X中,查找X*的K近鄰集n(X*),同時(shí)應(yīng)用式(7)進(jìn)行標(biāo)準(zhǔn)化處理;
2)應(yīng)用式(1)確定X*增廣向量X*(l);
本章引用文獻(xiàn)[9]中一個(gè)具有動(dòng)態(tài)特性的數(shù)值例子對(duì)本文方法進(jìn)行分析,同時(shí)與相關(guān)傳統(tǒng)方法進(jìn)行比較,以驗(yàn)證本文方法的有效性。主要模型如下:
(8)
(9)
其中:u(k)為相關(guān)變量;o(k)為均值為0、方差為0.1的隨機(jī)噪聲;w(k)為引入的隨機(jī)噪聲。本例中通過(guò)上述模型產(chǎn)生兩個(gè)模態(tài)數(shù)據(jù),其中模態(tài)1的w(k)服從均值為[0,0]、方差為[1,1]的二元高斯分布;模態(tài)2的w(k)服從均值為[5,5]、方差為[6,6]的二元高斯分布。在本例中,兩個(gè)模態(tài)各有1 000個(gè)訓(xùn)練樣本用于模型建立,同時(shí)只有變量u和y用于過(guò)程監(jiān)視。故障共有兩類:故障1按模態(tài)1運(yùn)行,從第500時(shí)刻起將w1設(shè)置為5;故障2按模態(tài)2運(yùn)行,從第500時(shí)刻起將w1設(shè)置為-5。
本例中分別使用PCA、DPCA、KNN、LNS-DPCA進(jìn)行故障檢測(cè)。根據(jù)累計(jì)貢獻(xiàn)率方法[14],確定PCA中主元數(shù)為2,DPCA和LNS-DPCA中主元數(shù)為7;由交叉驗(yàn)證方法[15],確定DPCA和LNS-DPCA中l(wèi)為2;通過(guò)尋優(yōu)測(cè)試,確定KNN中近鄰K為3,LNS-DPCA中局部近鄰K為30。以上方法均采用99%控制限對(duì)過(guò)程進(jìn)行監(jiān)控。
本例四種方法檢測(cè)如圖1~4所示。本實(shí)例數(shù)據(jù)為兩個(gè)模態(tài)數(shù)據(jù),不滿足PCA中統(tǒng)計(jì)量T2和SPE的數(shù)據(jù)分布假設(shè),因此檢測(cè)率較低,如圖1。圖5為訓(xùn)練樣本與故障1的前兩個(gè)主元散點(diǎn)圖,其中,PC表示主元。由圖5(a)可以看出,在經(jīng)過(guò)Z-score標(biāo)準(zhǔn)化處理后,DPCA得分在主元空間仍然具有多模態(tài)結(jié)構(gòu),這會(huì)影響傳統(tǒng)DPCA的故障檢測(cè)性能,因此如圖2所示,DPCA在本例中的故障檢測(cè)率較低。圖3給出了KNN方法的檢測(cè)結(jié)果,可以看出在KNN方法中兩個(gè)正常模態(tài)樣本D2統(tǒng)計(jì)值差異明顯,統(tǒng)計(jì)量控制限完全由模態(tài)2決定,湮滅了模態(tài)1的數(shù)據(jù)特征,因此KNN方法對(duì)于本例來(lái)說(shuō)故障檢測(cè)率也不高。LNS-DPCA故障檢測(cè)率遠(yuǎn)高于對(duì)比方法,與KNN算法相比,故障檢測(cè)率提升了約70個(gè)百分點(diǎn)。由圖4和圖5(b)可知,LNS-DPCA的控制限由兩個(gè)模態(tài)共同決定。本質(zhì)上來(lái)說(shuō),LNS-DPCA具有較高故障檢測(cè)率的原因是采用LNS方法消除了數(shù)據(jù)的多中心結(jié)構(gòu)和模態(tài)方差差異較大的影響,將多模態(tài)數(shù)據(jù)轉(zhuǎn)換為近似服從單一模態(tài)高斯分布數(shù)據(jù),提高了DPCA對(duì)多模態(tài)、動(dòng)態(tài)過(guò)程的故障檢測(cè)性能。
圖1 PCA檢測(cè)結(jié)果(數(shù)值模擬實(shí)例)
圖2 DPCA檢測(cè)結(jié)果(數(shù)值模擬實(shí)例)
圖3 KNN檢測(cè)結(jié)果(數(shù)值模擬實(shí)例)
圖4 LNS-DPCA檢測(cè)結(jié)果(數(shù)值模擬實(shí)例)
圖5 訓(xùn)練樣本與故障1的前兩個(gè)主元散點(diǎn)圖
青霉素發(fā)酵過(guò)程是具有非線性、動(dòng)態(tài)性、時(shí)序性的多階段間歇工業(yè)過(guò)程,已經(jīng)在故障檢測(cè)與診斷領(lǐng)域被重點(diǎn)研究[16]。本章應(yīng)用Pensim軟件模擬生成訓(xùn)練數(shù)據(jù)和故障數(shù)據(jù)。此軟件產(chǎn)生的青霉素?cái)?shù)據(jù)共有17個(gè)變量,如表1。Pensim仿真平臺(tái)可以在通風(fēng)率、攪拌功率和底物流加速率上設(shè)置故障,故障擾動(dòng)的類型有斜坡和階躍兩種,并可進(jìn)一步設(shè)定兩種擾動(dòng)的幅度、擾動(dòng)的引入時(shí)間和終止時(shí)間[17-18]。
建模過(guò)程中監(jiān)測(cè)12個(gè)主要變量,分別是:通風(fēng)率、攪拌功率、底物流加速率、底物流溫度、底物濃度、溶解氧濃度、菌體濃度、青霉素濃度、二氧化碳濃度、pH 值、反應(yīng)器溫度、反應(yīng)熱。設(shè)定發(fā)酵時(shí)間為400 h,每隔0.5 h進(jìn)行采樣。在正常工況下使用系統(tǒng)默認(rèn)參數(shù)生成1個(gè)批次作為訓(xùn)練樣本進(jìn)行建模。為驗(yàn)證本文方法有效性,在系統(tǒng)正常運(yùn)行時(shí)引入兩種不同類型故障,見(jiàn)圖6。其中:故障1為在30~200 h,在變量通風(fēng)率上引入0.2%的階躍故障;故障2為在100~400 h,在變量底物流加速率引入幅度為0.01(單位為l/h)的斜坡故障。
表1 變量名稱
本例中分別使用PCA、DPCA、KNN、LNS-DPCA進(jìn)行故障檢測(cè)。根據(jù)累計(jì)貢獻(xiàn)率方法, PCA中主元數(shù)確定為2,DPCA和LNS-DPCA中主元數(shù)為7;由交叉驗(yàn)證方法,DPCA和LNS-DPCA中l(wèi)為2;通過(guò)尋優(yōu)測(cè)試,KNN中近鄰K為3,LNS-DPCA中局部近鄰K為10。以上方法均采用99%控制限對(duì)過(guò)程進(jìn)行監(jiān)控。
圖6 故障散點(diǎn)圖
由圖7可以看出,LNS方法可以將多模態(tài)數(shù)據(jù)轉(zhuǎn)化為單模態(tài)數(shù)據(jù)。由于PCA是一種線性建模方法且只適合單模態(tài)故障檢測(cè),而青霉素?cái)?shù)據(jù)具有的多階段特性不滿足PCA中統(tǒng)計(jì)量T2和SPE的單模態(tài)高斯分布的假設(shè),故檢測(cè)率最低,見(jiàn)圖8。DPCA雖然能夠捕獲樣本的自相關(guān)性,但不能消除數(shù)據(jù)的多模態(tài)結(jié)構(gòu),因此在本例中的故障檢測(cè)率較低。在模態(tài)過(guò)渡時(shí)變量間的相關(guān)關(guān)系不同,歷時(shí)也不相同,這種不穩(wěn)定性影響了最終檢測(cè)結(jié)果。從圖9(b)可知,SPE檢測(cè)圖從第1 500個(gè)樣本開(kāi)始檢測(cè)到故障,比故障發(fā)生約延遲了250 h,這種延遲是由于溶解氧濃度、反應(yīng)器體積和冷水流量對(duì)葡萄糖基質(zhì)進(jìn)料速率的影響,從而導(dǎo)致其緩慢傳播。由圖10所示的KNN方法檢測(cè)結(jié)果可知,控制限由前100個(gè)樣本決定,對(duì)于密集模態(tài)的小尺度故障檢測(cè)困難,并且圖10(b)顯示故障2的檢測(cè)也具有延時(shí)性,延時(shí)約200 h,故KNN的故障檢測(cè)率也較低。由圖7(b)可知,樣本經(jīng)過(guò)LNS處理后已成為近似服從高斯分布的單模態(tài)結(jié)構(gòu),為DPCA的檢測(cè)奠定了基礎(chǔ),并且對(duì)于故障2的檢測(cè)沒(méi)有延遲,檢測(cè)效果表現(xiàn)最優(yōu),如圖11,表現(xiàn)出比對(duì)比方法更好的性能,進(jìn)一步驗(yàn)證了本文方法的有效性。
圖7 變量矩陣圖
圖8 PCA檢測(cè)結(jié)果(工業(yè)模擬實(shí)例)
圖9 DPCA檢測(cè)結(jié)果(工業(yè)模擬實(shí)例)
本文針對(duì)工業(yè)過(guò)程的多模態(tài)和動(dòng)態(tài)特征提出了LNS和DPCA相結(jié)合的方法。首先使用局部近鄰集的信息對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,有效消除數(shù)據(jù)多中心和方差差異顯著的影響;再結(jié)合DPCA消除不同時(shí)刻樣本的相關(guān)性,使得LNS-DPCA具有較高的故障檢測(cè)率。
本文方法中的近鄰數(shù)K是根據(jù)多次實(shí)驗(yàn)尋優(yōu)測(cè)試確定的,因此K的確定方法是接下來(lái)的研究方向。
圖10 KNN檢測(cè)結(jié)果(工業(yè)模擬實(shí)例)
圖11 LNS-DPCA檢測(cè)結(jié)果(工業(yè)模擬實(shí)例)