孔祥玉 陳雅琳 羅家宇 周紅平 葉興泰
(火箭軍工程大學(xué) 導(dǎo)彈工程學(xué)院,陜西 西安 710025)
現(xiàn)代工業(yè)生產(chǎn)過程是一個(gè)相對(duì)復(fù)雜的過程,且隨著現(xiàn)代工業(yè)設(shè)備發(fā)展趨于集成化、復(fù)雜化,大量的傳感器被布置到各個(gè)關(guān)鍵節(jié)點(diǎn)以采集大量的過程信息。如何從海量的數(shù)據(jù)中分析過程的變化并提取特征,成為新的研究熱點(diǎn)之一。相較于傳統(tǒng)的基于物理模型的方法,基于數(shù)據(jù)驅(qū)動(dòng)的多元統(tǒng)計(jì)過程監(jiān)測(cè)(MSPM)方法[1-3]不需要知道詳細(xì)的機(jī)理知識(shí),已被廣泛應(yīng)用于大型設(shè)備的健康狀態(tài)監(jiān)測(cè)。多變量統(tǒng)計(jì)過程監(jiān)測(cè)方法通過從過程數(shù)據(jù)中提取關(guān)鍵數(shù)據(jù)或關(guān)鍵信息來構(gòu)建高效的過程監(jiān)測(cè)模型。常用的方法包括主成分分析(PCA)、偏最小二乘(PLS)分析、獨(dú)立成分分析(ICA)[4-6]。
在上述方法中,基于偏最小二乘的分析方法被用于對(duì)關(guān)鍵性能指標(biāo)的有效監(jiān)測(cè),通過構(gòu)建因變量Y對(duì)自變量X的回歸模型,提取X的潛變量t和Y的潛變量u之間的協(xié)方差信息,同時(shí)解決了自變量之間的多重相關(guān)問題。為構(gòu)造PLS合理的統(tǒng)計(jì)指標(biāo),Zhou等[7]提出了全潛結(jié)構(gòu)投影(TPLS)算法,將X進(jìn)一步分解到4個(gè)子空間,并在對(duì)應(yīng)子空間分別構(gòu)造統(tǒng)計(jì)量進(jìn)行過程監(jiān)測(cè)。然而,Qin等[8]考慮了TPLS分解的子空間過多、存在冗余的情況,提出了并行潛結(jié)構(gòu)投影(CPLS)算法,有效地簡(jiǎn)化了TPLS模型。由于基于傳統(tǒng)PLS斜交分解[9]得到的空間擴(kuò)展方法,在質(zhì)量相關(guān)子空間中存在對(duì)預(yù)測(cè)質(zhì)量無用的信息,易引發(fā)誤報(bào)警。針對(duì)該問題,Yin等[10]提出了改進(jìn)的潛結(jié)構(gòu)投影(MPLS)算法,通過對(duì)X進(jìn)行正交分解得到預(yù)測(cè)關(guān)鍵性能指標(biāo)的質(zhì)量相關(guān)子空間。
上述算法在過程監(jiān)控中有較好的故障檢測(cè)效果,但在具有單一動(dòng)態(tài)、非線性的系統(tǒng)或兩種特性同時(shí)存在的工業(yè)系統(tǒng),利用上述算法進(jìn)行故障檢測(cè)時(shí),往往會(huì)導(dǎo)致監(jiān)測(cè)結(jié)果不可靠,如出現(xiàn)誤報(bào)率過高等問題。針對(duì)上述問題,專家學(xué)者們提出了許多的解決思路。但在動(dòng)態(tài)工業(yè)過程中,傳感器采集的過程數(shù)據(jù)往往受歷史時(shí)刻樣本的影響,不能有效地反映當(dāng)前時(shí)刻的變化。近幾年,增廣數(shù)據(jù)矩陣因操作簡(jiǎn)單受到了廣泛的關(guān)注。Ku等[11]基于增廣數(shù)據(jù)矩陣,將普通主成分分析擴(kuò)展為動(dòng)態(tài)主成分分析。但基于增廣數(shù)據(jù)矩陣的動(dòng)態(tài)分析方法存在以下缺點(diǎn):①模型僅關(guān)注方差信息,導(dǎo)致動(dòng)態(tài)關(guān)系的可解釋性差;②隨著滯后次數(shù)的增加,加載矢量的維數(shù)和參數(shù)的數(shù)量急劇增加,增大了計(jì)算復(fù)雜度。為了提高模型對(duì)數(shù)據(jù)動(dòng)態(tài)關(guān)系的描述,Li等[12]提出了一種利用動(dòng)態(tài)潛在變量模型(DLV)的方法,通過建立向量自回歸(VAR)動(dòng)態(tài)模型來表征潛在變量?jī)?nèi)部的自相關(guān)關(guān)系,使動(dòng)態(tài)模型具有更加清晰的數(shù)學(xué)描述。受DLV思想的啟發(fā),Li等[13]提出了結(jié)構(gòu)化動(dòng)態(tài)PCA算法,可以從原始的數(shù)據(jù)空間中提取DLV,在提高動(dòng)態(tài)特征提取能力的同時(shí),保持了動(dòng)態(tài)模型的空間結(jié)構(gòu)。之后,Dong等[14]提出了一種新的動(dòng)態(tài)主成分分析算法(DiPCA),該算法可以準(zhǔn)確地提取一組動(dòng)態(tài)潛在變量,以捕獲數(shù)據(jù)中動(dòng)態(tài)變化最明顯的部分,保證了外部模型的輸出,也給出了動(dòng)態(tài)潛在結(jié)構(gòu)的顯式表達(dá)。
在復(fù)雜的工業(yè)系統(tǒng)中,除動(dòng)態(tài)特性外,過程數(shù)據(jù)通常也呈非線性變化。為了將PLS應(yīng)用到非線性過程,人們提出了一系列基于PLS的非線性算法。如Wold等[15]通過使用多項(xiàng)式進(jìn)行非線性映射來改進(jìn)PLS的內(nèi)部模型;Rosipal等[16]提出了基于核函數(shù)的核偏最小二乘(KPLS)分析算法。由于基于核函數(shù)的方法避免了計(jì)算具體的非線性映射,易于理解,具有較強(qiáng)的泛化能力,能很好地解決其他方法的過擬合和欠擬合問題,因此在非線性過程中基于核函數(shù)的擴(kuò)展算法成為了主流方法,如全核PLS(TKPLS)算法[17]、向核PLS(MKPLS)算法[18]、并發(fā)核潛結(jié)構(gòu)(CKPLS)算法[19]、定向核PLS(DKPLS)算法[20]均在故障檢測(cè)方面取得了廣泛的應(yīng)用。
上述方法雖然在動(dòng)態(tài)過程和非線性過程的故障檢測(cè)中分別得到了大量的研究和發(fā)展,但不能有效應(yīng)用于動(dòng)態(tài)、非線性單獨(dú)存在的工業(yè)過程或兩種特性同時(shí)存在的多特性混合過程。針對(duì)該問題,本文提出了一種基于偏最小二乘的多特征提取算法(MFPLS)。該算法首先針對(duì)不同特性建立模型并提取特征,將原始的數(shù)據(jù)空間分解成4個(gè)子空間(動(dòng)態(tài)子空間、線性子空間、非線性子空間以及殘差子空間),然后針對(duì)不同空間構(gòu)造統(tǒng)計(jì)量以實(shí)現(xiàn)復(fù)雜過程多特征的過程監(jiān)測(cè)。最后以田納西-伊斯曼(TE)過程為實(shí)例,分析了本文所提出的算法的性能。
線性PLS有效解決了自變量之間的多重相關(guān)問題,但利用線性模型來解決非線性問題時(shí),會(huì)引入對(duì)回歸沒有幫助的噪聲,從而降低模型的泛化能力。針對(duì)該問題,核偏最小二乘被提出。設(shè)輸入數(shù)據(jù)、輸出數(shù)據(jù)分別為
X=[x0,x1,…,xm-1]T∈Rn×m
(1)
Y=[y0,y1,…,yp-1]T∈Rn×p
(2)
在動(dòng)態(tài)過程中,當(dāng)前時(shí)刻樣本受歷史樣本序列的影響呈動(dòng)態(tài)變化。為了更加清晰地描述動(dòng)態(tài)過程中PLS內(nèi)外模型的關(guān)系,Dong等[23]提出了DiPLS算法,通過建立X的內(nèi)在潛變量ti=Xwi與Y的內(nèi)在潛變量ui=Yci之間的動(dòng)態(tài)模型來表示動(dòng)態(tài)關(guān)系(wi和ci為權(quán)重向量),具體公式如下:
uk=β0tk+β1tk-1+…+βstk-s+rk
(3)
其中,tk、uk分別為當(dāng)前時(shí)刻k的輸入、輸出得分,rk為殘差,s為動(dòng)態(tài)系統(tǒng)的階次,βi為輸入得分的權(quán)重系數(shù)。則潛變量關(guān)系的預(yù)測(cè)模型可以表示為
(4)
其中,β=(β0,β1,…,βs)T,β?w為克羅內(nèi)克積。
(5)
針對(duì)動(dòng)態(tài)、非線性特性單獨(dú)存在或兩種特性同時(shí)存在的混合系統(tǒng)的質(zhì)量相關(guān)故障檢測(cè)問題,本文提出了基于偏最小二乘的多特征提取算法MFPLS。
為了提升模型的收斂速度和精度以及消除單位差異帶來的影響,需要先將獲取的原始輸入Xxun、輸出Yxun歸一化預(yù)處理為均值為0、方差為1的數(shù)據(jù)矩陣X、Y。隨后將數(shù)據(jù)矩陣X、Y分別擴(kuò)充為以下矩陣:
Xi=[xi,xi+1,…,xi+N]T∈R(n-s+1)×m
(6)
Zs=[Xs,Xs-1,…,X0]∈R(n-s+1)×sm
(7)
Ys=[ys,ys+1,…,ys+N]T∈R(n-s+1)×p
(8)
式中:Xi為第i個(gè)數(shù)據(jù)矩陣(i=0,1,…,s),即將數(shù)據(jù)矩陣X分成了s+1塊;Zs表示將每個(gè)數(shù)據(jù)塊Xi儲(chǔ)存起來,不改變樣本數(shù)只增加變量數(shù),此時(shí)的Zs作為新的增廣輸入矩陣;Ys表示將數(shù)據(jù)的維度增大到和Zs一致,此時(shí)的Ys作為新的增廣輸出矩陣。
結(jié)合式(6)-(8),動(dòng)態(tài)內(nèi)模型的目標(biāo)函數(shù)(式(5))可以被重新描述為
(9)
其中,c、w為權(quán)重矩陣。然后使用拉格朗日乘子法優(yōu)化該目標(biāo)函數(shù)。DiPLS外部模型建模使用的迭代算法步驟如下:
(1)初始化β=(1,0,…,0),us為Ys的任一列;
(3)計(jì)算X的得分向量ti=Xiw;
(5)計(jì)算Y的得分向量us=Ysq;
(7)返回步驟(2),直到ti收斂。
由于輸入X的得分矩陣T=[t1t2…tA]無法直接從X計(jì)算得到,故引入權(quán)重矩陣R∈Rm×A(A為主元個(gè)數(shù)):
R=W(PTW)-1
(10)
其中,W=(w1,w2,…,wA),P=(p1,p2,…,pA)。
(11)
(12)
(13)
此時(shí)的輸入輸出預(yù)測(cè)殘差為
(14)
上述動(dòng)態(tài)模型提取了動(dòng)態(tài)分量,但在動(dòng)態(tài)輸入殘差Ed中仍會(huì)存在線性變化的分量和自協(xié)方差信息,需要對(duì)Ed進(jìn)行線性PLS的分解。此時(shí),將DiPLS的殘差Ed∈R(n-s+1)×m、Yd∈R(n-s+1)×p作為線性部分的輸入和輸出矩陣。線性PLS的迭代步驟如下:
(1)取Yd的任一列并記為ud;
(3)計(jì)算Ed的得分向量tg并歸一化,即tg=Edwg;
(6)計(jì)算Yd的得分向量ug并歸一化,即ug=Ydqg;
(7)返回步驟(2),直到tg收斂。
由于輸入Ed的得分矩陣Tg=[tg1,tg2,…,tgA]無法直接從Ed計(jì)算得到,故引入權(quán)重矩陣Rg:
(15)
其中,Wg=(wg1,wg1,…,wgA),Pg=(pg1,pg1,…,pgA)。此時(shí),Ed、Yd被分解為
(16)
其中,Tg、Pg分別為輸入Ed的得分矩陣和負(fù)載矩陣,Qg為輸出Yg的負(fù)載矩陣,Eg、Yg分別為Ed、Yd的線性殘差。
農(nóng)產(chǎn)品的類別特別多,然而當(dāng)前國(guó)內(nèi)對(duì)于農(nóng)產(chǎn)品缺乏詳細(xì)地標(biāo)準(zhǔn),無論哪一種食品均存在好壞的差別,然而在農(nóng)產(chǎn)品市場(chǎng)上并未結(jié)合具體情況制定相關(guān)的標(biāo)準(zhǔn),這便較易導(dǎo)致交易雙方在認(rèn)知上存在一定地偏差。很多農(nóng)產(chǎn)品在流入市場(chǎng)以前,在品質(zhì)與售價(jià)方面均是不規(guī)范的,顧客在選購產(chǎn)品時(shí),也無法分辨產(chǎn)品的好壞,為此,會(huì)偏向于選購部分有明確標(biāo)準(zhǔn)的進(jìn)口農(nóng)產(chǎn)品,這對(duì)于國(guó)內(nèi)農(nóng)業(yè)的發(fā)展是非常不利的。
上述線性模型提取了線性分量,但在線性殘差Eg中仍然存在非線性信息。因此,需要對(duì)Eg進(jìn)行非線性PLS分解。殘差Eg的非線性映射為
Eg∈R(n-s+1)×m→Φ(Eg)∈Γ(n-s+1)×(n-s+1)
(17)
將經(jīng)過非線性映射函數(shù)得到的高維數(shù)據(jù)記為K,為了消除高維特征空間Γ中的均值效應(yīng),需要對(duì)數(shù)據(jù)進(jìn)行中心化預(yù)處理,即
(18)
其中,K1為中心化預(yù)處理后得到的數(shù)據(jù),nr為輸入Eg的列數(shù),K=Kraw為殘差Eg通過核函數(shù)得到的直接映射矩陣,Ir為n-s+1維的單位矩陣。KPLS非線性回歸建模的步驟如下:
(1)輸入Eg,隨機(jī)初始化輸出ur;
(2)對(duì)數(shù)據(jù)進(jìn)行非線性映射并中心化處理為K1;
(3)計(jì)算得分向量tr并歸一化,即tr=K1ur;
(5)計(jì)算Yg的得分向量并進(jìn)行歸一化處理,即ur=Ygqr;
(6)返回步驟(2),直到ur收斂;
此時(shí),得到的KPLS模型為
(19)
本文提出的MFPLS算法需要先對(duì)原始的數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理,然后按如下步驟分別提取不同的特征:①對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行動(dòng)態(tài)內(nèi)PLS處理;②將DiPLS處理后的動(dòng)態(tài)殘差進(jìn)行線性PLS處理;③將PLS處理后的線性殘差進(jìn)行KPLS處理。該算法既充分考慮了多特性混合系統(tǒng)的動(dòng)態(tài)、非線性和線性性能,也考慮了上述特性單獨(dú)存在的系統(tǒng),并在動(dòng)態(tài)殘差空間進(jìn)行多次分解,得到僅含噪聲的殘差子空間。MFPLS算法的原理圖如圖1所示。
圖1 MFPLS算法的原理圖Fig.1 Schematic diagram of MFPLS algorithm
這樣可以得到原始數(shù)據(jù)Xxun被完全分解的情況,即
(20)
也就是原始的數(shù)據(jù)空間被分解成4個(gè)子空間,它們分別是動(dòng)態(tài)子空間SD、線性子空間SG、非線性子空間SR和殘差子空間SS。PLS分解的子空間是斜交的,其中動(dòng)態(tài)、線性和非線性子空間是質(zhì)量相關(guān)的子空間,殘差子空間是質(zhì)量無關(guān)的子空間。
故障檢測(cè)中常用平方預(yù)測(cè)誤差(SPE)統(tǒng)計(jì)量(又稱Q統(tǒng)計(jì)量)來監(jiān)測(cè)殘差空間,用HotellingT2統(tǒng)計(jì)量來監(jiān)測(cè)質(zhì)量相關(guān)子空間,即用SPE統(tǒng)計(jì)量來監(jiān)測(cè)質(zhì)量無關(guān)的故障,用T2統(tǒng)計(jì)量來監(jiān)測(cè)質(zhì)量相關(guān)的故障,具體的公式為T2=tTΛ-1t和Q=eTe。對(duì)于核PLS算法,Q統(tǒng)計(jì)量的計(jì)算公式如下:
(21)
(22)
統(tǒng)計(jì)量的控制限為
(23)
(24)
當(dāng)給出新的測(cè)試集輸入Xce和輸出Yce時(shí),標(biāo)準(zhǔn)化處理和數(shù)據(jù)擴(kuò)充即能得到輸入Xnew和輸出Ynew。
最后計(jì)算總的殘差統(tǒng)計(jì)量:
(25)
(26)
MFPLS算法進(jìn)行故障檢測(cè)的主要步驟如下:①對(duì)直接獲取的訓(xùn)練集Xxun和Yxun按照適合的方式進(jìn)行預(yù)處理,并建立數(shù)學(xué)模型,計(jì)算各自的控制限;②利用訓(xùn)練后的模型計(jì)算測(cè)試數(shù)據(jù)的統(tǒng)計(jì)量;③比較新統(tǒng)計(jì)量與訓(xùn)練集的控制限,以判斷故障是否發(fā)生。
20世紀(jì)90年代,美國(guó)Eastman公司開發(fā)的化工模型仿真平臺(tái)TE過程是一個(gè)典型的非線性、開環(huán)不穩(wěn)定的復(fù)雜過程,包含快速和緩慢的動(dòng)態(tài)混合特性,主要由反應(yīng)器、冷凝器、氣液分離器、循環(huán)壓縮器和汽提器5部分動(dòng)態(tài)模型組成,被廣泛應(yīng)用于多特性復(fù)雜過程的故障檢測(cè)與故障診斷驗(yàn)證[25-26]。為了保護(hù)該過程的知識(shí)產(chǎn)權(quán),Downs等[27]沒有發(fā)布有關(guān)該過程的詳細(xì)組件,并對(duì)該過程中的工藝和操作條件等進(jìn)行了修改。
TE過程中的訓(xùn)練集樣本是在25 h仿真運(yùn)行下獲取的,觀測(cè)數(shù)據(jù)總數(shù)為500;測(cè)試集樣本是在48 h仿真運(yùn)行下獲取的,觀測(cè)數(shù)據(jù)總數(shù)為960。不同的訓(xùn)練集、測(cè)試集樣本分別代表不同的故障類型。TE過程主要包括41個(gè)測(cè)試變量XMEAS(1-41)和12個(gè)控制變量XMV(1-12),正常數(shù)據(jù)集作為訓(xùn)練樣本,160個(gè)正常樣本和800個(gè)故障樣本組成的數(shù)據(jù)集作為測(cè)試樣本。故障又分為質(zhì)量無關(guān)與質(zhì)量相關(guān)的故障。關(guān)于TE過程的變量含義、故障類型的詳細(xì)描述可參看文獻(xiàn)[27-29]。
MFPLS中主元個(gè)數(shù)由交叉驗(yàn)證或平均特征值法確定,針對(duì)不同的質(zhì)量相關(guān)故障,主元個(gè)數(shù)有所不同,3個(gè)子空間的主元數(shù)分別為Ad=7,Ag=6,Ar=5。采用粒子群優(yōu)化算法確定窗長(zhǎng)q為3,核函數(shù)比例系數(shù)σ為300。
本文選取的輸入變量X為22個(gè)過程變量XMEAS(1-22)和11個(gè)控制變量XMV(1-11);質(zhì)量輸出變量為過程變量XMEAS(35)。選取的對(duì)比對(duì)象是動(dòng)態(tài)總PLS(DTPLS)[12]和TKPLS。DTPLS算法將數(shù)據(jù)X的空間分解為質(zhì)量相關(guān)的動(dòng)態(tài)空間SD、質(zhì)量無關(guān)的動(dòng)態(tài)空間SWD、質(zhì)量無關(guān)的靜態(tài)空間SWG和殘差空間SDT。TKPLS算法將數(shù)據(jù)X的空間分解為負(fù)責(zé)預(yù)測(cè)輸出Y的非線性空間SR、與輸出Y正交的非線性空間SZ、殘差中包含較大差異的線性空間SG和僅含噪聲的線性殘差空間STK。主元個(gè)數(shù)通過交叉驗(yàn)證分別得到ADT=4,ATK=8。
TE過程用于建模的訓(xùn)練集Xxun包含500個(gè)正常的樣本,用于在線檢測(cè)的測(cè)試集Xce包含160個(gè)正常樣本和800個(gè)故障樣本,即測(cè)試集Xce中從第161個(gè)樣本開始就是故障樣本。一般來說,某種算法先檢測(cè)到故障,就表明該算法有較快的故障檢測(cè)速度。故在本實(shí)驗(yàn)中,采用故障檢測(cè)時(shí)刻來展示不同算法進(jìn)行故障檢測(cè)的優(yōu)劣性,具體的結(jié)果如表1所示,表中*表示3種算法在TE過程中能快速檢測(cè)到故障的最優(yōu)時(shí)刻,^表示DTPLS和MFPLS對(duì)動(dòng)態(tài)特性的檢測(cè)效果的最優(yōu)值,#表示TKPLS和MFPLS對(duì)非線性特性的檢測(cè)效果的最優(yōu)值。
表1 3種算法的故障檢測(cè)時(shí)刻對(duì)比Table 1 Comparison of fault detection time of three algorithms
由于MFPLS算法采用粒子群優(yōu)化算法確定的窗長(zhǎng)q為3,結(jié)合動(dòng)態(tài)PLS的矩陣擴(kuò)充方式,此時(shí)故障發(fā)生的樣本數(shù)變?yōu)?61-q+1=159。故對(duì)于MFPLS和DTPLS算法,測(cè)試集Xce中從第159個(gè)樣本開始為故障樣本;對(duì)于TKPLS算法,測(cè)試集Xce中從第161個(gè)樣本開始為故障樣本。經(jīng)過統(tǒng)計(jì)得知,對(duì)于故障IDV(1-15),DTPLS的質(zhì)量空間能快速監(jiān)測(cè)到故障數(shù)為18,TKPLS能快速監(jiān)測(cè)到故障數(shù)為10,MFPLS能快速監(jiān)測(cè)到故障數(shù)為19。相較于TKPLS算法,使用動(dòng)態(tài)類PLS算法能快速地捕獲到故障的發(fā)生,且MFPLS算法捕捉故障發(fā)生的能力優(yōu)于DTPLS算法。將MFPLS的動(dòng)態(tài)子空間與DTPLS的質(zhì)量相關(guān)的動(dòng)態(tài)子空間的故障檢測(cè)時(shí)刻進(jìn)行對(duì)比,可以知道DTPLS算法能較好地監(jiān)測(cè)到故障的發(fā)生。將MFPLS的非線性子空間與TKPLS的負(fù)責(zé)預(yù)測(cè)輸出的非線性子空間的故障檢測(cè)時(shí)刻進(jìn)行對(duì)比,可以明顯看出,TKPLS能較快檢測(cè)到故障IDV(4-7,9,12-14)的發(fā)生,而除了呈階躍變化的微小故障IDV(3)外,MFPLS可以快速地監(jiān)測(cè)到非線性子空間發(fā)生的所有異常。故障2是呈階躍變化的濃度故障,TKPLS、DTPLS、MFPLS算法對(duì)故障2的監(jiān)測(cè)效果和故障發(fā)生時(shí)刻的放大圖展示如圖2所示。由圖中可知:MFPLS的動(dòng)態(tài)子空間在第173個(gè)樣本檢測(cè)到故障的發(fā)生,DTPLS則在第180個(gè)樣本檢測(cè)到故障的發(fā)生;MFPLS的非線性子空間在第160個(gè)樣本檢測(cè)到故障的發(fā)生,DTPLS則在第191個(gè)樣本檢測(cè)到故障的發(fā)生。
圖2 3種算法的故障檢測(cè)時(shí)刻結(jié)果Fig.2 Fault detection time results of three algorithms
綜上所述,DTPLS算法對(duì)動(dòng)態(tài)特性有較好的故障檢測(cè)效果,MFPLS算法對(duì)動(dòng)態(tài)子空間也有良好的故障檢測(cè)效果。特別是,將數(shù)據(jù)空間經(jīng)過DiPLS算法去除動(dòng)態(tài)特性后,MFPLS算法能在線性和非線性子空間較迅速地監(jiān)測(cè)到故障的發(fā)生,說明了本文所提算法MFPLS對(duì)動(dòng)態(tài)、線性和非線性混合的系統(tǒng)能快速地捕獲到故障的發(fā)生,有較好的故障檢測(cè)效果。
本文采用有效檢測(cè)率(FDR,RFD)和故障誤報(bào)警率(FAR,RFA)[9,30-31]進(jìn)行故障檢測(cè)效果的驗(yàn)證。設(shè)Near為有效報(bào)警數(shù),Nfpr為誤報(bào)警數(shù),Nfsn為故障樣本數(shù)目,則
(27)
(28)
其中,F(xiàn)DR用于反映質(zhì)量相關(guān)故障的檢測(cè)情況,F(xiàn)AR用于反映質(zhì)量無關(guān)故障導(dǎo)致的誤報(bào)警情況。
DTPLS、TKPLS和MFPLS對(duì)質(zhì)量相關(guān)故障的檢測(cè)結(jié)果如表2所示。由表中可以發(fā)現(xiàn):在監(jiān)測(cè)故障IDV(1,2,6-8,12,13)時(shí),MFPLS算法的有效報(bào)警率有較大的提高;對(duì)于非線性特征,MFPLS在進(jìn)行IDV(1,2,6,7,14)故障檢測(cè)時(shí)的故障檢測(cè)率達(dá)到99%及以上,對(duì)IDV(8,12,13)的故障檢測(cè)率達(dá)到95%及以上,TKPLS對(duì)IDV(10)的故障檢測(cè)率優(yōu)于MFPLS;對(duì)于動(dòng)態(tài)特征,MFPLS在進(jìn)行IDV(1,6,14)故障檢測(cè)時(shí)的故障檢測(cè)率達(dá)到98%及以上,對(duì)IDV(2,13)的故障檢測(cè)率達(dá)到90%及以上,DTPLS對(duì)微小故障IDV(5)的檢測(cè)率優(yōu)于MFPLS;相較于DTPLS的動(dòng)態(tài)監(jiān)測(cè)效果,MFPLS的動(dòng)態(tài)監(jiān)測(cè)效果均有明顯的提高。
表2 3種算法的質(zhì)量相關(guān)故障報(bào)警率Table 2 Quality related fault alarm rates of three algorithms
故障8是隨機(jī)變化的供料濃度故障,TKPLS、DTPLS、MFPLS算法對(duì)故障8的監(jiān)測(cè)效果和局部放大圖如圖3所示。由圖中可以發(fā)現(xiàn):對(duì)于動(dòng)態(tài)特性,相較于DTPLS,MFPLS的統(tǒng)計(jì)量能監(jiān)測(cè)到較多的故障信號(hào),故障檢測(cè)率提高了將近20%,而DTPLS對(duì)故障樣本會(huì)有較多的誤報(bào)警情況;對(duì)于非線性特征,相較于TKPLS,MFPLS可以監(jiān)測(cè)幾乎所有的故障信號(hào),故障檢測(cè)率有了較大的提高,但MFPLS算法對(duì)正常數(shù)據(jù)會(huì)有更多的誤報(bào)警情況;與DTPLS的動(dòng)態(tài)特性、TKPLS的非線性特性相比,MFPLS對(duì)質(zhì)量相關(guān)故障的動(dòng)態(tài)特性、非線性特性的監(jiān)測(cè)效果均有將近20%的增長(zhǎng),但MFPLS算法對(duì)非線性空間的監(jiān)測(cè)效果不理想。綜上所述,MFPLS算法提高了質(zhì)量相關(guān)故障的檢測(cè)率,且均能對(duì)這幾類質(zhì)量相關(guān)故障進(jìn)行有效監(jiān)控。
圖3 3種算法的質(zhì)量相關(guān)故障檢測(cè)結(jié)果Fig.3 Quality related fault detection results of three algorithms
DTPLS、TKPLS和MFPLS對(duì)質(zhì)量無關(guān)故障的檢測(cè)結(jié)果如表3所示。從表中可以發(fā)現(xiàn):當(dāng)DTPLS在監(jiān)測(cè)質(zhì)量無關(guān)故障時(shí),IDV(3,9,15)的有效檢測(cè)率低于8%,而IDV(11)的有效檢測(cè)率將近70%,IDV(4)的有效檢測(cè)率高達(dá)100%,即DTPLS對(duì)IDV(4,11)的監(jiān)測(cè)有較高的誤報(bào)警率;TKPLS在進(jìn)行過程監(jiān)測(cè)時(shí),IDV(3,9)的有效檢測(cè)率低于8%,而殘差中包含較大差異子空間的有效檢測(cè)率低于5%,基本維持在1%附近,這種現(xiàn)象說明TKPLS能對(duì)數(shù)據(jù)進(jìn)行有效的分解,誤報(bào)警的情況得到了明顯的改善;MFPLS在監(jiān)測(cè)動(dòng)態(tài)質(zhì)量無關(guān)故障IDV(3,4,9,15)時(shí),有效檢測(cè)率基本維持在3%附近,發(fā)生誤報(bào)警的情況明顯減少,對(duì)故障IDV(3,4,15)的誤報(bào)警率甚至低于4%,但在監(jiān)測(cè)線性子空間和非線性子空間時(shí),誤報(bào)警率大多都高于50%。
表3 3種算法的質(zhì)量無關(guān)故障報(bào)警率Table 3 Quality independent fault alarm rates of three algorithms
故障3是階躍變化的供料溫度故障,TKPLS、DTPLS、MFPLS算法對(duì)故障3的監(jiān)測(cè)效果如圖4所示。對(duì)比圖4可以發(fā)現(xiàn),MFPLS對(duì)動(dòng)態(tài)特征的故障檢測(cè)效果較好,對(duì)非線性特征的誤報(bào)警率比TKPLS大一些。這是因?yàn)樵撍惴榱颂岣叻蔷€性部分的檢測(cè)效果而剔除了原始數(shù)據(jù)中的動(dòng)態(tài)和非線性信息。但該算法對(duì)質(zhì)量無關(guān)部分的故障具有良好的檢測(cè)效果和較低的誤報(bào)警率,且對(duì)動(dòng)態(tài)特征的誤報(bào)警率不受影響。與TKPLS、DTPLS方法相比,MFPLS具有更低的計(jì)算成本,且能用一種更容易解釋的方式來獲取過程數(shù)據(jù)中的動(dòng)態(tài)、線性和非線性特征。
圖4 3種算法的質(zhì)量無關(guān)故障檢測(cè)結(jié)果Fig.4 Quality independent fault detection results of three algorithms
綜上所述,本文提出的MFPLS算法解決了線性PLS、非線性PLS、動(dòng)態(tài)內(nèi)PLS對(duì)混合特性有較低的故障檢測(cè)率問題,擴(kuò)大了PLS的應(yīng)用范圍;同時(shí)考慮了過程數(shù)據(jù)中的動(dòng)態(tài)、線性和非線性特征,并將不同的特征變化分別反映在動(dòng)態(tài)、線性和非線性子空間中,故同樣適用于對(duì)動(dòng)態(tài)、非線性特性單一存在的過程或兩種特性同時(shí)存在的工業(yè)過程進(jìn)行監(jiān)測(cè)。此外,本文算法有效降低了質(zhì)量無關(guān)故障的誤報(bào)警率,在多特性復(fù)雜過程中具有更加良好的故障檢測(cè)性能。
針對(duì)動(dòng)態(tài)、非線性或動(dòng)態(tài)和非線性特征同時(shí)存在的系統(tǒng)的質(zhì)量相關(guān)故障檢測(cè)問題,本文提出了一種基于PLS的在線監(jiān)控多特征提取算法MFPLS。該算法將動(dòng)態(tài)內(nèi)PLS、線性PLS、核PLS模型有效地結(jié)合在一起,提取出的豐富信息提高了模型的可解釋性,也提高了過程監(jiān)控性能。與DKPLS和TKPLS相比,MFPLS提高了原始數(shù)據(jù)的利用效率,克服了動(dòng)態(tài)干擾,提高了質(zhì)量相關(guān)故障的檢測(cè)率,同時(shí)擴(kuò)大了PLS算法的應(yīng)用范圍。本文所提算法在質(zhì)量無關(guān)故障的非線性特征檢測(cè)方面的效果不夠理想,這是由于數(shù)據(jù)經(jīng)過多次特征提取造成的,如何降低多次特征提取時(shí)質(zhì)量無關(guān)故障的漏報(bào)率,是今后亟需解決的問題。在基于多特征提取算法的基礎(chǔ)上,如何進(jìn)行故障診斷也是今后的研究方向。