姬鵬飛,侯凡博,張修太
(安陽工學(xué)院電子信息與電氣工程學(xué)院,河南安陽455000)
工業(yè)過程具有多工況、非線性、復(fù)雜程度高等特點(diǎn),運(yùn)行過程中一旦出現(xiàn)故障就會(huì)影響產(chǎn)品質(zhì)量,造成重大的經(jīng)濟(jì)損失,嚴(yán)重時(shí)甚至出現(xiàn)人員損傷。因此,對(duì)工業(yè)過程中各種異常情況進(jìn)行及時(shí)、有效地監(jiān)控就顯得尤為重要[1]。
主元分析(PCA)方法[2]是目前廣泛應(yīng)用于過程分析和監(jiān)測(cè)的方法之一。但是,它是一種線性方法,不適用于非線性過程。針對(duì)現(xiàn)代工業(yè)過程的非線性特性,出現(xiàn)了各種非線性監(jiān)控方法,核主元分析(kernelPCA,KPCA)[3]就是其中一種。它考慮了過程的非線性特性,可以有效提取數(shù)據(jù)的非線性信息,同時(shí)在實(shí)施過程中沒有復(fù)雜的非線性計(jì)算,可調(diào)參數(shù)少,因此廣泛應(yīng)用于特征提取、人臉識(shí)別、圖像處理和故障診斷等領(lǐng)域[4-6]。
在KPCA方法中,核函數(shù)的選擇正確與否很大程度上決定了系統(tǒng)非線性特征提取的好壞。因此,核函數(shù)種類及其參數(shù)的選取對(duì)故障檢測(cè)的結(jié)果影響很大[7]。本文對(duì)常見核函數(shù)特性進(jìn)行分析后,將全局核函數(shù)和局部核函數(shù)混合,構(gòu)造出兼具兩種核函數(shù)優(yōu)點(diǎn)的混合核函數(shù)。將混合核函數(shù)應(yīng)用到KPCA方法中,達(dá)到對(duì)傳統(tǒng)KPCA方法改進(jìn)的目的。典型非線性過程和TE過程監(jiān)控結(jié)果表明,該方法在故障檢測(cè)中具有較高的準(zhǔn)確性。
KPCA是一種非線性方法,將數(shù)據(jù)經(jīng)過非線性映射函數(shù)φ:RM→F,把數(shù)據(jù)映射到高維特征空間F,然后在高維特征空間進(jìn)行非線性特征的提取[8]。
假設(shè)φ(xk)已經(jīng)均值化處理,則F空間上的協(xié)方差矩陣為:
對(duì)應(yīng)的特征方程為:
式(2)中,λ和v分別為與之對(duì)應(yīng)的特征值和特征向量。將式(1)代入式(2)可得:
由式(3)可知v位于φ(x1),…,φ(xn)的張成空間中,滿足,其中ai(i= 1,2,…,N)為系數(shù)向量。則存在:
>對(duì)矩陣K用下式進(jìn)行中心化,
測(cè)試樣本數(shù)據(jù)的第k個(gè)非線性主元tk計(jì)算如下:
核函數(shù)的性能由學(xué)習(xí)能力和推廣能力兩方面決定。KPCA方法中經(jīng)常使用的核函數(shù)有:
高斯徑向基核函數(shù):
多項(xiàng)式核函數(shù):
Sigmoid核函數(shù):
所有核函數(shù)歸納起來可分為泛化能力強(qiáng)、學(xué)習(xí)能力較弱的全局核函數(shù)和學(xué)習(xí)能力強(qiáng)、泛化能力較弱的局部核函數(shù)兩類。只使用一種核函數(shù),在分析系統(tǒng)的性能時(shí)會(huì)有一定的局限性。
由核函數(shù)的性質(zhì)可知,任意兩個(gè)核函數(shù)的線性組合,都能組成一個(gè)新的核函數(shù)[10]。因此,本文對(duì)具有較強(qiáng)學(xué)習(xí)能力的高斯徑向基核函數(shù)和具有較強(qiáng)泛化能力的多項(xiàng)式核函數(shù)進(jìn)行組合,構(gòu)造出兼具二者優(yōu)點(diǎn)的混合核函數(shù),如式(12)所示。
式(12)中,ρ為高斯徑向基核函數(shù)所占權(quán)重;σ為高斯徑向基核函數(shù)參數(shù);d為多項(xiàng)式核函數(shù)的階次。對(duì)于混合核函數(shù)KPCA方法來說,這3個(gè)參數(shù)的選取對(duì)模型的建立有著重要的影響。為了得到具有較好監(jiān)控效果的模型,有必要對(duì)這些參數(shù)進(jìn)行優(yōu)化調(diào)整。
本文采用交叉驗(yàn)證法[11],將主元貢獻(xiàn)率f1和故障檢測(cè)率f2作為參數(shù)優(yōu)化的目標(biāo)函數(shù),對(duì)混合核函數(shù)中的三個(gè)參數(shù)進(jìn)行優(yōu)化,從而得到最優(yōu)參數(shù)值。
式中,k為選取的主元個(gè)數(shù),n1為在線采集數(shù)據(jù)檢測(cè)正常個(gè)數(shù)。
①選取正常建模數(shù)據(jù)和測(cè)試數(shù)據(jù),并將數(shù)據(jù)作標(biāo)準(zhǔn)化處理。
②對(duì)混合核函數(shù)賦初值,計(jì)算建模數(shù)據(jù)和測(cè)試數(shù)據(jù)的核矩陣K1、Kt,并對(duì)K1、Kt進(jìn)行中心化處理。
③對(duì)于K1,進(jìn)行主元分析,求得特征值和特征向量,并確定T2和SPE控制限。
④將測(cè)試數(shù)據(jù)核矩陣Kt代入模型進(jìn)行檢測(cè),利用主元貢獻(xiàn)率f1和故障檢測(cè)率f2作為優(yōu)化目標(biāo),對(duì)混合核函數(shù)參數(shù)不斷進(jìn)行優(yōu)化,直到符合要求為止。
⑤重復(fù)步驟③,確定檢測(cè)模型最終的T2和SPE控制限。
①利用建模步驟①得到的均值和方差對(duì)在線獲得的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
②利用建模步驟④中得到的混合核函數(shù)計(jì)算對(duì)應(yīng)的核矩陣K2,并對(duì)K2進(jìn)行中心化處理。
③計(jì)算數(shù)據(jù)的T2和SPE統(tǒng)計(jì)量,并判斷這兩個(gè)統(tǒng)計(jì)量是否超過建模步驟⑤的控制限。
將改進(jìn)KPCA故障檢測(cè)方法應(yīng)用于典型的非線性過程和TE過程,并與傳統(tǒng)KPCA方法比較,驗(yàn)證改進(jìn)后方法的有效性。
為驗(yàn)證方法的有效性,采用如下非線性過程產(chǎn)生數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)[12]。
式(14)中,e1,e2,e3為獨(dú)立擾動(dòng)變量,滿足N(0 ,0.01) 的正態(tài)分布,t∈[0 . 01,2]。根據(jù)公式XX隨機(jī)產(chǎn)生500個(gè)樣本數(shù)據(jù)用于KPCA建模及核函數(shù)參數(shù)優(yōu)化,產(chǎn)生兩組故障數(shù)據(jù)測(cè)試模型的檢驗(yàn)?zāi)芰?。測(cè)試數(shù)據(jù)為對(duì)樣本x2從100個(gè)采樣時(shí)刻后加入了0.5的階躍干擾。
根據(jù)測(cè)試數(shù)據(jù),以主元貢獻(xiàn)率f1和故障檢測(cè)率f2作為優(yōu)化目標(biāo)對(duì)參數(shù)進(jìn)行優(yōu)化,優(yōu)化結(jié)果如表1、表2所示。
表1 高斯徑向基KPCA方法參數(shù)優(yōu)化結(jié)果
表2 多項(xiàng)式KPCA方法參數(shù)優(yōu)化結(jié)果
通過表1、表2可知,當(dāng)σ=5000、d=2時(shí),單一核函數(shù)KPCA方法對(duì)測(cè)試數(shù)據(jù)的主元貢獻(xiàn)率f1和故障檢測(cè)率f2達(dá)到最優(yōu),ρ取0.2。參數(shù)被確定后,混合核函數(shù)最終形式也就確定了。使用傳統(tǒng)KPCA方法和改進(jìn)KPCA方法的spe統(tǒng)計(jì)量檢測(cè)結(jié)果如圖1所示。
圖1 三種KPCA方法的spe統(tǒng)計(jì)量檢測(cè)圖
表3 三種方法故障檢測(cè)適應(yīng)函數(shù)值
通過圖1的檢測(cè)結(jié)果可以看到,三種方法都可以很好的檢測(cè)出故障。從表3中可以看出定量的數(shù)據(jù)分析,改進(jìn)KPCA方法對(duì)數(shù)據(jù)非線性特征的提取要高于傳統(tǒng)KPCA方法,同時(shí)故障檢測(cè)率也比高于傳統(tǒng)KPCA方法。
TE過程是一個(gè)典型的非線性工業(yè)過程,是伊斯曼化學(xué)品公司為了評(píng)價(jià)過程控制和監(jiān)控方法而提供的一個(gè)工業(yè)過程平臺(tái)[13]。本文選取了TE過程故障中較為典型的故障5和故障11為例分析改進(jìn)KPCA的檢測(cè)效果,故障5為階躍型故障,而故障11為隨機(jī)變量型故障,都具有很強(qiáng)的非線性。用于訓(xùn)練的正常工況樣本有400個(gè),用于測(cè)試的故障數(shù)據(jù)有240個(gè)。在檢測(cè)過程中,先使系統(tǒng)正常運(yùn)行8小時(shí),之后引入故障。
同樣,以主元貢獻(xiàn)率f1和故障檢測(cè)率f2作為優(yōu)化目標(biāo)對(duì)參數(shù)進(jìn)行優(yōu)化,當(dāng)σ=300、d=2時(shí),單一核函數(shù)KPCA方法對(duì)測(cè)試數(shù)據(jù)的主元貢獻(xiàn)率f1和故障檢測(cè)率f2達(dá)到最優(yōu)。同時(shí)取ρ=0.2,構(gòu)造混合核函數(shù)。圖2顯示了三種方法對(duì)故障5的spe統(tǒng)計(jì)量檢測(cè)結(jié)果。
圖2 三種KPCA方法對(duì)故障5的spe統(tǒng)計(jì)量檢測(cè)圖
由圖2可以看出,三種方法都可以很好的檢測(cè)出故障。表4的定量結(jié)果分析表明,改進(jìn)KPCA方法的非線性特征提取和故障檢測(cè)率要高于單一核函數(shù)KPCA方法。
圖3 三種KPCA方法對(duì)故障11的spe統(tǒng)計(jì)量檢測(cè)圖
表5 三種方法故障11檢測(cè)適應(yīng)函數(shù)值
由圖3可以看出,三種方法都可以檢測(cè)出故障11,但是改進(jìn)KPCA方法的監(jiān)控結(jié)果表明,無論在過程的正常運(yùn)行時(shí)刻,還是在引入故障后,此方法誤檢率都要明顯低于另外兩種方法。表5的定量結(jié)果也驗(yàn)證了這一點(diǎn),改進(jìn)KPCA方法兼具了高斯徑向基KPCA方法和多項(xiàng)式KPCA方法的優(yōu)點(diǎn),對(duì)于非線性過程故障的檢測(cè)效果要高于單一核函數(shù)KPCA方法。
本文采用了改進(jìn)KPCA方法對(duì)非線性過程進(jìn)行故障檢測(cè)。該方法采用了混合核函數(shù)對(duì)數(shù)據(jù)進(jìn)行高維映射,由于混合核函數(shù)兼具了兩類核函數(shù)的優(yōu)點(diǎn),因此映射后數(shù)據(jù)具有較強(qiáng)的泛化能力。將主元貢獻(xiàn)率和故障檢測(cè)率作為混合核函數(shù)參數(shù)優(yōu)化的雙重指標(biāo),使得到最優(yōu)參數(shù)的混合核函數(shù)在特征提取和故障檢測(cè)方面都優(yōu)于單一核函數(shù)。通過在典型非線性過程和TE過程數(shù)據(jù)進(jìn)行在線檢測(cè),結(jié)果表明改進(jìn)KPCA方法具有更好的有效性。