宋新建 鐘 純 李 楠 楊煜普
(上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240)
基于集成核可預(yù)測元分析的非線性故障檢測
宋新建 鐘 純 李 楠 楊煜普
(上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240)
以核可預(yù)測元分析(KForeCA)為例,將它與集成學(xué)習(xí)方法相結(jié)合,提出了一種基于集成核可預(yù)測元分析(EKForeCA)的非線性故障檢測方法。給出EKForeCA的故障檢測原理。TE仿真實驗結(jié)果表明:基于EKForeCA的故障檢測方法可有效提高故障檢測靈敏度和魯棒性。
非線性故障檢測 核可預(yù)測元分析 集成學(xué)習(xí)方法 統(tǒng)計量
近年來,現(xiàn)代工業(yè)過程逐漸趨向于規(guī)?;蛷?fù)雜化,因此工業(yè)過程的安全性和可靠性越來越受到人們的關(guān)注。隨著測量技術(shù)的不斷發(fā)展,工業(yè)過程中的大量過程變量被保存下來,為此基于數(shù)據(jù)驅(qū)動的故障檢測技術(shù)在工業(yè)過程中得到了廣泛應(yīng)用[1~3]。
作為一種傳統(tǒng)的多元統(tǒng)計故障檢測方法,主元分析法(PCA)假設(shè)數(shù)據(jù)服從高斯分布,并且數(shù)據(jù)變量之間線性相關(guān)。然而實際的工業(yè)過程數(shù)據(jù)是有限的,常表現(xiàn)出一定的非高斯性,且不同的工業(yè)過程數(shù)據(jù)具有不同的非線性特征,因此PCA方法在實際應(yīng)用中存在一定的缺陷[4~6]。核可預(yù)測元分析(KForeCA)方法作為一種新興的數(shù)據(jù)特征提取方法,考慮了數(shù)據(jù)之間的時序相關(guān)性,能夠提取具有動態(tài)時序特性和可預(yù)測性的數(shù)據(jù)特征,同時又引入了非線性核函數(shù),能夠?qū)⒌途S空間中的數(shù)據(jù)通過非線性映射投影到高維空間,因此可以很好地處理非線性的過程數(shù)據(jù)[7,8]。其中,核函數(shù)的選擇非常關(guān)鍵,這直接影響了該方法提取非線性信息的能力,進而影響故障檢測的效果[9,10]。對于核函數(shù)的選擇,一般的方法是根據(jù)經(jīng)驗選擇一個核函數(shù)并確定核函數(shù)的參數(shù),這具有一定的盲目性,很難在故障信息未知的情況下獲取合適的核參數(shù),而且即便是對于同一個核函數(shù),不同的故障可能在不同的核參數(shù)下具有不同的檢測性能[11]。針對該問題,筆者將集成學(xué)習(xí)方法與KForeCA相結(jié)合,提出一種基于集成核可預(yù)測元分析(EKForeCA)的非線性故障檢測方法,以提高故障檢測率,增強過程檢測魯棒性。
將低維非線性空間的數(shù)據(jù)映射到線性高維空間后,對高維空間中的數(shù)據(jù)進行標(biāo)準(zhǔn)化處理。則特征空間F的協(xié)方差矩陣ΣF為:
Ki,j=k(xi,xj)=〈Φ(xi),Φ(xj)〉
計算出核矩陣后,對Φ(xi)進行去中心化處理,得到:
(1)
由式(1)可以得出,去中心化后的核矩陣為:
H=[α1,α2,…,αp]
Λ=diag(λ1,λ2,…,λp),λ1≥λ2≥…≥λp
其中,U是經(jīng)過非線性核映射和白化處理得到的數(shù)據(jù),滿足E(UUT)=1,U∈Rp。
獲得U后,利用ForeCA方法對U進行處理,提取可預(yù)測元。ForeCA的基本原理是找到一個線性變換矩陣WT∈Rp×m,使得S=WTU,其中S為得分矩陣,W為負(fù)荷矩陣,其列向量為負(fù)載向量,且兩兩正交。W的求取可以轉(zhuǎn)換為求解最優(yōu)化問題,即:
s.t.wTΣUw=1
其中,SU(ω)表示多變量平穩(wěn)過程的譜密度,ΨU(k)表示自協(xié)方差函數(shù),ΣU表示協(xié)方差矩陣。
構(gòu)建KForeCA的過程統(tǒng)計量L2和SPE:
(2)
其中,L2是通過可預(yù)測主元模的變化來反映系統(tǒng)趨勢變化的統(tǒng)計量;SPE統(tǒng)計量是觀測數(shù)據(jù)到可預(yù)測模型空間的距離,反映測量值與可預(yù)測模型之間的偏離程度。
針對KForeCA方法在核函數(shù)和核參數(shù)選擇方面存在的不足,筆者將KForeCA與集成學(xué)習(xí)方法[13,14]相結(jié)合,提出一種基于EKForeCA的故障檢測方法。EKForeCA方法選取一系列的高斯核函數(shù)進行集成學(xué)習(xí),得到多個KForeCA訓(xùn)練子模型,然后利用貝葉斯推理將子模型的檢測結(jié)果轉(zhuǎn)換成故障概率,通過加權(quán)策略突出故障信息,提高故障檢測性能。
EKForeCA方法選用的一系列具有不同帶寬參數(shù)的高斯核函數(shù)為:
其中,核函數(shù)序號ci=2i-1rmσ2,i=1,…,ns。
然后利用這些核函數(shù)分別構(gòu)造不同的KForeCA子模型,根據(jù)式(2)為每一個KForeCA子模型分別構(gòu)建L2(i)和SPE(i)統(tǒng)計量:
利用貝葉斯推理把每個子模型中已導(dǎo)出的傳統(tǒng)檢測統(tǒng)計量的數(shù)值轉(zhuǎn)換為故障概率,分別為:
統(tǒng)計量EL2和ESPE的控制限同樣可以通過選取合適的置信水平并利用核密度估計方法獲得。當(dāng)兩個統(tǒng)計量均未超出各自的控制限時,判定檢測過程處于正常狀態(tài);當(dāng)任一統(tǒng)計量超出控制限時,則判定為出現(xiàn)故障,觸發(fā)故障警報。
Tennessee Eastman(TE)模型是一個基于實際化工反應(yīng)過程的基準(zhǔn)模型[16],其過程變量之間具有很強的耦合、非線性及時變等特點,被廣泛用于評估過程檢測技術(shù)。TE過程有41個測量變量(包括22個連續(xù)變量和19個成分變量)和12個操作變量。TE仿真模型共預(yù)設(shè)了21個故障,具體見表1。
表1 TE仿真模型的過程故障
筆者選取TE仿真模型中的22個連續(xù)變量和11個操作變量作為被檢測的變量,選取500個運行在正常狀態(tài)下的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,每一個故障測試分別選用960個樣本構(gòu)造測試數(shù)據(jù)集,且每一個過程故障都是在第161個采樣時刻被引入。
高斯核函數(shù)的帶寬參數(shù)通常根據(jù)經(jīng)驗公式選擇,即c=2i·5m,i=1,2,…,10。TE模型仿真實驗分別測試了i=4、i=8時的KForeCA模型與EKForeCA模型對于TE過程21個故障的檢測率,結(jié)果見表2。其中,L2和EL2分別反映單個KForeCA模型與EKForeCA模型的系統(tǒng)變化趨勢,SPE和ESPE分別表示觀測數(shù)據(jù)到可預(yù)測模型空間KForeCA與EKForeCA的距離。
表2 KForeCA、EKForeCA模型對21個故障的檢測結(jié)果
(續(xù)表2)
分析表2中的數(shù)據(jù)可以發(fā)現(xiàn),通過對核函數(shù)的集成學(xué)習(xí),對于大部分過程故障,EKForeCA基本都能檢測出故障的發(fā)生與傳播,尤其對于故障4、10、11、16、20,其故障檢測率得到了顯著提升。下面結(jié)合故障4和故障16的仿真實驗結(jié)果進行具體分析。
KForeCA和EKForeCA對故障4的檢測結(jié)果如圖1所示。可以看出,無論是EL2統(tǒng)計量還是ESPE統(tǒng)計量,相比于單個核函數(shù)的KForeCA子模型,EKForeCA的檢測效果均得到了極大提升。幾乎在整個檢測周期內(nèi),ESPE統(tǒng)計量都能以非常高的靈敏度將故障檢測出來。
圖1 KForeCA和EKForeCA對故障4的檢測結(jié)果
由表1可知,故障16是一種未知故障,對未知故障的檢測效果可以體現(xiàn)出集成核學(xué)習(xí)方法在故障檢測領(lǐng)域中的推廣應(yīng)用能力。KForeCA和EKForeCA對故障16的檢測結(jié)果如圖2所示,可以看出,L2、SPE統(tǒng)計量在采樣區(qū)間內(nèi)的檢測效果都不是很理想,不同核參數(shù)下的檢測效果也有很大差異,而基于集成核學(xué)習(xí)方法的EL2和ESPE統(tǒng)計量基本都能夠檢測出區(qū)間內(nèi)的絕大部分故障,其檢測靈敏度明顯優(yōu)于基于單個核函數(shù)的L2和SPE統(tǒng)計量。
圖2 KForeCA和EKForeCA對故障16的檢測結(jié)果
筆者針對核學(xué)習(xí)方法中核函數(shù)參數(shù)選擇存在的問題,利用集成學(xué)習(xí)的思想,以KForeCA為例,將它與集成學(xué)習(xí)方法相結(jié)合,對一系列的核函數(shù)進行集成學(xué)習(xí),訓(xùn)練得到若干不同的KForeCA子模型,利用貝葉斯推理將各個子模型的檢測結(jié)果轉(zhuǎn)換成故障概率,并通過加權(quán)策略突出故障信息,進而提高過程檢測性能。通過對核函數(shù)的集成學(xué)習(xí),避免了盲目選擇單個核函數(shù)對檢測性能的不利影響,提高了過程檢測魯棒性。TE仿真模型的實驗結(jié)果表明,與基于單個核函數(shù)的KForeCA模型的故障檢測方法相比,基于集成核學(xué)習(xí)的EKForeCA故障檢測模型顯著提高了過程檢測性能。因此,基于集成核學(xué)習(xí)方法的故障檢測方法在非線性過程檢測領(lǐng)域具備一定的研究潛力與應(yīng)用價值。
[1] 李晗,蕭德云.基于數(shù)據(jù)驅(qū)動的故障診斷方法綜述[J].控制與決策,2011,26(1):1~9.
[2] 周東華,胡艷艷.動態(tài)系統(tǒng)的故障診斷技術(shù)[J].自動化學(xué)報,2009,35(6):748~758.
[3] 赫偉英,裴峻峰.往復(fù)機械故障診斷技術(shù)進展綜述[J].化工機械,2010,37(5):671~674.
[4] Jiang Q,Yan X,Huang B.Performance-Driven Distributed PCA Process Monitoring Based on Fault-Relevant Variable Selection and Bayesian Inference[J].IEEE Transactions on Industrial Electronics,2016,63(1):377~386.
[5] Ge Z,Song Z,Gao F.Review of Recent Research on Data-Based Process Monitoring[J].Industrial & Engineering Chemistry Research,2013,52(10):3543~3562.
[6] 王迎,王新明,趙小強.基于小波去噪與KPCA的TE過程故障檢測研究[J].化工機械,2011,38(1):49~53.
[7] Goerg G.Forecastable Component Analysis[C].The 30th International Conference on Machine Learning.Atlanta:ICML, 2013:64~72.
[8] 林圣才,楊煜普,屈衛(wèi)東.一種基于可預(yù)測元分析的故障診斷方法[J].化工自動化及儀表,2015,42(3):272~276.
[9] Lee J M,Yoo C K,Sang W C,et al.Nonlinear Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering Science,2004,59(1):223~234.
[10] Cho J H,Lee J M,Sang W C,et al.Fault Identification for Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering Science,2005,60(1):279~288.
[11] Li N,Yang Y.Ensemble Kernel Principal Component Analysis for Improved Nonlinear Process Monitoring[J]. Industrial & Engineering Chemistry Research,2015,54(1):318~329.
[12] Sang W C,Lee C,Lee J M,et al.Fault Detection and Identification of Nonlinear Processes Based on Kernel PCA[J]. Chemometrics & Intelligent Laboratory Systems,2005,75(1):55~67.
[13] Banfield R E,Hall L O,Bowyer K W,et al.A Comparison of Decision Tree Ensemble Creation Techniques[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2007,29(1):173~180.
[14] Polikar R.Ensemble Based Systems in Decision Making[J].IEEE Circuit Systems Magazine,2006,6(3):21~45.
[15] Chen Q,Kruger U,Meronk M,et al.Synthesis ofT2,andQ,Statistics for Process Monitoring[J].Control Engineering Practice,2004,12(6):745~755.
[16] Downs J J,Vogel E F.A Plant-Wide Industrial Process Control Problem[J].Computers & Chemical Engineering,1993, 17(3):245~255.
NonlinearFaultDetectionBasedonEnsembleKernelForecastableComponentAnalysis
SONG Xin-jian, ZHONG Chun, LI Nan, YANG Yu-pu
(CollegeofElectronicInformationandElectricalEngineering,ShanghaiJiaotongUniversity,Shanghai200240,China)
Taking KForeCA(Ensemble Kernel Forecastable Component Analysis)as an example, having it combined with ensemble learning and KForeCA based to put forward the nonlinear fault detection method was implemented, including the presentation of EKForeCA fault detection principle. The TE simulation results show that, that the EKForeCA-based nonlinear fault detection method can improve the sensitivity of fault detection effectively and the robustness.
nonlinear fault detection, KForeCA, ensemble learning method, statistics
TH165+.3
A
1000-3932(2016)09-0917-06
2016-02-25(修改稿)