張敏龍 王濤 王旭平 常紅偉 王放
摘要:針對滑動窗自適應(yīng)核主元分析法(KPCA)在處理參數(shù)敏感和緩慢劣化問題時存在的“過適應(yīng)”現(xiàn)象,容易產(chǎn)生漏報的問題,提出了一種分步動態(tài)自回歸KPCA算法。首先,借鑒動態(tài)數(shù)據(jù)矩陣思想,分步建立初始模型;然后,在滑動窗自適應(yīng)KPCA的基礎(chǔ)上,引入指數(shù)加權(quán)法則處理實時數(shù)據(jù)、更新模型;最后,分析算法復(fù)雜度,并給出具體實現(xiàn)步驟。利用模擬數(shù)據(jù)分析分解系數(shù)和加權(quán)因子對算法的影響,結(jié)果表明,與滑動窗自適應(yīng)KPCA相比,所提方法在參數(shù)選擇恰當?shù)那闆r下,模型效率提高了近90%,誤報次數(shù)幾乎降為0,還能通過調(diào)整加權(quán)因子取值來控制算法的適應(yīng)能力,以解決多樣化的動態(tài)問題。將算法應(yīng)用于壓縮機喘振和軸承故障實驗數(shù)據(jù)分析,驗證了所提算法處理參數(shù)敏感和緩慢劣化問題的能力。
關(guān)鍵詞:核主元分析;滑動窗;分步動態(tài)策略;指數(shù)加權(quán);故障診斷
中圖分類號:TP277 文獻標志碼:A
Abstract:There are overfitting phenomenon and prone omissions when moving window adaptive Kernel Principal Component Analysis (KPCA) is utilized to deal with sensitive parameters or slow degradation problem. In order to solve the problem, a step dynamic autoregression KPCA was proposed. Firstly, the initial model was established step by step drawing on dynamic data matrix. Then, the exponentially weighting rule was introduced to process realtime data and update the model based on the moving window adaptive KPCA. Finally, the algorithm complexity was analyzed and specific steps were given. The simulation data was utilized to analyze the impact of decomposition coefficient and weighting factor. The results show that, compared with the moving window adaptive KPCA, the proposed algorithm efficiency was improved by nearly 90% and the number of false positives was almost 0 in the case of appropriate parameter selection; and it could also control the adaptive ability to solve a variety of dynamic problems by adjusting the value of weighting factor. The algorithm was applied to the experimental data analysis of compressor surge and bearing fault, the result verified its ability to deal with the problem of sensitive parameter and slow degradation.
Key words:Kernel Principal Component Analysis (KPCA); moving window; step dynamic strategy; exponentially weighting; fault diagnosis
0 引言
Schlkopf等[1]提出的核主元分析法(Kernel Principal Component Analysis, KPCA)是一種非線性數(shù)據(jù)處理方法,目前已經(jīng)在入侵檢測、圖像處理、過程監(jiān)控、故障診斷等領(lǐng)域得到了成功應(yīng)用[2-5]。但傳統(tǒng)KPCA建立在靜態(tài)模型的基礎(chǔ)上,存在模型訓練完成后不能改變的缺陷,應(yīng)用于動態(tài)時變系統(tǒng)中可能會出現(xiàn)大量誤報、漏報問題。
為此,近年來研究者們相繼提出了一些動態(tài)KPCA方法。文獻[6]結(jié)合滑動窗機制提出了一種自適應(yīng)動態(tài)KPCA方法,使模型能夠適應(yīng)時變系統(tǒng)的參數(shù)漂移,并成功應(yīng)用于航空發(fā)動機的故障動態(tài)監(jiān)測中。該方法實時性好、自適應(yīng)性強、模型更新周期可控,適用于跟蹤設(shè)備正常狀態(tài)的漂移,同時能夠減少誤報的發(fā)生。但該方法刻板地使用實時數(shù)據(jù)替換原始數(shù)據(jù),缺少對適應(yīng)性的控制,在推廣到處理設(shè)備參數(shù)敏感和緩慢劣化問題時會出現(xiàn)“過適應(yīng)”,影響算法效果,存在漏報的可能。
針對上述問題,本文借鑒文獻[7]的動態(tài)數(shù)據(jù)矩陣思想,在滑動窗自適應(yīng)KPCA的基礎(chǔ)上,引入文獻[8]的指數(shù)加權(quán)法則,提出一種分步動態(tài)自回歸核主元分析法(Step Dynamic AutoRegression KPCA,SDAR_KPCA)。該方法首先將訓練樣本分解擴展,分兩步提取數(shù)據(jù)的相關(guān)關(guān)系,減小核矩陣規(guī)模和計算復(fù)雜度;然后根據(jù)動態(tài)數(shù)據(jù),加權(quán)更新核矩陣,調(diào)節(jié)加權(quán)因子以適應(yīng)不同類型動態(tài)系統(tǒng)的要求,降低誤報、漏報概率;最后利用模擬數(shù)據(jù)驗證算法的快速性和自回歸性,并將算法應(yīng)用于壓縮機喘振過程信號和IMS(Intelligent Maintenance System)軸承故障實驗數(shù)據(jù)的分析。
1 分步動態(tài)自回歸核主元分析法
1.1 算法基本思想
文獻[7]指出,對于動態(tài)系統(tǒng),實時觀測數(shù)據(jù)與過去時刻觀測數(shù)據(jù)是緊密聯(lián)系的,利用靜態(tài)KPCA模型難以獲取數(shù)據(jù)之間的相關(guān)關(guān)系,并針對這一問題提出分步動態(tài)策略:首先對數(shù)據(jù)樣本在時間方向上進行擴充,構(gòu)造數(shù)據(jù)增廣矩陣,然后利用核主元分析提取數(shù)據(jù)的空間相關(guān)關(guān)系,最后利用主元分析(Principal Component Analysis,PCA)提取數(shù)據(jù)的時間相關(guān)關(guān)系,分兩步獲取動態(tài)數(shù)據(jù)之間的相關(guān)性。
滑動窗機制利用實時采集的正常樣本替換相同數(shù)量的原始樣本,重新生成正常樣本集,建立新模型進行檢測,以達到控制模型更新頻率和適應(yīng)實時數(shù)據(jù)變化的目的。對滑動窗數(shù)據(jù)使用分步動態(tài)策略,記滑動窗寬度為ω,滑動步長為s,當前窗口數(shù)據(jù)為{xi}ωi=1∈Rm,定義分解系數(shù)為D,利用當前窗口樣本數(shù)據(jù)構(gòu)建增廣矩陣X(D):
按列分解矩陣X(D),再先后進行KPCA和PCA分析,建立模型。滑動窗每次以步長s向前滑動,依次在各窗口更新模型。然而滑動窗機制刻板地使用實時數(shù)據(jù)替換原始數(shù)據(jù),沒有考慮原始數(shù)據(jù)信息,在模型多次更新后,可能會出現(xiàn)偏離現(xiàn)象,增大誤報、漏報幾率。更糟糕的是,在處理對象參數(shù)敏感或設(shè)備緩慢劣化問題時,滑動窗自適應(yīng)KPCA對動態(tài)數(shù)據(jù)變化適應(yīng)過度,會出現(xiàn)類似于“過學習”的現(xiàn)象,以至于無法準確辨別這兩類問題的發(fā)生。
其中γ∈[0,1]表示加權(quán)因子。γ的大小在模型更新時刻畫了算法對不同時刻數(shù)據(jù)樣本的重視程度,也反映了對實時樣本的適應(yīng)能力??梢愿鶕?jù)不同問題要求,選取合適的γ,以滿足相應(yīng)的診斷目的。
1)γ越大,則原始樣本具有較大權(quán)重,表示算法越重視原始樣本,對實時樣本的適應(yīng)能力越弱。特別地,當γ=1時,表示未對核矩陣進行更新,也就是不更新模型樣本數(shù)據(jù),沒有適應(yīng)能力,相當于靜態(tài)KPCA。對于參數(shù)敏感的問題,適合選擇較大的γ,當動態(tài)系統(tǒng)參數(shù)一旦發(fā)生漂移,就能夠被及時察覺。
2)γ越小,則新樣本具有較大權(quán)重,表示算法越重視實時樣本,對實時樣本的適應(yīng)能力越強。特別地,當γ=0時,表示核矩陣直接更新,沒有使用原始數(shù)據(jù)進行加權(quán),相當于滑動窗自適應(yīng)KPCA。對于設(shè)備緩慢劣化的問題,應(yīng)盡量選擇較小的γ,使算法具有較強的適應(yīng)能力,在一定范圍內(nèi)適應(yīng)設(shè)備參數(shù)的漂移,γ的具體取值視設(shè)備狀態(tài)變化特點而定。
1.2 算法步驟
1)離線訓練。
步驟1
收集正常樣本集X,用于初始KPCA模型的建立。設(shè)定分解系數(shù)D,滑動窗寬度ω,滑動步長s,加權(quán)因子γ,累計數(shù)k置零。計算窗口數(shù)據(jù)的均值和標準差,并進行標準化處理。
步驟2
2 仿真與應(yīng)用分析
2.1 仿真分析
設(shè)備運行時往往會發(fā)生狀態(tài)漂移,根據(jù)設(shè)備類型、工作環(huán)境、應(yīng)用場合等不同,會將不同程度的狀態(tài)漂移情況視為故障。為方便描述,本文使用一維模擬數(shù)據(jù)進行仿真分析,該數(shù)據(jù)以正態(tài)分布的隨機信號為基礎(chǔ),通過調(diào)整均值和標準差,模擬設(shè)備從正常狀態(tài)到出現(xiàn)漂移直至劣化的過程,如圖1所示,把漂移過程的任何位置都認為是可能的故障起始點。
由表1可以看出,SDAR_KPCA的離線訓練用時與滑動窗自適應(yīng)KPCA相比并無明顯優(yōu)勢,在分解系數(shù)D小于80后,訓練時間甚至比滑動窗自適應(yīng)KPCA還長。但從在線檢測更新時間上看,使用較大的分解系數(shù)時后,本文算法耗時遠小于滑動窗自適應(yīng)KPCA,而且D越大,更新時解算的核矩陣規(guī)模就越小,耗時也就越短,說明SDAR_KPCA算法能夠提高模型更新效率。
圖2自上而下分別是SDAR_KPCA在D取95、90、80時以及滑動窗自適應(yīng)KPCA的SPE統(tǒng)計量監(jiān)控結(jié)果。由圖2可見,SDAR_KPCA算法在D取90或80時,和滑動窗自適應(yīng)KPCA一樣,統(tǒng)計量能適應(yīng)數(shù)據(jù)的漂移;但當SDAR_KPCA分解系數(shù)D取95時,SPE的監(jiān)控結(jié)果很不理想,這是由于分解后每個子矩陣的訓練樣本數(shù)過少,導(dǎo)致不能從統(tǒng)計意義上構(gòu)成協(xié)方差矩陣,進而影響了模型的監(jiān)測效果, 因此,選取分解系數(shù)D時要綜合考慮快速性和準確性的影響,在不影響準確性的情況下,讓D盡量接近滑動窗寬度ω的值。
2.1.2 自回歸性驗證
固定分解系數(shù)D=90,然后令SDAR_KPCA取不同加權(quán)因子γ進行在線監(jiān)測。圖3(a)~(c)分別是γ取0.2、0.8和1時的SPE監(jiān)控結(jié)果,表2記錄了部分γ取值的SPE超限位置以及狀態(tài)漂移前的誤報次數(shù)。
從圖3和表2可以看出,γ取值越小,SPE統(tǒng)計量的超限位置越靠后,算法對狀態(tài)漂移的適應(yīng)能力越強,在γ接近于0時,統(tǒng)計量甚至不會越限。隨著γ取值不斷增大,SPE超限位置前移,特別是γ接近于1時,數(shù)據(jù)狀態(tài)一發(fā)生漂移,統(tǒng)計量就會越限。說明SDAR_KPCA模型能夠保留原始數(shù)據(jù)信息,具有自回歸性,而且可由γ的大小控制模型的適應(yīng)能力,使之對不同問題具有適用性。
另外,當γ取值過大時,狀態(tài)漂移前就出現(xiàn)了少量誤報問題,這是由于模型不更新或更新時新樣本的權(quán)值太小所引起的,此時SDAR_KPCA的性能退化至與靜態(tài)KPCA相當。
2.2 應(yīng)用分析
下面,利用SDAR_KPCA分別對兩種不同類型的實際故障數(shù)據(jù)進行分析。
1)壓縮機喘振過程信號分析。
分析250kW單級離心壓縮機從正常到喘振的發(fā)展過程,實驗轉(zhuǎn)速為13570rpm,采樣頻率為150Hz,采樣點數(shù)為2048,調(diào)節(jié)節(jié)流閥讓壓縮機發(fā)生喘振,得到進口總壓和出口靜壓信號如圖4所示[10]。
喘振現(xiàn)象對離心壓縮機危害巨大,必須對喘振先兆作出及時準確辨別,一旦發(fā)生參數(shù)漂移就能立即報警,屬于參數(shù)敏感問題,所以選擇較大的γ。將壓力信號合成二維數(shù)據(jù),選取滑動窗寬度ω=200,分解系數(shù)D=180,滑動步長s=10,核參數(shù)σ=5m/2=2.24,主元控制限為0.85,統(tǒng)計量控制限的置信度為99%,圖5顯示了加權(quán)因子γ=0.9時SPE的監(jiān)控結(jié)果。
圖5表明,在壓縮機平穩(wěn)運行時,SPE未出現(xiàn)超限情況,在壓縮機進出口壓力參數(shù)發(fā)生漂移瞬間,SDAR_KPCA模型及時給出了報警信息,實現(xiàn)了喘振先兆的準確識別。但是,報警后出現(xiàn)了大量“漏檢”點,這是由于沒有進行特征提取,而樣本點的壓力信息恰好與正常狀態(tài)相符引起的。
2)IMS軸承故障實驗數(shù)據(jù)分析。
數(shù)據(jù)來自美國辛辛那提大學IMS中心的軸承故障實驗[11],實驗中4個滾動軸承同軸安裝,1#、4#軸承固定在實驗臺上,2#、3#軸承通過彈簧機構(gòu)施加6000lb恒定徑向負載,轉(zhuǎn)速保持2000rpm,并在每個軸承上設(shè)置兩個PCB 353B33型振動傳感器,分別測量軸承水平和垂直振動信號。
實驗從2004年2月12日10:32:29持續(xù)到2月19日06:22:39,每隔10min利用NI DAQ 6062E信號采集平臺記錄各軸承的垂直振動信號,采樣頻率為20kHz,采樣點數(shù)為20480,共有984段4維信號數(shù)據(jù)。計算每段數(shù)據(jù)的時域統(tǒng)計指標作為原始特征,具體同上節(jié)模擬數(shù)據(jù)的10類指標,共得984點40維特征。選取滑動窗寬度ω=100,分解系數(shù)D=90,滑動步長s=10,核參數(shù)σ=5m/2=10,主元控制限為0.85,統(tǒng)計量控制限的置信度為99%,圖6為加權(quán)因子γ分別取0.8和0.2時SPE的監(jiān)控結(jié)果。
當γ=0.8時,SPE在第703點處超出控制限,對該段原始信號進行包絡(luò)分析,發(fā)現(xiàn)1#軸承的狀態(tài)開始出現(xiàn)漂移,但仍處于正常工作范圍。當γ=0.2時,統(tǒng)計量在最后幾個特征點處才發(fā)生越限,此時的包絡(luò)譜表明1#軸承的外圈處于故障狀態(tài),最后停機檢查發(fā)現(xiàn)1#軸承外圈存在裂紋。實驗記錄了軸承外圈緩慢劣化的過程,通過設(shè)置較小的加權(quán)因子γ如0.2,SDAR_KPCA模型能夠準確判斷出故障的發(fā)生。而設(shè)置較大的γ如0.8,則可以識別出狀態(tài)漂移的起始位置, 因此,可以設(shè)置雙層甚至多層SDAR_KPCA模型,形成層級報警器,可以得到更精確的診斷結(jié)論。
3 結(jié)語
本文借鑒分步動態(tài)策略,在滑動窗自適應(yīng)KPCA中引入指數(shù)加權(quán)法則,提出了SDAR_KPCA算法,利用模擬數(shù)據(jù)驗證了算法效果,并將其成功應(yīng)用于壓縮機喘振故障和IMS軸承故障診斷,主要結(jié)論如下:
1)SDAR_KPCA降低了算法復(fù)雜度,提高了模型更新效率,在保證準確性的前提下,讓分解系數(shù)盡量接近滑動窗寬度的值,可以實現(xiàn)動態(tài)數(shù)據(jù)的快速診斷。
2)SDAR_KPCA實現(xiàn)了模型的自回歸更新,根據(jù)實際問題選擇合適的加權(quán)因子,調(diào)節(jié)原始數(shù)據(jù)和動態(tài)數(shù)據(jù)的權(quán)重,能夠得到良好的診斷結(jié)果。
3)通過設(shè)置不同加權(quán)因子建立雙層甚至多層SDAR_KPCA模型,能形成層級報警器,從而達到更詳實診斷的目的。
參考文獻:
[1]SCHLKOPF B, SMOLA A, MLLER K R. Nonlinear component analysis as a kernel eigenvalue problem [J]. Neural Computation, 1998, 10(5): 1299-1319.
[2]余文利,余建軍,方建文.一種新的基于KPCA和改進εSVM的入侵檢測模型[J].計算機工程與應(yīng)用,2015,51(11): 93-98. (YU W L, YU J J, FANG J W. Novel intrusion detection model based on KPCA and improved εSVM [J]. Computer Engineering and Applications, 2015, 51(11): 93-98.)
[3]LIN C, PENG F, WANG BH, et al. Research on PCA and KPCA selffusion based MSTARSAR automatic target recognition algorithm [J]. Journal of Electronic Science and Technology, 2012, 10(4): 352-357.
[4]JIANG Q C, YAN X F. Statistical monitoring of chemical processes based on sensitive kernel principal components [J]. Chinese Journal of Chemical Engineering, 2013, 21(6): 633-643.
[5]張恒,趙榮珍.故障特征選擇與特征信息融合的加權(quán)KPCA方法研究[J].振動與沖擊,2014,33(9):89-93,121. (ZHANG H, ZHAO R Z. Weighted KPCA based on fault feature selection and feature information fusion [J]. Journal of Vibration and Shock, 2014, 33(9): 89-93, 121.)
[6]胡金海,李應(yīng)紅,楊帆,等.一種基于自適應(yīng)核主元分析的故障檢測方法[J].控制工程,2007,14(S1):80-83. (HU J H, LI Y H, YANG F, et al. A fault detection method based on kernel principal component analysis [J].Control Engineering of China, 2007, 14(S1): 80-83.)
[7]CHOI S W, LEE I B. Nonlinear dynamic process monitoring based on dynamic kernel PCA [J]. Chemical Engineering Science, 2004, 59(24): 5897-5908.
[8]WOLD S. Exponentially weighted moving principal component analysis and projection to latent structures [J]. Chemometrics and Intelligent Laboratory Systems, 1994, 23(1): 149-161.【Proceedings of the 3rd Scandinavian Symposium on Chemometrics (SSC3)】
[9]姜萬錄,吳勝強,劉思遠.指數(shù)加權(quán)動態(tài)核主元分析法及其在故障診斷中應(yīng)用[J].機械工程學報,2011,47(3):63-68. (JIANG W L, WU S Q, LIU S Y. Exponentially weighted dynamic kernel principal component analysis algorithm and its application in fault diagnosis [J].Journal of Mechanical Engineering, 2011, 47(3): 63-68.)
[10]張慶. 基于核方法的機械設(shè)備動態(tài)監(jiān)測診斷模型與關(guān)鍵技術(shù)研究[D]. 西安:西安交通大學, 2007. (ZHANG Q. Research on the dynamical model and its key techniques for condition monitoring and fault diagnosis of mechanical equipments based on kernel methods [D]. Xian: Xian Jiaotong University, 2007.)
[11]LEE J, QIU H, YU G, et al. ‘Bearing Data Set, IMS, University of Cincinnati. NASA Ames Prognostics Data Repository, NASA Ames, Moffett Field, CA [EB/OL]. [2015-07-20]. http://ti.arc.nasa.gov/projects/data_prognostics/.
[12]QIU H, LEE J, LIN J, et al. Wavelet filterbased weak signature detection method and its application on rolling element bearing prognostics [J]. Journal of Sound and Vibration, 2006, 289(4/5): 1066-1090.