張漢元, 田學(xué)民
?
基于異步PCA的故障識(shí)別方法
張漢元, 田學(xué)民
(中國石油大學(xué)(華東) 信息與控制工程學(xué)院, 山東 青島 266580)
針對(duì)傳統(tǒng)的主元分析(PCA)方法僅考慮變量間同步相關(guān)性的問題,提出一種基于異步PCA的故障識(shí)別方法。該方法首先利用導(dǎo)數(shù)動(dòng)態(tài)時(shí)間規(guī)整(DDTW)從待識(shí)別故障數(shù)據(jù)集的關(guān)鍵變量序列和歷史故障數(shù)據(jù)集的故障變量序列中獲得最優(yōu)規(guī)整路徑,將最優(yōu)規(guī)整路徑上的元素?cái)U(kuò)展為反映關(guān)鍵變量序列和故障變量序列之間異步相關(guān)性的新序列,然后對(duì)新變量序列的協(xié)方差矩陣進(jìn)行特征值分解獲得負(fù)荷矩陣,最后根據(jù)負(fù)荷矩陣中關(guān)鍵變量序列和故障變量序列的低維表示向量之間的相似性識(shí)別故障。在連續(xù)攪拌反應(yīng)器(CSTR)過程上的仿真結(jié)果表明所提出方法的故障識(shí)別性能優(yōu)于傳統(tǒng)的PCA相似系數(shù)法。
異步相關(guān)性;主元分析;導(dǎo)數(shù)動(dòng)態(tài)時(shí)間規(guī)整;故障識(shí)別
1 前 言
隨著計(jì)算機(jī)控制系統(tǒng)的廣泛應(yīng)用,工業(yè)過程中大量的操作數(shù)據(jù)被記錄下來,基于數(shù)據(jù)驅(qū)動(dòng)的過程監(jiān)控方法逐漸成為過程監(jiān)控領(lǐng)域中的研究熱點(diǎn)[1]。其中主元分析(PCA)是研究較多的方法,已經(jīng)成功應(yīng)用于工業(yè)生產(chǎn)過程的故障檢測(cè)研究[2]??紤]到工業(yè)數(shù)據(jù)的非線性特征,研究者們?cè)趥鹘y(tǒng)PCA方法的基礎(chǔ)上提出了一系列改進(jìn)的非線性方法[3]。
然而傳統(tǒng)的PCA模型在構(gòu)建協(xié)方差矩陣時(shí)只考慮了變量在相同時(shí)間點(diǎn)(同步)上的相關(guān)性,因此當(dāng)相同的形狀趨勢(shì)出現(xiàn)在兩個(gè)變量序列中的不同時(shí)刻時(shí)會(huì)被認(rèn)為不相關(guān)的。傳統(tǒng)PCA模型的這一局限性近年來引起了研究者們的廣泛關(guān)注。在間歇過程的故障診斷中考慮到不同批次間數(shù)據(jù)存在異步的情況,需要同步處理不同批次的變量軌跡后,才能采用基于多路PCA的過程監(jiān)控方法[4,5]。為了考慮不同時(shí)間序列數(shù)據(jù)間的異步相關(guān)性,Li等[6]根據(jù)原始時(shí)間序列構(gòu)建插值時(shí)間序列,然后采用PCA對(duì)獲得的插值時(shí)間序列進(jìn)行降維。
針對(duì)故障識(shí)別問題,早期提出的故障識(shí)別方法是貢獻(xiàn)圖法[7],但是由于變量之間往往具有較強(qiáng)的互相關(guān)性,貢獻(xiàn)最大的變量不一定是真實(shí)的故障變量[8]。Kranowski等[9]提出了PCA相似系數(shù)法,該方法通過比較主元模型負(fù)荷向量間的夾角測(cè)量?jī)蓚€(gè)數(shù)據(jù)集的相似性??紤]到不同的主元方向上描述的數(shù)據(jù)信息不同,Singhal等[10]在計(jì)算主元之間的夾角時(shí)用與主元對(duì)應(yīng)的特征值的平方根加權(quán)該主元,提出了改進(jìn)的PCA相似系數(shù)法。但是傳統(tǒng)的PCA模型僅采用同步分析計(jì)算協(xié)方差矩陣而忽略變量間的異步相關(guān)性,導(dǎo)致現(xiàn)有的PCA相似系數(shù)法故障識(shí)別效果不理想。
當(dāng)待辨識(shí)故障與歷史故障庫中的故障發(fā)生時(shí)間不一致時(shí),待辨識(shí)數(shù)據(jù)集中的關(guān)鍵變量序列和歷史故障數(shù)據(jù)集中的故障變量序列會(huì)出現(xiàn)異步相關(guān)的情況。本文提出基于異步PCA的故障識(shí)別算法,利用導(dǎo)數(shù)動(dòng)態(tài)時(shí)間規(guī)整(DDTW)構(gòu)造能夠反映關(guān)鍵變量序列與故障變量序列之間異步相關(guān)性的新序列,基于獲得的新序列計(jì)算協(xié)方差矩陣,對(duì)協(xié)方差矩陣進(jìn)行特征值分解獲得負(fù)荷矩陣,根據(jù)關(guān)鍵變量和故障變量的低維表示向量之間的相似性識(shí)別故障類型。以連續(xù)攪拌反應(yīng)器(CSTR)過程為仿真對(duì)象驗(yàn)證了所提出方法故障識(shí)別的有效性。
2 異步主元分析
從式(1)可以看出,傳統(tǒng)PCA在計(jì)算協(xié)方差矩陣時(shí)僅利用了和上相同時(shí)刻的數(shù)據(jù)點(diǎn),沒有利用和中不同時(shí)刻的數(shù)據(jù)點(diǎn)。因此PCA構(gòu)造的協(xié)方差僅僅反映和上相同時(shí)刻數(shù)據(jù)點(diǎn)之間的同步相關(guān)性,而忽略了和上不同時(shí)刻數(shù)據(jù)點(diǎn)之間的異步相關(guān)性。
圖1 變量x和y之間異步關(guān)系示意圖
2.1 導(dǎo)數(shù)動(dòng)態(tài)時(shí)間規(guī)整
動(dòng)態(tài)時(shí)間規(guī)整(DTW)僅考慮數(shù)據(jù)點(diǎn)的幅值,對(duì)于兩條時(shí)間序列上幅值相同但位于不同變化趨勢(shì)中的數(shù)據(jù)點(diǎn),DTW往往會(huì)錯(cuò)誤的將這兩個(gè)數(shù)據(jù)點(diǎn)對(duì)齊[11]。針對(duì)DTW存在的問題,Keogh等[12]提出了導(dǎo)數(shù)動(dòng)態(tài)時(shí)間規(guī)整(DDTW)算法,不考慮數(shù)據(jù)點(diǎn)的幅值,而根據(jù)數(shù)據(jù)點(diǎn)處的一階導(dǎo)數(shù)值更加合理的規(guī)整時(shí)間序列。
2.2 基于DDTW的異步PCA
3 基于異步PCA的故障識(shí)別
當(dāng)待識(shí)別數(shù)據(jù)集與歷史故障數(shù)據(jù)集的故障發(fā)生時(shí)間不同時(shí),待辨識(shí)故障數(shù)據(jù)集中的關(guān)鍵變量序列與歷史故障數(shù)據(jù)集中的故障變量序列的變化趨勢(shì)在時(shí)間點(diǎn)上會(huì)出現(xiàn)不一致的問題。為了考慮它們之間的異步相關(guān)性,采用基于DDTW的異步PCA算法構(gòu)造關(guān)鍵變量序列和故障變量序列的異步協(xié)方差矩陣,根據(jù)關(guān)鍵變量與故障變量在負(fù)荷矩陣中的低維表示向量間的相似性識(shí)別故障類型。
假定歷史故障庫中共含有標(biāo)準(zhǔn)化的類由可測(cè)擾動(dòng)引起的故障,從歷史故障數(shù)據(jù)集中選取產(chǎn)生擾動(dòng)的變量作為故障變量。將故障中的故障變量記為,類故障變量組成故障模式矩陣。假定待辨識(shí)故障也是由可測(cè)擾動(dòng)引起的故障,從標(biāo)準(zhǔn)化的待辨識(shí)故障數(shù)據(jù)集中找出最能夠表征故障類型的變量作為關(guān)鍵變量。利用DDTW計(jì)算關(guān)鍵變量和故障模式矩陣中第個(gè)變量之間最優(yōu)的規(guī)整路徑。將最優(yōu)規(guī)整路徑上的元素組成與和相對(duì)應(yīng)的新序列和。
4 仿真分析
本文以CSTR系統(tǒng)[13]作為仿真研究對(duì)象,在CSTR的仿真過程中加入服從高斯分布的測(cè)量噪聲,模擬了表1中的5類由可測(cè)擾動(dòng)引起的故障。為使關(guān)鍵變量與故障變量之間存在異步關(guān)系,使歷史故障數(shù)據(jù)集F1H~F5H中的故障發(fā)生在第151個(gè)采樣時(shí)刻;使待辨識(shí)的故障數(shù)據(jù)集F1S~F5S中的故障發(fā)生在第201個(gè)采樣時(shí)刻,故障幅值選取所對(duì)應(yīng)歷史故障數(shù)據(jù)集的90%。在改進(jìn)的PCA相似系數(shù)法[14]中,選取主元模型的階數(shù)依據(jù)主元方差的貢獻(xiàn)率在95% 以上的原則。在基于異步PCA的故障識(shí)別方法中選擇負(fù)荷矩陣中特征向量的個(gè)數(shù)與改進(jìn)的PCA相似系數(shù)法保留的主元個(gè)數(shù)一致。
表1 故障類型
表2 F2S與F1H~F5H之間的相似系數(shù)和
Table 2 Similarity factors and between F2S and F1H~F5H
表2 F2S與F1H~F5H之間的相似系數(shù)和
F1HF2HF3HF4HF5H 0.58260.99830.54010.42660.7457 0.00070.99320.09300.07390.0003
表3 相似系數(shù)和對(duì)于F1S~F5S的REI指標(biāo) Table 3 REI index of similarity factor and for F1S~F5S F1SF2SF3SF4SF5S 0.36720.45930.38550.45880.4001 0.03140.03490.07440.02120.0412
表4 相似系數(shù)和對(duì)于F1S~F5S的RCD指標(biāo)
Table 4 RCD index of similarity factor and for F1S~F5S
表3 相似系數(shù)和對(duì)于F1S~F5S的REI指標(biāo)
F1SF2SF3SF4SF5S 0.45150.25300.42910.31850.3597 0.91460.90640.80200.95060.8912
表5 F1(1)S~F1(5)S與F1H~F5H之間的相似系數(shù)和
Table 5 Similarity factors and between F1(1)S~F1(5)S and F1H~F5H
表5 F1(1)S~F1(5)S與F1H~F5H之間的相似系數(shù)和
F1HF2HF3HF4HF5H F1(1)S0.99450.37080.39140.34410.4751 0.99390.02060.06070.05020.0027 F1(2)S0.99920.46600.40340.35050.5180 0.99990.03810.07260.04410.0013 F1(3)S0.99800.42390.38800.39150.4960 0.99920.03090.03160.02780.0046 F1(4)S0.97680.44180.41920.38660.5326 0.98550.01300.06070.04310.0058 F1(5)S0.95170.44010.36780.35110.5261 0.99710.02620.07780.03190.0024
5 結(jié) 論
針對(duì)傳統(tǒng)的PCA方法忽略變量間異步關(guān)系的問題,本文提出了基于異步PCA的故障識(shí)別算法。該方法采用DDTW構(gòu)造能夠反映待辨識(shí)故障數(shù)據(jù)的關(guān)鍵變量序列和歷史故障數(shù)據(jù)的故障變量序列間異步相關(guān)性的新序列,對(duì)新序列的協(xié)方差矩陣進(jìn)行特征值分解求取原始關(guān)鍵變量和故障變量的低維表示向量,根據(jù)低維表示向量間的相似性識(shí)別故障類型。在CSTR過程上的仿真結(jié)果表明提出的故障識(shí)別方法與現(xiàn)有的PCA相似系數(shù)法相比具有更好的故障識(shí)別性能。
符號(hào)說明:
? 異步PCA的負(fù)荷矩陣? 關(guān)鍵變量和故障變量的所有新序列組成的矩陣 ? 異步PCA的第個(gè)負(fù)荷向量? 時(shí)間序列數(shù)據(jù) DDTW(S,R)? 最小的累積DDTW距離? 異步PCA負(fù)荷矩陣的第行 ? 第個(gè)數(shù)據(jù)點(diǎn)處的一階導(dǎo)數(shù)值? 時(shí)間序列數(shù)據(jù) ? 第個(gè)數(shù)據(jù)點(diǎn)處的一階導(dǎo)數(shù)值? 異步PCA的相似系數(shù) ? 第個(gè)歷史故障數(shù)據(jù)集? 改進(jìn)的PCA相似系數(shù) ? 待辨識(shí)故障數(shù)據(jù)集? 異步PCA的協(xié)方差矩陣 ? 故障模式矩陣 ? PCA的負(fù)荷矩陣 ? 保留的主元數(shù)? 正常工況數(shù)據(jù)集 ? 路徑矩陣 — 故障變量序列 ? 路徑矩陣上的元素— 關(guān)鍵變量序列 ? 最優(yōu)彎曲路徑— 第個(gè)故障變量的新序列 ? 最優(yōu)彎曲路徑上的元素 — 關(guān)鍵變量的新序列
[1] Progovac D, Wang L Y, Yin G. Parameter estimation and reliable fault eetection of electric motors [J]. Control Theory and Technology, 2014, 12(2): 110-121.
[2] LI Gui-xiang (李桂香), WANG Lei (王磊), LI Ji-ding (李繼定),. Modeling of hydrogen recovery membrane separation process based on PCA-LSSVM (基于PCA-LSSVM的氫回收膜分離過程建模) [J]. Journal of Chemical Engineering of Chinese Universities (高?;瘜W(xué)工程學(xué)報(bào)), 2013, 27(5): 877-883.
[3] Qin S J. Survey on data-driven industrial process monitoring and diagnosis [J]. Annual Reviews in Control, 2012, 36(2): 220-234.
[4] XIE Lei (謝磊), HE Ning (何寧), WANG Shu-qing (王樹青). Step-by-step adaptive MPCA applied to an industrial batch process (步進(jìn)MPCA及其在間歇過程監(jiān)控中的應(yīng)用) [J]. Journal of Chemical Engineering of Chinese Universities (高?;瘜W(xué)工程學(xué)報(bào)), 2004, 18(5): 643-647.
[5] Yao M, Wang H, Xu W. Batch process monitoring based on functional data analysis and support vector data description [J]. Journal of Process Control, 2014, 24(7): 1085-1097.
[6] Li H L. Asynchronism-based principal component analysis for time series data mining [J]. Expert Systems with Applications, 2014, 41(6): 2842-2850.
[7] Miller P, Swanson R E, Heckler C E. Contribution plots: a missing link in multivariate quality control [J]. Applied Mathematics and Computer Science, 1998, 8(4): 775-792.
[8] Qin S J. Statistical process monitoring: basics and beyond [J]. Journal of Chemometrics, 2003, 17(8-9): 480-502.
[9] Krzanowski W J. Between-groups comparison of principal components [J]. Journal of the American Statistical Association, 1979, 74(367): 703-707.
[10] Singhal A, Seborg D E. Pattern matching in historical batch data using PCA [J]. Control Systems, IEEE, 2002, 22(5): 53-63.
[11] Jeong Y S, Jeong M K, Omitaomu O A. Weighted dynamic time warping for time series classification [J]. Pattern Recognition, 2011, 44(9): 2231-2240.
[12] Keogh E J, Pazzani M J. Derivative dynamic time warping [C]//First SIAM international conference on data mining (SDM’2001), Chicago, 2001.
[13] Cai L F, Tian X M. A new fault detection method for non-Gaussian process based on robust independent component analysis [J]. Process Safety and Environmental Protection, 2014, 92(6): 645-658.
[14] Deng Xiao-Gang, TIAN Xue-min. Nonlinear process fault pattern recognition using statistics kernel PCA similarity factor [J]. Neurocomputing, 2013, 121(18): 298-308.
A Fault Identification Method Based on Asynchronous PCA
ZHANG Han-yuan, TIAN Xue-min
(College of Information and Control Engineering, China University of Petroleum (East China), Qindao 266580, China)
Traditional principal component analysis (PCA) only considers synchronous correlation between different variables. In this paper, a novel fault identification approach based on asynchronous PCA was proposed. Derivative dynamic time warping (DDTW) was used to obtain the best warping path between key variables and fault variables, and the elements in the best warping path were extended to two new series which reflected asynchronous correlation in-between. Eigenvalue decomposition was then executed based on the covariance of the new series to achieve a loading matrix. Finally, the fault pattern of snapshot dataset was identified by measuring similarity between the lower-dimensional representation vectors of the original key variables and the fault variables. Simulation results on a continuous stirred tank reactor (CSTR) process demonstrate that the proposed method can identify the pattern of fault snapshort dataset more effectively than the PCA similarity factor method.
asynchronous correlation; principal component analysis; derivative dynamic time warping; fault identification
1003-9015(2016)03-0680-06
TP277
A
10.3969/j.issn.1003-9015.2016.03.026
2015-04-30;
2015-07-18。
國家自然科學(xué)基金(61273160,61403418);山東省自然科學(xué)基金(ZR2014FL016);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(14CX06132A)。
張漢元(1991-),男,山東濟(jì)寧人,中國石油大學(xué)(華東)博士生。
田學(xué)民,E-mail: tianxm@upc.edu.cn