楊為惠,陳彥萍,溫福喜,高 聰
(西安郵電大學(xué) a.計(jì)算機(jī)學(xué)院,b.大數(shù)據(jù)處理研究中心,西安 710121)
隨著信息技術(shù)和自動(dòng)化技術(shù)的快速發(fā)展,現(xiàn)代工業(yè)系統(tǒng)的集成度和復(fù)雜度越來(lái)越高。各部分之間的相互影響也越來(lái)越復(fù)雜,導(dǎo)致系統(tǒng)發(fā)生故障和功能失效的概率逐漸加大,且故障一旦發(fā)生,危害影響極大,嚴(yán)重的會(huì)導(dǎo)致系統(tǒng)整個(gè)失效和癱瘓。故障診斷就是在這種背景下,在故障已經(jīng)發(fā)生后,確定故障的性質(zhì)及其對(duì)未發(fā)生故障部分的影響,給出補(bǔ)救策略。
但如果在故障發(fā)生的早期,即在其還未對(duì)系統(tǒng)造成任何損害的情況下及時(shí)地檢測(cè)出故障的發(fā)生,就可以提前實(shí)施可靠的維修策略排除故障,從而避免產(chǎn)品損壞、系統(tǒng)癱瘓以及災(zāi)難性事故的發(fā)生?;谶@一背景,故障預(yù)測(cè)與健康管理(prognosis and health management,PHM)技術(shù)應(yīng)運(yùn)而生。
現(xiàn)代工業(yè)系統(tǒng)已經(jīng)可以采集并且積累了海量的過(guò)程運(yùn)行數(shù)據(jù),基于數(shù)據(jù)驅(qū)動(dòng)(data-driven)的故障預(yù)測(cè)方法[2]逐漸獲得重視并取得快速發(fā)展。如何有效利用這些數(shù)據(jù),依據(jù)一些智能算法來(lái)建立系統(tǒng)的故障預(yù)測(cè)模型,是保障復(fù)雜工程系統(tǒng)安全高效運(yùn)行亟待解決的問(wèn)題。而工業(yè)過(guò)程數(shù)據(jù)的非線(xiàn)性、小樣本及自回歸特性,以及故障預(yù)測(cè)中的不確定性問(wèn)題等,為預(yù)測(cè)建模提升了難度[3]。
高斯過(guò)程[4]回歸是近年發(fā)展起來(lái)的一種機(jī)器學(xué)習(xí)回歸方法,它有著嚴(yán)格的統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ), 對(duì)處理高維數(shù)、小樣本、非線(xiàn)性等復(fù)雜的問(wèn)題具有很好的適應(yīng)性, 且泛化能力強(qiáng)。與神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)相比, 具有容易實(shí)現(xiàn)、超參數(shù)自適應(yīng)獲取、非參數(shù)推斷靈活以及輸出具有概率意義等優(yōu)點(diǎn)。
在故障預(yù)測(cè)中,預(yù)測(cè)方法是最基礎(chǔ),也是最核心的部分。
數(shù)據(jù)驅(qū)動(dòng)故障預(yù)測(cè)方法主要集中在機(jī)器學(xué)習(xí)、計(jì)算智能或其他統(tǒng)計(jì)模型[6-7]。應(yīng)用較為廣泛和相對(duì)成熟的方法有自回歸(AR)模型[8],支持向量機(jī)(SVM)[9-10],相關(guān)向量機(jī)(RVM)和神經(jīng)網(wǎng)絡(luò)(NN,neural network)[12-13]以及隨機(jī)過(guò)程模型如馬爾可夫模型、高斯過(guò)程回歸模型等。
以上方法中,AR是線(xiàn)性模型,只適用于線(xiàn)性時(shí)間序列建模;其余方法為非線(xiàn)性模型,適用于工業(yè)過(guò)程中的非線(xiàn)性數(shù)據(jù)建模。文獻(xiàn)[14]對(duì)NN建模技術(shù)進(jìn)行了多步預(yù)測(cè)的預(yù)測(cè)性能研究,文獻(xiàn)[15]提出先對(duì)時(shí)間序列進(jìn)行EMD分解得到若干個(gè)分量,然后用神經(jīng)網(wǎng)絡(luò)模型分別對(duì)時(shí)間序列的EMD 分量進(jìn)行多步預(yù)測(cè),最后將該若干個(gè)分量作為輸入,用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行時(shí)間序列的多步預(yù)測(cè)。文獻(xiàn)[16]基于改進(jìn)的小波神經(jīng)網(wǎng)絡(luò)算法對(duì)機(jī)床軸承故障進(jìn)行預(yù)測(cè)。然而,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)尚沒(méi)有統(tǒng)一的理論依據(jù),比如網(wǎng)絡(luò)的層數(shù)、神經(jīng)元的個(gè)數(shù)、傳遞函數(shù)的選擇等,因此網(wǎng)絡(luò)構(gòu)建上有一定困難。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量的數(shù)據(jù),而在工業(yè)過(guò)程中往往只有少量的故障數(shù)據(jù)樣本,樣本缺乏致使網(wǎng)絡(luò)性能下降。人工神經(jīng)網(wǎng)絡(luò)收斂速度慢,訓(xùn)練過(guò)程中存在過(guò)度擬合或擬合不足等問(wèn)題,并且輸出無(wú)概率意義,無(wú)法確定預(yù)測(cè)結(jié)果的置信度。
相關(guān)向量機(jī)、高斯過(guò)程回歸模型這兩種方法具備不確定性的管理能力[17]。較之NN模型,高斯過(guò)程具有完備的貝葉斯理論基礎(chǔ),在給出預(yù)測(cè)結(jié)果的同時(shí)還會(huì)給出一個(gè)置信區(qū)間,用作故障預(yù)測(cè)不確定性的度量。
文獻(xiàn)[18]基于高斯過(guò)程建立TE仿真數(shù)據(jù)的單步預(yù)測(cè)模型,并將之運(yùn)用于在線(xiàn)的故障檢測(cè),但是忽略了過(guò)程數(shù)據(jù)的時(shí)間序列特性。文獻(xiàn)[19]提出用高斯過(guò)程模型對(duì)混沌時(shí)間序列進(jìn)行單步與多步預(yù)測(cè),并提出用混合的高斯過(guò)程核函數(shù)進(jìn)行建模。盡管如此,以上文獻(xiàn)提出的方法(包括基于NN模型的方法),都是根據(jù)數(shù)據(jù)的統(tǒng)計(jì)特征建立模型,沒(méi)有將數(shù)據(jù)具有的物理意義作為先驗(yàn)信息加入到模型中,而不同的工業(yè)過(guò)程、同一工業(yè)過(guò)程不同的模態(tài)下產(chǎn)生的數(shù)據(jù)都具有不同的物理特性。文獻(xiàn)[20]提出了一種根據(jù)EMD分解環(huán)境監(jiān)測(cè)數(shù)據(jù),根據(jù)數(shù)據(jù)的物理特性構(gòu)建核函數(shù)的方法。本文基于高斯過(guò)程回歸(GPR,gaussian process regression)建立工業(yè)過(guò)程中時(shí)間序列數(shù)據(jù)的模型。通過(guò)針對(duì)特定數(shù)據(jù)構(gòu)建高斯過(guò)程核函數(shù)來(lái)更好的描述數(shù)據(jù)特性,從而提升模型性能;并且在基于單步預(yù)測(cè)基礎(chǔ)上,實(shí)現(xiàn)了不同種方法的多步預(yù)測(cè)。實(shí)驗(yàn)數(shù)據(jù)為在TE平臺(tái)[5]上采集到復(fù)雜工業(yè)過(guò)程的模擬數(shù)據(jù),通過(guò)大量的預(yù)測(cè)精度性能對(duì)比實(shí)驗(yàn)表明,構(gòu)建的高斯過(guò)程預(yù)測(cè)方法較之對(duì)比的預(yù)測(cè)方法具有較高的平均預(yù)測(cè)精度。
2.1.1 高斯過(guò)程回歸模型
假設(shè)觀(guān)測(cè)目標(biāo)值yi由一個(gè)未知函數(shù)f決定,并且被一個(gè)獨(dú)立同分布的高斯噪聲ωi腐蝕,即
yi=f(xi)+ωi.
(1)
式中:ωi為獨(dú)立的隨機(jī)變量,符合高斯分布,均值為0,方差為σ2(假設(shè)訓(xùn)練和測(cè)試數(shù)據(jù)的噪聲具有相同的分布,即ωi∶N(0,K).
在高斯過(guò)程回歸方法中,通常賦予f一個(gè)均值為0的高斯過(guò)程先驗(yàn)概率分布:
f|x,θ∶N|(0,K) .
(2)
式中:K是一個(gè)N×N維的對(duì)稱(chēng)正定的協(xié)方差矩陣,Ki,j=k(xi,yj),k(·,·)是協(xié)方差函數(shù),也稱(chēng)核函數(shù)。它是一個(gè)以超參數(shù)θ為自變量的正定函數(shù),因此,訓(xùn)練輸出y的概率分布為:
y|x,θ∶N(0,K+σ2I) .
(3)
給定一個(gè)測(cè)試輸入數(shù)據(jù)x*和對(duì)應(yīng)的測(cè)試輸出數(shù)據(jù)y*以及相應(yīng)的先驗(yàn)概率分布抽樣得到f(x*),f(x)與f(x*)的聯(lián)合概率分布也是一個(gè)均值為0的多維高斯過(guò)程:
(4)
其中,K*=[k(x*,x1),…,k(x*,xN)]T,K**=k(x*,x*).
基于式(1)中的高斯噪聲假設(shè),訓(xùn)練輸出y和測(cè)試輸出y*的聯(lián)合概率分布為:
(5)
根據(jù)條件高斯法則,可以推導(dǎo)出
y*|y,x,θ,σ2∶N(m(x*),v(x*)) .
(6)
其中,預(yù)測(cè)值y*的均值m(x*)和標(biāo)準(zhǔn)差v(x*)為:
(7)
(8)
由此可以看出,已知協(xié)方差函數(shù)和它的超參數(shù),就可以對(duì)未來(lái)時(shí)刻的數(shù)據(jù)做出預(yù)測(cè)。
2.1.2 模型訓(xùn)練
模型的訓(xùn)練就是獲取協(xié)方差函數(shù)的參數(shù)最優(yōu)值。目前GPR模型大多采用極大似然估計(jì)(maximum likelihood estimation,MLE)獲得超參數(shù)的最優(yōu)取值,即通過(guò)建立訓(xùn)練樣本條件概率的對(duì)數(shù)似然函數(shù),并對(duì)超參數(shù)求偏導(dǎo),再采用共軛梯度優(yōu)化方法搜索出超參數(shù)的最優(yōu)解,具體求解過(guò)程可見(jiàn)參考文獻(xiàn)[4].
其中對(duì)數(shù)似然函數(shù)的形式為:
(9)
對(duì)上式求偏導(dǎo)的結(jié)果為:
(10)
2.1.3 基于EMD的核函數(shù)構(gòu)建方法
高斯過(guò)程的協(xié)方差函數(shù)為模型的訓(xùn)練增加了很大靈活性,但是怎樣構(gòu)建協(xié)方差函數(shù)就變成了一個(gè)難點(diǎn)。運(yùn)用不同的核函數(shù)訓(xùn)練的模型性能會(huì)有較大的差距。以下為平方指數(shù)核函數(shù)(squared exponential,SE),周期核函數(shù)(periodic,Per),線(xiàn)性核函數(shù)(linear,Lin)和二次有理數(shù)核函數(shù)(rational quadratic,RQ) 的表達(dá)式:
(11)
(12)
(13)
(14)
Merce原理指出,一個(gè)矩陣只要滿(mǎn)足半正定就可以是一個(gè)協(xié)方差矩陣。通過(guò)將兩個(gè)核函數(shù)相加和相乘的操作組合依然是一個(gè)有效的核函數(shù)。DAVID[21]在研究中總結(jié)了基本核函數(shù)所表述的數(shù)據(jù)特性和在組合后他們的特性變化規(guī)律。
在以上的核函數(shù)中,SE描述數(shù)據(jù)局部變化的特征,Per描述數(shù)據(jù)周期性變化的特征,并且是一個(gè)全局性的周期核函數(shù),Lin描述數(shù)據(jù)的長(zhǎng)期變化趨勢(shì),RQ描述數(shù)據(jù)的不規(guī)則變動(dòng);核函數(shù)的相加與相乘都會(huì)有相應(yīng)的特性變化,例如,Lin核加Per核具有趨勢(shì)周期特性,SE乘Per核函數(shù)具有局部周期的特性。
HUANG et al提出的經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)是一種基于信號(hào)局部特征的自適應(yīng)分解方法[22],可以有效地將原始時(shí)域信號(hào)分解為具有多尺度時(shí)頻特性的本征模態(tài)函數(shù)(intrinsic mode functions,IMFs).該方法在旋轉(zhuǎn)機(jī)械故障診斷領(lǐng)域、高層建筑和橋梁健康狀態(tài)監(jiān)測(cè)得到了廣泛應(yīng)用。工業(yè)過(guò)程中傳感器監(jiān)測(cè)到的過(guò)程數(shù)據(jù)分解得到的不同IMFs往往具有不同的物理含義[23]。
根據(jù)以上的規(guī)律,就可以依據(jù)特定數(shù)據(jù)的物理特性,構(gòu)建具有針對(duì)性的高斯過(guò)程核函數(shù),使模型具有更加好的預(yù)測(cè)性能。
2.2.1 預(yù)測(cè)策略
為了掌握更多的未來(lái)信息,需要對(duì)高斯過(guò)程模型進(jìn)行多步預(yù)測(cè)[19]。多步預(yù)測(cè)是建立在上文單步的模型基礎(chǔ)上的。預(yù)測(cè)策略是多步預(yù)測(cè)的重要研究?jī)?nèi)容。
在預(yù)測(cè)策略方面,現(xiàn)階段應(yīng)用的預(yù)測(cè)策略主要有迭代策略和直接策略。多步預(yù)測(cè)策略在TAIEB的文獻(xiàn)[24]中有比較全面的闡述和研究。
2.2.1.1迭代策略
迭代預(yù)測(cè)策略中,首先需要建立單步預(yù)測(cè)模型,
yt=f(xt)+ω.
(15)
式中,xt={(xt,…,xt-d+1)},yt,d為輸入維數(shù),即時(shí)延步數(shù),ω是高斯噪聲。
在接下來(lái)的迭代過(guò)程中,將yt當(dāng)做其中一個(gè)輸入變量,同時(shí)剔除時(shí)延最久的輸入變量,從而在輸入變量個(gè)數(shù)不變和模型不變的情況下實(shí)現(xiàn)下一時(shí)刻的yt+1預(yù)測(cè),以此類(lèi)推,直到預(yù)測(cè)得到y(tǒng)t+H-1.
2.2.1.2直接策略
直接多步預(yù)測(cè)策略,即在相同的輸入數(shù)據(jù)的基礎(chǔ)上對(duì)每一步預(yù)測(cè)建立相應(yīng)的預(yù)測(cè)模型。每一步的預(yù)測(cè)輸出值如下式:
[yt+h-1,yt+h-2,…,yt]=fh(xt,…,xt-d+1)+ω.
(16)
其中,yt,d為輸入維數(shù),ω是高斯噪聲。
式中沒(méi)有任何的預(yù)測(cè)輸出作為下一時(shí)刻的輸入,因此,多步預(yù)測(cè)誤差并不會(huì)受到前面預(yù)測(cè)值的影響而不斷的放大。然而,因?yàn)橹苯拥亩嗖筋A(yù)測(cè)之間關(guān)聯(lián)性較弱,可能導(dǎo)致預(yù)測(cè)輸出值偏差較大。
2.2.2 預(yù)測(cè)原理
高斯過(guò)程回歸模型的預(yù)測(cè)方差不僅能夠解釋模型參數(shù)不確定性的影響,還可以描述過(guò)程的不確定性[17]。通過(guò)預(yù)測(cè)值和方差,可確定實(shí)際值可能的范圍,以2倍方差來(lái)設(shè)置預(yù)測(cè)值的置信區(qū)間[yt+h-1-2σ,yt+h-1+σ],其中,yt+h-1表示提前h步的預(yù)測(cè)值。從而確定可能出現(xiàn)故障的最早或者最遲時(shí)間。
由于在實(shí)際情況中,對(duì)于任何大型工業(yè)過(guò)程而言,數(shù)據(jù)是無(wú)法公開(kāi)得到的。為了驗(yàn)證本文提出的算法在時(shí)序數(shù)據(jù)異常檢測(cè)中的有效性,選用了TE(Tennessee Eastman)仿真平臺(tái)對(duì)本文算法進(jìn)行驗(yàn)證。
TE化工過(guò)程是Eastman一個(gè)實(shí)際工藝流程的原型。整個(gè)過(guò)程包括5個(gè)主要操作單元,即反應(yīng)器、冷凝器、循環(huán)壓縮機(jī)、氣液分離器和產(chǎn)品解吸塔。TE過(guò)程共有41個(gè)測(cè)量變量和12個(gè)操控變量,并設(shè)定21種故障類(lèi)型。由于攪拌速度XMV(12)在反應(yīng)過(guò)程中保持恒定不變,其對(duì)系統(tǒng)的建模沒(méi)有任何影響,因而選擇前52個(gè)變量[XMEAS(1),…,XMEAS(41),XMV(1),…,XMV(11)]T作為某一特定時(shí)刻的原始觀(guān)測(cè)信號(hào)向量。
圖1 TE工業(yè)過(guò)程原理圖Fig.1 A process ftowsheet of the TE
在仿真實(shí)驗(yàn)中,設(shè)定TE過(guò)程總反應(yīng)時(shí)間為48 h,采樣間隔為3 min.所有的異常都是在仿真開(kāi)始8 h后引進(jìn)。因此此類(lèi)故障的仿真可采集到48×20=960個(gè)數(shù)據(jù)樣本,每個(gè)樣本數(shù)據(jù)包含52維特征,每一類(lèi)異常數(shù)據(jù)樣本是一個(gè)960×52的樣本矩陣。
接下來(lái)就以異常一為例進(jìn)行實(shí)驗(yàn)。異常一的定義是A/C進(jìn)料比發(fā)生了變化,主要影響的特征變量為XMSE(1)和XMSE(4).
異常一的XMSE(1)特征變量作為數(shù)據(jù)集a1,XMSE(4)特征變量作為數(shù)據(jù)集a2.每個(gè)數(shù)據(jù)集均包含了480個(gè)訓(xùn)練樣本和960個(gè)測(cè)試樣本。
本節(jié)將提出的高斯過(guò)程模型與BP神經(jīng)網(wǎng)絡(luò)和應(yīng)用最廣泛的RBF核函數(shù)高斯過(guò)程模型進(jìn)行對(duì)比,并與兩種預(yù)測(cè)策略相結(jié)合,共形成6種多步預(yù)測(cè)方法:高斯過(guò)程迭代策略模型(GPI)、高斯過(guò)程直接策略模型(GPD)、神經(jīng)網(wǎng)絡(luò)迭代策略模型(NNI)、神經(jīng)網(wǎng)絡(luò)直接策略模型(NND)、高斯過(guò)程RBF迭代策略模型(GPrI)和高斯過(guò)程RBF直接策略模型(GPrD).
高斯過(guò)程模型的先驗(yàn)分布為自由度為4的Student's T分布。
在應(yīng)用BP神經(jīng)網(wǎng)絡(luò)模型時(shí),根據(jù)輸入要求,設(shè)置輸入節(jié)點(diǎn)個(gè)數(shù)為4,設(shè)置隱藏層的神經(jīng)元個(gè)數(shù)為10.BP網(wǎng)絡(luò)的訓(xùn)練函數(shù)為trainlm函數(shù)。
本節(jié)采用均方根誤差(RMSE)評(píng)價(jià)多步預(yù)測(cè)方法的性能。方根誤差ERMS計(jì)算表達(dá)式為:
(17)
圖2為原始數(shù)據(jù)通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解得到的4個(gè)IMF分量。IMF1表達(dá)了數(shù)據(jù)有不規(guī)則變化與局部變化的物理特性,IMF2,IMF3與IMF4表示了數(shù)據(jù)有局部周期特性與周期特性。所以在核函數(shù)的構(gòu)建中通過(guò)加入SE核與RQ核描述數(shù)據(jù)的局部變化與不規(guī)則變化,通過(guò)加入Per核函與SE核相乘來(lái)描述局部周期變化。
圖2 原始數(shù)據(jù)與其IMF分量Fig.2 Raw data and its IMF component
最終構(gòu)建的核函數(shù)為:
K=SE×Per+SE+RQ .
(18)
首先,基于a1和a2數(shù)據(jù)集,比較GPI,GPD,GPrI,GPrD,NNI,NND 6種方法的五步預(yù)測(cè)結(jié)果。圖3—圖7為6種方法在a1數(shù)據(jù)集上五步預(yù)測(cè)的預(yù)測(cè)值與真實(shí)值的對(duì)比??梢悦黠@看出,對(duì)神經(jīng)網(wǎng)絡(luò)而言,基于高斯過(guò)程模型的預(yù)測(cè)方法得到的預(yù)測(cè)值曲線(xiàn)與真實(shí)值曲線(xiàn)擬合得更好。
圖3 a1數(shù)據(jù)集上GPD與GPI的五步預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比Fig.3 Five-step ahead prediction results of GPD and GPI on a1 data set compare with the real value
6種預(yù)測(cè)方法對(duì)2種數(shù)據(jù)集的5步預(yù)測(cè)性能(通過(guò)RMSE計(jì)算得到)的統(tǒng)計(jì)結(jié)果如表1和表2所示,由于神經(jīng)網(wǎng)絡(luò)的方法需要交叉驗(yàn)證,故神經(jīng)網(wǎng)絡(luò)的RMSE是5次實(shí)驗(yàn)求平均值得到。
由表1和表2可以看出,本文提出的預(yù)測(cè)方法在兩個(gè)數(shù)據(jù)集上的5步預(yù)測(cè)都有最小的RMSE.這說(shuō)明提出的基于高斯過(guò)程的預(yù)測(cè)方法得到的預(yù)測(cè)值與其他方法相比更接近于真實(shí)的傳感器測(cè)量值。而基于高斯過(guò)程的方法相較于神經(jīng)網(wǎng)絡(luò)都有較小的RMSE,表明高斯過(guò)程回歸方法處理具有小樣本特性的工業(yè)過(guò)程故障數(shù)據(jù)時(shí)更有優(yōu)勢(shì),而神經(jīng)網(wǎng)絡(luò)模型的性能可能會(huì)因?yàn)橛?xùn)練樣本不夠充分而受限。
固定回歸階數(shù)P=4,預(yù)測(cè)步長(zhǎng)依次為[1,5,10,20,50],相應(yīng)的預(yù)測(cè)結(jié)果的RMSE的變化情況如表3,表4所示??梢钥闯?,隨著預(yù)測(cè)步長(zhǎng)的增大,各種方法的預(yù)測(cè)結(jié)果的RMSE呈逐漸增大的趨勢(shì)。當(dāng)步長(zhǎng)低于20步時(shí),一般迭代預(yù)測(cè)方法的RMSE低于直接預(yù)測(cè)方法,而當(dāng)步長(zhǎng)大于20時(shí),往往直接預(yù)測(cè)取得更低的RMSE,這是因?yàn)榈倪^(guò)程中會(huì)累積誤差,步長(zhǎng)越大,迭代次數(shù)越多,誤差就越大。特別地,GPD預(yù)測(cè)方法的RMSE絕大多數(shù)低于其他方法,表明在各種預(yù)測(cè)步長(zhǎng)之下,提出的基于高斯過(guò)程的預(yù)測(cè)方法能夠?qū)I(yè)過(guò)程數(shù)據(jù)進(jìn)行更準(zhǔn)確的多步預(yù)測(cè)。
圖4 a1數(shù)據(jù)集上GPrD與GPrI的五步預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比Fig.4 Five-step ahead prediction results of GPrD and GPrI on a1 data set compare with the real value
圖5 a1數(shù)據(jù)集上NND與NNI的5步預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比Fig.5 Five-step ahead prediction results of NND and NNI on a1 data set compare with the real value
RMSEGPGPrNNI0.04100.04180.0578D0.04010.04130.0514
表2 a2數(shù)據(jù)集上5步預(yù)測(cè)的性能統(tǒng)計(jì)結(jié)果Table 2 The performance of 5-step ahead prediction on a2 data set
圖6 a1數(shù)據(jù)集上GPI與GPrI的10步預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比Fig.6 Ten-step ahead prediction results of GPI and GPrI on a1 data set compare with the real value
本文基于高斯過(guò)程模型對(duì)工業(yè)過(guò)程中的歷史數(shù)據(jù)建立預(yù)測(cè)模型,通過(guò)對(duì)過(guò)程中監(jiān)測(cè)變量的多步預(yù)測(cè),實(shí)現(xiàn)了故障的提前預(yù)知。針對(duì)不同的工業(yè)過(guò)程,不同的工況,數(shù)據(jù)會(huì)呈現(xiàn)出不同的物理特性。通過(guò)分析特定數(shù)據(jù)的物理特性,構(gòu)建出可以描述該特性的核函數(shù);同時(shí)結(jié)合多種多步預(yù)測(cè)策略和建模方法,在TE模擬數(shù)據(jù)集上進(jìn)行了一系列對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的方法有更好的預(yù)測(cè)精度。下一步將TE模型的更多種類(lèi)故障數(shù)據(jù)上、在多模態(tài)情況下驗(yàn)證該方法的性能。
圖7 a1數(shù)據(jù)集上GPD與NND的20步預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比Fig.7 Twenty-step ahead prediction results of GPD and NND on a1 data set compare with the real value
表3 a1數(shù)據(jù)集上不同步長(zhǎng)預(yù)測(cè)性能比較Table 3 The performance of multi-step ahead prediction based on different method on a1 data set
表4 a2數(shù)據(jù)集上不同步長(zhǎng)預(yù)測(cè)性能比較Table 4 The performance of multi-step ahead prediction based on different method on a2 data set
[1] 曾聲奎,MICHAEL G PECHT,吳際.故障預(yù)測(cè)與健康管理(PHM)技術(shù)的現(xiàn)狀與發(fā)展[J].航空學(xué)報(bào),2005,26(5):627-632.
ZENG S K,MIEHAEL G PECHT,WU J.Status and perspectives of prognostics and health management technologies[J].Acta Aeronautica et Astronautica Sinica,2005,26(5):627-632.
[2] 彭宇,劉大同.數(shù)據(jù)驅(qū)動(dòng)故障預(yù)測(cè)和健康管理綜述[J].儀器儀表學(xué)報(bào),2014,35(3):481-495.
PENG Y,LIU D T.Data-driven prognostics and health management:a review of recent advances[J].Chinese Journal of Scientific Instrument,2014,35(3):481-495.
[3] 劉強(qiáng),秦泗釗.過(guò)程工業(yè)大數(shù)據(jù)建模研究展望[J].自動(dòng)化學(xué)報(bào),2016,42(2):161-171.
LIU Q,QIN S Joe.Perspectives on big data modeling of process industries[J].Acta Automatica Sinica,2016,42(2):161-171.
[4] RASMUSSEN C E,WILLIAMS C K I.Gaussian processes for machine learning[M].London:The MIT Press,2006.
[5] ANDREAS BATHELT,LAWRENCE RICKER N,MOHIEDDINE JELALI.Revision of the tennessee eastman process model[J].International Symposium on Advanced Control of Chemical Processes,2014(9):
[6] HENG A,ZHANG S,TAN ACC,et al.Rotating machineryprognostics:State of the art,challenges and opportunities[J].Mechanical Systems and Signal Processing,2009,23(3):724-739.
[7] PENG Y,DONG M,ZUO M J.Current status of machine prognostics in condition-based maintenance:a review[J].The International Journal of Advanced Manufacturing Technology,2010,50(1/4):297-313.
[8] LIU D,LUO Y,PENG Y,et al.Lithium-ion battery remaining useful life estimation based on nonlinear AR model combined with degradation feature[C]∥Annual Conference of the Prognostics and Health Management Society 2012,Minneapolis,Minnesota,USA.2012:1-7.
[9] QU J,ZUO M J.An LSSVR-based algorithm for online system condition prognostics[J].Expert Systems with Applications,2012,39(5):6089-6102.
[10] WIDODO A,SHIM M C,CAESARENDRA W,et al.Intelligent prognostics for battery health monitoring based on sample entropy[J].Expert Systems with Applications,2011,38(9):11763-11769.
[11] 朱永利,尹金良.組合核相關(guān)向量機(jī)在電力變壓器故障診斷中的應(yīng)用研究[J].中國(guó)電機(jī)工程學(xué)報(bào),2013,33(22):68-74.
ZHU Y L,YIN J L.Study on application of multi-kernel learning relevance vector machines in fault diagnosis of power transformers[J].Proceedings of the CSEE,2013,33(22):68-74.
[12] LIU J,SAXENA A,GOEBEL K,et al.An adaptive recurrent neural network for remaining useful life prediction of lthium-ion batteries[C]∥Annual Conference of thePrognostics and Health Management Society 2010.2010.
[13] PEEL L,GOLD I.Data driven prognostics using a Kalman filter ensemble of neural network models[C]∥International Conference on Prognostics and Health Management 2008.2008:1-6.
[14] GUO Z H,ZHAO H Y,LU H Y,et al.Multi-step forecasting for wind speed using a modified EMD-based artificial neural network model[J].Renew Energy,2012,37(1):241-249.
[15] 謝景新,程春田,周桂紅.基于經(jīng)驗(yàn)?zāi)J椒纸馀c混沌分析的直接多步預(yù)測(cè)模型[J].自動(dòng)化學(xué)報(bào),2008,34(6):684-689.
XIE J X,CHENG C T,ZHOU G H.A new nulti-step ahead prediction model on EMD and chaos analysis[J].Acta Automatica Sinica,2008,34(6):684-689.
[16] LIU Q,LIU M,ZHANG F,et al.A fault prediction method based on modified genetic algorithm using BP neural network algorithm[C]∥2016 IEEE International Conference on Systems,Man,and Cybernetics.2016.
[17] 孫強(qiáng),岳繼光.基于不確定性的故障預(yù)測(cè)方法綜述[J].控制與決策,2015,29(5):769-778.
SUN Q,YUE J G.Review on fault prognostic methods based on uncertainty[J].Control and Decision,2015,29(5):769-778.
[18] 于冰潔,夏戰(zhàn)國(guó),王久龍.基于高斯過(guò)程模型的異常檢測(cè)算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2016,37(4):914-920.
YU B J,XIA Z G,WANG J L.Anomaly detection algorithm based on Gaussian process model[J].Computer Engineering and Design,2016,37(4):914-920.
[19] 李軍,張友鵬.基于高斯過(guò)程的混沌時(shí)間序列單步與多步預(yù)測(cè)[J].物理學(xué)報(bào),2011,60(7):143-152.
LI J,ZHANG Y P.Single-step and multiple-step prediction of chaotic time series using Gaussian process model[J].Acta Phys Sin,2011,60(7):143-152.
[20] 陳艷,王子健,趙澤,等.傳感器網(wǎng)絡(luò)環(huán)境監(jiān)測(cè)時(shí)間序列數(shù)據(jù)的高斯過(guò)程建模與多步預(yù)測(cè)[J].通信學(xué)報(bào),2015,36(10):252-262.
CHEN Y,WANG Z J,ZHAO Z,et al.Gaussian process modeling and multi-step prediction for time series data in wireless sensor network environmental monitoring[J].Journal on Communications,2015,36(10):252-262.
[21] DUVENAUD D,LLOYD J R,GROSSE R,et al.Structure discovery in nonparametric regression through compositional kernel search[C]∥Proc of the 30th International Conference on Machine Learning,Atlanta GA,USA.2013.1166-1174.
[22] HUANG N E,LONG S R,SHEN Z.The mechanism for frequency downshift in nonlinear wave evolution[J].Advances in Applied Mechanics,1996,32:59.
[23] CHEN J.Application of empirical mode decomposition in structural health monitoring:some experience[J].Advances in Adaptive Data Analysis,2009,1(4):601:621.
[24] TAIEB SB,SORJAMAA A,BONTEMPI G.Multiple-output modeling for multi-step-ahead time series forecasting[J].Neurocomputing,2010,73(10/12):1950-1957.