曲亞鑫,楊晶晶
(北方工業(yè)大學(xué)電氣與控制工程學(xué)院,北京,100144)
電站設(shè)備引風(fēng)機(jī)具有的特點(diǎn)是,具有很強(qiáng)的耦合性、是非線性的,并且有很多的測點(diǎn)。對(duì)于非線性機(jī)械設(shè)備來說,他們本身結(jié)構(gòu)就很復(fù)雜、故障的類型也各式各樣,會(huì)出現(xiàn)故障和現(xiàn)象無法找到映射的情況,因此很難去建立一個(gè)全面的故障知識(shí)庫。且采集到的數(shù)據(jù)很容易因?yàn)橥饨缒承┮蛩囟艿接绊?,?dǎo)致真實(shí)的信號(hào)被掩蓋。
為了解決以上問題,提出了一種基于多元狀態(tài)估計(jì)法的引風(fēng)機(jī)故障預(yù)警模型。多元狀態(tài)估計(jì)法的建模不需要大量的故障數(shù)據(jù),其次也不需要對(duì)單一變量分別建模,而是可以多變量一起建模。MSET方法可以快速建立描述設(shè)備正常狀態(tài)的模型。觀測狀態(tài)和估計(jì)狀態(tài)之間的差異意味著故障信息。MSET建模的核心在于過程記憶矩陣的構(gòu)建,而記憶矩陣構(gòu)建的核心在于數(shù)據(jù)選取。用于構(gòu)建過程記憶矩陣的數(shù)據(jù)首先對(duì)其進(jìn)行小波去噪,盡可能的消除噪聲的干擾,之后使用主成分分析法進(jìn)行降維,消除數(shù)據(jù)之間可能的相關(guān)性,以確保獲得的模型具有更高的精度。
引風(fēng)機(jī)各個(gè)觀測點(diǎn)的實(shí)際運(yùn)行狀態(tài)都可以通過引風(fēng)機(jī)的歷史運(yùn)行數(shù)據(jù)反映出來。這個(gè)數(shù)據(jù)非常的寶貴,對(duì)于數(shù)據(jù)挖掘,挖掘該設(shè)備的歷史工況、健康評(píng)估等都是非常有參考價(jià)值的。但是,由于引風(fēng)機(jī)實(shí)際工作中所處的環(huán)境相對(duì)惡劣,數(shù)據(jù)采集上難免受到一些干擾。例如因?yàn)閭鞲衅鞴收希瑢?dǎo)致采集到的數(shù)據(jù)出現(xiàn)的誤差,環(huán)境變化導(dǎo)致的數(shù)據(jù)誤差等等[1],這樣會(huì)讓采集的數(shù)據(jù)出現(xiàn)噪聲,造成數(shù)據(jù)質(zhì)量的下降,最終還會(huì)影響到模型的準(zhǔn)確性,小波變換對(duì)給定的信號(hào)可以同時(shí)在時(shí)域和頻域進(jìn)行分析,并能夠比較準(zhǔn)確地辨識(shí)出信號(hào)中的突變部分以及噪聲,濾噪效果非常好。
本文由于處理的數(shù)據(jù)為數(shù)字信號(hào),因此選用db N和sym N小波,先設(shè)定分解層數(shù)為4進(jìn)行小波分解,以采集的1000個(gè)引風(fēng)機(jī)電機(jī)電流為例各選用9種常用的小波基對(duì)信號(hào)進(jìn)行降噪處理,從重構(gòu)誤差和運(yùn)行時(shí)間上綜合比較后選擇Sym5小波基。
小波分解層數(shù)的方法[2]可以確定為能量對(duì)比實(shí)驗(yàn)法。能量對(duì)比實(shí)驗(yàn)法主要參考能量分布。當(dāng)正常信號(hào)和噪聲信號(hào)能量分布開始分離時(shí),整數(shù)分解層數(shù)為最佳分解層數(shù)。選擇分解層數(shù)為4層。
經(jīng)典閾值函數(shù)是Donoho提出的,分為軟和硬兩種閾值函數(shù)。硬閾值函數(shù)因?yàn)樵谛〔ㄓ騼?nèi)并非連續(xù)函數(shù),在重構(gòu)過程中可能會(huì)丟失重要信號(hào)并產(chǎn)生振蕩,因此本文后續(xù)處理采用軟閾值函數(shù)進(jìn)行。
進(jìn)行閾值選擇時(shí),其他參數(shù)保持一致,對(duì)隨機(jī)選取的連續(xù)12000個(gè)數(shù)據(jù)采用軟閾值函數(shù)去噪,分別選取rigrsure規(guī)則、heursure規(guī)則、minimaxi規(guī)則、sqtwolog規(guī)則處理數(shù)據(jù)進(jìn)行對(duì)比,四種不同閾值規(guī)則的評(píng)價(jià)方法對(duì)比如表1所示。
表1 不同閾值規(guī)則的評(píng)價(jià)指標(biāo)對(duì)比
根據(jù)兩個(gè)評(píng)價(jià)指標(biāo)的數(shù)值來看,Rigrsure閾值規(guī)則的去噪效果最好。
主成分分析(PCA)是最常用的線性降維方法[3]。PCA的基本思想是尋找高維數(shù)據(jù)的一些主分量表示,這些分量具有最大方差,用它們表示原數(shù)據(jù)具有最小的均方誤差,是一種有效的多元統(tǒng)計(jì)分析工具。
設(shè)引風(fēng)機(jī)共有m個(gè)樣本點(diǎn)和n個(gè)參數(shù)變量,則構(gòu)成的樣本集合矩陣*m nX如下:
其中每一行代表某一時(shí)刻各測點(diǎn)的值,每一列代表某個(gè)測點(diǎn)在不同時(shí)刻的值。
第一步,對(duì)樣本集合矩陣*m nX進(jìn)行Z-score標(biāo)準(zhǔn)化處理。
得到的相關(guān)系數(shù)矩陣R:
第三步,求相關(guān)系數(shù)矩陣R的特征值λ和特征向量ν。
第四步,計(jì)算引風(fēng)機(jī)各監(jiān)測參數(shù)變量的貢獻(xiàn)率jc,并對(duì)λj的大小進(jìn)行排序,使得λ1≥λ2≥… ≥λn。
式中λj為相關(guān)系數(shù)矩陣R的特征值。
第五步,計(jì)算引風(fēng)機(jī)各監(jiān)測參數(shù)變量的累積貢獻(xiàn)率kC,以此來確定引風(fēng)機(jī)主要的監(jiān)測參數(shù)。
式中:k(k 工程上當(dāng)Ck≥ 85%時(shí),便可認(rèn)為前k個(gè)主元保留了原始數(shù)據(jù)的大部分信息,為引風(fēng)機(jī)主要的狀態(tài)監(jiān)測參數(shù),從而實(shí)現(xiàn)了數(shù)據(jù)降維的目的。 MSET是一種非參數(shù)建模方法[4-5]。目前,MSET在核電站傳感器檢驗(yàn)[6]、工業(yè)設(shè)備狀態(tài)監(jiān)測[7]、電子產(chǎn)品壽命預(yù)測[8]和計(jì)算機(jī)軟件老化現(xiàn)象診斷[9]等領(lǐng)域取得成功的應(yīng)用。 利用正常運(yùn)行狀態(tài)下的監(jiān)測數(shù)據(jù)構(gòu)造歷史記憶矩陣D是建立MSET模型的第一步。假設(shè)SIS系統(tǒng)監(jiān)測到n個(gè)變量,某個(gè)采樣時(shí)刻的觀測向量mt可以表示為: 其中xn(tm)是采樣時(shí)刻tm時(shí)變量xn的觀測值。然后歷史記憶矩陣D可以如下構(gòu)造: 對(duì)于某時(shí)刻的新觀測向量Xobs,其估計(jì)向量Xest可通過將Xobs與存儲(chǔ)在D中的歷史觀測向量進(jìn)行比較來計(jì)算。Xest可表示為D與權(quán)值向量ω的乘積。 權(quán)值向量ω表示estX和D中向量之間的相似性測度,可以通過觀測向量obsX和估計(jì)向量estX的殘差ε求得: 公式(12)中用非線性算子“ “? 替代了乘法算子”ד, ?通常采用歐氏距離。 公式(13)應(yīng)用空間距離來度量兩個(gè)向量之間的相似性,通過將式(13)代入(12)和(10),可以得到估計(jì)向量Xest。可得以下公式,用來得到估計(jì)向量。 式中:1k可由工作人員根據(jù)運(yùn)行經(jīng)驗(yàn)確定,vE為殘差均值絕對(duì)值的最大值。 本文所使用的數(shù)據(jù)是某電站引風(fēng)機(jī)B的包括引風(fēng)機(jī)前軸承溫度、引風(fēng)機(jī)電動(dòng)機(jī)繞組溫度、引風(fēng)機(jī)電機(jī)電流、引風(fēng)機(jī)端側(cè)軸承水平振動(dòng)等等在內(nèi)的22維參數(shù)共計(jì)80000組的數(shù)據(jù)。這些數(shù)據(jù)均取自SIS數(shù)據(jù)庫,為采樣間隔為1分鐘的連續(xù)數(shù)據(jù),從2015/2/1日中午12點(diǎn)開始到2015/3/30日晚上11點(diǎn)59分截止。測點(diǎn)如表2所示。 表2 引風(fēng)機(jī)B相關(guān)測點(diǎn) 選取x1?x22的80000組歷史觀測向量作為數(shù)據(jù)集data,采樣間隔為1min,將歷史數(shù)據(jù)分為Data1、Data2、Data3三部分。Data1是數(shù)據(jù)中的11250-71250組觀測向量,從中抽樣后用于構(gòu)造模型的D。Data2是數(shù)據(jù)中71251到第80000組之間的觀測向量,用于驗(yàn)證模型的準(zhǔn)確性,進(jìn)而確定故障預(yù)警閾值。前面11250組向量當(dāng)做Data3,不用來構(gòu)造記憶矩陣、建模,后面會(huì)從中取一部分?jǐn)?shù)據(jù)檢驗(yàn)故障檢測預(yù)警的效果。 使用前面介紹的PCA方法生成一些新的線性獨(dú)立分量Fi來構(gòu)造記憶矩陣的行,求解R的特征值ik,相應(yīng)的貢獻(xiàn)率ic及其累積值is。對(duì)引風(fēng)機(jī)的22個(gè)測點(diǎn)進(jìn)行PCA降維分析。當(dāng)選取的主元個(gè)數(shù)為3時(shí),累積方差貢獻(xiàn)率達(dá)到94% > 85% ,表示當(dāng)使用PCA降成3維時(shí)候表明前3個(gè)主元既代表了原始數(shù)據(jù)信息,既簡化了模型,又提高了模型的計(jì)算速度。為了使模型的精度更高,選取了前4個(gè)主元作為矩陣的行,把原22個(gè)變量用著4個(gè)主元來代表,可以達(dá)到95%以上的精度。圖1為主元個(gè)數(shù)與累計(jì)貢獻(xiàn)率的關(guān)系圖,可以看出達(dá)到降維的目的。 圖1 主元個(gè)數(shù)與累計(jì)貢獻(xiàn)率的關(guān)系圖 Data1中的數(shù)據(jù)經(jīng) PCA 和小波去噪后進(jìn)行等距離采樣,可以得到一個(gè) 6 ×10000的矩陣,將此矩陣作為構(gòu)建MSET建模的過程記憶矩陣D。 為了驗(yàn)證 MSET 模型的有效性,在引風(fēng)機(jī)的軸承水平振動(dòng)和軸承垂直震動(dòng)上從第10000到第10150個(gè)點(diǎn)開始人為的增加振動(dòng)偏差。圖2是兩向量之間的殘差。圖3是經(jīng)過滑動(dòng)窗口處理后的觀測值與預(yù)測值之間的殘差特性曲線。 圖2 向量間的殘差 圖3 滑動(dòng)窗口后殘差特性曲線 圖2和圖3中,黃色直線為所取閾值0.261,由公式(17)得到,根據(jù)經(jīng)驗(yàn),k取1.2,引風(fēng)機(jī)健康狀態(tài)下的最大估計(jì)殘差絕對(duì)值為0.23??梢詮纳蠄D中明顯看出殘差總體趨勢是逐漸在變大的。圖中選取數(shù)據(jù)段為第9851到第10150個(gè)數(shù)據(jù),將此300點(diǎn),5小時(shí)數(shù)據(jù)作為驗(yàn)證,從第10001點(diǎn)開始人為的增加偏差,也就是選取數(shù)據(jù)段的第150個(gè)點(diǎn)開始增加偏差。我們可以明顯看到圖中從第151個(gè)點(diǎn)開始偏差逐漸增加,殘差曲線明顯在上升,在滑動(dòng)窗口殘差統(tǒng)計(jì)曲線圖3-3中可以看到,在第228個(gè)點(diǎn)左右的時(shí)候,殘差和閾值到達(dá)了臨界閾值處,之后繼續(xù)升高,可以理解為這時(shí)候是故障的早期征兆。會(huì)進(jìn)行了持續(xù)兩個(gè)多小時(shí)的預(yù)警提醒,引起工作人員注意,查看是否出現(xiàn)了故障,為工作人員提前采取措施爭取了時(shí)間,達(dá)到預(yù)警的作用。 本文以引風(fēng)機(jī)為例,應(yīng)用PCA-MSET方法對(duì)引風(fēng)機(jī)的數(shù)據(jù)進(jìn)行了故障預(yù)警。實(shí)驗(yàn)表明,該方法可以提前發(fā)現(xiàn)隱含的故障信息,在故障發(fā)生前提前預(yù)警。本文應(yīng)用的故障檢測方法由在線和離線兩部分組成。離線部分包括數(shù)據(jù)預(yù)處理、過程記憶矩陣的構(gòu)造、MSET模型的建立以及故障預(yù)警閾值的計(jì)算。在線部分利用PCA -MSET模型估計(jì)新的,然后計(jì)算其殘差,從而通過判斷殘差是否超過故障預(yù)警閾值來實(shí)現(xiàn)故障測量和預(yù)警。在數(shù)據(jù)預(yù)處理中,采用小波去噪的方式對(duì)數(shù)據(jù)進(jìn)行了去噪。為了降低MSET模型的復(fù)雜度,本文還討論了基于PCA的變量選擇方法。在此基礎(chǔ)上,定義了殘差,采用滑動(dòng)窗口殘差統(tǒng)計(jì)方法對(duì)殘差進(jìn)行處理,確定了故障預(yù)警閾值?;赑CA -MSET的故障預(yù)警方法非常適合于引風(fēng)機(jī)的故障預(yù)警。2 多元狀態(tài)估計(jì)技術(shù)
3 應(yīng)用
4 結(jié)論