孫寶平
(中國石化工程建設有限公司,北京 100101)
催化裝置作為國內石油煉制企業(yè)的主力生產裝置,在石油加工行業(yè)中占有相當重要的地位。在催化裂化裝置中,主風機組是核心機組之一,機組包括煙氣輪機、風機和電機等單機以及輔助設施,其中煙氣輪機是將裝置反應生成的高溫煙氣所攜帶的剩余能量轉化為動力輸入風機,與電動機協(xié)同帶動風機工作,剩余能量也可帶動發(fā)電機發(fā)電。從煙氣輪機系統(tǒng)的介質來看,高溫煙氣中的催化劑對汽輪機動、靜葉片的沖蝕明顯,并容易在煙氣輪機葉片上結垢,破壞動平衡,導致機組故障的頻率和不確定性較高,給故障診斷和健康管理(Prognostics Health Management,PHM)帶來較大難度。近年來隨著機組振動監(jiān)控系統(tǒng)的不斷完善和大數據分析手段的不斷發(fā)展,尤其是伴隨“互聯網+”時代的到來,設備故障從診斷到預測的研究更加活躍,對于主風機組來說,煙氣結垢導致的機組故障具有一定的時間延遲性,這為開展故障預測、優(yōu)化檢修策略提供了可能。本文建立基于長短期記憶網絡(Long Short-Term Memory,LSTM)的故障分析模型,對某石化催化主風機組在運行失效模式之前的數據進行采集、訓練和擬合,從而預測機組的振動趨勢,進行故障預警和檢修方案優(yōu)化。這是設備健康管理的一個重要環(huán)節(jié)。
對于故障診斷與故障預測的方法,一些文獻進行了總結分類,比如“基于經驗、基于模型和基于趨勢”【1】;“基于分析模型、基于定性經驗和基于數據驅動”【2】;“基于物理、基于知識和基于數據”【3】等,表達雖略有不同,但歸納的基本結果是接近的?;跀祿寗拥乃惴ǖ膬?yōu)勢是更少的專業(yè)知識需求、可拓展的應用環(huán)境和較少的計算資源?;跀祿墓收项A測方法完全從工業(yè)現場數據出發(fā),挖掘數據中的隱含信息,具有廣泛的工程應用價值【4-5】。
工業(yè)大數據的快速發(fā)展是推動基于數據驅動的故障診斷和預測方法的基礎,在不同階段主要包括統(tǒng)計分析、信號處理、機器學習的分析方法【6】。
在機器學習【7】方面,向量機(SVM)、神經網絡及其進化衍生算法的應用越來越廣泛,很多研究都采用上述方法建立訓練與測試集,以分類實現診斷,或結合分類判斷,擬合時間變化曲線,實現預測。而神經網絡等多層次學習方式又被稱為深度學習(Deep Learning,DL),是通過在特定層次結構,堆疊多層非線性信息處理模塊,模擬數據背后的內在表示,并進行分類和預測。有文獻【8】對近年來深度學習在各領域發(fā)展的優(yōu)秀文獻和工具平臺進行了整理,并總結了幾種典型的深度學習模型,包括卷積神經網絡(Convolutional Neural Networks,CNN)、循環(huán)神經網絡(RecurrentNeural Network,RNN)、生成對抗網絡(Generative Adversarial Network,GAN)等,探討了深度學習在故障診斷與預測領域應用中存在的問題及解決方法。長短期記憶網絡【9】也是深度學習的算法之一,一些研究基于長短期記憶網絡建立了對接機構故障診斷模型【10-11】,該模型故障診斷準確率水平較高。這些應用主要集中于故障的診斷與故障的預測,而本文的研究重點是在設備振動故障或異常漸進發(fā)展的較長階段內,對設備振動趨勢進行預測。由于系統(tǒng)的復雜性和運行的不確定性,業(yè)內認為依據設備狀態(tài)監(jiān)測數據中的特征數據進行趨勢預測是PHM 領域難度更大的課題【12】,在一些其他領域,有研究認為基于LSTM算法的模型對研究主題的發(fā)展趨勢預測準確度較向量機和BP神經網絡為高【13】,并在預測精度指標方面做了定量分析【14-15】;也有研究【16】做設備運行狀態(tài)的估計和預測時,提出了一種人工經驗與主成分分析相結合的長短期記憶網絡方法(AEPCA-LSTM),利用時序數據對設備運行趨勢進行預測,這種以趨勢預測為目標的PHM,對本文的研究有重要的參考借鑒意義。
作為循環(huán)神經網絡中的一種,長短期記憶網絡因為具有可以解決長依賴性問題而備受關注。相較于傳統(tǒng)的神經網絡在時序問題上的處理模式,LSTM 不僅能夠將前面數據的計算輸出結果作為新的輸入,并且能將整個細胞的狀態(tài)傳遞下去。LSTM 結構單元示意見圖1。
圖1 LSTM 結構單元示意
在LSTM 中,一個完整的序列處理全部運算所在的集合被稱作一個細胞單元,此時細胞的狀態(tài)可以用c表示。用a表示細胞的輸出狀態(tài),x表示輸入狀態(tài)。如果令t表示當前時刻的時序,那么t-1就代表前一時刻的時序。因此,對于細胞狀態(tài)來說,前一時刻的細胞狀態(tài)為c t-1,前一時刻細胞的輸出為a t-1。在當前t時刻,新的輸入為x t,細胞的輸出為a t,細胞狀態(tài)為c t。因此對于一個LSTM 細胞來說,其輸入包括前一個時刻的細胞狀態(tài)c t-1、前一個時刻的細胞輸出量a t-1以及在當前時刻中的輸入量x t。
由于每次LSTM 細胞的輸出總有一個細胞狀態(tài)c,因此可以說在每次信息數據處理過程中,都將之前的信息處理納入到了這次的處理模式中,使得早期的數據序列也可以傳到后續(xù)的處理過程中。在利用LSTM 模型對采樣數據進行訓練時,一般使用的是BPTT 算法【9】,該算法首先按照前向計算方法對LSTM 細胞的輸出值計算,然后反向計算每一個LSTM 細胞的誤差,接著計算每個權重的梯度,最后是對權重進行更新。在此基礎上的一個分支,Adam 算法(Adaptive moment estimation,Adam)是較為有效的一種優(yōu)化方法,由于其具有較好的適應性,并且所占存儲空間較小,在LSTM 訓練過程中被專家學者廣泛使用。
為了實現對機組有效的健康管理,利用機組大數據對機組振動情況進行預測,判斷故障發(fā)生的時間點以便開展預知性維修,是最為重要的一個環(huán)節(jié)。對于主風機組這樣一個故障相對多發(fā)且烈度較低的機組來說,預知性維修比較適合的應用場景是當發(fā)生敏感性事件(即振動變化超過設定閾值)后,啟動趨勢分析和故障預測,確定能夠確保安全性并兼顧工廠效益的最佳檢修時機。本研究運用LSTM 神經網絡等大數據分析手段,在MATLAB軟件環(huán)境下進行趨勢預測,當預測到故障發(fā)生(振動特征值超過高報警值)時,啟動在線檢修或者停機檢維修等方案。
主風機組預知性維修流程方案如圖2所示。
從圖2中可以看出,數據訓練、趨勢預測設計為步進式,如果預測結果顯示下一時間段的振動特征值不觸發(fā)報警,則不需要立即停機,機組繼續(xù)運行,迭代訓練數,繼續(xù)對未來時序的振動情況進行預測。
圖2 主風機組預知性維修流程方案
數據訓練預測迭代流程見圖3。
圖3 數據訓練預測迭代流程
通過這種步進式的數據分析方法,可實現診斷預測的迭代更新,不斷為設備的管理人員提供機組的最新振動趨勢,優(yōu)化檢維修時機,逐步實現預知性維修。
圖4為某企業(yè)催化裝置主風機組B101 在2019年11月~2020年1月區(qū)間的振動趨勢,其中輕載瓦和重載瓦振動兩個位置高報警值均為75μm,高高報警值113μm,在此期間振動未觸發(fā)報警,但指標在某一時段具有突變性質(振動敏感事件)比較明顯的振動劣化趨勢,設備管理人員和工藝操作人員進行了一系列操作動作確保機組和裝置安全。
圖4 催化裝置B101機組振動趨勢(2019年11月~2020年1月)
表1為該企業(yè)催化裝置B101機組振動異常的處置過程,分別記錄了振動異常開始和發(fā)展的時間點、異常的部位和表現、設備管理人員和工藝操作人員對情況進行判斷分析后的處理措施以及處置后的振動異常發(fā)展情況。從處置情況看,做出降低裝置負荷和投切備機、更換主機轉子的決定時,振動值距離報警值還有距離,對機組檢修時機的把握還有優(yōu)化空間,由于分析方法的欠缺,對于檢修時機的選擇,留有的裕量也比較大。
表1 催化裝置B101機組振動異常處置
為了對預知性維修設計方案和分析方法的有效性進行驗證,選取B101機組在2020年1月2日停機檢修前的兩個階段進行訓練預測分析,并檢驗檢維修方案的合理性。
兩個階段分別為:
1)從2019年11月23日~12月21日,之后進行了工藝降負荷操作;
2)從2019年12月21日~2020年1月2日,之后進行了停車更換轉子的操作。
兩次數據采樣間隔均為5 min。在數據處理過程中,將每10個采樣數值進行平均求值,即每50 min取振動平均值,從而化簡數據量,提高分析處理速度,并保留原數據組特征。對于每組數據的訓練和預測的占比,參考楊柯等人的研究【16】,分別將前70%的數據作為訓練數據,后30%的數據作為預測數據,并將預測結果與真實值進行對比,對結果進行驗證。
3.2.1 振動趨勢訓練與預測擬合
將第一階段的818組歷史數據按時間順序分為成8個迭代訓練預測組,每組數據288個,其中訓練數據202 個,占70%,預測數據86 個,占30%,預測的時長約為72 h。72 h的預測時長,能夠滿足檢維修的決策和必要準備。
通過MATLAB 軟件運行搭建好的LSTM模型程序,對機組振動具有代表性的XIS6.1H(輕載瓦)測點振動通頻數據進行分析,其8組分析訓練預測、調校和迭代結果如圖5(a)~圖5(c)所示(篇幅所限,列示3組)。
圖5 XIS6.1H 測點訓練預測迭代結果
8組步進方式的訓練預測,預測值的趨勢波動與實際值的趨勢吻合度較好,主要的調校發(fā)生在第三組迭代之前,對LSTM 模型進行參數調整,將隱含層數由10 增加至20,以降低結果偏差。
根據文獻【17】,以平均絕對誤差(MAE)、平方和誤差(SSE)、均方根誤差(RMSE)等統(tǒng)計指標對預測的偏差率進行判斷,結果見表2。由表2可見,8組預測平均絕對誤差(MAE)低于3μm,并且均方根誤差率較低,這在工業(yè)應用上是完全可接受的精度范圍。
表2 XIS6.1H 測點預測偏差
以同樣步驟對機組另一測點XIS6.2 H(重載瓦)進行步進訓練預測,總體吻合度也較好,預測結果從略。從分步訓練、預測結果可以看出,以LSTM 數據分析方法對B101機組在這一階段的振動預測取得了良好效果,為進一步開展預知性維修和檢修方案優(yōu)化打下了基礎。
3.2.2 第一階段假定條件下的振動趨勢預測
基于此前8組訓練預測的良好效果,繼續(xù)進行下一個步長的振動預測。從歷史記錄可以得知,在這個時間點上(2019年12月21日),裝置對B101機組采取了降負荷操作,期望降低可能的超振動,以降低機組振動觸發(fā)報警值的風險。本次預測的目的是分析假定工藝參數繼續(xù)保持不變的情況下,下一個步長的振動情況。將3.2.1節(jié)一定數量的訓練數據導入,分別對XIS6.1 H、XIS6.2H 兩點的后續(xù)86個組振動通頻變化情況進行預測,如圖6所示。
圖6 XIS6.1H 第九步長測點預測情況
根據分時明細,預測結果為在未來4 300 min(約72 h),預測振動的最大值為61.373 3μm,而機組高報警值為75μm,即使考慮預測偏差也不足以觸發(fā)報警。
在XIS6.1H 測點預測的過程中,幾個主要控制參數RMSE 和過程損失函數值在多次迭代中都具有良好的收斂性(分別如圖7和圖8所示),確保了預測結果的可信度。
圖7 XIS6.1H 測點預測過程RMSE值
圖8 XIS6.1H 測點預測過程損失函數值
以上假定工藝操作不采取降負荷措施的條件下,預測未來72 h的振動趨勢,結果顯示:重點監(jiān)控點的通頻值均相對穩(wěn)定變化,將不觸發(fā)報警值;在預知這一基本趨勢的情況下,降低工藝操作這一操作手段則具有了優(yōu)化余地,在這個時間節(jié)點上,可以選擇進行持續(xù)觀察,持續(xù)預測,替代當時降低負荷的操作方案。
3.3.1 振動趨勢訓練與預測擬合
對機組B101 的XIS6.1 H、XIS6.2 H 兩 個 測點振動通頻數據進行第二階段分析,數據開始時間為2019年12月21日22:14,結束時間為2020年1月2日06:49,這一階段始于工藝降負荷操作,終于機組停車檢修更換轉子。
以MATLAB 工具、LSTM 方法 對XIS6.1H測點的6組數據進行訓練預測調校,總體吻合度較好,其中第六次預測結果如圖9所示。其余各次結果圖從略。由圖9可見,第二階段XIS6.1 H點各步預測偏差也在較低水平。
圖9 XIS6.1H 測點第二階段第六次訓練預測結果
3.3.2 第二階段假定條件下的振動趨勢預測
在第二階段,XIS6.1H 點實際發(fā)生的振動最大值為70.7μm,距離高報警值的空間已比較狹窄,裝置于2020年1月2日作出了停車檢修的決定。本節(jié)假定在該時點不作停車檢修決定,對未來72 h的振動進行預測。
通過分時明細判斷,未來72 h內,B101機組XIS6.1H 點預測振動最大值為69.675 0μm,振動并未進一步劣化。由于安全區(qū)間較窄,考慮到預測誤差,仍支持在此區(qū)間進行停車檢修,原檢修方案對檢修時機的把握較為合理。但值得注意的是,對于B101 機組的煙氣輪機,振動高報警為75μm,而觸發(fā)連鎖停車的高高報警值為113μm,二者之間的儲備區(qū)間遠較一般壓縮機為大。正是由于煙氣輪機故障多發(fā),并且不確定性強,因此高報警閾值較低,本研究基于大數據分析開展的訓練預測,一定程度上可以對振動趨勢增強判斷,降低不確定性,煙氣輪機的高報警閾值具備了適當放寬的基礎,這也是機組運行健康管理優(yōu)化的一部分。
本文引入了LSTM 神經網絡模型的原理及算法,讀取某催化主風機組B101 自振動敏感性事件后的通頻數據,應用MATLAB 工具對振動趨勢進行了預測。結果表明,各個時間段的預測值與實際值吻合度較高,偏差率低,建立在不斷迭代的訓練、預測和調?;A上的預測可信度較好,可以作為機組振動趨勢預測的參考。LSTM神經網絡分析方法在本研究中應用效果較好的原因,總結為以下幾點:
1)大數據分析結合了機理分析,通過分析相關性和故障機理,對故障產生的重點部位的特征參數進行重點訓練分析,降低了參與分析的特征值數量,使分析模型得到簡化,簡化的模型在實際應用中也更具有可行性。
2)預測的時序較短,在72 h的時長內,結果擬合度較好,而72 h這一時長,足夠制定風機檢修方案、安排人力和調撥備件,為檢修方案的優(yōu)化創(chuàng)造了條件。
3)步進迭代的方式為分析參數的中間調整提供了機會,也增加了分析的精確度。
通過案例分析驗證,本文所設計的預知性維護的方案,從操作上是可行的,且預測效果較好,具有現實意義。不斷的迭代預測對機組運行狀態(tài)的了解和下一步決策計劃的制定起到了重要作用,對保障生產的安全平穩(wěn)進行、提高經濟效益具有重要的意義。由于不同機組之間的差異性較大,以工業(yè)大數據為基礎,對機組的健康評價、故障診斷與趨勢預測、運維策略制定等PHM 領域的工作,很難構建具有通用性的分析模型,在應用領域,掌握分析方法和路徑,按照“一機組一策”的思路進行設備健康管理是必要的。本研究只對典型案例進行了分析,未來還需要進一步獲取研究樣本,盡可能通過技術方面的泛化,促進設備健康管理方法的優(yōu)化。