何 偉,高 玲,崔振偉,江學(xué)文,郭月明,田 欣
(1.中國石油天然氣股份有限公司獨(dú)山子石化分公司,新疆克拉瑪依 833699;2.中國海洋石油集團(tuán)有限公司,北京 100010;3.昆侖數(shù)智科技有限責(zé)任公司,北京 102206)
煉化企業(yè)機(jī)泵是指除列入大型機(jī)組管理范圍外的轉(zhuǎn)動(dòng)設(shè)備,如泵、壓縮機(jī)、風(fēng)機(jī)、汽輪機(jī)等,是本文的研究對象。
機(jī)泵智能系統(tǒng)監(jiān)測機(jī)泵健康狀態(tài),在提高機(jī)泵可靠性的前提下,實(shí)現(xiàn)庫存需求和維護(hù)成本的最優(yōu)化。智能系統(tǒng)具備機(jī)器學(xué)習(xí)和預(yù)測分析能力,可幫助工程師實(shí)施預(yù)測性維護(hù)計(jì)劃。
GB/T 40571—2021《智能服務(wù) 預(yù)測性維護(hù) 通用要求》對預(yù)測性維護(hù)的定義是[1]:根據(jù)觀測到的狀況而決定的連續(xù)或間斷進(jìn)行的維護(hù),以監(jiān)測、診斷或預(yù)測構(gòu)筑物、系統(tǒng)或部件的條件指標(biāo)。
預(yù)測性維護(hù)是通過對監(jiān)測對象進(jìn)行連續(xù)監(jiān)測,分析判定監(jiān)測對象所處的狀態(tài)和可能的故障模式,預(yù)測未來的發(fā)展趨勢,制定預(yù)測性維護(hù)計(jì)劃。預(yù)測性維護(hù)技術(shù)是目前工業(yè)領(lǐng)域研究的重點(diǎn)和熱點(diǎn)問題,也是工業(yè)智能化的具體內(nèi)容之一,應(yīng)用前景廣闊。
煉化企業(yè)機(jī)泵監(jiān)測維修管理存在的問題有:
(1)監(jiān)測系統(tǒng)分散建設(shè),標(biāo)準(zhǔn)不一、互不兼容、數(shù)據(jù)難共享。
(2)系統(tǒng)“重?cái)?shù)據(jù)、輕機(jī)理”,與工藝參數(shù)和故障機(jī)理關(guān)聯(lián)少,故障機(jī)理模型深度和廣度不夠、故障回溯和準(zhǔn)確定位困難,故障處理治標(biāo)不治本。
(3)歷史數(shù)據(jù)和故障數(shù)據(jù)分散在不同的監(jiān)測系統(tǒng),未能形成統(tǒng)一的機(jī)泵維護(hù)核心數(shù)據(jù)和專業(yè)模型。
(4)系統(tǒng)架構(gòu)以C/S 為主,擴(kuò)展性弱,應(yīng)用體驗(yàn)差,數(shù)據(jù)接入和處理能力低。
(5)大量監(jiān)測數(shù)據(jù)依賴人工判斷,診斷準(zhǔn)確率低,無法應(yīng)用大數(shù)據(jù)等先進(jìn)技術(shù)挖掘數(shù)據(jù)價(jià)值。
(6)機(jī)泵檢修模式仍以故障修、定期修為主,維護(hù)成本高、效率低。
機(jī)泵作為煉化企業(yè)通用的工業(yè)設(shè)備,實(shí)現(xiàn)智能運(yùn)維是目前機(jī)泵設(shè)備智能化發(fā)展的方向。以智能化技術(shù)為支撐的機(jī)泵預(yù)測性維修,通過預(yù)測模型預(yù)測機(jī)泵故障發(fā)生的時(shí)間、位置以及故障程度,最優(yōu)安排維修活動(dòng),可以大幅提高機(jī)泵維修效率,有效避免機(jī)泵運(yùn)行過程中的非計(jì)劃停機(jī),減少企業(yè)生產(chǎn)損失。
機(jī)泵預(yù)測性維護(hù)關(guān)鍵技術(shù)包括數(shù)據(jù)處理、智能報(bào)警、故障診斷、故障預(yù)測等。
2.1.1 異常信號識別技術(shù)
根據(jù)收集的大量傳感器異常數(shù)據(jù)(電氣干擾、導(dǎo)線晃動(dòng)、傳感器松動(dòng)、傳感器損壞等),通過設(shè)定的數(shù)據(jù)清洗業(yè)務(wù)規(guī)則,如時(shí)域波形呈直線、階梯狀、最大方差與最小方差比超過邊界值、單樣本有效值小于邊界值等,將當(dāng)前采集的監(jiān)測數(shù)據(jù)同異常信號規(guī)則庫進(jìn)行基于機(jī)器學(xué)習(xí)算法的比對和判故,識別和剔除假信號,提高數(shù)據(jù)質(zhì)量,避免誤報(bào)警(圖1)。
圖1 異常信號規(guī)則庫示意
2.1.2 數(shù)據(jù)預(yù)處理技術(shù)
2.1.2.1 重復(fù)數(shù)據(jù)清理
數(shù)據(jù)記錄中如果存在重復(fù)值,尤其是重復(fù)量大的情況下,直接影響對監(jiān)測對象的狀態(tài)評估。機(jī)泵狀態(tài)監(jiān)測數(shù)據(jù)不僅記錄了狀態(tài)值,同時(shí)也記錄了時(shí)間序列,采用逐個(gè)檢查時(shí)間點(diǎn)的方法,若存在重復(fù)的時(shí)間值則可以判定監(jiān)測數(shù)據(jù)存在重復(fù)值,識別到重復(fù)值直接刪除處理。
2.1.2.2 缺失值處理
機(jī)泵監(jiān)測數(shù)據(jù)記錄中若存在缺失值,意味著對應(yīng)時(shí)間點(diǎn)的狀態(tài)信息丟失,引起狀態(tài)評估的結(jié)果少考慮了該段時(shí)間內(nèi)的狀態(tài)。機(jī)泵狀態(tài)監(jiān)測數(shù)據(jù),記錄了狀態(tài)值及其對應(yīng)時(shí)間。采用逐個(gè)檢查時(shí)間點(diǎn)的方法,若發(fā)現(xiàn)存在不連續(xù)的現(xiàn)象,則可以判定監(jiān)測數(shù)據(jù)存在缺失值,也可根據(jù)監(jiān)測數(shù)據(jù)采集密度判斷出缺失數(shù)據(jù)量。
缺失值數(shù)據(jù)處理采用三次樣條插值法處理。三次樣條插值方法如下:
假定有n+1 個(gè)數(shù)據(jù)點(diǎn)(x0,y0),(x1,y1),…,(xn,yn),以這些數(shù)據(jù)點(diǎn)為端點(diǎn),則可劃分成n 個(gè)區(qū)間,每個(gè)區(qū)間的樣條曲線設(shè)為:
對于端點(diǎn)而言,Si(xi+1)=Si+1(xi+1),設(shè)mi=(xi)。
算法流程如下:
(1)計(jì)算步長,hi=xi+1-xi。
(2)選定邊界條件。m0=0、mn=0,將數(shù)據(jù)端點(diǎn)和選定的邊界條件帶入下述矩陣方程并求解:
(3)計(jì)算樣條曲線系數(shù)。
(4)通過上述步驟計(jì)算出參數(shù)后,代入樣條函數(shù),并利用樣條函數(shù)計(jì)算的值代替缺失值。
缺失值處理示例:以指數(shù)函數(shù)為例,取t=[0.5,0.9](單位以秒計(jì)),示例函數(shù)x=expt2,并加上最大幅值為0.05 的隨機(jī)擾動(dòng),取中間0.12 的區(qū)間設(shè)置為缺失值(圖2 中的虛線部分)。通過三次樣條函數(shù)補(bǔ)充缺失值,最大絕對誤差是0.056 3(圖2)。
圖2 三次樣條插值效果示例
2.1.2.3 離群點(diǎn)清理
數(shù)據(jù)記錄中如果存在離群點(diǎn),在特定情況下其代表監(jiān)測對象的狀態(tài)相差甚遠(yuǎn)。例如,溫度數(shù)據(jù)中的離群點(diǎn),可能引發(fā)溫度誤報(bào)警,有無溫度報(bào)警所代表的機(jī)泵狀態(tài)差距很大(圖3)。
圖3 離散點(diǎn)圖
(1)采用K—均值聚類算法識別離群點(diǎn)。對于給定的樣本集,K—均值聚類算法是按照樣本之間的距離(即相似度)大小,將樣本集劃分為K 個(gè)簇(即類別),讓簇內(nèi)的點(diǎn)盡量緊密的連在一起,而讓簇間的距離盡量的大,以此實(shí)現(xiàn)離群點(diǎn)識別。算法流程如下:①隨機(jī)取K 個(gè)初始中心點(diǎn);②對于每個(gè)樣本點(diǎn)計(jì)算到這K 個(gè)中心點(diǎn)的距離,將樣本點(diǎn)歸到與之距離最小的那個(gè)中心點(diǎn)的簇,這樣每個(gè)樣本都有自己的簇;③對于每個(gè)簇,根據(jù)里面的所有樣本點(diǎn)重新計(jì)算得到一個(gè)新的中心點(diǎn),如果中心點(diǎn)發(fā)生變化回到上一步,否則轉(zhuǎn)到下一步;④得出結(jié)果。按照上述流程被簇孤立出來的點(diǎn),確定為離群點(diǎn)。
(2)離群點(diǎn)處理。采用滑動(dòng)平均法處理離群點(diǎn),消除離群點(diǎn)對健康狀態(tài)評估的影響。設(shè)n 個(gè)數(shù)據(jù)點(diǎn)x={x1,x2,…,xn},其中xk(k∈[1,n])是離群點(diǎn),滑動(dòng)平均法即用yk代替xk。
其中,m 是滑動(dòng)點(diǎn)數(shù),具體值視實(shí)際數(shù)據(jù)情況而定。
采用5 點(diǎn)滑動(dòng)平均處理原始數(shù)據(jù),處理后異常值將被平滑處理掉,處理后的效果如圖4 所示。
圖4 滑動(dòng)平均處理效果
傳統(tǒng)的報(bào)警方式是將監(jiān)測數(shù)據(jù)與設(shè)定的報(bào)警閾值進(jìn)行比較,若超限則產(chǎn)生報(bào)警信息,報(bào)警信息用來反映機(jī)器內(nèi)部產(chǎn)生的故障。智能報(bào)警技術(shù)以智能算法為基礎(chǔ),包括閾值報(bào)警、差值報(bào)警、快變報(bào)警、慢變報(bào)警等內(nèi)容。
(1)閾值報(bào)警。根據(jù)機(jī)泵應(yīng)用經(jīng)驗(yàn)或參照國家標(biāo)準(zhǔn)確定報(bào)警閾值,在智能系統(tǒng)通過手動(dòng)錄入方式配置相應(yīng)參數(shù)。當(dāng)監(jiān)測數(shù)據(jù)反復(fù)穿越閾值邊界線時(shí),系統(tǒng)通過報(bào)警策略算法對報(bào)警事件進(jìn)行識別,篩選數(shù)據(jù)進(jìn)行故障報(bào)警,防止針對同一報(bào)警事件進(jìn)行重復(fù)報(bào)警。故障報(bào)警主要是對實(shí)時(shí)監(jiān)測的振動(dòng)數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,提取特征值,將特征值輸入智能算法模型進(jìn)行統(tǒng)計(jì)學(xué)習(xí),如果超限則在排除多種干擾因素后再判斷是否報(bào)警或更新統(tǒng)計(jì)模型,如果未超限則更新統(tǒng)計(jì)模型從而觸發(fā)新的一次學(xué)習(xí)。以某一個(gè)正常工況點(diǎn)為重心,劃分出機(jī)泵正常區(qū)域(綠色范圍)、預(yù)警區(qū)域(橙色范圍邊界)和報(bào)警區(qū)域(紅色范圍邊界),完成統(tǒng)計(jì)學(xué)習(xí)(圖5)。機(jī)泵長期運(yùn)行過程中,智能系統(tǒng)通過對機(jī)泵在不同負(fù)荷、轉(zhuǎn)速下的振動(dòng)參數(shù)進(jìn)行統(tǒng)計(jì)學(xué)習(xí),確定機(jī)泵在特定負(fù)荷、轉(zhuǎn)速下的正常工況范圍(圖6)。
圖5 機(jī)泵預(yù)警限報(bào)警限值智能統(tǒng)計(jì)學(xué)習(xí)
圖6 特定負(fù)荷下正常工況范圍
圖7 機(jī)理數(shù)據(jù)雙驅(qū)診斷模型
(2)差值報(bào)警。選擇n 個(gè)監(jiān)測數(shù)據(jù)樣本,計(jì)算每個(gè)數(shù)據(jù)樣本的總振值,以及主頻值與總振值的差值,當(dāng)選定的n 個(gè)監(jiān)測數(shù)據(jù)樣本中有70%的樣本數(shù)量的差值超過設(shè)定的差值閾值,系統(tǒng)輸出差值報(bào)警信息。
(3)快變報(bào)警。振動(dòng)監(jiān)測單樣本數(shù)據(jù)的前5 階,1×、2×、3×、4×、5×振動(dòng)幅值(振動(dòng)分量的矢量和),與上次監(jiān)測的振動(dòng)樣本的前5 階振動(dòng)幅值(與上同)的差值為跳變值,當(dāng)跳變值超過設(shè)定限值,且跳變過程較快,按毫秒(ms)時(shí)間計(jì)量,跳變后狀態(tài)穩(wěn)定在5 min 以上,系統(tǒng)將輸出快變報(bào)警信息。同時(shí),系統(tǒng)會(huì)自動(dòng)加密數(shù)據(jù)保存間隔,對快變報(bào)警事件進(jìn)行高密度數(shù)據(jù)存儲(chǔ)。
(4)慢變報(bào)警。振動(dòng)監(jiān)測單樣本數(shù)據(jù)的前5 階,1×、2×、3×、4×、5×振動(dòng)幅值(振動(dòng)分量的矢量和),與上次監(jiān)測的振動(dòng)樣本的前5 階振動(dòng)幅值(與上同)的差值為跳變值,當(dāng)跳變值超過設(shè)定限值,但跳變過程緩慢,按分鐘(min)時(shí)間計(jì)量,跳變后狀態(tài)穩(wěn)定在60 min 以上,系統(tǒng)將輸出慢變報(bào)警信息。
機(jī)泵報(bào)警輸出等級和狀態(tài)見表1。
表1 振動(dòng)速度和振動(dòng)加速度的5 級報(bào)警
2.3.1 基于機(jī)理規(guī)則的故障診斷
根據(jù)實(shí)際機(jī)泵結(jié)構(gòu)和振動(dòng)信號傳遞路徑,利用動(dòng)力學(xué)原理,建立機(jī)泵轉(zhuǎn)子類典型故障、軸承典型故障、齒輪典型故障的動(dòng)力學(xué)公式,結(jié)合Anasys、Adams 等多體動(dòng)力學(xué)仿真軟件建立機(jī)泵典型故障的動(dòng)力學(xué)模型,同時(shí)根據(jù)機(jī)泵結(jié)構(gòu)振動(dòng)信號傳遞路徑建立典型故障的激勵(lì)-響應(yīng)系統(tǒng)模型,揭示出機(jī)泵典型故障的振動(dòng)學(xué)機(jī)理,給出相關(guān)診斷規(guī)則,建立基于機(jī)理的診斷模型。
2.3.2 基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷
由于實(shí)際振動(dòng)測試傳感器安裝位置的局限,難以測到故障源真實(shí)的振動(dòng)信號,而所測的機(jī)體表面的振動(dòng)響應(yīng)信號存在一定程度的隨機(jī)性、不確定性、模糊性及耦合性,導(dǎo)致從機(jī)理模型上利用故障診斷規(guī)則實(shí)現(xiàn)的故障診斷存在一定誤差。為解決上述問題,提高機(jī)泵典型故障的診斷精度,開展基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷模型研究。
數(shù)據(jù)驅(qū)動(dòng)是以概率與統(tǒng)計(jì)學(xué)為基礎(chǔ),從數(shù)據(jù)出發(fā),利用機(jī)器學(xué)習(xí)模型,主動(dòng)學(xué)習(xí)數(shù)據(jù)內(nèi)部潛在的規(guī)律與模式,建立數(shù)據(jù)—故障的數(shù)學(xué)映射模式,從而實(shí)現(xiàn)故障診斷。首先,針對機(jī)泵典型故障,分別從時(shí)域、頻域、時(shí)頻域提取原始振動(dòng)信號的故障特征,建立高維故障特征集。然后利用核主成分分析算法,提取高維故障特征集的主成分。最后以神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)模型,建立基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷模型。
2.3.3 基于機(jī)理與數(shù)據(jù)融合的雙驅(qū)診斷技術(shù)
根據(jù)機(jī)泵的結(jié)構(gòu)特點(diǎn),研究各種典型故障的機(jī)理,基于故障機(jī)理研究特定故障的特征提取算法,建立診斷規(guī)則,同時(shí)通過故障仿真信號和故障模擬試驗(yàn),提取典型故障的高維度特征集,開發(fā)機(jī)器學(xué)習(xí)算法模型。
故障預(yù)測是指準(zhǔn)確、精確地估計(jì)損壞的部件或子系統(tǒng)的剩余壽命,其對于機(jī)泵預(yù)測性維護(hù)至關(guān)重要。對于可能引起故障的相關(guān)部分的故障演變進(jìn)行長期性估計(jì),需要一些方法去描述和處理固有的不確定性。不確定性描述意味著能夠?qū)τ筛鞣N各樣原因所導(dǎo)致的各種形式的不確定性進(jìn)行建模,而不確定性處理需要一些方法論和工具,當(dāng)可以獲得更多數(shù)據(jù)時(shí)需要這些方法論和工具來不斷減小不確定性的界限。為得到精準(zhǔn)的預(yù)測,需要有較好的故障演變概率模型以及足夠多的故障數(shù)據(jù)樣本,以幫助訓(xùn)練、驗(yàn)證、調(diào)整預(yù)測算法。
利用基于線性維納過程的機(jī)泵性能退化模型來預(yù)測當(dāng)前評估對象的剩余壽命,利用樸素貝葉斯和EM(Expectation-Maximum,期望最大化)算法評估參數(shù)進(jìn)行動(dòng)態(tài)更新。
故障預(yù)測過程如下:
(1)基于退化特征值,建立線性維納過程預(yù)測模型。假設(shè)t為機(jī)泵運(yùn)行時(shí)間程,為運(yùn)行時(shí)間t 所對應(yīng)的退化量,可建立如下維納過程模型:
其中,φ 為初始退化量,方便起見假設(shè)φ=0;θ 為漂移參數(shù),表示機(jī)泵的退化速率。由于各樣本之間存在差異,假設(shè)θ~N(μ0,σ02);σ 為擴(kuò)散參數(shù),B(t)為標(biāo)準(zhǔn)布朗運(yùn)動(dòng),σB(t)用于描述機(jī)泵性能在退化過程中存在的波動(dòng)。
(2)利用貝葉斯準(zhǔn)則更新漂移參數(shù)的條件密度函數(shù)和條件累計(jì)分布函數(shù),得到模型中的待估計(jì)參數(shù)向量和對數(shù)似然函數(shù),然后利用基于EM 算法給出待估計(jì)參數(shù)向量的極大似然估計(jì)的解析解。
記t1,t2,…,tk為某機(jī)泵的k 個(gè)監(jiān)測時(shí)間點(diǎn),X1∶k={x1,x2,…,xk}為k 個(gè)時(shí)間點(diǎn)對應(yīng)的退化量值,其中xi=X(ti),i=1,2,…,k。機(jī)泵在tk時(shí)刻的剩余壽命模型為:
其中,w 表示失效閾值。
(3)依據(jù)退化特征模型和當(dāng)前狀態(tài),對監(jiān)測對象進(jìn)行動(dòng)態(tài)壽命預(yù)測,可以實(shí)現(xiàn)機(jī)泵的全生命周期管理,保障機(jī)泵安全運(yùn)行,提高機(jī)泵利用率。
運(yùn)用物聯(lián)網(wǎng)、云計(jì)算、人工智能、大數(shù)據(jù)等新一代數(shù)字化技術(shù),建設(shè)智能感知、智能分析、智能預(yù)警、全面協(xié)同、科學(xué)決策等方面的能力,是煉化企業(yè)數(shù)字化轉(zhuǎn)型發(fā)展的必然趨勢。實(shí)現(xiàn)機(jī)泵預(yù)測性維護(hù)的關(guān)鍵是解決機(jī)泵監(jiān)測數(shù)據(jù)的智能化應(yīng)用,數(shù)據(jù)處理、智能報(bào)警、故障診斷、故障預(yù)測4 個(gè)環(huán)節(jié)彼此獨(dú)立又相互聯(lián)系,構(gòu)成了機(jī)泵預(yù)測性維護(hù)的核心技術(shù)。經(jīng)過多年的研究和技術(shù)沉淀,上述關(guān)鍵技術(shù)在相關(guān)煉化企業(yè)獲得成功應(yīng)用。