袁 壯
(中國石化青島安全工程研究院化學品安全控制國家重點實驗室,山東青島 266104)
故障診斷能有效檢測、識別和預(yù)示連續(xù)運行設(shè)備的狀態(tài),避免故障帶來的傷亡或損失。隨著石化設(shè)備的大型化、復(fù)雜化和信息化,非線性和不確定性激增,難以建立解析模型以辨識和定位異常。構(gòu)建診斷規(guī)則庫所需的專業(yè)知識也更為高深,存在獲取和表達瓶頸;此外,設(shè)備時刻產(chǎn)生大量反映其運行狀態(tài)的監(jiān)測數(shù)據(jù),如何利用這些數(shù)據(jù)滿足日益提升的可靠性需求成為亟待解決的新課題。
智能診斷從正常和故障數(shù)據(jù)出發(fā),運用機器學習建立測量特征與故障模式之間的映射模型,實現(xiàn)更加精準和智能的模式識別。常用的機器學習算法,如BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPNN)、支持向量機(Support Vector Machine, SVM)和深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)等均有不俗效果。
上述算法的優(yōu)異性能多建立在可用故障樣本充足的基礎(chǔ)上。而實際工業(yè)環(huán)境中,設(shè)備長期正常運行,故障頻次較低,加之樣本標注代價高昂,致使監(jiān)測數(shù)據(jù)呈現(xiàn)出小樣本不均衡特性。受制于有限的標簽樣本,模型訓練不足,泛化能力有限,無法辨識極少樣本或沒有樣本的故障。因此,智能診斷多在模擬實驗下開展,工程應(yīng)用較少,且面臨準確率低、漏報誤報等難題。針對小樣本困境,部分學者引入遷移學習:沈飛等構(gòu)造遷移分類器,用于變轉(zhuǎn)速、變負載的電機故障診斷;陳超等基于輔助集提出樣本不足時的遷移診斷算法;基于深度遷移網(wǎng)絡(luò)的跨工況診斷也在軸承和齒輪箱上加以驗證。上述研究提升了故障樣本和診斷知識的復(fù)用性,但大多局限于同一設(shè)備不同運行工況間的遷移,并假定某一工況下的可用樣本充足,與實際不符。此外,半監(jiān)督學習利用少量有標簽樣本和大量無標簽樣本聯(lián)合建模,也適合小樣本問題,但要求無標簽樣本含有大量故障數(shù)據(jù),當其仍以正常數(shù)據(jù)為主時,效果有限。
SVM適用于高維數(shù)、小樣本場景下的模式識別,且易于建模,基于遺傳算法(Genetic Algorithm, GA)優(yōu)化的GA-SVM已廣泛應(yīng)用。此外,其拓展One-Class SVM更是僅需正常數(shù)據(jù)便能構(gòu)建模型,辨識異常。因此,面向?qū)嶋H工程場景,基于One-Class SVM和GA-SVM,提出應(yīng)用于小樣本不均衡數(shù)據(jù)集的分步診斷策略O(shè)ne-Class & GA-SVM。首先,基于正常樣本,運用One-Class SVM構(gòu)建超球模型,實現(xiàn)零先例異常辨識;然后,基于已知故障樣本,運用相同的方式甄別復(fù)現(xiàn)故障和未知故障;最后,對于復(fù)現(xiàn)故障,運用GA-SVM診斷故障原因,對于未知故障,則由專家進行診斷和標注,并加入樣本集,將未知故障轉(zhuǎn)變?yōu)閺?fù)現(xiàn)故障。該方法能在無任何故障數(shù)據(jù)的情況下開展增量學習,完善故障模式,提升診斷精度。滾動軸承和往復(fù)壓縮機氣閥的故障診斷實驗證明了其有效性。
小樣本不均衡是指正常樣本易獲取,占數(shù)據(jù)集絕大多數(shù);而故障樣本難獲取,只占極小比例。出現(xiàn)這種問題的原因有:①故障數(shù)據(jù)獲取難。雖然積累有海量歷史數(shù)據(jù),但設(shè)備大部分時期正常運行,故障并不常見,且工業(yè)生產(chǎn)不允許設(shè)備帶病運行,可采集數(shù)據(jù)的時間窗也不長,造成監(jiān)測數(shù)據(jù)重復(fù)度高,典型故障信息缺失。②故障數(shù)據(jù)標注難。僅有的異常樣本中,故障模式明確且已知的又只占少數(shù),大部分是未知的。從繁復(fù)的參數(shù)變化和隱晦的異常征兆中鎖定故障原因,依賴豐富的專家經(jīng)驗,甚至需專家會診乃至停車自檢,代價高昂。③故障數(shù)據(jù)復(fù)用難。受生產(chǎn)環(huán)境、運行工況等因素的影響,監(jiān)測數(shù)據(jù)的分布規(guī)律高度個性化,某一設(shè)備、某一工況下積累的樣本、訓練的模型很難適用于其他設(shè)備或工況,加劇了故障樣本的匱乏。
上述問題會導(dǎo)致模式識別側(cè)重樣本較多類別,輕視樣本較少類別。具體而言,診斷模型會傾向于判斷設(shè)備正常,漏報潛在故障。
K
將單一類別(定義為正常,其它所有類別統(tǒng)稱為異常)樣本集{x
,i
=1,2,…,M
}x
∈R
映射到高維特征空間H
中,計算一個包含盡可能多樣本的最小超球體作決策邊界,即一個描述樣本密度分布的二值模型。(1)
式中:S
——正常樣本;S
’——異常樣本。如圖1所示,One-Class SVM僅需正常樣本便能確定球心a
和半徑R
,并在正確區(qū)分正常樣本與異常樣本的基礎(chǔ)上,使半徑R
盡可能小,將其轉(zhuǎn)化為求解凸優(yōu)化問題:圖1 基于One-Class SVM的超球模型
s
.t
.(x
-a
)(x
-a
)≤R
+σ
σ
≥0,1,…,N
(2)
式中:σ
>0——超球外異常點,即x
∈S
′。定義Lagrange函數(shù):
(3)
式中:C
——懲罰系數(shù);σ
——松弛變量;α
≥0,γ
≥0——Lagrange系數(shù)。對R
和α
求偏微分,并令其為0:(4)
引入高斯徑向基核函數(shù)(x
,y
)→K
(x
,y
),即:(5)
其相應(yīng)的優(yōu)化方程為:
(6)
根據(jù)KKT(Karush-Kuhn-Tucker)條件,大部分α
=0,小部分α
>0,其對應(yīng)樣本點決定超球邊界,即支持向量。對于待識別樣本點y
,其到球心的距離平方為:(7)
設(shè)任一支持向量x
,球體半徑的平方為:R
=K
(x
,x
)-(8)
則定義判據(jù)RC
=f
(y
)/R
以判斷y
所屬類別:(9)
將設(shè)備正常運行視為一類,將其他所有已知或未知的故障視為另一類,統(tǒng)稱為異常狀態(tài)。振動監(jiān)測信號在不同頻段的動態(tài)能量分布能夠有效反映設(shè)備狀態(tài)的變化。因此,對正常狀態(tài)下的振動信號進行db4小波分解,提取分解后的前5層頻帶能量值作為特征,訓練One-Class SVM超球模型,在無任何故障數(shù)據(jù)的前提下,檢測設(shè)備對正常狀態(tài)的偏離,可實現(xiàn)零先例異常辨識。
傳統(tǒng)方法假設(shè)訓練模型的故障模式庫能夠描述設(shè)備運行的所有狀態(tài),但實際工程中,存在大量無歷史數(shù)據(jù)的未知故障,模型會將其強行歸類為已知故障的一種,造成漏診或誤診。因此,識別異常后需先對潛在的未知故障進行甄別。
將存在歷史樣本的復(fù)現(xiàn)故障視為“正?!?,其他所有未知故障視為異常?;跉v史故障樣本,除5層頻帶能量外進一步提取32維統(tǒng)計特征,訓練One-Class SVM超球模型,甄別未知故障。特征組成如表1所示,1~14為時域特征,15~22為頻域特征,23~37為時頻域特征。
表1 振動信號的故障特征組成
對于復(fù)現(xiàn)故障,基于歷史故障數(shù)據(jù),通過GA-SVM建立最優(yōu)診斷模型,分析故障根原因;對于未知故障,則邀請專家進行人工診斷和樣本標注,并加入已知故障模式庫以重新訓練GA-SVM,將未知故障轉(zhuǎn)變?yōu)閺?fù)現(xiàn)故障,實現(xiàn)動態(tài)增量學習。
故障診斷流程如圖2所示,具體步驟如下。
圖2 應(yīng)用于小樣本不均衡數(shù)據(jù)集的故障診斷方法
a)離線階段:①異常辨識建模:運用設(shè)備正常數(shù)據(jù),提取5維小波頻帶能量,建立基于One-Class SVM的異常辨識模型;②未知故障甄別:運用所有可用的歷史故障樣本,提取37維故障特征,建立基于One-Class SVM的未知故障甄別模型;③故障診斷建模:運用37維故障特征,建立基于GA-SVM的復(fù)現(xiàn)故障診斷模型。
b)在線階段:①狀態(tài)監(jiān)測:對設(shè)備進行實時振動監(jiān)測,提取5維小波頻帶能量;②異常辨識:將能量特征輸入異常辨識模型,若設(shè)備正常,則等待下一次檢測;若設(shè)備異常,則進入步驟③;③故障診斷:提取異常振動信號的37維故障特征,輸入未知故障甄別模型。若為復(fù)現(xiàn)故障,則將特征輸入故障診斷模型,判斷故障根原因;若為未知故障,則由專家分析標注后加入故障模式庫。
準確率常用于評判診斷模型性能,但對于不均衡樣本而言并不適用。例如,數(shù)據(jù)集中有99個正常樣本和1個故障樣本,若將所有樣本均預(yù)測為正常,準確率高達99%,但并無實際意義。為全面衡量診斷效果,提出若干項評判指標,如表2所示。
表2 故障診斷效果評判指標
表2中,重要度越大,則該事件潛在后果越嚴重。例如,漏報會導(dǎo)致設(shè)備異常的持續(xù)發(fā)展,引起非計劃停機乃至安全事故,危害最大;誤報則會中斷原有的正常生產(chǎn),造成經(jīng)濟損失,危害次之;誤診會使原有維修方案失效,延長維修時間,危害較小。因此,上述3個指標越小診斷性能越優(yōu)異。
3.2.1
數(shù)據(jù)說明與任務(wù)采用美國凱斯西儲大學滾動軸承故障數(shù)據(jù)集,如圖3所示。軸承位于電機驅(qū)動端,轉(zhuǎn)速1 797 r/min,振動信號采樣頻率12 kHz。設(shè)正常、內(nèi)圈故障、滾動體故障和外圈故障等4類狀態(tài),每類故障又包含0.18,0.36,0.53 mm 3種損傷直徑,設(shè)0.53 mm的外圈故障為未知故障,其余8種為復(fù)現(xiàn)故障。訓練集與測試集設(shè)置詳見表3,樣本不均衡比為正常(800)∶故障(8×5)=20∶1,樣本長度為1 024。
表3 滾動軸承故障數(shù)據(jù)說明
圖3 軸承故障測試裝置
3.2.2
診斷模型與對比除One-Class & GA-SVM外,一些常用模型也采用上述數(shù)據(jù)開展診斷任務(wù)以進行對比驗證,包括BPNN、堆棧降噪自編碼器(Stacked Denoising Auto-encoder, SDA)和GA-SVM,其參數(shù)詳見表4。
表4中,BPNN和SDA分別是淺層網(wǎng)絡(luò)和深度學習的代表方法。其中,SDA具有強大的特征學習能力,因此將振動信號的單邊頻率幅值(長度512)作為輸入,以挖掘深度故障特征。GA-SVM則在參數(shù)設(shè)置不變的前提下被獨立出來,用于驗證One-Class SVM和所提出診斷結(jié)構(gòu)的有效性。
表4 診斷模型及參數(shù)設(shè)置
3.2.3
診斷結(jié)果與分析One-Class SVM超球診斷模型的二維投影如圖4所示。藍色和紅色橢圓分別為異常辨識模型和未知故障甄別模型的邊界投影,其能有效區(qū)分正常狀態(tài)、復(fù)現(xiàn)故障以及未知故障,且無需歷史標簽樣本。綠色圓圈為選取的支持向量,用以在高維空間中確定超球邊界或最優(yōu)超平面,其數(shù)量隨訓練樣本多少而自動調(diào)整,受標簽樣本數(shù)量的制約較少。
圖4 軸承故障超球診斷模型的二維投影
實驗結(jié)果如表5所示,對比分析得出如下結(jié)論。
表5 各診斷模型的性能評估(軸承) %
a)漏報率方面,除提出方法外其余模型均出現(xiàn)不同程度的漏報。原因在于,實驗數(shù)據(jù)集的不均衡比高達20∶1,致使模型向占據(jù)樣本絕大多數(shù)的正常狀態(tài)偏移,難以對數(shù)量稀少的故障樣本建立精準的辨識條件。
b)誤報率方面,除BPNN外其余模型均能有效識別正常狀態(tài),未出現(xiàn)誤報。但值得注意的是,這同樣建立在正常樣本充足、其辨識條件得到充分訓練的基礎(chǔ)上。
綜合以上分析可知,在故障樣本嚴重不足的前提下,傳統(tǒng)模型訓練所用的正常樣本較多,不均衡比上升,可能造成漏報;所用正常樣本較少,不均衡比下降,又存在誤報風險。而所提出的分步辨識結(jié)構(gòu),充分利用正常數(shù)據(jù)以完善正常狀態(tài)的超球模型,最大程度地明確異常界限,能夠同步消除漏報和誤報問題。
c)誤診率方面,BPNN和SDA的誤診率高達75%,GA-SVM也有30%。傳統(tǒng)模型誤診如此嚴重是因為:一方面,設(shè)有4組未知故障,不存在與之對應(yīng)的歷史樣本,傳統(tǒng)模型將其強行歸類為已知狀態(tài),必然誤診;另一方面,每類故障只有5組訓練樣本,且同一故障模式的不同損傷程度間存在特征相似性,加劇了診斷難度。
d)總準確率方面,One-Class & GA-SVM的準確率高達99%,GA-SVM也有94%,遠超BPNN和SDA,表明SVM在不均衡數(shù)據(jù)集上表現(xiàn)更佳。此外,將每類狀態(tài)的測試樣本數(shù)量固定為20組,逐步減少訓練樣本數(shù)量,模擬標簽樣本匱乏的場景,測試各模型在小樣本集上的性能,結(jié)果詳見圖5。
圖5 小樣本故障診斷正確率
將訓練樣本與測試樣本的數(shù)量比定義為小樣本比例。如圖5所示,隨著訓練樣本的減少,3種模型的性能均有所下降。其中,GA-SVM最為穩(wěn)定,在小樣本比為0.3∶1時,仍有98.75%的高準確率,即使最惡劣的0.1∶1場景,即只有2組訓練樣本,準確率也達90.63%;BPNN表現(xiàn)次之,小樣本比0.1∶1時測試準確率為64%;SDA效果最差,最惡劣場景下只能識別34.38%的樣本。因為SDA等深度模型的網(wǎng)絡(luò)結(jié)構(gòu)更復(fù)雜,所需訓練樣本更多。因此,當樣本不足時,模型訓練不完善,診斷性能大幅下降。而SVM則搜尋少量的支持向量以確定最優(yōu)超平面,受樣本數(shù)量的制約較小,更適合小樣本場景。
3.3.1
數(shù)據(jù)說明與任務(wù)采用現(xiàn)場數(shù)據(jù)驗證提出方法的工程適用性。診斷對象為西部油田某作業(yè)區(qū)的高壓氣原料壓縮機,有4個壓縮氣缸,轉(zhuǎn)速993 r/min。由于機組老化,排氣閥故障頻發(fā)。如圖6所示,采集第2氣缸排氣閥閥蓋處振動信號,采樣頻率16 kHz,共有氣閥正常、閥片斷裂、閥片磨損和彈簧失效等4種狀態(tài)。具體設(shè)置如表6所示,樣本不均衡比為正常(400)∶故障(10×2)=20∶1,樣本長度為1 024。
圖6 往復(fù)壓縮機氣閥振動監(jiān)測
表6 滾往復(fù)壓縮機氣閥故障數(shù)據(jù)
3.3.2
診斷結(jié)果與分析模型設(shè)置和對比方法與3.2.2節(jié)一致,相應(yīng)超球診斷模型如圖7所示。圖7中,不同狀態(tài)的樣本均得到了正確辨識。與圖4相比,由于正常狀態(tài)和復(fù)現(xiàn)故障的樣本數(shù)量下降,One-Class SVM選取的支持向量也適當減少,但仍能有效確定超球邊界。實驗結(jié)果如表7所示,One-Class & GA-SVM在各項評判指標中均顯著優(yōu)于對比方法,取得了100%的診斷正確率,無漏報、誤報及誤診現(xiàn)象,表明所提方法更能適應(yīng)實際工業(yè)生產(chǎn)中,正常樣本眾多、故障樣本稀少、數(shù)據(jù)重復(fù)度高且極端不均衡的復(fù)雜環(huán)境。
表7 各診斷模型的性能評估(壓縮機氣閥) %
圖7 往復(fù)壓縮機氣閥故障超球診斷模型的二維投影
面向?qū)嶋H工程場景,提出一種適用于小樣本不均衡數(shù)據(jù)集的故障分步診斷策略。經(jīng)實驗驗證得到如下結(jié)論。
a)基于One-Class SVM構(gòu)建超球診斷模型,能夠在沒有任何先例樣本的條件下實現(xiàn)異常狀態(tài)辨識和未知故障甄別。實驗結(jié)果表明,其能顯著降低診斷模型的漏報率、誤報率和誤診率,提升算法對復(fù)雜工程環(huán)境的適應(yīng)性。
b)所提出的One-Class & GA-SVM在小樣本不均衡數(shù)據(jù)集上取得了優(yōu)異的模式識別效果,在不均衡比20∶1的實驗和工程數(shù)據(jù)上,分別取得了99%和100%的準確率,在小樣本比0.1∶1的場景下也有90%以上的準確率。
所提方法仍有諸多不足,如未知故障仍需人工判斷其所屬類型,可考慮通過特征相似度開展研究。