朱林全 蔣文英 李 朋 邢 鑌,3
(1.重慶大學機械工程學院;2.重慶工業(yè)大數(shù)據(jù)創(chuàng)新中心;3.工業(yè)大數(shù)據(jù)應用技術國家工程實驗室)
動設備指工作進程中發(fā)生能源消耗的設備,在生產(chǎn)過程中占據(jù)重要的地位,其“健康”運行對于解放生產(chǎn)力、創(chuàng)造社會財富具有重要意義。 如果裝置的關鍵動設備出現(xiàn)故障,將會影響生產(chǎn)節(jié)奏甚至被迫停產(chǎn),給企業(yè)造成巨大的經(jīng)濟損失或安全隱患,有些行業(yè)故障維修和停機損失費用己占其生產(chǎn)成本的30%~40%[1]。 因此,對動設備進行“健康”狀態(tài)監(jiān)測與故障診斷具有巨大的經(jīng)濟效益和社會效益。
故障診斷即利用故障數(shù)據(jù)源輸入診斷模型得出診斷結果的過程。 近年來,故障診斷領域的研究主要集中在特征提取和故障模式識別方面,針對某些特定領域已經(jīng)有不少算法模型被提出和完善,在實際應用中也有較好的效果,但在診斷數(shù)據(jù)源方面的研究較少。 現(xiàn)有的故障診斷模型在針對某一具體診斷對象時還存在一些問題,比如:用于故障診斷的數(shù)據(jù)源單一,只使用與所監(jiān)測動設備故障相關的參數(shù)進行故障診斷,忽略與故障診斷有關的潛在的其他數(shù)據(jù),存在誤診和漏診的情況;故障樣本數(shù)據(jù)的數(shù)據(jù)源小,對于一些重要設備或者新設備,由于算法訓練的故障數(shù)據(jù)較少,導致訓練得到的算法診斷效果差;診斷模型 使用 算 法 單 一,由 已 有 的 研 究 和 實 驗 表 明[2~4],故障診斷模型往往只采用一種故障診斷算法,由于每種算法都有其局限性,導致有時診斷準確度不高和使用范圍受限。 為此,提出基于標識解析和可信度矩陣的故障診斷模型(以下簡稱模型)。模型基于工業(yè)物聯(lián)網(wǎng)及其標識解析技術實現(xiàn)診斷對象的多維相關數(shù)據(jù)采集,獲取企業(yè)內(nèi)部或行業(yè)其他同類或相似工況下動設備的歷史故障數(shù)據(jù),用于訓練模型和診斷,并基于主流故障診斷,考慮每種算法對同一對象的不同故障類型診斷準確度不同,以及不同算法對同一對象同一故障的診斷準確度不同,構建綜合診斷結果可信度矩陣,進行多維數(shù)據(jù)、多種算法的綜合故障診斷方法,以提高故障診斷的準確度和模型的適用性。
標識解析技術是工業(yè)互聯(lián)網(wǎng)的核心技術之一,是工業(yè)互聯(lián)網(wǎng)的神經(jīng)系統(tǒng),是打破工業(yè)大數(shù)據(jù)異主、異地、異構形成的“信息孤島”,實現(xiàn)工業(yè)系統(tǒng)互聯(lián)和工業(yè)數(shù)據(jù)傳輸交換的重要手段和支撐基礎,為企業(yè)生產(chǎn)的信息管理系統(tǒng)、資源控制系統(tǒng)及網(wǎng)絡系統(tǒng)等提供必要的數(shù)據(jù)支撐。 標識解析技術建設了一套完整的數(shù)據(jù)解析和理解體系,實現(xiàn)了數(shù)據(jù)之間的互通和理解。
工業(yè)互聯(lián)網(wǎng)標識解析技術主要由標識編碼和標識解析兩部分構成。 標識編碼指為人、機、物等實體對象和算法、工藝、數(shù)據(jù)等虛擬對象賦予全球唯一的身份標識,類似于互聯(lián)網(wǎng)中的域名。標識解析指通過標識編碼查詢標識對象在網(wǎng)絡中的服務站點,類似于互聯(lián)網(wǎng)中的域名解析服務,是實現(xiàn)資源互聯(lián)互通的關鍵基礎設施。 主流的標識解析技術主要有Handle、GS1及OID等,目前多用于流通環(huán)節(jié)的供應鏈管理、 全生命周期管理及產(chǎn)品溯源等場景[5,6]。 利用標識解析技術對數(shù)據(jù)進行身份標識時,同一動設備在不同系統(tǒng)中有唯一的同一標識,同一動設備的相關信息都有其相同的前綴, 在搜索數(shù)據(jù)時能夠快速獲取該動設備的相關信息。 利用數(shù)據(jù)的統(tǒng)一表達、 描述和解析標準與語言分析處理技術, 對不同系統(tǒng)的同種或相關信息進行快速集中與融合, 為利用大數(shù)據(jù)技術挖掘高價值信息提供了基礎。 同時,利用標識解析技術,快速定位動設備、物體及零部件等。
故障診斷的基本流程是利用傳感器采集診斷動設備的振動、超聲及電磁等信號,經(jīng)過數(shù)據(jù)預處理后, 利用特征提取算法提取相應的特征,故障診斷算法通過利用反應故障信息的故障特征對故障模式進行識別進而得出診斷結果。 因此, 故障診斷的主要步驟是特征提取和故障識別,其關鍵是選取適用的特征提取算法和故障診斷算法。
基于不同原理和適用領域的故障診斷技術較多,通過已有的研究資料[7~9],根據(jù)研究時間的順序介紹3種主流的故障診斷算法:
a. 神經(jīng)網(wǎng)絡故障診斷法。 近年來,人工神經(jīng)網(wǎng)絡(ANN)的研究日趨活躍,因其具有通過多層網(wǎng)絡結構建立輸入和輸出之間復雜的非線性關系的特點,在人工智能模式識別領域有著廣泛的應用。 在故障診斷領域,已有眾多學者開展了BP神經(jīng)網(wǎng)絡、 模糊神經(jīng)網(wǎng)絡及RBF神經(jīng)網(wǎng)絡等方面的研究,其在非線性映射特征、容錯性及并行處理等方面性能良好,在故障診斷中得到了很好的應用效果。
b. 支持向量機故障診斷法。 支持向量機(SVM)建立在統(tǒng)計學理論(STL)的VC維理論和結構風險最小原理基礎上,是一套能保證從有限樣本得出預報能力最強的數(shù)學模型的統(tǒng)計學習理論,既能有效處理非線性數(shù)據(jù),又能限制過學習,特別適合于小樣本集的數(shù)據(jù)處理。 在故障診斷領域,由于一些故障信息難以獲取或故障次數(shù)較少導致數(shù)據(jù)樣本較小,因而SVM在故障診斷領域有較廣泛的應用。
c. 深度學習故障診斷法。 傳統(tǒng)的故障診斷過程大多是基于信號處理的特征提取+機器學習模型的方法,需經(jīng)過故障特征提取、故障特征選擇及狀態(tài)識別等過程。 深度學習直接從原始數(shù)據(jù)出發(fā),構建深層次的模型,結合海量的訓練數(shù)據(jù),學習數(shù)據(jù)中隱含的特征,擺脫了對大量信號處理技術與診斷經(jīng)驗的依賴, 利用大數(shù)據(jù)來學習特征,增強了動設備故障診斷的準確度和智能性。
由于每種算法都有其適用性, 下面對3種故障診斷算法的優(yōu)劣作簡要對比,詳見表1。
表1 3種故障診斷算法優(yōu)劣勢比較
特征提取是利用已有的特征參數(shù)構造一個較低維數(shù)的特征空間, 該低維特征空間所蘊含的有用信息覆蓋原始特征所表達的全部信息, 忽略多數(shù)不相干的信息。 從已有研究[10~12]中總結的常用的軸承故障診斷方法有:
a. PCA主成分分析法,在相互之間可能存在相關性的特征變量集合中,利用正交變換將它轉(zhuǎn)換為一組線性不相關的特征變量組成的集合,同時,轉(zhuǎn)換后的集合能夠盡可能多地反映原來集合的信息,轉(zhuǎn)換后的這組變量叫主成分。
b. BP神經(jīng)網(wǎng)絡法,常用于在特征變量數(shù)量較多、模式類別具有復雜邊界的情況下,獲取能表征故障信息的特征變量。其原理是利用BP神經(jīng)網(wǎng)絡,通過訓練數(shù)據(jù)集,找到反映故障信息的特征變量,實現(xiàn)特征變量與故障分類的映射,具有良好的非線性映射能力。
c. 小波分析法,常用于對信號在時頻域進行特征提取。 小波分析從不同的尺度觀察信號,將信號分解在不同的頻帶內(nèi), 具有多分辨率的能力,在低頻部分有較高的頻率分辨率,在高頻部分有較高的時間分辨率。 小波變換擁有強大的特征提取、奇異性檢測和濾波降噪的能力。
圖1為模型框架,包含數(shù)據(jù)采集層、數(shù)據(jù)傳輸層、故障診斷層、故障診斷結果4個部分。 相對于傳統(tǒng)的故障診斷模型,該模型基于工業(yè)互聯(lián)網(wǎng)及其標識解析技術,建立了針對關鍵零部件、整體系統(tǒng)等診斷對象相關的歷史故障數(shù)據(jù)庫、額定參數(shù)數(shù)據(jù)庫、參數(shù)特征數(shù)據(jù)集,實現(xiàn)對同一對象多維數(shù)據(jù)的關聯(lián)和融合,并在基礎故障診斷算法庫和基礎特征處理算法庫的基礎上,構建基于多種方法的綜合故障診斷模型,達到高精度、自適應診斷對象故障的目的。
圖1 模型框架
數(shù)據(jù)采集層是采集用于故障診斷的數(shù)據(jù)源,包括對象內(nèi)部診斷參數(shù)集、對象關聯(lián)系統(tǒng)數(shù)據(jù)集和外部故障數(shù)據(jù)集:
a. 內(nèi)部診斷參數(shù)集主要是根據(jù)實驗和經(jīng)驗采集用于故障診斷的多維診斷參數(shù), 如振動信號、諧波信號及聲信號等;
b. 對象關聯(lián)系統(tǒng)數(shù)據(jù)集包括與對象有關的儲存在其他系統(tǒng)的動態(tài)和靜態(tài)參數(shù)(如MES、ERP等生產(chǎn)管理信息系統(tǒng)), 以及診斷對象作為整體的外部輸入和輸出系統(tǒng)數(shù)據(jù) (如診斷電機故障時,作為電機輸入的電力系統(tǒng)和電機輸出的力作為動力源的機械系統(tǒng));
c. 外部故障數(shù)據(jù)集是指企業(yè)內(nèi)部或外部的相同或相似工況的同種或同類型動設備的歷史故障數(shù)據(jù)。
數(shù)據(jù)處理層包括對采集的數(shù)據(jù)進行數(shù)據(jù)預處理和故障特征提取。 數(shù)據(jù)預處理層包括基本數(shù)據(jù)預處理步驟,還包括基于工業(yè)互聯(lián)網(wǎng)中標識解析技術對同一對象的相關信息進行統(tǒng)一標識、規(guī)范數(shù)據(jù)結構,便于識別和關聯(lián)相關信息,以及后續(xù)數(shù)據(jù)的使用和查詢,如:同一個軸承的振動監(jiān)測信號、諧波信號有相同的標識前綴,對與診斷對象相關的多個系統(tǒng)數(shù)據(jù)進行標識和規(guī)范,對故障的類型進行編碼等。 數(shù)據(jù)處理是利用一系列特征提取算法,根據(jù)獲取數(shù)據(jù)的類型和相應的故障診斷算法來提取相應的特征,并對特征進行標識和管理。
故障診斷層由額定參數(shù)數(shù)據(jù)庫、歷史故障數(shù)據(jù)庫、參數(shù)特征數(shù)據(jù)集、故障診斷基礎算法庫和可信度參數(shù)數(shù)據(jù)庫構成:
a. 額定參數(shù)數(shù)據(jù)庫是由大量與動設備的固有參數(shù)、運行或加工過程設定參數(shù)、診斷對象作為整體的外部輸入和輸出系統(tǒng)里的設定參數(shù)等額定參數(shù)構成的。 能否滿足相關額定參數(shù)是動設備“健康”與否的最基本參照標準。
b. 歷史故障數(shù)據(jù)庫, 主要是記錄與診斷對象、 其子系統(tǒng)或零部件有關的歷史故障數(shù)據(jù),主要包括故障的類型、故障的特征及故障檢查結果等,同時還包括從企業(yè)內(nèi)部其他相同或相似工況下同種或同類動設備的故障數(shù)據(jù)。 歷史故障數(shù)據(jù)主要用于訓練算法模型、 基礎算法的參數(shù)更新、可信度參數(shù)更新及歷史故障統(tǒng)計查詢等。 歷史故障數(shù)據(jù)也可以通過標識解析技術被外部訪問和使用。
c. 參數(shù)特征數(shù)據(jù)集是對采集的診斷對象內(nèi)部或外部數(shù)據(jù)進行特征提取后的特征集。 根據(jù)具體算法、采集的數(shù)據(jù)類型,運用相應特征提取算法提取特征,并基于標識解析技術對每個診斷對象的每種采集數(shù)據(jù)的特征進行標識和管理。
d. 故障診斷基礎算法庫包括主流、精確度較高的算法,如專家系統(tǒng)、深度學習、支持向量機及神經(jīng)網(wǎng)絡故障診斷法等。
e. 可信度參數(shù)數(shù)據(jù)庫主要存儲針對某一特定診斷對象的可信度矩陣和相關信息。
本診斷模型基于工業(yè)物聯(lián)網(wǎng)及其標識解析技術,可以快速對某系統(tǒng)或某個零部件進行故障診斷。 同時,可以在診斷模型得出結果后對故障進行快速定位,為維修人員提供維修支撐。
在模型框架中, 故障診斷層是關鍵部分,其中利用相關的數(shù)據(jù)庫進行故障診斷流程是模型的核心。
圖2為模型故障診斷流程,其步驟如下:
a. 經(jīng)標識解析技術處理后的數(shù)據(jù),首先多維度判定動設備基本的額定參數(shù)值是否合理,如動設備的運行功率應該處于額定功率附近一定范圍內(nèi),動設備的額定輸出應該在合理范圍內(nèi)等。
b. 當參數(shù)滿足額定參數(shù)的相關要求時,按照故障診斷算法的特征要求,通過特征算法庫進行特征提取,建立特征參數(shù)數(shù)據(jù)集。
c. 利用特征進行故障診斷前,先對歷史故障數(shù)據(jù)庫進行特征搜索,若提取的特征在歷史特征庫里存在,則直接判斷該診斷結果為歷史故障類型。
d. 在利用多種基礎診斷算法對故障進行綜合診斷時,通過獲取可信度參數(shù)數(shù)據(jù)庫里的診斷對象的可信度矩陣,由每種算法及其診斷的結果結合可信度矩陣得到綜合診斷結果。
e. 診斷結束后,根據(jù)實際檢驗結果、診斷結果的偏差以及歷史故障數(shù)據(jù)對可信度矩陣進行更新。 同時,當加入故障類型、故障特征及算法匹配參數(shù)等新的故障數(shù)據(jù)后,基礎算法也可以通過自學習更新算法參數(shù)。
筆者采用多種算法綜合診斷某一動設備的故障,由于每種算法對同一對象的不同故障類型的診斷準確度不一定相同,而且在多種算法綜合診斷時不同算法診斷同一故障的診斷結果可信度不相同,即需賦予不同算法診斷結果不同的權重,基于此建立了綜合診斷的可信度矩陣。 可信度矩陣決定著診斷模型的準確度,因而建立每個診斷對象的可信度矩陣是對故障進行多算法綜合診斷的關鍵。
圖2 故障診斷流程
設診斷模型中,基礎算法數(shù)據(jù)庫包含的算法種類為A1、A2、…、An,某一對象的故障類型為F1、F2、…、Fm-1、F0(其中F0表示正常)。 由于每種算法對每種故障類型的診斷準確度不一定相同,即算法診斷某一對象的某種故障類型結果可以用準確度表示, 因此構建一個m×n的算法和故障類型準確度矩陣M:
其中Rij(i=1,2,…,m;j=1,2,…,n)為第j個算法第i個特征的準確度。準確度Rij由基于歷史數(shù)據(jù)的每個算法模型的混淆矩陣的準確度獲得,其計算過程如下。
對于一個算法Aj, 其多分類模型的混淆矩陣見表2。
表2 多分類模型混淆矩陣
對于動設備健康狀態(tài)Fi(Fi∈{F1,F(xiàn)2,…,F(xiàn)m-1,F(xiàn)0}), 可以將上述混淆矩陣轉(zhuǎn)換為二分類的混淆矩陣(表3)。
表3 二分類混淆矩陣
對于所有故障:
由于準確率和召回率是互相影響的,一般情況下準確率高、召回率就低,準確率低、召回率就高。 為了綜合兩者,使兩者都較高,定義:
對于故障診斷算法, 存在誤診和漏診的情況。 特別地,對于非故障時(正常時),由于將故障狀態(tài)診斷為正常狀態(tài)具有極大的安全隱患(即漏診),這種錯誤是很難被接受的,所以準確率應該較召回率高, 以減少故障漏診的概率, 故β=0.5,即:
當診斷結果為正常時的準確度F0.5i,可以用于衡量多種算法的優(yōu)劣性。
綜上,對于某一故障診斷對象,第j個算法第i個特征的準確度Rij為:
同時,當用多種算法共同診斷同一對象的同一故障時,每種算法的診斷結果有不同的可信度,也即每種算法對每種故障診斷結果的權重矩陣P:
設Pi=[κi1κi2… κin],Mi=[Ri1Ri2…Rin](i=1,2,…,m)。
在多種算法綜合診斷同一對象同一故障時,基于可信度最大的原則, 即單一算法準確度越高,給予的權重就越大。 將最大的準確度作為標準,則有:
綜合可得,多種算法共同診斷同一對象時設的綜合診斷結果可信度矩陣為Mreliability, 它由準確度矩陣M和診斷結果的權重矩陣P的哈達馬乘積求得:
研究算法和故障類型的準確度矩陣M和診斷結果的算法權重矩陣P, 可以了解某種算法的使用范圍及其準確度,以及在診斷某一對象時各種算法的準確性。
石化行業(yè)具有生產(chǎn)動設備和工藝復雜、生產(chǎn)過程流程性強、 生產(chǎn)過程安全要求高等特點,在生產(chǎn)過程中局部動設備故障會影響全局生產(chǎn),成為重大的安全隱患, 可能造成巨大的經(jīng)濟損失。因此,對石化行業(yè)動設備的“健康”狀況進行診斷和預測,具有重要的經(jīng)濟價值和社會價值。 據(jù)統(tǒng)計,旋轉(zhuǎn)機械故障有30%是由軸承故障引起的[12]。壓縮機是石化行業(yè)的核心動設備之一,其正常工作與否關系著整個生產(chǎn)流程的正常運行。 故本項目以某ATL250-36/20型氨離心制冷壓縮機的軸承故障診斷為例,介紹診斷模型。
診斷模型在原歷史數(shù)據(jù)、經(jīng)驗、動設備其他信息等的前提下,建立相關數(shù)據(jù)庫(表4),包括故障診斷算法基礎數(shù)據(jù)庫、 可信度參數(shù)數(shù)據(jù)庫、特征算法庫、額定參數(shù)數(shù)據(jù)庫和歷史故障數(shù)據(jù)庫。
表4 軸承相關故障數(shù)據(jù)庫
筆者根據(jù)收集的資料[7~14]模型選用3種主流的軸承故障診斷方法:RBF神經(jīng)網(wǎng)絡法(A)、支持向量機法(B)、基于堆棧降噪自編碼軸承故障診斷法(C)。 故障類型為F1外圈故障、F2內(nèi)圈故障、F3滾珠故障、F0正常。
讀取由歷史故障數(shù)據(jù)和模型統(tǒng)計得到的可信度參數(shù)數(shù)據(jù)庫數(shù)據(jù),包括該軸承的算法和故障類型準確度矩陣M和權重矩陣P:
其中,列依次代表外圈故障、內(nèi)圈故障、滾珠故障、正常4種軸承“健康“狀態(tài),行分別代表RBF神經(jīng)網(wǎng)絡法、支持向量機法、基于堆棧降噪自編碼軸承故障診斷法3種故障診斷算法。
則可得用3種方法綜合診斷該軸承時的綜合診斷結果可信度矩陣Mreliability:
故障診斷算法在診斷故障時,一般診斷結果為正確的故障類型,或者不能診斷出故障(即正常狀態(tài)),小概率會診斷為錯誤的故障類型。 當用A、B、C算法共同診斷該軸承時, 某一次診斷結果F=[F3F3F0]T, 則由故障診斷算法類型作為列標、診斷結果作為行標,從綜合診斷結果可信度矩陣Mreliability中獲得A、B、C的診斷結果可信度參數(shù)MP=[0.92 0.05 0.51],則綜合診斷結果Result=MP×F=0.92F3+0.05F3+0.51F0。
由于故障診斷輸出關注故障發(fā)生的概率,令正常狀況F0=0,故障狀態(tài)Fi=1,故有F=[1 1 0]T。
則診斷結果為有故障的概率Resultp為:
可以看出, 通過3種算法綜合診斷該軸承,認為發(fā)生故障的概率為97%。 通過設定可信度閾值Resultstd,當綜合診斷結果大于閾值時,則判定軸承有故障, 并輸出診斷的故障類型。 可信度閾值Resultstd過大,則可能造成故障漏診,過小則會造成誤診,一般對于重要動設備,應盡量避免漏診,所以Resultstd的取值一般為70%~90%。 Resultstd可由訓練樣本得到,本例中Resultstd為0.80,則輸出的診斷結果為:軸承故障,故障類型為滾珠故障F3。
從權重矩陣P可以得出,對于某一故障類型,某一種算法診斷該故障越精確其權重就越大,其余的算法診斷結果的權重就越小。 特別地,當3種算法診斷結果都相同時,輸出結果為1。 同時,若單種算法在診斷某種故障的準確度為100%時,其余的診斷算法的權重由式(1)得出為0,即診斷該種故障的結果只由這種算法確定。 證明本模型計算結果滿足兩種極端情況。 從式(2)可以得出,綜合診斷模型診斷每種故障的可信度不小于單種算法診斷可信度的最大值,表明綜合診斷算法的診斷結果更準確。
當綜合診斷結果為有故障時, 提出故障報警, 可基于標識解析技術對故障進行快速定位,檢修人員根據(jù)模型提供的故障信息進行檢查并反饋到模型中。 當檢驗結果為故障時,將本次檢測的故障特征、診斷類型及檢查結果等信息存入歷史故障數(shù)據(jù)庫。 基于歷史數(shù)據(jù)庫中的故障信息, 對算法和故障類型準確度矩陣M和算法權重矩陣P進行更新,隨著歷史故障數(shù)據(jù)的積累,M和P的準確度將越來越高。 同時,基礎算法庫基于歷史故障數(shù)據(jù),也可以通過自學習來更新算法的參數(shù),提高基礎診斷算法的準確性。
筆者構建了綜合多種算法和多維數(shù)據(jù)源的故障診斷模型,基于工業(yè)互聯(lián)網(wǎng)及其標識解析技術采集診斷對象內(nèi)部多個反映故障的參數(shù),將存儲在各個系統(tǒng)中與故障診斷相關的額定參數(shù)、對象外部相關系統(tǒng)數(shù)據(jù)、外部歷史故障數(shù)據(jù)等整合利用, 從多個數(shù)據(jù)維度對動設備故障進行診斷。同時,針對每種診斷算法各有其使用范圍和適用性的問題, 在建立故障診斷算法庫的基礎上,基于算法和故障類型準確度矩陣M和算法診斷結果的權重矩陣P共同構建可信度矩陣Mreliability, 通過多種算法診斷結果加權得到綜合診斷結果。 最后通過某石化行業(yè)壓縮機軸承故障診斷過程,驗證了該模型比單一算法具有更高的診斷準確率和更廣的使用范圍, 具有積極的工程應用價值,值得業(yè)內(nèi)推廣或借鑒。