耿曉強(qiáng),唐向紅,2,3,陸見(jiàn)光,2,3
(1.貴州大學(xué) 現(xiàn)代制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,貴陽(yáng) 550025;2.貴州大學(xué) 機(jī)械工程學(xué)院,貴陽(yáng) 550025;3.貴州省公共大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室,貴陽(yáng) 550025)
智能制造模式的發(fā)展,對(duì)生產(chǎn)過(guò)程的故障監(jiān)測(cè)提出了更高的要求。隨著越來(lái)越多的高速傳感器的使用,可以從生產(chǎn)線上獲取的數(shù)據(jù)越來(lái)越豐富,一方面為故障信號(hào)的檢測(cè)提供了更豐富的數(shù)據(jù)基礎(chǔ),但另一方面面對(duì)體量巨大、實(shí)時(shí)產(chǎn)生的線上流數(shù)據(jù),智能終端無(wú)法提供足夠的計(jì)算能力,而計(jì)算能力突出的計(jì)算機(jī)設(shè)備直接部署在生產(chǎn)現(xiàn)場(chǎng)又很不現(xiàn)實(shí)。在此背景下,將云端數(shù)據(jù)處理中心和嵌入式智能終端相結(jié)合,提出云加端的數(shù)據(jù)處理模式,可以有效的解決數(shù)據(jù)處理的實(shí)時(shí)性和計(jì)算能力不足的問(wèn)題。
制造業(yè)生產(chǎn)線上大量的使用了電動(dòng)機(jī)設(shè)備,軸承作為其中重要的機(jī)械零件故障發(fā)生率一直居高不下,生產(chǎn)過(guò)程中對(duì)電動(dòng)機(jī)軸承的實(shí)時(shí)監(jiān)測(cè),通過(guò)各種傳感器采集電機(jī)軸承運(yùn)行狀態(tài)數(shù)據(jù)并進(jìn)行分析,是保證生產(chǎn)工作正常進(jìn)行、避免發(fā)生生產(chǎn)事故或者減小事故損失必不可少的一個(gè)環(huán)節(jié)。異步電機(jī)轉(zhuǎn)子、軸承等設(shè)備是故障高發(fā)的設(shè)備,針對(duì)不同的故障類型[1-2],通過(guò)有效的方法提取不同故障的故障特征并對(duì)其進(jìn)行準(zhǔn)確的分類,是電機(jī)、軸承等設(shè)備實(shí)時(shí)故障診斷需要研究的問(wèn)題。
電機(jī)軸承的故障信息會(huì)調(diào)制在各種測(cè)量信號(hào)中,而振動(dòng)信號(hào)可以最為直觀、最為準(zhǔn)確反映故障,令很多學(xué)者爭(zhēng)相對(duì)其展開(kāi)研究[3-4]。而且在一些生產(chǎn)現(xiàn)場(chǎng)或者設(shè)備運(yùn)行現(xiàn)場(chǎng),數(shù)據(jù)信息多種多樣、源源不斷,因此很多學(xué)者提出了對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)處理的方法[5]。為了解決傳統(tǒng)方法診斷結(jié)果不直觀、準(zhǔn)確率低的問(wèn)題,機(jī)器學(xué)習(xí)越來(lái)越多的用到了故障診斷方面[6]。而且由于支持向量機(jī)(SVM)在小樣本分類方面優(yōu)越的性能,在文獻(xiàn)[7-8]中SVM被應(yīng)用到了故障診斷中,并取得了比較理想的效果。但是不斷改進(jìn)的算法導(dǎo)致了對(duì)數(shù)據(jù)處理設(shè)備的性能要求越來(lái)越高,使得數(shù)據(jù)的實(shí)時(shí)處理越來(lái)越不易實(shí)現(xiàn),使得理論研究距離工程應(yīng)用的距離越來(lái)越遠(yuǎn)。
為了解決上述問(wèn)題,本文提出云加端支持向量機(jī)(CaTSVM),將傳統(tǒng)的故障診斷方法分為“云端+終端 ”兩部分,相對(duì)計(jì)算復(fù)雜度較低的特征提取算法在終端嵌入式設(shè)備中完成,而相對(duì)來(lái)說(shuō)計(jì)算復(fù)雜度較高的訓(xùn)練和分類算法放在云端計(jì)算中心完成。這一新型的故障診斷架構(gòu)不僅僅可以將故障診斷算法從實(shí)驗(yàn)室環(huán)境下搬到實(shí)際環(huán)境中,而且由于終端嵌入式設(shè)備對(duì)原始數(shù)據(jù)進(jìn)行了預(yù)處理操作,使得云端和終端的通信數(shù)據(jù)體量大大減小,降低了數(shù)據(jù)傳輸代價(jià)。并且在云端建立故障特征模型庫(kù)(CFML),不斷的更新完善CFML,用完善后的故障特征在線訓(xùn)練SVM模型,進(jìn)一步提高SVM模型分類能力,使故障診斷系統(tǒng)擁有了“終生學(xué)習(xí)”的能力。
支持向量機(jī)(SVM)[9]由Vapnik和Cortes在1995年正式發(fā)表在《Machine Learning》雜志上,SVM的出現(xiàn)直接掀起了“統(tǒng)計(jì)學(xué)習(xí)”在機(jī)器學(xué)習(xí)領(lǐng)域的應(yīng)用高潮。而且由于支持向量機(jī)在小樣本、非線性以及高維模式分類方面表現(xiàn)出的優(yōu)秀性能[10],使其比神經(jīng)網(wǎng)絡(luò)更加適合應(yīng)用在電機(jī)軸承的故障診斷中。本文將支持向量機(jī)與云加端模型結(jié)合在一起,應(yīng)用在軸承故障診斷中。而且當(dāng)前SVM的理論研究比較多,工程應(yīng)用研究比較少,本文方法的提出可以進(jìn)一步豐富SVM的工程應(yīng)用研究,具有一定的工程指導(dǎo)意義。
支持向量機(jī)(SVM)是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論(Statistical Learning Theory)基礎(chǔ)上的機(jī)器學(xué)習(xí)方法,其目標(biāo)是利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則構(gòu)造最優(yōu)決策函數(shù)來(lái)解決二分類問(wèn)題,求解其最優(yōu)決策函數(shù)的問(wèn)題實(shí)質(zhì)上就是一個(gè)解凸二次規(guī)劃的問(wèn)題。
對(duì)于一個(gè)二分類問(wèn)題,存在訓(xùn)練樣本集D={(x1,y1),(x2,y2),…,(xn,yn)},其中xi∈Rn,yi∈{1,-1},訓(xùn)練的目的就是在包含D的樣本空間中尋找一個(gè)最優(yōu)分類超平面,將兩類樣本按照各自的樣本特征分開(kāi)。而在樣本空間中,我們可以將分類超平面表示為
ωTx+b=0
(1)
式中:ω表示超平面的法向量,b為相對(duì)偏移量。對(duì)于一些在線性空間不可分的樣本集,可以將其映射到更高維的特征空間,使樣本在該高維空間線性可分,令φ(x)為高維空間特征向量,得到高維空間分類超平面
(2)
式中:k(x,xi)即為此分類問(wèn)題的核函數(shù)。樣本中把兩類樣本分開(kāi)的超平面的向量稱為此二分類問(wèn)題的“支持向量”,而想要最優(yōu)化分類超平面,需要最大化兩類支持向量到超平面的距離
(3)
式中:yi(ωT+b)≥1,i=1,2,…,n,式(4)等價(jià)于
(4)
為了解決某些問(wèn)題中無(wú)法找到合適的核函數(shù)使訓(xùn)練樣本在特征空間線性可分的問(wèn)題,提出軟間隔的概念,引入松弛變量εi≥0,得到軟間隔支持向量機(jī)
(5)
其約束于yi(ωT+b)≥1-εi,εi≥0,i=1,2,…,n。引入正則化的概念,將求解最優(yōu)超平面問(wèn)題優(yōu)化為更一般的形式
(6)
故障特征提取相對(duì)于SVM的訓(xùn)練以及分類來(lái)說(shuō),計(jì)算復(fù)雜度相對(duì)較低,而且對(duì)線上實(shí)時(shí)處理數(shù)據(jù)的要求比較高,因?yàn)槿绻麑?duì)原始數(shù)據(jù)先進(jìn)行傳輸再處理,一方面數(shù)據(jù)體量巨大,傳輸過(guò)程耗時(shí)較多;另一方面由于原始數(shù)據(jù)的不確定性和敏感性,容易在傳輸過(guò)程中引入更多的其他干擾因素。所以原始數(shù)據(jù)直接在設(shè)備端進(jìn)行實(shí)時(shí)處理更加合理,并且設(shè)備端的嵌入式設(shè)備的計(jì)算性能也可以滿足故障特征提取的要求。將原始數(shù)據(jù)進(jìn)行處理后,將提取并經(jīng)過(guò)降維的特征向量傳輸?shù)皆贫耍环矫鏈p小了數(shù)據(jù)傳輸量,另一方面增加了需要傳輸?shù)臄?shù)據(jù)的可靠性。使用支持向量機(jī)對(duì)軸承故障特征數(shù)據(jù)進(jìn)行分類,計(jì)算資源消耗最大的一部分是分類超平面的計(jì)算以及數(shù)據(jù)的分類過(guò)程,將這部分計(jì)算放在云端,可以在很大程度上提高分類的準(zhǔn)確度以及現(xiàn)實(shí)的可行性。并且在云端構(gòu)建故障特征數(shù)據(jù)庫(kù),在故障診斷的過(guò)程當(dāng)中不斷完善特征數(shù)據(jù)庫(kù),使用新的特征以替換舊的特征,不僅僅讓特征最新,而且讓特征數(shù)據(jù)庫(kù)中的數(shù)據(jù)保持一定的規(guī)模。云端模型庫(kù)CFML的建立讓本文提出的算法不再像傳統(tǒng)的SVM故障特征分類算法一樣只具備一次性學(xué)習(xí)能力,本文提出的算法可以在運(yùn)行過(guò)程中不斷完善和豐富,具備“終生學(xué)習(xí)”的能力。
如圖1所示是本文使用的云加端支持向量機(jī)模型。
圖1 CaTSVM故障診斷模型Fig.1 CaTSVM fault diagnosis model
目前常用的用于故障檢測(cè)的信號(hào)量中,聲音信號(hào)、電流、電壓信號(hào)和振動(dòng)信號(hào)尤其受到科研工作者的青睞,究其原因是因?yàn)檫@幾類信號(hào)最方便采集并且其均在一定程度上可以反映出當(dāng)前機(jī)電/機(jī)械設(shè)備的運(yùn)行狀態(tài)。通過(guò)對(duì)四種原始數(shù)據(jù)信號(hào)的實(shí)驗(yàn)對(duì)比,在是否侵入式、測(cè)量準(zhǔn)確度、反映故障類型、適用范圍以及提前預(yù)測(cè)時(shí)間等幾方面進(jìn)行考量,同時(shí)考慮到云加端故障診斷系統(tǒng)實(shí)際生產(chǎn)應(yīng)用的需要,在本文中振動(dòng)信號(hào)是最適合用來(lái)做機(jī)電設(shè)備故障診斷以及預(yù)測(cè)的數(shù)據(jù)類型。
故障檢測(cè)的目的是確定設(shè)備異常,故障診斷(分類)的目的是確定異常位置。故障檢測(cè)可以作為故障診斷的前期工作,因?yàn)楣收蠙z測(cè)算法的計(jì)算復(fù)雜度可以設(shè)計(jì)的更小,實(shí)時(shí)性可以更高,并且故障檢測(cè)可以為后期的故障診斷剔除很多干擾項(xiàng),以提高診斷效率和準(zhǔn)確率。耿曉強(qiáng)等[11]依托云加端的架構(gòu)提出了一種實(shí)時(shí)的故障檢測(cè)方法,其根據(jù)電機(jī)、軸承等旋轉(zhuǎn)設(shè)備故障信號(hào)存在周期性的特點(diǎn),使用聚類的方法對(duì)設(shè)備的實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)進(jìn)行處理,進(jìn)行設(shè)備異常檢測(cè)。本文的故障診斷程序的啟動(dòng)條件是故障檢測(cè)系統(tǒng)發(fā)出故障預(yù)警,在此條件下診斷系統(tǒng)在實(shí)際的工程使用中可以提高診斷準(zhǔn)確率并且大大降低人工參與確定故障的頻率。
特征提取在整個(gè)故障診斷系統(tǒng)中是計(jì)算量相對(duì)較小而且對(duì)流數(shù)據(jù)實(shí)時(shí)敏感的一部分,在本文提出的CaTSVM架構(gòu)中屬于終端數(shù)據(jù)處理部分。采集到設(shè)備的振動(dòng)信號(hào)后,經(jīng)過(guò)FFT變換可以得到信號(hào)的頻譜,根據(jù)以往的研究發(fā)現(xiàn),當(dāng)機(jī)電設(shè)備發(fā)生故障后會(huì)引發(fā)系統(tǒng)額外的振動(dòng),體現(xiàn)在信號(hào)頻譜上就是在在原始基波的基礎(chǔ)上會(huì)引入其他的諧波成分[12-13],利用這一特性可以很好的提取當(dāng)前故障的特征。但是由于信號(hào)頻譜特征的數(shù)據(jù)量和頻率分辨率成正比,并且其頻譜數(shù)據(jù)中并不是所有的特征量都可以有效的反映故障特征,如果使用振動(dòng)信號(hào)的頻譜作為特征向量,將面臨特征向量的維數(shù)災(zāi)難,而且存在非常大的冗余度,因此對(duì)頻譜特征進(jìn)行降維,提取主要特征將是必要的[14]。
主成分分析(PCA降維)可以有效的解決這個(gè)問(wèn)題,它可以重新構(gòu)建一個(gè)超平面來(lái)對(duì)所有的輸入樣本進(jìn)行恰當(dāng)?shù)谋硎荆缓笸ㄟ^(guò)對(duì)新的樣本表示進(jìn)行重要性排序(特征值大小),來(lái)選擇可以在一定程度上表示原來(lái)的樣本特性,并且將維度降到我們可以接受的范圍之內(nèi)的樣本映射。
PCA算法可以描述為以下過(guò)程[15]
輸入:輸入數(shù)據(jù)D={x1,x2,…,xm};降維后目標(biāo)維數(shù)d′
輸出:降維后數(shù)據(jù)W=(ω1,ω2,…,ωd′)
傳統(tǒng)的SVM模型大多是采用“離線訓(xùn)練-離線分類”[16-18]或者“離線訓(xùn)練-在線分類”的結(jié)構(gòu)[19],這樣的結(jié)構(gòu)對(duì)于解決實(shí)驗(yàn)室數(shù)據(jù)并沒(méi)有太大的問(wèn)題,因?yàn)閷?shí)驗(yàn)室數(shù)據(jù)存在太大的理想性?;蛘哳l繁的對(duì)模型進(jìn)行訓(xùn)練[20],可能導(dǎo)致過(guò)度的資源占用以及模型的過(guò)擬合,起到和預(yù)期相反的效果。此類結(jié)構(gòu)并沒(méi)有充分考慮到在實(shí)際的工程應(yīng)用中,機(jī)器的故障特征可能在發(fā)生著微妙的變化,導(dǎo)致當(dāng)前設(shè)備故障特征和SVM模型所依據(jù)的故障特征偏差越來(lái)越大,間接地造成了SVM模型分類準(zhǔn)確度的下降。
本文的CaTSVM在線訓(xùn)練模型采用了“離線訓(xùn)練+在線訓(xùn)練-在線分類”的結(jié)構(gòu),在初始階段,使用已經(jīng)分類完成的故障數(shù)據(jù)對(duì)CaTSVM模型進(jìn)行離線訓(xùn)練,建立初始CaTSVM模型;之后開(kāi)始在線的故障診斷,初始CaTSVM模型診斷的結(jié)果通過(guò)人機(jī)交互界面通知現(xiàn)場(chǎng),經(jīng)過(guò)工作人員實(shí)地檢查故障后反饋給系統(tǒng),并且將故障特征向量保存在云端特征模型庫(kù),由系統(tǒng)統(tǒng)計(jì)診斷的準(zhǔn)確率,當(dāng)準(zhǔn)確率低于指定閾值,調(diào)用云端特征庫(kù)對(duì)CaTSVM模型進(jìn)行二次訓(xùn)練,即在線訓(xùn)練,同時(shí)也避免了過(guò)度的資源占用。CaTSVM模型訓(xùn)練過(guò)程如圖2所示。
圖2 CaTSVM模型訓(xùn)練過(guò)程圖Fig.2 CaTSVM model training process
本文將故障特征提取和特征分類分別放在終端和云端進(jìn)行處理,終端負(fù)責(zé)對(duì)故障特征進(jìn)行提取,計(jì)算量相對(duì)較小,云端負(fù)責(zé)計(jì)算復(fù)雜度相對(duì)更高的特征學(xué)習(xí)和分類計(jì)算,并且隨著時(shí)間的推移,CaTSVM模型可以根據(jù)機(jī)電設(shè)備狀態(tài)的變化進(jìn)行終身的在線學(xué)習(xí)。由于終端對(duì)現(xiàn)場(chǎng)的實(shí)時(shí)反應(yīng)能力較強(qiáng),并且經(jīng)過(guò)特征提取之后的特征數(shù)據(jù)量相較于原始數(shù)據(jù)體量更小,可以大大減小網(wǎng)絡(luò)帶寬消耗并且提高數(shù)據(jù)傳輸和計(jì)算的實(shí)時(shí)性。終端、網(wǎng)絡(luò)、云端構(gòu)成了一個(gè)數(shù)據(jù)處理的并行“流水線”結(jié)構(gòu),可以再次在較大程度上提高系統(tǒng)的實(shí)時(shí)性。算法描述如下:
步驟1使用已知種類的故障特征數(shù)據(jù)離線訓(xùn)練CaTSVM,并將訓(xùn)練好的CaTSVM放在云端處理器,并且在云端建立特征模型庫(kù)CFML,將訓(xùn)練數(shù)據(jù)加入CFML;
步驟2終端原始數(shù)據(jù)采集;
步驟3終端FFT算法計(jì)算振動(dòng)信號(hào)的頻譜,提取故障特征并進(jìn)行降維;
步驟4將特征向量拷貝到無(wú)線設(shè)備模組發(fā)送緩沖區(qū),啟動(dòng)發(fā)送;運(yùn)行下一步,同時(shí)再次啟動(dòng)步驟2;
步驟5云端接收故障特征數(shù)據(jù),調(diào)用CaTSVM模型對(duì)特征向量進(jìn)行分類;
步驟6將分類結(jié)果返回人機(jī)交互界面,通過(guò)人工檢查,確定CaTSVM分類結(jié)果正確與否,并返回檢查結(jié)果;
步驟7根據(jù)人工復(fù)檢結(jié)果將特征向量分類加入特征模型庫(kù)CFML;
步驟8計(jì)算當(dāng)前故障分類準(zhǔn)確率,若準(zhǔn)確率低于閾值,從CFML取數(shù)據(jù),再次在線訓(xùn)練CaTSVM;返回步驟5。
本文的實(shí)驗(yàn)數(shù)據(jù)采自CUT-2轉(zhuǎn)子振動(dòng)試驗(yàn)臺(tái)(見(jiàn)圖3),終端處理器包括用于測(cè)量、預(yù)處理數(shù)據(jù)的測(cè)量模組(包括MCU和振動(dòng)傳感器)、無(wú)線設(shè)備模組。分別在不同負(fù)載以及故障情況下對(duì)軸承進(jìn)行故障診斷,包括① 正常軸承② 軸承內(nèi)圈故障③ 軸承外圈故障④ 軸承滾珠故障。每種狀態(tài)分別取500組數(shù)據(jù),共2 000組數(shù)據(jù)分別進(jìn)行訓(xùn)練和測(cè)試,對(duì)比不同算法準(zhǔn)確率以及效率,另外當(dāng)負(fù)載變化和故障尺寸變化后各狀態(tài)均增加500組數(shù)據(jù)用于實(shí)驗(yàn)。為了實(shí)驗(yàn)對(duì)比以及實(shí)驗(yàn)結(jié)果的記錄,云端設(shè)備使用DELL precision TOWER 5810服務(wù)器,終端使用Cortex M3系列處理器ADuCM3029。
圖3 CUT-2轉(zhuǎn)子振動(dòng)試驗(yàn)臺(tái)Fig.3 CUT-2 rotor vibration test bench
本文的特征提取需要應(yīng)用在系統(tǒng)的兩部分中,第一部分是已經(jīng)獲取的分類數(shù)據(jù)的特征提取,用于對(duì)PCA降維矩陣的訓(xùn)練以及CaTSVM分類模型的訓(xùn)練;第二部分是直接對(duì)實(shí)時(shí)采集的數(shù)據(jù)進(jìn)行特征提取,用于故障診斷以及在線學(xué)習(xí)中二次訓(xùn)練CaTSVM分類模型。信號(hào)的頻譜中包含了豐富的故障信息,直接計(jì)算出來(lái)的信號(hào)頻譜維度非常高,但是如果將頻譜進(jìn)行采樣或者求取部分信號(hào)的積分,將喪失頻譜信號(hào)對(duì)故障信息準(zhǔn)確反映的優(yōu)勢(shì),因此本文直接將信號(hào)的頻譜進(jìn)行PCA降維,在減小數(shù)據(jù)維度的同時(shí)保持了信號(hào)的完整性。
(1)原始數(shù)據(jù)經(jīng)過(guò)FFT計(jì)算出其頻譜,進(jìn)而求出其功率譜,使用z-score標(biāo)準(zhǔn)化方法對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。將標(biāo)準(zhǔn)化結(jié)果作為PCA算法的輸入,計(jì)算出對(duì)功率譜特征貢獻(xiàn)率最大的d′個(gè)特征,生成代表原始特征和降維特征對(duì)應(yīng)關(guān)系的降維矩陣D。其中d′的選擇是根據(jù)所選特征維數(shù)對(duì)整體特征的貢獻(xiàn)率不小于C%來(lái)確定的。計(jì)算出前k維特征向量對(duì)原始特征的貢獻(xiàn)度為
Con={0.596 4,0.755 6,0.827 1,0.880 5,0.897 5,0.910 3,0.921 5,0.932 0,0.939 6,0.945 0,0.949 5,0.952 7}
令C%=95%,取d′=12,得到的降維矩陣為
Dn×12=
(2)降維矩陣在CaTSVM模型訓(xùn)練階段就確定了下來(lái),而特征提取貫穿整個(gè)系統(tǒng)運(yùn)行的始終。在診斷過(guò)程中,數(shù)據(jù)要經(jīng)過(guò)傳感器采集,F(xiàn)FT計(jì)算數(shù)據(jù)頻譜、功率譜,數(shù)據(jù)降維,診斷分類等幾個(gè)階段。最后輸入到CaTSVM模型的特征向量是經(jīng)過(guò)降維矩陣降維之后的特征向量,如表2所示。
表1 不同故障對(duì)應(yīng)特征向量Tab.1 The eigenvector of different fault
SVM分類算法本質(zhì)上屬于二分類算法,雖然其可以通過(guò)更改算法實(shí)現(xiàn)多分類器,但是其計(jì)算復(fù)雜度大大提升。因此本文采用一對(duì)一的分類方法(One-Versus-One,OVO SVMs)分別對(duì)k類故障進(jìn)行兩兩分類,最后對(duì)k(k-1)/2個(gè)分類器的結(jié)果進(jìn)行投票匯總,得到最終的故障分類結(jié)果。此類方法對(duì)分類類別較少的情況有很好的分類效果和滿意的計(jì)算復(fù)雜度,非常適合機(jī)電設(shè)備的故障診斷。
根據(jù)本文對(duì)方法的改進(jìn)以及考慮到實(shí)驗(yàn)的可行性,本文從兩方面展開(kāi)對(duì)比實(shí)驗(yàn),以充分說(shuō)明本文提出方案的優(yōu)勢(shì)。第一方面,考慮到生產(chǎn)設(shè)備普遍的需要長(zhǎng)時(shí)間運(yùn)行,在此期間設(shè)備的狀態(tài)難免的發(fā)生一些變化,而且由于系統(tǒng)的負(fù)載也會(huì)時(shí)常發(fā)生不確定性的變化,這些變化導(dǎo)致傳感器采集的數(shù)據(jù)并不能像設(shè)備初始狀態(tài)下一樣反映設(shè)備的運(yùn)行狀態(tài)。如果系統(tǒng)不能對(duì)設(shè)備的當(dāng)前狀態(tài)進(jìn)行在線學(xué)習(xí),無(wú)疑系統(tǒng)的診斷準(zhǔn)確率將不斷的降低,直至無(wú)法正常工作。而本系統(tǒng)可以根據(jù)診斷的準(zhǔn)確率判斷系統(tǒng)運(yùn)行狀態(tài),進(jìn)行在線學(xué)習(xí),以解決設(shè)備狀態(tài)的逐漸演變給診斷模型帶來(lái)的干擾。第二方面,對(duì)于很多關(guān)鍵設(shè)備,系統(tǒng)的實(shí)時(shí)診斷是保障設(shè)備安全、正常運(yùn)行的重要條件。傳統(tǒng)的故障診斷大多數(shù)停留在實(shí)驗(yàn)室階段,即使用已經(jīng)采集的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)研究,實(shí)時(shí)性較差;即使將診斷方案封裝成計(jì)算機(jī)應(yīng)用,仍然需要在設(shè)備現(xiàn)場(chǎng)部署計(jì)算機(jī)進(jìn)行診斷。本文使用的系統(tǒng)包括終端和云端兩部分,在系統(tǒng)初始化設(shè)置完畢之后可以只將體積小巧的終端設(shè)備置于設(shè)備上采集數(shù)據(jù)并進(jìn)行特征提取,之后將特征上傳云端進(jìn)行診斷以及在線學(xué)習(xí)。這種流水線分布式數(shù)據(jù)處理方式充分考慮到了數(shù)據(jù)處理的實(shí)時(shí)性要求,是一項(xiàng)重要的實(shí)驗(yàn)指標(biāo)。
圖4 一對(duì)一法多分類支持向量機(jī)Fig.4 One versus one method multi-classification SVM
機(jī)械設(shè)備在運(yùn)行過(guò)程中可能發(fā)生設(shè)備狀態(tài)變化,其原因包括負(fù)載變化以及設(shè)備長(zhǎng)時(shí)間運(yùn)行造成的機(jī)械磨損等,本文提出的系統(tǒng)解決方案有助于降低這類變化給診斷系統(tǒng)帶來(lái)的診斷誤差。本實(shí)驗(yàn)將采集不同負(fù)載情況下的數(shù)據(jù)作為負(fù)載狀態(tài)變化,將采集不同故障直徑情況下的數(shù)據(jù)作為長(zhǎng)時(shí)間運(yùn)行造成的機(jī)械磨損,以此兩方面展開(kāi)實(shí)驗(yàn)研究。為了使用大量的數(shù)據(jù)進(jìn)行診斷準(zhǔn)確率的計(jì)算,這里將“算法描述”部分的“人工檢查”換成故障標(biāo)簽以判斷診斷正確與否。表2中給出了在線學(xué)習(xí)法和離線學(xué)習(xí)法原始診斷準(zhǔn)確率的數(shù)據(jù),該數(shù)據(jù)是在負(fù)載和故障尺寸均未變化的情況下測(cè)試得到,從中可以看出在初始狀態(tài)下在線學(xué)習(xí)算法和離線學(xué)習(xí)算法的診斷準(zhǔn)確率基本持平。表3、表4、表5所示是當(dāng)用負(fù)載變化和故障尺寸變化模擬設(shè)備狀態(tài)變化后傳統(tǒng)離線學(xué)習(xí)和本文提出的在線學(xué)習(xí)診斷準(zhǔn)確度對(duì)比:
表2 原始診斷準(zhǔn)確率Tab.2 Original diagnostic accuracy
表3 負(fù)載變化20%后診斷準(zhǔn)確率對(duì)比Tab.3 Comparison of diagnostic accuracy after load change 20%
表4 故障尺寸變化10%后診斷準(zhǔn)確率對(duì)比Tab.4 Comparison of diagnostic accuracy after fault size change 10%
根據(jù)利用軸承負(fù)載變化和故障尺寸變化來(lái)模擬軸承長(zhǎng)時(shí)間運(yùn)行給系統(tǒng)帶來(lái)變化的實(shí)驗(yàn)得到表3、表4、表5的數(shù)據(jù),由表3可知,負(fù)載的變化導(dǎo)致了傳統(tǒng)的離線學(xué)習(xí)方法診斷準(zhǔn)確度的降低,雖然沒(méi)有大幅度的降低,但是和在線學(xué)習(xí)方法相比仍然體現(xiàn)出了其劣勢(shì);由表4可知,故障尺寸的變化相較于負(fù)載的變化會(huì)對(duì)診斷準(zhǔn)確率帶來(lái)更大的影響,但是在線學(xué)習(xí)方法仍然表現(xiàn)出了優(yōu)越的性能;表5同時(shí)使用負(fù)載變化和故障尺寸變化來(lái)模擬系統(tǒng)狀態(tài)變化,由表中數(shù)據(jù)可以得出,在線學(xué)習(xí)法完全可以適應(yīng)系統(tǒng)的變化,但是傳統(tǒng)的離線學(xué)習(xí)方法的故障診斷準(zhǔn)確率已經(jīng)大大降低,無(wú)法滿足診斷系統(tǒng)的實(shí)際需求。
表5 負(fù)載變化20%+故障尺寸變化10%后診斷準(zhǔn)確率對(duì)比Tab.5 Comparison of diagnostic accuracy after load change 20% and fault size change 10%
在傳統(tǒng)的機(jī)器學(xué)習(xí)故障分類方法中,特征提取,高維特征降維以及故障分類均放在同一個(gè)PC端進(jìn)行順序處理,下一步必須在上一步計(jì)算完成釋放CPU使用權(quán)之后才能開(kāi)始;在本文的云加端結(jié)構(gòu)中,數(shù)據(jù)采集、特征提取、降維、數(shù)據(jù)傳輸以及SVM分類分別放在終端和云端進(jìn)行,隨著系統(tǒng)的運(yùn)行,可以把幾部分看作是并行處理數(shù)據(jù),是一種更為高效的數(shù)據(jù)處理方式。云加端流水線結(jié)構(gòu)和傳統(tǒng)數(shù)據(jù)處理結(jié)構(gòu)如圖5所示。
從圖5中可以看出,流水線診斷結(jié)構(gòu)可以并行的對(duì)數(shù)據(jù)進(jìn)行處理,形成了一種多環(huán)節(jié)并行的故障診斷模式,而傳統(tǒng)的診斷結(jié)構(gòu)對(duì)數(shù)據(jù)的處理只能是順序完成的。其中數(shù)據(jù)采集(COD)發(fā)生在MEMS傳感器中,采集的數(shù)據(jù)放在FIFO空間中;特征提取/降維(FE/DR)在MCU中進(jìn)行計(jì)算;數(shù)據(jù)傳輸(TDR)由RF芯片完成;故障特征的分類(CLOF)即故障診斷在云端進(jìn)行。
注:COD: Collection Data;
FE/DR: Feature Extraction/Dimensionality Reduction;
TRD: Transmission Data;
CLTF: Classify the Feature
圖5 兩種故障診斷結(jié)構(gòu)對(duì)比圖
Fig.5 Comparison chart of two kinds of fault diagnosis structure
并行的流水線數(shù)據(jù)處理結(jié)構(gòu)要比普通的順序結(jié)構(gòu)效率高很多,并行結(jié)構(gòu)可以同時(shí)充分調(diào)動(dòng)各個(gè)計(jì)算單元對(duì)數(shù)據(jù)進(jìn)行處理,一方面降低了單一處理器的計(jì)算負(fù)擔(dān),另一方面讓各個(gè)處理單元的“等待時(shí)間”大大降低,提高了系統(tǒng)的工作效率。如圖6所示給出了傳統(tǒng)的順序結(jié)構(gòu)和并行流水線結(jié)構(gòu)在相同時(shí)間內(nèi)完成任務(wù)數(shù)的對(duì)比,從圖中可以看出,隨著時(shí)間的推移,并行流水線結(jié)構(gòu)相較于傳統(tǒng)順序結(jié)構(gòu)體現(xiàn)出越來(lái)越大的效率優(yōu)勢(shì)。
圖6 傳統(tǒng)診斷結(jié)構(gòu)與流水線診斷結(jié)構(gòu)效率對(duì)比Fig.6 The efficiency comparison of traditional structure and pipeline structure
通過(guò)以上分析,從計(jì)算分布以及實(shí)際工程應(yīng)用的角度出發(fā),云加端的故障診斷方法更加符合實(shí)際的工程應(yīng)用,而且由于其可以直接布置在實(shí)際運(yùn)行的設(shè)備之中,真正實(shí)現(xiàn)了設(shè)備的在線實(shí)時(shí)故障診斷,相較于傳統(tǒng)只能先采集數(shù)據(jù)再進(jìn)行集中數(shù)據(jù)處理的方式更加符合實(shí)際。
文章中提出了一種云加端的改進(jìn)支持向量機(jī)(CaTSVM),并將其運(yùn)用到旋轉(zhuǎn)軸承的故障診斷中,通過(guò)云端和終端的配合,使得將故障診斷設(shè)備部署在生產(chǎn)線設(shè)備現(xiàn)場(chǎng)成為切實(shí)可行的方案。終端、無(wú)線傳輸以及云端并行流水線數(shù)據(jù)處理方式使得故障診斷系統(tǒng)的實(shí)時(shí)性得到大大提高,對(duì)系統(tǒng)的實(shí)時(shí)監(jiān)測(cè)有重大意義。
CaTSVM可以根據(jù)當(dāng)前被測(cè)設(shè)備狀態(tài)的變化適時(shí)的進(jìn)行在線訓(xùn)練,以隨著被測(cè)設(shè)備狀態(tài)的緩慢變化不斷的學(xué)習(xí)新的特征,使故障診斷系統(tǒng)具備“終身學(xué)習(xí)”的能力。通過(guò)在線訓(xùn)練可以讓診斷系統(tǒng)的診斷準(zhǔn)確度不受設(shè)備狀態(tài)變化的影響,提高分類器的識(shí)別能力。