王棟璀, 丁云飛, 朱晨烜
(上海電機(jī)學(xué)院 電氣學(xué)院,上海 200240)
齒輪箱作為旋轉(zhuǎn)機(jī)械設(shè)備的核心部件,長(zhǎng)期工作在惡劣的工況條件下,容易發(fā)生機(jī)械故障[1],如果不及時(shí)診斷維護(hù),會(huì)給旋轉(zhuǎn)設(shè)備造成較大的運(yùn)行風(fēng)險(xiǎn)和經(jīng)濟(jì)損失。因此,對(duì)齒輪箱建立快速而有效的故障診斷機(jī)制,是減少設(shè)備停機(jī)時(shí)間,提高經(jīng)濟(jì)效益的有效途徑。
目前,隨著人工智能技術(shù)的發(fā)展,基于智能算法的模式識(shí)別技術(shù)被引入到故障診斷領(lǐng)域中。K-最近鄰分類算法[2](K-Nearest Neighbor,KNN)是一種基于先驗(yàn)知識(shí)的監(jiān)督學(xué)習(xí)算法,該算法以較為簡(jiǎn)單的結(jié)構(gòu)和較強(qiáng)的分類性能而被廣泛應(yīng)用在文本分類、圖像處理以及故障診斷等領(lǐng)域。如孫斌等[3]利用局部切空間排列提取到汽輪機(jī)轉(zhuǎn)子的故障特征,并輸入到KNN分類器中,取得了良好的故障識(shí)別效果。姜景升等[4]針對(duì)診斷效果受近鄰參數(shù)影響較大的缺點(diǎn),對(duì)基于KNN分類器的故障診斷方法做出了改進(jìn),有效地提升了軸承故障的識(shí)別率。侯平智等[5]提出了基于K近鄰證據(jù)融合的故障診斷方法,在電機(jī)轉(zhuǎn)子故障診斷中取得了顯著的成果。王雪冬等[6]將核監(jiān)督局部保留投影法與KNN分類器相結(jié)合應(yīng)用在旋轉(zhuǎn)機(jī)械的故障診斷中,改善了故障識(shí)別精度。陳法法等[7]利用等距映射非線性流形學(xué)習(xí)提取到故障特征,并與KNN算法相結(jié)合對(duì)齒輪箱故障進(jìn)行了有效的診斷。
然而,KNN算法在分類決策時(shí)并沒(méi)有考慮特征權(quán)重的分配問(wèn)題,導(dǎo)致算法分類性能較差,進(jìn)而限制了KNN算法在工程領(lǐng)域中的進(jìn)一步推廣。針對(duì)這一缺陷,Keller等[8]從算法結(jié)構(gòu)出發(fā),借助模糊理論對(duì)KNN算法進(jìn)行了改進(jìn),提出了FKNN(Fuzzy-K-Nearest Neighbor,F(xiàn)KNN)分類算法,考慮了不同特征對(duì)分類的貢獻(xiàn),有效地提升了算法的分類性能。杜海蓮等[9]驗(yàn)證了FKNN算法在故障診斷中的適用性,更好地識(shí)別出了電動(dòng)執(zhí)行器的故障類型。
本文受FKNN算法的啟發(fā),欲借助中智理論在處理不一致性和不確定性信息上的優(yōu)勢(shì),提出基于中智KNN的齒輪箱故障診斷方法,以期提高診斷準(zhǔn)確度,從而為齒輪箱故障的智能診斷技術(shù)提供了新的研究思路。
KNN分類算法的基本思想是:假設(shè)x為待測(cè)樣本,通過(guò)歐式距離找出x的k個(gè)最近鄰樣本,然后統(tǒng)計(jì)這k個(gè)最近鄰樣本出現(xiàn)的次數(shù),采用投票機(jī)制,將出現(xiàn)次數(shù)最多的近鄰樣本的類標(biāo)簽賦給待測(cè)樣本。
現(xiàn)以待分類樣本xs為例簡(jiǎn)述KNN分類算法的計(jì)算步驟:首先設(shè)訓(xùn)練樣本數(shù)據(jù)集U={(xi,ci)|i=1,2,…,N},包含M類訓(xùn)練樣本,記類別集合為C={cl|l=1,2,…,M}, 其中訓(xùn)練樣本xi為p維的列向量,ci為xi所對(duì)應(yīng)的類別標(biāo)簽。
(1) 計(jì)算待分類樣本xs與所有訓(xùn)練樣本的距離,通常采用歐氏距離作為衡量標(biāo)準(zhǔn),其計(jì)算公式為
(1)
(2) 選擇最近鄰參數(shù)k,依據(jù)計(jì)算出的歐氏距離尋找出xs的k個(gè)最近鄰樣本,記為Qs={(xsj,csj)|j=1,2,…,k}。xsj表示待分類樣本xs的第j(1≤j≤k)個(gè)最近鄰樣本,csj為xsj所對(duì)應(yīng)的類別。
(3) 根據(jù)Qs中的k個(gè)最近鄰樣本的類別信息進(jìn)行投票,投票結(jié)果記為v=[v1,…,vl,…vM],并按投票結(jié)果進(jìn)行決策,決策規(guī)則為
(2)
如前文所述,F(xiàn)KNN是對(duì)一般KNN算法的擴(kuò)展與改進(jìn),它解決了KNN算法在分類時(shí)會(huì)將各特征屬性同等對(duì)待的問(wèn)題。沿用上述KNN算法所提出的假設(shè)條件,簡(jiǎn)述FKNN算法的實(shí)現(xiàn)步驟。
首先,將訓(xùn)練樣本的類別信息模糊化,得到訓(xùn)練樣本的類隸屬度;然后選定近鄰參數(shù)k,計(jì)算待分類樣本xs與所有訓(xùn)練樣本的歐式距離,從而找到xs的k個(gè)最近鄰樣本;隨后,利用距離權(quán)重構(gòu)造出xs與近鄰樣本的相似度,并將其與這k個(gè)近鄰樣本的類隸屬度進(jìn)行加權(quán)實(shí)現(xiàn)對(duì)待測(cè)樣本的分類決策。具體的決策計(jì)算公式如下
(3)
式中:m稱為權(quán)重系數(shù),反映樣本與其k個(gè)鄰居的重要程度。ul(xsj)表示xs的第j個(gè)最近鄰訓(xùn)練樣本屬于第l類的隸屬度,其計(jì)算公式為
(4)
式中:nl表示xs的k個(gè)最近鄰中與樣本xsj同屬第l類的個(gè)數(shù)。
20世紀(jì)末,Smarandache[10-11]從哲學(xué)角度出發(fā)提出了中智理論,創(chuàng)造性地引入了不確定性,解決了實(shí)際應(yīng)用中“非真即假”的邏輯單一性,使得很多智能學(xué)習(xí)算法得到推廣。本文所提到的中智KNN分類算法,將FKNN算法中的類隸屬度擴(kuò)展為“真”,“假”和不確定度[12]三類,能夠更好地細(xì)化樣本的特征權(quán)重,突出不同特征對(duì)分類過(guò)程的貢獻(xiàn)率。其中,“真”隸屬度反映樣本屬于自身屬性的程度,“假”隸屬度通過(guò)引入?yún)?shù)來(lái)模擬噪聲集合,從而反映出樣本與噪聲集的關(guān)系。而不確定度通過(guò)考察樣本點(diǎn)與中智點(diǎn)[13](某兩類樣本重心的中點(diǎn))的關(guān)系,來(lái)反映樣本與中立區(qū)域(中智點(diǎn)附近的區(qū)域)的關(guān)系,不確定度越大說(shuō)明樣本距中立區(qū)域就越近,因而該樣本“懸而未決”的程度就越大。利用這三種隸屬度構(gòu)建出基于中智KNN的決策規(guī)則,之后在不考慮噪聲的情況下,輸出含有不確定類(中智類)的劃分結(jié)果,稱為中智劃分。以待分類樣本xs,M類訓(xùn)練樣本為例,說(shuō)明算法流程。
(1) 確定訓(xùn)練集中每類訓(xùn)練樣本的類重心。
(2) 計(jì)算訓(xùn)練樣本xi的“真”隸屬度Tij,“假”隸屬度Fi和不確定度Ii。具體的計(jì)算公式如下
(5)
(6)
(7)
(8)
(3) 選定近鄰參數(shù)k,找出待分類樣本xs的k個(gè)最近鄰訓(xùn)練樣本,分別計(jì)算待分類樣本xs與其k個(gè)最近鄰樣本間的相似度。基于曼哈頓距離的相似度量度量公式在大多數(shù)情況下具有較高的穩(wěn)定性,因此本文采用曼氏距離來(lái)構(gòu)造相似度計(jì)算公式
(9)
式中: 樣本含有p維屬性,t為樣本的某個(gè)屬性,di表示xs與第i個(gè)近鄰樣本xi間的相似度,q為相似度量的權(quán)重系數(shù)。
(4) 依據(jù)公式(10)計(jì)算xs的類隸屬度,對(duì)待分類樣本進(jìn)行決策,分類決策公式為(11)。并通過(guò)公式(12)和(13)計(jì)算輸出中智劃分的結(jié)果Nc(xs)。
(10)
(11)
(12)
(13)
齒輪箱的故障診斷大致可以分為實(shí)驗(yàn)數(shù)據(jù)采集,故障特征提取和故障模式識(shí)別三個(gè)階段,具體的故障診斷流程如圖1所示。由于“1.3”節(jié)對(duì)中智KNN的模式識(shí)別算法進(jìn)行了描述,本節(jié)將只針對(duì)實(shí)驗(yàn)數(shù)據(jù)采集和特征提取的關(guān)鍵步驟進(jìn)行詳細(xì)說(shuō)明。
圖1 基于中智KNN的故障診斷流程圖Fig.1 Procedure of fault diagnosis based on NKNN
本文所采集的齒輪箱振動(dòng)信號(hào)來(lái)自江蘇千鵬診斷工程有限公司的QPZZ-Ⅱ。旋轉(zhuǎn)機(jī)械振動(dòng)分析及故障診斷實(shí)驗(yàn)平臺(tái)系統(tǒng),實(shí)驗(yàn)平臺(tái)由二級(jí)齒輪箱、變速驅(qū)動(dòng)電機(jī)、軸承、主軸、聯(lián)軸器、制動(dòng)器、傳感器和數(shù)據(jù)采集系統(tǒng)組成,實(shí)驗(yàn)平臺(tái)如圖 2所示。選擇振動(dòng)能量較為集中和突出的齒輪箱輸出端的軸承座作為測(cè)點(diǎn)位置,布置壓電式加速度傳感器,測(cè)取振動(dòng)加速度信號(hào)。為保證模擬的故障信號(hào)與實(shí)際產(chǎn)生的齒輪故障信號(hào)相似,實(shí)驗(yàn)采用電火花加工技術(shù)在不同的齒輪上分別植入損傷點(diǎn),來(lái)模擬高速軸小齒輪齒面磨損和低速軸大齒輪斷齒所引起的故障狀態(tài)。同時(shí)為了更好地說(shuō)明中智劃分在故障診斷中的意義,還對(duì)大齒輪斷齒、小齒輪磨損的混合故障進(jìn)行了模擬,為后續(xù)的實(shí)驗(yàn)工作奠定了基礎(chǔ)。在采樣頻率為5 120 Hz,主軸轉(zhuǎn)速為1 500 r/min的情況下,采集每種狀態(tài)數(shù)據(jù)各25組,共100組實(shí)驗(yàn)樣本。
圖2 齒輪箱故障診斷模擬實(shí)驗(yàn)平臺(tái)Fig.2 The test bench of gearbox fault diagnosis
合理地提取振動(dòng)信號(hào)的特征是提高診斷精度的前提。考慮到振動(dòng)信號(hào)中的頻帶能量包含了豐富的故障信息,以能量為元素構(gòu)造出的特征向量可以區(qū)分出齒輪箱的故障類型。因此,本文采用能夠?qū)Ψ瞧椒€(wěn)信號(hào)進(jìn)行有效分析的小波包[14]變換技術(shù)對(duì)信號(hào)特征進(jìn)行提取。以下對(duì)小波包提取特征向量的關(guān)鍵步驟進(jìn)行說(shuō)明:
(1) 對(duì)振動(dòng)信號(hào)的處理通常采用小波閾值降噪[15]手段來(lái)達(dá)到衰減噪聲的目的。本文選用軟閥值sym8小波對(duì)原始信號(hào)進(jìn)行去噪。
(2) 利用db3小波對(duì)降噪信號(hào)進(jìn)行三層小波包分解,從而得到第三層從低頻到高頻的八個(gè)子頻帶分解系數(shù)。
(3) 對(duì)第三層小波包分解系數(shù)進(jìn)行重構(gòu),提取各頻帶范圍內(nèi)的信號(hào)。用S3j(j=0,1,…,7)表示第三層小波包分解系數(shù)的單支重構(gòu)信號(hào)。
(4) 計(jì)算出各頻帶所占的相對(duì)能量,經(jīng)歸一化處理[16]構(gòu)造出能量特征向量。設(shè)S3j對(duì)應(yīng)的頻帶能量為E3j,則能量的計(jì)算公式為
(12)
式中:xjk(j=0,1,…,7為振動(dòng)信號(hào)的采樣點(diǎn)個(gè)數(shù))為重構(gòu)信號(hào)的離散點(diǎn)幅值。
隨后按照各個(gè)頻帶能量(相對(duì)能量)的比例關(guān)系做出一系列的能量分布直方圖。如圖3所示,不同故障對(duì)應(yīng)著不同頻帶能量的分布特征,因此,可以通過(guò)頻帶能量分布情況準(zhǔn)確地判斷出發(fā)生故障的類型。直接利用各頻率成分能量的變化來(lái)表示故障的征兆,較好地保留了信號(hào)的原始特征,從而為故障模式的識(shí)別提供了全面的信息輸入。
圖3 不同狀態(tài)的能量分布直方圖(k=5)Fig.3 The histogram of energy distribution in different states(k=5)
為驗(yàn)證基于中智KNN診斷方法的分類性能,首先依次選取四種狀態(tài)下的訓(xùn)練樣本各10組,共40組數(shù)據(jù)作為訓(xùn)練樣本集,其余60組作為測(cè)試樣本集。分別利用KNN,FKNN和基于中智的KNN分類診斷方法對(duì)測(cè)試樣本進(jìn)行診斷識(shí)別,三種方法均選定近鄰參數(shù)k為5。由圖4,圖5可以看出,KNN誤分了9個(gè)測(cè)試樣本,準(zhǔn)確率僅為85%。FKNN的故障識(shí)別精度較KNN診斷方法,提高了6.6%,分類性能優(yōu)于KNN。相比之下,基于中智KNN的診斷方法分類效果最佳,診斷準(zhǔn)確率達(dá)到了100%,能夠很好地區(qū)別出故障類型。
圖4 基于KNN的故障分類結(jié)果圖(k=5)Fig.4 KNN based fault classification results(k=5)
圖5 基于FKNN的故障分類結(jié)果圖(k=5)Fig.5 FKNN based fault classification results(k=5)
另一方面,為保證實(shí)驗(yàn)結(jié)果的客觀性,將故障樣 本按比例劃分,分別選取80%,60%,40%和20%的樣本作為訓(xùn)練樣本集,相應(yīng)地將剩余樣本作為測(cè)試樣本集。采用交叉驗(yàn)證[17]的方法,在近鄰數(shù)為5的情況下,分別利用以上三種方法對(duì)測(cè)試樣本進(jìn)行分類,實(shí)驗(yàn)均進(jìn)行N(N=10)次取平均值,得到的實(shí)驗(yàn)結(jié)果如表1所示,基于中智KNN的分類診斷方法所獲得的平均識(shí)別率均高于其他兩種方法。
表1 不同診斷方法的故障識(shí)別率(k=5)Tab.1 Fault classification rate of the different classifiers(k=5)
圖6 基于中智KNN的故障分類結(jié)果圖(k=5,δ=0.1)Fig.6 NKNN based fault classification results(k=5,δ=0.1)
正是由于中智KNN所引進(jìn)的“假”隸屬度和不確定度客觀地考慮了中立區(qū)域和噪聲集對(duì)樣本分類的影響,才使得貢獻(xiàn)權(quán)重的分配更趨于合理,得到的故障識(shí)別率更加精確。此外,為體現(xiàn)所提方法的有效性,還增加了基于支持向量機(jī)(Support Vector Machine,SVM)的故障診斷方法作為對(duì)比。雖然在診斷精度方面,SVM表現(xiàn)良好,但為了獲取最佳的核函數(shù)參數(shù)和懲罰因子需要對(duì)樣本模型進(jìn)行訓(xùn)練,這樣會(huì)增加計(jì)算開(kāi)銷,進(jìn)而會(huì)影響診斷效率,不利于提高診斷性能。
依據(jù)“1.3”節(jié)對(duì)中智KNN算法的描述,在最終進(jìn)行分類決策的同時(shí),會(huì)輸出中智劃分的結(jié)果,現(xiàn)將中智劃分在故障診斷中的意義進(jìn)行說(shuō)明。如圖7所示,49號(hào)和55號(hào)測(cè)試樣本在中智劃分結(jié)果中被判定為中智類。根據(jù)表2(Ti1,Ti2,Ti3和Ti4分別表示屬于正常、斷齒、磨損和混合故障的隸屬度)所列出的部分混合故障樣本的隸屬度信息可以發(fā)現(xiàn),由于靠近兩類集合的中智點(diǎn),導(dǎo)致了這兩個(gè)故障樣本的不確定度Ii較大,隨即被劃分到了兩類樣本的中立區(qū)域,即中智類。進(jìn)一步分析得到,由于這兩個(gè)故障樣本點(diǎn)的Ti3和Ti4的值較大,說(shuō)明故障樣本點(diǎn)更接近混合故障集和磨損故障集的中智點(diǎn),而較大的Ti3反映出樣本所包含的磨損故障信息較多,致使高頻振動(dòng)較為劇烈,由此可知在發(fā)生混合故障時(shí),相比大齒輪斷齒,小齒輪磨損的程度更深。某種意義上,當(dāng)發(fā)生混合故障時(shí),中智劃分會(huì)反映出不同的單一故障的劇烈程度,對(duì)故障狀態(tài)的預(yù)測(cè)起到指導(dǎo)性作用。
圖7 中智劃分結(jié)果圖(k=5,δ=1)Fig.7 The result of neutrosophic partition(k=5,δ=1)
KNN算法屬于惰性學(xué)習(xí)算法,其近鄰參數(shù)k的選擇勢(shì)必會(huì)對(duì)診斷結(jié)果產(chǎn)生影響。因此,本文研究了不同算法隨k值變化的魯棒性。取訓(xùn)練樣本60組,測(cè)試樣本40組進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如圖8所示,隨近鄰參數(shù)k的變化,不同方法所得到的故障識(shí)別率均有所變化。由圖可知,在k=4以后,KNN診斷方法的分類性能逐漸惡化,故障識(shí)別率大幅降低,無(wú)法準(zhǔn)確識(shí)別故障類型;FKNN診斷方法的故障識(shí)別率雖高于傳統(tǒng)的KNN診斷方法,但隨著k值的增大也呈現(xiàn)出了下降趨勢(shì),特別是在k=7以后,故障識(shí)別率已經(jīng)低于85%。相比之下,本文提出的中智KNN診斷方法表現(xiàn)出了良好的適應(yīng)性和穩(wěn)定性,即使是k值選擇較大,其故障識(shí)別率依然能夠保持較高水平,并且沒(méi)有出現(xiàn)明顯的波動(dòng),具有較強(qiáng)的魯棒性。
圖8 不同分類器隨k值變化的故障識(shí)別率Fig.8 Fault recognition rate of different classifiers based on the changing k value
前文提到基于中智KNN的故障診斷方法在引入“假”隸屬度時(shí),融入了正則化參數(shù)δ。由式(6)可知,若保持其值不變,那么Fi越大,證明樣本點(diǎn)屬于噪聲集的可能性就越大?,F(xiàn)通過(guò)改變正則化參數(shù),來(lái)控制隨機(jī)干擾噪聲的數(shù)量說(shuō)明算法的抗噪性,實(shí)驗(yàn)結(jié)果由圖9所示。隨著參數(shù)δ的減小,噪聲數(shù)量不斷增加,故障識(shí)別率有所降低,但將參數(shù)控制在一定范圍內(nèi),仍然可以保持較高的診斷精度,說(shuō)明該方法在一定程度上具有抗噪作用,有助于提升泛化能力,便于應(yīng)用。
表2 部分故障樣本的隸屬度(δ=1)Tab.2 The membership of some fault samples(δ=1)
圖9 參數(shù)δ隨k值變化的故障識(shí)別率Fig.9 The fault recognition rate based on the k value with changing parameters
(1) 本文提出了基于中智KNN的齒輪箱故障診斷方法,利用“真”、“假”隸屬度和不確定度將樣本的類別信息定量地反映出來(lái),量化自身屬性的同時(shí),還兼顧了不確定性和噪聲集對(duì)分類精度的影響,使得樣本分類更加靈活完善,良好地克服了傳統(tǒng)KNN同貢獻(xiàn)權(quán)重分配的缺陷。通過(guò)對(duì)比實(shí)驗(yàn),驗(yàn)證了該方法可以有效地提高故障的分類精度。
(2) 在混合故障診斷方面,所提出的方法不但能夠?qū)Σ煌愋偷墓收蠘颖具M(jìn)行細(xì)致劃分,而且通過(guò)中智劃分可以反映出混合故障中單一故障發(fā)生的劇烈程度,為齒輪箱的智能診斷研究提供了參考價(jià)值。
(3) 實(shí)驗(yàn)還表明,基于中智KNN的故障診斷方法具有較強(qiáng)的魯棒性和一定程度的抗噪性,體現(xiàn)出了該方法在故障診斷方面的優(yōu)越性。