潘巍巍, 宋彥萍, 于達(dá)仁
(1.廈門理工學(xué)院 應(yīng)用數(shù)學(xué)學(xué)院, 福建 廈門 361024; 2.哈爾濱工業(yè)大學(xué) 能源科學(xué)與工程學(xué)院, 哈爾濱 150001)
齒輪裂紋程度識(shí)別的有序分類算法
潘巍巍1,2, 宋彥萍2, 于達(dá)仁2
(1.廈門理工學(xué)院 應(yīng)用數(shù)學(xué)學(xué)院, 福建 廈門 361024; 2.哈爾濱工業(yè)大學(xué) 能源科學(xué)與工程學(xué)院, 哈爾濱 150001)
摘要:為識(shí)別齒輪裂紋的嚴(yán)重程度信息,提出一種基于有序分類的故障嚴(yán)重程度識(shí)別方法. 將故障嚴(yán)重程度識(shí)別問題視為不同嚴(yán)重程度之間存在序結(jié)構(gòu),并且部分特征和故障嚴(yán)重程度之間存在單調(diào)依賴關(guān)系的有序分類問題,從有序分類出發(fā),建立有序分類的故障嚴(yán)重程度識(shí)別模型. 研究故障嚴(yán)重程度識(shí)別中的特征評(píng)價(jià)和特征選擇問題, 利用排序互信息指標(biāo)區(qū)分原始特征集中的單調(diào)特征和非單調(diào)特征,提出單調(diào)特征和非單調(diào)特征混合存在情況下的有序分類特征選擇算法. 齒輪裂紋程度識(shí)別實(shí)驗(yàn)結(jié)果表明:提出的有序分類特征選擇算法可以降低特征空間維數(shù),能選擇出分類能力強(qiáng)的故障特征子集,提高了故障嚴(yán)重程度識(shí)別的準(zhǔn)確性.
關(guān)鍵詞:有序分類;特征選擇;故障診斷;嚴(yán)重程度;齒輪裂紋程度識(shí)別
近年來,故障診斷技術(shù)得到了廣泛深入地研究,對(duì)企業(yè)的關(guān)鍵機(jī)組實(shí)行狀態(tài)監(jiān)測和故障診斷,保障這些設(shè)備的安全高效運(yùn)行,避免災(zāi)難性事故的發(fā)生,具有顯著的經(jīng)濟(jì)效益和社會(huì)效益. 與傳統(tǒng)的故障診斷技術(shù)不同,故障嚴(yán)重程度識(shí)別并不關(guān)注故障的類型,而是考慮在同一故障類型下的故障嚴(yán)重性信息,識(shí)別故障的嚴(yán)重程度可以幫助用戶了解設(shè)備的運(yùn)行狀態(tài)及發(fā)展趨勢,制定合理的維修計(jì)劃,提高設(shè)備的利用率. 相比于故障檢測和故障分類,故障嚴(yán)重程度識(shí)別更加困難,是故障診斷領(lǐng)域的一項(xiàng)特殊任務(wù)和新的挑戰(zhàn).
在故障嚴(yán)重程度識(shí)別中,按照不同的嚴(yán)重程度, 可以將故障分為“輕微故障”,“中等故障”和“嚴(yán)重故障”. 不同嚴(yán)重程度之間存在序的關(guān)系,可以表示為:“嚴(yán)重故障”>“中等故障”>“輕微故障”,即“嚴(yán)重故障”表明設(shè)備的故障嚴(yán)重程度比“中等故障”和“輕微故障”高,“中等故障”比“輕微故障”的故障更嚴(yán)重. 進(jìn)行故障嚴(yán)重程度識(shí)別時(shí),要求工作人員人為地將故障劃分為幾個(gè)等級(jí),例如可以將故障劃分為“輕微故障”和“嚴(yán)重故障”,當(dāng)發(fā)現(xiàn)設(shè)備是“輕微故障”時(shí),表明已出現(xiàn)異常,需要立刻查找原因安排維修;當(dāng)發(fā)現(xiàn)是“嚴(yán)重故障”時(shí),為避免惡性事故的發(fā)生,必須馬上停機(jī). 這種按照故障的嚴(yán)重程度進(jìn)行分類的問題可以理解為模式識(shí)別和機(jī)器學(xué)習(xí)中的有序分類問題(也稱為排序問題或有序回歸問題)[1-3]. 進(jìn)行故障嚴(yán)重程度識(shí)別的關(guān)鍵問題是如何利用和表達(dá)數(shù)據(jù)中潛在的有序信息,而不是簡單的將其看作是一般分類問題進(jìn)行分類學(xué)習(xí).
目前,故障嚴(yán)重程度識(shí)別主要是建立分類學(xué)習(xí)模型,實(shí)現(xiàn)不同嚴(yán)重程度信息的自動(dòng)識(shí)別. 2009年,曾慶虎等[4]采用核主成分分析(KPCA)方法進(jìn)行多通道信息融合,建立基于隱半馬爾可夫模型(HSMM)的故障預(yù)測模型實(shí)現(xiàn)設(shè)備退化狀態(tài)識(shí)別. Lei等[5]人為地將齒輪破壞,并分成幾種不同程度的裂紋,在不同轉(zhuǎn)速和負(fù)載下收集振動(dòng)數(shù)據(jù),設(shè)計(jì)了基于加權(quán)歐式距離的K近鄰分類算法(WKNN)進(jìn)行齒輪裂紋程度識(shí)別. Li等[6]利用流行學(xué)習(xí)算法提取故障的非線性特征,并應(yīng)用經(jīng)驗(yàn)?zāi)B(tài)分解方法進(jìn)行齒輪裂紋程度識(shí)別. Cheng等[7]利用統(tǒng)計(jì)方法進(jìn)行特征選擇,提出了基于灰色關(guān)聯(lián)度分析的故障程度識(shí)別方法. Zhao等[8]提出了基于相關(guān)系數(shù)的有序分類特征選擇算法,并進(jìn)行實(shí)驗(yàn)分析,指出了分析故障嚴(yán)重程度識(shí)別問題時(shí)有序分類學(xué)習(xí)算法比一般分類算法更有效. Wu等[9]采用基尼系數(shù)度量不同故障的嚴(yán)重性,研究了基于故障注入技術(shù)的嚴(yán)重程度信息識(shí)別方法. Jiang等[10]提出了基于統(tǒng)計(jì)參數(shù)(均值)和殘差信號(hào)的故障嚴(yán)重性識(shí)別方法.
故障特征空間可能含有成百上千個(gè)特征,這些特征中只有很少一部分是與故障嚴(yán)重程度相關(guān)的,并且部分故障特征和嚴(yán)重程度之間存在單調(diào)變化趨勢:即隨著故障的嚴(yán)重程度的增加特征值增大或減小,這類特征被稱為是單調(diào)的故障特征. 對(duì)應(yīng)的,與故障嚴(yán)重程度不存在單調(diào)依賴關(guān)系的特征則稱為非單調(diào)故障特征. 單調(diào)故障特征能夠反映出與不同嚴(yán)重程度之間的單調(diào)依賴關(guān)系,能夠直觀地區(qū)分故障的不同嚴(yán)重程度信息. 對(duì)于這種非單調(diào)特征和單調(diào)特征混合存在的情況,需要設(shè)計(jì)混合的有序分類特征選擇算法.
本文首先提出非單調(diào)特征和單調(diào)特征混合的有序分類特征選擇算法,然后將提出的特征選擇算法應(yīng)用于齒輪裂紋程度識(shí)別,構(gòu)建基于有序分類的故障嚴(yán)重程度識(shí)別模型.
1有序分類
定義1給定決策系統(tǒng)DT=〈U,A,D〉,其中U={x1,x2,…,xN}表示有限非空樣本集,A={a1,a2,…,aJ}是特征集,D={d1,d2,…,dK}是決策類別集. 如果不同的決策類別之間存在序的關(guān)系,可以假設(shè)d1 樣本xi∈U在特征a∈A和決策D上的取值分別記為v(xi,a)和v(xi,D), 特征與決策集上的序關(guān)系記為“≥”和“≤”. 令v(xi,a)≥v(xj,a)和v(xi,D)≥v(xj,D)分別表示在特征a和決策D上樣本xj不好于xi. 同理,xi不好于xj記作xi≤axj和xi≤Dxj. 定義2給定有序決策系統(tǒng)DT=〈U,A,D〉,對(duì)?xi∈U,a∈A,xi關(guān)于特征a的有序信息粒子定義為 相應(yīng)的,對(duì)B?A,xi關(guān)于B和D的有序信息粒子分別定義為 式中:若?a∈B,都有xj≤axi,則稱xj≤Bxi. 定義3給定有序決策系統(tǒng)DT=〈U,A,D〉,單調(diào)約束條件指的是:對(duì)?xi,xj∈U,如果xi≤Bxj,有D(xi)≤BD(xj)(或者xi≥Bxj?D(xi)≥BD(xj)). 特征與決策之間的單調(diào)約束關(guān)系是指:假定樣本xi在特征集B上取值比樣本xj大,那么xi的決策也會(huì)比xj的決策好,否則就違反了單調(diào)一致性. 事實(shí)上,單調(diào)分類是一類特殊的有序分類問題,即它不僅強(qiáng)調(diào)決策類別之間存在序結(jié)構(gòu),而且假設(shè)全部特征與決策之間存在單調(diào)約束關(guān)系. 但單調(diào)約束關(guān)系是一個(gè)很強(qiáng)的限制條件,絕大多數(shù)現(xiàn)實(shí)的有序決策任務(wù)往往不能滿足全部特征都與決策之間具有單調(diào)依賴關(guān)系,可能只有部分特征為單調(diào)特征,大部分特征是非單調(diào)特征. 針對(duì)單調(diào)特征和非單調(diào)特征混合存在的情況,本文研究有序分類的特征選擇問題. 首先要解決的問題是對(duì)于給定的有序數(shù)據(jù)集,如何判斷哪些特征是單調(diào)特征,哪些特征是非單調(diào)特征. 2特征單調(diào)性評(píng)定方法 首先給出排序互信息的定義,具體信息可參考文獻(xiàn)[11]. 定義4給定有序決策系統(tǒng)DT=,B?A,C?A. B和C在U上的前向互信息定義為 后向互信息定義為 下面舉列說明排序互信息可以表征特征與決策之間的單調(diào)一致性程度. 圖1展示了8個(gè)特征(樣本數(shù)500)的散點(diǎn)圖,并計(jì)算了每個(gè)特征與決策之間的排序互信息值(這里只考慮前向排序互信息,后向排序互信息可以得到類似的結(jié)論). 圖1 各特征的散點(diǎn)圖分布及其與決策的排序互信息值 第1個(gè)特征與決策之間具有線性的單調(diào)一致關(guān)系,在第1個(gè)特征的基礎(chǔ)上加入了不同噪聲水平的噪聲得到了第2、3個(gè)特征. 相比特征1,特征2和3與決策之間的單調(diào)一致性程度降低,相應(yīng)的排序互信息值也隨之減小,從1.43分別降為1.15和0.67. 第4個(gè)特征完全是雜亂的,與決策之間不存在單調(diào)性,此時(shí)得到的排序互信息值很小,幾乎接近于0. 第6個(gè)特征與決策之間滿足非線性的單調(diào)一致關(guān)系,特征值隨著決策值的增大單調(diào)增加. 雖然特征6隨著決策非線性單調(diào)變化, 但是特征6得到的排序互信息與特征1相同,表明排序互信息可以反映特征與決策之間的單調(diào)相關(guān)性,不管這種單調(diào)關(guān)系是線性的還是非線性的. 第5個(gè)特征是在第6特征的基礎(chǔ)上加入了噪聲,排序互信息值從1.43降為0.95. 第7、8 這兩個(gè)特征的值先是單調(diào)增加然后再減少,相應(yīng)的排序互信息值低于其它特征(除了特征4). 通過以上的對(duì)比分析發(fā)現(xiàn),特征與決策的單調(diào)一致性程度可通過排序互信息表達(dá). 特征與決策之間的單調(diào)一致性程度越高,對(duì)應(yīng)排序互信息的值越大;反之單調(diào)一致性程度就越小. 因此,可以采用排序互信息作為評(píng)價(jià)指標(biāo)來區(qū)分原始特征集中哪些特征是單調(diào)特征,哪些是非單調(diào)特征. 在實(shí)際的有序?qū)W習(xí)任務(wù)中,需要假定一個(gè)閾值,將原始的特征集合分成兩個(gè)特征子集:非單調(diào)特征子集和單調(diào)特征子集. 如果某特征與決策的排序互信息>預(yù)設(shè)的閾值,將此特征判為單調(diào)特征,否則就是非單調(diào)特征. 在沒有任何先驗(yàn)知識(shí)的情況下,本文將所有特征按照排序互信息值大小排序,將原始特征集合分為兩部分,單調(diào)特征和非單調(diào)特征的數(shù)量相同. 3基于混合單調(diào)特征的有序分類特征選擇算法 特征選擇算法包含兩個(gè)主要步驟:特征評(píng)價(jià)函數(shù)和最優(yōu)子集搜索策略. 首先針對(duì)有序分類中非單調(diào)特征和單調(diào)特征混合存在的情況,定義有序分類的分類一致性假設(shè)條件,將其作為特征評(píng)價(jià)函數(shù)評(píng)價(jià)一個(gè)混合單調(diào)的特征子集與決策之間的相關(guān)性,然后采用遺傳算法(GA)作為搜索策略構(gòu)造有序分類的特征選擇算法. 3.1非單調(diào)特征和單調(diào)特征混合的有序分類一致性 定義5給定有序決策系統(tǒng)DT=,若特征集合A中只有部分特征與決策之間滿足單調(diào)依賴關(guān)系,既包含與決策之間滿足單調(diào)依賴關(guān)系的單調(diào)特征,又包含非單調(diào)特征,則稱此有序決策系統(tǒng)為混合單調(diào)特征的有序決策系統(tǒng). 定義6給定單調(diào)特征和非單調(diào)特征混合的有序決策系統(tǒng)DT=,?B?A,?xi,xj∈U,如果: 1)樣本xi和xj關(guān)于B中的非單調(diào)的符號(hào)特征滿足等價(jià)關(guān)系,且數(shù)值特征滿足相似關(guān)系; 對(duì)非單調(diào)特征和單調(diào)特征混合存在的有序分類任務(wù),定義混合單調(diào)特征的有序分類的分類一致性假設(shè). ?B?A,B的混合單調(diào)分類一致性越大,表征B對(duì)決策D的分類能力越強(qiáng),可以將其作為特征評(píng)價(jià)函數(shù)度量特征子集的質(zhì)量. 3.2遺傳算法 遺傳算法(genetic algorithm,簡稱GA)[12-13]的基本框架包括參數(shù)編碼、初始種群選取、適應(yīng)度函數(shù)和遺傳操作等4部分. GA基于生物進(jìn)化的適者生存理論,模擬遺傳學(xué)的生物遺產(chǎn)進(jìn)化的過程,并以適應(yīng)度函數(shù)評(píng)價(jià)種群中的個(gè)體優(yōu)劣程度,即以適應(yīng)度來表征種群中的個(gè)體對(duì)環(huán)境生存能力的強(qiáng)弱. 在實(shí)際應(yīng)用中,適應(yīng)度函數(shù)的設(shè)計(jì)需要根據(jù)所求解問題本身的要求而定. 設(shè)定了適應(yīng)度函數(shù)后,遺傳操作通過模擬生物基因遺傳原理,根據(jù)個(gè)體對(duì)環(huán)境的適應(yīng)度,進(jìn)行選擇、交叉、變異等遺傳操作,從而實(shí)現(xiàn)優(yōu)勝劣汰的進(jìn)化過程. 經(jīng)過多次迭代后,從最后一代種群中選出適應(yīng)度函數(shù)值最大的個(gè)體,進(jìn)而得到所求問題的最優(yōu)解. 本文采用二進(jìn)制編碼,對(duì)于任意的特征子集B?A,將B的混合單調(diào)分類一致性作為適應(yīng)度函數(shù),進(jìn)而度量GA算法每次選擇出來的特征子集B的適應(yīng)度,而算法最終輸出的最大的混合單調(diào)分類一致性(即適應(yīng)度)對(duì)應(yīng)的特征子集即為最終的最優(yōu)子集. GA算法采用輪盤賭選擇算子以及單點(diǎn)交叉方式,交叉率設(shè)為0.8,變異率是0.01. 4基于有序分類的齒輪裂紋程度識(shí)別 4.1實(shí)驗(yàn)描述和數(shù)據(jù)獲取 本文采用的實(shí)驗(yàn)系統(tǒng)結(jié)構(gòu)如圖2所示. 系統(tǒng)構(gòu)成中包括1個(gè)齒輪箱,提供負(fù)載的磁力制動(dòng)器和用以驅(qū)動(dòng)齒輪箱旋轉(zhuǎn)的三相交流電機(jī)[5]. 圖2 實(shí)驗(yàn)系統(tǒng)圖 在齒輪箱中,齒輪#1和齒輪#2嚙合,齒輪#3和齒輪#4嚙合,齒輪#3為測試齒輪. 在齒輪箱外殼上安裝兩個(gè)傳感器收集齒輪箱的x(水平)和y(垂直)兩個(gè)方向的振動(dòng)數(shù)據(jù). 人為地將測試齒輪破壞成不同的裂紋深度和寬度,得到不同故障嚴(yán)重程度的齒輪. 齒輪的裂紋程度信息見圖3,裂紋角度為α,a為弦齒厚度的一半,齒厚為b. 共采用了3個(gè)不同裂紋程度的齒輪,詳細(xì)信息見表1,其中F0表示正常完好的齒輪,F(xiàn)1和F2分別代表兩個(gè)不同裂紋程度的測試齒輪. 圖3 齒輪的裂紋程度信息 故障嚴(yán)重程度 寬度 深度 厚度 mmα/(°)F0000-F10.25a0.25b0.4045F20.50a0.50b0.4045 注: α為裂縫角度; 2a為分度圓弦齒厚; b為齒厚. 在3種負(fù)載(load0,load1,load2),4種轉(zhuǎn)速(1 200,1 400,1 600,1 800 r/min)以及3種不同裂紋程度(F0,F(xiàn)1,F(xiàn)2)情況下,共收集到36個(gè)故障樣本. 重復(fù)實(shí)驗(yàn)3次,整理得到的齒輪裂紋程度識(shí)別數(shù)據(jù)集共含有108個(gè)樣本. 圖4是在不同的裂紋程度(F1和F2)下,測試齒輪在時(shí)域和頻域中的數(shù)據(jù),由圖4可見,在不同的故障嚴(yán)重程度時(shí),時(shí)域和頻域的信息差異很大,可從中抽取特征對(duì)其進(jìn)行評(píng)判. 圖4 故障特征的時(shí)域和頻域 對(duì)振動(dòng)數(shù)據(jù)提取特征,特征集中包括時(shí)域特征、頻域特征以及特別為齒輪故障識(shí)別設(shè)計(jì)的特征[5],具體的特征信息見表2. 構(gòu)建的故障嚴(yán)重程度識(shí)別數(shù)據(jù)集有108個(gè)樣本,52個(gè)特征. 表2 特征編號(hào)和對(duì)應(yīng)的特征說明[14] 4.2齒輪裂紋程度識(shí)別 為有效識(shí)別齒輪裂紋的程度,本文在故障嚴(yán)重程度識(shí)別數(shù)據(jù)集的原始特征空間中,采用前述的特征選擇算法,以去除無關(guān)和冗余的特征,得到與故障嚴(yán)重程度相關(guān)的最優(yōu)特征子空間,并經(jīng)實(shí)驗(yàn)分析此特征子空間的有效性. 實(shí)驗(yàn)處理中,首先計(jì)算特征與故障嚴(yán)重程度之間的排序互信息,如圖5所示. 由圖5可以看出,特征48和特征44的排序互信息相對(duì)較大,說明它們與決策之間的具有較強(qiáng)的單調(diào)相關(guān)性. 圖6為特征48與不同裂紋嚴(yán)重程度之間的關(guān)系,其中‘+’表示正常齒輪,‘*’表示25%裂紋程度的齒輪,‘o’表示50%裂紋程度的齒輪. 如圖6可知,特征48能夠清晰地將不同的故障嚴(yán)重程度信息區(qū)分開,并能有效地反映故障嚴(yán)重程度的單調(diào)變化趨勢. 故障特征值增大,可發(fā)現(xiàn)故障嚴(yán)重程度隨之增加(故障嚴(yán)重程度高). 由圖6可知,當(dāng)特征48的特征值超過0.07時(shí),表示齒輪發(fā)生了故障. 圖7為特征44與不同裂紋嚴(yán)重程度之間的關(guān)系. 在特征44上同樣可以看出故障程度的發(fā)展進(jìn)程,當(dāng)樣本在特征44上的值超過0.2時(shí),表示齒輪發(fā)生了故障. 圖5 故障特征的排序互信息 圖6 特征48和裂紋程度之間的關(guān)系 圖7 特征44和裂紋程度之間的關(guān)系 應(yīng)用提出的特征選擇算法進(jìn)行特征選擇,得到最優(yōu)特征子集共包含7個(gè)特征,特征編號(hào)分別為:2、13、15、17、28、44和48. 在此特征子集中,非單調(diào)特征包括2、13和15,單調(diào)特征為17、28、44和48等. 隨機(jī)取3組特征兩兩組合,圖8~10展示了二維特征空間的數(shù)據(jù)散點(diǎn)圖. 可以看出,不同嚴(yán)重程度(不同顏色)的故障樣本在這些特征的空間上重疊區(qū)域很小,即便用最簡單的基于直線的區(qū)間劃分方法也可將不同嚴(yán)重程度的樣本分開,可見這些特征可以清晰地將不同的故障程度信息區(qū)分開. 而且特征48和44也能夠反映出故障嚴(yán)重程度的單調(diào)變化趨勢. 圖9是特征2和特征15組合形成的特征子集在二維圖上的散點(diǎn)分布,這個(gè)包含2個(gè)特征的子集合對(duì)故障嚴(yán)重程度有良好的區(qū)分能力. 圖8 特征48和特征44的散點(diǎn)圖 圖9 特征2和特征15的散點(diǎn)圖 圖10 特征13和特征17的散點(diǎn)圖 表3 原始特征集和特征子集的分類錯(cuò)誤率比較 % 表4 選中的特征子集和原始特征集的平均分類損失比較 % 從表3、4可以看出,相比原始數(shù)據(jù),特征選擇后再進(jìn)行分類得到的平均分類錯(cuò)誤率由15.36%降低為5.25%, 平均分類損失從11.36%降低為4.41%. 實(shí)驗(yàn)分析結(jié)果表明: 本文提出的特征選擇算法明顯地減少了特征空間的維數(shù),降低了故障嚴(yán)重程度識(shí)別的錯(cuò)誤率和平均分類損失. 5結(jié)論 1)本文設(shè)計(jì)了有序分類的特征選擇算法,并將其應(yīng)用于齒輪裂紋程度識(shí)別中以提高故障嚴(yán)重程度識(shí)別的準(zhǔn)確性. 2)針對(duì)非單調(diào)特征和單調(diào)特征混合存在的情況,定義了有序分類一致性假設(shè)條件,并將其作為特征評(píng)價(jià)函數(shù). 與遺傳算法相結(jié)合得到原始特征集合中的最優(yōu)的特征子集,并將提出的有序分類特征選擇算法應(yīng)用到齒輪裂紋程度識(shí)別,構(gòu)建了基于混合單調(diào)特征的有序分類故障嚴(yán)重程度識(shí)別模型. 3)實(shí)驗(yàn)結(jié)果表明,提出的特征選擇算法既降低了特征空間的維數(shù),又提高了故障嚴(yán)重程度識(shí)別的準(zhǔn)確性. 參考文獻(xiàn) [1] FRANK E, HALL M. A simple approach to ordinal classification[C]// Proc Europ Conf on Machine Learning. Beilin: Springer, 2001: 145-156.[2] KOTLOWSKI W, DEMBCZYNSKI K, GRECO S, et al. Stochastic dominance-based rough set model for ordinal classification[J]. Information Sciences, 2008, 178(21): 4019-4037. [3] BLASZCZYNSKI J, SLOWINSKI R, SZELAG M. Probabilistic rough set approaches to ordinal classification with monotonicity constraints[J]. Computational Intelligence for Knowledge-Based Systems Design, 2010, 6178: 99-108.[4]曾慶虎, 邱靜, 劉冠軍. 基于小波相關(guān)特征尺度熵的HSMM設(shè)備退化狀態(tài)識(shí)別與故障預(yù)測方法[J]. 儀器儀表學(xué)報(bào), 2009, 29(12): 2559-2564. [5] LEI Yaguo, ZUO M J. Gear crack level identification based on weighted K nearest neighbor classification algorithm[J]. Mechanical Systems and Signal Processing, 2009, 23(5): 1535-1547. [6] LI Zhixiong, YAN Xinping, JIANG Yu, et al. A new data mining approach for gear crack level identification based on manifold learning[J]. Mechanics, 2012, 18(1): 29-34. [7] CHENG Zhe, HU Niaoqing, ZHANG Xiaofei. Crack level estimation approach for planetary gearbox based on simulation signal and GRA[J]. Journal of Sound and Vibration, 2012, 331(26): 5853-5863. [8] ZHAO Xiaomin, ZUO M J, LIU Zhiliang, et al. Diagnosis of artificially created surface damage levels of planet gear teeth using ordinal ranking[J]. Measurement, 2013, 45(1): 132-144. [9] WU Jianing, YAN Shaoze. Fault severity evaluation and improvement design for mechanical systems using the fault injection technique and gini concordance measure[J]. Mathematical Problems in Engineering, 2014, 2014(1):759-765. [10]JIANG Fan, LI Wei, WANG Zhongqiu, et al. Fault severity estimation of rotating machinery based on residual signals[J]. Advances in Mechanical Engineering, 2015, 15(11):1067-1077. [11]HU Qinghua, GUO Maozu, YU Daren, et al. Information entropy for ordinal classification[J]. Science China Information Sciences, 2010, 53(6): 1188-1200. [12]HOLLAND J H. Adaptation in natural and artificial systems[M]. Ann Arbor: University of Michigan Press, 1975.[13]YANG J, HONAVAR V. Feature subset selection using a genetic algorithm[J]. IEEE Trans Intelligent Systems and Their Applications, 1998, 13(2): 44-49. [14]潘巍巍. 故障嚴(yán)重程度識(shí)別的有序分類特征分析方法[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2013. [15]XIA Fen, ZHANG Wensheng, LI Fuxin, et al. Ranking with decision tree[J]. Knowledge and Information Systems, 2008, 17(3): 381-395. [16]HU Qinghua, CHE Xunjian, ZANG Lei, et al. Rank entropy based decision trees for monotonic classification[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(11): 2052-2064.[17]BEN-DAVID A, STERLING L, TRAN T D. Adding monotonicity to learning algorithms may impair their accuracy[J]. Expert Systems with Applications,2009,36(3): 6627-6634. (編輯楊波) Gear crack level identification using ordinal classification PAN Weiwei1,2, SONG Yanping2, YU Daren2 (1.School of Applied Mathematics, Xiamen University of Technology, Xiamen 361024, Fujian, China;2. School of Energy Science and Engineering, Harbin Institute of Technology, Harbin 150001, China) Abstract:A fault severity level identification method based on ordinal classification is proposed to identify the gear crack levels. The fault level identification is regarded as ordinal classification in which there are ordinal structures between different severity levels and some features have monotonic relationship with the severity levels. The feature evaluation and feature selection for fault severity level identification based on ordinal classification are discussed. Ranking mutual information is utilized to distinguish monotonic features and non-monotonic features of the original feature set, and then a feature selection algorithm is designed for ordinal classification when monotonic features are mixed with non-monotonic features. The experimental results demonstrate that the designed algorithm can select the features with high classification ability for classifying the crack fault severity. A fault severity recognition model is constructed using ordinal classification. The proposed feature selection algorithm can reduce the dimension of feature space, select the features with strong classification ability and improve the accuracy of fault severity level identification. Keywords:ordinal classification; feature selection; fault diagnosis; severity level; gear crack level identification doi:10.11918/j.issn.0367-6234.2016.07.026 收稿日期:2015-10-13 基金項(xiàng)目:福建省自然科學(xué)基金(2015J01278) 作者簡介:潘巍巍(1983—), 女, 博士, 講師; 通信作者:于達(dá)仁, yudaren@hit.edu.cn 中圖分類號(hào):O235;TH165 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):0367-6234(2016)07-0156-07 宋彥萍(1971—), 女, 教授, 博士生導(dǎo)師; 于達(dá)仁(1966—), 男, 博士生導(dǎo)師,長江學(xué)者特聘教授