鄭 偉,劉偉東,王 星
ZHENG Wei1, LIU Wei-dong2, WANG Xing1
(1. 河北北方學(xué)院 理學(xué)院,張家口 075000;2. 河北北方學(xué)院 信息科學(xué)與工程學(xué)院,張家口 075000)
故障診斷是20世紀(jì)60年代發(fā)展起來(lái)的一門新學(xué)科。隨著現(xiàn)代科學(xué)技術(shù)水平的日益提高,尤其是計(jì)算機(jī)科學(xué)和控制科學(xué)的飛速發(fā)展,現(xiàn)代設(shè)備的結(jié)構(gòu)日益復(fù)雜,功能越來(lái)越完善,規(guī)模也越來(lái)越龐大,人們對(duì)于設(shè)備的安全性、可靠性和有效性的要求也越來(lái)越高,因此機(jī)械設(shè)備的故障診斷技術(shù)愈來(lái)愈受到人們的重視。故障診斷研究需要解決的問(wèn)題之一是在保證機(jī)器狀態(tài)評(píng)價(jià)一致的情況下如何選擇最少的特征集。也就是說(shuō),在保證診斷精度大致不變的情況下,如何盡可能減少特征維數(shù),以降低計(jì)算工作量和減少不確定性因素的影響。在診斷過(guò)程中,描述狀態(tài)的特征往往很多,有些特征是相關(guān)的,有些是獨(dú)立的,獨(dú)立的特征能提供互補(bǔ)信息,應(yīng)加以保留;相關(guān)性特征產(chǎn)生冗余信息,同時(shí)會(huì)增加計(jì)算工作量,需要加以消除[1],基于粗糙集的屬性約簡(jiǎn)正好為去除這種冗余性特征提供了方便。
本文著重研究了粗糙集理論的約簡(jiǎn)算法利用其從大量的數(shù)據(jù)中挖掘出其內(nèi)在的規(guī)律,找出有用的信息,可以大大提高故障的診斷精度。
粗糙集(Rough Set,RS)理論是波蘭數(shù)學(xué)家Pawlak在982年提出的,是一種新的軟計(jì)算方法[2],粗糙集方法的優(yōu)勢(shì)在于它不需要任何預(yù)備的或額外的有關(guān)數(shù)據(jù)信息,解決一些不確定性問(wèn)題。如統(tǒng)計(jì)中要求的先驗(yàn)概率和模糊集中要求的隸屬度,因此其算法具有簡(jiǎn)單、易于操作等特點(diǎn)。目前粗糙集理論已經(jīng)在數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、過(guò)程控制、決策分析、模式識(shí)別等科學(xué)與工程領(lǐng)域取得了成功的應(yīng)用。
決策表中的一個(gè)樣本就代表一條基本決策規(guī)則,如果把所有這樣的決策規(guī)則羅列出來(lái),就可以得到一個(gè)決策規(guī)則集合。但是,這樣的決策規(guī)則集合是沒(méi)有多大用處,因?yàn)槠渲械幕緵Q策規(guī)則沒(méi)有適應(yīng)性,只是機(jī)械地記錄了每個(gè)樣本的情況,不能適應(yīng)新的、其他的情況。為了從決策表中抽取得到適應(yīng)度大的規(guī)則,我們需要對(duì)決策表進(jìn)行約簡(jiǎn),使得經(jīng)過(guò)約簡(jiǎn)處理的決策表中的一個(gè)記錄就代表一類具有相同規(guī)律特性的樣本,這樣得到的決策規(guī)則就具有較高的適應(yīng)性。
決策表屬性約簡(jiǎn)的過(guò)程,就是在不損失原有信息的前提下,從決策表系統(tǒng)的條件屬性中去掉不必要(對(duì)得到?jīng)Q策不重要)的條件屬性,從而分析所得約簡(jiǎn)中的條件屬性對(duì)于決策屬性的決策規(guī)則。
傳統(tǒng)的屬性約簡(jiǎn)算法有一般屬性約簡(jiǎn),可辨識(shí)矩陣約簡(jiǎn)、基于屬性重要度的約簡(jiǎn)[3,4]、條件信息熵[5]等,可辨識(shí)矩陣約簡(jiǎn)該算法的不足是論域的對(duì)象與屬性的規(guī)模較大時(shí),差別矩陣將占有大量的存儲(chǔ)空間,其次, 差別函數(shù)的化簡(jiǎn)本身就是一個(gè)NP-hard問(wèn)題,基于屬性重要度的約簡(jiǎn)得到是一個(gè)最小約簡(jiǎn)集,并不是最優(yōu)集,結(jié)合信息論中條件信息熵的信息度量功能和屬性重要度的作用,本文改進(jìn)了條件信息熵約簡(jiǎn)算法,提出了一種基于屬性重要度和條件信息熵的屬性約簡(jiǎn)算法。
算法描述:
1)從條件屬性集C中求出核屬性并放到屬性集CORE中,C=C-CORE。
2)計(jì)算決策表T中決策屬性D相對(duì)條件屬性C的條件熵H(D|C);
3)計(jì)算決策屬性相對(duì)每個(gè)條件屬性的條件熵H(D|{ai})(ai∈C),將ai按H(D|{ai})的大小降序排列;
4)令B=C,按H(D|{ai})遞減的順序?qū)γ總€(gè)ai重復(fù)1)、2)運(yùn)算:
(1)計(jì)算決策屬性集相對(duì)條件屬性集B在去掉ai后的條件熵H(D|B-{ai});
(2)判斷條件熵的變化:如果H(D|C)= H(D|B-{ai}),則屬性ai應(yīng)約簡(jiǎn),記為B=B-{ai};如果H(D|C)!= H(D|B-{ai}),則屬性ai不被約簡(jiǎn),B不變;CORE=CORE+ai;
最后得到CORE集合為約簡(jiǎn)的最終結(jié)果。
內(nèi)燃機(jī)是一種動(dòng)力機(jī)械,它是通過(guò)使燃料在機(jī)器內(nèi)部燃燒,并將其放出的熱能直接轉(zhuǎn)換為動(dòng)力的熱力發(fā)動(dòng)機(jī)。內(nèi)燃機(jī)的供油系統(tǒng)是內(nèi)燃機(jī)的重要組成部分,供油系統(tǒng)產(chǎn)生故障將直接影響內(nèi)燃機(jī)燃燒質(zhì)量,其結(jié)果是降低了內(nèi)燃機(jī)功率和熱效率,從而影響內(nèi)燃機(jī)的性能和可靠性。因而查找供油系統(tǒng)的故障部位原因,對(duì)于保證設(shè)備正常工作具有十分重要的意義。
圖1 單缸4沖程柴油機(jī)工作原理示意圖
表3為內(nèi)燃機(jī)的故障診斷決策表[1],1 表示存在,0 表示不存在;S1 表示低殘壓,S2 表示高殘壓,S3 表示壓力上升緩慢,S4 表示壓力急劇上升,S5表示開(kāi)啟壓力提前,S6表示開(kāi)啟壓力滯后,S7 表示二次噴射;F1表示噴孔堵塞,F(xiàn)2表示針閥常開(kāi)或噴油器滴油,F(xiàn)3 表示開(kāi)啟壓力過(guò)高,F(xiàn)4 表示開(kāi)啟壓力過(guò)低,F(xiàn)5 表示油管堵塞。
表1 內(nèi)燃機(jī)故障診斷決策表
采用基于屬性重要度和條件信息熵的屬性約簡(jiǎn)方法進(jìn)行故障規(guī)則的提取是,先求決策表中特征屬性集對(duì)應(yīng)的核屬性,核屬性為特征S1與特征S6,再對(duì)特征集中剩余的特征依次進(jìn)行條件信息熵計(jì)算,最后就可得特征屬性的約簡(jiǎn)結(jié)果。表2給出了約簡(jiǎn)結(jié)果。
表2 約簡(jiǎn)后的內(nèi)燃機(jī)故障診斷決策表
基于屬性重要度和條件信息熵的屬性約簡(jiǎn)算法得到的約簡(jiǎn)結(jié)果與采用一般屬性約簡(jiǎn)、可辨識(shí)矩陣約簡(jiǎn)的結(jié)果一致,該算計(jì)算時(shí)間復(fù)雜度小地優(yōu)點(diǎn)。粗糙集約簡(jiǎn)理論的優(yōu)勢(shì)在于它不需要任何預(yù)備的或額外的有關(guān)數(shù)據(jù)信息。而統(tǒng)計(jì)中要求的先驗(yàn)概率和模糊集中要求的隸屬度,因此其算法具有簡(jiǎn)單、易于操作等特點(diǎn)。目采用該技術(shù)用于故障規(guī)則提取,提取的特征更具有典型特性,在故障診斷時(shí)能夠有效地降低故障診斷時(shí)間與提高診斷效果。
[1]康世英,姚斌.粗糙集屬性約簡(jiǎn)理論在故障診斷中的應(yīng)用研究[J].制造業(yè)自動(dòng)化,2009,31(7):13-14.
[2]張文修,吳偉志,梁吉業(yè),李德玉.粗糙集理論與方法[M].科學(xué)出版社,北京,2001,12-34.
[3]陳淑珍.基于粗集的幾種屬性約簡(jiǎn)算法分析[J].武漢工業(yè)學(xué)院學(xué)報(bào),2005,24(3):118-121.
[4]植小三,印勇,黃揚(yáng)帆.基于粗糙集理論的一種數(shù)據(jù)約簡(jiǎn)算法[J].云南民族學(xué)院學(xué)報(bào),2008,2003,12(2):86-88.
[5]王國(guó)胤,于洪,楊大春.基于條件信息熵的決策表約簡(jiǎn)[J].計(jì)算機(jī)科學(xué),2008,2002,25(7):759-765.