朱文博,李郝林,甘 屹
(上海理工大學(xué) 機(jī)械工程學(xué)院,上海 200093)
相似的故障現(xiàn)象往往是由相似的故障原因引起的,事實(shí)證明經(jīng)驗(yàn)豐富的維修師總是比缺乏經(jīng)驗(yàn)的維修人員診斷得更快、更好,這是因?yàn)橛薪?jīng)驗(yàn)的維修師積累了大量成功或失敗的維修案例和方法[1]?;趯?shí)例的推理(Case based Reasoning,CBR)利用已有的相似實(shí)例來解決問題[2],因此將CBR應(yīng)用于故障診斷系統(tǒng)是非常適合的[3]。要實(shí)現(xiàn)CBR最為關(guān)鍵的技術(shù)就是相似實(shí)例的檢索[4]。針對(duì)實(shí)例檢索這一問題,國(guó)內(nèi)外提出了多種方法,主要有:最近鄰法、歸納法、神經(jīng)網(wǎng)絡(luò)和灰色關(guān)聯(lián)度等[5],這些方法已較成功的應(yīng)用于故障診斷實(shí)例檢索中。文獻(xiàn)[6]將灰色關(guān)聯(lián)度的計(jì)算方法應(yīng)用于裝載機(jī)的故障診斷系統(tǒng),提出了一種類選、粗選、精選、擇優(yōu)“四步走”的檢索策略。文獻(xiàn)[7]在電動(dòng)摩托車故障診斷方面運(yùn)用了CBR,采用Petri網(wǎng)進(jìn)行實(shí)例建模后,用余弦匹配函數(shù)進(jìn)行實(shí)例檢索。文獻(xiàn)[8]將神經(jīng)網(wǎng)絡(luò)應(yīng)用于先進(jìn)制造系統(tǒng)控制部分的故障診斷中。雖然這些算法在理論研究上均能實(shí)現(xiàn)故障診斷實(shí)例檢索,但是由于實(shí)例表示模型的復(fù)雜性,或者檢索算法本身的繁雜,使得在實(shí)際程序編制的過程中出現(xiàn)偏差,從而導(dǎo)致實(shí)例檢索的可靠性不能保證。本文將本體引入故障診斷實(shí)例表示中,并在此基礎(chǔ)上提出一種故障診斷實(shí)例檢索方法,該方法首先計(jì)算概念術(shù)語(yǔ)的相似度進(jìn)行初步篩選,進(jìn)而比較概念匹配對(duì)的屬性值之間的相似度。
實(shí)例表示是CBR求解問題的第一步,輸入的實(shí)例首先要以系統(tǒng)可以識(shí)別的方式進(jìn)行描述,然后才可以進(jìn)行檢索。實(shí)例表示適當(dāng)與否,影響著實(shí)例的有效存儲(chǔ),更直接影響著CBR的推理效率[9]。將本體引入故障診斷實(shí)例表示中,不僅利于故障診斷知識(shí)的共享和重用,而且利用本體使得概念語(yǔ)義標(biāo)準(zhǔn)化和規(guī)范化,從源頭上降低故障診斷相關(guān)概念的語(yǔ)義距離,有利于后續(xù)的實(shí)例檢索。
基于本體的故障診斷實(shí)例表示需要建立故障診斷領(lǐng)域本體,其主要包括概念和屬性兩大部分。本體是對(duì)領(lǐng)域的概念化,概念是領(lǐng)域中規(guī)范化的、公認(rèn)的術(shù)語(yǔ),是具有相同屬性或行為的對(duì)象的集合,概念是本體的核心[10]。本文從故障診斷領(lǐng)域中:故障現(xiàn)象、故障部位、故障特征、故障原因以及排除方法等方面提取相關(guān)概念,采用自頂向下法建立故障診斷領(lǐng)域本體的概念分類層次,即從故障診斷領(lǐng)域中最大的概念開始,通過添加子類將這些概念細(xì)化。以數(shù)控軋輥磨床為例用領(lǐng)域概念本體樹表示,如圖1所示。
圖1 數(shù)控軋輥磨床故障診斷概念本體樹
在定義一個(gè)概念時(shí)包括:1)概念號(hào),是一個(gè)整型數(shù),唯一標(biāo)示一個(gè)概念。2)概念名稱以及該概念可能存在的同義詞和縮略詞。對(duì)這些同義詞、縮略詞進(jìn)行整理,在基于本體的故障診斷實(shí)例表示中統(tǒng)一使用概念名稱,概念用語(yǔ)的統(tǒng)一化和規(guī)范化,有利于實(shí)例檢索匹配。3)概念描述,對(duì)概念進(jìn)行文字說明。4)父類號(hào),除了根節(jié)點(diǎn)外,所有的枝節(jié)點(diǎn)都有上一級(jí)節(jié)點(diǎn),上一級(jí)節(jié)點(diǎn)對(duì)應(yīng)的概念號(hào)即為父類號(hào)。在概念本體樹中不允許有孤立的節(jié)點(diǎn)存在,這一要求由本體編輯器檢驗(yàn)語(yǔ)法來保證。
屬性是領(lǐng)域中的概念所具備性質(zhì)的抽象。屬性反映概念的特性,包含類型特性和語(yǔ)義描述。類型特性指屬性的名稱、屬性的類型(如字符型,整型等)等。語(yǔ)義描述指屬性的功能和目的,記錄屬性的內(nèi)容。
概念和屬性的BNF范式為:
<概念>::=(<概念分類號(hào)>,<概念名稱>,[<同義詞>],[<縮略詞>],<概念描述>, [<該概念的父類號(hào)>],[<所屬領(lǐng)域名稱>])
<屬性>::=(<屬性號(hào)>,<屬性名稱>,[<同義詞>],[<縮略詞>],[<屬性值>],<值的類型>,<集的勢(shì)>,[<允許值>],[<默認(rèn)值>], <概念號(hào)>)
一個(gè)故障診斷實(shí)例可以劃分為故障現(xiàn)象、故障征兆、故障部位、故障特征、故障原因、檢測(cè)順序和排除方法等方面,其中故障現(xiàn)象、故障征兆、故障部位和故障特征屬于實(shí)例表示的問題描述部分,而故障原因、檢測(cè)順序和排除方法等屬于實(shí)例表示的解決方案部分。基于本體的故障診斷實(shí)例表示所有的術(shù)語(yǔ)全部來自本體庫(kù)。即每一個(gè)故障診斷實(shí)例可以表示為一組概念集(Conception1,Conception2,...,Conceptioni,...,Conceptionn),概念集中的概念術(shù)語(yǔ)不能重復(fù)出現(xiàn)。每一概念具有若干屬性(Attribute1,Attribute2,...,Attributem),每一屬性具有屬性值,屬性值的類型是數(shù)值型或字符型。
檢索分兩個(gè)階段,第一階段通過計(jì)算概念術(shù)語(yǔ)的相似度初步篩選相似實(shí)例,過濾掉一些完全不相似和不太相似的舊實(shí)例,得到一批較為相似的舊實(shí)例,縮小了后續(xù)階段的檢索空間;第二階段主要比較概念匹配對(duì)的屬性值之間的相似度,從第一階段獲得的一批舊實(shí)例中,得出最為相似的舊實(shí)例。
實(shí)例檢索是尋找問題之間的相似度。設(shè)故障診斷新實(shí)例的問題由a個(gè)概念組成,即:(Conception,Conceptio,...,Conceptio,...,Conceptio,舊實(shí)例問題部分由b個(gè)概念組成(Conception,Conceptio...,Conceptio,...,Conceptio)。由于概念術(shù)語(yǔ)是字符型的,而且經(jīng)過本體編輯器已完成了概念術(shù)語(yǔ)的統(tǒng)一化和規(guī)范化,因此,若Conceptio和Conceptio兩個(gè)概念相同或?yàn)橥x詞、縮略詞,則定義此新舊兩個(gè)概念為一對(duì)概念匹配對(duì)。遍歷新舊實(shí)例所有概念術(shù)語(yǔ),找到若干對(duì)概念匹配對(duì),其數(shù)量記為:Number(a,b)。計(jì)算新舊實(shí)例概念術(shù)語(yǔ)相似度SConception為:
新實(shí)例和實(shí)例庫(kù)中的舊實(shí)例逐一計(jì)算SConception后,將SConception所有值從高到低排列,并設(shè)定閾值η,得到一批較為相似的故障診斷實(shí)例,完成第一階段實(shí)例檢索,準(zhǔn)備第二階段相似度比較。閾值η的設(shè)定可以由用戶根據(jù)第一階段的檢索結(jié)果,人為指定一個(gè)值,這個(gè)值為0到1之間的一個(gè)數(shù),也可以直接設(shè)定從第一階段的檢索結(jié)果中提取前多少個(gè)實(shí)例參與第二階段檢索。
第一階段的檢索僅僅從概念術(shù)語(yǔ)一致的角度來考察新舊故障診斷實(shí)例的相似度,這是不充分的,因?yàn)楦拍钚g(shù)語(yǔ)屬性值的差異,可能導(dǎo)致故障診斷的解決方案大相徑庭,所以第二階段從概念術(shù)語(yǔ)屬性值方面進(jìn)一步考察新舊故障實(shí)例的相似度,以期找到最相似、最適合的舊故障實(shí)例,從而利用其故障排除方案來解決新故障實(shí)例。
第二階段的實(shí)例檢索以第一階段找到的若干新舊概念匹配對(duì)為基礎(chǔ),計(jì)算每一對(duì)概念匹配對(duì)的相似度為:
式中,SiConception為某一概念匹配對(duì) 的相似度。m為概念匹配對(duì)i屬性總數(shù)。wjAttribute為第j個(gè)屬性的權(quán)重(j=1,2,...,m)如果屬性只有一個(gè),那么權(quán)重為1。如果有多個(gè),則要根據(jù)屬性對(duì)故障的影響程度來設(shè)定。例如:主軸的屬性有轉(zhuǎn)速和溫度,轉(zhuǎn)速對(duì)故障的影響要大于溫度,因此確定轉(zhuǎn)速的權(quán)重大于溫度的。如果屬性有多個(gè)且權(quán)重相同,則公式(2)變成為概念匹配對(duì)i的第j個(gè)屬性值相似度,根據(jù)屬性值類型的不同分別采用下述公式(3)~(7)計(jì)算[4,11]。
1)屬性值為確定性數(shù)值型,即屬性值x和y之間的相似度為:
2)屬性值之一為確定性數(shù)值型,另一為區(qū)間數(shù)值型,即屬性x和[y1,y2]之間的相似度為:
式中的Sim(x,y)的計(jì)算同式(3)。
3)屬性值均為區(qū)間數(shù)值型,即屬性值為[x1,x2]和 [y1,y2]之間的相似度為:
式中的Sim(x,y)的計(jì)算同式(3)。
4)屬性值為確定性字符型,即屬性值為有或無、存在或不存在等。屬性char1和char2之間的相似度為:
5)屬性值為模糊字符型。這些模糊概念屬性值的允許值在實(shí)例表示時(shí)被定義,并且根據(jù)屬性允許值的個(gè)數(shù)t映射成數(shù)值描述{0,1,2,...,t-1}。如電流波動(dòng){很大,相當(dāng)大,較大,中等,較小,相當(dāng)小,很小}和{0,1,2,3,4,5,6}之間建立映射關(guān)系,這樣模糊概念屬性的相似度就轉(zhuǎn)化成數(shù)值的相似度計(jì)算,計(jì)算方法同公式(3)。
計(jì)算完新舊故障實(shí)例每一對(duì)概念匹配對(duì)的相似度Si
Conception后,則新舊實(shí)例相似度S如公式(7)所示:
式中,SiConception如公式(2)所示;Number如公式(1)所述為概念匹配對(duì)的總數(shù)(i=1,2,...,Nunber(a,b));a如公式(1)所述為新實(shí)例概念的總數(shù)(i=1,2,...,Nunber(a,b),Nunber(a,b)+1,...,a);b為舊實(shí)例概念的總數(shù)(i=1,2,...,Nunber(a,b),Nunber(a,b)+1,...,b);wjConception為概念的權(quán)重。在分子中,乘以2是因?yàn)橐粋€(gè)SiConception值涉及到2個(gè)概念(即:新舊實(shí)例各一個(gè)概念);分母是新舊實(shí)例的所有概念(包括匹配的和不匹配的)權(quán)重之和。
新實(shí)例與第一階段獲得的一批舊實(shí)例逐一進(jìn)行第二階段計(jì)算,得到若干個(gè)S值,將S值從高到低排列,得到最為相似的故障診斷舊實(shí)例。至此完成故障診斷相似實(shí)例檢索。
表1 實(shí)例庫(kù)中部分實(shí)例(問題部分概念術(shù)語(yǔ)集)
以數(shù)控軋輥磨床故障診斷為例,來驗(yàn)證上述檢索方法的有效性。有一待診斷的故障為:砂輪架主軸電機(jī)電流波動(dòng)大,尾架頂尖有響聲。經(jīng)過本體編輯器的編輯,表示成概念術(shù)語(yǔ)集{砂輪架,主軸,電機(jī),尾架,頂尖}。在實(shí)例庫(kù)中存放著上千個(gè)故障實(shí)例,現(xiàn)僅列舉出10個(gè)實(shí)例,其問題部分的概念術(shù)語(yǔ)集如表1所示。
首先進(jìn)行第一階段的實(shí)例檢索。新實(shí)例問題部分有5個(gè)概念,001號(hào)實(shí)例問題部分有4個(gè)概念,新舊實(shí)例相同的概念數(shù)為3,代入公式(1)計(jì)算,a=5,b=4,Number(a,b)=3,依次類推計(jì)算新實(shí)例與002號(hào)到010號(hào)舊實(shí)例的概念術(shù)語(yǔ)相似度,并將得到的結(jié)果排序如下:
009號(hào)舊實(shí)例,SConception=0.9090;008號(hào)舊實(shí)例,SConception=0.8000;004號(hào)舊實(shí)例,SConception=0.7272;001號(hào)舊實(shí)例,SConception=0.6666;007號(hào)舊實(shí)例,SConception=0.6000;002號(hào)舊實(shí)例,SConception=0.4444;010號(hào)舊實(shí)例,SConception=0.4000;003號(hào)舊實(shí)例,SConception=0.3636;005號(hào)舊實(shí)例,SConception=0;006號(hào)舊實(shí)例,SConception=0。
設(shè)閾值η=0.7,則只有009號(hào)、008號(hào)和004號(hào)舊實(shí)例進(jìn)入第二階段相似度計(jì)算,縮小檢索范圍70%(1-3/10)。第二階段檢索進(jìn)一步比較第一階段找到的概念匹配對(duì)的屬性值之間的相似度,計(jì)算量較大,過程從略,僅給出結(jié)果從高到低排列如下:
008號(hào)舊實(shí)例,SConception=0.7969;009號(hào)舊實(shí)例,SConception=0.7431;004號(hào)舊實(shí)例,SConception=0.7183。
由于新實(shí)例與008號(hào)舊實(shí)例在概念匹配對(duì)的屬性值方面更接近,第二階段考慮的因素是比較全面的,其檢索結(jié)果比第一階段更有說服力,因此確定008號(hào)舊實(shí)例和新實(shí)例相似度最高,進(jìn)而可以參考008號(hào)舊故障實(shí)例的解決方案來排除新故障。
本文將本體引入故障診斷實(shí)例表示中,利用本體使得概念語(yǔ)義標(biāo)準(zhǔn)化和規(guī)范化,從源頭上降低故障診斷相關(guān)概念的語(yǔ)義距離,有利于后續(xù)的實(shí)例檢索。進(jìn)而在此基礎(chǔ)上提出一種故障診斷實(shí)例檢索方法。該方法采用兩個(gè)階段來檢索,利用概念術(shù)語(yǔ)相似度進(jìn)行初選,大大縮減復(fù)選空間,進(jìn)一步計(jì)算概念匹配對(duì)的屬性值相似度進(jìn)行復(fù)選。給出的兩階段算法,為故障診斷相似性檢索提供了可靠的依據(jù)。第一階段僅計(jì)算概念術(shù)語(yǔ)相似度,計(jì)算量雖小,但對(duì)實(shí)例初步篩選的準(zhǔn)確率卻是非常高的,因?yàn)楦拍钚g(shù)語(yǔ)所代表的故障種類是故障診斷所考慮的最重要的因素之一,自然可以作為初步判斷相似度的重要依據(jù)。第二階段檢索計(jì)算具體屬性值的相似度,計(jì)算量相對(duì)較大,但是僅僅在小范圍內(nèi)進(jìn)行,所以總的檢索效率是相當(dāng)高的。此外該方法的計(jì)算原理為最近鄰法,算法簡(jiǎn)單、易于實(shí)現(xiàn),本文的研究在數(shù)控軋輥磨床故障診斷系統(tǒng)中得到了良好的應(yīng)用。隨著本體庫(kù)和實(shí)例庫(kù)的進(jìn)一步完善,該方法會(huì)有更好的應(yīng)用前景。
[1] 張代勝,王悅,陳朝陽(yáng). 融合實(shí)例與規(guī)則推理的車輛故障診斷專家系統(tǒng)[J].機(jī)械工程學(xué)報(bào),2002,38(7):91-95.
[2] WATSON I.Case-based reasoning is a methodology not a technology[J].Knowledge-Based Systems,1999,12(5-6):303-308.
[3] CHIU C,CHIU N H, HSU C I.Intelligent aircraft maintenance support system using genetic algorithms and casebased reasoning[J].Int J Adv Manuf Technol,2004,24:440-446.
[4] LIAO T W,ZHANG Z, MOUNT C R.Similarity measures for retrieval in case-based reasoning systems[J].Applied Artificial Intelligence,1998,12(4):267-288.
[5] 杜海峰,王娜,張進(jìn)華,等. 基于復(fù)雜網(wǎng)絡(luò)的故障診斷策略[J].機(jī)械工程學(xué)報(bào),2010,46(3):90-96.
[6] 劉景寧,劉濤,賀曉.基于CBR的故障診斷系統(tǒng)案例檢索策略[J].華中科技大學(xué)學(xué)報(bào),2008,36(3)16-19.
[7] YANG B S,JEONG S K,OH Y M,et al.Case-based reasoning system with Petri nets for induction motor fault diagnosis[J].Expert Systems with Applications,2004,27:301-311.
[8] YE N,ZHAO B,SALVENDY G.Neural-networks-aided fault diagnosis in supervisory control of advanced manufacturing systems[J].Int J Adv Manuf Technol,1993,8:200-209.
[9] WATSON I,PERERA S. A hierarchical case representation using context guided retrieval[J].Knowledge-Based Systems,1998,11(5-6):285-292
[10]于娟,黨延忠.本體集成研究綜述[J].計(jì)算機(jī)科學(xué),2008,35(7):9-13,18.
[11]周凱波,馮珊,李鋒.基于案例屬性特征的相似度計(jì)算模型研究[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2003,25(1):24-27.