陳維義,王克明,鄧萬彬
(1.海軍工程大學 兵器工程系,湖北 武漢 430033;2.海軍裝備部,北京 100841)
面向CBR的案例庫組織與快速檢索方法
陳維義1,王克明1,鄧萬彬2
(1.海軍工程大學 兵器工程系,湖北 武漢 430033;2.海軍裝備部,北京 100841)
用面向對象的知識表示方法實現(xiàn)案例表示,用分層組織結構完成案例庫組織,采用距離相似度計算方法實現(xiàn)案例間的相似度的計算,提出類選、粗選、精選三步走的案例檢索方法。以防空火炮的故障診斷為例,驗證了快速檢索方法的有效性,提高故障診斷效率。
故障診斷;案例推理;案例檢索;專家系統(tǒng)
隨著科技的發(fā)展和計算機技術的廣泛應用,智能故障診斷技術得到快速發(fā)展,基于案例推理(Case-Based Reasoning,CBR)的故障診斷專家系統(tǒng)成為故障診斷領域的熱點,越來越受到重視。CBR故障診斷專家系統(tǒng)是通過訪問案例庫中過去相似案例的處理經驗而獲得當前問題解決方案的一種新的推理模式。
CBR的工作原理是利用已有的經驗和知識來解決遇到的新問題。根據(jù)Aamodt,Plaza和國外其他學者提出的 “4R”[1-2]模型,一個典型的案例推理問題求解過程的基本步驟可以歸納為4個主要的過程,即案例檢索、案例重用、案例修正和案例學習。案例的檢索是CBR的關鍵技術之一,本文將對CBR案例檢索技術展開研究。
面向對象 (Object Orientation,OO)[3]的知識表示方法能將多種知識表示方法按照面向對象的程序設計原則組成一種混合知識表示形式,以對象為中心,將對象的屬性、動態(tài)行為特征、相關領域知識和數(shù)據(jù)處理方法等有關知識封裝在表達對象的結構中。本文將采用面向對象的知識表示方法和數(shù)據(jù)庫技術相結合的方法對故障案例進行表示。
一個故障案例可以定義為對象:
采用面向對象的知識表示方法,一個故障案例可表示為如表1所示結構的對象。
表1 故障案例的結構Tab.1 The structure of fault case
故障特征信息包括故障特征向量和故障特征權重向量。故障特征向量是指在1個故障案例中所有特征值經參數(shù)化處理后,按照一定的順序組成的向量。故障特征權重向量是故障特征值對應的權重組成的向量。采用基于粗糙集理論故障特征權重提取方法[4-5]。
故障特征向量表示為:
式中:Ai為第i個案例的故障特征向量;Ai(k)為第i個案例中的第k個指標參數(shù)化處理后得到的特征值。
故障特征值可分為以下3種類型:
1)數(shù)值型。數(shù)值型是用數(shù)值記錄的定量數(shù)據(jù),案例的特征值就等于實際測量值,使用時只需要考慮其數(shù)值是否在一定的合理的范圍內。但對于不同故障的特征值,其量綱是不一樣的,因此在使用這些前,必須先對其進行歸一化處理。歸一化處理函數(shù)為:
2)枚舉型。為了便于提取使用需要數(shù)字化處理,建立相應特征值索引表。即對每一特征建立故障特征表現(xiàn)與其索引值的對應表,索引值分別用0,1,-1等整數(shù)表示,并規(guī)定所有故障特征的正常屬性值都用0表示。不同的故障特征信息其特征值索引表不同,對應的索引值個數(shù)也不同。如表2所示。
表2 故障特征索引表Tab.2 The fault case index
3)邏輯型。邏輯型故障特征的觀測值只有True和False兩種取值狀態(tài),根據(jù)對象是否處于故障狀態(tài),作如下定義:
式中:ai為故障案例的第i個屬性;V(ai)為屬性ai的值。
相似度是故障案例之間相似性的一種度量。相似度是案例聚類的依據(jù),也是案例檢索匹配的基礎。
案例間相似度量的基本方法大都是基于距離測度的相似評判方法,常用的距離測度方法有:歐氏距離、曼哈頓距離、無限模距離、海明距離、明考斯基距離、Hausdorff距離、Mahalanobis距離等[6],本文將采用基于海明距離的相似度計算方法。
基于海明距離的相似度計算方法的定義如下:
為了提高系統(tǒng)檢索效率,必須對故障案例庫進行分層組織,具體分為3層。以火炮故障案例庫為例,案例庫的組織結構如圖1所示。
圖1 防空火炮故障案例庫Fig.1 The case base of the antiaircraft artillery
第1層是系統(tǒng)總案例庫,第2層是按照防空火炮系統(tǒng)結構分成的各個子庫,第3層是按照故障類型分成的各案例集。
案例集是按照相似度進行聚類的,只有相似度滿足一定閾值的一些案例才能聚類在一起,從而構成一個案例集。同一個案例集中的案例相似度大,而不同的案例集之間的相似度小。案例相似度的計算用式(5)進行計算,案例集之間相似度的計算用式(7)進行計算。同一個案例集中的與其他各個案例相似度最大的案例作為本案例集的代表案例,在該案例集中編碼排第一個,以利于下一步案例檢索時計算案例集的相似度。
案例檢索就是要解決如何快速從系統(tǒng)案例庫中的大量案例中,找到與目標案例匹配的歷史案例,以解決當前的故障問題。隨著CBR故障診斷專家系統(tǒng)的使用,新的案例將不斷添加到案例庫中,案例庫中的案例數(shù)量將不斷增加。案例數(shù)量的增加將案例檢索提出了新的要求。檢查方法可分為以下3步:
1)類選
系統(tǒng)案例庫由多個子案例庫組成,類選就是從系統(tǒng)案例庫中找出與當前故障案例匹配的一個子案例庫。
故障診斷的最終目標是找到故障發(fā)生的根本原因,定位故障的位置,是一個復雜的過程。但是根據(jù)當前的故障現(xiàn)象,可初步確定故障模式,如目標探測系統(tǒng)故障、運載系統(tǒng)故障,相對較容易。而子案例庫的構建是以設備的組成結構和原理為基礎的,因此通過人工初步的故障模式判斷,系統(tǒng)通過子案例庫編碼匹配可以找到對應的子案例庫。這個過程就是類選的過程。
2)粗選
粗選就是從子案例庫中找出與當前故障案例匹配的一個案例集。
子案例庫由多個案例集組成,其中每個案例集有一個代表案例,用式(5)計算當前案例與各代表案例的相似度。取相似度最大的代表案例所在案例集作為粗選結果。計算所得相似度最大的代表案例所在的案例集就是與當前故障案例匹配的案例集。
3)精選
精選就是在案例集中找出與當前故障狀態(tài)匹配的數(shù)個案例。
案例集由多個具體的案例組成,用式(5)計算當前故障案例與案例集中各案例的相似度,設置一個相似度閾值η,將相似度大于該閾值的案例提取出來,作為精選的結果。將滿足閾值條件的案例按照發(fā)生頻率從大到小排序,取發(fā)生頻率最大的案例作為最優(yōu)的匹配案例。
檢索步驟如圖2所示。
圖2 案例檢索原理Fig.2 The case retrieval principium
以某型防空火炮發(fā)生的一個故障為例進行案例檢索。
故障情況如下:某型防空火炮跟蹤目標后無法開火射擊,轉為手動射擊后仍然無法開火射擊。
經檢查當時系統(tǒng)狀態(tài):跟蹤雷達工作良好,射控電路正常,隨動系統(tǒng)工作正常,供輸彈系統(tǒng)正常,可能是火炮自動機故障。
檢索第1步類選,初步判斷自動機故障,進入自動機案例子庫。
故障描述信息如表3所示。
表3 故障描述Tab.3 The description of fault case
檢索第2步粗選,輸入當前故障描述信息,經量化處理后,診斷系統(tǒng)在自動機案例子庫中進行粗選,取相似度最大的代表案例所在的案例集作為精選的案例集。
檢索第3步精選,在相似度最大的案例集中,計算各案例與當前故障的相似度,取相似度閾值η=0.8,將相似度大于該閾值的案例提取出來,取發(fā)生的頻率最大的案例作為精選的結果。
表4 故障案例檢索Tab.4 The fault case retrieval
檢索得到相似案例如表5所示。
表5 案例檢索結果Tab.5 The result of case retrieval
用傳統(tǒng)的檢索方法,需要在整個系統(tǒng)案例庫中對所有的案例都要檢索1次,隨著案例的不斷增加,系統(tǒng)案例庫的規(guī)模越來越大,案例檢索效率將越來越低。而采用新的快速檢索方法可以很好地解決這個問題。例如:當系統(tǒng)案例庫案例總數(shù)為106個,而分層組織的案例庫中相似案例集中案例數(shù)為104個時,快速檢索方法比傳統(tǒng)的檢索方法效率提高100倍。
本文采用面向對象的知識表示方法進行案例表示,通過對案例庫采用分層組織結構,相似案例聚類組織,可以縮小案例檢索范圍。并進一步探索出一種高效的案例檢索方法,提高了案例檢索速度。
[1]AAMODT A,PLAZA E.Case-based reasoning:foundational issues,methodological variations,and system approaches,Artificial Intelligence Communications,1994:39 -59.
[2]LEAKE D B.Case-based reasoning:experiences,lessons and future direction,AAAI press/MIT press[M].Menlo Park,CA,1996.
[3]BLAHA M,PREMERLANIW.Object-oriented modeling and design for database application[M],Prentice Hall Inc,1998.
[4]張光軼,蘇艷琴,許愛強.粗糙集理論在裝備故障診斷中的應用[J].艦船科學技術,2012,34(1):104 -106.
ZHANG Guang-yi,SU Yan-qin,XU Ai-qiang.Application analysis of the equipment fault diagnosis based on rough set theory[J].Ship Science and Technology,2012(1):104-106.
[5]苗奪謙,李道國.粗糙集理論、算法與應用[M].北京:清華大學出版社,2008:186-190.
MIAO Duo-qian,LIDao-guo.Rough set theory algorithms and applications[M].Beijing:Tsinghua University Press,2008:186-190.
[6]楊健,楊曉光,劉曉彬,等.一種基于k-NN的案例相似度權重調整算法[J].計算機工程與應用,2007(23):43.
YANG Jian,YANG Xiao-guang,LIU Xiao-bin,et al.K -NN-based feature weights adjustment algorithm for case similarity measurement[J].Computer Engineering and Applications,2007(23):43
Research on the case base structure and retrieval based on CBR
CHENWei-yi,WANG Ke-ming,DENGWan-bin
(1.Department ofWeaponry Engineering,Naval University of Engineering,Wuhan 430033,China;2.Naval Armament Department,Beijing 100841,China)
This paper realized case representation by the object-oriented knowledge representation approach.The case base is hierarchically organized.The case similarity is calculated by themethod based on distance similarity degree.A new case retrieval strategy which consisted of three steps had been explored,and the three steps were sort selection,rough selection and accurate selection.Finally,an example in the antiaircraft artillery fault diagnosiswas given,which verify the effectiveness of the rapid retrievalmethod,and improves the efficiency of fault diagnosis.
fault diagnosis;case-based reasoning;case retrieval;expert system
TP392
A
1672-7649(2014)04-0126-04
10.3404/j.issn.1672-7649.2014.04.027
2013-03-12;
2013-04-15
陳維義(1966-),男,教授,主要研究方向為武器系統(tǒng)仿真與測試技術。