李 鵬 ,陳忠一
(1.91550部隊 92分隊,遼寧 大連 116023;2.大連海事大學 輪機學院,遼寧 大連 116023)
自組織特征映射網(wǎng)絡(luò)在故障診斷中的應(yīng)用
李 鵬1,陳忠一2
(1.91550部隊 92分隊,遼寧 大連 116023;2.大連海事大學 輪機學院,遼寧 大連 116023)
運用自組織特征映射神經(jīng)網(wǎng)絡(luò)的工作原理和具體實現(xiàn)算法進行故障診斷分析,在對已有神經(jīng)網(wǎng)絡(luò)聚類分析方法概括和總結(jié)的基礎(chǔ)上,結(jié)合實驗數(shù)據(jù)、仿真數(shù)據(jù)對自組織特征映射算法故障模型診斷進行研究,得出了有意義的結(jié)論。
數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡(luò)聚類;自組織特征映射;特征提取
實時監(jiān)測設(shè)備運行狀況,在運行參數(shù)發(fā)生變化時及時報警并提示操作人員進行檢查,對于保障設(shè)備的正常運行具有重要的意義。傳統(tǒng)的故障診斷方法一般都是采用基于知識的故障診斷系統(tǒng),以領(lǐng)域?qū)<液筒僮魅藛T的啟發(fā)性主觀經(jīng)驗知識為基礎(chǔ),經(jīng)過產(chǎn)生式推理和演繹推理來獲得大量的規(guī)則,從而獲得診斷故障原因和部位。但由于基于知識的故障診斷系統(tǒng)不具有學習功能,知識的獲取途徑只有通過專家或操作人員總結(jié)經(jīng)驗獲取,從而制約了其進一步的發(fā)展[1,2]。
神經(jīng)網(wǎng)絡(luò)是模擬人腦結(jié)構(gòu)開發(fā)的一種并行運算的數(shù)字算法,由輸入層、輸出層和隱層組成,可以用來建立輸入輸出之間復雜的映射關(guān)系。由于具有良好的記憶聯(lián)想功能,因此在故障診斷領(lǐng)域得到了廣泛的應(yīng)用。但是傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)只能用于確定性關(guān)系的學習,不能處理矛盾樣本,而故障診斷系統(tǒng)中的數(shù)據(jù)有些具有一定的離散性,因此需要將輸入層的確定性信息模糊化之后變成模糊量,將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)變?yōu)槟:窠?jīng)網(wǎng)絡(luò),將與故障運行參數(shù)相對應(yīng)的隸屬度數(shù)值作為輸入,從而使神經(jīng)網(wǎng)絡(luò)系統(tǒng)更加適合設(shè)備故障狀態(tài)的描述。
1981年KOHONEN T教授提出一種自組織特征映射 SOFM(Self-Organizing Feature Map),又稱為 SOM網(wǎng)或Kohonen網(wǎng)。他認為當一個神經(jīng)網(wǎng)絡(luò)接受外界輸入模式時將會分為不同的對應(yīng)區(qū)域,各區(qū)域?qū)斎肽J骄哂胁煌捻憫?yīng)特征。SOFM網(wǎng)共兩層,輸入層模擬感知外界輸入信息的視網(wǎng)膜 ,輸出層模擬做出響應(yīng)的大腦皮層。輸入層各神經(jīng)元通過權(quán)向量將外界信息匯集到輸出層的各神經(jīng)元。輸出層屬于競爭層,神經(jīng)元的排列有多種形式,如一維線陣、二維平面陣和三維刪格陣。輸出按照二維平面組織是SOFM網(wǎng)最典型的組織方式,結(jié)構(gòu)如圖1所示。SOFM網(wǎng)采用的學習算法是在“勝者為王”算法基礎(chǔ)上改進的,主要區(qū)別在于調(diào)整權(quán)向量與側(cè)抑制的方式不同。SOFM學習算法中不僅獲勝神經(jīng)元本身要調(diào)整權(quán)向量,其周圍的神經(jīng)元在其影響下也要不同程度地調(diào)整權(quán)向量。權(quán)向量的調(diào)整函數(shù)稱為墨西哥帽函數(shù)。由于該函數(shù)的復雜性,在實際中采用較為簡化的大禮帽函數(shù)或廚師帽函數(shù)來處理。
SOFM網(wǎng)采用的學習算法稱為Kohonen算法,按如下步驟進行:
(1)初始化。對輸出層各權(quán)向量賦小的隨機數(shù)并進行歸一化處理,得到,j=1,2,…,m;建立初始優(yōu)勝鄰域Nj*(0),學習率 η 賦初始值;
(2)接受輸入。從訓練集中選取一個輸入模式并進行歸一化處理,得到,p∈{1,2,…,P};
(4)定義優(yōu)勝鄰域Nj*(t)以j*為中心確定t時刻的權(quán)值調(diào)整域,一般初始鄰域Nj*(0)較大,訓練過程中Nj*(t)隨訓練時間逐漸收縮;
(5)調(diào)整權(quán)值。針對優(yōu)勝鄰域Nj*(t)內(nèi)的所有節(jié)點調(diào)整權(quán)值:
其中,η(t,N)是訓練時間 t和鄰域內(nèi)第 j個神經(jīng)元與獲勝神經(jīng)元j*之間的拓撲距離N的函數(shù)。該函數(shù)一般有以下規(guī)律:t↑→η↓,N↑→η↓;
(6)結(jié)束檢查。訓練結(jié)束是以學習率η(t)是否衰減到0或某個預(yù)定的正小數(shù)為條件,不滿足條件則回到步驟(2)[3,4]。
任何聚類算法的參數(shù)對聚類結(jié)果都具有直接的影響,當考慮高維數(shù)據(jù)的時候,合理的降維是一個很重要的方面,降維應(yīng)該遵循一定的方法。在算法中處理高維數(shù)據(jù)時將更高維密集單元的搜索限制在子空間密集單元的交集中,這種候選空間的確定采用基于關(guān)聯(lián)規(guī)則挖掘中的先驗性質(zhì),該性質(zhì)在所有空間中利用數(shù)據(jù)項的先驗知識以裁減空間。采用的性質(zhì)是:如果數(shù)據(jù)在k維單元是密集的,則它在k-1維空間上的投影也是密集的。也就是說,給定一個k維的候選密集單元,檢查它的k-1維投影單元,如果發(fā)現(xiàn)任何一個不是密集的,則知道第k維的單元也不是密集的[5]。由此進一步得出結(jié)論,如果聚類的某一維是密集的,則它對于整個k維聚類也是可用的,否則,在整個k維數(shù)據(jù)聚類中不起作用。把這一關(guān)聯(lián)規(guī)則挖掘中的性質(zhì)應(yīng)用到故障特征屬性的降維中。
SOFM的數(shù)據(jù)壓縮和特征抽取的功能,將高維空間的樣本在保持拓撲結(jié)構(gòu)不變的條件下投影到低維空間,在高維空間中很多模式的分布具有復雜特性,但當映射到低維空間后,由于維度和節(jié)點數(shù)量(從多維對象映像到二維的神經(jīng)網(wǎng)絡(luò)節(jié)點)的降低,其規(guī)律很明顯。
2.2.1 預(yù)處理:選擇合適的維參與映射
自組織特征映射網(wǎng)絡(luò)聚類是模型聚類的一種,其自組織學習過程也可以描述為:對于每一個網(wǎng)絡(luò)的輸入,只調(diào)整一部分權(quán)值,使權(quán)向量更接近或更偏離輸入矢量,這一調(diào)整過程,就是競爭學習。隨著不斷學習,所有權(quán)向量都在輸入矢量空間相互分離,形成了各自代表輸入空間的一類模式,這就是自組織映射網(wǎng)絡(luò)的特征自動識別的聚類功能。每個故障模式參數(shù)樣本作為聚類的一個“典型”,可以根據(jù)新對象與哪個參數(shù)樣本最相似(基于某種距離計算方法)而將其分派到相應(yīng)的聚類中。被診斷設(shè)備狀態(tài)可以由一系列的特征參數(shù)來描述,一旦設(shè)備出現(xiàn)某個故障或多個故障,其狀態(tài)特征參數(shù)也會發(fā)生相應(yīng)的變化。因而,特定的特征參數(shù)值反映了相應(yīng)的設(shè)備故障。在故障診斷領(lǐng)域,當設(shè)備處于故障狀態(tài)時,將特征參數(shù)呈現(xiàn)出的特定取值稱之為故障征兆,即不同的故障征兆對應(yīng)著不同的故障類型;通常,設(shè)備的故障類型不止一種,因此用故障域來表述設(shè)備可能出現(xiàn)的多種故障類型,用征兆域來表述可能出現(xiàn)的多種故障征兆。由此可見,可以認為故障診斷即進行由征兆域到故障域的模式識別,或是由征兆域到故障模式的具有聯(lián)想能力的判別分類[6-8]。
需要指出的是,文本型數(shù)據(jù)轉(zhuǎn)換以后應(yīng)該作為分類數(shù)據(jù)來處理。一般,在聚類過程中,如果分類維和密集維表示的是非空間屬性中不同特征的某個方面,包括太密集的數(shù)據(jù)或者太分散的數(shù)據(jù),都不適合進入聚類,如果不是作為分類數(shù)據(jù),則太集中的數(shù)據(jù)不會對聚類產(chǎn)生影響,只會增加處理的時間。而太分散的數(shù)據(jù)會對聚類結(jié)果產(chǎn)生不良的影響。但是對于表示同一特征的不同維來說,有些維是密集的,有些維不是密集的,因此需要在這些維中選擇合適的維進行聚類。
2.2.2 診斷實例
在故障診斷分析應(yīng)用中,用戶應(yīng)該根據(jù)聚類的目的先選擇一些候選維,準備參與聚類。取X1~X10作為征兆參數(shù),在系統(tǒng)中各自參數(shù)點具有不同特點,在發(fā)生可能的故障時,它們的變化范圍和方向各不相同,對征兆參數(shù)進行歸一化處理,如表1所示。
表1 發(fā)射分系統(tǒng)故障樣本特征參數(shù)值
應(yīng)用自組織特征映射網(wǎng)絡(luò)來模擬模糊聚類故障診斷的全過程,應(yīng)用Matlab工具箱進行編程,根據(jù)故障樣本,利用newsom創(chuàng)建網(wǎng)絡(luò)的競爭層為 6×6的結(jié)構(gòu),網(wǎng)絡(luò)結(jié)構(gòu)是可以調(diào)整的,可以根據(jù)數(shù)據(jù)規(guī)模進行調(diào)整,然后輸入樣本p(如表1參數(shù)值進行訓練),利用函數(shù) train和函數(shù)sim對網(wǎng)絡(luò)進行訓練,并對故障樣本進行模糊聚類。由于訓練步數(shù)大小影響著網(wǎng)絡(luò)的聚類性能,分別設(shè)置 100、200 和 500 步對網(wǎng)絡(luò)進行訓練,觀察性能[7,8];選用聚類效果較好的訓練步數(shù)為500步的網(wǎng)絡(luò),利用自組織特征映射網(wǎng)絡(luò)選取聚類數(shù)目為6類,應(yīng)用訓練數(shù)據(jù)對網(wǎng)絡(luò)進行訓練,保存網(wǎng)絡(luò)參數(shù)的訓練結(jié)果,以及訓練數(shù)據(jù)的離散結(jié)果,然后利用訓練后的網(wǎng)絡(luò)對測試數(shù)據(jù)進行離散化處理,即可得到離散化結(jié)果,如圖 2所示,可見6種故障模式分別占據(jù)不同區(qū)域,可作為故障診斷故障基準。
競爭層輸出的不同的神經(jīng)元代表了不同的故障類型,系統(tǒng)某種故障與標準樣本的故障類型越相似,在競爭層上的興奮神經(jīng)元的幾何位置也就越接近。模擬某電子設(shè)備的典型故障,試驗中選取了5個故障樣本,經(jīng)模糊量化后得到待檢故障模式,如表2所示。
表2 模糊量化后的待檢故障模式
將其輸入到已訓練好的SOFM神經(jīng)網(wǎng)絡(luò),在競爭層中出現(xiàn)了圖3的分類結(jié)果。第1組故障樣本輸出的幾何距離Di最接近故障形式A,表明該故障形式為末級組件電路故障;同理,可判斷第2組故障樣本的故障形式為激勵產(chǎn)生故障;第3組和第4組故障樣本的輸出分別與D和B的位置重合,表明第3組和第4組故障樣本的故障形式分別為PIN開關(guān)故障和前級組件電路故障;第5組故障樣本的輸出最接近F,表明該故障形式可能為饋線故障。診斷結(jié)果與仿真機模擬的故障一致。
模糊聚類分析是依據(jù)客觀事物間的特征、親疏程度和相似性,通過建立模糊相似關(guān)系,對客觀事物進行分類的數(shù)學方法。用模糊聚類分析方法處理帶有模糊性的聚類問題更客觀、靈活和直觀,且計算更加簡便。實踐表明,它突破了常規(guī)邏輯推理方法的局限,在很少先驗知識的情況下,能快速而準確地解決故障診斷問題。
[1]楊軍,馮振聲,黃考利,等.裝備智能故障診斷技術(shù)[M].北京:國防工業(yè)出版社,2004:119-122.
[2]何青,張海巖,張志.基于 C8051F的便攜式多通道數(shù)據(jù)采集系統(tǒng)[J].儀器儀表學報,2006,27(6):140-141.
[3]WANG X,ILTON H.DBRS:a density based spatial clustering method with random sampling[C].Proceedings of the 7th PAKDD.Seoul,Korea,2003:563-575.
[4]TROST B,L IANG M.Mechanical fault detection using fuzzy index fusion[J].International Journal of Machine Tools&Manufacture,2007(47):1702-1714.
[5]CZESLAW T K,TERESA O K.Neural networks application for induction motor faults diagnosis[J].Mathematics and Computers in Simulation,2003(63):435-448.
[6]程昌銀,李琳.模糊神經(jīng)網(wǎng)絡(luò)故障診斷研究[J].武漢理工大學學報,2002,24(1):220-225.
[7]羅志勇.雷達系統(tǒng)智能故障診斷技術(shù)研究[D].西安:西北工業(yè)大學,2006.
[8]PAKKANEN J.The evolving tree,a new kind of self-organizing neural network[C].Proceedings of the Workshop on Self-Organizing Maps,Kitakyushu,Japan,2003:311-316.
Fault diagnosis based on self-organizing feature map
Li peng1,Chen Zhongyi2
(1.PLA91550 92 Unit,Dalian 116023,China;2.Marine Institute of Dalian Maritime University,Dalian 116023,China)
In this paper,the theory and algorithm of SOFM are considered.And on the basis of analysis and summary of current neural network clustering,researches in algorithms of self-organized mapping with some experimental data of simulation,at last gets several meaningful conclusions.
data mining;neural network clustering;self-organized feature map;feature extraction
TP182
A
1674-7720(2011)02-0116-03
2010-08-26)
李鵬,男,1978年生,工學碩士,主要研究方向:無線電測量與控制,電子設(shè)備故障診斷。