摘要:結(jié)合Bandelet變換和神經(jīng)網(wǎng)絡(luò)的各自特點(diǎn),提出了一種基于脈沖耦合神經(jīng)網(wǎng)絡(luò)(Pulse Coupled Neural Networks,PCNN)的新的識(shí)別方法。該方法將金屬斷口圖像輸入到PCNN中,像素激發(fā)引起神經(jīng)元激發(fā),發(fā)生點(diǎn)火,產(chǎn)生脈動(dòng)序列輸出,得到輸出圖像的神經(jīng)元點(diǎn)火序列及熵序列作為斷口識(shí)別分類的特征。該方法將PCNN引入到金屬斷口的識(shí)別研究中,開(kāi)拓了金屬斷口模式識(shí)別的新領(lǐng)域,同時(shí)對(duì)于PCNN的理論研究和實(shí)際應(yīng)用具有現(xiàn)實(shí)意義。
關(guān)鍵詞:脈沖耦合神經(jīng)網(wǎng)絡(luò)斷口識(shí)別神經(jīng)元點(diǎn)火序列熵序列
0 引言
金屬斷口圖像的模式識(shí)別與分類是進(jìn)行斷裂故障智能化分析的關(guān)鍵性問(wèn)題。金屬斷口圖像的識(shí)別研究已經(jīng)取得一定成果,但識(shí)別的種類有限,識(shí)別率也有待于提高[1-3]。文獻(xiàn)[4]提出利用小波變換等方法提取出的能量、L1范數(shù)和熵等特征,然后利用神經(jīng)網(wǎng)絡(luò)進(jìn)行分類器設(shè)計(jì)的方法,取得了較好的識(shí)別效果,能夠解決典型斷口圖像的識(shí)別問(wèn)題。但在識(shí)別的過(guò)程中都需要學(xué)習(xí),訓(xùn)練,而這些要求有大量的斷口來(lái)保證學(xué)習(xí)和訓(xùn)練的質(zhì)量,基于此,提出了一種新的斷口圖像的識(shí)別方法:將脈沖耦合神經(jīng)網(wǎng)絡(luò)應(yīng)用到斷口識(shí)別當(dāng)中去。
20世紀(jì)90年代,Eckhorn提出了脈沖藕合神經(jīng)網(wǎng)絡(luò)的定義。它是借助貓的視覺(jué)原理構(gòu)建的簡(jiǎn)化神經(jīng)網(wǎng)絡(luò)模型,與BP網(wǎng)絡(luò)和Kohonen神經(jīng)網(wǎng)絡(luò)相比,PCNN無(wú)需訓(xùn)練、學(xué)習(xí),就能在復(fù)雜的背景下提取所需信息,具有同步脈沖發(fā)放和全局耦合的特點(diǎn),在信號(hào)形式及處理機(jī)制更符合人類的視覺(jué)神經(jīng)系統(tǒng)生理學(xué)基礎(chǔ)。
因此在斷口數(shù)量較少的情況下,將斷口圖片輸入到PCNN中進(jìn)行迭代處理,得到由PCNN輸出描述圖像信息的熵值序列、點(diǎn)火時(shí)間序列、特征時(shí)間序列;再根據(jù)點(diǎn)火時(shí)間序列的距離閾值判斷斷口差別;最后通過(guò)歐式距離的大小直接進(jìn)行斷口的識(shí)別。實(shí)驗(yàn)結(jié)果表明,該方法在斷口識(shí)別方面能取得良好的效果。
1 基于PCNN的斷口識(shí)別模型
1.1 PCNN基本原理
PCNN的基礎(chǔ)是Eckhorn的連接域模型[5]。PCNN神經(jīng)元模型主要由接受域、調(diào)制和脈沖產(chǎn)生三個(gè)部分構(gòu)成。
接收部分接收到來(lái)自其他神經(jīng)元與外部的刺激輸入后,利用鏈接輸入通道L或饋送輸入通道F來(lái)完成傳輸。這兩條通道,前者主要是對(duì)相鄰神經(jīng)元輸出脈沖進(jìn)行局部抽樣,一般情況下鏈接接收域的半徑極小。而相比之下,F(xiàn)通道會(huì)隨著時(shí)間的延續(xù)對(duì)脈沖響應(yīng)函數(shù)的變化比較緩慢,對(duì)應(yīng)著外界的輸入。鏈接輸入L加上一個(gè)正的偏移量,再與饋送輸入相乘構(gòu)成內(nèi)部活動(dòng)項(xiàng)U。一個(gè)衰減的內(nèi)部閾值H與一個(gè)階躍函數(shù)共同構(gòu)成了脈沖發(fā)生器。
非線性連接調(diào)制部分:也即神經(jīng)元內(nèi)部活動(dòng)項(xiàng),反饋輸入和加有偏置權(quán)值的線性連接部分相乘能獲得此項(xiàng)。
脈沖產(chǎn)生部分: 內(nèi)部活動(dòng)項(xiàng)的大小能是否能大于動(dòng)態(tài)激發(fā)門(mén)限,往往決定著脈沖是否產(chǎn)生,如果神經(jīng)元輸出狀態(tài)發(fā)生變化,這個(gè)門(mén)限也會(huì)隨之變化。
從神經(jīng)元本身的構(gòu)成來(lái)看,脈沖耦合神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)的反饋型神經(jīng)網(wǎng)絡(luò)比起來(lái),前者的特色化性能就顯而易見(jiàn),這就使PCNN具備變閾值、強(qiáng)自適應(yīng)、同步脈沖發(fā)放等特性,在處理圖像時(shí),這些性能都能發(fā)揮很好作用。脈沖耦合神經(jīng)網(wǎng)絡(luò)神經(jīng)元模型如圖1所示。
1.2 識(shí)別模型的建立
通過(guò)PCNN處理圖像的過(guò)程中,其基本單元脈沖耦合神經(jīng)元的個(gè)數(shù)與圖像中像素點(diǎn)的個(gè)數(shù)相當(dāng),也就是每一個(gè)像素點(diǎn)都有與之對(duì)應(yīng)的神經(jīng)元相連,而且神經(jīng)元和神經(jīng)元之間也是相連的。我們可以將PCNN模型簡(jiǎn)化為F通道,注意在強(qiáng)度上,F(xiàn)通道的輸入值也要和像素點(diǎn)相同,周圍神經(jīng)元著火次數(shù)的總和就是L通道的輸入值。
根據(jù)金屬斷口圖像的灰度值確定PCNN 模型的點(diǎn)火時(shí)間,灰度值會(huì)隨著點(diǎn)火時(shí)間的提前而增大,反之則越小。這樣一來(lái),各類斷口裂紋的特點(diǎn)很容易通過(guò)脈動(dòng)輸出序列構(gòu)成的二值圖像體現(xiàn)出來(lái),這就是所謂的通過(guò)PCNN 建立識(shí)別模型的原理。下面的公式就是PCNN離散形式的數(shù)學(xué)表達(dá)式:
Fij(n)=Iij(1)
Lij(n)=exp(-αL)Lij(n-1)+VL■Wij,mnYmn(n-1) (2)
Uij(n)=Fij(n)*(1+βlij(n))(3)
θij(n)=exp(-αθ)θij(n-1)+VθYij(n-1) (4)
Yij(n)=1,Uij(n)>θij(n)0,其它 (5)
上式中的神經(jīng)元與周圍連接的范圍可取3×3或5×5的數(shù)值,用m,n來(lái)代替,而外部輸入刺激信號(hào)則用Iij表示;Lij(n)表示連接輸入,F(xiàn)ij(n)表示反饋輸入。PCNN神經(jīng)元接受Lij(n)及Fij(n),再在其內(nèi)部神經(jīng)元活動(dòng)系統(tǒng)構(gòu)成Uij(n),即內(nèi)部活動(dòng)項(xiàng)(模型中偏移量規(guī)整為1,β為鏈接強(qiáng)度系數(shù))。如果動(dòng)態(tài)門(mén)限θij(n-1)達(dá)不到Uij(n)的數(shù)值,PCNN就會(huì)產(chǎn)生輸出時(shí)序脈沖序列Yij(n)。
2 基于PCNN的斷口識(shí)別方法研究
2.1 特征提取
斷口圖像點(diǎn)火的神經(jīng)元總數(shù)為g(n)[6],則:
g(n)=■Yij(n) (6)
式中,Yij(n)是在n時(shí)刻點(diǎn)火神經(jīng)元Nij的輸出,點(diǎn)火時(shí)刻信號(hào)g(n)統(tǒng)計(jì)了n時(shí)刻PCNN發(fā)出脈沖的神經(jīng)元總數(shù),也就是每次迭代時(shí)整個(gè)圖像中點(diǎn)火的神經(jīng)元的總數(shù)。
Yij(n)涵蓋了圖像中相鄰像素之間的相對(duì)位置和圖像灰度分布的相關(guān)信息,充分體現(xiàn)出紋理圖像的特點(diǎn)。如果圖像的斷口不相同,就會(huì)出現(xiàn)不同的紋理,每幅斷口圖的時(shí)間序列都各具特色,其具有某種不變性,整個(gè)斷口圖的內(nèi)在特征也就能通過(guò)這一個(gè)特點(diǎn)反映出來(lái),這個(gè)特點(diǎn)完全能作為一個(gè)特征向量用于分類和識(shí)別,可將其輸入模式識(shí)別單元來(lái)識(shí)別。
2.2 PCNN模型的參數(shù)設(shè)置
操作人員一定要在同一參數(shù)模型下處理金屬斷口圖像,以確保最終獲得為宜的PCNN 輸出時(shí)間序列。假設(shè)Fn(PCNN模型的點(diǎn)火次數(shù))是45,Y、L、U初值都是0,歸一化以后的灰度值用S來(lái)代替,屬于[0,1],r(連接域半徑)取1.5,W(內(nèi)部連接矩陣)與M相同,為3*3的方陣:其中每一個(gè)元素?cái)?shù)值都是中心像素到四周像素的歐幾里德距離的平方的倒數(shù),則:
Mxy=[E(pij-pxy)2]-1 (7)
式中,中心像素點(diǎn)的坐標(biāo)、周圍像素點(diǎn)坐標(biāo)和所求數(shù)值分別用Pxy、Pij、Mxy表示。表1給出了其他的參數(shù)。
2.3 識(shí)別原理及方法
PCNN第n次點(diǎn)火時(shí)輸出二值圖Yij(n)的熵是Hn(p)。Hn(p)數(shù)值可以作為圖像統(tǒng)計(jì)特性的表現(xiàn)形式之一,將圖像包含信息量的大小體現(xiàn)出來(lái)。具體地也就是PCNN 在每次循環(huán)迭代運(yùn)算時(shí),計(jì)算分割輸出的二值圖像Y(n)的熵值Hn(p)。
H(p)=-p1*log■■log■■(8)
P1、P0分別表示Y(n)中像素為1、為0的概率。
對(duì)斷口圖像的識(shí)別,首先把斷口圖像送入PCNN模型,借助PCNN的圖像分割能力和輸出圖像Y(n)熵序列的性質(zhì),進(jìn)行特征提取,將輸出熵序列作為特征向量,將輸出熵序列與存儲(chǔ)的模板標(biāo)準(zhǔn)熵序列進(jìn)行對(duì)比,計(jì)算二者的歐氏距離,然后就可以根據(jù)距離的大小直接進(jìn)行斷口的識(shí)別(當(dāng)然也可以用其它分類器進(jìn)行分類),這里歐式距離定義為:
MSE=[∑(g0(n)-g1(n))2]■(9)
其中g(shù)0(n)、g1(n)分別表示標(biāo)準(zhǔn)熵序列和實(shí)際輸出的熵序列的值。
3 實(shí)驗(yàn)研究
實(shí)驗(yàn)樣本采用的是典型斷口圖像,如圖2~圖4典型斷口圖像樣本所示,依次為解理斷口、疲勞斷口和塑坑斷口。從這三種斷口圖像中分別提取10幅128×128的灰度圖像,作為訓(xùn)練樣本,任意取出三種斷口圖像中的各兩幅,得到Bandelet熵,任意取出三種斷口圖像中的兩幅的Bandelet熵,進(jìn)行兩步判斷:
第一步判斷,通過(guò)PCNN輸出斷口圖像的點(diǎn)火神經(jīng)元序列。設(shè)定閾值T為0.45。計(jì)算任意兩種斷口圖像Bandelet熵的歐式距離。如果得到的歐式距離大于閾值,就判定神經(jīng)元序列所屬的斷口圖像屬于兩種不同的斷口類型,可以進(jìn)行第二步判斷,確定其斷口種類;如果得到的歐式距離不大于閾值,就說(shuō)明這兩種斷口類型一樣,就停止判斷。通過(guò)這種判斷,這三種斷口圖像就可以被分成三類。第二步判斷,將被分成三類的斷口圖像的熵序列與存儲(chǔ)的模板標(biāo)準(zhǔn)熵序列進(jìn)行對(duì)比,計(jì)算二者的歐氏幾何距離,若是歐式距離很大,則說(shuō)明是不同類斷口;若歐式距離很小,則說(shuō)明是同類斷口,以此,就可以清楚的分辨出三種不同類型的斷口。
實(shí)驗(yàn)結(jié)果如下:
通過(guò)實(shí)驗(yàn),發(fā)現(xiàn)斷口圖像經(jīng)過(guò)PCNN之后,輸出熵序列和模式庫(kù)中的其他斷口圖像的輸出熵序列的歐氏距離很大,與自己所屬模式的輸出熵序列的歐氏距離最小。據(jù)此可以進(jìn)行不同斷口的模式識(shí)別工作。經(jīng)過(guò)大量的實(shí)驗(yàn)驗(yàn)證,本文算法對(duì)不同斷口圖像均可達(dá)到90%以上的正確識(shí)別率。本文所用方法與BP神經(jīng)網(wǎng)絡(luò)等相比,不需要學(xué)習(xí)或者訓(xùn)練,能夠節(jié)省大量時(shí)間的同時(shí)還能減少對(duì)實(shí)驗(yàn)樣本的需求,實(shí)驗(yàn)證明該方法切實(shí)有效。
4 結(jié)論
基于PCNN不需要學(xué)習(xí)或者訓(xùn)練,能從復(fù)雜背景下提取有效信息,并且具有同步脈沖發(fā)放等特性,本文將PCNN引入到金屬斷口圖像的識(shí)別中,提出了一種基于PCNN的金屬斷口識(shí)別方法,通過(guò)以上仿真實(shí)驗(yàn),說(shuō)明該方法在斷口識(shí)別中取得了良好的效果,特別是在斷口樣本較少的情況下,解決了BP網(wǎng)絡(luò)等需要大量樣本學(xué)習(xí)和訓(xùn)練的問(wèn)題,顯示了該方法在斷口識(shí)別方面的獨(dú)到之處,。但是,關(guān)于PCNN在識(shí)別領(lǐng)域的進(jìn)一步應(yīng)用還有待于研究和探討,尤其在實(shí)驗(yàn)裝置結(jié)構(gòu)上也可以做更多的改進(jìn)和優(yōu)化,使該算法更適用于實(shí)時(shí)處理系統(tǒng)。
參考文獻(xiàn):
[1]K Minoshima,T Nagasaki,K Komai. Automatic Classification of Fracture Surface Morphology Using Computer Image Processing Technique,Trans.Jpn.Soc.Mech.Eng,1990,56(525):1318-1328.
[2]K Komai,K Minoshima,S Ishii. Recognition of Different Frature Surface Morphologies Using Computer Image Processing Technique. JSME.Int.J,Ser.A.1993,36(2):220.
[3]K Minoshi,T Nagosaki. Automatic Classification of Fracture Surface Morphology Using Computer Image Processing Technique. Jpn. Soc. Mesh.Eng,1993,373.
無(wú)損檢測(cè)技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金項(xiàng)目ZD200829003資助。
作者簡(jiǎn)介:莊心生,男,1975年9月生,機(jī)械工程師。