岳荷荷 張麗 劉彩玲
摘 要:作為一種新型神經(jīng)網(wǎng)絡(luò),單節(jié)點的儲備池計算由于其結(jié)構(gòu)簡單、易于實現(xiàn)、處理速度快且數(shù)據(jù)容量大,近年來越來越受到學(xué)者們的關(guān)注。目前基于混沌儲備池計算的圖像識別研究中,主要是對0~9這10個手寫數(shù)字進行簡單識別。使用Matlab工具對Mackey-Glass混沌電路儲備池計算進行了仿真,首次對較復(fù)雜的圖片即種子圖像識別進行了研究。通過探索模型中各參數(shù)對系統(tǒng)結(jié)果的影響,最終將模型中的參數(shù)設(shè)置為p=7,?=3,?=20。首先嘗試對2種不同類型的種子圖片進行識別,取得了準(zhǔn)確率為100%的識別效果;隨后將種子類別增至5,取得了準(zhǔn)確率為90%的識別效果;最后將種子類別增至10及以上,識別準(zhǔn)確率降至80%,但仍有較好的識別效果。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);混沌儲備池計算;種子圖像識別;Matlab;識別準(zhǔn)確率;無損檢測
中圖分類號:TP183文獻標(biāo)識碼:A文章編號:2095-1302(2019)03-00-04
0 引 言
儲備池計算(Reservoir Computing)是對傳統(tǒng)遞歸神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法的改進[1],主要包含一個由大規(guī)模稀疏連接的模擬神經(jīng)元構(gòu)成的隨機網(wǎng)絡(luò)結(jié)構(gòu),即“儲備池”。但是儲備池在產(chǎn)生時的隨機性也成為了制約儲備池實際應(yīng)用的一個重要因素,因此在實際應(yīng)用中,歐盟的一個科研項目組提出了一種由單個節(jié)點和一段延時線構(gòu)成的儲備池[2]。儲備池計算方法一經(jīng)提出,就在不同領(lǐng)域得到了廣泛應(yīng)用,比如時間序列預(yù)測[3-5]、模式分類[6-7]、圖像處理[8-9]等。
目前的混沌儲備池計算主要有混沌電路儲備池計算、光電儲備池計算、全光儲備池計算和光電波長混沌儲備池計算[10]。這幾類混沌儲備池計算的應(yīng)用主要集中在時間序列預(yù)測[11]、波形識別[12]、光分組頭識別[13]和手寫數(shù)字識別[14]等方面。手寫數(shù)字識別主要基于0~9這10個比較簡單且特征值明顯的圖片,識別準(zhǔn)確率為87%。本文通過對電路混沌儲備池計算的模擬仿真,首次對較復(fù)雜的圖片進行了特征值提取,并實現(xiàn)了對10種不同種子圖像的識別。
1 Mackey-Glass混沌儲備池計算模型
傳統(tǒng)的儲備池計算模型如圖1所示,包括輸入層、儲備池和輸出層三部分。輸入層的數(shù)據(jù)在進入儲備池之前會進行固定的加權(quán)處理,中間的儲備池部分由隨機生成的節(jié)點構(gòu)成,節(jié)點之間的連接權(quán)重固定。唯有儲備池到輸出層之間的連接權(quán)重是根據(jù)訓(xùn)練所得。
對傳統(tǒng)的儲備池計算進行簡化后,由單個非線性節(jié)點和一段延時線構(gòu)成的儲備池計算原理模型如圖2所示。與傳統(tǒng)儲備池不同,這種形式的儲備池結(jié)構(gòu)簡單,易于實現(xiàn),同樣只需在輸出層對權(quán)值進行訓(xùn)練。其中的非線性節(jié)點可以通過電路設(shè)備、光電設(shè)備等實現(xiàn)。本文主要對基于電路非線性節(jié)點的混沌儲備池計算進行了仿真,借助非線性節(jié)點由Mackey-Glass混沌電路實現(xiàn)。
Mackey-Glass混沌儲備池計算中的儲備池由電子器件構(gòu)成非線性節(jié)點實現(xiàn)[2],混沌電路儲備池計算系統(tǒng)的構(gòu)成如圖3所示。圖中的輸入數(shù)據(jù)I(t)在輸入層與模板M一起進行預(yù)處理,即加模板操作,之后再被轉(zhuǎn)換為串行數(shù)據(jù)加入增益后輸入至電路儲備池中。電路儲備池對數(shù)據(jù)進行數(shù)模轉(zhuǎn)換后經(jīng)過作為非線性節(jié)點的混沌電路產(chǎn)生系統(tǒng)狀態(tài),再利用放大器和濾波器對數(shù)據(jù)進行放大和濾波后轉(zhuǎn)換為數(shù)字信號。數(shù)字信號經(jīng)延時τ后與輸入信號結(jié)合反饋給混沌電路。從系統(tǒng)的延時線中將系統(tǒng)狀態(tài)取出后進行訓(xùn)練獲得訓(xùn)練權(quán)值Wi,再進行濾波和判決等后期處理最終得到輸出y(t)。
在混沌電路儲備池計算中,利用Mackey-Glass延時反饋振蕩器來描述整個系統(tǒng),其數(shù)學(xué)模型見式(1)[2]:
2 種子圖像識別的實現(xiàn)過程
本文選取了10種不同種子的圖片,每張種子圖片均從不同的角度拍攝,能夠全方位反映該種子的特性。具體圖片如圖4所示(本文使用的每個種子圖片為40張,共400張圖片,這里只對部分圖片進行展示)。
2.1 特征提取
特征提取是圖像識別中的一個重要步驟,通過映射或變換的方法將模式空間的高維特征轉(zhuǎn)換為特征空間的低維特征。通過特征提取可以將系統(tǒng)要處理的數(shù)據(jù)量降低,從而提高系統(tǒng)的學(xué)習(xí)效率和識別準(zhǔn)確率。與普通的神經(jīng)網(wǎng)絡(luò)一樣,儲備池計算在對數(shù)據(jù)進行處理前也需要對初始數(shù)據(jù)進行特征提取。不同的地方在于,儲備池計算對數(shù)據(jù)進行特征提取時,實質(zhì)上是對數(shù)據(jù)進行了稀疏化處理,即圖3中的預(yù)處理。
本文在對種子圖像數(shù)據(jù)進行處理時,只使用了其灰度值。在提取了種子圖片的灰度圖像數(shù)據(jù)后,利用一個模板矩陣M對數(shù)據(jù)進行提取。比如將圖像進行灰度化處理后所得到的圖像數(shù)據(jù)為一個大小為110×80的矩陣,模板矩陣(模板矩陣中只包含了三個值,即0,0.51和0.49,并且0所占比例達80%)設(shè)置為200×110(模板矩陣中的200與系統(tǒng)中的時延相互對應(yīng)),將模板矩陣與圖像數(shù)據(jù)矩陣相乘,即特征提取后形成的矩陣大小為200×80。所得矩陣便是特征提取的結(jié)果。
2.2 仿真及訓(xùn)練過程
本文通過Matlab對式(3)的模型進行仿真。當(dāng)不存在外部輸入時,優(yōu)于存在延時反饋,Mackey-Glass延時反饋振蕩器仍然能表現(xiàn)出其非線性特征。圖5~圖8分別給出了當(dāng)延時反饋系數(shù)η不變時,系統(tǒng)波形隨著非線性系數(shù)p的改變而產(chǎn)生的變化。從圖中可以看出,當(dāng)p=3時,系統(tǒng)產(chǎn)生的波形的非線性特征已基本不存在;當(dāng)p=5時,非線性特征存在但不太明顯;隨著p值的增加,系統(tǒng)的非線性特征也表現(xiàn)得更加強烈。本文在使用Mackey-Glass混沌儲備池計算時主要利用系統(tǒng)的非線性特征,因此在仿真中選擇p的值為7,反饋系數(shù)值為3。
對種子圖片進行識別時,本文選取了10個種子,每個種子都有40張圖片。在對每張種子圖片進行預(yù)處理后,得到一個200×80的矩陣,該矩陣便是式(3)中的J(t)。將經(jīng)過Mackey-Glass混沌模型所得的數(shù)據(jù)進行訓(xùn)練。在對圖像進行識別時,本文首先對10個種子進行1~10編號,并給出每張圖片識別后相應(yīng)的期望值。隨機抽取其中的380組數(shù)據(jù)進行訓(xùn)練,用20組數(shù)據(jù)進行測試??紤]到非線性系統(tǒng)的延遲時間對系統(tǒng)狀態(tài)的影響,本文選取了200個虛擬節(jié)點進行仿真,每個節(jié)點之間的時間間隔為歸一化系統(tǒng)響應(yīng)時間T的1/5,即θ=0.2。
3 仿真結(jié)果及分析
判斷儲備池計算實現(xiàn)圖像識別的性能指標(biāo),歸一化均方根誤差(Normalized Root of Mean Square Error,NRMSE),表達式見式(4)[2]:
在實現(xiàn)對種子圖像識別的過程中,本文首先對兩個種子的圖片進行了識別,其中使用每個種子的圖片40張,訓(xùn)練所用的圖片比例為80%,測試所用的圖片比例為20%,所得的測試結(jié)果中NRMSE=0.082 1,經(jīng)winnertakesall算法[15]優(yōu)化計算后,識別正確率為100%,識別結(jié)果如圖9所示。其中圖片中的縱坐標(biāo)表示2個種子的不同編號(1和2),每個序號所對應(yīng)的條狀圖為矩陣圖中值的大小,當(dāng)顏色越接近紅色時,說明矩陣中的值越大。圖中的上半部分表示期望輸出的結(jié)果,下半部分則是對應(yīng)的測試結(jié)果。
在對2個種子的圖片識別取得很好的識別效果后,本文將種子的類別增加至5個,使用每個種子的圖片40張,訓(xùn)練所用的圖片比例為80%,測試所用的圖片比例為20%,所得的測試結(jié)果中NRMSE=0.082 1,經(jīng)winnertakesall算法優(yōu)化計算后,識別正確率為90%,識別結(jié)果如圖10所示。其中圖片中的縱坐標(biāo)表示5個種子的不同編號(1~5),每個序號所對應(yīng)的條狀圖為矩陣圖中值的大小,當(dāng)顏色越接近紅色時,說明矩陣中的值越大。圖中的上半部分表示期望輸出的結(jié)果,下半部分則是對應(yīng)的測試結(jié)果。
在對5個種子的圖片識別取得很好的識別效果后,本文將種子的類別增加至10個,使用每個種子的圖片40張,訓(xùn)練所用的圖片比例為80%,測試所用的圖片比例為20%,所得的測試結(jié)果中NRMSE=0.082 1,經(jīng)winnertakesall算法優(yōu)化計算后,識別正確率為80%,識別結(jié)果如圖11所示。其中圖片中的縱坐標(biāo)表示10個種子的不同編號(1~10),每個序號所對應(yīng)的條狀圖為矩陣圖中值的大小,當(dāng)顏色越接近紅色時,說明矩陣中的值越大。圖中的上半部分表示期望輸出的結(jié)果,下半部分則是對應(yīng)的測試結(jié)果。從圖中可以看出,測試結(jié)果和期望結(jié)果基本相同。當(dāng)然,在測試結(jié)果中使用winnertakesall算法計算后,測試結(jié)果可以直接作為結(jié)果輸出。在使用混沌電路儲備池計算對種子圖像進行識別時,識別正確率可達80%。
對比以上識別結(jié)果可以看出,隨著種子類別的增加,識別準(zhǔn)確率逐漸下降。主要是由于種子類別有所增加但每個種子的圖片數(shù)量卻并未增加,導(dǎo)致系統(tǒng)中某幾類相似種子圖片的細(xì)節(jié)無法體現(xiàn),從而增加了識別難度。
4 結(jié) 語
本文通過Matlab軟件對Mackey-Glass混沌電路儲備池計算進行了仿真,首次對較復(fù)雜的圖片即種子圖像識別進行了研究。分別研究了識別種子從2類增至5類再增至10類時的情形,取得了識別準(zhǔn)確率為100%,90%和80%的結(jié)果。主要原因在于本文使用的種子圖片數(shù)量有限,如果適當(dāng)加大測試所用的圖片數(shù)量,便可以提高識別準(zhǔn)確率。另外,本文在識別圖片時只提取了圖片的灰度值,未考慮圖片中不同種子的顏色這一參數(shù),如果將種子的顏色也作為識別種子圖片的參數(shù),將可以得到更好的識別效果。
參 考 文 獻
[1] VERSTRAETEN D,SCHRAUWEN B,HAENE M D,et al. An experimental unification of reservoir computing methods[J]. Neural networks,2007,20(3):391-403.
[2] APPELTANT L,SORIANO M C,SANDE G V,et al. Information processing using a single dynamical node as complex system[J].Nature communications,2011(2):468.
[3] SHI Z,HAN M. Support vector echo-state machine for chaotic time-series prediction[J]. IEEE transactions on neural networks,2007,18(2):359-372.
[4]史志偉,韓敏.ESN嶺回歸學(xué)習(xí)算法及混沌時間序列預(yù)測[J].控制與決策,2007,22(3):258-261.
[5]韓敏,王亞楠.基于Kalman濾波的儲備池多元時間序列在線預(yù)報器[J].自動化學(xué)報,2010,36(1):169-173.
[6] JAEGER H,LUKO?EVI?IUS M,POPOVICI D,et al. Optimization and applications of echo state networks with leaky-integrator neurons[J]. Neural networks,2007,20(3):335-352.
[7] EMBRECHTS M J,ALEXANDRE L A,LINTON J D. Reservoir computing for static pattern recognition[C]// Esann 2009,European Symposium on Artificial Neural Networks,Bruges,Belgium,April 22-24,2009,Proceedings. DBLP,2009:101-124.
[8] VERSTRAETEN D,SCHRAUWEN B,STROOBANDT D,et al. Isolated word recognition with the liquid state machine: a case study[J]. Information processing letters,2005,95(6):521-528.
[9]裴承丹.回聲狀態(tài)網(wǎng)絡(luò)及其在圖像邊緣檢測中的應(yīng)用[J].計算機工程與應(yīng)用,2008,44(19):172-174.
[10]趙清春,殷洪璽.混沌光子儲備池計算研究進展[J].激光與光電子學(xué)進展,2013,50(3):23-29.
[11]梁曄.基于儲備池計算的混沌時間序列預(yù)測方法研究[D].蘭州:蘭州大學(xué),2012.
[12]包秀榮,岳荷荷,殷洪璽,等.基于Mackey-Glass混沌儲備池計算的多波形識別[J].大連理工大學(xué)學(xué)報,2018,58(2):174-179.
[13]靳雨.光電反饋混沌儲備池計算及其識別應(yīng)用的研究[D].大連:大連理工大學(xué),2016.
[14]秦杰.基于光反饋混沌儲備池計算的分組頭識別研究[D].大連:大連理工大學(xué),2017.
[15] HELLMAN J S. Winners take all: the politics of partial reform in postcommunist transitions[J].World politics,1998,50(2):203-234.