王曉娟,楊永昕(.四川外國語大學 重慶南方翻譯學院,重慶 400;. 中國兵器工業(yè)北方勘察設(shè)計研究院有限公司,石家莊 0500)
?
Hopfield網(wǎng)絡(luò)對手寫體數(shù)字識別的改進方法
王曉娟1,楊永昕2
(1.四川外國語大學 重慶南方翻譯學院,重慶 401120;2. 中國兵器工業(yè)北方勘察設(shè)計研究院有限公司,石家莊 050011)
摘 要:計算機的功能非常強大,在處理圖片方面也具有很好的性質(zhì)。手寫體圖片的研究,在考古等方面有著重要的作用。本文的手寫體圖片是經(jīng)多數(shù)人書寫,保證了樣本的差異性。在圖片識別處理時,選用了識別性能較強的離散Hopfield網(wǎng)絡(luò),并針對Hopfield網(wǎng)絡(luò)的特點,對手寫體圖片的進行中心歸一化處理的改進,提高了識別效率。
關(guān)鍵詞:中心歸一化;Hopfield網(wǎng)絡(luò);圖像識別
神經(jīng)網(wǎng)絡(luò)是應用很廣的一門學科,是因為其有著自身的優(yōu)越性:神經(jīng)網(wǎng)絡(luò)是自適應的[1],它能從數(shù)據(jù)中自動地學習到解決問題的知識。神經(jīng)網(wǎng)絡(luò)具有容錯性[2],既能夠處理與訓練集中相同的數(shù)據(jù),又能夠處理不完整的數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)能夠獲取系統(tǒng)中復雜輸入變量的相互關(guān)系。神經(jīng)網(wǎng)絡(luò)的識別方法可以看成是一種介于統(tǒng)計模式識別[3]與結(jié)構(gòu)模式識別[4]之間的方法,既具有統(tǒng)計模式識別的優(yōu)點,又吸收了結(jié)構(gòu)模式識別的長處。Hopfield神經(jīng)網(wǎng)絡(luò)的一個很重要的網(wǎng)絡(luò),本文主要研究其在手寫體數(shù)字識別方面的作用。
2.1 離散 Hopfield網(wǎng)絡(luò)的工作原理
Hopfield網(wǎng)絡(luò)是單層全反饋網(wǎng)絡(luò)[5]。根據(jù)激活函數(shù)的不同,可分為離散型Hopfield網(wǎng)絡(luò)和連續(xù)性Hopfield網(wǎng)絡(luò)。本文用的是離散型Hopfield網(wǎng)絡(luò)。它的激活函數(shù)為二值性函數(shù),即ai=sgn(ni),i=1,2,…r。輸入輸出為{0,1}的網(wǎng)絡(luò),主要用于聯(lián)想記憶。該網(wǎng)絡(luò)為單層全反饋網(wǎng)絡(luò),所以每個神經(jīng)元的輸入和其他神經(jīng)元的輸出是相連的,所以,其輸入數(shù)目和神經(jīng)元的輸出數(shù)目是相等的。即輸入和輸出都有s個。
2.2 離散Hopfield網(wǎng)絡(luò)的海布學習規(guī)則[5]
在離散Hopfield網(wǎng)絡(luò)的訓練過程中,運用的是海布調(diào)節(jié)規(guī)則:當神經(jīng)元輸入與輸出節(jié)點的狀態(tài)相同(即同時興奮或抑制)時,從第j個神經(jīng)元到第i個神經(jīng)元之間的連接強度增強,否則減弱。海布規(guī)則是一種無指導的學習算法。
本文所用的手寫體都是在XP系統(tǒng)的畫板里面輸入的,且數(shù)字的像素是28×28,也就是說,每個手寫體數(shù)字都是一個28×28的矩陣。
3.1 圖片處理前
當我們不對圖片進行處理的時候,用離散Hopfield網(wǎng)絡(luò),我們給出網(wǎng)絡(luò)對手寫體數(shù)字識別的正確情況。
表1 Hopfield網(wǎng)絡(luò)各個數(shù)字的識別正確率
從上表可以看出,識別結(jié)果并不理想。數(shù)字3、8、9不能被識別,2、3、0的識別正確率也只有20%。
3.2 圖片處理后
本文中,這些手寫體圖片都是在電腦XP系統(tǒng)的畫圖工具人為輸入的。圖像的大小都是28×28。由于輸入時,圖片在所輸入?yún)^(qū)域位置不一樣,圖片本身的大小也不一樣,而這對識別的結(jié)果的好壞有直接的影響。所以,本文就這兩方面做了改進。具體的做法是,先提取圖片數(shù)字的邊緣,即數(shù)字的最左、最右、最上、最下的邊界點,這樣我們就把圖片中有數(shù)字的區(qū)域提取了出來,之后把提取的部分擴大成我們定義的標準尺寸。然后將擴大后的圖片放在我們固定大小的模板上。這樣經(jīng)過處理后,圖片的數(shù)字都在一定區(qū)域內(nèi)。而且圖片并不失真。
對圖片進行中心歸一化后,我們用已經(jīng)訓練好的Hopfield網(wǎng)絡(luò)檢驗識別情況,識別結(jié)果若下表
表2 Hopfield網(wǎng)絡(luò)各個數(shù)字的識別正確率
我們對比表1和表2,可以看出,對圖片進行歸一中心化處理后,識別的正確率明顯提高了,比未處理的圖片各個數(shù)字的正確率都有提高,達到了我們的預期效果。
參考文獻:
[1]蔡慧娟,范志宏.基于神經(jīng)網(wǎng)絡(luò)的自適應控制[J].電子科學期刊,2008.
[2]張濤.人工神經(jīng)網(wǎng)絡(luò)容錯性分析與設(shè)計的理論和應用[D].清華大學,1999.
[3]Chi Hau Chen,PeiGee Peter Ho. Statistical pattern recogni tion in remote sensing [J].Pattern Recognition,2008.
[4]譚建榮,岳小莉,陸國棟.圖形相似的基本原理、方法及其在結(jié)構(gòu)模式識別中的應用[J].計算機學報,2002.
[5]從爽.面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應用(3版)[M].合肥:中國科學技術(shù)大學出版社,2003:118,160.
DOI:10.16640/j.cnki.37-1222/t.2016.12.118
作者簡介:王曉娟(1985-),女,河北張家口人,研究生,助教,研究方向:神經(jīng)網(wǎng)絡(luò)。