• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      PNN在手寫體數(shù)字識別中的應用

      2016-10-26 00:52:37幸堅炬李軍謝贊福
      現(xiàn)代計算機 2016年23期
      關鍵詞:手寫體訓練樣本識別率

      幸堅炬,李軍,謝贊福

      (廣東技術師范學院計算機科學學院,廣州510665)

      PNN在手寫體數(shù)字識別中的應用

      幸堅炬,李軍,謝贊福

      (廣東技術師范學院計算機科學學院,廣州510665)

      稅務、金融等經(jīng)濟領域的手寫體數(shù)字信息通過計算機進行自動識別處理,可以節(jié)省人力、物力和財力,具有較高的實用價值。介紹概率神經(jīng)網(wǎng)絡的基本原理,并將概率神經(jīng)網(wǎng)絡應用于手寫體數(shù)字識別中,在一定的訓練樣本和網(wǎng)絡擴散速度情況下,實現(xiàn)基于概率神經(jīng)網(wǎng)絡的手寫體數(shù)字識別。通過MATLAB對MNIST手寫體數(shù)據(jù)庫數(shù)據(jù)進行仿真實驗驗證,結果表明概率神經(jīng)網(wǎng)絡在手寫體數(shù)字識別中能夠取得較高的識別率,使用的算法可行有效。

      概率神經(jīng)網(wǎng)絡;手寫體數(shù)字識別;貝葉斯決策理論;圖像識別

      0 引言

      光學字符識別技術(Optical Character Recognition,OCR)中的手寫體數(shù)字識別技術,其主要識別0-9共10個字符,分類的類別比光學字符識別少得多[1]。近年來,伴隨著計算機技術和模式識技術的不斷發(fā)展,手寫體數(shù)字識別在郵政編碼識別、財務金額識別、稅表識別、電子商務數(shù)字處理、甚至是學生成績單識別等方面得到了廣泛應用[2]。盡管模式識別技術不斷發(fā)展,各種各樣的分類器不斷出現(xiàn),但目前依然沒有一種算法能夠達到完美的效果。

      具有強大的自學能力、自適應性、分類能力、容錯能力和快速識別等特點的人工神經(jīng)網(wǎng)絡備受人們的關注,并且在字符識別中得到了廣泛應用[3]。本文將概率神經(jīng)網(wǎng)絡(Probabilistic Neural Networks,PNN)[4]應用于手寫體數(shù)字識別中,并使用MNIST數(shù)據(jù)庫進行了實驗驗證。實驗結果表明,基于概率神經(jīng)網(wǎng)絡的手寫體數(shù)字識別得到了較好的識別率。

      1 概率神經(jīng)網(wǎng)絡(PNN)的基本原理

      D.F.Specht博士在1989年提出了一種概率神經(jīng)網(wǎng)絡。這種概率神經(jīng)網(wǎng)絡的結構簡單,算法設計比較容易,可以用線性的學習算法實現(xiàn)非線性學習算法的功能,廣泛應用于模式分類的問題中[5]。

      1.1貝葉斯分類器

      概率神經(jīng)網(wǎng)絡以貝葉斯決策理論為基礎。貝葉斯分類器的基本原理就是根據(jù)某對象的先驗概率,在有先驗概率的情況下,根據(jù)貝葉斯的計算公式可以得到其后驗概率,即該對象屬于哪一類,最后選擇后驗概率最大的類作為該對象所屬的類[6-7]。

      這里我們把問題簡化為兩個類別(A1和A2)問題,對于A1和A2它們的先驗概率分別為h1和h2,并且滿足h1+h2=1。在一個向量需要分類時,我們先計算向量的后驗概率,進行分類的依據(jù)是哪個類別的后驗概率大就將向量分到其中。假定x為輸入向量,p(A1|x)為x發(fā)生情況下A1的后驗概率,我們根據(jù)貝葉斯公式可以得出A1的后驗概率為:

      但是在實際應用中會存在損失與風險問題,有可能將應該屬于A1的樣本錯誤的分到了A2中,或者是將A2中的樣本錯誤的分到了A1中,因此所造成的損失往往相差很大,因此需要對分類的規(guī)則進行調(diào)整。

      將向量指派到A1的動作我們假設為動作α1,輸入向量屬于A2時卻采取動作α1所造成的損失定義為λ,則執(zhí)行動作α1我們就把它叫做期望風險,期望風險用R表示。那么這時的判定規(guī)則就變成:當類別A1的期望風險大于A2的后驗概率時,將向量分類到類別A1中。調(diào)整后的規(guī)則變成:

      1.2概率神經(jīng)網(wǎng)絡的結構

      概率神經(jīng)網(wǎng)絡[8-9]四層結構分別為輸入層、隱含層、求和層和輸出層。第一層接收訓練樣本的值,神經(jīng)元個數(shù)與向量的長度相等。第二層隱含層接收輸入層傳過來的數(shù)據(jù),神經(jīng)元的節(jié)點個數(shù)與訓練樣本數(shù)相同,并且所有的節(jié)點都有一個中心點。在第三層求和層對同類別的隱含層的輸出做加權平均,一個神經(jīng)元與一個相應的類別對應。最后一層是輸出層,對閾值進行判斷,把最大的后驗概率的神經(jīng)元輸出為1,其他的輸出為0。概率神經(jīng)網(wǎng)絡結構如圖1所示。

      圖1 PNN網(wǎng)絡的結構

      2 手寫體數(shù)字識別系統(tǒng)的實現(xiàn)

      在實際應用時,手寫體數(shù)字一般是以圖像的形式提供的。原始圖像通過輸入設備(如光電掃描儀、電子傳真機等)獲取圖像信息,獲得圖像后不能直接用于識別,需要進行預處理、字符分割、特征提取、選擇分類器等過程后,才開始進行手寫體數(shù)字識別[10]。如圖2手寫體數(shù)字識別的完整過程。

      2.1圖像預處理

      與大多數(shù)的圖像處理算法類似,數(shù)字識別的第一步是對圖像進行預處理。由于不同的輸入設備掃描得到的數(shù)字圖像通常情況下質(zhì)量不同,往往包含了各種各樣的噪聲,為了防止對后期的識別過程造成干擾,首先需要對圖像進行去噪、濾波等處理。此外,在數(shù)字識別中使用的是二值圖像。所以如果輸入的是灰度圖像,需要先對圖像進行二值化的過程,再做預處理。如果輸入的是彩色圖像,則需要先進行灰度化。

      由于預處理是為了提高后期的識別率,所以在整個手寫體數(shù)字識別中,對圖像進行預處理的重要性是不言而喻的。預處理的效果好,就可以提高手寫體數(shù)字的識別率和識別速度。反之,在后期的識別中將會出現(xiàn)許多的不良后果,如錯誤識別、拒絕識別等[11]。

      本文沒有完成圖2中的完整流程,而是直接加載MNIST數(shù)據(jù)庫進行實驗。

      圖2 手寫體數(shù)字識別流程

      2.2特征提取算法

      特征提?。?2]在手寫體數(shù)字識別的過程中很重要,提取特征有很多不同的方法,它對分類效果產(chǎn)生很大的影響。提取特征好將可以提高識別率。常用的手寫體數(shù)字特征有:結構特征和統(tǒng)計特征。結構特征在相似字區(qū)分方面具有較高的識別率。雖然結構特征反映了數(shù)字的幾何結構,體現(xiàn)了數(shù)字結構的本質(zhì)特征,但是容易受到外在因素的干擾。統(tǒng)計特征以二值或者灰度值點陣圖為基礎,經(jīng)過傅立葉描述子、小波變換等數(shù)學變換對數(shù)字圖像點陣進行提取特征。

      為了取得良好的識別效果,本文特征提取采取了結構特征與統(tǒng)計特征相結合的方式,共抽取了14維特征。其中結構特征8個,統(tǒng)計特征6個。構成一個長度為14的特征向量,用該特征向量代表了每一幅數(shù)字圖像[13]。

      2.3手寫體數(shù)字識別的實現(xiàn)

      不同的分類器有不用的特點。樸素貝葉斯分類器是各分量統(tǒng)計獨立時的最佳分類器;支持向量機是性能優(yōu)異、發(fā)展很快的一種分類器;人工神經(jīng)網(wǎng)絡,具有很強的并行性和自適應能力,具有實現(xiàn)任意非線性映射的能力。本實驗采用概率神經(jīng)網(wǎng)絡作為分類器,具有分類準確,速度快的優(yōu)點[14]。圖3為實驗中構建的概率神經(jīng)網(wǎng)絡結構圖。

      圖3 實驗中的概率神經(jīng)網(wǎng)絡圖

      網(wǎng)絡輸入層神經(jīng)元節(jié)點數(shù)與輸出向量維度相同,包含了14個神經(jīng)元。由于使用的訓練樣本個數(shù)是35000,所以在徑向基層中有35000個神經(jīng)元節(jié)點。第三層為隱含層,神經(jīng)元節(jié)點個數(shù)為分類的類別數(shù),因此等于10。分類類別決定了輸出層只包含一個神經(jīng)元。使用newpnn函數(shù)創(chuàng)建的網(wǎng)絡,輸出的類別是以向量的形式給出,例如輸出類別是第四類,則向量的表示形式為[0,0,0,1,0,0,0,0,0,0]T。

      概率神經(jīng)網(wǎng)絡有多少個訓練樣本就有多少個徑向基神經(jīng)元。每一次輸入新的樣本的時候都需要求出它在這個神經(jīng)元所在樣本的概率。之后輸出到隱含層中。得到所對應樣本的概率。最后根據(jù)最大的概率判斷輸出。

      3 實驗結果及分析

      實驗中使用包含了60000個訓練樣本和10000個測試樣本的MNIST數(shù)據(jù)庫[15]。從訓練庫中抽取35000張樣本輸入到網(wǎng)絡進行訓練,然后對測試庫中的10000張樣本進行測試實驗。在表1中我們可以發(fā)現(xiàn),在樣本數(shù)保持不變的情況下,不同網(wǎng)絡擴散速度的識別效果也有所不同。

      由表1可以看出,當網(wǎng)絡擴散速度選擇0.15時,識別率是最好的。在另外一組實驗中,當網(wǎng)絡擴散速度(0.15)確定時,輸入的樣本數(shù)比較少,訓練效果不理想,識別率也不高。不斷地增加訓練樣本的數(shù)量進行不同的實驗,發(fā)現(xiàn)樣本的增加與識別率成正比,如表2所示。所以,建立強大的樣本庫在整個識別過程中的地位是不言而喻的。在實際運用中采用更多的訓練樣本,識別率將會更高。

      表1 概率神經(jīng)網(wǎng)絡網(wǎng)絡擴散速度不同時的識別結果

      表2 概率神經(jīng)網(wǎng)絡訓練樣本個數(shù)不同時的訓練結果

      4 結語

      本文在對概率神經(jīng)網(wǎng)絡進行深入分析的基礎上,探索了概率神經(jīng)網(wǎng)絡用于手寫體數(shù)字識別的可行性和有效性。最后,通過MNIST手寫體數(shù)字庫進行實驗,結果表明,基于概率神經(jīng)網(wǎng)絡的手寫體數(shù)字識別方法基本能夠實現(xiàn)對手寫體數(shù)字的準確、快速識別,并且具有良好的抗干擾能力。進一步改進已有算法,在樣本數(shù)一定時,可以獲得更高的識別率和更快的識別速度。

      [1]楊淑瑩,等.圖像識別與項目實踐[M].北京:電子工業(yè)出版社,2015:70-80.

      [2]Basu S,Das N,Sarkar R,et al.Recognition of Numeric Postal Codes from Multi-script Postal Address Blocks[C].InternationalConference on Pattern Recognition and Machine Intelligence.Springer-Verlag,2009:381-386.

      [3]Impedovo S,Pirlo G,Modugno R,et al.Zoning Methods for Hand-Written Character Recognition:An Overview[C].International Conference on Frontiers in Handwriting Recognition.IEEE Computer Society,2010:329-334.

      [4]葛哲學,孫志強.神經(jīng)網(wǎng)絡理論與MATLAB R2007實現(xiàn)[M].北京:電子工業(yè)出版社,2007.

      [5]黃鋒.基于徑向基函數(shù)神經(jīng)網(wǎng)絡的圖像研究識別[D].山西:太原理工大學,2007:54-59.

      [6]孫萬錄.傾斜車牌定位與識別算法的研究[D].哈爾濱:哈爾濱理工大學,2013:13-18.

      [7]王華青.基于局部幾何保持的人臉圖像姿態(tài)估計[D].西安:西安電子科技大學,2013:2-20.

      [8]U.Guclu,Marcel A J,Van Gerven.Deep Neural Networks Reveal a Gradient in the Complexity of Neural Representations Across the Ventral Stream[J].Journal of Neuroscience the Official Journal of the Society for Neuroscience,2015,35(27):10005-10014.

      [9]B.Zhou,A.Lapedriza,J.Xiao,A.Torralba,and A.Oliva.Learning Deep Features for Scene Recognition using Places Database.Advances in Neural Information Processing Systems 27(NIPS2014).

      [10]李三平,岳振軍.基于概率神經(jīng)網(wǎng)絡的手寫體數(shù)字識別系統(tǒng)的MATLAB實現(xiàn)[J].軍事通訊技術,2005,26(1):54-57.

      [11]王亞坤,曾德良,李向菊.一種新穎的數(shù)字識別算法[J].電力科學與工程,2009,25(1):76-78.

      [12]N.Das,S.Basu,R.Sarkar,M.Kundu,M.Nasipuri,D.kumar Basu.An Improved Feature Descriptor for Recognition of Handwritten Bangla Alphabet,”Jan,2015.

      [13]蘇玉彬,潘保昌.基于神經(jīng)網(wǎng)絡的手寫體字符識別技術研究[D].廣州:汕頭大學,2003.

      [14]卜富清,王茂芝,于慶剛.基于BP神經(jīng)網(wǎng)絡的數(shù)字識別[J].長江大學學報(自然科學版),2009,6(2):293-294.

      [15]李瓊,陳利,王維虎.基于SVM的手寫體數(shù)字快速識別方法研究[J].計算機技術與發(fā)展,2014,24(2):205-208.

      Application of PNN in Handwritten Digits Recognition

      XING Jian-ju,LI Jun,XIE Zan-fu
      (Institute of Computer Sciences,Guangdong Polytechnic Normal University,Guangzhou510665)

      Handwritten numeral recognition deals with the information of taxation,finance and other fields through computer or other machines for processing,makes it possible to save manpower and financial resources,with higher practical value.Although the type of identification number is not much,the required accuracy is very strict.Introduces the basic principle of probabilistic neural network,applies probabilistic neural network to handwritten digit recognition to select the best network diffusion speed and the number of training samples,and realizes the digital identification based on probabilistic neural network.MNIST handwritten database through MATLAB simulation experiment,the results show that the algorithm has high recognition rate,which is feasible and effective.

      Handwritten Digit Recognition;Probabilistic Neural Networks;Bayesian Decision Theory;Image Recognition

      1007-1423(2016)23-0020-04DOI:10.3969/j.issn.1007-1423.2016.23.005

      幸堅炬(1989-),男,廣東興寧人,研究生,研究方向為圖像識別

      李軍(1964-),女,浙江臨海人,教授,碩士,研究方向為移動互聯(lián)網(wǎng)、圖像識別、人工智能等,Email:janet-li@163.com

      謝贊福(1956-),男,海南儋州人,教授,本科,研究方向為圖像識別、人工智能

      2016-05-10

      2016-08-05

      廣東省科技計劃工業(yè)高新技術領域攻關項目(No.2013B010401032)

      猜你喜歡
      手寫體訓練樣本識別率
      哐當(外一首)
      哐當(外一首)
      基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
      計算機工程(2020年3期)2020-03-19 12:24:50
      人工智能
      基于大數(shù)據(jù)下的手寫體識別的設計與研發(fā)
      科技風(2020年3期)2020-02-24 06:52:46
      披著書法外衣的手寫體
      中國篆刻(2019年6期)2019-12-08 15:56:23
      基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關系
      提升高速公路MTC二次抓拍車牌識別率方案研究
      寬帶光譜成像系統(tǒng)最優(yōu)訓練樣本選擇方法研究
      融合原始樣本和虛擬樣本的人臉識別算法
      電視技術(2016年9期)2016-10-17 09:13:41
      张家港市| 阿合奇县| 蒙城县| 河北区| 鄄城县| 都匀市| 布尔津县| 调兵山市| 靖安县| 章丘市| 松溪县| 大冶市| 汽车| 邮箱| 津南区| 廊坊市| 富裕县| 普洱| 日喀则市| 久治县| 崇阳县| 米易县| 三穗县| 新化县| 蓬溪县| 老河口市| 翁源县| 措勤县| 兴山县| 永定县| 台湾省| 扶沟县| 广东省| 南雄市| 民丰县| 于都县| 和政县| 林西县| 汝南县| 乃东县| 阜新市|