• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于自編碼特征提取及彈性學(xué)習(xí)的手寫(xiě)數(shù)字識(shí)別

      2014-07-19 17:43:57姜芳芳何明一王欣欣
      現(xiàn)代電子技術(shù) 2014年10期

      姜芳芳 何明一 王欣欣

      摘 要: 針對(duì)自編碼算法提取輸入特征能更好地發(fā)現(xiàn)樣本間的相關(guān)性的優(yōu)點(diǎn),以自編碼算法提取待識(shí)別樣本特征作為多層前向網(wǎng)絡(luò)的輸入,以彈性BP算法訓(xùn)練網(wǎng)絡(luò),并用MNIST手寫(xiě)數(shù)字?jǐn)?shù)據(jù)庫(kù)樣本測(cè)試。從正確率、拒識(shí)率、錯(cuò)誤率和可靠率4項(xiàng)性能指標(biāo)方面與逐像素方法進(jìn)行了綜合對(duì)比測(cè)試。研究表明,采用自編碼特征提取、多層前向神經(jīng)網(wǎng)絡(luò)作為分類器以及彈性BP 算法進(jìn)行訓(xùn)練的手寫(xiě)數(shù)字識(shí)別,具有更快的收斂速度和更高的識(shí)別可靠率。

      關(guān)鍵詞: 多層前向神經(jīng)網(wǎng)絡(luò); 自編碼算法; 彈性BP算法; MNIST數(shù)據(jù)庫(kù)

      中圖分類號(hào): TN911?34; TP183 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2014)10?0031?04

      Abstract: As the autoencoder algorithm for input feature extraction is better in discovering the correlation between samples, an new approach is proposed for handwriting number recognition (HNR), in which the autoencoder algorithm is taken to extract the feature under recognition as the input of multilayer feedforward network, resilient back propagation (BP) algorithm is emplored to train the classifer, and some saples chosen from MNIST handwriting digits database are used to test the performance of this new approach. A comprehensive comparisons between this new approach and the pixel?by?pixel method is coducted in correct rate, rejection rate, error rate and reliability rate. This study results show that the proposed new approach (the autoencoder feature extraction, multilayer feedforward neural network classifier and resilient back propagation training algorithm are used together) has faster training speed and higher recognition reliability.

      Keywords: multilayer feedforward neural network; autoencoder algorithm; resilient back propagation algorithm; MNIST database

      手寫(xiě)數(shù)字識(shí)別(Handwriting Number Recognition,HNR) [1?2]主要指利用計(jì)算機(jī)智能的識(shí)別書(shū)寫(xiě)在紙張上的阿拉伯?dāng)?shù)字,是光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù)的一個(gè)重要方面,有廣泛的應(yīng)用需求。多層前向神經(jīng)網(wǎng)絡(luò)[3](MultiLayer Feedforward Neural Network,MLFNN)由于具有很好的非線性映射能力,在非線性函數(shù)逼近、模式識(shí)別與分類等領(lǐng)域得到廣泛的應(yīng)用。在用神經(jīng)網(wǎng)絡(luò)進(jìn)行模式識(shí)別的過(guò)程中,特征提取[4?5]是一個(gè)重要的環(huán)節(jié),它會(huì)直接影響神經(jīng)網(wǎng)絡(luò)分類器識(shí)別的效果。基于神經(jīng)網(wǎng)絡(luò)的字符識(shí)別的輸入特征提取一般采用逐像素方法[6],這是一種最簡(jiǎn)單的特征提取方法,其特點(diǎn)是算法簡(jiǎn)單,運(yùn)算速度快,但對(duì)特征較少的圖像,這種方法提取的信息量過(guò)大,適應(yīng)性不強(qiáng),不能很好的表示各類樣本特征。本文在前人工作基礎(chǔ)上,采用自編碼算法[7]提取待分類樣本的特征作為多層前向網(wǎng)絡(luò)的輸入,通過(guò)彈性BP算法[8]對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以期訓(xùn)練速度及識(shí)別效果的提升。最后,用公開(kāi)的MNIST數(shù)據(jù)庫(kù)[9]中部分手寫(xiě)數(shù)字進(jìn)行驗(yàn)證。

      1 系統(tǒng)原理

      基于多層前向網(wǎng)絡(luò)的識(shí)別系統(tǒng)如圖1所示。

      特征提取是識(shí)別系統(tǒng)中關(guān)鍵的組成部分,會(huì)直接影響系統(tǒng)的識(shí)別效果,本文采用自編碼特征提取方法。神經(jīng)網(wǎng)絡(luò)是識(shí)別系統(tǒng)實(shí)現(xiàn)功能的載體或方法,利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和記憶功能,先讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練樣本中大量樣本信息,以記住各模式類別中的樣本特征,然后在測(cè)試樣本時(shí),神經(jīng)網(wǎng)絡(luò)可以回憶起之前記住的各模式類別的特征,從而確定測(cè)試樣本所屬的模式類別。本文多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法為彈性BP算法。

      以下主要介紹特征提取模塊中的自編碼特征提取方法,及神經(jīng)網(wǎng)絡(luò)分類器。

      2 基于自編碼的特征提取

      當(dāng)神經(jīng)元的激勵(lì)函數(shù)是sigmoid函數(shù)時(shí),神經(jīng)元的輸出接近于1的時(shí)候認(rèn)為它被激活,而輸出接近于0的時(shí)候認(rèn)為它被抑制,稀疏性限制表示為:使得神經(jīng)元大部分的時(shí)間都是被抑制。斯坦福大學(xué)Andrew NG在UFLDL教程[7]中介紹的自編碼技術(shù)將傳統(tǒng)的三層前向網(wǎng)絡(luò)目標(biāo)值設(shè)為輸入值,在此網(wǎng)絡(luò)隱層加入稀疏性限制后,將經(jīng)誤差反向傳播學(xué)到的隱層輸出作為待識(shí)別樣本特征,此方法可更好地發(fā)現(xiàn)數(shù)據(jù)間的相關(guān)性。

      如果網(wǎng)絡(luò)的輸入數(shù)據(jù)是完全隨機(jī)的,比如每一個(gè)輸入[xi]都是一個(gè)與其他特征完全無(wú)關(guān)的獨(dú)立同分布高斯隨機(jī)變量,那么這一壓縮表示將會(huì)非常難學(xué)習(xí)。但是如果輸入數(shù)據(jù)中隱含著一些特定的結(jié)構(gòu),例如某些輸入特征是彼此相關(guān)的,那么這一算法就可以發(fā)現(xiàn)輸入數(shù)據(jù)中的這些相關(guān)性。具體來(lái)說(shuō),如果隱層神經(jīng)元的數(shù)量少于輸入層,訓(xùn)練好的網(wǎng)絡(luò)隱層輸出其實(shí)是學(xué)習(xí)到了輸入數(shù)據(jù)的壓縮表示,當(dāng)隱層神經(jīng)元的數(shù)量大于輸入層神經(jīng)元的數(shù)量時(shí),給隱層神經(jīng)元加入稀疏性限制,那么此網(wǎng)絡(luò)仍然可以學(xué)習(xí)到數(shù)據(jù)之間的關(guān)系。

      3 基于多層前向神經(jīng)網(wǎng)絡(luò)的分類模塊設(shè)計(jì)

      多層神經(jīng)網(wǎng)絡(luò)由若干層神經(jīng)元組成,不同層的神經(jīng)元作用各不相同,輸入層接受來(lái)自外界的信號(hào),輸出層給出對(duì)輸入信號(hào)的判別或決策,隱層用來(lái)表示或存貯知識(shí)。此網(wǎng)絡(luò)可實(shí)現(xiàn)樣本數(shù)據(jù)(由輸入模式與期望輸出模式對(duì)組成)的映射,同時(shí)它還具有推廣與概括等能力,即當(dāng)輸入模式不是學(xué)習(xí)過(guò)的樣本數(shù)據(jù)時(shí),網(wǎng)絡(luò)的輸出也能與該輸入最接近的樣本輸入對(duì)應(yīng)的期望輸出比較接近。圖3為多層前向網(wǎng)絡(luò)的基本結(jié)構(gòu)。其中輸入層神經(jīng)元個(gè)數(shù)為[ni],隱層神經(jīng)元個(gè)數(shù)為[nh],輸出層神經(jīng)元個(gè)數(shù)為[no]。

      4 基于彈性BP算法的網(wǎng)絡(luò)訓(xùn)練

      網(wǎng)絡(luò)的訓(xùn)練算法一般采用最速下降法[10],但是最速下降法存在諸如收斂速度慢,網(wǎng)絡(luò)易陷于局部極小,學(xué)習(xí)過(guò)程易發(fā)生振蕩或平臺(tái)效應(yīng)等缺點(diǎn)。為了完善多層前向神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法并提高學(xué)習(xí)速度,將彈性BP算法引入到多層前向網(wǎng)絡(luò)的學(xué)習(xí)中對(duì)其簡(jiǎn)要論述。

      6 結(jié) 語(yǔ)

      本文以自編碼算法提取特征作為網(wǎng)絡(luò)輸入,以彈性BP算法訓(xùn)練網(wǎng)絡(luò),并用標(biāo)準(zhǔn)手寫(xiě)數(shù)字識(shí)別庫(kù)數(shù)據(jù)樣本進(jìn)行測(cè)試。得出的主要結(jié)論是,自編碼算法提取特征用于多層前向網(wǎng)絡(luò)能提高網(wǎng)絡(luò)的收斂速度和識(shí)別精度。

      參考文獻(xiàn)

      [1] LORiGO L M, GOVINDARAJU V. Offline Arabic handwriting recognition: a survey [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(5): 712?724.

      [2] 柳回春,馬樹(shù)元,吳平東,等.手寫(xiě)體數(shù)字識(shí)別技術(shù)的研究[J]. 計(jì)算機(jī)工程,2003,29(4):24?25.

      [3] HAGAN M T, DEMUTH H B, BEALE M H.神經(jīng)網(wǎng)絡(luò)設(shè)計(jì) [M].戴葵,譯.北京:機(jī)械工業(yè)出版社,2007.

      [4] 翟俊海,趙文秀,王熙照.圖像特征提取研究[J].河北大學(xué)學(xué)報(bào):自然科學(xué)版,2009(1):106?112.

      [5] 董慧.手寫(xiě)體數(shù)字識(shí)別中的特征提取和特征選擇研究[D].北京:北京郵電大學(xué),2007.

      [6] 胡小鋒,趙輝.Visual C++/Matlab圖像處理與識(shí)別實(shí)用案例精選[M].北京:人民郵電出版社,2004.

      [7] VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders [C]// Proceedings of the 25th International Conference on Machine Learning. New York, USA: ACM, 2008: 1096?1103.

      [8] RIEDMILLER M, BRAUN H. A direct adaptive method for faster backpropagation learning: the RPROP algorithm [C]// Proceedings of the IEEE International Conference on Neural Networks. San Francisco, CA: IEEE, 1993: 586?591.

      [9] MADSEN K, NIELSEN H B, TINGLEFF O. Methods for non?linear least squares problems [M]. Denmark: Informatics and Mathematical Modeling, Technical University of Denmark, 2004.

      [10] CUN L, BOSER B, DENKER J S, et al. Handwritten digit recognition with a back?propagation network [M]// Advances in Neural Information Processing Systems. [S.l.]: Morgan Kaufmann, 1990: 396?404.

      3 基于多層前向神經(jīng)網(wǎng)絡(luò)的分類模塊設(shè)計(jì)

      多層神經(jīng)網(wǎng)絡(luò)由若干層神經(jīng)元組成,不同層的神經(jīng)元作用各不相同,輸入層接受來(lái)自外界的信號(hào),輸出層給出對(duì)輸入信號(hào)的判別或決策,隱層用來(lái)表示或存貯知識(shí)。此網(wǎng)絡(luò)可實(shí)現(xiàn)樣本數(shù)據(jù)(由輸入模式與期望輸出模式對(duì)組成)的映射,同時(shí)它還具有推廣與概括等能力,即當(dāng)輸入模式不是學(xué)習(xí)過(guò)的樣本數(shù)據(jù)時(shí),網(wǎng)絡(luò)的輸出也能與該輸入最接近的樣本輸入對(duì)應(yīng)的期望輸出比較接近。圖3為多層前向網(wǎng)絡(luò)的基本結(jié)構(gòu)。其中輸入層神經(jīng)元個(gè)數(shù)為[ni],隱層神經(jīng)元個(gè)數(shù)為[nh],輸出層神經(jīng)元個(gè)數(shù)為[no]。

      4 基于彈性BP算法的網(wǎng)絡(luò)訓(xùn)練

      網(wǎng)絡(luò)的訓(xùn)練算法一般采用最速下降法[10],但是最速下降法存在諸如收斂速度慢,網(wǎng)絡(luò)易陷于局部極小,學(xué)習(xí)過(guò)程易發(fā)生振蕩或平臺(tái)效應(yīng)等缺點(diǎn)。為了完善多層前向神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法并提高學(xué)習(xí)速度,將彈性BP算法引入到多層前向網(wǎng)絡(luò)的學(xué)習(xí)中對(duì)其簡(jiǎn)要論述。

      6 結(jié) 語(yǔ)

      本文以自編碼算法提取特征作為網(wǎng)絡(luò)輸入,以彈性BP算法訓(xùn)練網(wǎng)絡(luò),并用標(biāo)準(zhǔn)手寫(xiě)數(shù)字識(shí)別庫(kù)數(shù)據(jù)樣本進(jìn)行測(cè)試。得出的主要結(jié)論是,自編碼算法提取特征用于多層前向網(wǎng)絡(luò)能提高網(wǎng)絡(luò)的收斂速度和識(shí)別精度。

      參考文獻(xiàn)

      [1] LORiGO L M, GOVINDARAJU V. Offline Arabic handwriting recognition: a survey [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(5): 712?724.

      [2] 柳回春,馬樹(shù)元,吳平東,等.手寫(xiě)體數(shù)字識(shí)別技術(shù)的研究[J]. 計(jì)算機(jī)工程,2003,29(4):24?25.

      [3] HAGAN M T, DEMUTH H B, BEALE M H.神經(jīng)網(wǎng)絡(luò)設(shè)計(jì) [M].戴葵,譯.北京:機(jī)械工業(yè)出版社,2007.

      [4] 翟俊海,趙文秀,王熙照.圖像特征提取研究[J].河北大學(xué)學(xué)報(bào):自然科學(xué)版,2009(1):106?112.

      [5] 董慧.手寫(xiě)體數(shù)字識(shí)別中的特征提取和特征選擇研究[D].北京:北京郵電大學(xué),2007.

      [6] 胡小鋒,趙輝.Visual C++/Matlab圖像處理與識(shí)別實(shí)用案例精選[M].北京:人民郵電出版社,2004.

      [7] VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders [C]// Proceedings of the 25th International Conference on Machine Learning. New York, USA: ACM, 2008: 1096?1103.

      [8] RIEDMILLER M, BRAUN H. A direct adaptive method for faster backpropagation learning: the RPROP algorithm [C]// Proceedings of the IEEE International Conference on Neural Networks. San Francisco, CA: IEEE, 1993: 586?591.

      [9] MADSEN K, NIELSEN H B, TINGLEFF O. Methods for non?linear least squares problems [M]. Denmark: Informatics and Mathematical Modeling, Technical University of Denmark, 2004.

      [10] CUN L, BOSER B, DENKER J S, et al. Handwritten digit recognition with a back?propagation network [M]// Advances in Neural Information Processing Systems. [S.l.]: Morgan Kaufmann, 1990: 396?404.

      3 基于多層前向神經(jīng)網(wǎng)絡(luò)的分類模塊設(shè)計(jì)

      多層神經(jīng)網(wǎng)絡(luò)由若干層神經(jīng)元組成,不同層的神經(jīng)元作用各不相同,輸入層接受來(lái)自外界的信號(hào),輸出層給出對(duì)輸入信號(hào)的判別或決策,隱層用來(lái)表示或存貯知識(shí)。此網(wǎng)絡(luò)可實(shí)現(xiàn)樣本數(shù)據(jù)(由輸入模式與期望輸出模式對(duì)組成)的映射,同時(shí)它還具有推廣與概括等能力,即當(dāng)輸入模式不是學(xué)習(xí)過(guò)的樣本數(shù)據(jù)時(shí),網(wǎng)絡(luò)的輸出也能與該輸入最接近的樣本輸入對(duì)應(yīng)的期望輸出比較接近。圖3為多層前向網(wǎng)絡(luò)的基本結(jié)構(gòu)。其中輸入層神經(jīng)元個(gè)數(shù)為[ni],隱層神經(jīng)元個(gè)數(shù)為[nh],輸出層神經(jīng)元個(gè)數(shù)為[no]。

      4 基于彈性BP算法的網(wǎng)絡(luò)訓(xùn)練

      網(wǎng)絡(luò)的訓(xùn)練算法一般采用最速下降法[10],但是最速下降法存在諸如收斂速度慢,網(wǎng)絡(luò)易陷于局部極小,學(xué)習(xí)過(guò)程易發(fā)生振蕩或平臺(tái)效應(yīng)等缺點(diǎn)。為了完善多層前向神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法并提高學(xué)習(xí)速度,將彈性BP算法引入到多層前向網(wǎng)絡(luò)的學(xué)習(xí)中對(duì)其簡(jiǎn)要論述。

      6 結(jié) 語(yǔ)

      本文以自編碼算法提取特征作為網(wǎng)絡(luò)輸入,以彈性BP算法訓(xùn)練網(wǎng)絡(luò),并用標(biāo)準(zhǔn)手寫(xiě)數(shù)字識(shí)別庫(kù)數(shù)據(jù)樣本進(jìn)行測(cè)試。得出的主要結(jié)論是,自編碼算法提取特征用于多層前向網(wǎng)絡(luò)能提高網(wǎng)絡(luò)的收斂速度和識(shí)別精度。

      參考文獻(xiàn)

      [1] LORiGO L M, GOVINDARAJU V. Offline Arabic handwriting recognition: a survey [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(5): 712?724.

      [2] 柳回春,馬樹(shù)元,吳平東,等.手寫(xiě)體數(shù)字識(shí)別技術(shù)的研究[J]. 計(jì)算機(jī)工程,2003,29(4):24?25.

      [3] HAGAN M T, DEMUTH H B, BEALE M H.神經(jīng)網(wǎng)絡(luò)設(shè)計(jì) [M].戴葵,譯.北京:機(jī)械工業(yè)出版社,2007.

      [4] 翟俊海,趙文秀,王熙照.圖像特征提取研究[J].河北大學(xué)學(xué)報(bào):自然科學(xué)版,2009(1):106?112.

      [5] 董慧.手寫(xiě)體數(shù)字識(shí)別中的特征提取和特征選擇研究[D].北京:北京郵電大學(xué),2007.

      [6] 胡小鋒,趙輝.Visual C++/Matlab圖像處理與識(shí)別實(shí)用案例精選[M].北京:人民郵電出版社,2004.

      [7] VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders [C]// Proceedings of the 25th International Conference on Machine Learning. New York, USA: ACM, 2008: 1096?1103.

      [8] RIEDMILLER M, BRAUN H. A direct adaptive method for faster backpropagation learning: the RPROP algorithm [C]// Proceedings of the IEEE International Conference on Neural Networks. San Francisco, CA: IEEE, 1993: 586?591.

      [9] MADSEN K, NIELSEN H B, TINGLEFF O. Methods for non?linear least squares problems [M]. Denmark: Informatics and Mathematical Modeling, Technical University of Denmark, 2004.

      [10] CUN L, BOSER B, DENKER J S, et al. Handwritten digit recognition with a back?propagation network [M]// Advances in Neural Information Processing Systems. [S.l.]: Morgan Kaufmann, 1990: 396?404.

      天津市| 怀安县| 吴桥县| 虹口区| 江山市| 昭平县| 清徐县| 蓬莱市| 剑川县| 鄯善县| 六安市| 松滋市| 罗田县| 孟州市| 华安县| 扬中市| 文成县| 杭锦后旗| 宣化县| 宁远县| 沂源县| 高州市| 修武县| 嘉义县| 泸水县| 平乐县| 泰兴市| 茂名市| 西贡区| 井研县| 瑞昌市| 凉城县| 华宁县| 海门市| 余庆县| 光泽县| 岚皋县| 湖州市| 凤山县| 吴忠市| 北票市|