• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于移動端PCANet識別算法在電力銘牌文字識別的應用

      2018-02-25 11:25:16陳習曾智翔張蓓蕾陳春
      科技視界 2018年34期
      關鍵詞:圖像識別

      陳習 曾智翔 張蓓蕾 陳春

      【摘 要】在本文中,我們提出了一個深層次基于圖像分類學習網(wǎng)絡基本數(shù)據(jù)處理組件:級聯(lián)主成分分析(PCA)、二進制散列分類、塊狀直方圖分析。在提出的架構中,PCA被用于學習多級濾波器組。這個架構稱為PCA網(wǎng)絡(PCANet),可以非常容易和有效地設計和學習。PCANet在圖像、文字識別的應用中,是十分有效的方法。本文利用其原理技術,通過對電力銘牌圖像識別,適應其場景化做了相應的改進和特化。包括對光照變化,不匹配不對齊,遮擋等因素做了相應預處理改進。在實驗數(shù)據(jù)對比中,基于PCANet的電力銘牌圖像識別比其他傳統(tǒng)的識別技術效率都要高,獲得了95%的識別準確率,對于銘牌識別提供了即拍即識別的有效方案。

      【關鍵詞】圖像識別;PCA;PCANet;電力銘牌;

      中圖分類號: TP391.41 文獻標識碼: A 文章編號: 2095-2457(2018)34-0023-005

      DOI:10.19694/j.cnki.issn2095-2457.2018.34.009

      Application of PCANet recognition algorithm in character recognition of electric nameplate

      CHEN Xi ZENG Zhi-xiang* ZHANG Bei-lei CHEN Chun

      (Hainan Power Grid Co.,Ltd.,Hainan Haikou 570203,China)

      【Abstract】In this paper,we present a deep hierarchical image processing component based on image classification learning network:cascade principal component analysis(PCA),binary hash classification,and block histogram analysis.In the proposed architecture,PCA is used to learn multi-stage filter banks.This architecture,called the PCA Network(PCANet),can be designed and learned very easily and efficiently.PCANet is a very effective basic concept in the application of image and character recognition.In this paper,the principle technology is used to improve and specialize the image recognition of the electric nameplate and adapt to its scene.Including the changes in lighting,mismatch,misalignment,occlusion and other factors have been improved.In the comparison of experimental data,PCANet-based power nameplate image recognition is more efficient than other traditional recognition techniques,achieving 95% recognition accuracy,and providing an effective solution for instant recognition.

      【Key words】Image classification;PCA;PCANet;Power nameplate

      0 引言

      電氣銘牌的字符識別是光學字符識別[1](Optical Character Recognition,OCR)的一個方面.光學字符識別OCR是模式識別領域一個古老的研究方向.OCR的研究內(nèi)容是利用電子計算機等人工智能(計算)設備來識別各種形式的文字及符號的圖像所包含的信息。在學科分類上,字符識別技術屬于模式識別和人工智能的范疇,它涉及模式識別、光電子技術、計算機圖像處理、人工智能、模糊數(shù)學、組合數(shù)學、信息論、自然語言理解等技術,它是一門介于基礎理論研究和應用研究之間的綜合性學科?,F(xiàn)代的OCR產(chǎn)品實際上已經(jīng)成為現(xiàn)實世界和計算機世界的溝通紐帶。

      變壓器銘牌是變壓器重要的信息標識部件,由于其銘牌信息往往都是以人工形式采集,采用拍照記錄,再通過信息繪制成表單,記錄效率較低。本文主要是解決在拍照過程中只能畫識別圖片信息,生成對應銘牌信息表單的可視化界面后還能提供可操作功能(修改,刪除一些數(shù)據(jù)信息)的軟件,簡化其手工操作的繁瑣過程,其核心技術就是電力銘牌文字識別的技術。

      由于電力銘牌種類繁多,而且字體大小,形式,清晰度,污化度等各種因素,增加了對電力名牌的文字識別難度,普通常規(guī)的文字識別算法根本不足以支持具體環(huán)境下的文字識別準確率。對不同的文字識別算法進行分析后,我們采用基于PCAnet的算法,應用到具體項目中。從預處理,文字識別算法處理,后處理等過程,對比不同的模塊處理過程,綜合出一個相對符合標準的可視化電力銘牌文字識別算法。

      1 預處理

      由于拍照獲得的像素圖片不高,導致識別率降低。預處理過程則是對識別的照片進行質(zhì)量提高,如圖像灰度化,圖像切分,降躁,圖像定位矯正,字符分割,字符分割統(tǒng)一化等。

      1.1 圖像灰度化

      彩色圖像轉(zhuǎn)化為灰度化有:I=0.3R+0.59G+ 0.11B.I表示灰圖的亮度值,通過R,G,B紅綠藍三色分量的比重計算。圖像灰度化也有許多種措施,如最大類間方差法,是一種自適應的閥值方法,它是利用圖像的灰度特性,將圖像分成前景和背景兩個部分,當閥值達到最佳,背景和前景差別最大,從而達到二值化的目的,但是有時候某些字體和背景差距不大時,就會很難捕抓到。再如,Bernsen法,他是基于全局的灰度值處理,對圖像進行逐點二值化,它會遍歷所有的點,所以對于差距不大的背景反差,也能有較好的區(qū)分,但是由于遍歷所有的點特征,效率不高。再如,改進的bradley算法[2],具體步驟為:使用積分圖計算移動窗口內(nèi)的值,將當前灰度值與當前窗口灰度值作比較,如果當前灰度值比均值高出t個百分點,就設置為白色,否者就設置為黑色。忽略平滑過渡區(qū),這種基于bradley適用于簡單的,光照不均勻的圖像,不適合應用于復雜的圖像環(huán)境,且不論是效率還是處理效果,此算法是相對銘牌識別較優(yōu)的。

      1.2 圖像切分

      由于銘牌識別的銘牌樣式多種多樣,對于單字識別的結構很難完整的組合成一系列的詞語,有時詞語組合還會錯亂,這就要考慮到字符分割前提下的圖像切分,這是一種基于布局化的圖像切分,利用模版匹配的方法可以很好的解決這一點,基于自學的方法,先讓系統(tǒng)訓練各種銘牌樣式的布局,然后根據(jù)輪廓,邊框,來對圖像進行有規(guī)律的切分,訓練后作為匹配模版進行實際圖像切分的比較。圖像切分很好得解決了圖片識別結果以后的邏輯還原問題,即在字符識別相對準確的情況下還原銘牌的基本布局。

      根據(jù)像素的矩陣排列規(guī)律,可以切分為四個模塊,如下圖所示:

      1.3 降噪

      本文用到小波變換去噪原理[3],因為小波變換具有良好的時頻局部化特征,其線性表示為:,這種方法保留了大部分包含信號的小波函數(shù),發(fā)現(xiàn)并去掉由噪聲控制的小波函數(shù)。剩下的小波系數(shù)做逆變化得到去噪信號。

      小波變換去噪可以很好的保護有用的信號尖峰和突變信號,因此小波變換適合用于暫態(tài)信號和瞬間信號的噪聲去除方面,以及抑制高頻噪聲的干擾,有效將高頻信息和高頻噪聲區(qū)分開來,從而較好地保持圖像細節(jié),用在銘牌識別上的預處理很恰當。下圖為降噪后的效果圖:

      1.4 圖像定位矯正

      銘牌識別應用圖像為自然場景下所拍攝的,由于拍攝的角度問題,通常圖像不是正位的,這就需要對圖像進行定位矯正。透視形變矯正這種方法應用比較廣泛,透視形變導致圖像中的銘牌不再具有真實場景中的輪廓。由于金屬銘牌大多為矩形,而且銘牌圖像中的金屬銘牌具有明顯的輪廓,與背景區(qū)比較為明顯。因此,在本設計中將利用Harris角點檢測法求出銘牌金屬邊緣的四個角點,將這四個交點作為求解方程組中用到的四組平面的點。Harris算子是一種基于信號點特征提取的算子,如果在某一點上向任意方向細微的偏移都會引起灰度值很大的變化,那么Harris算法就會將其認定為角點。在標記好了所有特征點后,我們挑出距離原圖四個邊點最近的Harris角點,將其位置記錄,認為這四個點即為原始金屬的角點或相對邊緣點,將其作為四點法中世界平面的參考點應用于形變矯正。經(jīng)實驗證明,透視形變矯正效果很好,這有利于銘牌的文字識別效率。

      1.5 字符分割

      經(jīng)過銘牌定位后的銘牌是一個整體,要對字體達到準確識別,要對銘牌進行字符分割,包括漢字、字母、數(shù)字,就必須把字符從一行文字中分割出來,這就是字符分割。字符分割也分很多種,統(tǒng)一化分割,分類法分割等。

      但是,字符分割之前需要對圖片進行一系列預處理。

      1.5.1 基于垂直投影的字符識別切分

      垂直投影法通過將垂直方向的字符像素點的黑色進行累加,然后利用白色間隔進行字符切分。但是這樣做有兩個前提,第一,在二值化處理過后的灰度圖片背景不能與字體太過于接近,即差距要大否則會導致切分失誤。第二,有些字由于偏旁原因間隙也會大,會把一個字切分為兩個。所以還要做相對距離的判斷處理。

      1.5.2 基于類型綜合考慮的方法

      其一,利用字符間空隙和字符大小特征,利用投影特征的切分及利用連通元特征切分。其二,以識別為基礎的切分,通過反擴散法判斷切分結果是否正確,起到預確認的效果。其三,整體切分策略,即系統(tǒng)將字符串作為一個整體進行詞識別而不是字識別,在這種方法中加入了上下文關系等聯(lián)系。而且單個字符識別后還得進行統(tǒng)一化處理,消除字符位置和大小的變化。歸一化處理主要包括位置歸一化和大小歸一化。字符的歸一化十分重要,因為輸入的測試樣本大小不一樣,如果不能將字符在位置和大小統(tǒng)一化處理,字符與模版的相似度比較就顯得很難匹配。

      2 文字識別算法

      2.1 基于PCAnet識別文字識別

      主成份分析(PCA)也稱主向量分析[4],主元分析,是由英國統(tǒng)計學家Kart Peason提出的,之后由Hotelling將其改進,使之成為經(jīng)典方法之一,并廣泛應用在各個領域。

      在一些統(tǒng)計問題的研究中,往往需要考慮到各種影響因素,全面而系統(tǒng)的分析問題。在多元統(tǒng)計分析學中,這種影響因素被稱為變量。而我們在定量分析中恰恰希望變量越少越好。主成份分析法正是適應了這一點,對于銘牌文字識別提供了解決思路。

      PCAnet是基于人工網(wǎng)路方面的識別算法,所以相關的一些算法比較復雜。但是基本步驟還是比清晰易懂的。PCANet的網(wǎng)絡結構運算實現(xiàn):

      (two-stage)PCANet

      1)通常,采集的原始數(shù)據(jù)用一個m維向量表示,每個向量有n個特征值,也就可以表示為:

      構造樣本陣列,進行標準化變換:

      其中,

      2)對標準化陣列Z求相關系數(shù)矩陣

      3)解樣本相關矩陣R的特征方程,得m個特征根確定主成份,按確定w值,使信息的利用率達到85%以上,對每個,解方程組得單位特征向量b

      。

      4)將標準化的指標向量轉(zhuǎn)換成主成份

      其中,稱矩陣U的第一行為第一主成分,稱矩陣U的第二行為第二主成份,以此類推。

      5)對m個主成份進行綜合評價,對m個主成份進行加權求和,即得最終評價值,權數(shù)為每個主成份的方差貢獻率。

      在運用到銘牌識別的技術上,只需要提取需要訓練的圖像素材即可,在進行相關的結果分析,經(jīng)實驗證明,PCANet速度較快,計算量較小,更易于環(huán)境操作效率。

      由于銘牌識別具有字體局部性,一些參數(shù)和數(shù)字的信息,可以作為基本訓練的識別模式庫,對不同字體的相同符號參數(shù)進行特征統(tǒng)一化,減小了一二層篩選模式的規(guī)模大小,從而加快了識別速度。即對進行識別的已經(jīng)分割好的字符進行預分析,判定是否是該銘牌識別的必要信息,進行初步的過濾。

      本實驗訓練庫的識別樣本如下:

      字符類樣本:產(chǎn) 品 型 號 額 定 電 流 壓 聯(lián) 結 組 標 短 阻 抗

      絕 緣 水 平 準 代 頻 率 相 數(shù) 三 冷 卻 方 式 使 用 條 件 器 高 低 出 廠 序 號

      非字符類樣本:

      1234567890ABCDEFGHIJKLMNOPQRSTUVWXYZ%-.+

      本設計只是選取一般電力銘牌公用字段作為樣本,對于非庫中的中文就無法識別,所以需要進行特定擴充如需用到其他解析方面的話。

      2.2 模板匹配法字符識別

      傳統(tǒng)模版匹配法,也稱為近鄰法,是模式識別中最原始、最常用的分類方法。模版匹配并不需要特征提取過程,而是直接把圖像作為特征,和字典中的模版相比,相似度高的模版即為識別結果。這種方法的優(yōu)點是直觀,算法簡單,容易實現(xiàn),只要求訓練模版的數(shù)據(jù)源夠豐富。由于銘牌識別的字符個數(shù)和類別是有所固定的,所以采用此法比較簡便,但是要提高正確率,就需要使用多個模版進行匹配,那么處理速度就會有所下降。

      3 后處理

      對于后處理部分,針對相似字符,粘連字符,特殊符號的識別錯誤等問題,需要進行后處理,可以根據(jù)識別結果來進行對應處理。例如,在某些場合銘牌識別的準確率很低,就需要人工手動進行調(diào)整。

      系統(tǒng)運行要具有較高的可靠性,會經(jīng)過嚴格的性能測試來保證每一個環(huán)節(jié)在相對的準確域中,同時,對于錯誤和模糊的識別結果應該給使用者反饋標識出來,以便及時發(fā)現(xiàn)問題,并進行修復。

      針對字符粘連的后處理。對于字符的粘連問題主要有兩種,一種為簡單粘連--字符接觸,但并沒有重合的部分,如果粘連位置探測準確,可以將其分開,但可能造成誤切分。一種為交錯粘連--邏輯上的粘連,即字符不接觸,但有重合。

      對應的可行性解決方案如下:

      1)從上往下行掃描圖像,找到第一個白變黑的像素點,記錄坐標,然后繼續(xù)掃描,找到第一個黑變白的像素點,記錄其坐標,然后取這兩個跳變的中間點,記錄其坐標。

      2)繼續(xù)掃描找到下一個中間點,直到找到所有的中間點為止,記錄其坐標。

      3)將第一步中找到的中間點和第二步中找到的所有中間點,利用這些點進行劃線。

      4)連線上如果全是黑色的像素點則證明是交錯粘連,那么將左邊的字符移動,把第一步中的中點的橫坐標距離長度的字符放到一個新的空白矩陣中,如果不全是,則證明非交錯相連。

      5)對于剩下的圖像像素行繼續(xù)上訴步驟,逐一進行移出。

      4 總結

      在大數(shù)據(jù)和人工智能發(fā)展的時代背景下,一方面無標數(shù)據(jù)變得唾手可得,加上計算機運算水平的提高,這些都給人工智能技術的移植提供良好的環(huán)境;另外一方面無監(jiān)督深度學習的表達方法能夠自動的從原始數(shù)據(jù)里提取魯棒的特征性信息,使得分類識別準確率更高。

      本文旨在當前背景下利用文字識別技術的綜述和比較,提出了將主成份分析法應用于銘牌識別。首先通過對種方法的對比選擇了brdley方法作為二值化方案,選擇PCAnet用作識別。識別環(huán)節(jié)中一方面采用了無監(jiān)督訓練的方式,提取了高表征力的特征,識別準確率優(yōu)于人工設計特征的淺層算法;另一方面針對漢字字符識別這類多分類問題,有更快的識別速度。對于銘牌文字識別問題,PCANet做到了準確率和計算速度矛盾調(diào)優(yōu)中的最佳方案。

      【參考文獻】

      [1]馬文冀.基于Android平臺的字符識別預處理算法設計與實現(xiàn)[D].北京郵電大學碩士論文,2012.

      [2]安芳.PID控制器參數(shù)整定機器及其在逆變控制上的應用[D].南昌:南昌航空大學,2013.

      [3]馬玲玉.基于OpenCV手機拍照快遞單文字識別的研究[D].哈爾濱商業(yè)大學,2016.

      [4]尹遠,余正濤.融合字符及字符排列特征的銘牌識別方法[J].現(xiàn)代電子技術,2016,39(22):7-9.

      猜你喜歡
      圖像識別
      基于Resnet-50的貓狗圖像識別
      電子制作(2019年16期)2019-09-27 09:34:50
      高速公路圖像識別技術應用探討
      圖像識別在物聯(lián)網(wǎng)上的應用
      電子制作(2018年19期)2018-11-14 02:37:04
      圖像識別在水質(zhì)檢測中的應用
      電子制作(2018年14期)2018-08-21 01:38:16
      淺談模式識別在圖像識別中的應用
      電子測試(2017年23期)2017-04-04 05:06:50
      基于多組合內(nèi)容的圖像識別機制
      苏尼特左旗| 丁青县| 甘孜县| 灵山县| 丰台区| 邵阳市| 汤原县| 荣成市| 都安| 南投县| 宣恩县| 财经| 抚松县| 阳高县| 任丘市| 沂水县| 承德市| 宽甸| 长春市| 汝州市| 平昌县| 健康| 沾益县| 乌苏市| 故城县| 安庆市| 志丹县| 南和县| 桐乡市| 江西省| 邵东县| 墨脱县| 鲁甸县| 六盘水市| 永登县| 盐池县| 徐汇区| 桐乡市| 九江市| 新巴尔虎左旗| 上饶县|