李強 萬太昊 張超 王守志
【摘 要】圖像處理和模式識別中我們最常用并最具有研究價值的就是手寫數(shù)字體自動識別技術,本文主要是簡述手寫數(shù)字體自動識別技術的現(xiàn)狀情況,對我們的手寫數(shù)字體自動識別技術中的預處理中一些方法進行分析,將該技術服務中的重要特征和結(jié)構(gòu)進行分開概述,并通過我們的分析,讓讀者可以更加了解手寫數(shù)字體自動識別技術。
【關鍵詞】手寫數(shù)字體;自動識別;預處理;特征提取
引言
手寫數(shù)字體自動識別其實就是我們手寫出來的數(shù)字通過計算機優(yōu)化自動識別出來,它也是我們光學字符識別技術中的一項。我們國內(nèi)的大多學者其實已經(jīng)對自動識別技術有一些較為深入的研究,由此可見,我們國內(nèi)對手寫數(shù)字識別技術非常的看重,且該技術具有非常重要的意義?,F(xiàn)在市面上最多的是聯(lián)機識別的服務,就是主要通過攝像或手寫板,計算機聯(lián)機在攝像或手寫板進行書寫,再通過書寫出來的筆跡或落筆情況的像素空間的位置進行自動識別,這個技術是已經(jīng)較為成熟的情況,那么我們現(xiàn)在主要是針對脫機手寫數(shù)字體自動識別技術進行研究,它所涉及到的圖像處理、統(tǒng)計、模式識別等等?,F(xiàn)在這個技術是已經(jīng)有非常廣泛的應用了,比如是銀行票據(jù)和文本信息處理等,這個技術還有很多的不足之處,因為數(shù)字的筆畫和字型的不同,可能會導致識別錯誤。本文就以脫機手寫數(shù)字體識別為主,對其所存在的問題和優(yōu)點、缺點進行分別闡述。
一、預處理
預處理是我們的手寫數(shù)字體識別的必不可少的一部分,它其實主要就是在字符圖像中降噪、壓縮多余信息,以此提高我們的自動識別率和系統(tǒng)的識別速度。首先:我們?yōu)榱藢D像中筆劃進行清晰的展示,需要將我們的圖像顏色進行灰度化處理,沒有其他的顏色顯示,只是調(diào)整亮度,通過常用的加權平均法,然后將圖像的亮度進行處理。然后,將我們得到的圖像進行二值化,二值化中我們不常用的是動態(tài)閥值法,因為它主要是根據(jù)像元的領域特征來自己適應的改變閥值,領域灰度變化太快,計算時間長,很麻煩。我們在圖像的采集中,拍攝的時候光照情況和我們的拍攝環(huán)境是會影響到圖像的展示,同時圖像的本身可能也會存在有損壞的情況,圖像的質(zhì)量無法得到保證。為了得到高質(zhì)量的圖像保證,提高系統(tǒng)的識別率,我們就需要采取相應的措施,增強圖像的主要方式是頻率域法和空間域法。我們常用的是空間域法,因為它非常的簡單易操作,速度快,同時處理效果也非常好;但不是頻率域法效果不好,它主要是因為太麻煩,操作的效率低,所以是非常不實用。
我們的圖像在采集時都是隨機選擇的,沒有一個統(tǒng)一的角度,所以在獲取的圖像,它的傾斜角度是不確定的,即使是有傾斜角度校正的情況,但是識別出來的效果卻是不一樣的,傾斜校正也就是將圖像的傾斜角度按照一定的角度、方向進行旋轉(zhuǎn),我們常常使用的傾斜校正算法是:投影法、近鄰法,Hough變換法等等。我們一般現(xiàn)在使用的是基于小波變換與霍夫變換的圖像傾斜校正的算法:先是我們的原始圖像,進行灰度化得到灰度圖像;然后使用動態(tài)閥值得到二值圖像;通過小波變換,就有圖像整體概貌的形態(tài)了;再通過邊緣檢測,得出邊緣直線信息,最后再通過霍夫變換就有傾斜角度,最后的最后我們的圖像就校正成功了。
二、特征提取
特征提取是非常關鍵的,我們的圖像處理中需要保證有足夠的信息量,以此來得到圖像的較高識別率。我們的手寫數(shù)字特征常見的是結(jié)構(gòu)特征和統(tǒng)計特征的,結(jié)構(gòu)特征顧名思義就是主要在數(shù)字的結(jié)構(gòu)本質(zhì)上的特點;常用的特征提取是主要有:首先是粗網(wǎng)格,通過數(shù)字書寫的不同區(qū)域的黑色像素點的個數(shù),計算出黑色像素占比。不管有沒有降噪,它注重的是整體的分布情況,使用中會自動抑制噪聲,圖像的識別率高。然后是18維特征,主要是在粗網(wǎng)格的基礎上二次改進,還有主元素分析法。
三、模式分類識別
模式分類識別是圖像特征提取后,將特征空間來劃分,脫機手寫數(shù)字識別可以分成單分類和多分類集成。我們使用較多的還是多分類集成服務,也是現(xiàn)代社會的主流。我們的主流手寫體數(shù)字分類器有:基于距離的分類器:相對來說它的概念簡單,操作易上手,對小成本和低維等情況搓搓有余,但是缺點也很明顯,就是太過絕對的代表點,容易出錯;人工神經(jīng)網(wǎng)絡分類;支持向量機:它主要是針對的機器學習和模式識別問題;孿生支持向量機:還有待改進。
四、結(jié)束語
隨著現(xiàn)代社會的信息技術發(fā)展,手寫數(shù)字識別是已經(jīng)廣泛應用了,且在該領域已經(jīng)有非常重大的成果。本文就手寫數(shù)字識別服務中的預處理、特征提取、模式分類識別等,簡述它們的優(yōu)點和缺點情況,通過以上的分析情況來看,讓讀者對手寫數(shù)字體自動識別技術有進一步的了解,希望有助于以后的手寫數(shù)字體自動識別技術的更進一步的研究。
參考文獻:
[1]郭曉永,王相軍.一種基于SNMP的網(wǎng)絡拓撲發(fā)現(xiàn)算法[J].重慶工商大學學報(自然科學版),2011,(1):59-62.doi:10.3969/j.issn.1672-058X.2011.01.015
[2]朱江,宣國榮.一種基于骨架特征順序編碼的脫機手寫體數(shù)字識別方法[J].小型微型計算機系統(tǒng),2001,(8):957-960.doi:10.3969/j.issn.1000-1220.2001.08.017.
[3]吳冰,秦志遠.自動確定圖像二值化最佳閾值的新方法[J].測繪學院學報,2001,(4):283-286.doi:10.3969/j.issn.1673-6338.2001.04.014.
[4]張偉,王克儉,秦臻.基于神經(jīng)網(wǎng)絡的數(shù)字識別的研究[J].微電子學與計算機,2006,(8):206-208.doi:10.3969/j.issn.1000-7180.2006.08.063.
作者簡介:
李強,男,山東臨沂人,臨沂大學信息學院與工程學院;
萬太昊,男,山東青島人,臨沂大學信息學院與工程學院;
張超,男,山東臨沂人,臨沂大學信息學院與工程學院
王守志,男,山東臨沂人,臨沂大學信息學院與工程學院,副教授
(作者單位:臨沂大學信息學院與工程學院)