張玉葉 王尚強(qiáng) 王淑娟 王春歆
摘要:針對(duì)目前常見(jiàn)的脫機(jī)手寫(xiě)數(shù)字識(shí)別技術(shù)進(jìn)行分析比較,并模擬人工智能識(shí)別字符的過(guò)程,提出一種分層識(shí)別方法。對(duì)于結(jié)構(gòu)差異較大的數(shù)字字符,根據(jù)數(shù)字字符圖像的統(tǒng)計(jì)特征進(jìn)行粗略識(shí)別;然后進(jìn)一步利用結(jié)構(gòu)特征細(xì)致區(qū)分形狀相近的數(shù)字字符。通過(guò)自制樣本庫(kù)進(jìn)行識(shí)別測(cè)試,結(jié)果表明該方法能夠有效提高識(shí)別準(zhǔn)確率。
關(guān)鍵詞:脫機(jī)手寫(xiě)數(shù)字識(shí)別;統(tǒng)計(jì)特征;結(jié)構(gòu)特征
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)29-0195-03
脫機(jī)手寫(xiě)數(shù)字識(shí)別,就是利用數(shù)字化設(shè)備將紙質(zhì)或其他介質(zhì)上手寫(xiě)的數(shù)字字符掃描為數(shù)字圖像信息,然后利用計(jì)算機(jī)進(jìn)行一系列的數(shù)字圖像處理步驟進(jìn)行數(shù)字識(shí)別處理的技術(shù)。相對(duì)于目前比較成熟的聯(lián)機(jī)手寫(xiě)字符識(shí)別,由于缺少聯(lián)機(jī)能夠獲取的字符筆順等重要信息,其技術(shù)實(shí)現(xiàn)難度要大。另外,脫機(jī)手寫(xiě)數(shù)字識(shí)別在郵政、銀行、交易等領(lǐng)域應(yīng)用需求廣泛,所以是近年來(lái)圖像處理領(lǐng)域研究的熱點(diǎn)。
本文在分析目前常見(jiàn)的脫機(jī)手寫(xiě)數(shù)字識(shí)別技術(shù)的基礎(chǔ)上,提出一種分層次的識(shí)別方法。該方法模擬人類識(shí)別字符的一般規(guī)律,首先抽取數(shù)字字符樣本的統(tǒng)計(jì)特征,通過(guò)對(duì)主分量重建模型的誤差分析進(jìn)行字符的粗略識(shí)別;然后加入寬高比結(jié)構(gòu)特征進(jìn)行字符比對(duì),進(jìn)行第二層次的細(xì)致識(shí)別。
1常見(jiàn)的脫機(jī)手寫(xiě)數(shù)字識(shí)別技術(shù)
脫機(jī)手寫(xiě)數(shù)字識(shí)別最重要的環(huán)節(jié)是字符的特征提取,根據(jù)采用的特征提取方法的不同,可以將目前常見(jiàn)的脫機(jī)手寫(xiě)數(shù)字識(shí)別大致分為兩類:基于統(tǒng)計(jì)特征和基于結(jié)構(gòu)特征的方法。
基于統(tǒng)計(jì)特征的識(shí)別方法主要有兩個(gè)過(guò)程:分類器學(xué)習(xí)訓(xùn)練過(guò)程和利用分類器識(shí)別過(guò)程。學(xué)習(xí)訓(xùn)練是將獲取的樣本信息經(jīng)過(guò)預(yù)處理和特征提取之后給分類器學(xué)習(xí),以此為識(shí)別的基礎(chǔ),讓分類器獲得識(shí)別的能力。識(shí)別過(guò)程將待識(shí)別的信息經(jīng)過(guò)同樣的預(yù)處理與特征提取后讓分類器分類識(shí)別。統(tǒng)計(jì)方法的優(yōu)點(diǎn)是能較好地描述一類模式的本質(zhì)特征,對(duì)干擾信息不敏感,對(duì)與訓(xùn)練樣本一致的信息識(shí)別正確率很高,缺點(diǎn)是對(duì)一些不穩(wěn)定的字符形態(tài)容易誤判。所以該方法類似于人類識(shí)別字符的粗略宏觀過(guò)程。
基于結(jié)構(gòu)特征的方法是分析字符筆畫(huà)的構(gòu)造如圈、端點(diǎn)、交叉點(diǎn)、輪廓等識(shí)別特征,結(jié)合字符間互斥的特征進(jìn)行識(shí)別。方法能夠精確地描述字符的細(xì)節(jié)特征,比較直觀,對(duì)字符圖像畸變的抗干擾能力較強(qiáng),可靠性較高;缺點(diǎn)對(duì)噪聲、斷線等干擾較敏感,另外字符骨架提取等過(guò)程實(shí)現(xiàn)復(fù)雜度高。該類方法類似于人類識(shí)別字符的細(xì)致區(qū)分過(guò)程。
由于不同人的書(shū)寫(xiě)習(xí)慣和書(shū)寫(xiě)風(fēng)格不同,使手寫(xiě)數(shù)字字符的形態(tài)極不穩(wěn)定。根據(jù)人工智能識(shí)別字符的規(guī)律,可以將兩類方法結(jié)合起來(lái),分層進(jìn)行識(shí)別,從而克服各自的不足,提高字符識(shí)別的準(zhǔn)確度。
2脫機(jī)手寫(xiě)數(shù)字的分層識(shí)別方法
脫機(jī)手寫(xiě)數(shù)字識(shí)別,首要任務(wù)就是利用掃描設(shè)備將紙質(zhì)載體掃描為圖像信息以便計(jì)算機(jī)處理。得到的數(shù)字圖像在進(jìn)行識(shí)別之前需要進(jìn)行圖像的預(yù)處理,以消除圖像中無(wú)關(guān)的信息,增強(qiáng)有關(guān)信息的可檢測(cè)性和最大限度地簡(jiǎn)化數(shù)據(jù),從而改進(jìn)特征抽取、圖像分割、匹配和識(shí)別的可靠性。預(yù)處理過(guò)程一般有幾何變換、平滑、復(fù)原和增強(qiáng)、提取邊緣、細(xì)化等步驟。這些圖像預(yù)處理技術(shù)比較成熟,可以直接應(yīng)用。
2.1主分量分析法提取統(tǒng)計(jì)特征及識(shí)別
3.1主分量分析法識(shí)別數(shù)字實(shí)驗(yàn)
步驟一:學(xué)習(xí)階段
利用主分量分析法對(duì)0到9十個(gè)數(shù)字的訓(xùn)練樣本提取統(tǒng)計(jì)特征,得到0到9十個(gè)模式類的前d個(gè)主分量重建得到的數(shù)字模型。以數(shù)字“6”為例,給出前d個(gè)主分量的重建模型圖如圖l所示,主分量個(gè)數(shù)d分別取3、5、7、10。從圖中可以看出d越大,模型圖像中包含的信息越多。
圖1樣本“6”前d個(gè)主分量的重建模型圖
步驟二:識(shí)別階段
將測(cè)試樣本分別在各模式的特征空間估計(jì)對(duì)應(yīng)于各模式的重建模型,再與各模式的重建模型相減得到重建誤差,比較誤差大小,誤差越小,與對(duì)應(yīng)的數(shù)字模式類越相似。
任意給出測(cè)試樣本中經(jīng)過(guò)預(yù)處理的0-9十個(gè)數(shù)字的圖像如圖2所示。
0-9十個(gè)手寫(xiě)數(shù)字字符(下表中用“”中的數(shù)字代表),在數(shù)字6的特征空間,分別構(gòu)建的重建模型圖像如圖3所示:
根據(jù)公式(2),對(duì)任意選取的這十個(gè)數(shù)(測(cè)試樣本)的重建模型與訓(xùn)練樣本的重建模型相減求模,得到模型誤差值進(jìn)行識(shí)別。
這里,我們只針對(duì)“6”的樣本集進(jìn)行分析。當(dāng)d=10的時(shí)候,任意十個(gè)數(shù)的測(cè)試樣本與“6”樣本集的重建模型相減,得到如圖4中所示的十個(gè)誤差圖像。
對(duì)圖4中圖像求模得到誤差值,誤差值越小,說(shuō)明測(cè)試樣本數(shù)字的形態(tài)與數(shù)字“6”越相似。發(fā)現(xiàn)測(cè)試樣本數(shù)字“6”的重建模型誤差值最低,說(shuō)明本方法是合理的。
其次誤差值最小的是“4”,然后是“5”,其余的數(shù)字的誤差較大。究其原因,我們分析表2中測(cè)試樣本的圖像不難發(fā)現(xiàn),書(shū)寫(xiě)的數(shù)字4和5有與數(shù)字6最相近的筆畫(huà)弧度部分。
步驟三:分析結(jié)果
100個(gè)測(cè)試樣本經(jīng)過(guò)主分量分析識(shí)別,得到的實(shí)驗(yàn)結(jié)果如表1所示:
表1中反映出,各數(shù)字字符的識(shí)別率也不同,其中以取7個(gè)主分量時(shí)得到的實(shí)驗(yàn)結(jié)果為例,發(fā)現(xiàn),數(shù)字“1”的識(shí)別率最低(η=70%),其次是數(shù)字“7”“9”(η=80%)。分析其中的原因,主要是因?yàn)樽址?”的筆畫(huà)過(guò)于簡(jiǎn)單,只有一豎,因此它筆畫(huà)結(jié)構(gòu)的特征不明顯,通過(guò)PCA能夠提取的結(jié)構(gòu)特征也就很有限。而“7”和“1”、“9”兩個(gè)數(shù)字結(jié)構(gòu)特征類似,也導(dǎo)致它的識(shí)別率比較低。為此,加入字符的寬高比結(jié)構(gòu)特征進(jìn)行識(shí)別。
3.2結(jié)合寬高比結(jié)構(gòu)特征識(shí)別實(shí)驗(yàn)
針對(duì)統(tǒng)計(jì)法識(shí)別數(shù)字出現(xiàn)的問(wèn)題,提取寬高比特征進(jìn)行數(shù)字識(shí)別,得到結(jié)果如表2。
發(fā)現(xiàn)數(shù)字識(shí)別率由91%提高到了96%,其中數(shù)字“1”被全數(shù)識(shí)別,原因在于它的高寬比特征最顯著?!?”和“9”識(shí)別率也顯著提高,這是因?yàn)槠浣Y(jié)構(gòu)特征與“1”區(qū)別開(kāi)來(lái),另外,結(jié)構(gòu)特征使“9”與“6”區(qū)別更顯著了。
4結(jié)論
本文在分析現(xiàn)有脫機(jī)手寫(xiě)數(shù)字識(shí)別技術(shù)的基礎(chǔ)上,根據(jù)人工智能識(shí)別字符的規(guī)律,結(jié)合統(tǒng)計(jì)特征和結(jié)構(gòu)特征設(shè)計(jì)了分層識(shí)別步驟。自制訓(xùn)練樣本及測(cè)試樣本庫(kù),利用Matlab軟件進(jìn)行識(shí)別實(shí)驗(yàn),分析實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)本方法能夠在一定程度上提高數(shù)字識(shí)別率,但是未對(duì)算法實(shí)時(shí)性作出要求,要形成工程實(shí)用的算法,還需要進(jìn)一步的研究。