莆田學(xué)院信息工程學(xué)院 張荔
基于MATLAB的超分辨率字符識(shí)別算法實(shí)現(xiàn)
莆田學(xué)院信息工程學(xué)院 張荔
字符識(shí)別的超分辨率重建已經(jīng)在圖像處理領(lǐng)域成了一個(gè)研究熱點(diǎn),其不僅在理論上具有重要意義,在實(shí)用中也有迫切需求。論文主要通過對(duì)字符識(shí)別的超分辨率重建算法進(jìn)行研究,并應(yīng)用一種算法加以實(shí)現(xiàn)。最終通過MATLAB軟件進(jìn)行仿真,對(duì)給出的模糊文本圖像進(jìn)行超分辨率重建,并得出最后重建圖像。讓人們了解這種方法的實(shí)用性。
字符識(shí)別;超分辨率重建;MATLAB
在數(shù)字圖像的采集與處理過程中,不同精度和類型的傳感器、光學(xué)器件引起的圖像模糊以及運(yùn)動(dòng)物體采集時(shí)的運(yùn)動(dòng)模糊,同時(shí)自然界中大量存在起伏噪聲、單頻噪聲等,這些會(huì)使實(shí)際獲得的圖像產(chǎn)生模糊、噪聲乃至變形的情況,其最為在直接的表現(xiàn)就是使整個(gè)圖像的分辨率較低。除此之外,在數(shù)字化信息采集的過程之中也會(huì)對(duì)圖像的分辨率產(chǎn)生影響,最為主要的原因就在于采樣速率偏低,使得采樣后信號(hào)的頻譜出現(xiàn)混疊現(xiàn)象,從而不能簡(jiǎn)單用低通濾波器重建信號(hào)[1]。
從上述分析可以看出,想要對(duì)圖像的分辨率進(jìn)行改善,最為直接的方法就是使用性能優(yōu)良的硬件設(shè)備。但是性能越好的圖像采集器價(jià)格也越昂貴,通常用于高精度系統(tǒng)中,不適合于一般應(yīng)用中。因此,實(shí)際中普遍采取的方法是使用建立在信號(hào)處理基礎(chǔ)上的算法來改善圖像的分辨率,也就是超分辨率(SR:Super-Resolution)圖像重建。這一方法的優(yōu)點(diǎn)在于不會(huì)涉及硬件,成本較為低廉,并且還可以使用現(xiàn)有的圖像系統(tǒng),這種方案較為經(jīng)濟(jì)實(shí)用。
對(duì)于字符的識(shí)別,當(dāng)前最為主流的方法是基于模板匹配的OCR算法以及基于人工神經(jīng)網(wǎng)絡(luò)的OCR算法。在本設(shè)計(jì)之中使用的是基于模板匹配的OCR算法。該算法的主要原理是,首先對(duì)待識(shí)別圖像預(yù)處理(如二值化、中值濾波、圖像分割等,并將其尺寸大小縮放到與字符數(shù)據(jù)庫中模板的大小相同),然后與所有的模板圖像一一進(jìn)行計(jì)算比對(duì),最后選擇相關(guān)度最高的或者誤差最小的圖像作為結(jié)果[2]。
因此完整的字符識(shí)別的算法步驟如下:
(1)字符圖像預(yù)處理
標(biāo)準(zhǔn)模板庫必須在字符識(shí)別操作開始前建立好的。一般的文本圖像,包含漢字和英文等大量的字符,計(jì)算量過大。為了實(shí)驗(yàn)方便,只建立5個(gè)字母模型,用畫圖工具先畫出s、e、c、t、i等5個(gè)字符的圖像。并分別保存為moban1.jpg,moban2.jpg,moban3.jpg,moban4.jpg,moban5.jpg。模板庫中原圖大小設(shè)定為,以利于后面的處理。所得到的字符統(tǒng)一為黑字白底。字體為宋體,大小保持一致。
實(shí)際中的圖像在形成、傳輸或變換過程中,受多種因素的影響,會(huì)與原始圖像之間產(chǎn)生某種差異,這種差異會(huì)對(duì)后續(xù)的信號(hào)處理產(chǎn)生影響。所以在識(shí)別前需要對(duì)待識(shí)別圖像做預(yù)處理,包括去除噪聲,邊界增強(qiáng),增加亮度等等。
通常采集到的圖片由若干個(gè)字母或數(shù)字等組成,因此還需要將每個(gè)字符分離開來,便于下一步進(jìn)行相關(guān)度計(jì)算。分割圖像可以先采用邊緣檢測(cè)將背景區(qū)域和目標(biāo)圖像分離開來。再利用閥值分割,將連續(xù)字符分割為單個(gè)的字符圖像。為了方便最后的識(shí)別,論文將得到的分割圖像反色后填充,得到在白色背景前的圖像。
(2)與模板庫中的字母逐一進(jìn)行相關(guān)運(yùn)算,尋找相關(guān)度最大值所對(duì)應(yīng)的模板;
在字符識(shí)別中對(duì)于實(shí)現(xiàn)離散輸入模式分類最為有效的方法采用模板匹配,其實(shí)質(zhì)內(nèi)容就是度量輸入和樣本之間所存在的某種相似性,取相似性最大者為輸入模式所屬類別,它根據(jù)字符的直觀形象抽取特征,用相關(guān)匹配原理進(jìn)行識(shí)別,即將輸入字符與標(biāo)準(zhǔn)字符在一個(gè)分類器中進(jìn)行匹配。字符相關(guān)匹配算法如下:
將分割好的字符作為輸入字符和標(biāo)準(zhǔn)模版函數(shù)的大小均調(diào)整為640×480,用MATLAB中的corr2函數(shù)直接一一計(jì)算兩個(gè)字符圖像間的相似度和相關(guān)系數(shù)。然后尋找出擁有最大相關(guān)值的模板。
(3)輸出與此相關(guān)度最大的模板。
超分辨率重建有著越來越廣泛的應(yīng)用場(chǎng)合:(1)將從視頻信號(hào)中采集的圖像重建位高分辨率圖片;(2)有線電視系統(tǒng)中將標(biāo)清電視轉(zhuǎn)換為高清電視;(3)在醫(yī)學(xué)成像系統(tǒng)中(如CT、超聲波儀器等)、車牌識(shí)別等實(shí)際應(yīng)用中也具有很重要的意義。
[1]楊浩.一種基于實(shí)例的文本圖像超分辨率重建算法[J].東南大學(xué)學(xué)報(bào),2008.
[2]朱翚.利用MATLAB進(jìn)行圖像重建的算法研究[D].蘇州:蘇州大學(xué),2003,(12)
[3]王慧琴.數(shù)字圖像處理[M].北京:北京郵電大學(xué)出版社,2006.
[4]阮秋琦.數(shù)字圖像處理學(xué)[M].北京:電子工業(yè)出版社,2007.2:382.
[5]賈永紅.數(shù)字圖像處理 [M].武漢:武漢大學(xué)出版社,2003.9:197-198.
[6]高成.MATLAB圖像處理與應(yīng)用[M].北京:國防工業(yè)出版社,2007.4.