王莉麗+于印
摘要:針對(duì)目前主流文本圖像字符分割方法面臨的問題,考慮投影法及改進(jìn)方法容易實(shí)現(xiàn)之優(yōu)點(diǎn),提出了一種行與列投影的文本圖像字符分割新方法,以通過雙向掃描分割字符。首先對(duì)文本圖像進(jìn)行行投影,接著,實(shí)施列投影操作,最后,根據(jù)投影譜圖統(tǒng)計(jì)字符內(nèi)、外間距,分割單個(gè)字符。試驗(yàn)表明,提出的方法能快速準(zhǔn)確分割文本圖像字符。
關(guān)鍵詞:文本圖像處理;字符分割;投影法
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)05-0074-02
傳統(tǒng)的數(shù)據(jù)主要以紙質(zhì)文件為載體,但紙張文件存在不易保存、不易共享等缺點(diǎn)。隨著信息化與數(shù)字化技術(shù)的飛速發(fā)展, 越來越多的文檔以電子格式存儲(chǔ)。電子文本具有空間占用小,易于保存等優(yōu)點(diǎn),受到了公眾廣泛的歡迎。為了充分利用以往的海量紙質(zhì)版文檔數(shù)據(jù),對(duì)其數(shù)字化成為信息化建設(shè)領(lǐng)域亟待解決的主要問題之一。
文本圖像字符分割是紙質(zhì)文檔數(shù)字化的關(guān)鍵問題之一。自上世紀(jì) 70 年代起,從圖像中自動(dòng)提取文字的技術(shù)研究逐漸開展,到了上世紀(jì)90 年代末,受益于多媒體技術(shù)日新月異發(fā)展,圖像文字獲取逐漸成為研究熱點(diǎn),許多學(xué)者在上述領(lǐng)域做了積極的研究與嘗試,提出了諸多字符分割方法[1-6]。字符分割操作一般分為兩個(gè)步驟,首先定位與檢測圖像主要信息區(qū)域,即文字區(qū)域,一般使用矩形框來標(biāo)記,原圖像被分離多個(gè)子圖像。然后分別從子圖像中提取像素(提?。?。但這兩個(gè)步驟沒有嚴(yán)格的界限,某些算法在進(jìn)行字符檢測時(shí)同時(shí)字符提取的功能也得到實(shí)現(xiàn),一些算法在不進(jìn)行字符區(qū)域檢測的情況下也能夠直接實(shí)現(xiàn)提取。目前的字符分割算法有很多,大體來說,現(xiàn)有主要的字符分割方法可以被分為五類: 基于連通分析、基于灰度以及基于邊緣的方法、基于紋理的方法、基于垂直投影的方法。目前字符分割方法面臨的主要問題有:(1)分割效率較低;(2)對(duì)字符大小、語言特征要求高;(3)復(fù)雜背景適應(yīng)性差。為此,本文提出了一種新的有效文字圖像字符分割方法。
1 提出的分割方法
觀察眾多文本圖像,發(fā)現(xiàn)文本圖像一般內(nèi)容規(guī)整,多數(shù)以行與列的形式存在。基于此觀察,提出本文方法,其基本思想是:將文本圖像進(jìn)行行與列掃描投影,行投影分割出文本圖像每行;而后進(jìn)一步做列掃描與投影,得到對(duì)應(yīng)的投影譜圖,根據(jù)字符列間距完成字符分割。具體流程圖與實(shí)施步驟見圖1。
首先將輸入待分割的圖像,若為特殊圖像,則需要將其轉(zhuǎn)化為matlab所能識(shí)別的格式,如tif,bmp,jpg等;然后提取有效區(qū)域。對(duì)行與列上的像素值進(jìn)行統(tǒng)計(jì),繼而求得行與列均值,進(jìn)而統(tǒng)計(jì)像素值為0的行與列;再者,找到行/列的始末跳變點(diǎn),以區(qū)分開字符區(qū)域及非字符區(qū)域,舍去上下及左右純空白區(qū)域之后,獲得出有效區(qū)域。
基于有效區(qū)域段落分割。采用行投影方法,標(biāo)記出間隔區(qū)域;接著,分析行特征,將文本以行形式提取出來?;谖谋揪远温涞男问酱嬖谶@一特征,根據(jù)段落內(nèi)與外行間隔有差異特性,完成分段操作。
最后實(shí)施字符分割。首先對(duì)段內(nèi)圖像做行投影,分割出段內(nèi)每行。接著,對(duì)行內(nèi)字符進(jìn)行列投影,標(biāo)記出間隔區(qū)域。為解決字符內(nèi)空隙、標(biāo)點(diǎn)符號(hào)等對(duì)字符提取造成的偏差,需要后期處理步驟,具體為比較求得的列間距與平均列間距,將兩者區(qū)分,實(shí)現(xiàn)單個(gè)字符分割。試驗(yàn)舉例見圖2。
2 結(jié)語
字符分割是文本圖像信息化的關(guān)鍵問題之一。針對(duì)該問題,本文分析了文本圖像以行列形式存在的特征,將該特性引入到傳統(tǒng)的投影法中,提出了基于行與列雙向掃描投影的文本圖像字符分割新方法,通過實(shí)驗(yàn)驗(yàn)證了所提方法的有效性。實(shí)驗(yàn)結(jié)果表明,新方法字符分割效率高,運(yùn)算速度快。
參考文獻(xiàn)
[1]李文舉,梁德群,王新年.質(zhì)量退化的車牌字符分割方法.計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào)[J].2004,16(5):697-700.
[2]王俊杰,黃心漢.一種對(duì)圖像進(jìn)行快速二值化處理的方[J]電子技術(shù)應(yīng)用,1998,24(10):16-17.
[3]M. Elad. Why simple shrinkage is till relevant for redundant representations. IEEE Transactions on Information Theory,2006,52(12): 5559-5569.
[4]胡小峰,周勇,葉慶泰.復(fù)雜背景彩色圖像中的文字分割[J].光學(xué)技術(shù),2006,32(1):141-147
[5]王勇,鄭輝,胡德文.圖像和視頻中的文字獲取技術(shù)[J].中國圖象圖報(bào),2004,9(5):532-538.
[6]Lia C L,Hui K C.Feature recognition by template matching.Computers and Graphics,2000(24):569-582.endprint