毛晚堆 劉海敬 孔偌琳
摘要:將考生試卷掃描成圖像的過程中,難免會出現(xiàn)試卷圖像的傾斜,繼而影響后續(xù)試卷信息的識別結(jié)果的準確度以及識別精度。為提高試卷處理的工作效率,通過對試卷圖像進行傾斜校正,以節(jié)省返工時間或手動處理時間。為此本文結(jié)合具體環(huán)境,通過初次檢測與深度檢測相結(jié)合的方法,在確保時間效率的情況下提高檢測的準確度,實驗表明,該方法能快速準確測量出試卷圖像的傾斜角度。
Abstract: In the process of scanning the test paper into images, it is inevitable that the image of the test paper will be tilted, which will affect the accuracy and recognition accuracy of the subsequent information of the test paper. In order to improve the efficiency of paper processing, by tilting the paper image to save rework time or manual processing time. For this reason, in combination with the specific environment and through the combination of initial detection and depth detection, the paper improves the detection accuracy in consideration of the time efficiency. Experiments show that this method can quickly and accurately measure the tilt angle of examination paper images.
關(guān)鍵詞:傾斜校正;Hough變換;網(wǎng)上閱卷
Key words: tilt correction;Hough transformation;online marking
中圖分類號:TP391? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2018)35-0230-02
0? 引言
網(wǎng)上閱卷系統(tǒng)中文本圖像的自動識別與處理技術(shù)的發(fā)展越來越成熟,而對文本圖像識別的準確率和效率的要求也越來越高。在考生試卷的掃描過程中,不可避免地會出現(xiàn)試卷圖像的傾斜,而試卷圖像的傾斜給后續(xù)試題分割帶來困難,影響閱卷老師評閱試卷。
目前圖像傾斜檢測方法有Hough變換法、基于投影的方法、最近鄰聚類的方法、基于小波變換的方法。其中基于Hough變換的方法通過檢測圖像中直線從而估計出傾斜角,取得了很好的精度[1]。
1? Hough變換
Hough變換利用圖像空間和參數(shù)空間點-線對偶性質(zhì),將共線的點變換為相交于同一點的曲線,將直線提取問題轉(zhuǎn)化為計數(shù)問題[2]。
Hough變換不僅抗噪能力較強,而且具有較強的魯棒性,在較低的信噪比下也能得到較好的效果,但其較高的時間復(fù)雜度和空間復(fù)雜度影響了它的使用。
一些科研工作者根據(jù)具體的應(yīng)用環(huán)境,提出基于Hough變換算法的改進方法以適應(yīng)環(huán)境要求。邱力為等人提出基于兩點組合原理的Hough變換直線檢測算法,能夠有效克服參數(shù)空間的量化誤差,具有較高的檢測精度以及較低的內(nèi)存消耗等優(yōu)點,但在信噪比較高的情況下檢測精度較低[3];瞿洋等人使用了變分辨率金字塔的策略,不僅減少了算法的計算量,而且也提高了算法的抗噪能力[4];芮挺等提出采用輪廓跟蹤方法去除牌照圖像中和校正無關(guān)的所有冗余信息并采用分級檢測的策略,最大程度減少校正過程的運算量,提高算法運行速度[5];梁添才等人提出對圖像進行水平軌跡線平滑處理后再采用分級Hough變換的思想實現(xiàn)傾角的檢測[6]。
2? 試卷傾斜校正算法
考生試卷中存在大量的文本信息和邊框線,其中文本走向或表格線的方向則反映出整個文本圖像的傾斜角度。在本文所涉及的環(huán)境下,只需檢測出傾斜角度信息,則可對傾斜試卷進行校正處理。根據(jù)圖像數(shù)據(jù),圖像出現(xiàn)倒置或90°傾斜,通過其他方法處理即可。
本文在Hough變換檢測直線原理的基礎(chǔ)上,結(jié)合研究環(huán)境,采用初次與深度相結(jié)合的方法進行傾角的檢測。傾斜校正方法如下:
①計數(shù)變量n的初始值為0。將標準試卷圖像兩者分別在x軸和y軸進行投影,可得到圖像分別在x軸和y軸的投影分布區(qū)間;將標準試卷圖像投影在x軸左起第一個大于閾值Rs的坐標記為x1,并將最后一個小于閾值R0坐標記為x2。將標準試卷圖像投影在y軸左起第一個大于閾值R0的坐標記為y1,并將最后一個小于閾值R0坐標記為y2。
②若計數(shù)變量n的值小于等于1,轉(zhuǎn)③,否則轉(zhuǎn)⑨;
⑦)利用傾斜校正算法計算圖像的傾斜角度,并將計數(shù)變量n的值增1,并對圖像進行旋轉(zhuǎn)處理,然后轉(zhuǎn)②;
⑧傾斜校正程序結(jié)束;
⑨將考生試卷作為特殊試卷手動處理,結(jié)束。
在待檢測區(qū)域中每隔t個長度選取一個點作為待檢測點,并將待檢測點的坐標存入數(shù)組pos中。定義兩個數(shù)組angArr和graArr,變量i初始值為1。
①如果i ④i=i+1,轉(zhuǎn)②; ⑤遍歷angArr和graArr兩個數(shù)組,找出出現(xiàn)次數(shù)最多的數(shù)值,若存在多個值出現(xiàn)次數(shù)相同,將多個值從小到大進行排序,計算相鄰兩個值之間的差距a,若a小于等于閾值m,則取這多個值的中間值為傾斜角度,否則t=t/2,轉(zhuǎn)①; ⑥結(jié)束。 3? 實驗結(jié)果與總結(jié) 為檢測算法效果,本文對1385份考生試卷進行了總體測試,在實際環(huán)境下檢測準確率在98%以上,優(yōu)于目前若干個商業(yè)軟件。 本文提出的基于改進Hough變換的試卷圖像校正方法,通過初次檢測與深度檢測相結(jié)合的方法,在追求高準確度的要求下也達到節(jié)省時間的目的。實驗結(jié)果表明,該算法實現(xiàn)了試卷傾斜角度的檢測和校正。 參考文獻: [1]劉侃.基于分層隨機Hough變換的文本圖像傾斜檢測[J].中國體視學(xué)與圖像分析,2010,15(4):382-386. [2]謝忠紅.采摘機器人圖像處理系統(tǒng)中的關(guān)鍵算法研究[D].南京:南京農(nóng)業(yè)大學(xué),2013. [3]邱力為.直線參數(shù)檢測的快速哈夫變換[J].北京航空航天大學(xué)學(xué)報,2003,29(8):741-744. [4]瞿洋.Hough變換OCR圖象傾斜矯正方法[J].中國圖象圖形學(xué)報,2001,6(2):178-181. [5]芮挺.車牌識別中傾斜牌照的快速矯正算法[J].計算機工程,2004,30(13):122-123. [6]梁添才.基于Hough變換的列車客運票圖像傾斜校正[J].華南理工大學(xué)學(xué)報,2007,35(5):35-40.