李雪梅,車愛靜
(衡水學(xué)院電子信息工程學(xué)院 河北 衡水 053000)
近年來人才的競爭愈加激烈,為了更好地了解每個(gè)員工的工作情況,會(huì)定期對(duì)工作人員進(jìn)行考核,考核的標(biāo)準(zhǔn)一般為德、能、勤、績、廉5個(gè)方面。傳統(tǒng)的方式先將考核表分發(fā)給員工,大家根據(jù)標(biāo)準(zhǔn)在對(duì)應(yīng)表格位置處打?qū)矗俳y(tǒng)一收集起來,有專人進(jìn)行統(tǒng)計(jì),最后得出大家總的得分情況,這種方式費(fèi)時(shí)費(fèi)力,還容易出現(xiàn)統(tǒng)計(jì)錯(cuò)誤,因此提出來一種基于圖像處理的對(duì)勾識(shí)別算法,只需將收集好的考核表掃描為圖像,即可通過對(duì)圖像識(shí)別對(duì)考核表中的對(duì)勾位置進(jìn)行識(shí)別,從而統(tǒng)計(jì)出得分,節(jié)約了時(shí)間和人力、物力。
首先對(duì)收集好的考核表進(jìn)行掃描處理,得到考核表的數(shù)字圖像,為了后續(xù)識(shí)別的準(zhǔn)確性,需要對(duì)圖像進(jìn)行預(yù)處理,包括圖像的灰度化、二值化、去噪、傾斜校正、圖像歸一化等。
一般考核表為黑白圖像,只需進(jìn)行二值化即可,如果考核表是彩色表格,則需先對(duì)其進(jìn)行灰度化?;叶葓D像信息量較少,又要保留圖像有用的特征信息,由科學(xué)研究數(shù)據(jù)得知,人的眼睛對(duì)綠色最敏感,而對(duì)藍(lán)色最遲鈍,因此,對(duì)RGB的各個(gè)分量分別乘以不同權(quán)值,這樣使RGB不同分量的重要性能體現(xiàn)出來,處理后的灰度圖也更符合實(shí)際生活的需要,因此本文選用這種方法。加權(quán)平均值算法見式(1):
紙質(zhì)考核表轉(zhuǎn)化為電子圖像和進(jìn)行灰度化的過程中由于各種因素的影響會(huì)存在噪聲,為了后續(xù)更好地進(jìn)行圖像的識(shí)別,需要對(duì)其進(jìn)行去噪,提高清晰度。常用的濾波方法有:中值濾波、均值濾波和高斯濾波等方法。中值濾波是對(duì)一個(gè)窗口內(nèi)的像素點(diǎn)的灰度值重新進(jìn)行大小排序后,而噪聲點(diǎn)處的灰度值用重排后像素的中間值來代替。這樣可保存邊緣和細(xì)節(jié),但由于考核表中有大量的表格線,會(huì)被誤認(rèn)為噪聲,識(shí)別不出表格線,因此不適合中值濾波。高斯模糊處理方法的原理是用周圍像素的灰度平均值作為中間像素的值,結(jié)果會(huì)使得圖片中間的一些像素變得模糊。而考核表中有大量的表格線且相隔距離短,結(jié)果會(huì)造成表格模糊,不易識(shí)別表格的內(nèi)容。雙邊濾波處理方法將一個(gè)高斯方差加在高斯模糊的處理中,可以在去噪的同時(shí)保存了邊緣的信息,表格線不受影響,既去除了噪聲,圖像也不會(huì)模糊。
為了進(jìn)一步降低計(jì)算量,需要對(duì)圖像進(jìn)行二值化。圖像二值化即設(shè)定閾值,將灰度圖像進(jìn)行分類,將[0~255]的灰度級(jí)歸類為0或1。只要選取的閾值合適,轉(zhuǎn)換之后的圖像數(shù)據(jù)量減少,但并不會(huì)影響圖像局部和整體的特征。圖像二值化最重要的是閾值的選取,根據(jù)閾值選取方法的不同可劃分為固定閾值法與自適應(yīng)閾值法。固定閾值法是自己對(duì)圖片進(jìn)行實(shí)驗(yàn),確定一個(gè)固定的閾值,對(duì)于考核表這種灰度級(jí)比較簡單的圖像適合于用固定閾值法進(jìn)行二值化,考核表版面結(jié)構(gòu)明了清晰,灰度級(jí)差別明顯,灰度值相對(duì)固定,采用固定閾值(200,255)處理原圖像得到的二值化圖像效果比較好。二值化的圖像見圖1。
用掃描儀掃描的考核表圖片有時(shí)是傾斜的,為了識(shí)別的效果好,要對(duì)其進(jìn)行校正。而考核表中直線較多,比較適合用霍夫(Hough)變換來進(jìn)行校正[1],本文利用Hough變換原理來檢測直線。然后利用得出的直線斜率k0計(jì)算圖像傾斜角θ=arctan(k0),然后根據(jù)求得的傾斜角對(duì)圖像進(jìn)行修正,將圖像中心作為原點(diǎn)進(jìn)行旋轉(zhuǎn)。旋轉(zhuǎn)矩陣R如式(2):
得到旋轉(zhuǎn)后的坐標(biāo)如式(3):
由于圖像采集可能會(huì)受到很多因素的影響,造成采集到的圖像和原圖像的大小不同,影響識(shí)別的準(zhǔn)確率,所以要進(jìn)行圖像歸一化。圖像歸一化操作是指在不改變?cè)瓐D像信息的情況,將圖像轉(zhuǎn)化成規(guī)格一致、相對(duì)位置不變的圖像。由于考核測評(píng)表本身是一張A4紙張的大小,所以將尺寸大小統(tǒng)一調(diào)整為A4紙張的大小,即可實(shí)現(xiàn)圖像歸一化。
考核測評(píng)表的構(gòu)成比較簡單,由3部分組成,即表的標(biāo)題、主體和備注,主要識(shí)別的是主體部分[2]。從考核測評(píng)表的幾何結(jié)構(gòu)和邏輯結(jié)構(gòu)來看,它的版面規(guī)格大小統(tǒng)一,姓名區(qū)域和表格區(qū)域位置固定,而定位的任務(wù)分別在姓名區(qū)域和表格區(qū)域,識(shí)別的主體為表格區(qū)域,適合采用感興趣區(qū)域表格檢測法來進(jìn)行表格的定位。所謂感興趣區(qū)域即是一幅圖片里需要檢測識(shí)別的區(qū)域,而考核測評(píng)表需要識(shí)別的部分就是姓名區(qū)域和打?qū)吹谋砀駞^(qū)域,基于交互式的感興趣區(qū)域簡單方便高效,但對(duì)要處理的圖片有要求,不能過于復(fù)雜,目標(biāo)和背景簡單明確。而考核測評(píng)表的版面清晰簡單,對(duì)比明顯,正好適合用交互式的感興趣區(qū)域檢測方法[3]。
將二值化后的圖像的寬和高分別設(shè)置為width、high,圖像中需要定位的單元格起始點(diǎn)像素的坐標(biāo)位置為(x,y)。整張考核測評(píng)表自需要定位的考核人員姓名開始一共有16行單元格,因此需要進(jìn)行16次行檢測才可將考核表整頁的考核人員檢測出來。設(shè)置行計(jì)數(shù)器來記錄行檢測的次數(shù),直到檢測16次結(jié)束。同樣地對(duì)于列的檢測也是如此,考核表自左側(cè)考核人員姓名開始一共有20列,以左側(cè)像素起始坐標(biāo)x開始,沿著水平方向從左向右每隔一定的像素點(diǎn)作為一個(gè)感興趣區(qū)域,區(qū)域在x軸上的起始點(diǎn),循環(huán)執(zhí)行到圖像的最大寬度,如果x的值小于圖像的寬度,則繼續(xù)搜索,直到搜索到最大寬度為止。設(shè)置一個(gè)列計(jì)數(shù)器,一旦確定了一個(gè)感興趣區(qū)域,計(jì)數(shù)器則加一次并作為當(dāng)前感興趣區(qū)域的標(biāo)記符,計(jì)數(shù)器從1開始一直記錄到20(每行有20個(gè)單元格),一行搜索完畢后接著搜索下一行?;诮换ナ降母信d趣區(qū)域檢測方法根據(jù)預(yù)先設(shè)定的感興趣區(qū)域大小劃分出每一個(gè)單元格,并同時(shí)用計(jì)數(shù)器記錄當(dāng)前感興趣區(qū)域作為單元格的位置標(biāo)記。流程見圖2。
檢測出考核測評(píng)表的每個(gè)感興趣區(qū)域以后,再對(duì)表格內(nèi)的對(duì)勾進(jìn)行識(shí)別,而需要識(shí)別的對(duì)勾都處在一個(gè)固定的單元格中,每一個(gè)單元格對(duì)應(yīng)著不同考核標(biāo)準(zhǔn)的考核等級(jí),所以只要確定了哪個(gè)位置的單元打有對(duì)勾,就能獲得考核情況。鑒于考核表的版面結(jié)構(gòu),對(duì)于對(duì)勾的檢測可應(yīng)用以下兩種方法:一是根據(jù)像素統(tǒng)計(jì)法,二是角點(diǎn)檢測法。
像素統(tǒng)計(jì)法簡單易行,圖像經(jīng)過二值化處理后只有0和1兩種灰度級(jí),而沒有打?qū)吹谋砀窭锸?灰度級(jí),而打有對(duì)勾的表格內(nèi)在對(duì)勾部分是0灰度級(jí),所以只需要檢測表格內(nèi)灰度級(jí)為0的像素的多少即可,但是由于手寫打勾有時(shí)會(huì)超出表格到另一個(gè)格子里去,所以檢測的不是很準(zhǔn)確。
而角點(diǎn)檢測是檢測表格內(nèi)是否有角點(diǎn)。Harris角點(diǎn)檢測算法是一種簡單的、基于信號(hào)處理的,每個(gè)像素點(diǎn)周圍小窗口的二階導(dǎo)數(shù)圖像的自相關(guān)矩陣特征提取算子[4-5],比較適合檢測對(duì)勾,其檢測原理為圖像中的一個(gè)窗口沿著不同的運(yùn)動(dòng)方向在圖像不同區(qū)域中移動(dòng):(1)窗口在圖像中的平滑區(qū)域里移動(dòng)時(shí),窗口沿著任何一個(gè)方向一直運(yùn)動(dòng)下去,其運(yùn)功軌跡并沒有改變,見圖3a。(2)窗口在圖像中的邊緣區(qū)域中移動(dòng)時(shí),窗口一直沿著邊緣的方向運(yùn)動(dòng),其運(yùn)動(dòng)軌跡也不會(huì)發(fā)生變化,見圖3b。(3)窗口在圖像中的交點(diǎn)區(qū)域里移動(dòng)時(shí),窗口的運(yùn)動(dòng)軌跡向不同的方向延展發(fā)生改變,見圖3c。
通過觀察Harris角點(diǎn)檢測原理圖可以發(fā)現(xiàn)運(yùn)動(dòng)軌跡在圖像中不同區(qū)域里沿著各個(gè)方向發(fā)生了不同程度的變化,可根據(jù)這一特征確定圖像中某一點(diǎn)是否為角點(diǎn),Harris角點(diǎn)檢測是通過平移圖像中的窗口,造成圖像中灰度發(fā)生變化,從而判斷出角點(diǎn)的位置。Harris角點(diǎn)檢測圖像局部灰度變化自相關(guān)函數(shù)為:
自相關(guān)函數(shù)E(m,n)代表窗口經(jīng)過平移[m,n]后得到的圖像灰度變化結(jié)果,I代表圖像中不同像素點(diǎn)的灰度,w(x,y)代表圖像的窗口。不同點(diǎn)的灰度變化是不同的,灰度變化最明顯的是角點(diǎn)區(qū)域。
圖像中某一點(diǎn)的微小移動(dòng)量[m,n]后灰度變化結(jié)果,可以進(jìn)一步化簡表示成:
上式中矩陣Q是一個(gè)二階矩陣,類似于自相關(guān)函數(shù)E(m,n)的Hessian 矩陣可以通過對(duì)圖像的像素點(diǎn)求導(dǎo)得到:
對(duì)圖像中任意一像素點(diǎn)進(jìn)行兩次求導(dǎo),當(dāng)存在一階導(dǎo)數(shù)并且是極大值,二階導(dǎo)數(shù)為零時(shí),即矩陣Q存在兩個(gè)較大的特征值,此時(shí)認(rèn)為圖像中灰度自相關(guān)函數(shù)E(m,n)在該點(diǎn)的曲率最大,說明此點(diǎn)是一個(gè)角點(diǎn)。一般情況下,沒打?qū)吹膯卧駜?nèi)是不存在任何角點(diǎn)的,當(dāng)有對(duì)勾時(shí)單元格內(nèi)會(huì)有至少3個(gè)強(qiáng)角點(diǎn)存在,見圖4。輸出有角點(diǎn)表格的位置坐標(biāo),即可完成對(duì)勾位置的確定。
采集100張考核測評(píng)表的圖像,經(jīng)過預(yù)處理后,分別用像素統(tǒng)計(jì)法和角點(diǎn)檢測法進(jìn)行對(duì)勾識(shí)別實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果見表1。
表1 考核表實(shí)驗(yàn)測試
由實(shí)驗(yàn)結(jié)果可以看出,用角點(diǎn)檢測法來識(shí)別表格中對(duì)勾的識(shí)別率高達(dá)98%,而像素統(tǒng)計(jì)法的識(shí)別率略低一些,因此采用角點(diǎn)檢測法來檢測表格中的對(duì)勾比較合適。
傳統(tǒng)的人工統(tǒng)計(jì)考核測評(píng)表的結(jié)果費(fèi)時(shí)費(fèi)力,本文運(yùn)用數(shù)字圖像處理技術(shù)將收集好的考核測評(píng)表用掃描儀轉(zhuǎn)換為數(shù)字圖像,先對(duì)其進(jìn)行預(yù)處理,處理完成后確定圖像的感興趣區(qū)域,對(duì)感興趣區(qū)域進(jìn)行定位,最后采用角點(diǎn)檢測法識(shí)別出對(duì)勾所在的位置,從而確定被考核人員的考核結(jié)果。經(jīng)過試驗(yàn)測試,此算法用于自動(dòng)提取識(shí)別考核測評(píng)表的對(duì)勾具有可行性和實(shí)用性。