謝宇,周學(xué)禮,2,胡岳
(1.常熟理工學(xué)院 物理與電子工程學(xué)院,江蘇 常熟 215500;2.上海大學(xué)通信與信息工程學(xué)院,上海 200072)
互信息算法在車牌識(shí)別中的應(yīng)用研究
謝宇1,周學(xué)禮1,2,胡岳1
(1.常熟理工學(xué)院 物理與電子工程學(xué)院,江蘇 常熟 215500;2.上海大學(xué)通信與信息工程學(xué)院,上海 200072)
將醫(yī)學(xué)圖像配準(zhǔn)中的互信息算法移植到車牌識(shí)別系統(tǒng),首先基于顏色信息快速定位車牌并校準(zhǔn)分割出待識(shí)別的車牌字符,然后計(jì)算分割字符與字庫(kù)字符的互信息值,互信息值的大小反映了圖像之間的相似程度,最后通過(guò)比較互信息值的大小確定最終結(jié)果.實(shí)驗(yàn)證明,互信息算法相對(duì)其他車牌識(shí)別常規(guī)算法能更準(zhǔn)確反映出圖像之間的相似度,從而得到更精確的識(shí)別效果.
圖像配準(zhǔn);互信息;車牌識(shí)別
在交通管控系統(tǒng)發(fā)展中,智能化是必然趨勢(shì),作為智能交通管控系統(tǒng)中的重要一環(huán),車牌識(shí)別系統(tǒng)發(fā)揮著越來(lái)越重要的作用.完整的車牌識(shí)別系統(tǒng)[1]主要包括車牌定位和字符識(shí)別兩個(gè)部分,字符識(shí)別的正確與否關(guān)系到整個(gè)系統(tǒng)的成敗,是車牌識(shí)別系統(tǒng)的關(guān)鍵所在.目前在將字庫(kù)模板與提取字符比較這方面,大多采用模板匹配法,由于在字符分割時(shí)會(huì)產(chǎn)生一些誤差以及模板字符不夠標(biāo)準(zhǔn),此方法往往在細(xì)節(jié)方面有所缺欠,識(shí)別準(zhǔn)確度不足.本文將互信息算法引入車牌識(shí)別系統(tǒng),通過(guò)精確測(cè)量圖像之間的互信息,找出相似度最高的字符.實(shí)驗(yàn)表明該算法相較于通常使用的灰度特征統(tǒng)計(jì)法更為精確高效.
車牌識(shí)別的總體流程為:讀取圖像,圖像預(yù)處理,字符識(shí)別,輸出識(shí)別結(jié)果四部分,圖1為車牌識(shí)別的整體流程圖.
在讀取待處理圖像后,預(yù)處理時(shí)本文針對(duì)車牌的藍(lán)色特征,采用檢測(cè)圖像中藍(lán)色像素點(diǎn)的方法,快速定位出車牌位置.然后通過(guò)Radon變換對(duì)車牌進(jìn)行傾斜校正,由于校正后的圖像中仍然存在干擾區(qū)域,故用自適應(yīng)閾值函數(shù)對(duì)圖像進(jìn)行擦除處理,并將圖像二值化,本文采用的模板字庫(kù)是白底黑字,還要通過(guò)擦除反色來(lái)保持字符特征的一致性.再通過(guò)對(duì)圖像的Y方向處理后采用垂直投影對(duì)字符進(jìn)行分割,最后分別計(jì)算并比較分割字符和字庫(kù)字符的互信息值,找出與分割字符相似度最高的字庫(kù)字符,最后以文本格式輸出.
2.1 車牌定位
目前我國(guó)大多數(shù)省、市、自治區(qū)車牌均為藍(lán)底白字,本文采用藍(lán)色像素統(tǒng)計(jì)法對(duì)車牌進(jìn)行快速定位.首
先對(duì)藍(lán)色像素進(jìn)行篩選,大致確定車牌區(qū)域,然后統(tǒng)計(jì)藍(lán)色積累像素點(diǎn)最多的行和列,找出車牌的上下邊界和左右邊界.同時(shí)為了避免同一幅圖中包含多塊藍(lán)色區(qū)域?qū)е鲁绦虻腻e(cuò)誤識(shí)別或無(wú)法運(yùn)行,本文對(duì)已確定區(qū)域的白色像素進(jìn)行統(tǒng)計(jì)來(lái)確認(rèn)該區(qū)域是否為車牌區(qū)域.圖2為待識(shí)別圖像,圖3為定位后的車牌圖像.
2.2 車牌校正和分割
在本處理環(huán)節(jié),首先對(duì)圖像進(jìn)行傾斜校正,直線通常對(duì)應(yīng)重要的邊緣信息[2],提取圖像的直線邊緣并記錄直線的傾斜角度,多用于Hough變換.本文考慮到其處理相對(duì)比較繁雜,采用了更為簡(jiǎn)便的Radon變換,計(jì)算圖像在某一指定角度射線方向上的二維投影數(shù)據(jù)和投影角度[3],而后將圖像按記錄的傾斜角旋轉(zhuǎn),如圖4所示.然后通過(guò)最大類間方差法自行尋找合適的閾值并對(duì)圖像進(jìn)行擦除處理,將車牌邊框之外的干擾消除.圖5為噪聲消除后的效果.
本文采用的模板字庫(kù)字符是白底黑字,故需要進(jìn)行擦除反色處理,處理結(jié)果如圖6所示.反色擦除后將車牌的灰度像素沿垂直方向累加,因?yàn)樽址蚴呛谏址g為白色,所以車牌投影在字符處為波谷,在字符間為波峰,通過(guò)尋找峰值點(diǎn)即可對(duì)其進(jìn)行分割[4].字符分割結(jié)果見(jiàn)圖7.
3.1 互信息理論
互信息[5]是信息理論中的一個(gè)基本概念,通常用于描述兩個(gè)系統(tǒng)間的統(tǒng)計(jì)相關(guān)性,或者是一個(gè)系統(tǒng)中所包含的另一個(gè)系統(tǒng)中信息的多少,它可以用熵來(lái)描述,圖像的熵用來(lái)描述圖像的概率分布.
將兩幅待比較的圖像A和B的灰度值看成兩個(gè)隨機(jī)變量A和B,其概率分布可以分別用它們的熵,即H(A)和H(B)來(lái)表示:
它們的聯(lián)合信息熵可以表示為
隨機(jī)變量的互信息可以表示為
其中a∈A,b∈B,PA(a)和PB(b)分別是系統(tǒng)A和B完全獨(dú)立時(shí)的的概率分布.PAB(a,b)是系統(tǒng)A和B的聯(lián)合概率分布.
令圖像A和B的互信息為I(A,B),將式(1)、(2)、(3)分別代入式(4),即可得到圖像互信息的計(jì)算公式:
在車牌識(shí)別系統(tǒng)中,雖然分割字符圖像和字庫(kù)字符圖像來(lái)源不同,但它們都是基于共同個(gè)體的同一位置的解剖信息[6],所以當(dāng)兩幅圖像的互信息值越大,就說(shuō)明它們像素所對(duì)應(yīng)的灰度點(diǎn)重疊越多,即兩幅圖像的相似度越高,通過(guò)比較互信息值的大小來(lái)篩選出字庫(kù)字符中與分割字符最相似的字符.
雖然互信息測(cè)度在相似性度量方面有著成功的應(yīng)用,但由于兩幅圖像重疊部分的大小對(duì)互信息測(cè)度有著較大的影響,互信息值跟兩幅圖像重疊部分的大小成正比,重疊部分增加,參與統(tǒng)計(jì)互信息的像素增加,使互信息值增大,所以最大互信息值并不能保證相應(yīng)字符的準(zhǔn)確識(shí)別.因此,Studholme等提出了一個(gè)歸一化互信息測(cè)度,歸一化互信息能減少對(duì)圖像重疊部分的敏感性,計(jì)算精度更高.歸一化線性函數(shù)轉(zhuǎn)換如下:
其中x、y分別為轉(zhuǎn)換前、后的值,max Value、min Value分別為樣本的最大值和最小值.
在互信息測(cè)度中加入歸一化處理后,可以使得該算法具有更強(qiáng)的穩(wěn)定性.
3.2 車牌字符識(shí)別實(shí)現(xiàn)
在實(shí)現(xiàn)車牌字符識(shí)別時(shí),首先在讀入圖像a和圖像b時(shí)應(yīng)當(dāng)注意圖像文件的維度.本文使用的字庫(kù)中的圖像雖然只有黑白兩色,但仍然有RGB三個(gè)通道,要預(yù)先用rgb2gray函數(shù)處理.接著使用歸一化直方圖來(lái)計(jì)算聯(lián)合信息熵.本模塊核心代碼如下:
然后通過(guò)計(jì)算兩幅圖的聯(lián)合信息熵H(ab)以及本身的信息熵H(a)、H(b),可以得出兩幅圖的互信息值為MI=H(a)+H(b)-H(ab).
相較于常用的模板匹配法以及其他一些方法如SSIM算法[7]等關(guān)于“2”和“Z”混淆,“0”和“D”混淆的情況,互信息算法更具有優(yōu)勢(shì),筆者以上文圖中數(shù)字“2”為例,分別計(jì)算了其與模板中“2”和“Z”的互信息值為0.7373和0.3448,兩結(jié)果相差較大,即使圖像有一定的噪聲,也能準(zhǔn)確識(shí)別,不需要像SSIM算法等再對(duì)其角點(diǎn)進(jìn)行分析作二次處理.
利用上述車牌識(shí)別算法對(duì)車牌進(jìn)行識(shí)別實(shí)驗(yàn)分析,本文算法運(yùn)用MATLAB仿真工具實(shí)現(xiàn),計(jì)算程序采用MATLAB R2009,在P4 2.39 GHz、內(nèi)存2 GB的計(jì)算機(jī)上仿真實(shí)現(xiàn),實(shí)驗(yàn)步驟如下:
a)采用藍(lán)色像素統(tǒng)計(jì)法對(duì)車牌進(jìn)行快速定位;
b)利用Radon變換車牌傾斜校正;
c)通過(guò)最大類間方差法尋找合適的閾值對(duì)圖像進(jìn)行擦除處理,消除車牌邊框之外的干擾;
d)進(jìn)行擦除反色處理以適合本文白底黑字模板字庫(kù);
e)基于互信息算法進(jìn)行字符識(shí)別,完成車牌自動(dòng)識(shí)別全過(guò)程.
實(shí)驗(yàn)結(jié)果如圖3~8所示,其中圖8為車牌識(shí)別結(jié)果,很明顯,該算法可以正確識(shí)別車牌.
筆者選用了1000幅全國(guó)共23省藍(lán)底圖像測(cè)試該算法的普遍適用性,結(jié)果準(zhǔn)確識(shí)別了987幅,成功率98.7%.對(duì)于黃色底紋和白色底紋的車牌,只需要將運(yùn)行代碼中表示藍(lán)色像素點(diǎn)的數(shù)字范圍修改為黃色像素范圍和白色像素范圍即可.
為了驗(yàn)證互信息算法的優(yōu)越性,本文對(duì)1000副車牌圖像分別采用互信息算法和模板匹配法進(jìn)行處理,其中互信息算法準(zhǔn)確識(shí)別了987幅,模板匹配法準(zhǔn)確識(shí)別了903幅,模板匹配法典型識(shí)別錯(cuò)誤是:如果英文字母與數(shù)字圖像相近則易識(shí)別錯(cuò)誤,如“0”與“D”、“2”與“Z”“5”與“G”.
實(shí)驗(yàn)結(jié)果如圖9所示:從實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)模板匹配法將圖9中的“0”誤識(shí)別為“D”,而互信息法則能準(zhǔn)確識(shí)別.由此可見(jiàn)互信息算法的精確度更高且具有較強(qiáng)的魯棒性.
本文將醫(yī)學(xué)圖像配準(zhǔn)中的互信息算法融合到車牌識(shí)別系統(tǒng)中,通過(guò)實(shí)驗(yàn)可以看出,相較于模板匹配法,互信息值算法在細(xì)節(jié)方面更有優(yōu)勢(shì),可以更精確地識(shí)別車牌,且不需要二次處理,取得了令人滿意的效果,證明該算法高效、穩(wěn)定,且易于實(shí)現(xiàn).
[1]Choudhury A,Rahman,Wael Badawy,et al.A Real Time Vehicle’s License Plate Recognition System[C].Proceedings of the IEEE Conference on Advanced Video and Signal Based Surveillance,2003∶163-166.
[2]趙小川.MATLAB數(shù)字圖像處理實(shí)戰(zhàn)[M].北京:機(jī)械工業(yè)出版社,2013:94.
[3]劉剛.MATLAB數(shù)字圖像處理[M].北京:機(jī)械工業(yè)出版社,2010:82.
[4]陳希.車牌識(shí)別技術(shù)研究[D].北京:北京交通大學(xué),2011.
[5]陳顯毅.圖像配準(zhǔn)技術(shù)及其MATLAB編程實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2009:142-149.
[6]馮林.基于互信息的醫(yī)學(xué)圖像配準(zhǔn)技術(shù)研究進(jìn)展[D].大連:大連理工大學(xué),2005.
[7]王晨,丁輝.基于SSIM的車牌識(shí)別算法研究[D].北京:首都師范大學(xué),2013.
Application of Mutual Information Algorithm in License Plate Recognition
XIE Yu1,ZHOU Xue-li1,2,HU Yue1
(1 School of Physics and Electronic Engineering,Changshu Institute of Technology,Changshu,215500,China; 2.School of Communication and Information Engineering,Shanghai University,Shanghai 200072,China)
The mutual information algorithm in this paper is transp lanted from medical image registration into license plate recognition.First,the color of the license plate character information is used to locate the license plate quickly,and calibrate,split out the character to be identified.Then themutual information is calculated between segmented character and font character,and mutual information value reflects the degree of similarity between images.Finally,the final result is determined by comparing the size of the mutual information.The experiment has proved that mutual information algorithm can more accurately reflect the sim ilarity between images compared with other conventional algorithms,thus a more ideal and accurate identification is achieved for license plate recognition.
image registration;mutual information;license plate recognition
TP391.41
A
1008-2794(2014)04-0078-05
2014-03-01
江蘇省自然科學(xué)基金項(xiàng)目“高灰階低干擾LED顯示驅(qū)動(dòng)芯片關(guān)鍵技術(shù)研究”(BK 2011366)
周學(xué)禮,副教授,博士,研究方向:計(jì)算機(jī)圖形學(xué)及醫(yī)學(xué)圖像處理,嵌入式系統(tǒng)設(shè)計(jì),E-mail∶zhouxueli@163.com.