謝宇,周學(xué)禮,2,胡岳
(1.常熟理工學(xué)院 物理與電子工程學(xué)院,江蘇 常熟 215500;2.上海大學(xué)通信與信息工程學(xué)院,上海 200072)
互信息算法在車牌識別中的應(yīng)用研究
謝宇1,周學(xué)禮1,2,胡岳1
(1.常熟理工學(xué)院 物理與電子工程學(xué)院,江蘇 常熟 215500;2.上海大學(xué)通信與信息工程學(xué)院,上海 200072)
將醫(yī)學(xué)圖像配準(zhǔn)中的互信息算法移植到車牌識別系統(tǒng),首先基于顏色信息快速定位車牌并校準(zhǔn)分割出待識別的車牌字符,然后計算分割字符與字庫字符的互信息值,互信息值的大小反映了圖像之間的相似程度,最后通過比較互信息值的大小確定最終結(jié)果.實驗證明,互信息算法相對其他車牌識別常規(guī)算法能更準(zhǔn)確反映出圖像之間的相似度,從而得到更精確的識別效果.
圖像配準(zhǔn);互信息;車牌識別
在交通管控系統(tǒng)發(fā)展中,智能化是必然趨勢,作為智能交通管控系統(tǒng)中的重要一環(huán),車牌識別系統(tǒng)發(fā)揮著越來越重要的作用.完整的車牌識別系統(tǒng)[1]主要包括車牌定位和字符識別兩個部分,字符識別的正確與否關(guān)系到整個系統(tǒng)的成敗,是車牌識別系統(tǒng)的關(guān)鍵所在.目前在將字庫模板與提取字符比較這方面,大多采用模板匹配法,由于在字符分割時會產(chǎn)生一些誤差以及模板字符不夠標(biāo)準(zhǔn),此方法往往在細(xì)節(jié)方面有所缺欠,識別準(zhǔn)確度不足.本文將互信息算法引入車牌識別系統(tǒng),通過精確測量圖像之間的互信息,找出相似度最高的字符.實驗表明該算法相較于通常使用的灰度特征統(tǒng)計法更為精確高效.
車牌識別的總體流程為:讀取圖像,圖像預(yù)處理,字符識別,輸出識別結(jié)果四部分,圖1為車牌識別的整體流程圖.
在讀取待處理圖像后,預(yù)處理時本文針對車牌的藍(lán)色特征,采用檢測圖像中藍(lán)色像素點的方法,快速定位出車牌位置.然后通過Radon變換對車牌進(jìn)行傾斜校正,由于校正后的圖像中仍然存在干擾區(qū)域,故用自適應(yīng)閾值函數(shù)對圖像進(jìn)行擦除處理,并將圖像二值化,本文采用的模板字庫是白底黑字,還要通過擦除反色來保持字符特征的一致性.再通過對圖像的Y方向處理后采用垂直投影對字符進(jìn)行分割,最后分別計算并比較分割字符和字庫字符的互信息值,找出與分割字符相似度最高的字庫字符,最后以文本格式輸出.
2.1 車牌定位
目前我國大多數(shù)省、市、自治區(qū)車牌均為藍(lán)底白字,本文采用藍(lán)色像素統(tǒng)計法對車牌進(jìn)行快速定位.首
先對藍(lán)色像素進(jìn)行篩選,大致確定車牌區(qū)域,然后統(tǒng)計藍(lán)色積累像素點最多的行和列,找出車牌的上下邊界和左右邊界.同時為了避免同一幅圖中包含多塊藍(lán)色區(qū)域?qū)е鲁绦虻腻e誤識別或無法運行,本文對已確定區(qū)域的白色像素進(jìn)行統(tǒng)計來確認(rèn)該區(qū)域是否為車牌區(qū)域.圖2為待識別圖像,圖3為定位后的車牌圖像.
2.2 車牌校正和分割
在本處理環(huán)節(jié),首先對圖像進(jìn)行傾斜校正,直線通常對應(yīng)重要的邊緣信息[2],提取圖像的直線邊緣并記錄直線的傾斜角度,多用于Hough變換.本文考慮到其處理相對比較繁雜,采用了更為簡便的Radon變換,計算圖像在某一指定角度射線方向上的二維投影數(shù)據(jù)和投影角度[3],而后將圖像按記錄的傾斜角旋轉(zhuǎn),如圖4所示.然后通過最大類間方差法自行尋找合適的閾值并對圖像進(jìn)行擦除處理,將車牌邊框之外的干擾消除.圖5為噪聲消除后的效果.
本文采用的模板字庫字符是白底黑字,故需要進(jìn)行擦除反色處理,處理結(jié)果如圖6所示.反色擦除后將車牌的灰度像素沿垂直方向累加,因為字符域是黑色,字符之間為白色,所以車牌投影在字符處為波谷,在字符間為波峰,通過尋找峰值點即可對其進(jìn)行分割[4].字符分割結(jié)果見圖7.
3.1 互信息理論
互信息[5]是信息理論中的一個基本概念,通常用于描述兩個系統(tǒng)間的統(tǒng)計相關(guān)性,或者是一個系統(tǒng)中所包含的另一個系統(tǒng)中信息的多少,它可以用熵來描述,圖像的熵用來描述圖像的概率分布.
將兩幅待比較的圖像A和B的灰度值看成兩個隨機(jī)變量A和B,其概率分布可以分別用它們的熵,即H(A)和H(B)來表示:
它們的聯(lián)合信息熵可以表示為
隨機(jī)變量的互信息可以表示為
其中a∈A,b∈B,PA(a)和PB(b)分別是系統(tǒng)A和B完全獨立時的的概率分布.PAB(a,b)是系統(tǒng)A和B的聯(lián)合概率分布.
令圖像A和B的互信息為I(A,B),將式(1)、(2)、(3)分別代入式(4),即可得到圖像互信息的計算公式:
在車牌識別系統(tǒng)中,雖然分割字符圖像和字庫字符圖像來源不同,但它們都是基于共同個體的同一位置的解剖信息[6],所以當(dāng)兩幅圖像的互信息值越大,就說明它們像素所對應(yīng)的灰度點重疊越多,即兩幅圖像的相似度越高,通過比較互信息值的大小來篩選出字庫字符中與分割字符最相似的字符.
雖然互信息測度在相似性度量方面有著成功的應(yīng)用,但由于兩幅圖像重疊部分的大小對互信息測度有著較大的影響,互信息值跟兩幅圖像重疊部分的大小成正比,重疊部分增加,參與統(tǒng)計互信息的像素增加,使互信息值增大,所以最大互信息值并不能保證相應(yīng)字符的準(zhǔn)確識別.因此,Studholme等提出了一個歸一化互信息測度,歸一化互信息能減少對圖像重疊部分的敏感性,計算精度更高.歸一化線性函數(shù)轉(zhuǎn)換如下:
其中x、y分別為轉(zhuǎn)換前、后的值,max Value、min Value分別為樣本的最大值和最小值.
在互信息測度中加入歸一化處理后,可以使得該算法具有更強(qiáng)的穩(wěn)定性.
3.2 車牌字符識別實現(xiàn)
在實現(xiàn)車牌字符識別時,首先在讀入圖像a和圖像b時應(yīng)當(dāng)注意圖像文件的維度.本文使用的字庫中的圖像雖然只有黑白兩色,但仍然有RGB三個通道,要預(yù)先用rgb2gray函數(shù)處理.接著使用歸一化直方圖來計算聯(lián)合信息熵.本模塊核心代碼如下:
然后通過計算兩幅圖的聯(lián)合信息熵H(ab)以及本身的信息熵H(a)、H(b),可以得出兩幅圖的互信息值為MI=H(a)+H(b)-H(ab).
相較于常用的模板匹配法以及其他一些方法如SSIM算法[7]等關(guān)于“2”和“Z”混淆,“0”和“D”混淆的情況,互信息算法更具有優(yōu)勢,筆者以上文圖中數(shù)字“2”為例,分別計算了其與模板中“2”和“Z”的互信息值為0.7373和0.3448,兩結(jié)果相差較大,即使圖像有一定的噪聲,也能準(zhǔn)確識別,不需要像SSIM算法等再對其角點進(jìn)行分析作二次處理.
利用上述車牌識別算法對車牌進(jìn)行識別實驗分析,本文算法運用MATLAB仿真工具實現(xiàn),計算程序采用MATLAB R2009,在P4 2.39 GHz、內(nèi)存2 GB的計算機(jī)上仿真實現(xiàn),實驗步驟如下:
a)采用藍(lán)色像素統(tǒng)計法對車牌進(jìn)行快速定位;
b)利用Radon變換車牌傾斜校正;
c)通過最大類間方差法尋找合適的閾值對圖像進(jìn)行擦除處理,消除車牌邊框之外的干擾;
d)進(jìn)行擦除反色處理以適合本文白底黑字模板字庫;
e)基于互信息算法進(jìn)行字符識別,完成車牌自動識別全過程.
實驗結(jié)果如圖3~8所示,其中圖8為車牌識別結(jié)果,很明顯,該算法可以正確識別車牌.
筆者選用了1000幅全國共23省藍(lán)底圖像測試該算法的普遍適用性,結(jié)果準(zhǔn)確識別了987幅,成功率98.7%.對于黃色底紋和白色底紋的車牌,只需要將運行代碼中表示藍(lán)色像素點的數(shù)字范圍修改為黃色像素范圍和白色像素范圍即可.
為了驗證互信息算法的優(yōu)越性,本文對1000副車牌圖像分別采用互信息算法和模板匹配法進(jìn)行處理,其中互信息算法準(zhǔn)確識別了987幅,模板匹配法準(zhǔn)確識別了903幅,模板匹配法典型識別錯誤是:如果英文字母與數(shù)字圖像相近則易識別錯誤,如“0”與“D”、“2”與“Z”“5”與“G”.
實驗結(jié)果如圖9所示:從實驗結(jié)果可以發(fā)現(xiàn)模板匹配法將圖9中的“0”誤識別為“D”,而互信息法則能準(zhǔn)確識別.由此可見互信息算法的精確度更高且具有較強(qiáng)的魯棒性.
本文將醫(yī)學(xué)圖像配準(zhǔn)中的互信息算法融合到車牌識別系統(tǒng)中,通過實驗可以看出,相較于模板匹配法,互信息值算法在細(xì)節(jié)方面更有優(yōu)勢,可以更精確地識別車牌,且不需要二次處理,取得了令人滿意的效果,證明該算法高效、穩(wěn)定,且易于實現(xiàn).
[1]Choudhury A,Rahman,Wael Badawy,et al.A Real Time Vehicle’s License Plate Recognition System[C].Proceedings of the IEEE Conference on Advanced Video and Signal Based Surveillance,2003∶163-166.
[2]趙小川.MATLAB數(shù)字圖像處理實戰(zhàn)[M].北京:機(jī)械工業(yè)出版社,2013:94.
[3]劉剛.MATLAB數(shù)字圖像處理[M].北京:機(jī)械工業(yè)出版社,2010:82.
[4]陳希.車牌識別技術(shù)研究[D].北京:北京交通大學(xué),2011.
[5]陳顯毅.圖像配準(zhǔn)技術(shù)及其MATLAB編程實現(xiàn)[M].北京:電子工業(yè)出版社,2009:142-149.
[6]馮林.基于互信息的醫(yī)學(xué)圖像配準(zhǔn)技術(shù)研究進(jìn)展[D].大連:大連理工大學(xué),2005.
[7]王晨,丁輝.基于SSIM的車牌識別算法研究[D].北京:首都師范大學(xué),2013.
Application of Mutual Information Algorithm in License Plate Recognition
XIE Yu1,ZHOU Xue-li1,2,HU Yue1
(1 School of Physics and Electronic Engineering,Changshu Institute of Technology,Changshu,215500,China; 2.School of Communication and Information Engineering,Shanghai University,Shanghai 200072,China)
The mutual information algorithm in this paper is transp lanted from medical image registration into license plate recognition.First,the color of the license plate character information is used to locate the license plate quickly,and calibrate,split out the character to be identified.Then themutual information is calculated between segmented character and font character,and mutual information value reflects the degree of similarity between images.Finally,the final result is determined by comparing the size of the mutual information.The experiment has proved that mutual information algorithm can more accurately reflect the sim ilarity between images compared with other conventional algorithms,thus a more ideal and accurate identification is achieved for license plate recognition.
image registration;mutual information;license plate recognition
TP391.41
A
1008-2794(2014)04-0078-05
2014-03-01
江蘇省自然科學(xué)基金項目“高灰階低干擾LED顯示驅(qū)動芯片關(guān)鍵技術(shù)研究”(BK 2011366)
周學(xué)禮,副教授,博士,研究方向:計算機(jī)圖形學(xué)及醫(yī)學(xué)圖像處理,嵌入式系統(tǒng)設(shè)計,E-mail∶zhouxueli@163.com.