劉飛鵬,沈希忠
(上海應(yīng)用技術(shù)大學(xué) 電氣與電子工程學(xué)院,上海 201418)
?
圖像處理技術(shù)在車牌號識別領(lǐng)域中的算法改進(jìn)
劉飛鵬,沈希忠
(上海應(yīng)用技術(shù)大學(xué) 電氣與電子工程學(xué)院,上海 201418)
針對圖像處理技術(shù)在車牌號識別領(lǐng)域中的運(yùn)用,結(jié)合目前常用識別方法(模板匹配法、神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)識別法)和主要特征提取方式(統(tǒng)計(jì)特征提取和結(jié)構(gòu)特征提取)各自的優(yōu)點(diǎn),設(shè)計(jì)出一種多層分支結(jié)構(gòu)的車牌號識別系統(tǒng),該系統(tǒng)根據(jù)不同待識別字符的特征進(jìn)行分類,然后匹配上對該類特征識別較有優(yōu)勢的特征提取方法和字符識別算法,并提出一種對折識別算法運(yùn)用其中,通過對字符的分層識別和分支識別,從而達(dá)到精確、高效識別的目的,最后通過試驗(yàn)測試和統(tǒng)計(jì)分析,證明了該方法在車牌號識別中的優(yōu)越性。
車牌號識別;圖像處理;易混字識別
近年來,隨著國民經(jīng)濟(jì)的快速發(fā)展,機(jī)動(dòng)車數(shù)量增長迅猛,接踵而來的交通違章、肇事逃逸、車輛盜竊等行為呈現(xiàn)快速上升趨勢,給交通管理和車輛監(jiān)管部門造成不小的壓力。智能交通系統(tǒng)的開發(fā)和運(yùn)用已成為緩解交通管理問題的必然出路[1],而該系統(tǒng)中最主要的環(huán)節(jié)之一就是車牌號的智能識別。目前的車牌號識別方法有模板匹配法、神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)法(Support Vector Machine,SVM),其中后兩種方法需要先對字符特征進(jìn)行提取,字符特征提取的方式又可分為統(tǒng)計(jì)法和結(jié)構(gòu)特征法。統(tǒng)計(jì)法對字符的變形和噪點(diǎn)容錯(cuò)能力較強(qiáng),但對相似字符的細(xì)節(jié)特征難以區(qū)分;結(jié)構(gòu)特征提取法能夠分辨出字符的細(xì)節(jié)結(jié)構(gòu),但當(dāng)拍攝圖像清晰度不高時(shí)容易出現(xiàn)特征提取錯(cuò)誤。由于車牌字符特征的多樣化和拍攝環(huán)境的復(fù)雜化,運(yùn)用單一的字符特征提取方式和字符識別方式無法滿足字符識別較高正確率的要求,尤其不能滿足對相似字符的識別要求。
因此,為了實(shí)現(xiàn)對車牌字符更高的識別率,尤其提高對易混字符的識別率,本文在適當(dāng)改進(jìn)簡單字符識別算法的同時(shí),重點(diǎn)在易混淆字符的識別算法上進(jìn)行研究和改進(jìn),通過結(jié)合以上不同識別方法和不同特征提取方式的優(yōu)勢,同時(shí)運(yùn)用一種獨(dú)創(chuàng)的對折算法,設(shè)計(jì)出一種多層分支結(jié)構(gòu)的識別系統(tǒng),該系統(tǒng)本著簡單字符少分支、易混淆字符巧分支的原則,在實(shí)現(xiàn)提高字符正確識別率的同時(shí),讓系統(tǒng)具有更加簡潔、高效的工作效率。
在車牌號識別過程中主要運(yùn)用到圖像處理技術(shù),該過程主要包括圖像的采集、車牌的定位、字符的分割[2]和字符的識別[3]。經(jīng)過前期圖像處理分割出的字符如圖1所示,字符識別環(huán)節(jié)是車牌信息獲取的關(guān)鍵,也是本領(lǐng)域研究的熱點(diǎn),目前主流的車牌號識別方法有模板匹配法、神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)法。
圖1 分割處理后的車牌字符
1.1 基于模板匹配的識別方法
模板匹配法的識別過程為:首先建立模板庫,然后對待識別字符進(jìn)行特征提取,通過待識別字符的特征向量與模板庫中字符的特征向量進(jìn)行比對,相似度最高的模板所對應(yīng)的字符即為待識別字符的識別結(jié)果,該方法的優(yōu)點(diǎn)是原理簡單、算法簡潔、識別速度快,但該算法對字符的變形容錯(cuò)能力較差。
1.2 基于人工神經(jīng)網(wǎng)絡(luò)的識別方法
人工神經(jīng)網(wǎng)絡(luò)由輸入層、中間層和輸出層組成,其結(jié)構(gòu)如圖2所示,理論上通過3層神經(jīng)網(wǎng)絡(luò)即可無限擬合任意非線性函數(shù),人工神經(jīng)網(wǎng)絡(luò)識別方法的優(yōu)點(diǎn)為對字符的噪聲及變形不敏感,容錯(cuò)能力較強(qiáng),其不足為該識別方法對相似字符的細(xì)節(jié)結(jié)構(gòu)難以區(qū)分。另外,因其神經(jīng)元較多、運(yùn)算量較大,實(shí)時(shí)性較差。
圖2 人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
1.3 基于支持向量機(jī)的識別方法
支持向量機(jī)(SVM)是一種基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)算法,其原理為將輸入的樣本向量通過核函數(shù)映射到一個(gè)高維空間,然后求出由多個(gè)支持向量構(gòu)成的最優(yōu)分類超平面,使得超平面間的分類間距盡量大,這樣就使得分類錯(cuò)誤的風(fēng)險(xiǎn)盡量小,簡而言之,即高維空間的線性規(guī)劃問題。因該算法具有較好的過度擬合訓(xùn)練樣本功能。 因此,SVM對于即使未見過的測試樣本也具有較好的分類功能。
圖3 字符識別整體流程圖
要進(jìn)一步提高車牌號識別的正確率,首先要吸取原有識別算法的識別優(yōu)勢,其次要對不同特征的字符進(jìn)行分類識別,同時(shí),最關(guān)鍵要在易混淆字符的識別上采取更加有效的識別算法。本系統(tǒng)在識別算法上采用多層分支結(jié)構(gòu),對不同分支采用對應(yīng)更有效的識別算法,同時(shí),對于一級識別中識別出的字符屬于易混淆字符的,再根據(jù)該字符在易混淆字符中的分組,進(jìn)行二次甚至多次識別,直到準(zhǔn)確識別出易混字符的特征為止。本系統(tǒng)的整體工作流程圖如圖3所示。
2.1 車牌漢字的識別
在車牌的左側(cè)第一個(gè)字符為漢字,其外形如圖4所示,為了能清晰識別字符的細(xì)節(jié)結(jié)構(gòu)特征,該系統(tǒng)采用模板匹配算法作為漢字的識別算法。另外,該系統(tǒng)在模板匹配前增加了一個(gè)黑像素點(diǎn)統(tǒng)計(jì)環(huán)節(jié),然后把漢字模板庫中黑像素?cái)?shù)目與待測字符最相近的10個(gè)作為模板子集進(jìn)行匹配,這樣既減小了模板匹配數(shù)量,又提高了模板匹配效率。
圖4 車牌字符中的漢字
2.2 字母和數(shù)字字符的一級識別
對于車牌中字母和數(shù)字的一級識別,如圖5所示。在字符特征提取方面,采用統(tǒng)計(jì)特征提取和結(jié)構(gòu)特征提取[4]相結(jié)合的方法,在字符識別算法的選擇方面,因?qū)ψ址卣魈崛〉臄?shù)據(jù)稍多,因此在字母和數(shù)字的一級識別階段,采用SVM支持向量機(jī)識別算法。在字符的統(tǒng)計(jì)特征提取方面,采用水平投影和豎直投影相結(jié)合的方式,即對每行和每列黑像素的點(diǎn)數(shù)進(jìn)行統(tǒng)計(jì),如圖6所示為字母“C”的水平投影統(tǒng)計(jì)圖。在結(jié)構(gòu)特征提取方面,將每個(gè)待測字符分成8列16行的小方格,統(tǒng)計(jì)每個(gè)小方格中的黑像素點(diǎn)個(gè)數(shù),然后再除以該字符中總的黑像素個(gè)數(shù),這樣每個(gè)字符通過統(tǒng)計(jì)特征與結(jié)構(gòu)特征提取將得到一個(gè)64+32+8×16=224維的特征向量。而原圖像為64×32=2 048維的數(shù)組,因此通過該方案的特征提取在保證字符整體特征和細(xì)節(jié)結(jié)構(gòu)的同時(shí)充分降低了特征向量的維數(shù)。
圖5 車牌中字母和數(shù)字字符
圖6 字母“C”的水平投影特征數(shù)據(jù)圖
然后,將待測字符的特征數(shù)據(jù)經(jīng)SVM算法運(yùn)算和處理,輸出待測字符的一級識別結(jié)果,如果識別結(jié)果為非易混字符,即可直接輸出識別結(jié)果,如果為易混字符,則進(jìn)入下一環(huán)節(jié)的易混字符識別算法。
2.3 易混字符的識別
在車牌的字符識別過程中,易混字的識別一直制約著車牌字符識別正確率的提高,本識別系統(tǒng)通過對易混字符單獨(dú)建立易混字符庫,同時(shí)將結(jié)構(gòu)相似的字符進(jìn)一步分組,然后根據(jù)每組易混字的特征分別采取對應(yīng)更加有效的識別算法,從而達(dá)到對易混字符準(zhǔn)確識別的目的。
經(jīng)相關(guān)資料查閱和實(shí)踐測試,總結(jié)出以下幾組易混字:
第1組:字母O,Q,D,數(shù)字0;
第2組:字母C,G;
第3組:字母Z,數(shù)字2;
第4組:字母S,數(shù)字5;
第5組:字母A,R,數(shù)字4。
因車牌上的字符都是專用字體,這里截取車牌中二值化處理后的第一組易混字,其形狀如圖7所示。
圖7 二值化的車牌字符專用字體
從圖7中可以看出字母”O(jiān)”與數(shù)字“0”在車牌中的結(jié)構(gòu)形式是一模一樣的,因此主要看該字符在車牌中出現(xiàn)的位置,出現(xiàn)在車牌的第二位即為字母“O”,出現(xiàn)在其他位置則根據(jù)車牌字符排列的規(guī)則進(jìn)行辨別[5],從此也可以看出部分文獻(xiàn)中想當(dāng)然地把字母“O”和數(shù)字“0”的識別方式表達(dá)為“矮胖”和“高瘦”的區(qū)別是一種純空虛理論。
在本組的易混字識別中,筆者采用對折算法進(jìn)行識別。首先,找到待識別字符黑色像素點(diǎn)中最下側(cè)和最上側(cè)像素點(diǎn)的縱坐標(biāo),分別表示為y1,y2,計(jì)算字符的水平中心線的縱坐標(biāo)y3,算法如式(1)所示
(1)
并檢測出縱坐標(biāo)為y3時(shí),字符中最左側(cè)和最右側(cè)黑像素的橫坐標(biāo)x1,x2, 計(jì)算字符的豎直中心線的橫坐標(biāo)x3,算法如式(2)所示,各坐標(biāo)在字符中的位置如圖8所示。
(2)
圖8 對折算法字符坐標(biāo)圖
首先,運(yùn)用式(3)算法,對字符進(jìn)行左右對折,公式中函數(shù)f(i,j)代表在坐標(biāo)(i,j)處圖像的像素點(diǎn)值,黑色為“1”,白色為“0”,C1代表待測字符左右對折后未重疊部分占字符總面積的比重,經(jīng)運(yùn)算后,如果C1為0,則待識別字符為字母“O”或數(shù)字“0”的符號
(3)
如果C1不為0,則進(jìn)行式(4)算法,對待測字符進(jìn)行上下對折,C2代表字符上下對折后未重疊部分占字符總面積的比重;如果C2為0,則待識別字符為字母“D”,如果不為0,則待識別字符為字母“Q”,如此即可準(zhǔn)確識別出該組易混淆字符。
(4)
第2組:字母C,G的字符識別。字母C,G在車牌專用字體中的形狀如圖9所示,對該組易混淆字符可以運(yùn)用式(4)算法對字符進(jìn)行上下對折,如果輸出的結(jié)果C2為0則為字母“C”,而字母“G”的對折后未重疊部分如圖10所示的斜線區(qū)域,從此圖可以看出未重疊部分還是很明顯的,因此當(dāng)C2大于5%時(shí),即未重疊部分大于整個(gè)字符部分的5%時(shí),則該字符即為字母“G”。
圖9 字母C,G在車牌專用字體中的形狀
圖10 字母G的上下對折未重疊部分
第3組:字母Z,數(shù)字2。字母Z與數(shù)字2在車牌中的字符外形如圖11所示,考慮到字符變形和傾斜等因素[6]的影響,會(huì)使特征差別不太明顯,因此這里采用水平投影數(shù)據(jù)上下折疊的算法,因?yàn)榧词棺址l(fā)生偏斜和形變,但因整體都有影響,經(jīng)投影折疊作差,干擾因素將被抵消,其原有的差別特征將仍能很好地提取出來,經(jīng)投影作差運(yùn)算,其輸出結(jié)果如果為0則為字母“Z”,否則為數(shù)字“2”。
圖11 字母Z、數(shù)字2在車牌中的字符外形
第4組:字母S、數(shù)字5。本組的識別方式與第三組的較為相似,這里不再詳細(xì)論述。
第5組:字母A,R,數(shù)字4。在某些僅僅利用結(jié)構(gòu)特征提取的識別算法中,該組將是一個(gè)很難區(qū)分的易混字,如果把結(jié)構(gòu)特征和統(tǒng)計(jì)投影特征相結(jié)合的方式進(jìn)行字符特征提取,該組字符在第一級識別中即可準(zhǔn)確地識別出來,因此,在該系統(tǒng)中,本組字符不屬于易混字。
綜上所述,在其他車牌號識別系統(tǒng)中的5組易混字符,在本文所設(shè)計(jì)的車牌號識別系統(tǒng)中,其實(shí)際易混
淆字符僅為4組,有效減少了易混字符的數(shù)量,同時(shí)也意味著有效地提高了車牌號識別的正確率。
本車牌號識別系統(tǒng)算法在宏碁E5-511便攜式計(jì)算機(jī)上用MATLAB7.10平臺進(jìn)行運(yùn)行,通過對300個(gè)待測車牌樣本進(jìn)行測試,從車牌圖像采集到識別出的字符串輸出,每個(gè)車牌識別平均用時(shí)2.779 s,即單個(gè)字符平均用時(shí)0.397 s,完全能滿足車牌號識別的實(shí)時(shí)性要求。如圖12所示,為本車牌號識別系統(tǒng)的測試界面。
通過對300個(gè)車牌樣本的識別結(jié)果進(jìn)行統(tǒng)計(jì),其統(tǒng)計(jì)結(jié)果如表1所示(最右側(cè)”整體識別正確率”下面數(shù)據(jù)為99.10%,有時(shí)顯示不出來,可通過鼠標(biāo)點(diǎn)擊該欄即可顯示出來)。
圖12 車牌號識別系統(tǒng)界面(截圖)
表1 識別正確率分類統(tǒng)計(jì)表
在車牌樣本測試過程中,識別錯(cuò)誤字符的詳細(xì)統(tǒng)計(jì)信息如表2所示。
表2 樣本測試時(shí)識別錯(cuò)誤字符詳細(xì)統(tǒng)計(jì)表
本車牌號識別系統(tǒng)與同領(lǐng)域其他車牌號識別系統(tǒng)的正確率情況對比如表3所示。
結(jié)果分析:從表1可以看出,雖然整體的識別正確率已經(jīng)很高,但漢字的識別正確率仍然較低,其次是易混淆字符的識別率,雖然在識別過程中運(yùn)用了多種識別算法進(jìn)行優(yōu)勢互補(bǔ),但仍然難以與簡單字符的正確率相平齊,另外可以看出,簡單字符的識別技術(shù)已經(jīng)基本趨于成熟。
從表2數(shù)據(jù)分析,“贛”字識別錯(cuò)誤的原因?yàn)橐蛟撟止P畫復(fù)雜,同時(shí)拍攝清晰度有限,后經(jīng)提高清晰度處理后,就不再出現(xiàn)該種錯(cuò)誤。對于“魯”與“晉”,因這兩個(gè)字符的統(tǒng)計(jì)特征曲線圖較為相似,但在漢字中未設(shè)置易混字識別環(huán)節(jié),導(dǎo)致識別錯(cuò)誤。對于字符“H”和“K”、字符“U”和“N”容易出現(xiàn)識別混淆,可以通過把這兩組字符也加入易混淆字符庫來解決。而對于易混淆字符中“0”與“D”仍然容易發(fā)生混淆,其原因?yàn)椤癉”在對折運(yùn)算后的差值因過小,已經(jīng)滿足判為“0”的閾值,“2”與“Z” 識別錯(cuò)誤的原因也類似,但如果閾值再調(diào)小一些,字符識別的抗干擾能力將降低,因此可以通過微調(diào)來選出更優(yōu)的閾值或增加深一層的特征識別算法來解決。
從表3中的信息進(jìn)行對比分析,本車牌號識別系統(tǒng)在一級識別和易混字識別的算法上都在同領(lǐng)域優(yōu)勢算法的基礎(chǔ)上做了進(jìn)一步優(yōu)化和改進(jìn),在字符識別正確率方面,該車牌號識別系統(tǒng)在同領(lǐng)域較高識別正確率的基礎(chǔ)上又提高了約一個(gè)百分點(diǎn),因此可以證明:本車牌號識別系統(tǒng)在算法上的優(yōu)化和改進(jìn)在提高識別正確率方面起到了顯著和積極的作用。
本車牌號識別系統(tǒng)通過在一次識別時(shí),對不同特征提取方式的優(yōu)勢互補(bǔ),在易混字符識別上通過多種識別方式的配合運(yùn)用,有效提高了系統(tǒng)的綜合性能。然后,通過對待測樣本的識別測試和結(jié)果統(tǒng)計(jì),該系統(tǒng)的識別正確率較文獻(xiàn)記載的最高正確率又提高了一個(gè)百分點(diǎn),因此,通過試驗(yàn)證明,該種優(yōu)化和改進(jìn)對系統(tǒng)的識別性能起到了顯著積極的作用。當(dāng)然該識別算法仍存在一定不足,隨著技術(shù)的不斷改進(jìn)和完善,車牌號智能識別系統(tǒng)一定能以更加成熟和穩(wěn)健的步伐在交通管理控制領(lǐng)域掀起一場新的技術(shù)革命。
[1] 柴治,陶青川,余艷梅,等.一種快速實(shí)用的車牌字符識別方法[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,39(3):465-468.
[2] 施麗紅,劉剛.基于改進(jìn)蜂群優(yōu)化的圖像分割算法[J].電視技術(shù),2016,40(2):37-44.
[3] 李會(huì)民,張仁津.基于改進(jìn)BP網(wǎng)絡(luò)的車牌字符識別方法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(3):619-621.
[4] 宋加濤,劉濟(jì)林.車輛牌照上英文和數(shù)字字符的結(jié)構(gòu)特征分析及提取[J].中國圖象圖形學(xué)報(bào),2002,7(9):945-949.
[5] 中華人民共和國機(jī)動(dòng)車號牌:GA36-92[S].[S.l.]:中華人民共和國公安部,1992.
[6] 王嘯晨,潘榕.基于圖像失真類型的自適應(yīng)圖像質(zhì)量評價(jià)方法[J].電視技術(shù),2016,40(2):137-140.
[7] 薛丹,孫萬蓉,李京京,等. 一種基于SVM的改進(jìn)車牌識別算法[J].電子科技,2013,26(11):19-23.
[8] 何兆成,佘錫偉,余文進(jìn),等.字符多特征提取方法及其在車牌識別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(23):228-231.
[9] 朱皓.基于易混淆字符集神經(jīng)網(wǎng)絡(luò)的車牌識別算法研究[D].武漢:華中師范大學(xué),2014.
劉飛鵬(1988— ),碩士生,主研圖像處理與智能識別;
沈希忠(1968— ),教授,主要研究方向?yàn)槊ば盘柼幚怼?/p>
責(zé)任編輯:閆雯雯
Improvement of image processing algorithm in license plate recognition
LIU Feipeng,SHEN Xizhong
(ElectricalandElectronicEngineeringCollege,ShanghaiUniversityofInstituteandTechnology,Shanghai201418,China)
A design of license plate number recognition system with multi layer branch structure is introduced,which combines the advantages of template matching method, neural network method, support vector machine method, statistical feature extraction and structure feature extraction method. Firstly, this system classifies these characteristics into different classes, then match these classes with feature extraction and character recognition algorithm,and a fold recognition algorithm is also employed in it. With the help of the characters and branch recognition, the system performance achieves accurate and efficient identification. Finally, the experiment results and statistical analysis prove that the design perform better than other systems in the license plate number recognition.
license plate number recognition;image processing technology;confusable word recognition
上海市科委項(xiàng)目(15ZR1440700)
劉飛鵬,沈希忠.圖像處理技術(shù)在車牌號識別領(lǐng)域中的算法改進(jìn)[J].電視技術(shù),2016,40(12):28-33. LIU F P,SHEN X Z. Improvement of image processing algorithm in license plate recognition [J]. Video engineering,2016,40(12):28-33.
TN911.73
A
10.16280/j.videoe.2016.12.006
2016-04-20