楊 英 倉
(貴州省道路交通事故鑒定工程技術(shù)研究中心 貴州 貴陽 550005)(貴州警官職業(yè)學(xué)院 貴州 貴陽 550005)
基于字符包絡(luò)和筆畫寬度的偽車牌判斷方法
楊 英 倉
(貴州省道路交通事故鑒定工程技術(shù)研究中心 貴州 貴陽 550005)(貴州警官職業(yè)學(xué)院 貴州 貴陽 550005)
車牌定位結(jié)果中往往存在一些誤檢,為了減少車牌識(shí)別后續(xù)模塊的計(jì)算負(fù)擔(dān),并提升最終識(shí)別結(jié)果準(zhǔn)確率,提出一種基于字符包絡(luò)分析和筆畫寬度統(tǒng)計(jì)的偽車牌排除方法。該方法將車牌定位結(jié)果圖像二值化和反色判斷后,對(duì)二值圖中字符前景的上下輪廓提取包絡(luò),統(tǒng)計(jì)上下包絡(luò)線的間距,設(shè)定閾值排除一部分偽車牌;再對(duì)二值圖像各行前景點(diǎn)進(jìn)行筆畫寬度統(tǒng)計(jì),計(jì)算得到多個(gè)指標(biāo),進(jìn)一步排除更多偽車牌。實(shí)驗(yàn)結(jié)果表明,該方法能排除復(fù)雜場景中的絕大多數(shù)偽車牌。
車牌定位 車牌誤檢 偽車牌 字符包絡(luò) 筆畫寬度
車牌識(shí)別在智能交通中發(fā)揮著巨大的作用,在道路卡口、收費(fèi)站、停車場等地方都有著廣泛的用途。車牌識(shí)別系統(tǒng)一般包括車牌定位、字符分割和字符識(shí)別三個(gè)模塊,其中車牌定位是較為關(guān)鍵的一部。目前已有很多較為成熟的方法,采用了字符紋理、車牌邊框、車牌區(qū)域顏色等各種特征。但無論采用什么方法,車牌定位得到檢測結(jié)果中,總會(huì)存在一些不是真實(shí)車牌的檢測區(qū)域,這些區(qū)域的顏色或紋理與真實(shí)車牌區(qū)域較為相似。由于所有車牌定位的檢測結(jié)果都會(huì)送入字符分割和字符識(shí)別模塊等后續(xù)模塊分析,偽車牌的存在增加了計(jì)算負(fù)擔(dān),并且,如果后續(xù)模塊不能有效排除這些偽車牌,最終會(huì)造成車牌識(shí)別結(jié)果的誤檢,對(duì)大部分車牌應(yīng)用造成較大的干擾。
偽車牌常見于出租車、公交車的車身廣告或字符串,部分偽車牌的二值圖如圖1所示。
圖1 部分偽車牌的二值圖
對(duì)偽車牌的排除,目前主要做法有兩種,一種是在強(qiáng)化車牌定位中的篩選環(huán)節(jié),另外一種是在字符分割或字符識(shí)別中進(jìn)行處理。
文獻(xiàn)[1-3]中提到利用車牌定位中使用的紋理信息,來進(jìn)一步分析車牌區(qū)域的紋理是否合理,但由于偽車牌的多樣性,僅使用紋理的方法不能有效排除偽車牌。
文獻(xiàn)[4-6]對(duì)車牌區(qū)域二值圖進(jìn)行形狀分析,考慮了面積、高寬比、占空比等特征,但真?zhèn)诬嚺频倪@些特征區(qū)分并不是特別明顯,若要減少誤檢必定為增加漏檢。
文獻(xiàn)[7-8]根據(jù)字符分割得到的結(jié)果判斷偽車牌,但某些場景下(如光照強(qiáng)或模糊)車牌二值化后字符間會(huì)存在粘連,因此該方法不能廣泛適應(yīng)各種場景。
文獻(xiàn)[9-10]通過訓(xùn)練方式進(jìn)行字符識(shí)別,統(tǒng)計(jì)字符識(shí)別的平均置信度,通過置信度來去除偽車牌,該方法理論上來說應(yīng)該較為有效,但是限定了字符識(shí)別的方法,并且要完成字符識(shí)別后才能判偽增加了系統(tǒng)的負(fù)擔(dān)。
本文提出一種基于字符包絡(luò)分析和筆畫寬度統(tǒng)計(jì)的偽車牌判斷方法。該方法適用于車牌二值化及反色判斷后、字符分割之前。相對(duì)在車牌定位階段判偽的方法,利用了更多的車牌先驗(yàn)知識(shí);相對(duì)在字符分割和字符識(shí)別后判偽的方法,顯著減少了計(jì)算量。
本方法在車牌識(shí)別中的模塊位置如圖2所示。
圖2 偽車牌判斷模塊在車牌識(shí)別流程中的位置
車牌識(shí)別中二值化及反色、字符分割有成熟的算法,本文不做介紹。本文提出的偽車牌判斷方法包括字符包絡(luò)分析和筆畫寬度統(tǒng)計(jì)兩個(gè)子模塊,其中前者關(guān)注車牌字符區(qū)域的外輪廓特征,后者關(guān)注車牌字符區(qū)域的內(nèi)紋理特征。
字符包絡(luò)是根據(jù)輪廓特征提取的,這里輪廓特征指二值圖像的上輪廓和下輪廓特征,上輪廓是各列從上邊界往下到第一個(gè)前景點(diǎn)的距離,下輪廓是各列下邊界往上到第一個(gè)前景點(diǎn)的距離。
圖3中,為了方便輪廓線將一個(gè)待判斷的車牌區(qū)域復(fù)制為上下兩份,灰色細(xì)線為輪廓線,黑色粗線為極值點(diǎn)獲得的包絡(luò)連線??梢钥闯?,真車牌字符區(qū)域包絡(luò)平整,每列上的上下包絡(luò)高度差值變化不大(字符區(qū)域高度一致),而一些偽車牌的包絡(luò)連線不夠平整,高度差值變化也較大。
圖3 部分偽車牌與真車牌的包絡(luò)對(duì)比示意
2.1 標(biāo)記極小值點(diǎn)
極小值點(diǎn)一般情況下是取數(shù)值同時(shí)小于左右鄰近點(diǎn)的點(diǎn)作為極小值點(diǎn)。由于圖像中上下邊經(jīng)常會(huì)出現(xiàn)橫筆畫,使得一段輪廓值整體局部極小而在該段得不到極小值點(diǎn);另外,某些輪廓值較大的極小值點(diǎn)是不必要的。
設(shè)定車牌二值圖像高度為H,寬度為W。按照?qǐng)D4所示方法來進(jìn)行極小值點(diǎn)標(biāo)記。
圖4 極小值點(diǎn)標(biāo)記示意
(1) 首先設(shè)定閾值maxValTh= 0.45×H,任何輪廓值大于maxValTh的點(diǎn),都不標(biāo)記為極小值點(diǎn)。
(2) 當(dāng)輪廓值小于左側(cè)和右側(cè)時(shí),作為極小值點(diǎn),對(duì)于上圖右下虛線框中的區(qū)段情況(該區(qū)段中最大與最小輪廓值相差不大于1),應(yīng)將該段第一個(gè)點(diǎn)和最后一個(gè)點(diǎn)都作為極小值點(diǎn),兩點(diǎn)之間的點(diǎn)不做標(biāo)記。
2.2 極值點(diǎn)間距分析與距離閾值計(jì)算
在車牌字符中,上輪廓極值點(diǎn)的最大間距為L和J之間的間距設(shè)為WidthLJ,當(dāng)其中間存在小圓點(diǎn)時(shí),是最為極端的情況,若設(shè)閾值maxWidthTh=WidthLJ,則極值點(diǎn)間距大于此閾值的情況最多只有一個(gè),通過極值點(diǎn)間距分析也可以排除一些偽車牌。
下輪廓極值點(diǎn)的最大間距為F/P和1之間的間距,同理可設(shè)閾值maxWidthTH=WidthF1來排除偽車牌。
若直接對(duì)極值點(diǎn)進(jìn)行連接獲取包絡(luò),對(duì)于圖5來說,會(huì)得到較為平整的包絡(luò),不能判定為偽車牌。觀察可見兩圖中都存在有一個(gè)較大的間隙,因此可以根據(jù)車牌字符間距的先驗(yàn)知識(shí),對(duì)這部分包絡(luò)直接取原來的輪廓值使其保留包絡(luò)陡峭的特性。這個(gè)間隙是否足夠大需要通過設(shè)置一個(gè)極小值點(diǎn)連接距離閾值(ConnectTh)來判斷。
圖5 部分偽車牌中存在較大間隙導(dǎo)致包絡(luò)凹陷
當(dāng)存在一些特殊字符(J,F,P)等時(shí),會(huì)存在一些不必要的極值點(diǎn),使得連接起來的包絡(luò)有凹陷,因此要對(duì)這些極值點(diǎn)做舍棄(改為連接),是否舍棄需要通過設(shè)置一個(gè)近鄰極小值點(diǎn)查找距離閾值(FindTh)來判斷。如圖6所示。
圖6 個(gè)別極值點(diǎn)的存在導(dǎo)致包絡(luò)凹陷與包絡(luò)修復(fù)示意
2.3 輪廓特定點(diǎn)連接為包絡(luò)
N個(gè)極值點(diǎn)有N-1個(gè)極值點(diǎn)區(qū)間。對(duì)于序號(hào)為InterInd的區(qū)間,如果其寬度小于閾值ConnectTh(InterInd),則將兩個(gè)極小值點(diǎn)之間用直線連接起來得到包絡(luò),兩個(gè)點(diǎn)之間的其他點(diǎn)的包絡(luò)值通過線性插值得到。
如果區(qū)間寬度小于FindTh(InterInd),則以區(qū)間左側(cè)極小值點(diǎn)(記為A)的輪廓值為dotLine,并分別以點(diǎn)A為中心向左和向右各查找一個(gè)最近的輪廓值小于dotLine的極小值點(diǎn)Al和Ar,如果Al和Ar距離小于FindTh(InterInd),則將Al和Ar用直線連接起來作為新的包絡(luò)值,忽略點(diǎn)A這個(gè)極小值點(diǎn)。
如圖7所示,雖然A點(diǎn)也是一個(gè)極值點(diǎn),但其附近的紅色包絡(luò)線是通過連接Al和Ar獲得的。這樣就可以避免車牌字符的包絡(luò)出現(xiàn)凹陷。
圖7 放棄某些極小值點(diǎn)示意
如果Al和Ar之間的距離大于或等于FindTh(InterInd),則查找兩側(cè)與A點(diǎn)最近的輪廓值相等的極小值點(diǎn)Bl和Br,若Bl和Ar的距離小于FindTh(InterInd),則連接Bl和A;若AL和Br的距離小于FindTh(InterInd),則連接AL和Br。
若一個(gè)區(qū)間不能通過以上任意一種方法進(jìn)行極值點(diǎn)連接,則該區(qū)間包絡(luò)保持不變(為原來的輪廓值)。
2.4 使用包絡(luò)來判斷偽車牌
當(dāng)提取到上下輪廓的包絡(luò)后,就可以通過高度統(tǒng)計(jì)信息來判斷偽車牌了,為了避免左右兩側(cè)區(qū)域可能存在缺失筆畫漢字或其他噪聲的影響,這里統(tǒng)計(jì)時(shí)忽略兩側(cè)寬度為0.11×W。
設(shè)上輪廓包絡(luò)為EnvUp,下輪廓包絡(luò)為EnvDown,則各列高度為EnvH=H-EnvUp-EnvDown。取EnvH(0.11×W:0.89×W)計(jì)算平均值和標(biāo)準(zhǔn)差,若平均值不大于0.8×H或者標(biāo)準(zhǔn)差大于0.06×H,則判斷是偽車牌。
本文中的筆畫寬度是指每行前景點(diǎn)的游程長度。真實(shí)車牌的字符筆畫(圖像所有行都要進(jìn)行統(tǒng)計(jì))較多,且字母和數(shù)字的筆畫寬度在一定的范圍內(nèi)(10~45mm,占車牌寬度的比例為0.0244~0.1100),而且筆畫寬度主要為10和45mm兩種??衫眠@些特點(diǎn),通過計(jì)算待判定圖像的前景點(diǎn)筆畫寬度統(tǒng)計(jì)直方圖,可分別獲得車牌的筆畫數(shù)、窄筆畫數(shù)、窄筆畫寬度分布一致性、極窄筆畫比例、主流筆畫寬度(頻次最大的筆畫寬度)等特征,來判定是否為偽車牌。
圖8顯示了不同的圖像及其筆畫統(tǒng)計(jì)直方圖如下。
圖8 筆畫寬度統(tǒng)計(jì)直方圖示意
圖8中曲線對(duì)應(yīng)的橫坐標(biāo)表示筆畫寬度(mm),縱坐標(biāo)代表相應(yīng)筆畫寬度的數(shù)量。標(biāo)準(zhǔn)車牌從最左側(cè)字符左邊界到最右側(cè)字符右邊界的距離是409mm??梢钥闯?,真車牌的筆畫寬度統(tǒng)計(jì)直方圖上只有一個(gè)明顯峰值,且這個(gè)峰值在一定距離范圍內(nèi),而且?guī)缀醪淮嬖谳^寬的筆畫(大于標(biāo)準(zhǔn)字符寬度的筆畫)。
筆畫特征分析判斷算法分為筆畫寬度統(tǒng)計(jì)直方圖計(jì)算、特征提取和判決兩個(gè)步驟,以下將詳細(xì)介紹。
3.1 寬度統(tǒng)計(jì)直方圖
理論最大的筆畫寬度為車牌圖像的寬度(N),設(shè)置一個(gè)長度為N的零數(shù)組SWSF用于不同的筆畫寬度計(jì)數(shù)。遍歷每一行,每個(gè)長度為x的白色像素行程意味著SWSF(x)的一次累加(加1)。
為了避免噪聲干擾,不統(tǒng)計(jì)寬度為1的筆畫;為了避免車牌左右兩邊較窄背景筆畫和漢字細(xì)筆畫的干擾,也不統(tǒng)計(jì)左右側(cè)0.16×W范圍內(nèi)長度小于TH的行程,標(biāo)準(zhǔn)車牌寬度歸一化為180像素時(shí),字符筆畫寬度大約為5像素,因此這里TH可以取值為4。
3.2 特征提取與判決
本算法需要提取以下特征,每個(gè)特征都可以進(jìn)行獨(dú)立判決。
(1) 總筆畫數(shù)TNS(TotalNumberofStrokes):TNS等于直方圖數(shù)值之和,若總筆畫數(shù)TNS≤6×H,可認(rèn)為是偽車牌。這是因?yàn)橐宰址麛?shù)最少的普通車牌為例,由于含有7個(gè)字符,理論上筆畫的最小數(shù)量為7×H,考慮到可能有粘連或者個(gè)別字符上下邊界不靠邊的情況,這里將閾值設(shè)置為6×H。
(2) 窄筆畫數(shù)NNS(NumberofNarrowStrokes):NNS為筆畫寬度大于0.015×W且小于0.15×W的筆畫數(shù)量之和。若窄筆畫數(shù)NNS≤5.7×H,可認(rèn)為是偽車牌。
(3) 窄筆畫比例RNS(RatioofNarrowStrokes):RNS=NNS/TNS,若RNS< 0.85,可認(rèn)為是偽車牌。這是因?yàn)槔硐胭|(zhì)量車牌的NNS應(yīng)該等于TNS,所以RNS理想情況應(yīng)為1,考慮到粘連、噪聲等情況,較比例系數(shù)閾值設(shè)置較小。
(4) 窄筆畫寬度分布一致性DNS(DistributionofNarrowStroke-Width):計(jì)算筆畫寬度大于等于0.015×W且小于0.15×W的筆畫數(shù)量平方之和,即為DNS。若DNS< 2.6×H×H,可認(rèn)為是偽車牌。這是因?yàn)閷?duì)于車牌字符,其筆畫寬度主要集中在一個(gè)或兩個(gè)值附近,因此DNS應(yīng)該較大。
(5) 極窄筆畫比例RSS(RatioofSlenderStrokes):RSS為小于0.015×W的筆畫數(shù)量與NNS的比值。若RSS>0.05,可認(rèn)為是偽車牌。這是因?yàn)槔碚撋显谲嚺浦蟹菨h字區(qū)域是不存在細(xì)筆畫的,RSS=0。但考慮到毛刺,這里將閾值設(shè)置為0.05。
(6) 主流筆畫寬度MSW(MainStroke-Width):MSW為筆畫寬度統(tǒng)計(jì)直方圖中最大值點(diǎn)對(duì)應(yīng)的橫坐標(biāo)上的筆畫寬度。一般情況下,真車牌直方圖上只存在一個(gè)主要峰值,這個(gè)峰值對(duì)應(yīng)的主流筆畫寬度反映的是真車牌筆畫的寬度。因此當(dāng)MSW<0.015×W或MSW>0.065×W時(shí),可認(rèn)為是偽車牌。
實(shí)驗(yàn)素材來源于圖像或視頻,都是來源于車牌定位結(jié)果,并進(jìn)行了二值化和反色處理,偽車牌圖像1 202幅,車牌圖像7 080幅。該車牌定位算法基于邊緣和顏色分析,得到的偽車牌是難通過邊緣特征或顏色特征排除的。本文所用的實(shí)驗(yàn)素材源圖像如圖9所示。
圖9 車牌定位源圖像
偽車牌圖像主要是公交車上的字符,以及行人、摩托車、自行車或者機(jī)動(dòng)車的車燈車標(biāo)等。車牌圖像素材包含各種環(huán)境(強(qiáng)光、弱光、夜間、小雨、模糊、傾斜、變形、手機(jī)拍攝、視頻截取等)下的車牌,均為單排車牌。
使用以上素材,統(tǒng)計(jì)算法可排除的偽車牌以及錯(cuò)判的真車牌數(shù)(將真實(shí)車牌錯(cuò)判為偽車牌的數(shù)量),相關(guān)數(shù)據(jù)如表1所示。從表1可以看出,本方法可排除絕大部分偽車牌(95.6%),降低了字符分割和字符識(shí)別模塊的負(fù)擔(dān),對(duì)降低誤檢也有明顯的促進(jìn)作用。0.7%的錯(cuò)判率在可接受的范圍。
表1 本文方法偽車牌判斷實(shí)驗(yàn)結(jié)果
若將本方法結(jié)合字符分割或字符識(shí)別中的判偽算法一起使用,則車牌識(shí)別整個(gè)系統(tǒng)的誤檢率可以降低到可忽略的水平。
本文方法與其他文獻(xiàn)的方法對(duì)比如表2所示。其中多車牌是指一幅圖像中包含多個(gè)車牌。
表2 字符識(shí)別前對(duì)偽車牌的判斷結(jié)果數(shù)據(jù)比較
由于無法取得其他文獻(xiàn)的測試素材和代碼,不能在完全相同的條件下進(jìn)行比較。從表2中可以看出,本文方法對(duì)偽車牌的實(shí)際排除率雖然略低于其他兩篇文獻(xiàn)報(bào)告的識(shí)別率,但適應(yīng)性更強(qiáng)。
本方法不能排除的偽車牌主要是含有字符的車牌,且這些字符在輪廓、筆畫特征上與真車牌具有一定的相似性,如圖10所示。
圖10 本方法不能排除的偽車牌示例圖
本方法誤判的真車牌,主要是車牌成像質(zhì)量較差,二值化后有粘連或筆畫缺失的情況,如圖11所示。
圖11 本方法誤判的真車牌示例圖
為了降低車牌識(shí)別中的誤檢率,降低字符分割和字符識(shí)別模塊的負(fù)擔(dān),本文提出了一種同時(shí)基于車牌字符區(qū)域外部輪廓特征和內(nèi)部紋理特征分析的偽車牌判斷方法,該方法包含字符包絡(luò)分析和筆畫寬度統(tǒng)計(jì)兩個(gè)步驟。
實(shí)驗(yàn)結(jié)果顯示,對(duì)于使用邊緣和顏色分析算法的車牌定位檢測到的偽車牌,本方法能排除95.6%且錯(cuò)判率極低,表明本方法非常有效。但本方法較難排除輪廓、紋理特征上與真車牌相似的偽車牌,需要其他方法補(bǔ)充。
[1] 周欣,蔣欣榮,潘薇.基于分塊投影和語義約束的車牌定位算法[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(9):141-144,149.
[2] 馬爽,陳江寧,盧虎,等.邊緣特性篩選與多判定機(jī)制下的車牌定位方法[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(9):145-149.
[3] 周小龍,張小洪,馮欣.基于視覺顯著圖的車牌定位算法[J].光電工程,2009,36(11):145-150.
[4] 郭航宇,景曉軍,尚勇.基于小波變換和數(shù)學(xué)形態(tài)法的車牌定位方法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010,20(5):13-16.
[5] 朱春滿,房斌,尚趙偉,等.復(fù)雜背景下的多車牌定位技術(shù)研究[J].公路交通科技,2010,27(7):147-153.
[6] 甘玲,孫博.基于分塊投影和形態(tài)學(xué)處理的多車牌定位方法[J].計(jì)算機(jī)應(yīng)用研究,2012,29(7):2730-2732.
[7] 王俊杰,付曉紅,李俊杰.基于數(shù)學(xué)形態(tài)學(xué)和先驗(yàn)知識(shí)的車牌定位[J].軟件導(dǎo)刊,2008,7(7):9-11.
[8] 鄭伯川,崔屏,張征.一種基于粗細(xì)定位相結(jié)合的車牌定位方法[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,19(2):225-227.
[9] 朱秀峰.車牌字符識(shí)別算法研究與實(shí)現(xiàn)[D].華中科技大學(xué),2012.
[10] 周明輝.運(yùn)動(dòng)車輛車牌識(shí)別算法的研究與實(shí)現(xiàn)[D].昆明理工大學(xué),2013.
THE METHOD OF JUDGING FAKE LICENSE PLATE BASED ONCHARATER ENVELOPE AND STROKE WIDTH
Yang Yingcang
(GuizhouRoadTrafficAccidentIdentificationEngineeringTechnologyResearchCenter,Guiyang550005,Guizhou,China)(GuizhouPoliceOfficerVocationalCollege,Guiyang550005,Guizhou,China)
License plate location may be error detected. A method of eliminating fake license plate based on analyzing character envelope and calculating stroke length is proposed to reduce the computational burden of the license plate recognition module and improve the final accuracy results. In this method, after dealing license plate location results with image binaryzation and invert color judgment, the license binary image extracted envelope and distance between the upper and lower envelope, and then analyze the separation distance, so that the threshold is able to be set to exclude a part of fake license plates. Then, the stroke width of foreground points of the license binary image is count, and more fake license plate is excluded after calculating various indicators. Experimental results indicate that this method can eliminate most fake license plates in license plate location results.
License plate position License error detection Fake license plate Character envelope Stroke width
2015-10-30。貴州省道路交通事故鑒定工程技術(shù)研究中心開放
黔道交鑒合G字[2015]10012號(hào))。楊英倉,副教授,主研領(lǐng)域:公安視聽的教學(xué),科研和司法鑒定。
TP3
A
10.3969/j.issn.1000-386x.2017.03.040