張嶠
摘 要 在中國,由于智能交通系統(tǒng)的廣泛應用,車牌識別(LPR)技術的地位與日俱增并起著十分重要的作用。但是,在應用中由于復雜的路況和天氣可能使部分車牌文本被遮擋,目前大部分的車牌識別技術都能更好的識別車牌的字符信息,但對于部分被遮擋或信息不完整的車牌的識別效率和準確率較低。本文介紹了車牌識別的三步驟、車牌識別的算法發(fā)展、車牌文字識別的方法及發(fā)展和車牌識別的未來發(fā)展方向,并提出人工智能在車輛車牌照片圖像和車牌文本識別的應用,使高效、高準確率的車牌識別成為可能。
關鍵詞 車牌識別 判別式分析 智能交通
中圖分類號:TP2 文獻標識碼:A 文章編號:1007-0745(2021)09-0061-02
1 前言
智能交通體系極大地方便了人們的出行和生活。 隨著智能交通的飛速發(fā)展與完善,車牌識別技術在交通管理、數(shù)字安全監(jiān)控、車輛識別、停車管理、監(jiān)視過境和搜索可疑車輛等多個領域中頻繁使用,已成為智能交通系統(tǒng)的重要組成部分。這些具有巨大經(jīng)濟價值的應用技術, 不僅顯著地提高了工作效率, 還節(jié)約了人力和物力資源。
2 車牌識別的步驟
LPR系統(tǒng)是幾個模塊的組合,涉及對象檢測、圖像處理和模式識別。除了圖像采集和預處理之外,讀取車牌的過程還經(jīng)歷了三個主要階段:第一階段是板定位或板提取,即定位圖片中的牌照位置;第二階段是字符分割,即把每個字符都被檢測到并與其他字符分開;第三階段是字符識別,即把分割好的字符進行識別,并最終組成牌照號碼。車牌識別過程中,牌照顏色的識別依據(jù)算法不同,可能在上述不同步驟實現(xiàn),通常與車牌識別互相配合、互相驗證。實際上,車牌識別過程包括圖像采集、預處理、車牌定位、字符分割、字符識別、結(jié)果輸出等一系列算法運算。
3 車牌識別的算法發(fā)展
目前車牌識別技術發(fā)展已經(jīng)比較成熟, 識別準確率和魯棒性均比較高。C. Sharma 和 A. Kaur提出了利用直方圖均衡的邊緣檢測技術來檢測和識別印度車牌,識別率為89%,其主要領域是分割部分,但所提出的方法對角度和環(huán)境敏感。M.H.Dashtban嘗試使用邊緣檢測和神經(jīng)網(wǎng)絡算法兩種算法來測試巴黎車牌,識別率達到94%。這項研究的優(yōu)勢在于圖像數(shù)據(jù)庫包含了在不同光照條件下具有不同背景和坡度的各種車輛的圖像。R.Lee和K.Hung使用100個樣本圖像研究了基于Haar離散小波變換這種執(zhí)行速度較快的方法進行實時車牌識別,有93%的準確率[1]。G.Lekhana和 R.Srikantaswamy用神經(jīng)網(wǎng)絡和支持向量機支持向量機識別車牌號,無需對圖像進行任何增強,這種方法能夠成功識別運動中的車輛。S.Qing-kun和Y.Hui-jun利用140個樣本圖像對中國車牌進行了基于數(shù)學形態(tài)學方法和RBF神經(jīng)網(wǎng)絡的車牌識別研究,達到了94%的識別率。通過使用RBF神經(jīng)網(wǎng)絡基函數(shù)中心確定算法,可以直接確定隱藏節(jié)點的數(shù)量,易于實現(xiàn)且識別精度較高。另一方面,在中國的車牌識別領域中也提出了一種新的方法,即PVD ,這種方法可以適應性地處理車牌中的各種變化,例如旋轉(zhuǎn)、縮放、照明。利用支持向量機與神經(jīng)網(wǎng)絡的模板匹配,成功識別出印度車牌,識別率為96%。H. Rajput通過邊緣檢測和形態(tài)學運算進行Gussing濾波的實驗,該實驗對250個澳大利亞車牌進行了測試,并獲得了96%的識別率[2]。
4 車牌文字識別的方法及發(fā)展
對于車牌文字識別的方法,目前主要是采用判別式分析方法,這些方法包括基于模板匹配的字符識別、基于支持向量機的字符識別和神經(jīng)網(wǎng)絡的字符識別算法等。
艾哈邁德(Ahmed)等人提出了模板匹配。模板匹配是一種簡單的方法。字符和模板之間的相似性是度量,與角色最相似的模板被識別為目標,大多數(shù)模板匹配方法都使用二進制圖像,因為灰度會由于光照的變化而改變,在將提取的字符調(diào)整為相同大小后執(zhí)行模板匹配。此方法對于識別非旋轉(zhuǎn),不間斷的單個字體很有用。如果由于字體變化、旋轉(zhuǎn)、雜音而使字符與模板不同,則模板匹配會產(chǎn)生錯誤的識別[3]。
LeCun等人使用HOG功能進行字符識別,在訓練階段,從每個字母的高分辨率圖像生成訓練數(shù)據(jù),然后獲得每個字母在HOG特征空間中的分布。在識別階段,從圖像中切出每個字符,計算出HOG特征向量,并根據(jù)上面獲得的HOG特征空間中的分布識別字符。支持向量機和神經(jīng)網(wǎng)絡有較強的自學能力,能夠在一定程度上克服字符形狀的改變和位置偏移的缺陷[4]。
Siddharth等人使用支持向量機(SVM)分類器,SVM分類器由一組給定的訓練數(shù)據(jù)進行訓練,并準備了一個基于該模型對測試數(shù)據(jù)進行分類的模型。對于多分類問題,我們將多分類問題分解為多個二進制分類問題,并設計了合適的組合多個二進制SVM分類器。根據(jù)如何以適當?shù)挠嗔繉⑺袠颖痉譃椴煌念悇e,在SVM分類器中使用了不同類型的內(nèi)核[5]。
Sharma和Singh已將人工神經(jīng)網(wǎng)絡應用于字符識別,這種方法模擬了人類神經(jīng)系統(tǒng)創(chuàng)建智能行為的方式。這個想法是采用大量的角色(稱為訓練集),然后開發(fā)一個可以從這些訓練中學習的系統(tǒng)。換句話說,神經(jīng)網(wǎng)絡使用訓練來自動推斷識別字符的規(guī)則。這些方法在良好的數(shù)據(jù)集上可以取得令人印象深刻的結(jié)果,但在質(zhì)量較差的數(shù)據(jù)集上仍會產(chǎn)生不正確的識別,CNN的引入使得模糊數(shù)據(jù)集的字符識別做得更好。
Bounchain在角色識別任務中應用了Lenet-5,該網(wǎng)絡已用包含50,000多個手寫數(shù)字的數(shù)據(jù)庫進行了測試,所有數(shù)字均在輸入圖像中進行了標準化,達到了約0.95%的錯誤率[6]。
5 現(xiàn)狀和不足
實際應用中,車牌識別系統(tǒng)的識別率還與牌照質(zhì)量和拍攝質(zhì)量密切相關。牌照質(zhì)量會受到各種因素的影響,如生銹、污損、油漆剝落、字體褪色、牌照被遮擋、牌照傾斜、高亮反光、多牌照、假牌照等等;實際拍攝過程也會受到環(huán)境亮度、拍攝方式、車輛速度等等因素的影響。這些影響因素不同程度上降低了車牌識別的識別率,也正是車牌識別系統(tǒng)的困難和挑戰(zhàn)所在。為了提高識別率,除了不斷地完善識別算法還應該想辦法克服各種光照條件,使采集到的圖像最利于識別。
車牌識別在過去的幾年內(nèi)取得了驕人的成績,但還是存在著有待解決的問題。比如,現(xiàn)實應用中往往會因為沙塵、濺起的泥巴、雨水腐蝕、風化等各種原因使得車牌的字符不完整,致使字符分割和識別可能會遇到麻煩。上文提到的高識別準確率的方法在不完整車牌識別中結(jié)果不盡如人意。在常態(tài)下識別率達到98%的XX網(wǎng)絡用于識別文字殘缺不全的車牌,識別率降低一半以下,因此如何正確地分割和識別車牌文字成為一項艱巨的任務。
6 展望及發(fā)展方向
令人振奮的是,得益于圖像修復技術的發(fā)展,我們可以通過技術手段對殘缺文字進行修補,還原文字的真實形態(tài)。近年來,深度學習在圖像語義修復、情感感知、模式識別以及特征分類等領域展現(xiàn)出噴發(fā)時發(fā)展的態(tài)勢[7],特別在圖像生成方面,表現(xiàn)出優(yōu)越的性能?;谏疃葘W習的圖像生成算法相對于傳統(tǒng)的基于結(jié)構(gòu)和紋理的生成算法能夠捕獲更多圖像的高級特征,常用于進行紋理合成和圖像風格化遷移。2014年由Goodfellow提出的生成式對抗網(wǎng)絡(GAN)在圖像生成領域取得了開創(chuàng)性進展,在圖像生成的過程中,生成式對抗網(wǎng)絡相對于傳統(tǒng)的編碼-解碼器而言能夠更好地擬合數(shù)據(jù),且速度較快,生成的樣本更加銳利,但該方法也存在不足,如數(shù)據(jù)訓練不穩(wěn)定、模型自由不可控、訓練崩潰等問題。[8]2016年,Radford等人發(fā)表了一篇名為《無監(jiān)督代表性學習與深度卷積生成式對抗性網(wǎng)絡》的論文,提出深度卷積生成式對抗網(wǎng)絡DCGAN。DCGAN融合CNN和GAN,通過設計獨特的網(wǎng)絡結(jié)構(gòu),使得訓練更加穩(wěn)定[9],這是首篇表明向量運算可以作為從生成器中學習的固有屬性進行特征表達的論文。2019年SHENG ZHANG等人提出了一個有效而高效的共享對抗訓練網(wǎng)絡(SATN),該網(wǎng)絡可以在具備標準模板渲染車牌的先驗知識的情況下,從車牌中學習與環(huán)境無關且無透視的語義特征[10]。
生成式對抗網(wǎng)絡(GAN)的出現(xiàn)也給類似被遮擋的車牌識別問題帶來曙光,將車牌識別率進一步提高。當然,車牌識別還會受到光照、傾斜度、陰影、字符磨損變形、運動等諸多因素影響[11],因此車牌識別仍需要繼續(xù)研究。
參考文獻:
[1] 趙漢理,劉俊如,姜磊,沈建冰,胡明曉.基于卷積神經(jīng)網(wǎng)絡的雙行車牌分割算法[J].計算機輔助設計與圖形學學報,2019(08):1320-1329.
[2] Pham V H,Dinh P Q,Nguyen V H.CNN-Based Character Recognition for License Plate Recognition System[J].2018.
[3] Dashtban M H,Dashtban Z,Bevrani H.A Novel Approach for Vehicle License Plate Localization and Recognition[J].International Journal of Computer Applications,2011,26 (11):22-30.
[4] Lee R C,Hung K C,Wang H S.Real-Time Vehicle L icense Plate Recognition Based on Scanning and 2D Haar Discrete Wavelet Transform[J].Applied Mechanics & Materials,2013(284-287):2402-2406.
[5] Qing-Kun S,Hui-Jun Y,Teng Z.License plate recognition based on mathematical morphology method and RBF neural network[C].International Conference on Measurement, Information & Control,2012.
[6] Zhou W,Li H,Lu Y,et al.Principal Visual Word Discovery for Automatic License Plate Detection[J].ieee transactions on image processing a publication of the ieee signal processing society,2012,21(09):4269-79.
[7] 潘翔,王恒.基于深度學習的車牌相似字符識別[J].計算機科學,2017(S1):239-241,257.
[8] Alom M Z,Sidike P,Hasan M,et al.Handwritten Bangla Character Recognition Using the State-of-the-Art Deep Convolutional Neural Networks[J].Computational Intelligence & Neuroscience,2018:1-13.
[9] Xie L,Ahmad T,Jin L,et al. A New CNN-Based Method for Multi-Directional Car License Plate Detection[J].IEEE Transactions on Intelligent Transportation Systems,2018:1-11.
[10] Rajput H,Som T,Kar S.An Automated Vehicle License Plate Recognition System[J].Computer,2015,48(08):56-61.
[11] Haykin S,Kosko B. GradientBased Learning Applied to Document Recognition[D].Wiley-IEEE Press,2009.