摘 要:在車牌識(shí)別算法中,我們針對(duì)運(yùn)動(dòng)模糊時(shí)車牌識(shí)別率低下時(shí)識(shí)別率不高的問題,使用去運(yùn)動(dòng)模糊技術(shù)恢復(fù)清晰的車牌,并提高識(shí)別率。該方法建立在非盲卷的基礎(chǔ)上,首先獲取汽車的速度,然后計(jì)算運(yùn)動(dòng)核,再根據(jù)運(yùn)動(dòng)核通過非盲卷與盲卷算法恢復(fù)清晰的圖像,在恢復(fù)清晰圖像之后,車牌識(shí)別算法可以有效的識(shí)別率。此外,我們還分析了盲卷算法中,求取運(yùn)動(dòng)核的方法,并就二范數(shù)和一范數(shù)的區(qū)別做出分析,指出了這二種范數(shù)求解運(yùn)動(dòng)核的差異性。
關(guān)鍵詞:車牌識(shí)別;非盲卷算法;運(yùn)動(dòng)模糊;范數(shù)
中圖分類號(hào):TP391.41
圖像的噪音去除和恢復(fù)技術(shù)一直是圖像處理技術(shù)發(fā)展的重點(diǎn),而去運(yùn)動(dòng)模糊由于其有廣泛的實(shí)用價(jià)值,近年來一直是圖像處理技術(shù)的重要研究方向。例如,在車牌識(shí)別中,對(duì)于過于高速的汽車,牌照會(huì)產(chǎn)生運(yùn)動(dòng)模糊,使用去運(yùn)動(dòng)模糊技術(shù)將模糊圖像恢復(fù)為清晰圖像,可以大大提高識(shí)別率。
去運(yùn)動(dòng)模糊的關(guān)鍵在于如何根據(jù)已知模糊圖像恢復(fù)原清晰圖像,由于運(yùn)動(dòng)模糊圖像可以理解為原清晰圖像和運(yùn)動(dòng)核的卷積,表示為下式:I=B⊕K。
I為模糊圖像,B為清晰圖像,K為運(yùn)動(dòng)核算子,I為已知,如果K已知,就可以用反卷積算法獲取原清晰圖像,或使用非盲卷算法求解B。因此去運(yùn)動(dòng)模糊技術(shù)的技術(shù)難度主要取決于如何求取運(yùn)動(dòng)核,如果運(yùn)動(dòng)核未確定,那么不僅需要求取清晰圖像,還需要獲取運(yùn)動(dòng)核,此時(shí)去模糊問題是一個(gè)病態(tài)問題,需使用盲目卷算法求解,難度較大。
由于盲卷算法復(fù)雜,且效果有限,我們?cè)诖吮M可能通過其它方法求取運(yùn)動(dòng)核,并使用非盲卷方法求取清晰圖像。
而非盲卷方法根據(jù)核的性質(zhì),又可以分為時(shí)空不變核和時(shí)空變化核的求解問題。時(shí)空變化核的特點(diǎn)在于:運(yùn)動(dòng)物體在運(yùn)動(dòng)過程中,每個(gè)點(diǎn)的運(yùn)動(dòng)是不同的,例如在旋轉(zhuǎn)情況下,每個(gè)點(diǎn)的運(yùn)動(dòng)軌跡是不一樣的,因此屬于時(shí)空變化核,而空間上的平移,每個(gè)點(diǎn)的運(yùn)動(dòng)軌跡相同,屬于時(shí)空不變核。
在時(shí)空變化核中,由于圖像上的每個(gè)點(diǎn)的運(yùn)動(dòng)軌跡都是變化的,因此每個(gè)點(diǎn)對(duì)應(yīng)一個(gè)運(yùn)動(dòng)向量,因此時(shí)空變化核的求取和探測都較不變核難度大很多。此外,時(shí)空變化核的非盲卷算法復(fù)雜于時(shí)空不變核。由于核是時(shí)空變化的,因此,反卷積不能用傅立葉變換和反變換求解,因此也加大了求解的難度。
汽車牌照的運(yùn)動(dòng)核較為簡單。由于汽車一般都是直線運(yùn)動(dòng)的,因此模糊汽車對(duì)應(yīng)的運(yùn)動(dòng)核一般都是時(shí)空不變核,而且汽車的運(yùn)動(dòng)速度也可以用測速器求解,因此汽車牌照的去運(yùn)動(dòng)模糊問題屬于非盲卷技術(shù),時(shí)空不變核下非盲卷技術(shù)可以通過多種方法求解。
最簡單的方法是使用傅立葉變換,將核函數(shù)和模糊圖像同時(shí)變換到頻域,由于清晰圖像的頻域和核函數(shù)頻域的內(nèi)積等于模糊圖像,所以很容易求取出清晰圖像的頻域,從而進(jìn)一步通過逆變換求解清晰圖像。傅立葉方法反卷積的問題在于抗噪音能力不強(qiáng),大量的噪音信息夾雜在頻域中,影響了反卷積的效果。
目前常用的反卷積算法有維納反卷積算法、Richardson-Lucy(RL)反卷積算法[1],RL迭代算法的特點(diǎn)是使用貝葉斯方法對(duì)每個(gè)需要求解的清晰圖像的像素,使用最大后驗(yàn)概率估計(jì)方法,根據(jù)當(dāng)前模糊像素和運(yùn)動(dòng)核,估計(jì)原像素的最大可能的顏色。由于該方法建立貝葉斯概率基礎(chǔ)上,這種方法不僅可用于空間不變核,也可適用于空間可變核,算法更為魯棒,但是此方法沒有定義計(jì)算必須的迭代次數(shù)但,過度迭代會(huì)通常會(huì)使得圖像失真,一般經(jīng)驗(yàn)上說,迭代20-30次就可以得到較為良好的結(jié)果。
車牌識(shí)別分為幾部分,一為車牌的定位,二為車牌噪音的去除,三為車牌字模的提取與識(shí)別。我們的算法放在第二部分,也就是噪音去除部分
車牌的定位,主要方法是基于顏色,我國的車牌基本上為藍(lán)色,因此藍(lán)色集中的區(qū)域?yàn)檐嚺铺?hào)所在,在確定車牌以后,然后再用霍夫變換檢測直線的方法,檢查車牌在圖片中的角度,在得到角度以后,對(duì)車牌進(jìn)行規(guī)整化,規(guī)整為固定大小的長方形,然后再使用去噪音方法,去除車牌上的污點(diǎn)。
為了得到運(yùn)動(dòng)核,我們使用二類方法進(jìn)行去運(yùn)動(dòng)模糊處理。在有測速器的情況下,我們可以根據(jù)測速器的結(jié)果自然的計(jì)算出運(yùn)動(dòng)核的相關(guān)參數(shù)。在沒有測速器的情況下,我們手工先預(yù)給定一個(gè)初始的速度值,再使用RL算法進(jìn)行去運(yùn)動(dòng)模糊處理,然后使用文獻(xiàn)[3]所述方法使用統(tǒng)計(jì)的方法對(duì)模糊程度進(jìn)行估計(jì),然后根據(jù)估計(jì)結(jié)果動(dòng)態(tài)調(diào)整運(yùn)動(dòng)分量,從而選擇最為清晰的結(jié)果。為了提高算法效率,我們使用快速去運(yùn)動(dòng)模糊算法[4]的方法進(jìn)行高效盲卷求解。
該算法可以根據(jù)能量最小化原理求解核,具體方法如下:
在考慮到噪聲信息后,反卷積問題轉(zhuǎn)變?yōu)橐韵聠栴}:
在上式中,通過能量最小化的方式求取K算子,c|K|是重整項(xiàng),為快速求解準(zhǔn)確的K,在此通常使用二范數(shù),在此基礎(chǔ)上,將算法中涉及運(yùn)動(dòng)模糊卷積的地方,使用快速傅立葉變換和逆變換進(jìn)行計(jì)算,由于快速傅立葉變換的復(fù)雜度為nlog(n),因此極大的提高了算法的效率。
在經(jīng)過實(shí)驗(yàn)后,我們發(fā)現(xiàn)二范數(shù)由于容易易于進(jìn)行求導(dǎo)運(yùn)算,因此求解效率高,但該算法魯棒性不高,在噪聲大時(shí)候,算法不能收斂到有效的運(yùn)動(dòng)核。
通過實(shí)驗(yàn),我們發(fā)現(xiàn)一范數(shù)求解效率不如二范數(shù),一范數(shù)下的運(yùn)動(dòng)核求解需要使用特殊的方法,將絕對(duì)值轉(zhuǎn)化為其它形式進(jìn)行計(jì)算,因此算法更易為復(fù)雜,但魯棒性更高,這其中最根本的原因在于:使用一范數(shù)形式使得求核問題轉(zhuǎn)化為壓縮感知問題求解,壓縮感知要求運(yùn)動(dòng)核中的非零項(xiàng)盡可能少,這一點(diǎn)是非常符合時(shí)空不變運(yùn)動(dòng)核的特點(diǎn)的。時(shí)空不變運(yùn)動(dòng)核在運(yùn)動(dòng)軌跡處才為非零項(xiàng),其它項(xiàng)為零,因此求解運(yùn)動(dòng)核本質(zhì)上就要求算法基于運(yùn)動(dòng)感知。
在得到清晰車牌后,再使用模式識(shí)別方法識(shí)別車牌上的字母和數(shù)字。
我們?cè)诩尤肴ミ\(yùn)動(dòng)模糊后,對(duì)模糊的車牌,識(shí)別率可提高20%左右,但是現(xiàn)有的方法,對(duì)于去除特別大的運(yùn)動(dòng)模糊,效果不佳,根本原因在于:特別大運(yùn)動(dòng)量的模糊,其噪音往往也特別大,而且車牌的定位也容易出現(xiàn)誤差,這些都使得去運(yùn)動(dòng)模糊效果不佳,從而影響了車牌的識(shí)別。在將來的工作中,我們考慮使用更新的算法實(shí)現(xiàn)去運(yùn)動(dòng)模糊處理[5],這些算法效率更高,也更為有效。
參考文獻(xiàn):
[1]RICHARDSON H W.Bayesian-Based Iterative Method of Image Restoration[J].Journal of the Optical Society of America,1972(01):55-59.
[2]YUAN L,SUN J,QUAN L.Progressive inter-scale and intra-scale non-blindimage deconvolution[J].ACM Trans.Graph.,2008(03):1-10.
[3]R.Fergus.Removing camera shake from a single photograph[J].SIGGRAPH,2006.
[4]S.Cho and S.Lee.Fast motion deblurring[J].SIGGRAPHASIA,2009.
[5]S.Cho,J.Wang,and S.Lee.Handling outliers in non-blind image deconvolution[J].In ICCV,2011.
作者簡介:沈洋(1975.02-),男,合肥人,講師,博士,研究方向:數(shù)字媒體、圖形圖像。
作者單位:麗水學(xué)院工學(xué)院,浙江麗水 323000