吳曉剛,汪靜
(1.興義民族師范學(xué)院信息技術(shù)學(xué)院,興義562400;2.同濟大學(xué)計算機科學(xué)與技術(shù)系,上海201804)
目前國內(nèi)外車牌文字圖像識別的主要方法有模糊聚類[1]、基于模板匹配[2]和人工神經(jīng)網(wǎng)絡(luò)[3]等算法?;谀0迤ヅ浜湍:垲惖乃惴▽崿F(xiàn)簡單且當(dāng)字符較規(guī)整時識別率高,但對于一些因光照不均或污損遮擋的文字,在實際應(yīng)用中效果不理想。人工神經(jīng)網(wǎng)絡(luò)尤其深度神經(jīng)網(wǎng)絡(luò)對硬件的要求較高。針對此類模糊車牌文字識別一些學(xué)者作了研究,如文獻[4]提供了一種基于主成分特征重建圖像的車牌文字識別方法。
本文在具有三種否定的模糊集IFScom[5]理論基礎(chǔ)上,提出了一種基于IFScom 貼近度的模糊車牌文字識別方法。該算法針對模糊文字像素空間分布特點,結(jié)合IFScom 貼近度包含中介否定信息來描述模糊污損圖像的灰度特性。通過理論和實驗分析,在對模糊圖像文字的識別中,計算的準(zhǔn)確率和效率有明顯提高。
定義1[5]設(shè)A 是論域X 的模糊子集,其隸屬函數(shù)為A(x),l∈(0.5,1)。
(1)若映射滿足f┑:{A(x)|x∈X}→[0,1],f┑(A(x))=1-A(x),則f┑確定了論域X 上的一模糊子集,稱為A 的對立否定集,記作A┑。當(dāng)A(x)∈[0,1-l]或A(x)∈(l,1];
(2)若映射f~:{A(x)|x∈X}→[0,1],滿足:
則該映射f┑(A(x))=1-A(x)確定了X 上的模糊子集A 的中介否定集,記作A~。
(3)設(shè)A 是論域X 上的一個的模糊集,?x∈X,稱A┐為A 的矛盾否定集,若A┐(x)=(A┑∪A~(x)=A┑(x)∨A~(x)=max(A┑(x),A~(x))。
定義1 為區(qū)分矛盾否定運算┐、對立否定運算┑和中介否定運算~的模糊集IFScom。
貼近度反應(yīng)了兩個模糊集的貼近程度或相似程度。以下給出公理化的定義和可計算的貼近度。
定義2[6]設(shè)F(X)是論域X 上的模糊集,若映射σ:F(X)×F(X)→[0,1],(A,B)|→σ(A,B)∈[0,1],滿足:
(1)σ(A,A)=1,?A,B ∈F(X),
(2)σ(A,B)=σ(B,A),?A,B ∈F(X),
(3)A?B ?C ?σ(A,C)?σ(A,B)∧σ(B,C),
則稱σ(A,B)為A 與B 的貼近度。
定義3 設(shè)A、B 是論域X 上的具有三種否定的模糊集IFScom,?x∈X,映射
稱N(A,B)為模糊集IFScom 上A 與B 的貼近度。
定義4[7]設(shè)A、B 是論域X 上的IFScom 模糊集,,映射
稱為IFScom 模糊集A 與B 的格貼近度。
顯然式(1)(2)均滿足公理化定義2。實際應(yīng)用中,可以根據(jù)具體情況來選擇IFScom 貼近度或格貼近度計算。
車牌文字圖像的點的密度與其周圍點的位置和灰度值相關(guān)[8],通常文字像素點周圍的像素點越多,則組成“文字”的可能性越大,反過來該像素點可能是“噪聲”。以下給出一種基于像素點空間分布的密度函數(shù),點密度函數(shù)定義如下:
定義5設(shè)X為文字像素集,xi,xj分別表示X 中像素點i,j 的灰度(灰度級為0-255,0 和255 分別表示該像素點為白色和黑色),則對于每個像素點xi,其點密度函數(shù)zi定義為:
式(3)中,0 ≤zi≤1,當(dāng)zi=0 表示xi是黑或白的孤立點,zi=1 表示該點像素灰度級與周圍點是相同的。把它當(dāng)作點分布的模糊隸屬度。
基于模糊集IFScom 貼近度的車牌文字模糊識別的原理如下:對給定的待識別對象集合U中的每個對象u,建立特性指標(biāo)向量u=(u1,u2,…,up)。若識別對象集合u的n個類別均為u上的一個模糊集IFScom,記作A1,A2,…,Ap,模糊識別就是把對象u=(u1,u2,…,up)劃歸到與其最相似的一個類別Ai中(1≤i≤n)。建立模糊模式的隸屬函數(shù)特征,計算出具有三種否定的IFScom模糊集的貼近度,按照最大貼近度原則判斷對象u 歸屬于哪一個類別。算法的主要流程圖如圖1。
圖1 模糊車牌識別算法流程圖
通過計算比較模糊字符集與標(biāo)準(zhǔn)字符向量特征的貼近度,找到貼近度最大的輸出類別。
為了方便,本次實驗以常見的藍底小車牌照為例(如圖2):一般有七個字符,包括首位漢字及后面的6位字母或數(shù)字。建立了24 個漢字、26 個字母與10 個數(shù)字總共60 個標(biāo)準(zhǔn)字符的特征向量,其他車牌字符集的方法與此相同。
圖2 待識別車牌圖像
實驗步驟如下:
(1)由于車牌文字的寬高比接近1:2,對所有標(biāo)準(zhǔn)車牌字符集Fi(i=1,2…60) 分割成8×4 方塊點陣。
(2)對每個方塊中像素點出現(xiàn)的清晰度利用式(3)計算其隸屬度uij(i,j為所在的行列)。分別得到標(biāo)準(zhǔn)車牌文字A1(本例為字符F)與待識別模糊車牌文字A的向量特征關(guān)系矩陣如下:
圖3 車牌字符的8×4分塊
(3)字符像素集A 的對立否定A┑是完全不屬于該字符集,而部分污損或不完全的模糊字符像素屬于中介否定集,根據(jù)模糊集IFScom 定義,計算出A1的中介否定隸屬度(中介否定參數(shù)λ=0.75):
同上方法計算待識別車牌字符像素集A的中介否定隸屬度:
(4)將字符關(guān)系矩陣(8×4)按照行列展開成一維特征向量,根據(jù)式(1)分別計算標(biāo)準(zhǔn)字符集Ai(i=1,2,…60 )與待識別字符A 的貼近度N(Ai,A),結(jié)果N(A1,A)最大,因此待識別的字符是圖3 中的字母F。
(5)重復(fù)執(zhí)行以上步驟,可以得到完整的模糊車牌文字如圖4。
圖4 模糊車牌識別結(jié)果
為對比本文采用模糊集IFScom 具有三種否定貼近度方法的效果,選取標(biāo)準(zhǔn)和模糊車牌圖片與文獻[4]的主成分特征重建PCF 方法、文獻[8]的格貼近度GCD方法作對比實驗,得到表1 的準(zhǔn)確率。
表1 車牌文字識別的準(zhǔn)確率對比
從表1 可以看出對于標(biāo)準(zhǔn)清晰的車牌,三種算法的準(zhǔn)確率為100%。對于模糊污損車牌文字的識別率本文方法有一定的提高,主要的原因是具有三種否定的貼近度充分考慮了污損文字的中介模糊信息。
本文給出了一種基于IFScom 貼近度的模糊圖像文字識別方法。該方法通過建立文字像素點的分布隸屬度來描述字符的特征指標(biāo),利用具有三種否定模糊集IFScom 貼近度包含中介否定來刻畫污損圖像的灰度模糊特征。通過理論和實驗表明,該算法可用于解決實際車牌識別中的一些模糊或不完全文字問題,具有一定的實際意義。