摘 要:圖像識(shí)別技術(shù)是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)象的技術(shù)。文章通過(guò)MATLAB軟件采用圖像字符識(shí)別技術(shù),通過(guò)圖像采集、預(yù)處理、特征提取、模板匹配等方式,實(shí)現(xiàn)對(duì)含有商品保質(zhì)期的圖片進(jìn)行識(shí)別,提取保質(zhì)期信息與當(dāng)前時(shí)間比較根據(jù)比較結(jié)果進(jìn)行和判斷,用以提醒用戶商品是否過(guò)期,有效的避免了這類事件對(duì)商家造成的損失以及不良影響。
關(guān)鍵詞:字符識(shí)別技術(shù);預(yù)處理,特征提??;模板匹配
圖像中有效信息的提取是非常關(guān)鍵的,要首先進(jìn)行圖像識(shí)別,字幅圖像識(shí)別首先要對(duì)圖像識(shí)別技術(shù)是一種通過(guò)數(shù)字化技術(shù)對(duì)所采集的用來(lái)研究實(shí)驗(yàn)的圖片進(jìn)行處理,然后利用計(jì)算機(jī)進(jìn)行分析,使之能在不同模式下將有效信息變短辨別出來(lái)的一門技術(shù)。圖像進(jìn)行預(yù)處理,每個(gè)圖像中都有噪聲,圖像預(yù)處理的主要目的就是減少噪聲造成的影響,以防對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生影響,然后再對(duì)預(yù)處理的圖像進(jìn)行分割,得到含有有效信息的圖像,然后對(duì)得到的有效圖像進(jìn)行特征提取,再通過(guò)模板匹配實(shí)現(xiàn)圖像中字符的識(shí)別,以此來(lái)達(dá)到圖像識(shí)別的目的。接下來(lái)作者對(duì)圖像識(shí)別的具體步驟進(jìn)行詳細(xì)介紹。
1 圖像識(shí)別技術(shù)
圖像識(shí)別技術(shù)是一種通過(guò)數(shù)字化技術(shù)對(duì)所采集的用來(lái)研究實(shí)驗(yàn)的圖片進(jìn)行處理,然后利用計(jì)算機(jī)進(jìn)行分析,使之能在不同模式下將有效信息變短辨別出來(lái)的一門技術(shù)。自動(dòng)圖像識(shí)別系統(tǒng)的過(guò)程分為五部分:圖像輸入、預(yù)處理、特征提取、分類和匹配,其中預(yù)處理又可分為圖像分割、圖像增強(qiáng)、二值化和細(xì)化等幾個(gè)部分。
2 圖像預(yù)處理步驟及方法
2.1 預(yù)處理
預(yù)處理的步驟后可以包括下面幾個(gè)過(guò)程:灰度化、二值化等操作消除圖像中的無(wú)關(guān)信息,防止其無(wú)關(guān)信息對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生影響,生成一個(gè)簡(jiǎn)單清楚的圖像。能否達(dá)到預(yù)期時(shí)候?qū)⑸唐穲D片中有關(guān)于
保質(zhì)期的有效信息讀取出來(lái),達(dá)到實(shí)驗(yàn)后期與匹配庫(kù)中的目標(biāo)字符成功進(jìn)行匹配識(shí)別的效果,這一切都要看前期圖像字符預(yù)處理能否較為理想的完成。
2.2 灰度化
將彩色圖像轉(zhuǎn)化為灰色圖像的過(guò)程稱為圖像的灰度化處理,文章介紹幾種常見的方法:
(1)最大值法:將像素的三原色的值都等于它三原色中那個(gè)最大的原色的值,即:
G=R=B=MAX(R,G,B)
(2)平均值法:顧名思義,這個(gè)方法說(shuō)的是將像素三原色的值設(shè)置成像素三元色的平均值,即:
R=G=B=(R+G+B)/3
(3)加權(quán)平均值法:這個(gè)方法說(shuō)的是設(shè)置一組權(quán)值,其中,?棕R、?棕B、?棕G分別是R、B、G的權(quán)值。?棕R、?棕B、?棕G取不同的值時(shí),將形成不同的灰度圖像。然后對(duì)三原色的值進(jìn)行加權(quán)平均,得到一組新的三原色值,顯示圖像,即:
R=G=B=(?棕RR+?棕BB+?棕GG)/3
最大值法處理后的灰度化圖像會(huì)比較亮,也就是高亮度;平均值法處理后的圖像產(chǎn)生的灰度化圖像會(huì)比較柔和;加權(quán)平均值法在處理灰度化時(shí)候,可以人為的去改變圖像的灰度化程度,比較靈活。
2.3 二值化
在此次項(xiàng)目中,我們采用最大類間方差法找到圖片的合理閾值,它是按圖像的灰度特性,將圖像分成背景和目標(biāo)兩部分。背景和目標(biāo)之間的類間方差越大,說(shuō)明構(gòu)成圖像的兩部分的差別越大,當(dāng)部分目標(biāo)錯(cuò)分為背景或部分背景錯(cuò)分為目標(biāo)都會(huì)導(dǎo)致兩部分差別變小。因此,使類間方差最大的分割意味著錯(cuò)分概率最小。
3 圖像分割
圖像分割的目標(biāo)是把拍照?qǐng)D像中的每個(gè)字符從整個(gè)圖像中分離出來(lái),成為單個(gè)字符,此方法一般是對(duì)像素進(jìn)行操作,典型的圖像分割方法有閾值法、邊緣檢測(cè)法、區(qū)域法、聚類法等,在此,由于我們之前已對(duì)圖像進(jìn)行了預(yù)處理,所以只需要用基本的投影分割法,對(duì) x軸, y軸分別進(jìn)行投影分割,即可得到單個(gè)字符清晰的的分割效果,由于拍照所得的圖片樣品是印在商品上的有效日期,它的有效日期的字符是標(biāo)準(zhǔn)體,十分整齊,所以不會(huì)出現(xiàn)將兩個(gè)字符分割到一起的問(wèn)題。所以可采用投影分割法進(jìn)行處理。
4 特征提取
特征提取就是提取圖像中的信息特征,常見的特征提取方法一般分為以下兩種:(1)結(jié)構(gòu)特征提?。航Y(jié)構(gòu)特征提取是指利用目標(biāo)字符的特別的字符結(jié)構(gòu)特征進(jìn)行提取的方法,這種方法往往可區(qū)分性強(qiáng),同時(shí)穩(wěn)定性強(qiáng)。(2)統(tǒng)計(jì)特征提?。航y(tǒng)計(jì)特征提取是指對(duì)全部整個(gè)完整的字符進(jìn)行分析處理,然后提取該有效字符。
由于在本次項(xiàng)目中,用到的是商品上有關(guān)保質(zhì)期的有效信息,都是有關(guān)于數(shù)字,因此我們提取數(shù)字方面的特征,在本次實(shí)驗(yàn)中作者用到的特征提取的方法為以下兩種方法,粗網(wǎng)格特征提取的方法和筆劃密度特征提取的方法:
(1)粗網(wǎng)格特征提取
粗網(wǎng)格特征是指不同數(shù)字在不同位置塊內(nèi)的黑色素點(diǎn)個(gè)數(shù)特征,它代表的是圖像的整體分布特征。
這種方法首先把數(shù)字圖片分成幾個(gè)局部小區(qū)域,并把每個(gè)小區(qū)域上的點(diǎn)陣密度作為描述特征,即統(tǒng)計(jì)每個(gè)小區(qū)域中圖像象素所占百分比作為特征數(shù)據(jù)。
這種方法被廣泛運(yùn)用在各個(gè)領(lǐng)域。
(2)筆劃密度特征提取
每個(gè)數(shù)字的筆劃長(zhǎng)短,大小形狀都不一樣,所以0-9每個(gè)數(shù)字的筆劃特征都不一樣,由于每個(gè)數(shù)字的筆劃數(shù)量,集中分布的地方也不同,所以可以提取筆劃密度特征參數(shù)進(jìn)行識(shí)別。
我們可以通過(guò)以不同方向掃描輸入的樣本數(shù)字,計(jì)算其掃描線和筆劃相交的次數(shù),不同的筆劃相交次數(shù)不一樣,以此可以形成筆劃密度的特征向量。
5 模板匹配
5.1 模板匹配概念及原理
模板匹配法是指在實(shí)驗(yàn)建立的基礎(chǔ)模板匹配庫(kù)通過(guò)某些從圖像字符中查找提取到的特征向量,從匹配庫(kù)中找出與目標(biāo)字符最相似的字符,即如果庫(kù)中存在該字符那么就可以從模板匹配庫(kù)中找到并輸出目標(biāo)字符。在進(jìn)行模板匹配時(shí)會(huì)用到,前面說(shuō)到的從圖像字符中提取出來(lái)的特征向量。
觀測(cè)向量:觀測(cè)向量說(shuō)的是對(duì)目標(biāo)對(duì)象進(jìn)行處理分析然后得到的原理數(shù)據(jù)構(gòu)成的向量。
R=[r1,r2,...,rm]T
R是觀測(cè)向量,r是觀測(cè)值。
觀測(cè)空間:由觀測(cè)向量的維數(shù)決定的m維幾何空間。
特征向量:對(duì)觀測(cè)向量進(jìn)行特征選擇和提取,得到反映事物本質(zhì)特性的特征構(gòu)成的向量。
X=[x1,x2,...xn]T
X是特征向量,x是特征值。
特征空間:有特征向量的維數(shù)決定的n維幾何空間(n 特征選擇:去除次要的特征,篩選出重要的特征。 特征提取:通過(guò)壓縮變換或映射,降低特征維數(shù)。 歐氏距離:設(shè)有兩個(gè)n維的特征向量x1和x2, 那么這兩個(gè)目標(biāo)對(duì)象的歐氏距離可以被定義為如下: 可以根據(jù)實(shí)驗(yàn)的要求來(lái)改變加權(quán)系數(shù),使得實(shí)驗(yàn)的準(zhǔn)確性大大提高,同時(shí)也使得識(shí)別的過(guò)程步驟更加的靈活,增加了各個(gè)特征在識(shí)別中的重要程度。 5.2 模板匹配方法及思想 設(shè)檢測(cè)對(duì)象的模板為t(x,y),令其中心與圖像f(x,y)中的一點(diǎn)(i,j)重合,檢測(cè)t(x,y)和圖像重合部分之間的相似度,對(duì)圖像中所有的點(diǎn)都進(jìn)行這樣的操作,根據(jù)相似度為最大或者超過(guò)某已于直來(lái)確定對(duì)象物是否存在,并求得對(duì)象物所在的位置。 相似度:該值越大,表示匹配程度越好。 f—f(x+u,y+v)在S內(nèi)的均值,t—t(x,y)在S內(nèi)的均值。 6 仿真分析 文章通過(guò)MATLAB處理平臺(tái)對(duì)所采集的圖像進(jìn)行分析,通過(guò)對(duì)圖像的預(yù)處理、特征提取、模板匹配等方式,結(jié)果如圖2所示。 圖1 原始圖像 圖2 實(shí)驗(yàn)結(jié)果圖 從圖中可以看出,本次項(xiàng)目通過(guò)圖像字符識(shí)別技術(shù),可以很好地對(duì)圖像進(jìn)行識(shí)別,并與當(dāng)前系統(tǒng)時(shí)間進(jìn)行比較,根據(jù)比較結(jié)果進(jìn)行判斷輸出商品是否過(guò)期,達(dá)到提醒的目的。 7 結(jié)束語(yǔ) 本次實(shí)驗(yàn)是基于圖像識(shí)別中的圖像字符識(shí)別技術(shù)來(lái)實(shí)現(xiàn)對(duì)圖片中的有效信息進(jìn)行識(shí)別,并進(jìn)行對(duì)有效信息的提取和處理,最后通過(guò)判斷來(lái)實(shí)現(xiàn)文章的目的,即實(shí)現(xiàn)對(duì)商品保質(zhì)期的提醒功能。文章主要是講利用圖像識(shí)別技術(shù)來(lái)對(duì)含有商品保質(zhì)期信息的圖片進(jìn)行識(shí)別,并且提取保質(zhì)期信息與當(dāng)前時(shí)間進(jìn)行比較,根據(jù)比較結(jié)果進(jìn)行判斷,輸出結(jié)果,提醒用戶商品是否過(guò)期,或臨近保質(zhì)期期限,已達(dá)到實(shí)現(xiàn)商品保質(zhì)期提醒功能,從而也有效地實(shí)現(xiàn)了商品的有效使用以及及時(shí)處理,避免了商品因?yàn)橐恍┖鲆?,不注意等原因?qū)е律唐愤^(guò)期的事件,有效地避免了這類事件對(duì)商家造成的損失以及不良影響,也保護(hù)了消費(fèi)者的合法權(quán)益。 參考文獻(xiàn) [1]林篤盛,呂海堂,基于雙光源圖像合成法的標(biāo)牌字符識(shí)別方法研究[J].工業(yè)控制計(jì)算機(jī),2014,27(9):53-54. [2]楊小冬,寧新寶.自動(dòng)圖像識(shí)別系統(tǒng)圖像分割算法的研究[J].南京大學(xué)學(xué)報(bào),2004,40(4):424-431. [3]李建華,馬小妹.基于方向圖的動(dòng)態(tài)閾值圖像二值化方法[J].大連理工大學(xué)學(xué)報(bào),2002,42(5):626-628. [4]劉靜.幾種車牌字符識(shí)別算法的比較[J].電腦與電信,2008(8):72-74. [5]杜敏.基于混合特征提取提取的手寫體數(shù)字識(shí)別方法的研究[J].西安交通大學(xué)學(xué)報(bào),1996(9):94-98. [6]馬莉.MATLAB語(yǔ)言實(shí)用教程[M].北京:清華大學(xué)出版社,2010. [7]Yuntao Cui,Qian Huang,Automatic license extraction from moving vehicles, IEEE Transaction on Pattern Analysis and Machine Intelligence,1999,7(4):126-130. [8]Luis Salgado. Automatic car plate detection and recognition through intelligent vision engineering. IEEE Trans PAMI,1999,17:71-76. 作者簡(jiǎn)介:王斌(1995-),工作單位:杭州電子科技大學(xué),研究方向:圖形識(shí)別。