李嘯天
摘 要:本文概述了圖像識(shí)別技術(shù)的一般流程,分析比較了圖像識(shí)別技術(shù)的技術(shù)特點(diǎn)與優(yōu)缺點(diǎn),概括了圖像識(shí)別的應(yīng)用,并對(duì)圖像識(shí)別技術(shù)的重要步驟與原理進(jìn)行了舉例和講解。
關(guān)鍵詞:圖像識(shí)別;圖像區(qū)域分割;特征提??;匹配
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2018)14-0050-02
1 引言
圖像識(shí)別技術(shù)是目前應(yīng)用十分廣泛的一項(xiàng)技術(shù),它以圖像的形狀、顏色特征為基礎(chǔ),通過聚類的思想和方法從中獲取圖像的信息,進(jìn)而實(shí)現(xiàn)圖像的識(shí)別。近幾年,圖像識(shí)別的研究與應(yīng)用日益增多,尤其體現(xiàn)在生物識(shí)別與衛(wèi)星云圖識(shí)別方面。生物識(shí)別譬如指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別及視網(wǎng)膜識(shí)別具有非常良好的發(fā)展前景;條碼、二維碼的掃描,翻譯軟件常使用的文字識(shí)別及圖片文字錄入,車牌捕捉,蘋果充值卡所用的文字掃描等技術(shù),也是圖像識(shí)別在日常生活中的常見應(yīng)用。圖像識(shí)別研究不斷拓展和深入,其應(yīng)用領(lǐng)域會(huì)愈加廣泛。圖像識(shí)別需要經(jīng)過預(yù)處理、區(qū)域分割、特征提取等步驟,其算法種類繁多而且不同算法間差別巨大,但一般流程基本相同。本文將會(huì)以其一般流程為基礎(chǔ),對(duì)圖像識(shí)別技術(shù)的技術(shù)特點(diǎn)與技術(shù)原理進(jìn)行簡要介紹。
2 圖像識(shí)別的一般流程
2.1 圖像的采集
圖像識(shí)別的第一步是使用合適的方法采集圖像,通過計(jì)算機(jī)進(jìn)行下一步的處理操作。
2.2 預(yù)處理
圖像的預(yù)處理也是圖像識(shí)別的必要步驟。圖像預(yù)處理能夠加大算法的精簡度與可行度,提高識(shí)別算法運(yùn)行的效率,增強(qiáng)特征提取和特征匹配的精確度。預(yù)處理主要分為圖像增強(qiáng)、二值化和細(xì)化三個(gè)步驟。圖像增強(qiáng)能恢復(fù)圖像的原結(jié)構(gòu),為算法運(yùn)行提供較好的環(huán)境,也能夠提高圖像質(zhì)量;二值化是將輸入的灰度圖像轉(zhuǎn)化為二值圖像;細(xì)化是在二值化的基礎(chǔ)上,將不是很均勻的二值圖像轉(zhuǎn)化為一像素寬的點(diǎn)線圖像,以便實(shí)現(xiàn)算法。
2.3 圖像區(qū)域分割
經(jīng)過預(yù)處理后的圖像已經(jīng)可以開始識(shí)別,但還不適宜直接處理。圖像作為一個(gè)整體,具有我們需要和不需要的部分,尤其是所需的目標(biāo)部分和它的背景融成一體,不利于算法處理。因此我們先將輸入的圖像劃為幾個(gè)對(duì)應(yīng)目標(biāo)部分的區(qū)域,稱為感興趣區(qū),再利用目標(biāo)與背景的經(jīng)驗(yàn)區(qū)別來進(jìn)行標(biāo)識(shí)與定位,經(jīng)過一次或多次運(yùn)算,將目標(biāo)部分與背景和無用部分分離。感興趣區(qū)包含了分區(qū)與分區(qū)的描述信息,特定的特征可以區(qū)別不同目標(biāo)部分和非目標(biāo)部分,其中可用的特征差別有灰度、色調(diào)、紋理和頻譜特征等等。因?yàn)樘卣骶哂刑囟ㄐ?,所以這種分割方法還不具有通用性。目前大部分航空航天、軍事、醫(yī)用、通訊技術(shù)和工業(yè)自動(dòng)化等的圖像識(shí)別技術(shù)都使用了圖像區(qū)域分割技術(shù)。
2.4 特征提取
圖像的原始特征數(shù)量可能很大,這時(shí)可以通過映射或變換的方式在低維空間中表示樣本特征。特征提取能夠用數(shù)值形式表達(dá)目標(biāo)圖像的特征,在設(shè)計(jì)算法時(shí)應(yīng)注意盡可能地保留真實(shí)特征,濾去無用的特征。
2.5 判斷匹配
圖像的判斷、分類與匹配是圖像識(shí)別技術(shù)最需要,也是最熱門的一個(gè)研究方向。在圖像識(shí)別的處理系統(tǒng)中,輸入的圖像可能要和成百上千的其他圖像進(jìn)行匹配,為了降低運(yùn)算量和提高算法精確度與可行性,需要精確及通用的方法對(duì)圖像進(jìn)行分類。圖像匹配則是基于預(yù)處理、區(qū)域分割和特征提取,通過查找其共有特征來比對(duì)二者相似程度,從而判斷圖像是否一致。當(dāng)前,細(xì)節(jié)匹配算法是主流的匹配算法,如利用紋理特征進(jìn)行圖像識(shí)別。尋找具有更強(qiáng)表達(dá)圖像特征能力的圖像識(shí)別方式及其算法,至今仍是圖像識(shí)別和人工智能領(lǐng)域的熱點(diǎn)。
3 圖像識(shí)別的技術(shù)特點(diǎn)和優(yōu)點(diǎn)
3.1 圖像識(shí)別技術(shù)的特點(diǎn)
3.1.1 信息量大
相對(duì)于文字信息,圖像信息占用內(nèi)存更大,頻帶更寬。計(jì)算機(jī)對(duì)圖像進(jìn)行存儲(chǔ)和處理通常以二維的形式進(jìn)行,圖像的輸入、傳輸、存儲(chǔ)和處理過程,都需要計(jì)算機(jī)性能與存儲(chǔ)量等相關(guān)方面的技術(shù)支持。
3.1.2 關(guān)聯(lián)性大
關(guān)聯(lián)性是指計(jì)算機(jī)系統(tǒng)本身與圖像的像素(或圖像信息)之間的關(guān)聯(lián),很多時(shí)候只有通過壓縮技術(shù)才可以實(shí)現(xiàn)圖像的分類匹配。尤其是(客觀上)三維的圖像,圖像本身當(dāng)然不具備三維物體的特質(zhì),無法再現(xiàn)其三維幾何信息,此時(shí)應(yīng)進(jìn)行適當(dāng)?shù)募僭O(shè)與重新測量,利用映射或變換等方式,引導(dǎo)識(shí)別解決問題。
3.1.3 人為因素大
后期的圖像處理及修正可能需要人為處理和評(píng)價(jià)。人容易受到光線環(huán)境和知識(shí)限制等的影響,有時(shí)不能保證圖像識(shí)別的精確性。因此為提升圖像識(shí)別的質(zhì)量,現(xiàn)在正致力于讓計(jì)算機(jī)對(duì)人的視覺進(jìn)行模仿,模仿人對(duì)圖像進(jìn)行評(píng)價(jià)的方式。
3.2 現(xiàn)有圖像識(shí)別技術(shù)的優(yōu)點(diǎn)
3.2.1 精確度高
計(jì)算機(jī)掃描儀可以實(shí)現(xiàn)32位圖像像素的數(shù)字化處理,提高了圖像識(shí)別技術(shù)的精確度。
3.2.2 表現(xiàn)性高
圖像識(shí)別處理過程中,計(jì)算機(jī)可以對(duì)幾乎任何情況下的圖像進(jìn)行圖像還原,能夠?qū)?chǔ)存、輸入等相關(guān)因素進(jìn)行準(zhǔn)確處理,保證處理的像素信息。
3.2.3 靈活性高
在圖像輸入時(shí),無論是顯微鏡下的亞微觀圖像還是天文望遠(yuǎn)鏡下的小視角圖像,計(jì)算機(jī)都能以客觀情況為依據(jù)進(jìn)行放縮,并以線性的運(yùn)算和數(shù)學(xué)處理實(shí)現(xiàn)識(shí)別處理。圖像識(shí)別技術(shù)利用二維數(shù)據(jù)對(duì)圖像的某些顏色特征進(jìn)行組合,從而實(shí)現(xiàn)高質(zhì)量顯示圖像,整個(gè)識(shí)別過程統(tǒng)一而又靈活。
4 圖像識(shí)別技術(shù)的關(guān)鍵步驟
4.1 圖像區(qū)域分割方式
4.1.1 利用灰度值
目前最常用的、效率最高的區(qū)域分割方式就是利用目標(biāo)區(qū)域和非目標(biāo)區(qū)域的灰度值,進(jìn)而識(shí)別圖像。例如,設(shè)定合適的閾值,對(duì)圖像的每一個(gè)像素點(diǎn)的灰度值與閾值進(jìn)行大小比較,將圖像的像素歸類為灰度值較大與較小的兩部分,這樣的方法適用于圖像只有目標(biāo)和背景的情況。但如果直接從具有多目標(biāo)的原圖中提取灰度特征,則容易輸入大量的偽特征信息。
4.1.2 區(qū)域生長與分裂合并
區(qū)域生長的具體過程為:從每一個(gè)圖像的像素開始,一步步合并形成感興趣區(qū)。分裂合并則是從整個(gè)圖像出發(fā),逐步執(zhí)行分裂和合并兩個(gè)步驟,最終分割形成感興趣區(qū)。這兩種方法能夠考慮像素在“空間”中的連續(xù)性和臨接性,能夠有效消除單像素灰度的干擾,且具有很好的魯棒性。
4.1.3 利用邊緣
不同區(qū)域之間往往在邊緣處灰度值變化非常劇烈??梢韵日业侥繕?biāo)與非目標(biāo)區(qū)域的邊緣點(diǎn),再逐步構(gòu)成輪廓,最后找出感興趣區(qū)。
4.2 使用局部細(xì)節(jié)特征進(jìn)行特征提取
直接提取灰度特征的方法和直接利用灰度值分割圖像的方法具有相似性,效率高但易輸出偽特征信息。若采取模仿人類的做法,即采用邊緣區(qū)域規(guī)劃全圖特征,提取方向圖、奇異點(diǎn)進(jìn)行分類的方法,則具有很好的魯棒性,但在圖像質(zhì)量較差時(shí)結(jié)果不可信。
目前業(yè)界常利用特定的局部細(xì)節(jié)特征進(jìn)行特征提取,大致的算法如下:
我們采用一個(gè)3×3的框架來進(jìn)行圖像端點(diǎn)和分支點(diǎn)的特征提取,用A表示需要檢測的目標(biāo)像素,鄰域點(diǎn)用到表示,這八個(gè)像素的灰度值則用到表示(表1)。
若A為端點(diǎn),則鄰域點(diǎn)的特征公式為:
若A為分支點(diǎn),則鄰域點(diǎn)的特征公式為:
通過這樣的方法,圖像特征點(diǎn)被確定,與此同時(shí),圖像的類別和位置信息也能夠得到確認(rèn)和記錄。
4.3 細(xì)節(jié)匹配
現(xiàn)在最常用的圖像匹配方式是細(xì)節(jié)匹配,算法步驟如下:
模板細(xì)節(jié)點(diǎn)模式的細(xì)節(jié)點(diǎn)(具有特定特征)特征向量集合如下:
輸入細(xì)節(jié)點(diǎn)模式的細(xì)節(jié)點(diǎn)特征向量集合如下:
M有m個(gè)細(xì)節(jié)點(diǎn),N有n個(gè)細(xì)節(jié)點(diǎn),尋找M、N中點(diǎn)的最佳對(duì)應(yīng)關(guān)系,并按照此關(guān)系下對(duì)應(yīng)的細(xì)節(jié)點(diǎn)數(shù)目,可得匹配理論分值,與閾值比較。若,則說明兩模式匹配,若,則兩模式不匹配。
5 結(jié)語
圖像識(shí)別技術(shù)的原理依據(jù)人類對(duì)圖像的識(shí)別原理不斷發(fā)展而來,本質(zhì)上并不深?yuàn)W,只是計(jì)算機(jī)所需要處理的信息十分復(fù)雜。圖像處理技術(shù)其實(shí)是運(yùn)用程序,使模擬在人類腦海中進(jìn)行的圖像識(shí)別過程的算法得以實(shí)現(xiàn)。目前,利用計(jì)算機(jī)實(shí)現(xiàn)圖像識(shí)別主要是利用圖像特征的描述對(duì)其進(jìn)行處理。圖像識(shí)別技術(shù)以其廣泛的應(yīng)用與研究領(lǐng)域,必將會(huì)在日新月異的當(dāng)代社會(huì)中更好地嶄露頭角,創(chuàng)造更多的經(jīng)濟(jì)與社會(huì)價(jià)值。
參考文獻(xiàn)
[1]張家怡.圖像識(shí)別的技術(shù)現(xiàn)狀和發(fā)展趨勢[J].電腦知識(shí)與技術(shù):學(xué)術(shù)交流,2010,06(7X):6045-6046.
[2]于麗穎.圖像識(shí)別方法技術(shù)分析與應(yīng)用[C]//中國煤礦信息化與自動(dòng)化高層論壇,2014.
[3]陳云平.數(shù)字圖像識(shí)別在人臉檢測中的應(yīng)用[J].計(jì)算機(jī)時(shí)代,2012,(5):37-38.
[4]翁和王.關(guān)于人工智能中的圖像識(shí)別技術(shù)的研究[J].信息通信,2016,(10):191-192.
[5]劉芳.計(jì)算機(jī)智能化圖像識(shí)別技術(shù)的理論性探究[J].信息系統(tǒng)工程,2017,(4):16-16.