摘 要:在機(jī)器視覺(jué)智能導(dǎo)盲系統(tǒng)中,對(duì)2維圖像中物體標(biāo)注與識(shí)別極為關(guān)鍵,這一步?jīng)Q定整個(gè)系統(tǒng)對(duì)障礙物判別的正確性和智能導(dǎo)盲的準(zhǔn)確性、實(shí)用性。為了得到較好的識(shí)別,先進(jìn)行閾值分割,再對(duì)圖像進(jìn)行Gabor小波變換,考慮速度精度、適應(yīng)性再選擇多尺度和多方向的濾波器組成的小波濾波器,進(jìn)行特征提取。識(shí)別需要建好的目標(biāo)模型庫(kù)由Gabor網(wǎng)絡(luò)組成,識(shí)別出目標(biāo)之后,為了不受訓(xùn)練時(shí)間和訓(xùn)練樣本的約束,采用數(shù)據(jù)驅(qū)動(dòng)的的圖像標(biāo)注方法。
關(guān)鍵詞:Gabor濾波變換;圖像標(biāo)注;圖像檢索;標(biāo)簽挖掘
中圖分類號(hào):TP391.41
本文主要研究在基于機(jī)器視覺(jué)智能導(dǎo)盲系統(tǒng)中2維圖像中物體標(biāo)注與辨識(shí)的部分。現(xiàn)下,機(jī)器視覺(jué)領(lǐng)域有很多的圖像識(shí)別和標(biāo)注技術(shù)。在眾多的特征提取算法中選擇了Gabor濾波算法,因?yàn)榇朔椒▽?duì)空間分布和精度要求都比較滿足,利用閾值分割先對(duì)原圖進(jìn)行處理,提高了對(duì)識(shí)別物的計(jì)算速度,對(duì)物體識(shí)別極為有利;對(duì)于數(shù)據(jù)驅(qū)動(dòng)的圖像標(biāo)注方法,文獻(xiàn)[1]和文獻(xiàn)[2]提出基于Search的圖像標(biāo)注算法,屬于數(shù)據(jù)驅(qū)動(dòng)的標(biāo)注算法,AnnoSearch方法先將識(shí)別圖像視為查詢圖像,提供一個(gè)初始標(biāo)注,在檢索基于文本的相關(guān)圖像集合和標(biāo)注集合,這個(gè)依賴人為提供的標(biāo)注,而文獻(xiàn)[1]優(yōu)化了該方法,實(shí)現(xiàn)了檢索與標(biāo)注的自動(dòng)化。
1 特征提取和識(shí)別
在真正的機(jī)器視覺(jué)智能導(dǎo)盲系統(tǒng)中,圖像目標(biāo)和背景的灰度不是完全不同,是隨著可見(jiàn)光的強(qiáng)弱不同,目標(biāo)亮度和背景亮度都在變化之中。閾值不應(yīng)該是固定不變的,最好是自適應(yīng)圖像像素的實(shí)際性質(zhì)。選擇自適應(yīng)閾值算法對(duì)圖像進(jìn)行閾值分割后,采用Gabor濾波算法,它有著比較優(yōu)越的方向選擇和頻率選擇特點(diǎn)。本文所采用的二位Gabor函數(shù),它的脈沖響應(yīng)函數(shù)表達(dá)式是:
ωk與θl(k,?N)分別為調(diào)制頻率與調(diào)制方向,選擇k∈{0,--5}個(gè)頻率和l∈{0,--5}個(gè)方向來(lái)標(biāo)記,Gabor濾波器可以比較好的描述識(shí)別物。這樣一來(lái)就有36個(gè)濾波器,有著不同的Gabor小波特征,對(duì)圖像進(jìn)行Gabor小波變換,如圖1所示。
圖1 Gabor小波濾波
目標(biāo)識(shí)別需要建好的目標(biāo)模型庫(kù)由Gabor網(wǎng)絡(luò)組成。目標(biāo)模型Gabor網(wǎng)格的形成過(guò)程為:物體圖像的Gabor小波分解結(jié)果是一個(gè)多分辨率的圖像模板,它可以通過(guò)物體圖像與復(fù)Gabor小波濾波器的卷積得到,利用像素之間的相關(guān)性,對(duì)這個(gè)物體圖像的模板進(jìn)行亞抽樣就形成了一個(gè)Gabor網(wǎng)格。目標(biāo)圖像Gabor小波分解與模型Gabor網(wǎng)格的相似性測(cè)度則采用彈性匹配算法。
2 圖像標(biāo)注
現(xiàn)下,已經(jīng)出現(xiàn)的圖像標(biāo)注方法很多,可是受標(biāo)注詞典和訓(xùn)練樣本的約束較多,為了避免這些缺陷,采用數(shù)據(jù)驅(qū)動(dòng)的圖像標(biāo)注方法。這里要解決的最關(guān)鍵的是圖像檢索和標(biāo)簽挖掘技術(shù)。
圖像檢索從大規(guī)模圖像數(shù)據(jù)庫(kù)中搜索一組與查詢圖像視覺(jué)上十分相似的圖像:
(1)利用加權(quán)搜索樹和共現(xiàn)信息的特征量化方法,首先要對(duì)不同特征的視覺(jué)判別能力進(jìn)行區(qū)分,并依賴有效的特征量化精度構(gòu)建加權(quán)的搜索樹對(duì)局部特征進(jìn)行有區(qū)別的量化,然后利用大規(guī)模訓(xùn)練集統(tǒng)計(jì)不同視覺(jué)特征之間的共現(xiàn)頻率。這個(gè)量化方法有著比較快的收斂性,和高效的圖像檢索效率。
(2)利用特征組合的圖像表示方法,先用局部特征間空間位置信息把互相包含的局部特征組合在一起來(lái)增強(qiáng)局部特征的表達(dá)和區(qū)分能力;其次進(jìn)行圖像匹配時(shí)以相應(yīng)倒排索引機(jī)制實(shí)現(xiàn)特征的組合匹配,并引入特征組合間的空間約束關(guān)系進(jìn)而提高圖像匹配的準(zhǔn)確率。該特征組合有著較好的尺度、旋轉(zhuǎn)和平移不變性,因此非常適合用于大規(guī)模圖像檢索。
(3)采用基于概率混合模型的標(biāo)簽挖掘方法用于圖像標(biāo)注,本方法把數(shù)據(jù)驅(qū)動(dòng)的圖像標(biāo)注框架中標(biāo)簽挖掘歸納成關(guān)鍵詞排序問(wèn)題,先采用回歸模型利用文本的統(tǒng)計(jì)特征提取候選詞,然后將基于人工知識(shí)庫(kù)學(xué)習(xí)的主題空間作為橋梁來(lái)建立圖像和文本之間的聯(lián)系,最后通過(guò)建立概率混合模型對(duì)候選詞進(jìn)行相關(guān)度排序從而得到最終的標(biāo)注結(jié)果。這個(gè)方法支持標(biāo)注字典,還能生成有效的語(yǔ)義明確的短語(yǔ),大幅度提高圖像標(biāo)注的性能。
(4)是高分辨率圖像的實(shí)時(shí)分享方案,將圖像分享與基于檢索的圖像重構(gòu)相結(jié)合,利用云平臺(tái)和大數(shù)據(jù)驅(qū)動(dòng)圖像的實(shí)時(shí)分享應(yīng)用。首先采用縮略圖像和局部特征對(duì)圖像進(jìn)行聯(lián)合表示、聯(lián)合壓縮,在保證重構(gòu)質(zhì)量的基礎(chǔ)上進(jìn)一步減少移動(dòng)傳輸?shù)呢?fù)載;然后通過(guò)局部特征建立部分復(fù)制圖像之間的聯(lián)系,進(jìn)而通過(guò)區(qū)域匹配、區(qū)域校準(zhǔn)、不相關(guān)區(qū)域剪切以及區(qū)域拼接實(shí)現(xiàn)高分辨率圖像的即時(shí)重構(gòu)分享。這個(gè)方案使得機(jī)器視覺(jué)智能導(dǎo)盲系統(tǒng)視覺(jué)體驗(yàn)更加完善。
其次是標(biāo)簽挖掘,從圖像檢索結(jié)果的文本描述中挖掘出有意義的文本關(guān)鍵詞作為圖像最終的標(biāo)注結(jié)果。
為了保證圖像標(biāo)注的準(zhǔn)確率,在充滿噪聲的文本描述中進(jìn)行快速有效的標(biāo)簽挖掘,需具備幾個(gè)約束條件:
(1)具備一定程度的抗噪能力;
(2)支持實(shí)時(shí)在線的標(biāo)注服務(wù);
(3)面向一個(gè)開(kāi)放的標(biāo)注字典;
(4)有效生成特定有意義的短語(yǔ)。
采用基于混合模型的標(biāo)簽挖掘,將標(biāo)簽挖掘歸納為一個(gè)關(guān)鍵詞排序問(wèn)題,首先利用一個(gè)回歸模型提取語(yǔ)義明確的單詞或短語(yǔ)作為標(biāo)注的候選詞,然后通過(guò)基于主題空間的概率混合模型對(duì)候選詞進(jìn)行相關(guān)度排序,最終將排序靠前的單詞或短語(yǔ)作為圖像標(biāo)注結(jié)果。
3 結(jié)束語(yǔ)
機(jī)器視覺(jué)智能導(dǎo)盲系統(tǒng)中的2維圖像中物體標(biāo)注與辨識(shí)這部分課題研究意義深遠(yuǎn),隨著各類成像電子設(shè)備的飛速發(fā)展,對(duì)視頻圖像的更多處理需要越來(lái)越多,而機(jī)器視覺(jué)領(lǐng)域的研究極具挑戰(zhàn)性和可發(fā)展性,對(duì)它的學(xué)習(xí)希望能為從事該方向研究的人員提供一定的借鑒意義和參考價(jià)值。
參考文獻(xiàn):
[1]孫君頂,趙珊.圖像低層特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,2009.
[2]趙玉鳳.圖像檢索中自動(dòng)標(biāo)注技術(shù)的研究[D].北京:北京交通大學(xué),2009.
[3]姜弘道,陳和群.有限單元法的程序設(shè)計(jì)[M].北京:水利電力出版社,1992.
作者簡(jiǎn)介:于寶功(1990.10-),男,陜西西安人,本科,研究方向:2維圖像中物體標(biāo)注與辨識(shí)。
作者單位:西安文理學(xué)院 軟件學(xué)院,西安 710065
基金項(xiàng)目:2012年地方高校國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(基于機(jī)器視覺(jué)的智能導(dǎo)盲系統(tǒng) 201211080012)。