郭 松,范存群
(1.呼倫貝爾學(xué)院 傳媒學(xué)院,內(nèi)蒙古 呼倫貝爾 021008; 2.中國(guó)氣象局 國(guó)家衛(wèi)星氣象中心,北京 100081)
圖像識(shí)別主要通過強(qiáng)大的計(jì)算能力,對(duì)多源、大量圖數(shù)據(jù)進(jìn)行自動(dòng)化地分析和理解,涉及統(tǒng)計(jì)、計(jì)算機(jī)技術(shù)、神經(jīng)生物等學(xué)科。圖像識(shí)別技術(shù)已廣泛應(yīng)用于醫(yī)療、遙感、鐵路、交通等各大領(lǐng)域,有效的圖像識(shí)別可以極大地提高生產(chǎn)效率。在圖像識(shí)別實(shí)際應(yīng)用中,往往需要對(duì)大量圖像進(jìn)行識(shí)別,其算法的運(yùn)行效率以及穩(wěn)定和有效性已經(jīng)成為該領(lǐng)域亟需提高的方向。當(dāng)前,圖像識(shí)別技術(shù)主要圍繞圖像多種特征屬性建立相關(guān)識(shí)別算法。
HARZALLAH等[1]提出一種圖像分類和對(duì)象定位相組合方法,該方法通過上下文組合的方式闡述圖像分類對(duì)于檢測(cè)的優(yōu)化,并在此基礎(chǔ)上定義了非線性分類器。HUANG等[2]在特征編碼的基礎(chǔ)上給出一種演變式圖像識(shí)別方法。CHEN 等[3]指出傳統(tǒng)的圖像分類系統(tǒng)存在的問題,在忽略多種色彩的情況下僅考慮圖片亮度信息,這可能導(dǎo)致分類出現(xiàn)誤差。劉巖等[4]提出一種基于支持向量機(jī)的復(fù)雜混合零件姿態(tài)圖像識(shí)別方法。劉萬軍等[5]提出一種圖像識(shí)別算法,該算法基于雙重優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò),在構(gòu)造卷積神經(jīng)網(wǎng)絡(luò)時(shí),建立了特征提取和回歸分類的雙重優(yōu)化模型,實(shí)現(xiàn)了卷積過程和全連接過程的集成優(yōu)化。在圖像識(shí)別領(lǐng)域,魏濤等[6]提出一種自標(biāo)注在線順序極速學(xué)習(xí)機(jī)算法,以充分利用未標(biāo)號(hào)數(shù)據(jù),在目標(biāo)域的數(shù)據(jù)較少、未標(biāo)號(hào)數(shù)據(jù)較多的情況下提高模型識(shí)別能力。KATSAGGELOS等[7]通過最大似然估計(jì)方法找出未知參數(shù),并引入點(diǎn)擴(kuò)散函數(shù)描述模糊過程,提出一種基于模糊識(shí)別和噪聲模糊圖像恢復(fù)的算法。董素鴿等[8]提出一種基于改進(jìn)證據(jù)理論的顯示圖像復(fù)雜目標(biāo)識(shí)別方法。王烈等[9]構(gòu)造了一個(gè)基于Faster R-CNN的多任務(wù)網(wǎng)絡(luò)模型,可以同時(shí)完成目標(biāo)圖像識(shí)別、鑒別和分類。白帆等[10]設(shè)計(jì)了一種以溫度為矢量的雙通道圖像識(shí)別算法。
一般情況下,圖像的識(shí)別主要通過特定的主題、灰度、顏色、紋理和內(nèi)容等特征進(jìn)行識(shí)別,但是上述識(shí)別方法并沒有考慮到各個(gè)特征對(duì)圖像識(shí)別效果的影響程度。因此,本文提出一種基于重要度理論的圖像識(shí)別方法(Image Recognition based on Importance,IRI),首先給出重要度理論的相關(guān)定義和定理,然后根據(jù)圖像特征的映射建立圖像特征知識(shí)域,并在此基礎(chǔ)上計(jì)算得到圖像特征知識(shí)的重要度,最后將圖像特征知識(shí)的重要度作為權(quán)值進(jìn)行圖像特征向量的加權(quán)模計(jì)算,從而對(duì)圖像進(jìn)行識(shí)別。基于重要度的圖像識(shí)別方法可以更好地反映出不同圖像特征對(duì)圖像識(shí)別的影響程度,并且通過不同方式的切分方法可以根據(jù)實(shí)際要求進(jìn)行不同復(fù)雜程度的計(jì)算,從而更為準(zhǔn)確地進(jìn)行圖像識(shí)別。
在粗糙集理論中,有一種新的計(jì)算方法,即基于重要度進(jìn)行計(jì)算,重要度能夠反映事物屬性對(duì)一個(gè)領(lǐng)域的影響程度。在圖像識(shí)別中,準(zhǔn)確地描述特征屬性對(duì)于圖像域的影響程度可以更為準(zhǔn)確地進(jìn)行圖像識(shí)別。因此,本文在圖像識(shí)別屬性特征計(jì)算上引入重要度理論來構(gòu)建識(shí)別算法,從而更為準(zhǔn)確地表現(xiàn)出圖像特征,提高圖像識(shí)別準(zhǔn)確度。下面先給出有關(guān)重要度理論的介紹。
設(shè)K=(V,R)為一知識(shí)庫(kù),知識(shí)r∈R為等價(jià)關(guān)系,如圖1所示,有r?V×V。
定義1若知識(shí)r∈R的粒度可記為GD(r),則定義GD(r)=|r|/|V2|=|r|/|V|2(其中|r|表示r?V×V的基數(shù))[11-12]。當(dāng)r為論域關(guān)系,即r=δ時(shí),r的粒度達(dá)到最大值|V2|/|V|2=1;而當(dāng)r為相等關(guān)系時(shí),即r=ω,r的粒度達(dá)到最小值|V|/|V|2=1/|V|。
當(dāng)存在GD(r)∈[1/|V|,1],GD(r)的大小可以表示成知識(shí)(u,v)的區(qū)分能力,當(dāng)知識(shí)粒度值較小時(shí),該知識(shí)區(qū)分能力較強(qiáng)。當(dāng)(u,v)?R時(shí),則對(duì)象(u,v)與該知識(shí)域不具備等價(jià)關(guān)系,可以認(rèn)為對(duì)象在知識(shí)域下具備區(qū)分能力;反之,對(duì)象在知識(shí)域下不具備區(qū)分能力。因此,GD(r)表示在V中隨機(jī)選擇對(duì)象(x,y)且對(duì)象r-不可區(qū)分的概率[12]。粒度可能性越小,則GD(r)越小,說明r的區(qū)分能力越強(qiáng),反之說明r的區(qū)分能力越弱。綜上所述,可以得出以下區(qū)分度的定義。
定義2將Dis(r)定義為知識(shí)r的區(qū)分度,其中Dis(r)=1-GD(r)。同時(shí)有Dis(r)∈[0,1-1/|V|][11]。
定理1在知識(shí)域K=(V,R)中,V/R={X1,X2,…,Xn},則
(1)
定義3假設(shè)X?A為一屬性子集,而x∈A為一屬性,則x對(duì)于X的重要度可記為SigX(x),定義為SigX(x)=1-|X∪{x}|/|X|,其中|X|表示不可區(qū)分關(guān)系|ND(X)|[12-13]。
定理2屬性x的重要度與它的區(qū)分度相等,即Sig(x)=Dis(x)[13]。
圖像的特征包含多個(gè)方面(如明暗、顏色、灰度等),將這些特征轉(zhuǎn)化為量化計(jì)算后可以將其很直觀地表示為具體的特征值。在圖像識(shí)別中,一般采用圖像均勻切塊的方法對(duì)圖像進(jìn)行精細(xì)化處理,本文將圖像分為n×n塊,每一塊子圖像對(duì)應(yīng)的特征向量為(w1,w2,…,wN),其中N為分量數(shù)。通過引入重要度理論,圖像特征可以映射為一個(gè)知識(shí)域K=(V,W)。通過定理1可以得到特征知識(shí)域的粒度:
(2)
根據(jù)定義2可以得到知識(shí)W的的區(qū)分度為:
Dis(W)=1-GD(W);
(3)
根據(jù)定理2可以得到知識(shí)W的重要度為:
Sig(W)=1-GD(W);
(4)
圖像特征知識(shí)W的重要度則可以表示為:
(5)
為有效識(shí)別圖像,上文引入了圖像特征知識(shí)域的重要度概念,通過對(duì)圖像特征域進(jìn)行重要度計(jì)算,進(jìn)而將重要度作為權(quán)值賦予圖像特征向量,最后計(jì)算得到加權(quán)向量模進(jìn)行圖像識(shí)別。圖像特征向量的加權(quán)模則可以表示為:
(6)
由式(6)得到的圖像特征向量的加權(quán)模值可以有效衡量圖像子塊的特征,當(dāng)圖像整體加權(quán)模值與一類圖像加權(quán)模值近似時(shí),則可以認(rèn)為該類圖像屬于同一類型。
本文所提方法主要針對(duì)大量圖像的識(shí)別,由于圖像特征是圖像識(shí)別的關(guān)鍵性因素,而重要度方法可以有效地對(duì)圖像特征進(jìn)行度量,因此本文主要針對(duì)基于重要度的圖像識(shí)別方法展開相應(yīng)研究。首先,給出了重要度理論的定義和相關(guān)定理,然后得到圖像特征知識(shí)域的重要度,最后通過基于重要度的圖像特征知識(shí)域計(jì)算并確定圖像分類。
本文通過仿真實(shí)驗(yàn)來驗(yàn)證算法的實(shí)時(shí)性和準(zhǔn)確性。實(shí)驗(yàn)環(huán)境的硬件配置如下:操作系統(tǒng)為Windows 7,計(jì)算機(jī)CPU為Core i7-4790 3.60 GHz處理器, RAM為8 GB。本次實(shí)驗(yàn)在圖片類別和特征分量均已知的情況下,使用800張圖像進(jìn)行測(cè)試。實(shí)驗(yàn)中對(duì)圖像進(jìn)行3種不同的切分方式,分別為:50×50,80×80和100×100。并與基于絕對(duì)差分的圖像識(shí)別和基于灰度差分的圖像識(shí)別兩種方法對(duì)比,分析了準(zhǔn)確率。
仿真實(shí)驗(yàn)結(jié)果分析如下:
(1)算法實(shí)時(shí)性
當(dāng)圖像識(shí)別算法處理大量圖像時(shí),往往會(huì)降低算法的效率,為驗(yàn)證本文所提算法的時(shí)效性,實(shí)驗(yàn)中分別給出3種不同的圖像切分方式的算法處理時(shí)間的分析,如圖2所示。
如圖2所示,算法在50×50切分方式時(shí),算法整體的運(yùn)行時(shí)間約為400 ms,在80×80切分方式時(shí),算法整體運(yùn)行時(shí)間約為450 ms,在100×100切分方式時(shí),算法整體的運(yùn)行時(shí)間約為500 ms。上述3種圖像分割方法的算法運(yùn)行時(shí)間都較短,說明本文提出的基于重要度的圖像識(shí)別方法計(jì)算復(fù)雜度低,有較好的時(shí)效性。
(2)算法準(zhǔn)確性
為驗(yàn)證本文提出的基于重要度理論的圖像識(shí)別方法(IRI)的準(zhǔn)確性,在仿真實(shí)驗(yàn)中分別與基于絕對(duì)差的圖像識(shí)別方法(Image recognition based on Absolute Difference ,IAD)和基于灰度差的圖像識(shí)別方法(Image recognition based on Gray Difference ,IGD)進(jìn)行圖像識(shí)別準(zhǔn)確性的對(duì)比分析,不同切分方式的圖像識(shí)別算法準(zhǔn)確率如圖3~圖5所示。
以上結(jié)果是在模擬環(huán)境中通過10次獨(dú)立實(shí)驗(yàn)得到的。圖3~圖5的實(shí)驗(yàn)結(jié)果表明,本文提出的基于重要度的IRI算法在圖像識(shí)別精度上比基于絕對(duì)差分的圖像識(shí)別方法(IAD)和基于灰度差分的圖像識(shí)別方法(IGD)有更明顯的優(yōu)勢(shì)。圖像分割越細(xì),識(shí)別精度也隨之增加,原因在于隨著圖像分割的詳細(xì)程度的增大,圖像特征顯示也隨之越來越詳細(xì),從而使識(shí)別結(jié)果更準(zhǔn)確。但是,圖像切分的增加并不能無限度地提高圖像識(shí)別的準(zhǔn)確性。一方面過多的圖像切分使得算法計(jì)算效率下降,另一方面圖像識(shí)別的準(zhǔn)確性并不能無限地接近100%。在實(shí)際應(yīng)用中,可以根據(jù)實(shí)際精度需求和計(jì)算能力選擇圖像切分的幅度。
由圖3~圖5的結(jié)果可以看出,與基于絕對(duì)差分的圖像識(shí)別和基于灰度差分的圖像識(shí)別兩種方法相比,本文研究的基于重要度的圖像識(shí)別方法可以明顯地提高識(shí)別精度,特別是當(dāng)圖像分割為100×100時(shí),該算法可以達(dá)到95%以上的準(zhǔn)確率,從而可以有效地滿足圖像識(shí)別的精度要求。
為保證圖像識(shí)別算法計(jì)算的及時(shí)性,并有效地提高圖像識(shí)別的準(zhǔn)確性,本文在仿真實(shí)驗(yàn)的基礎(chǔ)上提出一種基于重要度理論的圖像識(shí)別方法。首先表述了重要度理論相關(guān)的定義和定理,然后通過圖像特征的映射構(gòu)建圖像特征知識(shí)域,并由此計(jì)算出圖像特征知識(shí)的重要度,最后將圖像特征知識(shí)的重要度作為權(quán)值進(jìn)行圖像特征向量的加權(quán)模計(jì)算,從而對(duì)圖像進(jìn)行識(shí)別。下一步工作中,筆者將優(yōu)化圖像特征向量的構(gòu)造,以期更好地提高圖像識(shí)別的準(zhǔn)確性。