王 敬,趙紅東,朱勝銀,楊志明
(河北工業(yè)大學(xué) 電子信息工程學(xué)院,天津 300401)
近年來,隨著衛(wèi)星技術(shù)和高分辨率對地觀測系統(tǒng)的快速發(fā)展,傳回地面工作站的高分辨率多光譜圖像數(shù)據(jù)量急劇增加。面對海量遙感圖像數(shù)據(jù),快速有效地檢索已成為急需解決的問題[1]。
當(dāng)今主流的遙感圖像檢索是基于內(nèi)容特征的,基于圖像內(nèi)容特征(如紋理、形狀、顏色等)或特征組合順序檢索的內(nèi)容式遙感圖像檢索得到了迅速發(fā)展[2-4]。目前,主要的遙感圖像檢索研究分為兩類:一類是提高檢索的準(zhǔn)確率,文獻(xiàn)[5]提出了基于聯(lián)合稀疏表示算法與形態(tài)學(xué)特征的高光譜圖像分類,提高稀疏分類的能力,提高分類精度;董安國提出的基于譜聚類和稀疏表示的高光譜圖像分類算法[6];文獻(xiàn)[7]提出了基于顏色矩和灰度共生矩陣的遙感圖像檢索原型系統(tǒng);綜合利用小波變換、LTRP和ANFIS的遙感圖像檢索技術(shù),檢索精度有所提高[8];文獻(xiàn)[9]對圖像RGB值的稀疏表達(dá)的相似性度量方法進(jìn)行檢索,能夠有效進(jìn)行圖像檢索,但計(jì)算復(fù)雜度高;改進(jìn)圖像檢索中相關(guān)反饋,使得檢索精度提高,但是由于選取的圖像特征多,相似性度量準(zhǔn)則復(fù)雜使得檢索效率較低[10]。另一類是提高檢索的效率,包含降維方法進(jìn)行圖像檢索:聚合特征進(jìn)行檢索,提高檢索的精確度[11];對多光譜遙感圖像降維以提高檢索效率,減少圖像存儲空間[12];另一方面,利用分類方法進(jìn)行圖像檢索成為研究的方向,樊利恒等提出基于分類器集成的高光譜遙感圖像分類方法[13];張洪群提出深度學(xué)習(xí)的半監(jiān)督遙感圖像檢索方法,與不分類相比檢索效率有明顯提高[14]。由我國2013年發(fā)射的GF-1遙感衛(wèi)星拍攝的高分辨率圖像,更能切實(shí)反映我國國情,目前對其研究報(bào)道較少。為了提高檢索效率,本文對河北陽原地區(qū)的GF-1圖像進(jìn)行研究,對比不同圖像特征在三類圖像中的分辨能力,選出最具分辨能力的特征,并提出了基于貢獻(xiàn)值的特征選擇及其分類檢索方法。
實(shí)驗(yàn)所用遙感圖像共包含3個類別,分別是山脊、水體和村落。GF-1號三類遙感圖像樣本如圖1所示,圖像分辨率為8 m,大小為50像素×50像素。
圖1 GF-1三類遙感圖像樣本
矩不變量分析圖像某個區(qū)域或者邊界的灰度變化情況。Hu矩的7個矩不變量M1~M7具有平移、旋轉(zhuǎn)和尺度不變性[15]。圖1中3個遙感圖像樣本Hu矩特征值如表1所示。
表1 典型三個遙感圖像樣本的Hu矩特征值
表1為利用sobel算子得到遙感圖像邊緣圖,對其提取的Hu矩特征值。表1中的圖像特征值即是圖2中三幅圖像的Hu矩特征值。
小波變換是指將信號分解為一系列的基本函數(shù),這些基本函數(shù)均是通過對母函數(shù)變形得到,在時域和頻域兩個域表示信號的局部特征的能力。表2為利用小波Haar進(jìn)行小波分解提取的3個遙感圖像樣本的特征值。其中,圖像在水平和垂直方向上的低頻分量LL、水平方向上的低頻和垂直方向上的高頻LH、水平方向上的高頻和垂直方向上的低頻HL以及水平和垂直方向上的的高頻分量 HH。
表2 3個遙感圖像樣本的小波分解特征值
灰度共生矩陣(GLCM)描述了圖像中從灰度為i的像素出發(fā),到距離為(dx,dy)的像素灰度為j的概率(或次數(shù))。本文以0°、45°、90°和135° 4個方向上,灰度共生矩陣的能量ASM、熵ENT、慣性矩CON及相關(guān)性COR的均值和標(biāo)準(zhǔn)差作為8維紋理特征[16],如表3所示。
表3 3個遙感圖像樣本的灰度共生矩陣特征值
分別計(jì)算3類圖像的3種圖像特征值,將同類遙感圖像特征值的均值作為類別特征值。采用不同的特征分別進(jìn)行分類實(shí)驗(yàn),可得分類正確率如表4所示。由表1—3可見,發(fā)現(xiàn)Hu矩的村落圖像與另外兩類圖像的差值差距較大,能夠準(zhǔn)確判別村落圖像,而另兩種圖像的類別特征值之差較小,不能作為圖像特征用于分類檢索。多光譜圖像的G通道能夠?qū)ι郊购退w進(jìn)行良好區(qū)分。引入顏色特征即圖像的G通道圖像的值,與Hu矩共同構(gòu)成遙感圖像分類檢索的特征空間。根據(jù)地物分布情況得到200幅山脊、136幅水體和216幅村落圖像。以部分樣本,50幅山脊、34幅水體和54幅村落圖像,進(jìn)行分類正確率測試,實(shí)驗(yàn)分類正確率,如表4所示。
圖像檢索以歐式距離度量特征相似度。若直接對Hu矩和顏色特征組合檢索,相似度計(jì)算的復(fù)雜度較高。本文將特征的各分量的重要性納入考慮,通過計(jì)算Hu 矩特征各分量在分類檢索中的貢獻(xiàn)值,發(fā)現(xiàn)部分分量的貢獻(xiàn)值較小。貢獻(xiàn)值即各分量在相似性度量中距離的差值中所占的比重。只選取貢獻(xiàn)量大的特征分量,在保證檢索質(zhì)量的情況下,有效提升檢索效率。區(qū)分不同圖像類別時,Hu矩各個不同分量的貢獻(xiàn)值,如表5所示。Hu矩的M1和M2貢獻(xiàn)值之和達(dá)到99%以上,故選擇M1和M2代表整個Hu矩分量,而忽略其它分量。
表4 選取不同特征的遙感圖像分類正確率 %
表5 山脊、水體及村莊圖像Hu矩各分量差值的貢獻(xiàn)值
分類檢索在檢索圖像前進(jìn)行,判斷其所屬類別。然后,在檢索圖像庫的同類別圖像庫中檢索。圖像分類的各個類別中的圖像越多,分類檢索方式越能提高檢索的效率。本文計(jì)算已知分類的遙感圖像樣本特征值,并存入特征空間。同一類別的樣本特征均值作為類別特征值。本文中Hu矩判定遙感圖像是否屬于村落類別?若是,則在村落類別的圖像中檢索;若不是,則通過顏色特征判定待檢索的遙感圖像所屬類別。最后,只在檢索圖像庫中同類別圖像中查找相似圖像。
采用圖像特征向量的歐式距離進(jìn)行不同遙感圖像的相似性計(jì)算,設(shè)兩幅遙感圖像的特征向量分別為s=(s1,s2,…,sm)和t=(t1,t2,…,tm),特征向量為m維,則這兩幅圖像的特征距離d(s,t)為:
(1)
式中:si和ti分別為特征向量s和t的第i個分量。d(s,t)越大,相似性越??;d(s,t)越小,相似性越大。
本文提出的基于貢獻(xiàn)值的有效特征選擇及其分類檢索算法,其計(jì)算過程如下:
第一步:對訓(xùn)練圖像庫中的圖像提取特征,得到訓(xùn)練圖像特征集。然后利用遙感圖像進(jìn)行特征分類,并得到不同類別的圖像類別特征值;
第二步:對檢索圖像庫中的圖像提取與第一步相同的特征,利用第一步得到的圖像類別特征值,判斷檢索圖像庫中每幅圖像的類別;
第三步:對待檢索圖像提取與第一步相同的特征,利用第一步得到的圖像類別特征值,判斷待檢索圖像的類別;
第四步:根據(jù)待檢索圖像的類別,利用圖像相似性度量準(zhǔn)則進(jìn)行,在檢索圖像庫中的同類別圖像中查找與待檢索圖像相似的圖像,得到檢索結(jié)果。
目前,在遙感圖像檢索中最常用的性能評估準(zhǔn)則是查全率和查準(zhǔn)率,查準(zhǔn)率P和查全率Q計(jì)算式為:
P=n/N,
(2)
Q=n/S.
(3)
其中,n為一次檢索返回的檢索結(jié)果中正確圖像的數(shù)目,N為一次檢索返回的檢索結(jié)果中圖像的總數(shù)目,S為檢索圖像庫中包含正確圖像的數(shù)目。
本文每次檢索返回最相似的10幅圖像,采用查準(zhǔn)率對檢索系統(tǒng)性能進(jìn)行評估。
構(gòu)建并實(shí)現(xiàn)基于GF-1遙感圖像特征的遙感圖像檢索系統(tǒng)。實(shí)驗(yàn)圖像均從原始GF-1遙感圖像中截取的。根據(jù)地物分布情況得到200幅山脊、136幅水體和216幅村落圖像,截取子圖大小為50像素×50像素。從每類圖像中隨機(jī)取100幅圖像作為訓(xùn)練樣本,其余為測試樣本。檢索系統(tǒng)結(jié)果如圖2所示。
圖2 檢索系統(tǒng)檢索結(jié)果
其中,查詢圖像即待檢索圖像,圖2中圖像與查詢圖像相似度按從大到小排列的檢索結(jié)果。
為驗(yàn)證本文算法的有效性,對山脊、水體和村落三類遙感圖像分別隨機(jī)選取10次進(jìn)行測試,查準(zhǔn)率取10次測試的均值。其中,一次遙感圖像檢索結(jié)果如圖2所示。采用查準(zhǔn)率和查全率對本文方法檢索性能評估,其查準(zhǔn)率可達(dá)到94%,查全率可達(dá)到88%。各類別圖像查準(zhǔn)率如表6所示,查全率如表7所示。
表6 本文方法各類圖像查準(zhǔn)率 %
表7 本文方法各類圖像查全率 %
表6為本文方法下的各類圖像查準(zhǔn)率。將各類圖像綜合起來,本文算法的總查準(zhǔn)率為92%。由此可見,本文方法的檢索準(zhǔn)確率很高。
表7為本文方法下的各類圖像查全率。將各類圖像綜合起來,本文算法的總查全率為88%。由此可見,本文方法達(dá)到很好的識別效果。
為了驗(yàn)證本文方法在檢索效率上的性能是否有所提升,對傳統(tǒng)順序檢索方法和本文方法所搭建的系統(tǒng)各進(jìn)行20次實(shí)驗(yàn)。使用傳統(tǒng)方法遙感圖像檢索的時間均值為0.28 s;使用本文方法遙感圖像檢索的時間均值為0.07 s。實(shí)驗(yàn)結(jié)果表明:與順序檢索相比,利用分類決策的檢索技術(shù)能夠大大提高檢索效率。本文算法與深度學(xué)習(xí)的半監(jiān)督遙感圖像檢索方法[14]得到的實(shí)驗(yàn)結(jié)果進(jìn)行對比,本文方法檢索時間為0.07 s,而深度學(xué)習(xí)半監(jiān)督方法檢索時間為1.88 s,本文算法在檢索效率上有很大提高。此外,由于深度學(xué)習(xí)中神經(jīng)網(wǎng)絡(luò)需要對數(shù)據(jù)進(jìn)行訓(xùn)練,比本文的分類方法消耗更長時間。在對特征進(jìn)行降維時,文獻(xiàn)[11]采用主成分分析法方法,這需要對所有圖像特征數(shù)據(jù)計(jì)算協(xié)方差矩陣、協(xié)方差矩陣的特征值和特征向量、比較特征值大小等,計(jì)算復(fù)雜度高于本文算法。
基于有效值分類檢索的方法,對GF-1遙感圖像中的不同類別圖像的3種圖像特征的計(jì)算,表明Hu矩具有識別圖像能力的特征,將其應(yīng)用到遙感圖像分類檢索模型中進(jìn)行實(shí)驗(yàn)。并證明了本文提出的方法用于遙感圖像的檢索和分類能夠成功的將不同類別的圖像區(qū)分開,對不同類別圖像的檢索識別結(jié)果達(dá)到較高的正確率。相比神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)算法,本文提出方法簡便,不需要神經(jīng)網(wǎng)絡(luò)的多次訓(xùn)練,因此檢索效率高,其檢索速度在毫秒量級。該方法對我國GF-1的其他圖像的山脊、水體、村落的分布和面積測量等地理勘測領(lǐng)域以及目標(biāo)檢索識別和定位具有參考價值,也為目標(biāo)識別的進(jìn)一步分析提供重要依據(jù)。