楊志剛,沈盛彧,張平倉,張 彤,吳華意
(1.廣東省國土資源測繪院,廣東 廣州 515000;2.長江科學院 水土保持研究所,湖北 武漢 430010;3.武漢大學 測繪遙感信息工程國家重點實驗室,湖北 武漢 430079)
基于主題模型的高分影像人工地物在線檢索
楊志剛1,沈盛彧2,張平倉2,張 彤3,吳華意3
(1.廣東省國土資源測繪院,廣東 廣州 515000;2.長江科學院 水土保持研究所,湖北 武漢 430010;3.武漢大學 測繪遙感信息工程國家重點實驗室,湖北 武漢 430079)
傳統(tǒng)遙感影像檢索系統(tǒng)主要是基于遙感影像的元數(shù)據(jù)、底層視覺特征或語義標注來實現(xiàn)檢索功能,面對海量的高分辨率遙感影像時,會因為計算量大或人力標注工作量大而無法兼顧時效性和準確性。提出了基于高性能云計算的海量高分辨率遙感影像的存儲組織、底層視覺特征提取和基于主題模型的遙感影像及人工地物檢索總體框架,并進一步實現(xiàn)了原型系統(tǒng),為高分辨率遙感影像中人工地物在線檢索研究進行了有益嘗試。
高分辨率遙感影像;高性能云計算;主題模型;滑動窗口
分析遙感數(shù)據(jù)的特點和遙感數(shù)據(jù)的應用現(xiàn)狀,可以總結(jié)出遙感數(shù)據(jù)利用率低下的2個重要原因:①對海量遙感數(shù)據(jù)的信息提取不足;②對海量遙感數(shù)據(jù)的檢索能力不足。雖然研究者們也一直嘗試從各種角度為海量遙感影像的處理、管理與檢索提出獨到的解決方案[1-7],但這些傳統(tǒng)遙感影像檢索系統(tǒng)[8,9]主要是基于遙感影像的元數(shù)據(jù)、底層視覺特征或語義標注來實現(xiàn)檢索功能,面對海量的高分辨率遙感影像時,會因為計算量大或人力標注工作量大而影響結(jié)果。
本文借鑒信息檢索和計算機視覺理論與技術(shù),提出了基于高性能云計算的海量高分辨率遙感影像的存儲組織、底層視覺特征提取和基于主題模型的遙感影像及人工地物檢索總體框架,進一步實現(xiàn)了原型系統(tǒng),為高分辨率遙感影像庫中人工地物在線檢索研究進行了有益嘗試。
為了實現(xiàn)高分辨率遙感影像庫中人工地物在線檢索,本文設計了一種高分辨率遙感影像人工地物檢索框架。本框架主要由高性能云計算平臺和B/S客戶端2個部分組成,如圖1所示。高性能計算平臺主要負責海量高分辨率遙感影像的存儲、底層視覺特征的提取及基于主題模型檢索庫的組織與存儲。B/S客戶端負責提供友好的用戶交互界面,方便用戶進行高分辨率遙感影像中人工地物的檢索操作。其中基于高性能云計算的海量遙感影像處理與主題模型應用是重點。
圖1 高分辨率遙感影像庫中人工地物在線檢索框架
圖2 海量遙感影像處理流程
高性能云計算平臺中的海量遙感影像處理流程如圖2所示。通過使用文獻[10]提出的基于MapReduce框架的預處理方法,海量高分辨率遙感影像集合以規(guī)則網(wǎng)格方式切分后被高效并行地合并成小影像集大文件,再保存在分布式文件數(shù)據(jù)庫中。本平臺以此小影像集大文件為原始數(shù)據(jù),采用文獻[11]所提出的高效并行的高分辨率遙感影像底層視覺特征提取方法對所有小影像進行底層視覺特征提取,生成海量底層視覺特征庫。再通過對海量底層視覺特征進行聚類分析,生成有限數(shù)量的可描述海量小影像的視覺詞項,然后采用Bag of Visual Words模型將所有小影像分別表示為視覺詞項的序列,由此得到海量高分辨率遙感影像集合的視覺詞項——小影像共現(xiàn)矩陣,作為高分辨率遙感影像中人工地物的檢索基礎[10,11]。
本檢索采用的是先粗略后具體的方式。檢索中,先通過建立的主題模型檢索出包含指定人工地物的遙感影像候選集,再通過滑動窗口識別出目標人工地物,獲得檢索最終結(jié)果。
3.1 基于主題模型的遙感影像檢索
遙感影像檢索的數(shù)據(jù)基礎是檢索模型,或稱檢索庫?;谥黝}模型的高分辨率遙感影像檢索模型是根據(jù)海量高分辨率遙感影像集合的視覺詞項——小影像共現(xiàn)矩陣進行主題模型訓練生成,檢索流程如圖3所示。其中預處理部分已在前一節(jié)基于高性能云計算完成;主題分析則采用主題模型對預處理后的遙感影像集進行潛在語義分析,建立概率檢索模型;最后,根據(jù)視覺詞—遙感影像之間的潛在語義聯(lián)系,對用戶需要檢索的圖像進行相似性計算,實現(xiàn)高分辨率遙感影像檢索結(jié)果排序與顯示。詳細內(nèi)容請參見文獻[12]。
圖3 基于主題模型的高分辨率遙感影像檢索流程
3.2 基于滑動窗口的人工地物識別
前一節(jié)的高分辨率遙感影像檢索已經(jīng)獲得了與查詢遙感影像具有相似主題的遙感影像集。由于相似性,這些遙感影像中也包括了與查詢遙感影像相似的人工地物。直接基于原始像素進行滑動窗口的人工地物識別,其計算成本很高,可能導致無識別結(jié)果。為了解決模糊性識別,同時還要適當降低計算量以提高在線處理效率,采用降采樣的遙感影像和梯度約束來進行人工地物識別,基本處理流程如圖4所示。
圖4 基于滑動窗口的人工地物識別基本流程
1)降采樣:通過設定尺度系數(shù),對人工地物影像和目標遙感影像同時進行降采樣。
2)差異指數(shù)計算:從降采樣的目標遙感影像的左上角開始,將人工地物樣本降采樣窗口進行“Z”字型滑動,每次移動一個超像素來遍歷全圖。同時,計算每次移動時窗口與目標遙感影像局部的像素灰度差值,并求和平均到每個像素就得到該區(qū)域的差異指數(shù),最終可以獲得整幅圖的差異指數(shù)矩陣。
3)梯度約束選取:對獲得的差異指數(shù)矩陣進行極小值計算,并將此極小值一定二維鄰域內(nèi)的其他差異指數(shù)排除極小值候選區(qū)。根據(jù)差異指數(shù)閾值和差異指數(shù)比例系數(shù),循環(huán)此過程,即可得出相似人工地物的候選區(qū)。因為僅用極小值來選擇準確性較低,所以本文還采用了梯度統(tǒng)計的方法進行約束。通過將候選區(qū)在X、Y 兩個方向上梯度數(shù)量的比值與人工地物樣本進行比較,對不符合要求的候選區(qū)進行排除。
4)人工地物標識:根據(jù)最終各個候選區(qū)域的坐標范圍,將識別出的人工地物以矩形框的形式在原始遙感影像上標識出來。
4.1 平臺環(huán)境
虛擬集群:在4臺物理機器上每臺虛擬出4臺機器,組成共16個節(jié)點的Hadoop集群。其中包括1臺Master和15臺Slave,HDFS系統(tǒng)數(shù)據(jù)備份設置為3,MapReduce內(nèi)存設置為2 046 MB,每臺虛擬機可支持2個Map操作。
本原型系統(tǒng)中提取的海量高分辨率遙感影像底層視覺特征為MSER和Harris-Affine特征區(qū)域,使用SIFT128維特征向量描述。
4.2 系統(tǒng)功能
本原型系統(tǒng)的B/S客戶端由Web服務器發(fā)布,后臺數(shù)據(jù)來自于高性能云計算提供的基于Latent Dirichlet Allocation(LDA)的檢索模型和海量高分辨率遙感影像庫,前臺通過Internet為用戶提供高分辨率遙感影像的主題瀏覽、影像檢索、地物檢索和詳細定位等操作,如圖5所示。
本客戶端首先將基于LDA的檢索模型中代表訓練出的各主題的典型小影像展現(xiàn)在用戶面前,然后由用戶根據(jù)自己的興趣任意點擊選擇小影像,進行基于概率主題模型的遙感影像檢索,獲得與小影像相似的檢索排序結(jié)果。因為小影像中包含有主題特征的人工地物對象,所以用戶可以根據(jù)已檢索的結(jié)果,拉框選擇自己感興趣的人工地物,本系統(tǒng)會進一步將已查詢出的遙感影像中的人工地物檢索并標識出來。
根據(jù)遙感影像或人工地物所在的遙感影像檢索結(jié)果的元數(shù)據(jù)(如文件名、經(jīng)度和緯度等),本系統(tǒng)還可以提供展示其原始大幅面高分辨率遙感影像和其元信息的功能和根據(jù)經(jīng)緯度在網(wǎng)絡地圖控件中進行地理標識的功能。
圖5 B/S客戶端功能結(jié)構(gòu)圖
4.3 原型系統(tǒng)界面
對應于本原型系統(tǒng)的4項功能,B/S客戶端的主要功能界面如圖6~9所示。
圖6 客戶端的檢索初始界面
圖7 遙感影像檢索效果
圖8 人工地物檢索效果
圖9 遙感影像定位查看效果
本文總結(jié)了遙感數(shù)據(jù)利用率低下的主要原因,通過借鑒信息檢索和計算機視覺理論與技術(shù),提出了利用高性能云計算對海量高分辨率遙感影像進行存儲組織和底層視覺特征提取,再運用主題模型分析遙感影像建立檢索模型,基于滑動窗口實現(xiàn)人工地物的檢索。相對傳統(tǒng)方法,本方法應對高分辨率遙感影像海量性的能力有所提高,并能在一定程度上兼顧遙感影像處理和檢索的時效性、準確性,探索了一條高分辨率遙感影像庫中人工地物在線檢索研究的新思路。但本原型系統(tǒng)所處理的數(shù)據(jù)量不到100 G,圖幅數(shù)量也未超過100萬幅,還未能充分實現(xiàn)海量數(shù)據(jù)量級,下一步研究將結(jié)合更多信息處理、數(shù)據(jù)挖掘等技術(shù)和更大數(shù)據(jù)量級展開。
[1] 朱先強. 融合視覺顯著特征的遙感圖像檢索研究[D]. 武漢:武漢大學, 2011
[2] 李小文. 定量遙感的發(fā)展與創(chuàng)新[J]. 河南大學學報:自然科學版, 2005, 35(4): 49-56
[3] Datcu M, Seidel K, Walessa M. Spatial Information Retrieval from Remote Sensing Images Part I: Information Theoretical Perspective [J]. IEEE Transactions on Geoscience and Remote Sensing, 1998, 36(5):1 431-1 445
[4] Sheikholeslami G, Zhang A D, Bian L. A Multi-resolution Content-based Retrieval Approach for Geographic Images [J].Geoinformatica, 1999, 3(2):109-139
[5] 程起敏. 基于內(nèi)容的遙感影像庫檢索關(guān)鍵技術(shù)研究[D]. 北京:中國科學院遙感應用研究所, 2004
[6] 寧曉剛. 基于內(nèi)容遙感圖像檢索的數(shù)據(jù)組織、特征提取和索引機制[D]. 武漢: 武漢大學, 2006
[7] 張男. 基于內(nèi)容的光學遙感圖像檢索關(guān)鍵技術(shù)研究[D]. 長沙:國防科學技術(shù)大學, 2008
[8] Shyu C R, Klaric M, Scott G J, et al. GeoIRIS: GeospatialInformation Retrieval and Indexing System-Content Mining, Semantics Modeling, and Complex Queries [J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(4):839-852
[9] Molinier M, Laaksonen J, Hame T. Detecting Man-made Structures and Changes in Satellite Imagery With a Contentbased Information Retrieval System Built on Self-organizing Maps [J]. IEEE Transactions on Geoscience and Remote Sensing, 2007,45(4):861-874
[10] 沈盛彧, 劉哲, 張平倉, 等. 一種適用于云計算可擴展高分辨率遙感影像存儲組織結(jié)構(gòu)[J].長江科學院院報,2014, 31(12):107-112
[11] 沈盛彧, 劉哲, 張平倉, 等. 基于MapReduce的高分辨率遙感影像特征提取方法[J]. 長江科學院院報,2014,31(2) :91-96
[12] 沈盛彧, 劉哲, 張平倉, 等. 一種基于LDA的高分辨率遙感影像檢索方法[J].長江科學院院報,2014,31(8) :98-102
P237.3
B
1672-4623(2015)04-0052-03
10.3969/j.issn.1672-4623.2015.04.019
楊志剛,工程師,主要從事遙感影像處理及應用工作。
2015-03-03。
項目來源:國家自然科學基金資助項目(41271400);國家重點基礎研究發(fā)展計劃資助項目(2012CB719906);中央級公益性科研院所基本科研業(yè)務費資助項目(CKSF2014024/TB)。