葉 勤,陳宏敏,張紹明
(同濟(jì)大學(xué)測(cè)繪與地理信息學(xué)院,上海200092)
基于Sketch Token的異源雷達(dá)影像匹配適應(yīng)性分析
葉 勤,陳宏敏,張紹明
(同濟(jì)大學(xué)測(cè)繪與地理信息學(xué)院,上海200092)
將異源影像間的共性信息提取與描述作為研究重點(diǎn),提出了一種基于Sketch Token中層特征的異源影像適配性評(píng)估方法.該算法利用監(jiān)督學(xué)習(xí)策略獲取異源雷達(dá)影像之間共性特征的先驗(yàn)知識(shí),據(jù)此訓(xùn)練Sketch Token特征分類器,并將其作為影像間共性特征的描述子對(duì)基準(zhǔn)圖進(jìn)行特征提取.利用提取結(jié)果的各項(xiàng)統(tǒng)計(jì)量訓(xùn)練支持向量機(jī)分類器,并以此評(píng)估異源影像對(duì)中基準(zhǔn)圖的適配性.利用星載SAR(synthetic aperture radar)影像作為基準(zhǔn)圖、機(jī)載實(shí)孔徑雷達(dá)影像作為實(shí)時(shí)圖進(jìn)行適配性評(píng)估試驗(yàn),試驗(yàn)結(jié)果表明了該算法的有效性.
異源影像;Sketch Token;中層特征;共性信息;適配性分析
景象匹配適配性技術(shù)是指按照特定準(zhǔn)則在飛行航跡上選取特征信息量大、信息穩(wěn)定、可匹配性高、大小滿足要求的景象區(qū)域作為匹配區(qū)的技術(shù)[1].匹配區(qū)的自動(dòng)選擇目前已發(fā)展成精確匹配導(dǎo)航定位中的獨(dú)立關(guān)鍵技術(shù)[2].隨著成像傳感器和遙感技術(shù)的發(fā)展,景象匹配適配性分析的對(duì)象已從早期的純光學(xué)影像發(fā)展到現(xiàn)在的紅外圖像、雷達(dá)圖像等多源圖像.特別是合成孔徑雷達(dá)(synthetic aperture radar,SAR)技術(shù)的出現(xiàn),因其具有全天候、穿透能力強(qiáng)以及空間分辨率與波長(zhǎng)、載機(jī)飛行高度和雷達(dá)作用距離無(wú)關(guān)等優(yōu)點(diǎn)[3],在飛行器導(dǎo)航定位中得到極大重視,SAR景象匹配適配性分析技術(shù)也成為飛行器末制導(dǎo)領(lǐng)域中的研究熱點(diǎn).但是因?yàn)镾AR特殊的成像機(jī)理,SAR影像通常伴隨著嚴(yán)重的相干斑噪聲,信噪比較低.并且在以星載SAR影像為參考圖、低空機(jī)載實(shí)孔徑雷達(dá)為實(shí)時(shí)圖的景象匹配輔助導(dǎo)航系統(tǒng)中,參考圖與實(shí)時(shí)圖獲取時(shí)的成像條件、時(shí)間以及所采用的極化方式都有較大差異,且由于成像條件限制,低空機(jī)載實(shí)時(shí)圖成像質(zhì)量很差(斑點(diǎn)噪聲極多且畸變大),這導(dǎo)致同一地物在2類雷達(dá)影像上的響應(yīng)存在著巨大差異,直接影響景象匹配導(dǎo)航定位的性能.對(duì)異源雷達(dá)影像間的匹配適應(yīng)性進(jìn)行研究、提高景象匹配制導(dǎo)的精度與可靠性是匹配導(dǎo)航定位中的難點(diǎn),但目前對(duì)異源雷達(dá)影像適配性研究的公開(kāi)文獻(xiàn)報(bào)道非常稀少.而異源雷達(dá)影像適配性研究中,異源雷達(dá)影像間的共性特征信號(hào)提取及其與非共性特征和噪聲信號(hào)的有效區(qū)分是適配性分析的基礎(chǔ),也是異源雷達(dá)影像適配性評(píng)估技術(shù)中的最大難點(diǎn).
目前,景象匹配的適配性研究大致可以分為兩大類[4]:①直接基于圖像信號(hào)相關(guān)計(jì)算的景象區(qū)域適配性研究;②基于綜合特征量的景象區(qū)域適配性研究.前者是將匹配問(wèn)題看作某個(gè)信號(hào)序列在其對(duì)應(yīng)的變形信號(hào)序列中的定位問(wèn)題.在對(duì)變形信號(hào)(實(shí)時(shí)圖)參數(shù)進(jìn)行適當(dāng)估計(jì)后,利用兩信號(hào)的相關(guān)度來(lái)度量影像之間的適配性.例如,文獻(xiàn)[5]提出了將二維影像按行或列掃描轉(zhuǎn)換成一維像素序列后,以傳統(tǒng)的一維信號(hào)歸一化互相關(guān)指標(biāo)作為基礎(chǔ)建立了匹配概率估計(jì)模型.文獻(xiàn)[6]則以理想相關(guān)函數(shù)是白噪聲為假設(shè),提出了最小相關(guān)長(zhǎng)度準(zhǔn)則來(lái)評(píng)估匹配區(qū)的適配性.基于綜合特征量的景象區(qū)域適配性研究則是對(duì)原始參考圖像區(qū)域進(jìn)行綜合描述,建立綜合特征量與景象區(qū)域適配性指標(biāo)間的關(guān)系.基于綜合特征量的景象匹配適配性方法適用性較廣,是目前景象匹配適配性研究的主流.此外,也有學(xué)者同時(shí)考慮圖像信號(hào)的相關(guān)性與綜合特征量,并嘗試采用機(jī)器學(xué)習(xí)方法解決問(wèn)題.如文獻(xiàn)[7]提出了基于特征的豐富性、穩(wěn)定性和唯一性三層次的匹配區(qū)選擇策略.而文獻(xiàn)[8]則引入了支持向量機(jī)(support vector machine,SVM),通過(guò)統(tǒng)計(jì)圖像的灰度和特征測(cè)度參數(shù)來(lái)訓(xùn)練適配性估計(jì)模型.但上述方法的研究對(duì)象主要集中于異源光學(xué)影像、光學(xué)影像與SAR影像以及光學(xué)影像與紅外影像之間,對(duì)異源雷達(dá)影像間的適配性評(píng)估效果非常不理想.究其根源,是無(wú)法有效提取出異源雷達(dá)影像之間的共性特征.
為了解決這一難點(diǎn),本文借鑒了計(jì)算機(jī)視覺(jué)領(lǐng)域中近年來(lái)才提出的概念——中層特征,通過(guò)引入Sketch Token[9]算法來(lái)描述、提取異源雷達(dá)影像間的共性特征,利用這些共性特征與SVM方法訓(xùn)練了一種新的適配性評(píng)估模型.將搭載了真實(shí)孔徑雷達(dá)的飛機(jī)在高速俯沖狀態(tài)下獲取的影像作為實(shí)時(shí)圖,TerraSAR X波段影像作為參考圖.最終通過(guò)對(duì)2 401對(duì)匹配像對(duì)進(jìn)行試驗(yàn)分析驗(yàn)證本文所提方法的有效性.
1.1 異源雷達(dá)影像間的共性特征
在異源雷達(dá)影像匹配中,獲取不同類型雷達(dá)影像之間的共性特征是匹配成功的關(guān)鍵.所謂共性特征是指同一地物或地貌在2種不同類型的影像中均有出現(xiàn)并且形態(tài)相同或相近的特征.具體在異源雷達(dá)影像匹配上,異源雷達(dá)影像之間的共性特征通常以低亮度聚集區(qū)域的形式出現(xiàn),其中以線、面特征較為典型.因此,異源雷達(dá)影像的適配性問(wèn)題可以簡(jiǎn)化為影像區(qū)域中共性特征的評(píng)價(jià)問(wèn)題.而一種良好的特征評(píng)價(jià)方法需要滿足以下3項(xiàng)指標(biāo):①能夠反映景象信息的豐富程度;②能夠反映景象中穩(wěn)定的共性特征;③能夠反映景象中地物的唯一性.
但是獲取參考圖與實(shí)時(shí)圖中均存在的線、面特征難度很大,因?yàn)橥坏匚镌诓煌愋陀跋裰械捻憫?yīng)不同,其主要受到以下3類因素的影響:①自然條件,如雨、雪、晴等;②傳感器的成像方式,如波段、成像角、原始分辨率、極化方式、成像機(jī)制(實(shí)孔徑、合成孔徑)等;③地表信息,如紋理、高程、本地入射角、介電常數(shù)、微波反射率、透射率、吸收率等.考慮到異源雷達(dá)影像在成像原理、成像條件上的諸多差異,在機(jī)載實(shí)孔徑雷達(dá)影像上呈現(xiàn)的特征未必也在SAR影像中呈現(xiàn).而普通的邊緣提取、點(diǎn)提取及分割方法只關(guān)注于圖像本身,并沒(méi)有考慮到異源雷達(dá)影像間的共性關(guān)系,因此無(wú)法有效提取出異源雷達(dá)影像之間的共性特征.
1.2 Sketch Token算法概述及Sketch Token類的定義
在圖像處理領(lǐng)域中,通常將SIFT(Scaleinvariant feature transform)[10],SURF(Speed-up robust features)[11],HOG(histogram of oriented gradient)[12]等直接基于圖像梯度統(tǒng)計(jì)量的像素級(jí)特征稱為底層特征,而將目標(biāo)級(jí)或場(chǎng)景級(jí)的特征稱為高級(jí)特征.由于單一的底層特征難以描述低信噪比異源影像之間的共性特征,而高級(jí)特征又難以獲得.故在2012年ECCV(European Conference on Computer Vision)的會(huì)議上卡內(nèi)基梅隆大學(xué)的Saurabh Singh等[13]首次提出了中層特征的想法.中層特征是一種介于底層特征和高級(jí)特征之間的特征結(jié)構(gòu),其描述的局部區(qū)域包含更加豐富的信息,至少是目標(biāo)部件級(jí)別的,而不是沒(méi)有任何語(yǔ)義信息的局部描述.Joseph J.Lim等在2013年的CVPR(IEEE Conference on Computer Vision and Pattern Recognition)會(huì)議上則提出了Sketch Token特征提取算法,并以此來(lái)描述局部影像區(qū)域中的直線、T型結(jié)構(gòu)、Y型結(jié)構(gòu)、角點(diǎn)、曲線及平行線等邊緣特征.算法提出者將以上結(jié)構(gòu)定義為中層特征,通過(guò)試驗(yàn)發(fā)現(xiàn)影像中的所有目標(biāo)都可通過(guò)上述結(jié)構(gòu)的特定組合來(lái)表達(dá),并將上述中層特征命名為Sketch Token類.
該算法應(yīng)用于異源雷達(dá)影像的共性特征提取時(shí),可以分為以下5個(gè)步驟:
(1)利用人對(duì)異源雷達(dá)影像間共性特征的認(rèn)識(shí),勾勒出影像集St對(duì)應(yīng)的特征圖集FS.
(2)將圖集FS中的所有影像分解為35×35(像素)大小的影像塊,并將中心區(qū)域存在特征像素的影像塊篩選出來(lái)命名為數(shù)據(jù)集EFS.
(3)利用Daisy算法處理數(shù)據(jù)集EFS中的所有影像,并使用K-means算法基于EFS中每張影像的Daisy描述量對(duì)EFS中的影像進(jìn)行聚類.其聚類數(shù)默認(rèn)為150類[9],每一類影像代表著一類中層特征結(jié)構(gòu),也即是上文所提到的T型、Y型、平行線等結(jié)構(gòu).最終將這150類中層特征結(jié)構(gòu)的集合命名為Sketch Token類.
(4)獲取EFS影像集中每張影像對(duì)應(yīng)的原始影像SEFS.將2類底層特征描述量即梯度統(tǒng)計(jì)量和自相關(guān)紋理統(tǒng)計(jì)量作為SEFS中影像的特征描述向量VF.
(5)以VF作為特征向量,Sketch Token類別作為標(biāo)簽,隨機(jī)森林算法作為分類器,訓(xùn)練一個(gè)特征分類模型M.當(dāng)輸入一張新影像SN時(shí),利用已經(jīng)訓(xùn)練好的特征分類器M對(duì)SN中的所有像素點(diǎn)進(jìn)行分類,當(dāng)所有像素點(diǎn)都分類完畢時(shí),也即完成了Sketch Token算法對(duì)SN的特征提取.
本文將Sketch Token算法與Canny,Sobel,Harris算法作對(duì)比,將同一地區(qū)不同時(shí)相下的SAR影像(圖1a)和RAR(real aperture radar)影像(圖1b)作為數(shù)據(jù)進(jìn)行試驗(yàn).試驗(yàn)結(jié)果如圖1所示.該試驗(yàn)的目的是力求將SAR影像和RAR影像中的暗區(qū)域輪廓提取出來(lái),而盡可能地抑制其他因異源雷達(dá)成像差異和噪聲信號(hào)形成的偽共性特征.從圖1c和1d中所展示的Sketch Token特征提取結(jié)果可以看到原圖像中的暗區(qū)域輪廓清晰可見(jiàn).從而其他偽特征都被較好地抑制了.相比之下,圖1e至1j的提取結(jié)果表明,Canny,Sobel,Harris算法將大量的噪聲與非共性特征也視為有效特征一并提取.該試驗(yàn)結(jié)果表明,Sketch Token算法相較于其他算法而言可以更好地將異源雷達(dá)影像間的共性特征與其他非共性特征和背景噪聲相區(qū)分.
圖1 多種特征提取算法性能對(duì)比Fig.1 Efficiency comparison of various feature extraction algorithms
2.1 獲取異源影像間共性信息的先驗(yàn)知識(shí)
由于人工目視判別依然是目前最為可靠的特征識(shí)別方法,因此本文采用該方法來(lái)獲取異源影像中共性特征的先驗(yàn)知識(shí).目視判別的具體標(biāo)準(zhǔn)因影像種類的不同而異,但總體上都是將異源雷達(dá)影像之間相同或相似的特征作為共性特征.由于本文以SAR和實(shí)孔徑雷達(dá)影像為例,故目視判別的具體策略需結(jié)合SAR影像和實(shí)孔徑雷達(dá)影像的特性制定.
SAR因其特殊的成像機(jī)制,影像中的許多特征會(huì)被大量的相干斑噪聲所淹沒(méi),點(diǎn)特征與其他特征相比受到的影響更為嚴(yán)重.同時(shí)受到SAR角反射效應(yīng)的影響,SAR影像往往會(huì)在樓房、橋梁等一些地物邊緣形成高亮的線特征.雖然這些特征看似非常明顯,但是并不能反映真實(shí)地物邊緣.這些偽特征的存在也會(huì)對(duì)匹配結(jié)果造成不良的影響.考慮到雷達(dá)成像的特性,相對(duì)而言線、面特征比較穩(wěn)定,特別是參考圖中的暗線、暗面.故本文主要將線、面特征作為特征評(píng)價(jià)的主要對(duì)象,并將參考圖中存在的“暗線”或“暗面”作為穩(wěn)定的共性特征.依據(jù)以上分析,采用手工描繪的方式獲取與SAR影像(參考圖)相對(duì)應(yīng)的特征圖像,如圖2所示.手工繪制的對(duì)象主要是針對(duì)參考集中有限數(shù)目影像,當(dāng)輸入一張新圖像時(shí)并不需要重復(fù)上述過(guò)程.
圖2 參考圖及對(duì)應(yīng)手繪特征圖Fig.2 Reference map and the corresponding hand-drawn feature map
2.2 構(gòu)造Sketch Token類
設(shè)參考圖的訓(xùn)練圖集為ST,利用2.1節(jié)中介紹的方法勾勒出ST對(duì)應(yīng)的特征圖集FS.將FS中的所有影像分解成35×35(像素)大小的影像塊,并從中篩選出中心像素點(diǎn)為特征像素的影像塊組成特征影像集EFS.如圖3a所示的影像塊中心像素點(diǎn)為特征像素點(diǎn),故這些區(qū)域應(yīng)予以保留;圖3b中所展示的影像區(qū)域中心像素點(diǎn)并不是特征像素,應(yīng)予以剔除.影像塊的分割和篩選工作均可直接利用計(jì)算機(jī)批處理完成.圖3展示了部分分割及篩選后的結(jié)果.
獲得影像集EFS之后,使用Daisy算法[14]對(duì)影像集中的所有影像逐一進(jìn)行處理.之后利用K- means算法基于每張影像的Daisy描述量來(lái)對(duì)EFS中的影像聚類,并將聚類結(jié)果命名為Sketch Token類.Sketch Token類中的每一類對(duì)應(yīng)著一種中層特征結(jié)構(gòu).該算法的提出者[9]通過(guò)大量試驗(yàn),指出當(dāng)把聚類數(shù)設(shè)置為150時(shí),影像中的所有目標(biāo)都可以利用這150類中層特征結(jié)構(gòu)的特定組合描述,故研究中依然沿用K=150這一經(jīng)驗(yàn)值.
圖3 影像區(qū)塊選取示例Fig.3 Image block selection sample
2.3 構(gòu)造Sketch Token類的特征描述向量
為了能夠使一張待評(píng)估SAR影像中全部的像素點(diǎn)與Sketch Token類中的每一類及背景類一一對(duì)應(yīng),以SAR影像中每個(gè)像素點(diǎn)為中心(影像邊緣區(qū)域除外),開(kāi)辟35×35(像素)大小的窗口,并分別計(jì)算窗口內(nèi)所有像素在不同尺度下的梯度方向、梯度模值[10,12,15]及整個(gè)窗口的自相關(guān)性[16].并將上述統(tǒng)計(jì)量組成特征向量.
為了獲得不同尺度下影像塊的梯度信息,分別用方差為0,1.5和5.0個(gè)像素單位的高斯濾波器平滑圖像.在3種平滑程度不同的影像上,分別計(jì)算影像上所有像素點(diǎn)的梯度模值,獲得3個(gè)位于不同尺度上的影像梯度圖T0,T1.5,T5.0.并針對(duì)T0和T1.5這2種影像在0°,45°,90°,135°這4個(gè)方向上計(jì)算梯向圖 A0-0,A0-45,A0-90,A0-135,A1.5-0,A1.5-45,A1.5-90,A1.5-135.最后再利用方差為1個(gè)像素單位的高斯濾波器對(duì)T0,T1.5,T5.0,A0-0,A0-45,A0-90,A0-135,A1.5-0,A1.5-45,A1.5-90,A1.5-135共11張圖像進(jìn)行濾波處理.由于每張影像都是35×35(像素)大小,故原始SAR影像中的每個(gè)像素點(diǎn)的特征向量中梯度信息的描述量共有11×35×35=13 475個(gè).
影像中的特征并不僅存在于影像梯度值大的區(qū)域,同時(shí)也會(huì)分布在紋理邊界上.自相關(guān)特征能夠有效地描述影像中的相似紋理[16].定義一個(gè)m×m大小的矩陣M,并將M陣填滿影像塊.對(duì)于35×35大小的影像塊來(lái)說(shuō),可以取m為5或7.當(dāng)m=5時(shí),一個(gè)影像塊中共存在著7×7=49個(gè)互相鄰接的M矩陣.設(shè)每個(gè)特征通道的標(biāo)號(hào)為k,則在第k個(gè)特征通道上,將每個(gè)M矩陣中行列號(hào)相同的格網(wǎng)點(diǎn)特征值之和記為sjk或sik.則自相關(guān)特征可被定義為fijk.
因?yàn)閒ijk=-fjik且fiik=0,所以每個(gè)特征通道上的統(tǒng)計(jì)量數(shù)目相當(dāng)于從m×m個(gè)格網(wǎng)點(diǎn)中隨機(jī)無(wú)序抽取2個(gè)點(diǎn)的方法數(shù),也即為時(shí),每個(gè)特征通道上的統(tǒng)計(jì)量總數(shù)即為300.對(duì)上述所有特征通道均進(jìn)行自相關(guān)性計(jì)算,則一共可獲得300×11=3 300個(gè)自相關(guān)性統(tǒng)計(jì)量.綜合以上所有統(tǒng)計(jì)量,可以構(gòu)造出一個(gè)維數(shù)高達(dá)3 300+13 475=16 775維的特征向量.該特征向量即是后續(xù)應(yīng)用于適配性分析的基于Sketch Token類別的特征向量.
3.1 隨機(jī)森林算法的訓(xùn)練及預(yù)測(cè)
當(dāng)輸入一張影像時(shí),需要利用訓(xùn)練好的分類模型對(duì)影像中所有的像素點(diǎn)進(jìn)行分類,也即將每一個(gè)像素點(diǎn)都賦予一個(gè)類別標(biāo)簽.這個(gè)標(biāo)簽可以是150種特征中的某一類,也可以是背景類.這就要求特征分類器能夠區(qū)分多種類別,同時(shí)可以快速運(yùn)行.而隨機(jī)森林算法剛好符合以上2個(gè)條件.
隨機(jī)森林[17]指的是利用多棵決策樹(shù)對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)的一種分類器.隨機(jī)森林是由多棵CART(classification and regression tree)構(gòu)成.其最終輸出的結(jié)果由各棵CART結(jié)果綜合決定.每棵樹(shù)使用的訓(xùn)練集是從總的訓(xùn)練集中有放回抽樣獲取的,使用的特征是從特征空間中按一定比例隨機(jī)無(wú)放回抽樣獲取的.本文從每種特征類別中隨機(jī)抽選1 000個(gè),共150 000個(gè)影像塊,從參考圖的訓(xùn)練集中隨機(jī)選取16 000個(gè)背景類區(qū)塊作為訓(xùn)練數(shù)據(jù).利用2.2節(jié)介紹的方法計(jì)算每個(gè)區(qū)塊的梯度和自相關(guān)紋理統(tǒng)計(jì)量作為每張影像的特征向量,將其對(duì)應(yīng)的Sketch Token類作為類標(biāo)簽用以訓(xùn)練隨機(jī)森林,訓(xùn)練步驟如下:
(1)給定訓(xùn)練集S,特征維數(shù)16 775維.確定參數(shù):訓(xùn)練25棵CART,每棵樹(shù)的深度設(shè)定為20.確定終止條件:所有CART的每棵葉節(jié)點(diǎn)所擁有的類別數(shù)小于等于5.
(2)從S中有放回地抽取大小和S一樣的訓(xùn)練集S(i),作為根節(jié)點(diǎn)的樣本,從根節(jié)點(diǎn)開(kāi)始訓(xùn)練.
(3)如果當(dāng)前節(jié)點(diǎn)達(dá)到終止條件,則設(shè)置當(dāng)前節(jié)點(diǎn)為葉節(jié)點(diǎn).該節(jié)點(diǎn)的預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集合中數(shù)量最多的一類.否則從16 775維特征中無(wú)放回隨機(jī)選取671維特征.在671維特征中選取信息增益比最高的一維特征k及其閾值Th,并將當(dāng)前樣本第k維特征小于Th的樣本劃分到左節(jié)點(diǎn),其余部分劃分到右節(jié)點(diǎn).繼續(xù)訓(xùn)練其他節(jié)點(diǎn).
(4)重復(fù)步驟(2)和(3)到所有節(jié)點(diǎn)都訓(xùn)練過(guò)或者被標(biāo)記為葉子節(jié)點(diǎn).
(5)重復(fù)步驟(2)至(4)直到所有CART都被訓(xùn)練過(guò).
設(shè)訓(xùn)練好的隨機(jī)森林為FM.當(dāng)輸入一張新影像S時(shí),遍歷S中的全部像素(邊緣像素點(diǎn)除外),利用2.2節(jié)方法計(jì)算該點(diǎn)對(duì)應(yīng)的特征向量,并將其輸入到FM中.最終將輸出該像素點(diǎn)屬于每個(gè)Sketch Token類別的概率{ei|i∈1,2,3,…,n} 及背景類的概率e0,以上概率滿足如下等式:
故當(dāng)前像素點(diǎn)是特征的概率為1-e0.當(dāng)圖像S中的所有非邊緣像素點(diǎn)都分類完畢時(shí),利用抑制局部非最大算法保留局部區(qū)域中特征概率最大的像素點(diǎn),并將量化后的特征概率值賦予該點(diǎn).處理效果如圖4所示.圖4a是一張?jiān)糞AR影像截圖.圖4b是經(jīng)Sketch Token算法處理后的灰度圖像,其中像素點(diǎn)亮度越高說(shuō)明其被評(píng)估為特征的概率越高,反之則越低.
圖4 Sketch Token特征提取結(jié)果Fig.4 Sketch Token feature extract result
3.2 基于特征圖灰度直方圖及SVM算法訓(xùn)練適配性評(píng)估模型
利用多子區(qū)匹配算法進(jìn)行景象匹配可獲得多張景象匹配對(duì),對(duì)匹配結(jié)果進(jìn)行目視判別,得到目視判別結(jié)果(其中存在一些匹配錯(cuò)誤的情況).利用Sketch Token算法對(duì)匹配對(duì)中的參考圖進(jìn)行特征提取獲得一系列對(duì)應(yīng)的Sketch Token特征圖,并統(tǒng)計(jì)每張?zhí)卣鲌D的灰度直方圖.將特征圖的灰度直方圖數(shù)據(jù)直接作為特征向量、其對(duì)應(yīng)匹配對(duì)的目視判別結(jié)果作為類別標(biāo)簽,以此來(lái)訓(xùn)練SVM分類器.為了防止過(guò)擬合現(xiàn)象,本文采用10折交叉驗(yàn)證方法訓(xùn)練分類器,并將最終訓(xùn)練得到的分類器作為SAR參考圖區(qū)域適配性的評(píng)估模型.SAR影像適配性評(píng)估算法的整體流程如圖5所示.
圖5 適配性評(píng)估方法的總體流程Fig.5 Overall flow chart of adaptive assessment method
4.1 試驗(yàn)影像數(shù)據(jù)的獲取
將在甘肅某地區(qū)2014年4月獲取的3種不同地區(qū)(城市、沙漠、河流)星載TerraSAR X波段影像作為參考圖,將2013年10月獲取的低空機(jī)載實(shí)孔徑雷達(dá)影像作為實(shí)時(shí)圖,利用多子區(qū)匹配算法[8]進(jìn)行景象匹配,共獲得2 460對(duì)匹配像對(duì).經(jīng)目視判讀,其中正確匹配對(duì)1 159對(duì),錯(cuò)誤匹配對(duì)1 233對(duì),無(wú)法判斷的像對(duì)68對(duì).將以上數(shù)據(jù)分為訓(xùn)練樣本組和預(yù)測(cè)(驗(yàn)證)樣本組.為了保證適配性分類器的訓(xùn)練效果,訓(xùn)練樣本組中需要保證正、負(fù)樣本數(shù)量相同或相近,試驗(yàn)數(shù)據(jù)的詳細(xì)情況如表1所示.表2展示了訓(xùn)練樣本組與預(yù)測(cè)(驗(yàn)證)樣本組之間的數(shù)據(jù)分布情況.
表1 經(jīng)多子區(qū)算法處理后的目視判讀結(jié)果Tab.1 The visual interpretation results based on multi sub-area algorithm 個(gè)
表2 訓(xùn)練樣本組與預(yù)測(cè)樣本組中的數(shù)據(jù)分布Tab.2 Data distribution in both train sample and predict sample group 個(gè)
4.2 基于SVM方法與Sketch Token特征統(tǒng)計(jì)量的影像適配性試驗(yàn)
利用4.1節(jié)中的訓(xùn)練樣本集數(shù)據(jù)訓(xùn)練SVM分類器.為了保證SVM算法能夠?qū)erraxSAR X波段影像的適配性分析產(chǎn)生良好效果,本文將RBF(Radial Basis Function Neural Network)徑向基函數(shù)作為SVM的核函數(shù),通過(guò)10折交叉驗(yàn)證選取獲得假設(shè)空間中的最優(yōu)SVM模型.
對(duì)預(yù)測(cè)集中的所有參考圖進(jìn)行Sketch Token特征提取,統(tǒng)計(jì)Sketch Token特征圖的灰度直方圖,并采用已經(jīng)訓(xùn)練好的SVM分類模型進(jìn)行分類,最終結(jié)果如表3所示.鑒于目前還沒(méi)有學(xué)者公開(kāi)發(fā)表過(guò)與此技術(shù)相關(guān)的研究成果,并考慮到異源雷達(dá)影像適配性評(píng)估問(wèn)題的難點(diǎn)及復(fù)雜性,利用本文方法對(duì)772對(duì)匹配對(duì)進(jìn)行適配性評(píng)估的正確性能超過(guò)70%,已經(jīng)達(dá)到了實(shí)際工程的技術(shù)要求,可用于實(shí)際的雷達(dá)影像導(dǎo)航定位工作中,說(shuō)明了本文所提方法的有效性.從表3的結(jié)果中可以看出,城市區(qū)域雷達(dá)影像適配性的評(píng)估準(zhǔn)確性高于其他地物類型區(qū)域的影像.這是因?yàn)樵诔鞘袇^(qū)域中存在大量的人造地物,這些人造地物的出現(xiàn)大大增加影像中的綜合信息量.而綜合信息量是影像適配性評(píng)估的重要指標(biāo).因此,本文所提方法對(duì)城市區(qū)域雷達(dá)影像適配性的評(píng)估正確率高于其他地物區(qū)域的雷達(dá)影像.
表3 本文方法適配性分析結(jié)果與目視判讀結(jié)果對(duì)比Tab.3 The compared result between visual interpret and this paper’s method
異源雷達(dá)景象適配性能評(píng)估的準(zhǔn)確性取決于影像中共性特征的提取與描述效果的好壞.本文以異源雷達(dá)影像間共性特征的提取算法為研究重點(diǎn),提出了一種基于Sketch Token中層特征的異源雷達(dá)景象適配性評(píng)估方法.該算法利用監(jiān)督學(xué)習(xí)策略獲取訓(xùn)練樣本,以此訓(xùn)練Sketch Token特征分類器,并以該分類器作為影像中共性特征的描述子對(duì)參考圖進(jìn)行特征提取.通過(guò)計(jì)算Sketch Token特征圖的灰度直方圖,構(gòu)成特征向量輸入到SVM分類器中,利用10折交叉驗(yàn)證方法訓(xùn)練得到新的針對(duì)異源雷達(dá)影像的適配性分類模型,并據(jù)此評(píng)估當(dāng)前影像區(qū)域的適配性.使用不同時(shí)相下的SAR影像與RAR影像作為試驗(yàn)數(shù)據(jù).試驗(yàn)結(jié)果表明:①Sketch Token特征提取算法能夠有效、穩(wěn)定地提取異源雷達(dá)影像間的共性特征;②本文所提出的適配性評(píng)估模型對(duì)異源雷達(dá)影像間適配性評(píng)估具有魯棒性,其正確率能夠達(dá)到現(xiàn)在實(shí)際工程的技術(shù)要求.本文研究的適配性分析方法模型已在實(shí)際工程中應(yīng)用,說(shuō)明了該方法的有效性.
[1] 趙鋒偉,劉揚(yáng),沈振康,等.景象匹配評(píng)估系統(tǒng)中圖像特征指標(biāo)的選擇(一)圖像統(tǒng)計(jì)特征[J].紅外與激光工程,2001,30(4):265.ZHAO Fengwei,LIU Yang,Shen Zhenkang,et al.Image feature index selecting in scene matching evaluated system(1)The statistical features of image[J].Infrared and Laser Engineering,2001,30(4):265.
[2] 沈振康.地形(地圖)匹配系統(tǒng)[M].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué)出版社,1984.SHEN Zhenkang.Terrain(map)matching system[M].Changsha:National University of Defence Technology Press,1984.
[3] 張紹明,陳鷹,林怡.SAR圖像與光學(xué)圖像多子區(qū)魯棒匹配算法[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2009,37(1):121.ZHANG Shaoming,CHEN Ying,LIN Yi.Robust algorithm of matching SAR image to optical image using multiple subarea[J].Journal of Tongji University:Natural Science,2009,37(1):121.
[4] 沈林成,卜彥龍,徐昕,等.景象匹配輔助組合導(dǎo)航中景象區(qū)域適配性研究進(jìn)展[J].航空學(xué)報(bào),2010,31(3):553.SHEN Lincheng,BO Yanlong,XU Xin,et al.Research on matching-area suitability for scene matching aided navigation[J].Chinese Journal of Aeronautics,2010,31(3):533.
[5] 張國(guó)忠,沈林成,常文森,等.互相關(guān)景象匹配系統(tǒng)的正確匹配概率研究[J].宇航學(xué)報(bào),2002,23(1):30.ZHANG Guozhong,SHEN Lincheng,CHANG Wensen,et al.Research on acquisition probability of cross correlatoin scene matching systems[J].Journal of Astronautics,2002,23(1):30.
[6] 王曉靜,徐大新,許高升.用于信號(hào)、圖像和景象匹配的特征區(qū)域選擇方法[J].紅外與激光工程,2002,31(5):378.WANG Xiaojing,XU Daxin,XU Gaosheng.Subset selection in signal,image and scene matching[J].Infrared and Laser Engineering,2002,31(5):378.
[7] 江標(biāo)初,陳映鷹.層次景象匹配區(qū)選取準(zhǔn)則[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2007,35(6):830.JIANG Biaochu,CHEN Yingying.A rule of selecting scene matching area[J].Journal of Tongji University:Natural Science,2007,35(6):830.
[8] 楊朝輝,陳映鷹.基于支持向量機(jī)的景象匹配區(qū)選擇方法[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2009,37(5):690.YANG Zhaohui,CHEN Yingying.Support vector machine for scene matching area selection[J].Journal of Tongji University:Natural Science,2009,37(5):690.
[9] Lim Joseph J,Zitnick C Lawrence,Dollar Piotr.Sketch tokens:A learned mid-level representation for contour and object detection[C]∥Conference on Computer Vision and Pattern Recognition.Portland:[s.n.],2013:3158-3165.
[10] Lowe D G.Distinctive image features from scale-invariant keypoints[J].International Journal of Computer Vision,2004,60(2):91.
[11] Herbert Bay,Tinne Tuytelaars,Luc Van Gool,et al.SURF:Speeded up robust features[J].Journal Computer Vision and Image Understanding,2008,110(3):346.
[12] Dalal N,Triggs B.Histograms of oriented gradients for human detection[C]∥Conference on Computer Vision and Pattern Recognition.San Diego:[s.n.],2005:886-893.
[13] Carl Doersch,Saurabh Singh,Abhinav Gupta,et al.What makes pairs look like pairs[J].Acm Transactions on Graphics,2012,31(4):13.
[14] Engin Tola,Vincent Lepetit,Pascal Fua,et al.DAISY:An efficient dense descriptor applied to wide-baseline stereo[J].IEEE Transactions on Pattern and Machine Intelligence,2010,32(5):815.
[15] Dollar P,Tu Z,Perona P,et al.Integeral channel features[R].London:British Machine Vision Conference,2009.
[16] Shechtman E,Irani M.Matching local self-similarities across images and videos[C]∥International Conference on Computer Vision.Minneapolis:[s.n.],2007:1-8.
[17] Criminisi A,Shotton J,Konukoglu E.Decision forests:A unified framework for classification,regression,density estimation,manifold learning and semi-supervised learning[J].Foundations and Trends in Computer Graphics and Vision,2012,7(2-3):81.
Analysis of the Matching Suitability of Remote Sensing Radar Images of Different Sensors Based on Sketch Token
YE Qin,CHEN Hongmin,ZHANG Shaoming
(College of Surveying and Geo-Informatics,Tongji University,Shanghai 200092,China)
Focusing on the extraction and description of common information between heterologous images,this paper proposed an algorithm for matching suitability analysis between heterologous images based on Sketch Token middle level features.Supervised learning has been used to acquire priori knowledge of homogeneous information between heterologous images,and utilize this knowledge to train the Sketch Token classifier,which is designed as a descriptor of homogeneous information to extract features on reference images.The statistical of extracted features is applied for training support vector machine classifier,which is used to analysis the matching suitability of reference images.The algorithm is validated by the satellite SAR(synthetic aperture radar)images which have been used as reference images and aerial RAR(real aperture radar)images which have been used as real images.The test result demonstrate the effectiveness of the algorithm.
heterologous images;Sketch Token;middle level features;common information;matching suitability analysis
TP751
A
0253-374X(2015)12-1888-07
10.11908/j.issn.0253-374x.2015.12.019
2014 11 14
國(guó)家自然科學(xué)基金(41171327,41301361);上海市自然科學(xué)基金(13ZR1444300)
葉 勤(1970—),女,副教授,工學(xué)博士,主要研究方向?yàn)閿?shù)字?jǐn)z影測(cè)量、遙感圖像處理.E-mail:yeqin@#edu.cn
張紹明(1979—),男,副教授,工學(xué)博士,主要研究方向?yàn)閿?shù)字圖像處理、攝影測(cè)量與遙感、嵌入式GIS.
E-mail:sheva2003@gmail.com
同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版)2015年12期