肖 艷,王 斌,姜琦剛,聞 雅
(1. 長春工程學院勘查與測繪工程學院,長春 130012;2. 長春市測繪院,長春 130021;3. 吉林大學地球探測科學與技術學院,長春 130012)
有效的 PolSAR(Polarimetric Synthetic Aperture Radar,PolSAR)影像分類技術是PolSAR 成功應用的基礎[1]。然而相比于比較成熟的PolSAR 成像技術與系統(tǒng)設計,PolSAR 影像分類技術的發(fā)展相對滯后,嚴重制約了PolSAR 技術的應用,因此,開展PolSAR 影像分類技術研究對提高PolSAR 系統(tǒng)應用水平具有重要意義[2]。
相比于單極化SAR,PolSAR 測量的是目標的極化散射特性,能夠獲取目標在多個極化狀態(tài)下的電磁波散射圖像[3]。因此,PolSAR 數(shù)據(jù)的優(yōu)勢就在于其包含的豐富極化信息。如何充分利用極化信息進行分類一直是PolSAR 影像分類研究的熱點問題[4]。根據(jù)極化信息利用方式,PolSAR 影像分類方法可歸納為3 類:直接利用散射矩陣和散射矢量的方法、直接利用相干矩陣和協(xié)方差矩陣的方法以及利用目標極化分解的方法[5]。相比于前2種方法,利用目標極化分解方法所獲得的分類結(jié)果能更好的揭示地物散射機理,有助于人們對影像的理解。根據(jù)分解機制及針對目標的不同,研究人員相繼提出了多種目標極化分解方法,較為經(jīng)典的有 Krogager 分解[6]、Huynen 分解[7]、Barnes 分解[8]、Cloude 分解[9]、H/A/α分解[10]、Freeman2 分解[11]、Freeman3 分解[12]、Yamaguchi分解[13]、Neumann 分解[14]、Touzi 分解[15]、Holm 分解[16]、Van Zyl 分解[17]和Pauli 分解[18]。這些目標極化分解方法在PolSAR 影像分類中都得到了廣泛應用。
總結(jié)PolSAR 影像分類研究現(xiàn)狀,發(fā)現(xiàn)現(xiàn)有利用目標極化分解的分類研究大都僅利用了一種極化分解方法。然而,目前發(fā)展的眾多極化分解方法中,哪一種方法所提取的特征最能反映地物本質(zhì)特征、最利于分類精度提高,還尚無定論。Shimoni 等[19]提出不同目標極化分解方法都應被用于土地覆被分類,因為其強調(diào)了不同的地物類型。近幾年,陸續(xù)有研究者在PolSAR 影像分類中同時采用多種目標極化分解方法,并取得了較好的分類效果。Qi 等[20-21]利用各目標極化分解方法提取出極化參數(shù)后,將提取的所有極化參數(shù)合成為一幅多通道影像,然后進行分類。盡管這些研究通過引入多種目標極化分解方法獲取了很多極化參數(shù),但出于“維數(shù)災難”的考慮,其并未將提取的極化參數(shù)全部用于分類,而是通過特征選擇方法篩選出小部分最有用的進行分類,造成了極化信息的嚴重浪費。
集成學習技術的發(fā)展為上述問題的解決提供了思路,在集成學習框架下嵌入目標極化分解方法能夠?qū)O化信息有效利用起來,從而提高PolSAR 影像分類精度。鑒于此,本研究提出了一種基于目標極化分解和集成學習的PolSAR 影像分類方法??紤]到面向?qū)ο蠓椒ㄍㄟ^以區(qū)域作為分類基本單元,能更好地抑制PolSAR 影像中相干斑噪聲對影像信息的破壞[22-23],所以提出的方法采用面向?qū)ο蠓诸惙绞健?/p>
1.1.1 研究區(qū)概況
本研究的研究區(qū)位于吉林省長春市的南部(43°39′58″N~43°51′10″N,125°17′52″E~125°34′45″E),包括長春市主城區(qū)和雙陽區(qū)的部分區(qū)域,如圖1 所示。
圖1 研究區(qū)位置示意圖Fig.1 Location map of study area
1.1.2 數(shù)據(jù)源
本研究選用全極化 RADARSAT-2 影像作為數(shù)據(jù)源(圖2)。RADARSAT-2 是一顆搭載C 波段傳感器的高分辨率商用雷達衛(wèi)星。本研究所用RADARSAT-2 影像的獲取時間為2016 年8 月1 日,成像模式為精細全極化(即極化方式包括HH、HV、VH、VV 共4 種),產(chǎn)品模式為單視復型數(shù)據(jù)(Single Look Complex,SLC)。該影像工作頻率是5.4 GHz,標稱空間分辨率為8 m,在方位向和距離向的像元尺寸分別為5.49 和4.73 m,近端入射角41.07°,遠端入射角42.46°,影像覆蓋范圍為25 km×25 km。
圖2 RADARSAT-2 PolSAR 影像(Pauli RGB 合成)Fig.2 RADARSAT-2 PolSAR image (Pauli RGB composition)
于 2016 年 7 月 30 日至 2016 年 8 月 3 日開展野外調(diào)查工作。研究區(qū)土地覆被類型包括耕地、林地、草地、居民地、道路和水體6 種。本研究共計采集了565 個樣本區(qū)域,圖 3 是各地類樣本分布情況。將采集的樣本分為兩組,一組為訓練樣本,一組為驗證樣本,各地類樣本的分組情況如表1 所示。
圖3 各地類的樣本分布圖Fig.3 Distribution map of samples for each class
表1 各地類樣本數(shù)量Table 1 Numbers of samples for each class
1.2.1 極化分解
雷達目標一般分為確定性目標和分布式目標 2 種。在單色波照射下,確定性目標的散射波是完全極化的,其散射特性可以用極化散射矩陣進行表征;而對于分布式目標,在任何波照射下,其散射波都是部分極化的,分布式目標的散射特性可以用協(xié)方差矩陣、相干矩陣等進行表征[24]。
極化散射矩陣能夠記錄并描述散射過程中目標的極化變化信息。極化散射矩陣S的定義如式(1)所示
式中對角線元素Shh和Svv為“同極化”項,非對角線元素Shv和Svh為“交叉極化”項[24]。
3×3 視相干矩陣T3和協(xié)方差矩陣C3的定義分別如式(2)和(3)所示
式中* 表示共軛,|·|表示模,〈·〉表示時間或空間集合平均[24]。極化分解就是基于雷達目標的散射矩陣、相干矩陣或協(xié)方差矩陣來實現(xiàn)的。
1.2.2 集成學習
按照成員分類器組合的形式,集成學習方法可分成串行方式和并行方式 2 類。串行方式的多分類器組合方法是指前一個分類器分類結(jié)果的輸出為后一個分類器的輸入。并行方式首先分別利用每個成員分類器獨立地進行分類,然后根據(jù)某種策略將各成員分類器的分類結(jié)果進行合成。
成員分類器分類結(jié)果的合成方法中,投票法是最簡單,也是應用最廣泛的一種[25]。但傳統(tǒng)投票法忽略了不同成員分類器分類性能的差異,為將該差異融入到合成結(jié)果當中,一些學者提出了加權投票法。在加權投票法中,不同分類器根據(jù)其性能被賦予不同的權值。
多分類器集成的效果除了受參與集成的成員分類器自身分類性能影響外,還與各成員分類器之間的差異程度有關[26]。一般來說,差異性越大,集成效果越好。衡量這種差異性的方法就是差異性度量。本研究采用熵值度量法衡量成員分類器之間的差異,熵的計算如式(4)所示
式中N為驗證樣本的數(shù)目,L為成員分類器個數(shù),[ ]表示取整操作,l(zm)表示正確分類樣本zm的成員分類器數(shù)量。E取值范圍為[0, 1],值越大代表差異性越大。
PolSAR 由于在成像過程中進行相干處理而產(chǎn)生大量的相干斑噪聲,所以需要先進行濾波處理[27]??紤]到refined Lee 算法[28]在濾波過程中既能充分保持數(shù)據(jù)極化特性,同時又能避免不同通道間的串擾,所以本研究采用refined Lee 濾波算法對RADARSAT-2 影像進行相干斑抑制,通過多次試驗,將濾波窗口設置為5×5。
1.3.1 目標極化分解
將 PolSARPro_v4.1.5 軟件提供的所有目標極化分解方法都用于分類,通過這些目標極化分解方法,共提取了61 個極化參數(shù),如表2 所示。
1.3.2 多尺度分割
利用 ecognition9.0 軟件的多尺度分割模塊對多通道影像進行分割。鑒于Pauli 分解常被用于表示一幅PolSAR影像中所有的極化信息,所以本研究利用Pauli RGB 合成影像的3 個圖層進行分割,3 個圖層被賦予相等權重。在分割過程中,需要設定顏色因子、形狀因子和分割尺度的值。顏色因子與形狀因子是相對的,這 2 個參數(shù)值之和為1,多數(shù)情況下,顏色因子對于創(chuàng)建對象提供了主要信息,而形狀因子值越小,分割對象在形狀上的差異越大;對于尺度參數(shù),其值越大,分割所得對象越大。本研究進行了多次試驗,最終設定顏色因子、形狀因子、分割尺度的值分別為0.9、0.1、30。
表2 不同極化分解方法所提取的極化參數(shù)Table 2 Polarimetric parameters extracted using different polarimetric decomposition methods
1.3.3 特征提取
因為用不同極化分解方法所提取極化參數(shù)的個數(shù)不同,所以能從不同極化分解方法中提取出的特征數(shù)量也不同,如表 3 所示。對于任一種極化分解方法,其對應的特征可以被歸納為如下4 類(其中n為利用該極化分解方法所提取極化參數(shù)的個數(shù)):
1)4×n個灰度特征:n個圖層的均值、標準差、最小像素值和最大像素值。
2)8×n個紋理特征:n個圖層的均值、標準差、熵、同質(zhì)度、對比度、非相似性、角二階矩和相關性(采用灰度共生矩陣(Grey Level Concurrence Matrix,GLCM)來描述對象的紋理特征)[29]。
3)2×n個空間關系特征:對象鄰域的平均差分、對象鄰域的平均差分(絕對值)。
4)11 個形狀特征:各個對象的面積、邊界長度、長度、長寬比、寬度、不對稱性、邊界指數(shù)、緊湊性、密度、形狀指數(shù)、圓度。
1.3.4 特征選擇
采用PSO_SVM 封裝算法進行特征選擇[30]。分類器和搜索算法是封裝特征選擇算法的 2 個組成部分。PSO_SVM 算法以粒子群優(yōu)化(Particle Swarm Optimization,PSO)作為搜索算法、支持向量機(Support Vector Machine,SVM)的分類精度作為評估函數(shù)挑選最優(yōu)特征子集[31-32],其中SVM 選用徑向基函數(shù)為核函數(shù)。采用徑向基函數(shù)時,容錯懲罰系數(shù)C和內(nèi)核參數(shù)γ是2 個必要調(diào)整參數(shù),其取值直接影響分類精度,因此必須進行參數(shù)尋優(yōu)。鑒于在封裝算法中,特征子集的構(gòu)成和SVM 核參數(shù)的取值是相互影響的,因此,本研究利用PSO 算法對SVM 核參數(shù)和特征子集進行同步優(yōu)化。
表3 提取和選擇的特征數(shù)量以及獲得的最優(yōu)C 和γ值Table 3 Numbers of extracted and selected features and obtained optimal C andγvalues
利用 PSO_SVM 算法分別對各目標極化分解方法的特征進行選擇,獲得特征的數(shù)量以及最優(yōu)C和γ參數(shù)的值如表3 所示。
1.3.5 土地覆被分類
基于ecognition9.0 軟件,利用獲取的最優(yōu)特征子集,以SVM 為分類器對研究區(qū)進行土地覆被分類,其中參數(shù)C和γ按照表3 進行取值,各目標極化分解方法的分類結(jié)果如圖4 所示。
針對各極化分解方法對應的分類結(jié)果,分別利用驗證樣本建立精度混淆矩陣,該矩陣包括 4 個統(tǒng)計量:生產(chǎn)者精度(Producer’s Accuracy,PA)、用戶精度(User’s Accuracy,UA)、總體精度(Overall Accuracy,OA)和Kappa 系數(shù),如表4 所示。
1.3.6 多分類器集成
參與集成的成員分類器數(shù)量并不是越多越好,成員分類器自身的分類性能會直接影響集成效果。因此,應選用分類性能較好的成員分類器進行集成。本研究將Kappa 系數(shù)>0.60 的9 種目標極化分解方法(Pauli、H/A/α、Freeman2、Freeman3、Yamaguchi3、Yamaguchi4、Neumann、Touzi、Van Zyl)的分類結(jié)果用于集成。多分類器集成的效果除了受參與集成的成員分類器自身的分類性能影響外,還與各成員分類器之間的差異程度有關,所以在集成之前,需要對成員分類器間的差異性進行度量。如 2.2 節(jié)所述,本研究選用熵值對 9種成員分類器的所有組合形式的差異性進行度量。在所有組合中,由 Pauli、Freeman3、Yamaguchi4、Neumann、Touzi 和Van Zyl 6 種極化分解方法的分類結(jié)果構(gòu)成的組合熵值最大,為0.282 7,所以最終選取了該組合進行集成。本研究中,特征選擇、差異性度量以及多分類器集成都是通過Matlab 2010b 語言平臺編程實現(xiàn)。
采用并聯(lián)方式結(jié)合加權投票法對 Pauli、Freeman3、Yamaguchi4、Neumann、Touzi 和 Van Zyl 6 種極化分解方法的分類結(jié)果進行集成,得到的分類結(jié)果如圖4 所示,基于該分類結(jié)果建立的混淆矩陣如表5 所示。
從表 4 可以看出,16 種極化分解方法中,基于Yamaguchi4 的分類結(jié)果精度最高,總體精度和 Kappa系數(shù)分別為 88.00%和 0.84,基于 Barnes1 的分類結(jié)果精度最低,總體精度和 Kappa 系數(shù)分別為 55.84%和0.40。按照Kappa 系數(shù)從高到低對16 種極化分解方法進行排序,結(jié)果為 Yamaguchi4、Pauli、H/A/α、Touzi、Neumann、Freeman3、Van Zyl、Yamaguchi3、Freeman2、Krogager、Cloude、Holm1、Holm2、Huynen、Barnes2、Barnes1。
集成后分類結(jié)果的總體精度和 Kappa 系數(shù)分別為92.49%和0.90,比集成前精度最高的Yamaguchi4 的總體精度和 Kappa 系數(shù)分別高出了 4.49%和 0.06。對比表 4和表 5 發(fā)現(xiàn),通過多分類器集成后,地類的生成者精度和用戶精度整體上都有所提高,但從單個地物角度看,并不是所有地類的生產(chǎn)者精度或用戶精度都比各成員分類器的高,比如Pauli 的水體的生產(chǎn)者精度為100.00%,而集成后的水體的生產(chǎn)者精度為99.92%;Van Zyl 的道路的用戶精度為 98.62%,而集成后的道路的用戶精度為96.47%??梢姡ㄟ^多分類器集成,盡管能提高整體分類精度,但并不能保證所有地類的生產(chǎn)者精度和用戶精度都得到提高。
表5 提出方法的分類精度Table 5 Classification accuracy of the proposed method
如引言部分所述,近幾年,陸續(xù)有研究者在PolSAR影像分類中同時采用多種目標極化分解方法,并取得了較好的分類效果。其中較多研究都是先利用各目標極化分解方法提取出極化參數(shù),并將所有極化參數(shù)合成一幅多通道影像,然后對多通道影像進行特征提取和特征選擇,最后利用選擇的最優(yōu)特征子集進行分類。本研究將該方法作為對比方法,以進一步驗證提出方法的有效性。利用對比方法對RADARSAT-2 影像進行分類,所用極化參數(shù)包括:Pauli_a、Pauli_b、Pauli_c、Barnes1_T22、Barnes1_T33、 Cloude_T33、 H/A/α_T22、 H/A/α_T33、Freeman2_Vol 、 Freeman2_Ground 、 Freeman_Dbl 、Yamaguchi4_Odd、Yamaguchi4_Dbl、Yamaguchi4_Hlx、TSVM_alpha_s2、Holm1_T33和 VanZyl3_Vol,分類結(jié)果如圖4 所示。對比方法的總體精度和Kappa 系數(shù)分別為90.74%和0.88,比提出方法的分別低1.75%和0.02??梢?,提出的方法能更有效用于PolSAR 影像分類。對比方法通過特征選擇僅保留了極少數(shù)特征用于分類,造成了極化信息的嚴重浪費,這是其精度較低的主要原因。而本研究提出的方法則是對精度較高的目標極化分解的分類結(jié)果進行集成,實現(xiàn)了PolSAR 數(shù)據(jù)極化信息的充分運用,從而獲得了更好的分類效果。
本研究提出了一種基于目標極化分解和集成學習的PolSAR 影像分類方法,并以吉林省長春市部分區(qū)域為研究區(qū),Radarsat2 影像為數(shù)據(jù)源,將提出方法應用于土地覆被分類中,得到如下結(jié)論:
1)按照獲得的 Kappa 系數(shù)從高到低對16 種極化分解方法進行排序,結(jié)果為 Yamaguchi4、Pauli、H/A/α、Touzi、Neumann、Freeman3、Van Zyl、Yamaguchi3、Freeman2、Krogager、Cloude、Holm1、Holm2、Huynen、Barnes2、Barnes1。
2)集成后分類結(jié)果的總體精度和Kappa 系數(shù)分別為92.49%和0.90,比集成前精度最高的Yamaguchi4 的總體精度和Kappa 系數(shù)分別高出了4.49%和0.06。
3)將提出的方法與其他基于多種目標極化分解的分類方法進行對比,提出的方法獲得了更高的總體精度和Kappa 系數(shù),證明提出的方法能更有效用于PolSAR 影像分類。
如何充分利用極化信息進行分類一直是 PolSAR 影像分類研究的熱點問題。本研究將目標極化分解方法嵌入在集成學習框架下,從而將極化信息有效利用起來。在利用集成學習技術進行PolSAR 影像分類的研究中,集成構(gòu)造方法主要集中在基于變換樣本和基于不同類型分類算法兩個方向上,而目前基于目標極化分解的集成學習研究還非常缺乏。本次研究不僅為PolSAR 影像分類提供了一個新的研究思路,同時也拓展了集成學習中常規(guī)“多樣性”的構(gòu)建方法。