• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于AdaBoost改進(jìn)隨機(jī)森林和SVM的極化SAR地物分類(lèi)*

      2022-11-15 06:01:30張政李世強(qiáng)
      關(guān)鍵詞:決策樹(shù)極化分類(lèi)器

      張政,李世強(qiáng)

      (1 中國(guó)科學(xué)院空天信息創(chuàng)新研究院, 北京 100190; 2 中國(guó)科學(xué)院大學(xué)電子電氣與通信工程學(xué)院, 北京 100049)

      合成孔徑雷達(dá)(synthetic aperture radar, SAR)是一種高分辨率成像雷達(dá),具備全天時(shí)、全天候、遠(yuǎn)距離觀測(cè)目標(biāo)的能力[1]。極化SAR(polarimetric SAR)是一種多通道多參數(shù)的SAR系統(tǒng),與傳統(tǒng)SAR系統(tǒng)相比可以獲得更為豐富的目標(biāo)散射特性[2],在圖像分類(lèi)方面具備一定優(yōu)勢(shì)[3]。

      地物分類(lèi)是遙感圖像解譯的關(guān)鍵問(wèn)題之一,在環(huán)境監(jiān)測(cè)、災(zāi)害評(píng)估、城市規(guī)劃等方面有著廣泛應(yīng)用。隨著大數(shù)據(jù)處理技術(shù)的發(fā)展,學(xué)者們開(kāi)始嘗試將機(jī)器學(xué)習(xí)等算法應(yīng)用在SAR數(shù)據(jù)處理中。文獻(xiàn)[4]用深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)對(duì)極化SAR進(jìn)行分類(lèi),可以得到較高的分類(lèi)精度,但其依賴(lài)大量的有標(biāo)記訓(xùn)練樣本,在數(shù)據(jù)量較少時(shí)分類(lèi)效果不佳,而在此情況下機(jī)器學(xué)習(xí)等傳統(tǒng)算法表現(xiàn)通常優(yōu)于深度卷積神經(jīng)網(wǎng)絡(luò)[5]。

      一般來(lái)說(shuō),特征參數(shù)種類(lèi)越豐富,所描述的地物目標(biāo)信息便越全面,然而由于特征之間冗余度和相關(guān)性的存在,不加區(qū)分的特征疊加往往會(huì)導(dǎo)致過(guò)高的計(jì)算復(fù)雜度,而分類(lèi)效果卻提升有限,同時(shí)SAR圖像的相干斑噪聲也一直影響著分類(lèi)精度。針對(duì)這些問(wèn)題,文獻(xiàn)[6]提出一種基于特征篩選的二級(jí)分類(lèi)結(jié)構(gòu)對(duì)建筑物進(jìn)行提取,作者利用隨機(jī)森林(random forest, RF)[7]對(duì)特征進(jìn)行篩選,并得到初級(jí)分類(lèi)結(jié)果,將篩選后的特征輸入到支持向量機(jī)(support vector machine, SVM)[8]得到二級(jí)分類(lèi)結(jié)果,兩種結(jié)果融合后獲得最終結(jié)果。該方法在建筑物提取上效果較好,但由于RF沒(méi)有區(qū)分決策樹(shù)的分類(lèi)能力,所有決策樹(shù)在分類(lèi)時(shí)默認(rèn)權(quán)重相同,而實(shí)際上決策樹(shù)分類(lèi)能力有所差異,對(duì)權(quán)重適當(dāng)調(diào)整可以提升分類(lèi)器的總體精度。因此陳偉民等[9]針對(duì)該問(wèn)題提出一種基于自適應(yīng)提升(adaptive boosting, AdaBoost)改進(jìn)RF算法,并在高光譜圖像分類(lèi)上驗(yàn)證了該算法的有效性。

      為提升極化SAR圖像地物分類(lèi)精度,減少相干斑噪聲對(duì)分類(lèi)的影響,本文設(shè)計(jì)了一種基于AdaBoost改進(jìn)RF(adaBoost random forest, ADA_RF)和SVM的二級(jí)分類(lèi)算法。該方法采用AdaBoost提升RF性能的方法[9],同時(shí)還引入了二級(jí)分類(lèi)結(jié)構(gòu)[6]。

      該方法首先從極化SAR數(shù)據(jù)中提取特征數(shù)據(jù)集,利用分層采樣法選取訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集,先得到ADA_RF分類(lèi)器和特征重要性排名,再根據(jù)排名選擇部分特征求出SVM的二級(jí)分類(lèi)結(jié)果,通過(guò)鄰域投票法融合兩級(jí)結(jié)果,得出最終結(jié)果。

      1 特征描述

      在極化SAR圖像的分析過(guò)程中常用極化散射矩陣S來(lái)描述地物的極化散射特性,S矩陣經(jīng)過(guò)變換之后又可以得到極化協(xié)方差矩陣C和極化相干矩陣T。

      (1)

      (2)

      (3)

      式(2)和式(3)中:〈·〉表示集合平均,*表示共軛。在單站后向散射體制下,假定S滿足互易性,即有SHV=SVH,因此通常定義極化SAR系統(tǒng)測(cè)量的散射總功率為

      式中:Tr(·)表示求矩陣的跡,T作為上角標(biāo)時(shí)表示轉(zhuǎn)置。

      不同的極化目標(biāo)分解方法描述地物散射特性的角度不同。極化目標(biāo)分解方法主要分為3種,分別是基于散射模型的分解方法、基于特征矢量或特征值分析的分解方法和相干分解方法[2]。基于散射模型的目標(biāo)極化分解方法有Freeman-Durden分解、Yamaguchi分解等?;谔卣魇噶磕繕?biāo)極化分解方法有Cloude-Pottier分解、 Holm分解和Van Zyl分解等。相干分解是將S矩陣分解為目標(biāo)散射機(jī)制的組合,有Pauli分解和Krogager分解等方法??紤]到地物目標(biāo)一般較為復(fù)雜,單一的分解方法難以適用于不同場(chǎng)景,故本文從3種分解方法中各選取了幾個(gè)典型特征組成極化特征集合。

      紋理是應(yīng)用于遙感圖像分類(lèi)的典型特征。它通過(guò)灰度空間重復(fù)變化反映圖像的灰度統(tǒng)計(jì)信息、空間分布信息和結(jié)構(gòu)信息。紋理特征中的灰度共生矩陣和半方差矩陣是具有代表性的兩個(gè)特征,前者是應(yīng)用最為廣泛的紋理描述方法之一,后者則能有效表示建筑區(qū)域的特征。因此本文選擇灰度共生矩陣和半方差矩陣作為紋理特征集合。

      綜上所述,本文選取如表1所示的特征集合,分別是直接測(cè)量得到的極化數(shù)據(jù)、Yamaguchi分解特征[10]、Cloude-Pottier極化分解特征[11],還有灰度共生矩陣[12]和半方差函數(shù)[13]等紋理特征。

      表1 特征集合

      其中,直接測(cè)量得到的極化數(shù)據(jù)主要有極化散射總功率Span和極化相干矩陣的對(duì)角線元素T11,T22,T33。Span表示極化SAR系統(tǒng)的回波強(qiáng)度,T11代表目標(biāo)對(duì)稱(chēng)因子,T22代表目標(biāo)非對(duì)稱(chēng)因子,T33代表目標(biāo)非規(guī)則因子。

      Yamaguchi分解將地物目標(biāo)散射分解成表面散射PS、二次散射PD、體散射PV和螺旋散射PH。螺旋散射信息PH的存在是Yamaguchi分解優(yōu)于Freeman-Durden分解之處,該成分在具有復(fù)雜結(jié)構(gòu)的目標(biāo)或城區(qū)建筑中較為常見(jiàn)。

      Cloude-Pottier分解參數(shù)包括極化熵H、散射角α與各向異性度A,它們都來(lái)自于相干矩陣T的分解,均有旋轉(zhuǎn)不變性。極化熵H用來(lái)衡量散射過(guò)程的隨機(jī)性,散射角α與平均物理散射機(jī)制密切相關(guān),各向異性度A用來(lái)描述特征分解得到的第2、3個(gè)特征值的相對(duì)大小。

      紋理特征選取灰度共生矩陣和半方差函數(shù)?;叶裙采仃嚢?、對(duì)比度、同質(zhì)性、均值4種特征,分別用符號(hào)ENT、CON、HOM、MEA表示。ENT描述圖像信息量的隨機(jī)性,CON反映圖像灰度的局部差異,HOM體現(xiàn)圖像局部均勻程度,MEA體現(xiàn)紋理的規(guī)則化程度。半方差函數(shù)V[14]描述像素與其鄰域像素的空間相關(guān)性。將圖像中的灰度值作為區(qū)域化變量,在以像素點(diǎn)為中心的鄰域窗口內(nèi)對(duì)0°、45°、90°、135°等4個(gè)方向的半方差函數(shù)取平均,最終得到中心像素的半方差紋理特征值。

      2 分類(lèi)方法

      2.1 分類(lèi)器

      本文構(gòu)建了由ADA_RF和SVM組成的二級(jí)分類(lèi)結(jié)構(gòu)。

      AdaBoost是一種集成學(xué)習(xí)算法,它能根據(jù)分類(lèi)器的性能賦予權(quán)重,得到分類(lèi)器的加權(quán)組合,提升整體分類(lèi)性能。具體來(lái)說(shuō)便是根據(jù)各個(gè)分類(lèi)器的分類(lèi)正確率高低來(lái)分配權(quán)重,正確率高的獲得高權(quán)重,低的則獲得低權(quán)重。RF[7]是一種集成學(xué)習(xí)模型,決策樹(shù)是它的基本分類(lèi)器。它利用自助采樣法隨機(jī)采集樣本組成子集,每個(gè)樣本子集訓(xùn)練出一個(gè)決策樹(shù),多顆決策樹(shù)組成隨機(jī)森林。各個(gè)決策樹(shù)通過(guò)簡(jiǎn)單投票法決定最終結(jié)果。

      本文用AdaBoost算法調(diào)整隨機(jī)森林中決策樹(shù)的投票權(quán)重,分類(lèi)能力越強(qiáng)權(quán)重越高,最后通過(guò)最大投票準(zhǔn)則獲得分類(lèi)結(jié)果。AdaBoost算法是面向二分類(lèi)的分類(lèi)算法,因此本文采用“一對(duì)多”拆解法,將多類(lèi)別分類(lèi)問(wèn)題轉(zhuǎn)化為多個(gè)二分類(lèi)問(wèn)題。對(duì)像素分類(lèi)時(shí),每顆決策樹(shù)單獨(dú)給出分類(lèi)結(jié)果,隨機(jī)森林對(duì)投票結(jié)果加權(quán)統(tǒng)計(jì),將得票最多的預(yù)測(cè)結(jié)果作為最終分類(lèi)結(jié)果。

      SVM是一種典型的有監(jiān)督分類(lèi)器[15]。它的基本思想是找到能夠正確劃分訓(xùn)練數(shù)據(jù)集并且間隔最大的超平面,該超平面要有足夠間隔將離其最近的兩類(lèi)樣本點(diǎn)分開(kāi),所以可將超平面的求解表示為一個(gè)凸二次優(yōu)化問(wèn)題

      s.t.yi(wTxi+b)≥1,i=1,2,…,m.

      其中:w為權(quán)重系數(shù),b為位移項(xiàng),(xi,yi)為樣本集中的訓(xùn)練樣本。SVM具有比較完備的數(shù)學(xué)理論支撐,但在大樣本和高維度場(chǎng)景下計(jì)算效率不高。因此可以考慮利用隨機(jī)森林的特征篩選功能,提前去除冗余特征,提高運(yùn)行效率。

      由ADA_RF和SVM得到的兩級(jí)分類(lèi)結(jié)果通過(guò)鄰域投票法進(jìn)行融合,其原理是當(dāng)兩級(jí)分類(lèi)結(jié)果在像素點(diǎn)(i,j)處不同時(shí),以該點(diǎn)為中心取一個(gè)寬度為d的正方形窗口,窗口中每個(gè)像素點(diǎn)都可以對(duì)分類(lèi)結(jié)果進(jìn)行投票,將中心像素的類(lèi)別標(biāo)記為得票最多的類(lèi)別C

      C=maxc(SUM(En(k,l)==c)),

      c=1,2,3,…;n=1,2.

      2.2 算法步驟

      本文算法流程如圖1所示。

      圖1 本文算法流程

      步驟1輸入極化SAR數(shù)據(jù),進(jìn)行預(yù)處理。

      步驟2提取數(shù)據(jù)的極化和紋理特征,構(gòu)成維度為M的原始特征參數(shù)集X。

      步驟3分析極化SAR圖像,查找或繪制地面真值圖。利用分層采樣法選取訓(xùn)練集和測(cè)試集。

      步驟4通過(guò)輸入訓(xùn)練數(shù)據(jù)集和標(biāo)簽到ADA_RF,使得隨機(jī)森林的每個(gè)決策樹(shù)都有各自的權(quán)重。用訓(xùn)練好的分類(lèi)器對(duì)整幅圖像進(jìn)行預(yù)測(cè),得到初級(jí)預(yù)測(cè)結(jié)果E1,同時(shí)得到各個(gè)特征的平均重要性排名V1。

      步驟6利用篩選后的特征集合X訓(xùn)練SVM分類(lèi)器,并對(duì)整幅圖像進(jìn)行預(yù)測(cè),得到二級(jí)分類(lèi)結(jié)果E2。

      步驟7利用鄰域投票法,將E1和E2進(jìn)行融合,得到最終地物分類(lèi)結(jié)果。

      3 實(shí)驗(yàn)與分析

      本文通過(guò)對(duì)AIRSAR采集自美國(guó)舊金山和荷蘭弗萊福蘭省的L波段極化數(shù)據(jù)進(jìn)行分類(lèi)實(shí)驗(yàn),得到RF、SVM、ADA_RF和本文算法4種分類(lèi)器的分類(lèi)結(jié)果,通過(guò)對(duì)比來(lái)驗(yàn)證本文算法的有效性。

      3.1 特征篩選

      ADA_RF可以根據(jù)各個(gè)特征的貢獻(xiàn)率得出重要性排名,作為特征篩選的依據(jù)。按照步驟5得到重要性排名,依次加入特征并記錄精度的提升程度,得到圖2所示的折線圖。

      圖2 特征向量個(gè)數(shù)對(duì)分類(lèi)精度的影響

      根據(jù)圖2確定兩個(gè)實(shí)驗(yàn)的特征篩選個(gè)數(shù)N=10,即選擇重要性排名前10的特征集,分別是Span,PS,PD,PV,PH,H,α,A,ENT,V。

      3.2 分類(lèi)對(duì)比實(shí)驗(yàn)

      第1個(gè)對(duì)比試驗(yàn)利用的是美國(guó)舊金山海灣地區(qū)的數(shù)據(jù)。數(shù)據(jù)大小為900×1 024,PauliRGB圖和地面真值圖像如圖3(a)、3(b)所示,其中地面真值圖像的繪制參考了文獻(xiàn)[16]和谷歌地圖。將地物類(lèi)別分為5類(lèi),分別是山地、海洋、城市、植被、有角度城市,城市對(duì)應(yīng)的是普通建筑區(qū)域,有角度城市對(duì)應(yīng)的是高層建筑區(qū)域。

      在實(shí)驗(yàn)中,RF和ADA_RF的決策樹(shù)各設(shè)置為200棵,SVM采用的是徑向基函數(shù)核。訓(xùn)練和測(cè)試數(shù)據(jù)集通過(guò)分層采樣法獲得,二者比例為3∶7,最終分類(lèi)效果如圖3(c)~3(f)所示,分類(lèi)精度與耗時(shí)數(shù)據(jù)如表2所示。

      表2 舊金山地區(qū)數(shù)據(jù)的分類(lèi)精度與耗時(shí)指標(biāo)

      圖3 舊金山地區(qū)數(shù)據(jù)分類(lèi)效果圖

      從分類(lèi)效果和分類(lèi)精度數(shù)據(jù)來(lái)看,本文算法的分類(lèi)精度最高,達(dá)到92.72%。尤其是山地和城區(qū)的精度相比RF和SVM有較大提升。從分類(lèi)效果看,本文算法得到的結(jié)果相比ADA_RF和SVM結(jié)果更加光滑連續(xù),說(shuō)明鄰域投票法可有效抑制相干斑噪聲。由圖3(c)、3(d)可知,RF和SVM在區(qū)分城市建筑物高度問(wèn)題上效果欠佳,而圖3(e)、3(f)表明經(jīng)過(guò)AdaBoost改進(jìn)的隨機(jī)森林可以更好地區(qū)分普通城區(qū)和高建筑物城區(qū)。在算法的耗時(shí)上,RF耗時(shí)最短,因?yàn)锳DA_RF引入了決策樹(shù)權(quán)重的計(jì)算,故相比于RF耗時(shí)有所增加,但本文算法的耗時(shí)小于ADA_RF和SVM耗時(shí)的直接加和,表明特征篩選在減少計(jì)算量上發(fā)揮了作用。

      為進(jìn)一步驗(yàn)證本文算法的有效性,選取Flevoland數(shù)據(jù)進(jìn)行二次驗(yàn)證。數(shù)據(jù)大小為750×1 024,包含15類(lèi)地物,圖4(b)地面真值圖像的繪制參考了文獻(xiàn)[17]和谷歌地圖。分類(lèi)器中RF和ADA_RF的決策數(shù)仍然設(shè)為200棵,訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集通過(guò)分層采樣獲取,比例設(shè)置為3∶7。分類(lèi)結(jié)果如圖4所示,各項(xiàng)分類(lèi)指標(biāo)如表3所示。

      表3 弗萊福蘭地區(qū)數(shù)據(jù)的分類(lèi)精度與耗時(shí)指標(biāo)

      圖4 荷蘭弗萊福蘭地區(qū)數(shù)據(jù)分類(lèi)圖

      從分類(lèi)效果和分類(lèi)精度上看,ADA_RF在分類(lèi)精度上相比于RF和SVM有所提升,分別提升6.71和8.31個(gè)百分點(diǎn)。本文算法又在ADA_RF的基礎(chǔ)上進(jìn)一步提升了分類(lèi)精度,達(dá)到94.68%。由此可以證明ADA_RF算法在提升分類(lèi)精度上具有一定效果,經(jīng)過(guò)鄰域投票法之后可以有效抑制相干斑噪聲,使得分類(lèi)精度進(jìn)一步提升。

      4 結(jié)論

      本文設(shè)計(jì)了一種基于ADA_RF和SVM的二級(jí)分類(lèi)結(jié)構(gòu)。通過(guò)對(duì)舊金山和弗萊福蘭兩個(gè)地區(qū)極化SAR數(shù)據(jù)的實(shí)驗(yàn),結(jié)果表示本文所提算法的分類(lèi)精度高于RF、SVM和ADA_RF。證明了本文算法的有效性,且ADA_RF算法能夠根據(jù)RF中決策樹(shù)的分類(lèi)能力給決策樹(shù)賦予權(quán)重,提升整體分類(lèi)精度,證明特征篩選之后再訓(xùn)練SVM分類(lèi)器能夠減少計(jì)算量與時(shí)間消耗。證明通過(guò)鄰域投票法將兩級(jí)分類(lèi)結(jié)果融合,能夠在保持空間一致性的前提下抑制相干斑噪聲的影響。

      猜你喜歡
      決策樹(shù)極化分類(lèi)器
      認(rèn)知能力、技術(shù)進(jìn)步與就業(yè)極化
      一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
      決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      BP-GA光照分類(lèi)器在車(chē)道線識(shí)別中的應(yīng)用
      雙頻帶隔板極化器
      加權(quán)空-譜與最近鄰分類(lèi)器相結(jié)合的高光譜圖像分類(lèi)
      結(jié)合模糊(C+P)均值聚類(lèi)和SP-V-支持向量機(jī)的TSK分類(lèi)器
      基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
      基于PWM控制的新型極化電源設(shè)計(jì)與實(shí)現(xiàn)
      基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
      曲阜市| 股票| 上杭县| 上犹县| 凤台县| 天台县| 绍兴市| 宜昌市| 鹤壁市| 界首市| 武川县| 安图县| 黄骅市| 宁化县| 安图县| 长寿区| 长子县| 成都市| 宜川县| 水富县| 正镶白旗| 吴忠市| 鄢陵县| 富源县| 禄丰县| 营山县| 吉安县| 海阳市| 罗江县| 焉耆| 正宁县| 兴和县| 久治县| 泰宁县| 甘肃省| 肥东县| 佳木斯市| 磐安县| 庐江县| 团风县| 弥勒县|