• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于K均值聚類的高光譜遙感影像分類研究

      2016-12-26 08:21:17
      地理空間信息 2016年3期
      關(guān)鍵詞:歐氏相似性度量

      趙 潔

      (1.武漢大學(xué) 遙感信息工程學(xué)院,湖北 武漢 430079)

      基于K均值聚類的高光譜遙感影像分類研究

      趙 潔1

      (1.武漢大學(xué) 遙感信息工程學(xué)院,湖北 武漢 430079)

      討論了信息熵和均勻光譜間隔(USS)兩種無監(jiān)督高光譜影像波段選擇方法,分析比較了基于K均值聚類的歐氏距離、相關(guān)系數(shù)以及光譜角3種相似性度量。實(shí)驗(yàn)表明,利用USS對(duì)高光譜影像降維,采用將歐氏距離作為相似性度量的K均值聚類方法進(jìn)行影像分類,所得到的分類結(jié)果精度較高,計(jì)算時(shí)間較短。

      高光譜;無監(jiān)督波段選擇;K均值聚類;相似性度量

      高光譜影像分析是當(dāng)前遙感領(lǐng)域研究的熱點(diǎn),有巨大的潛在價(jià)值,多應(yīng)用于公共安全、軍事偵察、土地使用狀況調(diào)查等領(lǐng)域。高光譜影像通常含有200 多 個(gè)在光譜段上非常窄且連續(xù)的波段,這些波段包括可見光、近紅外、中紅外、熱紅外等,每個(gè)像素都可以獲得一條連續(xù)的光譜曲線[1];相比其他遙感影像包含了更多的光譜信息以及空間信息。高光譜影像具有較高的光譜分辨率,更容易對(duì)地物進(jìn)行分辨,可應(yīng)用于精細(xì)土地覆蓋與土地利用制圖,與此同時(shí),較高的光譜分辨率伴隨著巨大的數(shù)據(jù)量,造成的數(shù)據(jù)冗余也為高光譜圖像處理帶來困難,高維數(shù)據(jù)也很容易導(dǎo)致Hughes現(xiàn)象[2,3]的產(chǎn)生。因此波段選擇是高光譜影像分類前必不可少的步驟。波段選擇總體上分為無監(jiān)督波段選擇與監(jiān)督波段選擇兩類[4],無監(jiān)督波段選擇無需先驗(yàn)知識(shí),可以自動(dòng)完成[5]。在影像分類方法中,K均值聚類是一種簡單有效的非監(jiān)督分類方法,分類結(jié)果較好,被廣泛應(yīng)用到圖像分割、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域。本文利用K均值聚類進(jìn)行高光譜影像分類,并對(duì)3種不同的相似性度量進(jìn)行對(duì)比分析。

      1 高光譜影像分類原理

      高光譜數(shù)據(jù)本身具有數(shù)據(jù)量大、維度高、混合像元等特點(diǎn),影像分類處理過程包括數(shù)據(jù)降維(波段選擇)、數(shù)據(jù)去噪以及影像分類。

      1.1 無監(jiān)督波段選擇

      從對(duì)象信息可用性的角度來看,波段選擇可以分為監(jiān)督波段選擇與無監(jiān)督波段選擇。監(jiān)督波段選擇需要已知的先驗(yàn)知識(shí)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,可以明確地選擇包含重要對(duì)象信息的波段,相比無監(jiān)督波段選擇,監(jiān)督波段選擇能得到更好的檢測或分類。而無監(jiān)督波段選擇不需要任何的對(duì)象信息,可以實(shí)現(xiàn)快速、自動(dòng)的波段選擇。當(dāng)先驗(yàn)知識(shí)未知時(shí),可以利用無監(jiān)督的方法進(jìn)行波段選擇,無監(jiān)督波段選擇較少甚至不需要進(jìn)行圖像預(yù)處理。無監(jiān)督波段選擇有多種方法,如信息熵、USS、光譜相關(guān)系數(shù)、一階光譜微分、二階光譜微分、主成分分析排序等。本文主要討論信息熵和USS兩種波段選擇方法。

      1)信息熵的概念由數(shù)學(xué)家Claude Shannon在1948 年提出,解決了對(duì)信息的量化度量問題。該方法需要對(duì)每個(gè)波段分別估計(jì)信息熵[6,7],信息熵定義為:

      式中,H是信息熵;p是一個(gè)高光譜波段反射率的概率密度函數(shù);m是不同的反射率的數(shù)量。概率可以根據(jù)反射率的直方圖計(jì)算得到。通常H越大,則數(shù)據(jù)所含的信息越多;反之,所含信息越少[8]。

      2)USS也是一種有效的波段選擇方法。由于高光譜影像所含的光譜信息較多,相鄰波段之間有較大的相關(guān)性,需要對(duì)數(shù)據(jù)進(jìn)行篩選從而獲得含有較高獨(dú)特信息量的部分波段,降低各個(gè)波段之間的相關(guān)性,提高數(shù)據(jù)分析的效率。USS方法通過控制步長選擇出間隔均勻、相關(guān)性低、信息量大的少量波段,從而達(dá)到降維的目的。

      1.2K均值聚類算法

      K均值聚類可以將數(shù)據(jù)自動(dòng)劃分為K組[9,10],通過選擇初始聚類中心,再反復(fù)迭代確定最終分組。整體流程為:①每一個(gè)元素按照一定的選擇標(biāo)準(zhǔn)被劃分到最近的聚類中心;②計(jì)算每個(gè)聚類的平均值;③每個(gè)聚類中心將會(huì)被新的平均值代替,作為新的聚類中心;④重復(fù)步驟②~③。

      從理論上講,當(dāng)聚類中心不再發(fā)生變化,以上迭代將停止,所有的元素都被分到對(duì)應(yīng)的類別中。在實(shí)際計(jì)算過程中,需要選擇一個(gè)極小的閾值來結(jié)束K均值聚類計(jì)算,即當(dāng)新的聚類中心與前一個(gè)聚類中心的“距離”小于這個(gè)閾值,迭代終止?!熬嚯x”則是一種選擇標(biāo)準(zhǔn),即相似性度量。然而在實(shí)際操作中,K均值聚類的結(jié)果容易被信號(hào)中的噪聲影響,聚類結(jié)果精度將降低。此外,K均值聚類的結(jié)果還與聚類初始中心有關(guān),因此在本文中,將采取相同的初始聚類中心進(jìn)行實(shí)驗(yàn)。

      1.3 相似性度量

      相似性度量是一種便于量化的評(píng)價(jià)標(biāo)準(zhǔn),K均值聚類可以使用多種不同的相似性度量來判斷新聚類中心的位置,例如曼哈頓距離(L1 norm)、歐氏距離(L2 norm)、相關(guān)系數(shù)、光譜角(spectral angle mapper)。本文選擇歐氏距離、相關(guān)系數(shù)以及光譜角這3種不同的相似性度量進(jìn)行比較分析。

      1)歐氏距離是一種最常見的距離度量。在二維和三維空間中,歐氏距離是一個(gè)可以用尺子測量的兩個(gè)點(diǎn)之間的“普通”距離,并可以由此推廣到n維空間。通常來說,對(duì)于一個(gè)n維空間,點(diǎn)p(p1,p2,…,pi,…,pn)與點(diǎn)q(q1,q2,…,qi,…,qn)之間的距離為:

      歐氏距離可以看作兩個(gè)點(diǎn)之間的相似程度,距離越近,相似度越高;反之,相似度越低。因此通過比較歐氏距離的大小,選擇出歐氏距離最小時(shí)某一點(diǎn)所屬空間,并將其分配到這一空間,從而完成聚類。

      2)相關(guān)系數(shù)是反映兩個(gè)變量之間關(guān)系密切程度的統(tǒng)計(jì)指標(biāo)。相關(guān)系數(shù)通常被用來描述一個(gè)矢量X(x1,x2,…,xi,…,xn)與另一個(gè)矢量Y(y1,y2,…,yi,…,yn)之間的關(guān)系:

      相關(guān)系數(shù)越大,說明矢量X與矢量Y的相似程度越高;反之,則相似程度越低。在K均值聚類的計(jì)算中,需要將像素矢量X與k個(gè)聚類中心的矢量Y1,Y2,Y3,…,Yk進(jìn)行相關(guān)系數(shù)計(jì)算,分別得到k個(gè)相關(guān)系數(shù)。當(dāng)與矢量Yp(p=1,…,k)的相關(guān)系數(shù)最大時(shí),該像素矢量X則被分類到聚類p中。

      3)光譜角是像素矢量和平均類矢量之間的夾角。通過光譜角分類器,可以直接將影像某個(gè)像素的光譜與一個(gè)已知的光譜或者端元進(jìn)行比較,有效區(qū)分出每個(gè)像素的光譜曲線,已知光譜通常是在實(shí)驗(yàn)室或在現(xiàn)場用光譜儀測量所得[11]。這種方法將兩個(gè)(未知和已知)光譜作為載體,計(jì)算它們之間的光譜角,通常作為確定礦物的首選方法,且在同類區(qū)域中可獲得較好的結(jié)果。將各個(gè)像素的光譜視為一個(gè)矢量并將其投影到n維空間中,其中空間的維度等于波段數(shù)。光譜角θ為:

      式中,vi為像素矢量;mi為第i類的平均矢量。光譜角θ越小,說明該光譜與已知光譜越相似;反之,則說明該光譜與已知光譜相似性越低。因此可以通過選擇最小的光譜角來確定影像像素分類。光譜角分類器對(duì)照明因素不敏感[12]。

      2 實(shí)驗(yàn)與分析

      高光譜數(shù)據(jù)包含大量的光譜信息,光譜波段數(shù)量通常在200以上,并包括高噪聲的混合像素,因此首先進(jìn)行影像波段的選擇實(shí)驗(yàn)。本文分別選取信息熵、USS兩種方法進(jìn)行波段選擇實(shí)驗(yàn),目的是尋找有效的波段選擇方法;再采用歐氏距離、相關(guān)系數(shù)以及光譜角3種不同相似性度量,進(jìn)行基于 K均值聚類的影像分類實(shí)驗(yàn),分析不同的相似性度量對(duì)影像分類精度的影響。實(shí)驗(yàn)流程如圖1所示。

      2.1 實(shí)驗(yàn)數(shù)據(jù)

      圖1 實(shí)驗(yàn)流程

      本文所用實(shí)驗(yàn)數(shù)據(jù)為覆蓋美國加利福尼亞州薩利納斯的AVIRIS數(shù)據(jù),影像大小為512×217,分辨率為3.7 m。AVIRIS數(shù)據(jù)有224個(gè)波段,去除20個(gè)水吸收波段([108-112],[154-167],224)后,剩余204個(gè)波段可用。此影像地物類型包括蔬菜、裸露的土壤和葡萄園的土地等16類地物,如表1所示,地面真實(shí)地物分類如圖2所示。

      表1 薩利納斯場景地面真實(shí)分類及其樣本數(shù)

      圖2 地面真實(shí)地物分類

      2.2 波段選擇實(shí)驗(yàn)

      高光譜影像有大量的光譜信息,同時(shí)也含有大量的噪聲,因此,在本文的實(shí)驗(yàn)中,為了得到更好的影像分類結(jié)果,首先進(jìn)行人工去噪,刪除明顯含有大量噪聲的波段,部分噪聲波段如圖3所示。人工篩選后,剩余177個(gè)可用波段。在此基礎(chǔ)上,選擇了兩種不同的方法進(jìn)行波段選擇,然后利用最大似然分類(監(jiān)督分類)對(duì)所選出的波段進(jìn)行分類,實(shí)驗(yàn)結(jié)果如表2所示。

      圖3 高噪聲波段

      表2 不同波段選擇方法的分類結(jié)果

      根據(jù)上述實(shí)驗(yàn)分析,得到以下結(jié)論:

      1)從表2可以看出,USS的總體精度與Kappa系數(shù)均高于信息熵的結(jié)果。USS波段選擇方法較信息熵能夠更好地選擇出具有獨(dú)特信息的波段且進(jìn)行影像分類的計(jì)算時(shí)間較短,分類精度較高。

      2)分類所用的波段數(shù)將對(duì)計(jì)算結(jié)果產(chǎn)生較大的影響。對(duì)于信息熵,用的波段越多,分類精度越高。但是當(dāng)波段數(shù)大于30后,分類精度相對(duì)穩(wěn)定,不會(huì)隨著波段數(shù)的增加而有較多提高。

      3)去除壞波段(高噪聲)可以略微提高分類精度,并且減少較多的計(jì)算時(shí)間。

      2.3 K均值聚類實(shí)驗(yàn)

      在波段選擇實(shí)驗(yàn)的基礎(chǔ)上,利用USS方法選取35 個(gè)波段,對(duì)其進(jìn)行K均值聚類影像分類實(shí)驗(yàn)。分別選擇歐氏距離、相關(guān)系數(shù)以及光譜角作為相似性度量進(jìn)行K均值聚類,得到的影像分類結(jié)果如圖4所示,影像分類精度如表3所示。

      圖4 影像分類結(jié)果

      表3 3個(gè)不同的相似性度量的精度

      根據(jù)表3和圖4的分類結(jié)果,可以得到以下結(jié)論:

      1) 根據(jù)分類結(jié)果的精度,K均值聚類為非監(jiān)督分類,整體精度弱于監(jiān)督分類,其中歐氏距離的效果比相關(guān)系數(shù)和光譜角好,光譜角的分類精度是這3種方法中最低的。

      2)比較3種方法的計(jì)算時(shí)間,歐氏距離所需要的計(jì)算時(shí)間最少,可以最快地得到分類結(jié)果,光譜角耗時(shí)最多。

      3)根據(jù)圖4可以看出這3種方法對(duì)于不同地物的分類精度有所不同。歐氏距離、相關(guān)系數(shù)以及光譜角均可將第1類、第4類與第9類地物較為完整地分類;而對(duì)于第3類、第8類、第15類以及第16類地物,3 種方法均不能進(jìn)行有效分類;對(duì)于第10類與第12類地物,歐氏距離作為相似性度量的分類結(jié)果明顯較好;對(duì)于第11類地物,相關(guān)系數(shù)作為相似性度量的分類結(jié)果較好;對(duì)于第6類地物,光譜角作為相似性度量的分類結(jié)果較好。由此可知,基于K均值聚類的分類方法進(jìn)行影像分類時(shí),3種不同的相似性度量對(duì)不同地物的分類效果具有一定的選擇性。

      4)3種不同的相似性度量中,采用歐氏距離作為相似性度量進(jìn)行影像分類最有效、精度最高;利用光譜角的分類效果差且耗時(shí)最長。針對(duì)各個(gè)種類的地物,選擇不同的相似性度量所得到的分類結(jié)果不同。

      3 結(jié) 語

      本文在討論兩種無監(jiān)督高光譜影像波段選擇方法的基礎(chǔ)上,分析比較了基于K均值聚類的3種相似性度量。實(shí)驗(yàn)表明,本文所采用的兩種無監(jiān)督波段選擇方法中,USS能夠較好地選擇出具有獨(dú)特信息的波段,對(duì)高光譜影像進(jìn)行有效降維,且方法簡單、計(jì)算簡便;利用3種不同的相似性度量進(jìn)行K均值聚類影像分類實(shí)驗(yàn)表明,將歐氏距離作為相似性度量,能夠取得相對(duì)較好的分類精度,且性能優(yōu)于其他的方法。

      [1] 劉雪松,葛亮,王斌,等.基于最大信息量的高光譜遙感圖像無監(jiān)督波段選擇方法[J].紅外與毫米波學(xué)報(bào),2012,31(2):166-170

      [2] Hughes G P. On the Mean Accuracy of Statistical Pattern Recognizers[J].IEEE Transactions on Information Theory, 1968,14(1):55-63

      [3] 楊諸勝,郭雷,羅欣,等.一種基于主成分分析的高光譜圖像波段選擇算法[J].微電子學(xué)與計(jì)算機(jī),2007,23(12):71-74

      [4] Lee J H,Kim Y S,Lee D,et al. Robust CCD and IR Image Registration Usinggradient-based Statistical Information[J]. IEEE Signal Processing Letters,2010,17(4):347-350

      [5] He Y,Qian D. Fast Band Selection for Hyperspectral Imagery[C]. IEEE 17th International Conference on Parallel and Distributed Systems (ICPADS),Tainan,2011

      [6] Bajcsy P,Groves P.Methodology for Hyperspectral Band Selection[J]. Photogrammetric Engineering and Remote Sensing,2004,70(7):793-802

      [7] Russ J C. The Image Processiong Handbook[M].New York: CRC Press,2011

      [8] Bajwa S,Bajcsy P,Groves P,et al. Hyperspectral Image Data Mining for Band Selection in Agricultural Applications[J]. Transactions-american Society of Agricultural Engineers,2004, 47(3): 895-908

      [9] Macqueen J B. Some Methods for Classification and Analysis of Multivariate Observations[J].In Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability,1967,1(14): 281-297

      [10] Wagstaff K,Cardie C,Rogers S,et al. Constrained K-means Clustering with Background Knowledge[J].Proceedings of the ICML,2001(1):577-584

      [11] Sohn Y,Rebello N S.Supervised and Unsupervised Spectral Angle Classifiers[J]. Photogrammetric Engineering and Remote Sensing,2002,68(12):1 271-1 282

      [12] Lv Z,Yu X,Zhang Z,et al.Automatic Remote Sensing Image Classification Method Based on Spectral Angle and Spectral Distance[C]. IEEE International Geoscience and Remote Sensing Symposium (IGARSS), Melbourne,2013

      P237

      B

      1672-4623(2016)03-0026-04

      10.3969/j.issn.1672-4623.2016.03.009

      趙潔,碩士,研究方向?yàn)閿z影測量與遙感。

      2015-12-15。

      猜你喜歡
      歐氏相似性度量
      有趣的度量
      一類上三角算子矩陣的相似性與酉相似性
      模糊度量空間的強(qiáng)嵌入
      淺析當(dāng)代中西方繪畫的相似性
      迷向表示分為6個(gè)不可約直和的旗流形上不變愛因斯坦度量
      低滲透黏土中氯離子彌散作用離心模擬相似性
      地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
      基于多維歐氏空間相似度的激光點(diǎn)云分割方法
      麗江“思奔記”(上)
      探索地理(2013年5期)2014-01-09 06:40:44
      V4國家經(jīng)濟(jì)的相似性與差異性
      介休市| 剑阁县| 宁阳县| 湖州市| 那坡县| 花莲市| 黔东| 尖扎县| 武城县| 布尔津县| 仲巴县| 西乌| 宁国市| 青铜峡市| 汨罗市| 宁陕县| 沾益县| 金平| 绥棱县| 准格尔旗| 黄骅市| 廉江市| 贵德县| 民勤县| 台山市| 连城县| 盐池县| 临泽县| 奇台县| 南汇区| 沽源县| 巫溪县| 射阳县| 本溪市| 舞钢市| 沙坪坝区| 呼图壁县| 西贡区| 融水| 福建省| 芜湖县|