錢成越
利用遙感影像對土地利用現(xiàn)狀調(diào)查具有十分重要的現(xiàn)實意義,本文從統(tǒng)計模式識別的角度出發(fā),將多波段遙感影像像元的各波段分量值作為待分類樣本,利用ISODATA算法進行迭代動態(tài)聚類。多波段影像豐富的波譜信息,從多個角度反映了圖像中的物體特征。同時ISODATA算法屬于一種動態(tài)聚類算法,可在迭代過程中實時對參數(shù)進行調(diào)整,在保證分類精度的同時具有良好的適應(yīng)性與靈活性,適合運用于復雜的遙感圖像自動分類處理。
ISODATA是一種遙感圖像非監(jiān)督分類法,全稱“迭代自組織數(shù)據(jù)分析技術(shù)”(Iterative Self-Organizing Data Analysis Technique)[1]。ISODATA算法運用數(shù)學方法研究和處理所給定對象的分類,認為同類事物在屬性空間上具有緊致集的特點。以隨機樣本或指定樣本作為初始的聚類中心,將其作為“種子”,依據(jù)最小光譜距離方程進行自動迭代聚類。在兩次迭代之間對上一次迭代的聚類結(jié)果進行統(tǒng)計分析,根據(jù)統(tǒng)計參數(shù)對已有類別進行取消、分裂、合并處理,并繼續(xù)進行下一次迭代,直至超過最大迭代次數(shù)或者滿足分類參數(shù),完成分類過程。
ISODATA算法加入了人機對話環(huán)節(jié),可在迭代過程中調(diào)整參數(shù),從而動態(tài)實時的控制聚類結(jié)果。其主要參數(shù)如下:K,預(yù)期的聚類中心數(shù);θN,一個類別應(yīng)具有的最少樣本數(shù)目,如小于此值就不作為一個獨立的聚類;θS,一個類別樣本標準差閾值;θC,聚類中心之間距離的閾值,即歸并系數(shù),如小于此值則將兩類樣本合并;L,每次迭代中可以歸并類數(shù)的最多對數(shù);I,允許迭代的最多次數(shù)。在類別的分裂過程中,引入一新的參數(shù)m,用于控制分裂時每一個新聚類中心獲得的標準差權(quán)重,稱為分裂系數(shù)??赏ㄟ^人工設(shè)定,也可采用迭代過程的統(tǒng)計結(jié)果由系統(tǒng)默認。
1)對于N個模式樣本的集合,確定C個初始聚類中心Z1,Z2,…,ZC,其中,C不一定等于K。這些聚類中心可為模式集合中的任意樣本。設(shè)定聚類分析的控制參數(shù),即上述的6個參數(shù)指標,已將N個模式樣本按指標分配到各個聚類中心。2)計算各類中諸樣本的距離指標函數(shù),按照最小光譜距離方程進行各樣本的分類。3)按給定的要求,將前一次獲得的聚類集進行分裂和合并處理。類分裂:同一類中樣本的分布過于密集或者類的數(shù)目太少,這說明空間上存在著更多的集群中心,因此需要進行該類的分裂處理,可以通過設(shè)置類內(nèi)各樣本分布標準差上限來實現(xiàn)分裂操作。類合并:兩類樣本類間距離過小,說明兩類樣本相關(guān)性較強,因此需要進行合并處理,可以通過設(shè)置類間距離下限來實現(xiàn)合并操作。通過上述操作獲得新的聚類中心。4)重新進行迭代運算,計算各項指標,判斷聚類結(jié)果是否符合要求。經(jīng)過多次迭代后,若結(jié)果收斂,或達到最大迭代次數(shù),則運算結(jié)束。
算法流程圖見圖1。
對24位BM P格式的TM影像進行處理。
通過分類前后影像的對比,TM影像分類效果較好,房屋、道路、綠地、土壤均較為清晰地識別。分類后影像右上部分屋頂由于材質(zhì)與道路相同,均為混凝土,導致錯分。
采用ERDAS IMAGING軟件Accuracy Assessment對分類結(jié)果進行精度評定,如表1所示。
表1 分類結(jié)果精度評定表
從數(shù)據(jù)可以看出,影像的分類效果精度較為理想,可以滿足一定要求的土地調(diào)查工作或完成數(shù)據(jù)的初始處理。
為提高分類的精度,可從圖像預(yù)處理和結(jié)合其他算法兩方面進行改進,從而較好的滿足土地調(diào)查工作的要求。
預(yù)處理的主要目的是要消除對動態(tài)聚類影響較大的噪聲。在實際實現(xiàn)的過程中,若待分類影像受噪聲污染嚴重,則會造成分割過度或者誤分割。因此,在影像展好之前先進行濾波,消除圖像中的椒鹽噪聲和白噪聲,特別是椒鹽噪聲,盡量減少噪聲對分類的影響。濾波的方法很多,如中值濾波、均值濾波等。
ISODATA算法實際上只考慮到同類像元在光譜特征上的高度相似性,對類內(nèi)像元相似度很高、類間差異較大的圖像具有較好的效果。然而未能充分利用同類像元在空間上的相關(guān)性,因而在地物類別信息復雜的情況下效果不理想。為此,可配合使用其他算法。如使用梯度算子設(shè)定初始聚類中心[3],利用神經(jīng)網(wǎng)絡(luò)算法[4]尋找類別邊界。應(yīng)充分發(fā)掘影像中所蘊含的空間與光譜信息,將二者結(jié)合使用。
本文從統(tǒng)計模式識別的角度出發(fā),分析了ISODATA算法的原理,將其運用于遙感影像的土地利用狀況調(diào)查,并對結(jié)果進行分析。對于類別差異明顯的遙感影像,ISODATA可滿足需求;若需處理復雜的任務(wù),仍需進一步加強改進。
[1]舒 寧,馬洪超,孫和利.模式識別的理論與方法[M].武漢:武漢大學出版社,2004:69-70.
[2]何 霽,滕奇志,羅代升,等.一種改進的 ISODATA算法及在彩色熒光圖像中的應(yīng)用[J].四川大學學報(自然科學版),2007,44(3):563-565.
[3]賈永紅.數(shù)字圖像處理[M].武漢:武漢大學出版社,2003:134-136.
[4]王 玲,龔健雅.一種基于自適應(yīng)諧振理論的TM遙感影像神經(jīng)網(wǎng)絡(luò)分類器[J].測繪科學,2003,28(3):39-42.