李 玉 胡海峰 趙雪梅 趙泉華
(遼寧工程技術(shù)大學(xué)遙感科學(xué)與應(yīng)用研究所,遼寧阜新 123000)
聚類分割算法實(shí)質(zhì)是利用圖像各像素光譜測(cè)度在特征空間自然聚類的性質(zhì),將表征不同地物的像素進(jìn)行歸并,保證其分割結(jié)果中同一地物類別內(nèi)像素光譜測(cè)度相似性盡可能大,不同地物類別間像素光譜測(cè)度相似性盡可能小[1]。該方法原理簡(jiǎn)單、可拓展性強(qiáng)、計(jì)算速度快,因此廣泛應(yīng)用于遙感圖像分割中。目前,較為常用的聚類分割算法主要包含以下幾種類型:K-means聚類[2-3]、層次聚類[4-5]、模糊聚類[6-7]、譜聚類[8-9]等分割算法。
K-means聚類分割算法是基于距離的動(dòng)態(tài)聚類硬劃分方法。以數(shù)據(jù)點(diǎn)到聚類中心距離平方和最小為準(zhǔn)則,迭代更新聚類中心直至滿足約束條件。該算法簡(jiǎn)單高效,但對(duì)初始聚類中心敏感,隨機(jī)選取其初值易導(dǎo)致聚類結(jié)果不穩(wěn)定。文獻(xiàn)[10]在HLS顏色空間提取圖像目標(biāo)分類區(qū)域顏色的統(tǒng)計(jì)值作為初始聚類中心,同時(shí)通過(guò)加權(quán)數(shù)據(jù)點(diǎn)到聚類中心的距離提高像素劃分的準(zhǔn)確性,進(jìn)而得到較傳統(tǒng)K-means聚類分割算法更加理想的分割結(jié)果。然而,表征不同地物的像素光譜測(cè)度在特征空間存在一定程度的重疊,采用距離預(yù)測(cè)像素類別只能將具有相同測(cè)度值的像素劃分到同一類別中,因此,基于K-means的硬劃分算法不適合特征空間中具有不同尺度、非球形分布的數(shù)據(jù)處理。
層次聚類分割方法可分為凝聚和分裂兩種層次聚類,亦屬于硬劃分算法。前者視每一數(shù)據(jù)點(diǎn)為一聚類,計(jì)算聚類間鄰近度,并合并最接近聚類,直至滿足終止條件;后者視所有原始數(shù)據(jù)為同一聚類,并按照一定準(zhǔn)則迭代細(xì)分前次聚類,直至滿足約束條件。該類算法簡(jiǎn)單直觀、適合任意分布的數(shù)據(jù)處理,但對(duì)噪聲敏感,同時(shí)該過(guò)程不可逆,即分裂或合并后無(wú)法回到原始狀態(tài),因此無(wú)法修正前次錯(cuò)誤。對(duì)此研究人員將層次聚類與其他聚類算法結(jié)合提出改進(jìn)層次聚類算法。如,文獻(xiàn)[11]定義全局目標(biāo)函數(shù)作為聚類合并的準(zhǔn)則,實(shí)現(xiàn)合并過(guò)程的可逆性。然而,過(guò)度的分裂或合并過(guò)程,極大地增加了算法的冗余度,進(jìn)而限制了其對(duì)大數(shù)據(jù)處理的能力。
模糊聚類分割算法允許每個(gè)像素點(diǎn)隸屬于所有類別,并用隸屬度函數(shù)表征其隸屬程度,在一定程度上解決像素類屬不確定性問(wèn)題,是一種軟劃分算法。該類算法使用隸屬度函數(shù)、非相似性測(cè)度及帶有約束條件的懲罰項(xiàng)構(gòu)建目標(biāo)函數(shù),形式靈活且易于引入約束條件。目前,主要通過(guò)添加相似度量懲罰項(xiàng)和模糊隸屬度懲罰項(xiàng)作為約束條件調(diào)整圖像像素歸屬。文獻(xiàn)[12]通過(guò)定義包含空間信息和鄰域信息的模糊要素增強(qiáng)對(duì)噪聲和異常值的魯棒性,進(jìn)而提出模糊局部信息C均值聚類(Fuzzy Local Information C-Means clustering, FLICM)算法。文獻(xiàn)[13]將KL(Kullback-Lerbler)信息引入模糊目標(biāo)函數(shù)中,提出KL信息FCM(KL information FCM,KLFCM)算法,進(jìn)而有效約束算法的聚類尺度,提高分割精度。但該算法采用歐氏距離衡量像素光譜測(cè)度與聚類的差異程度,對(duì)聚類尺度、形狀、噪聲和異常值均較為敏感。為了準(zhǔn)確衡量特征空間中像素光譜測(cè)度與聚類的差異,文獻(xiàn)[14]在KLFCM算法基礎(chǔ)上以高斯分布的負(fù)對(duì)數(shù)定義非相似性測(cè)度,提出HMRF-FCM算法,有效提高了算法對(duì)聚類的識(shí)別能力以及對(duì)噪聲和異常值的魯棒性。文獻(xiàn)[15]在HMRF-FCM算法基礎(chǔ)上,引入特征場(chǎng)鄰域模型,結(jié)合特征場(chǎng)和標(biāo)號(hào)場(chǎng)鄰域構(gòu)建包含雙鄰域的模糊聚類模型,進(jìn)一步提高了算法對(duì)噪聲和異常值的魯棒性。該類算法通過(guò)添加懲罰項(xiàng)作為約束條件,利用迭代最優(yōu)化方法尋求最優(yōu)解,但往往陷入局部最優(yōu),無(wú)法保證收斂到全局最優(yōu)解。
譜聚類分割算法將聚類問(wèn)題轉(zhuǎn)化為無(wú)向圖的最優(yōu)劃分問(wèn)題。首先,通過(guò)建立圖模型表達(dá)原始數(shù)據(jù),構(gòu)建無(wú)向圖;而后,定義并優(yōu)化劃分準(zhǔn)則,獲取全局最優(yōu)解。文獻(xiàn)[16]采用不同尺度參數(shù)及隨機(jī)采樣的基于Nystrom逼近的譜聚類算法獲得多種分割結(jié)果,并利用非負(fù)矩陣分解方法合并多種分割結(jié)果,獲得較理想的分割結(jié)果。文獻(xiàn)[17]引入Levin’s Affinity的權(quán)函數(shù)建立相似矩陣構(gòu)造無(wú)向圖,在此基礎(chǔ)上采用線性映射實(shí)現(xiàn)數(shù)據(jù)降維,而后采用傳統(tǒng)聚類分割算法實(shí)現(xiàn)圖像分割。該類算法首先將高維數(shù)據(jù)降維,而后通過(guò)傳統(tǒng)聚類分割算法分割低維數(shù)據(jù),其分割過(guò)程本質(zhì)仍為傳統(tǒng)聚類分割算法,且圖模型建立及分解過(guò)程增加了該類算法時(shí)間成本。
仿生模式識(shí)別依據(jù)同類樣本在特征空間連續(xù)性分布的特性,利用多個(gè)同一幾何形體覆蓋每一類學(xué)習(xí)樣本,以樣本最佳覆蓋為準(zhǔn)則,實(shí)現(xiàn)監(jiān)督分類[18]。為了充分利用圖像各目標(biāo)像素光譜測(cè)度在RGB特征空間中呈現(xiàn)橢球形分布的性質(zhì),提高算法對(duì)地物目標(biāo)的識(shí)別能力,在RGB特征空間中將相似度較大的像素劃分到同一聚類中。
本文類比仿生模式識(shí)別方法中“香腸模型”[19],采用橢球體包裹圖像各類別目標(biāo)主體,無(wú)需訓(xùn)練樣本,實(shí)現(xiàn)圖像自動(dòng)化聚類分割。尋找包裹各類目標(biāo)主體的最優(yōu)橢球?qū)嵸|(zhì)是確定橢球球心、三主軸方向及對(duì)應(yīng)長(zhǎng)度的過(guò)程。鑒于橢球體內(nèi)特征點(diǎn)集各主成分方向與橢球主軸方向一致,利用主成分分析計(jì)算樣本數(shù)據(jù)各主成分方向作為橢球體三主軸方向,并以樣本數(shù)據(jù)均值作為橢球球心構(gòu)建橢球體,而后擴(kuò)充樣本數(shù)據(jù)并不斷更新橢球位置、姿態(tài)和形狀,以尋找最優(yōu)橢球。而后利用“交叉覆蓋法”[20],即刪除當(dāng)前橢球內(nèi)特征點(diǎn),對(duì)余下特征點(diǎn)尋求下一目標(biāo)主體最優(yōu)橢球,如此交叉覆蓋,直至各目標(biāo)主體特征點(diǎn)全部被刪除為止,最終實(shí)現(xiàn)圖像粗分割。進(jìn)一步利用圖像空間的鄰域關(guān)系,填充粗分割結(jié)果中未被橢球包裹的表征噪聲和異常值的空洞區(qū)域,得到最終分割結(jié)果。
假設(shè)各類別目標(biāo)主體在RGB特征空間呈橢球形分布,為了有效區(qū)別不同地物,采用橢球體包裹各目標(biāo)主體。已知橢球球心及三個(gè)主軸的方向和長(zhǎng)度即可確定橢球位置和姿態(tài),因此包裹各目標(biāo)主體實(shí)際上是尋找橢球體球心、三個(gè)主軸最優(yōu)方向及對(duì)應(yīng)長(zhǎng)度的過(guò)程。對(duì)橢球而言,球內(nèi)變化最大的方向?yàn)槠渥铋L(zhǎng)的主軸方向,其次為與最長(zhǎng)主軸垂直的次長(zhǎng)主軸方向,再次為與上述兩主軸垂直的第三主軸方向。對(duì)特征點(diǎn)集而言,其第一主成分為特征點(diǎn)集方差變化最大的方向,第二主成分為特征點(diǎn)集方差變化次大的方向,第三主成分為特征點(diǎn)集方差變化第三大的方向。為了更好的包裹目標(biāo)主體,橢球內(nèi)特征點(diǎn)集的變化方向應(yīng)與橢球各主軸的方向一致,即第一主成分方向?qū)?yīng)橢球最長(zhǎng)主軸方向,第二主成分方向?qū)?yīng)橢球次長(zhǎng)主軸方向,第三主成分方向?qū)?yīng)橢球第三主軸方向。因此,可利用主成分分析計(jì)算樣本數(shù)據(jù)第一到第三主成分方向,將其視為橢球體的三個(gè)主軸方向,并以樣本數(shù)據(jù)均值作為橢球球心構(gòu)建橢球體。隨著樣本數(shù)據(jù)逐漸增加,其各主成分方向逐漸逼近目標(biāo)主體主成分方向,當(dāng)樣本數(shù)據(jù)趨于穩(wěn)定,此時(shí)確定的橢球體即為最優(yōu)橢球(如圖1(d)所示)。具體操作如下:
為了準(zhǔn)確定位并包裹目標(biāo)主體,首先隨機(jī)選取一個(gè)特征點(diǎn)作為代表點(diǎn),并計(jì)算RGB特征空間中與該代表點(diǎn)最近的m個(gè)特征點(diǎn)作為初始樣本數(shù)據(jù)(本文m=100)。由于RGB特征空間中,目標(biāo)主體具有顯著的聚集性,而噪聲和異常值分布較為稀疏。為了保證樣本數(shù)據(jù)為某一類別主體的子集而非噪聲或異常值,當(dāng)其方差小于給定閾值時(shí),則接受樣本數(shù)據(jù),否則需重新初始化該代表點(diǎn)。而后,以樣本數(shù)據(jù)幾何中心為球心,以樣本數(shù)據(jù)在各主成分方向投影的最短距離為直徑,初始化球體。并在此基礎(chǔ)上沿樣本主成分方向?qū)⒊跏记蝮w拓展為橢球體,并將橢球內(nèi)特征點(diǎn)視為新的樣本數(shù)據(jù),直至包裹該類目標(biāo)主體。假設(shè)當(dāng)前橢球內(nèi)有n個(gè)樣本數(shù)據(jù),該樣本數(shù)據(jù)可表示為,
(1)
其中,xjl(τ)為第j類第l個(gè)像素的測(cè)度,j為聚類索引,τ為橢球拓展次數(shù)索引,l為當(dāng)前橢球下隸屬于第j類的像素索引。則樣本數(shù)據(jù)均值矢量可計(jì)算為,
(2)
其協(xié)方差矩陣為,
(3)
圖1 合成圖像及像素顏色在RGB特征空間的分布圖Fig.1 Synthetic image and distribution diagram of pixels in the RGB color feature space
(4)
(5)
此時(shí),橢球可表示為,
(6)
(7)
沿橢球三個(gè)主軸方向拓展后,重新計(jì)算樣本數(shù)據(jù)幾何中心作為橢球球心,三個(gè)主成分方向作為橢球體三個(gè)主軸方向,并將延長(zhǎng)后的主軸長(zhǎng)度作為新的主軸長(zhǎng)度,構(gòu)建新的橢球體。因新橢球體球心位置及各主軸方向和長(zhǎng)度的變化,使得部分特征點(diǎn)轉(zhuǎn)換為樣本數(shù)據(jù)、部分樣本數(shù)據(jù)轉(zhuǎn)換為未被包裹的特征點(diǎn)。在步長(zhǎng)較小的前提下,新橢球所包裹的特征點(diǎn)與樣本數(shù)據(jù)中特征點(diǎn)差異較小,這種差異可以忽略不計(jì)。掃描過(guò)程中通過(guò)不斷重新計(jì)算樣本數(shù)據(jù)主成分方向,逐漸調(diào)整橢球方向及大小,使其逼近目標(biāo)主體。當(dāng)橢球體各主軸方向及長(zhǎng)度不再改變時(shí),停止掃描,此時(shí),樣本數(shù)據(jù)即為目標(biāo)主體。完成一類目標(biāo)主體的掃描后,在不考慮該類目標(biāo)主體的情況下,重新掃描下一類目標(biāo)主體,設(shè)圖像聚類數(shù)為C,直至所有C個(gè)目標(biāo)主體均被識(shí)別出來(lái)。此時(shí),特征空間中表示不同類別的特征點(diǎn)被有效區(qū)分開(kāi)來(lái),只余下一部分噪聲和異常值。
圖2 掃描過(guò)程示意圖Fig.2 Scanning process diagram
為了清晰地表現(xiàn)算法掃描數(shù)據(jù)過(guò)程,選取部分具有代表性的掃描結(jié)果列于圖2。其中,圖2(a)為RGB空間特征點(diǎn)分布圖,圖2(b)~(d)為掃描過(guò)程中區(qū)域Ⅰ目標(biāo)主體的識(shí)別情況,圖2(b)中紫色點(diǎn)為初始化橢球體內(nèi)包裹的特征點(diǎn),大致位于該目標(biāo)主體中間位置;圖2(c)為209個(gè)特征點(diǎn)的掃描聚類結(jié)果;圖2(d)為該類目標(biāo)掃描結(jié)束后得到的目標(biāo)主體(包含902個(gè)特征點(diǎn)),圖2(e)為各類目標(biāo)主體的掃描結(jié)果(包含3867個(gè)特征點(diǎn))。不難發(fā)現(xiàn),各類別目標(biāo)主體在特征空間中可區(qū)分性較強(qiáng),即使對(duì)于方差較大的目標(biāo)主體,也能對(duì)其進(jìn)行有效包裹。
將RGB特征空間各目標(biāo)主體的掃描結(jié)果表達(dá)在圖像空間,如圖3(a)所示,不同類別目標(biāo)主體能夠被有效區(qū)分,而未被橢球包裹的噪聲和異常值則表現(xiàn)為空洞(紅色區(qū)域)??斩磪^(qū)域表現(xiàn)為單像素或多像素構(gòu)成的連通體,對(duì)粗分割結(jié)果進(jìn)行二值化,應(yīng)用連通區(qū)域標(biāo)記算法檢測(cè)空洞區(qū)域。圖像空間中,相鄰像素隸屬于同一類別的可能性較大,故將空洞鄰域區(qū)域的類別屬性賦予空洞區(qū)域。假設(shè)Hk表示圖像空間每個(gè)空洞的像素集合,其中k為空洞索引,則空洞區(qū)域標(biāo)號(hào)表示為,
Lk=max{len(Hk∩Hk′)|k′為Hk鄰接區(qū)域索引}
(8)
其中,Lk為空洞區(qū)域標(biāo)號(hào),len(Hk∩Hk′)表示空洞與其鄰接區(qū)域相鄰邊界長(zhǎng)度。遍歷所有空洞區(qū)域,當(dāng)其鄰域區(qū)域只包含一類地物時(shí),將該類別屬性賦予空洞;當(dāng)其鄰域區(qū)域鄰接多類地物時(shí),將鄰接邊界最長(zhǎng)的鄰域區(qū)域類別屬性賦予空洞。圖3(b)為去除空洞區(qū)域后最終分割結(jié)果,雖然個(gè)別邊界位置分割結(jié)果不甚理想,區(qū)域Ⅱ中像素誤分為區(qū)域Ⅰ,但整體上看,跨越邊界的空洞位置較少,不影響算法整體精度。
圖3 分割結(jié)果Fig.3 Segmentation results
為了驗(yàn)證提出算法估計(jì)的目標(biāo)主體主成分方向與該類目標(biāo)真實(shí)主成分方向的差異,以圖1(a)對(duì)應(yīng)模板圖像為標(biāo)準(zhǔn),分別計(jì)算圖像各目標(biāo)主成分方向、估計(jì)的目標(biāo)主體延伸方向及偏差(見(jiàn)表1)。不難發(fā)現(xiàn),圖像各目標(biāo)真實(shí)主成分方向與估計(jì)主成分方向偏差較小,最大偏差不超過(guò)5.66°。其真實(shí)主成分方向與估計(jì)的目標(biāo)主體主成分方向的差異主要受離散分布在目標(biāo)主體周圍的噪聲以及隨機(jī)分布在整個(gè)空間的異常值影響。而提出算法利用橢球只包裹目標(biāo)主體,忽略RGB特征空間噪聲和異常值。實(shí)驗(yàn)表明,利用上述方法估計(jì)的目標(biāo)主體延伸方向能夠趨近于目標(biāo)主體的真實(shí)方向,進(jìn)而利用橢球能夠較為準(zhǔn)確地包裹目標(biāo)主體。
為了驗(yàn)證本文算法的有效性,根據(jù)圖4(a)模板圖像合成一幅高分辨率遙感圖像(如圖4(b)),該圖像由2.5 m分辨率SPOT圖像拼接而成,包含森林、水田、裸地、草地四種常見(jiàn)地物類別,對(duì)應(yīng)圖中區(qū)域Ⅰ-Ⅳ。
圖4 模板圖像與合成圖像Fig.4 Template image and synthetic image
K-means聚類算法作為最常用的動(dòng)態(tài)聚類硬劃分方法,先指定聚類數(shù)目并隨機(jī)生成初始聚類中心,而后以像素到聚類中心歐式距離最小作為相似性準(zhǔn)則進(jìn)行逐像素聚類,并以各聚類均值矢量作為新的聚類中心,重新聚類,直至收斂。本文算法亦屬于硬劃分方法,指定聚類數(shù)目,并隨機(jī)生成初始代表點(diǎn),而后以特征點(diǎn)密集度作為相似性準(zhǔn)則,進(jìn)行像素聚類;模糊C均值(Fuzzy C-means Algorithm, FCM)算法[22]作為經(jīng)典的模糊聚類分割算法,具有較為完備的理論基礎(chǔ),在圖像分割領(lǐng)域應(yīng)用廣泛。該算法基于類內(nèi)加權(quán)誤差平方和構(gòu)建目標(biāo)函數(shù),最小化目標(biāo)函數(shù)準(zhǔn)則下,進(jìn)行像素聚類。本文算法在類內(nèi)像素相似度大準(zhǔn)則下識(shí)別目標(biāo)主體,使各目標(biāo)主體方差最?。唤Y(jié)合馬爾可夫高斯模型的雙鄰域模糊聚類分割算法(DNS-MGM)[15]為改進(jìn)FCM算法的彩色圖像分割算法,引入像素特征場(chǎng)和標(biāo)號(hào)場(chǎng)的鄰域關(guān)系,對(duì)噪聲和異常值具有較強(qiáng)的魯棒性。本文算法在特征場(chǎng)中識(shí)別各聚類目標(biāo)主體,標(biāo)號(hào)場(chǎng)中完善圖像分割;改進(jìn)的譜聚類彩色圖像分割算法將無(wú)向圖映射至低維空間,而后執(zhí)行距離測(cè)度學(xué)習(xí)方法進(jìn)行聚類。本文方法亦屬于距離測(cè)度學(xué)習(xí)。分別使用K-means聚類算法、FCM算法、DNS-MGM算法、譜聚類算法及本文算法對(duì)合成圖像進(jìn)行分割實(shí)驗(yàn),分割結(jié)果如圖5所示。實(shí)驗(yàn)環(huán)境是Inter(R).Core(TM).i5- 4590.3.3GHz/4G內(nèi)存/Matlab2013a。
傳統(tǒng)的K-means聚類算法用像素到聚類中心的歐氏距離作為劃分準(zhǔn)則將像素劃分到距離最近的聚類中心;FCM算法用歐氏距離定義像素與聚類的相似性測(cè)度,但歐氏距離只適用于RGB特征空間中聚類呈球形分布的圖像,對(duì)噪聲和異常值敏感。因此,對(duì)于方差較大的森林、水田及草地區(qū)域,圖5(a)和(b)分割結(jié)果中包含大量誤分像素。DNS-MGM算法同時(shí)考慮特征場(chǎng)和標(biāo)號(hào)場(chǎng)鄰域作用,改進(jìn)的譜聚類彩色圖像分割算法在構(gòu)造無(wú)向圖時(shí)考慮鄰域像素相關(guān)性,二種算法都能夠在一定程度上提高算法對(duì)噪聲和異常值的魯棒性,故圖5(c)和圖5(d)分割結(jié)果略優(yōu)于K-means算法和FCM算法。而原始圖像(如圖4(b))中森林、水田及草地區(qū)域,噪聲和異常值在圖像中呈現(xiàn)聚集性(即區(qū)域性),采用鄰域關(guān)系無(wú)法有效削弱其影響,因而森林區(qū)域分割結(jié)果中誤分明顯,本文算法依據(jù)圖像不同地物類別在RGB特征空間自然聚類,而噪聲表現(xiàn)為遠(yuǎn)離聚類的孤立點(diǎn)或孤立點(diǎn)集的特性,采用橢球體包裹表征不同類型地物的目標(biāo)主體,獲取包含空洞的圖像粗分割結(jié)果。并在粗分割結(jié)果的基礎(chǔ)上,結(jié)合區(qū)域鄰域關(guān)系填補(bǔ)空洞,進(jìn)而實(shí)現(xiàn)圖像分割。算法粗分割過(guò)程能夠忽略噪聲影響,并通過(guò)填補(bǔ)空洞操作獲得最終分割結(jié)果,對(duì)噪聲和異常值不敏感,故圖5(e)分割結(jié)果明顯優(yōu)于上述算法。
表1 主成分方向及偏差(°)
以圖4(b)對(duì)應(yīng)模板圖像(如圖4(a))為標(biāo)準(zhǔn),分別計(jì)算上述分割結(jié)果的產(chǎn)品精度,用戶精度、總精度和Kappa(K)系數(shù)(見(jiàn)表2),其中,用戶精度為正確分類與所有分為該類的像素?cái)?shù)的比值;產(chǎn)品精度為正確分類與參考數(shù)據(jù)中該類像素?cái)?shù)的比值;總體精度為被正確分類的像素?cái)?shù)總和除以總像素?cái)?shù);Kappa(K)系數(shù)表征實(shí)驗(yàn)分割結(jié)果與標(biāo)準(zhǔn)分割結(jié)果一致性。從表2不難看出,K-means算法和FCM算法無(wú)論用戶精度、產(chǎn)品精度、總精度以及Kappa系數(shù)均低于后三種算法,在類內(nèi)方差較小的裸地區(qū)域,用戶精度及產(chǎn)品精度較高,能達(dá)到88%以上。而對(duì)于類內(nèi)方差較大的森林、水田及草地區(qū)域誤分現(xiàn)象明顯,產(chǎn)品精度和用戶精度偏低,無(wú)法滿足實(shí)際生產(chǎn)需求。DNS-MGM算法和譜聚類算法引入鄰域像素關(guān)系,算法精度及Kappa系數(shù)均高于K-means和FCM算法。但對(duì)于類內(nèi)方差較大的地物類別,基于像素鄰域關(guān)系無(wú)法有效削弱噪聲和異常值影響,導(dǎo)致森林、水田、裸地及草地區(qū)域均包含不同程度的誤分像素。本文算法依據(jù)圖像在RGB特征空間自然聚類特性,采用橢球體包裹各類別特征點(diǎn),且在標(biāo)號(hào)場(chǎng)中實(shí)現(xiàn)噪聲和異常值的分類,因此本文算法精度更高,總體精度可達(dá)99.92%,Kappa系數(shù)甚至為1。
為進(jìn)一步驗(yàn)證本文算法有效性,選取五幅彩色高分辨率WORLDVIWE-2、IKONOS圖像,如圖6所示,同質(zhì)區(qū)域個(gè)數(shù)為3、3、4、4、4,包含農(nóng)田、草地、道路、裸地、森林等地物類別。分別用K-means聚類算法、FCM算法、DNS-MGM算法、譜聚類算法及本文算法進(jìn)行分割實(shí)驗(yàn)。
圖5 K-means算法、FCM算法、DNS-MGM算法、譜聚類算法和本文算法分割結(jié)果Fig.5 K-means, FCM, DNS-MGM, spectral clustering and proposed algorithm segmentation results
圖6 真實(shí)高分辨率彩色圖像Fig.6 Real high resolution images
圖8(a1)~(a5)、(b1)~(b5)、(c1)~(c5)、(d1)~(d5)和(e1)~(e5)分別為K-means聚類算法、FCM算法、DNS-MGM算法、譜聚類算法和本文算法分割結(jié)果。不難發(fā)現(xiàn),圖6(e)中各地物類內(nèi)方差較小,因此,各算法均能較完整地分割該圖像(如圖8(a5)~(e5))。但K-means聚類算法、FCM算法、DNS-MGM算法和譜聚類算法分割結(jié)果中均含有少量誤分像素,結(jié)果不及本文算法。K-means聚類算法和FCM算法僅利用像素強(qiáng)度信息分割圖像,不考慮鄰域像素相關(guān)性,對(duì)于類內(nèi)方差較大的地物類別,其分割結(jié)果中誤分現(xiàn)象明顯(如圖8(a1)~(a4)、(b1)~(b4))。DNS-MGM算法和譜聚類算法考慮鄰域像素相關(guān)性,一定程度地增強(qiáng)了對(duì)噪聲和異常值的魯棒性,但誤分現(xiàn)象仍然明顯,圖8(c1)分割結(jié)果中,各類地物均存在誤分現(xiàn)象;圖8(d1)分割結(jié)果中,大量草地區(qū)域誤分為裸地;圖8(c2)、(d2)、(c3)和(d3)分割結(jié)果中,誤分現(xiàn)象較為明顯;圖8(c4)分割結(jié)果中,部分森林區(qū)域誤分為草地,不同種類草地區(qū)域間誤分現(xiàn)象明顯;圖8(d4)分割結(jié)果中,包含有區(qū)域性噪聲,將部分裸地區(qū)域和草地區(qū)域誤分為森林。本文算法能夠有效消除噪聲和異常值影響,分割結(jié)果較為理想。圖8(e1)中利用區(qū)域鄰域像素相關(guān)性填補(bǔ)空洞,使得森林及裸地區(qū)域幾乎無(wú)誤分像素,圖8(e2)和圖8(e3)分割結(jié)果中,各地物類別分割結(jié)果均較為完整。圖8(e4)分割結(jié)果中,少量森林區(qū)域誤分為草地區(qū)域。整體看來(lái),本文算法優(yōu)于其他各類算法。
以圖6對(duì)應(yīng)的模板圖像(如圖7)為標(biāo)準(zhǔn),分別計(jì)算圖8中各算法分割結(jié)果的總體精度、Kappa系數(shù)及平均精度(見(jiàn)表3)。不難看出,K-means算法和FCM算法總體精度及Kappa系數(shù)偏低,總體精度均值低于84%,Kappa系數(shù)均值不高于0.75;DNS-MGM算法和譜聚類算法分割精度較K-means算法和FCM算法有所提高,總體精度均值達(dá)到92%,Kappa系數(shù)均值達(dá)到0.88。相比之下,本文算法無(wú)論總體精度還是Kappa系數(shù)均高于其他算法,其總體精度可達(dá)95%,Kappa系數(shù)甚至為0.93。
圖9(a1)~(a5)為本文算法粗分割結(jié)果,不難發(fā)現(xiàn)本文算法能夠識(shí)別不同類別目標(biāo)主體,進(jìn)一步結(jié)合圖像空間鄰域關(guān)系填補(bǔ)空洞區(qū)域,能夠得到理想分割結(jié)果。
圖7 標(biāo)準(zhǔn)分割結(jié)果Fig.7 Standard segmentation results
圖8 K-means算法、FCM算法、DNS-MGM算法、譜聚類算法和本文算法分割結(jié)果Fig.8 K-means, FCM, DNS-MGM, spectral clustering and proposed algorithm segmentation results
方法精度指標(biāo)高分辨率彩色圖像abcde平均精度K-means總體精度88.2162.7686.7179.4097.3682.88Kappa系數(shù)0.820.360.790.730.960.73FCM算法總體精度87.7362.8388.6781.2397.3883.57Kappa系數(shù)0.820.430.810.750.960.75雙鄰域模糊聚類算法總體精度93.6387.7890.6994.5997.4192.82Kappa系數(shù)0.900.760.850.930.960.88譜聚類算法總體精度95.6286.5889.6394.5797.3992.78Kappa系數(shù)0.930.750.840.930.960.88本文算法總體精度97.7893.3594.1196.1797.2595.73Kappa系數(shù)0.970.870.900.960.960.93
圖9 粗分割結(jié)果Fig.9 Coarse segmentation results
本文基于圖像各目標(biāo)在RGB特征空間自然聚類,噪聲和異常值隨機(jī)分布在整個(gè)空間的特性,利用主成分分析估計(jì)目標(biāo)主體延伸方向,并沿該方向掃描特征點(diǎn),從而將目標(biāo)主體包裹在橢球體內(nèi)部,而后在圖像空間結(jié)合鄰域相關(guān)性填補(bǔ)空洞,進(jìn)而提出基于掃描聚類的遙感圖像分割算法。該算法忽略RGB特征空間噪聲和異常值的影響,通過(guò)鄰域相關(guān)性填補(bǔ)圖像上未被RGB特征空間橢球體包裹而產(chǎn)生的空洞,能夠得到較為理想的分割結(jié)果。實(shí)驗(yàn)表明,文本算法對(duì)RGB特征空間中較復(fù)雜的聚類,尤其對(duì)于方差較大的地物類別也能夠準(zhǔn)確的估計(jì)其目標(biāo)主體延伸方向,實(shí)現(xiàn)各類別特征點(diǎn)聚類劃,且算法對(duì)噪聲和異常值具有較強(qiáng)的魯棒性。此外,算法通過(guò)初始樣本數(shù)據(jù)特征判斷代表點(diǎn)的有效性,其分割結(jié)果不受代表點(diǎn)選取的影響。