孫小丹,陳 文
(福州職業(yè)技術(shù)學院,福建福州 350108)
相比高空間分辨率影像,多光譜/高光譜影像提供了更為豐富的光譜數(shù)據(jù),因此,地物的光譜特征為此類影像分類一個重要依據(jù)[1-3].然而,在多光譜/高光譜影像的光譜數(shù)據(jù)中,相鄰波段之間存在著大量信息冗余,使得影像數(shù)據(jù)結(jié)構(gòu)呈高度的非線性,導(dǎo)致了隨著光譜數(shù)據(jù)的增加非但不能有效地提高影像的分類精度,同時還降低了分類的執(zhí)行效率[4].針對這一問題,國內(nèi)外研究學者通過構(gòu)建各種特征降維的數(shù)學模型/算法,將多光譜/高光譜影像高維的光譜特征降為低維特征.在低維特征定義的空間中,屬于同一地類的像元更凝聚,屬于不同地類的像元更疏離,那么以此特征為依據(jù),有助于提高影像分類的執(zhí)行效率[5].
根據(jù)設(shè)計原理的不同,常用的特征降維算法可分為:線性降維型、非線性降維型等兩大類.根據(jù)降維時是否有依據(jù)訓練樣本數(shù)據(jù)或先驗知識,又可將線性降維算法分為監(jiān)督型和非監(jiān)督型[6].其中,線性判別分析 (Linear Discriminant Analysis, LDA)算法屬于一種監(jiān)督型線性降維算法,常用于多光譜/高光譜影像分類前的光譜特征數(shù)據(jù)降維.至今,國內(nèi)外研究學者已從不同的角度對LDA算法加以應(yīng)用或改進.如:謝欣芳等[7]結(jié)合線性判別分析 (LDA)算法和局部線性嵌入 (LLE)算法的思想,提出一種半監(jiān)督局部判別分析算法;Liu Z等[8]結(jié)合稀疏圖理論改進LDA算法,提出了一種正交稀疏線性判別分析算法;Ibrahim W等[9]將LDA與深度核化極限學習機相結(jié)合,用于蛋白質(zhì)折疊子識別;M Mahdianpari等[10]基于LDA算法構(gòu)建相干性矩陣,實現(xiàn)PolSAR圖像的濕地分類;黃妙芬等[11]將LDA算法用于水環(huán)境石油類污染遙感識別;侯榜煥等[12]利用分類的先驗知識對LDA算法加以改進,并提出了面向高光譜圖像分類的半監(jiān)督空譜判別分析方法;H Yuan等[13]提出了一種光譜-空間LDA算法并用于高光譜影像分類;W Sheng等[14]利用有類標像元數(shù)據(jù)和無類標像元數(shù)據(jù)訓練LDA數(shù)學模型,使其能實現(xiàn)半監(jiān)督的數(shù)據(jù)降維;A Phinyomark等[15]將LDA算法用于肌電特征投影;M Zhao等[16]通過馬爾可夫隨機場模型引入模糊隸屬度,以此減少異常值對LDA算法的影響;Y Chao等[17]采用圖切割法將數(shù)據(jù)集分成若干子集,基于成本最小化原則,采用LDA算法為每個子集找到最佳子空間,以實現(xiàn)特征降維;LuGF等[18]在假設(shè)所有訓練數(shù)據(jù)均線性無關(guān)的前提下,提出了一種新的快速NLDA算法.
綜上,雖然關(guān)于LDA算法的應(yīng)用和改進已取得了較多的研究成果,但是大部分成果是通過結(jié)合其它技術(shù)理論對該算法加以改進,或者僅是拓寬了該算法的應(yīng)用領(lǐng)域,屬于松耦合改進的偏多,而關(guān)于算法本身原理方面的改進比較少.針對這一現(xiàn)狀,本文從LDA算法原理入手,對其關(guān)鍵參數(shù)進行了重新定義,并提出了一種基于局部離散度的監(jiān)督型線性判別分析 (Supervised Linear Discriminant Analysis based on Local Dispersion, SLDALD)算法,以下簡稱SLDALD算法.最后,聯(lián)合World-View2影像數(shù)據(jù),通過對比實驗,對新算法的可行性和優(yōu)越性加以驗證.
LDA算法的思想是:在影像包含的n維原始光譜特征數(shù)據(jù)中,采用正交變換方式,在保證信息損失最小的情況下,獲得有利于分類的互不相關(guān)m維新特征數(shù)據(jù),其中m 然而,在執(zhí)行LDA算法時,從類的整體角度來定義像元光譜特征在類內(nèi)、類間分布的離散程度(即離散度),而影像中不同區(qū)域內(nèi)像元光譜特征離散度的差異并沒有得到充分的體現(xiàn),且降維過程易受噪聲點的干擾.同時,在影像分類時,類邊界處像元極易被誤分,而用LDA算法進行特征降維后,此類像元光譜特征的類間離散度并沒有得到顯著提升.存在的這些弊端導(dǎo)致了依據(jù)LDA算法獲得的低維特征,執(zhí)行影像分類,分類效果不理想.本文以此為研究的出發(fā)點,提出了SLDALD算法,具體如下所述. 圖1 SLDALD算法的執(zhí)行過程Fig.1 Schematic Diagram of SLDALD Algorithm 本文所提SLDALD算法的具體執(zhí)行過程為:首先,根據(jù)影像中包含的n維原始光譜數(shù)據(jù),進行小尺度的影像分割.分割后,各圖斑中所包含地物信息的類別盡可能單一.接著,根據(jù)影像中所包含的地類,采集代表C個不同地類的樣本圖斑,并利用C個樣本圖斑的n維光譜特征數(shù)據(jù),計算類內(nèi)散布矩陣、類間散布矩陣.然后,依據(jù)跡準則,利用類內(nèi)散布矩陣、類間散布矩陣的前m個最大特征向量,獲得變換矩陣?.最后,通過變換矩陣?,執(zhí)行從n維光譜特征到m(m 圖2 關(guān)于ω1類中像元iω1的類間鄰域離散度圖示Fig.2 Schematic Diagram of the about Pixel iω1 which belong to Class ω1 為了提取出有利于影像分類的特征,類內(nèi)散布矩陣、類間散布矩陣的定義是解決問題的關(guān)鍵參數(shù)H根據(jù)LDA算法存在的弊端,本文從三個方面入手,改進兩個散布矩陣的定義:1) 考慮到不同區(qū)域內(nèi)像元光譜特征離散度的差異性,本文從像元鄰域的角度出發(fā),重新定義類內(nèi)散布矩陣和類間散布矩陣;2) 鑒于在影像分類時,處于類邊界處的像元極易被誤分.為了讓該類像元在降維后的特征空間中與同類像元更加凝聚,而與它類像元更加疏離,在計算類內(nèi)、類間散布矩陣時,賦予類邊界像元較大的權(quán)重,讓后續(xù)的特征降維更針對此類像元;3) 考慮到特征降維易受噪聲點的干擾,在計算類內(nèi)散布矩陣時,賦予噪聲點較小的權(quán)重,以抑制噪聲點對降維過程的干擾. (1) ωk≠ωl ωk∈[ω1……ωC ] (2) ωk∈[ω1……ωC ] (3) (4) (5) 總的類間鄰域散布矩陣SNB計算方式為 (6) (7) 圖3 關(guān)于ω1類中像元iω1的類內(nèi)鄰域離散度圖示Fig.3 Schematic Diagram of the about pixel iω1 which belong to Class ω1 (8) j≠i (9) (10) (11) (12) (13) (14) 1.2.3 特征降維 首先,分別計算出SNB、SNW的特征向量,并選出關(guān)于SNB、SNW前m個最大特征向量,組成若干個變換矩陣?.接著,根據(jù)不同的變換矩陣?,求出變換后的散布矩陣SWM、SBM (15) 最后,利用跡準則 (式16),計算出幾種不同變換方案的J值.將最大J值對應(yīng)的變換矩陣?做為映射變換矩陣,并執(zhí)行n維光譜特征向量到m(m (16) 為了驗證SLDALD算法的可行性和優(yōu)越性,本文聯(lián)合了寨場2012年World-View2影像,影像中包含了藍色波段、綠色波段、紅色波段、近紅外波段1、海岸波段、黃色波段、紅邊波段、近紅外波段2等8個波段光譜特征數(shù)據(jù).為了避免實驗中存在的偶然性,在影像中選取了兩個實驗區(qū),兩個實驗區(qū)中均包含了:水體、植被、人工建筑、裸土等豐富的地物信息.實驗1區(qū)大小459×493像素;實驗2區(qū)大小381×488像素,兩個實驗區(qū)的偽彩色影像分別如圖4a、圖5a所示. 實驗過程為:首先,分別采用LDA算法和SLDALD算法,將兩個實驗區(qū)影像原始的8維光譜特征數(shù)據(jù)降成2維,獲得兩組2維特征.在執(zhí)行SLDALD算法時,通過對比實驗,確定實驗1區(qū)的最近鄰像元個數(shù)取16;實驗2區(qū)的最近鄰像元個數(shù)取12.接著,分別依據(jù)兩組2維特征,對兩個實驗區(qū)執(zhí)行影像分類.其中,將LDA算法獲得的2維特征稱為分類判據(jù)①;將SLDALD算法獲得的2維特征稱為分類判據(jù)②.最后,將分類結(jié)果用藍色的線條勾勒出來,線條以內(nèi)的像元屬于同一地類.為了更加客觀全面地對兩種分類結(jié)果的質(zhì)量進行評析,本文采用了目視對比和影像分類評價指標 (即總精度和Kappa系數(shù))等兩種方式. 根據(jù)兩個實驗區(qū)的偽彩色影像 (圖4a、圖5a),采用目視對比的方式,分析對比2個實驗區(qū)的兩種分類結(jié)果 (圖4b-c、圖5b-c).對于實驗1區(qū)來說,從依據(jù)分類判據(jù)①的分類結(jié)果 (圖4b)可以看出:1) 4號地塊內(nèi)的耕地信息存在“分類過細”現(xiàn)象,且與相鄰的植被信息存在“誤分”現(xiàn)象;2) 2號地塊內(nèi)的植被信息與相鄰裸土信息存在“誤分”現(xiàn)象;3) 1號、3號、6號和7號地塊的人工地物信息(包括:建筑物、道路)和相鄰的裸土、植被信息之間存在“誤分”現(xiàn)象;4) 5號地塊的建筑物信息被誤分,導(dǎo)致建筑物輪廓嚴重失真.因此,依據(jù)分類判據(jù)①,影像分類效果不佳.而在依據(jù)分類判據(jù)②的分類結(jié)果 (圖4c)中,上述現(xiàn)象得到改善,各類地物的圖斑邊緣與其實際的邊緣基本吻合,分類質(zhì)量得到明顯提高.對于實驗2區(qū)來說,在依據(jù)分類判據(jù)①的分類結(jié)果中 (圖5b): 1號~5號地塊的植被與裸土信息之間存在較嚴重的“誤分”現(xiàn)象,因此分類精度不高.而在依據(jù)分類判據(jù)②的分類結(jié)果 (圖5c)中,上述的“誤分”現(xiàn)象大大減少,分類質(zhì)量得到明顯改善. 圖4 實驗1區(qū)的偽彩色影像和分類結(jié)果對比Fig.4 Pseudo-color Image of the 1st Experimental Area and its Comparison of Classification Results 圖5 實驗2區(qū)的偽彩色影像和分類結(jié)果對比Fig.5 Pseudo-color Image of the 2nd Experimental Area and its Comparison of Classification Results 圖6 植被、水體、建筑物、裸土等地物樣本點的分布對比Fig.6 Comparison of the Distributions about Sample Points of Vegetation, Water, Buildings and Bare Soil 在兩個實驗區(qū)中,分別對被誤分的植被、水體、建筑物、裸土等四類地物的像元進行隨機采樣,并用散點圖的方式,顯示這四類地物樣本在分類判據(jù)①、分類判據(jù)②定義的特征空間中的分布狀況 (圖6). 從圖6可以看出:在分類判據(jù)①定義的特征空間中 (圖6a),建筑物樣本點與水體樣本點有部分重疊,水體與植被有也有部分重疊,而裸土樣本點與植被樣本點之間的可分性也不高.而在分類判據(jù)②定義的特征空間中 (圖6b),植被、水體、建筑物、裸土等四類地物樣本點分布得更加合理,屬于不同地物的樣本點更加疏離,而屬于同一類地物的樣本點更加聚集,各類地物的可分性得到了顯著提高. 采用影像分類評價指標總體精度和Kappa系數(shù),對兩種影像分類結(jié)果做精度驗證.具體為:分別在實驗1、2區(qū)內(nèi),采用分區(qū)隨機采樣的方式,在植被、水體、建筑物、道路、裸土等各類地物信息中選取250、200個驗證像元,并結(jié)合地面精度驗證數(shù)據(jù),對分類結(jié)果進行人機交互式的精度驗證,精度驗證數(shù)據(jù)如表1、表2所示.從精度驗證數(shù)據(jù)可以看出:相比依據(jù)分類判據(jù)①的分類結(jié)果,依據(jù)分類判據(jù)②執(zhí)行影像分類,實驗1區(qū)、2區(qū)的分類總精度分別提高到90.08%、91.13%,Kappa系數(shù)均能達到0.9以上.因此,依據(jù)SLDALD算法獲得的低維特征執(zhí)行影像分類,能有效地提高分類精度. 表1 關(guān)于實驗1區(qū)的精度驗證數(shù)據(jù)Tab.1 Quantitatively Evaluating Data of the 1st Experimental Area 表2 關(guān)于實驗2區(qū)的精度驗證數(shù)據(jù)Tab.2 Quantitatively Evaluating Data of the 2nd Experimental Area 本文以影像分類為目的,對LDA算法進行了改進,并提出一種SLDALD算法.新算法從像元鄰域的角度對類內(nèi)、類間離散度進行重新定義,充分體現(xiàn)了不同區(qū)域內(nèi)像元光譜特征離散度的差異性;同時,還突出了邊緣點對特征降維的影響,并抑制了噪聲點的干擾.最后,結(jié)合World-View2影像,通過分類對比實驗證明:相比采用LDA算法所獲得的低維特征,通過SLDALD算法所獲得的低維特征空間中,不同地類像元的類間離散度得到了提高,相同地類的像元更加凝聚.以新算法所獲得的低維特征為依據(jù),執(zhí)行影像分類,能有效提高分類質(zhì)量.1.2 SLDALD算法
2 對比實驗及分析
2.1 實驗數(shù)據(jù)及結(jié)果
2.2 目視對比
3.3 分類結(jié)果的精度驗證
3 結(jié)語