寧 晨,謝紅薇,孟麗楠
太原理工大學 軟件學院,太原030024
高光譜遙感圖像(hyperspectral remote sensing images,HSRSI)發(fā)展始于機載可見/紅外成像光譜儀(airborne visible infrared imaging spectrometer,AVIRIS)于1987 年問世[1],其可以提供更豐富的光譜信息,增強了區(qū)分地物類別的能力,也因在目標檢測、農(nóng)業(yè)管理、礦物檢測和醫(yī)學領(lǐng)域的成功應(yīng)用而受到特別關(guān)注[2]。
高光譜遙感圖像分類的任務(wù)是根據(jù)數(shù)百個連續(xù)且細分的不同光譜波段電磁波對地物的反射信息,確定樣本點的類別。不同的地物擁有特定的光譜曲線,因此有許多利用光譜信息的特征提取方法被提出用于高光譜圖像分類。高光譜遙感圖像具有以下特征:(1)可供訓練的數(shù)據(jù)較少;(2)地物的高光譜特征在大空間內(nèi)的多樣性;(3)數(shù)據(jù)穩(wěn)定程度受光照、大氣影響較大[3];(4)數(shù)據(jù)維數(shù)較高所導致的維數(shù)災(zāi)難問題,出現(xiàn)嚴重的Hughes現(xiàn)象[4]。高光譜遙感圖像數(shù)據(jù)通常不作為圖像處理,而是作為光譜測量的無序列向量操作[5],因此,其處理方法與一般圖像不同。所以,有效地降低數(shù)據(jù)的維數(shù),挖掘數(shù)據(jù)特征的最佳子集,提取優(yōu)化光譜數(shù)據(jù)的特征,是高光譜圖像特征提取和地物分類研究的關(guān)鍵任務(wù)[6]。
高光譜遙感圖像的經(jīng)典分類方法包括主成分分析算法[7](principal components analysis,PCA)、獨立成分分析算法(independent component analysis,ICA)、線性判別式分析算法[8](linear discriminant analysis,LDA)、基于稀疏表示的分類器算法[9-10](sparse representation based classifier,SRC)和K-近鄰算法[11](K-nearest neighbor,KNN)。關(guān)于高光譜遙感圖像特征提取的方法可分為三類:(1)降維方法;(2)深度學習;(3)其他特征提取方法[12]。在降維方法中,除PCA、ICA、LDA 等方法外,為了解決支持向量機的非線性分類問題,引入了核方法[13-15]。文獻[15]提出核非參數(shù)加權(quán)特征提取,從解決數(shù)據(jù)的非線性角度出發(fā),利用核函數(shù),將數(shù)據(jù)映射到線性空間進行分類,有效地對高光譜數(shù)據(jù)進行解混。在深度學習方法中,隨著卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)在圖像處理領(lǐng)域中的廣泛應(yīng)用,很多研究也將CNN 用與高光譜遙感圖像的分類中[16-20]。近年來,出現(xiàn)了很多空-譜聯(lián)合特征提取方法[21-22]。文獻[23]提取光譜空間特征頻譜空間特征學習(spatial-spectral feature learning,SSFL)是一種深層的層次結(jié)構(gòu)。此外,應(yīng)用局部二值模式(local binary patterns,LBP)圖像的特征與頻譜空間特征進行融合。最后,采用核函數(shù)極限學習機(extreme learning machine with kernel,KELM)對高光譜圖像進行分類。此外,文獻[24]提出使用多尺度密集網(wǎng)絡(luò)(multi-scale density networks,MSDN)用于高光譜遙感圖像分類,該網(wǎng)絡(luò)實現(xiàn)了深度特征提取和多尺度融合重構(gòu),提高了收斂速度,有效地節(jié)省了計算資源,具有較高的穩(wěn)定性。
除此之外,近年來,有很多通過復雜網(wǎng)絡(luò)方法處理圖像的研究。其中,研究可分為關(guān)鍵點檢測和紋理特征提取兩部分。關(guān)鍵點檢測方面,文獻[25]提出使用復雜網(wǎng)絡(luò)對彩色圖像建模,并設(shè)置閾值劃分子網(wǎng)絡(luò),計算子網(wǎng)絡(luò)中各個像素點的出入度、緊密中心性以及中介中心性,將其中高于各自拓撲參數(shù)均值的像素點作為圖像的關(guān)鍵點。紋理特征提取方面,文獻[26]將圖像建模為一個多層復雜網(wǎng)絡(luò),其中RGB每個顏色通道為一層,每個像素點表示為一個復雜網(wǎng)絡(luò)節(jié)點,并通過動態(tài)演化獲取單個通道像素點之間的關(guān)系,以及不同通道之間像素點的空間關(guān)聯(lián)。文獻[27]同樣利用復雜網(wǎng)絡(luò)方法,提取子網(wǎng)絡(luò)的熵、能量,能較準確地描述泡沫圖像的紋理,并能較好地分類不同的泡沫。
基于以上研究,針對高光譜遙感圖像的光譜信息,挖掘樣本點不同光譜波段之間的關(guān)聯(lián)特征,本文提出一種基于視覺詞典和復雜網(wǎng)絡(luò)(bag of visual wordscomplex networks,BOVW-CN)的高光譜遙感圖像的特征提取方法。受視覺詞典方法能夠以無序視覺詞匯表示圖像的啟發(fā),設(shè)計了一種高光譜圖像的視覺詞典方法,提升模型識別精度,降低數(shù)據(jù)維度。并且,為挖掘單個像素點不同波段之間的關(guān)系,將光譜一維數(shù)據(jù)轉(zhuǎn)化為復雜網(wǎng)絡(luò)并提取其拓撲參數(shù)。并在Salinas和KSC高光譜數(shù)據(jù)集上驗證了本文算法的有效性。
視覺詞典的出現(xiàn)源自于自然語言處理和信息檢索領(lǐng)域,具有算法靈活性強,且魯棒性好等特點,得到的字典辨別能力更強。BOVW方法將圖像中的像素點視為無序特征集合,忽略像素點之間的空間位置關(guān)系,選取K個最具代表性的樣本,使用K-Means聚類方法將關(guān)鍵視覺單詞組成視覺詞典。其代價函數(shù)如下:
令β為圖像的視覺特征向量的v屬于視覺詞典向量vD的隸屬度,則有:
上式表示視覺詞典向量與其他向量的歐式距離越小,則該向量對于該詞典向量的隸屬度越大。
在構(gòu)建詞匯表之后,來自數(shù)據(jù)集的每個樣本都用可視化單詞的直方圖表示。直方圖是根據(jù)組成圖像的視覺詞匯的詞頻來構(gòu)建的。例如,給定一個圖像I,首先檢測該圖像的關(guān)鍵點。通過給定的特征提取過程對每個關(guān)鍵點進行描述,并對每個描述的圖像關(guān)鍵點計算它們與詞匯表中的視覺詞之間的距離。最后,表示最短距離的可視單詞的直方圖將增加一個單位。
復雜網(wǎng)絡(luò)沒有相對嚴格的定義。通常,復雜網(wǎng)絡(luò)可視為擁有小世界(small-world)、無標度(scale-free)、自組織(self-organization)、自適應(yīng)(self-adaptive)、社區(qū)結(jié)構(gòu)(community structure)等特性的網(wǎng)絡(luò)[28]。復雜網(wǎng)絡(luò)可以表示自然結(jié)構(gòu),它能夠表示許多現(xiàn)實世界的系統(tǒng),在表示幾乎任何自然結(jié)構(gòu)方面具有靈活性和通用性[29]。其中,存在大量的靜態(tài)統(tǒng)計特征描述量,如度、聚類系數(shù)、網(wǎng)絡(luò)直徑、平均路徑長度、小世界屬性等。而網(wǎng)絡(luò)的度的分布函數(shù)f(x)以及局部聚類系數(shù)cj可以表示出網(wǎng)絡(luò)各節(jié)點與其他節(jié)點的關(guān)系。公式如式(4)、(5)所示:
其中,p(x)為度為x的節(jié)點個數(shù),N為總節(jié)點個數(shù);ntri為節(jié)點所構(gòu)成的三角形個數(shù),k為該節(jié)點的鄰居個數(shù)。
復雜網(wǎng)絡(luò)除了擁有大量靜態(tài)結(jié)構(gòu)參數(shù),還關(guān)注網(wǎng)絡(luò)的動態(tài)特征。動態(tài)演化是復雜網(wǎng)絡(luò)表現(xiàn)其動態(tài)特征的關(guān)鍵。動態(tài)演化過程中,復雜網(wǎng)絡(luò)結(jié)構(gòu)隨時間變化而變化,在同一種演化方式下,不同時刻得到的多個網(wǎng)絡(luò)具有不同的特征。多個子網(wǎng)絡(luò)的拓撲參數(shù)并集構(gòu)成了原有數(shù)據(jù)的光譜特征。動態(tài)演化步驟如下的偽代碼所示:
當應(yīng)用于機器學習時,復雜網(wǎng)絡(luò)的使用通常有三個步驟:(1)將問題的特征空間建模為初始網(wǎng)絡(luò);(2)初始網(wǎng)絡(luò)進行動態(tài)演化,形成子網(wǎng)絡(luò);(3)從各個網(wǎng)絡(luò)中提取拓撲參數(shù)作為特征向量[30]。如圖1所示。
圖1 復雜網(wǎng)絡(luò)機器學習分類Fig.1 Machine learning in complex networks
針對用于分析圖像而構(gòu)建的初始復雜網(wǎng)絡(luò),采用不同像素點之間的像素位置和像素值的相關(guān)關(guān)系構(gòu)建。將每個像素點作為網(wǎng)絡(luò)中的一個節(jié)點Ix,y,定義閾值半徑r,當兩個節(jié)點的歐式距離小于r時,則為兩個節(jié)點增加邊e∈E,即:
再為每一條邊賦予權(quán)值,定義如下:
復雜網(wǎng)絡(luò)的動態(tài)演化一般采用閾值演化或最小生成樹的方法。閾值演化發(fā)在初始網(wǎng)絡(luò)構(gòu)造完成之后,定義動態(tài)演化閾值t,將初始網(wǎng)絡(luò)中的各個邊的權(quán)值與閾值相比較,刪除大于閾值的邊,由此形成多個子網(wǎng)絡(luò),即在生成的子網(wǎng)絡(luò)中有d(e)≤t。多個閾值可計算出多個子網(wǎng)絡(luò),多個子網(wǎng)絡(luò)的拓撲參數(shù)的并集構(gòu)成了當前圖像的特征。最小生成樹法通過最小生成樹算法構(gòu)建子網(wǎng)絡(luò),并在所構(gòu)成子網(wǎng)絡(luò)對于初始網(wǎng)絡(luò)的補集中迭代計算,從而生成多個子網(wǎng)絡(luò)。
本文提出一種基于視覺詞典和復雜網(wǎng)絡(luò)的高光譜遙感圖像特征提取及分類方法。首先,在不同類別地物中計算均值(單一聚類中心)或使用K-Means算法聚類,作為當前地物類別的中心,所有中心構(gòu)成與類別數(shù)相等的視覺單詞數(shù)的詞典。將像素點的每個波段像素值與詞典中相對應(yīng)的波段比較,構(gòu)成直方圖特征。其次,為提取單個像素點的波段之間的關(guān)聯(lián)特征,將單個像素點的一維離散光譜向量矩陣化,并構(gòu)建為復雜網(wǎng)絡(luò),經(jīng)過動態(tài)演化后提取網(wǎng)絡(luò)拓撲參數(shù),構(gòu)成特征向量。
首先對高光譜遙感圖像數(shù)據(jù)進行標準化處理,處理方法如公式(8)所示:
其中,Imin和Imax代表圖像立方體中的最小像素值和最大像素值,Ii為任意像素值。
本文結(jié)合視覺詞典,提出了一種高光譜圖像地物分類的詞典構(gòu)造方法。對于每一類地物k,其中,k∈{1,2,…,K},每類地物的樣本數(shù)為nk,分別針對每類地物生成一個樣本集合??杀硎緸椋?/p>
其中,uk表示第k類的光譜向量集合。根據(jù)視覺詞典方法,利用K-Means 算法對訓練集每類地物進行聚類,根據(jù)聚類中心分別生成詞典向量,集合詞典向量得到最終用于高光譜遙感圖像地物分類的字典。
在像素點光譜向量集合β={v1,v2,…,vnk}中,vi=[bi,1,bi,2,…,bi,B],i=1,2,…,nk為像素點向量,其中,p∈{1,2,…,B}為波段序號,bi,p為i個光譜向量的第p個波段的像素值。波段像素值bi,p與詞典中的向量相對應(yīng)的波段像素值比較,可構(gòu)建單像素點的直方圖。直方圖根據(jù)組成圖像詞匯的視覺詞匯頻率來創(chuàng)建的,表示最短距離的單詞的直方圖值將增加一個單位,即
最終得到像素點的詞頻直方圖特征。
其中,Hk為直方圖對應(yīng)頻數(shù)。示意圖如圖2所示。
圖2 單像素點的直方圖構(gòu)建過程Fig2 Process of constructing histogram of single pixel points
2.3.1 初始網(wǎng)絡(luò)構(gòu)建
本文方法將單個像素點的一維光譜向量集合vi∈β轉(zhuǎn)化為矩陣。首先,計算滿足相乘等于向量維度的兩數(shù)a,b,即:
建立大小為a×b的零矩陣。若無可整除整數(shù),則尋找平方值與向量維數(shù)之差最小的整數(shù),即:
根據(jù)矩陣的坐標值及標準化后的波段像素值構(gòu)建復雜網(wǎng)絡(luò)G=(V,E),其中,V={node1,node2,…,nodem}E={e1,e2,…,el}分別為網(wǎng)絡(luò)的節(jié)點和邊的集合,當波段像素的矩陣位置距離小于等于閾值r時,則為兩樣本點之間增加邊。每條邊擁有各自的權(quán)值d(ei.j)的計算公式(15)~(17)如下:
上式中,(xi,yi)為像素點在矩陣中的坐標,Ist(xi,yi)為像素點(xi,yi)的標準化像素值,r為半徑閾值。此時,每個網(wǎng)絡(luò)頂點表示相同數(shù)量的連接。因此,計算圖呈現(xiàn)出一種規(guī)則的行為。而正則圖并不被認為是一個復雜網(wǎng)絡(luò),它也沒有為數(shù)據(jù)提取過程提供任何相關(guān)的屬性。因此,獲取初始復雜網(wǎng)絡(luò)后,需要進行動態(tài)演化進行子網(wǎng)絡(luò)分析。定義一組動態(tài)演化閾值T={t1,t2,…,tn},對每一個閾值ti,若ti>d(ei,j),則刪除邊ei,j;否則,將其保留。由此,可以得到多個子網(wǎng)絡(luò)。
2.3.2 動態(tài)演化
對于每一個子網(wǎng)絡(luò),分析并提取每一個子網(wǎng)絡(luò)的網(wǎng)絡(luò)拓撲參數(shù),將全部子網(wǎng)絡(luò)的全部參數(shù)組合,作為這個像素點的特征描述。本文選取5個參數(shù),分別為整個網(wǎng)絡(luò)節(jié)點度的頻數(shù)分布直方圖的均值、方差、能量和熵以及整個網(wǎng)絡(luò)的平均聚類系數(shù)[31-32],分別為:
其中,f(i)代表度頻數(shù)直方圖的概率分布函數(shù),i為度的值,k為最大度值,cj為單個節(jié)點的局部聚類系數(shù),m為節(jié)點個數(shù)。將以上參數(shù)進行組合,形成子網(wǎng)絡(luò)的特征向量。
根據(jù)不同的閾值ti,可得到多個子網(wǎng)絡(luò),子網(wǎng)絡(luò)分別提取各自的特征向量,最終構(gòu)成單個像素點特征向量。
算法步驟具體描述如圖3,復雜網(wǎng)絡(luò)特征提取方法偽代碼如下:
圖3 復雜網(wǎng)絡(luò)特征提取過程Fig.3 Feature extraction process of complex network
將得到的復雜網(wǎng)絡(luò)特征與視覺詞典特征進行特征融合,為了簡化處理,本文選擇了最簡單的方法,即直接組合法。最終得到的特征如公式(24)所示:
方法流程如圖4所示。
圖4 BOVW-CN方法特征提取過程Fig4 BOVW-CN method feature extraction process
本文使用兩個具有代表性的高光譜遙感圖像數(shù)據(jù)集Salinas和KSC。
3.1.1 Salinas
Salinas數(shù)據(jù)集場景由AVIRIS傳感器采集加利福尼亞州Salinas 山谷的景象,共224 個波段,具有高空間分辨率(空間分辨率為3.7 m)的特點。舍棄了20 個吸水帶,吸水帶為[108~112]、[154~167]、224。該圖像大小為517×517,包含111 104 個像素點,已標記樣本點54 129個。并類別包括蔬菜、裸露的土壤和葡萄園的田地,其中包含蔬菜、裸地和葡萄園等16 個類。偽彩色合成圖像和地面真實信息如表1及圖5所示。
圖5 Salinas數(shù)據(jù)集假彩色圖像及真實地物信息Fig.5 False color image and groundtruth of Salinas data set
表1 Salinas數(shù)據(jù)集信息Table 1 Information of Salinas data set
3.1.2 KSC
KSC數(shù)據(jù)集由AVIRIS儀器在佛羅里達州肯尼迪航天中心(Kennedy space center,KSC)獲得數(shù)據(jù),從大約20 km 的高度獲得,具有18 m 的空間分辨率,在波長為400 nm至2 500 nm的224個光譜波段中獲得數(shù)據(jù),包含5 211 個樣本點。在去除吸水率和低信噪比波段后。為了進行分類,該地點數(shù)據(jù)定義了13個類別,偽彩色圖像和類別信息如表2及圖6所示。
圖6 KSC數(shù)據(jù)集假彩色圖像及真實地物信息Fig.6 False color image and ground truth of KSC data set
表2 KSC數(shù)據(jù)集信息Table 2 Information of KSC data set
本文全部實驗均在Python3.7環(huán)境下運行,Red Hat操作系統(tǒng),硬件設(shè)備為Intel core i7-6800k CPU,GeForce RTX 2080 Ti顯卡。
為了驗證本文算法的地物分類效果,本文分三個部分進行實驗驗證:
(1)分別只使用視覺詞典方法、只使用復雜網(wǎng)絡(luò)方法以及本文所提算法在Salinas數(shù)據(jù)集上進行實驗。
(2)分別使用高斯核函數(shù)支持向量機方法(support vector machine with radial basis function,RBF-SVM)、KNN、LBP-KELM、SSFL、CNN,以及本文所提出的BOVW-CN方法對高光譜遙感圖像進行分類。
(3)調(diào)整本文所提算法中的兩個重要參數(shù):復雜網(wǎng)絡(luò)動態(tài)演化閾值與K-Means聚類中心個數(shù),測試二者對于整體分類效果的影響。
其中,本文算法針對Salinas數(shù)據(jù)集將一維向量轉(zhuǎn)化為20×10 矩陣,KSC 數(shù)據(jù)集轉(zhuǎn)化為11×16 矩陣,動態(tài)演化閾值t范圍從0.25至0.55每次增加0.025,半徑閾值r為3,利用各類地物向量的均值作為中心構(gòu)造。所有參數(shù)均通過交叉驗證(cross validation)和網(wǎng)格搜索(grid searching)尋找最優(yōu)解。
在實驗中采用常用的高光譜遙感圖像地物分類評價指標,即總體精度(overall accuracy,OA)、平均精度(average accuracy,AA)和KAPPA系數(shù)衡量各算法的分類性能公式如(25)~(27)所示。OA 表示正確分類的樣本占總體樣本的百分比,而AA計算測試樣本上每個類別準確率的平均值。Kappa 系數(shù)用來衡量預測的標簽和真實的標簽之間的一致性,是反映模型“偏向性”的重要指標。
其中,r為混淆矩陣的對角線元素個數(shù),CMi,i為對角線元素,CMi+、CM+i為行和列的總觀測數(shù),C為類別總數(shù),N為矩陣總元素個數(shù)。
混淆矩陣(confusion matrix,CM)是表示精度評價的一種標準格式,也是分析總體精度和Kappa系數(shù)等指標的基礎(chǔ)。
(1)單一特征分類方法和本文方法的對比
圖7 為只使用視覺詞典方法以及只使用復雜網(wǎng)絡(luò)方法與本文所提出的二者融合算法的實驗結(jié)果。圖(a)為真實地物信息,圖(b)為只使用視覺詞典方法的分類結(jié)果圖,圖(c)為只使用復雜網(wǎng)絡(luò)方法的分類結(jié)果。圖(d)為本文所提出的融合二者的分類方法。圖中標記了2個區(qū)域,圓形區(qū)域以及矩形區(qū)域。在圓形區(qū)域中(對應(yīng)類別15),單獨使用BOVW方法和單獨使用復雜網(wǎng)絡(luò)方法的大量錯分類樣本點在二者的融合方法中得到了改正。在矩形區(qū)域(對應(yīng)類別1、10、11、12、13、14),單獨使用BOVW 方法的分類結(jié)果較差,其中存在大量的噪聲點,相比之下,單獨使用復雜網(wǎng)絡(luò)方法的分類結(jié)果的噪聲點較少,而二者融合的算法極大地優(yōu)化了此區(qū)域的分類結(jié)果。從表3中也可以看出,本文所提出的BOVW-CN算法的OA 值有13.08%和6.66%提高。AA 和Kappa 也有不同程度的提升。
圖7 單一特征分類方法和BOVW-CN的對比結(jié)果Fig.7 Comparison results of single feature classification method and BOVW-CN
表3 Salinas數(shù)據(jù)集不同特征分類結(jié)果數(shù)據(jù)集分類結(jié)果Table 3 Results of classification of different characteristics of Salinas data set
(2)現(xiàn)有算法與本文算法比較
圖8展示了真實地物信息以及6種特征提取算法所在Salinas 數(shù)據(jù)集下的分類效果圖。分別為RBF-SVM、KNN、SSFL、LBP-KELM、3D-CNN 以及BOVW-CN 方法??梢钥闯觯钜族e分的第8 類和第15 類之外,本文算法在其他類別上的錯分噪聲點較少,大部分地物的分類準確率很高。
圖8 Salinas數(shù)據(jù)集分類效果圖Fig.8 Classification results of Salinas data set
表4給出了6種不同特征提取方的分類精度。RBFSVM、KNN、LBP-KELM、SSFL、3D-CNN和BOVW-CN的OA值分別為88.27%、86.09%、95.23%、94.11%、98.01%、98.97%。
表4 Salinas數(shù)據(jù)集不同算法分類結(jié)果Table 4 Salinas data set classification results of different methods
可以看出本文所提出的特征提取方法對于高光譜遙感圖像分類具有優(yōu)越性。在光譜曲線較為相似且極易錯分的第8 類和第15 類的分類上相較其他分類方法也有所提高。在訓練樣本較少的第13 類中,分類精度也有所提高。同時,通過對Kappa 值的分析,本文算法在分類一致性上相較其他算法也有相應(yīng)提升。
圖9 顯示了真實地物信息和KSC 數(shù)據(jù)集下6 種方法分類效果圖,可以看出在圖中所標記區(qū)域,BOVWCN算法的分類結(jié)果更接近于真實地物信息。
圖9 KSC數(shù)據(jù)集分類效果圖Fig9 Classification results of KSC data set
表5給出了在KSC數(shù)據(jù)集下的6種方法分類結(jié)果。本文算法較為RBF-SVM、KNN、LBP-KELM、SSFL、LBP-KELM 以及3D-CNN 算法OA 值提高了30.66%、14.94%、2.42%、2.14%以及1.46%。由此,可以得出以下結(jié)論:
表5 KSC數(shù)據(jù)集不同算法分類結(jié)果Table 5 KSC data set classification results of different methods
①單純使用支持向量機算法在不同數(shù)據(jù)集上的分類結(jié)果表現(xiàn)不穩(wěn)定;
②本文算法在訓練樣本數(shù)據(jù)較少的情況下,仍能保持較高的分類精度。
為更直觀地表現(xiàn)各算法分類結(jié)果的類間混淆,利用弦圖工具進行直觀分析[33-34]。圖10 顯示了KSC 數(shù)據(jù)集在6種方法分類下的混淆弦圖,結(jié)果表明,BOVW-CN類間混淆數(shù)據(jù)相比其他方法最少,從而達到最好的分類效果??梢宰C明,本文提出的算法能夠有效地提取高光譜遙感圖像特征,從而更加準確地完成分類任務(wù)。
圖10 KSC數(shù)據(jù)集分類混淆弦圖Fig.10 Confusion circos of KSC data set
(3)動態(tài)演化閾值個數(shù)和聚類中心個數(shù)對本文所提算法的影響
圖11 為不同復雜網(wǎng)絡(luò)動態(tài)演化閾值的個數(shù)對OA值、AA值和Kappa系數(shù)的影響。隨著閾值個數(shù)增加,在動態(tài)演化過程中生成的子網(wǎng)絡(luò)個數(shù)增加,拓撲參數(shù)提取數(shù)目也隨之增加。在分類中,每增加2 個閾值,分類的準確率以及Kappa值可增加0.85%至1.12%。
圖11 閾值個數(shù)對評價指標的影響Fig.11 Influence of threshold number on evaluation index
當使用K-Means算法構(gòu)建視覺詞典時,為研究單個類型地物不同的聚類中心個數(shù)對整體分類精度的影響,分別在兩個數(shù)據(jù)集上,并在聚類中心個數(shù)1 至5 對圖像進行分類。
結(jié)果如圖12 所示,聚類中心的增加對最終分類結(jié)果的影響較小。聚類中心的增加雖然對分類結(jié)果有提升的效果,但同時增加了所提取特征向量的維數(shù)。
圖12 聚類中心個數(shù)對評價指標的影響Fig.12 Influence of number of clustering centers on evaluation index
相較之下,求取均值作為單一中心的計算結(jié)果雖然在精度上有所損失,但能夠有效降低向量的維數(shù),提升算法的運行效率。
本文提出一種基于視覺詞典和復雜網(wǎng)絡(luò)的高光譜遙感圖像光譜特征提取方法,通過對高光譜遙感數(shù)據(jù)進行預處理,計算歸一化數(shù)據(jù)聚類的聚類中心,構(gòu)建視覺詞典,通過視覺詞典機制形成光譜直方圖特征。同時,為突出樣本波段間的關(guān)聯(lián)特征,將歸一化數(shù)據(jù)矩陣化,采用復雜網(wǎng)絡(luò)理論方法構(gòu)建復雜網(wǎng)絡(luò),經(jīng)動態(tài)演化之后,提取網(wǎng)絡(luò)拓撲參數(shù)形成復雜網(wǎng)絡(luò)特征。融合兩種特征向量,作為圖像樣本點的光譜特征進行分類。實驗表明,本文所提方法具有很好的分類效果,克服了光譜信息不足的缺陷,能夠挖掘出深層光譜信息,提高了高光譜遙感圖像的分類精度。但是,該算法沒有結(jié)合空間信息。下一步的研究工作,將結(jié)合高光譜遙感圖像的空間特征信息。