歐陽寧,高 鑫,袁 華
(桂林電子科技大學(xué) 認(rèn)知無線電與信息處理省部共建教育部重點實驗室,廣西 桂林 541004)
?
基于改進(jìn)的擴(kuò)散平滑和RBM的高光譜圖像分類
歐陽寧,高鑫,袁華
(桂林電子科技大學(xué) 認(rèn)知無線電與信息處理省部共建教育部重點實驗室,廣西 桂林 541004)
為了改善傳統(tǒng)分類方法在高光譜遙感圖像去噪和特征提取方面的不足,提出了一種基于改進(jìn)的擴(kuò)散平滑算法和RBM的方法。該方法使用自適應(yīng)擴(kuò)散系數(shù),對相應(yīng)的區(qū)域進(jìn)行不同程度的擴(kuò)散平滑,實現(xiàn)了對高光譜遙感圖像的快速去噪;然后利用多層限制玻爾茲曼機(jī)構(gòu)建DBN網(wǎng)絡(luò),實現(xiàn)對高光譜遙感圖像的分類。實驗表明,與傳統(tǒng)的分類方法和DBN相比,該方法在高光譜圖像地物分類精度上有所改善。
擴(kuò)散平滑;限制玻爾茲曼機(jī);高光譜;遙感;神經(jīng)網(wǎng)絡(luò)
近年來,隨著成像光譜儀技術(shù)的突破,遙感圖像由多光譜成像發(fā)展到高光譜,成像的波段由幾個增加到幾十個甚至幾百個。高光譜遙感技術(shù)的發(fā)展為地球遙感和相關(guān)應(yīng)用的開發(fā)創(chuàng)造了新的機(jī)遇。土地覆蓋調(diào)查、森林地物分類、材料識別以及現(xiàn)代農(nóng)業(yè)等幾個領(lǐng)域都利用了大量遙感影像來獲取信息[1-2]。
目前,主要運(yùn)用如ANN[3-4](人工神經(jīng)網(wǎng)絡(luò)),SVM[5-6](支持向量機(jī))這一類的非參數(shù)化方法[7]進(jìn)行高光譜圖像的分類工作。但是,SVM方法需要較多的有標(biāo)簽樣本,BP神經(jīng)網(wǎng)絡(luò)存在容易收斂到局部最小值的問題。2006年,Hinton及其學(xué)生Salakhutdinov在《Science》上發(fā)表了一篇文章[8],正式提出深度信念網(wǎng)絡(luò)DBN。在該算法中,一個DBN模型被視為由若干個RBM堆疊形成,訓(xùn)練時由低到高逐層訓(xùn)練,每次只需訓(xùn)練單層的網(wǎng)絡(luò)。在預(yù)訓(xùn)練后,DBN可以通過帶標(biāo)簽數(shù)據(jù)用BP算法對判別性能做出調(diào)整,網(wǎng)絡(luò)的性能比單純的BP算法訓(xùn)練的網(wǎng)絡(luò)要好。自此,深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個新興研究方向,受到了學(xué)術(shù)界的極大關(guān)注。
雖然DBN在高光譜圖像的分類上取得了不錯的效果,但該方法側(cè)重于限制玻爾茲曼機(jī)的特征提取方面,對高光譜數(shù)據(jù)的去噪處理還停留在簡單去除噪聲波段[9]這一層面,沒有很好的方法對已經(jīng)去除噪聲波段的數(shù)據(jù)再進(jìn)一步進(jìn)行去噪處理。針對這一問題,本文引入一種改進(jìn)的擴(kuò)散平滑算法對高光譜圖像進(jìn)行去噪,利用RBM構(gòu)建網(wǎng)絡(luò)進(jìn)行特征提取,再連接BP或SP進(jìn)行地物分類。實驗表明,本文提出的方法在主觀視覺效果和客觀評價參數(shù)都優(yōu)于相比較的幾種算法。
采用了一種改進(jìn)的各項異性擴(kuò)散平滑方法。通過改進(jìn)PM模型的擴(kuò)散系數(shù),設(shè)置一個梯度閾值,每個梯度范圍對應(yīng)一種擴(kuò)散系數(shù),在不同的梯度區(qū)域采用相對應(yīng)的擴(kuò)散系數(shù)進(jìn)行處理:在梯度較小的區(qū)域采用較大程度的擴(kuò)散,處理后圖像中亮度值相近的像素點會連成一片,形成尺度空間范圍內(nèi)的同質(zhì)區(qū)域,增加了同質(zhì)區(qū)域噪聲的差別;在梯度較大的區(qū)域采用PM模型進(jìn)行處理,最大程度保留細(xì)節(jié)和邊緣信息。
經(jīng)過擴(kuò)散平滑處理后,高光譜圖像的噪點基本被去除。將得到的數(shù)據(jù)中每個波段的圖像依次拉伸為一列,再將每列數(shù)據(jù)等分,按順序存儲起來,便于分批處理。最后利用多層限制玻爾茲曼機(jī)網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行訓(xùn)練,提取特征,輸出的權(quán)值向量作為BP神經(jīng)網(wǎng)絡(luò)或SP(子空間追蹤)算法的輸入,完成對地物的分類。系統(tǒng)框圖如圖1所示。
圖1 系統(tǒng)框圖
2.1基于改進(jìn)的擴(kuò)散平滑的高光譜圖像去噪
高光譜數(shù)據(jù)在獲取和傳輸過程中容易受傳感器、外界環(huán)境等因素的影響,存在很多噪聲。為了減小噪聲對特征提取的影響,除了剔除噪聲波段和吸水波段,還需要對數(shù)據(jù)進(jìn)一步去噪。由于高光譜數(shù)據(jù)包含上百個波段的光譜信息,如果采用中值濾波或者小波變換等方法,計算量非常大,耗時太久。本文引入一種改進(jìn)的各向異性擴(kuò)散(PM)模型對高光譜圖像進(jìn)行去噪。
PM模型是改進(jìn)的熱傳導(dǎo)微分方程
(1)
擴(kuò)散系數(shù)為
(2)
式中:k是閾值參數(shù),用來控制特征尺度。
新方法通過改進(jìn)PM模型的擴(kuò)散系數(shù),針對不同的梯度范圍采用不同程度的擴(kuò)散。
(3)
(4)
(5)
式中:α和β是連貫系數(shù),它們保證擴(kuò)散系數(shù)函數(shù)c2的連續(xù)性。
圖2所示為去噪前后的對比。在梯度較小的區(qū)域采用較大程度的擴(kuò)散后,圖像中亮度值相近的像素點連成一片,形成同質(zhì)區(qū)域,增加了區(qū)域噪聲的差別;在梯度較大的區(qū)域采用PM模型進(jìn)行處理,細(xì)節(jié)和邊緣信息都得到很好的保留。對比圖2a和圖2b后發(fā)現(xiàn),圓圈標(biāo)注的兩個區(qū)域經(jīng)過該方法處理后,噪點基本都被去除,邊緣和細(xì)節(jié)信息也得到很好的保留。
圖2 去噪前后的對比
2.2數(shù)據(jù)重組及分批
為了得到較好的分類效果以及提高系統(tǒng)效率,本文將經(jīng)過去噪后的數(shù)據(jù)進(jìn)行重組和分批:先把a(bǔ)幅大小為m×m的圖片拉伸為a列m2×1大小的矩陣存儲起來,再將每一列平均分為c份,每份含有b個元素。這樣處理過的數(shù)據(jù)就便于批量訓(xùn)練和制作標(biāo)簽。圖3所示為數(shù)據(jù)重組和分批的具體流程。
圖3 數(shù)據(jù)重組和分批
2.3限制玻爾茲曼機(jī)
限制玻爾茲曼機(jī)(RestrictedBoltzmannMachine,RBM)是一種生成式隨機(jī)神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)由若干可見單元構(gòu)成的可見層和一些隱藏單元構(gòu)成的隱藏層組成[10]。神經(jīng)元之間的連接具有層內(nèi)無連接、層間全連接的特點??梢妼訂卧脕砻枋鲚斎霕颖緮?shù)據(jù)的某個方面或某個特征,隱藏層單元一般用來獲取可見層單元對應(yīng)變量之間的依賴關(guān)系,也被稱為特征提取層。圖4所示為RBM的網(wǎng)絡(luò)結(jié)構(gòu)。
圖4 RBM網(wǎng)絡(luò)結(jié)構(gòu)
n表示可見層中神經(jīng)元的個數(shù),m表示隱藏層中神經(jīng)元的個數(shù),v=(v1,v2,…,vn)表示可見層的狀態(tài)向量,h=(h1,h2,…,hm)表示隱藏層的狀態(tài)向量,a=(a1,a2,…,an)表示可見層的偏置向量,b=(b1,b2,…,bm)表示隱藏層的偏置向量,W=(wi,j)∈Rn×m表示可見層和隱藏層之間的權(quán)值矩陣。
隱藏單元和可見單元的的激活概率分別為
(6)
(7)
式中:σ(x)=1/(1+e-x)為sigmoid激活函數(shù);∑表示累加求和;hi是h中的一個元素;vj是v中的一個元素;aj是a中的一個元素;bi是b中的一個元素。
將可見單元的狀態(tài)設(shè)置為一個訓(xùn)練樣本,v(0)=v,執(zhí)行k步Gibbs采樣,利用式(6)計算所有隱藏單元的二值狀態(tài),在所有隱藏單元狀態(tài)確定后,根據(jù)式(7)來確定第i個可見單元vi取值為1的概率,進(jìn)而產(chǎn)生可見層的一個重構(gòu)。然后利用采樣得到的v(k)來近似估計
(8)
(9)
(10)
各參數(shù)按下式更新
(11)
(12)
(13)
得到各層參數(shù)的更新公式
(14)
(15)
(16)
式中:η>0為學(xué)習(xí)率。
2.4方法具體流程
1)將經(jīng)過幾何校正和大氣校正的高光譜數(shù)據(jù)中的噪聲波段和吸水波段剔除,再進(jìn)行擴(kuò)散平滑去噪處理。
2)將每個波段的圖片拉伸為一列,每列進(jìn)行分塊,將數(shù)據(jù)分批。
3)按批次將數(shù)據(jù)輸入第一層RBM,輸出的權(quán)值和偏置作為第二層RBM的輸入,以此類推,經(jīng)過N層訓(xùn)練,得到權(quán)值向量以及隱藏層和可見層的偏置向量。
4)將最后一層RBM網(wǎng)絡(luò)輸出的權(quán)值向量作為BP神經(jīng)網(wǎng)絡(luò)的輸入,通過BP后進(jìn)行分類。
圖5所示為基于DBN的特征提取和分類方法流程圖。
圖5 基于DBN的特征提取和分類方法流程圖
3.1實驗數(shù)據(jù)和評估指標(biāo)
實驗環(huán)境:在CPU為Intel至強(qiáng)E3-1230V3,內(nèi)存為8GbyteDDR3,顯卡為GTX660 2GHz的PC機(jī)上,利用MATLABR2012a進(jìn)行實驗仿真。
實驗采用的數(shù)據(jù)是美國國家航空航天局噴氣推進(jìn)實驗室用AVIRIS系統(tǒng)在1992年拍攝的印第安納州西北部松樹場景高光譜遙感圖像。該數(shù)據(jù)光譜分辨率為10nm,空間分辨率為20m×20m,包含224個波段的光譜信息,每個波段的分辨率為144×144,圖6所示為某一個波段的地物分布情況。圖7為對應(yīng)的地物標(biāo)識。
圖6 單波段地物場景
圖7 地物標(biāo)識
該高光譜數(shù)據(jù)對應(yīng)的地物有16種,分別為Corn-Notill,Grass/Pasture,Grass/Trees,Hay-Windrowed,Soybeans-Notill,Soybeans-Mintill,Soybeans-Clean,Woods,Alfalfa,Corn-Mintill,Corn,Grass/Pasture-moved,Oats,Wheat,Bldng-Trass-Trees,Stone-Steel-Tower。表1為16種地物的樣本數(shù)目。
選取16種地物中的Corn-Notill,Grass/Pasture,Grass/Trees,Hay-Windrowed,Soybeans-Notill,Soybeans-Mintill,Soybeans-Clean和Woods這8類地物,共計8 511個樣本進(jìn)行分類實驗。8類地物的具體分布如圖8~9所示。
表116種地物樣本數(shù)目
地物種類AlfalfaCorn-NotillCorn-MimtillBldng-Grass-TreesGrass/PastureGrass/TreesGrass/Pasture-movedHay-Windrowed樣本數(shù)目54143483423449774726489地物種類OatsSoybeans-NotillSoybeans-MintillSoybeans-CleanWheatWoodsCornStone-Steel-Tower樣本數(shù)目209682468614212129438095
圖8 8類地物標(biāo)識1
圖9 8類地物標(biāo)識2
利用混淆矩陣來反映分類結(jié)果與地物真實情況的相關(guān)信息,通過分析混淆矩陣,采用總體分類精度(OverallAccuracy,OA)、平均分類精度(AverageAccuracy,AA)和Kappa系數(shù)作為實驗的參考參數(shù),用來判斷算法的性能。
對于混淆矩陣A,假設(shè)矩陣大小為m×m,樣本種類即為m個。aii表示正確分類到第i類的樣本數(shù)目,aij表示錯分的樣本數(shù)目。
測試樣本總數(shù)為
(17)
第i行元素之和為
(18)
第i列元素之和為
(19)
Kappa系數(shù)為
(20)
總體分類精度為
(21)
平均分類精度為
(22)
3.2參數(shù)設(shè)置實驗
實驗首先從RBM的參數(shù)設(shè)定進(jìn)行。通過查閱文獻(xiàn)[11],經(jīng)過多次試驗,將RBM的參數(shù)設(shè)置為:epsilonw=0.1,epsilonvb=0.1,epsilonhb=0.1,weightcose=0.000 2,initialmomentum=0.5,finalmomentum=0.9。
由于神經(jīng)網(wǎng)絡(luò)的抽象性,迭代的次數(shù)對實驗結(jié)果有很大影響。若迭代次數(shù)過小,則數(shù)據(jù)不能夠很好地描述較抽象的特征;若迭代次數(shù)過大,則實驗所花費(fèi)的時間將大大增加。通過實驗發(fā)現(xiàn),迭代20次以后,分類效果已經(jīng)穩(wěn)定,繼續(xù)增加迭代次數(shù)分類效果提升不明顯。
文獻(xiàn)[12]指出,隱藏層的節(jié)點數(shù)對特征提取有一定影響。當(dāng)隱藏層節(jié)點數(shù)目過多時,會導(dǎo)致過擬合;同樣,當(dāng)隱藏層節(jié)點數(shù)過小時,兩層神經(jīng)元之間的鏈接過少,層與層之間的權(quán)值向量不能很好地表示相關(guān)信息。通過多次實驗,發(fā)現(xiàn)其他參數(shù)不變,當(dāng)隱藏層節(jié)點個數(shù)為60的時候,分類結(jié)果最好。圖10所示為不同迭代次數(shù)下的分類結(jié)果,圖11所示為隱藏層個數(shù)對分類結(jié)果的影響。
圖10 不同迭代次數(shù)下的分類效果
圖11 隱藏層個數(shù)對分類結(jié)果的影響
3.3實驗結(jié)果分析
圖12所示為各方法的分類效果圖,表2所示為各類方法的參數(shù)對比。由圖12a的分類結(jié)果示意圖可以看出,SVM算法能夠?qū)?類地物都比較好地分類出來,特別是對Woods的分類準(zhǔn)確度達(dá)到了97.89%。但是由于高光譜圖像存在“同物異譜,同譜異物”的現(xiàn)象,造成該算法在某些地物的分類上容易發(fā)生誤分和漏分的現(xiàn)象。從圖12a中的標(biāo)注可以看出,該方法對Corn-Notill這類地物的分類效果很差,大部分都被錯分為地物Soybeans-Mintill,Soybeans-Clean這類地物也有一部分被錯分為Soybeans-Mintill。表2的實驗數(shù)據(jù)反映該方法對地物Corn-Notill的分類精度只有58.67%,這也進(jìn)一步印證了該算法的缺陷。
圖12 各方法的分類效果圖
基于RBM的兩種方法由于采用了多層RBM訓(xùn)練網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行處理,能夠深度挖掘很抽象的特征,在一定程度上改善了誤分的現(xiàn)象。圖12a中SVM分類方法將很大一部分的Hay-Windrowed誤分為Grass/Pasture,
表2各種方法的分類效果
地物種類SVMRBM+SPRBM+BP擴(kuò)散平滑+RBM+BPCorn-Notill0.58670.70730.74020.7421Grass/Pasture0.73780.88410.86750.8850Grass/Trees0.96750.94110.97530.9696Hay-Windrowed0.63820.92470.90380.9251Soybeans-Notill0.66760.76340.80760.7966Soybeans-Mintill0.77520.80530.79190.8045Soybeans-Clean0.61920.60030.63740.6233Woods0.97890.92810.95180.9637OA0.76710.82240.84070.8476AA0.74640.81930.83440.8387Kappa0.71900.76850.77010.7727
在圖12b和圖12d中可以看出該現(xiàn)象均得到了很好的改善。雖然對Woods的分類效果較SVM方法略有下降,但是對Corn-Notill,Grass/Trees,Grass/Pasture,Hay-Windrowed,Soybeans-Notill和Soybeans-Mintill這幾類地物的分類效果都有所提升。特別是DBN網(wǎng)絡(luò),由于BP神經(jīng)網(wǎng)絡(luò)的反向傳播特性,能夠?qū)ο到y(tǒng)進(jìn)行微調(diào),使得該網(wǎng)絡(luò)的分類效果進(jìn)一步提升。表2的數(shù)據(jù)也顯示它的幾項參數(shù)均比其他兩種方法有顯著提升。
從圖12c和圖12d可以看出,經(jīng)過擴(kuò)散平滑去噪處理后,分類效果得到改善。圖13所示為去噪前后的參數(shù)對比。由圖13和表2也可看出,去噪后的分類效果在Kappa系數(shù)、平均精度和總體精度上均有提高。實驗驗證本文方法改善了DBN系統(tǒng)在去噪方面的不足,對遙感圖像地物分類的效果顯著,證明該方法可行。
圖13 去噪前后評估參數(shù)對比
針對DBN在去噪方面的不足,提出了一種基于改進(jìn)的擴(kuò)散平滑和限制玻爾茲曼機(jī)的高光譜圖像特征提取及分類方法。該方法利用一種改進(jìn)的擴(kuò)散平滑算法,對高光譜圖像不同的梯度區(qū)域采取不同程度的擴(kuò)散平滑,有效去除噪聲;然后利用RBM網(wǎng)絡(luò),采用級聯(lián)的網(wǎng)絡(luò)結(jié)構(gòu),充分挖掘數(shù)據(jù)的深層抽象特征;最后將提取的特征作為BP(SP)的輸入,對各類地物進(jìn)行分類。實驗結(jié)果表明,本文提出的算法在各類地物分類效果以及總體分類準(zhǔn)確率上,相比其他算法,都取得一定程度的提高。本文方法在去噪方面仍有改進(jìn)的空間,可以結(jié)合PCA和字典學(xué)習(xí)的優(yōu)點進(jìn)行更好的去噪處理。該方法優(yōu)化后將在城市規(guī)劃、農(nóng)業(yè)生產(chǎn)和森林植被調(diào)查等領(lǐng)域有很好的應(yīng)用前景。
[1]GURRAMP.Algorithmsformultispectralandhyperspectralimageanalysis[J].Journalofelectrical&computerengineering,2013(2):11-16.
[2]AHMADM,LEES,HAQIU,etal.Hyperspectralremotesensing:dimensionalreductionandendmemberextraction[J].Internationaljournalofsoftcomputing&engineering,2012,2(2):25-29.
[3]都業(yè)軍,周肅,方吉宙.人工神經(jīng)網(wǎng)絡(luò)在遙感影像分類中的應(yīng)用與對比研究[J].測繪科學(xué),2015(增刊1):53-123.
[4]HAYKINS.Neuralnetworksandlearningmachines[M]. 3rded.NewJersey:PearsonEducation,2009.
[5]譚琨,杜培軍. 基于支持向量機(jī)的高光譜遙感圖像分類[J].紅外與毫米波學(xué)報, 2008, 27(2): 123-128.
[6]NIUX,BANYF.AnovelcontextualclassificationalgorithmformultitemporalpolarimetricSARdata[J].IEEEgeoscienceandremotesensingletters,2014,11(3):681-685.
[7]呂啟,竇勇,牛新,等.基于DBN模型的遙感圖像分類[J].計算機(jī)研究與發(fā)展,2014,51(9):1911-1918.
[8]HINTONGE,SALAKHUTDINOVRR.Reducingthedimensionalityofdatawithneuralnetworks[J].Science,2006(13):504-507.
[9]MIDHUNME,NAIRSR,PRABHAKARVTN,etal.Deepmodelforclassificationofhyperspectralimageusingrestrictedboltzmannmachine[C]//ICONIAAC′14.[S.l.]:IEEE,2014:1-7.
[10]張春霞,姬楠楠,王冠偉.受限波爾茲曼機(jī)[J].工程數(shù)學(xué)學(xué)報,2015,32(2):159-173.
[11]LUOX,ZHAOC,PANJ,etal.Remotesensingimageintelligentclassificationanditsapplication[J].Publishinghouseofelectronicsindustry,2011(8):19-27.[12]LAROCHELLE H,BENGIO Y,LOURADOUR J,et al. Exploring strategies for training deep neural networks[J]. The journal of machine learning research,2009(10):1-40.
歐陽寧(1972— ),教授,主要研究領(lǐng)域為智能圖像處理、智能信息處理、數(shù)據(jù)融合、計算機(jī)應(yīng)用等;
高鑫(1988— ),碩士生,主研高光譜圖像去噪和分類;
袁華(1975— ),碩士,講師,主研圖像處理、智能圖像處理。
責(zé)任編輯:時雯
Feature extraction and classification of hyperspectral image based on improved diffusion smoothing and RBM
OUYANG Ning,GAO Xin,YUAN Hua
(KeyLaboratoryofCognitiveRadioandInformationProcessing,GuilinUniversityofElectronicTechnology,GuangxiGuilin541004,China)
In order to improve the shortcomings of traditional classification methods in hyperspectral remote sensing image denoising and feature extraction, a new method based on improved diffusion smoothing algorithm and RBM model is proposed. The method uses the adaptive diffusion coefficient to the high spectral image denoising. To the corresponding regions, different degree of diffusion smoothing is adopted to realize the fast denoising of hyperspectral remote sensing image.Then, restricted Boltzmann machine is used to build DBN network to classify hyperspectral remote sensing images. The experimental results show that, compared with the traditional classification method and DBN, the proposed method obviously improve the classification accuracy of the remote sensing image.
diffusion smoothing; restricted Boltzmann machine; hyperspectral; remote sensing; neural network
TN911.73
ADOI:10.16280/j.videoe.2016.010.005
國家自然科學(xué)基金項目(61362021);廣西自然科學(xué)基金項目(2013GXNSFDA019030;2013GXNSFAA019331;2014GXNSFDA118035);廣西科技開發(fā)項目(桂科攻1348020-6;桂科能1298025-7);桂林電子科技大學(xué)研究生科研創(chuàng)新項目(YJCXS201531)
2016-02-05
文獻(xiàn)引用格式:歐陽寧,高鑫,袁華.基于改進(jìn)的擴(kuò)散平滑和RBM的高光譜圖像分類[J].電視技術(shù),2016,40(10):22-27.
OUYANG N,GAO X,YUAN H.Feature extraction and classification of hyperspectral image based on improved diffusion smoothing and RBM[J].Video engineering,2016,40(10):22-27.