趙 霖 張曉麗 吳艷雙 張 斌
(北京林業(yè)大學(xué)森林培育與保護(hù)教育部重點(diǎn)實(shí)驗(yàn)室 精準(zhǔn)林業(yè)北京市重點(diǎn)實(shí)驗(yàn)室 北京100083)
樹(shù)種精細(xì)分類(lèi)對(duì)于提取樹(shù)木特征屬性、經(jīng)營(yíng)管理以及保護(hù)生物多樣性十分重要,是森林資源監(jiān)測(cè)的基礎(chǔ)和關(guān)鍵內(nèi)容之一。傳統(tǒng)的樹(shù)種分類(lèi)主要依靠人力野外調(diào)查,成本高,費(fèi)時(shí)費(fèi)力,且調(diào)查信息不夠全面,不利于森林樹(shù)種信息的更新。林業(yè)中廣泛使用的多光譜遙感數(shù)據(jù)光譜分辨率較低,也難以獲得精確的樹(shù)種分類(lèi)結(jié)果。精細(xì)的樹(shù)種分類(lèi)往往依賴(lài)于豐富的數(shù)據(jù),如多時(shí)相/多季相、多數(shù)據(jù)源融合(雷達(dá)、高光譜、高空間分辨率)等,但實(shí)際應(yīng)用中這些數(shù)據(jù)獲取成本較高,且不容易得到; 同時(shí),樹(shù)種分類(lèi)研究需要對(duì)這些數(shù)據(jù)進(jìn)行特征提取、特征選擇,工作量較大,且針對(duì)某一區(qū)域或某些樹(shù)種的特征篩選結(jié)果不能很好地適用于其他區(qū)域。高光譜影像(hyperspectral image,HSI)波譜間隔窄,包含更多的光譜信息,能夠探測(cè)、區(qū)分出具有細(xì)微光譜差異的各類(lèi)地物。隨著遙感傳感器的快速發(fā)展,高光譜數(shù)據(jù)的獲取和收集更加容易,成本也大幅降低,特別是機(jī)載高光譜數(shù)據(jù),兼?zhèn)涓呖臻g和高光譜分辨率特征,數(shù)據(jù)獲取靈活快捷。因此,基于機(jī)載高光譜數(shù)據(jù)的樹(shù)種分類(lèi)研究具有重要意義。
在進(jìn)行基于高光譜數(shù)據(jù)的樹(shù)種分類(lèi)時(shí),一般先對(duì)數(shù)據(jù)降維,然后采用支持向量機(jī)(support vector machine,SVM)、隨機(jī)森林等方法進(jìn)行分類(lèi); 但高光譜影像中包含大量連續(xù)的窄波段,簡(jiǎn)單的降維不能充分發(fā)揮高光譜影像的優(yōu)勢(shì)。近年來(lái),深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)和圖像處理領(lǐng)域表現(xiàn)優(yōu)異,并在圖像分類(lèi)、物體檢測(cè)等方面得到了廣泛應(yīng)用?;谏疃葘W(xué)習(xí)的方法一般是構(gòu)建3層以上的多層網(wǎng)絡(luò)學(xué)習(xí)不同水平數(shù)據(jù)表示的模型,以充分提取和利用輸入數(shù)據(jù)(如圖像、語(yǔ)音、文本等)中包含的信息。模型可由低級(jí)特征學(xué)習(xí)到高級(jí)特征,實(shí)現(xiàn)抽象和不變特征的提取,并進(jìn)一步實(shí)現(xiàn)如分類(lèi)和目標(biāo)檢測(cè)等任務(wù)。目前,深度信念網(wǎng)絡(luò)(deep belief network,DBN)(Hintonetal., 2006a; 2006b)、棧式自編碼器(stacked autoencoder,SAE)(Le Rouxetal., 2010; Vincentetal., 2010)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)(Krizhevskyetal., 2012)等模型已用于高光譜數(shù)據(jù)分類(lèi),研究表明,在分類(lèi)(Szegedyetal., 2015; Simonyanetal., 2014)和目標(biāo)檢測(cè)(Girshicketal., 2014)任務(wù)中,CNN明顯優(yōu)于其他深度學(xué)習(xí)模型(如DBN、SAE)。
然而,直接將2D-CNN應(yīng)用于高光譜數(shù)據(jù)分類(lèi)前需對(duì)所有各波段原始數(shù)據(jù)進(jìn)行2D卷積,每個(gè)輸入波段都有一組需要訓(xùn)練的卷積核。不同于普通RGB 三波段圖像,在網(wǎng)絡(luò)輸入的高光譜數(shù)據(jù)光譜維度通常有上百個(gè),需要大量卷積核(參數(shù)),會(huì)導(dǎo)致過(guò)擬合,并顯著增加計(jì)算成本,因此,在應(yīng)用2D-CNN進(jìn)行特征提取和分類(lèi)前往往采用降維法降低原始數(shù)據(jù)的光譜維數(shù)。Yue 等(2015)通過(guò)主成分分析(principal component analysis,PCA)從HSI中提取前3個(gè)主成分,使用2D-CNN對(duì)壓縮后窗口大小為42×42的高光譜數(shù)據(jù)提取深度特征并預(yù)測(cè)每個(gè)像素的類(lèi)別。Makantasis等(2015)在使用2D-CNN進(jìn)行特征提取和分類(lèi)前,采用隨機(jī)主成分分析(randomized PCA, R-PCA)沿光譜維度壓縮HSI,僅保留前10或前30的主成分用于后續(xù)分類(lèi)任務(wù)。此類(lèi)方法在訓(xùn)練CNN模型前通過(guò)降維將HSI數(shù)據(jù)壓縮到可管理的規(guī)模,不能很好地保留光譜信息,且由于空間特征和光譜特征是分開(kāi)提取的,無(wú)法充分利用空間/光譜聯(lián)合特征,進(jìn)而影響分類(lèi)性能。為解決這一問(wèn)題,國(guó)內(nèi)外學(xué)者將3D-CNN(Lietal., 2017; 李竺強(qiáng)等, 2018)引入到HSI分類(lèi),但其采用的是年代比較久遠(yuǎn)的公開(kāi)數(shù)據(jù)集,空間分辨率低、數(shù)據(jù)量小,且網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,提出的方法并不能適用于機(jī)載高光譜數(shù)據(jù)分類(lèi)。
鑒于此,本研究在以往研究基礎(chǔ)上,針對(duì)機(jī)載高光譜數(shù)據(jù)特點(diǎn),提出一種新的3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)。該模型將全光譜帶作為輸入,不需要額外的預(yù)處理或后處理,得到的深度分類(lèi)器模型以端到端方式進(jìn)行訓(xùn)練。在相同規(guī)模上,3D-CNN比其他基于深度學(xué)習(xí)的方法涉及更少的參數(shù),更適合于HSI分類(lèi)中訓(xùn)練樣本數(shù)量有限的情況。將3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)與其他基于深度學(xué)習(xí)的HSI分類(lèi)方法以及目前林業(yè)中常用的面向?qū)ο蠓指睢㈦S機(jī)森林特征篩選方法進(jìn)行比較,3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)能夠?qū)崿F(xiàn)更高精度、更高效率的森林樹(shù)種分類(lèi)。
研究區(qū)位于廣西南寧國(guó)有高峰林場(chǎng)界牌分場(chǎng)(圖1),地理位置108°31′E,22°58′N(xiāo),屬南亞熱帶季風(fēng)氣候,年均氣溫21.6 ℃,極端最高溫40.0 ℃,極端最低溫-2 ℃,年均降雨量1 304.2 mm,平均相對(duì)濕度79%。森林植被以人工林為主,其中針葉林主要包括杉木(Cunninghamialanceolata)、馬尾松(Pinusmassoniana),闊葉林包括巨尾桉(Eucalyptusgrandis×E.urophylla)、尾葉桉(Eucalyptusurophylla)、紅椎(Castanopsishystrix)、油茶(Camelliaoleifera)等。
1.2.1 機(jī)載高光譜數(shù)據(jù) 研究采用的高光譜數(shù)據(jù)由中國(guó)林業(yè)科學(xué)研究院機(jī)載LiCHy(LiDAR,CCD and Hyperspectral)系統(tǒng)搭載的AISA EagleⅡ衍射光柵推掃式高光譜成像儀獲取。AISA EagleⅡ高光譜數(shù)據(jù)采集于2018年1月13日和1月30日,共飛行2個(gè)架次,實(shí)際飛行航高約1 000 m。獲取的高光譜數(shù)據(jù)包含125個(gè)波段,波長(zhǎng)范圍400~1 000 nm,光譜分辨率3.3 nm,空間分辨率1 m。LiCHy系統(tǒng)在采集高光譜數(shù)據(jù)時(shí),同步獲取研究區(qū)LiDAR數(shù)據(jù)、CCD影像以及IMU(慣導(dǎo))和GPS數(shù)據(jù)。CCD影像空間分辨率為0.2 m,用于輔助地面真實(shí)值的勾畫(huà)和驗(yàn)證; LiDAR數(shù)據(jù)為高光譜數(shù)據(jù)預(yù)處理過(guò)程中提供精確的DEM。LiCHy系統(tǒng)AISA EagleⅡ高光譜主要參數(shù)見(jiàn)表1。
圖1 廣西南寧高峰林場(chǎng)界牌分場(chǎng)Fig.1 Jiepai, Gaofeng forest farm, Nanning city of Guangxi
表1 LiCHy系統(tǒng)AISA EagleⅡ 高光譜主要參數(shù)Tab.1 The main parameters of AISA EagleⅡ hyperspectral system of LiCHy
對(duì)原始AISA EagleⅡ高光譜數(shù)據(jù)進(jìn)行預(yù)處理,包括輻射定標(biāo)、幾何校正、影像空間分辨率重采樣、正射校正、大氣校正、地形輻射校正等(莢文等, 2016)。根據(jù)SPECIM公司提供的AISA EagleⅡ傳感器定標(biāo)文件完成輻射定標(biāo)。 基于LiCHy系統(tǒng)同步獲取的DEM及定位姿態(tài)系統(tǒng)(position and orientation system, POS)提供的航跡文件完成幾何校正。大氣校正是為了消除成像時(shí)光照和大氣對(duì)地物反射率的影響,反演地物本身的反射率,以便于下一步地物特征提取和分類(lèi)。機(jī)載高光譜數(shù)據(jù)受大氣影響較小,校正相對(duì)容易,本研究采用ENVI 5.3 的QUAC快速大氣校正工具進(jìn)行高光譜數(shù)據(jù)的大氣校正。為了減弱地形對(duì)光譜的影響,采用綜合輻射校正法(integrated radiometric correction,IRC)(Kobayashietal., 2009)完成地形輻射校正。
1.2.2 野外調(diào)查數(shù)據(jù) 研究所用數(shù)據(jù)包括森林資源二類(lèi)調(diào)查小班數(shù)據(jù)和2018年1—2月野外調(diào)查數(shù)據(jù),調(diào)查點(diǎn)分布見(jiàn)圖1,各地物類(lèi)型分別調(diào)查10~20個(gè)點(diǎn)。外業(yè)調(diào)查前通過(guò)GF-2數(shù)據(jù)目視解譯,確定調(diào)查區(qū)域,設(shè)置樣地和采樣點(diǎn)位置。2018年1月16日—2月5日開(kāi)展地面樣地?cái)?shù)據(jù)調(diào)查,主要集中在杉木純林、桉樹(shù)純林和闊葉混交林內(nèi),共調(diào)查19塊樣地,其中6塊為桉樹(shù)純林、7塊為杉木純林、其余為其他林分和混交林,樹(shù)種主要包括桉樹(shù)、杉木、紅椎、馬尾松等,共1 657株。樣地大小為25 m×25 m和25 m×50 m,使用手持GPS實(shí)地觀測(cè)樣本精確位置,記錄坡度、坡向等樣地信息,進(jìn)行每木檢尺,包括樹(shù)種、樹(shù)高、冠幅、枝下高、胸徑等。
結(jié)合實(shí)地調(diào)查情況以及本研究目的,將研究區(qū)劃分為尾葉桉、巨尾桉、紅椎、米老排(Mytilarialaosensis)、其他軟闊、濕地松(Pinuselliottii)、杉木、馬尾松、油茶9種森林植被類(lèi)別和建筑用地、道路、采伐跡地3種非森林植被類(lèi)別。
傳統(tǒng)的2D-CNN中,卷積運(yùn)算僅用于捕獲2D特征圖的空間特征;而在處理3D數(shù)據(jù)如視頻分析時(shí),需要同時(shí)捕獲空間維度和時(shí)間維度信息。為了解決這個(gè)問(wèn)題,Ji等(2013)首次提出3D-CNN,即將3D卷積運(yùn)算應(yīng)用于3D特征圖以計(jì)算3D輸入數(shù)據(jù)(如視頻數(shù)據(jù))的“時(shí)空特征”。
在高光譜數(shù)據(jù)分類(lèi)中,保留豐富的光譜信息是非常重要的。2D卷積運(yùn)算是在空間維度對(duì)輸入數(shù)據(jù)進(jìn)行卷積,無(wú)論輸入數(shù)據(jù)是2D數(shù)據(jù)還是3D數(shù)據(jù),輸出的特征圖都是相對(duì)獨(dú)立的2D數(shù)據(jù),將2D卷積運(yùn)算應(yīng)用于高光譜數(shù)據(jù),會(huì)丟失大量光譜信息; 而3D卷積運(yùn)算同時(shí)在空間維度和光譜維度上對(duì)輸入數(shù)據(jù)進(jìn)行卷積,輸出的是3D 立方塊(volume),可以保留高光譜數(shù)據(jù)輸入的光譜信息。
2D卷積運(yùn)算可以表示為:
(1)
3D卷積運(yùn)算可以表示為:
(2)
式中:S表示3D卷積核在光譜維度上的大小;i表示網(wǎng)絡(luò)上一層特征塊的數(shù)量;j表示該層包含卷積核的個(gè)數(shù)。對(duì)應(yīng)地,該層(第i層)的輸出包括l×j個(gè)3D特征塊(feature volumes)。
高光譜數(shù)據(jù)同時(shí)包括空間信息和光譜信息,本研究將影像中的光譜信息與空間信息整合在一起,以構(gòu)建空間-光譜聯(lián)合CNN分類(lèi)框架。
不同于一般圖像級(jí)別的3D-CNN分類(lèi)模型(Jietal., 2013; Tranetal., 2015),本研究提出的用于高光譜影像分類(lèi)的3D-CNN為像元級(jí)別分類(lèi)模型,輸入數(shù)據(jù)不是整幅高光譜影像,而是像元周?chē)^小的鄰域空間-光譜立方體。
根據(jù)2D-CNN 研究結(jié)果,具有更深架構(gòu)的3×3卷積核的小感受域通常會(huì)產(chǎn)生更好的效果。相對(duì)于圖像級(jí)別的分類(lèi)模型而言,遙感影像分類(lèi)模型采用的輸入數(shù)據(jù)空間大小相對(duì)較小,且卷積運(yùn)算后特征圖的空間大小進(jìn)一步減小,一般都會(huì)使用空間上較小的卷積核以避免輸入信息過(guò)多損失。 Tran等(2015)證明小的3×3×3卷積核是時(shí)空特征學(xué)習(xí)中3D-CNN的最佳選擇。Li等(2017)針對(duì)常見(jiàn)高光譜公開(kāi)數(shù)據(jù)集的3D-CNN研究中同樣采用3×3空間大小的3D卷積內(nèi)核,且取得了很好效果。受此啟發(fā),本研究將3D卷積內(nèi)核的空間大小固定為3×3,在此基礎(chǔ)上將內(nèi)核的光譜深度定為7。模型包含4層卷積層,其中下一層包含的卷積核數(shù)量為上一層的2倍,很多著名的CNN模型,如ImageNet(Krizhevskyetal., 2012)也是采用這樣的比率。
3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,具體過(guò)程如下。
1) 樣本數(shù)據(jù)構(gòu)建: 以目標(biāo)像元為中心,提取大小為S×S×B的空間-光譜立方體及對(duì)應(yīng)標(biāo)簽l作為樣本數(shù)據(jù)。其中S×S為空間鄰域大小,B為影像波段數(shù),S×S×B尺寸數(shù)據(jù)作為模型的輸入數(shù)據(jù)。按比例隨機(jī)抽取每類(lèi)像元,劃分訓(xùn)練樣本、驗(yàn)證樣本和測(cè)試樣本。
圖2 3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)示意Fig.2 3D-CNN network architecture diagram
3) 全連接層: 將最后一層3D卷積層輸出的特征展平,通過(guò)全連接層F1將3D立方體變成維度為1×128的特征向量。
4) Logistic回歸: 在全連接層后添加邏輯回歸分類(lèi)器。Logistic回歸分類(lèi)器采用針對(duì)多分類(lèi)任務(wù)的softmax,將一層輸入特征展平后,輸出屬于類(lèi)i的輸入特征的概率:
(3)
式中:W為權(quán)重;b為偏差;Wi和bi為連接i類(lèi)輸出單元的權(quán)重和偏差;Y為分類(lèi)結(jié)果;s為softmax函數(shù)。輸出層中隱藏單元數(shù)量等于類(lèi)別的總數(shù)。
模型參數(shù)采用隨機(jī)初始化,使用隨機(jī)梯度下降(stochastic gradient descent,SGD)反向傳播來(lái)最小化網(wǎng)絡(luò)損失,完成模型訓(xùn)練。在設(shè)置權(quán)重更新規(guī)則前,需要合適的損失函數(shù)。本研究采用mini-batch更新策略,以適用于大型數(shù)據(jù)集的處理,損失函數(shù)的計(jì)算基于mini-batch輸入,公式如下:
(4)
采用線(xiàn)性修正單元ReLU(Krizhevsketal., 2012)作為激活函數(shù),公式如下:
f(x)=max(0,x)。
(5)
ReLU是一種廣泛使用的非飽和激活函數(shù),就梯度下降和訓(xùn)練時(shí)間而言,效率高于其他飽和激活函數(shù)。
網(wǎng)絡(luò)在最后一層3D卷積層和第1層全連接層中加入Dropout,即按照設(shè)定概率將神經(jīng)元的輸出設(shè)定為0,以減少隱藏單元的相互作用,使網(wǎng)絡(luò)學(xué)習(xí)更具魯棒性特征并降低噪聲的影響,通過(guò)減少過(guò)擬合問(wèn)題來(lái)改善神經(jīng)網(wǎng)絡(luò)(Hintonetal., 2012)。
技術(shù)路線(xiàn)如圖3所示。
完成3D-CNN網(wǎng)絡(luò)設(shè)計(jì)后,配置訓(xùn)練過(guò)程,通過(guò)反向傳播損失函數(shù)梯度更新三維卷積核參數(shù)。由于訓(xùn)練集相對(duì)較小,批量大小(batch size)設(shè)置為64,采用SGD優(yōu)化器完成訓(xùn)練過(guò)程。學(xué)習(xí)速率用于控制每次訓(xùn)練迭代的學(xué)習(xí)進(jìn)度,不合適的學(xué)習(xí)速率會(huì)導(dǎo)致梯度離散或收斂緩慢,本研究采用網(wǎng)格搜索方法,將學(xué)習(xí)速率設(shè)定為{0.01,0.003,0.001,0.003,0.000 1,0.000 3},分別對(duì)模型進(jìn)行300個(gè)周期的訓(xùn)練,基于訓(xùn)練中精度、損失的變化及分類(lèi)結(jié)果,選擇最佳學(xué)習(xí)速率為0.000 1。根據(jù)模型在驗(yàn)證集的表現(xiàn)及最終分類(lèi)結(jié)果,本研究采用的最佳3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表2所示。
為驗(yàn)證3D-CNN在高光譜數(shù)據(jù)中的分類(lèi)能力,本研究采用近年來(lái)樹(shù)種分類(lèi)研究中應(yīng)用較多的面向?qū)ο蠓指?毛學(xué)剛等, 2017)、隨機(jī)森林特征篩選方法(張瑩等, 2018)和2D-CNN(Chenetal., 2016)進(jìn)行對(duì)比分析。
2.4.1 基于特征選擇的面向?qū)ο髽?shù)種分類(lèi) 首先選擇最佳分割參數(shù)進(jìn)行圖像分割,然后采用分層分類(lèi)方法將非林地去除,避免與各樹(shù)種混淆; 從機(jī)載高光譜影像中提取特征變量,包括獨(dú)立成分分析(independent component analysis,ICA)降維波段、光譜指數(shù)、紋理特征及由LiCHy系統(tǒng)同步搭載的LiDAR數(shù)據(jù)獲取的冠層高度模型(canopy height model,CHM)特征(特征見(jiàn)表3);利用隨機(jī)森林法選擇最優(yōu)特征變量。
圖3 技術(shù)路線(xiàn)Fig.3 Technology roadmap
表2 最佳網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)(輸入W=11,N=4)Tab.2 Optimal network structure parameters (input W=11, N=4)
采用2種方案完成樹(shù)種分類(lèi): 1) 將上述所有特征疊加,使用SVM分類(lèi)器對(duì)分割后的對(duì)象進(jìn)行分類(lèi); 2) 采用隨機(jī)森林特征篩選方法從表3的特征中篩選出18個(gè)特征變量用于樹(shù)種分類(lèi),篩選的特征包括4個(gè)ICA變換特征、7個(gè)植被指數(shù)特征(包括歸一化植被指數(shù)NDVI、光化學(xué)植被指數(shù)PRI、綠度歸一化植被指數(shù)GNDVI、植被衰減指數(shù)PSRI、結(jié)構(gòu)不敏感色素指數(shù)SIPI和花青素反射指數(shù)1ARI1)、6個(gè)紋理特征(HOM_G550、ENT_G550、CON_G550、COR_G550、DIS_G650和DIS_R650)以及CHM特征。
2.4.2 基于2D-CNN的樹(shù)種分類(lèi) 通過(guò)PCA將原始數(shù)據(jù)的125個(gè)波段生成3個(gè)主成分,并分別提取27×27×3和9×9×3的數(shù)據(jù)作為原始特征,網(wǎng)絡(luò)中包含3層卷積層和2層池化層。卷積核大小為5×5,每層卷積核個(gè)數(shù)分別為32、64和128。
表3 面向?qū)ο髽?shù)種分類(lèi)中使用的特征Tab.3 Image object metrics used in tree species classification
考慮實(shí)際遙感影像分類(lèi)時(shí)通常難以獲取足夠多的樣本用于模型訓(xùn)練,為了使模型在實(shí)際應(yīng)用中具有可用性,分別從各類(lèi)標(biāo)簽數(shù)據(jù)中隨機(jī)選出10%作為訓(xùn)練數(shù)據(jù)用于模型訓(xùn)練,10%作為驗(yàn)證數(shù)據(jù),在訓(xùn)練過(guò)程中監(jiān)測(cè)模型學(xué)習(xí)效果、調(diào)整模型參數(shù),其余80%作為測(cè)試數(shù)據(jù),用于完成模型測(cè)試及計(jì)算分類(lèi)指標(biāo)。本研究12種地物選取的訓(xùn)練樣本、驗(yàn)證樣本以及測(cè)試樣本像元數(shù)量如表4所示。
基于特征選擇的面向?qū)ο髽?shù)種分類(lèi)在易康軟件中完成,基于2D-CNN和3D-CNN的樹(shù)種分類(lèi)采用Python編程,利用Tensorflow、Keras 開(kāi)源深度學(xué)習(xí)框架實(shí)現(xiàn),運(yùn)行平臺(tái)硬件配置包括IntelRXeon(R) E5-2620 v4 @ 2.10 GHZ CPU及2塊nvidia GeForce GTX 1080Ti GPU。表5為不同分類(lèi)方法的精度對(duì)比,基于深度學(xué)習(xí)的方法模型訓(xùn)練時(shí)間為訓(xùn)練300個(gè)周期(epochs)需要的時(shí)間。
面向?qū)ο蠓指罘椒軌蜉^好識(shí)別出道路、采伐跡地,但馬尾松、濕地松光譜比較接近,混分現(xiàn)象十分嚴(yán)重; 隨機(jī)森林特征篩選方法可有效提高分類(lèi)總體精度,但由于一些特征缺失使得米老排、馬尾松等一些總體數(shù)量較少的類(lèi)別分類(lèi)精度下降。
2D-CNN中,窗口大小為9時(shí)無(wú)法分出馬尾松、建筑用地,且杉木誤分嚴(yán)重, 當(dāng)設(shè)置較大窗口(W=27)時(shí),能實(shí)現(xiàn)較高的總體精度;但對(duì)于細(xì)小地物存在比較嚴(yán)重的誤分(圖4)。網(wǎng)絡(luò)中W=11、N=8時(shí)雖然能夠?qū)崿F(xiàn)最高的總體精度,但是會(huì)引入更多需要訓(xùn)練的參數(shù),增加訓(xùn)練、預(yù)測(cè)時(shí)的計(jì)算成本; 濕地松、其他軟闊、道路等訓(xùn)練樣本數(shù)量相對(duì)少的類(lèi)別分類(lèi)精度相對(duì)低,模型平均精度不如W=11、N=4。3D-CNN(W=11、N=4)在實(shí)現(xiàn)較高精度的同時(shí),訓(xùn)練、預(yù)測(cè)速度相對(duì)快一些。
表4 地物類(lèi)別以及訓(xùn)練樣本、驗(yàn)證樣本、測(cè)試樣本像元數(shù)量Tab.4 Summary of samples for training, validation and testing for each land cover class
表5 不同分類(lèi)方法的精度對(duì)比Tab.5 Comparisons of accuracy assessment results among different methods
為了評(píng)估輸入數(shù)據(jù)空間大小對(duì)模型分類(lèi)能力的影響,本研究嘗試將每個(gè)像元的5×5、7×7、9×9、11×11、13×13鄰域作為輸入對(duì)模型進(jìn)行測(cè)試,結(jié)果如圖5所示??梢园l(fā)現(xiàn),適當(dāng)增加輸入數(shù)據(jù)空間大小有助于提高分類(lèi)精度;然而,過(guò)大的區(qū)域可能產(chǎn)生額外噪聲,尤其當(dāng)像元位于一個(gè)類(lèi)別的角落或邊緣時(shí),會(huì)導(dǎo)致精度下降。此外,過(guò)大的輸入也會(huì)顯著增加網(wǎng)絡(luò)訓(xùn)練、預(yù)測(cè)時(shí)的計(jì)算量,導(dǎo)致需要更長(zhǎng)的訓(xùn)練時(shí)間。綜合上述結(jié)果,11×11窗口能取得較好效果。
圖5 輸入數(shù)據(jù)空間大小對(duì)模型分類(lèi)能力的影響Fig.5 The effect of the spatial size of input data on the classification performence of the model
李竺強(qiáng)等(2018)提出的三維卷積神經(jīng)網(wǎng)絡(luò)在每層卷積層后加入三維最大池化層,該池化層可有效縮小參數(shù)矩陣尺寸,減少最后全連接層中的參數(shù)數(shù)量。與城市土地覆蓋類(lèi)型相比,森林樹(shù)種之間光譜差異較小,引入光譜維度池化的數(shù)據(jù)降維方式會(huì)使原始細(xì)節(jié)丟失,導(dǎo)致分類(lèi)精度下降,所以本研究提出的3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)沒(méi)有加入此類(lèi)池化層。但是保持?jǐn)?shù)據(jù)維度會(huì)造成網(wǎng)絡(luò)后幾層參數(shù)較多,隨著網(wǎng)絡(luò)規(guī)模增大,訓(xùn)練過(guò)程中會(huì)出現(xiàn)過(guò)擬合問(wèn)題。
本研究在最后一層卷積層和全連接層(即整個(gè)網(wǎng)絡(luò)中參數(shù)最多的2層)加入比率為0.5的Dropout,即在每次批訓(xùn)練中,忽略掉一半特征檢測(cè)器,通過(guò)減少特征檢測(cè)器間的相互作用,避免模型過(guò)于依賴(lài)某些局部特征,從而提高模型的泛化性。圖6為加入Dropout與未加入Dropout訓(xùn)練時(shí)精度和損失隨訓(xùn)練迭代次數(shù)的變化情況,可以發(fā)現(xiàn),未加入Dropout時(shí)存在較嚴(yán)重的過(guò)擬合問(wèn)題,即模型對(duì)訓(xùn)練數(shù)據(jù)的適應(yīng)性要優(yōu)于測(cè)試數(shù)據(jù),且當(dāng)?shù)螖?shù)在150左右時(shí),驗(yàn)證集上的損失出現(xiàn)上升; 加入Dropout后可較好解決這一問(wèn)題,并在一定程度上加速了網(wǎng)絡(luò)訓(xùn)練過(guò)程。
將訓(xùn)練樣本數(shù)量由原來(lái)全部數(shù)據(jù)的10%變?yōu)?%、2.5%和20%,檢驗(yàn)?zāi)P驮谛颖居?xùn)練條件下的分類(lèi)效果,結(jié)果如圖7所示??梢园l(fā)現(xiàn),隨著訓(xùn)練樣本數(shù)量減少,模型分類(lèi)總體精度逐漸降低,但當(dāng)僅用全部數(shù)據(jù)的2.5%訓(xùn)練模型、其余95%進(jìn)行測(cè)試時(shí),總體精度為95.89%,仍高于隨機(jī)森林、2D-CNN方法,這說(shuō)明該模型適用于小樣本情況下的應(yīng)用。
圖6 訓(xùn)練時(shí)加入Dropout與未加入Dropout對(duì)比Fig.6 Impact of adding Dropout on model training
圖7 訓(xùn)練樣本數(shù)量對(duì)模型分類(lèi)能力的影響Fig.7 Effect of the number of training samples on classification performence of the model
針對(duì)廣西高峰林場(chǎng)機(jī)載高光譜數(shù)據(jù)的樹(shù)種分類(lèi)結(jié)果表明,本研究提出的3D-CNN結(jié)構(gòu)可獲得比基于傳統(tǒng)面向?qū)ο蠓指?、隨機(jī)森林特征篩選和2D-CNN的樹(shù)種分類(lèi)方法更好的分類(lèi)結(jié)果,通過(guò)合理的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),并選擇合適的訓(xùn)練策略,在少量樣本情況下仍可達(dá)95.89%的總體分類(lèi)精度。
3D-CNN模型能夠充分利用高光譜影像中的空間信息和光譜信息,實(shí)現(xiàn)高精度區(qū)分亞熱帶森林樹(shù)種,且不需要對(duì)數(shù)據(jù)進(jìn)行復(fù)雜預(yù)處理或后處理,同時(shí)也省去人工特征提取、特征篩選的步驟,模型結(jié)構(gòu)相對(duì)簡(jiǎn)單,模型訓(xùn)練、優(yōu)化過(guò)程也比較簡(jiǎn)單,訓(xùn)練過(guò)程僅需61.5 min,使用訓(xùn)練好的模型對(duì)研究區(qū)整幅影像進(jìn)行分類(lèi)僅需62 s。