摘 要:為探究基于主成分分析(Principal Component Analysis,PCA)下貝葉斯優(yōu)化(Bayesian Optimization,BO)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)算法(PCA-BO-CNN)模型對(duì)人工林樹種識(shí)別的方法,以提高遙感技術(shù)在人工林樹種識(shí)別中的準(zhǔn)確率和魯棒性。以塞罕壩機(jī)械林場為研究區(qū)域,利用Sentinel-1遙感數(shù)據(jù)、Sentinel-2遙感數(shù)據(jù)、數(shù)字高程模型(digitalElevation Model,DEM)數(shù)據(jù)及森林資源二類調(diào)查數(shù)據(jù)和PCA-BO-CNN算法模型結(jié)合,并與其他不同算法模型對(duì)比分析,以提高人工林樹種識(shí)別的準(zhǔn)確性。結(jié)果表明,1)相比PCA算法處理前,PCA算法處理后多源數(shù)據(jù)特征的PCA1—PCA39共計(jì)39個(gè)特征的標(biāo)準(zhǔn)差和特征間的區(qū)分性明顯提升。因此,PCA算法處理有利于提升對(duì)華北落葉松、白樺、樟子松、蒙古櫟和云杉主要優(yōu)勢(shì)樹種及非林地的識(shí)別精度;2)在PCA算法處理前,BO-隨機(jī)森林(random forest,RF)算法模型對(duì)主要優(yōu)勢(shì)樹種及非林地識(shí)別的總體準(zhǔn)確度(OA)和Kappa系數(shù)精度,分別為81. 87%,0. 754 5。在PCA算法處理后,PCA-BO-CNN算法模型對(duì)主要優(yōu)勢(shì)樹種及非林地識(shí)別的OA和Kappa系數(shù)精度相對(duì)提高,分別為83. 10%,0. 770 3;3)相比PCA算法處理前的BO-RF算法模型,PCA算法處理后的PCA-BO-CNN算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地識(shí)別的調(diào)和平均數(shù)(F1)、OA和Kappa系數(shù)的整體精度相對(duì)較高。具體,相比BO-RF算法模型PCA-BO-CNN算法模型的OA提升了1. 24%,且相比PCA算法處理前PCA-BO-CNN 算法模型OA提升了3. 71%。與其他算法模型相比,基于PCA-BO-CNN算法模型的人工林樹種識(shí)別方法具有很強(qiáng)的準(zhǔn)確性和魯棒性,為掌握塞罕壩林場人工林的樹種分布,進(jìn)而了解森林碳儲(chǔ)量、森林對(duì)氣候變化的響應(yīng)、制定碳減排政策以及推動(dòng)森林可持續(xù)發(fā)展提供重要的理論依據(jù)。
關(guān)鍵詞:PCA-BO-CNN模型; 塞罕壩林場; 人工林; 遙感技術(shù); 樹種識(shí)別
中圖分類號(hào):S771. 8 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10. 7525/j. issn. 1006-8023. 2025. 02. 009
0 引言
森林作為陸地生態(tài)系統(tǒng)的重要組成部分,擁有巨大的碳儲(chǔ)能力[1-3]。人工林在森林中扮演著重要角色,特別是我國人工林面積居全球首位,對(duì)于維持森林碳循環(huán)、緩解全球氣候變化具有深遠(yuǎn)意義[4]。因此,了解人工林碳儲(chǔ)量對(duì)于掌握我國森林碳匯儲(chǔ)量、應(yīng)對(duì)氣候變化、制定碳減排政策以及推動(dòng)森林可持續(xù)發(fā)展至關(guān)重要[5]。然而,人工林碳儲(chǔ)量的估算與森林樹種類型息息相關(guān)。不同森林樹種類型之間的儲(chǔ)碳能力存在明顯差異,僅靠統(tǒng)一森林含碳率估算無法提供準(zhǔn)確的人工林碳儲(chǔ)量信息[6]。因此,準(zhǔn)確的人工林樹種識(shí)別變得越來越重要,成為獲取可靠森林碳儲(chǔ)量信息的關(guān)鍵。
目前,人工林樹種識(shí)別的方法主要包括樣地清查法和基于遙感技術(shù)的樹種識(shí)別方法[7]。相比傳統(tǒng)人工對(duì)森林樹種識(shí)別的樣地清查法,基于遙感技術(shù)的樹種識(shí)別方法因遙感數(shù)據(jù)和計(jì)算機(jī)圖像解譯算法的不斷發(fā)展,逐漸成為人工林樹種識(shí)別的首選途徑[8]。特別是圖像解譯深度學(xué)習(xí)算法的發(fā)展,如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)模型作為一種深度學(xué)習(xí)的圖像處理和識(shí)別方法,在基于遙感技術(shù)的林分、樹種結(jié)構(gòu)圖像識(shí)別領(lǐng)域取得了顯著成果[9-10]。而在人工林樹種識(shí)別方面,CNN模型仍有很大的提升空間。此外,與以往的基于遙感技術(shù)的樹種識(shí)別方法相比,CNN模型不再需要人工對(duì)遙感數(shù)據(jù)進(jìn)行深層參數(shù)特征的提?。?1],而是通過卷積運(yùn)算自主學(xué)習(xí)到遙感數(shù)據(jù)的參數(shù)特征,從而提高人工林樹種識(shí)別的效率和準(zhǔn)確性。然而,CNN模型作為人工林樹種識(shí)別模型具有不易調(diào)整的模型超參數(shù),且僅靠人工經(jīng)驗(yàn)進(jìn)行模型超參數(shù)調(diào)整存在很大的局限性[12]。為此,引入貝葉斯優(yōu)化超參數(shù)(Bayesian optimization,BO)算法對(duì)CNN人工林樹種識(shí)別模型的超參數(shù)進(jìn)行調(diào)整。相比其他模型超參數(shù)的優(yōu)化算法,BO算法是一種全局優(yōu)化的手段,在超參數(shù)調(diào)整、機(jī)器學(xué)習(xí)模型選擇和神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索等方面表現(xiàn)出色[13],在一定程度上能夠提高樹種識(shí)別的準(zhǔn)確率和魯棒性。此外,多源數(shù)據(jù)特征的特征選擇是樹種識(shí)別中面臨的又一難題,為了解決這一難題,引入了主成分分析算法對(duì)遙感數(shù)據(jù)進(jìn)行特征優(yōu)選,從而提高樹種識(shí)別的準(zhǔn)確率。因此,通過主成分分析算法對(duì)多源數(shù)據(jù)特征進(jìn)行優(yōu)選,利用BO算法對(duì)CNN模型的超參數(shù)進(jìn)行優(yōu)化是提高CNN模型人工林樹種識(shí)別性能和準(zhǔn)確度的基礎(chǔ)[14]。
塞罕壩機(jī)械林場(以下簡稱為塞罕壩林場)作為我國典型的人工林國有林場之一[15],是京津冀乃至華北地區(qū)重要的森林碳庫。為了準(zhǔn)確估算該林場的森林碳儲(chǔ)量,亟須提高人工林樹種識(shí)別的準(zhǔn)確率和魯棒性。因此,本研究選擇了塞罕壩林場作為研究區(qū)域,旨在探究一種基于主成分分析下的貝葉斯優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)(PCA-BO-CNN)算法模型的人工林樹種識(shí)別方法,以提高其實(shí)用性和準(zhǔn)確性。PCA-BO-CNN算法模型將主成分分析算法、貝葉斯優(yōu)化算法與CNN算法相結(jié)合,通過自動(dòng)篩選多源數(shù)據(jù)特征并調(diào)整CNN模型的超參數(shù),從而提高人工林樹種識(shí)別的效率和準(zhǔn)確性,該方法不僅為局地區(qū)域人工林樹種識(shí)別提供了高效和準(zhǔn)確的方法,還為掌握森林碳儲(chǔ)量、了解氣候變化的影響、制定碳減排政策以及推動(dòng)森林可持續(xù)發(fā)展提供了重要的理論依據(jù)。
1 研究區(qū)概況與數(shù)據(jù)
1. 1 研究區(qū)概況
塞罕壩林場位于河北省承德市最北部,地處冀蒙邊界,地理位置為:116°51′~117°39′ E,41°02′~42°36′ N,如圖1所示。林場南北向長為58. 6 km,東西向?qū)挒?5. 6 km,林場總面積92 634. 7 hm2。地勢(shì)中部高,東南、西北低,由中部分別向東南、西北傾斜,海拔1 010~1 940 m,平均坡度在20°。年均降水日數(shù)134 d,年均降水量452 mm,主要集中在6—8月,占全年降水量的67. 6%。林場屬于寒溫帶大陸性季風(fēng)氣候區(qū),冬、春季較長,氣溫低且多風(fēng);夏季短,日照強(qiáng),溫差大。林場擁有豐富的土壤類型和復(fù)雜的氣候條件,孕育了多種多樣的植物種群,有森林、草原、草甸和灌叢等。其中,森林覆蓋率達(dá)80% 以上,主要優(yōu)勢(shì)樹種包括:華北落葉松(Larixgmelinii var. principis-rupprechtii)、白樺(Betula platy?phylla)、樟子松(Pinus sylvestris var. mongholica)、蒙古櫟(Quercus mongolica) 和云杉(Picea aspe?rata)等。
1. 2 數(shù)據(jù)與預(yù)處理
1. 2. 1 Sentinel-1/2和數(shù)字高程模型數(shù)據(jù)
Sentinel 系列衛(wèi)星是歐洲航天局(Europeanspace agency,ESA)哥白尼計(jì)劃發(fā)射的衛(wèi)星,主要提供Sentinel-1合成孔徑雷達(dá)遙感數(shù)據(jù)(synthetic apertureradar,SAR)和Sentinel-2 光學(xué)多光譜遙感數(shù)據(jù)(multi-spectral imagery,MSI)等。其中,Sentinel-1遙感衛(wèi)星是由A和B雙星組成,同時(shí)搭載C波段SAR傳感器[16],具有條帶模式、干涉寬幅模式、超寬幅模式和波浪模式4種成像模式,能夠全天候作業(yè)、不受氣候條件的限制,支持交叉極化(VH)和垂直極化(VV)兩種常見的極化方式,Sentinel-1遙感數(shù)據(jù)具體的參數(shù)見表1。
Sentinel-2遙感衛(wèi)星同樣由A和B雙星組成,雙星的重訪周期為5 d,搭載MSI成像儀[17],提供可見光、紅外和近紅外波段在內(nèi)的13個(gè)光譜波段,空間分辨率從10、20 m到60 m,Sentinel-2遙感數(shù)據(jù)具體的參數(shù)見表2。根據(jù)ESA 官方網(wǎng)站公布的相關(guān)信息,Sentinel-2遙感數(shù)據(jù)包括2A和1C 2種等級(jí),其中2A級(jí)數(shù)據(jù)是經(jīng)過大氣校正的遙感數(shù)據(jù)能夠直接用于試驗(yàn),1C 級(jí)數(shù)據(jù)是需要采用官方網(wǎng)站提供的Sen2Cor插件進(jìn)行大氣校正后得到2A級(jí)數(shù)據(jù)用于試驗(yàn)[18]。本研究使用的Sentinel-1_IW(IW為干涉寬幅模式數(shù)據(jù))和Sentinel-2_MSIL2A(MSIL2A為多光譜影像)遙感數(shù)據(jù)均是通過ESA哥白尼哨兵科學(xué)數(shù)據(jù)中心(https://browser. dataspace. copernicus. eu/)進(jìn)行免費(fèi)下載,并且采集時(shí)間與地面調(diào)查的森林資源二類調(diào)查數(shù)據(jù)相接近,云含量小于5% 的2020年的6月、8月、10月遙感數(shù)據(jù),且每期數(shù)據(jù)包括1景Sentinel-1_IW 數(shù)據(jù)和3 景Sentinel-2_MSIL2A 遙感數(shù)據(jù)。此外,數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù)即DEM數(shù)據(jù)是一種常用于反映地表森林植被等地貌特征的數(shù)據(jù)。DEM數(shù)據(jù)是從地理空間數(shù)據(jù)云官方網(wǎng)站(https://www. gscloud. cn/)進(jìn)行2020年數(shù)據(jù)的免費(fèi)下載,并按照6月、8月、10月分成同樣的3份DEM數(shù)據(jù)。
數(shù)據(jù)預(yù)處理包括:1)Sentinel-1遙感數(shù)據(jù),由于SAR數(shù)據(jù)受地形起伏和斑點(diǎn)噪聲影響引起幾何和輻射畸變,為此利用ESA的開源SNAP軟件對(duì)其進(jìn)行軌道校正、輻射定標(biāo)、熱噪聲去除、Deburst處理、多視處理、濾波處理、地理編碼和按照塞罕壩林場邊界進(jìn)行裁剪,獲得后向散射系數(shù)(Sigma0_VV_db、Sigma0_VH_db)雷達(dá)特征。2)Sentinel-2遙感數(shù)據(jù),通過SNAP軟件的Sen2Cor大氣校正處理器進(jìn)行大氣校正得到2A級(jí)遙感數(shù)據(jù),以及輻射定標(biāo)、拼接、重采樣和按照塞罕壩林場邊界進(jìn)行裁剪,獲得13個(gè)波段遙感數(shù)據(jù)(B1,B2,…B8,B8A,B9,…B12)。在此基礎(chǔ)上,去除3個(gè)用于監(jiān)測大氣的B1、B9和B10波段,剩下的10個(gè)波段,即B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12波段均能用于反映森林資源參數(shù)的特征。因此,本研究選取Sentine1-2遙感數(shù)據(jù)的B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12波段光譜特征用于樹種識(shí)別。3)DEM數(shù)據(jù),利用ArcGIS軟件對(duì)其重投影、重采樣、坡度、坡向分析和塞罕壩林場區(qū)域裁剪,提取高程(Elevation)、坡向(Aspect)和坡度(Slope)地形特征。為了便于后續(xù)塞罕壩林場的主要優(yōu)勢(shì)樹種及非林地的分類識(shí)別,將Sentinel-1、Sentinel-2和DEM全部數(shù)據(jù)的空間分辨率均重采樣為統(tǒng)一像元大小20 m的柵格數(shù)據(jù)。塞罕壩林場提取的多源數(shù)據(jù)特征見表3。
1. 2. 2 地面調(diào)查數(shù)據(jù)
根據(jù)2020年完成的森林資源二類調(diào)查矢量數(shù)據(jù)(以下簡稱為二調(diào)數(shù)據(jù)),塞罕壩林場的華北落葉松(HBLYS)、白樺(BH)、樟子松(ZZS)、蒙古櫟(MGL)和云杉(YS)主要優(yōu)勢(shì)樹種及非林地(FLD)在塞罕壩林場二類調(diào)查矢量數(shù)據(jù)的具體空間分布情況,如圖2所示。
根據(jù)圖2的塞罕壩林場主要優(yōu)勢(shì)樹種及非林地的空間分布狀況,使用ArcGIS軟件采集主要優(yōu)勢(shì)樹種及其非林地的分類識(shí)別樣本。為了獲取準(zhǔn)確的分類識(shí)別樣本,通過Google Earth提供的高分辨率數(shù)據(jù)進(jìn)行分類識(shí)別樣本相對(duì)位置的驗(yàn)證,以確保分類識(shí)別樣本的數(shù)量和精度。塞罕壩林場的主要優(yōu)勢(shì)樹種及其非林地分類識(shí)別樣本的空間分布,如圖3所示。
塞罕壩林場主要優(yōu)勢(shì)樹種及非林地有效的分類識(shí)別樣本總計(jì)有7 278個(gè)。其中,華北落葉松樣本數(shù)最多為3 088個(gè),云杉樣本數(shù)最少為263個(gè)。為保證樣本數(shù)的充足性,以樣點(diǎn)最多的華北落葉松為基準(zhǔn)數(shù),將其他類別的分類識(shí)別樣本進(jìn)行袋內(nèi)重復(fù)采樣至3 088個(gè),使各樹種的分類識(shí)別樣本具有相似的權(quán)重。塞罕壩林場主要優(yōu)勢(shì)樹種及非林地分類識(shí)別樣本的具體數(shù)量見表4。
2 研究方法
2. 1 主成分分析特征選擇
主成分分析算法(principal component analysis,PCA)是一種常用的特征降維算法,在實(shí)踐中廣泛地應(yīng)用于遙感數(shù)據(jù)的特征優(yōu)選[19],尤其是高光譜、多光譜遙感數(shù)據(jù)。其中,多光譜遙感數(shù)據(jù)含多個(gè)波段,利用PCA算法,可以對(duì)其進(jìn)行多維正交線性轉(zhuǎn)換,使原始重復(fù)冗余的數(shù)據(jù)生成新的組分不相關(guān)的數(shù)據(jù),降低了數(shù)據(jù)的重復(fù)和冗余程度,因此PCA算法對(duì)遙感數(shù)據(jù)具有分離信息、減少相關(guān)、突出不同地物特征的作用。本研究使用PCA算法對(duì)多源數(shù)據(jù)特征(表3)進(jìn)行特征優(yōu)選。其中,PCA算法的具體計(jì)算為
Y = AX。(1)
式中:Y 為主成分變換后的遙感數(shù)據(jù);A 為將X 轉(zhuǎn)換到Y(jié) 的變換矩陣;X 為主成分變換前的遙感數(shù)據(jù)。
2. 2 貝葉斯優(yōu)化算法
常見的算法模型中超參數(shù)優(yōu)化的方法有粒子群優(yōu)化算法、遺傳優(yōu)化算法和貝葉斯優(yōu)化算法(Bayesian optimization algorithm,BO)等。其中,BO算法是一種以概率貝葉斯原理為基礎(chǔ)的全局優(yōu)化算法,其在對(duì)一組超參數(shù)進(jìn)行運(yùn)算的同時(shí),也考慮了先前的超參數(shù)集合,以此得到模型的最優(yōu)超參數(shù)組合。BO算法相較于其他超參數(shù)優(yōu)化算法,能夠在較短的迭代計(jì)算時(shí)間內(nèi)獲得最優(yōu)超參數(shù)組合[20]。貝葉斯定理公式為
式中:f為含超參數(shù)的黑箱函數(shù);t為觀測集合總數(shù);D1:t為已觀測點(diǎn)集合;xt為決策向量;yt為觀測值;εt為觀測誤差;P(D1:t| f)為y的似然函數(shù)分布;P(f)為目標(biāo)函數(shù)f 的先驗(yàn)函數(shù)分布;P(D1:t| f)為f 的邊際似然函數(shù)分布,用來優(yōu)化可變參數(shù);P(f | D1:t )為f 的后驗(yàn)函數(shù)分布,表示修正先驗(yàn)函數(shù)分布后未知目標(biāo)函數(shù)的置信度。此外,BO算法由先驗(yàn)函數(shù)與采集函數(shù)2個(gè)重要部分組成[21]。本研究以高斯過程(Gaussian Process)先驗(yàn)函數(shù)和改進(jìn)概率函數(shù)采集函數(shù)提高樹種識(shí)別模型的泛化能力。BO算法的具體流程如圖4所示。
2. 3 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是一種典型深度學(xué)習(xí)算法模型,具有多層網(wǎng)絡(luò)結(jié)構(gòu),在圖像識(shí)別領(lǐng)域得到廣泛的應(yīng)用[22]。CNN模型包括特征提取和特征映射兩層主要結(jié)構(gòu),根據(jù)功能又可分為輸入層、卷積層、池化層、展平層、全連接層和輸出層[23],如圖5所示。本研究CNN算法模型是2D CNN算法,其輸入層是獲取柵格數(shù)據(jù)特征并將圖像的像素值轉(zhuǎn)換成對(duì)應(yīng)的像素二維矩陣,傳遞給卷積層;卷積層是利用卷積核對(duì)像素二維矩陣進(jìn)行卷積操作,得到一個(gè)新的像素二維矩陣即特征圖像;池化層是對(duì)特征圖像進(jìn)行特征掃描,將其最具代表性的特征提取出來,起到減少模型參數(shù)數(shù)量的同時(shí),保留了原圖像的重要特征、有效防止過擬合;全連接層是將提取的所有像素二維矩陣特征圖進(jìn)行“展平”處理,變?yōu)橐痪S特征向量,為輸出層提供基礎(chǔ)數(shù)據(jù);輸出層是將全連接層得到的一維向量經(jīng)過線性或非線性的計(jì)算得到不同類別的識(shí)別概率,這概率一般是在每一種分類位置都會(huì)得到一個(gè)概率值,取最大的概率值,得到最終樹種的識(shí)別結(jié)果。
2. 4 PCA-BO-CNN樹種識(shí)別模型
PCA 特征優(yōu)選下貝葉斯優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)(PCA Bayesian optimization convolutional neural network,PCA-BO-CNN)是一種通過PCA算法對(duì)多源數(shù)據(jù)特征進(jìn)行優(yōu)選和BO 算法優(yōu)化CNN 超參數(shù)的方法。本研究PCA-BO-CNN 樹種識(shí)別模型的具體流程:數(shù)據(jù)預(yù)處理即對(duì)Sentinel-1遙感數(shù)據(jù)、Sentinel-2遙感數(shù)據(jù)、DEM數(shù)據(jù)和二調(diào)數(shù)據(jù)進(jìn)行預(yù)處理,得到多源數(shù)據(jù)的特征組合并進(jìn)行歸一化與識(shí)別樣本數(shù)據(jù)的像元行列數(shù)相同;同時(shí),將樹種識(shí)別樣本數(shù)據(jù)隨機(jī)劃分成70%的訓(xùn)練集和30%的測試集,用于識(shí)別模型的訓(xùn)練和精度評(píng)估;PCA算法對(duì)多源數(shù)據(jù)特征進(jìn)行優(yōu)選,BO算法在超參數(shù)搜索空間中迭代選擇配置超參數(shù),并在訓(xùn)練集上進(jìn)行訓(xùn)練。然后根據(jù)測試集的性能評(píng)估結(jié)果,更新模型的先驗(yàn)知識(shí),收斂到更好的模型超參數(shù)組合,完成塞罕壩林場優(yōu)勢(shì)樹種的識(shí)別任務(wù),如圖6所示。同時(shí),與貝葉斯優(yōu)化隨機(jī)森林算法(BO-RF)、貝葉斯優(yōu)化人工神經(jīng)網(wǎng)絡(luò)算法(BO-ANN)和經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)算法(AlexNet、GoogLeNet 和VGGNet)對(duì)比分析,以驗(yàn)證PCA-BOCNN算法對(duì)樹種識(shí)別的準(zhǔn)確性和魯棒性。
2. 5 樹種分類識(shí)別后精度評(píng)價(jià)
為了定量評(píng)估PCA-BO-CNN 等不同算法模型對(duì)樹種識(shí)別中的表現(xiàn)性能,本研究采用混淆矩陣法進(jìn)行樹種識(shí)別精度的評(píng)價(jià)。其中,評(píng)價(jià)指標(biāo)主要包括制圖精度(producer accuracy,PA,式中記為PA)、用戶精度(user accuracy,UA,式中記為UA)、總體精度(overall accuracy,OA)和Kappa 系數(shù)(Kappa)[24]。而在實(shí)際分類中,PA和UA又相互制衡,不能準(zhǔn)確判斷分類的優(yōu)劣,所以引入PA 和UA 的調(diào)和平均值(F1)評(píng)價(jià)分類效果[25]。其中,F(xiàn)1的計(jì)算公式為
式中:F1的取值范圍是[0,1]。
3 結(jié)果與分析
3. 1 多源數(shù)據(jù)特征優(yōu)選及可分性分析
通過ArcGIS軟件波段組合工具將塞罕壩林場6月、8 月和10 月的Sigma0_VV_db、Sigma0_VH_db、B2、B3、B4、B5、B6、B7、B8、B8A、B11、B12、Elevation、Aspect和Slope多源數(shù)據(jù)特征進(jìn)行組合成一張柵格數(shù)據(jù),如圖7(a)所示;通過ArcGIS 軟件多值提取至點(diǎn)的工具,按照華北落葉松、白樺、樟子松、蒙古櫟和云杉主要優(yōu)勢(shì)樹種及非林地分類識(shí)別樣本將6月、8月和10月多源數(shù)據(jù)特征的像元值提取至各分類識(shí)別樣本點(diǎn),并經(jīng)過歸一化處理后繪制優(yōu)勢(shì)樹種及非林地的多源數(shù)據(jù)特征分布及標(biāo)準(zhǔn)差曲線,結(jié)果如圖7(b)和如圖7(c)所示。此外,通過PCA 算法,對(duì)塞罕壩林場6 月、8 月和10 月的多源數(shù)據(jù)特征進(jìn)行特征優(yōu)選處理(累積貢獻(xiàn)率達(dá)100%),如圖8 所示,并篩選出PCA1—PCA39 共計(jì)39個(gè)特征,結(jié)果如圖8(a)所示;同理,按照華北落葉松、白樺、樟子松、蒙古櫟和云杉主要優(yōu)勢(shì)樹種及非林地分類識(shí)別樣本將PCA算法處理后的多源數(shù)據(jù)特征的像元值提取至各主要優(yōu)勢(shì)樹種及非林地的分類識(shí)別樣本點(diǎn),并經(jīng)過歸一化后繪制不同樹種的多源數(shù)據(jù)特征分布及標(biāo)準(zhǔn)差曲線,結(jié)果如圖8(b)和如圖8(c)所示。
根據(jù)圖7和圖8可知,相比PCA算法處理前6月、8 月和10 月多源數(shù)據(jù)特征,PCA 算法處理后6 月、8月和10月多源數(shù)據(jù)特征的PCA1—PCA39標(biāo)準(zhǔn)差明顯高于PCA算法處理前的多源數(shù)據(jù)特征的標(biāo)準(zhǔn)差,同時(shí),PCA算法處理后多源數(shù)據(jù)特征的區(qū)分性相對(duì)較大。即塞罕壩林場的華北落葉松、白樺、樟子松、蒙古櫟和云杉優(yōu)勢(shì)樹種及非林地能夠更好地通過PCA算法處理后6月、8月和10月多源數(shù)據(jù)的PCA1—PCA39進(jìn)行主要優(yōu)勢(shì)樹種及非林地的區(qū)分識(shí)別。因此,通過PCA算法處理多源數(shù)據(jù)特征有利于提升對(duì)華北落葉松、白樺、樟子松、蒙古櫟和云杉主優(yōu)勢(shì)樹種及非林地的識(shí)別精度。
3. 2 多源數(shù)據(jù)特征樹種識(shí)別及精度分析
通過BO-RF、BO-ANN、BO-CNN、AlexNet、Goog-LeNet和VGGNet不同算法模型,對(duì)塞罕壩林場PCA處理前的多源數(shù)據(jù)特征進(jìn)行華北落葉松、白樺、樟子松、蒙古櫟和云杉主要優(yōu)勢(shì)樹種及非林地的識(shí)別,不同算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地的識(shí)別結(jié)果,如圖9 所示。同時(shí),通過Arc‐GIS 軟件創(chuàng)建隨機(jī)點(diǎn)工具隨機(jī)生成2 184 個(gè)隨機(jī)測試樣本點(diǎn)用于主要優(yōu)勢(shì)樹種及非林地識(shí)別精度的評(píng)價(jià)。即隨機(jī)生成總分類識(shí)別樣本數(shù)的30%的隨機(jī)樣本,用于不同算法模型對(duì)塞罕壩林場PCA處理前多源數(shù)據(jù)特征主要優(yōu)勢(shì)樹種及非林地的識(shí)別結(jié)果進(jìn)行混淆矩陣的計(jì)算,并基于此混淆矩陣進(jìn)行F1、OA 和Kappa 系數(shù)指標(biāo)的計(jì)算,結(jié)果見表5。
根據(jù)圖9和表5可知,在經(jīng)過PCA算法處理前6月、8月和10月多源數(shù)據(jù)特征進(jìn)行華北落葉松、白樺、樟子松、蒙古櫟和云杉主要優(yōu)勢(shì)樹種及非林地的識(shí)別中,BO-RF算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地的識(shí)別的OA精度相對(duì)較高,其次是AlexNet、BO-ANN、BO-CNN、VGGNet和GoogLeNet。
此外,通過BO-RF、BO-ANN、BO-CNN、AlexNet、GoogLeNet和VGGNet不同算法模型,對(duì)塞罕壩林場PCA算法處理后的多源數(shù)據(jù)特征PCA1—PCA39進(jìn)行主要優(yōu)勢(shì)樹種及非林地的識(shí)別,不同算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地的識(shí)別結(jié)果,如圖10所示。同樣,通過上述隨機(jī)生成的2 184個(gè)隨機(jī)測試樣本點(diǎn)用于PCA算法處理后多源數(shù)據(jù)特征主要優(yōu)勢(shì)樹種及非林地的識(shí)別結(jié)果進(jìn)行混淆矩陣的計(jì)算進(jìn)而對(duì)F1、OA和Kappa系數(shù)指標(biāo)的計(jì)算,結(jié)果見表6。
根據(jù)圖10和表6可知,相比經(jīng)過PCA算法處理前6 月、8 月和10 月多源數(shù)據(jù)特征的BO-RF、BOANN、BO-CNN、AlexNet、GoogLeNet 和VGGNet 不同算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地識(shí)別的F1、OA和Kappa系數(shù)的精度,經(jīng)過PCA算法處理后的多源組合數(shù)據(jù)的不同算法使主要優(yōu)勢(shì)樹種及非林地識(shí)別的F1、OA和Kappa系數(shù)的精度得到了提升。此外,在經(jīng)過PCA算法處理后多源數(shù)據(jù)特征的PCA1—PCA39樹種識(shí)別中,BO-CNN算法對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地的識(shí)別的OA精度相對(duì)較高,即PCA-BO-CNN 算法模型OA 精度相對(duì)較高,其次是AlexNet、BO-RF、GoogLeNet、VGGNet 和BO-ANN。
3. 3 多源數(shù)據(jù)特征PCA前后最優(yōu)模型對(duì)比分析
通過將在PCA算法處理前多源數(shù)據(jù)特征的不同算法模型在塞罕壩林場主要優(yōu)勢(shì)樹種及非林地識(shí)別中,精度最高的BO-RF算法模型以及將在PCA算法處理后多源數(shù)據(jù)特征PCA1—PCA39的不同算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地識(shí)別中,精度最高的BO-CNN 算法模型(PCA-BO-CNN)的F1、OA和Kappa系數(shù)的精度繪制成圖,結(jié)果如圖11所示。
根據(jù)圖11可知,相比在經(jīng)過PCA算法處理前多源數(shù)據(jù)特征的BO-RF算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地的識(shí)別精度,經(jīng)過PCA算法處理后多源數(shù)據(jù)PCA1—PCA39的PCA-BO-CNN 算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地的識(shí)別的F1、OA和Kappa系數(shù)的整體精度相對(duì)較高。具體,相比BO-RF算法模型PCA-BO-CNN算法模型的OA提升了1. 24%,且相比PCA 算法處理前PCA-BOCNN算法模型OA提升了3. 71%。
4 結(jié)論與討論
基于Sentinel-1 遙感數(shù)據(jù)、Sentinel-2 遙感數(shù)據(jù)和DEM數(shù)據(jù)的共計(jì)有45個(gè)多源數(shù)據(jù)特征以及二調(diào)數(shù)據(jù)的主要優(yōu)勢(shì)樹種分類識(shí)別樣本特征,通過使用BO-RF、BO-ANN、BO-CNN、AlexNet、GoogLeNet 和VGGNet不同算法模型對(duì)PCA算法處理前后的多源數(shù)據(jù)特征進(jìn)行主要優(yōu)勢(shì)樹種的識(shí)別及精度評(píng)價(jià),以此驗(yàn)證PCA-BO-CNN 算法模型對(duì)主要優(yōu)勢(shì)樹種識(shí)別的準(zhǔn)確性和魯棒性。主要結(jié)論:1)相比PCA算法處理前,PCA 算法處理后多源數(shù)據(jù)特征的PCA1—PCA39的標(biāo)準(zhǔn)差和特征間的區(qū)分性明顯提升。因此,通過PCA算法處理多源數(shù)據(jù)特征有利于提升對(duì)華北落葉松、白樺、樟子松、蒙古櫟和云杉主優(yōu)勢(shì)樹種及非林地的識(shí)別精度;2)在PCA算法處理前,BO-RF算法模型對(duì)主要優(yōu)勢(shì)樹種及非林地識(shí)別的OA和Kappa系數(shù)精度相對(duì)較高,分別為81. 87%,0. 754 5。在PCA算法處理后,PCA-BO-CNN算法模型對(duì)主要優(yōu)勢(shì)樹種及非林地識(shí)別的OA和Kappa系數(shù)精度相對(duì)較高,分別為83. 10%,0. 770 3;3)相比PCA算法處理前的BO-RF算法模型,經(jīng)過PCA算法處理后的PCA-BO-CNN算法模型對(duì)塞罕壩林場主要優(yōu)勢(shì)樹種及非林地識(shí)別的F1、OA和Kappa系數(shù)的整體精度相對(duì)較高。具體,相比BO-RF算法模型PCA-BO-CNN算法模型的OA提升了1. 24%,且相比PCA算法處理前PCA-BO-CNN算法模型OA提升了3. 71%。
塞罕壩林場是非常典型的人工林區(qū)域之一[26],在一定程度上加強(qiáng)了PCA-BO-CNN 算法模型的泛化能力和實(shí)用性,但本研究在進(jìn)行泛化能力驗(yàn)證時(shí),受客觀條件限制,只選取了Sentinel系列數(shù)據(jù)和DEM數(shù)據(jù),可能不夠充分,為此可以再選取其他不同人工林研究區(qū)、不同分辨率、不同時(shí)相的遙感數(shù)據(jù),進(jìn)行豐富的泛化能力測試驗(yàn)證試驗(yàn)。此外,訓(xùn)練數(shù)據(jù)集存在樣本不平衡的情況,樣本不平衡會(huì)使得PCA-BO-CNN算法模型偏向樣本較多的類別,導(dǎo)致模型對(duì)于樣本較少的類別分類精度不高,日后可以嘗試一些其他方式,如遷移學(xué)習(xí),以期在新的遙感數(shù)據(jù)中獲得更佳的人工林樹種識(shí)別效果。此外,可以探索將PCA-BO-CNN 算法模型應(yīng)用于其他領(lǐng)域,如森林健康監(jiān)測、樹木生長狀況評(píng)估等諸多方面的研究應(yīng)用。
【參 考 文 獻(xiàn)】
[1] 馬學(xué)威,熊康寧,張俞,等. 森林生態(tài)系統(tǒng)碳儲(chǔ)量研究進(jìn)展與展望[J]. 西北林學(xué)院學(xué)報(bào),2019,34(5):62-72.
MA X W,XIONG K N,ZHANG Y,et al. Research progressesand prospects of carbon storage in forest ecosystems[J]. Journal of Northwest Forestry University,2019,34(5):62-72.
[2] 張穎,孟娜,姜逸菲. 中國森林碳匯與林業(yè)經(jīng)濟(jì)發(fā)展耦合及長期變化特征分析[J]. 北京林業(yè)大學(xué)學(xué)報(bào),2022,44(10):129-141.
ZHANG Y,MENG N,JIANG Y F. Coupling and long-termchange characteristics analysis of forest carbon sequestrationand forestry economic development in China[J]. Journalof Beijing Forestry University,2022,44(10):129-141.
[3] ZHANG D N,ZHAO Y H,WU J S. Assessment of carbonbalance attribution and carbon storage potential in China′sterrestrial ecosystem[J]. Resources,Conservation and Recycling,2023,189(2):106748.
[4] 梅夢(mèng)媛,雷一東. 我國人工林新時(shí)代發(fā)展形勢(shì)分析[J].世界林業(yè)研究,2019,32(3):73-77.
MEI M Y,LEI Y D. Analysis on development trend ofChina′s plantation in new era[J]. World Forestry Research,2019,32(3):73-77.
[5] 劉曉曼,王超,高吉喜,等. 服務(wù)雙碳目標(biāo)的中國人工林生態(tài)系統(tǒng)碳增匯途徑[J]. 生態(tài)學(xué)報(bào),2023,43(14):5662-5673.
LIU X M,WANG C,GAO J X,et al. Approaches to carbonsequestration enhancement in China′s plantation ecosystemfor carbon peaking and carbon neutrality goals[J].Acta Ecologica Sinica,2023,43(14):5662-5673.
[6] 涂宏濤,周紅斌,馬國強(qiáng),等. 基于第九次森林資源清查的云南森林碳儲(chǔ)量特征研究[J]. 西北林學(xué)院學(xué)報(bào),2023,38(3):185-193.
TU H T,ZHOU H B,MA G Q,et al. Characteristics of forestcarbon storage in Yunnan based on the ninth forest inventorydata[J]. Journal of Northwest Forestry University,2023,38(3):185-193.
[7] 陳永富,陳巧,劉華. 基于遙感圖像的林況因子提取研究進(jìn)展[J]. 世界林業(yè)研究,2022,35(2):53-58.
CHEN Y F,CHEN Q,LIU H. Research progress in forestcondition factors extraction based on remote sensing images[J]. World Forestry Research,2022,35(2):53-58.
[8] 李華玉,陳永富,陳巧,等. 基于遙感技術(shù)的森林樹種識(shí)別研究進(jìn)展[J]. 西北林學(xué)院學(xué)報(bào),2021,36(6):220-229.
LI H Y,CHEN Y F,CHEN Q,et al. Research progress offorest tree species identification based on remote sensingtechnology[J]. Journal of Northwest Forestry University,2021,36(6):220-229.
[9] 江濤,王新杰. 基于卷積神經(jīng)網(wǎng)絡(luò)的高分二號(hào)影像林分類型分類[J]. 北京林業(yè)大學(xué)學(xué)報(bào),2019,41(9):20-29.
JIANG T,WANG X J. Convolutional neural network forGF-2 image stand type classification[J]. Journal of BeijingForestry University,2019,41(9):20-29.
[10] 劉嘉政,王雪峰,王甜. 基于多特征融合和CNN模型的樹種圖像識(shí)別研究[J]. 北京林業(yè)大學(xué)學(xué)報(bào),2019,41(11):76-86.
LIU J Z,WANG X F,WANG T. Image recognition of treespecies based on multi feature fusion and CNN model[J].Journal of Beijing Forestry University,2019,41(11):76-86.
[11] 周維勛. 基于深度學(xué)習(xí)特征的遙感影像檢索研究[J].測繪學(xué)報(bào),2023,52(1):167-179.
ZHOU W X. Research on remote sensing image retrievalbased on deep learning features[J]. Acta Geodaetica etCartographica Sinica,2023,52(1):167-179.
[12] 李紅宇,黃志鵬,張廣玲,等. 動(dòng)態(tài)權(quán)重證據(jù)推理規(guī)則的CNN 超參數(shù)質(zhì)量評(píng)估[J]. 小型微型計(jì)算機(jī)系統(tǒng),2021,42(5):1015-1021.
LI H Y,HUANG Z P,ZHANG G L,et al. Quality assessmentof CNN hyper-parameters based on dynamic weightevidential reasoning rule[J]. Journal of Chinese ComputerSystems,2021,42(5):1015-1021.
[13] 崔佳旭,楊博. 貝葉斯優(yōu)化方法和應(yīng)用綜述[J]. 軟件學(xué)報(bào),2018,29(10):3068-3090.
CUI J X,YANG B. Survey on Bayesian optimization methodologyand applications[J]. Journal of Software,2018,29(10):3068-3090.
[14] 鄧帥. 基于改進(jìn)貝葉斯優(yōu)化算法的CNN超參數(shù)優(yōu)化方法[J]. 計(jì)算機(jī)應(yīng)用研究,2019,36(7):1984-1987.
DENG S. Hyper-parameter optimization of CNN based onimproved Bayesian optimization algorithm[J]. ApplicationResearch of Computers,2019,36(7):1984-1987.
[15] 常偉強(qiáng). 塞罕壩機(jī)械林場森林資源動(dòng)態(tài)變化分析[J].林業(yè)資源管理,2018,1(6):13-17.
CHANG W Q. Analysis on dynamic changes of the forestresources in Saihanba Mechanized Forest Farm[J]. ForestResources Management,2018,1(6):13-17.
[16] TORRES R,SNOEIJ P,GEUDTNER D,et al. GMES Sentinel-1 mission[J]. Remote Sensing of Environment,2012,120(5):9-24.
[17] DRUSCH M,DEL BELLO U,CARLIER S,et al. Sentinel-2: ESA′s optical high-resolution mission for GMES operationalservices[J]. Remote Sensing of Environment,2012,120(5):25-36.
[18] SU W,ZHANG M Z,JIANG K P,et al. Atmospheric correctionmethod for Sentinel-2 satellite imagery[J]. ActaOptica Sinica,2018,38(1):0128001.
[19] BARSHAN E,GHODSI A,AZIMIFAR Z,et al. Supervisedprincipal component analysis: Visualization,classificationand regression on subspaces and submanifolds[J]. Pattern Recognition,2011,44(7):1357-1371.
[20] 周旭,王認(rèn)卓,代亞勛,等. 基于BO-XGBoost的煤自燃分級(jí)預(yù)警研究[J]. 煤炭工程,2022,54(8):108-114.
ZHOU X,WANG R Z,DAI Y X,et al. Classified earlywarning of coal spontaneous combustion based on BO-XGBoost[J]. Coal Engineering,2022,54(8):108-114.
[21] 王媛彬,李媛媛,韓騫,等. 基于PCA-BO-XGBoost的礦井回采工作面瓦斯涌出量預(yù)測[J]. 西安科技大學(xué)學(xué)報(bào),2022,42(2):371-379.
WANG Y B,LI Y Y,HAN Q,et al. Gas emission predictionof the stope in coal mine based on PCA-BO-XGBoost[J]. Journal of Xi′an University of Science and Technology,2022,42(2):371-379.
[22] 范迎迎,張姍姍. 基于深度主動(dòng)學(xué)習(xí)的高光譜遙感圖像分類方法[J]. 東北師大學(xué)報(bào)(自然科學(xué)版),2022,54(4):64-70.
FAN Y Y,ZHANG S S. Hyperspectral remote sensingimage classification method based on deep active learning[J]. Journal of Northeast Normal University (Natural ScienceEdition),2022,54(4):64-70.
[23] 胡越,羅東陽,花奎,等. 關(guān)于深度學(xué)習(xí)的綜述與討論[J]. 智能系統(tǒng)學(xué)報(bào),2019,14(1):1-19.
HU Y,LUO D Y,HUA K,et al. Overview on deep learning[J]. CAAI Transactions on Intelligent Systems,2019,14(1):1-19.
[24] 張開放,蘇華友,竇勇. 一種基于混淆矩陣的多分類任務(wù)準(zhǔn)確率評(píng)估新方法[J]. 計(jì)算機(jī)工程與科學(xué),2021,43(11):1910-1919.
ZHANG K F,SU H Y,DOU Y. A new multi-classificationtask accuracy evaluation method based on confusionmatrix[J]. Computer Engineering amp; Science,2021,43(11):1910-1919.
[25] 劉靈,張加龍,韓雪蓮,等. 基于GEE和Sentinel時(shí)序影像的優(yōu)勢(shì)樹種識(shí)別研究[J]. 森林工程,2023,39(1):63-72.
LIU L,ZHANG J L,HAN X L,et al. Dominant speciesclassification based on Google Earth Engine and Sentineltime-series data[J]. Forest Engineering,2023,39(1):63-72.
[26] 李斌,李崇貴,李煜. 基于Sentinel-2數(shù)據(jù)的塞罕壩機(jī)械林場落葉松人工林提?。跩]. 林業(yè)資源管理,2021,1(2):117-123.
LI B,LI C G,LI Y. Research on larch extraction in SaihanbaMechanical Forest Farm based on Sentinel-2 data[J]. Forest Resource Management,2021,1(2):117-123.
基金項(xiàng)目:中央引導(dǎo)地方科技發(fā)展資金項(xiàng)目(246Z5901G);河北省自然科學(xué)基金青年基金(D2019209322;2019209317);唐山市科技局應(yīng)用基礎(chǔ)研究計(jì)劃(20130202b);華北理工大學(xué)博士專項(xiàng)經(jīng)費(fèi)(BS201818)。