中圖分類號:S762.2 文獻(xiàn)標(biāo)識碼:A DOI:10.7525/j.issn.1006-8023.2025.03.001
Abstract:Themoisturecontentofforestfloorliterisakeyfactorinforestfireoccurrences,nditsaccuratedetectionis crucial for fire prevention.Near-infrared spectroscopy(NIRS)can directly invert moisturecontent from spectral data, enabling rapid detectionof liter moisture content.However,spectral characteristics difer between fuel types due to variations inlightintensitydataatdiffrent wavelengths,requiringseparatedetectionmodelsforliterfrom dierenttree species to match specific light intensity-moisture content inversion relationships.Collcting and labeling spectral data across differentforeststands is time-consuming,limitingthepracticalapplicationofthespectralmethod.Toaddresthis issue,this study proposesa moisturecontent detection method for forest floor liter basedon Bi-LSTM(Bidirectional Long Short-Term Memory)transferlearning.By transfering the trained modelparameters to new models,we avoid training models from scratch,thereby improving model learning eficiencyand reducing the data required fortraining.The studydemonstrates thatthe Bi-LSTMmethodsurpases the traditional inversion approach using LSTMin termsof detection accuracy.Specifically,the mean absolute errr (MAE)for Quercus mongolicaand Larix gmelinii is reduced by
0 . 6 2 % and 0 . 8 7 % ,respectively,while the mean squared error(MSE)is reduced by 0 . 2 8 % and 0 . 7 0 % ,respectively. Moreover,the Bi-LSTM-based transfer learning approach significantly lessens the reliance on labeled NIR spectraldata. With a target domain sample size of 3OO and a source domain sample size of 1 0 0 0 ,the detection model record an MAE of 3 . 2 7 % ,an MSE of 1. 10 % ,and an of 0.918.When compared to models without source domain training,the MAE and MSE show reductions of 2. 3 6 % and 1 . 0 2 % ,respectively,and an increase in
of 0.114.A comparative analysis before andafterimplementingtransferlearningreveals thathismethodologyoffersanovelstrategytodiminishthetimecostasociated withmodeling moisturecontentin spectralitterand to enhancethepracticalapplicationof spectraldetection. Keywords:Liter fall;moisture content;transfer learning;deep learning;near-infrared spectrum
0 引言
林內(nèi)可燃物作為森林火災(zāi)產(chǎn)生的必要條件之二[1],其中森林地表枯葉含水率(dead fuel forest mois-turecontent,DFFMC)作為一級引火要素是引起森林火災(zāi)的重要因素[2]。其含水率的大小與森林火災(zāi)發(fā)生的可能性、火災(zāi)強(qiáng)度以及蔓延速度具有直接關(guān)系,因此檢測森林地表枯葉的含水率對于預(yù)測森林火災(zāi)風(fēng)險和評估火險等級至關(guān)重要[3-4]。
目前DFFMC的研究方法主要有氣象要素回歸法、平衡含水率法以及遙感光譜法[5],其中,氣象要素回歸法測量方便且建模簡單,在各林區(qū)內(nèi)應(yīng)用廣泛,但這種方法并未考慮到可燃物本身的種類差異,所以該方法測得的枯葉含水率在很大程度上受到可燃物自身特性和研究區(qū)域限制,并未將枯葉含水率按其自身種類細(xì)化[6]。平衡含水率法雖然在小規(guī)模范圍內(nèi)較為精確,但在擴(kuò)展到更大范圍時,其準(zhǔn)確性可能會有所下降[7-8]。因此上述兩種主流方法在一定程度上都會受到測量范圍影響,當(dāng)測量范圍較大時,測量數(shù)值準(zhǔn)確度不高。光譜法可以根據(jù)光譜數(shù)據(jù)直接反映水分含量從而實現(xiàn)枯葉含水率的快速檢測,而且測量數(shù)值準(zhǔn),測量速度快,使用簡便快捷[9-10]。
在以往的對近紅外光譜檢測枯葉含水率研究中,研究人員多采用線性回歸算法對光譜數(shù)據(jù)進(jìn)行含水率反演[1]。但目前沒有研究表明枯葉含水率與葉片光譜的特征波段呈線性關(guān)系[12]。隨著機(jī)器學(xué)習(xí)的發(fā)展,神經(jīng)網(wǎng)絡(luò)越來越多被用于枯葉含水率的檢測研究中[13],相比線性回歸算法神經(jīng)網(wǎng)絡(luò)引入了對非線性關(guān)系的考慮。Peng等[14]利用近紅外光譜對4種不同林分的死可燃物進(jìn)行含水率預(yù)測,采用長短期記憶網(wǎng)絡(luò)(LSTM)和粒子群優(yōu)化算法建立預(yù)測模型,提高了死可燃物含水率的預(yù)測精度。但由于森林地表枯葉種類繁多,每種枯葉間的理化性質(zhì)不同,在近紅外光譜照射時,每種枯葉對水的敏感波段除了 1 4 5 0 n m 也不盡相同[15,而含水率檢測模型的關(guān)鍵在于含水率與枯葉光譜的特征波段建立映射關(guān)系。所以在以往枯葉含水率檢測研究中,不同樹種枯葉通常需要分別建立檢測模型,導(dǎo)致大量已有的標(biāo)記數(shù)據(jù)尚未得到有效利用[16]。針對上述問題,最簡便的途徑是依據(jù)其他林地枯葉樣本,重新構(gòu)建一個校正模型。但重新采集枯葉樣本會增加成本、降低效率,還會降低已有枯葉樣本數(shù)據(jù)的利用率,使光譜法的實際應(yīng)用受到很大限制。
遷移學(xué)習(xí)(transferlearning)是一種機(jī)器學(xué)習(xí)方法,其核心思想在于利用在一個或多個源任務(wù)(sourcetasks)上學(xué)到的知識來幫助目標(biāo)任務(wù)(targettask)的學(xué)習(xí)過程[17],尤其適用于目標(biāo)任務(wù)數(shù)據(jù)稀缺或標(biāo)注成本高昂的場景。遷移學(xué)習(xí)打破了傳統(tǒng)機(jī)器學(xué)習(xí)中“每個任務(wù)從頭開始學(xué)習(xí)”的局限,通過知識的遷移和再利用,顯著提高了學(xué)習(xí)效率和學(xué)習(xí)效果。遷移指將一個在豐富訓(xùn)練數(shù)據(jù)(源域)上訓(xùn)練的模型遷移到另一個具有較少或無注釋訓(xùn)練數(shù)據(jù)任務(wù)的過程[18]。當(dāng)訓(xùn)練的標(biāo)注樣本不足時,可以用已訓(xùn)練好的模型將少量樣本遷移至新的領(lǐng)域(目標(biāo)域),在獲得檢測能力的情況下,較大程度地減少對類似分布樣本的標(biāo)注數(shù)據(jù)的依賴[19]。遷移學(xué)習(xí)方法在圖像、語音和自然語言處理領(lǐng)域已被廣泛應(yīng)用[20]。Li等[21]分別采用降維和遷移學(xué)習(xí)方法,提出了兩種具有較強(qiáng)泛化能力的校正遷移任務(wù)方法,分別是選擇性剪枝與精細(xì)化策略(selectivepruningandrefinementstrategy,SPRS)方法和基于標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate,SNV)的Aug-TrAdaBoost.R2(augmented transfer adaptive bossing forregression)方法。在基于近紅外光(nearinfrared,NIR)的茶葉光譜數(shù)據(jù)集中實現(xiàn)了不同種類茶葉之間以及同種類茶葉不同批次之間的模型遷移。Peng等[22]針對小樣本場景下的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練問題,通過對先驗知識的應(yīng)用來滿足模型遷移的需求。
遷移學(xué)習(xí)可減少訓(xùn)練樣本和測試樣本的分布差異,有效緩解具有相似分布的少量樣本在建模時產(chǎn)生的檢測精度低、模型失效問題。鑒于原有的充足的樣本數(shù)據(jù)和模型良好的檢測性能,本研究為有效利用原有枯葉樣本,將原有枯葉含水率檢測模型遷移用于其他林分枯葉含水率的檢測中,在僅使用少量數(shù)據(jù)的條件下實現(xiàn)對目標(biāo)可燃物光譜-含水率反演模型的準(zhǔn)確建模[23]。本研究將采用深度遷移學(xué)習(xí)方法,建立基于雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(Bi-LSTM)的遷移學(xué)習(xí)森林地表枯葉含水率檢測模型,針對不同林分枯葉需要重新建立含水率檢測模型的問題,以降低深度學(xué)習(xí)模型對不同林分枯葉的標(biāo)注數(shù)據(jù)的依賴性。
為了提高檢測效率,針對現(xiàn)有的模型需要大量數(shù)據(jù)訓(xùn)練的問題,本研究在東北林業(yè)大學(xué)帽兒山實驗林場,選取蒙古櫟(闊葉),落葉松(針葉)兩種有代表性的樹種進(jìn)行研究,通過近紅外光譜儀采集枯葉的光譜光照強(qiáng)度數(shù)據(jù)。采用遷移學(xué)習(xí)方法,將蒙古櫟的光譜光照強(qiáng)度和含水率作為源域,落葉松的光照強(qiáng)度和含水率作為目標(biāo)域,將帶有少量標(biāo)注的自標(biāo)域數(shù)據(jù)輸入到具有微調(diào)機(jī)能檢測模型之中,并對比遷移前后模型性能的提升情況。證明相較傳統(tǒng)方法,基于遷移學(xué)習(xí)的方法可以使用少量帶有數(shù)據(jù)標(biāo)簽的樣本實現(xiàn)更高精度的含水率檢測,為降低光譜枯葉含水率建模時間成本、提高光譜檢測實用性提供新的思路。
1 材料與方法
1.1 研究區(qū)域概況
本研究實驗場地為東北林業(yè)大學(xué)帽兒山實驗林場。林場是中國東北東部山區(qū)的天然次生林,位于黑龍江省尚志市 。帽兒山平均海拔 3 0 0 m ,以帽兒山為主峰,海拔 8 0 5 m 屬溫帶大陸性氣候,年平均氣溫
,年日照 2 4 7 1 . 3 h 無霜期120\~140d,年降水量 7 2 3 . 8 m m 。降雨量以6—8月為主,年蒸發(fā)量
,年平均相對濕度70 % 。主要樹種有蒙古櫟(Quercusmongolica)、白樺(Betulaplatyphylla)落葉松(Larixgmelinii)、滿洲胡桃(Juglansmandshurica)、滿洲白蠟(Fraxinusmandsh-urica)、白楊(Populusdavidiana)紅松(Pinuskoraiensis)和蒙古蘇格蘭松(Pinus sylvestris var. mongolica)。實驗區(qū)域相關(guān)樹種的基本信息見表1。
1. 2 數(shù)據(jù)采集
1.2.1 枯葉含水率測定
根據(jù)該基地現(xiàn)狀,本研究主要針對混交林進(jìn)行研究,選取蒙古櫟、落葉松兩種枯葉,在秋季防火期結(jié)束后,每種枯葉分別隨機(jī)選取1000和800個形狀完好、沒有破損的葉片,用保溫保濕密封袋包裝好帶回實驗室。為防正環(huán)境溫度對含水率產(chǎn)生影響,在進(jìn)行不同批次試驗時對其他葉片進(jìn)行低溫保存。
本研究采用干濕稱重法獲取葉片含水率的標(biāo)準(zhǔn)值。在測量前,將電子秤置于水平且無風(fēng)位置,并調(diào)整氣泡至圓圈中央位置。測量時,等到讀數(shù)穩(wěn)定且連續(xù)3次稱重,當(dāng)讀數(shù)不再變化時,得到枯葉濕質(zhì)量( 。利用精密鼓風(fēng)干燥箱對樣本進(jìn)行烘干,其控溫范圍
,控溫精度 $1 \ { ^ { \circ } \mathrm { C } }$ 。在使用前,通過控制面板設(shè)置烘干溫度
。使用時,等到烘箱內(nèi)穩(wěn)定至所設(shè)置的溫度后再將枯葉樣本放人。待烘干后連續(xù)3次稱重電子秤讀數(shù)不再變化,記錄干質(zhì)量(
??扇嘉锖视嬎愎綖?/p>
式中: M 為不同樹種不同種類樣品觀測時的可燃物含水率, 為可燃物的濕質(zhì)量,
為可燃物的干質(zhì)量,
1.2.2枯葉近紅外光譜數(shù)據(jù)采集
為獲取枯葉的光譜信息,本研究采用Flame-NIR+(OceanInsight,美國)近紅外光譜系統(tǒng),如圖1所示,該系統(tǒng)主要包括光譜儀、近紅外光源、光纖和反射探頭支架等,可以采集到含水率的 9 0 0~1 7 0 0 n m 的光譜數(shù)據(jù),其光學(xué)分辨率為 1 0 n m ,信噪比為6000:1,最大掃描頻率為 。
光源和光譜儀預(yù)熱 3 0 m i n ,光源光照穩(wěn)定后,光源與樣本距離保持一致( 1 c m, ,對枯葉樣本采集正反面光譜各2次,取平均作為葉片光譜。試驗環(huán)境溫度 ,相對濕度 2 8 % ,采集波長范圍 9 5 0~1 7 0 0 n m ,光譜平均次數(shù)50次。首先將采集到的枯葉(落葉松、蒙古櫟)做好標(biāo)記放于培養(yǎng)皿中。用反射探頭支架固定好光纖探頭,保證每次光源照射時與枯葉距離一定。待Oceanview軟件上光強(qiáng)示數(shù)穩(wěn)定后,保存光譜數(shù)據(jù),用于后續(xù)含水率檢測。在此基礎(chǔ)上完成了森林地表枯葉的近紅外光譜檢測以及采集了各個林分枯葉的光譜數(shù)據(jù),如圖2所示。
1.3光譜數(shù)據(jù)預(yù)處理與數(shù)據(jù)集劃分
在收集原始光譜數(shù)據(jù)時,除了枯葉的固有特征外,還可能包含一些干擾信息,如散射、噪聲和基線漂移,這些都可能影響含水率的反演精度。因此,對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理是必要的步驟[24]。本研究采用了標(biāo)準(zhǔn)正態(tài)變量變換(standardnormalvariate,SNV)和S-G(savitzky-golay)平滑兩種預(yù)處理方法對光譜進(jìn)行預(yù)處理,SNV消除光譜散射影響造成的誤差,去除無關(guān)變量,降低光譜維度空間[25];S-G平滑算法是一種利用滑動窗口進(jìn)行卷積運(yùn)算的方法,可以有效降低光譜中的噪聲和干擾信號,同時保留光譜的光滑特征[26]。處理后的圖像如圖3和圖4所示。
本研究通過近紅外光譜數(shù)據(jù)設(shè)備收集了兩種枯葉的光譜信息。選取形狀完好無損的兩種枯葉分別 組和800組,共收集到近紅外光反射率的數(shù)據(jù)1800組。所建立的數(shù)據(jù)集可以分為訓(xùn)練集、測試集和驗證集。在光譜源域數(shù)據(jù)集中,以 8 0 % 作為訓(xùn)練數(shù)據(jù),其余 20 % 作為檢測數(shù)據(jù),以同一葉片編號對應(yīng)的含水量數(shù)據(jù)的 8 0 % 作為訓(xùn)練數(shù)據(jù),其余 2 0 % 作為驗證數(shù)據(jù)。為保證訓(xùn)練集和測試集中的樣本是隨機(jī)的,從而減小偏差,采用Shuffle(對數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行隨機(jī)重新排序)隨機(jī)函數(shù)在數(shù)據(jù)分割之前對數(shù)據(jù)進(jìn)行打亂。
根據(jù)訓(xùn)練集中的光譜反射率訓(xùn)練數(shù)據(jù)和含水量數(shù)據(jù)生成訓(xùn)練模型,將光譜反射率測量數(shù)據(jù)輸入訓(xùn)練模型,獲得含水量檢測結(jié)果。
1.4 Bi-LSTM網(wǎng)絡(luò)架構(gòu)
本研究選取Bi-LSTM作為枯葉含水率檢測遷移模型研究的結(jié)構(gòu)基礎(chǔ),Bi-LSTM是由前向長短期記憶網(wǎng)絡(luò)(LSTM)和后向LSTM組合成的神經(jīng)網(wǎng)絡(luò),將前向和反向神經(jīng)網(wǎng)絡(luò)的隱藏層狀態(tài)向量進(jìn)行拼接[27]。在這種機(jī)制下,Bi-LSTM神經(jīng)網(wǎng)絡(luò)可以根據(jù)枯葉近紅外光譜捕捉特征波段間的雙向信息,提高了模型的準(zhǔn)確性和效率。為了驗證Bi-LSTM用來作為枯葉含水率遷移模型結(jié)構(gòu)基礎(chǔ)的可行性,選取枯葉含水率檢測模型中經(jīng)典算法LSTM作為對比,本研究中使用Bi-LSTM和LSTM兩種建模算法分別對兩種枯葉含水率進(jìn)行反演。
由圖5可以看到,BiLSTM網(wǎng)絡(luò)中正向LSTM結(jié)構(gòu)計算過程與單個LSTM計算過程相似,將正向隱含層狀態(tài)和反向隱含層狀態(tài) 組合得到BiLSTM網(wǎng)絡(luò)的隱含層狀態(tài),其計算公式為
式中: 分別為
時刻的輸入數(shù)據(jù)、正向LSTM隱含層的輸出和反向LSTM隱含層的輸出; α β 均為常系數(shù),分別表示
的權(quán)重。
1.5 基于Bi-LSTM的模型遷移方法研究
為了讓含水率的檢測模型可以實現(xiàn)遷移,進(jìn)而解決現(xiàn)有的模型需要大量數(shù)據(jù)標(biāo)注訓(xùn)練的問題,基于Bi-LSTM的預(yù)訓(xùn)練網(wǎng)絡(luò)方法的核心理念是使用在源域數(shù)據(jù)集上訓(xùn)練完成的網(wǎng)絡(luò)作為一個通用模型。如果源域數(shù)據(jù)集規(guī)模龐大且具有代表性,該網(wǎng)絡(luò)所掌握的空間層次結(jié)構(gòu)便能被遷移至新的、相似領(lǐng)域的小規(guī)模數(shù)據(jù)集上[24]。基于以上論述,本研究采用基于Bi-LSTM和可訓(xùn)練模塊并行融合的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),用于建立蒙古櫟枯葉近紅外光譜的源域檢測模型。圖6為加入帶有微調(diào)機(jī)制的Bi-LSTM網(wǎng)絡(luò)框架的整體設(shè)計:將源域蒙古櫟枯葉近紅外光譜數(shù)據(jù)作為網(wǎng)絡(luò)輸入,全連接層FC(Fullyconnected)與Bi-LSTM以并聯(lián)的方式組合,用于提取具有長距離關(guān)聯(lián)的近紅外光譜特征,為了整合映射光譜特征信息,最后輸出層加入回歸器FCs。
圖7所示。為探究加入FC后對模型的檢測精度的影響,將FC分別與3個串聯(lián)的Bi-LSTM相并聯(lián),此時會產(chǎn)生3種組合方式,分別記為Bi-LSTM1、Bi-LSTM2、Bi-LSTM3,如圖8所示。利用源域校正集對所有網(wǎng)絡(luò)訓(xùn)練,驗證集和檢測集測試其有效性,將檢測得到的結(jié)果中平均絕對誤差(meanabsoluteerror,MAE)最小的網(wǎng)絡(luò)模型作為最優(yōu)源域神經(jīng)網(wǎng)絡(luò)。
對于蒙古櫟枯葉含水率檢測網(wǎng)絡(luò)的超參數(shù)設(shè)置,其隱藏層參數(shù)的設(shè)定,用于執(zhí)行特征提取的Bi-LSTM1—Bi-LSTM3以及FC隱藏層數(shù)保持一致,均為128?;貧w器的FCs隱藏層數(shù)為1。最大Epoch次數(shù),批量大小,全局初始學(xué)習(xí)率分別設(shè)置為 1 5 0 , 3 2 , 0 . 0 0 1 。為了保證源域模型和遷移模型有較強(qiáng)的魯棒性,訓(xùn)練過程中使用均方誤差(meansquareerror,MSE)作為損失函數(shù),利用歐幾里得范數(shù)(L2范數(shù))歸一化,使損失函數(shù)值最小,防止神經(jīng)網(wǎng)絡(luò)過擬合。采用自適應(yīng)動量估計(adaptivemomentestimation,Adam)優(yōu)化器求出訓(xùn)練過程中損失函數(shù)值的最小值。此外,設(shè)置Dropout機(jī)制防止過擬合,如果Dropout率設(shè)置得過高,可能會導(dǎo)致模型欠擬合,因為太多的神經(jīng)元被隨機(jī)丟棄,從而減少了模型的學(xué)習(xí)能力。同時,較低的Dropout率意味著更多的神經(jīng)元參與訓(xùn)練,這有助于模型更快地學(xué)習(xí)數(shù)據(jù)中的復(fù)雜模式,提高訓(xùn)練效率,所以在每個Epoch的訓(xùn)練中,去掉 10 % 神經(jīng)元,以防止訓(xùn)練過擬合。
為達(dá)到小樣本高精度的預(yù)測任務(wù),本研究采用基于Fine-tune(微調(diào))的遷移學(xué)習(xí)方法,如圖9所示,在上述建立好的3種改進(jìn)神經(jīng)網(wǎng)絡(luò)選出預(yù)測效果最好的作為預(yù)訓(xùn)練網(wǎng)絡(luò),將所有預(yù)訓(xùn)練好的FCs參數(shù)權(quán)值被初始化清零,且將預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)中的Bi-LSTM和函數(shù)層(如BatchnormLayers、layernormLayers等)的參數(shù)凍結(jié),然后對FCs進(jìn)行解凍,初始學(xué)習(xí)率設(shè)置為0.001,對目標(biāo)域數(shù)據(jù)進(jìn)行重新訓(xùn)練。通過將預(yù)訓(xùn)練的功能逐步適應(yīng)新數(shù)據(jù),可以實現(xiàn)對帶有少量樣本標(biāo)簽數(shù)據(jù)的檢測性能提升。
1.6 模型評價
在地表枯葉含水率研究領(lǐng)域,模型效果的評價指標(biāo)主要有3個:分別是MSE、MAE和決定系數(shù)(coeffi-cientofdetermination, 。MSE是一種常用的衡量模型預(yù)測值與實際觀測值之間差異的指標(biāo),用于評估模型在給定數(shù)據(jù)上的擬合程度。MSE(式中記為
是通過計算預(yù)測值與實際觀測值之間差異的平方的平均值得到。
式中: m 為樣本總數(shù); 為第 i 個樣本的檢測值; y ( i ) 為第 i 個樣本的真實值。
衡量的是變量間線性關(guān)系的強(qiáng)度,表示在 x 和 y 的總變異中,通過線性關(guān)系可解釋的比例。
越高,意味著自變量對因變量的預(yù)測準(zhǔn)確性越高,模型的擬合度越好。
式中: 為總離差平方和;
為殘差平方和。決定系數(shù)
越大,說明自變量對因變量的解釋程度越高,擬合效果越好。
MAE的值越小,表示模型的檢測準(zhǔn)確性越高。MAE(式中記為 )是一個很直觀地衡量誤差的方式,因為其平等地考慮了所有的單個檢測誤差的大小,而不考慮誤差的方向。
式中: n 是觀測點的數(shù)量; 是第 i 個觀測點的真實值;
是第 i 個觀測點的檢測值。
2 結(jié)果與分析
2.1森林地表枯葉含水率預(yù)訓(xùn)練網(wǎng)絡(luò)設(shè)計
基于SNV和S-G平滑兩種預(yù)處理方法,采用全波段光譜數(shù)據(jù),通過偏最小二乘回歸(PLSR)和LSTM兩種算法構(gòu)建模型,對處理后的光譜數(shù)據(jù)進(jìn)行分析,預(yù)測結(jié)果詳見表2。
結(jié)果表明在LSTM建立的全波段模型中,經(jīng)SNV處理后的LSTM模型預(yù)測效果最好,MAE、MSE、 分別為 3 . 6 0 % , 3 . 6 1 % 和 9 3 . 1 % 。對比S-G-LSTM模型,MAE和MSE分別降低了 0 . 1 8 % 和 0 . 2 0 %
提高了1 . 1 % 。在PLSR建立的預(yù)測模型當(dāng)中,經(jīng)SNV處理的模型的MAE、MSE
分別為 3 . 7 3 % , 3 . 8 4 % 和91. 7 % ,對比S-G-PLSR模型,MAE和MSE分別降低了 0 . 2 4 % 和 0 . 3 9 %
提高了 3 . 5 % 。由此可以說明,經(jīng)過SNV處理,光譜數(shù)據(jù)的預(yù)測性能得到顯著提升,散射噪聲和基線漂移被有效減少,使得光譜反射特性的對比更加鮮明,且光譜數(shù)據(jù)的分布更加集中。因此選擇SNV作為預(yù)處理方法結(jié)合預(yù)測模型進(jìn)行后續(xù)研究。
本研究采用隨機(jī)選取的方式,在源域中選取了訓(xùn)練集800個,驗證集和測試集均為200個。在目標(biāo)域中,選取了訓(xùn)練集640個,驗證集和測試集分別為160個。重復(fù)上述建模過程3次,最后取得的兩種枯葉的損失曲線以及預(yù)測值和真實值比較如圖10和圖11所示。
主干網(wǎng)絡(luò)與改進(jìn)網(wǎng)絡(luò)的性能評價指標(biāo)見表3,其中主干網(wǎng)絡(luò)Bi-LSTM的檢測集MAE值為 3 . 0 4 % ,加人FCs與之融合后,3組改進(jìn)網(wǎng)絡(luò)的MAE均有不同程度的減小,結(jié)果證明改進(jìn)結(jié)構(gòu)提高了含水率檢測的精度。此外,在3種改進(jìn)結(jié)構(gòu)中可以看出Bi-LSTM1模型的檢測效果最好,MAE為 2 . 1 8 % ,MSE值為 2 . 2 5 % 值為 9 3 . 1 % ,相比Bi-LSTM2和Bi-LSTM3具有更高的檢測性能,模型魯棒性更強(qiáng)。所以將第一種改進(jìn)Bi-LSTM網(wǎng)絡(luò)作為源域枯葉含水率的預(yù)訓(xùn)練網(wǎng)絡(luò),改進(jìn)后的微調(diào)機(jī)制也為后續(xù)模型遷移試驗研究提供了結(jié)構(gòu)基礎(chǔ)。
2.2近紅外光譜檢測模型遷移效果分析
為了驗證遷移學(xué)習(xí)的有效性,基于上一小節(jié)建立的源域含水率檢測的Bi-LSTM1網(wǎng)絡(luò),凍結(jié)其網(wǎng)絡(luò)參數(shù),在不加入可訓(xùn)練模塊時對自標(biāo)域落葉松枯葉150個樣本的檢測集所得的檢測值與真實值之間的數(shù)據(jù)分布如圖12所示。由圖12可知,目標(biāo)域檢測集在源域Bi-LSTM1模型上的MAE值為 1 0 . 5 % 為0.712。結(jié)果表明,已建立的源域含水率檢測網(wǎng)絡(luò)不可以直接被用于目標(biāo)域樣本的檢測,這與不同分布的樣本近紅外光譜間的差異有關(guān),盡管通過預(yù)處理消除了光譜的散射、噪聲和基線漂移等影響,但數(shù)模不匹配的原因之一是不同樣本的光譜特征波段差異導(dǎo)致目標(biāo)域光譜在Bi-LSTM1模型上的特征表達(dá)存在差異。通過深度學(xué)習(xí)算法構(gòu)建,不同分布的樣本與已建模型的不適配問題不可消除,所以模型遷移不可避免。
圖13~15為源域數(shù)據(jù)量為1000、目標(biāo)域數(shù)據(jù)分別為75、150、300時試驗結(jié)果。從源域中分別選取500、800、1000產(chǎn)生3種預(yù)訓(xùn)練網(wǎng)絡(luò),在進(jìn)行網(wǎng)絡(luò)微調(diào)時,自標(biāo)域數(shù)據(jù)集中分別選取了75、150、300個樣本。試驗數(shù)據(jù)詳見表4,其中,源域數(shù)據(jù)集數(shù)目為0表示直接使用目標(biāo)域數(shù)據(jù)集進(jìn)行建模,即無遷移的情況下不同樣本數(shù)量的預(yù)測性能指標(biāo)。
由表4中可知,當(dāng)目標(biāo)域樣本量與圖12中同樣為150個時,加入微調(diào)機(jī)制后,當(dāng)源域數(shù)量分別為500、8 0 0 , 1 0 0 0 時模型的MAE分別從 1 0 . 5 % 減小到3 . 8 6 % . 3 . 7 7 % . 3 . 5 7 % . 。這個結(jié)果說明了微調(diào)方案的有效性。由于預(yù)訓(xùn)練模型已在大規(guī)模數(shù)據(jù)集上進(jìn)行了訓(xùn)練,所以其通常會具備良好的特征提取能力,從而為微調(diào)任務(wù)提供更好的初始特征。當(dāng)源域數(shù)據(jù)一定時,隨著目標(biāo)域數(shù)據(jù)的增加,檢測模型的 逐漸平穩(wěn)增加,MSE總體呈緩慢下降趨勢,遷移的效果逐漸增強(qiáng),且在目標(biāo)域相同情況下,源域數(shù)量不為0時要比為0的
均有明顯提升,MSE和MAE均為下降??梢钥吹诫S著目標(biāo)域樣本數(shù)量的增加,MSE和MAE普遍減少,而
增加,這表明模型的性能在提高。這可能是因為更多的目標(biāo)域數(shù)據(jù)有助于模型更好地學(xué)習(xí)目標(biāo)域的特征。綜上所述基于Bi-LSTM1的模型遷移可以提升少量數(shù)據(jù)樣本的檢測精度,達(dá)到“小樣本,高精度”的檢測效果。
3結(jié)論
建立不同樹種枯葉的光譜-含水率反演模型需要大量數(shù)據(jù)標(biāo)注,限制了光譜技術(shù)在枯葉含水率檢測領(lǐng)域的應(yīng)用。本研究提出了一種基于Bi-LSTM的枯葉含水率檢測光譜反演方法。在檢測性能方面,與LSTM相比,所采用的Bi-LSTM1模型的得出結(jié)果的MAE縮小了1. 56 % ,MSE減小了 提升了 0 . 0 4 6 。在遷移性能方面,與未加入遷移的Bi-LSTM相比,在源域樣本個數(shù)為 1 0 0 0 , 目標(biāo)域樣本個數(shù)為300時,遷移學(xué)習(xí)方法MAE縮小了 2 . 3 6 % ,MSE減小了 2 . 0 2 % ,R2提升了0.114,證明了遷移學(xué)習(xí)可以用更少的訓(xùn)練數(shù)據(jù)實現(xiàn)更高的檢測準(zhǔn)確率,大大降低了對標(biāo)記近紅外光譜數(shù)據(jù)的依賴。證明了所提出的遷移學(xué)習(xí)方法與傳統(tǒng)方法相比,在應(yīng)對少量樣本輸人時具有更高的含水率反演準(zhǔn)確度,提高了應(yīng)用光譜方法進(jìn)行森林細(xì)小死可燃物含水率反演的準(zhǔn)確性和模型外推性,為光譜檢測枯葉含水率的實用性提供了一種新思路。
參考文獻(xiàn)
[1]梁盛.亞熱帶5種典型森林類型地表死可燃物負(fù)荷量及 燃燒能量釋放量[D].長沙:中南林業(yè)科技大學(xué),2024 LIANG S. Surface dead fuel loading and combustion energy release of five typical subtropicalforest types[Dl.Changsha: CentralSouthUniversityofForestryamp;Technology,2024.
[2]徐偉恒,吳超,楊磊,等.滇東北地區(qū)華山松與云南松的 地表凋落物載量及火強(qiáng)度對比研究[J].西南林業(yè)大學(xué) 學(xué)報(自然科學(xué)),2019,39(5):151-156. XU W H, WU C,YANG L,et al. Comparative study on surface litter load and fire intensity of Pinus armandi and Pinus yunnanensis in Northeastern Yunnan Province[J]. Journal of Southwest Forestry University (Natural Sciences),2019,39(5) :151-156.
[3]韓冰潔,葉江霞.植被冠層可燃物含水率評估方法研究 進(jìn)展[J].世界林業(yè)研究,2024,37(4):46-52. HAN B J,YE JX.Research progress in the evaluation of fuel moisture content in vegetation canopy[J].World Forestry Research,2024,37(4) :46-52.
[4]謝字希,胡海清,楊曦光,等.基于實測光譜的大興安嶺 地區(qū)典型森林枯落物含水率估測模型[J].生態(tài)學(xué)雜志, 2017,36(11) :3321-3328. XIE Z X,HU HQ,YANG X G,et al. Estimating model of typical forest litter moisture content based on the field spectrumin Daxing'anling of China [J]. Chinese Journal of Ecology,2017,36(11) :3321-3328.
[5]孫龍,劉祺,胡同欣.森林地表死可燃物含水率預(yù)測模 型研究進(jìn)展[J].林業(yè)科學(xué),2021,57(4):142-152. SUN L,LIU Q,HU T X. Advances in research on prediction model of moisture content of surface dead fuel in forests[J].Scientia SilvaeSinicae,2021,57(4) :142-152.
[6]胡海清,羅斯生,羅碧珍,等.森林可燃物含水率及其預(yù) 測模型研究進(jìn)展[J].世界林業(yè)研究,2017,30(3):64-69. HU HQ,LUO S S,LUO B Z,et al. Forest fuel moisture content and its prediction model[J].World Forestry Research,2017,30(3) :64-69.
[7]王婕.安寧地區(qū)主要樹種死可燃物含水率及火險等級 研究[D].北京:北京林業(yè)大學(xué),2018. WANG J. Research on moisture content of dead forest fuel and fire danger rating of maior tree secies in Annin area [D].Beijing:Beijing Forestry University,2018.
[8]張運(yùn)林,田玲玲,向敏,等.室內(nèi)模擬空氣溫濕度對蒙古 櫟林凋落物床層平衡含水率和時滯的影響[J].生態(tài)學(xué) 雜志,2022,41(10):2072-2080. ZHANG YL,TIAN LL,XIANG M,et al. Effects of indoor simulated air temperature and relative humidity on the equilibrium moisture content and time lag of the fuelbed of Quercus mongolica[J]. Chinese Journal of Ecology,2022, 41(10):2072-2080.
[9]張小丹.基于卷積神經(jīng)網(wǎng)絡(luò)的近紅外光譜定量分析模 型建立與轉(zhuǎn)移研究[D].太原:中北大學(xué),2022. ZHANG X D.Research on the establishment and transfer of near-infrared spectroscopy quantitative analysis model based on convolutional neural network[D]. Taiyuan: North University of China,2022.
[10] 劉瑜明.王巧華.陳遠(yuǎn)哲.等.豬肉理化指標(biāo)的近紅外
光譜無損檢測[J].光譜學(xué)與光譜分析,2024,44(5): 1346-1353. LIUYM,WANGQH,CHENYZ,etal.Non-Destructive near-infrared spectroscopy of physical and chemical indicator of pork meat [Jl. Spectroscopy and Spectral Analysis,2024,44(5) :1346-1353.
[11]朱詩豪,吳志偉,李政杰,等.贛南馬尾松林地表細(xì)小 死可燃物含水率動態(tài)及模型[J].林業(yè)科學(xué),,2024,60 (5) :158-168. ZHU SH,WU Z W,LI ZJ,et al. Moisture dynamics and modeling of ground surface fine dead combustibles in Pinus massoniana forest in Southern Jiangxi,China[J]. Scientia Silvae Sinicae,2024,60(5) :158-168.
[12]劉凱,王玉峰,彭志青,等.基于機(jī)器學(xué)習(xí)的高光譜土 壤養(yǎng)分特征波段提取方法[J].光學(xué)學(xué)報,2024:1-18. LIUK,WANGYF,PENG ZQ,et al. Hyperspectral soil nutrient feature band extraction method based on machine learning[J].Acta Optica Sinica,2024:1-18.
[13]王冉.基于卷積神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)的高光譜圖像分 類[D].贛州:贛南師范大學(xué),2023. WANG R. Hyperspectral image classification based on convolutional neural network and transfer learning [D]. Ganzhou:Gannan Normal University,2023.
[14]PENG B,ZHANG JW,XING J,et al. Measuring moisture content of dead fine fuels based on the fusion of spectrum meteorological data[J]. Journal of Forestry Research, 2023,34:1333-1346.
[15]葉穎慧.森林死可燃物含水率在線測量技術(shù)研究[D]. 哈爾濱:東北林業(yè)大學(xué),2019. YEYH.Research on on-line measurement technology of forest dead fuel moisture content[D].Harbin:Northeast Forestry University,2019.
[16] JIANG H,DENG J,ZHU C. Quantitative analysis of aflatoxin B1 in moldy peanuts based on near-infrared spectra with two-dimensional convolutional neural network [J]. InfraredPhysicsamp; Technology,2023,131:104672.
[17]鄭文瑞.基于遷移學(xué)習(xí)的土壤速效磷近紅外預(yù)測方法 研究[D].合肥:安徽農(nóng)業(yè)大學(xué),2022. ZHENG W R. Research on near infrared prediction methods of soil available phosphorus based on transferlearning [D].Hefei:Anhui Agricultural University,2022.
[18]魏玉震.基于光譜和光譜成像技術(shù)的茶葉含水率檢測 機(jī)理和方法研究[D].杭州:浙江大學(xué),2019. WEIY Z.Moisture content detection of tea leaves based on spectral and spectral imaging technologies[D]. Hangzhou:Zhejiang University,2019.
[19]沈歡超.基于人工智能與近紅外光譜技術(shù)的煙草質(zhì)量 控制研究[D].杭州:浙江大學(xué),2023. SHEN H C.Studies on quality control of tobacco based on artificial intelligence and near infrared spectroscopy[D]. Hangzhou: Zhejiang University,2023.
[20]胡燕芳.基于小樣本學(xué)習(xí)的圖像分類方法研究與應(yīng)用 [D].贛州:江西理工大學(xué),2022. HU Y F.Research and application on image classification method based on few-shot learning[D].Ganzhou:Jiangxi University of Science And Technology,2022.
[21] LI X L,LI Z,YANG X F,et al. Boosting the generalizationability of Vis-NIR-spectroscopy-based regression models through dimension reduction and transfer learning [J].Computers and Electronics in Agriculture,2021, 186:106157.
[22] PENG X,LI Y,WEI X,et al. RGB-NIR image categorization with prior knowledge transfer[J]. Journal on Image and Video Processing,2018,149:1.
[23] JIANG H,XUE Y,CHEN Q. Quantitative analysis of residues of chlorpyrifos in corn oil based on Fourier transform near-infrared spectroscopy and deep transfer learning[J]. InfraredPhysicsamp; Technology,2023,133(6):104814.
[24]朱瑞芬,徐遠(yuǎn)東,孫萬斌,等.基于人工神經(jīng)網(wǎng)絡(luò)的狼 尾草屬牧草品質(zhì)近紅外光譜預(yù)測研究[J].草地學(xué)報, 2024,32(2):527-534. ZHU RF,XU YD,SUN WB,et al. Research on nutritional components of Pennisetum Rich. forage by near infrared spectroscopy model based on artificial neural network[J]. Acta Agrestia Sinica,2024,32(2) :527-534.
[25]汪志強(qiáng),李大鵬,劉強(qiáng),等.基于溫度修正和可見/近紅 外光譜的油茶籽含水率檢測[J].食品與機(jī)械,2022,38 (12) :127-132. WANG ZQ,LI DP,LIU Q,et al.Water content detection of Camellia oleifera seeds based on temperature correction and visible/near infrared spectroscopy[J].Food amp; Machinery,2022,38(12):127-132.
[26]徐勝勇,劉政義,黃遠(yuǎn).基于Self-Attention-BiLSTM網(wǎng) 絡(luò)的西瓜種苗葉片氮磷鉀含量高光譜檢測方法[J].農(nóng) 業(yè)機(jī)械學(xué)報,2024,55(98):243-252. XU S Y,LIU Z Y,HUANG Y. Hyperspectral non-destructive detection of nitrogen, phosphorus and potassium contentofwatermelon seedlingleavesbased on Self-Attention-BiLSTM network[J].Transactions of the Chinese SocietyforAgriculturalMachinery,2024,55(98): 243-252.
[27] TAN A, WANG Y,ZHAO Y,et al. Near infrared spectroscopy quantification based on Bi-LSTM and transfer learning for new scenarios [J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy,2022, 283:121759.