袁 瑩,王雪峰*,王 甜,陳飛飛,黃川騰,林 玲,董曉娜
(1.中國林業(yè)科學(xué)研究院資源信息研究所,國家林業(yè)和草原局森林經(jīng)營與生長模擬重點(diǎn)實(shí)驗(yàn)室,北京 100091;2.海南省林業(yè)科學(xué)研究院,海南省紅樹林研究院,海南 海口 571100)
沉香(土沉香,Aquilariasinensis)又名白木香,喜生于海拔較低的山地丘陵地帶,主要分布在廣西、海南、廣東、福建等地[1],是我國特有的珍貴瀕危樹種。沉香具有極高的藥用價(jià)值,具有止痛、止嘔、抗腫瘤活性等功效[2]。由于具有十分顯著的經(jīng)濟(jì)效益,沉香天然林在亂砍濫伐中愈加稀少,但其市場需求量不減反增。近些年來在廣西、海南等地沉香苗木的人工培植規(guī)模日益增大[3],與此同時(shí),鑒于該樹種的珍貴特性,在其生長發(fā)育過程中如何在非破壞前提下對(duì)其營養(yǎng)信息進(jìn)行估測成為近年來亟需解決的重要議題。氮素是蛋白質(zhì)和葉綠素的組成成分,是影響林木生長發(fā)育的最重要的營養(yǎng)元素之一[4],植物葉片的氮含量能夠反映植物整體的生長態(tài)勢和營養(yǎng)狀況。氮素的缺乏和過剩均會(huì)影響植物的生理生化機(jī)制[5],因此,對(duì)氮素進(jìn)行有效監(jiān)測是對(duì)沉香苗木進(jìn)行合理培育經(jīng)營的重要基礎(chǔ)。經(jīng)過國內(nèi)外學(xué)者們的研究發(fā)現(xiàn),圖像信息與植物的生長、生理狀態(tài)有著緊密聯(lián)系[6]。相較于傳統(tǒng)的化學(xué)測定方法,結(jié)合數(shù)字圖像處理方法對(duì)林木營養(yǎng)進(jìn)行監(jiān)測大大提高了時(shí)效性[7],且減少了對(duì)林木的破壞。
有效利用具有代表性的圖像特征是建立沉香氮素估測模型的重要基礎(chǔ)[8],植株葉片的氮素含量在冠層顏色上有較為清晰的體現(xiàn),圖像的形狀特征則可以較好地反映沉香植株的生長特性[9],而當(dāng)?shù)堪l(fā)生變化時(shí),圖像的紋理特征也會(huì)發(fā)生一定的變化[10-11]。吳偉斌等[12]確定了基于高光譜圖像特征對(duì)茶樹氮含量和葉面積指數(shù)(LAI)進(jìn)行反演,獲得了較高的模型精度,但成本相較于數(shù)碼相機(jī)獲取可見光圖像較為高昂。張培松等[13]對(duì)利用數(shù)碼相機(jī)獲取的橡膠樹葉片圖像提取多個(gè)顏色特征,對(duì)橡膠樹葉片氮含量進(jìn)行營養(yǎng)診斷,但未對(duì)顏色特征以外的其他圖像信息進(jìn)行分析。因此,以幼齡沉香全氮量為響應(yīng)變量,獲取沉香冠層可見光圖像,對(duì)圖像的顏色、紋理、形狀特征進(jìn)行綜合分析具有一定的實(shí)際意義。
在基于圖像特征構(gòu)建營養(yǎng)狀態(tài)估測模型時(shí),Agarwal等[14]應(yīng)用主成分分析(PCA,Principal component analysis)對(duì)葉片圖像的顏色特征進(jìn)行降維,避免了高維圖像特征數(shù)據(jù)帶來的維度災(zāi)難和多重共線性問題,再對(duì)葉片養(yǎng)分和葉綠素含量構(gòu)建多元線性回歸估測模型;Lucas等[15]應(yīng)用隨機(jī)森林算法對(duì)柑橘樹冠層氮含量進(jìn)行了估測,并與其他機(jī)器學(xué)習(xí)算法進(jìn)行了對(duì)比分析;Amirruddin等[16]構(gòu)建線性判別和支持向量機(jī)模型基于圖像光譜數(shù)據(jù)對(duì)油棕氮營養(yǎng)狀態(tài)進(jìn)行分類。
本研究以幼齡沉香為研究對(duì)象,基于色調(diào)-亮度-飽和度(HIS)空間的最佳直方圖(KSW)熵法對(duì)沉香冠層圖像進(jìn)行分割提取,提取沉香數(shù)字圖像的多種顏色、形狀和紋理特征,通過偏最小二乘法(PLS)有監(jiān)督地降維融合對(duì)沉香圖像的多特征進(jìn)行綜合利用,并應(yīng)用天牛須搜索算法(BAS)實(shí)現(xiàn)模型參數(shù)的自適應(yīng)選取,以多圖像特征為基礎(chǔ)構(gòu)建PLS-BAS-ElmanNN模型對(duì)沉香葉片全氮量進(jìn)行無損估測,探索了利用圖像估測沉香營養(yǎng)狀態(tài)的新方法,以期為實(shí)現(xiàn)沉香苗木培育的精準(zhǔn)作業(yè)提供理論依據(jù)。
研究區(qū)設(shè)在海南省文昌市龍樓鎮(zhèn)的島東林場昌灑作業(yè)區(qū)(110°57′34″~111°1′54″E,19°43′58″~19°44′58″N),海拔5~20 m。島東林場占地約1.9萬hm2,東臨南海,屬沿海平原地帶,地勢較為平緩,森林資源豐富,為熱帶海洋性氣候,氣溫年較差較小,年均氣溫23.5 ℃,年均降水量約1 808.8 mm。試驗(yàn)地土壤類型為濱海沙壤土,土壤pH為5.0~6.6,有效氮含量98.3~114.8 mg/kg,有效磷含量3.38~4.56 mg/kg,速效鉀含量69.9~ 78.2 mg/kg,有效鐵含量2.33~4.89 mg/kg。
圖像獲取設(shè)備為CanonEOS750D相機(jī),傳感器為CMOS,傳感器尺寸22.3 mm×14.9 mm,有效像素約為2 420萬,APS-C畫幅。將沉香盆栽置于轉(zhuǎn)臺(tái),盆栽上方放置帶孔隔板以達(dá)到簡化圖像背景的效果,對(duì)沉香植株進(jìn)行側(cè)方位攝影和上方位俯拍(圖1)。俯拍時(shí)應(yīng)確定相機(jī)垂直于地面,避免產(chǎn)生傾斜誤差,側(cè)方拍攝時(shí)應(yīng)通過轉(zhuǎn)動(dòng)轉(zhuǎn)臺(tái)的方式拍攝東南西北4個(gè)方位的沉香圖像。試驗(yàn)材料為研究區(qū)域中生長的54株健康無病蟲害的幼齡沉香苗木,通過在沉香冠層的上、中、下層分別各摘取4~8片葉片測定全氮含量代表沉香整株葉片的全氮含量。單株沉香摘取的葉片烘干后通過H2SO4-H2O2消煮法進(jìn)行全氮含量測定,最終獲得沉香葉片全氮含量最小值為10.3 g/kg,最大值為25.6 g/kg。
圖1 沉香植株拍攝方位示意圖Fig.1 A schematic diagram of shooting orientation for Aquilaria sinensis
圖像分割是根據(jù)圖像的灰度、顏色、紋理等特征[17]將植株目標(biāo)從背景中分離出來,是圖像分析工作的基石。本研究將KSW熵閾值分割和形態(tài)學(xué)處理相結(jié)合完成沉香圖像的分割,其中KSW熵閾值法是以圖像信息熵為準(zhǔn)則進(jìn)行分割的方法,計(jì)算速度快且分割效果較好,為最常用的分割方法之一,形態(tài)學(xué)處理包括腐蝕和膨脹,可以依此除去目標(biāo)邊緣的少量散布背景點(diǎn)。KSW熵閾值分割原理是設(shè)閾值t將圖像分為目標(biāo)和背景兩類,記為T0和T1,則T0和T1熵的計(jì)算公式分別為:
(1)
(2)
令H(t)=H0(t)+H1(t),即為圖像的總熵,遍歷所有可取的閾值t,其中令H(t)取得最大值的對(duì)應(yīng)t值即為所求的分割閾值。
1.4.1 顏色特征
在計(jì)算機(jī)處理下的圖像色彩特征值更能夠反映出人類肉眼難以辨別的差異。對(duì)于數(shù)字圖像而言,RGB是最常用的顏色空間,通過一定的公式也可以轉(zhuǎn)化為HIS、Lab顏色空間等,提取圖像的多通道值作為色彩特征,通過對(duì)這些色彩特征的組合運(yùn)算可獲得多種色彩特征[18]。
1.4.2 紋理特征
灰度差分統(tǒng)計(jì)(GLDS)是最常用的提取圖像紋理的方法之一,令圖像中的一點(diǎn)與其相鄰點(diǎn)的灰度差值為Δg,稱為灰度差分。通過圖像直方圖獲取Δg相應(yīng)的概率,計(jì)算得到均值、對(duì)比度、熵等特征。GLDS計(jì)算簡單,效率較高,但僅能分析圖像整體紋理特征。灰度共生矩陣(GLCM)通過研究灰度的空間相關(guān)性來描述紋理,能夠提取灰度關(guān)于方向、相鄰間隔、變化幅度的綜合信息。常用的紋理特征有能量(二階矩)、慣性矩、相關(guān)性、熵等。
1.4.3 形狀特征
此前學(xué)者們對(duì)不同營養(yǎng)狀態(tài)的植株圖像分析主要集中于顏色和紋理特征上[18],事實(shí)上氮素缺乏或過剩對(duì)植株的生長所造成的差異也不容忽視。本研究提出了外接矩形法來獲取圖像形狀特征,以矩形的長(H)、寬(W)和長寬比(r)反映植株的株高和冠幅信息,以冠層面積(Sa)和矩形度(e)作為體現(xiàn)植株冠層密閉度的參數(shù)。將固定大小的花盆直徑引入計(jì)算,可避免攝影距離差異產(chǎn)生的誤差。各形狀特征的定義如下:
(3)
(4)
r=W/H;
(5)
Sa=S0/d;
(6)
e=S0/A。
(7)
1.5.1 Elman神經(jīng)網(wǎng)絡(luò)
Elman神經(jīng)網(wǎng)絡(luò)(Elman neural network,ElmanNN)相對(duì)于反向傳播神經(jīng)網(wǎng)絡(luò)(back-propagation neural network,BPNN)在網(wǎng)絡(luò)結(jié)構(gòu)中加入了承接層,使其能夠?qū)^去時(shí)刻輸出的信息進(jìn)行反饋,不僅解決了BPNN模型中的局部最小值陷入和計(jì)算速度慢的問題[19],還具有短期記憶功能,能夠?qū)颖具M(jìn)行動(dòng)態(tài)預(yù)測。設(shè)有n個(gè)輸入,m個(gè)輸出,模型結(jié)構(gòu)如圖2所示。
圖2 ElmanNN結(jié)構(gòu)Fig.2 The structure of Elman neural network
ElmanNN的非線性狀態(tài)空間表達(dá)式如下:
x(k)=f(ω1xc(k))+ω2u(k-1);
(8)
xc(k)=αxc(k-1)+x(k-1);
(9)
y(k)=g(ω3x(k))。
(10)
式中:x(k)、x(k-1)分別為k時(shí)刻和k-1時(shí)刻的隱層單元值;ω1為承接層到隱含層的連接權(quán)值;ω2為輸入層到隱含層的連接權(quán)值;ω3為隱含層到輸出層的連接權(quán)值;u(k-1)、y(k)、xc(k)分別為k-1時(shí)刻和k時(shí)刻輸入、輸出和隱層輸出;α為參數(shù);f函數(shù)和g函數(shù)分別為隱含層和輸出層的傳遞函數(shù)。常用正切S型傳遞函數(shù)F(x)和線性傳遞函數(shù)G(x),函數(shù)表達(dá)式如下:
(11)
G(x)=x。
(12)
令yφ(k)為目標(biāo)輸出,將誤差平方和定義為網(wǎng)絡(luò)的目標(biāo)函數(shù)E,計(jì)算公式如下:
(13)
1.5.2 模型優(yōu)化及驗(yàn)證
BAS算法是根據(jù)天牛通過觸須覓食的行為提出的優(yōu)化算法,該算法在優(yōu)化過程中不需要知道目標(biāo)函數(shù)的具體形式,且并未利用相關(guān)梯度信息,使得計(jì)算過程十分簡單高效,在尋優(yōu)速度上具有優(yōu)勢[20],通過BAS算法可以自適應(yīng)確定ElmanNN模型的最優(yōu)參數(shù)。此外為了確定模型的準(zhǔn)確性和穩(wěn)定性,本研究以留出法對(duì)模型進(jìn)行驗(yàn)證,將試驗(yàn)獲取的54個(gè)樣本中40個(gè)作為訓(xùn)練樣本,14個(gè)作為檢驗(yàn)樣本。
由于HIS空間將色亮分離,與人類的視覺感知方式相似,本研究應(yīng)用KSW熵閾值分割和形態(tài)學(xué)處理相結(jié)合的方法,基于圖像的HIS空間對(duì)幼齡沉香的可見光影像進(jìn)行分割。首先對(duì)沉香可見光圖像進(jìn)行閾值分割獲得目標(biāo)和背景的二值化圖像,再對(duì)目標(biāo)圖像進(jìn)行形態(tài)學(xué)腐蝕去除少量未能與目標(biāo)分割開的背景點(diǎn)??紤]到此前有不少學(xué)者對(duì)不同顏色空間的圖像分割方法進(jìn)行了分析對(duì)比[21-22],但并無統(tǒng)一結(jié)論,將本研究應(yīng)用的基于HIS顏色空間分割的方法與常用的RGB、Lab顏色空間進(jìn)行對(duì)比,結(jié)果見圖3。
A. HIS顏色空間分割結(jié)果 segmentation results based on HIS;B. RGB顏色空間分割結(jié)果 segmentation results based on RGB;C. Lab顏色空間分割結(jié)果 segmentation results based on Lab。
由圖3可見,RGB和HIS空間分割均能較好地將植株分割出來,但在邊緣的噪聲處理上HIS空間獲得了更好的分割效果,而Lab空間分割后的圖像存在明顯未除去的背景部分,沉香冠層的邊緣并不明顯。因此對(duì)于幼齡沉香而言,本研究應(yīng)用基于HIS空間進(jìn)行KSW熵分割的方法取得最優(yōu)分割效果。
2.2.1 顏色特征
應(yīng)用MATLAB軟件對(duì)分割后的幼齡沉香圖像進(jìn)行特征提取,基于RGB、HIS、Lab顏色空間共提取得到9個(gè)顏色特征,對(duì)所有的顏色特征值進(jìn)行統(tǒng)計(jì)整理后結(jié)果見表1。
表1 沉香圖像顏色特征值
此外本研究還將得到的顏色特征進(jìn)行組合,選取了13個(gè)特征組合,分別為R/B、G/B、B/(R+G)、R/(G+B)、R/(R+G+B)、B/(R+G+B)、G/(R+G+B)、(R-B)/(B+R)、(B+G)/(R+B+G)、(R-B)/(R+G+B)、G/(R-B)、B/L、G/L,作為全氮估測模型的輸入數(shù)據(jù)。
2.2.2 形狀特征
本研究提出以不同外接矩形的方式提取沉香植株側(cè)面和冠層的形狀特征。以沉香側(cè)面圖像為研究對(duì)象時(shí),選取正外接矩形的方式獲取形狀特征,矩形的長和寬體現(xiàn)了植株的株高和冠幅,如圖4A;以沉香冠層圖像為研究對(duì)象時(shí),選取最小外接矩形的方式獲取沉香的形狀特征,矩形的矩形度則反映了冠層的疏密程度,如圖4B;對(duì)比傳統(tǒng)的以正外接矩形獲取矩形度的方式(圖4C),采用該方法對(duì)于不規(guī)則的冠層形狀能夠更加穩(wěn)定地反映冠層密閉度。
圖4 外接矩形示意圖Fig.4 Bounding rectangle
根據(jù)公式(3)—(7)計(jì)算得到圖像的5個(gè)形狀特征H、W、r、S、e,見表2。
表2 沉香圖像形狀特征
2.2.3 紋理特征
使用兩種方法對(duì)幼齡沉香冠層圖像提取局部和整體紋理特征,應(yīng)用GLCM法計(jì)算得到能量(En)、熵(Ent1)、慣性矩(MOI)、相關(guān)(Cor)在4個(gè)方向上的均值(mean)和方差(std)。GLDS法計(jì)算得到均值(mean)、對(duì)比度(Con)、角二階矩(ASM)、熵(Ent2),其中由于GLDS和GLCM計(jì)算原理不同,得到的熵值也不同,作分開標(biāo)識(shí)。最終獲取了12個(gè)紋理特征,見表3。
表3 沉香圖像紋理特征
2.3.1 PLS降維
為避免量綱的影響,將提取的39個(gè)圖像色彩、形狀和紋理特征值進(jìn)行標(biāo)準(zhǔn)化處理。由于特征變量較多,會(huì)降低模型的計(jì)算能力,且變量之間若存在多重共線性也會(huì)影響模型的泛化性能。應(yīng)用PLS算法對(duì)圖像特征提取主成分從而完成特征的降維,以90%的方差貢獻(xiàn)率為閾值提取了6個(gè)主成分,此時(shí)方差累計(jì)貢獻(xiàn)率達(dá)到91%,見圖5。沉香圖像特征變量的維數(shù)由39降至6,被有效降低。
圖5 主成分方差貢獻(xiàn)率Fig.5 Variance contribution rates of principal components
對(duì)PLS降維前的圖像特征變量和降維后的6個(gè)主成分分別進(jìn)行相關(guān)性分析,結(jié)果如圖6所示。圖6A為降維前的相關(guān)性分析結(jié)果,部分圖像特征變量之間存在強(qiáng)相關(guān)性,即具有多重共線性。圖6B為PLS降維后的相關(guān)性分析結(jié)果,可以看到相關(guān)系數(shù)大大降低,6個(gè)主成分之間的相關(guān)系數(shù)均接近于0,不存在多重共線性。顯然,本研究使用的PLS算法在圖像特征變量的降維和消除多重共線性方面取得了顯著效果。
圖6 PLS降維前后特征變量及主成分相關(guān)性分析Fig.6 Correlation analysis of feature variables and principal component before and after PLS dimensionality reduction
2.3.2 BAS-ElmanNN全氮含量估測
將PLS提取的6個(gè)主成分作為估測模型的解釋變量,構(gòu)建BAS-ElmanNN模型,對(duì)幼齡沉香葉片全氮含量進(jìn)行估測。以BAS算法實(shí)現(xiàn)Elman網(wǎng)絡(luò)的訓(xùn)練參數(shù)的尋優(yōu),通過訓(xùn)練樣本確定ω1等權(quán)值,使用已訓(xùn)練好的BAS-Elman模型對(duì)14個(gè)檢驗(yàn)樣本進(jìn)行估測,模型估測結(jié)果見圖7。圖7中顯示估測值與真實(shí)值相近,即本研究提出的BAS-ElmanNN模型估測效果較好,相關(guān)系數(shù)為0.860 7,RMSE為1.265 3 g/kg。
圖7 BAS-ElmanNN模型估測結(jié)果Fig.7 Prediction results of the BAS-ElmanNN model
為進(jìn)一步定量分析模型的精度和適用性,以決定系數(shù)(R2)、平均相對(duì)誤差(MRE)、平均絕對(duì)誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo)進(jìn)行模型驗(yàn)證。此外將本研究提出的PLS-BAS-ElmanNN模型與多個(gè)常用的參數(shù)、半?yún)?shù)和非參數(shù)模型進(jìn)行對(duì)比分析,以確定最適用于沉香全氮含量的估測模型。其中參數(shù)模型包括偏最小二乘回歸(PLSR)、主成分回歸(PCAR)和嶺回歸(RR)模型,半?yún)?shù)模型為以PLS 提取的6個(gè)主成分為解釋變量構(gòu)建偏最小二乘-廣義可加模型(PLS-GAM),非參數(shù)模型包括以39個(gè)圖像特征構(gòu)建的ElmanNN、徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN,Radial basis function neural network)、BPNN模型和以6個(gè)主成分為解釋變量構(gòu)建的偏最小二乘-徑向基神經(jīng)網(wǎng)絡(luò)(PLS-RBFNN)、偏最小二乘-BP神經(jīng)網(wǎng)絡(luò)(PLS-BPNN)模型。各模型評(píng)價(jià)結(jié)果見表4,其中PLS-GAM中各主成分的偏殘差分析結(jié)果見圖8。
s表示平滑函數(shù),s(主成分i,j)表示s(自變量, 自由度);自由度j為1時(shí)表示線性關(guān)系,大于1表示非線性關(guān)系。s refers to the smoothing function, s (principal,component i,j) refers to s (independent variable, degree of freedom), when the degree of freedom is 1, it indicates a linear relationship, and greater than 1 indicates a nonlinear relationship.
表4 模型評(píng)價(jià)與對(duì)比
由表4可知,在多種模型中,本研究提出的PLS-BAS-ElmanNN模型與PLS-GAM模型、PLSR模型的MRE均低于10%,取得了較好的沉香全氮含量估測效果。其中,PLS-BAS-ElmanNN模型的MRE最低,僅為6.0%,決定系數(shù)R2達(dá)到0.740 7,R2較PLS-GAM模型和PLSR模型分別提高了5.5%和18.5%,RMSE僅為1.265 3 g/kg,較PLS-GAM模型和PLSR模型分別降低了21.1%和27.2%。
此外,在非參數(shù)模型中,基于39個(gè)圖像特征直接構(gòu)建的ElmanNN、RBFNN和BPNN模型的估測效果均較差,難以對(duì)幼齡沉香全氮量進(jìn)行準(zhǔn)確診斷。基于PLS提取主成分后構(gòu)建的PLS-RBFNN和PLS-BPNN模型雖在估測精度上有所提升,但依舊低于PLS-BAS-ElmanNN模型。因此,可確定本研究提出的PLS-BAS-ElmanNN模型為進(jìn)行幼齡沉香葉片全氮量估測的最適模型。
由圖8可見,在PLS-GAM半?yún)?shù)模型中主成分1、2、3、4、6的偏殘差圖均為線性,主成分5的偏殘差圖則表現(xiàn)了顯著的非線性,可見PLS-GAM模型對(duì)非線性關(guān)系具有一定的解釋能力,因此獲得了較PLSR模型更高的估測精度。
傳統(tǒng)的葉片氮含量測定方法費(fèi)時(shí)費(fèi)力且具有破壞性,難以滿足珍貴樹種營養(yǎng)狀態(tài)的監(jiān)測需求,而經(jīng)國內(nèi)外諸多研究學(xué)者證明,計(jì)算機(jī)視覺技術(shù)是實(shí)現(xiàn)無損估測的有效方法[23-24]。應(yīng)用計(jì)算機(jī)視覺方法估測葉片的全氮含量主要包括圖像處理和估測模型構(gòu)建兩部分,在對(duì)植株圖像的分割處理中,陳珠琳等[21]研究表明在HIS顏色空間下能夠?qū)μ聪惬@得較好的分割效果,Bai等[25]論證了在Lab空間對(duì)植物圖像進(jìn)行分割提取的可行性,本研究應(yīng)用的基于HIS顏色空間的KSW熵及形態(tài)學(xué)處理組合分割方法對(duì)幼齡沉香取得了最優(yōu)分割效果,優(yōu)于RGB和Lab空間分割,因此可認(rèn)為基于HIS空間分割的方式更適用于沉香圖像。其中,Lab空間分割效果最差,許多散亂的背景區(qū)域未能與目標(biāo)圖像分割開,這與Lab空間包含了過多的色彩信息反而難以很好地將背景完全剔除不無關(guān)系。而HIS空間接近于人類視覺,在自身視覺感知到前背景差異較明顯的情況下,使用HIS空間進(jìn)行圖像分割通常能實(shí)現(xiàn)更好的分割效果。
將幼齡沉香的前景圖像分割出來后,本研究提取了沉香圖像的22種顏色特征、12個(gè)紋理特征和5個(gè)形狀特征構(gòu)建沉香全氮含量估測模型。在高維圖像特征數(shù)據(jù)的處理中,相較于Agarwal等[14]應(yīng)用的PCA方法,PLS算法結(jié)合了PCA和典型相關(guān)分析的優(yōu)勢,能夠以沉香葉片全氮量為依據(jù)完成圖像特征的降維,同時(shí)變量間的多重共線性也得到了有效解決。在模型的評(píng)價(jià)對(duì)比結(jié)果中,可以看到若對(duì)圖像特征降維后獲得的變量直接構(gòu)建線性回歸模型,即PLSR模型,其R2為0.624 9,較PCAR模型具有更高的估測精度,與Tang等[26]對(duì)PLS與PCA進(jìn)行分析對(duì)比的研究結(jié)果具有一致性。這是因?yàn)镻LS是一種有監(jiān)督的降維方法,充分利用了沉香全氮含量信息,因此該方法提取的主成分對(duì)沉香全氮含量具有更高的解釋能力,不論是精度、穩(wěn)定性和實(shí)用性都優(yōu)于傳統(tǒng)的PCA降維方法。
在模型的驗(yàn)證分析中,通過R2、MRE、MAE、MSE、RMSE這5個(gè)評(píng)價(jià)指標(biāo)對(duì)比,可確定本研究提出的PLS-BAS-ElmanNN模型估測精度最高,其次為半?yún)?shù)模型PLS-GAM和參數(shù)模型中的PLSR模型。在非參數(shù)模型中,基于PLS算法提取主成分構(gòu)建的沉香全氮含量估測模型的估測效果顯著優(yōu)于基于39個(gè)圖像特征直接構(gòu)建的模型,這是由于當(dāng)輸入的解釋變量過多且變量之間具有多重共線性時(shí)訓(xùn)練數(shù)據(jù)易出現(xiàn)過擬合現(xiàn)象[27],導(dǎo)致模型泛化能力低,因此在使用檢驗(yàn)樣本進(jìn)行模型驗(yàn)證時(shí)獲得了較差的驗(yàn)證結(jié)果。而對(duì)比其他基于PLS算法的神經(jīng)網(wǎng)絡(luò)模型,如PLS-BPNN和PLS-RBFNN模型,本研究模型的估測精度也具有顯著優(yōu)勢,因此可確定在本試驗(yàn)中,ElmanNN相較于其他神經(jīng)網(wǎng)絡(luò)更適用于沉香葉片全氮含量的估測。此外,在參數(shù)和半?yún)?shù)模型對(duì)比中,本研究提出的PLS-BAS-ElmanNN模型、PLS-GAM模型和PLSR模型均獲得了較好的估測效果,PLS-GAM的偏殘差圖中可以看到主成分5的偏殘差圖具有顯著的非線性,而本研究模型為非參數(shù)模型,二者對(duì)非線性數(shù)據(jù)具有更好的擬合效果,因此較線性模型PLSR精度略高,但PLS-GAM模型精度依然低于本研究模型。且根據(jù)圖8可以看到其他主成分均與沉香全氮含量存在線性關(guān)系,這也是本研究模型和PLS-GAM模型比PLSR模型估測精度提升幅度較小的主要因素。
1)對(duì)于幼齡沉香圖像,基于本研究應(yīng)用的HIS顏色空間下應(yīng)用KSW熵和形態(tài)學(xué)處理進(jìn)行分割,分割效果顯著優(yōu)于RGB和Lab空間。
2)對(duì)于存在多重共線性的高維圖像特征變量,PLS算法以沉香葉片全氮量為依據(jù)對(duì)特征變量提取了6個(gè)主成分,快速降低了特征變量維數(shù),并有效避免了變量間多重共線性影響。
3)以5種模型評(píng)價(jià)指標(biāo)對(duì)本研究提出的PLS-BAS-ElmanNN模型進(jìn)行驗(yàn)證,并與多種常用的參數(shù)、半?yún)?shù)和非參數(shù)模型進(jìn)行對(duì)比,本研究提出的模型R2達(dá)到0.740 7,MRE值為6.0%,RMSE值為1.265 3 g/kg,綜合比較下估測精度最高,優(yōu)于其他模型,為適用于幼齡沉香全氮量估測的最優(yōu)模型。