王金星 劉雪梅 劉雙喜,3 權(quán)澤堃 徐春保 江 浩
(1.山東農(nóng)業(yè)大學(xué)機(jī)械與電子工程學(xué)院, 泰安 271018; 2.山東省農(nóng)業(yè)裝備智能化工程實(shí)驗(yàn)室, 泰安 271018;3.山東省園藝機(jī)械與裝備重點(diǎn)實(shí)驗(yàn)室, 泰安 271018)
中國(guó)是世界上最大的蘋(píng)果生產(chǎn)國(guó)和消費(fèi)國(guó),總種植面積及總產(chǎn)量均占世界50%以上[1-2]。氮元素是蘋(píng)果樹(shù)體內(nèi)一種重要的必需元素,它影響果樹(shù)體內(nèi)各種生理生化過(guò)程、果樹(shù)抗性、果品產(chǎn)量、品質(zhì)以及儲(chǔ)藏性狀[3-4]。合理施用氮肥可以促進(jìn)蘋(píng)果樹(shù)健康生長(zhǎng),提高果實(shí)產(chǎn)量及果品品質(zhì),減少農(nóng)田環(huán)境污染與資源浪費(fèi)。因此,精準(zhǔn)預(yù)測(cè)果樹(shù)氮含量對(duì)指導(dǎo)果樹(shù)健康成長(zhǎng)有重要作用[5-7]。葉片是整個(gè)樹(shù)體上對(duì)土壤礦質(zhì)營(yíng)養(yǎng)反應(yīng)最敏感的器官,蘋(píng)果葉片營(yíng)養(yǎng)分析、診斷技術(shù)可以作為蘋(píng)果樹(shù)氮素營(yíng)養(yǎng)盈虧并指導(dǎo)精準(zhǔn)施肥的依據(jù)[8-9]。傳統(tǒng)的作物氮素檢測(cè)方法主要有田間采樣室內(nèi)化學(xué)分析測(cè)定法和葉色卡法,雖然結(jié)果準(zhǔn)確可靠,但分析成本高、檢驗(yàn)周期長(zhǎng)、時(shí)效性差[10]。近年來(lái),機(jī)器學(xué)習(xí)及數(shù)字圖像處理技術(shù)的快速發(fā)展為作物氮素營(yíng)養(yǎng)快速、無(wú)損和準(zhǔn)確監(jiān)測(cè)提供了有效方法與手段[11]。
目前,國(guó)內(nèi)外學(xué)者針對(duì)作物氮含量預(yù)測(cè)方法已經(jīng)進(jìn)行了大量的研究[12-14],取得了一定成果。近年一些學(xué)者嘗試將支持向量機(jī)(SVM)方法[15-17]應(yīng)用到植被理化參數(shù)的反演中,梁棟等[18]利用SVM回歸方法估測(cè)冬小麥葉面積指數(shù)LAI,且估測(cè)精度優(yōu)于傳統(tǒng)模型。何汝艷等[19]聯(lián)合應(yīng)用連續(xù)小波變換與支持向量機(jī)方法對(duì)條銹病脅迫下冬小麥葉片全氮含量進(jìn)行反演,且具有較高的估測(cè)精度。
對(duì)作物的葉片氮含量進(jìn)行的研究,大部分是基于光譜數(shù)據(jù),其優(yōu)點(diǎn)是預(yù)測(cè)精度較高,但是成本昂貴、操作難度大,難以推廣使用。本研究通過(guò)提取圖像特征結(jié)合機(jī)器學(xué)習(xí)對(duì)蘋(píng)果樹(shù)葉片進(jìn)行氮素營(yíng)養(yǎng)預(yù)測(cè),具有成本低、可操作性高、可實(shí)時(shí)監(jiān)測(cè)的優(yōu)點(diǎn)。本文以不同時(shí)期的田間試驗(yàn)為基礎(chǔ),通過(guò)主成分分析提取不同時(shí)期的關(guān)鍵影響因子,對(duì)比基于支持向量機(jī)、反向傳播(Back propagation, BP)神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)3種方法建立的不同生長(zhǎng)時(shí)期蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型,以期建立不同時(shí)期不同因子的最佳蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型,為蘋(píng)果樹(shù)營(yíng)養(yǎng)診斷、精準(zhǔn)施肥提供信息支持。
試驗(yàn)樣本采集自山東省萬(wàn)林農(nóng)場(chǎng)試驗(yàn)園,試驗(yàn)品種為4年樹(shù)齡的煙臺(tái)紅富士。試驗(yàn)園分為A、B兩個(gè)區(qū)域,區(qū)域A采集的樣本作為測(cè)試集,區(qū)域B采集的樣本作為驗(yàn)證集。試驗(yàn)園位于山東省泰安市寧陽(yáng)縣葛石鎮(zhèn),海拔62.2 m,位于東經(jīng)116°49′、北緯35°45′,屬于溫帶大陸性半濕潤(rùn)季風(fēng)氣候,年平均氣溫13℃,年平均降水量697 mm。
1.2.1樣本采集與葉片圖像獲取
分別于4月3日(開(kāi)花期)、4月12日(開(kāi)花期)、5月18日(幼果期)、6月3日(幼果期)、6月22日(果實(shí)膨大期)、7月9日(果實(shí)膨大期)在區(qū)域A試驗(yàn)園隨機(jī)選取50株蘋(píng)果樹(shù)作為試驗(yàn)本體,標(biāo)號(hào)1~50,并在每株試驗(yàn)本體的樹(shù)冠外圍新梢中間部位4個(gè)方位各摘取5片充分展開(kāi)、無(wú)損傷、無(wú)病蟲(chóng)害的健康葉片作為試驗(yàn)樣本[20-21]。在4個(gè)不同方位選取平整的、便于色彩采集的10片葉片放置在光學(xué)標(biāo)定板上,將佳能EOS 80D型相機(jī)(焦距35 mm)安裝于深圳市優(yōu)捷虎電子科技有限公司生產(chǎn)的卓美z-888型三腳架上,利用水平儀調(diào)節(jié)相機(jī),使鏡頭與標(biāo)定板垂直進(jìn)行圖像采集,圖像尺寸為6 000像素×4 000像素。同一植株在不同時(shí)期采集的葉片圖像如圖1所示。
1.2.2樣本處理與氮素營(yíng)養(yǎng)測(cè)定
采用凱氏定氮法對(duì)蘋(píng)果樹(shù)葉片全氮含量進(jìn)行測(cè)定。將帶回實(shí)驗(yàn)室的葉片放在自來(lái)水下沖洗干凈,用95∶5的鹽酸溶液清洗1~2 min,再用無(wú)離子水沖洗2次,放入105℃高溫烘箱殺青30 min,再調(diào)至80℃持續(xù)干燥至樣品質(zhì)量恒定,使用研缽將干燥樣品研磨至粉末狀,稱(chēng)取0.1 g干樣,用H2SO4-H2O2消解,冷卻后采用海能公司生產(chǎn)的K9860型全自動(dòng)凱氏定氮儀測(cè)定蘋(píng)果樹(shù)葉片的全氮含量,測(cè)量3次取平均值作為最終氮含量。
首先獲取蘋(píng)果樹(shù)葉片原始圖像。其次對(duì)單片葉片分割提取,將圖像背景標(biāo)定板去掉后圖像如圖2所示,分割后得到單片葉片。
對(duì)蘋(píng)果樹(shù)葉片根據(jù)多尺度Retinex理論(Multi scale Retinex,MSR)進(jìn)行去光照處理,MSR的優(yōu)點(diǎn)是不僅可以增強(qiáng)圖像對(duì)比度還可以對(duì)圖像在動(dòng)態(tài)范圍內(nèi)進(jìn)行壓縮,并且,在一定條件下,MSR可以克服單尺度Retinex理論(Single scale Retinex,SSR)的缺點(diǎn),保持圖像色彩恒常性的同時(shí),實(shí)現(xiàn)圖像全局、部分動(dòng)態(tài)范圍壓縮以及圖像色彩的增強(qiáng),MSR計(jì)算公式為
(1)
式中r(x,y)——輸出圖像
Wk——第k個(gè)尺度的加權(quán)系數(shù)
S(x,y)——原始圖像
Fk——環(huán)繞函數(shù)
K——高斯中心環(huán)繞函數(shù)的個(gè)數(shù),當(dāng)K=1時(shí),只有一個(gè)中心環(huán)繞函數(shù),MSR理論退化為SSR理論
通常情況下,為保證MSR算法同時(shí)包含SSR算法低、中、高3個(gè)尺度的優(yōu)點(diǎn),K取值為3,并且W1=W2=W3=1/3。圖3為圖像處理前后對(duì)比。
最后,在RGB空間下提取蘋(píng)果樹(shù)葉片各單色分量,開(kāi)花期、幼果期和果實(shí)膨大期蘋(píng)果樹(shù)葉片在RGB空間下各單色分量的分布范圍。開(kāi)花期,R、G、B分量的最大值分別為7.882、62.410、15.539,最小值分別為5.041、50.236、6.470,平均值分別為6.139、54.684、10.886;在幼果期,R、G、B分量的最大值分別為7.867、53.602、23.589,最小值分別為2.764、43.132、13.694,平均值分別為5.231、47.449、18.838;果實(shí)膨大期,R、G、B分量的最大值分別為9.143、49.821、28.361,最小值分別為2.333、40.828、22.515,平均值分別為5.552、45.118、25.447。
為避免圖像的單色分量參數(shù)對(duì)氮素表征能力弱的問(wèn)題,進(jìn)一步提升基于圖像處理技術(shù)在RGB空間下對(duì)蘋(píng)果樹(shù)葉片氮含量監(jiān)測(cè)的準(zhǔn)確性,引入R+G+B、R-B、R-G、G-B、R-G-B、R/(R+G+B)、G/(R+G+B)、B/(R+B+G)、G/R、R/(R+G-B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B)、(R-G)/(R+G+B)共14個(gè)單色分量色彩組合參數(shù),共計(jì)17種圖像色彩特征。因篇幅有限,在開(kāi)花期采集的部分原始數(shù)據(jù),如表1所示。
表1 開(kāi)花期采集的部分原始數(shù)據(jù)Tab.1 Part of original data collected at flowering stage
主成分分析(Principal component analysis,PCA)是一種重要的數(shù)據(jù)統(tǒng)計(jì)方法,其能夠從眾多原始變量中找出幾個(gè)綜合性強(qiáng)的變量來(lái)替代原始變量,新的綜合變量之間不僅互不相關(guān),而且保留了原始變量的絕大部分信息,最終實(shí)現(xiàn)降維目的,使問(wèn)題得到最佳綜合[22-24]。其計(jì)算步驟為:①預(yù)處理后的原始數(shù)據(jù)構(gòu)造標(biāo)準(zhǔn)化矩陣。②對(duì)標(biāo)準(zhǔn)化矩陣計(jì)算相關(guān)系數(shù)矩陣R=(rij)m×n。③計(jì)算相關(guān)系數(shù)矩陣R的特征方程得到特征值和特征向量。④計(jì)算貢獻(xiàn)率τi與累計(jì)貢獻(xiàn)率ηi。累計(jì)貢獻(xiàn)率越大說(shuō)明數(shù)據(jù)信息損失越小。⑤計(jì)算主成分載荷矩陣以及主成分得分。其中載荷矩陣表示原始數(shù)據(jù)協(xié)方差矩陣的特征值。
(2)
式中l(wèi)ij——主成分載荷矩陣
λi——原始數(shù)據(jù)協(xié)方差矩陣的特征值
eij——單位特征向量
最后,將原始樣本數(shù)據(jù)代入主成分的表達(dá)式中即可計(jì)算出主成分得分。
2.2.1支持向量機(jī)
支持向量機(jī)是機(jī)器學(xué)習(xí)領(lǐng)域最重要的方法之一,是借助于統(tǒng)計(jì)與優(yōu)化方法解決機(jī)器學(xué)習(xí)問(wèn)題的強(qiáng)有力工具。針對(duì)蘋(píng)果樹(shù)葉片在RGB空間下各單色分量及各單色分量多種色彩組合參數(shù)檢測(cè)過(guò)程的隨機(jī)波動(dòng)性,采用在小樣本、非線性問(wèn)題的擬合上有一定優(yōu)勢(shì)的SVM回歸模型來(lái)構(gòu)建蘋(píng)果樹(shù)葉片在RGB空間下17種色彩特征與蘋(píng)果樹(shù)葉片氮含量的預(yù)測(cè)模型。蘋(píng)果樹(shù)葉片在RGB空間下各單色分量及各單色分量多種色彩組合參數(shù)檢測(cè)過(guò)程中,利用每組試驗(yàn)的輸入變量xi和輸出量(蘋(píng)果樹(shù)葉片氮含量)si構(gòu)建樣本空間{(xi,si),i=1,2,…,n}。si可表示為非線性函數(shù)模型
fs(x)=ωTφ(x)+b
(3)
式中fs(x)——非線性函數(shù)模型
ω——自變函數(shù)系數(shù)
φ(x)——輸入空間x的非線性映射
b——偏置
為最大可能減少訓(xùn)練誤差的經(jīng)驗(yàn)風(fēng)險(xiǎn),ω和b通過(guò)R(f)模型進(jìn)行評(píng)估
(4)
式中R(f)——考慮最少錯(cuò)分樣本的廣義最優(yōu)分類(lèi)面函數(shù)
C——懲罰因子L——損失函數(shù)
yi——真實(shí)值f(xi)——預(yù)測(cè)值
n——樣本個(gè)數(shù)
(5)
引入Lagrange方程
(6)
(7)
其中
K〈xi,xj〉=φ(xi)φ(xj)
式中K〈xi,xj〉——核函數(shù)
2.2.2BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)在復(fù)雜的非線性系統(tǒng)中具有較高的建模能力,并對(duì)數(shù)據(jù)具有良好的擬合能力,在預(yù)測(cè)方面應(yīng)用廣泛。研究表明,這種簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu)可以逼近任意非線性函數(shù),是一種典型函數(shù)映射關(guān)系。
2.2.3極限學(xué)習(xí)機(jī)
極限學(xué)習(xí)機(jī)(ELM)是一種簡(jiǎn)單易用、有效的單隱層前饋神經(jīng)網(wǎng)絡(luò)。與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度慢、容易陷入極小值點(diǎn)、學(xué)習(xí)率選擇敏感等缺點(diǎn)相比,ELM算法隨機(jī)產(chǎn)生輸入層與隱含層的連接權(quán)值w及隱含層神經(jīng)元的閾值t,且在訓(xùn)練過(guò)程中無(wú)需調(diào)整。只要設(shè)置隱含層神經(jīng)元的個(gè)數(shù),便可以獲得唯一的最優(yōu)解,具有學(xué)習(xí)速度快、泛化能力強(qiáng)等優(yōu)點(diǎn)。
基于上述算法,為了提高預(yù)測(cè)模型精度,本文將多種算法相結(jié)合,構(gòu)建了基于組合色彩特征的蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型。其預(yù)測(cè)流程如圖4所示,預(yù)測(cè)步驟如下:
(1)調(diào)研國(guó)內(nèi)外數(shù)字圖像處理與機(jī)器學(xué)習(xí)技術(shù)在農(nóng)業(yè)方面的應(yīng)用,尤其是對(duì)作物氮素營(yíng)養(yǎng)預(yù)測(cè)方面的研究。
(2)采集開(kāi)花期、幼果期、果實(shí)膨大期3個(gè)不同尺度蘋(píng)果樹(shù)葉片樣本和圖像。
(3)利用化學(xué)方法對(duì)葉片進(jìn)行氮素營(yíng)養(yǎng)測(cè)定,對(duì)葉片圖像進(jìn)行中值濾波、去光照等預(yù)處理,在RGB空間下提取蘋(píng)果樹(shù)葉片17種色彩特征。
(4)利用主成分分析對(duì)蘋(píng)果樹(shù)葉片圖形色彩特征進(jìn)行優(yōu)化,提取不同尺度關(guān)鍵影響因子。
(5)建立PCA-SVM、PCA-BP、PCA-ELM預(yù)測(cè)模型,對(duì)比篩選出不同尺度最佳預(yù)測(cè)模型;調(diào)整優(yōu)化最佳模型參數(shù),構(gòu)建基于組合色彩特征的蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型;通過(guò)田間試驗(yàn)驗(yàn)證蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型性能,實(shí)現(xiàn)對(duì)不同生長(zhǎng)時(shí)期蘋(píng)果樹(shù)葉片氮含量的精準(zhǔn)預(yù)測(cè)。
使用預(yù)處理后的數(shù)據(jù)作為模型的輸入,對(duì)基于組合色彩特征的預(yù)測(cè)模型進(jìn)行訓(xùn)練和測(cè)試。本文選用的預(yù)測(cè)模型性能評(píng)價(jià)指標(biāo)有平均絕對(duì)誤差(Mean absolute error, MAE)、均方根誤差(Root mean square error,RMSE)和平均絕對(duì)百分誤差(Mean absolute percentage error, MAPE)。
以山東省泰安市寧陽(yáng)縣萬(wàn)林農(nóng)場(chǎng)試驗(yàn)園區(qū)域A中蘋(píng)果樹(shù)葉片氮含量為研究對(duì)象。采用已經(jīng)預(yù)處理過(guò)的試驗(yàn)數(shù)據(jù),主要包括RGB空間中R、G、B和R+G+B、R-B、R-G、G-B、R-G-B、R/(R+G+B)、G/(R+G+B)、B/(R+B+G)、G/R、R/(R+G-B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B)、(R-G)/(R+G+B)14個(gè)單色分量色彩組合參數(shù),最終實(shí)現(xiàn)開(kāi)花期、幼果期和果實(shí)膨大期蘋(píng)果樹(shù)葉片氮含量的精準(zhǔn)預(yù)測(cè)。
試驗(yàn)所使用計(jì)算機(jī)的配置如下:處理器為Intel(R) Xeon(R) Silver 4210R CPU @2.40 Hz;機(jī)帶內(nèi)存為64 GB;操作系統(tǒng)為Windows 10(64位);圖像分割、圖像去光照處理與獲取蘋(píng)果樹(shù)葉片RGB空間下各單色分量及單色分量多種色彩組合參數(shù)由Matlab實(shí)現(xiàn);SVM、BP神經(jīng)網(wǎng)絡(luò)和ELM回歸模型均在Matlab中完成。
3.3.1模型分析
由于圖像多種色彩特征之間存在一定的相關(guān)性,直接作為模型的輸入會(huì)使數(shù)據(jù)量過(guò)于龐大,使用主成分分析法對(duì)所獲取的數(shù)據(jù)降維和分析,得到不相關(guān)的新變量,最終提取出多尺度蘋(píng)果樹(shù)葉片氮含量的關(guān)鍵影響因子。本文利用SPSS軟件實(shí)現(xiàn)對(duì)蘋(píng)果樹(shù)葉片氮含量關(guān)鍵影響因子的篩選,不同生長(zhǎng)時(shí)期的方差及主成分貢獻(xiàn)率如表2所示。
表2 開(kāi)花期、幼果期、果實(shí)膨大期方差及主成分貢獻(xiàn)率Tab.2 Variance and principal component contribution rate in flowering, young fruit and fruit expansion stages
選擇“特征值”大于1作為提取主成分的原則,由表2可知,開(kāi)花期、幼果期、果實(shí)膨大期中前3個(gè)因子的特征值均大于1,因此3個(gè)生長(zhǎng)時(shí)期均選擇前3個(gè)因子代替原變量。采用具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法得到各個(gè)顏色因子對(duì)不同主因子的因子載荷,得到的不同時(shí)期成分矩陣如圖5所示。圖中圖像色彩特征1~17分別表示成分B、G、R、R-B、R-G、G-B、R+G+B、R-G-B、R/(R+G+B)、G/(R+G+B)、B/(R+G+B)、G/R、R/(R+G-B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B)、(R-G)/(R+G+B)。
由圖5可以看出,開(kāi)花期,對(duì)成分1貢獻(xiàn)最大的有B、R-B、G-B、G/(R+G+B)、B/(R+G-B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B)8種色彩特征,對(duì)成分2貢獻(xiàn)較大的是R-G、R/(R+G+B)和G/R,R+G+B對(duì)成分3貢獻(xiàn)較大;幼果期,對(duì)成分1貢獻(xiàn)較大的有R-B、G/(R+G+B)、(R-B)/(R+G+B),對(duì)成分2貢獻(xiàn)較大的有R/(R+G-B)、(R-G)/(R+G+B),對(duì)成分3貢獻(xiàn)較大的有G、R+G+B;果實(shí)膨大期,對(duì)成分1貢獻(xiàn)最大的有R-G、G/(R+G+B)、R/(R+G-B)、(R-G)/(R+G+B),對(duì)成分2貢獻(xiàn)較大的有B/(R+G+B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B),R+G+B對(duì)成分3貢獻(xiàn)較大。
通過(guò)主成分分析方法對(duì)不同尺度蘋(píng)果樹(shù)葉片的色彩特征進(jìn)行降維處理,提取出前3個(gè)主成分因子,并建立各主成分的線性表達(dá)式為
F11=0.11u1-0.038u2-0.031u3+…+0.079u17
(8)
F12=0.023u1+0.006u2+0.276u3+…+0.135u17
(9)
F13=0.056u1+0.283u2+0.144u3+…+0.012u17
(10)
F21=0.115v1-0.073v2-0.033v3+…+0.080v17
(11)
F22=0.051v1+0.057v2+0.210v3+…+0.172v17
(12)
F23=0.093v1+0.355v2+0.123v3+…+0.021v17
(13)
F31=0.077w1-0.018w2+0.144w3+…+0.132w17
(14)
F32=0.193w1-0.027w2-0.023w3+…+0.040w17
(15)
F33=0.266w1+0.238w2+0.112w3+…+0.049w17
(16)
式中F11、F12、F13、F21、F22、F23、F31、F32、F33表示不同尺度前3個(gè)主成分因子,u1、u2、…、u17、v1、v2、…、v17、w1、w2、…、w17表示不同尺度蘋(píng)果樹(shù)葉片的17種色彩特征。
因此本文根據(jù)尺度不同選取不同的關(guān)鍵影響因子,開(kāi)花期選用的關(guān)鍵影響因子為B、R-B、G-B、G/(R+G+B)、B/(R+G-B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B)、R-G、R/(R+G+B)、G/R、R+G+B;幼果期選用的關(guān)鍵影響因子為R-B、G/(R+G+B)、(R-B)/(R+G+B)、R/(R+G-B)、(R-G)/(R+G+B)、G、R+G+B;果實(shí)膨大期選用的關(guān)鍵影響因子為R-G、G/(R+G+B)、R/(R+G-B)、(R-G)/(R+G+B)、B/(R+G+B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B)、R+G+B。選取不同的關(guān)鍵影響因子可降低數(shù)據(jù)維度和復(fù)雜度,并以此構(gòu)建多尺度蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型的輸入因子,輸出參數(shù)為蘋(píng)果樹(shù)葉片氮含量。
3.3.2模型選擇
為了得到更加精準(zhǔn)的預(yù)測(cè)效果,分別對(duì)PCA-SVM模型、PCA-BP模型、PCA-ELM模型進(jìn)行對(duì)比,均以相同的樣本進(jìn)行訓(xùn)練。預(yù)測(cè)誤差曲線和預(yù)測(cè)結(jié)果精度對(duì)比如圖6和表3所示。
由圖6可以看出,開(kāi)花期、幼果期和果實(shí)膨大期PCA-SVM模型的誤差曲線在零值上下波動(dòng)最小,其次是PCA-BP模型,3個(gè)時(shí)期內(nèi)誤差曲線波動(dòng)最大的是PCA-ELM模型。
由表3可以看出,開(kāi)花期,PCA-SVM模型的MAE、MAPE和RMSE均低于PCA-ELM和PCA-BP模型,PCA-SVM模型的MAE、MAPE和RMSE分別為1.072、0.099、1.035 g/kg,PCA-SVM模型預(yù)測(cè)精度高于PCA-BP、PCA-ELM兩種模型;幼果期,PCA-SVM模型的MAE、MAPE和RMSE均低于PCA-ELM和PCA-BP模型,PCA-SVM模型的MAE、MAPE和RMSE分別為0.722、0.065、0.850 g/kg,PCA-SVM模型預(yù)測(cè)精度高于PCA-BP和PCA-ELM模型;果實(shí)膨大期,PCA-SVM模型的MAE、MAPE和RMSE也低于PCA-ELM和PCA-BP模型,PCA-SVM模型的MAE、MAPE和RMSE分別為0.680、0.080、0.833 g/kg,PCA-SVM模型預(yù)測(cè)精度高于PCA-BP和PCA-ELM模型。對(duì)比結(jié)果表明,PCA-SVM模型在開(kāi)花期、幼果期、果實(shí)膨大期的預(yù)測(cè)精度均高于PCA-BP、PCA-ELM模型。因此本文選擇PCA-SVM模型作為組合色彩特征蘋(píng)果樹(shù)葉片氮含量的預(yù)測(cè)模型。
表3 不同生長(zhǎng)時(shí)期各模型預(yù)測(cè)結(jié)果精度分析Tab.3 Accuracy analysis of prediction results of each model in different growth periods g/kg
3.3.3模型優(yōu)化
影響遺傳算法[25-26](Genetic algorithm, GA)性能和行為的關(guān)鍵因素為交叉概率(Crossover probability,Pc)和變異概率(Mutation probability,Pm),但要通過(guò)反復(fù)試驗(yàn)來(lái)確定這2個(gè)參數(shù)值,過(guò)程較為繁瑣。自適應(yīng)遺傳算法(Adaptive genetic algorithm,AGA)[27-28]可使Pc和Pm隨適應(yīng)度自動(dòng)變更,即當(dāng)種群中各個(gè)體的適應(yīng)度趨于一定值或趨于局部最優(yōu)時(shí),增加Pc和Pm;相反,當(dāng)適應(yīng)度較發(fā)散時(shí),減小Pc和Pm。對(duì)于種群適應(yīng)度小于平均適應(yīng)度的個(gè)體,采用較高的Pc和Pm淘汰該個(gè)體,而大于種群平均適應(yīng)度的個(gè)體,采用較低的Pc和Pm使該個(gè)體得到保護(hù)進(jìn)入下一代。但該方法較適于處于進(jìn)化后期的群體,對(duì)初期進(jìn)化不利。為了避免Pc和Pm取零值,防止其處于一種近似停滯不前的局面,保證每代的優(yōu)良個(gè)體不被破壞,采用精英選擇策略,使其直接復(fù)制到下一代中。優(yōu)化后Pc和Pm計(jì)算公式分別為
(17)
(18)
式中fmax——群體中最大適應(yīng)度
favg——每代群體的平均適應(yīng)度
f′——交叉?zhèn)€體中較大的適應(yīng)度
f——變異個(gè)體的適應(yīng)度
Pc1、Pc2——交叉概率,取0.9、0.6
Pm1、Pm2——變異概率,取0.1、0.001
懲罰因子C的范圍為[0.1,100],RBF核函數(shù)寬度σ的范圍為[0.01,10],交叉概率Pc的范圍為[0.4,0.9],變異概率Pm的范圍為[0.001,0.1]。支持向量機(jī)參數(shù)最優(yōu)值如表4所示。
表4 支持向量機(jī)參數(shù)最優(yōu)值Tab.4 Optimal parameters of support vector machine
把優(yōu)化后的C和σ應(yīng)用到組合色彩特征蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型中,與優(yōu)化前的預(yù)測(cè)模型相比較,結(jié)果如圖7所示。
從圖7可以看出,在開(kāi)花期、幼果期和果實(shí)膨大期3個(gè)尺度中優(yōu)化后的模型所得到的預(yù)測(cè)曲線均與實(shí)際曲線更加接近,說(shuō)明優(yōu)化后PCA-SVM蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型的擬合效果優(yōu)于優(yōu)化前。表5為優(yōu)化后的PCA-SVM模型在開(kāi)花期、幼果期和果實(shí)膨大期試驗(yàn)得到的MAE、MAPE和RMSE。
表5 不同生長(zhǎng)時(shí)期優(yōu)化后PCA-SVM預(yù)測(cè)模型的精度分析Tab.5 Accuracy analysis of PCA-SVM prediction model optimized in different growth periods g/kg
從表5可以看出,相對(duì)于開(kāi)花期和幼果期,在果實(shí)膨大期取得的預(yù)測(cè)性能最好。此外,優(yōu)化后的PCA-SVM模型的整體預(yù)測(cè)精度在不同時(shí)期均有所提高,開(kāi)花期,與優(yōu)化前相比MAE、MAPE和RMSE分別降低了40.3%、42%、22.7%;幼果期,與優(yōu)化前相比MAE、MAPE和RMSE分別降低了22.7%、23.1%、12.1%;果實(shí)膨大期,與優(yōu)化前相比MAE、MAPE和RMSE分別降低20%、20%、11.5%,可以看出開(kāi)花期組合色彩特征預(yù)測(cè)模型的預(yù)測(cè)精度提高最為明顯,其次是幼果期和果實(shí)膨大期。試驗(yàn)結(jié)果表明,PCA-SVM模型預(yù)測(cè)精度較高,泛化能力強(qiáng),可以較好地?cái)M合不同尺度RGB空間下各單色分量和各單色分量多種色彩組合參數(shù)與蘋(píng)果樹(shù)葉片氮含量之間的復(fù)雜關(guān)系,可以為蘋(píng)果園精準(zhǔn)施肥提供決策依據(jù)。
3.3.4試驗(yàn)驗(yàn)證
試驗(yàn)驗(yàn)證樣本于2020年4—7月在山東省泰安市寧陽(yáng)縣萬(wàn)林農(nóng)場(chǎng)試驗(yàn)園區(qū)域B采集。在開(kāi)花期、幼果期和果實(shí)膨大期隨機(jī)抽樣50株果樹(shù)作為驗(yàn)證樣本[29],通過(guò)凱氏定氮法獲得蘋(píng)果樹(shù)葉片的實(shí)際氮含量,利用組合色彩特征模型預(yù)測(cè)蘋(píng)果樹(shù)葉片的氮含量。通過(guò)相對(duì)誤差評(píng)定蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型的準(zhǔn)確性,開(kāi)花期、幼果期和果實(shí)膨大期的蘋(píng)果樹(shù)葉片氮含量及相對(duì)誤差分布如圖8所示。
試驗(yàn)結(jié)果表明,開(kāi)花期,蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)值與實(shí)測(cè)值的相對(duì)誤差在-6%~9.84%之間;幼果期,蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)值與實(shí)測(cè)值的相對(duì)誤差在-9%~9.51%之間;果實(shí)膨大期,蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)值與實(shí)測(cè)值的相對(duì)誤差在-10%~9.86%之間。說(shuō)明開(kāi)花期和幼果期基于組合色彩特征模型預(yù)測(cè)蘋(píng)果樹(shù)葉片氮含量相對(duì)誤差較小,總體來(lái)說(shuō),模型預(yù)測(cè)值與試驗(yàn)結(jié)果基本符合,不同時(shí)期蘋(píng)果樹(shù)葉片氮含量實(shí)測(cè)值與預(yù)測(cè)值相對(duì)誤差在10%以?xún)?nèi),驗(yàn)證了基于組合色彩特征的蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型的準(zhǔn)確性。通過(guò)機(jī)器視覺(jué)與圖像處理的方式獲取蘋(píng)果樹(shù)葉片在RGB空間下各單色分量及各單色分量多種色彩組合參數(shù),預(yù)測(cè)不同生長(zhǎng)時(shí)期蘋(píng)果樹(shù)葉片氮含量,與傳統(tǒng)方法相比,本文方法具有無(wú)損傷、效率高、成本低、操作簡(jiǎn)單的優(yōu)勢(shì)。準(zhǔn)確地預(yù)測(cè)蘋(píng)果樹(shù)葉片氮含量也可為果園精準(zhǔn)化管理,合理施肥、定時(shí)定量施肥提供理論依據(jù)。
(1)采集不同生長(zhǎng)時(shí)期的蘋(píng)果樹(shù)葉片并通過(guò)圖像處理獲取RGB空間下各單色分量與14種色彩組合參數(shù),采用PCA篩選出不同尺度的蘋(píng)果樹(shù)葉片氮含量不同的關(guān)鍵影響因子,開(kāi)花期選用的關(guān)鍵影響因子為B、R-B、G-B、G/(R+G+B)、B/(R+G-B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B)、R-G、R/(R+G+B)、G/R、R+G+B,幼果期選用的關(guān)鍵影響因子為R-B、G/(R+G+B)、(R-B)/(R+G+B)、R/(R+G-B)、(R-G)/(R+G+B)、G、R+G+B,果實(shí)膨大期選用的關(guān)鍵影響因子為R-G、G/(R+G+B)、R/(R+G-B)、(R-G)/(R+G+B)、B/(R+G+B)、G/(R+G-B)、B/(R+G-B)、(R-B)/(R+G+B)、R+G+B,以此構(gòu)建蘋(píng)果樹(shù)葉片氮含量預(yù)測(cè)模型的輸入樣本,輸出參數(shù)為蘋(píng)果樹(shù)葉片氮含量,實(shí)現(xiàn)了模型輸入的降維,消除了變量之間的冗余性和相關(guān)性。
(2)提出PCA-SVM、PCA-ELM、PCA-BP共3種預(yù)測(cè)模型,在不同生長(zhǎng)時(shí)期,由MAE、RMSE和MAPE作為模型評(píng)價(jià)指標(biāo)確定多尺度預(yù)測(cè)模型。
(3)利用自適應(yīng)遺傳算法對(duì)組合色彩特征模型中懲罰參數(shù)C和RBF核函數(shù)寬度σ進(jìn)行優(yōu)化,優(yōu)化后PCA-SVM預(yù)測(cè)模型在開(kāi)花期、幼果期和果實(shí)膨大期的平均絕對(duì)誤差分別為0.640、0.558、0.544 g/kg,平均絕對(duì)百分誤差分別為0.057、0.050、0.064 g/kg,均方根誤差分別為0.800、0.747、0.737 g/kg,優(yōu)于優(yōu)化前預(yù)測(cè)模型,能夠擬合蘋(píng)果樹(shù)葉片氮含量與RGB空間下各單色分量及各單色分量多種色彩組合參數(shù)之間的非線性關(guān)系,解決了傳統(tǒng)預(yù)測(cè)方法預(yù)測(cè)精度低、魯棒性差等問(wèn)題,該模型具有良好的預(yù)測(cè)性能和泛化能力,可以為果園精準(zhǔn)施肥管理、提升果品品質(zhì)、避免資源浪費(fèi)和環(huán)境污染提供理論依據(jù)。