楊紅云,周 瓊,楊 珺,孫玉婷,路 艷,殷 華
(1.江西農(nóng)業(yè)大學(xué) 軟件學(xué)院,江西 南昌 330045; 2.江西省高等學(xué)校農(nóng)業(yè)信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,江西 南昌 330045; 3.江西農(nóng)業(yè)大學(xué) 計算機(jī)與信息工程學(xué)院,江西 南昌 330045)
在水稻栽培管理中,氮肥對糧食作物產(chǎn)量的貢獻(xiàn)率約占50%[1]。精準(zhǔn)施氮可以減少水稻生長過程中的無效分蘗,提高有效成穗率,優(yōu)化群體結(jié)構(gòu),改善田間植株生長狀況,減輕病蟲害的發(fā)生,進(jìn)而促進(jìn)水稻終產(chǎn)量的形成[2]。近年來,許多學(xué)者圍繞水稻氮素營養(yǎng)狀況診斷進(jìn)行了大量研究。李金文[3]應(yīng)用葉綠素計獲取水稻葉片生理生態(tài)學(xué)特征用于氮素診斷;孫棋[4]發(fā)現(xiàn),水稻拔節(jié)期冠層圖像的顏色特征參量可反映水稻拔節(jié)期氮素營養(yǎng)狀況;李嵐?jié)萚5]發(fā)現(xiàn),水稻冠層色彩參數(shù)與水稻氮素營養(yǎng)指標(biāo)具有較好的相關(guān)性;王遠(yuǎn)等[6]分割水稻冠層圖像提取的特征參數(shù)——紅光標(biāo)準(zhǔn)化值(NRI)與SPAD值、葉片含氮量具有良好的相關(guān)關(guān)系;劉江桓[7]應(yīng)用水稻葉片顏色特征參數(shù)進(jìn)行擬合分析發(fā)現(xiàn),不同生育期水稻頂三葉的顏色特征參數(shù)可反映水稻氮素營養(yǎng)狀態(tài);邵華等[8]發(fā)現(xiàn),738 nm處的水稻冠層一階微分光譜反射率與冠層葉片氮素含量相關(guān)性較高;祝錦霞等[9-10]基于水稻拔節(jié)期頂三葉的顏色特征數(shù)據(jù)與水稻冠層數(shù)據(jù)建立水稻氮素水平識別回歸模型;陳利蘇[11]應(yīng)用圖像處理和支持向量機(jī)(SVM)進(jìn)行溫室水培水稻氮素營養(yǎng)診斷,取得了較好的結(jié)果,但在其他試驗(yàn)場景下的應(yīng)用較受限;王樹文等[12]發(fā)現(xiàn),水稻冠層高光譜反射率與氮含量具有顯著相關(guān)性;Yuan等[13]借助數(shù)碼相機(jī)研究了水稻氮素狀況與葉片綠度的關(guān)系,發(fā)現(xiàn)葉片中部比葉尖和葉片基部更適于開展水稻氮素診斷,分蘗期和孕穗期是評估水稻氮素狀況的關(guān)鍵診斷階段。近年來,應(yīng)用高光譜進(jìn)行農(nóng)作物氮素診斷的研究也相繼被報道。孫小香等[14]獲取晚稻4個生育期冠層的高光譜數(shù)據(jù),發(fā)現(xiàn)基于冠層光譜指標(biāo)和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行水稻葉片氮素含量估算的效果較好;張晶等[15]應(yīng)用SPA-RDI-SVM模型進(jìn)行甜菜葉片含氮量預(yù)測;白麗敏等[16]應(yīng)用SPA-PLS模型進(jìn)行冬小麥冠層全氮含量預(yù)測;單貴蓮等[17]應(yīng)用多花黑麥草敏感波段光譜反射率R760與植株含氮量建立線性回歸模型,效果較好;張國圣等[18]應(yīng)用沈稻47分蘗期葉片高光譜的歸一化差值植被指數(shù)(NDVI)與同期氮素含量建立線性回歸模型,效果較好;李穎等[19]應(yīng)用概率神經(jīng)網(wǎng)絡(luò)基于室內(nèi)盆栽水稻的冠層光譜進(jìn)行氮素營養(yǎng)診斷識別分類,分蘗期、拔節(jié)期和抽穗期的總體識別準(zhǔn)確率分別為74%、75%和71%。本研究擬通過高光譜技術(shù)獲取分蘗期水稻的頂三葉光譜數(shù)據(jù),應(yīng)用機(jī)器學(xué)習(xí)方法建立大田水稻氮素營養(yǎng)診斷模型并開展分類識別,旨在摸索一種可準(zhǔn)確判別大田環(huán)境下水稻氮素營養(yǎng)狀況的普適性高、易于推廣的方法。
試驗(yàn)于2018年在江西省南昌市江西農(nóng)業(yè)大學(xué)試驗(yàn)田進(jìn)行。土壤基本理化性狀如下:pH值5.3,全氮1.02 g·kg-1,全磷0.48 g·kg-1,全鉀14.22 g·kg-1,有機(jī)質(zhì)19.46 g·kg-1,堿解氮112.31 mg·kg-1,速效磷11.65 mg·kg-1,速效鉀123.84 mg·kg-1。
以中嘉早17水稻品種為試驗(yàn)材料。依施氮水平差異設(shè)4個處理:N0,不施N;N1,基肥、分蘗肥、穗肥分別施N 114.0、45.6、68.4 kg·hm-2;N2,基肥、分蘗肥、穗肥分別施N 163.0、65.2、97.8 kg·hm-2;N3,基肥、分蘗肥、穗肥分別施N 212.0、84.8、127.2 kg·hm-2。各處理統(tǒng)一基施P 750 kg·hm-2。所有處理均于4月9日播種,4月28日移栽,栽插密度為13.3 cm×26.6 cm,人工移栽,其他田間管理按常規(guī)栽培要求進(jìn)行。
試驗(yàn)使用ASD野外光譜分析儀采集光譜數(shù)據(jù),其波長范圍為350~2 500 nm。采樣時正值水稻分蘗期(5月17日),每個處理取60片水稻頂三葉葉片,共計240片。以每片葉片為一個樣本。每個樣本分別采集葉尖、葉中、葉枕3條光譜,以其平均值作為該樣本的光譜反射率值,數(shù)值處理在Viewspec Program軟件中進(jìn)行。光譜測量時,每間隔15 min進(jìn)行一次標(biāo)準(zhǔn)白板校正。
由于光譜數(shù)據(jù)會受到譜線平移、高頻隨機(jī)噪聲和光散射等因素的干擾,為保證所建模型的精度和穩(wěn)定性,需對光譜進(jìn)行預(yù)處理,以最大限度地挖掘光譜數(shù)據(jù)中的有效信息,提升其信噪比。常見的光譜預(yù)處理方法包括多元散射校正(MSC)、變量標(biāo)準(zhǔn)化校正(SNV)、平滑算法(SG)、歸一化、基線校正等[20]。本研究分別采用MSC、SNV、SG方法進(jìn)行對比試驗(yàn)。
主成分分析(PCA)是將篩選出的能夠反映水稻施氮水平類別的幾個特征指標(biāo)重新組合,形成一組無關(guān)聯(lián)、信息不重疊的幾個綜合指標(biāo)替代原有的影響指標(biāo),視實(shí)際需求從中提取若干能夠反映原有指標(biāo)信息的綜合指標(biāo),以有效地對水稻施氮水平進(jìn)行預(yù)測分類[21]。
連續(xù)投影算法(SPA)是一種前向變量選擇方法,能有效尋找含有最低限度冗余信息的變量組,使變量之間的共線性達(dá)到最小。SPA算法能夠從大量的光譜變量中提取少數(shù)幾個共線性小的光譜特征波長代表原始的光譜數(shù)據(jù),從而將數(shù)據(jù)降維,減少模型的輸入變量,提高模型計算速度。以均方根誤差(RMSE)為評價指標(biāo),以RMSE最小值下的波長個數(shù)確定特征波長個數(shù)[22]。
SVM在解決非線性、小樣本數(shù)據(jù)集、高維空間模式識別等問題上獨(dú)具優(yōu)勢。核函數(shù)是SVM的理論基礎(chǔ)。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)、sigmoid核函數(shù)[23]。本研究選用徑向基核函數(shù)作為SVM模型的核函數(shù)。
水稻葉片原始反射光譜及經(jīng)不同方法預(yù)處理后的光譜曲線如圖1所示。從圖1-A的原始光譜可以看出,不同施氮水平下,水稻葉片光譜反射率曲線表現(xiàn)出相同的走向趨勢。在綠波段(約560 nm)處可見明顯的反射峰,即“綠峰”;在紅波段(約685 nm)處可見明顯的吸收谷,即“紅谷”;在近紅外波段(>760 nm)處出現(xiàn)一個較高的反射平臺。圖1-B~D分別是經(jīng)過MSC、SNV、SG預(yù)處理后的光譜曲線圖,可以看出:MSC處理后的光譜反射率值區(qū)間與原始光譜相近,與SNV處理后的光譜走勢相近;SNV處理后的光譜反射率值區(qū)間與原始光譜差異較大;SG處理后的光譜反射率曲線中各樣本分布緊密。
a,原始光譜;b,MSC處理后的光譜;c,SNV處理后的光譜;d,SG處理后的光譜。a, Original spectrum; b, Spectrum after MSC; c, Spectrum after SNV; d, Spectrum after SG.
對經(jīng)過不同方法預(yù)處理后各處理的樣本分別進(jìn)行主成分分析。如圖2所示:MSC處理后主分成1(PC1)的貢獻(xiàn)率為82.11%,主成分2(PC2)的貢獻(xiàn)率為7.31%;SNV處理后PC1的貢獻(xiàn)率為81.60%,PC2的貢獻(xiàn)率為7.73%;SG處理后PC1的貢獻(xiàn)率為56.59%,PC2的貢獻(xiàn)率為26.30%。經(jīng)過3種方法的預(yù)處理后,PC1與PC2的累積貢獻(xiàn)率均超過80%且低于90%,各處理的樣本點(diǎn)重疊嚴(yán)重,難以對不同處理的樣本進(jìn)行區(qū)分;因此,考慮采用基本能夠反映原樣本信息的累積貢獻(xiàn)率超過99.98%的前24個主成分作為SVM的輸入變量,3種預(yù)處理方法的前24個主成分的累積貢獻(xiàn)率如表1所示。
若采用全波段進(jìn)行建模,時間較長,且包含過多冗余信息;因此,采用SPA對經(jīng)不同方法預(yù)處理后的光譜數(shù)據(jù)提取特征波長(圖3),以最小RMSE值下的波長個數(shù)作為特征波長數(shù)量。對于經(jīng)過MSC處理后的光譜數(shù)據(jù),最小RMSE值為0.431 13,對應(yīng)的最佳波長個數(shù)為12,篩選的特征波長分別是350、374、728、750、1 004、1 187、1 801、1 937、2 465、2 475、2 495、2 500 nm;對于經(jīng)過SNV處理后的光譜數(shù)據(jù),最小RMSE值為0.480 39,對應(yīng)的最佳波長個數(shù)為15,篩選的特征波長分別是350、396、504、700、715、746、1 326、1 438、1 674、1 929、1 981、2 170、2 461、2 495、2 500 nm;對于經(jīng)過SG處理后的光譜數(shù)據(jù),最小RMSE值為0.371 95,對應(yīng)的最佳波長個數(shù)為19,篩選的特征波長分別是350、352、396、419、425、475、646、685、695、708、739、854、1 000、1 001、1 365、1 803、2 013、2 179、2 490 nm。
將所有供試樣本按照2∶1的比例隨機(jī)分成建模集和預(yù)測集2個集合,其中建模集有160個樣本(每個處理各40個),預(yù)測集有80個樣本(每個處理各20個)。以PCA獲取的前24個主成分,和SPA算法獲取的特征波長作為模型輸入?yún)?shù),將4個處理的氮素水平分別標(biāo)記為1、2、3、4,作為模型的輸出參數(shù),采用SVM建立水稻氮素營養(yǎng)診斷模型,并開展水稻氮素營養(yǎng)診斷識別,分類結(jié)果如表2所示。對于3種光譜預(yù)處理方法而言,PCA-SVM模型在預(yù)測集上的準(zhǔn)確率均高于SPA-SVM模型。其中,對于MSC預(yù)處理方法,PCA-SVM模型在預(yù)測集上的準(zhǔn)確率比SPA-SVM模型高出25.00個百分點(diǎn);對于SNV預(yù)處理方法,法,PCA-SVM模型在預(yù)測集上的準(zhǔn)確率比SPA-SVM模型高出21.25個百分點(diǎn);對于SG預(yù)處理方法,PCA-SVM模型在預(yù)測集上的準(zhǔn)確率比SPA-SVM模型高出10.00個百分點(diǎn)。對于PCA-SVM模型,經(jīng)過MSC預(yù)處理的模型在預(yù)測集上的準(zhǔn)確率最高,經(jīng)過SNV預(yù)處理的模型次之,經(jīng)過SG預(yù)處理的模型最低;對于SPA-SVM模型,經(jīng)過SNV預(yù)處理的模型在預(yù)測集上的準(zhǔn)確率最高。綜合各模型在建模集和預(yù)測集上的準(zhǔn)確率,MSC-PCA-SVM模型的效果最佳,在建模集和預(yù)測集上的準(zhǔn)確率分別達(dá)99.38%和97.50%,其在預(yù)測集上的實(shí)際分類與預(yù)測分類結(jié)果如圖4所示,圖中縱坐標(biāo)為氮素水平(類別標(biāo)簽),橫坐標(biāo)為測試樣本編號,對于N0、N1、N3處理的樣本(對應(yīng)縱坐標(biāo)為1、2、4)全部識別正確,對于N2處理的樣本(對應(yīng)縱坐標(biāo)為3),有2個被誤判為N1處理(對應(yīng)縱坐標(biāo)為2)。
a,經(jīng)MSC預(yù)處理;b,經(jīng)SNV預(yù)處理;c,經(jīng)SG預(yù)處理。a, After MSC; b, After SNV; c, After SG.
表1 不同預(yù)處理方法前24個主成分的累積貢獻(xiàn)率
Table1Cumulative contribution rate of the first 24 principal components after different pretreatments
預(yù)處理方法Pretreatment累計貢獻(xiàn)率Cumulativecontributionrate/%MSC99.9867SNV99.9859SG99.9949
a,b,MSC+SPA;c,d,SNV+SPA;e,f,SG+SPA。
本研究采用不同光譜預(yù)處理方法對分蘗期水稻的葉片高光譜數(shù)據(jù)進(jìn)行預(yù)處理,分別采用PCA和SPA算法進(jìn)行參數(shù)選取,基于SVM建立水稻氮素營養(yǎng)診斷分類模型。結(jié)果顯示,用MSC-PCA-SVM模型開展水稻葉片氮素營養(yǎng)診斷分類,其在預(yù)測集上的識別準(zhǔn)確率高達(dá)97.50%,僅有少數(shù)樣本被誤判,可有效識別處于缺氮和氮過量水平的水稻葉片,從而對水稻氮素營養(yǎng)狀況做出初步判斷。
表2 各模型的分類預(yù)測結(jié)果
Table2Classification prediction results of different models
建模方法Model輸入?yún)?shù)數(shù)量No.ofinputvariables準(zhǔn)確率Accuracy/%建模集Trainingset預(yù)測集PredictionsetMSC-PCA-SVM2499.3897.50MSC-SPA-SVM1284.3872.50SNV-PCA-SVM2498.7596.25SNV-SPA-SVM1586.8875.00SG-PCA-SVM2410082.50SG-SPA-SVM1992.5072.50
圖4 MSC-PCA-SVM模型在預(yù)測集上的識別分類結(jié)果
本研究采用高光譜技術(shù)獲取水稻氮素營養(yǎng)診斷分類模型的輸入特征數(shù)據(jù),并采用機(jī)器學(xué)習(xí)方法建立水稻氮素營養(yǎng)診斷分類模型,研究結(jié)果可為作物生長過程反演虛擬研究提供支持,同時為作物氮素營養(yǎng)診斷識別分類提供了一種有效可行的方法,對于科學(xué)指導(dǎo)作物施肥也具有參考意義。
顧清等[24]應(yīng)用圖像處理技術(shù)和SVM獲取葉片黃化比例、葉尖G值、葉片面積3個特征值進(jìn)行氮素營養(yǎng)診斷,但難以識別氮過量樣品。本研究中建立的水稻氮素營養(yǎng)診斷分類模型,能夠很好地識別出缺氮(N0處理)和高氮(N3處理)樣品,但對于N2處理的樣品,有2個被誤判為N1處理,這可能是因?yàn)檫@2個處理的樣本間相似程度較大,不易于區(qū)分。今后應(yīng)加強(qiáng)對類似樣品的識別研究。
本研究僅對2018年在中嘉早17品種水稻上獲取的破壞性高光譜數(shù)據(jù)進(jìn)行了分析,屬于水稻氮素營養(yǎng)診斷的初步研究,尚存在許多值得改進(jìn)之處。在今后的研究中,擬增加供試水稻品種,豐富不同年限不同時期不同葉位的水稻植株特征數(shù)據(jù)庫,對模型輸入?yún)?shù)的選取做進(jìn)一步研究,同時對非破壞性水稻參數(shù)的測量獲取開展研究,以便建立更具通用性和實(shí)用性的水稻氮素營養(yǎng)診斷識別模型。此外,還擬聯(lián)合水稻植株的其他參數(shù),開展更為細(xì)致的等級分類,或通過獲取水稻冠層圖像、光譜數(shù)據(jù)進(jìn)行氮素反演,建立優(yōu)化的識別模型,為水稻精準(zhǔn)施肥提供理論依據(jù)。