班松濤 田明璐 常慶瑞 王 琦 李粉玲
(1.西北農(nóng)林科技大學(xué)資源環(huán)境學(xué)院, 陜西楊凌 712100; 2.上海市農(nóng)業(yè)科學(xué)院農(nóng)業(yè)科技信息研究所, 上海 201403;3.上海市數(shù)字農(nóng)業(yè)工程技術(shù)研究中心, 上海 201403)
磷元素是農(nóng)作物體內(nèi)多種生物分子的關(guān)鍵組成部分,參與了大量理化反應(yīng)和代謝過程,是農(nóng)作物所需的大量營養(yǎng)元素之一[1]。在農(nóng)業(yè)生產(chǎn)過程中,磷肥施入不足會(huì)影響作物的生長和作物品質(zhì),施入過量則會(huì)造成面源污染[2]。因此,快速、準(zhǔn)確地診斷磷素在田間的分布狀況、并有針對(duì)性地進(jìn)行精準(zhǔn)施肥對(duì)實(shí)現(xiàn)高效綠色農(nóng)業(yè)非常重要。但通過化學(xué)分析測(cè)量作物磷素含量的方法所花費(fèi)的時(shí)間和人力成本都比較高,且難以實(shí)現(xiàn)對(duì)大面積作物的快速測(cè)量。
高光譜遙感技術(shù)的發(fā)展為作物組分快速無損監(jiān)測(cè)提供了新的手段,眾多學(xué)者對(duì)作物各類元素含量的高光譜特征展開研究,并提出了多種反演模型。針對(duì)作物磷素含量,MAHAJAN等[3]對(duì)雜交水稻養(yǎng)分含量的高光譜進(jìn)行監(jiān)測(cè),研究發(fā)現(xiàn),磷含量與波長670、700、730、1 090、1 260、1 460 nm處反射率具有較高的相關(guān)性,且在1 460 nm處相關(guān)性最高,由1 260、670 nm兩個(gè)波段組合得到的歸一化光譜指數(shù)能夠以較高的精度反演水稻葉片磷含量,其驗(yàn)證R2為0.67。林芬芳等[4]基于互信息理論對(duì)水稻光譜進(jìn)行分析,提取了536、551、630、656、1 040 nm共計(jì)5個(gè)對(duì)水稻葉片磷素敏感的波段,并在此基礎(chǔ)上采用神經(jīng)網(wǎng)絡(luò)和多元線性回歸構(gòu)建了磷素估算模型,其預(yù)測(cè)R2達(dá)到了0.989。ALABBAS等[5]、程一松等[6]、OSBORNE等[7]、王磊等[8]分析了玉米在不同磷素含量下的高光譜特征,發(fā)現(xiàn)波段350~730 nm和1 420~1 800 nm的可見光-近紅外光譜可以用于玉米磷素的診斷。SEMBIRING等[9]、PIMSTEIN等[10]、MAHAJAN等[11]、劉煒等[12]研究了磷脅迫下冬小麥的光譜特征,發(fā)現(xiàn)小麥磷含量與可見光波段的反射率呈顯著負(fù)相關(guān),特別是紅光波段的反射率。此外,也有一些學(xué)者對(duì)蘋果[13-15]、柑橘[16]、番茄[17]、黃瓜[18]等果蔬作物的葉片磷含量高光譜特征和反演模型進(jìn)行了研究,并取得了較好的效果。
以上研究主要基于葉片光譜或近地冠層光譜,每次只能測(cè)量單個(gè)樣點(diǎn)上的磷素狀態(tài),而無人機(jī)高光譜成像技術(shù)則可將測(cè)量范圍從樣點(diǎn)擴(kuò)展到區(qū)域尺度,從而更好地為生產(chǎn)實(shí)際服務(wù)[19-21]。目前,在較大范圍內(nèi)基于無人機(jī)平臺(tái)的水稻磷元素高光譜監(jiān)測(cè)研究仍較少。本文以水稻為研究對(duì)象,基于無人機(jī)高光譜影像數(shù)據(jù),通過波段篩選和光譜指數(shù)構(gòu)建,建立水稻葉片全磷含量(Leaf phosphorus content, LPC)估算模型,以期為水稻磷元素營養(yǎng)狀況的無人機(jī)遙感監(jiān)測(cè)提供科學(xué)依據(jù)。
試驗(yàn)田位于寧夏回族自治區(qū)青銅峽市葉盛鎮(zhèn)水稻示范基地(38°7′28″N,106°11′37″E),如圖1所示。葉盛鎮(zhèn)屬溫帶干旱氣候,地貌類型為黃河沖積平原。葉盛鎮(zhèn)水稻示范基地試驗(yàn)田種植的水稻品種為寧粳43號(hào),設(shè)置3個(gè)水平的氮肥和4個(gè)水平生物炭組合,共12個(gè)處理。氮肥施入量分別為0 kg/hm2(N1)、240 kg/hm2(N2)、300 kg/hm2(N3);生物炭施入量分別為0 kg/hm2(C1)、4 500 kg/hm2(C2)、9 000 kg/hm2(C3)、13 500 kg/hm2(C4);每個(gè)處理重復(fù)3次,共計(jì)36個(gè)小區(qū)。各小區(qū)磷肥和鉀肥相同,P2O5和K2O施入量均為90 kg/hm2,但由于水稻氮-磷吸收具有互作效應(yīng),不同氮處理小區(qū)的水稻對(duì)磷的吸收并不相同[22-23],LPC也有差異。其他管理措施與當(dāng)?shù)卮筇锼鞠嗤?。單個(gè)小區(qū)規(guī)格為5 m×12 m,面積60 m2。
于2016年7月19日(拔節(jié)期)、8月16日(灌漿期)和9月7日(乳熟期)展開田間試驗(yàn)3次。使用的機(jī)載遙感傳感器為Cubert S185型快照式高成像光譜儀(簡稱S185),影像數(shù)據(jù)的波長范圍為450~998 nm,光譜采樣間隔為4 nm;影像分辨率為1 000像素×1 000像素;鏡頭焦距25 mm,視場角13°。高光譜影像的采集于11:00—12:00在田間上空進(jìn)行,天氣晴。遙感平臺(tái)為八旋翼無人機(jī),設(shè)定自動(dòng)航線的航向重疊率85%,旁向重疊率70%,飛行高度100 m;在無人機(jī)起飛之前,使用隨S185配備的標(biāo)準(zhǔn)白板對(duì)傳感器進(jìn)行反射率標(biāo)定;設(shè)置S185為等時(shí)間間隔自動(dòng)拍攝,時(shí)間間隔為1 s;飛行時(shí)間約12 min,單次飛行獲取影像約720幅。對(duì)影像進(jìn)行篩選,剔除冗余影像,使用Cubert Pilot軟件對(duì)高光譜影像進(jìn)行輻射校正、大氣校正等處理,根據(jù)白板標(biāo)定結(jié)果將影像DN值轉(zhuǎn)換為反射率,得到反射率影像數(shù)據(jù);在Agisoft Photoscan軟件中對(duì)反射率影像進(jìn)行拼接,然后根據(jù)差分GPS測(cè)量得到的10個(gè)地面像控點(diǎn)坐標(biāo),在ArcGIS軟件中對(duì)拼接得到的影像進(jìn)行幾何校正,再使用試驗(yàn)田邊界矢量文件對(duì)影像進(jìn)行裁切,得到覆蓋完整試驗(yàn)田的高光譜影像(圖1b),影像空間分辨率為2.7 cm。
在無人機(jī)高光譜影像采集的同一天,在每個(gè)小區(qū)中心區(qū)域選擇長勢(shì)均勻、代表性強(qiáng)的樣點(diǎn)1個(gè),采集樣點(diǎn)周圍半徑約為100 cm內(nèi)水稻不同部位的葉片30片左右,裝入自封袋帶回實(shí)驗(yàn)室;并使用差分GPS記錄每個(gè)采樣點(diǎn)的坐標(biāo)。將葉片樣品殺青、干燥、粉碎,使用全自動(dòng)間斷化學(xué)分析儀測(cè)量樣品中全氮和全磷含量,以干基質(zhì)量分?jǐn)?shù)表示。各生育期LPC統(tǒng)計(jì)特征如表1所示。
表1 LPC樣本統(tǒng)計(jì)特征
水稻對(duì)氮、磷的吸收具有協(xié)同作用,王偉妮等[22]、劉曉偉等[23]的研究表明在磷肥施入量固定的情況下,氮肥施入量的增加會(huì)顯著提高磷的吸收量;氮肥施入不足時(shí),磷的吸收也會(huì)出現(xiàn)下降的趨勢(shì)。本研究中各小區(qū)采用碳氮組合施肥處理,但檢測(cè)結(jié)果表明,不同氮肥處理小區(qū)的LPC均值也具有明顯的差異,具體表現(xiàn)為氮肥施入量越高、LPC越大(圖2)。因此,水稻LPC數(shù)據(jù)集具備光譜分析和建模所需的梯度和差異性。
以每個(gè)小區(qū)內(nèi)采樣點(diǎn)的坐標(biāo)為中心,使用ENVI軟件中的ROI工具在各期拼接和校正處理完成的高光譜影像上選取50像素×50像素的區(qū)域,并統(tǒng)計(jì)區(qū)域內(nèi)所有像元的光譜反射率(Spectral reflectance, SR)的平均值作為該樣點(diǎn)的水稻冠層光譜反射率,得到3個(gè)生育期的光譜和葉片全磷數(shù)據(jù)樣本共108組,在每個(gè)生育期數(shù)據(jù)的3個(gè)重復(fù)小區(qū)中隨機(jī)選取2個(gè)用于建模,剩余1個(gè)用于驗(yàn)證。這樣,2/3的樣本(72個(gè))作為建模集,1/3的樣本(36個(gè))作為驗(yàn)證集。
1.5.1敏感波段選擇
由于高光譜數(shù)據(jù)波段較多,在建模之前需要對(duì)波段進(jìn)行篩選,去除不包含目標(biāo)信息的波段。本研究使用連續(xù)投影算法(Successive projections algorithm, SPA)提取特征波段。SPA是一種前向變量選擇算法,通過使矢量空間的共線性最小化,消除原始光譜矩陣中冗余的信息,從全部波段中篩選出若干特征波長,從而使基于光譜的多元回歸模型的建模條件得到簡化和改善[24]。
1.5.2光譜指數(shù)選擇
將波段450~998 nm范圍內(nèi)任意兩個(gè)波長的光譜反射率分別進(jìn)行歸一化、比值和差值運(yùn)算,得到歸一化光譜指數(shù)(Normalized difference spectral index,NDSI)、比值光譜指數(shù)(Ratio spectral index,RSI)和差值光譜指數(shù)(Difference spectral index,DSI),計(jì)算公式為
NDSI(Ri,Rj)=(Ri-Rj)/(Ri+Rj)
(1)
RSI(Ri,Rj)=Ri/Rj
(2)
DSI(Ri,Rj)=Ri-Rj
(3)
式中Ri、Rj——波長i、j處的光譜反射率
分別計(jì)算每一個(gè)NDSI、RSI、DSI與LPC的相關(guān)系數(shù),尋找與LPC相關(guān)性最高的光譜指數(shù)用于LPC估算模型的構(gòu)建。
1.5.3模型構(gòu)建與檢驗(yàn)
基于建模數(shù)據(jù)集,分別使用多元線性回歸(Multivariable linear regression, MLR)、偏最小二乘回歸法(Partial least squares regression, PLSR)、支持向量機(jī)回歸(Support vector regression, SVR)和基于人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network, ANN)的回歸算法進(jìn)行LPC估算模型的構(gòu)建。其中PLSR集成了主成分分析、典型相關(guān)分析和多元線性回歸分析,能夠消除自變量間的多重相關(guān)性,有效提取對(duì)系統(tǒng)解釋性最強(qiáng)的綜合變量,建立精確、穩(wěn)定的模型[25]。SVR是基于統(tǒng)計(jì)學(xué)理論的一種機(jī)器學(xué)習(xí)算法,通過非線性映射把輸入的向量數(shù)據(jù)從原空間映射到高維空間,并在高維空間中構(gòu)造最優(yōu)回歸函數(shù)[26]。ANN是一種模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的非線性統(tǒng)計(jì)性數(shù)據(jù)建模機(jī)器學(xué)習(xí)算法[27];本文采用多層前饋神經(jīng)網(wǎng)絡(luò),通過設(shè)置輸入層、中間層(也稱隱含層)和輸出層,基于數(shù)學(xué)統(tǒng)計(jì)學(xué)類型的學(xué)習(xí)方法進(jìn)行優(yōu)化,建立回歸模型。本文SVR模型中使用的核函數(shù)為Polynomial函數(shù);ANN模型采用的訓(xùn)練算法為Levenberg-Marquardt,設(shè)置隱含層層數(shù)為5。
使用驗(yàn)證數(shù)據(jù)集對(duì)各模型精度進(jìn)行檢驗(yàn),采用決定系數(shù)R2(Coefficient of determination)和均方根誤差(Root mean square error, RMSE)評(píng)估各模型的精度,R2越接近1、RMSE越小,模型精度越高。
不同LPC水稻冠層光譜反射率如圖3所示。由圖3可知,在波段454~720 nm范圍內(nèi),水稻冠層光譜反射率隨LPC的增大而減小;在波段724~998 nm范圍,反射率隨LPC的變化沒有表現(xiàn)出規(guī)律性的變化。對(duì)全生育期內(nèi)水稻LPC與各波段光譜反射率的相關(guān)性進(jìn)行分析,結(jié)果如圖4所示,在可見光-紅邊波段462~718 nm范圍,LPC與光譜反射率表現(xiàn)出極顯著負(fù)相關(guān)(P<0.001);其中在波段562~706 nm范圍相關(guān)系數(shù)絕對(duì)值均高于0.8,形成了一個(gè)高相關(guān)平臺(tái);LPC與波長622 nm處的光譜反射率達(dá)到最大負(fù)相關(guān),相關(guān)系數(shù)為-0.902。在近紅外波段722~998 nm范圍,LPC與光譜反射率未表現(xiàn)出顯著相關(guān)性。MAHAJAN等[3]研究發(fā)現(xiàn)水稻冠層LPC在波段520~710 nm范圍與光譜反射率顯著負(fù)相關(guān)(P<0.05),這一結(jié)論與本文相一致。但在波長大于710 nm的近紅外波段,MAHAJAN等[3]發(fā)現(xiàn)LPC與反射率顯著正相關(guān)(P<0.05),而本研究中LPC與近紅外波段反射率雖也表現(xiàn)出正相關(guān),但未達(dá)到0.001水平的顯著性,這可能與使用的數(shù)據(jù)集及顯著性水平的選取有關(guān)。
以LPC為目標(biāo)變量、各波段的光譜反射率為解釋變量,使用SPA對(duì)全波段進(jìn)行篩選,最終選取670、706、722、846 nm 共4個(gè)特征波長?;诮?shù)據(jù)集,以4個(gè)特征波長對(duì)應(yīng)的光譜反射率為自變量,分別使用MLR、PLSR、SVR和ANN算法構(gòu)建LPC估算模型,并用驗(yàn)證數(shù)據(jù)集對(duì)各模型精度進(jìn)行檢驗(yàn),結(jié)果如表2所示。LPC-SR-ANN和LPC-SR-PLSR 2個(gè)模型精度較高,2個(gè)模型的建模R2和驗(yàn)證R2均高于0.9;其中LPC-SR-ANN模型的建模R2達(dá)到了0.976,RMSE僅為0.007%,表現(xiàn)最佳。但在模型驗(yàn)證中LPC-SR-PLSR表現(xiàn)出最高的精度,驗(yàn)證R2為0.925,其次才是LPC-SR-ANN模型;這說明基于PLSR算法的模型具有更好的穩(wěn)定性。
表2 基于特征波長光譜反射率的LPC模型
對(duì)LPC與任意兩波段光譜反射率組合運(yùn)算得到的光譜指數(shù)NDSI(Ri,Rj)、RSI(Ri,Rj)和DSI(Ri,Rj)進(jìn)行相關(guān)分析,并制作相關(guān)系數(shù)的等勢(shì)圖,結(jié)果如圖5所示。其中,498 nm與606 nm組合得到的NDSI(R498,R606)和RSI(R498,R606)與LPC相關(guān)性最好,相關(guān)系數(shù)分別為0.913和0.915;498 nm和586 nm組合得到的DSI(R498,R586)與LPC相關(guān)性最好,相關(guān)系數(shù)為0.938。
以NDSI(R498,R606)、RSI(R498,R606)和DSI(R498,R586)為自變量,分別使用MLR、PLSR、SVR和ANN構(gòu)建LPC估算模型,并利用驗(yàn)證數(shù)據(jù)集對(duì)各模型精度進(jìn)行檢驗(yàn),結(jié)果如表3所示。LPC-SI-ANN模型的精度最高,建模R2達(dá)到0.937、RMSE僅為0.011%,驗(yàn)證R2為0.885、RMSE為0.029%,表現(xiàn)優(yōu)于其他3個(gè)模型;LPC-SI-SVR模型建模精度較高(R2=0.891),但驗(yàn)證精度略低(R2=0.878);LPC-SI-PLSR和LPC-SI-MLR兩個(gè)模型建模精度相近(R2分別為0.885和0.884),但前者驗(yàn)證精度更高(R2為0.881),PLSR算法再次表現(xiàn)出較好的穩(wěn)定性。
表3 基于光譜指數(shù)的LPC模型
使用精度較高的LPC-RS-PLSR模型對(duì)獲取的各期高光譜影像進(jìn)行解算,得到試驗(yàn)田水稻各生育期冠層LPC空間分布圖,結(jié)果如圖6所示;使用對(duì)應(yīng)時(shí)期的LPC實(shí)測(cè)值對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行擬合檢驗(yàn),結(jié)果如圖7所示。由圖6、7可以看出,各生育期水稻LPC模型預(yù)測(cè)值與實(shí)測(cè)值基本一致:一方面,對(duì)于同一生育期內(nèi)不同施肥處理的小區(qū),肥力越高的地塊水稻長勢(shì)越好,LPC也越高;另一方面,對(duì)于同一施肥處理的小區(qū),在不同生育期,隨著水稻從拔節(jié)到成熟的發(fā)展,葉片中的磷元素向果實(shí)轉(zhuǎn)移,LPC呈下降的趨勢(shì)。但同時(shí)也發(fā)現(xiàn),基于全生育期建立的LPC估算模型在單個(gè)生育期中的預(yù)測(cè)精度有所下降(圖7):拔節(jié)期和灌漿期的LPC驗(yàn)證R2分別為0.714和0.704,乳熟期LPC驗(yàn)證R2為0.639。
水稻LPC的高光譜特征較為明顯,與LPC高相關(guān)的光譜反射率集中在可見光-紅邊波段462~718 nm范圍,經(jīng)過SPA篩選得到的4個(gè)特征波長中的2個(gè)波長(670、706 nm)、以及構(gòu)建的新型光譜指數(shù)用到的波長(498、586、606 nm)都分布在該區(qū)間內(nèi)。這一結(jié)果也與其他學(xué)者相關(guān)的研究相同:MAHAJAN等[3]發(fā)現(xiàn)的6個(gè)磷元素高相關(guān)波段中有2個(gè)(670、700 nm)在此范圍;林芬芳等[4]使用互信息理論提取到的水稻葉片磷元素的5個(gè)敏感波段中有4個(gè)在同一波段區(qū)間,分別為波長536、551、630、656 nm。這表明診斷水稻磷素的光譜波長位于可見光-紅邊范圍,且敏感度較高的是紅光波段(656、670 nm)和紅邊波段(706、700 nm)。這也與玉米[5-8]、小麥[9-12]等糧食作物的磷素敏感波段相一致,說明這些作物磷素含量的差異在反射光譜上的響應(yīng)具有相似性。在不同的研究中水稻磷含量光譜響應(yīng)也有所不同,且主要反映在近紅外波段上;這主要是由數(shù)據(jù)源和光譜獲取尺度上的差異造成的:本文所使用的數(shù)據(jù)源為低空尺度的無人機(jī)高光譜影像,一方面Cubert S185光譜測(cè)量的波長范圍較小(小于1 000 nm),且波段900~1 000 nm范圍內(nèi)測(cè)得的光譜信噪比較低[28-29];另一方面近紅外光譜受作物冠層結(jié)構(gòu)影響較大[30-31],而近地面尺度和低空無人機(jī)尺度獲取的光譜數(shù)據(jù)中水稻表現(xiàn)出的冠層結(jié)構(gòu)不同[31-32]。這些因素都會(huì)造成不同的研究中近紅外波段上的差異。
在LPC模型的構(gòu)建中,盡管LPC與部分波段的光譜反射率已經(jīng)具有高度的相關(guān)性,但不適合直接用作自變量進(jìn)行建模。這主要是由于高光譜數(shù)據(jù)的相鄰波段之間往往具有較強(qiáng)的共線性,而在多元回歸模型中共線性會(huì)降低模型精度和穩(wěn)定性[33]。因此本研究分別使用SPA篩選特征波長、使用波段組合構(gòu)建光譜指數(shù)用于建模,以減少共線性的影響。從建模結(jié)果來看,基于特征波長的模型精度總體上優(yōu)于基于光譜指數(shù)的模型,這主要是由于兩類變量所包含的光譜信息量不同:4個(gè)特征波長分布于從可見光到近紅外的多個(gè)譜段,光譜信息更豐富;而3個(gè)光譜指數(shù)只使用了可見光中的3個(gè)波段,且NDSI(R498,R606)和RSI(R498,R606)用到的波段相同,包含的光譜信息相對(duì)較少。在后續(xù)的研究中,可以考慮將光譜反射率和光譜指數(shù)進(jìn)行綜合分析篩選、構(gòu)建模型。此外,在各模型中,ANN模型一般都能取得最高的建模精度,但驗(yàn)證精度會(huì)出現(xiàn)較大幅度的下降,原因可能是在本研究數(shù)據(jù)集中,基于機(jī)器學(xué)習(xí)的ANN算法在建模過程中出現(xiàn)了一定程度的過擬合現(xiàn)象。
試驗(yàn)中發(fā)現(xiàn)由于養(yǎng)分脅迫的原因,試驗(yàn)田各小區(qū)水稻生育期并不嚴(yán)格一致;而單個(gè)時(shí)期內(nèi)樣本量較小,不足以反映光譜隨LPC變化的實(shí)際規(guī)律;因此,本研究在分析和建模過程中使用了3個(gè)時(shí)期匯總的數(shù)據(jù)集。在針對(duì)特定時(shí)期的水稻LPC空間分布制圖中,由于樣本數(shù)據(jù)分布和數(shù)量的差異,模型對(duì)單個(gè)時(shí)期的LPC預(yù)測(cè)精度有所下降。
(1)LPC與無人機(jī)影像上水稻冠層光譜反射率在波段462~718 nm范圍呈極顯著負(fù)相關(guān)(P<0.001),在波段562~706 nm范圍內(nèi)相關(guān)系數(shù)絕對(duì)值均高于0.8,負(fù)相關(guān)最大處相關(guān)系數(shù)達(dá)到-0.902。二者在波段722~998 nm范圍未表現(xiàn)出顯著相關(guān)性。
(2)使用連續(xù)投影算法,以LPC為目標(biāo)對(duì)光譜波段進(jìn)行篩選,得到4個(gè)特征波長分別為670、706、722、846 nm。以特征波長為自變量構(gòu)建的4個(gè)LPC估算模型中,基于PLSR算法的模型精度和穩(wěn)定性最佳,驗(yàn)證R2達(dá)到0.925,RMSE為0.027%。
(3)LPC與NDSI(R498,R606)、RSI(R498,R606)、DSI(R498,R586) 3個(gè)新構(gòu)建的光譜指數(shù)相關(guān)性較高,相關(guān)系數(shù)分別為0.913、0.915和0.938?;谛陆ü庾V指數(shù)的ANN模型對(duì)LPC具有較好的預(yù)測(cè)能力,驗(yàn)證R2為0.885,RMSE為0.029%。
(4)基于全生育期LPC-PLSR模型和高光譜影像計(jì)算得到各生育期LPC的空間分布,其結(jié)果與實(shí)測(cè)值相一致,可以用于田間水稻葉片磷素狀況的監(jiān)測(cè)。