陳 幗 ,徐新剛 ,杜曉初 ,楊貴軍 ,趙曉慶 ,魏鵬飛 ,王玉龍 ,范玲玲
(1. 湖北大學資源與環(huán)境學院,武漢430062;2. 農(nóng)業(yè)部農(nóng)業(yè)遙感機理與定量遙感重點實驗室/北京農(nóng)業(yè)信息技術(shù)研究中心,北京100097;3. 國家農(nóng)業(yè)信息化工程技術(shù)研究中心,北京100097)
收獲指數(shù)(Harvest Index,HI)指收獲時作物籽粒產(chǎn)量和地上部生物量的比值,又名經(jīng)濟系數(shù),是選擇作物品種和品種改良研究中的重要參考因子[1]。收獲指數(shù)通??梢酝ㄟ^田間取樣獲得,但需要耗費較大的人力、物力,并具有一定滯后性。遙感技術(shù)擁有動態(tài)、快速和準確獲取地表作物參數(shù)信息的優(yōu)勢,隨著遙感監(jiān)測技術(shù)的快速發(fā)展,通過遙感手段獲取收獲指數(shù)將成為未來收獲指數(shù)評價的發(fā)展趨勢[2]。
當前,基于遙感技術(shù)的作物收獲指數(shù)遙感估算已開展了初步研究。杜鑫等[3]利用遙感技術(shù)監(jiān)測作物收獲指數(shù)的可行性分析研究,基于HI的形成過程總結(jié)歸納出3類利用遙感技術(shù)實現(xiàn)HI估測的方法,為如何利用遙感方式估算收獲指數(shù)提供了借鑒思路。Moriondo等[4]基于時間序列NDVI(歸一化植被指數(shù))遙感信息,利用小麥開花前后NDVI均值比作為指示特征,開展小麥的收獲指數(shù)遙感提取研究,但是該方法需要首先確定提取區(qū)域內(nèi)最大收獲指數(shù)和其可能會有的變動幅度,不同的取值一定程度會影響收獲指數(shù)估算結(jié)果?;贛oriondo等的研究,任建強等[5]做了方法改進,利用MODIS衛(wèi)星遙感影像獲取冬小麥生長期內(nèi)時間序列NDVI數(shù)據(jù),以小麥開花前的NDVI累計值與花后NDVI累計值的比值作為指示HI的遙感指數(shù),很好地估測了區(qū)域冬小麥的收獲指數(shù),反演結(jié)果與實測結(jié)果的R2達到了0.49。上述方法,盡管很好地實現(xiàn)區(qū)域尺度作物HI的遙感估測,但需要作物生長季內(nèi)逐日或者短周期間隔的時間序列衛(wèi)星遙感影像,數(shù)據(jù)處理工作量巨大。
另一方面,由于作物收獲指數(shù)反映了作物光合產(chǎn)物在籽粒和營養(yǎng)器官上的分配比例,它與作物不同生育期植株體內(nèi)光合產(chǎn)物的形成、運轉(zhuǎn)過程息息相關(guān),并受到諸多因素的影響,因此,作物不同生育期的生長對作物最終收獲指數(shù)的形成都具有或多或少的影響,如何來刻畫不同生育期對作物HI的影響貢獻,組合預測方法提供了一種可能途徑。文章通過獲取的冬小麥多生育期多時相地面冠層高光譜數(shù)據(jù),開展小區(qū)田塊尺度的作物收獲指數(shù)高光譜估測研究,通過引入最優(yōu)組合預測方法,將基于不同生育期光譜信息建立的不同冬小麥收獲指數(shù)光譜估測模型進行組合,通過優(yōu)化算法賦予最優(yōu)權(quán)重,從而構(gòu)建組合估測模型實現(xiàn)冬小麥收獲指數(shù)的高光譜估測,相關(guān)的研究并不多見。該文提出的作物收獲指數(shù)遙感光譜估測方法,嘗試利用權(quán)重最優(yōu)組合算法,以達到充分利用作物多個生育期有用信息進而改善收獲指數(shù)估算精度的目的,以期為基于多時相光譜信息的HI遙感估算提供新的方法參考。
實驗區(qū)位于北京郊區(qū)的順義區(qū)和通州區(qū),該區(qū)域?qū)儆谂瘻貛О霛駶櫞箨懶约撅L氣候。年平均溫度11.3℃,年平均降水量在620 mm左右。氣候宜人,地形平緩,適宜耕種。為展開研究,在順義區(qū)和通州區(qū)種植基地中隨機挑選出27個采樣點,采樣選取大田塊、生長具有代表性冬小麥地塊進行實驗獲取數(shù)據(jù)。
實驗于2009—2010年冬小麥生長季開展,分別選取冬小麥起身期、拔節(jié)期、孕穗期、開花期和灌漿期,對冬小麥冠層進行光譜測定。測定日期分別為:2010年4月1日、4月17日、4月29日、5月17日和6月2日。測量光譜儀選用ASD Field Spec FR2500,光譜范圍350~2 500 nm,采樣間隔為1 nm。盡量選擇在天氣晴朗時測定,測定時間為北京時間10: 00~14: 00。測定時,探頭始終垂直向下且保持與地面約為1 m的距離,探頭視場角為25°。在每個采樣點測量10次,取平均值為光譜測定的結(jié)果。在每個采樣點測定前、后立即進行標準白板矯正。在進行植被指數(shù)計算時,為排除干擾波段,僅僅選用敏感度較高的400~1 100 nm作為有效分析數(shù)據(jù)。
選取研究區(qū)內(nèi)共27個實測樣區(qū)。其中,通州區(qū)、順義區(qū)樣區(qū)數(shù)分別為15個和12個。樣區(qū)位置的選擇充分考慮了冬小麥生長狀況和區(qū)域分布的代表性,且樣區(qū)面積均不小于100 m×100 m。采用五點取樣法進行取樣,拷種稱量后,剪掉根部,只保留地上生物量部分進行晾曬,之后稱量5采樣點冬小麥干重記錄為M。隨后進行脫粒處理,稱取籽粒的重量記錄為M′,這樣每個采樣點的實測收獲指數(shù)HI即為兩者重量的比值。該實驗測得的結(jié)果HI,即為試驗區(qū)域內(nèi)冬小麥收獲指數(shù)的實際測量值。該值將被用于構(gòu)建單個生育期的預測模型以及驗證組合預測模型所計算結(jié)果的精度。計算公式為:
式(1)中,HI為收獲指數(shù),M′為小麥籽粒重量,M為小麥干重。
到目前為止,植被指數(shù)的種類已經(jīng)達到了100多種,并在各個領(lǐng)域得到了廣泛應(yīng)用。由于關(guān)于收獲指數(shù)的研究成果有限,能夠明顯反映收獲指數(shù)大小的植被指數(shù)還在探索中,但是收獲指數(shù)的大小與作物光合作用關(guān)系密切[6],在選擇植被指數(shù)構(gòu)建模型時,可以將對光合作用有關(guān)的因素列入考慮范圍,如葉面積大小、溫度、施氮水平、葉綠素含量等。
在挑選出的植被指數(shù)中,NDVI(歸一化差值植被指數(shù))、DVI(差值植被指數(shù))、RVI(比值植被指數(shù))、EVI(增強植被指數(shù))、OSAVI(優(yōu)化土壤調(diào)整植被指數(shù))等均屬于常用的植被指數(shù),而后學者們?yōu)榱斯罍y水稻大葉面積指數(shù),在NDVI的計算公式上進行了改良,提出了GBNDVI(綠藍波段歸一化植被指數(shù))、GRNDVI(紅綠波段歸一化植被指數(shù))、RBNDVI(紅藍波段歸一化植被指數(shù))、BNDVI(藍波段歸一化植被指數(shù)),這些改良的植被指數(shù)也被挑選為反演參數(shù)。常用于監(jiān)測葉綠素含量的植被指數(shù)有:NPCI(歸一化色素葉綠素植被指數(shù))、TCARI(轉(zhuǎn)化葉綠素吸收反射指數(shù))、MCARI 2#(改進葉綠素吸收比率指數(shù)II)、GVI(綠度植被指數(shù))等;植被含氮量估測常用的植被指數(shù)有:NDRE(歸一化紅邊指數(shù))、MTCI(MERIS陸地葉綠素指數(shù))、SIPI(結(jié)構(gòu)不敏感色素指數(shù))、PPR(植被色素比率)等;除此之外,該研究還引入了一些新型的植被指數(shù)作為對比參考,如DPI(雙峰值指數(shù))、REP-li(線性內(nèi)插法紅邊位置指數(shù))、PSRI(三波段比值指數(shù))、MSR(改進比值植被指數(shù))等。
綜合以上,共計44種植被指數(shù)被列為反演參數(shù)。計算時,分別選擇620~760 nm、492~577 nm、400~450 nm、700~1 100 nm的波段范圍內(nèi)平均反射率作為紅光(R)、綠光(G)、藍光(B)和近紅外(NIR)波段的反射率值。其詳細的計算公式和引用文獻如表1所示。
表1 采用的植被指數(shù)Table 1 Summary of vegetation indices studied
續(xù)表
將測定出的冬小麥5個生育期的冠層光譜數(shù)據(jù),代入表1所列公式進行計算。按照不同生育期,排列出27個取樣點對應(yīng)的44個植被指數(shù)值,并將每個生育期的44種植被指數(shù)與冬小麥實測收獲指數(shù)HI之間建模,進行相關(guān)性計算。選擇決定性系數(shù)(R2)和均方根誤差(RMSE)作為指標,將所計算的結(jié)果進行排序,挑選R2較大同時RMSE盡量較小的5個植被指數(shù)作為篩選結(jié)果。
偏最小二乘法(Partial Least-Square,PLS)是一種多元統(tǒng)計分析法,具有計算簡單、建模預測精度高、解釋性強等優(yōu)點。PLS通常用于解決對于多個因變量和多個自變量的回歸建模等問題,當解釋變量的個數(shù)遠超過樣本個數(shù)或者解釋變量內(nèi)部存在多重共線性時,PLS能運用成分提取的方法,解釋變量與因變量的相關(guān)性[34]。研究中篩選出的植被指數(shù)即為解釋變量,實測收獲是因變量,將二者利用PLS結(jié)合后,得到每個生育期的單個預測方程。與其他線性模型一樣,PLS的最終結(jié)果也是一個線性模型,其方程為:
式(2)中,Y是因變量,即實測收獲指數(shù);X1~Xn是用于構(gòu)建模型的植被指數(shù);A1~An是對應(yīng)植被指數(shù)的系數(shù);B是殘差參數(shù)。使用PLS得到A1~An和B的值,即可得到單個生育期的預測方程。
組合預測法是采用兩種或者兩種以上不同的預測方法,對同一對象進行預測,對各單獨的預測結(jié)果適當加權(quán)綜合后作為其最終結(jié)果[35]。這種方法能聚集各個預測方法的有用信息,使得組合模型的精度優(yōu)于其中任意一個單一模型的模擬精度,從而達到提高預測收獲指數(shù)精度的目的。研究采用組合預測法確定每個生育期對于最終收獲指數(shù)值的貢獻程度,即計算出每個生育期對應(yīng)的權(quán)重。確定權(quán)重的算法很多,該文采用最優(yōu)加權(quán)算法,評價最優(yōu)的標準為使組合預測偏差值之和最小。公式為:
式(3)中,ft代表第i種預測方法在t時刻的預測值,為第i種預測方法的權(quán)系數(shù),且滿足
根據(jù)最小二乘法,當殘差平方和達到最小,變權(quán)系數(shù)達到最佳。設(shè)et為t時刻組合預測的偏差,則計算最佳變權(quán)系數(shù)的方程組為:
式(4)中,k1~kN是需要求解的系數(shù),代表單個生育期的預測方程在組合預測中的權(quán)重。最后,用實測的數(shù)據(jù)和組合方程預測出的收獲指數(shù)值進行驗證。
將5個生育期內(nèi)的植被指數(shù)和實測植被指數(shù)進行相關(guān)性分析,計算出R2和RMSE,并進行排序,選取每個時期中R2盡可能大和RMSE盡可能小的5個最優(yōu)植被指數(shù),結(jié)果如表2所示。每一項植被指數(shù)與收獲指數(shù)的R2都非常低,均沒有超過0.3,拔節(jié)期內(nèi)所有植被指數(shù)與實測收獲指數(shù)的相關(guān)性幾乎趨近于0,且RMSE也出現(xiàn)了非常巨大的值??梢钥闯觯瑔蝹€生育期的單個植被指數(shù)與實測收獲指數(shù)的相關(guān)性太低,因此篩選5個最優(yōu)植被指數(shù)與收獲指數(shù)構(gòu)建模型。
表2 不同生育期最優(yōu)植被指數(shù)Table 2 Optimal vegetation indices in different stages
利用5個生育期中的最優(yōu)植被指數(shù)與PLS結(jié)合,建立冬小麥收獲指數(shù)的估算模型,可以得到經(jīng)過建模后,單生育期的預測模型。將模型中得到的預測值與實測的收獲指數(shù)進行相關(guān)性分析,按照生育期進行順序排列,結(jié)果如表3所示。相對于單個植被指數(shù)擬合,單生育期的多個植被指數(shù)擬合的結(jié)果在相關(guān)性方面有了明顯提高,能明顯看出單個生育期預測方程對于最終結(jié)果的影響大小。但是,只有灌漿期擬合結(jié)果的R2超過了0.4,其余4個時期與實測值的相關(guān)性都不明顯;5個RMSE相較于單個生育期擬合而言,結(jié)果有了明顯優(yōu)化,且結(jié)果相對穩(wěn)定,沒有太大起伏。說明在經(jīng)過PLS建模之后,單個生育期的擬合已達到最優(yōu)狀態(tài),但是精度并不足以支持預測方程成立,需要進一步提高。
表3 植被指數(shù)與PLS結(jié)合預測收獲指數(shù)的結(jié)果Table 3 Performance of the combination of vegetation indices and PLS for predicting harvest index
利用組合預測的方法,計算出了最優(yōu)變權(quán)系數(shù),將系數(shù)得到組合預測的方程為:
式(5)中每個單生育期預測方程前的系數(shù),代表單個生育期對最終結(jié)果的貢獻程度,即在組合預測方程中,單生育期預測方程的權(quán)重系數(shù)。這些系數(shù)根據(jù)前文中式(4)所列出的方程計算而出。
將各生育期的預測結(jié)果帶入組合預測方程中,得到最終的預測結(jié)果。建立實測地面冬小麥收獲指數(shù)與組合預測結(jié)果的關(guān)系為:
式(6)中,x為組合預測得到的參數(shù),y為預測出的收獲指數(shù),詳細結(jié)果由圖1所示。由圖可以看出,相較于單個生育期的預測結(jié)果而言,RMSE的變化不大,比單個預測模型中的最小值只降低了0.003,但是R2有了顯著提升,較單個預測模型的最大值提升了0.13。根據(jù)前文所述,組合預測法具有提取單個預測模型中有效信息的功能,單個預測模型的有效信息越多,代表單個模型的貢獻度越大,在組合預測中被賦予的權(quán)重就越大,反之則越小。由式(5)可以看出,開花期和灌漿期的單個預測模型在組合中權(quán)重最大,這與冬小麥栽培種植的特征基本吻合。由于前3個生育期的時間較短,作物光合產(chǎn)物的累積量不及后兩個生育期的累積量充足,而收獲指數(shù)的確定與光合作用累計的生物量密切相關(guān),所以時間間隔最長的開花期相較于其他生育期對于收獲指數(shù)的影響力最大,因此相關(guān)性最高,權(quán)重最大。因此,運用組合預測的算法,可以成功篩選出單個預測模型中的有效信息,利用最優(yōu)加權(quán)組合預測模型的精度比起單個模型預測的精度提升明顯。表明組合預測的方法能夠為利用遙感數(shù)據(jù)信息估算收獲指數(shù)提供有效的方法途徑。
圖1 組合預測值與冬小麥收獲指數(shù)關(guān)系Fig.1 Relationship between combination predicted value and winter wheat harvest index
單一生育期的植被指數(shù)與實測收獲指數(shù)相關(guān)性較低,在挑選出每個生育期中相關(guān)性最合適的5個植被指數(shù)后與PLS建模,相關(guān)性有所提高但依然很低,值最高的R2來自灌漿期為0.42,對應(yīng)的RMSE為各生育期預測值中最低為0.06,說明PLS的確具有能提升預測精度的能力,可是在該研究中,PLS與單一生育期建模并不能達到理想的預測標準。在利用組合預測法構(gòu)建方程以后,預測值與實測值的相關(guān)性有了明顯提高。研究結(jié)果表明,在多種不同的方法進行預測時,使用組合預測法可以有效起到提取有用信息的作用,從而可以提高對冬小麥收獲指數(shù)的估算精度。利用組合預測法得到的預測結(jié)果與實測結(jié)果的R2能達到0.55,對應(yīng)的RMSE為0.06。