黃健熙 趙劍橋 汪雪淼 解智琨 卓 文 黃 然
(1.中國農(nóng)業(yè)大學土地科學與技術學院, 北京 100083; 2.農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)災害遙感重點實驗室, 北京 100083;3.中國農(nóng)業(yè)大學信息與電氣工程學院, 北京 100083)
生育期對農(nóng)作物生長發(fā)育的動態(tài)監(jiān)測、田間精細管理具有重要意義。生育期的準確提取有利于對作物的時空年際變化作出合理分析,為有效監(jiān)測作物生長提供有力依據(jù),進而反映氣候變化對作物生長的影響[1-2],并有利于估產(chǎn)模型的改進[3-8]。冬小麥是中國主要的糧食作物之一,研究冬小麥生育期的提取方法,精確監(jiān)測冬小麥的關鍵生長階段,對其產(chǎn)量預測具有重要意義[9]。遙感技術具有時效高、范圍寬、成本低和時間序列連續(xù)等優(yōu)點,能反映地面植被季節(jié)性生長發(fā)育的過程及其年際變化等特點,可為監(jiān)測農(nóng)作物生育期提供新的技術手段[10]。
已有較多學者利用Savitzky-Golay濾波(S-G濾波)平滑時間序列遙感數(shù)據(jù),提取農(nóng)作物生育期[11-12]。但在上述研究中,平滑NDVI時間序列時直接用了S-G濾波,使NDVI的值總是處于周圍極大值和極小值之間。然而云霧和氣溶膠的影響導致NDVI值偏低,因此時間序列上突降的點都應該作為噪聲濾除,使用改進的S-G上包絡線濾波能獲得更高質量的時間序列[13]。
利用平滑模型函數(shù)擬合時間序列遙感數(shù)據(jù)及其產(chǎn)品,進而提取生育期,是近幾年發(fā)展較快的一種方法,平滑模型函數(shù)包括Logistic函數(shù)法、非對稱高斯函數(shù)法和諧波函數(shù)法[14]。SAKAMOTO等[15]利用MODIS/Terra數(shù)據(jù),使用小波變換、傅里葉變換兩種方法重構增強植被指數(shù)(Enhanced vegetation index,EVI)時序曲線。李錚等[16]以東北三省為研究區(qū)域,使用非對稱性高斯函數(shù)擬合法平滑MODIS、CYCLOPES和GLASS葉面積指數(shù)時間序列,利用動態(tài)閾值法提取水稻的主要生育期。JONSSON等[17]提出基于非線性最小二乘擬合的非對稱性高斯函數(shù)擬合AVHRR NDVI時序數(shù)據(jù)的方法,用于描繪地面植被的季節(jié)性生長和衰退曲線,并確定生育期參數(shù)。侯學會等[18]基于SPOT VGT NDVI數(shù)據(jù),用5種方法提取冬小麥返青期,分析遙感監(jiān)測結果與實測數(shù)據(jù)的均方根誤差,iNDVI-Logistic提取誤差為12.91 d,Logistic函數(shù)法提取誤差為13.04 d,閾值法提取誤差為17.48 d,導數(shù)法和DNA法提取誤差大于35 d。
目前,很多研究綜合使用上述兩種時間序列遙感數(shù)據(jù)的處理方法,獲得了較好效果[19-21]。但是前人成果主要集中于冬小麥一個或兩個顯著生育期(返青期和抽穗期)提取的研究,對于拔節(jié)期和開花期的研究很少,這是因為拔節(jié)期和開花期在LAI時間序列曲線上沒有明顯特征,因而,需要引入輔助數(shù)據(jù)。有效積溫是作物基點溫度之上日平均氣溫的積累[22],有效積溫與植物的生長速度和生育階段有直接聯(lián)系,是衡量作物生長發(fā)育過程熱量條件的重要指示因子[23]。CHU等[11]利用MODIS數(shù)據(jù)提取了冬小麥返青期和抽穗期,發(fā)現(xiàn)積溫每降低10℃·d,返青期延后4~5 d(R2=0.816,p<0.001),抽穗期延后1~2 d(R2=0.401,p<0.001)。說明冬小麥生育期與積溫具有顯著的相關關系。胡喬玲等[24]在Logistic曲線擬合NDVI并提取返青期的基礎上,結合積溫進行拔節(jié)期推算研究,監(jiān)測的冬小麥拔節(jié)期開始時間與觀測值平均誤差為4.3 d,最大誤差為8 d。
MODIS LAI數(shù)據(jù)具有覆蓋范圍廣、高時間分辨率的特征,在氣候變化監(jiān)測[25]、凈初級生產(chǎn)力評估[25]、作物生育期監(jiān)測[10]、作物產(chǎn)量預測[26-27]等方面有很廣泛的應用。本文綜合運用S-G上包絡線濾波、Logistic曲線擬合、有效積溫等,結合MODIS LAI數(shù)據(jù)和地面觀測數(shù)據(jù),提取并驗證大范圍冬小麥關鍵生育期,以實現(xiàn)大區(qū)域上冬小麥返青期、拔節(jié)期、抽穗期、開花期4個關鍵生育期的提取,并采用地面觀測生育期數(shù)據(jù)定量評價提取精度。
為了得到普適性的研究結果,選取河北、河南、山東三省為研究區(qū)域(圖1),進行冬小麥的生育期預測研究。該區(qū)域位于31°23′~42°40′N,110°21′~122°42′E,地處黃淮海平原,溫帶季風氣候,夏季降水集中,雨熱同期,冬春干旱少雨。年降水量500~900 mm,年均溫11~14℃。
圖1 研究區(qū)及農(nóng)氣站點Fig.1 Study area and agrometeorological stations
1.2.1遙感數(shù)據(jù)
遙感數(shù)據(jù)使用MODIS LAI標準產(chǎn)品中的MCD15A3H陸地4級數(shù)據(jù)產(chǎn)品,該產(chǎn)品的時間分辨率為4 d,空間分辨率為500 m(https:∥ladsweb.modaps.eosdis.nasa.gov/search/)。本文使用的MODIS LAI產(chǎn)品時間為2015年1—7月,軌道號為H26V4、H26V5、H27V4、H27V5。該數(shù)據(jù)已經(jīng)進行了幾何校正和輻射校正,本文根據(jù)研究區(qū)域對該數(shù)據(jù)進行了拼接、裁剪。
1.2.2氣象數(shù)據(jù)
氣象驅動數(shù)據(jù)來源為中國區(qū)域高時空分辨率地面氣象要素驅動數(shù)據(jù)[28-29](http:∥westdc.westgis.ac.cn/data/7a35329c-c53f-4267-aa07-e0037d913a21),其時間分辨率為3 h,水平空間分辨率0.1°。本文使用的時間范圍為2012—2015年,經(jīng)過數(shù)據(jù)預處理,將其轉換為366或365個波段的柵格文件,一個波段代表一天的日平均氣溫。
1.2.3觀測數(shù)據(jù)
地面觀測數(shù)據(jù)來自河北、河南、山東三省2012—2015年的農(nóng)氣站點觀測記錄,包含作物生育狀況觀測記錄和土壤水分觀測記錄。其中作物生育狀況觀測記錄包括臺站編號、作物品種、栽培方式、冬小麥各生育階段日期、生長狀況、生長高度、生長密度、產(chǎn)量、產(chǎn)量因素和產(chǎn)量構成,以及主要田間管理措施等,在農(nóng)氣站點上還有關鍵生育期葉面積指數(shù)和生物量等觀測值。本文使用了該系列數(shù)據(jù)中來自研究區(qū)域的64個農(nóng)氣站點的生育期數(shù)據(jù)。其中,2012—2014年的觀測數(shù)據(jù)用于計算返青-拔節(jié)、抽穗-開花2個階段冬小麥所需的平均積溫,2015年的觀測數(shù)據(jù)用于檢驗各生育期的提取精度。
由于本研究的空間跨度較大,返青期、拔節(jié)期、抽穗期、開花期幾個關鍵生育期在不同地面觀測站點呈現(xiàn)明顯的南北差異,時間差別較大。如表1所示,從南到北各生育期的日期大致呈現(xiàn)逐漸推遲的規(guī)律,該現(xiàn)象符合從南到北輻射和降雨的空間分布規(guī)律。
表1 2015年冬小麥生育期觀測數(shù)據(jù)Tab.1 Observed data of winter wheat growth stages in 2015 DOY
表1是對冬小麥生育期觀測數(shù)據(jù)的統(tǒng)計,單位為一年中的天數(shù)順序(Day of year, DOY)。4個關鍵生育期觀測數(shù)據(jù)最小值均出現(xiàn)在河南省,最大值均出現(xiàn)在河北省。河南省整體生育期靠前,山東省居中,河北省普遍較后。拔節(jié)期的南北差異較返青期明顯,河北省拔節(jié)期基本都在第100天之后,只有最南端的一個站點拔節(jié)期在第100天之前,為第87天;河南省主要在第90天之前,只有最北邊的兩個站點拔節(jié)期在第90天之后,分別為第94天和第104天;山東省拔節(jié)期分布在第85~100天,其中最南邊的站點對應第85天,最北邊的站點對應第100天。
抽穗期和開花期對溫度的響應更加敏感,因此這2個生育期的南北差異更明顯。河北省抽穗期主要在第120天之后,只有離河南省最近的站點在第120天之前,為第116天;河南省則均勻分布在第98~120天;山東省抽穗期分布在第112~126天。河北省開花期均勻分布在第120~131天,最北邊的站點對應第131天,最南邊對應第120天;河南省的開花期均勻分布在第104~126天;山東省分布在第119~131天,最北邊的站點對應第131天,最南邊對應第119天。
本研究利用MODIS數(shù)據(jù)重構LAI時間序列,根據(jù)時間序列的特征提取返青期和抽穗期。在此基礎上利用氣象數(shù)據(jù),計算積溫閾值并提取冬小麥的開花期、拔節(jié)期。通過LAI時間序列得到抽穗期日期后,從抽穗期開始計算有效積溫,有效積溫一旦達到近三年抽穗期到開花期有效積溫的平均值,則當天為開花期。同理,在返青期的基礎上得到拔節(jié)期。技術路線見圖2。
圖2 冬小麥生育期提取技術路線圖Fig.2 Flow chart of winter wheat growth stages extraction
2.2.1S-G上包絡線濾波
S-G濾波最早于1964年由SAVITZKY和GOLAY[30]提出。它可以理解為一種權重滑動平均濾波,其權重取決于在一個濾波窗口范圍內(nèi)做多項式最小二乘擬合的多項式次數(shù)[31]。S-G濾波過程為
(1)
其中
N=2m+1
i——時間索引
Ci——第i個LAI值的濾波系數(shù)
Yj+i——時間j處第i個LAI的原始值
m——窗口半徑
如果只使用S-G濾波,濾波后時間序列上每一點的值是窗口內(nèi)各點值的均值,不能將窗口內(nèi)的極大值包含在內(nèi),存在部分突降無法消除的問題。因此,使用了CHEN等[13]提出的S-G上包絡線濾波法來重構冬小麥LAI時間序列。該方法的處理步驟為:
(1)對原始LAI時間序列進行S-G濾波,分別存儲濾波后和濾波前的時間序列。
(2)對比步驟(1)中存儲的2個時間序列,得到新的時間序列,并將其作為原始序列。
(2)
式中O——原始的LAI值
L——濾波后的LAI值
T——迭代次數(shù)
采用S-G上包絡線濾波算法對遙感數(shù)據(jù)進行去噪處理。由于云污染和水汽等的影響,遙感圖像存在數(shù)據(jù)質量偏低甚至缺失的情況,因此濾波前的LAI時間序列曲線噪聲較多,存在尖銳拐點,不夠平滑,難以直接用于提取冬小麥的生育期;由圖3可以看出,濾波后得到了外包絡原始序列的平滑曲線,消除了原始數(shù)據(jù)的云污染和缺失數(shù)據(jù)造成的誤差,更準確地反映了冬小麥的生長變化規(guī)律,便于之后的Logistic曲線擬合。
圖3 2015年原始MODIS LAI時序曲線與S-G上包絡線濾波結果對比Fig.3 Comparison of MODIS LAI and S-G upper-envelope LAI in 2015
2.2.2Logistic曲線
Logistic模型是由比利時數(shù)學兼生物學家VERHULST于1838年首先提出的。其特點是一開始緩慢增長,而在以后的某一范圍內(nèi)迅速增長,到達一定限度后,增長再度緩慢下來[32],公式為
(3)
式中t——LAI時間序列中的時間
y(t)——t時間的LAI值
a、b、c、d——擬合參數(shù)
對擬合后的Logistic曲線方程求二階導數(shù),得到
(4)
原始MODIS LAI時序曲線、S-G上包絡線濾波結果、Logistic曲線擬合結果及曲線二階導數(shù)的對比見圖4。
圖4 2015年MODIS LAI、S-G上包絡線濾波LAI、Logistic擬合LAI、Logistic曲線二階導數(shù)對比Fig.4 Comparison of MODIS LAI, S-G upper-envelope LAI, fitting Logistic LAI and second derivative of fitting Logistic LAI in 2015
在研究區(qū)域內(nèi)提取2015年LAI時間序列曲線受冬小麥控制的像元,根據(jù)冬小麥生長期內(nèi)LAI時間序列的特征,給出提取較純像素的條件:由于冬小麥在抽穗期生長旺盛,LAI值較高,因此要求第31波段(121 DOY)的LAI值大于1。由于冬小麥LAI于抽穗期達到峰值后持續(xù)下降,且本研究的空間跨度較大,各區(qū)域抽穗期DOY差異大,因此要求在第22~36波段(85~141 DOY)內(nèi),LAI有一個極大值,且該極大值大于第36波段(141 DOY)的LAI值。以上2個限制條件,能濾除MODIS LAI時序曲線不符合冬小麥發(fā)育情況的像素。最后得到的研究區(qū)域內(nèi)2015年冬小麥分布如圖5所示。用地面采樣的方法驗證得到冬小麥種植區(qū)域提取總體精度為90.75%,Kappa系數(shù)為0.86。
圖5 2015年研究區(qū)冬小麥分布圖Fig.5 Winter wheat distribution map in study area in 2015
在研究區(qū)域內(nèi),具有有效地面觀測數(shù)據(jù)的農(nóng)氣站點共64個。但有些站點附近(3×3的柵格)混合像元問題嚴重,以農(nóng)氣站點周圍3×3柵格中至少有5個像元種植冬小麥為篩選條件,最后保留了35個站點,可用于冬小麥生育期提取后的驗證。
返青期是指早春麥田半數(shù)以上的麥苗心葉長度達到1~2 cm的時期。冬季麥苗停止生長,在該時期突然開始生長,LAI時間序列曲線表現(xiàn)為突然上升。抽穗是禾谷類作物發(fā)育完全的穗,隨著莖稈的伸長而伸出頂部葉的現(xiàn)象。全田50%植株抽穗為抽穗期,抽穗期處于冬小麥營養(yǎng)生長和生殖生長并進階段,且LAI在該時期前后達到最大值。
在冬小麥生育期內(nèi),其LAI變化曲線近似于拋物線。進入抽穗期時,冬小麥的長勢較好,葉片的生長狀況在整個生育期中屬于最好時期,冬小麥LAI在整個生育期中處于峰值[33]。因此,從濾波后的LAI時間序列中提取LAI最大值所對應的天數(shù)順序,即為當年冬小麥的抽穗期。
從返青期到抽穗期,冬小麥的LAI呈單調遞增,在抽穗期達到極大值后,從抽穗期到開花期,處于下降狀態(tài)。返青期到抽穗期這一增長過程,由Logisitc曲線較為準確地擬合出來。從擬合的曲線中提取出二階導數(shù)的最大值,最大值所對應的天數(shù)順序即為2015年冬小麥的返青期。
根據(jù)2012—2014年的氣溫格網(wǎng)數(shù)據(jù)以及農(nóng)氣站點記錄的返青期、拔節(jié)期,計算出返青期-拔節(jié)期的平均積溫。將此平均積溫作為閾值,結合2015年提取的返青期、氣溫格網(wǎng)數(shù)據(jù),提取2015年的拔節(jié)期。同理,根據(jù)2015年提取的抽穗期,基于3年平均積溫,提取2015年的開花期。
根據(jù)各農(nóng)氣站點的經(jīng)緯度,提取遙感影像中對應的像元,以該像元為中心,擴展至3×3像元區(qū)域,即1.5 km×1.5 km的區(qū)域。取該9個像元中的冬小麥區(qū)域生育期的平均值作為提取值,與對應的農(nóng)氣站點觀測的生育期對比。假設農(nóng)氣站點的觀測值為真值,分別采用最大誤差、最小誤差、平均誤差及均方根誤差(Root mean square error, RMSE)作為冬小麥生育期提取精度的評價指標。
MODIS LAI的時間分辨率為4 d,再考慮到混合像元等因素的影響,當生育期RMSE小于6 d時,認為該生育期提取精度較高。
獲得2015年研究區(qū)冬小麥生育期提取結果如圖6所示。提取結果具有顯著的空間變異性,與觀測數(shù)據(jù)的時空變異規(guī)律基本吻合。分析具有地面觀測數(shù)據(jù)的提取值與觀測值,可得:返青期提取值的范圍是29~91 DOY,觀測值的范圍是39~69 DOY。如圖7a所示,剔除2個異常樣本,返青期誤差在0~5 d內(nèi)的樣本數(shù)為17個(51.5%),誤差在6~10 d內(nèi)的樣本數(shù)為6個(18.2%),誤差超過10 d的樣本數(shù)為10個(30.3%)。
圖6 2015年冬小麥生育期提取結果Fig.6 Results of extracted winter wheat growth stages in 2015
LAI數(shù)據(jù)源的空間分辨率為500 m,因此混合像元是引起各生育期誤差的主要原因之一。由圖7a可看出,混合像元的效應造成提取的返青期日期偏后,即提取日期大于觀測日期。各生育期中,返青期的提取對混合像元非常敏感。由于夏季作物LAI快速增長的時期晚于冬小麥,LAI時序曲線二階導數(shù)最大的天數(shù)順序在像元內(nèi)夏季作物的影響下產(chǎn)生延遲。此外,MODIS LAI能夠較好地反映自然植被與林地的LAI,然而對于農(nóng)作物而言,往往低于其實測LAI[34]。MODIS LAI的這一特性,降低了對返青期的提取精度。
另一影響返青期提取的因素是Logistic曲線擬合的精度。返青期在LAI上體現(xiàn)的特征非常細微,本文采用求二階導數(shù)的方法提取返青期。因此,如果Logistic曲線不能準確刻畫LAI快速增長期變化趨勢的特性,就會導致提取的返青期產(chǎn)生一定誤差。
根據(jù)提取的2015年返青期,利用2012—2014年3年歷史積溫平均值作為積溫閾值,提取出當年拔節(jié)期。拔節(jié)期提取值的范圍是52~133 DOY,觀測值的范圍是69~108 DOY。如圖7b所示,剔除2個異常樣本,拔節(jié)期誤差在0~4 d內(nèi)的樣本數(shù)為20個(60.6%),誤差在5~8 d內(nèi)的樣本數(shù)為9個(27.3%),誤差超過8 d的樣本數(shù)為4個(12.1%)。
圖7 2015年生育期提取值與觀測值的對比Fig.7 Comparison of extracted and observed growth stages in 2015
與站點觀測值相比,返青期提取日期以延遲居多,導致開始計算積溫的日期也產(chǎn)生延遲。研究區(qū)域內(nèi)冬小麥返青期一般處于2月中下旬,在返青期實測日期—返青期推測日期這段時間內(nèi),各天的日平均氣溫多數(shù)都小于基點溫度0℃,即這段時間的有效積溫接近于0 ℃·d。因此,返青期提取值的延遲對積溫計算的影響較小,不會使拔節(jié)期的提取產(chǎn)生較大誤差。
抽穗期提取值的范圍是85~137 DOY,觀測值的范圍是98~127 DOY。如圖7c所示,抽穗期誤差在0~4 d內(nèi)的樣本數(shù)為20個(57.14%),誤差在5~8 d內(nèi)的樣本數(shù)為11個(31.43%),誤差超過8 d的樣本數(shù)為4個(11.43%)。
抽穗期提取受混合像元的影響較小?;旌舷裨獙Χ←溕谔崛〉挠绊懼饕獊碜杂诟鞣N不同生長周期的夏季作物,其中樹木的LAI遠高于冬小麥,使冬小麥LAI的峰值顯著升高;大棚、園藝作物、蔬菜作物等使冬小麥LAI峰值下降,曲線在達到峰值之后的下降趨勢不明顯。
但是混合像元僅對LAI的數(shù)值產(chǎn)生影響,對LAI峰值出現(xiàn)的時間影響較小,即峰值出現(xiàn)的時間主要由冬小麥決定。因此,抽穗期提取結果與地面觀測結果基本一致。
根據(jù)提取的2015年抽穗期,利用2012—2014年3年歷史積溫平均值作為積溫閾值,提取出當年開花期。開花期提取值的范圍是87~150 DOY,觀測值的范圍是104~134 DOY。如圖7d所示,開花期誤差在0~4 d內(nèi)的樣本數(shù)為21個(60.0%),誤差在5~8 d內(nèi)的樣本數(shù)為11個(31.4%),誤差超過8 d的樣本數(shù)為3個(8.6%)。經(jīng)過對比,開花期提取值與站點觀測值吻合情況良好。
此外,提取的生育期還受到以下因素的影響:原始數(shù)據(jù)存在誤差,提取的生育期需要精確到1 d,而MCD15A3H的時間分辨率為4 d。對空間尺度的差異而言,農(nóng)氣站點的觀測數(shù)據(jù)是點上數(shù)據(jù),而通過遙感數(shù)據(jù)提取的生育期是3×3柵格內(nèi)的平均值。農(nóng)氣站點人工觀測生育期數(shù)據(jù)存在誤差。
由圖7可知,提取的冬小麥生育期時間與觀測值之間的誤差有提前和延遲的現(xiàn)象,也存在基本一致的情況,其中多數(shù)返青期提取值存在延遲情況,其他生育期誤差正負分布較為均衡。表2為與農(nóng)氣站點觀測數(shù)據(jù)對比后,基于遙感與氣象數(shù)據(jù)提取的冬小麥生育期的精度評價。由表2可知,提取的返青期、拔節(jié)期、抽穗期、開花期與農(nóng)氣站點觀測數(shù)據(jù)比較,其平均誤差分別為7.4、4.5、4.4、3.8 d,均方根誤差分別為9.5、5.5、5.2、4.9 d。
表2 2015年冬小麥生育期提取精度評價Tab.2 Evaluation of extraction accuracy of winter wheat stages in 2015 d
與已有研究相比,本研究中返青期平均誤差與均方根誤差顯著小于WANG等[21]的研究結果,均方根誤差顯著小于侯學會等[18]用5種方法研究得出的均方根誤差;拔節(jié)期平均誤差與胡喬玲等[24]研究結論比較一致;而目前關于冬小麥開花期時間的研究尚無數(shù)據(jù)加以對比驗證。總體來看,本研究對冬小麥生育期的提取精度較高,達到了較以往的生育期提取方法更符合實際的提取結果。
(1)以河北、河南、山東三省為研究區(qū)域,MCD15A3H產(chǎn)品的空間分辨率為500 m、時間分辨率為4 d,通過S-G上包絡線濾波重構的LAI 時間序列,結合時序曲線特征和積溫方法,提取出較為準確的冬小麥關鍵生育期。
(2)S-G上包絡線濾波方法可以將濾波窗口內(nèi)的極大值包含在內(nèi),解決了直接使用S-G濾波時部分突降無法消除的問題,更準確地反映了冬小麥的生長變化情況。結果分析表明,各生育期開始時間由南到北逐漸推遲,空間變異性符合實際的輻射和降雨的空間分布規(guī)律。提取的生育期與農(nóng)氣站點觀測日期較為吻合,返青期的平均誤差在8 d之內(nèi),拔節(jié)期、抽穗期、開花期的平均誤差都在5 d之內(nèi)。這是由于求二階導數(shù)的方法對混合像元及Logistic函數(shù)擬合準確度敏感,返青期的提取結果出現(xiàn)延后現(xiàn)象,而拔節(jié)期、抽穗期、開花期的提取精度較高。
(3)由于冬小麥種植區(qū)提取存在誤差,研究中MODIS LAI時序曲線可能包含非作物信息,且積溫模型所使用的氣象插值產(chǎn)品精度有待驗證,對生育期提取精度有一定影響。其次,農(nóng)氣站點在研究區(qū)內(nèi)分布不均,疏密程度和代表性不同,可能影響結果驗證的準確性。此外,拔節(jié)期、開花期的積溫計算采用歷史年份積溫均值,其建模精度受年際間氣候和作物品種差異程度影響。