尹瀚民, 古麗·加帕爾,3, 于 濤, Jeanine UMUHOZA, 李 旭
(1.中國科學(xué)院新疆生態(tài)與地理研究所荒漠與綠洲國家重點(diǎn)實(shí)驗(yàn)室,新疆 烏魯木齊 830011;2.中國科學(xué)院大學(xué),北京 100049;3.中國科學(xué)院中亞生態(tài)與環(huán)境研究中心,新疆 烏魯木齊 830011)
哈薩克斯坦的面粉出口量位于世界第一,被稱作中亞糧倉,其北部地區(qū)的北哈薩克斯坦州、阿克莫拉州和庫斯塔納州是世界重要的小麥和面粉輸出地,小麥的種植結(jié)構(gòu)比例達(dá)到86%以上,2010 年以來,其小麥和大麥產(chǎn)量居世界第12 位,出口量居世界第5 位[1]。在中亞的其他國家,由于經(jīng)濟(jì)作物占比較大,種植結(jié)構(gòu)不合理且耕地面積有限,嚴(yán)重限制了各國的糧食生產(chǎn)能力,每年都需要向哈薩克斯坦進(jìn)口大量小麥,才能滿足國家糧食需求[1]。近年來,中亞各國的人口增長速度與糧食產(chǎn)量增產(chǎn)速度嚴(yán)重失衡,作為發(fā)展中國家,中亞各國經(jīng)濟(jì)發(fā)展水平本身較低,難以應(yīng)付國際糧價(jià)上漲和國家本身購買力低下帶來的一系列社會問題[2]。及時(shí)準(zhǔn)確估算哈薩克斯坦北部春小麥產(chǎn)量,可為當(dāng)?shù)卣块T春小麥生產(chǎn)管理提供重要的參考價(jià)值,對維護(hù)區(qū)域糧食安全亦起著不可忽視的作用。
作物估產(chǎn)的方法可以歸納為傳統(tǒng)作物估產(chǎn)和遙感作物估產(chǎn)兩大類[3]。傳統(tǒng)作物估產(chǎn),一般采取區(qū)域人工調(diào)查手段,結(jié)合農(nóng)學(xué)、氣象學(xué),采用統(tǒng)計(jì)學(xué)方法建立作物估產(chǎn)模式,該方法費(fèi)時(shí)、費(fèi)力且不利于動態(tài)時(shí)空監(jiān)測[3]?,F(xiàn)代遙感技術(shù)的發(fā)展,為區(qū)域糧食估產(chǎn)及動態(tài)監(jiān)測提供了有效的手段[4-7]。遙感作物估產(chǎn)方法主要包括經(jīng)驗(yàn)?zāi)P停?-10]、機(jī)器學(xué)習(xí)[11-12]和機(jī)理模型[13-14]三大類,其中,經(jīng)驗(yàn)?zāi)P头ㄊ抢眠b感衛(wèi)星對作物冠層反射的電磁波信息,計(jì)算表征植被特征的多個(gè)植被指數(shù),通過與作物的實(shí)際產(chǎn)量建立經(jīng)驗(yàn)?zāi)P?,尋找估算作物產(chǎn)量的最優(yōu)植被指數(shù),從而提高作物估產(chǎn)精度。例如Bolton等[15]利用MODIS產(chǎn)品計(jì)算2波段增強(qiáng)型植被指數(shù)(Enhanced vegetation index 2, EVI2)和歸一化水體指數(shù)(Normalized difference water index,NDWI),并利用該指數(shù)估算了美國中部玉米和大豆產(chǎn)量,發(fā)現(xiàn)在玉米返青后的65~75 d 和大豆返青后的80 d 左右,植被指數(shù)與作物產(chǎn)量相關(guān)性最高。Leroux等[16]以非洲薩赫勒地區(qū)為研究區(qū),利用MODIS 歸一化植被指數(shù)(Normalized difference vegetation index, NDVI)、地表溫度(Land surface temperature, LST)、作物模型SARRAH模擬的地表生物量和收獲指數(shù)建立經(jīng)驗(yàn)統(tǒng)計(jì)模型估算作物產(chǎn)量,結(jié)果發(fā)現(xiàn)組合后的指數(shù)在估算產(chǎn)量上優(yōu)于單獨(dú)基于NDVI 模型。郭銳[17]利用10 a 的MOD09A1和MOD16A2產(chǎn)品計(jì)算了增強(qiáng)型植被指數(shù)(Enhanced vegetation index,EVI)和作物水分脅迫指數(shù)(Crop water stress index, CWSI)估算了山東省和各市級尺度的冬小麥產(chǎn)量,其估算精度均不低于89.41%。此外,近些年來,機(jī)器學(xué)習(xí)模型在遙感作物估產(chǎn)方面得到廣泛應(yīng)用,其主要包括隨機(jī)森林、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等。安秦[18]在長春地區(qū)結(jié)合HJ-1A/B 和Landsat 8 2 種衛(wèi)星影像數(shù)據(jù)計(jì)算了4 種植被指數(shù),通過對比曲線統(tǒng)計(jì)、多元逐步回歸、偏最小二乘回歸和神經(jīng)網(wǎng)絡(luò)模型,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)建立的估產(chǎn)模型在穩(wěn)定性和精度性方面更高。曾妍等[19]利用MODIS產(chǎn)品計(jì)算了條件溫度植被指數(shù)(Vegetation temperature condition index, VTCI)和葉面積指數(shù)(Leaf area index,LAI),通過支持向量回歸模型估算了關(guān)中平原冬小麥產(chǎn)量,模型決定系數(shù)達(dá)0.88。機(jī)理模型作物估產(chǎn)是依據(jù)作物的生理生長特征,考慮作物的光合和呼吸作用,并考慮作物生長的環(huán)境,例如氣溫、降水、土壤肥力等因素,模擬作物的生長過程,同時(shí)將遙感數(shù)據(jù)與作物模型有效結(jié)合,從而實(shí)現(xiàn)對作物產(chǎn)量的預(yù)測,例如WOFOST、APSIM、DSSAT、CASA 模型等。例如黃健熙等[20]對比了LAI和蒸散(Evapotranspiration,ET)在同化前和同化后融合到SWAP 作物模型中進(jìn)行估算冬小麥產(chǎn)量,發(fā)現(xiàn)同化后的精度比同化前高出31%左右。同時(shí)馬鴻元等[21]還以WOFOST為動態(tài)模型,采用集合卡爾曼濾波同化算法,研發(fā)了一種遙感LAI 與作物模型同化的區(qū)域冬小麥產(chǎn)量系統(tǒng)。盡管機(jī)理模型雖然功能強(qiáng)大,但所需參數(shù)較多,模型計(jì)算量大,對計(jì)算機(jī)能力要求高,本地參數(shù)耗時(shí)耗力,并且依賴于站點(diǎn)數(shù)據(jù),因此在無站點(diǎn)數(shù)據(jù)區(qū)域難以推廣[18]。
哈薩克斯坦北部地區(qū)缺乏氣象觀測站點(diǎn)數(shù)據(jù)和詳細(xì)的土壤數(shù)據(jù),因此難以利用作物生長模型進(jìn)行春小麥產(chǎn)量估測。經(jīng)驗(yàn)?zāi)P蛻?yīng)用較為廣泛,其主要是通過建立單一植被指數(shù)或者多植被指數(shù)的組合與作物實(shí)際產(chǎn)量構(gòu)建線性或者非線性方程,比較其相關(guān)性,最終篩選出最佳的產(chǎn)量預(yù)測模型,但這種常規(guī)模型不一定能滿足估測小麥產(chǎn)量的精度要求。機(jī)器學(xué)習(xí)相比常規(guī)模型,有其獨(dú)特優(yōu)勢,例如善于處理高維變量和對變量間的線性和非線性關(guān)系有著極強(qiáng)的學(xué)習(xí)能力,以廣泛應(yīng)用于地理學(xué)的研究當(dāng)中[22]。盡管部分小麥估產(chǎn)的研究中涉及了機(jī)器學(xué)習(xí)模型,但往往僅是一種機(jī)器學(xué)習(xí)模型,很少研究將多種機(jī)器學(xué)習(xí)模型與常規(guī)方法進(jìn)行對比研究,且在哈薩克斯坦北部地區(qū)很少有關(guān)于春小麥產(chǎn)量的研究報(bào)道。本研究基于MODIS 遙感數(shù)據(jù)產(chǎn)品和作物產(chǎn)量統(tǒng)計(jì)數(shù)據(jù),采用經(jīng)驗(yàn)?zāi)P图皺C(jī)器學(xué)習(xí)法,利用線性回歸、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)模型,對比分析了10種植被指數(shù)估測春小麥產(chǎn)量的能力,評估春小麥最佳估產(chǎn)時(shí)間、最優(yōu)植被指數(shù)及估產(chǎn)模型,以期為當(dāng)?shù)卮盒←溕a(chǎn)提供管理依據(jù)。
哈薩克斯坦北部區(qū)域包括北哈薩克斯坦州、庫斯塔納州和阿克莫拉州(圖1),位置介于60°03′~74°16′E,48°09′~55°25′N[1]。該區(qū)域?yàn)闇貛Т箨懶詺夂?,夏季降水集中,冬季寒冷漫長[23]。冬季的平均氣溫在-15~-20 ℃,最低可達(dá)-30 ℃,夏季平均氣溫18~25 ℃,最高可達(dá)30 ℃。北哈薩克斯坦州年平均降水量為407 mm,庫斯塔納州年平均降水量為353 mm,阿克莫拉州年平均降水量為381 mm。伊希姆河和托博爾河流經(jīng)哈薩克斯坦北部。北哈薩克斯坦州有眾多湖泊,都為淡水湖。主要的植被類型為草地、耕地、建筑用地、森林、裸地和水體,分別約占總面積的36%、50%、1%、1%、10%和2%。該地區(qū)土壤以黑色土、棕色土為主,土壤肥沃、地勢平坦,是世界上重要的小麥出口輸出地,由于該地區(qū)農(nóng)田為雨養(yǎng)田,受降水影響大,導(dǎo)致產(chǎn)量極不穩(wěn)定[24-25]。
圖1 哈薩克斯坦北部地理位置及土地利用類型Fig.1 Location and types of land use in northern Kazakhstan
哈薩克斯坦北部耕作區(qū)矢量數(shù)據(jù)由中國科學(xué)院地球大數(shù)據(jù)科學(xué)工程(CASEarth)專項(xiàng)提供(http://data.casearth.cn/),數(shù)據(jù)生產(chǎn)者為中科院新疆生態(tài)與地理研究所遙感研究團(tuán)隊(duì),該數(shù)據(jù)集以Landsat遙感影像為數(shù)據(jù)源,采用面向?qū)ο蟮倪b感分類方法,應(yīng)用影像分割、決策樹分類、變化監(jiān)測等關(guān)鍵技術(shù)解譯獲得,數(shù)據(jù)精度達(dá)到93%以上[26]。計(jì)算植被指數(shù)所使用的遙感產(chǎn)品是2007—2016 年每年6—8 月每8 d的MOD09A1和MOD15A2H數(shù)據(jù)集,其分辨率為500 m。小麥估產(chǎn)采用2007—2016年的植被凈初級生產(chǎn)力MOD17A3HGF 產(chǎn)品進(jìn)行間接驗(yàn)證[27]。利用Google Earth Engine(GEE)平 臺,對MOD09A1、MOD15A2H 和MOD17A3HGF 產(chǎn)品進(jìn)行預(yù)處理,提取優(yōu)質(zhì)像元,以減少云污染對數(shù)據(jù)質(zhì)量的影響。
選用在作物估產(chǎn)和估算生物量方面應(yīng)用頻率較高的10 種植被指數(shù)進(jìn)行最優(yōu)植被指數(shù)分析。哈薩克斯坦北部春小麥的播種日期自5月初開始,8月底到9月初進(jìn)行春小麥?zhǔn)崭?。因此,利用GEE平臺,下載了春小麥關(guān)鍵生長期6 月2 日—8 月30 日每8 d 的MOD15A2H葉面積指數(shù)產(chǎn)品,并利用MOD09A1產(chǎn)品計(jì)算了在此日期內(nèi)每8 d的其余9種植被指數(shù),對哈薩克斯坦北部三州春小麥進(jìn)行動態(tài)監(jiān)測。9種植被指數(shù)計(jì)算公式如表1所示。
表1 植被指數(shù)公式Tab.1 Vegetation index formulas
通過利用哈薩克斯坦北部三州春小麥實(shí)際產(chǎn)量與哈薩克斯坦北部三州耕作區(qū)植被指數(shù)平均值進(jìn)行線性擬合,利用決定系數(shù)(R2)和均方根誤差(RMSE)作為選擇最優(yōu)植被指數(shù)和最佳預(yù)測時(shí)間的依據(jù)。
式中:xi、yi分別為冬小麥單產(chǎn)的預(yù)測值和實(shí)際值(kg·hm-2);N為年數(shù)。
基于最佳的植被指數(shù)和預(yù)測時(shí)間,分別使用回歸、隨機(jī)森林、支持向量機(jī)和雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型對哈薩克斯坦北部三州進(jìn)行春小麥產(chǎn)量估測[38]。由于本文所使用的樣本量較少,因此使用Bootstrap 抽樣方法,Bootstrap是一種有放回的均勻抽樣,它將數(shù)據(jù)集中的N個(gè)樣本數(shù)據(jù),有放回的隨機(jī)抽取N個(gè)樣本形成新的訓(xùn)練集,利用未抽到的樣本作為驗(yàn)證數(shù)據(jù)集[39]?;诒疚牡臉颖緮?shù)量,數(shù)據(jù)集循環(huán)抽樣50次進(jìn)行模型訓(xùn)練,優(yōu)化機(jī)器學(xué)習(xí)下的各重要參數(shù)。各州選出的最佳植被指數(shù)和預(yù)測時(shí)間作為模型輸入,模型輸出為春小麥產(chǎn)量。由于本文所使用的是單變量,所以在隨機(jī)森林模型中不對最佳變量個(gè)數(shù)進(jìn)行訓(xùn)練,而對回歸樹的個(gè)數(shù)進(jìn)行訓(xùn)練。支持向量機(jī)的核函數(shù)選擇線性函數(shù),主要對其代價(jià)函數(shù)進(jìn)行訓(xùn)練。雙向循環(huán)神經(jīng)網(wǎng)絡(luò)主要調(diào)整神經(jīng)元個(gè)數(shù),利用驗(yàn)證數(shù)據(jù)集的RMSE決定最佳的模型參數(shù),RMSE越小,模型估算的春小麥產(chǎn)量精度越高。
基于多波段的MOD09A1 和葉面積指數(shù)MOD 16A2 產(chǎn)品每8 d 的光譜信息,計(jì)算哈薩克斯坦北部三州耕作區(qū)植被指數(shù),利用一元線性回歸模型擬合作物產(chǎn)量,期望找出最優(yōu)植被指數(shù)和最佳估產(chǎn)日期。
圖2a和表2顯示,歸一化多波段干旱指數(shù)(Normalized multi-band drought index,NMDI)與春小麥產(chǎn)量在三州的擬合效果表現(xiàn)較差。2007—2016年6月2 日—8 月30 日,北哈薩克斯坦州各植被指數(shù)與春小麥產(chǎn)量R2表現(xiàn)為先升高后降低,最優(yōu)植被指數(shù)為7月12日左右的CIgreen,R2系數(shù)達(dá)到0.83,其P值小于0.001,RMSE為131.8 kg。其次是6月26日和7月12日的LAI,與春小麥產(chǎn)量R2都大于或等于0.80,P值都小于0.001,RMSE分別是143.0 kg和135.5 kg。在北哈薩克斯坦州,春小麥最早可以利用6月26日的LAI指數(shù)進(jìn)行春小麥估產(chǎn)。
圖2 哈薩克斯坦北部植被指數(shù)和春小麥單產(chǎn)決定系數(shù)Fig.2 Coefficient of determination between the vegetation index and the yield per unit of spring wheat in northern Kazakhstan
表2 哈薩克斯坦北部最優(yōu)植被指數(shù)及最佳估產(chǎn)日期Tab.2 Optimal vegetation index and best estimated date of spring wheat yield in northern Kazakhstan
圖2b和表2結(jié)果表明,除NMDI以外,6月26日以后其他植被指數(shù)與春小麥產(chǎn)量R2在阿克莫拉州開始迅速增加,8月21日之后R2系數(shù)普遍下降,總體來看,7 月4 日—8 月5 日植被指數(shù)與春小麥產(chǎn)量相關(guān)性較好,而6月18日以前各指數(shù)與春小麥產(chǎn)量相關(guān)性不佳。與春小麥單產(chǎn)擬合最好的植被指數(shù)是WDRVIgreen,最 佳 預(yù) 測 時(shí) 間 在8 月5 日 前 后,R2為0.80,P值小于0.001,RMSE 為137.5 kg。此外,在阿克莫拉州,春小麥估產(chǎn)最早可以在7月12日左右進(jìn)行,寬動態(tài)范圍植被指數(shù)(Wide dynamic range vegetation index, WDRVI)、LAI 和EVI2,R2都超過0.75,RMSE分別為147.6 kg、145.0 kg和143.9 kg。
從圖2c 和表2 表明,庫斯塔納州在6 月10 日以前和8月13日以后,各指數(shù)對春小麥產(chǎn)量擬合性較差,敏感性低。6 月26 日—7 月28 日為春小麥產(chǎn)量預(yù)測最佳時(shí)期,7 月12 日各指數(shù)對春小麥產(chǎn)量的敏感性達(dá)到最高,大部分指數(shù)P值小于0.001。其中,WDRVIgreen與春小麥產(chǎn)量在7月12日相關(guān)性較強(qiáng),R2為0.88,P值小于0.001,RMSE為123.6 kg。CIgreen、差值植被指數(shù)(Difference vegetation index,DVI)和優(yōu)化土壤校正植被指數(shù)(Optimized soil adjusted vegetation index,OSAVI)與春小麥產(chǎn)量R2在7月12日都大于或等于0.81,P值小于0.001,RMSE 分別為157.5 kg、158.2 kg和150.7 kg。在庫斯塔納州,春小麥最早可以在6月26日前后利用LAI指數(shù)進(jìn)行春小麥估產(chǎn)。
經(jīng)對比分析,北哈薩克斯坦州春小麥產(chǎn)量預(yù)測最佳日期為7 月12 日,最優(yōu)植被指數(shù)為CIgreen,阿克莫拉州春小麥產(chǎn)量預(yù)測最佳日期為8 月5 日,最優(yōu)植被指數(shù)為WDRVIgreen,庫斯塔納州春小麥產(chǎn)量預(yù)測最佳日期為7月12日,最優(yōu)植被指數(shù)為WDRVIgreen。
利用線性回歸、隨機(jī)森林、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)模型對哈薩克斯坦北部三州耕作區(qū)進(jìn)行春小麥產(chǎn)量估測,以期找出最佳的產(chǎn)量預(yù)測模型。圖3采用ArcGIS 自然間斷點(diǎn)進(jìn)行分類,結(jié)果表明,在北哈薩克斯坦州利用線性回歸、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)模型模擬出的產(chǎn)量在空間分布特征上相似性較高,隨機(jī)森林模型模擬的春小麥高產(chǎn)區(qū)分布較為離散,聚集性不強(qiáng),在西部和東南部低產(chǎn)區(qū)分布較多??傮w而言,4 種模型模擬的春小麥產(chǎn)量在東南部地區(qū)相對較低,中北部地區(qū)較高。在阿克莫拉州,支持向量機(jī)模型在南部模擬的產(chǎn)量分布上出現(xiàn)破碎化特征,并且支持向量機(jī)模型估算的產(chǎn)量區(qū)域差異較小。除支持向量機(jī)模型外,其他3 種模型模擬的春小麥產(chǎn)量在阿克莫拉州的北部相較于其他區(qū)域產(chǎn)量較高,東部和南部地區(qū)春小麥產(chǎn)量較低,回歸模型和隨機(jī)森林模型模擬的產(chǎn)量在空間分布上相似性較高。在庫斯塔納州,4 種模型估算的春小麥產(chǎn)量空間分布特征具有較高的相似性且產(chǎn)量表現(xiàn)為北部較高,南部較低。同樣支持向量機(jī)模型模擬的產(chǎn)值區(qū)域性差異較小。綜合上述分析,盡管模型之間有所差別,但模擬的春小麥產(chǎn)量在空間分布特征上具有一致性,通過對比發(fā)現(xiàn),隨機(jī)森林模型和支持向量機(jī)模型模擬的春小麥產(chǎn)量在三州有不同程度的缺陷,回歸模型和神經(jīng)網(wǎng)絡(luò)模型在估算哈薩克斯坦北部三州春小麥產(chǎn)量上有較好的表現(xiàn)。
圖3 2007—2016年哈薩克斯坦北部多年平均估算春小麥產(chǎn)量Fig.3 Estimated annual average production of spring wheat yield in northern Kazakhstan from 2007 to 2016
植被凈初級生產(chǎn)力NPP 通常乘以作物收獲指數(shù)來估算作物產(chǎn)量[27]。由于本研究春小麥產(chǎn)量統(tǒng)計(jì)數(shù)據(jù)有限,且主要用于模型輸入?yún)?shù),故為評價(jià)春小麥估產(chǎn)模型的優(yōu)劣,研究分析不同模型模擬春小麥產(chǎn)量與NPP(MOD17A3HGF)之間的相關(guān)性,期望找出最佳產(chǎn)量估測模型(圖4),并對各州NPP 與春小麥產(chǎn)量相關(guān)性統(tǒng)計(jì)結(jié)果進(jìn)行分級(圖5),具體分為微弱相關(guān)(0.0~0.3)、低度相關(guān)(0.3~0.5)、顯著相關(guān)(0.5~0.8)和高度相關(guān)(0.8~1.0)。
圖4 哈薩克斯坦北部估算春小麥產(chǎn)量空間驗(yàn)證Fig.4 Spatial validation of spring wheat yield estimation in northern Kazakhstan
圖5 NPP與春小麥產(chǎn)量相關(guān)性分級Fig.5 Classification of the correlation between NPP and spring wheat yield
研究表明,在北哈薩克斯坦州,回歸模型、支持向量機(jī)模型和神經(jīng)網(wǎng)絡(luò)模型相比隨機(jī)森林模型能夠更好的預(yù)測春小麥產(chǎn)量,其中表現(xiàn)最差的是隨機(jī)森林模型,低度相關(guān)性區(qū)域占北哈薩克斯坦州耕作區(qū)近68%,顯著相關(guān)區(qū)域占比僅8%。顯著相關(guān)區(qū)主要分布在北哈薩克斯坦州西部和東南部地區(qū),而表現(xiàn)為低度相關(guān)和微弱相關(guān)區(qū)域主要分布在北哈薩克斯坦州的北部。
除支持向量機(jī)模型外,其余3 種模型在阿克莫拉州都得到了很好的驗(yàn)證結(jié)果,尤其是回歸模型和神經(jīng)網(wǎng)絡(luò)模型,大部分地區(qū)NPP與估算的春小麥產(chǎn)量相關(guān)性都在0.5以上。表現(xiàn)最佳的是神經(jīng)網(wǎng)絡(luò)模型,估測的產(chǎn)量與NPP顯著相關(guān)和高度相關(guān)占比總和最高為94%,其次是回歸模型為92%,再次是隨機(jī)森林模型為77%。從空間分布來看,無論是高產(chǎn)區(qū)還是低產(chǎn)區(qū),回歸模型、神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)森林模型預(yù)測精度都較好,對于了解該地區(qū)高產(chǎn)和低產(chǎn)田的分布位置和產(chǎn)量,進(jìn)而合理安排該地區(qū)的農(nóng)業(yè)生產(chǎn)活動具有重要的參考價(jià)值。
在庫斯塔納州,回歸模型、支持向量機(jī)模型和神經(jīng)網(wǎng)絡(luò)模型模擬的精度較高,隨機(jī)森林模型模擬的結(jié)果不理想,其微弱相關(guān)占比為23%,主要分布在庫斯塔納州南部地區(qū),而其他模型在庫斯塔納州南部地區(qū)表現(xiàn)相對較好,大部分區(qū)域相關(guān)性都在0.50 以上。而在庫斯塔納州的北部地區(qū),4 種模型估測的春小麥產(chǎn)量與NPP相關(guān)性表現(xiàn)為低度相關(guān),而根據(jù)春小麥產(chǎn)量統(tǒng)計(jì)結(jié)果來看,北部區(qū)域?qū)嶋H為庫斯塔納州的高產(chǎn)區(qū),該種現(xiàn)象與北哈薩克斯坦州的北部估測產(chǎn)量驗(yàn)證精度較低具有一致性。
遙感作物估產(chǎn)主要是利用遙感影像建立表征作物因子與產(chǎn)量之間的模型體系,從而實(shí)現(xiàn)對作物產(chǎn)量預(yù)測,可使用單植被指數(shù)或者多植被指數(shù)組合,亦可與影響春小麥產(chǎn)量相關(guān)的氣溫、降水和土壤肥力等因子估算春小麥產(chǎn)量[40],但使用多因子估算春小麥產(chǎn)量不僅對樣本數(shù)據(jù)量有要求,同時(shí)也要考慮多因子之間的共線性問題,在樣本量較少的情況下,使用多因子組合不僅不會提高估產(chǎn)精度,而且會產(chǎn)生較大偏差。
通過利用機(jī)器學(xué)習(xí)模型和回歸模型估算春小麥產(chǎn)量發(fā)現(xiàn),各模型估算的春小麥高產(chǎn)區(qū)和低產(chǎn)區(qū)具有極大的相似性,4 種模型在北哈薩克斯坦州估測產(chǎn)量的能力普遍較差,尤其是在北哈薩克斯坦州的北部地區(qū),該地區(qū)是春小麥高產(chǎn)區(qū),同樣的現(xiàn)象也發(fā)生在庫斯塔納州的北部,經(jīng)過對降雨數(shù)據(jù)分析以及地面調(diào)查結(jié)果發(fā)現(xiàn),該地區(qū)雨量較大,對MODIS 產(chǎn)品數(shù)據(jù)質(zhì)量造成了影響,也有可能是由于驗(yàn)證數(shù)據(jù)MOD17A3HGF 產(chǎn)品在該區(qū)域出現(xiàn)誤差,還有一個(gè)重要原因是由于北哈薩克斯坦州小麥的種植結(jié)構(gòu)比例約在86%,而庫斯塔納州和阿克莫拉州小麥種植比例在93%以上,在北哈薩克斯坦州有大面積的大麥、蕎麥和土豆種植,不能完全視為春小麥種植區(qū),從而影響估產(chǎn)模型的精度。
從模型角度來分析,回歸隨機(jī)森林模型無法實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)集范圍外的預(yù)測,且由于本文數(shù)據(jù)樣本量較小,在進(jìn)行隨機(jī)采樣構(gòu)建回歸樹時(shí),會出現(xiàn)大量相似的回歸樹,并且高產(chǎn)和低產(chǎn)的樣本有時(shí)不會被隨機(jī)抽到,所以在估測產(chǎn)量時(shí)低產(chǎn)或高產(chǎn)的區(qū)域相比其他模型偏大或者偏小。支持向量機(jī)模型在尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小的方式來矯正模型[41],并且最終決策函數(shù)只由少數(shù)的支持向量所決定,所以有可能將幾個(gè)中度產(chǎn)值的樣本數(shù)據(jù)建立超平面估算作物產(chǎn)量,導(dǎo)致估算的作物產(chǎn)量空間差異性較小。本文發(fā)現(xiàn),在樣本點(diǎn)較少的情況下,雙向循環(huán)神經(jīng)網(wǎng)絡(luò)和回歸模型更加可靠,回歸模型不僅可以節(jié)省大量機(jī)器學(xué)習(xí)進(jìn)行模型參數(shù)優(yōu)化的時(shí)間,并且在模型的強(qiáng)健性上不輸于機(jī)器學(xué)習(xí)模型,但回歸模型的可移植性不高,從模型驗(yàn)證的整體情況來看,機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)模型估算精度略優(yōu)于其他3 種模型。由于缺乏地面實(shí)測產(chǎn)量對其進(jìn)行驗(yàn)證,NPP 作為表征地上生物量的重要指標(biāo),盡管MOD17A3HGF產(chǎn)品在某些區(qū)域存在精度限制,但在地面實(shí)測數(shù)據(jù)缺乏的條件下,可以作為驗(yàn)證春小麥產(chǎn)量的重要數(shù)據(jù)源。
(1)除NMDI指數(shù)外,植被指數(shù)與春小麥單產(chǎn)相關(guān)性較強(qiáng)的時(shí)間段主要集中在6 月26 日—8 月5 日之間,主要是因?yàn)樵撾A段哈薩克斯坦北部春小麥進(jìn)入抽穗揚(yáng)花到逐漸成熟時(shí)期,是春小麥產(chǎn)量形成的關(guān)鍵時(shí)期。春小麥估產(chǎn)最優(yōu)植被指數(shù)分別是北哈薩克斯坦州7 月12 日CIgreen,阿克莫拉州為8 月5 日的WDRVIgreen,庫斯塔納州為7月12日的WDRVIgreen。
(2)從4種模型模擬的春小麥產(chǎn)量空間分布可知,模型模擬的產(chǎn)量雖有差距,但高產(chǎn)和低產(chǎn)的分布范圍具有一致性,支持向量機(jī)模型在模擬產(chǎn)量時(shí)有可能造成產(chǎn)量區(qū)域差距較小,而隨機(jī)森林模型容易出現(xiàn)高產(chǎn)區(qū)或者低產(chǎn)區(qū)偏大或者偏小的特點(diǎn),回歸模型和神經(jīng)網(wǎng)絡(luò)模型穩(wěn)定性更高。
(3)NPP與不同模型估測的春小麥產(chǎn)量進(jìn)行相關(guān)性分析,結(jié)果表明,在阿克莫拉州和庫斯塔納州,最佳春小麥估產(chǎn)模型為神經(jīng)網(wǎng)絡(luò)模型,其次為回歸模型,支持向量機(jī)模型和隨機(jī)森林模型精度較低。而在北哈薩克斯坦州,4 種模型的預(yù)測精度與其他二州相比相對較差,相對而言,雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)最佳。