康曉鳳, 鄔定榮, 田 琪, 譚姣姣, 馬玉平, 于 強,4**
(1.西北農林科技大學資源環(huán)境學院 楊凌 712100; 2.中國氣象科學研究院 北京 100081; 3.中國科學院大學 北京100049; 4.西北農林大學水土保持研究所黃土高原土壤侵蝕與旱地農業(yè)國家重點實驗室 楊凌 712100)
IPCC第六次評估報告指出全球氣候變暖仍將持續(xù), 中國自1980年起變暖趨勢也很明顯。在變暖趨勢為主的氣候變化背景下, 準確預測未來作物的產量是制定氣候變化適應戰(zhàn)略的必要前提。而作物發(fā)育期預測是準確預測作物產量的基礎。在過去數十年里, 科學家們發(fā)展了多種不同類型的發(fā)育模式。利用觀測值校正后, 各模式普遍能獲得較好的模擬效果, 但由于機理的不同, 應用在變暖環(huán)境時, 不同模式的模擬能力可能會出現(xiàn)較大差異。而變暖環(huán)境下模擬發(fā)育期的差異對預測產量有較大影響, 因此評估變暖環(huán)境下發(fā)育模式表現(xiàn)的差異, 對于準確預測氣候變化環(huán)境下的作物產量具有重要意義。
現(xiàn)有發(fā)育模式大多基于積溫理論構建, 該理論假設作物完成發(fā)育階段所需要的積溫/光熱時是常數, 考慮的機理主要包括溫度響應、光周期、春化和水肥狀況影響等。模式間的差異主要體現(xiàn)在描述這些機理采用的具體方法。近年來, 發(fā)展了一些基于非常數積溫假設的模式。例如Wu等假設發(fā)育速率與溫度呈線性關系, 以發(fā)育階段始期日序為表征適應環(huán)境因子, 建立了耦合響應與適應機制的發(fā)育模式。該模式具有參數少、參數化過程簡單和精度高等特點。此外, 隨著信息技術的不斷發(fā)展, 有關機器學習算法用于模擬發(fā)育期的報道越來越多。研究發(fā)現(xiàn), 由于機器學習算法通過建立環(huán)境因素與作物發(fā)育及產量的深度關系, 在利用歷史數據對不同模式進行訓練時, 能較好地預測發(fā)育期和產量。已有研究表明機器學習算法應用在發(fā)育期模擬、作物發(fā)育生長及產量研究等方面時, 表現(xiàn)較為突出。
發(fā)育模式的重要應用場景之一是預測發(fā)育期對變暖環(huán)境的響應。但目前對變暖環(huán)境下不同類型發(fā)育模式的表現(xiàn)還缺乏綜合比較。雖有報道指出機器學習算法在校正階段表現(xiàn)突出, 但應用到變暖環(huán)境下時, 變暖環(huán)境的氣候條件很可能沒被包括在訓練集中, 這給機器學習算法的表現(xiàn)帶來一定的不確定性。而機理發(fā)育模式雖然有機理性較強的優(yōu)勢, 但參數化階段涉及的非線性過程普遍弱于機器學習模式, 因此哪種模式更適合變暖環(huán)境目前還不確定。
本研究以東北春玉米(Zea mays)和華北夏玉米為研究對象, 選擇3個代表性的機理發(fā)育模式和1個機器學習模式, 將觀測年份劃分為冷、暖年, 冷年的發(fā)育資料用于校正, 暖年資料用于驗證, 根據模式在冷暖年表現(xiàn)的差異評價模式在氣候變暖情景下的適用性, 以期為氣候變化下的發(fā)育期模式的選擇及模式改進提供科學依據。
以我國東北和華北為研究區(qū)域(圖1), 以春玉米和夏玉米為研究對象。東北屬于寒溫帶、中溫帶濕潤(半濕潤)氣候, 種植制度是一年一熟制。春玉米一般在4月下旬種植, 7月中下旬開花, 9月初成熟, 主要是雨養(yǎng), 個別年份可能會遭遇較嚴重的干旱。華北屬暖溫帶季風氣候, 種植制度是一年兩熟或兩年三熟制, 夏玉米生長期間雨熱同期, 通常不需要灌溉,一般在6月上中旬播種, 8月上旬開花, 9月底至10月成熟。
圖1 研究區(qū)域和農業(yè)氣象站點的分布Fig.1 Study area and location of agrometeorological observation sites
東北春玉米和華北夏玉米物候資料來自國家氣象信息中心。資料時段為各站建站起至2020年。從中選擇具有20年及以上發(fā)育期觀測的站點, 共包括36個春玉米站和25個夏玉米站(圖1), 站點平均觀測年數分別為29年和28年。收集每年出苗、開花和成熟等3個發(fā)育期的日期。根據常用的發(fā)育階段劃分方法, 將出苗—開花歸為營養(yǎng)生長階段(vegetative growth period, VGP), 開花—成熟歸為生殖生長階段(reproductive growth period, RGP)。
氣象數據來自國家氣象信息中心, 選取與農業(yè)氣象觀測站對應的國家級地面氣象觀測站的逐日氣象數據, 包括平均氣溫、最高氣溫、最低氣溫、日照時數和降水量等。數據時間與物候資料相同。缺失的氣象數據使用Python編程進行修訂。缺測序列小于5 d時缺測值采用線性插值法計算, 缺測序列大于或者等于5 d時采用同一日的多年平均值代替。假設某站1980年7月14—20日, 連續(xù)7日缺測平均氣溫數據, 而1981—2020年這7日均有觀測數據, 則用1981—2020年的同日平均值代替缺測的7日數據。各站資料的開始時間各異, 各日缺測年數也不盡相同, 計算多年平均值的年數因站點而異。本文采取的數據插補方法是氣象數據常規(guī)處理方法。此外,氣象數據的缺失量非常小, 總體上不會對研究結果產生較大影響。
1.4.1 發(fā)育模式簡介
選擇3個機理發(fā)育模式和1個機器學習模式進行比較。3個機理發(fā)育模式是前人研究表明具有較高精度的模式, 分別為MAIS (maize simulation)、Beta和RAM (response and adaption model)。機器學習算法選擇多層感知器 (multi-layer perceptron, MLP)。
在機理發(fā)育模式中, MAIS既不考慮光周期現(xiàn)象,也不考慮三基點溫度, 而是使用日平均氣溫的二次和三次函數計算積溫的逐日增量。Beta模式不僅考慮了光周期和三基點溫度, 還用非線性關系描述溫度和發(fā)育速率的關系。RAM模式由Wu等開發(fā), 該模式假設發(fā)育速率與溫度呈線性關系, 且線性傾向率與發(fā)育階段始期的日序線性相關。由于每年的發(fā)育階段始期和溫度都不盡相同, 因此RAM認為完成發(fā)育階段所需的積溫不是常數。
機器學習模式是一種基于統(tǒng)計關系建立的模式,在對輸入數據進行復雜訓練后, 可以進行準確預測。不同的訓練算法有不同的特點, 適用于不同的應用方向。由于預測發(fā)育期通常需要將作物發(fā)育依據時間序列展開, 因而常采用神經網絡算法。有研究表明神經網絡模式比基于氣候適宜度的發(fā)育模式具有更高的精度。因此, 本研究選擇多層感知器神經網絡作為代表性的機器學習模式。4個發(fā)育模式介紹如下:
參考已有的研究, 采用通用的框架介紹發(fā)育模式。玉米發(fā)育到某一階段的進展采用玉米發(fā)育指數(DVI)表示。將出苗的DVI定義為1, 開花定義為2, 成熟定義為3。
1) MAIS模式
MAIS模式中生長發(fā)育主要通過日平均溫度的二次和三次函數計算累積熱量單位的日增量(GTI)實現(xiàn)。公式如下:
式中: DVR為日發(fā)育速率, GTI, GTI分別是VGP和RGP的熱時(℃·d), T是日平均溫度(℃),T和T分別是日最高和最低氣溫(℃)。
2) Beta模式
Beta公式如下:
式中: T為日平均氣溫(℃), T為該發(fā)育階段下限溫度(℃), T為該發(fā)育階段適宜溫度(℃), T為該發(fā)育階段上限溫度(℃), K為基本發(fā)育系數, P為增溫促進系數, Q為高溫抑制系數, G為感光性系數, D為天文日長(h), D為發(fā)育階段臨界日長(h)。Beta模式中的T和MAIS中的T不完全相同。前者是氣象數據中的日平均氣溫, 后面是依據日最高和最低氣溫計算到的日平均溫度。Beta模式參數較多, 為便于參數化, 參照前人研究, 本研究將T、T和T分別取8 ℃、34 ℃和44 ℃, D取12.5 h。
3) RAM模式
RAM模式是一種耦合響應與適應機制的模式,計算公式如下:
式中: DVR為發(fā)育階段始期后的逐日發(fā)育速率, α、β和 γ是從出苗到開花階段的系數, α、 β和 γ是開花到成熟階段的系數, D OY和D OY分別是一年中的出苗和開花日期的日序。
4)多層感知器神經網絡模式
多層感知器神經網絡是一種監(jiān)督式學習算法,可對線性函數或者復雜的非線性函數進行學習, 通常由輸入層、隱藏層和輸出層3部分組成。算法基于一種多層前饋網絡結構, 模擬時先輸入學習樣本,樣本在MLP網絡中逐層前饋(從輸入層到隱藏層到輸出層), 逐層計算出結果。本研究使用反向傳播算法對網絡的權重和偏差進行反復調整訓練, 使輸出的向量與期望向量盡可能地接近。本文使用Python 3.7版本sklearn.neural_network包中的MLPRegressor函數, 神經網絡的激活函數使用整流線性單元(ReLU), 梯度下降采用Adam算法進行優(yōu)化。
選擇5個特征因素作為MLP神經網絡的輸入數據:日平均氣溫、日照時數、降水量、日長和高溫度日(heat degree days, HDD)。高溫度日依文獻 計算。東北春玉米和華北夏玉米在VGP和RGP階段的最高溫度均為35 ℃。由于同一站點同一生長階段的天數在不同年份存在差異, 本研究按照各年最大時間長度輸入逐日數據。VGP階段的最大時間長度為最早出苗期到最晚開花期, RGP階段為最早開花期到最晚成熟期, 以確保神經網絡能夠獲得相同長度的輸入序列的同時將玉米不同發(fā)育階段經歷的氣候條件盡可能包括在內。
1.4.2 模式參數化方法
根據氣候要素異常度(C)將發(fā)育期資料分為冷年數據和暖年數據, 冷年數據用于校正模式參數, 暖年數據用于驗證模式在氣候變暖背景下的模擬能力。參考中華人民共和國國家標準《農業(yè)氣候影響評價:農作物氣候年型劃分方法》(GB/T 21986—2008), 氣候要素異常度計算公式如下:
式中: Y 為逐年玉米生長季平均溫度(℃), Y為 研究時段內玉米生長季平均氣溫的多年平均值, s為標準差。
根據玉米生長季平均氣溫的異常度劃分等級,為了在校正和驗證時有盡可能多的數據, 同時使冷暖年記錄數盡可能一致, 參考文獻[32]的劃分標準,將C>0定義為暖年(正常年+高溫年), C<0定義為冷年(正常年+低溫年)。區(qū)分后, 春玉米冷暖年生長季平均溫度分別為18.91 ℃和19.95 ℃, 暖年生長季均溫較冷年高1.04 ℃; 夏玉米冷暖年生長季平均溫度分別為23.21 ℃和24.32 ℃, 暖年生長季均溫較冷年高1.11 ℃。為便于比較, 春玉米生長季統(tǒng)一定義為5月1日—9月30日, 夏玉米為6月10日—10月10日。
MAIS模式和Beta模式以均方根誤差(RMSE)最小化為原則, 在站點尺度用“窮舉法”對不同模式的參數進行全局尋優(yōu)。對于VGP階段, 從出苗期開始, 模擬開花期。對于RGP階段, 則從開花期開始,模擬成熟期。各參數的尋優(yōu)空間略大于公開報道的值, 以在確保得到最優(yōu)參數的同時減少計算量。RAM模式的參數可根據觀測值直接求出。除RAM模式外, 其他模式優(yōu)化的參數、取值范圍和步長如表1所示。MLP采用網格搜索算法進行超參數尋優(yōu),使用每組超參數訓練模式并挑選驗證集誤差最小的超參數組合。研究采用Python 3.7版本Grid SearchCV函數調整超參數, 包括隱含層的節(jié)點數、最大迭代次數、隨機種子, 通過五折交叉驗證獲得最佳超參數組合。
表1 發(fā)育模式參數/超參數取值范圍Table 1 Parameter / hyperparameter value range of phenological models
1.4.3 統(tǒng)計分析
采用歸一化均方根誤差(NRMSE)、平均偏差(MBE)和系統(tǒng)偏差等指標評價模式表現(xiàn)。NRMSE是均方根誤差與實際觀測數據平均值之比, 主要體現(xiàn)模擬值與觀測值的差異程度, 值越小模擬越好。MBE是模擬偏差的平均, 主要用于估計模式偏差的方向, 正偏差表示模擬值高于實測值, 負偏差表示低于實測值。發(fā)育模式經常用于預測未來氣候變化背景下發(fā)育期的變化, 模擬誤差的系統(tǒng)偏差可指示變暖環(huán)境下模擬的偏差程度, 因此本文還比較了模擬誤差隨發(fā)育階段平均溫度的趨勢, 以此作為模式的系統(tǒng)偏差。各指標的計算公式如下:
2.1.1 歸一化均方根誤差
在春玉米的VGP階段, NRMSE最小的模式是MLP (3.5%), 其次是RAM (4.5%)和Beta (4.8%), MAIS最大(5.3%) (圖2a)。在RGP階段, NRMSE最小的仍是MLP (4.6%), 其次是RAM (8.6%)和Beta (10.1%),最大的是MAIS (10.4%) (圖2b)。
夏玉米的結果與春玉米類似, VGP階段也是MLP最優(yōu)(4.5%), 其次是RAM (4.7%)和Beta (4.8%),NRMSE最大的模式是MAIS (5.7%) (圖2c)。RGP階段是MLP模式最優(yōu)(8.3%), 其次是RAM (8.9%)和Beta (9.1%) , 最大的是MAIS (9.8%) (圖2d)。
圖2 不同發(fā)育模式冷年模擬發(fā)育期的歸一化均方根誤差(a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段; c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段)Fig.2 Normalized root mean square error of simulated maize growth period of different phenological models in cold years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize;d: RGP of summer maize.
各模式在RGP階段的模擬誤差普遍高于VGP階段。平均而言, 模式在冷年調參后的模擬表現(xiàn)中,最優(yōu)的模 式 是MLP (5.2%), 其次是RAM (6.7%)、Beta (7.2%)和MAIS (7.8%)。
2.1.2 平均偏差
在春玉米VGP階段, 各模式均很好地模擬了開花期。Beta和MAIS模擬開花期與觀測值接近,MBE分別為0.0 d和0.1 d。RAM和MLP模擬開花期略晚于觀測值, MBE分別為0.4 d和0.7 d (圖3a)。各模式在RGP階段的表現(xiàn)普遍次于VGP階段。MAIS、Beta、RAM和MLP的MBE分別為—0.2 d、—0.9 d、0.4 d和0.6 d (圖3b)。
與春玉米類似, 各模式在夏玉米VGP階段也表現(xiàn)較好。Beta和MAIS模擬日期與觀測值接近,MBE分別為0.0 d和—0.1 d, RAM和MLP模擬開花期晚于觀測值, MBE分別為0.4 d和0.6 d (圖3c)。在RGP階段, Beta和MAIS模擬成熟期接近觀測值,MBE分別為0.0 d和—0.1 d, RAM和MLP模擬成熟期均晚于觀測值, MBE分別為0.3 d和0.7 d (圖3d)。
圖3 不同發(fā)育模式冷年模擬發(fā)育期的平均偏差(a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段; c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段)Fig.3 Mean bias error of simulated growth period of different phenological models in cold years.a: vegetative growth period (VGP)of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.
平均而言, MAIS和Beta模擬趨于提前, MBE分別為—0.1 d和—0.2 d, RAM和MLP模擬趨于推遲, 其值分別為0.4 d和0.7 d。
2.1.3 系統(tǒng)偏差
在春玉米VGP階段, Beta和RAM模式所有站點系統(tǒng)偏差均不顯著(圖4a), MAIS模式有顯著系統(tǒng)偏差的站點比例為11.1%, 系統(tǒng)偏差最大的是MLP模式(36.1%) (圖4a)。RGP階段則幾乎相反, MLP模式系統(tǒng)偏差最小(22.2%), 其次是Beta (25.0%)和RAM (33.3%), 系統(tǒng)偏差最大的是MAIS模式(58.3%)(圖4b)。
夏玉米VGP階段的結果與春玉米類似, Beta和RAM模式所有站點模擬誤差隨發(fā)育階段均溫的趨勢均不顯著(圖4c), 其次是MAIS模式, 有顯著趨勢的站點比例為8.0%, 系統(tǒng)偏差最大的為MLP模式,有顯著趨勢的站點比例為24.0% (圖4c)。夏玉米RGP階段, Beta模式的系統(tǒng)偏差最低, 有顯著趨勢的站點比例為4.0%, 其次是RAM模式(8.0%)和MAIS模式(20.0%); 系統(tǒng)偏差最大的是MLP模式, 有顯著趨勢的站點比例為44.0% (圖4d)。
圖4 不同發(fā)育模式在冷年模擬時的模擬誤差隨發(fā)育階段均溫的趨勢[a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段;c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段。實心點為站點趨勢顯著(P<0.05)]Fig.4 Trend of simulation error against growth period average temperature of different phenological models in cold years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize;d: RGP of summer maize.Solid point indicate the trends are statistically significant at P<0.05 level.
在冷年模擬時, 機理發(fā)育模式RGP階段的系統(tǒng)偏差高于VGP階段的系統(tǒng)偏差, 但MLP系統(tǒng)偏差表現(xiàn)較穩(wěn)定。平均而言, 系統(tǒng)偏差最小的模式是Beta(7.3%), 其次是RAM (10.3%)和MAIS (24.4%), 系統(tǒng)偏差最大的是MLP (31.6%)。
2.2.1 歸一化均方根誤差
和冷年的模擬結果不同, 在春玉米的VGP階段,表現(xiàn)最好的模式是MAIS (6.8%), 其次是Beta和RAM (均值均為7.4%), NRMSE最大的模式是MLP(8.9%) (圖5a)。在RGP階段, NRMSE最小的是MLP(10.0%), 其次是RAM (11.7%)和Beta (12.2%), NRMSE最大的是MAIS (14.8%) (圖5b)。
夏玉米的結果與春玉米相似, VGP階段是Beta最優(yōu)(7.1%), 其次是RAM (7.3%)和MAIS (7.5%),NRMSE最大的模式是MLP (10.7%) (圖5c)。RGP階段差異較大, Beta模式最優(yōu)(14.0%), 其次是MLP(14.1%)和MAIS (16.5%), 最大的是RAM (17.2%)(圖5d)。
圖5 不同發(fā)育模式暖年模擬發(fā)育期的歸一化均方根誤差(a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段; c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段)Fig.5 Normalized root mean square error of simulated growth period of different phenological models in warm years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d:RGP of summer maize.
在暖年的模擬精度明顯低于冷年, 不同發(fā)育階段的模擬結果也存在差異。4個發(fā)育模式RGP階段的模擬誤差普遍高于VGP階段。平均而言, 最優(yōu)的模式是Beta (10.2%), MLP雖然在RGP表現(xiàn)最好, 但受VGP階段表現(xiàn)的影響, 綜合表現(xiàn)(10.9%)次于Beta,RAM 綜合表現(xiàn)與 MLP 相同, MAIS 表現(xiàn)稍差, 為11.4%。
2.2.2 平均偏差
在春玉米VGP階段, MAIS和Beta模擬開花期均呈提前趨勢, 平均偏差值相同, 均為—1.7 d; RAM和MLP模擬開花期均呈延遲趨勢, 平均偏差分別為2.1 d和2.4 d (圖6a)。RGP階段各模式模擬成熟期較觀測值普遍提前: MAIS、Beta、RAM和MLP的平均偏差分別為—5.7 d、—4.0 d、—2.8 d和—1.7 d (圖6b)。MAIS模式平均偏差最大, MLP模式平均偏差最小。
在夏玉米VGP階段, MAIS和RAM模擬開花期與觀測值接近, 平均偏差值相近(圖6c), Beta和MLP的平均偏差分別為—0.1 d和2.6 d (圖6c)。RGP階段各模式模擬成熟期普遍較觀測值呈提前的趨勢:MLP的表現(xiàn)好于3個機理發(fā)育模式, MBE為—1.2 d;機理發(fā)育模式中, 表現(xiàn)最好的是Beta, 平均偏差值為—2.7 d, 其次是RAM模 式, 平均偏差值為—3.8 d,MAIS模式平均偏差最大, 平均偏差為—4.3 d (圖6d)。
圖6 不同發(fā)育模式暖年模擬發(fā)育期的平均偏差(a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段; c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段)Fig.6 Mean bias error of simulated growth period of different phenological models in warm years.a: vegetative growth period(VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.
平均而言, 機理發(fā)育模式模擬趨于提前, MAIS、Beta和RAM的平均偏差值分別為—2.9 d、—2.1 d和—1.1 d; MLP趨于延遲, 均值為0.5 d。
2.2.3 系統(tǒng)偏差
春玉米VGP階段, Beta模式有顯著系統(tǒng)偏差的站點比例最小(8.3%), 其次是MAIS模式(11.1%)和RAM模式(19.4%), MLP模式有顯著趨勢的站點比例達47.2%, 系統(tǒng)偏差較大(圖7a)。RGP階段表現(xiàn)與冷年模擬時表現(xiàn)一致, MLP模式有顯著趨勢的站點比例最低(11.1%), 其次是Beta (30.6%), RAM模式有顯著趨勢的站點比例為44.4%, 系統(tǒng)偏差最大的是MAIS模式(61.1%) (圖7b)。
在夏玉米VGP階段, MAIS和Beta模式系統(tǒng)偏差有顯著趨勢的站點比例均最低(20.0%), 其次是RAM模式, 有顯著趨勢的站點比例為32.0%, 系統(tǒng)偏差最大的為MLP模式(56.0%) (圖7c)。夏玉米RGP階段, 系統(tǒng)偏差最小的是MLP模式(12.0%), 其次是Beta模式(40.0%), MAIS模式有顯著趨勢的站點比例達60.0%, 系統(tǒng)偏差最大的是RAM模式(64.0%)(圖7d)。
圖7 不同發(fā)育模式暖年模擬時的模擬誤差隨發(fā)育階段均溫的趨勢。a: 春玉米營養(yǎng)生長階段; b: 春玉米生殖生長階段;c: 夏玉米營養(yǎng)生長階段; d: 夏玉米生殖生長階段。實心點為站點趨勢顯著(P<0.05)。Fig.7 Trend of simulation error against growth period average temperature of different phenological models in warm years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.Solid point indicate the trends are statistically significant at P<0.05 level.
在暖年模擬時, 機理發(fā)育模式RGP階段系統(tǒng)偏差高于VGP階段, MLP表現(xiàn)相反。平均而言, 系統(tǒng)偏差最小的是Beta模式(24.7%), 其次是MLP (31.6%),隨后是MAIS (38.1%)和 RAM (40.0%)。
本研究使用了站點20年以上的長期發(fā)育期觀測資料, 研究時段內玉米品種變化頻繁, 氣候明顯變暖,春玉米年均溫隨年份變化的平均傾向率為0.28 ℃?(10a), 夏玉米平均傾向率為0.43 ℃?(10a)。本文未區(qū)分品種, 直接用發(fā)育期數據驅動模式, 其中隱含的假設之一是品種變化對發(fā)育期影響較小。大量研究認為品種變化對發(fā)育期有明顯影響, 但研究結果多基于統(tǒng)計關系和復雜程度不一的發(fā)育模式模擬得到, 未經過同一品種連續(xù)種植多年的實際資料的驗證。此外, 統(tǒng)計關系和發(fā)育模式在捕捉變化環(huán)境下作物發(fā)育與環(huán)境因子關系方面還存在一定的問題。例如在分析三大主糧作物[小麥、玉米、水稻(Oryza sativa)]同一站點15年以上品種不變的實測發(fā)育期數據后發(fā)現(xiàn), 在發(fā)育期、發(fā)育階段日數、有效積溫的變化趨勢, 以及發(fā)育速率對溫度的敏感性等方面的結果與其他站品種變化時的結果無明顯差異, 表明品種變化對發(fā)育的影響可能遠小于基于統(tǒng)計關系和發(fā)育模式的結果。此外, 不少研究也認為品種變化對物候的影響并不如已有研究報道的大,進而不區(qū)分品種, 直接使用這些數據去訂正發(fā)育模式參數。在分析氣候變化對于物候的影響時, 有研究也傾向于不考慮作物品種特性的差異, 或者將差異主要歸因于生長條件氣候差異。綜上所述, 我們認為本研究中品種變化對發(fā)育期影響較小的假設, 對發(fā)育模式表現(xiàn)的影響應該在可接受范圍內。
本研究根據生長季平均溫度劃分為冷年和暖年,而在表示模式的系統(tǒng)偏差時使用了發(fā)育階段的平均溫度。其原因是生長季的長度遠大于VGP和RGP的實際經歷。與生長季平均溫度相比, 發(fā)育階段的平均溫度更能真實地反映VGP和RGP階段所經歷的真實氣溫。此外, 在生長季平均氣溫相同的情況下, 逐日氣溫在不同發(fā)育階段有不同的分布, 可能會導致VGP和RGP模擬誤差產生明顯差異。但氣候變暖導致發(fā)育期相應往前平移, 生長季因此處在比平移前相對更冷的環(huán)境中, 而生長季平均溫度尚不能反映這種變化。如何更準確地表示模式的系統(tǒng)誤差還需要進一步研究。
RAM和Beta在冷年和暖年的模擬中均有比較穩(wěn)定的良好表現(xiàn), 尤其是變暖背景下, 表明機理發(fā)育模式具有良好的外推能力。馬玉平等參考RAM構建了甘蔗(Saccharum officinarum)發(fā)育模式, 近40年實測數據表明該模式的適應性較好。本文研究結果認為冷年校正時RAM表現(xiàn)較好, 優(yōu)于Beta模式,但在變暖環(huán)境弱于Beta模式。也有文獻表明, 用大量數據同時訂正RAM和Beta模式時, RAM的表現(xiàn)好于Beta, 表明RAM中的耦合關系需要大量數據的訓練才能穩(wěn)定建立。
MLP模式將降水、日照等氣象因素及日長輸入模式, 同時還考慮生長發(fā)育過程中極端高溫事件對物候的影響, 加上MLP可獲得極其復雜的多元回歸關系, 因此MLP在冷年模擬時表現(xiàn)突出。但當生長季溫度升高時, 模式的模擬表現(xiàn)明顯降低, 原因為MLP模式本質上是根據輸入數據獲得的多元回歸關系, 而回歸關系天然存在外推困難的問題。但是, 與機理發(fā)育模式相比, MLP沒有考慮作物生長發(fā)育的生理機制, 這可能是MLP暖年模擬能力明顯弱于機理發(fā)育模式的原因之一。典型的機理之一是, 高于上限溫度時, 發(fā)育就會停止, 不經大量數據訓練,MLP可能難以捕捉到這一過程。因此, MLP輸入樣本量會直接影響模式優(yōu)化的結果。研究中單個站點數據較為有限, 可能導致MLP模式泛化能力不高。本研究結果表明MLP模擬有過擬合現(xiàn)象。有報道認為輸入差異顯著的氣象數據能顯著提高模式的表現(xiàn), 因此應盡可能多用數據訓練機器學習模式, 以包括多的環(huán)境變化條件, 提高MLP的泛化能力。值得關注的是, 發(fā)育模式的一個重要應用方向是預測未來變暖環(huán)境下的物候, 而未來變暖條件下的氣象數據, 很可能無法體現(xiàn)在訓練數據中, 這在一定程度上限制了機器學習模式在變暖環(huán)境中的應用。在RGP階段, MLP表現(xiàn)突出, 表明現(xiàn)有的機理發(fā)育模式對RGP階段機理的認識可能還存在不足。如研究發(fā)現(xiàn), 在RGP階段加入光周期的影響可顯著提高Beta模式模擬玉米成熟期的精度, 經改進后的Beta模式模擬效果提升明顯。RAM在暖年的RGP階段表現(xiàn)突出(圖5), 原因之一可能是RAM考慮的適應過程在形式上類似于光周期。此外, MLP在RGP的輸入特征也包括日長。因此, 在進一步的研究中, 應加強RGP階段這種類似于日長影響的研究。
本研究基于實測歷史發(fā)育期數據比較了3個不同的機理發(fā)育模式和1個機器學習算法在變暖環(huán)境下的適用性。冷年校正結果表明MLP模擬精度優(yōu)于3個機理發(fā)育模式, 機理發(fā)育模式中精度最高的是RAM, 其次是Beta和MAIS。MAIS和Beta模擬值普遍稍提前于觀測值, 其他2個模式則略晚于觀測值。3個機理發(fā)育模式的系統(tǒng)偏差均低于MLP,機理發(fā)育模式中, Beta系統(tǒng)偏差最小, 其次是RAM和MAIS。應用到變暖環(huán)境后, 各模式的模擬誤差均有所上升, 其中Beta精度最高, 其次是MLP和RAM,MAIS表現(xiàn)較差。機理發(fā)育模式模擬值較觀測值呈提前趨勢, 而MLP趨于推遲。除MLP以外的模式系統(tǒng)偏差較冷年時增大。4個模式中Beta偏差最小,其次是MLP, 隨后依次為MAIS和RAM。
機器學習通過輸入數據獲得復雜多元回歸關系對玉米物候進行模擬, 冷年校正時模擬表現(xiàn)優(yōu)于機理發(fā)育模式。但當生長季溫度升高時, MLP模擬表現(xiàn)明顯下降, 而機理發(fā)育模式中Beta和RAM模擬表現(xiàn)較為穩(wěn)定。
沒有一個模式在冷年校正和暖年驗證時均占優(yōu)勢, 因此應根據應用場景選用發(fā)育模式。關注準確反演歷史氣候變化對作物發(fā)育期的影響時, 建議采用MLP; 而更關注預測未來氣候變化對發(fā)育期影響時, 應以機理發(fā)育模式為主。