蘇暢 戶雪敏 胡洋山 馬麗杰 商文靜 馮小軍 胡小平
摘要 為提高陜西省小麥條銹病發(fā)生面積的預測準確度,以2010年-2018年陜西省小麥條銹菌冬繁區(qū)和越冬區(qū)的發(fā)生縣區(qū)數、發(fā)生面積、溫度和降雨量為數據集,通過Pearson相關性分析篩選病害流行的主要影響因子,利用全子集回歸篩選病害流行的因子集。以篩選得到的影響病害流行的5個因子,即累計發(fā)生縣區(qū)數、冬繁區(qū)條銹病發(fā)生面積、1月平均溫度、1月平均降雨量和3月平均降雨量為自變量,采用全子集回歸和BP神經網絡算法開展小麥條銹病發(fā)生面積的預測研究。結果表明,全子集回歸和BP神經網絡算法對2019年-2020年的小麥條銹病發(fā)生面積預測準確度均達90%以上,預測2021年陜西省小麥條銹病發(fā)生面積分別為46.11萬hm2和52.85萬hm2。
關鍵詞 小麥條銹病;發(fā)生面積;全子集回歸;BP神經網絡算法
中圖分類號: S435.121;S431
文獻標識碼: A
DOI: 10.16688/j.zwbh.2021218
Abstract In order to improve the prediction accuracy of the occurrence area of wheat stripe rust in Shaanxi province, the number of counties, the occurrence area, temperature, and rainfall in the winter propagation and overwintering regions of wheat stripe rust from 2010 to 2018 were used as the data set to construct prediction model. Relevant factors were screened through Pearson correlation analysis, and factor sets were screened by full subsets regression. Taking the five screened factors, including the total number of counties with stripe rust, the occurrence area of stripe rust in winter propagation, the monthly mean temperature and mean rainfall in January, and the mean rainfall in March as independent variables, the predicted occurrence area of wheat stripe rust was carried out using full subsets regression and BP neural network. The results showed that the prediction accuracy of full subsets regression and BP neural network on the wheat stripe rust occurrence area in 2019-2020 were both over 90%, and the predicted occurrence area of wheat stripe rust in Shaanxi province in 2021 were 461 100 and 528 500 hm2, respectively.
Key words wheat stripe rust;occurrence area;full subsets regression;BP neural network
由條形柄銹菌Puccinia striiformis f.sp. tritici引起的小麥條銹病是世界上重要的流行性真菌病害[1-4],屬于我國一類農作物病害[5],嚴重影響小麥的產量和品質[6]。我國是世界上條銹病流行面積最大的國家[7-8],1950年、1964年、1990年、2002年和2017年我國先后發(fā)生5次小麥條銹病大流行,發(fā)病面積333萬~667萬hm2,共造成小麥減產138億kg[9-13]。
陜西省陜南地區(qū)漢中、安康和商洛以及關中地區(qū)寶雞、咸陽、西安和渭南等均為小麥條銹病的常發(fā)流行區(qū),其中陜南地區(qū)是小麥條銹病菌冬繁區(qū)[13],關中是小麥條銹菌越冬區(qū)[14-16]。建立準確率高的小麥條銹病預測模型對保障陜西小麥的豐產穩(wěn)產至關重要。胡小平等[17-18]基于春季菌量、秋季菌量、感病品種面積比例、4月降雨量和4月平均溫度建立了漢中地區(qū)影響小麥條銹病流行程度的回歸模型,預測準確度為75%。張吉昌等[19]利用小麥感病品種種植比例、秋苗病田率、秋苗單位面積平均病葉數等影響因子建立了漢中小麥條銹病發(fā)病程度預測模型,預測擬合符合率為92.31%。但迄今為止尚未見到基于越冬及冬繁菌源量為因子的預測模型。
全子集回歸分析是通過篩選可能的變量組合,依據校正R2(Adj.R2)為評價指標進而選擇合適的因子作為預測模型的自變量[20]。BP神經網絡算法(back propagation neural network)是通過整個神經網絡算法中的迭代誤差進而調整權重,使神經網絡算法輸出與目標輸出之間的誤差最小化。BP神經網絡算法由輸入層、隱藏層、輸出層構成[21]。前人研究表明,三層神經網絡算法能夠以任意精度逼近給定的非線性連續(xù)函數,可以識別復雜的區(qū)域[22]。
本研究采用全子集回歸和BP神經網絡算法以陜西省冬繁區(qū)條銹病發(fā)生面積、累計發(fā)生縣區(qū)數、1月月平均氣溫、1月和3月月平均降雨量為自變量,對陜西省小麥條銹病發(fā)生面積進行預測,以期為小麥條銹病準確預測和及時防控提供技術支撐。B6F7B9F2-67DC-406B-B422-45868C92D1B5
1 材料與方法
1.1 數據收集
本研究收集整理了陜西省2010年-2020年調查的小麥條銹病冬繁區(qū)發(fā)生縣區(qū)數(x1)、越冬區(qū)發(fā)生縣區(qū)數(x2)、累計發(fā)生縣區(qū)數(x3)、冬繁區(qū)發(fā)生面積(x4)、越冬區(qū)發(fā)生面積(x5)和累計發(fā)生面積(x6)(表1),以及2009年-2020年11月至翌年4月的月平均氣溫(x7~x12)和月平均降雨量(x13~x18),數據來自中國氣象數據網(http:∥data.cma.cn/)(表2)。
1.2 預測模型的建立和驗證
采用全子集回歸和BP神經網絡算法建立陜西省小麥條銹病發(fā)生面積的預測模型。全子集回歸采用RStudio version 4.0.5軟件中l(wèi)eaps包運算,BP神經網絡算法運用Python編程語言第三方數據庫Numpy、Pandas、Matplotlib和Scikit-learn,選用輸入層、隱藏層和輸出層三層BP神經網絡,激活函數選用Sigmoid函數,即:
采用Pearson相關法對2010年-2018年歷史數據進行主導因素分析,利用決定系數R2、赤池信息量準則(akaike information criterion,AIC)和均方根誤差(root mean squared error,RMSE)作為全子集回歸分析的評價指標[23]。決定系數R2越高,預測模型擬合程度越好。AIC以熵概念為基礎,考慮了模型的統(tǒng)計擬合度和擬合的變量數目,AIC值越小,表明該模型能夠以最少參數預測因變量,有助于降低過擬合現象[24]。RMSE通過實際值與預測值的偏差來判斷預測模型的準確性,計算公式為:
其中,n為樣本數,yi為實際值,y′i為預測值。
采用構建預測模型因子集所對應y′i計算預測區(qū)間。預測區(qū)間上限為L1=y′i-1.96S,預測區(qū)間下限為L2=y′i+1.96S。其中,S為殘差標準差[25]。利用2010年-2018年調查數據對預測模型進行回測檢驗,并采用肖悅巖最大誤差參照法[26]計算擬合符合率。利用2019年-2020年歷史數據對預測模型進行驗證,計算預測準確度。
2 結果與分析
2.1 主要流行因子分析
篩選與小麥條銹病發(fā)生面積呈正相關且自變量間無顯著相關性的因子。將2010年-2018年調查數據與當年條銹病最終發(fā)生面積進行Pearson相關性分析。結果表明,冬繁區(qū)發(fā)生縣區(qū)數(x1)、累計發(fā)生縣區(qū)數(x3)、冬繁區(qū)發(fā)生面積(x4)、12月月平均溫度(x8)、1月月平均溫度(x9)、2月月平均溫度(x10)、1月月平均降雨量(x15)、3月月平均降雨量(x17)和4月月平均降雨量(x18)與條銹病發(fā)生面積(y)呈正相關。其中,冬繁區(qū)發(fā)生縣區(qū)數(x1)和3月月平均降雨量(x17)與條銹病發(fā)生面積(y)呈顯著正相關(P < 0.05)(表3),與3月月平均降雨量(x17)相關性最高,為0.889 3。計算自變量之間的相關系數,結果表明,累計發(fā)生縣區(qū)數(x3)與冬繁區(qū)發(fā)生縣區(qū)數(x1)、越冬區(qū)發(fā)生縣區(qū)數(x2)和12月月平均溫度(x8)均有較強的相關性(P < 0.05)(圖1)。
2.2 預測模型的建立與驗證
2.2.1 全子集回歸分析
基于2009年-2018年調查數據,最終選用累計發(fā)生縣區(qū)數(x3)、冬繁區(qū)發(fā)生面積(x4)、1月月平均溫度(x9)、2月月平均溫度(x10)、1月月平均降雨量(x15)和3月月平均降雨量(x17)作為自變量構建預測模型。當預測模型分別選用因子集1(x3、x9、x15、x17)和因子集2(x3、x4、x9、x15、x17)時,校正R2值均大于90%(圖2)。構建的2個預測模型分別為y1=0.94x3+4.11x9+1.13x15+0.61x17-8.23和y2=0.74x3+19.94x4+3.84x9+1.06x15+0.65x17-8.43。2個模型R2均大于0.96,模型1的AIC值最小,模型2的RMSE最低(表4)。
利用2010年-2018年歷史數據對2個預測模型進行回測,并計算預測擬合符合率(圖3)。模型1和模型2預測擬合符合率分別為94.20%和93.99%。利用2019年-2020年的調查數據對預測模型進行檢驗,模型1和模型2的預測準確度分別為90.35%和93.46%。模型1預測2019年和2020年陜西省小麥條銹病發(fā)生面積與實際發(fā)生面積的偏差分別為0.00萬hm2和0.45萬hm2;模型2兩年預測的偏差均為0(表5)。因此,選擇RMSE最低、預測準確度較高的模型2作為陜西省小麥條銹病發(fā)生面積的預測模型。
2.2.2 BP神經網絡算法預測
基于全子集回歸模型2中的自變量因子即累計發(fā)生縣區(qū)數(x3)、冬繁區(qū)發(fā)生面積(x4)、1月月平均溫度(x9)、1月月平均降雨量(x15)和3月月平均降雨量(x17)作為神經網絡算法的輸入層,隱藏層數設為9,當年條銹病最終發(fā)生面積作為輸出層。以2010年-2018年的調查數據作為訓練集,以2019年-2020年的調查數據作為測試集,計算預測模型的準確度。在訓練之前利用Scikit-learn庫中StandardScaler對數據進行標準化處理,通過不斷調整神經網絡算法參數,設置參數學習率為0.01,選用Sigmoid函數作為神經元激活函數,采用梯度下降法,使網格訓練后預測值和實際值之間的均方誤差最小,以均方誤差(mean squared error,MSE)作為損失函數,設置迭代次數700。通過訓練,達到最大迭代次數或訓練目標之后停止學習。通過不斷訓練選擇合適的權重與偏差,最終測試集輸出2019年和2020年陜西省小麥條銹病發(fā)生面積分別為11.73萬hm2和58.94萬hm2,測試集預測準確度為91.55%,B6F7B9F2-67DC-406B-B422-45868C92D1B5
訓練集輸出2010年-2018年陜西省小麥條銹病發(fā)生面積依次為39.92、7.40、17.24、4.91、23.41、40.31、22.45、54.83、40.90萬hm2(圖4)。訓練集預測擬合符合率達到92.29%。
2.3 條銹病發(fā)生面積預測
依據2021年陜西省7市37個縣調查資料(表1,圖5),利用全子集回歸模型2預測出2021年陜西省小麥條銹病發(fā)生面積為(46.11±10.61)萬hm2,當環(huán)境條件適宜發(fā)病時,發(fā)生面積可達56.72萬hm2;當環(huán)境條件不適宜發(fā)病時,發(fā)生面積為35.50萬hm2。利用BP神經網絡算法對2021年陜西省小
麥條銹病發(fā)生面積進行預測,結果顯示,2021年陜西省小麥條銹病發(fā)生面積為52.85萬hm2。
3 結論與討論
冬季溫度和濕度條件等是影響條銹菌越冬的主要因素[27],春季3月-5月降雨量偏多,有利于小麥條銹病春季流行[28]。本研究結果表明,1月月平均溫度和3月月平均降雨量是陜西省小麥條銹病發(fā)生流行的主要影響因子。建立全子集回歸預測模型2的預測準確度為93.46%,BP神經網絡算法的預測準確度為91.55%,具有很好的應用前景。
基于全子集回歸篩選法建立的預測模型已得到了廣泛的應用。李長春等[29]利用全子集回歸進行大豆育種材料葉面積指數(leaf area index,LAI)的估測,估測精度優(yōu)于逐步回歸;陳鵬等[30]基于全子集分析能夠準確估算馬鈴薯葉綠素含量;譚丞軒等[31]利用全子集篩選法與機器學習相結合能夠提高預測土壤含水率的反演精度。神經網絡算法具有較強的解決復雜非線性問題的功能,在病害預測方面已有一些研究。胡小平等[18]利用BP神經網絡算法預測陜西漢中小麥條銹病的流行程度;莫麗紅等[32]利用BP神經網絡算法預測甘肅平涼小麥條銹病的流行程度,預測準確度均達到了100%,測試樣本預測輸出與實際輸出間的均方差為0.1~0.4級。但迄今為止,在小麥條銹病發(fā)生流行預測中主要考慮了菌源、溫度和降雨量等因素,很少考慮病原菌的致病性等因素在條銹病發(fā)生流行中的作用,在以后的研究中應該加強這些方面基礎數據的收集等工作。
參考文獻
[1] CHEN Xianming. Epidemiology and control of stripe rust [Puccinia striiformis f.sp. tritici]on wheat [J]. Canadian Journal of Plant Pathology, 2005, 27(3): 314-337.
[2] 胡小平, 王保通, 康振生. 中國小麥條銹菌毒性變異研究進展[J]. 麥類作物學報, 2014, 34(5): 709-716.
[3] 李振岐, 商鴻生. 小麥銹病及其防治[J]. 上海: 上海科學技術出版社, 1989.
[4] 劉萬才, 劉振東, 黃沖, 等. 近10年農作物主要病蟲害發(fā)生危害情況的統(tǒng)計和分析[J]. 植物保護, 2016, 42(5): 1-9.
[5] 劉杰, 王福祥, 曾娟, 等. 貫徹《農作物病蟲害防治條例》走好依法植保道路[J]. 中國植保導刊, 2020, 40(7): 5-9.
[6] WELLINGS C R. Global status of stripe rust: a review of historical and current threats [J]. Euphytica, 2011, 179(1): 129-141.
[7] 王江蓉, 彭紅, 呂國強, 等. 小麥條銹病防治策略的提出與推廣應用[J]. 中國植保導刊, 2018, 38(10): 94-96.
[8] 陳萬權, 徐世昌, 吳立人. 中國小麥條銹病流行體系與持續(xù)治理研究回顧與展望[J]. 中國農業(yè)科學, 2007, 40(S1): 3107-3113.
[9] WAN Anmin, ZHAO Zhonghua, CHEN Xianming, et al. Wheat stripe rust epidemic and virulence of Puccinia striiformis f.sp. tritici in China in 2002 [J]. Plant Disease, 2004, 88(8): 896-904.
[10]黃沖, 姜玉英, 李佩玲, 等. 2017年我國小麥條銹病流行特點及重發(fā)原因分析[J]. 植物保護, 2018, 44(2): 162-166.
[11]黃沖, 姜玉英, 李春廣. 1987年-2018年我國小麥主要病蟲害發(fā)生危害及演變分析[J]. 植物保護, 2020, 46(6): 186-193.
[12]萬安民, 趙中華, 吳立人. 2002年我國小麥條銹病發(fā)生回顧[J]. 植物保護, 2003, 29(2): 5-8.
[13]馬占鴻. 中國小麥條銹病研究與防控[J]. 植物保護學報, 2018, 45(1): 1-6.
[14]李恩才, 李素玉, 武劍州, 等. 關中西部小麥條銹病發(fā)生規(guī)律及病菌越冬、越夏問題研究[J]. 陜西農業(yè)科學, 2008(1): 103-104.
[15]SHANER G, POWELSON R L. The oversummering and dispersal of inoculum of Puccinia striiformis in Oregon [J]. Phytopathology, 1973, 63: 13-17.
[16]馬麗杰. 小麥條銹菌潛育越冬的分子流行學[D]. 楊凌: 西北農林科技大學, 2015.B6F7B9F2-67DC-406B-B422-45868C92D1B5
[17]胡小平, 楊之為, 李振岐, 等. 漢中地區(qū)小麥條銹病流行程度預測研究[J]. 西北農業(yè)大學學報, 2000(2): 18-21.
[18]胡小平, 楊之為, 李振岐, 等. 漢中地區(qū)小麥條銹病的BP神經網絡預測[J]. 西北農業(yè)學報, 2000(3): 28-31.
[19]張吉昌, 王清文, 黎釗, 等. 漢中市小麥條銹病流行的影響因子及預測模型[J]. 麥類作物學報, 2017, 37(12): 1640-1644.
[20]陳鵬. 基于無人機多源遙感的馬鈴薯葉綠素含量反演機理及模型構建[D]. 焦作: 河南理工大學, 2019.
[21]張迦南. 基于不同預處理方法的冬小麥冠層高光譜遙感長勢監(jiān)測研究[D]. 鄭州: 河南農業(yè)大學, 2018.
[22]JIANG Xinhua, XUE Heru, ZHANG Lina, et al. Nondestructive detection of chilled mutton freshness based on multi-label information fusion and adaptive BP neural network [J]. Computers and Electronics in Agriculture, 2018, 155: 371-377.
[23]ATKINSON P M, JEGANATHAN C. Inter-comparison of four models for smoothing satellite sensor time-series data to estimate vegetation phenology [J]. Remote Sensing of Environment, 2012, 123: 400-417.
[24]HANGSHING L, DABRAL P P. Multivariate frequency analysis of meteorological drought using copula [J]. Water Resources Management, 2018, 32(5): 1741-1758.
[25]HYNDMAN R J, ATHANASOPOULOS G. Forecasting: principles and practice [M]. Melbourne, Australia: OTexts, 2018: 59-63.
[26]肖悅巖. 預測預報準確度評估方法的研究[J]. 植保技術與推廣, 1997(4): 3-6.
[27]鄒一萍, 馬麗杰, 胡小平. 條銹病菌源基地小麥返青期條銹病發(fā)病程度預測[J]. 西北農業(yè)學報, 2016, 25(2): 306-310.
[28]謝飛舟. 陜西省小麥條銹病流行規(guī)律進一步研究[D]. 楊凌: 西北農林科技大學, 2011.
[29]李長春, 牛慶林, 楊貴軍, 等. 基于無人機數碼影像的大豆育
種材料葉面積指數估測[J]. 農業(yè)機械學報, 2017, 48(8): 147-158.
[30]陳鵬, 馮海寬, 李長春, 等. 無人機影像光譜和紋理融合信息估算馬鈴薯葉片葉綠素含量[J]. 農業(yè)工程學報, 2019, 35(11): 63-74.
[31]譚丞軒, 張智韜, 許崇豪, 等. 無人機多光譜遙感反演各生育期玉米根域土壤含水率[J]. 農業(yè)工程學報, 2020, 36(10): 63-74.
[32]莫麗紅, 陳杰新, 倪偉, 等. 基于改進BP網絡的小麥條銹病預測模型研究[J]. 中國植保導刊, 2011, 31(9): 38-43.
(責任編輯:楊明麗)B6F7B9F2-67DC-406B-B422-45868C92D1B5