摘 要:小站稻是天津津南區(qū)的特產(chǎn)。小站稻病害的發(fā)生會(huì)嚴(yán)重影響其產(chǎn)量和品質(zhì),為防治病害,種植者常常會(huì)增加農(nóng)藥使用量,從而導(dǎo)致環(huán)境污染。所以,需要及時(shí)準(zhǔn)確地預(yù)測(cè)小站稻病害發(fā)生情況,以便有針對(duì)性地開展小站稻田間病蟲害防治工作,提高小站稻產(chǎn)量和品質(zhì),減少用藥,保護(hù)環(huán)境。傳統(tǒng)的病蟲害預(yù)警主要依靠田間樣本采集等方法,但這種方法無(wú)法及時(shí)掌握病害的發(fā)生和發(fā)展情況。針對(duì)上述問(wèn)題,對(duì)小站稻氣象數(shù)據(jù)進(jìn)行了采集和預(yù)處理,運(yùn)用LSTM模型建立了小站稻病害預(yù)測(cè)模型,以預(yù)測(cè)小站稻病害發(fā)生情況。對(duì)比了支持向量機(jī)、決策樹、隨機(jī)森林、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)、BP網(wǎng)絡(luò)等方法。結(jié)果顯示,采用LSTM模型對(duì)水稻病害預(yù)測(cè)的效果最佳,在預(yù)測(cè)惡苗病、細(xì)菌性褐斑病、稻瘟病、干尖線蟲病這四種病害時(shí)平均準(zhǔn)確率高達(dá)87.06%,優(yōu)于其他對(duì)比模型。
關(guān)鍵詞:LSTM;深度學(xué)習(xí);病害預(yù)測(cè);智慧農(nóng)業(yè);云平臺(tái);小站稻
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-1302(2025)07-0-05
0 引 言
水稻病害嚴(yán)重影響了水稻的生長(zhǎng)和產(chǎn)量。在全球范圍內(nèi),每年因病害和蟲害所造成的額外成本幾乎占整個(gè)糧食生產(chǎn)總成本的四分之一[1]。此外,全球氣溫逐年上升,為病蟲害的發(fā)生提供了極為有利的條件,使得病害程度逐年加重,所以,加強(qiáng)病蟲害的預(yù)防和監(jiān)控至關(guān)重要[2-3]。傳統(tǒng)種植業(yè)防治病蟲害的有效方法有噴灑殺蟲劑和培育具有耐病蟲害基因的新品種。但隨著抗病品種的增加,稻米品質(zhì)難以得到保證。另外,農(nóng)藥的大量使用有可能引發(fā)食物的安全問(wèn)題,且過(guò)量使用農(nóng)藥還會(huì)對(duì)環(huán)境造成一定程度的損害[1,4]。更重要的是,環(huán)境和食品中的有毒化學(xué)殘留會(huì)影響非目標(biāo)生物生存,還可能會(huì)導(dǎo)致人類患癌[5]。
目前,在我國(guó)農(nóng)業(yè)病蟲害預(yù)警監(jiān)控工作中,主要依靠田間樣本采集來(lái)獲取病蟲害信息。這種方法雖然準(zhǔn)確性較為可靠,但存在不少問(wèn)題,例如,它不能反映病蟲害的全貌、不夠及時(shí)且過(guò)于主觀[6],并且需要投入大量的時(shí)間和資源。所以,傳統(tǒng)的田間樣本采集方法無(wú)法及時(shí)掌握病害的發(fā)生和發(fā)展情況。
綜上所述,在精準(zhǔn)農(nóng)業(yè)中,病害預(yù)測(cè)有著重要意義。它能夠助力農(nóng)民及時(shí)察覺病害并加以應(yīng)對(duì),從而最大程度保障作物產(chǎn)量與質(zhì)量,達(dá)成農(nóng)業(yè)的可持續(xù)發(fā)展[7]。本研究把小站稻常見的四種病害,即惡苗病、細(xì)菌性褐斑病、稻瘟病、干尖線蟲病作為研究對(duì)象,依據(jù)病害的適宜氣象來(lái)預(yù)測(cè)病害理論上發(fā)生的概率。
1 材料與方法
1.1 數(shù)據(jù)采集和預(yù)處理
本文主要研究基于天津地區(qū)氣象參數(shù)進(jìn)行病害預(yù)測(cè)的方法[8],所涉及的病害有惡苗病、細(xì)菌性褐斑病、稻瘟病、干尖線蟲病。氣象數(shù)據(jù)主要采集自天津及附近地區(qū)的三個(gè)站點(diǎn):54511、54527、54534,數(shù)據(jù)來(lái)源于“https://rp5.ru/”網(wǎng)站,包含2020—2022年每年4月1日—11月30日的數(shù)據(jù)。文獻(xiàn)[9]曾利用貝葉斯模型,通過(guò)10年的長(zhǎng)期數(shù)據(jù)構(gòu)建了中國(guó)臺(tái)灣試驗(yàn)稻田的天氣波動(dòng)(溫度、相對(duì)濕度、風(fēng)和降雨)、耕作系統(tǒng)(常規(guī)和低外部投入耕作)與作物病害之間的關(guān)系,研究表明天氣波動(dòng)對(duì)稻田真菌病害發(fā)病率的影響會(huì)超過(guò)耕作制度的影響。因此,本文主要采集的氣象因子包括濕度、風(fēng)速、最低氣溫、最高氣溫、降水量,采集數(shù)據(jù)見表1。
由于訓(xùn)練氣象數(shù)據(jù)存在缺失值,故對(duì)連續(xù)缺失值予以清除,對(duì)不連續(xù)的缺失值采用插值法添加數(shù)據(jù)。經(jīng)過(guò)處理后,總共得到14 191條有效數(shù)據(jù)。然后,在不同氣象條件下,對(duì)最有可能出現(xiàn)的病害進(jìn)行標(biāo)注,依據(jù)此操作將氣象數(shù)據(jù)整理成數(shù)據(jù)集,最終得到的結(jié)果見表2。最后,按照9∶1的比例劃分為訓(xùn)練集和測(cè)試集,數(shù)據(jù)劃分情況見表3。
預(yù)測(cè)部分?jǐn)?shù)據(jù)采集自中國(guó)天津市優(yōu)質(zhì)農(nóng)產(chǎn)品示范基地,由圖1所示設(shè)備實(shí)時(shí)采集濕度、風(fēng)速、最高氣溫、最低氣溫、降水量五種參數(shù)。采集設(shè)備由深圳矽遞科技股份有限公司提供。
1.2 模型算法選擇
支持向量機(jī)(Support Vector Machine, SVM)是一種在分類與回歸分析中分析數(shù)據(jù)的監(jiān)督式學(xué)習(xí)模型和相關(guān)的學(xué)習(xí)算法。
K最鄰近法(K-Nearest Neighbor, KNN)是一種理論上比較成熟的方法,也是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法之一。
決策樹(Decision Tree, DT)是一種常用的分類算法,它通過(guò)構(gòu)建樹狀預(yù)測(cè)模型,對(duì)未知類別的數(shù)據(jù)進(jìn)行分類。
隨機(jī)森林(Random Forest, RF)是一種用于分類和回歸的集成學(xué)習(xí)方法,由一組決策樹組成。每棵樹都是在隨機(jī)抽取的特征上構(gòu)建的,然后對(duì)所有的樹進(jìn)行匯總,以得到最終的預(yù)測(cè)結(jié)果。
長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),適合于處理和預(yù)測(cè)時(shí)間序列中間隔和延遲相對(duì)較長(zhǎng)的重要事件[10]。LSTM是一種強(qiáng)大的神經(jīng)網(wǎng)絡(luò)模型,可以有效地處理和預(yù)測(cè)時(shí)間序列數(shù)據(jù),并已在多種任務(wù)中得到廣泛應(yīng)用[10]。本文針對(duì)氣象數(shù)據(jù)使用SVM、KNN、決策樹、隨機(jī)森林、LSTM、BP等算法進(jìn)行實(shí)驗(yàn)。
式中:U和W是權(quán)重矩陣;b是偏差;Ot()是sigmoid函數(shù)。
1.3 病害預(yù)測(cè)方法
本研究采用同一地區(qū)連續(xù)三年的數(shù)據(jù),提前一年預(yù)估下一年四種病害的發(fā)病率。通過(guò)利用前三年的氣象數(shù)據(jù)建立一個(gè)次年病害發(fā)病率預(yù)測(cè)模型,把這個(gè)多元時(shí)間序列問(wèn)題分為四類?;谠撃P?,預(yù)測(cè)接下來(lái)的時(shí)間內(nèi)理論上最易發(fā)生的病害。由于該地主要種植小站稻,且曾發(fā)生過(guò)惡苗病、細(xì)菌性褐斑病、稻瘟病、干尖線蟲病,所以該地殘留病菌孢子。
氣象數(shù)據(jù)預(yù)測(cè)流程如圖2所示。首先,需對(duì)采集的氣象數(shù)據(jù)進(jìn)行標(biāo)注。經(jīng)查閱資料得知,四種病害在不同氣象條件下的生存概率各異。例如,稻瘟病在25~28 ℃、相對(duì)濕度90%以上時(shí)最適宜發(fā)生;干尖線蟲病在20~25 ℃時(shí)最適宜發(fā)生。將不同氣象條件下最可能出現(xiàn)的病害進(jìn)行標(biāo)注,并整理成數(shù)據(jù)集。然后,按照9∶1的比例,把氣象數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集。另外,稻瘟病的潛育期為4.5天,干尖線蟲病的潛育期為3天,細(xì)菌性褐斑病的潛育期為6天,惡苗病的潛育期為14天。由于干尖線蟲病潛育期最短,所以采用氣象站實(shí)時(shí)采集的前3天的數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)3天最有可能發(fā)生該病害的概率。
1.4 模型預(yù)測(cè)精度評(píng)價(jià)指標(biāo)
分類器的預(yù)測(cè)結(jié)果以混淆矩陣表示,在二分類任務(wù)中,該矩陣定義了四個(gè)類別的評(píng)價(jià)指標(biāo):真陽(yáng)性(TP),即正確預(yù)測(cè)的1類數(shù)據(jù);假陽(yáng)性(FP),即錯(cuò)誤預(yù)測(cè)的1類數(shù)據(jù);真陰性(TN),即正確預(yù)測(cè)的0類數(shù)據(jù);還有假陰性(FN),即錯(cuò)誤預(yù)測(cè)的0類數(shù)據(jù)。
1.5 實(shí)驗(yàn)平臺(tái)
本節(jié)通過(guò)實(shí)驗(yàn)對(duì)所提出方法的性能進(jìn)行了評(píng)估、比較和討論。本文中所有的訓(xùn)練和評(píng)估試驗(yàn)都是在同一臺(tái)測(cè)試電腦上實(shí)現(xiàn)的。系統(tǒng)為Windows11,英特爾i9-13900HX處理器,擁有16 GB運(yùn)行內(nèi)存和8 GB英偉達(dá)GeForce RTX 4060 GPU。該網(wǎng)絡(luò)在PyTorch深度學(xué)習(xí)框架中進(jìn)行訓(xùn)練。
2 結(jié)果分析
2.1 四種病害預(yù)測(cè)模型比較
為預(yù)測(cè)小站稻病害情況,需選擇合適的算法。為此,在四種病害的數(shù)據(jù)集中進(jìn)行了比較,結(jié)果見表4。整體對(duì)干尖線蟲病的預(yù)測(cè)效果較差,這是由于干尖線蟲病的數(shù)據(jù)量較少。未來(lái)工作的一項(xiàng)內(nèi)容是加入干尖線蟲病的數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)均衡,以確保干尖線蟲病預(yù)測(cè)的精確度。
由表4可知,整體而言,LSTM算法與BP、DT、KNN、SVM、RF算法相比,Accuracy 提高了2.35~7.42個(gè)百分點(diǎn)。
從單個(gè)病害角度來(lái)看,LSTM對(duì)干尖線蟲病的預(yù)測(cè)效果較差;在稻瘟病方面,其Precision相比于其他模型提高了8.72~
26.12個(gè)百分點(diǎn),Recall提高了0.89~9.57個(gè)百分點(diǎn),F(xiàn)1增長(zhǎng)了5.95~19.27個(gè)百分點(diǎn);對(duì)于細(xì)菌性褐斑病,其Precision相比于其他模型提高了13.83~42.37個(gè)百分點(diǎn);在惡苗病方面,其Precision相比于其他模型提高了3.53~19.18個(gè)百分點(diǎn),Recall提高了0.01~8.92個(gè)百分點(diǎn),F(xiàn)1提高了1.36~13.11個(gè)百分點(diǎn)。綜上,LSTM與其他模型相比效果較好。
2.2 三種病害數(shù)據(jù)集模型比較
由于干尖線蟲病害數(shù)量較少,所以在刪除干尖線蟲病害分類之后,采用三種病害數(shù)據(jù)對(duì)LSTM、BP、DT、KNN、SVM、RF算法進(jìn)行比較,結(jié)果見表5。整體而言,LSTM算法的Accuracy最高可達(dá)93%,比其他算法高出5.57~14.34個(gè)百分點(diǎn)。從單個(gè)病害角度出發(fā),將LSTM與其他模型進(jìn)行比較,在預(yù)測(cè)稻瘟病時(shí)LSTM的Precision比其他模型提高了13.38~29.54個(gè)百分點(diǎn),Recall提高了8~13.6個(gè)百分點(diǎn),F(xiàn)1提高了11.17~21.86個(gè)百分點(diǎn);在預(yù)測(cè)細(xì)菌性褐斑病時(shí),LSTM的Precision提高了28.37~45.04個(gè)百分點(diǎn),Recall 提高了48.5~76.7個(gè)百分點(diǎn),F(xiàn)1提高了39.84~64.77個(gè)百分點(diǎn);在預(yù)測(cè)惡苗病時(shí),LSTM的Precision提高了18.53~38.05 個(gè)
百分點(diǎn),Recall提高了3.86~51.07個(gè)百分點(diǎn),F(xiàn)1提高了9.86~56.86個(gè)百分點(diǎn)。綜上,LSTM在三種病害的預(yù)測(cè)比較上優(yōu)于其他模型。
3 基于LSTM的小站稻病害預(yù)測(cè)系統(tǒng)實(shí)現(xiàn)
在完成基于LSTM的小站稻病害預(yù)測(cè)算法研究后,為了將本研究應(yīng)用于實(shí)際的小站稻種植過(guò)程,實(shí)現(xiàn)小站稻預(yù)測(cè)檢測(cè)智能化,開發(fā)了在線小站稻病害識(shí)別預(yù)測(cè)系統(tǒng)。該系統(tǒng)能夠?qū)崿F(xiàn)小站稻病害識(shí)別預(yù)測(cè)的數(shù)字化管理,為小站稻病害的早期及時(shí)檢測(cè)提供支撐。
3.1 系統(tǒng)登錄模塊
系統(tǒng)用戶登錄時(shí),需輸入網(wǎng)絡(luò)地址與登錄所需信息,再點(diǎn)擊登錄按鈕。后臺(tái)驗(yàn)證信息通過(guò)后,即可成功登錄,如圖3所示。該系統(tǒng)通過(guò)在后端生成驗(yàn)證碼,并將其存儲(chǔ)于session中。用戶輸入賬戶、密碼和驗(yàn)證碼后,系統(tǒng)利用session驗(yàn)證用戶身份信息。若驗(yàn)證未通過(guò)或失敗,界面會(huì)提示錯(cuò)誤,3 s后直接跳轉(zhuǎn)至登錄界面;若驗(yàn)證通過(guò)則成功登錄。成功登錄后,系統(tǒng)會(huì)根據(jù)后臺(tái)獲取到的用戶角色權(quán)限來(lái)設(shè)定界面,限制用戶操作內(nèi)容。其中,系統(tǒng)管理模塊僅管理員可見。
3.2 病害預(yù)測(cè)管理模塊
病害預(yù)測(cè)模塊涵蓋病害預(yù)測(cè)與歷史管理識(shí)別功能。該模塊對(duì)病害預(yù)測(cè)模型進(jìn)行封裝,其運(yùn)作流程為:前端調(diào)用后端接口,后端調(diào)用氣象站采集的數(shù)據(jù)并保存,之后在模型中進(jìn)行預(yù)測(cè),預(yù)測(cè)完成后將結(jié)果傳輸?shù)角岸?。氣象預(yù)測(cè)模塊如圖4所示,點(diǎn)擊“氣象預(yù)測(cè)”后,即可開始調(diào)用后端氣象站數(shù)據(jù),調(diào)用模型進(jìn)行病害預(yù)測(cè),再將預(yù)測(cè)結(jié)果傳輸至前端。點(diǎn)擊圖片,即可查看病害詳細(xì)信息,如圖5所示。
4 結(jié) 語(yǔ)
針對(duì)小站稻病害預(yù)測(cè)問(wèn)題,構(gòu)建了基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)的預(yù)測(cè)模型。模型構(gòu)建與數(shù)據(jù)利用方面,首先從氣象站獲取氣象數(shù)據(jù),隨后運(yùn)用LSTM模型對(duì)氣象數(shù)據(jù)進(jìn)行訓(xùn)練以實(shí)現(xiàn)對(duì)小站稻病害的預(yù)測(cè)。在預(yù)測(cè)結(jié)果上,當(dāng)預(yù)測(cè)惡苗病、細(xì)菌性褐斑病、稻瘟病、干尖線蟲病這四種病害時(shí),LSTM的平均準(zhǔn)確率為87.06%,其中稻瘟病精確率為92.56%、細(xì)菌性褐斑病精確率為88.37%、惡苗病精確率為80.71%、干尖線蟲病精確率為0%;而當(dāng)預(yù)測(cè)惡苗病、細(xì)菌性褐斑病、稻瘟病這三種病害時(shí),平均準(zhǔn)確率可達(dá)93.00%,其中稻瘟病精確率為96.83%、惡苗病精確率為92.81%、細(xì)菌性褐斑病精確率為98.10%。由此可見,該方法在預(yù)測(cè)惡苗病、細(xì)菌性褐斑病、稻瘟病時(shí)效果較好。未來(lái),將主要收集干尖線蟲氣象數(shù)據(jù)并納入模型當(dāng)中。
注:本文通訊作者為劉同海。
參考文獻(xiàn)
[1] GANGOLA S, BHATT P, KUMAR A J, et al. Biotechnological tools to elucidate the mechanism of pesticide degradation in the environment [J]. Chemosphere, 2022, 296: 133916.
[2]王翔宇,溫皓杰,李鑫星,等.農(nóng)業(yè)主要病害檢測(cè)與預(yù)警技術(shù)研究進(jìn)展分析[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2016,47(9):266-277.
[3]袁培森,歐陽(yáng)柳江,翟肇裕,等.基于MobileNetV3Small-ECA的水稻病害輕量級(jí)識(shí)別研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2024,55(1):253-262.
[4] WANG D, SALEH N B, BYRO A, et al. Nano-enabled pesticides for sustainable agriculture and global food security [J]. Nature nanotechnology, 2022, 17(4): 347-360.
[5] HOUGH R L. A world view of pesticides [J]. Nature geoscience, 2021, 14(4): 183-184.
[6]王洪健,于海業(yè),高山云,等. 基于熒光光譜分析的玉米早期斑病害預(yù)測(cè)模型[J]. 光譜學(xué)與光譜分析,2023,43(12):3710-3718.
[7]張靜文. 基于多源時(shí)空信息的水稻病害區(qū)域流行預(yù)測(cè)研究[D]. 杭州:杭州電子科技大學(xué),2022.
[8]張善文,黃文準(zhǔn),張傳雷. 基于環(huán)境信息和深度自編碼網(wǎng)絡(luò)的農(nóng)作物病害預(yù)測(cè)模型[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2018,34(2):288-292.
[9] CHIU M C, CHEN C L, CHEN C W, et al. Weather fluctuation can override the effects of integrated nutrient management on fungal disease incidence in the rice fields [J]. Scientific reports, 2022, 12(1): 4273.
[10] SHERSTINSKY A. Fundamentals of recurrent neural network (RNN) and long short-term memory (LSTM) network [J]. Physica D: nonlinear phenomena, 2020, 404: 132306.
收稿日期:2024-05-07 修回日期:2024-05-31
基金項(xiàng)目:天津市科技計(jì)劃項(xiàng)目(21YFSNSN00040);中央財(cái)政引導(dǎo)地方科技發(fā)展項(xiàng)目(21ZYCGSN00590)
作者簡(jiǎn)介:張 蕊(1999—),女,河北泊頭人,碩士,研究方向?yàn)樯疃葘W(xué)習(xí)。
蔡景瀚(2000—),男,浙江臺(tái)州人,碩士,研究方向?yàn)槎嗄B(tài)算法。
劉文正(1999—),男,山東鄒平人,碩士,研究方向?yàn)樯疃葘W(xué)習(xí)。
劉同海(1977—),男,山東鄄城人,博士,研究方向?yàn)檗r(nóng)業(yè)與人工智能。