岳喜申
(塔里木大學(xué)信息工程學(xué)院,新疆 阿拉爾 843300)
在農(nóng)業(yè)生產(chǎn)中,農(nóng)作物病蟲害對(duì)農(nóng)作物產(chǎn)量等造成巨大威脅。農(nóng)作物病害的發(fā)生會(huì)阻礙農(nóng)作物的健康生長(zhǎng),導(dǎo)致其產(chǎn)量和品質(zhì)下降,影響糧食安全[1]。近年來,受氣候、農(nóng)業(yè)用水資源和耕地等因素的影響,植物病害的發(fā)生較為頻繁[2],為農(nóng)業(yè)生產(chǎn)帶來難題。
部分農(nóng)作物病蟲害檢測(cè)和識(shí)別基于現(xiàn)場(chǎng)診斷進(jìn)行,比較依賴人工或半自動(dòng)方式,由農(nóng)業(yè)專家或有經(jīng)驗(yàn)的農(nóng)戶進(jìn)行現(xiàn)場(chǎng)觀察和判斷,這種方法簡(jiǎn)單易行,但效率和時(shí)效性都有待提高,識(shí)別結(jié)果受個(gè)人經(jīng)驗(yàn)和技術(shù)水平影響,無法完全滿足快速發(fā)展的現(xiàn)代農(nóng)業(yè)需求[3]。因此,亟須開發(fā)一種新的農(nóng)作物病害識(shí)別方法來適應(yīng)現(xiàn)代農(nóng)業(yè)的發(fā)展。近年來,隨著智慧農(nóng)業(yè)迅猛發(fā)展,越來越多的學(xué)者致力于研究將深度學(xué)習(xí)技術(shù)應(yīng)用于農(nóng)作物病蟲害的檢測(cè)與識(shí)別。深度學(xué)習(xí)技術(shù)通過學(xué)習(xí)大量數(shù)據(jù),能夠有效模擬人腦神經(jīng)網(wǎng)絡(luò)進(jìn)行分析和判斷,在圖像識(shí)別、聲音識(shí)別和自然語言處理等方面表現(xiàn)突出。常用的深度學(xué)習(xí)網(wǎng)絡(luò)模型主要有卷積神經(jīng)網(wǎng)絡(luò)(CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)和生成對(duì)抗網(wǎng)絡(luò)(GAN)。基于深度學(xué)習(xí)的農(nóng)作物病害識(shí)別方法成為當(dāng)前的研究熱點(diǎn)。
本文探討深度學(xué)習(xí)在農(nóng)作物病害識(shí)別中的應(yīng)用,詳細(xì)介紹了其相關(guān)研究進(jìn)展,并探討利用深度學(xué)習(xí)進(jìn)行病害識(shí)別所面臨的主要挑戰(zhàn),提出了可能的解決方案。為相關(guān)領(lǐng)域的進(jìn)一步研究提供參考。
農(nóng)田中存在各種復(fù)雜因素,如田間遮擋物、灰塵等,這些因素會(huì)對(duì)農(nóng)作物病害圖像的采集產(chǎn)生影響,導(dǎo)致圖像輸入的質(zhì)量參差不齊,使得某些圖像中可能會(huì)缺失關(guān)鍵病害信息。農(nóng)田環(huán)境中土壤、植物殘?jiān)阮w粒物質(zhì)的存在,容易導(dǎo)致圖像出現(xiàn)模糊、噪點(diǎn)或者光線反射等問題,降低了圖像質(zhì)量,使得深度學(xué)習(xí)技術(shù)無法直接應(yīng)用于田間農(nóng)作物病害識(shí)別。
實(shí)踐中,深度學(xué)習(xí)技術(shù)在工業(yè)領(lǐng)域的應(yīng)用較為廣泛。將深度學(xué)習(xí)技術(shù)應(yīng)用于農(nóng)業(yè)領(lǐng)域時(shí),成本控制非常關(guān)鍵。農(nóng)作物檢測(cè)需要運(yùn)用大量的農(nóng)田圖像數(shù)據(jù),相關(guān)數(shù)據(jù)需要由專業(yè)人員通過田間調(diào)查和圖像采集等方式獲取,這增加了數(shù)據(jù)獲取的成本和復(fù)雜度。同時(shí),深度學(xué)習(xí)模型通常需要在大規(guī)模的數(shù)據(jù)集上進(jìn)行訓(xùn)練,這需要高性能的計(jì)算設(shè)備和大量的計(jì)算時(shí)間,尤其是對(duì)于復(fù)雜的模型和大規(guī)模的數(shù)據(jù)集,訓(xùn)練周期可能需要數(shù)天甚至數(shù)周,增加了訓(xùn)練模型的時(shí)間成本。此外,深度學(xué)習(xí)模型的部署和維護(hù)需要考慮成本,將模型應(yīng)用于農(nóng)田時(shí),可能需要部署大量的傳感器設(shè)備和計(jì)算設(shè)備來收集和處理農(nóng)田數(shù)據(jù),并實(shí)時(shí)檢測(cè)農(nóng)作物的生長(zhǎng)狀態(tài)。這加大了設(shè)備的購(gòu)買、安裝、維護(hù)和更新等成本。
對(duì)于野外環(huán)境下的病害識(shí)別任務(wù),需要建立大規(guī)模、多種類和多類型的公開病害數(shù)據(jù)庫。研究者通常有兩種主要的數(shù)據(jù)采集方式:自行去田間采集數(shù)據(jù),搜集互聯(lián)網(wǎng)上的圖片資源。
自行去田間采集數(shù)據(jù)較為常見,但也面臨許多挑戰(zhàn)。首先,需要投入大量的人力資源,因?yàn)椴『Φ陌l(fā)生通常是季節(jié)性、地域性的,需要在特定時(shí)間和地點(diǎn)進(jìn)行采集。其次,田間環(huán)境的復(fù)雜性導(dǎo)致數(shù)據(jù)采集存在困難,包括光照條件變化、遮擋物、病害程度和種類多樣性等因素,都會(huì)對(duì)數(shù)據(jù)集的質(zhì)量產(chǎn)生影響,使數(shù)據(jù)的標(biāo)注和清洗存在困難。
從互聯(lián)網(wǎng)上搜集圖片資源時(shí),部分圖片質(zhì)量可能參差不齊,部分圖片的準(zhǔn)確性和標(biāo)注的一致性可能無法保證。此外,許多數(shù)據(jù)集不對(duì)外公開,這限制了不同深度學(xué)習(xí)模型之間的客觀比較和驗(yàn)證,使得原有模型的優(yōu)化和升級(jí)變得困難。
病蟲害是農(nóng)作物生產(chǎn)過程中導(dǎo)致產(chǎn)量與質(zhì)量下降的重要因素之一。因此,對(duì)病蟲害進(jìn)行有效防治至關(guān)重要[4]。隨著圖像識(shí)別技術(shù)的廣泛應(yīng)用[5],基于機(jī)器視覺的農(nóng)作物病害圖像識(shí)別方法備受關(guān)注。與傳統(tǒng)識(shí)別方法相比,基于機(jī)器視覺的的農(nóng)作物病害圖像識(shí)別方法具有諸多優(yōu)勢(shì)。首先,具有較強(qiáng)的可移植性,可以在不同的農(nóng)作物種類、農(nóng)田環(huán)境以及拍攝設(shè)備下應(yīng)用,無須大幅度調(diào)整或重新訓(xùn)練模型。其次,具有較高的時(shí)效性,可以快速對(duì)大量農(nóng)作物圖像進(jìn)行分析,實(shí)時(shí)監(jiān)測(cè)和檢測(cè)作物的健康狀況,及時(shí)采取相應(yīng)的防治措施,從而避免病害的擴(kuò)散和影響作物的產(chǎn)量和質(zhì)量。最后,具有較高的準(zhǔn)確率。通過利用大規(guī)模的訓(xùn)練數(shù)據(jù)和深度學(xué)習(xí)算法,可以學(xué)習(xí)和識(shí)別不同病害的特征和模式,從而提高識(shí)別的準(zhǔn)確性,減少對(duì)特征設(shè)計(jì)的依賴。
根據(jù)使用方法的不同,可以選擇兩種主要的農(nóng)作物病害圖像識(shí)別技術(shù):基于傳統(tǒng)機(jī)器學(xué)習(xí)算法的病害識(shí)別和基于深度學(xué)習(xí)的病害識(shí)別。
第一,傳統(tǒng)機(jī)器學(xué)習(xí)算法的病害識(shí)別方法。該方法需要依靠人工設(shè)計(jì)的特征來進(jìn)行分類和識(shí)別,這些特征的質(zhì)量直接影響模型的性能[6]。在復(fù)雜、真實(shí)的自然環(huán)境下,由于農(nóng)作物的生長(zhǎng)狀態(tài)和病害表現(xiàn)具有多樣性,該方法往往無法準(zhǔn)確捕捉到所有特征,導(dǎo)致識(shí)別結(jié)果不夠理想[7]。
第二,基于深度學(xué)習(xí)的農(nóng)作物病害圖像識(shí)別方法。該方法在互聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)的支持下取得明顯進(jìn)展。深度學(xué)習(xí)模型能夠通過大規(guī)模的訓(xùn)練數(shù)據(jù)自動(dòng)學(xué)習(xí)特征,利用多層神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取和分類,能夠從圖像中學(xué)習(xí)到更高級(jí)別的抽象特征,從而實(shí)現(xiàn)更準(zhǔn)確的病害識(shí)別。
基于深度學(xué)習(xí)的農(nóng)作物病害圖像識(shí)別方法在性能上優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)方法?,F(xiàn)有的病蟲害分類網(wǎng)絡(luò)大多使用深度學(xué)習(xí)中的成熟網(wǎng)絡(luò)結(jié)構(gòu),包括AlexNet、VGGNet 和ResNet 等。深度學(xué)習(xí)模型具有強(qiáng)大的表達(dá)能力和泛化能力,能夠適應(yīng)復(fù)雜、真實(shí)的自然環(huán)境,并在不同數(shù)據(jù)集上取得較好的泛化效果。隨著深度學(xué)習(xí)技術(shù)的發(fā)展和硬件計(jì)算能力的提升,該方法在速度和準(zhǔn)確性方面也得到了明顯提升。
基于深度學(xué)習(xí)的農(nóng)作物病害圖像識(shí)別方法具有較高的研究?jī)r(jià)值和廣闊的應(yīng)用前景[8]。它可以廣泛應(yīng)用于農(nóng)業(yè)生產(chǎn)中的病害監(jiān)測(cè)、預(yù)警和防治等工作,為農(nóng)業(yè)工作者提供快速、準(zhǔn)確的病害識(shí)別手段,提高作物產(chǎn)量和質(zhì)量,減少農(nóng)藥的使用,推動(dòng)農(nóng)業(yè)可持續(xù)發(fā)展。
Kawasaki等[9]較早采用CNN 進(jìn)行農(nóng)作物病害識(shí)別,使用800 幅黃瓜病害圖像,包括健康葉片和兩種不同病害葉片類型,同時(shí),使用4-fold 交叉驗(yàn)證方法進(jìn)行訓(xùn)練,最終實(shí)現(xiàn)了94.9%的識(shí)別準(zhǔn)確率。Karlekar 等[10]基于深度學(xué)習(xí)技術(shù)提出了一種用于復(fù)雜背景下的大豆葉片病害識(shí)別方法,設(shè)計(jì)了一個(gè)圖像處理模塊(IPM),訓(xùn)練在CNN 網(wǎng)絡(luò)之前去除圖像中的復(fù)雜背景,并分割出葉片部分,該模型的識(shí)別準(zhǔn)確率達(dá)到了98.14%。這項(xiàng)研究結(jié)果表明,基于深度學(xué)習(xí)的方法在復(fù)雜背景下的大豆葉片病害識(shí)別方面取得了較好成果。這種方法不僅能識(shí)別常見的大豆病害,還能檢測(cè)未知種類的病害,為大豆病害的早期預(yù)警和精準(zhǔn)防治提供有力支持。王春山等[11]提出了一種改進(jìn)型多尺度殘差網(wǎng)絡(luò),用于農(nóng)作物病害識(shí)別。該方法通過改變殘差層的連接方式和對(duì)大卷積核進(jìn)行分解,來減少模型的參數(shù)量,并設(shè)計(jì)一種輕量級(jí)的病害識(shí)別模型。首先,改變殘差層的連接方式,采用新的結(jié)構(gòu),使得網(wǎng)絡(luò)能更好地學(xué)習(xí)和表示復(fù)雜的病害特征。其次,對(duì)大卷積核進(jìn)行分解,將其分解為多個(gè)小卷積核,從而減少模型的參數(shù)量,在保持較高識(shí)別準(zhǔn)確率的同時(shí),降低了模型的復(fù)雜度和對(duì)計(jì)算資源的消耗。王丹丹等[12]為解決蘋果疏果期背景情況復(fù)雜、光照條件不穩(wěn)定、障礙物和果實(shí)遮擋等問題,提出了一種基于RFCN 神經(jīng)網(wǎng)絡(luò)模型的蘋果識(shí)別方法,取得了較高的準(zhǔn)確率。該研究的優(yōu)化在于采用R-FCN 神經(jīng)網(wǎng)絡(luò)模型,自動(dòng)學(xué)習(xí)和提取蘋果的特征,且具有較強(qiáng)的目標(biāo)檢測(cè)能力,能夠應(yīng)對(duì)光照條件不穩(wěn)定、障礙物和果實(shí)遮擋等復(fù)雜情況,對(duì)復(fù)雜背景下的蘋果進(jìn)行準(zhǔn)確檢測(cè)和識(shí)別。孫俊等[13]在AlexNet 的基礎(chǔ)上進(jìn)行改進(jìn),采用批歸一化方法,加入全局池化層以及縮減特征圖數(shù)目的方法,共得到了8 種改進(jìn)模型。利用改進(jìn)的模型,對(duì)PlantVillage 數(shù)據(jù)庫中的14 種植物的26 種病害進(jìn)行識(shí)別,最優(yōu)模型的平均測(cè)試識(shí)別準(zhǔn)確率高達(dá)99.56%。這項(xiàng)研究的優(yōu)化在于對(duì)AlexNet 進(jìn)行了改進(jìn),通過引入批歸一化方法,加快網(wǎng)絡(luò)的收斂速度,提高模型的穩(wěn)定性和準(zhǔn)確性。此外,加入全局池化層可以提取更全局的特征信息,有助于更好地捕捉病害的特征。同時(shí),縮減特征圖數(shù)目可以降低模型的計(jì)算復(fù)雜度,提高模型的運(yùn)行效率。
在傳統(tǒng)農(nóng)業(yè)向現(xiàn)代農(nóng)業(yè)轉(zhuǎn)型的關(guān)鍵時(shí)期,農(nóng)業(yè)生產(chǎn)將逐步從依賴單純?nèi)肆趧?dòng)和經(jīng)驗(yàn)逐漸向數(shù)字化、智能化和自動(dòng)化發(fā)展。隨著信息技術(shù)的快速發(fā)展,智慧農(nóng)業(yè)逐漸推廣?;谏疃葘W(xué)習(xí)實(shí)現(xiàn)農(nóng)作物病害圖像識(shí)別是未來的研究重點(diǎn)之一,包括將模型應(yīng)用于實(shí)際場(chǎng)景中,與農(nóng)業(yè)工作者緊密合作,實(shí)現(xiàn)技術(shù)轉(zhuǎn)化和農(nóng)業(yè)實(shí)踐的推廣。
基于深度學(xué)習(xí)的植物病害檢測(cè)與識(shí)別技術(shù)已取得進(jìn)展,實(shí)踐中在自然環(huán)境下實(shí)施時(shí)會(huì)面臨眾多挑戰(zhàn),包括數(shù)據(jù)量不足、成本高昂、田間環(huán)境復(fù)雜和數(shù)據(jù)集獲取困難等。為此,研究者需要共同努力,通過與農(nóng)業(yè)機(jī)構(gòu)、農(nóng)民合作,共享田間數(shù)據(jù)等方式,建立大規(guī)模、多種類和多類型的公開病害數(shù)據(jù)庫,利用充足的訓(xùn)練數(shù)據(jù)和實(shí)用模型,推動(dòng)農(nóng)業(yè)綠色可持續(xù)發(fā)展[14]。統(tǒng)一標(biāo)準(zhǔn)和協(xié)議,確保數(shù)據(jù)集的準(zhǔn)確性和一致性。公開數(shù)據(jù)庫可以為研究者提供更好的基準(zhǔn)和參考,促進(jìn)深度學(xué)習(xí)模型在農(nóng)作物病害識(shí)別任務(wù)中的發(fā)展和優(yōu)化。同時(shí),可以采用高效的深度學(xué)習(xí)算法和模型架構(gòu)[15],減少計(jì)算資源的需求;利用分布式計(jì)算和云計(jì)算等技術(shù),加速模型訓(xùn)練和推理過程;探索低成本的圖像采集和傳感器技術(shù),以降低設(shè)備部署和維護(hù)的成本。
綜上,本文對(duì)基于深度學(xué)習(xí)的農(nóng)作物病害識(shí)別方法進(jìn)行綜述,介紹深度學(xué)習(xí)在農(nóng)作物病害識(shí)別中的應(yīng)用,從田間環(huán)境、成本和數(shù)據(jù)量等方面入手探討其需要解決的一些問題,并對(duì)其發(fā)展進(jìn)行了展望,為今后農(nóng)作物病害識(shí)別的深入研究與發(fā)展提供參考。