南亞平,徐運紅
(河北工程大學(xué),河北 邯鄲 056000)
隨著世界人口的增加,提高農(nóng)作物的質(zhì)量和產(chǎn)量變得十分迫切。隨著以信息技術(shù)為基礎(chǔ)的現(xiàn)代工具被廣泛運用,加快了實現(xiàn)這一目標(biāo)的進(jìn)程。然而,相關(guān)成績的取得是以增加作物病蟲害的數(shù)量和類型為代價。在早期發(fā)現(xiàn)植物葉片病變可使農(nóng)民采用適當(dāng)?shù)奶幚矸椒?,精確地調(diào)整和把控農(nóng)作物質(zhì)量和數(shù)量,對農(nóng)業(yè)的智能管理具有重要意義[1]。
現(xiàn)階段,世界上大部分地區(qū)葉片病變需要通過人工實地調(diào)查來檢測,既耗時費力又容易出錯。此外,人工實地勘察要求在第一時間指出受感染的病變類型,專業(yè)性極高。隨著人工智能技術(shù)的迅速發(fā)展,可以在病變早期進(jìn)行診斷,使農(nóng)民能較早發(fā)現(xiàn)和識別出病蟲害類型和階段,從而及時采取預(yù)防措施,降低調(diào)查人員農(nóng)業(yè)勘察的工作難度,提高農(nóng)業(yè)勘察的效率和準(zhǔn)確率[2]。
隨著現(xiàn)代農(nóng)業(yè)的發(fā)展,迫切需要一個詳細(xì)的調(diào)查技術(shù)用于鑒別在各種植物中發(fā)現(xiàn)的病蟲害,從而更早、更快、更準(zhǔn)地對農(nóng)作物病蟲害進(jìn)行科學(xué)預(yù)判和干預(yù),從而判斷病蟲害災(zāi)情,采取科學(xué)、智能的管理方式,降低植物病蟲害的發(fā)生概率和導(dǎo)致的風(fēng)險。
在自動化技術(shù)中,基于植物葉片圖像的智能處理方法是解決植物疾病診斷的最佳方法。在各種圖像處理的基礎(chǔ)上,使用基于端到端深度學(xué)習(xí)的模型成功地解決了常規(guī)的圖像分類問題,取得了巨大的成功[3]。近年來,深度學(xué)習(xí)技術(shù)在農(nóng)業(yè)中得到了廣泛應(yīng)用,包括識別雜草、分類土地覆被、識別植物類型、計數(shù)果實以及檢測植物葉片病變等諸多問題[4]。
隨著GPU 的廣泛使用,各種圖像處理應(yīng)用中使用深度學(xué)習(xí)技術(shù)的比例也極大增加,使得利用深度學(xué)習(xí)技術(shù)智能診斷植物葉片的病蟲害類型成為了可能,對智慧農(nóng)業(yè)中的智能農(nóng)業(yè)管理具有重要意義。但是,其重點是使用不同的網(wǎng)絡(luò)架構(gòu),很少關(guān)注不同植物的病變。因此基于深度學(xué)習(xí)的葉片植物病變分類技術(shù)的詳細(xì)綜述存在研究空白。
在近期提出的針對各種植物病變的研究中,深入調(diào)研基于深度學(xué)習(xí)技術(shù)的可用性及其對農(nóng)業(yè)管理的啟示是文章的研究動機。早期的一些工作主要利用圖像處理技術(shù)來識別植物葉片病變。國外對植物果實和葉片病變進(jìn)行了另一項調(diào)查,主要包括利用傳統(tǒng)的特征提取和分類模型。
文章重點介紹了不同的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,對基于深度學(xué)習(xí)的方法進(jìn)行了全面回顧。文章闡述了針對各種蔬菜、水果和雜類植物葉片病變的深度學(xué)習(xí)技術(shù),概括了近年來提出的用于檢測田間感染葉片病蟲害程度的深度學(xué)習(xí)方法,分別從植物類型、數(shù)據(jù)采集及預(yù)處理、方法設(shè)計(訓(xùn)練與測試)、評估指標(biāo)和性能等方面,對不同類型的卷積神經(jīng)網(wǎng)絡(luò)方法及其對農(nóng)業(yè)管理的啟示進(jìn)行了分析。
Plant Village 是使用計算機視覺識別植物葉片病變領(lǐng)域中使用最廣泛的數(shù)據(jù)集[5]。該數(shù)據(jù)集由美國賓夕法尼亞州立大學(xué)采集,其收集病蟲害和健康作物中收集成千上萬的圖像,包含來自24 種不同植物的葉圖像,分為55 類。大多數(shù)研究者使用Plant Village 數(shù)據(jù)集作為圖像源訓(xùn)練、測試和驗證數(shù)據(jù)。然而,這些圖像是在不同的光照和背景條件下拍攝的,給研究人員帶來了更大的挑戰(zhàn)。
使用深度學(xué)習(xí)技術(shù)意味著需要大量數(shù)據(jù)來訓(xùn)練模型。通常而言,擁有成千上萬的訓(xùn)練圖像很容易達(dá)到高精度。與植物病變識別相關(guān)的其他問題相比,收集大量的真實野外數(shù)據(jù)是一個很大的困難。因此,要使用一些適當(dāng)?shù)念A(yù)處理方法豐富圖像數(shù)據(jù)。調(diào)研國內(nèi)外主要農(nóng)作物病蟲害公開數(shù)據(jù)集,包括數(shù)據(jù)集規(guī)模、來源、用途以及農(nóng)作物的類型和主要病蟲害的種類等,例如農(nóng)作物種類有大豆、咖啡、大米、豆類、小麥、玉米和其他水果品種等,病蟲害類型有赤霉病、白粉病等。此外,調(diào)研農(nóng)作物數(shù)據(jù)集圖像預(yù)處理方法。該操作對原始數(shù)據(jù)集進(jìn)行了大量的平移、縮放、倒置等擴(kuò)充方法,從而擴(kuò)充訓(xùn)練數(shù)據(jù)集[6]。
通過觀察主要的經(jīng)濟(jì)作物,確定其病蟲害癥狀下存在的圖像特征。構(gòu)建農(nóng)作物病蟲害的智能診斷模型,從而達(dá)到智能診斷農(nóng)作物的目的,判斷農(nóng)作物是否生病以及生病的類型。
文章采用了一種由預(yù)先訓(xùn)練和從零開始訓(xùn)練的CNN 模型組成的方法,識別蘋果葉片病變的4 種嚴(yán)重程度。為了節(jié)省計算量,通過大規(guī)模常規(guī)圖像數(shù)據(jù)集Image Net 進(jìn)行預(yù)訓(xùn)練,然后將模型遷移到蘋果葉病蟲害識別中,具體而言,將VGG16、VGG19、inception -v3和ResNet50 進(jìn)行微調(diào)。將不同的病蟲害類型直接當(dāng)成不同的圖像類別,采用分類任務(wù)中常用的交叉熵?fù)p失函數(shù)來進(jìn)行訓(xùn)練。初始學(xué)習(xí)率為0.01,優(yōu)化算法采用隨機梯度下降法[7],其識別準(zhǔn)確率如表1 所示。
今年,青海油田計劃生產(chǎn)66億立方米天然氣,比上年預(yù)計增產(chǎn)1.99億立方米。東坪、尖北氣田屬于基巖氣藏,埋藏深、鉆井周期長、產(chǎn)建速度慢、開發(fā)難度大。為了彌補今冬明春天然氣資源保供區(qū)的缺口,青海油田追加了采氣三廠產(chǎn)氣量,產(chǎn)能建設(shè)計劃由1.85億立方米增加至2.35億立方米,并一改以往產(chǎn)能建設(shè)冬休的機制,采取不停工連續(xù)生產(chǎn)模式,推進(jìn)天然氣產(chǎn)能建設(shè)提速提效,厚實天然氣資源根基。
表1 不同網(wǎng)絡(luò)準(zhǔn)確率 單位:%
結(jié)果表明,傳統(tǒng)機器學(xué)習(xí)的分類方法僅能取得70%左右的準(zhǔn)確率,而試驗所驗證的深度學(xué)習(xí)方法普遍可以取得80%以上的病蟲害識別準(zhǔn)確率,大幅領(lǐng)先于傳統(tǒng)的機器學(xué)習(xí)分類方法。此外,對比深度學(xué)習(xí)的不同神經(jīng)網(wǎng)絡(luò),VGG16 的準(zhǔn)確率略高于90%,是所有模型中準(zhǔn)確率最高的,為將來農(nóng)作物病蟲害智能識別模型的設(shè)計提供了思路,更加準(zhǔn)確地識別病蟲害性能意味著更加有利于農(nóng)業(yè)管理人員制訂相應(yīng)的防治措施,從而減少損失。然而,在相同的訓(xùn)練和測試機制下,從頭訓(xùn)練的8 層CNN 準(zhǔn)確率只有80%。
深度學(xué)習(xí)技術(shù)是圖像處理領(lǐng)域的熱門話題。通過利用人工智能技術(shù)建立智能診斷模型,檢測農(nóng)作物病蟲害為農(nóng)業(yè)智能管理提供輔助決策,從而探索病蟲害提前干預(yù)的措施和方法。利用智能化的管理手段,減少病蟲害的發(fā)生概率。
近年來,由于深度學(xué)習(xí)技術(shù)在基于圖像處理的應(yīng)用領(lǐng)域具有許多優(yōu)勢,在農(nóng)業(yè)上的應(yīng)用大大增加。盡管最近有幾十種基于深度學(xué)習(xí)方法識別植物葉片病變,但仍存在一些挑戰(zhàn),比如使用真實世界數(shù)據(jù)、自動背景消除以及使用手持設(shè)備來訓(xùn)練和測試包含數(shù)百萬個參數(shù)的復(fù)雜卷積神經(jīng)網(wǎng)絡(luò)。大量已發(fā)表的研究對Google Net、VGG Net 或Alex Net 等預(yù)先訓(xùn)練過的網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)進(jìn)行了微調(diào)。
研究發(fā)現(xiàn),與從頭訓(xùn)練網(wǎng)絡(luò)的情況相比,基于遷移學(xué)習(xí)的方法產(chǎn)生了更好的識別精度。這些技術(shù)的一些明顯優(yōu)勢如下。
1)該方法允許設(shè)計基于端到端特性學(xué)習(xí)的解決方案,從而簡化所提出的方法架構(gòu)。最近在這一領(lǐng)域提出的深度網(wǎng)絡(luò)對幾乎所有類型的植物都有很高的識別精度(一般在90%以上),大幅優(yōu)于傳統(tǒng)的機器學(xué)習(xí)分類方法。
2)一些研究人員已經(jīng)將高光譜、熱成像和多光譜成像用于識別植物葉片病蟲害。目前,高光譜成像在檢測應(yīng)激類型、健康狀況、蟲害、螨蟲和雜草等方面顯示出了很有前景的結(jié)果,但需要借助傳統(tǒng)的機器學(xué)習(xí)模型。卷積神經(jīng)網(wǎng)絡(luò)為所有基于圖像處理的應(yīng)用提供了一個新方向,這些網(wǎng)絡(luò)可以用于未來的高光譜作物圖像,特別是檢測早期的病蟲害。
3)合理利用新型計算機新型圖片數(shù)據(jù)處理技術(shù),充分運用病蟲害數(shù)據(jù)集。Plant Village 是目前使用計算機視覺識別植物葉片病變領(lǐng)域中使用最廣泛的數(shù)據(jù)集,除此之外還有其他許多公開的數(shù)據(jù)集,涉及的植物種類包括大豆、咖啡、大米、豆類、小麥、玉米和其他水果,病蟲害類型有赤霉病、白粉病等。隨著工作的推進(jìn),數(shù)據(jù)集的內(nèi)容也會逐漸擴(kuò)大,包含的植物種類和病蟲害類型也會更加全面。
可以從以下幾個方向監(jiān)測干預(yù)和管理病蟲害。
1)利用新型計算機技術(shù),充分運用數(shù)據(jù)集。運用先進(jìn)的計算機圖片處理技術(shù),提高病蟲害甄辨的速度?;贑NN 模型的可用性使開發(fā)工作快速和容易,只需修改、再訓(xùn)練最后幾層,就可以根據(jù)目標(biāo)應(yīng)用對給定的網(wǎng)絡(luò)進(jìn)行優(yōu)化,從而節(jié)省訓(xùn)練整個神經(jīng)網(wǎng)絡(luò)模型的時間,在實際應(yīng)用中可大幅縮減訓(xùn)練學(xué)習(xí)時間,為提高農(nóng)業(yè)管理效率提供了技術(shù)支撐。
2)提高監(jiān)測圖片的樣本容量,國際公開的病蟲害數(shù)據(jù)庫是很好的內(nèi)容借鑒,但可能會存在地域差異,造成病蟲害階段性診斷和分析的差異。當(dāng)樣本實踐的內(nèi)容和樣本本身的容量對比越大時,差異度就更加明顯,監(jiān)測更加準(zhǔn)確。但是擴(kuò)大樣本數(shù)據(jù)需要根據(jù)自身的需求運用符合國情的病蟲害數(shù)據(jù)庫,因此有必要構(gòu)建和完善我國病蟲害的數(shù)據(jù)庫。只有不斷完善數(shù)據(jù)庫內(nèi)容,病蟲害數(shù)據(jù)分析才會更加準(zhǔn)確,監(jiān)管措施才會更加地完善。
3)需要完善調(diào)研農(nóng)作物數(shù)據(jù)集圖像預(yù)處理方法。有了大量的數(shù)據(jù)庫后,需要對數(shù)據(jù)具體分析、提取特征。只有采用合理的方法,才能更快、更準(zhǔn)確地提取植物病蟲害的特征。可能涉及對原始數(shù)據(jù)集進(jìn)行大量的平移、縮放、倒置等擴(kuò)充方法,因此擴(kuò)充訓(xùn)練數(shù)據(jù)集十分必要。
4)運用多種圖片檢測方法,提高病蟲害的診斷準(zhǔn)確率。同一植物、不同病蟲害類型的生命周期不同,如何將智能識別的病蟲害結(jié)果用于優(yōu)化智能化的農(nóng)業(yè)管理,是亟待解決的問題。因此需要能檢測和分類病蟲害的所有階段、嚴(yán)重程度的深度學(xué)習(xí)模型,以便能在早期發(fā)現(xiàn)和治愈病變。利用實操圖片分析數(shù)據(jù),對病蟲害的確切時期進(jìn)行診斷分類,提出針對早、中、晚期不同的診治方法。充分考慮植物病蟲害的特征和影響、當(dāng)?shù)氐慕?jīng)濟(jì)水平和環(huán)境特征,再結(jié)合生物防治、化學(xué)防治、機械防治等防治措施對病蟲害進(jìn)行干預(yù),從而選擇最優(yōu)防治方案。
通過大量的文獻(xiàn)調(diào)研和試驗驗證發(fā)現(xiàn),應(yīng)用深度學(xué)習(xí)技術(shù)進(jìn)行植物病蟲害識別所面臨的一些挑戰(zhàn)如下。
1)缺乏大型數(shù)據(jù)集一直是深度學(xué)習(xí)方法在植物葉片脅迫識別領(lǐng)域應(yīng)用的一大障礙。雖然已經(jīng)公開了包含數(shù)千張圖片的大型數(shù)據(jù)集Plant Village 供研究者使用,但是包含真實應(yīng)用場景、面向不同農(nóng)作物品種不同病蟲害類型的數(shù)據(jù)集仍然較為缺乏。
2)大多數(shù)作者使用了來自公開數(shù)據(jù)集剪切之后的圖像,而來自真實場景的原始圖像數(shù)據(jù)則不可避免地會存在很多噪聲。一些研究者使用了來自雜亂背景的圖像集,但收集的小數(shù)據(jù)集也需要經(jīng)過必要的預(yù)處理。因此提出了基于深度學(xué)習(xí)方法,利用實驗室的圖像模擬不同光照環(huán)境的植物葉片圖像,評估不同角度和距離的變化,識別病蟲害精度的影響。使用該方法必須對自采集的野外圖像進(jìn)行預(yù)處理,以提高圖像的編碼精度。
3)如何將農(nóng)作物病蟲害智能識別的準(zhǔn)確率與農(nóng)業(yè)管理的技術(shù)政策相結(jié)合是亟待研究的關(guān)鍵問題。同時,在領(lǐng)域?qū)<业膸椭聵?biāo)注收集的數(shù)據(jù)是具有計算機科學(xué)背景的深度學(xué)習(xí)研究人員面臨的另一個問題。
4)植物病害的早期發(fā)現(xiàn)是該領(lǐng)域研究的重要方面。在早期階段發(fā)現(xiàn)被感染的植物,使農(nóng)民能以較低的成本采取糾正措施。相比較而言,采用超廣譜的影像識別已被用于這一場景,但使用熱傳感器和光反射器傳感器在地面捕獲的區(qū)域非常大,使得疾病或感染區(qū)域的精確檢測也成為一個難題。
根據(jù)本調(diào)查所查閱的研究論文以及試驗分析,列出該領(lǐng)域新研究者的一些未來發(fā)展方向,也是未來利用深度學(xué)習(xí)技術(shù)在農(nóng)業(yè)病蟲害管理上的可能研究熱點。
1)一片葉子在同一時間可以受到多種病蟲害的影響。如果寄主已經(jīng)缺乏營養(yǎng)或已經(jīng)存在其他非生物病變,寄主會變得更加脆弱。這種多重病蟲害的共存現(xiàn)象在現(xiàn)實中很常見,但現(xiàn)在的研究還沒有給予過多關(guān)注,現(xiàn)有的文獻(xiàn)很少討論這個問題。因此,可以作為未來的研究方向。
2)深度學(xué)習(xí)網(wǎng)絡(luò)的性能因作物的不同而具有差異,也會因為病蟲害類型的改變而產(chǎn)生變化。如果能搜索一組作物分析其性能,并提供大識別精度的統(tǒng)一深度網(wǎng)絡(luò)是未來的研究方向。
3)隨著深度學(xué)習(xí)模型的不斷改進(jìn),研究人員需尋找最優(yōu)參數(shù)。不同的傳統(tǒng)優(yōu)化算法在高維數(shù)據(jù)上表現(xiàn)不佳。已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)和使用集成學(xué)習(xí)技術(shù)來獲得最優(yōu)參數(shù)相關(guān)問題也是未來的研究方向。
4)充分結(jié)合具體的防治措施,對病蟲害診斷進(jìn)行干預(yù)。利用圖片對病蟲害進(jìn)行分析診斷后,結(jié)合復(fù)雜的社會環(huán)境、當(dāng)?shù)氐慕?jīng)濟(jì)消費水平以及生物多樣性等問題,再充分利用化學(xué)防治、生物防治和物理防治的各自特點進(jìn)行病蟲害診斷工作。