摘要:目的:針對傳統(tǒng)MobileNet-v2模型水稻葉面病害識別過程中出現(xiàn)的準確率低、運行速度慢、特征提取難等問題,提出一種基于改進MobileNet-v2輕量級網(wǎng)絡(luò)的水稻葉面病害識別模型。方法:該模型采用增加注意力機制模塊的結(jié)構(gòu)方法增強圖像的特征提取,然后將預(yù)訓(xùn)練好的權(quán)重參數(shù)遷移到改進的模型中,進而對水稻4種葉面病害進行識別研究。結(jié)果:該模型在50個epoch的訓(xùn)練測試過程中,訓(xùn)練速度和過擬合問題得到了較大的改善,最終測試識別準確率較傳統(tǒng)MobileNet-v2模型準確率提高了7.97%。結(jié)論:該模型在水稻葉面病害識別中準確率較高,識別速度較快,為水稻葉面病害的識別與研究提供了參考和借鑒意義。
關(guān)鍵詞:圖像識別;水稻病害;遷移學(xué)習(xí);MobileNet-v2
中圖分類號:TP391" " " 文獻標志碼:A" " " 文章編號:1008-4657(2024)04-0026-07
0" " " " 引言
水稻是中國農(nóng)業(yè)中的主要糧食作物,它的總產(chǎn)量和平均產(chǎn)量均位居世界第一,是全球三大谷物之一。中國擁有悠久的種植水稻的文化,據(jù)考古發(fā)現(xiàn),7 000年前,河姆渡人就著手馴化野生稻來種植水稻,這一文化在中國發(fā)展史上有著深厚的根基。全球超過38億人口以稻米為主食,而中國更是以稻米為主食,占比高達近60%,而且這一比例還在不斷上升。水稻病害直接影響著水稻的產(chǎn)量和質(zhì)量,因此在農(nóng)業(yè)生產(chǎn)活動中,能夠快速并且準確地識別水稻各類病害從而精準治理尤為關(guān)鍵。
近年來,基于計算機視覺的深度學(xué)習(xí)逐漸成熟并被廣泛推廣應(yīng)用,在自然語言處理、圖像識別、目標檢測、故障診斷等多領(lǐng)域都取得了較好的成果。自20世紀80年代末開始,許多學(xué)者和專家都致力于研究計算機視覺技術(shù)來識別農(nóng)作物病蟲害,其中陳峰等的成果尤為突出,識別率較高[ 1 ]。2012年,Krizhevsky" A等[ 2 ]提出了一種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)(Convolutional" "Neural" "Networks,CNN)模型-AlexNet,最終在ILSVRC(ImageNet" Large" Scale" Visual" Recognition" Challenge)比賽中,將top5的測試錯誤率下降到15.3%。2014年,Simonyan K等[ 3 ]提出VGG系列模型并在當年的Image" Net" Challenge上以top5錯誤率7.32%取得分類任務(wù)第二名,該VGG系列模型中采用了3 × 3的卷積核與2 × 2的池化核,這樣的設(shè)計不僅會讓卷積核感受野保持不變,而且使得模型的參數(shù)減少。在國內(nèi),王軍英[ 4 ]建立BP神經(jīng)網(wǎng)絡(luò)識別模型,對葡萄病的發(fā)生位置、類型、色澤以及主要癥狀進行了評估,獲得較為滿意的識別結(jié)果。劉成[ 5 ]采用傳統(tǒng)圖像特征提取和改進卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合方法,對水稻稻曲病等6種葉面病害進行分類識別,最終取得了較高的分類識別準確度。張建華等[ 6 ]構(gòu)建了基于改進VGG-16卷積神經(jīng)網(wǎng)絡(luò)病害識別模型,通過遷移學(xué)習(xí)共享預(yù)訓(xùn)練模型卷積層和池化層權(quán)值參數(shù),構(gòu)建出新的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型,平均識別準確率達到89.51%。孫俊等[ 7 ]采用改進的MobileNet-v2網(wǎng)絡(luò)結(jié)構(gòu)模型對田間農(nóng)作物葉片病害進行識別,實驗結(jié)果表明,較改進前提高了2.91個百分點。
綜上所述,國內(nèi)外研究者已經(jīng)將卷積神經(jīng)網(wǎng)絡(luò)運用到農(nóng)作物病害分類識別中,且取得了較好的成果,但仍然缺乏能夠較好地識別復(fù)雜背景下準確率較高的水稻病害識別模型。受上述研究啟發(fā),本文以水稻的白葉枯病、稻瘟病、胡麻斑病和東格魯病等葉面病害圖像為基礎(chǔ),研究的重點是如何將深度學(xué)習(xí)與圖像識別深度融合從而提高卷積神經(jīng)網(wǎng)絡(luò)識別的準確率,提出增加注意力機制和遷移學(xué)習(xí)相結(jié)合,以期達到識別速度更快,準確率更高的目標,為研究水稻識別系統(tǒng)提供實驗依據(jù),同時提升了農(nóng)業(yè)生產(chǎn)信息化的效率,有助于智能農(nóng)產(chǎn)品的研究開發(fā)。
1" " " "材料與方法
1.1" " " "試驗平臺
本研究的試驗為Windows64位操作系統(tǒng),內(nèi)存16GB,搭載11th" Gen" Intel(R) Core(TM) i5-1155G7 @ 2.50GHz 2.50 GHz處理器,試驗基于python編程語言,采用TensorFlow深度學(xué)習(xí)開發(fā)框架進行模型的搭建及訓(xùn)練。
1.2" " " " 試驗數(shù)據(jù)
本研究的研究對象為水稻白葉枯病、稻瘟病、胡麻斑病和東格魯病4種葉面病害,并基于病害圖像特征,對其進行準確的分類識別。水稻葉面病害樣本如圖1所示。
通過對水稻葉面病害圖像進行預(yù)處理,包括圖片旋轉(zhuǎn)、鏡像翻轉(zhuǎn),隨機縮放、隨機平移、隨機裁剪、等比例縮放等數(shù)據(jù)增強操作,得到6 682張水稻病害圖像數(shù)據(jù)集,其中訓(xùn)練集5 335張,測試集1 347張,并將樣本數(shù)據(jù)集進行編號分類,制作標簽,標簽0,1,2,3分別代表白葉枯病,稻瘟病,胡麻斑病,東格魯病。最后將圖片尺寸統(tǒng)一化,以JPEG格式導(dǎo)入計算機,構(gòu)建一個完整的水稻病害數(shù)據(jù)集,以便更好地分析和研究水稻葉面病害。數(shù)據(jù)集概述如表1所示。
卷積神經(jīng)網(wǎng)絡(luò)是一個具備深入學(xué)習(xí)圖像特征的前饋神經(jīng)網(wǎng)絡(luò)[ 8-9 ],它能夠從大量輸入數(shù)據(jù)信息中自動提取出更高層次的抽象特征[ 10 ],大大簡化了圖像處理技術(shù)識別作物病害的過程,并且現(xiàn)已被應(yīng)用于多方面[ 11 ],如人臉識別[ 12-13 ]、語音識別[ 14 ]和行人檢測[ 15 ]等,為深度學(xué)習(xí)技術(shù)作出了重要貢獻。卷積神經(jīng)網(wǎng)絡(luò)兼具局部連接和權(quán)值共享兩大特點,局部連接能夠有效地提升圖形的連接性,從而更好地捕捉每個部分的相關(guān)信息,而權(quán)值共享則能夠大大簡化操作過程,減少訓(xùn)練計算的復(fù)雜度。
卷積神經(jīng)網(wǎng)絡(luò)通常由卷積層、池化層和全連結(jié)層三個部分構(gòu)成,它們共同形成了網(wǎng)絡(luò)系統(tǒng)的基本架構(gòu)。
卷積層作為卷積神經(jīng)網(wǎng)絡(luò)中最為核心的結(jié)構(gòu)部分,能實現(xiàn)對輸入圖像的特征提取,運算公式如式(1)所示。
y = f(y*k + n)(1)
式中:f( )(Rctified linear Unit, ReLU)為激活函數(shù);k代表卷積核的個數(shù);y代表卷積層的特征圖;n為常數(shù)項。
池化層也稱下采樣層,負責(zé)降低特征圖像本身的維數(shù),從而縮短算法訓(xùn)練計算時間,通常包括最大池化(max pooling)、平均池化(average pooling)、最小池化(minimum pooling)。本文采用平均池化操作處理方法,運算公式如式(2)所示,其操作示意圖如圖3所示。
Z = ei(2)
式中:ei為區(qū)域R內(nèi)每個神經(jīng)元的激活值。
全連接層是一種用于預(yù)測結(jié)果的層,它能夠?qū)⒕矸e層學(xué)習(xí)到的抽象特征轉(zhuǎn)換為可分類的輸出,并使用Softmax函數(shù)激活每一層,以減少過擬合的可能性,其表達式如式(3)所示。
softmax(x) = (3)
ReLU函數(shù)是卷積神經(jīng)網(wǎng)絡(luò)中最為常用的激活函數(shù),其存在單側(cè)抑制,只有輸入的數(shù)值為正數(shù)時,其神經(jīng)元才會被激活,反之則為0;其特點是收斂速度更快,能較好地處理好梯度消失、爆炸等問題,是一個分段函數(shù),其函數(shù)表達式如式(4)所示。
f(x) = x(x > 0)0(x < 0)(4)
1.4" " 遷移學(xué)習(xí)
遷移學(xué)習(xí)是一項高效的機器學(xué)習(xí)方式,它能夠?qū)⒁呀?jīng)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)模型參數(shù)轉(zhuǎn)移到新的目標領(lǐng)域,從而大大減少對訓(xùn)練樣本及硬件計算能力的要求,極大地提高圖像數(shù)據(jù)有效分類的效率[ 16 ],從而為解決訓(xùn)練數(shù)據(jù)集容易產(chǎn)生的過擬合問題提供了強有力的幫助。
本研究采用了一個新的方法,將已經(jīng)訓(xùn)練好的模型當作預(yù)訓(xùn)練模型,并結(jié)合模型微調(diào)的學(xué)習(xí)方式,充分利用MobileNet-v2預(yù)訓(xùn)練模型在公開數(shù)據(jù)集上學(xué)到的知識,結(jié)合遷移學(xué)習(xí)方式將其用在水稻葉面病害圖像識別上,以期望能夠有效地減少訓(xùn)練時間,進一步提高網(wǎng)絡(luò)模型的訓(xùn)練效率,并最終解決水稻葉面病害識別問題。
1.5" " 改進卷積神經(jīng)網(wǎng)絡(luò)病害模型構(gòu)建
MobileNet-v2通過采用深度可分離卷積,可以在不影響精度的前提下,大范圍減小參數(shù)量和運算量,進而提升模型訓(xùn)練運算速度。在本研究中,針對水稻葉面病害圖像特征提取的復(fù)雜性和分類的準確性低等問題,基于使用數(shù)據(jù)集訓(xùn)練MobileNet-v2模型來識別水稻葉面病害信息,改進一種新的網(wǎng)絡(luò)結(jié)構(gòu)模型,初始化卷積核和偏置參數(shù),并將這些信息輸入到一種新的卷積神經(jīng)網(wǎng)絡(luò)中,如圖4所示。
針對過擬合現(xiàn)象的問題,采用增加Dropout層,同時也增加了識別的準確率。
針對數(shù)據(jù)特征提取復(fù)雜性問題,增加了注意力機制模塊,從而提高了圖片特征的提取能力,并且更好地表達圖片特征信息。
針對數(shù)據(jù)的分類準確性問題,提出增加遷移學(xué)習(xí)的思想,改進后訓(xùn)練模型以提高識別水稻葉面病害的準確性,經(jīng)過50次迭代訓(xùn)練,它能夠更準確地識別圖像特征。
2" " 實驗結(jié)果與分析
本研究中使用分類準確率來評價實驗方法的好壞[ 17 ],準確率計算公式如式(5)所示。
Acc = m / n(5)
式中:m表示正確分類的樣本數(shù)量;n表示測試圖像的總樣本數(shù)量。
損失率采用交叉熵損失函數(shù)方法,其可以有效地迭代更新網(wǎng)絡(luò)參數(shù),使損失函數(shù)進一步縮小,最終接近于0,從而訓(xùn)練出更準確的水稻病害識別模型。MobileNet-v2水稻病害模型實驗結(jié)果如圖5所示,改進后的模型運行結(jié)果如圖6所示。
圖5中,epoch初始值設(shè)置為50,網(wǎng)絡(luò)優(yōu)化器采用隨機梯度下降,起始學(xué)習(xí)率設(shè)置為0.001,訓(xùn)練集準確率為train accuracy,訓(xùn)練集代價函數(shù)為train loss,測試集準確率為validation accuracy,測試集代價函數(shù)為validation loss,這些參數(shù)均被用于優(yōu)化網(wǎng)絡(luò)的性能,以達到最優(yōu)化的效果。隨著訓(xùn)練次數(shù)的不斷增加,訓(xùn)練準確率和驗證準確率呈上升趨勢,訓(xùn)練損失率和驗證損失率呈下降趨勢。
在new-mobile模型訓(xùn)練過程中,圖6的折線圖可以反映出訓(xùn)練階段各個參數(shù)的收斂和飽和等趨勢走向,直觀地看出準確率呈上升趨勢并逐漸向1靠攏,代價函數(shù)呈下降趨勢并逐漸接近于0。通過采用遷移學(xué)習(xí)方法,我們可以看到代價函數(shù)收斂速度較快,曲線的變化趨勢也相對平緩,當訓(xùn)練批次逐漸增加時,訓(xùn)練效率和準確率都逐漸趨向于穩(wěn)定,且未出現(xiàn)較大波動,這表明該模式具有較強的泛化水平,能夠較好地識別4種水稻葉面病害種類。為了解決過擬合問題,在全連接層中增加Dropout層,從而大大提高了訓(xùn)練的準確率。為了增強圖片特征提取,加快網(wǎng)絡(luò)訓(xùn)練速度,同時增加了注意力機制和使用ReLU激活函數(shù),為客觀全面地評價本文所提出的網(wǎng)絡(luò)模型的性能。
不同網(wǎng)絡(luò)模型對比如表2所示。
本研究使用new-mobile模型對水稻葉面病害圖像種類識別研究,模擬訓(xùn)練50次,結(jié)合表2結(jié)果可以看出,基于改進MobileNet-v2網(wǎng)絡(luò)模型,采用增加注意力機制和遷移學(xué)習(xí)相結(jié)合的網(wǎng)絡(luò)結(jié)構(gòu),相對于傳統(tǒng)的MobileNet-v2網(wǎng)絡(luò)模型,new-mobile模型獲得較好的評價指標,模型驗證準確率高達90.91%,驗證損失率低達0.71%,相對于傳統(tǒng)MobileNet-v2網(wǎng)絡(luò)模型驗證準確率提升7.97個百分點,說明該模型識別準確率較高,實用性較好,模型切實有效,適用于水稻葉面的病害識別。
3" " 結(jié)論
本研究中,針對水稻葉面病害圖像特征提取復(fù)雜,識別準確率低等問題,提出了一種基于改進MobileNet-v2的水稻病害圖像識別方法模型。模型訓(xùn)練結(jié)果表明,本文所提出的改進模型與傳統(tǒng)的MobileNet-v2網(wǎng)絡(luò)模型相比,在一定范圍內(nèi),隨著迭代次數(shù)的增加,識別準確率越高,損失率越低,能夠較好地識別水稻常見葉面病害。因此,這種new-mobile模型能夠有效地解決傳統(tǒng)植物病害識別模型的準確率低和復(fù)雜環(huán)境源圖像采集等問題,從而可以為移動端設(shè)備提供有效的技術(shù)支持,為后續(xù)的植物病害研究提供參考價值。
此外,該研究模型是對水稻葉面病害進行單方面農(nóng)作物進行訓(xùn)練和測試,后期將進一步研究數(shù)據(jù)種類龐大的數(shù)據(jù)集,以達到對更多植物病害識別,并將其用于移動設(shè)備上,便于農(nóng)戶用于田間實際植物病害識別。
參考文獻:
[1]陳峰,谷俊濤,李玉磊,等.基于機器視覺和卷積神經(jīng)網(wǎng)絡(luò)的東北寒地玉米害蟲識別方法[J].江蘇農(nóng)業(yè)科學(xué),2020,48(18):237-244.
[2]Krizhevsky A,Sutskever I,Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Advances in Neural Information Processing Systems,2012,25(2):1097-1105.
[3]Simonyan K,Zisserman A. Very deep convolutional networks for large-scale image recognition[Z]. arXiv preprint arXiv,2014: 1409-1556.
[4]王軍英.基于BP神經(jīng)網(wǎng)絡(luò)的葡萄病害診斷系統(tǒng)研究[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2013(8):30-33.
[5]劉成.基于機器學(xué)習(xí)的水稻病害識別算法的研究[D].合肥:安徽大學(xué),2018.
[6]張建華,孔繁濤,吳建寨,等.基于改進VGG卷積神經(jīng)網(wǎng)絡(luò)的棉花病害識別模型[J].中國農(nóng)業(yè)大學(xué)學(xué)報,2018,23(11):161-171.
[7]孫俊,朱偉棟,羅元秋,等.基于改進MobileNet-V2的田間農(nóng)作物葉片病害識別[J].農(nóng)業(yè)工程學(xué)報,2021,37(22):161-169.
[8]Huang Gao,Liu Zhuang,Laurens V D M,et al. Densely connected convolutional networks[C]. The IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2017:2261-2269.
[9]Gu Jiuxiang,Wang Zhenhua,Kuen J,et al. Recent advances in convolutional neural networks[J]. Pattern Recognition,2018, 77:354-377.
[10]Lecun Y,Bengio Y,Hinton G. Deep learning[J]. Nature,2015,521(7553):436-444.
[11]邱靖,劉繼榮,曹志勇,等.基于卷積神經(jīng)網(wǎng)絡(luò)的水稻病害圖像識別研究[J].云南農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)),2019,34(5):884-888.
[12]邵蔚元,郭躍飛.多任務(wù)學(xué)習(xí)及卷積神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用[J].計算機工程與應(yīng)用,2016,52(13):32-37.
[13]王衛(wèi)民,唐洋,張健,等.基于卷積神經(jīng)網(wǎng)絡(luò)特征融合的人臉識別算法[J].計算機與數(shù)字工程,2020,48(1):88-92.
[14]王嘉偉.基于卷積神經(jīng)網(wǎng)絡(luò)的語音識別研究[J].科學(xué)技術(shù)創(chuàng)新,2019(31):71-73.
[15]付友,左迅,楊凡,等.基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型的行人檢測設(shè)計[J].信息技術(shù),2021(5):34-38.
[16]馮曉,李丹丹,王文君,等.基于輕量級卷積神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)的小麥葉部病害圖像識別[J].河南農(nóng)業(yè)科學(xué),2021,50(4):174-180.
[17]王圣昊.基于卷積神經(jīng)網(wǎng)絡(luò)的番茄葉片病害分類研究[D].長春:吉林農(nóng)業(yè)大學(xué),2021.
Rice Disease Recognition Based on Improved
MobileNet Lightweight Network
ZHENG Chao, ZHANG Huamin
(College of Mechanical Engineering, Anhui Science and Technology University, Fengyang 233100, China)
Abstract:Objective: To address the problem of the conventional MobileNet-v2 model in the recognition of rice leaf diseases, including its low recognition accuracy, sluggish running speed, and challenging feature extraction, a rice leaf disease recognition model based on improved MobileNet-v2 lightweight network was proposed. Methods: In this model, the method of adding attention mechanism module is used to enhance image feature extraction, and then the weight parameters of pre-trained model were transferred to the improved model to identify the four leaf diseases of rice. Results: The training speed and overfitting issues were significantly reduced throughout the training and testing of the new-mobile model over 50 epochs, and the final test recognition accuracy was 7.3% higher than that of the conventional MobileNet-v2 model. Conclusions: The new mobile model is more accurate and quicker in recognizing rice leaf diseases, which provides a reference and significance for identifying and researching of rice leaf diseases.
Key words:image recognition; rice disease; transfer learning; MobileNet-v2