摘要:針對羊肚菌育種過程中存在菌絲生長手工與目視測量精度差、識別效率低的問題,利用深度學習技術,研究羊肚菌菌絲生長程度的識別技術,通過采集和處理菌種培養(yǎng)過程中的圖像信息,來建立羊肚菌菌絲生長程度的識別模型,并對識別模型進行優(yōu)化,篩選出最佳模型。首先采用MobileNetV3large、MobileNetV3small 以及ResNet50模型來構建識別模型;接著提出了一種模型改進方法來提升識別模型的準確率;最后,利用模型剪枝方法對改進后的模型進行輕量化處理,通過對比剪枝前后模型的準確率、預測速度以及模型大小,在盡可能不損失準確率的情況下提升模型的預測速度。研究結果表明,在允許損失識別準確率的范圍內,MobileNetV3large模型的識別準確率最高,預測速度最快,實現了對菌絲生長程度的精準識別和判斷,提高了識別工作效率,這對于推動羊肚菌產業(yè)的規(guī)?;l(fā)展、提高經濟效益具有重要意義。
關鍵詞:深度學習;圖像識別;羊肚菌菌絲;識別模型
中圖分類號:S181;S966.16 文獻標識碼:A 文章編號:1002-204X(2025)01-0062-05
doi:10.3969/j.issn.1002-204x.2025.01.010
羊肚菌(Morchella esculenta. (L.) Pers.)是一類著名的食藥同源真菌,是世界上珍貴的稀有食用菌之一[1-2]。其香味獨特,營養(yǎng)豐富,功能齊全,食效顯著,富含人體所需的多種氨基酸和天然物質,口感脆嫩、香味獨特,其含有的活性成分具有抗病毒、抗腫瘤、調節(jié)身體免疫力、提高機體抗性等作用,具有較高市場價值和較大發(fā)展?jié)摿3-6]。隨著我國羊肚菌產業(yè)的迅猛發(fā)展,受到了科研機構、龍頭企業(yè)、種植大戶的廣泛關注,栽培規(guī)模不斷擴大,市場供應緊張狀況得到了有效改善[7]。盡管羊肚菌作為一種新興的食用菌栽培品種展現出潛力,但與傳統(tǒng)主流食用菌品種相比,在優(yōu)質種質資源的篩選、標準化生產流程的建立以及確保穩(wěn)定高產方面,仍具有顯著差距。因此,迫切需要加大對羊肚菌產業(yè)相關基礎與應用技術研究的投入,以保障該產業(yè)的持續(xù)健康發(fā)展。其中,優(yōu)良羊肚菌菌種選育與創(chuàng)制,成為影響我國羊肚菌產量及其穩(wěn)定性的重要因素之一[8]。蔡英麗等[9]對47 株羊肚菌菌株進行栽培適應性分析,以獲得適宜在武漢栽培的菌株。因此,羊肚菌育種專家的首要職責之一,便是提升羊肚菌的育種技術,開發(fā)出快速、科學且可量化的評估手段,以篩選出既高產又優(yōu)質的羊肚菌品種。
菌絲體作為食用菌的營養(yǎng)器官,負責從基質中獲取營養(yǎng),同時也是與外部環(huán)境之間的交互界面,其生長發(fā)育的好壞,直接影響菌種的培育,對食用菌栽培生產具有非常大的影響。然而,在羊肚菌菌絲的培養(yǎng)環(huán)節(jié)中,當前仍依賴于手工及視覺評估,缺乏一種高效、準確且可量化的測量工具,這相應地提升了對檢驗人員的專業(yè)要求。人工監(jiān)控菌絲生長狀況時,常會遇到觀察失誤、遺漏重要信息、菌絲見光,以及因未能及時篩選而導致的培養(yǎng)周期延長等問題。鑒于羊肚菌產業(yè)的實際需求,研發(fā)一種能夠識別菌絲生長階段的技術,通過收集并分析菌種培養(yǎng)過程中的圖像,達到精確判斷羊肚菌菌絲生長程度的目的,從而取代傳統(tǒng)的手工測量方式,對于推動羊肚菌產業(yè)實現規(guī)模化發(fā)展、提升經濟收益具有重大意義。
隨著機器學習的出現,推動了其在眾多領域的深入探索,其中也涉及農業(yè)領域。而深度學習是機器學習的一個重要分支,它是在統(tǒng)計機器學習、人工神經網絡等算法模型基礎上,結合當代大數據和大算力的發(fā)展而演化出來的。由于計算機運算能力的持續(xù)增強、大數據的廣泛應用以及新穎理論與算法的涌現,深度學習技術已實現廣泛應用和發(fā)展。2021 年,周惠汝等[10]利用深度學習的圖像識別技術,實現了農作物病害的自動快速診斷。2024 年,高發(fā)瑞等[11]基于農業(yè)大數據和深度學習提出改進的YOLO v8 雜草檢測模型,該模型具有更少的參數和計算量,同時克服了現有稻田中雜草識別方法的局限性,為稻田中的雜草控制工作提供技術支持。2024 年,宋光濤[12]提出了一種基于深度學習的農業(yè)機械自動化控制系統(tǒng),綜合運用卷積神經網絡、長短期記憶網絡等深度學習模型,實現了農業(yè)生產環(huán)境的智能感知、自主決策與精準控制。利用機器視覺的識別模式正成為一種流行趨勢,它為識別菌絲生長程度的工作開辟了新的路徑。本研究使用MobileNetV3 系列模型和ResNet50 模型對羊肚菌菌絲生長程度進行識別,并對模型進行優(yōu)化,提高羊肚菌菌絲生長程度識別工作的效率,為指導羊肚菌產業(yè)穩(wěn)定發(fā)展提供理論支撐。
1 材料與方法
1.1 數據采集
本實驗所用的羊肚菌菌絲圖像數據,均來自寧夏農林科學院農業(yè)經濟與信息技術研究所實驗室,使用手機拍攝的方式完成整個菌絲生長階段的圖像數據采集。羊肚菌菌絲培養(yǎng)在菌種培養(yǎng)室中進行,整個過程確保無菌、避光,并將溫度維持在18~22 ℃范圍內。采集羊肚菌菌絲圖像做到圖像背景和光照統(tǒng)一、圖像識別目標個數統(tǒng)一、識別目標大小統(tǒng)一、圖像分辨率統(tǒng)一。
通過手機拍攝的方式,完成了不同生長程度的菌絲圖像數據采集,將采集后的圖像數據經過整理、清洗后建立了羊肚菌菌絲生長樣本數據集,剔除了部分重復、模糊、細節(jié)丟失等圖像數據,避免其在后期影響模型訓練的精度。接著,利用GitHub開源的樣本標注工具,對已建立的羊肚菌菌絲生長樣本數據集中的圖像數據進行標注,標注后的圖像數據可為羊肚菌菌絲識別模型的訓練提供豐富的“養(yǎng)料”。如表1 所示,該數據集涵蓋了菌絲生長的四個階段,總計807 張圖像,且每個生長階段的圖像數量均超過100 張。
1.2 數據增強
鑒于收集到的菌絲圖像數據數量有限,運用深度學習技術進行神經網絡模型訓練時,容易發(fā)生過度擬合現象,進而影響模型在實際識別任務中的表現,使其效果不佳。為了避免出現這種情況,采用數據增強的方法來增加羊肚菌菌絲數據集的數據量,同時保證數據的多樣性。在訓練識別模型之前,本文先對樣本數據集實施了數據增強處理,以此來實現數據集的擴展。這里所采用的數據增強技術包括對圖像進行旋轉、翻轉操作,以及顏色變換三種方法。
圖像的旋轉和翻轉指的是對圖像進行幾何變換,即將圖像以某一固定點為中心進行一定角度的旋轉或者直接翻轉,達到圖像在方向上的調整。圖像的翻轉通常包括水平翻轉和垂直翻轉,水平翻轉相當于鏡像反射,而垂直翻轉則是將圖像上下顛倒,這種變換可以增加數據集的多樣性,尤其是在處理對稱性較強的圖像時。圖像的旋轉是指以圖像的中心為原點,順時針旋轉某一任意角度,這種操作通常涉及將圖像的每個像素點繞圖像中心進行旋轉。假設要將圖像中的某個點(x,y)繞圖像中心旋轉一個角度茲,那么旋轉后的坐標(x',y')可以通過以下公式計算:
x'=xcos(Φ)-ysin(Φ)
y'=ysin(Φ)-ycos(Φ)
這里,x 和y 是原始坐標,x' 和y' 是旋轉后的坐標,而Φ是旋轉角度(通常以弧度為單位)。這種變換可以模擬菌絲在不同視角下的觀察效果,增加模型對角度變化的適應性。
顏色變換涉及調整圖像的顏色屬性,如亮度、對比度和飽和度等。通過改變這些屬性,可以模擬不同的光照條件和色彩環(huán)境,增強模型對顏色變化的魯棒性。
通過采用以上三種數據增強方法,圖像數據的數量由原來的807 張增加到了3 228 張,這將有助于提升菌絲識別模型的泛化性和魯棒性。
1.3 數據集劃分
在深度學習模型的訓練流程中,一般會按照一定比例將數據集分割成三個部分,分別是用于模型學習的訓練集、用于模型驗證的驗證集,以及用于評估模型性能的測試集。訓練集作為模型的輸入數據,是用于模型擬合的數據樣本,通過這些數據來調整模型的參數,使模型能夠從菌絲數據中學習到特征。驗證集不參與模型參數的更新,但用于在訓練過程中評估模型的性能,選擇表現最佳的模型,并監(jiān)控模型的過擬合情況。測試集在訓練過程中完全不參與,只用來評估模型的實際性能,反映模型在真實應用中的表現。本文實驗中選取7∶1∶2 的比例完成數據集的劃分。
2 羊肚菌菌絲生長程度識別模型構建
本文使用ResNet50、MobileNetV3large和Mobile-NetV3small 這三種深度學習神經網絡模型進行對比試驗,并在訓練模型時,均采用遷移學習的方法,利用預訓練模型來加快模型訓練速度,從而更快地得到最終的識別模型。
2.1 模型構建方案
本文模型構建的具體方案如下:
(1)選取預訓練模型。采用遷移學習的方法,直接調用開源的預訓練模型在自建的羊肚菌菌絲生長樣本數據集上來訓練菌絲識別模型。
(2)加載預訓練模型和數據集開展模型訓練。在訓練模型過程中,通過查看訓練過程日志文檔,實時監(jiān)測模型的收斂狀態(tài),并及時調整模型參數,使模型能夠快速收斂,達到最佳訓練效果。
(3)模型量化。為了提升模型預測速度,通過將浮點計算轉化為整形計算,來達到對已訓練模型進行初步優(yōu)化的目的。
(4)模型剪枝。在盡量不損失模型識別精度的前提下,為了簡化模型結構并提升預測效率,對模型實施了剪枝操作。通過分析模型精度隨裁剪比例變化的趨勢,確定恰當的裁剪比例來對模型進行優(yōu)化,并重新開展模型訓練,得到性能更佳的輕量化模型。
2.2 預訓練模型的選取
在預訓練模型的發(fā)展過程中,研究人員和開發(fā)者不斷探索如何使這些模型更好地適應實際的應用場景。在這個過程中,出現了一種使用SSLD(Self-SupervisedLearning with Distillation)蒸餾策略來訓練預訓練模型的方法。這種方法有助于減少模型的計算成本和存儲需求,同時保持較高的性能,從而能更好地適應實際應用場景的需求。本文選取了經過4 000 萬張圖片訓練得到的預訓練模型并使用SSLD 蒸餾策略對模型進行訓練,經過訓練得到的預訓練模型大大提高了模型的識別精度。
2.3 實驗環(huán)境與模型參數設置
本次實驗環(huán)境參數如表2 所示。模型訓練過程中需要設置的訓練參數如表3 所示,Batch Size 表示每次訓練時輸入模型的樣本數量,Learning_rate 表示模型的初始學習率,Epoch 表示模型需要訓練的次數。
2.3.1 損失函數的選擇
LMCL(Large Margin Cosine Loss)損失函數是一種用于提升面部識別模型判別能力的新型損失函數。它通過引入余弦邊緣值m,使得類別分割的標準變得更加嚴格,進而提高模型的分類準確性和特征的區(qū)分性。具體來說,LMCL 損失函數通過對特征向量和權重向量進行L2 歸一化,將softmax 損失函數轉化為余弦損失函數,消除了半徑方向的變化,從而更好地聚焦于角度空間中的決策邊界。在實際應用中,LMCL損失函數能夠顯著增強深度卷積神經網絡(CNN)的特征辨識力度,增加不同類別圖像特征在特征空間的距離,從而提高分類能力。因此,本文為解決菌絲生長程度圖像識別問題,采用LMCL 損失函數,實現類間方差最大化和類內方差最小化的目標。
2.3.2 優(yōu)化器的選擇
在本文的菌絲生長程度圖像識別這個多分類任務中,我們希望網絡的損失函數具有良好的收斂速度,而不會有太大的擺動。動量優(yōu)化器(Momentum Optimizer)是一種在深度學習中廣泛使用的優(yōu)化算法,可以很好地解決此問題。它通過引入動量概念來加速收斂并抑制振蕩,能夠顯著加速模型的訓練過程并提高性能。核心思想是在更新模型參數時,不僅考慮當前的梯度信息,還結合之前累積的歷史梯度信息,從而使得參數更新更加平滑和穩(wěn)定。具體來說,動量優(yōu)化器在每次迭代中,都會將前一次的參數更新乘以一個動量因子(通常小于1),然后再加上當前梯度的更新。這樣,當連續(xù)幾次梯度方向相同時,參數更新會加速;而當梯度方向變化時,之前的更新速度會被減緩,從而避免參數在局部最優(yōu)解附近震蕩。因此,本文采用動量優(yōu)化器來實現模型的快速收斂。
2.4 識別模型結構改進
在MobileNetV3large 和MobileNetV3small 神經網絡中,均采用了全局平均池化(GAP)代替全連接層來降低計算量。GAP是將特征圖的每個元素求平均值,適用于識別占據圖像大面積的物體,但在物體占比較小或背景復雜的情況下,其性能可能受影響。全局最大池化(GMP)則選擇特征圖上的最大值,更注重圖像的特征區(qū)域,有助于減少背景噪聲的影響,提高對目標類中顯著區(qū)域的識別能力。也就是說,GAP更關注整體圖像信息,而GMP更側重于特征區(qū)域的細節(jié)。針對本文中菌絲生長程度的圖像識別任務,由于需要識別的目標相對較小,而全局最大池化能夠專注于物體特征并有效過濾掉無關背景,因此,選擇使用全局最大池化來替代全局平均池化。
對比實驗結果表明,使用了全局最大池化的MobileNetV3small模型相比之前的準確度提升2.16%,如圖1 所示。將這種改進同樣應用于MobileNetV3large模型,提升模型的識別準確率。
2.5 識別模型實驗對比與選擇
將改進后的MobileNetV3large模型、MobileNetV3small 模型以及ResNet50 模型進行實驗對比,并選取Top1 準確率、模型大小、參數規(guī)模、預測速度作為評價模型綜合性能的指標。實驗結果如表4 所示。
實驗結果表明,改進后的MobileNetV3 系列模型能夠在保持輕量化的同時,具有更高的Top1 準確率。綜合考慮輕量化與Top1準確率,本文選擇了改進后的MobileNetV3 系列模型作為羊肚菌菌絲生長程度識別的預測模型。
3 羊肚菌菌絲生長程度識別模型優(yōu)化
3.1 模型優(yōu)化方法
在深度學習模型的應用中,準確度與復雜度是兩個核心考量因素。對于本文的菌絲生長程度識別應用,同樣也不例外。為了適應不同硬件環(huán)境(如手機或者IoT設備),模型輕量化成為研究重點,旨在保持較高精度的同時盡可能地降低計算復雜度,以提升模型的實用性和經濟性。模型剪枝作為深度學習中一種重要的模型壓縮和加速技術,被廣泛用于模型的輕量化處理。根據裁剪的方式不同,模型剪枝可分為非結構化裁剪和結構化裁剪兩種類型。相較于非結構化裁剪,結構化裁剪遵循一定的模式或規(guī)則進行裁剪,這種方式產生的裁剪模式更符合現有硬件架構。這不僅能夠減少模型的大小和計算需求,還能有效利用現有的硬件加速技術,在實際部署中獲得更好的性能提升。
3.2 模型優(yōu)化分析
基于上述模型優(yōu)化方法的研究,本文采用基于強化學習的結構化裁剪方法,對改進后的MobileNetV3small和MobileNetV3large 模型分別進行敏感度分析,計算得到了兩個模型的神經網絡層中卷積核裁剪比例與精度損失的關系,如圖2 和圖3 所示。
在MobileNetV3small 模型中,當允許預測精度降低0.05 時,模型最多可裁剪22.1%,而當允許預測精度降低0.1 時,最多可裁剪29.6%的模型結構。該比值越大,即說明該裁剪操作的性價比越高,由此可得到在允許準確率損失范圍內對應的可裁剪的最高比例。
在MobileNetV3large模型中,當允許預測精度降低0.05 時,模型最多可裁剪32.2%,而當允許模型精度降低0.1的情況下,最多可以裁剪41.3%的模型結構。
基于上述分析,本文將MobileNetV3 系列模型的靈敏度允許下降值設定為0.1,并對模型進行了相應的裁剪。完成裁剪后,按照之前的參數取值重新對模型進行訓練,得到模型剪枝后的識別準確率,如圖4 所示,裁剪后的MobileNetV3small 的預測精度仍可達到91.8%,裁剪后的MobileNetV3large的預測精度仍可達到93.3%。
如表5 所示,通過對比模型剪枝前后模型的準確率、預測速度以及模型大小,可以發(fā)現模型剪枝后在保持高準確率的同時,可以有效地減少模型的預測時間,這將更有利于菌絲生長程度識別模型在實際應用場景中的快速應用。
4 結論
本研究通過搭建深度學習模型訓練環(huán)境,確定了模型構建的方案和訓練參數的設置,并對模型進行訓練;基于MobileNetV3 系列模型在數據集上的識別效果,提出了一種模型改進方法,用全局最大池化代替全局平均池化,并對改進后的模型進行訓練和對比測試;利用模型剪枝方法對改進后的模型進行輕量化處理,在允許損失識別準確率的范圍內,提升了模型的預測速度。研究結果表明,MobileNetV3large 模型的識別準確率最高,預測速度最快。本研究實現了羊肚菌菌絲生長程度的精準識別和判斷,提高了菌絲生長程度識別工作效率,為指導羊肚菌產業(yè)穩(wěn)定發(fā)展提供一定的理論支撐。
參考文獻:
[1] 陳向東,朱戎,蘭進. 羊肚菌研究進展[J]. 食用菌學報,
2002,9(2):56-61.
[2] 邊銀丙. 食用菌栽培學[M]. 3版. 北京:高等教育出版社,
2017.
[3] 蔡英麗,馬曉龍,劉偉. 羊肚菌營養(yǎng)價值與保健功能綜述
[J]. 食藥用菌,2021,29(1):20-27.
[4] ROSSBACH M, K譈MMERLE E, SCHMIDT S, et al.
Elemental analysis of Morchella esculenta from Germany
[J]. Journal of Radioanalytical and Nuclear Chemistry,
2017, 313(1): 273-278.
[5] TANG Y, CHEN J L, LI F H, et al. Antioxidant and
antiproliferative activities of modified polysaccharides originally
isolated from Morchella angusticepes peck [J].
Journal of Food Science, 2019, 84(3): 448-456.
[6] 劉偉,何培新,時曉菲,等. 我國羊肚菌栽培歷程及相關
基礎研究進展[J]. 食藥用菌,2022,30(4):261-270.
[7] 朱丹,馮銳,劉鵬,等. 寧夏地區(qū)設施羊肚菌與麒麟瓜輪
作高效栽培技術[J]. 北方園藝,2024(15):152-155.
[8] 王萬坤,潘家喜,康超,等. 云貴地區(qū)羊肚菌栽培現狀調
查與分析[J]. 食藥用菌,2021,29(6):466-469.
[9] 蔡英麗,劉偉,劉高磊,等. 47 株羊肚菌菌株在武漢市的
栽培適應性分析[J]. 湖北農業(yè)科學,2022,61(20):92-97.
[10] 周惠汝,吳波明. 深度學習在作物病害圖像識別方面應用
的研究進展[J]. 中國農業(yè)科技導報,2021,23(5):61-68.
[11] 高發(fā)瑞,古華寧,張巧玲,等. 基于農業(yè)大數據和深度
學習的稻田雜草識別[J]. 江蘇農業(yè)科學,2024,52(18):
215-221.
[12] 宋光濤. 基于深度學習的農業(yè)機械自動化控制系統(tǒng)設
計[J]. 南方農機,2024,55(21):60-62.
責任編輯:周慧