摘要:黃精是重要的藥食同源品種,在黃精的種植與育種過程中,通常采用基于個人經(jīng)驗的人工方式進行種子成熟度識別,但該方式存在主觀性強、精確度不穩(wěn)定的問題,會在一定程度上影響種植后黃精的產(chǎn)量和質量,進而影響黃精產(chǎn)品的品質和下游產(chǎn)業(yè)的經(jīng)濟效益;另一方面,由于黃精種植地塊通常較為分散,使得人工識別種子成熟度的方式較為低效。為了解決以上問題,本研究提出一種基于改進卷積神經(jīng)網(wǎng)絡YOLOv8n的黃精種子成熟度識別模型-YOLOv8n-FasterNeL-EMA。首先,在模型輕量化方面,通過將YOLOv8n主干網(wǎng)絡中原本的卷積替換為FasIerNet的PConv卷積結構,與BotIleneck層結合后得到新的c2f-FasLerNet模塊,從而減小模型的計算量與內(nèi)存消耗;其次,在模型泛化性能方面,通過使用EMA注意力機制與YOLOv8n頸部網(wǎng)絡中檢測處的c2f模塊結合,提升模型的特征提取能力,進而改善模型的泛化能力。為驗證所提模型的性能,在構建的黃精種子成熟度數(shù)據(jù)集上進行了對比實驗,結果表明,與原YOLOv8n模型相比,本研究所提模型在平均識別精度上提升了2.1%,同時模型的參數(shù)量降低了21.3%;此外,與SSD、YOLOv5n相比,本研究所提模型在識別精度和速度上也取得一定的提升。因此,YOLOv8n-FasterNet-EMA能有效識別黃精種子的成熟度,這對實現(xiàn)黃精種子成熟度的智能化識別,進而提升黃精育種的質量、改善下游產(chǎn)業(yè)的經(jīng)濟效益均具有重要的實際意義。
關鍵詞:黃精;種子成熟度識別;卷積神經(jīng)網(wǎng)絡;YOLOv8n;FasterNet;EMA注意力機制
中圖分類號:S126:S567.23+9 文獻標識號:A 文章編號:1001-4942(2025)01-0156-10
黃精是藥食同源的品種,有補陰益氣、美容養(yǎng)顏、調節(jié)血糖血脂等多種功效。隨著現(xiàn)代人對養(yǎng)生的重視,市場對于黃精產(chǎn)品的需求不斷上升,導致野生黃精的產(chǎn)量難以滿足市場的需要,人工栽培的黃精成為黃精有關產(chǎn)品原料來源的主要渠道。育種是人工栽培黃精必不可少的環(huán)節(jié),而育種過程中關于黃精種子成熟度的判斷,多采用基于個人經(jīng)驗的人工方式,存在主觀性強、精確度不穩(wěn)定的問題;另外,人工栽培黃精地塊分散,而收獲時間較集中,人工識別成熟度的方式較為低效,易受客觀因素影響,導致優(yōu)質種子的浪費,影響后續(xù)黃精種植后的產(chǎn)量和質量,進而影響黃精下游產(chǎn)業(yè)的質量和經(jīng)濟效益。黃精種子成熟度智能識別技術能夠有效解決人工識別成熟度低效和精確度不穩(wěn)的問題,提高采摘和種植的效率,而且還有助于農(nóng)民選擇達到要求的地塊進行采摘,確保種子來源的一致性和可靠性。因此,這一技術對于推動黃精種植業(yè)及其下游產(chǎn)業(yè)的品質和經(jīng)濟效益是必要的。
深度學習已廣泛應用于農(nóng)業(yè)工程領域,在農(nóng)作物種子或果實的成熟度識別領域也有應用。目前,對于果實與種子成熟度的識別算法主要有兩種,一種是使用區(qū)域卷積神經(jīng)網(wǎng)絡R-CNN為代表的二階段算法,另一種是以卷積神經(jīng)網(wǎng)絡YOLO為代表的一階段算法。兩種算法各有優(yōu)劣:二階段算法在精度方面有優(yōu)勢,但識別速度較慢,難以滿足較為實時性的需求:一階段算法在實時性上更具優(yōu)勢,但精度相對較低。因此,在選擇識別算法時需根據(jù)具體任務需求和場景進行權衡。袁明新等選用VGG-F模型進行預訓練,并在訓練過程中融入局部歸一化的數(shù)據(jù)預處理,對于自然環(huán)境下的蘋果成熟度識別的平均準確率達到了65.5%。曾俊等通過改進YOLOv5s模型,并引入CBAM(convolutional block attention module)注意力機制,對自然環(huán)境下桃子成熟度進行快速檢測識別,平均精度均值達到了88.6%。李陽德等通過將YOLOv4的骨干網(wǎng)絡替換為輕量級網(wǎng)絡MobileNet V3,對于自然環(huán)境下的菠蘿成熟度識別的平均精度均值達到了90.92%。熊俊濤等利用輕量化YOLOv5,通過去掉Focus層及減少使用C3 Layer的方式,對自然環(huán)境下的木瓜成熟度進行識別,平均精度均值達到了92.4%。朱旭等改進Faster R-CNN算法,通過卷積神經(jīng)網(wǎng)絡(CNN)、區(qū)域候選網(wǎng)絡(RPN)、感興趣區(qū)域池化(ROI Pooling)和分類網(wǎng)絡實現(xiàn)藍莓圖像背景消除來提升果實識別效果,平均識別準確率達到了94.67%。馬瑞峻等通過替換YOLOv5主干網(wǎng)絡為CSPDarkNet,并引入SE(squeeze-and-ex-citation)注意力機制,對于存在枝條遮擋與果實遮擋情況下的火龍果檢測能力明顯增強,平均精度均值達到了94.9%。王立舒等采用CSPDark-net53-Tiny網(wǎng)絡模型替換YOLOv4的主干網(wǎng)絡,并將CBAM注意力機制加入到YOLOv4的特征金字塔中,實現(xiàn)了在遮擋與光照不均的環(huán)境下對藍莓成熟度檢測的平均精度均值達到96.24%。陳仁凡等通過在YOLOv5s的主干中引入Shuffle-Block作為提取網(wǎng)絡,實現(xiàn)模型輕量化,在溫室環(huán)境下對草莓成熟度識別的平均精度均值達到了97.4%。楊堅等通過將CBAM注意力機制集成到YOLOv4-tiny模型骨干網(wǎng)絡中,并用Mish激活函數(shù)替代ReLU激活函數(shù),對自然環(huán)境下的番茄成熟度識別的平均精度均值達到了97.9%。王鐵偉等提出了一種基于數(shù)據(jù)平衡的Faster R-CNN冬棗識別方法,利用ROI提取方法,并采用數(shù)據(jù)平衡操作,對自然環(huán)境下不同成熟度的冬棗進行識別,平均精確度達到了98.5%。