摘 "要:該研究旨在解決速食粉面生產(chǎn)過程中對多品種外包裝的智能識別難題,計(jì)算機(jī)視覺技術(shù)為速食粉面外包裝生產(chǎn)線提供了一種高效、智能化的包裝識別與分揀解決方案。當(dāng)前,生產(chǎn)線上的包裝識別系統(tǒng)往往受限于識別種類,每增加一種外包裝識別功能,便大幅增加企業(yè)的生產(chǎn)開發(fā)成本。該文創(chuàng)新性地融合YOLOv8目標(biāo)識別算法與計(jì)算機(jī)視覺技術(shù),實(shí)現(xiàn)了速食粉面外包裝的實(shí)時(shí)識別功能,并對外包裝內(nèi)食品質(zhì)量無實(shí)質(zhì)性影響,不僅減少了因擴(kuò)展識別種類而增加的成本,還顯著提升了生產(chǎn)線的運(yùn)行效率。經(jīng)實(shí)驗(yàn)表明,模型的精準(zhǔn)度為99.93%,召回率為99.98%,mAP0.5為99.49%,mAP0.5∶0.95為99.47%,該研究給速食粉面包裝生產(chǎn)企業(yè)提供了一種多品種外包裝識別解決方案,具有一定的研究價(jià)值。
關(guān)鍵詞:速食粉面;YOLOv8;計(jì)算機(jī)視覺;目標(biāo)識別;深度學(xué)習(xí)
中圖分類號:TS213.2 " " "文獻(xiàn)標(biāo)志碼:A " " " " "文章編號:2095-2945(2025)10-0142-04
Abstract: This study aims to address the challenge of intelligent recognition of multi-variety packaging in the production process of instant noodles and noodles. Computer vision technology provides an efficient and automated packaging recognition and sorting solution for the production line of instant noodles and noodles packaging. Currently, packaging recognition systems on production lines are often limited in the types of recognition, and each additional packaging recognition function significantly increases the production and development costs for enterprises. This paper innovatively integrates the YOLOv8 object recognition algorithm with computer vision technology to achieve real-time recognition of instant noodles and noodles packaging, without substantially affecting the quality of the food inside the packaging. This not only reduces the increased cost caused by expanding the identification types, but also significantly improves the operating efficiency of the production line. Experiments show that the accuracy of the model is 99.93%, the recall rate is 99.98%, mAP0.5 of 99.49%, and mAP0.5∶0.95 of 99.47%. This research provides instant noodle packaging manufacturers with a multi-variety outer packaging identification solution, which has certain research value.
Keywords: instant noodle; YOLOv8; computer vision; target recognition; deep learning
近年來,隨著速食粉面市場需求的急劇攀升,國內(nèi)該行業(yè)的生產(chǎn)規(guī)模持續(xù)擴(kuò)張,然而,這一快速增長的背后也伴隨著成本控制的嚴(yán)峻挑戰(zhàn)。特別是在生產(chǎn)鏈的終端環(huán)節(jié)——包裝與裝箱過程中,當(dāng)前的智能化外包裝識別能力的局限性,僅能支持1~3種外包裝類型的識別,對于任何新增包裝類型的適應(yīng)性擴(kuò)展均需付出較高的經(jīng)濟(jì)成本。
長期以來,速食粉面包裝行業(yè)普遍依賴于人工裝箱的傳統(tǒng)模式,這種方法不僅效率低下,還不可避免地引入了人為誤差與主觀性,既耗費(fèi)了大量的人力資源,又難以保證裝箱質(zhì)量與效率。面對大規(guī)模、高頻次的包裝需求,人工逐箱稱重更是顯得力不從心,既增加了時(shí)間成本,也抬高了整體運(yùn)營成本。鑒于此,自動化裝箱機(jī)系統(tǒng)的應(yīng)運(yùn)而生成為了行業(yè)發(fā)展的一個(gè)重要轉(zhuǎn)折點(diǎn)。然而,目前這些系統(tǒng)普遍面臨的瓶頸在于其有限的外包裝識別能力,無法靈活應(yīng)對包裝種類日益多樣化的市場需求。每一次對新增包裝類型的識別功能升級,都需經(jīng)歷復(fù)雜的技術(shù)研發(fā)與高昂的資金投入,這無疑對生產(chǎn)商構(gòu)成了不小的壓力。
因此,提升自動化裝箱機(jī)系統(tǒng)的智能化水平,實(shí)現(xiàn)更高效、更靈活的包裝識別與裝箱作業(yè),已成為速食粉面生產(chǎn)行業(yè)亟待解決的關(guān)鍵問題。
1 "系統(tǒng)總體設(shè)計(jì)
本設(shè)計(jì)精心構(gòu)建了一個(gè)高效的數(shù)據(jù)處理與轉(zhuǎn)發(fā)系統(tǒng),其核心驅(qū)動力源自AMD Ryzen 7 5700X 8核處理器,這一強(qiáng)大的總控制芯片不僅確保了數(shù)據(jù)處理能力的卓越性,還優(yōu)化了數(shù)據(jù)流轉(zhuǎn)的效率,為整個(gè)系統(tǒng)提供了堅(jiān)實(shí)的性能基礎(chǔ)[1]。
在視覺識別領(lǐng)域,本系統(tǒng)創(chuàng)新性地集成了USB攝像頭模組,該模組專為捕捉速食粉面包裝的高清圖像而設(shè)計(jì),能夠精準(zhǔn)地捕獲包裝細(xì)節(jié),為后續(xù)的智能識別奠定堅(jiān)實(shí)基礎(chǔ)[2]。為了實(shí)現(xiàn)對速食粉面包裝的快速、準(zhǔn)確識別,本文采用了先進(jìn)的YOLOv8目標(biāo)檢測算法模型。這一模型以其出色的檢測速度與精度,在復(fù)雜環(huán)境中依然能夠穩(wěn)定識別速食粉面包裝,極大地提升了系統(tǒng)的智能化水平。
在圖像處理與展示方面,本系統(tǒng)充分利用了OpenCV(cv2)庫的強(qiáng)大功能,不僅實(shí)現(xiàn)了對攝像頭畫面的實(shí)時(shí)捕捉與顯示,還通過精細(xì)的編程實(shí)現(xiàn)了圖像數(shù)據(jù)的自動編號與本地存儲。這一功能不僅方便了后續(xù)的數(shù)據(jù)分析與處理,還增強(qiáng)了系統(tǒng)的數(shù)據(jù)管理能力,確保了數(shù)據(jù)的完整性與可追溯性。
本設(shè)計(jì)通過集成高性能處理器、高精度攝像頭模組以及先進(jìn)的圖像處理算法[3],構(gòu)建了一個(gè)高效、智能的速食粉面包裝識別系統(tǒng)。其系統(tǒng)結(jié)構(gòu)如圖1所示,各組件協(xié)同工作,共同實(shí)現(xiàn)了對速食粉面包裝的精準(zhǔn)識別與高效管理,為相關(guān)行業(yè)的自動化、智能化發(fā)展提供了有力支持[4]。
1.1 "數(shù)據(jù)庫設(shè)計(jì)
本文選擇了MySQL這一強(qiáng)大的關(guān)系型數(shù)據(jù)庫系統(tǒng),作為存儲與管理數(shù)據(jù)的核心解決方案。為了充分利用其靈活性和高效性,決定將MySQL數(shù)據(jù)庫部署于一個(gè)運(yùn)行Ubuntu 18.04 LTS版本的虛擬機(jī)環(huán)境中。這一配置不僅確保了數(shù)據(jù)庫的穩(wěn)定運(yùn)行,還便于在隔離的環(huán)境中進(jìn)行開發(fā)、測試及后續(xù)的維護(hù)工作。此數(shù)據(jù)庫的主要任務(wù)是不間斷地收集并存儲來自多個(gè)源的關(guān)鍵數(shù)據(jù),這些數(shù)據(jù)主要包括但不限于:通過先進(jìn)圖像處理技術(shù)識別到的圖片文件的保存路徑,以及利用機(jī)器學(xué)習(xí)模型進(jìn)行推理后得到的置信度評分等。通過精心設(shè)計(jì)的數(shù)據(jù)庫架構(gòu),能夠高效地管理這些數(shù)據(jù),確保它們的完整性、一致性和可訪問性。
1.2 "攝像頭選型
在攝像頭配置的選擇上,本文采用了具備1 080P外接免驅(qū)動攝像頭。這一選擇確保了捕捉到的圖像擁有極高的清晰度和細(xì)節(jié)表現(xiàn),1 080P高清攝像頭提升了圖像的分辨率。其出色的成像能力,為本文后續(xù)的圖像處理、特征提取以及模型推理等步驟提供了高質(zhì)量的數(shù)據(jù)源,從而確保了整個(gè)識別與分析過程的準(zhǔn)確性和可靠性。此外,該攝像頭還具備穩(wěn)定的性能和良好的兼容性,能夠輕松集成到本文的系統(tǒng)中,并與MySQL數(shù)據(jù)庫等后端組件無縫協(xié)作,共同構(gòu)建出一個(gè)高效、可靠的圖像處理與數(shù)據(jù)分析解決方案。
1.3 "數(shù)據(jù)集采集
本文數(shù)據(jù)集原始素材來源于拼多多平臺的采購。為了確保數(shù)據(jù)的多樣性和代表性,本文挑選了13種各類外包裝作為拍攝對象。隨后,利用先進(jìn)的1080P高清攝像頭進(jìn)行拍攝,這一步驟不僅捕捉到了商品的精細(xì)紋理與細(xì)節(jié),還確保了圖像的高清晰度和色彩準(zhǔn)確性,為后續(xù)的數(shù)據(jù)處理奠定了堅(jiān)實(shí)的基礎(chǔ)[5]。
在拍攝完成后,本文通過標(biāo)注軟件LabelImg進(jìn)行標(biāo)注,本文確保了每張圖片中的關(guān)鍵信息都被準(zhǔn)確、詳細(xì)地標(biāo)注出來。這一環(huán)節(jié)對于提升模型的識別精度和泛化能力至關(guān)重要。
本文將標(biāo)注好的數(shù)據(jù)按照COCO(Common Objects in Context)格式進(jìn)行了整理與合成,形成了COCO128數(shù)據(jù)集。COCO128數(shù)據(jù)集的成功構(gòu)建,為本文后續(xù)的模型訓(xùn)練、性能評估以及算法優(yōu)化提供了強(qiáng)有力的數(shù)據(jù)支持。
1.4 "OpenCV開發(fā)
本文巧妙利用OpenCV的強(qiáng)大功能,實(shí)時(shí)捕獲高清攝像頭的數(shù)據(jù)流,并將數(shù)據(jù)流中的每一幀圖像逐一送入YOLOv8模型進(jìn)行高效推理。推理結(jié)果中目標(biāo)的位置信息隨后通過OpenCV的cv2繪圖功能進(jìn)行精準(zhǔn)標(biāo)注,以直觀展示模型對攝像頭畫面的識別效果。
2 "YOLOv8目標(biāo)識別算法
2.1 "識別系統(tǒng)設(shè)計(jì)
速食粉面包裝識別部分系統(tǒng)設(shè)計(jì)如圖2所示。
2.2 "YOLOV8模型介紹
實(shí)時(shí)物體檢測技術(shù)作為當(dāng)代科技的璀璨明珠,已深深植根于自主駕駛、機(jī)器人技術(shù)、智能視頻監(jiān)控及增強(qiáng)現(xiàn)實(shí)等多個(gè)前沿領(lǐng)域[6],引領(lǐng)著技術(shù)革新與產(chǎn)業(yè)升級。在這一技術(shù)領(lǐng)域中,YOLO(You Only Look Once)框架憑借其卓越的速度與精度的完美融合,成為了業(yè)界的標(biāo)桿,它能夠在極短時(shí)間內(nèi)準(zhǔn)確無誤地識別出圖像中的各類物體。
自YOLO系列誕生以來,其歷經(jīng)多次迭代,每版皆旨在突破前代局限,推動性能極限。如圖3所示,YOLOv1首開先河,以單次前向傳播實(shí)現(xiàn)高速檢測,到Y(jié)OLOv2、v3引入多項(xiàng)優(yōu)化,強(qiáng)化檢測能力,YOLO持續(xù)引領(lǐng)創(chuàng)新。YOLOv4整合尖端技術(shù),實(shí)現(xiàn)速度與精度的飛躍。v5與v6則優(yōu)化結(jié)構(gòu),簡化流程,提升實(shí)用性。最新的YOLOv8,在架構(gòu)、訓(xùn)練、推理上全面革新,為用戶帶來前所未有的高效精準(zhǔn)檢測體驗(yàn)[7],標(biāo)志著YOLO技術(shù)的又一里程碑,預(yù)示著實(shí)時(shí)物體檢測領(lǐng)域的璀璨未來。
YOLOv8,作為YOLO系列的巔峰之作,榮膺目標(biāo)檢測領(lǐng)域SOTA桂冠。其不僅傳承了YOLO系列的卓越基因,更以全面革新引領(lǐng)潮流。YOLOv8深度融合前沿科技,革新骨干網(wǎng)絡(luò)、引入Anchor-Free檢測頭及定制化損失函數(shù),顯著提升特征提取效率與檢測精度[8]。其核心網(wǎng)絡(luò)架構(gòu)由高效Backbone、強(qiáng)大Neck與靈活Head組成,三者協(xié)同增效,鑄就非凡檢測能力。Backbone采用C2F[9-10]模塊與先進(jìn)技術(shù),優(yōu)化特征表示;Neck借助PAN-FPN與SPPF,增強(qiáng)特征融合與多尺度檢測;Head則通過Decoupled-Head設(shè)計(jì),實(shí)現(xiàn)高效分類與精準(zhǔn)檢測。加之Anchor-free、自適應(yīng)NMS及自動混合精度訓(xùn)練等優(yōu)化技術(shù),YOLOv8[3]在速度、精度與易用性上均實(shí)現(xiàn)飛躍,定義了目標(biāo)檢測新標(biāo)準(zhǔn)。
YOLOv8網(wǎng)絡(luò)模型結(jié)構(gòu)圖如圖4所示。
2.3 "模型訓(xùn)練的試驗(yàn)環(huán)境
試驗(yàn)環(huán)境配置如下:CPU為AMD Ryzen 7 5700x 8-Core Processor 3.4 GHz;運(yùn)行內(nèi)存為64 GB;GPU為16 G的 NVIDIA GeForce RTX 4060 Ti;操作系統(tǒng)為 Windows 11 專業(yè)版 23H2 22631.3672;NVIDIA驅(qū)動版本為552.44.00;編程語言Python的版本是3.8.10;深度學(xué)習(xí)框架Pytorch的版本為2.3.0+cu121。
3 "實(shí)驗(yàn)與驗(yàn)證
經(jīng)過對YOLOv8模型的深入優(yōu)化與數(shù)據(jù)集訓(xùn)練,本文通過3 000次的訓(xùn)練成功地構(gòu)建了一個(gè)高精度的識別系統(tǒng),該系統(tǒng)能夠準(zhǔn)確無誤地辨識出多達(dá)12種不同種類的螺螄粉包裝。具體模型數(shù)據(jù)見表1。
識別完成的實(shí)驗(yàn)耗材圖片如圖5所示。
聲明:以上圖片非商業(yè)用途;數(shù)據(jù)來源:拼多多采購。
識別完成的對應(yīng)表見表2。
YOLOv8的準(zhǔn)確率和函數(shù)損失圖如圖6、圖7所示。
4 "結(jié)論
該研究針對速食粉面外包裝種類的復(fù)雜性與多樣性,提出了一種基于YOLOv8的智能高效檢測方法。引入C2F特征融合模塊[11],成功地將深層特征圖的豐富語義信息與淺層特征圖的高分辨率細(xì)節(jié)相結(jié)合,提升了模型對速食粉面外包裝種類的識別能力。同時(shí),結(jié)合特征增強(qiáng)技術(shù),進(jìn)一步增強(qiáng)了特征圖的表達(dá)能力,有效抑制了噪聲信息的干擾。此外,利用多尺度檢測機(jī)制,能靈活應(yīng)對不同尺寸的外包裝目標(biāo)[12],確保了檢測的全面性和準(zhǔn)確性。該研究不僅為速食粉面外包裝識別領(lǐng)域帶來了新的突破,也為類似復(fù)雜場景下的目標(biāo)檢測任務(wù)提供了技術(shù)支持。
參考文獻(xiàn):
[1] 林濤.基于OSGi自動抄表網(wǎng)關(guān)的研究與設(shè)計(jì)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2006(4):48-50,12.
[2] 李賓,譚建榮,彭群生.一個(gè)基于掃描串的統(tǒng)一整體矢量化算法[J].軟件學(xué)報(bào),1998(6):27-32.
[3] 劉昱,彭龑.基于YOLOv8的鋼材表面缺陷檢測算法[J/OL].重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版),1-10[2024-09-02].http://kns.
cnki.net/kcms/detail/50.1155.N.20240823.1659.002.html.
[4] 胥鳴,張奇,牛守祥.一種利用邊緣計(jì)算網(wǎng)關(guān)對既有自控系統(tǒng)的改造方法[P].安徽?。篊N202211027279.3,2023-06-27.
[5] 黃文軍.基于LabVIEW的低頻虛擬示波器研究與實(shí)現(xiàn)[D].桂林:廣西師范大學(xué),2010.
[6] 韓建平.視頻運(yùn)動對象分割及其應(yīng)用研究[D].杭州:浙江大學(xué),2009.
[7] 朱舒卷,何軍.OLED顯示器及其制備方法、QLED顯示器[P].江蘇?。篊N202111027504.9,2021-11-26.
[8] 申光鵬,王挺.基于圖像特征的電子印章數(shù)字水印算法設(shè)計(jì)[J].計(jì)算機(jī)應(yīng)用,2020,40(S1):199-202.
[9] 陳德富.基于YOLOv4的金屬工件銀面缺陷檢測[D].桂林:桂林電子大學(xué),2022.
[10] 鄧力,周進(jìn),劉全義.基于改進(jìn)YOLOv8的火焰與煙霧檢測算法[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)學(xué)版),2025,65(4):681-689.
[11] 趙佰亭,程瑞豐,賈曉芬.融合多尺度特征的YOLOv8裂縫缺陷檢測算法[J].計(jì)算機(jī)工程與應(yīng)用,2024,60(22):261-270.
[12] 崔家禮,王涵,鄭瀚,等.基于LDI-YOLOv8的融合圖像檢測方法[J/OL].微電子學(xué)與計(jì)算機(jī),1-14[2024-09-02].http://kns.cnki.net/kcms/detail/61.1123.tn.20240808.1049.002.html.