摘" 要:手機(jī)取卡針在生產(chǎn)過程中常出現(xiàn)表面劃傷、磨傷、異色等缺陷,這些缺陷嚴(yán)重影響產(chǎn)品的質(zhì)量與交付。針對(duì)現(xiàn)有取卡針缺陷檢測(cè)方法的局限性,該研究構(gòu)建了基于YOLOv8的取卡針缺陷檢測(cè)模型,對(duì)3種常見的取卡針表面缺陷進(jìn)行學(xué)習(xí)、訓(xùn)練和驗(yàn)證。通過數(shù)據(jù)集構(gòu)建、模型訓(xùn)練和模型評(píng)測(cè)3個(gè)步驟,實(shí)現(xiàn)了對(duì)手機(jī)取卡針表面缺陷的自動(dòng)檢測(cè)。實(shí)驗(yàn)結(jié)果表明,該模型在多類別缺陷檢測(cè)中的平均精確度達(dá)到了98.45%,其中劃傷、磨傷和異色缺陷的識(shí)別精確度分別達(dá)到了98.89%、97.87%和96.98%,驗(yàn)證了模型的有效性。此外,YOLOv8模型具有內(nèi)存占用小、檢測(cè)速度快等優(yōu)勢(shì),顯著提升了模型的工程適用性。
關(guān)鍵詞:YOLOv8;手機(jī)取卡針;缺陷檢測(cè);檢測(cè)速度
中圖分類號(hào):TP391.4;TP183" 文獻(xiàn)標(biāo)識(shí)碼:A" 文章編號(hào):2096-4706(2025)04-0058-06
Research on Mobile Phone Card Removal Pin Defect Detection Method Based
on YOLOv8
CHEN Guangwei, JIANG Yongchun
(Qingdao University, Qingdao" 266071, China)
Abstract: The surface scratches, abrasions, discoloration, and other defects often occur in the production process of the mobile phone card removal pin, which seriously affect the quality and delivery of products. To address the limitations of the existing card removal pin defect detection methods, this research constructs a card removal pin defect detection model based on YOLOv8 for learning, training, and verifying three common card removal pin surface defects. Through the three steps of dataset construction, model training, and model evaluation, the automatic detection of the surface defects of the mobile phone card removal pin is realized. The experimental results show that the average accuracy of the model in multi-category defect detection reaches 98.45%, and the recognition accuracies of scratches, abrasions, and discoloration defects reach 98.89%, 97.87%, and 96.98%, respectively, verifying the effectiveness of the model. In addition, the YOLOv8 model has the advantages of small memory usage and fast detection speed, which significantly improves the engineering applicability of the model.
Keywords: YOLOv8; mobile phone card removal pin; defect detection; detection speed
0" 引" 言
手機(jī)取卡針作為手機(jī)的必備配件,其質(zhì)量與美觀影響著手機(jī)品牌的整體形象與客戶的信任,高強(qiáng)度,高質(zhì)量,實(shí)用、美觀的外形會(huì)提升手機(jī)品牌的應(yīng)用市場(chǎng)。當(dāng)前手機(jī)取卡針的鑄造主要采用金屬粉末注射成型技術(shù),質(zhì)檢主要依靠人工肉眼觀察,不僅效率低下,而且準(zhǔn)確率低,存在一定比例的次品漏檢的風(fēng)險(xiǎn)。本文通過分析手機(jī)取卡針缺陷的主要類型與特點(diǎn),構(gòu)建了基于YOLOv8的手機(jī)取卡針缺陷檢測(cè)系統(tǒng),對(duì)3種常見的手機(jī)取卡針缺陷進(jìn)行數(shù)據(jù)采集,通過數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和性能評(píng)估3個(gè)步驟,完成手機(jī)取卡針實(shí)時(shí)質(zhì)檢系統(tǒng)的設(shè)計(jì)。
近年來,深度學(xué)習(xí)技術(shù)不斷地在計(jì)算機(jī)視覺圖像檢測(cè)領(lǐng)域獲得應(yīng)用,它被用來定位、識(shí)別及評(píng)估多樣化的損傷與缺陷問題[1]。尤其在圖像分類、對(duì)象識(shí)別及定位的研究范疇內(nèi),卷積神經(jīng)網(wǎng)絡(luò)(CNNs)的應(yīng)用極為廣泛[2]。與傳統(tǒng)的二維圖像處理技術(shù)及計(jì)算機(jī)視覺方法相比較,CNNs通過迭代訓(xùn)練的過程自主學(xué)習(xí)圖像特征,省去了逐層人工設(shè)計(jì)特征提取器的煩瑣,大幅度簡化了圖像預(yù)處理步驟,故而逐漸被采納來實(shí)現(xiàn)手機(jī)取卡針各種缺陷(例如劃痕、磨損等)的自動(dòng)化識(shí)別任務(wù)。盡管如此,CNNs的應(yīng)用受限于其對(duì)大規(guī)模訓(xùn)練數(shù)據(jù)集的依賴、對(duì)硬件資源的高要求,以及訓(xùn)練過程中復(fù)雜度與計(jì)算負(fù)擔(dān)的增加。另一方面,基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(R-CNN)采取了選擇性搜索策略以生成區(qū)域提議,隨后將這些提議送入CNN模型進(jìn)行特征抽取,并借助支持向量機(jī)分類器得出分類概率,最終執(zhí)行邊界回歸操作于已分類的圖像上。這種基于特征的識(shí)別策略展現(xiàn)出了較高的查全率,但也不免存在訓(xùn)練周期長、計(jì)算密集型的挑戰(zhàn)。
1" YOLOv8模型
1.1" 模型的結(jié)構(gòu)
在實(shí)施取卡針缺陷的工程檢測(cè)實(shí)踐中,不僅要求高度的檢測(cè)精確度,還強(qiáng)調(diào)檢測(cè)效率的重要性,以此確保檢測(cè)結(jié)論既準(zhǔn)確無誤又及時(shí)有效。在此背景下,YOLOv8s作為一種前沿的實(shí)時(shí)目標(biāo)識(shí)別網(wǎng)絡(luò),展示出其在這兩方面尤為突出的優(yōu)勢(shì)。相比YOLOv5所需的27 MB內(nèi)存空間,YOLOv8通過對(duì)其網(wǎng)絡(luò)架構(gòu)的深入優(yōu)化(參見圖1),不僅降低了內(nèi)存占用,還加快了推理速率[3],表現(xiàn)出更強(qiáng)的性能提升。作為一個(gè)活躍更新且開放源代碼的網(wǎng)絡(luò)模型,YOLOv8s還擁有易于配置的環(huán)境、快速模型訓(xùn)練、批處理能力的支持等諸多實(shí)踐友好特性[4]。目前,YOLOv8算法已揭曉四個(gè)迭代版本:YOLOv8n、YOLOv8s、YOLOv8m(兩次提及)、YOLOv8x。其中,YOLOv8s以其在網(wǎng)絡(luò)深度和特征圖維度上的精簡設(shè)計(jì),在YOLOv8系列中獨(dú)樹一幟,而其他三款模型則是基于YOLOv8s通過增加深度和寬度來適應(yīng)不同應(yīng)用場(chǎng)景對(duì)檢測(cè)精度與速度的多元化需求,研究人員與工程師可根據(jù)具體應(yīng)用場(chǎng)景,甄選適宜的YOLOv8模型實(shí)施部署[5]。因其結(jié)合了高檢測(cè)精度與超高速推理時(shí)間,YOLOv8s非常適合應(yīng)用于對(duì)即時(shí)反應(yīng)有嚴(yán)格要求的手機(jī)取卡針缺陷監(jiān)測(cè)環(huán)節(jié)。概括而言,YOLOv8在手機(jī)取卡針缺陷檢測(cè)工程實(shí)踐中的卓越性能,充分確保了檢測(cè)結(jié)果的準(zhǔn)確度與實(shí)時(shí)性雙重標(biāo)準(zhǔn)。隨著不斷的優(yōu)化演進(jìn),YOLOv8預(yù)示著將為該領(lǐng)域帶來更高效、更精準(zhǔn)的檢測(cè)解決方案[6]。
1.2" 模型的特點(diǎn)
高速實(shí)時(shí)檢測(cè):YOLOv8s在保持高準(zhǔn)確率的同時(shí),實(shí)現(xiàn)了高速的實(shí)時(shí)檢測(cè)。這使得YOLOv8s能夠在各種實(shí)際應(yīng)用場(chǎng)景中,如無人駕駛、視頻監(jiān)控、機(jī)器人視覺等方面發(fā)揮重要作用。
高精度檢測(cè):YOLOv8s在各種對(duì)象檢測(cè)標(biāo)準(zhǔn)數(shù)據(jù)集(如COCO、PASCAL VOC等)上表現(xiàn)出了優(yōu)越的性能。通過引入更先進(jìn)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練策略,YOLOv8s進(jìn)一步提高了檢測(cè)的準(zhǔn)確率和召回率,降低了誤報(bào)率。
多尺度檢測(cè):YOLOv8s采用了多尺度檢測(cè)策略,可以有效地檢測(cè)不同大小的目標(biāo)。這一特點(diǎn)使得YOLOv8s在面對(duì)各種復(fù)雜場(chǎng)景時(shí)具有更強(qiáng)的魯棒性。
端到端訓(xùn)練:YOLOv8s采用端到端的訓(xùn)練方式,整個(gè)檢測(cè)過程無須額外的后處理步驟。這使得YOLOv8s在訓(xùn)練和推理過程中更加高效。
強(qiáng)大的擴(kuò)展性:YOLOv8s支持多種主流深度學(xué)習(xí)框架,如TensorFlow、PyTorch等,方便研究者和開發(fā)者在不同平臺(tái)上進(jìn)行部署和應(yīng)用。同時(shí),YOLOv8的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練策略可以根據(jù)實(shí)際需求進(jìn)行調(diào)整,以滿足不同場(chǎng)景的檢測(cè)需求。
2" 取卡針缺陷識(shí)別模型
2.1" 取卡針缺陷識(shí)別模型構(gòu)建
為了提高手機(jī)取卡針質(zhì)檢效率與質(zhì)量,構(gòu)建基于YOLOv8s的手機(jī)取卡針實(shí)時(shí)質(zhì)檢系統(tǒng),其主要包括數(shù)據(jù)處理,模型構(gòu)建與評(píng)測(cè),服務(wù)服務(wù)封裝3個(gè)步驟(圖2)。數(shù)據(jù)準(zhǔn)備:數(shù)據(jù)準(zhǔn)備主要包括數(shù)據(jù)采集,數(shù)據(jù)標(biāo)注,數(shù)據(jù)增強(qiáng)三部分,數(shù)據(jù)采集需要借助專業(yè)的采集設(shè)備,高速工業(yè)相機(jī),固定燈光,反差背景紙等,數(shù)據(jù)標(biāo)注使用的是Labelme,是一個(gè)免費(fèi)開源工具,數(shù)據(jù)增強(qiáng)是使用YOLOv8集成的[7]。模型訓(xùn)練與評(píng)測(cè):將標(biāo)注完成的數(shù)據(jù)集進(jìn)行劃分,我們按照7∶1∶2比例劃分訓(xùn)練集、驗(yàn)證集、評(píng)測(cè)集,訓(xùn)練目標(biāo)識(shí)別模型,進(jìn)行模型評(píng)測(cè),主要使用精確率與召回率兩個(gè)指標(biāo)。服務(wù)封裝與上線:這一步是模型從研發(fā)到落地應(yīng)用關(guān)鍵步驟,需要將模型封裝到服務(wù)里面,對(duì)外提供一個(gè)API接口,工業(yè)質(zhì)檢流水線上的取卡針圖片將會(huì)傳回后端進(jìn)行判斷,如果存在問題,將進(jìn)行篩選[8]。
2.2" 數(shù)據(jù)集構(gòu)建
根據(jù)產(chǎn)線上淘汰的帶缺陷手機(jī)取卡針樣品,這些樣品是從某某手機(jī)生產(chǎn)線中篩選出來的,主要是針對(duì)在質(zhì)檢過程中發(fā)現(xiàn)的缺陷產(chǎn)品進(jìn)行采集。我們對(duì)樣品的缺陷進(jìn)行分類,獲取缺陷類型列表,包括劃傷、磨傷、異色等10余種表面缺陷,經(jīng)過分析,按照缺陷占比與影響程度選取了劃傷、磨傷、異色3種常見的缺陷進(jìn)行研究。由我方團(tuán)隊(duì)搭建與產(chǎn)線上同等類型的燈光環(huán)境進(jìn)行數(shù)據(jù)采集,以確保數(shù)據(jù)采集時(shí)的光照條件與生產(chǎn)環(huán)境一致,進(jìn)而提高拍攝數(shù)據(jù)的質(zhì)量和準(zhǔn)確性。使用高清工業(yè)攝像機(jī)對(duì)帶缺陷手機(jī)取卡針正反面進(jìn)行拍攝,然后對(duì)拍攝的數(shù)據(jù)進(jìn)行人工標(biāo)注,使用Labelme軟件對(duì)缺陷區(qū)域進(jìn)行目標(biāo)檢測(cè)框和缺陷類型標(biāo)注,標(biāo)注完成數(shù)據(jù)需要轉(zhuǎn)換成YOLOv8模型訓(xùn)練需要的格式,標(biāo)注標(biāo)簽包括缺陷區(qū)域框的坐標(biāo)以及缺陷類型。由于人工標(biāo)注的數(shù)據(jù)量較少,無法滿足模型訓(xùn)練的要求,還需要使用反轉(zhuǎn),裁剪等方式對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)[9]。3種缺陷類型占比也存在一定差異,為了解決長尾效應(yīng),我們可以參考已有缺陷人工制造一些缺陷數(shù)據(jù),保證每種缺陷類型訓(xùn)練數(shù)據(jù)基本相同。最終獲取30 000張訓(xùn)練數(shù)據(jù),各種缺陷代碼,分類編號(hào)和樣本數(shù)量如表1所示。
2.3" 模型評(píng)價(jià)指標(biāo)
手機(jī)取卡針缺陷檢測(cè)模型是一個(gè)目標(biāo)檢測(cè)模型,對(duì)模型進(jìn)行評(píng)測(cè)主要從缺陷檢測(cè)的精度和圖像檢測(cè)的速度兩方面進(jìn)行評(píng)測(cè)。檢測(cè)精度評(píng)價(jià)指標(biāo)有交叉比(IoU)、精確度(Precision)和召回率(Recall)、F1-Score、PR曲線。檢測(cè)速度主要有前傳耗時(shí)、每秒幀數(shù)(FPS)、浮點(diǎn)運(yùn)算量(FLOPs)等。我們主要采用精確度、召回率、IoU來評(píng)價(jià)模型等檢測(cè)精度,使用FPS來評(píng)價(jià)模型性能。IoU計(jì)算方法如圖3所示。
精確度(P)和召回率(R)的計(jì)算式如下:
F1-Socre(F)的計(jì)算式如下:
FPS用來衡量設(shè)計(jì)模型每秒鐘能夠識(shí)別圖像樣本的數(shù)量,值越高則表示模型識(shí)別速度越快,速度越快則模型的性能越強(qiáng)。
2.4" 模型訓(xùn)練
將采集的手機(jī)卡針圖像樣本數(shù)據(jù),按照70%作為訓(xùn)練集,20%作為評(píng)估集,10%作為評(píng)估集。用訓(xùn)練數(shù)據(jù)對(duì)手機(jī)取卡針缺陷識(shí)別模型進(jìn)行訓(xùn)練調(diào)參,用評(píng)估集來評(píng)估模型訓(xùn)練指標(biāo),訓(xùn)練完成后會(huì)獲取到一個(gè)best.pt模型文件,接下來使用評(píng)測(cè)集對(duì)模型進(jìn)行評(píng)測(cè)[8]。模型訓(xùn)練環(huán)境為Ubuntu 20.04,顯卡為英偉達(dá)V00,顯存為32 GB。實(shí)驗(yàn)中,批處理batch_size設(shè)置為64,迭代次數(shù)epochs設(shè)置為500次[10]。
損失函數(shù)用來計(jì)算模型的輸出預(yù)測(cè)值和實(shí)際真實(shí)值的差異,損失函數(shù)設(shè)計(jì)的合理與否極大程度的決定了模型的性能。圖4為模型訓(xùn)練過程中的損失函數(shù),數(shù)據(jù)參考如下:
1)定位損失(box_loss):計(jì)算預(yù)測(cè)框與標(biāo)定框之間的誤差,值越小定位得越準(zhǔn)。
2)分類損失(cls_loss):表示錨框與氣對(duì)應(yīng)的真實(shí)分類正確與否,值越小分類得越準(zhǔn)。
3)置信度損失(dfl_loss):計(jì)算模型網(wǎng)絡(luò)的置信度,值越小判定的目標(biāo)越準(zhǔn)。
4)精確度(Precision):衡量模型在所有預(yù)測(cè)為正例的樣本中有多少是正確的,越大識(shí)別越準(zhǔn)。
5)召回率(Recall):衡量模型能夠找出真實(shí)正例的能力,越大識(shí)別越全。
6)平均精度(mAP):綜合考慮了模型在不同精度和召回率條件下的性能越大性能越好。
3" 測(cè)試結(jié)果與分析
圖5展示了若干手機(jī)取卡針瑕疵的辨識(shí)情形,其中,辨識(shí)結(jié)果借助帶有缺陷類型編碼的矩形框架予以標(biāo)記。這些矩形框架的界定區(qū)域代表相機(jī)視野中待測(cè)物體瑕疵大小。
手機(jī)取卡針模型評(píng)測(cè)結(jié)果如圖6所示,精確度(Precision)曲線顯示,在置信度為0.791時(shí),所有類別的精確度達(dá)到了1.00,這意味著在此閾值上模型沒有產(chǎn)生任何假正例,即所有標(biāo)記為正的預(yù)測(cè)都是正確的。召回率(Recall)曲線接近右上角,意味著模型在絕大多數(shù)召回率水平上都保持了較高的精確度。對(duì)于所有類別來說,在召回率為0.5的情況下,平均精確度已經(jīng)趨近于1,圖6(d)顯示所有類別的綜合F1-Socre在置信度為0.506時(shí)達(dá)到了0.98,這是一個(gè)非常高的性能指標(biāo),表明該模型具有較高的召回率和精確度。
4" 結(jié)" 論
文章提出一種基于YOLOv8的手機(jī)取卡針缺陷檢測(cè)方法,通過構(gòu)建基于目標(biāo)檢測(cè)手機(jī)取卡針的缺陷檢測(cè)模型,實(shí)現(xiàn)了對(duì)常見3種手機(jī)取卡針缺陷的自動(dòng)檢測(cè)與識(shí)別,并通過真實(shí)的測(cè)試數(shù)據(jù)進(jìn)行驗(yàn)證,在實(shí)際生產(chǎn)環(huán)境中,可以配合傳送帶進(jìn)行自動(dòng)化缺陷產(chǎn)品挑揀。模型實(shí)驗(yàn)結(jié)果表明,通過YOLOv8s搭建的取卡針表面缺陷識(shí)別模型,多類別平均精確度可達(dá)98.45%,其中劃傷、磨傷、異色缺陷識(shí)別的平均精確度分別可達(dá)98.89%、97.87%和96.98%,驗(yàn)證了該模型的有效性。
參考文獻(xiàn):
[1] 藍(lán)金輝,王迪,申小盼.卷積神經(jīng)網(wǎng)絡(luò)在視覺圖像檢測(cè)的研究進(jìn)展 [J].儀器儀表學(xué)報(bào),2020,41(4):167-182.
[2] 張濤,劉玉婷,楊亞寧,等.基于機(jī)器視覺的表面缺陷檢測(cè)研究綜述 [J].科學(xué)技術(shù)與工程,2020,20(35):14366-14376.
[3] 王銀,王晨晨,趙志誠,等.改進(jìn)YOLOv8的安檢違禁物品檢測(cè) [J/OL].控制工程,2025:1-6[2025-02-05].https://doi.org/10.14107/j.cnki.kzgc.20230586.
[4] 鮑禹辰,徐增波,田丙強(qiáng).基于YOLOv8改進(jìn)的服裝疵點(diǎn)檢測(cè)算法 [J].東華大學(xué)學(xué)報(bào):自然科學(xué)版,2024,50(4)49-56.
[5] 李昊璇,蘇艷瓊.基于改進(jìn)YOLOv8的道路缺陷檢測(cè) [J].測(cè)試技術(shù)學(xué)報(bào),2024,38(5):506-512.
[6] 李松,史濤,井方科.改進(jìn)YOLOv8的道路損傷檢測(cè)算法 [J].計(jì)算機(jī)工程與應(yīng)用,2023,59(23):165-174.
[7] VARGHESE R,SAMBATH M. YOLOv8: A Novel Object Detection Algorithm with Enhanced Performance and Robustness [C]//2024 International Conference on Advances in Data Engineering and Intelligent Computing Systems(ADICS).Chennai:IEEE,2024:1-6.
[8] 周華,鄭榮,肖榮.工業(yè)場(chǎng)景下AI質(zhì)檢關(guān)鍵技術(shù)及平臺(tái)架構(gòu)研究 [J].現(xiàn)代信息科技,2022,6(5):149-151+156.
[9] 胡瑋,趙菊敏,李燈熬.基于改進(jìn)YOLOv7-Tiny的輕量化激光器芯片缺陷檢測(cè)算法 [J].太原理工大學(xué)學(xué)報(bào),2025,56(1):137-147.
[10] 張培培,王昭,王菲.基于深度學(xué)習(xí)的圖像目標(biāo)檢測(cè)算法研究 [J].國外電子測(cè)量技術(shù),2020,39(8):34-39.
作者簡介:陳光偉(1996—),男,漢族,山東泰安人,碩士研究生,研究方向:計(jì)算機(jī)技術(shù);江永春(1972—),女,漢族,山東青島人,副教授,工學(xué)碩士,研究方向:數(shù)字影像非線編技術(shù)、特效合成技術(shù)、視覺傳達(dá)設(shè)計(jì)。
收稿日期:2024-09-23