關(guān)鍵詞:缺陷檢測;改進后的YOLOv8模型(CP-YOLOv8);CA注意力機制;CSPPC模塊;WIoUv3;目標檢測;輕量化設(shè)計中圖分類號:S776 文獻標識碼:A DOI:10.7525/j.issn.1006-8023.2025.04.012
Abstract:Inresponseto thecomplexdiversityofsurface defects inplywood veneersandthe dificulties infeature extraction,as well as the large number of parameters and computational costs of deep learning-based defect detection algorithms,which makes efectiveapplication on devices with lower computing power challenging,a detection model forsurface defects(live knots,dead knots,holes,cracks,and notches)in veneers based onan improvedYOLOv8n is constructed.Toenhance thedetectionaccuracyand lightweightperformanceof the model,improvementsare made to the plywood veneer surface defect detection model.First,anew eficient atention mechanism(coordinate atention,CA)is adopted,which can enhance the acuracyoffeature extraction and the network's spatial information perception ability whileavoiding excesivecomputational burden;secondly,anovel structure basedon partialconvolution(PConv)is proposed- -CSPPC(CSP(coross stage partial) pyramid convolution),it to improve computational efficiency and the fusion capability of multi-scale features; finally,an improved weighted intersection over union loss function- -WIoUv3, it is introduced,which enhances the model'slocalizationaccuracyand robustness.Experimentalresults showthat the improved YOLOv8 model(CP-YOLOv8)performs excellently in the task of detecting surfacedefects in plywood veneers,achieving an average precision mean (mAP)of 93.8% ,an increase of 0.9% over the original model,while reducing the model's floating-point operations (GFLOPs)and parameter count to 7.2Gand2.58 M,respectively,a reductionof O.9 GandO.42 M,which can fully meet practical application needs and provide an eficient,accurate,and lightweight solution for quality inspection of plywood veneers.
0 引言
在全球制造業(yè)加速向自動化、智能化深度轉(zhuǎn)型的時代背景下,木材加工行業(yè)正經(jīng)歷著深刻變革,而膠合板生產(chǎn)作為其中的關(guān)鍵分支,在建筑、家具和裝飾等眾多領(lǐng)域發(fā)揮著不可或缺的作用。膠合板是一種通過多層木材單板經(jīng)膠水黏合而成的復(fù)合材料,其獨特的結(jié)構(gòu)賦予其良好的強度、穩(wěn)定性和可塑性。目前,單板上的缺陷,如孔洞、裂紋和缺口等,會嚴重削弱膠合板的強度,影響其外觀的美觀度和穩(wěn)定性,進而在使用過程中引發(fā)安全隱患或降低產(chǎn)品的使用壽命。在膠合板產(chǎn)業(yè)的生產(chǎn)流程中,傳統(tǒng)的木材缺陷檢測主要采用人工目測[1]。精準且迅速地識別單板表面所存在的各類缺陷(如死節(jié)、活節(jié)、孔洞、裂縫和缺口等),對于科學(xué)劃分膠合板等級、提升單板利用率以及保障成品質(zhì)量具有關(guān)鍵意義。隨著人工智能技術(shù)的發(fā)展,機器視覺逐漸應(yīng)用到缺陷檢測中,Xie等2提出融合表面紋理特征的檢測法,挖掘紋理提升檢測死節(jié)、活節(jié)缺陷的準確性與魯棒性。王金聰?shù)萚3運用圖像分割技術(shù)精準檢測死節(jié)、活節(jié)及蟲眼缺陷,克服傳統(tǒng)算法分割問題,增強檢測效果。然而,需要注意的是,上述這些方法易受木板形狀紋理、光照和拍攝角度等環(huán)境因素干擾,在復(fù)雜背景下檢測可靠性與準確性受限,難以滿足工業(yè)高精度、高穩(wěn)定性檢測需求。
目前,越來越多的研究人員將深度學(xué)習(xí)用于缺陷檢測[4]。隨著卷積神經(jīng)網(wǎng)絡(luò)技術(shù)的不斷演進與成熟,將其應(yīng)用于目標檢測領(lǐng)域已成為一種趨勢。從算法處理流程的維度來劃分,其主要可歸為一階段與二階段2種不同類型,在一階段的目標檢測算法范疇內(nèi),具有代表性的有 SSD[5] 以及YOL0系列[6-7]。而處于二階段的算法,則是以FastRCNN[8]和FasterRCNN[9-10]等為典型代表。Han等[1]為了解決木材小目標及密集缺陷檢測的難題,改進設(shè)計了STC-YOLOv5模型,準確率提高了 3.1% 。Li等[12]針對不規(guī)則形狀的木材缺陷,采用循環(huán)生成對抗網(wǎng)絡(luò)(GAN)擴充數(shù)據(jù)集,并基于MaskR-CNN構(gòu)建了檢測模型,試驗結(jié)果顯示其最終檢測準確率為 82.8% 。Xia等[13]對FasterR-CNN模型進行了改進,優(yōu)化了其在不同紋理板材表面缺陷檢測中的表現(xiàn),準確率達到了 95.71% 。相比之下,“一步法”在檢測速度上有顯著優(yōu)勢,同時還能保持較高的檢測精度。賈浩男等[14]及其團隊創(chuàng)新提出一種木板材表面缺陷的定量識別方法,該方法不僅維持原有檢測精度,還顯著提升了小目標缺陷的識別能力,有力減少了木板材缺陷漏檢情況,成功實現(xiàn)復(fù)雜場景下的快速檢測。針對木材表面缺陷檢測難題,江興旺等[15]提出改進YOLOv7算法,通過嵌入注意力模塊、引入淺層加權(quán)特征融合網(wǎng)絡(luò)和優(yōu)化損失函數(shù),提升了模型檢測精度,滿足木材生產(chǎn)加工缺陷檢測需求。曹永鑫等[16]為解決木材表面缺陷檢測問題,提出基于YOLOv5-LW模型的方法,重構(gòu)骨干網(wǎng)絡(luò),結(jié)合注意力機制與特征融合網(wǎng)絡(luò),實現(xiàn)模型輕量化,提高了細小缺陷檢測能力,適合嵌入式設(shè)備部署。胡繼文等[17]為解決木材表面缺陷檢測模型計算量大等問題,提出FCS-YOLOv5n模型,引人FasterNet等技術(shù)改進,實現(xiàn)輕量化且保持良好檢測效果,為在移動端或嵌入式設(shè)備部署奠定基礎(chǔ)。朱豪等[18]針對木材表面缺陷特征提取困難,提出基于改進YOLOv5s的檢測模型,能有效檢測缺陷,且綜合性能優(yōu)于經(jīng)典檢測模型。然而,上述這些檢測模型在結(jié)構(gòu)設(shè)計上相對復(fù)雜,往往伴隨著較高的參數(shù)量和計算量,這在復(fù)雜的實際檢測場景中,可能會導(dǎo)致檢測效率的下降以及準確率的波動,從而限制了其在工業(yè)生產(chǎn)中的廣泛應(yīng)用。
針對上述一系列問題,提出改進后的YOLOv8模型(CP-YOLOv8),該模型應(yīng)用于膠合板單板表面缺陷檢測后,將顯著提升檢測精度并優(yōu)化輕量化程度,可以為取代膠合板單板生產(chǎn)線上的人工分選單板提供有效的技術(shù)支持,并為膠合板單板生產(chǎn)線自動化加工方案奠定更為可靠的技術(shù)基礎(chǔ)。
1 材料與方法
本試驗選取廣西柳州地區(qū)具有代表性且廣泛應(yīng)用的桉木板作為研究材料,該地區(qū)桉木產(chǎn)量可觀,在木材加工行業(yè)具有重要地位,以此確保試驗的可靠性和實際應(yīng)用價值。通過對桉木板的仔細檢查,篩選出存在缺陷(死節(jié)、活節(jié)、孔洞、裂縫、缺口)的樣本,如圖1所示。在綠色傳送帶上布置密封環(huán)境,在密封環(huán)境內(nèi)部安裝照明設(shè)備,達到恒定光照環(huán)境,選擇圖像采集相機(MVCS03260GC),其分辨率為 2 048×1 536 像素,最大幀率為38.6FPS,設(shè)置傳感器,當木板運送到采集相機下方時信號觸發(fā),完成圖像拍攝。
深度學(xué)習(xí)模型的性能與數(shù)據(jù)集的質(zhì)量和規(guī)模密切相關(guān)。為了充分訓(xùn)練模型并提高其泛化能力,需要構(gòu)建一個豐富多樣的數(shù)據(jù)集。將拍攝的圖片尺寸設(shè)置為640×640 像素,對于原始拍攝的700張桉木板圖像,通過數(shù)據(jù)增強技術(shù)對原始圖像進行擴充,共生成2500張圖像,具體的數(shù)據(jù)增強操作包括:將圖像旋轉(zhuǎn) 180° ,對圖像進行低光照處理,添加高斯模糊,對圖像進行等比例縮放,如圖2所示,以豐富數(shù)據(jù)集中的樣本多樣性。按7:2:1的比例劃分訓(xùn)練集、驗證集和測試集;隨后,在標注過程中,使用LabelImg圖像標注工具,以VOC(visualobjectclasses)數(shù)據(jù)集格式對采集到的圖像數(shù)據(jù)進行標注,為每個缺陷區(qū)域分配特定的標簽,死節(jié)、活節(jié)、孔洞、裂縫、缺口分別用0、1、2、3、4進行標記,確保標注的準確性和一致性,為后續(xù)模型的訓(xùn)練提供可靠的監(jiān)督信息。經(jīng)過數(shù)據(jù)增強后,各級缺陷在訓(xùn)練集和驗證集中的詳細分布情況見表1,通過合理的數(shù)據(jù)集構(gòu)建和處理,旨在提高模型對桉木板表面缺陷的檢測精度和魯棒性,使其能夠更好地適應(yīng)實際生產(chǎn)中的復(fù)雜情況。
2 CP-YOLOv8模型
2. 1 YOLOv8n的模型結(jié)構(gòu)
YOLO是一種基于深度學(xué)習(xí)的目標檢測模型,在物體檢測上具有速度快、檢測效果好等優(yōu)點,因此在目標檢測領(lǐng)域得到了廣泛應(yīng)用[19]。其中,YOLOv8n主要由Backbone、Neck和Head組成,模型結(jié)構(gòu)如圖3所示。Backbone和Neck部分使用C2f模塊進行特征融合。Backbone由Conv模塊、C2f模塊和快速空間金字塔池化(spatial pyramid pooling-fast,SPPF)模塊組成,Back-bone負責從輸入圖像中提取特征,利用多種卷積和池化操作獲取不同層次的語義信息。Neck采用PANet特征金字塔網(wǎng)絡(luò),融合來自Backbone不同層級的特征圖,以應(yīng)對不同尺度目標的檢測,增強模型對各類缺陷大小的適應(yīng)性。Head基于前兩者提取的特征圖執(zhí)行目標檢測,預(yù)測缺陷的邊界框和類別。YOLOv8n為Anchorfree模型,這種特性降低了計算復(fù)雜度,使其檢測速度更快,在缺陷檢測等對實時性有要求的場景中更具優(yōu)勢,能夠快速準確地識別出目標缺陷,為后續(xù)的處理和決策提供及時有效的支持。
2. 2 CP-YOLOv8模型結(jié)構(gòu)
YOLOv8作為一種具有高效性和強適應(yīng)性的自標檢測模型,在多種應(yīng)用場景中展現(xiàn)出了其獨特的優(yōu)勢,能夠在確保檢測精度的前提下,快速適應(yīng)不同類型的缺陷以及多樣化的檢測環(huán)境。然而,在木板表面缺陷檢測領(lǐng)域,當前YOLOv8模型有局限,特征融合能力有待提升,難以應(yīng)對復(fù)雜背景、多樣缺陷形態(tài)的情況。鑒于此,為了更好地滿足木板加工行業(yè)對于表面缺陷檢測的實際需求,本研究提出了一種基于改進YOLOv8的木板表面缺陷檢測模型——CP-YOLOv8。該模型通過引入坐標注意力機制(coordinateattention,CA),增強了模型對目標的定位能力;提出了一種CSPPC(CSP(cross stage partial) pyramidconvolution)模塊,旨在顯著增強模型對木板表面缺陷特征的提取與融合能力;引人了改進的加權(quán)交并比損失函數(shù)—WIoUv3,能夠更加精準地處理低質(zhì)量樣本對訓(xùn)練的負面影響,并提升模型的定位精度和魯棒性。
改進后的CP-YOLOv8目標檢測模型,如圖3所示,旨在提升模型的檢測精度與速度,同時通過引入輕量化設(shè)計,顯著降低模型的計算量和參數(shù)量。本研究的核心目標是輕量化YOLOv8模型,使其在保持高精度的同時,能夠適應(yīng)工業(yè)界對實時性和資源消耗的嚴格要求。首先,為了提升模型的精度,CP-YOLOv8引入了C2f_CA和CSPPC2個輕量化模塊。C2f_CA模塊采用了坐標注意力機制(CA),該機制能有效地增強模型對空間信息的捕捉能力。通過將縱橫向的位置信息編碼到通道注意力中,CA模塊在提升特征提取精度的同時,避免了傳統(tǒng)注意力機制中計算量過大的問題,從而實現(xiàn)了輕量化而高效的特征融合。具體來說,C2f_CA模塊替換了Backbone中原有的卷積層,提升了特征圖的表達能力,特別在復(fù)雜背景和小目標檢測中表現(xiàn)尤為突出。由于其低計算開銷,模型在推理速度上也得到了顯著提升。其次,CSPPC模塊基于部分卷積(partial convolution,PConv)[2o]的思想,提出了一種新的卷積結(jié)構(gòu)。該模塊通過僅對輸人通道的部分進行卷積操作,從而大幅度減少了計算量和內(nèi)存訪問量,同時保留了特征圖中的重要信息,這一模塊替換Head部分傳統(tǒng)的C2f模塊,提升了模型的精度,并有效降低了計算成本,幫助模型在硬件資源有限的環(huán)境下實現(xiàn)快速部署,尤其適合大規(guī)模數(shù)據(jù)集的訓(xùn)練和推理。引入了改進的WIoUv3損失函數(shù),有助于增強模型在自標框回歸階段的魯棒性和泛化能力,尤其對于多尺度缺陷和復(fù)雜背景下的檢測表現(xiàn)更為出色。
2.3 CA注意力機制
隨著網(wǎng)絡(luò)深度的增加,膠合板單板表面缺陷的特征信息在傳遞過程中逐漸變得更加抽象和泛化,尤其在復(fù)雜背景下,目標區(qū)域的特征信息可能被稀釋或丟失,導(dǎo)致網(wǎng)絡(luò)難以聚焦于關(guān)鍵區(qū)域,從而影響檢測性能。為了解決這一問題,本研究引入了坐標注意力機制(CA),以增強網(wǎng)絡(luò)對目標空間結(jié)構(gòu)的理解能力,并提升對關(guān)鍵特征的捕捉能力。CA通過將橫向和縱向的位置信息編碼到通道注意力中,既捕獲了通道信息,也捕獲了方向相關(guān)的空間位置信息,從而增強了模型對目標的定位能力。相比SE(squeeze-and-excitation)和CBAM(convolutionalblockattentionmodule)等機制,CA在輕量化設(shè)計的同時,能夠顯著提升全局和局部信息的建模能力。CA注意力機制的輸人是一個特征張量 ,輸出是一個與輸入張量大小相同但具有增強表征能力的特征張量
,其中, C 是通道數(shù), H 和 W 分別表示特征圖的高度和寬度。整個計算過程分為坐標信息嵌人和坐標注意力生成兩步,如圖5所示 ∣r 用于控制通道維度壓縮的程度)。
進行坐標信息嵌人,通過全局池化操作分別沿特征圖的高度和寬度方向?qū)γ總€通道進行編碼,捕獲水平方向和垂直方向的全局信息,計算公式[21]為
式中: xc(h,i) 為輸入特征圖第 C 個通道在位置 (h,i) 的值; Zch(h) 為第 C 通道在高度 H 上的全局平均值; Zcw(h) 為第 C 通道在寬度 W 上的全局平均值。
在完成坐標信息嵌人后,CA模塊通過以下步驟生成坐標注意力權(quán)重,將拼接后的張量輸入一個 1×1 卷
積 F1, 壓縮通道數(shù)并提取有效信息,計算公式為
式中: θ 為非線性激活函數(shù) ;f 為對空間信息在水平方向和垂直方向進行編碼的中間特征信息。
將變換后的張量f分解為2個獨立的張量 :fw 表示水平方向的特征 ,fh 表示垂直方向的特征,然后使用2個 1×1 卷積變換函數(shù)和分別將其變換為具有相同通道數(shù)的張量,計算公式為
式中, σ 為sigmoid函數(shù)。
注意力機制的輸出計算公式為
在C2f模塊中引入CA注意力機制,形成了改進版的C2f_CA模塊。CA機制通過將空間方向的位置信息編碼到通道注意力中,提升了模型對單板缺陷區(qū)域的關(guān)注,避免被背景干擾,在輕量化設(shè)計的同時,為膠合板單板表面缺陷檢測提供了更強大的特征提取和分析能力。
2.4 CSPPC模塊
隨著網(wǎng)絡(luò)深度和模型復(fù)雜度的增加,目標檢測任務(wù)中的計算開銷和推理時間逐漸成為影響實時性和資源使用效率的重要問題。為了解決這一問題,模型中加人了一種基于部分卷積(PConv)的輕量化模塊CSPPC(CSPpartialconvolution),結(jié)構(gòu)如圖6所示,以優(yōu)化模型的計算效率,同時保持對特征提取的高效性和多尺度表達能力。CSPPC模塊通過對輸入特征通道進行分割,僅對部分通道執(zhí)行卷積操作,而保留其他通道不變,從而大幅減少計算復(fù)雜度和內(nèi)存訪問量。相比傳統(tǒng)的卷積操作,CSPPC利用了特征圖的冗余性,在輕量化設(shè)計的同時保留了輸入特征中的關(guān)鍵信息。此外,通過結(jié)合部分卷積與特征金字塔池化(SPP)的多尺度特性,CSPPC能夠增強網(wǎng)絡(luò)對不同尺度目標的檢測能力。
2.5 損失函數(shù)
在目標檢測任務(wù)中,定位框的精確性直接決定了檢測性能。傳統(tǒng)的交并比(intersectionoverunion,IoU)、廣義交并比(generalized intersection overunion,GIoU)、距離交并比(distance intersection over union,DIoU)和完整交并比(complete intersection over union,CIoU)損失函數(shù)對目標邊界框的精確擬合能力仍存在局限。本研究引人了改進的加權(quán)交并比(WIoU)損失函數(shù),其結(jié)合了IoU度量、邊界框的中心偏移以及形狀差異,提出了一種動態(tài)非單調(diào)機制,能有效應(yīng)對自標大小及形狀差異的挑戰(zhàn),同時優(yōu)化邊界框的匹配度和收斂性。WIoUv1(Wise-IoUv1,式中記為 LWIoUv1) 提出了一種基于注意力機制的預(yù)測框損失計算方法。隨后,WIoUv2(LwIoUv2) 和 WIoUv3(LwIoUv3) 在此基礎(chǔ)上進一步引人了聚焦系數(shù),使得該方法更加適應(yīng)復(fù)雜樣本的學(xué)習(xí)需求。Wise-IoU的數(shù)學(xué)公式演變過程如下所示。
WIoUv1利用距離注意力顯著放大普通錨框的損失,計算公式為
LIoU=1-IoU°
式中: LIoU 為邊界框回歸; IoU 為重疊程度。
LwloUv1=RwloULIoU°
式中, RWIoU 為距離注意力。
式中: Wg2 和 Hg2 分別表示并集框的寬度和高度; x,y 和xgyg分別為預(yù)測框和真實框的中心坐標。為了消除可能阻礙收斂的因素, Wg2+Hg2 使用了從計算圖中分離的方式進行處理。 RWloU 的取值范圍為[1,e),能夠顯著增強普通錨框?qū)p失的貢獻,而 LIoU 的取值范圍為[0,1],則在高質(zhì)量錨框中降低 RWIoU 的權(quán)重,使得損失更關(guān)注錨框與目標框中心點的距離。當將單調(diào)聚焦系數(shù) LIoU* 引人 LWIoUv2 時,有效減弱了簡單樣本對損失的影響。但由于在訓(xùn)練中 LIoU* 隨著 LIoU 的減小而下降,可能導(dǎo)致收斂速度減慢,因此采用 LIoU 的平均值進行歸一化以加速收斂,WIoUv2計算公式為
式中, γ 為非單調(diào)聚焦系數(shù)。
WIoUv3相較于WIoUv1和WIoUv2,引入了動態(tài)非單調(diào)聚焦機制,并通過離群度 β 對錨框質(zhì)量進行度量?;陔x群度構(gòu)建的非單調(diào)聚焦系數(shù) (γ) ,能夠在訓(xùn)練過程中動態(tài)調(diào)整損失函數(shù)中的梯度增益,降低高質(zhì)量錨框的權(quán)重,避免低質(zhì)量錨框產(chǎn)生有害梯度,并聚焦于普通質(zhì)量的錨框,WIoUv3計算公式為
式中 δS 為超參數(shù)。
在木板缺陷檢測任務(wù)中,WIoUv3的引入有助于增強模型在目標框回歸階段的魯棒性和泛化能力,尤其對于多尺度缺陷和復(fù)雜背景下的檢測表現(xiàn)更為出色。這種改進使得模型能夠更好地平衡訓(xùn)練中的樣本質(zhì)量分布,提高檢測的精確度和穩(wěn)定性。
3 結(jié)果與分析
3.1 試驗環(huán)境
試驗的操作系統(tǒng)為Windows11,CPU為IntelCore i9- 13900F@2.10GHz GPU為NVDIAGe Force RTX4070(8GB),運行內(nèi)存為 32GB Pytorch版本為1.13.0,Python版本為3.9,CUDA版本為12.1,相機選用MVS03260GC。
參數(shù)設(shè)置:圖片大小設(shè)置為 640×640 像素,訓(xùn)練輪次為300,批量大小為16,學(xué)習(xí)率為0.01。
3.2 評價指標
試驗采用了精確率(precision,式中記為 P )召回率(Recall,式中記為 R 以及平均精度均值(meanaver-age precision, mAP ,式中記為 mAP) ,平均精度(averageprecision,AP,式中記為 AP ),包括 mAP@50 ,浮點運算次數(shù)GFLOPs,模型參數(shù)量(parameters),相關(guān)計算公式為
式中: TP 為模型正確預(yù)測為正的樣本數(shù)(truepositive);FP 為預(yù)測目標錯誤的個數(shù)(1positive); FN 為模型錯誤預(yù)測為負的樣本數(shù)(1negative); n 為類別個數(shù);i 為檢測的次數(shù)。
3.3 消融試驗
為驗證改進模塊對YOLOv8模型性能的提升效果,本研究設(shè)計了一系列消融試驗,在原始YOLOv8模型的基礎(chǔ)上逐一添加改進模塊,并對模型的檢測性能進行了比較,試驗結(jié)果見表2。
表2消融試驗結(jié)果
基礎(chǔ)模型為原始 YOLOv8 ,其精確率 (P) 為 90.0% ,召回率 (R) 為 87.8%,mAP@50 為 92.9% ,GFLOPs為8.1G,參數(shù)量為3.0M,該模型作為消融試驗的對照基準。在YOLOv8模型的Backbone部分引人C2f_CA模塊,用于增強模型的特征提取能力,但計算復(fù)雜度和參數(shù)量沒有增加,與基準模型相比, 提高了 0.4% ,達到 93.3% ,召回率提高了 0.7% ,達到 88.5% ,GFLOPs和參數(shù)量保持不變。在YOLOv8模型的Neck部分引入CSPPC模塊,通過輕量化設(shè)計降低了計算和參數(shù)量,略微犧牲了部分性能,但提高了計算效率。通過輕量化設(shè)計優(yōu)化特征融合,與基準模型相比,精確率提高了 2.3% ,達到 92.3% , mAP@50 降低了 0.1% ,GFLOPs降低為7.2G,參數(shù)量減少至 2.57M 。在YOLOv8模型中同時加人C2f_CA和CSPPC模塊,綜合提升特征提取和融合能力,有效提升了模型的整體性能,同時保持了較低的計算開銷,與基準模型相比,
提高了0.7% ,達到 93.6% ,召回率保持不變,GFLOPs和參數(shù)量分別為7.2G和 2.58M 。在同時添加C2f_CA和CSPPC模塊的基礎(chǔ)上,進一步將回歸損失函數(shù)替換為WIoUv3優(yōu)化邊界框回歸,進一步改善模型的整體性能。綜合試驗結(jié)果顯示,精確率為 89.9% ,召回率提高至 89.9% , mAP@50 提升至 93.8% ;GFLOPs和參數(shù)量保持為7.2G和 2.58M 。該組試驗驗證了各改進模塊的有效協(xié)同作用,顯著降低了訓(xùn)練參數(shù),達到了輕量化效果,且提升了檢測性能。
3.4 對比試驗
為了驗證改進模型CP-YOLOv8在膠合板表面缺陷檢測任務(wù)中的性能優(yōu)勢,本研究選取了YOLOv8n、YOLOv5n、YOLOv6和YOLOv9s等主流目標檢測模型進行對比試驗。試驗結(jié)果見表3。
CP-Y0LOv8在精確率、召回率和平均精度等指標上表現(xiàn)出色,如圖7和圖8所示。在整個訓(xùn)練過程中,CP-YOLOv8(紅色)的表現(xiàn)最為突出,其mAP50值在大部分Epoch中都高于其他算法,GFLOPs低于大部分模型。且CP-YOLOv8與YOLOv8n進行設(shè)備實測,如圖9所示。由圖9發(fā)現(xiàn),CP-YOLOv8可以更準確地識別出缺陷,相比于其他的檢測算法,可以更好地完成膠合板單板表面缺陷的目標檢測任務(wù),同時具有輕量化設(shè)計和較低計算復(fù)雜度。
3.5 不同損失函數(shù)結(jié)果比較
為了進一步驗證WIoU不同版本的優(yōu)勢,本研究在相同的試驗條件 下,對CIoU、EIoU、GIoU、SIoU以及WIoU的3個版本(WIoUv1、WIoUv2和WIoUv3)進行了詳細的試驗對比,試驗結(jié)果見表4。由表4可知,EIoU在精確率 (P) 方面較CIoU有一定程度下降,但GIoU的召回率 (R) 有小幅提升。而3種WIoU方法均展現(xiàn)出較好的綜合性能,其中,WIoUv3在 mAP@50 指標上達到了 93.8% ,召回率 (R) 也提升至 89.9% ,表現(xiàn)最優(yōu)。
4結(jié)論
本研究針對膠合板單板表面缺陷檢測任務(wù)的復(fù)雜性,提出了一種基于改進 YOLOv8n 的檢測模型,重點優(yōu)化了模型的檢測精度和輕量化特性。為實現(xiàn)這一目標,進行了3項關(guān)鍵改進:在網(wǎng)絡(luò)的Backbone部分的C2f模塊中引入CA注意力機制,以增強網(wǎng)絡(luò)的空間信息感知能力和特征提取精度,在保證輕量化的同時,提高了復(fù)雜背景下的目標檢測性能;提出CSPPC模塊,作為Head部分C2f模塊的替代,通過減少卷積計算的通道數(shù),有效降低了計算復(fù)雜度和內(nèi)存占用,同時保持了多尺度特征提取能力;結(jié)合動態(tài)非單調(diào)聚焦機制的WIoUv3損失函數(shù),在模型訓(xùn)練中動態(tài)分配梯度權(quán)重,有效平衡了高質(zhì)量與低質(zhì)量錨框的貢獻,提升了邊界框擬合精度和模型的魯棒性。試驗結(jié)果表明,改進后的模型在對膠合板單板表面缺陷檢測的平均精度均值0 mAP@50 上達到了 93.8% ,同時召回率(R)提升至89.9% ,并顯著減少了模型參數(shù)量和計算復(fù)雜度,改進模型浮點運算次數(shù)(GFLOPs)和參數(shù)量降低至7.2G和 2.58M ,使其可在算力較低的設(shè)備上得到有效應(yīng)用,改進后的模型在檢測精度、速度及輕量化性能方面均表現(xiàn)出色,為膠合板單板表面缺陷檢測任務(wù)提供了一種高效、精準且實用的解決方案。
參考文獻
[1]LIMWH,BONAB MB,CHUAKH.An aggressively
pruned CNN model with visualattentionfor near real-time wooddefectsdetection onembedded processors[Jl.IEEE Access,2023,11:36834-36848.
[2]XIE Y H,WANGJC.Study on the identification of the woodsurface defectsbased ontexture features[Jl.OptikInternational Journal forLightand Electron Optics,2015, 126(19):2231-2235.
[3]王金聰,宋文龍,張彭濤.應(yīng)用改進分水嶺算法對木材 表面缺陷圖像分割試驗[J].東北林業(yè)大學(xué)學(xué)報,2018, 46(10) :93-97. WANGJC,SONGWL,ZHANG PT,etal.Image segmentation ofwood surface defectswith improved watershed algorithm[J]. Journal of Northeast Forestry University,2018, 46(10):93-97.
[4]LIUW,ANGUELOVD,ERHAND,etal.SSD:Single shot multibox detector[C]//European Conference on Computer Vision,October11-14,2016,Amsterdam,TheNetherlands,2016:21-37.
[5]CHENG D,CHENG G,WANG X.Real-time detection method ofwood defectsbased ondeeplearning[Cl//2022 IEEE8th International Conference on Computer and Communications(ICCC),09-12 December,2022,Chengdu, China,IEEE,2022:2192-2197.
[6]REDMONJ,DIVVALA S,GIRSHICK R,et al. You only look once:Unified,real-time object detection[Cl//2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),12December 2016,LasVegas,NV,USA. IEEE,2016:779-788.
[7] YUAN W. Accuracy comparison of YOLOv7 and YOLOv4 regarding image annotation quality for apple flower bud classification[J].AgriEngineering,2023,5(1) :413-424.
[8]ROSS G. Fast R-CNN[C]//2015 IEEE International Conference on Computer Vision(ICCV),O7-13 December 2015,Santiago,Chile.IEEE,2015:1440-1448.
[9]REN SQ,HE K M,GIRSHICK R,et al. Faster R-CNN: Towards real-time object detection with region proposal networks [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6) : 1137-1149.
[10]LIUZF,LIUXH,LICL,etal.Fabric defect detection based on faster R-CNN[C]// 9th International Conference on Graphic and Image Processing,14-16 October 2017,Qingdao,China. 2018:55-63.
[11]HAN S,JIANG X,WU Z.An Improved YOLOv5 algo rithm for wood defect detectionbased on attention[J]. IEEE Access,2023,11:71800-71810.
[12] LI D,XIE W,WANG B,et al. Data augmentation and layered deformable mask R-CNN-Based detection of wood defects[J].IEEE Access,2021,9:108162-108174.
[13] XIA B,LUO H,SHI S.Improved faster R-CNN based surface defect detection algorithm for plates[J].Computational Intelligence and Neuroscience,2O22,2022: 3248722.
[14]賈浩男,徐華東,王立海,等.基于改進YOLOv5木板材 表面缺陷的定量識別[J].北京林業(yè)大學(xué)學(xué)報,2023,45 (4):147-155. JIAHN,XUHD,WANGLH,etal.Quantitative identification of surface defects in wood panelingbased on improved YOLOv5[J]. Journal of Beijing Forestry University,2023,45(4) :147-155.
[15]江興旺,趙興強.改進YOLOv7的木材表面缺陷檢測算 法[J].計算機工程與應(yīng)用,2024,60(7):175-182. JIANGX W,ZHAO XQ.Improved YOLOv7 algorithm for wood surface defect detection[J]. Computer Engineering and Applications,2024,60(7) :175-182.
[16]曹永鑫,劉芳華,江來,等.基于YOLOv5-LW模型的木 材表面缺陷檢測方法[J].林業(yè)工程學(xué)報,2024,9(5): 144-152. CAOYX,LIUFH,JIANGL,etal.Detectionofwood surface defectsusing YOLOv5-LW model[J]. Journal of Forestry Engineering,2024,9(5) :144-152.
[17]胡繼文,張國梁,李文浩,等.輕量化YOLOv5n的木材 表面缺陷檢測模型[J].林產(chǎn)工業(yè),2024,61(11):6- 13,32. HUJW,ZHANGGL,LIWH,et al. Timber surface defect detection model based on lightweight YOLOv5n[J]. China Forest Products Industry,2024,61(11) :6-13,32.
[18]朱豪,周順勇,曾雅蘭,等.基于改進YOLOv5s的木材 表面缺陷檢測模型[J].木材科學(xué)與技術(shù),2023,37(2): 8-15. ZHU H,ZHOU SH,ZENG YL,et al.Detection model of wood surface defects based on improved YOLOv5s[Jl. Chinese Journal of Wood Science and Technology,2023, 37(2):8-15.
[19]曾小山,張小波.基于YOLO-RW模型的機器視覺原 木端面識別定位[J].森林工程,2023,39(5):144-153. ZENGXS,ZHANGXB.A log end face recognition and positioning model based on YOLO-RW[J]. Forest Engineering,2023,39(5):144-153.
[20] YANG G,LEI J,ZHU Z. AFPN: Asymptotic feature pyramid network for object detection[A/OL].arXiv.2306. 15988,2023[2024-12-15].
[21]肖維穎,王健,李文順.松樹株數(shù)識別的YOLOv5輕量 化算法研究[J].森林工程,2023,39(4):126-133. XIAOWY,WANGJ,LIW S.Research on YOLOv5 lightweight algorithm for pine tree strain identification [J].Forest Engineering,2023,39(4):126-133.