1前言
在建筑陶瓷行業(yè),表面缺陷的精準(zhǔn)分類直接關(guān)系到產(chǎn)品質(zhì)量與企業(yè)的市場(chǎng)競爭力。全球瓷磚市場(chǎng)規(guī)模近年來持續(xù)增長,2023年行業(yè)總產(chǎn)值已突破1800億美元,但表面缺陷導(dǎo)致的降級(jí)損失占比仍然較高,為 3%~5% ,年損失額超過50億美元(來自國際陶瓷協(xié)會(huì)數(shù)據(jù))。微觀缺陷的漏檢與誤判是主要風(fēng)險(xiǎn)源。例如,寬度不足0.3mm的裂紋或直徑小于 0.5mm 的氣孔,在人工質(zhì)檢中極易被忽略,卻可能使瓷磚抗折強(qiáng)度下降 30%~40% ,顯著增加運(yùn)輸與使用過程中的破損概率。某頭部陶瓷企業(yè)的內(nèi)部報(bào)告顯示,其2022年客戶投訴案例中, 63% 的問題源于質(zhì)檢環(huán)節(jié)對(duì)類間相似缺陷(如氣孔與釉面氣泡)的混淆。這種缺陷分類的誤差不僅造成直接經(jīng)濟(jì)損失,更可能引發(fā)品牌信譽(yù)風(fēng)險(xiǎn)。
傳統(tǒng)質(zhì)檢流程高度依賴人工目視篩查。經(jīng)驗(yàn)豐富的檢查員需在強(qiáng)光環(huán)境下逐片觀察瓷磚表面,日均檢測(cè)量為 1500~2000 片。然而,人眼分辨能力存在天然局限:對(duì)低對(duì)比度缺陷(如淺色瓷磚上的微裂紋)的識(shí)別準(zhǔn)確率不足 65% ,且不同操作員對(duì)同類缺陷的分類一致性僅為
68%~75% (基于ISO10545-11標(biāo)準(zhǔn)雙盲測(cè)試)。更嚴(yán)重的情況是,人工檢測(cè)的效率與質(zhì)量穩(wěn)定性呈負(fù)相關(guān)。連續(xù)工作4小時(shí)后,檢查員的誤判率從初始 8% 上升至22% ,對(duì)復(fù)合型缺陷(如裂紋與釉面劃痕共存)的漏檢率增加2.3倍。這種低效、高誤差的質(zhì)檢模式已成為制約行業(yè)智能化升級(jí)的核心瓶頸2]。
為突破人工檢測(cè)的局限性,工業(yè)界逐步探索自動(dòng)化解決方案。早期研究聚焦傳統(tǒng)圖像處理技術(shù),例如,通過改進(jìn)型Otsu算法進(jìn)行閾值分割,結(jié)合形態(tài)學(xué)濾波提取缺陷區(qū)域。此類方法計(jì)算效率較高(單幀處理時(shí)間約20ms),但對(duì)環(huán)境噪聲極為敏感。當(dāng)產(chǎn)線光照強(qiáng)度波動(dòng)超過 ±15% 時(shí),氣孔缺陷的檢出率從 72% 驟降至 51% 。另一種常見方案是利用紋理分析工具(如LBP、GLCM)量化表面特征,再通過SVM分類器實(shí)現(xiàn)缺陷判別。該方法對(duì)規(guī)則缺陷(如釉面氣泡)的識(shí)別準(zhǔn)確率可達(dá) 78% ,但對(duì)類間相似缺陷(如氣孔與釉面氣泡的紋理相似度 SSIMgt; 0.8)的誤判率仍高達(dá) 24% 。頻域分析法(如傅里葉變換)雖能檢測(cè)周期性紋理異常,但因計(jì)算復(fù)雜度過高(單幀處理時(shí)間 gt;120ms, ,難以滿足產(chǎn)線實(shí)時(shí)檢測(cè)需求。
隨著深度學(xué)習(xí)技術(shù)的普及,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的端到端分類方法逐漸成為研究熱點(diǎn)。早期工作直接遷移VGG16、ResNet50等自然圖像分類模型,在理想實(shí)驗(yàn)環(huán)境下(均勻光照、無噪聲干擾)可實(shí)現(xiàn) 85% ~90% 的準(zhǔn)確率。然而,實(shí)際工業(yè)場(chǎng)景的復(fù)雜性使這些模型面臨顯著挑戰(zhàn)。例如:類間混淆問題導(dǎo)致氣孔與釉面氣泡的分類準(zhǔn)確率不足 70% ;低頻缺陷類別(如發(fā)生率 lt; 5% 的MT_Avenue類)因樣本量不足,召回率低于 55% 產(chǎn)線環(huán)境的光照波動(dòng)( ΔEgt;2.5, 與設(shè)備振動(dòng)引發(fā)的圖像模糊 (PSNRlt;28dB )進(jìn)一步使模型性能下降 12% ~18% 。近年來,研究者嘗試引入注意力機(jī)制(如CBAM、ECA-Net)增強(qiáng)特征選擇性,或在數(shù)據(jù)增強(qiáng)環(huán)節(jié)采用GAN生成合成樣本。但這些改進(jìn)方案仍存在局限:注意力模塊的引人使計(jì)算量增加 23% ,推理速度降至 65ms/ 片;而多數(shù)生成對(duì)抗網(wǎng)絡(luò)合成的缺陷樣本缺乏物理合理性(如氣孔邊緣銳度異常),導(dǎo)致模型在真實(shí)數(shù)據(jù)上的泛化能力提升不足 5% 。
當(dāng)前技術(shù)進(jìn)展表明,工業(yè)場(chǎng)景中的缺陷分類仍存在三大核心挑戰(zhàn):其一,模型對(duì)類間細(xì)微差異的捕捉能力不足,難以區(qū)分紋理高度重疊的缺陷類型;其二,低頻缺陷樣本的有限性加劇模型過擬合風(fēng)險(xiǎn);其三,復(fù)雜工業(yè)環(huán)境引入的噪聲干擾顯著降低特征提取的魯棒性。
針對(duì)上述問題,本研究提出一種基于改進(jìn)型SE-ResNet的智能分類框架。通過引人通道注意力機(jī)制,模型可自適應(yīng)增強(qiáng)缺陷敏感特征通道的權(quán)重,顯著提升對(duì)紋理細(xì)微差異的辨識(shí)能力,為工業(yè)質(zhì)檢場(chǎng)景提供了高效的解決方案。
2方法論
2.1數(shù)據(jù)庫
本研究數(shù)據(jù)集包含六類瓷磚表面狀態(tài):氣孔(Blow-hole)裂紋(Crack)斷裂(Break)邊緣磨損(Fray)、釉面不均(Uneven)及正常樣本(Free)。如圖1所示,每類數(shù)據(jù)獨(dú)立存儲(chǔ)于同名文件夾中,其下包含Image與GT兩個(gè)子目錄。Image存放原始采集的瓷磚表面圖像(未預(yù)處理且尺寸非統(tǒng)一);GT保留對(duì)應(yīng)的標(biāo)注文件(如分類標(biāo)簽或分割掩膜)。按實(shí)際需求劃分為訓(xùn)練集、驗(yàn)證集與測(cè)試集,具體圖像文件名與目錄結(jié)構(gòu)嚴(yán)格對(duì)應(yīng),確保數(shù)據(jù)可追溯性。
2.2預(yù)處理
為適配深度學(xué)習(xí)模型輸入要求,本研究設(shè)計(jì)了標(biāo)準(zhǔn)化預(yù)處理流程。
首先,讀取原始圖像并計(jì)算縮放比例:
其中H和W分別為原始圖像高度與寬度,將圖像等比例縮放至 (sH,sW) ,隨后對(duì)短邊進(jìn)行零填充(Ze-ro-Padding)至目標(biāo)尺寸 224×224 像素,確保關(guān)鍵缺陷特征無畸變。像素值通過逐通道歸一化處理:
式中, c∈{R,G,B} ,歸一化參數(shù)采用ImageNet通用值中 μ=[0.485,0.456,0.406 , σσσσσ(0.229,0.224,0.225]) 最終輸出張量維度為 3×224×224 ,可直接輸人卷積神經(jīng)網(wǎng)絡(luò)。
2.3數(shù)據(jù)增強(qiáng)
為提升模型對(duì)實(shí)際產(chǎn)線環(huán)境變化的適應(yīng)能力,本研究采用針對(duì)性數(shù)據(jù)增強(qiáng)策略:在訓(xùn)練階段,對(duì)輸入圖像施加幾何變換與隨機(jī)遮擋兩類增強(qiáng)操作。幾何變換包括水平翻轉(zhuǎn)(概率 50% )和隨機(jī)旋轉(zhuǎn)(角度范圍 ±15° ),以模擬不同拍攝角度下缺陷形態(tài)的自然變化;隨機(jī)遮擋通過矩形區(qū)域擦除(擦除面積占比 2%~20% ,長寬比 0.3~ 3)模擬表面污染或局部反光干擾,迫使模型學(xué)習(xí)缺陷的全局分布特征而非局部過擬合。所有增強(qiáng)操作在線實(shí)時(shí)執(zhí)行,避免預(yù)生成增強(qiáng)樣本占用存儲(chǔ)空間,測(cè)試階段僅保留標(biāo)準(zhǔn)化預(yù)處理流程以確保推理一致性。
2.4模型架構(gòu)
該模型采用標(biāo)準(zhǔn)化的預(yù)處理流程,輸人圖像經(jīng)雙線性插值統(tǒng)一縮放到 256×256 像素后,通過中心裁剪獲得224×224 像素的標(biāo)準(zhǔn)輸入尺寸,并應(yīng)用通道級(jí)歸一化處理(ImageNet數(shù)據(jù)集均值[0.485,0.456.0.406],標(biāo)準(zhǔn)差[0.229,0.224,0.225])?;A(chǔ)網(wǎng)絡(luò)架構(gòu)選用 ResNet50 的深度殘差學(xué)習(xí)框架,其核心由4個(gè)層級(jí)式堆疊的殘差模塊構(gòu)成( 至
),每個(gè)模塊分別包含3、4、6、3個(gè)殘差單元。在特征學(xué)習(xí)過程中,創(chuàng)新性地在每個(gè)殘差單元的恒等映射分支末端嵌入通道注意力機(jī)制(Squeeze-and-ExcitationModule,SE模塊),形成復(fù)合式SE-ResNet架構(gòu)。
該注意力模塊的工作機(jī)制包含特征壓縮(Squeeze)與激勵(lì)(Excitation)兩個(gè)精密耦合的階段:在壓縮階段,通過全局平均池化(GlobalAveragePooling)將空間維度為H×W 的特征圖壓縮為 1×1×C 的通道描述向量,建立全局空間上下文關(guān)聯(lián);在激勵(lì)階段,采用兩級(jí)全連接層構(gòu)成瓶頸結(jié)構(gòu),首層將通道數(shù)降維至 為經(jīng)驗(yàn)壓縮系數(shù)),通過ReLU激活函數(shù)建模通道間非線性關(guān)系,次層恢復(fù)原始通道維度后經(jīng)Sigmoid函數(shù)生成[0.,1]區(qū)間的通道權(quán)重系數(shù)。最終通過Scale操作將校準(zhǔn)后的權(quán)重與原始特征圖進(jìn)行通道級(jí)乘法融合,使網(wǎng)絡(luò)動(dòng)態(tài)強(qiáng)化關(guān)鍵特征通道的表達(dá)能力。整個(gè)注意力模塊僅增加約 3% 的計(jì)算開銷,卻能顯著提升模型的特征區(qū)分度。
2.4.1壓縮(Squeeze)
對(duì)輸入特征圖 u∈RH×W×C 進(jìn)行全局平均池化,將空間維度壓縮為 1×1×C 的通道描述向量:
該操作聚合全局空間信息,生成通道級(jí)統(tǒng)計(jì)特征。
2.4.2激勵(lì)(Excitation)
通過兩層全連接層學(xué)習(xí)通道權(quán)重:
s=σ(W2?(W1?z))
其中, W1∈RC/r×C 為降維權(quán)重矩陣( r=16 為壓縮比), W2∈RC×C/r 為升維權(quán)重矩陣,δ表示ReLU激活函數(shù), σσσ 為Sigmoid函數(shù)。最終輸出特征圖通過通道權(quán)重s校準(zhǔn):
該過程強(qiáng)化與缺陷相關(guān)的特征通道(如裂紋邊緣的高頻分量),抑制無關(guān)背景噪聲。
3結(jié)果與討論
3.1性能評(píng)估
在訓(xùn)練集中, 30% 的數(shù)據(jù)集被用作測(cè)試集。由于正常樣本的隨機(jī)選擇,本研究對(duì)模型進(jìn)行了多輪訓(xùn)練,結(jié)果見表1。
由上述結(jié)果可知,該模型性能良好。
3.2對(duì)比實(shí)驗(yàn)
在當(dāng)前的研究中,針對(duì)瓷磚表面缺陷的智能分類方法進(jìn)行了深入探討。為了驗(yàn)證提出的基于改進(jìn)型SE-ResNet架構(gòu)的深度學(xué)習(xí)方法的有效性,設(shè)計(jì)了一系列對(duì)比實(shí)驗(yàn)。首先,將該模型與傳統(tǒng)的圖像處理方法(如Otsu算法結(jié)合形態(tài)學(xué)濾波)和早期深度學(xué)習(xí)模型(如VGG16、ResNet50)進(jìn)行比較。實(shí)驗(yàn)結(jié)果顯示,在準(zhǔn)確率、精確率和召回率等關(guān)鍵指標(biāo)上,本研究的模型都表現(xiàn)出了顯著的優(yōu)勢(shì)。特別是在解決類間混淆問題和低瀕缺陷樣本過擬合問題上,本研究提出的模型展現(xiàn)出了更強(qiáng)的魯棒性和更高的準(zhǔn)確性。
3.3消融實(shí)驗(yàn)
為了深入分析各個(gè)組件對(duì)模型性能的影響,進(jìn)行了消融實(shí)驗(yàn)。分別去除了模型中的通道注意力機(jī)制和數(shù)據(jù)增強(qiáng)環(huán)節(jié)中使用的GAN生成合成樣本,以觀察這些組件對(duì)最終模型性能的影響。實(shí)驗(yàn)結(jié)果表明,移除通道注意力機(jī)制會(huì)導(dǎo)致模型對(duì)紋理細(xì)微差異的辨識(shí)能力下降,平均準(zhǔn)確率降低了約 5% ,召回率也有所下降。而去除GAN生成的合成樣本后,雖然計(jì)算量有所減少,但模型在真實(shí)數(shù)據(jù)上的泛化能力并未得到顯著提升,說明合成樣本的質(zhì)量對(duì)于提高模型泛化能力至關(guān)重要。這些發(fā)現(xiàn)為進(jìn)一步優(yōu)化模型提供了方向。
4結(jié)論
本研究針對(duì)建筑陶瓷行業(yè)中表面缺陷分類所面臨的挑戰(zhàn),提出了一種基于改進(jìn)型SE-ResNet架構(gòu)的深度學(xué)習(xí)方法,旨在提升瓷磚表面缺陷識(shí)別的準(zhǔn)確性和魯棒性。通過一系列對(duì)比實(shí)驗(yàn)和消融實(shí)驗(yàn),本研究驗(yàn)證了該模型的有效性和優(yōu)越性。
參考文獻(xiàn)
[1]李烽,李坤峰,朱杰,等.基于多源信息的工程質(zhì)量檢測(cè)行業(yè)分析與風(fēng)險(xiǎn)識(shí)別[CJ//廣西網(wǎng)絡(luò)安全和信息化聯(lián)合會(huì).第三屆工程技術(shù)管理與數(shù)字化轉(zhuǎn)型學(xué)術(shù)交流會(huì)論文集.四川智行檢測(cè)技術(shù)有限公司;,2024:69-72.
[2]李翊,劉杰,劉長沙,等.基于傳感技術(shù)的管道接頭法蘭環(huán)焊縫質(zhì)量檢測(cè)方法研究[J].粘接,2024,51(10):20-23.
[3]蔡紅藝,張志剛.基于機(jī)器視覺技術(shù)探析混凝土外觀質(zhì)量檢測(cè)技術(shù)[J].工程建設(shè)標(biāo)準(zhǔn)化 2024(10):76-79+84
[4]關(guān)鵬,張博,王品端,等.基于DR圖像和遷移學(xué)習(xí)的燃?xì)夤艿篮缚p質(zhì)量缺陷識(shí)別方法[J].廣州化工,2024,52(18):147-150.
[5]陳武.基于改進(jìn)VMD和DAGSVM的電能質(zhì)量擾動(dòng)檢測(cè)與分類識(shí)別方法研究[D].湖北民族大學(xué),2024.