李 毅,許知建,王逸涵,楊 前,李柏林
(西南交通大學(xué)機械工程學(xué)院,成都 610031)
近年來,隨著我國鐵路運營里程的不斷增長,多功能鐵路綜合巡檢車[1]被開發(fā)用于替代人工巡檢鐵路。漏纜卡扣作為固定鐵路信號傳輸線路的重要裝置[2]也被納入綜合巡檢車的檢測范圍[3-6]。作為智能巡檢的關(guān)鍵部分,卡扣缺陷檢測算法是不可或缺的。圖1展示了由綜合巡檢車采集到的漏纜及漏纜卡扣圖像。目前,基于特征設(shè)計[7]和深度學(xué)習(xí)[8]等方法被廣泛地應(yīng)用于卡扣的缺陷檢測,取得了較好的檢測結(jié)果。然而,上述算法只針對單個類型卡扣的缺陷識別,無法滿足實際檢測中對于多種類型卡扣識別的需求。而多類型卡扣的缺陷識別仍然存在以下問題及挑戰(zhàn):(1)不同類型卡扣形態(tài)學(xué)差異較大,以人工特征設(shè)計為基礎(chǔ)的方法對多類型卡扣的缺陷識別缺乏魯棒性;(2)相較于漏纜圖像,卡扣尺寸較小,無法提供足夠的特征用于缺陷識別;(3)卡扣的缺陷樣本是罕見的,且缺陷類型多樣,因此收集的數(shù)據(jù)很難擬合真實的缺陷數(shù)據(jù)分布,這會導(dǎo)致以監(jiān)督學(xué)習(xí)為基礎(chǔ)的方法存在缺陷卡扣漏檢的問題。
針對監(jiān)督學(xué)習(xí)方法由于缺陷樣本不足而無法有效地對其進行識別的問題,以生成對抗網(wǎng)絡(luò)(generative adversarial network,GAN)為基礎(chǔ)的無監(jiān)督或半監(jiān)督的方法被廣泛地用于正負(fù)樣本不平衡的缺陷檢測問題中[9-12],其缺陷檢測流程如圖2所示。通過生成器與判別器的對抗訓(xùn)練來學(xué)習(xí)正常樣本的分布,并將學(xué)習(xí)后的生成器用于包含缺陷樣本重構(gòu),最終算法依據(jù)重構(gòu)前后的圖像差異來判斷樣本是否存在缺陷。由于訓(xùn)練只需正常樣本,因此基于GAN的缺陷檢測方法對缺陷樣本的分布不敏感。針對缺陷樣本較少的缺陷檢測問題,葛小三等[13]將GAN用于在遙感圖像中檢測災(zāi)后受損的建筑。張宏偉等[14]將GAN用于有色織物的缺陷檢測中,并通過添加高斯噪聲的方式增強檢測的魯棒性。AKCAY等[15]提出了Skip-GANomaly用于檢測X-ray圖像中的異常物體。該方法以增加跳躍連接的方式實現(xiàn)了特征的重復(fù)利用,這使得生成器網(wǎng)絡(luò)能夠捕獲多尺度圖像空間的細(xì)節(jié)信息,輸出高質(zhì)量的重構(gòu)圖像。基于Skip-GANomaly網(wǎng)絡(luò),王道累等[16]引入結(jié)構(gòu)相似度與峰值信噪比的差異分?jǐn)?shù)計算方法,實現(xiàn)了玻璃絕緣子自爆缺陷的檢測。盡管上述方法取得較好的缺陷檢測性能,但Skip-GANomaly采用跳躍連接在重復(fù)利用特征的同時也容易導(dǎo)致生成器訓(xùn)練的過擬合,這使得生成器網(wǎng)絡(luò)無法精確地重構(gòu)缺陷卡扣,導(dǎo)致缺陷卡扣的漏檢。由于卡扣缺陷的主要形式為結(jié)構(gòu)缺失,隨機高斯噪聲不能改善卡扣缺陷重構(gòu)的過擬合問題。
圖2 基于GAN方法的缺陷檢測流程Fig.2 The process of defect detection based on GAN defect detection process
綜上,針對監(jiān)督學(xué)習(xí)方法在卡扣缺陷識別中對缺陷數(shù)據(jù)敏感的問題,提出一種基于GAN的多類型卡扣缺陷檢測算法。此外,受文獻(xiàn)[17]的啟發(fā),以分塊處理的方式將正常卡扣圖像拆分為多個不相交的子集圖像,并使用拆分圖像訓(xùn)練GAN網(wǎng)絡(luò)。在單個子集圖像中一些區(qū)域被隨機去除,這使得生成器網(wǎng)絡(luò)更多地側(cè)重于利用去除部分的鄰域信息重構(gòu)卡扣圖像;同時,圖像拆分也是一種數(shù)據(jù)增廣方式,它能夠改善Skip-GANomaly中生成器網(wǎng)絡(luò)的過擬合導(dǎo)致缺陷漏檢的問題。不同于文獻(xiàn)[17]中采用的多尺度訓(xùn)練方法,本文根據(jù)卡扣尺寸大致相當(dāng)?shù)奶匦?采用了單尺度的訓(xùn)練方式,簡化了訓(xùn)練流程,提高了訓(xùn)練速度。在缺陷判別方面,針對卡扣圖像的成像質(zhì)量低導(dǎo)致采用結(jié)構(gòu)相似度、峰值信噪比和殘差等方式無法有效地根據(jù)重構(gòu)前后的卡扣圖像判別缺陷,采用一種基于余弦相似度[18]的異常分?jǐn)?shù)計算方法,提升卡扣缺陷識別的性能。
本文提出的基于分塊重構(gòu)GAN的多類型漏纜卡扣缺陷檢測算法流程如圖3所示,算法主要由三部分組成:漏纜卡扣定位、卡扣分塊重構(gòu)和卡扣缺陷檢測。首先,目標(biāo)檢測網(wǎng)絡(luò)被用于定位并截取卡扣圖像I,減少后續(xù)卡扣重構(gòu)過程中背景區(qū)域的干擾。其次,基于分塊重構(gòu)的Skip-GANomaly被用于重構(gòu)截取的卡扣圖像I,并生成重構(gòu)圖像Ir。最后,基于卡扣圖像I和重構(gòu)圖像Ir,并利用余弦相似度來判斷該卡扣是否存在缺陷。
圖3 通訊漏纜卡扣缺陷檢測算法流程Fig.3 The Algorithm flow of the defect detection for cable fastener
由于卡扣類型多樣且尺寸較小,漏纜圖像無法提供足夠的特征用于準(zhǔn)確地完成卡扣定位、分類和缺陷判別。為避免漏纜圖像中無用的背景信息干擾后續(xù)重構(gòu),首先采用目標(biāo)檢測網(wǎng)絡(luò)定位并截取卡扣區(qū)域,使后續(xù)重構(gòu)網(wǎng)絡(luò)專著于卡扣特征的學(xué)習(xí)。
在漏纜卡扣圖像數(shù)據(jù)集上,詳細(xì)地對比了Faster-RCNN[19-20]、YOLOv4[21-22]及YOLOv5[23-24]等目標(biāo)檢測網(wǎng)絡(luò)的定位性能和時間效率。在權(quán)衡了算法的時間效率和定位性能后,最終選取YOLOv5-M作為卡扣的定位算法。YOLOv5-M主要由特征提取模塊和預(yù)測模塊組成,其前者用于提取目標(biāo)的特征,后者則用于回歸目標(biāo)的位置。由于漏纜數(shù)據(jù)集中各類型卡扣的尺寸大致相當(dāng),將卡扣定位后的截取尺寸設(shè)為128像素×128像素,截取的卡扣如圖3中I所示。
基于GAN的缺陷檢測方法期望生成器能夠?qū)毕莸膱D像以較高的異常分?jǐn)?shù)進行重構(gòu)。而在實際情況中,基于深度卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的生成器在采用跳躍連接來增強其特征表征能力的同時,也容易導(dǎo)致部分缺陷區(qū)域特征被過擬合地表達(dá)在重構(gòu)圖像中,這會導(dǎo)致以重構(gòu)誤差為基準(zhǔn)的缺陷檢測方法失效。針對這個問題,提出分塊重構(gòu)的方法來緩解過擬合問題。如圖4所示,首先以網(wǎng)格的形式將截取的卡扣圖像I劃分為N個矩形區(qū)域,其中每個區(qū)域的大小均為k×k像素。
(1)
式中,H和W分別為圖像的高度和寬度。
這N個矩形區(qū)域被隨機劃分為n個互補的子集Si,i∈{1,2,…,n},其中每個子集包含N/n個矩形區(qū)域。根據(jù)每個子集Si生成對應(yīng)的二元掩碼MSi,每個掩碼的尺寸與卡扣圖像相同,其生成方法如式(2)所示。
(2)
根據(jù)該二元掩碼,子集圖像Ii可表示為卡扣圖像與掩碼的點積,即
Ii=MSi⊙I
(3)
式中,子集圖像Ii表示將卡扣圖像I中屬于Si的區(qū)域去除,并使用像素點0來填充。
(4)
在每個圖像子集中,由于卡扣圖像的部分區(qū)域被隨機去除,因此,生成器網(wǎng)絡(luò)將更多地側(cè)重于利用去除部分的鄰域信息來修復(fù)圖像,從而緩解生成器網(wǎng)絡(luò)的過擬合。
本文采用的卡扣圖像重構(gòu)網(wǎng)絡(luò)為Skip-GANomaly,主要由生成器和判別器組成。生成器網(wǎng)絡(luò)主要用于學(xué)習(xí)輸入特征到輸出圖像的映射關(guān)系,其采用的Skip-Unet網(wǎng)絡(luò)主要包含用于特征下采樣的編碼器以及上采樣的解碼器。編碼器通過組合運用卷積和池化層將輸入圖像抽象表示為潛在空間向量δ。解碼器則采用反卷積還原潛在空間向量中的特征信息。此外,跳躍連接被用于傳遞下采樣過程中各層的特征信息,彌補信息采樣過程中丟失的特征信息。生成器的結(jié)構(gòu)及參數(shù)如圖5所示。
圖5 生成器網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)Fig.5 The outlines of generator network and its parameter
圖6 判別器網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)Fig.6 The outlines of discriminator network and its parameter
在對抗訓(xùn)練過程中,監(jiān)督損失函數(shù)主要由對抗損失Ladv、內(nèi)容損失Lcon和潛在損失Llat三部分組成,總體損失L表示為上述三類損失的權(quán)重求和。
L=λ1Ladv+λ2Lcon+λ3Llat
(5)
式中,λ1,λ2和λ3作為權(quán)重參數(shù),用于調(diào)整各部分損失函數(shù)對整體的影響。
(6)
對抗損失的目標(biāo)是確保生成器網(wǎng)絡(luò)盡可能真實地將輸入樣本重構(gòu)為正常的卡扣樣本,并同時保證判別器無法區(qū)分重構(gòu)樣本與輸入樣本。
在內(nèi)容損失中,L1正則被用于確保生成器重構(gòu)的圖像Ir與輸入圖像I之間具有較強的上下文相似性,如式(7)所示。
(7)
(8)
由于受到采集條件的限制,收集到的漏纜圖像中卡扣區(qū)域具有灰度小、邊界模糊、與背景區(qū)分度較小等特點。因此,采用結(jié)構(gòu)相似度、峰值信噪比和殘差等方法無法有效地依據(jù)重構(gòu)前后的圖像相似度來區(qū)分正常與缺陷卡扣圖像。為提升多類型缺陷卡扣的檢測效果,采用了一種基于余弦相似度的卡扣缺陷檢測方法,其計算方法如式(9)所示。
(9)
式中,ai和bi為向量A和B的分量。
Score=λcosI+(1-λ)cosδ
(10)
式中,λ為權(quán)重參數(shù),用于控制兩部分相似度在缺陷判別中所占比重,λ∈(0,1)。
依據(jù)相似度分?jǐn)?shù),卡扣的缺陷判別結(jié)果Θ被定義為
(11)
本文研究的實驗數(shù)據(jù)來自中國鐵道科學(xué)院,該數(shù)據(jù)是由綜合巡檢車采集到的漏纜卡扣圖像,每張漏纜圖像的尺寸均為2 048×2 021像素。從中挑選了5 052張漏纜圖像作為卡扣缺陷檢測的實驗數(shù)據(jù)集,該數(shù)據(jù)集包含了4種類型的卡扣,其中包含缺陷卡扣的漏纜圖像共445張,均為正??鄣穆├|圖像4 607張。該數(shù)據(jù)集中缺陷卡扣與正常卡扣的具體數(shù)量如表1所示。經(jīng)卡扣定位后,卡扣區(qū)域的截取尺寸均為128×128像素,如圖7所示。
表1 各種類型卡扣的數(shù)量Tab.1 The numbers of various types of fasteners
圖7 各種類型卡扣區(qū)域圖像Fig.7 The visualization of various types of fastener images
將定位到的卡扣數(shù)據(jù)集按照7∶3的比例分為訓(xùn)練集(3 536張圖像)和驗證集(1 516張圖像)。在卡扣重構(gòu)及缺陷判別實驗中,隨機挑選了4 000張截取的正??蹐D像來訓(xùn)練GAN的生成器網(wǎng)絡(luò),每種類型卡扣圖像各1 000張。為驗證GAN算法的缺陷檢測性能,隨機挑選了2 500張未經(jīng)訓(xùn)練的卡扣區(qū)域圖像作為驗證集,其中正常卡扣和缺陷卡扣圖像分別為1 833和667張。
本文所有的實驗均在dell服務(wù)器上進行模擬,該服務(wù)器的CPU為Intel(R) Core(TM) i9-10900X,GPU為NVIDIA GeForce RTX 3090,采用CUDA 11.1版本。采用的編譯語言為Python3.8,并選用PyTorch 深度學(xué)習(xí)框架。在訓(xùn)練卡扣定位算法時,將目標(biāo)檢測網(wǎng)絡(luò)的輸入尺寸統(tǒng)一設(shè)定為416×416×3;并采用Adam優(yōu)化器優(yōu)化目標(biāo)檢測函數(shù);在相關(guān)的網(wǎng)絡(luò)參數(shù)設(shè)置中,batch size被設(shè)定為8,迭代次數(shù)被設(shè)定為200次;初始學(xué)習(xí)率設(shè)定為0.0263。在卡扣缺陷重構(gòu)判別階段,GAN輸入與輸出重構(gòu)圖像的尺寸均為128×128×3像素,在相關(guān)參數(shù)的設(shè)置中,batch size被設(shè)置為8;迭代次數(shù)被設(shè)定為200次;初始學(xué)習(xí)率設(shè)為0.001,學(xué)習(xí)率具有λ衰減的屬性,其中動量b1=0.5和b2=0.999。參考文獻(xiàn)[16],實驗將最終損失函數(shù)L中的三類損失分別設(shè)定為Ladv=1,Lcon=40,Llat=1,并采用Adam優(yōu)化器對式(5)所示總體損失L進行優(yōu)化。
在卡扣定位的實驗中,采用IOU=0.5時的精準(zhǔn)度(Precision)、召回率(Recall)和總體平均準(zhǔn)確率(mean AP,mAP)來評估卡扣的定位性能,其中,mAP值越高表明卡扣的定位性能越好。在卡扣缺陷重構(gòu)判別階段,采用精準(zhǔn)度(Precision)、召回率(Recall)以及AUC值來評估算法的缺陷檢測性能。AUC(area under the curve)值定義為受試者工作特性(receiver operating characteristic curve,ROC)曲線下的面積,其值越接近1,表明模型的缺陷檢測效果越好。
在定位實驗中,詳細(xì)地對比了不同的目標(biāo)檢測網(wǎng)絡(luò)在漏纜卡扣數(shù)據(jù)集上的定位性能,檢測結(jié)果如表2所示。
表2 卡扣定位結(jié)果對比Tab.2 The comparison results of various locating methods
從實驗結(jié)果中可以發(fā)現(xiàn)。
(1)YOLOv4(98.7%)、YOLOv5-M(98.9%)以及YOLOv5-L(99.2%)均取得了較高的定位準(zhǔn)確率,且其檢測速度在實驗的計算設(shè)備上均滿足實時檢測要求。
(2)在所有的定位算法中,YOLOv5-L取得了最高的定位準(zhǔn)確率,其mAP值(99.2%),檢測速度為79FPS。
由于綜合巡檢車巡檢速度約為120 km/h,而數(shù)據(jù)集中每張漏纜圖像沿鐵路方向的視場寬度約2 m,這要求卡扣缺陷識別算法的識別速率應(yīng)遠(yuǎn)大于17FPS。此外,綜合巡檢車還需要同時檢測如接觸網(wǎng)、鐵路扣件、信號盒等其他設(shè)備缺陷,因此卡扣定位算法需要具有較高的時間效率。依據(jù)上述卡扣定位結(jié)果,本文權(quán)衡各個算法的mAP值與時間效率,選擇YOLOv5-M作為最終的卡扣定位方法。
為評估卡扣缺陷檢測方法的有效性,在所構(gòu)建的卡扣數(shù)據(jù)集上測試了無監(jiān)督學(xué)習(xí)方法Skip-GANomaly以及監(jiān)督學(xué)習(xí)方法YOLOv4、YOLOv5-M對缺陷卡扣的檢測性能。卡扣檢測結(jié)果如表3所示。
表3 卡扣缺陷檢測結(jié)果對比Tab.3 The comparision results of defect detection of fasteners
從實驗結(jié)果中可以發(fā)現(xiàn):
(1)本文所提方法在卡扣數(shù)據(jù)集上取得了較好的缺陷檢測性能。針對四種類型的卡扣,本文方法缺陷檢測的平均準(zhǔn)確率和召回率分別為91.1%和91.9%,其AUC值為0.961;
(2)相較于同為無監(jiān)督學(xué)習(xí)的Skip-GANomaly,本文方法對卡扣缺陷檢測的召回率和準(zhǔn)確率分別提升了3.0%和2.8%,這證明了分塊重構(gòu)能夠提升缺陷卡扣的檢測性能;
(3)在卡扣缺陷檢測任務(wù)上,本文算法取得了與采用監(jiān)督學(xué)習(xí)方式的YOLOv4與YOLOv5-M相當(dāng)?shù)臋z測性能。但本文算法在缺陷檢測過程中無需大量的人工標(biāo)注,且對缺陷數(shù)據(jù)分布不敏感。
圖8分別可視化了本文算法與Skip-GANomaly對缺陷卡扣圖像重構(gòu)的效果。采用Skip-GANomaly會保留部分缺陷區(qū)域,并影響最終的缺陷判別。相較而言,本文所提方法能夠較好地將缺陷圖像重構(gòu)為正常的卡扣圖像,保證后續(xù)的缺陷判別。
圖8 缺陷卡扣重構(gòu)效果圖Fig.8 The visualization of reconstruction results of defect fasteners
根據(jù)每個卡扣輸入圖像、重構(gòu)圖像以及潛在空間向量,采用余弦相似度方法計算對應(yīng)的相似度分?jǐn)?shù)。根據(jù)設(shè)定的相似度閾值,本文算法能夠判斷該輸入的卡扣圖像中是否存在缺陷。圖9展示了測試集中2500卡扣圖像相似度分?jǐn)?shù)的分布。
圖9 本文方法相似度分?jǐn)?shù)的分布Fig.9 The score distribution of our similarity method
結(jié)構(gòu)相似度和峰值信噪比作為衡量圖像重構(gòu)效果的重要指標(biāo),也常被一些研究者[16]用于GAN中作為缺陷判別的方法。在卡扣圖像的驗證集上,本文基于重構(gòu)前后的卡扣圖像分布測試了結(jié)構(gòu)相似度和峰值信噪比方法的缺陷檢測性能,它們的相似度分?jǐn)?shù)分布分別如圖10(a)和圖10(b)所示。
圖10 結(jié)構(gòu)相似度和峰值信噪比相似度分?jǐn)?shù)的分布Fig.10 The score distribution of structural similarity method and peak signal-to-noise ratio method
從圖9、圖10中對比可以看出:相較于結(jié)構(gòu)相似度和峰值信噪比,本文提出的基于余弦相似度計算方法在卡扣驗證集上對正??酆腿毕菘鄣膮^(qū)分性能最好。
圖11可視化了采用文獻(xiàn)[15]與文獻(xiàn)[17]中的異常檢測方法對缺陷卡扣的識別結(jié)果。從圖11中可以看出,文獻(xiàn)[15]和文獻(xiàn)[17]中方法無法有效地識別缺陷卡扣的缺陷位置。
圖11 不同方法對缺陷卡扣的識別結(jié)果Fig.11 The results of different defect detection methods
在本文提出的卡扣缺陷檢測算法中,式(11)選取的相似度分?jǐn)?shù)閾值能夠影響卡扣缺陷判別的精度和召回率。此外,式(1)中參數(shù)k能夠決定分塊大小以及分塊數(shù)量,式(2)中的參數(shù)n能夠決定子集圖像的數(shù)量,從而側(cè)面影響單個子集圖像中被去除的區(qū)域。因此,它們都是能夠影響缺陷重構(gòu)效果的重要參數(shù)。
為確定最佳的相似度分?jǐn)?shù)閾值,實驗分別計算了Score∈[0.960,0.970]、子集數(shù)量n=3、去除區(qū)域k=4條件下缺陷卡扣識別的精確度和召回率,實驗結(jié)果如圖12所示。
圖12 不同相似度分?jǐn)?shù)閾值的缺陷識別結(jié)果Fig.12 The quantitative comparison in terms of different similarity score thresholds
從實驗結(jié)果中可以發(fā)現(xiàn):隨著相似度閾值越高,卡扣缺陷檢測的召回率不斷提升,而精度不斷下降。在召回率-精度坐標(biāo)系中,由于坐標(biāo)點越靠近右上角,表明該閾值下的缺陷檢測性能越好。因此,本文選取Score=0.965作為最終的相似度閾值。
為評估k值對缺陷重構(gòu)的影響,實驗中分別測試了k∈{1,2,4,8,16}在子集數(shù)量n=3條件下算法對四種類型缺陷卡扣識別的AUC值。實驗結(jié)果如表4所示。
表4 去除區(qū)域k的大小對缺陷識別結(jié)果影響Tab.4 The influence experiment of the parameter k on the defect detection results
從實驗結(jié)果中可以發(fā)現(xiàn)。
(1)當(dāng)k=4時,4種類型卡扣缺陷識別取得了最高的AUC值。
(2)相較于不采用分塊重構(gòu)(k=0),當(dāng)k取值為1時,模型識別的AUC值無明顯提升;當(dāng)k=16時,缺陷識別的AUC反而更低。上述實驗結(jié)果表明:當(dāng)k取值較小時,分塊重構(gòu)效果不明顯。這是因為當(dāng)分塊區(qū)域較小時,隨機去除的區(qū)域無法有效地屏蔽部分卡扣缺陷區(qū)域;當(dāng)k取值較大時,模型AUC值反而降低。這表明區(qū)域較大可能會破壞卡扣缺陷區(qū)域的特征,從而造成缺陷識別性能的降低。因此,本文最終選取k=4作為分塊區(qū)域尺寸的參數(shù)。
由于式(2)中的參數(shù)n能夠決定劃分的子集數(shù)量,為了測試n的取值對缺陷重構(gòu)的影響,本文分別測試了n∈{2,3,4,5}條件下對模型AUC值的影響。實驗結(jié)果如表5所示。
表5 不相交的子集n個數(shù)對檢測結(jié)果的影響Tab.5 The influence of the number of disjoint subset n on detection results
從實驗結(jié)果中有如下發(fā)現(xiàn)。
(1)當(dāng)n=3時,分塊重構(gòu)GAN的方法取得了最佳的缺陷檢測AUC值。
(2)相較于不采用分塊重構(gòu)(n=1),當(dāng)1
上述實驗結(jié)果表明:當(dāng)n=3時采用分塊重構(gòu)能夠同時提高4種類型卡扣的缺陷識別性能。n=3表示卡扣圖像會被拆分為3張互補圖像,每張圖像中缺失的區(qū)域以像素0來填充。由于分塊操作,在一張子集圖像中卡扣區(qū)域的特征被離散化,因此網(wǎng)絡(luò)的特征學(xué)習(xí)更加專注于去除區(qū)域的領(lǐng)域信息,這能夠緩解模型訓(xùn)練的過擬合。而當(dāng)n取值較大時,在單個子集圖像中,去除區(qū)域較多則可能破壞卡扣的缺陷特征,從而導(dǎo)致模型識別精度降低。
針對鐵路隧道復(fù)雜應(yīng)用場景中漏纜卡扣缺陷檢測這一特定目標(biāo),提出一種無監(jiān)督檢測模型。為緩解Skip-GANomaly網(wǎng)絡(luò)因特征重用而使圖像重構(gòu)容易過擬合至卡扣缺陷區(qū)域,從而導(dǎo)致缺陷檢測失效的問題,本文提出了基于分塊重構(gòu)的卡扣缺陷檢測算法。該方法以分塊去除的方式將訓(xùn)練圖像拆分為多個互補集合,離散卡扣特征的同時增加樣本容量,緩解了生成器網(wǎng)絡(luò)訓(xùn)練的過擬合問題。
此外,針對卡扣結(jié)構(gòu)模糊、背景差異小而導(dǎo)致現(xiàn)行的異常判別方式無法有效識別卡扣缺陷的問題,采用余弦相似度方法度量重構(gòu)前后卡扣圖像的相似度分?jǐn)?shù),提升卡扣的缺陷識別性能。實驗及可視化結(jié)果表明,相較于Skip-GANomaly,采用分塊方法后,模型的卡扣缺陷檢測AUC值提高了3%,其中召回率和精準(zhǔn)度分別從89.1%和88.1%提升至91.9%和91.1%。
進一步對比其他監(jiān)督學(xué)習(xí)方法,本文提出的無監(jiān)督算法取得了具有競爭力的缺陷檢測性能,這表明了無監(jiān)督學(xué)習(xí)方法在多類型卡扣缺陷識別領(lǐng)域中的可行性。