摘要:工業(yè)品表面缺陷檢測(cè)的目標(biāo)在于識(shí)別和定位物體表面的異常區(qū)域。然而,在無監(jiān)督異常檢測(cè)模型的訓(xùn)練過程中,若訓(xùn)練集僅限于正樣本,模型將僅能學(xué)習(xí)到正樣本的特征表示。而采用異常合成策略能使模型學(xué)習(xí)到異常特征,從而提升異常區(qū)域的檢測(cè)效果。文章提出了一種結(jié)合前景預(yù)測(cè)和異常合成的新方法,該方法中的異常合成包括異常圖像合成和異常特征合成。首先,利用預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)提取圖像特征,并通過特征適配器對(duì)其進(jìn)行優(yōu)化。其次,引入前景分割網(wǎng)絡(luò),以輔助異常圖像的合成過程。在正常特征的基礎(chǔ)上,通過添加高斯噪聲創(chuàng)建異常特征;再次,將正常圖像的特征、合成的異常圖像特征以及合成的異常特征輸入辨別器中進(jìn)行訓(xùn)練。最后,利用前景預(yù)測(cè)器修正可能被誤分類的區(qū)域,以進(jìn)一步提升檢測(cè)精度。實(shí)驗(yàn)結(jié)果顯示,該方法在MVTEC AD數(shù)據(jù)集上的圖像級(jí)與像素級(jí)的AUROC(接受者操作特征曲線下面積)分?jǐn)?shù)分別達(dá)99.7%與98.8%,表明該方法在工業(yè)品表面缺陷檢測(cè)中具有顯著的應(yīng)用潛力。
關(guān)鍵詞:工業(yè)異常檢測(cè);表面缺陷檢測(cè);異常合成;無監(jiān)督學(xué)習(xí);深度神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TN911;TP391.41" " "文獻(xiàn)標(biāo)識(shí)碼:A" " "文章編號(hào):1674-0688(2024)11-0015-05
0 引言
在現(xiàn)代制造業(yè)中,工業(yè)品表面缺陷檢測(cè)對(duì)于保障產(chǎn)品質(zhì)量和可靠性至關(guān)重要。隨著自動(dòng)化和智能制造技術(shù)的飛速發(fā)展,對(duì)檢測(cè)技術(shù)的精確性和魯棒性提出了更為嚴(yán)格的要求。彭衛(wèi)兵等[1]采用了一種基于深度學(xué)習(xí)的監(jiān)督學(xué)習(xí)方法進(jìn)行鋼橋病害檢測(cè),盡管該方法能實(shí)現(xiàn)高精度的識(shí)別效果,但是仍面臨傳統(tǒng)監(jiān)督學(xué)習(xí)方法共有的挑戰(zhàn):高度依賴大量標(biāo)注的缺陷樣本。然而,實(shí)際生產(chǎn)過程中缺陷發(fā)生頻率低且標(biāo)注成本高昂,這些因素共同限制了監(jiān)督學(xué)習(xí)方法在工業(yè)領(lǐng)域的廣泛應(yīng)用。因此,無監(jiān)督異常檢測(cè)技術(shù)逐漸成為工業(yè)檢測(cè)領(lǐng)域的一個(gè)重要解決方案。
目前,工業(yè)品表面缺陷檢測(cè)方法主要分為重建方法、嵌入方法和合成方法3類。重建方法通過重建正常樣本并計(jì)算重建殘差識(shí)別異常;嵌入方法則利用預(yù)訓(xùn)練網(wǎng)絡(luò)提取的特征,試圖在特征空間中分離異常樣本與正常樣本;而基于合成的方法通常從正常樣本中合成異常,以引入異常辨別信息,增強(qiáng)檢測(cè)模型性能。然而,這些方法普遍存在樣本多樣性不足的問題,由于缺乏足夠多樣化的異常樣本而易導(dǎo)致模型過擬合,無法全面學(xué)習(xí)潛在異常特征。因此,有效增加樣本多樣性成為提升異常檢測(cè)性能的關(guān)鍵。為解決樣本多樣性不足的問題,圖像級(jí)合成和特征級(jí)合成被提出作為有效策略。圖像級(jí)合成通過生成新的異常圖像擴(kuò)展樣本空間,增加訓(xùn)練數(shù)據(jù)的多樣性。王丹等[2]針對(duì)路面裂縫檢測(cè)進(jìn)行研究,提出了在正常道路表面數(shù)據(jù)上應(yīng)用 CutPaste方法生成異常數(shù)據(jù),這種簡(jiǎn)單的圖像級(jí)合成異常方法能夠?qū)崿F(xiàn)高識(shí)別精度。特征級(jí)合成則在特征空間中生成合成異常樣本,進(jìn)一步豐富了樣本的多樣性。毛加平[3]提出的 TrisimpleNet 模型通過在正常樣本的特征空間中添加高斯噪聲來合成異常樣本,同時(shí)引入微小擾動(dòng)以生成偽造的正常特征,這一策略有效提升了缺陷檢測(cè)的精度與魯棒性。將這兩種合成方法結(jié)合使用,能有效克服現(xiàn)有方法在樣本多樣性方面的不足,進(jìn)一步提升檢測(cè)的精度和魯棒性。
盡管合成方法能增加樣本多樣性,但是現(xiàn)有方法仍易受背景區(qū)域干擾,尤其是在復(fù)雜背景下,背景區(qū)域可能被誤判為異常。為解決這一問題,本文引入前景預(yù)測(cè)技術(shù)。前景預(yù)測(cè)根據(jù)輸入圖像預(yù)測(cè)前景掩碼,使模型能夠聚焦于感興趣區(qū)域,避免背景信息干擾?;诖怂悸?,本文提出一種結(jié)合前景預(yù)測(cè)、圖像級(jí)異常合成和特征級(jí)異常合成的無監(jiān)督缺陷檢測(cè)方法。該方法首先通過圖像級(jí)和特征級(jí)合成技術(shù)增加異常樣本的多樣性,使模型學(xué)習(xí)更豐富多樣的異常特征;其次利用前景預(yù)測(cè)生成前景掩碼,排除背景區(qū)域干擾。綜合這些技術(shù),可提升復(fù)雜背景下工業(yè)品表面缺陷檢測(cè)的精度與魯棒性。
1 研究理論
相關(guān)研究指出,重建方法(如AutoEncoder)依賴于對(duì)正常樣本的重建殘差來檢測(cè)異常。盡管這些方法在理論上能夠識(shí)別出與正常樣本不同的異常,但是它們對(duì)正常樣本的質(zhì)量有著高度的依賴性,容易受到偽陽性結(jié)果的影響。在復(fù)雜環(huán)境中,若重建能力不足,可能會(huì)導(dǎo)致較高的錯(cuò)誤檢測(cè)率,從而影響實(shí)際應(yīng)用的可靠性[4]。
嵌入方法則利用預(yù)訓(xùn)練網(wǎng)絡(luò)提取特征,試圖在特征空間中實(shí)現(xiàn)異常樣本與正常樣本的分離。盡管引入記憶庫和單類分類器能在一定程度上提高檢測(cè)性能,但是這些方法仍然依賴于高質(zhì)量的特征表達(dá)。當(dāng)特征表達(dá)不足時(shí),其檢測(cè)效果并不理想。此外,這些方法在處理多樣化和復(fù)雜背景方面仍存在不足,從而限制了其在實(shí)際應(yīng)用中的有效性。
在合成方法中,圖像級(jí)合成方法(如CutPaste )通過切割和拼接正常樣本中的圖像生成異常樣本,從而擴(kuò)展訓(xùn)練數(shù)據(jù)集。圖像級(jí)異常合成方法能夠提供詳細(xì)的異常紋理,其在細(xì)節(jié)表現(xiàn)上具有一定優(yōu)勢(shì)。然而,該方法通常存在樣本多樣性不足的問題,導(dǎo)致生成的異常樣本無法覆蓋實(shí)際應(yīng)用中的廣泛情況。相比之下,特征級(jí)合成方法(如SimpleNet[5] )通過向正常特征添加高斯噪聲來合成異常,這種方法效率更高,但無法在像素級(jí)別實(shí)現(xiàn)高精度檢測(cè)。
現(xiàn)有方法在處理復(fù)雜背景時(shí),往往難以明確區(qū)分前景和背景,導(dǎo)致背景區(qū)域容易被誤判為異常,從而引發(fā)誤報(bào)。這是因?yàn)楸尘靶畔⒌母蓴_容易對(duì)檢測(cè)結(jié)果產(chǎn)生不良影響。
2 檢測(cè)方法模型構(gòu)建
2.1 模型框架
本文提出的工業(yè)品表面缺陷檢測(cè)方法由特征提取、特征適配、前景分割、異常圖像合成、異常特征合成、鑒別器和前景預(yù)測(cè)等功能模塊構(gòu)成。該方法融合了前景預(yù)測(cè)與異常合成技術(shù),旨在提高無監(jiān)督異常檢測(cè)的檢測(cè)精度,特別是在僅包含正樣本的情況下。模型整體框架圖見圖1。
2.2 模型訓(xùn)練方法
在訓(xùn)練階段,模型主要由異常圖像處理模塊、異常特征處理模塊及普通處理模塊三大核心部分構(gòu)成,它們共同利用特征提取器、特征適配器及鑒別器進(jìn)行動(dòng)作。首先,正常樣本經(jīng)由一個(gè)凍結(jié)狀態(tài)的特征提取器和一個(gè)可訓(xùn)練的特征適配器處理,以獲取適用于正常特征的表示,此環(huán)節(jié)構(gòu)成了普通處理模塊的一部分。其次,在異常特征處理模塊中,對(duì)正常特征添加高斯噪聲,以合成異常特征。與此同時(shí),異常圖像處理模塊則采用紋理疊加和前景分割技術(shù),生成局部異常圖像,這些圖像再經(jīng)過特征提取器和特征適配器處理,以獲得對(duì)應(yīng)的局部異常特征。最后,這3個(gè)模塊產(chǎn)生的特征被聯(lián)合輸入至鑒別器中,該鑒別器為一個(gè)分割網(wǎng)絡(luò),并采用3種損失函數(shù)進(jìn)行端到端的訓(xùn)練。
此外,利用對(duì)象類別的訓(xùn)練集訓(xùn)練了一個(gè)前景預(yù)測(cè)器。該預(yù)測(cè)器首先利用分割網(wǎng)絡(luò)生成正常掩碼圖像,然后在其基礎(chǔ)上合成異常掩碼圖像,以正常掩碼圖像和異常掩碼圖像作為訓(xùn)練數(shù)據(jù)集,共同訓(xùn)練一個(gè)專門用于前景預(yù)測(cè)的分割網(wǎng)絡(luò)。
在推理階段,測(cè)試圖像通過普通處理模塊和前景預(yù)測(cè)模塊進(jìn)行處理。普通處理模塊負(fù)責(zé)生成異常分?jǐn)?shù)圖,而前景預(yù)測(cè)模塊則負(fù)責(zé)生成掩碼圖。通過將異常分?jǐn)?shù)圖和掩碼圖進(jìn)行點(diǎn)乘運(yùn)算,即可得出最終的測(cè)試結(jié)果。
2.3 模塊功能
2.3.1 特征提取與特征適配
為了捕捉圖像中的多層次信息,采用了在ImageNet 數(shù)據(jù)集上預(yù)訓(xùn)練的 WideResNet50 作為骨干網(wǎng)絡(luò)進(jìn)行特征提取。骨干網(wǎng)絡(luò)的layer2和layer3的特征被連接在一起,以形成包含細(xì)節(jié)與全局結(jié)構(gòu)的多尺度空間信息。在此過程中,骨干網(wǎng)絡(luò)始終保持凍結(jié)狀態(tài),僅承擔(dān)特征提取的功能。
隨后,提取到的多層次特征通過特征適配器進(jìn)行進(jìn)一步處理。特征適配器的功能是將這些特征轉(zhuǎn)換為更適用于異常檢測(cè)的特征表示。在本方法中,特征適配器采用了一個(gè)全連接層這一簡(jiǎn)單的神經(jīng)模塊,該模塊能夠有效增強(qiáng)正常特征與異常特征在特征空間中的可區(qū)分度。
2.3.2 前景分割網(wǎng)絡(luò)
在工業(yè)品檢測(cè)中,缺陷通常集中在物體的前景部分,而背景信息通常對(duì)檢測(cè)結(jié)果不產(chǎn)生實(shí)質(zhì)性影響。為提升檢測(cè)精度,本文提出了一種前景分割網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠高效地將圖像中的物體從背景中分離出來,特別針對(duì)MVTec AD[6] 數(shù)據(jù)集中的10個(gè)對(duì)象類別,能夠生成精確的前景掩碼圖。對(duì)于其中的5個(gè)紋理類圖像,由于整個(gè)圖像均被視為前景,因此不需要進(jìn)行前景分割處理。
前景分割網(wǎng)絡(luò)生成的掩碼圖不僅被用于指導(dǎo)異常圖像的合成過程,還作為前景預(yù)測(cè)器訓(xùn)練的重要輸入,能夠有效排除背景區(qū)域異常分?jǐn)?shù)對(duì)檢測(cè)結(jié)果的干擾,從而提升整體的檢測(cè)性能。前景分割器效果見圖2。
通過對(duì)U-2Net[7] 分割網(wǎng)絡(luò)進(jìn)行微調(diào),所得到的前景分割器能夠精確地對(duì)MVTec AD數(shù)據(jù)集中10個(gè)對(duì)象類別進(jìn)行分割。在訓(xùn)練階段,憑借U-2Net網(wǎng)絡(luò)的高效性能,模型在2080Ti 顯卡上的檢測(cè)幀率達(dá)到了140 FPS,這證明了引入前景分割器對(duì)整體系統(tǒng)性能的影響微乎其微。
2.3.3 異常圖像合成
在工業(yè)應(yīng)用場(chǎng)景中,異?,F(xiàn)象的類型繁多且復(fù)雜,數(shù)據(jù)收集難以覆蓋所有異常類型,這給基于監(jiān)督學(xué)習(xí)的方法帶來了顯著限制。以往的半監(jiān)督學(xué)習(xí)方法僅依賴于正常樣本,忽略了非正常樣本的對(duì)比信息,從而限制了模型對(duì)正常模式的有效學(xué)習(xí)?;?(Dream-textures)[8] 方法,本文提出了一種更高效的異常圖像合成策略。異常圖像合成流程見圖3。
異常圖像合成的具體步驟如下。
(1)生成二維Perlin噪聲P,并通過二值化處理得到掩碼Mp。然而,對(duì)于對(duì)象類圖像,由于主體僅占圖像的一部分,直接使用二值化后的掩碼進(jìn)行異常合成可能會(huì)在背景區(qū)域引入噪聲,從而增大合成異常樣本與真實(shí)異常樣本之間的分布差異,影響模型學(xué)習(xí)有效的判別信息。因此,可利用前景分割器對(duì)輸入圖像生成精確的前景掩碼M1,并在此基礎(chǔ)上向外擴(kuò)展5個(gè)像素,生成更為寬泛的掩碼M2。這種設(shè)計(jì)旨在使模型既能有效學(xué)習(xí)前景區(qū)域的異常特征,又能捕捉前景周圍的異常信息。最終掩碼M通過這兩個(gè)掩碼進(jìn)行逐元素乘積運(yùn)算獲得。
(2)將掩碼M與來自DTD[9] 紋理數(shù)據(jù)集的噪聲圖像[In]進(jìn)行逐元素乘積運(yùn)算,得到感興趣區(qū)域(ROI)。在此過程中,引入透明度因子以平衡原始圖像和噪聲圖像的融合程度,使合成的異常更接近真實(shí)異常。生成的噪聲前景圖像通過以下公式計(jì)算:
(3)通過反轉(zhuǎn)掩碼M并與原始圖像I進(jìn)行元素乘積運(yùn)算,再加上經(jīng)過掩碼處理的噪聲前景圖像,得到數(shù)據(jù)增強(qiáng)圖像[Ia],即最終的合成異常圖像。合成異常圖像通過以下公式計(jì)算:
相比傳統(tǒng)方法,本文方法在異常圖像合成方面實(shí)現(xiàn)了以下兩點(diǎn)關(guān)鍵性提升。
(1)提高掩碼精度。傳統(tǒng)方法采用二值化處理生成前景掩碼,存在精度不足的問題。為改善此狀況,本文引入預(yù)訓(xùn)練的U-2Net分割網(wǎng)絡(luò),并針對(duì)MVTec AD 數(shù)據(jù)集中的10個(gè)對(duì)象類別訓(xùn)練集進(jìn)行微調(diào),從而生成了更精確的前景掩碼。這一改進(jìn)使模型在處理復(fù)雜背景(例如晶體管和電纜圖像)時(shí),能更有效地提取正常樣本的代表性模式,進(jìn)而提升異常樣本生成的質(zhì)量。
(2)模擬“增長(zhǎng)”類異常。傳統(tǒng)方法通常僅在前景區(qū)域內(nèi)生成異常樣本,忽略了異常可能擴(kuò)展至背景的情況。為此,本文在獲得精確前景掩碼后,對(duì)其進(jìn)行像素?cái)U(kuò)展處理,生成了膨脹的前景掩碼。該膨脹掩碼不僅覆蓋了前景區(qū)域,而且還包含了其周圍一小段區(qū)域。這一策略增強(qiáng)了模型對(duì)“增長(zhǎng)”類異常的識(shí)別能力,使合成的異常圖像更貼近實(shí)際情況。隨后,將噪聲圖像添加至膨脹的前景掩碼所覆蓋的區(qū)域,從而生成了更豐富的異常圖像。
通過上述改進(jìn),本文在現(xiàn)有方法的基礎(chǔ)上生成了更具全面性的異常樣本,有效縮小了合成異常與真實(shí)異常樣本之間的差異,從而進(jìn)一步提升了模型的學(xué)習(xí)效果和魯棒性。
2.3.4 異常特征生成
已有研究表明,合成異常特征是一種有效的方法。本模型采用了SimpleNet中的異常特征生成策略,通過在特征中簡(jiǎn)單添加高斯噪聲來模擬異常特征,以此引導(dǎo)鑒別器學(xué)習(xí)正常特征與異常特征之間的差異。需要注意的是,異常特征生成器僅使用在訓(xùn)練階段。
2.3.5 辨別器
鑒別器網(wǎng)絡(luò)的功能在于區(qū)分正常特征與異常特征。在訓(xùn)練階段,鑒別器通過不斷優(yōu)化判別損失函數(shù),旨在最大化正常和異常特征之間的差異。具體而言,訓(xùn)練過程中,正常特征被視為正樣本,而合成的異常特征以及異常圖像中異常區(qū)域的特征則被視為負(fù)樣本。通過這一學(xué)習(xí)過程,鑒別器逐步提升了其異常檢測(cè)的準(zhǔn)確性。
2.3.6 前景預(yù)測(cè)器
由于模型能夠識(shí)別大至小范圍的缺陷,因此不可避免地會(huì)將背景中的缺陷也視為異常。為減小背景異常的干擾,可考慮采用分割網(wǎng)絡(luò)區(qū)分前景和背景。然而,這也帶來了一個(gè)新的問題:某些類型的缺陷(如缺失類缺陷)可能會(huì)被前景分割網(wǎng)絡(luò)錯(cuò)誤地歸類為背景區(qū)域。由于該方法忽略了背景中的異常信息,可能會(huì)導(dǎo)致缺陷區(qū)域被漏檢,從而影響檢測(cè)精度。為解決這一問題,可引入前景預(yù)測(cè)網(wǎng)絡(luò)。前景預(yù)測(cè)網(wǎng)絡(luò)利用數(shù)據(jù)增強(qiáng)技術(shù),模擬出不同大小、形狀和位置的異常區(qū)域,從而生成更多樣化的異常樣本。在訓(xùn)練階段,僅使用MVTec AD數(shù)據(jù)集中的10個(gè)對(duì)象類別的訓(xùn)練集訓(xùn)練前景預(yù)測(cè)器。異常掩碼圖的生成方法與本文提出的異常圖像合成方法類似。通過將正常掩碼圖和模擬的異常掩碼圖一同輸入網(wǎng)絡(luò),前景預(yù)測(cè)器能夠?qū)W習(xí)并補(bǔ)償那些被遺漏的異常區(qū)域,進(jìn)而提升整體的檢測(cè)精度。
前景預(yù)測(cè)器效果見圖4。需要強(qiáng)調(diào)的是,前景預(yù)測(cè)器的目標(biāo)并非精確地分割出前景掩碼,而是根據(jù)測(cè)試圖像估測(cè)物體在正常狀態(tài)下所占的區(qū)域,以確保不會(huì)遺漏因缺失而導(dǎo)致的異常區(qū)域。
3 實(shí)驗(yàn)過程與結(jié)果
3.1 數(shù)據(jù)集和評(píng)估指標(biāo)
本文采用MVTec AD數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集專為工業(yè)品表面缺陷檢測(cè)設(shè)計(jì),包含5 354張圖像,涵蓋15個(gè)子數(shù)據(jù)集,其中分為5個(gè)紋理子類別和10個(gè)對(duì)象子類別。每個(gè)類別包含60~400張正常樣本用于訓(xùn)練,測(cè)試集則由正常圖像和各類真實(shí)異常圖像混合組成,這些異常圖像具有多樣化的紋理和規(guī)模。
在評(píng)估圖像表面缺陷檢測(cè)性能時(shí),本文采用圖像級(jí)和像素級(jí)的 AUROC作為主要評(píng)估指標(biāo)。
3.2 實(shí)驗(yàn)設(shè)置與實(shí)現(xiàn)細(xì)節(jié)
本文采用在ImageNet上預(yù)訓(xùn)練的WideResNet50作為骨干網(wǎng)絡(luò),融合了layer2和layer3的特征,并將鄰域大小p設(shè)置為3。輸入圖像經(jīng)過縮放和裁剪,調(diào)整為288×288像素的尺寸。在異常特征生成器中,添加的高斯噪聲參數(shù)設(shè)置為[∈]~N(0,0.015)。在訓(xùn)練過程中,采用Adam優(yōu)化器,初始學(xué)習(xí)率設(shè)定為0.001,批量大小為8,同時(shí)使用二元交叉熵與焦點(diǎn)損失函數(shù)作為訓(xùn)練目標(biāo)函數(shù)。為防止過擬合,實(shí)施了早停策略,以確保模型的泛化能力。所有實(shí)驗(yàn)均在RTX 2080 Ti GPU上執(zhí)行。
3.3 實(shí)驗(yàn)結(jié)果
將本文方法與其他方法進(jìn)行對(duì)比,結(jié)果表明,本文方法在多數(shù)現(xiàn)有方法中表現(xiàn)出更優(yōu)越的性能,驗(yàn)證了其有效性。不同方法在MVTec AD數(shù)據(jù)集上的性能對(duì)比見表1,本文方法在15個(gè)類別中的5個(gè)類別上實(shí)現(xiàn)了100%的圖像級(jí)AUROC(Receiver Operating Characteristic Curve),并且在圖像級(jí)和像素級(jí)的AUROC總平均分?jǐn)?shù)分別達(dá)到了99.7%和98.8%。
本文對(duì) MVTec AD 數(shù)據(jù)集進(jìn)行了定性實(shí)驗(yàn),驗(yàn)證了本文方法在異常分割方面的準(zhǔn)確性。圖5展示了MVTec AD數(shù)據(jù)集上像素級(jí)異常分割的定性可視化效果,表明本文方法具有更精確的異常分割能力和排除背景干擾的效果。具體而言,相較于單一方法,結(jié)合異常特征合成和異常圖像合成的方法表現(xiàn)出了更高的有效性,而前景預(yù)測(cè)器的加入則進(jìn)一步提升了像素級(jí) AUROC異常定位的性能。
4 結(jié)語
本文提出了一種結(jié)合前景預(yù)測(cè)與異常合成的工業(yè)品表面缺陷檢測(cè)方法,旨在解決無監(jiān)督學(xué)習(xí)環(huán)境下樣本稀缺的問題。該方法通過引入前景預(yù)測(cè)網(wǎng)絡(luò)和異常合成策略,有效生成了多樣化的異常樣本,提升了模型對(duì)異常區(qū)域的檢測(cè)能力。實(shí)驗(yàn)結(jié)果顯示,在MVTec AD數(shù)據(jù)集上,本文方法在圖像級(jí)和像素級(jí)的AUROC平均分?jǐn)?shù)分別達(dá)到了99.7%和98.8%,充分證明了其在工業(yè)品缺陷檢測(cè)中的有效性和應(yīng)用潛力。與現(xiàn)有方法相比,本研究的創(chuàng)新之處在于利用前景預(yù)測(cè)器修正錯(cuò)誤分類區(qū)域,從而進(jìn)一步提高了檢測(cè)精度,同時(shí)采用了多種異常合成策略,以增強(qiáng)樣本的多樣性。未來的研究方向?qū)⒕劢褂趯⒋朔椒ㄍ茝V至更多的實(shí)際應(yīng)用場(chǎng)景,并進(jìn)一步優(yōu)化模型結(jié)構(gòu)以提升實(shí)時(shí)檢測(cè)性能。同時(shí),鑒于不同工業(yè)環(huán)境中背景的復(fù)雜性,研究將更加注重增強(qiáng)模型對(duì)背景干擾的魯棒性,以確保其具備更廣泛的適用性和可靠性。
5 參考文獻(xiàn)
[1]彭衛(wèi)兵,張明見,全柳萌,等.基于改進(jìn)Mask R-CNN的鋼橋多病害智能識(shí)別[J].中國公路學(xué)報(bào),2024,37(2):100-109.
[2]王丹,鐘亮潔.基于異常數(shù)據(jù)生成和自監(jiān)督學(xué)習(xí)的路面裂縫檢測(cè)[J].肇慶學(xué)院學(xué)報(bào),2024,45(5):6-13.
[3]毛加平.TrisimpleNet:基于三元損失和特征合成的缺陷檢測(cè)網(wǎng)絡(luò)[J].應(yīng)用數(shù)學(xué)進(jìn)展,2024,13(5):2323-2330.
[4]ZHANG X,LI S,LI X,et al.DeSTSeg:Segmentation Guided Denoising Student-Teacher for Anomaly Detection[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).Vancouver,BC,Canada,2023.IEEE,2023:3914-3923.DOI:10.1109/CVPR52729.2023.00381.
[5]LIU Z,ZHOU Y,XU Y,et al.SimpleNet:A Simple Network for Image Anomaly Detection and Localization[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).Vancouver,BC,Canada,2023.IEEE,2023:20402-20411.DOI:10.1109/CVPR52729.2023.
01954.
[6]BERGMANN P,F(xiàn)AUSER M,SATTLEGGER D,et al.MVTec AD—A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection[C]//2019IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).Long Beach,CA,USA,2019.IEEE,2019:9584-9592.DOI:10.1109/CVPR.2019.00982.
[7]QIN X,ZHANG Z,HUANG C,et al.U2-Net:Going deeper with nested U-structure for salient object detection[J].Pattern recognition,2020,106:107404.
[8]ZAVRTANIK V,KRISTAN M,Sko?aj D.DR?M-A discriminatively trained reconstruction embedding for surface anomaly detection[C] //2021 IEEE/CVF International Conference on Computer Vision(ICCV).Montreal,QC,Canada,2021.IEEE,2021:8310-8319.DOI:10.1109/ICCV48922.2021." "00822.
[9]Cimpoi M,Maji S,Kokkinos I,et al.Describing Textures in the Wild[C] //2014 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Columbus,OH,USA,2014.IEEE,2014:3606-3613.DOI:10.1109/CVPR," "2014.461.