張 晉,謝 珺,梁鳳梅,續(xù)欣瑩,董俊杰
1(太原理工大學(xué) 信息與計(jì)算機(jī)學(xué)院,山西 晉中 030600) 2(太原理工大學(xué) 電氣與動(dòng)力工程學(xué)院,太原 030024)
磁瓦是電機(jī)的重要組成部件,在生產(chǎn)過程中,由于原料、加工工藝等因素的影響,其表面會(huì)產(chǎn)生各種復(fù)雜缺陷,而這些磁瓦中的缺陷會(huì)直接影響電機(jī)的性能和壽命,因此生產(chǎn)過程中必須將表面有缺陷的磁瓦檢測出并剔除[1].目前磁瓦表面缺陷檢測主要由人工檢出,存在檢測效率低、穩(wěn)定性差和成本高等問題.一些研究人員試圖通過視覺檢測和圖像處理方法來實(shí)現(xiàn)磁瓦表面缺陷的自動(dòng)化檢測與識(shí)別過程[2].
林麗君[3]等人提出一種基于圖像加權(quán)信息熵和小波模極大值相結(jié)合的磁瓦表面缺陷檢測方法,該方法通過一種自適應(yīng)改變截止頻率的BHPF濾波器,對磁瓦的裂紋缺陷背景紋理和噪聲進(jìn)行抑制后,利用小波多尺度分辨的特點(diǎn),檢測出磁瓦圖片中的缺陷部分.楊成立[4]等人提出一種非下采樣Shearlet變換的磁瓦表面缺陷檢測識(shí)別方法(NSST),該方法將含有磁瓦缺陷圖像中的缺陷和背景分別分解為低頻和高頻兩個(gè)子帶圖像,從而實(shí)現(xiàn)對磁瓦表面缺陷的檢測.HuangYi-bin[5]等人提出一種MCuePush U-Net的實(shí)時(shí)多模塊神經(jīng)網(wǎng)絡(luò)模型,在較短時(shí)間內(nèi)實(shí)現(xiàn)了對磁瓦圖像表面缺陷的檢測.劉暢[6]等人使用空洞卷積替代U-Net模型的部分卷積層和池化層,并加入分類神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了磁瓦表面缺陷的檢測與分類識(shí)別功能.這些基于機(jī)器視覺的磁瓦缺陷自動(dòng)檢測及分類方法,在一定程度上實(shí)現(xiàn)了很好的效果.目前,在磁瓦表面缺陷檢測的研究中,所需要的待檢測圖像樣本均通過CCD相機(jī)等圖像采集裝置獲得,而圖像采集設(shè)備價(jià)格昂貴、搭建較為復(fù)雜.此外,含有缺陷的磁瓦并不是大量存在的,在生產(chǎn)過程中,磁瓦表面缺陷的類型也是隨機(jī)產(chǎn)生的,而且同一類型缺陷也會(huì)有各種不同的樣式,如圖1所示.因此如何更好的獲取大量含有不同樣式缺陷的磁瓦圖像用于檢測分類模型的訓(xùn)練,是一個(gè)亟待解決的任務(wù).
圖1 磁瓦表面常見缺陷類型及樣式圖Fig.1 Common defects types and styles on the magnetic tile surfaces
生成圖像建模是計(jì)算機(jī)視覺領(lǐng)域一項(xiàng)重要的研究內(nèi)容,通過使用深度學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)已有圖像的特征,從而生成含有該特征的新的圖像數(shù)據(jù).目前,對于生成圖像建模的相關(guān)研究已取得了顯著進(jìn)展.Alexey Dosovitskiy[7]等人將訓(xùn)練的生成卷積神經(jīng)網(wǎng)絡(luò)用于生成不同形狀與顏色的桌椅,進(jìn)一步評價(jià)桌椅圖像之間的相似性以及對應(yīng)關(guān)系.Aaron van den Oord[8]等人在使用改進(jìn)的深度神經(jīng)網(wǎng)絡(luò)對自然圖像生成方法的研究中,獲取了清晰的圖像樣本.何新宇[9]等人提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的肺炎圖像識(shí)別模型,用于解決肺炎圖像識(shí)別準(zhǔn)確率低的問題.
隨著生成圖像建模的不斷研究,2014年,Goodfellow[10]等人提出的生成對抗網(wǎng)絡(luò)(GAN)得到的大家的廣泛關(guān)注,其算法已經(jīng)在各類圖像合成、修復(fù)以及視頻、音樂等的生成中展示出了良好的效果.趙樹陽[11]等人提出一種非監(jiān)督的由已有圖像生成新圖像的低秩紋理生成對抗網(wǎng)絡(luò)(Low-rank generative adversarial network,LR-GAN)算法,用于解決低秩圖像的校正問題.Zhao Zhi-xuan[12]等人將GAN和自編碼結(jié)合起來用于重建缺陷圖像,并使用LBP特征進(jìn)行圖像局部對比以檢測織物表面缺陷.田思洋[13]等人采用生成對抗網(wǎng)絡(luò)對不同生產(chǎn)線上的鋼板缺陷圖像樣本進(jìn)行圖像翻譯,從而獲得新生產(chǎn)線的缺陷樣本,實(shí)現(xiàn)跨域圖像轉(zhuǎn)換.陳方杰[14]等人利用生成對抗網(wǎng)絡(luò)生成可分性更高的高光譜圖像,用于解決在高光譜圖像分類領(lǐng)域中特征利用不足的問題.
為了解決磁瓦圖像采集困難、含缺陷磁瓦樣本少、不同缺陷樣本數(shù)不均勻、缺陷類型單一的問題,本文將深度卷積生成對抗網(wǎng)絡(luò)的輸入空間參數(shù)化為混合模型,提出一種高斯混合模型的深度卷積生成對抗網(wǎng)絡(luò)(Gaussian Mixture Model-Deep Convolution GenerativeAdversarial Networks,GMM-DCGANs)用于生成磁瓦缺陷圖像.由最大類間方差(Otsu)算法將磁瓦缺陷圖像轉(zhuǎn)換為二值圖像,在對圖像強(qiáng)化缺陷弱化背景后,將該二值圖像作為高斯混合模型的深度卷積生成對抗網(wǎng)絡(luò)的輸入,用于生成大量不同缺陷樣式的磁瓦缺陷圖像,并使用基于局部感受野的極限學(xué)習(xí)機(jī)(ELM-LRF)算法對生成的缺陷圖像分類,以驗(yàn)證所生成圖像的質(zhì)量.
由Goodfellow[10]等人在2014年提出的生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)是一種無監(jiān)督深度學(xué)習(xí)網(wǎng)絡(luò)模型,如圖2所示.其結(jié)構(gòu)主要由生成網(wǎng)絡(luò)G(Generator)和判別網(wǎng)絡(luò)D(Discriminator)兩部分組成.生成網(wǎng)絡(luò)G將輸入噪聲z生成圖像樣本,判別網(wǎng)絡(luò)D用來判別輸入圖像是真實(shí)圖像還是生成器生成的假圖像.通過兩個(gè)網(wǎng)絡(luò)相互博弈學(xué)習(xí),不斷提高兩個(gè)網(wǎng)絡(luò)的性能,最終達(dá)到動(dòng)態(tài)平衡,從而可以生成以假亂真的圖像.生成網(wǎng)絡(luò)G和判別網(wǎng)絡(luò)D的目標(biāo)函數(shù)如公式(1)所示:
(1)
其中:z是輸入噪聲,G是生成網(wǎng)絡(luò),D是判別網(wǎng)絡(luò),G(z)是由生成網(wǎng)絡(luò)G生成的圖像數(shù)據(jù),x是G(z)所對應(yīng)的真實(shí)圖像數(shù)據(jù).
圖2 生成對抗網(wǎng)絡(luò)(GAN)結(jié)構(gòu)圖Fig.2 Generative adversarial network(GAN)structure
2015年,Alec Radford[15]等人將卷積神經(jīng)網(wǎng)絡(luò)與生成對抗網(wǎng)絡(luò)相結(jié)合,將生成對抗網(wǎng)絡(luò)的生成器用反卷積神經(jīng)網(wǎng)絡(luò)替換,判別器用卷積神經(jīng)網(wǎng)絡(luò)替換,提出了深度卷積生成對抗網(wǎng)絡(luò)(DCGANs),并對其結(jié)構(gòu)做了改進(jìn):
1)使用全卷積網(wǎng)絡(luò),在生成器上使用微步卷積網(wǎng)絡(luò),使其可以學(xué)習(xí)空間的上采樣部分;在判別器上使用帶步長的卷積層網(wǎng)絡(luò),使其可以學(xué)習(xí)空間的下采樣部分.
2)在卷積特征上,使用全局平均池化來代替全連接層,從而提高模型的穩(wěn)定性.
3)生成器上,輸出層上使用Tanh激活函數(shù),其他層上則使用Relu激活函數(shù);在判別器上,所有層上都使用LeakyRelu激活函數(shù).
4)在生成器和判別器中,除最后一層外,每一層都使用批標(biāo)準(zhǔn)化,從而使梯度能夠傳播到更深的層次,避免了生成器崩潰以及模型的不穩(wěn)定情況.
高斯混合模型的深度卷積生成對抗網(wǎng)絡(luò)(GMM-DCGANs)是在深度卷積生成對抗網(wǎng)絡(luò)的基礎(chǔ)上,將生成器用于生成圖像的輸入噪聲z的潛在空間定義為高斯混合模型[16],生成網(wǎng)絡(luò)中將簡單分布的潛在變量映射成高維數(shù)據(jù)改為將復(fù)雜分布的潛在變量映射成高維數(shù)據(jù).這一改變提高了深度卷積生成對抗網(wǎng)絡(luò)對有限數(shù)量且具有類間及類內(nèi)多樣性的訓(xùn)練樣本的學(xué)習(xí)能力.
(2)
其中,μi為高斯分布的均值向量,Σi為協(xié)方差矩陣,ωi為每一個(gè)高斯分布的權(quán)重,N為自變量的維數(shù),g(z|μi,Σi)為第i個(gè)高斯分布函數(shù).對于磁瓦缺陷種類而言,每一類缺陷都將影響磁瓦的質(zhì)量,因此,對于N個(gè)高斯分布,每一個(gè)高斯分布的權(quán)重均為1/N,所以原公式即為:
(3)
在高斯混合模型中,每一個(gè)高斯分布稱為一個(gè)組件,為了使高斯混合模型中各組件存在一定的相關(guān)性,先隨機(jī)生成均勻噪聲,得到噪聲各維均值μ={μ1,μ2,…,μN(yùn)}和噪聲間協(xié)方差對角矩陣σi=[σj1,σj2,…,σjN].通過均值μ和協(xié)方差對角矩陣σi構(gòu)建高斯混合模型,并將該高斯混合模型作為生成器的輸入部分.
z~N(x;μ,σi)
(4)
(5)
高斯混合模型的深度卷積生成對抗網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,圖3(a)部分為生成網(wǎng)絡(luò)的輸入.將均勻噪聲復(fù)雜化,重構(gòu)為高斯混合模型,生成網(wǎng)絡(luò)每次迭代生成圖像時(shí),隨機(jī)選取一組高斯混合模型.通過增加生成網(wǎng)絡(luò)先前分配的能力,使模型能夠在訓(xùn)練數(shù)據(jù)數(shù)量有限且具有多樣性時(shí)表現(xiàn)出更好的性能.圖3(b)為生成網(wǎng)絡(luò).在生成網(wǎng)絡(luò)的卷積上使用全局平均池化來取代全連接層,并使用4層反卷積取代原生成網(wǎng)絡(luò)中的池化層;除了生成網(wǎng)絡(luò)的輸出層激活函數(shù)使用Tanh函數(shù)外,其余層激活函數(shù)均使用Relu函數(shù)且都使用批處理Batch Normalization,這將有助于訓(xùn)練梯度實(shí)現(xiàn)更深層次網(wǎng)絡(luò).輸入噪聲z映射通過生成網(wǎng)絡(luò)4層反卷積后,轉(zhuǎn)換為64*64像素的圖像.圖3(c)為判別網(wǎng)絡(luò).在判別網(wǎng)絡(luò)的卷積上同樣使用全局平均池化來取代全連接層,并使用4層步幅卷積取代原判別網(wǎng)絡(luò)中的池化層;除了輸入層以外,其余層均使用批處理Batch Normalization,判別網(wǎng)絡(luò)所有層上均使用LeakyRelu激活函數(shù).將生成網(wǎng)絡(luò)訓(xùn)練完成的假樣本輸入已訓(xùn)練學(xué)習(xí)過真實(shí)樣本信息的判別網(wǎng)絡(luò)中,判斷其輸入是真實(shí)樣本還是假樣本,并將結(jié)果反饋給生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò),從而不斷優(yōu)化生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的性能.
圖3 高斯混合模型的深度卷積生成對抗網(wǎng)絡(luò)(GMM-DCGANs)結(jié)構(gòu)圖Fig.3 Gaussian mixture model based deep convolution generative adversarial networks(GMM-DCGANs)structure
在已有的生成對抗網(wǎng)絡(luò)用于圖像生成的研究中,對于生成圖像質(zhì)量以及生成對抗網(wǎng)絡(luò)性能的評判,并沒有統(tǒng)一的標(biāo)準(zhǔn),大多學(xué)者采用直觀對比來評判生成圖像質(zhì)量的好壞[17],也有一些學(xué)者通過Inception score、Maximum Mean Discrepancy等評價(jià)指標(biāo)來評判生成對抗網(wǎng)絡(luò)的性能[18].對于本文生成磁瓦缺陷圖像的研究,除了通過直觀對比不同生成對抗網(wǎng)絡(luò)生成圖像的質(zhì)量外,我們還采用基于局部感受野的極限學(xué)習(xí)機(jī)(ELM-LRF)對5類磁瓦缺陷圖像進(jìn)行分類來檢測生成圖像是否符合實(shí)驗(yàn)要求.
基于局部感受野的極限學(xué)習(xí)機(jī)(ELM-LRF)是機(jī)器學(xué)習(xí)中一種分類速度快、效率高的分類算法,該分類算法最大的特點(diǎn)是將深度學(xué)習(xí)中單層卷積和池化網(wǎng)絡(luò)結(jié)構(gòu)融入到極限學(xué)習(xí)機(jī)中,從而實(shí)現(xiàn)對輸入圖像的特征自提取,并通過ELM的輸出權(quán)重公式對輸入圖像進(jìn)行分類[19].在ELM-LRF的網(wǎng)絡(luò)結(jié)構(gòu)中,為了使輸入的圖像更加充分,采用個(gè)不同的輸入權(quán)重,從而得到個(gè)不同的特征圖[20].ELM-LRF網(wǎng)絡(luò)具體功能實(shí)現(xiàn)可分為以下3部分內(nèi)容:
1)隨機(jī)生成初始權(quán)重Ainit.計(jì)算公式如公式(6)所示.
(6)
其中,其中Ainit是初始權(quán)重,K是特征圖個(gè)數(shù),r2是局部感受野大小,Ainit中每一列αk都是Ainit的一組正交基.
在獲取初試權(quán)重后,采用奇異值分解(SVD)將初始權(quán)重Ainit正交化,可以得到其正交化后的結(jié)果A.第k個(gè)特征圖卷積節(jié)點(diǎn)(i,j)值ci,j,k的計(jì)算公式如公式(7)所示:
(7)
其中,d×d是輸入圖像的大小,(d-r+1)×(d-r+1)是特征圖的大小,αk∈Rr×r是αk逐列排成的第k個(gè)特征圖的輸入權(quán)重.
2)平方根池化.計(jì)算公式如公式(8)所示.
(8)
其中,e為池化大小,表示池化中心到邊的距離[21],池化圖大小與特征圖大小均為(d-r+1)×(d-r+1).第k個(gè)特征圖中的節(jié)點(diǎn)(i,j)和第k個(gè)池化圖中的組合節(jié)點(diǎn)(p,q)分別用ci,j,k和hp,q,k來表示,如果當(dāng)(i,j)超出范圍,那么ci,j,k則等于0.
3)計(jì)算輸出權(quán)重矩陣.第1步,先計(jì)算各個(gè)輸入樣本對應(yīng)的池化圖和特征圖;第2步,將池化圖中的每一個(gè)組合節(jié)點(diǎn)合并成一個(gè)行向量;第3步,將所有輸入樣本的行向量連接起來,從而得到組合層矩陣為H∈RN×K·(d-r+1)2.輸出權(quán)重β可以由正則化最小二乘法計(jì)算得到,其計(jì)算公式如公式(9)、公式(10)所示:
如果N≤K·(d-r+1)2
(9)
如果N>K·(d-r+1)2
(10)
其中,N為輸入樣本的個(gè)數(shù),C為可調(diào)參數(shù),T為輸入樣本對應(yīng)的標(biāo)簽.此外,ELM-LRF分類網(wǎng)絡(luò)的平衡參數(shù)設(shè)置為0.0001,特征圖個(gè)數(shù)設(shè)置為50,局部感受野大小設(shè)置為4×4.
本文實(shí)驗(yàn)環(huán)境配置為:操作系統(tǒng)Windows 8.1 64位,處理器Intel Core i5-4200M @ 2.50GHz,內(nèi)存(ARM)8GB,軟件MATLAB R2018a.
表1 磁瓦缺陷圖像數(shù)據(jù)集說明Table 1 Description of magnetic tile defect image data set
磁瓦缺陷圖像生成實(shí)驗(yàn)采用的數(shù)據(jù)集來自中科院自動(dòng)化所收集的磁瓦缺陷檢測數(shù)據(jù)集[5].數(shù)據(jù)集共1344張,包括有缺陷和無缺陷圖像共6種類型,數(shù)據(jù)集具體說明如表1所示.
實(shí)驗(yàn)中,選用5類缺陷圖像(共391張)作為GMM-DCGANs網(wǎng)絡(luò)的訓(xùn)練樣本,由于不同磁瓦的ROI不同,所以數(shù)據(jù)集中圖像的大小也不同,為此在訓(xùn)練前,將數(shù)據(jù)集中圖像統(tǒng)一轉(zhuǎn)化成64×64大小,如圖4(a)所示.訓(xùn)練中,將磁瓦缺陷原圖像輸入GMM-DCGANs網(wǎng)絡(luò),經(jīng)過訓(xùn)練后,發(fā)現(xiàn)所生成的磁瓦缺陷圖像質(zhì)量較差,未能得到符合要求的磁瓦缺陷圖像,如圖4(b)所示.考慮到在后續(xù)的磁瓦缺陷檢測及分類實(shí)驗(yàn)研究中,需要將原磁瓦圖像轉(zhuǎn)換為二值圖像來進(jìn)行進(jìn)一步的實(shí)驗(yàn),因此,我們采用最大類間方差(Otsu)算法將磁瓦缺陷原圖像轉(zhuǎn)換為二值圖像,如圖4(c)所示,將該二值圖像作為GMM-DCGANs網(wǎng)絡(luò)的輸入,訓(xùn)練得到生成的缺陷圖像如圖4(d)所示.可以看出,采用經(jīng)過預(yù)處理后的磁瓦缺陷二值圖作為GMM-DCGANs網(wǎng)絡(luò)的輸入時(shí),可以生成質(zhì)量更好的圖像樣本,因此,我們將所有5種含缺陷的磁瓦原圖如圖5(a)所示,轉(zhuǎn)換為二值圖像后,如圖5(b)所示,再經(jīng)過GMM-DCGANs網(wǎng)絡(luò)訓(xùn)練,得到生成的缺陷圖像如圖5(c)所示.訓(xùn)練中,設(shè)置網(wǎng)絡(luò)迭代次數(shù)1000次,學(xué)習(xí)速率為0.001.為了對比本文所提生成對抗網(wǎng)絡(luò)生成圖片的質(zhì)量,采用GAN和DCGAN網(wǎng)絡(luò)分別對磁瓦缺陷圖像進(jìn)行訓(xùn)練,得到生成的磁瓦缺陷圖像如圖5(d)、圖5(e)所示.
圖4 磁瓦磨損缺陷原圖和二值圖生成實(shí)驗(yàn)結(jié)果對比圖Fig.4 Comparison of the original and binary image generation results of the magnetic tile fray defect
圖5 5種磁瓦缺陷圖像生成實(shí)驗(yàn)結(jié)果對比圖Fig.5 Comparison of five categoriemagnetic tile defect images generation experimentresults
通過生成磁瓦缺陷圖像對比實(shí)驗(yàn),可以看到在使用相同數(shù)據(jù)集訓(xùn)練生成圖像時(shí),GMM-DCGANs網(wǎng)絡(luò)生成的圖像存在的噪點(diǎn)雜質(zhì)最少,且生成圖像的缺陷特征更接近原圖像二值特征.另外,GMM-DCGANs網(wǎng)絡(luò)由于對輸入噪聲做復(fù)雜化處理,使得生成的圖像可以將多個(gè)缺陷融合在一張圖像中,如圖6所示,進(jìn)一步擴(kuò)充了數(shù)據(jù)集中磁瓦缺陷類型.
圖6 GMM-DCGANs生成多個(gè)缺陷融合圖像Fig.6 GMM-DCGANs generate multiple defect fusion images
在檢測生成的磁瓦缺陷圖像是否與實(shí)際生產(chǎn)中磁瓦缺陷圖像相符時(shí),我們采用ELM-LRF分類網(wǎng)絡(luò)對生成的缺陷圖像進(jìn)行分類,共進(jìn)行4組對比實(shí)驗(yàn),每組實(shí)驗(yàn)重復(fù)30次,取分類準(zhǔn)確率的平均值作為該組實(shí)驗(yàn)的分類準(zhǔn)確率.將分類準(zhǔn)確率作為評判生成圖像質(zhì)量好壞的標(biāo)準(zhǔn),分類準(zhǔn)確率計(jì)算公式如公式(11)所示:
準(zhǔn)確率=正確分類樣本數(shù)/樣本總數(shù)
(11)
第1組,只選取原磁瓦缺陷數(shù)據(jù)集中的缺陷圖像樣本進(jìn)行實(shí)驗(yàn),訓(xùn)練集和測試集樣本數(shù)量設(shè)置如表2所示.
表2 第1組實(shí)驗(yàn)訓(xùn)練集和測試集樣本數(shù)量設(shè)置Table 2 Training and test sets sample number settings for the first experimental
第2組,選擇原磁瓦缺陷數(shù)據(jù)集中所有缺陷圖像樣本作為訓(xùn)練集,選擇生成的磁瓦缺陷圖像作為測試集,訓(xùn)練集和測試集樣本數(shù)量設(shè)置如表3所示.
表3 第2組實(shí)驗(yàn)訓(xùn)練集和測試集樣本數(shù)量設(shè)置Table 3 Training and test sets sample number settings for the second experimental
第3組,選擇生成的磁瓦缺陷圖像作為訓(xùn)練集,選擇原磁瓦缺陷數(shù)據(jù)集中所有缺陷圖像樣本作為測試集,訓(xùn)練集和測試集樣本數(shù)量設(shè)置如表4所示.
表4 第3組實(shí)驗(yàn)訓(xùn)練集和測試集樣本數(shù)量設(shè)置Table 4 Training and test sets sample number settings for the third experimental
第4組,按照1:1比例選擇原磁瓦缺陷數(shù)據(jù)集中所有缺陷圖像樣本(391張)和生成的磁瓦缺陷圖像樣本(391張),共782張.將選取的圖像樣本按缺陷類型隨機(jī)混合后,選擇各缺陷類型圖像樣本的前一半作為訓(xùn)練集,后一半作為測試集進(jìn)行分類實(shí)驗(yàn),訓(xùn)練集和測試集樣本數(shù)量各為391張.
4組分類實(shí)驗(yàn)的30次分類準(zhǔn)確率對比結(jié)果,如圖7所示,每組實(shí)驗(yàn)的平均分類準(zhǔn)確率如表5所示.
通過ELM-LRF分類實(shí)驗(yàn)結(jié)果可以看到,4組實(shí)驗(yàn)中,第2組和第3組實(shí)驗(yàn)的平均分類準(zhǔn)確率較低,其中,第3組實(shí)驗(yàn)的平均分類準(zhǔn)確率最低,為86.83%,第4組實(shí)驗(yàn)的平均分類準(zhǔn)確率最高,為90.29%,兩者相差3.46個(gè)百分點(diǎn).這是因?yàn)?/p>
圖7 ELM-LRF分類實(shí)驗(yàn)準(zhǔn)確率對比圖Fig.7 Comparison of the ELM-LRF classification experimentsaccuracy
雖然原圖像和生成圖像中大部分缺陷樣式是一致或相似的,但原圖像中含有個(gè)別缺陷樣式是生成圖像中所沒有的,而生成圖像中也存在一些新型缺陷和融合缺陷是原圖像中所沒有的,因此在分別單獨(dú)使用原圖像和生成圖像做訓(xùn)練集和測試集時(shí),訓(xùn)練得到的分類模型對測試集中一些新缺陷樣式無法準(zhǔn)確分類,造成了平均分類準(zhǔn)確率較低.第4組實(shí)驗(yàn)將原圖像和生成圖像混合后進(jìn)行訓(xùn)練,進(jìn)一步豐富了訓(xùn)練數(shù)據(jù)的缺陷樣式,使訓(xùn)練得到的分類模型具有更高的泛化性能,因此第4組實(shí)驗(yàn)的平均分類準(zhǔn)確率較高.
表5 ELM-LRF分類實(shí)驗(yàn)平均分類準(zhǔn)確率Table 5 Average classification accuracy of the ELM-LRF classification experiments
另外由于第1組實(shí)驗(yàn)僅包含原圖像且數(shù)據(jù)樣本大小與后3組不同,將第1組實(shí)驗(yàn)作為后3組實(shí)驗(yàn)的參考,可以看到后3組實(shí)驗(yàn)的分類準(zhǔn)確率與第1組實(shí)驗(yàn)的分類準(zhǔn)確率相近.分類實(shí)驗(yàn)結(jié)果表明,生成的磁瓦缺陷圖像與原磁瓦缺陷圖像相符合,可以滿足后續(xù)磁瓦缺陷檢測及分類實(shí)驗(yàn)的需求.
本文針對訓(xùn)練磁瓦缺陷檢測及分類模型時(shí),圖像樣本采集困難、樣本數(shù)據(jù)較少、缺陷樣本類型不足的問題,提出一種高斯混合模型的深度卷積生成對抗網(wǎng)絡(luò)(GMM-DCGANs)用于生成磁瓦缺陷圖像.利用高斯混合模型作為生成網(wǎng)絡(luò)的輸入噪聲,一方面可以提高生成網(wǎng)絡(luò)生成圖像的質(zhì)量,另一方面也可以生成含有更多缺陷樣式的磁瓦圖像.通過4組磁瓦缺陷類型分類的對比實(shí)驗(yàn)結(jié)果可以看出,本文所提GMM-DCGANs模型生成的磁瓦缺陷圖像可以用于擴(kuò)充磁瓦缺陷圖像數(shù)據(jù)集,利用擴(kuò)充的數(shù)據(jù)集訓(xùn)練檢測及分類模型時(shí),可以更好地提升模型的泛化性能.未來進(jìn)一步的研究中將著眼于對生成圖像質(zhì)量進(jìn)行多重標(biāo)準(zhǔn)的評判.