摘 要:針對(duì)太陽電池缺陷圖像數(shù)據(jù)少導(dǎo)致深度學(xué)習(xí)模型過擬合,從而造成小樣本缺陷檢測困難的問題,該文提出一種融合元學(xué)習(xí)和雙路徑注意力的生成對(duì)抗網(wǎng)絡(luò)(MAGAN)作為數(shù)據(jù)增強(qiáng)策略。所設(shè)計(jì)的元學(xué)習(xí)調(diào)參模塊(MTM)優(yōu)化生成器中權(quán)重參數(shù);所設(shè)計(jì)的雙路徑注意力模塊(DPAT)在特征提取過程中更關(guān)注圖像中微小微弱缺陷特征;在改進(jìn)網(wǎng)絡(luò)構(gòu)架的同時(shí)提出一種聚類約束損失函數(shù)解決訓(xùn)練過程中梯度消失問題。實(shí)驗(yàn)和研究結(jié)果表明,所提方法能夠針對(duì)小樣本缺陷生成有效目標(biāo)數(shù)據(jù)集并優(yōu)于其他生成對(duì)抗網(wǎng)絡(luò),最后通過分類準(zhǔn)確率驗(yàn)證了該網(wǎng)絡(luò)的有效性。
關(guān)鍵詞:太陽電池;缺陷檢測;生成對(duì)抗網(wǎng)絡(luò);元學(xué)習(xí);雙路徑注意力;數(shù)據(jù)增強(qiáng)
中圖分類號(hào):TP391.4" 文獻(xiàn)標(biāo)志碼:A
0 引 言
太陽電池在大規(guī)模制造過程中,由于不同的工藝流程會(huì)產(chǎn)生不同種類的缺陷[1]。帶有缺陷的太陽電池會(huì)嚴(yán)重影響其發(fā)電效率,因此,太陽電池的缺陷檢測具有重要的研究意義。隨著科技的發(fā)展,基于機(jī)器視覺的深度學(xué)習(xí)缺陷檢測已成為新的主流研究方法[2-3],這些方法相比于人工檢測可降低工作量且具有更高的工作效率,但也存在不足:深度學(xué)習(xí)訓(xùn)練過程中模型需要大量數(shù)據(jù)集,而具有缺陷的數(shù)據(jù)集不易獲取。在缺陷樣本較少的條件下,小樣本檢測仍是一個(gè)技術(shù)難題。因此,可通過數(shù)據(jù)增強(qiáng)策略提升深度學(xué)習(xí)模型的識(shí)別性能。已有的傳統(tǒng)數(shù)據(jù)增強(qiáng)方法有旋轉(zhuǎn)、縮放、裁剪等[4-5],它們能在一定程度上擴(kuò)充樣本數(shù)據(jù),但并未真正改變樣本數(shù)量和屬性多樣性,這種數(shù)據(jù)極易導(dǎo)致深度學(xué)習(xí)模型過擬合。
目前,更有效的方法是利用生成模型生成新的樣本或新的特征,生成模型中最具代表性的是生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks, GAN)[6], GAN主要是生成器和判別器采用博弈思想進(jìn)行相互對(duì)抗并迭代優(yōu)化,以至最終判別器無法正確區(qū)分生成器生成樣本與真實(shí)樣本之間的差異從而產(chǎn)生最優(yōu)輸出。經(jīng)過GAN擴(kuò)充后的樣本可用于深度模型檢測,進(jìn)一步提高檢測準(zhǔn)確率[7-8]。Radford等[9]提出的深度卷積生成對(duì)抗網(wǎng)絡(luò)(deep convolutional GAN, DCGAN)是卷積神經(jīng)網(wǎng)絡(luò)與GAN的結(jié)合;Arjovsky等[10]提出的沃瑟斯坦生成對(duì)抗網(wǎng)絡(luò)(Wasserstein GAN, WGAN)用Wasserstein距離代替JS距離對(duì)真實(shí)樣本和生成樣本之間的距離進(jìn)行度量;文獻(xiàn)[11]提出的自注意力生成對(duì)抗網(wǎng)絡(luò)(selfattention GAN, SAGAN)是將自注意機(jī)制引入到GAN中。這些改進(jìn)的GAN雖然在生成效果上有更好的表現(xiàn),但在訓(xùn)練過程中依賴于大量的訓(xùn)練樣本,否則會(huì)出現(xiàn)梯度消失和過擬合問題,導(dǎo)致生成樣本質(zhì)量較低,多樣性較差,無法更好地解決小樣本生成問題。
近幾年小樣本學(xué)習(xí)(few-shot learning)[12]取得快速發(fā)展,元學(xué)習(xí)(meta-learning)[13]也已廣泛應(yīng)用于數(shù)據(jù)匱乏的小樣本任務(wù)中,元學(xué)習(xí)擁有的是一種學(xué)會(huì)學(xué)習(xí)的能力,其通過積累過去任務(wù)的經(jīng)驗(yàn)使得在新任務(wù)中有更好的表現(xiàn)。
為了更好地在小樣本條件下利用生成對(duì)抗網(wǎng)絡(luò)的學(xué)習(xí)能力,本文提出一種融合元學(xué)習(xí)和雙路徑注意力的生成對(duì)抗網(wǎng)絡(luò)(meta-attention generative adversarial networks, MAGAN),所設(shè)計(jì)的元學(xué)習(xí)調(diào)參模塊(meta-learning tuning module, MTM)旨在學(xué)習(xí)一組元學(xué)習(xí)器, 其根據(jù)以往學(xué)習(xí)經(jīng)驗(yàn)運(yùn)用于電池片缺陷生成任務(wù)中,改變生成網(wǎng)絡(luò)的權(quán)重參數(shù);所設(shè)計(jì)的雙路徑注意力模塊(dual-path attention, DPAT)用于圖像的屬性特征學(xué)習(xí),包括局部像素區(qū)域之間的關(guān)聯(lián)性,并重點(diǎn)關(guān)注缺陷的位置信息和內(nèi)容信息,驅(qū)動(dòng)小樣本生成模型輸出類別一致性和屬性多樣性。在判別器的損失函數(shù)中,引入聚類約束損失,其關(guān)鍵在于將損失函數(shù)約束在一定范圍內(nèi),拉近生成圖像和真實(shí)圖像的分布距離,以此增加真實(shí)圖像與生成圖像的相似性,并解決模型訓(xùn)練過程中的梯度消失問題。同時(shí),將MAGAN與傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法mixup算法進(jìn)行結(jié)合,多階段MAGAN使生成缺陷數(shù)據(jù)在第2階段進(jìn)行隨機(jī)混合疊加,進(jìn)一步提高多樣性和數(shù)據(jù)量。
1 多階段MAGAN
多階段MAGAN網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,結(jié)構(gòu)中每層神經(jīng)網(wǎng)絡(luò)由全連接層(Linear)、激活函數(shù)層(LeakyRelu)或全連接層(Linear)、層標(biāo)準(zhǔn)化(LayerNorm,LN)、激活函數(shù)層(LeakyRelu)構(gòu)成。將元學(xué)習(xí)調(diào)參模塊MTM和雙路徑注意力模塊DPAT融合于GAN網(wǎng)絡(luò)中,使生成器和判別器第2層的輸出作為DPAT的輸入,通過DPAT學(xué)習(xí)圖像的細(xì)節(jié)紋理,主要針對(duì)圖像中微小微弱缺陷的特征提取,避免在生成圖像中造成缺陷特征丟失,并能快速捕捉數(shù)據(jù)或特征的內(nèi)部相關(guān)性;同時(shí)將生成器第3層權(quán)重輸入到元學(xué)習(xí)模塊MTM,令MTM的輸出權(quán)重作為網(wǎng)絡(luò)第4層的輸入,優(yōu)化生成器中的權(quán)重參數(shù),使生成器在小樣本條件下仍能生成高質(zhì)量圖片。
在階段1,所設(shè)計(jì)生成對(duì)抗網(wǎng)絡(luò)MAGAN生成缺陷圖片B;在階段2,將階段1生成的缺陷圖像B與真實(shí)缺陷圖像A采用mixup算法進(jìn)行數(shù)據(jù)擴(kuò)充,即生成缺陷圖像與真實(shí)圖像進(jìn)行隨機(jī)混合疊加,生成階段2的生成缺陷圖像C,階段2僅用簡單算法即可使數(shù)據(jù)量成倍增加并增加缺陷位置的多樣性。
1.1 元學(xué)習(xí)調(diào)參模塊
元學(xué)習(xí)調(diào)參模塊MTM結(jié)構(gòu)如圖2所示,包括S1、S2、S3、S4這4部分,每部分均由卷積層(convolution, Conv)、層標(biāo)準(zhǔn)化、激活函數(shù)層(exponential linear units, Elu)和最大池化層(MaxPool)組成。
在MTM模塊中采用的Elu激活函數(shù)定義如式(1)所示。
式中:——x真實(shí)圖像;[E]——激活函數(shù)在輸入負(fù)數(shù)的情況下,具有一定的輸出,且這一部分輸出還具有一定的抗干擾能力;[α]——常數(shù)項(xiàng)系數(shù),輸入大于0部分的梯度為1,輸入小于0的部分無限趨近于[-α]。
MTM模塊中采用LN層標(biāo)準(zhǔn)化,防止過度依賴于神經(jīng)網(wǎng)絡(luò)批大小而對(duì)模型的訓(xùn)練帶來干擾,且將LN層放于激活函數(shù)之前,其作用是增加訓(xùn)練速度,防止過擬合,避免激活函數(shù)進(jìn)入飽和非線性區(qū),從而造成梯度彌散問題。
MTM模塊參數(shù)預(yù)訓(xùn)練過程如圖3所示,其采用元學(xué)習(xí)中一種經(jīng)典模型MAML[14]的參數(shù)訓(xùn)練方法,給定一個(gè)初始化參數(shù)[θ],進(jìn)行反復(fù)訓(xùn)練,最后得到最優(yōu)參數(shù)[θn],在整個(gè)過程中,其無需預(yù)設(shè)初始化參數(shù)[θ],而是經(jīng)過學(xué)習(xí)得到一個(gè)最優(yōu)的初始化參數(shù),使得對(duì)于所有的任務(wù)均可較快收斂,并在新任務(wù)上具有很好的表現(xiàn)。
圖3中學(xué)習(xí)一個(gè)最優(yōu)初始化參數(shù)[θn]的表達(dá)式如式(2)所示。
式中:[L?]——總損失函數(shù);[?]——總損失變量;[lnθn]——每個(gè)訓(xùn)練任務(wù)中的損失函數(shù);在進(jìn)行[n]個(gè)任務(wù)訓(xùn)練完成后,將[n]個(gè)任務(wù)中損失函數(shù)進(jìn)行求和運(yùn)算,最終得到[L?]損失函數(shù),在訓(xùn)練中使[L?]達(dá)到最小值,完成最優(yōu)初化參數(shù)的訓(xùn)練。
在訓(xùn)練過程中,經(jīng)過預(yù)訓(xùn)練找到最優(yōu)參數(shù),再將MTM模塊加入到生成器中開啟新任務(wù),用MTM的訓(xùn)練參數(shù)優(yōu)化生成器的權(quán)重參數(shù),并加入元學(xué)習(xí)模塊可具備即使存在樣本少也能夠使生成器更加有效地學(xué)習(xí)到少量樣本數(shù)據(jù)的特征,從而生成更好的圖片。
1.2 雙路徑注意力模塊
雙路徑注意力模塊主要用于解決太陽電池微小微弱缺陷特征丟失問題,DPAT是改進(jìn)的自注意力[15]和通道注意力[16],在計(jì)算自注意力特征的同時(shí)引入了平均池化層和最大池化層,它們分別通過保留背景信息和提取紋理特征聚合特征映射的空間信息。DPAT通過捕捉特征的內(nèi)部相關(guān)性,減少對(duì)外部信息的依賴。DPAT結(jié)構(gòu)框圖如圖4所示。
其具體實(shí)現(xiàn)是將輸入缺陷圖片進(jìn)行特征提取得到特征圖[y],然后進(jìn)行[1×1]卷積操作來降低通道數(shù),再經(jīng)過矩陣運(yùn)算得到自特征圖[y2],自特征圖[y2]的計(jì)算公式如式(3)所示。
式中:[s]——激活函數(shù);[VAT]——注意力計(jì)算;[fx]、[gx]——計(jì)算注意力權(quán)重的特征向量;[hx]——輸入特征向量。
得到的自特征圖[y2]利用平均值池化(MeanPool)和最大值池化將特征圖在空間維度上進(jìn)行壓縮,得到1個(gè)一維矢量后再進(jìn)行操作;然后將所得結(jié)果送入1個(gè)多層感知器(MLP),該多層感知器包括[1×1]卷積層,[LeakyRelu]激活函數(shù)和[1×1]卷積層;最后將2條分別經(jīng)過平均池化層和最大池化層的并行路徑進(jìn)行加和,經(jīng)過[sigmoid]激活函數(shù)輸出特征圖[y3],計(jì)算特征圖[y3]如式(4)所示。
式中:[VMLP]——經(jīng)過MLP層的計(jì)算結(jié)果;[Ay]——平均池化特征;[My]——最大池化特征;平均值池化對(duì)特征圖上的每個(gè)像素點(diǎn)均有反饋,而最大值池化在進(jìn)行梯度反向傳播計(jì)算時(shí),僅有特征圖中響應(yīng)最大處有梯度反饋,兩者的結(jié)合使特征提取的效果顯著增加。在經(jīng)過池化和多層感知器的整個(gè)過程中,雙路徑注意力模塊DPTA更關(guān)注特征圖中哪些內(nèi)容具有重要作用,最終的雙路徑注意力圖[Y]是將[y3]與[y2]進(jìn)行對(duì)應(yīng)元素相乘,如式(5)所示。
式中:λ——梯度懲罰項(xiàng)的常系數(shù);[gp]——梯度約束正則項(xiàng);[Pγ]——服從[γ]的概率分布;[D]——判別器;[P]——概率分布。
2 實(shí)驗(yàn)結(jié)果分析與討論
2.1 數(shù)據(jù)集
本次實(shí)驗(yàn)使用的數(shù)據(jù)集為工業(yè)上采集的單晶硅太陽電池缺陷圖片,主要包括線狀缺陷和虛焊缺陷兩種類型缺陷,圖片的分辨率為256像素×256像素,每個(gè)類別的原始真實(shí)數(shù)據(jù)集為20張圖片。
2.2 評(píng)價(jià)指標(biāo)
將本實(shí)驗(yàn)的生成數(shù)據(jù)結(jié)果通過初始得分(inception score, IS)、距離得分(frechet inception distance score, FID)、結(jié)構(gòu)相似性(structural similarity, SSIM)和峰值信噪比(peak signal to noise ratio, PSNR)4個(gè)指標(biāo)進(jìn)行驗(yàn)證,分別如式(9)~式(12)所示。
式中:[DKL]——用于衡量分布間的近似程度,KL散度;[μx]——真實(shí)圖像均值;[μDz]——生成圖像均值;[T]——矩陣對(duì)角線上元素的綜合;[x]——真實(shí)圖像特征的協(xié)方差矩陣;[Gz]——生成圖像特征的協(xié)方差矩陣;[lx,Gz]——兩個(gè)樣本亮度計(jì)算;[cx,Gz]——兩個(gè)樣本對(duì)比度計(jì)算;[sx,Gz]——兩個(gè)樣本結(jié)構(gòu)計(jì)算;[L2MAXx]——圖片可能的最大像素值;[EMSE]——真實(shí)圖像與生成圖像的均方誤差。
2.3 消融實(shí)驗(yàn)
此次消融實(shí)驗(yàn)通過直觀生成結(jié)果、評(píng)價(jià)指標(biāo)、可視化t-SNE圖3個(gè)方面來驗(yàn)證所設(shè)計(jì)模塊的有效性。
2.3.1 直觀生成結(jié)果
兩種缺陷生成結(jié)果如圖5所示。分別對(duì)比了線狀缺陷和虛焊缺陷這兩類缺陷的真實(shí)圖片和生成圖片,每類缺陷的真實(shí)圖像和生成圖像分別展示3張。
生成結(jié)果驗(yàn)證了DPAT模塊能夠高效提取細(xì)小微弱缺陷特征,避免造成缺陷特征丟失的問題;MTM模塊可進(jìn)一步提高生成圖片的質(zhì)量,使生成圖片更具有真實(shí)性,背景紋理也變得更清晰;在此基礎(chǔ)上,改進(jìn)的損失函數(shù)使得生成圖片更加真實(shí)。此方法不僅針對(duì)線狀這類微小微弱的缺陷,對(duì)于虛焊這種相對(duì)缺陷面積較大的也同樣適用。
2.3.2 評(píng)價(jià)指標(biāo)
僅用肉眼直觀判斷生成結(jié)果的好壞具有一定的局限性和不確定性,因此,將本實(shí)驗(yàn)兩類數(shù)據(jù)集的生成結(jié)果通過IS、FID、PSNR和SSIM這4個(gè)指標(biāo)進(jìn)行驗(yàn)證,結(jié)果見表1。
從表1可發(fā)現(xiàn),相比于原始網(wǎng)絡(luò),隨著加入所設(shè)計(jì)的模塊,性能指標(biāo)均有所提升,其中加入雙路徑注意力模塊DPAT比單獨(dú)加入通道注意力(channel attention, CA)或自注意力(self-attention, SA)指標(biāo)均有所提升,加入元學(xué)習(xí)調(diào)參模塊MTM后指標(biāo)有較為明顯提升。
2.3.3 可視化t-SNE圖
將真實(shí)圖片和生成圖片分為兩類,記作0和1這兩個(gè)類別。采用t-SNE圖通過在空間中的分布距離判斷真實(shí)圖片和生成圖片這兩個(gè)類別的相似度,可視化t-SNE圖如圖6所示,若兩個(gè)類別相似度越高,則0和1這兩類所代表的數(shù)據(jù)分布重合度越高,兩者分布距離即0和1的距離越近。從圖6可看出,相比于圖6a~圖6e,圖6f中0和1這兩類分布邊界幾乎已分不出,0和1所代表的分布距離也有明顯拉近,進(jìn)一步驗(yàn)證了所設(shè)計(jì)模塊的有效性,即生成圖片更接近于真實(shí)圖片,但又不完全相同,保持了生成類別一致性和屬性多樣性。
2.4 對(duì)比實(shí)驗(yàn)
為驗(yàn)證所設(shè)計(jì)MAGAN的有效性,通過對(duì)比InfoGAN、DCGAN、WGAN、WGAN-GP和MAGAN 這5種模型的生成樣本質(zhì)量和數(shù)據(jù)增強(qiáng)效果。同樣通過IS、FID、SSIM和PSNR指標(biāo)來進(jìn)行評(píng)價(jià),結(jié)果見表2。
從表2可發(fā)現(xiàn),DCGAN在IS指標(biāo)相對(duì)表現(xiàn)稍好,但在FID和SSIM指標(biāo)卻表現(xiàn)很差;WGAN-GP在FID、PSNR和SSIM指標(biāo)相對(duì)表現(xiàn)稍好,但在IS指標(biāo)卻表現(xiàn)很差,本文提出的MAGAN網(wǎng)絡(luò)在這4個(gè)指標(biāo)的結(jié)果相對(duì)均優(yōu)于其他GAN網(wǎng)絡(luò),由此也證明了該網(wǎng)絡(luò)性能的優(yōu)越性。
2.5 損失函數(shù)曲線
在GAN網(wǎng)絡(luò)訓(xùn)練過程中,因訓(xùn)練數(shù)據(jù)量少,網(wǎng)絡(luò)穩(wěn)定性差等原因,損失函數(shù)往往會(huì)出現(xiàn)梯度爆炸、梯度消失和梯度反常等情況。如圖7所示,圖7a~圖7d為訓(xùn)練過程中判別器損失函數(shù)變化曲線,圖7d相比于前3種情況,隨著訓(xùn)練輪數(shù)的增加,模型更穩(wěn)定,更易收斂。
2.6 分類驗(yàn)證
為進(jìn)一步驗(yàn)證所設(shè)計(jì)生成對(duì)抗網(wǎng)絡(luò)生成缺陷圖像的有效性和實(shí)用性,本文進(jìn)行缺陷分類實(shí)驗(yàn),將通過直觀生成結(jié)果和分類準(zhǔn)確率進(jìn)行驗(yàn)證。
2.6.1 直觀生成結(jié)果
InfoGAN、DCGAN、WGAN、WGAN-GP和MAGAN 這5種模型的直觀生成結(jié)果如圖8所示。通過直觀對(duì)比,其他GAN網(wǎng)絡(luò)生成圖片相對(duì)模糊,圖片生成質(zhì)量較差,所設(shè)計(jì)MAGAN生成圖片缺陷部分更明顯,圖像質(zhì)量更優(yōu)。
2.6.2 分類準(zhǔn)確率
表3為上述線狀和虛焊兩類缺陷訓(xùn)練、測試數(shù)據(jù)集分布情況,其中訓(xùn)練集的真實(shí)數(shù)據(jù)集為0,這是由于真實(shí)數(shù)據(jù)集為小樣本,如果采用真實(shí)數(shù)據(jù)集中一部分和生成數(shù)據(jù)集作為訓(xùn)練集,真實(shí)數(shù)據(jù)集中剩余一部分作為測試集,則測試集樣本更少,不足以評(píng)價(jià)分類準(zhǔn)確率。因此采用生成數(shù)據(jù)集作為訓(xùn)練集,真實(shí)數(shù)據(jù)集作為測試集,更能說明生成數(shù)據(jù)的真實(shí)性和可使用性。實(shí)驗(yàn)中采用的分類模型為MobilenetV2,分類結(jié)果見表4。
從表4可看出,與其他圖像生成方法相比,MAGAN的缺陷分類模型的準(zhǔn)確率較高,該方法準(zhǔn)確、全面地反映了生成數(shù)據(jù)的有效性。
3 結(jié) 論
根據(jù)工業(yè)太陽電池缺陷數(shù)據(jù)集的具體情況,提出一種缺陷圖像生成模型,其在判別器和生成器中融合元學(xué)習(xí)模塊和雙路徑注意力模塊,通過消融實(shí)驗(yàn)對(duì)比驗(yàn)證了這兩個(gè)模塊的有效性,元學(xué)習(xí)模塊有針對(duì)性地解決小樣本問題,雙路徑注意力模塊聚焦于缺陷特征,避免在提取特征時(shí)發(fā)生特征丟失問題,兩者與GAN網(wǎng)絡(luò)的融合提高了生成圖片的真實(shí)性和屬性多樣性,使得能生成紋理更清楚, 缺陷更明顯的圖片;通過與其他GAN網(wǎng)絡(luò)對(duì)比實(shí)驗(yàn),驗(yàn)證了所提出網(wǎng)絡(luò)性能的優(yōu)越性;通過損失函數(shù)曲線驗(yàn)證了所提出的聚類約束損失函數(shù)可有效改善模型在訓(xùn)練過程中的不穩(wěn)定性,使得模型更穩(wěn)定且更易收斂。與此同時(shí),通過分類準(zhǔn)確率進(jìn)一步驗(yàn)證了該網(wǎng)絡(luò)生成圖像的有效性,并改善因缺少樣本造成的過擬合情況。下一步將對(duì)如何更有效地提取缺陷特征等問題進(jìn)行深入研究。
[參考文獻(xiàn)]
[1] 張治, 鄒鵬輝, 劉志鋒, 等. 發(fā)射極摻雜工藝對(duì)產(chǎn)業(yè)化IBC太陽電池性能的影響[J]. 太陽能學(xué)報(bào), 2022, 43(3): 158-162.
ZHANG Z, ZOU P H, LIU Z F, et al. Influence of emitter doping process on performance of industrial IBC solar cell [J]. Acta energiae solaris sinica, 2022, 43(3): 158-162.
[2] 仝勖峰, 金嘉祺, 袁曉軍, 等. 基于機(jī)器視覺的區(qū)域太陽直接輻射動(dòng)態(tài)預(yù)測方法研究[J]. 太陽能學(xué)報(bào), 2021, 42(6): 247-255.
TONG X F, JIN J Q, YUAN X J, et al. Research on regional solar direct normal irradiance dynamic forecasting based on machine vision[J]. Acta energiae solaris sinica, 2021, 42(6): 247-255.
[3] EL HAJ Y, EL-HAG A H, GHUNEM R A. Application of deep-learning via transfer learning to evaluate silicone rubber material surface erosion[J]. IEEE transactions on dielectrics and electrical insulation, 2021, 28(4): 1465-1467.
[4] CUBUK E D, ZOPH B, MANé D, et al. AutoAugment: learning augmentation strategies from data[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, CA, USA, 2020: 113-123.
[5] REIPSCHLAGER P, FLEMISCH T, DACHSELT R. Personal augmented reality for information visualization on large" "interactive" "displays[J]." "IEEE" "transactions" "on visualization and computer graphics, 2021, 27(2): 1182-1192.
[6] GOODFELLOW I J, POUGRT A J, MIRZA M, et al. Generative adversarial nets[C]//Proceedings of the 27th International Conference on Neural Information Processing Systems, Montreal, Cambridge, UK, 2014: 2672-2680.
[7] TAO X, ZHANG D P, WANG Z H, et al. Detection of power line insulator defects using aerial images analyzed with convolutional neural networks[J]. IEEE transactions on systems, man, and cybernetics: systems, 2020, 50(4): 1486-1498.
[8] HANG R L, ZHOU F, LIU Q S, et al. Classification of hyperspectral images via multitask generative adversarial networks[J]. IEEE transactions on geoscience and remote sensing, 2021, 59(2): 1424-1436.
[9] RADFORD A, METZ L, CHINTALA S. Unsupervised representation learning with deep convolutional generative adversarial" "networks[J]." "Computer" "ence," "2015." "DOI:10.48550/arXiv.1511.06434.
[10] ARJOVSKY M, CHINTALA S, BOTTOU L. Wasserstein GAN[EB/OL]. 2017: arXiv: 1701.07875. https://arxiv.org/abs/1701.07875.
[11] ZHANG H, GOODFELLOW I, METAXAS D, et al. Self-attention generative adversarial networks[EB/OL]. 2018: arXiv: 1805.08318. https://arxiv.org/abs/1805.08318.
[12] CHEN Z T, FU Y W, ZHANG Y D, et al. Multi-level semantic feature augmentation for one-shot learning[J]. IEEE transactions on image processing, 2019, 28(9): 4594-4605.
[13] PENG" S" G." Overview" of" meta-reinforcement" learning research[C]//2020" "2nd" "International" "Conference" "on Information Technology and Computer Application (ITCA), Guangzhou, China, 2021: 54-57.
[14] PARK S, JANG H, SIMEONE O, et al. Learning to demodulate from few pilots via offline and online meta-learning[J]." IEEE" transactions" on" signal" processing, 2021, 69: 226-239.
[15] 葉星余, 何元烈, 汝少楠. 基于生成式對(duì)抗網(wǎng)絡(luò)及自注意力機(jī)制的無監(jiān)督單目深度估計(jì)和視覺里程計(jì)[J]. 機(jī)器人, 2021, 43(2): 203-213.
YE X Y, HE Y L, RU S N. Unsupervised monocular depth estimation and visual odometry based on generative adversarial" "network" "and" "self-attention" "mechanism[J]. Robot, 2021, 43(2): 203-213.
[16] WOO S, PARK J, LEE J Y, et al. CBAM: convolutional block attention module[EB/OL]. 2018: arXiv: 1807.06521. https://arxiv.org/abs/1807.06521.
DEFECT GENERATION OF SOLAR CELLS BY FUSION OF
META-LEARNING AND DUAL-PATH ATTENTION
Zhou Ying1,2,Yuan Zitong1,Chen Haiyong1,2,Wang Shijie1
(1. School of Artificial Intelligence and Data Science, Hebei University of Technology, Tianjin 300130, China;
2. Hebei Control Engineering Technology Research Center, Tianjin 300130, China)
Abstract:Due to over-fitting of deep learning models brought on by the absence of picture data containing solar cell defects, few-shot defect identification has become challenging. As a method of enhancing the data, this study proposes employing meta-attention generative adversarial networks (MAGAN), which incorporate meta-learning and dual-path attention. The dual-path attention module (DPAT) is designed to pay more attention to the small and faint defect features in the image during the feature extraction process. A clustering constrained loss function is proposed to solve the gradient disappearance problem during the training process while improving the network architecture. The meta-learning tuning module (MTM) is designed to optimize the weight parameters in the generator. The study and experiment discoveries demonstrate that the suggested strategy outperforms previous generative adversarial networks and may produce useful target datasets for modest sample faults.
Keywords:solar cells; defect detection; generative adversarial networks; meta-learning; dual-path attention; data augmentation
收稿日期:2022-06-01
基金項(xiàng)目:國家自然科學(xué)基金(62073117;U21A20482);中央引導(dǎo)地方科技發(fā)展資金項(xiàng)目(206Z1701G)
通信作者:陳海永(1980—),男,博士、教授、博士生導(dǎo)師,主要從事機(jī)器視覺與智能制造方面的研究。haiyong.chen@hebut.edu.cn