楊振良 汪俊亮 張 潔 蔣小康
東華大學(xué)機(jī)械工程學(xué)院,上海,201620
在半導(dǎo)體制造過程中,晶圓片需要薄膜、光刻、刻蝕等復(fù)雜的重入工藝,以實(shí)現(xiàn)復(fù)雜立體集成電路的制備[1]。制造過程中工序的異常會導(dǎo)致晶圓缺陷的產(chǎn)生,如薄膜過程中甩膠機(jī)的轉(zhuǎn)速變化或氧化過程中溫度不均勻易產(chǎn)生晶圓片表面Center和Edge-ring缺陷[2]。在晶圓質(zhì)檢中,利用電學(xué)測試設(shè)備對晶圓片上的每顆晶粒進(jìn)行電性測試,可得到用于描述晶圓缺陷狀態(tài)的晶圓圖。對晶圓圖的缺陷模式進(jìn)行識別分析,可有效輔助識別制造過程中的缺陷根源,從而提升晶圓制造的產(chǎn)品質(zhì)量。
在早期晶圓圖缺陷識別中,基于簡單統(tǒng)計(jì)的方法是一種比較常見的方法,如二項(xiàng)式測試[3]、空間特征分析[4]等。這些方法的局限性在于只能提供缺陷模式的統(tǒng)計(jì)分析,缺乏識別出詳細(xì)模式的能力,無法為查找制造過程中的缺陷根源提供更多有效的信息。近年來,隨著人工智能技術(shù)的發(fā)展,基于機(jī)器學(xué)習(xí)的方法已成為主流方法?;跈C(jī)器學(xué)習(xí)的晶圓圖缺陷模式識別的方法可分為兩個(gè)過程:①晶圓圖的圖像預(yù)處理;②對預(yù)處理得到的數(shù)據(jù)進(jìn)行缺陷識別。
利用圖像的預(yù)處理方法對晶圓圖數(shù)據(jù)進(jìn)行尺度轉(zhuǎn)換、數(shù)據(jù)采樣等操作,可以獲取表征晶圓圖中所含的缺陷類別信息。在晶圓生產(chǎn)過程中,不同晶圓片中的晶粒布局方式不同,使得所含晶粒數(shù)量不一致,從而導(dǎo)致掃描成像的晶圓圖所含缺陷數(shù)據(jù)的維度不同(通常有45×48、53×58、26×26、60×40等多種維度)。在機(jī)器學(xué)習(xí)中,同一個(gè)缺陷模式識別模型往往難以對不同維度的缺陷數(shù)據(jù)進(jìn)行處理。除了晶圓圖所含缺陷數(shù)據(jù)維度的多樣性外,還存在角度多樣性的特點(diǎn)。在晶圓制造過程中,缺陷晶粒在晶圓片上的分布角度受工藝參數(shù)、設(shè)備狀態(tài)等因素的影響而呈現(xiàn)出多樣的特點(diǎn)。在缺陷識別中,相同的晶粒缺陷圖形在不同角度下也可能被誤認(rèn)為不同的缺陷模式,因此,如何針對晶圓圖的數(shù)據(jù)維度與角度多樣性,設(shè)計(jì)出一種有效的圖像預(yù)處理方法,是晶圓缺陷模式識別中的難點(diǎn)。在圖像缺陷識別問題中,基于輪廓特征的預(yù)處理方法[5]和基于灰度值特征的預(yù)處理方法[6]得到了廣泛應(yīng)用。基于輪廓特征的預(yù)處理方法是針對圖像單個(gè)失效區(qū)域的特征(如面積、周長等),提取出相應(yīng)的失效區(qū)域輪廓數(shù)據(jù),但無法提取存在多個(gè)失效區(qū)域的晶圓圖缺陷模式的輪廓特征數(shù)據(jù);基于灰度值特征的預(yù)處理方法通過灰度共生矩陣來反映亮度的分布特征,但得到的一些缺陷模式數(shù)據(jù)相似度較高,影響分類精度。Radon變換[7]在圖像處理中屬于線性變換,通過對晶圓圖各個(gè)方向上的缺陷點(diǎn)做投影變換,可以解決晶圓圖的缺陷角度多樣性的難題,再對Radon變換圖像提取特征數(shù)據(jù)后,對數(shù)據(jù)進(jìn)行重采樣,可以解決晶圓圖的數(shù)據(jù)維度多樣性難題。
在晶圓圖缺陷模式識別中,構(gòu)建機(jī)器學(xué)習(xí)模型對缺陷晶圓圖的預(yù)處理數(shù)據(jù)進(jìn)行分類,以實(shí)現(xiàn)晶圓缺陷的識別。WU等[8]采用基于支持向量機(jī)(support vector machine,SVM)的晶圓圖缺陷模式識別(wafer map pattern recognition,WMFPR)和晶圓圖相似度排序(wafer map similarity ranking,WMSR)的方法,執(zhí)行WMFPR以識別晶圓圖缺陷模式及使用WMSR協(xié)助檢索其他晶圓映射中的類似缺陷,較為顯著地提高了模型的晶圓缺陷識別性能;邡鑫等[9]提出了改進(jìn)的Faster RCNN模型,利用卷積神經(jīng)網(wǎng)絡(luò)良好的特征學(xué)習(xí)能力,精準(zhǔn)、快速地對晶圓缺陷圖像進(jìn)行分類。雖然以上模型在晶圓缺陷識別中取得了較好的效果,但它們均建立在各類缺陷模式的樣本數(shù)量大致相同的情況下。在晶圓生產(chǎn)過程中,各類缺陷的比例各不相同,存在著某些缺陷模式的數(shù)據(jù)比例過少的情況,而在使用神經(jīng)網(wǎng)絡(luò)等模型對缺陷模式進(jìn)行分類識別時(shí),會因某些缺陷的樣本量較少而無法充分學(xué)習(xí)樣本的缺陷信息,從而影響識別精度。近年來,GOODFELLOW等[10]提出了生成式對抗網(wǎng)絡(luò)(generative adversarial networks, GAN)框架,可通過模擬真實(shí)數(shù)據(jù)生成仿真數(shù)據(jù),利用生成學(xué)習(xí)的方法來平衡缺陷晶圓圖數(shù)據(jù)集,使各類缺陷樣本達(dá)到相對平衡狀態(tài),以提升不平衡情況下的缺陷模式分類精度。
針對各類晶圓缺陷數(shù)據(jù)的不平衡特點(diǎn)和數(shù)據(jù)維度與角度的多樣性,本文提出了一種面向晶圓缺陷模式識別的分類方法。通過圖像預(yù)處理方法,將維度高且缺陷角度不統(tǒng)一的圖像數(shù)據(jù)轉(zhuǎn)化為低維度且與缺陷角度無關(guān)的數(shù)據(jù);設(shè)計(jì)了GAN網(wǎng)絡(luò)對預(yù)處理后的晶圓圖數(shù)據(jù)進(jìn)行缺陷模式分類,并利用WM-811K數(shù)據(jù)集進(jìn)行數(shù)值試驗(yàn)。
晶圓圖數(shù)據(jù)由下面的方式獲得:利用電學(xué)測試設(shè)備自動對晶圓片進(jìn)行探查和測試,檢測晶圓片上每一個(gè)晶粒的電學(xué)性能,再通過軟件利用正交坐標(biāo)系將失效與正常的晶粒標(biāo)出。每個(gè)晶圓圖數(shù)據(jù)在計(jì)算機(jī)內(nèi)都是一個(gè)由三種元素(0,1,2)構(gòu)成的二維圖像數(shù)組,其中,0表示空白點(diǎn),1表示通過電學(xué)測試的正常晶粒,2表示未通過電學(xué)測試的失效晶粒。晶圓圖缺陷模式識別問題本質(zhì)就是利用晶圓圖二維圖像數(shù)組內(nèi)3種元素(0,1,2)的分布規(guī)律來分辨晶圓的缺陷模式。晶圓圖的二維圖像矩陣見圖1,其中,位置靠上的圖表示晶圓圖的二維圖像矩陣,小橢圓劃出的區(qū)域由數(shù)字2集合組成,是該晶圓圖在缺陷模式識別時(shí)的主要缺陷區(qū)域,位置靠下的圖是二維圖像矩陣對應(yīng)的可視化表示。在晶圓圖缺陷模式的識別問題中,存在缺陷數(shù)據(jù)的維度多樣性、角度多樣性和數(shù)據(jù)集不平衡等特點(diǎn),具體特點(diǎn)如下。
圖1 晶圓圖的二維圖像矩陣Fig.1 Wafer map and the image matrix
(1)晶圓缺陷數(shù)據(jù)的維度多樣性。在晶圓的實(shí)際生產(chǎn)過程中,不同晶圓片中的晶粒大小和布局方式可能會有所不同,所以不同晶圓片所含晶粒的數(shù)量也會不同。二維晶圓圖像數(shù)組會因晶粒的數(shù)量不同導(dǎo)致其數(shù)據(jù)維度不同,在利用機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練分類時(shí),模型的輸入數(shù)據(jù)維度會因晶圓缺陷數(shù)據(jù)的維度多樣而無法確定,從而無法在同一機(jī)器學(xué)習(xí)模型中訓(xùn)練分類。
(2)晶圓缺陷數(shù)據(jù)的角度多樣性。由于晶圓生產(chǎn)中的某些工藝需要通過旋轉(zhuǎn)晶圓片來完成,故在最終形成的晶圓圖內(nèi),缺陷數(shù)據(jù)會呈現(xiàn)多角度的特點(diǎn)。例如,在晶圓生產(chǎn)的光刻階段,為了在晶圓表面得到均勻的膠膜覆蓋,常常采用旋轉(zhuǎn)涂膠的方法。但在旋轉(zhuǎn)涂膠的過程中,晶圓可能會因轉(zhuǎn)速和光刻膠黏度的不合適,導(dǎo)致晶圓的某些區(qū)域存在缺陷,且缺陷區(qū)域的角度不一致。對晶圓缺陷模式進(jìn)行識別時(shí),某些缺陷模式會由于存在缺陷數(shù)據(jù)角度多樣的特點(diǎn)而影響該模式的識別精度。3張Loc缺陷模式的晶圓圖見圖2,其主要缺陷區(qū)域位于晶圓圖的不同角度方向上。
圖2 缺陷數(shù)據(jù)角度不同的晶圓圖Fig.2 Wafer map with different angles
(3)晶圓缺陷數(shù)據(jù)集的不平衡性。在晶圓實(shí)際生產(chǎn)過程中,某些晶圓圖的缺陷模式會因?yàn)楸澈髮?yīng)的工藝或機(jī)器出現(xiàn)異常的次數(shù)較少,導(dǎo)致其樣本數(shù)量也較少,例如Scratch缺陷模式。Scratch缺陷模式通常是由機(jī)器故障產(chǎn)生的[11],且因機(jī)器出現(xiàn)故障的概率要遠(yuǎn)小于工藝出現(xiàn)異常的概率,所以其樣本數(shù)量與工藝出現(xiàn)異常導(dǎo)致的缺陷模式(如Edge-Ring缺陷模式)也相對較少。以本文實(shí)例中所用的數(shù)據(jù)為例,Edge-Ring與Edge-Loc缺陷類型的樣本要多于剩余缺陷類型樣本的總和,各類缺陷數(shù)據(jù)存在典型的不平衡特點(diǎn)。
針對晶圓圖的數(shù)據(jù)維度和角度的多樣性,本文設(shè)計(jì)了Radon變換與數(shù)據(jù)重采樣的兩階段晶圓缺陷數(shù)據(jù)預(yù)處理方法,以實(shí)現(xiàn)不同晶圓圖數(shù)據(jù)維度與角度的統(tǒng)一。
(1)階段一,晶圓圖像Radon變換。過晶圓圖中任意一點(diǎn)(x,y)的任意一條直線可表示為
xcosθ+ysinθ=ρ
(1)
式中,ρ為線與原點(diǎn)之間的距離;θ為直線與x軸所成的角度。
將ρ和θ看作定量,x和y看作變量,得到晶圓圖沿著ρ和θ為定值的一條直線上的投影(圖3):
(2)
其中,D是與數(shù)據(jù)維度為m×n的晶片圖相關(guān)的脈沖函數(shù);τ是與直線相關(guān)的脈沖函數(shù):
(3)
(4)
圖3 缺陷數(shù)據(jù)Radon變換過程Fig.3 The Radon transformation for wafer map
當(dāng)ρ和θ改變時(shí),一張晶圓圖的Radon變換就可用矩陣來表示:
(5)
經(jīng)過標(biāo)準(zhǔn)二維坐標(biāo)系向極坐標(biāo)系的轉(zhuǎn)換后,用晶圓圖向極坐標(biāo)系內(nèi)的每一條直線進(jìn)行投影變換,從而使圖像表達(dá)與晶圓圖角度無關(guān),以解決晶圓圖角度多樣性問題。
為了使不同晶圓圖的Radon變換數(shù)據(jù)F可比,對F進(jìn)行最大最小歸一化處理:
(6)
(2)階段二,Radon變換圖形的特征值提取與重采樣。為了提取Radon變換圖形的特征值,先計(jì)算F的行平均值Fm和行標(biāo)準(zhǔn)差Fv,得到兩個(gè)一維數(shù)組Fm和Fv;再通過三次插值法[12]對Fm和Fv進(jìn)行重采樣(采樣數(shù)為20),得到數(shù)據(jù)維度統(tǒng)一的晶圓圖Radon特征值Rm和Rv;最后將得到的Rm和Rv拼接組合,形成一個(gè)1×40的一維數(shù)組R:
R=[Rm,Rv]
(7)
圖4 插值采樣Fig.4 Interpolation sampling
經(jīng)過Radon變換與插值采樣之后,晶圓圖數(shù)據(jù)在數(shù)據(jù)維度和角度上得到了歸一化,可進(jìn)一步對預(yù)處理后的數(shù)據(jù)進(jìn)行分類,以實(shí)現(xiàn)晶圓缺陷模式的識別。
針對實(shí)際生產(chǎn)中晶圓圖數(shù)據(jù)集存在不平衡性的特點(diǎn),本文采用GAN模型的泛化模型分類生成式對抗網(wǎng)絡(luò)模型[13](categorical generative adversarial networks, CatGAN),通過模型內(nèi)兩個(gè)子神經(jīng)網(wǎng)絡(luò)(生成器G和鑒別器D)的相互對抗,使生成器G學(xué)習(xí)真實(shí)樣本的分布規(guī)律,生成大量的仿真數(shù)據(jù)來平衡晶圓圖數(shù)據(jù)集,從而解決晶圓圖數(shù)據(jù)集不平衡問題,同時(shí),網(wǎng)絡(luò)也會對晶圓圖進(jìn)行識別分類,提高晶圓缺陷模式中占比較小類別的識別精度。
2.2.1網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
面向晶圓圖缺陷模式識別的CatGAN的網(wǎng)絡(luò)結(jié)構(gòu)見圖5,它由一個(gè)生成器和一個(gè)鑒別器構(gòu)成。
圖5 CatGAN結(jié)構(gòu)Fig.5 CatGAN network structure
(1)生成器網(wǎng)絡(luò)結(jié)構(gòu)。生成器是一個(gè)由全連接層組成的神經(jīng)網(wǎng)絡(luò),一共3層,輸入由噪聲Z組成,輸出是仿真晶圓樣本,其具體結(jié)構(gòu)如下:
輸入層。輸入層的輸入向量Z=(z1,z2,…,zm),共設(shè)計(jì)了m=40個(gè)節(jié)點(diǎn),全由0到1的隨機(jī)噪聲產(chǎn)生。輸入層到隱含層之間采用softplus激活函數(shù),h1表示隱含層,w、b分別表示權(quán)重和閾值,有
softplus(x)=ln(1+ex)
(8)
h1=softplus(wZ+b)
(9)
隱含層。隱含層的節(jié)點(diǎn)數(shù)為20。隱含層到輸出層之間不使用激活函數(shù),o表示輸出層,有
o=wh1+b
(10)
輸出層。由于一個(gè)真實(shí)晶圓樣本是一個(gè)1×40的一維數(shù)組,故將輸出層節(jié)點(diǎn)數(shù)設(shè)為40。
(2)鑒別器網(wǎng)絡(luò)結(jié)構(gòu)。鑒別器是一個(gè)由全連接層組成的神經(jīng)網(wǎng)絡(luò),內(nèi)含3個(gè)隱含層,輸入由真實(shí)晶圓樣本和仿真晶圓樣本組成,輸出是樣本屬于各個(gè)缺陷模式的概率,其具體結(jié)構(gòu)如下:
輸入層。鑒別器的輸入由3部分樣本數(shù)據(jù)集組成,即未知缺陷模式的真實(shí)晶圓樣本、已知缺陷模式的真實(shí)晶圓樣本和生成器生成的仿真晶圓樣本。輸入層到隱含層之間采用tanh激活函數(shù),h1表示第一層隱含層,即
(11)
h1=tanh(w[X,XL,GZ]+b)
(12)
隱含層。鑒別器共有3個(gè)隱含層,每個(gè)隱含層都有20個(gè)節(jié)點(diǎn),為了加快網(wǎng)絡(luò)的收斂速度,隱含層之間均采用tanh激活函數(shù),hi表示第i層隱含層,有
hi=tanh(whi-1+b)
(13)
輸出層。輸出層最后輸出的是樣本屬于各個(gè)缺陷模式的概率,本文共有8種缺陷模式,所以輸出層的節(jié)點(diǎn)數(shù)為8,隱含層到輸出層之間采用softmax激活函數(shù),o表示輸出層,有
(14)
o=softmax(wh3+b)
(15)
2.2.2損失函數(shù)改進(jìn)
GAN網(wǎng)絡(luò)主要通過損失函數(shù)來實(shí)現(xiàn)兩個(gè)子神經(jīng)網(wǎng)絡(luò)的對抗,提高兩個(gè)子神經(jīng)網(wǎng)絡(luò)的功能(生成樣本和鑒別樣本),其損失函數(shù)為
Ex~G(z)ln1-DGz
(16)
但晶圓圖的缺陷模式識別是一個(gè)分類問題,為解決這一問題,有效的方法是對GAN網(wǎng)絡(luò)的損失函數(shù)進(jìn)行優(yōu)化,使得網(wǎng)絡(luò)可以在生成樣本的基礎(chǔ)上同時(shí)具備分類的能力。在確定網(wǎng)絡(luò)的損失函數(shù)時(shí),引入SPRINGENBERG[13]提出的CatGAN網(wǎng)絡(luò)相關(guān)理論。
CatGAN網(wǎng)絡(luò)的對抗細(xì)節(jié)與標(biāo)準(zhǔn)GAN網(wǎng)絡(luò)的對抗細(xì)節(jié)在鑒別器上有一個(gè)關(guān)鍵的不同點(diǎn):鑒別器D的目標(biāo)要求由鑒別出仿真晶圓樣本和真實(shí)晶圓樣本變?yōu)楦鶕?jù)樣本來源的不同(仿真晶圓樣本和真實(shí)晶圓樣本)輸出不同的概率分布。為了滿足上述要求的變化,可以用Shannon熵H來表示,其定義為樣本所攜帶的信息的期望值。在晶圓圖模式識別問題中,當(dāng)樣本來自于未知缺陷模式的真實(shí)晶圓X時(shí),要求鑒別器輸出的概率指向某個(gè)缺陷模式(即屬于某個(gè)缺陷模式的概率很大),即要求確定樣本的缺陷模式(要求Hpy|x,D值減小);當(dāng)樣本來自生成器的仿真晶圓G(z)時(shí),則要求鑒別器輸出的概率不指向缺陷模式(即屬于所有缺陷模式的概率很平均),即不要求確定樣本的缺陷模式可以模糊樣本的缺陷模式(要求Hpy|G(z),D值增大)。則可以定義未知缺陷模式的真實(shí)晶圓樣本X和仿真晶圓G(z)樣本的熵:
Ex~XHPy|x,D=
(17)
Ex~G(z)HPy|G(z),D=
(18)
其中,N表示數(shù)據(jù)集中有N個(gè)數(shù)據(jù)樣本,K表示已知晶圓圖有K個(gè)缺陷模式,Py=k|x,D是指通過softmox激活函數(shù)得到的屬于各個(gè)缺陷模式的概率。
為了讓鑒別器學(xué)習(xí)真實(shí)晶圓樣本XL的缺陷模式分布規(guī)律,可以使用交叉熵(cross entropy,CE)來實(shí)現(xiàn);為了讓生成器在各個(gè)缺陷模式上生成數(shù)量相同的樣本來平衡數(shù)據(jù)集,可以使用邊際熵(marginal entropy)來實(shí)現(xiàn):
k|xi,D))+(1-yi)ln(1-P(y=k|xi,D))
(19)
(20)
根據(jù)上述分析,鑒別器的損失函數(shù)可由式(17)~式(19)得到,它們分別表示確定未知缺陷模式的真實(shí)晶圓樣本的缺陷模式、模糊仿真晶圓樣本的缺陷模式、學(xué)習(xí)已知缺陷模式的真實(shí)晶圓樣本缺陷規(guī)律。生成器的損失函數(shù)由式(18)、式(20)得到,分別表示確定仿真晶圓樣本的缺陷模式,各缺陷模式的仿真晶圓樣本數(shù)量相等。具體損失函數(shù)如下:
Ex~G(z)HP(y|G(z),D)+
μE(x,y)~XL[CEy,P(y|x,D)]
(21)
HGP(y|D)
(22)
式中,μ為加權(quán)成本。
基于CatGAN的晶圓圖缺陷模式識別方法流程見圖6。首先在晶圓圖數(shù)據(jù)集中分離出已知缺陷模式的晶圓圖和未知缺陷模式的晶圓圖,然后對兩部分晶圓圖均進(jìn)行兩階段的預(yù)處理方法,得到的每個(gè)晶圓數(shù)據(jù)都是1×40的一維數(shù)組。再將已知和未知缺陷模式的真實(shí)晶圓樣本及生成器生成的仿真晶圓樣本分別作為輸入進(jìn)入鑒別器,經(jīng)過計(jì)算后得到鑒別器和生成器的誤差損失LD、LG,通過梯度下降的方式對兩個(gè)網(wǎng)絡(luò)進(jìn)行更新,為了防止生成器過擬合后總是生成同一種缺陷模式的樣本,通常采用訓(xùn)練一次生成器后訓(xùn)練多次鑒別器的方法。最終通過在兩個(gè)神經(jīng)網(wǎng)絡(luò)之間的對抗,生成器將提高生成仿真晶圓樣本的能力,可以生成高度仿真的樣本來平衡數(shù)據(jù)集,鑒別器將利用生成的仿真晶圓樣本學(xué)習(xí)其數(shù)據(jù)規(guī)律,提高缺陷模式中占比較小類別的識別精度。
圖6 晶圓圖缺陷模式識別方法流程Fig.6 Wafer pattern defect pattern recognition method flow
為了對上述方法進(jìn)行試驗(yàn)與分析,本文采用半導(dǎo)體制造工業(yè)實(shí)際晶圓圖像數(shù)據(jù)(WM-811K數(shù)據(jù)),先對CatGAN內(nèi)的關(guān)鍵參數(shù)進(jìn)行正交試驗(yàn),再利用CatGAN對晶圓圖數(shù)據(jù)進(jìn)行缺陷模式識別,同時(shí)采用支持向量機(jī)SVM和Adaboost算法進(jìn)行對比試驗(yàn)。試驗(yàn)中,使用Python 2.7和Tensorflow 1.0搭建模型,并在GPU為Nvidia GTX1080TI的Linux平臺上訓(xùn)練。
本文采用的數(shù)據(jù)為半導(dǎo)體制造工業(yè)實(shí)際晶圓圖像數(shù)據(jù)(WM-811K數(shù)據(jù))。從數(shù)據(jù)集中分別隨機(jī)選取了3 000、2 000、1 000個(gè)缺陷晶圓圖組成甲、乙、丙3個(gè)不同規(guī)模的數(shù)據(jù)集,這些缺陷晶圓圖包含了全部8種缺陷模式(Loc、Edge-loc、Center、Donut、Edge-ring、Scratch、Random、Near-full)
采用上述2000個(gè)缺陷晶圓圖組成的乙數(shù)據(jù)集作為源數(shù)據(jù),通過正交試驗(yàn)對CatGAN中的學(xué)習(xí)率、鑒別器損失函數(shù)中的加權(quán)成本μ、生成器與鑒別器的相對訓(xùn)練次數(shù)(在GAN網(wǎng)絡(luò)中,為了防止生成器的過擬合,通常采用訓(xùn)練一次生成器后訓(xùn)練多次鑒別器的方法)、已知缺陷模式的晶圓樣本比例(CatGAN是一個(gè)半監(jiān)督分類網(wǎng)絡(luò),已知缺陷模式的晶圓樣本和未知缺陷模式的晶圓樣本進(jìn)入網(wǎng)絡(luò)訓(xùn)練的比例與最終的分類精度相關(guān),后面統(tǒng)一用訓(xùn)練集比例表示)進(jìn)行最優(yōu)選擇。對學(xué)習(xí)率為(A1=0.15,A2=0.1,A3=0.05),加權(quán)成本μ為(B1=0.1,B2=0.07,B3=0.04),相對訓(xùn)練次數(shù)為(C1=5,C2=10,C3=15),訓(xùn)練集比例為(D1=0.6,D2=0.7,D3=0.8)等多種情況下進(jìn)行正交測試。
表1 正交試驗(yàn)結(jié)果
為了直觀顯示測試結(jié)果,將數(shù)據(jù)經(jīng)過處理之后以圖的形式表示,見圖7。
圖7 正交試驗(yàn)結(jié)果Fig.7 Orthogonal experimental results
由參數(shù)測試結(jié)果發(fā)現(xiàn),學(xué)習(xí)率為0.15,加權(quán)成本為0.07,相對訓(xùn)練次數(shù)為10,訓(xùn)練集比例為0.7時(shí),CatGAN的分類效果較好。
通過對參數(shù)優(yōu)化試驗(yàn)的結(jié)果分析,采用學(xué)習(xí)率為0.15、加權(quán)成本為0.07、相對訓(xùn)練次數(shù)為10、訓(xùn)練集比例為0.7,分別在3個(gè)不同規(guī)模的晶圓圖數(shù)據(jù)集中進(jìn)行分類試驗(yàn),得到其在整體和各個(gè)缺陷模式上的分類正確率。試驗(yàn)結(jié)果見表2。
從整體上看,甲乙丙三個(gè)數(shù)據(jù)集均得到了較高的分類正確率,說明本方法適用于不同規(guī)模的晶圓圖數(shù)據(jù)集,其中,乙數(shù)據(jù)集中,分類精度達(dá)到94.33%;在樣本量最少的丙數(shù)據(jù)集中分類結(jié)果稍差,但也達(dá)到89.67%。從各缺陷模式的分類正確率來看,只有在丙數(shù)據(jù)集中效果稍差,但絕大多數(shù)的缺陷模式達(dá)到80%以上,Random和Near-full兩種缺陷模式因樣本少,即使在測試樣本只錯兩個(gè)的情況下正確率也很低。
為了進(jìn)一步驗(yàn)證CatGAN的分類效果,本文采用SVM和在不平衡分類問題上的基本算法Adaboost算法在乙數(shù)據(jù)集中進(jìn)行對比試驗(yàn)。其中,SVM選擇高斯核,Addaboost算法選擇決策樹作為弱分類器,其結(jié)果見圖8。
圖8 對比試驗(yàn)結(jié)果Fig.8 Compare experimental results
圖8中,橫坐標(biāo)分別為總體及晶圓圖的8種缺陷模式,縱坐標(biāo)為分類的正確率,三條不同的折線分別表示三種算法的分類正確率。從試驗(yàn)結(jié)果可以看出,總體分類精度上,CatCAN的分類效果均優(yōu)于其他分類器,SVM和Adaboost雖然可以對晶圓進(jìn)行分類,但精度不高;從各缺陷模式的分類精度來看,SVM完全沒有對4種樣本比例少的缺陷模式的分類能力, CatGAN對各種缺陷模式的分類效果均比Adaboost好,證明了CatGAN通過生成學(xué)習(xí)的方式可以提升網(wǎng)絡(luò)對比例少的缺陷模式的識別精度。
表2 CatGAN分類試驗(yàn)結(jié)果
本文提出了一種基于分類生成式對抗網(wǎng)絡(luò)模型的方法,可用于晶圓圖不平衡數(shù)據(jù)集缺陷模式識別問題。通過分類生成式對抗網(wǎng)絡(luò)內(nèi)部兩個(gè)子神經(jīng)網(wǎng)絡(luò)的相互對抗,使得兩個(gè)子神經(jīng)網(wǎng)絡(luò)的功能(生成和鑒別)均得到了提高,尤其是生成器會生成一些仿真樣本來彌補(bǔ)神經(jīng)網(wǎng)絡(luò)對樣本比例少的類別識別結(jié)果較差的缺陷。在WM-811k數(shù)據(jù)的試驗(yàn)結(jié)果中,本文方法在隨機(jī)抽取的3個(gè)不同規(guī)模的數(shù)據(jù)集中的整體識別率均高于89.67%,在各個(gè)缺陷模式的識別率絕大多數(shù)也高于80%,充分證明了本方法的有效性。結(jié)果表明,本文方法在晶圓缺陷模式識別問題上對總體和各缺陷模式均有較高的識別精度。