胡佳美 吳錫生
(江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院,無(wú)錫,214122)
半導(dǎo)體電子器件在家電、電表、照明、安防和充電樁等多個(gè)領(lǐng)域都有著廣泛的應(yīng)用,對(duì)元器件封裝起著安裝、固定、密封和保護(hù)元器件電氣性能等方面的作用。電子元器件封裝體若出現(xiàn)缺陷,將影響到元器件的性能,因此在生產(chǎn)過(guò)程中對(duì)其封裝體進(jìn)行缺陷檢測(cè)就變得十分必要。表面貼裝工程(Surface mount assembly,SMA)是封裝技術(shù)中的一種,相比其他封裝技術(shù)有高密度、低成本、小體積和生產(chǎn)自動(dòng)化等特點(diǎn),研究SMA封裝元器件的缺陷檢測(cè)方法,是生產(chǎn)高質(zhì)量元器件產(chǎn)品的迫切需要。隨著計(jì)算機(jī)技術(shù)和圖像識(shí)別技術(shù)的發(fā)展,機(jī)器視覺(jué)被應(yīng)用于封裝技術(shù)缺陷檢測(cè)中,這不僅可以降低勞動(dòng)力強(qiáng)度,還能排除主觀因素的干擾,提高檢測(cè)精度。
傳統(tǒng)機(jī)器視覺(jué)的缺陷檢測(cè)手段,主要是通過(guò)對(duì)檢測(cè)目標(biāo)進(jìn)行分割,然后通過(guò)人工進(jìn)行缺陷特征的選取和描述,最后通過(guò)數(shù)字圖像處理(二值化、邊緣檢測(cè)和模板匹配等)的方法對(duì)圖像進(jìn)行檢測(cè)。如Wang等[1]提出了一種多圖像減法檢測(cè)發(fā)光二極管屏像素缺陷的方法。董先飛等[2]通過(guò)邊緣檢測(cè)算法提取塑封邊緣,結(jié)合差影法和模板匹配法檢測(cè)表面質(zhì)量缺陷。以上數(shù)字圖像處理方法的效果,往往依賴于研究人員長(zhǎng)期積累的經(jīng)驗(yàn),模板匹配法還受限于所選取的模板圖片,泛化性能較低。隨后,人工神經(jīng)網(wǎng)絡(luò)開始廣泛運(yùn)用到缺陷檢測(cè)中。如沈凌云等[3]提出主成分分析法(Principal component analysis,PCA)和徑向基神經(jīng)網(wǎng)絡(luò)相結(jié)合電池缺陷檢測(cè)方法。高向東等[4]提出了主成分分析-誤差反向傳播神經(jīng)網(wǎng)絡(luò)(PCA-back propagation,PCA-BP)分類模型識(shí)別焊件表面缺陷的方法。熊忠陽(yáng)等[5]提出將粒子群優(yōu)化算法和BP神經(jīng)網(wǎng)絡(luò)結(jié)合并應(yīng)用在變壓器故障檢測(cè)中。周宣汝[6]提出一種基于HOG特征和支持向量機(jī)(Support vector machine,SVM)的交通信號(hào)燈實(shí)時(shí)識(shí)別算法。SVM和人工神經(jīng)網(wǎng)絡(luò)等方法相對(duì)于傳統(tǒng)圖像處理方法有一定的自適應(yīng)性,但仍需要依賴大量先驗(yàn)知識(shí),人工干預(yù)多,當(dāng)檢測(cè)目標(biāo)改變或者檢測(cè)內(nèi)容復(fù)雜度提高時(shí),將會(huì)面臨更大挑戰(zhàn),而且使用PCA對(duì)圖像進(jìn)行提取會(huì)破壞圖像的二維結(jié)構(gòu)而導(dǎo)致精度下降。近年來(lái),隨著大數(shù)據(jù)和云計(jì)算的發(fā)展,深度學(xué)習(xí)成為人們研究的熱點(diǎn),開始被嘗試應(yīng)用于各個(gè)行業(yè)。如Allam等[7]采用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN)和前饋神經(jīng)網(wǎng)絡(luò)相結(jié)合建立糖尿病患者葡萄糖調(diào)節(jié)預(yù)測(cè)控制模型。文獻(xiàn)[8]運(yùn)用深度置信網(wǎng)絡(luò)(Deep belief network,DBN)對(duì)渦輪風(fēng)扇發(fā)動(dòng)機(jī)引擎組件進(jìn)行故障診斷。這些深度學(xué)習(xí)算法雖取得了不錯(cuò)的識(shí)別效果,但網(wǎng)絡(luò)的泛化性能較低,也不能滿足缺陷多樣的二極管表面缺陷的檢測(cè)精度。
為此本文提出將雙向二維主成分分析法(Bilateral two-dimensional principal component analysis,Bi-2DPCA)和改進(jìn)的AlexNet網(wǎng)絡(luò)相結(jié)合的二極管表面SMA封裝缺陷識(shí)別方法。先用Bi-2DPCA提取的主要特征作為網(wǎng)絡(luò)的輸入,然后使用正態(tài)隨機(jī)池化(Normal-Stochastic Pooling)對(duì)卷積產(chǎn)生的特征數(shù)據(jù)進(jìn)行下采樣操作,最后在全連接層引入DropConnect來(lái)提高泛化性能,實(shí)驗(yàn)結(jié)果表明改進(jìn)模型能很好地提高產(chǎn)品缺陷的識(shí)別率,并有較好的泛化性能。
二維主成分分析法(Two-dimensional principal component analysis,2DPCA)是 Yang等[9]提出來(lái)的一種直接圖像投影技術(shù)。相比與PCA算法,2DPCA不需要將圖像矩陣展開成一維向量,圖像的協(xié)方差矩陣可以通過(guò)二維圖像矩陣直接構(gòu)造出來(lái),從而保留圖像的二維信息。假設(shè)樣本集中有N個(gè)m×n的圖像S={S1,S2,S3,…,SN},X為n維列向量,
通過(guò)式(1)將S投影到X上得到投影向量Y,2DPCA最終目的為求得一組坐標(biāo)軸使得投影樣本的全局散度最大,即使得J(X)最大為
式中:GX表示訓(xùn)練樣本圖像的散度矩陣,tr(GX)為散度矩陣GX的跡。所以有
式中:G=E[(S-ES)T(S-ES)]=表示第i類中第j個(gè)圖像矩陣表示第Ti類樣本的平均樣本。獲取J(X)極大值的前d(d<n)個(gè)最大特征值λι,可以用累計(jì)特征貢獻(xiàn)率式(4)循環(huán)求解獲得。
式中:λ1≥λ2≥…≥λn是G的n個(gè)特征值,α表示特征累計(jì)貢獻(xiàn)率,d表示前d個(gè)最大特征值對(duì)應(yīng)的特征矩陣記為X=(X1,X2,…,Xd)。
2DPCA中的變換只提取了數(shù)據(jù)矩陣行內(nèi)的特征,而Bi-2D PCA算法則在2DPCA算法基礎(chǔ)上增加對(duì)列內(nèi)進(jìn)行特征變換,以此達(dá)到對(duì)二維圖像在兩個(gè)維度上同時(shí)對(duì)圖像長(zhǎng)寬進(jìn)行壓縮和特征提取的目的。對(duì)列特征變換過(guò)程與2DPCA類似,對(duì)應(yīng)的對(duì)式(1)中的Y進(jìn)行行內(nèi)2DPCA變換,得到一組基Z,則圖像進(jìn)行Bi-2DPCA變換可表示為
式中:R表示經(jīng)過(guò)行列雙向投影的特征矩陣。列變換中投影維度數(shù)由式(4)同理求出。
正態(tài)分布又叫高斯分布,對(duì)于隨機(jī)變量X,其概率密度函數(shù)滿足式(6),其中μ表示數(shù)學(xué)期望,σ2表示方差。隨機(jī)變量的信息熵指隨機(jī)變量不確定的程度,在數(shù)學(xué)期望和方差一定的條件下,高斯分布隨機(jī)變量具有最大信息熵[10]。
AlexNet模型[11]是Krizhevsky和Hinton小組在ISVRC2012大賽中使用的卷積神經(jīng)網(wǎng)絡(luò)[12]模型,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,它不需要人工提取圖像特征。AlexNet模型一共包含5個(gè)卷積層和3個(gè)全連接層。其中,每個(gè)卷積層后都緊接著將卷積得到的特征矩輸入到激活函數(shù)Relu中,第1層和第2層卷積層中對(duì)從激活函數(shù)輸出的特征進(jìn)行局部響應(yīng)歸一化(Local response normalization,LRN)處理,在第1層、第2層和第5層卷積層中對(duì)特征矩陣做下采樣處理,第1層和第2層全連接層中采用Dropout,本文訓(xùn)練樣本與原AlexNet訓(xùn)練樣本的維度有所不同,根據(jù)實(shí)驗(yàn)效果,對(duì)網(wǎng)絡(luò)模型配置同比修改,修改后的AlexNet網(wǎng)絡(luò)模型配置如圖1所示。
AlexNet網(wǎng)絡(luò)模型中使用了LRN,即圖1中的Norm層,LRN是受生物學(xué)上活躍的神經(jīng)元對(duì)周邊神經(jīng)元的側(cè)抑制現(xiàn)象的啟發(fā),對(duì)局部神經(jīng)元的活動(dòng)創(chuàng)建競(jìng)爭(zhēng)機(jī)制,使得其中響應(yīng)比較大的值變得相對(duì)更大,并抑制其他反饋較小的神經(jīng)元,從而增強(qiáng)模型的泛化能力,其計(jì)算為
圖1 修改后的AlexNet模型配置Fig.1 Modified AlexNet model configuration
池化層(Pooling Layer)的存在主要是為了降低特征的維度并保留主要信息,一定程度上避免過(guò)擬合,保持模型旋轉(zhuǎn)、平移和伸縮不變形。池化過(guò)程也稱為下采樣,跟卷積過(guò)程有點(diǎn)類似,用一個(gè)采樣核在輸入的特征矩上從左上角開始滑動(dòng),運(yùn)用某種規(guī)則在采樣核范圍內(nèi)求超參數(shù),然后將結(jié)果輸入到網(wǎng)絡(luò)的下一層,整個(gè)采樣過(guò)程不涉及到參數(shù)的訓(xùn)練。常用的池化方法有均值池化(Mean pooling)和最大值池化(Max pooling)。
二極管塑封表面缺陷形態(tài)具有多樣性和不可預(yù)測(cè)性,本文算法除了提高缺陷識(shí)別精度外,還著重提高檢測(cè)模型的泛化性能。一般來(lái)說(shuō),模型在測(cè)試集上的測(cè)試精度越接近訓(xùn)練集上的精度,就認(rèn)為該模型具有比較好的泛化性。本文算法首先由訓(xùn)練樣本生成虛擬樣本,再將生成的樣本用Bi-2DPCA算法對(duì)做降維處理,然后輸入到改進(jìn)的AlexNet模型中進(jìn)行訓(xùn)練,建立缺陷識(shí)別模型,測(cè)試集先通過(guò)降維變換矩陣進(jìn)行降維再輸入模型進(jìn)行缺陷識(shí)別分類,輸出識(shí)別結(jié)果,流程如圖2所示。
圖2 算法流程Fig.2 Algorithm flow
訓(xùn)練樣本分布不均衡或者訓(xùn)練集方差小容易使訓(xùn)練出來(lái)的卷積神經(jīng)網(wǎng)絡(luò)模型欠擬合或者過(guò)擬合,從而導(dǎo)致模型在測(cè)試集甚至是在訓(xùn)練集上識(shí)別效果欠佳。本文收集到的無(wú)材料圖像尤為不足,為了克服樣本分布不均衡的問(wèn)題,本文算法在所收集圖像基礎(chǔ)上進(jìn)行水平和垂直反射變換、灰度變換操作等生成虛擬樣本。數(shù)據(jù)樣本擴(kuò)充處理如圖3所示,其中a組是二極管SMA封裝體良品圖像,b組是槽體中無(wú)材料圖像,c組是材料崩角的缺陷圖像,d組是表面印字不清缺陷圖像,每組圖的第1張為原圖,后面3張分別是由水平反射變換、垂直反射變換和灰度變換處理而來(lái)。生產(chǎn)過(guò)程中可能會(huì)遇到材料槽中無(wú)材料的情況,這種情況下需要識(shí)別出來(lái)作特殊處理,所以將沒(méi)有材料的情況也當(dāng)作一類缺陷進(jìn)行識(shí)別。
圖3 樣本數(shù)據(jù)圖像擴(kuò)充Fig.3 Image expansion of sample data
對(duì)輸入數(shù)據(jù)的特征提取是AlexNet模型進(jìn)行識(shí)別的關(guān)鍵,也是難點(diǎn)部分。本文使用圖像的規(guī)格為256×128,維度為 32768,若直接從原圖像進(jìn)行特征提取維度會(huì)很高,使得整個(gè)網(wǎng)絡(luò)的計(jì)算復(fù)雜度高,冗余的特征也會(huì)帶來(lái)一些噪聲,降低網(wǎng)絡(luò)識(shí)別性能,因而考慮在正式訓(xùn)練網(wǎng)絡(luò)前,對(duì)數(shù)據(jù)樣本先進(jìn)行降維操作。使用PCA降維步驟:(1)每張訓(xùn)練圖像Si轉(zhuǎn)化為一維列向量列向量組成矩陣;(2)計(jì)算矩陣協(xié)方差矩陣,求其特征值和特征向量;(3)根據(jù)所給的特征貢獻(xiàn)占比確定特征維度,組成特征轉(zhuǎn)換矩陣;(4)用特征轉(zhuǎn)換矩陣對(duì)圖像進(jìn)行重構(gòu),最后將重構(gòu)圖像輸入AlexNet網(wǎng)絡(luò)。由于使用PCA將圖像展開成一維,破壞了圖像二維結(jié)構(gòu),影響圖像特征表征能力,且針對(duì)所有樣本組成的龐大的協(xié)方差矩陣求特征值和特征矩陣計(jì)算量大、耗時(shí),所以本文使用Bi2DPCA進(jìn)行降維,Bi2DPCA進(jìn)行降維步驟:(1)每張訓(xùn)練圖像Si根據(jù)式(3)求出行方向協(xié)方差矩陣;(2)求出特征值、特征向量,根據(jù)式(4)迭代求出維度數(shù),重構(gòu)圖像;(3)將重構(gòu)后圖像根據(jù)式(5)求出列方向協(xié)方差矩陣;(4)求出特征轉(zhuǎn)換矩陣重構(gòu)出圖像輸入AlexNet網(wǎng)絡(luò)進(jìn)一步提取特征。
針對(duì)原AlexNet網(wǎng)絡(luò)模型中使用最大值池化(Max pooling)只能保留最強(qiáng)信號(hào)易忽略有效特征的不足,提出正態(tài)隨機(jī)池化(Normal-stochastic pooling)。正態(tài)分布是隨機(jī)分布中信息熵最大的分布,將原隨機(jī)下采樣中的均勻分布概率采樣改進(jìn)為正態(tài)分布概率采樣,這樣可以表示一種多模態(tài)激活,除了讓最大值的激活元素被取到外,同時(shí)也有可能取到其他某些非最大激活,這樣可以增強(qiáng)原隨機(jī)采樣的信息熵,提高其隨機(jī)性,從而增強(qiáng)模型適應(yīng)性。而原Max-Pooling只能捕捉到網(wǎng)絡(luò)中最強(qiáng)的激活,所以其泛化性能相對(duì)較弱。本文算法具體做法是設(shè)池化窗口大小為3×3,在池化窗口內(nèi)將上一層的特征Map內(nèi)每個(gè)元素值除以和,得到每個(gè)元素占比,再通過(guò)正態(tài)分布產(chǎn)生權(quán)值系數(shù),與每個(gè)元素的占比相乘,得到一個(gè)新的取值概率,其計(jì)算如式(8)所示,示意如圖4所示。
式中:Pij表示取采樣區(qū)域元素的概率;Vij表示采樣區(qū)域元素值;sij表示正態(tài)分布隨機(jī)系數(shù);m,n代表采樣區(qū)域的行和列。
在AlexNet模型的全連接層部分,其前兩層中加入Dropout操作,如圖 5(a)所示,Dropout通過(guò)隨機(jī)丟棄某些神經(jīng)元節(jié)點(diǎn),使對(duì)應(yīng)的神經(jīng)元失效停止工作,當(dāng)網(wǎng)絡(luò)進(jìn)行反向傳播更新權(quán)值時(shí),就不再更新與該節(jié)點(diǎn)相連的權(quán)值。圖5中V1,V2,V3,V4代表連接層輸入,m(.)代表一個(gè)由0和1一定概率的行向量。
圖4 正態(tài)隨機(jī)池化過(guò)程Fig.4 Normal-stochastic pooling process
圖5 Dropout與 Dropconnect處理Fig.5 Dropout and Dropconnect process
本文在AlexNet的全連接層中使用Dropconnect[13]來(lái)對(duì)特征進(jìn)行稀疏化。Dropconnect和Dropout都是對(duì)全連接層進(jìn)行稀疏化,但與Dropout不同的是,Dropconnect不是隨機(jī)將激活函數(shù)節(jié)點(diǎn)的輸出設(shè)為0,而是將節(jié)點(diǎn)中每個(gè)與其相連的輸入權(quán)值以1-p的概率置為0,如圖5(b)所示,計(jì)算公式為
式中:v為n×1維的連接層輸入;W為d×n維的權(quán)重矩陣;M為1×d的行向量;a(x)為激勵(lì)函數(shù),*表示對(duì)應(yīng)元素相乘。從圖5(a)可以看出,Dropout每斷開一個(gè)節(jié)點(diǎn),就意味著把與該節(jié)點(diǎn)相連的所有輸入權(quán)值全部影響價(jià)值都舍棄。這樣做雖然在一定程度上對(duì)特征進(jìn)行了稀疏,但是由于網(wǎng)絡(luò)輸入前已經(jīng)作了Bi2DPCA主成分提取,輸入網(wǎng)絡(luò)的特征都是比較關(guān)鍵的特征,因而采用Dropout容易使得某一些關(guān)鍵特征被整個(gè)舍棄,導(dǎo)致識(shí)別效果不佳。而Dropconnect則是在權(quán)值層進(jìn)行稀疏,不會(huì)使某個(gè)特征的權(quán)值整個(gè)都取零,這樣既能夠保留所有的主要特征,又能對(duì)每個(gè)特征進(jìn)行稀疏,從而能夠在提高識(shí)別率的同時(shí)有較好的泛化性。
實(shí)驗(yàn)在Window10操作系統(tǒng)(Intel i5-7600 CPU、8 GB內(nèi)存)上運(yùn)行,基于Pycharm平臺(tái)使用Python3.6語(yǔ)言,在谷歌的TensorFlow1.7.0框架下對(duì)二極管封裝體表面缺陷進(jìn)行識(shí)別分類。
實(shí)驗(yàn)所使用的數(shù)據(jù)集是從揚(yáng)州某科技股份有限公司生產(chǎn)線上得到的二極管SMA圖片。相機(jī)是日本Sentech公司型號(hào)為STC-MB232PCL的CCD工業(yè)相機(jī),TAMROM的1A1HB鏡頭,光源使用SAKAZUME的LED光源。CCD工業(yè)相機(jī)快門時(shí)間非常短,圖像畸變小、靈敏度高且噪聲低,而且其輸出的是裸數(shù)據(jù),比較適合進(jìn)行高質(zhì)量的圖像處理算法,如機(jī)器學(xué)習(xí)等。實(shí)驗(yàn)將樣本數(shù)據(jù)分為良品、缺陷品和無(wú)材料3種進(jìn)行識(shí)別。經(jīng)數(shù)據(jù)擴(kuò)充后,共有10128張良品數(shù)據(jù)、2000張缺陷數(shù)據(jù)和550張無(wú)材料數(shù)據(jù),在3類數(shù)據(jù)中隨機(jī)各取30%作為測(cè)試集,10%作為驗(yàn)證集,剩余樣本參與模型訓(xùn)練,相同的實(shí)驗(yàn)做10次,并將實(shí)驗(yàn)精度在各迭代周期上取平均值作為最終結(jié)果,以此避免偶然因素的影響,更好地展現(xiàn)實(shí)驗(yàn)結(jié)果的普遍性。另外,為了檢測(cè)本文算法的泛化性能,實(shí)驗(yàn)在Mnist數(shù)據(jù)集和Cifar10數(shù)據(jù)集上作識(shí)別對(duì)比。Mnist數(shù)據(jù)集和Cifar10數(shù)據(jù)集部分樣本圖像如圖6所示。
本文算法主要分為4個(gè)步驟:建立數(shù)據(jù)集、構(gòu)建網(wǎng)絡(luò)模型、訓(xùn)練模型參數(shù)和測(cè)試數(shù)據(jù)。實(shí)驗(yàn)分別對(duì)訓(xùn)練集和測(cè)試集數(shù)據(jù)進(jìn)行主成分提取,然后用訓(xùn)練集訓(xùn)練模型,將訓(xùn)練好的模型對(duì)測(cè)試集進(jìn)行測(cè)試。經(jīng)過(guò)多次試驗(yàn)調(diào)整參數(shù),為提高收斂速度,最終確定模型所涉及到的超參數(shù)如表1所示。
圖6 實(shí)驗(yàn)所用數(shù)據(jù)集Fig.6 Data set of experiment
表1 實(shí)驗(yàn)超參數(shù)Tab.1 Experimental super parameters
為了尋找最佳迭代次數(shù),實(shí)驗(yàn)每迭代200次就測(cè)試識(shí)別精度,結(jié)果如圖7所示,從圖7中可以看出,迭代到3800次左右模型基本收斂。
圖7 迭代次數(shù)與精度關(guān)系Fig.7 Relation between iteration number and accuracy
為了考察特征維度與識(shí)別精度的關(guān)系,找到最佳特征維度,實(shí)驗(yàn)先對(duì)圖像列方向進(jìn)行2DPCA特征維度改變與識(shí)別率關(guān)系,確定行方向最佳特征維度后,再對(duì)圖像列方向上改變特征投影維度,考察模型的識(shí)別效果,實(shí)驗(yàn)結(jié)果如表2所示。
從表2的行方向識(shí)別率可以看出,當(dāng)僅在行方向做2DPCA時(shí),特征維度較少時(shí),識(shí)別率隨著維度增加提高的速度較快,但維度增加到35后,識(shí)別率變化很小,所以實(shí)驗(yàn)確定行方向上投影維度為35。再在列方向上作2DPCA(即Bi-2DPCA)改變列方向上維度,從表2列方向識(shí)別率可以看出列特征維度較少時(shí),識(shí)別率同樣隨著維度增加提高較快,但列維度較低時(shí),模型作Bi-2DPCA降維處理的識(shí)別率低于只對(duì)樣本作行方向2DPCA處理的識(shí)別率,當(dāng)維度數(shù)為45時(shí),識(shí)別率基本保持穩(wěn)定。綜上所述,行方向上投影維度數(shù)為35,列方向上投影維度數(shù)45左右最為合適。
本文算法與其他相關(guān)算法在擴(kuò)充后的數(shù)據(jù)集上實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)如表3所示。從表3中可以看到,本文算法識(shí)別精度最高,在3個(gè)深度神經(jīng)網(wǎng)絡(luò)中,訓(xùn)練時(shí)間5.4 h相對(duì)來(lái)說(shuō)時(shí)間較短,由于本文算法對(duì)AlexNet模型在池化層和全連接層進(jìn)行稀疏化改進(jìn),所以本文算法在收斂速度上慢于Bi-2DPCA+AlexNet算法。但測(cè)試時(shí)間是4個(gè)算法中最短的,SVM的訓(xùn)練時(shí)間明顯少于其他3個(gè)深度神經(jīng)網(wǎng)絡(luò),但是測(cè)試時(shí)間比其他算法要長(zhǎng)??紤]到在生產(chǎn)線上進(jìn)行實(shí)時(shí)檢測(cè)對(duì)算法的測(cè)試時(shí)間要求較高,而訓(xùn)練時(shí)間要求并不是太苛刻,因此,從實(shí)用性角度來(lái)看,本文算法更加適合二極管塑封表面流水線的質(zhì)量檢測(cè)。
表2 特征空間維度與識(shí)別率關(guān)系Tab.2 Relation between characteristic dimension and precision
表3 本文算法與其他算法對(duì)比Tab.3 Comparisons between the proposed algorithm and other algorithms
為了驗(yàn)證本文算法在泛化性能上較原算法有所提升,實(shí)驗(yàn)使用PCA+AlexNet算法、2DPCA+AlexNet算法和本文所提算法應(yīng)用在Mnist手寫數(shù)據(jù)集以及Cifar10數(shù)據(jù)集上進(jìn)行識(shí)別實(shí)驗(yàn),并通過(guò)算法在測(cè)試集與訓(xùn)練集上的錯(cuò)誤率的差值即方差來(lái)對(duì)上述3種算法的泛化性能進(jìn)行對(duì)比。從圖8中可以看出,在Mnist數(shù)據(jù)集上,2DPCA+AlexNet算法的方差最小,即在測(cè)試集上的識(shí)別率最接近訓(xùn)練集,本文算法在Mnist數(shù)據(jù)集方差略高,泛化性能比2DPCA+AlexNet算法稍差一點(diǎn)。圖9是在Cifar10數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,結(jié)果顯示本文算法方差為0.81%,在3個(gè)算法中最低。從上述實(shí)驗(yàn)結(jié)果分析,可能是因?yàn)镸nist數(shù)據(jù)每張圖片是簡(jiǎn)單的黑白二值化圖像,進(jìn)行過(guò)度的降維特征提取,會(huì)導(dǎo)致有用的特征丟失影響識(shí)別結(jié)果,模型不需要有太強(qiáng)的泛化性就可以達(dá)到比較好的識(shí)別效果。相比之下,Cifar10中的圖像場(chǎng)景更加復(fù)雜,所以泛化性強(qiáng)的模型在Cifar10測(cè)試集上的優(yōu)勢(shì)更能顯現(xiàn)。
圖8 Mnist數(shù)據(jù)集泛化性能對(duì)比Fig.8 Generalization performance comparison of Mnist data set
圖9 Cifar10數(shù)據(jù)集泛化性能對(duì)比Fig.9 Generalization performance comparison of Cifar10 data set
最后,將上述3種方法應(yīng)用在擴(kuò)充后的二極管塑封表面圖像集上,進(jìn)行泛化性能對(duì)比。結(jié)果如圖10所示,本文提出的算法方差為2%,在測(cè)試集上識(shí)別率最接近訓(xùn)練集??梢姡疚奶岢龅乃惴ㄔ诙O管塑封表面圖像集上可以有效提高模型的泛化性,有更好的適應(yīng)性,并且在復(fù)雜特征的圖像集上有很好的魯棒性。
本文提出了一種新型的半導(dǎo)體SMA缺陷識(shí)別方法,可以對(duì)二極管封裝表面缺陷圖像進(jìn)行很好的識(shí)別,使用Bi-2DPCA降維既可以保持圖像二維結(jié)構(gòu)提取主成分,又可以降低計(jì)算復(fù)雜度,縮短計(jì)算時(shí)間。在AlexNet結(jié)構(gòu)基礎(chǔ)上,提出正態(tài)隨機(jī)池化方法進(jìn)行下采樣并引入Dropconnect稀疏,實(shí)驗(yàn)在SMA封裝表面數(shù)據(jù)集、Mnist數(shù)據(jù)集和Cifar10數(shù)據(jù)集都上有很好的泛化性能,并且在SMA封裝表面數(shù)據(jù)集有很好的識(shí)別率,這對(duì)于提高二極管制造過(guò)程中的良品率有十分重要的意義。后續(xù)的研究主要是考慮如何進(jìn)一步提高識(shí)別精度以及優(yōu)化模型結(jié)構(gòu)以提高訓(xùn)練的收斂速度,使得本文算法可以更好地應(yīng)用到半導(dǎo)體行業(yè)的其他元器件識(shí)別生產(chǎn)過(guò)程中。
圖10 二極管塑封表面數(shù)據(jù)集泛化性能對(duì)比Fig.10 Generalization performance comparison of plastic sealing surface of diode data set