胡 鷹,侯政通,安 宇,喬磊明
(太原科技大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 太原 030024)
鋼材是當(dāng)今世界上最重要的工業(yè)材料之一,近年來隨著新技術(shù)新工藝的不斷應(yīng)用,各種新產(chǎn)品不斷涌現(xiàn),如我國最新研發(fā)的手撕鋼,其厚度只有0.02 mm,其生產(chǎn)工藝對(duì)鋼材產(chǎn)品表面質(zhì)量要求極為嚴(yán)格,我國目前在該領(lǐng)域處于世界領(lǐng)軍水平。然而,當(dāng)這些鋼材在制造加工運(yùn)輸?shù)拳h(huán)節(jié)中均會(huì)受到多種因素的影響,使其在外表面形成各種復(fù)雜類型的缺陷。這些缺陷附著或嵌入在鋼板表面除了直接影響產(chǎn)品的美觀之外,還間接影響了產(chǎn)品的結(jié)構(gòu)質(zhì)量和使用壽命,從而降低了企業(yè)的經(jīng)濟(jì)效益。為了能得到優(yōu)質(zhì)的成品鋼板,需要建立起一套完備的缺陷識(shí)別流程體系,供一線生產(chǎn)檢測(cè)識(shí)別。
鋼板表面缺陷圖像的識(shí)別首先需要從生產(chǎn)線上獲取不同缺陷的圖像,傳統(tǒng)缺陷識(shí)別主要依靠一線工人目測(cè),隨著機(jī)器視覺技術(shù)的興起,基于機(jī)器視覺的金屬表面缺陷檢測(cè)[1]已經(jīng)成為當(dāng)今各國鋼鐵企業(yè)的主流技術(shù),大多采用高速線陣CCD攝像機(jī)拍攝鋼板表面[2-6],通過融合提取特征[7],再輸入到分類器中訓(xùn)練,最后完成對(duì)缺陷圖像分類。
在傳統(tǒng)機(jī)器學(xué)習(xí)分類方法中,ünsalan等[8]對(duì)鋼表面銹蝕等級(jí)做劃分,將最近鄰分類器用于帶鋼表面缺陷類型的識(shí)別。Tang等[9]通過提取到的特征,采用BP神經(jīng)網(wǎng)絡(luò)方法對(duì)冷軋帶鋼表面缺陷圖像進(jìn)行分類。Jeon等[10]采用支持向量機(jī)對(duì)劃痕缺陷進(jìn)行檢測(cè)。但傳統(tǒng)的K最近鄰法(k-nearest neighbor,KNN)分類器在大數(shù)據(jù)中難以處理高維數(shù)據(jù),并在不同類別之間重疊度高的部分容易判錯(cuò);另外,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練針對(duì)大樣本,而且需要通過反向傳播不斷修正誤差,所以學(xué)習(xí)速度慢,易產(chǎn)生過擬合。而支持向量機(jī)(support vector machine,SVM)[11]的優(yōu)點(diǎn)是考慮結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,適用于小樣本、高維度的二分類問題,能有效避免過擬合,具有良好的泛化性能。
雖然SVM在數(shù)據(jù)的分類和回歸預(yù)測(cè)上展示了優(yōu)異的性能,但隨著研究的深入,SVM在處理高維數(shù)據(jù),尤其在對(duì)圖像復(fù)雜的特征分類時(shí),無法用最大邊際求解到一個(gè)合適的超平面,經(jīng)常會(huì)產(chǎn)生較差的效果。實(shí)際上,傳統(tǒng)的SVM算法旨在解決一個(gè)大規(guī)模的二次規(guī)劃(QPP)問題,這直接導(dǎo)致SVM在一些應(yīng)用上效率底、分類速度慢的問題,所以如果對(duì)SVM原始的模型做改進(jìn)或增加正則項(xiàng)勢(shì)必會(huì)增大開銷,導(dǎo)致速度更慢。
自2007年孿生支持向量機(jī)(twin support vector machine,TWSVM)[12]被提出后,相對(duì)于SVM不僅有效削減了計(jì)算成本,還保持了優(yōu)異的分類性能,同時(shí)也提出很多的改進(jìn)和應(yīng)用,如Kumar 等[13]引入了LSTWSVM,將不等式約束改為線性約束,提高模型訓(xùn)練速度;Jayadeva等[14]引入模糊隸屬度函數(shù)提供給數(shù)據(jù)點(diǎn),使其給模型提供不同的貢獻(xiàn)度;Chu等[15]在LSTWSVM基礎(chǔ)上通過對(duì)數(shù)據(jù)進(jìn)行修剪提出ELS-TWSVM,有效地限制了噪聲樣本所帶來的影響并成功運(yùn)用到帶鋼表面缺陷的分類上。但是,上述的方法都存在一個(gè)問題,就是這些算法只是將異類分開,只關(guān)注樣本的可分離性,而沒有充分挖掘到樣本間底層信息的關(guān)聯(lián)性,忽略了底層數(shù)據(jù)信息的結(jié)構(gòu)分布特征。
在常見的缺陷種類中,同種類的缺陷樣本之間會(huì)產(chǎn)生極為相似的特征,特征的分布存在很高的關(guān)聯(lián)程度,利用這些數(shù)據(jù)在全局和局部的結(jié)構(gòu)信息,可以最小化同類樣本間離散度并且最大化異類樣本間的離散度,從而更好地進(jìn)行分類。所以針對(duì)以上方法存在的問題,本文利用TWSVM的速度優(yōu)勢(shì)替換SVM算法,將全局、局部信息加入TWSVM的正則項(xiàng)中當(dāng)作約束條件,提出全域優(yōu)化孿生支持向量機(jī)(global optimized twin support vector machine,GTWSVM)算法,更好地對(duì)鋼板表面缺陷分類。
為了使計(jì)算機(jī)更好地識(shí)別缺陷圖像,采用灰度變換,從空間域上調(diào)整圖像對(duì)比度來改善視覺效果,在突出感興趣信息的同時(shí),也能抑制部分無關(guān)的信息,以達(dá)到圖像增強(qiáng)的目的。由于工廠獲取的圖片受到現(xiàn)場(chǎng)高溫的影響,也會(huì)出現(xiàn)不同程度的噪點(diǎn),這些噪點(diǎn)會(huì)影響后期的分類效果,所以采用了基于紋理分割的Gabor濾波器[16]對(duì)增強(qiáng)后的圖像進(jìn)行降噪平滑處理。
為了后期達(dá)到更好的分類效果,這里對(duì)預(yù)處理后的圖像采用灰度共生矩陣(gray-level co-occurrence matrix,GLCM)[17-18]和方向梯度直方圖(histogram of oriented gradient,HOG)[19-20]提取高維特征。
1.2.1灰度共生矩陣
在實(shí)際的缺陷圖像中,往往缺陷區(qū)域的灰度值和周圍區(qū)域的灰度值有著明顯的差異,為了更好地統(tǒng)計(jì)不同方向上灰度變換的頻率,采用GLCM提取缺陷圖像的紋理特征。首先將預(yù)處理后的圖像灰度級(jí)壓縮為16個(gè)灰度級(jí),以此來減少矩陣計(jì)算量,然后以當(dāng)前像素點(diǎn)為坐標(biāo)中心,設(shè)置基準(zhǔn)窗口尺寸為3×3,步長距離為1,移動(dòng)方向?yàn)?°、45°、90°、135°?;瑒?dòng)窗口以基準(zhǔn)窗口作為參考窗口,通過設(shè)定的移動(dòng)方向和步長距離進(jìn)行移動(dòng),尺寸與基準(zhǔn)窗口相同。在依次遍歷每幅缺陷圖像上的全部像素點(diǎn)后,最終每幅圖像都會(huì)得到一個(gè)關(guān)于缺陷紋理信息的特征矩陣。
1.2.2方向梯度直方圖
缺陷圖像中,局部缺陷區(qū)域和非缺陷區(qū)域的亮度不同,這可以通過計(jì)算邊緣梯度來獲取圖像明暗區(qū)域的變化信息,而HOG特征向量是由圖像局部區(qū)域的梯度方向生成的統(tǒng)計(jì)直方圖來構(gòu)成,優(yōu)點(diǎn)是對(duì)幾何形變和光照形變有著良好的不變性,因此可以對(duì)實(shí)時(shí)變化的圖像數(shù)據(jù)環(huán)境保持良好的魯棒性。
首先利用[-1,0,1]T和[1,0,-1]T梯度算子分別對(duì)預(yù)處理后的圖像做卷積運(yùn)算,計(jì)算出每個(gè)像素的水平方向和垂直方向的梯度,同時(shí)計(jì)算每個(gè)像素位置的梯度大小和方向,然后將圖像劃分成若干小的細(xì)胞單元,以45°等分將梯度方向映射到180°的范圍中,統(tǒng)計(jì)細(xì)胞單元的梯度方向直方圖,最后將細(xì)胞單元組成更大的描述子,稱為“塊”,本文的塊尺寸設(shè)置為3×3。為了降低局部光照變化帶來的影響和更好地融合其他特征,需要塊內(nèi)進(jìn)行歸一化處理。
最終將提取好的GLCM和HOG特征進(jìn)行拼接,得到337維特征長度,由于維數(shù)拼接過高容易造成過擬合,這里采用PCA降維,同時(shí)將特征歸一化和去中心化,使坐標(biāo)平移到數(shù)據(jù)中心,更好分類。
與傳統(tǒng)的SVM不同,TWSVM是Jayadeva等[12]在2007年提出的一個(gè)二分類算法,它將解決2個(gè)小規(guī)模的二次規(guī)劃問題,而不是求解單個(gè)大規(guī)模二次規(guī)劃問題,它實(shí)際由2個(gè)非平行超平面xTω1+b1=0和xTω2+b2=0構(gòu)成。圖1為TWSVM示意圖,目的是為了使2個(gè)超平面接近2個(gè)類的一個(gè),而盡可能遠(yuǎn)離另一個(gè)類。
圖1 孿生支持向量機(jī)示意圖
為了構(gòu)造這2個(gè)非平行決策平面,首先定義一組d維數(shù)據(jù)T={(xi,yi)|xi∈Rd,i=1,2,…,m},xi是輸入樣本,考慮是二分類問題,所以yi={+1,-1}為樣本標(biāo)簽。然后將訓(xùn)練集T劃分成大小為m1×n的矩陣A和大小為m2×n的矩陣B,其中m1+m2=m,從而建立了一對(duì)原始優(yōu)化問題:
(1)
(2)
式中:ω1、ω2為超平面法向量;b1、b2為超平面偏移量;c1、c2為懲罰參數(shù);q1、q2為松弛變量;e1、e2為適當(dāng)維數(shù)的1向量。
通過引入拉格朗日乘子向量,并利用K.K.T條件[21],如下可以分別得到式(3)和式(4)的對(duì)偶問題:
(3)
(4)
式中,α=[α1,α2,…,αm2]T,γ=[γ1,γ2,…,γm1]T為拉格朗日乘子向量H=[Ae1],G=[Be2],P=[Ae1],Q=[Be2]。
令μ=[ω1,b1]T,v=[ω2,b2]T,由K.K.T條件知:μ=-(HTH)-1GTα,v=(QTQ)-1PTγ,當(dāng)求得μ和v后,即可求出2個(gè)超平面。
通過下式,TWSVM很容易標(biāo)記一個(gè)新樣本x:
f(x)=argmin{|xTωl+bl=0|},l=1,2
(5)
線性鑒別分析(linear discriminant analysis,LDA)[22]是一種降維方式。針對(duì)全局結(jié)構(gòu),每類樣本點(diǎn)與本類的樣本均值點(diǎn)的總方差體現(xiàn)了散列程度,能體現(xiàn)數(shù)據(jù)總體分布情況,也反映了樣本點(diǎn)之間的密度,所以在投影后使同類樣本點(diǎn)與均值點(diǎn)的距離平方和變小,即從總體上來看每個(gè)類中的樣本與所屬類之間的離散度。相反,對(duì)于異類的樣本之間,從全局的角度上,通過求取每個(gè)類的中心點(diǎn)或均值點(diǎn),使其投影后兩類的均值點(diǎn)間的距離能夠盡可能的大,從而在整體空間上彼此互相遠(yuǎn)離。如圖2所示,其思想是希望找到一個(gè)最佳的投影方向,希望樣本之間在投影到低維空間后使異類樣本間的距離足夠遠(yuǎn),也希望同類樣本間的距離變得更緊湊,從而LDA可以刻畫出樣本與樣本之間的結(jié)構(gòu)關(guān)系。
圖2 最小化同類間距離和最大化異類間距離示意圖
LDA目的是通過最大化以下函數(shù)式J(ω)的比值,找到最優(yōu)的判別向量ω*,函數(shù)式定義如下:
(6)
式中:Sb為類內(nèi)離散度矩陣;Sw為類間離散度矩陣,分別反應(yīng)類內(nèi)和類間的數(shù)據(jù)樣本差異。
在采集到的鋼板表面各類缺陷圖像中,往往同種缺陷的圖像有非常相似的紋理、梯度等特征,所以在分類中充分挖掘樣本信息之間的關(guān)聯(lián)性,使同類樣本之間能夠盡量聚到一起,同時(shí)異類樣本之間盡可能遠(yuǎn)離,從而更好的分類。受LDA思想的啟發(fā),在二分類的情況下,通過樣本與樣本之間的方差來體現(xiàn)樣本之間的關(guān)聯(lián)性,會(huì)使模型更加關(guān)注數(shù)據(jù)樣本的先驗(yàn)知識(shí)。在TWSVM中加入LDA全局類內(nèi)最小化思想,那么圖1中兩類樣本虛線所圍面積會(huì)有所減小,使計(jì)算出的分類超平面將更準(zhǔn)確地區(qū)分兩類樣本。
根據(jù)LDA算法,可以定義全局類內(nèi)協(xié)方差矩陣Sw:
(7)
因?yàn)槿中畔Ⅲw現(xiàn)的數(shù)據(jù)樣本整體的結(jié)構(gòu)關(guān)系,沒有體現(xiàn)樣本局部范圍內(nèi)的信息結(jié)構(gòu),但在鋼板表面缺陷圖像中不同類型的缺陷往往存在較大差別,但同種類型的缺陷卻高度相關(guān),所以我們也希望利用樣本的局部關(guān)系,通過歐氏距離找到樣本附近與之特征相似的樣本點(diǎn),同時(shí)也挖掘出與樣本相差很大的部分樣本點(diǎn),使投影后樣本在新的子空間有最小的類內(nèi)距離和最大的類間距離。由于LDA是針對(duì)全局結(jié)構(gòu)[23],所以本文將采用KNN算法來提取樣本的局部結(jié)構(gòu),挖掘局部樣本之間的關(guān)系。
這里考慮正類樣本,若xi為正樣本中任意一點(diǎn),則定義它的K個(gè)同類近鄰樣本為N+(xi),同時(shí)定義它的K個(gè)異類近鄰樣本為N-(xi)。
N+(xi)=xik,k∈1,2,…,K,
N-(xi)=xjk,k∈1,2,…,K
(8)
(9)
(10)
在TWSVM算法的基礎(chǔ)上,將樣本全局類內(nèi)離散度矩陣、局部類內(nèi)離散度矩陣和類間離散度矩陣作為正則項(xiàng)加入到TWSVM中構(gòu)成新模型,相比原模型,新模型在添加全局信息后對(duì)于數(shù)據(jù)的分布有更好地掌控,可以最大程度使同類樣本盡可能附著在超平面上;同時(shí),添加局部信息后,不僅可以更加關(guān)注內(nèi)部結(jié)構(gòu),也能使邊緣樣本點(diǎn)遠(yuǎn)離異類超平面,從而達(dá)到更好的分類效果。
線性GTWSVM構(gòu)成如下2個(gè)QPPs問題:
(11)
(12)
式中:ω1、ω2為超平面法向量;b1、b2為超平面偏移量;c1至c4,v1至v6為懲罰參數(shù);q1、q2為松弛變量;e1、e2為適當(dāng)維數(shù)的1向量。2個(gè)公式的第一項(xiàng)是每個(gè)類的點(diǎn)到超平面之間距離的平方和。因此,最小化會(huì)使超平面接近2個(gè)類中的其中一個(gè)類(如正類)。第二項(xiàng)是最小化誤差變量的求和。第三項(xiàng)相當(dāng)于最大化關(guān)于超平面的一側(cè)邊距。第四項(xiàng)是最小化局部一類樣本中的散點(diǎn)。第五項(xiàng)是最大化局部異類樣本間散點(diǎn)。第六項(xiàng)是最小化全局類內(nèi)散點(diǎn)。最終,使得優(yōu)化后的模型更加關(guān)注全局、局部結(jié)構(gòu)信息。
對(duì)式(11)建立拉格朗日函數(shù)為:
αT(Bω1+e2b1+e2-q2)-βTq2
(13)
其中,α=[α1,…,αm2]T和β=[β1,…,βm2]T是朗格朗日乘子向量。根據(jù)K.K.T充分必要條件得:
(14)
(15)
(16)
-(Bω1+e2b1)+q2≥e2,q2≥0
(17)
αT[-(Bω1+e2b1)+q2-e2]=0,βTq2=0
(18)
α≥0,β≥0
(19)
從式(19)中知α≥0,β≥0,所以由式(16)可以得:
0≤α≤c1e2
(20)
將式(14)和式(15)合并表示為:
(21)
其中,I為適當(dāng)維數(shù)的單位矩陣。
定義:
H=P=[Ae1]
G=Q=[Be2]
(22)
令μ=[ω1,b1]T,可以重寫式(21)為:
HTHμ+τμ+GTα=0
(23)
則:
μ=-(HTH+τ)-1GTα
(24)
將式(24)代入式(13)中,可以求得式(11)的對(duì)偶QPPs問題:
(25)
同理可以獲得式(12)的對(duì)偶問題:
(26)
其中,
ν=[ω2,b2]T=(QTQ+φ)-1PTγ
(27)
(28)
最終,通過式(24)和式(27),可以得到2個(gè)超平面:
xTω1+b1=0,xTω2+b2=0
(29)
由式(5),一個(gè)新樣本x可以通過計(jì)算到2個(gè)超平面距離的遠(yuǎn)近來確定所從屬的類別。
由于鋼板表面缺陷圖像屬于多維特征,線性分類存在維度制約,不能很好地對(duì)其進(jìn)行分類,所以需要對(duì)應(yīng)非線性情況。GTWSVM通過核函數(shù),從低維空間到高維Hilbert空間中[24]構(gòu)造2個(gè)超平面K(xT,CT)u1+b1=0,K(xT,CT)u2+b2=0,其中,CT=[ATBT],u1,u2∈Rd為法向量,K是一個(gè)適合的核函數(shù),K(xT,CT)=φ(xT)·φ(CT)。
此時(shí)ω1、ω2被映射為:
(30)
與線性情況相似,非線性GTWSVM的2個(gè)QPPs問題分別描述如下:
s.t. -(K(B,CT)u1+e2b1)+q2≥e2,
q2≥0
(31)
s.t. (K(A,CT)u2+e1b2)+q1≥e1,q1≥0
(32)
式中:
(33)
(34)
(35)
類似于線性情形,式(31)(32) 的解表示為:
(36)
(37)
其中,
Hφ=Pφ=[K(A,CT)e1]
Gφ=Qφ=[K(B,CT)e2]
(38)
同理,可以獲得式(31)(32)的對(duì)偶QPPs問題:
(39)
(40)
則新樣本的類別可以通過如下函數(shù)進(jìn)行判別:
(41)
在一線生產(chǎn)過程中,由于鋼坯在軋制前沒有得到徹底地清理,導(dǎo)致軋制過程中有塊狀等雜質(zhì)壓入鋼坯表面,冷卻后掉落,最終在表面形成諸如小凹坑狀的麻點(diǎn);熱軋中,時(shí)間過長也會(huì)導(dǎo)致其表面形成點(diǎn)狀金屬氧化物[25];同時(shí),受到矯直機(jī)、運(yùn)輸機(jī)等設(shè)備的影響,也容易在表面形成條狀劃痕[26]。
鋼板表面缺陷的形成因素極為復(fù)雜,所以導(dǎo)致大量的缺陷種類。為了驗(yàn)證算法的可行性和泛化性能,實(shí)驗(yàn)選用2個(gè)典型的鋼板表面缺陷數(shù)據(jù)集進(jìn)行驗(yàn)證,首先選用東北大學(xué)熱軋鋼表面缺陷均衡數(shù)據(jù)集NEU-DET[27],驗(yàn)證算法在平衡數(shù)據(jù)集上的表現(xiàn)。其次,在工業(yè)生產(chǎn)過程中采集到的圖像數(shù)據(jù)往往是不充分的,每種缺陷的數(shù)量層次不齊,所以為了驗(yàn)證算法在不平衡數(shù)據(jù)集上的泛化性,又采用了東北大學(xué)的熱軋帶鋼表面缺陷不平衡數(shù)據(jù)X-SDD[28]進(jìn)行實(shí)驗(yàn)驗(yàn)證。
NEU數(shù)據(jù)集收集了熱軋帶鋼表面的6種典型缺陷圖像,即裂紋(Cr) 、夾雜物(In) 、斑塊(Pa) 、麻點(diǎn)(PS)、壓入氧化皮(RS)、刮痕(Sc)6類缺陷。該數(shù)據(jù)收集有1 800張鋼板表面缺陷的灰度圖像,每張圖像的原始分辨率為200×200像素,每種類型表面缺陷有300個(gè)樣本。按8∶2比例隨機(jī)選取每類缺陷的80%,剩下的20%作為測(cè)試集,樣本部分圖像以及經(jīng)過預(yù)處理后的圖像如圖3,圖中第1行為每種類型缺陷樣圖,第2行為圖像增強(qiáng)后的圖像,第3行是經(jīng)過Gabor濾波的去噪圖像。
圖3 NEU部分原圖像以及預(yù)處理結(jié)果圖像
S-SDD數(shù)據(jù)集包含7種熱軋帶鋼表面缺陷,即精軋輥印(FRP)、鐵皮灰(ISA)、夾雜物(In)、板道系氧化皮(PSOS)、紅鐵皮(RIS)、劃痕(Sc)、溫度系氧化皮(TSOS),共計(jì)1 360張缺陷圖像,每個(gè)缺陷圖像分辨率為128×128像素。每類缺陷樣本數(shù)量不同,其中精軋輥印203幅,鐵皮灰122幅,夾雜物238幅,板道系氧化皮63幅,紅鐵皮397幅,劃痕134幅,溫度系氧化皮203幅,屬于不平衡數(shù)據(jù)集。同樣,實(shí)驗(yàn)設(shè)置80%作為訓(xùn)練集,剩下20%作為測(cè)試集。部分圖像以及經(jīng)過預(yù)處理后的圖像如圖4所示,圖中第1行為每種類型缺陷樣圖,第2行為圖像增強(qiáng)后的圖像,第3行是經(jīng)過Gabor濾波的去噪圖像。
圖4 X-SDD部分原圖像以及預(yù)處理結(jié)果圖像
在本節(jié)中,通過相關(guān)實(shí)驗(yàn)來證明本文GTWSVM算法的性能。所做實(shí)驗(yàn)是在1臺(tái)配有Intel(R) Core(TM) i5-1135G7處理器(2.40 GHz)和16 GB RAM的電腦上并結(jié)合MATLAB R2017b編程軟件實(shí)現(xiàn)的。
實(shí)驗(yàn)中對(duì)比了5種傳統(tǒng)的算法,分別為BP、KNN、SVM、TWSVM、本文算法GTWSVM,每個(gè)算法均采用SOR算法來求解帶有約束條件的二次規(guī)劃問題。通過上文特征提取后降維得到37維缺陷樣本。這樣每個(gè)缺陷樣本圖像將由37維的特征向量和對(duì)應(yīng)的標(biāo)簽構(gòu)成,進(jìn)行多分類測(cè)試實(shí)驗(yàn),采用“一對(duì)多”(one-versus-all,OVA)[29]策略。用于本文評(píng)價(jià)方法的精確率(P)、召回率(R)、準(zhǔn)確率(A)和F1Score值定義如下:
(42)
其中,TP、TN、FP和FN分別為正確預(yù)測(cè)為正樣本數(shù)量、正確預(yù)測(cè)為負(fù)樣本數(shù)量、被錯(cuò)誤預(yù)測(cè)為正樣本的負(fù)樣本數(shù)量、被錯(cuò)誤預(yù)測(cè)為負(fù)樣本的正樣本數(shù)量。
核函數(shù)的選擇對(duì)映射到高維中樣本的分類有重要作用,文中采用最廣泛應(yīng)用的徑向基函數(shù)(radial basis function,RBF),其表達(dá)式為:
(43)
為了減少大規(guī)模訓(xùn)練時(shí)間,使正則化參數(shù)c1=c3、c2=c4、v1=v4、v2=v5、v3=v6,通過網(wǎng)格搜索,從{2i|i=-16,-15,…,+5}獲取RBF核參數(shù)σ、正則化參數(shù)和懲罰參數(shù)最優(yōu)值。經(jīng)過參數(shù)預(yù)調(diào)整,在GTWSVM中最近鄰參數(shù)K值選取7,一旦選擇了這些參數(shù),將調(diào)優(yōu)集返回到訓(xùn)練集,學(xué)習(xí)最終的決策函數(shù)。
對(duì)NEU數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)對(duì)比后,總體表現(xiàn)性能以及6種缺陷在不同算法的分類結(jié)果對(duì)應(yīng)的詳細(xì)指標(biāo)分別如表1和表2所示。
表1 不同算法在NEU數(shù)據(jù)集上的評(píng)估結(jié)果
表2 每種缺陷分類指標(biāo)結(jié)果
由表2實(shí)驗(yàn)結(jié)果可以看出,除BP神經(jīng)網(wǎng)絡(luò)外,其他4種算法對(duì)每類缺陷的識(shí)別都呈現(xiàn)出比較高的精度,但在同樣大小的訓(xùn)練集和測(cè)試集下,本文新提出的GTWSVM算法分類精度更高。在實(shí)際圖像中,麻點(diǎn)(PS)和壓入氧化皮(RS)存在類似點(diǎn)狀缺陷,尤其在第4類缺陷PS中混雜噪點(diǎn)較多并附著少量其他類型的缺陷,導(dǎo)致整體分類精度不高。但本文算法在PS缺陷中相對(duì)于其他算法分類效果更加明顯,召回率相較于BP提升了38.14%、相較于KNN提升了13.56、相較于SVM提升了3.39%、相較于TWSVM提升了6.78%,另外在其他指標(biāo)上均有一定程度的提升;同時(shí),在第2類缺陷In和第6類缺陷Sc中,本文算法相對(duì)于TWSVM算法有明顯提高,F(xiàn)1Score值分別提高1.42%和0.91%,召回率分別提高1.24%和1.67%。說明改進(jìn)后的算法更加關(guān)注樣本與樣本之間的關(guān)聯(lián)性,所得到的超平面更加利于區(qū)分。雖然提出的算法在一些缺陷分類效果上與其他算法相持平,但從表1可以看出分類整體效果上均優(yōu)于其他4種算法,有更好的表現(xiàn)。
為了證明算法的實(shí)用性,對(duì)X-SDD數(shù)據(jù)集進(jìn)行了測(cè)試,總體表現(xiàn)和具體每種缺陷指標(biāo)如表3、表4所示。
表3 不同算法在X-SDD數(shù)據(jù)集上的評(píng)估結(jié)果
從表4可以看出,在第4類缺陷樣本PSOS中,由于訓(xùn)練數(shù)據(jù)較少,導(dǎo)致模型擬合效果沒有達(dá)到良好的表現(xiàn),但本文所提的GTWSVM算法在該類缺陷上,召回率取得了60%的成績,相對(duì)于其他算法有顯著提升。雖然在第1類缺陷FRP中,GTWSVM的召回率低于TWSVM,但在第2類缺陷ISA、第3類缺陷In以及第5類缺陷RIS中均有不同程度的提升,其中在第3類缺陷In中,召回率相較于改進(jìn)前的TWSVM算法召回率提升了16.26%,F(xiàn)1Score達(dá)到了90.72%,遠(yuǎn)高于其他對(duì)比算法。同時(shí),從表3可以獲知,本文所提GTWSVM算法在整體性能上優(yōu)于TWSVM、SVM等算法,總體準(zhǔn)確率達(dá)到了89.19%,同樣在其他指標(biāo)上也有一定提升。
表4 每種缺陷分類指標(biāo)詳細(xì)結(jié)果
通過2組實(shí)驗(yàn),說明在原TWSVM模型中,添加全局信息后,使得投影后的每一類樣本到本類樣本均值點(diǎn)的距離平方和減??;同時(shí),添加局部信息后,每類樣本點(diǎn)在選擇局部同類近鄰樣本和異類近鄰樣本后,同樣可以使局部范圍對(duì)同類樣本之間的距離變得緊湊,并且遠(yuǎn)離局部異類樣本點(diǎn),利用樣本局部數(shù)據(jù)信息來擴(kuò)大同類與異類樣本間的邊界,通過平衡模型參數(shù)的權(quán)重,找到最佳投影方向,進(jìn)而提高TWSVM算法的性能。因此,最終得到的分類超平面會(huì)比優(yōu)化前的超平面更加關(guān)注全域范圍內(nèi)樣本間的內(nèi)部結(jié)構(gòu),分類更加準(zhǔn)確。
考慮到GTWSVM算法引入了局部近鄰,K值的選取會(huì)對(duì)模型的性能產(chǎn)生影響。為了驗(yàn)證算法的穩(wěn)定性,通過選取不同K值來進(jìn)行實(shí)驗(yàn),同時(shí)為了驗(yàn)證算法的普適性,將測(cè)試集數(shù)量增加為總數(shù)據(jù)量的30%,結(jié)果如圖5所示。
圖5 GTWSVM不同K值在NEU和X-SDD上的性能圖像
經(jīng)過多次實(shí)驗(yàn),在NEU數(shù)據(jù)集和X-SDD數(shù)據(jù)集上,GTWSVM算法在不同K值選取下所對(duì)應(yīng)的識(shí)別準(zhǔn)確率基本趨于穩(wěn)定。可以看出,當(dāng)K取7時(shí),識(shí)別準(zhǔn)確率最高,當(dāng)K取其他值時(shí),模型依然能夠維持在一個(gè)相對(duì)穩(wěn)定的范圍中。并且隨著測(cè)試數(shù)量的增加,K值并沒有對(duì)模型造成很大的波動(dòng),說明模型對(duì)K值的選取不敏感,有很好的魯棒性。
1) 利用LDA的全局思想并結(jié)合KNN算法,將每個(gè)樣本的局部同類近鄰樣本盡可能聚集在一起,將異類樣本盡可能分開,并作為正則項(xiàng)嵌入到TWSVM中。在對(duì)缺陷樣本圖像降噪處理后,利用GLCM和 HOG分別進(jìn)行特征提取,并融合2種特征。通過PCA降維后輸入到本文算法中訓(xùn)練。
2) 通過實(shí)驗(yàn)對(duì)比,本文算法在考慮了樣本之間的關(guān)聯(lián)性后,整體性能得到進(jìn)一步提高,更加適應(yīng)現(xiàn)代化工業(yè)生產(chǎn),可提高鋼板質(zhì)量,增大企業(yè)經(jīng)濟(jì)效益。