周昕晨,林 董,汪棟洋
(中國人民解放軍陸軍步兵學(xué)院(石家莊校區(qū)),河北 石家莊 050000)
隨著人工智能技術(shù)的發(fā)展,專家系統(tǒng)雖被廣泛地應(yīng)用到故障診斷領(lǐng)域中,但是仍存在知識獲取困難等問題。20世紀(jì)90年代,神經(jīng)網(wǎng)絡(luò)方法日趨成熟,但是存在泛化能力差、小樣本處理能力較弱等缺點(diǎn)。在神經(jīng)網(wǎng)絡(luò)的發(fā)展遇到問題時(shí),一種新的機(jī)器學(xué)習(xí)方法應(yīng)運(yùn)而生,即支持向量機(jī)(Support Vector Machine, SVM)[1-2]。SVM是基于小樣本統(tǒng)計(jì)理論的學(xué)習(xí)方法,它突破了傳統(tǒng)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,追求的是結(jié)構(gòu)風(fēng)險(xiǎn)最小化,所以泛化能力很強(qiáng),有效地解決了小樣本問題[3]。SVM在解決非線性問題上運(yùn)用了核函數(shù)方法,克服了神經(jīng)網(wǎng)絡(luò)等方法中運(yùn)算速度慢、容易陷入局部極小值的缺點(diǎn)。
因?yàn)镾VM中參數(shù)選擇對分類性能有較大影響,所以,越來越多的人對SVM的參數(shù)選擇進(jìn)行研究,如李嬌對支持向量機(jī)參數(shù)優(yōu)化進(jìn)行了研究,采用了遺傳算法和粒子群算法進(jìn)行參數(shù)優(yōu)化研究,避免因參數(shù)選擇不當(dāng)而導(dǎo)致效果不理想[4];尹子任等在支持向量機(jī)的輸電線路覆冰預(yù)測中引入了粒子群算法進(jìn)行優(yōu)化[5];陳偉根等對變壓器的繞組熱點(diǎn)溫度支持向量機(jī)的預(yù)測模型引入了遺傳算法進(jìn)行參數(shù)優(yōu)化[6];朱偉等在再生混凝土抗壓強(qiáng)度的支持向量機(jī)預(yù)測模型中進(jìn)行了遺傳算法參數(shù)優(yōu)化,提高了預(yù)測精度[7];袁玉萍等研究了遺傳算法在支持向量機(jī)模型中的參數(shù)優(yōu)化,并用算例進(jìn)行了驗(yàn)證,證明了經(jīng)過優(yōu)化后的分類精度和效率得到了提高[8]。
由于現(xiàn)有研究中參數(shù)選擇困難的問題尚未得到很好的解決,致使故障診斷準(zhǔn)確度不高。本文提出一種基于遺傳算法的參數(shù)優(yōu)化方法,并對試驗(yàn)信號和工程信號進(jìn)行了參數(shù)優(yōu)化前后的性能對比,結(jié)果表明,經(jīng)過參數(shù)優(yōu)化后診斷精度得到了提高。
以二維線性可分的分類問題(見圖1)為例。設(shè)數(shù)據(jù)集T={(xi,yi)|i=1,2,…,n},其中:xi∈Rn,yi∈(-1,+1),假設(shè)存在判別函數(shù):
f(x)=sgn(w·x+b)
(1)
由于yi∈(-1,+1),所以要使得所有數(shù)據(jù)點(diǎn)到最優(yōu)分類線的距離都>1,即:
yi(wixi+b)-1≥0
(2)
圖1 線性可分的分類問題
由圖1可以看出,w·x+b=0是區(qū)分樣本的超平面,為了使分類平面將2類樣本最大限度的區(qū)分,則需要分類間隔最大化,可以轉(zhuǎn)化為約束優(yōu)化問題:
(3)
s.t.yi(w·x+b-1)≥0
(4)
該約束可以通過構(gòu)造Lagrange函數(shù)求解:
(5)
式中,αi為Lagrange乘子,αi≥0。
對Lagrange函數(shù)求w和b的偏導(dǎo),根據(jù)優(yōu)化條件得:
(6)
根據(jù)上式結(jié)果得:
(7)
求出構(gòu)造超平面的參數(shù),則分類判別函數(shù)為:
f(x)=sgn(∑yiaixix+b)
(8)
根據(jù)f(x)的值就可以判斷x的類別。
當(dāng)存在一些不可以線性可分的點(diǎn)時(shí),則在約束條件下引入松弛變量ξi≥0,即:
(9)
s.t.yi(w·x+b)≥1-ξi
(10)
為了構(gòu)造Lagrange函數(shù),引入了Lagrange乘子,求解得:
(11)
(12)
對上式求解得:
(13)
(14)
判別函數(shù):
f(x)=sgn(∑yiaixix+b)
(15)
現(xiàn)實(shí)情況中存在更多的是非線性的情況,所以在對非線性數(shù)據(jù)集進(jìn)行分類處理時(shí),就需要將樣本特征通過映射函數(shù)φ(x)映射到高維空間(見圖2)。則優(yōu)化問題變?yōu)椋?/p>
(16)
(17)
設(shè)K(xi,xj)=φ(xi)φ(xj),則上式簡化為:
(18)
(19)
判別函數(shù)為:
(20)
式中,K(xi,xj)稱為核函數(shù)。
圖2 輸入空間到特征空間的映射
常用的核函數(shù)如下。
1)高斯徑向基核函數(shù):
(21)
2)多項(xiàng)式核函數(shù):
K(xi,xj)=(xixj+1)d
(22)
3)Sigmoid核函數(shù):
K(xi,xj)=tan[k(xixj)+v]
(23)
式中,σ、ν為核函數(shù)系數(shù)。
SVM的參數(shù)選擇對性能影響很大,需要確定的參數(shù)為懲罰參數(shù)C和核函數(shù)系數(shù)σ。C和σ的取值不同則模型的性能不同。針對不同的模型參數(shù)取值沒有一定的理論參考,如果對參數(shù)的取值采用嘗試的方法,這樣的工作量極大,效率低下。
SVM模型訓(xùn)練結(jié)果如圖3和圖4所示。圖3中C,σ初始值為(5,0.1)時(shí),分類正確率為77%;圖4中C,σ初始值為(10,0.5)時(shí),分類正確率為83%。由此可以看出,在參數(shù)選擇合適初始值的情況下,SVM才能實(shí)現(xiàn)很好的分類,參數(shù)選擇的不同將會有不同的分類效果。
圖3 SVM模型訓(xùn)練結(jié)果1
圖4 SVM模型訓(xùn)練結(jié)果2
由于遺傳算法具有隱含的并行性和較好的全局搜索能力等優(yōu)點(diǎn),可以在較短的時(shí)間內(nèi)搜索到全局最優(yōu)點(diǎn)[9],所以針對齒輪箱故障診斷模型為了選擇最佳的參數(shù),本文選擇了遺傳算法對齒輪箱支持向量機(jī)故障診斷模型進(jìn)行參數(shù)優(yōu)化。
遺傳算法(Genetic Algorithm,GA)是工程科學(xué)和生命科學(xué)相互交叉的產(chǎn)物,是一種通過借鑒生物界的進(jìn)化規(guī)律發(fā)展的高效全局優(yōu)化搜索算法,經(jīng)過選擇、遺傳和變異等操作,提高各個(gè)體的適應(yīng)性[10]。遺傳算法不基于具體問題,強(qiáng)大的隨機(jī)搜索能力和天然的并行性使其廣泛應(yīng)用在機(jī)器學(xué)習(xí)、模式識別等領(lǐng)域[11]。遺傳算法[12-13]通過對種群進(jìn)行基因編碼,按照適者生存方式,選擇出適應(yīng)度最好的個(gè)體,借用自然遺傳學(xué)中的遺傳操作進(jìn)行組合交叉和變異操作產(chǎn)生出新的種群,使得新總?cè)壕哂懈玫倪m應(yīng)性。
遺傳算法把問題空間映射到染色體位串空間,為了適者生存的原則,必須對個(gè)體的染色體位串的適應(yīng)度進(jìn)行評價(jià),所以,適應(yīng)函數(shù)組成了個(gè)體的生存環(huán)境。此次選擇訓(xùn)練好的SVM分類器計(jì)算測試樣本數(shù)據(jù)的識別率為適應(yīng)度函數(shù),以此來判斷是否滿足停止準(zhǔn)則。首先,對支持向量機(jī)分類模型中的主要參數(shù)即懲罰因子和核函數(shù)值進(jìn)行編碼操作并隨機(jī)生成初始化種群;然后,對種群的各個(gè)染色體進(jìn)行解碼,獲取出適應(yīng)值較好的懲罰因子和核函數(shù)值,并用選擇出的參數(shù)值用樣本數(shù)據(jù)集訓(xùn)練分類器模型,用訓(xùn)練好的分類器模型對測試集進(jìn)行測試。識別率計(jì)算式如下:
(24)
式中,s為測試樣本中分類爭取的樣本數(shù)目;t為測試樣本的總數(shù)目。
由于識別率在一定程度上反應(yīng)了分類模型的推廣能力和分類能力,所以根據(jù)識別率來構(gòu)造適應(yīng)度函數(shù),即:
Fitness=RR
(25)
SVM的2個(gè)參數(shù)C和σ對齒輪箱模型分類識別性能有很大的影響,為了提高分類識別性能,選擇GA對參數(shù)進(jìn)行優(yōu)化。
實(shí)驗(yàn)臺軸承為6307軸承,一個(gè)為正常軸承,另一個(gè)為外圈點(diǎn)蝕的軸承。采集數(shù)據(jù)后進(jìn)行數(shù)據(jù)處理,提取時(shí)域特征與小波包節(jié)點(diǎn)能量,由于各指標(biāo)數(shù)值的范圍有所差別,在進(jìn)行特征選擇之前先進(jìn)行歸一化處理,歸一化到[0,1],然后應(yīng)用Fisher準(zhǔn)則進(jìn)行特征選擇。選擇裕度指標(biāo)與峭度指標(biāo)作為支持向量機(jī)數(shù)據(jù)樣本特征向量。采集160組正常及故障狀態(tài)下的數(shù)據(jù),其中80組作為訓(xùn)練樣本,80組作為測試樣本。選用徑向基核函數(shù)作為支持向量機(jī)核函數(shù),該函數(shù)有1個(gè)核函數(shù)參數(shù)σ,設(shè)σ的取值范圍為0~100,C的取值范圍為0~1 000。
取GA群體規(guī)模為50,最大迭代次數(shù)為100,采用單點(diǎn)交叉方式,交叉概率為0.7,變異概率為0.01,終止條件為滿足最大迭代次數(shù)(即100)時(shí)停止進(jìn)化。經(jīng)過遺傳算法進(jìn)行優(yōu)化之后可以得到最優(yōu)的參數(shù)為:核函數(shù)參數(shù)σ的最優(yōu)解為84.916 9,懲罰參數(shù)C的最優(yōu)解為134.1,診斷精度為95%。GA參數(shù)優(yōu)化后的性能與未優(yōu)化的性能對比見表1。
表1 SVM分類性能對比
未經(jīng)參數(shù)優(yōu)化的分類結(jié)果、遺傳算法優(yōu)化適應(yīng)度以及經(jīng)過GA參數(shù)優(yōu)化之后的分類結(jié)果分別如圖5~圖7所示。
圖5 未經(jīng)參數(shù)優(yōu)化的分類結(jié)果
圖6 遺傳算法優(yōu)化適應(yīng)度
圖7 經(jīng)過GA參數(shù)優(yōu)化后的分類結(jié)果
圖8 軸承外圈故障
某裝甲車齒輪箱的軸承外圈故障如圖8所示。
選擇發(fā)生故障時(shí)的數(shù)據(jù)和正常運(yùn)轉(zhuǎn)時(shí)的數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,根據(jù)Fisher準(zhǔn)則,提取Fisher準(zhǔn)則值較大的特征峭度指標(biāo)和裕度指標(biāo)作為SVM模型的輸入,并選擇出訓(xùn)練集和測試集,建立SVM分類模型,進(jìn)行GA參數(shù)優(yōu)化,比較其分類性能。
支持向量機(jī)核函數(shù)選用最常用的徑向基核函數(shù),該函數(shù)有0個(gè)核函數(shù)參數(shù)σ,設(shè)σ的取值范圍為0.01~100,C的取值范圍為0~100。取GA群體規(guī)模為50,最大迭代次數(shù)為100,采用單點(diǎn)交叉方式,交叉概率為0.6,變異概率為0.001,終止條件為滿足最大迭代次數(shù)(即100)時(shí)停止進(jìn)化。
經(jīng)過遺傳算法進(jìn)行優(yōu)化后可以得到最優(yōu)的參數(shù)為:核函數(shù)參數(shù)σ的最優(yōu)解為92.30,懲罰參數(shù)C的最優(yōu)解為2.25,診斷精度為100%。GA參數(shù)優(yōu)化后的性能與未優(yōu)化的性能對比見表2。
表2 SVM分類性能對比
未經(jīng)參數(shù)優(yōu)化的分類結(jié)果、遺傳算法優(yōu)化適應(yīng)度以及經(jīng)過GA參數(shù)優(yōu)化后的分類結(jié)果分別如圖9~圖11所示。
圖9 未經(jīng)參數(shù)優(yōu)化的SVM模型分類結(jié)果
圖10 遺傳算法優(yōu)化適應(yīng)度
圖11 經(jīng)GA參數(shù)優(yōu)化后的SVM模型分類結(jié)果
齒輪箱SVM模型中參數(shù)的選擇對模型分類性能有較大影響。在齒輪箱支持向量機(jī)模型中引入遺傳算法對參數(shù)進(jìn)行優(yōu)化,通過未經(jīng)過參數(shù)優(yōu)化的SVM模型性能與經(jīng)過GA參數(shù)優(yōu)化后的SVM模型性能進(jìn)行對比可以看出,對于二分類或者多分類來說,GA參數(shù)優(yōu)化后的模型都能夠有更好的分類性能。工程數(shù)據(jù)驗(yàn)證可以看出,經(jīng)過GA參數(shù)優(yōu)化后的齒輪箱SVM模型能夠更好地進(jìn)行模式識別,對于實(shí)現(xiàn)齒輪箱故障智能診斷提供了幫助。
[1] 張繼強(qiáng). 基于模糊專家系統(tǒng)的礦井提升機(jī)電控系統(tǒng)的故障診斷[D]. 西安:西安科技大學(xué), 2012.
[2] Zhang B, Yin J, Wang S L, et al. Research on virus detection technique based on ensemble neural network and SVM[J]. Neurocomputing, 2014, 137:24-33.
[3] Shao Z, Zhang L, Zhou X, et al. A novel hierarchical semisupervised SVM for classification of hyperspectral images[J]. IEEE Geoscience and Remote Sensing Letters, 2014, 11:1609-1613.
[4] 李嬌. 支持向量機(jī)參數(shù)優(yōu)化研究[D]. 武漢: 華中師范大學(xué),2011.
[5] 尹子任, 蘇小林. 基于粒子群算法優(yōu)化支持向量機(jī)的輸電線路覆冰預(yù)測[J]. 電力學(xué)報(bào), 2014, 29(1):6-9.
[6] 陳偉根, 滕黎, 劉軍, 等. 基于遺傳優(yōu)化支持向量機(jī)的變壓器繞組熱點(diǎn)溫度預(yù)測模型[J]. 電工技術(shù)學(xué)報(bào), 2014, 29(1):44-51.
[7] 朱偉, 石超峰, 李楠. 基于遺傳算法優(yōu)化支持向量機(jī)的再生混凝土抗壓強(qiáng)度預(yù)測模型[J]. 中外公路, 2014, 34(1):311-314.
[8] 袁玉萍, 胡亮, 周志堅(jiān). 基于遺傳算法對支持向量機(jī)模型中參數(shù)優(yōu)化[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2008, 29(19):5016-5018.
[9] Goldberg D E. Genetic algorithms in search, optimization and machine learning[J]. MA: Addison-Wesley Publishing Company, 1989, 3:95-99.
[10] Mitchell M. An introduction to genetic algorithms[M]. Cambridge: MIT Press, 1996.
[11] De Jong K A. The analysis of the behavior of a class of genetic adaptive systems[M]. Ann Arbor: University of Michigan, 1975.
[12] Chauvin M, Lascoup B. Contribution to lightening in the automotive industry: application of the twist-beam rear axle[J]. Revue de Métallurgie, 2011, 108(7/8):427-435.
[13] Jack L B, Nandi A K. Fault detection using support vector machines and artificial neural net works augmented by genetic algorithms[J]. Mechanical Systems and Signal Processing, 2002, 16(2):373-390.