吳慶濤,韓春松,丁傳東
(齊齊哈爾大學(xué) 機(jī)電工程學(xué)院,黑龍江 齊齊哈爾 161006)
支持向量機(jī)(SVM,Support Vector Machine)最早用于線性系統(tǒng)數(shù)據(jù)分類,引入核函數(shù)后,SVM 具備了處理非線性系統(tǒng)數(shù)據(jù)的能力,又因其理論完善,需求訓(xùn)練樣本少,分類效果好的特點(diǎn),近年來被廣泛的用于非線性系統(tǒng)故障診斷。梅恒榮等[1]使用IPSO 算法優(yōu)化SVM 的參數(shù),有效地提高模擬電路故障診斷的分類準(zhǔn)確率和收斂速度,縮短分類時(shí)間;張建等[2]用改進(jìn)的免疫算法優(yōu)化支持向量機(jī)懲罰因子、松弛變量及核函數(shù)參數(shù)用于某型航空發(fā)動(dòng)機(jī)磨損故障診斷;許迪等[3]提出一種量子遺傳算法優(yōu)化的SVM 算法,用于滾動(dòng)軸承的故障診斷;胡曉依等[4]在卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,融入支持向量機(jī)和深度學(xué)習(xí)的模型優(yōu)化技術(shù),提出適于軸承故障診斷的CNN-SVM 深度卷積神經(jīng)網(wǎng)絡(luò)模型;張龍等[5]利用VMD 算法對振動(dòng)信號進(jìn)行分解處理,作為特征向量輸入到PSO 優(yōu)化的SVM 中,實(shí)現(xiàn)滾動(dòng)軸承故障診斷;林煜凱[6]提出了基于集成模態(tài)經(jīng)驗(yàn)分解(EEMD)的改進(jìn)布谷鳥搜索算法(ICS)和SVM 的故障診斷方法,用于齒輪箱故障診斷。本文旨在通過數(shù)據(jù)分類實(shí)驗(yàn),對比分析SVM 線性核函數(shù)和徑向基核函數(shù)的數(shù)據(jù)處理性能,確認(rèn)適用于非線性系統(tǒng)故障診斷的核函數(shù)。
對于線性可分的訓(xùn)練集樣本 train ={( x1, y1),( x2, y2), …, ( xn, yn)},且類別 yi∈{+ 1 , - 1},SVM 的目的就是尋求一個(gè)最優(yōu)超平面 ωx + b=0,要求這個(gè)最優(yōu)平面滿足以下兩個(gè)條件:
(1)將兩種類別數(shù)據(jù)準(zhǔn)確分開,即:
(2)保證兩類別數(shù)據(jù)之間的距離最大,即φ (ω ,ξ )的值最?。?/p>
式中,C>0 且為一常數(shù),ξ 稱為懲罰因子。
而后引入拉格朗日系數(shù)αi( i = 1,2, …, l),再根據(jù)KKT(Karush-Kuhn-Tucker)取得極值的條件和優(yōu)化方程求解的對偶性原理,最終上述求解最優(yōu)超平面的公式變?yōu)?/p>
那么對于非線性分類問題,SVM 的解決方法是使用核函數(shù)將低維非線性數(shù)據(jù)映射成高維特征空間,變成線性可分?jǐn)?shù)據(jù)。加入核函數(shù)后,求解最優(yōu)超平面的公式變?yōu)?/p>
本文選取4 組數(shù)據(jù)來完成SVM 線性核函數(shù)和徑向基核函數(shù)分類性能對比實(shí)驗(yàn),結(jié)果如圖1, 2 所示。同時(shí)為了實(shí)驗(yàn)結(jié)果更易于對比,又將分類準(zhǔn)確率和用時(shí)以數(shù)據(jù)形式呈現(xiàn)在表1 中。在實(shí)驗(yàn)中,SVM 的懲罰系數(shù)C 設(shè)置為100,徑向基核函數(shù)參數(shù)設(shè)置為1。下面對4 組數(shù)據(jù)以及實(shí)驗(yàn)結(jié)果進(jìn)行簡要分析和說明。
圖1 線性可分?jǐn)?shù)據(jù)和線性不可分?jǐn)?shù)據(jù)SVM 分類結(jié)果
(1)線性可分?jǐn)?shù)據(jù)。在兩段區(qū)間[1,3]和[4,5]中隨機(jī)產(chǎn)生數(shù)據(jù),且[1,3]區(qū)間產(chǎn)生數(shù)據(jù)樣本類別為+1,[4,5]區(qū)間產(chǎn)生數(shù)據(jù)類別為-1,最終產(chǎn)生訓(xùn)練樣本數(shù)據(jù)110 個(gè),測試樣本數(shù)據(jù)40 個(gè)。圖1 中的a 顯示的是線性核函數(shù)分類結(jié)果圖,圖1 中的c 顯示的是徑向基核函數(shù)分類結(jié)果圖,且表1 中顯示兩個(gè)核函數(shù)分類結(jié)果都是100%,所以兩種核函數(shù)都能將線性可分?jǐn)?shù)據(jù)有效分類,但表1 中顯示徑向基核函數(shù)用時(shí)短。
(2)線性不可分?jǐn)?shù)據(jù)。3 段區(qū)間[2,3]、[3,4]和[4,5]隨機(jī)產(chǎn)生數(shù)據(jù),[2,3]區(qū)間和[4,5]區(qū)間產(chǎn)生數(shù)據(jù)樣本類別為+1,[3,4]區(qū)間產(chǎn)生數(shù)據(jù)類別為-1,最終產(chǎn)生訓(xùn)練樣本數(shù)據(jù)60 個(gè),測試樣本數(shù)據(jù)60 個(gè)。圖1(b)是線性核函數(shù)分類結(jié)果圖,圖1(d)是徑向基核函數(shù)分類結(jié)果圖,由圖可以看出徑向基核函數(shù)能夠?qū)?shù)據(jù)圈出分類,而線性核函數(shù)無法有效分類,表1 中也顯示出相比于徑向基核函數(shù),線性核函數(shù)的分類準(zhǔn)確率低且用時(shí)長。
(3)Iris 數(shù)據(jù)集。Iris 也稱鳶尾花卉數(shù)據(jù)集是公認(rèn)的分類實(shí)驗(yàn)數(shù)據(jù)集,是由Fisher 收集整理,這個(gè)分類數(shù)據(jù)集可在UCI 數(shù)據(jù)庫中下載。
Iris 數(shù)據(jù)類別分為3 類,setosa,versicolor,virginica。每類植物有50 個(gè)樣本,共150 個(gè),每個(gè)樣本有4個(gè)屬性,分別為花萼長、花萼寬、花瓣長、花瓣寬。實(shí)驗(yàn)中取setosa 數(shù)據(jù)的類別為+1,其余類別為0。
圖2(a)是線性核函數(shù)分類結(jié)果圖,圖2(c)是徑向基核函數(shù)分類結(jié)果圖,能看到兩種核函數(shù)都將數(shù)據(jù)有效分開,且表1 數(shù)據(jù)也顯示分類準(zhǔn)確率均為100%,所以兩種核函數(shù)都能對Iris 數(shù)據(jù)進(jìn)行有效分類,當(dāng)然徑向基核函數(shù)在用時(shí)上更勝一籌。
(4)軸承故障數(shù)據(jù)。軸承數(shù)據(jù)來自于美國西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心,是在故障診斷領(lǐng)域公認(rèn)的數(shù)據(jù),在諸多文獻(xiàn)中都有使用。
數(shù)據(jù)測量平臺(tái)有4 種負(fù)載下相應(yīng)就有4 個(gè)轉(zhuǎn)速,分別為1 797, 1 772, 1 750, 1 730 r/min;每種負(fù)載下的軸承有3 個(gè)損傷位置,分為內(nèi)圈(IF)、外圈(OF)、滾動(dòng)體(RF);而每個(gè)損傷位置又有3 種損傷直徑,即0.177 8, 0.355 6, 0.533 4 mm 三種。
實(shí)驗(yàn)選用的數(shù)據(jù),是在大負(fù)載下,轉(zhuǎn)速1 730 r/min,軸承損傷位置選為內(nèi)圈(IF),損傷直徑選為0.533 4 mm,而采樣頻率選為12 kHz,選取驅(qū)動(dòng)端數(shù)據(jù)(DE)和風(fēng)扇端數(shù)據(jù)(FE)。訓(xùn)練樣本1 500 組數(shù)據(jù),其中正常樣本1 000 組,故障樣本500 組;測試樣本1 000 組數(shù)據(jù),其中正常樣本500 組,故障樣本500 組。正常樣本類別為+1,故障樣本類別為-1。
圖2(b)是線性核函數(shù)分類結(jié)果圖,圖2(d)是徑向基核函數(shù)分類結(jié)果圖,由圖可以看出徑向基核函數(shù)比線性核函數(shù)分類界限更清晰,且表1 體現(xiàn)出徑向基核函數(shù)的分類準(zhǔn)確率更高,且用時(shí)更短。
圖2 Fisheriris 數(shù)據(jù)和軸承內(nèi)圈故障數(shù)據(jù)SVM 分類結(jié)果
通過上述分類實(shí)驗(yàn)得出如下結(jié)論:
(1)依據(jù)線性可分?jǐn)?shù)據(jù)和fisheriris數(shù)據(jù)分類實(shí)驗(yàn)的結(jié)果,可以發(fā)現(xiàn)SVM 采用線性核函數(shù)或徑向基核函數(shù)都能夠?qū)@兩種數(shù)據(jù)進(jìn)行準(zhǔn)確分類,同時(shí)也可以看到相比于線性核函數(shù),徑向基核函數(shù)分類用時(shí)縮短約一半,所以徑向基核函數(shù)分類速度更快。
(2)依據(jù)線性不可分?jǐn)?shù)據(jù)分類結(jié)果和軸承振動(dòng)故障診斷結(jié)果,可以發(fā)現(xiàn)SVM 采用徑向基核函數(shù)進(jìn)行故障診斷時(shí),準(zhǔn)確率更高,且速度更快。
通過分析得出最終結(jié)論,SVM 的線性核函數(shù)只適用于線性系統(tǒng)數(shù)據(jù)分類,而徑向基核函數(shù)適應(yīng)范圍更廣,性能更優(yōu),不僅適于非線性系統(tǒng)故障診斷,且診斷速度更快。
表1 兩種核函數(shù)的分類結(jié)果
齊齊哈爾大學(xué)學(xué)報(bào)(自然科學(xué)版)2021年3期