黃 功,趙永平,謝云龍
(南京航空航天大學(xué)能源與動(dòng)力學(xué)院,南京210016)
(*通信作者電子郵箱y.p.zhao@163.com)
渦軸發(fā)動(dòng)機(jī)是一種將燃料的化學(xué)能轉(zhuǎn)化為輸出軸功率的機(jī)械裝置,主要為直升飛機(jī)提供動(dòng)力。由于其壓氣機(jī)、渦輪等部件長時(shí)間工作在高溫、高壓和高轉(zhuǎn)速的惡劣環(huán)境里,發(fā)生故障在所難免。據(jù)統(tǒng)計(jì),在航空發(fā)動(dòng)機(jī)發(fā)生的各類故障中,氣路故障占比約90%以上,因此對(duì)氣路故障進(jìn)行有效的檢測和研究就顯得尤為重要[1]。
為了能及時(shí)有效地對(duì)故障進(jìn)行檢測和隔離來保護(hù)人民生命財(cái)產(chǎn)安全和降低損失,各國學(xué)者和技術(shù)人員提出了很多有用的方法。目前,針對(duì)氣路故障檢測的方法主要有基于模型、基于數(shù)據(jù)和基于知識(shí)規(guī)則等三種方法[2]。其中,基于模型和基于數(shù)據(jù)的兩種檢測方法應(yīng)用最為廣泛。在基于模型的檢測方法中,比較常用的有基于卡爾曼濾波器[3-4]和基于觀測器的方法[5]。基于模型的檢測方法在機(jī)載實(shí)時(shí)應(yīng)用方面為我們帶來了很多好處,但同時(shí)也存在著很多不足。該方法要求對(duì)發(fā)動(dòng)機(jī)知識(shí)和建模過程有較全面的掌握,而且隨著發(fā)動(dòng)機(jī)設(shè)計(jì)水平和制造工藝的日趨復(fù)雜,建模不確定性和建模難度也越來越大,使建立精確的數(shù)學(xué)模型充滿了挑戰(zhàn)。與此同時(shí),隨著支持向量機(jī)(Support Vector Machine,SVM)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)等人工智能算法的快速發(fā)展,基于數(shù)據(jù)的故障檢測方法在檢測效率和檢測精度等方面有了長足的進(jìn)步。其中,反向傳播(Back Propagation,BP)算法是一種最基礎(chǔ)的ANN算法。理論上,BP算法具有任意逼近能力,但同時(shí)也存在譬如收斂速度慢,易陷入局部最小等缺點(diǎn)。殷鍇等[6]利用BP 算法來對(duì)航空發(fā)動(dòng)機(jī)進(jìn)行故障檢測,實(shí)驗(yàn)表明,BP 算法可作為故障檢測的一種備選方案。為了進(jìn)一步提高BP算法的檢測精度,Qu等[7]提出了一種利用遺傳算法(Genetic Algorithm,GA)來優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的初始權(quán)重和閾值的新算法,并將其用于航空發(fā)動(dòng)機(jī)氣路故障診斷中,實(shí)驗(yàn)證明,該算法相較于BP算法具有更快的收斂速度和更高的故障診斷精度。極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是一種擴(kuò)展的單隱含層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden Layer Feedforward Neural Network,SLFNN)。相較于BP 神經(jīng)網(wǎng)絡(luò),ELM 不需要更新隱含層,因而大大縮短了訓(xùn)練時(shí)間。王小雷等[8]利用ELM 對(duì)發(fā)動(dòng)機(jī)進(jìn)行故障檢測,取得了較好的效果。為了消除無效的隱含層節(jié)點(diǎn),廖洪一[9]提出一種利用GA 來優(yōu)化ELM 的輸入權(quán)值矩陣和隱含層偏置值的新算法,相較于標(biāo)準(zhǔn)的ELM,這一新算法有效地精簡了隱含層節(jié)點(diǎn)數(shù),提高了模型的泛化能力。當(dāng)ELM 用于解決故障檢測等分類問題時(shí),存在一種硬間隔缺陷,Zhao 等[10]提出了一種軟極限學(xué)習(xí)機(jī)(Soft ELM,SELM)算法來解決這一問題。SELM 算法通過靈活地為每個(gè)樣本設(shè)定一個(gè)目標(biāo)間隔,再求解一系列正則化的ELM,有效地提高了算法的分類精度、增強(qiáng)了模型的泛化能力。SVM 是Cortes 等[11]于1995 年提出的一種二分類算法,該算法通過最小化結(jié)構(gòu)風(fēng)險(xiǎn)來尋找最優(yōu)分類面,被廣泛應(yīng)用于圖像分割[12-14]、人臉識(shí)別[15-17]和文本識(shí)別[18-19]等領(lǐng)域。在2012 年,Heng等[20]使用SVM 對(duì)航空發(fā)動(dòng)機(jī)數(shù)據(jù)進(jìn)行故障檢測分析,取得了比較好的效果。最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)是基于SVM 改進(jìn)而來的,它通過求解線性方程組而不是求解二次規(guī)劃問題在很大程度上降低了算法的訓(xùn)練時(shí)間。在2013 年,莊夏等[21]提出一種利用改進(jìn)的粒子群優(yōu)化算法來優(yōu)化LSSVM 的懲罰參數(shù)和核函數(shù)參數(shù)的新算法,將該算法用于故障檢測中得到了比較好的結(jié)果。
隨著發(fā)動(dòng)機(jī)設(shè)計(jì)水平的提高以及制造工藝的日趨完善,發(fā)動(dòng)機(jī)故障數(shù)據(jù)獲取的難度越來越大,代價(jià)也越來越大,因此,類別不平衡學(xué)習(xí)(Class Imbalance Learning,CIL)問題在基于數(shù)據(jù)的故障檢測方法中的重要性日益凸顯。在2018 年,Xi等[22]提出了一種能解決CIL 問題的改進(jìn)LSSVM 算法,在渦扇發(fā)動(dòng)機(jī)數(shù)據(jù)集中取得了比較好的效果。一類支持向量機(jī)(One Class Support Vector Machine,OCSVM)是一種只需要正常數(shù)據(jù)就可建立故障檢測分類器的單分類算法,常用于故障檢測[23-24]、入侵檢測[25-26]等。加權(quán)一類支持向量機(jī)(Weighted OCSVM,WOCSVM)是通過對(duì)正常樣本分配較大的權(quán)值,對(duì)可能的故障樣本分配較小的權(quán)值,來最大限度地降低故障樣本對(duì)分類器的影響,從而達(dá)到增強(qiáng)算法魯棒性的目的,因此,對(duì)權(quán)重計(jì)算規(guī)則的制定就顯得尤為重要。文獻(xiàn)[27]提出了一種自適應(yīng)加權(quán)一類支持向量機(jī)(Adaptive WOCSVM,AWOCSVM)算法,該算法能有效地對(duì)樣本中的離域點(diǎn)進(jìn)行檢測,但也存在著不能很好地描述樣本邊界的問題。為此,本文提出一種基于局部密度的加權(quán)一類支持向量機(jī)(Local Density WOCSVM,LD-WOCSVM)算法。在該算法中,筆者首先考慮到馬氏距離能排除特征之間相關(guān)性的干擾這一特性,在求解樣本k近鄰的過程中,使用馬氏距離而不是歐氏距離來度量,并且選用當(dāng)前樣本k近鄰的中心而不是整個(gè)數(shù)據(jù)集的中心來計(jì)算樣本權(quán)重。此外,筆者通過改進(jìn)一種快速聚類算法來識(shí)別可能的故障樣本,并對(duì)故障樣本分配較小的權(quán)重而提出了一種新算法,為方便敘述,將這一新算法命名為FCLD-WOCSVM。在4 個(gè)基準(zhǔn)數(shù)據(jù)集上的仿真結(jié)果表明,與A-WOCSVM 算法相比,LD-WOCSVM 算法和FCLD-WOCSVM算法在故障檢測中能取得更好的結(jié)果,證明了本文提出算法的有效性。
OCSVM 是Sch?lkopf 等[28]于1999 年提出的一種單分類算法,只需要正常數(shù)據(jù)即可建立分類器,能很好地解決CIL 問題。為了能進(jìn)一步提高OCSVM 算法的魯棒性,學(xué)者們提出了各種改進(jìn)措施,WOCSVM 算法即是其中的一種。本文是在文獻(xiàn)[27]所提算法的基礎(chǔ)上做出改進(jìn)的。
給定訓(xùn)練樣本集D=,xi∈Rn,x是一個(gè)測試樣本,且x∈Rn。存在從Rn到希爾伯特空間χ的非線性映射φ使得φ(xi)∈χ,在希爾伯特空間存在超平面w·φ(xi)-ρ= 0 將原點(diǎn)和映射樣本完全分開。其中,w為超平面法向量,ρ為偏移量[29],映射樣本代表著正常樣本,原點(diǎn)代表著故障樣本。引入松弛因子ξi≥0 可使算法具有某種程度的魯棒性。用ωi表示樣本xi對(duì)應(yīng)的權(quán)重,且ωi∈[0,1],則WOCSVM 的優(yōu)化目標(biāo)可寫為
其中w∈χ,ρ∈R。ν∈(0,1]為預(yù)先定義的正則化參數(shù),是被允許的最大誤警率。引入拉格朗日乘子αi≥0,βi≥0,則有:
由Karush-Kuch-Tucker條件可得:
將式(3)代入式(2),可得原優(yōu)化目標(biāo)的對(duì)偶形式為:
其中SVs表示支持向量的索引。對(duì)于測試樣本x,如果f(x)的值為1,則說明x為正常樣本;如果f(x)的值為-1,則說明x為故障樣本。由式(4)可知,權(quán)重ωi越小,則對(duì)應(yīng)的拉格朗日乘子αi越趨近于零,說明樣本xi與分類邊界的距離越遠(yuǎn),對(duì)分類邊界的影響越小。因此,只要對(duì)潛在的故障樣本分配較小的權(quán)重,即可起到增強(qiáng)算法魯棒性的作用。
現(xiàn)將文獻(xiàn)[27]的權(quán)重求取方式簡述如下。
設(shè)C為數(shù)據(jù)集的幾何中心,則樣本xi與C之間的歐氏距離為:
則樣本xi對(duì)應(yīng)的權(quán)重ωi可由式(8)求得:
由上述表述可知,文獻(xiàn)[27]所提算法的權(quán)重求取方式存在一定缺陷。當(dāng)訓(xùn)練集的樣本構(gòu)成比較復(fù)雜,比如存在多個(gè)小范圍聚集的情況,則樣本與訓(xùn)練集中心的距離并不能衡量該樣本與數(shù)據(jù)集邊界的位置關(guān)系,也就是采用式(8)來求取權(quán)重并不科學(xué)。為此,本文提出一種基于局部密度的加權(quán)方式。其基本原理可簡述如下。
令表示樣本xi與其近鄰中心之間的正則化距離,則:
由于故障樣本與正常樣本的形成機(jī)制不同,一般情況下故障樣本均遠(yuǎn)離正常樣本。當(dāng)越大,說明樣本xi與其他樣本的距離越大,則xi為故障樣本的可能性越大,此時(shí)需要對(duì)它分配較小的權(quán)值。則令
式(11)即為基于局部密度的WOCSVM 算法的權(quán)重求取方式。
在1.2 節(jié)中,求取離樣本xi最近的k個(gè)訓(xùn)練樣本{xi,1,xi,2,…,xi,k}時(shí),考慮到訓(xùn)練數(shù)據(jù)集中可能摻雜有無法確定特征之間是否有聯(lián)系的故障樣本這一情況,如果采用傳統(tǒng)的歐氏距離來度量,則無法保證計(jì)算的科學(xué)性。為此,本文提出用馬氏距離(Mahalanobis Distance,MD)來度量兩樣本之間距離的遠(yuǎn)近。
馬氏距離是統(tǒng)計(jì)學(xué)家馬哈拉諾比斯定義的一種距離,它與歐氏距離相比,能有效地消除各變量之間的關(guān)聯(lián)性并且和數(shù)據(jù)的量綱沒有關(guān)系。給定訓(xùn)練樣本集D,對(duì)于第i個(gè)樣本xi和第j個(gè)樣本xj之間的馬氏距離可由下式計(jì)算得出:
其中Σ表示總體協(xié)方差矩陣。由于樣本協(xié)方差是總體協(xié)方差的無偏估計(jì),為便于計(jì)算,常用樣本協(xié)方差矩陣代替總體協(xié)方差矩陣。當(dāng)Σ為單位矩陣時(shí),馬氏距離變?yōu)闅W氏距離。
為方便敘述,將此算法簡稱為LD-WOCSVM?;谝陨戏治觯蓪⑺惴鞒毯喪鋈缦?。
步驟2 由式(12)計(jì)算樣本的k個(gè)鄰近樣本。
步驟3 由式(11)求得權(quán)重,代入式(4),由序列最小最優(yōu)(Sequential Minimal Optimization,SMO)算法求解式(4),繼而由式(5)求得決策函數(shù)。
步驟4 由式(5)預(yù)測新樣本是正常還是故障。
為了能進(jìn)一步增強(qiáng)算法的魯棒性,先采用一種快速聚類分析算法來獲取樣本分布特點(diǎn),再通過對(duì)可能的故障樣本分配較小的權(quán)重來實(shí)現(xiàn)自適應(yīng)加權(quán)?;诳焖倬垲愃惴ǖ臋?quán)重求取如下。
Rodriguez 等[30]在2014 年提出了一種很簡潔的快速聚類算法,該算法的參數(shù)很容易確定,通過分析,該算法的復(fù)雜度為O(N2)。本文通過對(duì)該算法進(jìn)行進(jìn)一步改進(jìn),可以快速準(zhǔn)確地識(shí)別出一部分故障樣本,從而使更大限度地提高算法魯棒性成為可能。該算法通過定義ρi和δi兩個(gè)參數(shù)來衡量對(duì)應(yīng)的樣本xi是否為故障樣本。其中,ρi表示數(shù)據(jù)點(diǎn)xi的局部密度,δi表示數(shù)據(jù)點(diǎn)xi到高局部密度的距離。ρi定義為:
其中:當(dāng)x<0 時(shí),χ(x)= 1;當(dāng)x≥0 時(shí),χ(x)= 0。dc為截?cái)嗑嚯x(超參數(shù)),di j為樣本xj到樣本xi的距離。則ρi表示到樣本xi的距離小于dc的樣本的個(gè)數(shù)。對(duì)于dc值的選取,一種常用的方法是選擇的dc應(yīng)能使平均每個(gè)樣本點(diǎn)的附近樣本個(gè)數(shù)為數(shù)據(jù)集總樣本個(gè)數(shù)的1%~2%。在本文中,使用k近鄰算法獲取dc的值,具體步驟如下。
N為數(shù)據(jù)集總樣本個(gè)數(shù),s=N×1%取整數(shù)獲取s值。用xi,s(i= 1,2,…,N)表示xi的第s個(gè)近鄰樣本,d(xi,xi,s)表示樣本xi和樣本xi,s之間的歐氏距離。使用Q(x)來表示數(shù)據(jù)集中每個(gè)樣本與該樣本第s個(gè)近鄰樣本之間距離的集合,即Q(x)={d(xi,xi,s)}。則dc的計(jì)算公式如下:
對(duì)于參數(shù)δi,其計(jì)算公式為:
可知,δi表示數(shù)據(jù)點(diǎn)xi到高局部密度的最小距離。對(duì)于局部密度最大的點(diǎn),設(shè)置δi=(dij)。通過上述分析計(jì)算,可以得到數(shù)據(jù)集中所有樣本對(duì)應(yīng)的ρi和δi。從對(duì)參數(shù)定義的規(guī)則可以得到,擁有較大ρi值和較大δi的樣本,可以認(rèn)為是訓(xùn)練集中某個(gè)類簇的中心;而對(duì)擁有較小ρi值和較大δi的樣本,認(rèn)為是訓(xùn)練集中存在的故障樣本(噪聲);對(duì)擁有較大ρi值和較小δi的樣本,認(rèn)為是分布在距離最近的類簇中心的周圍;對(duì)擁有較小ρi值和較小δi的樣本,認(rèn)為分布在距離該樣本最近的類簇的邊緣。為了使故障樣本分配到更小的權(quán)重,令
其中:Δ是一個(gè)很小的正數(shù),目的是為了避免出現(xiàn)分母為零的情況,一般取Δ= 10-6。為了便于敘述,將此算法簡稱為FCLD-WOCSVM?;谝陨戏治?,可將算法FCLD-WOCSVM的流程簡述如下。
步驟2 由式(13)和(15)計(jì)算ρi和δi,再由式(16)求得權(quán)重。
步驟3 將權(quán)重代入式(4),由SMO 算法求解式(4),繼而由式(5)求得決策函數(shù)。
步驟4 由式(5)預(yù)測新樣本是正常還是故障。
為了驗(yàn)證本文所提的LD-WOCSVM 和FCLD-WOCSVM 兩種算法的有效性,本文將從以下兩個(gè)方面加以論述。首先選用4 個(gè)常用的基準(zhǔn)數(shù)據(jù)集,用來測試本文所提算法的分類性能,同時(shí)參與比較的還有文獻(xiàn)[27]中的A-WOCSVM 算法、文獻(xiàn)[31]中的WOCSVM 算法、文獻(xiàn)[32]中的加權(quán)支持向量數(shù)據(jù)描述(Weighted Support Vector Data Description,WSVDD)算法、標(biāo)準(zhǔn)OCSVM 算法、文獻(xiàn)[33]中的局部異常因子(Local Outlier Factor,LOF)算法和文獻(xiàn)[34]中的孤立森林(Isolation FOREST,IFOREST)算法。仿真結(jié)果表明,本文所提算法相較于另6 種算法在分類性能上均有所增強(qiáng)。其次,將LDWOCSVM 和FCLD-WOCSVM 兩種算法用于某型渦軸發(fā)動(dòng)機(jī)故障檢測,實(shí)驗(yàn)結(jié)果表明,本文所提算法能夠構(gòu)建性能較好的分類器,可作為故障檢測的候選算法。本文采用G-mean(Geometric mean)值和AUC(Area Under the Curve)值作為最終的評(píng)價(jià)指標(biāo),兩種指標(biāo)的值越大,則說明故障檢測性能越好。為了減少樣本隨機(jī)選取對(duì)分類結(jié)果的影響,對(duì)每種算法均獨(dú)立運(yùn)行50 次并取其平均值和方差作為最終結(jié)果。如前所述,本文采用高斯核函數(shù)作為非線性映射函數(shù)。核函數(shù)參數(shù)σ和正則化參數(shù)ν通過5 折交叉驗(yàn)證進(jìn)行優(yōu)化,參數(shù)σ和ν的搜索區(qū)間分別為{2-10,2-9,…,2-4}和{10-4,10-3,…,103}。本文仿真實(shí)驗(yàn)是在Intel Core i5-7400 CPU @ 3.00 GHz 的Windows 10上進(jìn)行的,采用Matlab R2017a編程。
3.1.1 仿真設(shè)置
本文選取UCI(University of California Irvine)數(shù)據(jù)集中的4個(gè)常用數(shù)據(jù)集的基本信息在表1中列出。
表1 實(shí)驗(yàn)中使用的4個(gè)UCI數(shù)據(jù)集的基本信息Tab. 1 Fundamental information of 4 UCI datasets used in the experiment
在本次實(shí)驗(yàn)中,對(duì)于每個(gè)數(shù)據(jù)集,將樣本最多的那一類作為正常類,將剩余所有類作為故障類,并且將標(biāo)簽分別改為+1和-1。在正常類中隨機(jī)抽取70%的樣本作為訓(xùn)練集的一部分,在故障類中分別隨機(jī)抽取占整個(gè)訓(xùn)練集5%和10%的樣本作為訓(xùn)練集另一部分,并且將其標(biāo)簽人為改為+1。測試集的樣本構(gòu)成則為剩余的正常樣本和故障樣本。
故障樣本占整個(gè)訓(xùn)練集5%和10%時(shí)所得實(shí)驗(yàn)結(jié)果列于表2。其中,每組實(shí)驗(yàn)的最優(yōu)結(jié)果用黑體標(biāo)出。
3.1.2 結(jié)果分析
由表2 可以看出,在Set 1 和Set 3 兩個(gè)數(shù)據(jù)集上,故障樣本占比10%且使用AUC 指標(biāo)衡量時(shí),LD-WOCSVM 算法的性能最優(yōu),其余情況下,均是FCLD-WOCSVM 算法具有最優(yōu)的性能。以在Set 4 數(shù)據(jù)集上,故障樣本占比10%時(shí)為例,與AWOCSVM算法相比,F(xiàn)CLD-WOCSVM算法的G-mean值提高了12.1%。在Set 3 數(shù)據(jù)集上,故障樣本占比5% 時(shí),與AWOCSVM 算法相比,LD-WOCSVM 算法的AUC 值降低了0.01%,但在使用G-mean 值衡量時(shí),與A-WOCSVM 算法相比,LD-WOCSVM 算法的值增加了0.26%。在Set 1 數(shù)據(jù)集上,故障樣本占比10%時(shí),與A-WOCSVM 算法相比,LDWOCSVM 算法的G-mean 值降低了0.7%,但在使用AUC 值衡量時(shí),與A-WOCSVM 算法相比,LD-WOCSVM 算法的值提高了0.5%。且在其余情況下,LD-WOCSVM 算法的性能均優(yōu)于A-WOCSVM算法的性能。
表2 故障樣本數(shù)占整個(gè)訓(xùn)練集5%或10%時(shí),在4個(gè)UCI數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Tab. 2 Experimental results on 4 UCI datasets when fault samples account for 5%or 10%of the total training set
總而言之,在本文選取的4 個(gè)數(shù)據(jù)集上,與A-WOCSVM、WOCSVM、WSVDD、標(biāo)準(zhǔn)OCSVM、LOF、IFOREST 等算法相比,算法FCLD-WOCSVM 和算法LD-WOCSVM 的性能更優(yōu)。這說明了本文提出的FCLD-WOCSVM 算法和LD-WOCSVM 算法在解決故障檢測問題上的科學(xué)性和有效性。
3.2.1 背景知識(shí)
渦軸發(fā)動(dòng)機(jī)故障主要發(fā)生在壓氣機(jī)、燃?xì)鉁u輪和動(dòng)力渦輪三個(gè)氣路部件處,因此對(duì)這三個(gè)部件進(jìn)行故障檢測尤為重要。本文以T700發(fā)動(dòng)機(jī)為研究對(duì)象,在部件級(jí)數(shù)學(xué)模型的基礎(chǔ)上以性能參數(shù)蛻化一定的量來模擬相應(yīng)的故障。T700 發(fā)動(dòng)機(jī)模型簡圖如圖1 所示,分別用代號(hào)3、42、5 和9 來表示壓氣機(jī)出口截面、燃?xì)鉁u輪出口截面、功率渦輪出口截面以及尾噴管出口截面。在圖1中,GT(Gas Turbine)表示燃?xì)鉁u輪,PT(Power Turbine)表示動(dòng)力渦輪。
圖1 帶狀態(tài)數(shù)的T700渦軸發(fā)動(dòng)機(jī)原理Fig. 1 Principle of T700 turboshaft engine with state number
在參照文獻(xiàn)[35]的基礎(chǔ)上,本文選擇5 個(gè)性能參數(shù):壓氣機(jī)流量WC、燃?xì)鉁u輪流量WTG、壓氣機(jī)效率ηC、燃?xì)鉁u輪效率ηTG、動(dòng)力渦輪效率ηTP。經(jīng)過綜合比較各參數(shù)的測量難易程度,本文選擇11個(gè)傳感器測量參數(shù):壓氣機(jī)出口總溫T3、壓氣機(jī)出口總壓P3、飛行高度H、前飛速度vx、燃油流量Wf、燃?xì)鉁u輪輸出轉(zhuǎn)速PNC、燃?xì)鉁u輪出口總溫T42、燃?xì)鉁u輪出口總壓P42、動(dòng)力渦輪輸出轉(zhuǎn)速PNP、動(dòng)力渦輪出口總溫T5、動(dòng)力渦輪出口總壓P5。本文在全飛行包線范圍內(nèi),穩(wěn)定工況下采集數(shù)據(jù)。限于篇幅,只設(shè)置單一故障模式。各個(gè)性能參數(shù)蛻化量及對(duì)應(yīng)樣本數(shù)列于表3。
表3 性能參數(shù)的主要信息Tab.3 Main information about performance parameters
使用LD-WOCSVM/ FCLD-WOCSVM 算法進(jìn)行渦軸發(fā)動(dòng)機(jī)故障檢測時(shí),其流程可簡述為:
1)獲取渦軸發(fā)動(dòng)機(jī)工作狀態(tài)的數(shù)據(jù)集,劃分?jǐn)?shù)據(jù)集為訓(xùn)練集和測試集。
2)在訓(xùn)練集中,利用5 折交叉驗(yàn)證法求得核函數(shù)參數(shù)σ和正則化參數(shù)ν。
3)從訓(xùn)練集中隨機(jī)抽取部分?jǐn)?shù)據(jù)用于訓(xùn)練模型。利用式(11)/(16)求得權(quán)重,將權(quán)重代入式(4)并利用SMO 算法求解,再利用式(5)求得決策函數(shù)。
4)將測試集中樣本代入決策函數(shù),即可得測試結(jié)果。
3.2.2 參數(shù)設(shè)置
在本次實(shí)驗(yàn)中,根據(jù)采集得到的5 種故障樣本,分別設(shè)計(jì)5 組實(shí)驗(yàn)。由表4 中性能參數(shù)所列順序,將對(duì)應(yīng)的5 組實(shí)驗(yàn)依次命名為Case 1、Case 2、Case 3、Case 4和Case 5。將正常樣本作為正常類,并將其標(biāo)簽改為+1;將5 種故障樣本作為故障類,并將其標(biāo)簽改為-1。對(duì)每組仿真實(shí)驗(yàn),從正常類中隨機(jī)抽取40%的樣本作為訓(xùn)練集的一部分,從對(duì)應(yīng)的故障類中隨機(jī)抽取占比整個(gè)訓(xùn)練集1%的樣本作為訓(xùn)練集另一部分,并將該故障樣本的標(biāo)簽人為改成+1,即:訓(xùn)練集中正常樣本數(shù)為1 320,故障樣本數(shù)為13。測試集的樣本構(gòu)成則為剩余的正常樣本和故障樣本。為了檢驗(yàn)算法在故障樣本占比較高時(shí)的分類性能,本文還設(shè)計(jì)一組故障樣本占比5%時(shí)的仿真實(shí)驗(yàn),此時(shí)訓(xùn)練集中正常樣本數(shù)為1 320,故障樣本數(shù)為69。
故障樣本占整個(gè)訓(xùn)練集1%和5%時(shí)的實(shí)驗(yàn)結(jié)果列于表4,其中,每組實(shí)驗(yàn)的最優(yōu)結(jié)果用黑體標(biāo)出。在這一部分,選取了4 個(gè)對(duì)比算法:文獻(xiàn)[27]中的A-WOCSVM 算法、文獻(xiàn)[31]中的WOCSVM 算法、文獻(xiàn)[32]中的WSVDD 算法以及標(biāo)準(zhǔn)OCSVM算法。
表4 故障樣本數(shù)占整個(gè)訓(xùn)練集1%或5%時(shí),在渦軸發(fā)動(dòng)機(jī)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Tab. 4 Experimental results on turbo shaft engine datasets when fault samples account for 1%or 5%of the total training set
3.2.3 結(jié)果分析
由表4可以看出,對(duì)比算法WSVDD 的性能最差。無論是用AUC 還是G-mean 來度量,所得結(jié)果均小于0.5,說明該算法不適合用來解決渦軸發(fā)動(dòng)機(jī)故障檢測問題。
由表4還可以看出,在Case 1數(shù)據(jù)集中:使用AUC 值作指標(biāo)時(shí)FCLD-WOCSVM 算法的性能最優(yōu),使用G-mean值作指標(biāo)時(shí)LD-WOCSVM 算法性能最優(yōu),且本文所提出的兩種算法的性能均優(yōu)于對(duì)比算法A-WOCSVM。在Case 2 數(shù)據(jù)集中:故障樣本占比1% 時(shí)FCLD-WOCSVM 算法的性能最優(yōu),AWOCSVM 算法性能次優(yōu);故障樣本占比5%時(shí)LD-WOCSVM算法的性能最優(yōu),F(xiàn)CLD-WOCSVM 算法的性能次優(yōu)。在Case 3 數(shù)據(jù)集上:故障樣本占比1%且使用AUC 指標(biāo)衡量時(shí),LDWOCSVM 算法性能最優(yōu),其余情況下均是FCLD-WOCSVM 算法的性能最優(yōu)。在Case 4 數(shù)據(jù)集中:故障樣本占比5%時(shí)FCLD-WOCSVM 算法性能最優(yōu);占比1%時(shí)FCLD-WOCSVM算法的性能次優(yōu)。在Case 5 數(shù)據(jù)集中:故障樣本占比5%時(shí)WOCSVM 算法性能最優(yōu);其余情況下,算法LD-WOCSVM 性能最優(yōu)。從統(tǒng)計(jì)角度看,5個(gè)數(shù)據(jù)集,2種指標(biāo)和2種故障樣本比例一共20 種情況,其中:算法FCLD-WOCSVM 性能最優(yōu)的次數(shù)為9,次優(yōu)的次數(shù)為10;算法LD-WOCSVM 性能最優(yōu)的次數(shù)為9,次優(yōu)的次數(shù)為2;算法A-WOCSVM 性能最優(yōu)的次數(shù)為0,次優(yōu)的次數(shù)為2;算法WOCSVM 性能最優(yōu)的次數(shù)為1,次優(yōu)的次數(shù)為3;算法OCSVM 性能最優(yōu)的次數(shù)為1,次優(yōu)的次數(shù)為3。
從以上分析可以看出,在發(fā)動(dòng)機(jī)故障檢測方面,算法FCLD-WOCSVM 性能最優(yōu),算法LD-WOCSVM 性能次優(yōu),而對(duì)比算法A-WOCSVM 和WSVDD的性能最差。這進(jìn)一步說明了本文所提算法FCLD-WOCSVM 和算法LD-WOCSVM 可以作為渦軸發(fā)動(dòng)機(jī)故障檢測的兩種候選算法。
本文通過在算法A-WOCSVM 的基礎(chǔ)上提出兩種改進(jìn)算法:FCLD-WOCSVM 和LD-WOCSVM,并將其運(yùn)用在渦軸發(fā)動(dòng)機(jī)故障檢測方面,可得以下結(jié)論:
1)使用馬氏距離來選取每個(gè)樣本對(duì)應(yīng)的k近鄰樣本,再通過計(jì)算樣本與局部密度中心而不是全局密度中心的距離提出的LD-WOCSVM 算法,能夠使訓(xùn)練的分類器更精確地描述數(shù)據(jù)樣本邊界,分類效果更好。
2)通過對(duì)一種快速聚類分析算法進(jìn)行改進(jìn),使該算法能更準(zhǔn)確地識(shí)別故障數(shù)據(jù),進(jìn)而計(jì)算出更合適的權(quán)重而提出的FCLD-WOCSVM 算法,能夠最大限度地降低故障數(shù)據(jù)對(duì)分類邊界的影響,使得分類精度得到進(jìn)一步的提高。
3)將算法FCLD-WOCSVM 和LD-WOCSVM 運(yùn)用于渦軸發(fā)動(dòng)機(jī)故障檢測中,仿真實(shí)驗(yàn)表明,兩種算法能夠構(gòu)建精度較高的分類器,可以作為故障檢測的候選算法。