宮文峰,陳 輝,WANG Danwei,張澤輝,高海波
(1.武漢理工大學(xué) 高性能船舶技術(shù)教育部重點實驗室仿真中心,湖北 武漢 430063;2.桂林電子科技大學(xué)北海校區(qū) 海洋工程學(xué)院,廣西 北海 536000;3.南洋理工大學(xué) 電子與電氣工程學(xué)院ST Engineering-NTU聯(lián)合實驗室,新加坡 639798)
近十年來,我國在國產(chǎn)航空母艦、新型戰(zhàn)略核潛艇、高能電磁炮和新一代電力推進(jìn)系統(tǒng)等尖端裝備研制方面取得了突破性進(jìn)展,中國已成為世界第一造船大國,也是全球第一航運大國[1-2]。艦船是保障國家海洋主權(quán)和實現(xiàn)“海洋強國夢”的重要載體,如今,隨著新一代船舶朝著智能化、綠色化和新能源方向快速發(fā)展,由電力推進(jìn)替代傳統(tǒng)的機械推進(jìn)方式成為高技術(shù)船舶重要的發(fā)展趨勢[3-4]。相比傳統(tǒng)的機械推進(jìn),電力推進(jìn)具有更好的操控性、輕量化和低噪音,更便于快速機動和緊急靜默,且具有節(jié)能環(huán)保和“零排放”的優(yōu)點,目前已成為多數(shù)海洋強國發(fā)展的重點方向[5-6]。通常,電力推進(jìn)船可由燃料電池、超級電容、太陽能電池、風(fēng)力發(fā)電機、柴油發(fā)電機以及核能發(fā)電機組等多種方式提供電能,由于電源形式多樣,為實現(xiàn)交叉組網(wǎng)和能量變換,電力變換器在船舶電力系統(tǒng)中發(fā)揮著極其重要的作用[6-7]。船舶在復(fù)雜的海況環(huán)境下航行時,受風(fēng)、浪、流等影響,變換器需要根據(jù)負(fù)載和用電需求頻繁變化,且由于長時間承受過壓、過流、過熱、頻繁變載以及潮濕和腐蝕等影響而易于發(fā)生各種故障[8]。電氣故障不同于一般的機械故障,其初始特征模糊不明顯,故障升級速度快,一旦電力變換器發(fā)生故障,若處理不及時,輕則造成元器件損毀、電力系統(tǒng)波動或失衡,重則造成整個電網(wǎng)的癱瘓或系統(tǒng)崩潰,甚至帶來人員傷亡[9-10]。因此,開展電力變換器早期故障的快速智能診斷和預(yù)警方法研究極為必要,目前已成為業(yè)內(nèi)學(xué)者研究的重點[11-15]。
目前,國內(nèi)外學(xué)者針對電氣設(shè)備故障診斷的研究方法主要有專家系統(tǒng)法[12]、電流檢測法[13]、電壓檢測法[14]、解析模型法[15]、故障樹法[16]和基于智能算法的方法[17]。上述方法雖然得到了一定應(yīng)用,但仍存在一些不足?;谀P偷姆椒ㄍǔP枰⒕珳?zhǔn)的數(shù)學(xué)模型描述故障問題,該方法建模復(fù)雜,適用于處理特定問題,其通用性和遷移能力較差[18]?;趯<蚁到y(tǒng)定性分析的診斷方法需要根據(jù)專家經(jīng)驗,建立用于診斷的知識庫、規(guī)則庫和推理機,其診斷的準(zhǔn)確度取決于專家經(jīng)驗和知識庫的完備程度,且該方法難以處理微小故障和特征模糊的故障問題[19]。近年來,隨著機器學(xué)習(xí)研究的不斷興起,基于支持向量機(Support Vector Machine, SVM)、極限學(xué)習(xí)機(Extreme Learning Machine, ELM)、K近鄰法(K-Nearest Neighbor, KNN)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)等智能算法已被廣泛應(yīng)用于故障診斷中[19-21]。然而,此類淺層機器學(xué)習(xí)算法采用了較為簡單的模型結(jié)構(gòu),其較差的特征提取能力難以直接從原始故障數(shù)據(jù)中辨識微小的故障特征[18]。為此,業(yè)內(nèi)學(xué)者通常首先運用諸如經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)[20]、小波變換(Wavelet Transform, WT)[22]、快速傅里葉變換(Fast Fourier Transform, FFT)[23]和統(tǒng)計特征[24]等傳統(tǒng)的特征提取方法,根據(jù)經(jīng)驗對原始故障數(shù)據(jù)進(jìn)行特征提取和特征選擇,然后再將精選的主要特征輸入到淺層機器學(xué)習(xí)算法中,完成最終的故障分類[18],此類組合方法雖然取得了一定效果,但是采用EMD、FFT和WT等方法人工提取的特征往往依賴于工程師憑經(jīng)驗和專業(yè)知識完成,存在較大的主觀和盲目性,診斷效果很大程度上取決于技術(shù)人員的經(jīng)驗水平,并且很多反映早期故障的微小特征很難被捕捉和提取,不利于早期電氣故障的快速診斷[24-25]。
近5年來,深度學(xué)習(xí)技術(shù)在模式識別領(lǐng)域取得了舉世矚目的成效,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)作為一種典型的深度學(xué)習(xí)算法,因其強大的特征提取能力和非線性映射能力,可以直接從原始數(shù)據(jù)中提取代表特征,從而避免了傳統(tǒng)智能診斷方法中需要采用多種信號處理方法根據(jù)專家經(jīng)驗提取特征的繁瑣操作[26],CNN相比傳統(tǒng)的淺層機器學(xué)習(xí)算法在模式分類性能上具有顯著的優(yōu)勢,目前已得到故障診斷業(yè)內(nèi)學(xué)者的廣泛關(guān)注[23-25]。WANG等[23]提出一種基于FFT和多層CNN相結(jié)合的方法,用于電動機故障診斷,但是該方法仍然需要使用傳統(tǒng)的FFT方法對原始數(shù)據(jù)提取頻譜特征;WEN等[28]提出一種4層的CNN算法,并直接采用原始時域信號進(jìn)行故障診斷,進(jìn)而改進(jìn)了WANG等[23]方法的不足,然而該算法仍然包含了一個具有3層隱含層的全連接網(wǎng)絡(luò)層(Fully Connected, FC)作為最終分類層,存在巨大的訓(xùn)練參數(shù)量,從而導(dǎo)致模型的訓(xùn)練時間和測試時間較長,不利于電氣類故障的快速診斷。
針對以上不足,本文提出一種基于改進(jìn)的CNN-GAP-SVM的深度學(xué)習(xí)新算法,用于電力變換器的快速故障診斷。首先,該方法采用數(shù)據(jù)重構(gòu)的方法將原始的一維時間序列故障數(shù)據(jù)轉(zhuǎn)變?yōu)槎S特征圖訓(xùn)練樣本;其次,設(shè)計了一個維度自適應(yīng)的全局均值池化層(Global Average Pooling, GAP)代替?zhèn)鹘y(tǒng)CNN中的2~3層的全連接層結(jié)構(gòu),從而減少了診斷模型的總參數(shù)量和診斷時間;然后,在模型的測試階段設(shè)計了一個非線性SVM代替?zhèn)鹘y(tǒng)CNN中的Softmax分類器,從而進(jìn)一步提升診斷準(zhǔn)確率。本文所提出的方法可直接對電力變換器的原始輸出信號進(jìn)行特征自動提取,診斷結(jié)果和誤分類信息自動輸出,端到端的算法結(jié)構(gòu)無需任何人工特征提取操作。經(jīng)DC-DC變換器的故障診斷實驗表明,所提方法相比傳統(tǒng)的智能診斷方法具有更高的診斷準(zhǔn)確率和更快的診斷速度。
CNN是一種特殊的前饋式深度學(xué)習(xí)算法[18],具有強大的特征提取能力,目前主要應(yīng)用于圖像識別和自然語言處理領(lǐng)域[29]。CNN不同于傳統(tǒng)的全連接式BP(back propagation)神經(jīng)網(wǎng)絡(luò),它通過采用卷積和池化兩種特殊的操作算子模擬動物視覺系統(tǒng)的工作原理[25],并引入稀疏式連接和參數(shù)權(quán)共享機制在時間和空間上降維采樣以精減數(shù)據(jù)維度,極大地減少了模型參數(shù)量[29]。CNN通過構(gòu)建多個虛擬神經(jīng)元濾波器,從輸入圖像中逐層提取代表特征,其強大的非線性特征映射能力具備辨識微小故障的潛力[18],如圖1所示為卷積神經(jīng)網(wǎng)絡(luò)的基本架構(gòu)[25]。
如圖1所示,傳統(tǒng)的CNN主要由卷積層、池化層、全連接層和Softmax分類器組成[29]。卷積層和池化層用于提取和篩選圖像特征,全連接層用于進(jìn)一步提取池化層的輸出特征,Softmax層將全連接層的輸出作歸一化處理,使其符合概率分布[23]。經(jīng)過大量的實驗研究發(fā)現(xiàn),該類應(yīng)用于計算機視覺領(lǐng)域的傳統(tǒng)CNN算法若直接應(yīng)用于電氣故障診斷中應(yīng)注意以下3點問題:
(1) 電氣故障診斷不同于圖像識別和語音識別任務(wù),電氣故障診斷的關(guān)鍵在于快速辨識早期微小故障特征與正常狀態(tài)的區(qū)別,并非目標(biāo)匹配,因此,主流的VGGNet、GoogleNet 和ResNet等復(fù)雜模型并不適合直接遷移應(yīng)用在電氣故障診斷領(lǐng)域問題中。
(2) 傳統(tǒng)CNN模型中2~3層的全連接層結(jié)構(gòu)帶入了過多的訓(xùn)練參數(shù)量,該部分占據(jù)了CNN總參數(shù)量的80%~90%[30],過多的訓(xùn)練參數(shù)不僅容易引起訓(xùn)練過擬合,還將導(dǎo)致增加模型的訓(xùn)練難度和測試時間,不利于電氣故障的快速診斷。
(3) 傳統(tǒng)CNN模型中通常采用Softmax函數(shù)作為分類器,而Softmax實質(zhì)上只是將全連接層輸出結(jié)果轉(zhuǎn)變?yōu)榉细怕史植嫉暮唵巫儞Q[23],并沒有為CNN的診斷性能提高帶來任何幫助,因此,難以進(jìn)一步提升最終的診斷準(zhǔn)確率。
針對傳統(tǒng)CNN和現(xiàn)有淺層智能診斷算法的不足,結(jié)合電力變換器對故障診斷的快速實時性要求,本文提出一種改進(jìn)的CNN-GAP-SVM新算法,用于電力變換器IGBT開路故障的快速診斷,其框架結(jié)構(gòu)如圖2所示。該診斷框架包含3個模塊:最上層為故障診斷的結(jié)果輸出及可視化模塊,最底層為故障數(shù)據(jù)采集模塊,中間層為提出的CNN-GAP-SVM診斷算法模塊。該算法主要由輸入層、特征提取層、GAP層和SVM輸出層組成。原始的電力變換器故障監(jiān)測數(shù)據(jù)直接輸入到模型輸入層進(jìn)行數(shù)據(jù)處理,特征提取層自動進(jìn)行特征提取和稀疏處理等操作,GAP層自動完成維度變換和參數(shù)量壓縮和精減,最終的診斷結(jié)果和誤分類信息由SVM分類器自動輸出,“端到端”的算法結(jié)構(gòu)無需依照專家經(jīng)驗對原始數(shù)據(jù)做任何的手工特征提取和特征選擇操作,具有良好的可操作性和通用性。
本文提出的算法將CNN強大的特征提取能力和SVM優(yōu)越的多分類功能相結(jié)合,主要改進(jìn)包括以下兩個方面:①為了改善傳統(tǒng)CNN模型中因2~3層的全連接層所產(chǎn)生的巨大參數(shù)量而導(dǎo)致模型的訓(xùn)練時間和測試時間過長的不足,所提算法中設(shè)計了一個具有維度自適應(yīng)的全局均值池化層代替該全連接層部分,從而有效減少了CNN模型的總參數(shù)量、訓(xùn)練時間和診斷時間,GAP層可自動地根據(jù)特征提取層的輸出維度與輸出層的輸入維度之間進(jìn)行銜接和維度變換,實現(xiàn)網(wǎng)絡(luò)層間的連接和特征傳遞;②為了進(jìn)一步提升診斷準(zhǔn)確率,該方法在輸出層中設(shè)計了一個n分類的非線性SVM代替?zhèn)鹘y(tǒng)CNN中的Softmax分類器,最終的診斷結(jié)果由SVM分類器輸出,所提方法既可以提高診斷速度又能進(jìn)一步提升診斷準(zhǔn)確率。如圖3所示為所提算法的診斷流程圖,該診斷方法的基本流程和步驟如下:
步驟1采集DC-DC電力變換器的輸出信號數(shù)據(jù),如輸出電壓信號或電流信號。
步驟2將原始的故障監(jiān)測數(shù)據(jù)輸入到診斷模型中,輸入層將自動對原始一維時間序列數(shù)據(jù)進(jìn)行必要的數(shù)據(jù)處理,主要包括噪音濾波、數(shù)據(jù)規(guī)范化、數(shù)據(jù)重構(gòu)和二維特征圖訓(xùn)練樣本生成等。
步驟3數(shù)據(jù)集劃分。將所有數(shù)據(jù)集樣本隨機劃分為訓(xùn)練集、驗證集和測試集。
步驟4建立CNN-GAP-SVM診斷模型,初始化模型訓(xùn)練參數(shù)值。
步驟5執(zhí)行模型的訓(xùn)練、驗證和測試,將訓(xùn)練數(shù)據(jù)集輸入到建立的CNN-GAP-SVM診斷模型進(jìn)行模型訓(xùn)練,訓(xùn)練過程中采用梯度下降反向傳播算法進(jìn)行參數(shù)更新,訓(xùn)練過程中實時調(diào)用驗證集數(shù)據(jù)對損失誤差和準(zhǔn)確率進(jìn)行驗證,考察過擬合和收斂情況;在給定的迭代次數(shù)內(nèi),如果模型的準(zhǔn)確率和損失值達(dá)到要求,則執(zhí)行步驟6,否則轉(zhuǎn)步驟4修改模型進(jìn)行調(diào)參,依次循環(huán),最后保存最佳的CNN-GAP-SVM模型超參數(shù)和權(quán)重。
步驟6最后,將測試集數(shù)據(jù)輸入到訓(xùn)練好的CNN-GAP-SVM模型中,輸出電力變換器的故障診斷結(jié)果。
在提出的CNN-GAP-SVM算法中,訓(xùn)練過程包含前向傳播計算和誤差反向傳播兩個過程。
2.1.1 輸入層(Input Layer, IL)
輸入層是一個具有數(shù)據(jù)格式化處理功能的接口層,主要用于接收原始數(shù)據(jù),并對其進(jìn)行噪音濾波、數(shù)據(jù)歸一化和格式標(biāo)準(zhǔn)化處理,從而產(chǎn)生CNN模型可識別的二維特征圖訓(xùn)練樣本。通常,電力變換器的實際監(jiān)測信號中會摻雜一些噪音干擾,這些噪音多為高頻信號,且與正常和故障狀態(tài)時的信號波形具有明顯的差異性,為提高信號質(zhì)量,在采集系統(tǒng)中可提前設(shè)置濾波方法濾除噪音[31]。由于CNN要求的數(shù)據(jù)格式是二維圖像數(shù)據(jù)[29],然而,在故障監(jiān)測系統(tǒng)中采集到的原始數(shù)據(jù)是一些雜亂無序的一維時間序列數(shù)據(jù),這些數(shù)據(jù)無法被CNN診斷模型直接使用,為符合CNN算法對訓(xùn)練樣本二維圖像的格式要求,本文采用數(shù)據(jù)重構(gòu)[18]的方法將采集的原始一維時間序列數(shù)據(jù)轉(zhuǎn)變?yōu)槎S圖像格式,用于CNN的訓(xùn)練和測試,其數(shù)據(jù)重構(gòu)方法如圖4所示。
2.1.2 特征提取層(Feature Extraction Layer, FEL)
特征提取層是CNN-GAP-SVM算法的關(guān)鍵,主要用于故障特征的深度提取,由多個依次堆疊的卷積層和池化層組成。
(1) 卷積層 (Convolution Layer, CL)
卷積運算是CNN的核心模塊,它采用矩形的卷積核遍歷輸入特征圖上的每一個元素,輸入特征圖與卷積核相重合區(qū)域內(nèi)對應(yīng)點相乘后求和,再加上偏置,得到輸出特征圖中的一個值[25]。卷積操作的數(shù)學(xué)表達(dá)如式(1)所示[23]:
Xi=f(Wi?Xi-1+Bi)。
(1)
式中:?表示卷積運算符;Xi-1為輸入特征圖;Xi為輸出特征圖;Wi為卷積核權(quán)重;Bi為偏置;f(·)為激活函數(shù),在CNN中常用ReLU[29]作為激活函數(shù),其數(shù)學(xué)表達(dá)式為:
f(x)=max(0,x),x∈(-∞,+∞)。
(2)
(2) 池化層(Pooling Layer, PL)
池化層位于卷積層之后,主要作用是對卷積運算后得到的輸出特征圖進(jìn)行降維減參[25]。常用的池化操作主要有最大池化和均值池化[29]。在CNN中最常用的是最大池化,其數(shù)學(xué)表達(dá)式[18]為:
(3)
式中:Pi為最大池化后的輸出特征圖;Xi(tx,y)為輸出特征圖的第tx,y個像素值;S和H分別為池化窗的寬度和高度;max(·)表示取最大值。
2.1.3 全局均值池化層(GAP)
為達(dá)到電氣故障快速診斷的目的,本文算法中設(shè)計了一個具有維度自適應(yīng)的全局均值池化層來代替?zhèn)鹘y(tǒng)CNN模型中2~3層的全連接網(wǎng)絡(luò)層部分,該GAP層可根據(jù)CNN的輸出維度和故障類別數(shù)自適應(yīng)地調(diào)整GAP匹配參數(shù)。通過GAP操作,CNN可有效減少模型的參數(shù)量達(dá)90%以上,從而提高故障診斷的速度。在所提方法中,該GAP層的結(jié)構(gòu)設(shè)計為一個[m,a×b,n]的張量矩陣,其中m表示輸入GAP層的特征圖通道數(shù),a×b表示前一層網(wǎng)絡(luò)輸入給GAP層的特征圖尺寸,n表示GAP層的全局均值池化核的數(shù)量,對應(yīng)n個故障類別。在本算法設(shè)計中,當(dāng)任意一張?zhí)卣鲌D輸入GAP層時,GAP層會自動匹配GAP池化核的個數(shù)和維度。對于n分類問題,GAP層將采用n個全局均值池化核對輸入GAP層的特征圖執(zhí)行全局均值池化操作,每個GAP池化核的尺寸設(shè)計為與被池化的特征圖尺寸完全相同,并對池化核內(nèi)[a×b]的所有元素值計算一個全局平均值作為最終代表特征值[25],最后n個GAP池化核計算得到n個與傳統(tǒng)CNN的全連接層效果一樣的值,GAP操作的數(shù)學(xué)表達(dá)式為:
(4)
2.1.4 SVM輸出層
SVM是最早由VAPNIK等[32]根據(jù)統(tǒng)計學(xué)習(xí)理論提出的具有嚴(yán)謹(jǐn)數(shù)學(xué)推理的經(jīng)典二分類模型,在解決小樣本和多分類等任務(wù)中,SVM相比傳統(tǒng)CNN中的Softmax末端分類函數(shù)具有更加優(yōu)越的分類性能[33]。為進(jìn)一步提升診斷的準(zhǔn)確性,在所提算法中使用非線性的SVM代替Softmax函數(shù)作為最終分類器。 SVM將GAP層輸出的稀疏特征數(shù)據(jù)作為輸入,通過使用核技巧和軟間隔最大化,在高維特征空間里構(gòu)建最大軟間隔分離超平面,完成最終的分類,SVM的數(shù)學(xué)模型[34]為:
(5)
式中w和b為優(yōu)化參數(shù),通過調(diào)整w和b,使目標(biāo)函數(shù)最小化,從而得到最大軟間隔分離超平面。本文采用高斯徑向基核函數(shù),構(gòu)建的分類決策函數(shù)[18]可表示為:
(6)
本文采用誤差BP算法[29]進(jìn)行模型訓(xùn)練和參數(shù)更新,并使用Adam自適應(yīng)學(xué)習(xí)率梯度下降法[25]調(diào)整各層之間的參數(shù)。為了有效執(zhí)行BP計算,在訓(xùn)練過程中先采用Softmax函數(shù)對GAP層的輸出結(jié)果執(zhí)行歸一化操作,再將歸一化后的結(jié)果與該樣本對應(yīng)的真實標(biāo)簽相比較即可計算得到誤差損失值。本算法使用了交叉熵?fù)p失函數(shù),其數(shù)學(xué)表達(dá)式[18]為:
(7)
(8)
(9)
式中:w′和b′分別為更新后的權(quán)重和偏置;w和b為當(dāng)前的權(quán)重和偏置;η∈(0,1)為學(xué)習(xí)率。訓(xùn)練的過程即不斷調(diào)整w和b,以最小化J(w)。
為驗證改進(jìn)的CNN-GAP-SVM診斷算法的有效性和準(zhǔn)確性,本實驗以某新型電動船的某隔離型三相全橋式雙向DC-DC變換器作為實驗對象。
隔離型雙向DC-DC變換器是電力推進(jìn)船中重要的功能部件,其具有電力變換效率高、輸出形式多樣、穩(wěn)壓范圍寬和能夠適應(yīng)高/低壓變換的特點,目前在新能源電動船舶上應(yīng)用廣泛,其工作原理如圖5所示[35]。該變換器的三相全橋式結(jié)構(gòu)由3個單相雙半橋DC-DC結(jié)構(gòu)組成,三相之間以120°相位交錯工作,其輸入側(cè)和輸出側(cè)之間設(shè)置有高頻變壓器,能夠?qū)崿F(xiàn)良好的電氣隔離,通過合適的變壓器匝比設(shè)計可以匹配不同的電壓等級,拓寬了升、降壓范圍[36]。作者團隊采用MATLAB Simulink軟件搭建了該DC-DC變換器的仿真模型,如圖6所示。該模型包括一個100 V的直流電源,高頻變壓器的主側(cè)和次側(cè)分別由功率開關(guān)器件G1~G6和G7~G12組成全橋整流電路,低壓側(cè)與高壓側(cè)之間的升壓比為1∶4,其主要參數(shù)如表1所示。
表1 隔離型雙向DC-DC變換器模型參數(shù)
根據(jù)國內(nèi)外相關(guān)研究,電力變換器故障多數(shù)是由主電路上的功率開關(guān)器件損壞引起的,尤其是以逆變電路上的高頻率絕緣柵雙極型晶體管(Insulated Gate Bipolar Transistor, IGBT)開路故障居多,約占所有故障的38%[10-11]。IGBT在高頻次狀態(tài)下工作,其損耗大、發(fā)熱嚴(yán)重,最易出現(xiàn)故障失效,主要類型有開關(guān)短路故障(Short-Circuit Fault, SCF)和開關(guān)開路故障(Open-Circuit Fault, OCF)[37]。短路故障往往伴隨著瞬間毀壞性大電流,針對短路故障,DC-DC變換器一般設(shè)有過流檢測電路,一旦出現(xiàn)過流將會在微秒間切斷供電并觸發(fā)故障警報[13]。相對于SCF而言,開路故障發(fā)生時電網(wǎng)系統(tǒng)仍能繼續(xù)工作,由于早期的IGBT開路故障外部表現(xiàn)很微弱、故障特征不明顯,其量級并不容易激活電網(wǎng)系統(tǒng)的保護(hù)程序[37],使得該故障很難被人工早期發(fā)現(xiàn),若IGBT的開路故障處理不及時,將會快速影響其他IGBT產(chǎn)生過流,導(dǎo)致從微小故障快速轉(zhuǎn)變?yōu)橹卮箫@著故障。因此,本實驗重點討論電力變換器的單個IGBT發(fā)生開路故障時的快速診斷方法。
本實驗直接采用DC-DC變換器的末端輸出電壓信號原始數(shù)據(jù)作為診斷模型的實驗數(shù)據(jù)??紤]到每一個IGBT出現(xiàn)故障的可能性,本實驗依次采集12個IGBT出現(xiàn)開路故障時的數(shù)據(jù),從而得到12種故障狀態(tài)和1個正常狀態(tài)數(shù)據(jù)集。故障數(shù)據(jù)采樣頻率為24 kHz,每個狀態(tài)采集25 s,共計60萬個數(shù)據(jù)點,每種故障劃分為1 000個樣本段,每個樣本包含600個數(shù)據(jù)點,13種狀態(tài)共有13 000個樣本。按照圖4所示的數(shù)據(jù)重構(gòu)方法,將每一個形狀為[600,1]的序列樣本轉(zhuǎn)變?yōu)閇30, 20, 1]的二維特征圖格式,其中1表示1通道,因此每類故障狀態(tài)有1 000個輸入特征圖樣本。本實驗對每類故障的1 000個樣本隨機取出70%作為訓(xùn)練數(shù)據(jù)集,剩余30%作為測試數(shù)據(jù)集,在訓(xùn)練數(shù)據(jù)集中隨機取出20%作為驗證數(shù)據(jù)集,因此,總的測試集樣本為3 900個,最終的DC-DC變換器的故障數(shù)據(jù)集描述如表2所示。如圖7所示為變換器IGBT1~I(xiàn)GBT6依次出現(xiàn)開路故障時的輸出電壓波形,由圖7可知,不同故障之間波形極其相似。
表2 DC-DC變換器開路故障數(shù)據(jù)集
(1)模型建立
建立合適的CNN-GAP-SVM模型拓?fù)浣Y(jié)構(gòu)和選擇合理的模型超參數(shù)對故障診斷效果的影響至關(guān)重要,本實驗經(jīng)過多次反復(fù)計算,對激活函數(shù)、優(yōu)化器、學(xué)習(xí)率、卷積核與池化核等超參數(shù)進(jìn)行了調(diào)試,最終建立了故障診斷準(zhǔn)確率相對最優(yōu)的模型結(jié)構(gòu),如圖8所示,其詳細(xì)超參數(shù)如表3所示。由圖8和表3可以看出,本模型包含2個卷積層,原始輸入特征圖經(jīng)過第一個卷積層操作后輸出為64個特征圖,在經(jīng)過第二個卷積層操作后輸出為13個特征圖(對應(yīng)13個類別),在第二個卷積層后設(shè)置了全局均值池化層,最后由分類輸出層完成故障的分類。
從表3可以看出,整個模型的總參數(shù)量僅為8 323個,若采用傳統(tǒng)CNN模型,假設(shè)有2個隱含層,第1隱含層節(jié)點為128,第2節(jié)點為13,由于CNN特征提取層的輸出為[12, 7, 13],則需要通過Flatten函數(shù)將其拉直展成為一維序列才能輸入到全連接層,即拉直后的序列長度為12×7×13=1092,此處全連接層為3層,其神經(jīng)元節(jié)點為1092-128-13,3層的全連接層產(chǎn)生的總參數(shù)量高達(dá)149 722個,比提出的CNN-GAP-SVM算法總參數(shù)量多了近18倍之多。因此,提出的CNN-GAP-SVM算法可以極大地減少模型訓(xùn)練參數(shù)量,從而有效減少計算時間,提高了故障診斷的速度,兩者參數(shù)量對比如表4所示。
表3 建立的CNN-GAP-SVM故障診斷模型參數(shù)表
續(xù)表3
表4中各網(wǎng)絡(luò)層的參數(shù)量計算方法[25]如下:
(10)
式中:CNNnum為卷積層的參數(shù)個數(shù);DBNnum為全連接層的參數(shù)個數(shù);Knum為卷積核的個數(shù),即輸出通道數(shù);kheight為卷積核的高度尺寸;kwidth為卷積核的寬度尺寸;Inum為輸入卷積層的數(shù)據(jù)通道數(shù);Bnum為卷積層的偏置參數(shù)個數(shù);Ninput為全連接層輸入?yún)?shù)的維度數(shù),即輸入網(wǎng)絡(luò)節(jié)點數(shù);Noutput為全連接輸出結(jié)點的個數(shù)。
表4 模型訓(xùn)練參數(shù)量對比表
(2)故障診斷結(jié)果分析
根據(jù)上述工作,將表2所示的故障數(shù)據(jù)集輸入表3所示的CNN-GAP-SVM模型中進(jìn)行訓(xùn)練。本實驗采用Adam優(yōu)化器,mini-batch為128,學(xué)習(xí)率自適應(yīng)調(diào)整,循環(huán)迭代次數(shù)為50,其準(zhǔn)確率與損失下降曲線如圖9所示,經(jīng)過反復(fù)調(diào)參,SVM的最終超參數(shù)設(shè)置為懲罰系數(shù)C=10、高斯徑向基核函數(shù)、松弛變量ξ=0.1,最終的故障診斷結(jié)果和運行時間如表5所示。本文引入了精確率和召回率[18]對最終故障診斷結(jié)果進(jìn)行評估,在表5中,左側(cè)為傳統(tǒng)CNN算法的診斷結(jié)果,右側(cè)為改進(jìn)CNN-GAP-SVM診斷的結(jié)果,可以看出:所提方法的F1均值診斷準(zhǔn)確率已從傳統(tǒng)CNN方法的98.82%提升至100%。
從表5可以看出,提出的CNN-GAP-SVM性能明顯優(yōu)于CNN-softmax算法,在準(zhǔn)確率方面,傳統(tǒng)的CNN-softmax模型對3 900個測試樣本的分類準(zhǔn)確率為98.82%,而改進(jìn)的CNN-GAP-SVM算法的診斷準(zhǔn)確率已高達(dá)100%,由此可見SVM發(fā)揮的作用尤其明顯。在訓(xùn)練時間方面,傳統(tǒng)CNN-softmax算法對7 280個訓(xùn)練集樣本的訓(xùn)練時間為548.79 s,而改進(jìn)的CNN-GAP-SVM算法訓(xùn)練時間為476.49 s。在測試時間方面,傳統(tǒng)CNN-softmax算法對3 900個測試樣本的測試時間為2.021 s,而改進(jìn)CNN-GAP-SVM算法的總測試時間僅為1.541 s,減少23.7%的診斷時間,這對電氣故障的快速診斷極為重要。為進(jìn)一步量化診斷模型正確分類和誤分類的數(shù)量和位置,本文引入多分類混淆矩陣[25]對表5所示的診斷結(jié)果進(jìn)行量化,如圖10所示。
表5 故障診斷結(jié)果評估
在圖10中:每一類故障的測試集樣本數(shù)為300個,共13類工作狀態(tài);主對角線上的數(shù)字代表了CNN-GAP-SVM算法對每一類故障狀態(tài)正確診斷的樣本個數(shù)。如圖10a所示為傳統(tǒng)CNN-Softmax的診斷結(jié)果,可以看出,3 900個樣本中有46個樣本出現(xiàn)錯判,其中有14個IGBT1開路故障被誤判為IGBT5開路故障,有2個故障1被誤判為故障7,有30個故障7被誤判為故障10。如圖10b所示為CNN-GAP-SVM診斷的結(jié)果,沒有樣本被誤判,診斷準(zhǔn)確率高達(dá)100%。實驗表明,本文提出的CNN-GAP-SVM方法在保證100%準(zhǔn)確率的前提下具備更快的診斷速度和更好的診斷性能。
卷積神經(jīng)網(wǎng)絡(luò)具備強大的深度特征自動提取能力,然而CNN一直被當(dāng)作黑箱子來對待。為進(jìn)一步說明CNN-GAP-SVM模型的不同網(wǎng)絡(luò)層級對故障特征的提取效果,本實驗引入流形學(xué)習(xí)中最常用的t-SNE[18]技術(shù)對CNN各層提出的特征數(shù)據(jù)進(jìn)行降維可視化。本實驗以測試集的3 900個原始故障樣本為輸入,采用t-SNE降維至三維進(jìn)行可視化輸出,如圖11所示。如圖11a所示為原始故障樣本分布,圖11b為經(jīng)過第1卷積層特征提取后的故障樣本分布,圖11c為Softmax層輸出的故障樣本,圖11d為SVM分類后的數(shù)據(jù)分布。從圖11a~圖11d看出,原始數(shù)據(jù)分布散亂無序,經(jīng)過第1卷積層、第2卷積層和全局均值池化層處理后的故障樣本逐步聚集在一起,在圖11c所示的Softmax層中,樣本數(shù)據(jù)仍有部分誤分類,這與診斷結(jié)果相吻合;在圖11d所示的SVM輸出層,所有樣本被準(zhǔn)確的區(qū)分,各自聚集在一起,得到13個樣本群。由此可見,本文提出的CNN-GAP-SVM算法對原始故障數(shù)據(jù)逐層自動特征提取的效果十分顯著。
為進(jìn)一步驗證本文提出的CNN-GAP-SVM算法智能診斷的優(yōu)越性,本實驗將提出的方法與當(dāng)前主流的支持向量機(SVM)、K近鄰(KNN)和深度BP神經(jīng)網(wǎng)絡(luò)(Deep BP Neural Network,DNN)等智能算法進(jìn)行綜合對比驗證。對比實驗仍采用表2所示的故障數(shù)據(jù)集作為上述3種算法的輸入依次進(jìn)行測試。在傳統(tǒng)的故障診斷方法中,特征提取至關(guān)重要,常用的方法有小波變換(WT)、經(jīng)驗?zāi)B(tài)分析(EMD)、快速傅立葉變換(FFT)和統(tǒng)計特征(Statistical Feature,SF)等,前3種方法已在諸多文獻(xiàn)中被證明在特征提取方面CNN更具優(yōu)越性[23,27,33],統(tǒng)計特征(SF)由于具有較好的可操作性和適應(yīng)性被廣泛應(yīng)用,XIA等[24]和SHAO等[26]采用SF提取了原始數(shù)據(jù)的時域和頻域特征。本實驗采用相同的對比方法,從原始的故障數(shù)據(jù)中提取了14個統(tǒng)計特征,包含10個時域特征和4個頻域特征,如表6所示[25],提取的14個統(tǒng)計特征用于SVM和KNN的診斷,DNN和CNN直接采用原始數(shù)據(jù),實驗結(jié)果如表7所示。由表7可明顯看出,SVM、KNN、DNN和傳統(tǒng)CNN的準(zhǔn)確率分別為93.38%、96.51%、97.26%和98.82%,而本文改進(jìn)的方法準(zhǔn)確率高達(dá)100%,對比實驗表明,所提算法的診斷性能明顯優(yōu)于其他診斷算法。
表6 時域和頻域特征提取方法
表7 5種算法診斷準(zhǔn)確率數(shù)據(jù)表 %
續(xù)表7
針對傳統(tǒng)的智能故障診斷方法與現(xiàn)行CNN算法的不足,本文提出一種基于改進(jìn)CNN-GAP-SVM的深度學(xué)習(xí)新方法,用于DC-DC變換器開路故障的快速智能診斷。該方法通過設(shè)計一個具有維度自適應(yīng)的全局均值池化層和一個非線性的SVM分類器分別代替?zhèn)鹘y(tǒng)CNN中2~3層的全連接層和Softmax分類函數(shù)。所提算法由一個輸入層、特征提取層、全局均值池化層和SVM分類輸出層組成,首先,原始的故障數(shù)據(jù)直接輸入模型的輸入層進(jìn)行數(shù)據(jù)處理和數(shù)據(jù)重構(gòu);其次,特征提取層自動完成特征提取和數(shù)據(jù)挖掘;然后,全局均值池化層進(jìn)一步完成維度變換和參數(shù)量精減;最后,診斷準(zhǔn)確率再由SVM進(jìn)一步提升和輸出。
通過將提出的方法用于DC-DC電力變換器的IGBT開路故障診斷,并與主流的SVM、KNN和DNN及傳統(tǒng)CNN進(jìn)行對比驗證,結(jié)果表明:所提方法具有更高的診斷準(zhǔn)確率和更快的診斷速度,在診斷準(zhǔn)確率方面,4種對比方法的準(zhǔn)確率分別為:93.38%、96.51%、97.26%和98.82%,而提出的方法高達(dá)100%;在診斷速度方面,提出的CNN-GAP-SVM算法可提升診斷速度達(dá)23%,并可減少模型參數(shù)量90%以上。本文所提方法不但可以取得更加優(yōu)越的診斷性能,而且無需對原始數(shù)據(jù)作任何的手工特征提取操作,“端到端”的算法結(jié)構(gòu)更加適用于電力變換器等電氣設(shè)備故障的快速智能診斷。
未來,作者團隊將繼續(xù)在基于深度學(xué)習(xí)的船舶機電系統(tǒng)故障預(yù)測和在線健康評估方向開展持續(xù)性研究。