鄭啟明,姚新文,陳光武,王小敏,3,江 磊
(1.西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 611756;2.甘肅省高原交通信息工程及控制重點(diǎn)實(shí)驗(yàn)室,甘肅 蘭州 730070;3.四川省列車運(yùn)行控制技術(shù)工程研究中心,四川 成都 611756)
轉(zhuǎn)轍機(jī)作為鐵路信號(hào)系統(tǒng)中的無冗余執(zhí)行單元,因常年工作在室外環(huán)境,其故障發(fā)生頻率同比其他鐵路信號(hào)設(shè)備相對(duì)較高,是運(yùn)營(yíng)維護(hù)工作的重心之一。集中監(jiān)測(cè)系統(tǒng)(CMS)實(shí)時(shí)采集轉(zhuǎn)轍機(jī)牽引道岔轉(zhuǎn)換過程的表示電路與動(dòng)作電流信號(hào),并通過提取動(dòng)作電流特征值與預(yù)設(shè)閾值比較實(shí)現(xiàn)轉(zhuǎn)轍機(jī)故障報(bào)警,然后借助人工經(jīng)驗(yàn)分析動(dòng)作電流曲線實(shí)現(xiàn)故障確診。隨著CMS的廣泛應(yīng)用和智能技術(shù)的發(fā)展,為轉(zhuǎn)轍機(jī)運(yùn)維從周期修結(jié)合故障修的方式向狀態(tài)修轉(zhuǎn)變提供了可行條件,基于CMS監(jiān)測(cè)數(shù)據(jù)的智能診斷方法正成為該領(lǐng)域的研究熱點(diǎn)。
近年來,結(jié)合轉(zhuǎn)轍機(jī)動(dòng)作電流監(jiān)測(cè)數(shù)據(jù),相關(guān)學(xué)者開展了轉(zhuǎn)轍機(jī)故障智能診斷算法研究,并取得了一定進(jìn)展[1-13],大體上可分為基于機(jī)器學(xué)習(xí)和基于深度學(xué)習(xí)兩類方法。2016年,王瑞峰等[2]將灰色關(guān)聯(lián)分析和神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出灰色神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)轍機(jī)故障診斷方法,其特征值由統(tǒng)計(jì)分析總結(jié),在非均衡小樣本場(chǎng)景下可能存在一定偏差。2020年,孔令剛等[3]提出一種基于概率神經(jīng)網(wǎng)絡(luò)(PNN)與改進(jìn)的粒子群算法(PSO)相結(jié)合的道岔故障診斷方法,以主成分分析法降維時(shí)頻域的統(tǒng)計(jì)量與小波系數(shù)作為故障特征,再利用投票機(jī)制表決3個(gè)PSO-PNN分類器的故障診斷結(jié)果,該方法相比文獻(xiàn)[2]容錯(cuò)性更強(qiáng),但網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜。文獻(xiàn)[2-3]在故障特征提取部分工作依賴統(tǒng)計(jì)特征與傳統(tǒng)智能算法,對(duì)數(shù)據(jù)質(zhì)量要求高。隨著深度學(xué)習(xí)在圖像特征表示和分類方面的突出表現(xiàn),基于深度學(xué)習(xí)的轉(zhuǎn)轍機(jī)故障診斷方法得到了廣泛關(guān)注。如文獻(xiàn)[4]提出一種基于深度自編碼器的轉(zhuǎn)轍機(jī)故障診斷算法,其利用深度學(xué)習(xí)自編碼器與人工經(jīng)驗(yàn)識(shí)別未知故障,并借助集合監(jiān)控模型實(shí)現(xiàn)故障診斷,不依賴統(tǒng)計(jì)特征實(shí)現(xiàn)特征提取。文獻(xiàn)[5]針對(duì)現(xiàn)場(chǎng)轉(zhuǎn)轍機(jī)設(shè)備故障樣本不易獲取的難點(diǎn),提出一種利用仿真數(shù)據(jù)訓(xùn)練CNN深度網(wǎng)絡(luò)實(shí)現(xiàn)故障診斷的方法,該方法所需的大量訓(xùn)練數(shù)據(jù)基于建模仿真,故障診斷性能與仿真數(shù)據(jù)的建模效果關(guān)聯(lián)密切。文獻(xiàn)[6]利用CNN卷積神經(jīng)網(wǎng)絡(luò)提取一定維度的轉(zhuǎn)轍機(jī)故障特征,并作為GRU門控循環(huán)單元的輸入從而實(shí)現(xiàn)轉(zhuǎn)轍機(jī)故障診斷,該方法結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì),但同時(shí)也繼承了GRU網(wǎng)絡(luò)可能發(fā)生的梯度消失現(xiàn)象。2021年,文獻(xiàn)[7]提出一種基于改進(jìn)深度森林網(wǎng)絡(luò)和案例推理的分層故障診斷模型,雖然網(wǎng)絡(luò)結(jié)構(gòu)比文獻(xiàn)[4-6]更加復(fù)雜,但借助集成網(wǎng)絡(luò)的優(yōu)勢(shì)提升了故障診斷效果。
上述基于數(shù)據(jù)驅(qū)動(dòng)的智能診斷算法普遍對(duì)轉(zhuǎn)轍機(jī)故障數(shù)據(jù)需求量大,且忽略了故障數(shù)據(jù)的類別不均衡特性對(duì)診斷算法的不利影響。雖然CMS監(jiān)測(cè)系統(tǒng)記錄了轉(zhuǎn)轍機(jī)動(dòng)作電流的大量監(jiān)測(cè)數(shù)據(jù),但這些監(jiān)測(cè)數(shù)據(jù)呈現(xiàn)以下三個(gè)特點(diǎn):
(1)故障樣本量稀少。因轉(zhuǎn)轍機(jī)自身的高可靠性及高可用性,特別是現(xiàn)場(chǎng)的周期修運(yùn)用條件下其故障發(fā)生的絕對(duì)概率低,絕大部分監(jiān)測(cè)數(shù)據(jù)均為正常樣本。
(2)故障樣本類別不均衡。受運(yùn)用環(huán)境、設(shè)備質(zhì)量水平以及運(yùn)營(yíng)維護(hù)等因素影響,部分故障類型的發(fā)生率較高,導(dǎo)致不同故障類別的樣本量差異大。
(3)監(jiān)測(cè)數(shù)據(jù)長(zhǎng)度不一。因轉(zhuǎn)轍機(jī)類型不同、運(yùn)營(yíng)服役性狀差異及監(jiān)測(cè)系統(tǒng)研制廠家不同,導(dǎo)致轉(zhuǎn)轍機(jī)動(dòng)作電流的監(jiān)測(cè)數(shù)據(jù)長(zhǎng)度差異大。
對(duì)于現(xiàn)場(chǎng)監(jiān)測(cè)數(shù)據(jù)的前兩個(gè)特點(diǎn),現(xiàn)有的方法通常采用數(shù)據(jù)重抽樣或引入仿真數(shù)據(jù)的手段進(jìn)行數(shù)據(jù)增強(qiáng),但重抽樣或仿真的數(shù)據(jù)模式與分布空間高度重合,易引發(fā)機(jī)器學(xué)習(xí)的過擬合。對(duì)于監(jiān)測(cè)數(shù)據(jù)長(zhǎng)短不一的問題,通常采用數(shù)據(jù)填充或截?cái)嗟侥骋婚L(zhǎng)度來對(duì)齊監(jiān)測(cè)數(shù)據(jù),而這種數(shù)據(jù)硬填充或硬截?cái)嗟膶?duì)齊方式破壞了監(jiān)測(cè)數(shù)據(jù)的曲線模式特征,一定程度上影響了診斷效果。上述的轉(zhuǎn)轍機(jī)監(jiān)測(cè)數(shù)據(jù)特點(diǎn)不利于現(xiàn)有智能診斷算法的現(xiàn)場(chǎng)實(shí)際應(yīng)用。
對(duì)此,本文針對(duì)轉(zhuǎn)轍機(jī)監(jiān)測(cè)數(shù)據(jù)的實(shí)際特點(diǎn),提出一種基于改進(jìn)生成對(duì)抗網(wǎng)絡(luò)(ACGAN)和自適應(yīng)數(shù)據(jù)對(duì)齊的轉(zhuǎn)轍機(jī)故障診斷方法。首先借鑒生成對(duì)抗網(wǎng)絡(luò)博弈學(xué)習(xí)數(shù)據(jù)分布特征的思路,改進(jìn)了ACGAN網(wǎng)絡(luò)的目標(biāo)函數(shù),并采用生成器迭代強(qiáng)化判別器的輔助分類器,可充分學(xué)習(xí)動(dòng)作電流曲線的模式特征,僅需少量真實(shí)故障數(shù)據(jù)即完成了模型訓(xùn)練并借此實(shí)現(xiàn)故障診斷。其次,針對(duì)轉(zhuǎn)轍機(jī)監(jiān)測(cè)數(shù)據(jù)長(zhǎng)短不一的問題,設(shè)計(jì)一種自適應(yīng)數(shù)據(jù)壓縮方法,在實(shí)現(xiàn)數(shù)據(jù)自動(dòng)對(duì)齊的同時(shí)能夠最大限度地保留監(jiān)測(cè)曲線的模式特征,避免以往硬填充或硬截?cái)嗟膶?duì)齊方式對(duì)模式特征的破壞,有效提升了故障診斷準(zhǔn)確率。最后,以ZDJ9型電動(dòng)轉(zhuǎn)轍機(jī)的真實(shí)監(jiān)測(cè)數(shù)據(jù)為例進(jìn)行實(shí)驗(yàn)驗(yàn)證并與相關(guān)診斷方法進(jìn)行比較。結(jié)果表明,本文方法借助生成對(duì)抗數(shù)據(jù)增強(qiáng)和優(yōu)化的目標(biāo)函數(shù),在非均衡和小樣本故障數(shù)據(jù)集下能夠充分學(xué)習(xí)轉(zhuǎn)轍機(jī)動(dòng)作電流曲線的模式特征,故障診斷準(zhǔn)確率高。采用自適應(yīng)壓縮數(shù)據(jù)對(duì)齊后,強(qiáng)化了電流曲線的模式特征,進(jìn)一步提升了故障診斷準(zhǔn)確率。因此,本文方法符合轉(zhuǎn)轍機(jī)監(jiān)測(cè)數(shù)據(jù)的現(xiàn)場(chǎng)特點(diǎn)和需求,具有較好的工程應(yīng)用潛力。
轉(zhuǎn)轍機(jī)內(nèi)部電路可以分為控制電路與執(zhí)行電路。收到變軌控制信號(hào)后,繼電器吸起,表示線路電平轉(zhuǎn)換,觸發(fā)執(zhí)行電路開始工作,同時(shí)也觸發(fā)動(dòng)作曲線監(jiān)測(cè)接口采集動(dòng)作曲線數(shù)據(jù)。轉(zhuǎn)轍機(jī)轉(zhuǎn)換完成后,一啟動(dòng)繼電器(1DQJ)釋放,動(dòng)作曲線采集完成并傳送至集中監(jiān)測(cè)系統(tǒng),其結(jié)構(gòu)見圖1。
圖1 道岔轉(zhuǎn)轍機(jī)及集中監(jiān)測(cè)系統(tǒng)結(jié)構(gòu)框圖
轉(zhuǎn)轍機(jī)動(dòng)作曲線記錄了該轉(zhuǎn)轍機(jī)的完整執(zhí)行過程,其電流曲線與功率曲線反映了轉(zhuǎn)轍機(jī)的變軌阻力與工作時(shí)間,曲線平滑或波動(dòng)映射了轉(zhuǎn)轍機(jī)的服役性狀?;谶@一特性,通過觀察轉(zhuǎn)轍機(jī)動(dòng)作曲線模式即可大致判斷其故障類型及原因,因此轉(zhuǎn)轍機(jī)的動(dòng)作曲線模式亦是判定其健康狀態(tài)的重要依據(jù)之一。
圖2展示了轉(zhuǎn)轍機(jī)的一條標(biāo)準(zhǔn)動(dòng)作曲線,記錄了A、B、C三相工作電流的變化趨勢(shì)。圖中①表示1DQJ繼電器吸起,轉(zhuǎn)轍機(jī)開始工作,動(dòng)作電流開始記錄;②表示轉(zhuǎn)轍機(jī)根據(jù)控制信號(hào)確定轉(zhuǎn)換方向,并啟動(dòng)電機(jī),此時(shí)電流達(dá)到波峰;③、④之間電流呈現(xiàn)平緩區(qū)域,此時(shí)處于道岔變軌過程中;④、⑤之間,轉(zhuǎn)轍機(jī)變軌結(jié)束,此時(shí)1DQJ開始緩放,根據(jù)轉(zhuǎn)轍機(jī)變軌方向不同,B相電流或C相電流為0,其他兩項(xiàng)電流保持在0.4 A左右,呈小臺(tái)階狀;⑤之后,1DQJ完全釋放,轉(zhuǎn)轍機(jī)工作流程結(jié)束,停止動(dòng)作曲線采集。根據(jù)上述過程可以看出,動(dòng)作曲線能夠反映出轉(zhuǎn)轍機(jī)的變軌過程,以及電機(jī)啟動(dòng)摩擦力、轉(zhuǎn)換過程阻力、變軌時(shí)間等服役狀態(tài),可用來幫助診斷轉(zhuǎn)轍機(jī)故障原因。
圖2 轉(zhuǎn)轍機(jī)標(biāo)準(zhǔn)動(dòng)作電流曲線示例
為了進(jìn)一步闡述動(dòng)作曲線與轉(zhuǎn)轍機(jī)服役狀態(tài)(故障模式)之間的關(guān)聯(lián),圖3中分別列舉了9種常見的異常動(dòng)作曲線(power曲線表示轉(zhuǎn)轍機(jī)動(dòng)作時(shí)的功率),每種異常動(dòng)作曲線對(duì)應(yīng)的故障類型及原因分析如表1所示。為敘述方便,將正常動(dòng)作曲線記為類型0。
表1 異常動(dòng)作曲線類型及原因分析
圖3 常見異常動(dòng)作曲線
生成對(duì)抗網(wǎng)絡(luò)(GAN)在數(shù)據(jù)增強(qiáng)領(lǐng)域具有重要的地位,該網(wǎng)絡(luò)通常由生成器G(·)和判別器D(·)兩個(gè)關(guān)聯(lián)網(wǎng)絡(luò)結(jié)構(gòu)組成。G(·)根據(jù)隨機(jī)噪聲z~PZ(z)生成假樣本G(z),其中PZ(z)為z的概率分布;而D(·)判別真實(shí)數(shù)據(jù)x~Pdata(x)與G(z)為真假的概率,Pdata(x)為真實(shí)樣本的概率分布。經(jīng)過多輪交替迭代博弈后pTrue(D(G(z)))≈pTrue(D(x)),此時(shí)G(z)與x分布相似,又因?yàn)閦具備分布空間上的隨機(jī)性,從而得到以假亂真又各具差異的生成數(shù)據(jù)。
針對(duì)轉(zhuǎn)轍機(jī)的非均衡和小樣本故障數(shù)據(jù)的模型訓(xùn)練和診斷問題,本文在輔助分類生成對(duì)抗網(wǎng)絡(luò) (ACGAN)[14]基礎(chǔ)上,提出深度網(wǎng)絡(luò)模型并設(shè)計(jì)了新的損失函數(shù)。所設(shè)計(jì)的轉(zhuǎn)轍機(jī)故障診斷新模型主要由三部分構(gòu)成:①轉(zhuǎn)轍機(jī)動(dòng)作曲線的自適應(yīng)數(shù)據(jù)對(duì)齊;②基于改進(jìn)ACGAN目標(biāo)函數(shù)的故障特征學(xué)習(xí);③基于改進(jìn)ACGAN判別器網(wǎng)絡(luò)的故障診斷機(jī)制。
轉(zhuǎn)轍機(jī)因型號(hào)不同或運(yùn)營(yíng)服役狀態(tài)差異,其動(dòng)作電流數(shù)據(jù)通常在83~177個(gè)數(shù)據(jù)點(diǎn)之間變化。由于數(shù)據(jù)長(zhǎng)短不一,無法直接通過機(jī)器學(xué)習(xí)卷積層提取其數(shù)據(jù)特征,既有方法通常采用補(bǔ)全或截?cái)嗟姆绞竭M(jìn)行數(shù)據(jù)長(zhǎng)度對(duì)齊,但這種“硬操作”人為破壞了轉(zhuǎn)轍機(jī)動(dòng)作曲線的模式特征,降低了智能方法的診斷精度。為解決這一問題,本節(jié)主要討論針對(duì)轉(zhuǎn)轍機(jī)動(dòng)作曲線這一數(shù)據(jù)形式的自適應(yīng)定長(zhǎng)壓縮方法,自適應(yīng)實(shí)現(xiàn)轉(zhuǎn)轍機(jī)動(dòng)作曲線的數(shù)據(jù)對(duì)齊預(yù)處理,且能夠保留動(dòng)作曲線的原有模式特征,有利于提升智能診斷效果。
轉(zhuǎn)轍機(jī)動(dòng)作曲線是由動(dòng)作電流采樣值構(gòu)成的時(shí)間序列集合,本文將其看作特殊的二維矩陣,采用圖像處理領(lǐng)域經(jīng)典的Cubic插值算法實(shí)現(xiàn)對(duì)動(dòng)作曲線的自適應(yīng)壓縮。根據(jù)Cubic插值原理,假設(shè)轉(zhuǎn)轍機(jī)動(dòng)作電流是一條連續(xù)可微曲線,其任意分段為小區(qū)間f(ω)
f(ω)=aω3+bω2+cω+d
(1)
式中:ω∈[0,1]為動(dòng)作電流分段區(qū)間的兩端,那么區(qū)間參數(shù)可表示為
(2)
基于上述原理,對(duì)于任意一條轉(zhuǎn)轍機(jī)動(dòng)作電流采樣后的n維離散動(dòng)作曲線時(shí)間序列x=(x1,x2,…,xn),n表示動(dòng)作曲線的最大采樣點(diǎn)數(shù),本文將其自適應(yīng)對(duì)齊為m維時(shí)間序列y=(y1,y2,…,ym),m為期望的時(shí)間序列長(zhǎng)度。這里以yj|j∈[1,m]逼近xk|k∈[1,n],且k=nj/m。此時(shí)推導(dǎo)出yj的插值參數(shù)為
(3)
式中:采用x0=x1,xk+i|k+i>n=xn,i∈{1,2}準(zhǔn)則處理邊界問題。那么yj處逼近數(shù)值為
yj=ajω3+bjω2+cjω+dj
(4)
式中:ω=nj/m。為提高故障診斷準(zhǔn)確率,將max(x)與n并入歸一化后的y中,記為y+,以保留x的最大功率及動(dòng)作轉(zhuǎn)換時(shí)長(zhǎng),則y+=[y,max(x),n]。
本文提出的故障診斷模型是在ACGAN模型[14]范式的基礎(chǔ)上,針對(duì)轉(zhuǎn)轍機(jī)監(jiān)測(cè)數(shù)據(jù)形式與自適應(yīng)數(shù)據(jù)對(duì)齊后數(shù)據(jù)構(gòu)成,重新設(shè)計(jì)了生成器網(wǎng)絡(luò)模型與判別器網(wǎng)絡(luò)模型,模型參數(shù)如表2與表3所示。針對(duì)轉(zhuǎn)轍機(jī)動(dòng)作曲線的故障數(shù)據(jù)小樣本和不均衡問題,以優(yōu)化故障診斷精確率為導(dǎo)向重構(gòu)原始ACGAN[14]網(wǎng)絡(luò)的損失函數(shù),強(qiáng)化網(wǎng)絡(luò)模型對(duì)小樣本數(shù)據(jù)故障特征的學(xué)習(xí)能力。該模型在數(shù)據(jù)增強(qiáng)訓(xùn)練階段,利用生成對(duì)抗網(wǎng)絡(luò)交替迭代訓(xùn)練生成器與判別器的框架,在生成器訓(xùn)練階段強(qiáng)化生成數(shù)據(jù)的擬真性,在判別器訓(xùn)練階段弱化模型生成數(shù)據(jù)對(duì)輔助分類器的影響,從兩個(gè)方面提高模型對(duì)真實(shí)數(shù)據(jù)故障模式特征的學(xué)習(xí)效果。
表2 本文判別器網(wǎng)絡(luò)模型參數(shù)
表3 本文生成器網(wǎng)絡(luò)模型參數(shù)
為方便計(jì)算,本文設(shè)定經(jīng)過自適應(yīng)數(shù)據(jù)對(duì)齊后動(dòng)作曲線y+的長(zhǎng)度為200,同時(shí),動(dòng)作曲線包含A相電流、B相電流、C相電流以及功率值4個(gè)維度,則本文提出模型的判別器網(wǎng)絡(luò)輸入維度為[4×200×1],該模型參數(shù)如表2所示。改進(jìn)ACGAN模型判別器遵循的目標(biāo)為:①盡可能區(qū)分真實(shí)故障數(shù)據(jù)與生成故障數(shù)據(jù);②優(yōu)先學(xué)習(xí)真實(shí)故障數(shù)據(jù)的模式特征,以生成故障數(shù)據(jù)做輔助訓(xùn)練。根據(jù)表2建立判別器函數(shù)D(·),其損失函數(shù)分為兩個(gè)部分,分別為
E[lnP(S=fake|Xfake)]+
0.5×E[lnP(C=c|Xreal)]+
0.5×E[lnP(C=c|Xfake)]}
(5)
E[lnP(S=fake|Xfake)]+
E[lnP(C=c|Xreal)]}
(6)
式中:E為數(shù)學(xué)期望;C=c|X為當(dāng)真樣本或假樣本時(shí)判斷類別正確的概率;P為概率;S=real/Xreal為判別器判別數(shù)據(jù)為真的概率;S=fake|Xfake為判別器判別數(shù)據(jù)為假的概率。
結(jié)合式(5)、式(6),得出改進(jìn)ACGAN網(wǎng)絡(luò)判別器的LD為
LD=pLD1+(1-p)LD2
(7)
式中:p為在訓(xùn)練過程的單次迭代中將LD1作為判別器損失函數(shù)的概率,(1-p)為將LD2作為判別器損失函數(shù)的概率。LD根據(jù)p交替采用LD1和LD2作為損失函數(shù),以改進(jìn)ACGAN網(wǎng)絡(luò)訓(xùn)練前期未成形的生成故障數(shù)據(jù)對(duì)輔助分類器的負(fù)面影響,加強(qiáng)輔助分類器對(duì)真實(shí)數(shù)據(jù)的分類精度,實(shí)現(xiàn)快速收斂。
本文改進(jìn)ACGAN模型生成器遵循的目標(biāo)為:①生成符合故障模式特征的仿真轉(zhuǎn)轍機(jī)動(dòng)作曲線,使得判別器無法區(qū)分真假動(dòng)作曲線;②優(yōu)先保證判別器對(duì)生成數(shù)據(jù)的分類精確,其次保證判別器對(duì)真實(shí)數(shù)據(jù)的分類精確。生成器模型參數(shù)如表3所示,其損失函數(shù)同樣分為以下兩個(gè)部分
E[lnP(C=c|Xfake)]-
0.5×E[lnP(S=real|Xreal)]-
0.5×E[lnP(S=fake|Xfake)]}
(8)
E[lnP(C=c|Xfake)]-
E[lnP(S=fake|Xfake)]}
(9)
結(jié)合式(8)、式(9),得到改進(jìn)ACGAN模型生成器的損失函數(shù)LG為
LG=pLG1+(1-p)LG2
(10)
式中:p為訓(xùn)練過程的單次迭代中,將LG1作為生成器損失函數(shù)的概率,即生成器訓(xùn)練過程中對(duì)真實(shí)數(shù)據(jù)的分類精度納入損失估計(jì)的概率,(1-p)為采用LG2作為生成器損失函數(shù)的概率。
本文提出的改進(jìn)ACGAN網(wǎng)絡(luò)的轉(zhuǎn)轍機(jī)故障診斷模型訓(xùn)練流程見圖4,訓(xùn)練目標(biāo)為判別器網(wǎng)絡(luò)盡可能地學(xué)習(xí)小樣本非平衡故障數(shù)據(jù)的模式特征,具體步驟如下:
圖4 基于改進(jìn)ACGAN與自適應(yīng)數(shù)據(jù)對(duì)齊的轉(zhuǎn)轍機(jī)故障診斷模型訓(xùn)練流程
Step1通過式(3)與式(4)對(duì)訓(xùn)練數(shù)據(jù)做自適應(yīng)數(shù)據(jù)對(duì)齊預(yù)處理,初始化D(·)和G(·)。
Step2固化D(·)參數(shù),訓(xùn)練G(·)并更新其參數(shù)。
生成隨機(jī)數(shù)ρ∈(0,1),生成隨機(jī)噪聲z∈R100,打亂y+順序并提取標(biāo)簽c∈[0,N-1],其中N為樣本總數(shù)。
(1)生成假動(dòng)作曲線,通過判別器判別真假與分類。
(11)
rD,cD=D(y+)
(12)
(13)
(2)計(jì)算生成器損失。
(14)
(3)反向傳播梯度,優(yōu)化生成器G(·),并更新參數(shù)。
Step3固化G(·)參數(shù),訓(xùn)練,D(·),并更新其參數(shù)。
(1)重復(fù)Step2中(1)與Step2中(2)。
(2)計(jì)算判別器損失。
(15)
(3)反向傳播梯度,優(yōu)化判別器D(·),并更新參數(shù)。
Step4重復(fù)Step2與Step3,直至LG與LD共同收斂。
本文所提出的故障診斷方法是在判別器的基礎(chǔ)上,借助全連接層與softmax激活函數(shù)實(shí)現(xiàn)分類器,對(duì)數(shù)據(jù)預(yù)處理后由判別器引出輔助分類器即可實(shí)現(xiàn)轉(zhuǎn)轍機(jī)的故障診斷,其工作原理見圖5,具體步驟如下:
圖5 基于改進(jìn)ACGAN與自適應(yīng)數(shù)據(jù)對(duì)齊的轉(zhuǎn)轍機(jī)故障診斷流程框圖
Step1加載已訓(xùn)練好判別器D(·)的模型參數(shù),通過自適應(yīng)數(shù)據(jù)對(duì)齊實(shí)現(xiàn)對(duì)測(cè)試數(shù)據(jù)的預(yù)處理。
Step2通過式(12)預(yù)測(cè)測(cè)試數(shù)據(jù)的類別。
Step3將式(12)中cD作為改進(jìn)ACGAN網(wǎng)絡(luò)輔助分類器對(duì)動(dòng)作曲線的診斷結(jié)果。
本文數(shù)據(jù)來自成都地鐵四號(hào)線停車場(chǎng)內(nèi)ZDJ9型電動(dòng)轉(zhuǎn)轍機(jī)采集的真實(shí)數(shù)據(jù)。整理出的9類常見故障類型所對(duì)應(yīng)的異常數(shù)據(jù)如表1所示。將轉(zhuǎn)轍機(jī)單次動(dòng)作的三相電流監(jiān)測(cè)曲線及功率曲線整理為4×t的二維時(shí)間序列,其中t表示動(dòng)作曲線的采樣點(diǎn)數(shù)。表4列舉了訓(xùn)練數(shù)據(jù)集的分布情況。
表4 訓(xùn)練數(shù)據(jù)集分布
表4中監(jiān)測(cè)數(shù)據(jù)的原始時(shí)間序列長(zhǎng)度區(qū)間為[83,177],為方便深度網(wǎng)絡(luò)構(gòu)建,且盡可能保留原始動(dòng)作曲線的模式特征,根據(jù)2.2小節(jié)所述,采用自適應(yīng)壓縮算法對(duì)轉(zhuǎn)轍機(jī)動(dòng)作曲線實(shí)現(xiàn)數(shù)據(jù)對(duì)齊。
本文提出的故障診斷方法,首先通過自適應(yīng)壓縮重構(gòu)轉(zhuǎn)轍機(jī)動(dòng)作曲線以實(shí)現(xiàn)數(shù)據(jù)對(duì)齊預(yù)處理。為分析不同數(shù)據(jù)對(duì)齊方法對(duì)原始轉(zhuǎn)轍機(jī)動(dòng)作曲線模式特征的影響情況,圖6分別展示了原始動(dòng)作曲線、經(jīng)填充或截?cái)嗵幚砗蟮膭?dòng)作曲線,以及通過自適應(yīng)壓縮重構(gòu)后的動(dòng)作曲線。圖中A、B、C分別為ZDJ9型電動(dòng)轉(zhuǎn)轍機(jī)轉(zhuǎn)換道岔時(shí)的三項(xiàng)驅(qū)動(dòng)電流的監(jiān)測(cè)數(shù)據(jù)曲線(也稱為動(dòng)作曲線)。
圖6 原始動(dòng)作曲線
圖6~圖8展示了3種不同數(shù)據(jù)類型的轉(zhuǎn)轍機(jī)動(dòng)作曲線,將數(shù)據(jù)對(duì)齊到120個(gè)采樣點(diǎn)后其動(dòng)作電流及功率曲線呈現(xiàn)的效果。其中,圖6展示了不同長(zhǎng)度的原始動(dòng)作曲線;圖7展示了經(jīng)填充或截?cái)囝A(yù)處理后的動(dòng)作曲線;圖8展示了經(jīng)自適應(yīng)對(duì)齊預(yù)處理后的動(dòng)作曲線。以數(shù)據(jù)類型6為例,對(duì)于序列長(zhǎng)度較短的數(shù)據(jù),經(jīng)過填充后其曲線的變化趨勢(shì)與原始曲線相比有一定改變,而經(jīng)自適應(yīng)數(shù)據(jù)對(duì)齊后曲線變化趨勢(shì)與原始曲線幾乎一致。對(duì)于序列長(zhǎng)度較長(zhǎng)的曲線(如數(shù)據(jù)類型1和2),經(jīng)過截?cái)嗪笃淝€變化模式與原始曲線有明顯差異,而經(jīng)自適應(yīng)數(shù)據(jù)對(duì)齊后其數(shù)據(jù)長(zhǎng)度成比例壓縮??梢钥闯?采用自適應(yīng)數(shù)據(jù)對(duì)齊處理后,能夠有效保留原始曲線的模式特征,便于后續(xù)的故障診斷。
圖7 填充或截?cái)囝A(yù)處理后的動(dòng)作曲線
圖8 自適應(yīng)數(shù)據(jù)對(duì)齊預(yù)處理后的動(dòng)作曲線
針對(duì)轉(zhuǎn)轍機(jī)監(jiān)測(cè)數(shù)據(jù)不均衡、故障樣本量小的特點(diǎn),本文分析改進(jìn)ACGAN 網(wǎng)絡(luò)相對(duì)于原始ACGAN網(wǎng)絡(luò)[14]的模型訓(xùn)練情況與故障特征學(xué)習(xí)效果。改進(jìn)ACGAN目標(biāo)函數(shù)在生成器訓(xùn)練階段強(qiáng)化生成數(shù)據(jù)的擬真性,在判別器訓(xùn)練階段弱化模型生成數(shù)據(jù)對(duì)判別器的影響,旨在降低生成對(duì)抗網(wǎng)絡(luò)訓(xùn)練初期的不確定性對(duì)最終故障診斷結(jié)果的潛在影響。式(7)與式(10)中,當(dāng)p=1時(shí),生成器與判別器損失函數(shù)與原始ACGAN網(wǎng)絡(luò)一致;當(dāng)p=0時(shí),生成數(shù)據(jù)不參與判別器的訓(xùn)練,網(wǎng)絡(luò)不易收斂。為提升故障診斷準(zhǔn)確率,同時(shí)確保模型的穩(wěn)定性,實(shí)驗(yàn)中設(shè)定p=0.5的折中方案。
圖9展示了本文改進(jìn)ACGAN模型與原始網(wǎng)絡(luò)模型的生成器與判別器網(wǎng)絡(luò)的訓(xùn)練損失曲線??梢钥闯?本文改進(jìn)生成器網(wǎng)絡(luò)相比原始生成器網(wǎng)絡(luò)更快收斂。改進(jìn)判別器網(wǎng)絡(luò)訓(xùn)練損失震蕩收斂,表明LG1與LG2交替作用于訓(xùn)練階段。此外,判別器收斂損失的絕對(duì)值相比原始網(wǎng)絡(luò)更接近于0,說明改進(jìn)后的判別器網(wǎng)絡(luò)能夠更有效地學(xué)習(xí)轉(zhuǎn)轍機(jī)動(dòng)作曲線的模式特征。
圖9 生成器與判別器的損失曲線
為進(jìn)一步分析本文改進(jìn)模型損失函數(shù)對(duì)生成數(shù)據(jù)的影響,分別統(tǒng)計(jì)了改進(jìn)ACGAN網(wǎng)絡(luò)與原始ACGAN網(wǎng)絡(luò)判別器對(duì)真實(shí)數(shù)據(jù)與生成數(shù)據(jù)的區(qū)分能力,見圖10。
圖10 真假樣本判斷為真概率分布
由圖10可見,模型訓(xùn)練前期,判別器無法有效分辨真假樣本,故而判定樣本真假的概率均值接近0.5,處于盲猜階段;約50輪后,判別器判定真實(shí)數(shù)據(jù)與生成數(shù)據(jù)為真的概率均值趨近于0.5,表明生成器網(wǎng)絡(luò)已經(jīng)逐步學(xué)習(xí)了動(dòng)作曲線的模式特征,能夠生成高質(zhì)量的樣本。由圖10可知,改進(jìn)ACGAN網(wǎng)絡(luò)判別器區(qū)分真假樣本的概率均值更趨近于0.5,表明改進(jìn)ACGAN網(wǎng)絡(luò)模型的生成數(shù)據(jù)真實(shí)性得到了加強(qiáng),樣本質(zhì)量更好。
以小樣本真實(shí)數(shù)據(jù)訓(xùn)練并測(cè)試本文提出的故障診斷方法,采用獨(dú)立于訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集的真實(shí)測(cè)試數(shù)據(jù)集,并結(jié)合由隨機(jī)噪聲產(chǎn)生的生成測(cè)試數(shù)據(jù)集驗(yàn)證其故障診斷效果。其中,真實(shí)測(cè)試數(shù)據(jù)集整理出40條正常數(shù)據(jù)以及9類常見故障各40條數(shù)據(jù),生成測(cè)試數(shù)據(jù)集包括3 000條隨機(jī)標(biāo)簽的動(dòng)作曲線數(shù)據(jù),其診斷結(jié)果見圖11。
圖11 本文改進(jìn)ACGAN網(wǎng)絡(luò)與原始網(wǎng)絡(luò)對(duì)小樣本場(chǎng)景下測(cè)試數(shù)據(jù)集的故障診斷效果對(duì)比
圖11中,縱坐標(biāo)為實(shí)際數(shù)據(jù)標(biāo)簽,橫坐標(biāo)為輔助分類器的判別器,即為故障診斷結(jié)論。從圖11(a)中看出,本文提出的改進(jìn)模型對(duì)動(dòng)作曲線的故障診斷標(biāo)簽與實(shí)際標(biāo)簽完全一致,相比較于圖11(c),原始ACGAN網(wǎng)絡(luò)對(duì)標(biāo)簽3和標(biāo)簽6的數(shù)據(jù)存在誤診斷現(xiàn)象。為進(jìn)一步驗(yàn)證改進(jìn)模型的效果,采用生成數(shù)據(jù)比較兩種模型學(xué)習(xí)非均衡小樣本數(shù)據(jù)集中數(shù)據(jù)模式特征的能力。圖11(d)表明,原始ACGAN網(wǎng)絡(luò)欠擬合,針對(duì)生成測(cè)試數(shù)據(jù)集其故障診斷準(zhǔn)確率為 90.47%,部分故障類型4的數(shù)據(jù)被錯(cuò)診斷為故障8,故障類型8的被分別診斷為故障4和故障5,錯(cuò)診率為 10.72%。實(shí)驗(yàn)表明,在非均衡小樣本數(shù)據(jù)集訓(xùn)練場(chǎng)景下,本文提出的模型能夠更好地學(xué)習(xí)轉(zhuǎn)轍機(jī)動(dòng)作曲線的各類故障特征分布,故障診斷效果更優(yōu)。
為進(jìn)一步驗(yàn)證本文方法的故障診斷效果,將真實(shí)測(cè)試數(shù)據(jù)集與生成測(cè)試數(shù)據(jù)集進(jìn)行混合,形成混合數(shù)據(jù)集,并與表5中的5個(gè)參考文獻(xiàn)進(jìn)行對(duì)比試驗(yàn),結(jié)果如表5所示。由表5可以看出,在非均衡小樣本數(shù)據(jù)集訓(xùn)練場(chǎng)景下,本文方法的準(zhǔn)確率和F1-Score指標(biāo)均最高,其診斷效果優(yōu)勢(shì)明顯。
表5 各方法對(duì)混合測(cè)試數(shù)據(jù)集的故障診斷效果比較
由于現(xiàn)場(chǎng)收集的轉(zhuǎn)轍機(jī)真實(shí)故障數(shù)據(jù)有限,實(shí)驗(yàn)中用于訓(xùn)練的數(shù)據(jù)只有47條至105條不等,用于測(cè)試的各類型真實(shí)故障數(shù)據(jù)只有40條,在此小規(guī)模測(cè)試集下,本文方法的故障診斷結(jié)果完全正確(正如表5中的100%準(zhǔn)確率),不排除在更大規(guī)模測(cè)試集上其準(zhǔn)確性會(huì)有所降低,但算法機(jī)理上對(duì)非均衡小樣本故障數(shù)據(jù)的診斷準(zhǔn)確率要比其他方法更高。
如2.2小節(jié)所述,采用自適應(yīng)數(shù)據(jù)對(duì)齊預(yù)處理能夠保留轉(zhuǎn)轍機(jī)動(dòng)作曲線的模式特征,理論上有助于后續(xù)的故障診斷。為進(jìn)一步分析數(shù)據(jù)對(duì)齊方式對(duì)故障診斷的影響,采用數(shù)據(jù)填充與本文自適應(yīng)對(duì)齊兩種數(shù)據(jù)對(duì)齊方式進(jìn)行數(shù)據(jù)預(yù)處理后訓(xùn)練模型實(shí)現(xiàn)診斷。因本文故障診斷主要針對(duì)非均衡小樣本數(shù)據(jù)集,基于統(tǒng)計(jì)的準(zhǔn)確率和F1-Score存在一定不足,故采用AUC指標(biāo)[15-16]評(píng)估本文改進(jìn)網(wǎng)絡(luò)對(duì)真實(shí)數(shù)據(jù)集的分類效果,AUC指標(biāo)越大越好。
AUC指標(biāo)為本文故障診斷方法重復(fù)訓(xùn)練 10次網(wǎng)絡(luò)模型后得到的平均值。采用自適應(yīng)數(shù)據(jù)對(duì)齊預(yù)處理后的AUC指標(biāo)為0.999,而傳統(tǒng)數(shù)據(jù)填充對(duì)齊后AUC為0.932,表明采用自適應(yīng)對(duì)齊預(yù)處理后的故障診斷效果更好,驗(yàn)證了自適應(yīng)數(shù)據(jù)對(duì)齊的有效性。
本文提出一種基于改進(jìn)ACGAN與自適應(yīng)數(shù)據(jù)對(duì)齊的轉(zhuǎn)轍機(jī)故障診斷方法。受益于生成器與判別器的相互對(duì)抗迭代學(xué)習(xí)的優(yōu)勢(shì),利用生成數(shù)據(jù)加強(qiáng)判別器網(wǎng)絡(luò)的訓(xùn)練效果,僅借助少量非均衡訓(xùn)練數(shù)據(jù)使得改進(jìn)ACGAN網(wǎng)絡(luò)學(xué)習(xí)到各類常見故障的特征分布。同時(shí),對(duì)數(shù)據(jù)長(zhǎng)度不一的轉(zhuǎn)轍機(jī)動(dòng)作曲線,采用自適應(yīng)數(shù)據(jù)對(duì)齊預(yù)處理后更有利于提升故障診斷效果。實(shí)驗(yàn)結(jié)果表明,對(duì)于非平衡小樣本的轉(zhuǎn)轍機(jī)現(xiàn)場(chǎng)監(jiān)測(cè)數(shù)據(jù)診斷效果優(yōu)良。由于本文方法針對(duì)的監(jiān)測(cè)數(shù)據(jù)具備故障樣本量小、故障樣本不均衡和監(jiān)測(cè)數(shù)據(jù)長(zhǎng)度不一致等特點(diǎn),更符合轉(zhuǎn)轍機(jī)現(xiàn)場(chǎng)監(jiān)測(cè)數(shù)據(jù)的實(shí)際情況,因此本文方法具有良好的工程應(yīng)用價(jià)值,對(duì)于其他領(lǐng)域的非均衡小樣本的故障診斷問題也具有一定的參考價(jià)值。未來將在更大的非均衡數(shù)據(jù)集下進(jìn)一步檢驗(yàn)本文方法的有效性。