張典震,陳 捷,2,王 華,2,楊啟帆
(1.南京工業(yè)大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,南京 211816;2.南京工業(yè)大學(xué) 江蘇省工業(yè)裝備數(shù)字制造及控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,南京 211816)
回轉(zhuǎn)支承是保障盾構(gòu)機(jī)、風(fēng)力發(fā)電機(jī)等大型回轉(zhuǎn)機(jī)械進(jìn)行回轉(zhuǎn)運(yùn)動(dòng)的一種關(guān)鍵部件,在其服役過(guò)程中,由于受到工作環(huán)境、受載情況等因素的影響,往往會(huì)出現(xiàn)意外的故障和損壞,造成重大的經(jīng)濟(jì)損失與安全隱患。因此,研究回轉(zhuǎn)支承的性能退化趨勢(shì)預(yù)測(cè)具有重要意義。
退化趨勢(shì)預(yù)測(cè)主要包括構(gòu)造反映回轉(zhuǎn)支承性能退化狀況的健康指標(biāo)(health indicator,HI)與建立準(zhǔn)確有效的退化趨勢(shì)預(yù)測(cè)模型兩部分關(guān)鍵工作。在健康指標(biāo)構(gòu)造方面,由Lei等[1-3]的研究可知,健康指標(biāo)通常可分為兩類(lèi):一類(lèi)是物理指標(biāo),如均方根、峭度[4]等一些傳統(tǒng)的統(tǒng)計(jì)特征,或如Wang等[5-6]研究中的基于等效循環(huán)能量、振動(dòng)信號(hào)功率譜密度構(gòu)造的健康指標(biāo);另一類(lèi)是融合指標(biāo),即提取原始信號(hào)的時(shí)域、頻域等統(tǒng)計(jì)特征,并通過(guò)主成分分析(principal component analysis,PCA)、局部保持投影等算法構(gòu)造的指標(biāo)。但這兩類(lèi)指標(biāo)的構(gòu)造都過(guò)于依賴先驗(yàn)知識(shí),需要人為地提取與篩選特征,構(gòu)造方法難以適用于不同任務(wù)。存在通用性不強(qiáng)、自適應(yīng)能力差的問(wèn)題。而深度神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的特征發(fā)掘與特征學(xué)習(xí)能力,能夠?qū)崿F(xiàn)在原始數(shù)據(jù)中自動(dòng)提取特征、降維等操作。因此,近年來(lái)借助卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN),深度信念網(wǎng)絡(luò)[7]以及堆疊自編碼器等深度學(xué)習(xí)模型的健康指標(biāo)構(gòu)造方法被提出,但其中多數(shù)方法仍存在依賴人為標(biāo)注標(biāo)簽以進(jìn)行監(jiān)督訓(xùn)練的問(wèn)題。
在建立退化趨勢(shì)預(yù)測(cè)模型方面,較為常見(jiàn)的預(yù)測(cè)模型包括:自回歸模型,BP(back propagation)神經(jīng)網(wǎng)絡(luò),最小二乘支持向量機(jī)等[8],但以上傳統(tǒng)機(jī)器學(xué)習(xí)模型在處理非線性較強(qiáng)的健康指標(biāo)時(shí)存在一定局限性,預(yù)測(cè)精度不足。而諸如長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)、門(mén)控循環(huán)單元網(wǎng)絡(luò)(gated recurrent unit,GRU)等專(zhuān)門(mén)為序列預(yù)測(cè)任務(wù)設(shè)計(jì)的深度學(xué)習(xí)模型,具有強(qiáng)大的特征提取與非線性映射能力,在預(yù)測(cè)精度上往往優(yōu)于一般機(jī)器學(xué)習(xí)模型,且其各類(lèi)變體與改進(jìn)模型層出不窮,李峰等[9]將量子計(jì)算技術(shù)引入門(mén)控循環(huán)單元網(wǎng)絡(luò)進(jìn)行改進(jìn),提升了網(wǎng)絡(luò)的收斂效率與預(yù)測(cè)精度。Wang等[10]使用飛蛾撲火優(yōu)化算法對(duì)GRU模型進(jìn)行自適應(yīng)參數(shù)選擇,提升了網(wǎng)絡(luò)預(yù)測(cè)效果的穩(wěn)定性。Wang等[11]在長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)中接入多個(gè)卷積層以增強(qiáng)網(wǎng)絡(luò)的特征提取能力,從而提升對(duì)健康指標(biāo)的預(yù)測(cè)精度。時(shí)間卷積網(wǎng)絡(luò)(temporal convolution network,TCN)是2017年提出的一種用于序列預(yù)測(cè)任務(wù)的深度學(xué)習(xí)模型,目前已應(yīng)用在音頻合成、機(jī)器翻譯等方面,且在較多情況下取得了較循環(huán)神經(jīng)網(wǎng)絡(luò)更優(yōu)的表現(xiàn)。而在退化趨勢(shì)預(yù)測(cè)方面,其研究依然尚缺。雖在于重重等[12-13]的研究中作為預(yù)測(cè)模型被用于滾動(dòng)軸承的退化趨勢(shì)預(yù)測(cè)任務(wù),但研究中發(fā)現(xiàn),其訓(xùn)練時(shí)存在收斂效果不穩(wěn)定、收斂速度較慢的問(wèn)題,影響其最終的預(yù)測(cè)精度,有待改進(jìn)。
因此,為解決以上問(wèn)題,本文提出一種基于改進(jìn)時(shí)間卷積網(wǎng)絡(luò)的退化趨勢(shì)預(yù)測(cè)模型:密集時(shí)間卷積網(wǎng)絡(luò)(densely temporal convolution network,DTCN)。首先,基于Dense-Net中的密集連接結(jié)構(gòu)對(duì)最初的TCN進(jìn)行改進(jìn),通過(guò)進(jìn)一步增加網(wǎng)絡(luò)的內(nèi)部連接,增強(qiáng)對(duì)各卷積層所提取特征的復(fù)用,進(jìn)而提升網(wǎng)絡(luò)的預(yù)測(cè)性能以及訓(xùn)練時(shí)的穩(wěn)定性;隨后,通過(guò)對(duì)卷積自編碼網(wǎng)絡(luò)(convolutional auto-encoders,CAE)進(jìn)行無(wú)監(jiān)督訓(xùn)練提取特征,并結(jié)合隱馬爾可夫模型(hidden Markov model,HMM)建立回轉(zhuǎn)支承健康指標(biāo),驗(yàn)證本文所提方法的有效性以及在預(yù)測(cè)效果上的優(yōu)越性。
健康指標(biāo)是反映回轉(zhuǎn)支承性能退化狀況的關(guān)鍵指示量,也是進(jìn)行下一步退化趨勢(shì)預(yù)測(cè)的基礎(chǔ)。以往傳統(tǒng)的構(gòu)造方式中,如均方根(root mean square,RMS)、峭度等物理指標(biāo),雖然其構(gòu)造方式簡(jiǎn)單,但所包含的退化信息有限,難以全面的反映退化過(guò)程。而融合指標(biāo)如基于多種時(shí)、頻域特征的PCA指標(biāo)、HMM指標(biāo),則需針對(duì)不同構(gòu)造對(duì)象,人為篩選退化趨勢(shì)明顯的特征,通用性較差。因此,本文采用深度學(xué)習(xí)方法結(jié)合卷積自編碼網(wǎng)絡(luò)與隱馬爾可夫模型進(jìn)行回轉(zhuǎn)支承的健康指標(biāo)的構(gòu)造。
卷積自編碼網(wǎng)絡(luò)[14]是堆疊自編碼網(wǎng)絡(luò)的一種延伸,兩者具有相似的網(wǎng)絡(luò)結(jié)構(gòu),均由編碼器與解碼器兩部分網(wǎng)絡(luò)組成:編碼器負(fù)責(zé)將輸入數(shù)據(jù)映射到低維空間,輸出編碼特征;解碼器負(fù)責(zé)將編碼特征進(jìn)行重構(gòu)以得到近似的輸入數(shù)據(jù)。但卷積自編碼中使用卷積層代替以往的全連接層,因而具有更強(qiáng)的非線性映射能力。卷積自編碼網(wǎng)絡(luò)的無(wú)監(jiān)督訓(xùn)練過(guò)程,如圖1所示。其中編碼器網(wǎng)絡(luò)通過(guò)堆疊多個(gè)卷積層構(gòu)成,對(duì)于任意一個(gè)單通道輸入x,其多層映射可表示為
圖1 自編碼網(wǎng)絡(luò)的無(wú)監(jiān)督訓(xùn)練方法Fig.1 Unsupervised training method for auto-encoder
hk=σ(x*Wk+bk)
(1)
式中:hk為第k層的網(wǎng)絡(luò)輸出;σ為激活函數(shù);“*”為卷積運(yùn)算;Wk與bk分別為權(quán)重與偏差。解碼器網(wǎng)絡(luò)以編碼器所輸出的編碼特征作為輸入,通過(guò)多個(gè)堆疊的反卷積層得到與原始輸入尺寸一致的重構(gòu)輸入,其運(yùn)算過(guò)程可由式(2)表示
(2)
本文借助卷積自編碼網(wǎng)絡(luò)從原始試驗(yàn)數(shù)據(jù)中自適應(yīng)的提取特征,并基于所提取特征對(duì)HMM進(jìn)行訓(xùn)練,進(jìn)而得到回轉(zhuǎn)支承的健康指標(biāo),其流程如圖2所示,主要步驟包括:
圖2 基于卷積自編碼器與隱馬爾可夫的HI構(gòu)造Fig.2 HI construction based on CAE and HMM
步驟1將原始試驗(yàn)數(shù)據(jù)輸入卷積自編碼網(wǎng)絡(luò)進(jìn)行無(wú)監(jiān)督訓(xùn)練,訓(xùn)練過(guò)程包括——從訓(xùn)練數(shù)據(jù)輸入網(wǎng)絡(luò)后的前向傳播得到重構(gòu)輸入;以及計(jì)算與原始輸入之間的重構(gòu)誤差并反向傳播更新網(wǎng)絡(luò)參數(shù);最終得到訓(xùn)練后的模型。
步驟2將全部數(shù)據(jù)輸入訓(xùn)練后的卷積自編碼網(wǎng)絡(luò),提取編碼器網(wǎng)絡(luò)所輸出的多維特征,并構(gòu)造特征矩陣。
步驟3取正常階段數(shù)據(jù)輸入卷積自編碼網(wǎng)絡(luò)后所提取的特征訓(xùn)練HMM,得到模型參數(shù)λ。
步驟4將全部特征集作為觀察矩陣O輸入訓(xùn)練后的HMM,計(jì)算似然概率值P(O|λ),并對(duì)其進(jìn)行長(zhǎng)度5的滑動(dòng)平均,作為最終的健康指標(biāo)。
時(shí)間卷積網(wǎng)絡(luò)的基本結(jié)構(gòu)組成包括以下。
2.1.1 一維全卷積
時(shí)間卷積網(wǎng)絡(luò)中使用了一維卷積,目的是應(yīng)對(duì)一維的時(shí)序信號(hào)作為輸入,全卷積網(wǎng)絡(luò)的設(shè)計(jì)是指該卷積層通過(guò)對(duì)輸入數(shù)據(jù)進(jìn)行“補(bǔ)零”的方式,實(shí)現(xiàn)輸入與輸出等長(zhǎng)。
2.1.2 因果卷積
TCN中的因果卷積,其目的是要保證在序列預(yù)測(cè)任務(wù)中,當(dāng)對(duì)第t時(shí)刻進(jìn)行預(yù)測(cè)時(shí),僅能使用該時(shí)刻前的數(shù)據(jù),避免出現(xiàn)將未來(lái)的數(shù)據(jù)用于預(yù)測(cè)的所謂數(shù)據(jù)“漏接”的情況[15]。假設(shè)輸入序列{x0,x1,…,xN},預(yù)測(cè)t時(shí)刻的輸出yt,因果卷積的作用就是防止t時(shí)刻之后的數(shù)據(jù){xt+1,xt+2,…,xN}作為輸入用于預(yù)測(cè)。
2.1.3 擴(kuò)張卷積
擴(kuò)張卷積是CNN中的一種經(jīng)典架構(gòu),其作用是能夠成指數(shù)倍的擴(kuò)大CNN的感受野,在不改變卷積層輸出尺寸的同時(shí),提升網(wǎng)絡(luò)的性能。其主要通過(guò)在普通卷積核的基礎(chǔ)上插入間隔的方式實(shí)現(xiàn)。
(3)
式中:k為卷積核尺寸;d為擴(kuò)張系數(shù);下標(biāo)s-d·i為上一層第s-d·i元素;下標(biāo)i為第i個(gè)卷積層。由式(3)可知,影響該網(wǎng)絡(luò)感受的參數(shù)為卷積核的尺寸與擴(kuò)張系數(shù),此外,擴(kuò)張系數(shù)的大小與卷積層數(shù)密切相關(guān)
d=O(2i)
(4)
卷積層的層數(shù)同樣是影響該網(wǎng)絡(luò)性能的一個(gè)重要參數(shù)。因此可確定影響TCN性能的3個(gè)關(guān)鍵參數(shù)為:卷積核尺寸k,卷積層層數(shù)n,擴(kuò)張系數(shù)d。
2.1.4 殘差連接
由于TCN通常會(huì)采用增加層數(shù)的方式來(lái)確保足夠大的感受野,這就導(dǎo)致了在某些情況下出現(xiàn)網(wǎng)絡(luò)層數(shù)過(guò)多的問(wèn)題。因此,Res-Net網(wǎng)絡(luò)中的一種跨層連接結(jié)構(gòu)Residual-block被采用。
殘差連接是深度卷積神經(jīng)網(wǎng)絡(luò)中的一種重要結(jié)構(gòu),通過(guò)建立間隔兩層的跨層連接增強(qiáng)對(duì)卷積層輸出特征圖的復(fù)用,提升網(wǎng)絡(luò)的性能,同時(shí)也能有效避免因?qū)訑?shù)過(guò)多導(dǎo)致的梯度消散或梯度爆炸的問(wèn)題。這種跨層連接方式的表達(dá)式為
xl=Hl-1(xl-1)+xl-1
(5)
式中:H(·)為第l層的非線性變換;xl為第l層的輸出。
在對(duì)實(shí)驗(yàn)室回轉(zhuǎn)支承全壽命數(shù)據(jù)進(jìn)行退化趨勢(shì)預(yù)測(cè)的代碼試驗(yàn)中發(fā)現(xiàn),TCN的預(yù)測(cè)效果不穩(wěn)定,并不總能達(dá)到最優(yōu);而且在網(wǎng)絡(luò)的收斂速度上,相較于其他用于序列預(yù)測(cè)的深度學(xué)習(xí)模型(如LSTM,GRU等)較為緩慢,迭代次數(shù)要達(dá)到LSTM迭代次數(shù)的4倍~5倍才能達(dá)到相近或者更優(yōu)的預(yù)測(cè)效果。針對(duì)這一問(wèn)題,嘗試借鑒Dense-Net中的密集連接結(jié)構(gòu)對(duì)TCN進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)上的改進(jìn)。
2.2.1 Dense-Net
Dense-Net是Huang等[16]于2017年提出的一種深層卷積網(wǎng)絡(luò),該網(wǎng)絡(luò)在Res-Net基礎(chǔ)上,將原有的跨層連接方式進(jìn)行拓展,提出了一種不同卷積層之間更為密集的連接方式。Dense-Net中的密集連接結(jié)構(gòu)Dense-block使得網(wǎng)絡(luò)中的每一層都從前面的所有層獲得額外的輸入,并將該層的輸出特征映射傳遞給后面的所有層。同時(shí),區(qū)別于Res-Net中將不同層輸出特征升降維后相加的特征合并方式,Dense-Net將不同層的輸出特征沿某一維度進(jìn)行拼接,保障了信息的完整性,同時(shí)最大程度保障了網(wǎng)絡(luò)的內(nèi)部信息流通。
Dense-Net中將任意一層連接至所有后續(xù)層的密集連接方式可以由式(6)表示,xl為Dense-Net中第l層的輸入,[x0,x1,…,xl-1]為從第一層到第l-1層輸入的拼接,Hl為第l層進(jìn)行的非線性變換,l為所在的層數(shù)。
xl=Hl([x0,x1,…,xl-1])
(6)
2.2.2 模型結(jié)構(gòu)改進(jìn)
本文使用Dense-net中的密集連接結(jié)構(gòu)替換時(shí)間卷積網(wǎng)絡(luò)中的殘差連接結(jié)構(gòu),得到改進(jìn)后的密集時(shí)間卷積網(wǎng)絡(luò)DTCN。
原始的時(shí)間卷積網(wǎng)絡(luò),是由多個(gè)時(shí)間卷積模塊堆疊而成的,每個(gè)時(shí)間卷積模塊中都包含兩個(gè)擴(kuò)張因果卷積層。如圖3所示,該模塊結(jié)構(gòu)為:擴(kuò)張因果卷積-BN-ReLU-擴(kuò)張因果卷積-BN-ReLU,以及一個(gè)支路的跨層連接,其中包含一個(gè)1×1卷積用于調(diào)整數(shù)據(jù)的通道數(shù),起到升降維度的作用。(BN為批正則化操作,ReLU為激活函數(shù))。
圖3 改進(jìn)前TCN結(jié)構(gòu)(局部)Fig.3 TCN structure before improvement(part)
本文主要對(duì)網(wǎng)絡(luò)中的時(shí)間卷積模塊進(jìn)行改動(dòng),改動(dòng)后的每個(gè)時(shí)間卷積模塊中只含有一個(gè)擴(kuò)張因果卷積,每個(gè)時(shí)間卷積模塊之間通過(guò)Dense-Net中的密集連接方式建立連接,增強(qiáng)網(wǎng)絡(luò)內(nèi)部的信息流通與特征的復(fù)用,進(jìn)而提升網(wǎng)絡(luò)的預(yù)測(cè)性能。每個(gè)時(shí)間卷積模塊的結(jié)構(gòu)為:BN-ReLU-1×1卷積-BN-ReLU-擴(kuò)張因果卷積,如圖4所示。通過(guò)多個(gè)模塊的堆疊得到最終的網(wǎng)絡(luò)。
圖4 改進(jìn)后DTCN結(jié)構(gòu)(局部)Fig.4 The improved DTCN structure(part)
回轉(zhuǎn)支承退化趨勢(shì)預(yù)測(cè)的一般流程包括:健康指標(biāo)構(gòu)造、訓(xùn)練預(yù)測(cè)模型、模型測(cè)試三部分,如圖5所示。
圖5 退化趨勢(shì)預(yù)測(cè)流程Fig.5 Prediction process of degradation trend
其中,DTCN的訓(xùn)練過(guò)程如下。
設(shè)長(zhǎng)度為n的HI序列數(shù)據(jù)為{x1,x2,…,xn},將其按一定比例劃分,得到訓(xùn)練數(shù)據(jù){x1,x2,…,xm}與測(cè)試數(shù)據(jù){xm+1,xm+2,…,xn}。隨后,按預(yù)測(cè)模型的輸入維度l進(jìn)一步將數(shù)據(jù)劃分為形如式(7)的訓(xùn)練集與測(cè)試集,每一行代表一個(gè)樣本。式(8)為訓(xùn)練集對(duì)應(yīng)的期望輸出,將其與訓(xùn)練集樣本輸入網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練。當(dāng)損失函數(shù)不再明顯下降時(shí),保存DTCN模型參數(shù)訓(xùn)練結(jié)束。
(7)
Xtrain_label=[xl+1,xl+2,…,xm]
(8)
為進(jìn)一步驗(yàn)證該預(yù)測(cè)模型的可行性,使用本課題組自主研發(fā)的回轉(zhuǎn)支承試驗(yàn)臺(tái)對(duì)某型號(hào)單排球回轉(zhuǎn)支承進(jìn)行加速壽命試驗(yàn),采集其振動(dòng)加速度數(shù)據(jù)進(jìn)行驗(yàn)證。
回轉(zhuǎn)支承試驗(yàn)臺(tái)由加載蓋、上下法蘭及支架等構(gòu)成的機(jī)械部分,以及由液壓缸、液壓馬達(dá)組成的液壓部分共同完成回轉(zhuǎn)支承的加載與旋轉(zhuǎn),如圖6所示?;剞D(zhuǎn)支承在規(guī)定載荷下運(yùn)行至發(fā)生破壞停止工作,具體的試驗(yàn)方案參考Lu等的研究。整個(gè)試驗(yàn)過(guò)程共進(jìn)行了12 d,采集到從正常階段到嚴(yán)重退化階段的全壽命振動(dòng)加速度數(shù)據(jù),如圖7所示。
圖6 回轉(zhuǎn)支承試驗(yàn)臺(tái)Fig.6 Slewing bearing test bench
圖7 全壽命數(shù)據(jù)Fig.7 Life cycle data
按照第1章中所述的HI構(gòu)造流程,基于4.1節(jié)獲得的加速壽命試驗(yàn)數(shù)據(jù)建立HI,對(duì)改進(jìn)模型DTCN的預(yù)測(cè)效果進(jìn)行驗(yàn)證。同時(shí),為驗(yàn)證該自編碼指標(biāo)的優(yōu)勢(shì),選取幾種常用的HI進(jìn)行對(duì)比,包括:①RMS指標(biāo);②通過(guò)PCA融合多種時(shí)、頻域特征構(gòu)造的融合指標(biāo);③通過(guò)隱馬爾可夫模型結(jié)合多種時(shí)、頻域特征所建立的指標(biāo)。
文獻(xiàn)[17]綜述了能夠用于反映回轉(zhuǎn)支承性能退化的多類(lèi)特征,人為篩選出4種退化趨勢(shì)明顯的時(shí)域特征:峰峰值、方差、均方根、峭度。以及3種頻域特征:中心頻率、均方根頻率、均值頻率。將這些特征組成特征集,用于構(gòu)造上述②③兩種健康指標(biāo)HI。同時(shí),為避免滑動(dòng)平均對(duì)HI的評(píng)價(jià)結(jié)果造成影響,以上3種HI在構(gòu)造時(shí)均進(jìn)行了與本文HI相同的滑動(dòng)平均處理。全部的HI如圖8所示。
圖8 4種健康指標(biāo)HI對(duì)比Fig.8 Comparison of four health indicators
為了定量的評(píng)價(jià)不同健康指標(biāo)HI的優(yōu)劣,本文選擇時(shí)間關(guān)聯(lián)性和單調(diào)性以及魯棒性作為其評(píng)價(jià)指標(biāo)[18],如式(9)~式(11)所示。其中:時(shí)間相關(guān)性表示HI與時(shí)間的線性相關(guān)程度;單調(diào)性表示HI持續(xù)增加或減少的趨勢(shì);魯棒性能夠表示對(duì)異常值的容忍程度。
(9)
(10)
(11)
由于每種評(píng)價(jià)指標(biāo)僅能評(píng)價(jià)HI的部分屬性,難以全面地評(píng)價(jià)HI的適用性,因此,文中使用將3種度量進(jìn)行混合的HI評(píng)價(jià)方式,即計(jì)算其綜合得分,如式(12)。
(12)
根據(jù)式(9)~式(11)可得到不同構(gòu)造方法下健康指標(biāo)的量化指標(biāo)評(píng)價(jià)結(jié)果及綜合得分Score,如表1所示。通過(guò)對(duì)比可知,本文方法所構(gòu)造的健康指標(biāo),雖然3種評(píng)價(jià)指標(biāo)并不能全部達(dá)到最優(yōu),但均與其他HI相近,且具有最優(yōu)的綜合評(píng)分,因此,認(rèn)為該指標(biāo)能夠較好的反映回轉(zhuǎn)支承全壽命周期內(nèi)的性能退化狀況。同時(shí),相較于PCA與HMM方法所建立的指標(biāo),該指標(biāo)構(gòu)造方法無(wú)需針對(duì)不同對(duì)象進(jìn)行人為的特征提取與篩選,降低了對(duì)于先驗(yàn)知識(shí)的依賴,具有通用性更強(qiáng)的優(yōu)點(diǎn)。
表1 不同健康指標(biāo)的量化指標(biāo)評(píng)價(jià)結(jié)果Tab.1 Evaluation results of quantitative indicators of different health indicators
在得到4.2節(jié)中的退化指標(biāo)后,將其劃分為訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù),用于模型訓(xùn)練及驗(yàn)證??紤]到應(yīng)盡早發(fā)現(xiàn)并掌握回轉(zhuǎn)支承的性能退化情況,結(jié)合圖8中所建立的不同健康指標(biāo),取正常狀態(tài)與初期退化狀態(tài)數(shù)據(jù)作為訓(xùn)練集,將開(kāi)始出現(xiàn)顯著退化后的數(shù)據(jù)作為測(cè)試集,最終數(shù)據(jù)集劃分為70%的訓(xùn)練數(shù)據(jù)與30%的測(cè)試數(shù)據(jù),如圖9所示。
圖9 CAE-HI的訓(xùn)練集測(cè)試集劃分Fig.9 Data set partitioning for CAE-HI
為評(píng)價(jià)不同預(yù)測(cè)模型的預(yù)測(cè)準(zhǔn)確性,以下均采用均方誤差(mean square error,MSE,公式中為EMS)作為預(yù)測(cè)效果的評(píng)價(jià)指標(biāo),通過(guò)計(jì)算健康指標(biāo)HI預(yù)測(cè)值與真實(shí)值的差異反映預(yù)測(cè)效果。
(13)
由2.1節(jié)的介紹可知,對(duì)TCN預(yù)測(cè)性能有較大影響的幾個(gè)參數(shù)包括:卷積層數(shù)(范圍2~6),卷積核個(gè)數(shù)(范圍22~32),卷積核尺寸(范圍3~15);因此,首先對(duì)以上參數(shù)進(jìn)行討論,依次分別調(diào)整3個(gè)參數(shù),觀察對(duì)最終預(yù)測(cè)誤差的影響。參數(shù)按照C-N-S的形式表示:C為擴(kuò)張因果卷積的層數(shù),N為卷積核的個(gè)數(shù),S為卷積核尺寸,如表2所示。
由表2可知,在一定范圍內(nèi)改變超參數(shù)時(shí),相較于原始的TCN,DTCN預(yù)測(cè)誤差的上下浮動(dòng)范圍更小,且預(yù)測(cè)效果普遍優(yōu)于TCN,說(shuō)明DTCN具有一定的泛化性,對(duì)參數(shù)的變化并不敏感,能夠在不同參數(shù)下保持相對(duì)不錯(cuò)的預(yù)測(cè)效果,在實(shí)際應(yīng)用中,這一特性能夠使模型在保證性能的同時(shí),大大減少人為調(diào)參的工作量。此外,在逐漸增大某一超參數(shù)時(shí),發(fā)現(xiàn)預(yù)測(cè)誤差的變化并不規(guī)律。因此,為確定其最優(yōu)參數(shù),本文在TCN原論文所提供的參數(shù)范圍內(nèi)對(duì)3種參數(shù)進(jìn)行網(wǎng)格搜索,最終確定最優(yōu)超參數(shù)為6-27-15,其預(yù)測(cè)誤差為0.004 8。在DTCN的訓(xùn)練中,其他超參數(shù)設(shè)置為:網(wǎng)絡(luò)的輸入維度為10,輸出維度為1,最大迭代次數(shù)為1 000,使用Lookahead+Adam優(yōu)化器,Dropout比率為0.5,訓(xùn)練中引入Early-stopping機(jī)制防止過(guò)擬合。由于這些超參數(shù)對(duì)模型性能的影響相對(duì)較弱,故此處暫不討論。
表2 不同超參數(shù)對(duì)DTCN與TCN預(yù)測(cè)效果的影響Tab.2 Influence of different hyper-parameters on the prediction effect of DTCN and TCN
隨后,對(duì)本文所提改進(jìn)模型DTCN的有效性進(jìn)行驗(yàn)證,損失函數(shù)曲線能夠較為直觀的反映一個(gè)模型的收斂情況。因此,將TCN改進(jìn)前后的損失函數(shù)曲線進(jìn)行對(duì)比。DTCN使用以上確定的參數(shù),TCN的超參數(shù)按于重重等研究中的設(shè)置并同樣進(jìn)行網(wǎng)格搜索,保證其達(dá)到最優(yōu)效果。以對(duì)指標(biāo)HMM-HI的預(yù)測(cè)為例,通過(guò)對(duì)比圖10中TCN改進(jìn)前后的損失函數(shù)曲線可以發(fā)現(xiàn),DTCN的收斂效果明顯改善,損失函數(shù)的下降速度更快、波動(dòng)更小,這說(shuō)明收斂更加穩(wěn)定。同時(shí),損失函數(shù)最終能下降到更小的值,說(shuō)明DTCN預(yù)測(cè)效果較TCN更優(yōu),證明了本文中對(duì)DTCN網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)是有效的。
圖10 DTCN與TCN損失函數(shù)對(duì)比Fig.10 Comparison of loss between TCN and TCN
為充分驗(yàn)證DTCN在預(yù)測(cè)效果上的優(yōu)越性,將本文所提的改進(jìn)模型與原始TCN、以及目前在序列預(yù)測(cè)領(lǐng)域較常用的LSTM、GRU進(jìn)行對(duì)比。由于4.2節(jié)中所構(gòu)造的4種HI均呈現(xiàn)出明顯的指數(shù)上升趨勢(shì),因此,使用指數(shù)函數(shù)模型對(duì)不同HI進(jìn)行擬合并預(yù)測(cè)退化趨勢(shì)的方法同樣被引入進(jìn)行對(duì)比。其中,LSTM與GRU的參數(shù)設(shè)置可參見(jiàn)Wang等的研究,不同神經(jīng)網(wǎng)絡(luò)模型設(shè)置相同的輸入、輸出維度,以保證對(duì)比的客觀性。指數(shù)函數(shù)模型,由式(14)分別對(duì)不同HI的訓(xùn)練數(shù)據(jù)進(jìn)行擬合實(shí)現(xiàn)預(yù)測(cè),其中a、b為擬合中確定的模型系數(shù)。5種不同模型的最終的預(yù)測(cè)誤差如表3所示,部分預(yù)測(cè)結(jié)果如圖11所示。
表3 不同模型的預(yù)測(cè)誤差Tab.3 Prediction errors of different models
f(x)=a·eb·x
(14)
由表3對(duì)比最終的預(yù)測(cè)結(jié)果可知,原始TCN網(wǎng)絡(luò)僅在對(duì)某些指標(biāo)如PCA-HI、CAE-HI進(jìn)行預(yù)測(cè)時(shí),具有與LSTM、GRU相近的預(yù)測(cè)性能;而在對(duì)其他兩類(lèi)指標(biāo)進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)誤差較大,結(jié)合在表1超參數(shù)討論中,其不同參數(shù)下預(yù)測(cè)性能的較大差異,暴露了TCN所存在的預(yù)測(cè)性能不穩(wěn)定的問(wèn)題。LSTM與GRU作為兩種目前常用的序列預(yù)測(cè)模型,在對(duì)不同指標(biāo)的預(yù)測(cè)中表現(xiàn)出了相對(duì)穩(wěn)健的預(yù)測(cè)性能。指數(shù)函數(shù)模型的預(yù)測(cè)方法操作簡(jiǎn)單,基本能夠預(yù)測(cè)出HI的增長(zhǎng)趨勢(shì),但綜合來(lái)看,其對(duì)于HI細(xì)節(jié)變化的預(yù)測(cè)能力并不突出,預(yù)測(cè)誤差相對(duì)較大。說(shuō)明其在HI的長(zhǎng)期預(yù)測(cè)中可能更為適用。由圖11的預(yù)測(cè)結(jié)果可以看出,以上4種模型均能夠進(jìn)行退化趨勢(shì)預(yù)測(cè),較好的跟蹤回轉(zhuǎn)支承健康指標(biāo)的變化情況;但本文所提的DTCN模型在對(duì)不同健康指標(biāo)HI進(jìn)行預(yù)測(cè)時(shí),均能達(dá)到遠(yuǎn)低于其他模型的預(yù)測(cè)誤差,平均預(yù)測(cè)誤差下降71%以上,對(duì)健康指標(biāo)變化趨勢(shì)的反映更加準(zhǔn)確,說(shuō)明了DTCN在預(yù)測(cè)效果上具有優(yōu)越性,也具有一定的泛化性。由于DTCN采用了多個(gè)時(shí)間卷積模塊堆疊結(jié)構(gòu),當(dāng)網(wǎng)絡(luò)逐漸加深時(shí),其中的密集連接結(jié)構(gòu)將會(huì)帶來(lái)較大的參數(shù)量,對(duì)其運(yùn)算效率造成影響。因此,嘗試對(duì)DTCN進(jìn)行一些輕量化改進(jìn),從而保證其高效且準(zhǔn)確是今后將要研究的內(nèi)容。
(a)DTCN預(yù)測(cè)結(jié)果
本文的主要工作集中在退化趨勢(shì)預(yù)測(cè)中的預(yù)測(cè)模型方面。首先,通過(guò)將無(wú)監(jiān)督訓(xùn)練的卷積自編碼網(wǎng)絡(luò)與隱馬爾可夫模型結(jié)合,嘗試構(gòu)造了一種深度學(xué)習(xí)健康指標(biāo);隨后,使用時(shí)間卷積網(wǎng)絡(luò)對(duì)建立的回轉(zhuǎn)支承健康指標(biāo)進(jìn)行預(yù)測(cè),并通過(guò)將Dense-Net中的密集連接結(jié)構(gòu)引入TCN,代替以往殘差模塊的方式對(duì)其進(jìn)行改進(jìn),通過(guò)試驗(yàn)驗(yàn)證得到以下結(jié)論:
(1)DTCN增強(qiáng)了網(wǎng)絡(luò)內(nèi)部的信息流通,使卷積層所提取的特征能被盡可能多的利用,從而促進(jìn)網(wǎng)絡(luò)收斂,提升預(yù)測(cè)效果。
(2)通過(guò)其他序列預(yù)測(cè)模型預(yù)測(cè)結(jié)果的對(duì)比可知,相較于原始TCN,DTCN的預(yù)測(cè)效果與收斂速度有顯著提升,相較于LSTM與GRU,本文所提方法在預(yù)測(cè)效果上也更加精確。
(3)基于卷積自編碼網(wǎng)絡(luò)的健康指標(biāo),具有與其他健康指標(biāo)相近的評(píng)價(jià)結(jié)果,能夠用于反映回轉(zhuǎn)支承的性能退化狀況;同時(shí)擺脫了對(duì)于人為提取、篩選特征的依賴,構(gòu)造方式更加通用。
因此,本文所提的DTCN預(yù)測(cè)模型能夠較好地預(yù)測(cè)回轉(zhuǎn)支承健康指標(biāo)的退化趨勢(shì),準(zhǔn)確反映回轉(zhuǎn)支承的性能退化狀況,對(duì)及早發(fā)現(xiàn)潛在故障并進(jìn)行維護(hù)有積極作用。