摘" 要:為提高自動(dòng)扶梯軸承剩余使用壽命(RUL)預(yù)測(cè)模型的預(yù)測(cè)精度和泛化能力,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的軸承RUL預(yù)測(cè)方法。首先基于3σ準(zhǔn)則對(duì)原始數(shù)據(jù)進(jìn)行去噪,通過(guò)快速傅里葉變換獲得其頻率特征,其次將不同于傳統(tǒng)時(shí)間序列數(shù)據(jù)劃分方法的分層抽樣應(yīng)用于數(shù)據(jù)劃分,并構(gòu)造一個(gè)由三個(gè)卷積層和兩個(gè)全連通層組成的深度卷積神經(jīng)網(wǎng)絡(luò)DCNN模型,最后利用NASA IMS數(shù)據(jù)集對(duì)預(yù)處理方法、DCNN模型精度和泛化能力進(jìn)行評(píng)估,證明了該方法的優(yōu)越性。
關(guān)鍵詞:剩余壽命預(yù)測(cè);3σ準(zhǔn)則;分層抽樣;DCNN;泛化能力
中圖分類號(hào):TP391;TH133.3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2024)10-0032-06
Prediction Method for Bearing Remaining Useful Life Based on
Convolutional Neural Networks
ZHANG Hao1, ZHAO Jun1, WANG Lu1, ZHANG Yinlong2, CHENG Siyu2
(1.Nanjing Metro Construction Co., Ltd., Nanjing" 211806, China;
2.China Railway Siyuan Survey and Design Group Co., Ltd., Wuhan" 430063, China)
Abstract: To improve the prediction accuracy and generalization ability of the Remaining Useful Life (RUL) prediction model for escalator bearings, a bearing RUL prediction method based on Convolutional Neural Network (CNN) is proposed. Firstly, it denoises the original data based on 3σ criterion, obtains its frequency characteristics through fast Fourier transformation. Secondly, it applies layered sampling different from traditional time series data partitioning methods to data partitioning, and constructs a Deep Convolutional Neural Network (DCNN) model consisting of three convolutional layers and two fully connected layers. Finally, the NASA IMS dataset is used to evaluate the preprocessing method, DCNN model accuracy, and generalization ability, proving the superiority of this method.
Keywords: RUL prediction; 3σ criterion; layered sampling; DCNN; generalization ability
0" 引" 言
自動(dòng)扶梯軸承剩余使用壽命(Remain Useful Life, RUL)預(yù)測(cè)對(duì)公共安全極其重要,精確的RUL預(yù)測(cè)可以減少自動(dòng)扶梯的維修停梯時(shí)間,提高運(yùn)營(yíng)效益并降低運(yùn)營(yíng)成本[1-3],確保采取適當(dāng)?shù)木S護(hù)決策[4],避免扶梯設(shè)備造成的人員傷亡和財(cái)產(chǎn)損失[5],研究和提高自動(dòng)扶梯軸承RUL預(yù)測(cè)技術(shù)的準(zhǔn)確性具有較強(qiáng)的現(xiàn)實(shí)意義[6-8]。
深度學(xué)習(xí)結(jié)合不同的神經(jīng)網(wǎng)絡(luò)可以在RUL預(yù)測(cè)中取得優(yōu)異的結(jié)果,泛化能力是評(píng)價(jià)模型預(yù)測(cè)性能的重要指標(biāo)[9]。基于此,本文提出了一種用于軸承RUL預(yù)測(cè)的方法,利用3σ準(zhǔn)則去除原始數(shù)據(jù)中的粗監(jiān)測(cè)誤差,通過(guò)快速傅里葉變換從時(shí)域數(shù)據(jù)中獲得軸承的頻率特征,基于時(shí)間和頻率特征通過(guò)分層抽樣構(gòu)建訓(xùn)練集和測(cè)試集。如果訓(xùn)練后損失函數(shù)最小,則保存訓(xùn)練后的模型。如果損失函數(shù)不是最小的,則采用反向傳播法來(lái)調(diào)整卷積層和全連接層的權(quán)重W和偏置B,直到損失函數(shù)達(dá)到最小。最后使用測(cè)試數(shù)據(jù)對(duì)訓(xùn)練好的模型進(jìn)行測(cè)試。如果指數(shù)值是最佳的,則獲得預(yù)測(cè)的RUL。如果指數(shù)值不是最優(yōu)的,則調(diào)整訓(xùn)練次數(shù)、核大小和隱藏層深度,以獲得最優(yōu)的指數(shù)值。
1" 數(shù)據(jù)預(yù)處理
1.1" 數(shù)據(jù)去噪
假設(shè)數(shù)據(jù)服從高斯分布,采用3σ準(zhǔn)則來(lái)消除測(cè)量數(shù)據(jù)中的粗差,數(shù)據(jù)分布幾乎完全集中在(μ-3σ,μ+3σ)區(qū)間,超過(guò)該區(qū)間的數(shù)據(jù)比例為0.27%,區(qū)間之外的數(shù)據(jù)在此步驟被去除。
1.2" 時(shí)間和頻率特征選擇
通過(guò)快速傅里葉變換從原始時(shí)域獲取頻率特征,如表1所示。
1.3" 跟蹤度量
跟蹤度量是壽命分析的基礎(chǔ),包括穩(wěn)定性和準(zhǔn)確性,反映軸承振動(dòng)趨勢(shì)和可靠性。均方根值能夠反映整個(gè)數(shù)據(jù)集的變化趨勢(shì),具有合理的穩(wěn)定性,滿足跟蹤指標(biāo)的要求。每組的均方根描述了數(shù)據(jù)集在相應(yīng)時(shí)間點(diǎn)的振動(dòng),整個(gè)數(shù)據(jù)集的均方根反映了振幅的變化趨勢(shì)。均方根值表示為:
其中,xi表示第i點(diǎn)的監(jiān)測(cè)數(shù)據(jù)。
1.4" 標(biāo)準(zhǔn)化
監(jiān)測(cè)數(shù)據(jù)包括軸承運(yùn)行中每個(gè)點(diǎn)的振幅[10]。數(shù)據(jù)中的正負(fù)信號(hào)代表振幅的方向,歸一化數(shù)據(jù)在[0,1]中變化。去噪數(shù)據(jù)被歸一化以避免過(guò)大或過(guò)小的值:
其中,xi表示第i點(diǎn)的監(jiān)測(cè)數(shù)據(jù),xmin和xmax表示數(shù)據(jù)去噪后同一時(shí)間點(diǎn)的最小值和最大值。
1.5" 數(shù)據(jù)分區(qū)
采用分層抽樣的方法對(duì)預(yù)測(cè)模型構(gòu)建訓(xùn)練集和測(cè)試集,學(xué)習(xí)軸承運(yùn)行過(guò)程中各階段的特征。軸承運(yùn)行的完整歷史數(shù)據(jù)包括時(shí)間和頻率特征,根據(jù)時(shí)間序列將其分組。每組包含5個(gè)數(shù)據(jù)點(diǎn),按4:1的比例提取,即每4個(gè)數(shù)據(jù)點(diǎn)中提取1個(gè)數(shù)據(jù)點(diǎn)。提取的數(shù)據(jù)作為測(cè)試集,剩余的數(shù)據(jù)構(gòu)成訓(xùn)練集。
2" 預(yù)測(cè)模型構(gòu)建
2.1" 預(yù)測(cè)模型結(jié)構(gòu)
本文構(gòu)建了一個(gè)基于DCNN的預(yù)測(cè)模型,應(yīng)用ReLU作為激活函數(shù),精確擬合數(shù)據(jù)并進(jìn)行預(yù)測(cè);表達(dá)式如式(4)所示。在DCNN正向傳播中應(yīng)用了丟包來(lái)避免過(guò)擬合,提高了模型的泛化能力,丟包值被設(shè)置為0.7;應(yīng)用損失函數(shù)評(píng)價(jià)模型的準(zhǔn)確性作為反向優(yōu)化的指標(biāo),表達(dá)式如式(5)所示;Adam優(yōu)化算法用于改善結(jié)果。Adam函數(shù)的主要思想是通過(guò)使用梯度的一階矩估計(jì)和二階矩估計(jì)來(lái)調(diào)整每個(gè)參數(shù)的學(xué)習(xí)率。偏差修正后,學(xué)習(xí)率集中在一定范圍內(nèi)穩(wěn)定參數(shù)。使用Adam算法優(yōu)化模型包括4個(gè)步驟:計(jì)算每個(gè)參數(shù)的梯度,如式(6)所示;計(jì)算速度更新量和修改的速度更新量,如式(7)和(8)所示,其可以根據(jù)更新的參數(shù)和梯度累積平方來(lái)動(dòng)態(tài)調(diào)整速度;計(jì)算梯度累積平方和修正梯度累積平方,如式(9)和(10)所示,速度更新量和梯度累積平方是Adam優(yōu)化的關(guān)鍵技術(shù);更新參數(shù),如式(11)所示,其中η表示步長(zhǎng)因子,其取決于速度更新量和梯度累積平方。測(cè)試集被輸入到訓(xùn)練好的模型中以預(yù)測(cè)RUL并分析其可靠性:
其中,ω表示參數(shù),dω表示ω的一階矩,L(ω)表示ω的函數(shù)。
v = β1v + (1 - β1)dω" " " " " " " " " " "(6)
其中,β1表示一階矩估計(jì)的指數(shù)衰減率,v表示速度更新量。
其中, 表示當(dāng)前時(shí)刻第一時(shí)刻估計(jì)的指數(shù)衰減率,v'表示修正的速度更新量。
Sdω = β2Sdω + (1 - β1)dω2" " " " " " " " " " " " " "(8)
其中,β2表示二階矩估計(jì)的指數(shù)衰減率,Sdω是梯度累加平方,dω2表示ω的二階矩。
其中, 表示當(dāng)前時(shí)刻二階矩估計(jì)的指數(shù)衰減率,Sdω'表示修正的梯度累加平方。
輸入特征被轉(zhuǎn)換成一維向量,6個(gè)元素中的每一個(gè)在相同的時(shí)間點(diǎn)對(duì)應(yīng)于6個(gè)特征(如表1所示),使得第一組代表第一時(shí)間點(diǎn)。第一個(gè)卷積層中的核大小是6×1,步長(zhǎng)是6,這意味著核為每個(gè)操作同時(shí)計(jì)算6個(gè)特征。兩個(gè)具有1×1核的卷積層跟隨以增強(qiáng)特征學(xué)習(xí)的能力。第一個(gè)全連接層在卷積后集成了這些功能,第二個(gè)全連接層計(jì)算預(yù)測(cè)結(jié)果。
2.2" 模型評(píng)估
該模型由均方根誤差(Rm)、擬合優(yōu)度(R2)、調(diào)整后的擬合優(yōu)度(調(diào)整后的R2)進(jìn)行評(píng)估。
Rm表示一個(gè)衡量預(yù)測(cè)值和實(shí)際值之間差異的指數(shù)。Rm越接近0,預(yù)測(cè)結(jié)果越準(zhǔn)確,計(jì)算式為:
其中,yi表示實(shí)際值, 表示預(yù)測(cè)值。
R2表示統(tǒng)計(jì)學(xué)中用于評(píng)估回歸模型擬合度的優(yōu)秀標(biāo)準(zhǔn)。R2值通常在[0,1]范圍內(nèi)變化。值越接近1,模型的擬合越好。當(dāng)模型擬合不好時(shí),函數(shù)值接近于0。計(jì)算式為:
其中, 表示平均值,n表示數(shù)據(jù)中的樣本數(shù)。
根據(jù)式(12),當(dāng)樣本數(shù)量相對(duì)較大時(shí),R2增加,因此擬合優(yōu)度可能不能準(zhǔn)確地表示評(píng)估模型的性能,尤其是在大樣本量的情況下。為了克服這個(gè)問(wèn)題,提出了一種調(diào)整的" 來(lái)避免數(shù)據(jù)樣本數(shù)量對(duì)模型評(píng)價(jià)的影響。計(jì)算式為:
其中,n表示數(shù)據(jù)中的樣本數(shù)量,p表示數(shù)據(jù)中的特征數(shù)量。
3" 實(shí)驗(yàn)分析
本文利用NASA IMS數(shù)據(jù)集中的3個(gè)軸承運(yùn)行的監(jiān)測(cè)信息來(lái)進(jìn)行模型驗(yàn)證。每個(gè)軸承都配有一個(gè)傳感器,每次記錄20 480個(gè)點(diǎn)的振動(dòng)。
3.1" 模型比較
選擇RNN、LSTM作為比較模型。為了使比較更有說(shuō)服力和有效性,選擇每個(gè)模型的最優(yōu)預(yù)測(cè)結(jié)果進(jìn)行比較;因此,每個(gè)模型數(shù)據(jù)集的劃分比例是不同的:
1)RNN。為了保證比較的公平性,基于TensorFlow框架構(gòu)建了RNN預(yù)測(cè)模型。將數(shù)據(jù)以8:2的比例分成訓(xùn)練集和測(cè)試集,并構(gòu)建4個(gè)RNN層。最后一層是全連接層。采用ReLU作為激活函數(shù),均方誤差作為損失函數(shù),采用Adam優(yōu)化算法。每層神經(jīng)元分別為33、17、6、1,丟包值設(shè)置為0.7。
2)LSTM?;赥ensorFlow框架,構(gòu)造了一個(gè)具有三個(gè)隱藏層的LSTM預(yù)測(cè)模型。數(shù)據(jù)集按照7:3的比例分為訓(xùn)練集和測(cè)試集。最后一層應(yīng)用ReLU作為激活函數(shù)。損失函數(shù)采用均方誤差,采用Adam優(yōu)化算法。LSTM由四層組成;每層神經(jīng)元分別為35、24、11和1,丟包值設(shè)置為0.7。
3)DCNN。對(duì)于本文提出DCNN模型,數(shù)據(jù)集按照4:1的比例分為訓(xùn)練集和測(cè)試集。
3.2" 模型驗(yàn)證
選擇第二組IMS數(shù)據(jù)集中軸承1的監(jiān)測(cè)數(shù)據(jù)作為模型訓(xùn)練數(shù)據(jù)。通過(guò)兩個(gè)實(shí)驗(yàn)驗(yàn)證了該方法的有效性。實(shí)驗(yàn)一評(píng)估了本文提出數(shù)據(jù)去噪方法的有效性,實(shí)驗(yàn)二評(píng)估了模型的泛化能力。
3.2.1" 實(shí)驗(yàn)一
對(duì)于第1個(gè)軸承的運(yùn)行數(shù)據(jù),使用不同的數(shù)據(jù)預(yù)處理方法(無(wú)去噪、硬閾值去噪、軟閾值去噪和3σ準(zhǔn)則去噪)比較3個(gè)模型(RNN、LSTM、DCNN)的預(yù)測(cè),以確定去噪方法對(duì)預(yù)測(cè)精度的影響:
1)沒(méi)有去噪的數(shù)據(jù)。實(shí)驗(yàn)結(jié)果如圖1所示,RNN和LSTM模型的預(yù)測(cè)曲線與真實(shí)曲線有很大的不同,就95%置信區(qū)間和預(yù)測(cè)誤差而言,最小波動(dòng)出現(xiàn)在DCNN中,各模型的評(píng)價(jià)指標(biāo)如表2所示。
表2中的定量分析表明,各評(píng)價(jià)指標(biāo)的最優(yōu)值為Rm = 0.018 18,R2 = 0.958 46,調(diào)整后的R2 = 0.958 12,均由DCNN模型實(shí)現(xiàn)。綜合定性和定量分析表明,當(dāng)數(shù)據(jù)未去噪時(shí),DCNN模型的預(yù)測(cè)值最接近真實(shí)值。
2)硬閾值去噪。硬閾值去噪在提高精度方面是有效的,結(jié)果如圖2所示,評(píng)價(jià)指標(biāo)如表3所示。
表3中的定量分析表明,除了得分指標(biāo)之外,DCNN可以實(shí)現(xiàn)每個(gè)評(píng)估指標(biāo)的最佳值,因?yàn)榈梅趾瘮?shù)對(duì)高估給出了較大的懲罰,對(duì)預(yù)測(cè)不足給出了較小的懲罰。最優(yōu)值為Rm = 0.057 53,R2 = 0.993 82,調(diào)整后的R2 = 0.993 38。
綜合分析表明,DCNN可以在硬閾值去噪的情況下獲得理想的預(yù)測(cè)結(jié)果,連續(xù)卷積操作有助于提高模型的預(yù)測(cè)能力。
3)3σ準(zhǔn)則去噪。本文提出的3σ準(zhǔn)則去噪后模型的結(jié)果如圖3所示,評(píng)價(jià)指標(biāo)如表4所示。
表5中的定量分析表明,各評(píng)價(jià)指標(biāo)的最優(yōu)值為Rm = 0.005 25,R2 = 0.997 62,調(diào)整后的R2 = 0.997 60,均由DCNN模型實(shí)現(xiàn)。
根據(jù)對(duì)三者的定量分析,用3σ準(zhǔn)則去噪,預(yù)測(cè)值與實(shí)際值最接近。綜合比較后可知采用3σ準(zhǔn)則去噪結(jié)合DCNN可以得到最佳的預(yù)測(cè)結(jié)果。
3.2.2" 實(shí)驗(yàn)二
由于各軸承的退化趨勢(shì)不同,選擇第2、3軸承的運(yùn)行數(shù)據(jù)作為實(shí)驗(yàn)測(cè)試數(shù)據(jù),以驗(yàn)證模型的泛化能力,并評(píng)估模型依賴于每個(gè)數(shù)據(jù)集的性能。實(shí)驗(yàn)一結(jié)果如圖4、圖5所示,3σ準(zhǔn)則去噪最大化了DCNN模型的預(yù)測(cè)精度。為了驗(yàn)證預(yù)測(cè)性能最好的模型(帶3σ去噪的DCNN)的泛化能力,實(shí)驗(yàn)二仍然采用3σ準(zhǔn)則去噪,應(yīng)用3σ準(zhǔn)則去噪時(shí),3個(gè)模型的參數(shù)和結(jié)構(gòu)與實(shí)驗(yàn)一一致。通過(guò)不同的數(shù)據(jù)集驗(yàn)證了模型的泛化能力。
各模型的評(píng)價(jià)統(tǒng)計(jì)如6表所示,不同軸承的最佳評(píng)估指標(biāo)值以粗體顯示,所有這些評(píng)價(jià)指標(biāo)都是通過(guò)DCNN實(shí)現(xiàn)的。
由表可知RNN和LSTM的評(píng)價(jià)指標(biāo)值與DCNN模型存在較大差距;也就是說(shuō),預(yù)測(cè)結(jié)果是最差的,同時(shí)與軸承1的評(píng)價(jià)指標(biāo)也有較大出入反映出其泛化能力也較弱。
表6的綜合分析結(jié)果表明,RNN和LSTM的預(yù)測(cè)能力較差,DCNN對(duì)于不同退化趨勢(shì)的軸承可以獲得較好的預(yù)測(cè)結(jié)果,即DCNN的泛化能力最好。
3.3" 結(jié)果分析
實(shí)驗(yàn)一的結(jié)果分析,如表3至表6所示,表明DCNN模型的預(yù)測(cè)評(píng)價(jià)指標(biāo)值最接近理想值;因此,DCNN模型的預(yù)測(cè)精度最高。通過(guò)3σ準(zhǔn)則去噪預(yù)處理,提高了模型的預(yù)測(cè)評(píng)價(jià)指標(biāo)值,表明3σ準(zhǔn)則去噪效果最好。因此,結(jié)合DCNN模型的3σ準(zhǔn)則去噪預(yù)處理方法對(duì)3個(gè)評(píng)價(jià)指標(biāo)進(jìn)行了優(yōu)化,最優(yōu)值為Rm = 0.005 25,R2 = 0.997 62, = 0.997 60。
實(shí)驗(yàn)二的結(jié)果分析,如表6所示,比較了每個(gè)模型的相應(yīng)評(píng)價(jià)指標(biāo)值。RNN、LSTM模型的相應(yīng)評(píng)價(jià)尺度變化較大,表明RNN、LSTM嚴(yán)重依賴數(shù)據(jù)集,易受數(shù)據(jù)結(jié)構(gòu)的影響,泛化能力弱。對(duì)應(yīng)于DCNN模型的每個(gè)評(píng)估指標(biāo)的值的變化最小。這一發(fā)現(xiàn)表明,該模型對(duì)數(shù)據(jù)集具有很強(qiáng)的適應(yīng)性和最好的泛化能力。DCNN模型預(yù)測(cè)的評(píng)估指數(shù)值的范圍如下:Rm (0.005 25,0.010 84)、R2 (0.993 45,0.997 62)、 (0.993 39,0.997 60),DCNN模型的變異范圍最小,泛化能力最好。
4" 結(jié)" 論
本文提出了一種基于神經(jīng)網(wǎng)絡(luò)理論的軸承RUL預(yù)測(cè)方法,該方法預(yù)測(cè)能力強(qiáng),泛化能力強(qiáng)。通過(guò)3σ準(zhǔn)則法有效地去除了數(shù)據(jù)中的粗監(jiān)測(cè)誤差,提高了模型預(yù)測(cè)精度,得到的評(píng)價(jià)指標(biāo)值比其他去噪方法得到的結(jié)果更接近理想結(jié)果。構(gòu)造了由三個(gè)卷積層和兩個(gè)全連通層組成的DCNN模型。并通過(guò)模型驗(yàn)證實(shí)驗(yàn)表明,基于3σ準(zhǔn)則和分層抽樣結(jié)合DCNN的去噪方法具有最高的預(yù)測(cè)精度和最強(qiáng)的泛化能力。
參考文獻(xiàn):
[1] 梁敏健,彭曉軍,劉德陽(yáng).基于一維卷積神經(jīng)網(wǎng)絡(luò)的自動(dòng)扶梯機(jī)械故障分類研究 [J].測(cè)控技術(shù),2022,41(7):87-92+110.
[2] KHAN S,YAIRI T. A Review on the Application of Deep Learning in System Health Management [J].Mechanical Systems and Signal Processing,2018,107:241-265.
[3] KUNDU P,DARPE A K,KULKARNI M S. Weibull Accelerated Failure Time Regression Model for Remaining Useful Life Prediction of Bearing Working Under Multiple Operating Conditions [J].Mechanical Systems and Signal Processing,2019,134:106302[2023-06-10].https://doi.org/10.1016/j.ymssp.2019.106302.
[4] 關(guān)鵬,張毅.自動(dòng)扶梯軸承健康指標(biāo)提取及剩余壽命預(yù)測(cè)方法研究 [J].機(jī)電工程,2022,39(2):202-209.
[5] LEE J,WU F J,ZHAO W Y,et al. Prognostics and Health Management Design for Rotary Machinery Systems—Reviews, Methodology and Applications [J].Mechanical Systems and Signal Processing,2014,42(1-2):314-334.
[6] LEI Y G,LI N P,GONTARZ S,et al. A Model-Based Method for Remaining Useful Life Prediction of Machinery [J].IEEE Transactions on Reliability,2016,65(3):1314-1326.
[7] 杜澤厚.基于深度學(xué)習(xí)的軸承健康因子構(gòu)建及壽命預(yù)測(cè)研究 [D].青島:青島科技大學(xué),2022.
[8] QIAN Y N,YAN R Q,GAO R X. A Multi-Time Scale Approach to Remaining Useful Life Prediction in Rolling Bearing [J].Mechanical Systems and Signal Processing,2017,83:549-567.
[9] 鄭琪,趙春暉.軸承磨損階段劃分與分段剩余壽命估計(jì)方法 [J].控制工程,2022,29(4):593-599+636.
[10] LEI Y G,LI N P,GUO L,et al. Machinery Health Prognostics: A Systematic Review from Data Acquisition to RUL Prediction [J].Mechanical Systems and Signal Processing,2018,104:799-834.
作者簡(jiǎn)介:張浩(1983—),男,漢族,江蘇南京人,高級(jí)工程師,碩士研究生,研究方向:機(jī)械設(shè)計(jì)。