譚東貴, 袁逸萍, 樊盼盼
(新疆大學(xué) 智能制造現(xiàn)代產(chǎn)業(yè)學(xué)院,新疆 烏魯木齊 830017)
礦用電動機(jī)因其良好的過載能力、調(diào)速性能、單位質(zhì)量功率大等特點(diǎn),用于驅(qū)動提升機(jī)、輸送機(jī)和破碎機(jī)等礦山裝備。礦山環(huán)境惡劣、工況復(fù)雜,礦用電動機(jī)易受溫度、振動、濕度[1]等因素影響,導(dǎo)致電動機(jī)過熱、機(jī)械磨損、絕緣降低等問題,加速電動機(jī)損壞,影響生產(chǎn)效率和成本。因此,實(shí)時準(zhǔn)確評估礦用電動機(jī)健康狀態(tài)對制定合理的維護(hù)計劃、保障正常生產(chǎn)有重大現(xiàn)實(shí)意義。
傳統(tǒng)的電動機(jī)健康狀態(tài)評估方法主要依賴單一傳感器來實(shí)施[2],即利用單一類型的傳感器(如溫度、電流、振動等傳感器)采集電動機(jī)運(yùn)行數(shù)據(jù),通過對數(shù)據(jù)進(jìn)行分析和特征提取,評估電動機(jī)健康狀態(tài)[3]。但該方法存在一定的局限性,如對環(huán)境噪聲敏感、特征提取不充分、評估精度不高等。為克服這些問題,多傳感器信息融合技術(shù)成為電動機(jī)健康狀態(tài)評估的研究熱點(diǎn)。單增海等[4]通過同時采集多個傳感器的數(shù)據(jù),利用多傳感器信息融合以提供更全面、準(zhǔn)確的設(shè)備健康狀態(tài)信息。該方法可充分利用不同傳感器的優(yōu)勢,提高監(jiān)測的覆蓋范圍和準(zhǔn)確性。然而,在實(shí)際工況中由于運(yùn)行環(huán)境異常、人為因素干擾及采集設(shè)備故障等[5],礦用電動機(jī)監(jiān)測數(shù)據(jù)中混雜大量與健康狀態(tài)無關(guān)的異常值且存在缺失值,導(dǎo)致數(shù)據(jù)質(zhì)量下降,造成評估結(jié)果不穩(wěn)定。此外,多傳感器信息融合也帶來了數(shù)據(jù)融合和處理的復(fù)雜性,需要高效的算法來處理大量和多樣化的數(shù)據(jù)。為減少上述問題,可結(jié)合深度學(xué)習(xí)技術(shù)構(gòu)建更高效、準(zhǔn)確、魯棒的礦用電動機(jī)健康狀態(tài)評估模型。
近年來,深度學(xué)習(xí)技術(shù)在多領(lǐng)域取得了顯著突破,其中卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)在圖像和空間數(shù)據(jù)處理中表現(xiàn)出色[6],循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)在序列數(shù)據(jù)建模方面非常強(qiáng)大[7]。Yang Chao等[8]將CNN和RNN結(jié)合并提出了卷積循環(huán)神經(jīng)網(wǎng)絡(luò)(Convolutional Recurrent Neural Network,CRNN),可更好地捕捉時序性和空間信息。樊盼盼等[9]在缺乏歷史故障數(shù)據(jù)支撐的場景下,采用長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)構(gòu)建風(fēng)電動機(jī)組有功功率短期預(yù)測模型。袁逸萍等[10]采用多尺度卷積神經(jīng)網(wǎng)絡(luò)(Multiscale Convolutional Neural Networks,MCNN)特征提取層和門控制循環(huán)單元(Gated Recurrent Unit,GRU)神經(jīng)網(wǎng)絡(luò)時間序列預(yù)測層搭建滾動軸承剩余壽命預(yù)測模型。上述模型在時間維度上展開計算,能很好地處理具有序列特征的數(shù)據(jù),但對于數(shù)據(jù)質(zhì)量下降嚴(yán)重的情況,上述模型難以有效提取數(shù)據(jù)特征并更新網(wǎng)絡(luò)權(quán)重,導(dǎo)致容易出現(xiàn)梯度消失或爆炸等問題,影響模型性能。注意力機(jī)制可在一定程度上緩解該問題,被廣泛應(yīng)用于深度學(xué)習(xí)中[11-12]。
因此,本文提出了一種基于自適應(yīng)多尺度注意力機(jī)制(Adaptive Multi-Scale Attention Mechanism,AMSA)的CNN-GRU模型(以下簡稱CNN-GRUAMSA),可根據(jù)不同的輸入數(shù)據(jù)自動調(diào)整注意力權(quán)重,以提高模型對關(guān)鍵信息的關(guān)注度,從而提高礦用電動機(jī)健康狀態(tài)評估的準(zhǔn)確性。
礦用電動機(jī)健康狀態(tài)評估總體框架如圖1所示。首先對傳感器采集的數(shù)據(jù)進(jìn)行篩選、標(biāo)準(zhǔn)化、工況劃分(根據(jù)數(shù)據(jù)的特征或規(guī)律將數(shù)據(jù)分為若干類別)等預(yù)處理;然后依據(jù)傳感器參數(shù)的特點(diǎn),選擇能夠有效反映礦用電動機(jī)健康狀況的健康評估指標(biāo)(電動機(jī)電流、電動機(jī)三相繞組溫度、電動機(jī)前端軸承溫度和電動機(jī)后端軸承溫度),計算指標(biāo)的健康指數(shù)(Health Index,HI),并對HI進(jìn)行降噪、平滑、歸一化處理,同時根據(jù)指標(biāo)對礦用電動機(jī)的貢獻(xiàn)度設(shè)置初始權(quán)重系數(shù),對各指標(biāo)HI加權(quán)融合得到礦用電動機(jī)HI;最后將AMSA引入CNN-GRU模型,并對模型進(jìn)行訓(xùn)練和驗(yàn)證,由模型輸出電動機(jī)健康狀態(tài)評估結(jié)果。
圖1 礦用電動機(jī)健康狀態(tài)評估總體框架Fig.1 General framework of health state assessment of mine motor
礦用電動機(jī)運(yùn)行工況復(fù)雜、環(huán)境惡劣、噪聲大,易造成部分傳感器監(jiān)測數(shù)據(jù)異常大或異常小,不能真實(shí)反映礦用電動機(jī)運(yùn)行情況。如果將傳感器原始數(shù)據(jù)作為深度網(wǎng)絡(luò)學(xué)習(xí)的輸入數(shù)據(jù),會增加網(wǎng)絡(luò)規(guī)模和訓(xùn)練難度[13]。為使網(wǎng)絡(luò)獲得更好的預(yù)測性能,應(yīng)先對傳感器原始數(shù)據(jù)進(jìn)行預(yù)處理。
首先,采用牛頓插值法對缺失的數(shù)據(jù)進(jìn)行填補(bǔ)[14];其次,識別并除去異常值,剔除電流、溫度小于0的數(shù)據(jù),以及停機(jī)時的數(shù)據(jù);然后,對不同傳感器測量的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,本文使用常見的Z-Score數(shù)據(jù)標(biāo)準(zhǔn)化方法對輸入數(shù)據(jù)進(jìn)行縮放[15],使所有傳感器數(shù)據(jù)量綱統(tǒng)一;最后,對傳感器數(shù)據(jù)與環(huán)境溫度按斯皮爾曼相關(guān)系數(shù)法[16]進(jìn)行相關(guān)性分析,發(fā)現(xiàn)環(huán)境溫度與礦用電動機(jī)三相繞組溫度、軸承溫度具有強(qiáng)相關(guān)性,因此,本文依據(jù)環(huán)境溫度變化對礦用電動機(jī)運(yùn)行數(shù)據(jù)進(jìn)行工況劃分。
使用主成分分析(Principal Component Analysis,PCA)算法構(gòu)建礦用電動機(jī)HI[17],具體步驟如下。
1) 根據(jù)馬氏距離[18]計算健康評估指標(biāo)的HI:
式中:fHI為指標(biāo)HI;φ為變化率;dmd為馬氏距離;dm0為基準(zhǔn)值,dmd>dm0。
2) 為選擇高性能的HI,利用PCA算法計算不同指標(biāo)對礦用電動機(jī)的貢獻(xiàn)度,按貢獻(xiàn)度大小給定權(quán)重系數(shù),能夠在保證傳感器數(shù)據(jù)不失真的情況下降低特征維度并去除冗余數(shù)據(jù)。
3) 由于計算的指標(biāo)HI包含明顯噪聲,會對后續(xù)評估結(jié)果造成影響。Savitzky-Golay(S-G)濾波器[19]是一種基于曲線局部特征的有效濾波方法,因此利用S–G濾波器進(jìn)行擬合降噪。為進(jìn)一步獲得平滑的HI,使用經(jīng)驗(yàn)指數(shù)函數(shù)擬合去噪數(shù)據(jù),其表達(dá)式為
式中:λ(·)為隨時間t變化的經(jīng)驗(yàn)指數(shù)函數(shù);K為函數(shù)的初始值;α為函數(shù)的增長率;β為時間偏移量;γ為函數(shù)的漸近線。
4) 為保持HI的尺度統(tǒng)一,使用最小-最大歸一化方法將HI縮放到[0,1]。
5) 根據(jù)權(quán)重系數(shù)對指標(biāo)HI進(jìn)行加權(quán)融合,得到礦用電動機(jī)HI。
式中:Wk為權(quán)重系數(shù);wk為指標(biāo)k的貢獻(xiàn)度;l為指標(biāo)個數(shù);FHI為融合后的礦用電動機(jī)HI;Ak為指標(biāo)k對應(yīng)的全部數(shù)據(jù)。
CNN-GRU模型是一種結(jié)合CNN和GRU的深度學(xué)習(xí)模型,用于處理時間序列數(shù)據(jù)。CNN具有出色的分類和回歸能力[20],可提取數(shù)據(jù)中的空間特征;GRU通過引入重置門和更新門[21],有效解決標(biāo)準(zhǔn)RNN存在的梯度消失和長期依賴問題,可捕捉數(shù)據(jù)中的時序關(guān)系,實(shí)現(xiàn)對未來數(shù)據(jù)的預(yù)測或分類。CNN-GRU模型結(jié)構(gòu)如圖2所示。CNN層對輸入數(shù)據(jù)進(jìn)行特征提取,將原始數(shù)據(jù)轉(zhuǎn)換為更緊湊、更有信息量的表示形式,為后續(xù)的GRU層提供輸入;GRU層對CNN層提取的特征進(jìn)行時序建模,學(xué)習(xí)序列中的關(guān)系和動態(tài)變化,為最終的預(yù)測提供依據(jù)。
圖2 CNN-GRU模型Fig.2 CNN-GRU model
GRU層提取出時間特征后,模型會生成大量的高維時間特征,這些特征很難直觀地區(qū)分和理解。注意力機(jī)制通過合理改變注意力程度來實(shí)現(xiàn)重要信息的提取[22],當(dāng)注意力機(jī)制應(yīng)用于神經(jīng)網(wǎng)絡(luò)時,可使其從大量信息中快速鎖定目標(biāo)中的關(guān)鍵點(diǎn),從而剔除無用信息,更高效地完成訓(xùn)練任務(wù)[23]。由于礦用電動機(jī)涉及不同類型的傳感器信號,所以采用AMSA,根據(jù)輸入特征的尺度和內(nèi)容動態(tài)地調(diào)整注意力權(quán)重,從而關(guān)注最重要的特征。AMSA結(jié)構(gòu)如圖3所示。
圖3 AMSA結(jié)構(gòu)Fig.3 Structure of adaptive multi-scale attention mechanism
本文選取新疆某大型露天煤礦地面生產(chǎn)系統(tǒng)126帶式輸送機(jī)的1號礦用電動機(jī)的傳感器數(shù)據(jù)進(jìn)行分析驗(yàn)證。第1個時間節(jié)點(diǎn)為2021年1月16日17時14分,采樣時間間隔為1 min,最后一個時間節(jié)點(diǎn)為2021年12月31日19時12分。對數(shù)據(jù)進(jìn)行預(yù)處理后,數(shù)據(jù)記錄共38萬多條,將數(shù)據(jù)導(dǎo)入PCA模型中,計算出健康評估指標(biāo)的個體貢獻(xiàn)度與累計貢獻(xiàn)度,見表1。使用S-G濾波器對PCA處理后的主成分1—主成分6的HI進(jìn)行降噪處理,得到的HI曲線如圖4所示。借鑒文獻(xiàn)[24]的思想,結(jié)合得到的HI,本文設(shè)置4個健康狀態(tài)類別用于評估礦用電動機(jī)健康狀態(tài),見表2。
表1 健康評估指標(biāo)的個體貢獻(xiàn)度與累計貢獻(xiàn)度Table 1 Individual and cumulative contribution degree of health assessment index %
表2 礦用電動機(jī)健康狀態(tài)評估類別Table 2 Mine motor health state assessment categories
圖4 降噪處理后的HI曲線Fig.4 Health index curve after noise reduction
按式(2)、式(3)對主成分1—主成分6的HI進(jìn)行加權(quán)融合,并使用最小-最大歸一化方法將HI縮放到區(qū)間[0,1],得到礦用電動機(jī)HI曲線,如圖5所示。
圖5 礦用電動機(jī)HI曲線Fig.5 Health index curve of mine motor
由于在驗(yàn)證過程中存在隨機(jī)性,且考慮到環(huán)境溫度對溫度類傳感器參數(shù)的影響,將數(shù)據(jù)按環(huán)境溫度變化(以每變化5 ℃作為一個區(qū)間)劃分為8個工況(即8個子數(shù)據(jù)集),并分別輸入CNN-GRUAMSA模型進(jìn)行驗(yàn)證,每個子數(shù)據(jù)集選取其樣本數(shù)據(jù)的80%用于訓(xùn)練,其余20%作為測試數(shù)據(jù),將HI與各傳感器的時間序列數(shù)據(jù)拼接,形成最終參與模型訓(xùn)練、預(yù)測的數(shù)據(jù)集。
將輸入變量的初始?xì)v史時間步長設(shè)置為1.5 h,即輸入數(shù)據(jù)由過去1.5 h連續(xù)測量的傳感器數(shù)據(jù)和HI組成。由于在CNN-GRU模型中融入了AMSA,所以模型在訓(xùn)練過程中會動態(tài)調(diào)整時間步長與注意力權(quán)重,并使用Adam優(yōu)化器以0.001的學(xué)習(xí)率訓(xùn)練模型,用于預(yù)測礦用電動機(jī)健康狀態(tài)。
CNN-GRU-AMSA模型在訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)上的損失值如圖6所示。可看出訓(xùn)練損失值隨著迭代次數(shù)的增加逐漸減小并趨于平穩(wěn),且測試損失值保持在一個較低的水平上,說明CNN-GRU-AMSA模型在訓(xùn)練過程中能夠有效降低預(yù)測誤差,且沒有出現(xiàn)過擬合現(xiàn)象,具有較強(qiáng)的泛化能力。
圖6 CNN-GRU-AMSA模型損失值Fig.6 Loss value of CNN-GRU-AMSA model
各工況下CNN-GRU-AMSA 模型預(yù)測結(jié)果的混淆矩陣如圖7所示??煽闯龀斯r5—工況7下出現(xiàn)個別分類誤差相對較大的情況,整體分類結(jié)果較理想。
圖7 不同工況下CNN-GRU-AMSA模型預(yù)測結(jié)果的混淆矩陣Fig.7 Confusion matrix of CNN-GRU-AMSA model prediction results under different working conditions
為進(jìn)一步驗(yàn)證CNN-GRU-AMSA模型對礦用電動機(jī)健康狀態(tài)評估的性能,將其與常用的深度學(xué)習(xí)模型CNN、CNN-GRU、CNN-LSTM及CNN-LSTMAttention進(jìn)行對比,結(jié)果如圖8所示。根據(jù)圖8計算不同工況下各模型的評價指標(biāo),包括均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、最大絕對誤差( Maximum Absolute Error,MAX)、準(zhǔn)確率(Accuracy,ACC)、Macro F1與Micro F1。不同工況下各模型的評價指標(biāo)對比結(jié)果分別見表3-表10。可看出CNNGRU-AMSA模型相比于其他深度學(xué)習(xí)模型,其整體性能最優(yōu)。
表3 工況1下不同模型性能比較Table 3 Performance comparison of different models under working condition 1
表4 工況2下不同模型性能比較Table 4 Performance comparison of different models under working condition 2
表5 工況3下不同模型性能比較Table 5 Performance comparison of different models under working condition 3
表6 工況4下不同模型性能比較Table 6 Performance comparison of different models under working condition 4
表7 工況5下不同模型性能比較Table 7 Performance comparison of different models under working condition 5
表9 工況7下不同模型性能比較Table 9 Performance comparison of different models under working condition 7
表10 工況8下不同模型性能比較Table 10 Performance comparison of different models under working condition 8
圖8 不同模型的HI對比Fig.8 Health index comparison of different models
為了更加直觀地對比CNN-GRU-AMSA模型的與其他深度學(xué)習(xí)模型,展示8個工況下不同模型預(yù)測殘差,如圖9所示??煽闯鯟NN-GRU-AMSA模型預(yù)測殘差波動特別小,而其他模型預(yù)測殘差存在很大波動,說明CNN-GRU-AMSA模型的穩(wěn)定性更優(yōu)。
圖9 不同模型的預(yù)測殘差對比Fig.9 Comparison of predicted residuals of different models
1) 在CNN-GRU模型中引入AMSA,從而根據(jù)不同尺度特征的重要性動態(tài)分配注意力權(quán)重,實(shí)現(xiàn)對不同尺度特征的加權(quán)融合,以提高模型的泛化性和魯棒性。
2) 首先通過多種傳感器采集礦用電動機(jī)運(yùn)行數(shù)據(jù)并進(jìn)行預(yù)處理;然后根據(jù)馬氏距離計算健康評估指標(biāo)的HI,再利用S-G濾波器對HI進(jìn)行降噪擬合,結(jié)合PCA算法確定的每個指標(biāo)對礦用電動機(jī)的貢獻(xiàn)度,通過加權(quán)融合得到礦用電動機(jī)HI;最后使用CNN-GRU-AMSA模型對礦用電動機(jī)健康狀態(tài)進(jìn)行評估。
3) CNN-GRU-AMSA模型在RMSE,MAE,ACC,Macro F1,Micro F1等評價指標(biāo)上均優(yōu)于其他模型,預(yù)測殘差的波動范圍更小,穩(wěn)定性更優(yōu)。