劉 峰,劉海生
(北京交通大學(xué) 計算機(jī)與信息技術(shù)學(xué)院,北京 100044)
基于改進(jìn)小波神經(jīng)網(wǎng)絡(luò)的動車組牽引電機(jī)故障趨勢預(yù)測
劉 峰,劉海生
(北京交通大學(xué) 計算機(jī)與信息技術(shù)學(xué)院,北京 100044)
針對小波神經(jīng)網(wǎng)絡(luò)在多維輸入情況下易于陷入局部極小值、收斂速度慢的弱點,引入Levenberg Marquardt(LM)算法優(yōu)化小波神經(jīng)網(wǎng)絡(luò),解決傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)收斂速度慢的問題。基于傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)和LM算法改進(jìn)的小波神經(jīng)網(wǎng)絡(luò)分別建立預(yù)測模型,用于動車組牽引電機(jī)的故障趨勢預(yù)測,通過MATLAB軟件對兩種預(yù)測模型的訓(xùn)練過程進(jìn)行了數(shù)值仿真,仿真實驗結(jié)果表明改進(jìn)小波神經(jīng)網(wǎng)絡(luò)建立的故障預(yù)測模型提高了小波神經(jīng)網(wǎng)絡(luò)的預(yù)測精度,同時加快了神經(jīng)網(wǎng)絡(luò)的收斂速度,是一種有效的預(yù)測模型。
小波神經(jīng)網(wǎng)絡(luò);LM算法;動車組牽引電機(jī);故障趨勢預(yù)測
近年來我國高速鐵路動車組進(jìn)入大規(guī)模建設(shè)時期,投入運(yùn)營的動車組數(shù)量不斷增加,動車組監(jiān)測數(shù)據(jù)也不斷的增長。牽引電機(jī)為動車組提供動力,在運(yùn)行過程中承受各種電磁交變應(yīng)力的作用,易導(dǎo)致牽引電機(jī)出現(xiàn)各種電氣故障和機(jī)械故障,牽引電機(jī)的正常運(yùn)行對動車組的安全起著至關(guān)重要的作用。因此利用這些不斷積累的動車組監(jiān)測數(shù)據(jù),對牽引電機(jī)進(jìn)行故障趨勢預(yù)測,具有十分重要的意義。
小波神經(jīng)網(wǎng)絡(luò)用小波函數(shù)代替BP神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點的激勵函數(shù),通過映射變換建立起小波變換與網(wǎng)絡(luò)系數(shù)之間的連接,廣泛應(yīng)用于設(shè)備的故障診斷和故障趨勢預(yù)測。但傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練算法一般為梯度下降法,在多維輸入情況下有易于陷入局部極小值、收斂速度慢的弱點[1],無法滿足動車組進(jìn)行實時故障預(yù)測的要求。本文提出一種基于LM算法優(yōu)化小波神經(jīng)網(wǎng)絡(luò)的方法,并應(yīng)用于動車牽引電動機(jī)的故障趨勢預(yù)測。實驗結(jié)果表明,經(jīng)過改進(jìn)的小波神經(jīng)網(wǎng)絡(luò)不僅迭代次數(shù)少,而且收斂精度也得到了較大的提高。
1.1 小波神經(jīng)網(wǎng)絡(luò)
1992年,法國信息科學(xué)研究機(jī)構(gòu)的Qinghua Zhang等人提出了小波神經(jīng)網(wǎng)絡(luò)的概念和算法[2]。小波神經(jīng)網(wǎng)絡(luò)是一種基于小波變換理論而構(gòu)造的前饋神經(jīng)網(wǎng)絡(luò),具有較強(qiáng)的函數(shù)逼近能力和較快的收斂速度,其主要可分為松散型和緊密型兩種類型。本文采用緊密型結(jié)構(gòu)來構(gòu)造小波神經(jīng)網(wǎng)絡(luò),其基本思想是將常規(guī)小波神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點的激勵函數(shù)用小波函數(shù)代替,在網(wǎng)絡(luò)訓(xùn)練過程中逐步更新神經(jīng)元間的連接權(quán)值、神經(jīng)元的閾值及小波函數(shù)的伸縮因子和平移因子。3層前饋網(wǎng)絡(luò)能以任意精度逼近一個非線性映射[3],因此本文采用3層小波神經(jīng)網(wǎng)絡(luò)用于構(gòu)造動車組牽引電機(jī)的故障趨勢預(yù)測模型。
圖1 三層小波神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖1為3層小波神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)圖,其中輸入層有n個神經(jīng)元,隱含層有k個神經(jīng)元,輸出層有m個神經(jīng)元,輸入層和輸出層的神經(jīng)元個數(shù)根據(jù)實際要求確定,隱含層神經(jīng)元數(shù)參考經(jīng)驗公式表示輸人層的第i個神經(jīng)元與隱含層的第j個神經(jīng)元的連接權(quán)值,wij表示隱含層的第i個神經(jīng)元與輸出層的第j個神經(jīng)元的連接權(quán)值。設(shè)網(wǎng)絡(luò)輸入變量實際輸出變量期望輸出變量則隱含層輸出的計算公式為:
其中,h(j)為隱含層第j個節(jié)點的輸出值,Ψ(x)為小波函數(shù),bj為小波函數(shù)的平移因子,aj為小波函數(shù)的伸縮因子,v0j是第j個隱含層節(jié)點閾值(相應(yīng)的x0=-1),隱含層神經(jīng)元的激勵函數(shù)常采用Morlet小波[4]:
輸出層神經(jīng)元則采用sigmoid函數(shù)作為激勵函數(shù):
設(shè)w0j是第j個輸出層節(jié)點閾值,則小波神經(jīng)網(wǎng)絡(luò)輸出層的計算公式為:
傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)多采用梯度下降法修正網(wǎng)絡(luò)的權(quán)值和小波函數(shù)的參數(shù)。梯度下降法是一階最優(yōu)化算法,核心思想是以目標(biāo)函數(shù)的負(fù)梯度方向為搜索方向,通過每次迭代使待優(yōu)化的目標(biāo)函數(shù)逐步減小。這種搜索是一種貪心算法的過程,只考慮目標(biāo)函數(shù)在迭代點的局部性質(zhì)。其中學(xué)習(xí)速率選擇過大或過小會導(dǎo)致網(wǎng)絡(luò)訓(xùn)練過慢或震蕩發(fā)散,因此通常會在梯度下降法的基礎(chǔ)上附加動量因子加速算法收斂[5],使小波神經(jīng)網(wǎng)絡(luò)預(yù)測輸出不斷逼近期望輸出。給定樣本集根據(jù)梯度下降法定義誤差目標(biāo)函數(shù):
基于上述目標(biāo)函數(shù)進(jìn)行誤差反向傳播,使權(quán)值沿誤差函數(shù)的負(fù)梯度方向改變,利用梯度下降法調(diào)整優(yōu)化小波神經(jīng)網(wǎng)絡(luò)的參數(shù);
其中,t為迭代次數(shù),β為學(xué)習(xí)速率,α為動量因子。
1.2 LM算法改進(jìn)的小波神經(jīng)網(wǎng)絡(luò)
1.2.1 LM算法
傳統(tǒng)的小波神經(jīng)網(wǎng)絡(luò)算法采用梯度下降法進(jìn)行誤差反向傳播,參數(shù)沿著與誤差梯度相反的方向移動,使誤差函數(shù)達(dá)到極小值。附加動量因子記憶上次迭代的變化方向,可以采用較大的學(xué)習(xí)速率系數(shù)以提高學(xué)習(xí)速度,但是參數(shù)調(diào)整優(yōu)化過程依然線性收斂,相對速度依然較慢。LM算法是一種利用標(biāo)準(zhǔn)數(shù)值優(yōu)化技術(shù)的快速算法,具有高斯牛頓法的局部收斂性和梯度下降法的全局特性,在局部搜索能力上強(qiáng)于梯度下降法[6]。
LM算法基本思想是先沿著負(fù)梯度方向進(jìn)行搜索,然后根據(jù)牛頓法在最優(yōu)值附近產(chǎn)生一個新的理想的搜索方向。LM算法具有二階收斂速度,迭代次數(shù)很少,可以大幅度提高收斂速度和算法的穩(wěn)定性,避免陷入局部最小點的優(yōu)點。設(shè)x(n)表示第n次迭代的小波神經(jīng)網(wǎng)絡(luò)的參數(shù)所組成的向量,新的參數(shù)向量x(n+1)可根據(jù)下面的規(guī)則求得:
按式(5)定義的誤差目標(biāo)函數(shù),對于小波神經(jīng)網(wǎng)絡(luò)的參數(shù)有Jacobian矩陣:
LM算法改進(jìn)小波神經(jīng)網(wǎng)絡(luò)的權(quán)值修正量為:
其中μ>0是比例系數(shù),I是單位矩陣。當(dāng)μ=0時,LM算法轉(zhuǎn)化為具有近似高斯牛頓法。當(dāng)μ較大時,LM算法接近小步長的梯度下降法。
1.2.2 LM算法改進(jìn)小波神經(jīng)網(wǎng)絡(luò)的計算步驟
1)給出網(wǎng)絡(luò)訓(xùn)練誤差允許值ε及網(wǎng)絡(luò)最大訓(xùn)練次數(shù)M,一般選定ε=0.0000001,M=5000次,初始化系數(shù)μ0和β,且令n=0,μ=μ0。
2)計算網(wǎng)絡(luò)輸出Y(m)及誤差目標(biāo)函數(shù)E(n)。
3)計算Jacobian矩陣。
4)計算權(quán)值修正量?x(k)。
5)若E(n)<ε或n>M,轉(zhuǎn)至步驟7),否則以x(n+1)為權(quán)重,計算誤差E(n+1)。
6)若E(n+1) 7)停止。 故障預(yù)測就是對裝備的未來性能給出定量的評價、分析[7]。動車組牽引電機(jī)故障趨勢預(yù)測模型以動車組牽引電機(jī)當(dāng)前的運(yùn)行狀態(tài)為起點,對未來任務(wù)段內(nèi)其運(yùn)行狀態(tài)的變化給出預(yù)測,以便于根據(jù)已知的結(jié)構(gòu)特性、功能參數(shù)、服役條件及運(yùn)行歷史(包括運(yùn)行記錄和以往故障及修復(fù)的記錄),對動車組牽引電機(jī)可能出現(xiàn)的故障進(jìn)行預(yù)報、分析和判斷[8]。 2.1 動車組電機(jī)預(yù)測的特點 動車組牽引電機(jī)固定在動車轉(zhuǎn)向架上,與周圍環(huán)境密切接觸,工作環(huán)境相對惡劣,工作強(qiáng)度較大,導(dǎo)致動車組牽引電機(jī)易發(fā)生各種電氣故障和機(jī)械故障,其故障趨勢預(yù)測也具有一下特點: 1)實時性要求。動車組牽引電機(jī)的運(yùn)行狀態(tài)對于動車組的正常運(yùn)行具有重要意義,其監(jiān)控數(shù)據(jù)頻率是分鐘級別的,這就要求預(yù)測模型必須有較快的運(yùn)算速度。 2)多因素相互影響。動車組牽引電機(jī)工作環(huán)境惡劣,其運(yùn)行狀態(tài)受環(huán)境影響,各種運(yùn)行狀態(tài)指標(biāo)之間也存在相互影響,對其故障趨勢的預(yù)測必須考慮多因素。文獻(xiàn)[9]進(jìn)行了發(fā)電機(jī)組振動多因素預(yù)測,并通過實驗比較說明隨機(jī)時間序列受多種因素影響時,將這些影響因子也作為網(wǎng)絡(luò)的輸入,綜合考慮網(wǎng)絡(luò)預(yù)測結(jié)果更好。 3)短時運(yùn)行環(huán)境相對穩(wěn)定。動車組短時內(nèi)運(yùn)行速度、運(yùn)行環(huán)境溫度等相對變化較穩(wěn)定。 2.2 動車組電機(jī)故障趨勢預(yù)測 針對動車組電機(jī)故障預(yù)測特點,建立時間序列上的動車組電機(jī)多因素滾動故障趨勢預(yù)測模型,利用過去一段時間的監(jiān)測值預(yù)測未來的一段時間內(nèi)動車組牽引電機(jī)的狀態(tài)。將動車組電機(jī)的歷史狀態(tài)數(shù)據(jù)編輯整理成時間序列,用每次單步預(yù)測模型的預(yù)測值替換下一步預(yù)測模型中輸入層時間最老的一個值,依次迭代,得到未來一段時刻的預(yù)測值。由于動車組電機(jī)短時運(yùn)行環(huán)境相對穩(wěn)定,對動車組電機(jī)的運(yùn)行狀態(tài)產(chǎn)生影響的其他多因素取最近時刻的狀態(tài)值。 其中(x1,x2,…,xn,yn,…,zn)、(x2,x3,…,xn+1,yn+1,…,zn+1)和(xk-n,xk-n+1,…,xk-1,yk-1,…,zk-1)為訓(xùn)練樣本輸入,模型訓(xùn)練收斂后,輸入樣本(xk-n+1,xk-n+2,…,xk,yk,…,zk)預(yù)測xk+1時刻的值。依次類推得到期望的預(yù)測時間序列。 使用上海鐵路局提供的動車組牽引電機(jī)監(jiān)控數(shù)據(jù),分別建立傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)和改進(jìn)小波神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,基于牽引電機(jī)的軸承溫度、列車速度、環(huán)境溫度和定子溫度4個因素對定子溫度做預(yù)測,在MATLAB下驗證改進(jìn)神經(jīng)網(wǎng)絡(luò)建立的預(yù)測模型的優(yōu)越性。實驗1通過比較兩個模型的迭代次數(shù),驗證改進(jìn)模型實時預(yù)測性能的優(yōu)越性;實驗2通過比較兩個模型的預(yù)測結(jié)果,驗證改進(jìn)模型預(yù)測精度的優(yōu)越性。 3.1 數(shù)據(jù)歸一化處理 小波神經(jīng)網(wǎng)絡(luò)的輸入變量具有不同的物理意義和不同的量綱,歸一化之后的數(shù)據(jù)都在[0,1]之間變化,從而使網(wǎng)絡(luò)訓(xùn)練中各輸入分量有同等重要的地位。同時輸出層小波函數(shù)選用Sigmoid函數(shù),該函數(shù)輸出在0~1之間,因此必須對數(shù)據(jù)歸一化處理才能用于預(yù)測問題。將輸入輸出數(shù)據(jù)變換為[0,1]區(qū)間的值常用以下變換式: 3.2 實例分析 現(xiàn)有來源于上海鐵路局的動車組牽引電機(jī)監(jiān)測數(shù)據(jù),是國內(nèi)某段動車組2016年7月和8月共62天的監(jiān)控數(shù)據(jù),數(shù)據(jù)時間單位是分鐘,選用7月1日這一天5個小時共300組數(shù)據(jù)做實驗驗證。前280組數(shù)據(jù)做模型訓(xùn)練,最后20組數(shù)據(jù)分別用于實驗1和實驗2。其中前10組數(shù)據(jù)用于實驗1,后10組數(shù)據(jù)用于實驗2。利用常規(guī)小波神經(jīng)網(wǎng)絡(luò)和改進(jìn)的神經(jīng)網(wǎng)絡(luò)分別建立多因素滾動預(yù)測模型,基于牽引電機(jī)的軸承溫度、列車速度、環(huán)境溫度和定子溫度4個因素對定子溫度做預(yù)測,從預(yù)測的精度和模型訓(xùn)練的迭代次數(shù)兩個方面,比較兩種預(yù)測模型的性能。 根據(jù)動車組牽引電機(jī)的特性設(shè)計小波神經(jīng)網(wǎng)絡(luò),確定輸入層節(jié)點數(shù)16,其中13個節(jié)點是動車組電機(jī)的定子溫度時間序列,其他3個節(jié)點分為列車速度、環(huán)境溫度和定子溫度,輸出層節(jié)點1個,隱含層節(jié)點4個,即本案例網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為16:4:1。初始化神經(jīng)網(wǎng)路參數(shù)學(xué)習(xí)率為0.5,網(wǎng)絡(luò)權(quán)值選定為0.5~+0.5之間的一組隨機(jī)數(shù),小波函數(shù)選用morlet函數(shù),系統(tǒng)誤差選定為0.0000001,最大迭代次數(shù)為5000次。 分別使用傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)和改進(jìn)小波神經(jīng)網(wǎng)絡(luò)建立的牽引電機(jī)故障預(yù)測模型,采用相同的280樣本數(shù)據(jù)對預(yù)測模型進(jìn)行訓(xùn)練。實驗1使用相同的10組數(shù)據(jù)測試上述訓(xùn)練完成的預(yù)測模型,誤差曲線如圖2和圖3所示。 圖2 傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)誤差迭代曲線 圖3 改進(jìn)小波神經(jīng)網(wǎng)絡(luò)誤差迭代曲線 從圖2和圖3可以看出,改進(jìn)小波神經(jīng)網(wǎng)絡(luò)的收斂速度更快,網(wǎng)絡(luò)迭代次數(shù)更少,改進(jìn)小波神經(jīng)網(wǎng)絡(luò)迭代41次收斂,常規(guī)小波神經(jīng)網(wǎng)絡(luò)迭代94次收斂,改進(jìn)小波神經(jīng)網(wǎng)絡(luò)的收斂速度提高了56%。迭代次數(shù)的減少,意味著改進(jìn)小波神經(jīng)網(wǎng)絡(luò)建立的預(yù)測模型在預(yù)測實時性上更好。 實驗2使用訓(xùn)練完成的預(yù)測模型預(yù)測未來電機(jī)定子溫度的10組數(shù)據(jù),預(yù)測結(jié)果如圖4和圖5所示,通過觀察預(yù)測擬合曲線可以發(fā)現(xiàn),預(yù)測變化趨勢與實際值基本一致,因此可以用訓(xùn)練好的網(wǎng)絡(luò)來預(yù)測動車組牽引電機(jī)的定子溫度,并對預(yù)測結(jié)果進(jìn)行分析。 圖4 傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果 圖5 改進(jìn)小波神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果 采用相對誤差率分析預(yù)測結(jié)果,其計算公式為: 通過預(yù)測結(jié)果對照表1發(fā)現(xiàn),用改進(jìn)小波神經(jīng)網(wǎng)絡(luò)建立的預(yù)測模型平均誤差率為1.26%,傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)建立的預(yù)測模型為1.71%,改進(jìn)模型預(yù)測的準(zhǔn)確定更好。 本文采用小波神經(jīng)網(wǎng)絡(luò)用于動車組牽引電機(jī)的故障 【】【】趨勢預(yù)測,通過預(yù)測牽引電機(jī)狀態(tài)變化,反應(yīng)其故障變化趨勢。利用LM算法改進(jìn)小波神經(jīng)網(wǎng)絡(luò),分別建立改進(jìn)小波神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)的電機(jī)故障趨勢預(yù)測模型,通過以上實驗可以得到以下結(jié)論: 表1 動車組牽引電機(jī)預(yù)測情況表 1)采用改進(jìn)小波神經(jīng)網(wǎng)絡(luò)建立的預(yù)測模型,網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)更少,網(wǎng)絡(luò)收斂速度更快,預(yù)測的實時性更好。 2)采用改進(jìn)小波神經(jīng)網(wǎng)絡(luò)建立的預(yù)測模型,預(yù)測的準(zhǔn)確性也得到了一定的提高。 因此,基于改進(jìn)小波神經(jīng)網(wǎng)絡(luò)建立的動車組牽引電機(jī)多因素滾動故障預(yù)測模型具有更好的先進(jìn)性和實用性,是一種有效的動車組牽引電機(jī)預(yù)測方法。 [1] 楊國為,王守覺,閆慶旭.分式線性神經(jīng)網(wǎng)絡(luò)及其非線性逼近能力研究[J].計算機(jī)學(xué)報,2007,30(2):189-199. [2] Zhong Shisheng.Continuous wavelet process neural network and its application[J].Neural Network World,2007,17(5):483-495. [3] 閻平凡,張長水.人工神經(jīng)網(wǎng)絡(luò)與模擬進(jìn)化計算[M].北京:清華大學(xué)出版社,2000. [4] 涂遠(yuǎn),杜建江,王濤.壓電類智能層合結(jié)構(gòu)的ANSYS仿真分析[J].廣西大學(xué)學(xué)報(自然科學(xué)版),2005,30(4):288-292. [5] J. L. Guardado. A comparative study of neural network efficiency in power transformers diagnosis using dissolved gas analysis[J].IEEE Transactions on Power Delivery,2001,16(4):643-647. [6] McKeown, John J. Some numerical aspects of the training problem for feed-forward neural nets[M].Elsevier Science Ltd.,1997,10(9):1455-1463. [7] 陳明,顧幸生.故障模糊預(yù)測模型研究[J].系統(tǒng)仿真技術(shù),2005,1(2):74-78. [8] Himmelblau DM. Fault detection and diagnosis in chemical and petrochemical process[M].Amsterdam: Elsevier Press,1978. [9] AS Willsky. A survey of design methods for failure detection in dynamic systems[J].Automatica,1975,12(6):601-611. Fault trend prediction of EMU traction motor based on improved wavelet neural network LIU Feng, LIU Hai-sheng U269 :A 1009-0134(2017)07-0015-05 2017-05-02 國家科技部“863”項目-高速鐵路動車組全生命周期數(shù)據(jù)集成化管理平臺技術(shù)研究項目(K15B200011);國家科技支撐計劃項目:面向高鐵列車高效生產(chǎn)的新一代認(rèn)知型制造執(zhí)行系統(tǒng)研究與應(yīng)用示范(2015BAF08B02) 劉峰(1961 -),男,北京人,教授,博士,研究方向為計算機(jī)軟件。2 動車組牽引電機(jī)故障趨勢預(yù)測模型
3 仿真實驗
4 結(jié)論