步春辰,王亞平,閆雅斌
(1. 南京理工大學 機械工程學院,南京 210094;
2. 廣州地鐵集團有限公司 運營事業(yè)總部,廣州 510330)
在地鐵營運的高峰時段,站臺人流量大且非常密集。若地鐵閘機出現(xiàn)故障不及時修復,車站通行效率將大幅降低,且增加安全隱患。
時間序列預測通過將某一現(xiàn)象統(tǒng)計指標的數(shù)值按時間先后順序形成數(shù)列,從中分析發(fā)現(xiàn)該現(xiàn)象隨時間變化的規(guī)律,得出一定的模式,并基于此模式預測該現(xiàn)象將來的情況。時間序列預測在經(jīng)濟、金融、工程等領(lǐng)域有著廣泛的應用[1-2]。產(chǎn)品的故障時間序列作為重要的可靠性指標,能夠反映產(chǎn)品故障的動態(tài)演化過程。目前,常用的分析故障時間序列預測的方法有:自回歸移動平均(ARIMA,Autoregressive Integrated Moving Average)[3]、奇 異 譜 分 析(SSA,Singular Spectrum Analysis)[4]、支持向量回歸(SVR,Support Vector machines Regression)[5]、人工神經(jīng)網(wǎng)絡(luò)[6](ANN,Artificial Neural Network)等。
本文采用CNN+LSTM 混合神經(jīng)網(wǎng)絡(luò),對地鐵閘機扇門機構(gòu)故障時間序列預測進行研究,以期準確掌握故障規(guī)律,制定合理的維修計劃,減少應急維修頻次,保障地鐵車站運營可靠性和安全性。
機器學習模型在過去幾年中取得顯著進步,在軌道交通領(lǐng)域已有不少應用。茅飛[7]使用ARIMA 模型預測分析閘機口各個時段的客流量,合理安排工作人員,疏導城市交通,并調(diào)節(jié)閘機參數(shù),提高其工作效率;徐文文等人[8]針對列車供電系統(tǒng)無法有效擬合和預測受電弓滑板的磨損趨勢問題,利用優(yōu)化的SVR 對其進行預測,提升受電弓的效能;李建偉等人[9]采用BP 神經(jīng)網(wǎng)絡(luò)對故障數(shù)據(jù)進行學習訓練,檢測學習相關(guān)度,預測城市軌道交通車輛的可靠性。
作為機器學習的熱門分支,深度學習逐漸被應用到故障時間序列的研究中。常見的深度學習診斷模型包括深度自動編碼器、遞歸神經(jīng)網(wǎng)絡(luò)和長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)等[10]。LSTM 擅長學習具有長程依賴關(guān)系的時間序列數(shù)據(jù),對識別高維時間序列中的長程依賴性和時序性具有明顯優(yōu)勢,而卷積神經(jīng)網(wǎng)絡(luò)(CNN)[11]適合處理具有統(tǒng)計平穩(wěn)性和局部關(guān)聯(lián)性的數(shù)據(jù)。基于CNN+LSTM 混合神經(jīng)網(wǎng)絡(luò)的時間序列預測已在多個領(lǐng)域得到應用,如圖像識別、自然語言處理、智能電表故障檢測[12]、能源資產(chǎn)能量預測、設(shè)備剩余使用壽命預測[13]等方面,具有精度高、適用性廣、可拓展的特點。
目前,國內(nèi)尚未見針對地鐵閘機故障時間序列預測分析的相關(guān)研究。
用于時間序列預測的典型CNN 由1 個用于提取特征圖的單卷積層、1 個用于特征圖二次采樣的單合并層及1 個用于學習輸出的完全連接層組成。
令X={X1,···,XN},Xi=[x1,···,xT]T作為具有N個樣本和T個嵌入維的輸入時間序列,且Yi=[xT+1,···,xT+H]T是具有H個預測范圍的相應輸出序列,帶有C 的卷積濾波器可以表示為:
LSTM 由3 個門組成,分別為遺忘門、輸入門和輸出門。
遺忘門是sigmod函數(shù)的常用單元,用于決定保留或者刪除現(xiàn)有信息;通過ht?1和xt輸出值ft(0~1)來表示細胞狀態(tài)Ct?1,0 表示完全與學習值脫節(jié),1則表示保留完整的值,輸出公式為:
其中,bf為常數(shù), σ表 示sigmod函數(shù)。
輸入門決定是否將新信息添加至LSTM 中,由sigmod層和tanh層組成;sigmod層決定哪些值需要更新替換,tanh層為新候選值創(chuàng)建一個向量并添加到LSTM 中,這些信息更新到現(xiàn)有細胞信息中,可表達為:
其中,it表 示該值是否需要更新,表示新候選值的向量,ht?1表示細胞輸出。
輸入門為LSTM 的存儲提供更新,使用遺忘門將舊值(i,ct?1) 相乘,然后加上新的候選值來忘記當前值,可表達為:
輸出門通過sigmod層來決定LSTM 內(nèi)存的哪一部分對輸出做出貢獻,再使用非線性tanh函數(shù)將向量值映射至?1 和1 之間,最后將結(jié)果乘以sigmod函數(shù)并輸出,可表達式為:
其中,ot表示輸出值,ht表示介于?1 和1 之間的值,W和b分 別指代各狀態(tài)的權(quán)重和偏置量。
基于從簡設(shè)計循環(huán)神經(jīng)網(wǎng)絡(luò)的原則,分析高維多變量時間序列數(shù)據(jù),構(gòu)建基于CNN+LSTM 的時間序列預測模型,其整體框架如圖1 所示,包括輸入層、隱藏層、輸出層及Adam 優(yōu)化4 個功能模塊。
其中,輸入層完成閘機故障數(shù)據(jù)的采集和處理;隱藏層采用CNN+LSTM 構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò),采用經(jīng)過歸一化的特征數(shù)據(jù),通過卷積層和池化層,提取出數(shù)據(jù)中重要特征后,輸入到多層結(jié)構(gòu)的LSTM 網(wǎng)絡(luò)中,并利用全連接層中Dropout(全連接層中的一個功能)來防止過擬合,提升模型泛化能力;再經(jīng)Adam 算法優(yōu)化和損失計算,最后通過輸出層進行迭代,輸出預測結(jié)果。
圖1 基于CNN+LSTM 的時間序列預測模型框架
具體算法描述如下:
(1)以月為單位,通過滑動窗口訓練,采用歸一化數(shù)據(jù)集輸入,迭代次數(shù)epochs設(shè)置,從卷積層獲取特征向量x,I={i|xi≠0}, 將x輸入,進行卷積與池化操作得到特征向量y,使用ReLU 函數(shù)激活,即maxpooling(?w+b)通過池化層輸入LSTM 神經(jīng)網(wǎng)絡(luò)。
(2)通過LSTM 神經(jīng)網(wǎng)絡(luò),將輸出概率ht輸入ReLU 函數(shù)中,得到0~1 之間的值,設(shè)置閾值后對結(jié)果進行分類,并將結(jié)果與樣本標簽進行比對,計算交叉熵損失函數(shù),并使用Adam 優(yōu)化算法對權(quán)值進行優(yōu)化,即有:
(3)按照上述步驟調(diào)整輸入,結(jié)束前向傳播,得到預測輸出值。再利用真實值,進行反向傳播并更新參數(shù),完成訓練。
采用某型號地鐵閘機2015年—2019年期間237條在役閘機的扇門機構(gòu)故障記錄,包括站點及閘機編號、故障時間、故障原因、故障現(xiàn)象、電機運行電流、線纜連接是否穩(wěn)固、扇門門體與中門間隙值、運行噪聲值、扇門主要機構(gòu)動作是否正常等數(shù)據(jù)。
對故障時間序列中的冗余數(shù)據(jù)和空值進行清洗,移除冗余數(shù)據(jù),采用均值對空值進行填充。
故障率指工作到t時刻尚未失效的產(chǎn)品,在t時刻后的單位時間內(nèi)發(fā)生失效的概率,記為 λ(t)。對于有限樣本,設(shè)樣本數(shù)目為N,經(jīng)過時間t有n(t)個樣本失效,而在 (t+?t)時 刻產(chǎn)品的失效數(shù)為n(t+?t),則故障率估計值為:
地鐵閘機發(fā)生故障后,會更換故障模塊,被更換的模塊返廠維修,相當于總體樣本在維修后進行了一次更新。本文近似的認為下一個周期(單位時間)的故障率約等于故障數(shù)除以樣本總數(shù)。
經(jīng)整理得到包含70 個數(shù)據(jù)點的月度故障時間序列數(shù)據(jù),如圖2 可知,隨著不斷的維修,閘機系統(tǒng)級故障率總體呈上升趨勢。
圖2 某型號閘機月度故障時間序列數(shù)據(jù)
故障率樣本分組方式:故障率樣本總數(shù)為n,將其分為m個 組;每組包含n?m+1個 值,其中前n?m個值為訓練用輸入樣本,第n?m+1個值為期望映射;m個 組中前k組用于訓練,后m?k組用于檢測。
如表1 所示,將這70 條數(shù)據(jù)分成60 組,每組包含11 個值;前10 個值為訓練用輸入樣本,第11個值為期望映射;60 組數(shù)據(jù)中,前40 組用來訓練,后20 組進行檢測。
表1 故障率數(shù)據(jù)分組
為評價預測模型的預測準確性,選擇3 個統(tǒng)計指標:均方根誤差(RMSE)、平均絕對誤差(MAE)和測定系數(shù)(R2)。
其中,n為 樣本數(shù),yt表示真實值,為預測值,表示閘機門機構(gòu)故障數(shù)據(jù)真值的均值。
RMSE 和MAE 接近0 意味著性能更好,而R2接近1 則性能更佳。
實驗環(huán)境配置見表2。
表2 實驗環(huán)境配置
為獲得最優(yōu)結(jié)果,需要調(diào)節(jié)故障時間序列預測模型中多個超參數(shù),主要包括:卷積核的大小、CNN 的移動步長、激活函數(shù)的選取、CNN 的深度、LSTM 的步長、隱藏層節(jié)點數(shù)、Dropout 值和優(yōu)化方法的選取。經(jīng)測試發(fā)現(xiàn),CNN 的移動步長、CNN 的深度、LSTM 的隱藏層節(jié)點數(shù)、每次訓練所選取的樣本數(shù)對預測結(jié)果的影響較大。經(jīng)實驗對比,CNN+LSTM 故障時間序列預測模型的參數(shù)設(shè)置見表3。
本文采用故障率指標對數(shù)據(jù)集中每條故障數(shù)據(jù)進行歸一化,并將數(shù)據(jù)集隨機分為2 組:訓練數(shù)據(jù)集(占70%)和驗證數(shù)據(jù)集(占30%)。經(jīng)預訓練,從規(guī)范化故障數(shù)據(jù)中提取時序特征,利用預測模型所準備的數(shù)據(jù)進行再訓練。
為評估CNN+LSTM 混合神經(jīng)網(wǎng)絡(luò)時間序列預測模型的性能,與CNN、LSTM 及ARIMA 這3 種單一預測模型進行比較,結(jié)果如圖3~圖6 所示,表4 列出了這4 種模型預測結(jié)果準確性的對比。
圖3 CNN+LSTM 模型的預測結(jié)果與真實值對比
圖4 ARIMA 模型的預測結(jié)果與真實值對比
由表4 可知:
(1)ARIMA 模型要求時序數(shù)據(jù)(不論是否經(jīng)過差分化)具備穩(wěn)定性,即只能捕捉線性關(guān)系,未考慮地鐵閘機工作中各種復雜變量所帶來的影響,其RMSE 和MAE 指標上的表現(xiàn)都是最差的。
圖5 CNN 模型的預測結(jié)果與真實值對比
圖6 LSTM 模型的預測結(jié)果與真實值對比
表4 4 種模型預測結(jié)果準確性對比
(2)CNN 模型與LSTM 模型的預測效果及各項性能指標均相差不大,但由于訓練數(shù)據(jù)量不足,CNN 與LSTM 圖像分析的中后期均出現(xiàn)一定的滯后現(xiàn)象;CNN 僅考慮當前輸入,不具備記憶功能,會丟失部分信息,也會忽略局部與整體之間的關(guān)聯(lián)性;LSTM 因具有全局性記憶功能,但在訓練大數(shù)據(jù)量時,需要更高的硬件條件。
(3)CNN+LSTM 混合神經(jīng)網(wǎng)絡(luò)模型利用CNN通道提取時序特征,并通過LSTM 輸出到全連接層,以獲得預測信息,其性能優(yōu)于其它單一模型;相比CNN 模型和LSTM 模型,其RMSE 值分別提升6.45%與7.11%,R2值分別提升8.96%與15.87%。
構(gòu)建基于CNN+LSTM 混合神經(jīng)網(wǎng)絡(luò)的故障時間序列預測模型,利用某型號地鐵閘機扇門機構(gòu)的故障數(shù)據(jù),以降低預測誤差為目標,調(diào)節(jié)模型參數(shù),對高維故障數(shù)據(jù)進行特征提取,經(jīng)神經(jīng)網(wǎng)絡(luò)迭代訓練后輸出預測結(jié)果;并與ARIMA、CNN 和LSTM 模型的預測結(jié)果進行對比,結(jié)果表明:CNN+LSTM 混合神經(jīng)網(wǎng)絡(luò)時間序列預測模型的預測結(jié)果準確性較高,具有較好的應用前景。
研究成果可用于支持地鐵閘機維修計劃的制定和優(yōu)化,減少應急維護頻次,保障地鐵車站運營的可靠性與安全性。