盧 皎,禹建麗,黃春雷,陳洪根
(1.鄭州航空工業(yè)管理學院 管理工程學院,河南 鄭州 450046;2.黑龍江瑞興科技股份有限公司,黑龍江 哈爾濱 150030)
我國鐵路建設高速發(fā)展,極大地方便了人們的出行,同時推動了國民經(jīng)濟的發(fā)展。鐵路運輸?shù)陌踩允菍崿F(xiàn)鐵路整體高效運行的基本保證[1]。鐵路區(qū)間廣泛鋪設的ZPW-2000系列無絕緣移頻軌道電路是列車運行控制系統(tǒng)的基礎設備,主要用于實現(xiàn)對區(qū)間的占用檢查、斷軌檢查以及地車通訊。軌道電路的正常工作是列車安全運行的重要保障。軌道電路室外設備易受溫度、濕度等復雜環(huán)境因素影響,同時也因系統(tǒng)各個部件運行狀況等,使得軌道電路故障時有發(fā)生[2],其結果會影響鐵路運營效率甚至行車安全[3]。
目前,ZPW-2000R軌道電路發(fā)生故障時,現(xiàn)場人員主要依賴工作經(jīng)驗,對設備相關部位進行數(shù)據(jù)測試,或利用微機監(jiān)測數(shù)據(jù),根據(jù)系統(tǒng)應用邏輯分析、電路的電氣特性等對故障位置進行定位[4]。當遇到較為罕見的故障模式,故障特征較為復雜時,僅依據(jù)已有經(jīng)驗難以進行準確的快速故障診斷。
為了擺脫軌道電路故障診斷對人的依賴,提高故障診斷效率,增加軌道電路信號系統(tǒng)的安全性和可靠性,很多學者進行了軌道電路故障自動診斷方法研究。胡永杰等[5]將ZPW-2000A信號設備作為研究對象,對常見故障類型和故障原理進行分析。張振海等[6]將圖論與粗糙集應用于鐵路故障診斷,減少了模型的復雜度,提高了準確性。隨著大數(shù)據(jù)、人工智能的發(fā)展,機器學習在故障診斷中的應用越來越廣泛,如人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)、支持向量機((support vector machines, SVM)、隨機森林(random forest, RF)等在故障診斷中都有廣泛應用[7-9]。卷積神經(jīng)網(wǎng)絡作為深度學習算法之一,解決了誤差反向傳播(back propagation, BP)神經(jīng)網(wǎng)絡等傳統(tǒng)網(wǎng)絡容易過擬合,提取特征缺失等缺陷,可有效減少網(wǎng)絡的復雜度,具有更為強大的分類能力[10],廣泛應用于信號和信息處理中[11]。許多學者嘗試在故障診斷領域應用卷積神經(jīng)網(wǎng)絡,并取得了較高的診斷精度。Zhang等[12]將卷積神經(jīng)網(wǎng)絡用于高鐵轉向架的故障診斷中,可快速診斷轉向架常見故障,對高速鐵路的安全運行具有重要意義。卷積神經(jīng)網(wǎng)絡具有較強的泛化能力,Zhu等[13]用一種改進的卷積神經(jīng)網(wǎng)絡研究飛機發(fā)動機的超音速燃燒器,解決復雜的超音速燃燒器燃燒模式問題。趙冰等[14]、周雯等[15]應用卷積神經(jīng)網(wǎng)絡解決鐵路關鍵部位缺陷檢查及行車安全檢查,提高了缺陷檢測的準確率。
ZPW-2000R型軌道電路鋪設在全國數(shù)千公里的鐵路線上,工作環(huán)境復雜,故障類型、數(shù)目多,實現(xiàn)快速準確的故障智能診斷難度大。鑒于卷積神經(jīng)網(wǎng)絡在特征提取與模式識別方面的獨特優(yōu)勢,本文將其應用于ZPW-2000R型軌道電路故障智能診斷研究,提出一種基于卷積神經(jīng)網(wǎng)絡模型的故障診斷方法。利用維護機監(jiān)測的軌道電路實時數(shù)據(jù)對包括室內(nèi)、室外設備的29種故障類型進行快速智能診斷。
卷 積 神 經(jīng) 網(wǎng) 絡(convolutional neural network,CNN),是受哺乳動物的視覺皮層細胞啟發(fā)而提出的前饋性神經(jīng)網(wǎng)絡,目前廣泛應用于圖像識別領域[16]。CNN基本結構如圖1所示,包括輸入層、卷積層、池化層、全連接層和輸出層。
圖1 卷積神經(jīng)網(wǎng)絡結構圖Figure 1 Structure of convolutional neural network
卷積層相當于圖像處理中的“濾波器運算”,當圖像輸入到卷積神經(jīng)網(wǎng)絡后通過卷積層不斷提取特征。卷積層的計算公式為
池化層即下采樣,通常采用最大值池化和平均值池化,通過池化稀疏參數(shù)簡化網(wǎng)絡結構。池化層的計算公式為
其中,down為池化函數(shù);β為第l層的網(wǎng)絡乘性偏置。
全連接層與傳統(tǒng)神經(jīng)網(wǎng)絡的全連接方式相同,輸出為其中,f為激活函數(shù);WT為全連接層的權值矩陣。通常在全連接層之后連接softmax、adam、optimizer等分類函數(shù)。將數(shù)值轉化為對應類別的概率,softmax的輸出為
其中, xn為 輸出節(jié)點個數(shù),即分類數(shù); xm為第m個節(jié)點的輸出值; Pm為網(wǎng)絡預測出的結果,屬于第m類的概率值。
本文所使用的一維卷積神經(jīng)網(wǎng)絡方法與卷積神經(jīng)網(wǎng)絡原理相似,具體操作過程如圖2所示。
圖2 一維卷積神經(jīng)網(wǎng)絡具體操作圖Figure 2 Operation of 1D convolution neural network
根據(jù)神經(jīng)網(wǎng)絡具有監(jiān)督學習的特點,將軌道電路診斷主機的實時變化數(shù)據(jù)作為神經(jīng)網(wǎng)絡的輸入,將實際使用中常見的故障類型作為輸出,建立輸入與輸出之間的映射關系。模型分為訓練階段和故障診斷階段,如圖3所示。首先,將訓練數(shù)據(jù)集的實時監(jiān)測數(shù)據(jù)作為輸入,故障類型作為輸出,訓練網(wǎng)絡的參數(shù),不斷調(diào)整網(wǎng)絡結構,尋找最優(yōu)參數(shù)。然后,將測試集的監(jiān)測變量輸入訓練好的卷積神經(jīng)網(wǎng)絡,以此來判斷網(wǎng)絡性能。和圖像處理不同,本文對ZPW-2000R的29種故障類型進行故障診斷用的是診斷主機實時監(jiān)測的變量數(shù)據(jù),用一維卷積神經(jīng)網(wǎng)絡處理更為合理。一維卷積神經(jīng)網(wǎng)絡是處理一維序列數(shù)據(jù)的一種卷積神經(jīng)網(wǎng)絡,與卷積神經(jīng)網(wǎng)絡結構相似,包括卷積層、池化層和全連接層[17]。當一維序列 X=[x1,x2,···,xn]T作為輸入傳入卷積層時,輸出為
圖3 基于CNN的軌道電路故障診斷模型圖Figure 3 Fault diagnosis model of track circuit based on CNN
池化層通常選用最大池化(max-pooling)將序列長減小。
其中,p為池化層的層數(shù)。
全連接層與傳統(tǒng)神經(jīng)網(wǎng)絡一樣,有多個隱含層,傳遞函數(shù)可選擇sigmoid函數(shù)
最后,經(jīng)過softmax分類器后得到故障類型。
ZPW-2000R型無絕緣移頻軌道電路結構如圖4所示。ZPW-2000R主要由鋼軌、室外設備和室內(nèi)設備組成。ZPW-2000R無絕緣移頻軌道電路發(fā)送器通過移頻信號的形式向鋼軌傳輸前方區(qū)段的車輛占用情況。當其無列車占用時,接收器接收到足夠強度的軌道信號,軌道繼電器吸起,相應設備顯示該區(qū)段空閑。當列車進入軌道電路區(qū)間時,列車輪對起到分路軌道信號作用,接收器接收的軌道信號幅值低于軌道繼電器下落門限,軌道繼電器落下,相應設備顯示該區(qū)段占用[18],ZPW-2000R軌道電路系統(tǒng)通過診斷主機等設備對每個軌道電路區(qū)段的各項主要電壓、電流信號等38個變量進行實時監(jiān)測。
圖4 ZPW-2000R型軌道電路拓撲結構圖Figure 4 Topological structure of ZPW-2000R track circuit
實驗裝置如圖5所示,由ZPW-2000R型移頻自閉系統(tǒng)模擬道床組成,通過模擬29種不同的故障,監(jiān)測發(fā)送器、接收器、發(fā)送端變壓器、發(fā)送端調(diào)諧單元、接收端變壓器、接收端調(diào)諧單元等15個單元器材以及鋼軌附近的電壓電流共38個變量(記為[Z1,Z2,···,Z38]),由診斷主機讀取并記錄數(shù)據(jù)。在實際列車運行中,區(qū)段長度、載頻、電纜長度以及道砟電阻的不同,都會對各個單元器材的監(jiān)測變量產(chǎn)生影響。因此,根據(jù)不同的影響因素,選擇6種不同的實用場景進行故障模擬仿真實驗,采集對應的監(jiān)測變量。
圖5 ZPW-2000R型移頻自閉系統(tǒng)模擬道床Figure 5 Simulation track bed of ZPW-2000R frequency shift self closing system
通過監(jiān)測設備的功出電壓、功出電流、發(fā)送電纜電壓電流等共38個變量,得到正常狀態(tài)的數(shù)據(jù)和29種故障類型的數(shù)據(jù)。各種故障類型名稱如表1所示。用故障名稱序號表示各類故障。通過整理得到數(shù)據(jù)集5 820組,其中,4 074組作為訓練和K折驗證組;1 746組作為測試組。將數(shù)據(jù)集劃分為網(wǎng)絡訓練樣本和測試樣本,見表2。
表1 ZPW-2000R型移頻軌道電路常見29種故障類型Table 1 29 Common fault types of ZPW-2000R frequency shift track circuit
表2 網(wǎng)絡訓練樣本與測試樣本分組情況Table 2 Grouping of network training samples and test samples
將整理后的訓練樣本和測試樣本中的各個監(jiān)測變量進行歸一化處理。歸一化公式為
其中,x為歸一化前的數(shù)據(jù); xnorm為歸一化后的數(shù)據(jù); xmin、 xmax為原始數(shù)據(jù)的最大值和最小值。
將訓練集輸入已建立的卷積神經(jīng)網(wǎng)絡模型,針對模型進行超參數(shù)調(diào)整實驗,通過實驗確定故障診斷準確率較高的網(wǎng)絡參數(shù)。CNN模型中的超參數(shù)包含卷積層數(shù)、卷積核的大小、池化層數(shù)、全連接層中隱層層數(shù)、不同的優(yōu)化函數(shù)以及批處理數(shù)等。通過K折交叉驗證的方式確定最優(yōu)參數(shù),將訓練集中的數(shù)據(jù)按照K折交叉驗證的方法進行實驗,將數(shù)據(jù)集分成k個子集,選擇其中一個子集作為評估數(shù)據(jù)集,利用剩余k-1個子集訓練模型,并用預留的子集對模型作評估;重復該過程,直到所有子集被賦予作為被評估數(shù)據(jù)集的機會,據(jù)此測試模型取不同超參數(shù)下的性能,并最終確定最佳參數(shù)。
1) 針對不同的卷積神經(jīng)網(wǎng)絡模型,需要選擇不同的優(yōu)化器,常用的優(yōu)化方法有Adam、RMSprop、SGD、Adadelta[19]等。由于該故障診斷問題所需分類數(shù)較多,因此,采用相同的樣本數(shù),并將其他參數(shù)設置一致,通過比較分類的準確率來選取合適的優(yōu)化器。由于分類數(shù)目較多,用SGD法分類效果較差,Adadelta法準確率僅為65%,而RMSprop法準確率為93.25%,Adam法準確率為95.21%,故選擇Adam自適應調(diào)整學習率法[20]。Adam法的優(yōu)點是使梯度經(jīng)過偏置校正后,每一次迭代學習率都有一個固定范圍,參數(shù)比較平穩(wěn),可加快訓練速度。
2) 由于輸入向量是一維數(shù)據(jù),故設置一維卷積核。通過調(diào)整卷積層的結構發(fā)現(xiàn),卷積核大小為2×1時和3×1時的準確率較為接近,約為95%;而當卷積核大小為4×1時,準確率下降到93%,故選取卷積核大小為3×1,采樣寬度為2×1。卷積層用Rule作為激活函數(shù),池化層采用MaxPooling的方法。卷積層和池化層交替,可以加深網(wǎng)絡的深度,也可以通過較少的參數(shù)來提取較全面的特征。由于輸入數(shù)據(jù)為38種監(jiān)測變量,輸出為29種故障類型,故障診斷輸出類型較多,故采用softmax分類函數(shù)得出分類結果,全連接層設置層數(shù)為30。
3) 深度學習訓練的樣本數(shù)較多,如果采取單個樣本的方法更新參數(shù),會陷入局部最優(yōu),影響神經(jīng)網(wǎng)絡的性能和泛化能力,因此本文采用批處理的方式訓練網(wǎng)絡。批處理的數(shù)目較少會嚴重影響迭代速度,同時極易陷入局部最優(yōu);而批處理數(shù)目較多會導致無法找到最優(yōu)參數(shù),本文采用相同的樣本數(shù),并將其他參數(shù)設置一致,分別采用批處理數(shù)為16、32、40、64進行實驗,分類的準確率分別為95.26%、94.35%、95.31%、92.02%。因此,選擇既可以保證準確率又可以提升運算速度的批處理數(shù)40。
實驗環(huán)境基于Keras的深度學習庫,Tensorflow為后端,采用Anaconda的Jupyter Notebook作為Python編譯器,將訓練集輸入卷積神經(jīng)網(wǎng)絡,采用交叉驗證的方法,通過K折交叉驗證獲得最優(yōu)超參數(shù),迭代350次后停止訓練,此時回檢樣本準確率達98.25%,得到訓練過程中損失函數(shù)變化曲線,如圖6~7所示。將測試樣本輸入到訓練好的網(wǎng)絡,評估神經(jīng)網(wǎng)絡的準確率。
圖6 網(wǎng)絡訓練過程中準確率變化曲線Figure 6 The accuracy curve during the network training procedure
圖7 網(wǎng)絡訓練過程中損失率變化曲線Figure 7 The loss rate curve during the network training procedure
利用精確率、召回率、準確率和F1-score[21]4個指標進行模型的性能分析。準確率可評估出網(wǎng)絡的總體分類性能;通過精確率、召回率和F1-score可以看出網(wǎng)絡對每一類型故障的分類性能。具體計算如式(9)~(12)所示。其中,TP為被模型預測為正的正樣本;FP為被模型預測為正的負樣本;FN為被模型預測為負的正樣本;TN為被模型預測為負的負樣本。TP、FP、FN、TN構成混淆矩陣。
根據(jù)式(9)~(12)可得網(wǎng)絡的準確率為96.27%。測試集中各故障類型的預測準確個數(shù)和準確率如圖8~9所示。
圖8 測試集診斷結果圖Figure 8 Test set diagnosis results
圖9 測試集診斷準確率Figure 9 Diagnostic accuracy of test set
由圖8~9可以看出,一維卷積神經(jīng)網(wǎng)絡可以診斷出29種故障類型,總體故障診斷準確率較高。訓練樣本的回檢準確率可達98.25%,檢驗樣本的故障診斷準確率達96%。對檢驗樣本,故障類型1、2、3、4、6、7、9、10、11、12、13、14、15、16、17、19、20、21、22、23、24、25、26、27、28、29均有非常高的準確率(90%~100%),而對故障5、8、18的診斷準確率在80%到90%之間。
將相同的樣本數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡調(diào)整網(wǎng)絡層數(shù)和參數(shù)進行網(wǎng)絡訓練。實驗結果表明,在設置隱層神經(jīng)元個數(shù)為150時,神經(jīng)網(wǎng)絡回檢準確率僅能達到80%,且神經(jīng)網(wǎng)絡泛化能力較差,不能給出相應準確率的故障類型診斷。因此,BP等傳統(tǒng)淺層神經(jīng)網(wǎng)絡對于輸出變量較少的分類問題效果較好,但ZPW-2000R軌道電路故障診斷問題輸入變量和輸出變量均較多,不能使用傳統(tǒng)神經(jīng)網(wǎng)絡進行分類,故使用卷積神經(jīng)網(wǎng)絡進行軌道電路故障診斷,準確率較高,具有可行性。
深度卷積神經(jīng)網(wǎng)絡可以挖掘同類數(shù)據(jù)內(nèi)在關系,使不同類別數(shù)據(jù)之間的界限得以明確,可避免傳統(tǒng)淺層神經(jīng)網(wǎng)絡故障診斷算法存在的訓練耗時,易陷入局部極小值等問題。本文利用深度卷積神經(jīng)網(wǎng)絡的優(yōu)勢,通過實驗研究提出了一種基于一維卷積神經(jīng)網(wǎng)絡的ZPW-2000R型軌道電路故障診斷方法。實驗結果表明,用訓練好的一維卷積神經(jīng)網(wǎng)絡可以直接將現(xiàn)場監(jiān)測到的電壓、電流等38個變量作為神經(jīng)網(wǎng)絡的輸入,快速診斷出故障類型,且對29種故障都有較高的故障診斷準確率,有助于現(xiàn)場維護人員排除故障,恢復鐵路運輸,提高軌道電路維護維修效率和智能化水平,確?,F(xiàn)代化鐵路運輸?shù)母咚?、高效和安全可靠?/p>