李 超,趙林海
(北京交通大學(xué) 電子信息工程學(xué)院, 北京 100044)
道岔作為鐵路線路的重要組成部分,通過(guò)轉(zhuǎn)轍機(jī)對(duì)道岔尖軌的推拉,實(shí)現(xiàn)道岔定位和反位的轉(zhuǎn)換、鎖閉與表示,以達(dá)到對(duì)列車運(yùn)行進(jìn)路的控制[1-2]。因此,道岔的工作狀態(tài)直接關(guān)系通過(guò)列車的運(yùn)行安全。目前,轉(zhuǎn)轍機(jī)表示缺口卡阻是道岔常見(jiàn)的故障模式之一,其會(huì)導(dǎo)致道岔失去位置表示,并使道岔轉(zhuǎn)轍機(jī)電機(jī)發(fā)生空轉(zhuǎn),從而危及行車安全[3-4]。
根據(jù)現(xiàn)場(chǎng)調(diào)研,見(jiàn)圖1,不同月份發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的數(shù)量并不相同,存在較大波動(dòng)。這說(shuō)明,不同月份發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險(xiǎn)并不一致。然而,現(xiàn)場(chǎng)目前“計(jì)劃修”模式下,各電務(wù)段實(shí)際分配到的維護(hù)資源,如維護(hù)人員、設(shè)備和維護(hù)天窗等卻是有限的[5-7]。如果不能合理分配這些維護(hù)資源,很容易導(dǎo)致兩種結(jié)果,即維護(hù)資源無(wú)法滿足當(dāng)月的維護(hù)需求,造成轉(zhuǎn)轍機(jī)表示缺口的“維護(hù)不足”和“維護(hù)滯后”;或維護(hù)資源冗余,造成人員、設(shè)備和維護(hù)天窗等維護(hù)資源的浪費(fèi),甚至引發(fā)設(shè)備的“過(guò)度維護(hù)”。
圖1 某電務(wù)段2016年各月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障數(shù)
對(duì)此,若能預(yù)測(cè)未來(lái)各月轉(zhuǎn)轍機(jī)表示缺口卡阻故障發(fā)生風(fēng)險(xiǎn)的高低,鐵路現(xiàn)場(chǎng)就可根據(jù)各月故障風(fēng)險(xiǎn)的高低提前協(xié)調(diào)設(shè)備、人員、維護(hù)天窗等資源,并調(diào)整轉(zhuǎn)轍機(jī)表示缺口相關(guān)維護(hù)活動(dòng)的月度維護(hù)計(jì)劃,從而避免轉(zhuǎn)轍機(jī)表示缺口的“過(guò)度維護(hù)”和“維護(hù)不足”問(wèn)題。因此,研究轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)的預(yù)測(cè)方法具有十分重要的意義。
目前,對(duì)于轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)的預(yù)測(cè),國(guó)內(nèi)外還沒(méi)有相關(guān)的研究報(bào)導(dǎo)。對(duì)于道岔事故風(fēng)險(xiǎn)以及其他部件故障概率和風(fēng)險(xiǎn)的相關(guān)預(yù)測(cè)研究也尚處于起步階段。其中,Wang等[8]針對(duì)由極端天氣,如雷暴、冰雹等造成的道岔外部部件故障,提出一種基于貝葉斯網(wǎng)絡(luò)的道岔設(shè)備故障頻次預(yù)測(cè)方法。Dindar等[9]針對(duì)由人為因素引發(fā)的道岔脫軌事故,提出一種基于貝葉斯網(wǎng)絡(luò)的道岔脫軌事故概率評(píng)估方法。Zhao等[10]則針對(duì)由鋼軌斷軌引發(fā)的脫軌事故,提出了一種基于LS故障風(fēng)險(xiǎn)評(píng)價(jià)法[11]和故障分布建模的道岔脫軌事故風(fēng)險(xiǎn)預(yù)測(cè)方法。
為此,本文首先基于鐵路現(xiàn)場(chǎng)的道岔維護(hù)記錄,對(duì)每月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險(xiǎn)進(jìn)行量化和分級(jí)。而后,分析了影響每月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)的外部因素,構(gòu)建每月故障風(fēng)險(xiǎn)預(yù)測(cè)特征向量。最后,基于CACC離散化方法[12]和隨機(jī)森林(Random Forest,RF)[13]構(gòu)建轉(zhuǎn)轍機(jī)表示缺口卡阻的故障風(fēng)險(xiǎn)預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)未來(lái)各月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)。實(shí)驗(yàn)表明,本文方法可較為準(zhǔn)確地預(yù)測(cè)轉(zhuǎn)轍機(jī)表示缺口卡阻的故障風(fēng)險(xiǎn)等級(jí),可為現(xiàn)場(chǎng)維護(hù)人員提前協(xié)調(diào)設(shè)備、人員、維護(hù)天窗等維護(hù)資源,調(diào)整相關(guān)維護(hù)活動(dòng)的強(qiáng)度提供可靠參考。
當(dāng)?shù)啦磙D(zhuǎn)轍機(jī)一側(cè)尖軌與對(duì)應(yīng)基本軌密貼并完成鎖閉后,與該密貼尖軌對(duì)應(yīng)表示機(jī)構(gòu)中的表示塊將落入表示桿上的表示槽中,而落下的表示塊和表示槽間的空隙即為轉(zhuǎn)轍機(jī)表示缺口,見(jiàn)圖2。
圖2 轉(zhuǎn)轍機(jī)表示缺口的位置與轉(zhuǎn)轍機(jī)結(jié)構(gòu)
通常,轉(zhuǎn)轍機(jī)表示缺口的尺寸應(yīng)處于一個(gè)正常范圍內(nèi)[14],如(2±0.5) mm[3],以保證每次道岔動(dòng)作結(jié)束后,相應(yīng)轉(zhuǎn)轍機(jī)表示機(jī)構(gòu)中的表示塊均能正常落入表示槽中,從而使相應(yīng)的表示接點(diǎn)組接通,給出道岔的位置表示。但是,若轉(zhuǎn)轍機(jī)表示缺口尺寸的變化超過(guò)上述正常范圍,或相關(guān)部件缺少潤(rùn)滑發(fā)生卡阻,則道岔動(dòng)作結(jié)束后,表示塊將無(wú)法正常落入表示槽中,導(dǎo)致表示電路無(wú)法正常接通,從而無(wú)法給出道岔位置表示,并引發(fā)轉(zhuǎn)轍機(jī)電機(jī)的空轉(zhuǎn),造成轉(zhuǎn)轍機(jī)表示缺口卡阻故障。
要實(shí)現(xiàn)轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險(xiǎn)等級(jí)預(yù)測(cè),就必需首先量化不同月份轉(zhuǎn)轍機(jī)表示缺口發(fā)生卡阻故障的風(fēng)險(xiǎn)高低,并對(duì)各月的故障風(fēng)險(xiǎn)等級(jí)進(jìn)行劃分。為此,本文引入LS風(fēng)險(xiǎn)評(píng)價(jià)法和k均值聚類方法[15]。
其中,LS風(fēng)險(xiǎn)評(píng)價(jià)法是工業(yè)生產(chǎn)領(lǐng)域最常用的故障風(fēng)險(xiǎn)評(píng)價(jià)方法之一[10],其核心思想是將故障風(fēng)險(xiǎn)量化為故障情形出現(xiàn)的頻率與故障情形造成后果的乘積。故障情形出現(xiàn)的頻率越高且造成的后果越嚴(yán)重,故障情形對(duì)應(yīng)的風(fēng)險(xiǎn)量化指標(biāo)便越高。k均值聚類則是一種無(wú)監(jiān)督的數(shù)據(jù)自動(dòng)劃分方法,其具有實(shí)現(xiàn)簡(jiǎn)單、速度快、解釋性強(qiáng)的特點(diǎn),是當(dāng)前最流行、應(yīng)用最廣泛的聚類方法[16]。
因此,利用LS風(fēng)險(xiǎn)評(píng)價(jià)法提供的風(fēng)險(xiǎn)量化思路和k均值聚類可以簡(jiǎn)單明了地量化各月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險(xiǎn),并在風(fēng)險(xiǎn)量化結(jié)束后實(shí)現(xiàn)對(duì)各月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)的自動(dòng)無(wú)監(jiān)督劃分。具體的流程如下:
首先,基于選定目標(biāo)電務(wù)段前4年的逐月道岔故障維護(hù)記錄,統(tǒng)計(jì)該段各月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的數(shù)量,結(jié)果顯示該段共存在如表1所示的5種月故障情形。
表1 轉(zhuǎn)轍機(jī)表示缺口卡阻的月故障情形
而后,根據(jù)式(1)計(jì)算上述5種月故障情形在該段出現(xiàn)的頻率,并根據(jù)式(2)計(jì)算上述5種月故障情形造成的平均月線路延誤時(shí)長(zhǎng),結(jié)果見(jiàn)圖3。
圖3 目標(biāo)電務(wù)段4年內(nèi)月故障情形i的出現(xiàn)頻率及其造成的平均月線路延誤時(shí)長(zhǎng)
Li=ni/48i∈[1,5]
( 1 )
Si=hi/nii∈[1,5]
( 2 )
式中:Li為4年內(nèi)發(fā)生月故障情形i的頻率;Si為月故障情形i導(dǎo)致的后果,也即月故障情形i造成的平均月線路延誤時(shí)長(zhǎng);ni為該段4年內(nèi)月故障情形i出現(xiàn)的次數(shù);hi為該段4年內(nèi)月故障情形為情形i的月份內(nèi),由轉(zhuǎn)轍機(jī)表示缺口卡阻故障引發(fā)線路延誤時(shí)長(zhǎng)的總和。
其次,基于LS風(fēng)險(xiǎn)評(píng)價(jià)法提供的風(fēng)險(xiǎn)量化思路,將以上5種月故障情形的風(fēng)險(xiǎn)量化為其出現(xiàn)頻率和其造成的平均月線路延誤時(shí)長(zhǎng)的乘積,即有
Ii=Li×Sii∈[1,5]
( 3 )
式中:Ii為故障情形i的風(fēng)險(xiǎn)量化指標(biāo)。
最后,基于式(3)計(jì)算的風(fēng)險(xiǎn)量化指標(biāo)Ii,采用k均值聚類算法,將表1所列的5種月故障情形,按工業(yè)領(lǐng)域相關(guān)標(biāo)準(zhǔn)[17-18]劃分為4個(gè)風(fēng)險(xiǎn)等級(jí):
( 4 )
式中:|·|為求歐式距離。
( 5 )
Step4重復(fù)Step2、Step3,直到各類的聚類中心不再發(fā)生變化。
最終,基于以上4步聚類過(guò)程,對(duì)于選定的目標(biāo)電務(wù)段,本文將每月發(fā)生1到2起轉(zhuǎn)轍機(jī)表示缺口卡阻故障的情形合并為1類,制定出如表2所示的月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)劃分規(guī)則。
表2 月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)的劃分規(guī)則
根據(jù)現(xiàn)場(chǎng)調(diào)研和以往的研究報(bào)告[6,14,19],影響每月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)高低的外部因素可被總結(jié)為3類,即溫度、濕度和前期維護(hù)力度。
其中,溫度的影響主要體現(xiàn)在道岔金屬部件的熱脹冷縮上。月內(nèi)白天溫度越高,日間溫差越大,轉(zhuǎn)轍機(jī)表示缺口的相關(guān)部件,如表示桿,發(fā)生熱脹冷縮的概率就越大,從而轉(zhuǎn)轍機(jī)表示缺口尺寸就越容易超過(guò)標(biāo)準(zhǔn)導(dǎo)致轉(zhuǎn)轍機(jī)表示缺口卡阻故障。
濕度的影響則體現(xiàn)在轉(zhuǎn)轍機(jī)表示缺口相關(guān)部件的潤(rùn)滑上。空氣濕度的高低會(huì)影響轉(zhuǎn)轍機(jī)表示缺口相關(guān)部件上潤(rùn)滑劑的濃稠程度。過(guò)高或過(guò)低的濕度都會(huì)降低轉(zhuǎn)轍機(jī)內(nèi)潤(rùn)滑劑的潤(rùn)滑性能,從而使得轉(zhuǎn)轍機(jī)表示缺口更容易發(fā)生卡阻。
前期維護(hù)力度是指上月現(xiàn)場(chǎng)維護(hù)人員維護(hù)轉(zhuǎn)轍機(jī)表示缺口的次數(shù)。若維護(hù)人員在上月進(jìn)行了充分且系統(tǒng)的維護(hù),則本月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險(xiǎn)會(huì)相對(duì)降低。
根據(jù)2.1節(jié)分析,構(gòu)建第k月的故障風(fēng)險(xiǎn)預(yù)測(cè)特征向量Fk,即
( 6 )
( 7 )
將目標(biāo)電務(wù)段前4年各月的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)與當(dāng)月的風(fēng)險(xiǎn)預(yù)測(cè)特征向量Fk串聯(lián)即可構(gòu)成本文的訓(xùn)練集DT,即
DT={[Fkgk]|k∈[1,nT]}
( 8 )
式中:nT為訓(xùn)練樣本數(shù);T為train的縮寫;gk為第k月轉(zhuǎn)轍機(jī)表示缺口卡阻故障的實(shí)際風(fēng)險(xiǎn)等級(jí),同時(shí)也是訓(xùn)練和驗(yàn)證模型的類別標(biāo)簽;Fk為標(biāo)簽gk對(duì)應(yīng)的用于輸入模型的特征向量;向量[Fkgk]為一條完整的訓(xùn)練數(shù)據(jù)。
基于2.2節(jié)構(gòu)建的故障風(fēng)險(xiǎn)預(yù)測(cè)特征向量,為實(shí)現(xiàn)對(duì)轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè),本文進(jìn)一步引入了RF模型和CACC離散化方法。
其中,RF模型是一種由多個(gè)CART決策樹模型共同構(gòu)成的集成機(jī)器學(xué)習(xí)模型[13]。RF不但繼承了經(jīng)典的樣本自助采樣法[20],還引入隨機(jī)特征采樣。這使其在計(jì)算開(kāi)銷小的同時(shí),還擁有良好的泛化性能,可為如不平衡樣本的分類、超大維度樣本的分類和小樣本分類問(wèn)題構(gòu)建較為準(zhǔn)確的分類器[21]。然而,已有的研究證明,當(dāng)樣本中同時(shí)混合有連續(xù)特征和離散特征時(shí),RF模型通常傾向于挖掘連續(xù)特征包含的信息而無(wú)法良好地學(xué)習(xí)離散特征的內(nèi)在規(guī)律[22]。CACC離散化方法則是一種自適應(yīng)的數(shù)據(jù)離散化方法,主要用于在分類問(wèn)題中實(shí)現(xiàn)對(duì)連續(xù)數(shù)據(jù)的分箱操作[23],以實(shí)現(xiàn)對(duì)數(shù)據(jù)離散化信息的濃縮,從而增強(qiáng)分類器的分類精度和分類速度,提高分類器對(duì)異常值的魯棒性。
因此,本文通過(guò)將CACC離散化方法引入RF模型來(lái)彌補(bǔ)RF模型在處理同時(shí)混合有連續(xù)特征和離散特征數(shù)據(jù)集時(shí)的不足,提高RF模型的魯棒性和分類精度,并最終構(gòu)建一套基于CACC-RF預(yù)測(cè)模型的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)算法,其總體流程見(jiàn)圖4。
圖4 算法總體流程
由圖4可知,算法可被分為算法訓(xùn)練和算法預(yù)測(cè)2個(gè)部分。在算法訓(xùn)練部分,首先基于訓(xùn)練集生成CACC離散化斷點(diǎn)集,而后離散化訓(xùn)練集中的特征向量,最后基于離散化后的訓(xùn)練集,循環(huán)訓(xùn)練CART決策樹以構(gòu)建RF模型。在算法預(yù)測(cè)部分,首先基于算法訓(xùn)練部分生成的CACC離散化斷點(diǎn)集離散化預(yù)測(cè)數(shù)據(jù),而后利用訓(xùn)練好的RF模型,預(yù)測(cè)各月的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)。
( 9 )
Step2生成離散化斷點(diǎn)候選集β,即
(10)
Step3設(shè)初始斷點(diǎn)數(shù)ql=1,全局CACC統(tǒng)計(jì)量Cg=0。構(gòu)建初始CACC離散化斷點(diǎn)集γ0
(11)
Step4對(duì)集合β中的每個(gè)βp,如果βp?γ0,則構(gòu)建集合γp
γp=γ0∪βp
(12)
Step5計(jì)算各集合γp的CACC統(tǒng)計(jì)量取值Cp,即
(13)
(14)
(15)
(16)
式中:max(·)表示求括號(hào)內(nèi)的最大取值;argmax(·)表示求使括號(hào)內(nèi)值取最大值的條件。
(17)
3.2.2 RF模型的生成
訓(xùn)練RF模型的過(guò)程包括以下8步:
Step1初始化決策樹數(shù)量r=0。初始化一個(gè)空集合T=?用于存儲(chǔ)RF模型。設(shè)置隨機(jī)森林要求的規(guī)模為R,隨機(jī)特征采樣數(shù)為W,葉結(jié)點(diǎn)最小樣本數(shù)為E。
(18)
(19)
(20)
(21)
(22)
(23)
式中:argmin(·)表示求使括號(hào)內(nèi)值取最小值的條件。
Step8令T=T∪Tr。判斷當(dāng)前決策樹數(shù)量r是否小于R。若r 基于算法訓(xùn)練完成的隨機(jī)森林模型T和CACC離散化斷點(diǎn)集γl,即可實(shí)現(xiàn)對(duì)訓(xùn)練集外任意第t個(gè)月份轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)的預(yù)測(cè)。 (24) (25) 進(jìn)一步,對(duì)T中每棵決策樹的推斷結(jié)果取平均作為隨機(jī)森林T的推斷結(jié)果,即有 (26) (27) 為驗(yàn)證本文算法訓(xùn)練部分功能的有效性,首先基于目標(biāo)電務(wù)段2016年至2019年的道岔維護(hù)記錄和歷史氣象數(shù)據(jù),根據(jù)公式(6)~式(8)構(gòu)建訓(xùn)練集DT。 而后,根據(jù)3.2.1小節(jié)中的步驟,基于訓(xùn)練集DT為各月風(fēng)險(xiǎn)特征向量Fk中的連續(xù)特征生成CACC離散化斷點(diǎn)集,結(jié)果如表3所示。 表3 Fk中各連續(xù)特征的CACC離散化斷點(diǎn)集 最后,隨機(jī)森林模型3個(gè)初始化參數(shù)的取值由基于10折交叉驗(yàn)證的貝葉斯超參數(shù)搜索算法[24]確定。最終選定隨機(jī)森林規(guī)模R=91,隨機(jī)特征采樣數(shù)W=3,葉結(jié)點(diǎn)最小樣本數(shù)E=4。圖5顯示了訓(xùn)練完成的隨機(jī)森林模型T對(duì)訓(xùn)練集內(nèi)各月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)結(jié)果。 圖5 訓(xùn)練集預(yù)測(cè)結(jié)果 由圖5可知,訓(xùn)練完成的隨機(jī)森林模型T僅錯(cuò)誤預(yù)測(cè)了訓(xùn)練集中一個(gè)月的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)。這說(shuō)明隨機(jī)森林模型T從訓(xùn)練集中較好地學(xué)習(xí)了轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)與各影響因素間的內(nèi)在規(guī)律。 4.1.2 算法預(yù)測(cè)部分功能驗(yàn)證 為進(jìn)一步驗(yàn)證本文算法預(yù)測(cè)功能的有效性,本部分利用訓(xùn)練完成的隨機(jī)森林模型T,對(duì)2020年1月的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)進(jìn)行了預(yù)測(cè)。 (28) 表4 目標(biāo)電務(wù)段2020年1月的風(fēng)險(xiǎn)預(yù)測(cè)特征向量及其離散化結(jié)果 表5 目標(biāo)電務(wù)段2020年1月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)為u的概率 最后,根據(jù)式(27),輸出2020年1月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)值。通過(guò)參考表5可知,本文算法預(yù)測(cè)2020年1月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險(xiǎn)等級(jí)為2(如表5陰影標(biāo)注),與真實(shí)情況一致。這說(shuō)明當(dāng)氣象臺(tái)提供的氣象預(yù)報(bào)結(jié)果準(zhǔn)確時(shí),本文方法能夠良好地實(shí)現(xiàn)轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)的功能。 圖6 目標(biāo)電務(wù)段2020年1月至12月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)結(jié)果 由圖6可知,本文算法僅錯(cuò)誤預(yù)測(cè)了目標(biāo)電務(wù)段2020年11月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險(xiǎn)等級(jí)。通過(guò)對(duì)比目標(biāo)電務(wù)段所在地區(qū)2020年10月和11月的月度氣象數(shù)據(jù)發(fā)現(xiàn),這兩個(gè)月的月度氣象特征表現(xiàn)十分接近,因此RF模型認(rèn)為目標(biāo)電務(wù)段11月的故障風(fēng)險(xiǎn)等級(jí)與10月相同,高估了該月的故障風(fēng)險(xiǎn)等級(jí)。 為量化本文方法的預(yù)測(cè)效果,計(jì)算隨機(jī)森林模型T的預(yù)測(cè)準(zhǔn)確率Acc,最大預(yù)測(cè)誤差EM和總預(yù)測(cè)誤差ET,即 (29) (30) (31) 經(jīng)計(jì)算,本文模型的預(yù)測(cè)準(zhǔn)確率Acc為91.7%,最大預(yù)測(cè)誤差EM為1,總預(yù)測(cè)誤差ET等于1。這說(shuō)明當(dāng)氣象臺(tái)提供的氣象預(yù)報(bào)結(jié)果準(zhǔn)確時(shí),本文提出的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)算法具有良好的預(yù)測(cè)性能。 (32) (33) 圖7 2020年和前8維氣象特征取值 圖8 目標(biāo)電務(wù)段2020年1月至12月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)結(jié)果 最后,引入糾錯(cuò)輸出碼(Error Correcting Output Codes, ECOC)模型[25]和樸素貝葉斯(Naive Bayesian,NB)模型[26],并將本文算法的性能與這2種模型進(jìn)行了對(duì)比。其中,ECOC模型是一種基于糾錯(cuò)輸出編碼的多分類模型,該模型通常會(huì)將一個(gè)多分類問(wèn)題通過(guò)編碼方式分解為多個(gè)二分類問(wèn)題,從而利用多個(gè)基二分類模型共同解決多分類問(wèn)題。已有的研究已經(jīng)證明,相較于其他多分類模型,ECOC模型在多數(shù)問(wèn)題中有更優(yōu)的表現(xiàn)[27]。NB模型則是一種基于貝葉斯決策論的多分類器。該模型在各種類型的樣本集上均能夠獲得十分穩(wěn)定的分類效率和性能表現(xiàn)[28],且對(duì)缺失數(shù)據(jù)和異常數(shù)據(jù)不敏感,被廣泛應(yīng)用于文本分類、網(wǎng)絡(luò)信息安全等領(lǐng)域。此處,本小節(jié)以在小樣本上表現(xiàn)良好且泛化性能優(yōu)秀的支持向量機(jī)模型[29]作為基學(xué)習(xí)器并使用3元碼[30]編碼方式構(gòu)建ECOC模型。表6顯示了原始的RF模型、ECOC模型和NB模型增加CACC離散化步驟前后,在本文數(shù)據(jù)集上的表現(xiàn)。 表6 不同模型的性能比較結(jié)果 針對(duì)鐵路現(xiàn)場(chǎng)當(dāng)前“計(jì)劃修”模式下轉(zhuǎn)轍機(jī)表示缺口存在的“維護(hù)不足”和“過(guò)度維護(hù)”問(wèn)題,本文提出了一種基于CACC-RF模型的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)方法?;诂F(xiàn)場(chǎng)5年維護(hù)記錄數(shù)據(jù)的實(shí)驗(yàn)表明,本文提出的方法可以較為準(zhǔn)確預(yù)測(cè)各月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險(xiǎn)等級(jí),從而指導(dǎo)現(xiàn)場(chǎng)維護(hù)人員根據(jù)各月不同的故障風(fēng)險(xiǎn)等級(jí)提前協(xié)調(diào)設(shè)備、人員和維護(hù)天窗等維護(hù)資源,調(diào)整轉(zhuǎn)轍機(jī)表示缺口相關(guān)維護(hù)活動(dòng)的強(qiáng)度,最終實(shí)現(xiàn)在減少人力物力浪費(fèi)的同時(shí),提高道岔的維護(hù)水平。 下一步,更多的監(jiān)測(cè)數(shù)據(jù)和特征將被考慮以進(jìn)一步提升本文模型的精度。同時(shí),將嘗試把本文提出的方法移植到軌道電路等其他電務(wù)的關(guān)鍵設(shè)備上,從而為電務(wù)維護(hù)人員制定月度維修計(jì)劃提供更加豐富的參考。3.3 轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)
4 實(shí)驗(yàn)驗(yàn)證
4.1 功能驗(yàn)證4.1.1 算法訓(xùn)練部分功能驗(yàn)證
4.2 性能驗(yàn)證
5 結(jié)論