呂 彪 ,劉于萌
(1. 西南交通大學信息科學與技術學院,四川 成都 611756;2. 西南交通大學四川省列車運行控制技術工程研究中心,四川 成都 611756;3. 北京交通大學電子信息工程學院,北京 100044)
CTCS-3 (China train control system-3)級列控系統是保障時速300 km 以上動車組安全、高效運行的神經中樞. 車載子系統是CTCS-3 級列控核心組成部分[1]. 已有研究普遍使用可用性或可靠性作為車載子系統運行穩(wěn)定性的測度指標. 文獻[2]組合可靠性框圖與馬爾可夫隨機過程方法計算了列控系統的可靠性、可用性及維修性指標. 文獻[3]基于動態(tài)故障樹方法研究了CTCS-3 級列控車載設備的可靠性.文獻[4-5]運用貝葉斯網絡(Bayesian network, BN)評估了CTCS-3 級列控車載子系統的可靠性. 文獻[6]以可靠度收益和維修成本為優(yōu)化目標,提出了列控系統維修周期的確定方法. 文獻[7]使用動態(tài)BN 評估了CTCS-300T 列控車載子系統的運行可靠性與可用性. 上述研究[2-7]在建模工具、考慮因素和側重點上雖各有不同,但均遵從傳統可靠性工程研究的基本思路,即不考慮特定擾動事件影響、以統計平均性能確定部件壽命分布和維修時間分布;同時,基于列控系統部件由電子器件構成的現實,假定部件壽命與維修時間均服從指數分布,即具有恒定的失效率和維修率. 傳統方法用來評價列車運行環(huán)境穩(wěn)定、無重大擾動發(fā)生時的系統性能是合適的. 但“7·23”事故表明,當面臨雷電等非常態(tài)擾動時,傳統可用性、可靠性指標不再適用. 這不僅因為面臨非常態(tài)擾動時列控系統失效概率會大幅增加,而且失效概率與擾動類型直接相關,不能再視為常數. 同時,運營企業(yè)不僅關心列控系統能否抵御非常態(tài)擾動,也關心系統一旦失效能否快速有效恢復到可用狀態(tài). 因此,設計合理指標、專門針對非常態(tài)擾動下列控系統性能研究,有利于提升系統應對雷電等重大擾動事件的能力.
不同于可用性指標,韌性通常以非常態(tài)擾動為背景,可同時描述系統抵御擾動和從擾動中快速恢復的能力. 韌性最初應用于生態(tài)學領域. 1973 年,生態(tài)學家Holling[8]首次使用韌性評價生態(tài)系統穩(wěn)定性,隨后韌性被引入工程領域. 隨著研究不斷深入,交通運輸領域的韌性問題也逐步引起研究者關注[9].Murray-Tuite[10]首次使用韌性評價交通系統的性能.Henry 等[11]將韌性定義為恢復期內系統性能恢復程度與擾動事件所造成的系統性能損失程度之比.Twumasi-Boakye 等[12]認為有韌性的系統應是吸收擾動能力強、失效恢復速度快的系統. 文獻[13]通過航空服務從破壞性事件中恢復的速度來衡量韌性.文獻[14]通過乘客延誤等指標量化鐵路運輸系統韌性. 文獻[15]提出了一種基于OD (origin-destination)數據集評估城市交通韌性的方法. 文獻[16]通過對10 個地區(qū)的智能交通系統進行隨機和有針對性的破壞來研究網絡效率和韌性,證明了韌性對智能交通系統的適用性. 文獻[17]利用彈性三角模型對列控車載設備在不同故障情況下的恢復能力進行了評估. 綜合來看,交通運輸領域韌性研究目前處于起步階段,僅有的少量研究主要針對航空網絡、道路網絡、城市公交網絡等展開.
基于上述分析,引入韌性作為評價非常態(tài)擾動下CTCS-3 級列控車載子系統運行穩(wěn)定性的指標.首先,界定了韌性的內涵,定義了適用于列控車載子系統的韌性量化方法和5 種基于韌性的部件重要度指標,構建了基于BN 的列控車載子系統韌性評估模型,并開展算例研究.
CTCS-3 級列控車載子系統(簡稱車載子系統)是保證列車安全、高效運行的核心裝置,其結構如圖1 所示[4-5].
圖1 CTCS-3 級列控車載子系統結構Fig. 1 On-board subsystem structure of CTCS-3
車載子系統采用分布式結構,由安全計算機(vital computer, VC)、軌道電路信息接收單元(track circuit receiver, TCR)、列車接口單元(train interface unit, TIU)、無線傳輸單元(radio transmission unit,RTU)、GSM-R (global system for mobile communications-railway)、無線電臺(radio station, RS)、測速測距單元(speed and distance processing unit, SDU)、應答器傳輸模塊(balise transmission module, BTM)及應答器天線(BTM ant)、人機界面(driver machine interface, DMI)、司法記錄儀(juridical recorder unit,JRU)以及PROFIBUS (process fIeld bus)接口等部件組成. 為保證高可靠、高可用性,關鍵部件均采用冗余配置,例如,BTM、BTM ant、DMI 等采用冷備結構,ATP-CU (automatic train protection-core unit)、C2-CU (China train control system-2 core unit)、速度傳感器、雷達、TCR、GSM-R 單元及其天線等采用熱備結構[4-5].
由于學科視角與對象不同,不同研究者對韌性內涵界定存在較大差異[18]. 部分研究將韌性表述為可靠性、脆弱性、恢復性等傳統指標的簡單延伸或擴展,與韌性內涵嚴重不匹配[18]. 文獻[9]指出,韌性內涵應包括兩方面:一是系統抵御擾動的能力,二是系統偏離穩(wěn)定狀態(tài)后的快速恢復能力. 對車載子系統而言,實際應用中遭遇雷電等非常態(tài)擾動時,可能導致部件損壞,由于部分部件采用冗余配置,單套設備損壞后系統仍能正常工作,即系統具有吸收或抵御擾動的能力;而非冗余配置部件的損壞則可能導致系統失效,但通過采取一定的技術手段(如替換失效部件)可盡快使系統恢復到正常狀態(tài),即系統具有從擾動中快速恢復的能力. 車載子系統的韌性是上述兩種能力的綜合體現.
基于上述分析,將車載子系統或部件的韌性定義為:系統或部件受到非常態(tài)擾動時具有的維持正常運行或失效后快速恢復正常運行的能力.
圖2 描述了非常態(tài)擾動事件下韌性與可用性指標的差異. 圖中:t為時間;t0、td、tr分別為擾動事件發(fā)生時刻、系統性能退化到最低程度時刻、系統性能恢復時刻;F(t) 為系統性能函數;紅色實線表示可用性指標,黑色實線表示韌性指標. 為便于分析,將擾動事件下系統性能劃分為4 種狀態(tài),分別為:1) 正常狀態(tài): 0 <t<t0,出現擾動前,系統保持穩(wěn)定工作狀態(tài). 2) 降級狀態(tài):t0<t<td,擾動事件發(fā)生導致系統性能退化;3) 恢復狀態(tài):td<t<tr,通過維修受損部件將系統性能恢復到預期水平. 4) 新穩(wěn)定狀態(tài):t>tr,完成維修后,系統性能恢復到新的穩(wěn)定狀態(tài).可以看出:擾動事件發(fā)生后,可用性指標與韌性指標出現明顯分化,由于可用性不考慮特定事件影響,因此指標穩(wěn)定;而韌性存在事件依賴,出現明顯的降級然后恢復的過程.
圖2 非常態(tài)擾動事件下韌性與可用性指標的差異Fig. 2 Differences in resilience and availability indexes under abnormal disturbance events
車載子系統是由多部件構成的復雜系統,由于擾動事件通常導致部件失效進而引發(fā)系統失效或性能退化,因此,車載子系統韌性評估應以部件韌性評估為基礎. 為便于描述,令Xei(t) 表示擾動事件e發(fā)生后時刻t部件i的狀態(tài)變量,具體定義如下:
令 ψei(t) 表示擾動事件e發(fā)生后時刻t部件i的韌性值. 根據前文所述,韌性內涵為抵御擾動的能力和無法抵御擾動時的快速恢復能力. 根據這一界定,可將 ψei(t) 具體表示如下:
式中:P(·)為概率計算.
從式(2)可以看出:擾動事件e發(fā)生后部件i在時刻t的韌性值等于該時刻部件處于可用狀態(tài)的概率. 存在兩種可能性,一是該部件能抵御擾動事件影響并未失效,二是該部件雖失效但在時刻t已恢復正常.
令 ρei(t0) 表示時刻t0發(fā)生擾動事件e時部件i失效的概率, φei(t-t0) 表示擾動事件e發(fā)生后部件i在時刻t0未失效且在時段t-t0仍正常工作的概率,φei(t-t0)表示時刻t0發(fā)生擾動事件e后部件i失效但在時段t-t0恢復正常的概率.
根據式(1)、(2)可得
由于列控系統部件由電子器件構成,工程計算中通常以指數分布描述部件壽命與維修時間分布.因此,假定 φei(t-t0) 和 φei(t-t0) 分別服從部件i的失效率 λi和部件i的維修率 μi的指數分布. 在此條件下, φei(t-t0) 和 φei(t-t0) 可分別展開為
根據式(4)、(5),可將式(3)重新描述如下:
式(6)中:(1-ρei(t0))e-λi(t-t0)反映部件i抵御擾動的能力,ρei(t0)(1-e-μi(t-t0))反映部件i無法抵御擾動失效后的恢復能力. 因此,式(6)集中反映了韌性內涵的兩個方面. 同時可以看出:部件i的韌性與擾動事件緊密相關(不同類型擾動事件造成部件失效的概率一般不同,即 ρei(t0) 隨事件e變化而取值可能不同),而可用性指標與具體擾動事件無關,即ρei(t0)不影響可用性指標,這一點在圖2 中可直觀反映.
顯然,車載子系統的韌性取決于所有部件的韌性. 因此,可將車載子系統的韌性視為所有部件韌性的函數. 但由于車載子系統結構復雜,很難建立解析的函數表達式. 基于此,本文利用BN 強大的推理能力,建立基于BN 的車載子系統韌性評估模型.
BN 是一種用于表達和推理不確定信息的圖形化概率模型[19],可表示為B= <G,P> = <<V,E>,P>.其中:G= <V,E>為有向無環(huán)圖,V為圖中節(jié)點集合,集合中每一個元素代表一個隨機變量;E為圖中有向邊集合,集合中元素表示變量之間的關系;概率參數P包括先驗概率和條件概率表兩部分. BN 中,兩節(jié)點間如存在一條有向邊,則箭頭連接的節(jié)點稱為子節(jié)點,箭尾連接的節(jié)點稱為父節(jié)點. 網絡中,沒有父節(jié)點的節(jié)點稱為根節(jié)點,沒有子節(jié)點的節(jié)點稱為葉節(jié)點,其余節(jié)點稱為中間節(jié)點. 先驗概率表示根節(jié)點的邊緣分布情況,而條件概率表用于表示有向邊相連節(jié)點的依賴關系和依賴強度.
BN 具有強大推理能力,包括正向推理和反向推理. 其中,正向推理又稱因果推理,可根據根節(jié)點狀態(tài)推理非根節(jié)點狀態(tài);反向推理又稱診斷推理,可根據葉節(jié)點狀態(tài)反向推理非葉節(jié)點狀態(tài).
當前,國內外有近10 種BN 建模軟件,其中GeNIe軟件以其簡單直觀、功能完善而被廣泛使用. 本文使用GeNIe 2.0 作為建模工具,考慮到韌性指標的動態(tài)時變性,使用圖3 所示的動態(tài)BN 構建車載子系統韌性評估模型,圖中:VC-C2、VC-C3 分別為CTCS-2、CTCS-3 級列控系統的安全計算機;VC-C21、VC-C22 分別為VC-C2 的冗余配置部件1、部件2;VC-C31、VC-C32 分別為VC-C3 的冗余配置部件1、部件2.
圖3 基于GeNIe 2.0 的車載子系統韌性評估模型Fig. 3 Resilience evaluation model of on-board subsystem based on GeNIe 2.0
建模過程中,考慮到車載子系統的核心功能是安全防護,因此,對不影響行車安全的部件如司法記錄儀JRU 在建模過程中不予考慮[4-5]. 同時,為簡化模型,將冷備結構當作單系處理,熱備結構按并聯處理[4-5].
韌性評估的根本目的在于提升系統韌性,而要提升系統韌性,必須從提升部件韌性入手. 現實條件下,由于條件限制,不大可能對所有部件都采取改進措施,這就需要按照某種規(guī)則確定優(yōu)先次序,即定義部件重要度指標確定部件重要度排序,選擇排序靠前的部件采取改進措施. 參照可靠性工程領域[20]部件重要度定義思路,提出如下5 個基于韌性的部件重要度指標:
1) BIRNBAUM 重要度(BIRNBAUM importance, BI)
擾動事件e發(fā)生后時刻t部件i的BI 為
式中: ψe(t)= (ψe1(t),ψe2,(t),···,ψei(t),···)為所有部件韌性值向量; ψs,e(ψe(t)) 為部件狀態(tài)為 ψe(t) 時的系統韌性; ψs,e(ψe(t))|ψei(t)=1和 ψs,e(ψe(t))|ψei(t)=0分別為當部件i可用和失效時的系統韌性.
從式(7)可以看出:部件的BI 反映了該部件可用與否對系統韌性的影響程度. 該指標的不足在于部件自身處于可用或失效的概率對重要度沒有影響.
2) 關鍵重要度(criticality importance, CI)
擾動事件e發(fā)生后時刻t部件i的CI 為
從式(8)可以看出:CI 是以BI 為基礎構建的.CI 考慮了部件自身失效的概率對系統韌性的潛在影響,可以彌補BI 的不足.
3) 改進潛力(improvement potential, IP)
擾動事件e發(fā)生后時刻t部件i的改進潛力為
從式(9)可以看出:改進潛力的本質是確保部件處于可用狀態(tài)對系統韌性的改進程度.
4) 風險增加值(risk achievement worth, RAW)
擾動事件e發(fā)生后時刻t部件i的風險增加值為
式(10)中,分母表示擾動事件e發(fā)生后時刻t系統處于不可用狀態(tài)的概率,分子表示擾動事件e發(fā)生后時刻t部件i不可用時系統處于不可用狀態(tài)的概率,其實質為部件i不可用對系統處于不可用狀態(tài)的影響程度.
5) 風險減少值(risk reduction worth, RRW)
擾動事件e發(fā)生后時刻t部件i的風險減少值為
式(11)中,分子表示擾動事件e發(fā)生后時刻t系統處于不可用狀態(tài)的概率,分母表示擾動事件e發(fā)生后時刻t時如果部件i可用系統處于不可用狀態(tài)的概率,其實質為部件i可用對減少系統處于不可用狀態(tài)的貢獻程度.
我國地域遼闊,列車運行可能遭遇不同氣象條件影響. 車載子系統由大量電子器件構成,對雷電、磁暴、冰雪天氣等比較敏感. 以雷電干擾為例,2011 年7 月,雷電引起列控系統故障、軌道電路發(fā)碼異常,導致甬溫線特大鐵路交通事故發(fā)生,據鐵路部門統計,每10 次雷電事故中就有3 次是在雷電破壞鐵路信號設備的情況下發(fā)生的,因此,雷電對鐵路信號設備性能具有重要影響. 再以磁暴干擾為例,1989 年發(fā)生超強磁暴引起俄羅斯高爾基鐵路信號集中閉塞系統功能異常;2003 年磁暴期間,瑞典Vladimir 和Arzamasskaya 鐵路部分信號燈多次顯示錯誤信號.冰雪可能導致安裝在車體表面的電子設備凍結進而發(fā)生故障,例如,2015 年遼沈地區(qū)出現因大量降雪導致安裝在車體表面的信號感應線圈、測速雷達等設備凍結,繼而出現車載設備功能異常. 基于上述分析,選取雷電、磁暴和冰雪作為非常態(tài)擾動事件,開展車載子系統韌性評估.
由于雷電、磁暴、冰雪等非常態(tài)擾動事件發(fā)生頻度低,缺乏足夠的歷史數據,因此,遭受上述事件影響導致車載子系統部件失效的概率很難準確估計.鑒于此,根據行業(yè)專家意見并結合不同事件對不同部件的潛在影響程度,將部件失效概率設置為區(qū)間取值. 將擾動事件對部件的影響程度劃分為3 類,即重大、重要和一般,3 類影響程度下部件的失效概率取值范圍依次為10-2~ 10-1、10-3~ 10-2和10-4~ 10-3.表1 描述了雷電、磁暴、冰雪3 類擾動事件下部件失效概率 ρei(t0) 、部件的失效率 λi和維修率 μi的取值.其中,部件失效概率 ρei(t0) 綜合行業(yè)專家意見后確定,參數 λi、 μi依據文獻[5]確定. 從表1 可以看出:雷電主要影響TCR、RS、BTM ant,磁暴主要影響TCR、GSM-R、RS、BTM、BTM ant,冰雪主要影響TCR、RS、BTM ant.
表1 不同擾動情景下部件參數取值Tab. 1 Component parameter values under different disturbance scenarios
假定擾動發(fā)生在t= 5 000 h,以擾動發(fā)生后2 h為測試期,每15 min 取樣一次. 基于保守思想,選取失效概率區(qū)間最大值作為擾動事件下部件失效概率. 根據前述韌性計算方法,將表1 中參數取值代入式(6),依次計算得到3 種擾動情景下不同時刻部件的韌性指標,將其設置為根節(jié)點先驗概率,再利用BN 正向推理,計算相應擾動情景及時間點非根節(jié)點的韌性指標.
圖4 比較了韌性與可用性指標的差異. 可看出:在擾動發(fā)生后的較短時間內可用性指標幾乎不發(fā)生變化,而韌性指標隨擾動事件變化而變化. 例如,在擾動發(fā)生時刻(t= 5 000 h),車載子系統可用性為0.999 996,擾動發(fā)生后2 h (t= 5 002 h),其值仍保持在0.999 996 (由于數值變化很小,受計算精度限制,看不出數值變化);而伴隨著擾動事件的發(fā)生,韌性指標發(fā)生了明顯的變化. 在t= 5 000 h 時,面臨雷擊、磁暴、冰雪擾動時,系統韌性指標分別為0.881 9、0.801 7 和0.988 0;當t= 5 002 h 時,系統韌性指標相應變化為0.938 9、0.937 3 和0.993 9. 這是因為可用性指標反映的是統計意義上系統的平均性能,不受特定擾動事件影響;而韌性指標與擾動事件類型緊密相關,不同擾動事件下系統韌性指標不同.
圖4 韌性指標與可用性指標的比較Fig. 4 Comparison of resilience index and availability index
圖5 描述了不同擾動情景下部件與車載子系統的韌性. 其中,t= 5 000 h 時的韌性值反映系統抵御擾動的能力,t> 5 000 h 時的韌性值變化反映系統的恢復能力. 可以看出:韌性可全面描述部件與車載子系統抵御擾動和從擾動中恢復的能力;不同擾動情景下車載子系統韌性明顯不同. 其中,磁暴影響最為顯著,其次是雷電,冰雪影響最小. 這是因為磁暴、雷電會對多個部件造成重大、重要影響,而冰雪僅對少量部件造成重大、重要影響,對其余部件僅造成一般性影響. 而車載子系統的韌性是關于部件韌性的單調函數,因此出現圖5 所示的結果.
圖5 擾動情景對韌性的影響Fig. 5 Effects of disturbance scenarios on resilience
利用BN 反向推理,可以計算車載子系統在擾動發(fā)生后某時刻失去韌性(不可用)時各部件在該時刻失去韌性(不可用)的概率. 通過BN 反向推理可以找出造成車載子系統失去韌性的主要原因. 以雷擊擾動為例,從圖6 可以看出:若車載子系統在擾動發(fā)生時(t= 5 000 h)失去韌性,此時部件E20 (BTM ant)、E3/E4 (TCR)、E11/E12 (RSS)失去韌性的概率分別為0.845 49、0.100 75 和0.100 68,說明此時車載子系統不可用的最主要原因是部件E20 (BTM ant)不可用,其次是E3/E4 (TCR)和E11/E12 (RSS)不可用. 此外,需要注意的是,若擾動發(fā)生后2 h 車載子系統仍不可用,此時部件E20 (BTM ant)、E3/E4 (TCR)、E11/E12 (RSS)失去韌性的概率分別變化為0.992 56、0.001 83 和0.001 84,幾乎可以認定是由于部件E20 (BTM ant)不可用造成的. 出現這一結果的原因是E20 (BTM ant)的維修率明顯低于部件E3/E4 (TCR)和E11/E12 (RSS)的維修率.
圖6 BN 反向推理Fig. 6 BN backward reasoning
為識別不同擾動事件下不同部件的重要程度,按照前述重要度指標定義,計算得到的3 種擾動情景下5 個重要度指標排序結果如表2 ~ 4 所示. 可以看出:同一擾動事件下,使用不同指標得到的部件重要度排序結果不完全一致. 例如,雷電干擾下,擾動發(fā)生時(t= 5 000 h)部件E5 的BI、CI、RAW 排序為7,而IP、RRW 排序為5. 這是因為不同重要度指標從不同角度反映部件的重要程度. 在實際應用中,應根據實際需要合理選擇重要度指標.
表2 雷電擾動下部件重要度排序Tab. 2 Component importance rankings under lightning disturbance
表3 磁暴擾動下部件重要度排序Tab. 3 Component importance rankings under magnetic storm disturbance
面臨的擾動類型不同,部件重要度排序也存在差異. 例如,雷電、磁暴擾動發(fā)生時(t= 5 000 h)部件E9 (GSM-R)的IP 排序分別為2 和5. 這一結論有很強的現實指導意義. 我國地域遼闊,不同地域列車面臨的主要擾動事件類型不同,如南方容易遭受雷電干擾,而北方容易遭受冰雪災害. 不同區(qū)域的鐵路運營企業(yè)應根據面臨的主要擾動事件類型,有針對性地確定車載子系統中的重要部件,加強對重要部件的檢修和防護,以提高系統韌性.
除此之外,部件的重要度排序可能隨時間動態(tài)變化,并且此變化不具有單調性. 例如,磁暴干擾下,當t= 5 000 h 時,部件E13 的RAW 排序為2,而當t=5 001 h 和t= 5 002 h 時,E13 的RAW 排序分別變?yōu)? 和7.
表4 冰雪擾動下部件重要度排序Tab. 4 Component importance rankings under snow and ice disturbances
由于表1 中設定的不同擾動情景下部件失效概率不是一個確定值,而是一定范圍的數值區(qū)間. 因此,有必要通過靈敏度分析,驗證部件失效概率的取值變化對系統韌性的潛在影響. 假定部件失效概率在取值范圍內服從均勻分布,依據模特卡羅仿真思想,隨機抽樣2 000 次得到車載子系統韌性的頻率直方圖如圖7 所示. 可以看出:雷電、磁暴、冰雪擾動發(fā)生時(t= 5 000 h),車載子系統的韌性取值范圍分別 為 [0.880 0,0.990 0]、[0.840 0,0.990 0] 和 [0.990 0,1.000 0]. 這一結果反映了不同擾動事件對車載子系統韌性的潛在影響程度.
圖7 不同擾動下車載子系統韌性的頻率直方圖Fig. 7 Frequency histogram of on-board subsystem resilience under different disturbances
引入韌性作為非常態(tài)事件下車載子系統運行穩(wěn)定性測度指標,構建了車載子系統韌性量化評估方法和基于貝葉斯網絡的韌性評估模型,并定義了5 種基于韌性的部件重要度指標. 算例結果表明:
1) 韌性可全面描述車載子系統抵御擾動和從擾動中恢復的能力,并與可用性指標存在明顯差異.由于不考慮特定擾動事件影響,雷電等非常態(tài)事件發(fā)生時可用性指標穩(wěn)定,而韌性與擾動事件緊密相關,且隨擾動事件不同而取值不同.
2) 不同擾動情境下車載子系統韌性明顯不同.其中,磁暴影響最為顯著,其次是雷電,冰雪影響最小.
3) 部件重要度與擾動情景相關,同一部件在不同擾動情景下重要度排序可能不同;同時,部件重要度隨時間動態(tài)變化,擾動發(fā)生后的不同時間點,同一部件同一指標的重要度排序可能不同.