莫志剛,駱漢賓
(華中科技大學土木工程與力學學院,湖北武漢 430074)
基于通信的列車控制(CBTC)[1]信號系統(tǒng)中的安全型設(shè)備(“3 取 2”車載控制器 VOBC,“2 乘 2 取 2”區(qū)域控制器 ZC 和聯(lián)鎖)和非安全型設(shè)備(數(shù)據(jù)通信子系統(tǒng) DCS 和列車自動監(jiān)控系統(tǒng) ATS)的設(shè)計為冗余結(jié)構(gòu),以達到相對高可用性,盡可能減少系統(tǒng)中的單點故障,具體應(yīng)用配置也是整個系統(tǒng) RAMS[2-4]的決定因素,特別是列車的數(shù)量和軌旁設(shè)備的數(shù)量。
信號系統(tǒng)中各要素的可靠性通過各種組合決定系統(tǒng)硬件的可靠性。信號系統(tǒng)的架構(gòu)及詳細設(shè)計須通過評估各要素對系統(tǒng)可靠性的影響程度來決定。根據(jù)對 RAMS的不同影響區(qū)分不同的元器件基于 2 個原則:①根據(jù)可靠性和可維護性指標設(shè)計基本的元器件或子系統(tǒng);②高安全性、高可靠性的硬件組織架構(gòu)將作為提高系統(tǒng)RAMS 性能的重要設(shè)計參數(shù)。子系統(tǒng)的組件或元器件故障率的預測將遵循“元器件應(yīng)力分析可靠性預計”的方法來進行,依據(jù)零件質(zhì)量與操作環(huán)境等多項因素,利用 GJB/Z299C-2006《電子設(shè)備可靠性預計手冊》建立可靠度分析模型,并依據(jù)所提供的公式做較精確的可靠度預計工作,計算元器件失效率和平均工作壽命。
所有框圖和計算方法將包括計算系統(tǒng)組件的平均故障間隔時間MTBF和平均恢復時間MTTR。CBTC 信號系統(tǒng)的整體可靠性和可用性由建立的數(shù)學模型(可靠性框圖、馬爾可夫過程[5-7])進行估算。通常情況下,系統(tǒng)可靠性采用可靠性框圖的形式建模進行計算。但是,存在以下情況時,采用馬爾可夫模型可靠性建模將會更精確:①系統(tǒng)與模塊的狀態(tài)不僅存在正常工作狀態(tài)和故障狀態(tài),還存在處于兩者之間的降級狀態(tài);②系統(tǒng)與模塊的故障是相關(guān)聯(lián)的,1 個模塊的故障可能增加其他模塊的故障率。
馬爾可夫模型由俄國數(shù)學家馬爾可夫提出,他定義了馬爾可夫過程。馬爾可夫過程中,下一個狀態(tài)僅取決于現(xiàn)在狀態(tài)而與以往的狀態(tài)無關(guān),即無記憶性。一般采用狀態(tài)轉(zhuǎn)移圖的方法構(gòu)建馬爾可夫模型。如圖 1 為 2 階轉(zhuǎn)移圖,圓表示模塊處于正常狀態(tài)與失效狀態(tài),箭頭弧線表示正常到失效或失效到維修的可能性行為。λ為模塊的故障率,μ為模塊的修復率。
圖 1 馬爾可夫鏈模型
馬爾可夫模型各狀態(tài)的概率通常利用轉(zhuǎn)移概率矩陣計算。N階矩陣(N代表狀態(tài)數(shù))表示各個狀態(tài)之間變化的概率,式(1)為 3 階隨機轉(zhuǎn)移概率矩陣T。
轉(zhuǎn)移概率矩陣第 1 行代表狀態(tài) 0 向各狀態(tài)轉(zhuǎn)移的概率,依此類推得到系統(tǒng)的轉(zhuǎn)移概率矩陣。狀態(tài)矩陣Sn可以通過上一狀態(tài)矩陣Sn-1與轉(zhuǎn)移矩陣T得到。
模擬所有運行與故障狀態(tài)。圖 2 使用馬爾可夫鏈詳細分析了這些狀態(tài)。狀態(tài) 0 表示相同的獨立單元工作正常。狀態(tài) 1 表示有 1 個單元需要維修,另一個單元工作正常。狀態(tài) 2 表示 2 個單元均故障沒有維修。
圖 2 并行冗余系統(tǒng)馬爾可夫過程
3 取 2 多數(shù)投票系統(tǒng),需要模擬系統(tǒng)的所有運行狀態(tài),如圖 3 所示。狀態(tài) 0 表示 3 個相同的獨立單元處于正常工作狀態(tài)。狀態(tài) 1 表示有 1 個單元在維修,而其他的2 個單元處于正常工作狀態(tài)。狀態(tài) 2 表示至少由于 2 個單元故障沒有修好引起的系統(tǒng)故障狀態(tài)。
圖 3 3 取 2 冗余系統(tǒng)馬爾可夫過程
系統(tǒng)、子系統(tǒng)級的可靠性、可用性和可維修性(RAM)計算通過可靠性框圖完成。本節(jié)使用馬爾可夫鏈對可修復系統(tǒng)進行 RAM 分析,更加符合實際。但為防止狀態(tài)過于繁多,馬爾可夫鏈僅在分析冗余設(shè)備時使用。本節(jié)涉及 2 種可修復性的冗余系統(tǒng):一是并行冗余系統(tǒng),二是 3 取 2 冗余系統(tǒng)(圖 4)。
列車自動防護/列車自動運行(ATP/ATO)車載子系統(tǒng)模塊功能正常時,模塊處于熱備冗余狀態(tài),記為S0;當車頭或車尾設(shè)備出現(xiàn)不可檢測故障,此時車載功能依然正常,但是維護人員無法得知一端車載控制器(CC)已經(jīng)故障,此時設(shè)備狀態(tài)記為S1;當車頭或車尾設(shè)備出現(xiàn)可檢測故障,此時車載功能依然正常,維護人員通過人機界面(DMI)可得知一端車載控制器已經(jīng)故障,此時設(shè)備狀態(tài)記為S2;當車頭和車尾設(shè)備同時出現(xiàn)故障時,車載功能無法正常實現(xiàn),需要立即進行維護,此時設(shè)備狀態(tài)記為S3。
當車載設(shè)備處于S0、S1、S2時,系統(tǒng)是可用的,此時系統(tǒng)的可用度為:
當車載設(shè)備處于S3時,車載設(shè)備為不可用狀態(tài),此時系統(tǒng)的可用度為:
根據(jù)可用度與MTBF、MTTR的含義及關(guān)系(圖 5),
圖 4 3 取 2 冗余系統(tǒng)框圖
圖 5 MTBF 與 MTTR 的含義及關(guān)系
可以推導得到:
式(4)中,μ為MTTR-1。
根據(jù)馬爾可夫模型的理論,馬爾可夫模型狀態(tài)轉(zhuǎn)移關(guān)系見表 1。
表 1 馬爾可夫模型狀態(tài)轉(zhuǎn)移關(guān)系
P為 4 階狀態(tài)轉(zhuǎn)移矩陣
式(5)左邊的矩陣為S在T時刻的狀態(tài),右邊的矩陣為S在T+1 時刻的狀態(tài)。
圖 6 中狀態(tài)之間的弧線分別為連續(xù)時間間隔設(shè)備從起始狀態(tài)到另一狀態(tài)的概率和恢復率,如 2λCPS(1-αCPS)+ 2λCMP(1-αCMP)+ 2λCBS(1-αCBS)+2λCMB(1-αCMB)+2λBeaconAntenna(1-αBeaconAntenna) + 2λWheelSensor(1-αWheelSensor)表示設(shè)備從S0至S1的概率,且為未檢測到的故障,但整體功能依然正常,μUFTMPC是通過日常巡檢發(fā)現(xiàn)設(shè)備故障的概率,這是一個中間狀態(tài),中間狀態(tài)又可以分為可檢測故障和不可檢測故障,可檢測故障恢復到功能完備狀態(tài)概率高,不可檢測故障較低。依此類推,得到相鄰時刻各狀態(tài)之間的馬爾可夫轉(zhuǎn)移模型(圖 6)。圖 6 中 MPC 為車載計算模塊。
式(6)為 ATP/ATO車載計算模塊馬爾可夫轉(zhuǎn)移矩陣,其中:λMPC1=λCPS+λCMP+λCBS+λCMB+λBeaconAntenna+λWheelSensor,δMPC= 1-2λMPC1(1-α)-2αλMPC1-λMPC(Ccf)。
圖 6 車載 ATP/ATO 計算模塊馬爾可夫鏈
根據(jù)式(1)、(2)、(3)、(6)計算得到計算模塊的MTBF。
ATP/ATO 車載子系統(tǒng) I /O 模塊功能正常時,處于3取 2 冗余狀態(tài),記為S0;當采集 I /O 模塊出現(xiàn)不可檢測故障(降級到 2 取 2),此時輸入輸出功能依然正常,但是維護人員無法得知1個通道已經(jīng)故障,此時設(shè)備狀態(tài)記為S1;當車頭或車尾設(shè)備出現(xiàn)可檢測故障,此時 I /O功能依然正常,但是維護人員通過維護設(shè)備可以得知 1個通道已經(jīng)故障,此時設(shè)備狀態(tài)記為S2;當 2 個通道及以上同時出現(xiàn)故障時,I/O 通道功能無法正常實現(xiàn),需要立即進行維護,此時設(shè)備狀態(tài)記為S3。因此,當車載I/O 設(shè)備處于S0、S1、S2時,系統(tǒng)是可用的,得到 I/O 模塊各狀態(tài)之間的馬爾可夫轉(zhuǎn)移模型(圖 7)。圖 7 中 VIO 為車載輸入輸出模塊。
根據(jù)上述馬爾可夫模型可以得到轉(zhuǎn)移矩陣(7),其中:
根據(jù)式(1)、(2)、(3)、(7)計算得到輸入輸出模塊的MTBF。
通信模塊(Backbone/Gateway):首尾兩頭的通信模塊是熱備冗余的,同理,它的馬爾可夫狀態(tài)模型見圖 8。
圖 7 ATP/ATO 車載輸入輸出模塊的馬爾可夫鏈
圖 8 ATP/ATO 車載通信模塊的馬爾可夫鏈
根據(jù)相關(guān)模塊板卡的歷史故障數(shù)據(jù)和維修數(shù)據(jù),通過馬爾可夫模型計算得到車載 ATP/ATO 計算模塊:
λMPC(Ccf)=1×10-9(共模故障引起雙套同時失效的概率,經(jīng)驗值);
α=99%(故障可檢查概率,經(jīng)驗值);
λCoreMPC=5.87×10-8,MTTRCoreMPC= 0.44 h。
車載子系統(tǒng)數(shù)據(jù)采集輸入輸出模塊:
λVIOM(Ccf)=1×10-9(共模故障引起雙套同時失效的概率,經(jīng)驗值);
α= 99% (故障可檢查概率,經(jīng)驗值);
同理,車載通信模塊的故障率計算結(jié)果及平均修復時間為:
由于分析的特殊復雜性,通過圖 9 可靠性框圖進行 ATP/ATO 車載子系統(tǒng)可靠性分析。假設(shè)司機可用按鈕打開、關(guān)閉車門并用按鈕啟動列車,人機界面(DMI)故障不會影響服務(wù)。與骨干網(wǎng)的連接已經(jīng)在 DCS 子系統(tǒng)可用性計算中考慮,未出現(xiàn)在可靠性框圖中。DCS 天線已用于 DCS 子系統(tǒng)可用性分析中,未出現(xiàn)在可靠性框圖中。
根據(jù)可靠性框圖原理圖 9,可以計算得到 ATP/ATO車載子系統(tǒng)可靠性,見表 2。
表 2 ATP/ATO 車載子系統(tǒng)可靠性
在特定的任務(wù)時間與空間內(nèi)完成特定功能的能力定義為產(chǎn)品的任務(wù)可靠性。以是否影響任務(wù)完成作為任務(wù)可靠性的故障判別準則,基本可靠性所涉及到的故障范圍大于并包含任務(wù)可靠性所涉及的故障。為便于建模與數(shù)學計算,模型中任務(wù)可靠性和基本可靠性產(chǎn)品元器件的名稱和標識設(shè)計一致。當產(chǎn)品不考慮冗余與替代模式的工況下,不再區(qū)別基本可靠性模型和任務(wù)可靠性的模型結(jié)構(gòu),且都為串聯(lián)結(jié)構(gòu)。任務(wù)可靠性預計不足的情況下,通過產(chǎn)品或系統(tǒng)的冗余設(shè)計、改善應(yīng)力條件、選擇更優(yōu)元器件,增強系統(tǒng)的容差性能等措施彌補。若基本可靠性預計不能滿足運營要求,則通過簡化設(shè)計或采用高質(zhì)量等級的元器件,增強系統(tǒng)的容差性能等措施彌補,靠增加冗余元器件單元的方式可能降低其基本可靠性。
圖 9 ATP/ATO 車載子系統(tǒng)可靠性框圖
[1]徐杰. 城市軌道交通CBTC系統(tǒng)列車自動駕駛關(guān)鍵技術(shù)的研究與實現(xiàn)[D]. 北京:中國鐵道科學研究院,2012.
[2]燕飛,郜春海,唐濤. 軌道交通安全相關(guān)系統(tǒng)評估方法[J]. 中南大學學報:自然科學版,2003,34(增1):230-233.
[3]陳紅霞,孫強. 國內(nèi)外軌道交通RAMS標準規(guī)范的現(xiàn)狀與比較研究[J]. 科技創(chuàng)新與應(yīng)用,2016(11):26-27.
[4]李國正. 基于RAMS的地鐵列車車載設(shè)備維修策略與故障診斷研究[D]. 北京:北京交通大學,2013.
[5]鄧肯,王梓坤. 馬爾科夫過程論基礎(chǔ)[M]. 黑龍江哈爾濱:哈爾濱工業(yè)大學出版社,2015.
[6]David A. Levin, Yuval Peres, Ellzabeth L. Wilmer.Markov Chains and Mixing Times[M]. Providence,Rhode Island:American Mathematical Society,2017.
[7]Sean P. Meyn, Richard L. Tweedie. Markov Chains and Stochastic Stability[M]. London∶ Springer,1993.