白 磊,李 擎,劉仍奎,趙新勇,王福田
(1.北京交通大學(xué) 交通運(yùn)輸學(xué)院,北京 100044;2.北京全路通信信號(hào)研究設(shè)計(jì)院集團(tuán)有限公司,北京 100073;3.北京易華錄信息技術(shù)股份有限公司,北京 100043)
鐵路鋼軌是鐵路軌道設(shè)備的重要部件,具有承載輪重、橫向上引導(dǎo)車輪、提供光滑的運(yùn)行表面等功能,它的強(qiáng)度和狀態(tài)直接關(guān)系到鐵路運(yùn)輸?shù)陌踩?、平穩(wěn)和暢通。鐵路鋼軌維修規(guī)劃的優(yōu)化編制,對(duì)合理配置維修資源,降低維修成本,有效減少“過維修”“欠維修”等維修活動(dòng),保障行車安全等具有重要意義。
文獻(xiàn)[1]對(duì)鐵路軌道年度維修計(jì)劃、月度維修計(jì)劃、日維修計(jì)劃等有明確規(guī)定。鐵路現(xiàn)場(chǎng)缺少較長(zhǎng)時(shí)間范圍軌道維修規(guī)劃的相關(guān)管理規(guī)章。決策者常以年為基本單位,按照百分比的形式,確定管轄范圍內(nèi)的維修與大修任務(wù)量,缺乏對(duì)維修規(guī)劃的統(tǒng)籌編制。
鐵路軌道設(shè)備維修規(guī)劃、維修計(jì)劃編制建模大多采用組合優(yōu)化方法[2-9]。如Caetano等[2-3]提出了多目標(biāo)的鐵路軌道維修規(guī)劃編制模型,分別選取了以軌道可靠性最大、成本最小相權(quán)衡的目標(biāo)函數(shù)組,以及以軌道不可用度最小、成本最小相權(quán)衡的目標(biāo)函數(shù)組。郭然等[6]提出了一個(gè)面向區(qū)域路網(wǎng)的鐵路軌道維修計(jì)劃編制模型,該模型采用整數(shù)規(guī)劃方法實(shí)現(xiàn)。周宇等[7]提出了一個(gè)以軌道狀態(tài)最優(yōu)為優(yōu)化目標(biāo)的綜合維修計(jì)劃編制模型,該模型采用0-1整數(shù)規(guī)劃方法實(shí)現(xiàn)。李海峰等[8]提出了一個(gè)基于文獻(xiàn)[1]鐵路軌道綜合維修計(jì)劃編制模型。許玉德等[9]采用整數(shù)規(guī)劃方法,提出了一個(gè)以年度TQI平均值最小為目標(biāo)函數(shù)的鐵路軌道綜合維修計(jì)劃編制模型。
以上研究在編制軌道設(shè)備維修規(guī)劃時(shí),忽略了軌道設(shè)備狀態(tài)劣化的不確定性,均假設(shè)提出的軌道設(shè)備狀態(tài)劣化模型能準(zhǔn)確預(yù)測(cè)未來的狀態(tài)。隱形馬爾科夫決策過程方法(Latent Markov Decision Process,LMDP)能以觀測(cè)概率矩陣的形式描述不同檢查方式的檢查誤差,以狀態(tài)轉(zhuǎn)移概率的形式表達(dá)設(shè)備狀態(tài)劣化的不確定性,確定出規(guī)劃周期內(nèi)的檢查策略、維修策略。目前,LMDP的研究多集中在道路路面的維修規(guī)劃編制問題,鐵路軌道設(shè)備維修規(guī)劃編制問題的直接研究較少[10-12]。
依據(jù)鐵路基礎(chǔ)設(shè)施網(wǎng)格化管理思想[13],本文按照一定長(zhǎng)度把線性、連續(xù)的鋼軌設(shè)備,分割為相鄰、長(zhǎng)度相同的小區(qū)段,稱之為鋼軌網(wǎng)格(Railway Rail Grids,RRG)。依據(jù)文獻(xiàn)[1],線路是否需要采取更換鋼軌大修作業(yè)的重要依據(jù)是,每公里的鋼軌重傷根數(shù)是否達(dá)到閾值,故本文鋼軌網(wǎng)格的整體狀態(tài)采用每公里鋼軌重傷根數(shù)進(jìn)行度量。
本文將鋼軌網(wǎng)格作為維修規(guī)劃的基本編制對(duì)象,構(gòu)建一種新的基于LMDP的鋼軌設(shè)備維修規(guī)劃編制模型(LMDP-based Optimal Repair Planning Model for Railway Rail Grids,LMDP-ORPM)。該模型在解決鋼軌設(shè)備維修規(guī)劃編制問題時(shí),采用了LMDP方法,將鋼軌劣化狀態(tài)的不確定性、不同檢查方式的檢測(cè)誤差不同等因素考慮在內(nèi);提出模型將鋼軌狀態(tài)劣化的異質(zhì)性特征考慮在內(nèi),針對(duì)每個(gè)鋼軌網(wǎng)格的狀態(tài)劣化規(guī)律進(jìn)行個(gè)性化地表達(dá),準(zhǔn)確評(píng)估鋼軌網(wǎng)格的使用壽命,故編制出的維修規(guī)劃更符合實(shí)際情況,更具針對(duì)性、指導(dǎo)性。
LMDP-ORPM以鋼軌網(wǎng)格為基本研究對(duì)象,由兩個(gè)子模型構(gòu)成:鐵路鋼軌網(wǎng)格化狀態(tài)劣化規(guī)律子模型,用于預(yù)測(cè)鋼軌網(wǎng)格的未來狀態(tài);鐵路鋼軌網(wǎng)格化維修決策子模型,用于確定鋼軌網(wǎng)格的檢查規(guī)劃、維修規(guī)劃。
本模型將以鋼軌網(wǎng)格為基本研究對(duì)象,采用多階段Markov模型,綜合考慮各類異質(zhì)性因素影響,充分利用鋼軌設(shè)備的歷史相關(guān)數(shù)據(jù),個(gè)性化評(píng)估鋼軌網(wǎng)格的使用壽命,準(zhǔn)確描述其狀態(tài)劣化規(guī)律,為鋼軌維修規(guī)劃的優(yōu)化編制奠定基礎(chǔ)。
根據(jù)文獻(xiàn)[14],鋼軌設(shè)備的傷損病害等級(jí)分為4級(jí),分別為不到輕傷、輕傷、重傷和折斷。隨著上道服役時(shí)間的增長(zhǎng),在不采取維修活動(dòng)的條件下,鋼軌設(shè)備傷損狀態(tài)會(huì)逐步惡化,傷損等級(jí)會(huì)由輕傷發(fā)展為重傷,甚至折斷。鋼軌設(shè)備在不同生命周期階段的劣化速度不同,在生命周期階段初期,其劣化速度較慢,而在生命周期階段末期,其劣化速度逐漸加快[15]。因此本模型將鋼軌設(shè)備質(zhì)量狀態(tài)劃分為若干等級(jí),劣化過程細(xì)分為若干階段。
影響鋼軌設(shè)備狀態(tài)劣化的異質(zhì)性因素都與空間位置緊密相關(guān),不同空間位置處的異質(zhì)性因素一般不同。為充分反映各類異質(zhì)性因素對(duì)鋼軌設(shè)備狀態(tài)劣化規(guī)律的影響,個(gè)性化把握鐵路鋼軌狀態(tài)劣化趨勢(shì),本模型以鋼軌網(wǎng)格為基本研究對(duì)象,采用Markov隨機(jī)過程理論,描述鋼軌網(wǎng)格狀態(tài)等級(jí)在相鄰兩次檢查間變化的不確定性;各個(gè)狀態(tài)劣化階段的鋼軌網(wǎng)格壽命分布規(guī)律,利用不同的壽命分布函數(shù)表達(dá),其相應(yīng)的失效率由網(wǎng)格內(nèi)的異質(zhì)性因素確定。
鋼軌網(wǎng)格在日期tA的狀態(tài)等級(jí)X(tA)=i,則在日期tB的X(tB)=j的Markov轉(zhuǎn)移概率為
prob[X(tB)=j|X(tA)=i]=πij
(1)
式中:tA、tB分別為該鋼軌網(wǎng)格相鄰兩次檢查日期,鋼軌網(wǎng)格檢查周期Z=tB-tA。
本文采用多階段指數(shù)Markov模型[16-17]確定狀態(tài)轉(zhuǎn)移概率πij(i≤j;i=1,2,…,S-1;j=2,3,…,S),S為狀態(tài)等級(jí)的總數(shù),則πij為
πij=prob[X(tB)=j|X(tA)=i]=
(2)
同時(shí)
(3)
(4)
(5)
θi=χβi
(6)
式中:θi為鋼軌網(wǎng)格由狀態(tài)等級(jí)i劣化到i+1的失效率,i=1,2,…,S-1;χ為鋼軌網(wǎng)格的異質(zhì)性因素;βi為χ對(duì)鋼軌網(wǎng)格由狀態(tài)等級(jí)i劣化到i+1的影響程度,i=1,2,…,S-1,可采用鋼軌歷史數(shù)據(jù)計(jì)算得到。
本模型將在準(zhǔn)確把握鋼軌網(wǎng)格狀態(tài)劣化規(guī)律的基礎(chǔ)上,采用隱形馬爾科夫決策過程方法LMDP,構(gòu)建鐵路鋼軌網(wǎng)格化維修決策子模型,以期望總成本最小為優(yōu)化目標(biāo),確定出規(guī)劃周期內(nèi)的最優(yōu)的檢查規(guī)劃、維修規(guī)劃。
依據(jù)以下兩點(diǎn)分析,選擇采用隱形馬爾科夫決策過程方法LMDP:(1)隱形馬爾科夫決策過程LMDP強(qiáng)調(diào),系統(tǒng)在下一個(gè)日期的狀態(tài),只與當(dāng)前日期的狀態(tài)、當(dāng)前日期采取的行動(dòng)有關(guān),與之前日期的狀態(tài)無關(guān),且這種關(guān)系是以概率的形式描述的;(2)隱形馬爾科夫決策過程LMDP中的系統(tǒng)狀態(tài)細(xì)分為兩類:真實(shí)狀態(tài)(或隱藏狀態(tài))、觀測(cè)狀態(tài),且以概率的形式描述真實(shí)狀態(tài)與觀測(cè)狀態(tài)的關(guān)系。
1.2.1 模型的關(guān)鍵要素
基于狀態(tài)的鐵路鋼軌維修策略模型,采用隱形馬爾科夫決策過程LMDP進(jìn)行構(gòu)建,其關(guān)鍵要素為
(7)
(3)ηik(e)為鋼軌網(wǎng)格在日期t采取檢測(cè)活動(dòng)Ct=e時(shí),其真實(shí)狀態(tài)為i且觀測(cè)狀態(tài)為k的概率,見式(8)。若不采取檢查活動(dòng),Ct=0,對(duì)于真實(shí)狀態(tài)為j的鋼軌網(wǎng)格,其觀測(cè)狀態(tài)為任意狀態(tài)的概率是相等的,即鋼軌網(wǎng)格的各個(gè)狀態(tài)都有相同的概率被觀測(cè)到[12],見式(9)。
(8)
(9)
(5)πij(a)表示鋼軌網(wǎng)格在日期t的真實(shí)狀態(tài)為i,采取維修活動(dòng)At=a后,在日期t+1真實(shí)狀態(tài)為j的概率,見式(10)。不同維修活動(dòng)At的相應(yīng)的狀態(tài)轉(zhuǎn)移概率πij(At)不同。
πij(a)=P(Xt+1=j|Xt=i,At=a)
(10)
(11)
πij(a)≥0
(12)
(6)ξ1(Xt,At)為鋼軌網(wǎng)格在日期t采取維修活動(dòng)At的成本;ξ2(Ct+1)為在日期t+1采取檢查活動(dòng)Ct+1的成本;Rt為ξ1(Xt,At)與ξ2(Ct+1)之和,即
Rt=g(Xt,At,Ct+1)=ξ1(Xt,At)+
ξ2(Ct+1)t=1,2,…,T-1
(13)
式中:T為規(guī)劃周期結(jié)束日期。
RT為鋼軌網(wǎng)格在日期T采取維修活動(dòng)AT的成本ξ1(XT,AT),即
RT=ξ1(XT,AT)
(14)
其中,維修成本ξ1(Xt,At)由鋼軌網(wǎng)格狀態(tài)Xt、采取的維修活動(dòng)At的決定。若在日期t不采取維修活動(dòng),At=0,ξ1(Xt,0)表示由鋼軌網(wǎng)格狀態(tài)Xt持續(xù)劣化導(dǎo)致的損耗。檢查成本ξ2(Ct)由采取的檢查活動(dòng)Ct決定,當(dāng)在日期t不采取檢查活動(dòng),Ct=0,相應(yīng)的檢查成本ξ2(0)=0。
(7)δ為隨時(shí)間變化的折扣率,表示采取相同檢查與維修活動(dòng)時(shí)日期t的成本Rt與日期t-1的成本Rt-1的比值,δ=Rt/Rt-1。δ越小,表明當(dāng)前成本與未來相比價(jià)值越高。
1.2.2 模型的決策變量
模型LMDP-ORPM在整個(gè)規(guī)劃周期內(nèi)的決策變量包括兩部分:(1)維修決策:決定在日期t采取維修活動(dòng)At(1≤t≤T)的類型;(2)檢查決策:決定在日期t+1是否采取檢查活動(dòng)Ct+1(2≤t≤T)。
假設(shè)鋼軌網(wǎng)格初始狀態(tài)X1已知,鋼軌網(wǎng)格在一個(gè)規(guī)劃周期內(nèi)的維修決策過程示意圖見圖1。在日期t,決策者根據(jù)鋼軌網(wǎng)格的Xt,決定采取的At與Ct+1;在日期t+1,根據(jù)狀態(tài)轉(zhuǎn)移概率πij(At),鋼軌網(wǎng)格的狀態(tài)由Xt轉(zhuǎn)移到Xt+1,決策者根據(jù)鋼軌網(wǎng)格的Xt+1,決定采取的At+1與Ct+2;然后以此類推一直循環(huán)到日期T,決策者根據(jù)鋼軌網(wǎng)格的XT,決定采取的AT,整個(gè)維修決策過程結(jié)束。在上述整個(gè)維修決策過程中,每個(gè)日期t都會(huì)產(chǎn)生相應(yīng)的檢查、維修成本Rt(1≤t≤T)。
圖1 鋼軌網(wǎng)格在給定規(guī)劃周期內(nèi)的檢查與維修決策過程示意圖
1.2.3 模型的目標(biāo)函數(shù)
模型LMDP-ORPM的目標(biāo)函數(shù)是整個(gè)規(guī)劃周期內(nèi)的期望總成本函數(shù)最小,期望總成本函數(shù)由以下兩部分構(gòu)成:(1)檢查、維修活動(dòng)的成本Rt;(2)規(guī)劃周期結(jié)束時(shí)的鋼軌網(wǎng)格剩余價(jià)值GT+1,見圖 1。其中,Rt=g(Xt,At,Ct+1),由鋼軌網(wǎng)格狀態(tài)Xt、維修活動(dòng)At、檢查活動(dòng)Ct+1的決定。GT+1=u(XT+1),表示規(guī)劃周期結(jié)束時(shí)的該鋼軌網(wǎng)格里程范圍內(nèi)全部鋼軌的使用價(jià)值,由該鋼軌網(wǎng)格里程范圍內(nèi)全部鋼軌的狀態(tài)決定。規(guī)劃期結(jié)束時(shí)的鋼軌網(wǎng)格狀態(tài)越好,相應(yīng)的剩余價(jià)值越大。
vt(It)為從日期t開始至規(guī)劃周期結(jié)束時(shí)的最小期望總成本。It(1≤t≤T+1)為鋼軌網(wǎng)格從初始時(shí)刻到日期t的跨度內(nèi),由維修活動(dòng)、檢查活動(dòng)、觀測(cè)狀態(tài)等元素構(gòu)成的集合,可通過式(15)~式(17)遞歸得到,如IT+1的具體集合形式,見式(18)。
(15)
I1={X1}
(16)
IT+1={IT,AT}
(17)
(18)
整個(gè)規(guī)劃周期內(nèi)的最小期望總成本vt(It)可通過式(19)、式(20)遞歸得到。當(dāng)1≤t≤T-1時(shí),vt(It)由檢查、維修活動(dòng)的成本Rt,及日期t+1的vt+1(It+1)決定,見式(19);當(dāng)t=T時(shí),vT(IT)由檢查、維修活動(dòng)的成本RT,及規(guī)劃周期結(jié)束時(shí)的鋼軌網(wǎng)格剩余價(jià)值GT+1決定,見式(20)。式中EY|W[·]表示在給定W條件下,所有可能Y相應(yīng)[·]的平均值。
(19)
(20)
為驗(yàn)證模型LMDP-ORPM的有效性,作者采集了47 304條隴海鐵路6年(2010年1月到2016年1月)中K1397+000~K1720+000上下行區(qū)段內(nèi)的鋼軌傷損數(shù)據(jù)。為便于模型LMDP-ORPM的分析結(jié)果與鐵路現(xiàn)場(chǎng)實(shí)際情況進(jìn)行對(duì)比,本實(shí)例中鋼軌網(wǎng)格的長(zhǎng)度設(shè)置為1 km,故上述里程范圍內(nèi)的鋼軌網(wǎng)格數(shù)量為648個(gè)。本實(shí)例將研究這些鋼軌網(wǎng)格個(gè)性化的狀態(tài)劣化趨勢(shì),最優(yōu)化以10年為規(guī)劃周期的鋼軌網(wǎng)格檢查與維修策略。規(guī)劃周期的基本單位為年,時(shí)間范圍為10年,即T=10年。成本隨時(shí)間推移的折扣率δ取0.9。
表1 隴海線鋼軌網(wǎng)格狀態(tài)等級(jí)劃分標(biāo)準(zhǔn)及其大修策略
另外,鋼軌網(wǎng)格在本實(shí)例中的檢查方式有兩類:(1)鋼軌探傷檢查,C=1,相應(yīng)的鋼軌網(wǎng)格狀態(tài)觀測(cè)概率ηik(1),見式(21);(2)不采取檢查活動(dòng),C=0。依據(jù)式(9),相應(yīng)的鋼軌網(wǎng)格狀態(tài)觀測(cè)概率ηik(0),見式(22)。蘭州局一般按照1次/月的頻率,定期地組織安排隴海線的鋼軌探傷檢查活動(dòng)。在本實(shí)例中,若第t年的檢測(cè)活動(dòng)的檢測(cè)方式Ct=1,表明第t年內(nèi)的各月都采取鋼軌探傷檢查活動(dòng)。
(21)
(22)
鋼軌網(wǎng)格在本實(shí)例中的維修活動(dòng)類型有兩類:(1)整體更換鋼軌大修,A=1,對(duì)應(yīng)鋼軌網(wǎng)格的狀態(tài)轉(zhuǎn)移概率為πij(1);(2)不采取維修活動(dòng),A=0,對(duì)應(yīng)鋼軌網(wǎng)格的狀態(tài)轉(zhuǎn)移概率πij(0)。不同類型鋼軌維修活動(dòng)的費(fèi)用,可在隴海鐵路的現(xiàn)場(chǎng)調(diào)研中獲取。
2.2.1 狀態(tài)劣化規(guī)律子模型結(jié)果分析
表2 影響隴海線鋼軌網(wǎng)格狀態(tài)劣化的異質(zhì)性因素標(biāo)定系數(shù)
注:(·)中的值表示待估參數(shù)的標(biāo)準(zhǔn)差。
(23)
(24)
依據(jù)得到的待估參數(shù)β,根據(jù)式(23)、式(24),可評(píng)估出本實(shí)例中隴海線各鋼軌網(wǎng)格的使用壽命。
圖2展示了鋼軌網(wǎng)格使用壽命隨里程的變化趨勢(shì)。圖中的鋼軌網(wǎng)格位于隴海線上下行1 560 ~1 610 km里程范圍內(nèi),是全部研究對(duì)象的一部分。由圖 2可知:(1)處于不同空間位置的鋼軌網(wǎng)格使用壽命不同、狀態(tài)劣化規(guī)律不同;(2)上行與下行鋼軌網(wǎng)格的使用壽命隨里程的變化趨勢(shì)基本一致。
圖2 隴海線上下行1 560~1 610 km里程范圍內(nèi)網(wǎng)格使用壽命對(duì)比圖
本實(shí)例采用鋼軌上道服役日期、更換報(bào)廢日期數(shù)據(jù),統(tǒng)計(jì)計(jì)算鋼軌的真實(shí)使用壽命。(1)鋼軌網(wǎng)格整體角度對(duì)比,計(jì)算出的全部研究對(duì)象的平均真實(shí)使用壽命是7.57年,模型LMDP-ORPM評(píng)估的出的全部研究對(duì)象的平均使用壽命是7.61年。(2)鋼軌網(wǎng)格個(gè)體角度對(duì)比,全部研究對(duì)象(648個(gè)鋼軌網(wǎng)格單元)中僅有94個(gè)鋼軌網(wǎng)格評(píng)估使用壽命與真實(shí)使用壽命差別在3年以上,占總體的14.5%。因此,上述計(jì)算結(jié)果表明,評(píng)估出的鋼軌網(wǎng)格壽命整體上非常接近真實(shí)值,可滿足鐵路現(xiàn)場(chǎng)鋼軌管理需求。
2.2.2 維修決策子模型結(jié)果分析
表3 RG-A的狀態(tài)轉(zhuǎn)移概率(不采取維修活動(dòng))
假設(shè)鋼軌網(wǎng)格RG-A在初始日期(t=1)前,剛采取了整體更換鋼軌大修作業(yè),則在日期t=1時(shí)該鋼軌網(wǎng)格狀態(tài)等級(jí)為1,不需要采取鋼軌探傷檢查活動(dòng)。經(jīng)計(jì)算,10年規(guī)劃周期內(nèi)的期望總成本最小值v1(I1)為232.64萬元,相應(yīng)的檢查策略、維修策略如下。
(1)求解出的最優(yōu)檢查策略見式(25)和圖3(a)。鋼軌網(wǎng)格RG-A在{3,4,…,8}采取鋼軌探傷檢查活動(dòng),在 {1,2}∪{9,10}不采取檢查活動(dòng)。
(25)
(2)求解出的最優(yōu)維修策略見式(26)和圖3(b)。鋼軌網(wǎng)格RG-A在第8年采取整體更換鋼軌大修活動(dòng),在{1,2,…,7}∪{9,10}不采取大修活動(dòng)。
(26)
為驗(yàn)證模型LMDP-ORPM的有效性,本實(shí)例將對(duì)比分析模型LMDP-ORPM與中國(guó)鐵路既有管理方法的計(jì)算結(jié)果。根據(jù)文獻(xiàn)[1]及蘭州鐵路局的實(shí)施細(xì)則,位于隴海線上行K1595+000~K1596+000里程范圍處的鋼軌網(wǎng)格RG-A,基本上是按照1次/月的檢查頻次,定期組織實(shí)施鋼軌探傷的檢查活動(dòng)。相應(yīng)的檢查策略見式(27)和圖 3(c)。
(27)
中國(guó)鐵路既有管理辦法判定是否成段更換鋼軌大修作業(yè)的重要依據(jù)是,鋼軌上道后至需要更換前的累計(jì)通過總重是否達(dá)到閾值。鋼軌網(wǎng)格RG-A的累計(jì)通過總重閾值為700 Mt,年平均通過總重為96.588 Mt,故其成段更換鋼軌大修周期為7.2年。相應(yīng)的維修策略詳見式(28)和圖 3(d)。
(28)
通過對(duì)比式(25)與式(27)、式(26)與式(28)及分析圖 3可知,(1)模型LMDP-ORPM確定出的鋼軌網(wǎng)格RG-A的鋼軌探傷檢查活動(dòng)次數(shù)為6次,少于中國(guó)鐵路既有的管理方法規(guī)定的檢查次數(shù)(10次)。(2)兩種方法編制出的整體更換鋼軌大修作業(yè)的次數(shù)是相同的,但模型LMDP-ORPM確定出的大修活動(dòng)的實(shí)施時(shí)間,相較于中國(guó)鐵路既有的管理方法推遲了1年。(3)模型LMDP-ORPM確定出的鋼軌網(wǎng)格RG-A整體更換鋼軌大修活動(dòng)規(guī)劃與中國(guó)鐵路既有的管理方法的區(qū)別是,前者是基于鋼軌網(wǎng)格個(gè)性化的狀態(tài)劣化規(guī)律和10年規(guī)劃周期內(nèi)的總成本最小確定的,而后者則僅考慮了累計(jì)通過總重閾值。(4)若采用基于閾值的鐵路既有的管理方法,具有相同年平均通過總重的隴海線鋼軌網(wǎng)格的維修規(guī)劃是相同的,但模型LMDP-ORPM考慮了鋼軌狀態(tài)劣化的異質(zhì)性、不確定性,故編制出的維修規(guī)劃是有差異的,更符合實(shí)際情況,更具針對(duì)性、指導(dǎo)性。
綜上分析,模型LMDP-ORPM在準(zhǔn)確把握鋼軌網(wǎng)格狀態(tài)個(gè)性化的劣化規(guī)律的基礎(chǔ)上,基于鋼軌狀態(tài)、成本,編制出鋼軌網(wǎng)格在一個(gè)較長(zhǎng)規(guī)劃周期內(nèi)的維修規(guī)劃,相較于基于閾值的中國(guó)鐵路既有管理方法,實(shí)現(xiàn)了維修資源的統(tǒng)籌配置、維修成本的節(jié)省。
圖3 不同方法編制出的鋼軌網(wǎng)格RG-A維修規(guī)劃圖
本文研究構(gòu)建了一種基于LMDP的鐵路鋼軌網(wǎng)格化維修規(guī)劃編制模型LMDP-ORPM。該模型依據(jù)鐵路基礎(chǔ)設(shè)施網(wǎng)格化管理思想,以鋼軌網(wǎng)格為研究對(duì)象,采用多階段Markov模型,個(gè)性化描述了鋼軌網(wǎng)格狀態(tài)變化規(guī)律;在此基礎(chǔ)上,采用隱形馬爾科夫決策過程方法LMDP,建立了基于狀態(tài)的維修策略模型,確定出一個(gè)較長(zhǎng)規(guī)劃周期內(nèi)的最優(yōu)檢查策略、維修策略。隴海線的實(shí)際案例表明,模型LMDP-ORPM編制出的10年鐵路鋼軌維修規(guī)劃,優(yōu)于既有的管理方法,優(yōu)化配置了維修資源。如何將編制出的維修規(guī)劃進(jìn)一步細(xì)化到維修工序?qū)用?,?gòu)建鐵路鋼軌維修進(jìn)度計(jì)劃編制模型,是作者下一步的研究方向。