李茂圣,王大彬
(1.云南南天電子信息產(chǎn)業(yè)股份有限公司,昆明 650000; 2.昆明地鐵運(yùn)營有限公司,昆明 650000)
隨著人民生活水平提高和科技不斷發(fā)展,方便、環(huán)保的城市地鐵逐漸向網(wǎng)絡(luò)化運(yùn)營階段發(fā)展。地鐵軌道是列車安全運(yùn)行的基礎(chǔ),需要在日常工作中保證連續(xù)平滑的軌道幾何形狀,否則會(huì)導(dǎo)致列車振蕩,不僅降低了乘客的舒適度,嚴(yán)重時(shí)甚至出現(xiàn)列車側(cè)翻等危險(xiǎn)[1-2]。所以,實(shí)時(shí)了解地鐵軌道狀態(tài),掌握軌道狀態(tài)變化規(guī)律,這對于提高乘客的舒適度、保障地鐵列車的安全運(yùn)行具有重要意義。
考慮到地鐵的軌道狀態(tài)具有不確定性和異質(zhì)性,常規(guī)的檢測技術(shù)和量化標(biāo)準(zhǔn)很難對其進(jìn)行精準(zhǔn)描述,這就引出了許多急需解決的難題:如何實(shí)時(shí)精準(zhǔn)掌握地鐵軌道的運(yùn)行狀態(tài),并且形成科學(xué)合理的維修決策方案,進(jìn)一步實(shí)現(xiàn)軌道狀態(tài)的安全預(yù)警等[3]。目前,類似于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能技術(shù)飛速發(fā)展,強(qiáng)化學(xué)習(xí)、集成學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)預(yù)測等技術(shù)也得到了越來越多的關(guān)注,這就為地鐵軌道狀態(tài)智能感知、全方面深入分析和軌道狀態(tài)發(fā)展規(guī)律提供了科學(xué)合理的方法和途徑[4-6]。
目前國內(nèi)外研究團(tuán)隊(duì)在構(gòu)建維修決策優(yōu)化模型時(shí)通常只針對軌道占用時(shí)間和質(zhì)量監(jiān)測,然而對于軌道異常狀態(tài)的維修決策主要以維修成本為主,所以在考慮軌道異常狀態(tài)時(shí)需將維修成本作為目標(biāo)函數(shù)。越來越多的人工智能技術(shù)和大數(shù)據(jù)分析技術(shù)被應(yīng)用到軌道的基礎(chǔ)設(shè)施建設(shè)和日常運(yùn)行維護(hù)中。然而,國內(nèi)外研究團(tuán)隊(duì)在制定或優(yōu)化地鐵軌道的異常狀態(tài)時(shí)存在較大的方法局限性,通常只是局限于固定的模型參數(shù),比如,常規(guī)MDP方法的規(guī)劃周期內(nèi)采用固定不變的狀態(tài)轉(zhuǎn)移概率。該方法無法實(shí)現(xiàn)自適應(yīng)學(xué)習(xí),在軌道運(yùn)維狀態(tài)的智能感知和常規(guī)預(yù)測中很難捕捉軌道劣化機(jī)理,最終很難實(shí)現(xiàn)科學(xué)、規(guī)范和完善的維修決策和規(guī)劃。所以,通過深度挖掘、分析軌道運(yùn)行和維護(hù)的海量數(shù)據(jù),利用機(jī)器學(xué)習(xí)形成個(gè)性化和具有較強(qiáng)針對性的模型來更準(zhǔn)確地預(yù)測軌道狀態(tài),才能使得維修策略更具有針對性和科學(xué)性。
為提高地鐵軌道智能化管理水平,設(shè)計(jì)了樸素貝葉斯分類器、Logistic回歸分類器和支持向量機(jī)分類器,并構(gòu)建了基于Stacking集成的軌道狀態(tài)預(yù)測模型。進(jìn)一步,基于Stacking-SVM集成模型,引入自適應(yīng)學(xué)習(xí)的馬爾可夫決策過程(AL-MDP)構(gòu)建了軌道維修決策優(yōu)化模型。
分別構(gòu)建基于樸素貝葉斯、Logistic回歸以及支持向量機(jī)的單體學(xué)習(xí)器,并對其進(jìn)行兩兩組合構(gòu)建集成預(yù)測模型[7-8]。
1.1.1 樸素貝葉斯分類器(NBC)
定義A和B為隨機(jī)概率事件,A=A1∪A2∪…∪An,且Ai∩Aj=φ(i≠j),則Ai引發(fā)B的概率:
定義類標(biāo)記y,其類先驗(yàn)概率為P(y),某樣本Xi的類條件概率為P(Xi∣y),對軌道全線劃分若干單元區(qū)間Ni,若已知其特征屬性值Xi=(xi1,xi2,…,xi18),則預(yù)測下一時(shí)刻的軌道狀態(tài)等級y(y∈Y)的概率為:
1.1.2 Logistic回歸分類器(LRC)
考慮到軌道狀態(tài)預(yù)測為多分類問題,將其劃分為多個(gè)二分類問題的求解,訓(xùn)練多個(gè)二分類器并通過測試輸出最終預(yù)測結(jié)果,如圖1所示。共劃分4個(gè)軌道狀態(tài)類別C1,C2,C3,C4,定義任意類別Ci的數(shù)據(jù)樣本為正,其他三類為負(fù)且用來訓(xùn)練分類器,若測試中存在唯一預(yù)測為正的分類器,且其余3個(gè)分類器預(yù)測為負(fù),則最終預(yù)測結(jié)果為正。
圖1 “一對其余”拆分示意圖(OvR)
若已知單元區(qū)間Ni的特征屬性值Xi=(xi1,xi2,…,xi18),由于Logistic回歸函數(shù)只會(huì)輸出0或1,因此將所有二分類器均構(gòu)建為Logistic回歸分類器,則輸出Ni的正概率P(y=1∣Xi)和負(fù)概率P(y=0∣Xi)分別為:
P(y=0∣Xi)=1-P(y=1∣Xi)=
定義正概率和負(fù)概率比值為odds,則正負(fù)概率比odds表達(dá)式為:
1.1.3 支持向量機(jī)分類器(SVM)
考慮到支持向量機(jī)適用于二分類問題,因此同樣根據(jù)OvR策略構(gòu)建支持向量機(jī)分類器。在此定義任意樣本i的特征向量為Xi=(xi1,xi2,…,xi18),并用Yi=0或1分別定義正例和反例標(biāo)簽;C代表樣本約束常數(shù),若C有限,則部分樣本可以不滿足約束條件,若C無窮大,則任意樣本均滿足約束條件,任意樣本i不滿足約束條件的松弛變量為ξi,SVM表示為:
s.t.Yi(ωTxi+b)≥1-ξi,ξi≥0,i=1,2,…,n
Stacking集成學(xué)習(xí)算法能夠?qū)误w學(xué)習(xí)器進(jìn)行訓(xùn)練并集成?;凇?.1單體學(xué)習(xí)器”的3種單體學(xué)習(xí)器,隨機(jī)選擇兩個(gè)構(gòu)建初級學(xué)習(xí)器,剩余一個(gè)為次級學(xué)習(xí)器,兩兩組合構(gòu)建3種基于Stacking集成的狀態(tài)預(yù)測模型[9-10],如圖2所示。在此定義,以樸素貝葉斯分類器(NBC)為次級學(xué)習(xí)器的Stacking集成預(yù)測模型為“Stacking-NBC”,以Logistic回歸分類器(LRC)為次級學(xué)習(xí)器的Stacking集成預(yù)測模型為“Stacking-LRC”,以支持向量機(jī)分類器(SVM)為次級學(xué)習(xí)器的Stacking集成預(yù)測模型為“Stacking-SVM”。
圖2 3種基于Stacking集成的狀態(tài)預(yù)測模型
1.3.1 樣本數(shù)據(jù)
收集XX地鐵1號線、2號線和6號線的設(shè)備數(shù)據(jù)、檢測數(shù)據(jù)和維修數(shù)據(jù)驗(yàn)證模型的有效性。共截取XX三條地鐵線路540個(gè)軌道單元區(qū)段,每個(gè)區(qū)段長度為200 m,同時(shí)收集2015-2021年總計(jì)174次檢測數(shù)據(jù)(其中包括23 050條TQI數(shù)據(jù))、8025條設(shè)備數(shù)據(jù)和7年間的維修數(shù)據(jù)。設(shè)備數(shù)據(jù)包括坡度、道床類型、鋼軌型號、曲線半徑、加減速區(qū)段和鋼軌接頭數(shù)量等11個(gè)特征信息xi1~xi11;維修數(shù)據(jù)決定了下次檢測時(shí)的維修活動(dòng)類型xi12~xi14;軌道質(zhì)量指數(shù)(TQI,track quality index)檢測數(shù)據(jù)、TQI管理值和TQI等級劃分標(biāo)準(zhǔn)共同決定某一單元區(qū)段在當(dāng)前時(shí)刻和下一時(shí)刻的地鐵軌道狀態(tài)等級xi15~xi18和標(biāo)記值yi。上述18項(xiàng)特征共同構(gòu)成任意單元區(qū)段Ni的特征向量Xi=(xi1,xi2,…,xi18)。數(shù)據(jù)預(yù)處理后共獲得22 128個(gè)數(shù)據(jù)樣本,訓(xùn)練集和測試集的劃分比例為3:1。表1為軌道TQI狀態(tài)等級劃分標(biāo)準(zhǔn)和樣本數(shù)量分布。
表1 等級劃分標(biāo)準(zhǔn)及樣本分布
1.3.2 模型的評價(jià)分析
對3個(gè)單體學(xué)習(xí)器和3個(gè)集成模型分別進(jìn)行評價(jià)分析,內(nèi)容包括精度(Accuracy)、F1值和AUC值,結(jié)果如圖3所示。精度(Accuracy)方面,地鐵軌道狀態(tài)的預(yù)測結(jié)果為:Stacking-SVM>Stacking-LRC>Stacking-NBC>LRC>SVM>NBC,Stacking-SVM的預(yù)測精度比單體學(xué)習(xí)器平均提高了13.6%。F1值方面,預(yù)測結(jié)果為:Stacking-SVM>Stacking-LRC>Stacking-NBC>SVM>LRC>NBC,Stacking-SVM的F1值比單體學(xué)習(xí)器平均提高了18.5%。AUC值方面,預(yù)測結(jié)果為:Stacking-SVM>Stacking-LRC>Stacking-NBC>SVM>LRC>NBC,Stacking-SVM的AUC值比單體學(xué)習(xí)器平均提高了13.9%。綜合來看,3個(gè)集成模型的狀態(tài)預(yù)測效果均優(yōu)于單體學(xué)習(xí)器,且以SVM為次級學(xué)習(xí)器的Stacking集成模型具有個(gè)性化和較高的準(zhǔn)確性,為智慧城市軌道提供管理和維修參考。
圖3 不同模型評價(jià)結(jié)果
四元組定義馬爾可夫決策過程[11]:
狀態(tài)空間S:定義機(jī)器在空間中感知環(huán)境的所有狀態(tài)s構(gòu)成空間S,本文中為地鐵軌道狀態(tài)等級;
動(dòng)作空間A:定義機(jī)器所有應(yīng)對的動(dòng)作a構(gòu)成動(dòng)作空間A,在本文中為地鐵軌道維修活動(dòng)類型;
轉(zhuǎn)移概率P:定義當(dāng)前狀態(tài)s通過某個(gè)動(dòng)作a轉(zhuǎn)移到另一個(gè)狀態(tài)的概率矩陣P,在本文中為地鐵軌道狀態(tài)從當(dāng)前狀態(tài)等級到另一狀態(tài)的轉(zhuǎn)移概率;
轉(zhuǎn)移獎(jiǎng)勵(lì)R:定義系統(tǒng)在通過動(dòng)作a發(fā)生狀態(tài)轉(zhuǎn)移時(shí)依據(jù)獎(jiǎng)勵(lì)函數(shù)R(s,a)所獲得的獎(jiǎng)勵(lì)R,在本文中為采用維修活動(dòng)a對狀態(tài)s的地鐵軌道進(jìn)行維修時(shí)產(chǎn)生的費(fèi)用R(s,a)。
MDP的基本原理為:若機(jī)器處于狀態(tài)si∈S的系統(tǒng)中,對其采取維修活動(dòng)a,機(jī)器以轉(zhuǎn)移概率P由狀態(tài)si轉(zhuǎn)移至下一狀態(tài)si+1,并獲得獎(jiǎng)勵(lì)R(s,a)。機(jī)器通過學(xué)習(xí)若干個(gè)狀態(tài)轉(zhuǎn)移過程和轉(zhuǎn)移獎(jiǎng)勵(lì),能夠自主判斷系統(tǒng)狀態(tài)并采取相應(yīng)的維修活動(dòng)類型以得出最優(yōu)決策策略,以獲得最多的總獎(jiǎng)勵(lì)[12]。
2.2.1 決策變量
2.2.2 目標(biāo)函數(shù)
2.2.3 約束條件
定義軌道狀態(tài)為約束條件,下一決策時(shí)刻T+1時(shí)不能處于吸收態(tài)S,并設(shè)置S的剩余價(jià)值[13]為-∞:
2.2.4 自適應(yīng)學(xué)習(xí)機(jī)制
為了提高軌道狀態(tài)的智能感知和準(zhǔn)確預(yù)測,并且以此作為依據(jù)制定更加合理的維修優(yōu)化決策,首先要對軌道運(yùn)行和維護(hù)狀態(tài)進(jìn)行準(zhǔn)確預(yù)測。同時(shí),為了使模型能夠針對海量檢測數(shù)據(jù)和歷史運(yùn)行數(shù)據(jù)進(jìn)行自適應(yīng)學(xué)習(xí),深入挖掘軌道劣化機(jī)理,應(yīng)該基于合理準(zhǔn)確的預(yù)測結(jié)果進(jìn)行維修決策優(yōu)化。因此,本文結(jié)合“1.3模型預(yù)測結(jié)果”,以樸素貝葉斯分類器(NBC)和Logistic回歸分類器(LRC)作為雙單體初級學(xué)習(xí)器,以SVM分類器作為次級學(xué)習(xí)器,對三者集成并構(gòu)建Stacking-SVM模型,在模型引入了自適應(yīng)學(xué)習(xí)機(jī)制。
圖4 Stacking-SVM模型的自適應(yīng)學(xué)習(xí)過程
步驟5:計(jì)算軌道單元k在決策時(shí)刻τ的最優(yōu)維修決策:
步驟6:返回步驟3;
步驟7:判斷t是否等于T。若t=T,則算法結(jié)束;若t≠T,令t=t+1,進(jìn)入步驟1。
隨機(jī)選取第43號軌道單元,采用上述方法對規(guī)劃周期內(nèi)30個(gè)決策時(shí)刻的狀態(tài)等級和最優(yōu)維修策略進(jìn)行分析,結(jié)果如圖5所示[18-19]。其中,狀態(tài)等級包括:C1、C2、C3和C4,維修策略包括:a0為不維修、a1為經(jīng)常維修和a2為綜合維修,初始決策時(shí)刻為t1,周期末決策時(shí)刻為t30。
狀態(tài)等級C1:時(shí)刻t1~t24,43號軌道單元的維修決策為a1,需采取經(jīng)常維修活動(dòng);時(shí)刻t25~t31,維修決策為a2,需采取綜合維修活動(dòng)。狀態(tài)等級C2:時(shí)刻t1~t9、t14~t22,維修決策為a1,需采取經(jīng)常維修活動(dòng);時(shí)刻t10~t13、t23~t30,維修決策為a2,需采取綜合維修活動(dòng)。狀態(tài)等級C3:時(shí)刻t1~t3、t7~t8、t13~t14、t18~t19,維修決策為a1,需采取經(jīng)常維修活動(dòng);時(shí)刻t4~t6、t9~t12、t15~t17、t20~t30,維修決策為a2,需采取綜合維修活動(dòng)。狀態(tài)等級C4:所有時(shí)刻t1~t30,維修決策均為a2,需采取綜合維修活動(dòng)。
圖5 規(guī)劃周期內(nèi)最優(yōu)維修策略
由XX地鐵2015年至2021年的維修數(shù)據(jù)可知,XX地鐵1、2和6號線任意軌道單元的平均維修成本為2.25萬?;贛DP和AL-MDP對43號軌道單元完成500次MC模擬后的規(guī)劃周期總成本如圖6所示。分析圖6可知,規(guī)劃周期總成本方面,MDP模擬結(jié)果的最小值和最大值分別為1.450萬和2.573萬,AL-MDP模擬結(jié)果的最小值和最大值分別為1.291萬和1.678萬;MDP模擬結(jié)果的四分位數(shù)分別為2.144萬和1.858萬,AL-MDP模擬結(jié)果的四分位數(shù)分別為1.946萬和1.678萬;MDP模擬結(jié)果的平均數(shù)和中位數(shù)分別為2.001萬和1.996萬,AL-MDP模擬結(jié)果的平均數(shù)和中位數(shù)分別為1.803萬和1.789萬。MDP和AL-MDP的平均規(guī)劃周期總成本(2.001萬、1.803萬)均小于實(shí)際成本2.25萬,這表明加入馬爾可夫決策過程的兩個(gè)模型均可降低維修成本,但AL-MDP在各項(xiàng)參數(shù)上均優(yōu)于MDP,獲得最優(yōu)維修策略和最優(yōu)規(guī)劃周期總成本。
圖6 規(guī)劃周期總成本箱型圖
與MDP模型相比,AL-MDP模型在Stacking-SVM集成模型的基礎(chǔ)上加入了自適應(yīng)學(xué)習(xí)機(jī)制,能夠根據(jù)當(dāng)前預(yù)測結(jié)果不斷更新下一時(shí)刻的預(yù)測過程,進(jìn)一步降低地鐵軌道的維修成本。同時(shí),AL-MDP能夠?qū)崟r(shí)掌握地鐵軌道的運(yùn)作狀態(tài),給管理者和工作者提供精細(xì)化、個(gè)性化、更科學(xué)的維修優(yōu)化決策,對維修成本和軌道安全實(shí)現(xiàn)雙重精準(zhǔn)控制。
本文所設(shè)計(jì)的“智慧地鐵軌道管理系統(tǒng)”共包括8個(gè)主要功能模塊,其中:軌道數(shù)據(jù)管理、狀態(tài)監(jiān)測管理、檢查分析管理、生產(chǎn)運(yùn)維管理、系統(tǒng)安全管理、設(shè)備綜合管理、決策輔助管理以及系統(tǒng)綜合管理,如圖7所示。不同模塊的功能存在相互關(guān)聯(lián),比如狀態(tài)監(jiān)測管理和檢查分析管理協(xié)同包含病毒檢測、健康評估、壽命分析、任務(wù)編制和多設(shè)備一體化等不同的子功能[21]。
圖7 系統(tǒng)總體設(shè)計(jì)圖
基于上述系統(tǒng)的總體設(shè)計(jì)框架,本文融合利用“基于自適應(yīng)學(xué)習(xí)的Shaping-SVM模型”,實(shí)現(xiàn)了兩大主體功能——“軌道狀態(tài)預(yù)測”和“軌道狀態(tài)維修決策優(yōu)化”。在地鐵軌道預(yù)測中需要實(shí)現(xiàn)對軌道狀態(tài)等級、分布、變化趨勢和短期內(nèi)的工作狀態(tài)預(yù)測等功能,在軌道狀態(tài)維修決策優(yōu)化中需要制定地鐵軌道的維修優(yōu)化決策、預(yù)測規(guī)劃周期內(nèi)的狀態(tài)變化趨勢,并對未來某時(shí)刻的軌道狀態(tài)進(jìn)行安全預(yù)警[22]。系統(tǒng)的功能設(shè)計(jì)如圖8所示。
圖8 系統(tǒng)功能結(jié)構(gòu)圖
4.3.1 評定軌道狀態(tài)等級
基于XX地鐵的狀態(tài)等級分布標(biāo)準(zhǔn),本文以200 m為一個(gè)軌道單元,按照狀態(tài)等級完成對軌道路線的所有單元的評定,通過實(shí)時(shí)數(shù)據(jù)掌握當(dāng)前軌道運(yùn)行狀態(tài),并對未來某時(shí)刻的軌道狀態(tài)進(jìn)行預(yù)測。該功能可對XX地鐵任意線路的所有單元進(jìn)行狀態(tài)等級評定,使管理者實(shí)時(shí)掌握軌道單元狀態(tài)等級,內(nèi)容包括軌道單元序號、里程點(diǎn)、TQI值及狀態(tài),如圖9所示。
圖9 軌道狀態(tài)等級評定
4.3.2 制定維修決策
為智能感知地鐵軌道異常狀態(tài)和精準(zhǔn)捕捉劣化規(guī)律,進(jìn)一步對軌道異常狀態(tài)提供更合理、更科學(xué)的維修優(yōu)化決策,結(jié)合所有單元的軌道狀態(tài)數(shù)據(jù)和海量歷史檢測數(shù)據(jù),本文采用第1章節(jié)和第2章節(jié)的模型,對規(guī)劃周期內(nèi)的任意單元狀態(tài)進(jìn)行預(yù)測并制定優(yōu)化后的軌道維修決策策略。管理用戶可得到指定規(guī)劃周期的一條線路所有軌道單元的蒙特卡洛模擬下的規(guī)劃周期總成本,如圖10所示。可通過MC模擬出任意軌道單元在決策周期內(nèi)的維修決策優(yōu)化結(jié)果,經(jīng)常維修C1和C2的軌道單元,綜合維修C3和C4的軌道單元。分析圖10可知,指定初始決策時(shí)刻為2020年5月,通過基于AL-MDP的軌道維修決策優(yōu)化模型對所有軌道單元進(jìn)行蒙特卡洛模擬。已知實(shí)際成本為2.25萬元,蒙特卡洛模擬所得全線軌道的規(guī)劃周期內(nèi)總成本為280.75萬元,經(jīng)過AL-MDP的優(yōu)化模型后,任意軌道單元的平均規(guī)劃成本為1.81萬元。
圖10 制定維修決策
4.3.3 預(yù)警軌道安全狀態(tài)
基于前文地鐵軌道在規(guī)劃周期內(nèi)的狀態(tài)變化趨勢預(yù)測功能,通過指定某一決策時(shí)刻,對未來某一時(shí)刻的地鐵軌道單元狀態(tài)進(jìn)行狀態(tài)檢測。通過歷史數(shù)據(jù)的狀態(tài)變化趨勢,結(jié)合目前軌道單元的運(yùn)行狀態(tài)提出安全預(yù)警,保證地鐵管理人員和維修人員能夠及時(shí)掌握軌道運(yùn)行狀態(tài),并且為未來可能存在或即將出現(xiàn)的危險(xiǎn)狀態(tài)提供運(yùn)維保證和決策參考。管理用戶可得到查詢條件下的軌道單元狀態(tài)安全預(yù)警表。在該系統(tǒng)中可獲得任意軌道單元在2個(gè)月后的MC模擬結(jié)果,如圖11所示。地鐵軌道工作者或管理者能夠根據(jù)預(yù)警信息對軌道單元的未來狀態(tài)進(jìn)行等級評定和狀態(tài)預(yù)警,給管理者制定維修措施提供決策參考。
圖11 軌道狀態(tài)安全預(yù)警
設(shè)計(jì)了樸素貝葉斯分類器、Logistic回歸分類器和支持向量機(jī)分類器,并構(gòu)建了基于Stacking集成的軌道狀態(tài)預(yù)測模型。綜合來看,以SVM為次級學(xué)習(xí)器的Stacking集成模型具有個(gè)性化和較高的準(zhǔn)確性,為智慧城市軌道提供管理和維修參考。
基于Stacking-SVM集成模型,引入自適應(yīng)學(xué)習(xí)的馬爾可夫決策過程(AL-MDP)構(gòu)建了軌道維修決策優(yōu)化模型。AL-MDP能夠進(jìn)一步降低地鐵軌道的維修成本,實(shí)時(shí)掌握地鐵軌道的運(yùn)作狀態(tài),給管理者和工作者提供精細(xì)化、個(gè)性化、更科學(xué)的維修優(yōu)化決策,對維修成本和軌道安全實(shí)現(xiàn)雙重精準(zhǔn)控制。