滕 達(dá) ,趙 陽 ,范 楷 ,張 淼 ,王 翔
TENG Da1, 2, ZHAO Yang1, 2, FAN Kai1, 2, ZHANG Miao1, 2, WANG Xiang1, 2
(1.中國鐵道科學(xué)研究院集團(tuán)有限公司 通信信號(hào)研究所,北京 100081;2.中國鐵道科學(xué)研究院集團(tuán)有限公司 國家鐵路智能運(yùn)輸系統(tǒng)工程技術(shù)研究中心,北京 100081)
(1.Signal & Communication Research Institute, China Academy of Railway Sciences Corporation Limited, Beijing 100081, China; 2.National Research Center of Railway Intelligence Transportation System Engineering Technology, China Academy of Railway Sciences Corporation Limited, Beijing 100081, China)
目前,國內(nèi)外新型列車運(yùn)行控制系統(tǒng)實(shí)現(xiàn)移動(dòng)閉塞,根本前提是實(shí)現(xiàn)列車的精確自主定位,最大程度地減少軌旁設(shè)備?;诒倍沸l(wèi)星的列車自主定位技術(shù)是實(shí)現(xiàn)列車精確自主定位的最優(yōu)解決方案,但在特殊地形下的衛(wèi)星信號(hào)“盲區(qū)”問題是該方案的主要技術(shù)問題,而采用圖像識(shí)別技術(shù)為解決衛(wèi)星信號(hào)“盲區(qū)”問題提供了一種解決方案。
列車運(yùn)行控制系統(tǒng)是指揮列車運(yùn)行,保證行車安全,改善行車組織方式,提高運(yùn)輸效率的關(guān)鍵設(shè)施。目前世界各國均在進(jìn)行新型列車運(yùn)行控制系統(tǒng)的研究與開發(fā),其中區(qū)間閉塞技術(shù)是列車運(yùn)行控制系統(tǒng)的核心技術(shù)手段。區(qū)間閉塞是分段對(duì)區(qū)間線路進(jìn)行邏輯封鎖,同一時(shí)間只允許一列列車在其間運(yùn)行,從而防止列車相撞的安全控制手段,該技術(shù)是線路運(yùn)輸效率的主要決定因素之一,主要分為站間閉塞、自動(dòng)閉塞和移動(dòng)閉塞等制式。移動(dòng)閉塞制式取消了由軌旁設(shè)備劃分出的固定閉塞分區(qū),動(dòng)態(tài)計(jì)算前后兩車追蹤間隔,后車行車許可隨前車的位置、速度等運(yùn)行狀態(tài)的變化而動(dòng)態(tài)移動(dòng),相較于站間閉塞和自動(dòng)閉塞,具有更高效、更靈活、更經(jīng)濟(jì)的特點(diǎn),是提高鐵路運(yùn)輸效率的重要手段之一[1-2]。由于列車運(yùn)行控制系統(tǒng)實(shí)現(xiàn)移動(dòng)閉塞的前提條件是實(shí)現(xiàn)列車的精確自主定位,而目前列車定位方式仍然依靠軌道電路等軌旁設(shè)備完成,導(dǎo)致建設(shè)與運(yùn)維成本較高、維修難度較大。因此,在最大程度簡化軌旁設(shè)備的同時(shí)實(shí)現(xiàn)列車自主定位,成為國內(nèi)外新型列控運(yùn)行控制系統(tǒng)研究的核心關(guān)鍵點(diǎn)[3-4]。
基于北斗衛(wèi)星的列車定位技術(shù)是基于一種多源定位信息安全融合算法,數(shù)據(jù)來源包括:北斗衛(wèi)星提供的列車定位信息、地面衛(wèi)星差分基站提供的地面差分信息、速度傳感器和加速度計(jì)等多種傳感器提供的實(shí)時(shí)測(cè)量數(shù)據(jù),以及地面應(yīng)答器信息,最終結(jié)合電子地圖進(jìn)行綜合運(yùn)算,實(shí)現(xiàn)列車的精確測(cè)速和自主定位,使列車具備在區(qū)間不依靠軌旁設(shè)備實(shí)現(xiàn)高精度自主定位的能力[5-6]。由于速度傳感器和加速度計(jì)等傳感器的精度有限,基于北斗衛(wèi)星的列車定位技術(shù)方案主要依靠的定位信息來源是衛(wèi)星定位信息,由于衛(wèi)星定位信息存在信號(hào)“盲區(qū)”問題,尤其在偏遠(yuǎn)地區(qū)鐵路沿線地形具有多山、多隧道的特點(diǎn),這樣的地形會(huì)極大消減、遮蔽衛(wèi)星信號(hào),嚴(yán)重影響列車自主定位精度[7]。針對(duì)這一問題,現(xiàn)有的解決方案是在衛(wèi)星定位信號(hào)不佳的地區(qū)加裝定位應(yīng)答器,每隔一段距離對(duì)列車的定位誤差進(jìn)行矯正,保證列車自主定位的精度。但是,定位應(yīng)答器在列車時(shí)速高于350 km/h時(shí)效果不佳,而且線路上加裝的大量應(yīng)答器不但提高了建設(shè)及運(yùn)維的成本,也與最大程度減少軌旁設(shè)備的發(fā)展趨勢(shì)相悖。
針對(duì)信號(hào)“盲區(qū)”問題,提出一種將圖像識(shí)別技術(shù)應(yīng)用至列車自主定位的方案,在鐵路沿線設(shè)置視覺標(biāo)簽,通過加裝視覺采集及處理設(shè)備,為列控車載子系統(tǒng)增加圖像識(shí)別定位單元,該單元的功能是在列車行駛過程中采集并識(shí)別這些視覺標(biāo)簽的圖像信息,結(jié)合電子地圖當(dāng)中預(yù)存的視覺標(biāo)簽位置信息精確校正列車定位累積誤差。圖像識(shí)別定位單元是新型列車運(yùn)行控制系統(tǒng)車載子系統(tǒng)的新增功能單元,與車載子系統(tǒng)協(xié)同工作,需要結(jié)合列車運(yùn)行控制系統(tǒng)車載子系統(tǒng)對(duì)其進(jìn)行方案設(shè)計(jì)。
圖像識(shí)別技術(shù)已經(jīng)在鐵路領(lǐng)域開展了大量的應(yīng)用研究,為圖像識(shí)別技術(shù)在鐵路領(lǐng)域的應(yīng)用打下了良好基礎(chǔ)。但是,這些研究主要針對(duì)靜止或低速目標(biāo)進(jìn)行圖像識(shí)別,并沒有開展針對(duì)列車高速行駛場(chǎng)景下的圖像識(shí)別研究。因此,列車高速行駛場(chǎng)景進(jìn)行列車自主定位圖像識(shí)別技術(shù)研究,重點(diǎn)解決衛(wèi)星信號(hào)“盲區(qū)”問題,提高新型列車運(yùn)行控制系統(tǒng)列車自主定位技術(shù)定位精確度及地形適應(yīng)能力。
圖像識(shí)別技術(shù)應(yīng)用核心要素包括視覺標(biāo)簽、圖像采集設(shè)備及圖像處理設(shè)備。視覺標(biāo)簽需要設(shè)置于軌旁易于識(shí)別位置且表面文字信息在線路中具有惟一性,以便將具有惟一性的文字信息與位置關(guān)聯(lián)。在鐵路沿線存在許多具有固定位置的標(biāo)志,如公里標(biāo)、百米標(biāo)、橋涵標(biāo)等,這些固定標(biāo)志當(dāng)中與位置相關(guān)性最大且顯示信息在線路中具有唯一性的是公里標(biāo),通過前期的精確測(cè)量,準(zhǔn)確獲知公里標(biāo)在線路中的精確位置,并將公里標(biāo)文字信息及精確位置信息對(duì)應(yīng)保存在列車運(yùn)行控制系統(tǒng)電子地圖當(dāng)中,進(jìn)而將線路既有的公里標(biāo)定義為視覺標(biāo)簽進(jìn)行利用,從而省去重新設(shè)計(jì)、生產(chǎn)、安裝及維護(hù)視覺標(biāo)簽的工作。
在衛(wèi)星信號(hào)較強(qiáng)的非“盲區(qū)”運(yùn)行環(huán)境下,無需圖像識(shí)別列車定位單元的校正也能獲得較小的列車定位誤差。圖像識(shí)別列車定位單元合理的工作方式是通過與列車運(yùn)行控制系統(tǒng)車載子系統(tǒng)進(jìn)行信息交互實(shí)時(shí)獲取列車位置、衛(wèi)星信號(hào)強(qiáng)度、電子地圖等信息,預(yù)知列車即將進(jìn)入衛(wèi)星信號(hào)“盲區(qū)”或是發(fā)現(xiàn)當(dāng)前衛(wèi)星信號(hào)不佳時(shí),控制圖像采集設(shè)備在接近公里標(biāo)時(shí)開始工作,首先對(duì)公里標(biāo)文字信息進(jìn)行識(shí)別,再通過對(duì)電子地圖當(dāng)中預(yù)存的公里標(biāo)信息的檢索得出列車正在跨越的唯一公里標(biāo),最終通過電子地圖預(yù)存的位置信息掌握該公里標(biāo)的精確位置信息,根據(jù)該信息生成列車定位誤差校正信息,將其提供給車載子系統(tǒng),完成基于圖像識(shí)別的列車定位過程。列車自主定位圖像識(shí)別技術(shù)架構(gòu)示意圖如圖1所示。
列車自主定位圖像識(shí)別技術(shù)方案的核心設(shè)備,圖像識(shí)別處理單元軟件由運(yùn)行狀態(tài)綜合判斷模塊、圖像預(yù)處理模塊、視覺標(biāo)簽定位模塊、視覺標(biāo)簽識(shí)別模塊、位置計(jì)算及報(bào)告模塊組成。結(jié)合運(yùn)營場(chǎng)景,分析各軟件模塊的功能、實(shí)現(xiàn)方式,以及各軟件模塊間如何協(xié)同工作。
運(yùn)行狀態(tài)綜合判斷模塊的功能是根據(jù)車載設(shè)備提供的位置信息及衛(wèi)星信號(hào)強(qiáng)度,綜合判斷圖像識(shí)別單元工作的時(shí)機(jī),控制圖像采集設(shè)備開始工作。當(dāng)預(yù)知列車即將進(jìn)入衛(wèi)星信號(hào)“盲區(qū)”或是發(fā)現(xiàn)當(dāng)前衛(wèi)星信號(hào)不佳時(shí),運(yùn)行狀態(tài)綜合判斷模塊控制圖像識(shí)別單元在接近公里標(biāo)時(shí)開始工作。因此,運(yùn)行狀態(tài)綜合判斷模塊功能主要有2項(xiàng),一是從列控車載系統(tǒng)處獲知列車位置,結(jié)合電子地圖,預(yù)知列車即將進(jìn)入隧道山區(qū)等信號(hào)“盲區(qū)”時(shí),控制圖像識(shí)別單元在接近公里標(biāo)時(shí)開始工作。二是通過列控車載系統(tǒng)實(shí)時(shí)監(jiān)測(cè)衛(wèi)星信號(hào)強(qiáng)度,當(dāng)衛(wèi)星信號(hào)低于一定閾值時(shí),結(jié)合電子地圖,控制圖像識(shí)別單元在接近公里標(biāo)時(shí)開始工作。
得到圖像采集設(shè)備輸入的圖像數(shù)據(jù)后,預(yù)處理模塊的功能包括對(duì)原始圖像數(shù)據(jù)進(jìn)行圖像抽取和圖像增強(qiáng)。該模塊應(yīng)適應(yīng)最高時(shí)速將達(dá)到400 km/h的高速鐵路應(yīng)用場(chǎng)景,圖像采集設(shè)備需要有足夠的曝光速度,據(jù)測(cè)算,在時(shí)速400 km/h的列車上清晰地拍攝公里標(biāo),需要視頻采集的幀率達(dá)到每秒330幀,現(xiàn)有的設(shè)備網(wǎng)絡(luò)負(fù)載和圖像處理能力都無法滿足如此高幀率的處理需求,因而在圖像預(yù)處理模塊實(shí)現(xiàn)了圖像抽取處理的方式,即每秒以固定時(shí)間間隔抽取10幀圖片來進(jìn)行文本檢測(cè)和識(shí)別,該模塊一方面能夠使現(xiàn)有的圖像識(shí)別設(shè)備計(jì)算能力滿足需求,另一方面使圖像識(shí)別單元能夠適應(yīng)各種級(jí)別列車的運(yùn)行速度。
圖1 列車自主定位圖像識(shí)別技術(shù)架構(gòu)示意圖Fig.1 Structure diagram of train positioning scheme based on image recognition
原始圖像于列車運(yùn)行過程中采集,可能亮度較低或存在雨、霧等天氣影響因素,影響后續(xù)圖像識(shí)別的進(jìn)行,圖像預(yù)處理模塊需要使用去霧、補(bǔ)光等算法對(duì)原始圖像進(jìn)行處理,消除雨霧環(huán)境對(duì)圖像質(zhì)量的影響,從而增加圖像的可視度,提高識(shí)別準(zhǔn)確率。方案使用的圖像增強(qiáng)技術(shù)是運(yùn)算量較少同時(shí)效果較好的暗通道去霧算法,經(jīng)典霧圖形成模型為
式中:I(x)為現(xiàn)有的有霧圖像;J(x)為無霧圖像;t(x)為透射率;A為全球大氣光成分。
將經(jīng)典霧圖形成模型進(jìn)行變形,可以得到去霧后的表達(dá)式為
式中:t0為透射率t的下限值,其作用是在輸入圖像的濃霧區(qū)域保留一定的霧。
視覺標(biāo)簽定位模塊的功能包括公里標(biāo)字符的檢測(cè)定位及公里標(biāo)跨越時(shí)機(jī)的檢測(cè)。視覺標(biāo)簽定位模塊需精確地檢測(cè)并定位自然圖像中的每一個(gè)字符,圖像識(shí)別技術(shù)方案構(gòu)建了一個(gè)可以預(yù)測(cè)字符,以及字符之間連接關(guān)系的深度神經(jīng)網(wǎng)絡(luò)模型。該深度神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)以牛津大學(xué)視覺小組提出的VGG-16全卷積神經(jīng)網(wǎng)絡(luò)作為主干網(wǎng)絡(luò),并在其末端加入新的4層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行補(bǔ)充訓(xùn)練微調(diào)。改造優(yōu)化后的VGG-16全卷積神經(jīng)網(wǎng)絡(luò)模型目標(biāo)函數(shù)L為
式中:p為圖像中像素是視覺標(biāo)簽組成部分的概率;conf(p)為像素落在范圍中的置信度,當(dāng)使用合成數(shù)據(jù)集時(shí),該置信度為1;Sr(p)及Sa(p)為預(yù)測(cè)范圍和連接關(guān)系是已標(biāo)注的訓(xùn)練集范圍和連接關(guān)系。
視覺標(biāo)簽定位模塊的另一重要功能是通過識(shí)別幀圖像當(dāng)中公里標(biāo)的存在和運(yùn)動(dòng)趨勢(shì)判斷出列車車頭在何時(shí)跨越了公里標(biāo),在列車跨越公里標(biāo)的同時(shí)將圖像識(shí)別結(jié)果告知位置計(jì)算及報(bào)告模塊,從而形成位置報(bào)告,完成定位校準(zhǔn)。
視覺標(biāo)簽識(shí)別模塊在字符檢測(cè)模塊的基礎(chǔ)上完成字符的識(shí)別任務(wù),識(shí)別出檢測(cè)出的字符當(dāng)中包含的數(shù)字或英文字母。圖像識(shí)別技術(shù)方案構(gòu)建了一個(gè)具有字符識(shí)別功能的深度神經(jīng)網(wǎng)絡(luò)模型,深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)仍然是以VGG-16全卷積神經(jīng)網(wǎng)絡(luò)作為主干網(wǎng)絡(luò),在末端加入雙向長短時(shí)記憶網(wǎng)絡(luò)(LSTM)進(jìn)行補(bǔ)充訓(xùn)練微調(diào),最終輸出模型所識(shí)別出字符的置信度。LSTM的核心思想是將每個(gè)節(jié)點(diǎn)作為一個(gè)細(xì)胞元,并設(shè)計(jì)輸入門、遺忘門、輸出門來有選擇地過濾輸入到細(xì)胞的信息。雙向LSTM的特點(diǎn)是對(duì)于每個(gè)時(shí)刻t,輸入會(huì)同時(shí)提供2個(gè)方向相反的LSTM,輸出由2個(gè)LSTM共同確定。VGG-16加LSTM的組合網(wǎng)絡(luò)模型目標(biāo)函數(shù)為
式中:Train表示訓(xùn)練集;Xi表示圖像;Yi表示字符。
模型通過最小化目標(biāo)函數(shù),即字符條件概率的負(fù)對(duì)數(shù)似然性進(jìn)行訓(xùn)練。
通過前期的精確測(cè)量,準(zhǔn)確獲知每一公里標(biāo)在線路中的精確位置,并將公里標(biāo)文字信息及精確位置信息對(duì)應(yīng)保存在列控系統(tǒng)電子地圖中。位置計(jì)算及報(bào)告模塊需與列控車載設(shè)備保持通信連接,同步獲取列車當(dāng)前所在區(qū)間的電子地圖。當(dāng)位置計(jì)算及報(bào)告模塊收到視覺標(biāo)簽定位模塊發(fā)出的列車跨越公里標(biāo)信息時(shí),可根據(jù)視覺標(biāo)簽識(shí)別模塊識(shí)別出的公里標(biāo)文字信息,結(jié)合電子地圖,檢索出列車當(dāng)前跨越的唯一公里標(biāo),再根據(jù)電子地圖當(dāng)中預(yù)存的對(duì)應(yīng)公里標(biāo)精確位置信息,得出列車當(dāng)前的精確位置,進(jìn)而向列控車載設(shè)備報(bào)告該位置信息,校正列車定位誤差,達(dá)到解決衛(wèi)星信號(hào)“盲區(qū)”問題,提高新型列控系統(tǒng)列車自主定位技術(shù)定位精確度及地形適應(yīng)能力的目的。
基于圖像識(shí)別的列車自主定位方案功能設(shè)計(jì)流程圖如圖2所示。
圖2 基于圖像識(shí)別的列車自主定位方案功能設(shè)計(jì)流程圖Fig.2 Flow chart of function design of autonomous train positioning scheme based on image recognition
為實(shí)現(xiàn)視覺標(biāo)簽定位模塊及視覺標(biāo)簽識(shí)別模塊功能,構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型,并使用大量訓(xùn)練數(shù)據(jù)集對(duì)其進(jìn)行訓(xùn)練,使模型中的參數(shù)取值達(dá)到最優(yōu)化。研究使用的訓(xùn)練集分為2部分,一部分是公開數(shù)據(jù)集,另一部分是合成數(shù)據(jù)集。其中公開數(shù)據(jù)集使用的是微軟COCO數(shù)據(jù)集,而合成的數(shù)據(jù)集則是自行研發(fā)的圖片合成及標(biāo)注軟件生成的數(shù)據(jù)集。訓(xùn)練模型的設(shè)備為CPU I9 10900K 8核,雙GTX 2080Ti顯卡,64 G內(nèi)存的PC機(jī),使用語言為Python,深度學(xué)習(xí)框架是Facebook公司的開源深度學(xué)習(xí)框架Pytorch。
在仿真試驗(yàn)階段,使用一段網(wǎng)上公開的行車記錄[8],從該視頻中選取了200幀帶有公里標(biāo)的圖片,以及200幀不帶公里標(biāo),無其他字符干擾的圖片作為對(duì)照。試驗(yàn)使用常用的F-Measure評(píng)價(jià)標(biāo)準(zhǔn),作為評(píng)價(jià)結(jié)果的標(biāo)準(zhǔn)。F-Measure評(píng)價(jià)體系結(jié)合準(zhǔn)確率、精確率及召回率等參數(shù)綜合計(jì)算調(diào)和平均數(shù),是信息檢索、機(jī)器學(xué)習(xí)等領(lǐng)域的常用的評(píng)價(jià)標(biāo)準(zhǔn),常用于綜合考量模型的實(shí)用性。
在仿真試驗(yàn)過程中,沒有對(duì)不存在公里標(biāo)的圖片發(fā)生誤判,而對(duì)于存在公里標(biāo)的圖片,由于網(wǎng)絡(luò)視頻拍攝設(shè)備效果不佳且上傳網(wǎng)絡(luò)過程中存在多次壓縮造成的失真,導(dǎo)致字符識(shí)別難度加大,共造成27個(gè)圖片的誤判,最終模型取得了89.99%的F-Measure評(píng)價(jià)值。仿真試驗(yàn)結(jié)果如表1所示。
表1 仿真試驗(yàn)結(jié)果Tab.1 Simulation test results
由表1中準(zhǔn)確率和F-Measure數(shù)值可以得出,構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型能夠?qū)崿F(xiàn)視覺標(biāo)簽定位模塊及視覺標(biāo)簽識(shí)別模塊功能,具備一定的實(shí)用性。
列車運(yùn)行控制系統(tǒng)是鐵路信號(hào)系統(tǒng)的核心組成部分,在高速鐵路運(yùn)營當(dāng)中發(fā)揮著“神經(jīng)中樞和大腦”的重要作用。列車自主定位圖像識(shí)別技術(shù)方案在校正衛(wèi)星信號(hào)“盲區(qū)”所帶來的列車自主定位誤差的同時(shí),還具有無需額外加裝地面設(shè)備、維護(hù)工作量小、適應(yīng)各種列車運(yùn)行速度、滿足多種線路運(yùn)營需求的優(yōu)點(diǎn),方案經(jīng)濟(jì)性好,實(shí)用性高,滿足我國鐵路信號(hào)系統(tǒng)發(fā)展的新需求,是計(jì)算機(jī)視覺技術(shù)在鐵路領(lǐng)域應(yīng)用的一種新探索。