鐘 昊,柴金川,宗孝鵬
(1. 佳訊飛鴻智能科技研究院 人工智能應用技術研究所,北京 100044;2. 中國鐵道科學研究院集團有限公司 國家鐵道試驗中心,北京 100015)
鐵路編組站咽喉區(qū)的行車和調車作業(yè)尤為繁忙,且工務、電務和供電等專業(yè)在咽喉區(qū)施工作業(yè)也較為頻繁,會出現(xiàn)異物落入道岔后導致基本軌與尖軌無法密貼、施工作業(yè)結束后工器具遺留在現(xiàn)場、轉轍機在檢修完成后箱蓋未閉合或未完全固定等安全隱患,嚴重地威脅著行車安全。
目前,咽喉區(qū)安全檢測主要依靠人工巡檢,但因人工巡檢周期長,難以及時發(fā)現(xiàn)異常情況。保障咽喉區(qū)安全是提高鐵路編組站通過能力的前提和基礎,亟需采用新技術及時發(fā)現(xiàn)和消除安全隱患。
近年來,隨著人工智能技術的快速發(fā)展,基于智能視覺的鐵路巡檢技術已成為研究熱點,接觸網(wǎng)異常識別系統(tǒng)[1]、鋼軌表面缺陷檢測系統(tǒng)[2]、機房智能巡檢機器人系統(tǒng)[3]、軌旁設備異常檢測系統(tǒng)[4]、貨車故障動態(tài)圖像檢測系統(tǒng)[5]等智能檢測系統(tǒng)在鐵路各專業(yè)得到應用,極大地提升了鐵路巡檢作業(yè)效率,增強了鐵路安全保障能力。
《國鐵集團關于加快推進5G技術鐵路應用發(fā)展的實施意見》指出,加快推進第5代移動通信技術(5G) 應用,是推進新時代鐵路高質量發(fā)展、實現(xiàn)交通強國、鐵路先行的重要領域和重要基礎,有利于提升鐵路服務品質和效率效益。
為此,研究開發(fā)基于5G的編組站咽喉區(qū)異常檢測系統(tǒng)(簡稱:咽喉區(qū)異常檢測系統(tǒng)),借助5G網(wǎng)絡大帶寬、低時延、泛在連接的優(yōu)勢,利用監(jiān)控攝像頭對咽喉區(qū)關鍵點位定期巡檢,采用智能視覺技術,自動識別咽喉區(qū)異常情況并告警,推動鐵路業(yè)務模式創(chuàng)新,提升編組站咽喉區(qū)安全保障能力。
編組站咽喉區(qū)異常檢測系統(tǒng),如圖1所示。
圖1 編組站咽喉區(qū)異常檢測系統(tǒng)構成
(1)圖像采集子系統(tǒng):在編組站咽喉區(qū)關鍵部位安裝監(jiān)控攝像頭,巡回采集各個關鍵點的監(jiān)控視頻;目前利用運營商5G網(wǎng)絡(今后可利用鐵路5G-R專網(wǎng)),將視頻監(jiān)控數(shù)據(jù)發(fā)送給視頻分析子系統(tǒng),實現(xiàn)咽喉區(qū)視頻監(jiān)控數(shù)據(jù)的接入、匯聚和集中管理。
(2)視頻分析子系統(tǒng):完成視頻圖像智能分析,主要包括視頻監(jiān)控平臺、視頻分析服務器及數(shù)據(jù)存儲模塊等;其中,視頻監(jiān)控平臺實現(xiàn)攝像頭的統(tǒng)一接入與管理,通過標準協(xié)議,對前端攝像頭云臺進行控制;視頻分析服務器對采集的視頻數(shù)據(jù)進行智能分析,判斷是否存在異常情況,生成告警信息并發(fā)送給服務管理子系統(tǒng)。
視頻分析子系統(tǒng)軟件采用基于組件的多級流水線視頻處理技術[6],實現(xiàn)視頻采集、解碼、預處理、合流、推理、告警、分流、渲染、編碼、輸出的流水線,多路視頻可以在流水線上并行處理,如圖2所示。
圖2 視頻分析子系統(tǒng)流水線
(3)服務管理子系統(tǒng):提供系統(tǒng)服務管理功能,包括接口管理、配置管理、任務管理及狀態(tài)監(jiān)測模塊;其中,接口管理模塊定義了與既有的工電供生產(chǎn)管控系統(tǒng)(簡稱:生產(chǎn)管控系統(tǒng))的HTTP數(shù)據(jù)傳輸接口,可將告警信息、關聯(lián)的異常圖像以及系統(tǒng)自身運行狀態(tài)上報給生產(chǎn)管控系統(tǒng),并從生產(chǎn)管控系統(tǒng)接收系統(tǒng)管理指令;配置管理模塊可對分析服務進行配置,如接入攝像頭的地址、數(shù)據(jù)存儲路徑等;任務管理模塊提供巡檢周期、攝像頭預置位等參數(shù)設置功能,完成巡檢任務調度;狀態(tài)監(jiān)測模塊實時采集和記錄硬件及服務的運行狀態(tài)信息,如CPU溫度、磁盤剩余、GPU占用百分比等。
生產(chǎn)管控系統(tǒng)接收到告警信息后,推送到車站值班室監(jiān)控終端以及值班人員手持終端,指導異常處理工作,避免引發(fā)安全事故。同時,車站值班人員可在生產(chǎn)管控系統(tǒng)的監(jiān)控終端上,通過與服務管理子系統(tǒng)的數(shù)據(jù)接口,執(zhí)行狀態(tài)監(jiān)測、配置管理及任務管理等操作,實現(xiàn)對咽喉區(qū)異常檢測系統(tǒng)的監(jiān)測與控制。
咽喉區(qū)異常檢測系統(tǒng)通過攝像頭采集咽喉區(qū)視頻數(shù)據(jù),智能識別咽喉區(qū)異常情況,并將告警信息上傳給生產(chǎn)管控系統(tǒng)。
(1)定時巡檢:系統(tǒng)按照預定的時間間隔,定時控制攝像頭對準預置位,采集咽喉區(qū)各個關鍵點的視頻數(shù)據(jù)。
(2)道岔異物入侵檢測:道岔基本軌與尖軌之間存在較大縫隙,當異物(如列車通過時崩落的石塊)落入縫隙時,會導致基本軌與尖軌無法密貼,如圖3(a)所示;系統(tǒng)通過視頻智能分析,自動識別基本軌與尖軌密貼區(qū)域出現(xiàn)的異物。
(3)工器具遺留檢測:工務、電務和供電3個專業(yè)咽喉區(qū)施工作業(yè)較為頻繁,使用的工器具種類繁多,容易出現(xiàn)工器具遺留現(xiàn)象,如圖3(b)所示;通過視頻智能分析,自動識別軌道內(nèi)的工器具遺留異常。
(4)轉轍機箱蓋狀態(tài)檢測:轉轍機在檢修完成后,箱蓋(尤其是外箱蓋)未閉合或者未完全固定,容易危害行車安全,如圖3(c)所示;通過視頻智能分析,自動識別轉轍機箱蓋外觀異常,箱蓋是否完好和正常閉合。
圖3 安全隱患示意
(5)異常告警:識別出異常情況后,立即將告警信息上傳到生產(chǎn)管控系統(tǒng),由生產(chǎn)管控系統(tǒng)將告警信息及異常圖像推送至車站值班室監(jiān)控終端和值班人員手持終端,指導相關人員及時到現(xiàn)場進行處理。
(6)運行狀態(tài)監(jiān)測:對異常檢測服務運行狀態(tài)及設備服務器資源進行監(jiān)測,查看服務運行是否正常,以及服務器的CPU、圖形處理器(GPU,Graphic Processing Unit)、網(wǎng)絡、磁盤等硬件信息。
(7)服務管理:對系統(tǒng)數(shù)據(jù)接口、配置參數(shù)及任務進行管理,實現(xiàn)與既有的生產(chǎn)管控系統(tǒng)對接,提供攝像頭分析任務管理及相關參數(shù)設置。
基于機器學習的異常檢測主要方法:(1)無監(jiān)督學習方法,即利用手工設計特征[7]、特征表示[8]、模板匹配[9]和淺層機器學習等方法,實現(xiàn)單個缺陷或故障的檢測;(2)監(jiān)督學習方法,即利用標注好的故障圖像(包括類別、矩形框、像素等)對神經(jīng)網(wǎng)絡進行訓練,利用訓練好的神經(jīng)網(wǎng)絡模型來識別[10]。
在實際應用場景中,咽喉區(qū)異常檢測面臨著異常樣本數(shù)量極少,以及異常類別不固定、無法提前預知遺留物類別的難題。因此,咽喉區(qū)異常檢測采用無監(jiān)督學習方法進行異常檢測。
咽喉區(qū)異常檢測系統(tǒng)的工作流程如圖4所示。
圖4 系統(tǒng)工作流程
(1) 系統(tǒng)開始工作時,讀取攝像頭的巡檢參數(shù)(巡檢周期、預置位等),檢查各個攝像頭是否有到達設定巡檢周期的巡檢任務;
(2) 當某個攝像頭進入設定的巡檢周期時,系統(tǒng)控制該攝像頭云臺移動到第一個預置位,采集咽喉區(qū)指定位置的監(jiān)控視頻數(shù)據(jù),并通過5G公網(wǎng)連接,將視頻數(shù)據(jù)傳輸給視頻分析子系統(tǒng);
(3) 視頻分析服務器對每一幀圖像數(shù)據(jù)進行異常檢測,結合滑動窗口方法,判斷連續(xù)時間段內(nèi)是否存在異常;
(4) 檢測到異常時,向生產(chǎn)管控系統(tǒng)推送告警信息,提醒車站值班人員及時進行處理;
(5) 系統(tǒng)控制該攝像頭云臺移動到下一個預置位進行檢測,直至該攝像頭的所有預置位檢測完畢,結束該攝像頭的檢測;
(6) 檢查下一個攝像頭,重復上述(2)~(5)步驟,直至所有的攝像頭檢測完畢。
知識蒸餾是一種模型壓縮方法[11],是一種基于“教師—學生思想”的訓練方式,即將一個訓練好的教師模型中所包含的知識蒸餾提取到學生模型中,如圖5所示。由于其簡單有效,已經(jīng)在工業(yè)界被廣泛應用。
圖5 知識蒸餾過程
將知識蒸餾方法應用于異常檢測的基本思路是:在正常樣本上,對于預先訓練好的教師模型和隨機初始化的學生模型進行知識蒸餾,使得學生模型的輸出去逼近教師模型的輸出,完成在正常樣本上的知識學習。因此,在正常樣本上,由學生模型預測得到的特征(embedding)與教師模型十分相似;當輸入異常樣本時,由于學生模型并未見過異常,學生模型預測得到的特征與教師模型相差較大,于是判斷輸入圖像為異常。
師生特征金字塔匹配(STPM,Student-Teacher Feature Pyramid Matching)算法[12],是一個基于知識蒸餾的異常檢測框架,如圖6所示。
圖6 師生特征金字塔匹配網(wǎng)絡結構
使用大規(guī)模數(shù)據(jù)集的預訓練模型作為教師模型,訓練階段將教師經(jīng)驗提煉到具有相同結構的學生模型。采用特征金字塔結構,將多尺度大小的特征圖進行融合,可以提高小目標的檢測性能。
在訓練階段,使用正常數(shù)據(jù),即無異常的圖片進行訓練,學生模型學習到正常數(shù)據(jù)集的分布。在測試階段,當輸入為正常數(shù)據(jù)時,學生模型與教師模型的特征分布相近,特征圖差異較小,異常值得分較低,歸類為正常數(shù)據(jù);當輸入為異常數(shù)據(jù)時,由于學生模型沒有學習過異常數(shù)據(jù)的分布情況,與教師模型的特征圖差異較大,異常值得分較高,歸類為異常結果。
在異常檢測算法驗證階段,使用異常圖像進行測試,如圖7(a)所示,圖片中存在工器具遺留異常,對應的人工標注的工器具位置如圖7(b)所示;使用訓練階段得到的異物檢測算法模型,對輸入圖像進行檢測,檢測結果如圖7(c)所示。
圖7 異常檢測算法檢測效果
為了消除由干擾因素造成的誤報,采用滑動窗口算法確定最終結果[13]?;瑒哟翱谒惴ǖ膮?shù)包括滑動窗口長度L、滑動步長S及滑動閾值百分比;滑動閾值百分比的含義為,在長度為L滑動窗口中,異常結果次數(shù)超過閾值比例后,判定該時刻結果為異常。
如圖8所示,設置滑動窗口長度L為3,滑動步長S為2,即選取3個連續(xù)時刻的檢測結果進行最終判斷。對于連續(xù)時間段內(nèi)的檢測結果序列,N表示此時刻未檢測到異常,Y表示此時刻檢測出異常。
圖8 滑動窗口示意
在T=0時刻,滑動窗口內(nèi)3次檢測結果均為N,則判斷T=0時刻沒有異常;在T=1時刻,滑動窗口內(nèi)有1次檢測結果為Y,而其余2次結果為N,1次檢測結果為Y可能由誤檢造成,因而判斷T=1時刻沒有異常;在T=2時刻,滑動窗口內(nèi)有2次檢測結果為Y,1次檢測結果為N,則判斷T=2時刻出現(xiàn)了異常。
與傳統(tǒng)異常檢測算法相比,采用無監(jiān)督學習算法無需采集負樣本(即異常情況的圖像),通過對正樣本數(shù)據(jù)進行自動特征提取,即可識別除正常情況之外的異常,提高異常識別的檢出率。在正常樣本數(shù)據(jù)足夠多樣的情況下,該算法可以有效適應光線及天氣等環(huán)境變化情況。同時,可通過多個場景圖像的混合訓練,提高模型泛化能力。
傳統(tǒng)異常檢測算法需手動設計特征提取方法,對形狀輪廓、色彩空間等特征進行異常分析。本文提出的異常檢測算法,通過神經(jīng)網(wǎng)絡自動提取圖像特征,特征提取更為多樣,有利于提高異常檢測的準確率。
在懷化西編組站進行系統(tǒng)部署及測試,該編組站具備中國移動5G公網(wǎng)覆蓋,項目使用的頻段范圍為2515 MHz~2615 MHz,頻率帶寬共100 MHz。
在咽喉區(qū)內(nèi)道岔的基本軌、尖軌、密貼區(qū)和轉轍機等關鍵點安裝超高清4K球機攝像頭,支持30倍光學變焦,通過5G公網(wǎng)接入視頻分析子系統(tǒng)。
由于攝像頭采集的圖像會受光線變化影響,同一位置的圖像在不同時刻、不同天氣條件下也存在差異。為保證檢測模型的魯棒性,設置3個攝像頭采集15個預置位的圖像數(shù)據(jù),每隔5 min采集一組無異常的圖像,連續(xù)采集7天,從而獲取到不同時間段、不同光線條件、不同天氣的樣本數(shù)據(jù),用于模型訓練。
對攝像頭預置位進行異常模擬測試,分別在道岔密貼區(qū)放置石塊,在軌道內(nèi)放置工具,打開轉轍機的箱蓋。部分預置位的檢測結果如圖9所示,左側為輸入圖片,右側為檢測結果圖,以熱力圖表示異常的分值,紅色矩形框表示異常區(qū)域。
圖9 異常檢測結果示例
當圖像中存在工器具、轉轍機箱蓋未閉合等異常時,均可由該系統(tǒng)正確地檢測出來。
在系統(tǒng)應用過程中發(fā)現(xiàn):(1)視頻傳輸過程中偶爾會出現(xiàn)丟幀花屏現(xiàn)象(如圖10所示),異常檢測算法會將其識別為異常,從而產(chǎn)生誤報;(2)攝像頭夜間采用紅外補光,輸出灰度圖像,大大降低了異常識別的準確度。
圖10 花屏產(chǎn)生誤報
本文針對編組站咽喉區(qū)存在的道岔異物入侵、工器具遺留等安全風險,研究開發(fā)了基于5G的編組站咽喉區(qū)異常檢測系統(tǒng)。借助現(xiàn)有的運營商5G網(wǎng)絡,實現(xiàn)了咽喉區(qū)視頻監(jiān)控數(shù)據(jù)的采集;運用知識蒸餾技術,采用無監(jiān)督學習算法框架,實現(xiàn)咽喉區(qū)非確定性異常識別和定位功能。異常檢測算法具有通用性和泛化能力,可適應不同道岔場景,不受光線、陰影、環(huán)境變化影響,具有精度高、泛化能力強、魯棒性好的特點,在現(xiàn)場測試驗證過程中取得較為滿意的效果。
后續(xù)將針對現(xiàn)有問題,重點研究解決花屏現(xiàn)象的識別和預防問題,降低誤報率;同時,通過物理補光和優(yōu)化異常檢測算法,提高系統(tǒng)在夜間的異常識別能力。