盛良, 張克永, 張文軒, 楊志鵬
(1.中國國家鐵路集團有限公司鐵路基礎(chǔ)設(shè)施檢測中心,北京 100081;2.中國國家鐵路集團有限公司工電部,北京 100844;3.中國鐵道科學(xué)研究院集團有限公司基礎(chǔ)設(shè)施檢測研究所,北京 100081)
接觸網(wǎng)是由接觸懸掛、支持裝置、定位裝置、支柱與基礎(chǔ)等主要部分組成,包含吊弦、定位線夾、終端錨固線夾、中心錨結(jié)裝置等眾多零部件的復(fù)雜大型結(jié)構(gòu)體[1-2]。由于長期處于風(fēng)、雨、雪、霧、高低溫、強光照、沙塵、鹽污等復(fù)雜外部環(huán)境中,并經(jīng)受列車受電弓高頻振動和大載流電氣作用,其結(jié)構(gòu)中各零部件的安全可靠運行,對電氣化鐵路運營秩序和安全運輸發(fā)揮著重要保障作用。
接觸網(wǎng)狀態(tài)檢測監(jiān)測裝置(簡稱4C裝置)是電氣化鐵路供電安全檢測監(jiān)測系統(tǒng)(簡稱6C系統(tǒng))的重要組成部分,4C裝置通過對支持裝置、定位裝置、接觸懸掛及附加懸掛等區(qū)域進行高精度定位與高清成像,實現(xiàn)對接觸網(wǎng)零部件外觀狀態(tài)的快速采集,并通過圖像智能識別算法實現(xiàn)對零部件完整性、移位、裂損、松脫、異物等缺陷狀態(tài)的自動識別預(yù)警,有效保障了接觸網(wǎng)系統(tǒng)的安全運行。其中,4C裝置圖像智能識別是其發(fā)揮安全保障功能和提高檢測勞效的關(guān)鍵影響因素[3-4]。
文獻[5]梳理了6C系統(tǒng)的發(fā)展歷程和應(yīng)用實踐,并提出4C裝置及其他各型裝置的發(fā)展不足。文獻[6-7]梳理總結(jié)了深度學(xué)習(xí)的技術(shù)優(yōu)勢,以及在計算機視覺中的應(yīng)用前景。文獻[8]采用圖像處理和模式識別等方法,對大量接觸網(wǎng)零部件缺陷圖像的智能識別作了探索性研究。文獻[9-10]探索運用深度學(xué)習(xí)技術(shù)開展圖像智能識別,并在鐵道塞釘智能識別中取得良好運用效果?;谏疃葘W(xué)習(xí)4C裝置圖像智能識別的技術(shù)特點,在分析我國電氣化鐵路接觸網(wǎng)的特征和優(yōu)勢基礎(chǔ)上,研究提出一條可推動4C裝置圖像智能識別技術(shù)持續(xù)發(fā)展的工作路線。
2014年起,隨著高鐵接觸網(wǎng)檢測車(含4C裝置)的分批次集中采購裝配和全路范圍內(nèi)廣泛裝備配屬,4C裝置已基本實現(xiàn)對高速和普速鐵路全覆蓋檢測,全路接觸網(wǎng)零部件結(jié)構(gòu)狀態(tài)檢測工作實現(xiàn)了革命性轉(zhuǎn)變,接觸網(wǎng)養(yǎng)護維修效率得到極大提高,弓網(wǎng)系統(tǒng)運行安全性、可靠性顯著加強。截至2019年底,全國各型4C裝置總計116套。
2018年以來,在中國國家鐵路集團有限公司(簡稱國鐵集團)的統(tǒng)籌指導(dǎo)下,由中國鐵道科學(xué)研究院集團有限公司(簡稱鐵科院集團公司)和設(shè)備供應(yīng)商等相關(guān)技術(shù)力量組成的工作組,經(jīng)過連續(xù)2輪軟件系統(tǒng)優(yōu)化升級,4C裝置圖像智能識別的項目數(shù)量和質(zhì)量均有一定提升。識別項點數(shù)量增加至38個,識別檢出率提高到26.57%。
盡管如此,4C裝置圖像稱4C圖像智能識別效果距離現(xiàn)場需求仍有較大距離。一方面,現(xiàn)有智能識別項點數(shù)量仍然較少,尚不能有效覆蓋主要接觸網(wǎng)類部件,仍需要依賴人工進行缺陷識別分析;另一方面,現(xiàn)有識別算法適應(yīng)能力較差,不能有效適應(yīng)多種形式接觸網(wǎng)零部件結(jié)構(gòu),一定程度上影響了4C裝置功能的全面發(fā)揮。
隨著計算機技術(shù)的發(fā)展,計算能力極大提高,計算成本大幅下降,使基于機器學(xué)習(xí)的圖像智能識別技術(shù)路線發(fā)生了重大轉(zhuǎn)變。基于深度學(xué)習(xí)的智能識別技術(shù)路線,具有算法模型通用、擴展性強、技術(shù)成熟等特點,并且其通過數(shù)據(jù)驅(qū)動方式實現(xiàn)模型參數(shù)優(yōu)化方式,能夠與不斷產(chǎn)生的檢測數(shù)據(jù)結(jié)合,實現(xiàn)算法模型的循環(huán)迭代,形成自生長態(tài)勢,已成為目前甚至今后較長時期內(nèi)圖像智能識別領(lǐng)域的主要技術(shù)路線,也是4C智能識別的主要技術(shù)路線[6-9]。
基于深度學(xué)習(xí)的智能識別技術(shù),其實現(xiàn)效果的好壞主要由算法模型和樣本數(shù)據(jù)決定。一方面,算法模型具有通用、擴展性強、技術(shù)成熟等特點,但其技術(shù)的提升依賴行業(yè)發(fā)展,更新?lián)Q代周期相對較長;而用于算法模型參數(shù)優(yōu)化訓(xùn)練的樣本數(shù)據(jù),由于數(shù)據(jù)規(guī)模可以通過科學(xué)分類、廣泛匯集和持續(xù)積累等方式實現(xiàn)快速成倍增長,故其發(fā)展不依賴某項技術(shù)的發(fā)展,并且隨著使用自然增長,發(fā)展成本低。另一方面,算法模型參數(shù)的構(gòu)建與優(yōu)化訓(xùn)練專業(yè)性強,應(yīng)主要依靠科研或社會專業(yè)技術(shù)力量;而樣本數(shù)據(jù)的增長專業(yè)性相對弱,在鐵路行業(yè)內(nèi)部的日常檢測工作中即可實現(xiàn)。綜合以上分析,從鐵路行業(yè)內(nèi)部可開展工作的角度出發(fā),樣本數(shù)據(jù)的持續(xù)擴大是推動智能識別技術(shù)進步的關(guān)鍵。
我國高速鐵路接觸網(wǎng)具有結(jié)構(gòu)形式多樣,并且高鐵線路由多個鐵路局集團公司、站段分別運管的特點。一方面,由于接觸網(wǎng)結(jié)構(gòu)形式、零部件類型等差異較大,使全路集中研發(fā)一套適應(yīng)所有結(jié)構(gòu)形式接觸網(wǎng)的智能識別算法十分艱難。另一方面,由于每個站段或鐵路局集團公司通常運管多條接觸網(wǎng)結(jié)構(gòu)形式不同的線路,并且每種結(jié)構(gòu)形式的接觸網(wǎng)里程長度僅為各條線路的1個區(qū)段,使得以各鐵路局集團公司分散開展研發(fā)適應(yīng)各自管內(nèi)所有線路的智能識別算法工作所需樣本數(shù)據(jù)規(guī)模不足、資金和研發(fā)力量分散。也就是說,倘若樣本數(shù)據(jù)充分,通過集中資金和研發(fā)力量,針對不同結(jié)構(gòu)形式接觸網(wǎng)甚至分線路分別研發(fā)智能識別算法,將具有更高的經(jīng)濟性。
我國高速鐵路的優(yōu)勢之一是路網(wǎng)規(guī)模龐大。一方面,我國幅員遼闊,單線里程超過1 000 km的高鐵線路占比較大,使針對特定線路研發(fā)獨立智能識別算法的工作具有樣本數(shù)據(jù)規(guī)模的保障。另一方面,我國路網(wǎng)線路眾多,多條線路采用同種形式接觸網(wǎng)的情況較多,這意味著該種形式接觸網(wǎng)的樣本數(shù)據(jù)規(guī)模將進一步成倍擴大,使針對不同形式接觸網(wǎng)分別研發(fā)獨立的智能識別算法的工作具有更高的可行性。但發(fā)揮路網(wǎng)規(guī)模優(yōu)勢的前提是消除不同鐵路局集團公司及站段間樣本數(shù)據(jù)之間的屬性差異,即全路4C圖像缺陷樣本數(shù)據(jù)實現(xiàn)統(tǒng)一編碼規(guī)則。
當(dāng)前,4C裝置圖像數(shù)據(jù)分析工作仍主要依靠人工,并且已經(jīng)獲得了大量有價值的缺陷圖像樣本數(shù)據(jù)。但由于各鐵路局集團公司及站段間對于接觸網(wǎng)結(jié)構(gòu)狀態(tài)的缺陷定義和歸檔標(biāo)準(zhǔn)不統(tǒng)一,造成相當(dāng)多的缺陷圖像樣本數(shù)據(jù)限制在鐵路局集團公司甚至站段機構(gòu)的小范圍內(nèi),無法形成全路大數(shù)據(jù)圖庫,影響全路規(guī)模優(yōu)勢的發(fā)揮,是當(dāng)前4C裝置智能識別技術(shù)發(fā)展緩慢的重要原因。同時,由于全路尚未建成分類科學(xué)、數(shù)據(jù)規(guī)模足夠的4C圖像缺陷樣本數(shù)據(jù)庫,使得按照不同類型或線路接觸網(wǎng)開發(fā)特定智能識別算法的主要成本集中在圖像缺陷樣本數(shù)據(jù)的整理,而非算法優(yōu)化和模型參數(shù)訓(xùn)練,這是目前4C裝置智能識別技術(shù)堅持使用一套算法的主要原因,也是社會技術(shù)力量長期難以有效被引進的關(guān)鍵因素。
我國高速鐵路接觸網(wǎng)的結(jié)構(gòu)形式多樣,路網(wǎng)規(guī)模龐大,擁有世界其他國家和地區(qū)無法比擬的優(yōu)勢。如何將該優(yōu)勢與相關(guān)技術(shù)發(fā)展結(jié)合,并轉(zhuǎn)變?yōu)檠b備技術(shù)、數(shù)據(jù)運用等可全面提升的有形資產(chǎn),形成其他國家或地區(qū)無法超越的技術(shù)制高點,是6C系統(tǒng)各項工作必須思考和回答的問題?;谏疃葘W(xué)習(xí)的4C裝置智能識別技術(shù),可通過樣本數(shù)據(jù)規(guī)模的擴大驅(qū)動智能識別模型參數(shù)不斷優(yōu)化,使智能識別效果持續(xù)提高,具有發(fā)揮我國路網(wǎng)規(guī)模優(yōu)勢的條件。
可根據(jù)接觸網(wǎng)結(jié)構(gòu)形式分類(甚至分線)制定全路統(tǒng)一的接觸網(wǎng)結(jié)構(gòu)狀態(tài)描述標(biāo)準(zhǔn),消除各鐵路局集團公司及站段之間的4C圖像缺陷樣本屬性差異,進一步根據(jù)統(tǒng)一標(biāo)準(zhǔn)要求,將全路各鐵路局集團公司、站段已經(jīng)產(chǎn)生和即將產(chǎn)生的4C圖像缺陷樣本數(shù)據(jù)規(guī)范統(tǒng)一,利用6C系統(tǒng)數(shù)據(jù)中心進行全路歸集并形成大數(shù)據(jù)庫,建立起我國4C圖像缺陷樣本數(shù)據(jù)的路網(wǎng)規(guī)模優(yōu)勢。之后,通過將智能識別算法模型的訓(xùn)練優(yōu)化工作,集中上移至全路4C圖像大數(shù)據(jù)庫,發(fā)揮我國4C圖像缺陷樣本數(shù)據(jù)的路網(wǎng)規(guī)模優(yōu)勢。
充分發(fā)揮高速鐵路基礎(chǔ)設(shè)施檢測監(jiān)測體系三級檢測機構(gòu)職能作用,構(gòu)建由國鐵集團(檢測中心)、鐵路局集團公司及站段和社會技術(shù)力量組成的技術(shù)發(fā)展生態(tài),建立并發(fā)揮我國路網(wǎng)規(guī)模優(yōu)勢,盤活研發(fā)技術(shù)力量格局,形成4C裝置智能識別技術(shù)的健康、可持續(xù)發(fā)展態(tài)勢(見圖1)。
圖1 4C裝置圖像智能識別技術(shù)發(fā)展路線示意圖
國鐵集團(檢測中心)是實現(xiàn)全路統(tǒng)一,發(fā)揮路網(wǎng)規(guī)模優(yōu)勢的中心。中心負責(zé)將各鐵路局集團公司及站段的4C圖像缺陷樣本數(shù)據(jù)通過6C系統(tǒng)數(shù)據(jù)中心歸集入庫,并根據(jù)技術(shù)需求分別設(shè)立訓(xùn)練圖庫和評定圖庫,用于社會技術(shù)力量研發(fā)智能識別算法的優(yōu)化訓(xùn)練和對訓(xùn)練后的算法模塊進行評定比選,最后經(jīng)綜合比對,將效果和經(jīng)濟性較好的智能識別算法模塊向全路高鐵接觸網(wǎng)檢測車和高鐵綜合巡檢車(含4C裝置)發(fā)布運用。同時,中心負責(zé)根據(jù)數(shù)據(jù)規(guī)模的增加和智能識別的需求變化,集中資金、分階段、分類型或線路,組織社會技術(shù)力量開展智能識別算法研發(fā)和優(yōu)化工作。可通過公開競賽形式,主動引入社會優(yōu)勢技術(shù)力量開展高速鐵路接觸網(wǎng)4C智能識別算法研發(fā)工作,充分發(fā)揮社會技術(shù)力量。
鐵路局集團公司及站段是4C圖像缺陷樣本數(shù)據(jù)產(chǎn)生的源頭,也是智能識別算法模塊運用的終端,是智能識別工作的服務(wù)主體。路局及站段負責(zé)將4C圖像數(shù)據(jù)按照統(tǒng)一編碼規(guī)則進行編碼和歸檔,同時將國鐵集團(檢測中心)發(fā)布的智能識別算法模塊進行更新和運用。
社會技術(shù)力量(包括4C裝置的設(shè)備供應(yīng)商),是智能識別算法的技術(shù)輸入力量。由于在該發(fā)展生態(tài)中,4C裝置主要作為智能識別算法模塊的搭載平臺,智能識別工作的技術(shù)力量將不再局限為4C裝置的設(shè)備供應(yīng)商,可引入社會優(yōu)秀技術(shù)力量,盤活智能識別研發(fā)力量格局,促進智能識別技術(shù)快速發(fā)展。同時,由于樣本數(shù)據(jù)已按照統(tǒng)一編碼規(guī)則實現(xiàn)編碼和分類,各社會技術(shù)力量的工作將主要集中在算法優(yōu)化和模型參數(shù)訓(xùn)練上,并且模型參數(shù)訓(xùn)練工作將主要集中在國鐵集團(檢測中心)的全路4C圖像庫開展,省去了缺陷樣本數(shù)據(jù)的整理環(huán)節(jié),節(jié)約了技術(shù)力量投入,較大程度降低了智能識別算法研發(fā)成本。
4C圖像缺陷樣本數(shù)據(jù)是在高速鐵路基礎(chǔ)設(shè)施檢測監(jiān)測體系的三級檢測機構(gòu)間流通的2個要素(樣本數(shù)據(jù)和算法模塊,如圖1所示)之一,其實現(xiàn)流通的前提也是路網(wǎng)規(guī)模優(yōu)勢發(fā)揮的前提,是實現(xiàn)數(shù)據(jù)的統(tǒng)一編碼。4C裝置的主要功能是實現(xiàn)接觸網(wǎng)結(jié)構(gòu)狀態(tài)檢測,故其圖像數(shù)據(jù)編碼規(guī)則實為接觸網(wǎng)結(jié)構(gòu)狀態(tài)描述的編碼規(guī)則。
該項工作可根據(jù)4C裝置檢測項目要求,按照接觸網(wǎng)結(jié)構(gòu)特點,分類制定全路統(tǒng)一的接觸網(wǎng)結(jié)構(gòu)狀態(tài)描述編碼規(guī)則?,F(xiàn)階段,可由檢測中心牽頭,組織包括設(shè)備供應(yīng)商、鐵路局集團公司、站段和科研院所在內(nèi)的力量,在充分考慮基于深度學(xué)習(xí)的智能識別技術(shù)路線需要的前提下,并于總結(jié)現(xiàn)階段各鐵路局集團公司、站段及設(shè)備供應(yīng)商已經(jīng)制定的相關(guān)編碼規(guī)范的基礎(chǔ)上,按照逐步深入細化的實施路線,分類梳理全路接觸網(wǎng)的結(jié)構(gòu)特點,根據(jù)接觸網(wǎng)各結(jié)構(gòu)及部件的重要程度,有重點、有層次的細化并分類制定接觸網(wǎng)的結(jié)構(gòu)狀態(tài)編碼規(guī)則。同時,考慮到4C裝置投運以來已經(jīng)產(chǎn)生了大量有價值的圖像缺陷樣本數(shù)據(jù),在完成此項工作基礎(chǔ)上,需盡快規(guī)范已有樣本數(shù)據(jù)并實施全路歸集,避免數(shù)據(jù)資產(chǎn)流失。此外,為保證編碼規(guī)則的科學(xué)性,可通過設(shè)立科研項目,從簡統(tǒng)化接觸網(wǎng)編碼規(guī)則的研究制定入手,逐步深化完善編碼規(guī)則。
根據(jù)上述技術(shù)發(fā)展生態(tài),高鐵接觸網(wǎng)檢測車和高鐵綜合巡檢車(4C裝置)的軟件系統(tǒng)將成為智能識別算法模塊的運用平臺,并且主要集中在軟件系統(tǒng)上。算法模塊是在高速鐵路基礎(chǔ)設(shè)施檢測監(jiān)測體系的三級檢測機構(gòu)間流通的要素之一,但其流通的前提是算法模塊與軟件系統(tǒng)之間接口實現(xiàn)統(tǒng)一。由于算法模塊將按照接觸網(wǎng)結(jié)構(gòu)類型或不同線路獨立研發(fā),各臺4C裝置將可能安裝多個獨立算法模塊,為此需要優(yōu)化軟件系統(tǒng)的算法模塊調(diào)用機制,使智能識別算法模塊的發(fā)布實施和運用更加靈活高效;同時,考慮到推進實施的初期,智能識別功能不能完全取代人工分析,并且人工分析工作也是智能分析結(jié)果的確認(rèn)和重要補充,應(yīng)通過按照統(tǒng)一編碼規(guī)則,優(yōu)化軟件系統(tǒng)人工分析功能,實現(xiàn)4C圖像的接觸網(wǎng)結(jié)構(gòu)狀態(tài)的快速自動化編碼。
4C裝置的高清圖像是實現(xiàn)接觸網(wǎng)結(jié)構(gòu)狀態(tài)檢測的原始數(shù)據(jù),拍攝角度、圖像清晰度等方面不僅影響缺陷圖像樣本質(zhì)量(且可能進一步影響算法模型參數(shù)優(yōu)化訓(xùn)練),也會影響智能識別算法模塊的部署運用效果,是智能識別工作的源頭和基礎(chǔ)。應(yīng)細化研究4C裝置成像質(zhì)量評價項目和方法,最后通過6C評定的方式保障圖像數(shù)據(jù)的源頭質(zhì)量。
(1)當(dāng)前4C裝置圖像智能識別由于識別項點數(shù)量較少、算法適應(yīng)能力較差等原因,仍大量依賴人工進行缺陷識別分析,一定程度上影響其功能的全面發(fā)揮。
(2)基于深度學(xué)習(xí)的智能識別技術(shù)路線的關(guān)鍵在于數(shù)據(jù)驅(qū)動,而我國路網(wǎng)具有規(guī)模龐大的絕對優(yōu)勢,由于各鐵路局集團公司間數(shù)據(jù)編碼標(biāo)準(zhǔn)不統(tǒng)一,造成大量缺陷圖像樣本數(shù)據(jù)限制在鐵路局集團公司機構(gòu)內(nèi),無法形成全路規(guī)模優(yōu)勢,這是當(dāng)前4C裝置智能識別技術(shù)發(fā)展緩慢的重要原因。
(3)以建立全路4C圖像大數(shù)據(jù)庫為基礎(chǔ),構(gòu)建由國鐵集團(檢測中心)、鐵路局集團公司及站段和社會技術(shù)力量組成的技術(shù)發(fā)展生態(tài),不僅實現(xiàn)我國路網(wǎng)規(guī)模優(yōu)勢的建立和發(fā)揮,同時進一步盤活研發(fā)技術(shù)力量格局,形成4C裝置圖像智能識別技術(shù)持續(xù)發(fā)展態(tài)勢。
(4)明確了工作路線的3個關(guān)鍵點:制定統(tǒng)一的缺陷圖像編碼規(guī)則、統(tǒng)一并優(yōu)化算法模塊接口標(biāo)準(zhǔn)和進一步完善成像質(zhì)量評價項目和方法。