蔡靜嫻,畢江海,王繼軍,張望,夏文?,余建安
(1. 浙江大學(xué) 臺(tái)州研究院,浙江 臺(tái)州 318000;2. 中國(guó)鐵建電氣化局集團(tuán)有限公司,北京 100000;3. 中鐵建電氣化局集團(tuán)第三工程有限公司,河北 高碑店 074003;4. 中鐵建電氣化局集團(tuán)運(yùn)營(yíng)管理有限公司,湖北 襄陽(yáng) 441100)
近年來(lái),隨著人工智能技術(shù)在各行業(yè)的廣泛應(yīng)用,融合AI(Artificial Intelligence)的智慧建造已逐漸成為軌道交通建設(shè)轉(zhuǎn)型升級(jí)的必然趨勢(shì)[1]。信號(hào)工程是鐵路“四電”工程之一,需定測(cè)信號(hào)機(jī)等軌旁設(shè)備的安裝位置并測(cè)量限界數(shù)據(jù)。傳統(tǒng)的人工現(xiàn)場(chǎng)勘查方式存在測(cè)量精度差、勞動(dòng)效率低下等問(wèn)題,也不利于今后“四電”工程的全面數(shù)字化轉(zhuǎn)型。為解決上述問(wèn)題,研發(fā)一種可自主移動(dòng)的便攜式信號(hào)工程數(shù)據(jù)定測(cè)及檢測(cè)裝置,代替人工操作對(duì)軌旁設(shè)備進(jìn)行自動(dòng)識(shí)別和測(cè)量,大幅提升作業(yè)效率和精度,已成為鐵路電氣化施工企業(yè)亟需解決的課題。自動(dòng)識(shí)別軌旁設(shè)備技術(shù)是實(shí)現(xiàn)自動(dòng)測(cè)量的前提條件。目前,國(guó)內(nèi)對(duì)于軌旁設(shè)備的目標(biāo)檢測(cè)主要應(yīng)用于巡檢。吳楠[2]利用機(jī)器視覺(jué)圖像對(duì)比自動(dòng)檢測(cè)電務(wù)軌旁設(shè)備變化,但圖像對(duì)比需要采集大量原始圖像,且采集到的圖像易受設(shè)備硬件與外界環(huán)境影響。深度學(xué)習(xí)是新一代人工智能的核心技術(shù),融合深度學(xué)習(xí)的機(jī)器視覺(jué)更加智能化且具有更好的泛化性?;谏疃葘W(xué)習(xí)的常用目標(biāo)檢測(cè)算法可分為2個(gè)大類,一是基于候選區(qū)域的two-stage算法,例如R-CNN系列,該類算法檢測(cè)和定位精度較高,但計(jì)算量大,檢測(cè)速度的提升受到約束;二是基于回歸的one-stage算法,常見的有YOLO系列和SSD,該類算法在檢測(cè)速度上占優(yōu),可滿足實(shí)時(shí)檢測(cè)的需求,但對(duì)于小目標(biāo)和多目標(biāo)檢測(cè)精度較低[3]。Faster R-CNN算法已被廣泛應(yīng)用于多種場(chǎng)景的目標(biāo)檢測(cè)。為實(shí)現(xiàn)輸電線路無(wú)人機(jī)巡檢圖像多目標(biāo)檢測(cè)及定位,林剛等[4]提出了一種改進(jìn)型的Faster R-CNN模型,采用選擇性搜索算法建立巡檢圖像樣本庫(kù),優(yōu)化模型訓(xùn)練過(guò)程中的參數(shù)學(xué)習(xí),在損失函數(shù)中加入正則項(xiàng)優(yōu)化模型參數(shù)權(quán)重,該模型具有較好的泛化能力。馬靜怡等[5]使用DenseNet作為特征提取網(wǎng)絡(luò)并修改定位框計(jì)算方式,使得改進(jìn)后的Faster RCNN模型在監(jiān)測(cè)變電站小目標(biāo)入侵時(shí)具有更高的準(zhǔn)確度。在農(nóng)業(yè)應(yīng)用方面,彭明霞等[6]將金字塔特征網(wǎng)絡(luò)引入Faster R-CNN算法,優(yōu)化了網(wǎng)絡(luò)結(jié)構(gòu),高效識(shí)別棉田雜草從而進(jìn)一步精確除草。馮小雨等[7]將Faster R-CNN運(yùn)用于防空武器空中目標(biāo)檢測(cè),采用膨脹積累和區(qū)域放大策略改善小目標(biāo)檢測(cè)的精準(zhǔn)度,被大面積遮擋的目標(biāo)檢測(cè)精準(zhǔn)度則通過(guò)局部標(biāo)注和時(shí)空上下文策略改善,同時(shí)減少候選區(qū)域數(shù)量提高檢測(cè)速率。白堂博等[8]應(yīng)用Faster R-CNN算法進(jìn)行鐵路扣件定位,并根據(jù)扣件信息調(diào)整錨框進(jìn)而提高計(jì)算速度。本文以自動(dòng)測(cè)量裝置在鐵軌上自主移動(dòng)運(yùn)行過(guò)程中拍攝到的軌旁設(shè)備作為研究對(duì)象,應(yīng)用深度學(xué)習(xí)目標(biāo)檢測(cè)算法Faster R-CNN對(duì)多種常見的軌旁設(shè)備進(jìn)行自動(dòng)識(shí)別,以改進(jìn)的ResNet50為骨干網(wǎng)絡(luò),引入特征金字塔算法,進(jìn)一步提高檢測(cè)精度。最終將訓(xùn)練的最優(yōu)模型結(jié)果導(dǎo)入C++平臺(tái),供信號(hào)工程數(shù)據(jù)自動(dòng)測(cè)量裝置調(diào)取應(yīng)用。
光學(xué)配件主要為工業(yè)相機(jī)和工業(yè)鏡頭,其主要功能為拍攝檢測(cè)區(qū)域的圖像。光學(xué)系統(tǒng)的設(shè)計(jì)[9]決定了圖像的采集質(zhì)量,進(jìn)而影響檢測(cè)算法的效率與效果,是系統(tǒng)設(shè)計(jì)時(shí)需重點(diǎn)考慮的因素之一。光學(xué)系統(tǒng)設(shè)計(jì)主要包括相機(jī)、鏡頭以及光源3個(gè)部分。鏡頭焦距f可以通過(guò)式(1)得到:
式中:D為工作距離;W和w分別為視場(chǎng)(FOV)的寬度和圖像傳感器靶面的寬度。
現(xiàn)有視場(chǎng)FOV(W×H)為2 500 mm×2 000 mm,工作距離D為2 400 mm,相機(jī)采用??低昅VCA013-21UC,分辨率為1 280×1 024,像元尺寸為4.8 μm×4.8 μm,則w計(jì) 算 可 得 為1 280×4.8=6.144 mm,求得f為5.898 mm,故選擇鏡頭焦距為6 mm的鏡頭。
本文的軌旁設(shè)備數(shù)據(jù)集類別包括扼流變壓箱(BEX),電纜分向盒(HF),電纜終端盒(HZ),變壓器箱(XB)和信號(hào)機(jī)(light),各個(gè)設(shè)備的實(shí)物外觀如圖1所示。
為避免訓(xùn)練數(shù)據(jù)不足帶來(lái)的過(guò)擬合問(wèn)題,對(duì)所有數(shù)據(jù)集進(jìn)行擴(kuò)充,使用的增強(qiáng)方式有對(duì)比度調(diào)整、色調(diào)變化、左右鏡像、旋轉(zhuǎn)180度以及隨機(jī)裁剪等。將增強(qiáng)后數(shù)據(jù)集分為訓(xùn)練集和驗(yàn)證集,將這些圖像及對(duì)應(yīng)的標(biāo)簽輸入至網(wǎng)絡(luò)模型。經(jīng)處理后總共有729張圖片,每張圖片中含有一個(gè)或多個(gè)目標(biāo)類別,具體標(biāo)簽樣本數(shù)據(jù)量如表1所示。
表 1 樣本數(shù)據(jù)量分布情況Table1 Distribution of sample data volume
Faster R-CNN算 法[10]是GIRSHICK于2016年在R-CNN和Fast R-CNN基礎(chǔ)上提出的一種改進(jìn)型算法,其主要思路是將特征提取、候選框提取、目標(biāo)定位和目標(biāo)分類整合到了一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)中,優(yōu)化了候選框生成方式,實(shí)現(xiàn)了端對(duì)端訓(xùn)練,使檢測(cè)速度和精度有所提高,其網(wǎng)絡(luò)結(jié)構(gòu)框圖如圖2所示。首先,將原始圖像輸入到特征提取網(wǎng)絡(luò)中產(chǎn)生相應(yīng)的特征圖,再運(yùn)用RPN(Region Proposal Network)網(wǎng)絡(luò)生成候選框。采用n×n滑動(dòng)窗口在特征圖上移動(dòng),滑動(dòng)窗口的中心點(diǎn)映射回原圖,在對(duì)應(yīng)的每個(gè)位置預(yù)測(cè)k個(gè)錨(Anchors),即初始候選區(qū)域。通過(guò)邊框分類與回歸進(jìn)行篩選和修正候選區(qū)域,提取候選框及相應(yīng)的特征矩陣。為提高后續(xù)的處理速度,RoI Pooling層將不同尺寸的特征矩陣通過(guò)最大池化操作縮放到相同大小,得到輸出矩陣經(jīng)過(guò)全連接層展平之后,再輸入分類器和回歸網(wǎng)絡(luò),進(jìn)一步得到更準(zhǔn)確的目標(biāo)預(yù)測(cè)框。
本文采用ResNet殘差網(wǎng)絡(luò)作為骨干網(wǎng)絡(luò)來(lái)進(jìn)行特征提取,代替原算法中的VGG16網(wǎng)絡(luò)。在卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)層數(shù)越多,提取的特征越抽象,機(jī)器學(xué)習(xí)的能力越強(qiáng)。ResNet網(wǎng)絡(luò)通過(guò)引入殘差塊的概念,解決了隨著網(wǎng)絡(luò)層數(shù)增加帶來(lái)的準(zhǔn)確率飽和或下降的退化問(wèn)題,從而提高準(zhǔn)確率[11]。綜合考慮訓(xùn)練速度與檢測(cè)精度,選擇層數(shù)為50的ResNet50作為骨干網(wǎng)絡(luò)。
ResNet50網(wǎng)絡(luò)流程框架如圖3所示。當(dāng)模塊(如Stage5)輸入與輸出大小和通道數(shù)不同時(shí),需先進(jìn)行下采樣和升維操作。Bottleneck1模塊路徑a上采用步長(zhǎng)為2的1×1卷積進(jìn)行下采樣,忽略了3/4的輸入特征映射,為確保信息盡可能不被忽略,故將原始ResNet50的下采樣部分改造為ResNet50-D[12],即在卷積前加入一個(gè)步長(zhǎng)為2的2×2平均池化層,可避免步長(zhǎng)2與1×1同時(shí)出現(xiàn)造成的信息忽略。
由于實(shí)際現(xiàn)場(chǎng)采集到的圖像目標(biāo)尺寸差異較大,而原論文的Faster R-CNN算法只對(duì)多次下采樣后的Stage5輸出的特征圖進(jìn)行RoI Pooling操作,小目標(biāo)的特征無(wú)法被有效提取。為提高小目標(biāo)檢測(cè)的準(zhǔn)確度,引入Feature Pyramid Networks (FPN)算法,即特征金字塔網(wǎng)絡(luò)算法[13]。
如圖4所示,將骨干網(wǎng)絡(luò)輸出的多層特征層(C2~C5),每一層進(jìn)行2倍上采樣后,逐一疊加低層特征層,融合不同尺度的特征從而彌補(bǔ)低層特征信息表達(dá)不足的問(wèn)題,增強(qiáng)大小目標(biāo)檢測(cè)精度。最終產(chǎn)生的不同尺寸的特征圖(P2~P5)用來(lái)作為下一步RPN目標(biāo)檢測(cè)的輸入。
引入FPN算法之后的Faster R-CNN算法框架如圖5所示。將原圖輸入模型中,首先通過(guò)骨干網(wǎng)絡(luò)ResNet50-D進(jìn)行特征提取,輸出4個(gè)不同尺寸的特征圖(C2~C5)。4個(gè)特征圖輸入FPN網(wǎng)絡(luò),進(jìn)一步得到5個(gè)不同尺寸的特征圖(P2~P6),其通道數(shù)均為256,其中P6為P5降采樣所得。RPN對(duì)每個(gè)特征圖進(jìn)行預(yù)測(cè)候選框,將得到的所有候選框(N2~N6)合并操作,利用非極大值抑制算法(Non-Maximum Suppression, NMS)刪除冗余度較高的候選框。得到的候選框先通過(guò)RoIAlign操作轉(zhuǎn)換成相同大小,再與特征圖(P2~P5)一同進(jìn)入Fast R-CNN網(wǎng)絡(luò),對(duì)候選框進(jìn)一步調(diào)整,最終生成預(yù)測(cè)結(jié)果。
損失函數(shù)可用來(lái)評(píng)估模型和優(yōu)化參數(shù),F(xiàn)aster R-CNN網(wǎng)絡(luò)結(jié)構(gòu)中包含了RPN Loss和R-CNN Loss對(duì)應(yīng)的分類損失和回歸損失。RPN網(wǎng)絡(luò)損失公式定義為:
其中:pi為第i個(gè)anchor預(yù)測(cè)為真實(shí)標(biāo)簽的概率;pi*正樣本時(shí)為1,負(fù)樣本時(shí)為0;ti為第i個(gè)anchor的邊界框回歸參數(shù);ti*為第i個(gè)anchor對(duì)應(yīng)的真實(shí)框的回歸參數(shù);Ncls=256,其中正負(fù)樣本各128;Nreg=52×52=2 704。
本文中,RPN分類損失函數(shù)采用了Sigmoid Cross Entropy函數(shù),即經(jīng)過(guò)Sigmoid函數(shù)激活之后的交叉熵函數(shù)。該函數(shù)可適用于多類別相互獨(dú)立但不相互排斥的情況,如一張圖片中可同時(shí)包含多種軌旁設(shè)備。參數(shù)xi經(jīng)Sigmoid函數(shù)映射得到輸出在(0,1)之間的概率pi,再用得到的pi值計(jì)算分類損失,公式見式(3)和式(4):
位置回歸損失函數(shù)均采用SmoothL1Loss函數(shù)。具體的計(jì)算公式見式(5)和式(6):
本文采用了針對(duì)梯度優(yōu)化的Momentum優(yōu)化器[14]。隨機(jī)梯度下降法在迫近局部最優(yōu)解時(shí),由于方向與步長(zhǎng)沒(méi)有自適應(yīng)調(diào)節(jié),當(dāng)每一次前向計(jì)算后,反向傳播更新權(quán)值參數(shù),容易陷入震蕩,即減慢訓(xùn)練速度,同時(shí)降低訓(xùn)練效果。因此,在反向傳播更新權(quán)值時(shí),引入動(dòng)量Momentum優(yōu)化算法,通過(guò)指數(shù)滑動(dòng)平均處理,將之前迭代過(guò)程的累計(jì)步長(zhǎng)信息添加權(quán)重并與當(dāng)前步長(zhǎng)相加,獲得新的學(xué)習(xí)率參數(shù),其中累計(jì)步長(zhǎng)信息權(quán)重取0.9。通過(guò)累積之前的步長(zhǎng)與梯度,自適應(yīng)更新權(quán)值,加速收斂和減小震蕩,提高訓(xùn)練效果。
同時(shí),為了減少數(shù)據(jù)較少對(duì)骨干網(wǎng)絡(luò)訓(xùn)練結(jié)果的影響,提高模型的泛化性,對(duì)骨干網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練處理。預(yù)訓(xùn)練學(xué)習(xí)率更新方案采用余弦退火策略[15]。余弦退火學(xué)習(xí)率策略,會(huì)在訓(xùn)練過(guò)程中隨著迭代次數(shù)增加,周期性更新學(xué)習(xí)率。第1階段學(xué)習(xí)率按照余弦函數(shù)的梯度下降,當(dāng)學(xué)習(xí)率下降到設(shè)定的最低值時(shí),進(jìn)入第2階段,垂直恢復(fù)到初始值,進(jìn)行下一次迭代。在訓(xùn)練初期學(xué)習(xí)率較大,加快模型更新,快速跳出平坦的局部最優(yōu)點(diǎn),在靠近全局最優(yōu)點(diǎn)時(shí),減小學(xué)習(xí)率,通過(guò)這樣的策略使得模型最終收斂到一個(gè)好的訓(xùn)練效果。
本實(shí)驗(yàn)在Window 10的64位系統(tǒng)上進(jìn)行,處理器為酷睿i5-8400,內(nèi)存24G,顯卡為GTX 1080Ti。利用Pycharm進(jìn)行編程,利用深度學(xué)習(xí)框架Paddlepaddle 1.8和PadlleX 1.2.8來(lái)搭建和訓(xùn)練模型,并使用顯卡進(jìn)行訓(xùn)練與推理,最后將生成的模型通過(guò)C++部署到Visual Studio 2017上面,進(jìn)行系統(tǒng)的實(shí)時(shí)運(yùn)行處理。
訓(xùn)練過(guò)程中,迭代次數(shù)、批量樣本數(shù)(Batch Size, BS)和學(xué)習(xí)率等超參數(shù)的設(shè)置對(duì)模型的訓(xùn)練結(jié)果和性能有較大的影響。學(xué)習(xí)率采用階梯式衰減方法。迭代初期學(xué)習(xí)率較大,可快速進(jìn)行梯度下降,為避免在全局最優(yōu)點(diǎn)附近擺蕩,迭代后期減小學(xué)習(xí)率。對(duì)于Faster R-CNN模型,圖6(a)表示的是在現(xiàn)有實(shí)驗(yàn)條件下,批量樣本數(shù)為2時(shí)訓(xùn)練過(guò)程中Loss的變化。圖6(b)則是批量樣本數(shù)為16時(shí)Loss的變化??梢娕繕颖緮?shù)較小時(shí),迭代梯度震蕩較為嚴(yán)重,不利于模型收斂。但批量樣本數(shù)較大時(shí),Loss下降較緩,容易使模型陷入局部最優(yōu)解,且批量樣本數(shù)過(guò)大會(huì)直接造成顯存不足。圖7表示的是當(dāng)批量樣本數(shù)為2,8和16時(shí),同一模型訓(xùn)練所得的mAP隨迭代次數(shù)變化的情況。批量樣本數(shù)越小,所需的迭代次數(shù)越少,且批量樣本數(shù)為16時(shí)所得的最大mAP較小。故選擇批量樣本數(shù)為8,迭代次數(shù)為30進(jìn)行Faster R-CNN模型優(yōu)化訓(xùn)練。
3.2.1 評(píng)價(jià)方法
為評(píng)價(jià)本文提出的算法模型的各個(gè)性能和對(duì)比不同算法的差異性,采用檢測(cè)速度、精確率(Precision)、分類召回率(Recall)、某一類別的平均精準(zhǔn)率(Average Precision,AP)和所有類別的平均精準(zhǔn)度(mean Average Precision,mAP)來(lái)進(jìn)行模型的性能評(píng)估。上述檢測(cè)性能指標(biāo)的參數(shù)定義公式見式(7)~式(10):
式(9)中:R表示Recall,P表示Precision。IoU表示預(yù)測(cè)框與真實(shí)框的相交面積和相并面積之比。程序生成的候選框中的預(yù)測(cè)樣本可分為正樣本和負(fù)樣本,其中,正樣本是與人工標(biāo)注的真實(shí)框IoU值大于閾值的樣本,小于閾值的則為負(fù)樣本。預(yù)測(cè)結(jié)果可分為4類,被預(yù)測(cè)為正的正樣本(TP)、被預(yù)測(cè)為正的負(fù)樣本(FP)、被預(yù)測(cè)為負(fù)的負(fù)樣本(TN)和被預(yù)測(cè)為負(fù)的正樣本(FN)。
3.2.2 不同算法對(duì)比
為驗(yàn)證Faster R-CNN算法模型的可靠性,與一階YOLO算法進(jìn)行對(duì)比。各個(gè)模型對(duì)應(yīng)的mAP值與檢測(cè)速度如表2所示。對(duì)比實(shí)驗(yàn)數(shù)據(jù),YOLO算法的檢測(cè)速度明顯優(yōu)于二階的Faster R-CNN算法。其中,基于YOLOv3改進(jìn)的PPYOLO算法速度最快,達(dá)到了24.84幀每秒,且精準(zhǔn)度優(yōu)于YOLOv3。但進(jìn)一步觀察輸出的圖像識(shí)別結(jié)果,發(fā)現(xiàn)YOLO模型易忽略小尺寸目標(biāo),造成目標(biāo)漏測(cè),而工程應(yīng)用中需避免漏測(cè)。
表2 不同目標(biāo)檢測(cè)模型結(jié)果對(duì)比Table 2 Results of different target detection models
對(duì)于Faster R-CNN算法,VGG16為骨干網(wǎng)絡(luò)時(shí),mAP最低。對(duì)比模型5~7,可發(fā)現(xiàn)骨干網(wǎng)絡(luò)層數(shù)越多,精度越高,但檢測(cè)速度隨之下降,采用層數(shù)較多的ResNet101為骨干網(wǎng)絡(luò)的模型mAP達(dá)到了96.2%,比采用ResNet18的模型提高了2.6%,但相對(duì)ResNet50的模型提高不明顯,且每秒僅能處理7.65幀。而本文提出的改進(jìn)模型Faster R-CNN[ResNet50-D]+FPN的精確度達(dá)到了97.46%,比ResNet50高1.4%,且每秒可處理10.87幀圖像,達(dá)到軌旁設(shè)備識(shí)別要求,故而選擇該模型為主框架。
3.2.3 不同參數(shù)對(duì)比
Faster R-CNN模型初步預(yù)測(cè)會(huì)產(chǎn)生大量的候選預(yù)測(cè)框,NMS算法會(huì)根據(jù)設(shè)置的置信度閾值和IoU閾值來(lái)過(guò)濾多余的候選框,篩選出最終候選框。置信度閾值和IoU閾值的設(shè)定通過(guò)多組實(shí)驗(yàn)對(duì)比得出。實(shí)驗(yàn)結(jié)果如圖8所示,圖中縱坐標(biāo)表示模型訓(xùn)練得到的mAP值。實(shí)線表示置信度設(shè)定為0.5,不同IoU閾值的模型訓(xùn)練所得結(jié)果;虛線表示IoU設(shè)定為0.5,不同置信度閾值的模型訓(xùn)練所得結(jié)果。結(jié)果表明,當(dāng)IoU閾值為0.4,置信度閾值為0.5時(shí),訓(xùn)練所得的模型具有較高的精準(zhǔn)度,mAP達(dá)到97.6%。
3.2.4 最終模型評(píng)估結(jié)果
選取以ResNet50-D為骨干網(wǎng)絡(luò)的Faster R-CNN模型作為最終模型,得到各類別軌旁設(shè)備識(shí)別的結(jié)果如表3所示。結(jié)果顯示,模型對(duì)于BEX與Light這2類目標(biāo)在當(dāng)前測(cè)試數(shù)據(jù)集中的識(shí)別準(zhǔn)確率達(dá)到了100%,另外3類識(shí)別精度均達(dá)到了工程應(yīng)用水平。
表3 最終模型檢測(cè)各類軌旁設(shè)備實(shí)驗(yàn)結(jié)果Table 3 Final results of each trackside equipment
為驗(yàn)證模型的泛化性和魯棒性,將72張圖片進(jìn)行特殊化處理,包括旋轉(zhuǎn)、改變對(duì)比度和色調(diào)、添加噪聲等,使用生成的最終模型對(duì)其進(jìn)行檢測(cè),準(zhǔn)確度達(dá)到98%。圖9為其中2張圖片識(shí)別結(jié)果,左圖中為標(biāo)識(shí)的真實(shí)框,右圖中為模型輸出的預(yù)測(cè)框,所有設(shè)備均能準(zhǔn)確被識(shí)別。
將最佳模型量化、壓縮成最小優(yōu)化模型,即可在新的圖像上進(jìn)行推理。得到檢測(cè)模型之后,將模型導(dǎo)入檢測(cè)裝置內(nèi)的C++平臺(tái),并打包為DLL文件提供上位機(jī)調(diào)用。上位機(jī)界面使用了C#語(yǔ)言編寫而成,包含控制相機(jī)采集圖像、調(diào)用算法模型、獲得軌旁設(shè)備類別及位置信息。圖10是研發(fā)完成的便攜式信號(hào)工程數(shù)據(jù)定測(cè)及檢測(cè)裝置的工程樣機(jī),以及樣機(jī)在興泉鐵路泉州段草源站進(jìn)行現(xiàn)場(chǎng)測(cè)試的圖片。
測(cè)試運(yùn)行過(guò)程中采集的圖像和目標(biāo)識(shí)別結(jié)果,如圖11所示,圖中所有軌旁設(shè)備均能被有效識(shí)別。實(shí)驗(yàn)可得,該裝置可實(shí)現(xiàn)軌旁設(shè)備的自動(dòng)識(shí)別,結(jié)合裝置采集到的位置信息和限界數(shù)據(jù),進(jìn)而實(shí)現(xiàn)對(duì)各個(gè)軌旁設(shè)備安裝位置檢測(cè)和限界數(shù)據(jù)檢測(cè)。
1) 為解決鐵路電氣化工程建設(shè)過(guò)程中人工勘察軌旁設(shè)備安裝位置及其限界數(shù)據(jù)不便的問(wèn)題,研發(fā)一種便攜式鐵路信號(hào)工程數(shù)據(jù)定測(cè)及檢測(cè)裝置,通過(guò)該裝置結(jié)合機(jī)器視覺(jué)技術(shù)實(shí)現(xiàn)各種軌旁設(shè)備的自動(dòng)識(shí)別。
2) 以Faster R-CNN為基礎(chǔ),提出一種應(yīng)用于軌旁設(shè)備多目標(biāo)檢測(cè)的算法。該算法基于骨干網(wǎng)絡(luò)為ResNet50-D的Faster R-CNN目標(biāo)識(shí)別框架,并且融合了FPN網(wǎng)絡(luò)以提高小目標(biāo)的識(shí)別準(zhǔn)確性。算法具有較高識(shí)別精度,更滿足實(shí)際應(yīng)用需求。
3) 軌旁設(shè)備識(shí)別可應(yīng)用于除鐵路之外的其他軌道交通方式,如地鐵和輕軌等,也可應(yīng)用于軌道交通日常運(yùn)維所需的巡檢任務(wù)。