董文波,李 晨,熊敏君,田 野,肖 雄,姚巍巍
(株洲中車(chē)時(shí)代電氣股份有限公司,湖南 株洲 412001)
截止2022年底,我國(guó)電氣化鐵路運(yùn)營(yíng)里程已突破11萬(wàn)公里,其中高速鐵路(簡(jiǎn)稱(chēng)“高鐵”)4.2萬(wàn)公里,保障規(guī)模龐大的高鐵運(yùn)營(yíng)安全是我們面臨的重大課題。車(chē)體、輪對(duì)和受電弓等是高鐵系統(tǒng)中重要的零部件,也是動(dòng)車(chē)組的重要組成部分。受電弓是動(dòng)車(chē)組獲取外界電能的唯一途徑,長(zhǎng)期運(yùn)行導(dǎo)致受電弓碳滑板不斷磨損變薄,影響動(dòng)車(chē)組的正常供電甚至導(dǎo)致受電弓拉弧、灼傷剝離等其他故障。輪對(duì)是動(dòng)車(chē)組實(shí)現(xiàn)走行功能的最重要部件,不僅承受著動(dòng)車(chē)組全部的重量,而且還要傳遞動(dòng)車(chē)與鋼軌間的驅(qū)動(dòng)力和制動(dòng)力。當(dāng)輪對(duì)存在磨損時(shí),往往會(huì)給車(chē)輪承軸和鋼軌帶來(lái)巨大的額外沖擊載荷,造成嚴(yán)重的安全隱患。因此,對(duì)高鐵關(guān)鍵零部件進(jìn)行實(shí)時(shí)故障診斷具有重要意義[1-3],其中,對(duì)高鐵關(guān)鍵零部件進(jìn)行快速且準(zhǔn)確的定位是故障診斷的前提。
隨著傳感器技術(shù)的發(fā)展,相機(jī)已成為軌道交通領(lǐng)域運(yùn)用最廣泛的傳感器之一,基于圖像的非接觸式目標(biāo)檢測(cè)方法也在該領(lǐng)域得到廣泛應(yīng)用。以AlexNet[4]為界限,現(xiàn)有的圖像目標(biāo)檢測(cè)算法主要分為傳統(tǒng)方法以及深度學(xué)習(xí)方法。傳統(tǒng)方法通過(guò)“特征提取+目標(biāo)分類(lèi)”完成目標(biāo)檢測(cè)[5-8]。深度學(xué)習(xí)方法根據(jù)檢測(cè)過(guò)程是單階段還是雙階段,又分為基于候選框的目標(biāo)檢測(cè)方法[9-11]及基于回歸的檢測(cè)方法[12-16]。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,現(xiàn)有基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法在檢測(cè)精度與速度上遠(yuǎn)超傳統(tǒng)方法。文獻(xiàn)[17-18]通過(guò)工業(yè)相機(jī)進(jìn)行受電弓數(shù)據(jù)采集,并通過(guò)深度學(xué)習(xí)算法確定受電弓位置。文獻(xiàn)[19-20]采用離線(xiàn)分析的方法,利用目標(biāo)檢測(cè)算法對(duì)采集的輪對(duì)踏面數(shù)據(jù)進(jìn)行缺陷檢測(cè)。這類(lèi)方法在動(dòng)車(chē)組低速運(yùn)行或是數(shù)據(jù)采集裝置與關(guān)鍵零部件相對(duì)靜止的情況下能夠取得較好的檢測(cè)效果;但當(dāng)數(shù)據(jù)采集裝置與關(guān)鍵零部件之間有相對(duì)高速運(yùn)動(dòng)時(shí),則會(huì)由于運(yùn)動(dòng)模糊或幀間視差過(guò)大等問(wèn)題,導(dǎo)致無(wú)法在圖像中準(zhǔn)確地定位關(guān)鍵零部件,難以進(jìn)行實(shí)時(shí)在線(xiàn)檢測(cè)。超高速脈沖相機(jī)能夠?qū)崿F(xiàn)每秒鐘數(shù)萬(wàn)幀的數(shù)據(jù)采集,可以有效避免工業(yè)相機(jī)在相對(duì)高速運(yùn)動(dòng)場(chǎng)景存在的運(yùn)動(dòng)模糊以及幀間視差過(guò)大的問(wèn)題。超高速脈沖相機(jī)的數(shù)據(jù)為由0和1組成的脈沖流,現(xiàn)有的利用脈沖神經(jīng)網(wǎng)絡(luò)(spiking neural network,SNN)進(jìn)行目標(biāo)檢測(cè)的方法主要有基于代理梯度的SNN 訓(xùn)練方法以及基于人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)轉(zhuǎn)SNN的訓(xùn)練方法,但是相較ANN算法,現(xiàn)有SNN算法無(wú)論是在訓(xùn)練難度以及模型部署上,均存在較大的差距,極大地增加了直接利用脈沖數(shù)據(jù)進(jìn)行目標(biāo)檢測(cè)的難度。
針對(duì)上述直接利用工業(yè)相機(jī)以及超高速脈沖相機(jī)對(duì)高鐵關(guān)鍵零部件進(jìn)行定位存在的各種問(wèn)題,本文提出一種基于脈沖數(shù)據(jù)重構(gòu)的高鐵關(guān)鍵零部件檢測(cè)算法,其利用超高速脈沖相機(jī)作為數(shù)據(jù)采集裝置對(duì)運(yùn)行中的高鐵進(jìn)行數(shù)據(jù)采集,避免了工業(yè)相機(jī)存在的運(yùn)動(dòng)模糊以及幀間視差過(guò)大的問(wèn)題。針對(duì)脈沖相機(jī)數(shù)據(jù)密度低、訓(xùn)練難度大等問(wèn)題,本文采用先重構(gòu)后檢測(cè)的思想,即首先將脈沖數(shù)據(jù)重構(gòu)為高清灰度圖像,在此基礎(chǔ)上進(jìn)行關(guān)鍵零部件檢測(cè)的模型訓(xùn)練與加速,從而能夠?qū)崿F(xiàn)對(duì)運(yùn)行中的高鐵關(guān)鍵零部件進(jìn)行檢測(cè)。
不同于普通工業(yè)相機(jī),脈沖相機(jī)在進(jìn)行數(shù)據(jù)采集的過(guò)程中,所有感光器件并不同步地按相同的曝光時(shí)長(zhǎng)進(jìn)行曝光,而是持續(xù)地捕獲光子,當(dāng)感光位置的累計(jì)光強(qiáng)超過(guò)設(shè)定閾值,就產(chǎn)生一個(gè)脈沖信號(hào)。該過(guò)程的數(shù)學(xué)描述如下:假設(shè)第i行第j列像素的光強(qiáng)值為Iij,在時(shí)間0~t內(nèi)對(duì)它進(jìn)行積分,得到該感光位置的累計(jì)光強(qiáng)為
定義光強(qiáng)閾值為T(mén)。當(dāng)Sij(t)大于等于T時(shí),第i行第j列的像素觸發(fā)脈沖;否則,不觸發(fā)脈沖。因此,第i行第j列像素的脈沖觸發(fā)狀態(tài)可以表示為
將所有像素的瞬時(shí)脈沖觸發(fā)狀態(tài)按行排列,得到當(dāng)前時(shí)刻t的脈沖幀,脈沖相機(jī)采集脈沖流數(shù)據(jù)的過(guò)程被看作是不斷重復(fù)生成當(dāng)前時(shí)刻脈沖幀的過(guò)程,其中每一個(gè)像素位置都是由0或1組成。
由上述超高速脈沖相機(jī)成像原理可知:
1)單個(gè)像素位置的光照強(qiáng)度與單位時(shí)間內(nèi)觸發(fā)的脈沖數(shù)量成正比,單位時(shí)間內(nèi)觸發(fā)的脈沖數(shù)量越多,光強(qiáng)越大。故可通過(guò)統(tǒng)計(jì)一段時(shí)間內(nèi)觸發(fā)的脈沖數(shù)量來(lái)還原真實(shí)光強(qiáng),從而還原圖像在該像素位置的亮度,如圖1(a)所示。其中,時(shí)間窗口T1~T2為虛擬曝光時(shí)間,大小可調(diào)。
圖1 脈沖重構(gòu)原理Fig.1 Principle of spike-based reconstruction
2)單個(gè)像素位置的光照強(qiáng)度與兩脈沖之間的間隔大小成反比,兩個(gè)脈沖之間的間隔越小,光強(qiáng)越大。故可通過(guò)計(jì)算脈沖間隔的倒數(shù)來(lái)還原像素位置的光強(qiáng),從而還原圖像在該像素位置的亮度,如圖1(b)所示。
圖像顯示了特定時(shí)刻所有像素位置對(duì)光強(qiáng)映射的空間排布,利用上述方法可以估計(jì)任意時(shí)刻光強(qiáng),從而實(shí)現(xiàn)基于脈沖數(shù)據(jù)的圖像重構(gòu)[21]。
本文所提方法依據(jù)超高速脈沖相機(jī)原理,首先將在高鐵運(yùn)行正線(xiàn)上采集的脈沖數(shù)據(jù)重構(gòu)為高清晰灰度圖像數(shù)據(jù)并進(jìn)行數(shù)據(jù)清洗與標(biāo)注,然后利用YOLOv8目標(biāo)檢測(cè)算法對(duì)標(biāo)注后的數(shù)據(jù)進(jìn)行訓(xùn)練,最后對(duì)訓(xùn)練后的模型進(jìn)行TensorRT加速處理,從而使模型具有更好的實(shí)時(shí)推理能力。本文所提算法整體框架如圖2 所示。由圖可知,該算法主要包含2 個(gè)模塊:基于脈沖數(shù)據(jù)的高鐵場(chǎng)景圖像重構(gòu)、基于重構(gòu)圖像的高鐵關(guān)鍵零部件定位。
圖2 高鐵關(guān)鍵零部件檢測(cè)算法總體設(shè)計(jì)Fig.2 Overall design of detection algorithm for key components on high-speed railways
由于脈沖累計(jì)重構(gòu)是通過(guò)統(tǒng)計(jì)虛擬曝光時(shí)間內(nèi)所觸發(fā)的脈沖數(shù)量來(lái)還原光強(qiáng)大小的,和普通工業(yè)相機(jī)類(lèi)似,在高速運(yùn)動(dòng)場(chǎng)景下存在運(yùn)動(dòng)模糊現(xiàn)象。因此,本文的重構(gòu)方法在脈沖間隔重構(gòu)原理的基礎(chǔ)上增加了一系列后處理,從而達(dá)到更好的成像效果。本文所提圖像重構(gòu)方法具體流程如圖3所示。
圖3 基于脈沖數(shù)據(jù)的圖像重構(gòu)Fig.3 Image reconstruction based on spike data
根據(jù)脈沖間隔成像的原理,利用本文所提方法,由原始脈沖數(shù)據(jù)重構(gòu)出高清晰度灰度圖像,具體步驟如下:
1)將單幀 脈沖數(shù) 據(jù)表示 為Sm={xi,j,m},m∈[1,n],i,j∈[1,1000]。其中,xi,j,m表示第m幀脈沖數(shù)據(jù)像素位置為(i,j)的取值,xi,j,m∈{0,1}。
2)對(duì)每個(gè)像素位置,計(jì)算脈沖間隔。設(shè)第m幀與第k幀在像素位置(i,j)處分別觸發(fā)脈沖,即xi,j,m=1,xi,j,k=1,記該像素位置的脈沖間隔為
3)設(shè)由脈沖數(shù)據(jù)重構(gòu)的圖像表示為Im={pi,j,m}。其中,pi,j,m表示第m幀圖像在像素位置(i,j)處的取值。重構(gòu)的圖像在像素位置(i,j)處的亮度表示為
4)計(jì)算1~n幀每個(gè)像素位置的所有脈沖間隔,由式(3)和式(4)可得重構(gòu)后每個(gè)像素位置的值。為防止局部過(guò)曝,計(jì)算單幀圖像全局亮度,具體為
式中:Bi,j——像素點(diǎn)(i,j)的亮度值;H——圖像的高度;W——圖像的寬度;ε——極小量。
式中:α——調(diào)整系數(shù)。
5)對(duì)每個(gè)像素點(diǎn)(i,j),利用亮度系數(shù)與局部亮度計(jì)算像素位置的值,具體為
式中:g——增益因子,用來(lái)調(diào)節(jié)像素位置的取值;round——取整函數(shù)。
6)對(duì)重構(gòu)結(jié)果進(jìn)行中值濾波,去除椒鹽噪聲,具體為
式中:median(·)——對(duì)窗口內(nèi)的像素值進(jìn)行排序取中位數(shù),濾波窗口是以像素點(diǎn)(i,j)為中心,大小為n×n的矩形;B_m'(i,j)——中值濾波后位置(i,j)的亮度值。
7)對(duì)濾波后的結(jié)果進(jìn)行增強(qiáng)處理。根據(jù)濾波后圖像的拉普拉斯變換矩陣的方差值l_var,判斷圖像的微小變化以及紋理信息并作相應(yīng)處理,處理方式為
鑒于此,本文擬從這些常用詞的造詞和詞義方面,結(jié)合構(gòu)詞理?yè)?jù)對(duì)有借代意義的詞作理論上的分析和描述,總結(jié)歸納常用詞中借代意義的不同類(lèi)型、規(guī)律,并就辭書(shū)中常用詞借代義的釋義體例及模式進(jìn)行探討,以供辭書(shū)編纂和修訂時(shí)參考。
式中:Bfinal(i,j) ——像素位置(i,j)最終的亮度值。
8)對(duì)每個(gè)像素位置完成相應(yīng)的操作,即可完成脈沖數(shù)據(jù)到圖像數(shù)據(jù)的重構(gòu)。
對(duì)于重構(gòu)后的圖像數(shù)據(jù),本文選擇YOLOv8 作為基本網(wǎng)絡(luò)模型進(jìn)行目標(biāo)檢測(cè)模型訓(xùn)練。相較YOLOv5網(wǎng)絡(luò),YOLOv8利用C2f替換C3,通過(guò)更多的分支跨層連接對(duì)殘差特征進(jìn)行學(xué)習(xí),具有更強(qiáng)特征表達(dá)能力。此外,其利用快速空間金字塔池化(spatial pyramid pooling-fast,SPPF)替換空 間金字 塔池化(spatial pyramid pooling,SPP)進(jìn)行特征連接,采用多個(gè)小尺寸池化核級(jí)聯(lián)代替SPP 模塊中單個(gè)大尺寸池化核,在融合不同感受野的特征圖、豐富特征圖的表達(dá)能力的情況下,進(jìn)一步提高了運(yùn)行速度;在Neck 層采用PAN結(jié)構(gòu),加強(qiáng)網(wǎng)絡(luò)對(duì)不同縮放尺度對(duì)象特征融合的能力;最后在Head層進(jìn)行輸出結(jié)果預(yù)測(cè)時(shí),針對(duì)目標(biāo)定位中的分類(lèi)與回歸相沖突的問(wèn)題,Head層將分類(lèi)和回歸進(jìn)行解耦,分別對(duì)目標(biāo)的類(lèi)別以及位置進(jìn)行預(yù)測(cè),大幅度提高模型的收斂速度。YOLOv8模型結(jié)構(gòu)如圖4所示。
圖4 YOLOv8 網(wǎng)絡(luò)結(jié)構(gòu)示意Fig.4 Schematic diagram of YOLOv8 network
TensorRT 是NVIDIA 的深度學(xué)習(xí)推理優(yōu)化器,通過(guò)算子融合、量化、內(nèi)核自動(dòng)調(diào)整、動(dòng)態(tài)張量顯存和多流執(zhí)行等技術(shù),實(shí)現(xiàn)加速網(wǎng)絡(luò)推理。為了進(jìn)一步提高模型的實(shí)時(shí)推理能力,本文采用TensorRT對(duì)訓(xùn)練好的模型進(jìn)行加速處理。由于本文采用Pytorch 模型搭建,無(wú)法直接轉(zhuǎn)換為T(mén)ensorRT可讀取的參數(shù)格式,因此在利用TensorRT 進(jìn)行優(yōu)化時(shí),先將Pytorch 模型轉(zhuǎn)換為T(mén)ensorRT支持的Onnx格式模型,再進(jìn)行引擎優(yōu)化和執(zhí)行推理,從而完成模型的加速。
為了對(duì)本文所提高鐵關(guān)鍵零部件檢測(cè)算法進(jìn)行驗(yàn)證,分別進(jìn)行基于脈沖數(shù)據(jù)的重構(gòu)實(shí)驗(yàn)以及基于重構(gòu)圖像的關(guān)鍵零部件檢測(cè)試驗(yàn),通過(guò)分析試驗(yàn)結(jié)果對(duì)本文算法的有效性進(jìn)行驗(yàn)證。
超高速脈沖相機(jī)作為傳感器負(fù)責(zé)數(shù)據(jù)的采集,采集頻率可達(dá)每秒兩萬(wàn)幀。數(shù)據(jù)采集系統(tǒng)從相機(jī)前端芯片捕獲脈沖數(shù)據(jù),并通過(guò)軟排線(xiàn)與脈沖傳感器連接,對(duì)采集所得數(shù)據(jù)進(jìn)行前處理和封裝,再通過(guò)光纖與上位機(jī)進(jìn)行連接,通過(guò)外部設(shè)備進(jìn)行采集端的控制與可視化處理。超高速脈沖相機(jī)參數(shù)如表1所示。
表1 超高速脈沖相機(jī)參數(shù)Table 1 Parameters of the ultra-high-speed spike camera
通過(guò)在高鐵運(yùn)行正線(xiàn)路側(cè)搭建上述數(shù)據(jù)采集系統(tǒng),對(duì)沿線(xiàn)運(yùn)行的高鐵進(jìn)行數(shù)據(jù)采集,累計(jì)采集80 余趟高鐵運(yùn)行數(shù)據(jù),共得原始脈沖數(shù)據(jù)1.2 TB,數(shù)據(jù)采集場(chǎng)景及采集所得原始脈沖數(shù)據(jù)示例分別如圖5(a)和圖5(b)所示。
圖5 數(shù)據(jù)采集Fig.5 Data acquisition
使用Python語(yǔ)言和Pytorch框架進(jìn)行原始算法開(kāi)發(fā),操作系統(tǒng)為Ubuntu18.04,GPU為GeForce GTX3090。
目標(biāo)檢測(cè)模型性能所用評(píng)價(jià)指標(biāo)如下:
式中:R——召回率;P——準(zhǔn)確率;TP——檢測(cè)到的類(lèi)別與真實(shí)類(lèi)別一致的樣本數(shù)量;FP——檢測(cè)到的類(lèi)別與真實(shí)類(lèi)別不一致的數(shù)量;FN——存在未被檢測(cè)的標(biāo)簽數(shù)量;PmA——所有類(lèi)別樣本的精度平均值;N——類(lèi)別數(shù)。
為對(duì)本文所提重構(gòu)算法進(jìn)行驗(yàn)證,分別選取靜止場(chǎng)景以及運(yùn)動(dòng)場(chǎng)景的高鐵脈沖數(shù)據(jù),利用本文所提重構(gòu)算法、脈沖累計(jì)重構(gòu)與脈沖間隔重構(gòu)3 種重構(gòu)算法同時(shí)對(duì)上述脈沖數(shù)據(jù)進(jìn)行圖像重構(gòu),結(jié)果如圖6所示??梢钥闯觯?/p>
1)脈沖累計(jì)重構(gòu)出來(lái)的圖像在靜止場(chǎng)景下結(jié)果清晰,且無(wú)明顯噪點(diǎn);在運(yùn)動(dòng)場(chǎng)景下,出現(xiàn)明顯運(yùn)動(dòng)模糊,故該方法不適用于高速運(yùn)動(dòng)場(chǎng)景的圖像重構(gòu)。
2)脈沖間隔重構(gòu)的圖像則無(wú)運(yùn)動(dòng)模糊,但由于原始脈沖數(shù)據(jù)含有較多的隨機(jī)噪聲,脈沖間隔重構(gòu)的結(jié)果含有較多噪聲。
3)采用本文所提方法重構(gòu)的圖像既沒(méi)有出現(xiàn)運(yùn)動(dòng)模糊現(xiàn)象,也沒(méi)有明顯的噪點(diǎn)。
進(jìn)一步的,對(duì)本文所提重構(gòu)方法在不同亮度區(qū)域所觸發(fā)的脈沖數(shù)量進(jìn)行定量分析,結(jié)果如圖7所示。對(duì)于重構(gòu)后的灰度圖像,隨機(jī)選取不同灰度值的8 個(gè)典型像素點(diǎn),其在圖像中的位置如圖7 中Pixel 1~Pixel 8所示,統(tǒng)計(jì)每個(gè)像素點(diǎn)在100 幀內(nèi)累計(jì)觸發(fā)的脈沖數(shù)量。可以看出,脈沖觸發(fā)數(shù)量和像素亮度之間的正比關(guān)系,即重構(gòu)結(jié)果符合超高速脈沖相機(jī)脈沖觸發(fā)原理,這說(shuō)明了本文所提重構(gòu)方法能夠正確地還原不同像素位置在任意時(shí)刻的光強(qiáng)。
圖7 不同像素點(diǎn)觸發(fā)脈沖數(shù)量Fig.7 Number of triggered pulses at different pixels
為了進(jìn)一步對(duì)本文所提重構(gòu)方法效果進(jìn)行驗(yàn)證,分別對(duì)靜止場(chǎng)景下3 種重構(gòu)結(jié)果進(jìn)行灰度圖對(duì)比分析,結(jié)果如圖8所示??梢钥闯?,3種圖像重構(gòu)方式所得結(jié)果灰度圖曲線(xiàn)的大致走勢(shì)相近,即3 種重構(gòu)方法重構(gòu)出的結(jié)果相似;且本文重構(gòu)方法與脈沖間隔重構(gòu)灰度圖分布基本一致,即本文所提重構(gòu)方法在不改變圖像灰度分布的情況下,能夠很好地消除脈沖間隔重構(gòu)的異常噪點(diǎn);相較圖像累計(jì)重構(gòu)方法,本文所提重構(gòu)方法無(wú)運(yùn)動(dòng)模糊現(xiàn)象且具有更好的圖像銳度。
圖8 不同重構(gòu)方法灰度圖分析Fig.8 Analysis of grayscale images from different reconstruction methods
完成上述由脈沖數(shù)據(jù)到圖像數(shù)據(jù)的轉(zhuǎn)換,對(duì)重構(gòu)后的圖像進(jìn)行關(guān)鍵幀抽取,最后得到灰度圖像數(shù)據(jù)5 100余張。對(duì)數(shù)據(jù)集進(jìn)行關(guān)鍵零部件標(biāo)注,并按照訓(xùn)練集與測(cè)試集7∶3的比例進(jìn)行劃分,訓(xùn)練集、測(cè)試集數(shù)據(jù)分布如表2所示。
表2 數(shù)據(jù)集劃分Table 2 Division of the dataset
利用劃分好的數(shù)據(jù)集,對(duì)模型進(jìn)行200 個(gè)周期(epoch)的基礎(chǔ)訓(xùn)練,其PR 曲線(xiàn)以及混淆矩陣如圖9所示。由圖可知,該模型對(duì)車(chē)體、輪對(duì)以及受電弓的檢測(cè)PmA值均在99%以上,證明該模型具有較好的性能。模型具體性能如表3所示。
表3 關(guān)鍵零部件檢測(cè)試驗(yàn)結(jié)果Table 3 Experimental results of detection on key components
圖9 PR 曲線(xiàn)及混淆矩陣Fig.9 PR curve and confusion matrix
完成模型的基礎(chǔ)訓(xùn)練之后,利用TensorRT對(duì)模型進(jìn)行推理加速,并將加速前后的模型部署于GTX3090。取測(cè)試集對(duì)模型的平均精度以及推理時(shí)間進(jìn)行對(duì)比測(cè)試,其中推理時(shí)間取測(cè)試集所有圖像幀的平均值。未加速前,平均單幀推理時(shí)間為5.9 ms;加速后,平均單幀推理時(shí)間為3.5 ms。相比未加速的模型,TensorRT 加速后的模型效率約提高了41%。具體性能如表4所示。
表4 TensorRT 加速前后性能對(duì)比Table 4 Performance comparison before and after TensorRT acceleration
對(duì)加速后的模型在測(cè)試集進(jìn)行驗(yàn)證,效果如圖10所示??梢钥闯?,加速后的模型仍能夠較好地對(duì)關(guān)鍵零部件進(jìn)行檢測(cè);且對(duì)于較小的關(guān)鍵零部件,如車(chē)輪以及受電弓等,檢測(cè)結(jié)果置信度也均在0.8 及以上,即TensorRT 加速后的模型在提高檢測(cè)時(shí)效性的同時(shí),依然有較高的檢測(cè)精度。
圖10 模型在測(cè)試集上檢測(cè)效果Fig.10 Detection results of module on the test dataset
針對(duì)直接利用工業(yè)相機(jī)以及超高速脈沖相機(jī)對(duì)高鐵關(guān)鍵零部件進(jìn)行檢測(cè)存在的各種問(wèn)題,本文利用先重構(gòu)再檢測(cè)的技術(shù)路線(xiàn),取得了較好的效果。首先,針對(duì)脈沖累計(jì)成像存在運(yùn)動(dòng)模糊以及脈沖間隔成像存在較多噪點(diǎn)的問(wèn)題,本文在脈沖間隔成像的基礎(chǔ)上,利用全局光強(qiáng)修正局部光強(qiáng),并通過(guò)濾波和局部增強(qiáng)處理,有效解決重構(gòu)結(jié)果含有噪點(diǎn)的問(wèn)題,實(shí)現(xiàn)任意時(shí)刻的脈沖數(shù)據(jù)到高清灰度圖像的轉(zhuǎn)換;其次,利用重構(gòu)后的灰度圖像訓(xùn)練高鐵關(guān)鍵零部件目標(biāo)檢測(cè)模型,并利用TensorRT 實(shí)現(xiàn)模型加速,最終實(shí)現(xiàn)98.7%的平均精確度以及3.5 ms 的單幀平均推理時(shí)間,為算法的工程化應(yīng)用奠定了基礎(chǔ)??偟膩?lái)說(shuō),本文為高鐵關(guān)鍵零部件檢測(cè)提供了一種新的可行性方案,該方案能夠?qū)崿F(xiàn)對(duì)運(yùn)動(dòng)中的高鐵關(guān)鍵零部件快速準(zhǔn)確檢測(cè),對(duì)提高高鐵安全可靠運(yùn)營(yíng)具有重要意義。雖然利用先重構(gòu)再檢測(cè)的方法能夠?qū)崿F(xiàn)對(duì)高鐵關(guān)鍵零部件更高精度的檢測(cè),但是圖形重構(gòu)過(guò)程所消耗的時(shí)間較長(zhǎng),后續(xù)考慮對(duì)圖像重構(gòu)過(guò)程進(jìn)行加速,或是直接利用SNN目標(biāo)檢測(cè)方法對(duì)脈沖相機(jī)采集的數(shù)據(jù)進(jìn)行檢測(cè)。