• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于智能圖像識別的地鐵保護區(qū)內(nèi)鉆機檢測方法

      2022-10-17 08:09:18胡雪霏李丞鵬陳俊海劉書浩宋曉敏
      交通運輸研究 2022年4期
      關鍵詞:衰減系數(shù)余弦圖像識別

      胡雪霏,李丞鵬,陳俊海,劉書浩,宋曉敏

      (1.交通運輸部科學研究院,北京 100029;2.城市軌道交通運營安全管理技術及裝備交通運輸行業(yè)研發(fā)中心,北京 100029;3.北京中天路通智控科技有限公司,北京 100036)

      0 引言

      近年來,南寧、深圳、成都等多個城市地鐵保護區(qū)陸續(xù)發(fā)生鉆機施工擊穿隧道的險性事件[1],造成隧道及列車受損、司機受傷、運營延誤等嚴重后果,給乘客人身安全帶來了重大隱患。據(jù)不完全統(tǒng)計,僅2021 年,我國就發(fā)生了6 起因外部勘探等施工作業(yè)打穿地鐵隧道的事件。為加強地鐵保護區(qū)管理,《城市軌道交通運營管理規(guī)定》(中華人民共和國交通運輸部令2018 年第8 號)以及各城市軌道交通管理規(guī)定中均對地鐵保護區(qū)的作業(yè)和巡查提出了要求。然而目前各城市地鐵保護區(qū)巡查主要依靠人工[2],工作量大、投入較高且效率較低,不僅難以覆蓋所有區(qū)域,而且巡查效果受人員自身素質(zhì)、專業(yè)素養(yǎng)等因素影響較大。因此,單純的人工巡查無法解決地鐵保護區(qū)面臨的安全隱患[3]。

      圖像識別技術的發(fā)展為地鐵保護區(qū)管理提供了新思路,如:Lablack等[4]通過監(jiān)控攝像機分析乘客的停止、移動和觀看等行為,以判斷其對物體的興趣;Ko[5]提出了可疑人類行為檢測方法,將基于行為分析的視頻監(jiān)控應用于公共安全領域;Hu等[6]結合空間、距離和類型的特征,對交通監(jiān)控視頻中的典型和異常行為進行了識別。我國各大城市也在探索利用新型監(jiān)測技術手段提升地鐵保護區(qū)的安全管理水平,如:武漢地鐵針對武漢市的特殊地質(zhì)條件,研究了地鐵保護區(qū)變形安全監(jiān)測的方案設計、實施及控制指標,梳理出了主要安全風險因素[7];南京地鐵[8]結合移動互聯(lián)網(wǎng)、地理信息系統(tǒng)(Geographic Information System,GIS)與全球衛(wèi)星導航系統(tǒng)(Global Navigation Satellite System,GNSS)定位技術,研發(fā)了軌道交通保護區(qū)信息化巡查執(zhí)法智能管理系統(tǒng)及配套手持終端,提出了巡查結果動態(tài)查詢、歷史項目和案件回溯及數(shù)據(jù)智能分析算法,以加強地鐵保護區(qū)巡查執(zhí)法管理;北京地鐵通過保護區(qū)既有部分地質(zhì)、水文、管線、設施等基礎數(shù)據(jù)融合技術、北斗衛(wèi)星遙感、保護區(qū)電子圍欄、地面線視頻監(jiān)控、無人機自動巡查、自動化監(jiān)測等關鍵技術研究,搭建了保護區(qū)管理平臺[9]。

      綜上所述,國外關于圖像識別技術在地鐵中的應用研究主要集中在乘客行為分析和監(jiān)測方面,國內(nèi)大部分地鐵保護區(qū)的研究側重于施工管理過程中的變形監(jiān)測[10-13],以及施工管理全過程的信息化平臺研發(fā)[14-15],對于智能監(jiān)測和巡查手段的準確率和有效性研究相對不足。為此,本文擬針對地鐵保護區(qū)施工鉆機的圖像特點,開展基于智能圖像識別的地鐵保護區(qū)內(nèi)鉆機作業(yè)監(jiān)測方法研究,從圖像識別準確率、識別速度、功能參數(shù)影響等方面進行對比分析,評價深度學習方法在地鐵保護區(qū)鉆機圖像識別中的應用性能,旨在為增強地鐵保護區(qū)內(nèi)鉆機施工識別的及時性和準確性提供支撐。

      1 圖像識別算法

      圖像識別主要是通過對圖像特征的提取和分析,實現(xiàn)對信息的處理和識別。由于普通的機器學習模型無法對物體大小、形狀、狀態(tài)等多樣性進行有效識別,21 世紀前的圖像識別方法僅處于實驗室水平。深度學習[16]是基于深度神經(jīng)網(wǎng)絡的機器學習,更適合解碼復雜的、高維的、隱秘的特征。2010 年以來,隨著深度學習的普及,關于圖像識別的研究蓬勃發(fā)展,R-CNN(Regionbased Convolution Neural Networks)系 列、SSD(Single Shot MultiBox Detector)、YOLO(You Only Look Once)系列等基于人工神經(jīng)網(wǎng)絡的圖像識別算法應運而生。Faster R-CNN[17-18]是R-CNN 系列的最新成果,它是目前準確率最高的圖像識別算法之一,但識別速度相對較慢。SSD[19]同時借鑒了YOLO 和Faster R-CNN,既有YOLO 速度快的優(yōu)點,又有Faster R-CNN 識別準的優(yōu)點,但調(diào)試過程較多依賴經(jīng)驗。YOLO[20]是基于CNN 的深度學習模型在圖像識別中的典型應用,通過不斷改進和迭代成為YOLOv4 模型,其在網(wǎng)絡結構、訓練策略等方面都有了較大變化,能夠同時保證準確率和檢測速率,具有較好的檢測效果。各種算法的優(yōu)劣勢比較和適用場景如表1所示。

      表1 圖像識別算法適用性比較

      結合表1 中3 種算法的優(yōu)劣勢和適用場景,考慮到地鐵保護區(qū)的鉆機識別對于速度和時間的要求較高,且鉆機本身目標相對較大,YOLOv4算法的成熟度和適用性更高,因此本文選擇采用YOLOv4算法構建鉆機識別模型。

      2 地鐵保護區(qū)鉆機檢測方法

      YOLOv4 算法是在YOLO 目標檢測架構的基礎上,對數(shù)據(jù)處理、主干網(wǎng)絡、網(wǎng)絡訓練、激活函數(shù)、損失函數(shù)等多方面進行了優(yōu)化。YOLOv4網(wǎng)絡主要分為Input,Backbone,Neck 和Head 共4層,其中:Input 層負責輸入圖片用于訓練,即輸入層;Backbone層負責特征提取,利用Mish 激活函數(shù)提高網(wǎng)絡性能;Neck 層負責對提取到的信息進行池化以及特征融合操作;Head層負責輸出檢測結果。同時,考慮到地鐵保護區(qū)的鉆機具有圖像隱蔽、不易識別的特點,在YOLOv4 模型訓練過程中應用了馬賽克(Mosaic)數(shù)據(jù)增強和學習率余弦退火算法,以進一步提升模型的性能。

      2.1 馬賽克(Mosaic)數(shù)據(jù)增強

      在訓練過程中,首先從總數(shù)據(jù)集中取出一定批量數(shù)據(jù),每次從中隨機選取4 張圖片,進行隨機位置的裁剪拼接,合成1張新圖片,重復N次,最后得到N個經(jīng)過馬賽克數(shù)據(jù)增強后的圖片數(shù)據(jù)集,再反饋給神經(jīng)網(wǎng)絡進行訓練,如圖1所示。

      2.2 學習率余弦退火算法

      深層神經(jīng)網(wǎng)絡訓練難度高主要是因為學習過程容易陷入局部最優(yōu),模型無法進一步更新參數(shù)。學習率退火算法可在每個批量數(shù)據(jù)訓練后將學習率減小一點,當減小到規(guī)定值后馬上增大到初始值,然后循環(huán)這一過程。余弦退火可以通過余弦函數(shù)來降低學習率。在余弦函數(shù)中,隨著自變量x的增大,余弦值先緩慢減小,然后加速減小,之后再次緩慢減小。學習率與余弦退火的結合,將獲得較好的學習效果(如圖2所示)。

      2.3 權重衰減

      權重衰減也稱L2正則化,其目的是讓權重衰減到更小的值,在一定程度上減少模型過擬合的問題。其表達式為在損失函數(shù)后面再加上一個正則化項,如式(1)所示。

      式(1)中:C為正則化后的損失函數(shù);C0為原始的損失函數(shù);λ為權重衰減系數(shù);w為權值;n為訓練集大小。

      權重衰減使得權值w更小,根據(jù)奧卡姆剃刀原理,一般情況下網(wǎng)絡的復雜度越低,模型對數(shù)據(jù)的擬合越好。

      3 實驗分析

      3.1 模型訓練

      本次地鐵保護區(qū)鉆機實驗中共使用1 682 張圖片進行測試。在打好標簽后,將其中的90%,即1 514 張圖片劃為訓練集參與測試,10%即168張圖片劃為測試集。在1 514 張訓練圖片中,選取10%即151 張圖片用于驗證計算損失,最后基于168張測試圖片計算模型的各項評價指標。

      3.2 評價指標

      鉆機識別模型的評價指標包括精確率P(Precision)、召回率R(Recall)、調(diào)和平均數(shù)F1、平均準確率AP(Average Precision)及幀率FPS(Frame per Second):

      (1)精確率P,也稱查準率,是針對預測結果而言的,即預測為正的結果占總預測樣本的百分比,如式(2)所示:

      式(2)中:TP 為預測為正的樣本數(shù);FP 為預測為負的樣本數(shù)。

      (2)召回率R,也稱查全率,是針對原樣本而言的,即在全部為正的樣本中被預測為正樣本的概率,如式(3)所示:

      式(3)中:FN表示實際為正但未被預測出的樣本數(shù)。

      (3)調(diào)和平均數(shù)F1。由于在某些極端情況下,P和R是矛盾的,需要以犧牲其中一個指標為代價來最大化另一個指標。為使結果更加均衡和客觀,取F1為綜合評價指標,即精確率和召回率的調(diào)和平均數(shù),如式(4)所示:

      (4)平均準確率AP。AP是P -R曲線中P對R的積分,本質(zhì)上是P關于R的加權平均數(shù),它可以更準確地衡量模型的整體精確率,如式(5)所示:

      (5)幀率FPS。FPS 是衡量模型速度的一個指標,它表示模型每秒能夠處理的圖片數(shù)量。

      3.3 實驗結果分析

      3.3.1 YOLOv4模型結果分析

      實驗結果中,鉆機標簽的精確率和召回率關于置信度閾值的曲線如圖3 所示。其中,橫坐標為置信度閾值,高于該閾值判為正例(含有鉆機),反之則為負例。

      從圖3 中可以看到,精確率P隨置信度閾值的增大而增大,即判定標準越嚴格,精確率越高;而召回率R正好相反,隨置信度閾值的增大而減小,即判定標準越嚴格,召回率越低。當閾值取0.5 時,模型的精確率P和召回率R分別為91.43%和92.75%,均處于較高水平。

      鉆機標簽的P-R曲線如圖4所示。

      調(diào)和平均數(shù)F1關于置信度閾值的曲線如圖5所示。經(jīng)計算,模型中鉆機標簽在測試集中的平均準確率為94.03%,并且F1在置信度閾值為0.854 5時達到最大值。

      實驗中構建的鉆機識別模型對鉆機圖片的識別效果如圖6所示。

      3.3.2 參數(shù)敏感性分析

      (1)功能疊加對平均準確率的影響

      為了對比不同的技術功能參數(shù)對識別結果的影響,通過調(diào)節(jié)YOLOv4 算法模型,分別疊加Mosaic 數(shù)據(jù)增強、學習率余弦退火算法兩種功能,最終得到的平均準確率如表2所示。

      表2 不同算法功能組合對平均準確率的影響

      從表2 可以看出,Mosaic 數(shù)據(jù)增強和學習率余弦退火算法均對提升模型的平均準確率有明顯作用,其中單獨使用Mosaic 數(shù)據(jù)增強功能可以將平均準確率提升2.06%,單獨使用學習率余弦退火算法可以將平均準確率提升1.22%,二者同時使用時平均準確率最高,為94.03%,提升了3.79%。

      (2)權重衰減系數(shù)對平均準確率的影響

      為得出平均準確率的最優(yōu)值,在上述效果最好的功能組合的基礎上,改變權重衰減系數(shù)λ,觀察對比不同λ對平均準確率的影響,結果如圖7所示。

      由圖7 可以看出,總體上,當權重衰減系數(shù)處于低值區(qū)間時,權重衰減系數(shù)越高,平均準確率越高;當權重衰減系數(shù)處于較高值區(qū)間時,權重衰減系數(shù)越高,平均準確率反而越低。這是因為合理的權重衰減系數(shù)可以減小參數(shù),避免過擬合,提高模型在測試集上的準確率;當權重衰減系數(shù)過高時,參數(shù)變得過小,訓練對參數(shù)幾乎沒有影響,平均準確率就會降低。計算結果顯示,當權重衰減系數(shù)取0.000 1 時,平均準確率最高,達到98.23%。

      3.3.3 不同模型的結果對比

      為了驗證YOLOv4 模型對于地鐵保護區(qū)中鉆機識別的適應性,另外選取了Faster R-CNN,SSD,YOLOv3 這3 種常見的圖像識別算法模型,對4 種模型的精確率、召回率、F1值、平均準確率和識別速度進行對比,結果如圖8 所示。從圖8 可以看出,YOLOv4 模型在精確率、召回率、F1值、平均準確率以及幀率5 個指標方面均優(yōu)于Faster R-CNN,SSD 和YOLOv3 模型,說明YOLOv4模型對于鉆機識別的適用性較好。

      4 結語

      采用基于圖像識別技術的智能監(jiān)測方法,可協(xié)助對地鐵保護區(qū)沿線安全狀態(tài)的全天候、全方位監(jiān)測,實現(xiàn)事件信息采集的精確化、信息傳遞過程的網(wǎng)絡化、監(jiān)督管理過程的實時化,是加強地鐵保護區(qū)安全管理工作的有效技術手段之一。本文基于深度學習的圖像識別技術,結合鉆機圖像的識別特點,構建了地鐵保護區(qū)鉆機檢測方法,并通過實驗驗證了不同參數(shù)設置對模型性能的影響,分析了常見的4 種模型對于鉆機識別的精確率、召回率、F1值、平均準確率和幀率的實驗結果。實驗結果顯示,YOLOv4 模型的識別效果較為理想,可作為地鐵保護區(qū)鉆機識別的模型之一。本文主要針對地鐵保護區(qū)施工常見的鉆機識別進行研究和驗證,模型的樣本量相對較小,適用范圍較為單一。未來在實驗條件允許的情況下,可增加安全帽、反光背心、頭盔等更多地鐵保護區(qū)施工作業(yè)常見的工具進行多模型的識別對比,以擴大模型的適用范圍,更好地為地鐵保護區(qū)監(jiān)測提供技術支撐。

      猜你喜歡
      衰減系數(shù)余弦圖像識別
      基于Resnet-50的貓狗圖像識別
      電子制作(2019年16期)2019-09-27 09:34:50
      高速公路圖像識別技術應用探討
      復合材料孔隙率的超聲檢測衰減系數(shù)影響因素
      無損檢測(2018年11期)2018-11-28 08:27:42
      圖像識別在物聯(lián)網(wǎng)上的應用
      電子制作(2018年19期)2018-11-14 02:37:04
      圖像識別在水質(zhì)檢測中的應用
      電子制作(2018年14期)2018-08-21 01:38:16
      近岸及內(nèi)陸二類水體漫衰減系數(shù)的遙感反演研究進展
      對《電磁波衰減系數(shù)特性分析》結果的猜想
      兩個含余弦函數(shù)的三角母不等式及其推論
      HT250材料超聲探傷中的衰減性探究
      中國測試(2016年3期)2016-10-17 08:54:04
      分數(shù)階余弦變換的卷積定理
      同德县| 南部县| 古蔺县| 宕昌县| 黄平县| 古蔺县| 南昌市| 灵寿县| 凤山县| 孟连| 奉新县| 贵定县| 三台县| 闽清县| 青铜峡市| 三台县| 时尚| 景谷| 孝昌县| 鄢陵县| 青阳县| 建水县| 安溪县| 山阳县| 金乡县| 苏尼特右旗| 天台县| 吴忠市| 昌都县| 合肥市| 石台县| 三河市| 商都县| 徐州市| 建德市| 永靖县| 仙桃市| 昌乐县| 怀仁县| 嘉义市| 衡阳县|