中圖分類(lèi)號(hào) U491.5 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-8949(2025)08-0004-03
0 引言
地鐵作為現(xiàn)代城市公共交通系統(tǒng)的重要組成部分,承載著大量乘客的日常出行需求。地鐵站點(diǎn)和車(chē)廂內(nèi)人員密集,一旦發(fā)生安全事件,后果往往不堪設(shè)想。通過(guò)安全行為監(jiān)測(cè)研究,可以及時(shí)發(fā)現(xiàn)并預(yù)警潛在的安全隱患,如乘客攜帶危險(xiǎn)品、意圖進(jìn)行暴力行為、逃票、翻越閘機(jī)等,安全行為監(jiān)測(cè)不僅可以有效防止安全事件的發(fā)生,提升地鐵公共安全的整體水平,還能幫助優(yōu)化地鐵運(yùn)營(yíng)管理。例如,通過(guò)監(jiān)測(cè)乘客上下車(chē)行為,可以評(píng)估站臺(tái)和車(chē)廂的擁擠程度,為調(diào)度人員提供實(shí)時(shí)數(shù)據(jù)支持,以調(diào)整列車(chē)班次和路線,減少乘客等待時(shí)間,提高運(yùn)營(yíng)效率,同時(shí)也為乘客提供更加便捷、舒適的乘車(chē)環(huán)境[。該文主要通過(guò)YOLOv5最新算法與大華智能技術(shù)對(duì)地鐵乘客安全行為進(jìn)行監(jiān)測(cè)研究。YOLOv5算法具有出色的檢測(cè)速度,可以達(dá)到較高的幀率(如140FPS),這使其非常適合用于實(shí)時(shí)性要求高的場(chǎng)景,在地鐵這種人流量大,情況比較復(fù)雜的場(chǎng)景中,通過(guò)實(shí)時(shí)處理監(jiān)控視頻數(shù)據(jù),能夠迅速響應(yīng)并發(fā)出預(yù)警,有效減少安全隱患。相比于之前的版本,YOLOv5最新算法的模型更小、參數(shù)更少,這使得它更適合在移動(dòng)端和嵌入式設(shè)備等資源受限的平臺(tái)上運(yùn)行。
1 YOLOv5模型分析
YOLOv5具有4個(gè)版本,具體包括YOLOv5s、YOLOv5m、YOLOv51、YOLOv5x四種,其他的版本都在該版本的基礎(chǔ)上對(duì)網(wǎng)絡(luò)進(jìn)行加深與加寬。根據(jù)不同版本的YOLOv5與EfficientDet的對(duì)比研究,得出結(jié)論:
與EfficientDet0相比,YOLOv5不僅可以獲得更高的AP指標(biāo),而且可以獲得更快的推理速度。
與EfficientDet4相比,YOLOv5不僅能夠獲得更高的AP指標(biāo),其推理耗時(shí)是EfficientDet4的1/5左右。(見(jiàn)圖1、表1)
YOLOv5在骨干網(wǎng)絡(luò)上采用了Focus、C3Net。針對(duì)Backbone和Detecthead,YOLOv5設(shè)計(jì)了兩種不同的C3Net。YOLOv5與YOLOv4不同點(diǎn)在于,YOLOv4中只有主干網(wǎng)絡(luò)使用了CSP結(jié)構(gòu),而YOLOv5中設(shè)計(jì)了兩種C3Net結(jié)構(gòu),以YOLOv51網(wǎng)絡(luò)為例,C3_X結(jié)構(gòu)應(yīng)用于Backbone主干網(wǎng)絡(luò),另一種C3_1結(jié)構(gòu)則應(yīng)用于Neck中,加強(qiáng)了網(wǎng)絡(luò)特征融合的能力。圖2所示是YOLOv5框架示例圖。
YOLOv5自發(fā)布以來(lái),對(duì)目標(biāo)檢測(cè)領(lǐng)域產(chǎn)生了顯著影響。其開(kāi)源、輕量化、高精度的特性使其迅速成為學(xué)術(shù)研究和工業(yè)應(yīng)用中的熱門(mén)工具。YOLOv5不僅提高了目標(biāo)檢測(cè)的精度和效率,還推動(dòng)了更多實(shí)時(shí)應(yīng)用的發(fā)展,尤其是在資源受限的嵌入式設(shè)備和移動(dòng)設(shè)備上的部署。隨著YOLOv5在各個(gè)領(lǐng)域的廣泛應(yīng)用,它不僅推動(dòng)了技術(shù)的發(fā)展,也加速了人工智能在實(shí)際場(chǎng)景中的落地應(yīng)用,從而對(duì)各行業(yè)的效率和安全性產(chǎn)生了深遠(yuǎn)的影響。
2 大華智能技術(shù)
2.1基于Anchor-Based的目標(biāo)檢測(cè)
(1)R-CNN二階目標(biāo)檢測(cè)算法
R-CNN是卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于目標(biāo)檢測(cè)的經(jīng)典二階段目標(biāo)檢測(cè)算法。R-CNN的思想較為簡(jiǎn)單,它首先使用選擇性搜索(selectivesearch,SS)創(chuàng)建數(shù)千個(gè)自標(biāo)區(qū)域,然后將這些區(qū)域內(nèi)的圖像分成固定大小圖像,接著將圖像加入卷積神經(jīng)網(wǎng)絡(luò)來(lái)提取特征,最后通過(guò)SVM對(duì)區(qū)域目標(biāo)分類(lèi)進(jìn)行預(yù)測(cè),使用回歸器來(lái)獲得目標(biāo)的區(qū)域邊框。在視頻流中得到多幀圖像進(jìn)行目標(biāo)檢測(cè),得到每幀圖像中與目標(biāo)行人的對(duì)應(yīng)檢測(cè)區(qū)域;分別在每幀圖像的檢測(cè)區(qū)域進(jìn)行光流檢測(cè),得到每幀圖像檢測(cè)區(qū)域的光流信息,其中,多幀圖像包括目標(biāo)幀的圖像和至少一幀樣本幀的圖像;利用至少一幀樣本幀的圖像光流信息,分析目標(biāo)幀的圖像光流信息;以及基于分析結(jié)果,來(lái)確定目標(biāo)行人是否存在安全行為[2。
(2)安全行為數(shù)據(jù)處理方法
通過(guò)一種多模態(tài)的處理框架和數(shù)據(jù)處理方法,數(shù)據(jù)基于不同傳輸協(xié)議初始化并發(fā)送給操作算子,初始的數(shù)據(jù)包括多模態(tài)數(shù)據(jù)和結(jié)構(gòu)化的數(shù)據(jù),數(shù)據(jù)源與一種數(shù)據(jù)類(lèi)型的初始數(shù)據(jù)對(duì)應(yīng)。操作算子應(yīng)用于對(duì)初始數(shù)據(jù)進(jìn)行處理;數(shù)據(jù)匯集用于接收操作算子處理后數(shù)據(jù)并輸出。將輸入圖像細(xì)分為多尺度圖像塊,再將多個(gè)尺度上的特征信息進(jìn)行融合,極大提升了小目標(biāo)檢測(cè)的準(zhǔn)確率。通過(guò)使用上述的處理框架,可同時(shí)進(jìn)行結(jié)構(gòu)化數(shù)據(jù)和多模態(tài)數(shù)據(jù)采集,解析、處理等操作,而不用投入大量時(shí)間、人力成本分別處理不同模態(tài)的數(shù)據(jù),從而實(shí)現(xiàn)了多模態(tài)數(shù)據(jù)的實(shí)時(shí)處理和融合分析,極大簡(jiǎn)化了對(duì)多模態(tài)數(shù)據(jù)實(shí)時(shí)分析的處理難度,降低多模態(tài)數(shù)據(jù)實(shí)時(shí)融合分析時(shí)的復(fù)雜性和操作門(mén)檻[3]。
2.2 圖像編解碼裝置
圖像解碼裝置采用的編碼率失真優(yōu)化(RateDistortionOptimization)是一種提升視頻壓縮性能的最優(yōu)化算法。在AV1(AOMediaVideo1)圖像幀幀內(nèi)的預(yù)測(cè)和圖像幀幀間的預(yù)測(cè)中,遞歸執(zhí)行RDO按確定每個(gè)編碼單元的最佳編碼結(jié)構(gòu)和最佳預(yù)測(cè)模式,在壓縮失真和比特率之間找到最佳折衷。其中,以RD為代價(jià)的計(jì)算過(guò)程如下所示。
式中, J ——是率失真代價(jià)函數(shù),這在視頻壓縮中用于平衡失真和碼率; D ——失真,表示當(dāng)前塊中原始像素和重構(gòu)像素之間平方差的和; R —多元算數(shù)熵編碼對(duì)應(yīng)整個(gè)塊進(jìn)行編碼的比特率;—與量化參數(shù)相關(guān)的拉格朗日乘子。為使AV1編碼器能夠?qū)崟r(shí)編碼,這種較低復(fù)雜度和高精度快速RDO算法非常必要。 (見(jiàn)圖3)
(1)基于估計(jì)碼率和估計(jì)失真,確定待編碼塊的預(yù)測(cè)模式和變換類(lèi)型組合率失真代價(jià)
低頻失真計(jì)算:對(duì)于 3 2 × 3 2 低頻部分量化域的失真,其計(jì)算方式為:
式中, (2 頻域預(yù)估失真;tcoeff
量化系數(shù);dqcoeff
—反量化系數(shù);
變換塊中的行列索引值;
-高頻失真補(bǔ)償。
(2)圖像編解碼裝置
通過(guò)率失真優(yōu)化的硬件架構(gòu)實(shí)現(xiàn),圖像編解碼裝置能夠快速地計(jì)算待編碼塊在使用每一種編碼模式進(jìn)行編碼的率失真代價(jià)值。選擇率失真代價(jià)值最小的編碼模式將待編碼塊進(jìn)行編碼,獲取編碼流,能有效提高編碼效率和效果。
2.3技術(shù)從智能走向智慧
現(xiàn)代交通問(wèn)題的復(fù)雜性要求智能系統(tǒng)不僅要具備數(shù)據(jù)處理能力,還要通過(guò)結(jié)合人類(lèi)智慧進(jìn)行決策。這與地鐵安全監(jiān)控的核心需求相吻合,監(jiān)控系統(tǒng)通過(guò)自動(dòng)識(shí)別安全行為,結(jié)合人工干預(yù)能夠有效防止?jié)撛诘氖鹿拾l(fā)生。
(1)大華智能技術(shù)的應(yīng)用
大華智能技術(shù)可整合到乘客行為安全監(jiān)測(cè)系統(tǒng)中,通過(guò)實(shí)時(shí)預(yù)警機(jī)制,一旦發(fā)現(xiàn)乘客行為異?;虬踩[患,系統(tǒng)會(huì)立即觸發(fā)預(yù)警信號(hào),并通過(guò)聲光報(bào)警、短信、郵件提醒等多種方式向相關(guān)人員發(fā)送預(yù)警信息。這有助于相關(guān)工作人員迅速響應(yīng)并采取措施,防止事態(tài)進(jìn)一步惡化。同時(shí),該技術(shù)還制定了詳細(xì)的應(yīng)急處理流程,規(guī)范各級(jí)人員在應(yīng)急情況下的職責(zé)和行動(dòng)步驟。在發(fā)生緊急情況時(shí),系統(tǒng)能夠自動(dòng)啟動(dòng)應(yīng)急處理流程,指導(dǎo)工作人員按照既定方案進(jìn)行處置。
大華智能技術(shù)憑借強(qiáng)大的硬件和軟件集成能力,在地鐵監(jiān)控中具有重要應(yīng)用價(jià)值。智能攝像頭搭載YOLOv5算法后,可對(duì)地鐵乘客進(jìn)行實(shí)時(shí)監(jiān)測(cè)并識(shí)別異常行為,如突然奔跑、跌倒或爭(zhēng)執(zhí)。通過(guò)智能監(jiān)控平臺(tái),這些異常行為能夠及時(shí)被檢測(cè)并報(bào)警,有效降低了地鐵站的安全風(fēng)險(xiǎn)[4]。
(2)異常行為識(shí)別的應(yīng)用
目前杭州地鐵在各大站點(diǎn)和車(chē)廂內(nèi)部署應(yīng)用了智能攝像頭,這些攝像頭通過(guò)YOLOv5算法對(duì)乘客的安全行為(如摔倒、奔跑、打架等)進(jìn)行實(shí)時(shí)檢測(cè),并在發(fā)現(xiàn)異常情況時(shí)及時(shí)向控制中心報(bào)警[5。杭州地鐵還能通過(guò)對(duì)大量視頻數(shù)據(jù)的長(zhǎng)期存儲(chǔ)與分析,在特定時(shí)間段或特定站點(diǎn)中發(fā)現(xiàn)潛在的安全隱患,提高整體運(yùn)營(yíng)效率。
3結(jié)語(yǔ)
隨著YOLOv5算法的進(jìn)一步發(fā)展和優(yōu)化,地鐵乘客安全行為監(jiān)測(cè)系統(tǒng)將變得更加智能和高效。杭州地鐵計(jì)劃在未來(lái)繼續(xù)擴(kuò)展智能監(jiān)控的應(yīng)用范圍,并引入更多基于人工智能的功能,如實(shí)時(shí)的乘客行為預(yù)測(cè)和更精細(xì)的風(fēng)險(xiǎn)預(yù)警系統(tǒng)。這些技術(shù)的升級(jí)將進(jìn)一步提高地鐵的安全性和運(yùn)營(yíng)效率,為乘客提供更加舒適和安全的出行體驗(yàn)。同時(shí),杭州地鐵在智能監(jiān)控技術(shù)應(yīng)用方面的經(jīng)驗(yàn),將為其他城市的公共交通系統(tǒng)提供重要的參考和借鑒,進(jìn)而推動(dòng)全球智能交通管理的進(jìn)步。
參考文獻(xiàn)
[1]許立楊.智慧工地系統(tǒng)在地鐵施工現(xiàn)場(chǎng)安全管理中的應(yīng)用研究[J].現(xiàn)代城市軌道交通,2024(6):26-30.
[2]浙江大華技術(shù)股份有限公司.異常行為檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì):CN202211695602.4[P].2023-05-09.
[3]浙江大華技術(shù)股份有限公司.行為數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì):CN202310445324.5[P].2023-08-29
[4]周琛,張?zhí)m春.基于改進(jìn)YOLOv5的交通目標(biāo)檢測(cè)算法[J].電腦知識(shí)與技術(shù),2024(20):33-36+40.
[5]高金銘,李燕,厲風(fēng).自動(dòng)化監(jiān)測(cè)系統(tǒng)在既有地鐵線路監(jiān)測(cè)中的應(yīng)用[J].現(xiàn)代交通技術(shù),2024(3):87-91.