摘要:隨著城市化的發(fā)展,電動車的使用日益普及,但其在高層住宅電梯內(nèi)的違規(guī)使用帶來了嚴(yán)重的安全隱患。針對電梯內(nèi)電動車入戶檢測中存在的遮擋問題,文章提出了一種基于改進(jìn)YOLOv5(YouOnlyLookOnceversion5)算法的檢測系統(tǒng)。該系統(tǒng)引入CoordinateAttention(CA)機制優(yōu)化YOLOv5網(wǎng)絡(luò)結(jié)構(gòu),增強對遮擋目標(biāo)的特征提取能力。同時,構(gòu)建了包含遮擋情況的電梯場景數(shù)據(jù)集,并采用數(shù)據(jù)增強技術(shù)提升模型的泛化能力。實驗結(jié)果表明,與原始YOLOv5算法相比,改進(jìn)后的算法在保證實時性的前提下,有效提高了電梯內(nèi)電動車檢測的準(zhǔn)確率,為電梯安全管理提供了有力的技術(shù)支持。
關(guān)鍵詞:YOLOv5算法;電動車入戶檢測;注意力機制;遮擋識別;實時監(jiān)控
中圖分類號:TP183文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)35-0021-05開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
0引言
隨著社會的發(fā)展和人們生活水平的提高,電動車因其便捷性和經(jīng)濟性成為城市居民日常出行的重要工具之一。我國電動自行車保有量已達(dá)3.5億輛,是居民日常代步的重要工具。隨著電動車的普及,其在電梯內(nèi)的使用問題也日益受到關(guān)注。然而,電動車在高層建筑電梯內(nèi)的不當(dāng)使用問題隨之而來[1-4]。電動車在電梯內(nèi)的不規(guī)范行為不僅影響電梯的正常運行,還可能造成嚴(yán)重的安全隱患[5]。2023年,北京市豐臺區(qū)某小區(qū)發(fā)生的一起火災(zāi)便是一個典型案例,造成兩死一傷的悲劇。據(jù)國家消防救援局統(tǒng)計,自2021年以來,全國共接報電動自行車及蓄電池故障引發(fā)的火災(zāi)6.97萬起,造成884人死傷,直接財產(chǎn)損失超過7億元[7]。有關(guān)研究表明,電動車在電梯內(nèi)的不當(dāng)使用不僅影響電梯正常運行,還可能引發(fā)火災(zāi)、爆炸、觸電等安全事故[1,3-7]。
電動車的安全隱患主要表現(xiàn)在違規(guī)停放和充電行為上,例如進(jìn)樓入戶、人車同屋、飛線充電等。這些行為如同“不定時炸彈”,一旦發(fā)生火災(zāi),燃燒迅速且難以撲救[1]。此外,電動車的重量和尺寸往往超出電梯設(shè)計的承載范圍,增加了電梯負(fù)荷,從而縮短電梯使用壽命。而電動車在電梯內(nèi)的誤操作也可能導(dǎo)致電梯故障甚至電梯事故。傳統(tǒng)檢測模式多為人工阻攔,不僅檢測效率低,還容易引發(fā)住戶與管理人員之間的沖突,自動檢測方法亟須得到應(yīng)用與推廣。許多住宅小區(qū)和公共場所安裝了監(jiān)控系統(tǒng),為視頻檢測提供了便利,但由于電梯轎廂空間狹小、人員流動性大,傳統(tǒng)監(jiān)控手段難以有效識別電動車入戶行為。近年來,隨著人工智能技術(shù)的發(fā)展,特別是目標(biāo)檢測技術(shù)的進(jìn)步,為解決這一問題提供了新思路[6-7]。
本研究采用YOLOv5(YouOnlyLookOnceversion5)作為主要目標(biāo)檢測算法,旨在提高電梯內(nèi)電動車行為的檢測效率和準(zhǔn)確性[8-11]。通過對YOLOv5算法的優(yōu)化和調(diào)整,本文期望實現(xiàn)對電梯內(nèi)電動車行為的實時監(jiān)控和自動報警,從而提高居民的安全感。
電梯內(nèi)場景下電動車目標(biāo)檢測面臨諸多挑戰(zhàn):1)遮擋問題:乘客和行李物品容易遮擋電動車,導(dǎo)致漏檢。2)小目標(biāo)問題:監(jiān)控畫面中電動車尺寸相對較小,特征不明顯,識別難度較大。3)實時性要求:電梯場景需要實時檢測預(yù)警,對算法速度要求較高。
目標(biāo)檢測技術(shù)是計算機視覺領(lǐng)域的重要研究方向之一,其目的是從圖像中識別出感興趣的目標(biāo),并確定其位置和大小[12]。隨著深度學(xué)習(xí)領(lǐng)域的快速發(fā)展,目標(biāo)檢測技術(shù)取得了飛躍式進(jìn)步。這一技術(shù)主要分為兩大類別:雙階段檢測器與單階段檢測器,各自以獨特方式實現(xiàn)目標(biāo)的精準(zhǔn)識別。以FasterR-CNN為代表的雙階段檢測器首先生成候選區(qū)域,然后對候選區(qū)域進(jìn)行分類和邊界框回歸。有研究者通過語言嵌入動態(tài)調(diào)整不同數(shù)據(jù)集的分類問題,從而提高多數(shù)據(jù)集訓(xùn)練的協(xié)同性[9]。YOLO和SSD等單階段檢測器則直接在特征圖上預(yù)測目標(biāo)的類別和位置,具有更快的檢測速度。
其中,YOLO算法作為一種實時目標(biāo)檢測算法,因其快速高效的特點而受到廣泛關(guān)注。例如,YOLOv5作為YOLO系列的高級版本,進(jìn)一步優(yōu)化了算法性能,在保持高精度的同時提升了檢測速度,成為實時目標(biāo)檢測領(lǐng)域的熱門選擇[11]。
盡管YOLOv5算法在目標(biāo)檢測領(lǐng)域的應(yīng)用已經(jīng)非常廣泛,但其在電梯內(nèi)電動車檢測中的應(yīng)用仍處于探索階段[8,9,12]。本文探討了YOLOv5算法在電梯內(nèi)電動車檢測中的應(yīng)用,并分析了其在實際應(yīng)用中的優(yōu)勢和挑戰(zhàn)。通過對YOLOv5算法的優(yōu)化和調(diào)整,提出了一種基于改進(jìn)YOLOv5算法的電梯內(nèi)電動車入戶檢測系統(tǒng)。該系統(tǒng)引入CoordinateAttention(CA)機制優(yōu)化YOLOv5網(wǎng)絡(luò)結(jié)構(gòu),增強對遮擋目標(biāo)的特征提取能力,并構(gòu)建包含遮擋情況的電梯場景數(shù)據(jù)集,利用數(shù)據(jù)增強技術(shù)提升模型的泛化能力,最終實現(xiàn)對電梯內(nèi)電動車的精準(zhǔn)、實時檢測。
本研究的創(chuàng)新點在于將YOLOv5算法應(yīng)用于電梯內(nèi)電動車檢測,并針對電梯內(nèi)環(huán)境的特殊性探討了遮擋識別在電動車檢測中的應(yīng)用。通過引入CA機制對YOLOv5算法進(jìn)行改進(jìn),提高了電梯內(nèi)電動車檢測的準(zhǔn)確性,為解決遮擋問題提供了新思路,為電動車入戶檢測提供了更有效的技術(shù)支持。本研究的意義在于提高電梯內(nèi)電動車檢測的準(zhǔn)確性和便捷性,為電動車入戶檢測提出了新的解決方案,為居民人身安全提供了保障。
1相關(guān)工作
1.1目標(biāo)檢測算法
目標(biāo)檢測是計算機視覺領(lǐng)域的基礎(chǔ)性任務(wù)之一,其目的是從圖像或視頻中識別出特定目標(biāo)并確定其位置。近年來,深度學(xué)習(xí)技術(shù)的快速發(fā)展推動了目標(biāo)檢測領(lǐng)域的巨大進(jìn)步。其中,YOLO系列算法以其速度快、精度高、易部署等優(yōu)點,在目標(biāo)檢測領(lǐng)域得到了廣泛應(yīng)用。YOLOv5在網(wǎng)絡(luò)結(jié)構(gòu)、損失函數(shù)、數(shù)據(jù)增強等方面進(jìn)行了一系列改進(jìn),進(jìn)一步提升了目標(biāo)檢測的性能。憑借其易用性、穩(wěn)健的性能和靈活性,YOLOv5被廣大業(yè)內(nèi)人員廣泛使用。
1.2注意力機制
注意力機制模仿人類視覺系統(tǒng)的工作方式,其核心思想是從眾多信息中選擇性地關(guān)注對當(dāng)前任務(wù)更為重要的信息。在目標(biāo)檢測領(lǐng)域,注意力機制能夠幫助模型更加關(guān)注目標(biāo)區(qū)域的特征信息,從而提升目標(biāo)檢測的精度。CoordinateAttention(CA)是一種輕量級的注意力機制,它通過將通道注意力分解為兩個一維特征編碼過程,分別沿水平和垂直方向聚合特征,從而捕捉目標(biāo)的長距離依賴關(guān)系,增強模型對目標(biāo)空間信息的感知能力。尤其是在處理遮擋目標(biāo)時,CA機制表現(xiàn)出了較好的性能。
1.3遮擋目標(biāo)檢測
遮擋目標(biāo)檢測是目標(biāo)檢測領(lǐng)域的一個難點問題,其挑戰(zhàn)在于如何從被遮擋的目標(biāo)中提取有效的特征信息。針對這一問題,研究者提出了一些方法:1)基于上下文信息的檢測方法:利用目標(biāo)周圍的場景信息來推斷被遮擋的目標(biāo)。2)基于部件模型的檢測方法:將目標(biāo)分解為多個部件分別檢測,然后組合成完整的目標(biāo)。3)基于多視角融合的檢測方法:利用多個視角的觀測信息來彌補單一視角信息的不足。
2算法設(shè)計
2.1YOLOv5算法原理
YOLOv5算法是一種單階段目標(biāo)檢測算法,其核心思想是在圖像的多個尺度上進(jìn)行特征提取,并在每個尺度上預(yù)測目標(biāo)的類別和位置(如圖1)。網(wǎng)絡(luò)結(jié)構(gòu)主要分為3個部分:Backbone、Neck和Head。
Backbone的主要作用是提取圖像中的特征,并逐步縮小特征圖尺寸,同時增加通道數(shù)。YOLOv5通常采用CSPDarknet53作為Backbone,這是Darknet53的一種改進(jìn)版本,通過引入跨階段連接(CrossStagePar?tial)來提高信息流動效率和網(wǎng)絡(luò)性能。在Backbone中,主要組件包括Conv模塊、C3模塊和SPPF模塊:
Conv模塊:由Conv2d(卷積層)、BatchNorm2d(批歸一化層)和激活函數(shù)(如SiLU)組成。Conv2d用于提取特征并整理特征圖,BatchNorm2d對每批數(shù)據(jù)進(jìn)行歸一化,激活函數(shù)增加數(shù)據(jù)的非線性表達(dá)能力。
C3模塊:由三個Conv模塊和一個BottleNeck模塊組成。C3模塊通過分路處理和Concat操作,實現(xiàn)特征圖的降維和升維,并通過BottleNeck模塊中的殘差連接,避免梯度消失問題。
SPPF模塊(SpatialPyramidPooling-Fast):基于空間金字塔池化(SPP)的改進(jìn)版本,通過多個并行或串行的MaxPool操作,實現(xiàn)多尺度特征融合。
Neck結(jié)構(gòu)位于Backbone和Head之間,主要作用是對Backbone提取的特征進(jìn)行進(jìn)一步融合和上采樣操作,以提供更高級的語義信息,并適應(yīng)不同尺度圖片的檢測需求。YOLOv5的Neck通常采用特征金字塔網(wǎng)絡(luò)(FPN)或PANet等結(jié)構(gòu),將淺層圖形特征與深層語義特征結(jié)合在一起。在Neck中,特征圖通過上采樣(Upsample)和Concat操作,實現(xiàn)不同層級特征的融合。這樣既能保留淺層圖形特征,又能結(jié)合深層語義特征,從而提高目標(biāo)檢測精度。
Head是YOLOv5的檢測頭,負(fù)責(zé)生成預(yù)測框和預(yù)測類別。YOLOv5的Head結(jié)構(gòu)相對簡單,主要由三個1×1卷積層組成,對應(yīng)三個不同尺度的檢測特征層。1×1卷積層的主要作用是升維或降維,以調(diào)整特征圖的通道數(shù),使其符合檢測頭的需求。每個檢測特征層都會生成一系列預(yù)測框,包括位置坐標(biāo)(x,y,w,h)、置信度和類別信息。YOLOv5使用CIOU_Loss作為損失函數(shù),并結(jié)合NMS(非極大值抑制)算法對預(yù)測框進(jìn)行后處理,以去除冗余預(yù)測框。
2.2CA機制工作原理
CA模塊首先將輸入特征圖分別進(jìn)行水平和垂直方向的全局平均池化,得到兩個一維特征向量。然后,這兩個特征向量分別經(jīng)過兩個不同的卷積層和Sigmoid激活函數(shù),生成兩個注意力權(quán)重圖。最后,將這兩個注意力權(quán)重圖分別與原始特征圖相乘,得到最終的輸出特征圖(如圖2)。
2.3YOLOv5算法優(yōu)化
電梯內(nèi)空間相對狹小,人物、電動車等檢測目標(biāo)遮擋重疊現(xiàn)象較多,干擾了對目標(biāo)的正常識別,影響了檢測精度。針對電梯內(nèi)環(huán)境的特殊性,本文從網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)據(jù)集處理兩個方面解決上述關(guān)鍵性問題。
在網(wǎng)絡(luò)結(jié)構(gòu)方面,本文對YOLOv5算法進(jìn)行了優(yōu)化,主要改進(jìn)內(nèi)容為增加注意力機制。將原有YO?LOv5的C3結(jié)構(gòu)替換為增加了CA機制的C3CA結(jié)構(gòu)(如圖3)。對輸入特征進(jìn)行三次不同的卷積操作,這些卷積操作具有不同的卷積核大小、步長或填充方式,以提取不同尺度的特征表示。對每次卷積操作得到的特征表示分別應(yīng)用CA注意力機制。CA注意力機制首先通過全局平均池化對每個通道的特征進(jìn)行降維,得到一個全局特征向量;然后使用全連接層對全局特征向量進(jìn)行映射,得到權(quán)重向量;最后,將權(quán)重向量與原始特征逐元素相乘,得到加權(quán)后的特征表示。將三組加權(quán)后的特征表示進(jìn)行融合,得到最終的特征表示。
當(dāng)發(fā)生遮擋等情況時,電梯內(nèi)目標(biāo)的一部分會轉(zhuǎn)化為小目標(biāo)問題。通過優(yōu)化,本文期望增加檢測目標(biāo)的權(quán)重,提高算法在有遮擋情況下目標(biāo)檢測的準(zhǔn)確性。
在Backbone中出現(xiàn)的Conv均采用3×3卷積核,步長為2,通道數(shù)根據(jù)網(wǎng)絡(luò)深度和寬度的不同而改變(如圖3)。3×3卷積核是常用的尺寸,因為它能夠捕獲圖像中的局部特征。步長為2用于減少特征圖的尺寸,同時增加感受野。SPPF是一種多尺度池化方式,用于融合不同尺度的特征信息,分別選取5×5、9×9、13×13三種尺寸的池化核。這些池化核的大小選擇是為了捕獲不同尺度的上下文信息,提高模型對目標(biāo)的檢測能力。
Neck模塊連接Backbone和Head,負(fù)責(zé)進(jìn)一步融合和提取特征。在Neck部分中,各模塊的相關(guān)參數(shù)與Backbone中的相同。Head模塊負(fù)責(zé)生成最終檢測結(jié)果,包括目標(biāo)類別、位置和置信度等。其中,Conv采用1×1卷積核,用以調(diào)整特征圖的通道數(shù),避免全連接層的冗余參數(shù)和高計算量。
3數(shù)據(jù)集的構(gòu)建和預(yù)處理
為了訓(xùn)練和測試YOLOv5算法,需要構(gòu)建一個包含電梯內(nèi)電動車圖像的數(shù)據(jù)集。本文分別從以下兩個途徑構(gòu)建數(shù)據(jù)集:
1)實地拍攝和網(wǎng)絡(luò)視頻爬?。哼x取不同時間段、不同光照條件下的大量電梯內(nèi)場景視頻,并從中截取圖像幀,共計1600張。
2)公開數(shù)據(jù)集:PaddlePaddle電動車檢測數(shù)據(jù)集,共計2080張。
公開數(shù)據(jù)集使用Labelme進(jìn)行標(biāo)注,因此對于實地拍攝和網(wǎng)絡(luò)爬取得到的相關(guān)圖像幀也使用Labelme進(jìn)行標(biāo)注。標(biāo)注信息包括目標(biāo)類別和邊界框。通過以上方法,構(gòu)建了一個適用于電梯內(nèi)環(huán)境的數(shù)據(jù)集,如圖4所示。
在數(shù)據(jù)預(yù)處理階段,本文采用了數(shù)據(jù)增強技術(shù):1)幾何變換:包括隨機旋轉(zhuǎn)、縮放、翻轉(zhuǎn)等;2)顏色變換:包括隨機調(diào)整圖像亮度、對比度、飽和度等;3)添加噪聲:包括添加高斯噪聲、椒鹽噪聲等;4)Mixup:將兩張圖像按照一定比例進(jìn)行混合,并根據(jù)混合比例調(diào)整標(biāo)簽;5)Cutout:隨機遮擋圖像局部區(qū)域,模擬遮擋情況。以上數(shù)據(jù)增強技術(shù)可以擴充數(shù)據(jù)集,提高算法的泛化能力。
同時,遮擋是影響目標(biāo)檢測準(zhǔn)確性的一個重要因素。在電梯內(nèi)環(huán)境中,電動車與其他物體或乘客之間可能出現(xiàn)遮擋。本文考慮了電梯內(nèi)環(huán)境中可能出現(xiàn)的遮擋問題。為了提高遮擋情況下的檢測準(zhǔn)確性,除上一節(jié)對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行修改,增加注意力機制以提高識別目標(biāo)關(guān)注權(quán)重外,本文還通過以上Mixup、Cutout數(shù)據(jù)增強技術(shù)模擬遮擋情景,從而提高電梯內(nèi)遮擋情況的識別準(zhǔn)確率。
通過添加注意力機制訓(xùn)練模型識別遮擋區(qū)域,并對遮擋區(qū)域進(jìn)行特別處理,同時通過擴充模擬遮擋圖像來增強算法的魯棒性,提高檢測系統(tǒng)在遮擋情況下的準(zhǔn)確性。
4模型訓(xùn)練
本文在以下硬件和軟件環(huán)境下進(jìn)行模型訓(xùn)練:Ubuntu24.04、NVIDIAGeForceRTX3080Ti(12GB顯存)、16GB內(nèi)存、Pytorch框架、Python編寫。使用預(yù)訓(xùn)練方法,凍結(jié)特征提取部分權(quán)重,利用構(gòu)建的數(shù)據(jù)集劃分訓(xùn)練集和測試集對網(wǎng)絡(luò)進(jìn)行局部訓(xùn)練。具體訓(xùn)練參數(shù)設(shè)置如下:初始學(xué)習(xí)率為0.01、循環(huán)學(xué)習(xí)率為0.2、IoU訓(xùn)練閾值為0.2、batch-size為64、epochs為100、優(yōu)化器為SGD,并沿用YOLOv5的CIOU_Loss損失函數(shù)。
損失函數(shù)從三個方面進(jìn)行分析,包括回歸損失(RegressionLoss)、置信度損失(ConfidenceLoss)和分類損失(ClassificationLoss),分別表示為box_loss、obj_loss、cls_loss。其中,box_loss隨著訓(xùn)練的進(jìn)行逐漸降低,表明模型在逐步優(yōu)化其預(yù)測邊界框的能力;置信度損失obj_loss的高低直接影響模型的檢測精度和召回率,較低的置信度損失意味著模型更準(zhǔn)確地識別了目標(biāo)的存在;分類損失cls_loss表示模型對預(yù)測框中目標(biāo)分類的準(zhǔn)確性,逐漸降低表明分類準(zhǔn)確性逐步提高。
損失函數(shù)除訓(xùn)練初期波動較大外,后期訓(xùn)練過程中整體波動下降。在目標(biāo)的驗證過程中,損失函數(shù)到后期已無法進(jìn)一步下降,并出現(xiàn)升高趨勢,說明訓(xùn)練已達(dá)到完成狀態(tài),若繼續(xù)訓(xùn)練可能存在過擬合風(fēng)險。此時,準(zhǔn)確率與召回率綜合處于較為平衡的位置(如圖5)。
5算法性能評估
5.1性能分析
為了評估加入CA模塊改進(jìn)后算法在電梯內(nèi)電動車檢測中的性能,本文通過F1范數(shù)、混淆矩陣和PR曲線對算法性能進(jìn)行評估。
F1范數(shù)代表準(zhǔn)確率和召回率的平衡,如公式(1)所示。
F1score=2×(Precision×Recall/Precision+Recall)(1)
由于實際算法應(yīng)用過程中,無法同時兼顧準(zhǔn)確率和召回率均處于最高水平,因此需要根據(jù)實際工程需求,利用F1范數(shù)衡量二者的平衡位置,以滿足相對適合的水準(zhǔn)。如圖6所示,由于嬰兒車的訓(xùn)練樣本較少,其F1范數(shù)表現(xiàn)較低。針對上述樣本不均衡問題,進(jìn)一步分析其準(zhǔn)確率與召回率。
在樣本不均衡的情況下,相關(guān)指標(biāo)評估應(yīng)更加關(guān)注準(zhǔn)確率問題。如圖7所示,當(dāng)置信度較高時,準(zhǔn)確率同樣處于較高水平。而如圖8所示,當(dāng)置信度較高時,嬰兒車的預(yù)測召回率較低,因此可以得出召回率影響了F1范數(shù)的表現(xiàn)。由圖9混淆矩陣可知,除準(zhǔn)確預(yù)測部分外,嬰兒車大多被預(yù)測為背景。本研究的重點是電動車入戶檢測,對于嬰兒車與電動車的區(qū)分處于較高水準(zhǔn),完全符合工程應(yīng)用需求。
根據(jù)曲線示意圖分析,除嬰兒車預(yù)測外,其他分類的F1范數(shù)、準(zhǔn)確率和召回率均表現(xiàn)良好,證明改進(jìn)后的算法符合設(shè)計初期的需求。
5.2對比實驗
加入CA注意力機制改進(jìn)網(wǎng)絡(luò)后,同時考慮實時性要求,與原版YOLOv5版本進(jìn)行比較,各項性能如表1所示。評估指標(biāo)包括CPU推理速度、典型GPU推理速度、推理參數(shù)量和計算量等。改進(jìn)后的算法雖然在推理速度、推理計算量和參數(shù)量方面均高于原版YO?LOv5算法,但通過犧牲部分實時性性能,提高了平均準(zhǔn)確率。并且改進(jìn)后的算法實時性依然能夠滿足工程應(yīng)用需求,證明算法改進(jìn)是有效的。
5.3模型使用
將訓(xùn)練好的模型用于實際檢測,選取互聯(lián)網(wǎng)上采集到的2020年某電梯監(jiān)控視頻作為測試數(shù)據(jù),檢測效果如圖10所示。該檢測效果表現(xiàn)出色,完全符合工程設(shè)計所設(shè)定的各項要求與標(biāo)準(zhǔn)。
6結(jié)論
本研究開發(fā)了一種基于YOLOv5算法的電梯內(nèi)電動車入戶檢測系統(tǒng),通過加入CA注意力機制優(yōu)化算法,減少了電動車在遮擋情況下的誤識別和漏識別問題,在保證符合工程實時性要求的基礎(chǔ)上提高了檢測準(zhǔn)確性。實驗結(jié)果表明,該系統(tǒng)能夠有效識別電梯內(nèi)的電動車、自行車、輪椅、人員、嬰兒車等5種目標(biāo),并對電動車目標(biāo)重點關(guān)注。所得結(jié)果可與電梯控制系統(tǒng)結(jié)合,減少電動車違規(guī)入戶的情況發(fā)生
本研究為電梯內(nèi)電動車的有效監(jiān)控提供了一種新的技術(shù)手段,有助于減少因電動車違規(guī)入戶導(dǎo)致的安全事故。此外,研究中對YOLOv5算法的優(yōu)化和改進(jìn),也為其他目標(biāo)檢測任務(wù)提供了參考。
為了進(jìn)一步提高系統(tǒng)的實用性和普及性,未來的研究將在以下幾個方面進(jìn)行探索:1)增加數(shù)據(jù)集的多樣性和代表性,以提高算法的泛化能力;2)探索更高效的網(wǎng)絡(luò)結(jié)構(gòu)和目標(biāo)檢測算法,以提升系統(tǒng)性能;3)考慮實際應(yīng)用中的復(fù)雜因素,提高系統(tǒng)的適應(yīng)性和魯棒性;4)構(gòu)建用戶界面和交互設(shè)計,以提升用戶體驗。
參考文獻(xiàn):
[1]趙文涵.新華視點|違規(guī)停放和充電如何治理?:電動自行車安全隱患系列調(diào)查之三-新華網(wǎng)[EB/OL].(2024-03-20)[2024-05-16].http://www.news.cn/politics/20240320/673389cdfe104eda9bb8c3ef3dd365ae/c.html.
[2]劉溫馨,張珺.記者調(diào)查:進(jìn)樓入戶、違規(guī)充電,電動自行車治理難題何解?[EB/OL].[2024-05-16].https://www.thepa?per.cn/newsDetail_forward_27321883.
[3]高層民用建筑消防安全管理規(guī)定[J].中華人民共和國國務(wù)院公報,2021(24):27-34.
[4]胡曉光.電動自行車起火原因與火災(zāi)事故調(diào)查要點分析[J].消防界(電子版),2022,8(7):55-56.
[5]邱景輝.加強電動自行車消防安全風(fēng)險隱患的溯源治理[EB/OL].[2024-05-16].https://www.spp.gov.cn/spp/llyj/202402/t20240229_645595.shtml.
[6]多措并舉,筑牢電動車安全線-新華網(wǎng)[N].光明日報,2024-04-23.
[7]郭琳瑯,于杜周.電梯電動車阻車系統(tǒng)檢驗方法分析[J].特種設(shè)備安全技術(shù),2022(1):34-36.
[8]潘曉英,賈凝心,穆元震,等.小目標(biāo)檢測研究綜述[J].中國圖象圖形學(xué)報,2023,28(9):2587-2615.
[9]MENGLC,DAIXY,CHENYP,etal.Detectionhub:unifyingobjectdetectiondatasetsviaqueryadaptationonlanguageem?bedding[C]//2023IEEE/CVFConferenceonComputerVisionandPatternRecognition(CVPR).June17-24,2023,Vancouver,BC,Canada.IEEE,2023:11402-11411.
[10]謝翔,肖金球,汪俞成,等.基于改進(jìn)YOLOv5s的DeepPCB缺陷檢測算法研究[J].微電子學(xué)與計算機,2023,40(7):1-9.
[11]LIX,CAIZH,ZHAOX.Oriented-YOLOv5:areal-timeori?enteddetectorbasedonYOLOv5[C]//20227thInternationalConferenceonComputerandCommunicationSystems(ICCCS).April22-25,2022,Wuhan,China.IEEE,2022:216-222.
[12]陳震元,王振東,宮辰.圖像級標(biāo)記弱監(jiān)督目標(biāo)檢測綜述[J].中國圖象圖形學(xué)報,2023,28(9):2644-2660.
【通聯(lián)編輯:唐一東】