摘" 要: 在實際場景中,目標之間常常存在重疊或部分遮擋的情況,若是未進行有效的多目標檢測以及了解變規(guī)模網(wǎng)絡(luò)重疊區(qū)域內(nèi)的節(jié)點狀況,會導致目標跟蹤精度下降。對此,提出一種基于改進YOLOV7的變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標跟蹤方法。首先,采用改進YOLOV7對變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標進行檢測;然后,在目標檢測的基礎(chǔ)上,對多目標軌跡特征進行提??;最后,基于提取到的多目標軌跡特征,已知目標的速度、方向與距離,實現(xiàn)變規(guī)模網(wǎng)絡(luò)重疊區(qū)域的多目標跟蹤。實驗結(jié)果表明,所提方法的跟蹤精準度最高達到98%,曼哈頓距離明顯小于對比方法,僅在0.1~-0.1之間,性能較優(yōu),具有實用性。
關(guān)鍵詞: 多目標跟蹤; 重疊區(qū)域; YOLOV7; 多目標檢測; 軌跡特征提??; 曼哈頓距離
中圖分類號: TN911.23?34; TP391" " " " " " " " " "文獻標識碼: A" " " " " " " " " 文章編號: 1004?373X(2024)12?0057?05
Method of improved YOLOV7 based multitarget tracking for overlapping
regions in variable scale networks
WANG Bo, CHAI Rui
(School of Computer Science and Technology, North University of China, Taiyuan 030051, China)
Abstract: In practical scenarios, there is often overlap or partial occlusion between targets. If effective multitarget detection is not carried out to understand the node status in the overlapping area of the variable scale network, it will lead to a decrease in target tracking accuracy. Therefore, an improved YOLOV7 based multi target tracking method for the overlapping area of the variable scale network is proposed. The improved YOLOV7 is used to detect multiple targets in overlapping areas of the variable scale network. On the basis of target detection, multi target trajectory features are extracted. Multitarget tracking for overlapping areas in the variable scale network is realized based on the extracted multitarget trajectory features, and the given speed, direction, and distance of the targets. The experimental results show that the proposed method has a tracking accuracy of up to 98%, and the Manhattan distance is significantly smaller than that of the comparison method, only between 0.1 and -0.1, which has better performance and practicality.
Keywords: multitarget tracking; overlapping regions; YOLOV7; multitarget detection; trajectory feature extraction; Manhattan distance
0" 引" 言
變規(guī)模網(wǎng)絡(luò)是指網(wǎng)絡(luò)規(guī)模在時間和空間上具有動態(tài)變化的特點的一種網(wǎng)絡(luò)。這種網(wǎng)絡(luò)結(jié)構(gòu)可以根據(jù)實時需求、資源分配、拓撲結(jié)構(gòu)等因素進行動態(tài)調(diào)整,以適應不斷變化的環(huán)境和需求。隨著人工智能和計算機視覺技術(shù)的快速發(fā)展,對于高密度目標的準確跟蹤的需求不斷增加[1?3];且當場景中存在多個目標時,目標之間可能會產(chǎn)生遮擋或重疊現(xiàn)象,傳統(tǒng)方法往往難以準確識別和跟蹤這些目標。而多目標跟蹤算法的準確性和穩(wěn)定性很大程度上依賴于提取到的數(shù)據(jù)支撐,如目標的軌跡特征、相似性信息和位置關(guān)系等。因此,研究變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標跟蹤方法具有重要意義[4?5]。
在廣大科研人員的不懈努力下,越來越多的用于網(wǎng)絡(luò)的多目標跟蹤方法被提出。郭嘉等人將緩沖區(qū)與三元組損失融合,將原有的固定模板改為動態(tài)模板,提升復雜環(huán)境下相似度判別的可靠性;然后在模板緩沖區(qū)稀疏地緩存目標外觀以應對跟蹤過程中非語義樣本的干擾,增強目標跟蹤的魯棒性;最后應用三元組損失以充分利用目標的正負樣本特征,使跟蹤更加具有判別能力[6]。李輝等人基于流式分析對網(wǎng)絡(luò)重疊社區(qū)進行識別跟蹤,對網(wǎng)絡(luò)中的邊進行流式處理,每次只處理一條邊且每條邊僅被處理一次。根據(jù)節(jié)點的度、節(jié)點對社區(qū)的貢獻度以及節(jié)點移動前后社區(qū)間連邊數(shù)量的變化等信息對節(jié)點進行劃分[7]。盧錦亮等人研究基于孿生網(wǎng)絡(luò)的多目標跟蹤算法,利用重識別特征對跟蹤算法進行改進。針對基于檢測的跟蹤框架設(shè)計的FairMOT算法中卡爾曼濾波器存在手工設(shè)計關(guān)鍵參數(shù)的問題,完成目標跟蹤[8]。
在實際場景中,目標之間常常存在重疊或部分遮擋的情況,若是未進行有效的多目標檢測,了解變規(guī)模網(wǎng)絡(luò)重疊區(qū)域內(nèi)的節(jié)點狀況,會導致目標跟蹤精度下降[9]。對此,在以上研究方法的基礎(chǔ)上,提出一種基于改進YOLOV7的變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標跟蹤方法。
1" 變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標檢測
為了實現(xiàn)高性能的多目標跟蹤,需要獲取到每個目標的位置,了解變規(guī)模網(wǎng)絡(luò)重疊區(qū)域內(nèi)的節(jié)點狀況,從而為后續(xù)的跟蹤任務提供關(guān)鍵信息,以提高跟蹤效率。YOLOV7算法通過目標檢測任務,能快速高效地識別節(jié)點中的多個目標。由于在變規(guī)模網(wǎng)絡(luò)重疊區(qū)域場景中,YOLOV7檢測精度可能相對較低,為了確保實現(xiàn)多目標跟蹤,有效進行網(wǎng)絡(luò)重疊區(qū)域研究,對YOLOV7算法進行改進,以提高檢測精度。選取效率最高的YOLOV7基礎(chǔ)模型[10?11]加以改進,用于檢測變規(guī)模網(wǎng)絡(luò)重疊區(qū)域中的多個目標,以滿足精度、準確度、速度等各項需求。
YOLOV7基礎(chǔ)模型包含輸入端、骨干網(wǎng)絡(luò)和頭部網(wǎng)絡(luò),各部分功能描述如下。
1) 輸入端:利用混合訓練(Mix up)算法[12]處理網(wǎng)絡(luò)節(jié)點,為權(quán)重訓練提供基礎(chǔ)數(shù)據(jù)。
2) 骨干網(wǎng)絡(luò):該部分由ELAN結(jié)構(gòu)與MP結(jié)構(gòu)組成。前者可豐富網(wǎng)絡(luò)節(jié)點特征,加強模型魯棒性;后者能縮短特征提取時間。
3) 頭部網(wǎng)絡(luò):該部分由基于跨階段局部網(wǎng)絡(luò)[13]的空間金字塔池化結(jié)構(gòu)、金字塔結(jié)構(gòu)及基于VGG16網(wǎng)絡(luò)[14]的推理模型組成。三者的作用分別是擴大感受野、保留關(guān)鍵特征,檢測小目標特征,加快推理速度,縮短檢測時間。
在變規(guī)模網(wǎng)絡(luò)重疊區(qū)域場景下,不同目標之間的相互遮擋、重疊都會增加檢測的難度,而傳統(tǒng)的損失函數(shù)處理重疊問題的效果并不理想。交并比損失函數(shù)可以更準確地衡量目標檢測在重疊區(qū)域的檢測能力,以區(qū)分和定位重疊目標。故從交并比損失函數(shù)入手,改進YOLOV7算法,提高檢測性能。為賦予損失函數(shù)對實況框與預測框重疊情況的描述能力,在YOLOV7中采用完全交并比損失函數(shù)。該函數(shù)的長寬比僅表示縱橫比差異,預測框的高和寬在對應梯度內(nèi)并不與之同步變化,故綜合重疊損失[LIOU]、長寬比損失[Lv]與中心距離損失[Ld],并引入調(diào)節(jié)因子[η],獲取新的損失函數(shù)。
假設(shè)實況框是[A],寬、高為[wz]、[hz],預測框是[B],寬、高為[w]、[h],兩框中心各是[bz]、[b],交并比是[IOUA,B],最小外接矩形寬、高為[wc]、[hc],則獲取改進YOLOV7算法的損失函數(shù),以實現(xiàn)變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標檢測,其表達式為:
[ψ=η?LIOU+Lv+Ld=η?1-IOUA,B+ρb,bzwchc2+ρw,wzwc2+ρh,hzhc2]" " (1)
式中[ρ·,·]代表兩點間的歐氏距離。
基于上述改進YOLOV7算法實現(xiàn)變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標檢測,為后續(xù)的多目標跟蹤提供有效幫助。
2" 變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標跟蹤
2.1" 多目標軌跡特征提取
在上述變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標檢測的基礎(chǔ)上,對多目標軌跡特征進行提取,以進一步輔助目標在重疊區(qū)域中的跟蹤?;谏鲜鰴z測結(jié)果,獲取同一目標的大量軌跡。若目標的軌跡標識是[id],軌跡上點[pi]的時間戳是[ti],該時刻目標的經(jīng)緯度為[Ji]、[Wi],則點[pi]的界定式為:
[pi=id,ti,Ji,Wi,ψ] (2)
由此推導出軌跡界定式:
[G=p1,p2,…,pn]" (3)
式中,[i]表示點數(shù),[i∈n]。
為了提取出更具代表性和穩(wěn)定性的目標運動特征,通過以下步驟充分提取多目標軌跡特征。
1) 運動速度判定:基于目標的運動速度預測目標未來的運動路徑,對于目標跟蹤的持續(xù)性和準確性非常重要,可為目標的跟蹤和路徑規(guī)劃提供依據(jù)。目標從點[pi]運動到點[pi-1]的速度通過下式求解:
[vi,i-1=Ji-Ji-1,Wi-Wi-12Gti-ti-1]" (4)
2) 方向判定:通過分析目標在網(wǎng)絡(luò)節(jié)點中的位置變化,結(jié)合上一節(jié)點或多節(jié)點的軌跡信息,可以計算目標的運動方向,用于識別和分類不同類型的目標行為?;诙鄬訒r空切片法,劃分軌跡為多條切片。若[s]條切片的長度均為[l],則第[j]條的均值點界定式為:
[pj=i=1j·lJi?vi,i-1l,i=1j·lWi?vi,i-1l]" (5)
利用從點[pi]運動到點[pi-1]的速度,獲取該均值點的鄰近點運動向量序列:
[V=Jj+1-Jj?pj,Wj+1-Wj]" "(6)
由此得到各包含[s1]、[s2]條切片的兩條軌跡的運動向量序列[Vs1]、[Vs2]。根據(jù)余弦相似性,利用下式解得兩個軌跡的相似度,實現(xiàn)最大化判定方向一致性。
[ξ=Vs1Vs2Vs12Vs22] (7)
3) 特征軌跡提?。焊鶕?jù)各均值點間的距離最小值,判定軌跡正確性。通過距離計算實現(xiàn)特征軌跡的提取。[DG1,G2]公式為:
[DG1,G2=JG1-JG2ξ,WG1-WG22] (8)
基于上述流程得到多目標軌跡特征。多目標軌跡特征中包含了目標在時間序列中的速度、方向與距離,這些信息可以幫助變規(guī)模網(wǎng)絡(luò)更好地理解目標的動態(tài)行為和運動模式,以更準確地進行目標的跟蹤預測。
2.2" 多目標跟蹤實現(xiàn)
基于上述提取到的多目標軌跡特征,了解目標的速度、方向與距離,并將其作為多目標跟蹤的數(shù)據(jù)支撐,實現(xiàn)多目標跟蹤。運行流程各步驟描述如下。
1) 社區(qū)檢測可以幫助提供關(guān)于變規(guī)模網(wǎng)絡(luò)中節(jié)點之間的相似性或關(guān)聯(lián)性的信息。這些信息可以應用于變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標跟蹤中,用于輔助目標的關(guān)聯(lián)和匹配。其中,一個網(wǎng)絡(luò)節(jié)點可以同時屬于多個社區(qū),設(shè)定跟蹤目標1,根據(jù)其軌跡特征,持續(xù)標記其節(jié)點的中心方位。
2) 若改進YOLOV7算法檢測到網(wǎng)絡(luò)中有新目標2,則節(jié)點中心坐標為[Zx2,y2],判定其與各社區(qū)重疊區(qū)域的位置關(guān)系為:
[Zx2,y2=αx+βylt;0," 在區(qū)域內(nèi)=0," 在線上gt;0," 在區(qū)域外] (9)
式中[αx+βy]指區(qū)域邊界的直線方程。當目標在區(qū)域內(nèi)時,進入下一步;反之,則賦予其新的標記,跳至最后一步。
3) 設(shè)定閾值,獲取重疊社區(qū)里各目標[Zxm,ym]到區(qū)域邊界的距離,用于確定目標是否在重疊區(qū)域以內(nèi),以完成目標跟蹤,表達式為:
[RZxm,ym,DG1,G2=S2△ZPFdPF?ψ] (10)
式中,[P]、[F]為區(qū)域邊界生成時位于線上的兩個基準點,[dPF]表示兩點間距;[S△ZPF]代表兩基準點與目標交點構(gòu)成的三角形面積。
3" 實驗分析
3.1" 實驗環(huán)境
為了驗證本文所提改進YOLOV7方法的有效性和實用性,分別采用不同規(guī)模的人工合成網(wǎng)絡(luò)進行對比實驗,并選用文獻[6]方法與文獻[7]方法作為對比方法。采用LRF程序生成人工合成網(wǎng)絡(luò),用以測試算法在不同規(guī)模網(wǎng)絡(luò)數(shù)據(jù)集下的目標跟蹤性能,詳細參數(shù)如表1所示。其中,[N]表示網(wǎng)絡(luò)的節(jié)點數(shù);[k]表示網(wǎng)絡(luò)的平均度;[on]表示網(wǎng)絡(luò)中重疊節(jié)點的比例;[μ]表示混淆系數(shù)。
3.2" 實驗指標
以目標跟蹤精準度來分析各方法的重疊區(qū)域多目標跟蹤性能,表達式為:
[acc=TPTP+FP×100%] (11)
式中:[TP]代表跟蹤成功的目標個數(shù);[FP]代表跟蹤丟失的目標個數(shù)。
曼哈頓距離(Manhattan Distance)又稱為[L1]距離,用于衡量目標跟蹤的位置準確性,以評估目標的位置偏差程度。[L1]表達式為:
[L1=x2-x1+y2-y1] (12)
式中:[x1,y1]表示預測目標位置的坐標;[x2,y2]表示實際目標位置的坐標。
3.3" 結(jié)果分析
為客觀說明三種方法對重疊區(qū)域的多目標跟蹤能力,采用目標跟蹤精準度、曼哈頓距離等指標評估整體性能。
1) 多目標跟蹤測試結(jié)果
采用三種對比方法對變規(guī)模網(wǎng)絡(luò)中重疊區(qū)域的多目標進行跟蹤,結(jié)果如圖1所示。
根據(jù)圖1可以看出:所提方法的多目標跟蹤效果最好,跟蹤結(jié)果與實際結(jié)果一致;而文獻[6]方法與文獻[7]方法均出現(xiàn)了跟蹤偏差的現(xiàn)象。由此說明,所提方法的多目標跟蹤效果較優(yōu)。所提方法通過改進YOLOV7算法的可靠檢測與目標軌跡特征的充分提取,能夠成功跟蹤絕大多數(shù)的目標。
2) 目標跟蹤精準度測試結(jié)果
基于表1中的參數(shù)進行目標跟蹤精準度測試,三種方法的跟蹤精準度測試結(jié)果如表2所示。
根據(jù)表2可以看出,所提方法的跟蹤精準度明顯高于其他兩個對比方法。所提方法的跟蹤精準度最高達到98%,而對比方法的跟蹤精度均低于90%。由此說明,所提方法的跟蹤性能明顯優(yōu)于對比方法。
3) 曼哈頓距離測試結(jié)果
基于表1中的參數(shù)進行曼哈頓距離測試,三種方法的曼哈頓距離測試結(jié)果如圖2所示。
根據(jù)圖2可以看出:所提方法的曼哈頓距離明顯小于對比方法,僅在0.1~-0.1之間;而文獻[6]方法的曼哈頓距離在0.15~-0.2之間,文獻[7]方法的曼哈頓距離在0.25~-0.25之間。由此說明,所提方法性能較優(yōu),具有實用性。
4" 結(jié)" 論
變規(guī)模網(wǎng)絡(luò)是指網(wǎng)絡(luò)規(guī)模在時間和空間上具有動態(tài)變化特點的一種網(wǎng)絡(luò)。這種網(wǎng)絡(luò)結(jié)構(gòu)可以根據(jù)實時需求、資源分配、拓撲結(jié)構(gòu)等因素進行動態(tài)調(diào)整,以適應不斷變化的環(huán)境和需求。對此,本文提出一種基于改進YOLOV7的變規(guī)模網(wǎng)絡(luò)重疊區(qū)域多目標跟蹤方法。實驗結(jié)果表明,所提方法的跟蹤精準度最高達到98%,曼哈頓距離明顯小于對比方法,僅在0.1~-0.1之間,性能較優(yōu),具有實用性。
參考文獻
[1] DINH D L, NGUYEN H N, THAI H T, et al. Towards AI?based traffic counting system with edge computing [J]. Journal of advanced transportation, 2021(Pt.5): 5551976.1?5551976.15.
[2] 范珍珍,黃小華.微機械傳感器網(wǎng)絡(luò)區(qū)域重疊節(jié)點優(yōu)化調(diào)度方法研究[J].傳感技術(shù)學報,2022,35(12):1707?1711.
[3] KANDASAMY S, MANGAI S. A smart transportation system in VANET based on vehicle geographical tracking and balanced routing protocol [J]. International journal of communication systems, 2021, 34(4): e4714.1?e4714.13.
[4] KUMAR M, MONDAL S. Recent developments on target tracking problems: A review [J]. Ocean engineering, 2021, 236: 109558.1?109558.20.
[5] WANG J, SONG Y, JIANG H, et al. Prototype development of multi?target tracking system for space multi?node laser communication network [J]. Optik, 2023, 274: 170552.
[6] 郭嘉,王鵬,楊永俠,等.結(jié)合緩沖區(qū)與三元組損失的孿生網(wǎng)絡(luò)目標跟蹤[J].激光與光電子學進展,2021(20):365?374.
[7] 李輝,張建朋,陳福才.基于流式分析的大規(guī)模網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)算法[J].電子學報,2022,50(8):1951?1958.
[8] 盧錦亮.基于孿生網(wǎng)絡(luò)的多目標跟蹤算法[J].科技創(chuàng)新與應用,2021,11(27):27?31.
[9] 賽斌,曹自強,譚躍進,等.基于目標跟蹤與軌跡聚類的行人移動數(shù)據(jù)挖掘方法研究[J].系統(tǒng)工程理論與實踐,2021,41(1):231?239.
[10] 薛震,張亮亮,劉吉.基于改進YOLOv7的融合圖像多目標檢測方法[J].兵器裝備工程學報,2023,44(6):166?172.
[11] 王金鵬,周佳良,張躍躍,等.基于優(yōu)選YOLOv7模型的采摘機器人多姿態(tài)火龍果檢測系統(tǒng)[J].農(nóng)業(yè)工程學報,2023,39(8):276?283.
[12] 張云,化青龍,姜義成,等.基于混合型復數(shù)域卷積神經(jīng)網(wǎng)絡(luò)的三維轉(zhuǎn)動艦船目標識別[J].電子學報,2022,50(5):1042?1049.
[13] 曹楨淼,吉衛(wèi)喜,蘇璇,等.基于擴展跨階段局部網(wǎng)絡(luò)的表面缺陷檢測[J].計算機集成制造系統(tǒng),2022,28(8):2399?2407.
[14] 陳瑞瑞.協(xié)同式網(wǎng)絡(luò)多尺度重疊區(qū)域圖像偏色檢測仿真[J].計算機仿真,2020,37(4):352?355.