摘 要:基于GPS數(shù)據(jù)的軌跡生成方法因隱私保護(hù)與成本高的問題而難以應(yīng)用,提出一種基于卡口數(shù)據(jù)生成車輛軌跡的方法。但其面臨以下挑戰(zhàn):首先由于卡口覆蓋率低導(dǎo)致拍攝的軌跡不連續(xù),無法兼容現(xiàn)有模型,且未有工作研究如何有效填補缺失軌跡;其次現(xiàn)有模型忽略路網(wǎng)約束,生成軌跡無法進(jìn)行仿真;最后現(xiàn)有模型無法生成多樣化軌跡,導(dǎo)致可用性較差。為解決以上挑戰(zhàn),首先設(shè)計了TrajGAT-A*模型,通過圖神經(jīng)網(wǎng)絡(luò)構(gòu)建包含實際交通信息的路網(wǎng)拓?fù)鋱D,使用聚類算法構(gòu)造出功能區(qū)網(wǎng)絡(luò)并利用圖注意力網(wǎng)絡(luò)挖掘路網(wǎng)特征,生成路網(wǎng)權(quán)重圖后執(zhí)行A*算法重構(gòu)出連續(xù)軌跡。接著設(shè)計β-TrajVAE模型,通過聚類算法將路網(wǎng)劃分為簇內(nèi)外路段并執(zhí)行分區(qū)采樣,在損失函數(shù)中加入超參數(shù)以控制精度與散度之間的平衡,生成多個制導(dǎo)圖后執(zhí)行A*搜索生成多樣化軌跡。基于重慶數(shù)據(jù)進(jìn)行實驗驗證,結(jié)果顯示重構(gòu)軌跡在precision、recall、F1指標(biāo)上均優(yōu)于現(xiàn)有模型,生成軌跡在cross-entropy上優(yōu)于現(xiàn)有生成模型,并通過仿真實驗證實該方法可生成符合真實交通狀況的軌跡。
關(guān)鍵詞:軌跡生成;A*算法;路徑規(guī)劃;VAE
中圖分類號:TP389.1"" 文獻(xiàn)標(biāo)志碼:A""" 文章編號:1001-3695(2025)03-030-0870-10
doi: 10.19734/j.issn.1001-3695.2024.08.0311
Diversified trajectory generation of urban motor vehiclesbased on traffic road network weight learning
Wang Haoquan1, Zheng Jiaoling1, Qiao Shaojie1, Shuai Yanshu1, Liu Shuangqiao2, Zeng Yu2
(1.School of Software Engineering, Chengdu University of Information Technology, Chengdu 610225, China; 2. Sichuan Efang Intelligence Technology Co., Ltd., Chengdu 610000, China)
Abstract:The acquisition of trajectory generation methods based on GPS data is challenging due to privacy protection and high costs. This study proposed a method for generating vehicle trajectories using checkpoint data, which confronted several challenges. Firstly, the low checkpoint coverage results in discontinuous trajectories that are not compatible with existing mo-dels, and no research has been conducted filling the gaps. Secondly, existing models overlook road network constraints, preventing trajectories suitable for simulation. Lastly, these models lack the capability to produce diverse trajectories, which diminishes their practicality. To tackle these challenges, it developed the TrajGAT-A* model, which utilized a graph neural network to build a costmap rich with actual traffic information, employed a clustering algorithm to create a functional area network and leveraged a graph attention network to extract road network features. After constructing the costmap, it applied the A* algorithm to reconstruct continuous trajectories. Following this, it designed the β-TrajVAE model to segment the road network into intra and inter cluster sections via clustering algorithms and to conduct partitioned sampling. Hyperparameters were incorporated into the loss function to balance accuracy and divergence, leading to the generation of multiple costmaps for executing A* search and producing diverse trajectories. Experimental validation using Chongqing data reveals that the reconstructed trajectories surpass existing models in terms of precision, recall, and F1 metrics. The generated trajectories also outperform existing models in cross-entropy. Simulation experiments confirm that the proposed method is capable of generating trajectories that align with real traffic conditions.
Key words:trajectory generation; A* algorithm; path planning; VAE
0 引言
隨著城市交通的快速發(fā)展和交通管理需求的日益增長,大規(guī)模車輛軌跡數(shù)據(jù)集生成對于信號燈優(yōu)化[1]、交通流分析[2]、事故調(diào)查[3]等領(lǐng)域具有重要意義。目前廣泛采用的車輛軌跡生成方法主要依賴于全球定位系統(tǒng)(GPS)定位數(shù)據(jù)[4],然而,用戶隱私保密協(xié)議以及政府禁止永久儲存城市行人與車輛軌跡等政策使得GPS數(shù)據(jù)獲取成本高昂。
近年來,城市道路中卡口攝像頭覆蓋率的不斷提高,為解決車輛軌跡生成問題提供另一種方法。路網(wǎng)中廣泛分布的卡口攝像頭會時刻記錄下車輛出現(xiàn)的位置和時間信息,為研究人員提供了海量的車輛移動數(shù)據(jù)。因此,本文研究如何利用卡口數(shù)據(jù)生成車輛軌跡。
考慮到龐大且復(fù)雜的城市道路網(wǎng)絡(luò),車輛軌跡重構(gòu)與生成可被認(rèn)定為一種特殊的尋路任務(wù)。早期的研究主要集中在如何將現(xiàn)有的啟發(fā)式搜索算法(如Dijkstra最短路徑算法和A*搜索算法[5])進(jìn)行擴(kuò)展。其中A*算法因其使用啟發(fā)式估計、具有靈活性和剪枝避免重復(fù)等特點,成為了一種被廣泛應(yīng)用于路徑規(guī)劃的算法。隨著深度學(xué)習(xí)的發(fā)展,神經(jīng)網(wǎng)絡(luò)為車輛軌跡重構(gòu)提供了更優(yōu)解決思路。與此同時,圖神經(jīng)模型(GCN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)已被廣泛用于對序列軌跡數(shù)據(jù)進(jìn)行建模[6]。軌跡生成本質(zhì)上是生成問題,根本目的在于學(xué)習(xí)數(shù)據(jù)特征并生成與真實數(shù)據(jù)無法區(qū)分的解集,目前已有許多生成模型可完成此項任務(wù),如自動編碼器(AE)、變分自編碼器(VAE)[7]和生成對抗網(wǎng)絡(luò)(GAN)[8]。
SUMO[9]是一個開源的、多模式的交通仿真軟件,它包含地圖文件和車流文件(圖1),在交通流動分析和城市交通規(guī)劃中發(fā)揮著重要作用。該軟件支持對各種交通模式的仿真,包括汽車、公共交通、行人以及自行車等,且能夠處理復(fù)雜的交通場景。利用SUMO,研究人員和決策者能夠模擬不同的交通策略和政策對城市交通流的影響,識別潛在的交通瓶頸,評估交通管理方案的效果,從而為優(yōu)化城市交通系統(tǒng)提供數(shù)據(jù)支持。
在實際應(yīng)用中(以圖1中相同OD下車流為例),圖1(a)中卡口攝像頭分別在早高峰時間段內(nèi)拍攝到大量過車數(shù)據(jù),其中卡口1和5為交通擁堵的起點和終點,卡口2和4為過車數(shù)量較少的卡口路段,卡口3為交通擁擠的主干道路段。將卡口過車數(shù)據(jù)生成的車輛軌跡輸入SUMO仿真環(huán)境中,如圖1(b)中,最終使得仿真環(huán)境中道路的擁堵情況與卡口所拍攝的一致,即卡口1、3、5對應(yīng)擁擠路段(SUMO中紅色路段),卡口2和4對應(yīng)流量稀疏路段(SUMO中綠色路段,參見電子版)。通過模擬和分析在不同交通條件和管理策略下的車流情況,為城市交通規(guī)劃和管理提供有力的支持。然而先前模型所生成的軌跡在SUMO仿真應(yīng)用中,均無法應(yīng)對以下挑戰(zhàn):
挑戰(zhàn)1:卡口數(shù)據(jù)拍攝的車輛軌跡是不連續(xù)的。如圖1(a)所示,由于卡口攝像頭的安裝和維護(hù),包括硬件、軟件、人力以及運行成本需要投入大量資金,卡口攝像頭在路網(wǎng)覆蓋率普遍在40%以下,車輛軌跡只在部分卡口被拍攝記錄,因此記錄的車輛軌跡為不連通的軌跡序列。然而在SUMO仿真的車流文件中,軌跡必須是連通的序列,否則無法進(jìn)行仿真。
挑戰(zhàn)2:先前的研究中, Choi等人[10]將學(xué)習(xí)觀察到的軌跡中的位置序列形式化為部分可觀察馬爾可夫決策過程中的模仿學(xué)習(xí)問題。然而方法基于GPS數(shù)據(jù),無法適配缺失的卡口數(shù)據(jù)。
挑戰(zhàn)3:基于序列的模型關(guān)注生成軌跡序列的時空性而忽略路網(wǎng)約束。如Zhang等人[11]結(jié)合VAE和VRNN對軌跡進(jìn)行編碼,并基于LSTM生成軌跡后進(jìn)入馬爾可夫模型得到路網(wǎng)約束軌跡;然而如圖1(a)所示,先前模型無法捕獲路網(wǎng)上禁行等約束條件,生成車流文件中的軌跡在標(biāo)有禁左行駛路口依然選擇左轉(zhuǎn),在SUMO仿真時則會發(fā)生異常中斷,無法真正投入使用。
挑戰(zhàn)4:基于軌跡的生成模型無法滿足真實路網(wǎng)中軌跡的多樣化需求。圖1中會有多輛車只在起點和終點被拍攝,然而所花費時間卻不同,表明車輛所選擇的路線不同,起點到終點的潛在通行軌跡理應(yīng)有多條。而現(xiàn)有模型都計算生成軌跡與樣本數(shù)據(jù)的損失,旨在生成無法與樣本數(shù)據(jù)區(qū)分的軌跡,所以訓(xùn)練后只能生成近似樣本的車輛軌跡。在SUMO仿真中,相同OD下的軌跡完全一致,則會導(dǎo)致軌跡中的道路異常擁堵,而臨近道路沒有車輛通行,顯著削弱了仿真結(jié)果的真實性和可靠性。因此在真實路網(wǎng)中,缺失區(qū)域的軌跡理應(yīng)具有多樣性。
基于上述的問題求解:
針對挑戰(zhàn)1和3,Yonetani等人[12]提出Neural A*算法。該算法通過將經(jīng)典的A*搜索算法進(jìn)行微分改造,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò),實現(xiàn)了端到端的路徑規(guī)劃學(xué)習(xí)?;诖耍疚脑O(shè)計一個結(jié)合圖神經(jīng)網(wǎng)絡(luò)和A*的軌跡重構(gòu)模型。a)啟發(fā)式搜索算法A*在本質(zhì)上解決了給定起始點情況下的路徑搜索問題。通過優(yōu)化啟發(fā)函數(shù),它可以有效地生成高質(zhì)量的近似解。b)圖神經(jīng)網(wǎng)絡(luò)在捕獲空間數(shù)據(jù)特征方面的強大使得它能夠自主學(xué)習(xí)路網(wǎng)中重要節(jié)點和給定車輛軌跡的數(shù)據(jù)映射。通過有向圖構(gòu)建出路網(wǎng)權(quán)重圖,搜索出的車輛軌跡完全遵循路網(wǎng)約束,后續(xù)稱為TrajGAT-A*模型。
針對挑戰(zhàn)2,通過聚類算法在路網(wǎng)基礎(chǔ)上構(gòu)建功能區(qū)網(wǎng)絡(luò),用于表示如住宅區(qū)、主干道等特殊交通區(qū)域。通過賦予這些區(qū)域內(nèi)路段更大的權(quán)重,引導(dǎo)A*探索路網(wǎng)中功能區(qū)內(nèi)的路段。
針對挑戰(zhàn)4,Shao等人[13]提出可控變分自編碼器框架,采用非線性PI控制器,通過動態(tài)調(diào)整 KL 散度權(quán)重,實現(xiàn)KL散度的精確控制,而Chen等人[14]通過LSTM生成類似于樣本的軌跡。然而基于序列的VAE模型生成軌跡的同時滿足路網(wǎng)約束是極其困難的,因此提出方法延續(xù)上面任務(wù)中所生成的路網(wǎng)權(quán)重圖,設(shè)計β-TrajVAE生成模型。具體來說,模型將路網(wǎng)權(quán)重圖作為輸入,通過分區(qū)采樣和優(yōu)化損失函數(shù),生成符合特征分布的多個路網(wǎng)權(quán)重圖,執(zhí)行A*搜索后生成多樣化軌跡。
1 問題定義
定義1 道路網(wǎng)絡(luò)。路網(wǎng)使用有向圖G=(V,A)表示,其中V代表路網(wǎng)中道路段節(jié)點,A是由二進(jìn)制值組成的鄰接矩陣,表示路段之間的連通關(guān)系。方法遵循廣泛采用的設(shè)置[15],將路段視為有向圖節(jié)點,并采用反轉(zhuǎn)起終點的方法處理雙向路段。
第1~7行使用聚類算法劃分路段,執(zhí)行分區(qū)采樣獲取到不同的概率密度樣本,從而放大功能區(qū)內(nèi)路段權(quán)重的變化,探索功能區(qū)內(nèi)其他路段,減小功能區(qū)外路段權(quán)重變化,避免關(guān)注不必要的路段。第7~9行解碼器依據(jù)采樣值重構(gòu)出多個路網(wǎng)權(quán)重圖,并通過損失函數(shù)優(yōu)化。
7 實驗
7.1 實驗背景
重慶作為中國西部地區(qū)的經(jīng)濟(jì)中心和交通樞紐之一,有著復(fù)雜的交通路網(wǎng)和日益嚴(yán)重的交通擁堵問題,獲取實時的交通流量和擁堵信息格外重要。
傳統(tǒng)的交通數(shù)據(jù)獲取方法無法精確捕捉城市不同時間段的交通狀況。因此,為了更精確地獲取和分析交通數(shù)據(jù),模型采用卡口數(shù)據(jù)生成車輛軌跡,并結(jié)合仿真技術(shù)模擬多種交通場景和車輛行為。同時由于單一的軌跡生成,無法準(zhǔn)確地模擬復(fù)雜的交通現(xiàn)象和真實的道路行為。通過生成多樣性的軌跡數(shù)據(jù),可以更全面地分析交通擁堵情況。這種多樣性的數(shù)據(jù)不僅有助于識別交通擁堵的形成原因,還能為交通管理者制定更為精準(zhǔn)的優(yōu)化策略和應(yīng)對方案。
綜上所述,車輛軌跡生成技術(shù)在重慶市的交通管理項目中的應(yīng)用,不僅提供了必要的數(shù)據(jù)支持和決策依據(jù),還為城市交通的未來發(fā)展奠定了堅實的基礎(chǔ)。
7.2 實驗?zāi)繕?biāo)
為了驗證引言中所提出的三個挑戰(zhàn),本節(jié)設(shè)計以下研究問題:
RQ1:針對挑戰(zhàn)1,為了驗證模型能夠基于不連續(xù)的卡口數(shù)據(jù)進(jìn)行軌跡重構(gòu),首先基于表2中數(shù)據(jù)構(gòu)造樣本軌跡,將其作為輸入并重構(gòu)出連續(xù)軌跡,設(shè)計了7.4節(jié)中的指標(biāo)來衡量重構(gòu)軌跡的質(zhì)量。
RQ2:針對挑戰(zhàn)2,由于現(xiàn)有重構(gòu)方法都基于連續(xù)軌跡作為樣本,為了與其進(jìn)行對比,實驗采用最短路徑補全卡口間空缺路段,重構(gòu)出連續(xù)的軌跡來進(jìn)行對比,基于7.4節(jié)中的指標(biāo)來衡量重構(gòu)軌跡的質(zhì)量。
同時,為了驗證提出的方法與已有模型所重構(gòu)出軌跡的區(qū)別,設(shè)計軌跡可視化實驗,在圖6中通過對比重構(gòu)軌跡是否經(jīng)過功能區(qū)評判重構(gòu)軌跡的質(zhì)量。
RQ3:針對挑戰(zhàn)3,為了驗證重構(gòu)出的軌跡是否遵循路網(wǎng)約束,實驗將提出的方法和對比模型所重構(gòu)的軌跡輸入SUMO軟件進(jìn)行仿真,設(shè)計7.4節(jié)中指標(biāo)驗證軌跡是否遵循路網(wǎng)約束。
RQ4:為了探究不同模塊和參數(shù)對性能的影響,設(shè)計了消融實驗和參數(shù)敏感性實驗。值得注意的是,本文模型的輸入可以是不連續(xù)軌跡,而已有模型的輸入必須是連續(xù)軌跡,具體實現(xiàn)步驟在7.5節(jié)中進(jìn)行了詳細(xì)描述。
RQ5:針對挑戰(zhàn)4,為了驗證提出的方法能生成多樣性軌跡,首先將TrajGAT-A*模型訓(xùn)練的單個路網(wǎng)權(quán)重圖作為輸入,生成多個路網(wǎng)權(quán)重圖后執(zhí)行A*搜索生成多條軌跡,并設(shè)計了7.4節(jié)中的路段交叉熵指標(biāo)衡量生成軌跡的多樣性。
RQ6:針對挑戰(zhàn)4,選擇TrajVAE和EETG進(jìn)行對比實驗,然而這兩種方法關(guān)注于生成軌跡與樣本數(shù)據(jù)的特征相似度,沒有涉及生成多樣性軌跡的工作,實驗通過修改TrajVAE和EETG的損失函數(shù)產(chǎn)生模型變體,將TrajGAT-A*重構(gòu)軌跡作為輸入以進(jìn)行對比,通過7.4節(jié)中路段交叉熵指標(biāo)驗證軌跡的多樣性。
RQ7:為了測試不同模塊對實驗性能的影響,實驗將TrajGAT-A*模型訓(xùn)練的單個路網(wǎng)權(quán)重圖作為輸入,通過設(shè)計不同的變體進(jìn)行消融實驗,生成多個路網(wǎng)權(quán)重圖后執(zhí)行A*搜索生成多條軌跡,最后仍基于7.4節(jié)中的指標(biāo)衡量生成軌跡的質(zhì)量。
7.3 實驗設(shè)計
7.3.1 卡口數(shù)據(jù)預(yù)處理和設(shè)計
實驗軌跡數(shù)據(jù)選用重慶市大渡口區(qū)一周早高峰時段(7:00~9:00)卡口攝像頭拍攝車輛信息,該數(shù)據(jù)集包含95 000多條車輛軌跡,每條信息包含卡口經(jīng)緯度信息、車牌號碼、拍攝時間、卡口編號等信息,在對車牌號進(jìn)行脫敏處理后的數(shù)據(jù)字段如表2所示。通過排序、卡口匹配、車牌有效性檢測和時間異常檢測等方法處理后,將脫敏數(shù)據(jù)轉(zhuǎn)換成表3的卡口過車數(shù)據(jù)。
7.3.2 SUMO路網(wǎng)設(shè)計
實驗路網(wǎng)數(shù)據(jù)使用重慶市大渡口區(qū)的SUMO路網(wǎng)圖,該地圖包含203個卡口、1 072條路段和578個路口。如圖5所示,將卡口匹配到路網(wǎng)后通過SUMO文件中道路的連接關(guān)系構(gòu)建路網(wǎng)有向圖,以便TrajGAT-A*模型進(jìn)行路徑規(guī)劃。
7.3.3 實驗參數(shù)設(shè)計
所有實驗均在Windows 服務(wù)器(CPU為Intel CoreTM i9-12900H,GPU為NVIDIA GeForce RTX3060)上進(jìn)行,使用 PyTorch 框架進(jìn)行編譯與測試。以7∶2∶1的比例劃分訓(xùn)練集、驗證集和測試集,batch_size大小為100,采用RMSProp和Adam優(yōu)化器進(jìn)行訓(xùn)練,學(xué)習(xí)率設(shè)為0.001。
7.3.4 評估指標(biāo)設(shè)計
對于軌跡重構(gòu)任務(wù),采用先前工作中廣泛使用的各種評價指標(biāo)[17~19],在給定不連通的卡口軌跡T,模型重構(gòu)具有相同起終點的軌跡T′(見目標(biāo)1)。使用精確率、召回率和F1值作為評估重構(gòu)軌跡的指標(biāo):
(22)
精確率和召回率分別計算真實軌跡和重構(gòu)軌跡重疊部分的比率。實驗將重構(gòu)軌跡輸入SUMO軟件進(jìn)行仿真,通過統(tǒng)計出錯的軌跡數(shù)量Eerror占總軌跡數(shù)量Eall的百分比來衡量軌跡是否符合路網(wǎng)約束:
Eratio=EerrorEall
(23)
實驗中統(tǒng)計以1 000條軌跡為一組進(jìn)行衡量。
生成模型的目的是生成符合特征分布但具有多樣性的車輛軌跡。從宏觀角度考慮,使用路段交叉熵(cross-entropy)[24]、卡口位置分布來定量評估生成軌跡的質(zhì)量。
路段交叉熵(cross-entropy):衡量樣本軌跡中路段分布概率P(v)與生成軌跡中路段分布概率Q(v)的交叉熵為
CEr=-∑iP(vi)log Q(vi)
(24)
其中:p(vi)=count(vi in T)n和q(vi)=count(v′i in T′)n分別表示路段在樣本軌跡T中和生成軌跡T′中的概率,當(dāng)CEr越大,生成軌跡越具有多樣性。
卡口位置分布:在駕駛過程中,駕駛員由當(dāng)前路段Vi駛向下一路段Vi+1往往呈現(xiàn)固定方向偏好,在圖1中,車輛在行駛過B4卡口后往往駛向B5卡口,通過統(tǒng)計輸入樣本集中所有被卡口攝像頭拍攝到的節(jié)點并將這一連續(xù)行為定義為狀態(tài)Si,由樣本集中卡口位置分布概率P(Si)和輸出集中卡口位置分布概率Q(Si),計算卡口狀態(tài)分布之間的交叉熵為
CEb=-∑iP(Si)·Q(Si)
(25)
其中:Si表示狀態(tài);-log Q(Si)表示概率的信息量。當(dāng)交叉熵CEb越小時,兩個集合的分布差異越小,軌跡中含有卡口狀態(tài)的概率分布越接近。
7.4 軌跡重構(gòu)實驗
重構(gòu)實驗將卡口過車數(shù)據(jù)劃分成長距離(超過15個卡口)、中距離(5到15個卡口)和短距離(5個卡口以下)任務(wù)。
7.4.1 對比實驗(驗證RQ1和RQ2)
對于TrajGAT-A*模型,給定不連續(xù)的卡口軌跡作為訓(xùn)練樣本,實驗在測試階段隱藏除起點和終點以外所有卡口路段,最終需要重構(gòu)出一條連續(xù)可通行路徑。
基于部分模型需要連續(xù)軌跡作為輸入,實驗采用最短路徑補全空缺路段形成連續(xù)的軌跡,并依據(jù)經(jīng)緯度和拍攝時間轉(zhuǎn)換成帶時間戳的GPS位置序列,選用以下模型進(jìn)行對比。
CTRR[17]:一種考慮個人出行偏好的協(xié)同出行路徑推薦算法。從用戶歷史軌跡轉(zhuǎn)換而來的對數(shù)逆出行行為概率,對道路網(wǎng)絡(luò)圖進(jìn)行加權(quán)。最后,利用Dijkstra算法尋找最小權(quán)值路徑。
AttnMove[18]:通過以細(xì)粒度的時空分辨率恢復(fù)未觀察到的位置來加密車輛個體軌跡,結(jié)合各種軌跡內(nèi)和軌跡間的注意力機(jī)制,并充分利用長期周期性來模擬車輛個體軌跡的模型。
CFST[19]:它利用視覺特征對車輛進(jìn)行聚類,將整個地圖區(qū)域劃分為多個塊,并利用GPS軌跡訓(xùn)練統(tǒng)一的Dirichlet先驗?zāi)P秃蜁r間模型,按塊恢復(fù)和連接軌跡。
NASR+[20]:結(jié)合神經(jīng)網(wǎng)絡(luò)與A*尋路算法的軌跡預(yù)測模型,使用注意力機(jī)制的RNN和圖神經(jīng)網(wǎng)絡(luò)分別對啟發(fā)函數(shù)建模。
TrajRecovery[21]:通過構(gòu)造空間轉(zhuǎn)移概率模型(spatial transfer probabilistic model, STPM)綜合路況和駕駛員行為計算路口轉(zhuǎn)向概率,利用STPM輸出車輛軌跡。
表4列出所有對比模型的F1值實驗結(jié)果,可以看出TrajGAT-A*在重構(gòu)準(zhǔn)確度上明顯優(yōu)于其他模型。AttnMove面對長距離的任務(wù)體現(xiàn)出較低的準(zhǔn)確性,一個可能的原因是無法很好地利用道路網(wǎng)絡(luò)的信息。CFST在短距離任務(wù)中表現(xiàn)良好,但隨著軌跡增長,F(xiàn)1值大幅下降,一個可能的原因是將地圖分區(qū)后,弱化軌跡的OD性導(dǎo)致無法生成較為準(zhǔn)確的路徑。
在圖6中可視化出不同模型在重慶路網(wǎng)上所重構(gòu)的軌跡??梢钥闯觯琓rajGAT-A*模型重構(gòu)出的軌跡在經(jīng)過卡口的同時在空缺部分探索功能區(qū)內(nèi)路段。CTRR和NASR+模型經(jīng)過重構(gòu)的軌跡盡管經(jīng)過卡口,但意外出現(xiàn)探索功能區(qū)外低流量路段,顯然不符合機(jī)動車駕駛規(guī)律。CFST在區(qū)域與區(qū)域連接處無法準(zhǔn)確重構(gòu)出軌跡。
7.4.2 路網(wǎng)約束實驗(驗證RQ3)
為了驗證不同模型重構(gòu)軌跡是否符合路網(wǎng)約束條件,將模型和對比模型重構(gòu)軌跡輸入SUMO軟件進(jìn)行仿真,統(tǒng)計每1 000條軌跡中出錯軌跡數(shù)量。
從表5可以看出,基于GPS數(shù)據(jù)重構(gòu)的軌跡均出現(xiàn)不同程度的錯誤軌跡,而提出方法是根據(jù)道路的連接關(guān)系構(gòu)造有向圖,重構(gòu)出的軌跡完全遵循路網(wǎng)約束,這是所提出方法最大的優(yōu)勢。
7.4.3 消融實驗(驗證RQ4)
為了測試各模塊對實驗結(jié)果的影響,將模型中不同的模塊去除組成不同的變體,以觀測其結(jié)果的變化。TrajGAT-A*-K為去除聚類功能分區(qū)層的模型;TrajGAT-A*-A為去除路段注意力機(jī)制的模型;TrajGAT-A*-KA為去除聚類功能分區(qū)層和路段注意力機(jī)制,只使用簡單GCN的模型。
圖7列出所有消融實驗的結(jié)果。可明顯發(fā)現(xiàn),去除聚類劃分功能區(qū)層的模型在長距離任務(wù)中體現(xiàn)出明顯的性能下降,一個可能的原因是缺少功能區(qū)層對距離遙遠(yuǎn)卻呈現(xiàn)高相關(guān)度節(jié)點的特征學(xué)習(xí)。而去除注意力機(jī)制的模型在短中長任務(wù)中均出現(xiàn)小幅度下將。最后,在只使用簡單圖神經(jīng)網(wǎng)絡(luò)和A*的基線模型仍能有不俗的準(zhǔn)確率,也體現(xiàn)出啟發(fā)式算法結(jié)合神經(jīng)網(wǎng)絡(luò)在解決軌跡重構(gòu)的任務(wù)上有很大的競爭力。
7.4.4 參數(shù)敏感性實驗(驗證RQ4)
為了探究模型最佳性能,本文探究了鄰接矩陣特征維度和多頭注意力個數(shù)對軌跡重構(gòu)質(zhì)量的影響。
1)特征維度 節(jié)點特征向量的長度,即特征矩陣的列數(shù)。低維特征可能會導(dǎo)致信息的丟失,高維特征能捕獲更多的信息與細(xì)節(jié),從而提高模型的表達(dá)能力與性能,如圖8所示。
2)多頭注意力 在每一層中應(yīng)用多個獨立的注意力機(jī)制,每個注意力頭都生成一組注意力權(quán)重并計算輸出,然后將這些輸出進(jìn)行聚合。更多頭數(shù)允許模型從不同的角度和不同的子空間中聚合信息,從而提高模型的表達(dá)能力和性能,如圖9所示。
結(jié)果表明,隨著特征維度提高,模型性能也逐步提高,在特征維度大于256時性能逐漸趨于穩(wěn)定,因此選用256作為特征維度。多頭注意力個數(shù)為8時,重構(gòu)性能達(dá)到最佳。
7.5 軌跡生成實驗
生成軌跡實驗同樣將卡口過車數(shù)據(jù)劃分成長距離(超過15個卡口)、中距離(5~15個卡口)和短距離(5個卡口以下)任務(wù)。給定單個路網(wǎng)權(quán)重圖作為訓(xùn)練數(shù)據(jù),模型生成多個路網(wǎng)權(quán)重圖后執(zhí)行A*搜索生成多條軌跡。
7.5.1 對比實驗(驗證RQ5和RQ6)
基于現(xiàn)有的工作并未涉及生成多樣性軌跡,且需要連續(xù)軌跡作為輸入,實驗采用最短路徑補全空缺路段形成連續(xù)的軌跡,并依據(jù)經(jīng)緯度和拍攝時間轉(zhuǎn)換成帶時間戳的GPS位置序列,實驗選用以下模型對比性能。
TrajVAE[14]:使用LSTM對軌跡特征進(jìn)行建模,然后利用變分自動編碼器(VAE)框架來生成軌跡。實驗將VAE模塊損失函數(shù)替換為本文損失函數(shù)以適應(yīng)多樣性目標(biāo)。
EETG[10]:結(jié)合VAE和VRNN對軌跡進(jìn)行編碼,并基于LSTM生成軌跡后進(jìn)入馬爾可夫模型得到路網(wǎng)約束軌跡。實驗將VAE模塊損失函數(shù)替換為本文損失函數(shù)以適應(yīng)多樣性目標(biāo)。
由表6可以看出,TrajVAE變體在路段交叉熵和卡口位置分布交叉熵這兩個指標(biāo)上變動均不明顯,表明了其生成軌跡盡管符合樣本軌跡的卡口分布,但是缺乏多樣性。EETG在路段交叉熵增大的同時,其卡口位置分布的交叉熵也在顯著增大,表明生成軌跡隨著路段個數(shù)的增長逐漸缺失精度。β-TrajVAE相較于其他方法,其路段交叉熵隨著軌跡長度顯著增加,但是卡口位置分布交叉熵只呈現(xiàn)微弱上升,這表明生成軌跡在滿足卡口位置分布的同時具有多樣性特點。
7.5.2 消融實驗(驗證RQ7)
消融實驗將TrajGAT-A*模型訓(xùn)練的單個路網(wǎng)權(quán)重圖作為輸入,其目標(biāo)是測試不同模塊對生成軌跡多樣性的影響。最終設(shè)計了以下變體。
β-TrajVAE/og:在本文方法的基礎(chǔ)上去除分區(qū)采樣模塊和使用初始損失函數(shù),即基礎(chǔ)的VAE模型。
β-TrajVAE/ns:在本文方法的基礎(chǔ)上去除分區(qū)采樣模塊后的變體。
β-TrajVAE/loss:在本文方法的基礎(chǔ)上只使用初始損失函數(shù)來訓(xùn)練模型。
如表7所示,基礎(chǔ)的VAE生成的軌跡明顯缺乏多樣性。加入分區(qū)采樣和優(yōu)化損失函數(shù)的變體隨著軌跡長度的增加,在保持卡口位置分布交叉熵微小增長的同時,路段交叉熵有著較為明顯的增長,最終表明了模型生成了符合特征分布且具有多樣性的軌跡。
圖10可視化出在重慶路網(wǎng)上相同OD下生成的多樣性軌跡??梢钥闯?,路網(wǎng)權(quán)重圖在經(jīng)過β-TrajVAE訓(xùn)練后生成的軌跡在經(jīng)過樣本軌跡所經(jīng)過的卡口路段時,會在空缺部分探索功能區(qū)內(nèi)其他路段,從而生成多樣性軌跡。
8 結(jié)束語
本文提出了一種基于交通路網(wǎng)權(quán)重學(xué)習(xí)的城市機(jī)動車多樣化軌跡生成方法,其中TrajGAT-A 模型通過結(jié)合圖神經(jīng)網(wǎng)絡(luò)和A*算法,通過構(gòu)造上層網(wǎng)絡(luò)和注意力機(jī)制捕獲相鄰簇和路段的特征。構(gòu)建功能區(qū)網(wǎng)絡(luò)和路段注意力機(jī)制,引導(dǎo)A*算法探索功能區(qū)域,提高軌跡的準(zhǔn)確性。β-TrajVAE模型通過聚類算法劃分簇內(nèi)外路段并分別進(jìn)行采樣,引導(dǎo)A*探索功能區(qū)內(nèi)其他路段的同時避免關(guān)注不必要的路段。最后在損失函數(shù)中加入超參數(shù) β,控制樣本與生成數(shù)據(jù)之間的精度與散度,從而生成具有多樣性的軌跡。
本文方法的核心貢獻(xiàn)在于克服了現(xiàn)有軌跡生成模型的局限性,使其能夠處理不連續(xù)軌跡或非GPS類型的樣本數(shù)據(jù);確保了生成軌跡遵循現(xiàn)實路網(wǎng)約束,使其真正能夠投入實際應(yīng)用;生成多樣性的軌跡從而更好地模擬真實交通狀況。
模型在短中距離和長距離軌跡的生成上均表現(xiàn)優(yōu)越,通過將模型生成軌跡在SUMO軟件應(yīng)用中進(jìn)行仿真,可以精準(zhǔn)地展示城市道路交通擁堵信息,了解不同區(qū)域的車流量和擁堵情況,為交通管理提供數(shù)據(jù)支持。未來的工作將進(jìn)一步考慮車輛行駛速度和時間對軌跡生成的影響,以提升模型的全面性。
參考文獻(xiàn):
[1]Liao Zhuhua, Xiao Hao, Liu Silin,et al. Impact assessing of traffic lights via GPS vehicle trajectories [J]. ISPRS International Journal of Geo-Information, 2021, 10(11): 769.
[2]Khajeh Hosseini M, Talebpour A. Probabilistic traffic state prediction based on vehicle trajectory data [J]. Data Science for Transportation, 2023, 5(3): 22.
[3]Yang Da, Wu Yuezhu, Sun Feng,et al. Freeway accident detection and classification based on the multi-vehicle trajectory data and deep learning model [J]. Transportation Research Part C: Emerging Technologies, 2021, 130: 103303.
[4]Soares de Sousa R, Boukerche A, Loureiro A A F. A novel scalable framework to reconstruct vehicular trajectories from unreliable GPS datasets [J]. IEEE Trans on Intelligent Transportation Systems, 2023, 24(9): 9658-9669.
[5]Wei Lingyin, Zheng Yu, Peng W C,et al. Constructing popular routes from uncertain trajectories [C]//Proc of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2012: 195-203.
[6]Singh D, Srivastava R. Graph neural network with RNNs based tra-jectory prediction of dynamic agents for autonomous vehicle [J]. Applied Intelligence, 2022, 52(11): 12801-12816.
[7]Kingma D P, Welling M. Auto-encoding variational Bayes [EB/OL]. (2013-12-20). https://arxiv.org/abs/1312.6114.
[8]Goodfellow I, Pouget-Abadie J, Mirza M,et al. Generative adversarial networks [J]. Communications of the ACM, 2014, 63: 139-144.
[9]Michael B, Laura B, Jakob E, et al. SUMO-simulation of urban mobility an overview [C]//Proc of the 3rd International Conference on Advances in System Simulation. [S.I.]:IARIA, 2011:63-68.
[10]Choi S, Kim J, Yeo H. TrajGAIL: generating urban vehicle trajectories using generative adversarial imitation learning [J]. Transportation Research Part C: Emerging Technologies, 2021, 128: 103091.
[11]Zhang Liming, Zhao Liang, Pfoser D,et al. Factorized deep generative models for end-to-end trajectory generation with spatiotemporal validity constraints [C]//Proc of the 30th International Conference on Advances in Geographic Information Systems. New York: ACM Press, 2022: 1-12.
[12]Yonetani R, Taniai T, Barekatai M, et al. Path planning using neural A* search [C]//Proc of International Conference On Machine Learning. [S.I.]:PMLR, 2021: 12029-12039.
[13]Shao Huajie, Xiao Zhisheng, Yao Shuochao,et al. ControlVAE: tu-ning, analytical properties, and performance analysis [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2022, 44(12): 9285-9297.
[14]Chen Xinyu, Xu Jiajie, Zhou Rui,et al. TrajVAE: a variational Auto-Encoder model for trajectory generation [J]. Neurocomputing, 2021, 428: 332-339.
[15]Jepsen T S, Jensen C S, Nielsen T D. Relational fusion networks: graph convolutional networks for road networks [J]. IEEE Trans on Intelligent Transportation Systems, 2022, 23(1): 418-429.
[16]Kan Zihan,Liu Dong, Yang Xue, et al. Measuring exposure and contribution of different types of activity travels to traffic congestion using GPS trajectory data [J]. Journal of Transport Geography, 2024, 117: 103896.
[17]Cui Ge, Luo Jun, Wang Xin. Personalized travel route recommendation using collaborative filtering based on GPS trajectories [J]. International Journal of Digital Earth, 2018, 11(3): 284-307.
[18]Xia Tong, Qi Yunhan, Feng Jie, et al. AttnMove: history enhanced trajectory recovery via attentional network [C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2021: 4494-4502.
[19]Yu Fudan, Yan Huan, Chen Rui, et al. City-scale vehicle trajectory data from traffic camera videos [J]. Scientific Data, 2023, 10(1): 711.
[20]Wang Jingyuan, Wu Ning, Zhao W X, et al. Empowering A* search algorithms with neural networks for personalized route recommendation [C]//Proc of the 25th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining. New York: ACM Press, 2019: 539-547.
[21]Wu Dongen, Fang Ziquan, Sun Qichen, et al. TrajRecovery: an efficient vehicle trajectory recovery framework based on urban-scale traffic camera records [C]//Proc of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2024: 5979-5990.
[22]Ng A, Jordan M I, Weiss Y. On spectral clustering: analysis and an algorithm [C]//" Proc of the 14th International Conference on" Neural Information Processing Systems. Cambridge, MA: MIT Press, 2001:849-856.
[23]Keogh E, Ratanamahatana C A. Exact indexing of dynamic time warping [J]. Knowledge and Information Systems, 2005, 7(3): 358-386.
[24]Mao Anqi, Mohri M, Zhong Yutao. Cross-entropy loss functions: theo-retical analysis and applications[EB/OL]. (2023-06-20). https://arxiv.org/abs/2304.07288.