唐偉文 郭晟楠 陳 煒 林友芳 萬(wàn)懷宇
準(zhǔn)確預(yù)測(cè)未來(lái)交通事故發(fā)生的風(fēng)險(xiǎn),可以大幅減少人員傷亡、降低交通事故造成的經(jīng)濟(jì)損失,對(duì)市民出行、政府管控都具有重要意義.
圍繞這一課題,路段級(jí)的交通事故風(fēng)險(xiǎn)預(yù)測(cè)尤為重要,具有實(shí)際應(yīng)用價(jià)值.因?yàn)?準(zhǔn)確的路段級(jí)的事故風(fēng)險(xiǎn)預(yù)測(cè),可以及時(shí)為交通參與者提供有針對(duì)性的行車建議和預(yù)警信息,保障出行安全.例如,當(dāng)預(yù)測(cè)某個(gè)路段的交通事故風(fēng)險(xiǎn)在未來(lái)一小時(shí)會(huì)激增時(shí),可以對(duì)該路段上正在通行的車輛廣播安全行車準(zhǔn)則,并對(duì)計(jì)劃通行該路段的車輛發(fā)送預(yù)警信息.然而,實(shí)現(xiàn)準(zhǔn)確的路段級(jí)交通事故風(fēng)險(xiǎn)預(yù)測(cè)面臨以下三點(diǎn)挑戰(zhàn).
1)交通事故風(fēng)險(xiǎn)會(huì)受到多源因素的動(dòng)態(tài)影響.具體而言,交通事故風(fēng)險(xiǎn)會(huì)同時(shí)受到交通狀態(tài)和已發(fā)生的交通事故的影響.天氣、溫度和興趣點(diǎn)(Point of Interests, POI)等因素對(duì)交通事故的發(fā)生也存在一定影響.在這些多源影響因素中:少數(shù)是靜態(tài)的,如興趣點(diǎn)的分布;多數(shù)是隨時(shí)間動(dòng)態(tài)變化的,如交通狀態(tài)和天氣.相比靜態(tài)因素,動(dòng)態(tài)因素與交通事故發(fā)生的關(guān)系更加緊密.這些影響因素之間不僅存在直接(一階)相關(guān)性,還存在間接(高階)相關(guān)性,即影響因素之間的潛在關(guān)聯(lián).挖掘影響因素之間的動(dòng)態(tài)、高階相關(guān)性及它們對(duì)交通事故風(fēng)險(xiǎn)的影響是為實(shí)現(xiàn)準(zhǔn)確的路段級(jí)交通事故風(fēng)險(xiǎn)預(yù)測(cè)需要解決的首要問(wèn)題.為了捕捉多源因素的影響,除了交通事故數(shù)據(jù)以外,SDAE(Stack Denoise Autoencoder)[1]還考慮從定位數(shù)據(jù)中獲得的人類移動(dòng)數(shù)據(jù),而SDCAE(Stack Denoise Convolutional Autoencoder)[2]則考慮交通流量數(shù)據(jù).RiskOracle[3]、GSNet(Geographical and Se-mantic Spatial-Temporal Network)[4]和RiskSeq[5]同時(shí)考慮天氣、溫度和交通狀態(tài)數(shù)據(jù).
2)交通事故的發(fā)生存在復(fù)雜的時(shí)空相關(guān)性.在時(shí)間維度上,路段上發(fā)生的歷史事故會(huì)非線性地影響未來(lái)事故的發(fā)生.在空間維度上,事故的發(fā)生會(huì)受到相鄰路段和周圍興趣點(diǎn)的影響,而且影響程度是隨時(shí)間動(dòng)態(tài)變化的.因此需要充分建模時(shí)空相關(guān)性.RiskOracle、GSNet、RiskSeq和DSTGCN(Deep Spatio-Temporal Graph Convolutional Network)[6]采用時(shí)空?qǐng)D卷積網(wǎng)絡(luò)捕捉復(fù)雜的時(shí)空相關(guān)性,實(shí)現(xiàn)準(zhǔn)確的交通事故風(fēng)險(xiǎn)預(yù)測(cè).
3)由于交通事故的發(fā)生是一個(gè)小概率事件,因此經(jīng)統(tǒng)計(jì)得到的全路網(wǎng)的路段級(jí)事故風(fēng)險(xiǎn)中會(huì)出現(xiàn)大量零值,導(dǎo)致模型預(yù)測(cè)值收斂于零值,即出現(xiàn)零膨脹的問(wèn)題[7].而收斂于零的預(yù)測(cè)值對(duì)于實(shí)際應(yīng)用是沒(méi)有意義的.因此,如何克服交通事故風(fēng)險(xiǎn)數(shù)據(jù)的稀疏性,得到具有實(shí)際應(yīng)用意義的預(yù)測(cè)結(jié)果是值得進(jìn)一步思考和解決的問(wèn)題.為了緩解或解決零膨脹問(wèn)題,Wang等[4]提出加權(quán)損失函數(shù),而Wang等[8]提出MVMT-STN(Multi-view Multi-task Spatio-Temporal Networks),采用多任務(wù)學(xué)習(xí)框架,考慮粒度之間的空間關(guān)聯(lián),共同預(yù)測(cè)多粒度交通事故風(fēng)險(xiǎn).
為了解決上述挑戰(zhàn)與問(wèn)題,本文提出融合時(shí)序知識(shí)圖譜的雙層次多視角時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)模型(Two-Level and Multi-view Spatial-Temporal Graph Neural Network by Incorporating Temporal Knowledge Graph, STGN-TKG).首先,構(gòu)建交通事故時(shí)序知識(shí)圖譜,并設(shè)計(jì)可以融入秒級(jí)時(shí)間戳信息的交通事故時(shí)序知識(shí)圖譜歷時(shí)嵌入模型(Diachronic Embedding for Traffic Accident Temporal Knowledge Graph, DETA),建模多源影響因素之間的關(guān)聯(lián)性,并通過(guò)預(yù)訓(xùn)練的方式得到多源影響因素的深層嵌入表示.然后,基于多源影響因素的深層嵌入表示和淺層信息,構(gòu)建兩個(gè)層次(深層與淺層)、三個(gè)語(yǔ)義視角(路段、興趣點(diǎn)和事故風(fēng)險(xiǎn))下的路段關(guān)系圖,并采用空間圖卷積與注意力捕獲交通事故風(fēng)險(xiǎn)的空間相關(guān)性,同時(shí)利用循環(huán)神經(jīng)網(wǎng)絡(luò)和時(shí)間注意力捕獲交通事故風(fēng)險(xiǎn)的時(shí)間相關(guān)性.在不同層次、不同語(yǔ)義視角下,任意圖節(jié)點(diǎn)通過(guò)圖卷積可以聚合與傳播鄰居節(jié)點(diǎn)的信息,獲取局部交通子圖的交通事故風(fēng)險(xiǎn)語(yǔ)義信息.空間注意力會(huì)關(guān)注所有路段,任意路段可以計(jì)算注意力分?jǐn)?shù),對(duì)所有路段的信息進(jìn)行加權(quán)聚合,從而獲取全局的交通事故風(fēng)險(xiǎn)語(yǔ)義信息.此語(yǔ)義信息是雙層次多視角的.循環(huán)神經(jīng)網(wǎng)絡(luò)和時(shí)間注意力挖掘交通事故數(shù)據(jù)中的時(shí)間相關(guān)性,完成不同時(shí)間步之間交通事故風(fēng)險(xiǎn)語(yǔ)義信息的有效傳遞.在兩個(gè)真實(shí)的路段級(jí)交通事故風(fēng)險(xiǎn)數(shù)據(jù)集上的實(shí)驗(yàn)表明,STGN-TKG在預(yù)測(cè)未來(lái)下一個(gè)時(shí)間段所有路段的事故風(fēng)險(xiǎn)的任務(wù)上達(dá)到較佳的預(yù)測(cè)效果.
城市交通事故預(yù)測(cè)是智能交通系統(tǒng)建設(shè)的重點(diǎn)環(huán)節(jié),學(xué)者們?nèi)〉秘S碩的成果.現(xiàn)有的研究方法主要分為兩類:傳統(tǒng)的機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法.
傳統(tǒng)的機(jī)器學(xué)習(xí)方法中具有代表性的方法是支持向量機(jī)(Support Vector Machine, SVM)、負(fù)二項(xiàng)式回歸和決策樹(shù).Sharma等[9]使用帶有高斯核的SVM分析城市交通事故.Caliendo等[10]分別采用泊松、負(fù)二項(xiàng)式和負(fù)多項(xiàng)式的回歸模型模擬事故頻率.Olutayo等[11]使用決策樹(shù)分析最易引發(fā)交通事故的多種因素.然而,早期的這些工作都假設(shè)交通事故的發(fā)生相互獨(dú)立,但這種假設(shè)在實(shí)際中是不滿足的.而且這些方法未考慮天氣、興趣點(diǎn)等外部因素對(duì)交通事故的影響,預(yù)測(cè)準(zhǔn)確率并不理想.
近年來(lái),隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,學(xué)者們提出應(yīng)用于交通事故預(yù)測(cè)的深度學(xué)習(xí)方法.為了挖掘交通事故數(shù)據(jù)和用戶定位數(shù)據(jù),Chen等[1]設(shè)計(jì)SDAE,學(xué)習(xí)人類移動(dòng)的層次特征表示,用于交通事故預(yù)測(cè).為了建模鄰近區(qū)域的空間依賴性,在SDAE的基礎(chǔ)上,Chen等[2]設(shè)計(jì)SDCAE.但SDAE和SDCAE都未考慮數(shù)據(jù)在時(shí)間維度上的動(dòng)態(tài)性.Yuan等[12]提出Hetero-ConvLSTM,捕獲交通事故的空間異質(zhì)性和時(shí)間自相關(guān)性.Zhou等[3]提出RiskOracle,使用差分時(shí)變圖神經(jīng)網(wǎng)絡(luò),捕獲交通流的影響和空間依賴性.Wang等[4]提出GSNet,同時(shí)建模地理空間相關(guān)性和語(yǔ)義空間相關(guān)性.受限于數(shù)據(jù)的零膨脹問(wèn)題,分鐘級(jí)事故預(yù)測(cè)的研究只有RiskOracle和RsikSeq,路段級(jí)事故預(yù)測(cè)的研究只有DSTGCN.
在現(xiàn)有工作中,大多數(shù)是針對(duì)區(qū)域級(jí)事故風(fēng)險(xiǎn)預(yù)測(cè)的研究,針對(duì)路段級(jí)事故風(fēng)險(xiǎn)預(yù)測(cè)的研究很少,但路段級(jí)事故風(fēng)險(xiǎn)預(yù)測(cè)能提供更有針對(duì)性的行車建議和更精確的事故預(yù)警信息,是研究交通事故更具有現(xiàn)實(shí)意義的方式.上述方法都是從淺層次語(yǔ)義視角(如真實(shí)拓?fù)潢P(guān)系)進(jìn)行信息的聚合與傳播,未考慮深層次語(yǔ)義視角(如事故之間潛在的關(guān)聯(lián)性),因此無(wú)法充分捕獲交通事故發(fā)生的規(guī)律和模式.
知識(shí)圖譜(Knowledge Graph, KG)本質(zhì)上是一個(gè)靜態(tài)的多關(guān)系有向圖,形式化表示為
G={(u,r,v)|u∈E,v∈E,r∈R},
其中,E表示實(shí)體集合,R表示關(guān)系集合,(u,r,v)表示頭實(shí)體-關(guān)系-尾實(shí)體構(gòu)成的事實(shí)三元組.
知識(shí)圖譜包含多種類型的實(shí)體(節(jié)點(diǎn))和關(guān)系(邊).因此,根據(jù)圖中不同的邊,可得到一個(gè)實(shí)體的多方面屬性.此外,通過(guò)這些不同的關(guān)系還可以發(fā)現(xiàn)實(shí)體之間的高階相關(guān)性.總之,知識(shí)圖譜具有較強(qiáng)的表征能力.
知識(shí)圖嵌入(KG Embedding, KGE)是將知識(shí)圖譜嵌入低維空間中,學(xué)習(xí)實(shí)體和關(guān)系的表示,能有效挖掘?qū)嶓w之間的高階相關(guān)性.
針對(duì)靜態(tài)知識(shí)圖譜嵌入,已有很多較成熟的解決方案[13-15],其中較經(jīng)典的模型是TransE[16].
為了捕獲數(shù)據(jù)在時(shí)間維度上的信息,關(guān)聯(lián)知識(shí)圖譜中的三元組與時(shí)間戳或時(shí)間間隔t,得到事實(shí)四元組(u,r,v,t),此時(shí)靜態(tài)知識(shí)圖譜就轉(zhuǎn)換為時(shí)序知識(shí)圖譜(Temporal KG, TKG).TKG全面建模數(shù)據(jù)的動(dòng)態(tài)性,應(yīng)用場(chǎng)景豐富.
近些年,一些工作將靜態(tài)知識(shí)圖譜嵌入模型,擴(kuò)展為時(shí)序知識(shí)圖譜嵌入模型.為了擴(kuò)展TransE,Jiang等[17]在評(píng)分函數(shù)中加入一個(gè)時(shí)間戳嵌入.Dasgupta等[18]提出HyTE(Hyperplane-Based Tem-porally Aware KG Embedding),將嵌入投影到時(shí)間戳超平面,再在投影空間上使用TransE的得分函數(shù)計(jì)算分?jǐn)?shù),用于擴(kuò)展TransE.Ma等[19]提出ConT,在評(píng)分函數(shù)中添加時(shí)間戳嵌入,擴(kuò)展一些靜態(tài)知識(shí)圖譜嵌入模型.當(dāng)時(shí)間戳的數(shù)量很大時(shí),上述模型效率不佳.此外,由于它們只學(xué)習(xí)歷史時(shí)間戳的嵌入,因此不能推廣到未來(lái)時(shí)間戳.
針對(duì)上述不足和受歷時(shí)詞嵌入(Diachronic Word Embeddings)的啟發(fā),Goel等[20]提出歷時(shí)嵌入(Diachronic Embedding, DE),在給定實(shí)體和任意時(shí)間戳后,計(jì)算實(shí)體的動(dòng)態(tài)表示,有代表性的模型是DE_SimplE.但DE_SimplE只能提供天級(jí)時(shí)間粒度的實(shí)體表示,為了獲取更細(xì)時(shí)間粒度的實(shí)體表示,本文在DE_SimplE的基礎(chǔ)上添加可以處理秒級(jí)時(shí)間戳的歷時(shí)函數(shù),得到交通事故時(shí)序知識(shí)圖譜歷時(shí)嵌入模型(DETA).
定義1路網(wǎng) 路段級(jí)事故風(fēng)險(xiǎn)預(yù)測(cè)研究的地理范圍是城市行政區(qū).首先借助Python第三方庫(kù)OSMnx獲取行政區(qū)路網(wǎng),再對(duì)道路路段進(jìn)行拼接、過(guò)濾等預(yù)處理,最終獲得長(zhǎng)度在500~2 000 m的路段,路段數(shù)為N.
路網(wǎng)可以視為一個(gè)有向圖
Groad=(V,Eroad,A),
其中,
V={v1,v2,…,vN}
表示路段集合;Eroad?V×V表示邊集,ei, j∈Eroad表示路段i與路段j相鄰;A∈RN×N表示路段鄰接矩陣
為了方便表述,所有路段關(guān)系圖都只由鄰接矩陣定義.
定義4時(shí)序知識(shí)圖譜 時(shí)序知識(shí)圖譜可定義為
G={(u,r,v,t)|u∈E,v∈E,r∈R,t∈T,
φ(u)∈A,φ(v)∈A,φ(r)∈B},
其中,E表示實(shí)體集合;R表示關(guān)系集合;T表示時(shí)間戳集合,時(shí)間戳精度為秒;φ(·)表示實(shí)體到實(shí)體類型的映射函數(shù);φ(·)表示關(guān)系到關(guān)系類型的映射函數(shù);A表示實(shí)體類型集合;B表示關(guān)系類型集合.
給定靜態(tài)數(shù)據(jù)Xs和歷史T個(gè)時(shí)間段的動(dòng)態(tài)數(shù)據(jù)
預(yù)測(cè)未來(lái)下一個(gè)時(shí)間段內(nèi)的所有路段的事故風(fēng)險(xiǎn)Yτ+1.動(dòng)態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)拼接得到最初輸入X.
本文提出融合時(shí)序知識(shí)圖譜的雙層次多視角時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)模型(STGN-TKG),架構(gòu)圖如圖1所示.STGN-TKG主要由四部分組成:時(shí)序知識(shí)圖譜嵌入模塊、雙層次多視角的空間圖卷積注意力模塊、時(shí)序表征模塊和預(yù)測(cè)模塊.
輸入X后,模型首先通過(guò)時(shí)序知識(shí)圖譜嵌入模塊獲取多源影響因素的深層歷時(shí)嵌入,由此,構(gòu)建深層次路段關(guān)系圖,同時(shí)配合路段物理層面的淺層關(guān)系圖,利用雙層次多視角的空間圖注意力模塊捕獲交通事故風(fēng)險(xiǎn)數(shù)據(jù)中的空間信息,再采用時(shí)序表征模塊捕獲交通事故風(fēng)險(xiǎn)數(shù)據(jù)中的時(shí)間相關(guān)性,最后預(yù)測(cè)輸出所有路段的交通事故風(fēng)險(xiǎn).
圖1 STGN-TKG架構(gòu)圖
現(xiàn)有關(guān)于交通事故風(fēng)險(xiǎn)預(yù)測(cè)的工作都是從淺層次語(yǔ)義視角進(jìn)行相關(guān)性建模[1-5],未從深層次語(yǔ)義視角挖掘不同數(shù)據(jù)對(duì)交通事故深層次的復(fù)雜影響.知識(shí)圖嵌入是將知識(shí)圖譜嵌入低維空間中,學(xué)習(xí)實(shí)體和關(guān)系的表示,能有效挖掘?qū)嶓w之間的高階相關(guān)性.因此,知識(shí)圖譜嵌入是處理多源數(shù)據(jù)更佳的方式.考慮到時(shí)間的動(dòng)態(tài)性,本文采用時(shí)序知識(shí)圖譜嵌入.
時(shí)序知識(shí)圖譜嵌入模塊首先基于訓(xùn)練集數(shù)據(jù)構(gòu)建一個(gè)交通事故時(shí)序知識(shí)圖譜,然后設(shè)計(jì)可以融入秒級(jí)時(shí)間戳信息的交通事故時(shí)序知識(shí)圖譜歷時(shí)嵌入模型(DETA),建模多源影響因素之間的動(dòng)態(tài)、高階相關(guān)性,最后通過(guò)預(yù)訓(xùn)練的方式,得到多源影響因素的深層嵌入表示.
3.1.1 構(gòu)建交通事故時(shí)序知識(shí)圖譜
首先,基于訓(xùn)練集數(shù)據(jù)構(gòu)建交通事故時(shí)序知識(shí)圖譜.基于時(shí)序知識(shí)圖譜的定義,給出交通事故時(shí)序知識(shí)圖譜的定義
G={(u,r,v,t)|u∈E,v∈E,r∈R,t∈T,
φ(u)∈A,φ(v)∈A,φ(r)∈B}.
A有6種實(shí)體類型,包括:事故等級(jí)與原因?qū)嶓w、交通狀態(tài)等級(jí)實(shí)體、出租車服務(wù)區(qū)域?qū)嶓w、興趣點(diǎn)實(shí)體、天氣實(shí)體和路段實(shí)體.B有9種關(guān)系類型,包括:天氣狀態(tài)關(guān)系、交通狀態(tài)關(guān)系、區(qū)域相鄰關(guān)系、路段下游關(guān)系、路段交叉關(guān)系、區(qū)域包含興趣點(diǎn)關(guān)系、區(qū)域包含路段關(guān)系、路段鄰近興趣點(diǎn)關(guān)系和事故發(fā)生關(guān)系.所有關(guān)系都是單向關(guān)系,不區(qū)分單向和雙向.T只包括訓(xùn)練集中出現(xiàn)過(guò)的時(shí)間戳.
圖2為交通事故時(shí)序知識(shí)圖譜的一個(gè)實(shí)例,圖中不同的節(jié)點(diǎn)表示不同實(shí)體,不同的邊表示不同的關(guān)系,邊是有向的.
圖2 交通事故時(shí)序知識(shí)圖譜實(shí)例
3.1.2 時(shí)序知識(shí)圖譜歷時(shí)嵌入模型
為了獲得秒級(jí)時(shí)間粒度的歷時(shí)實(shí)體嵌入,本文設(shè)計(jì)可以處理秒級(jí)時(shí)間戳的交通事故時(shí)序知識(shí)圖譜歷時(shí)嵌入模型(DETA).模型由三部分組成:關(guān)系嵌入方法、實(shí)體嵌入方法和得分函數(shù).
1)關(guān)系嵌入方法.關(guān)系r∈R嵌入表示zr的定義如下:
zr[i]={lr[i],tr[i]}, 1≤i≤d,
(1)
(2)
3)得分函數(shù).給定任意事實(shí)四元組f=(u,r,v,t),得分函數(shù)會(huì)給出事實(shí)發(fā)生的概率:
(3)
得分函數(shù)是正向事實(shí)四元組與逆向事實(shí)四元組語(yǔ)義匹配得分的平均值,頭實(shí)體歷時(shí)嵌入經(jīng)過(guò)關(guān)系嵌入的線性映射后得到的嵌入與尾實(shí)體歷時(shí)嵌入越相近,語(yǔ)義匹配得分越高.
3.1.3 歷時(shí)嵌入模型預(yù)訓(xùn)練
基于構(gòu)建好的交通事故時(shí)序知識(shí)圖譜對(duì)DETA進(jìn)行預(yù)訓(xùn)練.在預(yù)訓(xùn)練時(shí),γ設(shè)置為0.32,歷時(shí)嵌入維度為100,訓(xùn)練100輪.對(duì)于任意事實(shí)四元組f=(u,r,v,t),將頭實(shí)體u或尾實(shí)體v隨機(jī)替換為實(shí)體集E的其它實(shí)體e(e≠u且e≠v),得到Nneg個(gè)負(fù)樣本,正樣本則是本身.最后使用交叉熵?fù)p失函數(shù)指導(dǎo)模型正確區(qū)分正負(fù)樣本,即
(4)
其中,Θ表示Nneg個(gè)負(fù)樣本的替換實(shí)體集,ψ(·)表示得分函數(shù).
為了充分挖掘路段之間的空間相關(guān)性對(duì)交通事故的影響,在雙層次多視角的空間圖卷積注意力模塊中設(shè)計(jì)雙層次路段關(guān)系圖,包括基于深層歷時(shí)實(shí)體嵌入得到的深層次路段關(guān)系圖和基于真實(shí)世界的語(yǔ)義構(gòu)建的淺層次路段關(guān)系圖.此外,對(duì)于每個(gè)層次,同時(shí)從路段、興趣點(diǎn)、事故風(fēng)險(xiǎn)三個(gè)語(yǔ)義視角建模路段的鄰接關(guān)系.構(gòu)建雙層次多視角的路段關(guān)系圖后,采用空間圖卷積與多頭自注意力機(jī)制,捕獲交通事故風(fēng)險(xiǎn)的空間相關(guān)性.
3.2.1 淺層次路段關(guān)系圖
在真實(shí)世界的語(yǔ)義空間中,路段存在物理層面的淺層相關(guān)性,對(duì)事故風(fēng)險(xiǎn)有直接影響.
在興趣點(diǎn)語(yǔ)義視角下,計(jì)算的分布是路段附近的興趣點(diǎn)分布,而在事故風(fēng)險(xiǎn)語(yǔ)義視角下,計(jì)算的分布是訓(xùn)練集上路段的事故風(fēng)險(xiǎn)分布.具體計(jì)算過(guò)程如下:
其中,*∈{risk,poi},Ri*∈RL和Rj*∈RL表示路段i和路段j在特定語(yǔ)義視角下的特征分布.
可以提前計(jì)算淺層次路段關(guān)系圖.
3.2.2 深層次路段關(guān)系圖
基于轉(zhuǎn)移矩陣和時(shí)序知識(shí)圖譜嵌入模塊輸出的深層歷時(shí)實(shí)體嵌入矩陣,可以求出路段在不同語(yǔ)義視角下的動(dòng)態(tài)嵌入,再以自適應(yīng)[22]的方式構(gòu)建不同語(yǔ)義視角下的深層次路段關(guān)系圖.具體操作如下:
ReLU(·)表示激活函數(shù).
采用自適應(yīng)的方式構(gòu)建路段關(guān)系圖,可以讓模型感知交通事故對(duì)路網(wǎng)的動(dòng)態(tài)影響,從而實(shí)現(xiàn)更準(zhǔn)確的事故風(fēng)險(xiǎn)預(yù)測(cè).
3.2.3 空間圖卷積注意力模塊
構(gòu)建好雙層次多視角的路段關(guān)系圖后,本文使用兩層的圖卷積進(jìn)行空間信息的聚合與傳播,即
獲取到不同層次、不同視角下的圖卷積輸出后,首先對(duì)相同視角、不同層次的路段表示進(jìn)行加權(quán)融合:
X*=w*Xs*+Xd*,
其中,w*表示可學(xué)習(xí)參數(shù),初始值為0.5.
然后,水平拼接不同語(yǔ)義視角下的路段表示,得到
X′=Xroad‖Xpoi‖Xrisk∈RT×N×(3×D).
空間圖卷積只是獨(dú)立建模路段在不同語(yǔ)義空間中的局部空間相關(guān)性,為了挖掘路段在不同語(yǔ)義空間之間的全局空間相關(guān)性,本文采用多頭自注意力機(jī)制(Multi-head Attention, MHA)[23]進(jìn)行進(jìn)一步處理.該過(guò)程可表述為
除了空間相關(guān)性,交通事故數(shù)據(jù)中也存在明顯的時(shí)間相關(guān)性,包括短期相關(guān)性和長(zhǎng)期相關(guān)性.本文采用GRU(Gated Recurrent Unit)建模數(shù)據(jù)在時(shí)間上的長(zhǎng)短期相關(guān)性,隱藏狀態(tài)
H={h1,h2,…,hT}∈RT×N×dh.
其中,hi∈RN×dh表示所有路段在時(shí)刻t的隱藏狀態(tài)矩陣.
為了更深刻地建模時(shí)間依賴性,并捕獲歷史時(shí)間段對(duì)目標(biāo)時(shí)間段的動(dòng)態(tài)影響,本文引入時(shí)間注意力機(jī)制[24].注意力分?jǐn)?shù)
a=softmax(ReLU(HWX+Eτ+1WE+ba))∈RT,
其中,WX、WE和ba表示可學(xué)習(xí)參數(shù),Eτ+1表示目標(biāo)時(shí)間段的時(shí)間嵌入向量.
基于注意力分?jǐn)?shù),對(duì)每個(gè)時(shí)間段的GRU輸出進(jìn)行加權(quán)聚合,即
關(guān)于損失函數(shù),本文選擇均方誤差(Mean Squared Error, MSE),計(jì)算公式如下:
(5)
模型訓(xùn)練包括預(yù)訓(xùn)練與正式訓(xùn)練,都使用Adam(Adaptive Moment Estimation)優(yōu)化算法[25]進(jìn)行參數(shù)學(xué)習(xí).時(shí)序知識(shí)圖譜嵌入模塊需要進(jìn)行預(yù)訓(xùn)練,式(4)會(huì)指導(dǎo)DETA在交通事故時(shí)序知識(shí)圖譜上進(jìn)行充分訓(xùn)練,完成預(yù)訓(xùn)練的DETA能產(chǎn)生蘊(yùn)含動(dòng)態(tài)、高階相關(guān)性的歷時(shí)實(shí)體嵌入.在正式訓(xùn)練時(shí),式(5)會(huì)指導(dǎo)STGN-TKG在路段級(jí)交通事故風(fēng)險(xiǎn)數(shù)據(jù)集上進(jìn)行充分訓(xùn)練,DETA的參數(shù)也會(huì)進(jìn)行微調(diào),以便更好地適應(yīng)事故風(fēng)險(xiǎn)數(shù)據(jù)集.
基于第三方庫(kù)OSMnx和紐約市公開(kāi)城市數(shù)據(jù)(https://opendata.cityofnewyork.us),本文構(gòu)建兩個(gè)真實(shí)的路段級(jí)交通事故風(fēng)險(xiǎn)數(shù)據(jù)集:布魯克林?jǐn)?shù)據(jù)集和曼哈頓數(shù)據(jù)集,具體時(shí)間跨度為2019年1月1日至2019年12月31日.兩個(gè)數(shù)據(jù)集的統(tǒng)計(jì)情況如表1所示.
表1 數(shù)據(jù)集統(tǒng)計(jì)信息
為了緩解零膨脹問(wèn)題,本文提出事故風(fēng)險(xiǎn)傳播策略:在任意時(shí)間段內(nèi),計(jì)算每個(gè)路段的事故風(fēng)險(xiǎn)后,對(duì)于風(fēng)險(xiǎn)值不為零的路段,將其風(fēng)險(xiǎn)值進(jìn)行輻射性廣播,即
當(dāng)路段上發(fā)生事故時(shí),事故不僅會(huì)影響本路段的風(fēng)險(xiǎn)值,還會(huì)對(duì)通過(guò)路段鄰接關(guān)系影響相鄰路段的事故風(fēng)險(xiǎn)值,即事故的影響會(huì)通過(guò)路網(wǎng)擴(kuò)散.先前關(guān)于交通事故風(fēng)險(xiǎn)預(yù)測(cè)的工作在計(jì)算事故風(fēng)險(xiǎn)時(shí),只考慮事故對(duì)自身路段(區(qū)域)的影響,忽略對(duì)其它路段(區(qū)域)的影響,這樣的風(fēng)險(xiǎn)計(jì)算方式顯然不準(zhǔn)確.而事故風(fēng)險(xiǎn)傳播策略會(huì)以指數(shù)衰減的形式在路網(wǎng)中傳播事故的影響,這是符合實(shí)際場(chǎng)景需求的,因此事故風(fēng)險(xiǎn)傳播策略不僅可以緩解零膨脹問(wèn)題,還可以讓事故風(fēng)險(xiǎn)的計(jì)算方式更合理準(zhǔn)確.
數(shù)據(jù)集按時(shí)間順序以6∶2∶2的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集.時(shí)間段粒度是小時(shí),一天劃分為h=24個(gè)時(shí)間段,一周觀測(cè)w=7天.構(gòu)造樣本時(shí)T取值為7,其中p=3,q=4,樣本標(biāo)簽是未來(lái)一個(gè)小時(shí)內(nèi)所有路段的事故風(fēng)險(xiǎn)值.事故風(fēng)險(xiǎn)傳播策略中k=5.經(jīng)過(guò)參數(shù)搜索,模型在兩個(gè)數(shù)據(jù)集上的重要超參數(shù)設(shè)置如表2所示.
表2 超參數(shù)設(shè)置
本文使用如下3個(gè)指標(biāo)綜合評(píng)估模型的性能.考慮到預(yù)測(cè)任務(wù)是回歸問(wèn)題,本文使用均方根誤差(Root MSE, RMSE)衡量回歸誤差.受相關(guān)論文啟發(fā)[3-4,26],本文研究任務(wù)也可以視為排序問(wèn)題,因此采用召回率(Recall)和平均精度均值(Mean Average Precision, MAP)評(píng)估模型對(duì)高風(fēng)險(xiǎn)路段的排序誤差.評(píng)價(jià)指標(biāo)計(jì)算公式如下:
RMSE關(guān)注預(yù)測(cè)的準(zhǔn)確性,值越小越好,而Recall和MAP關(guān)注高風(fēng)險(xiǎn)路段的召回率和平均精度,值越大越好.在事故風(fēng)險(xiǎn)預(yù)測(cè)中,高風(fēng)險(xiǎn)路段的預(yù)測(cè)結(jié)果更受關(guān)注,也更具有應(yīng)用價(jià)值,因?yàn)楦唢L(fēng)險(xiǎn)路段預(yù)測(cè)準(zhǔn)確比低風(fēng)險(xiǎn)路段預(yù)測(cè)準(zhǔn)確的影響更大,因此Recall和MAP指標(biāo)更具有參考意義.
為了進(jìn)一步檢驗(yàn)?zāi)P驮谑鹿拾l(fā)生概率較高的高峰時(shí)段的預(yù)測(cè)性能,本文還評(píng)估模型在高峰時(shí)段的預(yù)測(cè)性能.經(jīng)過(guò)對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,確定高峰時(shí)段集合為{14,15,16,17,18,19},相應(yīng)的指標(biāo)值符號(hào)為RMSE*、Recall*、MAP*.
本文將STGN-TKG與如下7個(gè)基準(zhǔn)模型進(jìn)行對(duì)比.
1)HA(Historical Average).將樣本輸入中事故風(fēng)險(xiǎn)值序列的均值作為預(yù)測(cè)結(jié)果.
2)MLP.由多層全連接層組成,隱藏層之間設(shè)置激活函數(shù),進(jìn)行轉(zhuǎn)換與激活.
3)SDCAE[2].堆疊多個(gè)去噪卷積層,捕獲地理空間特征,預(yù)測(cè)城市尺度上的交通事故風(fēng)險(xiǎn).
4)GSNet[4].能有效地從地理和語(yǔ)義兩方面捕捉復(fù)雜的時(shí)空關(guān)系,用于交通事故風(fēng)險(xiǎn)預(yù)測(cè).
5)AGCRN(Adaptive Graph Convolutional Re-current Network)[22].基于兩個(gè)增強(qiáng)圖卷積的自適應(yīng)模塊和循環(huán)神經(jīng)網(wǎng)絡(luò),自動(dòng)捕獲交通序列中時(shí)空相關(guān)性.
6)GRU[27].經(jīng)典的時(shí)間序列預(yù)測(cè)模型,可以有效捕獲數(shù)據(jù)在時(shí)間維度上的非線性依賴關(guān)系.
7)ConvLSTM(Convolutional LSTM)[28].結(jié)合CNN(Convolutional Neural Network)和LSTM(Long Short Term Memory),可以對(duì)空間依賴性和時(shí)間依賴性進(jìn)行建模.
各對(duì)比模型在布魯克林、曼哈頓數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表3和表4所示,表中黑體數(shù)字表示最佳值,斜體數(shù)字表示次優(yōu)值.
表3和表4結(jié)果表明,STGN-TKG在幾乎所有場(chǎng)景下都取得最佳值.由于HA無(wú)法捕捉復(fù)雜的時(shí)空相關(guān)性,性能明顯低于深度學(xué)習(xí)方法.MLP結(jié)構(gòu)簡(jiǎn)單,無(wú)法充分捕獲時(shí)空相關(guān)性.GRU只考慮時(shí)間相關(guān)性,卻忽略空間相關(guān)性.SDCAE只通過(guò)CNN提取局部空間相關(guān)性,卻忽略時(shí)間相關(guān)性.因此,這些模型的預(yù)測(cè)效果都不太理想.ConvLSTM同時(shí)考慮時(shí)間相關(guān)性和空間相關(guān)性,相比MLP和GRU,指標(biāo)值有不小的提升.GSNet能充分捕獲多語(yǔ)義時(shí)空相關(guān)性,所以在Recall和MAP指標(biāo)上表現(xiàn)較優(yōu),但由于其未能從深層語(yǔ)義視角進(jìn)行信息的聚合與傳播,導(dǎo)致RMSE指標(biāo)很差.AGCRN雖然能自適應(yīng)地選擇最佳空間模式,并有效建模時(shí)間相關(guān)性,但不能從多個(gè)語(yǔ)義視角建模空間關(guān)系,因此預(yù)測(cè)效果不如STGN-TKG.
總之,所有基準(zhǔn)模型都只是在淺層語(yǔ)義上對(duì)時(shí)空相關(guān)性進(jìn)行建模和捕捉,無(wú)法學(xué)習(xí)和應(yīng)用動(dòng)態(tài)的高階語(yǔ)義信息,并進(jìn)一步提高預(yù)測(cè)性能.而在淺層次路段關(guān)系圖的基礎(chǔ)上,STGN-TKG能借助DETA產(chǎn)生的歷時(shí)實(shí)體嵌入構(gòu)建深層次路段關(guān)系圖,進(jìn)而采用空間圖卷積注意力模塊和時(shí)序表征模塊同時(shí)對(duì)淺層語(yǔ)義和深層語(yǔ)義時(shí)空相關(guān)性進(jìn)行有效挖掘與提取,因此取得最佳的預(yù)測(cè)效果.
表3 各模型在布魯克林?jǐn)?shù)據(jù)集上的預(yù)測(cè)性能
表4 各模型在曼哈頓數(shù)據(jù)集上預(yù)測(cè)性能
為了驗(yàn)證STGN-TKG中設(shè)計(jì)的核心模塊是否對(duì)預(yù)測(cè)效果有提升作用,設(shè)計(jì)如下3個(gè)模型變體.
1)-TKG.移除時(shí)序知識(shí)圖譜嵌入模塊,隨機(jī)初始化向量(torch.nn.Embedding)替換深層歷時(shí)嵌入.
2)-DepthGCN.移除深層次空間圖卷積組件,包括深層次路段關(guān)系圖的構(gòu)建.
3)-SpatialAttn.移除全局空間注意力組件,即不使用多頭自注意力機(jī)制.
在曼哈頓數(shù)據(jù)集上開(kāi)展消融實(shí)驗(yàn),結(jié)果如圖3~圖5所示.由圖可見(jiàn),在RMSE指標(biāo)上,三種變體與完整模型非常接近,但在另外兩個(gè)指標(biāo)上,完整模型優(yōu)勢(shì)明顯.
圖3 兩種時(shí)段的RMSE指標(biāo)對(duì)比
圖4 所有時(shí)段的MAP和Recall指標(biāo)對(duì)比
圖5 高峰時(shí)段的MAP*和Recall*指標(biāo)對(duì)比
對(duì)比-TKG和完整模型可以得出,時(shí)序知識(shí)圖譜嵌入模塊計(jì)算的深層歷時(shí)嵌入蘊(yùn)含實(shí)體的動(dòng)態(tài)性和實(shí)體之間的高階相關(guān)性,從而優(yōu)于自適應(yīng)嵌入方式.-DepthGCN和完整模型的實(shí)驗(yàn)結(jié)果說(shuō)明深層次圖卷積能有效利用基于深層歷時(shí)嵌入構(gòu)建的深層次路段關(guān)系圖進(jìn)行事故空間信息的聚合與傳播.-SpatialAttn和完整模型的實(shí)驗(yàn)結(jié)果則表明多頭自注意力機(jī)制能捕獲路段在不同語(yǔ)義空間之間的全局空間相關(guān)性.
為了研究不同超參數(shù)對(duì)模型性能的影響,選擇對(duì)模型性能影響較大的兩個(gè)超參數(shù),即圖卷積核和注意力頭數(shù)進(jìn)行實(shí)驗(yàn).實(shí)驗(yàn)在曼哈頓數(shù)據(jù)集上開(kāi)展,除了注意力頭數(shù)與卷積核,其余超參數(shù)設(shè)置與最優(yōu)超參數(shù)一致.實(shí)驗(yàn)結(jié)果如圖6和圖7所示,圖中對(duì)比預(yù)測(cè)所有時(shí)段的指標(biāo)值.
由圖6可知,MAP和Recall指標(biāo)雖然有稍許上下波動(dòng),但整體都呈現(xiàn)出先增后減的變化趨勢(shì).由圖7可知,RMSE指標(biāo)變化波動(dòng)較小,注意力頭數(shù)改變時(shí)整體呈現(xiàn)先減后增的變化趨勢(shì),卷積核改變時(shí)呈現(xiàn)明顯的先增后減趨勢(shì).
(a)注意力頭數(shù)
(b)卷積核
(a)注意力頭數(shù)
(b)卷積核
綜合三種指標(biāo)可知,注意力頭數(shù)取值為4或卷積核取值為128時(shí),模型性能最優(yōu).
為了探究事故風(fēng)險(xiǎn)傳播策略的有效性,在曼哈頓數(shù)據(jù)集上開(kāi)展實(shí)驗(yàn),對(duì)比使用與不使用事故風(fēng)險(xiǎn)傳播策略時(shí)的指標(biāo)值,具體如表5所示,表中-AUG表示不使用事故風(fēng)險(xiǎn)傳播策略.模型超參數(shù)設(shè)置相同.
由表5可見(jiàn),雖然RMSE指標(biāo)稍微變差了一些,但Recall和MAP指標(biāo)有大幅提升,說(shuō)明事故風(fēng)險(xiǎn)傳播策略不僅緩解數(shù)據(jù)零膨脹問(wèn)題,而且使交通事故風(fēng)險(xiǎn)的計(jì)算方式更合理,更符合實(shí)際場(chǎng)景,進(jìn)而使模型能更準(zhǔn)確地預(yù)測(cè)高風(fēng)險(xiǎn)路段,顯著提升模型的整體性能.
本文提出融合時(shí)序知識(shí)圖譜的雙層次多視角時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)模型(STGN-TKG).首先,為了充分建模多源數(shù)據(jù)的動(dòng)態(tài)性并挖掘多源數(shù)據(jù)中的高階相關(guān)性,構(gòu)建交通事故時(shí)序知識(shí)圖譜,并設(shè)計(jì)交通事故時(shí)序知識(shí)圖譜歷時(shí)嵌入模型(DETA),進(jìn)行預(yù)訓(xùn)練,獲得多源數(shù)據(jù)的深層嵌入表示.然后,設(shè)計(jì)雙層次多視角的空間圖卷積注意力模塊,從深淺兩個(gè)層次,以及路段、興趣點(diǎn)和事故風(fēng)險(xiǎn)三個(gè)語(yǔ)義視角進(jìn)行空間信息的聚合與傳播,并采用門控循環(huán)單元與時(shí)間注意力捕獲時(shí)間相關(guān)性.為了緩解零膨脹問(wèn)題,提出事故風(fēng)險(xiǎn)傳播策略.最后,在兩個(gè)真實(shí)的路段級(jí)交通事故風(fēng)險(xiǎn)數(shù)據(jù)集上的實(shí)驗(yàn)驗(yàn)證STGN-TKG的優(yōu)越性.針對(duì)零膨脹問(wèn)題,本文只提出事故風(fēng)險(xiǎn)傳播策略,只能緩解此問(wèn)題而并未解決,因此,如何設(shè)計(jì)一種有效的解決方案是進(jìn)一步提升模型事故風(fēng)險(xiǎn)預(yù)測(cè)性能的研究方向之一.