黃承寧,李 娟,陳嘉政
(南京工業(yè)大學(xué)浦江學(xué)院,江蘇 南京 211222)
隨著電子商務(wù)興起,物資調(diào)度系統(tǒng)應(yīng)用已經(jīng)深入到人們的生活學(xué)習(xí)之中,如何讓調(diào)度與物資路線更加智能化、配送成本與效率反相關(guān)等已經(jīng)成為更多研究人員的課題。傳統(tǒng)廣泛應(yīng)用的是蟻群算法為基礎(chǔ)的路徑構(gòu)建[1],但是隨著物資處理數(shù)量劇增,逐漸顯現(xiàn)出計(jì)算復(fù)雜度高、收斂速度慢、全局最優(yōu)缺失等問(wèn)題。在這種情況下準(zhǔn)確的醫(yī)療物資運(yùn)輸和病患分流狀況實(shí)時(shí)預(yù)測(cè)對(duì)于醫(yī)療工作者,確診患者和疑似病患,以及企業(yè)部門和政府而言至關(guān)重要。
隨著移動(dòng)物聯(lián)時(shí)代的到來(lái),各類數(shù)據(jù)呈爆炸式增長(zhǎng),對(duì)于大數(shù)據(jù)的研究已滲透到人們生活的各個(gè)方面。機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法的提出讓研究人員得以充分發(fā)揮數(shù)據(jù)的規(guī)模效應(yīng)。獲取到的大規(guī)模的數(shù)據(jù)在一定程度上把研究人員從愈加復(fù)雜的數(shù)學(xué)模型中解放出來(lái),使得他們專注于數(shù)據(jù)本身,大大提高了系統(tǒng)的適用性、可靠性以及魯棒性[2-3]。機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等前沿技術(shù)在圖像、語(yǔ)音、文字處理等方向的成功應(yīng)用也給物資調(diào)度系統(tǒng)的優(yōu)化帶來(lái)了新的思路。以機(jī)器學(xué)習(xí)算法為基礎(chǔ),以影響資源調(diào)度的各因素作為輸入,以成本節(jié)約最優(yōu)、配送效率最快的配送方案及路線作為輸出,進(jìn)行訓(xùn)練、學(xué)習(xí),得到一種精度高、可靠性高、魯棒性高的物資智能調(diào)度算法。
在交通研究中,交通流量的基本變量即通常選擇速度、體積和密度作為指標(biāo),監(jiān)控交通狀況的當(dāng)前狀態(tài)以及預(yù)測(cè)未來(lái)。根據(jù)預(yù)測(cè)的時(shí)長(zhǎng),流量預(yù)測(cè)通常分為兩個(gè)等級(jí),即短期和中長(zhǎng)期。最普遍統(tǒng)計(jì)方法(例如,線性回歸)能夠在短期預(yù)測(cè)中表現(xiàn)良好。但是,由于對(duì)于交通流量的不確定性和復(fù)雜性,這些方法對(duì)于相對(duì)長(zhǎng)期的預(yù)測(cè)而言效果較差。以前關(guān)于中長(zhǎng)期流量預(yù)測(cè)的研究可以大致分為兩類:動(dòng)態(tài)建模和數(shù)據(jù)驅(qū)動(dòng)的方法[4]。動(dòng)態(tài)建模用數(shù)學(xué)工具和物理通過(guò)計(jì)算來(lái)解決交通問(wèn)題的數(shù)學(xué)建模。為了達(dá)到穩(wěn)定狀態(tài),模擬過(guò)程不僅需要復(fù)雜的系統(tǒng)編程,也消耗了大量計(jì)算功率。不切實(shí)際的假設(shè)和簡(jiǎn)化建模也會(huì)降低預(yù)測(cè)準(zhǔn)確性。因此,隨著交通數(shù)據(jù)收集和存儲(chǔ)技術(shù)的快速發(fā)展,許多研究人員正在將他們的注意力轉(zhuǎn)到數(shù)據(jù)驅(qū)動(dòng)的方法上。
通過(guò)為每個(gè)醫(yī)療點(diǎn)運(yùn)輸路線建模,并記錄每個(gè)節(jié)點(diǎn)與其可能存在交互車輛之間的邊緣,從而獲得交通場(chǎng)景的稀疏點(diǎn)陣,存儲(chǔ)為一個(gè)圖特征。同時(shí),已顯示該機(jī)器學(xué)習(xí)模型,尤其是深度神經(jīng)網(wǎng)絡(luò)在這個(gè)問(wèn)題上表現(xiàn)良好。然而學(xué)習(xí)模型對(duì)固定大小的數(shù)據(jù)進(jìn)行操作并具有固定的空間組織,例如單個(gè)數(shù)據(jù)點(diǎn),時(shí)間序列或圖像輸入。直到最近才出現(xiàn)圖神經(jīng)網(wǎng)絡(luò)(GNN),即人工深度神經(jīng)網(wǎng)絡(luò)在圖數(shù)據(jù)上運(yùn)行的計(jì)算圖模型,并享有顯著成功。這大大改善了可擴(kuò)展性,同時(shí)提高了性能。
GNN在對(duì)圖形中節(jié)點(diǎn)間的依賴關(guān)系進(jìn)行建模方面能力強(qiáng)大,使得圖分析相關(guān)的研究領(lǐng)域取得了突破性進(jìn)展。但由于圖結(jié)構(gòu)數(shù)據(jù)的表示一般是不規(guī)則的,傳統(tǒng)的GNN等模型無(wú)法直接運(yùn)用在圖數(shù)據(jù)上,所以需要在圖上重新定義卷積操作,因此,在捕獲結(jié)構(gòu)化依賴上扮演著中心角色的圖卷積網(wǎng)絡(luò)GCN應(yīng)運(yùn)而生[5-7](見(jiàn)圖1)。
圖1 從GNN到GCN
在智慧醫(yī)療建設(shè)中,除了醫(yī)學(xué)和生物學(xué)研究外,理論研究以及基于統(tǒng)計(jì)或數(shù)學(xué)建模的實(shí)體也可能發(fā)揮不可忽略的作用。對(duì)于了解疫情的流行特征,預(yù)測(cè)疫情并確定遏制蔓延的措施。物資調(diào)度路徑非常適合用圖數(shù)據(jù)來(lái)表達(dá),如調(diào)度路徑網(wǎng)絡(luò)中的節(jié)點(diǎn)以及節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)系。對(duì)于圖數(shù)據(jù)既要考慮節(jié)點(diǎn)信息,也要考慮結(jié)構(gòu)信息,而圖卷積神經(jīng)網(wǎng)絡(luò)正好可以自動(dòng)化地既學(xué)習(xí)節(jié)點(diǎn)特征,又能學(xué)習(xí)節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)聯(lián)信息。因此圖神經(jīng)網(wǎng)絡(luò)模型對(duì)于優(yōu)化控制交通運(yùn)輸有著巨大的作用。
根據(jù)Lef‘evre等人的調(diào)查,將車輛行為預(yù)測(cè)模型分為基于物理、基于機(jī)動(dòng)和交互覺(jué)察三種模型[8]。
基于物理的模型通常假設(shè)車輛沒(méi)有動(dòng)作,而是使用恒定速度或加速度,然后僅根據(jù)物理模型預(yù)測(cè)運(yùn)動(dòng)。這些模型可以用于跟蹤[9],但通常智能預(yù)測(cè)瞬時(shí)運(yùn)動(dòng)狀態(tài)。
基于機(jī)動(dòng)的模型使用一組機(jī)動(dòng)原型并使用基于聚類的聚類直接匹配過(guò)去的軌跡方法或使用機(jī)器從車輛特征學(xué)習(xí)方法[10]。這些做法可以進(jìn)行更復(fù)雜的機(jī)動(dòng),但無(wú)法考慮互動(dòng)。
交互意識(shí)模型旨在根據(jù)已有車輛的狀態(tài)進(jìn)而預(yù)測(cè)車輛輸出模型。這些預(yù)測(cè)模型包括擴(kuò)展沖突的基于機(jī)動(dòng)的模型、耦合隱馬爾可夫模型(HMM)以及對(duì)實(shí)體依賴或基于機(jī)器學(xué)習(xí)的模型等[11]。根據(jù)基于機(jī)器學(xué)習(xí)模型的復(fù)雜度不同,可以使用簡(jiǎn)單的前饋神經(jīng)網(wǎng)絡(luò)創(chuàng)建用于蒙特卡洛的快速模型樹(shù)搜索算法。也可以使用用于相同任務(wù)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),或使用生成對(duì)抗式模仿學(xué)習(xí)從而強(qiáng)化學(xué)習(xí)駕駛行為。
圖像上的卷積規(guī)則網(wǎng)格的標(biāo)準(zhǔn)卷積顯然不適用于一般拓?fù)鋱D。GCN的本質(zhì)目的就是用來(lái)提取拓?fù)鋱D的空間特征。當(dāng)前有兩種基本方法探索如何將CNN概括為結(jié)構(gòu)化數(shù)據(jù)形式。一種是擴(kuò)展卷積的空間定義[12],另一種是在圖傅里葉變換的光譜域[13]。前一種方法將頂點(diǎn)重新排列為可以通過(guò)常規(guī)卷積處理的某些網(wǎng)格形式操作,即空域可以類比到直接在圖片的像素點(diǎn)上進(jìn)行卷積。后者介紹光譜通常在頻譜域中應(yīng)用卷積的框架稱為頻譜圖卷積[14],即頻域可以類比到對(duì)圖片進(jìn)行傅里葉變換后再進(jìn)行卷積。幾次改進(jìn)研究使圖卷積更具前景,將計(jì)算復(fù)雜度從O(n2)降低到線性相關(guān)。
圖卷積神經(jīng)網(wǎng)絡(luò)實(shí)際上跟CNN的作用一樣,就是一個(gè)特征提取器,只不過(guò)它的對(duì)象是圖數(shù)據(jù)。在GCN中,精妙地設(shè)計(jì)了一種從圖數(shù)據(jù)中提取特征的方法,從而可以使用這些特征對(duì)圖數(shù)據(jù)進(jìn)行節(jié)點(diǎn)分類(node classification)、圖分類(graph classification)、邊預(yù)測(cè)(link prediction),還可以得到圖的嵌入表示(graph embedding)[15]。GCN的核心部分就是可以很好地提取圖數(shù)據(jù)結(jié)構(gòu)的特征,通過(guò)kernel小窗口在圖片上平移,通過(guò)卷積的方式來(lái)提取特征,且圖片結(jié)構(gòu)具有平移不變性:一個(gè)小窗口無(wú)論移動(dòng)到圖片的哪一個(gè)位置,其內(nèi)部的結(jié)構(gòu)都是一模一樣的,可以實(shí)現(xiàn)參數(shù)共享。
卷積提取特征過(guò)程如圖2所示。
圖2 卷積提取特征過(guò)程
上文介紹了圖卷積神經(jīng)的概念,假設(shè)基于頻譜圖卷積信號(hào)為G,則G為信號(hào)維度x2Rn與核的乘積,如公式(1)所示。
Gx=(L)x=(UUT)x=U*UTx
(1)
而其中傅里葉變換D∈Rn×n是歸一化拉普拉斯算子的特征向量。
(2)
通過(guò)使用上述算法,可以把交通運(yùn)輸情況轉(zhuǎn)化為大規(guī)模圖數(shù)據(jù)進(jìn)行運(yùn)算,作為疫情期間交通運(yùn)輸?shù)膬?yōu)化策略。
GCN是一種基于節(jié)點(diǎn)的圖分類或預(yù)測(cè)的方法。類似于圖像或時(shí)間序列上的卷積,GCN在所有節(jié)點(diǎn)上應(yīng)用相同的操作。像其他神經(jīng)網(wǎng)絡(luò)一樣,它由一系列相繼應(yīng)用的不同參數(shù)層定義。假設(shè)有一批圖數(shù)據(jù),其中有N個(gè)節(jié)點(diǎn)(node),每個(gè)節(jié)點(diǎn)都有自己的特征,設(shè)這些節(jié)點(diǎn)的特征組成一個(gè)N×D維的矩陣X,然后各個(gè)節(jié)點(diǎn)之間的關(guān)系也會(huì)形成一個(gè)N×N的矩陣A,稱為鄰接矩陣(adjacency matrix)。X和A便是模型的輸入。
在數(shù)據(jù)輸入到輸入層之前要先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)需要進(jìn)行標(biāo)準(zhǔn)化處理才可以使用,若輸入值為像素而像素的大小范圍是在[0,255]之內(nèi),則卷積神經(jīng)網(wǎng)絡(luò)的輸入值是通過(guò)歸一化取得的像素值與255的比值,將數(shù)據(jù)歸一化在[0,1]的區(qū)間范圍內(nèi)。卷積層的功能是對(duì)輸入到卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)進(jìn)行深入的分析得到數(shù)據(jù)的最具有代表性的特征。卷積層是通過(guò)卷積核來(lái)實(shí)現(xiàn)卷積的。卷積層的主要特征在于卷積核、卷積層參數(shù)和激勵(lì)函數(shù)。卷積神經(jīng)網(wǎng)絡(luò)的輸出層的上一層一般是全連接層,把所有的特征都作用在神經(jīng)元上,連接所有學(xué)習(xí)到的特征將輸出值送給分類器,一般選擇Softmax分類器,最終輸出分類標(biāo)簽。
GCN也是一種神經(jīng)網(wǎng)絡(luò),每一層都使用卷積機(jī)制,層與層之間的傳播方式如公式(3):
(3)
其中,H是每一層的特征,對(duì)于輸入層的話,H就是X,H(l+1)是第l層的激活,σ是非線性激活函數(shù),A是在節(jié)點(diǎn)之間添加了自連接的鄰接矩陣,D是度向量A中的一個(gè),而W(l)是第l層可學(xué)習(xí)的權(quán)重矩陣。
通過(guò)公式(3),不僅可以很好地提取圖的特征,且若向GCN輸入一個(gè)圖,通過(guò)若干層GCN每個(gè)node的特征從X變成了Z,無(wú)論中間有多少層,node之間的連接關(guān)系,即A,都是共享的,很好地實(shí)現(xiàn)了層特征傳播。具體圖神經(jīng)卷積[16-17]如圖3所示。
圖3 圖神經(jīng)卷積
這等效于局部頻譜濾波器的一階逼近,但具有兩個(gè)關(guān)鍵優(yōu)勢(shì):圖拉普拉斯算子不需要反轉(zhuǎn),這將導(dǎo)致更高的計(jì)算成本,并且指定了轉(zhuǎn)換l層的大小恰好將節(jié)點(diǎn)的l度鄰域考慮在內(nèi)。因此,計(jì)算復(fù)雜度在邊緣的數(shù)量上線性地縮放,并且可以考慮未直接連接到自我車輛的車輛。這使其比相鄰車輛的直接編碼更有效。
為了探索圖拉普拉斯矩陣為指明的隱藏結(jié)構(gòu),文獻(xiàn)[18]提出了自適應(yīng)圖卷積網(wǎng)絡(luò)(AGCN)。AGCN利用所謂的殘差圖來(lái)擴(kuò)充圖,殘差圖是通過(guò)計(jì)算節(jié)點(diǎn)對(duì)的距離來(lái)構(gòu)造的。盡管AGCN能夠捕獲互補(bǔ)關(guān)系信息,但是以O(shè)(N2)的計(jì)算量為代價(jià)。AGCN通過(guò)圖的鄰接矩陣學(xué)習(xí)未知的隱藏結(jié)構(gòu)關(guān)系。它通過(guò)一個(gè)以兩個(gè)節(jié)點(diǎn)的特征為輸入的可學(xué)習(xí)的距離函數(shù)來(lái)構(gòu)造一個(gè)所謂的殘差圖鄰接矩陣。
在優(yōu)化過(guò)程中主要實(shí)現(xiàn)的目標(biāo):(1)加快算法收斂速度;(2)盡量避過(guò)或沖過(guò)局部極值;(3)減小手工參數(shù)的設(shè)置難度,主要是Learning Rate(LR)。梯度下降是最流行的優(yōu)化算法之一,并且目前為止是優(yōu)化神經(jīng)網(wǎng)絡(luò)最常見(jiàn)的算法。目前每種深度學(xué)習(xí)庫(kù)都包含各自優(yōu)化實(shí)現(xiàn)的梯度下降算法,常見(jiàn)的有Adagrad 、Adadelta、Adam等。在實(shí)驗(yàn)中,每種優(yōu)化算法針對(duì)具體需求各有其優(yōu)缺點(diǎn),通過(guò)對(duì)優(yōu)化過(guò)程中鞍點(diǎn)處理對(duì)比來(lái)看,效果如圖4所示。
圖4 鞍點(diǎn)處優(yōu)化算法比較
對(duì)于GCN,除了提出自適應(yīng)圖卷積網(wǎng)絡(luò)優(yōu)化改進(jìn),還存在一些改進(jìn),但是目前GCN的分類準(zhǔn)確率僅為80%左右,即使增加GCN層數(shù),準(zhǔn)確率也不一定提高。同時(shí)GCN容易受到圖結(jié)構(gòu)的干擾,這些圖是隨機(jī)的或經(jīng)過(guò)對(duì)抗性設(shè)計(jì)的。擾動(dòng)的連接性會(huì)破壞圖結(jié)構(gòu),從而嚴(yán)重影響GCN在半監(jiān)督學(xué)習(xí)(SSL)任務(wù)中的性能。針對(duì)交通中的動(dòng)圖對(duì)GCN健壯性減弱的問(wèn)題,實(shí)驗(yàn)改進(jìn)過(guò)程中生成了多個(gè)輔助圖,每個(gè)輔助圖隨機(jī)地增加或者刪去一些鄰變。配置使用自適應(yīng)(A)GCN在生成輔助圖進(jìn)行半監(jiān)督的學(xué)習(xí)。通過(guò)合適的正則化方法,學(xué)習(xí)到輔助圖融合的權(quán)重,可以實(shí)現(xiàn)保障GCN的健壯性。相對(duì)于GCN,新型AGCN在噪聲輸入,結(jié)構(gòu)微小擾動(dòng)和最先進(jìn)的對(duì)抗性攻擊測(cè)試中均獲得了顯著改善的性能。
在基本GCN的應(yīng)用實(shí)現(xiàn)過(guò)程中,做了重要改變與設(shè)置:其中一項(xiàng)就是剩余權(quán)重,GCN根據(jù)該節(jié)點(diǎn)鄰域的頻譜分解以及添加的自連接,即節(jié)點(diǎn)本身來(lái)計(jì)算該節(jié)點(diǎn)的下一層功能。但是,這意味著GCN不能將節(jié)點(diǎn)的自身特征與其鄰居節(jié)點(diǎn)區(qū)別對(duì)待。在預(yù)測(cè)任務(wù)中,這似乎是良好性能的重要障礙。因此,刪除了自連接,同時(shí)引入了第二個(gè)權(quán)重矩陣,該矩陣定義了自節(jié)點(diǎn)特征的轉(zhuǎn)換。變換方程如公式(4)所示。
按距離的權(quán)重,是指鄰接矩陣可以是二進(jìn)制的也可以是加權(quán)的,通過(guò)反距離評(píng)估加權(quán)邊,自環(huán)設(shè)為1。
前饋輸出,實(shí)驗(yàn)中不再使用完整的GCN,而是將輸出層替換為對(duì)每個(gè)節(jié)點(diǎn)的功能獨(dú)立運(yùn)行的前饋層,如此可以更好地解耦特征提取(發(fā)生在前幾個(gè)GCN層中)和根據(jù)提取的特征進(jìn)行預(yù)測(cè),且GCN層數(shù)不宜多,2~3層(多了容易產(chǎn)生過(guò)平滑現(xiàn)象,同時(shí)加深網(wǎng)絡(luò)會(huì)導(dǎo)致模型的效果變差)的效果最佳。
鑒于網(wǎng)絡(luò)的輸入數(shù)據(jù)存在調(diào)整需求,此時(shí)其數(shù)據(jù)位節(jié)點(diǎn)度、節(jié)點(diǎn)信息,節(jié)點(diǎn)K接鄰居信息的concat結(jié)果,僅為通過(guò)在輸入數(shù)據(jù)中加入度信息和鄰居信息,此情境下若用線性變化和激活函數(shù)代替鄰域節(jié)點(diǎn)聚合操作便能在圖分類任務(wù)上取得很好的效果。
Keras模型有兩種:序貫?zāi)P秃秃瘮?shù)化模型。序貫?zāi)P褪菍訉?duì)象堆疊得到的網(wǎng)絡(luò)模型,序貫?zāi)P筒伙@示定義輸入層,因此在添加第一層時(shí)需要指定輸入數(shù)據(jù)的大??;函數(shù)化模型是將兩個(gè)張量分別定為輸入和輸出,并且將與輸入張量和輸出張量相連接的節(jié)點(diǎn)組合成神經(jīng)網(wǎng)絡(luò)模型,函數(shù)化模型顯示定義了隱含層的張量,因此可以更容易地搭建非序列化模型。
由于之前模型中存在算法收斂速度不夠快和沖過(guò)局部極值等情況,采用了更小的卷積核和更深的模型參數(shù)設(shè)置。
實(shí)驗(yàn)中將文中方法與兩種不同的基于模型的靜態(tài)方法和一種學(xué)習(xí)的方法進(jìn)行比較:CVM模型考慮到每輛車都以與觀察到的最后一幀相同的速度(橫向和縱向)繼續(xù)運(yùn)動(dòng);而IDM是微觀交通模擬的常用驅(qū)動(dòng)程序模型,因?yàn)樗山忉屒覠o(wú)沖突,用它來(lái)預(yù)測(cè)縱向速度的變化并保持車道內(nèi)位置恒定。
IDM的加速度是根據(jù)free road和interaction項(xiàng)計(jì)算得出的。自由道路加速度計(jì)算公式如式(5)所示。
(5)
在最大加速度amax的情況下,加速度指數(shù)和期望速度v0是可調(diào)參數(shù),而當(dāng)前速度v交互項(xiàng)aint定義為:
(6)
到前車的最小距離s0,時(shí)間間隔τ和最大減速度b是可調(diào)參數(shù)。v是車輛的速度,是其前身的閉合速度??偧铀俣仁亲杂傻缆泛徒换プ饔眉铀俣戎汀S捎贗DM僅輸出縱向加速度,因此在使用IDM時(shí)假設(shè)沒(méi)有橫向運(yùn)動(dòng)獲取NGSIM數(shù)據(jù)集的IDM參數(shù),對(duì)于HighD數(shù)據(jù)集,使用引導(dǎo)的隨機(jī)搜索對(duì)IDM的參數(shù)進(jìn)行了調(diào)整,總共有20 000個(gè)樣本,數(shù)值對(duì)比如表1所示。
表1 IDM的優(yōu)化參數(shù)
除了考慮相互作用的模型外,還添加了一個(gè)簡(jiǎn)單的前饋神經(jīng)網(wǎng)絡(luò),僅根據(jù)自運(yùn)載工具的過(guò)去數(shù)據(jù)預(yù)測(cè)軌跡。使用此基準(zhǔn)模型來(lái)衡量通過(guò)將交互包括到模型中而獲得的改進(jìn)。
每個(gè)模型都使用類似的配置:兩層產(chǎn)生256維特征表示,然后是前饋層,產(chǎn)生最終輸出; 所有模型都使用ReLU非線性激活函數(shù),以避免梯度爆炸和梯度消失問(wèn)題。GAT采用了四個(gè)關(guān)注頭,每個(gè)都有64維特征表示。
由于GNN模型使用兩層,因此它們的有效接收?qǐng)鍪亲晕覀鞑スぞ叩膬商徲?。所有模型均以固定長(zhǎng)度的時(shí)間步接收輸入并產(chǎn)生輸出,而不會(huì)重復(fù)發(fā)生。它們經(jīng)過(guò)訓(xùn)練可以預(yù)測(cè)相對(duì)于最后位置的位移,并接收每個(gè)過(guò)去時(shí)間步的位置和速度。它們訓(xùn)練以使所有輸出的均方誤差最小。
在實(shí)驗(yàn)過(guò)程中,為了克服激活函數(shù)存在的參數(shù)更新速度非常慢,甚至?xí)斐呻x期望值越遠(yuǎn),更新越慢的現(xiàn)象,因此在實(shí)驗(yàn)過(guò)程將激活函數(shù)改為交叉熵?fù)p失,此時(shí)梯度不再跟激活函數(shù)的導(dǎo)數(shù)相關(guān),收斂較快,且整個(gè)權(quán)重矩陣的更新都會(huì)加快。
為了驗(yàn)證模型與算法優(yōu)化結(jié)果,以某物流公司的應(yīng)急調(diào)度數(shù)據(jù)為系統(tǒng)測(cè)試:假設(shè)目標(biāo)城市C有5種需要物資,分別為P1、P2、P3、P4、P5,需要調(diào)用物資數(shù)量分別為2 100、4 000、1 000、840和920,物資調(diào)度可用相鄰6個(gè)物資儲(chǔ)備倉(cāng)庫(kù)分別為S1、S2、S3、S4、S5、S6。到C所需時(shí)間為10、13、21、17、29、18。在文中的優(yōu)化神經(jīng)網(wǎng)絡(luò)調(diào)度模型中,可以依據(jù)場(chǎng)地、交通情況、需求緊張等參數(shù),以優(yōu)化的調(diào)度算法實(shí)現(xiàn)最短途徑網(wǎng)絡(luò)運(yùn)輸圖,同時(shí)神經(jīng)網(wǎng)絡(luò)權(quán)值系數(shù)和閾值經(jīng)過(guò)優(yōu)化更新,避免神經(jīng)網(wǎng)絡(luò)陷入局部最小。
在實(shí)驗(yàn)中,通過(guò)測(cè)量地面真實(shí)情況與預(yù)測(cè)之間的位置誤差來(lái)報(bào)告模型的性能。報(bào)告了五秒鐘的平均位移,每個(gè)時(shí)間步均加權(quán),五秒鐘后的最終位移。為確保有意義的結(jié)果,使用隨機(jī)選擇的隨機(jī)種子將每次評(píng)估重復(fù)。在表2中,三組實(shí)驗(yàn)的比較數(shù)據(jù)將所有結(jié)果報(bào)告為平均標(biāo)準(zhǔn)偏差。
表2 實(shí)驗(yàn)數(shù)據(jù)比較
表2中顯示了選擇不同方法時(shí)不同的最優(yōu)選擇:若在標(biāo)準(zhǔn)設(shè)置條件下,GAT方法取得最小偏差1.92;在加入邊權(quán)重條件下,GAT方法取得最小偏差1.93;在加入殘差條件下,GNN方法取得最小偏差1.93;在加入邊界特征條件下,GAT方法取得最小偏差2.40。
從實(shí)驗(yàn)過(guò)程總結(jié)可以發(fā)現(xiàn),充分提取結(jié)構(gòu)信息可以更好地提升神經(jīng)網(wǎng)絡(luò)模型效果,同時(shí)節(jié)點(diǎn)的度是一個(gè)非常重要的特征,也能夠顯著提升模型效果。
文中將交通場(chǎng)景建模為互動(dòng)車輛的圖數(shù)據(jù),從而獲得了靈活而抽象的交互模型,以預(yù)測(cè)未來(lái)交通參與者的行為。使用圖神經(jīng)網(wǎng)絡(luò),用于圖數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)構(gòu)建。實(shí)驗(yàn)中評(píng)估了三個(gè)計(jì)算有效的圖神經(jīng)網(wǎng)絡(luò)方法并針對(duì)方案提出了三種改進(jìn)方案。在具有豐富互動(dòng)(包括互動(dòng))的流量數(shù)據(jù)集中與之前相比,將預(yù)測(cè)誤差降低了30%以上,達(dá)到了最佳基準(zhǔn)模型。同時(shí),沒(méi)有看到幾乎沒(méi)有交互作用的數(shù)據(jù)集的預(yù)測(cè)誤差增加。
盡管提高了預(yù)測(cè)質(zhì)量,但仍有很多工作尚待完成:這項(xiàng)工作僅完成了理論實(shí)驗(yàn)性驗(yàn)證,還有待進(jìn)一步在實(shí)際復(fù)雜交通場(chǎng)景中進(jìn)行預(yù)測(cè)優(yōu)化。將此模型整合到現(xiàn)有模型中最先進(jìn)的方法,尤其是RNN,仍然是開(kāi)放任務(wù)。同時(shí),想探索其他圖構(gòu)造策略,尤其是自動(dòng)尋找相關(guān)的互動(dòng)。但同時(shí),該實(shí)驗(yàn)數(shù)據(jù)對(duì)于計(jì)算現(xiàn)實(shí)交通場(chǎng)景的復(fù)雜度仍具有挑戰(zhàn)性,尤其在交通環(huán)境出現(xiàn)突發(fā)干擾偏差時(shí)。能夠具有瞬時(shí)處理突發(fā)情況的動(dòng)態(tài)模型,仍是研究的突破點(diǎn)和長(zhǎng)久攻堅(jiān)方向。