李伯涵,郭茂祖,趙玲玲
(1.北京建筑大學(xué) 電氣與信息工程學(xué)院,北京 100044;2.北京建筑大學(xué) 建筑大數(shù)據(jù)智能處理方法研究北京市重點實驗室,北京 100044;3.哈爾濱工業(yè)大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150001)
流量預(yù)測是實現(xiàn)城市交通智能管理的基石,是構(gòu)建未來智能交通系統(tǒng)(intelligent transportation system,ITS)的必要技術(shù)支撐,其核心是實時準確地預(yù)測城市不同尺度區(qū)域人流的分布和流向,為城市規(guī)劃、交通管理、安全防護、個體化服務(wù)提供可靠依據(jù),從而減少擁堵,提高交通效率,并為公共安全應(yīng)急管理提供早期預(yù)警,優(yōu)化城市交通系統(tǒng)的效率和城市居民的出行體驗[1-2]。
在城市交通流量預(yù)測的相關(guān)研究中,乘客流量的預(yù)測實質(zhì)上就是基于人流特征的預(yù)測,有些針對人流的預(yù)測,根據(jù)人流分布空間的不同可以分為主要道路上的人流量[3]預(yù)測和整個城市范圍的人流量預(yù)測。其中,道路上的人流速度、人流量的研究主要面向部分路段,而不是整個城市范圍,因此該類研究與交通流量預(yù)測更為相關(guān)[4]。城市范圍[2]的人流量預(yù)測又根據(jù)預(yù)測范圍的尺度和形狀差異可以分為針對單個區(qū)域和針對整個城市的研究。針對單個區(qū)域預(yù)測的模型[5],多采用較為復(fù)雜的方法以劃分出不規(guī)則的區(qū)域,并借助馬爾科夫模型進行預(yù)測。針對整個城市的人群預(yù)測[6-7]往往采用多源大數(shù)據(jù)進行分析。
機器學(xué)習框架下的客流量預(yù)測方法差別在于預(yù)測對象和預(yù)測依據(jù)。有些研究[8-10]只針對短期客流進行預(yù)測,不具備遷移能力和普適性。有些研究[11-12]利用了深度學(xué)習、遷移學(xué)習等手段對不同區(qū)域客流進行預(yù)測,但沒有考慮突發(fā)性活動與周期性、趨勢性活動的差異。研究[13]考慮了活動的周期性,同時利用起點—終點(origin-destination,OD)客流數(shù)據(jù)的區(qū)域上下文對活動地區(qū)進行建模,但是忽略了人群活動中有很大一部分屬于突發(fā)性活動,同時沒有考慮外部因素的影響。
預(yù)測客流量也可以建模為時間序列的預(yù)測問題。歷史平均(historical average,HA)模型[14]比較簡單,該模型僅使用歷史時間序列的平均值,來預(yù)測未來時間序列的平均值。然而,該模型無法對動態(tài)事件(如交通事故等突發(fā)事件)做出響應(yīng)。自回歸滑動平均模型(autoregressive integrated moving average model,ARIMA)假設(shè)未來時間序列的值,是歷史值的線性組合與殘差,因此,為了獲得穩(wěn)定的結(jié)果,非穩(wěn)定的時間序列在分析之前需要特殊處理[15]。自回歸滑動平均模型不適合處理有缺失值的時間序列,因為它依賴于非缺失時間序列數(shù)據(jù),隨著應(yīng)用場景復(fù)雜度的提高,數(shù)據(jù)填補技術(shù)將不能滿足需求[16]。在使用自回歸滑動平均模型之前,額外的周期性差異通常應(yīng)用到周期 性時間序列中以獲得穩(wěn)定的結(jié)果,稱之為周期性自回歸整體滑動平均模型(season autoregressive integrated moving average,SARIMA),其不足之處在于它具有較大的時間復(fù)雜度[17]。向量自回歸模型(vector autoregressive,VAR)能夠捕捉非相關(guān)時間序列的線性依賴[18],但是該模型沒有考慮到預(yù)測值和殘差之間的關(guān)系。
Zhang 等[19]定義了區(qū)域數(shù)據(jù)的流入量流出量概念,并且把空間依賴性分為長距離空間依賴和短距離空間依賴,將乘客人群流動的時間特性歸納為3 類:臨近性、周期性和趨勢性,利用不同時空特性的三模塊時空殘差網(wǎng)絡(luò)和外部特征網(wǎng)絡(luò),從多源數(shù)據(jù)中提取與客流量變化密切相關(guān)的抽象特征表示,具有較好的預(yù)測性能。但是,該方法忽略了不同城市功能區(qū)對客流量變化的顯著影響,同時,更為有效的深度學(xué)習機制也有助于模型能力的進一步提升。
針對上述問題,本文構(gòu)建了基于分割注意力機制的殘差網(wǎng)絡(luò)(residual split-attention network,ResNeSt),形成深度時空分割注意力機制殘差網(wǎng)絡(luò)框架(spatio-temporal split-attention networks,STSANet),面向整個城市范圍內(nèi)的乘客人群進行流量預(yù)測。引入分割注意力模塊,實現(xiàn)了跨不同特征圖組的注意力機制,進而更深入地發(fā)掘城市不同時空區(qū)域間多模態(tài)數(shù)據(jù)的特征和關(guān)系[20]。同時,除了對小區(qū)域客流量的時空關(guān)聯(lián)進行挖掘之外,在城市客流量時空數(shù)據(jù)中增加了“城市功能區(qū)屬性”這一新特征,捕捉各區(qū)域客流量變化與所處城市功能區(qū)之間的關(guān)聯(lián)關(guān)系,同時結(jié)合外部特征數(shù)據(jù)形成多模態(tài)數(shù)據(jù)集,進而提升客流量預(yù)測模型的準確性。
Zhang 等[19]提出深度時空殘差網(wǎng)絡(luò)(spatiotemporal residual network,ST-ResNet)的客流量預(yù)測,首先定義了區(qū)域數(shù)據(jù)的流入量流出量概念。將每個時間間隔內(nèi)的流入量和流出量轉(zhuǎn)化成類似于圖像的雙通道矩陣,并按照時間尺度分為3 類:臨近時間段、較近時間段和遙遠時間段,然后將3 個時間段的人流矩陣輸入到不同的模塊中進行建模,從而提取客流群體活動所具備的鄰近性、周期性和趨勢性。
在此基礎(chǔ)上,Zhang 等采用深度時空殘差網(wǎng)絡(luò)模型來進行特征表示學(xué)習和預(yù)測。該網(wǎng)絡(luò)包括3 個主要的殘差網(wǎng)絡(luò)模塊,共享相同網(wǎng)絡(luò)結(jié)構(gòu)。每個模塊的輸入都是一個矩陣X。以鄰近性模塊為例,一個時間間隔內(nèi)的數(shù)據(jù)可以表示為
式(1)稱為鄰近性依賴矩陣,其中l(wèi)c為時間間隔,c下標代表了卷積層,然后按照時間軸將其連接為一個矩陣:∈T2lc×I×J。其中T2lc×I×J表示維度為 2lc×I×J的矩陣的集合,隨后輸入到一個卷積單元:
每一個卷積操作中堆疊L個殘差單元,即:
式中:F是殘差方程(即兩個ReLU 和卷積的組合),θ(1)包括所有第l層需要學(xué)習的參數(shù)。同樣,在ReLu 之前,使用批歸一化(batch normalization,BN)。在頂端的第L層殘差單元輸出為
將3 個模塊的結(jié)果進行拼接,調(diào)用Tanh 激活函數(shù),結(jié)合外部因素模塊,最終計算Loss 值,訓(xùn)練得到城市區(qū)域客流量預(yù)測模型。
本文以城市區(qū)域的流入流出量、當前城市功能區(qū)域分布、天氣節(jié)假日等外部特征3 類異構(gòu)數(shù)據(jù)來源為基礎(chǔ),以Deep&Wide 網(wǎng)絡(luò)為框架,提出包括4 個主要網(wǎng)絡(luò)模塊的多源時空客流量預(yù)測方法。
為了更好地提取與城市區(qū)域客流量相關(guān)的特征,以ST-ResNet 框架為基礎(chǔ),在空間依賴性、時間依賴性以及外部因素之上,引入“城市功能區(qū)屬性”作為重要的特征。其原因在于不同時段的客流量變化與區(qū)域功能屬性密切相關(guān)。如工作日的上班早高峰時間段,住宅區(qū)和商業(yè)區(qū)的人口密度與客流量變化會明顯多于其他功能區(qū)。同時,以ST-SANet 來提取區(qū)域客流量的時空抽象特征。
將數(shù)據(jù)集劃分為鄰近時段(Xclose)、較近時段(Xperiod)、遙遠時段(Xtrend)數(shù)據(jù),采用ST-SANet 分別對活動鄰近性、周期性、趨勢性進行建模,動態(tài)聚合3 個網(wǎng)絡(luò)模塊的輸出,為不同模態(tài)的特征分配不同的權(quán)重。采用全連接網(wǎng)絡(luò)對節(jié)假日、天氣等外部影響因子進行建模。最后將得到的特征進行拼接,利用激活函數(shù)實現(xiàn)對小區(qū)域客流量的預(yù)測,整體結(jié)構(gòu)如圖1 所示。
圖1 分割注意力機制殘差網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Structure diagram of split-attention residual network
2.1.1 帶有城市功能區(qū)域?qū)傩缘牧魅肓鞒鼍仃嚇?gòu)建
輸入為表征小區(qū)域流入流出量、功能區(qū)域?qū)傩缘? 維向量:Xt=(fint,foutt,Func,t)形成的矩陣,其中 fint、foutt分別代表t時刻區(qū)域流入量以及流出量,F(xiàn)unc,t為6 位one-hot 編碼向量,表征了功能區(qū)域?qū)傩浴?/p>
本文根據(jù)北京市經(jīng)緯度范圍將整個市區(qū)劃分為32 ×32 個柵格區(qū)域,參考北京市功能區(qū)分布將各區(qū)域劃分為“居住區(qū)”、“商業(yè)區(qū)”、“文教區(qū)”、“行政區(qū)”、“休閑區(qū)”。每個柵格內(nèi)選取比重較大的一至三類功能區(qū)屬性作為劃分依據(jù),如圖2 所示。
圖2 城市功能區(qū)劃分示意圖Fig.2 Schematic diagram of urban functional area division
將包含了城市功能區(qū)特征和時空流入流出量信息的數(shù)據(jù),繪制成流入量流出量熱力圖[21-22],按照時間軸分成較近時間段、臨近時間段以及遙遠時間段3 類,然后將3 類數(shù)據(jù)輸入到對應(yīng)的模塊中進行建模,從而提取前述的活動鄰近性、周期性以及趨勢性。3 個模塊共享相同的網(wǎng)絡(luò)結(jié)構(gòu),且彼此相互獨立,都采用了卷積神經(jīng)網(wǎng)絡(luò)、殘差單元序列、分割注意力機制模塊結(jié)構(gòu)。相較于原始模型,改進后的結(jié)構(gòu)能夠更動態(tài)地提取影響程度較大的數(shù)據(jù)特征,更準確地捕捉數(shù)據(jù)中的潛在關(guān)聯(lián)性[23]。
為前3 個主要模塊的輸出分配相應(yīng)的權(quán)值后,融合為一個結(jié)果矩陣。然后將主要模塊的結(jié)果矩陣與外部特征模塊的結(jié)果矩陣進行拼接。最后用Tanh 函數(shù)將融合后的輸出映射到區(qū)間[-1,1]中。在反向傳播中,Tanh 函數(shù)比標準邏輯函數(shù)收斂得更快[24]。
2.1.2 ST-SANet 構(gòu)架
圖1 展示了ST-SANet 的架構(gòu),模型的主體為上半部分的3 個模塊,分別對鄰近性、周期性、趨勢性進行建模,每個模塊由兩個主要子模塊組成,分別是殘差單元和分割注意力機制模塊。整個城市范圍內(nèi)的數(shù)據(jù)量非常龐大,同時包含許多不同屬性的區(qū)域,使得抽象數(shù)據(jù)中隱藏了大量多元化的特征信息,本文在殘差網(wǎng)絡(luò)算法(residual network,ResNet)的基礎(chǔ)上引入了分割注意力機制,使模型具備了多模態(tài)數(shù)據(jù)特征提取的能力,進而深入地發(fā)掘了更多維度數(shù)據(jù)信息。通過在ResNet 結(jié)構(gòu)中堆疊分割注意力機制模塊,形成了新的ResNet變體ResNeSt[25]。它保留了整個ResNet 結(jié)構(gòu),以便直接用于下游任務(wù),而不引入額外的計算成本。
分割注意力機制模塊中同一層的多個卷積核相互獨立,可以各自提取特征,使得模型具有提取多元化信息的特性。
殘差模塊輸出為維度h=32、w=32、c=8 的矩陣X∈Th×w×c,并作為分割注意力機制模塊的輸入,ResNeSt 算法中的特征圖組與ResNeXt 算法[26]相似,特征可以分為若干組,特征圖組的數(shù)量由超參數(shù)K提供[27-29],以此種方式將輸入的特征分成了若干基組(Cardinal 組),如圖3 所示。
圖3 分割注意力機制模塊Fig.3 Model of split-attention
在每個相互獨立的基組中,又把輸入分成了多個分支,每個分支的注意力層能夠提供捕捉特征相關(guān)性的網(wǎng)絡(luò)機制,通過引入自注意力機制實現(xiàn)特征分支間的權(quán)重分配,如圖4 所示。
圖4 組群中的注意力機制分支Fig.4 Branches of Split-attention in groups
此處涉及了第二個超參數(shù)R,將特征分成了若干基組的組內(nèi)分支(Radix 分支),后文簡稱為“組內(nèi)分支”,使得模型能進一步地提取具有多元化屬性的特征。
在組內(nèi)分支中首先將特征求和并進行全局池化操作,然后使用卷積等操作進行權(quán)重系數(shù)的分配。第一組卷積的輸出維度為4 維,作為縮放系數(shù)用于減少參數(shù)量;第二組卷積的輸出維度通道數(shù)乘以組內(nèi)分支數(shù),保持了與組內(nèi)分支特征層相對應(yīng)的維度。為了確保組內(nèi)分支間特征層的權(quán)重獨立分布,使用n-Softmax 對各組內(nèi)分支的權(quán)重分別計算,最后將各組對應(yīng)的特征層與注意力系數(shù)相乘再求和。
上文提到的超參數(shù)R描述了基數(shù)組內(nèi)的分支模塊數(shù)目,因此特征組的總數(shù)為G=K×R
并應(yīng)用一系列變換 {F1,F2,···,FG}得到每個單獨的組,各組的中間量表示為u:
基組可以通過多個組內(nèi)分支逐元素求和來獲得,其中第k個基數(shù)組表示為
超參數(shù)R代表了分支數(shù)量,h、w和c分別是模塊輸出特征圖的維度參數(shù)??梢允褂萌制骄鼗瘉硎占度胧酵ǖ溃╡mbedded channelwise)中全局上下文信息[30]。第c個分量S的計算公式為
把每個基數(shù)組的輸出拼接在一起,又經(jīng)過一層1×1 的卷積層,最終輸出一個與輸入同為h、w、c維度的特征矩陣Xw×h×c,并傳遞給下一模塊。
2.1.3 參數(shù)矩陣融合
使用下述方法融合圖1 中3 個主要模塊的輸出:
式中:“ °”是阿達瑪乘法(即元素間相乘),參數(shù)Wc、Wp和Wq分別表征了鄰近性、周期性和趨勢性的影響程度。
在外部因素模塊中,本文把與時空數(shù)據(jù)時間相對應(yīng)的完整外部數(shù)據(jù)(天氣數(shù)據(jù)和節(jié)假日數(shù)據(jù))輸入到一個兩層的全連接神經(jīng)網(wǎng)絡(luò)中,以獲取天氣和節(jié)假日特征對區(qū)域客流量的影響[31]。
用Et表示預(yù)測時間節(jié)點t的外部因素特征向量,包括了天氣、節(jié)假日、工作日等信息。與時空數(shù)據(jù)預(yù)測方式相似,使用t-1 時刻的數(shù)據(jù)近似預(yù)測t時刻的外部因素情況。輸出的Et需要經(jīng)過兩個全連接層,第一層可以理解為每個子因素的嵌入層,后面連接一個激活函數(shù)。第二層則可以理解為是將低維向量映射到高維空間。
最終把外部因素模塊和主要的模塊進行融合,如圖1 框架圖所示。預(yù)測得到t時間的區(qū)域客流量預(yù)測值:
式中的Tanh 為雙曲線切線函數(shù),保證了輸出的范圍在-1 到1 之間。
算法1 ST-SANet 模型
輸入流入、流出量數(shù)據(jù)XRes、預(yù)測時間點真實數(shù)據(jù)XReal,外部特征數(shù)據(jù)XExt。
輸出經(jīng)過訓(xùn)練得到各項模型參數(shù)。
1) 按照距離預(yù)測時間點的時間間隔劃分數(shù)據(jù)集;
2)將流入流出量數(shù)據(jù)通過預(yù)卷積層:
3) 外部特征數(shù)據(jù)經(jīng)過兩層全連接后得到結(jié)果Et:
4)將預(yù)卷積層結(jié)果輸入到ResNeSt 模塊:
鄰近性模塊:
5)將鄰近性、周期性以及趨勢性3 個模塊的輸出進行全連接后生成Xt;
6)拼接Xt與Et后,經(jīng)過Tanh 激活函數(shù)得到預(yù)測結(jié)果;
7)按照公式計算loss 值:
反向傳播更新網(wǎng)絡(luò)參數(shù)。
本實驗在16C32G 服務(wù)器環(huán)境下,平均訓(xùn)練時間為47 h 16 min。
本文以公開的真實數(shù)據(jù)集—北京出租車數(shù)據(jù)集(TaxiBJ)[32]以及對應(yīng)的北京氣象信息、節(jié)假日等數(shù)據(jù)(BJ_Meteorology)為基礎(chǔ)對客流情況進行預(yù)測。TaxiBJ 數(shù)據(jù)集為h5 文件,包括“date”和“data”兩個字段,分別表示數(shù)據(jù)集的時間、以及流入流出量數(shù)據(jù)。該數(shù)據(jù)集涵蓋了4 個時間范圍的數(shù)據(jù),分別是2013 年7 月1 日~10 月30 日;2014年3 月1 日~6 月30 日;2015 年3 月1 日~6 月30 日;2015 年11 月1 日~2016 年4 月10 日。4 年的數(shù)據(jù)集的形狀分別為(4888,2,32,32)、(4780,2,32,32)、(5596,2,32,32)以及(7220,2,32,32),其中數(shù)據(jù)第一位代表總數(shù)據(jù)量,第二位的二維數(shù)組分別代表了該區(qū)域的流入量和流出量,第三、四位代表了32×32 的柵格網(wǎng)絡(luò)區(qū)域。時間戳的間隔設(shè)定以30 min 為單位。
圖5 為TaxiBJ 數(shù)據(jù)集中某時間節(jié)點的流入流出量熱力圖,其中(a)圖為流入量熱力圖,(b)圖為流出量熱力圖。
圖5 流入流出量數(shù)據(jù)熱力圖Fig.5 Heat map of inflow and outflow data
本文選擇均方根誤差(RMSE)作為框架的衡量標準,從而評估算法預(yù)測結(jié)果的準確性。均方根誤差的公式為
式中predicted 為預(yù)測量,actual 為真實量,分別對應(yīng)了各時間段、各區(qū)域出租車客流量的流入流出量的預(yù)測值以及真實值。進而對模型的預(yù)測準確度進行評估。
本文提出的新模型經(jīng)過多次實驗的沉淀,最終獲得的參數(shù)設(shè)置如表1 所示。論文中代碼見文獻[33]。
表1 實驗參數(shù)表Table 1 Experimental parameters table
續(xù)表1
3.4.1 對比實驗的設(shè)置
實驗過程中隨機選擇了數(shù)量為8 周的數(shù)據(jù)作為測試集,剩余數(shù)據(jù)為訓(xùn)練集。選取了ST-ResNet 和DeepST[34]兩種人流量預(yù)測模型和ARIMA、SARIMA、VAR、RNN、LSTM、GRU 等主流時間序列預(yù)測模型作為對比模型。
HA計算對應(yīng)時間區(qū)間的所有歷史輸入流和外出流的平均流量。例如:周二上午9:00~9:30,對應(yīng)所有歷史數(shù)據(jù)中所有周二上午的9:00~9:30。
ARIMA[35]自回歸滑動平均(ARIMA),著名的預(yù)測時間序列的模型。
SARIMA[36]季節(jié)性ARIMA,在ARIMA 的基礎(chǔ)上,SARIMA 考慮了季節(jié)特性,能夠同時學(xué)習時間鄰近性和周期性。
VAR向量自回歸模型(VAR)能夠捕捉成對乘客流量之間的關(guān)系,但由于參數(shù)規(guī)模十分龐大,致使時間復(fù)雜度較高。
ST-ANN抽取空間(周圍8 個區(qū)域的值)和時間(前8 個時間區(qū)間)的特征作為模型預(yù)測的依據(jù)。
DeepST面向時空數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)(DNN)預(yù)測模型,在交通領(lǐng)域數(shù)據(jù)預(yù)測問題上展示了較好的特性。
RNN[37]遞歸神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習模型,能夠較好捕捉時間依賴性,可用于訓(xùn)練不同維度的時間序列數(shù)據(jù)。本文的實驗中,分別選取了長度為3、6、12、24、48、336 的輸入序列作為對比實驗。不同的序列長度預(yù)測效果不盡相同,例如當序列長度選取48、時間間隔為30min 時,數(shù)據(jù)的時間依賴性為24 h。因此,有6 種RNN 的變種:RNN-3、RNN-6、RNN-12、RNN-24、RNN-48 和RNN-336。
LSTM長短記憶單元網(wǎng)絡(luò)(LSTM)[38]是一種特殊的RNN,能夠?qū)W習到較長的時間依賴。與RNN 的設(shè)置相同,做了6 種LSTM 的變種實驗,即LSTM-3、LSTM-6、LSTM-12、LSTM-24、LSTM-48 和LSTM-336。
GRU[39]門遞歸單元網(wǎng)絡(luò),是一種新的RNN,能夠捕捉較長的時間依賴。與RNN 的設(shè)置相同,有以下6 種GRU 變種作為對比實驗:GRU-3、GRU-6、GRU-12、GRU-24、GRU-48 以及GRU-336。
3.4.2 對比實驗的結(jié)果與分析
與上述模型的對比實驗結(jié)果如表2 所示。
表2 TaxiBJ 數(shù)據(jù)集下的各個模型RMSE 對比實驗Table 2 Comparison of RMSE results of various frameworks under Taxibj dataset
從表2 可以看出,本文提出的ST-SANet 準確率明顯優(yōu)于所有的對比方法。含有12 個殘差單元和分割注意力機制模塊的ST-SANet 優(yōu)于DeepST等傳統(tǒng)算法約22%以上,優(yōu)于RNN 約40%以上,優(yōu)于LSTM 約31%以上,優(yōu)于GRU30%以上,優(yōu)于ST-ResNet 約6%。
ST-ANN 和VAR 也采用了時空數(shù)據(jù)進行模型訓(xùn)練,但是性能都不及ST-SANet 模型,因為它們只是考慮了較近時間段以及鄰近時間段信息。對于時間序列模型而言,GRU 和LSTM 的RMSE 性能相似,且均優(yōu)于RNN,但是都不及ST-SANet 模型,其原因在于GRU 和LSTM 都能夠捕捉較長的時間依賴性,但不具備提取多元化特征的能力[40]。
3.5.1 消融實驗設(shè)置
為了驗證分割注意力機制模塊以及城市功能區(qū)劃分對模型的性能影響,本文針對ST-SANet,構(gòu)造了未引入城市功能區(qū)特征的消融版模型STSANetRib,未引入分割注意力機制的消融模型ST-ResNet,以及未引入分割注意力機制及城市功能區(qū)特征的消融模型ST-ResNetRib。
3.5.2 消融實驗的結(jié)果與分析
4 個模型的預(yù)測結(jié)果如表3 所示。
表3 消融實驗對比結(jié)果Table 3 Comparison results of ablation experiments
從消融實驗對比結(jié)果表中可以看出,首先對于城市功能區(qū)劃分的消融實驗,無論是改進后形成的ST-SANet 模型,還是原始的ST-ResNet 模型,引入城市功能區(qū)劃分后的預(yù)測效果都有顯著提升,說明了城市功能區(qū)特征在很大程度上影響著客流量的預(yù)測。同時,功能區(qū)特征對傳統(tǒng)模型ST-ResNet 的提升略小,也側(cè)面說明針對多模態(tài)特征的數(shù)據(jù)集,ST-SANet 更具有優(yōu)勢。
其次,在分割注意力機制模塊的消融實驗中,無論是否在多模態(tài)數(shù)據(jù)集下,引入了分割注意力機制的ST-SANet 模型的預(yù)測精度均明顯優(yōu)于傳統(tǒng)的ST-ResNet 模型,并且面對復(fù)雜數(shù)據(jù)集時,模型精度的提升更為明顯,說明分割注意力模塊能夠有效提升預(yù)測的準確率,同時能夠更好的從多模態(tài)數(shù)據(jù)集中提取多元化特征。
引入城市功能區(qū)屬性的數(shù)據(jù)集,包含了各時段各區(qū)域的客流量變化信息,并且在一定程度上反映了與區(qū)域相關(guān)的活動語義。不同的人群活動會發(fā)生在不同的區(qū)域,比如“上班”會發(fā)生在工作區(qū),那么引入功能區(qū)劃分這一特征,就可以提取各時段不同功能區(qū)乘客群體的活動規(guī)律,從而提升模型的預(yù)測精度。實驗中相同模型下,引入了城市功能區(qū)屬性的數(shù)據(jù)帶來的預(yù)測結(jié)果要優(yōu)于原始數(shù)據(jù)的預(yù)測結(jié)果。
面對多模態(tài)數(shù)據(jù)集,引入分割注意力機制模塊能夠更好地提取多樣化的特征。并且人群活動的成因十分復(fù)雜,不同區(qū)域、不同類型乘客群體活動的原因和規(guī)律具有明顯差異,注意力機制模塊能夠動態(tài)地分析各種場景的乘客群體活動,挑選影響程度較高的特征,同時能夠更好地捕捉多模態(tài)數(shù)據(jù)間的潛在關(guān)系,這無疑是模型性能提升的主要原因。
針對城市各區(qū)域客流量預(yù)測問題,本文將城市區(qū)域的功能屬性作為重要特征,采用分割注意力機制殘差網(wǎng)絡(luò)算法,提取城市中任意兩個區(qū)域之間的相互關(guān)系;采用包含區(qū)域功能屬性的歷史時空數(shù)據(jù),以及節(jié)假日、天氣等外部特征數(shù)據(jù)進行訓(xùn)練,能夠更好地捕捉多模態(tài)數(shù)據(jù)之間的時間依賴、空間依賴、地區(qū)屬性依賴以及外部因素的影響;在真實數(shù)據(jù)集上與10 種類似算法進行對比,結(jié)果充分說明了本模型具有更高的準確性。
在未來的工作中,本文將會基于擴張卷積算法,探究空間上的近距離、遠距離數(shù)據(jù)依賴對于預(yù)測的影響程度,以減輕無效數(shù)據(jù)對模型性能造成的負面影響。