蔣 熙,賈飛凡,馮佳平
(北京交通大學(xué)軌道交通控制與安全國家重點(diǎn)實(shí)驗室,北京100044)
城市軌道交通路網(wǎng)的日常運(yùn)營過程中,運(yùn)營部門特別關(guān)注如何及時準(zhǔn)確地把握路網(wǎng)當(dāng)前運(yùn)營狀態(tài),以便為列車運(yùn)行調(diào)整或客流控制決策提供科學(xué)依據(jù),而客流OD(Origin Destination)是形成路網(wǎng)運(yùn)營狀態(tài)的重要基礎(chǔ).運(yùn)營中,從分時段上傳的準(zhǔn)實(shí)時AFC(Automatic Fair Collection)刷卡數(shù)據(jù)可以得到當(dāng)前時段各車站的進(jìn)出站客流信息,而當(dāng)前時段路網(wǎng)客流OD尚處于未知狀態(tài),需要進(jìn)行動態(tài)在線估計.
道路交通領(lǐng)域的客流OD動態(tài)估計,主要是利用路段流量數(shù)據(jù),運(yùn)用神經(jīng)網(wǎng)絡(luò)模型、貝葉斯濾波等方法進(jìn)行研究[1-3].而城市軌道交通的可觀測信息主要來源于“準(zhǔn)實(shí)時”AFC刷卡數(shù)據(jù),基于AFC數(shù)據(jù)的客流估計研究逐步發(fā)展,代表性的研究包括基于卡爾曼濾波的客流OD估計模型構(gòu)建[4-5],以及在此基礎(chǔ)上通過數(shù)據(jù)融合降低估計誤差的研究[6].此外,還有基于交通行為非集計模型的客流OD預(yù)測的研究[7].
路網(wǎng)客流狀態(tài)變化具有非線性、不確定性特征,目前已有的城軌路網(wǎng)客流OD動態(tài)估計方法在及時性、準(zhǔn)確性方面仍然有待提高.本文結(jié)合路網(wǎng)客流OD動態(tài)特性及其與觀測數(shù)據(jù)間的關(guān)聯(lián)邏輯,綜合利用歷史信息與準(zhǔn)實(shí)時數(shù)據(jù),研究與之相適應(yīng)的方法、模型及算法,以在線方式實(shí)現(xiàn)客流OD動態(tài)估計,滿足日常運(yùn)營在線決策支持的需要.
從數(shù)據(jù)時效性上看,城市軌道交通的AFC數(shù)據(jù)可分成準(zhǔn)實(shí)時AFC數(shù)據(jù)和歷史AFC數(shù)據(jù)兩類.準(zhǔn)實(shí)時AFC數(shù)據(jù)以乘客每次進(jìn)出站刷卡記錄作為一個單元進(jìn)行采集,并按一定時間間隔(如每15 min)打包上傳.運(yùn)營結(jié)束后對實(shí)時AFC進(jìn)出站數(shù)據(jù)進(jìn)行匯總和配對后形成歷史AFC數(shù)據(jù),從中可以處理得到當(dāng)日的分時段客流OD矩陣,從而形成歷史客流OD時序數(shù)據(jù).
運(yùn)營過程中的每一時段,由進(jìn)出站刷卡記錄可以獲得采集周期內(nèi)各車站的進(jìn)出站客流量.路網(wǎng)中,客流狀態(tài)的規(guī)律性與隨機(jī)不確定性共存,各乘客在路網(wǎng)出行過程中存在著時間消耗,某一時段由某一“O點(diǎn)”進(jìn)站的客流將會在當(dāng)前及后續(xù)的若干時段內(nèi)分批、陸續(xù)到達(dá)不同的“D點(diǎn)”車站,這些到達(dá)客流量可以看成是該“O點(diǎn)”進(jìn)站客流量在不同去向站、不同時段上的時空分布.
本文所述路網(wǎng)客流OD在線動態(tài)估計是指,在獲得了準(zhǔn)實(shí)時AFC數(shù)據(jù)的條件下,基于客流OD在時空維度的分布特性與邏輯關(guān)聯(lián),結(jié)合歷史客流OD信息,隨時間的推進(jìn),分時段對當(dāng)前路網(wǎng)的客流OD矩陣進(jìn)行動態(tài)估計.
源于地鐵客流出行需求的動態(tài)變化規(guī)律及在出行過程中的動態(tài)關(guān)聯(lián),分時段的客流OD即存在時序特征,也與相關(guān)時段的進(jìn)出站客流間存在著某種時空關(guān)聯(lián)邏輯,其隨機(jī)概率特性或者隱含在歷史數(shù)據(jù)中,或者隱含在準(zhǔn)實(shí)時AFC提供的觀測數(shù)據(jù)與客流OD的聯(lián)系中.由此,對這些隨機(jī)概率特性進(jìn)行發(fā)現(xiàn)、建模和綜合利用就是本文的基本研究思路.
考慮到城軌這一非線性動態(tài)系統(tǒng)中AFC觀測數(shù)據(jù)與客流OD間的關(guān)聯(lián)邏輯,本文基于遞歸貝葉斯理論方法研究客流OD的在線動態(tài)估計.其基本思想是,基于客流OD的時序關(guān)聯(lián)構(gòu)建狀態(tài)轉(zhuǎn)移方程,基于AFC與客流OD間的時空關(guān)聯(lián)構(gòu)建量測方程,并隨著時間推進(jìn),利用這兩個方程以遞歸方式進(jìn)行客流OD概率密度的迭代計算.
按照AFC數(shù)據(jù)采樣周期的長度Δt(如15 min)進(jìn)行時段劃分,用T={1,2,…,k,…,t,…}表示各離散時間段,k代表[(k-1)Δt,kΔt)時間區(qū)間.在路網(wǎng)客流OD動態(tài)估計迭代過程中,任意時段k,主要包括如下兩個階段任務(wù).
(1)k時段路網(wǎng)客流OD量的預(yù)估.在獲得了前序時段客流OD概率分布的條件下,輸入到系統(tǒng)狀態(tài)轉(zhuǎn)移方程中得到當(dāng)前時段k客流OD量概率分布,形成客流OD預(yù)估值.
(2)k時段路網(wǎng)客流OD量的修訂更新.得到預(yù)估值后,在時段k采集準(zhǔn)實(shí)時AFC數(shù)據(jù)作為觀測數(shù)據(jù),依據(jù)量測方程,通過貝葉斯原理對當(dāng)前時段客流OD進(jìn)行后驗估計,形成預(yù)估值的修訂更新,使結(jié)果與當(dāng)前的系統(tǒng)狀況更接近.然后進(jìn)入k+1的預(yù)估階段,如此迭代下去.
預(yù)估階段的關(guān)鍵是構(gòu)建客流OD狀態(tài)轉(zhuǎn)移方程.因歷史OD數(shù)據(jù)中蘊(yùn)涵著難以用一般解析公式準(zhǔn)確刻畫的OD動態(tài)變化特性,可采用機(jī)器學(xué)習(xí)方法進(jìn)行數(shù)據(jù)挖掘,并以網(wǎng)絡(luò)模型形式體現(xiàn)出歷史時序數(shù)據(jù)中的先驗規(guī)律.長短時記憶網(wǎng)絡(luò)LSTM(Long Short Term Memory Network)作為一種改進(jìn)循環(huán)神經(jīng)網(wǎng)絡(luò),適用于具有長時間依賴性的時間序列預(yù)測問題.因此,本文運(yùn)用LSTM及客流OD歷史數(shù)據(jù)進(jìn)行模型構(gòu)建與訓(xùn)練,學(xué)習(xí)得到客流OD預(yù)估模型,并將其作為狀態(tài)轉(zhuǎn)移方程嵌入到貝葉斯估計的迭代過程中,實(shí)現(xiàn)客流OD動態(tài)估計,其方法框架如圖1所示.
在進(jìn)入在線估計過程前,首先利用歷史客流OD數(shù)據(jù)對LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練,形成LSTM網(wǎng)絡(luò)形式的客流OD狀態(tài)轉(zhuǎn)移方程.然后,開始在線估計迭代過程,在每一時段,先利用若干前序時段的客流OD估計值作為輸入,運(yùn)行LSTM狀態(tài)轉(zhuǎn)移模型得到當(dāng)前時段客流OD的預(yù)估值,作為該迭代步下當(dāng)前時段的先驗估計;再利用相關(guān)車站的AFC進(jìn)出站刷卡數(shù)據(jù)作為觀測值進(jìn)行后驗修訂,對原預(yù)估的OD進(jìn)行更新;然后,再進(jìn)入下一時段,繼續(xù)利用LSTM模型進(jìn)行新的客流OD預(yù)估.如此,隨時鐘推進(jìn),客流OD在周而復(fù)始的遞推過程中實(shí)現(xiàn)在線動態(tài)估計.
圖1 LSTM模型嵌入下的客流OD遞歸貝葉斯估計方法框架Fig.1 OD recursive Bayesian estimation method framework embedded with LSTM model
按照上節(jié)提出的方法框架,構(gòu)建基于LSTM的系統(tǒng)狀態(tài)轉(zhuǎn)移方程及系統(tǒng)量測方程來形成客流OD遞歸貝葉斯估計模型.
設(shè)N={1,2,…,i,j,…}為城市軌道交通路網(wǎng)車站集合,定義時段k路網(wǎng)客流OD矩陣Q(k)為
式中:Qi(k)表示在時段k由車站i進(jìn)站將去往其他各個車站的客流OD向量,Qi(k)=[qi1(k),qi2(k),…,qin(k)];qij(k)表示在時段k由車站i進(jìn)站將要去往車站j的客流量,這些客流將分批在未來若干時段陸續(xù)到達(dá)車站j并出站.
定義進(jìn)站客流向量O(k),表示時段k路網(wǎng)各站的進(jìn)站客流量,即
式中:oi(k)表示車站i在時段k內(nèi)進(jìn)站客流量.
定義累計到達(dá)量Rt(k),表示截止到時段k(k≥t),在時段t出發(fā)的客流累計到達(dá)量矩陣.
對于擁有n個車站的城市軌道交通路網(wǎng),路網(wǎng)客流OD矩陣可以看成是由各個“O點(diǎn)”車站的去向客流量向量Qi(k)構(gòu)成,因此可分別對各個車站進(jìn)行客流OD量估計,最終再組成路網(wǎng)客流OD的矩陣Q(k).這種分車站OD向量進(jìn)行估計的方式便于采用并行計算技術(shù)來實(shí)現(xiàn),可提高計算速度.因此,本文從各個“O點(diǎn)”車站的角度進(jìn)行模型計算和求解.
對于路網(wǎng)中任一車站i,采用LSTM模型構(gòu)建該站客流OD預(yù)估模型.該模型以任一時段s的客流OD向量作為輸出變量Y,以s以前m個時段的客流OD向量輸入變量X.
其中,m的取值對預(yù)估結(jié)果和運(yùn)算效率有重要影響,本文經(jīng)過實(shí)際嘗試后,發(fā)現(xiàn)當(dāng)m取3時能夠在運(yùn)算效率與效果方面達(dá)到一個較好的平衡.將LSTM網(wǎng)絡(luò)的隱藏層數(shù)設(shè)置為2層,第1層LSTM選用50個神經(jīng)元,第2層LSTM選用100個神經(jīng)元,為防止過擬合的情況選取DropOut為0.2,即每個訓(xùn)練步驟取80%的數(shù)據(jù)用于參數(shù)調(diào)整.將歷史相關(guān)運(yùn)營日期的客流OD數(shù)據(jù)按時序處理,以每前3個時段OD向量為輸入、后1個時段OD向量為輸出構(gòu)成一個數(shù)據(jù)單元,按順序形成訓(xùn)練數(shù)據(jù)序列,對網(wǎng)絡(luò)進(jìn)行訓(xùn)練后得到基于LSTM的客流OD狀態(tài)轉(zhuǎn)移模型.該模型隱含實(shí)現(xiàn)了車站i前序3個時段的客流OD向量對當(dāng)前時段客流OD向量的非線性動態(tài)映射關(guān)系,將其命名為fi.
在此基礎(chǔ)上,針對任意車站i進(jìn)行客流OD預(yù)估時,對任一時段k(k≥3),將前3個時段的客流OD估計值輸入到這個非線性動態(tài)映射fi中,可以形成客流OD向量的動態(tài)轉(zhuǎn)移,得到時段k的客流OD預(yù)估值.則對任意車站i,基于LSTM的客流OD狀態(tài)轉(zhuǎn)移方程的形式可描述為
式中:w(k)為過程噪聲,可從歷史AFC數(shù)據(jù)中統(tǒng)計其隨機(jī)分布參數(shù).
網(wǎng)絡(luò)化運(yùn)營條件下,路網(wǎng)客流動態(tài)變化具有廣泛的時空關(guān)聯(lián)性.首先,車站i的觀測量oi(k)與待估狀態(tài)Qi(k)之間存在某種空間分離的關(guān)系,定義進(jìn)站客流分離率bij(k),表示車站i在時間段k的進(jìn)站客流oi(k)中qij(k)的比率.
式(10)與式(11)為客流分離率的約束條件.運(yùn)用本文構(gòu)建的LSTM客流OD狀態(tài)轉(zhuǎn)移模型進(jìn)行Qi(k)的預(yù)估時,bij(k)就已經(jīng)隱藏在其中形成預(yù)估取值了.
進(jìn)一步看,在時段k,由車站i進(jìn)站去往車站j的客流量,需要在當(dāng)前及后續(xù)的幾個時段陸續(xù)到達(dá)車站j,在多個不同時段的出站數(shù)據(jù)觀測值中才能獲得相應(yīng)的客流信息,為了描述累計出站觀測量與待估客流OD量之間的關(guān)系,定義累計到達(dá)系數(shù)矩陣At(k)為
(k)的取值與車站i與j之間的客流出行時間分布、時段的間隔時間長短,以及路網(wǎng)當(dāng)前運(yùn)營中的不確定因素有關(guān),本文將其作為一項隨機(jī)參數(shù),利用歷史AFC數(shù)據(jù)進(jìn)行統(tǒng)計計算得到.
可見,待估量qij(k)與觀測量oi(k)與rit j(k)之間體現(xiàn)了客流在時間與空間上的關(guān)聯(lián)關(guān)系.車站i進(jìn)站客流oi(k)經(jīng)過空間與時間兩個層面上的分離結(jié)果可以從觀測數(shù)據(jù)(k)上得到體現(xiàn).基于上述邏輯關(guān)系,可構(gòu)建量測方程,表示為
式中:V(k)為測量噪聲,可從歷史AFC數(shù)據(jù)統(tǒng)計得到隨機(jī)分布參數(shù).
映射關(guān)系h代表關(guān)系式為
至此,基于構(gòu)建完成的狀態(tài)轉(zhuǎn)移模型和量測方程,可進(jìn)一步研究客流OD遞歸貝葉斯估計問題的求解算法,得到每個k時段qij(k)的動態(tài)估計.
卡爾曼濾波是求解線性系統(tǒng)遞歸貝葉斯估計的經(jīng)典算法之一,但對于可能需要多維復(fù)雜積分運(yùn)算的非線性系統(tǒng)的適應(yīng)性較弱.而基于蒙特卡洛重采樣技術(shù)的粒子濾波方法對非線性系統(tǒng)具有更強(qiáng)的建模能力,因此,本文以粒子濾波為基礎(chǔ)研究求解算法.
由于LSTM模型的嵌入,狀態(tài)轉(zhuǎn)移變成三階馬爾科夫過程,而一般粒子濾波算法是在一階條件下設(shè)計的.本文結(jié)合客流動態(tài)估計問題特點(diǎn),將一般粒子濾波算法按照如下方式進(jìn)行擴(kuò)展,形成面向高階狀態(tài)轉(zhuǎn)移的客流OD動態(tài)估計的粒子濾波算法.
(1)將隨機(jī)粒子集擴(kuò)展為4套,分別對應(yīng)Qi(k-3)、Qi(k-2),Qi(k-1),Qi(k)的概率密度,各套粒子集中第l個粒子權(quán)重分別設(shè)為
(2)初始時段k=0,由Q(-2),Q(-1),Q(0)分別表示最初3個時段路網(wǎng)客流OD概率密度(由歷史相似運(yùn)營日的AFC統(tǒng)計獲得),并加上噪聲后分別形成初始粒子集,將各粒子的初始權(quán)重置為1M.
(3)預(yù)估階段,用Qi(k-3)、Qi(k-2)、Qi(k-1)對應(yīng)的粒子集作為輸入,利用LSTM模型進(jìn)行粒子集傳播,形成代表Qi(k)概率密度的粒子集.
(4)修訂階段,選用高斯函數(shù)作為基函數(shù)用于似然度擬合,利用觀測數(shù)據(jù)分別對代表Qi(k-2)、Qi(k-1)和Qi(k)的各粒子進(jìn)行條件似然度的計算.基于粒子濾波原理,各粒子權(quán)重與其似然度成正比,則將各粒子似然度歸一化后就可形成新的權(quán)重值.
(5)為防止粒子退化,依據(jù)更新后的各粒子權(quán)重、運(yùn)用重采樣算法對Qi(k-2)、Qi(k-1)和Qi(k)對應(yīng)的各套粒子集重新采樣.然后時段k加1,將新生成的3套粒子輸入到LSTM模型中,進(jìn)行下一次迭代.
經(jīng)高階擴(kuò)展后的客流OD動態(tài)估計粒子濾波算法主要分成初始化、客流OD預(yù)估、觀測數(shù)據(jù)采集處理、隨機(jī)粒子更新、形成估計值等步驟,后幾個階段隨時間推進(jìn)不斷進(jìn)行循環(huán)迭代,算法流程如圖2所示.
以2018年某市地鐵為例進(jìn)行實(shí)例驗證.首先采集了預(yù)測日前3個星期路網(wǎng)205個車站的歷史客流OD向量數(shù)據(jù)進(jìn)行處理和機(jī)器學(xué)習(xí),形成基于LSTM的客流OD預(yù)估模型,然后將其嵌入到客流OD動態(tài)估計粒子濾波算法中.因本文分別按照各個車站OD向量進(jìn)行估計,在算法設(shè)計時,被分解為205個相對獨(dú)立的可以并行的子任務(wù)以提高運(yùn)算速度.
在此基礎(chǔ)上,在1臺4核計算機(jī)上運(yùn)行模型與算法,動態(tài)接收每15 min時段的AFC數(shù)據(jù)作為觀測數(shù)據(jù),對205個車站進(jìn)行了在線式全網(wǎng)客流OD動態(tài)估計.在此,僅取其中2個OD估計結(jié)果進(jìn)行說明,圖3(a)、圖3(b)給出了各時段OD實(shí)際值、LSTM形成的OD預(yù)估值及粒子濾波后估計值的對比關(guān)系.可見,預(yù)估值、估計值均與當(dāng)日實(shí)際值較接近,而經(jīng)過粒子濾波處理后得到的估計值表現(xiàn)更好.
圖2 客流OD動態(tài)估計粒子濾波算法流程Fig.2 Process of passenger flow OD dynamic estimation particle filter algorithm
完成當(dāng)日估計后,以各時段各OD的實(shí)際值為X坐標(biāo)值,以相應(yīng)的模型計算值為Y坐標(biāo)構(gòu)成的點(diǎn)繪制散點(diǎn)圖,如圖4所示.不難看出,路網(wǎng)客流OD估計值接近于實(shí)際值.進(jìn)一步,利用各分時OD量的實(shí)際值對模型誤差進(jìn)行計算,得到加權(quán)相對誤差為15.42%(按客流分離率來計算結(jié)果相同).
圖3 部分客流OD實(shí)際值、預(yù)估值與估計值的對比Fig.3 Comparison of actual,predicted and estimated value of some OD
圖4 實(shí)際值與計算值的散點(diǎn)對比圖Fig.4 Scattered plots of actual and calculated values
本文面向準(zhǔn)實(shí)時AFC數(shù)據(jù)接入下的路網(wǎng)客流OD動態(tài)估計問題,提出將LSTM模型嵌入到遞歸貝葉斯估計中實(shí)現(xiàn)客流OD動態(tài)估計的方法,能夠?qū)μN(yùn)藏在歷史數(shù)據(jù)中的客流OD動態(tài)變化規(guī)律及實(shí)際運(yùn)營中獲取的觀測數(shù)據(jù)進(jìn)行綜合利用,有助于更準(zhǔn)確可靠地實(shí)現(xiàn)路網(wǎng)客流OD動態(tài)估計.經(jīng)實(shí)例驗證表明,本文提出的方法與模型具有較好的效果.