姚恩建, 周文華, 張永生
(1.北京交通大學(xué) 城市交通復(fù)雜系統(tǒng)理論與技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100044;2.北京交通大學(xué) 交通運(yùn)輸學(xué)院,北京 100044)
隨著城市軌道交通網(wǎng)絡(luò)規(guī)模的持續(xù)擴(kuò)大,客流時(shí)空分布規(guī)律愈加復(fù)雜,作為客流生成源頭的進(jìn)出站客流,運(yùn)營(yíng)管理部門(mén)需對(duì)其實(shí)時(shí)監(jiān)測(cè),準(zhǔn)確把握未來(lái)短時(shí)間內(nèi)客流變化趨勢(shì),從而實(shí)時(shí)調(diào)整運(yùn)營(yíng)計(jì)劃,對(duì)突發(fā)大客流做出及時(shí)預(yù)警和響應(yīng)。為此,高精度、小粒度的實(shí)時(shí)進(jìn)出站客流量預(yù)測(cè)已成為精細(xì)化運(yùn)營(yíng)管理的關(guān)鍵。同時(shí),新站不斷開(kāi)通運(yùn)營(yíng),成為新線接入線網(wǎng)后實(shí)時(shí)客流預(yù)測(cè)的重點(diǎn)。然而,新站開(kāi)通初期缺乏足夠歷史數(shù)據(jù),且客流波動(dòng)大,變化規(guī)律較不穩(wěn)定,對(duì)未來(lái)短時(shí)間內(nèi)客流的精準(zhǔn)把握愈發(fā)艱難。因此,對(duì)新站開(kāi)通初期實(shí)時(shí)進(jìn)出站客流量預(yù)測(cè)方法的研究尤為必要。
針對(duì)城市軌道交通新站客流預(yù)測(cè),目前國(guó)內(nèi)外學(xué)者主要在項(xiàng)目可行性分析等過(guò)程中進(jìn)行中長(zhǎng)期或短期的客流需求預(yù)測(cè),為新線開(kāi)通后的客運(yùn)組織等提供數(shù)據(jù)支撐。如光志瑞[1]基于車(chē)站可達(dá)性指標(biāo)建立新線接入后新站進(jìn)出站客流預(yù)測(cè)模型,得到新站開(kāi)通后全天的進(jìn)出站客流量,以評(píng)估新線開(kāi)通后的運(yùn)輸組織方案。蔡昌俊[2]等基于非集計(jì)理論,預(yù)測(cè)了新線接入條件下的城市軌道交通新線車(chē)站與既有線車(chē)站之間的工作日客流量。程濤[3]等基于既有站客流規(guī)律采用多元線性回歸模型預(yù)測(cè)新線開(kāi)通初期的客運(yùn)量,包括全天的客運(yùn)強(qiáng)度及規(guī)模。趙路敏[4]等通過(guò)新線工程可行性研究報(bào)告的數(shù)據(jù)和既有路網(wǎng)OD數(shù)據(jù)預(yù)測(cè)新線開(kāi)通后的全網(wǎng)客流。但是,以上研究均以日為單位預(yù)測(cè)新站客流,其預(yù)測(cè)粒度及精度尚不能滿(mǎn)足城市軌道交通運(yùn)營(yíng)管理部門(mén)對(duì)客流實(shí)時(shí)監(jiān)測(cè)的精細(xì)化運(yùn)營(yíng)需求。
對(duì)于實(shí)時(shí)客流預(yù)測(cè)方法,國(guó)內(nèi)外已有諸多研究,常用模型包括時(shí)間序列模型[5-6]、卡爾曼濾波模型[7-8]、支持向量機(jī)模型[9-10]和神經(jīng)網(wǎng)絡(luò)模型[11-12]等。這些模型大多用顯性的數(shù)學(xué)解析式或隱性的關(guān)系表達(dá)式描述影響因素與預(yù)測(cè)變量之間的擬合函數(shù)關(guān)系[13],客流預(yù)測(cè)時(shí)需要為歷史數(shù)據(jù)建立近似模型,參數(shù)訓(xùn)練調(diào)整復(fù)雜,可移植性較弱,且通常用于網(wǎng)絡(luò)穩(wěn)定情況下基于固有的穩(wěn)定客流規(guī)律預(yù)測(cè)未來(lái)客流,不適用于客流波動(dòng)性較大的新站開(kāi)通初期客流精細(xì)化預(yù)測(cè)需求。
相對(duì)于參數(shù)回歸方法,非參數(shù)回歸方法摒棄傳統(tǒng)求解數(shù)學(xué)解析模型的過(guò)程,不對(duì)數(shù)據(jù)做任何嚴(yán)格限定,且算法效率高,可移植性強(qiáng)。張曉利[13]、張濤[14]等對(duì)短時(shí)交通流量進(jìn)行預(yù)測(cè)時(shí),比較了非參數(shù)回歸和神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果,證明了前者較后者具有更高精度和更強(qiáng)移植性。王翔[15]等對(duì)高速公路短時(shí)行程時(shí)間進(jìn)行預(yù)測(cè),證明非參數(shù)回歸比時(shí)間序列自回歸模型有更好的預(yù)測(cè)準(zhǔn)確度與實(shí)時(shí)性。劉美琪[16]等研究了非參數(shù)回歸在城市軌道交通進(jìn)站客流量短時(shí)預(yù)測(cè)中的應(yīng)用,比較了非參數(shù)回歸、卡爾曼濾波模型和貝葉斯組合預(yù)測(cè)模型的預(yù)測(cè)效果,發(fā)現(xiàn)非參數(shù)回歸的總體預(yù)測(cè)精度最高,能很好地適應(yīng)城市軌道交通客流的復(fù)雜時(shí)變性和不確定性。但該研究依賴(lài)大量歷史數(shù)據(jù),無(wú)法適應(yīng)新站開(kāi)通初期缺乏數(shù)據(jù)的情況,同時(shí)采用傳統(tǒng)K近鄰非參數(shù)回歸方法時(shí),近鄰值K固定不變無(wú)法適應(yīng)實(shí)時(shí)預(yù)測(cè),且算法只注重對(duì)客流分時(shí)比例的把握,缺少對(duì)客流量差異性的考慮。
針對(duì)新站開(kāi)通初期實(shí)時(shí)進(jìn)出站客流量預(yù)測(cè),不僅需要解決歷史數(shù)據(jù)缺乏的難點(diǎn),同時(shí)要考慮預(yù)測(cè)方法能否把握開(kāi)通初期客流不穩(wěn)定的復(fù)雜時(shí)變特征。因此,本文以廣州地鐵廣佛線二期開(kāi)通為例,分析新站開(kāi)通初期客流變化規(guī)律及其與車(chē)站周邊土地利用性質(zhì)的相關(guān)性,基于相同土地利用性質(zhì)的既有車(chē)站客流數(shù)據(jù),構(gòu)建新站開(kāi)通初期客流預(yù)測(cè)的歷史數(shù)據(jù)庫(kù);結(jié)合實(shí)時(shí)進(jìn)出站客流特征,考慮客流量的差異,對(duì)K近鄰非參數(shù)回歸方法中狀態(tài)向量及K值的確定、預(yù)測(cè)算法等做出改進(jìn),提出新站開(kāi)通初期實(shí)時(shí)進(jìn)出站客流量預(yù)測(cè)方法;利用廣州地鐵實(shí)際數(shù)據(jù)對(duì)該方法進(jìn)行驗(yàn)證。
廣州地鐵廣佛線二期全長(zhǎng)約為6 km,2015年12月28日開(kāi)通,新開(kāi)通的車(chē)站包括鶴洞、沙涌和燕崗3個(gè)車(chē)站。采用廣州市軌道交通自動(dòng)售檢票系統(tǒng)(簡(jiǎn)稱(chēng)AFC系統(tǒng))采集的15 min進(jìn)、出站客流量,計(jì)算15 min進(jìn)、出站客流分時(shí)系數(shù)(其值分別為15 min的進(jìn)、出站客流量占全日總進(jìn)站、總出站客流量的比值),用于分析客流變化規(guī)律。由于進(jìn)站客流與出站客流的分析方法相同,且變化規(guī)律一致,此處以進(jìn)站客流量為例,分析各新站開(kāi)通當(dāng)天及之后若干平常日的進(jìn)站客流變化規(guī)律。其中平常日指除節(jié)假日、大型活動(dòng)等特殊日期的正常工作日和周六日。
鶴洞站15 min進(jìn)站客流分時(shí)系數(shù)變化曲線如圖1所示。由圖1可知:鶴洞站開(kāi)通初期,工作日內(nèi)客流雖已具有一定周期性,但仍有大幅波動(dòng),短時(shí)間內(nèi)甚至發(fā)生突變,客流變化規(guī)律較不穩(wěn)定,且與周六日存在較大差異。進(jìn)一步地,對(duì)AFC系統(tǒng)采集的客流數(shù)據(jù)進(jìn)行統(tǒng)計(jì),得到鶴洞站開(kāi)通后前8個(gè)月內(nèi)各月日均進(jìn)站客流量,如圖2所示。由圖2可知:日均進(jìn)站客流量在前3個(gè)月(自然月)變化較大,從第4個(gè)月開(kāi)始呈穩(wěn)定增長(zhǎng)。同樣,沙涌站和燕崗站的客流變化也表現(xiàn)出相同規(guī)律。
圖1 鶴洞站15 min進(jìn)站客流量變化曲線
圖2 鶴洞站日均進(jìn)站客流量及其變化率
因此,若采用傳統(tǒng)的客流預(yù)測(cè)方法,在新站開(kāi)通初期的不穩(wěn)定客流數(shù)據(jù)中尋找適應(yīng)實(shí)時(shí)精準(zhǔn)預(yù)測(cè)的動(dòng)態(tài)映射關(guān)系顯然不夠理想,而非參數(shù)回歸方法不需確定具體的函數(shù)關(guān)系,直接從客流數(shù)據(jù)中獲取相關(guān)信息,能夠更好地適應(yīng)新站開(kāi)通初期不穩(wěn)定客流的預(yù)測(cè)。
然而,新站開(kāi)通初期缺乏歷史數(shù)據(jù),沒(méi)有歷史客流變化規(guī)律作為未來(lái)短時(shí)間內(nèi)客流預(yù)測(cè)的依據(jù)與參考,使得非參數(shù)回歸方法也難以直接應(yīng)用。因此,構(gòu)建新站開(kāi)通初期實(shí)時(shí)進(jìn)出站客流量預(yù)測(cè)的歷史數(shù)據(jù)庫(kù)是本研究的首要任務(wù)。
城市軌道交通客流發(fā)生與客流吸引的源泉是土地利用,即進(jìn)出站客流在全天不同時(shí)間段上的分布規(guī)律很大程度上由車(chē)站沿線的土地利用性質(zhì)決定[1]。土地利用性質(zhì)主要分為居住類(lèi)、辦公類(lèi)、居住占優(yōu)類(lèi)、辦公占優(yōu)類(lèi)、商業(yè)類(lèi)、樞紐類(lèi)、綜合類(lèi)等,當(dāng)車(chē)站周邊土地存在混合利用的情況時(shí),在不同時(shí)間段用于表征車(chē)站客流產(chǎn)生/吸引量的土地利用性質(zhì)可能會(huì)發(fā)生改變,如工作日為辦公占優(yōu)類(lèi),周六日可能變?yōu)樯虡I(yè)類(lèi)。根據(jù)對(duì)鶴洞站周邊土地利用情況的調(diào)研分析可知,其周邊土地利用以居住區(qū)為主,含小規(guī)模的辦公區(qū),故可將其歸為居住占優(yōu)類(lèi)車(chē)站。以工作日為例,取其15 min進(jìn)、出站客流分時(shí)系數(shù)(其中進(jìn)站為正,出站為負(fù))觀察新站進(jìn)、出站客流變化規(guī)律。鶴洞站的進(jìn)、出站客流分時(shí)系數(shù)變化規(guī)律如圖3(a)所示,可見(jiàn)該站客流有明顯的進(jìn)站和出站早晚高峰,并且早高峰時(shí)進(jìn)站客流大于出站客流,晚高峰時(shí)相反。在既有車(chē)站中,東曉南車(chē)站周邊土地利用情況與鶴洞站相似,同屬居住占優(yōu)類(lèi)的東曉南車(chē)站,其進(jìn)、出站客流分時(shí)系數(shù)變化規(guī)律曲線也如圖3(a)中所示,可見(jiàn)東曉南車(chē)站的進(jìn)、出站客流分時(shí)系數(shù)變化規(guī)律與鶴洞站非常相似。沙涌站和燕崗站也歸為居住占優(yōu)類(lèi)車(chē)站,與東曉南車(chē)站的客流分時(shí)系數(shù)變化規(guī)律同樣一致。另外,在廣州地鐵網(wǎng)絡(luò)中,選取其他相同土地利用性質(zhì)的既有車(chē)站進(jìn)行分析,如圖3(b)至圖3(d)所示,可以看出相同土地利用性質(zhì)的車(chē)站進(jìn)出站客流分時(shí)系數(shù)變化規(guī)律均存在較高的相似性。
圖3 不同土地利用性質(zhì)車(chē)站進(jìn)、出站客流分時(shí)系數(shù)的變化規(guī)律
由此可見(jiàn),基于進(jìn)站、出站客流分時(shí)系數(shù)變化規(guī)律與車(chē)站周邊土地利用性質(zhì)的內(nèi)生關(guān)系,建立新站與既有車(chē)站之間的映射,采用相同土地利用性質(zhì)既有車(chē)站(簡(jiǎn)稱(chēng)為相似既有車(chē)站)的歷史客流數(shù)據(jù),可以構(gòu)建新站實(shí)時(shí)進(jìn)出站客流量預(yù)測(cè)的歷史數(shù)據(jù)庫(kù)。
根據(jù)新站開(kāi)通初期實(shí)時(shí)進(jìn)出站客流特征,對(duì)K近鄰非參數(shù)回歸方法做出改進(jìn),提出適用于新站開(kāi)通初期的實(shí)時(shí)進(jìn)出站客流量預(yù)測(cè)方法。
K近鄰非參數(shù)回歸預(yù)測(cè)方法的核心思想是數(shù)據(jù)庫(kù)模式匹配,即從歷史數(shù)據(jù)庫(kù)中提取數(shù)據(jù)特征,根據(jù)合理的狀態(tài)向量找到與當(dāng)前實(shí)時(shí)觀測(cè)數(shù)據(jù)相匹配的K個(gè)近鄰數(shù)據(jù),將其作為預(yù)測(cè)算法的輸入,最終得到下一時(shí)段的客流預(yù)測(cè)值。該預(yù)測(cè)方法包括構(gòu)建歷史數(shù)據(jù)庫(kù)、確定狀態(tài)向量、制定相似機(jī)制、近鄰K值的選取和預(yù)測(cè)算法5個(gè)步驟。
首先,基于模糊C均值聚類(lèi)方法選取與新站土地利用性質(zhì)相同的既有車(chē)站,構(gòu)建相似既有車(chē)站客流基礎(chǔ)數(shù)據(jù)庫(kù)。根據(jù)對(duì)不同土地利用性質(zhì)車(chē)站進(jìn)出站客流分時(shí)系數(shù)變化規(guī)律的分析,可發(fā)現(xiàn)進(jìn)出站客流早晚高峰的客流特征與車(chē)站周邊土地利用性質(zhì)具有直接關(guān)聯(lián),故選取早晚高峰系數(shù)(其值為早晚高峰時(shí)段內(nèi)15 min進(jìn)、出站客流分時(shí)系數(shù)的總和,即早晚高峰時(shí)段內(nèi)客流量占全日總客流量的比值)作為車(chē)站聚類(lèi)指標(biāo)。對(duì)不同時(shí)間、不同位置的城市軌道交通網(wǎng)絡(luò)中所有既有車(chē)站進(jìn)行模糊C均值聚類(lèi)[17],其中既有車(chē)站的位置通過(guò)既有路網(wǎng)車(chē)站可達(dá)性[18]進(jìn)行劃分?;诰垲?lèi)結(jié)果,構(gòu)建車(chē)站性質(zhì)匹配庫(kù),以描述預(yù)測(cè)日時(shí)間屬性、新站的車(chē)站位置、新站的土地利用性質(zhì)與既有車(chē)站的映射關(guān)系。如對(duì)于新站X,則有
DML:SX=f(TP,SL,ST)
(1)
式中:DML為車(chē)站性質(zhì)匹配庫(kù),包括性質(zhì)相匹配的所有既有車(chē)站;SX為新站X匹配得到的相似既有車(chē)站集;TP為預(yù)測(cè)日時(shí)間屬性對(duì)應(yīng)指標(biāo);SL為新站車(chē)站位置指標(biāo);ST為新站周邊土地利用性質(zhì)指標(biāo)。其中新站X的車(chē)站位置和周邊土地利用性質(zhì)可以根據(jù)城市地圖進(jìn)行確定。
其次,構(gòu)建新站客流基礎(chǔ)數(shù)據(jù)庫(kù)。新站開(kāi)通運(yùn)營(yíng)后,新站的客流數(shù)據(jù)較相似既有車(chē)站的客流數(shù)據(jù)更能直接體現(xiàn)其客流變化規(guī)律,故應(yīng)將新站的客流數(shù)據(jù)及時(shí)加入歷史數(shù)據(jù)庫(kù)。
最后,基于新站及既有車(chē)站客流基礎(chǔ)數(shù)據(jù)庫(kù),確定歷史客流數(shù)據(jù)的時(shí)間跨度,構(gòu)建歷史數(shù)據(jù)庫(kù)。歷史數(shù)據(jù)庫(kù)的構(gòu)成,一方面應(yīng)盡量多的包含未來(lái)可能發(fā)生的客流變化規(guī)律,同時(shí)也不能過(guò)于冗余,以免影響預(yù)測(cè)的實(shí)時(shí)性。因此,歷史數(shù)據(jù)庫(kù)的構(gòu)成可表示為
(2)
對(duì)于時(shí)間跨度T1,因不同新站的相似既有車(chē)站數(shù)目不一,需結(jié)合實(shí)際合理確定。同時(shí),隨著新站客流數(shù)據(jù)的不斷積累,時(shí)間跨度T2需逐日增加,即T2=dt-d0(其中,d0為新站開(kāi)通日,dt為預(yù)測(cè)日)。當(dāng)新站開(kāi)通一段時(shí)間后,且自身客流數(shù)據(jù)足以代表未來(lái)客流變化趨勢(shì)時(shí),應(yīng)從歷史數(shù)據(jù)庫(kù)中剔除相似既有車(chē)站的客流數(shù)據(jù),以避免數(shù)據(jù)庫(kù)冗余。
此外,對(duì)于歷史數(shù)據(jù)庫(kù)中客流數(shù)據(jù)的時(shí)間屬性,需要與預(yù)測(cè)日時(shí)間屬性保持一致,即若預(yù)測(cè)日為工作日,則歷史數(shù)據(jù)庫(kù)中均為工作日的客流數(shù)據(jù)。隨著新站客流數(shù)據(jù)的逐漸積累,可對(duì)歷史數(shù)據(jù)庫(kù)進(jìn)一步細(xì)分,如將平常工作日的歷史數(shù)據(jù)庫(kù)分成周一至周五分別進(jìn)行構(gòu)建,以提高算法預(yù)測(cè)效率及精度。
歷史數(shù)據(jù)庫(kù)的形成過(guò)程可以簡(jiǎn)要表述如圖4所示。
圖4 歷史數(shù)據(jù)庫(kù)形成示意圖
不同時(shí)段的實(shí)時(shí)進(jìn)、出站客流量均可看作獨(dú)立的1個(gè)時(shí)間序列,在各時(shí)間序列中,連續(xù)若干時(shí)間段的客流量間具有較強(qiáng)的關(guān)聯(lián),因此選取與預(yù)測(cè)時(shí)段進(jìn)、出站客流量最密切相關(guān)的若干相鄰時(shí)段的進(jìn)、出站客流量作為狀態(tài)向量。具體方法是:通過(guò)計(jì)算q階自相關(guān)系數(shù)rq確定狀態(tài)向量中前m個(gè)時(shí)段的客流量,即將連續(xù)n個(gè)時(shí)間段的進(jìn)或出站客流量看作時(shí)間序列{Q(1),Q(2),…,Q(n)},則這個(gè)時(shí)間序列q階自相關(guān)系數(shù)rq的計(jì)算公式為
(3)
其中,
通常,對(duì)于給定的自相關(guān)系數(shù)閾值M,當(dāng)相關(guān)系數(shù)rq≥M時(shí),可認(rèn)為時(shí)間序列中間隔q個(gè)時(shí)段的2個(gè)值相關(guān)性較強(qiáng)。為使?fàn)顟B(tài)向量中盡可能多地包含與預(yù)測(cè)時(shí)段相關(guān)的客流時(shí)段,取m=max{q|rq≥M}, 即m為滿(mǎn)足rq≥M的最大q值, 并由預(yù)測(cè)時(shí)段前m個(gè)時(shí)段的進(jìn)或出站客流量構(gòu)成狀態(tài)向量。
傳統(tǒng)非參數(shù)回歸方法,在匹配近鄰數(shù)據(jù)時(shí),用歐式距離作為指標(biāo)衡量實(shí)時(shí)數(shù)據(jù)與歷史數(shù)據(jù)的匹配程度,歐式距離的取值范圍為[0,∞),為了與通常的相似程度判別方法(即1表示最為相似,0表示完全不相似[19])更為一致,本文采用相似度測(cè)度函數(shù)替代歐式距離作為近鄰匹配機(jī)制。相似度測(cè)度函數(shù)為
(4)
式中:A和H分別為實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)中同一時(shí)段的狀態(tài)向量;ak和hk分別為實(shí)時(shí)和歷史狀態(tài)向量中各時(shí)段進(jìn)或出站客流量;K為近鄰的個(gè)數(shù);c為常量,用于調(diào)節(jié)相似度的分布。
目前,對(duì)于近鄰個(gè)數(shù)K的取值沒(méi)有既定準(zhǔn)則。大多研究通過(guò)對(duì)不同K取值下一定量樣本的測(cè)試結(jié)果進(jìn)行誤差判斷,確法最優(yōu)K值,并在預(yù)測(cè)時(shí)始終取該值。不同于既有研究,本文在實(shí)時(shí)客流預(yù)測(cè)時(shí),動(dòng)態(tài)計(jì)算每個(gè)預(yù)測(cè)時(shí)段的K值,即以歷史數(shù)據(jù)庫(kù)中預(yù)測(cè)日前Nk天對(duì)應(yīng)時(shí)段的客流為預(yù)測(cè)樣本,計(jì)算得到Nk個(gè)最優(yōu)K值,并取其均值作為當(dāng)前預(yù)測(cè)時(shí)段的K值。
根據(jù)前文分析,新站與相同土地利用性質(zhì)的既有車(chē)站之間進(jìn)出站客流分時(shí)系數(shù)變化規(guī)律高度相似,但客流量不完全相近。例如,同為辦公類(lèi)車(chē)站的珠江新城站與林和西站,客流分時(shí)系數(shù)變化規(guī)律非常相似,如圖5所示,但分時(shí)客流的量級(jí)存在較大差異,如圖6所示。同時(shí),同一車(chē)站的進(jìn)出站客流量由于一定的自然增長(zhǎng)同樣存在客流量上的波動(dòng),因此,為減小預(yù)測(cè)客流量與近鄰客流量的差異,本文定義近鄰系數(shù),其計(jì)算公式見(jiàn)式(5),用以調(diào)整近鄰的客流量,調(diào)整計(jì)算公式見(jiàn)式(6)。對(duì)珠江新城站客流進(jìn)行調(diào)整,調(diào)整后的客流量與林和西站的客流量非常相近,如圖6所示,這說(shuō)明通過(guò)近鄰系數(shù)的調(diào)整能夠有效減小客流量的差異。
(5)
(6)
圖5 分時(shí)系數(shù)對(duì)比
圖6 調(diào)整前后分時(shí)客流量對(duì)比
以實(shí)際數(shù)據(jù)與近鄰數(shù)據(jù)的相似度為權(quán)重,相似度越大權(quán)重越大;采用基于相似度的加權(quán)平均法,得到預(yù)測(cè)時(shí)段t的客流預(yù)測(cè)值y(t),計(jì)算方法為
(7)
其中,
式中:si為第i個(gè)近鄰狀態(tài)向量與當(dāng)前狀態(tài)向量間的相似度;αi為第i個(gè)近鄰預(yù)測(cè)值的權(quán)重。
以廣州地鐵廣佛線二期開(kāi)通的鶴洞、沙涌和燕崗3個(gè)新站為例,這3個(gè)新站均屬于居住占優(yōu)類(lèi)車(chē)站。盡管本文所提出的方法適用于新線開(kāi)通初期進(jìn)出站客流量的實(shí)時(shí)預(yù)測(cè),但考慮到文章篇幅的限制,以下以開(kāi)通前半年內(nèi)的廣州地鐵線網(wǎng)既有車(chē)站客流數(shù)據(jù)作為歷史客流數(shù)據(jù),采用本文提出的方法,僅對(duì)該線路新站開(kāi)通后的實(shí)時(shí)進(jìn)站客流進(jìn)行預(yù)測(cè),時(shí)間粒度為15 min,預(yù)測(cè)場(chǎng)景為平常工作日。
廣州地鐵全網(wǎng)共有136個(gè)既有車(chē)站,對(duì)其進(jìn)行模糊C均值聚類(lèi)。結(jié)合廣州地鐵運(yùn)營(yíng)現(xiàn)狀,工作日早晚高峰時(shí)段分別為7:00—9:00和17:00—19:00,計(jì)算這2個(gè)時(shí)間段內(nèi)客流量占全日總客流量的比值,即為早、晚高峰系數(shù),將其作為聚類(lèi)指標(biāo),對(duì)工作日的全網(wǎng)既有車(chē)站進(jìn)行聚類(lèi),結(jié)果見(jiàn)表1。
表1 工作日車(chē)站聚類(lèi)結(jié)果
由表1可知:既有車(chē)站中居住占優(yōu)類(lèi)車(chē)站有三元里、東曉南、江南西等共14個(gè)車(chē)站,考慮相似既有車(chē)站較多,取新線開(kāi)通前半年內(nèi)的客流數(shù)據(jù),再加入新站開(kāi)通后逐日形成的客流數(shù)據(jù),由此構(gòu)成歷史數(shù)據(jù)庫(kù)。
為適時(shí)剔除既有車(chē)站客流數(shù)據(jù),分析近鄰匹配結(jié)果中既有車(chē)站客流與新站客流的占比。結(jié)果顯示:新站開(kāi)通后的前4個(gè)月,既有車(chē)站的匹配比例依次為95.33%,55.00%,28.00%,19.53%,反之新站本站客流的匹配比例逐月上升。即隨著新站開(kāi)通后時(shí)間的推移,本站的歷史客流量更能體現(xiàn)本站未來(lái)客流量變化趨勢(shì)。因此,考慮到預(yù)測(cè)算法的運(yùn)行效率,新站開(kāi)通3個(gè)月后,剔除歷史數(shù)據(jù)庫(kù)中既有車(chē)站的客流數(shù)據(jù),即令T1=0。
另外,新站開(kāi)通初期,因本站客流數(shù)據(jù)量較少,在數(shù)據(jù)庫(kù)構(gòu)建時(shí),將所有的平常工作日數(shù)據(jù)匯集在一起構(gòu)建工作日的歷史數(shù)據(jù)庫(kù)。在新站開(kāi)通3個(gè)月后,隨著新站數(shù)據(jù)量不斷增大,考慮到同一周次的客流規(guī)律相似度更高,可將歷史數(shù)據(jù)庫(kù)進(jìn)一步細(xì)化,分別針對(duì)周一至周五等5個(gè)工作日構(gòu)建歷史數(shù)據(jù)庫(kù),以提高算法的預(yù)測(cè)效率。
狀態(tài)向量的確定。根據(jù)廣州地鐵全網(wǎng)既有車(chē)站半年內(nèi)平常工作日15 min進(jìn)站客流量,以每日每車(chē)站60個(gè)(7:00—22:00)時(shí)段進(jìn)站客流量為1個(gè)樣本序列,共計(jì)19 312條樣本。根據(jù)式(3)計(jì)算樣本各階自相關(guān)系數(shù),取閾值M=0.5,統(tǒng)計(jì)所有樣本中rq≥0.5的占比,結(jié)果見(jiàn)表2。
表2 各階自相關(guān)系數(shù)滿(mǎn)足閾值條件(rq≥0.5)的占比統(tǒng)計(jì)
由表2可知:樣本中q=1,2,3時(shí),均有90%以上樣本數(shù)據(jù)滿(mǎn)足rq≥0.5,而q=4時(shí),滿(mǎn)足要求的樣本量低于30%,可認(rèn)為實(shí)時(shí)進(jìn)站客流量中,預(yù)測(cè)時(shí)段進(jìn)站客流量與前3個(gè)時(shí)段進(jìn)站客流量具有較強(qiáng)相關(guān)性。因此,確定平常工作日?qǐng)鼍跋逻M(jìn)站客流量預(yù)測(cè)時(shí)m=3,即本文提出的方法適用于當(dāng)日15 min的實(shí)時(shí)客流量采集時(shí)段已滿(mǎn)足3個(gè)的情況。
近鄰K值的確定。參照相關(guān)研究[14]結(jié)論,本文取Nk=10,表3列出燕崗站部分時(shí)段預(yù)測(cè)時(shí)的K取值,由于每日每時(shí)段均重新計(jì)算K值,且各時(shí)段取值不盡相同,本文不再一一列舉。
表3 燕崗站部分時(shí)段近鄰K值
基于實(shí)際數(shù)據(jù),定義a(t)為預(yù)測(cè)時(shí)段t實(shí)際的進(jìn)站客流量,將本文方法的預(yù)測(cè)結(jié)果與實(shí)際值進(jìn)行對(duì)比分析,采用平均絕對(duì)誤差MAE與平均絕對(duì)百分比誤差MAPE對(duì)模型進(jìn)行精度檢驗(yàn),其計(jì)算公式見(jiàn)式(8)和式(9),預(yù)測(cè)結(jié)果見(jiàn)表4。
(8)
(9)
表4 新站部分日期實(shí)時(shí)進(jìn)站客流量預(yù)測(cè)誤差
根據(jù)誤差統(tǒng)計(jì),各新站開(kāi)通當(dāng)天平均絕對(duì)百分比誤差均在22%以下,鶴洞、沙涌的誤差略大于燕崗,分析原因發(fā)現(xiàn),鶴洞、沙涌站的客流規(guī)模小,基礎(chǔ)客流量較小,導(dǎo)致相對(duì)誤差略大。前3個(gè)月的平均MAE不超過(guò)16人次,平均MAPE在17%以下。為更具體地分析15 min進(jìn)站客流量預(yù)測(cè)誤差,取燕崗站2015-12-30的實(shí)時(shí)進(jìn)站客流量預(yù)測(cè)值與實(shí)際值進(jìn)行比較,如圖7所示,由圖7可以看到數(shù)據(jù)點(diǎn)基本分布在45°線附近,說(shuō)明預(yù)測(cè)結(jié)果較為理想。
圖7 燕崗站預(yù)測(cè)值與真實(shí)值對(duì)比
為驗(yàn)證本文提出的改進(jìn)算法的有效性,以預(yù)測(cè)燕崗站2015-12-30實(shí)時(shí)進(jìn)站客流量為例,分別采用不考慮客流量差異性的傳統(tǒng)非參數(shù)回歸方法和本文方法進(jìn)行預(yù)測(cè)。結(jié)果表明,采用傳統(tǒng)預(yù)測(cè)方法的平均絕對(duì)誤差為23人次,平均絕對(duì)百分比誤差為17.23%;采用本文方法的預(yù)測(cè)誤差分別為16人次和12.19%??梢?jiàn),本文提出的改進(jìn)算法預(yù)測(cè)精度更優(yōu)于傳統(tǒng)非參數(shù)回歸算法。
此外,由表4還可以看到,隨著開(kāi)通時(shí)間的推移,預(yù)測(cè)誤差有一定變化。為進(jìn)一步分析該方法的預(yù)測(cè)效果,結(jié)合歷史數(shù)據(jù)庫(kù)的不同組成,對(duì)新站開(kāi)通后連續(xù)4個(gè)月內(nèi)平常工作日實(shí)時(shí)進(jìn)站量進(jìn)行預(yù)測(cè),統(tǒng)計(jì)得到周平均預(yù)測(cè)誤差,如圖8所示。由圖8可知:隨著歷史數(shù)據(jù)庫(kù)中本站客流量的增多,各新站的實(shí)時(shí)進(jìn)站客流量預(yù)測(cè)精度會(huì)逐漸提高直至平穩(wěn)。該結(jié)果說(shuō)明:隨著預(yù)測(cè)時(shí)間跨度的增大,本站歷史客流量逐漸積累,對(duì)歷史數(shù)據(jù)庫(kù)進(jìn)一步細(xì)分后,本文提出的方法可以得到較好的預(yù)測(cè)效果,說(shuō)明本文的預(yù)測(cè)方法具有良好的適應(yīng)性。
圖8 模型預(yù)測(cè)精度變化
本文分析了城市軌道交通新站開(kāi)通初期客流的變化規(guī)律,發(fā)現(xiàn)新站開(kāi)通初期3個(gè)月內(nèi)客流量波動(dòng)較大,而后客流量變化趨于穩(wěn)定。為解決新站開(kāi)通初期客流預(yù)測(cè)中歷史數(shù)據(jù)缺乏的問(wèn)題,本文提出了基于相同土地利用性質(zhì)的既有車(chē)站歷史客流數(shù)據(jù)的新站開(kāi)通初期客流預(yù)測(cè)的歷史數(shù)據(jù)庫(kù)構(gòu)建方法,然后針對(duì)新站開(kāi)通初期客流波動(dòng)大等問(wèn)題,結(jié)合新站實(shí)時(shí)客流特征,提出了基于改進(jìn)非參數(shù)回歸方法的新站實(shí)時(shí)進(jìn)出站客流量預(yù)測(cè)方法。其中,針對(duì)實(shí)時(shí)預(yù)測(cè)改進(jìn)了狀態(tài)向量及近鄰K值的確定方法,并考慮客流量差異性對(duì)預(yù)測(cè)算法做出調(diào)整,以提高算法的預(yù)測(cè)精度達(dá)到實(shí)時(shí)客流精準(zhǔn)預(yù)測(cè)的要求。
以廣州地鐵廣佛線二期新站開(kāi)通初期的實(shí)際進(jìn)站客流量預(yù)測(cè)為例,對(duì)本文方法的預(yù)測(cè)效果進(jìn)行了驗(yàn)證。結(jié)果顯示:各新站實(shí)時(shí)進(jìn)站量預(yù)測(cè)的平均絕對(duì)誤差不大于16人次。此外,隨著新站客流量數(shù)據(jù)不斷積累,該方法的預(yù)測(cè)精度會(huì)逐漸提高,說(shuō)明該方法在數(shù)據(jù)量充足的情況下能夠更加精確地預(yù)測(cè)實(shí)時(shí)進(jìn)出站客流量,實(shí)現(xiàn)車(chē)站及網(wǎng)絡(luò)客流的實(shí)時(shí)監(jiān)測(cè),為新站開(kāi)通后及時(shí)制定并實(shí)施運(yùn)輸組織計(jì)劃提供重要的決策依據(jù)。
[1]光志瑞.基于土地利用和可達(dá)性的城市軌道交通進(jìn)出站客流量預(yù)測(cè)[D].北京:北京交通大學(xué),2013.
(GUANG Zhirui. Passenger Flow Prediction for Urban Railway Station’s Entrance and Exit Based on Land-Use and Accessibility [D]. Beijing: Beijing Jiaotong University, 2013. in Chinese)
[2]蔡昌俊,姚恩建,張永生,等. 基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測(cè)[J].中國(guó)鐵道科學(xué),2015,36(1):126-132.
(CAI Changjun, YAO Enjian, ZHANG Yongsheng, et al. Forecasting of Passenger Flow’s Distribution among Urban Rail Transit Stations Based on AFC Data[J]. China Railway Science, 2015,36(1):126-132. in Chinese)
[3]程濤,周峰,酈海通.西安地鐵2號(hào)線南段運(yùn)營(yíng)初期客流預(yù)測(cè)[J].都市快軌交通,2015,28(5):45-49.
(CHENG Tao, ZHOU Feng, LI Haitong. Forecasting Passenger Flow on Southern Extension of Xi’an Metro Line 2 in Preliminary Operation Stage[J]. Urban Rapid Rail Transit,2015,28(5):45-49. in Chinese)
[4]趙路敏,王奕,杜世敏.新線開(kāi)通對(duì)線網(wǎng)客流特征的影響[J]. 都市快軌交通,2011,24(2):46-49.
(ZHAO Lumin, WANG Yi, DU Shimin. Impact of Opening a New Line on Passenger Flow Feature ofUrban Rail Transit Network[J]. Urban Rapid Rail Transit, 2011,24(2):46-49. in Chinese)
[5]JAN G De Gooijer, ROB J. Hyndman. 25 Years of Time Series Forecasting[J].International Journal of Forecasting,2006,22(3):443-473.
[6]WILLIAMS B M, HOEL L A. Modeling and Forecasting Vehicular Traffic Flow as a Seasonal ARIMA Process: Theoretical Basis and Empirical Results[J]. Journal of Transportation Engineering, 2003, 129(6):664-672.
[7]OKUTANI I, STEPHANEDES Y J. Dynamic Prediction of Traffic Volume through Kalman Filtering Theory[J]. Transportation Research Part B: Methodological, 1984, 18(1): 1-11.
[8]張春輝, 宋瑞, 孫楊. 基于卡爾曼濾波的公交站點(diǎn)短時(shí)客流預(yù)測(cè)[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2011, 11(4): 154-159.
(ZHANG Chunhui, SONG Rui, SUN Yang. Kalman Filter-Based Short-Term Passenger Flow Forecasting on Bus Stop[J].Journal of Transportation Systems Engineering and Information Technology,2011,11(4):154-159. in Chinese)
[9]楊軍,侯忠生.基于小波分析的最小二乘支持向量機(jī)軌道交通客流預(yù)測(cè)方法[J].中國(guó)鐵道科學(xué),2013,34(3):122-127.
(YANG Jun, HOU Zhongsheng. A Wavelet Analysis Based LS-SVM Rail Transit Passenger Flow Prediction Method[J]. China Railway Science, 2013,34(3):122-127. in Chinese)
[10]SUN Yuxing, LENG Biao, GUAN Wei. A Novel Wavelet-SVM Short Time Passenger Flow Prediction in Beijing Subway System[J]. Neurocomputing,2015(166):109-121.
[11]YU Wei, MU Chen Chen. Forecasting the Short-Term Metro Passenger Flow with Empirical Mode Decomposition and Neural Networks[J]. Transportation Research Part C,2012(21):148-162.
[12]董升偉.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的軌道交通短時(shí)客流預(yù)測(cè)方法研究[D].北京交通大學(xué),2013.
(DONG Shengwei.The Research of Short-Time Passenger Flow Forecasting Based on Improved BP Neural Network in Urban Rail Transit[D]. Beijing: Beijing Jiaotong University, 2013. in Chinese)
[13]張曉利,陸化普.非參數(shù)回歸方法在短時(shí)交通流預(yù)測(cè)中的應(yīng)用[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2009,49(9):1471-1475.
(ZHANG Xiaoli, LU Huapu. Non-Parametric Regression and Application for Short-Term Traffic Flow Forecasting[J].Journal of Tsinghua University:Science and Technology,2009,49(9):1471-1475. in Chinese)
[14]張濤,陳先,謝美萍,等.基于K近鄰非參數(shù)回歸的短時(shí)交通流預(yù)測(cè)方法[J].系統(tǒng)工程理論與實(shí)踐,2010,30(2):376-384.
(ZHANG Tao, CHEN Xian, XIE Meiping, et al.K-NN Based Nonparametric Regression Method for Short-Term Traffic Flow Forecasting[J].System Engineering-Theory & Practice, 2010,30(2): 376- 384. in Chinese)
[15]王翔,陳小鴻,楊祥妹.基于K最近鄰算法的高速公路行程時(shí)間預(yù)測(cè)[J].中國(guó)公路學(xué)報(bào),2015,28(1):102-111.
(WANG Xiang, CHEN Xiaohong, YANG Xiangmei. Short Term Prediction of Expressway Travel Time Based onKNearest Neighbor Algorithm[J].China Journal of Highway and Transport, 2015,28(1): 102-111. in Chinese)
[16]劉美琪,焦朋朋,孫拓.城市軌道交通進(jìn)站客流量短時(shí)預(yù)測(cè)模型研究[J].城市軌道交通研究,2015(11):13-17.
(LIU Meiqi, JIAO Pengpeng, SUN Tuo. On Short-Term Forecasting Model of Passenger Flow in Urban Rail Transit[J].Urban Mass Transit, 2015(11):13-17. in Chinese)
[17]姚恩建,李斌斌,劉莎莎,等.考慮土地利用性質(zhì)匹配度的城軌客流分布預(yù)測(cè)[J].交通運(yùn)輸系統(tǒng)工程與信息,2015,15(6):107-113.
(YAO Enjian, LI Binbin, LIU Shasha, et al. Forecast of Passenger Flow Distribution among Urban Rail Stations Considering the Land-Use Matching Degree[J]. Journal of Transportation Systems Engineering and Information Technology, 2015,15(6):107-113. in Chinese)
[18]姚恩建,程欣,劉莎莎,等.基于可達(dá)性的城軌既有站進(jìn)出站客流預(yù)測(cè)[J].鐵道學(xué)報(bào),2016,38(1):1-7.
(YAO Enjian, CHENG Xin, LIU Shasha, et al. Accessibility-Based Forecasting on Passenger Flow Entering and Departing Existing Urban Railway Stations[J]. Journal of the China Railway Society, 2016,38(1):1-7. in Chinese)
[19]李星毅.基于相似性的交通流分析方法[D].北京:北京交通大學(xué),2010.
(LI Xingyi. Methods of Traffic Flow Analysis Based on Similarity[D]. Beijing: Beijing Jiaotong University, 2010. in Chinese)