王夏秋 張 寧 王 健
(1. 東南大學(xué)智能運(yùn)輸系統(tǒng)研究中心軌道交通研究所, 210096, 南京;2. 南京地下鐵道有限責(zé)任公司, 210024, 南京//第一作者,碩士研究生)
短期客流預(yù)測指預(yù)測1年內(nèi)(主要以小時、日、月、季度等時間單位作為時間粒度)的軌道交通網(wǎng)絡(luò)或者線路的客流特征、服務(wù)水平以及出行效率等[1-3],是城市軌道交通運(yùn)營部門展開各項(xiàng)管理工作的基礎(chǔ)與依據(jù)。在以往的短期客流預(yù)測研究中,主要集中于短期客流的日/小時預(yù)測[4-5],而對于月度或季度等更長時間跨度的短期客流預(yù)測還少有研究。但在城市軌道交通的實(shí)際運(yùn)營中,車輛月度檢修計(jì)劃、運(yùn)用車配備計(jì)劃以及日常運(yùn)輸計(jì)劃的調(diào)整等大型生產(chǎn)計(jì)劃需要參考月度、季度客流預(yù)測的結(jié)果,同時,運(yùn)營企業(yè)可根據(jù)該預(yù)測結(jié)果合理制定年度/季度生產(chǎn)運(yùn)營計(jì)劃。有鑒于此,本文針對月度客流預(yù)測展開研究。
與小時/日客流不同的是,城市軌道交通月度客流受偶然因素影響的隨機(jī)波動性不大,但因預(yù)測的時間跨度較大,其受季節(jié)氣候變化、法定節(jié)假日分布、學(xué)校寒暑假等較穩(wěn)定因素影響呈現(xiàn)出季節(jié)性波動的周期性特征[5]。因此,針對月度客流量呈現(xiàn)的明顯季節(jié)性特點(diǎn),引入季節(jié)指數(shù)對原始月度客流數(shù)據(jù)進(jìn)行季節(jié)處理,以季節(jié)調(diào)整原始數(shù)據(jù)并利用自回歸積分滑動平均(ARIMA)模型對城市軌道交通月度客流進(jìn)行預(yù)測,從而使構(gòu)建的預(yù)測模型具有更好的預(yù)測精度,提高預(yù)測結(jié)果的準(zhǔn)確度。
現(xiàn)代城市軌道交通系統(tǒng)采用自動售檢票(AFC)系統(tǒng)記錄乘客的交易數(shù)據(jù),是獲取軌道交通客流數(shù)據(jù)的良好平臺,為月度客流特性分析和城市軌道交通短期客流預(yù)測工作提供了數(shù)據(jù)支撐。本文采用的城市軌道交通運(yùn)營客流數(shù)據(jù)來自于南京地鐵自動售檢票系統(tǒng),以月份為統(tǒng)計(jì)時間間隔,南京地鐵2號線月度進(jìn)站客流的時間演變?nèi)鐖D1所示。
a) 年度時間序列
b) 月度時間序列圖1 網(wǎng)絡(luò)化運(yùn)營后的南京地鐵2號線月進(jìn)站客流演變圖
由圖1可見,月度客流量有以下變化特征:
(1) 趨勢增長性。圖1 a)年度時間序列反映的是月度客流量在同一月份不同年份的變化情況,體現(xiàn)了客流量隨著沿線土地開發(fā)利用逐漸實(shí)施與完善以及網(wǎng)絡(luò)化運(yùn)營效應(yīng)的影響所呈現(xiàn)出的增長趨勢。具體表現(xiàn)為在相鄰的兩個年份之間,其客流量具有相同的分布特性,且隨著城市經(jīng)濟(jì)的發(fā)展,客流總體隨著各月份呈現(xiàn)出增長趨勢。
(2) 季節(jié)波動性。圖1 b)月度時間序列反映的是月度客流量隨著時間的逐漸推移呈現(xiàn)出不同的變化情況,體現(xiàn)了該月度客流量由于季節(jié)變化的不同而引起波動的發(fā)展趨勢。具體表現(xiàn)為:由于春節(jié)假期原因,客流量在每年1、2月份出現(xiàn)低谷;7、8月份受到炎熱天氣以及學(xué)生放假的影響,其客流量略少于其他月份。因此,月度客流量每年重復(fù)出現(xiàn)循環(huán)變動,即以12個月為周期的季節(jié)波動性。
從圖1可以發(fā)現(xiàn),城市軌道交通月度客流受偶然因素影響的隨機(jī)波動性不大,但因預(yù)測的時間跨度較大,一方面,受季節(jié)氣候變化、法定節(jié)假日分布、學(xué)校寒暑假等較穩(wěn)定因素影響,呈現(xiàn)出季節(jié)性波動的周期性特征;另一方面,在無新線接入的條件下,主要受線路周邊土地開發(fā)利用程度和網(wǎng)絡(luò)化運(yùn)營效應(yīng)影響而呈現(xiàn)趨向于線性但不夠平穩(wěn)的趨勢增長性特征。考慮到季節(jié)指數(shù)法能夠有效地消除季節(jié)性因素影響,且ARIMA模型是線性估計(jì)模型,其對線性且非平穩(wěn)性時間序列數(shù)據(jù)能進(jìn)行較好的處理,因此,結(jié)合兩種模型的優(yōu)勢,引入季節(jié)指數(shù)法和ARIMA模型共同對城市軌道交通月度客流量進(jìn)行預(yù)測,從而使構(gòu)建的預(yù)測模型具有更好的預(yù)測精度,提高預(yù)測結(jié)果的準(zhǔn)確度。
形成以12個月為循環(huán)周期的這種季節(jié)性波動最主要的因素是自然季節(jié)性和制度季節(jié)性的綜合影響。其中,自然季節(jié)性是一年中氣候、光照時長、溫度等因素變化的結(jié)果;而制度季節(jié)性則是由于法定節(jié)假日及一些特殊時期的活動引起的,尤其是法定節(jié)假日是制度季節(jié)性的最一般性的表現(xiàn)。正是由于這兩種因素的疊加,形成了我國城市軌道交通月度客流季節(jié)性波動的獨(dú)特性。因此,需要從該時間序列中剔除季節(jié)因素,在建模預(yù)測前引入季節(jié)指數(shù)調(diào)整[6],建模預(yù)測過程中對預(yù)測值用季節(jié)指數(shù)逆向季節(jié)調(diào)整,使預(yù)測結(jié)果更符合客觀規(guī)律[7]。
季節(jié)指數(shù)是基于統(tǒng)計(jì)學(xué)的一種簡化時間序列數(shù)據(jù)的方法,通過該方法對季節(jié)時間序列的季節(jié)性進(jìn)行處理,同時使得原始數(shù)據(jù)中的一些重要信息不被丟失。本文采用的是直接平均季節(jié)指數(shù)法對原始客流數(shù)據(jù)進(jìn)行建模前的季節(jié)指數(shù)調(diào)整。直接平均季節(jié)指數(shù)法用算數(shù)平均值直接計(jì)算各月或各季度的季節(jié)指數(shù)[6],其計(jì)算公式為:
(1)
式中:
cj——第j個月的季節(jié)指數(shù);
xij——第i年第j個月份的客流量。
然后利用該指數(shù)對歷史各月份的月度流量xij進(jìn)行季節(jié)調(diào)整:
(2)
經(jīng)過對歷史數(shù)據(jù)的處理之后,通過預(yù)測得到未來時期某個月份的客流總量為yj,那么逆向季節(jié)調(diào)整后的該月客流總量為:
(3)
ARIMA模型是將非平穩(wěn)時間序列通過差分計(jì)算轉(zhuǎn)化為平穩(wěn)序列后,將因變量僅對其滯后值及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸建模[8]。由此可知,ARIMA模型是對時間序列進(jìn)行差分轉(zhuǎn)化、自回歸、移動平均的一種預(yù)測方法,故ARIMA(p,d,q) 稱為差分自回歸移動平均模型。其表達(dá)式為:
xt=φ0xt-d+φ1xt-d-1+…+φpxt-d-p+εt-
θ1εt-1-θ2εt-2-…-θqεt-q
(4)
式中:
xt,xt-1,…,xt-p——觀測序列值;
B——延遲算子;
{εt}——零均值白噪聲;
φ0,φ1,φ2,…,φp,θ1,θ2,…,θq,εt——均為待估參數(shù);
p——自回歸項(xiàng);
q——移動平均項(xiàng)數(shù);
d——時間序列成為平穩(wěn)時所做的差分次數(shù)。
基于季節(jié)指數(shù)的ARIMA模型的短期客流預(yù)測是先通過季節(jié)指數(shù)調(diào)整原始客流序列后,再通過差分處理將序列平穩(wěn)化,最終將其轉(zhuǎn)化為ARIMA模型來解決。主要預(yù)測步驟如下:① 計(jì)算季節(jié)指數(shù)并調(diào)整月度客流序列。根據(jù)數(shù)據(jù)優(yōu)化處理方法,利用原始客流數(shù)據(jù)計(jì)算各月份的季節(jié)指數(shù),并用計(jì)算得到的季節(jié)指數(shù)按照式(2)對樣本中的各月份客流量進(jìn)行季節(jié)調(diào)整,以獲得變換后的月度客流序列。② 利用經(jīng)過變換后的客流序列建立ARIMA模型。將經(jīng)過變換后的客流數(shù)據(jù)按照數(shù)據(jù)平穩(wěn)化處理、模型識別、參數(shù)估計(jì)和檢驗(yàn)這三步構(gòu)建出合適的ARIMA模型。③ 利用季節(jié)指數(shù)逆向季節(jié)調(diào)整預(yù)測值。利用上一步得到的模型預(yù)測未來時期某個月份的客流量,并按照式(3)對預(yù)測值進(jìn)行逆向季節(jié)調(diào)整,得到的結(jié)果即為最終的月度客流預(yù)測值。
本文選取網(wǎng)絡(luò)化運(yùn)營穩(wěn)定后南京地鐵2號線2011—2013年共36個月的進(jìn)站客流量為基礎(chǔ)數(shù)據(jù),通過本文計(jì)算方法對36個月的原始月度客流時間序列數(shù)據(jù)進(jìn)行計(jì)算,得到季節(jié)指數(shù)(如表1)。
表1 月度客流時間序列的季節(jié)指數(shù)
根據(jù)表 1的季節(jié)指數(shù),對原始客流序列進(jìn)行季節(jié)調(diào)整,經(jīng)過變換后的月度客流序列如圖 2所示。
利用變換后的月度客流序列構(gòu)建ARIMA(1,1,1)(0,1,0)12模型,對月度客流量進(jìn)行預(yù)測,得到的預(yù)測結(jié)果如表 2所示。同時,為驗(yàn)證本文提出的預(yù)測方法的有效性,將原始數(shù)據(jù)直接建模預(yù)測得到的結(jié)果與之對比分析,有無季節(jié)指數(shù)調(diào)整的ARIMA模型預(yù)測結(jié)果如表 2所示。
表2 有無季節(jié)指數(shù)調(diào)整的預(yù)測結(jié)果
通過相對誤差(PE)和平均絕對百分比誤差(MAPE)兩個指標(biāo)來檢驗(yàn)兩個模型的預(yù)測精度,其性能評價指標(biāo)結(jié)果如表3所示。
表3 有無季節(jié)指數(shù)調(diào)整的ARIMA模型誤差對比分析 %
進(jìn)一步地,得到有無季節(jié)指數(shù)調(diào)整的預(yù)測客流趨勢曲線與實(shí)際客流曲線對比,如圖3所示。
圖3 2014年1—6月有無季節(jié)指數(shù)調(diào)整的預(yù)測客流趨勢曲線與實(shí)際客流曲線對比圖
通過兩個指標(biāo)對比分析可見,基于季節(jié)指數(shù)的ARIMA模型預(yù)測各月度客流量的相對誤差較無季節(jié)指數(shù)調(diào)整的ARIMA模型的相對誤差好,均在10%以內(nèi),有些月份的相對誤差更達(dá)到了2%以內(nèi),相對誤差主要在5%范圍上下波動,平均絕對誤差也在5%以內(nèi)。 對于個別月份的相對誤差比無季節(jié)指數(shù)調(diào)整的ARIMA模型預(yù)測結(jié)果的誤差值大(如2月份和5月份),是因?yàn)?014年的春節(jié)處于2月份,期間客流出行受走訪探親、購物、旅游等多種隨機(jī)因素的綜合影響,且歷史年的春節(jié)并非都處于2月份,僅通過季節(jié)調(diào)整而不考慮日歷因素影響得到的預(yù)測結(jié)果,反而比單純利用ARIMA模型預(yù)測的結(jié)果誤差更大,未來可考慮加入日歷因素影響因子以提高預(yù)測結(jié)果的準(zhǔn)確度。而2014年5月31日南京為迎接青奧會的到來在南京玄武湖舉辦環(huán)湖大型徒步活動,致使當(dāng)日客流量較歷史同期的客流量大幅度增加,進(jìn)而影響5月份的客流總量。與此同時,圖3的趨勢曲線表明,相對于無季節(jié)指數(shù)調(diào)整的預(yù)測客流趨勢曲線而言,基于季節(jié)指數(shù)調(diào)整的預(yù)測客流趨勢曲線與實(shí)際客流曲線更加吻合。綜上所述,基于季節(jié)指數(shù)的ARIMA模型預(yù)測效果更佳。
本文提出的基于季節(jié)指數(shù)的預(yù)測方法是在采用ARIMA 模型建模預(yù)測前引入季節(jié)指數(shù)對原始客流數(shù)據(jù)進(jìn)行季節(jié)調(diào)整,以消除季節(jié)因素對建模的影響,并在預(yù)測結(jié)束后用季節(jié)指數(shù)對預(yù)測值進(jìn)行逆向季節(jié)調(diào)整,使預(yù)測結(jié)果更加符合客觀規(guī)律。通過與未經(jīng)過季節(jié)指數(shù)調(diào)整的ARIMA模型預(yù)測結(jié)果對比分析,說明了本文提出的方法在月度客流預(yù)測中精度較高,基本滿足對客流量的預(yù)測需求。運(yùn)營單位可根據(jù)該方法得到的預(yù)測量及時調(diào)整相關(guān)運(yùn)能運(yùn)力,制定更加經(jīng)濟(jì)合理的季度或年度運(yùn)營計(jì)劃。需要指出的是,基于季節(jié)指數(shù)的ARIMA模型適用于具有周期性變化規(guī)律的客流量預(yù)測,而以小時、天等更小的預(yù)測時間跨度也具有一定的周期波動性,未來可嘗試采用該模型進(jìn)行預(yù)測。