倪 杰,于 莉,靳笑楠
(上海工程技術(shù)大學(xué) 城市軌道交通學(xué)院,上海201620)
近年來,隨著城市軌道交通行業(yè)的高速發(fā)展,由于新線開通運(yùn)營后期,站點(diǎn)周邊公交配套設(shè)施逐漸完備,乘客對(duì)于新線已經(jīng)較為熟悉,且原有的客流出行習(xí)慣也會(huì)由于新線所提供的便利性而得到改變。此時(shí)站點(diǎn)的進(jìn)出站客流波動(dòng)趨于穩(wěn)定,因此可以利用歷史數(shù)據(jù)進(jìn)行客流預(yù)測。
目前,眾多學(xué)者針對(duì)不同場景提出不同的預(yù)測方法。郭文雅等[1]比對(duì)武漢軌道交通3號(hào)線開通前后,線網(wǎng)及各線路客流變化情況,定量分析了新線開通對(duì)線網(wǎng)及各線路客流的影響,提出了提高線網(wǎng)客流的幾項(xiàng)建議和措施。楊德明等[2]對(duì)深圳地鐵新開通線路進(jìn)行觀察,結(jié)合網(wǎng)絡(luò)后臺(tái)客流數(shù)據(jù)分析,找出網(wǎng)絡(luò)中存在較大問題的車站,掌握新線開通客流變化規(guī)律。朱霞等[3]從上海軌道交通運(yùn)營線路的客流變化入手,探討網(wǎng)絡(luò)化進(jìn)程對(duì)客流變化的影響,分析網(wǎng)絡(luò)化進(jìn)程中客流變化的原因。鄭清杰[4]在分析歷史新線接入后客流變化情況,基于土地利用性質(zhì)對(duì)城市軌道交通車站進(jìn)行K聚類,基于聚類結(jié)果及新線車站的評(píng)估,進(jìn)行新線車站進(jìn)出站量的預(yù)測。
考慮到不同重要度等級(jí)下的站點(diǎn)客流特性有較大差異[5],時(shí)間序列模型的優(yōu)勢在于能夠較好的挖掘出數(shù)值變化背后的規(guī)律性。因此,本文采用時(shí)間序列模型進(jìn)行站點(diǎn)進(jìn)出站客流的預(yù)測,并利用小波去噪法,針對(duì)客流信號(hào)中不規(guī)則波動(dòng)的噪點(diǎn)進(jìn)行去除,提高預(yù)測精度。
時(shí)間序列模型能夠?qū)σ粋€(gè)時(shí)間序列進(jìn)行時(shí)頻兩方面的分析。時(shí)域分析認(rèn)為當(dāng)前信號(hào)組成的時(shí)間序列是由過去的狀態(tài)以及相關(guān)的外部因素(噪聲、干擾等)組成的,即將來的數(shù)據(jù)能夠由之前的時(shí)序數(shù)據(jù)預(yù)測而出;頻域分析則認(rèn)為時(shí)間序列可以通過不同周期振幅下的正弦波相加而得,即將正弦波通過平移拉伸產(chǎn)生一系列不同周期及振幅的波系來對(duì)一個(gè)信號(hào)進(jìn)行表示[6]。
本文研究內(nèi)容為城市軌道交通客流數(shù)據(jù),該序列受多種因素的影響,呈現(xiàn)出時(shí)序的趨勢及特征。因此在對(duì)客流信號(hào)進(jìn)行分析時(shí)主要還是關(guān)注于時(shí)間域,以達(dá)到預(yù)測的目的。而頻率域的分析,則集中于對(duì)客流信號(hào)的去噪,以及不同頻率成分的分析。由于本文所采用的數(shù)據(jù)為地鐵日進(jìn)出站客流量,且數(shù)據(jù)時(shí)間跨度較大,故而季節(jié)性與趨勢性并存,因此采用A R I M A(p,d,q)(P,D,Q)S進(jìn)行預(yù)測模型的建立。ARIMA方法的模型運(yùn)用主要包括:模型平穩(wěn)性分析、模型階數(shù)判定以及模型估計(jì)。利用季節(jié)時(shí)間序列模型即可預(yù)測出各等級(jí)下的站點(diǎn)新線開通后期的進(jìn)出站客流。
為了驗(yàn)證方法的可行性,在站點(diǎn)客流預(yù)測前,優(yōu)先針對(duì)線網(wǎng)全日總客流進(jìn)行預(yù)測嘗試。圖1即為利用2006年1月~11月的全日客流數(shù)據(jù),預(yù)測2016年12月的預(yù)測值與實(shí)際值之間的對(duì)比圖。
圖1 全日總客流時(shí)間序列預(yù)測值與實(shí)際值對(duì)比圖Fig.1 Comparison of predicted and actual values of total daily passenger flow
由此可見,總體預(yù)測精度較高,能夠較好地保留客流變化的趨勢,證明了預(yù)測方法的可用性。
時(shí)間序列模型即為利用站點(diǎn)歷史客流數(shù)據(jù)的變化對(duì)新線開通后期的站點(diǎn)客流量進(jìn)行預(yù)測。由于不同線路所在線網(wǎng)中位置走向的差異,則在進(jìn)行實(shí)際預(yù)測時(shí),需要對(duì)不同類別線路的站點(diǎn)分別進(jìn)行建模,以提高預(yù)測精度。本文選取上海地鐵9號(hào)線楊高中路站作為實(shí)例,進(jìn)行換乘站點(diǎn)進(jìn)站客流預(yù)測模型的建立與演示。
預(yù)測采用2015年1月1日~2018年6月24日的上海地鐵9號(hào)線楊高中路站的全日進(jìn)站客流數(shù)據(jù),利用Matlab繪制該站進(jìn)站客流的總體趨勢如圖2所示。
從圖中清晰可見客流變化趨勢,春節(jié)期間,客流量降至全年的低谷,各大節(jié)假日,客流量也會(huì)有較大的降低。此外還有少量數(shù)據(jù)存在著較大幅度的波動(dòng),若將這些異常波動(dòng)點(diǎn)納入時(shí)間序列模型中,則會(huì)降低預(yù)測的精度及模型的擬合效果,因此需要利用小波分析方法進(jìn)行去噪。
圖2 楊高中路站進(jìn)站客流總體趨勢圖Fig.2 The overall trend of passenger flow in Middle Yanggao Road Station
(1)借助Matlab對(duì)客流數(shù)據(jù)進(jìn)行db9小波基下的3層分解,編程求取閾值(約為3745.3)。將分解后的低頻信號(hào)進(jìn)行軟閾值去噪,對(duì)去噪后的信號(hào)進(jìn)行重構(gòu),可得新的客流趨勢如圖3所示。
圖3 三層分解后的客流高低頻信號(hào)Fig.3 High and low frequency signals of Three-layer decomposition of passenger flow
由此可見,經(jīng)過小波去噪后的客流信號(hào),相對(duì)較為光滑且將客流波動(dòng)變化的特征尖峰很好地進(jìn)行了保留。去噪后的進(jìn)站客流總體趨勢如圖4所示。(2)利用去噪后的客流數(shù)據(jù)進(jìn)行時(shí)間序列模型的構(gòu)建,首先繪制自相關(guān)圖和偏自相關(guān)圖,如圖5所示。
圖4 去噪后的進(jìn)站客流總體趨勢圖Fig.4 Overall trend of inbound passenger flow after denoising
顯而易見,兩圖皆未呈現(xiàn)拖尾或是截尾趨勢,因此序列非平穩(wěn)。觀察偏自相關(guān)圖中,數(shù)據(jù)在前三階顯著突出,但隨著階數(shù)的增長,數(shù)據(jù)在零水平線上下波動(dòng)未顯著趨于零。因此可知,序列趨勢性與季節(jié)性并存。
(3)為了消除數(shù)據(jù)的趨勢性和季節(jié)性,擬采用一階差分和一階季節(jié)差分對(duì)數(shù)據(jù)進(jìn)行差分。經(jīng)增加階數(shù)進(jìn)行差分以及對(duì)數(shù)變換等嘗試,效果并不明顯。因此,為了不過分丟失原始數(shù)據(jù)的特性,最終選擇一階差分。差分結(jié)果如圖6所示。
經(jīng)差分后數(shù)據(jù)的自相關(guān)圖、偏自相關(guān)圖,如圖7所示。數(shù)據(jù)的趨勢性得到了一定的消除,但仍有少許季節(jié)性波動(dòng)。
圖5 去噪后客流數(shù)據(jù)的自相關(guān)圖和偏自相關(guān)圖Fig.5 Autocorrelation and partial autocorrelation of passenger flow data after denoising
圖6 客流信號(hào)的一階差分圖Fig.6 First order difference in the passenger flow
圖7 差分后數(shù)據(jù)的自相關(guān)圖和偏自相關(guān)圖Fig.7 Autocorrelation plot and partial autocorrelation plot of differential data
考慮到數(shù)據(jù)既存在著趨勢性又存在季節(jié)性,在構(gòu)建季節(jié)時(shí)間序列模型時(shí),根據(jù)圖7的拖尾及截尾情況,嘗試建立A RIMA(5,1,3)(1,0,1)S模型,利用SPSS進(jìn)行模型參數(shù)的擬合,實(shí)際擬合結(jié)果見表1。
由模型擬合結(jié)果可知,平穩(wěn)的R方和R方都達(dá)到0.858,Ljung-Box Q(18)(楊博克斯統(tǒng)計(jì)量)的顯著性為0.713,說明序列已經(jīng)達(dá)到平穩(wěn),消除了自相關(guān)性,而且正態(tài)化貝葉斯統(tǒng)計(jì)值也達(dá)到13.924,可見模型總體擬合效果良好,可用性較高。
利用所建模型對(duì)一周內(nèi)的進(jìn)站客流進(jìn)行預(yù)測(2018年6月25~7月1日數(shù)據(jù)),預(yù)測出的客流量見表2,客流預(yù)測值的擬合效果如圖8所示。
預(yù)測進(jìn)站客流值與實(shí)際客流量作對(duì)比結(jié)果見表3。求得平均誤差約為3.708%,可見預(yù)測效果較好,能夠達(dá)到一定的運(yùn)用程度。
表1 模型擬合效果評(píng)價(jià)表Tab.1 Model fitting effect evaluation
表2 模型預(yù)測結(jié)果Tab.2 Model prediction result
圖8 客流預(yù)測值擬合圖Fig.8 Passenger flow prediction value fitting map
表3 預(yù)測結(jié)果比較Tab.3 Comparison of prediction results
本文以2015年~2018年上海地鐵客流數(shù)據(jù)為基礎(chǔ),以軌道交通市區(qū)段新線開通后的進(jìn)出站客流量為預(yù)測對(duì)象,預(yù)測城市軌道交通新線開通后期的客運(yùn)量。在進(jìn)行時(shí)序建模時(shí)需要對(duì)區(qū)段的站點(diǎn)分別進(jìn)行建模,對(duì)楊高中路站站進(jìn)行了基于小波去噪的時(shí)間序列模型預(yù)測的實(shí)例分析,預(yù)測平均誤差較小(約為3.708%),證明該方法具有一定的實(shí)用性和工程應(yīng)用性,可以應(yīng)用于新開線路后期的客流預(yù)測研究及工程應(yīng)用。