石莊彬 張 寧 邵星杰
(1.東南大學(xué)ITS研究中心軌道交通研究所,210018,南京; 2.南京地鐵運營有限責(zé)任公司,210008,南京∥第一作者,博士研究生)
城市軌道交通客流高峰持續(xù)時間預(yù)測方法*
石莊彬1張 寧1邵星杰2
(1.東南大學(xué)ITS研究中心軌道交通研究所,210018,南京; 2.南京地鐵運營有限責(zé)任公司,210008,南京∥第一作者,博士研究生)
分析了國內(nèi)城市軌道交通運營管理的發(fā)展現(xiàn)狀,總結(jié)了關(guān)于客流高峰持續(xù)時間現(xiàn)有的研究方法,通過對比分析,選擇回歸分析作為城市軌道交通客流持續(xù)時間預(yù)測模型。分析和定義了城市軌道交通客流高峰事件的概念,探討了客流高峰事件的影響因素,闡述了回歸分析模型的理論基礎(chǔ)和求解方法。以南京地鐵1號線的數(shù)據(jù)作為原始數(shù)據(jù)并進行建模,在此基礎(chǔ)上驗證研究方法的可行性。
城市軌道交通; 客流高峰持續(xù)時間; 回歸分析
First-author′s address ITS Rail Transit Research Institute,Southeast University,210018,Nanjing,China
目前,我國的城市軌道交通發(fā)展還處于初期,運營管理水平仍有很大的提升空間。尤其在城市軌道交通客流高峰事件管理方面,主要依靠管理人員主觀經(jīng)驗,缺少必要的理論支持,存在不能對客流需求變化做出及時反應(yīng)、通行能力浪費和服務(wù)水平低下等問題。
我國城市軌道交通當(dāng)前的總體趨勢是各大中城市正在不斷地建設(shè)新線,逐步形成城市軌道交通網(wǎng)絡(luò),客流模式還處于發(fā)展變化之中。由于城市軌道交通快速、準(zhǔn)時、運量大等優(yōu)勢,公共交通中選擇城市軌道交通出行的乘客比例隨著城市軌道交通線網(wǎng)發(fā)展迅速攀升。同時,我國城市人口密度大,出行需求較高,導(dǎo)致高峰時段乘客的等待延誤和擁擠現(xiàn)象時有發(fā)生,成為提升城市軌道交通服務(wù)質(zhì)量的瓶頸。為合理節(jié)省企業(yè)資源和提高運營管理水平,迫切需要一種簡單迅速、準(zhǔn)確性高的城市軌道交通客流高峰持續(xù)時間預(yù)測方法。
國內(nèi)外許多學(xué)者已在交通事件持續(xù)時間預(yù)測分析方面做了一定的研究,由于數(shù)據(jù)來源、分析角度、研究目的不同,所建立的預(yù)測方法也不盡相同。主要的預(yù)測方法包括:概率統(tǒng)計[1,3]、回歸分析[4-6]、決策樹模型[7-8]、模糊邏輯法[9]、生存分析[10-11]等。
近年來,一些研究者試圖加入其它的方法,如貝葉斯決策理論、人工神經(jīng)網(wǎng)絡(luò)、支持向量機等,以提高預(yù)測的精度和擴大模型適用范圍,并證實預(yù)測方法的有效性。考慮到現(xiàn)有的一些方法具有過于復(fù)雜難以理解、計算處理時間較長、易收斂于局部極小值等缺陷,在實際應(yīng)用中實施比較困難,而回歸分析操作相對簡單且能取得較好的預(yù)測結(jié)果,本文選擇回歸分析作為城市軌道交通客流高峰持續(xù)時間預(yù)測模型。首先從客流高峰事件的定義出發(fā),對客流高峰事件的影響因素進行重點分析,然后介紹回歸分析模型的原理,并通過實例應(yīng)用對模型有效性進行驗證。
1.1 客流高峰持續(xù)時間定義
目前,國內(nèi)外對于交通高峰事件尚未有明確的定義。根據(jù)美國道路通行能力手冊(HCM2010),高峰小時被認為是一天中交通流量最大的1 h[1]。高峰小時流量反映了線路的交通通行需求,是通行能力以及其它交通分析的重點,在交通工程設(shè)計和運營決策過程中往往作為一個十分重要的基礎(chǔ)數(shù)據(jù)。一般日??土鞲叻迨侵赣捎诰用裢ㄇ凇⑸蠈W(xué)、娛樂等出行行為引起某個時間段內(nèi)的交通流量明顯高于其它時段,接近甚至超過線路的通行能力,在客流分布曲線上形成明顯的“山峰”。其中最典型的現(xiàn)象是城市交通的早、晚峰。根據(jù)歷史經(jīng)驗,在實際的分析中,通常劃分早高峰時段為7:00—9:00,晚高峰時段為17:00—19:00。
但對高峰小時交通量的統(tǒng)計結(jié)果及依據(jù)經(jīng)驗劃分的高峰時段對客流的描述過于粗糙,無法準(zhǔn)確判斷交通進入高峰狀態(tài)的時間以及高峰狀態(tài)持續(xù)的時間長度。造成這種情況的主要原因在于缺乏對交通量實時精確的檢測。與城市道路交通不同的是,城市軌道交通自動售檢票(AFC)系統(tǒng)詳細地記錄了乘客進出站的交易信息,并有能力將交易數(shù)據(jù)實時上傳至清分中心(ACC),這就為城市軌道交通客流高峰事件的分析提供了實施的基礎(chǔ)。
城市軌道交通的客流高峰持續(xù)時間可定義為從進入客流高峰到退出客流高峰之間的時間長度。而判定客流高峰的關(guān)鍵在于選擇合適的高峰閾值作為客流是否進入高峰狀態(tài)的依據(jù)。從乘客舒適性的角度而言,應(yīng)基于列車時刻表計算線路的通行能力,通過乘客交易信息估計線路上最大斷面客流和最大的站臺乘客密度,當(dāng)服務(wù)質(zhì)量低于一定水平時,則視臨界狀態(tài)時的客流為高峰閾值。在單位時間進站客流量累積頻率分布曲線上,15%~85%分位區(qū)域內(nèi)客流量變化比較平穩(wěn),超過上85%分位時客流量增長明顯。借鑒新建公路以自由流車速的上85%分位速度作為劃分一般狀態(tài)和超速行駛的分界值[1],本文以單位時間客流量的上85%分位點作為臨界點。具體的判定方法是:對一段時間內(nèi)單位時間線路進站客流量的統(tǒng)計結(jié)果由低到高進行排序(即累積頻率分布曲線),選取上85%分位點的線路進站客流量作為高峰閾值;為避免由于短時客流波動而導(dǎo)致錯誤的判斷,只有在連續(xù)5個單位時間段的線路進站客流量大于高峰閾值時,確認客流進入了高峰狀態(tài);在進入客流高峰后,若在連續(xù)5個單位時間段內(nèi)有2個單位時間段的線路進站客流量小于高峰閾值時,確認客流退出高峰狀態(tài)。
1.2 影響因素分析
在以往的研究中,研究對象一般是道路交通事件的持續(xù)時間,尤其是關(guān)于道路上車輛的交通事故的持續(xù)時間,鮮有對客流事件持續(xù)時間的研究。在道路交通中使用的事件持續(xù)時間預(yù)測模型顯然是不適用于城市軌道交通客流高峰事件的。因此,需要因事制宜地構(gòu)建客流高峰持續(xù)時間模型。本文所選擇的回歸分析方法的核心在于分析事件持續(xù)時間和不同影響因素的關(guān)系,其首要的步驟是對城市軌道交通客流高峰事件的影響因素進行分析和選擇。與城市軌道交通客流高峰事件相關(guān)且獲取比較容易的數(shù)據(jù)主要有客流數(shù)據(jù)(包括交易的時間、地點、編號等交易記錄)、事故記錄、施工記錄、天氣情況、舉辦大型活動等,根據(jù)這些數(shù)據(jù)可獲得的主要影響因素如下:
(1) 事件開始時間:城市軌道交通客流高峰事件的開始時間在一定程度上反映乘客出行的模式,如出行目的、客流組成類型、出行方式選擇等特征。具體對客流高峰事件開始時間所考慮的候選變量有事件在當(dāng)天的時間段、事件在當(dāng)周的星期幾、事件發(fā)生的季節(jié)等。城市軌道交通客流在一天內(nèi)的出行可以分為3個時間段,分別為早高峰(6:30—09:00)、晚高峰(16:30—20:00)、其它時間段。一個星期的日期可簡單地分為工作日和周末,如果對預(yù)測的精度要求較高且數(shù)據(jù)量足夠,也可用8個變量表示一周的7天和特殊節(jié)假日。季節(jié)則按照習(xí)慣分為春、夏、秋、冬4個變量。
(2) 客流量:隨著我國城市軌道交通的發(fā)展,城市軌道交通客流量及其在公共交通出行方式中所占的比例迅速增加,車站內(nèi)的客流密度逐漸加大,從而延長了客流高峰的持續(xù)時間??土髁康脑鲩L具有時間趨勢性,同時也具有一定的波動性,為減弱客流量的波動所產(chǎn)生的影響,可選擇觀測日前一周的平均線路日客流量作為變量。
(3) 線路站點布局:城市軌道交通線路站點數(shù)量、途經(jīng)的城市區(qū)域類型,決定了乘客對于線路上乘降地點和乘降時間的選擇。此外,線路的線網(wǎng)布局和列車交路類型也會影響乘客在線路上的分布。
(4) 天氣條件:選擇天氣條件作為城市軌道交通高峰客流事件的一個影響因素,是因為城市的天氣變化會改變?nèi)藗兊某鲂辛?xí)慣,尤其是遇到雨雪天氣時,人們往往不愿意外出,而必須出行的乘客通常偏向于選擇最易獲得的方式出行。天氣條件包括雨、雪、霧霾、大風(fēng)等變量。
(5) 車站運行環(huán)境:車站內(nèi)的運行環(huán)境發(fā)生變化時,乘客對出行方式的選擇也將隨之改變,例如車站設(shè)備發(fā)生故障、線路施工建設(shè)、發(fā)生火災(zāi)事故等情況下,乘客對城市軌道交通服務(wù)質(zhì)量的滿意度會降低,部分乘客會優(yōu)先選擇其它的交通方式出行。
(6) 車站周邊環(huán)境:車站周邊環(huán)境對乘客出行心理的影響會對城市軌道交通客流造成或增或減的變化,具體的變量包括車站周邊通道施工、車站周邊地面公交運行變化、車站附近舉辦大型活動等。
對客流高峰持續(xù)時間和影響因素的數(shù)據(jù)表進行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化數(shù)據(jù)表T*和X*。標(biāo)準(zhǔn)化的方法如下:
(1)
式中:
根據(jù)多元線性回歸模型,客流高峰持續(xù)時間ti與影響因素之間的關(guān)系可表示為:
ti=b0+b1xi1+b2xi2+…+bdxid+εi
(2)
式中:
b0,b1,b2,…,bd——待定系數(shù);
εi——干擾項,表示隨機誤差以及其它被省略的影響因素對持續(xù)時間干擾的總體效果,一般設(shè)E(εi)=0。
令β=(b0,b1,b2,…,bd)T,ε=(ε1,ε2,…,εn)T,在影響因素標(biāo)準(zhǔn)化數(shù)據(jù)表添加一個值為1的常數(shù)列,即:
由式(2)可得到客流高峰持續(xù)時間和影響因素的標(biāo)準(zhǔn)化數(shù)據(jù)表之間回歸關(guān)系的矩陣表達形式:
(3)
(4)
3.1 數(shù)據(jù)采集及預(yù)處理
回歸分析模型所需要的數(shù)據(jù)主要分為兩部分,分別對應(yīng)模型的因變量和自變量。其中,因變量是指客流高峰事件持續(xù)時間,通過對城市軌道交通原始的交易數(shù)據(jù)進行整理獲得目標(biāo)數(shù)據(jù)集;自變量則需要選擇合適影響因素作為模型變量,并設(shè)定相關(guān)的量化準(zhǔn)則。
本文選取2013年3月11日至2013年5 月26日共計11周的南京地鐵1號線乘客日常交易數(shù)據(jù)作為算例基礎(chǔ)數(shù)據(jù)。南京地鐵1號線于2005年4月10日正式開始運營,2號線于2010年5月28日正式運營,經(jīng)過數(shù)年的發(fā)展,南京地鐵的客流模式已逐漸趨于穩(wěn)定,其客流數(shù)據(jù)能較好地反映客流的本質(zhì)規(guī)律。本文以基礎(chǔ)數(shù)據(jù)中第一周的上85%分位點的線路進站客流量作為高峰閾值,通過數(shù)據(jù)預(yù)處理流程得到客流高峰持續(xù)時間的數(shù)據(jù)表。在數(shù)據(jù)量充足的條件下,確定高峰閾值的數(shù)據(jù)時間段宜盡量的長,例如1年或者2年,以免短期數(shù)據(jù)無法全面反映信息特征。
設(shè)定單位時間Δt=1 min,按Δt對時間進行分段,統(tǒng)計原始交易數(shù)據(jù)在各單位時間段內(nèi)的1號線全線進站客流量,對一段時間內(nèi)單位時間線路進站客流量的統(tǒng)計結(jié)果由低到高進行排序,選取上85%分位點的線路進站客流量作為高峰閾值,然后按城市軌道交通客流高峰持續(xù)時間的判定方法確定客流高峰事件以及客流高峰持續(xù)時間t。為提高模型預(yù)測結(jié)果的可靠性,還需要對目標(biāo)數(shù)據(jù)進行清洗。采用孤立點分析去除目標(biāo)數(shù)據(jù)的噪聲,具體過程是:在一個以客流高峰事件的持續(xù)時間為中心、半徑為10 min的時間段內(nèi)搜索其它客流高峰事件,若搜索到的客流高峰事件數(shù)量不大于樣本總量的3%,則將該客流高峰事件視為孤立點,并從目標(biāo)數(shù)據(jù)中剔除。
此算例的目的是演示城市軌道交通客流高峰持續(xù)時間預(yù)測模型的操作方法,并驗證模型的可行性。為了數(shù)據(jù)取樣和建模過程的方便性,算例所使用的數(shù)據(jù)樣本量相對較小。由于所選擇樣本數(shù)據(jù)的時間跨度不長,客流增長的變化趨勢不明顯,以及極端天氣、事故、施工等特殊情況出現(xiàn)的頻率較少等原因,算例在模型影響因素的選擇上作了一些精簡,排除掉部分偶發(fā)因素和長期因素。算例的時間影響因素變量包括日期、開始時刻、高峰時段、是否為工作日,天氣因素主要考慮是否下雨,車站周邊環(huán)境變化因素產(chǎn)生較大影響的變量是奧體中心是否舉辦大型活動。具體變量設(shè)置說明如表1所示。
依照表1中影響因素變量的設(shè)置要求以及交易記錄數(shù)據(jù)庫中的信息,建立影響因素的數(shù)據(jù)表。聯(lián)合客流高峰持續(xù)時間的數(shù)據(jù)表和影響因素的數(shù)據(jù)表,將數(shù)據(jù)表拆分成兩部分,其中前10周數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),第11周數(shù)據(jù)作為測試數(shù)據(jù)。
3.2 算例分析
通過觀察城市軌道交通客流高峰持續(xù)時間與上述變量值之間的關(guān)系,發(fā)現(xiàn)早高峰和非早高峰時段的客流高峰持續(xù)時間明顯不同。工作日的客流變化曲線呈明顯且相對穩(wěn)定的早晚高峰現(xiàn)象,而非工作日的客流變化曲線高峰現(xiàn)象不太顯著。此外,算例數(shù)據(jù)中所有的早高峰均發(fā)生在工作日??紤]到不同出行時間段下高峰持續(xù)時間與其它變量關(guān)系的差異,為提高預(yù)測的準(zhǔn)確性,將數(shù)據(jù)分為早高峰(Model1)、工作日非早高峰(Model2)、非工作日高峰(Model3),分別建立回歸模型。
表1 模型變量設(shè)置
借助統(tǒng)計軟件導(dǎo)入訓(xùn)練數(shù)據(jù),通過回歸模型參數(shù)標(biāo)定方法得到三種不同客流模式下模型的回歸結(jié)果,包括方差分析表(見表2)和參數(shù)估計,最終得到城市軌道交通客流高峰持續(xù)時間預(yù)測模型的表達式為:
表2中模型的F統(tǒng)計檢驗結(jié)果顯示該預(yù)測模型的線性回歸關(guān)系是高度顯著的,說明使用回歸分析方法進行城市軌道交通客流高峰持續(xù)時間預(yù)測具有一定的可靠性。
表2 不同客流模式的方差分析表
為進一步說明模型的預(yù)測效果,使用測試數(shù)據(jù)對模型的準(zhǔn)確性進行評估(見表3)。對比客流高峰持續(xù)時間的實際值和預(yù)測值可知,工作日的預(yù)測殘差均小于5 min,特別是早高峰的預(yù)測殘差都在2 min以內(nèi)。這是一個可以接受的預(yù)測結(jié)果,可為城市軌道交通列車運行圖的調(diào)整提供較好的輔助決策。表3中周末的預(yù)測誤差較大,預(yù)測值與實際值的偏差接近25 min,通過分析周末的客流變化情況,發(fā)現(xiàn)其主要原因是周末的客流量日變化趨勢相對比較平穩(wěn),且單位時間客流量一般在高峰閾值附近波動,導(dǎo)致客流高峰持續(xù)時間的隨機性較強。因此,非工作日的高峰持續(xù)時間對于城市軌道交通行車組織的指導(dǎo)意義不大。
表3 模型準(zhǔn)確性評估表
科學(xué)地預(yù)測客流高峰持續(xù)時間,有助于實現(xiàn)城市軌道交通高峰事件的科學(xué)管理,是提升城市軌道交通服務(wù)質(zhì)量的有效措施。本文對城市軌道交通客流高峰事件進行了定義,總結(jié)了持續(xù)時間的研究方法,討論了城市軌道交通客流高峰持續(xù)時間的影響因素,并使用回歸分析的方法驗證了研究的可行性。本文只是對城市軌道交通客流高峰持續(xù)時間進行了初步探討,以起到拋磚引玉的效果,為了提高城市軌道交通運營管理水平,實現(xiàn)優(yōu)化運營企業(yè)資源配置和改善社會形象兩者之間的最佳平衡,還需要更多深入的研究。
[1] Transportation Research Board.Highway capacity manual [M].Washington D C:National Research Council,2010.
[2] GOLOB T F,RECKER W W,LEONARD J D.An analysis of the severity and incident Duration of truck-involved freeway accidents [J].Accident Analysis & Prevention,1987,19(5):375.
[3] GOOLSBY M E.Influence of incidents on freeway quality of service [M].Washington D C:Highway Research Record,1971.
[4] GIULIANO G.Incident characteristics,frequency,and duration on a high volume urban freeway [J].Transportation Research Part A General,1989,23(89):387.
[5] GARIB A,RADWAN A E,AL-DEEK H.Estimating magnitude and duration of incident delays [J].Journal of Transportation Engineering,1997,123:459.
[6] KHATTAK A J,,SCHOFER J L,WANG M.A simple time sequential procedure for predicting freeway incident duration [J].Journal of Intellient Transportation Systems,1995,2(2):113.
[7] OZBAY K,NOYAN N.Estimation of incident clearance times using Bayesian Network approach [J].Accident Analysis and Prevention,2006,38(3):542.
[8] 姬楊蓓蓓,張小寧,孫立軍.基于貝葉斯決策樹的交通事件持續(xù)時間預(yù)測[J].同濟大學(xué)學(xué)報(自然科學(xué)版),2008,36(3):319.
[9] CHOI H K.Predicting freeway traffic incident duration an expert system context using fuzzy logic PHD dissertation [D].Los Angeles:University of Southern California,1996.
[10] JOVANIS P P,CHANG H L.Disaggregate model of highway accident occurrence using survival theory [J].Accident Analysis & Prevention,1989,21(5):445.
[11] 康國祥,方守恩.基于風(fēng)險分析的交通事件持續(xù)時間預(yù)測[J].同濟大學(xué)學(xué)報(自然科學(xué)版),2012,40(2):241.
Prediction of Passenger Flow Duration in Urban Rail Transit Peak Hours
SHI Zhuangbin, ZHANG Ning, SHAO Xingjie
The current development situation and operation management of rail transit in China are firstly analyzed, the existing research methods on the passenger flow duration in peak hours are summarized.By means of comparison, the regression analysis is selected as the basic prediction model. Then the concept of rail transit passenger flow in peak hours is defined, the influential factors of which is investigated, the theoretical basis and methods for solving the regression model are proposed.Finally, by using the data of Nanjing Metro Line 1 to establish a prediction model, the feasibility of this research method is verified.
urban rail transit; passenger flow duration in peak hours; regression analysis
*交通運輸部建設(shè)科技項目(2015318J33080)
U 293.13
10.16037/j.1007-869x.2016.07.008
2014-08-16)