向紅艷, 袁發(fā)濤
(重慶交通大學(xué)交通運(yùn)輸學(xué)院,重慶 400074)
軌道車站是軌道交通的關(guān)鍵節(jié)點(diǎn),是城市居民出行乘降、換乘的主要場所。車站客流識(shí)別是研究站點(diǎn)客流集散規(guī)律,挖掘乘客出行行為特征的重要方法。對軌道車站客流進(jìn)行識(shí)別,探討不同類型客流模式間的差異,有助于充分發(fā)揮軌道交通在城市公共交通中的骨干作用,為軌道交通運(yùn)營策略制定及評(píng)價(jià)提供理論支撐。
隨著大數(shù)據(jù)技術(shù)的發(fā)展和完善,充分利用多源數(shù)據(jù)成為精細(xì)化研究交通問題的新趨勢[1-4]。中外關(guān)于軌道車站的研究主要關(guān)注的是從乘客出行行為和站點(diǎn)自身屬性角度對乘客和站點(diǎn)進(jìn)行分類,而鮮有車站客流識(shí)別研究。在軌道乘客分類方面, Yin等[5]采用模糊C均值聚類進(jìn)行了基于行為特征的乘客行為模式劃分。鄒慶茹等[6]強(qiáng)調(diào)研究乘客分類的重要性,利用軌道自動(dòng)售檢票(automatic fare collection,AFC)數(shù)據(jù)能夠較好反映乘客個(gè)體特征和出行規(guī)律的特點(diǎn),將出行乘客分為5類并分析其出行特征。Kieu等[7]構(gòu)建了乘客出發(fā)時(shí)間和出行起訖點(diǎn)(origin-destination, OD)指標(biāo),利用基于密度的DBSCAN(density based spatial clustering of application with noise)算法將乘客分為出發(fā)時(shí)間穩(wěn)定型、出行起訖點(diǎn)穩(wěn)定型、通勤乘客及不規(guī)律乘客4類。在軌道車站分類方面,冷彪等[8]從地鐵客流數(shù)據(jù)中提取了乘客出行模式和地鐵站客流模式,建立了基于隱含狄利克雷分配(latent Dirichlet allocation,LDA)主題模型的區(qū)域功能聚類模型,得到不同客流峰段內(nèi)的區(qū)域功能和相互客流關(guān)系。李向楠[9]選取軌道交通站點(diǎn)周邊環(huán)境和站點(diǎn)的自身特點(diǎn)等相關(guān)因素,綜合因子分析和聚類算法,對站點(diǎn)相似度做定量計(jì)算,得到站點(diǎn)分類結(jié)果。關(guān)于車站客流識(shí)別方面,僅從客流密度角度進(jìn)行了交通瓶頸分析。孫立山等[10]提取并標(biāo)定乘客微觀行為參數(shù),引入動(dòng)態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)算法,實(shí)現(xiàn)客流激波現(xiàn)象的識(shí)別與量化分析。盧佳等[11]通過計(jì)算高峰時(shí)段客流量閾值并劃分預(yù)警等級(jí),提出一種基于自動(dòng)售檢票數(shù)據(jù)的大客流識(shí)別方法。而客流識(shí)別有助于提高車站運(yùn)行效率,合理配置運(yùn)營資源,對已有車站的管理和未來車站的規(guī)劃都有著重要意義。為此,結(jié)合海量AFC數(shù)據(jù),建立軌道車站客流識(shí)別指標(biāo),運(yùn)用無監(jiān)督聚類算法對不同類型車站客流進(jìn)行精準(zhǔn)劃分,實(shí)現(xiàn)軌道車站客流規(guī)律挖掘、客流模式識(shí)別等精細(xì)化研究。
截至2020年4月,重慶軌道3號(hào)線總運(yùn)營里程67.09 km,共有45座軌道站點(diǎn)。采集重慶軌道3號(hào)線連續(xù)1個(gè)月的自動(dòng)售檢票數(shù)據(jù),超過108條出行記錄,每條出行記錄包含進(jìn)出站時(shí)間、站點(diǎn)編號(hào)、刷卡狀態(tài)等出行屬性,具體信息如表1所示。
表1 重慶軌道3號(hào)線刷卡數(shù)據(jù)
重慶軌道AFC數(shù)據(jù)以單次刷卡為一條出行記錄,該數(shù)據(jù)格式有利于分別統(tǒng)計(jì)各軌道站點(diǎn)進(jìn)、出站客流量。為研究軌道車站客流,首先提取1個(gè)月乘客刷卡數(shù)據(jù),利用Python 編程從軌道全網(wǎng)數(shù)據(jù)中篩選軌道3號(hào)線各站點(diǎn)進(jìn)出站出行記錄。然后以刷卡日期提取每日06:00—24:00共18小時(shí)的出行記錄,以刷卡時(shí)間按60 min時(shí)間粒度提取軌道車站進(jìn)出站客流量。最后結(jié)合乘客出行時(shí)間維度和空間維度對數(shù)據(jù)進(jìn)行再處理得到各站點(diǎn)客流指標(biāo)數(shù)據(jù)。
數(shù)據(jù)標(biāo)準(zhǔn)化處理能夠平衡數(shù)值水平差異,消除直接用原始指標(biāo)進(jìn)行分析帶來的量綱影響,保證結(jié)果可靠性,解決指標(biāo)間的可比性。還可有效加快梯度下降求解速度,提高計(jì)算精度。采用[0,1]標(biāo)準(zhǔn)化的方法,將數(shù)據(jù)壓縮到0~1。其計(jì)算公式為
(1)
式(1)中:x′ 為指標(biāo)處理后結(jié)果;x為原始指標(biāo)數(shù)據(jù);max(x)為該類指標(biāo)中變量的最大值;min(x)為該類指標(biāo)中變量的最小值。
對重慶軌道3號(hào)線AFC數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,提取各軌道車站進(jìn)站客流和出站客流的客流量、日高峰時(shí)段及車站潮汐比等指標(biāo)。軌道車站客流呈現(xiàn)如下3種現(xiàn)象。
1.4.1 軌道車站客流波動(dòng)性
部分軌道車站連續(xù)1個(gè)月客流量變化規(guī)律如圖1所示。不同站點(diǎn)客流量呈量級(jí)差異,且波動(dòng)趨勢略有不同,但整體呈現(xiàn)出季節(jié)波動(dòng)性,工作日客流量穩(wěn)定,周末客流量略有下降,節(jié)假日客流量波動(dòng)明顯。
1.4.2 軌道車站客流高峰時(shí)段穩(wěn)定性
圖1 軌道站點(diǎn)客流量Fig.1 Passenger flow at rail stations
圖2 軌道站點(diǎn)高峰時(shí)段 Fig.2 Rail station peak hours
軌道站點(diǎn)全日進(jìn)出站客流量如圖2所示,不同軌道站點(diǎn)進(jìn)出站客流高峰時(shí)段主要集中在早高峰08:00—9:00以及晚高峰18:00—19:00,高峰時(shí)段分布較穩(wěn)定。
1.4.3 軌道車站潮汐性
各站點(diǎn)的進(jìn)站客流與出站客流呈現(xiàn)出不同程度的潮汐性(圖3)。部分站點(diǎn)在早高峰進(jìn)站客流較大,出站客流較??;對應(yīng)地在晚高峰進(jìn)站客流較小,出站客流較大??傮w上不同軌道站點(diǎn)潮汐比呈現(xiàn)量級(jí)差異,且部分站點(diǎn)早晚高峰潮汐比差異較大。
圖3 軌道站點(diǎn)潮汐比 Fig.3 Rail station tidal ratio
客流指標(biāo)構(gòu)建旨在能夠反映不同軌道車站客流模式,區(qū)分站點(diǎn)客流時(shí)空特性。通過提取AFC記錄包含的軌道站點(diǎn)客流直接信息。主要從站點(diǎn)客流量、高峰時(shí)段、潮汐現(xiàn)象3個(gè)方面闡述具體指標(biāo)。
站點(diǎn)客流量是通過站點(diǎn)的乘客數(shù),是站點(diǎn)價(jià)值和人氣的體現(xiàn)。具體包括:①工作日客流量,反映通勤人員上班、上學(xué)形成是通勤客流數(shù)量;②周末客流量,反映以休閑娛樂為主的乘客客流量;③節(jié)假日客流量,反映由于外出旅游形成的客流量。
高峰時(shí)段即交通高峰,是一日中出現(xiàn)大交通量的一段時(shí)間。具體包括:①高峰小時(shí),即一日中出現(xiàn)最大交通量的一個(gè)小時(shí);②高峰小時(shí)客流量,即高峰小時(shí)內(nèi)產(chǎn)生的客流量。③客流量高峰小時(shí)系數(shù),是指車站高峰小時(shí)內(nèi)進(jìn)站量(或出站量)占全日進(jìn)站量(或出站量)的比例。
潮汐交通現(xiàn)象指的是早高峰進(jìn)城方向客流量大,而晚高峰出城方向客流量大的現(xiàn)象。具體指標(biāo)包括:潮汐比,刻畫由于潮汐交通現(xiàn)象造成的軌道站點(diǎn)進(jìn)出站客流不均衡性,即進(jìn)站客流量與出站客流量的比值,分為早高峰潮汐比和晚高峰潮汐比。
聚類分析是一種無監(jiān)督學(xué)習(xí),根據(jù)相似度判定準(zhǔn)則將樣本自動(dòng)分為幾個(gè)不同群組。使得組內(nèi)樣本各維變量相似,組間樣本多維變量相異。聚類算法能夠?qū)?shù)據(jù)進(jìn)行科學(xué)合理的相似性度量,可有效挖掘數(shù)據(jù)內(nèi)部特征,以達(dá)到分析數(shù)據(jù)特征的目的。采用K-means聚類算法進(jìn)行車站客流識(shí)別。
McQueen首次提出了K均值聚類算法(K-means算法),迄今為止,很多聚類任務(wù)都選擇該經(jīng)典算法[12]。這種聚類技術(shù)計(jì)算速度快,可解釋性強(qiáng),對大數(shù)據(jù)集的處理效率較高。算法計(jì)算步驟如下。
步驟1對于給定包含m個(gè)元素的數(shù)據(jù)集,任意從該數(shù)據(jù)集中選取k個(gè)元素,作為初始聚類中心yi(i=1,2,…,k)。
步驟2依次計(jì)算每個(gè)元素到初始聚類中心的距離d(xj,yi),j=1,2,…,m;i=1,2,…,k;將各個(gè)元素xj按照歐氏距離最短原則劃分到相應(yīng)的聚類中心。
步驟4根據(jù)“歐氏距離”最短原則,重新進(jìn)行每個(gè)元素到各個(gè)聚類中心的分配。
步驟5判斷前后兩次形成的類是否相同,若滿足要求則迭代結(jié)束,若不滿足要求,則返回步驟2。
K-means算法可獲得指定聚類個(gè)數(shù)及其被指定屬于該聚類的數(shù)據(jù)點(diǎn),難點(diǎn)在于初始聚類數(shù)K值的確定, 為有效評(píng)價(jià)聚類效果,度量聚類性能,采用輪廓系數(shù)法確定聚類數(shù)目,樣本輪廓系數(shù)定義為
(2)
式(2)中:s為樣本輪廓系數(shù);a為樣本與同一簇類中的其他樣本點(diǎn)的平均距離;b為樣本與距離最近簇類中所有樣本點(diǎn)的平均距離。
通過采集重慶軌道3號(hào)線乘客刷卡數(shù)據(jù),提取軌道站點(diǎn)客流量指標(biāo),采用K-means算法對車站客流模式進(jìn)行聚類。利用輪廓系數(shù)法評(píng)價(jià)聚類性能,確定最佳初始聚類數(shù)K。
工作日、周末和節(jié)假日的軌道數(shù)據(jù)差異較大,工作日以通勤客流為主,客流相對穩(wěn)定,早、晚高峰客流較為密集;周末和節(jié)假日以休閑娛樂、外出旅游客流為主,客流較為分散多樣。采用不同時(shí)期客流數(shù)據(jù)進(jìn)行聚類,更全面分析軌道車站客流模式。為探究不同客流指標(biāo)對聚類結(jié)果的影響,選取客流量、高峰時(shí)段、潮汐比3個(gè)特征變量得到聚類結(jié)果如下。
4.1.1 基于客流量的聚類結(jié)果
以1個(gè)月的工作日、周末和節(jié)假日的全日平均進(jìn)出站客流量為特征變量,得到基于客流量數(shù)據(jù)指標(biāo)的聚類結(jié)果如圖4所示。其中,label 1、label 2、label 3分別表示聚類結(jié)果類別1、類別2、類別3。
圖4 基于客流量聚類結(jié)果Fig.4 Clustering results based on passenger flow
根據(jù)客流量聚類結(jié)果,第1類車站客流量區(qū)間跨度較小,為一般通勤站點(diǎn)。第2類車站客流聚類結(jié)果不穩(wěn)定,說明該類車站客流受周末、節(jié)假日影響大,結(jié)合實(shí)際站點(diǎn)情況分析,聚類結(jié)果變動(dòng)站點(diǎn)均為城市大型對外樞紐接駁軌道站點(diǎn),如重慶北站南廣場和四公里軌道站點(diǎn)。第3類車站客流量最大,聚類結(jié)果穩(wěn)定,屬于持續(xù)高客流模式,是集商圈、旅游景點(diǎn)為一體的復(fù)合型站點(diǎn)。
4.1.2 基于高峰時(shí)段的聚類結(jié)果
車站客流高峰時(shí)段是乘客出行時(shí)間集中性的體現(xiàn),能夠反映乘客出行目的。圖5為基于高峰時(shí)段數(shù)據(jù)指標(biāo)的聚類結(jié)果。工作日高峰時(shí)段集中在早、晚高峰,早高峰07:00—09:00,晚高峰17:00—19:00。圖5(a)中,第1類客流(label 1)為進(jìn)站早高峰、出站晚高峰,屬于居住區(qū)通勤站點(diǎn);第2類客流(label 2)為進(jìn)站晚高峰、出站早高峰,屬于工作區(qū)通勤站點(diǎn);第3類客流(label 3)進(jìn)出站高峰時(shí)段均在早高峰,屬于復(fù)合型站點(diǎn)。圖5(b)、圖5(c)中,周末、節(jié)假日客流高峰時(shí)段分散,進(jìn)站早高峰現(xiàn)象弱化明顯,14:00—16:00出現(xiàn)午后高峰,晚高峰時(shí)段后延,聚類結(jié)果數(shù)目增加。說明周末、節(jié)假日乘客出行以休閑娛樂、外出旅游為主,出行彈性較大,出行時(shí)段分散。線路兩端公交樞紐站場接駁站點(diǎn)、旅游景點(diǎn)和高校屬性站點(diǎn)是形成午后高峰的主要原因,使得下午出行需求增加。
4.1.3 基于潮汐比的聚類結(jié)果
潮汐比能夠反映車站客流職住關(guān)系,挖掘站點(diǎn)周圍環(huán)境。圖6為基于軌道站點(diǎn)潮汐比數(shù)據(jù)指標(biāo)的聚類結(jié)果。工作日第1類車站客流早、晚高峰潮汐現(xiàn)象較弱;第2類車站客流早高峰潮汐現(xiàn)象明顯,早高峰進(jìn)站客流量大,出站客流量較??;第3類車站客流晚高峰進(jìn)站客流量大,出站客流量小。周末、節(jié)假日將潮汐比數(shù)據(jù)聚為4類,分別為早高峰潮汐偏向型(label 1)、晚高峰潮汐偏向型(label 2)、早高峰潮汐主導(dǎo)型(label 3)、晚高峰潮汐主導(dǎo)型(label 4)。
圖6 基于潮汐比聚類結(jié)果Fig.6 Clustering results based on tidal ratio
4.1.4 綜合分類結(jié)果
利用單一客流指標(biāo)來判斷軌道車站客流模式不夠全面,不能完全反映實(shí)際情況。綜合客流量、高峰時(shí)段、潮汐比客流指標(biāo),多維度提取乘客出行特征,多角度挖掘車站客流模式。聚類結(jié)果如表2所示。
表2 一日客流指標(biāo)聚類結(jié)果
為驗(yàn)證聚類結(jié)果穩(wěn)定性,分析數(shù)據(jù)對分類結(jié)果的影響,分別選取1周數(shù)據(jù)和1個(gè)月數(shù)據(jù)為對象,對軌道車站客流進(jìn)行聚類,聚類結(jié)果如表3所示。結(jié)果顯示客流模式趨于一致站點(diǎn)比例高達(dá)89%,驗(yàn)證了聚類結(jié)果具有良好的穩(wěn)定性。1月數(shù)據(jù)能夠識(shí)別出對周末、節(jié)假日更為敏感的樞紐型、旅游景點(diǎn)型站點(diǎn)客流,更全面反映站點(diǎn)客流類別,說明海量數(shù)據(jù)使得分類結(jié)果更為準(zhǔn)確。
按照客流指標(biāo)聚類結(jié)果對車站客流模式進(jìn)行分析,挖掘站點(diǎn)在不同時(shí)段、不同區(qū)位的客流特征,得出如下結(jié)論。
(1)第1類車站客流特點(diǎn)是:早高峰進(jìn)站客流稀少,出站客流密集,相反地,晚高峰進(jìn)站客流大,出站客流小,全日客流總量較小,客流潮汐現(xiàn)象特別明顯。類中站點(diǎn)地區(qū)工業(yè)園布局較多,工作崗位密集,屬于城郊新興工業(yè)園區(qū)。
(2)第2類車站客流特點(diǎn)是:早高峰以進(jìn)站客流為主,晚高峰以出站客流為主,早、晚高峰潮汐比差異大且與類別1呈相反態(tài)勢。類中站點(diǎn)處于線路終端,旅客乘降量較大,站點(diǎn)周圍以大型居住區(qū)為主,為城郊住宅區(qū)。
(3)第3類車站客流特點(diǎn)是:工作日客流量穩(wěn)定,周末略有上升,節(jié)假日客流量激增;全日客流量較大,客流無明顯潮汐現(xiàn)象,各時(shí)段客流較平均。類中站點(diǎn)公交接駁線路多,交通用地比例大,站點(diǎn)客流對周末、節(jié)假日敏感,屬于城市對外交通樞紐區(qū)。
(4)第4類車站客流特點(diǎn)是:早、晚高峰進(jìn)出站客流量大,其余時(shí)段呈客流平峰,無客流低谷時(shí)段。類中站點(diǎn)靠近城市商務(wù)核心區(qū),旅客乘降量大,步行接駁環(huán)境優(yōu)越,周圍建筑密度高,屬于城市中心型站點(diǎn)。其中,觀音橋?yàn)槌掷m(xù)高客流站點(diǎn);其余為商圈及商圈輻射站點(diǎn)。
(5)第5類車站客流特點(diǎn)是:進(jìn)站客流量高峰時(shí)段在晚高峰,出站客流量高峰時(shí)段在早高峰,具有一定潮汐現(xiàn)象。類中站點(diǎn)早上出站客流較大,晚上則以進(jìn)站客流為主,屬于一般工作區(qū)通勤站點(diǎn)。
(6)第6類車站客流特點(diǎn)是:全日客流量適中,早高峰進(jìn)站客流量大,晚高峰出站客流量大,潮汐現(xiàn)象明顯,屬于一般居住區(qū)通勤站點(diǎn)。
(7)第7類車站客流特點(diǎn)是:進(jìn)出站客流高峰均在早高峰期間,無明顯潮汐現(xiàn)象。類中站點(diǎn)旅客乘降量較大,各時(shí)段進(jìn)出站客流量相當(dāng),屬于復(fù)合型通勤站點(diǎn)。
AFC數(shù)據(jù)是城市交通大數(shù)據(jù)的重要組成部分,深入挖掘其潛在價(jià)值信息對運(yùn)營管理具有重要意義。通過提取AFC數(shù)據(jù)包含的軌道站點(diǎn)客流直接信息,構(gòu)建客觀的客流分類指標(biāo),并結(jié)合K-means算法對軌道車站客流模式進(jìn)行識(shí)別,以重慶軌道3號(hào)線連續(xù)1個(gè)月的AFC數(shù)據(jù)進(jìn)行實(shí)證分析,探討了工作日、周末、節(jié)假日時(shí)期不同客流指標(biāo)對聚類結(jié)果的影響,采用多變量客流指標(biāo)將站點(diǎn)客流模式分為7類。但僅從站點(diǎn)客流數(shù)據(jù)角度分析客流模式,而未考慮站點(diǎn)周圍建筑環(huán)境的影響,后續(xù)將多源數(shù)據(jù)和客流數(shù)據(jù)有效結(jié)合,從更多維度、更長時(shí)間跨度對客流模式進(jìn)一步深度挖掘,以促進(jìn)軌道站點(diǎn)客流規(guī)律研究更加精細(xì)化。