• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于刷卡數(shù)據(jù)和高斯混合聚類(lèi)的地鐵車(chē)站分類(lèi)

      2017-06-21 15:05:43岳真宏陳峰王子甲黃建玲汪波
      都市快軌交通 2017年2期
      關(guān)鍵詞:工作日刷卡客流量

      岳真宏,陳峰,2,王子甲,2,黃建玲,汪波

      (1.北京交通大學(xué)土木建筑工程學(xué)院,北京100044;2.北京市軌道交通線路安全與防災(zāi)工程技術(shù)研究中心,北京100044;3.北京市交通信息中心,北京100161)

      基于刷卡數(shù)據(jù)和高斯混合聚類(lèi)的地鐵車(chē)站分類(lèi)

      岳真宏1,陳峰1,2,王子甲1,2,黃建玲3,汪波3

      (1.北京交通大學(xué)土木建筑工程學(xué)院,北京100044;2.北京市軌道交通線路安全與防災(zāi)工程技術(shù)研究中心,北京100044;3.北京市交通信息中心,北京100161)

      合理的城市軌道交通車(chē)站分類(lèi)對(duì)車(chē)站的規(guī)劃設(shè)計(jì)及客流預(yù)測(cè)有重要作用。基于刷卡數(shù)據(jù)提取出行時(shí)間、頻次、車(chē)票類(lèi)型等反映車(chē)站客流特性的若干變量,運(yùn)用主成分分析法(PCA)和高斯混合模型(GMM)進(jìn)行車(chē)站聚類(lèi)。該聚類(lèi)方法不僅可以識(shí)別車(chē)站類(lèi)別,同時(shí)可以根據(jù)后驗(yàn)概率確定混合類(lèi)型的車(chē)站。以北京地鐵為例,將全網(wǎng)233個(gè)車(chē)站分為4類(lèi),利用地理信息系統(tǒng)(GIS)工具可視化分類(lèi)結(jié)果,并疊加地理信息描述各類(lèi)車(chē)站的特征,直觀地展示了部分混合性質(zhì)的車(chē)站。與K-均值聚類(lèi)結(jié)果比較顯示,GMM方法可以更好地解釋多種特性混合的車(chē)站類(lèi)型。

      地鐵;車(chē)站分類(lèi);刷卡數(shù)據(jù);高斯混合模型;地理信息系統(tǒng)

      城市軌道交通車(chē)站的分類(lèi)對(duì)車(chē)站個(gè)性化設(shè)計(jì)有重要意義。目前,國(guó)內(nèi)對(duì)于站點(diǎn)分類(lèi)的研究主要集中在以節(jié)點(diǎn)導(dǎo)向的分類(lèi)和以場(chǎng)所導(dǎo)向的分類(lèi)[1]。大多數(shù)分類(lèi)僅僅基于定性分析[24],而定量分析也有很大的局限性[56]。首先采用的數(shù)據(jù)量有限,不能全面反映車(chē)站的特性;其次分類(lèi)結(jié)果往往是單純的幾類(lèi)車(chē)站,不能反映車(chē)站可能同時(shí)屬于多種類(lèi)型的實(shí)際。這種問(wèn)題在基于用地性質(zhì)或客流特性的分類(lèi)上表現(xiàn)更為突出。如果車(chē)站緊鄰?fù)乳_(kāi)放強(qiáng)度的居住用地或商業(yè)用地,非此即彼的分類(lèi)可能掩蓋一些重要信息,不能很好地指導(dǎo)站點(diǎn)的個(gè)性化規(guī)劃設(shè)計(jì)。

      既有研究表明,可以從交通智能卡數(shù)據(jù)中挖掘乘客出行時(shí)空分布、頻次等關(guān)鍵信息。這些信息可以為車(chē)站分類(lèi)提供豐富的數(shù)據(jù)支撐。本文針對(duì)目前車(chē)站分類(lèi)存在的問(wèn)題,基于刷卡數(shù)據(jù),引入主成分分析法和GMM聚類(lèi)方法,建立了基于車(chē)站客流特性的具有一定柔性的車(chē)站分類(lèi)方法。該方法不僅能從大量刷卡數(shù)據(jù)中提取最有效的信息,同時(shí)能給出車(chē)站從屬于某種特定類(lèi)別的概率,以判斷車(chē)站是否為混合類(lèi)型及其回合程度。本文采用該方法對(duì)北京地鐵網(wǎng)的所有車(chē)站進(jìn)行了分類(lèi)并利用GIS工具可視化了分類(lèi)結(jié)果,取得了較好的效果。這種分類(lèi)可以為軌道交通規(guī)劃、設(shè)計(jì)者基于客流特性和車(chē)站承擔(dān)的功能對(duì)站內(nèi)及站外導(dǎo)向、便民服務(wù)等設(shè)施的配置提供數(shù)據(jù)支持。

      1 基于卡數(shù)據(jù)的客流特征指標(biāo)選取

      城市軌道交通車(chē)站是乘客乘降的場(chǎng)所,是城市交通網(wǎng)絡(luò)的重要節(jié)點(diǎn)和集散點(diǎn)。對(duì)車(chē)站進(jìn)行聚類(lèi)分析,首先要從刷卡數(shù)據(jù)中提取出反映車(chē)站客流特性的具有代表性的相關(guān)因素作為初始變量。

      1.1 刷卡數(shù)據(jù)描述

      智能卡數(shù)據(jù)一般包含了卡號(hào)、上車(chē)站點(diǎn)、上車(chē)時(shí)間、下車(chē)站點(diǎn)、下車(chē)時(shí)間等信息,這些信息中包含了乘客出行的時(shí)空特性和卡屬性。在車(chē)站層次對(duì)客流的時(shí)空特性進(jìn)行分析,獲得了早晚高峰客流分布、通勤客流分布、工作日和周末客流差異等特性,對(duì)卡屬性進(jìn)行分析得到一票通的比例,為初始變量的選取提供支撐。

      1.2 初始變量的提取與描述

      綜合考慮通勤客流、早晚高峰客流特性、工作日與周末客流差異、一票通的比例等因素的影響,選取以下13個(gè)因素作為聚類(lèi)分析的初始變量。各個(gè)變量的編號(hào)及主要反映的車(chē)站客流信息如下:

      1)工作日早高峰進(jìn)站客流量/工作日全天進(jìn)站客流量(F1)、工作日晚高峰進(jìn)站客流量/工作日全天進(jìn)站客流量(F2)、工作日早高峰出站客流量/工作日全天出站客流量(F3)、工作日晚高峰出站客流量/工作日全天出站客流量(F4):這4個(gè)變量主要反映車(chē)站早晚高峰的客流特性,通常早高峰取6:30—9:30,晚高峰取17:00—20:00;

      2)工作日全天客流量/周末全天客流量(F5):反映車(chē)站工作日和周末的客流差異;

      3)工作日ABBA_A客流量/工作日全天客流量(F6)、工作日ABBA_B客流量/工作日全天客流量(F7):反映車(chē)站通勤客流的特性,其中,ABBA_A客流量表示滿足一天中從A站進(jìn)站B站出站再?gòu)腂站進(jìn)站A站出站的乘客在A站的客流量,ABBA_B客流量表示滿足一天中從A站進(jìn)站B站出站再?gòu)腂站進(jìn)站A站出站的乘客在B站的客流量;

      4)一票通比例(F8):表示使用臨時(shí)卡進(jìn)出站客流量與全天客流量的關(guān)系;

      5)工作日單次進(jìn)出站客流量/工作日全天客流量(F9):表示一天內(nèi)在某車(chē)站內(nèi)僅僅進(jìn)站一次或出站一次的客流量與全天客流量的關(guān)系;

      6)周末上午8:00—12:00出站客流量/周末全天出站客流量(F10)、周末下午3:00—7:00進(jìn)站客流量/周末全天進(jìn)站客流量(F11)、周末晚8:00—10:00進(jìn)站客流量/周末全天進(jìn)站客流量(F12)、周末晚8:00—10:00出站客流量/周末全天出站客流量(F13):反映了周末各個(gè)時(shí)段的進(jìn)站(或出站)客流量與周末全天進(jìn)站(或出站)客流量的關(guān)系。

      2 GMM方法

      將城市軌道交通車(chē)站分為K類(lèi),每一類(lèi)車(chē)站均由一個(gè)單高斯分布生成,然而具體車(chē)站屬于哪個(gè)單高斯分布未知,因此假設(shè)每一個(gè)車(chē)站分別由K個(gè)單高斯分布的混合模型表示,即軌道交通車(chē)站由高斯混合模型生成的概率密度函數(shù)為:

      式中,x是維度為d的向量;k為單高斯模型的數(shù)量;πk為第k個(gè)單高斯分布被選中的概率;μk,∑k為第k個(gè)單高斯分布的均值和方差;η(x|μk,∑k)為第k個(gè)單高斯分布的概率密度函數(shù),可表示為:

      利用高斯混合模型進(jìn)行聚類(lèi)的一般步驟如下:

      1)估計(jì)數(shù)據(jù)由每個(gè)單高斯分布生成的概率,對(duì)于每個(gè)數(shù)據(jù)xi來(lái)說(shuō),它由第k個(gè)單高斯分布生成的概率為:

      2)估計(jì)每個(gè)單高斯分布的參數(shù),通過(guò)極大似然估計(jì)求出對(duì)應(yīng)的參數(shù)值:

      3)重復(fù)迭代以上兩步,直到似然函數(shù)的值收斂為止。

      3 應(yīng)用案例

      本文以北京市軌道交通2014年10月13日至19日一周的刷卡數(shù)據(jù)為依據(jù)進(jìn)行客流分析,刷卡數(shù)據(jù)經(jīng)過(guò)篩選清理后,可用于車(chē)站客流特性分析。

      3.1 公共因子的提取

      選取了與車(chē)站客流特征相關(guān)的13個(gè)初始變量進(jìn)行車(chē)站聚類(lèi)分析,由于選取的初始變量較多,變量之間可能存在較大的相關(guān)性,因此需要對(duì)變量進(jìn)行降維處理以從多個(gè)變量中提取隱藏的公共因子。本次公共因子的提取選擇主成分分析法從眾多的初始變量中提取出主成分變量。

      在運(yùn)用主成分分析法降維之前,需要進(jìn)行KMO檢驗(yàn)和Bartlett檢驗(yàn)以考察結(jié)構(gòu)效度,結(jié)果如表1所示,KMO檢驗(yàn)系數(shù)0.867,概率值為0.000,結(jié)構(gòu)效度較高,可以進(jìn)行主成分分析。

      表1 KMO和Bartlett的檢驗(yàn)Tab.1 Tests of KMO and Bartlett

      基于主成分分析法提取隱藏的公共因子,從13個(gè)反映車(chē)站客流信息的初始變量中提取出初始特征值大于1的2個(gè)成分。這2個(gè)成分可以解釋原信息中81.443%的信息量,可以較好地提取出客流信息。因此,可以選用這2個(gè)成分作為主成分分析法的公共因子。

      3.2 GMM聚類(lèi)結(jié)果及分析

      以提取出的2個(gè)公共因子為聚類(lèi)變量,利用GMM模型進(jìn)行聚類(lèi),分別選取K值為3,4,5,6,將不同的聚類(lèi)結(jié)果進(jìn)行分析比較,得知當(dāng)K=4時(shí)聚類(lèi)結(jié)果更符合實(shí)際情況,因此將全網(wǎng)233個(gè)車(chē)站分為4類(lèi)進(jìn)行聚類(lèi)分析。刷卡數(shù)據(jù)中提取出來(lái)的信息不含車(chē)站的社會(huì)屬性等定性的描述,而刷卡數(shù)據(jù)反映的交通樞紐和旅游商業(yè)區(qū)性質(zhì)的車(chē)站具有相似的分類(lèi)指標(biāo),因此文中將交通樞紐和旅游商業(yè)區(qū)歸為一類(lèi),后續(xù)研究可以進(jìn)一步做定性區(qū)分。

      根據(jù)GMM模型將北京地鐵全網(wǎng)233個(gè)車(chē)站分為4類(lèi),則各類(lèi)質(zhì)心附近的典型車(chē)站初始變量指標(biāo)如表2所示。

      表2 質(zhì)心附近典型車(chē)站初始變量指標(biāo)Tab.2 Initial variable indicators of typical stations near the center ofmass

      基于GMM模型進(jìn)行站點(diǎn)分類(lèi)的依據(jù)為模型產(chǎn)生的后驗(yàn)概率,站點(diǎn)聚類(lèi)結(jié)果由GIS工具展示如圖1。

      對(duì)聚類(lèi)結(jié)果進(jìn)行分析,所得結(jié)論描述如下:

      1)第1類(lèi)站點(diǎn)為工作區(qū)車(chē)站,如金臺(tái)夕照站、國(guó)貿(mào)站、中關(guān)村站、永安里站、西二旗站、生物醫(yī)藥基地站。該類(lèi)車(chē)站多分布于市二環(huán)至四環(huán)之間,從地理位置上看,北城工作區(qū)站點(diǎn)數(shù)量明顯高于南城工作區(qū)站點(diǎn)數(shù)量,工作日出行客流多為“先出后進(jìn)”的通勤客流,周末全天客流分布較平緩,屬于特征顯著的工作區(qū)站點(diǎn);

      圖1 站點(diǎn)GMM聚類(lèi)GIS展示Fig.1 The stations visualization with GIS based on GMM clustering

      2)第2類(lèi)站點(diǎn)為居住區(qū)車(chē)站,如天通苑站、生命科學(xué)園站、蘋(píng)果園站等。該類(lèi)站點(diǎn)多為各條線路遠(yuǎn)離市中心的端頭站,乘客早上乘坐地鐵上班,晚上乘坐地鐵回家,居住區(qū)域車(chē)站周邊區(qū)域多體現(xiàn)“睡城”特性,八通線、昌平線所屬車(chē)站均為該類(lèi)型車(chē)站;

      3)第3類(lèi)站點(diǎn)為交通樞紐類(lèi)車(chē)站和旅游區(qū)車(chē)站,如北京西站、北京站、前門(mén)站、天安門(mén)東站、天安門(mén)西站。該類(lèi)車(chē)站有大量臨時(shí)客流,屬于外地乘客聚集地,北京站和北京西站是大型火車(chē)站,前門(mén)站、天安門(mén)東站、天安門(mén)西站屬于旅游景點(diǎn)類(lèi)車(chē)站;

      4)第4類(lèi)站點(diǎn)為機(jī)場(chǎng)T2、T3航站樓站。這兩個(gè)站點(diǎn)為一票通比例超高的對(duì)外交通樞紐站,工作日臨時(shí)客流量占工作日全天客流量的85%左右,較其他對(duì)外交通樞紐表現(xiàn)出更明顯的特性。

      3.3與K-均值聚類(lèi)的比較

      K-均值聚類(lèi)算法是通過(guò)迭代算法,逐次更新各類(lèi)的中心值,直至得到最好的聚類(lèi)結(jié)果。以提取出的兩個(gè)公共因子為聚類(lèi)變量,利用K-均值聚類(lèi)算法進(jìn)行聚類(lèi),得到的聚類(lèi)結(jié)果由GIS展示,如圖2所示。

      基于GMM模型產(chǎn)生的后驗(yàn)概率來(lái)識(shí)別混合型車(chē)站,部分混合型車(chē)站的后驗(yàn)概率及對(duì)應(yīng)的K-均值聚類(lèi)結(jié)果如表3所示。

      比較GMM聚類(lèi)結(jié)果和K-均值聚類(lèi)結(jié)果,兩者的車(chē)站分類(lèi)基本相同,但基于GMM的聚類(lèi)是依后驗(yàn)概率進(jìn)行車(chē)站聚類(lèi),對(duì)于混合程度較高的車(chē)站,單純的類(lèi)別劃分并不能準(zhǔn)確地表示該車(chē)站的特征,因此對(duì)于車(chē)站分類(lèi),GMM算法優(yōu)于K-均值算法。

      圖2 站點(diǎn)K-均值聚類(lèi)GIS展示Fig.2 The stations visualization with GISbased on K-means clustering

      表3 部分混合車(chē)站GMM聚類(lèi)與K-均值聚類(lèi)比較Tab.3 Partialm ixed stations’com parative analysis between GMM clustering and K- means clustering

      4 結(jié)論

      本文提出了一種基于刷卡數(shù)據(jù)和GMM模型的地鐵車(chē)站聚類(lèi)方法。其中,刷卡數(shù)據(jù)為地鐵站點(diǎn)分類(lèi)研究提供了一種全新高效的數(shù)據(jù)來(lái)源,考慮一票通比例、單次出行比例、早晚高峰特性與通勤客流特性、工作日與周末客流差異等因素后利用GMM模型進(jìn)行車(chē)站聚類(lèi),并依據(jù)模型產(chǎn)生的后驗(yàn)概率識(shí)別了混合類(lèi)型的車(chē)站。

      該聚類(lèi)與K-均值聚類(lèi)結(jié)果比較表明,GMM聚類(lèi)方法對(duì)混合類(lèi)型車(chē)站的識(shí)別有良好的效果,較傳統(tǒng)單一的車(chē)站分類(lèi)模式更具有現(xiàn)實(shí)意義,可為站點(diǎn)周邊土地的開(kāi)發(fā)利用與城市空間結(jié)構(gòu)的識(shí)別提供技術(shù)支持。

      [1]邵瀅宇,丁柏群.基于聚類(lèi)分析的地鐵站點(diǎn)分類(lèi):以哈爾濱地鐵1號(hào)線為例[J].森林工程,2015,31(3):106- 111.

      SHAO Yingyu,DING Baiqun.Metro stations classification based on clustering analysis:A case study of harbin metro line 1[J].Forest engineering,2015,31(3):106- 111.

      [2]王俊.地鐵車(chē)站綜合開(kāi)發(fā)及影響的初步探討[D].成都:西南交通大學(xué),2000.

      WANG Jun.Primarily study ofmetro stations’comprehensive development and influence[D].Chengdu:Southwest Jiaotong University,2000.

      [3]惠英.城市軌道交通站點(diǎn)地區(qū)規(guī)劃與建設(shè)研究[J].城市規(guī)劃匯刊,2002(2):30 33.

      HUIYing.Planning and construction of the areas round the rail transportation station[J].Urban planning forum,2002 (2):30- 33.

      [4]金磊,彭建,柳昆,等.城市地鐵車(chē)站分類(lèi)理論及方法研究[J].地下空間與工程學(xué)報(bào),2010,6(Z1):1339 1342.

      JIN Lei,PENG Jian,LIU Kun,et al.Sorting theory and investigation of urban metro station[J].Chinese journal of underground space and engineering,2010,6(Z1):1339 1342.

      [5]李向楠.城市軌道交通站點(diǎn)分類(lèi)的聚類(lèi)方法研究[J].鐵道標(biāo)準(zhǔn)設(shè)計(jì),2015,35(4):19- 23.

      LIXiangnan.Classifying urban rail transit stations using cluster analysis[J].Railway standard design,2015,35 (4):19- 23.

      [6]羅芳,柴蕾,邱星.基于交通換乘的城市軌道交通車(chē)站分類(lèi)研究[J].洛陽(yáng)理工學(xué)院學(xué)報(bào)(自然科學(xué)版),2015,25(3):45 48.

      LUO Fang,CHAI Lei,QIU Xing.Classification of urban rail transit station based on traffic transfer[J].Journal of Luoyang Institute of Science and Technology(natural science edition),2015,25(3):45- 48.

      (編輯:曹雪明)

      Classifications of Metro Stations by Clustering Smart Card Data Using the Gaussian Mixture Model

      YUE Zhenhong1,CHEN Feng1,2,WANG Zijia1,2,HUANG Jianling3,WANG Bo3
      (1.School of Civil Engineering,Beijing Jiaotong University,Beijing 100044; 2.Beijing Engineering and Technology Research Center of Rail Transit Line Safety and Disaster Prevention,Beijing 100044;3.Beijing Transportation Information Center,Beijing 100161)

      Reasonable classification of urban rail transit stations is of great significance to station planning,designing and ridership forecasting.This research focused on the characteristics of station ridership and proposed travel time,frequency,ticket type and other variables extracted from smart card data.Accordingly,Principal Component Analysis(PCA)and the Gaussian M ixture Model(GMM)were used in clustering and classifying stations.Themetro stations are classified into arbitrary types and m ixed types using the posterior probability generated by GMM,which revealed to what extent and by which arbitrary types a mixed station wasmixed.Beijing was selected as a case and 4 clusters were determined for the 233 stations on Beijingmetro network.The classification resultswere visualized by GISand all types of stationswere characterized by superposing geographic information,meanwhile,parts of m ixed stations were presented intuitively.At last,comparative analysis was conducted between GMM and K-means algorithm and the results showed thatGMM can explainmixed stationsw ith various characteristics preferably.

      metro;station classification;smart card data;Gaussian M ixture Model;geographic information system

      U231.4

      A

      1672- 6073(2017)02- 0048- 04

      10.3969/j.issn.1672 6073.2017.02.010

      2016- 05 03

      2017 01 09

      岳真宏,男,碩士研究生,主要從事城市軌道交通規(guī)劃與設(shè)計(jì),14121208@b jtu.edu.cn

      王子甲,男,博士,講師,主要從事城市軌道交通規(guī)劃與設(shè)計(jì),zjwang@b jtu.edu.cn

      中央高校基本科研業(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金資助(2016YJS102)

      猜你喜歡
      工作日刷卡客流量
      基于嵌入式系統(tǒng)的商場(chǎng)客流量統(tǒng)計(jì)算法
      刷卡
      基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測(cè)
      成長(zhǎng)日記
      刷臉就可以購(gòu)物
      奧秘(2014年8期)2014-08-30 06:32:04
      從客流量推算公交出行PA矩陣的方法
      新建旅游項(xiàng)目客流量分析方法初探
      對(duì)《資本論》中工作日問(wèn)題的哲學(xué)思考
      商(2012年14期)2013-01-07 07:46:16
      鄭州局辦理業(yè)務(wù)全程提速
      第一次刷卡
      抚松县| 云霄县| 峨眉山市| 鲁甸县| 宝应县| 富宁县| 连南| 阿拉善左旗| 绩溪县| 化州市| 皮山县| 银川市| 渑池县| 云和县| 正宁县| 河南省| 且末县| 宁夏| 辽宁省| 沙洋县| 玉溪市| 广平县| 永福县| 凤翔县| 怀化市| 辽宁省| 五原县| 探索| 大埔区| 盈江县| 凌海市| 双柏县| 含山县| 来安县| 凯里市| 灵宝市| 揭西县| 濮阳市| 博爱县| 开原市| 永和县|