趙瑜,李玉,王利雷,李朋州
(西南交通大學(xué)交通工程系,四川成都 610031)
?
基于手機(jī)GPS定位軌跡的出行信息采集技術(shù)
趙瑜,李玉,王利雷,李朋州
(西南交通大學(xué)交通工程系,四川成都610031)
摘要:針對居民出行調(diào)查主要依靠傳統(tǒng)紙質(zhì)問卷形式獲取居民出行信息、調(diào)查數(shù)據(jù)很難準(zhǔn)確反映實(shí)際交通需求特征的問題,提出運(yùn)用手機(jī)GPS技術(shù)獲取個體出行軌跡信息,挖掘分析不同交通方式的軌跡特征,并運(yùn)用支持向量機(jī)算法對出行方式進(jìn)行識別。結(jié)合實(shí)例分析表明:提出的算法對步行-自行車-步行、步行-公交車-步行、步行-小汽車-步行3種組合的出行方式識別正確率均較高,為以后城市居民出行調(diào)查提供一種新型的調(diào)查方法。
關(guān)鍵詞:手機(jī)GPS;出行軌跡;出行方式識別;支持向量機(jī)
近年來隨著我國城市化進(jìn)程的加快和人口的集聚,交通擁堵問題日益突顯,交通基礎(chǔ)數(shù)據(jù)的采集是解決城市交通問題的重要手段。居民出行調(diào)查是把握城市居民交通需求的基本工具,是交通相關(guān)部門制定科學(xué)交通規(guī)劃方案和交通政策的重要依據(jù)。
居民出行調(diào)查大多是依靠傳統(tǒng)紙質(zhì)問卷形式獲取居民出行信息,該類方法通過居民回憶出行過程得到調(diào)查數(shù)據(jù),普遍存在數(shù)據(jù)精度不高、被調(diào)查者不愿意配合、調(diào)查組織難度大等問題,調(diào)查數(shù)據(jù)很難準(zhǔn)確反映實(shí)際交通需求特征。基于GPS定位的個體出行信息采集已經(jīng)逐漸成為交通工程領(lǐng)域國際前沿?zé)狳c(diǎn)之一,國內(nèi)外學(xué)者對GPS出行信息采集技術(shù)與傳統(tǒng)交通調(diào)查技術(shù)做了比較研究,并開始對基于GPS軌跡數(shù)據(jù)的出行信息提取算法進(jìn)行探索。文獻(xiàn)[1]提出結(jié)合GIS地圖匹配算法和基于規(guī)則的數(shù)學(xué)算法,成功實(shí)現(xiàn)了步行、自行車、公交車和小汽車4種交通方式的識別;文獻(xiàn)[2]利用GPS-GIS數(shù)據(jù)開發(fā)一套基于模糊邏輯的交通方式自動識別算法,通過與出行日志對比,該方法對不同交通方式識別的準(zhǔn)確率達(dá)到90%左右;文獻(xiàn)[3]通過GPS設(shè)備收集出行行為特征數(shù)據(jù),運(yùn)用神經(jīng)網(wǎng)絡(luò)算法識別個體出行模式,研究發(fā)現(xiàn)該算法對居民單一交通方式的出行具有較好的識別效果。文獻(xiàn)[4]通過分析GPS軌跡的多源不確定性和高模糊度等數(shù)據(jù)特征,提出一種基于模糊最大隸屬度法則的出行方式識別算法。文獻(xiàn)[5]探討利用手機(jī)軟件檢測和記錄的參數(shù),分析出行軌跡特征信息,并對比支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹3種算法對出行方式的識別效果,表明支持向量機(jī)具有更好的識別性能,識別正確率為89.6%。文獻(xiàn)[6]通過手機(jī)GPS軟件采集GPS軌跡數(shù)據(jù),運(yùn)用小波模極大值算法將整個出行軌跡劃分成不同的出行段,并運(yùn)用神經(jīng)網(wǎng)絡(luò)算法和公交站點(diǎn)匹配算法對不同交通方式和換乘點(diǎn)進(jìn)行識別,得出換乘點(diǎn)識別誤差在1 min以內(nèi)、交通方式識別正確率在85%以上的結(jié)論。
本文提出運(yùn)用手機(jī)GPS軟件采集移動定位軌跡數(shù)據(jù),并運(yùn)用支持向量機(jī)算法識別提取出行方式信息,形成一整套的出行信息采集與提取技術(shù)。
1手機(jī)GPS技術(shù)
近年來,隨著衛(wèi)星定位技術(shù)的快速發(fā)展,基于手機(jī)GPS定位的交通數(shù)據(jù)采集技術(shù)越來越受到研究人員的關(guān)注[7-9]?;谑謾C(jī)GPS的交通數(shù)據(jù)采集技術(shù)是指被調(diào)查者攜帶具有GPS功能的智能手機(jī),利用手機(jī)內(nèi)置GPS定位芯片計算交通出行者的實(shí)時位置,并將數(shù)據(jù)傳輸?shù)教幚碇行?,計算得出速度、加速度等居民出行的相關(guān)交通信息[10]。該技術(shù)作為移動式交通采集技術(shù)的一種,相比其他交通調(diào)查方式,可以獲得更為客觀、精確的交通行為特征數(shù)據(jù),并且數(shù)據(jù)更新動態(tài)性更強(qiáng),數(shù)據(jù)精度明顯提高。此外,該技術(shù)避免了手持式GPS儀器成本昂貴的缺點(diǎn),將成為未來居民出行調(diào)查重要的輔助手段,有著廣闊的應(yīng)用前景。
2GPS數(shù)據(jù)預(yù)處理
由于目前市場上智能手機(jī)選用的GPS芯片質(zhì)量參差不齊,GPS定位精度也明顯不同,因而運(yùn)用手機(jī)GPS軟件在數(shù)據(jù)采集過程中會發(fā)生部分?jǐn)?shù)據(jù)缺失和數(shù)據(jù)飄移等現(xiàn)象,此外,由于在進(jìn)行實(shí)際GPS數(shù)據(jù)采集時,會因為高樓、樹蔭、下穿隧道、高架道路等環(huán)境影響,使獲取的GPS軌跡點(diǎn)出現(xiàn)數(shù)據(jù)突變情況。因此,在挖掘GPS數(shù)據(jù)特征之前,必須結(jié)合數(shù)據(jù)除噪算法對基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理操作。
2.1漂移去除
選取成都市中心城區(qū)的GPS試驗調(diào)查數(shù)據(jù),對不符合成都市地理位置特征的GPS數(shù)據(jù)予以刪除。此外,手機(jī)GPS軟件獲取定位數(shù)據(jù)的前提必須保證至少有3顆衛(wèi)星信號。按照成都各級道路的限速規(guī)定,成都市中心城區(qū)的機(jī)動車限速為80 km/h。文獻(xiàn)[11]研究得出室內(nèi)手機(jī)GPS定位精度為±50 m,數(shù)據(jù)過濾時將定位誤差大于100 m的數(shù)據(jù)清除。綜合考慮,本文主要從經(jīng)緯度、海拔、衛(wèi)星個數(shù)、定位誤差、機(jī)動車速度幾個方面進(jìn)行數(shù)據(jù)漂移除去操作。
通過編寫MATLAB程序,當(dāng)緯度小于30°05′或者緯度大于31°26′、經(jīng)度小于102°54′或者經(jīng)度大于104°53′、衛(wèi)星個數(shù)小于3顆、海拔高度小于0 m或者海拔高度大于1 000 m、速度大于22.2 m/s時,去除相應(yīng)的漂移數(shù)據(jù)。
2.2數(shù)據(jù)濾波
GPS軌跡中位置的隨機(jī)性影響數(shù)據(jù)后續(xù)處理過程,因此需要進(jìn)行濾波除噪處理。使用高斯濾波器進(jìn)行除噪,高斯濾波器是一種在除噪方面比較理想的濾波器,也稱為時頻寬積最小的最優(yōu)濾波器。高斯濾波器在很大程度上克服了傳統(tǒng)濾波相移和設(shè)計復(fù)雜的缺陷,并廣泛運(yùn)用到信號數(shù)據(jù)除噪等數(shù)據(jù)預(yù)處理領(lǐng)域。高斯濾波器對每一個點(diǎn)的坐標(biāo)x、y,濾波處理后的值[12]
(1)
(2)
根據(jù)式(1)、(2),編寫MATLAB濾波算法程序?qū)PS軌跡進(jìn)行濾波處理,對步行-公交車-步行組合出行(即先從出發(fā)地步行一段距離到公交站,然后乘坐公交車,到終點(diǎn)附近的公交站后再步行至目的地)調(diào)查數(shù)據(jù)進(jìn)行對比分析,最終濾波結(jié)果如圖1所示。
由圖1可知,濾波前,當(dāng)出行時間為17.5 min時公交車的瞬時速度波動最大,幾乎接近18 m/s,而進(jìn)行高斯濾波處理后,該時間點(diǎn)的瞬時速度約為12 m/s左右,既減少了速度的異常突變,又維持了公交車的速度特征。此外,經(jīng)過處理后出行時間為27 min時的步行速度也減少了突變,各段的速度較為平滑,這為后續(xù)的數(shù)據(jù)特征分析奠定了基礎(chǔ)。
2.3GPS數(shù)據(jù)分析
為了比較分析不同組合出行的GPS軌跡數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理后,選取了步行-自行車-步行、步行-公交車-步行、步行-小汽車-步行3種組合的GPS數(shù)據(jù),通過繪制速度-時間折線圖得到:步行速度≤2 m/s,自行車速度為2~4 m/s,公交車速度為10 m/s左右,小汽車速度為15 m/s左右。步行-公交車-步行示例如圖2所示。
圖1 濾波前后的速度-時間折線圖
圖2 步行-公交車-步行組合出行GPS速度特征
3支持向量機(jī)算法
3.1支持向量機(jī)基本原理
基于GPS軌跡的出行信息識別本質(zhì)上屬于一種非線性的模式識別問題,目前,交通方式識別算法有神經(jīng)網(wǎng)絡(luò)、決策樹、模糊識別等,且支持向量機(jī)算法在處理非線性問題上具有突出的數(shù)據(jù)挖掘和提取識別能力,獲取結(jié)果相對其他算法具有更高的精度[13]。
支持向量機(jī)是在統(tǒng)計學(xué)習(xí)理論中提出的重要機(jī)器學(xué)習(xí)方法,也是目前應(yīng)用最廣泛、綜合效果最好的模式分類技術(shù)。簡單地講,支持向量機(jī)算法對模式識別的過程類似于神經(jīng)網(wǎng)絡(luò),其樣本數(shù)據(jù)分類模型結(jié)構(gòu)主要包括3部分[14-15],如圖3所示。其中,φj(X)為訓(xùn)練樣本X第j個特征函數(shù),K(xj,X)為模型自帶的核函數(shù),其中X=(x1,x2,x3…xm)。
1)輸入層。將m維的訓(xùn)練樣本數(shù)據(jù)導(dǎo)入支持向量機(jī)數(shù)學(xué)模型。
2)隱含層。通過對輸入層導(dǎo)入的基礎(chǔ)數(shù)據(jù)進(jìn)行訓(xùn)練,生成最優(yōu)的出行模式預(yù)測模型。
3)輸出層。運(yùn)用訓(xùn)練得到的預(yù)測模型,對其他數(shù)據(jù)進(jìn)行預(yù)測識別,最后輸出樣本的識別結(jié)果。
3.2非線性支持向量的數(shù)學(xué)模型
設(shè)樣本集合為(xi,yi),i=1,2,…,n,n為樣本個數(shù),xi∈Rd,yi∈{-1,+1}表示不同類別的標(biāo)號。由于在d維空間中線性判別函數(shù)的一般形式為g(x)=wT·X+b,其中,w為d維的平面法向量,b為模型初始值參數(shù)。
因此可以得到一個分類面方程[16]
wT·X+b=0。
圖3 支持向量機(jī)示意圖
本文中隱含層的預(yù)測模型實(shí)際上等價于求得一個最優(yōu)化問題,略去具體推導(dǎo)過程[17-18],得到支持向量機(jī)的最終數(shù)學(xué)模型:
s.t.
最優(yōu)分類函數(shù):
式中:W(α)為目標(biāo)函數(shù);αi,αj分別為第i個樣本和j個樣本的拉格朗日乘子;K(xi,Xj)為第i個樣本和第j個樣本的內(nèi)積核函數(shù)值;xi、xj分別為第i個和第j個樣本點(diǎn)數(shù)據(jù);yi、yj分別為第i個和第j個樣本點(diǎn)的類別標(biāo)號;K(xi,X)為第i個樣本與所有樣本的內(nèi)積核函數(shù)值;αi*為實(shí)現(xiàn)最優(yōu)分類時的第i個樣本的拉格朗日乘子;b*為確定最優(yōu)解的參數(shù)。
一般而言,非線性支持向量機(jī)會因選擇不同的內(nèi)積核函數(shù)而得到不同的模型,常用的核函數(shù)有多項式、高斯徑向基函數(shù)(RBF)、Sigmoid核函數(shù),本文選擇RBF核函數(shù)進(jìn)行出行信息識別[19],有
4案例分析
4.1數(shù)據(jù)來源
選取四川省成都市人民北路-人民南路南站為GPS數(shù)據(jù)采集試驗調(diào)查線路。該試驗線路全程長約11 km,為雙向6車道主干路,兩側(cè)有機(jī)動車輔路和非機(jī)動車道,呈南北走向,北起人民北路公交站,南至人民南路南站,此線路包括地鐵1#線、16路公交車線等公共交通線路,途徑天府廣場、錦江賓館等商業(yè)中心,是成都市南北交通的主要通道。運(yùn)用開發(fā)的手機(jī)GPS定位軟件采集步行-自行車-步行、步行-公交車-步行、步行-小汽車-步行3種組合的GPS軌跡數(shù)據(jù),運(yùn)用支持向量機(jī)算法對GPS軌跡中出行方式進(jìn)行識別。
4.2識別結(jié)果
運(yùn)用LIBSVM工具箱分別對不同組合出行軌跡中的出行方式進(jìn)行識別。
1)用不同數(shù)字代表不同交通方式。用1、2、3、4分別表示步行、自行車、公交車和小汽車出行方式。
2)構(gòu)建最優(yōu)支持向量機(jī)數(shù)學(xué)模型。選擇高斯徑向基核函數(shù),并運(yùn)用3組公交車、小汽車、自行車速度數(shù)據(jù)進(jìn)行訓(xùn)練建模,通過網(wǎng)格尋優(yōu)法獲取搜索步長為50 s,參數(shù)取值c=1,g=0.019(c,g為LIBSVM工具箱自帶參數(shù),初始設(shè)置為c=2,g=0.2,需要調(diào)試尋最優(yōu)),從而構(gòu)建最優(yōu)的支持向量機(jī)數(shù)學(xué)模型[20]。
3)支持向量機(jī)識別出行信息結(jié)果。利用支持向量機(jī)算法訓(xùn)練和識別得到各組交通方式識別結(jié)果如圖4~6所示。
由圖4可知,步行-自行車組合識別結(jié)果與實(shí)際結(jié)果比較一致。由圖5、6知,公交車和小汽車兩種交通方式識別結(jié)果相互干擾,即步行-公交車組合和步行-小汽車組合出現(xiàn)一定的識別誤差。此外,根據(jù)各組識別結(jié)果還可以直接讀取步行與機(jī)動車之間的換乘點(diǎn)信息。
圖4 步行-自行車-步行識別結(jié)果
圖5 步行-公交車-步行識別結(jié)果
圖6 步行-小汽車-步行識別結(jié)果
對步行-自行車組合、步行-機(jī)動車組合的每次出行數(shù)據(jù),運(yùn)用支持向量機(jī)算法進(jìn)行訓(xùn)練識別后(每組數(shù)據(jù)識別1次),得到唯一一種結(jié)果,并且對識別結(jié)果進(jìn)行統(tǒng)計。已知步行-自行車組合、步行-公交車組合2種組合的實(shí)際出行次數(shù)均為14次,步行-小汽車組合的實(shí)際出行次數(shù)為12次。運(yùn)用支持向量機(jī)算法分別對14組步行-自行車組合數(shù)據(jù)、14組步行-公交車組合數(shù)據(jù)、12組步行-小汽車組合數(shù)據(jù)進(jìn)行識別,共識別40次,得到所有出行試驗數(shù)據(jù)的出行方式識別結(jié)果,再運(yùn)用數(shù)理統(tǒng)計方法,得到3種組合出行試驗數(shù)據(jù)的出行方式識別正確率,如表1所示。從表1中可以看出,步行-自行車組合的識別正確率最高,為100%,其次是步行-公交車組合,識別正確率為92.86%,最后是步行-小汽車組合,識別正確率為75%。
表1 不同組合出行方式識別結(jié)果
5結(jié)語
本文分別采集步行-自行車-步行、步行-公交車-步行、步行-小汽車-步行3種組合的GPS軌跡基礎(chǔ)數(shù)據(jù),通過對軌跡中的速度數(shù)據(jù)進(jìn)行數(shù)據(jù)特征分析,建立支持向量機(jī)數(shù)學(xué)模型,對不同組合出行中的GPS軌跡中的出行方式進(jìn)行識別提取。研究發(fā)現(xiàn):步行-自行車組合的識別正確率最高,為100%,步行-公交車組合為92.86%,步行-小汽車組合為75%。由于公交車和小汽車速度數(shù)據(jù)特征比較相似,導(dǎo)致小汽車識別誤差較大,因此后續(xù)研究需要結(jié)合多源軌跡數(shù)據(jù)或者地圖匹配信息,以獲取較高的識別正確率。
參考文獻(xiàn):
[1]SAREMBAUD A.A trip reconstruction tool for GPS-based personal travel surveys[J].Transportation Planning & Technology, 2005, 28(5):381-401.
[2]TSUI S,SHALABY A.Enhanced system for link and mode identification for personal travel surveys based on global positioning systems[J].Transportation Research Record Journal of the Transportation Research Board,2006, 1972(1):38-45.
[3]BYON Y, ABDULHAI B, SHALABY A.Real-time transportation mode detection via tracking global positioning system mobile devices[J].Journal of Intelligent Transportation Systems,2009, 13(4):161-170.
[4]徐超,季民河,陳雯.GPS軌跡中交通方式的模糊識別及算法實(shí)現(xiàn)[J].中國科技論文在線,2011, 4(21):1938-1945.
XU Chao,JI Minhe,CHEN Wen.Identifying travel mode from GPS trajectories through fuzzy pattern recognition[J].Sciencepaper Online, 2011, 4(21):1938-1945.
[5]汪磊,左忠義,傅軍豪.基于SVM的出行方式特征分析和識別研究[J].交通運(yùn)輸系統(tǒng)工程與信息,2014, 1(3):70-75.
WANG Lei,ZUO Zhongyi,F(xiàn)U Junhao.Travel mode character analysis and recognition based on SVM[J].Journal of Transportation Systems Engineering and Information Technology, 2014, 14(3):70-75.
[6]YANG F, YAO Z,JIN P J.GPS and acceleration data in multimode trip data recognition based on wavelet transform modulus maximum algorithm[J].Transportation Research Record Journal of the Transportation Research Board,2015,2526:90-98.
[7]李勇.GPS全球衛(wèi)星定位導(dǎo)航系統(tǒng)的發(fā)展與應(yīng)用[J].電腦知識與技術(shù),2007(18):1640-1641.
LI Yong.Development and application of global positioning system-GPS[J].Computer Knowledge and Technology,2007(18):1640-1641.
[8]田永軍,賈國慶.A-GPS定位技術(shù)在智能手機(jī)中的研究與應(yīng)用[J].科技信息,2009(4):160.
TIAN Yongjun,JIA Guoqing.Application research on A-GPS positioning technology in the smart phone[J].Science and Technology Information,2009(4):160.
[9]夏熙梅.差分GPS定位技術(shù)及應(yīng)用[J].現(xiàn)代情報,2002,22(3): 99-100.
XIA Ximei.Differential GPS positioning technology and its application[J].Modern Intelligence,2002,22(3):99-100.
[10]SU Ya,YANG Yanlan, WU Xiaojia, et al.Design and development of android-based mobile positioning software[J].Computer Science &Application,2013(3):17-22.
[11]謝翔, 荊昊, 郭際明.室內(nèi)環(huán)境下手機(jī)GPS定位精度研究[J].測繪通報, 2012(8):95-98.
XIE Xiang, JING Hao, GUO Jiming.Research on accuracy of indoor-mobile-GPS positioning[J].Bulletin of Surveying and Mapping, 2012(8):95-98.
[12]連仁包,王衛(wèi)星.一種異性擴(kuò)散的自適應(yīng)平滑濾波算法[J].計算機(jī)工程與應(yīng)用,2013,49(20): 141-144.
LIAN Renbao, WANG Weixing.Anisotropic diffusion and adaptive smoothing algorithm[J].Computer Engineering and Applications, 2013, 49(20):141-144.
[13]ADREW A M.An introduction to support vector machines and other kernel-based learning methods[J].AI Magazine,2000,32(8):1-28.
[14]CORTES C, VAPNIK V.Support-vector networks[J].Machine Learning, 1995, 20(3):273-297.
[15]BOSER B E, GUYON I M, VAPNIK V N.A training algorithm for optimal margin classifiers[J].Proceedings of Annual Acm Workshop on Computational Learning Theory,1996(5): 144-152.
[16]王定成.支持向量機(jī)建模預(yù)測與控制[M].北京:氣象出版社, 2009.
[17]趙風(fēng)治,尉繼英.約束最優(yōu)化計算方法[M].北京: 科學(xué)出版社,1991.
[18]杜樹新,吳鐵軍.模式識別中的支持向量機(jī)方法[J].浙江大學(xué)學(xué)報(工學(xué)版),2003, 37(5): 521-527.
DU Shuxin, WU Tiejun.Support vector machine method in pattern recognition[J].Journal of Zhejiang University(Engi-neering Sience),2003, 37(5):521-527.
[19]趙瑩.支持向量機(jī)中高斯核函數(shù)的研究[D].上海:華東師范大學(xué), 2007.
ZHAO Ying.The research of gaussian kernel function of the support vector machine[D].Shanghai:East China Normal Univer-sity, 2007.
[20]ZHUANG L, DAI H.Parameter optimization of kernel-based one-class classifier on imbalance learning[J].Journal of Compu-ters,2006,1(7): 434-443.
(責(zé)任編輯:楊秀紅)
收稿日期:2016-05-17
作者簡介:趙瑜(1989—),男,重慶人,碩士研究生,主要研究方向為智能交通技術(shù)與應(yīng)用,E-mail:zhaoyu.mail@163.com.
DOI:10.3969/j.issn.1672-0032.2016.02.003
中圖分類號:U491
文獻(xiàn)標(biāo)志碼:A
文章編號:1672-0032(2016)02-0012-07
Travel Information Collection Technology Based on Mobile Phone GPS Trajectory
ZHAOYu,LIYu,WANGLilei,LIPengzhou
(DepartmentofTransportationEngineering,SouthWestJiaotongUniversity,Chengdu610031,China)
Abstract:The traditional resident travel survey mainly relies on paper questionnaires to obtain the resident travel information. The survey data are hard to reflect the characteristics of the actual traffic demand accurately. In this paper, the mobile phone GPS technology is used to collect individual travel path information through the analysis of the trajectory characteristics of different transport modes. Then, the support vector machine (SVM) algorithm is used for the travel mode identification. Combined with the case analysis, the research shows that the proposed algorithm gets higher extraction accuracy for three kinds of combination travel ways: walking-bike-walking, walking-bus-walking and walking-car-walking, which provides a new method for the urban resident trip survey.
Key words:mobile phone GPS;travel trajectory;travel mode identification;support vector machine