張 歡, 邊 揚(yáng), 梁 鯤, 李 玲
(北京工業(yè)大學(xué)城市交通學(xué)院, 北京 100124)
目前,對(duì)于評(píng)價(jià)自行車交通服務(wù)水平有很多方法如:自行車安全指數(shù)等級(jí)(BSIR)、自行車風(fēng)險(xiǎn)水平、路況指數(shù)體系(RCI)、自行車適應(yīng)性評(píng)級(jí)、自行車交通服務(wù)水平、自行車適應(yīng)性評(píng)分以及自行車兼容性指標(biāo)(BCI). 自行車交通服務(wù)水平是一項(xiàng)重要的評(píng)價(jià)方法,廣泛應(yīng)用于自行車交通規(guī)劃、設(shè)計(jì)、監(jiān)控、優(yōu)先權(quán)劃定等策略制定方面,大量研究人員利用自行車交通服務(wù)水平來評(píng)價(jià)道路的舒適性和安全性[1].
國(guó)內(nèi)對(duì)于自行車交通服務(wù)水平的影響因素研究較少,在《城市道路交通規(guī)劃設(shè)計(jì)規(guī)范》(GB50220—95)中采用行車速度、路段(交叉口)飽和度為主要評(píng)判指標(biāo)[2]. 而《城市道路設(shè)計(jì)規(guī)范》(CJJ37—2012),將騎行速度、占道面積、負(fù)荷度作為路段自行車交通服務(wù)水平的主要影響因素[3]. 趙賢蘭等[5]在分析自行車交通特性與騎行影響因素的基礎(chǔ)上,通過改進(jìn)自行車兼容性指數(shù)模型建立連接段服務(wù)水平模型,確定服務(wù)水平分級(jí)標(biāo)準(zhǔn). 曹士強(qiáng)等[5]將不同道路斷面隔離形式下的非機(jī)動(dòng)車橫向偏移率作為主要指標(biāo).
結(jié)合國(guó)內(nèi)外自行車交通服務(wù)水平研究的影響因素和北京市內(nèi)的道路交通特點(diǎn),確定本文研究主要從道路交通環(huán)境條件、騎行行為特征條件、主觀感受3個(gè)方面來選取自行車服務(wù)水平影響因素.
道路環(huán)境因素包括道路等級(jí)、非機(jī)動(dòng)車道的有效寬度、隔離形式、出入口數(shù)量、路段的公交站點(diǎn)數(shù)都對(duì)騎行者有顯著影響;交通環(huán)境條件主要選取:機(jī)動(dòng)車交通量、非機(jī)動(dòng)車逆行交通量、電動(dòng)自行車與助力車交通量、最外側(cè)車道的機(jī)動(dòng)車流量(分車型)、機(jī)動(dòng)車和非機(jī)動(dòng)車的車速、路側(cè)停車比例、行人占用非機(jī)動(dòng)車道情況在內(nèi)的7項(xiàng)指標(biāo);騎行行為特征從速度和加速度2個(gè)方面進(jìn)行選??;主觀感受評(píng)價(jià)指標(biāo)指的是騎行者對(duì)1個(gè)路段的整體騎行感受信息主要從安全感和舒適感2個(gè)方面進(jìn)行評(píng)價(jià).
自行車交通服務(wù)水平體現(xiàn)騎行環(huán)境的好壞,通過對(duì)上述3種條件的組合可產(chǎn)生出不同的自行車騎行環(huán)境,如:非機(jī)動(dòng)車和有效寬度大、采取物理隔離、出入口數(shù)量和公交站點(diǎn)數(shù)量小、交通環(huán)境簡(jiǎn)單、車流量少無機(jī)非混行影響的道路,必然會(huì)導(dǎo)致個(gè)人的騎行速度處于較高水平且速度的變化較小,同時(shí)騎行者的整體感受在這種路段往往評(píng)分較高.
在明確影響因素的前提下,文章需要獲得3類基礎(chǔ)數(shù)據(jù):道路交通環(huán)境數(shù)據(jù)、騎行行為特征數(shù)據(jù)、主觀感受數(shù)據(jù). 在北京市內(nèi)選取不同影響因素下的組合,設(shè)計(jì)騎行行為實(shí)驗(yàn)和道路交通環(huán)境調(diào)查實(shí)驗(yàn);然后根據(jù)不同數(shù)據(jù)的特點(diǎn)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理工作.
騎行行為實(shí)驗(yàn)共需采集2類數(shù)據(jù),分別是騎行行為特征數(shù)據(jù)、主觀感受數(shù)據(jù). 道路交通環(huán)境調(diào)查實(shí)驗(yàn)主要采集道路交通環(huán)境數(shù)據(jù). 本文對(duì)19段典型道路進(jìn)行道路交通環(huán)境調(diào)查如表1所示.
騎行行為數(shù)據(jù)主要利用手機(jī)內(nèi)置傳感器進(jìn)行數(shù)據(jù)采集,分別采集騎行過程中的GPS數(shù)據(jù)(1個(gè)/s)和加速度數(shù)據(jù)(20個(gè)/s). 騎行行為實(shí)驗(yàn)分別在早高峰和晚高峰2個(gè)時(shí)段進(jìn)行,實(shí)驗(yàn)車輛為共享單車,共選取實(shí)驗(yàn)者30人,15男、15女,并分為青年組和中老年組,即每個(gè)路段在1個(gè)時(shí)段進(jìn)行實(shí)驗(yàn)30次. 預(yù)計(jì)得到樣本2×30×19=1 140條. 道路交通環(huán)境調(diào)查實(shí)驗(yàn)與騎行行為實(shí)驗(yàn)同步進(jìn)行,主觀感受評(píng)分采用李克特5級(jí)量表,1為極差,5為極好. 最終共得到有效樣本1 011個(gè),其中5級(jí)整體感受在19段道路上的分布如圖1所示. 樣本整體打分較高,但是依舊可看出不同騎行環(huán)境的差別,如:騎行環(huán)境特別差的道路,路段6和13,是無隔離、機(jī)非混行且道路交通環(huán)境條件復(fù)雜的路段.
表1 實(shí)驗(yàn)路段基本信息
通過手機(jī)GPS模塊采集的速度數(shù)據(jù)與通過加速度計(jì)模塊采集的加速度數(shù)據(jù)存在誤差包含很多噪音,需要對(duì)兩類數(shù)據(jù)進(jìn)行相應(yīng)的預(yù)處理工作.
圖1 路段—整體感受水平分布圖
2.2.1 速度數(shù)據(jù)預(yù)處理
速度數(shù)據(jù)主要通過GPS數(shù)據(jù)計(jì)算而來,軟件所采集的數(shù)據(jù)為逐秒的GPS點(diǎn)位信息,采集頻率為1 Hz. 包含經(jīng)緯度信息以及UNIX時(shí)間戳信息. 設(shè)置7項(xiàng)數(shù)據(jù)清洗原則:
1)字段缺失
指采集過程,GPS字段、加速度字段、歐拉角字段缺失的刪除處理;
2)上一時(shí)刻相同點(diǎn)位
研究路段的騎行行為特征不考慮停止,因此速度為零點(diǎn)刪除;
3)時(shí)序數(shù)列判斷
GPS數(shù)據(jù)采用逐秒記錄,對(duì)于大于1.2 s和小于0.8 s的數(shù)據(jù)刪除;
4)瞬時(shí)速度判斷
瞬時(shí)速度大于12 m/s的點(diǎn)刪除,實(shí)驗(yàn)用自行車不可能到達(dá)該速度;
5)其他類型數(shù)據(jù)、加速度、GPS三者對(duì)應(yīng)判斷
與其他類型數(shù)據(jù)(道路交通環(huán)境數(shù)據(jù)等)對(duì)應(yīng),其他數(shù)據(jù)缺失導(dǎo)致描述樣本的屬性不全面;
6)利用經(jīng)緯度位置判斷
利用經(jīng)緯度判斷單個(gè)路段的騎行實(shí)驗(yàn)的起點(diǎn)和終點(diǎn);
7)記錄條數(shù)判斷
通過逐秒記錄的單個(gè)樣本應(yīng)該保持在100個(gè)GPS點(diǎn)以上,設(shè)備原因?qū)е掠涗淈c(diǎn)過少,刪除這類數(shù)據(jù).
通過上述7個(gè)步驟的GPS數(shù)據(jù)清洗,對(duì)于速度數(shù)據(jù)的處理已經(jīng)有一定效果,但是由于GPS數(shù)據(jù)存在漂移現(xiàn)象,因此利用萊茵塔準(zhǔn)則對(duì)速度數(shù)據(jù)進(jìn)行去除粗大誤差處理. 如式(1)所示:
(1)
2.2.2 加速度數(shù)據(jù)預(yù)處理
加速度數(shù)據(jù)的采集頻率為20 Hz,手機(jī)內(nèi)置的加速度計(jì)是三軸加速度計(jì),所測(cè)量的三向加速度是以手機(jī)為坐標(biāo)系的3個(gè)方向(x、y、z).同時(shí)手機(jī)還可通過姿態(tài)傳感器采集手機(jī)的姿態(tài)數(shù)據(jù)即歐拉角數(shù)據(jù)(ψ、γ、θ),利用式(2)將2類數(shù)據(jù)融合,將加速度轉(zhuǎn)換到以世界坐標(biāo)系為基準(zhǔn)[6].
(2)
轉(zhuǎn)換完坐標(biāo)系的加速度3個(gè)軸向分別是X軸正東方向、Y軸正北方向、Z軸垂直地面方向3個(gè)方向上的加速度(x′、y′、z′).由于所選的實(shí)驗(yàn)道路均為正南正北正東正西的路段,因此再將世界坐標(biāo)系下的加速度轉(zhuǎn)換到以騎行者本身為坐標(biāo)系之上,即沿騎行方向,垂直于騎行方向以及垂直于地面方向.經(jīng)過一系列的坐標(biāo)變換處理,將以手機(jī)坐標(biāo)系下采集的加速度數(shù)據(jù)轉(zhuǎn)換到以騎行者為坐標(biāo)系上來.由于加速度計(jì)在數(shù)據(jù)采集過程中存在白噪音,因此選用滑動(dòng)均值濾波法對(duì)加速度數(shù)據(jù)進(jìn)行濾波處理,滑動(dòng)均值濾波的原理見式(3),本文采用MATLAB軟件實(shí)現(xiàn)此過程,單個(gè)樣本的濾波結(jié)果如圖2所示:
圖2 滑動(dòng)均值濾波結(jié)果
(3)
式中,y(k)為濾波后的第k個(gè)數(shù)值;x(k+i)為濾波前的第k+i個(gè)數(shù)值;N為滑動(dòng)窗口大小(本文取N=10).
在非機(jī)動(dòng)車騎行行為數(shù)據(jù)提取的基礎(chǔ)上,應(yīng)用數(shù)理統(tǒng)計(jì)分析方法,研究速度相關(guān)騎行行為特征和加速度相關(guān)騎行行為特征,對(duì)比分析不同道路交通環(huán)境條件下的騎行行為.
提出2類騎行行為指標(biāo)分別是速度相關(guān)騎行行為指標(biāo)和加速度相關(guān)行為指標(biāo),主要分為8種統(tǒng)計(jì)學(xué)特征,分別是均值、方差、中位數(shù)、變異系數(shù)、最大值、最小值、85%位數(shù)值、15%位數(shù)值. 因此速度和加速度共提取32項(xiàng)(其中加速度為3個(gè)方向)騎行行為特征指標(biāo). 這些特征指標(biāo)可代表不同騎行環(huán)境下的騎行行為,如速度均值、方差等指標(biāo)代表的是騎行的整體情況,而加速度的最大值、最小值,85%位數(shù)值和15%數(shù)值則是代表騎行的急加速和急減速情況.
結(jié)合道路交通環(huán)境數(shù)據(jù)、主觀感受數(shù)據(jù),最終得到1 011行、45列的樣本集合. 其中19段道路的部分騎行行為特征指標(biāo)如表2所示:
表2 各路段騎行行為特征分析
通過表2可看出一些騎行特征分布規(guī)律,如:路段5、7、15、19等路段的速度值較高,且速度方差較低,以上路段均為隔離設(shè)施完善且有效非機(jī)動(dòng)車道寬度較寬的路段;如:路段6、13為19條路段中僅有的2條沒有任何隔離形式的支路,在速度均值和方差上則體現(xiàn)出整體速度水平偏低且速度的波動(dòng)性高,說明在上述路段騎行過程中受干擾程度大.
繪制5級(jí)主觀感受與速度相關(guān)騎行行為特征和加速度相關(guān)騎行特征的散點(diǎn)圖,如圖3~6所示:
圖3 主觀感受- 速度均值散點(diǎn)圖
圖4 主觀感受- 速度方差散點(diǎn)圖
圖5 主觀感受-85%位加速度(沿向)散點(diǎn)圖
圖6 主觀感受-85%位加速度(垂向)散點(diǎn)圖
圖7 隨機(jī)森林分類器主程序
可得出:①不同騎行感受水平下具有不同的騎行行為特征;②好的騎行體現(xiàn)出速度水平較高且速度的變化小,符合一般實(shí)際情況,一般騎行速度處于較高水平且速度變化不大的騎行環(huán)境更受騎行者歡迎;③加速度2個(gè)方向上的85%位加速度值在主觀感受不同水平上呈現(xiàn)的趨勢(shì)不同,即沿向85%位加速度與主觀感受呈負(fù)相關(guān)趨勢(shì),垂向85%位加速度與主觀感受呈正相關(guān)趨勢(shì),說明對(duì)于感受不好的騎行而言,容易在行進(jìn)方向上做出更多的急加減速行為,騎行者沒有其他辦法規(guī)避沿著騎行方向上的沖突,而感受好的騎行則在沿著垂直方向做出的急加減速行為較少,可通過做出垂向的急加減速行為(超越或者繞行)規(guī)避沖突.
隨機(jī)森林分類算法是機(jī)器學(xué)習(xí)算法的一種,主要采用bootstrap抽取即有抽取放回的方法對(duì)樣本進(jìn)行抽取并將樣本分為樣本集和測(cè)試集2個(gè)部分,從而達(dá)到學(xué)習(xí)和預(yù)測(cè)目的的機(jī)器學(xué)習(xí)方法. 隨機(jī)森林分類算法具有不容易過擬合、抗噪聲能力強(qiáng)、適用于處理高維度即多特征的數(shù)據(jù),不用做特征選擇等優(yōu)點(diǎn),對(duì)于數(shù)據(jù)集中個(gè)別數(shù)據(jù)的缺失有很好的適應(yīng)性[7].
本章在數(shù)據(jù)集的基礎(chǔ)上,采用機(jī)器學(xué)習(xí)的方法對(duì)樣本進(jìn)行學(xué)習(xí)和預(yù)測(cè),最終構(gòu)建基于隨機(jī)森林算法的路段自行車交通服務(wù)水平模型.
為保證分類質(zhì)量,將5級(jí)感受分為2個(gè)級(jí)別,即服務(wù)水平“好”(主觀感受“4~5級(jí)”)和服務(wù)水平差(主觀感受“1~3級(jí)”). 利用Rapid Miner軟件構(gòu)建隨機(jī)森林分類器,采用十折交叉驗(yàn)證,并利用基尼系數(shù)判斷屬性的重要性程度. 如圖7、圖8所示:
圖8 交叉驗(yàn)證子程序
隨機(jī)森林算法不需要做特征選擇,因此以基于主觀感受所得的2類服務(wù)水平作為“標(biāo)簽”,以騎行行為特征、道路環(huán)境特征、交通環(huán)境特征為“屬性”帶入模型學(xué)習(xí)并預(yù)測(cè). 樣本為1 011例,屬性特征為45項(xiàng). 模型預(yù)測(cè)結(jié)果和不同特征屬性的重要程度如圖9、圖10所示:
圖9 模型預(yù)測(cè)結(jié)果
圖10 特征屬性重要性程度
模型分類精度在二分類情況下為68.25%,與文獻(xiàn)[8]中基于Probit模型的分類精度68.4%和基于SVM分類器的分類精度75.5%相差不大. 對(duì)于以主觀感受為標(biāo)簽來說分類精度比較理想. 同時(shí)通過特征屬性重要程度圖可看出,經(jīng)典的自行車交通
服務(wù)水平研究中如:道路等級(jí)、隔離形式、出入口數(shù)量、路側(cè)停車、混行機(jī)動(dòng)車交通量等對(duì)服務(wù)水平具有較大影響,但是也可看出個(gè)人的騎行行為特征如:速度變異系數(shù)、速度15%位數(shù)值、速度方差、垂向加速度最大值等也對(duì)模型有不小的貢獻(xiàn). 說明個(gè)人的騎行行為特征可用于劃分自行車交通服務(wù)水平.
構(gòu)建基于隨機(jī)分類分類器的自行車服務(wù)水平模型,以個(gè)體騎行行為作為樣本進(jìn)行學(xué)習(xí)和預(yù)測(cè),證明個(gè)體的騎行行為特征可用自行車服務(wù)水平的研究,最終兩類預(yù)測(cè)的精度達(dá)到68.25%,分類模型精度較高,整體模型較為理想. 但采用主觀評(píng)價(jià)作為自行車交通服務(wù)水平劃分過于主觀,需要進(jìn)一步加入客觀數(shù)據(jù)使分類模型精度進(jìn)一步提高.