黃洪滔,肖梅,劉倩,明秀玲,邊浩毅
1)長安大學運輸工程學院,陜西 西安 710064;2)浙江機電職業(yè)技術學院,浙江 杭州 310053
公交進站??渴菍崿F(xiàn)乘客和車輛交互以及時空轉(zhuǎn)移的過程,是公交運營中必不可少的階段[1].公交站內(nèi)車輛的運行特征包括公交車??刻卣髋c到達特征[2].車輛停靠時間與單位時間內(nèi)的車輛到達數(shù)均會影響公交站的運行狀態(tài),進而影響公交系統(tǒng)的運行效率.因此,有必要對公交站運行狀態(tài)進行識別與因素分析,以提高公交系統(tǒng)的服務質(zhì)量和吸引力.
對公交或地鐵站的分類研究一般具有兩個特征:① 根據(jù)站點的設置位置、設置方法、幾何形狀及周邊用地性質(zhì)等靜態(tài)指標研究站點分類[3-4].《城市公共汽電車和無軌電車工程項目建設標準》[3]將公交場站分為首末站、中途站、保養(yǎng)場及停車場.葉嬌[4]提出根據(jù)節(jié)點區(qū)位特性、換乘需求量及周邊用地性質(zhì)進行城市交通樞紐層次劃分的方法.② 對動態(tài)指標使用聚類分析方法,進而分類識別站點.朱宏等[5]使用主成分分析法提取關于站點服務、站點接駁及步行環(huán)境滿意度3個因子,在此基礎上對19個快速公交站點進行k-means聚類,最終劃分為5 類;馬壯林等[6]通過分析地鐵進出站客流數(shù)據(jù)對站點進行高斯混合模型聚類,歸納出不同類型站點的時空分布特征規(guī)律.當考慮如何評價站點的運行狀態(tài)時,王學勇等[7]以每小時平均到達車數(shù)與平均??繒r間等指標評價站點服務效率,并計算出自由??亢投c停靠時公交站的合理泊位數(shù);卞張蕾[8]考慮車輛進出站速度、時間和平均服務時間等因素,使用k-means 算法對公交站的運行狀態(tài)進行分類識別;朱寧等[9]使用公交負荷到達率衡量站點的運營情況,并提出站點延誤估算模型.
在站點內(nèi)公交車輛??颗c到達過程的影響因素分析方面,TAN等[10]在分析泊位分配與公交站車輛延誤過程中,驗證了高峰時段和公交流量變大會增加公交延誤;BIAN 等[11]對公交站泊位數(shù)、線路數(shù)及乘客數(shù)量等因素間的關系進行分析,建立站點服務時間模型;柳伍生等[12]研究公交進出站和停站延誤,認為泊位數(shù)、公交到達率及上下車乘客數(shù)對公交延誤具有影響;張夢潔[13]從站臺、公交停靠及環(huán)境方面分析公交??繒r間影響因素,解釋了時段、站型、有無公交專用道及泊位數(shù)等因素的顯著影響作用.
機器學習模型可以確定以上各因素之間的非線性關系,并以較高精度預測站點運行狀態(tài),結(jié)合可解釋機器學習框架SHAP(Shapley additive explanation)可以探究內(nèi)部變量對預測結(jié)果的影響.羅妍等[14]使用了可解釋機器學習框架SHAP,提升了機器學習預測模型的透明度.呂能超等[15]構建了基于極限梯度提升(extreme gradient boosting,XGBoost)的碰撞風險預測模型,并引入SHAP 對模型變量的影響進行解釋.
由以上分析可知,在公共交通站點分類的現(xiàn)有研究中,多數(shù)研究集中在軌道交通樞紐領域,公交站的分類識別主要考慮周圍用地性質(zhì)等靜態(tài)指標,而綜合考慮站點運行特性的研究較少,難以體現(xiàn)對公交站運行狀態(tài)的實際評價.本研究針對公交站運行狀態(tài)展開研究,以中國西安市公交車輛全球定位系統(tǒng)(global positioning system,GPS)軌跡數(shù)據(jù)為基礎,將公交車輛的??亢偷竭_特征作為公交站運行狀態(tài)特征變量的提取依據(jù),根據(jù)公交站平均服務時間和服務車數(shù)特征對公交站運行狀態(tài)進行識別,并識別出3 類公交站.提出考慮數(shù)據(jù)不均衡性的SMOTEENN-XGBoost(synthetic minority oversampling technique edited nearest neighbours - extreme gradient boosting)站點運行狀態(tài)預測模型,利用可解釋機器學習框架SHAP 剖析站臺屬性、道路及環(huán)境對站點運行狀態(tài)的影響.研究結(jié)果有望進一步協(xié)調(diào)站點車輛運行,為乘客提供準確的站點和車輛信息服務,進而提升公交系統(tǒng)的整體服務質(zhì)量.
采用西安市2017-07-03 至2017-07-09 的公交車輛GPS 軌跡數(shù)據(jù),包含公交車輛的身份標識號(identity document,ID)、經(jīng)緯度、運行速度、記錄時間、當日行駛總里程及行駛方位角等信息.使用ArcGIS對清洗后的GPS軌跡數(shù)據(jù)進行站點匹配,將所有數(shù)據(jù)按站點進行歸類.由于公交站的運行狀態(tài)主要由進站車輛運行特點決定,因此,選取公交站內(nèi)車輛的??刻卣骱偷竭_特征來描述站點運行狀態(tài)特點.
1)平均服務時間.平均服務時間為1 小時內(nèi)公交站服務時間的平均值,表示不同運行狀態(tài)公交站的時間特征.當車輛經(jīng)歷多次啟動停車時,以車輛駛離站臺前的最后一次啟動時間與到達站臺前的最后一次停車時間之差作為公交站服務時間[16].公交車在站臺范圍內(nèi)的運行速度一般不超過15 km/h,因此,可將公交車輛的進出站過程視為勻加速過程.考慮到GPS軌跡數(shù)據(jù)的采樣頻率為10 s,在采樣間隔時間內(nèi)存在公交車輛停止和啟動的現(xiàn)象,繪制典型公交站公交運行示意圖,如圖1.其中,A和F為車輛停止前和啟動后采集到的第1個數(shù)據(jù)點;B和E為實際的車輛停止和啟動數(shù)據(jù)點;C和D為采集到的車輛停止和啟動數(shù)據(jù)點;t為時刻;v為車速;L為當日當前時刻的行駛總里程.點A到B之間車輛加速度a、v及L的關系為
圖1 公交站內(nèi)公交車輛的(a)行駛里程和(b)速度變化示意Fig.1 Schematic of (a) mileage and (b) speed changes of bus vehicles at bus station.Solid line with circle is for the recorded status points.Dashed line with circle is for the real status points.
由式(1)可推導出公交車輛減速至停止的時刻tB.同理,可推導出公交車輛停止至加速的時刻tE,定義站臺服務時間T為tB和tE之差,即
2)服務車數(shù).服務車數(shù)為站點小時內(nèi)公交車輛的到達數(shù),很大程度上反映了公交車輛到達率以及該站點的運營狀況,因此,選用服務車數(shù)作為衡量站點運行狀態(tài)的特征指標.
為保證合理性,公交站選取的原則[13]包括:① 選擇位于基本路段的公交站時,保證數(shù)據(jù)不受交叉路口信號控制的影響;② 社會車輛干擾等不確定因素會導致站內(nèi)車輛在某一瞬間速度驟增或驟減,避免選取此類公交站;③ 選取非節(jié)假日的公交站運行數(shù)據(jù).
根據(jù)已有的站點車輛運行特性研究結(jié)果[1,10-13,17],結(jié)合實際從站臺、道路及環(huán)境方面初選10個因素,包括站臺設置方法、站臺設置位置、線路數(shù)、有無公交專用道、車道數(shù)、天氣類型、是否工作日、站臺幾何形狀、泊位數(shù)及時段,變量描述如表1所示.將這10個因素分別與站點的平均服務時間和服務車數(shù)進行相關性檢驗,結(jié)果顯示所選因素與站點的平均服務時間或服務車數(shù)存在顯著性相關關系(P< 0.05).
表1 公交站影響因素的變量描述Table 1 Variable description of bus stop influencing factors
為了融合公交站的不同運行狀態(tài)特征,確定運行狀態(tài)類型,使用聚類算法對站點運行狀態(tài)特征數(shù)據(jù)進行聚類.常用的劃分聚類算法有針對連續(xù)數(shù)值的k-means算法、針對離散類別的k-modes算法、基于密度的帶噪聲應用空間聚類(density-based spatial clustering of applications with noise,DBSCAN)算法及從概率角度出發(fā)的高斯混合模型(Gaussian mixture model,GMM)等[18-19].GMM融合了參數(shù)和非參數(shù)估計方法的特點,對異常值的識別度更高[19],因此,本研究使用GMM模型進行數(shù)據(jù)分類.
GMM 模型通過混合多個基于高斯模型的概率分布來表示數(shù)據(jù)分布,若將公交站運行狀態(tài)分為M類,則由M個單高斯分布組成的混合模型可表示站點的運行狀態(tài),高斯混合模型P(x)可表示為
其中,M為高斯分布的個數(shù);wm、μm及σm為第m個高斯分布的權重系數(shù)、均值及協(xié)方差;g(x;μm,σm)為第m個高斯分布的概率密度函數(shù).
采用樣本輪廓系數(shù)s確定最佳聚類數(shù)M,s計算為
其中,a為與同簇中數(shù)據(jù)點的平均距離;b為與下一個最近簇中數(shù)據(jù)點的平均距離.s越接近1 聚類效果越好,越接近-1聚類效果越差.
數(shù)據(jù)的相對大小會影響聚類結(jié)果,因此,對站點平均服務時間和服務車數(shù)進行z-score標準化.對處理后的數(shù)據(jù)進行Hopkins 聚類趨勢分析,計算出統(tǒng)計值為0.908,表明公交站的運行特征具有可聚性.根據(jù)輪廓系數(shù)極值得到k-means與GMM聚類的最佳聚類數(shù)均為3,且當聚類數(shù)為3時k-means算法和GMM 的輪廓系數(shù)分別為0.560 和0.693,可見,高斯混合模型在站點運行狀態(tài)識別方面的有效性更強.
將站點運行狀態(tài)根據(jù)特征分為3類,分別為類型Ⅰ、類型Ⅱ及類型Ⅲ,其基本特征如圖2 和表2所示.可見,Ⅰ類公交站的服務車數(shù)不多,平均服務時間最長為63.261 s,表明該運行狀態(tài)的公交站服務車輛少且服務時間最長;Ⅱ類公交站的平均服務時間和服務車數(shù)在3種類型中最低;Ⅲ類公交站的平均服務時間短,服務車數(shù)最多為125輛,表明該運行狀態(tài)的公交站服務車輛最多且服務時間短.
表2 三類公交站運行狀態(tài)的特征Table 2 Characteristics of operating states of three types of bus stops
圖2 GMM聚類結(jié)果Fig.2 Clustering results by GMM.The plus signs are for typeⅠ, the minus signs are for type Ⅱ, the multiplication signs are for type Ⅲ, and the solid circles are for the clustering centers.
考慮站臺屬性、道路和環(huán)境等要素,構建SMOTEENN-XGBoost站點運行狀態(tài)預測模型.利用SHAP可解釋性分析框架解釋因素對預測結(jié)果影響.
考慮到不同公交站運行狀態(tài)樣本數(shù)不均衡時,會影響到預測模型的訓練,預測結(jié)果會傾向于樣本數(shù)較多的類型,因此,本研究結(jié)合SMOTEENN(synthetic minority oversampling technique edited nearest neighbours)和 XGBoost 算 法 構 建SMOTEENN-XGBoost 預測模型.使用SMOTEENN算法對訓練集數(shù)據(jù)進行不均衡處理,對于少數(shù)類樣本,使用過采樣SMOTE(synthetic minority oversampling technique)算法以線性插值方式增加新樣本;對于多數(shù)類樣本,使用欠采樣ENN(edited nearest neighbours)算法對與其k近鄰點類別不同的數(shù)據(jù)進行刪除,使得處理后的數(shù)據(jù)更可靠[20].極限梯度提升算法是在梯度提升決策樹算法基礎上提出的一種疊加樹模型,其對目標函數(shù)進行二階泰勒展開,加入模型復雜度的正則項,使目標值和實際值的誤差更小,進而提高數(shù)據(jù)預測準確度.
假設模型樣本為(xi,yi),i= 1,2,…,n,fq(xi)為第q個決策樹的預測結(jié)果,經(jīng)過Q輪迭代后模型的預測結(jié)果為
其中,l(yi,y?i)為模型的損失函數(shù);Ω為模型的正則項.將目標函數(shù)泰勒展開至二次項,采用貪心算法可以得到最終模型.
本研究按照0.8 的比率隨機劃分訓練集,SMOTEENN 均衡化后的訓練集包含312 個Ⅰ類樣本、398 個Ⅱ類樣本及278 個Ⅲ類樣本.為提升模型的性能,采用網(wǎng)格搜索法和五折交叉驗證法尋找預測模型的最優(yōu)參數(shù)組合,表3 為SMOTEENNXGBoost模型的最終參數(shù).
表3 SMOTEENN-XGBoost模型參數(shù)Table 3 SMOTEENN-XGBoost model parameters
使用準確率A、精確率P、召回率R及F1 分數(shù)F1作為評估指標,評估指標的值越接近于1表明預測效果越好,由于本模型為多分類預測模型,因此,根據(jù)各類型數(shù)據(jù)所占比例計算各類型評估指標的加權平均值,評估指標的定義為
其中,TP 表示真實和預測值都是當前類型的樣本數(shù);FP 表示真實值不是當前類型且預測值是當前類型的樣本數(shù);FN 表示真實和預測值都不是當前類型的樣本數(shù).
為了驗證模型的預測性能,選取XGBoost、邏輯回歸(logistic regression,LR)、隨機森林(random forest,RF)、梯度提升決策樹(gradient boosting decision tree,GBDT)和k近 鄰(k-nearest neighbors,KNN)5種機器學習算法進行對比,在相同數(shù)據(jù)集基礎上進行模型的訓練和測試.表4是各個模型的對比結(jié)果.可見,與其他5 種模型相比,SMOTEENN-XGBoost模型的準確率、精確率、召回率及F1分數(shù)均為最高,預測性能最好.
表4 六種模型的預測性能比較Table 4 Prediction performance comparison of the six models %
SHAP 是一種事后解釋黑箱機器學習模型的框架.對于每個樣本的不同影響因素會生成對應的SHAP 值,SHAP 值的主要作用是量化各因素對模型的貢獻.假設第i個樣本的第j個因素為xij,xij的SHAP 值為f(xij),模型對第i個樣本的預測值為yi,整個模型的基線(通常是所有樣本目標變量的均值)為ybase,則SHAP值有如下關系
其中,f(xij)即為第i個樣本中第j個因素對預測值yi的貢獻值.當f(xij)>0 時,該因素提升了預測值;反之,該因素使預測值降低.
根據(jù)SHAP 值得到各個因素對模型分類結(jié)果的重要性排序,如圖3.可見,各因素按照重要程度由大到小的排序為線路數(shù)、有無公交專用道、泊位數(shù)、站臺設置方法、站臺幾何形狀、車道數(shù)、站臺設置位置、是否工作日、時段和天氣類型.
圖3 因素重要度排序Fig.3 The importance order of factors.
圖4 為各因素對不同公交站運行狀態(tài)的影響,橫坐標為因素的SHAP 值,每個點代表1 個樣本,灰度值越低即顏色越深表示因素值越大.
圖4 因素對公交站運行狀態(tài)(a)類型Ⅰ、(b)類型Ⅱ及(c)類型Ⅲ的影響分析Fig.4 Analysis of influencing factors of bus stop operating state on (a) type Ⅰ, (b) type Ⅱ, and (c) type Ⅲ.
在站臺屬性方面,線路數(shù)是重要度最高的因素,隨著線路數(shù)的增加,站點運行狀態(tài)屬于類型Ⅲ的概率越大,這與線路數(shù)越多時到達公交站的車輛數(shù)越多,站點的服務車數(shù)越多有關;泊位數(shù)對于類型Ⅱ的重要程度最高;在站臺設置方法中,沿人行道設置的公交站傾向?qū)儆陬愋廷?;站臺幾何形狀對類型Ⅱ和類型Ⅲ具有有較高貢獻度,相比于直線式公交站,港灣式公交站運行狀態(tài)傾向?qū)儆陬愋廷?,這是由于港灣式公交站通常設置在機動車飽和度較大的路段,對應客流量一般比較大,導致更多的公交車輛經(jīng)過[13].
在道路因素方面,有無公交專用道是重要度最高的因素,公交專用道提供的路權可以減少車輛在站點的服務時間,對類型Ⅰ和類型Ⅲ的影響最為顯著;同理,隨著車道數(shù)的減少,公交車輛進出站容易受其他車輛的影響而導致停留時間較長;位于上下游的公交站不傾向?qū)儆陬愋廷?,傾向?qū)儆陬愋廷?
在環(huán)境因素方面,是否工作日是影響站點運行狀態(tài)的主要因素,非工作日時站點運行狀態(tài)屬于類型Ⅱ的概率大,容易出現(xiàn)服務時間和服務車數(shù)少的現(xiàn)象;平峰時段車輛少,不易出現(xiàn)由于機動車和乘客流量大所導致的車輛停留時間長的現(xiàn)象,站點運行狀態(tài)不傾向?qū)儆陬愋廷瘢瑑A向?qū)儆陬愋廷?;天氣類型難以直接表征對類型Ⅱ和類型Ⅲ的影響,但對類型Ⅰ具有一定影響.
在實際情況中,公交站的運行狀態(tài)會受到多種因素的綜合影響,單一因素分析難以全面解釋站臺屬性、道路和環(huán)境因素對模型的影響,因此,有必要對不同因素間的交互作用及其對模型的影響做進一步探究.以聚類特征比較明顯的類型Ⅰ和類型Ⅲ中的不同因素組合為研究對象,圖5 和圖6 分別為站臺設置方法、有無公交專用道、天氣類型及線路數(shù)等因素組合的SHAP交互圖.
圖5 考慮(a)站臺設置方法和公交專用道與(b)天氣類型和站臺設置方法因素的類型Ⅰ公交站SHAP交互性分析Fig.5 SHAP interaction analysis of type Ⅰ considering (a)method of platform installation and bus lane and (b) weather of type and method of platform installation factors.
圖6 考慮(a)線路數(shù)和公交專用道與(b)站臺幾何形狀和公交專用道因素的類型Ⅲ公交站SHAP交互性分析Fig.6 SHAP interaction analysis of type Ⅲ considering(a) number of lines and bus lanes and (b) platform geometry and bus lanes factors.
當不考慮圖形灰度差別時,圖形SHAP 值的變化反映了主因素對預測結(jié)果的影響.由圖5(a)可見,沿人行道設置的公交站運行狀態(tài)屬于類型Ⅰ的可能性增大,這與公交車輛進出站時行人與公交車容易產(chǎn)生沖突,進而增加停留時間相關;樣本點灰度值的變化體現(xiàn)了站臺設置方法與公交專用道的交互作用,當站臺設置方法取值從0 變成1 時,灰度值低的點轉(zhuǎn)至灰度值高的點下方,即SHAP 值為正時,無公交專用道的樣本點SHAP 值更高.該結(jié)果表明沿人行道設置的站點,以及無公交專用道的站點,其運行狀態(tài)屬于類型Ⅰ的可能性更大.由圖5(b)可見,當天氣類型由晴天變成雨天時,SHAP值由負值變成正值,這與雨天時乘客的上下車時間增加,車輛由于視線干擾、路況變差等原因在進出站耗時更多有關;在SHAP 值為正值時,沿人行道設置的公交站樣本點位于沿機非隔離帶設置的公交站的樣本點上方,這與圖5(a)的結(jié)論一致.
類似地,圖6顯示了運行狀態(tài)類型Ⅲ中有無公交專用道與線路數(shù)、站臺幾何形狀的SHAP 交互圖.可見,隨著線路數(shù)變多,SHAP 值增大,當站臺幾何形狀為港灣式時,站點運行狀態(tài)屬于類型Ⅲ的概率更大;當SHAP 值 > 0 時,有公交專用道的樣本點位于無公交專用道的樣本點的上方,這是因為有公交專用道時,公交車輛駛?cè)牒婉偝龉徽緯r具有專用路權,與其他車輛沖突的影響較小,在站點內(nèi)的停留時間較短.
本研究以西安市公交車輛的GPS軌跡數(shù)據(jù)為研究對象,將平均服務時間和服務車數(shù)作為公交站運行狀態(tài)的特征變量,通過聚類融合后識別出3類公交站.考慮到樣本的不均衡性構建SMOTEENNXGBoost 預測模型,引入SHAP 值增強模型的可解釋性,進而研究站臺屬性、道路因素及環(huán)境因素對公交站運行狀態(tài)的影響,得到的主要結(jié)論如下:
1)Hopkins 統(tǒng)計值為0.908 說明站點的運行狀態(tài)特征具有可聚性,使用GMM 方法確定3 類公交站運行狀態(tài),其中,類型Ⅰ的平均服務時間最長為63.261 s;類型Ⅱ的平均服務時間和服務車數(shù)最少;類型Ⅲ的服務車數(shù)最多為125輛.
2)與XGBoost、LR、RF、GBDT 及KNN 模型相比,所構建SMOTEENN-XGBoost 模型的準確率、精確率、召回率及F1分數(shù)均為最高,可實現(xiàn)公交站運行狀態(tài)的精準預測.
3)線路數(shù)是預測模型最重要的因素,線路數(shù)的增加提高了公交站運行狀態(tài)屬于類型Ⅲ的概率;有無公交專用道對類型Ⅰ預測模型的影響最大;泊位數(shù)、站臺設置方法、站臺幾何形狀、車道數(shù)及站臺設置位置等因素對預測模型的重要度逐漸減小;天氣類型對服務時間比較長的類型Ⅰ具有一定重要度,相比于晴天,雨天時公交站運行狀態(tài)屬于類型Ⅰ的概率更大.
由于數(shù)據(jù)種類的限制,本研究內(nèi)容仍存在一定局限性,如公交車輛的站點到達與停靠行為會同時受到道路交通流、客流及發(fā)車間隔等因素影響,如何綜合各影響因素的作用是下一步研究的重點.
參考文獻 / References:
[1]祁昊,劉好德,楊宇航,等.基于全樣本大數(shù)據(jù)的公交??空緯r間規(guī)律分析[J].交通信息與安全,2020,38(6):113-121.QI Hao, LIU Haode, YANG Yuhang, et al.An analysis of time regularity of urban bus stop dwell based on full sample big data [J].Journal of Transport Information and Safety, 2020, 38(6): 113-121.(in Chinese)
[2]BIE Yiming, WANG Yunhao, ZHANG Le.Impact of carriage crowding level on bus dwell time: modelling and analysis [J].Journal of Advanced Transportation, 2020,2020: 6530530.
[3]中華人民共和國建設部,中華人民共和國國家計劃委員會.城市公共汽車和無軌電車工程項目建設標準:JB99-104-1996[S].Ministry of Construction of the People's Republic of China, State Planning Commission of the People's Republic of China.Construction standards for urban bus and trolley bus projects: JB99-104-1996 [S].(in Chinese)
[4]葉嬌.面向城市交通樞紐的多模式組合出行效用及網(wǎng)絡承載力評估[D].南京:東南大學,2020.YE Jiao.Evaluation of intermodal utility and multi-modal network capacity considering the urban transport hubs[D].Nanjing: Southeast University, 2020.(in Chinese)
[5]朱宏,謝云俠,張汝華,等.快速公交站點類別及步行吸引范圍研究[J].交通運輸研究,2015,1(4):22-29.ZHU Hong, XIE Yunxia, ZHANG Ruhua, et al.Classification and walking attractive distance of BRT stations [J].Transport Research, 2015, 1(4): 22-29.(in Chinese)
[6]馬壯林,楊興,譚曉偉,等.基于客流時間序列的城市軌道交通車站分類[J].長安大學學報自然科學版,2021,41(6):113-126.MA Zhuanglin, YANG Xing, TAN Xiaowei, et al.Classification of urban rail transit stations based on passenger flow time series [J].Journal of Chang’an University Natural Science Edition, 2021, 41(6): 113-126.(in Chinese)
[7]王學勇,邵勇,王玉石.定點停靠公交站的服務效率與??磕芰ρ芯浚跩].交通標準化,2010(11):202-205.WANG Xueyong, SHAO Yong, WANG Yushi.Service efficiency and parking capacity of pointing parking bus stop [J].Transport Standardization, 2010 (11): 202-205.(in Chinese)
[8]卞張蕾.基于車輛GPS數(shù)據(jù)的公交站運行狀態(tài)識別及通行能力研究[D].揚州:揚州大學,2021.BIAN Zhanglei.Bus-stop operating state recognition and capacity study based on bus GPS data [D].Yangzhou:Yangzhou University, 2021.(in Chinese)
[9]朱寧,馬健霄,錢思文,等.公交站點延誤估算方法研究[J].森林工程,2021,37(1):87-94.ZHU Ning, MA Jianxiao, QIAN Siwen, et al.Research on delay estimation methods for bus station [J].Forest Engineering, 2021, 37(1): 87-94.(in Chinese)
[10]TAN Jiyuan, LI Zhiheng, LI Li, et al.Berth assignment planning for multi-line bus stops [J].Journal of Advanced Transportation, 2014, 48(7): 750-765.
[11]BIAN Bomin, ZHU Ning, LING Shuai, et al.Bus service time estimation model for a curbside bus stop [J].Transportation Research Part C: Emerging Technologies, 2015,57: 103-121.
[12]柳伍生,潘自翔,周騫,等.基于運行特性的港灣式公交站延誤時間研究[J].交通運輸系統(tǒng)工程與信息,2020,20(4):150-157.LIU Wusheng, PAN Zixiang, ZHOU Qian, et al.Delay time model of pull-out bus stops considering bus operational characteristics [J].Journal of Transportation Systems Engineering and Information Technology, 2020,20(4): 150-157.(in Chinese)
[13]張夢潔.基于生存分析的公交停靠耗費時間影響因素研究[D].成都:西南交通大學,2019.ZHANG Mengjie.Research on the influencing factors of the time-consuming of bus stop based on survival analysis[D].Chengdu: Southwest Jiaotong University, 2019.(in Chinese)
[14]羅妍,王樅,葉文玲.基于XGBoost 和SHAP 的急性腎損傷可解釋預測模型[J].電子與信息學報,2022,44(1):27-38.LUO Yan, WANG Cong, YE Wenling.An interpretable prediction model for acute kidney injury based on XGBoost and SHAP [J].Journal of Electronics &Information Technology, 2022, 44(1): 27-38.(in Chinese)
[15]呂能超,彭凌楓,吳超仲,等.區(qū)分沖突類型的路段實時碰撞風險預測模型[J].中國公路學報,2022,35(1):93-108.Lü Nengchao, PENG Lingfeng, WU Chaozhong, et al.Real-time crash-risk prediction model that distinguishes collision types [J].China Journal of Highway and Transport, 2022, 35(1): 93-108.(in Chinese)
[16]肖梅,王海明,邊浩毅,等.交叉路口公交等待時長分布及影響因素分析[J].公路交通科技,2022,39(1):96-105.XIAO Mei, WANG Haiming, BIAN Haoyi, et al.Analysis on distribution of bus waiting time at intersections and its influencing factors [J].Journal of Highway and Transportation Research and Development, 2022, 39(1): 96-105.(in Chinese)
[17]ARHIN S, NOEL E, ANDERSON M F, et al.Optimization of transit total bus stop time models [J].Journal of Traffic and Transportation Engineering (English Edition),2016, 3(2): 146-153.
[18]何玉林,黃哲學.大規(guī)模數(shù)據(jù)集聚類算法的研究進展[J].深圳大學學報理工版,2019,36(1):4-17.HE Yulin, HUANG Zhexue.A review on clustering algorithms for large-scale data sets [J].Journal of Shenzhen University Science and Engineering, 2019, 36(1): 4-17.(in Chinese)
[19]劉通,付銳,張名芳,等.融合K-means 與高斯混合模型的駕駛風格聚類研究[J].中國安全科學學報,2019,29(12):40-45.LIU Tong, FU Rui, ZHANG Mingfang, et al.Study on driving style clustering based onK-means and Gaussian mixture model [J].China Safety Science Journal, 2019, 29(12): 40-45.(in Chinese)
[20]束鹍.基于可解釋機器學習的城市道路交通事故嚴重程度預測[D].西安:長安大學,2021.SHU Kun.Analysis of factors contributing to crash severity on urban road based on explainable machine learning [D].Xi’an: Chang’an University, 2021.(in Chinese)