陳永勝
深圳高速工程顧問有限公司 交通規(guī)劃事業(yè)部, 廣東 深圳 518000
近年來,隨著社會經(jīng)濟的持續(xù)發(fā)展與城市居民生活水平的提高,機動化出行需求急劇增加,尤其是私人機動化出行迅猛增長,由此產(chǎn)生的城市交通擁堵日益嚴(yán)重。隨著人工智能、科學(xué)計算、機器學(xué)習(xí)、模式識別等數(shù)據(jù)挖掘技術(shù)的成熟,探索交通大數(shù)據(jù)與城市交通治理的前沿趨勢,深層次挖掘城市交通擁堵問題,并提出相關(guān)改進舉措,已成為智慧交通研究的重要課題。
為提高交通運營效率和路網(wǎng)通行能力,文獻[1]從交通實時數(shù)據(jù)采集、整合、分析、應(yīng)用4個層次開展研究,提出基于物聯(lián)網(wǎng)和大數(shù)據(jù)融合技術(shù)的城市交通狀況分析方法。文獻[2]以浮動車數(shù)據(jù)可視化分析路網(wǎng)交通空間分布特征,采用空間聚類法實現(xiàn)了城市交通擁堵狀況的識別與分類。文獻[3]結(jié)合車輛全球定位系統(tǒng)(global positioning system,GPS)軌跡數(shù)據(jù),運用數(shù)據(jù)挖掘理論,提出一種道路網(wǎng)交通狀態(tài)時空特征分析技術(shù),以提升城市交通規(guī)劃與管理決策的支持水平。文獻[4]利用圖像處理技術(shù)對監(jiān)控視頻進一步處理,實時檢測城市交通擁堵狀況,為交通決策提供理論依據(jù)。文獻[5]建立基于北京、上海、廣州、深圳交通運行數(shù)據(jù)的聚類分析數(shù)學(xué)模型,研究不同城市間交通擁堵狀況及緩堵政策的異同性。文獻[6]基于應(yīng)用程序編程接口(application programming interface, API)規(guī)劃路徑數(shù)據(jù)與地理信息系統(tǒng)(geographic information system,GIS)可視化技術(shù),對比分析我國重點城市步行、小汽車、公交車3種出行方式的可達性特征,提出強化公交優(yōu)先相關(guān)建議。文獻[7]以道路平均行程時間及速度作為評價指標(biāo),建立評價模型對城市路網(wǎng)交通狀況進行評價。文獻[8]運用數(shù)據(jù)挖掘算法,搭建Three-phase框架,對多個路段之間的擁堵狀況進行關(guān)聯(lián)分析。文獻[9]采集我國11個城市的交通狀態(tài)和交通基礎(chǔ)設(shè)施信息數(shù)據(jù),構(gòu)建聚類與相關(guān)性分析組合模型,研究城市交通擁堵的原因。文獻[10]利用模糊理論對城市交通運行狀態(tài)進行評價分析,并將評價結(jié)果用于關(guān)聯(lián)規(guī)則挖掘中,研究出行潛在規(guī)律,為交通規(guī)劃決策提供技術(shù)支撐。
目前多數(shù)研究側(cè)重于城市交通擁堵成因分析方面,采用多種數(shù)據(jù)挖掘方法挖掘交通運行相關(guān)數(shù)據(jù),但在對客觀指標(biāo)進行深度挖掘、研究交通擁堵影響因素方面稍顯不足。另外,對城市交通基礎(chǔ)設(shè)施、國民經(jīng)濟與社會發(fā)展對交通擁堵狀況的實際影響規(guī)律缺乏總結(jié)。為此,本文選取全國36個重點城市作為研究對象,構(gòu)建城市交通狀況分析指標(biāo)體系,運用聚類理論劃分城市交通擁堵等級,通過灰色系統(tǒng)理論分析城市擁堵與交通基礎(chǔ)設(shè)施建設(shè)、國民經(jīng)濟與社會發(fā)展水平之間的內(nèi)在關(guān)聯(lián),研究城市擁堵成因,探索相應(yīng)的城市交通發(fā)展對策與思路。
城市交通狀況受城市國民經(jīng)濟水平、人口與崗位、機動車擁有量、交通設(shè)施建設(shè)等眾多因素影響,且各個因素與城市交通狀況之間存在相互獨立、相互影響的關(guān)系。本文基于對指標(biāo)體系的綜合性、適量性和針對性考慮,參考文獻[11-14]以及不同城市統(tǒng)計年鑒,構(gòu)建包括交通擁堵狀況、交通基礎(chǔ)設(shè)施、城市國民經(jīng)濟與社會發(fā)展的城市交通狀況分析指標(biāo)體系,如圖1所示。其中,交通擁堵狀況指標(biāo)用于城市擁堵聚類分析,聚類結(jié)果與其他指標(biāo)應(yīng)用于城市交通狀況的關(guān)聯(lián)性分析。
圖1 城市交通狀況分析指標(biāo)體系
文獻[11]基于城市交通擁堵時空特征考慮,以B0~B5指標(biāo)構(gòu)建城市交通擁堵綜合評價指標(biāo)體系,并結(jié)合百度地圖海量交通出行數(shù)據(jù)、車輛GPS軌跡數(shù)據(jù)、位置定位數(shù)據(jù)等,計算全國100個城市的B0~B5。本文以此為基礎(chǔ)數(shù)據(jù),進行標(biāo)準(zhǔn)化處理,得出研究城市交通擁堵狀況的數(shù)據(jù)集。
K-Means聚類分析具有原理簡明、收斂快速、聚類效果較優(yōu)等優(yōu)勢,本文運用K-Means聚類法對交通擁堵狀況數(shù)據(jù)集進行聚類。該方法的基本思想為:把所有觀測值劃分為K類,使每類中的觀測值距離該類的中心(即類均值)較其余類的中心更近,且類和類之間盡可能的遠離。具體為:1)從所有觀測值中任選K個作為類中心;2)分別計算其余每個觀測值與每個類中心的距離,距哪個類中心最近,則該觀測值劃分至該類中心所屬的集合,共組成K類;3)重新計算每類中觀測值之間的平均值,作為新類中心;4)重新劃分每個觀測值到離它最近的類;5)重復(fù)步驟3)、4),直到所有的類中心不再改變。
K-Means聚類中常用的距離度量指標(biāo)為歐幾里得距離的平方
式中:xi、yi為不同樣本x、y的N維數(shù)值(N為特征數(shù)量)。
確定數(shù)據(jù)集的最佳聚類數(shù)目K,常用的測定方法為手肘法,該方法度量指標(biāo)為類間誤差平方和SSSE,指每次聚類完成后,所有觀測值到其所屬類中心的距離平方和,即
式中:Ci為第i個類集合,p為Ci中的觀測點,mi為Ci的中心。
隨著K的增大,數(shù)據(jù)集劃分更加精細(xì),SSSE逐漸變小,直到最后趨于穩(wěn)定,同樣聚類程度回報也隨之減小。K-SSSE曲線變化過程存在拐點(亦稱“肘”點),SSSE下降突然變緩時,此時的K為最佳值,大于該值時無法帶來更多的聚類程度回報。
圖2 K-Means聚類的SSSE
以36座城市交通擁堵狀況數(shù)據(jù)為分析數(shù)據(jù)集,利用Python程序計算不同K對應(yīng)的SSSE,繪制K-SSSE曲線,如圖2所示。由圖2可知,K=3,即分析數(shù)據(jù)集劃分為3類較為合適。
隨機選擇3個城市的觀測值為初始類中心,觀測值為由指標(biāo)B0~B5組成的6維數(shù)值。其他城市根據(jù)其觀測值與各個類中心的距離遠近,分別分配給距離最近的類中心,共組成3類。然后計算現(xiàn)有每個類中觀測值的平均值,生成新的類中心,所有城市根據(jù)與新的類中心距離重新劃分為3類。這個過程不斷重復(fù),多次迭代至滿足終止條件,輸出聚類結(jié)果。
為了在二維平面中觀察聚類結(jié)果,運用主成分分析法,將指標(biāo)B0~B5數(shù)據(jù)空間進行降維,重新生成2項綜合指標(biāo)來代替B0~B5。綜合指標(biāo)1、2累計貢獻率約95.42%,可以認(rèn)為綜合反映了交通擁堵狀況。交通擁堵狀況K-Means聚類結(jié)果如圖3所示。圖3中圓圈表示每類城市的類中心,虛線圈表示同類城市。
圖3 交通擁堵狀況 K-Means聚類結(jié)果
圖4 城市交通擁堵六維特征
根據(jù)圖3及36座城市的B0~B5指標(biāo),將城市交通狀況劃分為嚴(yán)重?fù)矶?、較為擁堵、交通順暢3個等級,其中嚴(yán)重?fù)矶碌某鞘邪ū本?、重慶、哈爾濱3個城市;較為擁堵的城市包括貴陽、呼和浩特、長沙等9個城市;交通順暢的城市包括昆明、廈門、福州等24個城市。聚類結(jié)果與文獻[7]的分析結(jié)論基本一致。哈爾濱、北京、重慶B0~B5指標(biāo)標(biāo)準(zhǔn)化后的數(shù)值如圖4所示。由圖4可知:哈爾濱6項指標(biāo)均較高,位列擁堵榜單首位;北京、重慶擁堵均呈現(xiàn)高峰擁堵嚴(yán)重、持續(xù)時間長、空間蔓延廣、區(qū)域間不均衡嚴(yán)重、常發(fā)性路段占比高等特點,分別居擁堵榜單第二、第三位。
對嚴(yán)重?fù)矶鲁鞘匈x值為0,較為擁堵城市賦值為1,交通順暢城市賦值為2,對城市交通擁堵狀況A0與交通基礎(chǔ)設(shè)施建設(shè)A1、國民經(jīng)濟與社會發(fā)展水平A2間的關(guān)聯(lián)性進行分析。
參考文獻[11-14],收集整理城市交通基礎(chǔ)設(shè)施、國民經(jīng)濟與社會發(fā)展指標(biāo)數(shù)據(jù),進行均值化處理,得出關(guān)聯(lián)性分析數(shù)據(jù)集,如表1所示。
表1 關(guān)聯(lián)性分析數(shù)據(jù)集
表1(續(xù))
灰色關(guān)聯(lián)分析是灰色理論中衡量關(guān)聯(lián)程度的一種方法,可將影響因素之間不明確的關(guān)系進行白化,對數(shù)據(jù)不精準(zhǔn)、不完整的樣本系統(tǒng)有顯著的理論研究優(yōu)勢。交通擁堵狀況與交通基礎(chǔ)設(shè)施、國民經(jīng)濟與社會發(fā)展指標(biāo)之間的內(nèi)在聯(lián)系難以準(zhǔn)確量化,且各因素自身的發(fā)展?fàn)顩r比較模糊,所以運用灰色關(guān)聯(lián)分析對影響城市交通狀況的各個指標(biāo)進行排序,探索影響城市擁堵的主導(dǎo)因素。
1)確定參考序列矩陣和比較序列矩陣
參考序列矩陣一般采用評價指標(biāo)的最優(yōu)值或最劣值,也可根據(jù)評價目的確定其他參照值。設(shè)評價指標(biāo)為n個,每個指標(biāo)有m個觀測值,建立比較序列矩陣。分別表述為:
2)無量綱化數(shù)據(jù)集
由于各個評價指標(biāo)的本質(zhì)不同,造成指標(biāo)數(shù)值的量綱不盡相同,不能直接進行比較,所以在做關(guān)聯(lián)度分析之前,常采用均值化法、初始值法等無量綱化方法進行數(shù)據(jù)處理。無量綱化后的參考序列矩陣與比較序列矩陣為:
(1)
(2)
3)計算每個比較序列矩陣與參考序列矩陣對應(yīng)元素的絕對差值
絕對差值矩陣
(3)
第t個評價指標(biāo)第k個觀測值與參考序列矩陣對應(yīng)元素的絕對差值
Δt(k)=|x0(k)-xt(k)|,
(4)
4)確定最大、最小絕對差值
5)計算關(guān)聯(lián)因數(shù)
(5)
6)計算關(guān)聯(lián)度
針對各個比較序列矩陣分別計算參考序列矩陣對應(yīng)元素的關(guān)聯(lián)系數(shù)均值,即灰色關(guān)聯(lián)度
(6)
若各個指標(biāo)在綜合評價中所起的作用不同,可對關(guān)聯(lián)系數(shù)求加權(quán)平均值,即灰色加權(quán)關(guān)聯(lián)度
(7)
式中Wk為評價指標(biāo)的權(quán)重矩陣。
7)建立關(guān)聯(lián)度矩陣進行優(yōu)勢分析
選擇36個城市評價指標(biāo)體系中的某一項指標(biāo),以其觀測值建立參考序列矩陣,以其他指標(biāo)觀測值建立比較序列矩陣,運用式(1)~(7),分別計算該指標(biāo)與其他指標(biāo)之間的關(guān)聯(lián)度。同理依次確定參考序列矩陣與比較序列矩陣,計算各個指標(biāo)之間的關(guān)聯(lián)度,以參考序列指標(biāo)為橫軸,比較序列指標(biāo)為縱軸,建立關(guān)聯(lián)度矩陣。再根據(jù)指標(biāo)關(guān)聯(lián)度大小,依次排序,得出較為重要的影響因素,進行相關(guān)評價。
以36個城市交通擁堵狀況指標(biāo)A0觀測數(shù)據(jù)構(gòu)建參考序列矩陣,以交通基礎(chǔ)設(shè)施指標(biāo)B6~B14、國民經(jīng)濟與社會發(fā)展指標(biāo)B15~B18觀測數(shù)據(jù)構(gòu)建比較序列矩陣,分別計算A0與B6~B14、B15~B18的關(guān)聯(lián)度。同理在城市交通狀況分析指標(biāo)體系中,將B6~B14、B15~B18依次作為參考序列指標(biāo),分別計算與其他指標(biāo)的關(guān)聯(lián)度,建立關(guān)聯(lián)度矩陣。為了觀察各類指標(biāo)間的關(guān)聯(lián)性,使用熱力圖來描述關(guān)聯(lián)度矩陣,如圖5所示。
由圖5可得:城市交通擁堵狀況影響因素的關(guān)聯(lián)序為:B18>B6>B14>B7>B17>B15>B16>B13>B12>B9>B8>B10>B11,說明每千人民用汽車擁有量、建成區(qū)道路密度為影響交通擁堵的主導(dǎo)因素,每萬人公共汽車擁有量以及建成區(qū)人均道路面積為主要間接影響因素。
圖5 關(guān)聯(lián)度矩陣熱力圖
因此在今后的城市綜合交通改善過程中,北京、重慶等汽車總量較多,應(yīng)采取行政、經(jīng)濟、市場綜合調(diào)控,引導(dǎo)和限制私人小汽車的過快增長;哈爾濱、長春、呼和浩特等路網(wǎng)密度較低的城市可引入“窄馬路模式”等道路布局新理念,盡快完善完整道路網(wǎng)系統(tǒng),逐步緩解交通擁堵問題。
指標(biāo)B6~B14表示交通基礎(chǔ)設(shè)施建設(shè)情況,內(nèi)部沒有直接聯(lián)系,僅考慮其與國民經(jīng)濟與社會發(fā)展指標(biāo)之間的內(nèi)在關(guān)聯(lián)性,結(jié)合圖5綜合考慮可知:影響交通運輸網(wǎng)絡(luò)密度指標(biāo)B6、B11和B13的主導(dǎo)因素為B18、B16、B17,說明城市汽車、人口與就業(yè)崗位數(shù)量可間接影響城市交通基礎(chǔ)設(shè)施建設(shè)。
根據(jù)城市交通實際情況,構(gòu)建交通狀況分析指標(biāo)體系,提出基于K-Means聚類與灰色關(guān)聯(lián)的集成方法,研究導(dǎo)致城市擁堵的關(guān)鍵因素,提出相應(yīng)的交通改善措施,為交通發(fā)展政策的制定提供參考。
本文提出的方法仍有待改進,例如:交通狀況分析指標(biāo)體系應(yīng)考慮城市規(guī)模、形態(tài)、區(qū)位、面積等因素,對相近城市之間進行關(guān)聯(lián)分析;此外,灰色關(guān)聯(lián)分析為定量、定性相結(jié)合的灰色理論方法,以后可采用專家評估法進一步明確其分辨系數(shù)。