湯旻安,王攀琦
(1.蘭州交通大學(xué) 自動化與電氣工程學(xué)院, 甘肅 蘭州 730070;2.蘭州理工大學(xué) 機電工程學(xué)院,蘭州 730050)
城市化與機動化發(fā)展水平的提高,對整個交通運輸?shù)母窬之a(chǎn)生了根本性的改造。然而,城市交通供求矛盾的情況也日漸凸顯,道路交通擁堵情況逐漸加劇。道路擁堵帶來了交通管理矛盾突出、環(huán)境污染、能源消耗顯著以及應(yīng)對突發(fā)事件的響應(yīng)時間延長等城市綜合問題。
蘭州市屬于典型的河谷地形,這種地形條件下城市交通路網(wǎng)的形成受到嚴重的制約。整個市區(qū)呈一字型分布,城區(qū)的劃分也根據(jù)這一地形進行功能分區(qū)。黃河穿過城市中心,將市區(qū)分為南北兩個部分,東西方向的主干道承載了蘭州市交通的大部分客流,而南北方向則不夠通達,其交通狀況整體表現(xiàn)為東西交通量大,南北閉塞的局面。除了兩山夾黃河的天然屏障,近年來機動車的增加也是一個不容忽視的影響因素。除了上述這些原因,鐵路對蘭州市路網(wǎng)的二次分割加劇了交通擁堵現(xiàn)狀[1-2]。
圖1 蘭州市地形圖Fig.1 Lanzhou topographic map
城市交通擁堵問題是一個復(fù)雜的系統(tǒng)性問題,對其進行研究具有巨大的現(xiàn)實意義[3]。本文挖掘蘭州市交通評價體系中交通的參數(shù),利用因子分析法(FA)和聚類分析對蘭州市交通擁堵狀況進行評價。首先,利用因子分析方法對交通量各參數(shù)提取公共因子,其次,利用聚類分析發(fā)掘各路口的相關(guān)性。除此之外,利用主成分分析法在保證數(shù)據(jù)完整性的條件下對各項參數(shù)降維,將其數(shù)據(jù)分析結(jié)果與因子分析的數(shù)據(jù)處理結(jié)果進行對比,進行綜合分析驗證。Wen等人指出,緩解交通擁堵的基本原則是科學(xué)定量地描述交通擁堵[4]。本研究通過綜合運用因子分析和聚類分析進行理論探索和實證分析,對蘭州市交通擁堵狀況作出了合理的評價,將為地方政府的交通管理提供科學(xué)的決策方法。
因子分析是一種多元統(tǒng)計分析技術(shù),在解決多變量問題時,具有顯著的優(yōu)點,其主要思想是將原始的變量進行分組,得到每組變量的相關(guān)性,從新得到的n組變量中提取出新的公共因子,可以同時處理許多因素相互影響的復(fù)雜體系[5]。正是這些特性,使得它在特征提取、數(shù)據(jù)壓縮方面都有著廣泛的應(yīng)用。造成交通擁堵影響的因素有很多,用因子分析對各個因素的數(shù)據(jù)進行規(guī)格化處理,發(fā)掘造成蘭州市交通擁堵的潛在因素。
設(shè)對蘭州交通有影響的因素數(shù)目為N,選取路口數(shù)目為M,則原始數(shù)據(jù)矩陣為
(1)
xij為第i個路口第j個指標的觀察數(shù)據(jù),i=1,2,…,M;j=1,2,…,N。
因子分析中每一個變量用新公共因子的線性函數(shù)與特殊因子之和表示,公式為
Xi=ai1F1+ai2F2+…+aimFm+εi,
(i=1,2,…,p)
(2)
其中,F1,F2,…,F(xiàn)m為求取的新的公共因子,εi為特殊因子。
此模型用矩陣表示為
X=AF+ε。
其中,
(3)
矩陣A稱為因子載荷矩陣,aij稱為因子載荷。
因子分析的計算從協(xié)方差矩陣入手,可以證明,經(jīng)過標準化處理后的數(shù)據(jù)的協(xié)方差矩陣就是X的相關(guān)系數(shù)矩陣。因此,可以直接利用上文主成分分析得到的相關(guān)系數(shù)矩陣進行分析。
求解因子載荷陣的具體方法如下:
1)計算標準化處理后的數(shù)據(jù)的相關(guān)系數(shù)矩陣,并通過相關(guān)顯著性檢驗方法檢測因子分析法對所取樣本數(shù)據(jù)的適用性。
2)計算相關(guān)系數(shù)矩陣的特征根及其對應(yīng)的特征向量,根據(jù)特征值的大小(一般取大于1的特征值)和累積方差貢獻率(累積貢獻率達80%以上)來確定因子個數(shù)。
3)利用相關(guān)系數(shù)矩陣的特征根和特征向量計算因子載荷矩陣,
(4)
因子分析法的目的是為了減少變量個數(shù),實現(xiàn)降維,因此,得到的公因子數(shù)目是小于變量數(shù)目p的。
由因子載荷矩陣可知,因子載荷矩陣第j列元素的平方和
(5)
又因為第j列元素的平方和為
(6)
所以有λj=gj2,各個因子的方差貢獻gj2即是其對應(yīng)的各第j個特征根。
確定要提取的因子即是選取方差貢獻大于1的因子,也可以利用累積方差貢獻率來確定要提取的因子的個數(shù)m。
4)計算因子得分系數(shù)[6-7]。
聚類分析用來分析衡量同類樣本的類似性,即將高維空間數(shù)分布的結(jié)構(gòu)特征用二維圖像顯示,利用對二維圖像的識別能力考察高維空間數(shù)據(jù)分布結(jié)構(gòu)的特征。利用這一特性,從各路口的歷史數(shù)據(jù)中獲得路口間交通流量的相似性和相關(guān)性,找出各路口間的相互關(guān)系[8]。對高維數(shù)據(jù)點Xi(xi1,xi2,…,xim),其二維顯示的對應(yīng)點為Yi(yi1,yi2),則yi1,yi2應(yīng)是xi1,xi2,…,xim的某種函數(shù)。這里采用非線性映射方法(NLM)得到二維圖像。根據(jù)NLM方法,多維空間中的點經(jīng)過投影后,點與點之間的距離必然會產(chǎn)生誤差。
在m維空間,矢量Xi和Xj的距離為
(7)
在二維空間中,矢量Yi和Yj的距離為
dij=dis(Yi,Yj)。
(8)
映射時的誤差函數(shù)為
(9)
交通擁堵的原因是多方面的,從不同的角度都可以對其進行評價。道路交通擁堵評價指標可分為交叉口指標、路段指標、區(qū)域指標,城市交叉口作為路網(wǎng)的節(jié)點和交通的咽喉,對于一個城市交通狀況的評估和改善有著重要的意義,本文選擇交叉口指標來進行研究[11]。
交通量不是一個靜止量,隨時處于變動之中,但其變化具有統(tǒng)計規(guī)律性。在調(diào)查時,每個路口的4個方向都要設(shè)置調(diào)查組。調(diào)查時為了使數(shù)據(jù)更有說服力,需要對相對擁堵的多個路口都進行測量統(tǒng)計,最終再從其中幾個路口進行研究分析。
為了對蘭州市交通擁堵的主要原因進行分析,選取了8個交叉路口及其交通量參數(shù):機動車量、非機動車量、引道延誤、車速、路段均速、效率指數(shù)、飽和度等。車速是衡量道路通行能力的重要參數(shù)。車輛在區(qū)段行駛時,往往受到各種因素的影響,如道路線形、車行道寬度、路面狀況、車輛性能、??空疚恢谩⒔徊婵诮煌顩r及氣候條件等。
在交通量的測量中,需要將不同類型車輛換算成標準車輛,然后進行匯總,換算系數(shù)如表1所示。
獲取數(shù)據(jù)時,由于觀測或者記錄的原因,可能會導(dǎo)致有些數(shù)據(jù)明顯不合理,在實際分析中要淘汰這些數(shù)據(jù)。在分析中如果出現(xiàn)了參數(shù)未按要求記錄、延誤時間為負、明顯地超過了合理范圍等情況就認為數(shù)據(jù)失效。因此,必須對無效數(shù)據(jù)進行剔除。
除此之外,在實際的提取數(shù)據(jù)的過程中,不可避免地會存在設(shè)備故障、操作失誤而造成的個別數(shù)據(jù)丟失。這時需要對丟失的數(shù)據(jù)進行彌補,常用的技術(shù)就是均值彌補,即用集中變量的均值來代替丟失的數(shù)據(jù)。還可能有個別數(shù)據(jù)離群較遠,或者叫作異常值、極端值,一般情況下,這種數(shù)據(jù)應(yīng)直接舍去。
從蘭州市主要的擁堵路口路段中選取一些具有代表性的路口進行分析。通過實地檢測,選取8個路口,得到各交通流信息如表2所示。
表1 標準車換算系數(shù)Tab.1 Conversion coefficient of standard vehicle
數(shù)據(jù)來源:蘭州市交通規(guī)劃調(diào)查報告
表2 蘭州各路口交通參數(shù)值Tab.2 Traffic parameters of each intersection in Lanzhou
數(shù)據(jù)來源:蘭州市交通規(guī)劃調(diào)查報告。
本文采用SPSS軟件進行因子模型分析[12],進行因子分析的7個指標:機動車量(B1)、非機動車量(B2)、引道延誤(B3)、車速(B4)、路段均速(B5)、效率指數(shù)(B6)、飽和度(B7)。
經(jīng)計算得到相關(guān)系數(shù)矩陣及相關(guān)顯著性檢驗如表3所示。上下兩部分分別為原始變量相關(guān)系數(shù)矩陣和相關(guān)系數(shù)顯著性檢驗的P值,從上半部分可以看出,矩陣中存在大量高值相關(guān)系數(shù),下半部分P值存在很多小于0.05的數(shù)值,上下兩部分均表明原始變量之間存在著較強的相關(guān)性。
表3 相關(guān)系數(shù)矩陣及相關(guān)顯著性檢驗Tab.3 Correlation matrix and relevant significance test
表4為特征根及方差貢獻情況。初始特征值用于選擇和確定要提取的因子,共有3項,分別為特征值、方差貢獻率、累積方差貢獻率。在表4中共有兩個因子的特征根大于1,所以應(yīng)提取兩個因子,如表5所示。從旋轉(zhuǎn)前因子方差貢獻率可以看到,提取出的兩個因子可以解釋原始變量81.383% 的信息,具有代表性。對比旋轉(zhuǎn)前后方差貢獻情況可以看出,旋轉(zhuǎn)后兩個因子的特征根和方差發(fā)生改變,但其累積方差貢獻率與旋轉(zhuǎn)前保持一致。
表4 特征根與方差貢獻Tab.4 Characteristic root and variance contribution
因子旋轉(zhuǎn)的目的在于使因子載荷簡單化,便于對測量數(shù)據(jù)點進行分組。從表5可看出,兩個因子在不同原始變量上的載荷范圍沒有明顯的差別,因此要對因子載荷進行旋轉(zhuǎn)。
表5 旋轉(zhuǎn)前因子載荷陣Tab.5 Factor load array before rotation
從表6可以看出,旋轉(zhuǎn)后載荷系數(shù)兩極差異顯著。第一公因子在指標B6(效率指數(shù))、B3(引道延誤)、B4(車速)、B5(路段均速)上有較大載荷,這表明這些指標有較強的相關(guān)性,歸為一類,從影響因素來看,這些指標主要受道路條件的制約,對于蘭州,對道路限制最大的是兩山夾一河的特殊地形,因此可以把第一公因子命名為“地形因子”。第二公因子在B1(機動車量)、B2(非機動車量)、B7(飽和度)上有較大載荷,而這3個因子都是關(guān)于交通量的指標,因此,可以將其命名為“交通量因子”。
從相關(guān)系數(shù)矩陣出發(fā)來進行因子分析,這里的B1~B7是標準化變換之后的變量。此外,因子得分是利用旋轉(zhuǎn)后的因子載荷陣得到的。根據(jù)因子分析的數(shù)學(xué)特性可以得出,得分值越大的因子,其對新因子的影響也越大[13]。從表7和圖2可以看出, 7個指標中, 3(引道延誤)、 4(車速)、 5(路段均速)、6(效率指數(shù))與地形關(guān)系較大,1(機動車量)、2(非機動車量)、7(飽和度)與交通量關(guān)系較大。
表6 旋轉(zhuǎn)后因子載荷陣Tab.6 Factor load array after rotation
表7 因子得分系數(shù)矩陣Tab.7 Component score coefficient matrix
圖2 各因子得分圖Fig.2 Score of each factor
通過圖3可以看出,各交通路口聯(lián)系的緊密程度,南關(guān)什字 (3)、中山橋 (5)、小西湖(8)的3個路口數(shù)據(jù)在二維空間的距離比較接近,說明這3個路口之間的聯(lián)系較為緊密。同樣得出,天水路什字(6)和省圖書館(7)兩路口關(guān)系較大。各路口的分類在二維平面圖上是按照一定的方向和順序鄰次排列的,自右向左,擁堵程度逐漸增加。因此,各個路口之間不是相互獨立的,反而有著一定的聯(lián)系。不同的擁堵類別,客觀地反映了地理、車流對交通狀況的影響。在對交通流進行控制和疏導(dǎo)時,對于聯(lián)系緊密程度不同的路口,應(yīng)分別考慮各路口之間的相互影響,以便實現(xiàn)合理疏導(dǎo)。
圖3 高維數(shù)據(jù)映射到二維空間的結(jié)果圖像Fig.3 High-dimensional data is mapped to the result image in two-dimensional space
PCA是一種多元統(tǒng)計分析技術(shù)。它是一種基于目標統(tǒng)計特性的正交變換方法,變換后的新分量正交或不相關(guān),同時可以反映原始變量的絕大部分信息[14]。分析結(jié)果如圖4所示。
圖4 各主成分方差的帕累托圖Fig.4 Pareto charts for variance of the principal components
通過圖4可以簡明地看出,各個新主成分的各自貢獻率及其對應(yīng)的累積貢獻率的大小,選取前3個成分:機動車量(1)、非機動車量(2)、引道延誤(3),其累積貢獻率為91.763 5%(大于85%),因而前3個主成分即可作為提取的主成分,來代表全部7個變量的大部分信息。根據(jù)前3個主成分得分,用其貢獻率加權(quán),可分別求出8個路口各自的得分[15]。
運用PCA仿真分析得到,造成蘭州市交通擁堵的主要原因包括機動車和非機動車交通量過大,混合交通流量往往會加劇交通的擁堵。由于受自行車和行人影響,機動車減速、停車等待、占用路面等問題總是導(dǎo)致道路堵塞。因此,與機動車交通流量相比, 混合交通流量加重了交通擁堵[16]。其次,引道延誤方差貢獻率也較大,而道路條件是對引道延誤的主要制約因素,說明蘭州市的特殊地形同樣是交通擁堵的巨大誘因。
綜上所述,蘭州市的道路條件,即河谷狹長地形以及車流量是導(dǎo)致蘭州市交通擁堵現(xiàn)狀的首要因素,與因子分析提取出的兩個新因子“地形”、“交通流”的結(jié)論是一致的,因此把二者視作擁堵治理的重點對象。
本文綜合運用了因子分析法和聚類分析對蘭州交通擁堵狀況進行了分析。首先,利用因子分析法建立因子分析模型,提取出不可觀測的潛在變量,分別為車量因子和地形因子。然后,利用聚類分析對8個交叉口進行分類,分析了路口之間的相關(guān)性。最后,運用主成分分析法提取主成分,與因子分析進行對比。運用PCA 法提取出了機動車量、非機動車量、引道延誤這3個新主成分。這一仿真結(jié)果證實了因子分析結(jié)果的正確性??梢宰C明,二者分析結(jié)果一致,因此,總結(jié)蘭州市交通擁堵的主要因素為蘭州市特殊的地形和混合交通量。本文的研究結(jié)果為蘭州市交通擁堵治理提供了明確的方向。此外,還可以把路段和交叉口各個交通量結(jié)合在一起同時進行因子分析,這將對蘭州市交通擁堵的緩解和治理有重要的指導(dǎo)意義。