仇建華 楊興園 張亞岐 李創(chuàng)
摘 ? 要:針對軌道交通客流量的不確定性,采用考慮先驗知識的獨立成分分析法對軌道交通客流量進行預測。首先將采集部分時段同一線路上各個站點客流量數(shù)據(jù)作為先驗樣本,獲得相應的概率密度;其次通過獨立成分分析得各個站點客流量獨立源數(shù)據(jù),利用獨立源數(shù)據(jù)構(gòu)建基于相關向量機預測模型;最后通過增加擾動量來對模型進行評價。結(jié)果表明:未考慮先驗知識的預測模型對相對較小的擾動量不敏感,且對較大擾動量響應的穩(wěn)定性差;而考慮先驗知識的預測模型有很好的敏感度和穩(wěn)定性。
關鍵詞:軌道交通;先驗知識;預測;獨立成分分析;擾動量
中圖分類號:U121 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A
Application of ICA in Prediction of Rail Traffic Passenger
Flow Volume Considering Prior Knowledge
QIU Jian-hua1,YANG Xing-yuan2,ZHANG Ya-qi2?覮,LI Chuang3
(1.Xi'an Aeronautical University,Xi'an,Shaanxi 710077,China;
2.Dongfeng Motor Corporation Technical Center,Wuhan,Hubei 430058,China;
3.Dongfeng Honda Automobile Limited Liability Company,Wuhan,Hubei 430056,China)
Abstract: In view of the uncertainty of rail traffic flow ,this paper adopted the independent component analysis considering prior knowledge to predict passenger flow volume of rail traffic. Firstly ,the passenger flow datas of all stations in the same line were collected and the datas were as the prior samples. Then the corresponding probability density was obtained. Secondly,the independent source datas of all stations can be achieved through independent component analysis.And the independent source datas were used to construct prediction model based on correlation vector machine. Finally,the model was evaluated by increasing the disturbance quantity and results show that the prediction model considering the prior knowledge is not sensitive to relatively small disturbance quantity,and its stability of the response of large disturbance quantity is poor. The prediction model considering the prior knowledge has good sensitivity and stability.
Key word: rail traffic;prior knowledge;predictiton; independent component analysis;disturbance quantity
城市軌道交通客流量預測是很有必要的。一方面,軌道交通作為城市旅客運輸?shù)闹饕d體,其運量大、客流集中、人員進出頻繁,且空間相對封閉狹小,一旦造成擁擠可能波及整個交通網(wǎng)絡。因此準確預測客流量、提前做好響應機制,對交通擁擠具有一定的遏制作用[1-6];另一方面,智能交通運輸系統(tǒng)是未來交通運輸發(fā)展的主要方向,軌道交通作為智能運輸系統(tǒng)的先行者,其運行的可靠性受客流量預測的影響較大。近年來,各國學者從多個維度開展交通客流預測的研究,孫琦峰等人采用改進BP網(wǎng)絡對公路旅游客流量進行預測,并對幾種預測方法進行了對比,并用試驗證明了改進的BP網(wǎng)絡模型對公路旅游客流量預測的合理性與可行性。Tsung-Hsien Tsai利用臨時的檢索模型對鐵路旅客的道道時間進行預測,并對模型進行了驗證。Yujuan Sun采用非參數(shù)回歸模型對地鐵換乘站客流量進行預測。隨著科技水平的不斷提高,相繼產(chǎn)生了多個行之有效的分析預測模型,如卡爾曼預測模型、支持向量機、神經(jīng)網(wǎng)絡模型以及貝葉斯濾波器等,由于卡爾曼觀測器對于強非線性模型并不適用,且支持向量機[7-8]隨著樣車數(shù)增加,其計算成本迅速增加,而神經(jīng)網(wǎng)絡模型需大量樣本訓練,容易出現(xiàn)過學習或欠學習,影響預測精度。進而出現(xiàn)了基于貝葉斯稀疏特性的相關向量機(RVM),RVM[9]對樣本數(shù)敏感度不高,適用于解決大樣本問題。軌道交通是一個相對封閉網(wǎng)絡,各個站點、各條軌道交通線路之間相互影響,乘客可以從某一站點上車,通過換乘可以在任意站點下車,因此,在各個站點設置觀測點,將單一線路各個觀測點當做一個整體來考慮,依據(jù)獨立成分分析以及相關向量機對軌道交通客流進行預測。從各個觀測點處得到獨立源的混合數(shù)據(jù),運用部分先驗數(shù)據(jù)構(gòu)建各個獨立源概率密度,通過獨立成分分析解析出各獨立源信號和混合矩陣,采用相關向量機對各個獨立信號進行預測,并經(jīng)過混合矩陣的逆變換得到客流量的預測值,并采用擾動量對模型的敏感度和穩(wěn)定性進行評價。
1 ? 獨立成分分析
假設有n個獨立信號源s(s1,s2,…,sn)T,通過 p個觀測點進行m次采樣得到s信號的混合疊加信號x,x{x(i) (x(i)1,x(i)2,…,x(i)n);i = 1,…,m},s與x存在如下關系:
x = As ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
其中x不是單一向量,是n×m的矩陣,其中每一列向量x(i) ,x(i) ?= As(i) 。式(1)中A和s是待求變量,求解過程也被稱為盲源信號分離。由于獨立成分分
析[10-13](Independent Component Analysis,ICA)在沒有先驗信息的情況下,無法得到唯一確定解[14-15],因此,考慮信號先驗信息可得到源信號的唯一解。
假定每個信號源si的概率密度為ps,根據(jù)聯(lián)合分布以及各信源的獨立性可得:
p(s) = ∏ni=1ps(si) ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
p(x) = ps(Wx)W=W∏ni=1ps(wTix) ? ?(3)
式(3)左邊是每個采樣信號x(n維向量)的概率,等式右邊是每個信源信號概率乘積的W倍。在沒有先驗知識的情況下,ps(si)一般選取sigmoid函數(shù)(g(s)= )或其他分布函數(shù),ps(si)隨機選取對分析結(jié)果有一定影響,為此,本文考慮信源信號的先驗知識,即根據(jù)部分樣本利用最大似然估計得到 ps(si)函數(shù)。對于給定樣本{x(i) (x(i)1,x(i)2,…,x(i)n);i = 1,…,m},通過樣本對數(shù)似然估計可以得到 估計值,
λ(W) = ? log g′(wTjx(i) ) + logW ? (4)
2 ? 相關向量機
相關向量機跟支持向量機相類似,也是將低維非線性不可分問題通過核函數(shù)轉(zhuǎn)化為高維線性可分,在支持向量機基礎上引入貝葉斯理論[16],通過后驗概率的最大化得出相關向量的權(quán)重,通過預設權(quán)重閾值確定最終的相關向量數(shù)量。于給定的樣本數(shù)據(jù){tn,xn},RVM定義為:
y(x;w) = ?wi K(X,Xi) + w0 ? (5)
上式中:wi為第i個樣本權(quán)重; K(X,Xi)為核函數(shù);N為樣本總數(shù)。對于tn = y(xn,w) + ξn,假定ξn服從高斯分布(0,σ2),
P(ti|xi,W,σ2)~N(0,σ2)
=(2πσ2)-0.5exp- (ti - yi)2
=(2πσ2)-0.5exp- (ti - WT?準(x))2(6)
同時訓練N個點,則向量t代表了所有獨立的訓練點ti,然后構(gòu)造一個N × M維的矩陣,其中第 i行表示向量?準(xi),
P(t|xi,W,σ2)= N(WT?準(x),σ2)
= (2πσ2)-0.5exp- (ti - WT?準(x))2
=(2πσ2)-0.5exp- ‖t - ΦW‖22 ?(7)
整個樣本的似然函數(shù)可以表示出來,其中w與σ2是兩個參數(shù),可用最大似然估計來計算,一般的數(shù)值計算中w元素大都不為0,不為0的元素確定為相關向量,會出現(xiàn)過學習的情況,為避免過學習的情況,RVM中引入了先決條件,認為w服從正太分布:
P(wi|αi) = N(wi|0,σ2i) ? ?(8)
通過式(7)將w的求解轉(zhuǎn)化為α的求解,當α趨于無窮大時,w趨于0。相關向量機預測的基本流程如圖1所示,
3 ? 基于ICA-RVM軌道交通客流量預測
ICA-RVM預測模型基本流程如圖2所示。
首先將各個觀測點得到客流數(shù)據(jù)作為混合信號,經(jīng)過ICA得到獨立信號和相應的混合矩陣A;通過各個觀測點的先驗樣本得到獨立信號的概率密度函數(shù);利用RVM對各個獨立信號進行預測,根據(jù)各個獨立信號預測值以及混合矩陣A得到相應的客流量預測值。
試驗中選取重慶某條地鐵線當天的客流量數(shù)據(jù)進行分析。若出現(xiàn)2個及2個以上站點客流量很少時,獨立成分分析會將相應的數(shù)據(jù)不作為獨立成分,即表現(xiàn)形式就是:在這些觀測點觀測到的客流量數(shù)據(jù)基本保持一致。因此,對于客流量極少的多個站點只設置一個觀測點。圖3是某個站點的客流量數(shù)據(jù),每隔15分鐘統(tǒng)計一次客流量,
由于關系式(9)為客流量概率密度,ps(s)值在(0,1)以內(nèi),因此系數(shù)的數(shù)值相對較小。用同樣的方法可以得到其他獨立信號的概率密度,結(jié)合獲取到的獨立信號概率密度進行獨立成分分析,得到混合矩陣A(其中采樣100次,觀測點25個)和相應的獨立信號。采樣RVM對各個獨立信號分別進行預測,再通過混合矩陣得到客流量的預測值。
圖4表明:考慮先驗知識的預測模型具有更高的準確率。以9點半為例,該時刻實際數(shù)據(jù)是處于波谷的,先驗預測結(jié)果與實際結(jié)果存在一定偏離,但有先驗知識的模型比無先驗知識模型的預測結(jié)果更為準確,從圖4中可以看出。由于先驗知識來源于原有客流量的統(tǒng)計結(jié)果,受前期統(tǒng)計數(shù)據(jù)的影響,模型對某個時間點的客流預測出現(xiàn)偏離是無法避免,只能盡可能的縮小二者差距。其實預測大客流能夠為管理者提供決策依據(jù),因此,對突發(fā)客流的預測意義更大。為了測試模型的穩(wěn)定性,對觀測