安寶坤,周歡歡
(1.西藏大學(xué)藏文信息技術(shù)研究中心,2.西藏大學(xué)工學(xué)院,西藏 拉薩 850000)
公共交通的運行與社會福利關(guān)系緊密,尤其是公交都市.公交準(zhǔn)點能夠吸引更多的出行者選擇公共出行工具,同時對乘客的吸引力也是公交企業(yè)收益的保障[1].靜態(tài)的發(fā)車計劃表適應(yīng)于以往路網(wǎng)流量較小時的公交需求,隨著城市汽車保有量和城市人口的不斷增長,不穩(wěn)定因素的增多導(dǎo)致公交運營不準(zhǔn)點,影響著乘客的乘車感知[2-3].因此,有必要根據(jù)運行環(huán)境調(diào)整公交發(fā)車間隔及其運營速度,以穩(wěn)定公交系統(tǒng)運行狀態(tài)[4].到站時間作為公交運營調(diào)整與乘客出行誘導(dǎo)的重要參考[5],因受到交通流混沌特性[6]及其他諸多因素的影響,其預(yù)測工作較為困難,所采用的方法也趨于復(fù)雜,尤其對于運營在非公交專用道上的公交.
已有研究中,公交到站時間被劃分為多種形式.如:胡華等[7]提出的站點??繒r間、區(qū)段全程運行時間和區(qū)段部分運行時間;季彥婕等[5]提出的路段運行時間和站點??繒r間.同時,在公交到站時間預(yù)測方面,也呈現(xiàn)出輸入?yún)?shù)與預(yù)測模型的多樣性.如:馬書紅等[8]提出的公交GPS歷史數(shù)據(jù)和即時數(shù)據(jù),及模糊隸屬度預(yù)測模型;于濱等[4]提出的時間段、天氣和路段,及支持向量機模型和Kalman濾波方法;季彥婕等[5]提出的工作日和周末的公交到站數(shù)據(jù),及粒子群小波神經(jīng)網(wǎng)絡(luò);胡繼華等[9]提出的公交GPS數(shù)據(jù),及改進的馬爾科夫鏈模型;李大銘等[10]提出的公交GPS和電子收費數(shù)據(jù)等實時信息,及模糊神經(jīng)網(wǎng)絡(luò);楊敏等[11]提出的停站時間和其相關(guān)數(shù)據(jù),及差分自回歸移動平均模型和支持向量機;王旭等[12]提出的上下車人數(shù)、車內(nèi)擁擠度和車門數(shù),及回歸分析方法;王建等[13]提出的上下車人數(shù)和車內(nèi)擁擠度,及貝葉斯網(wǎng)絡(luò)組合模型;Lin等[14]提出的公交調(diào)度時間表,及歷史平均法;Meng等[15]提出的公交、乘客、社會車輛,及概率預(yù)測模型.
以上研究方法在預(yù)測結(jié)果上較為理想,但計算過程的復(fù)雜度和實際應(yīng)用效果在實際應(yīng)用中難以得到驗證[7-15].而混沌理論作為分析非線性序列的有力工具[6],已運用于諸多領(lǐng)域,并有著可觀效果.同時,未見相關(guān)文獻闡述混沌理論在公交到站預(yù)測中的應(yīng)用.為此,本文就該理論在公交到站數(shù)據(jù)中的應(yīng)用展開分析,拓寬公交到站數(shù)據(jù)的預(yù)測渠道,驗證混沌理論在公交到站預(yù)測中的適用性.
混沌理論旨在揭示隨機系統(tǒng)中可能蘊含的簡單規(guī)律及確定性系統(tǒng)中所存在的隨機現(xiàn)象,是一種逐步豐富且較為新興的工具和手段,可用于系統(tǒng)混沌狀態(tài)的識別、預(yù)測及控制等.其輸出的序列介于明顯的規(guī)律序列和完全隨機序列之間.本研究對該理論的應(yīng)用集中在研究分析對象的混沌特性以及可預(yù)測性.
混沌特性的判別?;谧畲驦yapunov指數(shù),它沿某一方向的取值體現(xiàn)著相空間中相鄰軌道間平均收斂或發(fā)散的快慢程度[16],指數(shù)為正預(yù)示著系統(tǒng)具有混沌特征,指數(shù)為0值說明系統(tǒng)中有周期現(xiàn)象,指數(shù)為負說明系統(tǒng)內(nèi)部存在不動點(以不動點為初始點,當(dāng)時間趨于無窮,系統(tǒng)軌跡點的極限仍是其本身[17])或數(shù)據(jù)輸出完全無序.本研究基于C-C法[18]、重構(gòu)相空間及小數(shù)據(jù)量法[16]等計算最大Lyapunov指數(shù).
直接分析系統(tǒng)中大量數(shù)據(jù)的規(guī)律十分困難,但可通過時間序列重構(gòu)將繁瑣的數(shù)據(jù)轉(zhuǎn)變?yōu)榈碗A形式,進而尋找其演變規(guī)律是混沌理論重構(gòu)相空間的基本思路和混沌時間序列分析的基礎(chǔ),即尋找長度為n的觀測數(shù)據(jù)固定時間延遲(τ),進而重構(gòu)“等價”的n-(m-1)τ行m列狀態(tài)空間.此時,第i行數(shù)據(jù),即點X(i)為
X(i)=[xi,xi+τ,xi+2τ,…,xi+(m-1)τ],
(1)
其中,n-(m-1)τ為相空間中點的個數(shù),m為相空間的嵌入維.?;贑-C法[18-20]求取m和τ及嵌入窗口.
在得到重構(gòu)相空間后,可采用定義法、wolf法、正交法及小數(shù)據(jù)量法等求取最大Lyapunov指數(shù).張海龍等[18]在對比多種計算方法的優(yōu)缺點后認為:實際應(yīng)用中所獲取的數(shù)據(jù)包含較多的噪聲且數(shù)據(jù)量有限,應(yīng)優(yōu)先考慮小數(shù)據(jù)量法計算Lyapunov指數(shù).因此,本研究采用小數(shù)據(jù)量法求取最大Lyapunov指數(shù):
(2)
2) 對相空間中每一個點計算其鄰點的j個離散時間步長后的歐氏距離dj(i),即
(3)
3) 對每個xi所有的距離數(shù)據(jù)篩選出非零數(shù)據(jù)求其自然對數(shù)的均值y(i),即
(4)
其中,q是非零dj(i)的個數(shù).
4) 根據(jù)最小二乘法求取均值序列穩(wěn)定區(qū)間的斜率[16],即為由小數(shù)據(jù)量法得到的最大Lyapunov指數(shù)λL.
由于Lyapunov指數(shù)表征著相空間中相體積收縮和膨脹的幾何特性,因此可用于預(yù)測系統(tǒng)的演化趨勢[22-23].其核心思想在于從歷史數(shù)據(jù)中尋找相似點,根據(jù)相似點的演化規(guī)律、最大Lyapunov指數(shù)的物理意義及范數(shù)的計算來獲取一維或多維序列的預(yù)測值.本研究對單個數(shù)據(jù)的預(yù)測過程闡述如下:
(5)
其中,點X(i+1)中只有一個分量(記為X(i+1)(m))是未知的,其他均為已知值,且分量與所需預(yù)測值等價.則可由式(6)得到待預(yù)測量,并按照所設(shè)定的約束(本研究取和值)保留預(yù)測值,即
(6)
在數(shù)據(jù)對象方面,由于混沌特性分析常基于一維或多維時間序列數(shù)據(jù),時間序列數(shù)據(jù)常由一定時間尺度下對應(yīng)的觀測值組成;而本研究所獲取的公交數(shù)據(jù)以觀測序列為軸線,以時間特征數(shù)據(jù)為觀測值.因此,本研究將公交到站次數(shù)作為觀測軸線,相應(yīng)的到站數(shù)據(jù)作為序列數(shù)據(jù)用于分析.
在混沌特征的判別與混沌數(shù)據(jù)的預(yù)測方面,本研究首先針對公交到站數(shù)據(jù)采用C-C法[18]得到重構(gòu)相空間所需參數(shù)并重構(gòu)相空間;進一步基于小數(shù)據(jù)量法求取最大Lyapunov指數(shù),判別所輸入的數(shù)據(jù)是否具有混沌特性.在篩選得到具有混沌特性的數(shù)據(jù)后,將該數(shù)據(jù)作為基于最大Lyapunov指數(shù)預(yù)測方法的輸入,輸出得到預(yù)測數(shù)據(jù).同時,留取部分原始數(shù)據(jù)來驗證基于最大Lyapunov指數(shù)的到站數(shù)據(jù)預(yù)測精度與預(yù)測的可行性.
本文中數(shù)據(jù)為2015年9月21—26日(21—25日為工作日,26日為休息日))某市運行在普通車道上單條常規(guī)公交線路中段單一站點的連續(xù)6 d的公交數(shù)據(jù).該線路在工作日期間的平峰時和高峰時分別以10和8 min為發(fā)車間隔,在周末則采用9 min為發(fā)車間隔,數(shù)據(jù)的采集依托GPS車載設(shè)備及GPRS無線傳輸技術(shù).用于分析的數(shù)據(jù)為經(jīng)預(yù)處理后的公交站點停靠時間、公交到站間隔、到站延誤及其絕對值的數(shù)據(jù).其中,公交到站間隔為公交依次到站的時間間隔;到站延誤為按照公交發(fā)車時間表得到的公交到站時間點和實際到站時間點的差值;由于數(shù)據(jù)采集設(shè)備在站點50 m范圍內(nèi)對公交到站和駛離時間點進行記錄,故本文中公交站點??繒r間是指公交在駛?cè)牒褪钩稣军c50 m范圍內(nèi)這一進程中所用的時間.數(shù)據(jù)總量為534條.其中,為將6 d的分散數(shù)據(jù)串聯(lián)為一維序列,將5條間隙數(shù)據(jù)選為理想條件下應(yīng)會出現(xiàn)的數(shù)據(jù),如0 s的到站延誤和600 s的到站間隔數(shù)據(jù).所收集到公交到站數(shù)據(jù)的統(tǒng)計量如表1所示,數(shù)據(jù)的波動曲線如圖1所示.可以看出,數(shù)據(jù)整體上并不存在明顯的周期,所觀測到的數(shù)據(jù)可能是無序的隨機數(shù)據(jù).同時,結(jié)合均方差的大小可知,到站延誤、到站延誤絕對值以及到站間隔的波動相對較大,站點停靠時間波動相對較小.
圖1 數(shù)據(jù)波動曲線Fig.1 Wave curves of data
Tab.1 Description of bus arrival data statistics s
為判別公交到站數(shù)據(jù)的混沌特性,將數(shù)據(jù)序列分割為單日數(shù)據(jù)和多日數(shù)據(jù)(2,3和6 d)分別分析,進而將數(shù)據(jù)分別進行快速傅里葉變換(fast Fourier transformation,FFT)獲取各數(shù)據(jù)序列的平均周期,并對功率加權(quán)[21].然后,采用C-C法[18]得到嵌入維數(shù)和時間延遲并重構(gòu)相空間.最后,采用小數(shù)據(jù)量法計算最大Lyapunov指數(shù).得到的各指標(biāo)最大Lyapunov指數(shù)如表2所示.結(jié)果表明:本研究方法能夠判別數(shù)據(jù)的混沌信息,由最大Lyapunov指數(shù)的正負性可見,單日的公交到站延誤、站點停靠時間和到站間隔時間均是混沌數(shù)據(jù),而公交到站延誤絕對值數(shù)據(jù)僅有1 d為非混沌數(shù)據(jù).因此,可認為對混沌數(shù)據(jù)取絕對值降低了數(shù)據(jù)的混沌特性,即混沌數(shù)據(jù)由混沌序列轉(zhuǎn)變?yōu)閮?nèi)部具有不動點的序列或完全隨機的序列[16-17].
表2 各指標(biāo)的最大Lyapunov指數(shù)
Tab. 2 The largest Lyapunov exponent of each indicator
時間段最大Lyapunov指數(shù)到站延誤到站延誤絕對值到站間隔站點???21日0.167 20.227 50.210 90.189 3 22日0.151 10.222 90.121 10.030 6 22日0.165 2-0.071 00.117 70.122 6 24日0.007 40.072 40.074 50.008 5 25日0.162 00.207 80.025 30.008 9 26日0.086 10.067 70.080 30.052 0 21—22日0.027 50.000 20.001 8-0.004 0 22—23日-0.000 3-0.001 90.000 1-0.012 0 23—24日0.008 50.014 2-0.003 60.011 2 24—25日-0.000 9-0.001 20.008 3-0.922 1 25—26日-0.012 5-0.022 8-0.005 70.125 1 21—23日0.018 9-0.003 00.014 6-0.013 4 22—24日0.000 6-0.003 70.000 4-0.023 5 23—25日0.003 1-0.000 90.001 00.000 2 24—26日-0.008 8-0.014 60.005 90.013 6 21—26日0.004 5-0.000 1-0.000 40.007 2
對于多日數(shù)據(jù)的計算結(jié)果,表2顯示公交到站延誤方面,全6 d數(shù)據(jù)的最大Lyapunov指數(shù)大于0,即公交到站延誤數(shù)據(jù)序列在整體上是混沌的.同時,該全6 d數(shù)據(jù)內(nèi)部存在著有收斂或者無序的數(shù)據(jù)區(qū)間,如24—25日和24—26日的數(shù)據(jù)序列的最大Lyapunov指數(shù)小于0.在對公交到站延誤數(shù)據(jù)取絕對值之后發(fā)現(xiàn),原先多個混沌區(qū)間變?yōu)榫哂蟹腔煦缣匦缘臄?shù)據(jù),全6 d的最大Lyapunov指數(shù)(-0.000 1)很小,即該數(shù)據(jù)在一定程度上趨于周期數(shù)據(jù)或混沌數(shù)據(jù).公交到站間隔方面,本研究數(shù)據(jù)整體上是非混沌的.但連續(xù)3 d數(shù)據(jù)卻均具有混沌特性,連續(xù)2 d的數(shù)據(jù)中也存在著混沌的數(shù)據(jù)區(qū)間.車輛站點??糠矫?全6 d數(shù)據(jù)在整體上是混沌的.但其內(nèi)部有可能存在不動點的數(shù)據(jù)區(qū)間(例如,21—23日和22—24日),但隨著數(shù)據(jù)量的增大,其數(shù)據(jù)特性又趨于混沌.
具有足夠數(shù)據(jù)量的混沌數(shù)據(jù)具備預(yù)測的可能性[22],非混沌數(shù)據(jù)區(qū)間并不能采用混沌理論進行數(shù)據(jù)預(yù)測.非混沌數(shù)據(jù)序列區(qū)間的疊加可能會使得數(shù)據(jù)具有混沌特性.同時,混沌數(shù)據(jù)序列區(qū)間的疊加同樣有可能導(dǎo)致其混沌特性的丟失.
對于時間數(shù)據(jù)序列的混沌特性識別,其數(shù)據(jù)量在100左右是足夠的,進行混沌預(yù)測則需要400左右的數(shù)據(jù)量[22].由于本文中單日數(shù)據(jù)均不足100條,故采用全6 d數(shù)據(jù)為例進行預(yù)測分析.同時,因為最大Lyapunov指數(shù)在一定程度上代表了系統(tǒng)的整體發(fā)散程度,故可將其倒數(shù)作為可預(yù)測尺度[22-23].本文中全6 d數(shù)據(jù)中的公交到站延誤時間絕對值序列及公交到站間隔時間序列不具有混沌特性,故僅將公交到站延誤時間及車輛站點??繒r間這兩組序列作為預(yù)測對象進行分析.此外,由于預(yù)測步長越大,則所得到的預(yù)測數(shù)據(jù)偏差越大,因此考慮到城市居民公交出行需要,將預(yù)測步長設(shè)置為15,即根據(jù)前519條到站數(shù)據(jù),預(yù)測公交正常運轉(zhuǎn)情形下短時的15次到站情況,并與實際到站數(shù)據(jù)進行對比.按照第1節(jié)的預(yù)測方法,基于配備有酷睿i5處理器、4 GB運行內(nèi)存和Windows10專業(yè)版系統(tǒng)的筆記本電腦,采用Matlab2012平臺進行仿真預(yù)測,并進一步得到了BP神經(jīng)網(wǎng)絡(luò)模型[24]與GM(1,1)模型[25]的預(yù)測結(jié)果,得到的預(yù)測曲線如圖2和3所示.
圖2 公交到站延誤時間預(yù)測Fig.2 Bus arrival deviation prediction
圖3 公交站點??繒r間預(yù)測Fig.3 Bus dwell time prediction
圖2和3表明,混沌理論預(yù)測結(jié)果在曲線走勢上與實測數(shù)據(jù)較為一致,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果存在較大的數(shù)據(jù)波動,而GM(1,1)模型預(yù)測結(jié)果較為平穩(wěn).所預(yù)測的到站延誤是實際到站時間點與計劃到站時間點的差值,其與公交站點停靠時間均很容易受到交通環(huán)境的影響,表1和圖1均顯示了兩者數(shù)據(jù)的波動性和不穩(wěn)定性,而基于混沌理論的預(yù)測方法能夠較為準(zhǔn)確的預(yù)測到站延誤的走勢,這也與數(shù)據(jù)的混沌特征相符.同時,由于站點??繒r間同樣具有混沌特性,其預(yù)測效果也較為理想.
表3 預(yù)測效果
Tab. 3 Predicting Effect
預(yù)測對象預(yù)測方法評價指標(biāo)預(yù)測數(shù)據(jù)量MSE/s2MAPE/% 公交到站延誤混沌理論15組(星期六)198.1611.25GM(1,1)模型15組(星期六)100 471.937186.251BP神經(jīng)網(wǎng)絡(luò)模型15組(星期六)70 263.454216.853文獻[5]方法全天[5](星期日)11.35文獻[7]方法69組[7](工作日)11.50 公交站點??炕煦缋碚?5組(星期六)11.939.93GM(1,1)模型15組(星期六)60.41520.682BP神經(jīng)網(wǎng)絡(luò)模型15組(星期六)9 617.57184.786文獻[11]方法192組[11](工作日)7.965.66文獻[11]方法57組[11](工作日)4.050.62
在實際過程中,公交到站延誤較大程度受到交通環(huán)境的影響,尤其是站間車流量的影響.公交站點??繒r間受上下車人流量顯著影響,也受到公交站點周邊交通量的影響.同時,由于研究對象是常規(guī)公交,兩者的混沌特征可能較高程度受到車流量及乘車人流量的混沌特征的影響.已有研究表明車流量本身具有一定的混沌特性[6].綜合可知,分析所得公交運營數(shù)據(jù)的混沌特征與實際相符,同時圖2與3也說明了混沌數(shù)據(jù)的預(yù)測具有可行性.
為了進一步分析基于最大Lyapunov指數(shù)的預(yù)測效果,用式(7)計算公交到站延誤時間和公交站點??繒r間預(yù)測數(shù)據(jù)的均方誤差(mean square error,MSE)和平均相對百分比誤差(mean absolute prcentage error,MAPE)來分析預(yù)測的精確度[11],兩者的數(shù)值越小代表精確度越高.
(7)
其中:yi為實際值;yi′為預(yù)測值;n為預(yù)測的數(shù)據(jù)量,即15.
表3顯示了基于MSE和MAPE的混沌理論預(yù)測效果評價,以及結(jié)合BP神經(jīng)網(wǎng)絡(luò)模型、GM(1,1)模型以及前人研究成果[5,7,11]所進行的對比.其中,采用BP神經(jīng)網(wǎng)絡(luò)模型和GM(1,1)模型對上文相同數(shù)據(jù)進行預(yù)測.從本研究預(yù)測結(jié)果評價指標(biāo)來看,基于混沌理論的預(yù)測精度較為理想.對比發(fā)現(xiàn),混沌理論在公交到站延誤(即到站時間)上的預(yù)測較為理想,且明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和GM(1,1)模型.在公交站點??繒r間的預(yù)測上,其預(yù)測精度及預(yù)測數(shù)據(jù)量低于前人研究[11],但文獻[11]中所分析的對象為快速公交(bus rapid transit,BRT)數(shù)據(jù),這是由于BRT具有專用道,其運營過程受到較小的外界因素影響,這與本研究所分析的常規(guī)公交存在明顯差異,但預(yù)測效果同樣顯著優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和GM(1,1)模型.
在計算過程上,混沌理論、GM(1,1)模型、BP神經(jīng)網(wǎng)絡(luò)模型、支持向量機、回歸分析以及貝葉斯網(wǎng)絡(luò)等均涉及參數(shù)的求取,再由輸入數(shù)據(jù)和參數(shù)得到預(yù)測數(shù)據(jù)所需的仿真時間.本文中,基于所采用平臺和混沌理論的預(yù)測方法,在公交到站延誤時間的計算及公交站點??繒r間的計算中所消耗的仿真時間分別為0.917 s與0.924 s,能夠滿足實際應(yīng)用的需求.基于此,可認為混沌理論在分析公交運營所輸出非線性公交到站時間序列中具有較高的適用性.
依據(jù)混沌理論對實測的非公交專用道上公交到站數(shù)據(jù)進行數(shù)據(jù)特性分析,討論了公交到站數(shù)據(jù)的混沌特征、可預(yù)測性及預(yù)測精度.分析過程與結(jié)果可總結(jié)如下:
1) 采用混沌理論分析公交運營數(shù)據(jù)具有較高可行性.該理論能夠通過構(gòu)造相空間將繁瑣數(shù)據(jù)降階以簡化分析過程,同時也考慮了數(shù)據(jù)的整體特征.本研究基于該理論判別得到了公交到站時間數(shù)據(jù)的混沌特性,并將混沌數(shù)據(jù)用于預(yù)測分析,得到較好的預(yù)測精度和較少的仿真時間消耗,豐富了公交運營預(yù)測分析的理論實踐.
2) 受到運行環(huán)境的影響,本文中公交單日單點到站數(shù)據(jù)不僅在工作日上具有一定的混沌特性,而且在休息日同樣具有一定的混沌特性.將到站延誤數(shù)據(jù)絕對值化,部分區(qū)間的混沌特性被削弱,甚至有存在不動點的可能.若能發(fā)現(xiàn)并求解不動點,則可發(fā)現(xiàn)精確的數(shù)據(jù)變動規(guī)律.多日的數(shù)據(jù)序列組合可能具有混沌特性,如本文中的到站延誤和站點停靠時間.也有部分不具有混沌特性的數(shù)據(jù)序列區(qū)間,如到站間隔和到站延誤的絕對值數(shù)據(jù).
3) 為探究基于混沌理論的數(shù)據(jù)序列的可預(yù)測性分析,采集運行在非公交專用道上的連續(xù)6 d的單線公交到站實測數(shù)據(jù),將最大Lyapunov指數(shù)大于0的公交到站延誤和??繒r間的全6 d數(shù)據(jù)進行預(yù)測分析.雖然普通車道上的公交運營過程相比BRT運營過程受到更大的外界因素影響,預(yù)測更加困難.但結(jié)果表明:基于混沌理論的預(yù)測分析能夠較大程度地識別數(shù)據(jù)演化趨勢,得到較為理想的預(yù)測精度,在公交到站延誤和公交站點??款A(yù)測上顯著優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和GM(1,1)模型,并且在公交到站延誤預(yù)測方面,得到了較為精確的預(yù)測結(jié)果,在公交站點??糠矫娴念A(yù)測略低于前人[5,7]的研究成果.
4) 數(shù)據(jù)序列的混沌特性判定和預(yù)測分析需要計算出精確的時間延遲、嵌入維及平均周期等參數(shù),由于當(dāng)前計算方法繁多,本研究中僅選用了近年來研究中所推薦的參數(shù)計算方法.若采用混沌理論進行更多的嘗試,或許能夠發(fā)現(xiàn)更好的計算方法.