田?;郏?彬
(河南交通職業(yè)技術(shù)學(xué)院 交通信息工程系,河南 鄭州 450000)
基于時(shí)空特征分析的短時(shí)交通流預(yù)測(cè)模型
田?;?,郭 彬
(河南交通職業(yè)技術(shù)學(xué)院 交通信息工程系,河南 鄭州 450000)
交通流預(yù)測(cè)的實(shí)時(shí)性和準(zhǔn)確性直接影響到交通流誘導(dǎo)系統(tǒng)的高效性,是智能交通領(lǐng)域研究的熱點(diǎn)。為了進(jìn)一步提高短時(shí)交通流預(yù)測(cè)的精度,提出一種基于時(shí)空特征分析的短時(shí)交通流預(yù)測(cè)模型。在分析路段時(shí)空相關(guān)性的基礎(chǔ)上,利用云模型改進(jìn)的遺傳算法對(duì)支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化,得到最優(yōu)的支持向量機(jī)模型,并實(shí)現(xiàn)短時(shí)交通流預(yù)測(cè)。以長(zhǎng)春市局部路網(wǎng)的實(shí)測(cè)數(shù)據(jù)為基礎(chǔ),驗(yàn)證了所提出模型的有效性和可行性。
交通運(yùn)輸工程;交通量預(yù)測(cè);時(shí)空特征分析;云模型;遺傳算法;支持向量機(jī)
交通流預(yù)測(cè)在智能交通研究領(lǐng)域一直占據(jù)著舉足輕重的地位,通過國(guó)內(nèi)外研究學(xué)者的不斷努力,形成了多種方法,如Kalman濾波法[1]、時(shí)間序列法[2]、神經(jīng)網(wǎng)絡(luò)法[3]、支持向量機(jī)[4]等。由于基于單一模型的預(yù)測(cè)方法都存在缺陷,國(guó)內(nèi)外學(xué)者研究了很多基于組合理論的預(yù)測(cè)方法,如灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法[5]、基于小波包和最小二乘支持向量機(jī)的預(yù)測(cè)方法[6]、基于蟻群優(yōu)化支持向量機(jī)的預(yù)測(cè)方法[7]等。
這些短時(shí)交通流預(yù)測(cè)方法在很大程度上都能得到滿意的預(yù)測(cè)結(jié)果,但是普遍沒有考慮路段時(shí)空相關(guān)性,預(yù)測(cè)因子考慮不全面,預(yù)測(cè)精度還有待于提高。為了進(jìn)一步提高短時(shí)交通流預(yù)測(cè)的精確度,筆者一方面優(yōu)化預(yù)測(cè)因子,充分考慮路段時(shí)空相關(guān)性,另一方面優(yōu)化預(yù)測(cè)模型,通過云模型改進(jìn)的遺傳算法優(yōu)化支持向量機(jī)模型,提出一種基于時(shí)空特征分析的短時(shí)交通流預(yù)測(cè)模型。以長(zhǎng)春市局部路網(wǎng)的實(shí)測(cè)數(shù)據(jù)為基礎(chǔ),通過實(shí)例驗(yàn)證了所提出模型的有效性和可行性。
1.1 相似性分析
圖1是同一日不同檢測(cè)器的交通流量變化曲線,共28個(gè)檢測(cè)器,隨機(jī)選出4個(gè)檢測(cè)器采集到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。從圖1可以看出:在這些檢測(cè)器中,部分交通流量變化曲線存在一定的相似性,這是路段截面相關(guān)性分析的基礎(chǔ)。
圖1 同一日不同檢測(cè)器交通流量變化曲線Fig.1 Traffic flow change curve of different detectors on the same day
1.2 相關(guān)性分析
為了進(jìn)一步了解各路段截面之間的相關(guān)程度,選擇相關(guān)系數(shù)為相似系數(shù),以相似系數(shù)作為聚類標(biāo)準(zhǔn),采用系統(tǒng)聚類方法對(duì)路段截面數(shù)據(jù)進(jìn)行分析。系統(tǒng)聚類分析法的具體步驟是:①數(shù)據(jù)的標(biāo)準(zhǔn)化處理;②確定相似系數(shù);③計(jì)算類間距并進(jìn)行聚類;④繪制系統(tǒng)聚類譜系圖。
相關(guān)系數(shù)是描述變量間線性關(guān)系密切程度的數(shù)量指標(biāo)。設(shè)路段截面交通流量統(tǒng)計(jì)數(shù)據(jù)矩陣為
(1)
式中:m為截面數(shù);n為時(shí)間點(diǎn)數(shù)。
相關(guān)系數(shù)計(jì)算步驟如下:
1)對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化變換
(2)
2)計(jì)算相關(guān)系數(shù)矩陣
R=QQ′
(3)
式中:R為相關(guān)系數(shù)矩陣;Q為標(biāo)準(zhǔn)化后的交通流量矩陣;Q′為Q的轉(zhuǎn)置矩陣。
交通流預(yù)測(cè)是一種非線性回歸問題,支持向量機(jī)(support vector machine,SVM)在解決這類問題上具有優(yōu)勢(shì)[8-9],因此選擇SVM模型作為基礎(chǔ)預(yù)測(cè)模型,其基本原理如下。
存在訓(xùn)練集:
式中:xi∈Rn為預(yù)測(cè)因子,即前幾個(gè)時(shí)段的時(shí)空序列;yi∈R為預(yù)測(cè)值;i=1,…,l為訓(xùn)練集包含的訓(xùn)練樣本數(shù)。
(4)
(5)
(6)
對(duì)上述問題進(jìn)一步變換,將式(4)改寫為
(7)
在支持向量機(jī)的參數(shù)中,對(duì)模型的預(yù)測(cè)結(jié)果影響較大的是懲罰參數(shù)C、不敏感損失參數(shù)ε和核函數(shù)參數(shù)σ。同時(shí)考慮遺傳算法存在一定的缺陷,如收斂速度慢,陷入局部最優(yōu),因此,采用基于云模型的遺傳算法對(duì)支持向量機(jī)參數(shù)進(jìn)行優(yōu)化。
3.1 云模型
3.1.1 云的數(shù)字特征
圖2 云模型及其數(shù)字特征Fig.2 Cloud model and its numerical characteristics
3.1.2 云發(fā)生器
云發(fā)生器有兩種,一種是由定性到定量的過程,稱為正向云發(fā)生器;另一種是由定量到定性的過程,稱為逆向云發(fā)生器。如圖3。
圖3 云發(fā)生器Fig.3 Cloud generator
3.2 基于云模型的遺傳優(yōu)化支持向量機(jī)
基于云模型的遺傳算法優(yōu)化支持向量機(jī)參數(shù)的具體步驟如下[12],如圖4。
圖4 遺傳優(yōu)化支持向量機(jī)參數(shù)的流程Fig.4 Process of SVM parameters optimized by GA
1)初始化,隨機(jī)產(chǎn)生一組支持向量機(jī)參數(shù),并對(duì)其進(jìn)行編碼。
2)初始化種群,對(duì)種群規(guī)模、最大迭代次數(shù)等參數(shù)進(jìn)行設(shè)定。
3)適應(yīng)度評(píng)價(jià)。
4)以最大迭代次數(shù)為優(yōu)化準(zhǔn)則,如果滿足條件則輸出結(jié)果,即支持向量機(jī)的最優(yōu)參數(shù),從而得到訓(xùn)練好的支持向量機(jī);如果不滿足條件,則進(jìn)行步驟5)。
5)執(zhí)行選擇、交叉和變異操作,生成新種群,再?gòu)牟襟E1)開始新一代遺傳。
3.2.1 染色體編碼與解碼
3.2.2 適應(yīng)度函數(shù)
適應(yīng)度函數(shù)可以指導(dǎo)下一代的遺傳和進(jìn)化,是自然選擇的唯一標(biāo)準(zhǔn)。通過合適地選擇適應(yīng)度函數(shù)能夠提升算法的效率和解的質(zhì)量。因?yàn)橐獙?shí)現(xiàn)SVM的參數(shù)優(yōu)化,就要找到最優(yōu)的模型,所以選擇均方根誤差函數(shù)為適應(yīng)度函數(shù)。
3.2.3 個(gè)體選擇
通過個(gè)體選擇可以使適應(yīng)度較高的個(gè)體遺傳下來,并在代與代之間不斷進(jìn)化。筆者通過輪盤賭法進(jìn)行個(gè)體選擇,則個(gè)體被選擇的概率為
(8)
3.2.4 交叉與變異
交叉的目的是保留父本的優(yōu)秀基因,構(gòu)成一個(gè)全新的個(gè)體。變異是為了保持種群的多樣性,避免陷入局部最優(yōu)。自適應(yīng)遺傳算法的交叉率和變異率函數(shù)絕對(duì)地保留了優(yōu)秀個(gè)體,缺乏隨機(jī)性,因此筆者采用正向云發(fā)生器對(duì)自適應(yīng)交叉率和變異率函數(shù)進(jìn)行改進(jìn),得到式(9)和式(10)。
(9)
(10)
實(shí)現(xiàn)基于時(shí)空分析和云遺傳優(yōu)化支持向量機(jī)的交通流預(yù)測(cè)需要3個(gè)步驟:①訓(xùn)練樣本的準(zhǔn)備;②利用基于云模型的遺傳算法對(duì)支持向量機(jī)模型進(jìn)行訓(xùn)練;③利用訓(xùn)練好的支持向量機(jī)模型進(jìn)行短時(shí)交通流預(yù)測(cè)。
4.1 訓(xùn)練樣本的準(zhǔn)備
訓(xùn)練樣本的準(zhǔn)備包括兩個(gè)步驟:
1)路網(wǎng)數(shù)據(jù)的時(shí)空分析,得到具有時(shí)空特征的樣本數(shù)據(jù)。
2)對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)據(jù)歸一到區(qū)間[-1,1],公式如下:
(11)
式中:x為原始數(shù)據(jù);y為映射后數(shù)據(jù)。
4.2 云遺傳支持向量機(jī)的短時(shí)交通流預(yù)測(cè)
利用云遺傳支持向量機(jī)進(jìn)行短時(shí)交通流預(yù)測(cè)的流程如圖5。
圖5 云遺傳支持向量機(jī)的交通流預(yù)測(cè)流程Fig.5 Process of traffic flow forecasting based on CGA-SVM
4.3 評(píng)價(jià)指標(biāo)選取
為了評(píng)價(jià)所提出模型的有效性,選擇相對(duì)誤差XRE、平均相對(duì)誤差XMRE、最大相對(duì)誤差XMAXRE、均方根誤差XRMSE為評(píng)價(jià)指標(biāo)。相關(guān)表達(dá)式如下:
實(shí)驗(yàn)對(duì)象為長(zhǎng)春市局部路網(wǎng),如圖6,取其中的12個(gè)路段斷面進(jìn)行分析。實(shí)驗(yàn)數(shù)據(jù)為2013年8月12—16日06:30—18:30的流量數(shù)據(jù),每5 min采集一次,12個(gè)截面共產(chǎn)生720組數(shù)據(jù),以前4天的576組數(shù)據(jù)作為訓(xùn)練樣本,16日的144組數(shù)據(jù)為預(yù)測(cè)樣本。在MATLAB7.0.1環(huán)境下設(shè)計(jì)云模型等相關(guān)程序,運(yùn)用GA工具箱和LibSVM工具箱對(duì)支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化。為了驗(yàn)證所提出的基于時(shí)空分析和云遺傳支持向量機(jī)(時(shí)空CGA-SVM)預(yù)測(cè)模型的有效性,在實(shí)驗(yàn)過程中與云遺傳支持向量機(jī)模型(CGA-SVM)和遺傳支持向量機(jī)模型(GA-SVM)進(jìn)行了對(duì)比和分析。
圖6 長(zhǎng)春市局部路網(wǎng)Fig.6 Local road network diagram of Changchun
首先進(jìn)行路段時(shí)空特征的聚類分析,得到的聚類譜系圖如圖7。
圖7 聚類譜系Fig.7 Hierarchical graph
由此可見,截面2,6,7,截面1,3,4,8,截面9,10,11,12均為相關(guān)性較強(qiáng)的一組。以截面4為例,對(duì)其進(jìn)行短時(shí)交通流預(yù)測(cè),實(shí)驗(yàn)分為兩種情況:①對(duì)于GA-SVM模型和CGA-SVM模型,以截面4的歷史流量作為輸入變量;②對(duì)于基于時(shí)空分析的CGA-SVM模型,以截面1,3,4,8的歷史流量作為輸入變量。
在利用3種模型進(jìn)行交通流預(yù)測(cè)之前,首先要對(duì)SVM參數(shù)進(jìn)行優(yōu)化。設(shè)置GA和CGA的種群規(guī)模、最大迭代次數(shù)均為m=30、Gmax=100,通過優(yōu)化,得到最優(yōu)的SVM參數(shù)結(jié)果如表1。
表1 支持向量機(jī)的參數(shù)優(yōu)化結(jié)果
通過GA-SVM,CGA-SVM和基于時(shí)空CGA得到的預(yù)測(cè)結(jié)果和預(yù)測(cè)結(jié)果的相對(duì)誤差如圖8,3種方法的評(píng)價(jià)指標(biāo)值如表2。
圖8 預(yù)測(cè)結(jié)果和相對(duì)誤差Fig.8 Prediction results and relative error
模型XMREXMAXREXRMSEGA-SVM0.12030.18182.1414CGA-SVM0.10040.16891.5284時(shí)空CGA-SVM0.74490.12820.8453
由圖8可以看出,基于時(shí)空CGA模型的預(yù)測(cè)結(jié)果和實(shí)際值擬合的效果最好,同時(shí),即使是流量變化較大的情況下,其預(yù)測(cè)結(jié)果的相對(duì)誤差也能保持基本穩(wěn)定。由表2可以看出,基于時(shí)空CGA模型的XMRE,XMAXRE,XRMSE是最小的,因此所提出方法的預(yù)測(cè)精度最高。
提出了一種基于時(shí)空特征分析的短時(shí)交通流預(yù)測(cè)模型,充分考慮了交通流數(shù)據(jù)的時(shí)空特征,同時(shí)結(jié)合云模型和遺傳算法的優(yōu)點(diǎn),優(yōu)化了支持向量機(jī)參數(shù),得到了最優(yōu)的交通流預(yù)測(cè)模型。與遺傳支持向量機(jī)模型和云遺傳支持向量機(jī)模型相比,所提出的預(yù)測(cè)模型提高了短時(shí)交通流預(yù)測(cè)的精度。實(shí)驗(yàn)表明基于時(shí)空分析和云遺傳支持向量機(jī)的短時(shí)交通流預(yù)測(cè)方法具有有效性和可行性,同時(shí),該短時(shí)交通流預(yù)測(cè)方法比較簡(jiǎn)單,易于實(shí)現(xiàn),可以進(jìn)行工程應(yīng)用。
[1] 朱征宇,劉琳,崔明.一種結(jié)合SVM與卡爾曼濾波的短時(shí)交通流預(yù)測(cè)模型[J].計(jì)算機(jī)科學(xué),2013,40(10):248-278. ZHU Zhengyu, LIU Lin, CUI Ming. Short-term traffic flow forecasting model combining SVM and Kalman filtering [J].ComputerScience, 2013, 40(10): 248-278.
[2] 張曉利,賀國(guó)光,陸化普.基于K-鄰域非參數(shù)回歸短時(shí)交通流預(yù)測(cè)方法[J].計(jì)算機(jī)應(yīng)用與軟件,2009,24(2):178-182. ZHANG Xiaoli, HE Guoguang, LU Huapu. Short-term traffic flow forecasting based on K-nearest neighbors non-parametric regession[J].JournalofSystemsEngineering, 2009, 24 (2): 178-182.
[3] 唐志強(qiáng),王正武,招曉菊,等. 基于神經(jīng)網(wǎng)絡(luò)和混沌理論的短時(shí)交通流預(yù)測(cè)[J].山西科技,2005(5):117-120. TANG Zhiqiang, WANG Zhengwu,ZHAO Xiaoju, et al. Short-time traffic prediction based on neural network and chaos theory[J].ShanxiScienceandTechnology, 2005(5): 117-120.
[4] 楊兆升,王媛,管青. 基于支持向量機(jī)方法的短時(shí)交通流量預(yù)測(cè)方法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2006,36(6):881-884. YANG Zhaosheng, WANG Yuan, GUAN Qing. Short-term traffic flow prediction method based on SVM[J].JournalofJilinUniversity(EngineeringandTechnologyEdition), 2006, 36(6): 881-884.
[5] 陳淑燕,王煒. 交通量的灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法[J]. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,34(7):541-544. CHEN Shuyan, WANG Wei. Grey neural network forecasting for traffic flow[J].JournalofSoutheastUniversity(NaturalScienceEdition), 2004,34( 7): 541-544.
[6] 姚智勝,邵春福,熊志華.基于小波包和最小二乘支持向量機(jī)的短時(shí)交通流組合預(yù)測(cè)方法研究[J]. 中國(guó)管理科學(xué),2007,15(1):64-68. YAO Zhisheng, SHAO Chunfu, XIONG Zhihua. Research on short-term traffic flow combined forecasting based on wavelet package and least square support vector machines[J].ChineseJournalofManagementScience,2007,15(1):64-68.
[7] 劉艷忠,邵小建,李旭宏. 基于Lagrange支持向量回歸機(jī)的短時(shí)交通流量預(yù)測(cè)模型的研究[J].交通與計(jì)算機(jī),2007,25(5):46-49. LIU Yanzhong, SHAO Xiaojian, LI Xuhong. Short-term traffic flow prediction model based on lagrange support vector regression[J].TrafficandComputer, 2007, 25(5): 46- 49.
[8] 徐鵬,姜鳳茹. 基于蟻群優(yōu)化支持向量機(jī)的短時(shí)交通流量預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2013,30(3):250-254. XU Peng,JIANG Fengru. Short-term traffic flow prediction based on SVM optimized by ACO[J].ComputerApplicationsandSoftware, 2013, 30(3): 250-254.
[9] YAN Hongsen , XU Duo. An approach to estimating product design time based on fuzzy v-support vector machine[J].IEEETransactionsonNeuralNetworks, 2007, 18(3): 721-731.
[10] 李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國(guó)工程科學(xué),2004,6(8):28-34. LI Deyi, LIU Changyu. Study on the universality of normal cloud model [J].EngineeringScience, 2004,6(8): 28-34.
[11] 楊朝暉,李德毅.二維云模型及其在預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),1998,21(11):961-969. YANG Zhaohui, LI Deyi. Planar model and ITS application in prediction[J].ChineseJournalofComputers,1998,21(11): 961-969.
[12] MIN Sunghwan, LEE Jumin, HAN Ingoo. Hybrid genetic algorithms and support vector machines for bankruptcy prediction[J].ExpertSystemswithApplications,2006,31(3):652-660.
[13] SRINIVAS M, PATNAIK L M. Adaptive probabilities of crossover and mutation in genetic algorithms[J].IEEETransonSystems,ManandCybernetics, 1994, 24(4): 656- 667.
A Short-Term Traffic Flow Prediction Model Based on Spatio-Temporal Characteristics Analysis
TIAN Baohui, GUO Bin
(Department of Traffic Information Engineering, Henan Communication Vocational Technology College, Zhengzhou 450000, Henan, P.R.China)
The real-time and accuracy of traffic flow prediction directly affect the efficiency of traffic flow guidance system, which is a hot issue of intelligent transportation system research. In order to improve the accuracy of short-term traffic flow forecasting further, a short-term traffic flow prediction model based on spatio-temporal characteristics analysis was proposed. On the basis of spatio-temporal correlativity analysis of section, the parameters of support vector machine (SVM) were optimized by using the genetic algorithm improved by cloud model. At last, the optimal SVM model was obtained, and it realized the short-term traffic flow prediction. Based on the measured data of local road network in Changchun city, the feasibility and effectiveness of the proposed model were verified.
traffic and transportation engineering; traffic flow forecasting; spatio-temporal characteristics analysis; cloud model; genetic algorithm; support vector machine
10.3969/j.issn.1674-0696.2016.03.22
2014-12-16;
2015-03-09
河南省交通運(yùn)輸廳科技計(jì)劃項(xiàng)目(2014G21)
田保慧(1975—),女,河南鄭州人,副教授,主要從事交通信息化方面的研究。E-mail:18341615@qq.com。
U491.1
A
1674-0696(2016)03-105-05