廖瑞輝,周晶
(南京大學(xué)工程管理學(xué)院,南京210093)
基于云—自組織神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)模型
廖瑞輝,周晶*
(南京大學(xué)工程管理學(xué)院,南京210093)
現(xiàn)代交通系統(tǒng)結(jié)構(gòu)復(fù)雜,涉及的數(shù)據(jù)類型和數(shù)量眾多,模糊性、隨機(jī)性和不確定性等因素的存在增加了數(shù)據(jù)分析過程中定性與定量綜合集成的難度.本文對(duì)城市交通流預(yù)測(cè)進(jìn)行了研究,根據(jù)云模型和自組織神經(jīng)網(wǎng)絡(luò)的特點(diǎn),構(gòu)建了云—自組織神經(jīng)網(wǎng)絡(luò)交通流預(yù)測(cè)模型.該預(yù)測(cè)模型運(yùn)用云模型處理數(shù)據(jù)的模糊性和隨機(jī)性問題的優(yōu)勢(shì),提高了自組織神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)中學(xué)習(xí)樣本數(shù)據(jù)的可靠性.通過對(duì)某城區(qū)的實(shí)際數(shù)據(jù)進(jìn)行對(duì)比測(cè)算,改進(jìn)的預(yù)測(cè)模型比單純使用自組織神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型決定系數(shù)更高.結(jié)果表明,本文提出的模型在交通流預(yù)測(cè)中提高了準(zhǔn)確率,降低了預(yù)測(cè)泛化誤差.
城市交通;數(shù)據(jù)預(yù)測(cè);云—自組織神經(jīng)網(wǎng)絡(luò);交通流
城市交通系統(tǒng)是一個(gè)人、車、路和環(huán)境相互交融的復(fù)雜系統(tǒng),該系統(tǒng)呈現(xiàn)出微觀的隨機(jī)性與宏觀的規(guī)律性.其中,隨機(jī)性主要體現(xiàn)在道路狀況、天氣、出行者等對(duì)交通運(yùn)行狀態(tài)的影響,規(guī)律性則表現(xiàn)為各個(gè)交通流參數(shù)遵循它們之間的關(guān)系及變化的趨勢(shì).城市交通系統(tǒng)涉及的數(shù)據(jù)類型眾多,數(shù)據(jù)量龐大,不同類型的數(shù)據(jù)所表現(xiàn)的意義不同,其所屬范圍也有很大差異.交通流預(yù)測(cè)分析中,預(yù)測(cè)模型輸入數(shù)據(jù)的質(zhì)量很大程度上決定了預(yù)測(cè)模型的有效性,它不僅是模型輸出結(jié)果的精度保證,也可以有效地檢驗(yàn)預(yù)測(cè)模型的設(shè)計(jì)偏差.但是,從路網(wǎng)中所采集到的交通數(shù)據(jù)不可避免地會(huì)存在著一些缺陷,例如:交通系統(tǒng)隨機(jī)擾動(dòng)導(dǎo)致數(shù)據(jù)傳輸故障、交通流過大造成檢測(cè)器無法有效檢測(cè)車輛、檢測(cè)器的采集頻率不穩(wěn)定等,都會(huì)使得檢測(cè)器所采集到的交通數(shù)據(jù)出現(xiàn)數(shù)據(jù)缺失情況,這大大增加了交通數(shù)據(jù)的不確定性.目前常用的分析方法中,例如:層次分析、量化加權(quán)、專家群體打分等,夾雜著一些數(shù)學(xué)模型和定量計(jì)算,但都不能兼顧交通數(shù)據(jù)的隨機(jī)性和模糊性.為了降低交通數(shù)據(jù)的不確定性,本文引入云模型為交通流預(yù)測(cè)提供數(shù)據(jù)預(yù)處理.
云模型(Cloud Model,CM)是在模糊數(shù)學(xué)與概率論基礎(chǔ)上發(fā)展的一種人工智能模型,用于定性與定量信息的精確互換,能夠較好地處理數(shù)據(jù)快速分類與數(shù)據(jù)挖掘等應(yīng)用需求,在數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)等領(lǐng)域得到了廣泛地應(yīng)用,并取得了良好的應(yīng)用效果[1-4].云是用語言值描述的某個(gè)定性概念與其數(shù)值表示之間的不確定性轉(zhuǎn)換模型,簡(jiǎn)而言之,云模型是定性定量間轉(zhuǎn)換的不確定性模型.其定義為:設(shè)U是一個(gè)用精確數(shù)值表示的定量論域,C是U上的定性概念,若定量值x∈U,且x是定性概念C的一次隨機(jī)實(shí)現(xiàn),x對(duì)C的確定度μ(x)∈[0,1]是有穩(wěn)定傾向的隨機(jī)數(shù),則稱μ(x)在U上的分布為云模型.μ(x)在U上的分布稱為“隸屬云”,也簡(jiǎn)稱為“云”.而神經(jīng)網(wǎng)絡(luò)作為人工智能方法的產(chǎn)物,已有近三十年的研究歷史,是一種比較成熟的信息處理手段.通過模擬人腦的運(yùn)行機(jī)理,對(duì)一定量的數(shù)據(jù)樣本進(jìn)行有記憶的和自適應(yīng)的學(xué)習(xí),魯棒性較強(qiáng),在解決交通流預(yù)測(cè)問題時(shí)具有一定的優(yōu)勢(shì).雖然目前云模型已經(jīng)廣泛應(yīng)用,但是其與神經(jīng)網(wǎng)絡(luò)相結(jié)合應(yīng)用于交通領(lǐng)域的比較少.
神經(jīng)網(wǎng)絡(luò)方法有很多種,自組織神經(jīng)網(wǎng)絡(luò)(Self-Organizing Neural Network,SONN)是Kohonen教授于1981年根據(jù)神經(jīng)元有序的排列可以反映出感覺到的外界刺激的某些物理特性而提出的,其主要思想是在學(xué)習(xí)的過程中逐步縮小神經(jīng)元之間的作用領(lǐng)域,并依據(jù)相關(guān)的學(xué)習(xí)規(guī)則增強(qiáng)中心神經(jīng)元的激活程度,從而去掉神經(jīng)元之間的側(cè)向連接,以達(dá)到模擬真實(shí)大腦神經(jīng)系統(tǒng)“近興奮遠(yuǎn)抑制”的效果.SONN是非監(jiān)督學(xué)習(xí)網(wǎng)絡(luò),它具有很強(qiáng)的模式識(shí)別能力,這個(gè)特征對(duì)于交通流預(yù)測(cè)十分有力[5].SONN可以很好地提取出交通數(shù)據(jù)中的重要特征信息,并能夠自動(dòng)將這些特征進(jìn)行類別標(biāo)識(shí),從而有效避免了人為的類別標(biāo)識(shí),減輕了主觀因素的影響[6].但是目前自組織神經(jīng)網(wǎng)絡(luò)容易受到樣本數(shù)據(jù)質(zhì)量的限制,比如數(shù)據(jù)缺損或者數(shù)據(jù)集模糊,將云模型與自組織神經(jīng)網(wǎng)絡(luò)相結(jié)合,不但具有自組織神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,還結(jié)合了云模型處理信息的不確定性的能力,更適用于復(fù)雜的城市交通系統(tǒng)研究.現(xiàn)有關(guān)于交通流預(yù)測(cè)的文獻(xiàn)中[3],對(duì)樣本數(shù)據(jù)缺失的處理效果并不太理想,本文針對(duì)交通數(shù)據(jù)中存在的不確定性問題,將云模型與自組織神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了云—自組織神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型(CMSONN)對(duì)存在樣本數(shù)據(jù)缺損情況下的交通流預(yù)測(cè)進(jìn)行優(yōu)化.
交通流量數(shù)據(jù)是常用的交通數(shù)據(jù)之一,是典型的時(shí)間序列數(shù)據(jù),運(yùn)用數(shù)據(jù)挖掘方法對(duì)交通流量數(shù)據(jù)進(jìn)行深入對(duì)比分析,可以掌握交通現(xiàn)狀,分析交通流量變化規(guī)律,為交通管理與控制、交通規(guī)劃、道路設(shè)計(jì)和交通流理論研究等提供可靠依據(jù),從而改善道路交通秩序,提高道路通行能力.通過預(yù)測(cè)模型分析,得到城市交通系統(tǒng)中關(guān)聯(lián)的交通模式或運(yùn)動(dòng)趨勢(shì)的潛在信息,是實(shí)現(xiàn)整個(gè)城市交通系統(tǒng)有效運(yùn)行的關(guān)鍵.本文采用五層網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行預(yù)測(cè)模型設(shè)計(jì),如圖1所示.
圖1 CM-SOFM結(jié)構(gòu)示意圖Fig.1 Structural representation of CM-SOFM
生成云滴的算法稱為云發(fā)生器(Cloud Generator,CG),如圖2所示.每個(gè)節(jié)點(diǎn)內(nèi)部由一組云發(fā)生器CG1,CG2,…,CGm組成,云模型的數(shù)字特征為(Ex,En,He),對(duì)于每個(gè)輸入x,通過這組云發(fā)生器得到輸出μ1,μ2,…,μn即屬性值x與云模型A1(Ex1,En1,He1),…,An(Exn,Enn,Hen)的隸屬度.在圖1中:
(1)輸入層有n個(gè)輸入,即一次輸入含有n個(gè)估計(jì)元素的輸入序列.
(2)云化層中包含n個(gè)x正態(tài)云發(fā)生器,將對(duì)輸入層的數(shù)據(jù)進(jìn)行預(yù)處理,形成的云滴drop(xi,μi),輸入到包含n個(gè)自組織神經(jīng)元的隱含層(在SONN中稱為競(jìng)爭(zhēng)層),類似度準(zhǔn)則采用歐式距離公式為映射層的權(quán)值向量),隸屬度通過神經(jīng)網(wǎng)絡(luò)隱含層進(jìn)行映射學(xué)習(xí),隸屬度通過神經(jīng)網(wǎng)絡(luò)隱含層進(jìn)行映射學(xué)習(xí).
(3)隱含層采用Log-Sigmoid函數(shù)進(jìn)行學(xué)習(xí),計(jì)算并選擇使輸入向量和權(quán)值向量的距離最小的神經(jīng)元,稱為勝出神經(jīng)元并記為j?,并給出其鄰接神經(jīng)元集合.連接權(quán)值的更新由下式計(jì)算:其中:領(lǐng)域函數(shù)以獲勝神經(jīng)元為中心設(shè)定了一個(gè)鄰域半徑,稱為勝出鄰域.學(xué)習(xí)初期,勝出神經(jīng)元和其附近的神經(jīng)元全部接近當(dāng)時(shí)的輸入向量,形成粗略的映射.σ2隨著學(xué)習(xí)的進(jìn)行而減小,勝出鄰域變窄,勝出神經(jīng)元附近的神經(jīng)元數(shù)變少.因此,學(xué)習(xí)方法是一種從粗調(diào)整向微調(diào)整變化,最終達(dá)到預(yù)定目標(biāo)的過程.wij(t+1)和wij(t)分別表示t+1和t時(shí)刻從節(jié)點(diǎn)i到節(jié)點(diǎn)j的連接權(quán)值,Δwij是連接權(quán)值的變化量,擬合后進(jìn)入逆云化層.
圖2 云發(fā)生器Fig.2 Cloud generator
(4)逆云化層包含n個(gè)Y正態(tài)云發(fā)生器,逆云化后輸出n個(gè)估計(jì)值.在本文的方法中,預(yù)測(cè)的趨勢(shì)值計(jì)算次數(shù)與測(cè)試樣本訓(xùn)練次數(shù)相關(guān),由于當(dāng)前趨勢(shì)反映的是未來的可能性,不能根據(jù)當(dāng)前數(shù)據(jù)產(chǎn)生一個(gè)確定的趨勢(shì)值作為預(yù)測(cè)結(jié)果,所以云計(jì)算的單次結(jié)果是不確定的,但是當(dāng)前趨勢(shì)的知識(shí)表達(dá)應(yīng)遵循當(dāng)前數(shù)據(jù)的分布規(guī)律,因此它應(yīng)當(dāng)表示為定性趨勢(shì).為了實(shí)現(xiàn)這種定性趨勢(shì)與定量數(shù)值之間的轉(zhuǎn)換,本文引入的G(Ex,En,He)可以表示當(dāng)前趨勢(shì).其中,期望值Ex表明當(dāng)前趨勢(shì)的中心值,作為期望預(yù)測(cè)值;熵En表示當(dāng)前趨勢(shì)的模糊度量,反映了可被當(dāng)前趨勢(shì)所接受的預(yù)測(cè)值;超熵He是熵En的不確定性度量,He越大表示當(dāng)前趨勢(shì)的模糊性越大.
CM-SONN的優(yōu)點(diǎn)是隸屬度由云發(fā)生器產(chǎn)生,而不是由傳統(tǒng)的模糊方法等產(chǎn)生.由于云模型的數(shù)據(jù)邊界是模糊的,每次訓(xùn)練或泛化的值都是隨機(jī)的,保留了數(shù)據(jù)原有的模糊性和隨機(jī)性.在進(jìn)行訓(xùn)練之前,先要將交通數(shù)據(jù)進(jìn)行擬合,轉(zhuǎn)換成定性的概念,即進(jìn)行云變換.云變換是指對(duì)于任意一個(gè)不規(guī)則的數(shù)據(jù)分布,根據(jù)設(shè)定原則進(jìn)行數(shù)學(xué)變換,使之成為若干個(gè)不同的云的疊加,常用的云變化方法有峰值云變換法和原子云模型集的歸整法.本文采取基于峰值的云變換算法,它依據(jù)兩個(gè)啟發(fā)性原理:①論域中的元素對(duì)定性概念的隸屬程度是一統(tǒng)計(jì)屬性,具有隨機(jī)性;②高頻率元素對(duì)定性概念的貢獻(xiàn)大于低頻率元素對(duì)定性概念的貢獻(xiàn).具體如下:式中g(shù)(x)為數(shù)據(jù)分布函數(shù);cj為權(quán)重函數(shù);m為疊加云的個(gè)數(shù);ε為用戶定義的可允許最大誤差,m與ε有關(guān),ε越小則m越大.
交通流周期變化的知識(shí)表示是由歷史云來完成的,歷史云由時(shí)間值t和X條件云發(fā)生器來確定,由圖1中的云化層來實(shí)現(xiàn).
本文利用江蘇省某城市城區(qū)交通數(shù)據(jù)進(jìn)行分析.該城市交通量記錄是以天為基準(zhǔn)周期性變化的,這樣有利于分析挖掘出其中的規(guī)律.為了簡(jiǎn)化數(shù)據(jù)處理且不失交通流量的規(guī)律性,把連續(xù)三周的一條主干道通行交通量作為歷史數(shù)據(jù)集來解決周末交通量出現(xiàn)突變的問題.現(xiàn)就該主干道的交通流量進(jìn)行預(yù)測(cè),車輛檢測(cè)器每天24小時(shí)檢測(cè)并記錄經(jīng)過該站的車輛信息,得到各檢測(cè)周期內(nèi)的交通流量序列并折算成小時(shí)流量.選擇2013年的交通數(shù)據(jù)作為樣本,采用CM-SONN對(duì)選定的一個(gè)工作日(以周三為例)的交通流進(jìn)行預(yù)測(cè)分析.
取交通流序列前300組數(shù)據(jù)為訓(xùn)練樣本,后100組為測(cè)試樣本,表1為部分樣本數(shù)據(jù)(單位為:百輛),其中星號(hào)表示數(shù)據(jù)缺失.輸入樣本集N=300,分別計(jì)算樣本均值一階樣本絕對(duì)中心矩,樣本方差得到以云模型參數(shù)熵En,超熵He,期望Ex初值作為初始權(quán)值,訓(xùn)練次數(shù)取5 000,訓(xùn)練目標(biāo)誤差ε取0.01,其中學(xué)習(xí)率取0.1.
表1 交通車流量數(shù)據(jù)Table 1 Traffic flow data
圖3 交通流量預(yù)測(cè)對(duì)比圖Fig.3 Comparison of traffic flow prediction
為了便于定量評(píng)價(jià)該方法預(yù)測(cè)的性能,通過以下指標(biāo)來進(jìn)行分析:
(1)均方誤差(Mean Square Error,MSE)可以評(píng)價(jià)數(shù)據(jù)的變化程度,說明預(yù)測(cè)模型描述實(shí)驗(yàn)數(shù)據(jù)誤差分布的集中與離散程度.設(shè)θ?為原數(shù)據(jù)序列θ的預(yù)測(cè)值,則
(2)平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)是一個(gè)綜合評(píng)價(jià)預(yù)測(cè)性能高低的指標(biāo),數(shù)值越低,預(yù)測(cè)效果越好,
(3)均等系數(shù)(Equal Coefficient,EC)反映的是預(yù)測(cè)曲線跟蹤觀測(cè)曲線的走向趨勢(shì),
表2 預(yù)測(cè)性能參數(shù)比較Table 2 Comparing of forecasting performance
由于云模型本身集合了數(shù)值分析中的隨機(jī)性和模糊性,每次實(shí)驗(yàn)的結(jié)果不是固定的.如圖3所示,橫軸為時(shí)間軸,縱軸為交通流量,圓圈表示預(yù)測(cè)值,星點(diǎn)表示真實(shí)值.通過對(duì)一天內(nèi)每個(gè)小時(shí)的交通預(yù)測(cè),預(yù)測(cè)性能參考數(shù)比較如表2所示,云—自組織神經(jīng)網(wǎng)絡(luò)的均方誤差是0.001 091 6,比自組織神經(jīng)網(wǎng)絡(luò)的均方誤差(MSE=0.012 347)要小很多.在表2中還可以看出,云—自組織神經(jīng)網(wǎng)絡(luò)的平均絕對(duì)百分比誤差遠(yuǎn)低于自組織神經(jīng)網(wǎng)絡(luò)的指標(biāo)值.總體來看,本文的預(yù)測(cè)方法是可行的,比自組織神經(jīng)網(wǎng)絡(luò)能更好地跟蹤觀測(cè)曲線的走向趨勢(shì).
本文針對(duì)多屬性分類技術(shù)中的不確定性和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法中訓(xùn)練樣本數(shù)據(jù)質(zhì)量的局限性,將云模型與神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了云—自組織神經(jīng)網(wǎng)絡(luò)模型.該方法在保證預(yù)測(cè)中數(shù)據(jù)的模糊性和隨機(jī)性的基礎(chǔ)上,引用云模型基礎(chǔ)理論及云模型計(jì)算方法,對(duì)實(shí)際檢測(cè)的交通流量數(shù)據(jù)進(jìn)行了分析,云—自組織神經(jīng)網(wǎng)絡(luò)模型降低了預(yù)測(cè)的泛化誤差,并提高了預(yù)測(cè)的準(zhǔn)確率.
[1]Qin Kun,Xu Kai,Liu Feilong,et al.Image segmentation based on histogram analysis utilizing the cloud model[J]. Computers&Mathematics with Applications,2011,7 (62):2824-2833.
[2]Bo Jin,Yong Wang,Zhenyan Liu,et al.A trust model based on cloud model and bayesian networks[J].Proce?dia Environmental Sciences,2011(11):452-459.
[3]董春嬌,邵春福,熊志華,等.基于Elman神經(jīng)網(wǎng)絡(luò)的道路網(wǎng)短時(shí)交通流預(yù)測(cè)方法[J].交通運(yùn)輸系統(tǒng)工程與信息,2010,10(1):145-151.[DONG C,SHAO C F, XIONG Z H,et al.Short-term traffic flow forecasting ofroad network based on elman neural network[J].Journal of Transportation Systems Engineering and Information Technology,2010,10(1):145-151.]
[4]劉海軍,柳征,姜文利,等.基于云模型和矢量神經(jīng)網(wǎng)絡(luò)的輻射源識(shí)別方法[J].電子學(xué)報(bào),2010(12):2797-2804. [LIU H J,LIU Z,JIANG W L,et al.Approach based on cloud model and vector neural network for emitter identi?fication[J]ActaElectronicaSinica,2010(12):2797-2804.]
[5]黃強(qiáng),吳建軍.基于云-神經(jīng)網(wǎng)絡(luò)的液體火箭發(fā)動(dòng)機(jī)故障檢測(cè)方法[J].國(guó)防科技大學(xué)學(xué)報(bào),2010,32(1):11-15. [HUANG Q,WU J J.Fault detection method based on cloud-neural network of liquid-propellant rocket engine [J].Journal of National University of Defense Technology, 2010,32(1):11-15.]
[6]萬映紅,胡萬平,曹小鵬.基于粗糙神經(jīng)網(wǎng)絡(luò)的客戶消費(fèi)分類模型研究[J].管理工程學(xué)報(bào),2011,25(2):142-148.[WAN Y H,HU W P,CAO X P.Constructing cus?tomer consumption classification models based on rough sets and neural network[J].Journal of Industrial Engi?neering and Engineering Management,2011,25(2):142-148.]
Traffic Flow Forecasting Model Based on Cloud-Self-Organizing Neural Network
LIAO Rui-hui,ZHOU Jing
(School of Management and Engineering,Nanjing University,Nanjing 210093,China)
ract:Modern transportation systems have complex structure,and the existence of fuzzy,stochastic and uncertainty factors increase the difficulty of huge data involved in qualitative and quantitative integrated analysis.This paper developed the cloud neural network self-organization of traffic flow forecasting model based on the characteristics of cloud model and self-organizing neural network.Using cloud model fuzziness and randomness advantages,the paper proposed the prediction model that can improve the reliability of selforganizing neural network prediction learning sample data to process data problems.Through comparing two models to a city traffic flow forecasting with actual data,the paper found that the forecasting model has higher coefficient of determination than the only using of self-organizing neural network.The results show that the model proposed in the traffic flow forecasting can improve accuracy and reduce generalization error.
rds:urban traffic;data forecasting;cloud-self-organizing neural network;traffic flow
1009-6744(2014)04-0154-06
TP391
A
2013-11-26
2014-04-18錄用日期:2014-04-25
國(guó)家自然科學(xué)基金項(xiàng)目(71371094);國(guó)家自然科學(xué)基金青年基金項(xiàng)目(71201078);教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目(12YJCZH017);江蘇省自然科學(xué)基金項(xiàng)目(BK2012305).
廖瑞輝(1986-),男,江西贛州人,博士生.*通訊作者:jzhou@nju.edu.cn