童 林,官 錚
(1.六盤水師范學(xué)院物理與電氣工程學(xué)院,貴州六盤水 553004;2.云南大學(xué)信息學(xué)院,昆明 650500)
準(zhǔn)確把握交通流量發(fā)生趨勢和變化區(qū)間是合理調(diào)控交通負(fù)荷的重要依據(jù),但由于交通流量與其影響因素之間存在著復(fù)雜非線性關(guān)系,難以建立精確的模型。眾多的研究中,參數(shù)模型中的時間序列方法用于交通流量預(yù)測取得了良好的預(yù)測效果[1],但對交通流量的波動性缺乏考慮且不適用于大數(shù)據(jù)樣本。為了更好地捕獲交通流量中的非線性時空關(guān)系,機(jī)器學(xué)習(xí)方法等非參數(shù)模型被廣泛應(yīng)用在交通流量預(yù)測中:文獻(xiàn)[2]中使用基于高斯過程的機(jī)器學(xué)習(xí)模型對交通流量預(yù)測,評估可知機(jī)器學(xué)習(xí)方法優(yōu)于時間序列模型;文獻(xiàn)[3]中提出了一種基于支持向量機(jī)(Support Vector Machine,SVM)的短時交通流量預(yù)測模型,并驗(yàn)證了SVM 模型在精度、收斂時間等指標(biāo)上均優(yōu)于BP(Back Propagation)神經(jīng)網(wǎng)絡(luò),但在核參數(shù)g和懲罰系數(shù)c參數(shù)選擇上存在難點(diǎn),而這兩個參數(shù)的選取對SVM模型預(yù)測結(jié)果影響較大;文獻(xiàn)[4]提出了基于支持向量回歸機(jī)的交通狀態(tài)短時預(yù)測方法,但同時也提到了該模型的參數(shù)優(yōu)化、預(yù)測精度的提高等還需要進(jìn)一步的研究。
隨著智能算法的提出,眾多智能優(yōu)化方法被用于優(yōu)化機(jī)器學(xué)習(xí)模型及神經(jīng)網(wǎng)絡(luò)算法的參數(shù),如:文獻(xiàn)[5]提出了遺傳算法(Genetic Algorithm,GA)優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的短時交通流混沌預(yù)測,有效降低了BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型陷入局部極小值的概率;文獻(xiàn)[6]提出了采用粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法對多核SVM 的參數(shù)進(jìn)行優(yōu)化,增強(qiáng)了模型的非線性擬合能力;文獻(xiàn)[7]提出了基于無負(fù)約束理論(No Negative Constraint Theory,NNCT)的權(quán)重積分方法來匯總多個長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)的預(yù)測結(jié)果,并使用人口極值優(yōu)化(Population Extremal Optimization,PEO)對權(quán)重系數(shù)進(jìn)行了優(yōu)化。此類智能算法存在著搜索精度低、易早熟收斂、后代迭代效率不高等共性問題,易在尋找機(jī)器學(xué)習(xí)模型最優(yōu)參數(shù)時陷入局部極值進(jìn)而降低預(yù)測精度。
部分研究者提出了基于組合模型的交通預(yù)測模型,如:文獻(xiàn)[8]提出了基于K-means 和極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)組合模型的短時交通流量預(yù)測算法,與單一機(jī)器學(xué)習(xí)模型相比,其預(yù)測精度有較大提高,但其缺陷是由于網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,隱含層的節(jié)點(diǎn)數(shù)需要在訓(xùn)練前由用戶設(shè)定或通過多次實(shí)驗(yàn)獲得最優(yōu)節(jié)點(diǎn)數(shù),導(dǎo)致算法時間復(fù)雜度較高;文獻(xiàn)[9]提出了基于K最近鄰(K-Nearest Neighbor,KNN)回歸的短時預(yù)測模算法,該算法的參數(shù)同樣需要人工設(shè)定,缺乏研究如何學(xué)習(xí)算法中的模型參數(shù)達(dá)到模型自動優(yōu)化;文獻(xiàn)[10]使用了自組織映射神經(jīng)網(wǎng)絡(luò)(Self-Organizing feature Map,SOM)和概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)進(jìn)行交通流模式劃分和對交通流模式進(jìn)行匹配,但沒有解決交通流波動較大時預(yù)測精度較低的問題。上述組合非參數(shù)模型通常需要更多時間和計(jì)算量來學(xué)習(xí)最佳參數(shù),限制了算法的實(shí)際應(yīng)用。隨著計(jì)算機(jī)計(jì)算資源的大幅度提升,深度學(xué)習(xí)在交通流量預(yù)測領(lǐng)域得到了應(yīng)用,如:文獻(xiàn)[11]提出了基于時空節(jié)點(diǎn)選擇和深度學(xué)習(xí)的城市道路短時交通流預(yù)測;文獻(xiàn)[12]提出了基于深度學(xué)習(xí)的短時交通流量預(yù)測,但深度學(xué)習(xí)為追求神經(jīng)網(wǎng)絡(luò)精度,造成模型過深以及計(jì)算代價高昂,在硬件資源匱乏時難以滿足低時延交通流量預(yù)測的要求。
交通流量預(yù)測的目的是服務(wù)于交通調(diào)度規(guī)劃與后續(xù)的協(xié)調(diào)控制,根據(jù)以上現(xiàn)有研究工作可知使用機(jī)器學(xué)習(xí)方法較多是預(yù)測交通流量的定量值,由于交通流量預(yù)測過程中存在較多的不確定因素,且交通流量變換具有一定的周期性和區(qū)間特征(即某個周期時段往往在某個區(qū)間內(nèi)波動),如果僅以短時定量值預(yù)測作為控制依據(jù),會缺乏全局性,造成調(diào)度與控制策略的頻繁切換,不利于實(shí)際交通環(huán)境應(yīng)用,對交通流量變化趨勢和變化區(qū)間的預(yù)測更有利于后續(xù)的交通規(guī)劃和流量控制。本文在充分考慮其他研究的基礎(chǔ)上,提出了采用模糊信息粒化(Fuzzy Information Granulation,F(xiàn)IG)和改進(jìn)的鯨魚優(yōu)化算法(Improved Whale Optimization Algorithm,IWOA)的SVM交通區(qū)間預(yù)測方法。
所提方法主要工作有:1)采用鯨魚優(yōu)化算法(Whale Optimization Algorithm,WOA)對SVM 的參數(shù)進(jìn)行優(yōu)化提高了SVM 預(yù)測的準(zhǔn)確度;同時對WOA 進(jìn)行改進(jìn),進(jìn)一步提高了SVM 參數(shù)優(yōu)化的準(zhǔn)確性,避免算法搜尋SVM 最優(yōu)參數(shù)時陷入局部最優(yōu)。2)在交通流量定量值預(yù)測的基礎(chǔ)上引入模糊信息?;乃枷?,解決了單一的交通流量預(yù)測模型不能表征預(yù)測結(jié)果的問題,同時給出交通流量預(yù)測值和其變化區(qū)間,為交通流量預(yù)測提供一種更可靠的方法。3)FIG 方法使得交通流量可以從傳統(tǒng)點(diǎn)預(yù)測轉(zhuǎn)向區(qū)間預(yù)測,另外,還可通過縮短和擴(kuò)增FIG 時間窗的寬度,對交通流量進(jìn)行中短期或中長期預(yù)測,并可以模擬交通流的波動區(qū)間。實(shí)驗(yàn)結(jié)果表明,本文所提的基于FIG 和IWOA-SVM 的交通流量區(qū)間預(yù)測模型,不僅提高了交通流量預(yù)測的準(zhǔn)確性,而且能夠解決單一的交通流量預(yù)測模型存在的預(yù)測結(jié)果可靠性低的問題,為智能交通流量監(jiān)測提供更有效的信息。
本文從交通流量變化區(qū)間預(yù)測出發(fā),提出如圖1 所示的交通流量區(qū)間預(yù)測建模策略,模型主要按照以下3 個方面進(jìn)行構(gòu)建:
圖1 交通流量區(qū)間預(yù)測建模策略Fig.1 Traffic flow interval prediction modeling strategy
1)針對WOA存在搜索精度低、易陷入局部最優(yōu)的缺點(diǎn),提出了IWOA。首先將動態(tài)對立學(xué)習(xí)引入到WOA的種群初始化中,改善算法初始種群質(zhì)量;并通過非線性函數(shù)代替了WOA參數(shù)的線性選擇,計(jì)算數(shù)據(jù)的變化趨勢并動態(tài)更新模型的超參數(shù),提高了WOA在高維數(shù)據(jù)中的收斂速度和預(yù)測精度。
2)考慮到SVM 模型在懲罰參數(shù)和核函數(shù)的選擇上存在難點(diǎn)和IWOA 在求解高維數(shù)據(jù)優(yōu)化問題上的優(yōu)勢,提出了一種IWOA 對SVM 進(jìn)行優(yōu)化的IWOA-SVM 交通流量定量值預(yù)測模型。
3)影響交通流量變化因素較多,導(dǎo)致交通流量預(yù)測波動頻繁,僅靠定量值進(jìn)行預(yù)測難以準(zhǔn)確地表征其真實(shí)交通狀況,帶來交通調(diào)控方向錯誤。針對交通流量定量值預(yù)測不能表征預(yù)測結(jié)果可信度的問題,本文模型結(jié)合IWOA-SVM 算法和模糊信息?;枷?,提出了一種基于IWOA-SVM 和FIG 的交通流量變化區(qū)間預(yù)測方法,實(shí)現(xiàn)交通流量預(yù)測值和預(yù)測區(qū)間的同時預(yù)測。
與傳統(tǒng)SVM 算法對定量值預(yù)測的思路不同,本文提出的實(shí)現(xiàn)過程交通流量定量值經(jīng)過模糊信息粒化后能夠根據(jù)窗口數(shù)分解為三個部分上界(Up)、趨勢值(R)和下界(Low),在SVM 中采取相同的懲罰函數(shù)c和核參數(shù)g不能夠很好地學(xué)習(xí)三種流量的變化規(guī)律,因此利用改進(jìn)的鯨魚算法尋找SVM 的最佳超參數(shù),分別為cUp和gUp、cR和gR、cLow和gLow,其流程如圖2 所示。得到SVMUp、SVMR和SVMLow這三種SVM 模型對交通流量變化區(qū)間分別進(jìn)行預(yù)測。最后建立了FIG-IWOA-SVM 模型,以進(jìn)一步增強(qiáng)預(yù)測交通流量區(qū)間的能力,使FIG-IWOASVM模型擁有更高的交通流量區(qū)間預(yù)測精度。
圖2 IWOA優(yōu)化SVM超參數(shù)流程Fig.2 Flowchart of IWOA optimizing SVM hyperparameters
信息粒度(Information Granulation,IG)計(jì)算被應(yīng)用于模擬人類思維并解決復(fù)雜問題。它通過相似性、函數(shù)逼近和區(qū)分將整體分為幾個部分,每個部分都是一個信息粒。通過信息粒化研究信息的形成、表示、粗細(xì)、語義解釋等。在信息?;幕A(chǔ)上,Zadeh[13]于1979年首次提出FIG,如式(1)所示:
其中:x是實(shí)數(shù)集合R中的變量;G作為R的模糊子集,由隸屬函數(shù)μG來刻畫;λ表示x屬于G的可能性概率。首先,通過劃分每個子間隔作為窗口并選擇窗口大小,可以維護(hù)數(shù)據(jù)信息,簡化數(shù)據(jù)序列,并使其易于研究。然后,對一個窗口進(jìn)行模糊處理以生成許多模糊顆粒以替換相關(guān)信息。
假設(shè)交通時間數(shù)據(jù)序列為X=(x1,x2,…,xn),并劃分6 個數(shù)據(jù)序列為一個窗口,可得交通時間序列數(shù)據(jù)的信息?;^程如圖3所示。
圖3 交通時間序列數(shù)據(jù)的模糊信息?;翱趧澐諪ig.3 Fuzzy information granulation window partitioning of traffic time series data
對數(shù)據(jù)進(jìn)行模糊?;瘯r需要確定具體的隸屬函數(shù),模糊顆粒的常見模糊隸屬度函數(shù)由三角形、高斯等組成。三角形模糊隸屬度函數(shù)[14]如式(2)所示:
式中:x為模糊論域中的變量;a和b分別為模糊上界和模糊下界;d為模糊核參數(shù)。三角形模糊隸屬函數(shù)如圖4所示。
圖4 三角形模糊隸屬函數(shù)Fig.4 Triangle fuzzy membership function
WOA 是Mirjalili 等[15]于2016 年提出的一種新穎的自然啟發(fā)式優(yōu)化算法。根據(jù)鯨魚捕食的方式提出了鯨魚狩獵行為的數(shù)學(xué)模型,包括3個部分:隨機(jī)搜索、包圍捕食、攻擊獵物。
1)包圍獵物。
座頭鯨可以發(fā)現(xiàn)誘餌并將其包圍,在確定最佳搜索者代理后,其他搜索者將根據(jù)最佳搜索者更新其職位。此行為[15]由式(3)表示:
式中:r1和r2為[0,1]的隨機(jī)向量;e為收斂因子,收斂邊界為2到0,定義為:
式中tmax為最大迭代次數(shù)。
2)Bubble-net攻擊。
鯨魚利用螺旋運(yùn)動和向上運(yùn)動來制造氣泡,并使用泡泡狩獵策略捕食獵物。有兩種方法可以模擬座頭鯨的泡泡網(wǎng)攻擊行為:一種是收縮包圍機(jī)制;另一種是位置的螺旋更新。通過縮小包圍或螺旋運(yùn)動,鯨魚更接近誘餌。在螺旋更新位置方法中,其數(shù)學(xué)模型[15]如式(7)所示:
式中:D=為鯨魚與當(dāng)前全局最優(yōu)個體之間的距離;k為對數(shù)螺旋形狀的常數(shù);l為[?1,1]的隨機(jī)數(shù)。
座頭鯨在圍捕獵物時不僅以螺旋形態(tài)游向獵物,還要收縮包圍圈,要對此行為建模,假設(shè)鯨魚在圍捕獵物更新動作時選擇收縮包圍機(jī)制和螺旋更新位置概率為50%,數(shù)學(xué)模型[15]如式(8)所示:
式中p為[0,1]的隨機(jī)數(shù)。
3)隨機(jī)搜索。
搜索獵物的過程中,為保證WOA 的全局探索能力,即在更大的搜索范圍內(nèi)找到更好的候選解,通過對系數(shù)向量|A|值的判斷選擇鯨魚搜索方式。當(dāng)|A|>1 時,鯨魚在收縮包圍圈外游動,鯨魚會根據(jù)周邊鯨魚的位置進(jìn)行隨機(jī)搜索,鯨魚隨機(jī)搜索數(shù)學(xué)模型[15]式(9)所示:
1)對立學(xué)習(xí)。
WOA 在首次迭代之前,需要選取一組隨機(jī)的值用來初始化種群個體。由于可行解范圍較大,存在初始化位置選擇盲目的問題,容易造成初始搜索位置不佳,因此,改善初始種群的位置可以加快算法收斂。基于對立學(xué)習(xí)(Opposition-Based Learning,OBL)[16]已被廣泛應(yīng)用于各種算法初始的學(xué)習(xí)階段,以增強(qiáng)算法的搜索能力[16],其核心思想是通過計(jì)算當(dāng)前值及其對應(yīng)的對立值來尋求更好的候選解決方案,從而豐富開發(fā)空間。對立學(xué)習(xí)定義如式(10)所示:
將對立學(xué)習(xí)拓展到高維,形成多維對立學(xué)習(xí)[16]如式(11):
式中:ub和lb為高維可行解的上下界,ub和lb為高維可行解的上下界向量,然后選擇適應(yīng)度較好的種群用來對算法進(jìn)行初始化。為了進(jìn)一步增強(qiáng)OBL 策略,本文將對立學(xué)習(xí)做出一定的改進(jìn),在對立學(xué)習(xí)的基礎(chǔ)上添加隨機(jī)因子改進(jìn)為動態(tài)對立學(xué)習(xí),該算法具有搜索空間不對稱和動態(tài)調(diào)整以及隨機(jī)產(chǎn)生相反數(shù)的特征。動態(tài)對立學(xué)習(xí)定義如下:
式中:JO為經(jīng)過動態(tài)對立學(xué)習(xí)的種群位置;r3為(0,1)的隨機(jī)值。將經(jīng)過動態(tài)對立學(xué)習(xí)的種群適應(yīng)度與標(biāo)準(zhǔn)算法種群適應(yīng)度進(jìn)行對比,選擇較優(yōu)的種群作為初始化種群,具體如式(13):
2)自適應(yīng)收斂因子。
基本的鯨魚優(yōu)化算法中,收斂因子e呈線性變化,線性遞減的收斂因子會造成算法在前期搜索較慢、后期求解不精細(xì),不利于算法區(qū)分全局搜索和局部搜索。為平衡全局搜索與局部搜索,采用非線性函數(shù)替代e,如式(14)所示的Sigmoid 函數(shù)[17]常被用作神經(jīng)網(wǎng)絡(luò)的激活函數(shù),具有前期下降快和后期下降較慢的特點(diǎn)。
為增強(qiáng)算法的全局搜索和局部尋優(yōu)能力,將Sigmoid函數(shù)引入到收斂因子中。
式中emax為收斂因子設(shè)定的最大值?;赟igmoid函數(shù)重新定義了收斂因子的變化率,使收斂因子的值隨迭代次數(shù)的增加呈非線性減小。在算法迭代的初期,e減小較快,有利于全局搜索,可以更全面地發(fā)現(xiàn)多個潛在極值,進(jìn)而快速地進(jìn)行全局搜索;而在后期,隨著迭代次數(shù)的增加,e的變化率逐漸減小,算法在局部搜索時可以對最優(yōu)解進(jìn)行更精細(xì)化的搜索。
3)動態(tài)權(quán)值因子。
動態(tài)權(quán)值因子的變化能夠影響算法的全局勘探能力和局部尋優(yōu)能力。為進(jìn)一步提高算法的收斂速度和精度,結(jié)合控制參數(shù)e的動態(tài)變化,在局部位置更新中引入了和非線性收斂因子e同步變化的自適應(yīng)權(quán)值w,并添加了自適應(yīng)權(quán)值系數(shù)η,具體操作如式(16)所示:
本文將權(quán)值w的表達(dá)式設(shè)置為w(t)=e,算法搜索階段的迭代次數(shù)t→tmax時,對算法的位置更新,采用動態(tài)權(quán)值因子,使權(quán)重能夠跟隨適應(yīng)度的變化調(diào)整權(quán)值,算法的求解精度和收斂速度在尋優(yōu)過程中進(jìn)一步改善,有利于算法跳出次優(yōu)解。
本文所提的IWOA 主要是由對立學(xué)習(xí)種群初始化、自適應(yīng)收斂因子和動態(tài)權(quán)值因子組成。當(dāng)種群數(shù)目為N、優(yōu)化問題的維度為D時,初始化種群的計(jì)算復(fù)雜度為O(ND);在鯨魚位置更新環(huán)節(jié),計(jì)算復(fù)雜度為O(ND)。因此每一次迭代過程中,算法的計(jì)算復(fù)雜度為O(2ND),近似為O(ND),等于WOA的復(fù)雜度O(ND)。表1中給出了GA、PSO、WOA及IWOA的計(jì)算復(fù)雜度。
表1 不同算法的計(jì)算復(fù)雜度Tab.1 Computational complexities of different algorithms
由表1 可知,四種算法的計(jì)算復(fù)雜度由種群數(shù)目N和優(yōu)化問題D的維度決定,當(dāng)優(yōu)化問題的維度較高(D?N)時,四種算法的計(jì)算復(fù)雜度都為O(ND),屬于同一數(shù)量級。
為了驗(yàn)證IWOA 的性能,本文選取了單峰、多峰和固定維度的9 個基準(zhǔn)優(yōu)化問題如表2 所示,其中:F1~F4 為高維的單峰基準(zhǔn)函數(shù),F(xiàn)5~F7 為高維的多峰基準(zhǔn)函數(shù),F(xiàn)8~F9 為固定維的多峰基準(zhǔn)函數(shù)。單峰函數(shù)用于測試IWOA 的收斂速度和求解精度,多峰函數(shù)用于測試IWOA的全局探索能力。
表2 基本測試函數(shù)Tab.2 Basic test functions
為研究算法在不同維度下的性能,F(xiàn)1~F7 在實(shí)驗(yàn)中分別設(shè)置D=10,30,50。由于F8~F9 為固定維度函數(shù),不參與多維度測試,利用WOA 和IWOA 分別對每個測試函數(shù)獨(dú)立運(yùn)行20次,記錄各個測試函數(shù)尋優(yōu)的平均值,實(shí)驗(yàn)結(jié)果如表3 所示,其中加粗字體表示效果最好的結(jié)果。
表3 不同算法尋優(yōu)性能比較Tab.3 Optimization performance comparison of different algorithms
由表3的結(jié)果可知,在單峰函數(shù)F1~F4上IWOA 的求解精度明顯高于WOA,隨著維度D由10增加到30和50時,目標(biāo)函數(shù)趨于復(fù)雜,提高了WOA 求解的難度,IWOA 和WOA 求解精度有所下降。在多峰函數(shù)F6~F7 的求解上,添加了動態(tài)收斂因子和權(quán)值的IWOA 能夠更加精確地求解函數(shù)最優(yōu)值,具有較高的求解精度和魯棒性。另外,在固定維多峰函數(shù)上,IWOA 同樣取得了更優(yōu)的解。通過以上結(jié)果對比驗(yàn)證了改進(jìn)算法在全局尋優(yōu)上的有效性。
SVM 被廣泛應(yīng)用于分類和回歸預(yù)測問題上,是由Vapink[18]在1995 年提出的,其基本原理和推導(dǎo)見參考文獻(xiàn)[18]。對于給定的樣本集,為了避免SVM 在學(xué)習(xí)訓(xùn)練的過程中,主觀選擇懲罰系數(shù)c和核參數(shù)g導(dǎo)致算法性能不佳,如核參數(shù)的值過小會導(dǎo)致支持向量機(jī)相互影響較大,預(yù)測精度降低,核參數(shù)過大則無法保證模型的推廣能力[19]。利用WOA求取優(yōu)化問題的優(yōu)勢,將IWOA應(yīng)用在SVM參數(shù)尋優(yōu),進(jìn)一步提高SVM模型性能。IWOA-SVM模型偽代碼如下。
輸入 目標(biāo)函數(shù),鯨魚群參數(shù)。
輸出 最優(yōu)個體位置參數(shù)。
本文選取兩個模型分別進(jìn)行驗(yàn)證:
第一組數(shù)據(jù) 采用UCI 機(jī)器學(xué)習(xí)數(shù)據(jù)庫中2017 年11 月明尼阿波里斯市交通流量數(shù)據(jù)進(jìn)行實(shí)證研究。數(shù)據(jù)模型包含溫度、降雨量、降雪量、烏云量,采樣周期為1 h,共720 條數(shù)據(jù)。
第二組數(shù)據(jù) 采用文獻(xiàn)[20]中國內(nèi)某路口的2011年10月25日至10月27日3天的7:00—19:00 的某交叉路口交通數(shù)據(jù)流量集,數(shù)據(jù)模型僅包含交通流量,采樣周期15 min,共144條數(shù)據(jù)。
采用平均絕對誤差(Mean Absolute Error,MAE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)作為算法測試的評價標(biāo)準(zhǔn)。
1)MAE定義為:
2)MAPE定義為:
3.2.1 第一組數(shù)據(jù)實(shí)驗(yàn)對比
首先,對第一組交通流預(yù)測采取多因素預(yù)測,利用SVM建立的回歸模型對交通流量進(jìn)行回歸擬合,其中參數(shù)選擇分別經(jīng)GA、PSO、WOA 及IWOA 優(yōu)化得到的最佳參數(shù)c和g對SVM 進(jìn)行訓(xùn)練,得到GA-SVM、PSO-SVM、WOA-SVM、IWOASVM 模型,再對原始數(shù)據(jù)進(jìn)行預(yù)測,得到11 月30 號數(shù)據(jù)預(yù)測結(jié)果如圖5所示。
圖5 第一組交通流量預(yù)測結(jié)果Fig.5 Prediction results of the first group of traffic flow
由圖5 可以看出,IWOA-SVM 模型對于大部分訓(xùn)練樣本都能進(jìn)行很好的擬合,其預(yù)測精度較高,IWOA-SVM 模型具有較強(qiáng)的尋優(yōu)能力。各個模型MAE 和MAPE 對比如表4 所示,可以看到IWOA-SVM性能最好。
表4 第一組交通數(shù)據(jù)實(shí)驗(yàn)性能對比Tab.4 Experimental performance comparison of the first group of traffic data
3.2.2 第二組數(shù)據(jù)實(shí)驗(yàn)對比
對第二組交通流量數(shù)據(jù)進(jìn)行預(yù)測,各個模型結(jié)果對比如圖6 所示,MAE 和MAPE 對比如表5 所示,其中時間段ID 間隔為15 min。
圖6 第二組交通流量預(yù)測結(jié)果Fig.6 Prediction results of the second group of traffic flow
表5 第二組交通數(shù)據(jù)實(shí)驗(yàn)性能對比Tab.5 Experimental performance comparison of the second group of traffic data
由于第二組數(shù)據(jù)量較小且數(shù)據(jù)模型僅包含交通流量,各個模型預(yù)測性能差別較小,從對比圖中不易看出區(qū)別,但從表5中可以看出,IWOA預(yù)測精度略優(yōu)。
為進(jìn)一步對交通流量發(fā)生趨勢和變化空間進(jìn)行預(yù)測,采用FIG方法對交通時間序列進(jìn)行處理,具體步驟如下:
步驟1 FIG 建立,對采集到的交通數(shù)據(jù)以1 h 為時間間隔建立交通時間序列窗口X=(x1,x2,…,xn),并選取粒度窗口大小o。
步驟2 確定三角形模糊集的核d、三角形模糊集的上界a和下界b。
步驟3 根據(jù)式(2),交通流量經(jīng)過FIG,分別得到交通流量的下限Low 部分、交通流量上限Up 部分和描述交通流量平均水平的R部分。
對Low、Up 及R 三個部分進(jìn)行預(yù)測能夠進(jìn)一步判斷交通流量發(fā)生趨勢和變化空間。
3.3.1 第一組數(shù)據(jù)實(shí)驗(yàn)對比
對第一組國外11 月份交通流量使用FIG 后的數(shù)據(jù)如圖7所示,其中窗口大小o=6,24 h 數(shù)據(jù)序列被劃分為6 個窗口。通過圖7 可以看到,720 組數(shù)據(jù)經(jīng)過模糊窗口?;蠓譃榱?20組數(shù)據(jù),?;蟮?個部分能夠針對性地描述交通流量變化區(qū)間和趨勢。
圖7 第一組交通流量模糊?;Y(jié)果Fig.7 The first group of traffic flow fuzzy granulation results
根據(jù)FIG 結(jié)果,分別利用FIG-GA-SVM、FIG-PSO-SVM、FIG-WOA-SVM、FIG-IWOA-SVM 模型來預(yù)測以上3個成分(區(qū)間上界,區(qū)間下界和趨勢成分),實(shí)際范圍值和預(yù)測范圍值數(shù)據(jù)格式為[Low,R,Up]。其中4 組數(shù)據(jù)序列為1 天,11 月28、29、30 日共3 天的數(shù)據(jù)用于驗(yàn)證所建模型的泛化能力。不同模型的交通流量變化趨勢和空間預(yù)測對比如表6所示。
從表6 可以看出,對于測試樣本,F(xiàn)IG-IWOA-SVM 模型預(yù)測趨勢和變化區(qū)間最接近實(shí)際交通流量范圍值,GA和PSO優(yōu)化的FIG-SVM 模型對交通流量區(qū)間的預(yù)測與實(shí)際交通流量變化區(qū)間相比誤差較大。在描述交通流量發(fā)生趨勢R值的第1、5、9組數(shù)據(jù)預(yù)測上,F(xiàn)IG-GA-SVM 模型和FIG-PSO-SVM 模型預(yù)測精度較低,與FIG-WOA-SVM 和FIG-IWOA-SVM 模型相比,預(yù)測精度不平穩(wěn),難以滿足交通流量預(yù)測的需要。FIGIWOA-SVM 泛化能力較強(qiáng),在多種交通流量預(yù)測上精度均高于其他三種模型。為了更加直觀地了解FIG-GA-SVM、FIGPSO-SVM、FIG-WOA-SVM、FIG-IWOA-SVM 四種模型預(yù)測精度,在表6 的基礎(chǔ)上計(jì)算了四種模型的預(yù)測相對誤差百分比,結(jié)果如表7所示。
表6 第一組交通流量變化趨勢和變化區(qū)間預(yù)測Tab.6 Change trend and change interval prediction of the first group of traffic flow
表7 第一組交通流量變化趨勢和變化區(qū)間預(yù)測誤差 單位:%Tab.7 Change trend and change interval prediction error of the first group of traffic low unit:%
通過表7 可以看出,在預(yù)測描述交通流量區(qū)間的下界值時,四種模型預(yù)測精度相差較小,但在預(yù)測描述交通流量的趨勢值R 和區(qū)間的上界值Up 時,F(xiàn)IG-IWOA-SVM 模型和FIGWOA-SVM 模型相較于FIG-GA-SV 模型和FIG-PSO-SVM 模型相對誤差較低,表明WOA 能夠更加精確地找到SVM 模型的最優(yōu)參數(shù)。FIG-IWOA-SVM 模型對WOA 進(jìn)一步優(yōu)化,在交通流量區(qū)間下界值Low 中的第11 組數(shù)據(jù)精度大于FIG-WOASVM,對于趨勢值R 預(yù)測兩個模型精度相同,而在描述交通流量的Up 上界值上,F(xiàn)IG-IWOA-SVM 模型在1、5、7、8、9 組數(shù)據(jù)上精度均優(yōu)于FIG-WOA-SVM模型。
3.3.2 第二組數(shù)據(jù)實(shí)驗(yàn)對比
對第二組11月份國內(nèi)某路口交通流量使用FIG后的數(shù)據(jù)如圖8 所示,其中窗口大小為o=4,1 h 數(shù)據(jù)序列被劃分為1個窗口??梢钥吹剑?44 組數(shù)據(jù)經(jīng)過模糊窗口?;蠓譃榱?6組數(shù)據(jù)。
圖8 第二組交通流量模糊?;Y(jié)果Fig.8 The second group of traffic flow fuzzy granulation results
根據(jù)FIG 結(jié)果,分別利用四個模型來預(yù)測交通區(qū)間,數(shù)據(jù)格式為[Low,R,Up],其中12 組數(shù)據(jù)序列為1 d,10 月27 號18:00—19:00 的數(shù)據(jù)用于驗(yàn)證所建模型的泛化能力。不同模型的交通流量變化趨勢和空間預(yù)測對比如表8 所示,交通 流量變化趨勢和空間預(yù)測誤差如表9所示。
表8 第二組交通流量變化趨勢和變化區(qū)間預(yù)測Tab.8 Change trends and change interval prediction of the second group of traffic flow
表9 第二組交通流量變化趨勢和變化區(qū)間預(yù)測誤差 單位:%Tab.9 Change trend and change interval prediction error of the second group of traffic flow unit:%
由表8 可以看出,F(xiàn)IG-IWOA-SVM 模型預(yù)測交通流量更接近于實(shí)際交通流量,其中,使用FIG-GA-SVM 和FIG-PSOSVM 模型預(yù)測的Low 值與實(shí)際Low 值誤差較大,R 值部分中除第一個數(shù)據(jù)外,4個模型預(yù)測值相同,Up部分中四個模型預(yù)測值較為接近。由表9 可得,F(xiàn)IG-IWOA-SVM 模型預(yù)測誤差最小。
總體上,F(xiàn)IG-IWOA-SVM 模型預(yù)測值較為平穩(wěn)、精度更優(yōu),進(jìn)一步驗(yàn)證了IWOA 的有效性,表明該模型能更加精確地預(yù)測交通流量的變化趨勢和區(qū)間。
為了對交通流量變化趨勢和范圍進(jìn)行預(yù)測,本文提出了改進(jìn)鯨魚優(yōu)化算法優(yōu)化支持向量機(jī)的交通流量模糊粒化預(yù)測模型。通過動態(tài)對立學(xué)習(xí)、自適應(yīng)權(quán)重及動態(tài)閾值對WOA的恒定權(quán)重進(jìn)行了改進(jìn),提高了WOA 的預(yù)測精度,并在9 個測試函數(shù)上進(jìn)行性能測試驗(yàn)證了IWOA 的優(yōu)越性。同時,對交通流量信息模糊?;?,建立了多因素影響下的交通流量區(qū)間集合。最后,通過兩種實(shí)際算例對交通流量變化區(qū)間進(jìn)行預(yù)測,實(shí)驗(yàn)結(jié)果表明,所提FIG-IWOA-SVM 預(yù)測精度更高。下一步工作將圍繞大規(guī)模路網(wǎng)下的交通流量變化空間和趨勢預(yù)測,并將區(qū)間預(yù)測和短時預(yù)測相結(jié)合進(jìn)一步提高算法的實(shí)用性。