• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于集成算法的鐵路客流短期預測模型研究

    2022-05-27 11:02:22
    關鍵詞:客流精度誤差

    劉 杰

    (重慶工程職業(yè)技術學院 智能制造與交通學院,402260)

    0 引 言

    客流預測是鐵路運營管理中一項重要的基本工作,科學合理的把握線路乃至路網(wǎng)客流狀態(tài),能為鐵路的收益管理和決策提供數(shù)據(jù)支持。預測分為短、中、長期預測,由于中長期預測時間跨度較大,除自身歷史客流數(shù)據(jù)規(guī)律外,還要更多考慮經(jīng)濟社會政策突變因素影響。短期預測時間跨度小,在歷史數(shù)據(jù)較為充足的情況下,短期客流可以通過對歷史客流數(shù)據(jù)規(guī)律挖掘來較為精確的預測。

    目前,客流預測研究成果多集中在短期客流預測。王洪業(yè)等[1]以客票系統(tǒng)數(shù)據(jù)為基礎,將客票數(shù)據(jù)轉換為客運量時序數(shù)據(jù),采用改進的移動平均法對客流進行預測;李夏苗等[2]基于模糊預測和客流OD推算方法對一條高速鐵路線路車站發(fā)送人數(shù)進行預測,得到較好的效果;楊曉等[3]考慮高速鐵路短期客流周期性和波動性特征,提出改進重力模型對客流進行預測;帥斌等[4]根據(jù)北京市郊客流的特點,利用灰色預測模型對S2線客流進行了預測,得到了較高的預測精度;李曉俊等[5]基于客流復雜性和非線性特點建立徑向基神經(jīng)網(wǎng)絡預測模型;宋嘉雯等[6]基于鐵路客流性質提出四階段法對銀川—寧樂鐵路初、中、長期客流分別預測;豆飛等[7]把客流變化率模糊化,并利用其模糊值時序關系建立客運專線模糊k近鄰預測模型;李麗輝等[8-9]將灰色預測模型和雙約束重力模型組合起來對京滬高鐵客流進行預測;楊軍等[10]提出利用小波分解將原始客流時序數(shù)據(jù)分為高頻和低頻2個子序列,再利用SVM回歸算法分別對高頻和低頻子序列進行預測,最后用小波重構得到預測值的地鐵客流預測方法;T.H.TSAI等[11]利用多時間單元神經(jīng)網(wǎng)絡和并行集成神經(jīng)網(wǎng)絡對鐵路短期客流進行預測,結果表明其在均方誤差上明顯優(yōu)于傳統(tǒng)多層感知機模型;YU Wei等[12]將經(jīng)驗模態(tài)分解和反向傳播神經(jīng)網(wǎng)絡模型結合對地鐵客流短期預測,得到精度較高且穩(wěn)定的結果; JIANG Xiushan等[13]將集合經(jīng)驗模態(tài)分解和灰色支持向量機結合對武漢—廣州高鐵客流進行短期預測,結果表明其平均誤差小于既有的支持向量機和ARIMA模型預測結果;M.MILENKOVIC等[14]利用季節(jié)自回歸移動平均模型對塞爾維亞鐵路2014年1—6月客流預測,取得了較好效果;SUN Yuxing等[15]將小波分解和支持向量機模型結合對北京地鐵短期客流進行預測,該方法預測結果精度較高,且穩(wěn)定性好。

    現(xiàn)有鐵路客流預測主要分為2大類:①是傳統(tǒng)時序預測模型,如ARIMA和GM(1,1)等,這類模型使用簡單,但處理復雜非線性能力不強;②基于機器學習的模型,如隨機森林、SVM回歸和k鄰近模型等,這類模型預測精度高,但需要外部特征數(shù)據(jù)支持,增加了數(shù)據(jù)收集和分析的難度。為了克服以上模型缺點,在鐵路客流短期問題上,筆者研究思路為首先以鐵路車站間OD客流為預測對象,再將小波分解和ARIMA模型組合構建單個預測模型(以下簡稱:弱模型),最后采用集成算法Adaboost將多個弱模型集成為一個預測模型(以下簡稱:強模型),最后在測試集上進行驗證。理論上已經(jīng)證明,集成算法組合的強模型在預測精度和泛化能力上要高于單個弱模型。

    1 抽 樣

    (1)

    (2)

    為了后面算法描述方便,將樣本集F重新記為F={(xh,yh),h=1,2,…,|F|},其中,|F|表示樣本集樣本數(shù)量。

    有了樣本集,采用留出法(hold-out)得到訓練集U和測試集V,且滿足:

    |U|∶|V|=4∶1

    (3)

    |U|+|V|=|F|

    (4)

    式中:|U|為訓練集樣本數(shù)量;|V|為測試集樣本數(shù)量。

    2 客流預測

    ARIMA是一種常用的時間序列建模方法,它不僅描述了數(shù)據(jù)點之間的相關性,也考慮了數(shù)值之間的差異性,但ARIMA模型對數(shù)據(jù)平穩(wěn)性有較高要求,鐵路客流的時間序列數(shù)據(jù)很難滿足,因此對時間序列先進行小波分解,分解后各子序列相比原始序列更加平穩(wěn),更符合ARIMA模型對數(shù)據(jù)性質的要求,從而可以適當提高預測精度。

    2.1 小波分解

    考慮客流數(shù)據(jù)離散特性,采用一維離散小波分解,如式(5):

    (5)

    式中:C(0,k)為低頻系數(shù);D(l,k)為高頻系數(shù);φ(0,k)(h)為尺度函數(shù);ψ(l,k)(h)為小波函數(shù);l和k為整數(shù)。

    2.2 ARIMA模型

    自回歸移動平均模型ARIMA[16-17]是基于時間序列數(shù)據(jù)自相關性,利用歷史值和擬合誤差的線性組合預測的一種線性模型,如式(6)。ARIMA模型算法流程如圖1。

    Xt=a1Xt-1+…+apXt-p+εt-…-bqεt-q

    (6)

    式中:p為自回歸階數(shù);a1,…,ap為自回歸系數(shù);q為滑動平均階數(shù);Xt為t時刻預測值;Xt-1,…,Xt-p為t-1,…,t-p時刻歷史數(shù)據(jù);εt,εt-1,…,εt-p為t,t-1,…,t-p時刻擬合誤差。

    圖1 ARIMA模型算法預測流程Fig. 1 ARIMA model algorithm prediction process

    從小波分解角度,不同的小波基{φ(0,k)(h),ψ(l,k)(h),l∈N,k∈Z}得到的低頻和高頻系數(shù)不一樣,因此在77種常見小波基中進行篩選,最終選擇在樣本上加權誤差和最小的小波基。算法步驟如下:

    步驟2:利用小波基dr對(xh,yh)中特征序列xh分解得到C(0,k)和D(l,k)。

    步驟5:如果r=R, 則r=argrmin(Te), 輸出dr,算法結束;否則r=r+1,b=0,轉步驟2。

    3 客流預測集成模型

    在特征序列較短時,弱模型的泛化能力不強,為挖掘所有OD客流整體規(guī)律,采用Adaboost算法思想將若干個Gm(xh,dr)集成為一個強模型,Gm(xh,dr)表示第m個弱模型,其中m=1,2,…,M,M為弱模型數(shù)量。

    集成算法是通過樣本預測誤差更新弱模型權重,最終在損失目標函數(shù)達到最優(yōu)時得到最佳組合[18]。集成算法步驟如下:

    步驟1:初始化參數(shù)M,μ。其中,μ為防過擬合參數(shù)且0<μ<1,令m=1。

    步驟2:在U上訓練Gm(xh,dr),得到一個使所有訓練樣本加權誤差最小的Gm(xh,dr)。

    …,αMGM(xh,dr),r∈[1,R]的中位數(shù),算法結束;否則,m=m+1,轉步驟2。

    4 案例分析

    表1 77種常用小波基名稱集合Table 1 Name set of 77 kinds of commonly used wavelet bases

    4.1 模型參數(shù)估計

    按第2節(jié)中小波基的選擇算法確定,最終的小波基為Coiflets 5。按第3節(jié)集成算法確定得到100個弱模型權重值如表2。

    表2 集成模型權重系數(shù)Table 2 Weight coefficients of ensemble model

    4.2 預測模型精度對比

    將測試集V分別用灰色預測模型GM(1,1),ARIMA同筆者模型分別測試,以平均絕對誤差MA、平均相對誤差MR和預測均方差MS指標度量,公式如式(7)~式(9):

    (7)

    (8)

    (9)

    表3 模型預測精度結果對比Table 3 Comparison of model prediction accuracy results

    表3為模型預測精度結果。由表3可知:筆者模型比GM(1,1)和ARIMA在30天的短期預測上預測精度有明顯提高,在MA、MR和MS上與GM(1,1)相比分別提高42.90%、98.61%和63.74%;與ARIMA相比分別提高33.34%、36.94%和13.30%。

    從指標結果來看GM(1,1)不適合用來對渝萬線特征序列客流進行短期預測,其預測誤差過大,原因在于GM(1,1)是以指數(shù)形式的變化趨勢來進行預測,而特征序列的反復波動性不符合GM(1,1)的特點。ARIMA預測效果優(yōu)于GM(1,1),說明渝萬線客流除具有周期性和波動性外,還體現(xiàn)一定的線性特征。預測時間跨度越大,預測的累計誤差隨之增加,精度降低。筆者選擇預測時間跨度為30天,在這個時間跨度上獲得了較好的精度結果,因此可以將模型和算法泛化到時間跨度小于30天的數(shù)據(jù)集上。

    5 結 語

    筆者對數(shù)據(jù)抽樣的變長時間序列樣本進行訓練與預測,充分挖掘原始時間序列數(shù)據(jù)局部和全局特征,并和GM(1,1), ARIMA進行比較。結果表明:在平均絕對誤差、平均相對誤差和均方差3個指標上平均有38.12%,67.78%和38.52%的提高。筆者模型和算法適用于客流短期預測,但對于中、長期客流預測僅從歷史數(shù)據(jù)特征挖掘是不夠的,需要外部數(shù)據(jù)作為補充,尤其是經(jīng)濟政策的突變影響數(shù)據(jù),這也是后續(xù)進一步研究的重點。

    猜你喜歡
    客流精度誤差
    客流增多
    角接觸球軸承接觸角誤差控制
    哈爾濱軸承(2020年2期)2020-11-06 09:22:26
    Beidou, le système de navigation par satellite compatible et interopérable
    壓力容器制造誤差探究
    基于DSPIC33F微處理器的采集精度的提高
    電子制作(2018年11期)2018-08-04 03:25:38
    GPS/GLONASS/BDS組合PPP精度分析
    九十億分之一的“生死”誤差
    山東青年(2016年2期)2016-02-28 14:25:41
    北京信息科技大學學報(自然科學版)(2016年5期)2016-02-27 06:31:37
    人工免疫算法在電梯客流時段劃分的應用
    改進的Goldschmidt雙精度浮點除法器
    和顺县| 彭州市| 禹州市| 玉树县| 巴青县| 毕节市| 广州市| 城市| 东港市| 广汉市| 平遥县| 门头沟区| 祁东县| 大新县| 从化市| 自治县| 敦化市| 耿马| 嵩明县| 绥芬河市| 凤台县| 巢湖市| 禹城市| 乌拉特中旗| 商南县| 绥中县| 博爱县| 凤翔县| 温泉县| 和顺县| 永州市| 观塘区| 醴陵市| 台南市| 新邵县| 孟津县| 五台县| 芦山县| 汽车| 北辰区| 遂宁市|