• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于LSTM網(wǎng)絡(luò)的浮動單車需求量預(yù)測

    2022-01-12 04:14:38黃洪滔郝艷軍
    關(guān)鍵詞:浮動需求量時段

    肖 梅 張 穎 黃洪滔 郝艷軍

    (長安大學(xué)運(yùn)輸工程學(xué)院 西安 710064)

    0 引 言

    無樁式浮動單車無需定點(diǎn)停車,導(dǎo)致單車亂停亂放,擠占地鐵等公共出入口、人行道交通車道等,造成單車在時空上分布不合理、道路資源的過度浪費(fèi),影響了城市交通秩序和形象,嚴(yán)重時甚至?xí)斐山煌ㄗ枞?實(shí)現(xiàn)城市浮動單車需求量的準(zhǔn)確預(yù)測,不僅可以為解決單車的亂停亂放提供理論依據(jù),也可以更好地滿足共享單車用戶的出行需求,保障單車運(yùn)營企業(yè)可持續(xù)、快速平穩(wěn)發(fā)展.

    國內(nèi)外學(xué)者對單車顯著性影響因素分析和需求量預(yù)測進(jìn)行了大量的研究.在研究影響需求量因素方面:Fagnant等[1]利用西雅圖騎行數(shù)據(jù),提出了一種直接需求模型(direct-demand model),該模型根據(jù)產(chǎn)生量和吸引量估算與自行車相關(guān)道路條件,結(jié)果顯示,需求量與交叉路口和路緣寬度和道路速度顯著相關(guān).Xu等[2]利用多源數(shù)據(jù),提出了上海市共享單車興趣點(diǎn)區(qū)域劃分和交通分區(qū)的創(chuàng)新方法,揭示了上海市共享單車出行的分布特征并構(gòu)建了多塊混合動力預(yù)測模型準(zhǔn)確預(yù)測了單車供需量.譚旭平等[3]為解決單車的投放和停車需求,針對城市用地的空間上的因素,考慮多種交通方式的換乘接駁,基于改進(jìn)的logit模型對不同交通強(qiáng)度的交通區(qū)進(jìn)行投放和停車需求的預(yù)測,提高了預(yù)測精度.在研究單車需求量預(yù)測方面研究方法多集中于統(tǒng)計回歸模型和機(jī)器學(xué)習(xí)模型:Feng等[4]結(jié)合歷史使用模式和天氣數(shù)據(jù),建立了基于隨機(jī)森林預(yù)測模型來預(yù)測華盛頓地區(qū)自行車租賃需求量,相比于多元線性回歸模型,預(yù)測結(jié)果和準(zhǔn)確性都有很大提高.劉暢[5]基于網(wǎng)格劃分理論、時間序列預(yù)測方法,構(gòu)建了共享單車需求預(yù)測量ARIMA模型,但預(yù)測值的曲線擬合優(yōu)度較低.Jia等[6]提出了一種兩級高斯混合模型聚類算法,在此算法中考慮了自行車在站點(diǎn)間的遷移趨勢和地理位置信息,并將實(shí)驗(yàn)結(jié)果與其他傳統(tǒng)預(yù)測模型相比較,錯誤率減少了約8%.Wang等[7]綜合考量自行車需求具有很強(qiáng)的隨機(jī)性、時變性和非線性,提出了一種非線性RBF神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸算法來預(yù)測公共自行車站點(diǎn)需求量區(qū)間.Du等[8]以關(guān)聯(lián)公共自行車出租站歷史出行信息和時間為影響因素,分別建立了自適應(yīng)粒子群優(yōu)化小波神經(jīng)網(wǎng)絡(luò)(APSO-WNN)的公共自行車還借需求模型,對比粒子群優(yōu)化小波神經(jīng)網(wǎng)絡(luò)(PSO-WNN),平均相對誤差和均方誤差分別下降了26.45%和36.31%.王立[9]通過對共享單車使用量的數(shù)據(jù)分析,重點(diǎn)研究了基于BP神經(jīng)網(wǎng)絡(luò)進(jìn)行組合的非線性組合預(yù)測模型預(yù)測單車的需求量.楊軍等[10]利用不同時段的共享單車需求數(shù)據(jù),采用BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建了四種不同激活函數(shù)下的需求預(yù)測模型.陳菁等[11]綜合考慮校園區(qū)域和學(xué)生出行特征,應(yīng)用小波神經(jīng)網(wǎng)絡(luò)預(yù)測區(qū)域需求量,實(shí)驗(yàn)結(jié)果表明:預(yù)測需求量的平均絕對誤差和平均百分誤差分別為0.983輛和14.36%.Soheil等[12]提出了廣義極值(GEV)計數(shù)模型,以預(yù)測每小時內(nèi)每個停車站點(diǎn)自行車的離開和到達(dá)的數(shù)量,整個系統(tǒng)總需求預(yù)測誤差在5%以內(nèi),75%的站點(diǎn)到達(dá)和離開的預(yù)測誤差在1以內(nèi).何郁波等[13]針對城市某一公共場所的單車使用量情況的時間序列,提出了ARIMA時序回歸預(yù)測模型,對共享單車的使用情況進(jìn)行了短期的預(yù)測,并驗(yàn)證了模型的可靠性.在深度學(xué)習(xí)中,由于LSTM神經(jīng)網(wǎng)絡(luò)具有長時記憶功能,且可以很好地解決梯度消失或梯度爆炸的問題,國內(nèi)外學(xué)者將其運(yùn)用在預(yù)測不同領(lǐng)域的問題:Xu等[14]通過深度學(xué)習(xí)方法建立了無站共享單車的動態(tài)需求預(yù)測模型,利用長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM NNS)預(yù)測不同時間間隔的共享單車出行量和吸引量,結(jié)果證明預(yù)測精度均優(yōu)于傳統(tǒng)的ARIMA、SVM等統(tǒng)計模型.Pan等[15]根據(jù)歷史數(shù)據(jù)提出了一種基于兩層深度的LSTM模型,預(yù)測未來一段時間內(nèi)城市不同區(qū)域的自行車租賃和歸還的情況,LSTM雙層模型平均均方根誤差為2.70,比DNN預(yù)測模型減少了14%.程肇蘭等[16]提出了一種基于LSTM網(wǎng)絡(luò)的鐵路貨運(yùn)量預(yù)測模型,將預(yù)測結(jié)果與ARIMA預(yù)測模型結(jié)果相比較,LSTM網(wǎng)絡(luò)預(yù)測效果更佳.耿立校等[17]為準(zhǔn)確預(yù)測股票指數(shù),提出了基于多源異構(gòu)數(shù)據(jù)的長短期網(wǎng)絡(luò)模型,并與卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行對比分析,結(jié)果表明,LSTM模型的預(yù)測準(zhǔn)確率比傳統(tǒng)模型更為優(yōu)秀,更具可行性和有效性.

    在綜合考量影響浮動單車需求量的波動性及模型的穩(wěn)定性的基礎(chǔ)上,文中從時間因素、空間因素、天氣因素、騎行因素上分析并得出預(yù)測模型的特征輸入,構(gòu)建了基于LSTM網(wǎng)絡(luò)的單車需求量預(yù)測模型,實(shí)現(xiàn)了對城市浮動單車早晚高峰出行時段的精準(zhǔn)預(yù)測,為浮動單車的管理提供了理論依據(jù).

    1 LSTM網(wǎng)絡(luò)算法

    LSTM的核心在于增加了三個門與一個記憶單元,分別是遺忘門、輸入門、輸出門,以控制信息在演進(jìn)方向上的傳遞及增加控制門解決輸入或輸出問題.其主要是通過一個神經(jīng)層和一個逐點(diǎn)相乘的操作來實(shí)現(xiàn),很好地解決了長期依賴以及梯度消失和梯度爆炸的問題,LSTM網(wǎng)絡(luò)模型結(jié)構(gòu)原理圖見圖1.該模型向前傳遞的計算公式為

    圖1 LSTM網(wǎng)絡(luò)模型結(jié)構(gòu)

    ft=σ(Wf·[ht-1,Xt]+bf)

    (1)

    (2)

    (3)

    Ot=σ(Wo·[ht-1,Xt]+bo)

    (4)

    ht=Ot·tanh(At)

    (5)

    2 浮動單車需求量預(yù)測

    2.1 數(shù)據(jù)預(yù)處理

    文中采用的實(shí)例數(shù)據(jù)是通過解密開源的2017年的北京單車數(shù)據(jù)(https://biendata.com/competition/mobike/),樣本原始數(shù)據(jù)的起止時間為2017年5月10—24日,數(shù)據(jù)集近兩千萬條,包括7個字段信息,見表1.對字段數(shù)據(jù)進(jìn)行挖掘,初次選取了13個影響浮動單車使用的因素作為自變量.變量名稱、表示符號及變量單位,見表2.

    表1 原始樣本數(shù)據(jù)示例

    表2 變量的初步選取及相關(guān)描述

    根據(jù)編碼原理和字符串精度級別,7位編碼長度對應(yīng)的的面積為153 m×153 m,為使構(gòu)建的研究區(qū)域更符合單車實(shí)際出行情況和短途騎行的特點(diǎn),將其聚合成面積約為1.22 km×0.61 km的6位編碼長度區(qū)域作為研究區(qū)域,在北京市空間位置分布見圖2.

    圖2 北京市研究區(qū)域空間位置分布示意圖

    按照研究區(qū)域面積一定的篩選原則,隨機(jī)提取了近5萬條數(shù)據(jù)作為研究的樣本數(shù)據(jù)并對原始數(shù)據(jù)集按每2 h進(jìn)行重采樣,劃分成每2 h一個時段.經(jīng)統(tǒng)計分析,出行的高峰時段為:早高峰08:00—10:00,晚高峰:18:00—20:00.為驗(yàn)證各網(wǎng)絡(luò)模型的精度,將樣本數(shù)據(jù)80%作為訓(xùn)練集,20%作為測試集.選取出行高峰時段(08:00—10:00)和平峰時段(12:00—14:00)的單車需求量預(yù)測作為驗(yàn)證模型精度的結(jié)果.

    2.2 Spearman秩相關(guān)性檢驗(yàn)

    Spearman(SR)相關(guān)系數(shù)不僅用于衡量兩個變量之間相關(guān)性檢驗(yàn),且樣本數(shù)據(jù)不需要滿足連續(xù)性和正態(tài)分布,同時也具有消除量綱的作用.為排除隨機(jī)采樣對SR相關(guān)系數(shù)結(jié)果的影響,以構(gòu)建統(tǒng)計量的方式計算P值進(jìn)行顯著性檢驗(yàn).基于兩者標(biāo)準(zhǔn)共同判斷影響因素的顯著相關(guān)性,見表3.式(6)為Spearman(SR)相關(guān)系數(shù)計算公式.

    表3 相關(guān)性判斷標(biāo)準(zhǔn)

    (6)

    表4為Spearman系數(shù)矩陣,表5為Spearman秩相關(guān)檢驗(yàn)系數(shù)。由表4和表5可知,X1為城市功能區(qū);X7為降雨天氣;X8為高溫出行;X9為風(fēng)力級數(shù);X13為騎行距離;X13的SR相關(guān)系數(shù)和檢驗(yàn)值P都表現(xiàn)出非常弱的相關(guān)性,表明并不是影響單車使用的重要因素,推測可能是數(shù)據(jù)采集期間時間跨度僅為14天且天氣情況較為穩(wěn)定、各功能區(qū)流量集中導(dǎo)致需求量分布比較均勻,導(dǎo)致單車需求量波動不明顯,因此以上影響因素均表現(xiàn)為不相關(guān)并剔除該變量.

    表4 Spearman系數(shù)矩陣

    表5 Spearman秩相關(guān)檢驗(yàn)系數(shù)

    而其他8個自變量間均存在相關(guān)性如:X3與X4強(qiáng)相關(guān)、X3與X11弱相關(guān),X11與X12中相關(guān)等;與Y之間呈正相關(guān)的變量,如X3是由于存在公共交通的區(qū)域會更容易產(chǎn)生單車接駁需求;X5是由于居民日常出行更容易集中在1 d中的早晚高峰時段,例如,上下班時與公交、地鐵接駁通勤等均會導(dǎo)致更大的需求量;與Y之間呈負(fù)相關(guān)的變量如:X6是由于用戶在節(jié)假日出行需求比平時工作日的出行需求更迫切,對單車需求量更大.經(jīng)分析對以上影響因素予以保留,并作為單車需求量預(yù)測模型的特征變量輸入.

    2.3 模型構(gòu)建

    基于Anaconda管理平臺下的Python3.9開發(fā)環(huán)境,利用Tensorflow2.2與Keras2.3.1深度學(xué)習(xí)框架進(jìn)行建模.將樣本數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集80%,測試集20%,分別用于RNN、GRU、LSTM網(wǎng)絡(luò)模型訓(xùn)練參數(shù)與測試模型精度,其中,LSTM網(wǎng)絡(luò)預(yù)測模型運(yùn)行原理見圖3.為提高模型精度,模型中均采用0.001的Adam優(yōu)化算法,tanh激活函數(shù),Loss損失函數(shù)采用均方誤差(mean squared error, MSE),計算公式為

    圖3 LSTM網(wǎng)絡(luò)模型運(yùn)行原理

    (7)

    2.3.1模型訓(xùn)練

    對于基于時間序列預(yù)測的網(wǎng)絡(luò)模型而言,t時刻單車需求量Yt的值,不僅受到t時刻的特征輸入Xt的約束,同時還受到t-n(n=1,2,…)時刻的輸出Yt-n及t-n時刻的特征輸入Xt-n的約束.因此,模型的輸入為t-n時刻的顯著性變量數(shù)據(jù)集及標(biāo)簽數(shù)據(jù)集:Yt=(Yt-n+X(2,t-n)+X(3,t-n)+X(4,t-n)+X(5,t-n)+X(6,t-n)+X(10,t-n)+X(11,t-n)+X(12,t-n)+Xt),以此預(yù)測未來第N天的高峰時段:第(t+2)個時段,以及平峰時段:第(t+4)個時段單車需求量.交叉驗(yàn)證后訓(xùn)練集上模型預(yù)測精度達(dá)到最優(yōu)時,停止迭代,得到LSTM模型參數(shù):Units=3,Hidden_layer=32,Dense=2,Epochs=50,Batch_size=32,Dropout=0.2.

    2.3.2模型評價指標(biāo)

    為了評估模型的預(yù)測結(jié)果,所用到的評價指標(biāo)為:均方根誤差RMSE,用來衡量觀測值同真值之間的偏差;平均絕對值誤差MAE,反映預(yù)測值誤差的實(shí)際情況;擬合優(yōu)度值R2,計算曲線擬合優(yōu)度.

    (8)

    (9)

    (10)

    2.4 模型對比

    為比較LSTM預(yù)測模型與其他預(yù)測模型的精度,本文另采用兩種變種深度學(xué)習(xí)的預(yù)測方法:RNN預(yù)測模型和GRU預(yù)測模型.同理,搭建Python3.9開發(fā)環(huán)境,Tensorflow與Keras模塊中的深度學(xué)習(xí)網(wǎng)絡(luò)框架.樣本數(shù)據(jù)訓(xùn)練集和測試集的劃分均為8∶2,模型輸入為經(jīng)檢驗(yàn)后的顯著性變量數(shù)據(jù)集X及標(biāo)簽數(shù)據(jù)集Y.在訓(xùn)練集交叉驗(yàn)證后最終得到RNN模型參數(shù): Activation=Softmax,Hidden_Layer=100,Batch_Size=128,Epochs=60,Dropout=0.3,Dense=2;GRU模型參數(shù):Optimizer=Adam,Hidden_Layer=80,Batch_Size=64,Epochs=60,Dropout=0.5,Dense=2;損失函數(shù)均采用均方誤差.其中,數(shù)據(jù)啞變量處理與數(shù)值歸一化處理、模型結(jié)果評估與LSTM模型處理過程一致.

    2.5 模型結(jié)果

    為更加貼近實(shí)際單車出行情況,從位于20個不同位置的研究區(qū)域及14 d不同日期的數(shù)據(jù)集中隨機(jī)選取了1 197條數(shù)據(jù),133個時間滑窗序列測試樣本,圖4~6分別為各模型對早高峰時段及平峰時段單車需求量預(yù)測結(jié)果的真實(shí)值與預(yù)測值的擬合曲線及兩者之間的差值曲線.由圖4~6可知:LSTM預(yù)測模型中,預(yù)測值很高程度上預(yù)測了未來時間段的真實(shí)值;GRU預(yù)測模型預(yù)測效果次之,RNN預(yù)測模型預(yù)測效果較差.

    圖4 RNN網(wǎng)絡(luò)預(yù)測模型

    圖5 GRU網(wǎng)絡(luò)預(yù)測模型

    圖6 LSTM網(wǎng)絡(luò)預(yù)測模型

    通過表6的評價指標(biāo)對比分析,LSTM預(yù)測模型總體上優(yōu)于兩個對比預(yù)測模型.相較于GRU:LSTM優(yōu)化了隱藏層節(jié)點(diǎn),因此對時序的記憶能力更強(qiáng);當(dāng)時間序列距離增加時,RNN存在無法解決長時依賴,可能出現(xiàn)梯度消失或梯度爆炸等問題,然而LSTM受梯度消失問題的影響要小很多,擬合優(yōu)度更高,且三個門與一個記憶單元的結(jié)構(gòu)非常適用于處理與時間序列高度相關(guān)的問題.GRU與RNN進(jìn)行對比:GRU除預(yù)測平均絕對值誤差分別為7.14和4.53略高于RNN,其余評價指標(biāo)均優(yōu)于RNN,說明相比于簡單的RNN網(wǎng)絡(luò)結(jié)構(gòu)而言,GRU雖然只有兩個門,但構(gòu)建龐大的網(wǎng)絡(luò)時更加有力,效率更高.從預(yù)測結(jié)果整體看,浮動單車平峰時段的需求量預(yù)測比高峰時段預(yù)測效果更佳,由于高峰時段需求量對影響因素更加敏感,造成的曲線波動幅度較大,而平峰時段需求量受到的影響較小,從而更加平穩(wěn).

    表6 模型評價結(jié)果

    3 結(jié) 束 語

    文中針對北京市內(nèi)浮動單車出行時需求量的實(shí)際情況,從空間因素、時間因素、天氣因素、騎行因素多方面考慮并分析了浮動單車不同時段的出行特征,并將其作為模型的特征輸入,提高預(yù)測的精度和可信度,使預(yù)測模型更貼近現(xiàn)實(shí)情況.從深度學(xué)習(xí)算法的角度,結(jié)合浮動單車出行大數(shù)據(jù),以及嚴(yán)格周期的時間序列,構(gòu)建了一種基于LSTM網(wǎng)絡(luò)的浮動單車需求量預(yù)測模型.為了驗(yàn)證LSTM模型的性能,分別構(gòu)建了RNN網(wǎng)絡(luò)預(yù)測模型和GRU網(wǎng)絡(luò)預(yù)測模型,通過對比真實(shí)需求量和預(yù)測需求量數(shù)值的擬合曲線和各項(xiàng)預(yù)測結(jié)果評價指標(biāo),體現(xiàn)LSTM模型優(yōu)越的影響因素記憶和預(yù)測性能,并且LSTM可作為復(fù)雜的非線性單元用于構(gòu)造更大型深度神經(jīng)網(wǎng)絡(luò),該模型成功為城市浮動單車的投放與后期的調(diào)度計劃提供前瞻性理論支撐.下一步工作會深入研究模型超參對模型精度的影響,并且結(jié)合GIS數(shù)據(jù)模型,分析城市浮動單車在空間上的出行特征及預(yù)測模型的探索,例如:空間位置、空間形態(tài)及分布等,提高預(yù)測模型的普遍性和適用性.

    猜你喜歡
    浮動需求量時段
    中國船級社(CCS)發(fā)布 《海上浮動設(shè)施入級規(guī)范》(2023)
    從數(shù)學(xué)角度看“彈性”
    四個養(yǎng)生黃金時段,你抓住了嗎
    一種用于剪板機(jī)送料的液壓浮動夾鉗
    帶有浮動機(jī)構(gòu)的曲軸孔鏜刀應(yīng)用研究
    傍晚是交通事故高發(fā)時段
    2017年我國汽車軟管需求量將達(dá)6.4億m
    橡膠科技(2015年3期)2015-02-26 14:45:02
    分時段預(yù)約在PICC門診維護(hù)中的應(yīng)用與探討
    基于BP神經(jīng)網(wǎng)絡(luò)人均豬肉需求量預(yù)測
    世界最大浮動船試水重量超60萬噸
    廣東造船(2013年6期)2013-04-29 16:34:55
    靖宇县| 牡丹江市| 金平| 杭州市| 靖宇县| 浠水县| 天全县| 桂东县| 留坝县| 安福县| 海宁市| 郓城县| 巴彦淖尔市| 沙田区| 西宁市| 襄汾县| 邻水| 华蓥市| 新乡县| 宁德市| 盐池县| 正蓝旗| 内江市| 琼结县| 华阴市| 彭水| 辛集市| 晴隆县| 陵水| 上犹县| 施甸县| 桐庐县| 阳曲县| 故城县| 岱山县| 云龙县| 垫江县| 阿尔山市| 桓仁| 商都县| 靖宇县|