關(guān)鍵詞:共享單車;需求預(yù)測(cè);深度學(xué)習(xí);ConvLSTM;交通
0 引言(Introduction)
隨著共享經(jīng)濟(jì)的發(fā)展,共享單車作為一種新型的出行方式,它的便捷性、環(huán)保性和經(jīng)濟(jì)性受到越來越多人的青睞。在國(guó)內(nèi),共享單車的運(yùn)營(yíng)模式主要有有樁共享單車(Station-BasedBike Sharing, SBBS)和無樁共享單車(Free-Floating BikeSharing, FFBS)[1-2]。當(dāng)前,很多大型城市的交通節(jié)點(diǎn)和人口相對(duì)集中,如何根據(jù)不同城市或城市不同區(qū)域的差異化需求精準(zhǔn)預(yù)測(cè)共享單車需求量,合理規(guī)劃布局共享單車的停放點(diǎn)和區(qū)域,是社會(huì)交通發(fā)展過程中面臨的棘手問題。國(guó)內(nèi)學(xué)者對(duì)共享單車需求預(yù)測(cè)和規(guī)劃的研究主要集中于用車頻率與周期特點(diǎn)分析、停放區(qū)域規(guī)劃、城市活力分析和交通樞紐影響力分析等不同角度,但是較少針對(duì)城市特點(diǎn)和區(qū)域特點(diǎn)開展共享單車需求測(cè)算的設(shè)計(jì)。常見的長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)、自動(dòng)回歸移動(dòng)平均(ARMA)等需求預(yù)測(cè)模型在分析城市人口布局和區(qū)域特征分布時(shí)存在提取特征能力不足的問題,導(dǎo)致其預(yù)測(cè)結(jié)果與實(shí)際相比有較大偏差。因此,采用新的模型或技術(shù)手段挖掘用戶使用共享單車的年度、季節(jié)性和周期性等方面的重要規(guī)律和特點(diǎn),以此優(yōu)化單車投放數(shù)量計(jì)劃,并提升用戶對(duì)共享單車使用的滿意度,這成為當(dāng)前的迫切需求[3-5]。
1 時(shí)間序列預(yù)測(cè)與深度學(xué)習(xí)技術(shù)(Time seriesprediction and deep learning techniques)
1.1 時(shí)間序列預(yù)測(cè)
時(shí)間序列是按照時(shí)間先后順序?qū)﹄S機(jī)變量X1,X2,…,XT 進(jìn)行排列的一種序列化表現(xiàn),記為{Xt,t∈T},并用x1,x2,…,xn 或者{xt,t∈1,2,…,N }表示該隨機(jī)序列的N 個(gè)有序觀測(cè)值。其中,對(duì)時(shí)間序列應(yīng)用最廣泛的就是預(yù)測(cè),其核心思想是利用過往的歷史數(shù)據(jù)預(yù)知未來的走勢(shì)。與回歸或分類預(yù)測(cè)相比,時(shí)序預(yù)測(cè)的核心原理大相徑庭,雖然它們都需要使用數(shù)據(jù)進(jìn)行預(yù)測(cè),但是回歸或分類預(yù)測(cè)通常是使用其他數(shù)據(jù)點(diǎn)預(yù)測(cè)目標(biāo)數(shù)據(jù)點(diǎn),而時(shí)間序列預(yù)測(cè)則是利用歷史數(shù)據(jù)預(yù)測(cè)未來數(shù)據(jù)點(diǎn)。這種預(yù)測(cè)方式通?;跁r(shí)間序列的趨勢(shì)性、季節(jié)性、周期性等因素,并考慮其他因素,如天氣、假期等[6]。
在時(shí)間序列分析中,通??梢詫r(shí)間序列數(shù)據(jù)分解為趨勢(shì)性、季節(jié)周期性和隨機(jī)誤差三大部分。趨勢(shì)性主要描述了時(shí)序數(shù)據(jù)在長(zhǎng)周期中隱含的有規(guī)律性的單向升高或下降的變化特點(diǎn),該部分通常可以通過線性或非線性回歸模型擬合。季節(jié)周期性描述了時(shí)序數(shù)據(jù)在一定時(shí)間周期內(nèi)出現(xiàn)的可復(fù)現(xiàn)的規(guī)律性波動(dòng),該部分可采用季節(jié)性分解方法分離出季節(jié)性成分。隨機(jī)誤差也稱為殘差,是在上述兩個(gè)特征之外出現(xiàn)的隨機(jī)性的不規(guī)則波動(dòng),隨機(jī)波動(dòng)所導(dǎo)致的時(shí)間序列變化,可以通過殘差分析檢查模型的擬合程度。時(shí)間序列通常包含趨勢(shì)性、季節(jié)周期性和隨機(jī)誤差的特征,可以采用加法模型或乘法模型進(jìn)行表達(dá)。加法模型將時(shí)間序列分解為趨勢(shì)性、季節(jié)性和殘差的加和,乘法模型將時(shí)間序列分解為趨勢(shì)性、季節(jié)性和殘差的乘積。加法模型如公式(1)所示,乘法模型如公式(2)所示。
其中:趨勢(shì)性特征用mt 表征,季節(jié)周期性特征用st 表征,隨機(jī)誤差用et 表征。在時(shí)間序列分析中,需要選擇適當(dāng)?shù)哪P兔枋鰯?shù)據(jù)中的趨勢(shì)性和季節(jié)性變化。如果趨勢(shì)性特征與季節(jié)周期性特征之間的關(guān)系相對(duì)獨(dú)立,加法模型可以很好地表達(dá)它們相互之間的影響。如果趨勢(shì)性特征的變化對(duì)季節(jié)周期性特征的效應(yīng)有明顯的影響,那么乘法模型將是更好的選擇。因此,在選擇模型時(shí)需要考慮數(shù)據(jù)中不同因素之間的相互關(guān)系,以便能夠更準(zhǔn)確地描述數(shù)據(jù)的變化趨勢(shì)。
針對(duì)時(shí)間序列數(shù)據(jù)的預(yù)測(cè)問題,目前主要有三種主流方法可供選擇。經(jīng)典的ARMA和ARIMA(自回歸綜合移動(dòng)平均)模型是以往進(jìn)行時(shí)序數(shù)據(jù)建模與處理的常用模型,該類模型能夠有效地處理特征平穩(wěn)的時(shí)序數(shù)據(jù),并且具備對(duì)單一變量數(shù)據(jù)序列的回歸能力,但其對(duì)復(fù)雜特征數(shù)據(jù)的處理能力較弱,效果不佳;經(jīng)典的機(jī)器學(xué)習(xí)模型往往將時(shí)序數(shù)據(jù)處理轉(zhuǎn)化為無監(jiān)督學(xué)習(xí)任務(wù),在進(jìn)行有效的數(shù)據(jù)特征工程、預(yù)處理和模型訓(xùn)練后進(jìn)行時(shí)序數(shù)據(jù)的未來預(yù)測(cè),該方法能夠處理對(duì)復(fù)雜特征數(shù)據(jù)的分析與建模,并且能夠較好地解決時(shí)序數(shù)據(jù)中多變量特征的協(xié)同性回歸和非線性等問題,該類方法的典型模型有Lightgbm和Xgboost;深度學(xué)習(xí)模型是近年來比較流行的時(shí)序數(shù)據(jù)處理方法,該方法在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入了大規(guī)模的隱藏層和感知單元,能有效地提取時(shí)序數(shù)據(jù)中的各類特征,該類模型主要包括CNN模型、GRU模型和LSTM 模型。具體來說,選擇合適的時(shí)間序列預(yù)測(cè)方法應(yīng)該考慮具體問題的復(fù)雜程度和數(shù)據(jù)量大小[7]。
1.2 深度學(xué)習(xí)技術(shù)
深度學(xué)習(xí)技術(shù)在時(shí)間序列預(yù)測(cè)中的應(yīng)用始于全連接神經(jīng)網(wǎng)絡(luò)(FCNN)。然而,F(xiàn)CNN存在過擬合和泛化能力不足等問題。隨著卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像領(lǐng)域取得的新突破,CNN在特征提取中表現(xiàn)出的優(yōu)異性使其成為深度學(xué)習(xí)技術(shù)中的熱門模型,CNN通過不同的卷積核和卷積操作可有效地對(duì)高維度的數(shù)據(jù)進(jìn)行特征提取。但是,CNN只能處理短期預(yù)測(cè)問題,對(duì)于處理長(zhǎng)期預(yù)測(cè)問題表現(xiàn)不佳。在CNN之后出現(xiàn)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)可以通過內(nèi)部隱藏狀態(tài)很好地保留歷史信息,其采用方向傳播的參數(shù)訓(xùn)練模式,能高效推導(dǎo)網(wǎng)絡(luò)中的權(quán)重參數(shù),能自動(dòng)高效地學(xué)習(xí)序列數(shù)據(jù)的特征。上述模型雖然能力突出,但是在訓(xùn)練過程中易出現(xiàn)梯度消失或爆照等問題,這些問題限制了其在長(zhǎng)序列預(yù)測(cè)方面的應(yīng)用。為了解決這些問題,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)被提出,它通過門控機(jī)制控制歷史信息的保留和遺忘,從而更好地處理長(zhǎng)期依賴性問題。最近,變換器和深度強(qiáng)化學(xué)習(xí)(DRL)等技術(shù)也被應(yīng)用于時(shí)間序列預(yù)測(cè)中[8]。
深度學(xué)習(xí)技術(shù)在時(shí)間序列預(yù)測(cè)中的應(yīng)用非常廣泛,包括股票價(jià)格預(yù)測(cè)、交通流預(yù)測(cè)、氣象預(yù)測(cè)、能源需求預(yù)測(cè)等。例如,在股票價(jià)格預(yù)測(cè)方面,深度學(xué)習(xí)技術(shù)可以通過學(xué)習(xí)股票價(jià)格歷史數(shù)據(jù)預(yù)測(cè)未來的股票價(jià)格走勢(shì)。在交通流預(yù)測(cè)方面,深度學(xué)習(xí)技術(shù)可以通過分析交通歷史數(shù)據(jù)預(yù)測(cè)未來的交通狀況,為交通管理和規(guī)劃提供支持。在氣象預(yù)測(cè)方面,深度學(xué)習(xí)技術(shù)可以通過學(xué)習(xí)天氣歷史數(shù)據(jù)預(yù)測(cè)未來的天氣情況,為氣象預(yù)警和防災(zāi)減災(zāi)提供支持。在能源需求預(yù)測(cè)方面,深度學(xué)習(xí)技術(shù)可以通過學(xué)習(xí)用電量歷史數(shù)據(jù)預(yù)測(cè)未來的能源需求量,為能源規(guī)劃和管理提供支持。
1.3ConvLSTM
LSTM 模型是由Hochreiter等人對(duì)RNN進(jìn)行改進(jìn)而提出的一種新型模型,其設(shè)計(jì)初衷是為了解決長(zhǎng)期依賴性問題。21世紀(jì),LSTM 被一代代學(xué)者逐漸完善,形成了較為系統(tǒng)的LSTM框架,在自然語言處理(NLP)、自動(dòng)駕駛汽車等領(lǐng)域均有應(yīng)用。在LSTM 模型中,ConvLSTM (Convolutional LongShort Term Memory)是將CNN和LSTM 進(jìn)行結(jié)合的一種特殊形態(tài),它繼承了CNN的卷積特點(diǎn),能夠有效地提取高維數(shù)據(jù)信息的特征,同時(shí)又集合了LSTM 的記憶能力,能夠應(yīng)對(duì)較為復(fù)雜的時(shí)序數(shù)據(jù)。該模型對(duì)于語音、視頻等多特征的時(shí)序數(shù)據(jù)有很好的處理效果[9]。同時(shí),ConvLSTM還被廣泛應(yīng)用于如天氣、股票、能量場(chǎng)等多尺度的數(shù)據(jù)預(yù)測(cè)。ConvLSTM 的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。
全連接的LSTM,其輸入和輸出狀態(tài)都是一維的張量,它主要的優(yōu)勢(shì)在于梯度會(huì)被保存在單元中,從而避免梯度消失的問題。LSTM單元結(jié)構(gòu)如圖2所示。
其中:輸入門、遺忘門和輸出門分別用i、f 和o 表示,Wi、Wf 、Wo 是其對(duì)應(yīng)的權(quán)重,bi、bf 、bo 為遺忘門的偏置項(xiàng),sigmod函數(shù)為σ,○為點(diǎn)積操作,Ct、Ct-1 分別為t 和t-1時(shí)刻的長(zhǎng)期記憶,ot 為神經(jīng)元的中間記憶[10]。雖然全連接的LSTM 已經(jīng)可以用來解決時(shí)間關(guān)聯(lián)性問題,但是它無法捕捉空間特征。
ConvLSTM由兩種組件組成,即卷積層和LSTM 層。其中,卷積層的作用在于以卷積方式對(duì)多維數(shù)據(jù)提取有效特征,LSTM層的作用在于通過門控機(jī)制將需要記憶的信息進(jìn)行迭代保存,將需要遺忘的數(shù)據(jù)丟棄。ConvLSTM的各個(gè)時(shí)刻狀態(tài)計(jì)算方法如公式(8)至公式(12)所示:
其中:*代表卷積,○代表哈達(dá)瑪積,Xt 代表輸入,Ct 代表單元輸出,Ht 代表隱狀態(tài),it 代表輸入門,ft 代表遺忘門,ot 代表輸出門。比較FC-LSTM和ConvLSTM的重要等式可以看出,ConvLSTM與FC-LSTM主體大致相同,僅提取特征的方式不同,ConvLSTM是將所有普通乘法改為卷積操作,卷積核越大,就越能夠提取到更快的動(dòng)作,而卷積核越小,就越能夠提取到更慢的動(dòng)作。
2 數(shù)據(jù)集與特征分析(Dataset and feature analysis)
收集南京地區(qū)兩個(gè)自然年度三類典型地區(qū)共享單車的使用需求數(shù)量信息作為數(shù)據(jù)集,數(shù)據(jù)集有24個(gè)數(shù)據(jù)采集點(diǎn),每小時(shí)采集1次。數(shù)據(jù)集中記錄了與共享單車需求相關(guān)的區(qū)域、氣溫、天氣等影響因素,數(shù)據(jù)集特征描述如表1所示。
為了有效地訓(xùn)練神經(jīng)網(wǎng)絡(luò)(如LSTM),需要注意樣本數(shù)據(jù)中數(shù)值較大的輸入可能會(huì)對(duì)學(xué)習(xí)和收斂速度造成負(fù)面影響,甚至影響神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)精度。因此在進(jìn)行訓(xùn)練之前,需要對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理以達(dá)到更好的訓(xùn)練效果[11]。其中,標(biāo)準(zhǔn)化作為一種常用的數(shù)據(jù)預(yù)處理方式,可將數(shù)據(jù)值擬合為均值為0、方差為1的正態(tài)分布函數(shù)。需要注意的是,進(jìn)行標(biāo)準(zhǔn)化操作之前需要對(duì)轉(zhuǎn)換數(shù)據(jù)進(jìn)行分布情況的分析,如數(shù)據(jù)不符合高斯分布,其進(jìn)行標(biāo)準(zhǔn)化后的可靠性將有較大程度地降低,標(biāo)準(zhǔn)化的轉(zhuǎn)換函數(shù)如公式(13)所示:
標(biāo)準(zhǔn)化需計(jì)算樣本數(shù)據(jù)的均值u 和標(biāo)準(zhǔn)差σ,通??梢酝ㄟ^對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行估計(jì)得到。與歸一化方式相比,標(biāo)準(zhǔn)化方法的優(yōu)點(diǎn)在于其魯棒性更強(qiáng)、訓(xùn)練效果更為穩(wěn)定。對(duì)標(biāo)準(zhǔn)化后的特征通過相關(guān)性分析,使用斯皮爾曼秩相關(guān)系數(shù)衡量變量之間的線性相關(guān),去除冗余的特征,該系數(shù)計(jì)算如公式(14)所示:
其中:ρ 為斯皮爾曼秩相關(guān)系數(shù);di 為對(duì)應(yīng)變量的秩之差,即Xi 和Yi 兩個(gè)變量分別排序后對(duì)應(yīng)成對(duì)的變量位置(等級(jí))差,即Xi-Yi;n 為觀測(cè)對(duì)象的數(shù)量。斯皮爾曼秩相關(guān)系數(shù)在-1~1變化。當(dāng)其絕對(duì)值接近1時(shí),表明兩個(gè)變量的相關(guān)性更強(qiáng),當(dāng)系數(shù)值為0時(shí),表明兩個(gè)變量完全不相關(guān)(一個(gè)變量的變化不受另一個(gè)變量變化的影響)[12]。一般而言,相關(guān)系數(shù)絕對(duì)值大于0.8的則判定兩個(gè)變量為強(qiáng)相關(guān),小于0.2的則判定兩個(gè)變量為弱相關(guān),在實(shí)際特征分析過程中絕對(duì)值大于0.6或小于0.4,即可判定為兩個(gè)變量有一定的強(qiáng)弱相關(guān)性。各變量的特征相關(guān)性圖如圖3所示。
研究人員通過對(duì)三個(gè)區(qū)域內(nèi)的共享單車的全部需求數(shù)據(jù)進(jìn)行相關(guān)性分析發(fā)現(xiàn),需求與氣溫和風(fēng)速有一定的關(guān)系,并且與時(shí)間和月份存在關(guān)聯(lián)性。通過對(duì)月度和小時(shí)的單車需求數(shù)量分析發(fā)現(xiàn),大多數(shù)月份的需求呈現(xiàn)雙峰分布,同時(shí)還發(fā)現(xiàn)工作時(shí)間段的需求呈現(xiàn)增加態(tài)勢(shì),而下午非工作時(shí)間段的單車需求相對(duì)穩(wěn)定,月需求數(shù)量分布如圖4所示,小時(shí)需求數(shù)量分布如圖5所示。
從圖4可以看出,南京地區(qū)的7~9月是共享單車需求量最高的月份,這與氣溫升高和暑假來臨有密切關(guān)系。對(duì)圖5中的每日數(shù)據(jù)進(jìn)行對(duì)比分析發(fā)現(xiàn),8時(shí)、17時(shí)和18時(shí)存在用車高峰,這與上下班時(shí)間點(diǎn)重合,在季節(jié)影響方面可以看出春、夏、秋季的需求旺盛,冬季的需求量較為低迷。
3 模型訓(xùn)練和評(píng)估(Model training and evaluation)
對(duì)于多變量時(shí)間序列預(yù)測(cè)問題,ConvLSTM模型的輸入數(shù)據(jù)形態(tài)為具有步長(zhǎng)的多維數(shù)據(jù),其表達(dá)方式為[samples,timesteps,rows,cols,channels],每一個(gè)時(shí)間步都包含有多個(gè)行列的數(shù)據(jù)。本文將ConvLSTM 模型的步長(zhǎng)設(shè)定為14 d的周期,這樣便于拆解為兩個(gè)子序列進(jìn)行卷積,實(shí)現(xiàn)特征提取。每個(gè)子序列中包含7 d的特征數(shù)據(jù),整個(gè)輸入數(shù)據(jù)形狀為[n,2,1,7,1]。為了驗(yàn)證ConvLSTM 的訓(xùn)練和評(píng)估效果,研究人員將ConvLSTM 模型與LSTM、GRU和CNN模型進(jìn)行了橫向?qū)Ρ?。ConvLSTM模型的參數(shù)信息如表2所示。
ConvLSTM總計(jì)訓(xùn)練參數(shù)為49 291個(gè),50次的迭代效果如圖6所示,CNN、LSTM、GRU的迭代效果如圖7至圖9所示,對(duì)比圖7至圖9可以看出,ConvLSTM在10次迭代后的殘差就已經(jīng)降至較為穩(wěn)定的狀態(tài),并且在驗(yàn)證集上的應(yīng)用效果也較好。
ConvLSTM 與LSTM、GRU、CNN 模型效果對(duì)比如表3所示。
從表3可以看出,ConvLSTM 模型的解釋性變量分值最高,明顯優(yōu)于單一使用CNN或LSTM的模型,其在訓(xùn)練集和測(cè)試集上的MSE、RMSE 誤差有一定的提升,利用ConvLSTM進(jìn)行預(yù)測(cè)的結(jié)果如圖10所示。
從圖10可以看出,預(yù)測(cè)結(jié)果的趨勢(shì)吻合度較好,對(duì)于波動(dòng)性變化的敏感度適應(yīng)能力較強(qiáng)。
4 結(jié)論(Conclusion)
本文對(duì)南京地區(qū)兩個(gè)自然年度三類典型地區(qū)共享單車的使用需求數(shù)量、天氣狀態(tài)、季節(jié)周期等多類信息進(jìn)行分析和特征提取,并在此基礎(chǔ)上提出了一種同時(shí)考慮了時(shí)空序列的基于ConvLSTM的深度學(xué)習(xí)預(yù)測(cè)模型,該模型通過卷積操作提取數(shù)據(jù)中隱含的空間信息,設(shè)定序列長(zhǎng)度周期為14 d時(shí),模型擁有最優(yōu)的預(yù)測(cè)效果。通過與經(jīng)典的時(shí)序LSTM 網(wǎng)絡(luò)、卷積CNN 等模型進(jìn)行相比,本文設(shè)計(jì)的模型其RMSE、MSE 和解釋性變量分值等指標(biāo)顯示出更好的效果。在模型設(shè)計(jì)中,時(shí)間序列長(zhǎng)度的設(shè)置至關(guān)重要,該參數(shù)設(shè)置過大,會(huì)導(dǎo)致短期需求預(yù)測(cè)準(zhǔn)確度降低;該參數(shù)設(shè)置過小,會(huì)導(dǎo)致樣本與模型的網(wǎng)絡(luò)結(jié)構(gòu)不匹配而出現(xiàn)無法有效擬合的問題,因此后續(xù)研究將圍繞共享單車的數(shù)據(jù)特征工程展開,增加城市、地區(qū)、地形等方面特征的多模態(tài)數(shù)據(jù),提升模型的預(yù)測(cè)精準(zhǔn)度。