溫浩宇,趙靈君,王 帆,于江霞
(1. 西安電子科技大學(xué) 經(jīng)濟與管理學(xué)院,陜西 西安 710126; 2. 西安大數(shù)據(jù)資產(chǎn)經(jīng)營有限責(zé)任公司,陜西 西安 710075)
截止到2019年,西安市機動車保有量已經(jīng)突破360萬輛,并以每年約30萬輛的速度持續(xù)增長。汽車給生活帶來便利的同時,也給城市治理造成了困擾,帶來了如停車位短缺、道路堵塞及環(huán)境污染等一系列問題。停車誘導(dǎo)是緩解城市“停車難”問題的有效方法之一,通過交通大數(shù)據(jù)技術(shù),以線上線下并行的方式實時發(fā)布區(qū)域內(nèi)的停車地點、空滿狀態(tài)、路線規(guī)劃等信息,幫助駕駛者快速有效地解決尋泊問題,減少了因車輛尋泊而產(chǎn)生的交通擁堵及環(huán)境污染,提高交通系統(tǒng)運行效率。目前停車誘導(dǎo)系統(tǒng)大多基于停車場實時泊位對駕駛者在到達停車場前進行誘導(dǎo),但駕駛者更關(guān)注的是在到達停車場后是否還有停車泊位。因此,有效停車泊位的短時預(yù)測對停車誘導(dǎo)系統(tǒng)的調(diào)度、改進具有重要意義[1]。
傳統(tǒng)的有效停車泊位預(yù)測方法主要包括自回歸移動平均模型(ARIMA)、卡爾曼濾波模型、馬爾可夫模型等。隨著停車數(shù)據(jù)的指數(shù)級增長,機器學(xué)習(xí)方法開始應(yīng)用于有效停車泊位的預(yù)測,如神經(jīng)網(wǎng)絡(luò)算法、粒子濾波算法、遺傳算法等。許多學(xué)者對停車場泊位預(yù)測問題展開了研究,唐克雙等[2]采用ARIMA模型、卡爾曼濾波模型和BP模型對有效停車泊位進行預(yù)測研究,發(fā)現(xiàn)ARIMA和BP模型有較高的預(yù)測精度,但沒有考慮各停車場間的相關(guān)性對預(yù)測的影響,且ARIMA模型刻畫復(fù)雜泊位時間序列非線性特征的能力較弱;季彥婕等[3-4]提出結(jié)合粒子群算法的小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型,先利用粒子群算法對小波神經(jīng)網(wǎng)絡(luò)的參數(shù)進行優(yōu)化選取,再通過小波神經(jīng)網(wǎng)絡(luò)對有效停車泊位進行預(yù)測,并通過實例分析驗證了預(yù)測模型的有效性,但粒子群算法所需訓(xùn)練時間較長,預(yù)測效率有待提升;韓印等[5]提出基于灰色—小波神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,取得了較為理想的預(yù)測結(jié)果,但由于訓(xùn)練樣本數(shù)量不夠充足,導(dǎo)致預(yù)測結(jié)果存在一定局限性。
BP(back-propagation)神經(jīng)網(wǎng)絡(luò)由于能夠捕捉非線性關(guān)系,具有良好的自學(xué)習(xí)能力和適應(yīng)性,在時間序列的預(yù)測問題上有良好效果[6-8]。但是對于較為復(fù)雜的時間序列,BP神經(jīng)網(wǎng)絡(luò)無法體現(xiàn)出時間序列內(nèi)部的關(guān)聯(lián)性,導(dǎo)致對時間序列的特征刻畫不足,影響預(yù)測精度。針對停車場有效停車泊位的預(yù)測問題,當(dāng)前時刻有效停車泊位的預(yù)測值不僅和停車場的歷史泊位數(shù)據(jù)有關(guān),更和之前時刻停車場的有效停車泊位相關(guān),所以建立起不同時刻泊位數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系尤為重要。
LSTM(long short-term memory)神經(jīng)網(wǎng)絡(luò)不僅能夠有效處理復(fù)雜時間序列的非線性和隨機性問題,還能記憶時間序列內(nèi)部的關(guān)聯(lián)性,已廣泛應(yīng)用于動態(tài)交通流量預(yù)測中,并取得了較好的預(yù)測效果[9-11]。靜態(tài)交通指車輛出行中的停車過程,是動態(tài)交通的延續(xù),動、靜態(tài)交通共同組成了一個城市的交通系統(tǒng)[12],但目前LSTM在靜態(tài)交通領(lǐng)域的應(yīng)用較少。
為了更好刻畫有效停車泊位時間序列內(nèi)部的相關(guān)聯(lián)性,筆者擬在分析西安市歷史停車數(shù)據(jù)的基礎(chǔ)上,建立基于深度學(xué)習(xí)的LSTM有效停車泊位預(yù)測模型,以改進西安市機動車停放服務(wù)中心的停車誘導(dǎo)系統(tǒng)。
基于LSTM的有效停車泊位預(yù)測模型主要利用了循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)算法。RNN是深度學(xué)習(xí)領(lǐng)域重要的研究方向之一,是一類具有短期記憶能力的神經(jīng)網(wǎng)絡(luò)。RNN的網(wǎng)絡(luò)表現(xiàn)形式中有循環(huán)結(jié)構(gòu),使過去輸出的信息作為“記憶”被保留下來,應(yīng)用于當(dāng)前的輸出計算。
基于RNN的有效停車泊位預(yù)測模型結(jié)構(gòu)如圖1。在t時刻下,網(wǎng)絡(luò)的輸入為歷史泊位數(shù)據(jù)xt,輸出為預(yù)測泊位數(shù)據(jù)ht。st為t時刻的隱藏層狀態(tài)值,包含網(wǎng)絡(luò)儲存的記憶狀態(tài)信息,使前一時刻的泊位信息作為記憶保留,并應(yīng)用于當(dāng)前時刻泊位數(shù)據(jù)的計算中,從而建立起不同時刻泊位數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。U是輸入層到隱藏層的權(quán)重矩陣,V是隱藏層到輸出層的權(quán)重矩陣,W是隱藏層上一時刻狀態(tài)值st-1作為本時刻輸入的權(quán)重矩陣。
圖1 基于RNN的有效停車泊位預(yù)測模型結(jié)構(gòu)Fig. 1 Structure diagram of effective parking space prediction model based on RNN
由于輸入的歷史泊位數(shù)據(jù)與輸出的預(yù)測泊位數(shù)據(jù)間的時間間隔較長,容易產(chǎn)生梯度消失問題,難以實現(xiàn)準確預(yù)測。為實現(xiàn)對長時間間隔泊位序列的有效處理,筆者采用RNN的改進模型——LSTM模型進行預(yù)測分析,即在RNN結(jié)構(gòu)的基礎(chǔ)上引入LSTM單元,利用不同門控機制加強對記憶信息的控制能力,從而解決梯度消失問題。
基于LSTM的有效停車泊位預(yù)測模型結(jié)構(gòu)如圖2,一個LSTM記憶單元包括輸入門、輸出門和遺忘門3種。遺忘門ft負責(zé)對上一時刻的單元狀態(tài)Ct-1進行選擇性拋棄,重置記憶單元。輸入門it負責(zé)對歷史泊位數(shù)據(jù)xt進行讀取及過濾無用信息。輸出門ot負責(zé)對當(dāng)前時刻的單元狀態(tài)Ct進行選擇過濾,輸出預(yù)測泊位數(shù)據(jù)ht。圖2表示的是同一神經(jīng)元A在不同時刻xt的狀態(tài)信息ht的傳遞,即上一時刻的輸出會作為下一時刻的輸入?yún)⑴c模型的訓(xùn)練。
圖2 基于LSTM的有效停車泊位預(yù)測模型結(jié)構(gòu)Fig. 2 Structure diagram of effective parking space prediction model based on LSTM
LSTM記憶單元的遺忘門、輸入門、輸出門對應(yīng)的運算過程為:
ft=σ(Wf·[ht-1,xt]+bf)
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
ot=σ(Wo·[ht-1,xt]+bo)
(3)
式中:W和b分別為各門的權(quán)重矩陣和偏移量;σ(·)為sigmoid激活函數(shù)。
LSTM記憶單元最終的輸出ht由輸出門和單元狀態(tài)共同決定:
(4)
(5)
ht=ot·tanh(Ct)
(6)
截至到2019年底,西安市擁有2 000余個路邊公共停車場,超過45 000個公共停車位。筆者所選數(shù)據(jù)為西安市2017年的2 700萬行相關(guān)停車記錄。
停車場泊位利用情況受工作、生活等作息習(xí)慣的影響,也受到停車場位置、泊位類型、收費標準、時間、天氣、周邊交通條件等多種因素的干擾[1]。從尋泊的角度看,駕駛者通常考慮的是目標區(qū)域內(nèi)的停車場是否存在有效停車泊位。從停車管理的角度,機動車停放服務(wù)中心通常針對目標區(qū)域內(nèi)的停車場,進行有效停車泊位的預(yù)測和停車誘導(dǎo)。在停車場的選擇方面,筆者的研究對象不局限于某一停車場,而是把目標區(qū)域內(nèi)的停車場視為一個整體,這樣可以避免各停車場間的相關(guān)性對預(yù)測結(jié)果造成影響,也在一定程度上減少了周邊交通條件對預(yù)測結(jié)果的干擾。
為避免停車數(shù)據(jù)受特殊停車活動及偶然因素的影響,保證結(jié)論的普適性,選擇5種不同類型的停車區(qū)域進行研究,分別為:商圈(小寨商圈)、景點(大雁塔)、醫(yī)院(西京醫(yī)院)、住宅小區(qū)(世家星城)和學(xué)校(高新一中)。提取西安市內(nèi)各停車場經(jīng)緯度信息,以目標區(qū)域的經(jīng)緯度坐標為中心,計算各停車場與坐標中心的直線距離,選取直線距離1 500 m范圍內(nèi)的停車場,得到目標區(qū)域內(nèi)停車場的數(shù)據(jù)信息。各停車區(qū)域數(shù)據(jù)信息如表1,泊位類型均為路邊停車泊位,收費模式為單一收費。
表1 各停車區(qū)域數(shù)據(jù)信息Table 1 Data information of each parking area
對各停車區(qū)域在2017年01月01日—12月31日的每日有效停車泊位數(shù)據(jù)進行采集,采集由08:00開始至20:00結(jié)束,每10 min采集一次,得到有效數(shù)據(jù)共計355 d,選擇前250 d數(shù)據(jù)作為訓(xùn)練集用于模型訓(xùn)練,后105 d數(shù)據(jù)作為測試集用于模型測試。各停車區(qū)域日均停車數(shù)的時序如圖3。
圖3 各停車區(qū)域日均停車數(shù)時序Fig. 3 Time sequence of average daily number of parking spaces in each parking area
構(gòu)建輸入與輸出的映射關(guān)系:在使用LSTM模型前,需要將有效停車泊位時間序列的預(yù)測問題轉(zhuǎn)換為機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)問題,即構(gòu)建輸入與輸出的映射關(guān)系。采用滑動窗口的方法,利用前n個時間間隔的歷史觀測數(shù)據(jù)區(qū)間(t-n,t-1)來預(yù)測下一時間間隔t時刻的有效停車泊位。假設(shè)每天開始記錄的時間為08:00,結(jié)束的時間為20:00,輸入序列的時間步長為5,則時間間隔輸入序列為{08:00,08:10,08:20,08:30,08:40},{08:10,08:20,08:30,08:40,08:50},…,{19:00,19:10,19:30,19:40,19:50},相應(yīng)的時間間隔輸出序列為{8:50,9:00,…,19:50,20:00}。
(7)
式中:xi為原始數(shù)據(jù);xmax為最大有效停車泊位數(shù);xmin最小有效停車泊位數(shù)。
采用了2種評價指標作為模型預(yù)測結(jié)果的評估標準,即均方根誤差(RMSE)和平均絕對百分誤差(MAPE),2個指標的計算公式為:
(8)
(9)
LSTM神經(jīng)網(wǎng)絡(luò)輸入層的神經(jīng)元個數(shù)取決于輸入序列的時間步長大小。LSTM神經(jīng)網(wǎng)絡(luò)可以處理任意時間步長,能刻畫有效停車泊位時間序列較長時刻的前后關(guān)聯(lián)關(guān)系。選取輸入時間步長為4、5、10、15進行預(yù)測,結(jié)果如表2。由表2可知:不同的輸入時間步長對網(wǎng)絡(luò)的預(yù)測性能影響不大,RMSE在8左右, MAPE在6%左右。輸入時間步長為5時,訓(xùn)練時間最短,故選擇輸入時間步長為5。
表2 不同輸入時間步長下LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果Table 2 LSTM neural network prediction results with different input time steps
對于有效停車泊位時間序列的預(yù)測問題,單隱含層神經(jīng)網(wǎng)絡(luò)已能夠刻畫其映射關(guān)系,因此采用單隱含層的神經(jīng)網(wǎng)絡(luò)進行預(yù)測。隱含層的神經(jīng)元個數(shù)對LSTM神經(jīng)網(wǎng)絡(luò)模型性能有重要影響,個數(shù)過多容易出現(xiàn)過擬合問題,個數(shù)過少則網(wǎng)絡(luò)的學(xué)習(xí)能力不足,無法實現(xiàn)精準預(yù)測。分別選取神經(jīng)元個數(shù)為50、100、150、200進行預(yù)測,結(jié)果如表3。由表3可知:在不同的隱含層神經(jīng)元個數(shù)下,預(yù)測結(jié)果有小幅波動, RMSE在8左右, MAPE在6%左右,隨著神經(jīng)元個數(shù)的增加,網(wǎng)絡(luò)訓(xùn)練時間在不斷增加。綜合考慮RMSE、MAPE及網(wǎng)絡(luò)訓(xùn)練時間,選擇隱含層神經(jīng)元個數(shù)為150。
表3 不同隱含層神經(jīng)元個數(shù)下LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果Table 3 LSTM neural network prediction results with different number of hidden layer neurons
輸出層的神經(jīng)元個數(shù)與預(yù)測步數(shù)有關(guān),預(yù)測可分為單步預(yù)測和多步預(yù)測,筆者主要研究的是單步預(yù)測,因此輸出層神經(jīng)元個數(shù)為1。
由于數(shù)據(jù)量較大,小批量梯度下降法具有訓(xùn)練速度快、計算量較小的特點,因此選擇小批量梯度下降法對LSTM神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。采用小批量梯度下降法時,需要確定訓(xùn)練子集的大小。分別選取batch-size為5、10、20、50、100進行預(yù)測,結(jié)果如表4。由表4可知:當(dāng)batch-size小于20時,不同batch-size下的RMSE在8左右,MAPE在5%左右,隨著batch-size的增加,訓(xùn)練時間減少。當(dāng)batch-size大于20時,LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測誤差開始明顯增加,綜上,選擇batch-size為20。
表4 不同batch-size下LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果Table 4 LSTM neural network prediction results with different batch size
綜上,輸入層的輸入時間步長選擇為5;采用單步預(yù)測,輸出層神經(jīng)元個數(shù)為1;采用單隱含層網(wǎng)絡(luò)結(jié)構(gòu),隱含層神經(jīng)元個數(shù)為150;采用小批量梯度下降法對網(wǎng)絡(luò)進行訓(xùn)練,batch-size為20。另外,選取的迭代次數(shù)為10,優(yōu)化算法為Adam。
采用LSTM模型、BP模型和ARIMA模型3種方法對各停車區(qū)域進行有效停車泊位的預(yù)測和比較,預(yù)測結(jié)果如表5。由于ARIMA模型擬合非線性趨勢能力較弱,選用ARIMA模型作為基線模型,作為與其他模型進行比較和評估的參考。
表5 LSTM模型、BP模型和ARIMA模型的預(yù)測結(jié)果對比Table 5 Comparison of prediction results between LSTM model, BP model and ARIMA model
由表5可知:在不同停車區(qū)域的有效停車泊位預(yù)測中,基于LSTM模型的有效停車泊位預(yù)測均取得了良好的預(yù)測效果,不同停車區(qū)域LSTM模型預(yù)測結(jié)果的MAPE均在10%以內(nèi),精度在90%以上,說明LSTM模型在有效停車泊位預(yù)測問題上可靠且有效。在不同停車區(qū)域的泊位預(yù)測中,LSTM模型預(yù)測誤差均小于BP模型,說明LSTM模型比BP模型更有效。
LSTM模型、BP模型和ARIMA模型的預(yù)測值和真實值的對比如圖4(以小寨商圈2017年10月01日—10月07日為例)。由圖4可知:LSTM模型表現(xiàn)出了和真實值相似的變化趨勢,BP模型次之,ARIMA模型存在較大誤差,說明LSTM模型能較好地刻畫有效停車泊位時間序列內(nèi)部的相關(guān)聯(lián)性,預(yù)測精度更高。
圖4 LSTM模型、BP模型和ARIMA模型的預(yù)測值和真實值對比Fig. 4 Comparison of predicted and true values of LSTM model, BP model and ARIMA model
筆者綜合考慮了有效停車泊位預(yù)測的時空特性。一方面分析了傳統(tǒng)有效停車泊位預(yù)測方法的不足,提出基于LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,該模型由于其“記憶單元”的獨特結(jié)構(gòu),可產(chǎn)生對過去泊位信息的記憶,充分利用了泊位序列前后時刻的關(guān)聯(lián)關(guān)系;另一方面選取目標區(qū)域內(nèi)多個鄰近停車場的歷史停車數(shù)據(jù)組成訓(xùn)練樣本,既避免了停車場之間的相關(guān)性對預(yù)測結(jié)果造成影響,也滿足了神經(jīng)網(wǎng)絡(luò)對海量數(shù)據(jù)的訓(xùn)練需求。運算結(jié)果表明:對于不同類型停車區(qū)域的有效停車泊位預(yù)測,考慮時空特性的LSTM預(yù)測模型預(yù)測結(jié)果與真實值一致性較高,預(yù)測精度在90%以上且均高于BP預(yù)測模型,說明LSTM模型是實現(xiàn)有效停車泊位預(yù)測的有效方法。下一步,可加入時間因素、天氣條件等相關(guān)參數(shù)進行有效停車泊位的預(yù)測,進一步提高預(yù)測的準確性。