劉東輝 肖 雪 張 玨
(1.吉林警察學院信息工程系 長春130000;2.吉林大交通學院 長春130021;3.杭州市公安局交通警察支隊 杭州310000)
隨著機動車保有量飛速增長,停車資源供需關系嚴重失衡。面對現有停車資源難以滿足停車需求,以及現有停車資源難以得到有效利用等停車困境,智能停車誘導系統(tǒng)能夠針對每個出行者的停車需求精準高效地提供停車輔助決策和路徑誘導,因此有效減少了因尋找停車位而行駛在道路上的車輛,被廣泛認為能夠緩解停車難問題[1-2]。其中停車信息是該系統(tǒng)得以成功實施的關鍵與基礎,也是其他停車系統(tǒng)與模型的重要輸入,因此,準確地預測停車需求信息變得十分重要。
停車需求預測分為短時預測和長時預測,長時指的是以年為單位進行的宏觀需求預測,多用于制定停車政策與停車規(guī)劃[3]。短時停車需求預測則著眼于日內停車需求的變化,即當前時刻和未來某時刻的停車需求,文中研究的停車需求預測方法主要應用于智能停車誘導系統(tǒng),屬于短時停車需求預測。
短時停車需求預測方法主要分為2種:①從停車基礎過程出發(fā),將停車場內車輛到達和離開過程描述為車輛排隊過程;②基于假設的到達和離開規(guī)律分析未來時刻停車需求[4-5]。根據實際觀測到的數據,車輛到達與離開過程通常被抽象為泊松分布,由此可獲得停車狀態(tài)轉移概率,建立基于經典馬爾可夫生滅過程的停車狀態(tài)轉移概率矩陣[6]。該方法無法同時估計到達率與離開率參數,無法完整地描述車輛到達與離開過程與停車需求之間的關系。
得益于先進的檢測與存儲設備,獲取長時間、大規(guī)模的連續(xù)停車數據變得越來越容易,使得統(tǒng)計和機器學習方法能夠在停車需求預測方面得以應用,包括簡單回歸模型[7]、混沌時間序列分析[8]、多變量時空回歸[9]、聚類[10]、神經網絡[11],其中神經網絡強大的數據擬合能力受到了學者們的廣泛研究。神經網絡在停車需求預測精度很大程度上受神經網絡結構的影響,如輸入節(jié)點的數量,輸入層、隱藏節(jié)點的數量,學習速率和動量等,這啟發(fā)了學者們新的研究方向,通過改進神經網絡的模型結構來提高預測精度。包括采用智能優(yōu)化算法優(yōu)化網絡參數[12],利用小波函數對停車數據時間序列分解與重構[13],采用相空間重構技術建立理論預測模型,采用動態(tài)反饋神經網絡——Elman神經網絡訓練預測模型[14-15]。雖然該方法理論上能夠獲得較好的預測精度,但該類方法的預測過程屬于不可見的黑盒過程,仍然無法獲得準缺的停車規(guī)律;此外,在預測的過程中通常將停車數據無差別地輸入到預測模型當中,忽視了停車規(guī)律的動態(tài)變化特性,減弱了模型對于停車規(guī)律的挖掘與識別。
基于以上研究的現狀與不足,考慮停車場內車輛到達和離開規(guī)律動態(tài)變化特性,研究了1種可變停車需求預測區(qū)間與預測間隔方法;在此基礎上,采用LSTM網絡為基礎框架預測停車需求,并利用改進的粒子群算法進行優(yōu)化,針對單一建筑類型停車場,對停車場到達車輛與離開車輛進行分析,以預測停車需求。
各類停車需求預測模型的預測效果影響因素主要包括:①模型結構;②訓練數據。以往研究大多專注于優(yōu)化模型結構,往往強調數據體量的作用,卻忽略了數據質量的影響。在停車需求預測方法中,通常假定以5 min或15 min作為停車需求預測單位時間間隔的劃分,但停車系統(tǒng)是動態(tài)且復雜多變的,缺乏對停車過程的分析,而人為地認定后續(xù)時刻停車需求只受前5 min或15 min的停車需求影響缺乏依據。
因此,考慮到停車狀態(tài)變化過程對模型預測結果的重要影響,即停車需求的時變性與波動性隨車輛到達和離開過程的變化而變化,故提出通過估計停車到達率和離開率來識別數據預測區(qū)段與間隔的思路,從而提高預測模型學習質量與預測精度。
停車狀態(tài)變化本質上是以停車到達率和離開率為基礎的概率轉移結果,即從1個狀態(tài)到另1個狀態(tài)的隨機過程,具備無后效性與隨機性,當時間間隔無限小時,停車狀態(tài)的變化可視為馬爾可夫生滅過程,服從馬爾可夫的狀態(tài)變化規(guī)律。
馬爾可夫生滅過程規(guī)定[16],同一時刻停車狀態(tài)只能向臨近狀態(tài)轉移,即停車狀態(tài)只有3種變化方式:停車數增加1、減少1或不變。假設單位時間內停車到達率為λ,停車離開率為p,停車狀態(tài)生滅過程轉移概率見式(1)~(4)。
其他情況見式(4)。
式中:h為無窮小的時間間隔;ο(h)為時間間隔h的高階無窮小量。當停車場車輛到達過程符合泊松分布,離開過程符合二項分布時,以馬爾可夫過程為基礎,通過代數變換,在停車到達率和離開率一定的情況下,可得到停車狀態(tài)隨時間變化。
式中:E0為停車場內初始車輛數;t為時間序列數據。
通過式(5)可知,停車狀態(tài)在時間和空間上的波動性本質上是隨時間變化的停車到達率與離開率的變化,即到達率與離開率為定值的時段內,停車場具有相似的停車規(guī)律。依據停車到達率與離開率劃分預測區(qū)段具體流程見圖1。
圖1 停車預測時段迭代流程圖Fig.1 Iteration flow for the parking forecast period
有N天的歷史數據,可得到N天停車數據均值,假設一定時間段內停車達到率λ、離開率P是恒定的,通過式(5),擬合歷史停車數均值隨時間變化的函數,迭代求解不同停車達到率λ、離開率P組合的時段。
停車趨勢的變化一般發(fā)生在停車數隨時間變化曲線的拐點,該點左右導數符號相反。設第l點為曲線的第1個轉折點,該點時刻為tl,初始時刻為t0,Δt為迭代單位長度,在時間段內擬合曲線,若擬合優(yōu)度判定系數R2≥0.9,則更新tl=tl+Δt,直到R2<0.9,輸出時間段[t0,tl];若R2<0.9,更 新tl=tl-Δt,直到滿足R2≥0.9,輸出時間段[t0,tl]。下1次迭代則將上1次迭代最后1個時刻作為初始時刻,找出下1個曲線轉折點作為初始曲線擬合時刻,重復上述步驟,直到找出所有的停車達到率、離開率組合,每1個參數組合代表1個預測時段。
在不同停車到達率和離開率時段內,單位時間內到達和離開的車輛數也不同,故預測間隔也隨之變化。以單位時間內感知到1輛車的變化為原則,建立預測間隔與到達率與離開率之間的關系,見式(6)。
式中:Δt為初始時計算到達率和離開率的時間間隔。
文章采用改進的LSTM神經網絡來預測停車需求,通過調整模型結構和參數來提高停車需求的預測精度。
LSTM通過遺忘門、輸入們和輸出門3種門控邏輯架構可學習網絡訓練過程當中任意時刻的信息,有效提高了網絡的學習能力和表征能力[17],網絡拓撲結構見圖2。
圖2 LSTM網絡隱含層拓撲結構Fig.2 Hidden layer topology of the LSTM network
遺忘門決定從單元狀態(tài)中保留的信息;輸入門決定單元狀態(tài)更新的信息;輸出門在單元狀態(tài)的基礎上決定輸出的信息,各門分別是單獨的BP網絡,更新規(guī)則見式(7)~(9)。
為提高模型的學習效率,避免模型權重較小時模型學習效率低的問題,采用交叉熵代價函數作為輸出神經元的代價函數[18]。權重更小意味著網絡的預測結果不會隨輸入的改變而產生強烈的變化,故為避免模型在訓練過程中出現的過擬合問題,同時提高預測模型的泛化與預測能力,考慮在代價函數中加入1個權重衰減項,其形式為所有權重平方和平均值項,用以懲罰過大的網絡權重,引入規(guī)范化參數d,用以調整規(guī)范化項在代價函數中的比重,見式(10),式中第1項為交叉熵項,第2項為權重規(guī)范化項。
粒子群優(yōu)化算法的基本思想是利用群體中個體對信息的共享,使得整個群體的運動在問題求解空間中產生從無序到有序的求最優(yōu)解的過程,在函數優(yōu)化、圖像處理、大地測量等眾多領域都得到了廣泛的應用[19-20]。
本文利用粒子群算法函數優(yōu)化的功能,采用粒子群算法優(yōu)化LSTM網絡訓練初始參數。該過程中,每個粒子均為網絡預測輸出的1個基本可行解,粒子的位置即為長短期記憶神經網絡的連接權值和閾值組成的向量。每個粒子依靠位置和迭代速度決定下1次飛行的位置和速度,迭代標準為LSTM網絡代價函數,見式(10)。
粒子群算法更新規(guī)則見式(11)~(14)。
通過粒子群算法獲得網絡訓練初始參數后,進行長短期記憶神經網絡訓練與預測過程,具體預測流程見圖3。
圖3 LSTM網絡訓練與預測流程圖Fig.3 Training and prediction flow of the LSTMnetwork
吉林大學南嶺校區(qū)位于長春市南關區(qū),屬于教育用地,內部規(guī)劃停車位共720個,停車需求以教職工車輛為主,社會車輛為輔。筆者選取該校區(qū)2019年6月17日—23日為期1周的停車數據作為模型訓練集,保證了數據的一般性。選取2019年6月25日(星期二)和6月29日(星期六)作為驗證集,對模型預測能力及有效性進行評價。
圖4為6月17日—30日期間停車場內的各時刻的停車數??紤]到教育用地的工作特征,18:00—次日06:00間,無明顯停車需求變化趨勢,且屬于夜間停車范疇,故實例驗證中不考慮該時段的停車需求變化。與一般用地停車規(guī)律相似,該校區(qū)停車規(guī)律在工作日和非工作存在明顯的不同,除星期一初始停車數較少外,工作日與非工作日內均具有相似的波動性和規(guī)律性,故可按工作日和非工作分別確定預測間隔和時刻。
圖4 6月17日—6月23日06:00—18:00時刻場內停車數Fig.4 Number of parking spaces inside from 6:00 to 18:00 on June 17-23
按工作日與非工作日,依據1.2中提出的方法確定不同停車趨勢時段。根據式(5),通過實際停車數據擬合得到停車到達率和離開率。依據式(6),計算不同時段停車需求預測間隔。為簡化計算,提高預測效率,預測間隔計算結果取去掉小數,最大預測間隔設為5 min,最小預測間隔設為1 min。非工作日停車到達率、離開率、預測時段與時間間隔計算結果見表1,工作日停車到達率、離開率、預測時段與時間間隔計算結果見表2。
表1 非工作日預測時間間隔Tab.1 Interval of forecast on non-working days
表2 工作日預測時間間隔Tab.2 Interval of forecast on working days
由表1~2可見,工作日與非工作日預測間隔劃分大體相似,但停車到達率與離開率均不相同,可能是因為部分教職工除工作日教學工作外,周末仍需來校辦公,而其工作時間與工作日具有相似性。同時由圖4可見,工作日與非工作日數量波動性上具有較大差異,時間波動性上卻具有相似性,無論是工作日還是非工作日,預測間隔除上午為5 min外,其他時間預測間隔均為1 min。
經多次測試訓練,粒子群算法的粒子總數初值取200時較為合適,循環(huán)次數取300次,適應值系數設定為10-3,w=2,c=1,vmax=5。
結合粒子群算法的LSTM網絡門控制器均設置為3層網絡,輸入層設置為3,經過多次測試確定隱含層個數為3。學習速率參數確定為0.025,收斂誤差與粒子群最優(yōu)適應度相同。為了在相同的訓練次數下比較LSTM網絡模型與粒子群LSTM網絡模型的預測精度,單獨使用LSTM網絡模型預測時的迭代學習次數為:種群規(guī)?!吝M化次數×神經網絡正向更新時的迭代次數=50×200×10=10 000次。
根據以上所述的參數設置,計算得到工作日和非工作日粒子群長短期神經網絡(PSO-LSTM)、長短期神經網絡(LSTM)、前饋神經網絡(BP)、小波神經網絡(WNN)的平均絕對誤差(MAE)和均方誤差(MSE),結果見表3和圖5~8。
表3 誤差對比表Tab.3 Comparison of errors輛
從表3和圖5~8中可以看出,PSO-LSTM模型與普通LSTM網絡、BP網絡,以及小波神經網絡相比,具有更高的預測精度,工作日與非工作日平均絕對誤差分別為2.53輛和2.32輛,均方誤差分別為11.89輛和10.89輛,應用于停車需求短時預測具有較好的預測效果,增加了停車需求預測的可靠性。
基于馬爾可夫生滅過程,以停車到達率與離開率為基礎,研究了停車需求預測時段與間隔劃分方法,建立了基于粒子群和LSTM網絡的組合預測模型。以吉林大學南嶺校區(qū)的停車數據為例,驗化網絡參數,消除了初始訓練參數對模型預測精度的影響,與其他預測模型相比,提出的組合預測模型的預測誤差最小,精度最高。模型中部分參數的選取采用了直接賦值的方法,將來可考慮采用其他方法確定參數值。此外,隨著智能停車檢測設備的普及與停車大數據的開源應用,將進一步獲取其他用地類型的停車數據以驗證所提出模型的有效性和普適性。
圖5工作日PSO-LSTM模型、LSTM模型、BP模型、小波模型預測值Fig.5 Absolute error values of PSO-LSTM NN,LSTM NN,BP NN,and WNN on working days
圖6工作日PSO-LSTM模型、LSTM模型、BP模型、小波模型絕對誤差值Fig.6 The absolute error values of PSO-LSTMNN,LSTM NN,BP NN and WNN on working days
圖7非工作日PSO-LSTM模型、LSTM模型、BP模型、小波模型預測值Fig.7 Predicted values of PSO-LSTMNN,LSTM NN,BP NN,and WNN on non-working days
圖8非工作日PSO-LSTM模型、LSTM模型、BP模型、小波模型絕對誤差值Fig.8 Absolute error values of the PSO-LSTM NN,LSTMNN,BP NN,and WNN on non-working days