高廣旭 劉敬賢 劉 奕 李宗志
(武漢理工大學(xué)航運學(xué)院1) 武漢 430063) (武漢理工大學(xué)內(nèi)河航運技術(shù)湖北省重點實驗室2) 武漢 430063)(國家水運安全工程技術(shù)研究中心3) 武漢 430063) (伊利諾伊理工大學(xué)4) 芝加哥 IL 60616)
船舶交通流是一種非線性的、復(fù)雜的時間序列.對船舶交通流預(yù)測的研究包括參數(shù)法、非參數(shù)法和數(shù)值模擬三類[1].
參數(shù)法主要包括基于灰色理論的預(yù)測模型、時間序列方法和卡爾曼濾波等模型.GM(1,1)是灰色模型中最常用的方法之一,由于其運算簡單速度快且不需要大量樣本,所以在短期預(yù)測方面具有很好的應(yīng)用,但是對于波動性數(shù)據(jù)的處理并不理想[2].差分自回歸移動平均模型(ARIMA)是典型的時間序列方法,對與非平穩(wěn)數(shù)據(jù)有較好的處理效果,然而由于交通流數(shù)據(jù)日變化特性引起了異方差性,使得該模型的殘差被低估,會影響預(yù)測精度[3-4].由于船舶交通流還具有非線性、隨機性及復(fù)雜性特征,在對交通流的預(yù)測中,參數(shù)法無法很好的處理這些特性.非參數(shù)法正好彌補了這一缺陷,并且其預(yù)測精度更高.在非參數(shù)法中,神經(jīng)網(wǎng)絡(luò)(NN)是最常用的研究方法之一,并在此基礎(chǔ)上發(fā)展出多種預(yù)測模型[5-6].反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)模型,它可以反映出交通流時間序列的分線性特征,能夠處理復(fù)雜的非線性交通流時間序列,因而被廣泛應(yīng)用于交通流預(yù)測中[7].但是由于其同傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型一樣,具有容易陷入局部極小,收斂慢和易引起震蕩等缺點,對預(yù)測精度有較大影響[8].面對單一神經(jīng)網(wǎng)絡(luò)預(yù)測模型在交通流預(yù)測中的缺點,有研究學(xué)者提出基于船舶交通流不同特性,采用不同的預(yù)測模型進(jìn)行預(yù)測[9],避免單一模型對船舶交通流特性考慮不足,提升了船舶交通流預(yù)測精度[10-11].隨著大數(shù)據(jù)及數(shù)據(jù)挖掘技術(shù)的發(fā)展,通過對船舶交通流大數(shù)據(jù)進(jìn)行挖掘,可以發(fā)現(xiàn)其內(nèi)在特征及非線性特性[12],然后提取交通流數(shù)據(jù)的特征,對每個特征數(shù)據(jù)進(jìn)行預(yù)測[13].
文中針對船舶交通流的非線性和復(fù)雜性提出一種組合預(yù)測模型,考慮船舶交通流受不同因素的影響,分析船舶交通流內(nèi)在特性,將船舶交通流數(shù)據(jù)看作是由波動性數(shù)據(jù)和平穩(wěn)性數(shù)據(jù)構(gòu)成的,船舶交通流多是由穩(wěn)定、周期性數(shù)據(jù)構(gòu)成,這一部分?jǐn)?shù)據(jù)稱之為平穩(wěn)性數(shù)據(jù),當(dāng)受到突發(fā)因素影響而造成的數(shù)據(jù)波動,稱之為波動性數(shù)據(jù).由平穩(wěn)數(shù)據(jù)構(gòu)成低秩矩陣,波動性數(shù)據(jù)構(gòu)成稀疏矩陣.對于分解后的矩陣采用BPMF模型通過對數(shù)據(jù)矩陣進(jìn)行補全的方式進(jìn)行預(yù)測,然后將補全后的矩陣組合得到最后需要的預(yù)測結(jié)構(gòu).
船舶交通流作為一種時間序列,具有以下特性.
1)在長期時間內(nèi)表現(xiàn)出一定的周期性,且船舶交通流受到水域內(nèi)航道、錨地等固定因素的影響,而表現(xiàn)出平穩(wěn)性特征.
2)船舶交通流在受到自然因素、突發(fā)事故等因素的影響,產(chǎn)生一定的波動性.
3)同時在一定周期內(nèi),船舶交通流數(shù)據(jù)還表現(xiàn)出很強的時間相關(guān)特性.
4)船舶交通流作為一種時間序列,也體現(xiàn)出一定的空間特性.
因此,考慮船舶交通流的時空屬性,將一維船舶交通流數(shù)據(jù)轉(zhuǎn)為二維交通流數(shù)據(jù),并結(jié)合交通流平穩(wěn)性和波動性,對交通流數(shù)據(jù)進(jìn)行低秩稀疏矩陣分解,并分別進(jìn)行預(yù)測.進(jìn)一步提升對船舶交通流的預(yù)測精度.
結(jié)合船舶交通流的時空特性,將一維船舶交通流序列按照日(day)和時間段(time)進(jìn)行分組轉(zhuǎn)為二維船舶交通流矩M,M∈Rm×n;m,n分別為數(shù)據(jù)矩陣中行和列,其中行為天,列為時間段,文中按3 h采集一次數(shù)據(jù)將1 d劃分為8個時間段.通過對采集的數(shù)據(jù)進(jìn)行相關(guān)性分析及奇異值分解,得出船舶交通流統(tǒng)計數(shù)據(jù)的相關(guān)性及低秩性較強,利用低秩稀疏分解是合理的.
對于重新構(gòu)造的船舶交通流二維矩陣采用低秩稀疏矩陣分解模型對船舶交通流數(shù)據(jù)進(jìn)行分解,分解為低秩矩陣L和稀疏矩陣S.交通流矩陣分解步驟如下.
步驟1采集原始船舶交通流一維時間序列數(shù)據(jù),并重新構(gòu)造為二維船舶交通流矩陣M,矩陣M是由交通流稀疏性矩陣L和稀疏矩陣S組成.
M=L+S
(1)
式中:M∈Rm×n為已知的船舶交通流二維矩陣;L∈Rm×n為低秩矩陣;S∈Rm×n為稀疏矩陣.
步驟2為了較好的將交通流矩陣M分解為低秩矩陣和稀疏矩陣,需要對該過程進(jìn)行約束和優(yōu)化,并引入正則化參數(shù)λ,以平衡矩陣的低秩性和稀疏性.
s.t.M=L+S
(2)
步驟3為了進(jìn)一步提升公式(1)中S的稀疏性,根據(jù)文獻(xiàn)[14]研究成果,對分解模型采用非凸優(yōu)化可以保證矩陣的稀疏性和數(shù)值精度,因此基于非凸優(yōu)化的低秩稀疏矩陣分解模型為
s.t.M=L+S
(3)
步驟4為了能夠得到比較穩(wěn)定的解,再引入增廣拉格朗日乘子Y處理約束非凸優(yōu)化最小問題.引入該乘子后矩陣分解模型為
(4)
式中:Y為增廣拉格朗日乘子;μ為正懲罰參數(shù).利用交替方向乘子算法迭代求解式(3)[15],固定參數(shù)L和參數(shù)Y求解S,固定參數(shù)S和參數(shù)Y求解L,再更新拉格朗日乘子Y.
步驟5分別固定參數(shù)(S,Y)對L進(jìn)行求解和固定參數(shù)(L,Y)對S進(jìn)行求解,求解過程為
(5)
貝葉斯概率矩陣分解的AIS預(yù)測模型是在概率矩陣分解模型的基礎(chǔ)上進(jìn)行優(yōu)化[16-17],其預(yù)測原理主要為矩陣補全,將預(yù)測數(shù)據(jù)看作原始矩陣中缺失元素,通過貝葉斯概率矩陣分解進(jìn)行矩陣補全以達(dá)到預(yù)測的目的,在計算中將預(yù)測數(shù)據(jù)在矩陣中以“0”表示,以滿足計算要求[18].其預(yù)測流程如下.
步驟1將要預(yù)測的船舶交通流數(shù)據(jù)二維矩陣X通過兩個矩陣表示,并加入隨機噪音矩陣E.
X=HA+E
(6)
式中:X∈Rm×n為包含缺失數(shù)據(jù)(預(yù)測數(shù)據(jù))在內(nèi)的船舶交通流數(shù)據(jù);n和m分別為矩陣的行數(shù)和列數(shù);H∈Rm×k和A∈Rk×n分別為基函數(shù)和對應(yīng)的系數(shù);k為船舶交通流數(shù)據(jù)X的秩;E為隨機噪音矩陣.
基函數(shù)H和相關(guān)系數(shù)A滿足如下的高斯分布:
(7)
式中:Hi:,為基函數(shù)H的第i行;A:,j為系數(shù)矩陣A的第j列;超參數(shù)ΘH={ζH,ΛH}和超參數(shù)ΘA={ζA,ΛA}為決定基函數(shù)H和系數(shù)A分布特征的超參數(shù),這兩個超參數(shù)都符合Gaussian-Wishart分布.
P(ΘH|Θ0)=N(ξA|ξ0,(β0ΛM)-1)w(ΛH|W0,v0)
(8)
P(ΘA|Θ0)=N(ξA|ξ0,(β0ΛA)-1)w(ΛA|W0,v0)
(9)
步驟2更新超參數(shù)ΘH={ζH,ΛH}和超參數(shù)ΘA={ζA,ΛA},根據(jù)上一步可以得出基函數(shù)H和系數(shù)A,則超參數(shù)的概率密度函數(shù)為
P(ξH,ΛH|M,Θ0)=
(10)
P(ξA,ΛA|M,Θ0)=
(11)
步驟3更新基函數(shù)H,根據(jù)貝葉斯公式:
P(H|X,A,ξH,ΛH)P(X|A,ξH,ΛH)=
P(X|M,A,ξH,ΛH)P(M|A,ξH,ΛH)
(12)
此時船舶交通流數(shù)據(jù)X,系數(shù)矩陣A和超參數(shù)都已知,所以概率密度函數(shù)是一常數(shù),同時基函數(shù)矩陣H和系數(shù)矩陣A無關(guān),所以得出基函數(shù)H的概率密度函數(shù)為
(13)
步驟4更新系數(shù)A,和步驟3同理可得:
(14)
步驟5重復(fù)步驟2~4直至基函數(shù)H和系數(shù)A達(dá)到穩(wěn)定輸出為止.
LRSD-BPMF組合預(yù)測模型的預(yù)測流程見圖1.具體步驟如下.
圖1 LRSD-BPMF組合預(yù)測模型流程圖
步驟1數(shù)據(jù)預(yù)處理 將采集的船舶交通流數(shù)據(jù)進(jìn)行處理,轉(zhuǎn)換為二維船舶交通流時間序列矩陣M.
步驟2利用LRSD算法,將M分解為低秩矩陣L和稀疏矩陣S,見式(1).
步驟3對于分解后的低秩矩陣L和稀疏矩陣S,分別運用BPMF對兩矩陣進(jìn)行預(yù)測值補全,得到包含預(yù)測值的低秩矩FL和包含預(yù)測值的稀疏矩陣FS.
步驟4將預(yù)測后的低秩矩陣和稀疏矩陣恢復(fù)為船舶交通流矩陣,即可得到船舶交通流預(yù)測結(jié)果矩陣FM.
FM=FL+FS
(15)
由于文中提出的預(yù)測模型面向的為一般情形下的船舶交通流短時預(yù)測,所以對于實驗數(shù)據(jù)的選取沒有特定要求.選擇曹妃甸港2017年5月31日—2018年6月1日的港口交通流數(shù)據(jù),進(jìn)行驗證文章所提出的算法的可行性及有效性.將采集的船舶交通流數(shù)據(jù)按照3 h為一時間段劃分?jǐn)?shù)據(jù),1 d共分為8個時間段,對交通流預(yù)測模型進(jìn)行訓(xùn)練,并將最后8組作為測試數(shù)據(jù)實驗數(shù)據(jù)來驗證模型效果.為了考慮到預(yù)測數(shù)結(jié)果的隨機性,提高預(yù)測結(jié)果的魯棒性,實驗將每個時間段進(jìn)行10次預(yù)測,獲取10組預(yù)測值.
為了驗證提出的LRSD-BPMF模型的預(yù)測結(jié)果精度,實驗選取了GM,ARIMA,BPNN,WNN,LSTM,BPMF共六種常用的且預(yù)測精度較好的模型進(jìn)行對比,各模型預(yù)測結(jié)果統(tǒng)計見圖2.
圖2 各預(yù)測模型計算結(jié)果對比圖
選擇均方誤差(mean-square error,MSE),均方根誤差(root mean square error, RMSE),相對誤差(relative error, RE)及標(biāo)準(zhǔn)差(standard deviation, STD)對各模型的預(yù)測結(jié)果進(jìn)行綜合評價.各評價公式為
(16)
均方誤差可以評價數(shù)據(jù)的變化程度,MSE值越小,則說明預(yù)測模型預(yù)測的實驗數(shù)據(jù)越精確.
(17)
均方根誤差是均方誤差的算術(shù)平方根,當(dāng)對某一時段的數(shù)據(jù)進(jìn)行多次預(yù)測時,可以通過均方根誤差來表示預(yù)測精度,預(yù)測精度越高,均方根誤差越小.
(18)
(19)
由圖2可知,LRSD-BPMF預(yù)測模型的預(yù)測結(jié)果與真實值從趨勢到每一時間段的數(shù)值大小上相似度最大,其次是BPMF的預(yù)測結(jié)果波動較小,與LSTM在走勢上的相似度較大;然后是WNN和BPNN預(yù)測模型的預(yù)測效果相對來講要劣于BPMF;GM及ARIMA的預(yù)測結(jié)果大部分與實際值的差值較大,預(yù)測結(jié)果相對較差.
通過對實驗結(jié)果進(jìn)行分析,各模型對各時段預(yù)測結(jié)果的MSE、RMSE值見圖3.
MSE與RMSE越小則模型預(yù)測精度越高,通過對8個時間段的預(yù)測結(jié)果進(jìn)行比較,GM、ARIMA 由圖3c)可知,LRSD-BPMF預(yù)測模型的相對誤差及標(biāo)準(zhǔn)差最小,其預(yù)測結(jié)果可信度最高.故LRSD-BPMF模型相較于其他預(yù)測模型,具有更通過對實驗結(jié)果及實驗?zāi)P瓦M(jìn)行分析,參數(shù)法GM、ARIMA由于其對波動性數(shù)據(jù)無法處理,所以相較于非參數(shù)法BPNN、WNN、LSTM模型充分考慮數(shù)據(jù)波動性和平穩(wěn)性,所以對于船舶交通流的預(yù)測有了較好的效果.但是參數(shù)法非參數(shù)法考慮的都只是船舶交通流的時間屬性,沒有考慮船舶交通流的空間屬性的影響.本文提出的模型,是在考慮了船舶交通流平穩(wěn)性和波動性的基礎(chǔ)上,對交通流時空屬性也充分考慮,所以預(yù)測效果較好. 圖3 各模型預(yù)測結(jié)果 文中提出一種基于低秩稀疏矩陣分解和貝葉斯概率矩陣分解的船舶交通流預(yù)測模型.通過對比其他現(xiàn)在應(yīng)用較多的神經(jīng)網(wǎng)絡(luò)及機器學(xué)習(xí)算法預(yù)測模型來講,矩陣分解比較容易通過編程來實現(xiàn),同時其時間及空間的復(fù)雜度較低,預(yù)測精度較高,并且具有很好的拓展性.但該預(yù)測模型的算法,在算法的計算速度上耗費時間較長.同時在算法訓(xùn)練上仍依靠大量的歷史數(shù)據(jù)進(jìn)行訓(xùn)練,所以在算法優(yōu)化方面仍有一定的提升空間,后續(xù)將通過對各種算法進(jìn)行進(jìn)一步優(yōu)化,以提升模型的預(yù)測精度及預(yù)測效率.3 結(jié) 束 語