王若琳
(中石化(大連)石油化工研究院有限公司,遼寧大連 116045)
成品油二次物流是指油品從油庫到加油站的運輸組織過程,是成品油物流過程中的重要一環(huán)。實現(xiàn)加油站未來銷量的準(zhǔn)確預(yù)測,可以有效提高二次物流的運輸調(diào)度精確性,幫助企業(yè)實現(xiàn)庫存管理與配送計劃編制,提升運行效率。然而,加油站的銷量受多種因素影響,銷量數(shù)值波動性較強(qiáng)且無顯著規(guī)律。因此,實現(xiàn)加油站銷量的準(zhǔn)確預(yù)測有一定的難度。
由于銷量預(yù)測任務(wù)的數(shù)據(jù)通常為時間序列形式,因此當(dāng)前大多使用時間序列模型,主要方法包括線性回歸、指數(shù)平滑[1]、整合移動平均自回歸模型[2]、機(jī)器學(xué)習(xí)[3-5]、深度學(xué)習(xí)等。支持向量機(jī)[6]、決策樹、迭代算法[7]等模型同樣可用于預(yù)測任務(wù),但在處理時間序列數(shù)據(jù)時,由于時間序列特性引起的高維度,存在消耗資源大、效率低等問題。隨著深度學(xué)習(xí)的不斷發(fā)展,研究者提出了循環(huán)神經(jīng)網(wǎng)絡(luò)及其衍生方法:長短期記憶網(wǎng)絡(luò)(LSTM)[8]和門控循環(huán)單元[9],2種衍生方法對于時間序列數(shù)據(jù)的處理和預(yù)測具有較好的效果[10-12]。部分學(xué)者將注意力機(jī)制[13-14]與深度網(wǎng)絡(luò)結(jié)合,使網(wǎng)絡(luò)更加關(guān)注重要的部分。然而,由于加油站銷量的時間序列具有較強(qiáng)的非線性特征,現(xiàn)有的模型精度仍有待提升。
加油站銷量受到多種因素的影響,存在較大的波動性。將加油站銷量影響因素分為特殊日期因素和長短時因素兩大類,通過對比不同加油站的實際銷量數(shù)據(jù),分析不同因素對加油站銷量的影響程度。
加油站銷量可能會受到某些特殊日期的影響,包括油價調(diào)整、節(jié)假日、特殊天氣等。以某市一典型加油站全年真實數(shù)據(jù)為例進(jìn)行分析。
1)油價調(diào)整
通過繪制加油站實際銷量隨時間的變化圖(見圖1),可以發(fā)現(xiàn),當(dāng)油價宣布即將上漲時,調(diào)價前的銷量會有所上升,調(diào)價后的銷量會有所下降;反之同理。銷量的變化幅度與調(diào)價幅度有關(guān)。當(dāng)油價調(diào)整幅度較大時,油品銷量的變化也較為明顯,反映出市場預(yù)期和價格信號機(jī)制在成品油市場發(fā)揮著一定作用。油價對銷量的影響主要集中在油價調(diào)整日期的前后2 天內(nèi),影響的時間范圍不會過長,反映出市場對價格的反應(yīng)速度較快,成品油市場機(jī)制較為健全有效。
圖1 油價對加油站銷量的影響注:圖中紅點表示當(dāng)日油價上調(diào),綠點表示當(dāng)日油價下調(diào),單位為元/t
2)節(jié)假日
通過繪制加油站實際銷量隨時間的變化圖,并在圖中標(biāo)出部分典型節(jié)假日節(jié)點(見圖2),可以發(fā)現(xiàn),節(jié)假日對于加油站銷量的影響較為明顯,表現(xiàn)為:節(jié)假日前1 ~2 天,加油站銷量出現(xiàn)明顯的上升,在節(jié)假日前1天或節(jié)假日當(dāng)天達(dá)到峰值;節(jié)假日期間,銷量呈現(xiàn)下降趨勢;節(jié)假日后1 ~2天,銷量逐漸上升至正常水平。其中,春節(jié)期間銷量的激增與激降情況最為明顯,反映出我國成品油消費體現(xiàn)著明顯的節(jié)日效應(yīng)。
圖2 節(jié)假日對加油站銷量的影響
3)特殊天氣
通過繪制加油站實際銷量隨時間的變化圖,并在圖中標(biāo)出特殊天氣節(jié)點(見圖3),可以發(fā)現(xiàn),相較于其他因素,天氣對加油站銷量的影響較小。通過對數(shù)據(jù)的梳理,將天氣情況分為3類。一是,晴、陰、多云、小雨、霾等一般天氣:加油站銷量基本不受天氣影響,可以保持正常水平。二是,中雨、小雪、雨夾雪、中雪等惡劣天氣:天氣對加油站銷量產(chǎn)生一定影響,部分加油站銷量會出現(xiàn)小幅下降(但天氣因素影響較小,遇國慶假期銷量仍然上升)。三是,暴雨、大雨、大雪、暴雪等極端天氣:天氣對加油站銷量會產(chǎn)生較為明顯的影響,部分加油站銷量會出現(xiàn)一定程度的下降,反映出成品油市場與不良天氣因素的關(guān)聯(lián)效應(yīng)。
圖3 天氣對加油站銷量的影響
加油站銷量還可能與各類長短時因素有關(guān),包括月份、星期、一天中的不同時間段等。選取某市A、B、C、D 4個典型加油站2022年真實銷量數(shù)據(jù)進(jìn)行分析。
1)月份
繪制2022 年4 個典型加油站月銷量變化情況(見圖4),可以看出,加油站銷量與月份有一定的關(guān)聯(lián)。1月和7月整體銷量較高,2月和11月銷量偏低。
圖4 不同加油站月銷量情況
2)星期
為消除季節(jié)等其他因素的影響,以周一為例,將全年所有周一的日銷量求和作為當(dāng)前的周一銷量,并依此得到不同加油站一周7 天的銷量變化情況(見圖5),可以看出,不同加油站一周7 天的銷量變化趨勢相近,相對而言,周五的銷量相對偏高,周末期間會有所下降。
圖5 不同加油站一周銷量變化情況
3)時間段
將2022年所有某時刻的銷量求和作為該時刻總銷量,繪制得到不同加油站一天24小時的銷量變化情況(見圖6),可以看出,加油站銷量在凌晨期間普遍較低,早晚出行高峰期間會出現(xiàn)銷量的急劇增加。
圖6 不同加油站單日分時段銷量變化情況
將LSTM 模型引入加油站銷量預(yù)測問題,模型的輸入變量為前1 天或多天的加油站銷量分布情況,即24×n 個小時的銷量數(shù)據(jù);輸出變量為后1 天或多天的加油站銷量分布,即加油站未來逐小時的銷量需求情況。為進(jìn)一步提升模型預(yù)測準(zhǔn)確性,在LSTM模型基礎(chǔ)上引入關(guān)鍵因素特征,與歷史銷量數(shù)據(jù)一同輸入模型進(jìn)行訓(xùn)練,幫助模型更好地學(xué)習(xí)加油站銷量的變化特點,豐富模型的可學(xué)習(xí)內(nèi)容。
根據(jù)對銷量影響因素的分析,利用特征數(shù)值量化的方法建立合理的關(guān)鍵因素特征,使模型輸出的預(yù)測數(shù)據(jù)可以對相關(guān)因素作出有效反饋,提升模型的預(yù)測準(zhǔn)確性。
2.2.1 特殊日期特征
特殊日期因素可以通過對歷史銷量數(shù)據(jù)的分析,獲得較為明確的銷量變化趨勢,因此對其特征的量化公式設(shè)定為f=A×10n的形式。其中A用于調(diào)整特征值的幅度,n 用于調(diào)整特征值的數(shù)量級,以保證特征數(shù)值與訓(xùn)練數(shù)據(jù)中的加油站銷量處于同一數(shù)量級;f為特殊日期因素的特征量化表示。
1)油價特征
根據(jù)國家油品調(diào)價政策得到調(diào)價日期及調(diào)價幅度,油價特征的量化采用分段函數(shù)的形式。以油價上調(diào)為例,對于調(diào)價當(dāng)天,油價調(diào)整一般于當(dāng)日24時進(jìn)行,在油價上漲前2天,消費者會進(jìn)行儲油準(zhǔn)備,銷量有所上升,此時油價特征為正值(A=m>0),且上漲幅度越大,特征值A(chǔ)越大;對于調(diào)價前1天,調(diào)價對于隔天銷量的影響減弱,此時為油價特征賦較小的正值(A=m/2);對于調(diào)價后1天,此時價格已經(jīng)上漲,銷量會有所下降,此時為油價特征賦負(fù)值(A=-m);對于調(diào)價后2天油價調(diào)整影響減弱,此時為油價特征賦絕對值較小的負(fù)值(A= -m/2)。
2)節(jié)假日特征
相較于普通節(jié)假日,春節(jié)期間銷量的波動程度更大,因此,將普通節(jié)假日與春節(jié)進(jìn)行區(qū)分,春節(jié)期間的特征幅度A大于普通節(jié)假日。
節(jié)假日開始的前1天以及結(jié)束的后1天,銷量呈上升趨勢,特征值為正值;節(jié)假日期間,銷量下降,特征為負(fù)值。
3)天氣特征
天氣對銷量影響較小,特征幅度A小于其他特征。一般天氣時,A=0;惡劣天氣時,A=-0.5;極端天氣時,A=-1。
2.2.2 長短時因素特征
此類因素較難通過歷史數(shù)據(jù)分析獲得明確的銷量變化趨勢,因此其特征設(shè)定方式是將歷史數(shù)據(jù)中,不同時間范圍全年銷量之和占全年總銷量的比值作為特征值。即若為月份特征,則特征值為該月銷量占全年總銷量的比重;若為星期特征,則特征值為全年所有該星期日銷量占全年總銷量的比重;若為時間段特征,則特征值為全年所有天數(shù)該時刻的銷量總和占全年總銷量的比重。
選擇2018年12月至2023年6月某市多個典型加油站的歷史銷量數(shù)據(jù)作為模型數(shù)據(jù)集。數(shù)據(jù)反映為加油站各個油罐逐小時的液位情況。對數(shù)據(jù)進(jìn)行處理后,得到模型的可用數(shù)據(jù),將其按照7∶3的比例劃分為訓(xùn)練集和測試集,并選擇均方誤差作為損失函數(shù)。
將基礎(chǔ)模型與引入特征后的模型預(yù)測效果對比可知,LSTM 基礎(chǔ)模型的預(yù)測情況與真實值之間存在較大誤差。以某典型加油站為例,基礎(chǔ)LSTM的預(yù)測誤差約為21.1%;引入長短時因素特征后模型預(yù)測情況有所提升,預(yù)測曲線更接近真實值,模型預(yù)測誤差降低至18.3%,但對于特殊情況(節(jié)假日、油品調(diào)價)銷量的突然變化,預(yù)測效果依然不理想;最后引入特殊日期特征,模型對于油價調(diào)整、節(jié)假日期間銷量的急劇波動,均可以做出較為正確的預(yù)測,模型預(yù)測準(zhǔn)確性明顯提升,預(yù)測誤差降低至13.6%(見圖7)。
圖7 引入特殊因素特征后的預(yù)測效果
將模型應(yīng)用于不同加油站的不同油品,計算平均預(yù)測誤差(見表1),可以看出,模型中引入影響因素特征對模型預(yù)測效果有較大提升;模型對于加油站的汽油銷量預(yù)測結(jié)果平均誤差小于15%,柴油預(yù)測結(jié)果平均誤差小于18%,能夠滿足應(yīng)用需求。模型具有較好的通用性和魯棒性,在不同加油站中均有較好的預(yù)測表現(xiàn)。
表1 2 種模型對不同加油站汽、柴油的平均預(yù)測誤差 %
通過將預(yù)測模型與市場銷售特點相結(jié)合,引入銷量影響因素特征,為加油站銷量預(yù)測提供了方法和思路,為成品油二次物流的運輸調(diào)度提供準(zhǔn)確依據(jù),便于工作人員實現(xiàn)加油站油品的主動配送及庫存管理,具有一定的實際借鑒意義。