喬曼,王敏,董傳波,余樂安,劉倩
1.中國(guó)石油天然氣股份有限公司規(guī)劃總院;2.中國(guó)石油天然氣集團(tuán)有限公司油氣業(yè)務(wù)鏈優(yōu)化重點(diǎn)實(shí)驗(yàn)室;3.中國(guó)航油華南藍(lán)天湖北分公司;4.北京化工大學(xué)
成品油作為日常生產(chǎn)和生活的必要能源,其價(jià)格波動(dòng)對(duì)國(guó)民經(jīng)濟(jì)運(yùn)行有著深刻的影響[1]。與歐美等國(guó)家成品油市場(chǎng)大多采取完全市場(chǎng)化定價(jià)機(jī)制不同[2],中國(guó)現(xiàn)行成品油定價(jià)機(jī)制為半市場(chǎng)化定價(jià)模式。國(guó)家發(fā)展和改革委員會(huì)(簡(jiǎn)稱國(guó)家發(fā)展改革委)2016年1月13日發(fā)布的《石油價(jià)格管理辦法》規(guī)定:“汽、柴油零售價(jià)格和批發(fā)價(jià)格,向社會(huì)批發(fā)企業(yè)和鐵路、交通等專項(xiàng)用戶供應(yīng)汽、柴油供應(yīng)價(jià)格,實(shí)行政府指導(dǎo)價(jià)。汽、柴油最高零售價(jià)格以國(guó)際市場(chǎng)原油價(jià)格為基礎(chǔ),考慮國(guó)內(nèi)平均加工成本、稅金、合理流通環(huán)節(jié)費(fèi)用和適當(dāng)利潤(rùn)確定。汽、柴油價(jià)格根據(jù)國(guó)際市場(chǎng)原油價(jià)格變化每10 個(gè)工作日調(diào)整一次。成品油批發(fā)企業(yè)對(duì)零售企業(yè)的汽、柴油最高批發(fā)價(jià)格,合同約定由供方配送到零售企業(yè)的,按最高零售價(jià)格每噸扣減300 元確定。”
2016年以前,國(guó)內(nèi)成品油市場(chǎng)施行嚴(yán)格的準(zhǔn)入經(jīng)營(yíng)許可制,關(guān)于成品油市場(chǎng)化價(jià)格的研究也相對(duì)較少,價(jià)格調(diào)節(jié)不靈活,市場(chǎng)在資源優(yōu)化方面發(fā)揮的作用不突出。2016年,國(guó)家開始推進(jìn)油氣體制市場(chǎng)化改革,原油“雙權(quán)”(進(jìn)口權(quán)和使用權(quán))向地方煉廠放開,成品油批發(fā)資質(zhì)審批權(quán)也由商務(wù)部下放至地方政府,市場(chǎng)準(zhǔn)入門檻的降低帶來國(guó)內(nèi)成品油市場(chǎng)供應(yīng)規(guī)模的大幅增漲,而成品油消費(fèi)端步入中低速增長(zhǎng),導(dǎo)致以往主營(yíng)企業(yè)獨(dú)享的政策紅利逐步弱化[3],成品油銷售壓力顯著增加。2021年,成品油市場(chǎng)化進(jìn)程進(jìn)一步提速,國(guó)家對(duì)調(diào)油原料征收進(jìn)口環(huán)節(jié)消費(fèi)稅、強(qiáng)化原油資質(zhì)使用審核、環(huán)保督查等一系列政策出臺(tái),成品油市場(chǎng)運(yùn)行愈加規(guī)范化[4]。此外,在“雙碳”戰(zhàn)略和目標(biāo)的大背景下,國(guó)家適當(dāng)收緊出口配額以降低國(guó)內(nèi)成品油產(chǎn)量,產(chǎn)需差又經(jīng)歷了一定程度的主動(dòng)收窄[5]??偟膩碚f,目前國(guó)內(nèi)成品油市場(chǎng)批發(fā)價(jià)格更為靈活,周期性波動(dòng)頻繁,特別是在山東省和東部沿海等省份的成品油市場(chǎng)批發(fā)價(jià)格已經(jīng)衍化為受多種因素影響的完全市場(chǎng)化價(jià)格,進(jìn)一步推動(dòng)國(guó)內(nèi)成品油市場(chǎng)格局重構(gòu)。因此,深入開展成品油市場(chǎng)批發(fā)價(jià)格影響因素分析和應(yīng)用研究,是成品油生產(chǎn)和銷售企業(yè)應(yīng)對(duì)市場(chǎng)化改革的必然要求,對(duì)企業(yè)制定生產(chǎn)計(jì)劃、優(yōu)化價(jià)格和市場(chǎng)營(yíng)銷策略都具有重要意義。
從現(xiàn)有研究看,成品油不僅是重要的能源消費(fèi)品,更是一種特殊的商品。影響成品油商品價(jià)格的因素眾多,除去成品油與國(guó)際原油價(jià)格緊密相關(guān)的定價(jià)邏輯外,產(chǎn)業(yè)鏈供需基本面變化、宏觀經(jīng)濟(jì)波動(dòng)、國(guó)際匯率變動(dòng),以及投資者風(fēng)險(xiǎn)規(guī)避意識(shí)的提升,都會(huì)對(duì)成品油市場(chǎng)化價(jià)格產(chǎn)生不同程度的影響。衛(wèi)永剛等[6]分析國(guó)際石油市場(chǎng)的基本走勢(shì)認(rèn)為能源轉(zhuǎn)型和“歐佩克+”限產(chǎn)政策的實(shí)施是油價(jià)上升的主導(dǎo)因素。李治國(guó)等[7]通過使用市場(chǎng)供給、市場(chǎng)需求、消費(fèi)狀況和成品油進(jìn)出口貿(mào)易這四方面指標(biāo),利用古諾模型對(duì)現(xiàn)行成品油定價(jià)機(jī)制與成品油市場(chǎng)平衡之間的關(guān)聯(lián)進(jìn)行分析。張崢等[8]認(rèn)為影響原油價(jià)格波動(dòng)的因素大致可以歸類于商品屬性和金融屬性,供給主導(dǎo)商品屬性,需求主要受金融屬性影響,并通過引入波動(dòng)率指標(biāo),證明了油價(jià)波動(dòng)是原油的商品屬性和金融屬性共同作用的結(jié)果。錢興坤等[9]指出,石油具有多重屬性,而商品屬性和金融屬性是其最為突出的兩大屬性,其中最重要的就是商品屬性中的供需關(guān)系,并表明21世紀(jì)以來的油價(jià)上漲一部分是由需求驅(qū)動(dòng)的,特別是由發(fā)展中國(guó)家快速增長(zhǎng)的石油需求所支撐的。Oladunjoye[10]的研究也證明,造成成品油價(jià)格變化的因素不是單一的,而是多種因素共同作用的結(jié)果,原油價(jià)格變化只是其中一種重要因素,此外還應(yīng)包括原油及成品油的儲(chǔ)備、加工成本等因素。Frankel[11]通過研究還發(fā)現(xiàn)了原油庫存對(duì)成品油價(jià)格有負(fù)面影響。Kiliana 等[12]的研究表明,油價(jià)近10年的走勢(shì)都可以用原油及油品的需求預(yù)期加以解釋。
對(duì)于成品油價(jià)格的宏觀經(jīng)濟(jì)維度,學(xué)者們主要是從宏觀經(jīng)濟(jì)影響成品油的供需,進(jìn)而影響成品油價(jià)格的角度進(jìn)行分析。經(jīng)濟(jì)增長(zhǎng)速度是決定石油消費(fèi)增長(zhǎng)的主要因素。Aastveit 等[13]通過構(gòu)建FAVAR(因子增廣型向量自回歸模型)也證實(shí)了新興經(jīng)濟(jì)體的原油需求快速增長(zhǎng)是油價(jià)波動(dòng)的主要原因。Li 等[14]對(duì)中國(guó)和印度的原油進(jìn)口總量與國(guó)際原油價(jià)格的協(xié)整關(guān)系進(jìn)行了分析,指出國(guó)際市場(chǎng)上原油價(jià)格持續(xù)上漲的重要原因,是由于中國(guó)和印度經(jīng)濟(jì)的迅速發(fā)展導(dǎo)致的原油需求量的持續(xù)增長(zhǎng)。
此外,考慮到能源金融化之后,能源市場(chǎng)在金融屬性下表現(xiàn)出新的價(jià)格形態(tài)和微觀行為規(guī)律,進(jìn)一步加大了成品油市場(chǎng)與傳統(tǒng)金融市場(chǎng)間的信息聯(lián)系[15]?;趪?guó)際原油以美元標(biāo)價(jià),同時(shí)各國(guó)匯率之間存在強(qiáng)關(guān)聯(lián)性,所以美元貨幣發(fā)行量和匯率變動(dòng)必然對(duì)成品油價(jià)格產(chǎn)生影響[16]。譚小芬等[17]基于FAVAR 對(duì)油價(jià)進(jìn)行研究指出,發(fā)達(dá)國(guó)家大規(guī)模寬松貨幣政策導(dǎo)致的全球流動(dòng)性增加對(duì)油價(jià)的沖擊顯著增強(qiáng),而美元匯率走高是造成2014年下半年以來油價(jià)加速下跌的主要原因之一。
可以看出,國(guó)內(nèi)外學(xué)者關(guān)于成品油價(jià)格影響因素的研究已經(jīng)取得了豐富的成果。但是,現(xiàn)有研究未能綜合考慮成品油價(jià)格基本屬性和需求、供給、宏觀經(jīng)濟(jì)及金融等多維度屬性對(duì)成品油價(jià)格產(chǎn)生的影響。由于影響成品油市場(chǎng)的因素眾多,價(jià)格波動(dòng)復(fù)雜,因此有必要構(gòu)建成品油市場(chǎng)分析的特征參量體系與基礎(chǔ)數(shù)據(jù)庫,從而輔助成品油價(jià)格分析,指導(dǎo)生產(chǎn)經(jīng)營(yíng)決策。
綜合考慮中國(guó)成品油定價(jià)機(jī)制現(xiàn)狀及2016年以來中國(guó)成品油市場(chǎng)環(huán)境變化,本文將結(jié)合現(xiàn)有文獻(xiàn)的分析結(jié)果,系統(tǒng)分析界定成品油市場(chǎng)批發(fā)價(jià)格影響因素,基于構(gòu)建的備選特征參量體系,結(jié)合數(shù)據(jù)預(yù)處理方法和特征工程模型,篩選出成品油市場(chǎng)批發(fā)價(jià)格的關(guān)鍵影響因素,根據(jù)汽油和柴油的差異,分別構(gòu)建汽油市場(chǎng)批發(fā)價(jià)格特征參量體系和柴油市場(chǎng)批發(fā)價(jià)格特征參量體系,用以分析成品油市場(chǎng)批發(fā)價(jià)格。
本文從成品油市場(chǎng)批發(fā)價(jià)格基本屬性和產(chǎn)業(yè)鏈特征出發(fā),結(jié)合價(jià)格、需求、供給、宏觀經(jīng)濟(jì)及金融5 個(gè)維度構(gòu)建初始特征參量。使用數(shù)據(jù)預(yù)處理與特征工程模型,考慮到成品油市場(chǎng)批發(fā)價(jià)格不僅受定價(jià)機(jī)制的影響,還受到經(jīng)濟(jì)增長(zhǎng)、供需變動(dòng)、金融市場(chǎng)等多類指標(biāo)因素的影響,通過維度劃分,將相關(guān)影響因素的信息輸入該模型進(jìn)行特征選擇,構(gòu)建出成品油市場(chǎng)批發(fā)價(jià)格特征參量體系,具體研究框架見圖1。
圖1 基于特征工程的成品油市場(chǎng)批發(fā)價(jià)格影響因素研究框架
考慮到初步篩選的特征變量較多,不同變量之間可能存在信息冗余,因此需要結(jié)合相關(guān)模型,篩選確定成品油市場(chǎng)批發(fā)價(jià)格特征參量體系。本文從特征工程模型中的特征選擇入手,從特征集合中挑選一組具有明顯統(tǒng)計(jì)意義的特征子集,剔除不相關(guān)或者冗余的特征,從而減少模型訓(xùn)練的時(shí)間,提高模型的精確度。在特征選擇方面,分別選取過濾式、封裝式和嵌入式方法,包括皮爾森相關(guān)系數(shù)(Pearson)、線性回歸(Linear regression,簡(jiǎn)稱LR)、遞歸特征消除(RFE)、交叉驗(yàn)證的遞歸特征消除法(Cross-Validation Recursive Feature Elimination,簡(jiǎn)稱RFECV)、Lasso 回歸(Least Absolute Shrinkage and Selection Operator regression,簡(jiǎn)稱Lasso)、嶺回歸(Ridge)、隨機(jī)森林(Random forest,簡(jiǎn)稱RF)在內(nèi)的機(jī)器學(xué)習(xí)模型。從現(xiàn)有研究來看,這3 類特征選擇方法各有優(yōu)劣。其中,封裝式和嵌入式方法對(duì)于基模型的依賴性較強(qiáng),需要結(jié)合基模型確定的特征重要性進(jìn)行選擇。當(dāng)基模型對(duì)于數(shù)據(jù)的適應(yīng)性較強(qiáng)時(shí),封裝式和嵌入式方法選出的特征效果優(yōu)于過濾式,反之效果則較差。對(duì)于過濾式方法,其通用性強(qiáng),計(jì)算復(fù)雜性低,適合于大規(guī)模數(shù)據(jù)集的篩選。同時(shí),此3 類特征選擇方法均屬于數(shù)據(jù)驅(qū)動(dòng)型,即需要結(jié)合數(shù)據(jù)確定最適合當(dāng)前數(shù)據(jù)集的特征選擇方法。因此,本文選擇過濾式、封裝式和嵌入式3類特征選擇方法、7 種特征選擇模型,結(jié)合訓(xùn)練集數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并基于實(shí)驗(yàn)結(jié)果確定成品油市場(chǎng)批發(fā)價(jià)格特征參量體系。此外,在參數(shù)設(shè)置方面,皮爾森相關(guān)系數(shù)法的篩選閾值設(shè)置為0.6,即篩選相關(guān)系數(shù)大于0.6 的變量進(jìn)入特征參量體系;RFECV 方法選擇三折交叉驗(yàn)證的方法;其余模型的參數(shù)則使用Python工具箱“sklearn”中的默認(rèn)參數(shù)進(jìn)行實(shí)驗(yàn)分析。
基于數(shù)據(jù)的可獲得性,本文選擇全國(guó)和山東地區(qū)成品油市場(chǎng)批發(fā)價(jià)格作為研究對(duì)象進(jìn)行指標(biāo)體系構(gòu)建,從5 個(gè)維度構(gòu)建成品油市場(chǎng)批發(fā)價(jià)格的特征參量體系,每個(gè)維度的詳細(xì)特征參量詳見3.2 節(jié)。特征參量數(shù)據(jù)收集于國(guó)家統(tǒng)計(jì)局及Wind 數(shù)據(jù)庫等行業(yè)公開的第三方數(shù)據(jù)庫,目標(biāo)序列成品油市場(chǎng)批發(fā)價(jià)格以商務(wù)部?jī)?nèi)貿(mào)統(tǒng)計(jì)監(jiān)測(cè)平臺(tái)的實(shí)貨貿(mào)易成交價(jià)格以及第三方監(jiān)測(cè)機(jī)構(gòu)提供的地方煉廠成品油市場(chǎng)報(bào)價(jià)為主。
研究時(shí)間區(qū)間是2009年1月至2021年12月,共計(jì)156 條月度觀測(cè)序列,按照8∶2 的比例劃分訓(xùn)練集和測(cè)試集。訓(xùn)練集包含了125 條觀測(cè)序列,用于特征選擇和參數(shù)訓(xùn)練;測(cè)試集包含31 條觀測(cè)序列,用于模型預(yù)測(cè)性能測(cè)試和對(duì)比分析。對(duì)于目標(biāo)序列全國(guó)成品油市場(chǎng)批發(fā)價(jià)格,考慮到國(guó)家稅費(fèi)政策的改革調(diào)整,根據(jù)不同時(shí)期稅費(fèi)制度進(jìn)行了剔稅處理,換算為不含稅價(jià)格作為模型目標(biāo)序列。
為了評(píng)價(jià)不同特征變量篩選結(jié)果,本文選擇均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)進(jìn)行衡量,RMSE 衡量真實(shí)值與預(yù)測(cè)值偏離的絕對(duì)大小,而MAPE 衡量的是偏離的相對(duì)大小。兩者的指標(biāo)值越低,說明篩選出的變量對(duì)于成品油市場(chǎng)批發(fā)價(jià)格的擬合度越高,篩選效果越好。
本文分析構(gòu)建成品油市場(chǎng)批發(fā)價(jià)格的5 個(gè)維度中,價(jià)格維度是從中國(guó)現(xiàn)行成品油的定價(jià)機(jī)制出發(fā),挑選國(guó)際市場(chǎng)基準(zhǔn)原油價(jià)格序列作為備選特征參量。由于汽、柴油擁有一般商品的屬性,因此選擇基于需求維度和供應(yīng)維度進(jìn)行特征參量構(gòu)建。隨著經(jīng)濟(jì)體的高速增長(zhǎng),成品油的供需變化會(huì)引發(fā)油價(jià)持續(xù)上漲,這影響到成品油價(jià)格的宏觀經(jīng)濟(jì)維度特征參量的分析與選擇。成品油價(jià)格的金融維度則涉及成品油市場(chǎng)與傳統(tǒng)金融市場(chǎng)間的信息聯(lián)系。
價(jià)格維度主要涉及作為成品油生產(chǎn)主要成本的國(guó)際基準(zhǔn)原油價(jià)格、國(guó)家發(fā)展改革委成品油定價(jià)機(jī)制參考價(jià)格,以及其他相關(guān)產(chǎn)品的價(jià)格。原油價(jià)格直接反映成品油生產(chǎn)成本,且原油價(jià)格是零售環(huán)節(jié)不含稅成品油價(jià)格的最主要構(gòu)成部分,原油價(jià)格的波動(dòng)對(duì)國(guó)內(nèi)成品油價(jià)格的影響通常呈現(xiàn)同向移動(dòng)趨勢(shì)。國(guó)際市場(chǎng)原油是完全市場(chǎng)化的,主要原油現(xiàn)貨市場(chǎng)包括西北歐地區(qū)、地中海地區(qū)和美國(guó)、新加坡等國(guó),以及紐約商業(yè)交易所(NYMEX)、倫敦國(guó)際石油交易所(IPE)及迪拜商品交易所(DME)等三大原油期貨交易所。因此可選取具體指標(biāo)包括:WTI原油期貨價(jià)格、布倫特原油期貨價(jià)格、DME 阿曼原油期貨價(jià)格、阿曼原油現(xiàn)貨價(jià)格、WTI 輕質(zhì)原油現(xiàn)貨價(jià)格、布倫特原油現(xiàn)貨價(jià)格、迪拜原油現(xiàn)貨價(jià)格,其他相關(guān)產(chǎn)品價(jià)格可選取新加坡優(yōu)質(zhì)汽油價(jià)格、新加坡普通汽油價(jià)格、新加坡柴油價(jià)格等特征參量。
需求維度方面,除了汽、柴油表觀消費(fèi)量直接能夠反映需求程度外,交通、工業(yè)、農(nóng)業(yè)、運(yùn)輸、新能源等行業(yè)發(fā)展也會(huì)影響成品油需求變化,在以市場(chǎng)需求為主導(dǎo)的成品油市場(chǎng)格局中,這些產(chǎn)業(yè)發(fā)展的指標(biāo)與成品油批發(fā)價(jià)格必然有一定的相關(guān)性,甚至有可能是一些先行指標(biāo)。因此需利用運(yùn)輸部門、工業(yè)企業(yè)、商務(wù)部門等相關(guān)行業(yè)部門的特征參量開展研究。其中,汽油市場(chǎng)批發(fā)價(jià)格需求維度的特征參量可包括:載貨汽車保有量、民用轎車保有量、新能源汽車保有量、公路貨運(yùn)量、公路客運(yùn)量、工業(yè)增加值、汽油出口數(shù)量、汽油表觀消費(fèi)量、單位汽油銷量、地方煉廠汽油銷量等。柴油市場(chǎng)批發(fā)價(jià)格需求維度的特征參量可包括:公路貨運(yùn)量、航運(yùn)貨運(yùn)量、航運(yùn)景氣指數(shù)、公路客運(yùn)量、工業(yè)增加值、柴油表觀消費(fèi)量、農(nóng)業(yè)柴油消費(fèi)量、采掘業(yè)柴油消費(fèi)量、生活類柴油消費(fèi)量、工業(yè)柴油消費(fèi)量、其他行業(yè)柴油消費(fèi)量、主營(yíng)單位柴油銷量、地方煉廠柴油銷量等。
供應(yīng)維度方面,主要從成品油產(chǎn)業(yè)鏈中的原油加工量、開工率以及汽、柴油庫存等方面來反映成品油的供給情況,供需差一定程度反映了市場(chǎng)競(jìng)爭(zhēng)態(tài)勢(shì)。其中,汽油市場(chǎng)批發(fā)價(jià)格供應(yīng)維度的特征參量可包括:國(guó)內(nèi)原油產(chǎn)量、原油加工量、原油進(jìn)口量、原油庫存、主營(yíng)單位原油加工量、地方煉廠原油加工量、主營(yíng)單位煉廠開工率、地方煉廠開工率、國(guó)內(nèi)汽油產(chǎn)量、主營(yíng)單位汽油庫存、地方煉廠汽油庫存、新加坡輕質(zhì)油庫存等。柴油市場(chǎng)批發(fā)價(jià)格供應(yīng)維度的特征參量可包括:國(guó)內(nèi)原油產(chǎn)量、原油加工量、原油進(jìn)口量、原油庫存、主營(yíng)單位原油加工量、地方煉廠原油加工量、主營(yíng)單位煉廠開工率、地方煉廠開工率、主營(yíng)單位柴油產(chǎn)量、地方煉廠柴油產(chǎn)量、主營(yíng)單位柴油庫存、地方煉廠柴油庫存、新加坡中質(zhì)油庫存等。
宏觀經(jīng)濟(jì)維度主要反映國(guó)家經(jīng)濟(jì)質(zhì)量、經(jīng)濟(jì)增長(zhǎng)、稅收收入、固定資產(chǎn)投資、貨幣匯率波動(dòng)以及天然氣與電力等替代產(chǎn)品對(duì)我國(guó)成品油價(jià)格造成的影響,可選取GDP(國(guó)內(nèi)生產(chǎn)總值)、固定資產(chǎn)投資、克強(qiáng)指數(shù)、交通工具使用和維修CPI(居民消費(fèi)價(jià)格指數(shù))、增值稅稅收收入、液化天然氣市場(chǎng)價(jià)格等為備選特征參量。成品油需求與宏觀經(jīng)濟(jì)關(guān)聯(lián)密切,投資、消費(fèi)、經(jīng)濟(jì)的增長(zhǎng),一定程度上會(huì)轉(zhuǎn)化為成品油消費(fèi)增長(zhǎng)的內(nèi)生動(dòng)力。
金融維度主要包括可能影響成品油價(jià)格的金融市場(chǎng)相關(guān)參量指標(biāo),如中證指數(shù)、能源類大宗商品價(jià)格指數(shù)、美元指數(shù)、匯率、M1 同比值、國(guó)內(nèi)信貸、債券增速等。此外,還包括部分投資指標(biāo),雖然目前國(guó)內(nèi)成品油的金融屬性還不強(qiáng),但因其與原油掛鉤,還可加入與原油相關(guān)的金融指標(biāo)如主要期貨市場(chǎng)相關(guān)品種期貨成交量和持倉量,在一定程度上反映投機(jī)者情緒。
在實(shí)證分析中,使用7 種特征選擇模型對(duì)各維度的影響因素進(jìn)行特征選擇,以探究不同因素對(duì)于成品油批發(fā)價(jià)格的影響大小,并使用選出的特征參量對(duì)成品油市場(chǎng)批發(fā)價(jià)格進(jìn)行研究,并通過在測(cè)試集上的表現(xiàn)確定各特征選擇方法的優(yōu)劣以及選出的特征參量質(zhì)量。同時(shí),在數(shù)據(jù)預(yù)處理階段,考慮到汽、柴油特征參量體系中部分特征參量存在數(shù)據(jù)缺失,若直接使用均值或零值填充,則會(huì)丟失變量的局部信息。因此,使用KNN 插補(bǔ)方法,通過識(shí)別空間相似或相近的k個(gè)樣本,并使用這些近鄰樣本來填補(bǔ)缺失數(shù)據(jù)。通過缺失值填充處理后,保證了數(shù)據(jù)的完整性與可分析性。
對(duì)汽油和柴油的特征參量體系各5 個(gè)維度分別進(jìn)行特征選擇,用MAPE 與RMSE 指標(biāo)衡量性能評(píng)價(jià)結(jié)果,見表1和表2。
表1 成品油價(jià)格影響因素選擇性能評(píng)價(jià)
表2 成品油價(jià)格影響因素
3.3.1 價(jià)格維度
對(duì)于汽油的價(jià)格維度而言,基于LR 共篩選出5 個(gè)影響因素,所選出的特征參量整體性能較優(yōu),分別為迪拜原油現(xiàn)貨價(jià)格、阿曼原油現(xiàn)貨價(jià)格、阿曼原油期貨價(jià)格、布倫特原油現(xiàn)貨價(jià)格和布倫特原油期貨價(jià)格。具體地,從指標(biāo)性能上來看,其在訓(xùn)練集上的MAPE為7.246 4%,RMSE 為334.674 4,能夠用于后續(xù)的汽油價(jià)格走勢(shì)分析。
對(duì)于柴油而言,基于LR 所篩選出的價(jià)格維度特征參量整體性能較優(yōu),共選取5 個(gè)影響因素,分別為迪拜原油現(xiàn)貨價(jià)格、阿曼原油現(xiàn)貨價(jià)格、阿曼原油期貨價(jià)格、布倫特原油現(xiàn)貨價(jià)格和布倫特原油期貨價(jià)格。具體地,從指標(biāo)性能上來看,其在訓(xùn)練集上的MAPE 為10.344 3%,RMSE 為550.313 9,能夠用于后續(xù)的柴油價(jià)格走勢(shì)分析。
3.3.2 需求維度
對(duì)于汽油而言,基于RF 所篩選出的特征參量整體性能較優(yōu),共選取3 個(gè)影響因素,分別為民用轎車保有量、新能源汽車保有量和公路客運(yùn)量。具體地,從指標(biāo)性能上來看,其在訓(xùn)練集上的MAPE 為24.084 8%,RMSE 為938.625 9。雖然Pearson 選出的影響因素在MAPE 上較RF 選擇的影響因素下降了1.597 5%,但是其RMSE 較RF 選擇的影響因素增加了35.295 3%。因此,基于RF 篩選出的變量性能更優(yōu),能夠從需求維度出發(fā)分析汽油價(jià)格走勢(shì)。
對(duì)于柴油而言,基于Ridge 所篩選出的特征參量整體性能較優(yōu),共選取3 個(gè)影響因素,即公路客運(yùn)量、采掘業(yè)柴油消費(fèi)量和生活類柴油消費(fèi)量。具體地,從指標(biāo)性能上來看,其在訓(xùn)練集上的MAPE為10.588 0%,RMSE 為564.403 5,優(yōu)于其他所有的特征選擇方法。因此,Ridge 所篩選出的影響因素,能夠從需求維度角度對(duì)柴油價(jià)格走勢(shì)進(jìn)行分析。
3.3.3 供應(yīng)維度
對(duì)于汽油而言,基于LR 所篩選出的特征參量整體性能較優(yōu),共選取3 個(gè)影響因素,分別為汽油產(chǎn)量、新加坡輕質(zhì)油庫存和主營(yíng)煉廠開工率。其在訓(xùn)練集上的MAPE 為22.857 7%,RMSE 為850.853 9,優(yōu)于其他所有的特征選擇方法。因此,LR 所篩選出供給維度的影響因素能夠用于后續(xù)的成品油價(jià)格走勢(shì)分析。
對(duì)于柴油而言,基于Lasso 回歸所篩選出的特征參量整體性能較優(yōu),共選取4 個(gè)影響因素,分別為主營(yíng)柴油產(chǎn)量、地方煉廠柴油產(chǎn)量、主營(yíng)煉廠開工率和地方煉廠開工率。其在訓(xùn)練集上的MAPE 為17.073 9%,RMSE 為773.701 6,優(yōu)于其他所有的特征選擇方法。因此,Lasso 回歸所篩選出的供給維度因素能夠用于后續(xù)的成品油價(jià)格走勢(shì)分析。
3.3.4 宏觀經(jīng)濟(jì)維度
對(duì)于汽油而言,基于Lasso 回歸所篩選出的特征參量整體性能較優(yōu),共選取5 個(gè)影響因素,分別為當(dāng)月同比CPI、交通工具使用和維修CPI、美元實(shí)際有效匯率指數(shù)、出口貨物退稅收入和平均銷售電價(jià)。其在訓(xùn)練集上MAPE 為14.308 8%,RMSE 為758.608 0,優(yōu)于其他所有的特征選擇方法。因此,Lasso 回歸所篩選出的宏觀經(jīng)濟(jì)維度因素能夠用于后續(xù)的成品油價(jià)格走勢(shì)分析。
對(duì)于柴油而言,基于Ridge 所篩選出的特征參量整體性能較優(yōu),共選取5 個(gè)影響因素,分別為當(dāng)月同比CPI、交通工具使用和維修CPI、短期貸款利率、美元實(shí)際有效匯率指數(shù)和平均銷售電價(jià)。具體地,從指標(biāo)預(yù)測(cè)性能上來看,其在訓(xùn)練集上的MAPE為16.567 7%,RMSE 為855.564 6,雖然RMSE 可能略高于RFE 和RFECV,但MAPE 優(yōu)于其他所有的特征選擇方法。因此,Ridge 所篩選出的宏觀經(jīng)濟(jì)維度因素能夠用于后續(xù)的成品油價(jià)格走勢(shì)分析。
3.3.5 金融維度
對(duì)于汽油而言,基于RFE 所篩選出的特征參量整體性能較優(yōu),共選取3 個(gè)影響因素,分別為布倫特原油期貨成交量、中國(guó)大宗商品價(jià)格指數(shù)(能源類)和美元指數(shù)。其在訓(xùn)練集上的MAPE 為12.375 5%,RMSE 為499.633 2,優(yōu)于其他所有的特征選擇方法。因此,RFE 所篩選出的金融維度因素能夠用于后續(xù)的成品油價(jià)格走勢(shì)分析。
對(duì)于柴油而言,基于RFE 所篩選出的特征參量整體性能較優(yōu),共選取3 個(gè)影響因素,分別為布倫特原油期貨成交量、中國(guó)大宗商品價(jià)格指數(shù)(能源類)和美元指數(shù)。其在訓(xùn)練集上的MAPE 為11.390 2%,RMSE 為510.279 4,優(yōu)于其他所有的特征選擇方法。因此,RF 所篩選出的金融維度因素能夠用于后續(xù)的成品油價(jià)格走勢(shì)分析。
本文在分析篩選國(guó)內(nèi)成品油市場(chǎng)價(jià)格影響因素基礎(chǔ)上,基于特征工程方法,從價(jià)格、需求、供給、宏觀經(jīng)濟(jì)以及金融5 個(gè)維度出發(fā),通過對(duì)歷史數(shù)據(jù)的插補(bǔ)分析處理,分別構(gòu)建汽油和柴油市場(chǎng)批發(fā)價(jià)格特征參量體系。在實(shí)證分析中,通過對(duì)比不同特征工程模型在測(cè)試集上的性能,篩選出成品油市場(chǎng)批發(fā)價(jià)格目標(biāo)序列關(guān)鍵影響因素。從特征參量體系的構(gòu)建結(jié)果來看,汽油和柴油在價(jià)格維度、宏觀經(jīng)濟(jì)維度和金融維度的特征選擇結(jié)果整體相同,說明汽油和柴油作為重要的能源品種,其價(jià)格變化均會(huì)受到包括宏觀經(jīng)濟(jì)波動(dòng)、國(guó)際匯率變動(dòng),以及投資者風(fēng)險(xiǎn)規(guī)避意識(shí)提升等因素的影響。但是,在需求維度和供應(yīng)維度,汽油價(jià)格主要受到包括汽車保有量、輕質(zhì)油庫存以及汽油產(chǎn)量等因素的影響,柴油價(jià)格主要受到柴油消費(fèi)量和柴油產(chǎn)量的影響,特征差異性更為明顯。因此,在生產(chǎn)經(jīng)營(yíng)過程中,相關(guān)政策制定者在制定成品油批發(fā)市場(chǎng)指導(dǎo)價(jià)時(shí),除對(duì)國(guó)際市場(chǎng)油價(jià)變化情況、宏觀經(jīng)濟(jì)環(huán)境形式和金融市場(chǎng)氛圍進(jìn)行深入分析外,還需要有針對(duì)性地考慮汽柴油的供需環(huán)境因素,從而引導(dǎo)成品油生產(chǎn)和消費(fèi)市場(chǎng)的有序發(fā)展。
試驗(yàn)數(shù)據(jù)測(cè)試說明,本文基于特征工程方法從價(jià)格、需求、供給、宏觀經(jīng)濟(jì)以及金融5 個(gè)維度的影響因素出發(fā),使用多種特征選擇模型篩選分析,構(gòu)建了汽油、柴油市場(chǎng)批發(fā)價(jià)格特征參量體系,取得了較好的性能。但是,該方法仍存在一定不足,需要在未來進(jìn)一步探索和改進(jìn)。例如,基于各類影響因素如何設(shè)計(jì)考慮多影響因素的成品油市場(chǎng)價(jià)格預(yù)測(cè)模型,以便預(yù)判成品油市場(chǎng)批發(fā)價(jià)格的變化趨勢(shì),是值得進(jìn)一步研究的方向。