陳逸東,陸忠華
1.中國科學(xué)院 計(jì)算機(jī)網(wǎng)絡(luò)信息中心 高性能計(jì)算部,北京100190
2.中國科學(xué)院大學(xué),北京100049
居民消費(fèi)價(jià)格指數(shù)(CPI)反映一定時(shí)期內(nèi)人們購買一組代表性商品和勞務(wù)總花費(fèi)的變化情況,是國民經(jīng)濟(jì)核算統(tǒng)計(jì)的核心指標(biāo)之一。如果用CPI 來衡量價(jià)格水平,則通貨膨脹率就是不同時(shí)期的CPI 變動(dòng)的百分比。按照國際慣例,當(dāng)CPI增幅連續(xù)超過3%時(shí),即意味著發(fā)生了通貨膨脹;當(dāng)CPI 低于1%時(shí),則有通貨緊縮的風(fēng)險(xiǎn)。當(dāng)通貨膨脹發(fā)生時(shí),貨幣貶值,大多數(shù)居民的利益和生活會受到影響。CPI關(guān)系國計(jì)民生,是管理層制定宏觀經(jīng)濟(jì)政策、分析貨幣市場和債券市場及央行公開市場操作的重要參考依據(jù)。從我國貨幣政策目標(biāo)來看,我國的貨幣政策目標(biāo)是“保持物價(jià)穩(wěn)定,并以此促進(jìn)經(jīng)濟(jì)增長”,物價(jià)穩(wěn)定是我國宏觀經(jīng)濟(jì)決策的重要目標(biāo)之一。如何科學(xué)預(yù)測我國CPI,并在此基礎(chǔ)上運(yùn)用一定的技術(shù)手段,實(shí)施超前性的貨幣政策,對于全面把握經(jīng)濟(jì)發(fā)展趨勢、經(jīng)濟(jì)安全以及社會穩(wěn)定具有重要的意義。
目前,國內(nèi)外對于CPI研究主要是利用歷史月度數(shù)據(jù)構(gòu)建模型。Kontonikas 等[1]基于GARCH 模型分析了英國月度的宏觀經(jīng)濟(jì)數(shù)據(jù),將英國1972 年到2002 年的通脹分解為短期通脹與長期通脹,提出根據(jù)通貨膨脹預(yù)測值的變化制定宏觀經(jīng)濟(jì)政策,以引導(dǎo)通貨膨脹預(yù)期向預(yù)定水平靠攏。Jonathan等[2]采用貝葉斯平均模型預(yù)測對美國四個(gè)不同時(shí)期的通脹進(jìn)行預(yù)測,將預(yù)測結(jié)果與等權(quán)平均模型預(yù)測的結(jié)果進(jìn)行比較,論證了貝葉斯平均模型在預(yù)測美國通脹方面通常比簡單的等加權(quán)平均模型表現(xiàn)得更好。Carstensen 等[3]建立隨機(jī)平均波動(dòng)率模型對美國短期通脹進(jìn)行預(yù)測并與ARMA模型進(jìn)行對比分析。分析結(jié)果表明隨機(jī)平均波動(dòng)率模型相較于ARMA時(shí)間序列模型在預(yù)測美國通脹上有更高的精度和更好的魯棒性。Koop等[4]基于廣義的菲利普斯曲線(Phillips curve),采用動(dòng)態(tài)的計(jì)量模型預(yù)測美國每個(gè)季度的通脹變化率。結(jié)果表明動(dòng)態(tài)計(jì)量模型對于通脹的預(yù)測精度相較于靜態(tài)計(jì)量模型有極大的改善。Ahmar 等[5]使用ARIMA 模型對印尼CPI 進(jìn)行預(yù)測,發(fā)現(xiàn)最優(yōu)模型為ARIMA(1,0,0)。趙影等[6]分析了影響CPI的驅(qū)動(dòng)因素GDP 和M1,采用二元回歸模型對我國未來CPI 走勢進(jìn)行預(yù)測。雷鵬飛等[7]和肖良等[8]根據(jù)CPI 序列的季節(jié)性特點(diǎn),基于季節(jié)性ARIMA 模型對我國CPI 波動(dòng)進(jìn)行預(yù)測。CPI 的主要預(yù)測方法還包括ARX 神經(jīng)網(wǎng)絡(luò)[9]、RBF神經(jīng)網(wǎng)絡(luò)[10]和支持向量回歸[11]等。
然而,這些基于月度數(shù)據(jù)的預(yù)測方法很難充分利用當(dāng)月可觀測到的信息。舉例說明,假如要預(yù)測2020年6月的CPI,可在6 月9 日(國家統(tǒng)計(jì)局發(fā)布上月CPI 的日期)獲得5 月CPI 數(shù)據(jù)后用月度數(shù)據(jù)建模。這樣建立的模型忽略了6月9日至6月30日這段時(shí)間內(nèi)可觀測到的一些金融市場變量對CPI的影響,這些金融變量包括了農(nóng)產(chǎn)品的價(jià)格波動(dòng)、大宗商品的價(jià)格波動(dòng)和外匯市場的匯率波動(dòng)等。按照國家統(tǒng)計(jì)局2020 年公布的指數(shù)構(gòu)成,我國的CPI 包括食品、煙酒及用品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療保健及個(gè)人用品、交通和通信、娛樂教育文化用品及服務(wù)、居住等八大類262個(gè)基本分類。截至2020 年12 月1 日,我國上市的期貨交易品種有上海交易所的銅、鋁、天然橡膠和大連交易所的玉米、黃大豆1 號、黃大豆2 號、鄭州交易所的菜籽油、強(qiáng)麥、普通小麥、棉花、白砂糖等共60個(gè)品種。能否發(fā)掘這些變量中的日度信息,為CPI 提供更精確的預(yù)測,本文將對這一問題展開研究。
期貨作為現(xiàn)貨的一種遠(yuǎn)期交易,其對現(xiàn)貨價(jià)格的引導(dǎo)作用已經(jīng)被國內(nèi)外學(xué)者多次證實(shí)。國內(nèi)外學(xué)者從期貨價(jià)格與宏觀經(jīng)濟(jì)變量相關(guān)性的角度出發(fā),研究了商品期貨的價(jià)格發(fā)現(xiàn)功能[12-14]。Bigman等[15-16]提出利用期貨對現(xiàn)貨價(jià)格的引導(dǎo)作用來預(yù)測CPI 的變化。Foster[17]檢驗(yàn)了美國原油期貨的價(jià)格發(fā)現(xiàn)功能,結(jié)果表明期貨市場對于宏觀經(jīng)濟(jì)的早期風(fēng)險(xiǎn)發(fā)現(xiàn)具有預(yù)警作用,一般情況下期貨市場的走勢領(lǐng)先于宏觀經(jīng)濟(jì)指標(biāo)3到6個(gè)月。周舟[18]采用計(jì)量分析方法對我國商品期貨價(jià)格指數(shù)與CPI的關(guān)系進(jìn)行了實(shí)證分析,檢驗(yàn)結(jié)果顯示,中國商品期貨價(jià)格指數(shù)先行消費(fèi)價(jià)格指數(shù)5個(gè)月。王楠[19]基于向量自回歸(VAR)模型研究鄭商所農(nóng)產(chǎn)品期貨價(jià)格的基準(zhǔn)價(jià)格指數(shù)序列ESABI和CPI的關(guān)系,揭示鄭商所農(nóng)產(chǎn)品期貨對通貨膨脹的預(yù)警作用。隨著我國期貨市場的發(fā)展與壯大,期貨品種更加豐富多樣,商品期貨的整體波動(dòng)更能反映實(shí)物未來一段時(shí)間的變化趨勢。
在上述研究工作的基礎(chǔ)上,本文考慮利用期貨市場的日度交易數(shù)據(jù)發(fā)掘我國期貨農(nóng)產(chǎn)品價(jià)格對于CPI 的先導(dǎo)作用。期貨數(shù)據(jù)種類繁多,卷積神經(jīng)網(wǎng)絡(luò)(CNN)具有特征提取和特征識別的能力,被廣泛應(yīng)用于空間特征提取。長短期記憶網(wǎng)絡(luò)(LSTM)已成功應(yīng)用于時(shí)序依存性數(shù)據(jù)建模[20],本文將CNN和LSTM網(wǎng)絡(luò)聯(lián)合用于期貨面板數(shù)據(jù)的特征提取和CPI 預(yù)測。CNN-LSTM 深度網(wǎng)絡(luò)模型最早由Deng等[21]提出和運(yùn)用。Bae等[22]和Tara等[23]將CNN-LSTM 深度網(wǎng)絡(luò)用于視頻分類,采用卷積神經(jīng)網(wǎng)絡(luò)提取視頻的空間特征,采用長短期記憶網(wǎng)絡(luò)從連續(xù)的音頻信息中提取數(shù)據(jù)的序列特征,該模型將二者提取到的特征視為一個(gè)新的特征作為全連接層的輸入,將不同視頻的分類結(jié)果作為全連接層的輸出。然而,該模型是對三個(gè)獨(dú)立的網(wǎng)絡(luò)分別進(jìn)行訓(xùn)練,再通過組合層對三個(gè)輸出進(jìn)行組合。谷歌Tara 等在上述模型的基礎(chǔ)上提出了CNN-LSTM-DNN 深度網(wǎng)絡(luò)模型[23],將CNN、LSTM和DNN合并為一個(gè)統(tǒng)一的框架共同訓(xùn)練。該模型成功運(yùn)用于語音識別,極大降低了語言識別的詞錯(cuò)誤率(word error rate)。
期貨面版數(shù)據(jù)既具有類似圖像的空間特征,又具有時(shí)域相依特征,為此本文提出采用卷積神經(jīng)網(wǎng)絡(luò)對期貨面板數(shù)據(jù)進(jìn)行空間特征提取,將提取到的特征作為LSTM 網(wǎng)絡(luò)的輸入,最后用全連接層輸出CPI 的預(yù)測結(jié)果。本文的實(shí)驗(yàn)數(shù)據(jù)采用國內(nèi)市場的三大種類期貨合約:農(nóng)產(chǎn)品期貨、金屬期貨和能源期貨的日交易數(shù)據(jù)。通過訓(xùn)練CNN-LSTM 深度網(wǎng)絡(luò)模型,學(xué)習(xí)空間特征之間的時(shí)間關(guān)聯(lián),動(dòng)態(tài)定量預(yù)測未來一段時(shí)間內(nèi)CPI的變化,為CPI和其他宏觀經(jīng)濟(jì)指標(biāo)的預(yù)測提供一種參考。
CPI 數(shù)據(jù)是宏觀經(jīng)濟(jì)數(shù)據(jù),以月為單位發(fā)布,數(shù)據(jù)本身所包含的信息有限。研究表明商品期貨的價(jià)格波動(dòng)與CPI 波動(dòng)之間存在密切的關(guān)系。商品期貨包括農(nóng)產(chǎn)品期貨、能源期貨和有色金屬期貨。本文首先將每日商品期貨的交易信息轉(zhuǎn)換為類圖像,以農(nóng)產(chǎn)品期貨為例,農(nóng)產(chǎn)品期貨合約包括蘋果、小麥和大豆等不同種類商品,每一種農(nóng)場品期貨合約又包括了近期合約、次近期合約和遠(yuǎn)期合約。本文將每一類數(shù)據(jù)視為一個(gè)特征,由于每個(gè)特征包含不同交割月的數(shù)據(jù),將所有數(shù)據(jù)按列拼接成二維面板數(shù)據(jù)(如圖1所示),該面板數(shù)據(jù)包含空間特征和時(shí)間特征,采用卷積神經(jīng)網(wǎng)絡(luò)對面版數(shù)據(jù)進(jìn)行特征提取,采用LSTM網(wǎng)絡(luò)輸出CPI的預(yù)測值。
圖1 期貨面板數(shù)據(jù)結(jié)構(gòu)Fig.1 Futures panel data structure
1.1.1 基于CNN的期貨特征提取
CNN可以用于研究任何輸入和輸出之間的映射關(guān)系而不需要建立精確的數(shù)學(xué)表達(dá)式。本文所使用的卷積神經(jīng)網(wǎng)絡(luò)主要包括卷積層與池化層,通過提取面板數(shù)據(jù)具有代表性的全局特征,建立輸入與輸出之間的映射關(guān)系。基于CNN 的期貨特征提取基本過程如圖2 所示。卷積層對每個(gè)時(shí)刻輸入的面板數(shù)據(jù)采用多個(gè)卷積核對面板數(shù)據(jù)進(jìn)行掃描,通過卷積運(yùn)算提取特征,將提取到的特征進(jìn)行池化運(yùn)算(Pooling)。實(shí)現(xiàn)池化最常見的方法是對每個(gè)過濾器的結(jié)果應(yīng)用max 操作。這里使用最大池化有兩個(gè)原因。第一,通過消除非最大值減少了上層的計(jì)算量。第二,提取不同區(qū)域的局部依賴關(guān)系,保留最顯著的信息,將獲得的區(qū)域向量作為LSTM網(wǎng)絡(luò)的輸入。
1.1.2 基于CNN-LSTM的CPI預(yù)測
提取特征以后,針對CPI 數(shù)據(jù)具有時(shí)間相依的特點(diǎn),長短期記憶網(wǎng)絡(luò)(LSTM)來輸出CPI的預(yù)測值。
長短記憶網(wǎng)絡(luò)在隱含層引入了內(nèi)存單元來代替?zhèn)鹘y(tǒng)的人工神經(jīng)元。有了這些記憶單元,網(wǎng)絡(luò)能夠有效地將記憶關(guān)聯(lián)起來,并進(jìn)行遠(yuǎn)程的時(shí)間輸入,適合動(dòng)態(tài)掌握期貨合約的數(shù)據(jù)結(jié)構(gòu),具有較高的預(yù)測能力。CNNLSTM深度網(wǎng)絡(luò)通過最小化CPI的預(yù)測值與實(shí)際值之間的均方誤差進(jìn)行訓(xùn)練。對于測試集上的面版數(shù)和CPI數(shù)據(jù)損失函數(shù)定義為:
其中,X={x(1),x(2),…,x(m)}分別表示m個(gè)時(shí)刻的面板數(shù)據(jù),h(x(i))表示每一個(gè)時(shí)刻CPI的預(yù)測值,Y={y(1),y(2),…,y(m)}表示每一個(gè)時(shí)刻CPI 的實(shí)際值。深度神經(jīng)網(wǎng)絡(luò)存在兩種可能影響模型訓(xùn)練效果的問題,一是梯度消失導(dǎo)致神經(jīng)網(wǎng)絡(luò)難以收斂,二是過擬合導(dǎo)致測試集失效。Batch-Normalization(BN)能有效解決梯度消失問題,Dropout技術(shù)通過阻止神經(jīng)元共適應(yīng)能夠緩解過擬合問題。本文在設(shè)計(jì)CNN-LSTM 深度網(wǎng)絡(luò)時(shí)添加了BN 層和Dropout層以優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。
模型在訓(xùn)練過程中分為兩個(gè)階段,第一個(gè)階段是網(wǎng)絡(luò)預(yù)訓(xùn)練,第二個(gè)階段是網(wǎng)絡(luò)動(dòng)態(tài)訓(xùn)練和預(yù)測(參見圖3)。在網(wǎng)絡(luò)預(yù)訓(xùn)練階段,模型采用t0時(shí)刻之前的數(shù)據(jù)集訓(xùn)練深度網(wǎng)絡(luò)。當(dāng)訓(xùn)練完成以后,進(jìn)入動(dòng)態(tài)訓(xùn)練和預(yù)測階段。在這個(gè)階段,對于每一個(gè)tn時(shí)刻的數(shù)據(jù),模型采用tn時(shí)刻之前包括tn時(shí)刻的數(shù)據(jù)作為訓(xùn)練集訓(xùn)練網(wǎng)絡(luò),預(yù)測(tn,tn+Tn)時(shí)間段內(nèi)的CPI 值。預(yù)測完成之后,滑動(dòng)時(shí)間窗口,采用tn+1=tn+Tn時(shí)刻之前的數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)。重復(fù)上述過程,不斷滑動(dòng)時(shí)間窗口,直至tN時(shí)刻(tN表示滑動(dòng)窗口的終止時(shí)刻),所有數(shù)據(jù)預(yù)測完成。
Fig.2 Feature extraction based on CNN圖2 基于CNN的期貨特征提取
圖3 CNN-LSTM深度網(wǎng)絡(luò)預(yù)測CPIFig.3 Forecasting CPI based on CNN-LSTM deep neural network
本文選取了國內(nèi)三大期貨交易所包括上海期貨交易所、鄭州商品交易所和大連商品交易所的期貨交易數(shù)據(jù)對模型進(jìn)行訓(xùn)練。數(shù)據(jù)選取的時(shí)間范圍從2010 年1月1日至2020年6月31日共計(jì)2 483個(gè)交易日。對期貨合約的缺失數(shù)據(jù)按上一個(gè)交易日的數(shù)據(jù)補(bǔ)全。面板數(shù)據(jù)的每一列表示一個(gè)交易品種,每個(gè)品種選取次交割期、次近交割期和次次近交割期的合約。每種合約選取結(jié)算價(jià)、成交量、持倉量和未平倉量共四個(gè)特征。數(shù)據(jù)獲取方面,期貨日交易數(shù)據(jù)從國泰君安數(shù)據(jù)庫獲??;CPI數(shù)據(jù)從國家統(tǒng)計(jì)局網(wǎng)站獲?。幻吭碌腃PI 采用環(huán)比CPI(上月=100),訓(xùn)練前對原始CPI 數(shù)據(jù)xt進(jìn)行變換:(xt-100)/100。本文采用當(dāng)月期貨合約預(yù)測當(dāng)月CPI是合理的,國家統(tǒng)計(jì)局總是在下個(gè)月的中旬公布上個(gè)月的CPI。
宏觀數(shù)據(jù)的發(fā)布往往以月、季度或者年度為單位。本文針對宏觀數(shù)據(jù)樣本量稀疏的特點(diǎn)采用線性插值處理。這樣做有兩個(gè)優(yōu)點(diǎn):一是保持?jǐn)?shù)據(jù)的趨勢性。二是大大增加了深度網(wǎng)絡(luò)訓(xùn)練樣本的數(shù)量。用yt和yt-1分別表示t月和t-1 月國家統(tǒng)計(jì)局公布的CPI,函數(shù)U(·)將北京時(shí)間轉(zhuǎn)換為Unix時(shí)間戳,則t月第k日的CPI的值采用線性插值計(jì)算:
例如,國家統(tǒng)計(jì)局公布的2020 年3 月和4 月的CPI(環(huán)比,上月=100)分別為98.77 和99.14,采用線性插值計(jì)算得到2020 年4 月的每個(gè)期貨交易日的CPI 的值如表1所示。
表1 2020年4月CPI插值數(shù)據(jù)示例Table 1 Example of CPI interpolated data(April 2020)
對宏觀數(shù)據(jù)采用線性插值的方法,保留了原始數(shù)據(jù)的變化趨勢,增加原始宏觀數(shù)據(jù)樣本數(shù)量的數(shù)量,為深度學(xué)習(xí)訓(xùn)練提供了較好的數(shù)據(jù)集。事實(shí)上,宏觀數(shù)據(jù)在繪圖過程中,默認(rèn)了數(shù)據(jù)之間的變化是線性的。后續(xù)的實(shí)驗(yàn)中可以看到,線性插值數(shù)據(jù)對于傳統(tǒng)的預(yù)測方法不會產(chǎn)生較大的影響。采用線性插值的方法,注意需要避免在tn時(shí)刻引入包含未來信息的訓(xùn)練集,這樣做訓(xùn)練出來的模型不符合實(shí)際。例如在tn時(shí)刻,只允許使用tn時(shí)刻對應(yīng)月份的上個(gè)月之前的CPI數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。
本文的評價(jià)指標(biāo)分為兩類。一類是常用的評價(jià)指標(biāo),這類評價(jià)指標(biāo)包括均方根誤差(RMSE),平均絕對百分比誤差(MAPE)和Pearson 相關(guān)系數(shù)R,用于評價(jià)模型的預(yù)測精度;另一類評價(jià)指標(biāo)是本文設(shè)計(jì)引入的定向精度(directional accuracy,DA)指標(biāo),用以評價(jià)模型對于趨勢預(yù)測的準(zhǔn)確程度,以下分別予以說明。平均均方根誤差(MRSE)表示為:
平均絕對百分誤差(MAPE)表示為:
Pearson相關(guān)系數(shù)R表示為:
這三個(gè)評價(jià)指標(biāo)用于評價(jià)模型的預(yù)測精度。為了評價(jià)模型對于趨勢預(yù)測的準(zhǔn)確程度,本文設(shè)計(jì)引入定向精度(directional accuracy,DA)指標(biāo)。該指標(biāo)用于評價(jià)模型對于時(shí)間序列趨勢的預(yù)測的準(zhǔn)確率,指標(biāo)的計(jì)算方法如下:
其中,trendt是CPI 預(yù)測的趨勢。t時(shí)刻趨勢定義為:
本章實(shí)驗(yàn)主要分為三個(gè)部分,實(shí)驗(yàn)第一部分對模型的預(yù)測結(jié)果進(jìn)行分析。第二部分將CNN-LSTM模型與SMR、ARIMA 和LSTM 模型進(jìn)行對比分析。最后對模型進(jìn)行穩(wěn)定性分析,比較引入不同期貨合約的CNNLSTM 模型對CPI 預(yù)測結(jié)果的影響。所有模型均采用2010 年1 月至2018 年12 月的CPI 數(shù)據(jù)作為訓(xùn)練集,2019年1月至2020年5月的數(shù)據(jù)作為測試集。
模型預(yù)測2019 年1 月至2020 年5 月CPI 的結(jié)果如圖4所示,實(shí)驗(yàn)對比了基于期貨價(jià)格數(shù)據(jù)的CNN-LSTM模型預(yù)測結(jié)果和不含期貨合約數(shù)據(jù)的CNN-LSTM模型預(yù)測CPI的結(jié)果。其中預(yù)測值1表示在不引入期貨合約數(shù)據(jù)的情況下CNN-LSTM 模型預(yù)測CPI 的結(jié)果,此時(shí)模型對于CPI的趨勢的預(yù)測仍存在較大偏差,引入期貨數(shù)據(jù)以后,從預(yù)測值2 可以看到,CNN-LSTM 深度網(wǎng)絡(luò)對未來一段時(shí)間內(nèi)CPI的變化趨勢做出了正確的判斷,并且CNN-LSTM網(wǎng)絡(luò)的預(yù)測精度也十分高。
實(shí)驗(yàn)第二部分將CNN-LSTM深度網(wǎng)絡(luò)的預(yù)測結(jié)果與支持向量回歸、ARIMA、LSTM 模型的預(yù)測結(jié)果進(jìn)行對比分析。不同模型的參數(shù)如表2所示。其中,SVR模型的核函數(shù)為RBF核函數(shù)[10],ARIMA模型的參數(shù)為(1,0,0),在窗口滑動(dòng)的過程中,CNN-LSTM深度網(wǎng)絡(luò)總是以當(dāng)前時(shí)刻對應(yīng)月份之前的數(shù)據(jù)作為輸入,以當(dāng)前時(shí)刻對應(yīng)的月份的CPI值作為輸出。
表2 CNN-LSTM深度網(wǎng)絡(luò)、SVR、ARIMA和LSTM模型參數(shù)表Table 2 Parameters of CNN-LSTM deep neutral network,SVR,ARIMA and LSTM
圖5展示了基于ARIMA、LSTM、SVR對2019年1月至2020 年5 月CPI 的預(yù)測結(jié)果。只關(guān)注模型在測試集上的表現(xiàn)情況。從預(yù)測結(jié)果可以看出,在2019年5月至2019年7月時(shí)間段內(nèi),ARIMA模型對CPI變化趨勢的預(yù)測是十分準(zhǔn)確的,預(yù)測精度也比較高。然而,在CPI波動(dòng)比較劇烈的時(shí)間段(2019年9月至2020年5月),ARIMA模型的預(yù)測值相對于真實(shí)值的偏離比較大,且對CPI變化趨勢的預(yù)測也不夠準(zhǔn)確。從圖5 的結(jié)果可以得出LSTM 的CPI 預(yù)測的結(jié)果,LSTM 網(wǎng)絡(luò)在部分時(shí)間段上(2019 年7 月11 月,2020 年2 月5 月)對CPI 變化趨勢的判斷是準(zhǔn)確的,預(yù)測精度也比較高。和ARIMA 模型的表現(xiàn)相似的是,在部分時(shí)間段內(nèi),LSTM 的預(yù)測精度和趨勢判斷都不夠理想(2019 年1 月至2019 年6 月)。從SVR(圖5)的預(yù)測結(jié)果可以看出,在每一個(gè)時(shí)間點(diǎn),SVR的預(yù)測值十分接近于上一個(gè)時(shí)刻的真實(shí)值,這表明SVR的預(yù)測值相對于真實(shí)值滯后,出現(xiàn)這種現(xiàn)象的本質(zhì)的原因是CPI歷史數(shù)據(jù)所包含的信息量有限,這也是大多數(shù)基于月度數(shù)據(jù)的模型容易遇到的問題,為了解決這樣的問題,引入與CPI變動(dòng)密切相關(guān)的日度信息是有必要的。
圖5 CPI預(yù)測結(jié)果對比Fig.5 Comparison of CPI prediction results
表3對比了在不同評價(jià)指標(biāo)下LSTM、SVM、ARIMA和CNN-LSTM 的精度和趨勢精度。從表3 可以看到,CNN-LSTM深度網(wǎng)絡(luò)預(yù)測結(jié)果的均方根誤差(RMSE),平均絕對百分比誤差(MAPE)分別為0.043 4和0.326 6,均小于其他三個(gè)模型。CNN-LSTM深度網(wǎng)絡(luò)預(yù)測結(jié)果與真實(shí)值的Pearson相關(guān)系數(shù)R為0.992 5,呈現(xiàn)出高度的正相關(guān)性,定向精度DA為0.625 8,也優(yōu)于其他三個(gè)模型的結(jié)果。CNN-LSTM深度網(wǎng)絡(luò)利用月與月之間可觀測到的期貨市場的價(jià)格變動(dòng),發(fā)掘期貨價(jià)格波動(dòng)對于CPI 變化的影響,具有很好的期貨價(jià)格發(fā)現(xiàn)能力和CPI預(yù)測能力。
表3 模型預(yù)測結(jié)果的評價(jià)指標(biāo)對比Table 3 Comparison of evaluation indicators of model prediction results
實(shí)驗(yàn)的第三部分對CNN-LSTM模型進(jìn)行穩(wěn)定性分析。設(shè)計(jì)實(shí)驗(yàn),對比模型在不同期貨合約預(yù)測CPI的穩(wěn)定性。分別測試在單一期貨合約和多品種期貨合約下模型的預(yù)測精度。由表4可以進(jìn)行分析,當(dāng)輸入的期貨合約品種在50 個(gè)以上的時(shí),模型預(yù)測結(jié)果的平均絕對百分比誤差、Pearson 相關(guān)系數(shù)和定向精度均保持在較為穩(wěn)定的區(qū)間,這表明模型的預(yù)測具有一定的穩(wěn)定性。當(dāng)期貨品種數(shù)量少于40,模型預(yù)測值的平均絕對百分比誤差有較為顯著的上升,且Pearson 相關(guān)系數(shù)和定向精度均有下降。在期貨品種較少的情況下,數(shù)據(jù)所包含的信息有限,使得模型較難對CPI提供精確的預(yù)測。從以上結(jié)果可以得出,當(dāng)期貨合約數(shù)據(jù)的樣本數(shù)量保持在一定的水平,本文模型結(jié)構(gòu)能對CPI 提供較為精確的預(yù)測,這表明模型具有一定的穩(wěn)定性。
表4 不同種類期貨合約預(yù)測結(jié)果分析Table 4 Analysis of forecasting results with different future types
科學(xué)預(yù)測我國CPI 并在此基礎(chǔ)上運(yùn)用一定的技術(shù)手段,實(shí)施超前性的貨幣政策,對于全面把握經(jīng)濟(jì)發(fā)展趨勢、經(jīng)濟(jì)安全以及社會穩(wěn)定具有重要的意義。期貨的價(jià)格變動(dòng)是通貨膨脹更早期的預(yù)警指標(biāo),它包含基礎(chǔ)商品價(jià)格的波動(dòng)會影響生產(chǎn)者價(jià)格指數(shù),進(jìn)而影響消費(fèi)者價(jià)格指數(shù)。CNN 具有特征提取和特征識別的特點(diǎn),被廣泛應(yīng)用于空間特征提??;LSTM網(wǎng)絡(luò)具有處理時(shí)序相依數(shù)據(jù)的能力,本文選取期貨日交易數(shù)據(jù),結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長短期記憶(LSTM)網(wǎng)絡(luò)的特點(diǎn),提出基于CNN-LSTM 深度網(wǎng)絡(luò)的CPI 預(yù)測模型,進(jìn)行期貨面板數(shù)據(jù)特征提取和CPI 預(yù)測。論文針對CNN-LSTM深度網(wǎng)絡(luò)訓(xùn)練過程中存在兩種影響模型訓(xùn)練效果的問題,一是梯度消失導(dǎo)致神經(jīng)網(wǎng)絡(luò)難以收斂,二是過擬合導(dǎo)致測試集失效,本文在設(shè)計(jì)訓(xùn)練網(wǎng)絡(luò)時(shí)添加BN層效解決了梯度消失問題,通過Dropout 技術(shù)阻止神經(jīng)元共適應(yīng)緩解決了過擬合問題。CPI 數(shù)據(jù)是以月為單位發(fā)布的,數(shù)據(jù)量相對較少,為解決訓(xùn)練過程中存在樣本數(shù)量不足的問題,本文對月度CPI 數(shù)據(jù)進(jìn)行插值處理,提高深度網(wǎng)絡(luò)訓(xùn)練樣本量。論文設(shè)計(jì)實(shí)驗(yàn)實(shí)現(xiàn)了CNNLSTM 深度網(wǎng)絡(luò),將預(yù)測過程分為兩個(gè)階段,一是預(yù)訓(xùn)練階段,二是動(dòng)態(tài)訓(xùn)練預(yù)測階段;通過滑動(dòng)時(shí)間窗口對網(wǎng)絡(luò)進(jìn)行訓(xùn)練并對未來一段時(shí)間的CPI做出預(yù)測;將預(yù)測結(jié)果與支持向量回歸、ARIMA 和LSTM 模型進(jìn)行對比分析,結(jié)果表明CNN-LSTM 預(yù)測結(jié)果的各項(xiàng)評價(jià)指標(biāo),包括MRSE、MAPE、Pearson 相關(guān)系數(shù)和DA 均優(yōu)于傳統(tǒng)方法預(yù)測的結(jié)果,當(dāng)期貨合約數(shù)據(jù)的樣本數(shù)量保持在一定的水平,本文的模型結(jié)構(gòu)能對CPI提供較為精確的預(yù)測。研究表明,本文提出的CNN-LSTM深度網(wǎng)絡(luò)具有很好的價(jià)格發(fā)現(xiàn)能力,對于CPI早期預(yù)警具有意義。