沈欣宜, 李 旭, 沈 虹
(揚(yáng)州大學(xué)商學(xué)院, 江蘇 揚(yáng)州 225127)
一直以來(lái), 金融資產(chǎn)的價(jià)格預(yù)測(cè)是微觀金融領(lǐng)域關(guān)注的重要問(wèn)題之一.傳統(tǒng)的資產(chǎn)價(jià)格預(yù)測(cè)主要通過(guò)使用自回歸、滑動(dòng)平均、廣義自回歸等線性時(shí)間序列模型來(lái)實(shí)現(xiàn).然而,由于資產(chǎn)價(jià)格的走勢(shì)往往表現(xiàn)出高度的不確定性和非平穩(wěn)的特征,因此,也大大限制了時(shí)間序列模型在價(jià)格預(yù)測(cè)方面的應(yīng)用及拓展.近年來(lái),隨著人工智能的快速發(fā)展,以人工神經(jīng)網(wǎng)絡(luò)為代表的各類(lèi)機(jī)器學(xué)習(xí)算法為構(gòu)建數(shù)據(jù)間的非線性關(guān)系,提高預(yù)測(cè)能力提供了很好的思路與方法.在機(jī)器學(xué)習(xí)包含的眾多學(xué)習(xí)算法中, 支持向量機(jī)(support vector machine,SVM)、神經(jīng)網(wǎng)絡(luò)等模型在價(jià)格預(yù)測(cè)方面有著廣泛的應(yīng)用.Huang等[1]使用SVM模型預(yù)測(cè)NIKKEI 225指數(shù)以及財(cái)務(wù)移動(dòng)方向, 同時(shí)將SVM與線性判別、二次判別和Elman反向傳播神經(jīng)網(wǎng)絡(luò)進(jìn)行了比較,證明了SVM優(yōu)于其他分類(lèi)方法; Yu等[2]提出了一種演化的最小二乘支持向量機(jī),探索美國(guó)股票市場(chǎng)三個(gè)重要股指的走勢(shì); Huang等[3]則采用支持向量回歸(support vector regression, SVR)對(duì)單日股票價(jià)格的具體數(shù)值進(jìn)行回歸預(yù)測(cè),通過(guò)特征選擇方法優(yōu)化輸入特征,并運(yùn)用自組織特征圖(self-organizing feature maps, SOFM)技術(shù)對(duì)輸入SVR的訓(xùn)練樣本進(jìn)行篩選,極大地提升了SVR的預(yù)測(cè)準(zhǔn)確度.
神經(jīng)網(wǎng)絡(luò)作為人工智能領(lǐng)域的非線性方法,在處理多維、高頻、非連續(xù)數(shù)據(jù)等方面具有先天優(yōu)勢(shì), 且能有效識(shí)別金融序列的長(zhǎng)短期記憶效應(yīng),因此被應(yīng)用于各類(lèi)金融預(yù)測(cè).Di Persio等[4]將循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory, LSTM)和門(mén)控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(gated recurrent unit, GRU)用于谷歌股價(jià)趨勢(shì)預(yù)測(cè), 結(jié)果顯示LSTM 神經(jīng)網(wǎng)絡(luò)在金融序列預(yù)測(cè)方面具有優(yōu)勢(shì); Fischer等[5]基于日度交易數(shù)據(jù)采用LSTM模型預(yù)測(cè)股票收益率相對(duì)于其截面中值的漲跌方向, 其構(gòu)建的投資組合績(jī)效顯著優(yōu)于傳統(tǒng)線性模型; Zhang等[6]提出使用生成對(duì)抗網(wǎng)絡(luò)來(lái)預(yù)測(cè)股票市場(chǎng),并以多層感知機(jī)(multilayer perceptron, MLP)為鑒別器, LSTM為生成器來(lái)預(yù)測(cè)收盤(pán)價(jià).
由于期貨市場(chǎng)是一個(gè)復(fù)雜的非線性動(dòng)力系統(tǒng), 其價(jià)格波動(dòng)受多重因素的影響.早期的相關(guān)研究主要從期貨與現(xiàn)貨之間、相同品種不同市場(chǎng)之間的高度相關(guān)性進(jìn)行展開(kāi), 并基于市場(chǎng)本身的價(jià)量進(jìn)行分析.以GARCH(generalized autoregressive conditional heteroskedasticity)模型、Copula模型為代表的時(shí)間序列模型是衡量?jī)r(jià)格波動(dòng)的主流方法[7-8].Yue等[9]采用VAR-DCC-GARCH模型探討了中國(guó)有色金屬市場(chǎng)價(jià)格和倫敦LME價(jià)格之間的Co-movement關(guān)系; Han等[10]從投資者情緒角度出發(fā),分析其對(duì)價(jià)格波動(dòng)的影響,研究發(fā)現(xiàn)基于Google搜索量構(gòu)造的投資者情緒對(duì)商品期貨價(jià)格具有較好的樣本外預(yù)測(cè)能力.但如果將多重因素納入同一價(jià)格預(yù)測(cè)框架中,傳統(tǒng)的線性預(yù)測(cè)模型則變得越來(lái)越局限,而使用機(jī)器學(xué)習(xí)算法為期貨市場(chǎng)價(jià)格預(yù)測(cè)研究打開(kāi)了新的思路.基于此,本文擬以上海期貨交易所的代表性品種銅期貨為研究對(duì)象,對(duì)于影響銅期貨價(jià)格的因素分析進(jìn)行更為全面的分析.這個(gè)過(guò)程中往往充斥著各類(lèi)噪音,并不是越復(fù)雜的機(jī)器學(xué)習(xí)算法就越有效,因此需要根據(jù)數(shù)據(jù)與預(yù)測(cè)目標(biāo)的相關(guān)性進(jìn)行數(shù)據(jù)處理、分類(lèi)和合成,并根據(jù)模型的擬合度不斷進(jìn)行優(yōu)化,從而選擇更為精準(zhǔn)的預(yù)測(cè)模型.與此同時(shí),由于引起資產(chǎn)價(jià)格變動(dòng)的因素眾多,在收集并運(yùn)用大量金融數(shù)據(jù)的過(guò)程中,機(jī)器學(xué)習(xí)經(jīng)常會(huì)遇到維度災(zāi)難的問(wèn)題,這往往會(huì)降低模型的預(yù)測(cè)能力,如何選擇合適的特征變量是亟需解決的關(guān)鍵問(wèn)題.因此,本文將國(guó)內(nèi)外市場(chǎng)的各類(lèi)相關(guān)指標(biāo),以及反映投資者心理情緒的百度指數(shù)加入預(yù)測(cè)框架中,從中提取關(guān)鍵特征變量,通過(guò)構(gòu)建多因素的支持向量機(jī)、MLP神經(jīng)網(wǎng)絡(luò)、LSTM神經(jīng)網(wǎng)絡(luò)和GRU神經(jīng)網(wǎng)絡(luò)模型分別對(duì)銅期貨價(jià)格進(jìn)行預(yù)測(cè),旨在為有色金屬期貨市場(chǎng)的金融預(yù)測(cè)提供可參考的模型,使得對(duì)資產(chǎn)價(jià)格影響因素的研究更加全面.
1.1.1 SVM
1.1.2SVR
多層感知器(MLP)是一種前向反饋的人工神經(jīng)網(wǎng)絡(luò), 由輸入層、隱含層和輸出層組成, 每層節(jié)點(diǎn)之間完全相連.輸入層接收數(shù)據(jù)輸入, 其他層的節(jié)點(diǎn)通過(guò)應(yīng)用一個(gè)激活函數(shù)得到該層相應(yīng)的輸出.MLP的學(xué)習(xí)策略是使用梯度下降法,通過(guò)反向傳播來(lái)不斷調(diào)整節(jié)點(diǎn)間的權(quán)重和閾值,使網(wǎng)絡(luò)的均方誤差達(dá)到最?。畧D1是1個(gè)三層MLP神經(jīng)網(wǎng)絡(luò)模型示例.
圖1 MLP神經(jīng)網(wǎng)絡(luò)模型Fig.1 MLP neural network model
LSTM神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)的一個(gè)變體, 通過(guò)設(shè)計(jì)特殊的神經(jīng)元結(jié)構(gòu),能成功解決其他學(xué)習(xí)算法難以處理長(zhǎng)期信息的缺陷.在細(xì)胞單元內(nèi)部由三大門(mén)限單元構(gòu)成, 分別是遺忘門(mén)、輸入門(mén)和輸出門(mén), 如圖2所示.LSTM的創(chuàng)新之處在于, 隨著細(xì)胞元狀態(tài)Ct-1從左至右貫穿LSTM結(jié)構(gòu), 序列數(shù)據(jù)首先經(jīng)過(guò)遺忘門(mén)篩選掉部分信息,再通過(guò)輸入門(mén)增加需要新增的數(shù)據(jù), 而長(zhǎng)期狀態(tài)Ct直接輸出.在LSTM結(jié)構(gòu)的每個(gè)節(jié)點(diǎn), 不斷有數(shù)據(jù)篩選和增加,并且通過(guò)輸出門(mén)結(jié)構(gòu),判斷長(zhǎng)期狀態(tài)中哪些有效信息被保留, 哪些無(wú)效信息被過(guò)濾,形成短期狀態(tài)ht.LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)利用長(zhǎng)短期序列數(shù)據(jù)共同學(xué)習(xí), 將重要有參考性的信息保留在長(zhǎng)期狀態(tài)中,使模型達(dá)到最優(yōu).
圖2 LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 LSTM network structure diagram
GRU神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)的另一個(gè)重要變體.與LSTM相比, GRU結(jié)構(gòu)更簡(jiǎn)單, 參數(shù)更少.GRU在LSTM基礎(chǔ)上進(jìn)行了2個(gè)改進(jìn): 1) 將輸入門(mén)、遺忘門(mén)、輸出門(mén)變?yōu)橹刂瞄T(mén)rt和更新門(mén)zt; 2) 將LSTM的單元狀態(tài)Ct與輸出合并為一個(gè)狀態(tài)ht.圖3為GRU神經(jīng)元的內(nèi)部結(jié)構(gòu).
圖3 GRU網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.3 GRU network structure diagram
2.1.1 指標(biāo)選取
銅期貨價(jià)格的波動(dòng)除與歷史價(jià)格相關(guān)外,還受到諸多因素的影響,主要包括供求關(guān)系、宏觀經(jīng)濟(jì)、相關(guān)商品、國(guó)際期貨市場(chǎng)以及市場(chǎng)情緒等.為了擺脫對(duì)歷史交易價(jià)格的數(shù)據(jù)依賴(lài),本文收集的數(shù)據(jù)中剔除了每日最高價(jià)、最低價(jià)、開(kāi)盤(pán)價(jià)、收盤(pán)價(jià),重點(diǎn)考察其他因素對(duì)銅期貨價(jià)格的預(yù)測(cè)能力.由于期貨結(jié)算價(jià)是某一期貨合約每日按照交易量加權(quán)的平均價(jià),其價(jià)格走勢(shì)更具有代表性,因此,本文選取銅期貨的結(jié)算價(jià)格作為被解釋變量,將下一個(gè)交易日的銅期貨結(jié)算價(jià)預(yù)測(cè)值作為模型輸出,共選取26個(gè)指標(biāo),在供求關(guān)系方面選取銅期貨的持倉(cāng)量和成交量2個(gè)指標(biāo),其他24個(gè)指標(biāo)按宏觀經(jīng)濟(jì)、相關(guān)市場(chǎng)和百度指數(shù)分為三類(lèi),具體如表1所示.
2.1.2 數(shù)據(jù)收集
選取上海期貨交易所銅期貨的主力合約(簡(jiǎn)稱(chēng)“銅期貨”)作為研究樣本, 銅期貨的結(jié)算價(jià)選取自2011年1月4日至2021年1月29日期間共2 452個(gè)日度交易數(shù)據(jù), 其他26個(gè)變量的數(shù)據(jù)收集時(shí)間均是基于銅期貨結(jié)算價(jià)時(shí)間序列.對(duì)于銅期貨在當(dāng)天有交易而其他變量沒(méi)有交易或者出現(xiàn)數(shù)據(jù)缺失時(shí),為保證數(shù)據(jù)的連續(xù)性, 用該序列的上一日有交易數(shù)據(jù)值進(jìn)行填充.以上數(shù)據(jù)均來(lái)源于Wind數(shù)據(jù)庫(kù)和百度指數(shù)官網(wǎng).
為進(jìn)一步細(xì)化預(yù)測(cè)效果,本文對(duì)有色金屬進(jìn)行長(zhǎng)短期價(jià)格預(yù)測(cè), 用20個(gè)交易日的時(shí)間長(zhǎng)度衡量短期預(yù)測(cè)效果, 200個(gè)交易日的時(shí)間長(zhǎng)度衡量長(zhǎng)期預(yù)測(cè)效果.對(duì)預(yù)測(cè)模型訓(xùn)練時(shí), 使用每個(gè)交易日的數(shù)據(jù)信息預(yù)測(cè)下一日的結(jié)算價(jià), 故對(duì)總樣本區(qū)間剔除最后20個(gè)交易日后的數(shù)據(jù)作為訓(xùn)練集, 分別選取最后200個(gè)交易日的前20和200個(gè)交易日數(shù)據(jù)作為短期和長(zhǎng)期預(yù)測(cè)的測(cè)試集.
2.1.3 數(shù)據(jù)預(yù)處理
在建模過(guò)程中,為消除數(shù)據(jù)間的量綱影響并提升模型的預(yù)算速度, 對(duì)所有數(shù)據(jù)進(jìn)行了零-均值規(guī)范化處理, 其轉(zhuǎn)換公式為Z=(X-μ)/σ, 其中X為須要標(biāo)準(zhǔn)化處理的原始值,μ為均值,σ為標(biāo)準(zhǔn)差且不等于0.
本次實(shí)驗(yàn)選取了26個(gè)特征指標(biāo), 從已有特征中篩選出與銅期貨價(jià)格變動(dòng)更相關(guān)的特征, 有助于提高模型預(yù)測(cè)的準(zhǔn)確度[12], 因此在構(gòu)建模型前, 須對(duì)原始特征變量進(jìn)行選擇和降維處理.
2.2.1 相關(guān)性分析
相關(guān)性分析用于衡量特征變量和目標(biāo)變量之間的關(guān)系.Pearson相關(guān)系數(shù)是用來(lái)反映變量和變量的線性相關(guān)程度的一種方法, Pearson值介于-1和1之內(nèi), 絕對(duì)值的大小表示了相關(guān)性的強(qiáng)弱.X和Y兩個(gè)相關(guān)變量間的Pearson相關(guān)系數(shù)r(X,Y)=E(X-μX)(Y-μY)/(σXσY), 其中μX和μY分別為X和Y的均值,σX和σY分別為X和Y的標(biāo)準(zhǔn)差,E為期望.
本文的輸出變量為下一個(gè)交易日的銅期貨結(jié)算價(jià)預(yù)測(cè)值, 為獲得與輸出變量相關(guān)性高的特征變量,首先測(cè)算26個(gè)特征變量與輸出變量之間的Pearson相關(guān)系數(shù), 其結(jié)果如表1所示.由于各特征變量在量級(jí)上有巨大差異, 所以本文在預(yù)測(cè)之前做了標(biāo)準(zhǔn)化處理來(lái)消除量級(jí)差異, 當(dāng)r值低于0.5時(shí)表明特征變量和目標(biāo)變量之間的線性相關(guān)性較低.由表1可知, 除了長(zhǎng)江有色市場(chǎng)平均銅價(jià)、SHFE黃金持倉(cāng)量、LME銅連續(xù)結(jié)算價(jià)、“倫銅期貨實(shí)時(shí)行情”百度指數(shù) 、上期銅超額收益指數(shù)、上期銅期貨價(jià)格指數(shù)這6個(gè)變量和下一日銅期貨結(jié)算價(jià)之間存在較強(qiáng)的線性關(guān)系,其他20個(gè)變量都和目標(biāo)變量線性關(guān)系較弱.這也說(shuō)明期貨結(jié)算價(jià)預(yù)測(cè)不適用線性模型.
表1 輸入變量的統(tǒng)計(jì)、分類(lèi)以及與次日結(jié)算價(jià)的相關(guān)系數(shù)Tab.1 Statistics and classification of input variables and correlation coefficients with the next-day settlement price
2.2.2 主成分分析
表2 主成分方差貢獻(xiàn)Tab.2 Principal component variance contribution
由相關(guān)系數(shù)的分析可知,與下一日結(jié)算價(jià)相關(guān)系數(shù)超過(guò)0.5的6個(gè)變量可以作為輸入變量放入模型中, 剩余20個(gè)變量雖然與被解釋變量之間的線性關(guān)系較弱,但仍具有一定相關(guān)性,而機(jī)器學(xué)習(xí)模型輸入變量個(gè)數(shù)較多時(shí)容易產(chǎn)生過(guò)擬合問(wèn)題,故采用主成分分析法對(duì)剩余的20個(gè)解釋變量進(jìn)行降維處理.表2給出了部分主成分方差分析結(jié)果.根據(jù)表2的主成分方差分析結(jié)果并結(jié)合特征值大于1的原則,本文從中選用前5個(gè)主成分,其累積貢獻(xiàn)率達(dá)到74.431%,表明前5個(gè)主成分已能較好地反映所有變量的信息.因此,本文共選取11個(gè)特征變量代入機(jī)器學(xué)習(xí)預(yù)測(cè)模型中進(jìn)行價(jià)格預(yù)測(cè),即6個(gè)強(qiáng)相關(guān)性變量和5個(gè)主成分變量.
3.1.1 回歸法
3.1.2 分類(lèi)法
對(duì)多種機(jī)器學(xué)習(xí)模型進(jìn)行分類(lèi)法預(yù)測(cè)時(shí),將通過(guò)準(zhǔn)確率、精確率、召回率以及F1值四大評(píng)價(jià)指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià).
1) 準(zhǔn)確率.所有分類(lèi)正確的樣本個(gè)數(shù)占總樣本個(gè)數(shù)的比例, 即準(zhǔn)確率=分類(lèi)正確的樣本數(shù)/總樣本數(shù).準(zhǔn)確率越大代表模型分類(lèi)越準(zhǔn)確, 但不能給出分類(lèi)出錯(cuò)的類(lèi)型和潛在分布, 故對(duì)于樣本數(shù)據(jù)分布不平衡的情況, 準(zhǔn)確率會(huì)受到大類(lèi)別樣本的影響.
表3 混淆矩陣Tab.3 Confusion matrix
2) 精確度和召回率.可根據(jù)樣本真實(shí)類(lèi)別和分類(lèi)器預(yù)測(cè)類(lèi)別劃分為四類(lèi)判別矩陣, 如表3所示.精確率(P)是指所有分類(lèi)正確的正樣本數(shù)(TP)與所有預(yù)測(cè)為正類(lèi)的樣本數(shù)(TP+FP)的比值, 即P=TP/(TP+FP).召回率(R)是指所有分類(lèi)正確的正樣本數(shù)(TP)與所有正樣本數(shù)(TP+FN)的比值, 即R=TP/(TP+FN).
3) F1值F=2PR/(P+R)中和了精確率和召回率的評(píng)估指標(biāo), F1值越高, 分類(lèi)效果越好.
以選取的11個(gè)特征變量作為模型輸入, 在訓(xùn)練SVR 模型時(shí), 通過(guò)對(duì)比線性核函數(shù)、多項(xiàng)式核函數(shù)和高斯核函數(shù),最終選取線性核函數(shù)對(duì)滬銅期貨進(jìn)行分析.采用MLP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)時(shí),設(shè)定隱藏層神經(jīng)元數(shù)為8個(gè), 模型訓(xùn)練的輪數(shù)為500,一個(gè)批次的大小設(shè)為80.經(jīng)過(guò)多次測(cè)試和調(diào)優(yōu), LSTM和GRU模型的優(yōu)化器選擇AdamOptimizer, 損失函數(shù)使用MAPE, 學(xué)習(xí)率設(shè)為0.000 6, 每個(gè)隱藏層中神經(jīng)元數(shù)均為10個(gè).在模型優(yōu)化方面,采用梯度下降方法, LSTM和GRU模型中一個(gè)批次的大小分別設(shè)為70, 60, 模型訓(xùn)練的輪數(shù)均為500.為了控制過(guò)擬合現(xiàn)象, 模型中加入dropout結(jié)構(gòu), 并將dropout的數(shù)值設(shè)為0.2.圖4為不同機(jī)器學(xué)習(xí)模型對(duì)銅期貨價(jià)格預(yù)測(cè)的走勢(shì)圖,表4為上述四種機(jī)器學(xué)習(xí)模型在測(cè)試集上的預(yù)測(cè)結(jié)果.結(jié)果顯示, 四種機(jī)器學(xué)習(xí)模型不論是在長(zhǎng)期預(yù)測(cè)還是短期預(yù)測(cè)中, 對(duì)銅期貨結(jié)算價(jià)格的預(yù)測(cè)結(jié)果都很穩(wěn)定, 且各模型長(zhǎng)期預(yù)測(cè)和短期預(yù)測(cè)的結(jié)果相差不大; 因此, 在擺脫對(duì)價(jià)格交易數(shù)據(jù)的依賴(lài)后,根據(jù)引入的相關(guān)影響因素進(jìn)行機(jī)器學(xué)習(xí)對(duì)銅期貨價(jià)格有較好的預(yù)測(cè)能力, 而四種機(jī)器學(xué)習(xí)模型能夠在預(yù)測(cè)中得到相似的預(yù)測(cè)結(jié)果, 表明機(jī)器學(xué)習(xí)在銅期貨結(jié)算價(jià)格預(yù)測(cè)中的適應(yīng)性很強(qiáng).
表4 各模型回歸法預(yù)測(cè)結(jié)果Tab.4 Prediction results of regression methods %
圖4 不同機(jī)器學(xué)習(xí)模型下銅期貨 價(jià)格預(yù)測(cè)走勢(shì)圖(200日)Fig.4 Forecast trend of copper futures price under different machine learning models (200 days)
四種機(jī)器學(xué)習(xí)模型利用分類(lèi)法實(shí)現(xiàn)對(duì)銅期貨價(jià)格漲跌的預(yù)測(cè)時(shí), 本文將銅期貨結(jié)算價(jià)格漲跌預(yù)測(cè)問(wèn)題轉(zhuǎn)化為二分類(lèi)問(wèn)題: 當(dāng)本日結(jié)算價(jià)大于前日結(jié)算價(jià)時(shí), 判定為本正樣, 即價(jià)格上漲, 用1表示; 反之, 則判定為負(fù)樣本, 即價(jià)格下跌, 用0表示, 并利用選取的11個(gè)特征變量對(duì)下一日的銅期貨結(jié)算價(jià)格的漲跌進(jìn)行預(yù)測(cè).以LSTM模型對(duì)20日的預(yù)測(cè)為例, 當(dāng)LSTM模型預(yù)測(cè)的準(zhǔn)確率達(dá)到0.85時(shí), 表示對(duì)20個(gè)交易日的漲跌行情, LSTM模型準(zhǔn)確地預(yù)測(cè)了17個(gè)交易日的漲跌情況.對(duì)實(shí)驗(yàn)結(jié)果調(diào)查發(fā)現(xiàn), LSTM模型準(zhǔn)確預(yù)測(cè)了14個(gè)正類(lèi)樣本中12個(gè), 6個(gè)負(fù)類(lèi)樣本中5個(gè), 故其精確率為12/(12+1)=0.92, 召回率為12/(12+2)=0.86.
表5給出了分類(lèi)法預(yù)測(cè)結(jié)算價(jià)的結(jié)果.由表5可知, 在對(duì)銅期貨價(jià)格的短期預(yù)測(cè)中, LSTM和GRU模型的四項(xiàng)指標(biāo)均表現(xiàn)的較為突出,而SVM和MLP模型的預(yù)測(cè)效果稍遜.然而在對(duì)銅期貨價(jià)格進(jìn)行長(zhǎng)期預(yù)測(cè)時(shí), 四種機(jī)器學(xué)習(xí)模型的預(yù)測(cè)效果相差不大, 僅出現(xiàn)SVM的召回率相對(duì)較優(yōu)異的結(jié)果.
表5 分類(lèi)法預(yù)測(cè)結(jié)算價(jià)Tab.5 Predicting settlement prices under classifications
1) 擺脫對(duì)交易數(shù)據(jù)的依賴(lài)后, 被引入的多因素指標(biāo)通過(guò)機(jī)器學(xué)習(xí)能夠?qū)︺~期貨價(jià)格有較好的預(yù)測(cè)能力; 2) SVM、MLP、LSTM、GRU四種機(jī)器學(xué)習(xí)模型能夠在預(yù)測(cè)中得到相似的預(yù)測(cè)結(jié)果, 表明機(jī)器學(xué)習(xí)在銅期貨價(jià)格預(yù)測(cè)中有很好的適用性.
當(dāng)然, 金融資產(chǎn)價(jià)格的變化除了受可度量經(jīng)濟(jì)指標(biāo)的影響外,往往還受其他不可量化的因素影響,如政策環(huán)境、突發(fā)事件等.同時(shí),本文中超參數(shù)的調(diào)試是人工調(diào)參,并且一些超參數(shù)的選取是參考的已有經(jīng)驗(yàn),如果可以借助自動(dòng)調(diào)參工具使調(diào)參過(guò)程更加簡(jiǎn)化,同時(shí)減少人為調(diào)參的主觀影響,那么預(yù)測(cè)模型的選擇將更加精確與合理, 這將是本課題組進(jìn)一步研究的方向.