趙婷婷,韓雅杰,楊夢(mèng)楠,任德華,陳亞瑞,王 嫄,劉建征
(天津科技大學(xué)人工智能學(xué)院,天津 300457)
在大數(shù)據(jù)背景下,機(jī)器學(xué)習(xí)技術(shù)迅速發(fā)展,被廣泛應(yīng)用到各個(gè)領(lǐng)域,而機(jī)器學(xué)習(xí)的發(fā)展對(duì)數(shù)據(jù)有很強(qiáng)的依賴性.在眾多數(shù)據(jù)中,時(shí)序數(shù)據(jù)是一種重要且復(fù)雜的數(shù)據(jù)類型,其在各行各業(yè)中扮演著重要角色.時(shí)序數(shù)據(jù)即時(shí)間序列數(shù)據(jù),是指數(shù)據(jù)按照時(shí)間發(fā)生先后進(jìn)行排列組成的數(shù)據(jù),具有很強(qiáng)的時(shí)間相關(guān)性.常見(jiàn)的時(shí)序數(shù)據(jù)如股票價(jià)格、氣溫、糧食產(chǎn)量、降雨量等.
時(shí)序數(shù)據(jù)預(yù)測(cè)方法是通過(guò)捕捉歷史時(shí)序數(shù)據(jù)之間的規(guī)律預(yù)測(cè)數(shù)據(jù)的長(zhǎng)期發(fā)展趨勢(shì),典型的時(shí)序數(shù)據(jù)分析如股票大盤走勢(shì)、氣象變化、內(nèi)存監(jiān)控等.金融數(shù)據(jù)是一種具有非線性和非穩(wěn)定特點(diǎn)的時(shí)序數(shù)據(jù),對(duì)于此類時(shí)序數(shù)據(jù)預(yù)測(cè)往往具有很大的難度,主要體現(xiàn)在[1]:具有非線性和高噪聲性,投資者投資具有盲目性,數(shù)據(jù)的變動(dòng)受國(guó)家政策等多種不可控因素影響.基于上述原因,使得金融時(shí)序數(shù)據(jù)預(yù)測(cè)的結(jié)果往往不盡如人意.由此可見(jiàn),金融時(shí)序數(shù)據(jù)預(yù)測(cè)在時(shí)序數(shù)列預(yù)測(cè)領(lǐng)域一直以來(lái)都是一個(gè)極具挑戰(zhàn)的問(wèn)題.
相關(guān)學(xué)者經(jīng)過(guò)長(zhǎng)期的探索和研究,加深了對(duì)金融時(shí)序數(shù)據(jù)內(nèi)在規(guī)律的認(rèn)識(shí).根據(jù)該數(shù)據(jù)的變化規(guī)律總結(jié)出了大量的預(yù)測(cè)方法,主要可分為線性預(yù)測(cè)方法和非線性預(yù)測(cè)方法[2].線性預(yù)測(cè)[3]方法是早期使用的預(yù)測(cè)方法,經(jīng)典算法主要包括指數(shù)平滑法[4-5]、自回歸積分移動(dòng)平均預(yù)測(cè)方法[6-11]等,此類方法具有結(jié)構(gòu)簡(jiǎn)單、計(jì)算量少的優(yōu)點(diǎn),可以對(duì)短期預(yù)測(cè)取得較好的結(jié)果,但是這類方法不能很好地捕捉金融時(shí)序數(shù)據(jù)之間的非線性關(guān)系,且當(dāng)面對(duì)長(zhǎng)期預(yù)測(cè)時(shí)就會(huì)突顯其局限性[6].面對(duì)線性方法的諸多不足,相關(guān)研究提出利用非線性模型進(jìn)行改進(jìn),增加對(duì)復(fù)雜數(shù)據(jù)的捕捉能力,從而提出非線性預(yù)測(cè)方法,主要包括BP神經(jīng)網(wǎng)絡(luò)[12-19]、支持向量機(jī)[20-23]、循環(huán)神經(jīng)網(wǎng)絡(luò)[24-29]和生成對(duì)抗網(wǎng)絡(luò)[30-32]及強(qiáng)化學(xué)習(xí)[33-36].此類方法可以更全面地捕捉金融時(shí)序數(shù)據(jù)之間的非線性關(guān)系,并取得了相對(duì)準(zhǔn)確的預(yù)測(cè)結(jié)果,是未來(lái)金融時(shí)序數(shù)據(jù)領(lǐng)域的研究重點(diǎn)及趨勢(shì).
股票數(shù)據(jù)是金融時(shí)序數(shù)據(jù)中典型和熱點(diǎn)的研究對(duì)象,而金融時(shí)序數(shù)據(jù)由于其序列相關(guān)性、季節(jié)變化性及復(fù)雜的變化趨勢(shì),使得對(duì)其進(jìn)行分析及預(yù)測(cè)極具挑戰(zhàn).本文以股票數(shù)據(jù)預(yù)測(cè)為例,圍繞該領(lǐng)域中的算法展開(kāi)綜述,首先介紹股票預(yù)測(cè)模型的建模;然后介紹股票預(yù)測(cè)領(lǐng)域中的經(jīng)典算法的原理,并分析各算法的優(yōu)缺點(diǎn)及改進(jìn)方法方案;最終展望該領(lǐng)域的研究趨勢(shì).
時(shí)序數(shù)據(jù)的預(yù)測(cè)通常建模為利用歷史數(shù)據(jù)值預(yù)測(cè)未來(lái)的數(shù)據(jù)走勢(shì).本文所關(guān)注的時(shí)序數(shù)據(jù)預(yù)測(cè)中的股票預(yù)測(cè)模型可表示為
其中 x = {x1,x2,…, xt}表示歷史數(shù)據(jù),S表示預(yù)測(cè)系統(tǒng),表示預(yù)測(cè)結(jié)果.預(yù)測(cè)可分為短期預(yù)測(cè)和長(zhǎng)期預(yù)測(cè)[6].短期預(yù)測(cè),如單步預(yù)測(cè)可表示為
根據(jù)預(yù)測(cè)模型的類型,將預(yù)測(cè)方法分為線性預(yù)測(cè)方法和非線性預(yù)測(cè)方法.本部分將圍繞上述兩類預(yù)測(cè)方法進(jìn)行討論,分別從各經(jīng)典算法的原理、優(yōu)缺點(diǎn)及改進(jìn)方法進(jìn)行詳細(xì)介紹.
2.1.1 基于指數(shù)平滑的預(yù)測(cè)方法
指數(shù)平滑預(yù)測(cè)法是時(shí)序數(shù)據(jù)預(yù)測(cè)領(lǐng)域早期常用的方法之一,其基本思想是利用權(quán)值將當(dāng)前時(shí)刻的真實(shí)值和預(yù)測(cè)值聯(lián)系起來(lái),以加權(quán)算術(shù)平均數(shù)方法對(duì)預(yù)測(cè)對(duì)象進(jìn)行預(yù)測(cè)[4],具體可表示為
其中:a ,a( 1? a) ,… ,a ( 1? a)t?1為數(shù)據(jù)各時(shí)刻的權(quán)值.權(quán)值距離預(yù)測(cè)時(shí)刻由近到遠(yuǎn)按指數(shù)逐級(jí)遞減,即,a> a (1?a) > …> a ( 1?a)t?1.
指數(shù)平滑預(yù)測(cè)法主要包括一次指數(shù)平滑法、二次指數(shù)平滑法和三次指數(shù)平滑法.該算法實(shí)現(xiàn)簡(jiǎn)單,所需數(shù)據(jù)信息少,只利用歷史數(shù)據(jù)的加權(quán)和就可以預(yù)測(cè)出下一時(shí)刻的股票數(shù)據(jù).但是,這種線性的預(yù)測(cè)方法擁有很多局限性[5]:首先,對(duì)平滑系數(shù)較為敏感,平滑系數(shù)的選擇不同,預(yù)測(cè)結(jié)果也不同,還會(huì)影響預(yù)測(cè)精度;此外,該方法只適用于短期的預(yù)測(cè),而對(duì)于長(zhǎng)期且不穩(wěn)定的股票數(shù)據(jù),則會(huì)造成嚴(yán)重失誤.
2.1.2 基于自回歸積分移動(dòng)平均的預(yù)測(cè)方法
自回歸積分移動(dòng)平均模型(autoregressive integrated moving average model,ARIMA)是自回歸移動(dòng)平均模型(autoregressive moving average model,ARMA)的擴(kuò)展,ARMA更加適合處理平穩(wěn)的時(shí)間序列,而金融時(shí)序數(shù)據(jù)具有不平穩(wěn)性,由此擴(kuò)展出了ARIMA,該模型由自回歸模型(AR)、移動(dòng)平均模型(MA)和差分法結(jié)合而成.該方法是利用差分方法經(jīng)過(guò)d次差分將時(shí)序數(shù)據(jù)平穩(wěn)化,然后確定參數(shù)p、q進(jìn)行預(yù)測(cè),最后將預(yù)測(cè)結(jié)果反平穩(wěn)化得到最后的預(yù)測(cè)結(jié)果,整個(gè)過(guò)程可表達(dá)為ARIMA(p,d,q).其中,p是自回歸項(xiàng),d是將數(shù)據(jù)平穩(wěn)化總的差分次數(shù),q是移動(dòng)平均項(xiàng)數(shù)[7].模型的方程表示為
使用ARIMA對(duì)股票數(shù)據(jù)進(jìn)行預(yù)測(cè)已取得了不錯(cuò)的結(jié)果,但是對(duì)于長(zhǎng)期的預(yù)測(cè)卻不太理想,且此類方法對(duì)于波動(dòng)較大的股票數(shù)據(jù),也難以得到理想結(jié)果.由于該方法從根本上是對(duì)平穩(wěn)數(shù)據(jù)進(jìn)行處理[7],因此針對(duì)此問(wèn)題,結(jié)合非線性模型可有效改善其性能.
綜上所述,線性模型普遍存在長(zhǎng)期預(yù)測(cè)不理想,無(wú)法很好捕捉股票數(shù)據(jù)的非線性等缺點(diǎn).面對(duì)股票數(shù)據(jù)的非線性特性,利用線性模型的預(yù)測(cè)方法難以達(dá)到令人滿意的效果.此外,股票預(yù)測(cè)的目標(biāo)不僅局限于下一時(shí)刻,而是關(guān)注更久遠(yuǎn)的預(yù)測(cè)結(jié)果.因此,基于線性模型的預(yù)測(cè)方法有待進(jìn)一步改進(jìn).
針對(duì)時(shí)序數(shù)據(jù)中股票數(shù)據(jù)非線性及高噪聲的特點(diǎn),利用線性模型的預(yù)測(cè)方法對(duì)該類數(shù)據(jù)進(jìn)行預(yù)測(cè)無(wú)法達(dá)到令人滿意的效果.針對(duì)其不足,相關(guān)學(xué)者把目光放在了非線性預(yù)測(cè)方法上.非線性方法能夠更好地捕捉股票數(shù)據(jù)的內(nèi)在規(guī)律,從而得到更加準(zhǔn)確的預(yù)測(cè)結(jié)果.
2.2.1 基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法
神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)是一種模擬人類大腦神經(jīng)元連接結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型,其根據(jù)訓(xùn)練數(shù)據(jù)不斷調(diào)整內(nèi)部節(jié)點(diǎn)之間的關(guān)系學(xué)習(xí)數(shù)據(jù)變化.相較于傳統(tǒng)的線性模型,神經(jīng)網(wǎng)絡(luò)是一種表達(dá)能力極強(qiáng)的非線性模型,它的優(yōu)勢(shì)在于其自適應(yīng)性、泛化能力、容錯(cuò)性等方面,從而使得它在處理非線性數(shù)據(jù)時(shí)表現(xiàn)得更為突出.
在時(shí)序數(shù)據(jù)預(yù)測(cè)中,使用最廣泛的神經(jīng)網(wǎng)絡(luò)為反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)[12].BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層組成,在其訓(xùn)練過(guò)程中,可分為兩個(gè)過(guò)程:一個(gè)是數(shù)據(jù)輸入層經(jīng)隱藏層到輸出層輸出,即正向傳播過(guò)程;另一個(gè)是如果輸出層輸出的數(shù)據(jù)沒(méi)有達(dá)到預(yù)期的效果,則誤差將從相反的方向?qū)?quán)值進(jìn)行調(diào)整,即反向傳播過(guò)程.
基于BP神經(jīng)網(wǎng)絡(luò)的股票預(yù)測(cè)原理是:股票數(shù)據(jù)輸入到BP神經(jīng)網(wǎng)絡(luò)中,由該網(wǎng)絡(luò)分析股票數(shù)據(jù)和參數(shù)的規(guī)律,利用其函數(shù)逼近功能進(jìn)行預(yù)測(cè),具體預(yù)測(cè)模型如圖1[13]所示.其中:x1,x2,…,xt分別為各個(gè)時(shí)刻真實(shí)值;h1,h2,…,ht分別為各個(gè)時(shí)刻的隱藏層狀態(tài);+1為t+1時(shí)刻的預(yù)測(cè)值.該模型通過(guò)正向傳播進(jìn)行預(yù)測(cè),目標(biāo)是使輸出的預(yù)測(cè)值+1與實(shí)際值xt+1盡可能保持一致,該過(guò)程是通過(guò)反向傳播進(jìn)行權(quán)值調(diào)整,使得總誤差達(dá)到最小.其誤差(E)可表示為
圖1 基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型Fig. 1 Prediction model based on BP neural network
最早將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到股票預(yù)測(cè)的是White[14],但是發(fā)現(xiàn)由于BP神經(jīng)網(wǎng)絡(luò)極易陷入局部極小值而導(dǎo)致模型的預(yù)測(cè)效果較差.此外,BP神經(jīng)網(wǎng)絡(luò)算法還有收斂速度慢、訓(xùn)練時(shí)間長(zhǎng)的缺點(diǎn)[15].針對(duì)訓(xùn)練時(shí)間長(zhǎng)的問(wèn)題,鹿天宇等[16]采用主成分分析(principal component analysis,PCA)對(duì)輸入數(shù)據(jù)進(jìn)行降維,有效簡(jiǎn)化網(wǎng)絡(luò)的輸入,從而提高訓(xùn)練的速度.針對(duì)易陷入局部極小值和收斂速度慢的問(wèn)題,季闊[17]在權(quán)值調(diào)整公式中加入動(dòng)量項(xiàng)對(duì)權(quán)值調(diào)整公式
進(jìn)行改進(jìn),避免在訓(xùn)練過(guò)程中發(fā)生震蕩,加快收斂速度,而且在訓(xùn)練時(shí),允許略過(guò)一些極小值,因此易陷入局部極小值的問(wèn)題得到了一定程度的緩解.此外,Li[18]和郭怡然等[19]引入了遺傳算法對(duì)該方法進(jìn)行改進(jìn),進(jìn)一步緩解了上述問(wèn)題.
2.2.2 基于支持向量機(jī)的預(yù)測(cè)方法
支持向量機(jī)(support vector machine,SVM)于1995年被首次提出[37],其主要思想是將輸入向量以非線性的方式映射到一個(gè)高維的特征空間,在這個(gè)特征空間中構(gòu)造一個(gè)決策面,利用決策面的特殊性來(lái)保持其較高的泛化能力.SVM可以很好地處理非線性和高維的問(wèn)題,將它運(yùn)用在金融時(shí)序數(shù)據(jù)預(yù)測(cè)中,克服了BP神經(jīng)網(wǎng)絡(luò)本身的缺陷[20],體現(xiàn)出很大的優(yōu)勢(shì).
利用SVM進(jìn)行股票預(yù)測(cè),給定股票數(shù)據(jù)序列{ x1,x2,…,xt},定義輸入序列為 X = {xt,xt?1,…, xt?n+1}進(jìn)行預(yù)測(cè),其原理就是找到真實(shí)值x與預(yù)測(cè)值x?之間的映射關(guān)系.
Rn為影響股票數(shù)據(jù)預(yù)測(cè)的因數(shù),nx∈R;R為預(yù)測(cè)向量,∈R.對(duì)于股票預(yù)測(cè)這種非線性問(wèn)題,利用核函數(shù)建立非線性的回歸函數(shù)
其中:αi和為拉格朗日乘子,K (xi,xt) 為核函數(shù),tx為影響預(yù)測(cè)的因素,xi為t-n個(gè)樣本中第i個(gè)樣本,b為閾值.由以上回歸函數(shù)可得到下一步的預(yù)測(cè)
整個(gè)過(guò)程可由圖2[20]表示.
圖2 基于SVM的預(yù)測(cè)模型Fig. 2 Prediction model based on SVM
在股票預(yù)測(cè)中,基于SVM的預(yù)測(cè)方法的性能優(yōu)于基于BP神經(jīng)網(wǎng)絡(luò)的方法,但其在預(yù)測(cè)時(shí)存在一定的不足.首先,SVM只能得到具體的預(yù)測(cè)值,而不能預(yù)測(cè)股票的變化趨勢(shì).其次,核函數(shù)是該方法的核心問(wèn)題,核函數(shù)的選擇會(huì)對(duì)預(yù)測(cè)精度產(chǎn)生直接影響.針對(duì)前者,通常首先使用模糊信息粒化對(duì)原始的股票數(shù)據(jù)進(jìn)行預(yù)處理,再使用SVM預(yù)測(cè)出短期的變化趨勢(shì)[21].針對(duì)后者,黃同愿等[22]分析了采用不同核函數(shù)對(duì)最后預(yù)測(cè)結(jié)果的影響.李坤等[23]突破傳統(tǒng)的核函數(shù),采用小波核將小波和SVM結(jié)合,不但能消除數(shù)據(jù)的高頻干擾,還具有很好的抗噪能力,更適合股票預(yù)測(cè);通過(guò)選取3種不同的小波核進(jìn)行比較,得出不同的股票要選擇合適的核函數(shù)進(jìn)行預(yù)測(cè)的結(jié)論.
2.2.3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)是一種用來(lái)處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),其每一時(shí)刻輸出都與歷史的輸入建立起關(guān)聯(lián).在時(shí)序數(shù)據(jù)預(yù)測(cè)應(yīng)用中,RNN利用其時(shí)序特性,能夠很好地利用歷史數(shù)據(jù)對(duì)數(shù)據(jù)未來(lái)變化作出預(yù)測(cè).基于RNN的預(yù)測(cè)原理和BP神經(jīng)網(wǎng)絡(luò)相同,正向傳播輸出預(yù)測(cè)結(jié)果,反向傳播進(jìn)行參數(shù)優(yōu)化.然而,RNN在訓(xùn)練過(guò)程中容易出現(xiàn)梯度消失的問(wèn)題,導(dǎo)致其在反向傳播的過(guò)程中無(wú)法學(xué)習(xí)到長(zhǎng)期依賴,即它只有短期記憶,在時(shí)序數(shù)據(jù)預(yù)測(cè)中無(wú)法準(zhǔn)確地對(duì)數(shù)據(jù)進(jìn)行長(zhǎng)期預(yù)測(cè).
長(zhǎng)短時(shí)記憶[38](long short-term memory,LSTM)是一種改進(jìn)的RNN模型,由輸入門(input gate)、遺忘門(forget gate)、輸出門(output gate)和細(xì)胞單元(cell)構(gòu)成.該模型各部分功能[45]為數(shù)據(jù)首先通過(guò)遺忘門,由其決定是否遺忘t時(shí)刻隱藏節(jié)點(diǎn)所包含的歷史信息,可表達(dá)為
其中:ft為遺忘門在t時(shí)刻的輸出,σ為激活函數(shù),xt為t時(shí)刻的輸入,ht-1和ct-1分別為t-1時(shí)刻的隱層狀態(tài)和細(xì)胞單元信息,Wxf、Whf、Wcf為權(quán)值矩陣,bf為遺忘門的偏差矩陣.然后由輸入門執(zhí)行遺忘門的決定,并更新ct-1的信息,計(jì)算公式為
其中:it和ct分別為輸入門和細(xì)胞單元在t時(shí)刻的輸出,Wxi、Whi、Wci、Wxc、Whc為權(quán)值矩陣,bi和bc分別為輸入門和細(xì)胞單元的偏差矩陣.最后由輸出門確定最后的輸出為
其中:ot為輸出門在t時(shí)刻的輸出,Wxo、Who、Wco為權(quán)值矩陣,bo為輸出門的偏差矩陣,ht表示t時(shí)刻的隱藏層狀態(tài).
圖3 基于LSTM的預(yù)測(cè)模型Fig. 3 Prediction model based on LSTM
LSTM雖然能夠很好地處理時(shí)序數(shù)據(jù)問(wèn)題,但是它在進(jìn)行股票預(yù)測(cè)時(shí)存在以下問(wèn)題:第一,有陷入局部最優(yōu)解的可能[24];第二,在預(yù)測(cè)時(shí)具有滯后性[25].LSTM雖然在一定程度上解決了RNN梯度消失的問(wèn)題,使其在梯度下降過(guò)程中不會(huì)很快進(jìn)入局部最優(yōu)解,但是在理論上還是無(wú)法逃脫局部最優(yōu)解的可能性.一種雙向LSTM模型可以從前后兩個(gè)方向充分對(duì)股票數(shù)據(jù)之間的關(guān)系進(jìn)行分析,在解決易陷入局部最優(yōu)解問(wèn)題的同時(shí)解決了長(zhǎng)期依賴問(wèn)題[24].針對(duì)滯后性問(wèn)題,方紅等[26]運(yùn)用多維度向量輸入、特征工程和新聞情感分析3個(gè)步驟對(duì)LSTM進(jìn)行改進(jìn),使得滯后性和精確度都得到了一定程度的改善.
除了改進(jìn)LSTM本身存在的不足,還可以與其他模型組合成混合模型,以提升LSTM的預(yù)測(cè)性能,例如LSTM和ARIMA組合模型[11],LSTM和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)組合模型[27],LSTM、維德情緒分析(valence aware dictionary and entiment reasoner,VADER)和 差 分 隱 私(differential privacy,DP)組合模型[28],LSTM和棧式自編碼器(stacked autoencoder,SAE)組合模型[29].這些混合模型和單一的模型相比更具有優(yōu)勢(shì).
2.2.4 基于生成對(duì)抗網(wǎng)絡(luò)的預(yù)測(cè)方法
生成對(duì)抗網(wǎng)絡(luò)[39](generative adversarial net,GAN)是一種新型的生成模型,由生成器G和判別器D兩部分組成,如圖4[39]所示.GAN的主要思想就是G和D進(jìn)行一個(gè)極大極小博弈游戲,其中生成器G用于捕捉樣本數(shù)據(jù)的分布,輸入隨機(jī)噪聲z,目標(biāo)是生成類似真實(shí)數(shù)據(jù)的樣本數(shù)據(jù)G(z),生成的樣本越像真實(shí)數(shù)據(jù)X越好;判別器D就是一個(gè)二分器,用來(lái)判別生成樣本的真實(shí)性,輸出一個(gè)概率,生成的樣本越像真實(shí)數(shù)據(jù)則輸出的概率越接近1,否則接近0.
圖4 GAN結(jié)構(gòu)圖Fig. 4 Structure of GAN
GAN已在圖像生成[40]、繪畫[41]和文本生成[42]等領(lǐng)域取得顯著成果.在金融時(shí)序數(shù)據(jù)預(yù)測(cè)中,該方法用生成器G去捕捉從金融市場(chǎng)中給出的歷史金融數(shù)據(jù)的數(shù)據(jù)分布,并根據(jù)其分布規(guī)律對(duì)未來(lái)的數(shù)據(jù)進(jìn)行預(yù)測(cè);而判別器D用來(lái)判別生成金融數(shù)據(jù)的真實(shí)性.具體模型如圖5[30]所示.將第t天的數(shù)據(jù)X={x1,…,xt}輸入到生成器中,生成第t+1天的數(shù)據(jù)t+1,該過(guò)程定義為
圖5 基于GAN的預(yù)測(cè)模型Fig. 5 Prediction model based on GAN
基于GAN的時(shí)序數(shù)據(jù)預(yù)測(cè)方法的優(yōu)勢(shì)在于GAN能夠更好地捕捉數(shù)據(jù)分布和反映數(shù)據(jù)的波動(dòng),從而使得生成數(shù)據(jù)更加逼近真實(shí)數(shù)據(jù).然而,GAN本身存在由于訓(xùn)練過(guò)程中出現(xiàn)梯度消失而導(dǎo)致的訓(xùn)練不穩(wěn)定的問(wèn)題.Wasserstein GAN(WGAN)[43]是對(duì)原始GAN的一種改進(jìn),它使用平滑的Earth-Mover(EM)距 離 代 替Kullback-Leibler(KL)和Jensen-Shannon(JS)散度,可以一直提供有效的梯度,從而解決梯度消失的問(wèn)題,使得訓(xùn)練更加穩(wěn)定.Boris[31]將WGAN和Metropolis-Hastings GAN(MHGAN)相結(jié)合對(duì)股票進(jìn)行預(yù)測(cè),從而避免了梯度消失對(duì)股票預(yù)測(cè)所帶來(lái)的困擾.另外,生成器和判別器的選擇也會(huì)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生影響.Zhang等[30]將LSTM作為生成器,多層感知機(jī)(multilayer perceptron,MLP)作為判別器對(duì)股票數(shù)據(jù)進(jìn)行預(yù)測(cè),取得了較為準(zhǔn)確的預(yù)測(cè)結(jié)果,但是采用MLP作為判別器,在全連接的情況下,過(guò)深的神經(jīng)網(wǎng)絡(luò)容易導(dǎo)致梯度消失.而Zhou等[32]則采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為判別器,解決了MLP存在的問(wèn)題,使得預(yù)測(cè)結(jié)果更加準(zhǔn)確.
基于增長(zhǎng)極理論,運(yùn)用因子分析法、旅游區(qū)位熵計(jì)算法等構(gòu)建旅游增長(zhǎng)極模型,進(jìn)行安徽省各市旅游業(yè)綜合發(fā)展水平測(cè)度與分類,得到以下結(jié)論:
在股票預(yù)測(cè)的應(yīng)用中,GAN取得了相對(duì)準(zhǔn)確的預(yù)測(cè)結(jié)果,但是如何克服GAN訓(xùn)練困難的問(wèn)題仍是一個(gè)具有挑戰(zhàn)性的任務(wù).
2.2.5 基于強(qiáng)化學(xué)習(xí)的預(yù)測(cè)方法
強(qiáng)化學(xué)習(xí)(reinforcement learning,RL)[44]是機(jī)器學(xué)習(xí)領(lǐng)域用來(lái)解決連續(xù)決策問(wèn)題的學(xué)習(xí)范式,它通過(guò)與環(huán)境的交互獲得知識(shí),自主地進(jìn)行動(dòng)作選擇,通過(guò)不斷地試錯(cuò)獲得最優(yōu)策略,如圖6[44]所示.近年來(lái),強(qiáng)化學(xué)習(xí)方法在電子游戲[45]、棋類[46]等領(lǐng)域得到了應(yīng)用,同時(shí)在股票、外匯和期貨等方面的應(yīng)用也得到廣泛的研究.
圖6 強(qiáng)化學(xué)習(xí)基本框架Fig. 6 Framework of reinforcement learning
基于強(qiáng)化學(xué)習(xí)的時(shí)序數(shù)據(jù)預(yù)測(cè)方法主要分為以下兩類:
其中:st∈S 表示t時(shí)刻的股票數(shù)據(jù),at∈A表示t時(shí)刻的交易動(dòng)作,+1表示t+1時(shí)刻股票的預(yù)測(cè)值.目前,以馬爾科夫過(guò)程為模型,已使用TD算法[33]、深度Q網(wǎng)絡(luò)[34]和DDPG算法[35]等實(shí)現(xiàn)了對(duì)于股票的預(yù)測(cè),并取得了不錯(cuò)的結(jié)果.
另一類是利用強(qiáng)化學(xué)習(xí)對(duì)預(yù)測(cè)模型的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)進(jìn)行優(yōu)化.此類方法是預(yù)測(cè)系統(tǒng)對(duì)輸入的數(shù)據(jù)進(jìn)行處理,然后強(qiáng)化學(xué)習(xí)模塊對(duì)其輸出進(jìn)行評(píng)價(jià),隨后反饋給預(yù)測(cè)系統(tǒng)對(duì)其進(jìn)行調(diào)整或優(yōu)化,其過(guò)程可由圖7[34]表示.葉德謙等[36]提出了強(qiáng)化學(xué)習(xí)BP神經(jīng)網(wǎng)絡(luò)(RBP),用強(qiáng)化學(xué)習(xí)對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)優(yōu)化,從而實(shí)現(xiàn)股票預(yù)測(cè),該模型在實(shí)現(xiàn)系統(tǒng)自我學(xué)習(xí)的同時(shí)還提高了預(yù)測(cè)精度;Boris[31]將強(qiáng)化學(xué)習(xí)加入到GAN中,不斷對(duì)其超參數(shù)進(jìn)行優(yōu)化,解決了由于股市的不斷變化所導(dǎo)致模型無(wú)法自適應(yīng)的問(wèn)題.
圖7 基于強(qiáng)化學(xué)習(xí)改進(jìn)的預(yù)測(cè)模型Fig. 7 Prediction model based on reinforcement learning improvement
強(qiáng)化學(xué)習(xí)利用其強(qiáng)大的自主學(xué)習(xí)能力,在進(jìn)行股票預(yù)測(cè)時(shí),能夠更加適應(yīng)不斷變化的股市,從而可以更好地進(jìn)行長(zhǎng)期的交互學(xué)習(xí).但是強(qiáng)化學(xué)習(xí)本身依然存在著訓(xùn)練困難、樣本利用率低等問(wèn)題.
針對(duì)股票等時(shí)序數(shù)據(jù),在對(duì)其模型進(jìn)行評(píng)估時(shí)通常使用美股中的標(biāo)準(zhǔn)普爾500指數(shù)(Standard &Poor’s 500(S&P 500 Index))、中國(guó)平安保險(xiǎn)(集團(tuán))股份有限公司(PAICC)股票指數(shù)、來(lái)自全美證券交易商協(xié)會(huì)(NASDAQ)的微軟公司(MSFT)股票指數(shù)、紐約證券交易所(NYSE)的國(guó)際商業(yè)機(jī)器公司(IBM)股票指數(shù)、中國(guó)股票中的上證綜指[47]作為常用數(shù)據(jù)集.數(shù)據(jù)集選取的數(shù)據(jù)通常為過(guò)去20年的日數(shù)據(jù)(每只股票中幾乎有5000條數(shù)據(jù))和7個(gè)金融因素預(yù)測(cè)未來(lái)的收盤價(jià).描述股票數(shù)據(jù)7個(gè)因素包括在一天中股票的最高價(jià)、最低價(jià)、開(kāi)盤價(jià)、收盤價(jià)、成交量、周轉(zhuǎn)率和Ma5(5日價(jià)格移動(dòng)平均線).這7個(gè)因素在技術(shù)分析、均值回歸或三月理論的價(jià)格預(yù)測(cè)中具有重要的價(jià)值和意義.因此,這些因素可以作為股票數(shù)據(jù)的7個(gè)特征用于未來(lái)收盤價(jià)的預(yù)測(cè).
為了更直觀地理解所分析的數(shù)據(jù),在表1中展示了PAICC股票數(shù)據(jù)集中的部分?jǐn)?shù)據(jù),每個(gè)數(shù)據(jù)包括7個(gè)特征.
表1 每個(gè)特征不同時(shí)刻的數(shù)據(jù)列表Tab. 1 Data list of different time of each feature
為了提高模型的預(yù)測(cè)精度,在模型進(jìn)行訓(xùn)練之前通常需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理[47].經(jīng)典的歸一化方法為0均值歸一化方法(z-score),該方法是將原始數(shù)據(jù)減去均值再除以標(biāo)準(zhǔn)差,經(jīng)過(guò)該方法處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即x~N(0,1).歸一化函數(shù)計(jì)算式可表示為
其中:x為原始的股票數(shù)據(jù),μ為所有股票數(shù)據(jù)的均值,σ為所有股票數(shù)據(jù)的標(biāo)準(zhǔn)差.為歸一化后的股票數(shù)據(jù).
關(guān)于時(shí)序數(shù)據(jù)預(yù)測(cè)任務(wù)的目標(biāo)是希望股票預(yù)測(cè)數(shù)據(jù)與真實(shí)歷史數(shù)據(jù)之間的誤差盡可能小.均方誤差(mean square error,MSE)可以很好地衡量整個(gè)模型最后的訓(xùn)練效果,利用MSE定義模型的損失函數(shù)可表示為
除了將MSE作為損失函數(shù),還使用平均絕對(duì)誤差MAE、均方根誤差RMSE和平均絕對(duì)百分比誤差MAPE的評(píng)估方法反映股票數(shù)據(jù)的預(yù)測(cè)值和其真實(shí)值之間的偏差.MAE、RMSE和MAPE的值越小則表示預(yù)測(cè)值和真實(shí)值之間的誤差越小,模型的預(yù)測(cè)效果越好.
為了進(jìn)一步觀測(cè)各時(shí)序數(shù)據(jù)預(yù)測(cè)方法在股票數(shù)據(jù)中的性能,相關(guān)文獻(xiàn)[47]總結(jié)了各算法的預(yù)測(cè)結(jié)果,該結(jié)果是基于3.1節(jié)所述的的5個(gè)數(shù)據(jù)集上的RMSE、MAE、AR的平均值作為預(yù)測(cè)方法的性能評(píng)估.預(yù)測(cè)結(jié)果見(jiàn)表2[47],其中粗體部分表示最佳預(yù)測(cè)結(jié)果,較低的MAE、RMSE和MAPE表明對(duì)收盤價(jià)的預(yù)測(cè)與真實(shí)值的誤差越小.AR表示5個(gè)數(shù)據(jù)集基于4種預(yù)測(cè)方法的日平均收益.從表2可知,在所比較的數(shù)據(jù)中,GAN與其他方法相比,具有最優(yōu)性能.
表2 對(duì)5個(gè)股票數(shù)據(jù)集的平均評(píng)價(jià)Tab. 2 Averaged performance on five stock data sets
時(shí)序數(shù)據(jù)是一種復(fù)雜的數(shù)據(jù)類型,其變化既有內(nèi)在規(guī)律的影響,還有外在事件的影響,通過(guò)對(duì)時(shí)序數(shù)據(jù)的預(yù)測(cè)可以更好地分析相關(guān)領(lǐng)域及市場(chǎng).雖然現(xiàn)有方法在股票預(yù)測(cè)中取得了較好的效果,但是面對(duì)股票數(shù)據(jù)的動(dòng)態(tài)性、復(fù)雜性及不可控因素等特點(diǎn),依然還有很大的改進(jìn)空間.未來(lái)研究方向可從以下幾個(gè)方面展開(kāi).
(1)從數(shù)據(jù)自身特點(diǎn)分析總結(jié)得到,金融時(shí)序數(shù)據(jù)具有維度高、非線性的特點(diǎn).現(xiàn)有方法通常直接對(duì)原始數(shù)據(jù)進(jìn)行處理,這樣增加了計(jì)算成本和模型的復(fù)雜程度;另一方面,使用線性降維方法如PCA,對(duì)股票數(shù)據(jù)進(jìn)行降維后再進(jìn)行預(yù)測(cè).然而,股票是一種非線性數(shù)據(jù),線性降維無(wú)法很好地捕捉股票數(shù)據(jù)之間的關(guān)系,對(duì)于股票數(shù)據(jù)的特征描述具有一定的局限性.因此,如何在低維空間對(duì)股票數(shù)據(jù)進(jìn)行有效分析及預(yù)測(cè)是亟待解決的研究問(wèn)題.
(2)從預(yù)測(cè)模型分析發(fā)現(xiàn),不同的模型具有其各自優(yōu)勢(shì),通過(guò)相關(guān)研究可知,將不同的方法進(jìn)行組合可以取得更優(yōu)的預(yù)測(cè)效果.因此,將不同的模型及學(xué)習(xí)方法進(jìn)行組合,讓不同的理論方法相結(jié)合,達(dá)到優(yōu)劣互補(bǔ)的目的,也是該領(lǐng)域的一個(gè)重要研究方向.
(3)現(xiàn)有的預(yù)測(cè)模型一次只能預(yù)測(cè)一支股票,如果要預(yù)測(cè)另一支股票,模型需要從頭開(kāi)始訓(xùn)練.元學(xué)習(xí)(meta learning)[48]是機(jī)器學(xué)習(xí)中一個(gè)新的分支,它可以通過(guò)在多個(gè)任務(wù)上的訓(xùn)練以實(shí)現(xiàn)在新場(chǎng)景下快速調(diào)整模型的目的.可以考慮使用元學(xué)習(xí)一次訓(xùn)練多支股票,當(dāng)面對(duì)新的預(yù)測(cè)任務(wù)時(shí)可以快速地完成預(yù)測(cè),從而避免重新訓(xùn)練模型.