潘越穎
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent NeuralNetwork, RNN)是一種用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。相比一般的神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),RNN模型能夠處理序列變化的數(shù)據(jù)。比如某個(gè)單詞的意思會(huì)因?yàn)樯衔奶岬降膬?nèi)容不同而有不同的含義,RNN模型就能夠很好地解決這類問(wèn)題。而量化擇時(shí)是通過(guò)進(jìn)行買入擇時(shí)因子的編寫、分解模式一步一步對(duì)策略進(jìn)行回測(cè)、賣出擇時(shí)因子的實(shí)現(xiàn)對(duì)股票的買入和拋出時(shí)間進(jìn)行評(píng)估分析,從而達(dá)到持股人利益最大化的策略。
有效市場(chǎng)假說(shuō)認(rèn)為:假如市場(chǎng)是有效的,那么市場(chǎng)中價(jià)格總是能夠及時(shí)、準(zhǔn)確且充分地反映所有相關(guān)的信息。根據(jù)不同的資本市場(chǎng)所處的信息環(huán)境下,有效市場(chǎng)可以分為弱式有效、半強(qiáng)式有效和強(qiáng)式有效三種形式。在有效市場(chǎng)的假說(shuō)下,投資者不能依據(jù)歷史信息來(lái)獲得超額收益,因?yàn)闅v史信息已經(jīng)全部體現(xiàn)在當(dāng)前標(biāo)的的價(jià)格上。學(xué)術(shù)界有很多對(duì)我國(guó)金融市場(chǎng)有效性的研究,普遍認(rèn)為國(guó)內(nèi)金融市場(chǎng)滿足弱式有效,但也存在一定的爭(zhēng)議。本文基于股指期貨中具有代表性的滬深300期貨歷史交易數(shù)據(jù)信息,對(duì)其進(jìn)行量化擇時(shí)投資,通過(guò)不斷訓(xùn)練模型,進(jìn)而推演到商品期貨中具有典型代表的期貨,最終通過(guò)金融期貨與商品期貨的組合,從而降低風(fēng)險(xiǎn),使利潤(rùn)最大化。最后相比不同時(shí)期的投資組合收益差與成本差來(lái)證明通過(guò)該擇時(shí)方法選定的期貨投資組合可以獲得一定的超額收益。
一、研究?jī)?nèi)容
期貨市場(chǎng)是一個(gè)充滿了不確定性的市場(chǎng),屬于高風(fēng)險(xiǎn)高回報(bào)的市場(chǎng),期貨價(jià)格時(shí)間序列具有非線性及高噪聲的數(shù)據(jù)特征,對(duì)其精確預(yù)測(cè)依舊十分困難。交易者要想做到穩(wěn)定盈利還是需要一套完整的交易系統(tǒng)的。沒(méi)有一個(gè)好的交易系統(tǒng)不僅不能盈利,還可能造成長(zhǎng)期虧損的危險(xiǎn)。一套好的交易系統(tǒng)是要在交易中不斷進(jìn)行一步步完善的。
期貨市場(chǎng),隨著時(shí)間的推移,會(huì)產(chǎn)生具有順序的一系列數(shù)字,這些數(shù)字是具有序列特性的,由于時(shí)間的動(dòng)態(tài)變化,使得自變量和因變量二者之間的關(guān)系也會(huì)隨之發(fā)生變動(dòng),本次研究主要著眼于排除隨機(jī)擾動(dòng)項(xiàng)、現(xiàn)貨市場(chǎng)對(duì)期貨價(jià)格影響后,滯后1到5階的歷史數(shù)據(jù)對(duì)期貨價(jià)格未來(lái)走勢(shì)的影響,從而對(duì)買入或賣出期貨的時(shí)機(jī)進(jìn)行大致選擇,使其機(jī)會(huì)成本最小。神經(jīng)網(wǎng)絡(luò)能夠發(fā)現(xiàn)并刻畫數(shù)據(jù)自身復(fù)雜的內(nèi)部結(jié)構(gòu)特征,也能自適應(yīng)地學(xué)習(xí)和構(gòu)建數(shù)據(jù)非線性的復(fù)雜關(guān)系,不會(huì)對(duì)輸入變量施加限制,也具備更好的遷移學(xué)習(xí)性質(zhì),因此非常適合處理如期貨價(jià)格這樣的金融數(shù)據(jù)。RNN對(duì)具有序列特性的數(shù)據(jù)非常有效,它能挖掘數(shù)據(jù)中的時(shí)序信息以及語(yǔ)義信息,利用RNN的這種能力,使深度學(xué)習(xí)模型在解決時(shí)序分析等問(wèn)題時(shí)有所突破。
我們希望建立一個(gè)基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的非線性預(yù)測(cè)模型,研究期貨市場(chǎng)量化擇時(shí)交易策略。
二、研究方法
(一)定量分析法
我將使用定量分析法使人們對(duì)期貨市場(chǎng)的認(rèn)識(shí)進(jìn)一步精確化,對(duì)市場(chǎng)變動(dòng)的認(rèn)識(shí)更加理性,以便更加科學(xué)地參與期貨市場(chǎng),把握本質(zhì),理清關(guān)系,預(yù)測(cè)期貨市場(chǎng)金融期貨及大宗商品期貨的變動(dòng)情況,來(lái)確定不同時(shí)間段股指期貨與商品期貨的投資組合,從而使預(yù)期收益率最大化。
(二)文獻(xiàn)資料調(diào)研法
在研究之初,我深入學(xué)習(xí)了《深度學(xué)習(xí)》一書中與循環(huán)神經(jīng)網(wǎng)絡(luò)相關(guān)的部分,對(duì)于一些難以理解的部分采取了在線查閱資料以及組內(nèi)討論的形式,在數(shù)據(jù)獲取階段主要通過(guò)知網(wǎng)中的參考文獻(xiàn)部分,去尋找滬深300期貨價(jià)格變動(dòng)的歷史數(shù)據(jù),同時(shí)閱讀了大量關(guān)于期貨市場(chǎng)的相關(guān)資料,幫助我們明晰整體思路,并做下一步規(guī)劃,去探求單個(gè)大宗商品的價(jià)格規(guī)律。
三、研究結(jié)果
通過(guò)RNN這種神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)某種商品的定價(jià),而影響期貨市場(chǎng)價(jià)格變動(dòng)的因素又有很多,因此,我們要在諸多不確定性中找到確定性,通過(guò)交易方向、入市點(diǎn)、持倉(cāng)方法的選擇以及資金管理,使期貨市場(chǎng)的高收益在不同交易次數(shù)之間發(fā)生偏移。
通過(guò)收集大量資料,對(duì)期貨市場(chǎng)上不同種類的商品有大致的了解;然后根據(jù)市場(chǎng)現(xiàn)狀,來(lái)確定我們具體需要構(gòu)建的RNN模型種類;之后,利用組內(nèi)人員專業(yè)優(yōu)勢(shì),嘗試建模;建模完成后,套入某具有代表性的期貨產(chǎn)品在過(guò)去某一個(gè)時(shí)間步的數(shù)據(jù),通過(guò)觀察信息在某個(gè)時(shí)間步向前的計(jì)算輸出和損失,以及先后計(jì)算梯度,通過(guò)契合度測(cè)試模型的可行性,并不斷修改、不斷驗(yàn)證,從而訓(xùn)練一個(gè)成功的RNN模型,并將訓(xùn)練好的模型運(yùn)用于不同種類的期貨產(chǎn)品中,預(yù)測(cè)其未來(lái)走勢(shì),大體思路為從金融期貨推演到不同種類的商品期貨,最終在不同的時(shí)間選取有效的投資組合,力求在相同投機(jī)需求下分散風(fēng)險(xiǎn),盡可能地提高收益率。
我們運(yùn)用建立的模型預(yù)測(cè)該期貨未來(lái)一段時(shí)間的價(jià)格走勢(shì)。然后收集了三種典型的金融期貨——滬深300、中證500、中證1000,四類商品期貨中的典型期貨——農(nóng)產(chǎn)品中的美豆粕2301、基本金屬中的COMEX銅、能源化工WTI原油、貴金屬中的COMEX黃金等數(shù)據(jù),以期對(duì)模型的正確性進(jìn)行檢驗(yàn)。但該模型對(duì)于不同種類的期貨預(yù)測(cè)準(zhǔn)確性和適用性有差異。該模型用于數(shù)據(jù)集較少的期貨時(shí),模型擬合程度較低,數(shù)據(jù)可信度差;該模型用于數(shù)據(jù)集較多的期貨價(jià)格預(yù)測(cè)時(shí),擬合程度高,數(shù)據(jù)可信度好。因此可以得出該模型可用于長(zhǎng)期期貨價(jià)格預(yù)測(cè)的特點(diǎn)。
四、創(chuàng) 新 點(diǎn)
(一)引入量化擇時(shí)
量化擇時(shí)的優(yōu)勢(shì)主要體現(xiàn)在:其一,量化擇時(shí)擁有客觀性。在交易過(guò)程中,量化擇時(shí)任何操作均不是人為進(jìn)行的,全部都是運(yùn)用計(jì)算機(jī)系統(tǒng)開展預(yù)算與測(cè)試。因此,這樣便成功地避免了投資人員心理因素和主觀情緒等方面的因素對(duì)投資過(guò)程中帶來(lái)的負(fù)面影響。在量化擇時(shí)過(guò)程中,借助計(jì)算機(jī)來(lái)構(gòu)建量化擇時(shí)模型,并對(duì)市場(chǎng)大數(shù)據(jù)開展分析,只需確保使用的模型符合投入市場(chǎng)的應(yīng)用要求。其二,量化擇時(shí)具有可控性。跟傳統(tǒng)投資項(xiàng)目相比,量化擇時(shí)擁有可控性。相比傳統(tǒng)的投資項(xiàng)目,量化擇時(shí)的投資范圍更廣, 并且通過(guò)應(yīng)用技術(shù)能夠?qū)L(fēng)險(xiǎn)降至最低水平,把風(fēng)險(xiǎn)控制在可以接受的范圍中。正因?yàn)榱炕瘬駮r(shí)擁有這一優(yōu)勢(shì),能夠讓投資者在承擔(dān)最小風(fēng)險(xiǎn)的基礎(chǔ)上獲得較大的收益。其三,量化擇時(shí)具有高效性。量化擇時(shí)是將計(jì)算機(jī)、金融、數(shù)學(xué)等包含在內(nèi)的多種學(xué)科融合形成的一類高效投資模型,將各個(gè)學(xué)科的作用發(fā)揮出來(lái),再經(jīng)信息處理后借助大數(shù)據(jù)來(lái)幫助投資者作出科學(xué)的投資。換而言之,量化擇時(shí)的數(shù)據(jù)是經(jīng)計(jì)算機(jī)處理后的,因此投資決策更科學(xué),極大地減少了人員的工作負(fù)擔(dān),提升了投資決策的高效性。
(二)引入RNN
運(yùn)用Python建立了基于RNN的期貨市場(chǎng)預(yù)測(cè)模型,并使用滬深300股指期貨數(shù)據(jù)進(jìn)行了檢驗(yàn),訓(xùn)練集準(zhǔn)確率與測(cè)試集準(zhǔn)確率都較為滿意。
利用建立好的模型預(yù)測(cè)具有代表性的四類大宗商品期貨價(jià)格走勢(shì),經(jīng)過(guò)不斷調(diào)整模型,來(lái)獲得近3個(gè)月的預(yù)測(cè)值與真實(shí)值的走勢(shì)圖,使R^2等于95%,最終確定近3個(gè)月使收益率最大的最優(yōu)投資組合。
(三)引入Origin
Origin是一個(gè)具有電子數(shù)據(jù)表前端的圖形化用戶界面軟件。Origin支持各種各樣的2D/3D圖形。Origin中的數(shù)據(jù)分析功能包括統(tǒng)計(jì)、信號(hào)處理、曲線擬合以及峰值分析。Origin中的曲線擬合是采用基于Levernberg-Marquardt算法(LMA)的非線性最小二乘法擬合。Origin強(qiáng)大的數(shù)據(jù)導(dǎo)入功能,支持多種格式的數(shù)據(jù),包括ASCII、Excel、NI TDM、DIADem、NetCDF、SPC等等。圖形輸出格式多樣,例如JPEG、GIF、EPS、TIFF等。內(nèi)置的查詢工具可通過(guò)ADO訪問(wèn)數(shù)據(jù)庫(kù)數(shù)據(jù)。
總的來(lái)講,Origin在數(shù)據(jù)分析方面功能更強(qiáng)大,從操作上來(lái)講,Origin更容易上手;此外,Origin還能滿足數(shù)據(jù)擬合的功能,內(nèi)嵌了非常豐富的函數(shù)庫(kù),相較于其他平臺(tái),數(shù)據(jù)擬合變得更加容易操作,更加靈活。