摘要:為了提高股票價指數(shù)預(yù)測的準確性、增強統(tǒng)計建模性能優(yōu)化與股票指數(shù)特征相依的交易策略效果,提出一種將指數(shù)預(yù)測與量化交易策略有效結(jié)合的門控循環(huán)單元深度進化量化模型(GRU-DES)。首先,建立循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短時記憶神經(jīng)網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元網(wǎng)絡(luò)(GRU)預(yù)測模型, 分別對上海證券交易所(上證)超大盤股票指數(shù)、上證中盤股票指數(shù)和上證小盤股票指數(shù)進行預(yù)測; 接著采用所提出的深度進化量化模型(DES)對三大股票指數(shù)的預(yù)測值與真實值進行回測研究, 通過比較預(yù)測結(jié)果與真實結(jié)果在同一策略下的各項回測指標和交易細節(jié)等特性確定最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)和策略參數(shù),進而優(yōu)化深度進化策略; 最后根據(jù)優(yōu)化后的策略提出了GRU-DES模型,并再次對三大股票指數(shù)進行樣本外數(shù)據(jù)回測來驗證模型有效性。實證回測結(jié)果表明: 所提出的GRU-DES模型在各量化回測指標上較LSTM-DES模型與RNN-DES模型的預(yù)測精度均高出14%以上, 有效解決了統(tǒng)計預(yù)測指標的隨機性和過擬合的問題; 根據(jù)2016年至2024年7年間數(shù)據(jù)回測, 所提出的GRU-DES模型比強化學習模型在各回測指標中均展現(xiàn)了穩(wěn)定性和有效性。
關(guān)鍵詞:股票指數(shù);量化模型;長短時記憶神經(jīng)網(wǎng)絡(luò);門控循環(huán)單元;收益率
中圖分類號:TP181 文獻標志碼:A
DOI:10.7652/xjtuxb202502015 文章編號:0253-987X(2025)02-0146-10
Quantitative Model for Stock Indexes Based on Gated Recurrent Unit and Deep Evolution Strategy
REN Xiaoping1,2, CHEN Zhiping1
(1. School of Mathematics and Statistics, Xi’an Jiaotong University, Xi’an, 710049, China;
2. School of Mathematics and Statistics, Northeast Petroleum University, Daqing, Heilongjiang 163318, China)
Abstract:To improve the prediction accuracy of stock price indexes and enhance the performance of statistical modeling and the design of quantitative trading strategy based on the characteristics of indexes, a quantitative model was proposed, which was based on gated recurrent unit and deep evolution strategy (GRU-DES) and effectively integrated index prediction with quantitative trading strategies. Firstly, RNN, LSTM, and GRU neural network predictive models were established to forecast the SSE mega cap, SSE mid cap and SSE small cap indexes, respectively. Next, the proposed DES model was employed to backtest the predicted values and true values of the three indexes. By comprehensively comparing the backtesting metrics and trading details of the predicted results with the true results under the same strategy, after determining the network structure and strategy parameters, the DES was optimized. Finally, the GRU-DES model was developed on basis of the optimized strategy, and the model effectiveness was verified through out-of-sample backtesting of these indexes again. The results show that the proposed GRU-DES model was 14% higher than the LSTM-DES model and RNN-DES model in backtesting metrics, effectively avoiding the randomness and overfitting problems of statistical prediction indexes. According to the backtesting results over 7 years from 2016 to 2024, the proposed GRU-DES model sufficiently demonstrates the stability and effectiveness in all backtesting metrics compared to reinforcement learning model.
Keywords:stock index; quantitative model; long short term memory; gated recurrent unit; returns
近年來,研究人員不斷從量化策略和算法交易方面對量化投資進行優(yōu)化,在資本市場風險增加、股票指數(shù)波動劇烈的背景下,急需將機器學習算法與深度學習算法應(yīng)用到量化投資體系中。用混合方法生成交易信號也是近兩年投資機構(gòu)與量化學者研究的重點,如Ayala等[1]結(jié)合機器學習算法與傳統(tǒng)技術(shù)指標,分別測試了線性模型(LM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、隨機森林(RF)和支持向量機回歸算法(SVR)的性能,但交易策略上缺乏創(chuàng)新性。
近年來,不少學者結(jié)合機器學習和深度學習算法對個股價格進行預(yù)測,Wang等[2]構(gòu)建了多元線性回歸模型、最小絕對收縮和選擇算子、SVR算法、ANN網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短時記憶神經(jīng)網(wǎng)絡(luò)(long short term memory,LSTM)、門控循環(huán)單元網(wǎng)絡(luò)(gated recurrent unit,GRU)和雙向門控循環(huán)單元網(wǎng)絡(luò)(bidirectional GRU,Bi GRU)8個單項模型,雖然實驗數(shù)據(jù)充足,但模型性能評價標準仍是傳統(tǒng)統(tǒng)計計算標準。Peng等[3]采用LSTM網(wǎng)絡(luò)和Transformer模型對中國A股市場的銀行股價進行預(yù)測,使用集成經(jīng)驗?zāi)B(tài)分解方法對股票指數(shù)降噪后進行預(yù)測,降噪與預(yù)測相結(jié)合的研究方法可能會造成預(yù)測信息的缺失。Lind等[4]基于股票交易策略,對比分析了LSTM網(wǎng)絡(luò)和GRU網(wǎng)絡(luò)的優(yōu)劣性。Sang等[5]結(jié)合了傳統(tǒng)技術(shù)指標、簡單移動平均指標(SMA)、相對強弱指標(RSI)與LSTM網(wǎng)絡(luò),通過實證表明技術(shù)指標相結(jié)合比單獨使用可得到更好的預(yù)測效果。 Kanwal等[6]提出了一種基于混合深度學習(DL)的預(yù)測模型,該模型結(jié)合了雙向Cuda深度神經(jīng)網(wǎng)絡(luò)長短期記憶(Bi-Cu DNN-LSTM)和一維卷積神經(jīng)網(wǎng)絡(luò)(CNN),用于及時有效地預(yù)測股價,但模型沒有經(jīng)過樣本外數(shù)據(jù)驗證。 Lv等[7]將股票指數(shù)分解為一系列從高頻到低頻排列的本征模態(tài)函數(shù)(IMF),將其輸入深度自動編碼器(DAE)去除冗余數(shù)據(jù)并提取深層特征,最后將高層抽象特征輸入LSTM網(wǎng)絡(luò),以預(yù)測下一個交易日的股票回報率。于孝建等[8]使用LSTM網(wǎng)絡(luò)對股票歷史數(shù)據(jù)進行建模,同時從社交媒體、個股評論等文本數(shù)據(jù)中提取情感特征共同搭建股票預(yù)測模型;該模型可以對金融市場發(fā)生風險給出預(yù)警,但沒有提出金融風險的應(yīng)對策略。Liu等 [9]提出了一個用于日內(nèi)股市預(yù)測的包含CEEMDAN、Entropy和帶歷史注意力的門循環(huán)單元網(wǎng)絡(luò)(GRU-HA)的四階段混合(CEGH)模型。文獻[3,7,9]將股票交易數(shù)據(jù)去噪后進行預(yù)測,而預(yù)測準確度的提升主要是依靠因去噪而平滑的交易數(shù)據(jù),并沒有在預(yù)測算法上進行創(chuàng)新。以上研究只依靠統(tǒng)計指標評估股票價格預(yù)測的精度,沒有從量化交易的角度來驗證預(yù)測的準確性。
另外,也有很多研究人員致力于利用新型神經(jīng)網(wǎng)絡(luò)進行金融資產(chǎn)定價。周章元等[10]結(jié)合主成分分析法和注意力機制優(yōu)化LSTM網(wǎng)絡(luò),對消費行業(yè)板塊指數(shù)進行預(yù)測,文中只闡明了策略的有效性,并沒有探討模型預(yù)測效果的優(yōu)劣。Bińkowski等[11]提出顯著性偏移卷積神經(jīng)網(wǎng)絡(luò)(significance-offset convolutional neural network, SOCNN)和RNN網(wǎng)絡(luò)的混合應(yīng)用,Luo等[12]提出一種基于多循環(huán)CNN-GRU網(wǎng)絡(luò)和注意力機制的甲醇價格預(yù)測方法;在模型構(gòu)建中,設(shè)計了一種并行混合網(wǎng)絡(luò)架構(gòu),模型框架上有一定的創(chuàng)新,但預(yù)測精度沒有明顯提升。Nourbakhsh等[13]將CNN網(wǎng)絡(luò)和LSTM網(wǎng)絡(luò)結(jié)合,并利用市盈率、盈利能力和公司交易次數(shù)等基本面數(shù)據(jù),提升股價趨勢預(yù)測性能,但多網(wǎng)絡(luò)結(jié)合在股票價格的預(yù)測上只有框架結(jié)構(gòu)的創(chuàng)新,對不同時期的交易數(shù)據(jù)預(yù)測效果缺乏魯棒性。
針對現(xiàn)有文獻方法的不足,本文提出新的應(yīng)對方案:① 簡化對股票指數(shù)預(yù)測的過程,選用預(yù)測較好的算法分別進行預(yù)測對比; ② 交易策略不選用傳統(tǒng)的交易策略,而是采用加入具有網(wǎng)絡(luò)結(jié)構(gòu)的實時交易策略,即本文使用的深度進化策略(deep evolution strategy, DES);③從交易的角度來驗證預(yù)測的有效性,為預(yù)測與量化投資有效結(jié)合提供新的研究視角與框架。
1 GRU網(wǎng)絡(luò)
從現(xiàn)有研究中可知,循環(huán)神經(jīng)網(wǎng)絡(luò)存在梯度消失問題,無法解決輸入數(shù)據(jù)的長期依賴關(guān)系。LSTM作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),在處理長期依賴關(guān)系時消除了梯度消失問題;該網(wǎng)絡(luò)通過維持一個能存儲較長時序的狀態(tài)來解決長期依賴關(guān)系,下一個狀態(tài)由前一個狀態(tài)計算得到。LSTM網(wǎng)絡(luò)結(jié)構(gòu)包含:一個遺忘門,決定t時刻獲得新數(shù)據(jù)后,存儲在長期記憶中的信息的重要性;輸入門,表示長期記憶更新方式;輸出門,計算最近輸入的短期記憶,同時記錄更新后的長期記憶[13]。
GRU網(wǎng)絡(luò)是簡化版的LSTM網(wǎng)絡(luò),兩者的主要區(qū)別在于GRU網(wǎng)絡(luò)將LSTM網(wǎng)絡(luò)中的遺忘門和輸入門集成在一個更新門中,從而減少了參數(shù),簡化了計算過程,從而達到網(wǎng)絡(luò)結(jié)構(gòu)簡化的目的。GRU網(wǎng)絡(luò)結(jié)合了時間序列單元的可見狀態(tài)和隱藏狀態(tài),目前實證結(jié)果表明GRU網(wǎng)絡(luò)在一定程度上加快了網(wǎng)絡(luò)計算速度。
根據(jù)文獻[12-14]中的金融預(yù)測方法的實證結(jié)果,為便于對照LSTM網(wǎng)絡(luò)與GRU網(wǎng)絡(luò)預(yù)測結(jié)果的準確度,本文激活函數(shù)全部選取tanh函數(shù)。GRU網(wǎng)絡(luò)的具體模型方程如下
zt=φ(ωzxt,yt-1)
gt=φ(ωrxt,yt-1)
z′t=φ(ω′xt,gtyt-1)
yt=(1-zt)yt-1+ztz′t(1)
式中:zt為t時刻更新門狀態(tài);φ為激活函數(shù);ωz為更新門輸入狀態(tài)的權(quán)重;xt為t時刻輸入序列;gt為t時刻重置門狀態(tài);ωr為重置門輸入狀態(tài)的權(quán)重;z′t為t時刻更新記憶狀態(tài);ω′為更新記憶輸入狀態(tài)的權(quán)重;yt為t時刻最終狀態(tài)。
2 深度進化策略
進化策略(evolution strategy,ES)算法被廣泛應(yīng)用于解決工程和統(tǒng)計研究問題,如車間調(diào)度問題[15]、車輛自動泊車視域規(guī)劃問題[16]和高維數(shù)據(jù)特征識別[17]問題等。目前,未見將進化策略應(yīng)用于金融交易中。本文提出的深度進化策略(DES)是一種在ES算法上加入了無損失函數(shù)網(wǎng)絡(luò)結(jié)構(gòu),可合理優(yōu)化開倉、平倉的一種高頻交易策略。DES模型包含兩個模塊:①DES模型訓(xùn)練過程,訓(xùn)練模型包含輸入層、隱藏層和輸出層;②DES模型決策交易過程。DES模型包含5個初始參數(shù),分別為:權(quán)重(w)、獎勵函數(shù)(r)、參與擾動種群大小(Mpop)、權(quán)重更新參數(shù)(σ)和學習率(lr)。
DES模型的訓(xùn)練模塊包括3個參數(shù):窗口期、輸入量和輸出量,其訓(xùn)練過程通過不斷執(zhí)行指定迭代次數(shù)的循環(huán)完成訓(xùn)練。首先,初始化變量,在每個循環(huán)訓(xùn)練epoch中,隨機生成種群后計算個體變異擾動值和個體更新權(quán)重,進行變異操作;接收新進入的數(shù)據(jù)序列后進行模型訓(xùn)練,計算交易策略權(quán)重。DES模型的決策交易模塊包含3個初始參數(shù):初始價值(Vini)、每次迭代跳過的序列數(shù)(G)和狀態(tài)空間(St)。決策過程如下:首先根據(jù)新進入數(shù)據(jù)的排序位置確定波動趨勢狀態(tài),獲取當前價格趨勢狀態(tài)后,按照窗口期設(shè)置的值提取價格序列中相應(yīng)序列數(shù)的歷史數(shù)據(jù),進入第一個模塊進行訓(xùn)練完成模型優(yōu)化;然后根據(jù)優(yōu)化后的模型計算出決策值(D),D大于新進入的價格值將執(zhí)行買入操作,D小于新進入的價格值將進行賣出操作;最后,計算每次交易的收益率,并將其標準化,進行下一代模型的訓(xùn)練。決策過程連續(xù)接收優(yōu)化訓(xùn)練后更新的交易策略權(quán)重,根據(jù)模型預(yù)測的動作執(zhí)行決策操作;DES模型通過逐漸優(yōu)化神經(jīng)網(wǎng)絡(luò)的個體權(quán)重,從而提高模型的性能。由于DES模型屬于高頻策略范疇,因此本文只包含買入和賣出兩種交易行動。
本文提出的DES模型訓(xùn)練和決策交易參數(shù)的更新分步計算過程如下。
步驟1 模型個體權(quán)重的更新過程。根據(jù)種群中每一個個體i和預(yù)先設(shè)置的擾動強度θ參數(shù)進行擾動操作,計算最新一期的變異擾動值和更新增加擾動項后的權(quán)重
Jt=θit(2)
ωt=ωt-1+Jt(3)
式中:it為種群中t時刻個體i的值;Jt為t時刻最新一期變異指數(shù)擾動值;ωt為t時刻最新一期更新后的權(quán)重。
步驟2 確定模型訓(xùn)練中t時刻交易策略使用的權(quán)重值
ωtr,t=ωt+lrMpopσ∑Mpopi=1Ji,tPi(4)
式中:Mpop為參與擾動的樣本數(shù);σ為權(quán)重更新參數(shù);lr為學習率可控制更新步長;Ji,t為第i個樣本t時刻擾動值;Pi為第i個樣本獎勵值。
步驟3 將收盤價格作為輸入,計算策略連續(xù)狀態(tài)空間的狀態(tài)值
St=vinωtr,t+ωtr,t-1St-1(5)
式中:vin為收盤價輸入值。
步驟4 根據(jù)連續(xù)狀態(tài)空間值,確定連續(xù)決策值
D=Stωtr,t+1(6)
步驟5 DES獎勵函數(shù)定義為給定權(quán)重下進行交易后的收益率
r=Vdec-ViniVini×100%(7)
式中:Vini為執(zhí)行決策后賬戶的價值; Vdec為執(zhí)行決策后賬戶的價值。
與傳統(tǒng)梯度下降等優(yōu)化方法相比,DES模型無需手動設(shè)計損失函數(shù),沒有梯度下降過程,這使得DES模型更加簡約、高效。DES模型的工作流程如圖1所示。
3 GRU-DES精度檢驗
3.1 模型預(yù)測檢驗指標
采用傳統(tǒng)的統(tǒng)計預(yù)測精度指標均方根誤差(root mean squared error, ERMSE)和平均絕對百分比誤差(mean absolute percentage error, EMAPE)來評價模型精確度,在模型擬合效果上選擇多輸出的決策系數(shù)R2vw,3個評價模型指標表示為
ERMSE= 1m∑mi=1(yi-i)2(8)
EMAPE=1m∑mi=1yi-iyi×100%(9)
R2vw=∑mj=1var(yj)R2j∑mj=1var(yj)(10)
式中:m為變量的數(shù)量;n為樣本的個數(shù);yi為第i個輸出;i為第i個輸出估計值;R2j為第j個輸出的R2值;var(yj)為第j個輸出的數(shù)學方差。
3.2 量化策略回測指標
文獻[18-19]中使用投資組合中各股票收益率的線性加權(quán)和作為投資策略優(yōu)劣的標準。文獻[20]使用年化收益率、阿爾法、夏普比值、波動率、勝率、最大回撤比率、信息比率等回測指標對預(yù)測建模方法進行評估。在現(xiàn)有文獻啟發(fā)下,本文從量化投資角度出發(fā),通過結(jié)合投資策略的回測結(jié)果衡量模型的預(yù)測精準度,投資策略回測結(jié)果的評估包含以下幾個指標。
(1)日收益率表示為
ra=Va,tVa,t-1-1(11)
式中:Va,t為第t日投資賬戶價值。
(2)年化收益率表示為
ran=VfinVini252n-1(12)
式中: Vfin為最終賬戶價值。
(3)最大回撤比率(MDD),反映了投資期間最大下跌幅度表示為
MDD=maxVroll-Va,tVroll(13)
式中:Vroll為賬戶價值的累積最大值。
(4)夏普比值(Rsh),衡量投資者承受一單位的風險獲得的超額回報表示為
Rsh=E(ra-rf) var(ra-rf)(14)
式中:E(ra-rf)為超額收益率數(shù)學期望;ra為日收益率;rf為無風險收益率;var(ra-rf)為超額收益率數(shù)學方差。
(5)歐米茄比值(Rom),衡量投資組合收益分布情況表示為
Rom=∑(ragt;rtar)∑(ra≤rtar)(15)
式中:rtar為目標收益率。
(6)卡瑪比值(Rcal),衡量投資組合風險調(diào)整后收益表示為
Rcal=ranMDD(16)
式中:ran為年化收益率;MDD為最大回撤比率。
(7)索提諾比值(Rsor),衡量投資者承受一單位的下行風險獲得的超額回報表示為
Rsor=E(ra) var(rneg)(17)
式中:rneg為負日收益率。
4 實證分析
4.1 實證數(shù)據(jù)
上市公司流通市值大小和交易活躍度展現(xiàn)出不同的指數(shù)變動特征。本文旨在對流通市值和交易活躍度綜合指數(shù)進行對比研究。分別選取了上海證券交易所(以下簡稱上證)超大盤股票指數(shù)和上證中盤股票指數(shù)2006年1月1日至2024年6月30日的收盤價數(shù)據(jù),上證小盤股票指數(shù)由于其上市日期限制,只能獲取2010年1月1日至2024年6月30日的數(shù)據(jù)。最后,對于上證三大股票指數(shù),本文采用2016年1月1日至2024年6月30日的日交易數(shù)據(jù)進行DES-GRU模型交易回測分析。本文所使用的數(shù)據(jù)來源于國泰安CSMAR數(shù)據(jù)庫。
實證分為3個部分:①采用RNN、LSTM和GRU 3個網(wǎng)絡(luò)預(yù)測模型分別對2006年1月1日至2015年12月31日的上證超大盤股票指數(shù)、上證中盤股票指數(shù)的日收盤價數(shù)據(jù)和2010年1月1日至2022年12月31日的上證小盤股票指數(shù)的日收盤價數(shù)據(jù)進行訓(xùn)練及預(yù)測;②將第一部分預(yù)測出的收盤價和相同指數(shù)同一時期的真實收盤價分別進行DES模型回測,對比研究預(yù)測價格和真實價格回測結(jié)果及交易細節(jié)的差別,確定最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)和策略參數(shù);③根據(jù)優(yōu)化出的GRU-DES模型對樣本外數(shù)據(jù)2016年1月1日至2024年6月30日7年間上證大盤指數(shù)、上證中盤股票指數(shù)和上證小盤股票指數(shù)進行模型驗證,以進一步彰顯本文所提出模型的優(yōu)勢。
4.2 預(yù)測模型對比
基于文獻[20-25]中對相關(guān)預(yù)測網(wǎng)絡(luò)模型的對比研究結(jié)果,本文選用預(yù)測效果較好的3個網(wǎng)絡(luò)模型RNN、LSTM和GRU進行對比研究,為了確定適合它們的最優(yōu)層次網(wǎng)絡(luò)結(jié)構(gòu),每個模型分別對層數(shù)為1、2、3、4的隱藏層(記為GRU-1層~GRU-4層)進行網(wǎng)絡(luò)訓(xùn)練。具體地,將3個模型分別用于上證超大盤股票指數(shù)。上證中盤股票指數(shù)和上證小盤股票指數(shù)的預(yù)測。本文所選的數(shù)據(jù)以2016年初證券市場熔斷政策出現(xiàn)為分界點,上證大盤指數(shù)和上證中盤股票指數(shù)使用2006年1月1日至2015年12月31日,共2 427條交易數(shù)據(jù),其中1 492條訓(xùn)練數(shù)據(jù)和485條測試數(shù)據(jù)個交易日數(shù)據(jù),上證小盤股票指數(shù)編制日期較短,所以使用2010年1月1日至2022年12月31日,共3153個交易日的數(shù)據(jù),其中2502條訓(xùn)練數(shù)據(jù)和630條測試數(shù)據(jù)。表1所示為各個模型預(yù)測結(jié)果的均方根誤差,表2所示各個模型預(yù)測結(jié)果的平均絕對百分比誤差,表3所示各個模型的決策系數(shù),依據(jù)均方根誤差值、平均絕對百分比誤差最小和決策系數(shù)最接近1的原則,選擇各模型的最優(yōu)層次網(wǎng)絡(luò)結(jié)構(gòu)。由于3個模型訓(xùn)練結(jié)果圖類似,限于篇幅本文只展示GRU模型對上證超大盤股票指數(shù)的最優(yōu)預(yù)測結(jié)果,效果圖如圖2所示。
由表1、表2和表3可以觀察到:① GRU模型的4個層次預(yù)測結(jié)果較穩(wěn)定,均方根誤差和平均絕對百分比誤差都是最小,對三大股票的預(yù)測精度最高,并且模型的擬合效果都較好; ② LSTM模型的整體預(yù)測能力較弱,預(yù)測精度與模型擬合效果基本一致; ③RNN模型也展示出較好的預(yù)測準確性,但預(yù)測結(jié)果的穩(wěn)定性和模型擬合效果較弱。
4.3 GRU-DES精度分析
本文用DES模型對4.2節(jié)中RNN、 LSTM和GRU這3個模型預(yù)測的三大股票收盤價和同一時期真實收盤價格進行量化策略回測。這里上證超大盤股票指數(shù)和上證中盤股票指數(shù)預(yù)測了484期,對應(yīng)交易日期為2013年10月16日至2015年12月30日;上證小盤股票指數(shù)預(yù)測了630期,對應(yīng)交易日期為2020年6月1日至2022年12月31日。 GRU模型的簡化特點與高頻策略DES模型的高效思想一致,DES模型的參數(shù)根據(jù)收益最大化進行多次調(diào)整,選中擾動強度為為0.1,學習率為0.03;策略執(zhí)行環(huán)境設(shè)置為:初始資金為10000元,手續(xù)費比率為0.0001,數(shù)據(jù)頻率為日數(shù)據(jù),訂單類型為市價單,無杠桿,不存在做空機制,回測期間無風險收益率與目標收益率均設(shè)置為0。
GRU-DES模型、LSTM-DES模型、RNN-DES模型與DES模型真實值回測的對比結(jié)果展示在表4中,顯而易見:① GRU-DES模型在年化收益率、最大回撤比率、卡瑪比值和索提諾比值與真實回撤指標上保持高度一致,均比RNN-DES模型和LSTM-DES模型的預(yù)測精度高出14%以上;②LSTM-DES模型回測效果與真實值差別最大,LSTM模型在統(tǒng)計指標上預(yù)測效果也不佳,其中最大回撤比率、歐米茄比值、卡瑪比值和索提諾比值變動區(qū)間較大,說明LSTM-DES模型明顯沒有識別出行情的波動,LSTM模型預(yù)測存在隨機性問題;③RNN-DES模型在小盤股票指數(shù)回測出高于真實值的年化收益率和較大回撤,說明預(yù)測的結(jié)果波動性大,導(dǎo)致在小盤股票指數(shù)計算與波動率相關(guān)的回撤指標中夏普比值、歐米茄比值、卡瑪比值和索提諾比值更為接近真實回測值的現(xiàn)象,4.2節(jié)中RNN模型從統(tǒng)計指標角度展現(xiàn)出優(yōu)勢,但RNN-DES模型明顯與真實值回測結(jié)果相差較大,說明了RNN模型預(yù)測存在過擬合問題。
圖3展示了各模型賬戶價值變動過程:①圖中顯示GRU-DES模型與真實值回測賬戶價值變動最
為接近;②LSTM-DES模型雖然在超大盤回測中賬戶價值與真實回測結(jié)果較為相近,但另外兩個指數(shù)回測上表現(xiàn)出不穩(wěn)定性;③策略回測期間上證中盤股票指數(shù)波動趨勢明顯,策略容易識別交易信號,導(dǎo)致3個模型從賬戶價值曲線中展現(xiàn)出相似的回測的效果。
4.4 GRU-DES模型樣本外驗證
為了更準確驗證本文優(yōu)化后策略的盈利穩(wěn)定性,這里從交易策略的樣本外表現(xiàn)來進一步驗證GRU-DES模型的優(yōu)勢。將GRU-DES模型應(yīng)用于2016年1月1日至2024年6月30日上證三大股票收盤點位進行測試,同時測試了3個雙強化學習模型Double-Duel Q learning、Duel Q learning和Double Q learning[26-27]的交易結(jié)果,回測環(huán)境與上文訓(xùn)練期間相同,回測結(jié)果如表5所示,其中三大股票以“買入并持有策略”為基準。不難看出:本文提出的GRU-DES高頻交易量化策略遠優(yōu)于3個強化學習算法策略和基準;雖然Double-Duel Q learning模型 和 Double Q learning模型有較高的歐米茄比率,說明這兩個量化模型的勝率較高,盈虧比率較低產(chǎn)生較大回撤,但GRU-DES模型各回測指標在三大股票上展現(xiàn)出穩(wěn)定性。另外,樣本外數(shù)據(jù)驗證期間指數(shù)行情一直處于低位震蕩中下行趨勢,而模型訓(xùn)練期間指數(shù)處于趨勢明顯上行區(qū)間故樣本外數(shù)據(jù)策略效果遠低于訓(xùn)練期間回測效果,同時也說明GRU-DES模型在捕捉趨勢中有一定優(yōu)勢和穩(wěn)定性。GRU-DES模型回測賬戶價值曲線和交易細節(jié)如圖4和圖5所示,從賬戶價值逐步上漲中可以觀察到GRU-DES模型一直表現(xiàn)出穩(wěn)定的收益。
最后,將GRU-DES量化模型應(yīng)用于2023年10月9日至2024年9月30日上證三大股票指數(shù)收盤點位進行測試,回測結(jié)果如表6所示,可見GRU-DES模型所有回測指標都優(yōu)于基準模型。
5 結(jié) 論
本文同時考慮RNN,LSTM和GRU 3種神經(jīng)網(wǎng)絡(luò)模型,選取上證超大盤股票指數(shù)、上證中盤股票指數(shù)和上證小盤股票指數(shù)進行訓(xùn)練與回測,由此提出了GRU-DES模型并進行樣本外數(shù)據(jù)驗證,得出以下結(jié)論。
(1) 根據(jù)3個模型預(yù)測統(tǒng)計指標的對比結(jié)果,GRU網(wǎng)絡(luò)模型顯示出一定的穩(wěn)定性和精確性; LSTM網(wǎng)絡(luò)模型在預(yù)測統(tǒng)計指標上顯示出預(yù)測效果較弱,模型預(yù)測精度與模型擬合效果一致;RNN網(wǎng)絡(luò)模型預(yù)測結(jié)果的穩(wěn)定性和模型擬合效果較弱。
(2) 根據(jù)GRU-DES、LSTM-DES和RNN-DES量化模型回測結(jié)果的對比,GRU-DES模型在各回測指標上,均比RNN-DES模型和LSTM-DES模型的預(yù)測精度高出14%以上,說明神經(jīng)網(wǎng)絡(luò)與交易策略的結(jié)合可以有效解決統(tǒng)計指標的隨機性和過擬合問題。
(3) 本文提出的GRU-DES模型與Double Duel Q learning、Duel Q learning、Double Q learning強化學習模型對比,在各回測指標中都表現(xiàn)出明顯的優(yōu)勢。GRU-DES模型將預(yù)測結(jié)果與動態(tài)交易策略有效結(jié)合,在預(yù)測過程中動態(tài)同步改進交易策略,同時交易策略又反過來印證預(yù)測結(jié)果。
參考文獻:
[1]AYALA J, GARCA-TORRES M, NOGUERA J L V, et al. Technical analysis strategy optimization using a machine learning approach in stock market indices [J]. Knowledge-Based Systems, 2021, 225: 107119.
[2]WANG Jia, WANG Xinyi, WANG Xu. International oil shocks and the volatility forecasting of Chinese stock market based on machine learning combination models [J]. The North American Journal of Economics and Finance, 2024, 70: 102065.
[3]PENG Zongyu, GUO Peichang. A data organization method for LSTM and transformer when predicting Chinese banking stock prices [J]. Discrete Dynamics in Nature and Society, 2022, 2022(1): 7119678.
[4]LIN Zili, TIAN Fangyuan, ZHANG Weiqian. Evaluation and analysis of an LSTM and GRU based stock investment strategy [C]//Proceedings of the 2022 International Conference on Economics, Smart Finance and Contemporary Trade (ESFCT 2022). Dordrecht, The Netherlands: Atlantis Press, 2022: 1615-1626.
[5]SANG Chenjie, DI PIERRO M. Improving trading technical analysis with TensorFlow long short-term memory (LSTM) neural network [J]. The Journal of Finance and Data Science, 2019, 5(1): 1-11.
[6]KANWAL A, LAU M F, NG S P H, et al. BiCuDNNLSTM-1dCNN: a hybrid deep learning-based predictive model for stock price prediction [J]. Expert Systems with Applications, 2022, 202: 117123.
[7]LV Pin, SHU Yating, XU Jia, et al. Modal decomposition-based hybrid model for stock index prediction [J]. Expert Systems with Applications, 2022, 202: 117252.
[8]于孝建, 劉國鵬, 劉建林, 等. 基于LSTM網(wǎng)絡(luò)和文本情感分析的股票指數(shù)預(yù)測 [J]. 中國管理科學, 2024, 32(8): 25-35.
YU Xiaojian, LIU Guopeng, LIU Jianlin, et al. Stock index prediction based on LSTM network and text sentiment analysis [J]. Chinese Journal of Management Science, 2024, 32(8): 25-35.
[9]LIU Yijiao, LIU Xinghua, ZHANG Yuxin, et al. CEGH: a hybrid model using CEEMD, Entropy, GRU, and history attention for intraday stock market forecasting [J]. Entropy, 2023, 25(1): 71.
[10]周章元, 何小靈. 基于優(yōu)化LSTM模型的股價預(yù)測方法 [J]. 統(tǒng)計與決策, 2023, 39(6): 143-148.
ZHOU Zhangyuan, HE Xiaoling. Stock price prediction method based on optimized LSTM model [J]. Statistics amp; Decision, 2023, 39(6): 143-148.
[11]BIN′KOWSKI M, MARTI G, DONNAT P. Autoregressive convolutional neural networks for asynchronous time series [C]//Proceedings of the 35th International Conference on Machine Learning. Chia Laguna Resort, Sardinia, Italy: PMLR, 2018: 580-589.
[12]LUO Shuang, NI Zhiwei, ZHU Xuhui, et al. A novel methanol futures price prediction method based on multicycle CNN-GRU and attention mechanism [J]. Arabian Journal for Science and Engineering, 2023, 48(2): 1487-1501.
[13]NOURBAKHSH Z, HABIBI N. Combining LSTM and CNN methods and fundamental analysis for stock price trend prediction [J]. Multimedia Tools and Applications, 2023, 82(12): 17769-17799.
[14]LI Chengyu, QIAN Guoqi. Stock price prediction using a frequency decomposition based GRU transformer neural network [J]. Applied Sciences, 2023, 13(1): 222.
[15]KHURSHID B, MAQSOOD S. A hybrid evolution strategies-simulated annealing algorithm for job shop scheduling problems [J]. Engineering Applications of Artificial Intelligence, 2024, 133, Part A: 108016.
[16]ABOYEJI E T, AJANI O S, MALLIPEDDI R. Covariance matrix adaptation evolution strategy based on ensemble of mutations for parking navigation and maneuver of autonomous vehicles [J]. Expert Systems with Applications, 2024, 249, Part A: 123565.
[17]NEMATZADEH H, GARCA-NIETOJ, ALDANA-MONTES J F, et al. Pattern recognition frequency-based feature selection with multi-objective discrete evolution strategy for high-dimensional medical datasets [J]. Expert Systems with Applications, 2024, 249, Part A: 123521.
[18]LO A W, SINGH M. Deep-learning models for forecasting financial risk premia and their interpretations [J]. Quantitative Finance, 2023, 23(6): 917-929.
[19]劉偉龍, 張永, 楊興雨. 基于LSTM預(yù)測信息的在線融資融券組合交易策略 [J]. 系統(tǒng)工程理論與實踐, 2024, 44(8): 2493-2508.
LIU Weilong, ZHANG Yong, YANG Xingyu. Online margin trading strategy based on LSTM prediction information [J]. Systems Engineering-Theory amp; Practice, 2024, 44(8): 2493-2508.
[20]賀毅岳, 高妮, 韓進博, 等. 基于長短記憶網(wǎng)絡(luò)的指數(shù)量化擇時研究 [J]. 統(tǒng)計與決策, 2020, 36(23): 128-133.
HE Yiyue, GAO Ni, HAN Jinbo, et al. Research on the exponential quantitative timing based on long short term memory [J]. Statistics amp; Decision, 2020, 36(23): 128-133.
[21]柴昱白, 陳偉, 趙舒欣, 等. 采用機器學習與二維伽馬函數(shù)的股票指數(shù)量化交易策略 [J]. 西安交通大學學報, 2023, 57(5): 204-212.
CHAI Yubai, CHEN Wei, ZHAO Shuxin, et al. Quantitative trading strategy for stock index based on machining learning and 2D gamma function [J]. Journal of Xi’an Jiaotong University, 2023, 57(5): 204-212.
[22]賀毅岳, 劉磊, 高妮. 基于M-LSTM的股票指數(shù)日內(nèi)交易量分布預(yù)測研究 [J]. 運籌與管理, 2022, 31(10): 196-203.
HE Yiyue, LIU Lei, GAO Ni. Research on forecasting intraday trading volume of stock index based on M-LSTM [J]. Operations Research and Management Science, 2022, 31(10): 196-203.
[23]GUPTA U, BHATTACHARJEE V, BISHNU P S. StockNet-GRU based stock index prediction [J]. Expert Systems with Applications, 2022, 207: 117986.
[24]蔡超, 何馨怡, 李麗. 大規(guī)模數(shù)據(jù)的分布式神經(jīng)網(wǎng)絡(luò)回歸模型研究 [J]. 統(tǒng)計與決策, 2023, 39(17): 34-39.
CAI Chao, HE Xinyi, LI Li. Research on distributed neural network regression model for large-scale data [J]. Statistics amp; Decision, 2023, 39(17): 34-39.
[25]KU C S, XIONG Jiale, CHEN Y L, et al. Improving stock market predictions: an equity forecasting scanner using long short-term memory method with dynamic indicators for Malaysia stock market [J]. Mathematics, 2023, 11(11): 2470.
[26]NING B, LIN F H T, JAIMUNGAL S. Double deep Q-learning for optimal execution [J]. Applied Mathematical Finance, 2021, 28(4): 361-380.
[27]XU Hongfeng, CHAI Lei, LUO Zhiming, et al. Stock movement prediction via gated recurrent unit network based on reinforcement learning with incorporated attention mechanisms [J]. Neurocomputing, 2022, 467: 214-228.
(編輯 劉楊 陶晴)