摘 要:針對國家對證券市場的監(jiān)管和投資人對證券市場的決策而言,一個精確度更高的時間序列預測模型是很重要的。本文在吸取前人利用神經網絡模型進行證券價格趨勢預測中的經驗,基于長短期記憶人工神經網絡搭建時間序列,提出利用指數(shù)移動平均值均線對數(shù)據進行采樣,以提高時間序列對證券價格趨勢預測的準確性。本文采用的時間序列數(shù)據為上證指數(shù)日線收盤價,實驗結果表明預測精確度提高70%,采用指數(shù)移動平均值均線對數(shù)據進行采樣輸入時間序列分析模型的預測效果優(yōu)于傳統(tǒng)方法進行數(shù)據采樣。本文的實驗結果為國家對市場的監(jiān)督和投資者的決策提供了一定參考。
關鍵詞:時間序列;指數(shù)移動平均值;神經網絡;LSTM;深度學習
本文索引:陳騰勁 .<變量 2>[J].中國商論,2021(20):-094.
中圖分類號:F832.0 文獻標識碼:A 文章編號:2096-0298(2021)10(b)--03
時間序列分析是以已有的歷史數(shù)據為根據,通過數(shù)學建模進行分析和判斷未來發(fā)展趨勢的一種手段,被廣泛地運用在證券走勢的預測當中。自20世紀80年代開始,在人工智能(Artificial Intelligence, AI)領域,人工神經網絡(Artificial Neural Networks, ANN)受到越來越多的關注。得益于最近十多年來科技的進步,人們在半導體領域的探索不斷深入,ANN的研究工作也不斷向前邁進,已經取得了很大的進展。傳統(tǒng)的時間序列分析方法因其對高噪聲序列分析的效果不佳,又因證券價格為高噪聲序列,故難以對證券價格趨勢的變動做出科學的、嚴謹?shù)呐袛啵鳤NN容易處理不完整的、模糊不確定或規(guī)律性不明顯、高噪聲的數(shù)據,所以用ANN進行價格預測的優(yōu)勢是傳統(tǒng)時間序列模型無法相提并論的。
長短期記憶人工神經網絡(Long-Short Term Memory, LSTM)是人工神經網絡的一種,衍生于循環(huán)人工神經網絡(Recurrent Neural Network, RNN),因其具有負責計算時間序列中各個觀測值之間依賴性的能力,所以,LSTM通常被用于預測目的[1]。又因其具有快速適應趨勢中急劇變化的固有能力,所以,LSTM可以在波動的時間序列中很好地工作。傳統(tǒng)的時間序列分析模型,如差分整合移動平均自回歸模型 (Autoregressive Integrated Moving Average Model, ARIMA)則無法盡快適應證券價格的突然劇烈變動。
一個精確度高的時間序列分析模型對證券市場的價格進行分析和預測,將有助于國家對宏觀經濟政策的把控,也能為投資者帶來極大的利潤。本文將運用LSTM模型對證券價格進行時間序列分析,并分別以收盤價和以指數(shù)移動平均值均線 (Exponential Moving Average, EMA)價格進行采樣,對比兩個不同采樣方式的誤差率,評估兩種采樣方式的預測效果,為國家對市場的監(jiān)督和投資者的決策提供參考。
1 LSTM模型原理
由于RNN模型沒有長期記憶能力和會出現(xiàn)梯度爆炸或者梯度消失等弊端,在RNN模型的基礎之上,Juergen Schmidhuber提出了LSTM模型。
LSTM除了RNN結構外,還具有閥門節(jié)點層。有三種類型的閥門:忘記門,輸入門和輸出門。這些閥門可以被打開或關閉,用于確定模型網絡的內存狀態(tài)(前一個網絡的狀態(tài))的輸出是否達到閾值,從而添加到該層的當前計算中。
ft,it,ot和Ct分別表示在t時刻對應的三種門結構和細胞狀態(tài);Wf,Wi,Wo和Wc表示循環(huán)層的權重矩陣;σ表示激活函數(shù),一般為sigmoid函數(shù)或者tanh函數(shù);bf,bi,bo和bc表示偏置向量,LSTM模型的計算公式如下[2]:
2 EMA均線原理
EMA均線是一種趨向類指標,其構造的原理是對收盤價進行算術平均,并且把不同時間的平均值連接成一條平滑的曲線,用于判斷證券價格未來走勢的變動趨勢。對序列{xn}定義其截至第n項的周期為N的指數(shù)移動平均 EMAN(xn)的計算公式:
由于x1之前沒有數(shù)據,一般都會補充定義x0=x-1=x-2=…=x1。這樣自然就能給出EMAN(x1)=x1的結果。從定義式中,我們可以看出EMA均線加權平均的特性。在EMA均線指標中,時間越靠近當天(當期)時刻,該證券價格所獲得的權重越大。這說明EMA函數(shù)對近期的證券價格逐步增加權重比,更能及時反映近期的證券價格的波動情況[3]。
3 模型構建
本文基于Python3.8和Tensorflow環(huán)境下的Keras API進行LSTM模型的搭建。
本文搭建的LSTM模型共有1層隱藏層,該隱藏層內含有的神經元數(shù)量為128個。
人工神經網絡運用梯度下降法在反向傳播過程中,迭代出最佳的損失殘差,能更好地基于訓練數(shù)據迭代地更新神經網絡權重[4]。本文選用的梯度下降迭代器為Adam優(yōu)化算法。
本文中選擇用于衡量訓練誤差的損失函數(shù)為均方誤差(Mean Squared Error, MSE)。訓練過程中,隨著迭代次數(shù)不斷增加,MSE的值會不斷縮小,當MSE的值越來越接近于0,說明LSTM模型擬合的效果越來越好[5]。
在對神經網絡模型進行多次訓練之后,發(fā)現(xiàn)Epochs次數(shù)為1000時,模型對數(shù)據擬合的損失函數(shù)MSE的值最小,即擬合的精確度最高,故本文所選用的Epochs次數(shù)為1000次,選用的輸入數(shù)據批次大小 (Batch Size)為128,數(shù)據采樣的滑動窗口設置為1。
本文利用LSTM神經網絡建立了兩個不同的模型來進行證券價格的預測,具體模型描述如下:
模型一:利用連續(xù)采樣單純的歷史收盤價作為模型的輸入數(shù)據;
模型二:利用連續(xù)采用的歷史收盤價的EMA價格作為模型的輸入數(shù)據。