龐志輝
摘要;考慮到股市情況通常受不同外部因素的影響,股票市場預(yù)測是時間序列分析中最困難的預(yù)測分析之一。本文的研究旨在調(diào)查在時間序列是非穩(wěn)定狀態(tài)下和最常見的情況下,研究人工神經(jīng)網(wǎng)絡(luò)(ANN)在解決預(yù)測任務(wù)中的潛力。我們使用前饋型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),具有外部輸入的非線性自回歸網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練函數(shù)用來跟新權(quán)重和偏差參數(shù),神經(jīng)網(wǎng)絡(luò)模型的特點(diǎn)是具有反向傳播算法的自適應(yīng)學(xué)習(xí)速率的梯度下降算法。使用均方差(MSE)測量在評估模型的性能,通過對比使用這種技術(shù)和一些ARIMA模型得出的結(jié)果進(jìn)行比較。比較分析得出的結(jié)論是,提出的模型可以成功應(yīng)用于預(yù)測相關(guān)數(shù)據(jù)。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);非線性回歸網(wǎng)絡(luò);ARIMA模型
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號;1009-3044(2017)07-0162-03
1介紹
預(yù)測股市指數(shù)及其趨勢已被認(rèn)為是時間序列預(yù)測中最具挑戰(zhàn)性的應(yīng)用之一。根據(jù)現(xiàn)有提出的有效市場理論,股價遵循隨機(jī)路徑,實(shí)際上不可能根據(jù)歷史數(shù)據(jù)制定特定的長期預(yù)測模型。ARIMA和ANN技術(shù)已經(jīng)成功地用于建模和預(yù)測金融時間序列。與作為復(fù)雜預(yù)測系統(tǒng)的ANN模型相比,ARIMA模型被認(rèn)為是更容易的訓(xùn)練和預(yù)測技術(shù)。神經(jīng)網(wǎng)絡(luò)的一個重要特征是能夠從他們的環(huán)境中學(xué)習(xí),并通過學(xué)習(xí)在某種意義上提高性能。其中一個新的趨勢是專門的神經(jīng)結(jié)構(gòu)與學(xué)習(xí)算法的發(fā)展,提供替代工具用來解決特征提取,信號處理和數(shù)據(jù)預(yù)測等問題。近年來,在使用ARIMA模型進(jìn)行金融時間序列預(yù)測的金融數(shù)據(jù)分析領(lǐng)域中進(jìn)行了一系列研究。Meyler等人使用ARIMA模型來預(yù)測愛爾蘭通貨膨脹。Contreras等人使用ARIMA方法預(yù)測第二天的電價。FxJiger等人用于ARIMA模型來預(yù)測在土耳其通過燃料一次能源的需求。Datta使用相同的Box和Jenkins方法預(yù)測孟加拉國的通貨膨脹率。A1-Zeaud已經(jīng)使用ARIMA模型來建模和預(yù)測銀行部門的波動率。
本文的結(jié)構(gòu)如下。在本文的第二部分,我們簡要介紹ARIMA模型進(jìn)行預(yù)測。接下來,給出了旨在預(yù)測特定股票收盤價的外部輸入的非線性自回歸網(wǎng)絡(luò)。應(yīng)用于數(shù)據(jù)預(yù)測的基于ANN的策略是針對ARIMA模型進(jìn)行分析的,并且在文章的第四部分中描述了這些模型的比較分析。關(guān)于報告的研究的結(jié)論在本文的最后部分提出。
2RIM模型
自回歸積分移動平均(ARIMA)模型和Box-Jenkins方法是一種統(tǒng)計分析模型。它主要用于時間序列分析的計量經(jīng)濟(jì)學(xué)和統(tǒng)計學(xué)。ARIMA模型使用時間序列數(shù)據(jù)來預(yù)測系列中的未來點(diǎn)。非季節(jié)性ARIMA模型由ARIMA(p,d,q)表示,其中p,d,q是非負(fù)整數(shù),它們分別是自回歸(AR),集成(I)和移動平均(MA)的參數(shù)。
(1)
(2)
(3)
可以使用為ARMA過程開發(fā)的預(yù)測技術(shù)的擴(kuò)展來解決預(yù)測ARIMA過程的問題。預(yù)測ARMA(p,q)過程中最常用的方法之一是用于計算最佳線性預(yù)測變量(Durbin-Levison算法,創(chuàng)新算法等)的遞歸技術(shù)類。在下面我們描述使用創(chuàng)新算法的遞歸預(yù)測方法。
3用于預(yù)測股票收盤價的基于ANN的模型
具有旨在預(yù)測特定股票的收盤價的外部輸入的非線性自回歸網(wǎng)絡(luò)的過程如下所示;
我們假設(shè)Yt是時間z時刻的股票收盤價。對于每個時刻t,我們用Xt=(Xt(1),Xt(2),…,Xt(n)表示與Yt顯著相關(guān)的指標(biāo)的值的向量,即在Xt(i)和Yt之間的相關(guān)系數(shù)大于某一閾值。
我們研究中使用的神經(jīng)模型是一個動態(tài)網(wǎng)絡(luò)。直接法用于建立股票平倉值的預(yù)測模型,具體描述如下。
(4)
(5)
(6)
所考慮的延遲對訓(xùn)練集和預(yù)測過程具有顯著影響。我們使用相關(guān)圖為我們的神經(jīng)網(wǎng)絡(luò)選擇適當(dāng)?shù)拇翱诖笮 N覀冃枰糠肿韵嚓P(guān)函數(shù)(PACF)在統(tǒng)計上不相關(guān)的滯后。
具有外部輸入的非線性自回歸網(wǎng)絡(luò)(NARX)是一個遞歸動態(tài)網(wǎng)絡(luò),反饋連接包含網(wǎng)絡(luò)的多個層。NARX網(wǎng)絡(luò)的輸出可以被認(rèn)為是某個非線性動態(tài)系統(tǒng)的輸出估計。由于在網(wǎng)絡(luò)訓(xùn)練期間實(shí)際輸出是可用的,所以產(chǎn)生串并聯(lián)架構(gòu),其中估計輸出被實(shí)際輸出替代。這個模型的優(yōu)點(diǎn)有兩個方面;一方面,在訓(xùn)練階段中使用的輸入更精確,另一方面,由于所得到的網(wǎng)絡(luò)具有前饋結(jié)構(gòu),因此可以使用靜態(tài)反向傳播類型的學(xué)習(xí)。
NARX網(wǎng)絡(luò)在這里用作預(yù)測器,預(yù)測公式如下:
(7)
在圖1中描述了該串并聯(lián)神經(jīng)網(wǎng)絡(luò)的示例,其中d=2,n=10并且隱層中的神經(jīng)元的數(shù)量是24。
隱藏層和輸出層中的神經(jīng)元的激活函數(shù)可以以多種方式定義。在我們的測試中,我們采用邏輯函數(shù)(8)來模擬屬于隱藏層的神經(jīng)元的激活函數(shù),并且單位函數(shù)對屬于輸出層的神經(jīng)元的輸出進(jìn)行建模。
(8)
在訓(xùn)練步驟之后,串并聯(lián)架構(gòu)被轉(zhuǎn)換為并行配置,以便執(zhí)行多級提前預(yù)測任務(wù)。相應(yīng)的神經(jīng)網(wǎng)絡(luò)架構(gòu)如圖2所示。我們使用標(biāo)準(zhǔn)性能函數(shù),由網(wǎng)絡(luò)誤差的平均和確定。取消數(shù)據(jù)分割過程以避免提前停止。
用于更新權(quán)重和偏差參數(shù)的網(wǎng)絡(luò)訓(xùn)練函數(shù)對應(yīng)于具有反向傳播算法的自適應(yīng)學(xué)習(xí)速率變體的梯度下降。在下面,我們考慮基于梯度的學(xué)習(xí)算法的類,其一般更新規(guī)則由下式所以:
(9)
在本文中我們用E來表示誤差函數(shù),該誤差函數(shù)根據(jù)訓(xùn)練集合上的平方差誤差函數(shù)的和來定義。具有自適應(yīng)學(xué)習(xí)速率的基于反向傳播梯度的算法通過使誤差函數(shù)最小化而產(chǎn)生。
為了提供基于準(zhǔn)牛頓法的正割方程的兩點(diǎn)近似,在每個時期定義的學(xué)習(xí)速率為;
(10)
在這種情況下,基于梯度的學(xué)習(xí)方法可能超過最佳點(diǎn)或者甚至發(fā)散。
4實(shí)驗(yàn)結(jié)果
我們用樣本數(shù)據(jù)集測試了模型。樣本是在2009和2014之間的每周觀察量的一組變量S。集合S包含來自證券交易所的SNP股票的開盤價,收盤價,最高價和最低價,以及從股票市場的技術(shù)和基礎(chǔ)分析獲得的七個指標(biāo)。
相關(guān)圖顯示,對于所有變量,PACF函數(shù)在第二滯后之后立即下降。這意味著所有變量的窗口大小可以設(shè)置為2。在我們的測試中,我們使用200個樣本用于訓(xùn)練目的和100個樣本用于數(shù)據(jù)預(yù)測。
神經(jīng)網(wǎng)絡(luò)參數(shù)基于以下過程確定:
1.初始化NN的參數(shù)。
2.使用6000個時期中的訓(xùn)練樣本集訓(xùn)練NN。
對于已經(jīng)訓(xùn)練的數(shù)據(jù),根據(jù)MSE測量計算的總體預(yù)測誤差小于某個閾值。
在我們的測試中,閾值設(shè)置為0J 001。如果我們用T=(T(1),T(2),…,T(nr)表示目標(biāo)值的向量,并用(P(1),P(2),…,P(nr))表示其條目對應(yīng)于預(yù)測值的向量,則MSE誤差測量由:
(11)
使用上述技術(shù)獲得的結(jié)果報告如下。對已經(jīng)訓(xùn)練的數(shù)據(jù)預(yù)測計算的總體預(yù)測誤差為0.000 35。在已訓(xùn)練的數(shù)據(jù)上計算的回歸系數(shù)和數(shù)據(jù)擬合在圖3中示出。在已經(jīng)訓(xùn)練樣本的情況下的網(wǎng)絡(luò)預(yù)測與實(shí)際數(shù)據(jù)在圖4中示出。在新數(shù)據(jù)預(yù)測上計算的總預(yù)測誤差為0.001 2。在圖5中示出了在新樣本的情況下的網(wǎng)絡(luò)預(yù)測與實(shí)際數(shù)據(jù)。
我們用基于神經(jīng)網(wǎng)絡(luò)的方法和ARIMA預(yù)測方法進(jìn)行比較分析。首先,我們使用自相關(guān)函數(shù)(ACF)和部分自相關(guān)函數(shù)(PACF)來確定時間序列是否穩(wěn)定。在平穩(wěn)時間序列的情況下,ACF迅速衰減。由于ACF的計算值表明函數(shù)衰減非常緩慢,我們認(rèn)為考慮的時間序列是非穩(wěn)定的。為了調(diào)整ARIMA模型的差分參數(shù),分別計算了一階和二階差分序列。由于在使用一階差分系列的情況下,ACF的值非常小,我們得出結(jié)論,ARIMA模型的差分參數(shù)應(yīng)設(shè)置為1。
基于以下標(biāo)準(zhǔn)調(diào)整與AR(p)和MA(g)過程相關(guān)的ARIMA模型的參數(shù):BIC(貝葉斯信息準(zhǔn)則)的相對小的值,調(diào)整的R2(確定系數(shù))的相對高的值和相對小回歸標(biāo)準(zhǔn)誤差(SER)。根據(jù)這些結(jié)果,從上述標(biāo)準(zhǔn)的角度來看,最佳模型是ARIMA(1,1,1)模型。我們得出結(jié)論,最佳擬合模型是ARIMA(1,1,0)和ARMA(1,1,1)。
在使用ARIMA(1,1,0)模型的情況下,對新數(shù)據(jù)預(yù)測計算的總體預(yù)測誤差為0.007 7,而在使用ARIMA(1,1,1)模型的情況下為0.009 6。預(yù)測的結(jié)果如圖6所示。
5結(jié)論
本文報告的研究集中于NARX神經(jīng)網(wǎng)絡(luò)與標(biāo)準(zhǔn)ARIMA模型的比較分析。該研究是在一個數(shù)據(jù)集上開發(fā)的,該數(shù)據(jù)集包括在2009和2014之間的一組變量的800次歷史每周觀察結(jié)果。使用所提出的神經(jīng)方法獲得的結(jié)果證明了從MSE測量的觀點(diǎn)來看更好的結(jié)果。所獲得的結(jié)果是令人鼓舞的,并且需要在使用替代神經(jīng)模型的情況下擴(kuò)展研究的未來工作。