黃秋萍,周 霞,甘宇健,韋 宇(廣西財(cái)經(jīng)學(xué)院 信息與統(tǒng)計(jì)學(xué)院,廣西 南寧 530003)
SVM與神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測(cè)中的應(yīng)用研究*
黃秋萍,周霞,甘宇健,韋宇
(廣西財(cái)經(jīng)學(xué)院 信息與統(tǒng)計(jì)學(xué)院,廣西南寧 530003)
介紹了SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測(cè)中的應(yīng)用研究。通過輸入歷史股票價(jià)格走勢(shì)數(shù)據(jù)進(jìn)行模型訓(xùn)練,并分別進(jìn)行三個(gè)模型預(yù)測(cè)輸出,最后通過均方誤差、走勢(shì)方向準(zhǔn)確率和總盈利率三個(gè)指標(biāo)分析比較三個(gè)模型,從而了解模型在股票預(yù)測(cè)領(lǐng)域的應(yīng)用效果,為后續(xù)研究做參考。
股票預(yù)測(cè);SVM;神經(jīng)網(wǎng)絡(luò)
如何準(zhǔn)確地對(duì)股票進(jìn)行預(yù)測(cè)一直是一個(gè)熱門的證券研究話題。在國(guó)內(nèi),張秀艷、徐立本基于神經(jīng)網(wǎng)絡(luò)集成理論,建立股市預(yù)測(cè)模型,實(shí)驗(yàn)分析表明,股市預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)集成系統(tǒng)具有更好的穩(wěn)健性和更好的應(yīng)用價(jià)值[1]。近幾年來,SVM(Support Vector Machines)發(fā)展較快,國(guó)內(nèi)研究人員開展了許多有效的研究工作,取得了良好的效果[2-3]。在國(guó)外,神經(jīng)網(wǎng)絡(luò)、SVM等經(jīng)常出現(xiàn)在股票識(shí)別、走勢(shì)預(yù)測(cè)的論文中。除此之外,神經(jīng)網(wǎng)絡(luò)模型已在借貸評(píng)估、市場(chǎng)研究、金融預(yù)測(cè)等方面得到了應(yīng)用,并顯示出巨大的生命力。
SVM對(duì)經(jīng)驗(yàn)的依賴較小,能夠獲得全局最優(yōu)解,具有良好的泛化性能,從而有效地克服了神經(jīng)網(wǎng)絡(luò)等方法無法避免的局部極值問題。另外,SVM是專門針對(duì)有限樣本而設(shè)計(jì)的學(xué)習(xí)機(jī),它采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則對(duì)經(jīng)驗(yàn)風(fēng)險(xiǎn)和學(xué)習(xí)機(jī)的復(fù)雜度進(jìn)行控制,有效地避免過學(xué)習(xí)現(xiàn)象的產(chǎn)生,能獲得比傳統(tǒng)學(xué)習(xí)方法更優(yōu)良的泛化能力。在人工神經(jīng)網(wǎng)絡(luò)的實(shí)際應(yīng)用中,80%~90%的人工神經(jīng)網(wǎng)絡(luò)模型采用的是BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)或它的變化形式,它是前饋網(wǎng)絡(luò)的核心部分,體現(xiàn)了神經(jīng)網(wǎng)絡(luò)的精華,具有非線性映射能力、自學(xué)習(xí)和自適應(yīng)能力、泛化能力以及容錯(cuò)能力。小波神經(jīng)網(wǎng)絡(luò)結(jié)合了神經(jīng)網(wǎng)絡(luò)和小波分析的優(yōu)點(diǎn),克服了二者各自應(yīng)用于預(yù)測(cè)系統(tǒng)的不足,具有神經(jīng)網(wǎng)絡(luò)的自適應(yīng)、自學(xué)習(xí)和容錯(cuò)性的優(yōu)點(diǎn),同時(shí)可以充分利用小波的時(shí)頻局部化性質(zhì),學(xué)習(xí)過程只利用局部信息就可以大大提高小波神經(jīng)網(wǎng)絡(luò)的訓(xùn)練收斂速度。
結(jié)合上述三個(gè)模型的優(yōu)點(diǎn),本文通過建立SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)上證指數(shù),通過分析這三個(gè)模型在相同訓(xùn)練數(shù)據(jù)長(zhǎng)度下的預(yù)測(cè)結(jié)果,對(duì)比分析三個(gè)模型的優(yōu)缺點(diǎn),為后續(xù)相關(guān)研究做準(zhǔn)備。
1.1SVM模型
支持向量機(jī)(SVM)以統(tǒng)計(jì)學(xué)習(xí)理論為理論基礎(chǔ),是結(jié)構(gòu)風(fēng)險(xiǎn)最大化的近似實(shí)現(xiàn)。它的主要思想是通過建立一個(gè)分類超平面作為決策曲面,最大化正例和反例之間的隔離邊緣。與多層感知器網(wǎng)絡(luò)和徑向基函數(shù)網(wǎng)絡(luò)一樣,SVM可用于模式分類和非線性回歸。在處理非線性問題時(shí),運(yùn)用一個(gè)核函數(shù)來代替高維空間中的內(nèi)積運(yùn)算,將非線性問題轉(zhuǎn)化為高維空間的線性運(yùn)算問題。其中K為核函數(shù),其種類主要有:
(1)線性核函數(shù)
K(x,xi)=xTxi
(2)二層神經(jīng)網(wǎng)絡(luò)核函數(shù)
K(x,xi)=tanh(γxTxi+r)
(3)徑向基函數(shù)
K(x,xi)=exp(-γ‖x·xi‖2),γ>0 (4)多項(xiàng)式核函數(shù)
K(x,xi)=(γxTxi+r)p,γ>0
SVM神經(jīng)網(wǎng)絡(luò)進(jìn)行回歸預(yù)測(cè)的目標(biāo)函數(shù):
Y=f(x)=(ω·x)+b
其中,ω為權(quán)重,x為樣本輸入值,b為偏置(閾值)。
1.2BP神經(jīng)網(wǎng)絡(luò)模型
誤差反傳神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))是一種基于誤差反向傳播算法的多層前饋型神經(jīng)網(wǎng)絡(luò)。它由輸入層、中間層和輸出層組成,中間層也稱為隱含層,可以是一層也可以是多層。它的基本原理是梯度最速下降法,通過誤差反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,網(wǎng)絡(luò)的總誤差最小。
與一般的人工神經(jīng)網(wǎng)絡(luò)一樣,構(gòu)成BP神經(jīng)網(wǎng)絡(luò)的神經(jīng)元仍然是神經(jīng)元。按照BP算法的要求,神經(jīng)元所用的激活函數(shù)必須是處處可導(dǎo),一般使用S型函數(shù)。對(duì)一個(gè)神經(jīng)元來說,它的網(wǎng)絡(luò)輸入可表示為:
其中,x1,x2,…,xn為神經(jīng)元的輸入,w1,w2,…,wn分別是它們對(duì)應(yīng)的連接權(quán)值。該神經(jīng)元的輸出為:
小波神經(jīng)網(wǎng)絡(luò)是一種以BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ),以小波分析為理論,將小波基函數(shù)作為隱含層節(jié)點(diǎn)的傳遞函數(shù),信號(hào)前向傳播的同時(shí)誤差反向傳播的神經(jīng)網(wǎng)絡(luò)[4]。小波神經(jīng)網(wǎng)絡(luò)結(jié)合了小波分析和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),在一定程度上克服了二者各自應(yīng)用于預(yù)測(cè)系統(tǒng)的不足,因此,將小波神經(jīng)網(wǎng)絡(luò)應(yīng)用于股價(jià)預(yù)測(cè)具有重要的理論意義和實(shí)際的應(yīng)用價(jià)值。而小波分析是針對(duì)傅里葉變換的不足發(fā)展而來,它能夠通過小波基函數(shù)的變換分析信號(hào)的局部特征,并且在二維情況下具有信號(hào)方向選擇性能力,它的特點(diǎn)包括:
(1)時(shí)域都具有緊支集或近似緊支集;
(2)直流分量為0。
小波函數(shù)是將一個(gè)母小波函數(shù)經(jīng)過平移與尺寸伸縮得到的,小波分析即把信號(hào)分解成一系列的小波函數(shù)的疊加。
小波變換是指把某一基本小波函數(shù)φ(t)平移τ后,再在不同尺度 a下與待分析的信號(hào) x(t)做內(nèi)積:
式中,τ和a為參數(shù),τ相當(dāng)于使鏡頭相對(duì)于目標(biāo)平移,a相當(dāng)于使鏡頭向目標(biāo)推進(jìn)和遠(yuǎn)離。
參考目前論文中出現(xiàn)頻率最高的 SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)股票預(yù)測(cè)模型,分別構(gòu)建了3個(gè)6輸入、1輸出的股票預(yù)測(cè)模型[5-7]。輸入分別為:某日上證指數(shù)的開盤指數(shù)(價(jià))、指數(shù)(股價(jià))最高值、指數(shù)(股價(jià))最低值、收盤指數(shù)(價(jià))、交易量和交易額;輸出為輸入次日的收盤指數(shù)(價(jià))。
在設(shè)計(jì)SVM模型時(shí),選取不同的核函數(shù)對(duì)SVM模型性能的影響不大,但核函數(shù)的參數(shù)g和誤差懲罰因子c卻會(huì)嚴(yán)重影響SVM模型的泛化推廣性能,故針對(duì)核函數(shù)g和誤差懲罰因子c的參數(shù)選擇方法尤為重要。本文選擇交叉驗(yàn)證的方式尋找最優(yōu)參數(shù),將樣本數(shù)據(jù)進(jìn)行分組,一部分作為訓(xùn)練集,另一部分作為驗(yàn)證集,先用訓(xùn)練集對(duì)學(xué)習(xí)機(jī)器進(jìn)行訓(xùn)練,再利用驗(yàn)證集檢測(cè)訓(xùn)練得到的模型[4]。
在設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)時(shí),輸入層和輸出層的神經(jīng)元數(shù)目由實(shí)際情況而定,在設(shè)計(jì)時(shí)應(yīng)盡量減小系統(tǒng)的規(guī)模和復(fù)雜度,使模型運(yùn)行的時(shí)間減小。另外,由于BP神經(jīng)網(wǎng)絡(luò)是非線性的,初始權(quán)值的選取對(duì)于模型的學(xué)習(xí)效果是否能達(dá)到局部最小和能否收斂有密切的關(guān)系,因此初始權(quán)值選取的一個(gè)重要標(biāo)準(zhǔn)是使得初始權(quán)值在輸入累加時(shí)每個(gè)神經(jīng)元的狀態(tài)值能接近于零。
小波神經(jīng)網(wǎng)絡(luò)權(quán)值參數(shù)修正算法類似于BP神經(jīng)網(wǎng)絡(luò)權(quán)值修正算法,采用梯度修正網(wǎng)絡(luò)的權(quán)值和小波基函數(shù)參數(shù),從而使小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出不斷逼近期望輸出。三個(gè)模型的算法流程如圖1所示。
圖1 三個(gè)模型的算法流程
為了對(duì)比分析三個(gè)模型的預(yù)測(cè)效果,本文選擇三個(gè)指標(biāo)評(píng)判模型的預(yù)測(cè)結(jié)果:均方誤差、走勢(shì)準(zhǔn)確率和總盈利率。
均方誤差是衡量平均誤差的一種較為方便的方法,可以評(píng)價(jià)數(shù)據(jù)的變化。大多學(xué)者在評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)模型時(shí),常用的評(píng)價(jià)指標(biāo)是均方誤差。在數(shù)學(xué)理論中,均方誤差越小可以說明預(yù)測(cè)結(jié)果越好。其計(jì)算公式為:
其中,a為預(yù)測(cè)期望輸出值,b為預(yù)測(cè)輸出值,n為預(yù)測(cè)個(gè)數(shù)。
走勢(shì)方向準(zhǔn)確率是指預(yù)測(cè)走勢(shì)方向和期望走勢(shì)方向相同的次數(shù)與總預(yù)測(cè)數(shù)之間的比值。走勢(shì)方向準(zhǔn)確率可以反映一個(gè)模型的預(yù)測(cè)勝算率,在一些投資場(chǎng)合,投資者可能只關(guān)心明天是漲是跌,而不關(guān)心具體漲多少或跌多少。走勢(shì)方向準(zhǔn)確率如果能超過70%,則說明預(yù)測(cè)10次,準(zhǔn)確7次,這樣的預(yù)測(cè)模型將有非常高的直接使用價(jià)值。
總盈利率是投資者非常關(guān)心的指標(biāo),該指標(biāo)反映模型在一定交易日內(nèi)的盈利情況。股票預(yù)測(cè)模型能否指導(dǎo)投資產(chǎn)生穩(wěn)定客觀的正贏利,是評(píng)判預(yù)測(cè)模型效果的重要指標(biāo)之一。
其計(jì)算公式為:
本文選取上證指數(shù) 2000年 2月15日~2014年7月25日共3 500個(gè)交易日數(shù)據(jù)作為模型數(shù)據(jù)源,從中劃分訓(xùn)練和預(yù)測(cè)數(shù)據(jù),訓(xùn)練數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)相鄰。分別進(jìn)行訓(xùn)練1 000個(gè)數(shù)據(jù)預(yù)測(cè)500個(gè)數(shù)據(jù);訓(xùn)練3 000個(gè)數(shù)據(jù),預(yù)測(cè)500個(gè)數(shù)據(jù)的試驗(yàn),之后計(jì)算預(yù)測(cè)結(jié)果的均方誤差、走勢(shì)方向準(zhǔn)確率、500個(gè)交易日的總盈利率,結(jié)果見表1和表2。
表1 訓(xùn)練數(shù)據(jù)為1 000個(gè)的結(jié)果
表2 訓(xùn)練數(shù)據(jù)為3 000個(gè)的結(jié)果
由以上二表可知,三個(gè)模型的均方誤差較低,與前人研究的結(jié)果相近[5-7]。三個(gè)模型預(yù)測(cè)的走勢(shì)方向準(zhǔn)確率不高,準(zhǔn)確率徘徊在50%附近??傆实谋憩F(xiàn)也較差,且不穩(wěn)定,這說明若直接使用三個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行股票投資無法取得穩(wěn)定良好的收益。此外,從預(yù)測(cè)結(jié)果還能發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)的運(yùn)行結(jié)果波動(dòng)性大,隨機(jī)性較強(qiáng),而SV M的結(jié)果較為穩(wěn)定。
本文通過建立 SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)三種模型分別對(duì)上證指數(shù)進(jìn)行訓(xùn)練及預(yù)測(cè),通過均方誤差、走勢(shì)方向準(zhǔn)確率和總盈利率三個(gè)指標(biāo)分析比較三個(gè)模型,發(fā)現(xiàn)直接使用三個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行股票投資無法取得穩(wěn)定良好的收益。在今后的工作中,會(huì)繼續(xù)深入研究股票預(yù)測(cè)問題,尋找一個(gè)基于神經(jīng)網(wǎng)絡(luò)等人工智能方法的可穩(wěn)定盈利的股票預(yù)測(cè)模型。
[1]張秀艷,徐本立.基于神經(jīng)網(wǎng)絡(luò)集成系統(tǒng)的股市預(yù)測(cè)模型[J].系統(tǒng)工程理論與實(shí)踐,2003,23(9):67-70.
[2]喻勝華,肖雨峰.基于信息粒化和支持向量機(jī)的股票價(jià)格預(yù)測(cè)[J].財(cái)經(jīng)理論與實(shí)踐,20011,32(6):44-47.
[3]程硯秋.基于支持向量機(jī)的證券價(jià)格預(yù)測(cè)方法研究[D].大連:大連理工大學(xué),2007.
[4]MATLAB中文論壇.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2010.
[5]馮居易.BP神經(jīng)網(wǎng)絡(luò)股票價(jià)格預(yù)測(cè)模型研究[D].西安:西安建筑科技大學(xué),2008.
[6]張立霞,馬芳芳,葉德謙.基于支持向量機(jī)方法的金融時(shí)間序列研究[J].遼寧工業(yè)大學(xué)學(xué)報(bào),2008,28(1):28-30.
[7]張海珍.小波神經(jīng)網(wǎng)絡(luò)在股價(jià)預(yù)測(cè)中的應(yīng)用[D].西安:西安科技大學(xué),2008.
Application of SVM and neural network model in the stock prediction research
Huang Qiuping,Zhou Xia,Gan Yujian,Wei Yu
(School of Information and Statistics,Guangxi University of Finance and Economics,Nanning 530003,China)
This paper introduces the SVM,BP neural network and wavelet neural network model in the application of stock prediction research.The historical stock price data was input for the three models training and then they output predicted values. Finally,through the mean square error,the accuracy of tendency and the total of profitability as evaluation index to analysis and compare the three models,so as to know application effect in the field of stock prediction models and make reference for subsequent researches.
stock prediction;SVM;neural network
TP391.4
A
1674-7720(2015)05-0088-03
2014年廣西壯族自治區(qū)級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201411548098)
(2014-10-01)
黃秋萍(1990-),女,在讀本科,主要研究方向:模式識(shí)別、統(tǒng)計(jì)建模。
周霞(1993-),女,在讀本科,主要研究方向:數(shù)理統(tǒng)計(jì)。
甘宇?。?986-),通信作者,男,碩士研究生,助教,主要研究方向:模式識(shí)別、金融量化投資,E-mail:vhdl@foxmail. com。