高欽姣 張勝剛 賈曉薇
【摘要】支持向量機(support vector machine, SVM)是數(shù)據(jù)挖掘中的一項新技術(shù),是借助于最優(yōu)化方法解決機器學習問題的新工具。 支持向量機目前主要用來解決分類問題(模式識別,判別分析)和回歸問題。而股市行為預(yù)測通常為預(yù)測股市數(shù)據(jù)的走勢和預(yù)測股市數(shù)據(jù)的未來數(shù)值。而當我們將走勢看作兩種狀態(tài)(漲、跌),問題便轉(zhuǎn)化為分類問題,而預(yù)測股市未來的價格是指為典型的回歸問題。本文旨在于介紹預(yù)測股票價格走勢的SVM簡單預(yù)測模型。 該模型可以用來預(yù)測未來若干天股票價格的大體走勢,這對于股票投資可以起到很好的指導性作用。
【關(guān)鍵詞】支持向量機 股票價格預(yù)測 量化分析
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2016)10-0227-01
一、引言
隨著金融市場的逐步完善,證券交易所的交易量也在不斷的提升,預(yù)測未來一段時間內(nèi)的證券價格成為廣大投資者密切關(guān)注的問題,同時產(chǎn)生了許多優(yōu)秀的證券分析預(yù)測方法[1],如基本分析和技術(shù)分析(K線圖、移動平均線和OBV線等)。然而這些方法從本質(zhì)上來講只是分析方法,其預(yù)測結(jié)果不很理想。近年來,國內(nèi)外學者紛紛采用人工神經(jīng)網(wǎng)絡(luò)[2]、支持向量機[3]等方法對證券交易數(shù)據(jù),特別是股票市場的數(shù)據(jù)進行處理,試圖揭示證券交易數(shù)據(jù)背后所蘊含的意義,并對其價格進行預(yù)測。目前,國內(nèi)外關(guān)于證券價格預(yù)測的方法主要有證券投資分析法、時間序列分析法、人工神經(jīng)網(wǎng)絡(luò)法和支持向量機方法[4]等。
自2000年以來,國內(nèi)外對支持向量機的研究不斷地增加,SVM應(yīng)用于證券價格預(yù)測領(lǐng)域的優(yōu)勢可概括為:
(1)SVM具有堅實的數(shù)學理論基礎(chǔ),是專門針對小樣本學習問題提出的。
(2)從本質(zhì)上講,SVM算法是一個凸二次規(guī)劃問題,可以保證得到的解是全局最優(yōu)解。
(3)SVM采用核函數(shù)方法,有效的解決了復雜計算問題。
(4)SVM應(yīng)用了結(jié)構(gòu)風險最小化原則,因而具有很好的推廣能力。
基于以上優(yōu)點,我們可以相信SVM在證券價格預(yù)測領(lǐng)域?qū)⒃絹碓绞芡瞥纭?/p>
二、支持向量機簡介
支持向量機分類的目標是能在某特征空間中學習到一個分類超平面,使得在這個空間中能夠?qū)?shù)據(jù)線性分開。支持向量機的研究最初是針對模式識別中的二類線性可分問題提出來的。由于股市的數(shù)據(jù)是非線性的,SVM對數(shù)據(jù)進行非線性映射,通過映射?覬:X→F ,將數(shù)據(jù)映射到一個合適的特征空間F中,從而使數(shù)據(jù)線性可分,然后在F中構(gòu)造最優(yōu)超平面。由于優(yōu)化函數(shù)和分類函數(shù)都涉及樣本空間的內(nèi)積運算, 因此在變換后的高維特征空間E中需進行內(nèi)積運算<?覬(xi),?覬(xj)>,根據(jù)滿足Mercer定理,對應(yīng)線性變換空間中的內(nèi)積,<?覬(xi),?覬(xj)>=k(xi,xj)。采用適當?shù)暮撕瘮?shù)k(xi,xj),就能代替向高維空間中的非線性映射,實現(xiàn)非線性變換后的線性分類。
三、支持向量機在股票價格預(yù)測中的應(yīng)用
(1)支持向量機核函數(shù)的選取問題
支持向量機方法是將數(shù)據(jù)映射到一個Hilbert特征空間中,然后在此特征空間中對數(shù)據(jù)進行處理,數(shù)據(jù)分類時選擇合適的核函數(shù)非常重要。目前的方法大部分是使用一種徑向基函數(shù)Guass核函數(shù),同樣可以作為核函數(shù)的還有徑向基函數(shù)吳函數(shù)和Wendland函數(shù),在對徑向基函數(shù)和Guass核函數(shù)做了充分研究的基礎(chǔ)上,對支持向量機中的核函數(shù)可以進行分析和改進。
(2)將改進的分類方法應(yīng)用到股票價格預(yù)測中
將分類方法應(yīng)用到股票價格預(yù)測中時,要面臨以下問題: 一是變量的選取問題, 我們希望在選擇盡量少的向量的基礎(chǔ)上達到做好的預(yù)測效果。 二是變量的處理問題, 目的是不能出現(xiàn)向量被覆蓋的問題。
四、總結(jié)
隨著非線性理論、統(tǒng)計學、系統(tǒng)論、信息論、控制論和人工智能技術(shù)的空前發(fā)展,證券價格預(yù)測也開辟了新思路。支持向量機作為一種新的機器學習方法,它基于嚴格完備的數(shù)學理論,引入結(jié)構(gòu)風險最小化原則,可以得到全局最優(yōu)解,解決了陷入局部極小點的問題,利用支持向量機對證券時間序列進行預(yù)測是目前金融預(yù)測領(lǐng)域的最好方法之一。
參考文獻:
[1]彭麗芳, 孟志青, 姜華等.基于時間序列的支持向量機在股票預(yù)測中的應(yīng)用[J].計算技術(shù)與自動化,2006, 25(3):88-91.
[2]彭望蜀.基于BP神經(jīng)網(wǎng)絡(luò)與支持向量機的股票指數(shù)預(yù)測模型比較[J]. 南方金融, 2013(1):71-72.
[3]克里斯蒂亞尼尼.支持向量機導論[M].電子工業(yè)出版社, 2004.
[4]劉道文, 樊明智.基于支持向量機股票價格指數(shù)建模及預(yù)測[J].統(tǒng)計與決策, 2013(2):76-78.
作者簡介:
高欽姣(1986.9—),女,山東日照人,博士,講師,研究方向:應(yīng)用數(shù)學。