彭益
(湖南大學 金融與統(tǒng)計學院,長沙 410079)
股票的價格由股票的價值所決定,價格圍繞價值上下進行波動。通過對股票內(nèi)在價值以及其價格的表現(xiàn)形態(tài)進行分析,可以了解股票價格的波動性。對股票的內(nèi)在價值進行分析,即基本面的分析,主要是結(jié)合公司的經(jīng)營業(yè)績與行業(yè)的發(fā)展前景,對公司的未來現(xiàn)金流進行預測,從而確定公司未來的價值。當價格高于價值時賣出,當價格低于價值時買入。對價格的表現(xiàn)形態(tài)進行分析,即技術分析,主要是對公司股票的歷史價格、成交量等交易數(shù)據(jù)進行挖掘,找出其規(guī)律。在此基礎上,對股票價格走勢進行預測,進而確定當前價位對應的交易策略?;久娣治鍪且环N長期的投資工具,本文欲對短期股指漲跌概率進行推斷,故未考慮基本面分析。
從股票產(chǎn)生之日開始,對股票價格以及股指漲跌的預測是學術界與股票投資者感興趣的問題。對投資者而言,對股價的預測準確度越高,有利于其獲得利潤與回避風險。對國家的經(jīng)濟金融發(fā)展而言,股票市場是國民經(jīng)濟的晴雨表,股票預測也具有重要的作用。針對這樣的情況,本文提出推斷股指漲跌概率的新方法,通過數(shù)據(jù)挖掘,用泊松分布擬合股指收益率的動態(tài)過程,從而構造股指漲跌概率推斷模型來對股指漲跌概率進行預測。
股票指數(shù)漲跌變化可以看成離散的時間序列,日收盤價是時間的函數(shù)。若進行技術分析,實際上是在知道股票指數(shù)第t天以前信息基礎上,對第t+1天股票指數(shù) pt+1進行預測。 pt+1是一個非線性的函數(shù),近期的技術分析集中分析收益率動態(tài)過程,主要是利用神經(jīng)網(wǎng)絡以及生存模型對股票價格及股指漲跌進行預測。本文也從收益率動態(tài)過程的角度出發(fā),對歷史數(shù)據(jù)進行挖掘,采取泊松分布對股指漲跌的動態(tài)過程進行擬合,并且以該泊松分布為基礎,構建股指漲跌概率推斷模型,從而判斷第t+1天的股指相對第t天是漲還是跌。
對第t+1天股指漲跌進行預測前,可以計算出股指歷史日收益率。第t天股指收益率為rt,收益率計算采用rt=(pt-pt-1)/pt-1,其中 pt表示第t天收盤價,pt-1表示第t-1天收盤價。
我國股票市場存在10%的漲跌停限制,每天股票收益率在-10%與10%之間波動。股票指數(shù)采取的是派許加權綜合價格指數(shù)方法進行計算,故其日漲跌幅也在-10%與10%之間。將收益率總區(qū)間[-10,10]劃分為n等份,則每個區(qū)間段的長度為20 n。用i表示區(qū)間序號,i取值從1到n,第i區(qū)間段表示為Sector(i),則:
在收益率區(qū)間劃分為n等份后,可以判斷第t天股指收益率rt所處的區(qū)間,若rt在區(qū)間a(a∈Sector(i))內(nèi),將歷史數(shù)據(jù)中出現(xiàn)股指收益率處于區(qū)間a后第二天數(shù)據(jù)組成一個集合S,用該集合來進行泊松分布的擬合。用Count(i)表示集合S中股指收益率在區(qū)間段Sector(i)元素個數(shù),P(i)表示集合S中股指收益率在區(qū)間段Sector(i)中概率,則:
假設第t+1天收益率rt+1服從參數(shù)為λ的泊松分布,且
泊松分布的擬合是在收益率區(qū)間劃分為n等份基礎上進行的,需要獲得n的最佳值,使得集合S中股票指數(shù)收益率盡量服從泊松分布。令n的擬合評估函數(shù)為F(n),現(xiàn)在考慮影響F(n)的元素。
最后,我們希望集合S中股指收益率的實際概率分布是盡量光滑的曲線,考慮股指收益率分為n個區(qū)間后,集合S股指收益率實際概率出現(xiàn)異常點的情況。如圖1所示,異常點是指在處于某區(qū)間的實際概率比其左右臨近區(qū)間的概率都要低的情況。圖1中,收益率區(qū)間劃分為15個區(qū)間段,縱坐標為對應的概率值,則點4為異常點。異常點的個數(shù)g(n)越多,表示實際概率分布越不平滑。異常點的個數(shù)與 f(n)呈負相關關系。
圖1 異常點示例圖
對異常點g(n)進行定義如下
其中 P(i)表示集合 S中股指收益率在區(qū)間段Sector(i)中的實際概率,h表示收益率區(qū)間進行等分后,集合S中包含元素最多的區(qū)間段,即P(h)=max{P(i)},i∈{1,2...n}。
根據(jù)以上三個主要的影響因素,建立了最佳泊松分布的擬合評估函數(shù):
本文以{G(t+1)>60%|G(t+1)<40%}作為判別條件,當G(t+1)的值大于60%時,我們認為第t+1天股指上漲概率較大;當G(t+1)的值小于40%時,我們認為第t+1天股指下跌的概率較大。
我們選取上證綜合指數(shù)(000001),新上證綜指(000017)以及深證新指數(shù)(399100)對股指漲跌概率推斷模型進行檢驗。上證綜合指數(shù)反映上海證券交易所上市的股票價格的總體趨勢。新上證綜指由滬市所有G股組成,股票在股權分置改革方案實施后的第二個交易日納入指數(shù),該指數(shù)與2006年1月4日發(fā)布。深證新指數(shù)上反映深圳證券交易所流通股票價格的變動情況,其以G股公司為主體編制,于2006年2月16日開始發(fā)布。
在對股指第t+1天漲跌情況進行推斷時,采用的歷史數(shù)據(jù)為2006年2月16日至第t天的數(shù)據(jù)。歷史數(shù)據(jù)選取從2006年2月16日開始,是考慮到深圳新指數(shù)于2006年2月16日開始發(fā)布;另外在計量經(jīng)濟學中,一般認為時間序列里前期數(shù)據(jù)對后期數(shù)據(jù)的影響呈現(xiàn)一個遞減的趨勢,前期數(shù)據(jù)過多,反而使得數(shù)據(jù)預測會產(chǎn)生一個失真的效果,上證綜合指數(shù)和新上證綜指沒有選取所有的歷史數(shù)據(jù)進行擬合。從2006年2月16日以后的200個交易日后開始預測,因為如果前期數(shù)據(jù)過少,會導致集合S中缺乏的足夠數(shù)據(jù)來進行泊松分布的擬合??倶颖镜臄?shù)據(jù)截止于2011年6月30日,即進行預測的最后一天的數(shù)據(jù)為2011年6月30日。
本文采用Microsoft Visual Studio 2005 with C#進行編程,對股票指數(shù)漲跌概率進行估算。在本文前面建立的模型基礎上,進行一定的簡化處理。模型中需要遍歷n={1→2000b},但是在實際檢驗過程中,n取值范圍簡化為[15,50]。原因在于模型將收益率總區(qū)間進行了均勻分布處理,分區(qū)數(shù)不能過少,取n的下限值為15;在對部分數(shù)據(jù)進行處理后,發(fā)現(xiàn)n的取值一般在50以內(nèi),為了計算機處理的方便,我們?nèi)?0作為上限值。
上證綜合指數(shù),新上證綜指以及深證新指數(shù)的檢驗結(jié)果如表1所示。
表1 指數(shù)擬合結(jié)果
對上證綜合指數(shù)而言,第一個符合 {G(t+1)>60%||G(t+1)<40%}的數(shù)值出現(xiàn)在2006年12月11日,由于本文為了使擬合的泊松分布接近真實值,故要求在對第一個數(shù)據(jù)進行擬合之前至少有200天的交易,而初始數(shù)據(jù)是從2006年2月16日開始,故第一個數(shù)據(jù)的出現(xiàn)接近2006年年底。n值取42時,擬合評估函數(shù)F(n)取得最大值。當n值為42時,該天上證綜合指數(shù)收益率服從參數(shù)為23.67的泊松分布。根據(jù)股指漲跌概率推斷模型,上證綜合指數(shù)漲跌的概率G(t+1)為66.18%,上漲的概率比較高,而該天上證綜合指數(shù)實際增長率為1.76%,推斷正確。在所有符合{G(t+1)>60%||G(t+1)<40%}的日期里面,根據(jù)本文構建的模型判斷上證綜合指數(shù)漲跌與實際上證指數(shù)漲跌一致的占69.39%,說明該模型對上證綜合指數(shù)漲跌的預測具有一定的準確性。
對新上證綜指而言,第一個符合判別條件的數(shù)值出現(xiàn)在2006年12月11日。估計擬合函數(shù)F(n)取得最大值時,n值為18,該天收益率服從參數(shù)為12.33的泊松分布。根據(jù)股指收益率概率分布函數(shù),判斷該天新上證綜指漲跌的概率G(t+1)為78.55%,上漲的概率高,而該天新上證綜指實際增長率為1.85%,估計正確。在所有符合判別條件的日期里面,根據(jù)本文構建的模型判斷新上證指數(shù)漲跌與實際漲跌相同的占到72%,說明該模型對新綜指漲跌的預測具有一定的準確性。
對深證新指數(shù)而言,第一個符合 {G(t+1)>60% ||G(t+1)<40%}的數(shù)值出現(xiàn)在2006年12月11日,n值為21時,估計擬合函數(shù)F(n)取得最大值。該天服從參數(shù)為14的泊松分布,從而判斷該天深證新指數(shù)漲跌的概率G(t+1)為78.21%,上漲的概率比較高,而該天深證新指數(shù)實際增長率為0.2%,估計正確。在符合判斷條件的所有日期里面,根據(jù)模型判斷深證新指數(shù)漲跌的概率與實際漲跌概率一致的占到64.2%,說明該模型對深證新指數(shù)漲跌的預測具有一定的準確性。
在選取的三種指數(shù)中,預測準確度最低的是深證新指數(shù),為64.2%,但是其依然優(yōu)于呂琦采用支持向量機的預測準確度63.3%,說明該方法是可取的。
本文基于數(shù)據(jù)挖掘,構建了用于推斷股指漲跌概率的新模型。通過對上證指數(shù)、新綜指和深證新指數(shù)的實證檢驗表明該模型具有一定的準確性,其對新上證綜指的擬合程度最好。但是該模型具有一定的缺點,判別條件的要求比較高,故并不能對每天的股指漲跌進行預測,有待進一步的改進。
[1]Cheol-Ho P,Scott H.Irwin.What do we Know about the Profitability of Technical Analysis?[J].Journal of Economic Surveys,2007,21(4).
[2]Kim K,Won B L.Stock Market Prediction Using Artificial Neural Networks with Optimal Feature Transformation[J].Neural Comput&Applic,2004,(13).
[3]Liu W,Zhang W.Stochastic Volatility Model and Technical Analysis of Stock Price[J].Acta Mathematica Sinica,English Series,2004,27(7).
[4]鄧杰,唐國興.中國股票市場技術交易規(guī)則有效性的實證分析[J].華東經(jīng)濟管理,2009,(5).
[5]李莎,李紅剛.股票市場中技術分析有效性的實證研究[J].北京師范大學學報(自然科學版),2009,(2).
[6]雷鳴,葉五一,繆柏其,郭文旌.生存分析與股指漲跌的概率判斷[J].管理科學學報,2010,(4).
[7]呂琦.基于SVM的股票時間序列的預測研究[J].吉林工程技術師范學院學報,2009,(7).
[8]王志剛,曾勇,唐小我.中國股票市場技術分析非線性預測能力的實證檢驗[J].管理工程學報,2009,(1).