趙豐云 王宗威 汪 舜 張世濤
(安徽工業(yè)大學數(shù)理科學與工程學院,安徽 馬鞍山 243002)
股票投資價值的一種基于層次聚類的實證研究
趙豐云 王宗威 汪 舜 張世濤
(安徽工業(yè)大學數(shù)理科學與工程學院,安徽 馬鞍山 243002)
針對上市公司的基本面情況分析,構(gòu)建了較為全面的綜合評價指標體系。定義了上市公司股票間“相似程度”的一種度量,基于該度量提出了一種新的層次聚類算法對樣本股票進行聚類,然后通過聚類結(jié)果來分析投資價值確定投資品種或范圍。最后,選取上證30指數(shù)27家上市公司股票進行實證研究,結(jié)果表明所提聚類方法對指導證券投資是實用有效的。
股票;相似度;層次聚類;投資價值
隨著人們金融投資意識日益增強,股市日益成為眾多投資者選擇。投資者一直以來使用基本面分析和技術(shù)分析的方法進行投資決策,這些方法對實踐投資中有一定的指導作用,但是在受許多因素影響的上市公司股票市場中,把握準確的選股標準,僅靠這兩種分析方法是不夠的。通常有效的投資組合均由高質(zhì)量的股票所構(gòu)成,如何從擁有眾多股票的股票市場中甄別出投資價值優(yōu)良的高質(zhì)量股票,一直以來是投資價值分析過程中的一個重要環(huán)節(jié)[1-2]。一般來說,高質(zhì)量股票的選取經(jīng)常依賴股票的分類。股票合理分類實現(xiàn)的難度主要表現(xiàn)在:第一,股票市場數(shù)據(jù)龐大,計算復雜度較大;第二,股票的評價指標繁多且含義不同,分類的標準難以統(tǒng)一確定;第三,投資者對股票的先驗性知識不足,加大選擇的主觀性。因此,僅通過上市公司的基本面分析和技術(shù)分析,投資者很難在有限的時間、有限成本內(nèi)對上市公司股票進行有效分類,更無從談起對上市公司投資價值的進一步分析。
近來,一些學者在基本證券投資分析方法(基本面和技術(shù)分析)的基礎(chǔ)上結(jié)合了一些統(tǒng)計方法深入挖掘了股票的投資價值信息,取得了一些有意義的結(jié)果。例如,文獻[3]應用聚類分析和因子分析對汽車及配件行業(yè)的上市公司進行了綜合分析,把上市公司區(qū)分為藍籌股、績優(yōu)股、一般股和劣質(zhì)股,與公司的實際情況相符。文獻[4]首先建立了完善的綜合評價指標體系,然后通過聚類分析模型來確定投資范圍和投資價值。文獻[5]利用38家中小企業(yè)板上市公司會計和財務數(shù)據(jù),運用聚類分析和判別分析方法對其盈利、成長和擴張能力進行定量分析研究,并據(jù)此歸結(jié)出整個板塊股票的分類及其特點。文獻[6]結(jié)合核主元分析和K-均值聚類構(gòu)造核主元聚類方法對上市公司股票進行了分類,并選擇了滬深股市中20支上市公司股票來進行實證分析,結(jié)果表明聚類方法有效適用,為上市公司股票分類和評估提供了很好的依據(jù)。
考慮到在上市公司樣本股票容量較大時,無監(jiān)督學習的層次聚類過程操作簡單且可實現(xiàn)程度較高,在一定的時間成本限制內(nèi)該法對樣本股票分類相對有效?;诖?,本文試圖建立股票間的一種相似性度量,基于該度量運用多元統(tǒng)計分析[7]中的層次聚類算法對上市公司的股票進行分類,通過分類幫助投資者了解并把握股票的總體特征,鎖定一定的投資范圍,降低投資風險。為了驗證本文提出的聚類分析方法在股票市場分析中的準確性及實用性,本文選取上證30指數(shù)27家上市公司的股票進行實證研究,基于聚類方法確定最佳的股票投資類別,從而為投資者提供一些投資參考。
基于上市公司基本面情況,盈利能力和成長性是支持股價的長期因素,也是判斷公司是否具備投資價值的根本所在。所以在上市公司會計和財務指標中,選取了較能反映這些能力的5項重要指標[8-9]。列表如下:
在聚類分析前,為消除原始數(shù)據(jù)量綱和數(shù)量級的差異對結(jié)果的影響,采用標準差變換和極差變換將指標值原始數(shù)據(jù)進行標準化,將數(shù)據(jù)壓縮到[0,1]區(qū)間上,以便構(gòu)造相似矩陣。設有n個樣本股,m個指標,每個樣本股都有m個指標的觀測值,設第i個樣本股第j個指標的觀測值為xij。首先,將第i個樣本股的第j個指標值進行標準差變換,即
其次,采用極差變換法將標準差變換后的數(shù)據(jù)壓縮到[0,1]區(qū)間上,即
定義1 兩樣本股ei與ej的相似度可定義為:
定理1 定義1給出的樣本股相似度滿足以下性質(zhì):
(1)(規(guī)范性)0≤ε(ei,ej)≤1;
(2)(自反性)ε(ei,ej)=1;
(3)(對稱性)ε(ei,ej)=ε(ej,ei);
(4)(接近性)樣本股ei和ej的性質(zhì)越接近,ε(ei,ej)值越大,反之值越小。
考慮到層次聚類法[11-12]的優(yōu)勢,如,不需要預先制定聚類數(shù),此外,還可發(fā)現(xiàn)類的層次關(guān)系等。為此,我們基于上述定義的相似度,采用層次聚類算法對樣本股票進行分類。
首先,根據(jù)定義1計算兩兩樣本股的相似度,得上三角相似度矩陣∏,
若Gp與Gq合并成新類Gr,則任一類Gk與Gr間的類相似度為:
基于類相似度對n個樣本股進行層次聚類,具體算法(記為算法1)步驟如下:
步驟1:將每個指標看作一類,共n類,計算兩兩指標之間的相似度,得初始類相似度矩陣∏,易知ε(Gp,Gq)=ε(ep,eq)。記L(0)=∏。
步驟2:選L(0)中對角線元素以外的最大元素,設其為ε(Gp,Gq),將Gp與Gq合并成新類Gr={Gp,Gq},據(jù)式(5)計算新類Gr與其它類Gk(k≠p,q)的類相似度ε(Gk,Gr)。劃去L(0)中所在的第p,q行及第p,q列,將新類Gr作為新行和新列,得到新的類相似度矩陣L(1)。
步驟3:由L(1)出發(fā),重復Step2得到上三角矩陣L(2),依此類推,直到s個決策者聚為一個大類為止。
步驟4:繪聚類譜系圖,給定類相似度閾值T確定類的個數(shù)。
注:若L(k)中最大元素不唯一,對應最大元素的類同時合并,每合并兩類,矩陣L(k)降低一階。
選取上證30指數(shù)中27家上市公司,依據(jù)2012年度證券報告查看其各項財務指標。對影響公司股價因素的盈利能力、成長能力指標收集數(shù)據(jù)信息(數(shù)據(jù)來源:銳思數(shù)據(jù)http://www.resset.cn/cn/;截止日期:2012-12-31)并對原始數(shù)據(jù)進行標準化預處理(方法見本文第二部分)。原始數(shù)據(jù)見附件中的表1,預處理后的數(shù)據(jù)見表2。
步驟1:據(jù)表2和公式(3)求解上市公司兩樣本股股票間的相似度,可得相似矩陣∏(略);
步驟2:據(jù)相似矩陣∏利用軟件Matlab編程實現(xiàn)算法1得聚類樹狀圖(見圖1);
步驟3:取閾值T=0.65,據(jù)圖1可將27只股票分為四類。為方便起見,不妨記表1中序號為i(i=1,2,…,27)的個股代號為ei,則具體分類結(jié)果見表3;
為進一步地觀察分類個股的盈利和成長能力,計算了每類5個指標值的均值,列表如下:
表3和表4可看出,
(1)在聚類分析中的第4類(14號),綜合評價各項指標值的均值相比其他類都很顯著,14號對應的青島海爾,主營家電,地處青島,投資環(huán)境優(yōu)良;自上市以來,企業(yè)的經(jīng)營業(yè)績保持穩(wěn)步增長,是市場公認的藍籌股。
(2)聚類分析中劃分為第2類的公司:五礦發(fā)展、江南重工、上海石化,受國際能源和資源環(huán)境的影響以及內(nèi)部管理上的不足,這類公司近期既沒有規(guī)模效益,也沒有在主營業(yè)務上業(yè)績突出,在投資效益上虧損,近期表現(xiàn)為劣質(zhì)股的特征。
(3)每股收益、凈資產(chǎn)收益率這兩個指標是投資者最為關(guān)注的指標,它們是衡量公司獲利能力和成長性最好的指標。例如凈資產(chǎn)收益率,在一定的凈資產(chǎn)條件下,能夠產(chǎn)生更高的利潤,而當公司將利潤留存用作發(fā)展時,就可使公司的凈資產(chǎn)大幅度增加;如果較高的凈資產(chǎn)收益率能夠維持,公司后續(xù)年度的收益將呈幾何級數(shù)地增長,相應股東的財富也同步增加。因此,第3類公司從股東的角度來看,投資效率較高,表現(xiàn)為績優(yōu)股的特征。
(4)聚類分析中劃分為第1類的公司,各項綜合指標值不是很突出,特別是主營業(yè)務收入增長率不足,表明這類公司在行業(yè)內(nèi)發(fā)展的態(tài)勢不明顯,規(guī)模效益和投資效率突出呈現(xiàn)虛高,表現(xiàn)為一般股的特征。
通過對上市公司基本面情況的分析,構(gòu)建了較為全面的綜合評價指標體系,定義了衡量樣本股票“相似程度”的度量,提出了一種基于樣本股票相似度的層次聚類算法,運用該聚類方法把上證30指數(shù)27家上市公司區(qū)分為藍籌股、績優(yōu)股、一般股和劣質(zhì)股,結(jié)合公司基本面狀況分類分析他們的投資價值。實證表明,本文采用的分析方法為股票的分析和選擇提供了一條很好的途徑。
[1]李云飛,惠曉峰.基于支持向量機的股票投資價值分類模型研究[J].中國軟科學,2008,(1)∶135-140.
[2]Elton E.J.,Gruber M.J.,Brown S.J.,et al.Modern portfolio theory and investment analysis[M].John Wiley&Sons,2009.
[3]柯冰,錢省三.聚類分析和因子分析在股票研究中的應用[J].上海理工大學學報,2002,(4)∶371-374.
[4]周焯華,陳文南,張宗益.聚類分析在證券投資中的應用[J].重慶大學學報,2002,(7)∶122-126.
[5]陶冶,馬健.基于聚類分析和判別分析方法的股票投資價值分析——關(guān)于中小企業(yè)板的初步研究[J].財經(jīng)理論與實踐,2005,(138)∶45-48.
[6]余樂安,汪壽陽.基于核主元聚類的股票分類[J].系統(tǒng)工程理論與實踐,2009,(12)∶1-8.
[7]何曉群.多元統(tǒng)計分析[M].北京∶中國人民大學出版社,2012.
[8]嚴俊,王鐘.上市公司投資價值綜合評價指標體系及評價[J].數(shù)學的實踐與認識,2001,(4)∶394-398.
[9]郭顯光.上市公司市場價值評價分析[J].數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,2001,(11)∶94-97.
[10]白雪.聚類分析中的相似性度量及其應用研究[D].北京∶北京交通大學,2012.
[11]Mirzaei A.,Rahmati M.&Ahmadi M.A new method for hierarchical clustering combination[J].Intelligent data analysis,2008,(6)∶549-571.
[12]Wu J.,Xiong H.&Chen J.Towards understanding hierarchical clustering∶A data distribution perspective[J].Neurocomputing,2009,(10)∶2319-2330.
責任編輯:陳 侃
附件:
AN EMPIRICAL STUDY OF STOCK INVESTMENT VALUE BASED ON HIERARCHICAL CLUSTERING
ZHAO Feng-yun WANG Zong-weiWANG Shun ZhANG Shi-tao
(School of Mathematics,Physics and Engineering,Anhui University of Technology,Ma'anshan Anhui 243002)
A more comprehensive evaluation index system is constructed based on the analysis of the basic situation of listed companies.A measure of the similarity degree on the stocks of limited companies is defined.Based on the measure,a new hierarchical clustering algorithm is proposed to cluster the sample stocks.Then the results of clustering are used to analyze the investment value and determine investment products or range.Finally,empirical studies on 27 shares of listed companies from the SSE 30 Index are carried out.The results show that the proposed clustering method to guide investment in securities is practical and effective.
stocks;similarity degree;hierarchical clustering;investment value
O212.4
A
1672-2868(2015)06-0014-07
2015-03-05
安徽工業(yè)大學青年科研基金(項目編號:QZ201018);安徽工業(yè)大學大學生創(chuàng)新訓練項目(項目編號:201410360094)
趙豐云(1994-),男,安徽阜陽人。安徽工業(yè)大學數(shù)理科學與工程學院,碩士研究生。研究方向:應用數(shù)學。