朱立云 劉媛華
摘? 要: 盈利能力也稱獲利能力,是指企業(yè)在一定時期內(nèi)獲取利潤的能力。利潤率越高,盈利能力就越強(qiáng)。針對中國影視業(yè)上市公司樣本規(guī)模較小,常規(guī)的預(yù)測方法難以奏效,文章嘗試運(yùn)用支持向量機(jī)來預(yù)測其盈利能力。首先從不同的角度選擇盈利能力單項指標(biāo),以此為基礎(chǔ)構(gòu)建反映公司盈利能力的集成指標(biāo),再運(yùn)用2007—2017中國A股影視業(yè)上市公司的數(shù)據(jù),構(gòu)建基于支持向量機(jī)的盈利能力預(yù)測模型,最后對影視公司的盈利能力進(jìn)行預(yù)測。研究結(jié)果顯示,經(jīng)過訓(xùn)練的支持向量機(jī)模型能比較成功地預(yù)測樣本公司的盈利能力,2009-2018的預(yù)測準(zhǔn)確率均超過80%。
關(guān)鍵詞: 影視業(yè)上市公司; 盈利能力預(yù)測; 主成分分析; 支持向量機(jī)
中圖分類號:F222.1? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ?文章編號:1006-8228(2019)12-33-05
Enterprise profitability forecast based on PCA and SVM
Zhu Liyun, Liu Yuanhua
(University of Shanghai for Science and Technology, Shanghai 200093, China)
Abstract: Profitability, also known as earnings-generating capacity, refers to the ability of an enterprise to make a profit in a certain period of time. The higher the profit rate, the stronger the profitability. In view of the small sample size of listed companies in China's film and television industry, and the conventional forecasting methods are difficult to work, this paper tries to use support vector machine to predict their profitability. Firstly, select the profitability single indicator from different angles, build the integration index reflecting the company's profitability based on this, and then use the data of 2007-2017 China A-share film and television listed company to build a profitability prediction model based on support vector machine. The profitability prediction model finally predicts the profitability of the film and television company. The research results show that the trained support vector machine model can successfully predict the profitability of sample companies, and the prediction accuracy of 2009-2018 is more than 80%.
Key words: listed companies in the film and television industry; profitability prediction; analysis of main components; support vector machine
0 引言
盈利能力預(yù)測屬于模式識別范疇。目前常用的模式識別方法包括數(shù)據(jù)挖掘、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)[1]。數(shù)據(jù)挖掘一般是指通過分析每個數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù)[2],對數(shù)據(jù)量有較高的要求。人工神經(jīng)網(wǎng)絡(luò)是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型[3],在樣本量充足的情況下,該模型識別效果較好。但它容易陷入局部最優(yōu)的困境。支持向量機(jī)是以一種基于統(tǒng)計學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險最小原理的模式識別方法,在解決小樣本模式識別問題上表現(xiàn)出很多特有的優(yōu)勢,并且通過核函數(shù)可以解決神經(jīng)網(wǎng)絡(luò)局部最優(yōu)的問題。
中國影視業(yè)上市公司的數(shù)量較少,只有25家,難以滿足數(shù)據(jù)挖掘和人工神經(jīng)網(wǎng)絡(luò)大樣本的要求。相比而言,支持向量機(jī)主要是針對小樣本進(jìn)行模式識別,便更適合。目前支持向量機(jī)方法主要應(yīng)用于投資風(fēng)險評價和企業(yè)信用評價等評價領(lǐng)域[4]。本文首次將其應(yīng)用于企業(yè)盈利能力預(yù)測,既擴(kuò)展了支持向量機(jī)的應(yīng)用范圍,同時也是對盈利能力分析的一種全新嘗試。要想比較準(zhǔn)確的預(yù)測盈利能力,選擇合適的反映盈利能力的指標(biāo)是很關(guān)鍵的。目前會計上常用的盈利能力指標(biāo)包括“資產(chǎn)收益率([X1])”、“凈資產(chǎn)收益率([X2])”、“成本費(fèi)用利用率([X3])”、“主營業(yè)務(wù)利潤率([X4])”、“每股收益([X5])”[5-6]等。上述五個指標(biāo)也從五個不同的角度反映了企業(yè)的盈利能力。然而不同角度的指標(biāo)在同一時期內(nèi)往往呈現(xiàn)不同的趨勢[7],僅憑單個指標(biāo)是很難客觀的評價企業(yè)的盈利能力的。因此,本文將采用主成分分析法構(gòu)建一個盈利能力的集成指標(biāo),以期解決單個指標(biāo)相互沖突的問題。由此,本文以中國影視業(yè)的上市公司為樣本,首先基于既有研究選擇反映盈利能力的單項指標(biāo),并采用主成分分析法創(chuàng)建集成指標(biāo);其次建立盈利能力預(yù)測的支持向量機(jī)模型;最后選取部分影視業(yè)上市公司為訓(xùn)練樣本,采用支持向量機(jī)模型對樣本進(jìn)行盈利能力預(yù)測訓(xùn)練,并得出結(jié)論。
1 盈利能力指標(biāo)的分析與構(gòu)建
1.1 數(shù)據(jù)來源
本文根據(jù)國泰安數(shù)據(jù)庫中國證監(jiān)會制訂的《上市公司行業(yè)分類指引》,選擇2007—2017年中國A股的影視業(yè)上市公司為樣本,共計25家,公司股票代碼均可查詢。
1.2 盈利能力單項指標(biāo)選擇
在既有研究的基礎(chǔ)上,本文分別從資產(chǎn)利用效率、股東權(quán)益、費(fèi)用控制、主營業(yè)務(wù)收益能力、股票投資回報這5個角度選擇反映上市公司盈利能力的單項指標(biāo),即[X1到X5]。選擇2007—2017年中國A股的影視業(yè)上市公司為樣本,對其盈利能力單項指標(biāo)進(jìn)行統(tǒng)計分析,得出均值,并將結(jié)果導(dǎo)入matlab,畫出各指標(biāo)的折線圖,結(jié)果見圖1-圖5。
分析圖1-圖5,可以清楚地看出以下幾點(diǎn):
⑴ 主營業(yè)務(wù)利潤率在2010年跌成負(fù)值,又返回到最高點(diǎn),說明企業(yè)在主營業(yè)務(wù)競爭力和產(chǎn)品定價上面都做了很大的調(diào)整;
⑵ 從2007-2017年,影視業(yè)的盈利能力起伏很大,尤其是衡量盈利能力最重要的兩個指標(biāo),資產(chǎn)收益率和凈資產(chǎn)收益率,在2011年到達(dá)一個較高的點(diǎn)后,一直降低,說明影視業(yè)整個行業(yè)的盈利能力在下降;
⑶ 成本費(fèi)用率和每股收益雖然有很大的起伏,但是總體上是上升的,這說明盈利能力在增強(qiáng);
由此可見,當(dāng)從不同角度分析影視業(yè)上市公司的盈利能力時,不同的單項指標(biāo)表現(xiàn)出不同的變化趨勢,有時候甚至?xí)贸鲎韵嗝艿慕Y(jié)論,很難憑借單個指標(biāo)對盈利能力做出總體判斷。因此,構(gòu)建一個集成指標(biāo)是很有必要的。
1.3 盈利能力集成指標(biāo)的構(gòu)建
由于不同原始指標(biāo)變量具有不同的量綱,數(shù)據(jù)之間缺乏可比性,直接比較沒有意義,也會得出錯誤的結(jié)論。因此,在利用主成分分析法構(gòu)建集成指標(biāo)時,首先須對單項指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理。具體做法是:先計算因子的特征值及其方差貢獻(xiàn)率;再根據(jù)方差貢獻(xiàn)率確定主成分因子;然后根據(jù)成分矩陣和特征值計算特征向量,并結(jié)合標(biāo)準(zhǔn)化的單項指標(biāo)數(shù)據(jù)確定主成分因子;最后將方差貢獻(xiàn)率作為系數(shù)對主成分因子進(jìn)行線性組合,得到集成指標(biāo)P。本文結(jié)合中國A股影視業(yè)上市公司2007—2017年的數(shù)據(jù)(共275個樣本。利用SPSS軟件對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,利用處理后的數(shù)據(jù)進(jìn)行因子分析,得到包含原始指標(biāo)所有信息的因子[Yi](i=1,2,…,5)。各個因子的特征值和方差貢獻(xiàn)率,如表1所示,因子對應(yīng)的成分矩陣如表2所示。
由表1可知,前三個因子[Y1]、[Y2]和[Y3]的累積方差貢獻(xiàn)率達(dá)到 89.787%,可以將其作為主成分因子。結(jié)合表2的成分矩陣,選取[Y1]、[Y2]和[Y3]的成分向量,利用公式⑴計算主成分特征向量。
其中,[Y*i]表示第i個主成分的特征向量(i=1, 2, 3);[Yi]是第i個主成分的成分向量(見表2);[][i]為第i個主成分的特征值(見表1)。按照公式⑴可計算出主成分[Y1]、[Y2]和[Y3]的特征向量,如表3所示。
以表3的主成分特征向量為系數(shù),可將每個主成分表達(dá)為標(biāo)準(zhǔn)化指標(biāo)的線性函數(shù),見式⑵-式⑷:
其中,ZX表示經(jīng)過標(biāo)準(zhǔn)化的單項指標(biāo)數(shù)據(jù)。
以表1的方差貢獻(xiàn)率為系數(shù),建立[Y1]、[Y2]和[Y3]與P的線性表達(dá)式如下:
再結(jié)合公司2007-2017年的數(shù)據(jù),便可計算出各年度影視業(yè)上市公司綜合盈利能力指標(biāo)均值,結(jié)果如下:
2007-2017年分別為-0.27、-0.41、-0.12、0.43、 0.32、0.27、0.15、0.04、0.27、0.30、0.42。
從上述結(jié)果可以看出2007-2009年公司總體盈利能力較差,而 2010—2017 年總體盈利能力較好。從2010-2013年,p均值一直在下降,說明這幾年影視業(yè)盈利能力下降,而從2014年開始,盈利能力起伏很大,說明該行業(yè)雖然盈利能力比之前增強(qiáng)了,但還不是很穩(wěn)定,管理層需要多多關(guān)注盈利的穩(wěn)定性。
2 構(gòu)建支持向量機(jī)模型
前面兩部分已經(jīng)計算出了各年度影視業(yè)盈利能力綜合指標(biāo)P,這部分的任務(wù)是構(gòu)造基于支持向量機(jī)模型來預(yù)測盈利能力。
基本思路
第一步,選擇適當(dāng)?shù)暮撕瘮?shù)和參數(shù)構(gòu)建支持向量機(jī)。前面提到,核函數(shù)是支持向量機(jī)的重要組成部分,可以解決人工神經(jīng)網(wǎng)絡(luò)局部最優(yōu)的問題。常用的核函數(shù)包括四種:線性核函數(shù)、多項式核函數(shù)、Sigmoid核函數(shù)和徑向基核函數(shù)(RBF)。目前大部分學(xué)者推薦使用RBF[8]。RBF模型包括兩個重要的參數(shù),懲罰參數(shù)C和核參數(shù)γ。參數(shù)的選擇是很重要的,因為參數(shù)選擇不當(dāng)將會嚴(yán)重影響最終的分類超平面。由于這兩個參數(shù)沒有什么規(guī)律可循,為了正確選擇參數(shù),學(xué)者們常使用網(wǎng)格與交叉驗證方法。本文利用 LIBSVM軟件包完成支持向量機(jī)的參數(shù)選擇工作[11];
第二步,建立訓(xùn)練樣本對支持向量機(jī)進(jìn)行預(yù)測訓(xùn)練。具體操作是:以影視業(yè)上市公司第t年和t+1年的數(shù)據(jù)作為訓(xùn)練樣本。將樣本公司第t年的5個盈利能力單項指標(biāo)作為支持向量機(jī)模型的輸入量;并對第t+1年的盈利能力進(jìn)行劃分。盈利能力集成指標(biāo)P大于0的劃分為+1,盈利能力集成指標(biāo)P小于0的劃分為-1,以+1和-1作為模型的輸出量,形成支持向量機(jī)預(yù)測模型的基本框架。再借助MATLAB統(tǒng)計軟件和 LIBSVM 軟件包對樣本進(jìn)行訓(xùn)練;
第三步,用前兩步訓(xùn)練好的模型來預(yù)測盈利能力。即將樣本公司第t+1年的5個盈利能力單項指標(biāo)輸入訓(xùn)練好的預(yù)測模型,根據(jù)輸出量預(yù)測其t+2年的綜合盈利能力。
3 影視業(yè)上市公司盈利能力預(yù)測
3.1 建立訓(xùn)練樣本
本文利用相鄰兩年的數(shù)據(jù)建立訓(xùn)練樣本對支持向量機(jī)進(jìn)行訓(xùn)練,將經(jīng)過訓(xùn)練的模型用來做下一年度盈利能力的預(yù)測。即2007-2017年的11年間,可建立10個訓(xùn)練組,利用這些訓(xùn)練組對模型進(jìn)行訓(xùn)練,可依次預(yù)測中國影視業(yè)上市公司2009-2018年盈利能力。例如:2007年和2008年中國A股影視業(yè)上市公司都只有6家。便以2007年的6家公司為訓(xùn)練樣本,將其按照A1-A6編號。再將2007年的5個單項盈利能力指標(biāo)作為輸入向量,擬合2008年的綜合盈能力狀況,分別輸出+1和-1。訓(xùn)練樣本的原始數(shù)據(jù)和訓(xùn)練結(jié)果如表4所示。
由表4可知,在2007年6個訓(xùn)練樣本中,盈利能力較差(集成指標(biāo)P大于0)的公司只有1家,盈利能力較差(集成指標(biāo)P小于0)的公司有5家;而訓(xùn)練的結(jié)果是6個樣本的模擬結(jié)果均為-1,即模型正確地判斷出了5家公司的盈利能力,說明支持向量機(jī)能對83.3%的訓(xùn)練樣本進(jìn)行正確分類。
表4是第一組訓(xùn)練樣本的結(jié)果。類似的,可建立其余九組訓(xùn)練樣本。
3.2? 預(yù)測盈利能力
本文使用2007年和2008年的數(shù)據(jù),預(yù)測樣本公司2009年的盈利能力。操作流程是將樣本公司2008年的5個單項盈利能力指標(biāo)作為輸入向量,利用訓(xùn)練好的支持向量機(jī)模型預(yù)測2009年的綜合盈利能力,原始數(shù)據(jù)和預(yù)測結(jié)果如表5所示。
表5中,P大于0的有1家,小于0的有5家,說明盈利能力較好的只有一家,盈利能力較差的有5家。支持向量機(jī)模型預(yù)測出6家公司的盈利能力都較差,準(zhǔn)確率達(dá)到了83.3%。
同理,可以預(yù)測出2010年到2018年的盈利能力,支持向量機(jī)預(yù)測準(zhǔn)確率如下:
2010-2018年分別為86.7%、88.2%、84.3%、 90.1%、92.3%、89.9%、91.2%、85.6%、87.4%。
上述結(jié)果表明2009-2018年支持向量機(jī)模型預(yù)測準(zhǔn)確率都高于了80%,說明該模型能比較成功地預(yù)測上市公司的盈利能力。
4 總結(jié)
由于影視業(yè)上市公司數(shù)量較少,不滿足神經(jīng)網(wǎng)絡(luò)大樣本的要求,本篇論文創(chuàng)新地運(yùn)用支持向量機(jī)來預(yù)測盈利能力。論文的總體框架是:先從資產(chǎn)利用效率、股東權(quán)益、費(fèi)用控制、主營業(yè)務(wù)收益能力、股票投資回報這五個角度選擇反映上市公司盈利能力的單項指標(biāo),即資產(chǎn)收益率、凈資產(chǎn)收益率、成本費(fèi)用利潤率、主營業(yè)務(wù)利潤率、每股收益,使用SPASS軟件構(gòu)造集成指標(biāo)P。再根據(jù)2007-2017年的數(shù)據(jù),建立基于支持向量機(jī)的盈利能力預(yù)測模型,并借助MATLABA對模型進(jìn)行訓(xùn)練。最后利用相鄰兩年的盈利能力預(yù)測樣本公司下一年的綜合盈利能力。結(jié)果表明,經(jīng)過訓(xùn)練的支持向量機(jī)模型準(zhǔn)確率都超過80%,能較為成功的預(yù)測樣本公司的盈利能力,因此會計人員在具體實(shí)務(wù)中,可以嘗試運(yùn)用該模型,從而降低工作量,節(jié)省時間。
參考文獻(xiàn)(References):
[1] PengX.TPMSVM:ANovel Twin Parametric - Margin SupportVector Machinefor Pattern Recognition[J].Pattern Recognition,2011,44(10).
[2] 穆瑞輝,付歡.數(shù)據(jù)挖掘概念與技術(shù)[M].數(shù)據(jù)挖掘:概念與技術(shù),2005.
[3] 范高鋒,王偉勝,劉純,等.基于人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測[J].中國電機(jī)工程學(xué)報,2008.28(34):118-123
[4] Chen J,JiangF,Huang Z,etal.Performance Evaluation for GEM Listed Companies Based on Support Vector Machine[J].International Journal of Applied Mathematics and Statistics,2013.45(15).
[5] Hoque Z.Measuring Divisional Performance in the Short-Run[J].Handbook of Cost & Management Accounting, 2012.
[6] Yasser Q R.Corporate Governance and Performance (ACase Study for Pakistani Communication Sector)[J].International Journal of Trade, Economics and Finance,2011.2(3).
[7] 張紅,林蔭,劉平.基于主成分分析的房地產(chǎn)上市公司盈利能力分析與預(yù)測[J].清華大學(xué)學(xué)報(自然科學(xué)版),2010.3.
[8] HuangG B,Saratchandran P,Sundararajan N.A generalized growing and pruning RBF (GGAP-RBF) neural network forfunction approximation[J].IEEE Transactions on Neural Networks,2005.16(1):57-67