[摘 要] 本文給出了財(cái)務(wù)評價(jià)指標(biāo)體系及其量化方法,利用支持向量機(jī)的分類能力建立財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的模型。對上市公司的財(cái)務(wù)數(shù)據(jù)進(jìn)行訓(xùn)練和評估,證明基于支持向量機(jī)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的可行性和實(shí)用性,實(shí)驗(yàn)表明支持向量機(jī)在小樣本情況下具有良好的非線性建模能力和泛化能力。
[關(guān)鍵詞] 財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警;支持向量機(jī)
[中圖分類號]F232;TP224.0[文獻(xiàn)標(biāo)識碼]A[文章編號]1673-0194(2008)18-0007-03
1 引 言
企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測是以企業(yè)相關(guān)信息為基礎(chǔ),通過設(shè)置并觀察一些敏感性財(cái)務(wù)預(yù)測指標(biāo)的變化,對企業(yè)可能面臨的財(cái)務(wù)危機(jī)實(shí)施預(yù)測。作為企業(yè)來講,在長期的運(yùn)營過程中累計(jì)的風(fēng)險(xiǎn),會(huì)持續(xù)傳導(dǎo)并影響企業(yè)的財(cái)務(wù)信息,最終形成財(cái)務(wù)危機(jī)。通過收集這類財(cái)務(wù)信息,運(yùn)用一定的方法分類、識別和評價(jià),就可以對企業(yè)的財(cái)務(wù)風(fēng)險(xiǎn)進(jìn)行預(yù)警,協(xié)助企業(yè)及早有效規(guī)避和分散財(cái)務(wù)風(fēng)險(xiǎn)。本文運(yùn)用支持向量機(jī)(Support Vector Machine,SVM),通過選取適當(dāng)?shù)念A(yù)警指標(biāo)獲取已知警情公司的預(yù)警數(shù)據(jù)來判別未知警情的新預(yù)警樣本。實(shí)驗(yàn)表明,支持向量機(jī)模型在預(yù)警精確度和遠(yuǎn)期預(yù)警能力上要好于傳統(tǒng)預(yù)警方法。
2 支持向量機(jī)技術(shù)
上市公司財(cái)務(wù)危機(jī)預(yù)警屬于小樣本問題。由于統(tǒng)計(jì)模型和神經(jīng)網(wǎng)絡(luò)都是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化準(zhǔn)則,所以在小樣本條件下,容易過度擬合,導(dǎo)致模型的泛化能力下降。因此近年來,諸多實(shí)證研究表明,在小樣本和高維條件下,SVM 結(jié)構(gòu)簡單,不僅具有良好的判別分類能力,而且具有良好的泛化能力。
支持向量機(jī)(Support Vector Machines,SVM)是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)之上的機(jī)器學(xué)習(xí)方法,其最大的特點(diǎn)是根據(jù)文獻(xiàn)[1]和[2]結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,盡量提高學(xué)習(xí)機(jī)的泛化能力,即由有限的訓(xùn)練集樣本得到小的誤差仍然能夠保證對獨(dú)立的測試集保持小的誤差。另外,由于支持向量算法是一個(gè)凸優(yōu)化問題,所以局部最優(yōu)解一定是全局最優(yōu)解,這是其他學(xué)習(xí)算法所不及的。將支持向量機(jī)應(yīng)用到客戶信用分析中,可在先驗(yàn)知識不足的情況下,仍然具有較好的分類能力。SVM建立在結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)之上,其主要思想是:對于一個(gè)給定的具有有限數(shù)量訓(xùn)練樣本的學(xué)習(xí)任務(wù),通過在原空間或經(jīng)投影后的高維空間中構(gòu)造最佳超平面,將給定的屬于兩個(gè)類別的訓(xùn)練樣本分開,構(gòu)造超平面的依據(jù)是兩類樣本對超平面的最小距離最大化,這意味著距超平面最近的異類向量之間的距離最大[3]。它的思想可用圖1說明,圖1描述的是兩類樣本線性可分的情形,圖中“○”和“+”分別代表兩類樣本。
最優(yōu)超平面決策函數(shù)為:
3 基于SVM 的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型
3. 1樣本選取
根據(jù)我國上市公司實(shí)際情況和有關(guān)政策規(guī)定,上市公司發(fā)生財(cái)務(wù)狀況異?;虬l(fā)生其他異常狀況,導(dǎo)致投資者對該公司前景難以判定,可能發(fā)生損害投資者利益的情形時(shí),上市公司自動(dòng)進(jìn)入ST板塊。其中,財(cái)務(wù)狀況異常指的是最近兩年連續(xù)虧損,或最近一年的每股凈資產(chǎn)低于每股面值。從以上規(guī)定可以看出,被特別處理(ST)的企業(yè)已經(jīng)陷入了較大的財(cái)務(wù)危機(jī)。因此,將ST類作為財(cái)務(wù)危機(jī)型企業(yè)的標(biāo)準(zhǔn)是現(xiàn)有條件下的最佳選擇。
本文實(shí)證分析中的原始的公司財(cái)務(wù)數(shù)據(jù)及財(cái)務(wù)比率數(shù)據(jù)來源于WIND資訊。考慮到我國ST制度運(yùn)作的實(shí)際情況,本文擬采用上市公司被ST前1~3年有關(guān)數(shù)據(jù)來預(yù)測當(dāng)年是否會(huì)被ST,選取的樣本分為學(xué)習(xí)樣本和檢驗(yàn)樣本。為了訓(xùn)練模型,從2005年和2006年的ST公司和非ST公司中隨機(jī)抽取60個(gè)作為學(xué)習(xí)樣本,另外隨機(jī)抽取80個(gè)作為檢驗(yàn)樣本,供模型進(jìn)行測試。
3. 2指標(biāo)體系的建立
由于企業(yè)財(cái)務(wù)預(yù)警研究的指標(biāo)選取缺乏具體的經(jīng)濟(jì)理論作指導(dǎo),公司被ST的本質(zhì)原因又不盡相同,很難用簡單的幾個(gè)財(cái)務(wù)比率對財(cái)務(wù)困境進(jìn)行充分描述,所以嘗試從不同的側(cè)面選取指標(biāo),以反映企業(yè)財(cái)務(wù)狀況的各個(gè)方面。指標(biāo)選取遵循以下基本原則:
(1)以往研究中普遍使用,并被證明是有效的;
(2)數(shù)據(jù)能從資產(chǎn)負(fù)債表、損益表以及現(xiàn)金流量表中獲得,計(jì)算相對簡便;
(3)選取相對指標(biāo),排除企業(yè)規(guī)模的影響;
(4)考慮現(xiàn)金流量指標(biāo)的重要性。
按照以上選取原則,采用傳統(tǒng)財(cái)務(wù)指標(biāo)和現(xiàn)金流量信息相結(jié)合的方法,從企業(yè)盈利能力、償債能力、營運(yùn)能力、發(fā)展能力、現(xiàn)金流量能力5方面,選取了18個(gè)財(cái)務(wù)指標(biāo):
(1)盈利能力指標(biāo):每股收益(x1),資產(chǎn)收益率(x2),銷售凈利率(x3),權(quán)益凈利率(x4);
(2)償債能力指標(biāo):流動(dòng)比率(x5),速動(dòng)比率(x6),資產(chǎn)負(fù)債率(x7),權(quán)益負(fù)債比(x8);
(3)營運(yùn)能力指標(biāo):總資產(chǎn)周轉(zhuǎn)率(x9),應(yīng)收賬款周轉(zhuǎn)率(x10),存貨周轉(zhuǎn)率(x11);
(4)發(fā)展能力指標(biāo):銷售增長率(x12),權(quán)益增長率(x13),主營業(yè)務(wù)利潤增長率(x14);
(5)現(xiàn)金流量指標(biāo):現(xiàn)金凈利潤比率(x15),現(xiàn)金流動(dòng)負(fù)債比率(x16),現(xiàn)金總負(fù)債比率(x17),每股凈資產(chǎn)(x18)。
將上市公司分為兩組,第1組包含ST公司,認(rèn)為該類企業(yè)具有較大的財(cái)務(wù)風(fēng)險(xiǎn)。非ST公司作為第2組,認(rèn)為該類企業(yè)財(cái)務(wù)狀況正常。若模型將ST組樣本判為非ST組,則稱為犯第1類錯(cuò)誤;若將非ST組樣本判為ST組,則稱為犯第2類錯(cuò)誤。
3. 3SVM模型構(gòu)造
根據(jù)上述的分析,構(gòu)造了樣本集(x,y),其中x的維數(shù)為8,y是樣本的類別屬性,對于財(cái)務(wù)狀況正常的公司y=1,對于財(cái)務(wù)風(fēng)險(xiǎn)大的公司y=-1。SVM 中不同的內(nèi)積核函數(shù)將形成不同的算法,目前研究最多的核函數(shù)主要有多項(xiàng)式函數(shù)、徑向基函數(shù)、Sigmoid 函數(shù)3種。手寫數(shù)字識別實(shí)驗(yàn)表明,采用上述3種不同核函數(shù)的SVM能得到性能相近的結(jié)果,且支持向量的分布差別不大。對于具體問題,如何選擇核函數(shù)目前還沒有一般性的方法。本文構(gòu)造的SVM模型的內(nèi)積核函數(shù)采用最常用的多項(xiàng)式函數(shù)和徑向基函數(shù):
K(x,xi)=[(x·xi)+ c]q;
K(x,xi)= exp(-| x-xi| 2/σ2)。
綜合考慮最少錯(cuò)分樣本數(shù)和最大分類間隔,在高維空間中構(gòu)造軟間隔。σ2,c 等參數(shù)采用交叉驗(yàn)證方法(Cross Validation,CV)確定,進(jìn)行實(shí)驗(yàn)分析。
4 實(shí)驗(yàn)結(jié)果
SVM 中不同的內(nèi)積核函數(shù)將形成不同的算法,本例分別選取多項(xiàng)式核函數(shù)和徑向基函數(shù)分別訓(xùn)練SVM,并對實(shí)驗(yàn)結(jié)果進(jìn)行比較。設(shè)定懲罰因子c=1 000,開發(fā)工具使用MATLAB 6.0 。
4. 1多項(xiàng)式核函數(shù)
(1)取多項(xiàng)式核函數(shù)為:K(x,xi)= [(x·xi)+10]2時(shí),實(shí)驗(yàn)結(jié)果如表1所示。
(2)取多項(xiàng)式核函數(shù)為:K(x,xi)=[(x·xi)+10]1時(shí),實(shí)驗(yàn)結(jié)果如表2所示。
當(dāng)多項(xiàng)式核函數(shù)中參數(shù)c 固定,q=1 時(shí)有較高的識別率。
4. 2徑向基核函數(shù)
(1)取徑向基核函數(shù)為:K(x,xi)= exp(-| x-xi|2/0.7)時(shí),實(shí)驗(yàn)結(jié)果如表3所示。
(2)取徑向基核函數(shù)為:K(x,xi)= exp(-| x-xi|2/0.1)時(shí),實(shí)驗(yàn)結(jié)果如表4所示。
當(dāng)徑向基核函數(shù)中參數(shù)σ取不同值時(shí)有不同的識別率,σ2= 0.1 比σ2 = 0.7 有高的識別率。
而用相同的樣本集訓(xùn)練BP人工神經(jīng)網(wǎng)絡(luò)(ANN),其實(shí)驗(yàn)結(jié)果如表5所示。
相對于BP神經(jīng)網(wǎng)絡(luò)而言,SVM具有較高的識別效果。實(shí)驗(yàn)表明,采用上述兩種核函數(shù),包括兩層神經(jīng)網(wǎng)絡(luò)Sigmoid核函數(shù)的SVM 能得到性能相似的結(jié)果,且支持向量的分布差別不大。對于具體問題,如何選擇核函數(shù)目前還沒有一般性的方法[4-6]。
5 結(jié)束語
SVM是一種有堅(jiān)實(shí)理論基礎(chǔ)的新穎的小樣本學(xué)習(xí)方法,其最終決策函數(shù)只由少數(shù)的支持向量所確定。該方法具有較好的“魯棒”性,例如增加或者刪除非支持向量樣本時(shí)對模型沒有影響,在有些成功的應(yīng)用中,SVM對核的選取不敏感。將SVM 應(yīng)用到財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警中,比傳統(tǒng)方法更簡單、有效,具有更好的泛化能力。SVM不僅可以用于兩分類問題,而且可以推廣到更為復(fù)雜的多分類的問題上。
主要參考文獻(xiàn)
[1] V N Vapnik. 統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M]. 張學(xué)工譯. 北京:清華大學(xué)出版社,2000.
[2] N V Vapnik. Statistical Learning Theory [M]. NY: Wiley,1995.
[3] 張學(xué)工. 關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J]. 自動(dòng)化學(xué)報(bào),2000,26(1):32-42.
[4] 劉閩,林成德. 基于支持向量機(jī)的商業(yè)銀行信用風(fēng)險(xiǎn)評估模型[J]. 廈門大學(xué)學(xué)報(bào):自然科學(xué)版,2005,44(1):29-32.
[5] 孫華麗,謝劍英,薛耀鋒. 基于支持向量機(jī)的物流服務(wù)顧客滿意度評價(jià)模型[J]. 上海交通大學(xué)學(xué)報(bào),2006(4).
[6] 張麗霞,施國慶. 基于支持向量機(jī)的工程項(xiàng)目風(fēng)險(xiǎn)預(yù)測研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2005(21).
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文