黃 迅,張 穎,林 宇
(成都理工大學(xué) 商學(xué)院,成都 610059)
強(qiáng)化財(cái)務(wù)危機(jī)識(shí)別能力、提高財(cái)務(wù)危機(jī)預(yù)測(cè)精度、增強(qiáng)財(cái)務(wù)危機(jī)控制效果,不僅是廣大上市公司時(shí)刻關(guān)注的重要問(wèn)題,更是維護(hù)整個(gè)國(guó)家經(jīng)濟(jì)健康、穩(wěn)定、持續(xù)發(fā)展的關(guān)鍵環(huán)節(jié)。尤其對(duì)我國(guó)海外上市公司而言,盡管它們與國(guó)內(nèi)上市公司一樣同為推動(dòng)我國(guó)經(jīng)濟(jì)發(fā)展的重要力量,然而隨著經(jīng)濟(jì)全球化的發(fā)展,我國(guó)海外上市公司面臨著比國(guó)內(nèi)上市公司更為復(fù)雜的經(jīng)濟(jì)環(huán)境[1],來(lái)自財(cái)務(wù)危機(jī)的壓力與挑戰(zhàn)也就會(huì)大大超過(guò)國(guó)內(nèi)上市公司。因此,建立科學(xué)有效的財(cái)務(wù)危機(jī)預(yù)警模型,對(duì)于我國(guó)海外上市公司成功地防范與化解財(cái)務(wù)危機(jī),從而促進(jìn)經(jīng)濟(jì)的穩(wěn)定與繁榮具有重要意義。
長(zhǎng)期以來(lái),上市公司財(cái)務(wù)危機(jī)預(yù)警多以Z-Score多元判別分析(MDA)模型[2]、邏輯(Logit)回歸模型[3,4]、概 率 比 (Probit)回 歸 模 型[5]、KLR 信 號(hào) 模型[6]、主成分分析(PCA)模型[7]等傳統(tǒng)的統(tǒng)計(jì)模型以及神經(jīng)網(wǎng)絡(luò)(Neural Networks)[8,9]等人工智能模型為主。雖然這些模型具有較強(qiáng)的泛化(Generalization)與容錯(cuò)性能,也取得了較好的研究效果并被實(shí)務(wù)界廣泛應(yīng)用[10],但是這些模型卻都存在前提條件過(guò)于苛刻、過(guò)學(xué)習(xí)(Over Fitting)、欠學(xué)習(xí)(Under Fitting)、局部極?。↙ocal Minimization)等諸多問(wèn)題[11]。為了彌補(bǔ)以上模型存在的缺陷,Vapnik提出了一種支持向量機(jī)(SVM)模型[12]。它是基于統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化(Structural Risk Minimization,SRM)原則發(fā)展起來(lái)的一種新的機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘模型,能夠有效地克服以上模型存在的過(guò)學(xué)習(xí)、欠學(xué)習(xí)以及局部極小等問(wèn)題,具有自適應(yīng)性等優(yōu)越的學(xué)習(xí)能力與泛化推廣能力[13,14]?;诖耍疚倪\(yùn)用SVM模型對(duì)我國(guó)海外上市公司財(cái)務(wù)危機(jī)預(yù)警進(jìn)行研究。
但需要指出的是,SVM財(cái)務(wù)危機(jī)預(yù)警模型的預(yù)測(cè)能力是否優(yōu)越,在很大程度上取決于選擇的核函數(shù)(Kernel Function)[15]。但令人遺憾的是,目前還沒(méi)有通用的核函數(shù)選擇方法。不過(guò),令人欣慰的是,已有學(xué)者利用最為常用的四種核函數(shù),即線性(Linear)、多項(xiàng)式(Polynomial)、徑向基(Radial Basis)和神經(jīng)元的非線性作用(Sigmoid)核函數(shù),分別構(gòu)建SVM財(cái)務(wù)危機(jī)預(yù)警模型,并對(duì)其分類準(zhǔn)確率進(jìn)行比較,從而將基于使得分類準(zhǔn)確率達(dá)到最高的核函數(shù)而建立起來(lái)的SVM模型確定為最終將要采用的預(yù)警模型[14,16]。鑒于此,本文也利用以上最為常用的四種核函數(shù),分別建立我國(guó)海外上市公司的SVM財(cái)務(wù)危機(jī)預(yù)警模型并進(jìn)行性能驗(yàn)證與評(píng)價(jià),從中探索出一種具有最優(yōu)學(xué)習(xí)能力與泛化推廣能力的預(yù)警模型。
還需值得注意的是,海外上市公司財(cái)務(wù)數(shù)據(jù)往往呈現(xiàn)高相關(guān)性特征,從而容易引發(fā)數(shù)據(jù)冗余問(wèn)題,導(dǎo)致SVM財(cái)務(wù)危機(jī)預(yù)警模型的預(yù)測(cè)精度大大降低[17]。而據(jù)周子 英等研 究成果[18],PCA 方法能 夠有效地解決財(cái)務(wù)數(shù)據(jù)之間因具有高相關(guān)性特征而造成的數(shù)據(jù)冗余問(wèn)題。因此,本文在構(gòu)建海外上市公司的SVM財(cái)務(wù)危機(jī)預(yù)警模型之前,還將引入PCA方法消除數(shù)據(jù)之間的高相關(guān)性特征,以提高模型的學(xué)習(xí)能力與泛化推廣能力。
基于以上認(rèn)識(shí)與分析,本文以我國(guó)海外上市公司為研究對(duì)象,運(yùn)用PCA方法提取出對(duì)財(cái)務(wù)危機(jī)具有顯著影響的特征指標(biāo),以此作為輸入變量并運(yùn)用SVM方法對(duì)我國(guó)海外上市公司財(cái)務(wù)危機(jī)預(yù)警進(jìn)行研究,尤其重點(diǎn)探討不同核函數(shù)對(duì)預(yù)警模型性能的影響,最終探索出一種具有最優(yōu)學(xué)習(xí)能力與泛化推廣能力的預(yù)警模型,并提出相應(yīng)對(duì)策建議,為國(guó)家相關(guān)決策部門提供決策參考依據(jù),為海外上市公司的管理層提供決策借鑒,為廣大投資者合理投資提供科學(xué)指導(dǎo)。
支持向量機(jī)是由Vapnik最先提出的,其主要思想是建立一個(gè)分類超平面(the Separating Hyperplane)作為決策曲面,最大化正例與反例之間的隔離邊緣。如圖1所示,空心點(diǎn)和實(shí)心點(diǎn)分別代表兩類樣本,H為分類超平面,H1、H2分別代表過(guò)兩類樣本中離分類超平面H最近的樣本且平行于H的超平面。它們到H的距離相等,并且這兩個(gè)超平面之間的距離叫做分類間隔(margin)。所謂的最優(yōu)分類面(the Optimal Separating Hyperplane)就是不但能將兩類樣本準(zhǔn)確無(wú)誤地分開(即訓(xùn)練錯(cuò)誤率為0),而且能使分類間隔達(dá)到最大的超平面。
圖1 最優(yōu)分類面示意圖
考慮到SVM的最大優(yōu)勢(shì)在于解決非線性不可分問(wèn)題,本文將主要討論該類問(wèn)題。假設(shè)海外上市公司樣本集為 (xi,yi),其中i=1,2,…,n,表示海外上市公司數(shù)量為n。xi=(xi1,xi2,…,xid)是d維特征指標(biāo)向量,表示每家海外上市公司擁有d項(xiàng)財(cái)務(wù)比率指標(biāo)。,其定義為:公司發(fā)生危機(jī)屬于正類,用“+1”表示,公司未發(fā)生危機(jī)屬于負(fù)類,用“-1”表示。用數(shù)學(xué)模型為:
其中,D表示樣本處于危機(jī)狀態(tài),D表示樣本處于非危機(jī)狀態(tài)。此時(shí),在給定公司樣本集(xi,yi)的前提條件下,構(gòu)建SVM危機(jī)預(yù)警模型旨在尋找一個(gè)能夠?qū)l(fā)生危機(jī)和未發(fā)生危機(jī)的樣本點(diǎn)正確分類的最優(yōu)超平面。在的條件下,尋找最優(yōu)分類面可以轉(zhuǎn)化為求解如下最優(yōu)問(wèn)題:
其中,w是可調(diào)權(quán)值向量,b是偏置向量,ξi是非負(fù)的松弛變量(Slack Variable),其作用是適當(dāng)?shù)亍败浕奔s束條件,允許樣本錯(cuò)分情況的存在。換言之,允許樣本錯(cuò)分就是允許將發(fā)生危機(jī)的公司誤判為未發(fā)生危機(jī)的公司,或?qū)⑽窗l(fā)生危機(jī)的公司誤判
其中,α為引入的非負(fù)的拉格朗日乘子。根據(jù)Wolf對(duì)偶(Wolf Dual)定理,對(duì)L 關(guān)于w ,b,ξ求極大:
得到:
然后將上述式(7)、式(8)、式(9)中的極值條件代入式(3)中的拉格朗日函數(shù)中,并對(duì)α求極大,得到對(duì)偶(Dual)問(wèn)題:
其中,K(xi,xj)是為了克服維數(shù)災(zāi)難(Curse of Dimensionality)而引入的核函數(shù)(Kernel Function),下文將會(huì)對(duì)核函數(shù)作具體介紹。
再將式(4)、式(5)、式(6)中的對(duì)偶問(wèn)題轉(zhuǎn)化為求極小,便得到最終的對(duì)偶問(wèn)題:
其中,sgn( )為符號(hào)函數(shù),w*為權(quán)向量,b*為分類閾值(Threshold)。
基于上述SVM預(yù)警模型的構(gòu)建可知,采用適當(dāng)?shù)膬?nèi)積(Inner Product)核函數(shù) K(xi,xj)來(lái)替代原空間中的內(nèi)積 (xi,xj),既可以實(shí)現(xiàn)非線性變換后的線性分類,又避免了維數(shù)災(zāi)難的發(fā)生。維數(shù)災(zāi)難之所以產(chǎn)生,是因?yàn)榈途S空間線性不可分的模式盡管通過(guò)非線性映射到高維特征空間后實(shí)現(xiàn)了線性分類,卻同時(shí)也造成了維數(shù)越高、計(jì)算量越大的問(wèn)題,而借助核函數(shù)技術(shù)就能夠有效地解決“維數(shù)災(zāi)難”問(wèn)題[19]。核函數(shù)的形式有多種,采用不同的核函數(shù)將產(chǎn)生不同的支持向量機(jī),形成不同的分類預(yù)警方法。常見的核函數(shù)有:
盡管上文通過(guò)SVM方法構(gòu)建出了海外上市公司財(cái)務(wù)危機(jī)預(yù)警模型,然而,海外上市公司財(cái)務(wù)數(shù)據(jù)往往呈現(xiàn)高相關(guān)性特征,從而容易引發(fā)數(shù)據(jù)冗余問(wèn)題,導(dǎo)致SVM財(cái)務(wù)危機(jī)預(yù)警模型的預(yù)測(cè)精度大大降低,而PCA方法正好能夠有效地解決財(cái)務(wù)數(shù)據(jù)之間因具有高相關(guān)性特征而造成的數(shù)據(jù)冗余問(wèn)題[18]。因此,本文在構(gòu)建海外上市公司的SVM財(cái)務(wù)危機(jī)預(yù)警模型之前,還將引入PCA方法消除數(shù)據(jù)之間的高相關(guān)性特征,從而提升模型的學(xué)習(xí)能力與泛化推廣能力。
在本文中,對(duì)于每一個(gè)具有d維特征指標(biāo)的公司而言,其特征指標(biāo)為xj,j=1,2,…,d,表示公司的第j項(xiàng)特征指標(biāo)。于是,對(duì)公司的特征指標(biāo)便展開如下的PCA分析:
(1)計(jì)算方差-協(xié)方差矩陣:
其中
在式(19)中,xti和xtj分別表示第t家公司的第i項(xiàng)和第j項(xiàng)特征指標(biāo);Ε(xi)和Ε(xj)分別表示第i項(xiàng)和第j項(xiàng)特征指標(biāo)的均值,i、j=1,2,…,d。
其中,設(shè)λ1≥λ2≥…≥λd,稱F1為第1個(gè)主成分,同理,F(xiàn)d為第d個(gè)主成分。
(4)若取前p(p≤d)個(gè)主成分,則F1、F2、…,F(xiàn)p的累計(jì)貢獻(xiàn)率為:
其中,第一主成分F1的貢獻(xiàn)率最大,這表明F1綜合公司特征指標(biāo)x1、x2、…、xd的能力最強(qiáng),依此類推,F(xiàn)p的貢獻(xiàn)率最小,這表明Fp綜合公司特征指標(biāo)x1、x2、…、xd的能力最弱。
(5)經(jīng)過(guò)PCA得到的新樣本集為 (Fi,yi),其中,F(xiàn)i= (Fi1,F(xiàn)i2,…,F(xiàn)ip),i=1,2,…,n。
至此,基于PCA的特征指標(biāo)提取已完成。于是,將提取出對(duì)財(cái)務(wù)危機(jī)具有顯著影響的p個(gè)主成分因子作為輸入指標(biāo),就能夠運(yùn)用SVM方法建立海外上市公司財(cái)務(wù)危機(jī)預(yù)警模型。
對(duì)每家海外上市公司而言,其特征指標(biāo)之間的數(shù)量等級(jí)可能相差很大,這將會(huì)導(dǎo)致較大值的輸入
式中,xmean為原樣本中第k列數(shù)值的均值,xvar為原樣本中第k列數(shù)值的方差。
根據(jù)PCA-SVM基本原理的概述,下文將就如何構(gòu)建海外上市公司財(cái)務(wù)危機(jī)預(yù)警模型進(jìn)行實(shí)驗(yàn)設(shè)計(jì)。
1.樣本及其對(duì)應(yīng)的財(cái)務(wù)預(yù)警指標(biāo)的選取
本文的樣本是從截止到2010年末在美國(guó)的Nasdaq及紐約證券交易所上市的中國(guó)公司中隨機(jī)選擇的n家公司。本文之所以將我國(guó)海外上市公司樣本定位在美國(guó)的Nasdaq及紐約證券交易所中選取,是因?yàn)槲覈?guó)海外上市公司中的絕大部分是在美國(guó)的Nasdaq及紐約證券交易所上市,從這兩大證券市場(chǎng)中選擇出來(lái)的樣本在我國(guó)眾多海外上市公司中最具代表性。然后,再?gòu)倪@n家海外上市公司2009年12月的財(cái)務(wù)報(bào)表數(shù)據(jù)中提取出d項(xiàng)財(cái)務(wù)比率指標(biāo)作為樣本指標(biāo)。由于公司的盈虧狀況直接決定著公司是否會(huì)發(fā)生財(cái)務(wù)危機(jī),而凈利潤(rùn)的正負(fù)恰好能夠直接反映公司的盈虧狀況。因此,本文以凈利潤(rùn)的正負(fù)作為評(píng)判公司財(cái)務(wù)是否發(fā)生危機(jī)的標(biāo)準(zhǔn)。在此基礎(chǔ)上,這n家公司被劃分為財(cái)務(wù)正常類公司(用“-1”來(lái)表示)以及財(cái)務(wù)危機(jī)類公司(用“+1”來(lái)表示)。由此,構(gòu)成樣本集 (xi,yi),i=1,2,…,n,輸入數(shù)據(jù)xi= (xi1,xi2,...,xid)是d維特征指標(biāo)覆蓋較小值的輸入指標(biāo),從而可能影響PCASVM模型的預(yù)測(cè)精度。為了減少預(yù)測(cè)誤差,本文在構(gòu)建模型前,將采用歸一化(Normalization)數(shù)據(jù)預(yù)處理方法,將公司的特征指標(biāo)值映射(Map)到區(qū)間[0,1]之間。數(shù)據(jù)歸一化的常用方法有多種,其中平均數(shù)方差法是進(jìn)行PCA分析之前慣用的一種歸一化方法。因此,本文采用平均數(shù)方差法對(duì)原樣本集(xi,yi)的輸入變量特征指標(biāo)進(jìn)行歸一化,得到新的公司樣本集
2.特征指標(biāo)的歸一化預(yù)處理
為了避免因特征指標(biāo)之間的數(shù)量級(jí)差別而造成模型的預(yù)測(cè)精度下降,本文在構(gòu)建PCA-SVM預(yù)警模型前,將采用平均數(shù)方差法的歸一化數(shù)據(jù)預(yù)處理方法,將樣 本集 (xi,yi)的輸 入特征 指標(biāo)映射(Map)到區(qū)間 [0,1]之間,由此獲得新的數(shù)據(jù)樣本集 (,yi)。
3.基于PCA的財(cái)務(wù)危機(jī)特征指標(biāo)提取
由于在特征指標(biāo)的歸一化預(yù)處理中僅僅消除了這d項(xiàng)特征指標(biāo)之間的數(shù)量級(jí)差別,而并未解決各指標(biāo)之間存在的高相關(guān)性問(wèn)題,因此本文采用PCA方法提取出p個(gè)相互獨(dú)立的主成分,在減少樣本數(shù)據(jù)維數(shù)的同時(shí)也消除各指標(biāo)之間線性相關(guān)的冗余成分,從而提高SVM財(cái)務(wù)危機(jī)預(yù)警模型的學(xué)習(xí)能力與泛化推廣能力。
4.訓(xùn)練集與測(cè)試集的劃分
為了保證實(shí)驗(yàn)設(shè)計(jì)的公平性與準(zhǔn)確性,我們將樣本及指標(biāo)選取中的n個(gè)樣本隨機(jī)地平均劃分為訓(xùn)練集與測(cè)試集,每類集合中都分別包含著一部分財(cái)務(wù)正常類公司與財(cái)務(wù)危機(jī)類公司。
5.參數(shù)選取
考慮到參數(shù)的選取是一個(gè)復(fù)雜的過(guò)程,并且參數(shù)值的大小會(huì)直接影響模型的訓(xùn)練與預(yù)測(cè)效果,因此為了選擇出能夠保證訓(xùn)練與預(yù)測(cè)效果達(dá)到最優(yōu)的參數(shù),本文運(yùn)用最為常用的k交叉驗(yàn)證法(K-fold Cross Validation,K-CV)來(lái)選擇最佳的懲罰參數(shù)c和核函數(shù)參數(shù)g。所謂k交叉驗(yàn)證,即將原始數(shù)據(jù)均分為k組,將每組子集數(shù)據(jù)分別當(dāng)作一次驗(yàn)證集,與此同時(shí),其余的k-1組子集數(shù)據(jù)當(dāng)作訓(xùn)練集,于是得到k個(gè)模型,將這k個(gè)模型最終驗(yàn)證集的分類準(zhǔn)確率的平均值作為此K-CV下分類器的性能指標(biāo)。采用k交叉驗(yàn)證法,能夠有效地避免產(chǎn)生過(guò)學(xué)習(xí)與欠學(xué)習(xí)問(wèn)題,從而優(yōu)化模型的訓(xùn)練效果,提升模型的泛化推廣能力[20]。
6.不同核函數(shù)下模型的訓(xùn)練
為了深入探討不同核函數(shù)對(duì)預(yù)警模型性能的影響,本文以參數(shù)選取中選取出來(lái)的最佳參數(shù)為基礎(chǔ),利用訓(xùn)練集在不同的核函數(shù)下對(duì)模型進(jìn)行訓(xùn)練,從而獲得不同的SVM預(yù)警模型。
7.模型可靠性檢驗(yàn)
為了評(píng)價(jià)模型的泛化推廣能力,我們利用測(cè)試集對(duì)SVM預(yù)警模型進(jìn)行性能驗(yàn)證,從中選擇出擁有最高分類準(zhǔn)確率的模型作為我國(guó)海外上市公司的財(cái)務(wù)危機(jī)預(yù)警模型。
本文以我國(guó)海外上市公司2010年的凈利潤(rùn)為標(biāo)準(zhǔn),從在美國(guó)Nasdaq以及紐約證券交易所上市的中國(guó)公司中選擇了57家財(cái)務(wù)正常公司,其中30家被劃入訓(xùn)練集合,剩余27家被劃入測(cè)試集合,并用“-1”表示它們所屬財(cái)務(wù)正常類。另外選擇了23家財(cái)務(wù)危機(jī)公司,其中10家被劃入訓(xùn)練集合,剩余13家被劃入測(cè)試集合,并用“+1”表示它們所屬財(cái)務(wù)危機(jī)類。
在此基礎(chǔ)上,本文通過(guò)借鑒以往研究文獻(xiàn)并參考公司業(yè)績(jī)?cè)u(píng)價(jià)指標(biāo)體系,從以上80家海外上市公司2009年12月的財(cái)務(wù)報(bào)表數(shù)據(jù)中選取出能夠綜合反映公司的短期償債能力、長(zhǎng)期償債能力、營(yíng)運(yùn)能力和盈利能力四方面的15項(xiàng)財(cái)務(wù)比率指標(biāo)作為樣本指標(biāo)。(樣本指標(biāo)見表1)
表1 財(cái)務(wù)比率指標(biāo)
需要說(shuō)明的是,之所以樣本指標(biāo)的選擇年度定位在判定公司是否發(fā)生財(cái)務(wù)危機(jī)的上一年(即公司2010年被判定為財(cái)務(wù)正常類或財(cái)務(wù)危機(jī)類,則選用2009年的財(cái)務(wù)數(shù)據(jù)),是因?yàn)檫@樣能夠提前一年預(yù)測(cè)海外上市公司是否會(huì)出現(xiàn)財(cái)務(wù)危機(jī),從而避免對(duì)模型預(yù)測(cè)能力的高估。本文主要使用Matlab2011b軟件分析數(shù)據(jù)。
本文首先對(duì)各項(xiàng)財(cái)務(wù)比率指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理,得到新的財(cái)務(wù)比率指標(biāo)數(shù)據(jù)x*i,i=1,2,…,15,并運(yùn)用PCA方法提取出6個(gè)主成分因子,其累積貢獻(xiàn)率達(dá)到79.658%,從而說(shuō)明,提取出的這6個(gè)主成分因子能夠比較全面地反映我國(guó)海外上市公司的財(cái)務(wù)狀況。
將以上6個(gè)主成分因子作為輸入指標(biāo),就能運(yùn)用SVM方法建立海外上市公司財(cái)務(wù)危機(jī)預(yù)警模型。
首先,在劃分出訓(xùn)練集與測(cè)試集的基礎(chǔ)上,本文運(yùn)用k交叉驗(yàn)證法選擇最佳的懲罰參數(shù)c和核函數(shù)參數(shù)g。實(shí)驗(yàn)結(jié)果顯示,最佳懲罰參數(shù)c為1.0718,最佳核函數(shù)參數(shù)g為0.35355。
由于訓(xùn)練SVM模型除需要選擇參數(shù)c、g外,還需要選擇合適的核函數(shù)類型。因此,在獲得最佳參數(shù)c和g的基礎(chǔ)上,本文利用訓(xùn)練集對(duì)不同核函數(shù)下的SVM進(jìn)行訓(xùn)練,從而尋找到最佳的核函數(shù)類型(結(jié)果見表2)。
表2 不同核函數(shù)下的訓(xùn)練樣本分類準(zhǔn)確率
從表2可見,采用多項(xiàng)式核函數(shù)和徑向基核函數(shù)的訓(xùn)練樣本分類準(zhǔn)確率最高,說(shuō)明基于這兩類核函數(shù)的SVM模型具有最為優(yōu)越的學(xué)習(xí)能力。
此外,通過(guò)展示圖2~圖5,能夠更加直觀地看到在不同核函數(shù)下訓(xùn)練樣本的具體分類情況。其中,“○”代表實(shí)際訓(xùn)練集分類;“×”代表預(yù)測(cè)訓(xùn)練集分類;橫坐標(biāo)表示訓(xùn)練集樣本,圖2~圖5中顯示出本文訓(xùn)練集樣本數(shù)共40個(gè);縱坐標(biāo)表示樣本的類別標(biāo)簽,即“+1”和“-1”兩類。此外,從圖2~圖5可以觀察到,當(dāng)預(yù)測(cè)訓(xùn)練集分類與實(shí)際訓(xùn)練集分類一致,即模型對(duì)于訓(xùn)練樣本是否發(fā)生危機(jī)的實(shí)際與預(yù)測(cè)情況判斷正確時(shí),“○”與“×”便重合在一起,否則就相分離(見圖2~圖5)。
從圖2可以看到,在訓(xùn)練樣本集的前30個(gè)財(cái)務(wù)正常類公司中出現(xiàn)1個(gè)“○”與“×”相分離的情況,即表示出現(xiàn)1個(gè)被錯(cuò)劃為財(cái)務(wù)危機(jī)類公司的情況;后10個(gè)財(cái)務(wù)危機(jī)類公司中出現(xiàn)3個(gè)“○”與“×”相分離的情況,即表示出現(xiàn)3個(gè)被錯(cuò)劃為財(cái)務(wù)正常類公司的情況。從圖3中可以看到,在訓(xùn)練樣本集的前30個(gè)財(cái)務(wù)正常類公司中未出現(xiàn)被錯(cuò)劃為財(cái)務(wù)危機(jī)類公司的情況;后10個(gè)財(cái)務(wù)危機(jī)類公司中出現(xiàn)3個(gè)被錯(cuò)劃為財(cái)務(wù)正常類公司的情況。從圖4中可以看到,在訓(xùn)練樣本集的前30個(gè)財(cái)務(wù)正常類公司中未出現(xiàn)被錯(cuò)劃為財(cái)務(wù)危機(jī)類公司的情況;后10個(gè)財(cái)務(wù)危機(jī)類公司中出現(xiàn)3個(gè)被錯(cuò)劃為財(cái)務(wù)正常類公司的情況。從圖5中可以看到,在訓(xùn)練樣本集的前30個(gè)財(cái)務(wù)正常類公司中出現(xiàn)4個(gè)被錯(cuò)劃為財(cái)務(wù)危機(jī)類公司的情況;后10個(gè)財(cái)務(wù)危機(jī)類公司中出現(xiàn)6個(gè)被錯(cuò)劃為財(cái)務(wù)正常類公司的情況。
圖2 線性核函數(shù)下訓(xùn)練樣本集分類圖
圖3 多項(xiàng)式核函數(shù)下訓(xùn)練樣本集分類圖
圖4 徑向基核函數(shù)下訓(xùn)練樣本集分類圖
雖然在多項(xiàng)式核函數(shù)和徑向基核函數(shù)下訓(xùn)練出的SVM模型具有最為優(yōu)越的學(xué)習(xí)能力,但其泛化
圖5 sigmoid核函數(shù)下訓(xùn)練樣本集分類圖
推廣性能是否優(yōu)越還不可知。因此,我們還需要通過(guò)測(cè)試集對(duì)訓(xùn)練出的模型進(jìn)行性能驗(yàn)證與評(píng)價(jià),從而尋找到泛化推廣性能最為優(yōu)越的SVM模型(結(jié)果見表3)。
表3 不同核函數(shù)形式下的測(cè)試樣本分類準(zhǔn)確率
從表3可以看到,采用徑向基核函數(shù)和神經(jīng)元的非線性作用核函數(shù)的測(cè)試樣本分類準(zhǔn)確率最高,說(shuō)明基于這兩類核函數(shù)訓(xùn)練出的SVM模型具有最為優(yōu)越的泛化推廣性能。
此外,通過(guò)展示圖6~圖9,能夠更加直觀地觀察到在不同核函數(shù)下測(cè)試樣本的具體分類情況(見圖6~圖9)。
從圖6中可以看到,在測(cè)試樣本集的前27個(gè)財(cái)務(wù)正常類公司中出現(xiàn)1個(gè)被錯(cuò)劃為財(cái)務(wù)危機(jī)類公司的情況,后13個(gè)財(cái)務(wù)危機(jī)類公司中出現(xiàn)8個(gè)被錯(cuò)劃為財(cái)務(wù)正常類公司的情況。從圖7中可以看到,在測(cè)試樣本集的前27個(gè)財(cái)務(wù)正常類公司中出現(xiàn)2個(gè)被錯(cuò)劃為財(cái)務(wù)危機(jī)類公司的情況,后13個(gè)財(cái)務(wù)危機(jī)類公司中出現(xiàn)7個(gè)被錯(cuò)劃為財(cái)務(wù)正常類公司的情況。從圖8中可以看到,在測(cè)試樣本集的前27個(gè)財(cái)務(wù)正常類公司中未出現(xiàn)被錯(cuò)劃為財(cái)務(wù)危機(jī)類公司的情況,后13個(gè)財(cái)務(wù)危機(jī)類公司中出現(xiàn)8個(gè)被錯(cuò)劃為財(cái)務(wù)正常類公司的情況。從圖9中可以看到,在測(cè)試樣本集的前27個(gè)財(cái)務(wù)正常類公司中出現(xiàn)1個(gè)被錯(cuò)劃為財(cái)務(wù)危機(jī)類公司的情況,后13個(gè)財(cái)務(wù)危機(jī)類公司中出現(xiàn)8個(gè)被錯(cuò)劃為財(cái)務(wù)正常類公司的情況。
圖6 線性核函數(shù)下測(cè)試樣本集分類圖
圖7 多項(xiàng)式核函數(shù)下測(cè)試樣本集分類圖
圖8 徑向基核函數(shù)下測(cè)試樣本集分類圖
圖9 sigmoid核函數(shù)下測(cè)試樣本集分類圖
因此,對(duì)比表2與表3可見,在表2中,在線性核函數(shù)下訓(xùn)練樣本分類準(zhǔn)確率為90%,即40個(gè)訓(xùn)練樣本分類中出現(xiàn)4個(gè)被錯(cuò)分的樣本;在多項(xiàng)式核函數(shù)下訓(xùn)練樣本分類準(zhǔn)確率為92.5%,即40個(gè)訓(xùn)練樣本分類中出現(xiàn)3個(gè)被錯(cuò)分的樣本;在徑向基核函數(shù)下訓(xùn)練樣本分類準(zhǔn)確率為92.5%,即40個(gè)訓(xùn)練樣本分類中出現(xiàn)3個(gè)被錯(cuò)分的樣本;在神經(jīng)元的非線性作用核函數(shù)下訓(xùn)練樣本分類準(zhǔn)確率為75%,即40個(gè)訓(xùn)練樣本分類中出現(xiàn)10個(gè)被錯(cuò)分的樣本。從中分析可知,在多項(xiàng)式核函數(shù)與徑向基核函數(shù)下訓(xùn)練得到的預(yù)警模型所達(dá)到的分類準(zhǔn)確率是最高的。另外,表3中,在線性核函數(shù)下測(cè)試樣本分類準(zhǔn)確率為77.5%,即40個(gè)測(cè)試樣本分類中出現(xiàn)9個(gè)被錯(cuò)分的樣本;在多項(xiàng)式核函數(shù)下訓(xùn)練樣本分類準(zhǔn)確率為77.5%,即40個(gè)測(cè)試樣本分類中出現(xiàn)9個(gè)被錯(cuò)分的樣本;在徑向基核函數(shù)下訓(xùn)練樣本分類準(zhǔn)確率為80%,即40個(gè)測(cè)試樣本分類中出現(xiàn)8個(gè)被錯(cuò)分的樣本;在神經(jīng)元的非線性作用核函數(shù)下訓(xùn)練樣本分類準(zhǔn)確率為75%,即40個(gè)測(cè)試樣本分類中出現(xiàn)8個(gè)被錯(cuò)分的樣本。從中分析可知,在徑向基核函數(shù)與神經(jīng)元的非線性作用核函數(shù)下測(cè)試樣本分類準(zhǔn)確率是最高的。
綜上所述,PCA-SVM財(cái)務(wù)危機(jī)預(yù)警模型在線性、多項(xiàng)式、徑向基和sigmoid四種核函數(shù)下都具有良好的預(yù)測(cè)能力,而徑向基核函數(shù)下的PCA-SVM財(cái)務(wù)危機(jī)預(yù)警模型較其他主要核函數(shù)下的模型而言,具有更加優(yōu)越的學(xué)習(xí)能力與泛化推廣能力。
本文以我國(guó)海外上市公司為研究對(duì)象,運(yùn)用PCA方法提取出對(duì)財(cái)務(wù)危機(jī)具有顯著影響的特征指標(biāo),利用訓(xùn)練集在不同核函數(shù)下對(duì)SVM進(jìn)行訓(xùn)練,運(yùn)用測(cè)試集對(duì)訓(xùn)練出的SVM財(cái)務(wù)危機(jī)預(yù)警模型進(jìn)行性能驗(yàn)證與評(píng)價(jià),從中尋找出一種具有最優(yōu)學(xué)習(xí)能力與泛化推廣能力的SVM財(cái)務(wù)危機(jī)預(yù)警模型。實(shí)證研究結(jié)果表明,PCA-SVM財(cái)務(wù)危機(jī)預(yù)警模型在線性、多項(xiàng)式、徑向基和sigmoid四種核函數(shù)下都具有良好的預(yù)測(cè)能力,而徑向基核函數(shù)下的PCA-SVM財(cái)務(wù)危機(jī)預(yù)警模型具有更加優(yōu)越的學(xué)習(xí)能力與泛化推廣能力。
基于以上實(shí)證結(jié)果,本文認(rèn)為,基于徑向基核函數(shù)的PCA-SVM財(cái)務(wù)危機(jī)預(yù)警模型能夠有效地預(yù)測(cè)我國(guó)海外上市公司是否會(huì)發(fā)生財(cái)務(wù)危機(jī),從而能夠?yàn)槲覈?guó)相關(guān)決策部門、海外上市公司管理層以及廣大投資者提供寶貴的決策參考。
最后需要指出的是,盡管本文僅僅運(yùn)用四種核函數(shù)下的PCA-SVM方法對(duì)我國(guó)海外上市公司財(cái)務(wù)危機(jī)預(yù)警進(jìn)行實(shí)證研究,然而,本文的研究技術(shù)、方法與相關(guān)結(jié)論對(duì)于我國(guó)海外上市公司進(jìn)行財(cái)務(wù)危機(jī)預(yù)警仍然具有一定的借鑒意義。
[1]張艷慧,周雪峰.中國(guó)公司海外上市優(yōu)劣勢(shì)分析[J].中小企業(yè)管理與科技(下旬刊),2010,(9):76-77.
[2]Altman.Financial Ratios,Discriminant Analysis and the Prediction of Corporate Bankruptcy[J].Journal of Finance,1968,23(4):589-609.
[3]Ohlson.Financial Rations and the Probabilistic Prediction of Bankruptcy[J].Journal of Accounting Research,1980,18(1):109-130.
[4]Laitinen E K.Predicting a corporate credit analyst’s risk estimate by logistic and linear models[J].International Review of Financial Analysis,1999,8(2):97-121.
[5]Zmijewski.Methodological issues related to the estimated of financial distress prediction models[J].Journal of Accounting Research,1984,22(1):59-82.
[6]Kaminsky,C.,Lizondo,S.a(chǎn)nd Reinhart,C.Leading Indicatiors of Currency Crises[R].MF staff paper,1998,45(1):1-48.
[7]張愛(ài)民,祝春山,許丹健.上市公司財(cái)務(wù)失敗的主成分預(yù)測(cè)模型及其實(shí)證研究[J].金融研究,2001,(1):10-25.
[8]Odom,Sharda.Neural Network for Bankruptcy Prediction[C].International Joint Conference on Neural Network,1990:17-70.
[9]Desai V S,Crook J N,Overstreet G A.A comparison of neural network and linear scoring models in the credit union environment[J].European Journal of Operational Research,1996,95(1):24-37.
[10]王小黎.SVM模型在河南省中小企業(yè)技術(shù)創(chuàng)新能力評(píng)價(jià)中的應(yīng)用[J].科技管理研究,2011,(9):92-95.
[11]陳守東,楊瑩,馬輝.中國(guó)金融風(fēng)險(xiǎn)預(yù)警研究[J].?dāng)?shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2006,23(7):36-48.
[12]Vapnik V N.The Nature of Statistical Learning Theory[M].1995.
[13]鄧乃揚(yáng),田英杰.?dāng)?shù)據(jù)挖掘中的新方法-支持向量機(jī)[M].第三版.北京:科學(xué)出版社,2006.
[14]楊海軍,太雷.基于模糊支持向量機(jī)的上市公司財(cái)務(wù)困境預(yù)測(cè)[J].管理科學(xué)學(xué)報(bào),2009,12(3):102-110.
[15]Aronszajin N.Theory of reproducing kernels[J].Transactions of the American Mathematical Society,1950(68):337-404.
[16]宋新平,丁永生.基于最優(yōu)支持向量機(jī)模型的經(jīng)營(yíng)失敗預(yù)警研究[J].管理科學(xué),2008,21(1):115-121.
[17]劉雷.應(yīng)用EN、PCA和RBF網(wǎng)絡(luò)評(píng)價(jià)建設(shè)項(xiàng)目動(dòng)態(tài)聯(lián)盟的候選投標(biāo)項(xiàng)目[J].管理評(píng)論,2010,22(2):121-128.
[18]周子英,段建南,向昌盛,陳茜.基于PCA-SVM的區(qū)域經(jīng)濟(jì)預(yù)測(cè)研究[J].計(jì)算機(jī)仿真,2011,28(4):375-378.
[19]Aizerman M.A,Braverman E.M,Bozonoer L.I.Theoretical foundations of the potential function method in pattern recognition learning.Journal of Machine Learning Research,2000.http://www.jmlr.org.113-114.
[20]郭文偉.基于支持向量機(jī)的股市風(fēng)格輪換策略研究[J].管理科學(xué),2009,22(6):101-110.