吳旭東
摘 要:企業(yè)在發(fā)生破產(chǎn)之前,它的很多財務(wù)指標(biāo)會跟財務(wù)良好的企業(yè)之間有一定的區(qū)別。文章運(yùn)用多元統(tǒng)計(jì)分析中的判別分析,對21家破產(chǎn)企業(yè)和25家財務(wù)狀況良好的企業(yè)的幾項(xiàng)不同的指標(biāo)做了分析,用SPSS構(gòu)造了費(fèi)希爾線性判別函數(shù),并運(yùn)用此函數(shù)判定企業(yè)的財務(wù)狀況是否良好。
關(guān)鍵詞:判別分析;破產(chǎn)企業(yè);財務(wù)狀況
1 判別分析原理
在生產(chǎn)、科研和日常生活中,經(jīng)常遇到需要判別的問題。判別分析本質(zhì)上具有探索性。作為一種分割方法,它通常在因果關(guān)系不甚明了的情況下被一次性地用來對所觀察到的差別進(jìn)行調(diào)查。例如,在地質(zhì)勘探中,我們在某地區(qū)采集到某種礦物標(biāo)本,需要判定它是哪種礦物;又如,在醫(yī)院對一名患者作各種化驗(yàn)檢查、獲得有關(guān)指標(biāo)和數(shù)據(jù)、要診斷患者得的是哪一種疾病,等等,這些都屬于判別問題。
判別分析是應(yīng)用性很強(qiáng)的一種多元統(tǒng)計(jì)方法,已滲透到各個領(lǐng)域,但不管哪個領(lǐng)域,判別分析問題都可以這樣描述:設(shè)有k個m維總體G1,G2, …,GK,其分布特征已知(如已知分布函數(shù),或知道來自各個總體的訓(xùn)練樣本)。對給定的新樣本,我們要判斷它來自哪個總體。
常用的判別方法主要有下列幾種:
(1)最大似然法
用于變量均為分類變量的情況。該方法建立在獨(dú)立事件概率乘法原理的基礎(chǔ)上,根據(jù)訓(xùn)練樣本信息求得因變量各種組合情況下樣品被分為任何一類的概率。當(dāng)新樣品進(jìn)入時,則計(jì)算它被分到每一類中的條件概率(似然值),概率最大的那一類就是它最終評定的歸類。
(2)距離判別
它的方法是由訓(xùn)練樣本得出每個分類的重心(中心)坐標(biāo),然后對新樣品求出它們離各個類別重心的距離遠(yuǎn)近,從而歸入離得最近的分類。最常見的距離是馬氏距離,偶爾也采用歐氏距離。
距離判別的特點(diǎn)是直觀簡單,適合于對因變量均為連續(xù)的情況進(jìn)行分類,且它對變量的分布類型無嚴(yán)格要求。
(3)Fisher判別
亦稱典型判別,該方法的基本方法是投影,即將原來在R維空間的因變量組合投影到維度較低的D維空間去,然后在D維空間中再進(jìn)行分類。投影的原則是使得每一類內(nèi)的方差盡可能小,而不同類別之間的投影的方差盡可能大。
Fisher判別法的優(yōu)勢在于對分布、方差等都沒有什么限制,應(yīng)用范圍較廣。另外,用該判別方法建立的判別方程可以直接用手工計(jì)算的方法進(jìn)行新觀察對象的判別,這在許多時候是方便的。
(4)Bayes判別
許多時候?qū)Ω黝悇e的比例分布情況有一定的先驗(yàn)信息,比如說客戶對投遞廣告的反應(yīng)絕大多數(shù)都是無回音,如果進(jìn)行判別,自然也應(yīng)當(dāng)是無回音居多。Bayes判別就可以利用這種先驗(yàn)信息,它的基本方法是認(rèn)為所有P個類別都是空間中互斥的子體,每個觀察都是空間中的一個點(diǎn)。在考慮先驗(yàn)概率的前提下,利用Bayes公式按照一定的準(zhǔn)則建構(gòu)一個判別函數(shù),分別計(jì)算該樣品落入各個子體的概率,所有概率中最大的一類就是被認(rèn)為是該樣品所屬的類別。
Bayes判別的強(qiáng)項(xiàng)是進(jìn)行多類判別,但是它要求母體呈多元正態(tài)分布。
在下面的應(yīng)用中,主要使用SPSS軟件分析輸出以Fisher判別為主給出的結(jié)果。在指定選項(xiàng)后,也可以給出Bayes判別式的結(jié)果。
文章中主要運(yùn)用Fisher判別。Fisher的想法是將多元觀測值x變換成多元觀測值y,使得總體?仔1和?仔2導(dǎo)出的y盡可能地分離開。Fisher建議用x的線性組合來建立y,因?yàn)樗鼈兪莤的非常簡單的函數(shù),易于掌握。
Fisher的線性判別函數(shù)是在假定兩個總體有相同協(xié)方差的條件下得到的。因此,毫不奇怪Fisher方法與最小錯分代價法則這種特殊情況相對應(yīng)。Fisher分類法則等價于在相同先驗(yàn)概率和相同錯分代價下的最小ECM法則。
為具有均值向量?滋i和協(xié)方差矩陣?撞i的正態(tài)密度函數(shù)的情形。若進(jìn)一步假定c(i|i)=0,c(k|i)=1,k≠i(或等價的,所有錯分代價相同),則上述最小ECM分類法則變成:
則將x分配到?仔k。
在上式中,常數(shù)(p/2)ln(2?仔)可以略去,因?yàn)閷λ械目傮w都相同,因此我們將第i個總體的二次判別得分定義為
實(shí)踐中?滋i和?撞i兼屬未知,但??色@得一組已經(jīng)正確分類的訓(xùn)練樣本,因此可以用樣本均值xi來估計(jì)總體均值?滋i,以及用樣本協(xié)方差矩陣Si來估計(jì)總體協(xié)方差矩陣?撞i。此時二次于是基于樣本的分類法則如下:
估計(jì)的最小TPM法則(對?撞i不同的多個正態(tài)總體)
若二次判別得分
則將x分配到?仔k。
若先驗(yàn)概率未知,通常的做法是令 。
2 多元判別分析法
2.1 判別分析的基本步驟
應(yīng)用SPSS進(jìn)行判別分析模型的構(gòu)建,其過程為:對于分為k組的研究對象,可建立(k-1)個典型判別函數(shù)(原始自變量的線性組合),和k個Fisher判別函數(shù),然后將各樣本的自變量回代到判別函數(shù)中,計(jì)算器判別分?jǐn)?shù)或?qū)儆诟鹘M的概率,根據(jù)數(shù)值的大小,判別樣品所屬組別,對樣品的原始組別給出錯分率。具體步驟如下:
(1)選擇自變量和組變量。
(2)計(jì)算各組單變量描述統(tǒng)計(jì)量,包括組內(nèi)均值、組內(nèi)標(biāo)準(zhǔn)差、總均值、總標(biāo)準(zhǔn)差、各組協(xié)方差矩陣、組間相關(guān)矩陣、并對組間均值相等和協(xié)方差矩陣相等的零假設(shè)進(jìn)行檢驗(yàn)。
(3)推導(dǎo)判別系數(shù),給出標(biāo)準(zhǔn)或未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù),并對函數(shù)顯著性進(jìn)行檢驗(yàn)。
(4)建立Fisher線性判別模型。
(5)按照一定的規(guī)則進(jìn)行分組。
(6)進(jìn)行樣本回判分析,計(jì)算錯分率。
(7)輸出結(jié)果。
(8)結(jié)合實(shí)際情況進(jìn)行分析。
2.2 建立模型的數(shù)據(jù)假定和原始數(shù)據(jù)的選擇。
對破產(chǎn)的企業(yè)收集它們在破產(chǎn)兩年的年度財務(wù)數(shù)據(jù),對財務(wù)良好的企業(yè)也收集同一時期的數(shù)據(jù),數(shù)據(jù)涉及四個變量,X1=CF/TD(現(xiàn)金流量/總債務(wù)),X2=NI/TA(凈收益/總資產(chǎn)),X3=CA/CL(流動資產(chǎn)/流動債務(wù)),以及X4=CA/NS(流動資產(chǎn)/凈銷售額),數(shù)據(jù)列于表1所示。
表2是獨(dú)立變量的全部和各組的均值和標(biāo)準(zhǔn)離差。
表3給出了合并類內(nèi)協(xié)方差矩陣和相關(guān)矩陣,陣中個元素是各類協(xié)方差或相關(guān)陣中對應(yīng)元素的均值。從表中可以看出,X1=CF/TD(現(xiàn)金流量/總債務(wù))和X2=NI/TA(凈收益/總資產(chǎn))的相關(guān)系數(shù)值(0.758)較大,說明這兩個變量有較好的相關(guān)性,如果需要剔除這四個變量中的某個變量,通常采取剔除X1=CF/TD(現(xiàn)金流量/總債務(wù))和X2=NI/TA(凈收益/總資產(chǎn))這兩個變量中的一個比較好。
表4給出了各類的協(xié)方差矩陣和總協(xié)方差矩陣。
表5給出了Fisher線性判別方程的系數(shù)。利用表中的數(shù)據(jù)可直接寫出判別方程,有幾類就有幾個分類方程。將某個樣品代人方程計(jì)算其在各類別上的得分,并根據(jù)分值多少判斷其所屬類別,比較不同類的判別分值,哪個大就屬于哪一類。
破產(chǎn)企業(yè)的判別函數(shù)為:
未破產(chǎn)企業(yè)的判別函數(shù)為:
例如,第一行的原始數(shù)據(jù)為(-0.45,-0.41,1.09,0.45)代入上述式中,得
y1=7.40191,y2=2.00561,y1的數(shù)值比y2大,所以這個企業(yè)屬于破產(chǎn)企業(yè)。
表6給出了判別分析結(jié)果的統(tǒng)計(jì)評價。從表中可以看出,它給出了全部樣品建立判別方程的正確分類的樣品數(shù),錯分樣品數(shù)和錯判率;交叉驗(yàn)證建立判別方程的正確分類的樣品數(shù),錯分樣品數(shù)和錯分率。全部樣品建立判別方程的正確分類結(jié)果為破產(chǎn)企業(yè)的錯判率為9.5%,財務(wù)狀況良好的企業(yè)錯判率為8%;交叉驗(yàn)證建立判別方程的正確分類結(jié)果為破產(chǎn)企業(yè)的錯判率為14.3%,財務(wù)狀況良好的企業(yè)錯判率為16%。如果對判定的結(jié)果不滿意的話,可以進(jìn)一步收集數(shù)據(jù),或者引入其他的財務(wù)指標(biāo)進(jìn)行分析。會提高判定的準(zhǔn)確性。
參考文獻(xiàn)
[1]RichardoA.Johnson、DeanW.Wichern.實(shí)用多元統(tǒng)計(jì)分析[M].陸璇,葉俊譯.北京:清華大學(xué)出版社,2008,11.
[2]張潤楚.多元統(tǒng)計(jì)分析[M].北京:科學(xué)出版社,2006,9.
[3]章紅波,陳紅艷.實(shí)用數(shù)據(jù)統(tǒng)計(jì)分析及SPSS12.0應(yīng)用[M].北京:人民郵電出版社,2006,2.
[4]林杰斌等.統(tǒng)計(jì)建模與應(yīng)用實(shí)務(wù)[M].北京:中國鐵道出版社,2006,
2.
[5]劉晶等.基于多元判別分析的財務(wù)預(yù)警系統(tǒng)[M].北京:中國管理信息化,2010,2.
[6]衷克定.統(tǒng)計(jì)數(shù)據(jù)分析與實(shí)踐[M].北京:高等教育出版社,2005,4.
[7]周皓.統(tǒng)計(jì)基礎(chǔ)和SPSS入門與提高[M].北京:清華大學(xué)出版社,2005,10.
[8]何少華,文竹青,等.實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理[M].北京:國防科技大學(xué)出版社,2002,10.
[9]高惠璇.應(yīng)用多元統(tǒng)計(jì)分析[M].北京:北京大學(xué)出版社,2005,1.
[10]林震巖.多變量分析-SPSS的操作與應(yīng)用[M].北京:北京大學(xué)出版社,2007,8.