[摘 要] 應(yīng)用學(xué)習(xí)向量量化LVQ神經(jīng)網(wǎng)絡(luò)方法,以近期14個(gè)數(shù)據(jù)作為財(cái)務(wù)危機(jī)預(yù)警建模樣本和測(cè)試樣本,建立了財(cái)務(wù)危機(jī)的預(yù)警模型,經(jīng)過(guò)對(duì)樣本的反復(fù)訓(xùn)練和學(xué)習(xí),得到了較好的預(yù)測(cè)結(jié)果#65377;研究結(jié)果表明:LVQ神經(jīng)網(wǎng)絡(luò)是一種非線性映射模式,在指標(biāo)間相關(guān)度較高#65380;呈非線性變化,或數(shù)據(jù)缺漏不全等情況下仍可得到比較滿意的結(jié)果,因此是一種比較理想的預(yù)測(cè)方法,具有廣泛的適用性和較高的推廣價(jià)值#65377;
[關(guān)鍵詞] 財(cái)務(wù)危機(jī);預(yù)警;學(xué)習(xí)向量量化LVQ神經(jīng)網(wǎng)絡(luò)方法
[中圖分類號(hào)]F232;F275[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1673-0194(2009)02-0031-02
一#65380;引 言
財(cái)務(wù)失敗又稱為財(cái)務(wù)困境或財(cái)務(wù)危機(jī),最嚴(yán)重的財(cái)務(wù)危機(jī)就是企業(yè)破產(chǎn)#65377;當(dāng)一個(gè)企業(yè)無(wú)力履行合同#65380;無(wú)力按時(shí)支付債權(quán)人利息和償還本金時(shí),該企業(yè)就面臨財(cái)務(wù)失敗#65377;事實(shí)上,企業(yè)陷入財(cái)務(wù)危機(jī)直至破產(chǎn)是一個(gè)逐步的過(guò)程,大多數(shù)企業(yè)的財(cái)務(wù)失敗都是由財(cái)務(wù)狀況異常到逐步惡化,最終導(dǎo)致財(cái)務(wù)失敗或破產(chǎn)的#65377;因此,企業(yè)的財(cái)務(wù)失敗不但具有先兆,而且是可預(yù)測(cè)的#65377;目前我國(guó)金融銀行業(yè)的競(jìng)爭(zhēng)日趨激烈,正確地預(yù)測(cè)企業(yè)財(cái)務(wù)失敗對(duì)于保護(hù)投資者和債權(quán)人的權(quán)益#65380;對(duì)于經(jīng)營(yíng)者防范財(cái)務(wù)危機(jī)#65380;對(duì)于政府管理部門監(jiān)控上市公司質(zhì)量和證券市場(chǎng)風(fēng)險(xiǎn),都具有重要的現(xiàn)實(shí)意義#65377;當(dāng)前被廣泛研究并應(yīng)用于財(cái)務(wù)失敗預(yù)測(cè)的模型主要有統(tǒng)計(jì)模型和人工智能模型兩大類#65377;傳統(tǒng)的統(tǒng)計(jì)模型包括多元判別分析模型(MDA)和對(duì)數(shù)回歸模型(Logistics Regression)等,這兩者也是應(yīng)用最為廣泛的模型#65377;統(tǒng)計(jì)模型最大的優(yōu)點(diǎn)在于其具有明顯的解釋性,存在的缺陷在于其過(guò)于嚴(yán)格的前提條件#65377;如MDA要求數(shù)據(jù)分布服從多元正態(tài)分布#65380;同協(xié)方差等;對(duì)數(shù)回歸模型雖然對(duì)數(shù)據(jù)分布的要求有所降低,但仍對(duì)財(cái)務(wù)指標(biāo)之間的多重共線性干擾敏感,而現(xiàn)實(shí)中大量數(shù)據(jù)分布都不符合這些假設(shè)前提,從而限制了統(tǒng)計(jì)模型在這一領(lǐng)域中的應(yīng)用#65377;
二#65380;問(wèn)題描述及LVQ網(wǎng)絡(luò)的適用性
隨著信息技術(shù)的發(fā)展,人工智能和機(jī)器學(xué)習(xí)的一些分類和預(yù)測(cè)的算法也被引入到金融信用風(fēng)險(xiǎn)評(píng)估領(lǐng)域中來(lái),主要包括人工神經(jīng)網(wǎng)絡(luò)和決策樹(shù)的方法#65377;決策樹(shù)是一種自頂向下的分類方法,它通過(guò)對(duì)一組訓(xùn)練樣本的學(xué)習(xí),構(gòu)造出決策型的知識(shí)表現(xiàn)#65377;決策樹(shù)具有速度快#65380;精度高#65380;生成模式簡(jiǎn)單等優(yōu)點(diǎn),但是這種歸納學(xué)習(xí)的方法容易造成模型的過(guò)度擬合,而且當(dāng)問(wèn)題復(fù)雜時(shí),決策樹(shù)的解釋性也會(huì)降低#65377;人工神經(jīng)網(wǎng)絡(luò)具有良好的容錯(cuò)性#65380;自適應(yīng)性和很強(qiáng)的泛化功能#65377;現(xiàn)實(shí)世界中的企業(yè)財(cái)務(wù)失敗預(yù)測(cè)問(wèn)題往往非常復(fù)雜,企業(yè)的各項(xiàng)財(cái)務(wù)指標(biāo)之間相互影響,呈現(xiàn)出復(fù)雜的非線性關(guān)系,而神經(jīng)網(wǎng)絡(luò)正是處理這類非線性問(wèn)題的強(qiáng)有力的工具,近年來(lái)開(kāi)始被引入金融信用風(fēng)險(xiǎn)評(píng)估領(lǐng)域中#65377;尤其是基于神經(jīng)網(wǎng)絡(luò)的企業(yè)破產(chǎn)預(yù)測(cè)方法逐漸顯示出它的優(yōu)越性,已經(jīng)開(kāi)始成為新的研究熱點(diǎn),應(yīng)用的模型也從主要以BP網(wǎng)絡(luò)為主逐漸擴(kuò)展到其他類型的網(wǎng)絡(luò),本文嘗試?yán)靡愿?jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的學(xué)習(xí)向量量化LVQ網(wǎng)絡(luò),基于我國(guó)上市公司的實(shí)際數(shù)據(jù)對(duì)財(cái)務(wù)失敗進(jìn)行預(yù)測(cè)#65377;
三#65380;數(shù)據(jù)樣本的收集
本例采用的用于構(gòu)建破產(chǎn)預(yù)測(cè)模型的財(cái)務(wù)數(shù)據(jù)全部來(lái)自我國(guó)上市公司的真實(shí)數(shù)據(jù),其中選取的財(cái)務(wù)破產(chǎn)公司是指在連續(xù)2年內(nèi)被股市特別處理(ST)的公司,同時(shí)依據(jù)行業(yè)分類選取該行業(yè)的其他公司為正常公司,以財(cái)務(wù)狀況異常最早發(fā)生日為基準(zhǔn)日,選取這些公司在基準(zhǔn)日前2年的財(cái)務(wù)報(bào)表數(shù)據(jù)#65377;共選取了102家財(cái)務(wù)狀況異常公司,481家正常公司(不同年份的同一家公司也認(rèn)為是不同的公司),共583家公司來(lái)構(gòu)建樣本的集合#65377;出于篇幅的原因,這里選用了其中的8個(gè)非ST公司和6個(gè)ST公司的樣本#65377;
這里把所有樣本數(shù)據(jù)分成兩份,分別是訓(xùn)練集和測(cè)試集#65377;已有研究表明,在分類模型的建立過(guò)程中,如果訓(xùn)練集合中兩類樣本數(shù)據(jù)的數(shù)量相當(dāng),則所建模型具有較強(qiáng)的健壯性,因此這里的訓(xùn)練集由相同數(shù)量的兩類樣本構(gòu)成(ST和非ST公司分別是5個(gè)樣本)#65377;測(cè)試集中ST和非ST公司樣本分別是1和3個(gè),用于測(cè)試在訓(xùn)練集上構(gòu)建的LVQ網(wǎng)絡(luò)模型的預(yù)測(cè)精度#65377;
特征選擇是模式識(shí)別分類問(wèn)題中的關(guān)鍵步驟,綜合考慮覆蓋面和計(jì)算量的問(wèn)題,這里選擇了最能反映公司財(cái)務(wù)狀況的5個(gè)財(cái)務(wù)指標(biāo):凈資產(chǎn)收益率#65380;流動(dòng)比率#65380;股本權(quán)益比率#65380;總資產(chǎn)增長(zhǎng)率和營(yíng)運(yùn)資本率#65377;樣本數(shù)據(jù)如表1所示#65377;
四#65380;LVQ神經(jīng)網(wǎng)絡(luò)建模與測(cè)試
由于所有數(shù)據(jù)都已經(jīng)在[0,1]中,所以對(duì)于表1中的數(shù)據(jù),無(wú)需進(jìn)行歸一化處理,可直接投入訓(xùn)練及測(cè)試#65377;
這里利用前5個(gè)ST公司的樣本和前5個(gè)正常公司的樣本作為網(wǎng)絡(luò)的訓(xùn)練樣本,后1個(gè)ST公司和后3個(gè)正常公司的樣本作為網(wǎng)絡(luò)的測(cè)試樣本#65377;
首先,創(chuàng)建一個(gè)LVQ網(wǎng)絡(luò):
net=newlvq(minmax(p),8,[0.5 0.5]);
其中,p為訓(xùn)練樣本中的輸入向量,8表示網(wǎng)絡(luò)的競(jìng)爭(zhēng)層神經(jīng)元的數(shù)目,[0.5 0.5]表示輸入樣本中屬于第1類的數(shù)據(jù)占50%,屬于第2類的占50%,學(xué)習(xí)算法learnlv1#65377;由于競(jìng)爭(zhēng)層神經(jīng)元的數(shù)目可以影響網(wǎng)絡(luò)分類性能,因此需要通過(guò)不斷實(shí)驗(yàn)進(jìn)行選擇#65377;
接下來(lái)利用訓(xùn)練樣本對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練:
tc=[1 1 2 1 2 2 2 1 2 1];t=ind2vec(tc);net=train(net,p,t);
其中,tc為輸入向量所屬的類別,ST公司用1表示,正常公司用2表示#65377;函數(shù)ind2vec將類別向量轉(zhuǎn)換為網(wǎng)絡(luò)可用的目標(biāo)向量#65377;網(wǎng)絡(luò)的訓(xùn)練結(jié)果為:
TRAINR Epoch 0/100
TRAINR Epoch 2/100
TRAINR,Performance goal met.
網(wǎng)絡(luò)經(jīng)過(guò)2次訓(xùn)練后,誤差就達(dá)到了要求#65377;
對(duì)網(wǎng)絡(luò)進(jìn)行模擬,檢驗(yàn)網(wǎng)絡(luò)是否對(duì)訓(xùn)練數(shù)據(jù)中的輸入向量進(jìn)行了正確的分類#65377;
y=sim(net,p);yc=vec2ind(y);
輸出結(jié)果為:yc=1 1 2 1 2 2 2 1 2 1
yc=tc,可見(jiàn)網(wǎng)絡(luò)的分類是正確的#65377;
接下來(lái)對(duì)網(wǎng)絡(luò)進(jìn)行交叉檢驗(yàn),即利用網(wǎng)絡(luò)隊(duì)訓(xùn)練樣本以外的數(shù)據(jù)進(jìn)行分類:
tc_test=[2 1 2 2];y_test= sim(net,p_test);yc_test=vec2ind(y_test)
y_test為網(wǎng)絡(luò)測(cè)試樣本中的輸入向量,tc_test表示輸入向量的類別#65377;輸出為:
yc_test=2 1 2 2
yc_test= tc_test,可見(jiàn)網(wǎng)絡(luò)對(duì)輸入向量進(jìn)行很好的分類#65377;
主要參考文獻(xiàn)
[1] 朱順泉. 管理科學(xué)研究方法——統(tǒng)計(jì)與優(yōu)化應(yīng)用[M]. 北京:清華大學(xué)出版社,2007.
[2] 飛思研發(fā)中心. 神經(jīng)網(wǎng)絡(luò)理論與Matlab 7實(shí)現(xiàn)[M]. 北京:電子工業(yè)出版社,2005.