[摘要]2007年次貸危機(jī)之后,信用評(píng)級(jí)問題引起了包括銀行等金融機(jī)構(gòu)以及企業(yè)本身的高度關(guān)注。信用評(píng)級(jí)簡(jiǎn)單理解就是通過一定的方法將貸款客戶進(jìn)行分類,產(chǎn)生一系列的級(jí)別,因此其核心算法可以理解為是經(jīng)典的多分類問題。隨著近20年來機(jī)器學(xué)習(xí)的發(fā)展和興起,越來越多與之相關(guān)的技術(shù)被運(yùn)用到信用評(píng)級(jí)的工作中。
[關(guān)鍵詞]機(jī)器學(xué)習(xí);計(jì)算數(shù)學(xué);信用評(píng)級(jí);人工神經(jīng)網(wǎng)絡(luò)
引言
2007年次貸危機(jī)之后,信用評(píng)級(jí)問題引起了包括銀行等金融機(jī)構(gòu)以及企業(yè)本身的高度關(guān)注。根據(jù)評(píng)價(jià)主體的不同,信用評(píng)級(jí)可以分為外部信用評(píng)級(jí)和內(nèi)部信用評(píng)級(jí)兩種,其中外部信用評(píng)級(jí)主要是由專門的評(píng)級(jí)機(jī)構(gòu)作出,并給出相應(yīng)的信用統(tǒng)計(jì)信息[1],而內(nèi)部信用評(píng)級(jí)則是由企業(yè)內(nèi)部或者銀行等金融機(jī)構(gòu)給出,以用于是否放貸等金融決策。本文研究的對(duì)象即為內(nèi)部信用評(píng)級(jí)。而根據(jù)被評(píng)價(jià)對(duì)象的不同,又可以分為對(duì)消費(fèi)者個(gè)人的信用評(píng)級(jí)和對(duì)企業(yè)用戶的信用評(píng)級(jí),對(duì)于企業(yè)用戶的信用評(píng)級(jí)需要通過構(gòu)建其還貸能力(主要通過其相關(guān)財(cái)務(wù)指標(biāo)進(jìn)行衡量)、還貸意愿(公司過往的還貸記錄、公司中高層領(lǐng)導(dǎo)素質(zhì)、企業(yè)規(guī)模[3])與公司違約之間的聯(lián)系,通過一定的模型來預(yù)測(cè)企業(yè)的違約可能性。
1、傳統(tǒng)信用評(píng)級(jí)方法
信用評(píng)級(jí)簡(jiǎn)單理解就是通過一定的方法將貸款客戶進(jìn)行分類,產(chǎn)生一系列的級(jí)別,因此其核心算法可以理解為是經(jīng)典的多分類問題。企業(yè)信用評(píng)級(jí)的傳統(tǒng)方法主要是包括專家法、打分法等在內(nèi)的主觀綜合法,在信用評(píng)級(jí)行為越來越頻繁和普遍的今天,冗繁的評(píng)定過程和過強(qiáng)的主觀性使人們開始尋求傳統(tǒng)法之外的信用評(píng)級(jí)方法。20世紀(jì)30年代以來,隨著統(tǒng)計(jì)學(xué)的發(fā)展,基于統(tǒng)計(jì)判別方法的評(píng)級(jí)方法成為國(guó)外信用評(píng)級(jí)體系的支柱,主流方法包括多元判別分析法(MDA)、加權(quán)Logistic回歸分析模型、Probit回歸分析模型等。除此之外,傳統(tǒng)的信用評(píng)級(jí)常用的方法還包括:模糊綜合評(píng)價(jià)法FCE(Romaniuk等1992)、層次分析法(趙家敏等2006)等。
隨著近20年來機(jī)器學(xué)習(xí)的發(fā)展和興起,越來越多與之相關(guān)的技術(shù)被運(yùn)用到信用評(píng)級(jí)的工作中,其中應(yīng)用較為廣泛的包括:人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、支持向量機(jī)(SVM)和投影尋蹤等。而他們也因?yàn)閷?duì)于財(cái)務(wù)樣本較少的依賴以及良好的預(yù)測(cè)效果越來越成為信用評(píng)級(jí)中的熱門研究領(lǐng)域。
3、人工神經(jīng)網(wǎng)絡(luò)在信用評(píng)級(jí)中的應(yīng)用
人工神經(jīng)網(wǎng)絡(luò)(Artifical Neural Networks,ANN)近年來在多個(gè)領(lǐng)域迅速興起,在包括會(huì)計(jì)和金融[7],健康和醫(yī)藥[8,9],工程和制造業(yè)[10,11],營(yíng)銷[12]等在內(nèi)的多個(gè)領(lǐng)域內(nèi)取得了很好的應(yīng)用。ANN相比于傳統(tǒng)的統(tǒng)計(jì)學(xué)方法也是一種有效的處理回歸和分類問題的方法[13]。并被證明在信用評(píng)級(jí)問題上也具有良好的表現(xiàn)[14,15,16]。ANN通過模擬生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能的數(shù)學(xué)模型。ANN是一種自適應(yīng)的非線性的建模方式,常用來針對(duì)輸入和輸出之間的復(fù)雜關(guān)系進(jìn)行探索。
4、數(shù)據(jù)介紹
對(duì)于企業(yè)信用評(píng)級(jí)而言,目前國(guó)際上較為權(quán)威的信用評(píng)級(jí)機(jī)構(gòu)為:穆迪投資者服務(wù)(Moody’s Investor Services,MIS)、標(biāo)準(zhǔn)普爾(Standard Poor's rating service,SnP)以及惠譽(yù)國(guó)際(Fitch Group)。為評(píng)級(jí)標(biāo)準(zhǔn)和等級(jí)的一致性,本次主要選用MIS下的被評(píng)級(jí)機(jī)構(gòu)作為研究對(duì)象。
通過對(duì)企業(yè)的履約情況進(jìn)行評(píng)定,MIS將企業(yè)的信用等級(jí)分為21級(jí),其中券信譽(yù)高,履約風(fēng)險(xiǎn)小,被稱為“投資級(jí)”,主要包括:Aaa級(jí)(優(yōu)等)、Aa級(jí)(高級(jí))、A級(jí)(中上級(jí))、Baa級(jí)(中級(jí));相比之下,信譽(yù)較低,履約風(fēng)險(xiǎn)較大的則被成為“投機(jī)級(jí)”,主要包括:Ba級(jí)(具有投機(jī)性質(zhì)的因素)、B級(jí)(缺少理想投資的品質(zhì))、Caa級(jí)(劣質(zhì)債券)、Ca級(jí)(高度投機(jī)性)、C級(jí)(最低等級(jí)評(píng)級(jí))
相應(yīng)的財(cái)務(wù)數(shù)據(jù)則可以通過分析企業(yè)的財(cái)務(wù)報(bào)告獲得[17]。公司的財(cái)務(wù)報(bào)告包括各項(xiàng)評(píng)定企業(yè)業(yè)務(wù)表現(xiàn)的財(cái)務(wù)數(shù)據(jù),其中常被使用的列示于表1。常用的財(cái)務(wù)比率主要包括以下幾個(gè):
表1 企業(yè)常用財(cái)務(wù)比率
為避免企業(yè)所處行業(yè)差異對(duì)研究帶來的影響,本文中主要選取了38家房地產(chǎn)上市企業(yè)的財(cái)報(bào)數(shù)據(jù)進(jìn)行研究,以保證模型評(píng)判標(biāo)準(zhǔn)的統(tǒng)一性。
5、方法步驟
(1)選取38家房地產(chǎn)上市企業(yè)財(cái)報(bào),根據(jù)表1中公式計(jì)算各項(xiàng)財(cái)務(wù)比率。采用計(jì)算而得的財(cái)務(wù)比率而非直接利用財(cái)報(bào)中數(shù)字的原因在于,各上市公司因規(guī)模差異,財(cái)報(bào)中財(cái)務(wù)指標(biāo)絕對(duì)值相差較大,且因其上市地點(diǎn)不同,財(cái)報(bào)中所披露的指標(biāo)數(shù)據(jù)的貨幣單位也不盡相同。但財(cái)務(wù)指標(biāo)的絕對(duì)值并不能全面的反應(yīng)一個(gè)公司的發(fā)展?fàn)顩r,采取財(cái)務(wù)比率作為數(shù)學(xué)模型依據(jù),可以消除規(guī)模差異及匯率變化帶來的影響,使結(jié)果更具有準(zhǔn)確性。
(2)在對(duì)數(shù)據(jù)進(jìn)行初步處理之后,對(duì)其進(jìn)行相關(guān)性分析。此環(huán)節(jié)主要包括指標(biāo)間的相關(guān)性比較和指標(biāo)與評(píng)級(jí)結(jié)果的相關(guān)性比較。
表2 各指標(biāo)相關(guān)性
首先,對(duì)10個(gè)指標(biāo)進(jìn)行相關(guān)性分析。
相關(guān)性主要包括正相關(guān)和負(fù)相關(guān)兩個(gè)方面,而相關(guān)性的強(qiáng)弱取決于相關(guān)系數(shù)取絕對(duì)值后的結(jié)果。其中,取絕對(duì)值后的結(jié)果若在0-0.09范圍內(nèi),則一般認(rèn)為兩者之間沒有相關(guān)性,(0.1,0.3)為弱相關(guān),(0.3,0.5)為中等相關(guān),(0.5,1.0)為強(qiáng)相關(guān)。而根據(jù)此環(huán)節(jié)的主要目的,我們主要研究各指標(biāo)之間的正相關(guān)性,下文中以相關(guān)性簡(jiǎn)稱弱相關(guān)性。根據(jù)結(jié)果,可以看出,大部分財(cái)務(wù)比率之間不具有明顯的正相關(guān)關(guān)系。我們主要關(guān)注其中的強(qiáng)相關(guān)性,即指標(biāo)1、指標(biāo)10;指標(biāo)4、指標(biāo)5;指標(biāo)7、指標(biāo)8這三對(duì)數(shù)據(jù)。將這三對(duì)數(shù)據(jù)與信用評(píng)級(jí)結(jié)果分別進(jìn)行相關(guān)性比較:通過將這三對(duì)指標(biāo)分別與信用評(píng)級(jí)結(jié)果進(jìn)行比較,最終選擇指標(biāo)5、指標(biāo)8、指標(biāo)10進(jìn)入模型的創(chuàng)建。
在經(jīng)過了相關(guān)性比較這一環(huán)節(jié)后,最終確定參與模型建立的指標(biāo)包括7個(gè):指標(biāo)2、指標(biāo)3、指標(biāo)5、指標(biāo)6、指標(biāo)8、指標(biāo)9、指標(biāo)10。
(3)將38組數(shù)據(jù)分為兩組,一組為訓(xùn)練集,一組為檢驗(yàn)集。其中,訓(xùn)練集中數(shù)據(jù)個(gè)數(shù)為20組,檢驗(yàn)集18組。本文中采用的人工神經(jīng)網(wǎng)絡(luò)模型為BP神經(jīng)網(wǎng)絡(luò)。
BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)通常由一個(gè)輸入層、一個(gè)輸出層、多個(gè)隱層共同組成。輸入層神經(jīng)元的個(gè)數(shù)由樣本屬性的維度決定,輸出層神經(jīng)元的個(gè)數(shù)由樣本分類個(gè)數(shù)決定。每一層包含若干個(gè)神經(jīng)元,每個(gè)神經(jīng)元包含一個(gè)閾值,用來改變神經(jīng)元的活性。網(wǎng)絡(luò)中帶箭頭的線表示前一層神經(jīng)元和后一層神經(jīng)元之間的權(quán)值。每個(gè)神經(jīng)元都有輸入和輸出。輸入層的輸入和輸出都是訓(xùn)練樣本的屬性值。
對(duì)于隱藏層和輸出層的輸入, 其中,是由上一層的單元i到單元j的連接的權(quán);是上一層的單元i的輸出;而是單元j的閾值。
神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的輸出是經(jīng)由賦活函數(shù)計(jì)算得到的。該函數(shù)用符號(hào)表現(xiàn)單元代表的神經(jīng)元活性。賦活函數(shù)一般使用simoid函數(shù)(或者logistic函數(shù))。神經(jīng)元的輸出為:
除此之外,神經(jīng)網(wǎng)絡(luò)中有一個(gè)學(xué)習(xí)率(l)的概念,通常在0和1之間取值,并有助于找到全局最小。若學(xué)習(xí)率太小,學(xué)習(xí)將進(jìn)行得很慢。若學(xué)習(xí)率太大,則有可能出現(xiàn)在不合適的解之間波動(dòng)。
算法基本流程就是:
1、初始化網(wǎng)絡(luò)權(quán)值和神經(jīng)元的閾值(一般隨機(jī)初始化)。
2、前向傳播:按照公式一層一層的計(jì)算隱層神經(jīng)元和輸出層神經(jīng)元的輸入和輸出。
3、后向傳播:根據(jù)公式修正權(quán)值和閾值
直到滿足終止條件。
在我們的模型中,我們有7個(gè)輸入層(7個(gè)指標(biāo)),以及2個(gè)輸出層(2個(gè)評(píng)級(jí)分類)。運(yùn)用Matlab對(duì)評(píng)價(jià)模型對(duì)20組訓(xùn)練集數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,設(shè)迭代次數(shù)為1000次,學(xué)習(xí)率為0.1,我們用18組檢驗(yàn)集數(shù)據(jù)進(jìn)行模擬預(yù)測(cè)得到了以下結(jié)果:
預(yù)測(cè)的準(zhǔn)確率達(dá)到了88.89%,能較準(zhǔn)確的對(duì)企業(yè)進(jìn)行信用評(píng)價(jià),可作為決策者的決策依據(jù)。若用Monte-Carlo模擬方法則可獲得更精確的結(jié)果,本文這里不作深入研究。
6、結(jié)束語
本文通過建立BP神經(jīng)網(wǎng)絡(luò)模型對(duì)38個(gè)企業(yè)的7個(gè)關(guān)鍵財(cái)務(wù)比率進(jìn)行信用評(píng)級(jí)分析,取得了較好的模擬結(jié)果。然而神經(jīng)網(wǎng)絡(luò)模型在信用評(píng)級(jí)方面的應(yīng)用仍處于初級(jí)研究階段,目前仍需對(duì)具體的結(jié)構(gòu),算法以及參數(shù)進(jìn)行優(yōu)化和改進(jìn),相信在不久的將來神經(jīng)網(wǎng)絡(luò)模型分析會(huì)成為信用評(píng)級(jí)中重要的參考依據(jù)。
參考文獻(xiàn)
[1]奚勝田,詹原瑞,韓著釗.因子分析與聚類分析在企業(yè)信用評(píng)級(jí)中的應(yīng)用[J].中國(guó)農(nóng)機(jī)化2009(1):44-47
[3]張鴻,丁以中.基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)信用評(píng)級(jí)模型[J].上海海事大學(xué)學(xué)報(bào)2007(3):64~68
[4]王春峰,萬海暉,張維.基于神經(jīng)網(wǎng)絡(luò)技術(shù)的商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估[J].系統(tǒng)工程理論與實(shí)踐,1999(9):24-32
[5].Altman EI. Financial ratios, discriminate analysis and the prediction of corporate bankruptcy[J]. Journal of Finance,1968,9(XXⅢ):589-609.
[6].Martin D. Earky warning of bank failure: a logit regression approach[J]. Journal of Banking and Finance,1977:249-276.
[7]N.Chauhan,V.Ravi,D.K.Chandre,Differential evolution trained wavelet neural networks:application to bankruptcy prediction in banks[J],Expert Syst.Appl.36(4)(2009)7659-7665
[8]D.Delen,G.Walker,A.Kadam,Predicting breast cancer survivability:acomparison of three datamining methods[J],Artif.Intell.Med.34(2)(2005)113-128.
[9]M.Behrman,R.Linder,A.H.Assadi,B.R.Stacey,M.M.Backonja,Classification of patients with pain based on neuropathic pain symptoms:comparison of an artificial neural network against an established scoring system[J],Eur.J.Pain11 (4) (2007)370-376.
[10]H.C.Zhang,S.H.Huang,Applications of neural networks in manufacturing:a state-of-the-art survey,Int.J.Prod.Res.33(3)(1995)705-728.
[11]P.C.Pendharkar,Scale economies and production function estimation for object-oriented software component and source code documentation size, Eur.J.Oper.Res.172(3)(2006)1040-1050.
[12] J. Yao,N.Teng,H.-L.Poh,C.L.Tan,F(xiàn)orecasting and analysis of marketing data using neural networks,J.Inf.Sci.Eng.14(4)(1998)843-862.
[13]M.Paliwal,U.A.Kumar,Neural networks and statistical techniques:a review of applications,ExpertSyst.Appl.36(1)(2009)2-17.
[14]P.Hájek,Municipal credit rating modelling by neural networks,Decision Support Syst.51(1)(2011)108-118.
[15]K.Kumar,S.Bhattacharya,Artificial neural network vs linear discriminant analysis in credit ratings forecase:a comparative study of predicti on performances, Rev.AccountingFinance5(3)(2006)216–227.
[16]Z.Huang,H.Chen,C.-J.Hsu,W.-H.Chen,S.Wu,Credit rating analysis with support vector machines and neural networks:a market comparative study, Decision SupportSyst.37(4)(2004)543-558.
作者簡(jiǎn)介
于雯(1990—),女,漢族,山東青島人,中國(guó)海洋大學(xué)數(shù)學(xué)科學(xué)院研究生,研究方向:計(jì)算數(shù)學(xué)