1.華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,廣東廣州 510631
2.華南師范大學(xué)金融工程與風(fēng)險管理研究所,廣東廣州 510631
2018年,以土耳其、阿根廷為代表的幾個新興市場國家輪番遭遇到貨幣貶值的危機(jī),一度讓人開始擔(dān)心 1998年金融危機(jī)再現(xiàn)。表面上,美國對這些國家開打貿(mào)易戰(zhàn)是造成上述情況的直接原因,但究其深層次原因還是在于這些國家自身,其中一個重要因素是它們各自過高的外債比例(如土耳其貨幣危機(jī)爆發(fā)時其外債規(guī)模已占到本國 GDP的52%),一旦經(jīng)濟(jì)環(huán)境出現(xiàn)不利變化,極易導(dǎo)致信用風(fēng)險的急劇增加,且該狀況會迅速向企業(yè)、金融機(jī)構(gòu)、投資者蔓延,給金融市場帶來極大沖擊,最終可能導(dǎo)致金融危機(jī)的爆發(fā)。反觀歷次金融危機(jī)的產(chǎn)生基本上都離不開信用風(fēng)險惡化這個重要根源。顯然,信用風(fēng)險的評估與防范對金融監(jiān)管當(dāng)局及相關(guān)金融機(jī)構(gòu)、投資者等而言是至關(guān)重要的。
由于信用風(fēng)險的復(fù)雜性,信用風(fēng)險評估的模型也多種多樣,但從技術(shù)方法角度來看,主要可分為兩類基本模型(Chen et al,2016):一類是以統(tǒng)計分析為基礎(chǔ)的模型;另一類則是基于智能技術(shù)方法構(gòu)建的模型。前者典型代表包括線性判別分析法、二次判別分析以及 logistic 回歸模型等;后者包括了現(xiàn)今比較流行的一些機(jī)器學(xué)習(xí)方法,主要有神經(jīng)網(wǎng)絡(luò)(NN)、決策樹(DT)、進(jìn)化方法、模糊邏輯(FL)以及支持向量機(jī)(SVM)等。Prado 等人(2016)利用 Web Science 數(shù)據(jù)庫,采用文獻(xiàn)計量方法分析了從 1968到2014年間所發(fā)表的有關(guān)信用風(fēng)險和破產(chǎn)研究的期刊文獻(xiàn),他們對比了研究者使用這兩類模型情況,發(fā)現(xiàn)雖然判別模型和logistic 模型一直是研究者常用的方法,但從上世紀(jì) 90年代以來,以神經(jīng)網(wǎng)絡(luò)為代表的人工智能技術(shù)得到越來越廣泛的運(yùn)用,一個重要原因是后者不像前者需要嚴(yán)格假設(shè)前提,而且在處理非線性、病結(jié)構(gòu)問題方面比前者有更明顯的優(yōu)勢,因此在面對日益復(fù)雜的信用風(fēng)險,基于后者的評估模型也越來越受到相關(guān)研究人員的青睞,并在這方面取得了不少的研究成果。Blanco 等人(2013)運(yùn)用多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)模型構(gòu)建企業(yè)信用評分模型,以誤判成本為標(biāo)準(zhǔn),對比線性判別(LDA)及 logistic 等統(tǒng)計模型,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型結(jié)果要優(yōu)于統(tǒng)計模型;Korol(2013)則將神經(jīng)網(wǎng)絡(luò)運(yùn)用在對比中歐地區(qū)和拉美地區(qū)的企業(yè)在破產(chǎn)風(fēng)險預(yù)測上的不同;Khashman(2011)也通過神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建信用風(fēng)險的評價模型;楊淑娥等(2007)則利用 BP 神經(jīng)網(wǎng)絡(luò)(BPNN)構(gòu)建了我國上市公司財務(wù)預(yù)警模型,并在實際運(yùn)用中得到了較好的結(jié)果;Wang 等人(2012)、Sun 等人(2012)在進(jìn)行公司信用評估預(yù)測研究中則采用了SVM方法并取得了較好的效果。Yao 等(2015)則將 SVM 成功地運(yùn)用在公司債券違約損失的預(yù)測上。
然而上述模型在使用過程中缺陷也很明顯,如BP 神經(jīng)網(wǎng)絡(luò)為例,存在局部最優(yōu)、泛化性較差的缺點,究其原因,一個重要因素是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(包括支持向量機(jī)等)為代表的這類模型本質(zhì)上是一種淺層學(xué)習(xí)結(jié)構(gòu)(即網(wǎng)絡(luò)結(jié)構(gòu)層次較少,如普通神經(jīng)網(wǎng)絡(luò)一般只包含一個隱層),當(dāng)遇到高維、數(shù)據(jù)量龐大、結(jié)構(gòu)復(fù)雜的數(shù)據(jù)問題時,這類淺層結(jié)構(gòu)算法在刻畫數(shù)據(jù)特征、表達(dá)復(fù)雜函數(shù)方面的能力就非常有限了;但若采用多層網(wǎng)絡(luò)結(jié)構(gòu),系統(tǒng)復(fù)雜性自然增大,采用傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法(如 BP 算法),又會出現(xiàn)梯度消失或梯度爆炸問題,實際運(yùn)用中還會產(chǎn)生嚴(yán)重的過擬合問題?;诖?,Hinton 等人(2006a,2006b)提出了深度學(xué)習(xí)的思想來克服上述缺陷,其主要觀點為:1)采用多隱層的深層網(wǎng)絡(luò)結(jié)構(gòu)相比淺層結(jié)構(gòu)更能學(xué)習(xí)刻畫復(fù)雜數(shù)據(jù)的本質(zhì)特征,對可視化和分類等任務(wù)而言有很大的幫助;2)通過無監(jiān)督的通過逐層初始化(layer-wise pre-training)策略來有效克服深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的困難。由于深度學(xué)習(xí)在處理復(fù)雜數(shù)據(jù)中體現(xiàn)出的優(yōu)異性能使其一問世便受到許多研究者的關(guān)注和重視。近年來,深度學(xué)習(xí)已經(jīng)在圖像分類、多媒體檢索、交通流預(yù)測、語音處理及疾病診斷等許多領(lǐng)域得到廣泛的運(yùn)用,并且取得了較傳統(tǒng)方法更優(yōu)的效果(焦李成等,2016)。由于金融市場數(shù)據(jù)有復(fù)雜的非線性特征,因此有研究者借鑒其他領(lǐng)域的成功經(jīng)驗,將深度學(xué)習(xí)引入到金融領(lǐng)域研究中,如 Shen等(2015)、曾志平等(2017)運(yùn)用深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBN)方法分別對匯率和股票走勢特征進(jìn)行分析和預(yù)測;而 Luo 等人(2017)使用信用違約互換(CDS)數(shù)據(jù)對比了深度信念網(wǎng)絡(luò)(DBN)模型與logistic 回歸、多層感知器以及 SVM 模型的信用評分效果,發(fā)現(xiàn)DBN 效果最好;Kvamme 等(2018)則利用深度卷積神經(jīng)網(wǎng)絡(luò)對抵押貸款的違約進(jìn)行預(yù)測。目前,深度學(xué)習(xí)在金融領(lǐng)域當(dāng)中的應(yīng)用和研究主要集中在金融市場運(yùn)動的預(yù)測及相關(guān)交易策略的改進(jìn)與決策分析等方面(蘇治等,2017),在公司信用評估方面的研究還是比較少的。鑒于上述分析,特別的,由于深度信念網(wǎng)絡(luò)優(yōu)異的對數(shù)據(jù)本質(zhì)特征學(xué)習(xí)和刻畫能力以及在其他領(lǐng)域的成功運(yùn)用,本文提出一種基于深度信念網(wǎng)絡(luò)的信用評估研究模型,并將其運(yùn)用在中國和美國上市公司的信用評估實踐中。
深度信念網(wǎng)絡(luò)(DBN)是運(yùn)用較廣的一種深度學(xué)習(xí)模型。DBN 由若干個疊加的受限玻爾茲曼機(jī)(Restricted Boltzmann Machines,RBM)和一個BP 神經(jīng)網(wǎng)絡(luò)構(gòu)成,其網(wǎng)絡(luò)結(jié)構(gòu)類似于多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),但在訓(xùn)練算法上,DBN 采用了無監(jiān)督的逐層訓(xùn)練方法,克服了傳統(tǒng)的多層神經(jīng)網(wǎng)絡(luò)很難運(yùn)用梯度下降算法進(jìn)行訓(xùn)練的缺陷。由于DBN的主要構(gòu)成基礎(chǔ)是RBM,這里首先介紹RBM,在此基礎(chǔ)上再介紹DBN的具體結(jié)構(gòu)和訓(xùn)練算法。
受限玻爾茲曼機(jī)(RBM)可被看成是一個二分無向圖模型,如圖1所示。V為可視層,含m個神經(jīng)元(節(jié)點),代表輸入數(shù)據(jù);H為隱含層,含n個神經(jīng)元,目的是對輸入數(shù)據(jù)進(jìn)行特征提取,W為可視層與隱含層之間對稱的連接權(quán)重。并假設(shè)所有節(jié)點都是隨機(jī)二值變量節(jié)點(取 0 或 1),全概率分布p(v,h)滿足Boltzmann 分布。則 RBM的能量函數(shù)定義為:
其中,Wij為可視層節(jié)點i與隱含層節(jié)點j之間的連接權(quán)重,ai為i的偏置,bi為j的偏置,θ={Wij,ai,bi} 代表RBM 中所有的參數(shù)集,當(dāng)確定時,根據(jù)式(1)易得的聯(lián)合分布概率為:
其中,z(θ)=Σv,he-E(v,h|θ)是配分函數(shù),起歸一化因子的作用。因此,對(2)取邊緣分布,可得 RBM的可視向量分布和隱含向量分布分別為:
圖1 受限玻爾茲曼機(jī)(RBM)結(jié)構(gòu)示意圖Fig.1 Schematic diagram of the restricted Boltzmann machine
根據(jù) RBM 結(jié)構(gòu)可知,可視層和隱含層各節(jié)點的激活狀態(tài)是相互獨立的,可知在給定可視層向量v時隱含層節(jié)點j的條件概率以及給定隱含層向量h時可視層節(jié)點i的條件概率分別為:
其中,為sigmoid 函數(shù),即:
從上分析可看出。RBM 實際上就是一種隨機(jī)神經(jīng)網(wǎng)絡(luò),其訓(xùn)練是通過迭代方式完成,訓(xùn)練學(xué)習(xí)的目的就是確定參數(shù)θ={wij,ai,bj}的合適值。RBM 一般使用最大似然估計來找到其隱含層中輸入的隨機(jī)表達(dá)式(潛在特征),即通過最大似然函數(shù)推導(dǎo)參數(shù)θ的更新公式。參數(shù)的更新迭代公式為:
其中,η為學(xué)習(xí)率。上述迭代理論上可采用梯度下降算法來實現(xiàn),但實際上梯度很難計算。因此文獻(xiàn)(Hinton,2006)提出了一種對比分歧(contrastive divergence,CD)方法來得到各具體參數(shù)的更新公式。對比分歧法是首先通過一步完全 Gibbs 采樣,利用式(5)更新所有隱含層節(jié)點h,隨后再由式(7)更新所有可視層節(jié)點得到v’,最后再次通過式(5)得到h’。故各參數(shù)更新規(guī)則可由如下公式給出:
2.2.1 模型結(jié)構(gòu)
深度信念網(wǎng)絡(luò)(DBN)是由若干個RBM堆疊而成的多層信念網(wǎng)絡(luò),圖2為擁有三個隱含層的DBN的拓?fù)浣Y(jié)構(gòu)示意圖,為簡潔起見,連接權(quán)重W及偏置a和b并未在圖上標(biāo)示出來:
在上述DBN 結(jié)構(gòu)圖中,第一個RBM(即RBM1)將輸入作為可視層,其隱含層可被看成是第二個RBM(即 RBM2)的可視層,RBM2 將學(xué)習(xí) RBM1的隱含層中的特征輸出,并將該輸出作為下一層的輸入,依次類推,每一層從前一隱含層中學(xué)習(xí)抽象出其包含的特征分布,而 RBM1的輸入是整個網(wǎng)絡(luò)模型的輸入,這樣通過網(wǎng)絡(luò)的不斷堆疊,模型能夠逐層學(xué)習(xí)提取出原始數(shù)據(jù)中更復(fù)雜、更深層次的數(shù)據(jù)特征。而在頂層的BP 網(wǎng)絡(luò)則利用提取的數(shù)據(jù)特征為輸入,進(jìn)行分類或評估預(yù)測。
2.2.2 模型訓(xùn)練算法
由于信用評估本質(zhì)上可以看成是一種判別分類問題,將DBN 用于信用評估過程中,其充當(dāng)就是一種判別模型角色。然而,DBN 是一個具有多隱含層的深度神經(jīng)網(wǎng)絡(luò)模型,其權(quán)值參數(shù)的訓(xùn)練是一個非常困難的任務(wù),若直接采用傳統(tǒng)的梯度算法(如 BP 算法)來訓(xùn)練參數(shù),會使模型極易陷入局部最優(yōu),另外,隨著深度的增加,梯度的幅度會急劇減小,導(dǎo)致淺層(靠近輸入層)神經(jīng)元(節(jié)點)權(quán)值參數(shù)難以更新,無法有效學(xué)習(xí)。鑒于此,DBN的判別學(xué)習(xí)過程分為兩個階段來克服上述缺陷:首先利用 RBM 進(jìn)行逐層無監(jiān)督預(yù)訓(xùn)練,然后再利用 BP 反向傳播算法進(jìn)行有監(jiān)督的調(diào)優(yōu),具體過程如下所述。
圖2 深度信念網(wǎng)絡(luò)(DBN)的拓?fù)浣Y(jié)構(gòu)示意圖Fig.2 Schematic diagram of the topology of the deep belief network
第一階段:利用無監(jiān)督的貪心逐層訓(xùn)練算法對網(wǎng)絡(luò)權(quán)值等參數(shù)進(jìn)行預(yù)處理。最開始先對 RBM1 進(jìn)行訓(xùn)練(具體訓(xùn)練算法可采用前面所述的對比分歧算法),然后保存訓(xùn)練好的RBM1的權(quán)值和偏置,將 RBM1 隱含層的輸出作為RBM2的輸入,接著同樣方法對 RBM2 進(jìn)行訓(xùn)練,依次類推,分別對所有的RBM 進(jìn)行訓(xùn)練,實現(xiàn)了對DBN 網(wǎng)絡(luò)權(quán)值的預(yù)處理。這種操作可以降低采樣噪聲,更有利于加快網(wǎng)絡(luò)的學(xué)習(xí)速度,這一階段又被稱為預(yù)訓(xùn)練階段(pre-training)。通過無監(jiān)督的貪心逐層訓(xùn)練算法,能夠有效地對網(wǎng)絡(luò)權(quán)值進(jìn)行預(yù)處理,使權(quán)值參數(shù)獲得一個較優(yōu)的值。該算法雖然有效,但所求權(quán)值并非最優(yōu),因此往往需要根據(jù)實際問題進(jìn)行進(jìn)一步微調(diào)。
第二階段:微調(diào)(fine-tune)階段,亦稱調(diào)優(yōu)階段。這一階段是采用 BP 算法對整個網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,即在預(yù)訓(xùn)練結(jié)束之后,處在最后的RBM的輸出作為頂層 BP 網(wǎng)絡(luò)的輸入,此時整個網(wǎng)絡(luò)參數(shù)已確定(相當(dāng)于已預(yù)先設(shè)定好了網(wǎng)絡(luò)的初始參數(shù)),然后利用帶標(biāo)簽的訓(xùn)練樣本通過 BP 算法對整個DBN 網(wǎng)絡(luò)權(quán)值參數(shù)進(jìn)行調(diào)整,直到停止條件滿足為止。
實際上,預(yù)訓(xùn)練+微調(diào)的做法可看作是將許多參數(shù)分組,對每組先各自找到局部比較好的位置,然后再基于這些局部較優(yōu)的初步結(jié)果看成一個整體,從總體上對其進(jìn)行全局尋優(yōu)。這樣做的結(jié)果大大提高了模型的學(xué)習(xí)能力,改善了模型的泛化能力,提高了其評估預(yù)測的效果?;贒BN 模型的整個信用評估框架如圖3所示。
3.1.1 樣本數(shù)據(jù)來源
本文選取了我國上市公司數(shù)據(jù)和在美國上市的公司數(shù)據(jù)兩個公開樣本數(shù)據(jù)集,其中我國公司數(shù)據(jù)來源于wind、同花順財經(jīng)數(shù)據(jù)庫及同花順iFinD 數(shù)據(jù)庫,美國公司數(shù)據(jù)來源于compustat 數(shù)據(jù)庫。
我國上市公司數(shù)據(jù)樣本是從 2000至2014年被宣布實施 ST的公司中(剔出金融行業(yè)以及由于財務(wù)作假或非財務(wù)原因被 ST的)選取共 300 家 ST 公司,另外選取同時期的非 ST 公司樣本 1200 家,共計 1500個樣本公司構(gòu)成*(數(shù)據(jù)來源于Wind 數(shù)據(jù)庫、深圳國泰安 CSMAR 數(shù)據(jù)庫和同花順 iFinD 數(shù)據(jù)庫)。假定公司t年被宣布 ST,由于公司t年被宣布 ST和該公司公布t-1年度財務(wù)報表幾乎是同時發(fā)生的,故本文采用了t-2年的數(shù)據(jù)來預(yù)測t年是否會被 ST,例如 2012年被宣布 ST的公司,則采用2010年財務(wù)數(shù)據(jù)來進(jìn)行分析。即中國公司樣本數(shù)據(jù)共 1500個,其中信用狀況為好的1200個,為差的300個;
類似,美國公司數(shù)據(jù)樣本也是從 2000至2014年被標(biāo)普公司評級過的公司中選取了 1704個樣本公司,美國公司被評級范圍從 AAA到D 共 10個等級(分別為AAA、AA、A、BBB、BB、B、CCC、CC、C和D,其中AA至CCC 級可用“+”和“-”號進(jìn)行微調(diào)),為簡單起見,我們將美國上市公司也分為好和差兩類,評級在AAA+至B-的被視為信用較好企業(yè),評級在CCC+到D的被視為信用較差企業(yè)。這樣在1704個樣本中,基于上述分類,被歸為信用好的樣本為1549個,差的為155個。
圖3 基于DBN 模型的信用評估框架示意圖Fig.3 Schematic diagram of credit evaluation framework based onDBN model
我們將這兩個數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和測試集,訓(xùn)練集與測試集樣本數(shù)量比例關(guān)系大體為65:35,具體來說,中國公司樣本訓(xùn)練集包含 975個樣本(占樣本總數(shù)的65%),其中信用類別為好的790個,為差的185個;測試樣本集為525個樣本(占樣本總數(shù)的35%),其中信用為好的410個,為差的115個。美國公司訓(xùn)練集為1107個樣本(占樣本總數(shù)的64.96%),其中信用類別為好的1012個,為差的95個;測試樣本集為597個樣本(占樣本總數(shù)的35.04%),其中信用為好的537個,為差的60個。
3.1.2 指標(biāo)選擇及模型參數(shù)選取
本研究在深入分析公司財務(wù)報表結(jié)構(gòu)的基礎(chǔ)上,結(jié)合前人的研究,從償債能力、營運(yùn)能力、盈利能力、現(xiàn)金流量及發(fā)展能力等方面分析整理了 40個指標(biāo),具體見表1所示。
由于上述指標(biāo)之間可能存在高度相關(guān)性,本研究基于相關(guān)系數(shù)的變量選擇方法(這里采用了逐步回歸選擇法)分別對中美公司樣本指標(biāo)進(jìn)行變量篩選,限于篇幅,具體篩選過程就不再贅述(更詳細(xì)的介紹可參看文獻(xiàn)[Falangis et al,2010]),最后篩選結(jié)果如下:中國公司樣本指標(biāo)共篩選出 10個指標(biāo),分別是X3,X5,X8,X14,X16,X24,X25,X27,X33和X36;相應(yīng)的,美國公司樣本指標(biāo)共篩選出 13個指標(biāo),分別是X1,X8,X9,X10,X13,X18,X21,X24,X26,X29,X33,X34和X40。由于這兩個樣本集的信用評估分析過程基本相同,這里以中國公司樣本集為例來說明基于DBN的信用評估模型的構(gòu)建過程。
首先對原始指標(biāo)數(shù)據(jù)做了歸一化處理,歸一化函數(shù)如式(14)所示:
表1 輸入指標(biāo)名稱一覽表Table1 Enter indicator name list
這里,X代表輸入矩陣,maxx和minx分別為X中的最大和最小值,使得輸入向量的值量化到[-1,1]內(nèi)。DBN 模型的構(gòu)建是基于darch 軟件包(Package for Deep Architectures and Restricted Boltzmann Machines)通過 R 語言編程實現(xiàn)。由上述分析可知,該網(wǎng)絡(luò)模型的輸入層節(jié)點為10;預(yù)訓(xùn)練階段學(xué)習(xí)率η1=0.001,精調(diào)階段學(xué)習(xí)率η2=0.001,隱含層數(shù)及每個隱含層節(jié)點數(shù)通過試錯法確定,分別對隱含層數(shù)為2、3、4、5 以及隱含層節(jié)點數(shù)為10、20、30、40 時的共 16 種結(jié)構(gòu)進(jìn)行訓(xùn)練對比,最終確定采用 3個隱含層結(jié)構(gòu),每個隱含層節(jié)點數(shù)為30的網(wǎng)絡(luò)結(jié)構(gòu),因此,該模型結(jié)構(gòu)為一個10-30-30-30-1的網(wǎng)絡(luò)結(jié)構(gòu);其中,預(yù)訓(xùn)練階段學(xué)習(xí)率η1=0.001,精調(diào)階段學(xué)習(xí)率η2=0.001,其它參數(shù)為darch 包中的默認(rèn)參數(shù),輸出變量為單變量y,即輸出層為一個節(jié)點,若y=1 則代表信用差(ST 公司),y=0 則代表信用好(非 ST 公司)。
一般來講,模型的檢驗是用對訓(xùn)練樣本和測試樣本中分類的判定準(zhǔn)確度來表示,尤其是對訓(xùn)練樣本外的測試樣本中的判定準(zhǔn)確度更能反映模型的泛化性和預(yù)測性。故本研究采用I類錯誤率、II 類錯誤率和總誤判率三個指標(biāo)作為衡量模型預(yù)測準(zhǔn)確度的標(biāo)準(zhǔn)。這里第一類錯誤指的是將高信用風(fēng)險(信用差)公司誤判為低信用風(fēng)險(信用好)公司,即將 ST 公司判為非 ST 公司;第二類錯誤指的是將低信用風(fēng)險(信用好)公司誤判為高信用風(fēng)險(信用好)公司,即將非ST 公司判為ST 公司;總誤判率指所有被錯判的公司數(shù)與樣本公司總數(shù)的比值。此外,為對比分析,本研究還利用前面文獻(xiàn)所提到的一些經(jīng)典方法,包括 BPNN、Logistic 回歸、SVM、DT(采用 C5.0 算法)及 LDA 等構(gòu)建了相應(yīng)的信用評估模型,表2為所構(gòu)建的六種模型對中國上市公司測試樣本集的預(yù)測結(jié)果。
從表2 可看出,所構(gòu)建的六種模型對測試樣本集的預(yù)測結(jié)果總體來看都相當(dāng)不錯,其中總誤判率最高的為DT 模型,誤判率為8.57%,最低為DBN 模型,誤判率僅為4.38%;從 I 類錯誤率指標(biāo)來看,最高仍為DT 模型,誤判率達(dá)到22.41%,而最低為DBN,只有 13.04%,差不多只有 DT 模型的一半;再看 II類錯誤率,最高為LDA 模型,其誤判率為4.89%,最低還是DBN 模型,僅為1.95%;另外,我們對美國公司樣本也做了類似地分析研究,表3為六種模型對美國公司測試樣本集的預(yù)測結(jié)果。
同樣地,從表3 結(jié)果可看出,I 類錯誤率最高為DT 模型的23.33%,II 類錯誤率最高則為LDA 模型的5.96%,總誤判率最高為LDA 模型的6.53%;而DBN 模型在上述三個指標(biāo)的結(jié)果分別為10.00%、2.05%和2.85%,表現(xiàn)是最好的。綜上可看出,無論是中國公司樣本集還是美國公司樣本集,從 I 類錯誤率、II 類錯誤率及總誤判率這三個指標(biāo)的表現(xiàn)來看,基于DBN 模型的信用評估預(yù)測效果都要遠(yuǎn)優(yōu)于其它五種模型的評估效果,這也說明本研究所構(gòu)建的DBN 模型相比其他傳統(tǒng)模型的確能更好地挖掘和刻畫出復(fù)雜數(shù)據(jù)背后的特征關(guān)系,從而大大提高模型預(yù)測的準(zhǔn)確性和可靠性。
表2 六種模型對中國上市公司測試樣本的預(yù)測誤判結(jié)果對比Table2 Comparison of prediction results of six models on test samples of listed companies in China
表3 六種模型對美國公司測試樣本的預(yù)測誤判結(jié)果對比Table3 Comparison of prediction results of six models for US company test samples
傳統(tǒng)的信用評估模型對信用風(fēng)險的高維性、非線性等特點處理起來比較困難,在實際運(yùn)用中往往存在較大誤差,極大影響評估效果。深度學(xué)習(xí)作為當(dāng)前新興的一種人工智能學(xué)習(xí)算法,由于其在處理復(fù)雜問題、刻畫非線性數(shù)據(jù)特征方面具有其他方法不可比擬的優(yōu)勢,已經(jīng)受到各方面廣泛關(guān)注,并取得不錯的應(yīng)用效果。鑒于此,本研究在分析深度學(xué)習(xí)算法的基礎(chǔ)上,首先通過變量選擇方法將高維信用變量降維,然后采用深度信念神經(jīng)網(wǎng)絡(luò)(DBN)構(gòu)建了基于DBN的信用評估模型。通過在兩個公開樣本集(中國公司樣本集和美國公司樣本集)的實際驗證,相比其它 5個經(jīng)典模型,實證結(jié)果顯示,基于DBN的信用評估模型在I 類錯誤率、II 類錯誤率和總誤判率三個指標(biāo)上都要好于其它 5 種對比模型,說明了基于深度學(xué)習(xí)方法構(gòu)建信用評估模型的有效性和可靠性,該研究成果也為探索和豐富符合信用評估管理方法提供了一些借鑒和參考。