姜慜喆,趙盛喆,黃雅荷
(1.武漢理工大學(xué) 安全科學(xué)與應(yīng)急管理學(xué)院,湖北 武漢 430070;2.華中師范大學(xué) 信息管理學(xué)院, 湖北 武漢 430079)
2008年,美國(guó)的金融危機(jī)升級(jí)為經(jīng)濟(jì)危機(jī),并將影響范圍擴(kuò)展至全球,造成金融系統(tǒng)紊亂、金融機(jī)構(gòu)倒閉以及金融資產(chǎn)萎縮等一系列連鎖反應(yīng),引發(fā)了政府和學(xué)者對(duì)金融風(fēng)險(xiǎn)領(lǐng)域的廣泛關(guān)注。黨的十九大報(bào)告把防范化解重大風(fēng)險(xiǎn)擺在三大攻堅(jiān)戰(zhàn)之首,要求保持對(duì)重大風(fēng)險(xiǎn)普遍性和客觀性的清醒認(rèn)識(shí)。在經(jīng)濟(jì)全球化的背景下,任何國(guó)家或地區(qū)都不可能成為有風(fēng)險(xiǎn)的孤島,地區(qū)的風(fēng)險(xiǎn)乃至國(guó)家的風(fēng)險(xiǎn)會(huì)迅速地傳遞到其他的國(guó)家或地區(qū)。因此,監(jiān)控金融風(fēng)險(xiǎn)出現(xiàn)的征兆,預(yù)防可能會(huì)發(fā)生的金融風(fēng)險(xiǎn),是國(guó)家獲得長(zhǎng)遠(yuǎn)發(fā)展的關(guān)鍵和難題。
隨著大數(shù)據(jù)時(shí)代的到來(lái),海量的金融數(shù)據(jù)對(duì)傳統(tǒng)的金融風(fēng)險(xiǎn)管理體系造成巨大的沖擊,金融風(fēng)險(xiǎn)管理問(wèn)題日益突出,傳統(tǒng)的分析方法已經(jīng)不能滿足如今的金融風(fēng)險(xiǎn)管理需求。在各類計(jì)算機(jī)技術(shù)的快速進(jìn)步以及經(jīng)濟(jì)社會(huì)發(fā)展的協(xié)同作用下,機(jī)器學(xué)習(xí)算法開(kāi)始逐步應(yīng)用于金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域。上市公司財(cái)務(wù)困境預(yù)警以及信用風(fēng)險(xiǎn)評(píng)估是金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域中典型和熱點(diǎn)的研究對(duì)象。由于金融風(fēng)險(xiǎn)數(shù)據(jù)具有樣本復(fù)雜性、指標(biāo)多樣性等特征,因此通過(guò)機(jī)器學(xué)習(xí)模型對(duì)其進(jìn)行分析和預(yù)測(cè),研究機(jī)器學(xué)習(xí)在金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域中應(yīng)用,有助于加強(qiáng)金融風(fēng)險(xiǎn)管理效率和推進(jìn)社會(huì)良好發(fā)展。綜上,筆者以上市公司財(cái)務(wù)困境預(yù)警和信用風(fēng)險(xiǎn)評(píng)估為例,圍繞這兩個(gè)金融風(fēng)險(xiǎn)預(yù)測(cè)問(wèn)題展開(kāi)綜述,從金融風(fēng)險(xiǎn)預(yù)測(cè)度量指標(biāo)、機(jī)器學(xué)習(xí)分析方法和機(jī)器學(xué)習(xí)在金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域中的應(yīng)用3個(gè)方面出發(fā),進(jìn)一步梳理了金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域的相關(guān)研究,并最終展望了該領(lǐng)域的研究趨勢(shì)。
建立合適的金融風(fēng)險(xiǎn)度量預(yù)警指標(biāo)體系是建立預(yù)測(cè)模型的基石,對(duì)于模型的預(yù)測(cè)效果至關(guān)重要。在財(cái)務(wù)困境預(yù)警領(lǐng)域中,大多數(shù)的傳統(tǒng)研究使用財(cái)務(wù)指標(biāo)作為分析依據(jù),而MERWIN[1]首次運(yùn)用流動(dòng)比率、營(yíng)運(yùn)能力與負(fù)債權(quán)益比例等財(cái)務(wù)指標(biāo)預(yù)測(cè)公司財(cái)務(wù)困境。此后,財(cái)務(wù)指標(biāo)在財(cái)務(wù)困境預(yù)警中得到廣泛運(yùn)用。鮑新中等[2]利用粗糙理論對(duì)33個(gè)財(cái)務(wù)指標(biāo)進(jìn)行篩選,最終得到流動(dòng)比率、資產(chǎn)周轉(zhuǎn)率和營(yíng)業(yè)收入增長(zhǎng)率等9個(gè)能夠更好闡述公司財(cái)務(wù)狀況的財(cái)務(wù)指標(biāo)進(jìn)行財(cái)務(wù)困境預(yù)警研究。PAVLICKO等[3]選取27個(gè)財(cái)務(wù)指標(biāo)對(duì)中歐550 000家公司的財(cái)務(wù)困境進(jìn)行預(yù)測(cè),結(jié)果表明流動(dòng)比率、股本回報(bào)率、資產(chǎn)回報(bào)率、債務(wù)比率和凈營(yíng)運(yùn)資本等5個(gè)指標(biāo)對(duì)財(cái)務(wù)困境預(yù)警的貢獻(xiàn)最突出。
然而,財(cái)務(wù)指標(biāo)屬于定量指標(biāo),忽視了企業(yè)內(nèi)部治理等定性因素對(duì)財(cái)務(wù)狀況的影響,在一定程度上影響了財(cái)務(wù)困境預(yù)警模型的準(zhǔn)確性。為解決此問(wèn)題,有學(xué)者提出引入考慮定性信息的非財(cái)務(wù)指標(biāo)完善財(cái)務(wù)困境預(yù)警指標(biāo)體系。國(guó)內(nèi)對(duì)于非財(cái)務(wù)指標(biāo)的研究相對(duì)比較晚。國(guó)外對(duì)于非財(cái)務(wù)指標(biāo)的運(yùn)用最早可以追溯至1960年[4],國(guó)內(nèi)在2000年以后才有人陸續(xù)將非財(cái)務(wù)指標(biāo)引進(jìn)財(cái)務(wù)困境預(yù)警指標(biāo)體系中。早年引用較多的非財(cái)務(wù)指標(biāo)大多為管理指標(biāo),如WANG等[5]在預(yù)警模型中加入了股權(quán)集中度指標(biāo),曹德芳等[6]在研究中加入了股權(quán)結(jié)構(gòu)變量。非結(jié)構(gòu)化的文本數(shù)據(jù)也引起了學(xué)者們的關(guān)注,文本數(shù)據(jù)包含規(guī)范性文本和非規(guī)范性文本。規(guī)范性文本是指上市公司年報(bào)等擁有高度標(biāo)準(zhǔn)化特征的數(shù)據(jù),能夠反映公司經(jīng)營(yíng)情況和發(fā)展趨勢(shì)。李詩(shī)軒等[7]探究了上市公司年報(bào)中的非結(jié)構(gòu)化數(shù)據(jù)對(duì)于企業(yè)財(cái)務(wù)困境的影響,研究發(fā)現(xiàn)來(lái)源于上市公司年報(bào)的文本數(shù)據(jù),能夠輔助傳統(tǒng)的財(cái)務(wù)指標(biāo)實(shí)現(xiàn)更高效率的財(cái)務(wù)困境預(yù)警。非規(guī)范性文本則是指來(lái)源于網(wǎng)絡(luò)媒體的數(shù)據(jù),如財(cái)經(jīng)新聞、股吧評(píng)論等,能夠體現(xiàn)文本的多樣性。邊海容等[8]利用財(cái)務(wù)指標(biāo)和從中證網(wǎng)中的收集文本數(shù)據(jù)進(jìn)行財(cái)務(wù)困境預(yù)警,證明了網(wǎng)絡(luò)媒體文本數(shù)據(jù)對(duì)于提高財(cái)務(wù)困境預(yù)警模型性能的重要性。楊揚(yáng)等[9]綜合運(yùn)用了規(guī)范性的上市公司年報(bào)數(shù)據(jù)以及非規(guī)范性的網(wǎng)民評(píng)論的文本數(shù)據(jù),發(fā)現(xiàn)非規(guī)范性文本信息在預(yù)測(cè)企業(yè)信用風(fēng)險(xiǎn)方面的準(zhǔn)確性更高。
在信用風(fēng)險(xiǎn)評(píng)估領(lǐng)域中,傳統(tǒng)的評(píng)估方法為專家打分法,即信貸行業(yè)專家通過(guò)自身的專業(yè)知識(shí)和行業(yè)經(jīng)驗(yàn)對(duì)信用風(fēng)險(xiǎn)要素進(jìn)行主觀評(píng)估,如5C、5P和5W要素法等。隨著金融全球化的發(fā)展,金融界對(duì)信用風(fēng)險(xiǎn)的關(guān)注逐漸增加,信用風(fēng)險(xiǎn)評(píng)估方法也不斷推陳出新,定量化的硬信息和定型化的軟信息均被廣泛運(yùn)用于信用風(fēng)險(xiǎn)評(píng)估領(lǐng)域。由于銀行和投資者所面臨的信用風(fēng)險(xiǎn)往往來(lái)自借款企業(yè)的財(cái)務(wù)困境,因此發(fā)現(xiàn)和收集一些反映企業(yè)經(jīng)營(yíng)狀況的指標(biāo),能夠確定企業(yè)信用風(fēng)險(xiǎn)評(píng)級(jí),為銀行和投資者進(jìn)行貸款或投資行為提供依據(jù)?;谶@一邏輯,金融機(jī)構(gòu)通常將企業(yè)出現(xiàn)信用風(fēng)險(xiǎn)的信號(hào)轉(zhuǎn)化為企業(yè)陷入財(cái)務(wù)困境。財(cái)務(wù)困境是指財(cái)務(wù)情況出現(xiàn)嚴(yán)重惡化,導(dǎo)致企業(yè)或個(gè)人資金鏈無(wú)法償還債務(wù)或支付日常開(kāi)銷。國(guó)內(nèi)學(xué)者通常將獲得特殊處理(ST)標(biāo)簽的公司視為財(cái)務(wù)困境公司,如陳輝遠(yuǎn)等[10]在不同時(shí)期的研究大多都以ST標(biāo)簽為判定方法,判斷上市公司是否陷入財(cái)務(wù)困境。此外,周穎等[11-12]同樣以ST標(biāo)簽作為判定方法,判斷上市公司是否出現(xiàn)信用風(fēng)險(xiǎn)。因此,部分信用風(fēng)險(xiǎn)評(píng)估領(lǐng)域中所采用的度量指標(biāo)與財(cái)務(wù)困境預(yù)警領(lǐng)域中的度量指標(biāo)高度重合。在財(cái)務(wù)困境預(yù)警領(lǐng)域所廣泛采用的指標(biāo)體系之外,有學(xué)者進(jìn)一步考慮了其他非財(cái)務(wù)指標(biāo)對(duì)借款企業(yè)進(jìn)行信用風(fēng)險(xiǎn)分析。王鑫等[13]從守信意愿、守信能力和守信表現(xiàn)3個(gè)方面評(píng)估企業(yè)信用風(fēng)險(xiǎn)情況,具體包含公司價(jià)值理念、制度規(guī)范、財(cái)務(wù)能力、管理能力和公益支持等9個(gè)方面二級(jí)指標(biāo),以及19個(gè)三級(jí)指標(biāo),構(gòu)建了包含88個(gè)指標(biāo)的信用風(fēng)險(xiǎn)評(píng)估體系,以期能夠更全面、客觀地反映中小企業(yè)信用風(fēng)險(xiǎn)。
除了將信用風(fēng)險(xiǎn)測(cè)度轉(zhuǎn)化為企業(yè)財(cái)務(wù)困境研究,也有學(xué)者以融資企業(yè)是否有違約記錄判斷企業(yè)是否存在信用風(fēng)險(xiǎn)。如胡海青等[14]將企業(yè)的信用風(fēng)險(xiǎn)歷史分類數(shù)據(jù)作為機(jī)器學(xué)習(xí)模型的輸出,從供應(yīng)鏈金融視角下對(duì)中小型企業(yè)進(jìn)行信用風(fēng)險(xiǎn)評(píng)估,從行業(yè)狀況、融資企業(yè)自身狀況、核心企業(yè)資信狀況以及供應(yīng)鏈關(guān)系狀況4個(gè)角度出發(fā),構(gòu)建包含宏觀經(jīng)濟(jì)狀況、法律政策因素、行業(yè)競(jìng)爭(zhēng)強(qiáng)度、產(chǎn)品價(jià)格優(yōu)勢(shì)等31個(gè)指標(biāo)的信用風(fēng)險(xiǎn)評(píng)估指標(biāo)體系。基于上述文獻(xiàn),筆者對(duì)金融風(fēng)險(xiǎn)預(yù)測(cè)度量指標(biāo)做了進(jìn)一步梳理,結(jié)果如圖1所示。
圖1 金融風(fēng)險(xiǎn)預(yù)測(cè)度量指標(biāo)
機(jī)器學(xué)習(xí)是一類算法的總稱,這些算法通過(guò)對(duì)輸入的樣本數(shù)據(jù)進(jìn)行反復(fù)多次的學(xué)習(xí)和訓(xùn)練,并最終輸出算法的分類或預(yù)測(cè)結(jié)果,其基本運(yùn)行框架如圖2所示。機(jī)器學(xué)習(xí)是當(dāng)代人工智能的核心,通過(guò)模擬人腦或者采用人類的方法,使計(jì)算機(jī)具備自動(dòng)學(xué)習(xí)能力。研究者期望通過(guò)機(jī)器學(xué)習(xí)算法從大量歷史數(shù)據(jù)中挖掘出其中隱含的規(guī)律,并用于預(yù)測(cè)或者分類當(dāng)中。
圖2 機(jī)器學(xué)習(xí)基本運(yùn)行框架
目前,機(jī)器學(xué)習(xí)方法已廣泛應(yīng)用于多個(gè)領(lǐng)域。
按照任務(wù)目標(biāo)的不同可將機(jī)器學(xué)習(xí)算法分為以下3類:回歸算法、分類算法和聚類算法。①回歸算法能夠建立變量之間的回歸模型,通過(guò)給定一個(gè)訓(xùn)練集,根據(jù)該訓(xùn)練集進(jìn)行學(xué)習(xí)得到一個(gè)線性函數(shù),并利用學(xué)習(xí)(訓(xùn)練)過(guò)程得到自變量與因變量之間的相關(guān)關(guān)系,用于模型預(yù)測(cè)或者分類。楊青龍等[15]運(yùn)用LASSO回歸模型預(yù)測(cè)企業(yè)財(cái)務(wù)困境,并證明了該模型預(yù)測(cè)的有效性。②分類算法是一種對(duì)離散型隨機(jī)變量進(jìn)行預(yù)測(cè)的監(jiān)督學(xué)習(xí)方法,通過(guò)訓(xùn)練集對(duì)某個(gè)分類模型進(jìn)行訓(xùn)練,并最終達(dá)到對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測(cè)的目的,被廣泛地應(yīng)用于企業(yè)財(cái)務(wù)危機(jī)預(yù)警、信用風(fēng)險(xiǎn)評(píng)估等金融風(fēng)險(xiǎn)領(lǐng)域中。常見(jiàn)的分類算法包括決策樹(shù)(DT)、邏輯回歸(LR)以及支持向量機(jī)(SVM)等。CHEN[16]利用DT和LR對(duì)上市公司財(cái)務(wù)困境進(jìn)行預(yù)警,發(fā)現(xiàn)LR能比DT發(fā)現(xiàn)更長(zhǎng)時(shí)期的財(cái)務(wù)困境隱含信號(hào)。③聚類是機(jī)器學(xué)習(xí)中一種重要的無(wú)監(jiān)督算法,它可以將數(shù)據(jù)點(diǎn)歸結(jié)為一系列特定的組合。理論上歸為一類的數(shù)據(jù)點(diǎn)具有相同的特性,而不同類別的數(shù)據(jù)點(diǎn)則具有各不相同的屬性,常用的聚類算法包括K-均值聚類、層次聚類和線性判別分析。如陳茜等[17]運(yùn)用聚類分析法對(duì)上市公司進(jìn)行財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警,為企業(yè)控制可能會(huì)發(fā)生的財(cái)務(wù)風(fēng)險(xiǎn)提供理論依據(jù)。
無(wú)論是在早期的財(cái)務(wù)困境預(yù)警研究還是信用風(fēng)險(xiǎn)評(píng)估研究中,大多數(shù)學(xué)者選擇將企業(yè)出現(xiàn)財(cái)務(wù)困境或信用違約風(fēng)險(xiǎn)視為平衡問(wèn)題,即認(rèn)為出現(xiàn)金融風(fēng)險(xiǎn)的公司數(shù)量等同于金融狀況正常的公司數(shù)量。然而,在現(xiàn)實(shí)情況中,前者的數(shù)目要遠(yuǎn)小于后者。若基于平衡數(shù)據(jù)集進(jìn)行金融風(fēng)險(xiǎn)預(yù)測(cè),會(huì)致使模型無(wú)法貼合現(xiàn)實(shí)情況,使研究結(jié)果缺乏可信度。然而,如果使用非平衡的數(shù)據(jù)進(jìn)行建模,會(huì)導(dǎo)致模型偏向多數(shù)類樣本,即金融狀況正常公司,從而大幅降低判斷準(zhǔn)確率。目前解決非平衡問(wèn)題對(duì)研究結(jié)果的影響主要從數(shù)據(jù)層和算法層兩個(gè)層面展開(kāi)。
在數(shù)據(jù)層面,學(xué)者們通常采用不同形式的重采樣方法平衡數(shù)據(jù)集中的類別分布,通過(guò)增加少數(shù)類的數(shù)量或減少多數(shù)類的數(shù)量以消除類不平衡問(wèn)題。包括欠采樣、過(guò)采樣以及混合采樣3類方法。文獻(xiàn)[11]通過(guò)隨機(jī)欠采樣方法平衡違約公司和非違約公司的數(shù)量,通過(guò)企業(yè)歷史數(shù)據(jù)預(yù)測(cè)企業(yè)未來(lái)的信用違約風(fēng)險(xiǎn)。ZHOU[18]運(yùn)用2種過(guò)采樣方法和4種欠采樣方法解決企業(yè)破產(chǎn)預(yù)測(cè)的類不平衡問(wèn)題,發(fā)現(xiàn)訓(xùn)練樣本集中少數(shù)類樣本的數(shù)量會(huì)影響不同采樣方法的性能,少數(shù)類樣本數(shù)量較少的時(shí)候應(yīng)選取過(guò)采樣方法,少數(shù)類樣本較多時(shí)欠采樣方法更優(yōu)。過(guò)采樣方法是目前面向不平衡問(wèn)題中應(yīng)用最為廣泛的采樣方法,相對(duì)隨機(jī)過(guò)采樣方法,合成少數(shù)類過(guò)采樣技術(shù)(SMOTE)能夠降低過(guò)擬合的風(fēng)險(xiǎn),增加模型的泛化能力,目前已被廣泛應(yīng)用于財(cái)務(wù)困境預(yù)警領(lǐng)域。
在算法層面,通常不會(huì)對(duì)訓(xùn)練數(shù)據(jù)集做過(guò)多的預(yù)處理,而是通過(guò)考慮各種誤分類情況的成本差異,對(duì)傳統(tǒng)分類器進(jìn)行改進(jìn)和重設(shè)計(jì),提高其對(duì)不平衡數(shù)據(jù)集特殊分類需求的適用性。代表性的方法有代價(jià)敏感學(xué)習(xí)算法和集成學(xué)習(xí)算法。張悅等[19]基于代價(jià)敏感學(xué)習(xí)對(duì)國(guó)內(nèi)上市公司展開(kāi)財(cái)務(wù)造假識(shí)別研究,構(gòu)建財(cái)務(wù)造假識(shí)別模型,實(shí)驗(yàn)結(jié)果表明,該算法能夠有效提升財(cái)務(wù)造假公司的識(shí)別正確率。集成學(xué)習(xí)是指利用特定規(guī)則集成多個(gè)基分類器,從而提高模型的泛化能力。TAO等[20]綜合應(yīng)用了上述兩種學(xué)習(xí)方法,提出了一種以代價(jià)敏感SVM模型為基分類器的Adaboost集成學(xué)習(xí)模型,該方法在G-Mean和F-Measure兩個(gè)評(píng)估指標(biāo)上表現(xiàn)出更好的泛化性能。
1968年,ALTMAN在文獻(xiàn)[4]中使用多元判別分析(MDA)預(yù)測(cè)公司破產(chǎn)的概率,并開(kāi)創(chuàng)性地提出了Z-score模型的概念,為使用統(tǒng)計(jì)學(xué)方法進(jìn)行金融風(fēng)險(xiǎn)預(yù)測(cè)開(kāi)創(chuàng)了先河。此后,線性判別分析(LDA)、因子分析(FA)等統(tǒng)計(jì)學(xué)模型被廣泛應(yīng)用于金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域。盡管統(tǒng)計(jì)學(xué)算法擁有易于計(jì)算、利用便捷等優(yōu)點(diǎn),但其依賴于限制性假設(shè),在一定程度上限制了統(tǒng)計(jì)學(xué)模型的準(zhǔn)確性與適用性。隨著信息技術(shù)的發(fā)展,限制較少的機(jī)器學(xué)習(xí)方法已經(jīng)成為金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域的主流預(yù)測(cè)模型。
機(jī)器學(xué)習(xí)方法的應(yīng)用過(guò)程通常分為兩個(gè)階段:指標(biāo)篩選階段和模型構(gòu)建階段。由于機(jī)器學(xué)習(xí)模型容易受到冗余特征的影響,因此通過(guò)指標(biāo)選擇算法消除冗余特征,能夠防止模型過(guò)擬合,對(duì)提高預(yù)測(cè)模型的準(zhǔn)確性有積極效果。特征選擇方法可以被大致分為3類:過(guò)濾法,包裹法和嵌入法。文獻(xiàn)[10]~文獻(xiàn)[11]及文獻(xiàn)[15]分別使用過(guò)濾法、包裹法和嵌入法對(duì)上市公司金融風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)體系進(jìn)行篩選,提高了模型的可讀性與準(zhǔn)確性。
機(jī)器學(xué)習(xí)模型在財(cái)務(wù)困境預(yù)警問(wèn)題中的應(yīng)用主要分為兩個(gè)模塊:單分類器和集成分類器。單分類器包含決策樹(shù)(DT)、支持向量機(jī)(SVM)和邏輯回歸(LR)等,而集成分類器集成算法按照個(gè)體學(xué)習(xí)器之間的關(guān)系,可以分為Bagging、Boosting、Stacking共3類,其中,使用的較為廣泛的為Bagging法與Boosting法。謝紀(jì)剛等[21]對(duì)比了兩種單分類器和集成分類器在財(cái)務(wù)困境預(yù)警問(wèn)題上的預(yù)測(cè)效果,發(fā)現(xiàn)集成分類器能夠提高模型的預(yù)測(cè)性能。隨后,越來(lái)越多的學(xué)者應(yīng)用集成分類器進(jìn)行金融風(fēng)險(xiǎn)預(yù)測(cè)研究,如文獻(xiàn)[2]、文獻(xiàn)[12]和文獻(xiàn)[14]。
在金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域,雖然機(jī)器學(xué)習(xí)算法相較傳統(tǒng)的統(tǒng)計(jì)方法能夠提供更準(zhǔn)確的預(yù)測(cè)結(jié)果,但算法復(fù)雜度的增加會(huì)造成模型的可解釋性降低,無(wú)法判別模型結(jié)果的合理性,導(dǎo)致難以給出具有可解釋性和說(shuō)服力的風(fēng)控結(jié)論,大幅降低了模型的實(shí)際效益。為提高模型的可解釋性和透明性,建立用戶和決策模型之間的信任關(guān)系,學(xué)術(shù)界主要從兩個(gè)角度來(lái)尋找解決方法:①將解釋方法與模型進(jìn)行結(jié)合的內(nèi)在解釋法和事后解釋法。內(nèi)在解釋法即建立本身就具備可解釋性的模型(決策樹(shù)、線性回歸、logistic回歸等),利用模型所具備的特性為解釋模型提供支持;事后解釋方法即針對(duì)特定的黑盒模型(集合算法或神經(jīng)網(wǎng)絡(luò)等),并在訓(xùn)練后利用某些方法對(duì)其進(jìn)行分析,如特征重要性、梯度積分等。②分離解釋方法和模型的模型無(wú)關(guān)法,能夠增加解釋方法的靈活性和可用性,包含部分依賴圖、個(gè)體條件期望圖以及局部可解釋性描述算法等。
隨著互聯(lián)網(wǎng)、人工智能等技術(shù)的飛速發(fā)展,針對(duì)金融風(fēng)險(xiǎn)預(yù)測(cè)模型的研究也進(jìn)一步深化,經(jīng)歷了從定性到定量,從簡(jiǎn)單到復(fù)雜,從單一算法到集成算法的發(fā)展路線,引起了國(guó)內(nèi)外學(xué)者廣泛關(guān)注。從研究結(jié)果上來(lái)看,基于機(jī)器學(xué)習(xí)的金融風(fēng)險(xiǎn)預(yù)測(cè)模型比基于傳統(tǒng)統(tǒng)計(jì)方法的金融預(yù)測(cè)模型擁有更突出的預(yù)測(cè)性能,能夠?yàn)楝F(xiàn)實(shí)中的金融決策提供理論支撐。
(1)從金融風(fēng)險(xiǎn)預(yù)測(cè)度量指標(biāo)、機(jī)器學(xué)習(xí)分析方法以及機(jī)器學(xué)習(xí)在金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域中的應(yīng)用3個(gè)方面出發(fā),對(duì)金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域的文獻(xiàn)進(jìn)行比較和總結(jié)。研究發(fā)現(xiàn):①在構(gòu)建金融風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)體系時(shí),早期的研究多采用財(cái)務(wù)指標(biāo),近年來(lái)有學(xué)者開(kāi)始陸續(xù)引入非財(cái)務(wù)指標(biāo)作為財(cái)務(wù)信息的補(bǔ)充;②機(jī)器學(xué)習(xí)在金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域擁有廣泛應(yīng)用,其不僅可以解決金融風(fēng)險(xiǎn)預(yù)測(cè)中的非平衡問(wèn)題,還可以構(gòu)建金融風(fēng)險(xiǎn)模型以評(píng)估上市公司出現(xiàn)金融風(fēng)險(xiǎn)的概率;③討論了金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域中度量指標(biāo),總結(jié)了機(jī)器學(xué)習(xí)在財(cái)務(wù)困境預(yù)警領(lǐng)域的應(yīng)用,有助于梳理國(guó)內(nèi)研究現(xiàn)狀,為金融風(fēng)險(xiǎn)預(yù)測(cè)研究提供更為全面的視角。
(2)未來(lái)研究應(yīng)從如下角度進(jìn)行切入:①建立更加多源的金融風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)體系,更進(jìn)一步討論宏觀外部因素在金融風(fēng)險(xiǎn)預(yù)測(cè)中的作用,結(jié)合財(cái)務(wù)指標(biāo)與多種非財(cái)務(wù)指標(biāo)(如宏觀環(huán)境、行業(yè)發(fā)展前景)建立更加多源的財(cái)務(wù)金融風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)體系;②進(jìn)一步考慮模型的可解釋性,對(duì)模型從整體和個(gè)體上進(jìn)行決策解釋,以擴(kuò)大機(jī)器學(xué)習(xí)在金融風(fēng)險(xiǎn)領(lǐng)域中的應(yīng)用;③考慮深度學(xué)習(xí)算法在金融風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用,隨著時(shí)間的推移,上市公司的數(shù)量會(huì)逐步增加,學(xué)者們建立的金融風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)體系會(huì)更加多樣化,將導(dǎo)致樣本數(shù)據(jù)量增加,深度學(xué)習(xí)算法相比機(jī)器學(xué)習(xí)算法會(huì)擁有更好的性能。