(天津財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院 天津 300222)
近年來,我國(guó)商業(yè)銀行的不良貸款余額和不良貸款率持續(xù)上升,2019年2月我國(guó)銀保監(jiān)會(huì)公布了最新的監(jiān)管年報(bào)數(shù)據(jù),2018年末,我國(guó)不良貸款余額達(dá)2.03萬億元,相較2017年末增加了2 800億元,同比增長(zhǎng)16%。與此同時(shí),我國(guó)銀行業(yè)的不良貸款率為1.83%,相較2017年又增加了0.1%。在如此嚴(yán)峻的形勢(shì)下,商業(yè)銀行風(fēng)險(xiǎn)暴露的問題將變得更為尖銳,如果處理不當(dāng),容易引發(fā)系統(tǒng)性風(fēng)險(xiǎn)。未來我國(guó)銀行業(yè)的不良貸款的風(fēng)險(xiǎn)還會(huì)不斷積聚。由此可見,分析影響我國(guó)銀行業(yè)不良貸款率的宏微觀因素,具有十分重要的現(xiàn)實(shí)意義。
分析世界銀行的經(jīng)營(yíng)史可知,導(dǎo)致銀行經(jīng)營(yíng)失敗的原因眾多,但是銀行不良貸款問題是導(dǎo)致銀行經(jīng)營(yíng)危機(jī)的首要原因。因此,銀行不良貸款受到世界各國(guó)廣泛的研究和關(guān)注。從宏觀角度分析,Akinlo和Emmanuel(2014)發(fā)現(xiàn),從長(zhǎng)期看,經(jīng)濟(jì)增長(zhǎng)與不良貸款率呈反向關(guān)系。Tanskovic和Jandric(2015)分析結(jié)果表明這些因素與不良貸款率的增加呈正相關(guān)關(guān)系。徐曉通(2015)經(jīng)過實(shí)證分析得知,M2增長(zhǎng)率對(duì)不良貸款率有顯著的正向影響。商業(yè)銀行不良貸款率受GDP增長(zhǎng)率的影響并與之呈負(fù)相關(guān)關(guān)系,受貨幣供應(yīng)量增長(zhǎng)率的影響并與之呈負(fù)相關(guān)關(guān)系。從銀行自身角度分析,Zelalem(2014)就銀行資產(chǎn)規(guī)模與商業(yè)銀行不良貸款率的關(guān)系進(jìn)行研究,發(fā)現(xiàn)二者之間成正相關(guān)關(guān)系。梁秋霞(2012)研究發(fā)現(xiàn)商業(yè)銀行不良貸款率受銀行的資產(chǎn)負(fù)債率的影響并與之呈正相關(guān)關(guān)系。徐曉通(2015)認(rèn)為我國(guó)商業(yè)銀行不良貸款率受銀行自身的撥備覆蓋率影響,且呈負(fù)相關(guān)關(guān)系。
本文研究的數(shù)據(jù)主要包括兩部分,一部分來源于Wind數(shù)據(jù)庫(kù)中宏觀經(jīng)濟(jì)板塊2014—2018年各項(xiàng)宏觀經(jīng)濟(jì)指標(biāo)數(shù)據(jù),其中包括季度數(shù)據(jù)與月度數(shù)據(jù)。另一部分?jǐn)?shù)據(jù)是銀行自身數(shù)據(jù),來源于Wind數(shù)據(jù)庫(kù)中股票板塊中每只股票的銀行專項(xiàng)指標(biāo)數(shù)據(jù),這部分?jǐn)?shù)據(jù)是16家銀行2014—2018年四個(gè)季度的各個(gè)銀行專項(xiàng)指標(biāo)數(shù)據(jù)。由于其他銀行上市時(shí)間不足5年,所以只篩選出16家銀行,對(duì)數(shù)據(jù)處理如下。第一步,宏觀月度數(shù)據(jù)與宏觀季度數(shù)據(jù)的匹配。對(duì)于宏觀月度數(shù)據(jù)做兩種處理,一種是將各季度的三個(gè)月的數(shù)據(jù)分別作為三個(gè)指標(biāo);另一種月度數(shù)據(jù)處理方法是將各季度三個(gè)月的數(shù)據(jù)的平均值作為一個(gè)指標(biāo)。第二步,16家銀行自身數(shù)據(jù)與宏觀數(shù)據(jù)匹配。將第一步中的兩種宏觀數(shù)據(jù)分別與各個(gè)銀行自身數(shù)據(jù)按照季度對(duì)應(yīng)然后合并。
自變量的選?。簩?duì)預(yù)處理后的數(shù)據(jù)進(jìn)行變量選取,得到四大類自變量。其中微觀層面包括銀行業(yè)務(wù)情況變量及銀行各項(xiàng)貸款業(yè)務(wù)占比情況的變量,宏觀層面包括宏觀經(jīng)濟(jì)情況變量及金融市場(chǎng)流動(dòng)性、風(fēng)險(xiǎn)性指標(biāo)變量。
因變量的選?。阂圆涣假J款率是否上升(Y)作為因變量。本文先選取各銀行企業(yè)每年的不良貸款率為初始變量,然后計(jì)算出當(dāng)年不良貸款率相對(duì)上一年不良貸款率的變動(dòng)值,變動(dòng)值為正代表不良貸款率上升,變動(dòng)值為負(fù)或零代表不良貸款率沒有上升。
分別對(duì)兩個(gè)數(shù)據(jù)集,以最大深度為3的決策樹為基學(xué)習(xí)器,構(gòu)建隨機(jī)森林、AdaBoost、GBDT、XGBoost和LightGBM五種集成學(xué)習(xí)模型(基學(xué)習(xí)器均為50個(gè))。將原始數(shù)據(jù)隨機(jī)劃分為訓(xùn)練集(80%)和測(cè)試集(20%),并對(duì)每個(gè)模型進(jìn)行分類。對(duì)每個(gè)模型重復(fù)進(jìn)行100次樣本劃分與分類,計(jì)算100次分類結(jié)果訓(xùn)練集的準(zhǔn)確率與測(cè)試集的準(zhǔn)確率的平均值,結(jié)果如下。隨機(jī)森林訓(xùn)練集與測(cè)試集的準(zhǔn)確率分別為0.84、0.76,AdaBoost訓(xùn)練集與測(cè)試集的準(zhǔn)確率分別為1、0.74,GBDT訓(xùn)練集與測(cè)試集的準(zhǔn)確率分別為1、0.76,XGBoost訓(xùn)練集與測(cè)試集的準(zhǔn)確率分別為1、0.75,LightGBM訓(xùn)練集與測(cè)試集的準(zhǔn)確率分別為0.83、0.74。比較5個(gè)模型可以發(fā)現(xiàn),默認(rèn)參數(shù)下隨機(jī)森林的預(yù)測(cè)準(zhǔn)確率較高,模型泛化能力較好,AdaBoost、GBDT、XGBoost、LightGBM存在過擬合現(xiàn)象。因此,選擇隨機(jī)森林模型作為預(yù)測(cè)模型。
模型調(diào)優(yōu)后,混頻數(shù)據(jù)集隨機(jī)森林訓(xùn)練集與測(cè)試集的準(zhǔn)確率分別為86.55%、81.25%,同頻數(shù)據(jù)集隨機(jī)森林訓(xùn)練集與測(cè)試集的混淆矩陣的準(zhǔn)確率分別為87.89%、81.25%??梢园l(fā)現(xiàn),兩種數(shù)據(jù)集的隨機(jī)森林模型的測(cè)試集預(yù)測(cè)準(zhǔn)確率均為81.25%,說明建立的模型對(duì)混頻數(shù)據(jù)與同頻數(shù)據(jù)都能準(zhǔn)確地識(shí)別出不良貸款率上升的情況。
隨機(jī)森林模型按照兩種數(shù)據(jù)集給出變量重要性排在前30位的特征。其中,國(guó)內(nèi)信貸規(guī)模、國(guó)房景氣指數(shù)、M2增速、資本充足率、房地產(chǎn)業(yè)貸款額占比,這5個(gè)變量的重要性明顯大于其他變量。
將數(shù)據(jù)按照國(guó)有銀行、股份制銀行及城市商業(yè)銀行將樣本進(jìn)行分類,然后利用隨機(jī)森林模型擬合出影響不同類型銀行不良貸款率變動(dòng)的特征重要性排名。結(jié)果如下,影響國(guó)有銀行不良貸款率變動(dòng)的前六種因素分別為國(guó)房景氣指數(shù)、國(guó)內(nèi)信貸、生產(chǎn)價(jià)格指數(shù)、城鎮(zhèn)登記失業(yè)率、M2增速和商業(yè)銀行的流動(dòng)性比率;影響股份制銀行不良貸款率變動(dòng)的前六種因素分別是國(guó)房景氣指數(shù)、制造業(yè)貸款比例、批發(fā)和零售業(yè)貸款比例、城鎮(zhèn)登記失業(yè)率、商業(yè)銀行的流動(dòng)性比率和國(guó)內(nèi)信貸;影響城商銀行不良貸款率變動(dòng)的前六種因素分別是房地產(chǎn)業(yè)貸款比例、計(jì)息負(fù)債、單一客戶集中度、資本充足率、成本收入比和商業(yè)銀行的流動(dòng)性比率。不難發(fā)現(xiàn)影響國(guó)有銀行不良貸款率變動(dòng)的主要因素為宏觀經(jīng)濟(jì)指標(biāo),影響股份制銀行的主要因素既包括宏觀經(jīng)濟(jì)因素又包括銀行各項(xiàng)貸款占比情況,而城商銀行的不良貸款率變動(dòng)主要受銀行自身業(yè)務(wù)和各項(xiàng)貸款占比的影響。
本文利用機(jī)器學(xué)習(xí)研究銀行不良貸款率的變動(dòng)情況得出以下結(jié)論。
第一,本文構(gòu)建基于隨機(jī)森林的銀行不良貸款率變動(dòng)預(yù)測(cè)模型發(fā)現(xiàn),隨機(jī)森林算法與其他集成學(xué)習(xí)方法比較,在處理樣本少、特征多的數(shù)據(jù)時(shí)預(yù)測(cè)精度更高,模型泛化能力更好。利用隨機(jī)森林構(gòu)建銀行不良貸款率變動(dòng)預(yù)測(cè)模型,能較好地對(duì)銀行不良貸款率上升或下降進(jìn)行預(yù)測(cè),尤其能夠識(shí)別出不良貸款率上升的情況,預(yù)測(cè)精度在90%左右。
第二,研究銀行每季度不良貸款率變動(dòng)時(shí),加入高頻數(shù)據(jù)并做兩種處理。一種是將各季度的三個(gè)月的數(shù)據(jù)作為三個(gè)指標(biāo),另一種是將各季度三個(gè)月的數(shù)據(jù)的平均值作為一個(gè)指標(biāo)。對(duì)比預(yù)測(cè)結(jié)果發(fā)現(xiàn),混頻數(shù)據(jù)同頻數(shù)據(jù)預(yù)測(cè)效果相同,后續(xù)考慮增加樣本進(jìn)一步進(jìn)行比較。
第三,通過分析變量重要性發(fā)現(xiàn),對(duì)整個(gè)的銀行業(yè)來說,國(guó)內(nèi)信貸資金的規(guī)模、房地產(chǎn)行業(yè)景氣程度、貨幣供應(yīng)量增速這些宏觀經(jīng)濟(jì)因素會(huì)影響銀行的不良貸款率的變動(dòng)。對(duì)不同類型的銀行分析發(fā)現(xiàn),低水平國(guó)內(nèi)信貸規(guī)模、高失業(yè)率以及貨幣供應(yīng)量增速緩慢,容易引起國(guó)有銀行不良貸款率上升;較高的制造業(yè)或批發(fā)和零售業(yè)貸款額占比、較高的社會(huì)失業(yè)率都易引起股份制銀行不良貸款率的上升;客戶集中度高、較高銀行成本收入容易引起城商銀行不良貸款率的上升。綜合可以發(fā)現(xiàn)國(guó)有銀行受宏觀經(jīng)濟(jì)情況及金融系統(tǒng)流動(dòng)性的影響比較大,股份制銀行與城商銀行受自身因素的影響比較大。