摘要:在對(duì)農(nóng)村商業(yè)銀行貸款信用風(fēng)險(xiǎn)影響因素進(jìn)行理論分析的基礎(chǔ)上,通過(guò)收集某農(nóng)村商業(yè)銀行的實(shí)際貸款數(shù)據(jù),運(yùn)用隨機(jī)森林算法和Logistic模型對(duì)貸款數(shù)據(jù)進(jìn)行實(shí)證分析,得出影響農(nóng)村商業(yè)銀行貸款違約風(fēng)險(xiǎn)的若干因素,為該農(nóng)村商業(yè)銀行降低貸款違約風(fēng)險(xiǎn),提供了借鑒依據(jù)。
關(guān)鍵詞:農(nóng)村商業(yè)銀行 信用風(fēng)險(xiǎn) Logistic模型
1 概述
在我國(guó),信貸業(yè)務(wù)收入作為銀行的主要收入,其貸款質(zhì)量的高低,直接影響著銀行業(yè)的盈利水平,而對(duì)貸款違約影響因素的分析能夠有效輔助貸款質(zhì)量的評(píng)估,幫助銀行避免不必要的損失。由于我國(guó)銀行體系的特殊性,農(nóng)村商業(yè)銀行與國(guó)有商業(yè)銀行及其他股份制銀行相比,自身基礎(chǔ)比較薄弱,為了幫助農(nóng)村商業(yè)銀行更加有效管理貸款風(fēng)險(xiǎn),從源頭把該風(fēng)險(xiǎn)降到最低,本文在實(shí)地調(diào)研的基礎(chǔ)上,利用所得數(shù)據(jù),對(duì)農(nóng)村商業(yè)銀行貸款違約影響因素進(jìn)行研究。
范英[1]和蔡冬林[2]研究表明,貸款風(fēng)險(xiǎn)的影響因素包括借款人因素、信用環(huán)境因素、歷史因素和內(nèi)部管理因素4大類。李正波[3]等以調(diào)研數(shù)據(jù)為依托,采用Logistic模型對(duì)我國(guó)農(nóng)村信用社農(nóng)戶貸款信用風(fēng)險(xiǎn)進(jìn)行了實(shí)證研究,結(jié)果顯示:非種養(yǎng)業(yè)收入、自營(yíng)支出、貸款期限、利率、信用社服務(wù)對(duì)農(nóng)戶的違約行為影響顯著,農(nóng)戶年齡和教育程度對(duì)農(nóng)戶的違約行為影響也較大。余江[4]和陳東海等[5]的研究表明,借款人特征、擔(dān)保方式、貸款利率和期限等貸款特征,社會(huì)信用環(huán)境和銀行對(duì)信貸風(fēng)險(xiǎn)的控制能力等因素可以作為判斷貸款人是否存在道德風(fēng)險(xiǎn)的指標(biāo)。
農(nóng)村商業(yè)銀行的信貸風(fēng)險(xiǎn)管理問(wèn)題研究相比于四大商業(yè)銀行信貸風(fēng)險(xiǎn)管理問(wèn)題研究還是非常薄弱的。本文以某農(nóng)村商業(yè)銀行為例,研究影響該農(nóng)村商業(yè)銀行貸款違約的因素,以期為農(nóng)村商業(yè)銀行的貸款質(zhì)量管理提供有效幫助。
2 商業(yè)銀行貸款違約影響因素分析
歐美等國(guó)家對(duì)于商業(yè)銀行貸款違約風(fēng)險(xiǎn)的研究比較多,影響因素主要包括借款人性別、年齡、種族、貸款金額、貸款年限、貸款價(jià)值比、貸款期限等。在參考國(guó)內(nèi)外學(xué)者對(duì)于該問(wèn)題研究的基礎(chǔ)上,本文又根據(jù)所選研究農(nóng)商行的特殊性,選擇了貸款利率,擔(dān)保方式,還款方式等11個(gè)因素作為貸款違約的影響因素。
3 非參數(shù)隨機(jī)森林法和Logistic回歸模型
由于貸款違約分析的數(shù)據(jù)分布復(fù)雜,特征較多,并且噪聲很大,同時(shí)自變量又分為連續(xù)屬性和離散屬性,用傳統(tǒng)方法難以達(dá)到滿意的評(píng)估效果。本文引入非參數(shù)隨機(jī)森林法對(duì)原始自變量屬性進(jìn)行篩選,再用Logistic回歸模型對(duì)該農(nóng)村商業(yè)銀行貸款違約因素進(jìn)行系統(tǒng)建模與定性分析。
3.1 非參數(shù)隨機(jī)森林算法 隨機(jī)森林(Random Forest,RF)算法是由Leo Breriman于2001年提出的一種分類和預(yù)測(cè)算法。在本研究中采用的是投票的方式,具體公式如下。
H(x)=argmax h(x,θi)
隨機(jī)森林的生成流程圖如下圖所示:
隨機(jī)森林算法是一種可以運(yùn)用在分類問(wèn)題和回歸問(wèn)題中的學(xué)習(xí)方法,具有以下幾個(gè)優(yōu)點(diǎn):①適用于數(shù)據(jù)量大噪聲大的數(shù)據(jù);②有效防止數(shù)據(jù)過(guò)度擬合的發(fā)生;③能夠區(qū)分出分類中重要的特征。
3.2 Logistic回歸模型 Logistic模型是一種概率統(tǒng)計(jì)模型,廣泛應(yīng)用于因變量為二分類變量的分析中。在其對(duì)貸款違約概率測(cè)算的運(yùn)用中,貸款分為違約和不違約兩種情況,服從logistic分布,因此,本文將影響貸款人違約概率的主要指標(biāo)屬性作為模型的自變量,通過(guò)建立logistic模型對(duì)貸款人發(fā)生財(cái)務(wù)困境的可能性即貸款違約的概率進(jìn)行預(yù)測(cè)分析。對(duì)應(yīng)的多元logistic回歸模型形式為:
In( )=β0+β1X1+β2X2+…+βnXn+μn
其中,P 為貸款違約事件發(fā)生的概率,1-P 為不發(fā)生的概率,βn為待估計(jì)系數(shù),Xn為屬性變量,μn是隨機(jī)誤差項(xiàng)。
4 變量設(shè)計(jì)與模型實(shí)證
基于國(guó)外學(xué)者的研究和現(xiàn)有數(shù)據(jù)的收集,本文對(duì)貸款人特征維度和貸款特征為度下的屬性變量進(jìn)行分析。首先運(yùn)用非參數(shù)隨機(jī)森林法對(duì)數(shù)據(jù)進(jìn)行篩選和分類,然后運(yùn)用logistic回歸模型對(duì)經(jīng)過(guò)隨機(jī)森林篩選出來(lái)的屬性變量進(jìn)行建模,分析各因素對(duì)該農(nóng)村商業(yè)銀行貸款違約風(fēng)險(xiǎn)的影響方向和程度。
4.1 樣本數(shù)據(jù)與變量設(shè)計(jì) 本文使用的數(shù)據(jù)是某農(nóng)村商業(yè)銀行14年內(nèi)的貸款數(shù)據(jù),獲得有效樣本35866條,其中違約樣本4265條,非違約樣本31601條。本文研究所選的變量及量化方法用表1說(shuō)明。其中,因變量為貸款是否違約,貸款違約賦值為1,貸款不違約賦值為0。
4.2 建模與實(shí)證分析 對(duì)于該農(nóng)村商業(yè)銀行貸款違約風(fēng)險(xiǎn)的實(shí)證分析,主要是通過(guò)對(duì)貸款人的自身特征和貸款特征等屬性變量進(jìn)行統(tǒng)計(jì)分析,尋找、衡量和評(píng)價(jià)影響違約風(fēng)險(xiǎn)的因素,分析各變量對(duì)違約風(fēng)險(xiǎn)的影響方向和影響程度。
首先,運(yùn)用R語(yǔ)言對(duì)初始數(shù)據(jù)進(jìn)行數(shù)據(jù)清理和整合,并建立隨機(jī)森林模型參數(shù)設(shè)置以及構(gòu)建完整隨機(jī)森林模型,運(yùn)行結(jié)果如表2所示。
由結(jié)果可以看出,非違約判定為違約的錯(cuò)誤率為13.49%,違約判定為非違約的錯(cuò)誤率為14.54%,總體錯(cuò)誤率為13.92%,即正確率為86.08%,說(shuō)明判定效果比較好。
模型的函數(shù)表達(dá)式可以表示為:
Z=-2.456+0.0015creditlength+0.309rate-1.049yn_
crating-1.861I3-1.324I5-0.728I6-2.159I9-1.393I10-0.797I12-
0.623I13-1.508I14-0.7I16-0.84I18-1.173I20
當(dāng)Pi= >0.5時(shí),這筆貸款很可能發(fā)生違約;反之,即為正常貸款。
實(shí)證分析結(jié)果表明,在結(jié)合前人研究和該農(nóng)村商業(yè)銀行實(shí)際情況所選擇的13個(gè)分析變量中,對(duì)貸款違約影響顯著的有4個(gè)變量,其具體的分析結(jié)果為:
①貸款期限的系數(shù)估計(jì)值為0.0015,說(shuō)明貸款期限越長(zhǎng),該筆貸款違約發(fā)生的概率越大。②貸款利率的系數(shù)估計(jì)值為0.309,說(shuō)明貸款利率越高,該筆貸款違約發(fā)生的概率越大。③有無(wú)信用評(píng)級(jí)的系數(shù)估計(jì)值為-1.049,說(shuō)明有信用評(píng)級(jí)的客戶比沒(méi)有信用評(píng)級(jí)的客戶違約率要低。④反映貸款分支機(jī)構(gòu)影響因素的22個(gè)虛擬變量中有11個(gè)非常顯著且系數(shù)估計(jì)值均為負(fù)值,說(shuō)明這些分支機(jī)構(gòu)的貸款相比于其它分支機(jī)構(gòu)的貸款違約率要低。
5 結(jié)論
本文通過(guò)分析logistic模型可處理因變量為二分變量以及對(duì)自變量沒(méi)要求等特點(diǎn),針對(duì)找出影響某農(nóng)村商業(yè)銀行貸款違約率影響因素的問(wèn)題,提出采用隨機(jī)森林算法篩選特征變量然后用logistic模型分析特征變量對(duì)貸款違約率的影響方向。最后通過(guò)實(shí)例驗(yàn)證證明該算法和模型具有良好的分析效果,同時(shí)本文的研究對(duì)增強(qiáng)農(nóng)村商業(yè)銀行的風(fēng)險(xiǎn)管理能力和盈利能力有積極的幫助和意義。
參考文獻(xiàn):
[1]范英.商業(yè)銀行信貸風(fēng)險(xiǎn)管理與識(shí)別[J].科技與管理,2000(4):66-70.
[2]蔡?hào)|林.農(nóng)村信用社資產(chǎn)風(fēng)險(xiǎn)的管理措施[J].金融與經(jīng)濟(jì),2001(12):47-48.
[3]李正波,高杰,崔衛(wèi)杰.農(nóng)村信用社農(nóng)戶貸款的信用風(fēng)險(xiǎn)評(píng)價(jià)研究[J].北京電子科技學(xué)院學(xué)報(bào),2006(1):69-74.
[4]余江.借款人道德風(fēng)險(xiǎn)甄別與信貸合同安排[J].武漢金融,2007(9):45-47.
[5]陳東海,謝赤.關(guān)于信用風(fēng)險(xiǎn)管理模型的比較分析[J].社會(huì)學(xué)家,2005(2):75-76.
基金項(xiàng)目:天津市哲學(xué)社會(huì)科學(xué)規(guī)劃資助項(xiàng)目(TJGL13-019)。
作者簡(jiǎn)介:
李易衡(1988-),女,河南商丘人,碩士,研究方向:貸款風(fēng)險(xiǎn)、資產(chǎn)轉(zhuǎn)移定價(jià)。