陸一
摘 要:農(nóng)村商業(yè)銀行控制運營成本、提升經(jīng)濟效益的重要手段是信貸風險管理,但是銀行每天都需要處理大量的信貸業(yè)務。本文針對農(nóng)村商業(yè)銀行信貸業(yè)務中風險較高等問題,設計了一種基于決策樹算法的信貸風險評估模型。該模型具有較高的準確率,為銀行信貸風險評估提供重要決策依據(jù)。
關鍵詞:決策樹 銀行信貸 風險評估
中圖分類號:F304.4 文獻標識碼:A 文章編號:1672-3791(2018)12(c)-0018-02
隨著近年來國家對中小金融企業(yè)發(fā)展的支持,農(nóng)村商業(yè)銀行的信貸業(yè)務的種類也日益豐富,信貸業(yè)務更加復雜,信貸風險管理系統(tǒng)有了更高的要求,因此只有通過先進的管理工具和途徑、統(tǒng)一的信息化管理技術,這樣才能對信貸業(yè)務實行科學、規(guī)范化的管理,進一步實現(xiàn)對信貸資產(chǎn)的有效的風險控制和有效監(jiān)管。
就浙江省來看,日前浙江省農(nóng)村信用社下的各農(nóng)村商業(yè)銀行(或正處于改革下的農(nóng)村合作銀行和農(nóng)村信用社)都是改革的攻堅階段,隨著經(jīng)營規(guī)模的不斷擴大及其信貸業(yè)務種類的增加,信貸風險管理的難度也必然會加大,這更要依賴先進的管理工具、統(tǒng)一的信息化技術,這樣才能科學規(guī)范化地管理信貸業(yè)務的過程。為了最大化地實現(xiàn)信息的共享,加強農(nóng)村商業(yè)銀行系統(tǒng)內(nèi)的信息規(guī)范化和數(shù)據(jù)的管理,構建更為安全、有效、規(guī)范的信貸風險管理系統(tǒng)成為必然趨勢,這樣才能滿足新形勢下應對農(nóng)村商業(yè)銀行經(jīng)營的風險并且不斷擴大業(yè)務規(guī)模,才能可持續(xù)地發(fā)展農(nóng)村商業(yè)銀行。
1 決策樹算法介紹
C4.5算法是決策樹生成的一種十分經(jīng)典的算法,這個算法是對ID3算法的優(yōu)化。針對ID3算法C4.5做的主要改進有以下幾點:(1)通過信息增益來決定屬性分裂的值。(2)能夠處理處理連續(xù)性還有離散型數(shù)據(jù)。(3)把決策樹構造完成后能夠進行剪枝,簡化決策樹。(4)能夠處理有缺失的樣本數(shù)據(jù)。
在C4.5算法中,只通過屬性的信息增長率選擇分裂屬性的。如公示(1)所示,判斷屬性的分裂值即split information:
2 信貸風險評估模型
2.1 決策屬性選擇
以桐鄉(xiāng)市農(nóng)村信用合作社個人貸款客戶歷史數(shù)據(jù)中,取一小部分數(shù)據(jù)作為訓練集生成決策樹,并生成客戶信用等級評定模型。指標的合理選取對于模型的有效性有著的影響,為了指標的全面性以及準確性,個人貸款客戶信用評估指標體系共分為若干項,經(jīng)過仔細的調(diào)查研究,可以分為年齡、貸款與收入的比值,學歷、還貸與收入的比值,是否有違約記錄等5個屬性值,具體如表1所示?,F(xiàn)隨機抽取兩萬名客戶的信息進行訓練以生成決策樹。
年齡屬性:是從數(shù)據(jù)庫中的記錄的數(shù)據(jù)獲取。
學歷屬性:也是和年齡屬性一樣,都是通過數(shù)據(jù)庫的原始數(shù)據(jù)獲取。
貸款金額比:貸款金額比是貸款總金額和年收入的比值,通過該屬性可以判斷該客戶貸款的金額是否超出能力范圍。其計算公式:X3=貸款總金額/年收入。
還款金額比:還款金額比是月還款金額與月收入的比值,這個屬性可以判斷客戶的還款能力。計算公式:X4=月還款金額/(年收入/12)。
是否有違約記錄:該屬性是判斷用戶是否有違約記錄,具有一票否決權,即表示有任何違約記錄,就拒絕貸款。
2.2 決策樹剪枝
由于決策樹的建立完全是依賴于訓練樣本,因此該決策樹對訓練樣本能夠產(chǎn)生完美的擬合效果。但這樣的決策樹對于測試樣本來說過于龐大而復雜,可能產(chǎn)生較高的分類錯誤率。這種現(xiàn)象就稱為過擬合。因此需要將復雜的決策樹進行簡化,即去掉一些節(jié)點解決過擬合問題,這個過程稱為剪枝。
剪枝方法分為預剪枝和后剪枝兩大類。預剪枝是在構建決策樹的過程中,提前終止決策樹的生長,從而避免過多的節(jié)點產(chǎn)生。預剪枝方法雖然簡單但實用性不強,因為很難精確的判斷何時終止樹的生長。后剪枝是在決策樹構建完成之后,對那些置信度不達標的節(jié)點子樹用葉子結點代替,該葉子結點的類標號用該節(jié)點子樹中頻率最高的類標記。對于一個葉子節(jié)點,這個節(jié)點覆蓋了N個樣本,其中有e個是錯誤的分類,那么整棵樹的錯誤判斷值為,其中0.5為懲罰因子,通過經(jīng)驗判斷,懲罰因子一般設定為0.5.那么對于一整顆樹的誤判率就為:
式(4)中,l為所有節(jié)點的個數(shù)表示該節(jié)點中的所有樣本,表示節(jié)點錯誤的樣本。一旦求得的整個數(shù)的誤判錯誤率的均值加上標準差,小于節(jié)點的均值誤差,那么就可以將子樹替換葉子節(jié)點,即表示為剪枝。
3 規(guī)則描述
根據(jù)C4.5決策樹模型,對給定的5個屬性構建了一顆決策樹,其決策樹如圖1所示,為了更為清晰地了解決策模型,將決策樹轉變?yōu)橄铝幸?guī)則。決策樹將信用等級分為A、B、C、D這4個等級,其中信用等級為A的表示還款能力強,貸款風險低。D則表示信用等級最低,風險最高。根據(jù)決策樹模型來看,年齡較小,學歷越高則風險越低。年齡較大,學歷越低,并且貸款金額和收入比越高風險越大。
4 結語
本文針對農(nóng)村商業(yè)銀行信貸業(yè)務中風險較高等問題,設計了一種基于決策樹算法的信貸風險評估模型。通過決策樹模型發(fā)現(xiàn),在農(nóng)村商業(yè)銀行信貸業(yè)務中,年齡較小,學歷越高則風險越低。年齡較大,學歷越低,并且貸款金額和收入比越高風險越大。該模型對輔助信貸決策有著重要的作用。
參考文獻
[1] 侯斌甲.基于B/S架構的個人信貸系統(tǒng)的研究與實現(xiàn)[D].蘭州大學,2016.
[2] 張韶峰.大數(shù)據(jù)在信貸和保險領域的實踐[J].新經(jīng)濟,2016(19):48-50.
[3] 張彥.河南農(nóng)信社信貸管理系統(tǒng)的設計與實現(xiàn)[D].天津大學,2016.
[4] 曹可雲(yún)荻.基于B/S結構的商業(yè)銀行信貸管理系統(tǒng)的設計與實現(xiàn)[D].吉林大學,2016.
[5] 王宣強.基于REST的銀行信貸系統(tǒng)API體系研究[J].金融電子化,2016(3):79-80.
[6] 嚴曄瑋.建設銀行宜春分行小企業(yè)信貸管理系統(tǒng)的研究與分析[D].云南大學,2016.