黃嘉斌
(中國建設(shè)銀行股份有限公司義烏分行,浙江 金華 322000)
當(dāng)前,我國很多銀行小型網(wǎng)點受到硬件設(shè)施、數(shù)據(jù)處理技術(shù)的等方面限制,無法有效的把握貸款相關(guān)信息,進而無法準(zhǔn)確、有效地評估信貸風(fēng)險,容易出現(xiàn)決策失誤現(xiàn)象,因此對銀行信貸風(fēng)險管理期間數(shù)據(jù)挖掘技術(shù)的應(yīng)用開展深入研究,對于降低信貸風(fēng)險、維護金融市場穩(wěn)定有著重要的指導(dǎo)意義。
數(shù)據(jù)挖掘是指在海量數(shù)據(jù)中將一些隱藏,卻又具有價值的數(shù)據(jù)進行發(fā)現(xiàn)、提取的方法,具體是指將一些不為人知的、具有未知性、規(guī)律性、隱蔽性的信息進行發(fā)現(xiàn),提取的整個過程。
信貸風(fēng)險可以劃分為市場性風(fēng)險、非市場性風(fēng)險,其中市場性風(fēng)險多數(shù)來自于借款企業(yè)、借款人的生產(chǎn)以及銷售風(fēng)險,主要是指借款放在生產(chǎn)、銷售自身產(chǎn)品期間,由于市場條件、生產(chǎn)技術(shù)的變動的所引起的風(fēng)險。非市場風(fēng)險包括社會風(fēng)險、自然風(fēng)險,自然風(fēng)險是指因自然因素造成借款人的經(jīng)濟遭受損失,無法償還信貸本息風(fēng)險;社會風(fēng)險表示由組織、個人在社會上的某些行為所引起的風(fēng)險。
利用數(shù)據(jù)挖掘,可利用不同類別貸款特征建立貸款管理模型,一旦有新貸款申請,當(dāng)即利用模型來判斷貸款類別,銀行可依據(jù)模型的類別,對貸款申請采取針對性措施,同時,在應(yīng)用數(shù)據(jù)挖掘期間,會每隔一段時間,就對每一筆貸款開展重新分類,進而有效提高信貸風(fēng)險管理力度。
1.銀行信貸原始數(shù)據(jù)描述。我國一些銀行網(wǎng)點設(shè)立于縣級,乃至是縣級以下的地域,這些小型銀行所開展的貸款業(yè)務(wù)主要面對來自于農(nóng)村地區(qū)的客戶,例如某商業(yè)銀行開展的小額貸款業(yè)務(wù),分為農(nóng)戶、商戶兩種,本次研究以商戶小額貸款為研究對象。商戶小額度貸款可分為商戶聯(lián)保貸款、商戶保證貸款,在對此類小型某商業(yè)銀行的商業(yè)信貸風(fēng)險管理開展數(shù)據(jù)挖掘期間,為了不會侵犯到貸款客戶的隱私,避免客戶信息的泄露,在數(shù)據(jù)提取階段,將商戶的姓名、居住地址、店鋪位置、企業(yè)名稱、聯(lián)系方式、營業(yè)執(zhí)照編號等數(shù)據(jù)信息進行過濾,經(jīng)過對海量客戶相關(guān)數(shù)據(jù)分析之后,將數(shù)據(jù)提取確認(rèn)為如下字段:(1)客戶代碼;(2)婚姻狀況;(3)教育程度;(4)主營業(yè)務(wù);(5)經(jīng)營年限;(6)年齡;(7)貸款種類;(8)貸款額度;(9)貸款期限;(10)客戶流動總資產(chǎn);(11)固定總資產(chǎn);(12)客戶負(fù)載;(13)客戶還款方式;(14)客戶月凈收入;(15)客戶月投入;(16)客戶信用信息[1]。
2.數(shù)據(jù)預(yù)處理。數(shù)據(jù)采集的第二步,就是對錯誤、空值數(shù)據(jù)進行預(yù)處理,數(shù)據(jù)預(yù)處理的過程為數(shù)據(jù)收集——數(shù)據(jù)選擇——數(shù)據(jù)清理——數(shù)據(jù)轉(zhuǎn)換,在上一部分,針對某某商業(yè)銀行信貸管理業(yè)務(wù),進行了17個屬性字段的數(shù)據(jù)收集,隨后,以隨機的方式在數(shù)據(jù)庫中對100條貸款用戶信息記錄進行收集、整理,整理過后經(jīng)過處理,去除無參考價值的數(shù)據(jù),對剩余的屬性字段進行概化,如表1:
表1 屬性字段概化結(jié)果表
在本次開展分類抽取整理的客戶資料當(dāng)中,有52個為已經(jīng)分類的案例,其中關(guān)注類9例,次級類6例,可疑類5例、損失類2例、正常類30例,此外,一般損失類借款人的相關(guān)財務(wù)資料都難以獲取,因此只有其他4類參與,即:正常類=30,關(guān)注類=9;次級類=6,可疑類=5,損失類=2。
3.構(gòu)造決策樹。將上表中過濾后的數(shù)據(jù),轉(zhuǎn)換成CSC Data Files格式時WEKA可以讀取,隨后使用WEKA建造模型,選擇建立決策樹方法建立決策樹,采用準(zhǔn)確率最高的J48分類器。
4.評估模型。以分類模型和樣本數(shù)據(jù)作為依據(jù),利用測試樣本的百分比來表示模型預(yù)測的準(zhǔn)確率,假設(shè)正確率可接受,那么就可以用于指導(dǎo)對客戶群的分流,J48分類器通過默認(rèn)粉分層10折較差驗證,準(zhǔn)確率高達82%,為可以接受范圍,此刻,當(dāng)銀行收到新的貸款申請,就可以利用模型得出估計的類別,進而對不同的類別采取針對性的措施,如果貸款類型為正常范圍,直接審批通過,弱勢關(guān)注范圍,就需要對其加強審查、加強貸后檢查或是對其進行拒絕,進一步提高信貸資產(chǎn)安全性,有效控制銀行信貸風(fēng)險[2]。
本次研究,針對銀行信貸風(fēng)險管理中數(shù)據(jù)挖掘的應(yīng)用進行了深入研究,在分析數(shù)據(jù)挖掘、銀行信貸風(fēng)險的基礎(chǔ)上,分別對數(shù)據(jù)挖掘中的原始數(shù)據(jù)描述,、數(shù)據(jù)預(yù)處理、決策樹構(gòu)造、評估模型開展深入的研究,通過本次研究,可以明確數(shù)據(jù)挖掘的每個步驟經(jīng)過,相關(guān)行業(yè)可以借鑒本次研究,將數(shù)據(jù)挖掘應(yīng)用到銀行的信貸風(fēng)險管理中,以確保信貸資產(chǎn)的安全性,降低信貸風(fēng)險。