王磊
摘?要:當前互聯(lián)網(wǎng)金融行業(yè)飛快發(fā)展,各種P2P網(wǎng)絡(luò)借貸公司不斷涌現(xiàn),這種新型的借貸模式具有很多優(yōu)點,但是也存在相應(yīng)的問題,如何做好借款人的個人信用評價是保證P2P網(wǎng)貸行業(yè)健康運營的最重要一環(huán)。通過對近些年國內(nèi)外個人信用評價模型的研究,以拍拍貸網(wǎng)站的用戶數(shù)據(jù)為例,建立信用個人信用評價指標體系,利用BP神經(jīng)網(wǎng)絡(luò)算法,建立了借款人個人信用評價模型,為了達到更好的效果,采用不同的激活函數(shù)及權(quán)值調(diào)整方法進行模型優(yōu)化,最終建立基于擬牛頓算法的BP神經(jīng)網(wǎng)絡(luò)模型,能達到對用戶信命評級96.28%的準確率。
關(guān)鍵詞:P2P網(wǎng)絡(luò)借貸;信用風(fēng)險;BP神經(jīng)網(wǎng)絡(luò);指標體系
中圖分類號:TB?文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2019.03.095
1?研究背景
隨著互聯(lián)網(wǎng)科技的不斷進步,P2P網(wǎng)絡(luò)借貸應(yīng)勢而生,這種互聯(lián)網(wǎng)創(chuàng)新模式主要是為了解決中小型企業(yè)融資難的問題,P2P網(wǎng)絡(luò)借貸為中小企業(yè)和私人資金需求者提供了高效快捷的融資渠道。在行業(yè)飛速發(fā)展的同時,問題也開始不斷顯現(xiàn),出現(xiàn)了很多平臺倒閉、跑路、提現(xiàn)困難等問題,使得建立并完善P2P自身征信體系迫在眉睫。本文結(jié)合國內(nèi)行業(yè)實際情況,剖析P2P業(yè)務(wù)的風(fēng)險特征,借助BP神經(jīng)網(wǎng)絡(luò)的方法評價借款人的信用風(fēng)險,通過不同的訓(xùn)練算法使得模型的評價結(jié)果更為準確合理,對平臺今后的信用評價起到了一定的參考作用。
2?數(shù)據(jù)準備
本文的數(shù)據(jù)取自拍拍貸,利用Python軟件,編寫爬蟲代碼,爬取1352條信用記錄。為了保證數(shù)據(jù)質(zhì)量,首先對于指標缺失值過半的信用記錄進行刪除,剔除無效樣本,最終留下974條信用記錄。拍拍貸網(wǎng)站用魔鏡等級作為信用評價的標準,主要分為AA、A、B、C、D、E、F共7個等級,經(jīng)過調(diào)研發(fā)現(xiàn),魔鏡等級主要集中在AA、B、C三者中,其他等級的信用記錄相對較少甚至為零,所以,本文將信用等級分為三大類,具體劃分方法及信用記錄條數(shù)見表1。
3?構(gòu)建指標體系及打分表
從拍拍貸上爬取的每條信用記錄都有31各指標,通過相關(guān)性檢驗,有13個指標通過檢驗,分別為個人基本信息:年齡、性別、文化程度、借款用途、還款來源、工作信息、收入情況、網(wǎng)絡(luò)借貸平臺借款余額、認證信息。歷史信用記錄:正常還清次數(shù)、逾期筆數(shù)。負債相關(guān):待還金額、歷史最高負債。
科學(xué)完善的評估指標體系起著衡量評估結(jié)果是否公正的作用,為了盡量客觀的對定性變量進行量化打分,本文對每個指標做出各指標與借款人信用交叉表。以性別為例,表格樣式大致如表2。
通過建立借款人信用分類及性別交叉表格,可以清楚的發(fā)現(xiàn)女性的信用評級為良好的比重更大,而男性的信用評級則傾向于較差,所以男性賦值為0,女性賦值為1。由于本文篇幅所限,其余指標量化打分表不做贅述,指標量化打分表見表3。
根據(jù)信用評級打分表,將網(wǎng)站所爬取的數(shù)據(jù)進行量化處理,然后對數(shù)據(jù)進行缺失值處理、數(shù)據(jù)規(guī)范化處理。本文采用EM算法填補缺失值,采用X-min(X)/maxX-min(X)進行數(shù)據(jù)歸一化處理,從源頭保證數(shù)據(jù)質(zhì)量。
4?模型的建立與調(diào)優(yōu)
4.1?模型簡介
BP神經(jīng)網(wǎng)絡(luò)又稱為誤差反向傳播神經(jīng)網(wǎng)絡(luò),目前廣泛應(yīng)用于分類、預(yù)測等領(lǐng)域。BP神經(jīng)網(wǎng)絡(luò)可以依托不同的數(shù)學(xué)函數(shù),而做到學(xué)習(xí)和存儲大規(guī)模輸入、輸出,并且不用事先設(shè)定某種特定對應(yīng)關(guān)系。完整的BP神經(jīng)網(wǎng)絡(luò)包含了輸入、隱含、輸出三層次網(wǎng)絡(luò)結(jié)構(gòu)。
用數(shù)學(xué)的方式將BP神經(jīng)網(wǎng)絡(luò)模型可以表示為:
其中Y代表輸出向量,X是輸入向量,W是輸入層和隱含層間連接權(quán)向量,B1、B2分別為隱含層和輸出層的閾值向量,V為隱含層與輸出層間連接權(quán)向量,g為傳遞函數(shù)。
4.2?模型參數(shù)選擇
就本文而言,輸入指標有13個,所以輸入層節(jié)點個數(shù)為13,輸出層的指標為信用分類,只有1個,輸出節(jié)點數(shù)為1。對于隱含層的個數(shù)設(shè)置是設(shè)計的重要環(huán)節(jié),它確定會密切影響到最后輸出結(jié)果的準確性,目前關(guān)于隱層節(jié)點的設(shè)定并沒有一個唯一的準則,公認的經(jīng)驗公式有以下4種:
根據(jù)以往經(jīng)驗及本文的背景,選擇第三種作為隱層節(jié)點數(shù)的確認方法,隱層節(jié)點數(shù)的范圍為[4,13]。
4.3?模型的建立
將規(guī)范化處理后的數(shù)據(jù)進行神經(jīng)網(wǎng)絡(luò)建模,隨機抽取80%的信用記錄進行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,剩余20%的信用記錄對模型的結(jié)果進行檢驗。根據(jù)以往經(jīng)驗,設(shè)置神經(jīng)網(wǎng)絡(luò)模型的最大迭代次數(shù)為2000次,目標誤差值為0.0001,輸入節(jié)點數(shù)為13,輸出節(jié)點數(shù)為1,隱層節(jié)點數(shù)根據(jù)經(jīng)驗公式,取值在[4,13]之間,目前不做決定,帶入不同神經(jīng)網(wǎng)絡(luò)探索后取得。BP神經(jīng)網(wǎng)絡(luò)具有不同的激活函數(shù)和優(yōu)化訓(xùn)練算法,常見的激活函數(shù)有空操作的激活函數(shù)(identity)、邏輯斯蒂函數(shù)(logistic)、雙曲正切函數(shù)(tanh)、線性整流函數(shù)(relu),常見的訓(xùn)練算法有很多,結(jié)合本文的具體問題及算法特點,決定采用擬牛頓算法(lbfgs)、隨機梯度下降算法(sgd)、自適應(yīng)時刻估計方法(adam)進行訓(xùn)練,為了得到更好的預(yù)測分類效果,本文對以上四種激活函數(shù)、三種訓(xùn)練方法進行遍歷組合。
經(jīng)過綜合考慮,最終決定采用relu激活函數(shù),13-9-1的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),此種網(wǎng)絡(luò)結(jié)構(gòu)的模型10次平均迭代次數(shù)為226.9次,平均誤差為0.011206,判斷準確率為97.50%。
其余兩種方法確定過程類似,篇幅所限,不再贅述,sgd方法下選取tanh激活函數(shù),節(jié)點數(shù)為8時模型效果最優(yōu)。adam方法下選取tanh激活函數(shù),節(jié)點數(shù)為11時模型效果最優(yōu),接下來將剩余20%數(shù)據(jù)帶入三種最優(yōu)模型進行驗證。
我們選取20%的數(shù)據(jù)195條信用記錄,帶入三種最優(yōu)的模型,結(jié)果如表4,列舉5位。
表5列出了所有驗證數(shù)據(jù)集的平均準確率、絕對誤差及相對誤差,可以清楚顯示基于lbfsg方法建立的BP神經(jīng)網(wǎng)絡(luò)模型可以達到最優(yōu)的模型評價效果,對數(shù)據(jù)預(yù)測的準確率能達到96.28%。
5?結(jié)論
本文通過搭建P2P個人信用評級密切相關(guān)指標體系并創(chuàng)建各指標交叉信用表進行更加客觀合理的打分,建立了基于lbfsg方法的BP神經(jīng)網(wǎng)絡(luò),實現(xiàn)了對借款人信用評級96.28%的準確預(yù)測。結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)模型具有良好的特征抽取和知識發(fā)現(xiàn)能力,具有一定的推廣性。
參考文獻
[1]李昕,戴一成.基于BP神經(jīng)網(wǎng)絡(luò)的P2P網(wǎng)貸借款人的信用風(fēng)險評估研究[J].武漢金融,2018,(2):33-37.
[2]鄧逸,徐曉敏.基于互聯(lián)網(wǎng)行為信息的P2P個人信用評價模型[J].背景信息科技大學(xué)學(xué)報,2017,32(2):90-94.
[3]涂艷,王翔宇.基于機器學(xué)習(xí)的P2P網(wǎng)絡(luò)借貸違約風(fēng)險預(yù)警研究—來自“拍拍貸”借貸交易證據(jù)[J].統(tǒng)計與信息論壇,2018,33(6):69-76.