摘要:近年來,P2P網絡借貸平臺的發(fā)展十分迅猛,但其背后隱藏的風險也是不容忽視的,尤其是借款人違約的風險。對于借款人違約風險影響因素進行的研究,有利于借貸平臺和投資者合理規(guī)避風險。本文運用生存分析的方法,建立了cox比例風險模型,基于lending club的貸款數據,對P2P網絡借貸借款人的違約風險進行了實證研究,并依據研究結論針對P2P網絡借貸平臺及投資者提出建議。
關鍵詞:P2P網絡借貸;違約風險;生存分析;cox比例風險模型
一、引言
P2P 網絡借貸是一種不需要以銀行等其他金融機構作為中介,個人和個人間直接發(fā)生借貸,并借助互聯網平臺完成相關交易步驟的借貸行為。近年來,P2P網絡借貸隨著互聯網的蓬勃發(fā)展也得到了快速的發(fā)展,其數量和成交量都呈現出不斷增長的趨勢,但同時累計的問題平臺數量也在激增。因此,p2p網絡借貸在為借貸雙方提供便利的同時,也使投資者和平臺面臨著諸多風險,其中最為普遍的就是借款人的違約風險。違約風險,也稱信用風險,是指借款人因種種原因, 不愿或無力履行合同條件而構成違約, 致使出借人或者中介平臺等交易對手遭受損失的可能性(王書斌等,2017)。由于借款人發(fā)生違約時,不僅會使投資者遭受損失,而且使得越來越多的平臺出現資金流停滯、提現困難、甚至跑路等不良現象。所以,對于p2p網絡借貸平臺中借款人違約風險的研究具有十分重要的意義。
二、相關文獻回顧
目前P2P網絡借貸違約風險的評估是國內外研究的熱點問題,許多學者都對其進行了研究,已有的研究常用的方法是Logistic回歸方法和Probit回歸方法,如Pope 和Syndor ( 2011) 通過構建Logistic回歸模型,并基于平臺Prosper 的數據進行相關實證研究,實證結果表明借款人的性別、種族等特征對借款人的違約風險有影響。徐喆(2015)建立Probit模型對P2P網絡借貸業(yè)務違約風險的相關因素進行了實證研究,研究發(fā)現:(1)客戶的違約記錄、借貸時間、銀行存款數額、工作狀態(tài)、個人財產、戶口所在地這些變量對借款人的的違約可能性有著較為顯著的影響;(2)房貸情況、年齡、電話號碼的影響能力則較差。還有一些學者運用了BP神經網絡分析的方法、決策樹和支持向量機(SVM)算法等。宋麗平等人(2015)構建基于BP算法的神經網絡模型,并選取借款人性別、年齡、文化程度、婚姻狀況、工作年限、收入狀況、房產狀況、購車狀況、借款成功次數及逾期筆數等作為評價指標,對借款人的信用狀況進行評估,研究發(fā)現該模型適用于貸前對借款人信用狀進行預測。
此外,還有少量學者將生存分析法引入借款人違約風險的評估中,生存分析法是研究生存現象和響應時間數據及其統計規(guī)律的一種分析方法,最初主要應用于醫(yī)學、生物學領域,近年來越來越多的學者將其引入到金融、財務、統計學等領域中,如Emekter et al.(2015)運用Cox模型考察借款期限與違約率之間的關系,證明了借款期限越長違約可能性越大。
雖然這些傳統的回歸方法也可以對借款人的違約風險及其影響因素就行測算,但是這些模型只能對違約風險進行靜態(tài)的評估,而生存分析方法還能對貸款在不同時點的違約可能性進行動態(tài)的預測分析。
因此,本文擬在前人的研究成果的基礎之上,運用生存分析的方法,基于美國的P2P網絡借貸平臺Lending Club的借貸數據,構建Cox比例風險模型來探究P2P網絡借貸借款人的違約風險,分析哪些因素與借款人的違約風險有關,以期對P2P網絡借款人的風險進行有效的評估。
三 、生存分析方法
生存分析是用來分析生存現象與生存時間之間的關系及其規(guī)律的一種統計方法。生存分析是一種既考慮結果又考慮具體的生存時間的統計方法,它可以對生存時間的分布特征進行描述,還可以對影響生存時間的因素進行分析。
生存時間是指從某個時間點到另一個時間點之間的間隔。完整的生存時間數據具有三個要素:觀察起點、觀察終點及關心的特定事件。生存時間數據根據其完整性,可以分為兩大類:
(1)完全數據,又稱非刪失數據,是指研宄對象的觀測數據完全落在觀察起點和終點之間,即我們關心的事件出現在觀測期內,生存時間數據的三要素是完整的。
(2)刪失數據,是指關心的事件出現在終點事件之前,觀測過程由于失訪、退出或研究時限已到而終止了。刪失數據又可以根據刪失情況的不同分為:左刪失、右刪失和區(qū)間刪失。左刪失數據是指在觀察起點開始之前,研究所關心的事件就已經發(fā)生;右刪失數據是指到了觀測終點,研究所關心的事件仍然沒有發(fā)生;區(qū)間刪失是指無法完整地觀測到所關心的事件確切的發(fā)生時間。
四、實證結果
本文主要對借款人的違約風險進行研究,主要從借款信息和借款人信息兩大類信息中選取12個可能會影響借款人違約風險的變量(見表1)。
本文選擇以美國典型的P2P網貸平臺——Lending club作為研究對象,選取了 Lending Club 公司2012 年借貸交易數據來進行實證研究,其貸款最終的還款狀態(tài)目前是已知的,分別為 Fully Paid /Default/Late (16-30 days)/ Late (31-120 days)/Charged Off/In Grace Period,其中Fully Paid視為全額還款,其它狀態(tài)均視為還款逾期,即發(fā)生違約。本文共提取了lending club 2012年的53367條借貸數據作為初始樣本,對數據做處理及刪除缺失數據后得到48180條有效數據,其中發(fā)生違約的數據有8000條,違約率大概為16.60%。
借款信息主要是指那些與每筆貸款有關的信息及特征。主要包括以下五個方面:
(1)借款金額,即借款金額總額。
(2)借款期限,是指借入一筆貸款的期限。
(3)借款利率,是指借款人為了獲得貸款而必須支付的借貸成本。
(4)月還款額,是借款人借入一筆貸款后每月需要償還的金額。
(5)信用等級。Lending Club平臺基于借款人的 FICO 等信用得分以及借貸金額等借貸特征,對每筆貸款進行評級,分為 A、B、C、D、E、F、G 七個等級,等級依次遞減,見表2。
借款人信息主要是指借款人本身具備的特征情況。主要包括以下幾個方面:
(6)年收入,美國對P2P 網絡借貸借款人規(guī)定了年收入最低限額。
(7)工作年限,是指借款人有穩(wěn)定收入的時間。
(8)住房擁有情況,目前的房產情況主要分為三大類:自有住房(own)、按揭住房(mortgage)、租房(rent)。
(9)債務收入比,是指借款人的借貸金額與其年收入的比值。
(10)額度循環(huán)利用率,是指借款人目前已經占用的循環(huán)貸款額度與其循環(huán)貸款總額度的比值。
(11)過去 2 年內超過 30 天的逾期欠款次數和被公開的不良記錄次數。這兩項指標都反映了借款人信用記錄中發(fā)生的不良行為次數。
五、結論及建議
本研究主要得出以下結論:
(1)借款期限、年收入以及額度循環(huán)利用率屬于保護因子。它們降低了貸款發(fā)生違約的可能性。
(2)借款利率、信用等級、債務收入比和被公開的不良記錄次數屬于危險因子。它們增加了貸款發(fā)生違約的可能性。
(3)借款金額、月還款額、工作年限、住房擁有情況和過去兩年內超過30天的逾期欠款次數這四個變量與貸款發(fā)生違約的概率之間沒有顯著關系。
根據以上的研究結論,本文針對p2p網絡借貸提出以下建議:
平臺應當對每筆貸款確定合理的借款期限、借款利率和信用等級。由于這三個與借款信息相關的變量與借款人違約風險存在緊密的聯系,因此平臺應當予以重視。首先平臺應當選擇恰當的方法對借款人的信用等級進行評估,并在此基礎上為不同借款人設定合理的借款利率和借款期限。
平臺應盡可能地收集并驗證借款人信息。由于p2p網絡借貸存在嚴重的信息不對稱性,投資者能夠獲得的信息是有限的。P2P 網絡借貸平臺作為借款人和投資人的中間平臺,應當對借款人的年收入、額度循環(huán)利用率、債務收入比以及被公開的不良記錄次數等信息進行收集,并進行嚴格地驗證,以供投資人在作出投資決策時參考。
第三,投資者在對借款人進行選擇時,也應對風險和收益有正確的認識,不要盲目或者從眾,投資者要學會主動對借款信息和借款人信息進行分析,并做好風險管理,以降低違約風險。
參考文獻:
[1]王書斌,譚中明,陳藝云.P2P網貸違約風險及其傳染性評估綜述[J].武漢金融,2017(6):40-44.
[2]Pope D G,Sydnor J R.What's in a Picture?: Evidence of Discrimination from Prosper.com[J].Journal of Human Resources, 2011, 46(1):53-92.
[3]徐喆.邏輯回歸模型在互聯網金融P2P業(yè)務信用風險的應用[J].統計科學與實踐, 2015(11):26-29.
[4]宋麗平,張利坤,徐瑋.P2P網絡借貸個人信用風險評估[J].財會月刊,2015(35):94-96.
作者簡介:劉瓊,湖北孝感人,漢族,1992年3月生,碩士,工商管理專業(yè),現湖北商貿學院會計學院專職教師,研究方向為審計學。