□文/孫 靜
(天津大學管理與經(jīng)濟學部 天津)
在“高信用風險、高人工成本”的小微企業(yè)貸款業(yè)務(wù)中,如何降低不良貸款率是小微金融能否持續(xù)發(fā)展的關(guān)鍵之一。降低不良貸款率的核心在于如何從眾多小微企業(yè)中甄選出優(yōu)質(zhì)客戶。本文根據(jù)實際操作經(jīng)驗,選取對于貸款發(fā)放影響最大的四個指標,首次將多元統(tǒng)計中的copula方法綜合評價小微企業(yè)貸款能力,定量給出申請者排名,為銀行相關(guān)決策者提供借鑒和幫助。
隨機向量的聯(lián)合分布函數(shù)是刻畫隨機向量概率性質(zhì)的最好工具之一,分布函數(shù)是對變量變化規(guī)律的精確描述。在實際應(yīng)用中,都要假定變量服從某一分布,正態(tài)分布是最常用的分布,其原因是現(xiàn)有的許多定理及結(jié)論都是與正態(tài)分布有關(guān)。尤其是大數(shù)定律及中心極限定理更是奠定了正態(tài)分布在概率統(tǒng)計中的重要地位。然而研究表明,在對諸如股票、匯率等金融變量進行分析時,假設(shè)這些變量服從正態(tài)分布并不合適。copula函數(shù)著眼于具有非線性特征的變量間的相互關(guān)系,對變量的相關(guān)性建立模型。copula函數(shù)最大的優(yōu)點是把隨機變量的邊緣分布和它們之間的結(jié)構(gòu)關(guān)系分開研究,使得研究過程更加清晰,方法更加靈活。
Copula理論是由Sklar在1959年提出,Sklar指出,可以將任意一個n維聯(lián)合累積分布函數(shù)分解成n個邊緣累積分布和一個copula函數(shù)。邊緣分布描述變量自身特征,copula函數(shù)描述變量之間相關(guān)性。任意邊緣分布和任意copula都可以組合成一個嶄新的多維聯(lián)合累積分布函數(shù),大大擴展了多元分布類型。
常見的 copula有 Gauss Copula、Gumbel Copula、Clayton Copula 和 Frank copula。其中,Gauss Copula為:
其中,φ為一元標準正態(tài)分布,p∈(-1,1)。CGa事實上是邊際分布為標準正態(tài)分布。諸多研究表明,在數(shù)據(jù)的中間部分,模擬CGa與實際數(shù)據(jù)吻合較好,但在尾部差別相當明顯,當要度量尾部風險相依性時,橢圓族的高斯Copula是無能為力的。
Gumbel Copula的密度函數(shù)具有非對稱性,上尾高下尾低,其密度分布呈“J”字型。Gumbel Copula函數(shù)上尾的相關(guān)性較強,可用于描述在上尾處具有較強相關(guān)關(guān)系的現(xiàn)象。收益率呈左偏分布時,多用Clayton Copula去描述相關(guān)關(guān)系。Gumbel Copula函數(shù)的分布函數(shù)為:
Clayton Copula函數(shù)的分布函數(shù)為:
Clayton Copula的密度函數(shù)同樣具有非對稱性,上尾低,下尾高,其密度分布呈“L”字型。Clayton Copula函數(shù)下尾的相關(guān)性較強,可用于描述在下尾處具有較強相關(guān)關(guān)系的現(xiàn)象。收益率呈右偏分布時,多用Clayton Copula去描述相關(guān)關(guān)系。Frank Copula函數(shù)的分布函數(shù)為:
根據(jù)個人工作經(jīng)驗,選擇婚姻狀況、已有額度、資產(chǎn)合計、從事行業(yè)II四個指標作為申請人貸款能力綜合評價指標體系。四個指標中已有額度和資產(chǎn)合計是數(shù)值型變量,而婚姻狀況和從事行業(yè)II是分類變量。22個申請樣本中已婚者最多有15人,離異6人,只有1人未婚。從事行業(yè)II總共13個因素水平,最多的行業(yè)有3個樣本。22個申請人中有一部分是以前沒有在民生銀行貸過款的新客戶。而資產(chǎn)合計有2個申請人的資產(chǎn)遠超于其他人,達到6,000多萬元和8,000多萬元。
評價的第一步需要將指標標準化,剔除不同指標量綱的影響,一般標準化到[0,1]區(qū)間或者[-1,1]區(qū)間。標準化方法很多,理論上只要值域是[0,1]區(qū)間的函數(shù)都可以作為標準化函數(shù)。但有時需要考慮標準化函數(shù)的實際含義,選擇比較簡單的函數(shù)。
婚姻狀況和從事行業(yè)II分類變量可以看成離散分布,標準化數(shù)值可取離散分布的經(jīng)驗分布函數(shù)。已婚和離異對于授信額度沒有差別,但是未婚者授信額度較低。將未婚者標準化為0.3,已婚和離異者標準化為0.9。同樣對于從事行業(yè)II,個人經(jīng)驗表明,建材>交通運輸設(shè)備>服務(wù)>儀器儀表>家具>醫(yī)藥、醫(yī)療設(shè)備>日用品>金屬,剩下的服裝、器材、食品、飲料和專用設(shè)備看成和基準行業(yè)服務(wù)一樣。授信能力越強的行業(yè),賦予其值也大。
假設(shè)已有額度和資產(chǎn)合計服從伽瑪分布,其形狀參數(shù)和尺度參數(shù)可以采用極大似然估計。兩者的Kolmogorov-Smirnov檢驗結(jié)果如表所示,兩者相伴概率都大于0.05,接受原假設(shè),認為已有額度和資產(chǎn)合計兩個指標服從伽瑪分布。取伽瑪分布參數(shù)為極大似然估計值,指標標準化值為累積分布函數(shù)值。
Copula 種類很多,如正態(tài)、t、阿基米德、混合等等,不同生成元函數(shù)的阿基米德Copula各不相同。到底哪一種Copula適合數(shù)據(jù),這是一個普遍問題。由于Copula種類太多,我們不可能在所有類型中選取,而只能在很小一部分Copula中選取。要想比較優(yōu)劣,必須制定統(tǒng)一準則,計算不同Copula準則得分,取最大或者最小得分者為最優(yōu)Copula。這就是Copula擬合優(yōu)度檢驗問題。目前已有Copula擬合優(yōu)度檢驗方法包括基于概率積分變換的擬合優(yōu)度檢驗、基于核密度估計的擬合優(yōu)度檢驗、基于卡方擬合優(yōu)度檢驗、基于生成元核密度的擬合優(yōu)度檢驗等。R語言的Copula宏包提供了一種基于經(jīng)驗Copula的擬合優(yōu)度檢驗。
選擇五種常見的Copula,正態(tài)Copula、t Copula、gumbel Copula、frank Copula和clayton Copula,其中正態(tài)和t Copula 屬于橢球型 Copula,gumbel、frank和clayton屬于阿基米德Copula。橢球型Copula方差矩陣(dispersionmatrix)含有較多參數(shù),對于Copula,方差矩陣也稱作相關(guān)矩陣(correlationmatrix),決定變量之間的相關(guān)結(jié)構(gòu)。方差矩陣通常有以下幾種形式:1階自回歸(autoregressive of order 1)、可交換(exchangeable)、Toeplitz和一般形式。
采用R語言基于經(jīng)驗Copula的擬合優(yōu)度檢驗。由于t Copula和gumbel計算時間過長,改用基于乘子中心極限定理方法,其他Copula采用參數(shù)自助法。假設(shè)邊緣分布為連續(xù)分布,這是該檢驗方法的基本前提。連續(xù)分布出現(xiàn)兩個相同的值概率為零,如果樣本中存在兩個相同的值,就會影響最后相伴概率的計算。如果相伴概率都小于0.05,拒絕原假設(shè),認為不服從該copula。在5種Copula中,只有t Copula對應(yīng)的相伴概率大于0.05,認為t Copula最適合本文貸款數(shù)據(jù)。
計算22個樣本標準化數(shù)據(jù)對應(yīng)t copula的概率分布函數(shù)值,作為綜合評價值,所得排名與他們授信額度基本吻合,授信額度大的申請人排名都比較靠前,只有21號樣本申請人授信額度400萬元,但是排名最靠后。查閱此人申請資料,發(fā)現(xiàn)此人屬于跟其他2個申請人一起聯(lián)合擔保,每人400萬元額度。其他2人實力很強,但是此人本身經(jīng)濟實力較為一般。貸款額度最小的7號84萬元和22號申請人95萬元排名都非??亢螅f明基于copula的綜合評價確實能反映申請人的銀行貸款能力。
本文根據(jù)個人工作經(jīng)驗,最終選擇婚姻狀況、已有額度、資產(chǎn)合計、從事行業(yè)II四個指標作為申請人貸款能力綜合評價指標體系。首次將多元分布copula方法引入綜合評價,得到各貸款申請人能力排名,為銀行發(fā)放貸款提供一定的支持和參考。
[1]Nelsen R.An Introduction to Copulas[M].Ber lin:Springer,1998.
[2]史道濟,姚慶祝.改進Copula對數(shù)據(jù)擬合的方法[J].系統(tǒng)工程理論與實踐,2004.24.4.
[3]Wang W,Wel ls M T.Model selection and semiparamet ric inference for bivariate failure-time data[J].Journal of The American Statistical Association,2000.9.