侯瑞環(huán),蘇佳琳,原星星
(西南交通大學(xué)數(shù)學(xué)學(xué)院統(tǒng)計系,四川 成都 610031)
在商業(yè)銀行信用風(fēng)險管理中,違約概率是指借款人在未來一定時期內(nèi)不能按合同要求償還銀行貸款本息或履行相關(guān)義務(wù)的可能性.早期關(guān)于違約概率模型的研究主要以線性判別為主,在線性判別模型中,Beaver 的單變量模型及Altman的多元模型影響最廣.在度量企業(yè)信用風(fēng)險時企業(yè)是否違約是一個兩分類變量,作為兩分類因變量的信用狀況的概率取值在0 ~1,但在線性模型條件下,不能保證自變量在各種組合下,因變量的取值仍在0 ~1;可通過對因變量作Logist 轉(zhuǎn)換來解決這一問題.就目前而言,建立違約概率模型的有效與主流方法為Logistic 方法.然而Cramer 研究發(fā)現(xiàn),對于貸款違約率的建模用一般的Logistic 模型無法有效解決[1].換言之,就是一般的Logistic 模型不能夠很好解決在H -L 檢驗(yàn)中所反映出的Cramer 問題.為了解決這一問題,Cramer 提出了邊界Logistic 模型,但并未對邊界Logistic 模型優(yōu)于一般Logistic 模型的原因做理論分析.石小軍等[2-4]分析了這種原因,并發(fā)現(xiàn)邊界Logistic 模型不僅能克服Cramer 問題,而且對臨界值不敏感,模型的預(yù)測效率也較好.然而,對邊界Logistic 模型的參數(shù)估計研究較少,主要是運(yùn)用極大似然估計解決.
經(jīng)驗(yàn)似然是Owen[5-6]在完全樣本下提出的一種非參數(shù)統(tǒng)計推斷方法,它有類似于bootstrap的抽樣特性.這種思想是由 Thomas&Grun kemeier[7]提出,并在隨機(jī)刪失下發(fā)展非參數(shù)似然比方法構(gòu)造生存概率置信區(qū)間.Owen將這一思想方法應(yīng)用到完全獨(dú)立同分布樣本下總體均值的統(tǒng)計推斷.然而,相比經(jīng)典現(xiàn)代統(tǒng)計方法,用經(jīng)驗(yàn)似然法構(gòu)造的置信區(qū)間有域保持性、變換不變性、Bartlett 糾偏性等突出優(yōu)點(diǎn).近年來,一些統(tǒng)計學(xué)家又將經(jīng)驗(yàn)似然方法應(yīng)用到不完全數(shù)據(jù)的統(tǒng)計分析,發(fā)展了所謂的被估計的經(jīng)驗(yàn)似然,調(diào)整的經(jīng)驗(yàn)似然及bootstrap 經(jīng)驗(yàn)似然.在數(shù)據(jù)分布已知與數(shù)據(jù)不缺失的情況下,經(jīng)驗(yàn)似然估計法對參數(shù)的估計顯得沒有參數(shù)估計那么高效.實(shí)踐中數(shù)據(jù)通常受到不同程度的破壞,這種破壞主要表現(xiàn)在:隨機(jī)刪失、測量誤差及數(shù)據(jù)丟失.Owen在完全樣本下的經(jīng)驗(yàn)似然方法被一些學(xué)者基于這3 類被破壞數(shù)據(jù)進(jìn)行了統(tǒng)計推斷的推廣[8-11].本文在石小軍等的研究基礎(chǔ)上,進(jìn)一步討論邊界Logistic 模型的參數(shù)估計,并利用經(jīng)驗(yàn)似然方法給出參數(shù)的一種極大經(jīng)驗(yàn)似然估計,最后通過實(shí)證分析,進(jìn)一步說明這種估計方法得到參數(shù)的可靠性.
經(jīng)驗(yàn)似然的方法最早由Owen 提出.這種方法在構(gòu)造參數(shù)置信區(qū)域方面有著突出的優(yōu)點(diǎn).設(shè)X1,X2…,是來自于Rp(p ≥1)的獨(dú)立同分布隨機(jī)變量,分布函數(shù)為F,在這里無需知道F 的具體參數(shù)形式,可以通過一個r 維獨(dú)立估計函數(shù)
對參數(shù)θ 進(jìn)行估計,并由Qin&Lawless 給出了如下估計方程[12]:
EF與θ0表示關(guān)于分布F 的數(shù)學(xué)期望和參數(shù)θ 的真實(shí)值,通常也將上述估計方程稱為矩條件方程.
Owen 給出經(jīng)驗(yàn)似然方程,定義為
其中pi= pr(X = xi).在條件(1)下經(jīng)驗(yàn)似然比函數(shù)為
同時Owen 與Qin&Lawless 指出,當(dāng)
時,上述經(jīng)驗(yàn)似然比函數(shù)LE(θ)有唯一值:
其中t 與θ 和n 有關(guān),并且可通過方程
確定t.
Cramer 給出邊界Logistic 模型為:
其中ω 為[0,1]之間的任意常數(shù),稱為違約邊界.Xi是第i 個自變量值,β 為一個包含截距項(xiàng)的系數(shù)向量,對于模型(2):
其中設(shè)Z = XTiβ,則
參數(shù)β 的參數(shù)似然為:
對數(shù)似然為:
對上式求關(guān)于β 的導(dǎo)數(shù)得到估計方程為:
在這里
由此(5)式估計方程可簡化為
ω ∈[0,1]為任意常數(shù),故而(6)式也可表示為
因此,邊界Logistic 模型的經(jīng)驗(yàn)似然比函數(shù)為:
這里估計函數(shù)
可根據(jù)(7)式得到參數(shù)β 與ω 的極大經(jīng)驗(yàn)似然估計方法,即參數(shù)θ 的經(jīng)驗(yàn)對數(shù)似然函數(shù)為:
其中θ = (ω,βT)T∈Θ 的參數(shù)向量,
假設(shè)t 與θ 相互獨(dú)立,類似于丁先文等[13]對Logistic模型基于檢驗(yàn)似然估計的方法,可定義:
t 與上文一樣,都與n 和θ = (ω,βT)T∈Θ 有關(guān).
顯然,參數(shù)θ = (ω,βT)T∈Θ 極大經(jīng)驗(yàn)似然估計和t 的估計為下列方程組
的解,其中
由此可以得到邊界Logistic 模型參數(shù)β 與ω 的極大經(jīng)驗(yàn)似然估計^β 和^ω.
本文選用2012年第一至第四季度40 家房地產(chǎn)行業(yè)上市公司的主要財務(wù)數(shù)據(jù)進(jìn)行研究.其中有20 家公司的每股收益大于零,認(rèn)為其為正常運(yùn)行公司,定義其信用度為1.另外20 家公司每股收益小于零,為違約公司,定義其信用度為0.模型樣本包括了這一年的總資產(chǎn)利潤率、流動比率、存貨周轉(zhuǎn)率等12 個指標(biāo)(見表1),并且采用參數(shù)兩獨(dú)立樣本T 檢驗(yàn)和非參數(shù)的K -W 檢驗(yàn)對指標(biāo)變量進(jìn)行分析,分析結(jié)果見表2與表3.由于指標(biāo)之間存在線性或非線性關(guān)系,通過因子分析方法消除多重共線性,分析結(jié)果見表4.由因子分析的總方差解釋表可知,變量相關(guān)矩陣的前3 個因子的特征值大于1,它們一起解釋了總方差的87.81﹪.最終選出3 個因子來研究房地產(chǎn)上市公司的信用風(fēng)險.
表1 銀行對房地產(chǎn)客戶信用評級五大指標(biāo)
表2 兩獨(dú)立樣本T-檢驗(yàn)結(jié)果
表3 兩獨(dú)立樣本K-W 檢驗(yàn)結(jié)果
通過T 檢驗(yàn)和K-W 檢驗(yàn)的結(jié)果可知,所有指標(biāo)中顯著的指標(biāo)有每股收益、總資產(chǎn)利潤率、股本報酬率、總資產(chǎn)增長率、主營業(yè)務(wù)增長率、凈資產(chǎn)增長率、總資產(chǎn)周轉(zhuǎn)率、流動資產(chǎn)周轉(zhuǎn)率、經(jīng)營現(xiàn)金流對負(fù)債比率以及現(xiàn)金流量比率.這也表明上市公司在這幾個指標(biāo)正常時就可以避免或很少出現(xiàn)違約現(xiàn)象.
表4 因子分析結(jié)果
利用R 軟件求解出邊界Logistic 的極大經(jīng)驗(yàn)似然非線性方程組,得到各參數(shù)的估計結(jié)果,見表5.
表5 邊界Logistic 模型系數(shù)估計結(jié)果
因此,邊界Logistic 違約率模型為:
有x1,x2,x33 個指標(biāo)最終進(jìn)入模型.由此看出企業(yè)的凈利潤、盈利能力、營運(yùn)能力以及成長能力對房地產(chǎn)行業(yè)信用風(fēng)險的影響較大,其中影響最大的是企業(yè)的成長能力.也就是說,在房地產(chǎn)行業(yè)里,成長能力強(qiáng)的企業(yè)會有很大的獲利空間,從而也較大幅度地降低對投資者產(chǎn)生違約的危險.
再利用這個邊界Logistic 違約模型計算出樣本的違約率,并得到違約率分布,如圖1.
圖1 邊界Logistic 違約模型的檢驗(yàn)樣本違約率分布圖
(1)邊界Logistic 違約模型計算出的違約率剔除了灰色區(qū)域,能夠很好觀測出上市公司違約與否.
(2)邊界Logistic 違約模型的系數(shù)估計除了極大似然估計方法,也可以利用經(jīng)驗(yàn)極大似然估計求解,二者的估計結(jié)果差不多,但經(jīng)驗(yàn)極大似然法對數(shù)據(jù)的分布不做任何要求.
(3)除了Cramer 問題,同樣可以研究其對臨界點(diǎn)的穩(wěn)定性,也可以在文章找到邊界Logistic違約模型對臨界點(diǎn)更穩(wěn)定的依據(jù)(見圖1).
(4)本文僅僅利用經(jīng)驗(yàn)極大似然估計方法研究了邊界Logistic 違約率模型的參數(shù)估計,同樣也可以立足于經(jīng)驗(yàn)似然對估計參數(shù)嘗試給出區(qū)間估計.
[1]Cramer J S.Scoring banking loans that may go wrong -a case study[J].Statistic Neerlandica,2004,58(3):365 -381.
[2]石曉軍,肖遠(yuǎn)文,任若恩.邊界Logistic 違約率模型Bayes 分析及實(shí)證研究[J].中國管理科學(xué),2006,(14):25 -29.
[3]石曉軍,肖遠(yuǎn)文,任若恩.Logistic 違約率模型的最優(yōu)樣本配比與分界點(diǎn)研究[J].財經(jīng)研究,2005(9):39-49.
[4]Shi X J.Robust factor credit discriminate model and empirical evidences from China[A].proceedings of the 7th International Conference on industrial Management.China Aviation Industry Press,2004:491 -497.
[5]Owen A B.Empirical likelihood ratio confidence intervals for a single function[J].Biometrika,1988,75(2):237 -249.
[6]Owen A.Empirical likelihood for linear models[J].Ann Statistic,1991(19):1725 -1747.
[7]Thomas D R,Grunkemeier G L.Confidence interval estimation of survival probabilities for censored data[J].Amer Statistic Assoe,1975(70):865 -871.
[8]Wang Q H,Jing B Y.Empirical likelihood for a class of functions of survival distribution with censored data[J].Ann Inst Statistic Math,2001(53):517 -527.
[9]Wang Q H,Wang J L.Inference for the mean difference in the two - sample random Censorship model [J].Journal of Multivariate Analysis,2001(79):295 -315.
[10]Li G,Wang Q H.Empirical likelihood confidence regre ssion analysis with right censored data[J].Statistic Siniea,2003,13(1):51 -68.
[11]Wang Q H,Rao J N K.Empirical likelihood for linear regression models under imputation for missing response[J].Canadian Journal of Statistics,2001,29(4):597 -605.
[12]Qin J,Lawless J.Empirical likelihood and general estimating equations[J].Ann Statistic,1994(22):300 -325.
[13]丁先文,陳絢青,周友明,等.Logistic 回歸模型的經(jīng)驗(yàn)似然診斷[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2013(43):140-148.