王燦華
摘要:本文基于可得數(shù)據(jù),采用特征工程方法提取影響信用資質的核心因素,并將其作為自變量構建制造業(yè)企業(yè)信用違約預測的Logistic回歸模型和信用評分卡。實證結果顯示,企業(yè)性質、銷售費用/營業(yè)收入、流動資產(chǎn)周轉率、帶息債務/全部投入資本等六個指標對違約概率影響顯著。通過建立機器學習模型評級和外部評級之間的映射表,有望實現(xiàn)風險企業(yè)排雷、信用價值挖掘、信用風險定價等功能。
關鍵詞:機器學習特征工程 制造業(yè)企業(yè)信用評級
得益于大數(shù)據(jù)和非結構化數(shù)據(jù)處理技術的發(fā)展,基于大數(shù)據(jù)的機器學習模型應用日益廣泛。機器學習算法是根據(jù)特征對事物進行分類,本質上是降熵過程。企業(yè)信用評級是利用不同的信用評分或評級對樣本進行分類,進而實現(xiàn)將企業(yè)違約概率從等概率分布轉換為非等概率分布。非等概率的熵低于等概率的熵,信用評級降熵可用于評價企業(yè)信用資質。從功能和目標的角度看,將機器學習模型應用于企業(yè)信用評級具有一定優(yōu)勢,但需要以大數(shù)據(jù)為基礎,以保證學習效果和參數(shù)估計準確,避免過擬合??紤]到難以具備海量企業(yè)樣本數(shù)據(jù),在建模時,使用有較少參數(shù)估計需求的Logistic回歸算法更為合適。為減少變量共線性對模型估計的影響,筆者采用特征工程方法提取信用資質驅動核心因子入模。從行業(yè)看,制造業(yè)企業(yè)違約樣本數(shù)居行業(yè)之首,負樣本數(shù)量相對充足。將特征工程和機器學習方法應用于制造業(yè)企業(yè)信用評級在技術和數(shù)據(jù)方面具有較好的可行性。
指標選取、數(shù)據(jù)來源及特征工程
在樣本選擇方面,筆者選擇證監(jiān)會行業(yè)分類標準下的制造業(yè),訓練正樣本為截至2021年一季度末有存量債券、未發(fā)生違約事件且評級在A級以上的企業(yè)主體,共682家;負樣本為2014—2019年發(fā)生違約事件或者評級在BBB級及以下的企業(yè)主體,共56家。正負樣本之比約為12:1。將外部評級為BBB級及以下的企業(yè)視為負樣本基于兩方面考量:一是BBB級以下屬投機級,違約風險較高,考慮到外部評級實行發(fā)行人付費模式,為審慎起見,將正負切分線上調至BBB級;二是多數(shù)金融機構限制準入外部評級在A級及以下的債券,認為BBB級及以下債券的違約風險較高。
在觀察期和表現(xiàn)期選擇方面,考慮到債券市場的價格敏感度高于評級公司跟蹤評級以及真實違約消息,筆者將債券估值偏離度大于10%、評級低于A級、首次違約等三個事件發(fā)生之前作為樣本企業(yè)觀察期,將觀察期數(shù)據(jù)作為Logistic回歸自變量數(shù)據(jù)。觀察期之后為表現(xiàn)期,將表現(xiàn)期違約與否作為因變量數(shù)據(jù)。
為客觀地基于機器學習模型預測制造業(yè)企業(yè)違約情況,需構建信用資質影響因子矩陣。考慮到信用債發(fā)行主體樣本總量相對有限,且待估參數(shù)過多可能影響估計結果,筆者將企業(yè)性質和30項財務指標作為原始指標,具體包括:一是盈利能力指標6項[銷售凈利率、銷售費用/營業(yè)總收入、營業(yè)利潤/營業(yè)總收入、稅息折舊及攤銷前利潤(EBITDA)/營業(yè)總收入、經(jīng)營活動凈現(xiàn)金流/利潤總額、凈資產(chǎn)回報率的增長率];二是現(xiàn)金流量指標4項(經(jīng)營活動產(chǎn)生的現(xiàn)金流量凈額/營業(yè)總收入、經(jīng)營活動產(chǎn)生的現(xiàn)金流量凈額占比、投資活動產(chǎn)生的現(xiàn)金流量凈額占比、投資活動現(xiàn)金凈流量/營業(yè)總收入);三是營運能力指標4項(存貨周轉天數(shù)、應收賬款周轉率、流動資產(chǎn)周轉率、總資產(chǎn)周轉率);四是償債能力指標5項(長期負債占比、EBITDA/利息費用、經(jīng)營活動凈現(xiàn)金流/帶息債務、經(jīng)營活動凈現(xiàn)金流/總負債、貨幣資金/短期債務);五是成長能力指標7項(營業(yè)總收入同比增長率、利潤總額同比增長率、凈利潤同比增長率、營業(yè)利潤同比增長率、凈資產(chǎn)同比增長率、營業(yè)總收入3年復合增長率、凈利潤2年復合增長率);六是資本結構指標4項(資產(chǎn)負債率、長期資本負債率、帶息債務/全部投資資本、流動負債/負債總計)。
利用特征工程方法從原始指標篩選入模變量。在進行特征工程之前利用相關性分析和VIF檢驗剔除了方差膨脹因子VIF大于10的指標。特征工程首先對原始指標進行分箱,透過卡方分箱方法計算不同指標的證據(jù)權重WOE和信息量IV值,如表1所示,最終選取IV值大于0.2的變量入模,確保入模變量具有較好的違約預測能力。
機器學習模型:Logistic回歸及結果
Logistic回歸模型將多元線性回歸通過Sigmoid函數(shù)轉為違約概率預測的計算函數(shù),因變量是樣本違約與否的結果,自變量為特征工程篩選出的22個特征變量。通過回歸結果的p值測量回歸系數(shù)的顯著性大小,結合逐步回歸確定最終入模指標。筆者選擇顯著性較高(p值小于5%)的特征變量。對樣本按照7:3的比例隨機分為訓練集和測試集,訓練集回歸結果如表2所示。
從回歸結果來看,制造業(yè)企業(yè)信用影響因子涵蓋企業(yè)性質、盈利能力、營運能力、資本結構、償債能力和成長能力中的6個指標。如圖1所示,結合特征工程分箱及不同箱體的WOE值分析內(nèi)在機理。預期內(nèi)的結論是:影響信用資質的核心指標包括企業(yè)性質、流動資產(chǎn)周轉率、經(jīng)營活動凈現(xiàn)金流占負債的比例、有息負債占投入資本的比重、凈利潤復合增長率。超預期的結論是:銷售費用占營業(yè)收入的比重越低越容易違約。這說明對于制造業(yè)企業(yè)來說,銷售收入可提高盈利和償債能力。
如表3所示,訓練集和測試集的KS值分別為0.67和0.65,顯著大于0.3,說明模型具有良好的等級區(qū)分能力;由表4可見,訓練集和測試集的AUC值分別為0.90和0.88,顯著高于0.75的界限值,說明模型具有較高的精準性;表4所示測試集的混淆矩陣顯示模型應用于測試集的效果較好,違約預測精準度高達73.33%。
制造業(yè)企業(yè)信用評級模型及評分卡
基于Logistic回歸模型及參數(shù)估計結果,計算制造業(yè)企業(yè)的違約概率p,再基于p構建信用評級評分卡,評分Score=500-20?log(p/1-p),即以500分為基準分,以20分為單一等級分數(shù)區(qū)間,違約概率越高,則評分越低。基于上述邏輯構建制造業(yè)企業(yè)的信用評分卡,如表5所示?;谠u分卡對存量738家制造業(yè)企業(yè)進行信用評級打分,以30分劃分一級,將企業(yè)分成12個等級,結果如表6所示。10級以上企業(yè)占比為13.69%,與外部評級相比,模型更具區(qū)分度。外部評級為AA級及以上的企業(yè)占比為70%,AAA級占比高達22%,集中度較高,區(qū)分度較低。
在信用違約預測方面,機器學習模型表現(xiàn)較好,違約預測命中率達75%。如表7所示,2020年下半年至2021年一季度實際違約企業(yè)4家,其中3家基于2019年數(shù)據(jù)的評級結果低于6級,基于2018年數(shù)據(jù)的評級結果均低于7級,僅B公司的評級結果為9級。
研究結果的潛在應用
將制造業(yè)企業(yè)外部評級和基于機器學習方法的信用評級建立二維映射表,如表8所示,單元格內(nèi)容代表外部評級為該列對應外部等級和機器學習模型評級為所在行對應模型等級的企業(yè)家數(shù)。映射表可用于三個方面。一是風險企業(yè)排雷,當企業(yè)外部評級低于AA-級且模型評級低于5級時,可認為信用風險較高,應避免投資。二是信用價值挖掘,當企業(yè)外部評級在AA-級及以下,但模型評級為9級及以上時,可進一步研究,挖掘被市場誤判帶來的信用溢價。三是警惕市場高估,當企業(yè)外部評級在AA-級以上,但模型評級為5~9級時,可考慮結合進階信用研究并利用債券借貸等做空機制參與做空。
學習模型結果還可用于信用風險定價和內(nèi)部評級檢驗。利用模型評級結果計算不同等級的違約概率,并將違約概率應用于不同信用等級制造業(yè)企業(yè)的信用風險定價。模型評級還可為機構內(nèi)部評級提供交叉驗證和補充,助力內(nèi)部評級方法的改進和完善。
注:1.單元格內(nèi)數(shù)字代表同時具有相應外部評級和模型評級的企業(yè)數(shù)量
2.橙色區(qū)域為可選優(yōu)質企業(yè)區(qū),綠色區(qū)域為信用價值挖掘區(qū),深藍色區(qū)域為市場高估區(qū),紅色區(qū)域為排雷區(qū)
作者單位:東莞銀行資產(chǎn)負債管理部
責任編輯:陳森? 鹿寧寧