摘" "要:債券信用評級對債券信用風(fēng)險防范具有重要作用,而涵蓋信息充分、能有效區(qū)分債券信息差異的債券信用評級指標(biāo)體系是識別債券信用影響因素、提高債券違約鑒別精度、提升債券信用評級可靠性的重要基準(zhǔn)。本文選取2012—2022年我國上市公司債券為樣本,引入風(fēng)險披露指標(biāo)增大信息充分性、構(gòu)建宏觀指標(biāo)與債券其他特征的克羅內(nèi)克積指標(biāo)增大信息差異性,并基于AdaBoost算法的預(yù)測結(jié)果反推最優(yōu)指標(biāo)體系。通過計算加入風(fēng)險披露等指標(biāo)和宏觀指標(biāo)與債券其他特征克羅內(nèi)克積指標(biāo)前后的多個模型性能評估指標(biāo),驗(yàn)證指標(biāo)體系的有效性;將AdaBoost模型與其他常用機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果對比,驗(yàn)證根據(jù)AdaBoost方法確定的最終指標(biāo)體系可靠性;通過計算指標(biāo)在模型預(yù)測中的重要性程度,提高指標(biāo)體系的可解釋性。研究發(fā)現(xiàn),在多個預(yù)測性能評估指標(biāo)上,增加指標(biāo)體系的信息充分性和信息差異性,可顯著優(yōu)于未加入此類指標(biāo)的預(yù)測結(jié)果;基于宏觀指標(biāo)與債券其他特征克羅內(nèi)克積的多個指標(biāo)對債券違約預(yù)測有重大影響;上市公司風(fēng)險信息披露情況等指標(biāo)是債券違約預(yù)測的重要指標(biāo)。
關(guān)鍵詞:債券信用評級指標(biāo)體系;信息充分性;信息差異性;債券違約鑒別;AdaBoost
DOI:10.3969/j.issn.1003-9031.2024.11.005
中圖分類號:F224.9;F812.5" " " " 文獻(xiàn)標(biāo)識碼:A" " "文章編號:1003-9031(2024)11-0049-15
一、引言及文獻(xiàn)綜述
1981年國務(wù)院決定恢復(fù)國債發(fā)行,拉開了我國債券市場從無到有、長足發(fā)展的序幕。截至2023年12月,我國債券市場托管余額157.9萬億元,同比增長9.1%,實(shí)現(xiàn)了債券市場規(guī)模的穩(wěn)定增長,我國債券市場規(guī)模穩(wěn)居全球第二①。債券市場蓬勃發(fā)展的背后是債券違約事件的頻發(fā)和各種極端風(fēng)險的挑戰(zhàn)(王培輝和張猛,2023),2023年,全國共有41只債券主體發(fā)生違約,違約債券余額高達(dá)308.19億元②。為了盡可能地規(guī)避風(fēng)險,減少損失,實(shí)現(xiàn)我國債券市場的穩(wěn)健發(fā)展,對債券進(jìn)行合理的違約風(fēng)險評估、建立有效的信用評級指標(biāo)體系顯得愈發(fā)重要。目前,在債券信用評級領(lǐng)域中,國內(nèi)外學(xué)者的研究多聚焦于以下兩個方面。
一是債券信用評級影響因素研究。鄒昆侖和陸萍(2018)基于債券發(fā)行人的盈利能力、資本結(jié)構(gòu)、償債能力、成長能力、每股指標(biāo)五個方面,考慮了一系列財務(wù)指標(biāo)對債券信用評級的影響。Ma C et al.(2021)認(rèn)為債券信息、債券發(fā)行主體信息、債券信用評級和宏觀經(jīng)濟(jì)指標(biāo)等會影響債券信用水平。姚瀟等(2022)將債券違約事件視為一種外生事件,同時考慮發(fā)債主體基本信息和財務(wù)指標(biāo)對于債券信用評級的影響。生柳榮等(2019)在篩選信用評級影響因素時,綜合考慮了涵蓋企業(yè)屬性、企業(yè)償債能力和杠桿水平等六個方面的定性因素和定量因素。蔣敏等(2021)基于上市公司債券違約樣本,從公司經(jīng)營狀況等內(nèi)部經(jīng)營問題和外部經(jīng)濟(jì)環(huán)境兩方面出發(fā),探究內(nèi)部及外部因素對債券違約的“聯(lián)合效應(yīng)”。肖艷麗和向有濤(2021)以上市公司發(fā)行的企業(yè)債券作為研究樣本,實(shí)證發(fā)現(xiàn)發(fā)債主體的財務(wù)指標(biāo)和債券自身屬性等非財務(wù)指標(biāo)都會對債券信用評級產(chǎn)生一定的影響。陳學(xué)彬等(2021)基于債券發(fā)行公司的財務(wù)指標(biāo)、債券市場指標(biāo)、債券評級指標(biāo)、宏觀經(jīng)濟(jì)環(huán)境指標(biāo)、行業(yè)景氣指標(biāo)、地區(qū)經(jīng)濟(jì)景氣指標(biāo)等六類指標(biāo)進(jìn)行信用債違約風(fēng)險預(yù)測。Zhou Lu et al.(2021)采用半年期形式的數(shù)據(jù),衡量上市狀態(tài)、所有權(quán)結(jié)構(gòu)、行業(yè)分類和信用評級降級信息四個方面對債券信用水平的影響。近年來,部分學(xué)者發(fā)現(xiàn)債券發(fā)行人的風(fēng)險信息披露情況也會在一定程度上影響債券的信用水平,如吳育輝和唐浩博(2021)發(fā)現(xiàn)債券募集說明書中披露的風(fēng)險信息對債券信用水平有顯著影響;吳建華等(2017)推導(dǎo)了信息偏誤下資產(chǎn)價值的條件分布、違約概率和信用價差的解析表達(dá)式,基于該模型發(fā)現(xiàn)信息披露下的財務(wù)信息扭曲在一定程度上會影響債券信用水平。
二是債券信用評級指標(biāo)篩選方法研究。由于確定的初始指標(biāo)體系往往含有較多的備選指標(biāo),為了篩選出信息利用度高的指標(biāo),學(xué)者們采用了不同的方法對初始指標(biāo)體系進(jìn)行降維處理。現(xiàn)有文獻(xiàn)多在構(gòu)建信用評級模型前便對指標(biāo)體系進(jìn)行篩選,如高秀存等(2022)采用因子分析法對初始指標(biāo)體系進(jìn)行篩選,最終確定了包含流動比率、短期債務(wù)比總債務(wù)等14個指標(biāo)的最優(yōu)指標(biāo)體系。王玉龍等(2022)分別依據(jù)相關(guān)性和冗余性對初始指標(biāo)體系進(jìn)行第一次和第二次指標(biāo)篩選,最終選定營業(yè)凈利率、凈利潤、現(xiàn)金比率、財務(wù)費(fèi)用和資產(chǎn)負(fù)債率等5個財務(wù)指標(biāo)共同組成最優(yōu)指標(biāo)體系。龐春潮和羅苑瑋(2023)綜合考慮了各指標(biāo)間的顯著性、相關(guān)性和多重共線性,最終構(gòu)建了包含20個定量指標(biāo)、24個定性指標(biāo)的最優(yōu)指標(biāo)體系。謝玲玲和范龍振(2020)首先將債券數(shù)據(jù)分為違約組和非違約組,并針對初始指標(biāo)體系中的指標(biāo)依次進(jìn)行均值差異比較和相關(guān)性分析,最終建立了包括14個指標(biāo)的最優(yōu)指標(biāo)體系。徐舒玥和曹艷華(2023)利用Pearson相關(guān)分析法對全部特征指標(biāo)進(jìn)行篩選,最終保留20個變量組成最優(yōu)指標(biāo)體系。
通過回顧現(xiàn)有文獻(xiàn),發(fā)現(xiàn)學(xué)者們已經(jīng)對債券信用評級指標(biāo)體系構(gòu)建做出了諸多探索,也取得了眾多成果,但仍存在進(jìn)一步研究的空間。
一是債券信用評級海選指標(biāo)信息涵蓋不全面。債券信用評級情況受多方面因素影響,在指標(biāo)海選時,現(xiàn)有研究雖然是從債券信用評級影響因素出發(fā)去選擇指標(biāo),但多是考慮了發(fā)債主體的財務(wù)指標(biāo)、非財務(wù)指標(biāo)、宏觀指標(biāo)和債券基本信息等結(jié)構(gòu)化指標(biāo),對債券發(fā)行人的風(fēng)險披露信息并未考慮,導(dǎo)致構(gòu)建的債券信用評級指標(biāo)體系涵蓋信息不全面,影響信用評級的可靠性。
二是指標(biāo)篩選方法不科學(xué)帶來信息損失。很多研究在構(gòu)建信用評級模型前便通過相關(guān)性等統(tǒng)計量對指標(biāo)進(jìn)行篩選,但指標(biāo)篩選時無法保證保留的指標(biāo)體系組合對債券違約的預(yù)測精度,沒有體現(xiàn)出指標(biāo)體系應(yīng)保證債券違約可能性大、其信用評分低的合理思路,這種篩選方法雖然可以降低信用評級指標(biāo)體系規(guī)模,但可能帶來信息損失,進(jìn)而影響最終信用評級可靠性。
三是不同債券部分指標(biāo)取值相同,指標(biāo)差異性不強(qiáng)。現(xiàn)有文獻(xiàn)中所考慮的宏觀指標(biāo)多為債券發(fā)行人所在省級層面的相關(guān)數(shù)據(jù),這些指標(biāo)對相同省份公司發(fā)行的債券取值相同,當(dāng)相同地區(qū)的債券數(shù)量較多時,指標(biāo)體系中這些債券的宏觀指標(biāo)取值便會相同,這會導(dǎo)致該類指標(biāo)不能反映出宏觀因素對債券信用影響的差別,導(dǎo)致錯失重要影響因素。
本文的研究目標(biāo)是確定一個違約鑒別能力強(qiáng)、復(fù)雜度低且具備經(jīng)濟(jì)可解釋性的最優(yōu)債券信用評級指標(biāo)體系?;诖四繕?biāo),本文從信息充分性和信息差異性視角出發(fā),在指標(biāo)海選、指標(biāo)篩選和宏觀指標(biāo)差異化方面進(jìn)行改進(jìn)。
根據(jù)上述分析,本文的主要創(chuàng)新點(diǎn)如下:第一,在債券信用評級指標(biāo)海選時,將發(fā)債主體財務(wù)指標(biāo)、非財務(wù)指標(biāo)、宏觀指標(biāo)、債券基本信息指標(biāo)和根據(jù)上市公司發(fā)布的文本信息處理得到的風(fēng)險披露方面的指標(biāo)(如管理層凈語調(diào)等)等均納入海選指標(biāo)體系,保證指標(biāo)體系涵蓋信息更充分;第二,本文基于AdaBoost的嵌入式特征選擇方法對指標(biāo)體系進(jìn)行降維處理,在模型訓(xùn)練的同時完成最優(yōu)指標(biāo)體系篩選構(gòu)建,保證用篩選后的指標(biāo)體系進(jìn)行信用評級可以取得較好的債券違約鑒別精度,減少因只考慮指標(biāo)相關(guān)性等進(jìn)行指標(biāo)體系降維而導(dǎo)致的信息損失;第三,考慮到同省份不同債券宏觀指標(biāo)取值相同導(dǎo)致該部分指標(biāo)信息差異小的弊端,一方面采用城市層面宏觀指標(biāo),增大同省份債券宏觀指標(biāo)信息差異,另一方面引入克羅內(nèi)克積構(gòu)建宏觀指標(biāo)與債券其他特征指標(biāo)的相互作用項(xiàng),并將其加入指標(biāo)體系,保證指標(biāo)體系中該類指標(biāo)能體現(xiàn)不同債券的信息差異性,有助于識別宏觀因素是否影響債券信用評級。
二、我國上市公司債券信用評級指標(biāo)體系構(gòu)建原理
(一)樣本數(shù)據(jù)處理
1.缺失值處理
樣本數(shù)據(jù)的大量缺失可能會導(dǎo)致模型精度的下降,為了在不損失大量信息的基礎(chǔ)上盡可能地減小分析結(jié)果與真實(shí)情況之間的誤差,本文在數(shù)據(jù)預(yù)處理階段對樣本存在的缺失值進(jìn)行處理(白鈺銘和姜昱汐,2024)。
缺失值處理的整體思路是利用樣本數(shù)據(jù)中的最差值來填補(bǔ)缺失值。對于流動比率、速動比率等正向定量指標(biāo),考慮用式(1)來填補(bǔ)缺失值:
其中,ν'代表用于填充缺失值的指標(biāo)值,i代表債券(i=1,2,…,N),j代表指標(biāo),ν代表現(xiàn)有的原始指標(biāo)值,N代表債券總數(shù)。若式(1)得到的ν'偏離了該指標(biāo)的合理范圍,則用現(xiàn)有指標(biāo)值中的最小值來填補(bǔ)。
對于有形凈值債務(wù)率、長期資本負(fù)債率等負(fù)向定量指標(biāo),考慮用式(2)來填補(bǔ)缺失值:
式(2)中各參數(shù)含義同式(1),若式(2)得到的ν'偏離了該指標(biāo)的合理范圍,則用現(xiàn)有指標(biāo)值中的最大值來填補(bǔ)。
對于董事會規(guī)模、管理層平均年齡等區(qū)間指標(biāo),考慮用式(3)來填補(bǔ)缺失值:
其中,q代表區(qū)間指標(biāo)的最小值,q代表區(qū)間指標(biāo)的最大值,(q+ q)/2代表區(qū)間指標(biāo)的中間值。
式(1)—(3)為定量指標(biāo)的缺失值填補(bǔ)方法,對于股權(quán)性質(zhì)等定性指標(biāo),考慮按照類別進(jìn)行等級劃分,并在[0,1]范圍內(nèi)為其賦分,然后用最低分來填補(bǔ)缺失值。
2.指標(biāo)數(shù)據(jù)異常值處理和標(biāo)準(zhǔn)化
在缺失值填補(bǔ)完成后,對獲得的完整數(shù)據(jù)進(jìn)行前后1%縮尾的異常值處理(白鈺銘和姜昱汐,2024)。同時,考慮到樣本數(shù)據(jù)間的單位和量綱不同,本文在數(shù)據(jù)預(yù)處理階段對樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,即將所有定量指標(biāo)數(shù)據(jù)歸于[0,1]之間,便于后續(xù)模型的構(gòu)建與評估,具體標(biāo)準(zhǔn)化公式如下(遲國泰等,2016):
式(4)—(6)為定量指標(biāo)的標(biāo)準(zhǔn)化公式,其中,式(4)為正向指標(biāo)的歸一化過程,式(5)為負(fù)向指標(biāo)的歸一化過程,式(6)為區(qū)間指標(biāo)的歸一化過程。公式中各參數(shù)含義為:xij代表第i只債券第j個指標(biāo)標(biāo)準(zhǔn)化后的數(shù)值,其它參數(shù)含義同前文。
3.基于SMOTE方法的非均衡樣本處理
對于我國上市公司債券信用評級問題而言,違約債券的數(shù)量遠(yuǎn)少于非違約債券,因此我國上市公司債券數(shù)據(jù)為非均衡樣本。為了避免非均衡樣本數(shù)據(jù)可能導(dǎo)致的分類預(yù)測精度降低等問題,本文采用SMOTE方法對樣本進(jìn)行均衡化處理。
不同于隨機(jī)過采樣技術(shù)直接復(fù)制合成新的少數(shù)類樣本即違約樣本來解決樣本非均衡問題,欠采樣技術(shù)直接刪除多數(shù)類樣本即非違約樣本使樣本數(shù)據(jù)達(dá)到均衡,本文采用SMOTE方法通過對違約樣本進(jìn)行插值來創(chuàng)建新的違約樣本,在實(shí)現(xiàn)樣本均衡的同時,幫助提高模型的泛化能力和準(zhǔn)確性。
用SMOTE方法實(shí)現(xiàn)上市公司債券樣本均衡的過程如下:首先,從違約債券中隨機(jī)選擇一個樣本計算它與其k個最近鄰樣本之間的距離,將計算得到的差值乘以0到1之間的隨機(jī)數(shù),然后將結(jié)果添加到違約樣本中作為新的合成樣本。重復(fù)上述過程,直到樣本數(shù)據(jù)達(dá)到均衡。
(二)基于AdaBoost的上市公司債券信用評級指標(biāo)體系構(gòu)建與模型精度評估
信用評級是一個全面評估債券違約風(fēng)險的過程,合理有效的信用評級要求能夠充分反映債券的違約可能性,即能夠滿足債券違約可能性大、其信用評級低的合理?xiàng)l件。因此,本文以債券違約預(yù)測精度高和指標(biāo)體系規(guī)模合理為指標(biāo)體系建立的原則,確立債券信用評級指標(biāo)體系。
1.指標(biāo)體系的構(gòu)建
(1)初始指標(biāo)體系構(gòu)建
參照惠譽(yù)、標(biāo)普、穆迪、中誠信等國內(nèi)外權(quán)威評級機(jī)構(gòu)的信用評級指標(biāo)體系,同時結(jié)合已有的經(jīng)典文獻(xiàn),從發(fā)債主體內(nèi)部財務(wù)指標(biāo)、發(fā)債主體內(nèi)部非財務(wù)指標(biāo)、債券基本信息指標(biāo)和宏觀指標(biāo)等多個方面,選取債券信用評級可能的影響因素,建立本文的初始指標(biāo)體系,具體包括各種結(jié)構(gòu)化指標(biāo)和根據(jù)上市公司發(fā)布的文本信息處理得到的風(fēng)險披露方面的指標(biāo)(如管理層凈語調(diào)等)。
(2)基于數(shù)據(jù)可獲性的指標(biāo)第一次篩選
由于部分指標(biāo)數(shù)據(jù)無法獲取或存在大量缺失,若不在模型訓(xùn)練前對指標(biāo)進(jìn)行處理可能會導(dǎo)致模型精度的下降,因此,本文基于指標(biāo)數(shù)據(jù)的可獲得性對初始指標(biāo)體系進(jìn)行第一次篩選。
(3)宏觀指標(biāo)差異化處理
為保證每個指標(biāo)都能反映不同債券的差異,更好地識別債券信用風(fēng)險因素,本文構(gòu)造了宏觀指標(biāo)與債券其他特征指標(biāo)的相互作用項(xiàng),即通過計算宏觀指標(biāo)與債券其他特征指標(biāo)的克羅內(nèi)克積,得到具有債券差異性的新的宏觀指標(biāo),并將得到的新的特征指標(biāo)納入指標(biāo)池,參與指標(biāo)的第二次篩選。
宏觀指標(biāo)差異化處理的目的:通過計算宏觀指標(biāo)與債券其他特征指標(biāo)的克羅內(nèi)克積來構(gòu)造相互作用項(xiàng),可以保證每一只債券的宏觀指標(biāo)都能在最大程度上反映債券的真實(shí)信息,且在不同債券間具有差異性,進(jìn)而能更準(zhǔn)確識別信用風(fēng)險關(guān)鍵因素;考慮到初始指標(biāo)池中可能含有大量無法獲取數(shù)據(jù)的指標(biāo),若直接計算宏觀指標(biāo)與債券其他特征指標(biāo)的克羅內(nèi)克積,可能會產(chǎn)生大量數(shù)據(jù)缺失嚴(yán)重的指標(biāo),造成信息噪聲增加,同時增加后續(xù)計算工作量,因此本文對第一次篩選后的宏觀指標(biāo)做債券差異化處理。宏觀指標(biāo)差異化處理的具體公式如下(Leippold M et al.,2022):
(4)基于AdaBoost的指標(biāo)第二次篩選
為了進(jìn)一步提高模型的預(yù)測精度,同時降低模型的復(fù)雜度,本文利用基于AdaBoost的嵌入式特征選擇方法對指標(biāo)體系進(jìn)行降維處理,在模型訓(xùn)練的同時完成指標(biāo)第二次篩選。
對模型訓(xùn)練得到的結(jié)果進(jìn)行精度和指標(biāo)體系精簡性的對比,依據(jù)結(jié)果反推同時滿足預(yù)測精度高且模型更精簡的最優(yōu)指標(biāo)體系。
AdaBoost算法作為一種重要的集成學(xué)習(xí)算法,主要通過不斷將多個弱學(xué)習(xí)器進(jìn)行訓(xùn)練,最終加權(quán)組合為一個強(qiáng)學(xué)習(xí)器,實(shí)現(xiàn)模型精度的提高,并對樣本準(zhǔn)確分類(Freund Y and Schapire R E,1997)。具體計算步驟如下:
假設(shè)債券樣本的訓(xùn)練集為S=(x,y),(x,y),…,(x,y),其中,xR為q維債券特征空間的樣本,y0,1(i=1,2,…,N)為債券違約狀態(tài)(其中yi=1代表債券違約,否則為不違約)。
初始化債券樣本數(shù)據(jù)的權(quán)值分布,對每一個訓(xùn)練樣本賦予相同的權(quán)值w:
進(jìn)行m(m=1,2,…,M)輪迭代,依次訓(xùn)練每個弱分類器Cm(x):
選取弱分類器決策樹Cm(x)訓(xùn)練債券樣本數(shù)據(jù)的權(quán)值,計算每一次迭代時弱分類器的錯誤率em:
計算弱分類器Cm(x)在最終分類器中的權(quán)重α:
更新債券樣本數(shù)據(jù)的權(quán)重w:
其中,Z為:
對債券樣本進(jìn)行反復(fù)迭代,直至迭代次數(shù)m等于設(shè)置的迭代次數(shù)M,將多次迭代得到的各個弱分類器進(jìn)行加權(quán)組合,得到f(x):
通過符號函數(shù)sign(·)的作用,得到最終的強(qiáng)分類器G(x):
2.模型評估
為了更好地評估模型的分類性能,本文引入了5個經(jīng)典的判別精度指標(biāo)對模型進(jìn)行精度檢驗(yàn),分別為準(zhǔn)確率(Accuracy)、AUC(ROC曲線下面積)、第一類錯誤(Type I Error)、第二類錯誤(Type Ⅱ Error)以及幾何平均值(G-mean),各精度指標(biāo)的含義及計算參照經(jīng)典文獻(xiàn)(遲國泰等,2020),本文不再贅述。選取的上述5個判別精度指標(biāo)既涵蓋了對模型整體性能的評估,又考慮到了模型的分類性能,可以較好地衡量模型的綜合精度。
三、基于AdaBoost的上市公司債券信用評級指標(biāo)體系構(gòu)建
(一)樣本選取及數(shù)據(jù)來源
1.樣本選取
考慮到信用評級應(yīng)該對債券違約有預(yù)警作用,因此本文通過構(gòu)建t-1年時間窗對我國上市公司發(fā)行的38233只在市債券進(jìn)行違約預(yù)測,并依據(jù)違約預(yù)測的精度結(jié)果反推確定債券信用評級指標(biāo)體系,即所使用的指標(biāo)數(shù)據(jù)為2012—2021年,對應(yīng)的違約狀態(tài)為2013—2022年。
2.樣本數(shù)據(jù)來源
本文的債券樣本數(shù)據(jù)來自多個渠道,債券基本信息、發(fā)債主體內(nèi)部財務(wù)指標(biāo)數(shù)據(jù)和非財務(wù)指標(biāo)數(shù)據(jù)從國泰安數(shù)據(jù)庫獲取;債券違約情況從銳思數(shù)據(jù)庫獲取;宏觀指標(biāo)數(shù)據(jù)則從《中國城市統(tǒng)計年鑒》《中國城市建設(shè)統(tǒng)計年鑒》及各地級市統(tǒng)計公報獲取。
需要特別指出的是,本文在發(fā)債主體內(nèi)部非財務(wù)指標(biāo)中補(bǔ)充考慮了債券發(fā)行人的風(fēng)險信息披露情況,并采用管理層凈語調(diào)對其進(jìn)行衡量。管理層凈語調(diào)無法從國泰安數(shù)據(jù)庫中直接獲取,需要依據(jù)正面詞匯數(shù)量和負(fù)面詞匯數(shù)量進(jìn)行進(jìn)一步計算,具體計算如式(16)所示(謝德仁和林樂,2015)。
其中,pos代表管理層信息披露中的正面詞匯數(shù)量,neg代表管理層信息披露中的負(fù)面詞匯數(shù)量,tone則代表管理層凈語調(diào),tone越大,證明管理層信息披露的語調(diào)越積極。
(二)樣本數(shù)據(jù)處理
1.指標(biāo)數(shù)據(jù)預(yù)處理
依據(jù)前文所述,對于獲取的原始指標(biāo)數(shù)據(jù),首先利用已有數(shù)據(jù)中的最差值對缺失值進(jìn)行填補(bǔ)(其原因是本文通過預(yù)測債券違約來對債券進(jìn)行信用評級,信息缺失時用最差值填補(bǔ)缺失值,即對信息披露不完全的債券,將缺失的信息視為該方面表現(xiàn)差,這樣處理的目的是為了更好地防控債券違約風(fēng)險),進(jìn)一步地,對無缺失值的完整數(shù)據(jù)進(jìn)行前后1%縮尾的異常值處理,并將所有指標(biāo)數(shù)據(jù)歸于[0,1]之間。
2.樣本劃分和基于SMOTE方法的非均衡樣本處理
對于全部債券樣本,本文首先按照8:2的比例進(jìn)行分層抽樣,將樣本隨機(jī)劃分為訓(xùn)練集和測試集。劃分后的訓(xùn)練集樣本中,違約樣本數(shù)為200,非違約樣本數(shù)為30386,顯然本文選用的樣本數(shù)據(jù)為類別非均衡數(shù)據(jù)。根據(jù)已有研究可知,對類別非均衡樣本,模型對小類別的特征學(xué)習(xí)相對不足,因此通常需要對非均衡樣本進(jìn)行處理。
本文對訓(xùn)練集樣本數(shù)據(jù)按照前文所述SMOTE方法步驟進(jìn)行均衡化處理,來保證訓(xùn)練集中兩類樣本數(shù)量相同,降低樣本類別不均衡對預(yù)測結(jié)果產(chǎn)生的影響。通過利用SMOTE方法處理上述非均衡樣本數(shù)據(jù),得到違約樣本數(shù)與非違約樣本數(shù)達(dá)到1:1的均衡樣本,SMOTE非均衡樣本處理前后對比如表1所示。
為了提高模型的泛化性能,對于均衡化的訓(xùn)練集樣本,本文利用十折交叉驗(yàn)證方法將數(shù)據(jù)按照9:1的比例劃分為新的訓(xùn)練集和驗(yàn)證集,參與后續(xù)模型的訓(xùn)練,占樣本總數(shù)20%的測試集樣本則用于檢驗(yàn)訓(xùn)練完成的模型精度。
(三)指標(biāo)體系構(gòu)建
1.初始指標(biāo)體系構(gòu)建
本研究所涉及的初始指標(biāo)共377個,其中包含“資產(chǎn)負(fù)債率”“長期借款與總資產(chǎn)比”等157個發(fā)債主體內(nèi)部財務(wù)指標(biāo),“股權(quán)制衡度”“管理層凈語調(diào)”等125個發(fā)債主體內(nèi)部非財務(wù)指標(biāo),“目前狀態(tài)”“品種類別”等50個債券基本信息指標(biāo)以及“城市產(chǎn)業(yè)結(jié)構(gòu)高級化”“城市人均GDP”等45個宏觀指標(biāo)。
2.第一次指標(biāo)篩選
對于指標(biāo)海選得到的初始指標(biāo)體系,刪掉無法獲取數(shù)據(jù)或數(shù)據(jù)存在大量缺失的指標(biāo)。刪除數(shù)據(jù)獲取困難的指標(biāo)、保留數(shù)據(jù)可獲取的指標(biāo)可以在最大程度上保證構(gòu)建的指標(biāo)體系信息的有效性。
經(jīng)過篩選后保留了“資產(chǎn)負(fù)債率”“資產(chǎn)報酬率”“城市數(shù)字普惠金融指數(shù)”等200個指標(biāo),第一次篩選后的指標(biāo)體系如表2所示。
3.宏觀指標(biāo)差異化處理
計算第一次指標(biāo)篩選所得指標(biāo)體系的宏觀指標(biāo)與債券其他特征指標(biāo)的克羅內(nèi)克積,并將得到的相互作用項(xiàng)作為新的宏觀指標(biāo)納入后續(xù)模型訓(xùn)練及最優(yōu)債券信用評級指標(biāo)體系的構(gòu)建中,最終得到6951個特征指標(biāo)。
(四)上市公司債券信用評級指標(biāo)體系構(gòu)建與精度檢驗(yàn)
1.基于AdaBoost的第二次指標(biāo)篩選
對于第一次篩選完成的指標(biāo)體系,在宏觀指標(biāo)完成債券差異化處理的基礎(chǔ)上,通過基于AdaBoost的嵌入式特征選擇方法對指標(biāo)體系進(jìn)行第二次指標(biāo)篩選,并依據(jù)模型的精度及降維效果,遴選出對債券違約狀態(tài)有顯著影響的特征指標(biāo),最終確定本文的最優(yōu)指標(biāo)體系如表3所示。
2.債券信用評級違約預(yù)測精度測算
模型精度的測算離不開混淆矩陣中的相關(guān)指標(biāo),本文表4、表5分別給出了模型訓(xùn)練集和測試集的混淆矩陣。依據(jù)表4,可以得到訓(xùn)練集的鑒別精度結(jié)果,其中,acc=98.76%、AUC=99.88%、Type I Error=1.74%、TypeⅡError=0.74%、G-mean=98.76%。
依據(jù)表5,可以得到測試集的鑒別精度結(jié)果,其中,acc=98.35%、AUC=99.07%、Type I Error=1.62%、Type Ⅱ Error=6.00%、G-mean=96.17%??梢钥闯?,無論是訓(xùn)練集還是測試集,基于AdaBoost算法的模型鑒別精度均在94%以上,表明用篩選后的指標(biāo)體系建立模型具有一定的泛化性能,同時對上市公司債券有較強(qiáng)的違約判別能力。
3.不同模型精度對比
為了進(jìn)一步論證基于AdaBoost算法對指標(biāo)體系進(jìn)行篩選的合理性及有效性,本文選取了4個常用模型與AdaBoost模型得到的結(jié)果進(jìn)行精度及指標(biāo)體系規(guī)模對比,4個模型分別為梯度提升樹(Gradient Boosting Decision Tree,GBDT)、邏輯回歸(Logistic Regression,LR)、隨機(jī)森林(Random Forest,RF)以及隨機(jī)梯度下降(Stochastic Gradient Descent,SGD)。
表6給出了不同違約預(yù)測模型的指標(biāo)體系規(guī)模,可以看出,AdaBoost的最優(yōu)指標(biāo)體系包含45個特征,指標(biāo)個數(shù)明顯少于其他模型的最優(yōu)指標(biāo)體系,因此,對于本文而言,AdaBoost模型降維效果最好。
較訓(xùn)練集而言,測試集精度可以更好地衡量模型的泛化性能,因此在模型精度對比時,本文僅列出不同模型的測試集精度結(jié)果,不同模型測試集精度結(jié)果對比如表7所示。
由表7可知,AdaBoost模型的Type Ⅱ Error指標(biāo)明顯小于LR模型等其他模型。對于債券違約預(yù)警問題而言,Type Ⅱ Error是投資者更為關(guān)注的精度指標(biāo),Type Ⅱ Error越大意味著將違約樣本誤判為非違約樣本的可能性越大,帶來的損失也會越大。同時,AdaBoost模型的其他精度指標(biāo)雖然不全為最好,但同其他模型中該指標(biāo)最好值相差很小。因此,在Type Ⅱ Error最小的基礎(chǔ)上,綜合考慮各模型的精度指標(biāo),確定AdaBoost模型擁有最好的違約鑒別精度以及泛化能力。
綜合考慮各模型的指標(biāo)體系規(guī)模和鑒別精度,不難看出AdaBoost模型的指標(biāo)體系規(guī)模最小、鑒別精度綜合表現(xiàn)最好,表明本文基于AdaBoost算法篩選得到的信用評級指標(biāo)體系可信度高。
4.引入風(fēng)險信息披露情況指標(biāo)前后的精度對比
為了驗(yàn)證信息充分性在債券信用評級中的重要作用,表8列出了引入風(fēng)險信息披露情況指標(biāo)前后測試集預(yù)測精度的結(jié)果對比。
由表8可知,在引入風(fēng)險信息披露情況指標(biāo)后,模型的綜合精度和類別精度指標(biāo)均得到了一定的提升,明顯優(yōu)于未考慮風(fēng)險信息披露情況指標(biāo)的樣本模型,其中在債券違約鑒別中重點(diǎn)關(guān)注的指標(biāo)Type Ⅱ Error精度提升了2%,且對非違約的債券鑒別精度也提升了3.26%。顯然,加入風(fēng)險信息披露情況指標(biāo)來增大指標(biāo)體系的信息充分性,的確可以得到更高的債券違約鑒別精度,同時降維效果也更優(yōu),即指標(biāo)信息充分性提高,會提高債券違約的預(yù)測精度,因此得到的信用評級指標(biāo)體系對衡量債券信用評級更可信。
5.宏觀指標(biāo)差異化處理前后的精度對比
為了進(jìn)一步驗(yàn)證使用具有債券差異性的宏觀指標(biāo)進(jìn)行模型訓(xùn)練能夠取得更好的綜合鑒別精度和降維效果,即信息差異對識別債券信用評級關(guān)鍵因素具有積極作用,本文計算了宏觀指標(biāo)差異化處理前后模型的預(yù)測精度,表9列出了宏觀指標(biāo)差異化處理前后測試集的預(yù)測精度對比。
由表9可知,當(dāng)宏觀指標(biāo)具有債券差異性時,模型的各個精度指標(biāo)得到了較顯著的提升,其中綜合精度指標(biāo)acc、G-mean和非違約債券的鑒別指標(biāo)Type I Error、違約債券的鑒別精度指標(biāo)Type Ⅱ Error提升較為顯著,最大的提升幅度達(dá)到2.12%,且綜合精度指標(biāo)AUC也有小幅提升。同時,對于使用具有債券差異性的宏觀指標(biāo)樣本的模型而言,其最優(yōu)指標(biāo)體系中指標(biāo)個數(shù)占第一次篩選后的指標(biāo)體系的0.65%,明顯優(yōu)于未使用具有債券差異性的宏觀指標(biāo)樣本模型的15.50%,表明使用具有債券差異性的宏觀指標(biāo)可以更好地提升指標(biāo)體系預(yù)測精度和降維效率。
綜合考慮模型的精度及降維效率,發(fā)現(xiàn)采用克羅內(nèi)克積構(gòu)造具有債券差異性的宏觀指標(biāo)方法有效,得到的債券違約鑒別精度更高,即提升債券信用評級指標(biāo)體系信息差異的思路可行,指標(biāo)信息差異性增大,會提高債券違約的預(yù)測精度,提升債券信用評級指標(biāo)體系可靠性。
6.信用評級指標(biāo)重要性排序
前文已經(jīng)驗(yàn)證本文構(gòu)建的信用評級模型具有不同信用的區(qū)分能力,且判別精度較高。在此基礎(chǔ)上,計算該模型對應(yīng)的各特征指標(biāo)權(quán)重,并對其重要性進(jìn)行排序,最優(yōu)信用評級指標(biāo)體系中各特征指標(biāo)權(quán)重及重要性排序如表10所示。
由表10可知,在包含45個指標(biāo)的信用評級指標(biāo)體系中,城市數(shù)字普惠金融指數(shù)*管理層平均年齡、城市產(chǎn)業(yè)結(jié)構(gòu)*監(jiān)事會規(guī)模、綜合收益增長率等指標(biāo)的重要性得分較高,表明這些指標(biāo)對于債券違約鑒別、信用評級而言經(jīng)濟(jì)意義更顯著。最終指標(biāo)體系中包含債券發(fā)行人的風(fēng)險信息披露情況指標(biāo)(如管理層凈語調(diào))和多個經(jīng)過差異化處理后的宏觀指標(biāo),進(jìn)一步驗(yàn)證了具有信息充分性和差異性的指標(biāo)對模型預(yù)測有影響。
四、結(jié)論與政策建議
(一)結(jié)論
本文通過對我國上市公司發(fā)行的債券進(jìn)行違約鑒別,并依據(jù)違約預(yù)測精度結(jié)果反推最優(yōu)指標(biāo)體系,得到主要結(jié)論如下:
一是本文構(gòu)建的最終指標(biāo)體系包含管理層風(fēng)險披露信息的管理層凈語調(diào)等指標(biāo),表明上市公司管理層信息披露對債券信用評級有影響,引入該類指標(biāo),可提高債券信用評級指標(biāo)體系涵蓋信息的充分性。通過對比引入風(fēng)險信息披露情況指標(biāo)前后的預(yù)測結(jié)果,發(fā)現(xiàn)指標(biāo)體系信息充分性的提高能提升預(yù)測精度,進(jìn)而增強(qiáng)債券信用評級指標(biāo)體系的可靠性。
二是本文利用基于AdaBoost的嵌入式特征選擇方法對指標(biāo)體系進(jìn)行降維處理,在指標(biāo)篩選時能更好地保證指標(biāo)體系信息充分性。該方法在模型訓(xùn)練的同時完成指標(biāo)篩選,相比在預(yù)測前進(jìn)行指標(biāo)篩選的處理方法,本文的方法在預(yù)測時輸入更多特征,因此涵蓋的信息更充分。且根據(jù)預(yù)測精度結(jié)果可知,本文模型的預(yù)測精度AUC=99.07%gt;70.00%,且降維后只包含第一次篩選后指標(biāo)數(shù)的0.65%(即從原有的6951個指標(biāo)降低到45個指標(biāo)),表明了本文篩選方法的可靠性和有效性。
三是根據(jù)最終確定的最優(yōu)指標(biāo)體系可知,基于克羅內(nèi)克積構(gòu)建的多個差異性指標(biāo)對債券信用評級有影響,表明信息差異對識別債券信用評級關(guān)鍵因素有積極作用。
四是根據(jù)宏觀指標(biāo)的差異性處理前后預(yù)測結(jié)果對比,引入進(jìn)行差異性處理的宏觀指標(biāo)構(gòu)建的指標(biāo)體系預(yù)測精度更高,表明提高指標(biāo)體系信息差異性能改善預(yù)測精度,提高債券信用評級指標(biāo)體系可靠性。
(二)政策建議
對于發(fā)債主體而言,應(yīng)充分了解可能影響信用水平的各因素,加強(qiáng)企業(yè)自身財務(wù)建設(shè)、非財務(wù)建設(shè),進(jìn)一步提高企業(yè)及其發(fā)行債券的透明度和風(fēng)險信息披露。同時在企業(yè)內(nèi)部建立完善的債券管理和監(jiān)控機(jī)制,依據(jù)信用評級影響因素做好自身違約風(fēng)險評估與防范,提升其發(fā)行債券的信用水平。
對于相關(guān)機(jī)構(gòu)而言,應(yīng)及時更新信用評級指標(biāo)體系,根據(jù)企業(yè)的發(fā)展情況不斷進(jìn)行自我革新,同時要清晰地披露信用評級標(biāo)準(zhǔn)和方法。此外,相關(guān)機(jī)構(gòu)要加強(qiáng)對企業(yè)綜合收益增長率等指標(biāo)的關(guān)注,幫助企業(yè)有的放矢地提升自身及發(fā)行債券的信用水平,為企業(yè)健康良性發(fā)展?fàn)I造一個好的信用環(huán)境。
對于投資者而言,要對債券信用評級的影響因素有一定的了解,不能盲目投資。不僅要關(guān)注企業(yè)公布的重要財務(wù)指標(biāo),還應(yīng)該關(guān)注企業(yè)的風(fēng)險披露信息,同時,要考慮發(fā)債主體所在城市的宏觀指標(biāo)和微觀指標(biāo)的綜合狀況,對債券信用水平關(guān)鍵影響因素表現(xiàn)不佳的債券要謹(jǐn)慎投資,要及時關(guān)注相關(guān)機(jī)構(gòu)公布的債券信用影響因素變化情況,盡可能地提前規(guī)避風(fēng)險,減少自身損失。
參考文獻(xiàn):
[1]王培輝,張猛.中國債券市場信息溢出效應(yīng)研究[J].海南金融,2023(9):3-20.
[2]鄒昆侖,陸萍.基于Z模型對中國企業(yè)債信用評級的實(shí)證研究[J].宏觀經(jīng)濟(jì)研究,2018(5):72-83+175.
[3]Chi M,Hongyan S,Shaofan W,et al.Bond default prediction based on deep learning and knowledge graph technology[J].IEEE Access,2021(9):12750-12761.
[4]姚瀟,李可,余樂安.非平衡樣本下基于生成對抗網(wǎng)絡(luò)過抽樣技術(shù)的公司債券違約風(fēng)險預(yù)測研究[J].系統(tǒng)工程理論與實(shí)踐,2022(10):2617-2634.
[5]生柳榮,陳海華,胡施聰,等.企業(yè)債券信用風(fēng)險預(yù)警模型及其運(yùn)用[J].投資研究,2019(6):25-35.
[6]蔣敏,周煒,史濟(jì)川,等.基于fsQCA的上市企業(yè)債券違約影響因素研究[J].管理學(xué)報,2021(7):1076-1085.
[7]肖艷麗,向有濤.企業(yè)債券違約風(fēng)險預(yù)警——基于GWO-XGBoost方法[J].上海金融,2021(10):44-54.
[8]陳學(xué)彬,武靖,徐明東.我國信用債個體違約風(fēng)險測度與防范——基于LSTM深度學(xué)習(xí)模型[J].復(fù)旦學(xué)報(社會科學(xué)版),2021(3):159-173.
[9]Lu Z,Zhuo Z.Modelling of Chinese corporate bond default–A machine learning approach[J].Accounting amp; Finance,2021(5):6147-6191.
[10]吳育輝,唐浩博.風(fēng)險信息披露能預(yù)測債券違約風(fēng)險嗎?——來自債券募集說明書的經(jīng)驗(yàn)證據(jù)[J].財務(wù)研究,2021(5):15-28.
[11]吳建華,張穎,王新軍.信息披露扭曲下企業(yè)債券違約風(fēng)險量化研究[J].數(shù)理統(tǒng)計與管理,2017(1):175-190.
[12]高秀存,趙明航,楊倩芳.基于因子分析和SVM的信用債違約風(fēng)險預(yù)警實(shí)證研究——以河北省為例[J].征信,2022(8):87-92.
[13]王玉龍,周榴,張滌霏.企業(yè)債務(wù)違約風(fēng)險預(yù)測——基于機(jī)器學(xué)習(xí)的視角[J].財政科學(xué),2022(6):62-74.
[14]龐春潮,羅苑瑋.基于投資者視角的信用類債券違約風(fēng)險預(yù)警[J].統(tǒng)計與決策,2023(2):152-157.
[15]謝玲玲,范龍振.上市公司信用債違約風(fēng)險評估[J].管理現(xiàn)代化,2020(2):104-108.
[16]徐舒玥,曹艷華.基于可解釋機(jī)器學(xué)習(xí)的信用債違約研究[J].科學(xué)決策,2023(5):190-200.
[17]白鈺銘,姜昱汐.基于特征選擇和違約鑒別的我國上市公司債券違約預(yù)警模型研究[J].工程數(shù)學(xué)學(xué)報,2024(1):67-87.
[18]遲國泰,張亞京,石寶峰.基于Probit回歸的小企業(yè)債信評級模型及實(shí)證[J].管理科學(xué)學(xué)報,2016(6):136-156.
[19]Leippold M,Wang Q,Zhou W.Machine learning in the Chinese stock market[J].Journal of Financial Economics,2022(2):64-82.
[20]Freund Y,Schapire R E.A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting[J].Journal of Computer and System Sciences,1997(1):119-139.
[21]遲國泰,章彤,張志鵬.基于非平衡數(shù)據(jù)處理的上市公司ST預(yù)警混合模型[J].管理評論,2020(3):3-20.
[22]謝德仁,林樂.管理層語調(diào)能預(yù)示公司未來業(yè)績嗎?——基于我國上市公司年度業(yè)績說明會的文本分析[J].會計研究,2015(2):20-27+93.