• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      機器學(xué)習(xí)模型預(yù)測信用違約的研究與實證分析

      2022-04-29 00:44:03陳雪融
      計算機應(yīng)用文摘 2022年10期
      關(guān)鍵詞:預(yù)測出錯誤率債券

      摘要:隨著信用債“暴雷”的頻繁發(fā)生,信用債違約成為金融市場較為重要的課題。文章主要利用公司財務(wù)數(shù)據(jù),采取兩種機器學(xué)習(xí)模型預(yù)測公司債違約,并利用樣本進行了實際測算以及對結(jié)果進行了對比,發(fā)現(xiàn)兩種機器學(xué)習(xí)模型對于預(yù)測公司債信用違約都有較好的效果。其中,SVM模型的預(yù)測精度更高,logit模型則犧牲了一部分精度來預(yù)測出更多違約事件。應(yīng)用層面上,logit模型更適合市場風(fēng)險預(yù)警,而SVM模型更適用于提示監(jiān)管機構(gòu)采取一定措施。利用機器學(xué)習(xí)模型研究信用債違約,有助于推動我國信用風(fēng)險評估市場化進程。

      關(guān)鍵詞:信用違約;logit模型;SVM模型;比較分析;應(yīng)用場景啟示中圖法分類號:F830 文獻標識碼:A

      Research and empirical analysis on prediction of credit default usingmachine learning model

      CHEN Xuerong

      (Yushi Internet Financial Information Service Co., Ltd., Shanghai 200120, China)

      Abstract: With the frequent occurrence of credit debt thunderstorm, credit default has become a more important issue in financial market. Mathematical methods are also more common in finance, and machine learning techniques are more mature. Therefore, this paper mainly uses the company financial data, adopts two kinds of machine learning model to forecast the company debt default, uses the sample to carry on the actual computation, and has carried on the contrast to the result. It is found that the two ML models have better effect on the default of corporate bonds. The precision of SVM model is higher, but logit model sacrifices part of precision to predict more default events. On the application level, logit model is more suitable for market risk early warning, while SVM is more suitable for prompting regulators to take certain measures. The study of credit default using machine learning model is helpful to the further development of credit default prediction and the marketization of credit risk assessment in China.

      Key words: credit default, logit model, SVM model, comparative analysis, application scenario enlightenment

      1? 研究背景

      債券是金融市場不可或缺的重要工具之一,信用債又是債券中的重要類型。信用債是企業(yè)的重要融資途徑,信用風(fēng)險是金融市場風(fēng)險的重要來源。近年來,信用違約事件屢屢發(fā)生,信用債違約逐漸成為常態(tài)。2019年,209 只債券發(fā)生違約,違約金額為1302.33億元;2020年,196只債券發(fā)生違約,違約金額達1752.71億元。在此背景下,研究信用債違約便成為重要課題。

      定性分析較為常見的違約分析辦法,主要分析發(fā)行公司的現(xiàn)金流和盈利狀況,常見方法為 5C ( Capacity,Capital,Collateral,Condition,Character )模型,主要從企業(yè)償債能力、資本結(jié)構(gòu)、抵押品價值、公司未來成長和公司償債意愿等維度進行分析。

      現(xiàn)有的定量分析預(yù)測違約模型可分為三類:第一類是評分模型。其中,具有代表性的模型有基于多元判別分析( MDA)的 Altman ( 1968) Z 評分模型和 Ohlson (1980) O 評分模型。Z 評分模型存在較大的局限性。首先,其決策規(guī)則是不確定的,得分判別存在2.99~ 1.81的中空地帶。此外,它并沒有給出估計的違約概率。logit 模型則可以有效地解決該問題。 Ohlson (1980)使用 logit 模型來計算違約概率。LDA 線性與 logit 和 probit 非線性模型僅僅是將模型套用在公司/企業(yè)債上,它們存在兩個問題,即起到較大作用的是指標的設(shè)定,而指標的人為構(gòu)造或選取又存在一定的主觀性;線性回歸或者非線性回歸雖不易造成過擬合,但是容錯率很高,對于違約的預(yù)測沒有很好的效果。

      第二類是 Merton (1974)提出的結(jié)構(gòu)化模型,即 Merton 模型。其假設(shè)購買杠桿公司的股票應(yīng)被視為等價于購買寫在公司資產(chǎn)上的看漲期權(quán)。Merton 模型假設(shè)資產(chǎn)價值是隨機的,并遵循幾何布朗運動;預(yù)期資產(chǎn)收益率和波動率以及無風(fēng)險利率,不隨著時間推移改變。Merton 模型存在局限性,如需要對發(fā)債人的債務(wù)進行持續(xù)交易,而大多數(shù)負債都很難經(jīng)常性地交易;資產(chǎn)價值的波動標準差被假定為不變,而實際的波動性隨著時間而變化等。

      第三類是 Reduced Form 模型。它是生存分析模型的一種變體。之所以將 Hazard 模型稱為 Reduced Form 模型,是因為 Hazard 模型將復(fù)雜的違約機制簡化為一個簡單的表達式,使模型能夠在現(xiàn)實中接受市場數(shù)據(jù)采集。它還可以推導(dǎo)出無套利定價、估值和套期保值公式。

      2? 模型

      2.1? 因子篩選

      我們建立了關(guān)于債券的數(shù)據(jù)庫,除了債券的一些基礎(chǔ)信息外,還從公司財務(wù)報表中整理了400多個財務(wù)因子,作為模型的輸入變量。

      2.2? logit 模型建立

      (1)logit 模型原理

      在分析國內(nèi)外定量模型的優(yōu)缺點及適用性后,針對我國的信用債市場,考慮選擇 binomial 分布對應(yīng)的 logit 回歸為初始模型。觀測到違約事件發(fā)生情況:

      其中,殘差項εi 的分布為 logistic 分布。

      那么,Yi =1的概率公式如下:

      其中:

      其中,Xi 為因子參數(shù),β為對應(yīng)參數(shù)的系數(shù)值。

      (2)logit 機器學(xué)習(xí)計算步驟

      在非線性模型預(yù)測的基礎(chǔ)上,我們在模型中引入了機器學(xué)習(xí)算法(圖1)來完成預(yù)測違約。

      將該算法轉(zhuǎn)為機器學(xué)習(xí)模式,可以處理為:

      Logistic 回歸模型可以寫成 Y=h ( x )= F(X′iβ+εi ),其替代函數(shù) sigmoid 函數(shù)也叫 s 型函數(shù),用 g( z )表示:

      其中,z=X′iβ+εi 。

      誤差反饋(損失函數(shù) J)為:

      機器學(xué)習(xí)模型容易過擬合,泛化能力較差,且違約事件為小概率事件,難以訓(xùn)練[2]。此時,需要模型的參數(shù)設(shè)置精巧,即考慮過擬合問題,同時能保證預(yù)測精度。為了解決機器學(xué)習(xí)的維度災(zāi)難問題,本文在模型中加入了正則項。正則項可以取不同的形式,在回歸問題中取平方損失,就是參數(shù)的 L2范數(shù),也可以取 L1范數(shù)。取平方損失時,模型的損失函數(shù)變?yōu)椋?/p>

      其中,λ為正則項系數(shù),合適的正則函數(shù)和系數(shù)能夠提高分類問題的精度。

      模型最終篩選出了14個因子,包括一些常規(guī)因子,如代表償債能力的流動負債和貨幣資產(chǎn);挖掘不到一些非常規(guī)但其實有效的因子,如代表資產(chǎn)結(jié)構(gòu)的固定資產(chǎn)清理和盈余公積等。

      (3)支持向量機(SVM)模型原理及公式

      支持向量機 ( Support? Vector? Mechine ,SVM)是 V.Vapnik 等人提出的一種針對小樣本的分類機器學(xué)習(xí)理論[1]。支持向量機指的是將向量映射到一個高維空間,在這個高維空間中建立一個最大間距超平面。在分隔數(shù)據(jù)的超平面的兩側(cè)建立了兩個平行的超平面,以該方式使兩個平行的超平面之間的距離最大化。假設(shè)平行超平面之間的距離或差值越大,分類器的總誤差就越小。

      SVM 和 logistic 回歸是功能相近的分類器,二者的區(qū)別在于 logistic 回歸的輸出具有概率意義,也容易擴展至多分類問題,而 SVM 的稀疏性和穩(wěn)定性使其具有良好的泛化能力并在使用核方法時計算量更小。

      3? 結(jié)果分析

      (1)樣本介紹

      由于涉及財務(wù)數(shù)據(jù),考慮債券發(fā)行公司財務(wù)數(shù)據(jù)的存在性問題,本文只選取部分上市公司的公司債的2016年 ~2020年的季度違約數(shù)據(jù)作為樣本數(shù)據(jù)做滾動預(yù)測。

      (2)logit 機器學(xué)習(xí)模型結(jié)果分析

      違約債券方面,logit 機器學(xué)習(xí)模型預(yù)測結(jié)果如表1 所列。

      從表1 可以看到,第一類錯誤率較高,說明模型預(yù)測違約但實際不違約情況較多,可能雖然整體數(shù)據(jù)發(fā)出了違約信號,表明公司有違約風(fēng)險,但公司及時籌集了足夠的資金避免了違約事件的發(fā)生。第二類錯誤率非常低,說明模型基本可以將違約事件全部預(yù)測到,也說明模型犧牲了一部分的第一類錯誤,以保證可以預(yù)測出更多違約事件。

      模型對于公司發(fā)生違約事件的預(yù)測結(jié)果如表2 所列。可以看出,表1 和表2 中的預(yù)測準確率差別不大,但是表2 的第一類錯誤率較低,這是因為一個公司可以發(fā)多只債券,但在一個季度內(nèi),只違約了一只債券,預(yù)測違約公司的難度要小于預(yù)測違約的債券。

      (3)SVM 機器學(xué)習(xí)模型結(jié)果分析

      違約債券方面,SVM 機器學(xué)習(xí)模型預(yù)測結(jié)果如表3 所列。

      從表3 可以看到,第一類錯誤率非常低,說明模型預(yù)測違約但實際不違約情況為0,表明模型在樣本數(shù)據(jù)內(nèi)預(yù)測出的違約會有100%的概率發(fā)生。第二類錯誤率比 logit 模型的結(jié)果高,說明模型不能將違約事件全部預(yù)測到,也說明模型犧牲了一部分的第二類錯誤,以保證可以預(yù)測出的精確度。

      SVM 模型對于公司發(fā)生違約事件的預(yù)測結(jié)果如表 4所列??梢钥闯觯? 和表4 中的預(yù)測準確率差別不大,但是表2 的第二類錯誤率較低,這是因為一個公司可以發(fā)多只債券,但在一個季度內(nèi),只違約了一只債券,預(yù)測違約公司的難度要小于預(yù)測違約的債券。

      (4 )模型結(jié)果比較

      通過兩個模型的結(jié)果對比可以看出,logit 模型犧牲了第一類錯誤來保證第二類錯誤率盡量小,即為了保證預(yù)測出所有的違約事件,將一部分高風(fēng)險但沒有違約的公司或債券納判斷為違約。而 SVM 模型犧牲了第二類錯誤來保證第一類錯誤率盡量小,即為了保證預(yù)測出的違約事件100%的概率真實違約,保證了預(yù)測違約的精確度,但沒能預(yù)測出全部違約事件。

      筆者認為,這兩種模型可以用于不同的方面,如 logit 模型的結(jié)果可以提供給預(yù)測出的可能違約的公司參考,供其檢視自身的流動性是否充裕,讓公司解決其潛在問題,避免發(fā)生違約事件。而 SVM 模型的預(yù)測結(jié)果則可用于相關(guān)機構(gòu)參考,使其有足夠的時間采取必要措施,避免債券不兌付或者公司清算重組造成的影響。

      4? 總結(jié)

      由結(jié)果分析可以看出,機器學(xué)習(xí)模型對于中國公司債違約事件的預(yù)測具有一定的效果,雖然各有優(yōu)劣,但在分別使用的情況下相信有助于國內(nèi)債券市場的長期發(fā)展。

      不足之處在于:第一,數(shù)據(jù)不全,并沒有用全市場的數(shù)據(jù)代入模型,模型的系數(shù)更適用于被選中的數(shù)據(jù);第二,模型因子只包含400個財務(wù)數(shù)據(jù),只能反映企業(yè)的部分狀況,而在高管管理能力以及是否有大型集團做擔(dān)保等難以定量化的因素方面,未能涵蓋進模型;第三,模型應(yīng)用了機器學(xué)習(xí),可以保證預(yù)測的精度,但也有一定的缺點,如系數(shù)的解釋性較弱,以及因變量(因子)系數(shù)的高低雖然可以反映其對違約的影響,但無法確定其真實的相關(guān)性;第四,尚未深入研究參數(shù)選擇,參數(shù)的選擇會對模型的結(jié)果有一定的影響。在后續(xù)的研究中,可以彌補以上不足來優(yōu)化模型,以期得到更好的結(jié)果。

      參考文獻:

      [1 ] 喬林波.大規(guī)模正則化機器學(xué)習(xí)算法研究[ D ].長沙:國防科技大學(xué).2017.

      [2 ] 常甜甜.支持向量機學(xué)習(xí)算法若干問題的研究[ D ].西安:西安電子科技大學(xué).2010.

      作者簡介:

      陳雪融(1994—) ,碩士,研究員,研究方向:信用風(fēng)險、宏觀經(jīng)濟研究、機器學(xué)習(xí)。

      猜你喜歡
      預(yù)測出錯誤率債券
      限制性隨機試驗中選擇偏倚導(dǎo)致的一類錯誤率膨脹*
      2020年9月債券型基金績效表現(xiàn)
      債券(2020年10期)2020-10-30 10:02:30
      2020 年 7 月債券型基金績效表現(xiàn)
      債券(2020年8期)2020-09-02 06:59:38
      2020年2月債券型基金績效表現(xiàn)
      債券(2020年3期)2020-03-30 03:27:23
      吸引力無法則
      正視錯誤,尋求策略
      教師·中(2017年3期)2017-04-20 21:49:49
      解析小學(xué)高段學(xué)生英語單詞抄寫作業(yè)錯誤原因
      量體薦衣
      降低學(xué)生計算錯誤率的有效策略
      閱讀理解沙場點兵
      敦化市| 黔江区| 郁南县| 监利县| 清丰县| 莆田市| 刚察县| 元朗区| 当雄县| 安多县| 永兴县| 扶绥县| 泸西县| 荥经县| 龙海市| 海门市| 城市| 五家渠市| 遂宁市| 壶关县| 无锡市| 东阿县| 濉溪县| 乐都县| 长治县| 潞城市| 信宜市| 博爱县| 泊头市| 习水县| 邵武市| 汉源县| 屏东市| 泸州市| 仁布县| 莱西市| 手游| 灵宝市| 原平市| 乐昌市| 镇沅|