• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于軟投票集成模型的房地產(chǎn)上市企業(yè)財(cái)務(wù)預(yù)警研究

      2024-05-15 20:11:09姜鳳珍李毛王駿
      關(guān)鍵詞:財(cái)務(wù)困境房地產(chǎn)企業(yè)

      姜鳳珍 李毛 王駿

      摘要:以中國房地產(chǎn)上市企業(yè)為研究對(duì)象,選取了反映企業(yè)償債能力、盈利能力、營運(yùn)能力和杠桿比率在內(nèi)的20個(gè)指標(biāo),收集了137家企業(yè)在1991~2021年期間的財(cái)務(wù)數(shù)據(jù),構(gòu)建了基于軟投票的集成模型來預(yù)測中國房地產(chǎn)上市企業(yè)一年期和兩年期的財(cái)務(wù)困境。結(jié)果顯示,集成模型提前一年期和兩年期預(yù)測的AUC值分別為0.946和0.880,與性能最好的單一分類器相比預(yù)測性能更高。然后通過SHAP解釋模型對(duì)集成模型中輸入變量的解釋能力進(jìn)行分析。無論提前一年期還是兩年期,預(yù)測準(zhǔn)確率在很大程度上受銷售凈利率、凈資產(chǎn)收益率、應(yīng)收賬款周轉(zhuǎn)率、利息保障倍數(shù)和總資產(chǎn)收益率的影響。提出的模型通過對(duì)房地產(chǎn)企業(yè)財(cái)務(wù)困境高準(zhǔn)確率的預(yù)測,識(shí)別與預(yù)測相關(guān)的主要變量,有望幫助房地產(chǎn)企業(yè)和其他相關(guān)利益者通過早期預(yù)警防止破產(chǎn)。

      關(guān)鍵詞:房地產(chǎn)企業(yè);財(cái)務(wù)困境;集成模型;軟投票;Shapley值

      中圖分類號(hào):F275;TP391? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1008-4657(2024)02-0043-10

      0? ? ? ? 引言

      根據(jù)中國國家統(tǒng)計(jì)局的數(shù)據(jù),中國房地產(chǎn)行業(yè)的GDP已經(jīng)從1998年的3? 425億元人民幣(占GDP總量的4.02%)增加到2021年的77? ?216億元人民幣(占GDP總量的6.78%)。這樣的增長是由中國銀行業(yè)的深度支持推動(dòng)的,并依賴于房地產(chǎn)行業(yè)內(nèi)的高杠桿和長周轉(zhuǎn)的商業(yè)模式[ 1 ]。盡管這種商業(yè)模式帶來了快速增長,但它也使中國的房地產(chǎn)行業(yè)特別容易受到金融危機(jī)的影響,對(duì)經(jīng)濟(jì)周期也很敏感。為了防止房地產(chǎn)債務(wù)危機(jī),維護(hù)金融系統(tǒng)的穩(wěn)定和安全,中國政府實(shí)施了國家“去杠桿化”政策,并提出了“三條紅線”政策來收緊房地產(chǎn)行業(yè)業(yè)務(wù)[ 1-2 ]。以中國最大的民營房地產(chǎn)企業(yè)——中國恒大集團(tuán)為例,近期,恒大被曝出巨額債務(wù),存在巨大的償債違約風(fēng)險(xiǎn)。作為一個(gè)擁有2.38萬億元資產(chǎn)的大型企業(yè),恒大見證了金融公司的爆發(fā)、商業(yè)票據(jù)的失效、房地產(chǎn)的停工和員工的辭職。同時(shí),恒大還背負(fù)著1.97萬億元的債務(wù)[ 3 ]。這讓人們注意到房地產(chǎn)行業(yè)長期存在的過度融資問題。房地產(chǎn)業(yè)的融資渠道非常單一,大多依靠銀行貸款。根據(jù)中國經(jīng)濟(jì)金融研究(China? Stock? Market? &? Accounting? Research? Database, CSMAR)數(shù)據(jù)庫,房地產(chǎn)企業(yè)的資產(chǎn)負(fù)債率普遍較高,達(dá)到了65.2%。因此,對(duì)房地產(chǎn)行業(yè)財(cái)務(wù)困境的預(yù)測是一個(gè)非常重要的研究課題。

      然而,大多數(shù)研究者只關(guān)注所有上市公司的財(cái)務(wù)困境預(yù)測,而專注于房地產(chǎn)行業(yè)的研究卻很少[ 4 ]。而建立房地產(chǎn)行業(yè)預(yù)測模型的論文對(duì)不平衡數(shù)據(jù)集的處理過于簡單,采用人工逐一匹配的方法[ 5-6 ],不具有隨機(jī)性,得到的結(jié)果不具有遍歷性。相關(guān)研究大多預(yù)測了1年內(nèi)企業(yè)遭遇財(cái)務(wù)困境的概率,從短期角度看是有意義的。然而房地產(chǎn)項(xiàng)目一般需要一年以上的時(shí)間來完成。更重要的是,機(jī)器學(xué)習(xí)模型的“黑箱”問題使得其對(duì)模型預(yù)測結(jié)果的解釋性較差,很多研究將重點(diǎn)放在確定具有高預(yù)測性能的輸入變量組合,沒有明確哪個(gè)輸入變量對(duì)預(yù)測精度影響最大[ 7 ]。

      1? ? ? ?文獻(xiàn)綜述

      長期以來,研究人員和從業(yè)人員利用許多不同的技術(shù)來構(gòu)建財(cái)務(wù)困境的預(yù)測模型傳統(tǒng)的破產(chǎn)預(yù)測模型是利用統(tǒng)計(jì)技術(shù)構(gòu)建的。研究人員開發(fā)了MRA(Multivariate? Regression? Analysis)模型[ 8 ]、MDA(Multivariate? Discriminant? Analysis)模型[ 9 ]和LR(Logistic? Regression)模型[ 10 ]。然而,這些統(tǒng)計(jì)技術(shù)有一個(gè)缺點(diǎn),就是受到假設(shè)的限制。在過去的二十年里,破產(chǎn)預(yù)測方法的流行已經(jīng)從統(tǒng)計(jì)方法轉(zhuǎn)向人工智能方法。Kumar? ?P? R等[ 11 ]比較了采用這兩組方法的論文,并得出結(jié)論,人工智能方法優(yōu)于統(tǒng)計(jì)方法。人工智能方法能夠考慮到大量的屬性并評(píng)估它們之間更復(fù)雜的關(guān)系。盡管人工智能技術(shù)的種類越來越多,但有三種技術(shù)是最常使用的,神經(jīng)網(wǎng)絡(luò)(Neural? ?Network,NN)、決策樹(Decision? ?Tree,DT)和支持向量機(jī)(Support? Vector? ?Machine,SVM)。但它們?cè)诜康禺a(chǎn)行業(yè)的應(yīng)用是有限的。Dong Yuanxiang等[ 12 ]利用邏輯回歸、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)來預(yù)測2005~2009年期間107家中國房地產(chǎn)企業(yè)的違約情況。近年來,集成分類器通過結(jié)合多個(gè)單一分類器產(chǎn)生比單一分類器更好的假設(shè),從而產(chǎn)生比單一分類器更優(yōu)的結(jié)果[ 13 ]。Liao? Bangxiong等[ 14 ]以反向傳播神經(jīng)網(wǎng)絡(luò)(Back? Propagation? Neural? Network, BPNN)為基礎(chǔ)學(xué)習(xí)器,構(gòu)建了兩個(gè)集成分類器,即BPNN-AdaBoost和BPNN-Bagging,來預(yù)測中國建筑和房地產(chǎn)企業(yè)的財(cái)務(wù)困境。

      房地產(chǎn)行業(yè)的大多數(shù)相關(guān)研究都集中在提高財(cái)務(wù)困境的預(yù)測精度上。除了預(yù)測的準(zhǔn)確性,識(shí)別輸入變量和預(yù)測結(jié)果之間的關(guān)系也是至關(guān)重要的,它可以為這些模型的改進(jìn)提供見解,支持對(duì)被建模過程的理解,以及幫助輸入變量的選擇。Nohara? Y等[ 15 ]提出了基于沙普利值可加性解釋模型,其在博弈論中具有堅(jiān)實(shí)的理論基礎(chǔ),能夠顯著提高機(jī)器學(xué)習(xí)模型的可解釋性,迅速在各個(gè)領(lǐng)域得到廣泛應(yīng)用[ 16-17 ]。以往關(guān)于企業(yè)財(cái)務(wù)困境預(yù)測的研究通常采用樣本匹配法,即將一組違約企業(yè)與相同數(shù)量或一定倍數(shù)的健康企業(yè)進(jìn)行匹配[ 6,18 ]。然而,樣本匹配法可能會(huì)導(dǎo)致有偏見的預(yù)測結(jié)果[ 19 ]。為了避免這種偏差,一些研究放棄了樣本匹配方法,而把所有可用的公司年數(shù)據(jù)用來代表公司的財(cái)務(wù)狀況[ 20 ]。然而,這種方法會(huì)導(dǎo)致非違約樣本的數(shù)量大大超過違約樣本的數(shù)量。這種情況被廣泛地稱為類不平衡問題。為了處理這個(gè)問題,人們提出了兩種不同的取樣方法,欠采樣技術(shù)(RUS)[ 20 ]和過采樣技術(shù)(SMOTE)[ 21 ]。

      2? ? ? ?模型構(gòu)建

      在數(shù)據(jù)集被分割成訓(xùn)練集和測試集之后,欠采樣旨在減少多數(shù)類成員的數(shù)量,而過采樣則旨在增加訓(xùn)練集中少數(shù)類成員的數(shù)量。過采樣的優(yōu)點(diǎn)是不會(huì)丟失原始訓(xùn)練集的信息,因?yàn)樗械脑汲蓡T都保留了下來,但是過采樣會(huì)增加訓(xùn)練集的大小,從而相應(yīng)地增加訓(xùn)練時(shí)間和內(nèi)存量[ 21 ]。過去的研究沒有就哪種技術(shù)比另一種技術(shù)更好達(dá)成一致結(jié)論,沖突的結(jié)果可能是由于不同的數(shù)據(jù)集和分類算法的結(jié)合[ 22 ]。因此,本研究分別使用RUS和SMOTE算法來處理不平衡數(shù)據(jù),得到2個(gè)數(shù)據(jù)集。此外,本研究添加高斯噪聲擴(kuò)大原始數(shù)據(jù)集的規(guī)模,這是一種數(shù)據(jù)增強(qiáng)的形式,它可以減少由樣本少引起的網(wǎng)絡(luò)過擬合問題。

      2.1? ? ? ?單一分類器的訓(xùn)練

      對(duì)于從上一步得到的數(shù)據(jù)集,分別采用模型池中的6種常見的單一分類器進(jìn)預(yù)測:邏輯回歸(Logistic? Regression,LR)、人工神經(jīng)網(wǎng)絡(luò)(Artificial? Neural? Networks,ANN)、支持向量機(jī)(Support? Vector Machine,SVM)、K近鄰(K-Nearest? Neighbors,KNN)、分類回歸樹(Classification? and? Regression? Tree,CART)和樸素貝葉斯(Naive? Bayes,NB)。2個(gè)數(shù)據(jù)集在提前一年和兩年的預(yù)測點(diǎn)上分別建立了6個(gè)不同的單一分類器。根據(jù)不同模型的特點(diǎn),本文基于測試集用網(wǎng)格搜索算法對(duì)模型進(jìn)行參數(shù)調(diào)優(yōu),每個(gè)分類器需要調(diào)整的參數(shù)及其候選值如表1所示。通過循環(huán)遍歷給定的參數(shù)組合來優(yōu)化模型,以達(dá)到最佳預(yù)測性能,參數(shù)是用交叉驗(yàn)證法確定的。

      2.2? ? 集成分類器的構(gòu)建

      以前的研究提出了諸如Q統(tǒng)計(jì)量[ 23 ]用加權(quán)計(jì)數(shù)值(Weighted Count of Errors and Correct results,WCEC)[ 13 ]等不同的指標(biāo)來計(jì)算單一分類器的成對(duì)多樣性,具有較高多樣性的組合是首選。然而,選擇多樣性最高的單一分類器組合并不能保證是表現(xiàn)最好的集成分類器。本研究沒有計(jì)算單一分類器的成對(duì)多樣性并從最多樣化的組合中選擇最佳的集成分類器,而是采用了一種基于軟投票的集成分類器。

      投票分類器使用兩種類型的投票技術(shù),即硬投票和軟投票。在硬投票中,最終的預(yù)測是通過多數(shù)投票完成的,在這種情況下,聚合器會(huì)選擇在基礎(chǔ)模型中反復(fù)出現(xiàn)的類別預(yù)測。在軟投票中,基礎(chǔ)模型應(yīng)該有Predict_proba方法。投票分類器呈現(xiàn)出比其他基礎(chǔ)模型更好的整體結(jié)果,因?yàn)樗Y(jié)合了不同模型的預(yù)測。構(gòu)建軟投票集成分類器如圖1所示。

      由圖1可知,邏輯回歸(LR)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、K近鄰(KNN)、分類回歸樹(CART)和樸素貝葉斯(NB)分類器被組合在一起。其中的決定是在單個(gè)決定的基礎(chǔ)上做出的,這些決定根據(jù)概率值進(jìn)行組合,以指定數(shù)據(jù)屬于某個(gè)特定類別。在軟投票集成方法中,預(yù)測根據(jù)分類器的重要性進(jìn)行加權(quán),并將其合并以獲得加權(quán)概率和。具有最大加權(quán)概率之和的目標(biāo)標(biāo)簽被選中,因?yàn)樗哂凶畲蟮耐镀敝?,定制的?quán)重也可以用來計(jì)算加權(quán)概率。通過列舉所有單一分類器的組合來創(chuàng)建不同的集成分類器,計(jì)算AUC(Area Under The Curve, AUC)值,根據(jù)一年期和兩年期預(yù)測的最高AUC值來選擇表現(xiàn)最佳的集成分類器。

      3? ? 實(shí)證分析

      3.1? ? 數(shù)據(jù)獲取和處理

      圖2是本研究的研究方法流程圖。

      由圖2可知,研究方法流程包含三個(gè)部分:數(shù)據(jù)獲取和處理,單一分類器的訓(xùn)練,以及集成分類器的構(gòu)建和可解釋性分析。本文的數(shù)據(jù)處理和建模和以及解釋性分析都是在Python程序中完成的。

      在數(shù)據(jù)獲取和處理部分,本研究的數(shù)據(jù)收集自Choice金融終端數(shù)據(jù)庫,根據(jù)全球行業(yè)分類標(biāo)準(zhǔn)(Global Industry Classification Standard,GICS)選擇了137家房地產(chǎn)企業(yè)。根據(jù)中國上海證券交易所和深圳證券交易所的上市規(guī)則,對(duì)財(cái)務(wù)狀況異常的上市企業(yè)股票交易實(shí)行特別處理(Special Treatment,ST),其股票名稱也會(huì)被標(biāo)記上“ST”,作為未來可能發(fā)生的財(cái)務(wù)危機(jī)的預(yù)警,這是我國資本市場特有的一個(gè)制度。在國內(nèi),由于破產(chǎn)或者退市的企業(yè)數(shù)量較少,普遍采用是否被特殊處理(ST)作為企業(yè)陷入財(cái)務(wù)困境的標(biāo)志[ 24 ],本研究采用同樣的方法來區(qū)分財(cái)務(wù)困境企業(yè)(y = 1)和正常健康企業(yè)(y = 0)。每家企業(yè)和每一年的數(shù)據(jù)被視為一個(gè)樣本,構(gòu)建的數(shù)據(jù)集是一個(gè)(4110,21)矩陣,其中4110代表樣本的數(shù)量,21代表20個(gè)自變量和y因變量。

      一旦選擇了適當(dāng)?shù)臉颖?,那么就必須確定相關(guān)的變量來進(jìn)行模型開發(fā)。破產(chǎn)發(fā)生的原因有很多,其中之一是財(cái)務(wù)困難或所謂的財(cái)務(wù)困境。當(dāng)一個(gè)公司不能滿足其預(yù)定的付款,或者當(dāng)現(xiàn)金流預(yù)測表明公司無法支付時(shí),財(cái)務(wù)困境就開始了。預(yù)測財(cái)務(wù)困境對(duì)公司來說是一件非常重要的事情,以預(yù)測未來會(huì)發(fā)生的破產(chǎn)風(fēng)險(xiǎn)。財(cái)務(wù)比率反映了從財(cái)務(wù)報(bào)表或其他財(cái)務(wù)信息來源中得出的兩個(gè)數(shù)字之間的關(guān)系,潛在財(cái)務(wù)困境的跡象一般在公司經(jīng)歷失敗之前很長時(shí)間就會(huì)在財(cái)務(wù)比率中顯現(xiàn)出來,在企業(yè)失敗預(yù)測中占絕對(duì)優(yōu)勢[25]。本文的輸入變量是從企業(yè)失敗預(yù)測模型的綜述文獻(xiàn)中選出的[7,11,26]。我們確定的20個(gè)財(cái)務(wù)比率變量被用于三個(gè)或更多的預(yù)測模型,因此我們認(rèn)為這些變量具有很好的預(yù)測能力,在構(gòu)建新模型時(shí)應(yīng)考慮它們的應(yīng)用。這些輸入變量涵蓋了房地產(chǎn)企業(yè)的財(cái)務(wù)特征和業(yè)績,被分為以下四類:償債能力、盈利能力、營運(yùn)能力和杠桿比率。表2概述了具體的輸入變量,對(duì)于每個(gè)變量,表3報(bào)告了4 110個(gè)可用觀測值的樣本平均值、中位數(shù)、標(biāo)準(zhǔn)差、最小值和最大值。

      由于本文研究的是財(cái)務(wù)困境預(yù)警,我們關(guān)心的是企業(yè)何時(shí)發(fā)生財(cái)務(wù)困境。那么對(duì)于每個(gè)企業(yè)來說,它收到ST標(biāo)記后的數(shù)據(jù)被刪除,因?yàn)槿绻髽I(yè)陷入財(cái)務(wù)困境的事實(shí)已經(jīng)公開,繼續(xù)預(yù)測就不是本研究的目的。對(duì)于那些收到多次標(biāo)記為ST的企業(yè),從ST戴帽到摘帽之間的數(shù)據(jù)被刪除。原始數(shù)據(jù)集被處理成兩個(gè)數(shù)據(jù)集,用于提前一年預(yù)測(N1 = 83,N0 = 3672,其中N1代表財(cái)務(wù)困境樣本的數(shù)量,N0代表正常健康樣本的數(shù)量)和提前兩年預(yù)測(N1 = 83,N0 = 3535)。假設(shè)公司被ST年份為第i年,分別選取第i-1和第i-2年,也就是用其發(fā)生財(cái)務(wù)危機(jī)前一年和前兩年的財(cái)務(wù)數(shù)據(jù)構(gòu)建預(yù)警模型,對(duì)公司第i年的財(cái)務(wù)危機(jī)狀況進(jìn)行預(yù)測。

      為了從數(shù)據(jù)挖掘中獲得更好的結(jié)果,處理缺失值是一個(gè)必要的程序。首先對(duì)于每個(gè)數(shù)據(jù)集,有三個(gè)以上缺失變量的樣本被剔除,剩下的樣本中的缺失值用鏈?zhǔn)椒匠痰亩嘀夭逖a(bǔ)(Multiple Imputation by Chained Equations,MICE)方法來填充[ 4 ],最后得到兩個(gè)數(shù)據(jù)集:提前一年預(yù)測(N1 = 83,N0 = 3032)和提前兩年預(yù)測(N1 = 83,N0 = 2897)數(shù)據(jù)集。

      3.2? ? 評(píng)價(jià)指標(biāo)

      本研究采用AUC(Area Under The Curve, AUC)來評(píng)估分類器的性能。AUC是接收操作特征(Receiver Operating Characteristics,ROC)曲線中最常見的定量指標(biāo),被廣泛用于企業(yè)財(cái)務(wù)困境預(yù)測模型的比較[ 7 ],它是檢查任何分類模型性能的最重要的評(píng)估指標(biāo)之一,也被寫為AUROC。ROC是一條概率曲線,AUC代表分類器區(qū)分類別的能力,AUC越高,說明該模型在區(qū)分正負(fù)類方面的表現(xiàn)越好。

      為了評(píng)估集成分類器和六個(gè)單一分類器的分類性能,我們進(jìn)行了k倍交叉驗(yàn)證。這種方法比其他驗(yàn)證方法更有效地減少偏差和變異[ 13 ],可以在一定程度上避免過擬合問題。如前所述,通過RUS和SMOTE算法對(duì)原始數(shù)據(jù)集進(jìn)行重新采樣。重新采樣的數(shù)據(jù)集被分為訓(xùn)練和測試數(shù)據(jù)集,本文采用了五倍交叉驗(yàn)證的方法,訓(xùn)練數(shù)據(jù)集被隨機(jī)分割為五份互不相干的子集,每次隨機(jī)選擇4份作為訓(xùn)練集訓(xùn)練模型,剩下的1份做測試集。當(dāng)這一輪完成后,重新隨機(jī)選擇4份來訓(xùn)練數(shù)據(jù)。若干輪(小于5)之后,選擇損失函數(shù)評(píng)估最優(yōu)的模型和參數(shù)。分類器的總體性能是通過5個(gè)子集的平均性能來計(jì)算的。

      3.3? ? 模型對(duì)比分析

      圖3和圖4分別顯示了這些模型提前一年和提前兩年預(yù)測房地產(chǎn)企業(yè)財(cái)務(wù)困境的表現(xiàn),左邊的圖顯示了使用RUS時(shí)的各模型性能,右邊的圖顯示了使用SMOTE時(shí)的各模型性能。每個(gè)分類器的結(jié)果都是通過對(duì)每個(gè)預(yù)測年份的數(shù)據(jù)集進(jìn)行5倍交叉驗(yàn)證產(chǎn)生的。軟投票算法通過六個(gè)單一分類器的分類結(jié)果,計(jì)算出多數(shù)投票,得出最終預(yù)測結(jié)果。根據(jù)軟投票的結(jié)果,為提前一年和提前兩年的兩個(gè)數(shù)據(jù)集分別選擇具有最好性能的集成分類器。

      由圖3可知,對(duì)于提前一年的預(yù)測,使用RUS時(shí)的集成分類器由ANN和KNN組成,使用SMOTE時(shí)的集成分類器由ANN和LR組成。使用RUS時(shí)的集成分類器(AUC = 0.946)比使用SMOTE時(shí)的集成分類器(AUC = 0.936)有更好的性能,而且使用RUS時(shí)的集成分類器的表現(xiàn)超過了每一個(gè)單一分類器。

      由圖4可知,對(duì)于提前兩年的預(yù)測,使用RUS時(shí)的集成分類器由ANN、KNN、LR和CART組成,而使用SMOTE時(shí)的集成分類器由ANN和LR組成。使用RUS時(shí)的集成分類器(AUC = 0.880)也比使用SMOTE時(shí)的集成分類器(AUC = 0.874)有更好的表現(xiàn),而且它的表現(xiàn)也超過了任何單一分類器。本研究結(jié)果表明,與六個(gè)單一分類器相比,在預(yù)測房地產(chǎn)企業(yè)的財(cái)務(wù)困境時(shí),所提出的軟投票集成分類器可以在預(yù)測點(diǎn)提前一年和兩年的情況下取得更優(yōu)異的性能,而且當(dāng)使用RUS方法進(jìn)行抽樣時(shí),性能總是更好。

      此外,本文的目標(biāo)之一是確定財(cái)務(wù)困境預(yù)測的最關(guān)鍵時(shí)間段,因此,我們根據(jù)提前一年和提前兩年的兩個(gè)數(shù)據(jù)集,然后參考1991年到2021年的數(shù)據(jù)組合(i-1和i-2),分別評(píng)估分類器的AUC值。無論單一分類器還是集成分類器,隨著預(yù)測期的延長,以AUC值計(jì)算的房地產(chǎn)企業(yè)的財(cái)務(wù)困境預(yù)測性能明顯下降。在使用提前一年的數(shù)據(jù)集預(yù)測時(shí),預(yù)測性能達(dá)到最高。在預(yù)測時(shí)間提前兩年的情況下,分類器的AUC值明顯下降,最高預(yù)測性能低于0.9。眾所周知,AUC值大于0.9的分類器具有出色的識(shí)別性能[ 19 ]。這意味著,對(duì)于房地產(chǎn)行業(yè)的數(shù)據(jù)來說,提前一年的數(shù)據(jù)最能說明即將發(fā)生的財(cái)務(wù)問題。本文使用1991年到2021年多年的組合也并沒有提高預(yù)測。這可以解釋為,要么分類器不能利用多年的數(shù)據(jù)多樣性,要么更有可能的是,關(guān)于財(cái)務(wù)困境的主要信息包含在i-1年的數(shù)據(jù)中,以前的數(shù)據(jù)對(duì)分類器貢獻(xiàn)的信息很有限。

      3.4? ? 變量重要性分析

      為了增強(qiáng)模型的可解釋性,本研究進(jìn)一步采用SHAP解釋模型對(duì)使用RUS方法進(jìn)行抽樣的兩個(gè)軟投票集成模型的結(jié)果進(jìn)行分析。SHAP解釋模型的基礎(chǔ)是Lundberg S于1953年提出的Shapley值法,該方法將模型中所有特征變量都定義為對(duì)模型結(jié)果的貢獻(xiàn)者,某一個(gè)特征變量Shapley值就是該特征對(duì)模型預(yù)測結(jié)果的邊際貢獻(xiàn)[ 15 ]。使用RUS后提前一年(左)和提前兩年(右)軟投票集成模型的Shapley值如圖5所示。

      從圖5可以看出,對(duì)于提前1年的預(yù)測模型,ROS的Shapley值最高,其次是ROE和ART。對(duì)于提前2年的預(yù)測模型,結(jié)果顯示ROE的Shapley值最高,其次是ART和ROE。

      結(jié)果還說明了兩個(gè)模型之間的輸入變量影響的比較。與在提前一年的預(yù)測模型一致,提前兩年的預(yù)測模型中排名前五的變量也是ROS、ROE、ART、TIE和ROA,這表明,無論短期還是長期預(yù)測,ROS、ROE、ART、TIE和ROA對(duì)預(yù)測準(zhǔn)確率都有明顯影響。

      同時(shí),隨著預(yù)測期的延長,有兩個(gè)變量,即ROS和ART,對(duì)預(yù)測準(zhǔn)確性的影響有所下降。其余18個(gè)變量的Shapley值隨著預(yù)測期的增加而增加,表明隨著預(yù)測期的延長,他們對(duì)預(yù)測準(zhǔn)確性的影響增加。

      4? ? 結(jié)論與展望

      本研究構(gòu)建包含四個(gè)方面財(cái)務(wù)指標(biāo)的房地產(chǎn)上市企業(yè)財(cái)務(wù)困境預(yù)警指標(biāo)體系,利用欠采樣(RUS)和過采樣技術(shù)(SMOTE)對(duì)非平衡數(shù)據(jù)集進(jìn)行處理,并通過6種單一分類器(LR, ANN, SVM, KNN, CART, NB)和軟投票集成分類器建立財(cái)務(wù)困境預(yù)警模型。結(jié)論如下:所提出的集成模型在提前一年和兩年的預(yù)測中都取得了最高的性能,而且當(dāng)使用RUS方法處理非平衡數(shù)據(jù)集時(shí),性能總是更好;無論單一分類器還是集成分類器,隨著預(yù)測期的延長,以AUC值計(jì)算的房地產(chǎn)企業(yè)的財(cái)務(wù)困境預(yù)測性能明顯下降;所提供的基于SHAP解釋模型比較兩個(gè)預(yù)測模型中輸入變量對(duì)預(yù)測準(zhǔn)確性的影響,無論短期還是長期預(yù)測,ROS、ROE、ART、TIE和ROA對(duì)模型預(yù)測準(zhǔn)確率都有明顯影響。

      本研究在以下三個(gè)方面對(duì)知識(shí)體系有所貢獻(xiàn)。首先,本研究提出的模型是基于比以往大多數(shù)研究更廣泛的時(shí)間范圍建立的,增加了模型的通用性和對(duì)不同經(jīng)濟(jì)周期的穩(wěn)健性。第二,本研究提出了預(yù)測中國房地產(chǎn)上市企業(yè)財(cái)務(wù)困境的集成學(xué)習(xí)方法,以往大多數(shù)研究只利用單一分類器,而集成分類器顯示出比單一分類器更好的性能。最后,本研究采用了SHAP解釋模型用于衡量輸入變量對(duì)集成分類器預(yù)測性能的影響,提高了模型的分析能力。

      未來的研究方向包括:(1)收集更多的變量,涵蓋除償債能力、盈利能力、營運(yùn)能力和杠桿比率之外的其他企業(yè)特征;(2)在輸入變量之前進(jìn)行特征選擇程序;(3)延長輸入變量的時(shí)間段,從而納入更多以前時(shí)期的變量;(4)納入其他單一分類器,如深度學(xué)習(xí)算法;(5)實(shí)施不同的加權(quán)機(jī)制以創(chuàng)建集成分類器。

      參考文獻(xiàn):

      [1]郭菲,馮長春.宏觀調(diào)控政策下我國住房市場周期變化的影響分析[J].地域研究與開發(fā),2020,39(6):18-23.

      [2]王建勇,李艾琳.警惕“利用資本市場賺錢”的商業(yè)模式——恒大應(yīng)對(duì)危機(jī)引發(fā)的思考[J].財(cái)會(huì)通訊,2021(22):3-9.

      [3]張強(qiáng).大型企業(yè)集團(tuán)財(cái)務(wù)危機(jī)預(yù)警研究——以海航和恒大為例[J].審計(jì)研究,2023(1):48-56.

      [4]Azur M J,Stuart E A,F(xiàn)rangakis C,et al. Multiple imputation by chained equations: what is it and how does it work?[J]. International Journal of Methods in Psychiatric Research,2011,20(1): 40.

      [5]Cheng Minyuan,Hoang Nhat-Duc, Limanto Lisayuri,et al. A novel hybrid intelligent approach for contractor default status prediction[J].Knowledge-Based Systems,2014,71:314-321.

      [6]Han Yang,Zhang Haotian,Zhao Yong. Structural evolution of real estate industry in China: 2002-2017[J]. Structural? Change and Economic Dynamics,2021,57:45-56.

      [7]Veganzones D,Séverin E. Corporate failure prediction models in the twenty-first century:a review[J] . European Business Review,2020(ahead-of-print):204-226.

      [8]Roozbeh Kangari, Foad Farid, Elgharib Hesham M. Elgharib. Financial performance analysis for construction industry[J]. Journal of Construction Engineering & Management,1992,118(2):349-361.

      [9]Abidali A F,Harris F. A methodology for predicting company failure in the construction industry[J]. Construction Management & Economics,1995,13(3):189-196.

      [10]陳欣欣,郭洪濤.因子分析和Logistic回歸在農(nóng)業(yè)上市公司財(cái)務(wù)預(yù)警中的聯(lián)合運(yùn)用[J].數(shù)理統(tǒng)計(jì)與管理,2022,41(1):11-24.

      [11]Kumar P R,Ravi V. Bankruptcy prediction in banks and firms via statistical and intelligent techniques: a review[J]. European Journal of Operational Research,2007,180(1):1-28.

      [12]Dong Yuanxiang,Xiao Zhi,Xiao Xue. Default prediction for real estate companies with imbalanced dataset[J]. Journal of Information Processing Systems,2014,10(2):314-333.

      [13]Choi Hyunchul,Son Hyojoo,Kim Changwan. Predicting financial distress of contractors in the construction industry using ensemble learning[J]. Expert Systems with Applications,2018,110:1-10.

      [14]Liao Bangxiong,Li Hui,Sun Jie. AdaBoost and bagging ensemble approaches with neural network as base learner for financial distress prediction of Chinese construction and real estate companies[J]. Recent Patents on Computer Science,2013,6(1): 47-59.

      [15]Nohara Y, Matsumoto K, Soejima H, et al. Explanation of machine learning models using improved shapley additive explanation[C]//Proceedings of the 10th ACM international conference on bioinformatics, computational biology and health informatics,2019: 546.

      [16]王達(dá),周映雪.隨機(jī)森林模型在宏觀審慎監(jiān)管中的應(yīng)用——基于18個(gè)國家數(shù)據(jù)的實(shí)證研究[J].國際金融研究,2020(11):45-54.

      [17]肖艷麗,向有濤.企業(yè)債券違約風(fēng)險(xiǎn)預(yù)警——基于GWO-XGBoost方法[J].上海金融,2021(10):44-54.

      [18]He Hongliang,Zhang Wenyu,Zhang Shuai. A novel ensemble method for credit scoring: adaption of different imbalance ratios[J]. Expert Systems with Applications,2018,98:105-117.

      [19]Tserng H P,Lin G F,Tsai L K, et al. An enforced support vector machine model for construction contractor default prediction[J]. Automation in Construction,2011,20(8):1242-1249.

      [20]李艷霞,柴毅,胡友強(qiáng),等.不平衡數(shù)據(jù)分類方法綜述[J].控制與決策,2019,34(4):673-688.

      [21]張忠林,馮宜邦,趙中愷.一種基于SVM的非均衡數(shù)據(jù)集過采樣方法[J].計(jì)算機(jī)工程與應(yīng)用,2020,56(23):220-228.

      [22]Mohammed R,Rawashdeh J,Abdullah M. Machine learning with oversampling and undersampling techniques: overview study and experimental results[C]//2020 11th International conference on information and communication systems (ICICS),2020.

      [23]曹振田.基于Q統(tǒng)計(jì)量的選擇性集成學(xué)習(xí)研究[D].合肥:安徽大學(xué),2010.

      [24]張金昌,王大偉.財(cái)務(wù)困境預(yù)警:概念界定與理論辨析[J].財(cái)經(jīng)論叢,2020(12):61-69.

      Research on Financial Distress Predicting of Listed Real

      Estate Companies using Soft Voting Ensemble Learning

      JIANG Fengzhen, LI Mao, WANG Jun

      (School of Management Engineering, Qingdao University of Technology, Qingdao 266520, China)

      Abstract: In this study, taking Chinese listed real estate companies as research objects, 20 financial indicators reflecting solvency, profitability, operating capacity and leverage ratios are selected, and the financial data of 137 companies are collected for the period of 1991-2021, and a ensemble models based on soft voting is constructed to predict the financial distress of Chinese listed real estate companies in the one-year and two-year periods. The results show that the AUC value of the ensemble models are? 0.946 and 0.880 for one-year and two-year advance prediction, respectively, which are higher compared with the best-performing single classifier. The explanatory power of the input variables in the ensemble models are analyzed by the SHAP explanatory model. Prediction accuracy is heavily influenced by ROS、ROE、ART、TIE and ROA, irrespective of the one-year or two-year advance period. The models proposed in this study predict the financial distress of real estate companies with high accuracy and identify the main variables related to forecasting. The study is intended to assist real estate companies and other relevant stakeholders to prevent financial failures through early warning.

      Key words:Real Estate Companies; Financial Distress; Ensemble Learning; Soft Voting; Shapley Value

      [責(zé)任編輯:許立群]

      猜你喜歡
      財(cái)務(wù)困境房地產(chǎn)企業(yè)
      財(cái)務(wù)報(bào)表信息對(duì)企業(yè)財(cái)務(wù)困境的預(yù)測能力
      預(yù)測(2016年5期)2016-12-26 11:38:32
      上市公司財(cái)務(wù)困境預(yù)測研究述評(píng)
      商情(2016年43期)2016-12-23 13:16:16
      債務(wù)重組在st上市公司的應(yīng)用
      商(2016年34期)2016-11-24 14:59:02
      論述中小型房地產(chǎn)企業(yè)項(xiàng)目開發(fā)成本控制問題
      人間(2016年26期)2016-11-03 19:17:35
      增值稅全面實(shí)施背景下房地產(chǎn)企業(yè)稅務(wù)風(fēng)險(xiǎn)管理探討
      淺析“營改增”背景下房地產(chǎn)企業(yè)的稅負(fù)變化及應(yīng)對(duì)措施
      商(2016年27期)2016-10-17 06:02:28
      房地產(chǎn)企業(yè)績效考核研究
      商(2016年27期)2016-10-17 04:23:04
      房地產(chǎn)企業(yè)在所得稅匯算清繳中易混淆的費(fèi)用列支問題
      試論營改增對(duì)房地產(chǎn)企業(yè)財(cái)務(wù)管理的影響
      高校財(cái)務(wù)困境成因與預(yù)警分析
      中國市場(2016年30期)2016-07-18 04:25:33
      石河子市| 汉中市| 宽城| 花垣县| 开平市| 洛隆县| 嵊州市| 保德县| 金昌市| 隆德县| 汝南县| 乐昌市| 江津市| 曲水县| 涪陵区| 山东省| 夏邑县| 余干县| 成武县| 鄂托克旗| 富川| 会理县| 淮北市| 三河市| 油尖旺区| 钦州市| 通海县| 昌乐县| 定州市| 岑巩县| 张家港市| 台南县| 萍乡市| 托里县| 铁岭市| 弥勒县| 昌图县| 康平县| 天等县| 奉新县| 盐津县|