鮑新中, 傅宏宇
(北京聯(lián)合大學(xué) 管理學(xué)院, 北京 100101)
?
基于變精度加權(quán)平均粗糙度決策樹的財務(wù)預(yù)警研究
鮑新中, 傅宏宇
(北京聯(lián)合大學(xué) 管理學(xué)院, 北京 100101)
運用聚類方法把公司財務(wù)狀況分為5個等級,分別為財務(wù)狀況健康,良好,一般,預(yù)警和危機,與以往將研究樣本分為ST和非ST兩類的財務(wù)預(yù)警模型相比,5分類模型更加精確合理,貼近實際。同時基于指標相關(guān)性和指標重要度對33個財務(wù)指標進行了約簡,得到9個能夠反映企業(yè)財務(wù)狀況的財務(wù)指標。以約簡后的9個指標及5個等級的財務(wù)狀況來建立決策樹,指標體系和財務(wù)等級更加合理。樹的生成過程運用粗糙集中的變精度加權(quán)平均粗糙度作為選擇測試屬性的方法,每次選擇變精度加權(quán)平均粗糙度值最小的屬性作為分支結(jié)點。變精度加權(quán)平均粗糙度的應(yīng)用提高了決策樹的防噪聲能力,復(fù)雜性較低且能有效提高分類效果。實證研究表明將它應(yīng)用到財務(wù)預(yù)警領(lǐng)域,提高了財務(wù)預(yù)警的分類精度。
財務(wù)危機;聚類分析;決策樹;粗糙集
企業(yè)財務(wù)預(yù)警模型經(jīng)歷了從統(tǒng)計模型到人工智能模型的發(fā)展歷程。20世紀末到21世紀初是財務(wù)困境預(yù)測理論發(fā)展的高峰期。除了傳統(tǒng)的統(tǒng)計方法之外,以人工智能技術(shù)為主的一些具有非線性、分布式運算能力的新方法也被引入到財務(wù)困境預(yù)測的相關(guān)研究中[1~4]。Frydman[5]等首先將決策樹引入財務(wù)預(yù)警研究中,決策樹在解決分類問題上具有簡單、易于理解并對數(shù)據(jù)準備要求低等優(yōu)點。
決策樹是一種對大量數(shù)據(jù)集進行分類的非常有效的方法,通過決策樹構(gòu)造的模型,可以從大量信息中挖掘有效的數(shù)據(jù),提取有價值的分類規(guī)則,從而獲得有用的知識,幫助決策者準確地進行預(yù)測。它的基本算法是貪心算法,采用自頂向下的遞歸方式構(gòu)造決策樹。根據(jù)決策樹的增長方法,也就是用來測試的屬性的選擇方法不同,前人提出了很多經(jīng)典的決策樹算法。Quinlan J. R.提出了決策樹ID3算法,后來,他又提出了決策樹C4.5算法,C4.5繼承了ID3算法的所有優(yōu)點,并且提出了增益比率的概念,通過合并具有連續(xù)值的屬性,可以根據(jù)連續(xù)性屬性進行分類,還可以處理缺少屬性值的訓(xùn)練樣本。之后有人在此基礎(chǔ)上又提出了SLIQ、SPRINT、CHAID等一些算法,并且把這些方法運用到各個領(lǐng)域。
姚靠華[6]運用決策樹進行財務(wù)預(yù)警的實證研究,應(yīng)用決策樹技術(shù)建立了中國上市公司的財務(wù)困境預(yù)警系統(tǒng),他們使用差異系數(shù)下降最快的分割值作為最佳分割閾值,從而保證了同一組內(nèi)目標變量的取值有最小的差異性,但作者同樣沒有對指標之間相關(guān)性等進行處理。陳曉紅[7]運用CHAID算法對中小企業(yè)上市公司財務(wù)預(yù)警進行了研究,他們把每個類別屬性分別與決策變量做交叉分類,產(chǎn)生一系列二維表,然后分別計算他們的卡方統(tǒng)計量,以統(tǒng)計量P值最大的二維表作為最佳初始分類表,并且對結(jié)論進行了分析,作者雖然把樣本公司的財務(wù)狀況分為3類,但主觀性比較強,沒有合理的選擇標準。Sangjae Lee[8]運用數(shù)據(jù)包絡(luò)分析和決策樹方法進行效益分析和B2C控制推介,分為兩個步驟對B2C控制進行評價,效率分析與控制推薦。
將粗糙集知識運用到?jīng)Q策樹模型中可以有效防止決策樹生成過程中的過度擬合的問題,從而提高分類的效果,因此本文將粗糙集理論與決策樹理解相結(jié)合進行財務(wù)預(yù)警模型的建立。
1982年Z.Pawlak教授提出了粗糙集理論,運用粗糙集的方法可以對屬性進行約簡,把粗糙集的知識運用到?jīng)Q策樹上,國內(nèi)外學(xué)者提出了很多不同的建樹方法并應(yīng)用到不同領(lǐng)域。趙衛(wèi)東[9]運用粗糙集知識對決策樹進行了優(yōu)化,通過引入粗糙集理論中可分辨的概念給出一種方法,這種方法通過優(yōu)化降低了樹的高度。蔣蕓[10]等人提出了一種基于粗糙集構(gòu)造決策樹的方法,它基于粗糙集的理論提出了加權(quán)平均粗糙度的概念,將其作為選擇分離屬性的標準。高靜[11]等人提出了一種新的基于粗糙集模型的決策樹算法,引入了抑制因子,有效避免了劃分過細的問題。鮑新中[12]將粗糙集理論和聚類方法運用到神經(jīng)網(wǎng)絡(luò)的輸入輸出層建立中,使得財務(wù)預(yù)警模型更加符合企業(yè)實踐。Iftikhar U. Sikder和Toshinori Munakata[13]基于粗糙集和決策樹對低地震活動前兆因素的描述,他們運用粗糙集和決策樹的方法,使用了信息增益和熵產(chǎn)生一系列規(guī)則,對地震進行預(yù)警。Mu-Yen Chen[14]基于決策樹分類算法和邏輯回歸算法對公司的財務(wù)狀況進行預(yù)警,他認為利用人工智能模型進行財務(wù)預(yù)警要優(yōu)于傳統(tǒng)的統(tǒng)計模型。
運用決策樹方法形成一系列規(guī)則,對訓(xùn)練數(shù)據(jù)集進行分類,然后根據(jù)形成的規(guī)則對訓(xùn)練數(shù)據(jù)集之外的數(shù)據(jù)進行分類,應(yīng)用在財務(wù)領(lǐng)域,可以對財務(wù)進行預(yù)警。與傳統(tǒng)的財務(wù)預(yù)警方法將研究樣本劃分為兩類不同的是,本文將樣本劃分為5類,分類更具漸進性,更加合理。并且文章從指標重要度與消除指標共線性兩方面考慮約簡財務(wù)指標,所獲得財務(wù)指標有代表性。將粗糙集與決策樹相結(jié)合,應(yīng)用到財務(wù)預(yù)警領(lǐng)域,可以提高分類效果。
1.1 變精度加權(quán)平均粗糙度介紹
我們選取測試屬性的目的是使所選條件屬性包含的確定性因素更多,而條件屬性的變精度加權(quán)平均粗糙度越小,則相應(yīng)的其包含的確定性因素就越多,因此,將其選為測試屬性也更加合理。相關(guān)定義如下:
定義1 加權(quán)平均粗糙度
(1)
定義2 變精度加權(quán)平均粗糙度
(2)
(3)
(4)
現(xiàn)實財務(wù)數(shù)據(jù)中不可避免存在很多噪聲數(shù)據(jù),使用變精度近似精度可以克服噪聲數(shù)據(jù)對精確性的影響,在一定程度上消除噪聲數(shù)據(jù)對刻畫精度的影響。
1.2 基于變精度加權(quán)平均粗糙度構(gòu)造決策樹過程描述
決策樹的基本算法是貪心算法,采用自頂向下的遞歸方式構(gòu)造決策樹。也就是說決策樹每次生長過程都是使用相同的標準來確定測試屬性。
構(gòu)造決策樹過程,測試屬性用來確定樹的非葉子結(jié)點,樹的每一次生長都要確定一個測試屬性,所以說測試屬性的選擇至關(guān)重要,直接影響分類的質(zhì)量。樹的生長過程中,把變精度加權(quán)平均粗糙度作為決策樹測試屬性選擇的標準,每次選擇變精度加權(quán)平均粗糙度最小的屬性作為樹的測試結(jié)點。
決策樹自頂向下生長,每次生長都選擇變精度加權(quán)平均粗糙度值最小的屬性作為樹的測試屬性。輸入決策表和分類誤差β,即可輸出一棵決策樹。
算法步驟如下:
步驟1 根據(jù)輸入的決策表計算每一個條件屬性的變精度加權(quán)平均粗糙度,并比較它們的大小;
步驟2 選擇變精度加權(quán)平均粗糙度最小的屬性ψ作為決策樹測試的屬性;
步驟3 用選擇的屬性ψ去劃分訓(xùn)練集,相應(yīng)的該屬性的每一個取值產(chǎn)生一個分支(子表),這樣訓(xùn)練集被劃分為若干小的決策表;
步驟4 若子表中屬于某一類別實例個數(shù)占表中總實例個數(shù)大于等于(1 -β)或表中沒有可選的屬性,則以該子表中占多數(shù)的實例類別標識該節(jié)點,并作為葉子結(jié)點;否則,將子表中的條件屬性去掉已選劃分屬性ψ,重復(fù)以上步驟;
步驟5 返回。
算法步驟比較簡單,決策樹使用遞歸算法,對訓(xùn)練集劃分,可以得到一個局部最優(yōu)解。根據(jù)分類的結(jié)果可以形成一系列規(guī)則,根據(jù)這些規(guī)則可以對公司財務(wù)狀況進行評價,進而對公司財務(wù)進行預(yù)警。樹的生成過程運用粗糙集中的變精度加權(quán)平均粗糙度作為選擇測試屬性的方法,每次選擇變精度加權(quán)平均粗糙度值最小的屬性作為分支結(jié)點。這種方法復(fù)雜性較低,并能有效提高分類效果,應(yīng)用到財務(wù)領(lǐng)域,對財務(wù)預(yù)警效果較好。
2.1 基于粗糙集的決策樹財務(wù)預(yù)警基本步驟
本文基于粗糙集和決策樹理論對公司財務(wù)預(yù)警,以選取原始數(shù)據(jù)為出發(fā)點,最后建立一棵決策樹,形成規(guī)則后對公司財務(wù)狀況進行預(yù)警。文章結(jié)構(gòu)主要分為5個部分。
步驟1 為增強可比性,應(yīng)選取同一行業(yè)的財務(wù)數(shù)據(jù),本文選取85家制造業(yè)上市公司數(shù)據(jù),并使用可以反映企業(yè)財務(wù)狀況的六方面共計33個財務(wù)指標構(gòu)建原始指標體系;
步驟2 對選取的原始數(shù)據(jù)進行標準化處理,以消除不同量綱和奇異值對結(jié)果的影響;
步驟3 把選取的85家數(shù)據(jù)進行對象聚類,把它們分為5類,分別是財務(wù)狀況危機、預(yù)警、一般、良好和健康,同時對數(shù)據(jù)進行離散化;
步驟4 將標準化后的數(shù)據(jù)按照指標聚類把33個指標分為9類,分別計算9類指標中每個指標的重要度,并分別對它們排序,選擇每類中重要度最大者構(gòu)建指標體系;
步驟5 根據(jù)約簡后的指標體系,對象聚類結(jié)果和離散化后的數(shù)據(jù)計算變精度加權(quán)平均粗糙度,并依此構(gòu)造一棵決策樹。
基于粗糙集的決策樹財務(wù)預(yù)警基本步驟如圖1。
圖1 基于粗糙集的決策樹財務(wù)預(yù)警基本步驟
2.2 樣本選取及原始指標體系構(gòu)建
企業(yè)財務(wù)狀況出現(xiàn)異常時,可能會對其營運能力、現(xiàn)金流量等方面產(chǎn)生影響。如,當企業(yè)陷入財務(wù)困境時,可能出現(xiàn)流動性不足,償債能力下降,資產(chǎn)周轉(zhuǎn)困難,盈利能力降低等情況。當然,流動性降低、資產(chǎn)周轉(zhuǎn)不靈、盈利能力下降可能也是導(dǎo)致企業(yè)陷入財務(wù)困境的原因。為了研究企業(yè)財務(wù)指標與財務(wù)困境之間的關(guān)系,本文選取影響公司財務(wù)狀況的六方面共計33個指標對企業(yè)財務(wù)狀況進行評價。這六個方面分別是:營運能力、現(xiàn)金流量、資本結(jié)構(gòu)、償債能力、成長能力和盈利能力。
本文選用滬深兩市制造業(yè)公司的財務(wù)數(shù)據(jù)為樣本,剔除中小板A股股票70只、創(chuàng)業(yè)板14只、B股7只,數(shù)據(jù)不全的股票60只(含),最后得到滬深兩市C4行業(yè)2009年A股主板85只股票的財務(wù)數(shù)據(jù)作為樣本。即本文的樣本數(shù)據(jù)為85家制造業(yè)公司2009年的33個財務(wù)指標。
表1 選擇財務(wù)指標
2.3 數(shù)據(jù)標準化
聚類分析及建樹的要求需要對各個原始數(shù)據(jù)進行標準化處理。本文選擇0-1標準化方法,算法描述如下:
對于一個正向指標Xi,假定當它取值大于或者等于α?xí)r為最佳,此時,把它所有取值等于或者大于α的值標準化后取值為1;同理,假定當Xi的取值小于或者等于β時為最差,標準化后取值為0;取值為區(qū)間(β,α)的數(shù)據(jù)δ,標準化之后為:
(5)
將選取的85家上市公司的33個財務(wù)指標運用上述方法進行標準化。
2.4 指標約簡
由于財務(wù)指標之間會有較強的相關(guān)性,同時考慮到各個指標對公司財務(wù)狀況影響程度不同,本文基于聚類和粗糙集中指標重要度來對指標約簡,建立決策樹的指標體系。
(1)首先從指標的共線性角度出發(fā),使用系統(tǒng)聚類方法對33個財務(wù)指標進行聚類。本文綜合考慮指標之間相關(guān)性和指標經(jīng)濟含義,把33個原始指標分為9類,分別為:
Y1={X2,X4,X19},Y2={X10,X11},Y3={X14,X16,X17,X18,X25},Y4={X1,X3,X5,X13,X15},Y5={X27,X30},Y6={X6},Y7={X7,X9,X29,X31},Y8={X8,X12},Y9={X20,X21,X22,X23,X24,X26,X28,X32,X33}
結(jié)合指標的經(jīng)濟意義來看,{X2,X4,X19}反映的主要是營運能力;{X10,X11}是對償債能力說明性強的指標。顯然,將{X2,X4,X10,X11,X19}劃分為兩類是合理的。{X7,X9,X29,X31}主要是反映銷售收入結(jié)構(gòu)的指標,而{X8,X12}反映的是企業(yè)資本結(jié)構(gòu),從二者的計算過程來看,將它們聚在一起,并與其他指標分開比較合理。
(2)其次考慮每個指標對決策變量的重要性,利用粗糙集中重要度理論對指標聚類結(jié)果中屬于同一類的財務(wù)指標進行約簡。得到最終的財務(wù)預(yù)警指標體系。一般來說,不同的條件屬性對決策屬性有不同的重要性。為了確定每個條件屬性對于決策屬性的重要性,粗糙集中常用的一種方法是將該屬性從決策表中刪除,然后考察沒有這個屬性的情況下決策表分類的變化情況。
定義3 重要度:給定一個決策表DT=(U,C∪D,V,f),?β?C,?β∈c,以及?α∈C-B,定義:
(6)
為條件屬性α對條件屬性集B相對于決策屬性D的重要度;其中,U表示一個論域,C為條件屬性,D為決策屬性,V表屬性集的值域, f為一個信息函數(shù),表任意一個對象的屬性在V上的取值。
以第一步中每一類聚類結(jié)果中的指標為條件屬性,確定每個指標對決策屬性的重要程度。在每一類指標中挑選重要度最大的指標作為最終指標,構(gòu)建最終指標體系。
表2 指標重要度
由此得到約簡后的指標,構(gòu)建出最終指標,如表3。
表3 最終財務(wù)指標
從33個財務(wù)指標中最終篩選出9個指標,它們從6個方面描述企業(yè)的財務(wù)狀況,并且指標之間無明顯的共線性。
2.5 聚類分析
為了確定每家單位所屬的財務(wù)狀況等級,我們需要對這些單位進行分類。文章運用系統(tǒng)聚類的方法,把所選的國內(nèi)制造業(yè)上市公司分為5類。根據(jù)各指標值的表現(xiàn)情況,第一類為財務(wù)狀況健康的公司,第二類為財務(wù)狀況良好的公司,第三類為財務(wù)狀況一般的公司,第四類為財務(wù)狀況預(yù)警的公司,第五類為財務(wù)狀況危機的公司。
利用處理過后的數(shù)據(jù),然后通過系統(tǒng)聚類把85家企業(yè)分為5類,為方便起見,我們對85家公司進行了編號。聚類結(jié)果如下:
A={9,30,37,43,49,52,53,55,56,57,60,65,69,73,78,81,84};
B={4,5,7,13,15,21,24,26,27,31,32,33,36,38,39,40,45,47,48,63,66,68,71,74,82,83};
C={3,8,10,11,14,17,29,32,34,46,58,59,62,72};
D={2,12,16,23,25,28,35,42,61,67,70,75,76,77,80,85};
E={1,6,18,19,20,41,44,50,51,54,64,79}。
以上聚類結(jié)果把85家企業(yè)分為5類,并根據(jù)每類公司各指標值的表現(xiàn)情況,A、B、C、D、E分別表示財務(wù)狀況健康、良好、一般、預(yù)警和危機。從聚類結(jié)果來看,大多數(shù)ST公司被聚到了第五類,聚類效果較好。
同時,為了滿足建樹的需要,我們需對數(shù)據(jù)進行離散化處理。數(shù)據(jù)離散化把連續(xù)型數(shù)據(jù)轉(zhuǎn)化為離散型數(shù)據(jù),對標準化后的數(shù)據(jù),把每個條件屬性按照取值劃分為5個等價類,分別為:[0,0.1)表示財務(wù)狀況差,用數(shù)字“1”表示;[0.1,0.3)表示財務(wù)狀況較差,用數(shù)字“2”表示;[0.3,0.6)表示財務(wù)狀況中等,用數(shù)字“3”表示;[0.6,0.8)表示財務(wù)狀況較好,用數(shù)字“4”表示;[0.8,1]表示財務(wù)狀況好,用數(shù)字“5”表示。由此,每個條件屬性都有5個等價類。
2.6 生成決策樹
分類誤差可以反映決策樹分類精確度,綜合考慮分類精度與防止決策樹過度擬合問題,本文設(shè)定分類誤差β=0.2。
若子表中屬于某一類別實例個數(shù)占表中總實例個數(shù)比例大于等于0.8或者表中沒有可選的屬性,則以該子表中占多數(shù)的實例類別標識該節(jié)點,并作為葉子結(jié)點;否則,將子表中的條件屬性去掉已選劃分的條件屬性R3,重復(fù)上述步驟。
首先,銷售成本率作為樹的根結(jié)點,把訓(xùn)練集分成了五類,其中銷售成本率在區(qū)間[0,0.1)之間的公司有10家,而這10家中有9家是屬于財務(wù)狀況危機的公司,9/10=0.9,大于1-β=0.8。因此,銷售成本率在區(qū)間[0,0.1)之間的等價類財務(wù)狀況為危機。據(jù)此,我們可以認為訓(xùn)練集以外的公司銷售成本率在區(qū)間[0,0.1)的財務(wù)狀況為危機。而且,得出的決策樹把大部分被ST的公司分到財務(wù)危機的一類,總體分類準確率比較高。
樹中“1”表示區(qū)間[0,0.1),“2”表示區(qū)間[0.1,0.3),“3”表示區(qū)間[0.3,0.6),“4”表示區(qū)間[0.6,0.8),“5”表示區(qū)間[0.8,1]。
決策樹結(jié)果如圖2。
圖2 財務(wù)預(yù)警的決策樹結(jié)果
根據(jù)決策樹形成規(guī)則如表4。
表4 決策規(guī)則
根據(jù)歷史數(shù)據(jù)尋找公司財務(wù)數(shù)據(jù)的規(guī)律,建立一棵決策樹,生成一系列規(guī)則,根據(jù)這些規(guī)則可以預(yù)測訓(xùn)練集以外的公司財務(wù)狀況。
同時,我們得到利用變精度加權(quán)平均粗糙度決策數(shù)模型的財務(wù)預(yù)警分類精度,如表5所示。同時,運用CHAID決策樹算法,對相同樣本進行了財務(wù)預(yù)警的分析,其分類精度結(jié)果見表5??梢钥吹?,基于變精度加權(quán)平均粗糙度決策樹的財務(wù)預(yù)警結(jié)果精度更高。
表5 模型分類精度表
為了對公司財務(wù)狀況進行更加精確的預(yù)警,本文把公司財務(wù)狀況分為5個等級,與以往兩個等級的財務(wù)預(yù)警相比,分類更具漸進性,更加合理。同時本文利用粗糙集中重要度理論對所選33個指標進行了約簡,最終得到可以代表公司財務(wù)狀況的9個財務(wù)指標,這9個財務(wù)指標從6個方面描述公司的財務(wù)狀況,并且消除了指標之間的相關(guān)性。數(shù)據(jù)離散過程,不是平均地劃分為5個區(qū)間,而是偏向于正態(tài)分布的趨勢,符合數(shù)據(jù)分布的一般規(guī)律。
將變精度加權(quán)平均粗糙度作為構(gòu)造決策樹的測試屬性選擇的標準,通過實證研究,我們得到一棵決策樹,并根據(jù)這棵決策樹形成12條規(guī)則。這些規(guī)則對發(fā)生財務(wù)危機的企業(yè)預(yù)警精度為100%,構(gòu)造出的決策樹把10家ST公司全部分到財務(wù)狀況危機的一類;對公司財務(wù)狀況一般的企業(yè)預(yù)警精度為92.9%,總體預(yù)測精度達82.4%??梢姶四P蛯矩攧?wù)狀況預(yù)警有較好的效果,尤其是對將要發(fā)生財務(wù)危機的企業(yè)。與運用CHAID決策樹算法的財務(wù)預(yù)警模型相比,基于變精度加權(quán)平均粗糙度決策樹的財務(wù)預(yù)警結(jié)果更加準確。
根據(jù)決策樹提取的一系列規(guī)則以及決策樹模型,可以構(gòu)建一個財務(wù)危機預(yù)警系統(tǒng)。由于引入了變精度加權(quán)平均粗糙度,生成的決策樹有效弱化了少數(shù)實例對決策樹造成的不良影響,雖然決策中存在一定的誤差,但決策樹總體分類是比較好的,最終生成的決策樹也比較符合實際,分類精度也比較高,且有效地處理了噪聲數(shù)據(jù)。
[1] Yang Z J, You W, Ji G L. Using partial least squares and support vector machines for bankruptcy prediction[J]. Expert Systems with Applications, 2011, 38: 8336- 8342.
[2] Bao X Z, Tao Q Y. Dynamic financial distress prediction based on rough set theory and EWMA model[J]. International Journal of Applied Mathematics and Statistics, 2013, 48(18): 339-346
[3] Jae K B. Predicting financial distress of the south korean manufacturing industries[J]. Expert Systems with Applications, 2012, 39 (10): 9159-9165.
[4] Sun J, Jia M Y, Li H. Adaboost ensemble for financial distress prediction: an empirical comparison with data from Chinese listed companies[J]. Expert Systems with Applications, 2011, 38(8): 9305-9312.
[5] Frydman H, Altman E I, Kao D. Introducing recursive partitioning for financial classification: the case of financial distress[J]. Journal of Finance, 1985, 40(1): 269-291.
[6] 姚靠華,蔣艷輝.基于決策樹的財務(wù)預(yù)警[J].系統(tǒng)工程,2005,23(10):102-106.
[7] 陳曉紅,易松青.基于CHAID方法的中小企業(yè)上市公司財務(wù)預(yù)警研究[J].經(jīng)濟管理研究,2007,3: 50-54.
[8] Lee S. Using data envelopment analysis and decision trees for efficiency analysis and recommendation of B2C controls[J]. Decision Support Systems, 2010, (49): 486- 497.
[9] 趙衛(wèi)東,李旗號.粗集在決策樹優(yōu)化中的應(yīng)用[J].系統(tǒng)工程學(xué)報,2001,16(4):289-295.
[10] 蔣蕓,李戰(zhàn)懷,張強等.一種基于粗糙集構(gòu)造決策樹的新方法[J].計算機應(yīng)用,2004,24(8):21-23.
[11] 高靜,徐章艷等.一種新的基于粗糙集模型的決策樹算法[J].計算機工程,2008,34,(3):9-11.
[12] 鮑新中,楊宜.基于聚類-粗糙集-神經(jīng)網(wǎng)絡(luò)的企業(yè)財務(wù)危機預(yù)警[J].系統(tǒng)管理學(xué)報,2013,22(03):358-365
[13] Iftikhar U S, Toshinori M. Application of rough set and decision tree for characterization of premonitory factors of low seismic activity[J]. Expert Systems with Applications, 2009, 36: 102-110.
[14] Chen M Y. Predicting corporate financial distress based on integration of decision tree classification and logistic regression[J]. Expert Systems with Applications, 2011, (38): 11261-11272.
Financial Early-warning Based on Variable Precision WeightedAverage Roughness Decision Tree
BAO Xin-zhong, FU Hong-yu
(Management School, Beijing Union University, Beijing 100101, China)
Traditional researches usually divide the samples into ST and non-ST for the financial status. We use clustering methods to divide sample companies into 5 categories, namely, healthy, good, general, warning and crisis. This five-level classification may be more reasonable and practical than the traditional two-level classification. Meanwhile, 33 financial indicators are reduced into 9 ones based on the indicator correlations and the significance. The reduced indicaor system and the five-level financial status are used to construct the decision tree, which makes the process more reasonable. Then, we regard variable precision-weighted average roughness as the method of selecting branch properties, and each time select minimum of them as branch properties. Thus generated decision tree can avoid the detailed classification of a small amount of special categories data and improve the ability of anti-noise. This method is less complex and can effectively improve the classification results. The empirical study proves to have good results by using it in the early-warning of financial distress.
clustering analysis; decision tree; rough sets; financial early-warning
2013- 09-30
國家社會科學(xué)基金項目(14BGL034);北京市社科基金重點項目(15JGA003)
鮑新中(1968-),男,江蘇宜興人,教授,博士,主要研究方向為財務(wù)數(shù)據(jù)挖掘。
F275
A
1007-3221(2015)03- 0189- 08