• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      貝葉斯分類模型應(yīng)用于企業(yè)運營風(fēng)險預(yù)測

      2017-10-13 05:58:50韓麗娜石昊蘇咸陽師范學(xué)院圖形圖像研究所咸陽7000西北政法大學(xué)商學(xué)院西安70063
      微型電腦應(yīng)用 2017年9期
      關(guān)鍵詞:訓(xùn)練樣本貝葉斯概率

      韓麗娜, 石昊蘇(.咸陽師范學(xué)院 圖形圖像研究所,咸陽 7000; .西北政法大學(xué) 商學(xué)院,西安 70063)

      貝葉斯分類模型應(yīng)用于企業(yè)運營風(fēng)險預(yù)測

      韓麗娜1, 石昊蘇2
      (1.咸陽師范學(xué)院 圖形圖像研究所,咸陽 712000; 2.西北政法大學(xué) 商學(xué)院,西安 710063)

      針對影響企業(yè)運營因素多,無法提前預(yù)知結(jié)果、風(fēng)險大等問題,采用貝葉斯分類方法,通過選取企業(yè)的4個指標(biāo)作為屬性條件,以企業(yè)運營狀況(破產(chǎn)或良好)作為目標(biāo),對40個訓(xùn)練樣本進(jìn)行貝葉斯分類模型學(xué)習(xí)訓(xùn)練;然后對4個測試樣本以及訓(xùn)練樣本進(jìn)行了預(yù)測實驗,誤判率為10%,精確度較高,測試樣本也進(jìn)行了歸類。因此應(yīng)用貝葉斯分類模型能夠較好預(yù)測企業(yè)運營狀況,減少運營風(fēng)險,為盡早預(yù)防改善企業(yè)的運營管理提供參考。

      貝葉斯分類模型; 風(fēng)險預(yù)測; 企業(yè)運營狀況

      Abstract: For the risk of no prediction in advance and many influential factors about enterprise status, Bayesian classification method is selected to predict the risk. By selecting 4 index factors as the property of the enterprise, taking the enterprise operation status (bankruptcy or good) as the target, 40 training samples were input into Bayesian classification model for training. Then the experimental error rate is 10% in the testing of 40 training samples and 4 other samples. Therefore, the Bayesian classification model could forecast the enterprise status in order to reduce operational risk, and provide a reference of early prevention and improvement of the management.

      Keywords: Bayes classification model; Risk prediction; Enterprise operation status

      0 引言

      企業(yè)的競爭非常激烈,企業(yè)運營風(fēng)險較大,而且影響企業(yè)運營狀況的因素又很多,如果能借助某種方法建立一套企業(yè)狀況的預(yù)測趨勢模型,通過該模型,企業(yè)能夠及時發(fā)現(xiàn)財務(wù)管理中存在的問題,及早察覺財務(wù)異常的信號,能夠在財務(wù)狀況異常出現(xiàn)的萌芽狀態(tài)采取有效措施,改善管理,預(yù)防失敗,是非常重要的。為了能夠判斷財務(wù)狀況出現(xiàn)異常的公司未來最有可能出現(xiàn)的運營風(fēng)險(破產(chǎn)或良好),本文分別選取了20家發(fā)生財務(wù)危機(jī)的破產(chǎn)企業(yè)和20家保持穩(wěn)定發(fā)展的企業(yè)作為研究訓(xùn)練樣本,通過分析提取不同組別的樣本公司的4個財務(wù)指標(biāo)屬性,構(gòu)建貝葉斯分類預(yù)測模型,然后對4家未知企業(yè)進(jìn)行企業(yè)狀況的預(yù)測。

      1 貝葉斯分類概念

      1.1 貝葉斯定理

      貝葉斯方法是一種概率統(tǒng)計方法,它計算每一個樣本屬于每一類的概率,然后將樣本劃分為具有最大概率的那一類中。即已知樣本x的條件下,計算其屬于某一類的概率[1]。

      1.2 貝葉斯公式中的相關(guān)概率

      先驗概率P(cj):表示訓(xùn)練樣本數(shù)據(jù)前cj(類別)擁有的初始概率。P(cj)常被稱為cj的先驗概率(prior probability) ,它反映cj正確分類時的經(jīng)驗知識,是根據(jù)歷史的資料或主觀判斷所確定的各種事件發(fā)生的概率,它是獨立于樣本的,樣本的類別總數(shù)用|C|表示[2,3]。如果沒有這一先驗知識,可以將每一候選類別賦予相同的先驗概率。但通常采用用樣例中屬于cj的樣例數(shù)|cj|與總樣例數(shù)|D|的比值來近似表示。如式(1)。

      (1)

      類條件概率(似然概率):P(X|cj):指當(dāng)已知類別為cj的條件下,出現(xiàn)所考察樣本X的概率,若設(shè)X=,則如式(2)。

      P(X|cj)=P(a1,a2,…,am|cj),j∈(1,|C|)

      (2)

      后驗概率P(cj|X):指當(dāng)給定數(shù)據(jù)樣本X,屬于cj類的概率。P(cj|X)被稱為cj的后驗概率(posterior probability),它反映先看到數(shù)據(jù)樣本X后cj成立的置信度。使用貝葉斯公式計算后驗概率,如式(3)。

      貝葉斯公式:

      (3)

      由于P(X)對所有類都是相同的,因此在實際的應(yīng)用中我們只需計算貝葉斯公式分子部分,求取最大值,如式(4)所示,然后就把X分到最大值對應(yīng)的類ccap中,如式(4)。

      P(ccap|X)=max(P(X|cj)P(cj))

      (4)

      1.3 樸素貝葉斯分類器

      由于計算式(2)相當(dāng)困難,所以采用樸素貝葉斯分類器假設(shè),即在給定樣本的目標(biāo)值時屬性之間的相互獨立,即式(2)求取的類條件概率就是每個單獨屬性對應(yīng)的概率的乘積 ,如式(5)。

      P(X|cj)=P(a1,a2,…,am|cj)=

      (5)

      因此,對于樸素貝葉斯學(xué)習(xí)方法就是從訓(xùn)練樣本中估計不同的P(cj)和P(ai|cj),針對新的待分樣本實例,采用公式(4)、(5)進(jìn)行計算給出分類結(jié)果。

      如果屬性為分類屬性,則P(ai|cj)=|sik|/|si|,其中|sik|是D中屬性ak的值為xk的ci類的樣本個數(shù),|si|是D中屬于ci類的樣本個數(shù)[4]。

      如果屬性為連續(xù)屬性,樸素貝葉斯分類方法使用兩種方法估計連續(xù)屬性的類條件概率。一種方法是把每個連續(xù)的屬性離散化,然后用相應(yīng)的離散區(qū)間替換連續(xù)屬性值。另一種方法是可以假設(shè)連續(xù)變量服從某種概率分布,使用訓(xùn)練樣本估計分布的參數(shù),一般采用正態(tài)分布來表示類條件概率分布[5],如式(6)。

      (6)

      1.4 應(yīng)用貝葉斯分類預(yù)測企業(yè)運營風(fēng)險

      1.4.1 數(shù)據(jù)準(zhǔn)備

      本次收集數(shù)據(jù)為:20個破產(chǎn)企業(yè)在破產(chǎn)前兩年的年度財務(wù)數(shù)據(jù)和同時期20個財務(wù)良好的企業(yè)年度數(shù)據(jù),數(shù)據(jù)涉及4個變量。因此訓(xùn)練樣本為40個數(shù)據(jù),分為2組,1組為破產(chǎn)企業(yè),2組為良好企業(yè);包含4個屬性x1表示現(xiàn)金流量/總資產(chǎn),x2表示凈收入/總資產(chǎn),x3表示流動資產(chǎn)/流動債務(wù),x4表示流動資產(chǎn)/凈銷售額,采用貝葉斯分類對40個數(shù)據(jù)進(jìn)行挖掘分析,針對4個企業(yè)的年度財務(wù)數(shù)據(jù),預(yù)測該企業(yè)的運營狀況[4]。部分企業(yè)年度財務(wù)數(shù)據(jù),如表1所示。

      1.4.2 貝葉斯分類預(yù)測應(yīng)用步驟

      第一步:讀取數(shù)據(jù),整理樣本數(shù)據(jù)并歸一化,得到歸一化后的1組數(shù)據(jù)20項,2組數(shù)據(jù)20項;待測數(shù)據(jù)4項。

      第二步:求出各組數(shù)據(jù)的均值和方差,根據(jù)公式(6),構(gòu)造兩類數(shù)據(jù)的正態(tài)分布函數(shù)g(x1)和g(x2);

      表1 部分企業(yè)年度財務(wù)數(shù)據(jù)

      第三步:將任意一行待測數(shù)據(jù)代入兩組正態(tài)分布函數(shù)中,分別求出結(jié)果P1(Xi)和P2(Xi)。

      第四步:根據(jù)公式(4)比較P1(Xi)和P2(Xi)的大小,將Xi分到最大值對應(yīng)的組別中。

      1.4.3 貝葉斯分類預(yù)測結(jié)果分析

      基于40個訓(xùn)練樣本,采用貝葉斯分類思想對未知的4家企業(yè)數(shù)據(jù)進(jìn)行預(yù)測,結(jié)果是41和43號企業(yè)判歸為1組,他們?yōu)槠飘a(chǎn)企業(yè),42和44號企業(yè)判歸為2組,他們?yōu)榉瞧飘a(chǎn)企業(yè)。為了計算機(jī)該貝葉斯分類模型的誤判率,將40個訓(xùn)練樣本采用此方法進(jìn)行分類,結(jié)果如圖1所示。

      其中空心圓圈表示1組的20個數(shù)據(jù),帶實心的圈表示2組的20個數(shù)據(jù),縱坐標(biāo)表示分類組別。我們發(fā)現(xiàn)1組有3個數(shù)據(jù)發(fā)生了誤判,分別為第13、15、16號數(shù)據(jù)被盼歸到2組,而2組有13號數(shù)據(jù)發(fā)生了誤判,被判歸到1組,因此1組的誤判概率估計值為:3/20=0.15,2組的誤判概率估計值

      (a) 應(yīng)用模型1組樣本分類結(jié)果

      (b) 應(yīng)用模型2組樣本分類結(jié)果

      為:1/20=0.05。設(shè)兩組的先驗概率為0.5,則此貝葉斯分類模型的誤判概率為:=0.5*0.15+0.5*0.05=0.1=10%,基本上滿足分類預(yù)測的準(zhǔn)確度。

      3 總結(jié)

      文章論述了貝葉斯分類的基本理論,然后采用貝葉斯方法對企業(yè)狀況預(yù)測問題進(jìn)行研究。首先選取訓(xùn)練樣本,采用貝葉斯方法建立分類模型進(jìn)行訓(xùn)練,然后將待測數(shù)據(jù)帶入分類模型并求出結(jié)果。通過訓(xùn)練樣本對該模型進(jìn)行測試評估,準(zhǔn)確率達(dá)90%。不足之處該模型中樣本數(shù)據(jù)較少,考慮影響企業(yè)狀況的因素不夠全面,還需要進(jìn)一步改進(jìn)。

      [1] 郭艷軍.貝葉斯網(wǎng)學(xué)習(xí)方法及應(yīng)用研究[D].武漢:華中科技大學(xué),2009.

      [2] 邊平勇,石永奎,張序萍.基于貝葉斯分類器的煤與瓦斯突出強(qiáng)度預(yù)測研究[J].佳木斯大學(xué)學(xué)報,2013,31(6):890-894.

      [3] 李愛國,厙向陽.數(shù)據(jù)挖掘原理、算法及應(yīng)用[M].西安:西安電子科技大學(xué)出社,2012:69-72.

      [4] 謝中華.MATLAB統(tǒng)計分析與應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2010,6.

      [5] 李堯.基于貝葉斯網(wǎng)絡(luò)的上市公司財務(wù)狀況異常變動趨勢研究[D].沈陽:沈陽工業(yè)大學(xué),2006.

      TheApplicationofBayesClassificationModelinEnterpriseOperationRiskPrediction

      Han Lina1, Shi Haosu2
      (1. Institute of Graphics and Image Processing, Xianyang Normal University, Xianyang 712000, China;2. School of Business, Northwest University of Political Science and Law, Xi’an 710063, China)

      TP399

      A

      2017.05.30)

      陜西省教育廳科研計劃項目(15JK1776),陜西省計算機(jī)教育學(xué)會2016教學(xué)改革項目(013),咸陽師范學(xué)院校級項目(15XSYK047),咸陽師范學(xué)院“青藍(lán)”人才工程項目(XSYQL201608)

      韓麗娜(1976-),女,陜西富平縣人,教授,博士,CCF會員,研究方向:數(shù)據(jù)挖掘,圖像處理。 石昊蘇(1976-),男,陜西咸陽人,碩士,副教授,研究方向:物證圖像處理,信息管理。

      1007-757X(2017)09-0009-02

      猜你喜歡
      訓(xùn)練樣本貝葉斯概率
      第6講 “統(tǒng)計與概率”復(fù)習(xí)精講
      第6講 “統(tǒng)計與概率”復(fù)習(xí)精講
      概率與統(tǒng)計(一)
      概率與統(tǒng)計(二)
      人工智能
      貝葉斯公式及其應(yīng)用
      寬帶光譜成像系統(tǒng)最優(yōu)訓(xùn)練樣本選擇方法研究
      融合原始樣本和虛擬樣本的人臉識別算法
      基于稀疏重構(gòu)的機(jī)載雷達(dá)訓(xùn)練樣本挑選方法
      基于貝葉斯估計的軌道占用識別方法
      寻甸| 嵊泗县| 平泉县| 武威市| 葫芦岛市| 大化| 怀化市| 神池县| 白城市| 嘉祥县| 甘泉县| 吴江市| 汉川市| 卢氏县| 祁东县| 舞阳县| 邵阳县| 广南县| 大悟县| 政和县| 游戏| 彰化市| 建阳市| 石屏县| 建始县| 绵竹市| 宁南县| 沙田区| 关岭| 高碑店市| 南宁市| 安阳市| 茌平县| 通渭县| 宜兰县| 都江堰市| 绵阳市| 呈贡县| 烟台市| 朝阳区| 五原县|