• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      銀行信用風(fēng)險預(yù)測
      ——基于SVM和BP神經(jīng)網(wǎng)絡(luò)的比較研究

      2018-12-14 09:21:08李佳黃之豪
      關(guān)鍵詞:超平面信用風(fēng)險分類器

      李佳,黃之豪

      (上海理工大學(xué),上海200093)

      一、引 言

      銀行信用風(fēng)險評估和銀行信用管理方法一直是學(xué)術(shù)研究和商業(yè)銀行管理領(lǐng)域重要的研究話題。由于銀行是整個金融系統(tǒng)的核心,銀行的主要資產(chǎn)業(yè)務(wù)是銀行對企業(yè)發(fā)放的貸款,若企業(yè)由于破產(chǎn)或資金流動性等原因無法按期償還貸款甚至造成違約會給商業(yè)銀行帶來巨大的損失,并且,商業(yè)銀行的不良貸款率不斷提升不僅是導(dǎo)致銀行破產(chǎn)的主要原因,同時也會導(dǎo)致整個金融市場風(fēng)險提升。因此,商業(yè)銀行能否獲得性能極好又切實(shí)可行的信用風(fēng)險預(yù)測模型,對于銀行金融機(jī)構(gòu)乃至整個金融市場而言至關(guān)重要。

      早期的破產(chǎn)預(yù)測模型多使用傳統(tǒng)計量和統(tǒng)計方法。Sinkey(1975)[1]將統(tǒng)計預(yù)測模型運(yùn)用在銀行破產(chǎn)、信用風(fēng)險領(lǐng)域,使用多元判別分析方法(Multivariate discriminant analysis,簡記為MDA)來預(yù)測銀行破產(chǎn)風(fēng)險,Meyer&Pifer(1970)[2]和 Martin(1977)[3]使用 logistic 回歸分析方法來預(yù)測銀行信用風(fēng)險,Kolari et al.(2002)[4]運(yùn)用 logit回歸分析來預(yù)測美國商業(yè)銀行破產(chǎn)風(fēng)險。

      近年來,隨著人工智能的興起、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘在世界范圍內(nèi)的推廣,幫助商業(yè)銀行風(fēng)險預(yù)測獲得了新的、更有效的預(yù)測方法,也或許預(yù)示著在商業(yè)銀行信用風(fēng)險預(yù)測領(lǐng)域,人工智能方法逐漸會取代傳統(tǒng)統(tǒng)計方法,成為預(yù)測商業(yè)銀行信用風(fēng)險即破產(chǎn)的首選方法。最早使用人工智能方法研究銀行破產(chǎn)的是Tam (1991)[5],他使用人工智能方法BP神經(jīng)網(wǎng)絡(luò) (Back-propagation neural networks)進(jìn)行建模研究,得到了BP神經(jīng)網(wǎng)絡(luò)優(yōu)于多元判別分析方法、logistic回歸分析方法、KNN (K-nearest Neighbor)方法的結(jié)論,在Tam&Kiang(1992)[6]研究中又進(jìn)一步得出BP神經(jīng)網(wǎng)絡(luò)優(yōu)于前向反饋神經(jīng)網(wǎng)絡(luò)(Forward-feed Neural Networks,簡記 FFNN)的結(jié)論。

      支持向量機(jī)(SVM)是人工智能領(lǐng)域的新方法,近些年來支持向量機(jī)在各個行業(yè)的相關(guān)運(yùn)用發(fā)展迅速,在銀行破產(chǎn)和信用風(fēng)險領(lǐng)域中,Ravi et al.(2008)[7]基于SVM方法用了54個變量對1000家銀行進(jìn)行研究,預(yù)測準(zhǔn)確度為83.5%。Ekinci&Erdal (2011)[8]對土耳其的35家私人商業(yè)銀行進(jìn)行分析,比較了SVM方法和神經(jīng)網(wǎng)絡(luò)方法的預(yù)測精度。國內(nèi)學(xué)者對該方法的研究甚少,楊毓和蒙肖蓮(2006)[9]搜集了2000-2002年間某省制造行業(yè)1360家企業(yè)破產(chǎn)案例,用SVM方法構(gòu)建了企業(yè)破產(chǎn)預(yù)測模型,余晨曦和梁瀟(2008)[10]使用滬深兩市2006-2007年間數(shù)據(jù),進(jìn)行SVM和MDA方法比較,得出SVM方法更優(yōu)的結(jié)論。

      然而,上述學(xué)者的研究存在以下不足:第一,沒有做出人工智能方法之間的比較研究。第二,研究數(shù)據(jù)多為調(diào)查數(shù)據(jù),并不公開可得或難以收集,因此缺乏推廣的基礎(chǔ)。第三,研究結(jié)論并未與時俱進(jìn)。本文針對這些不足之處加出改進(jìn),選擇近兩年公開可得的數(shù)據(jù)比較研究SVM方法和BP神經(jīng)網(wǎng)絡(luò)方法優(yōu)劣,使人工智能方法能被銀行業(yè)及金融業(yè)廣泛運(yùn)用。

      本文余下結(jié)構(gòu)為:第二部分介紹支持向量機(jī)和神經(jīng)網(wǎng)絡(luò);第三部分講述數(shù)據(jù)來源、建模方法和實(shí)證結(jié)果分析;最后是針對本文實(shí)證分析得到的結(jié)果進(jìn)行總結(jié)并得出一些啟示。

      二、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)

      (一)支持向量機(jī)

      支持向量機(jī)是在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來的一種機(jī)器學(xué)習(xí)方法,1992年由Boser,Guyon和Vapnik提出,在解決小樣本、非線性和高維的回歸和分類問題上有巨大優(yōu)勢,因此自推出以后倍受歡迎,支持向量機(jī)可以看做一類簡單的最大間隔分類器的擴(kuò)展。

      1.最大間隔分類器

      在p維空間中,超平面是p-1維的平面仿射子空間。在p維空間中,超平面可以定義為:

      β0,β1,…,βp為參數(shù)。 任何滿足公式(1)的點(diǎn) X=(X1,X2,…,Xp)T都落在超平面上。

      假設(shè)X為n×p的數(shù)據(jù)矩陣,由p維空間中的n個訓(xùn)練觀測組成,x1=(x11,…,x1p)T,…,xn=(xn1,…,xnp)T。 這些觀測分為兩類,即 y1,…,yn∈{-1,1},其中-1代表一種類別,1代表另一種類別,如果分割超平面存在,就可以用其來制造分類器,如圖1所示。

      圖1 超平面分割訓(xùn)練觀測

      而這樣的分割超平面有無數(shù)個,因此需要找到一個最大間隔超平面,即離訓(xùn)練觀測最遠(yuǎn)的那個分割超平面。一個分割超平面的例子如圖2所示,可以看到有三個訓(xùn)練觀測到最大間隔超平面的距離是一樣的,這三個訓(xùn)練觀測就叫做支持向量(Support Vector)。

      圖2 分割超平面和支持向量

      最大間隔超平面實(shí)則優(yōu)化問題的解:

      滿足約束(3)、(4)以保證每個觀測都落在超平面正確的一側(cè):

      2.支持向量分類器

      最大間隔分類器在線性不可分的情況下的推廣叫做支持向量分類器,支持向量分類器允許了小部分訓(xùn)練觀測誤分以保證分類器對其余大部分觀測實(shí)現(xiàn)更好地分類,因此支持向量分類器所選超平面是如下最優(yōu)化的解。

      滿足約束條件:

      其中,C是損失懲罰調(diào)節(jié)參數(shù),ε1,…,εn是松弛變量,其作用為允許小部分訓(xùn)練觀測誤分。

      3.支持向量機(jī)

      支持向量機(jī)是支持向量分類器的一個擴(kuò)展,支持向量機(jī)使用了核函數(shù)方式來擴(kuò)大特征空間。常見的核函數(shù)有:線性核函數(shù)、多項式核函數(shù)和徑向基核函數(shù),分別是公式(9)、(10)、(11)。

      其中,d是多項式函數(shù)的自由度,γ是個正常數(shù),‖Xi-Xj‖表示觀測Xi,Xj的歐式距離。

      (二)BP反向傳播神經(jīng)網(wǎng)絡(luò)

      BP神經(jīng)網(wǎng)絡(luò)是一種典型的人工神經(jīng)網(wǎng)絡(luò),反向傳播模型為多層感知機(jī)結(jié)構(gòu),不僅包含輸入和輸出節(jié)點(diǎn),還有一層或多層隱層,又稱為多層感知機(jī)模型(MLP),圖3可以形象表示一個BP神經(jīng)網(wǎng)絡(luò)。

      圖3 BP神經(jīng)網(wǎng)絡(luò)拓?fù)鋱D

      BP反向傳播網(wǎng)絡(luò)的重要特點(diǎn)是反向傳播,BP反向傳播網(wǎng)絡(luò)算法分為正向傳播和反向傳播兩階段。正向傳播階段是指樣本信息從輸入層開始由上至下逐層經(jīng)隱節(jié)點(diǎn)計算處理,最終樣本信息被傳播到輸出層節(jié)點(diǎn),得到預(yù)測結(jié)果。計算出預(yù)測誤差后便進(jìn)入反向傳播階段,將輸出節(jié)點(diǎn)的預(yù)測誤差反方向逐層傳播到上層隱節(jié)點(diǎn),逐層調(diào)整連接權(quán)重,直到輸入節(jié)點(diǎn)和隱節(jié)點(diǎn)的權(quán)重全部到調(diào)整為止。

      總的來說,BP算法的目的是利用梯度下降來更新結(jié)構(gòu)中的參數(shù)以使得損失函數(shù)最小化,給定一個樣本(x,y),將其輸入到神經(jīng)網(wǎng)絡(luò)模型中,得到網(wǎng)絡(luò)輸出為y?,假定損失函數(shù)為L(y,y?),要進(jìn)行參數(shù)學(xué)習(xí)就需要計算損失函數(shù)關(guān)于每個參數(shù)的導(dǎo)數(shù),對參數(shù)求偏導(dǎo)時涉及矩陣微分、鏈?zhǔn)角髮?dǎo)法則等,出于篇幅考慮此處略去?;谡`差反向傳播算法的前饋神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程可以分為以下三步:

      (1)前饋計算每一層的凈輸入 z(l)和激活值 α(1),直到最后一層;

      (2)反向傳播計算每一層的誤差項 δ(1);

      (3)計算每一層參數(shù)的偏導(dǎo)數(shù),并更新參數(shù)。

      三、研究數(shù)據(jù)和實(shí)驗(yàn)結(jié)果分析

      (一)模型假設(shè)

      由于企業(yè)是否違約與企業(yè)經(jīng)營狀況息息相關(guān)。而現(xiàn)實(shí)中,個別企業(yè)的貸款違約信息十分難以搜集,且可能涉及到一些商業(yè)機(jī)密,所以本文參照余晨曦和梁瀟的研究并做出研究假設(shè):獲得商業(yè)銀行貸款的企業(yè)可以劃分為兩類,第1類企業(yè)不會發(fā)生違約現(xiàn)象,第2類企業(yè)會發(fā)生違約。并且本文做出進(jìn)一步假設(shè):經(jīng)營狀況很好的企業(yè)不會發(fā)生違約,經(jīng)營狀況差的公司會發(fā)生違約。本文選取滬深兩市上市公司作為研究對象,由于本文著重考察商業(yè)銀行信用風(fēng)險,因此本文認(rèn)為上市公司中ST公司是經(jīng)營狀況不佳的公司并會發(fā)生違約,而上市公司中償債能力指標(biāo)較好的公司為經(jīng)營狀況很好的企業(yè)不會發(fā)生違約。經(jīng)營狀況好的企業(yè)記為1,經(jīng)營狀況不好的企業(yè)記為-1,支持向量機(jī)預(yù)測商業(yè)銀行信用風(fēng)險的方法就是要找到一個超平面來區(qū)分經(jīng)營狀況好的和不好的公司。

      (二)樣本選取與數(shù)據(jù)來源

      本文的研究期間為2015-2016年,本文樣本公司為144家滬深兩市上市公司,其中ST公司有75家,而剔除其中三家數(shù)據(jù)不齊全樣本不具代表性的公司,剩余72家公司,為了使實(shí)驗(yàn)數(shù)據(jù)集由相同數(shù)量的經(jīng)營不佳和良好企業(yè)組成,本文通過償債能力指標(biāo)——利息保障倍數(shù)等同時兼顧各個行業(yè)來選擇償債能力最好的72家公司與之匹配形成本文樣本公司,這可以避免樣本數(shù)據(jù)集有偏差現(xiàn)象。本文在全部數(shù)據(jù)集中隨機(jī)抽取其中70%的數(shù)據(jù)作為訓(xùn)練集,剩余30%的數(shù)據(jù)作為測試集。

      本文參照張輝和趙秋紅(2013)[11],通過主成分分析方法(Principal Component Analysis,PCA)進(jìn)行降維處理,對企業(yè)的盈利能力、長期償債能力、短期償債能力和運(yùn)營能力綜合考察,選擇變量:(1)ROA(Return on Assets)—總資產(chǎn)凈利潤率;(2)ROS (Return on Sales)—營業(yè)凈利率;(3)ICR(Interest Coverage Ratio)—利息保障倍數(shù);(4)DAR (Debt Asset Ratio)—資產(chǎn)負(fù)債率;(5)LLR(Long-term Liability Rate)—長期資本負(fù)債率;(6)LR(Liquid Ratio)—流動比率;(7)QR(Quick Ratio)—速動比率;(8)CR(Cash Ratio)—現(xiàn)金比率;(9)AT(Total Assets Turnover)—總資產(chǎn)周轉(zhuǎn)率;(10)WCT(Working Capital Turnover)—營運(yùn)資金周轉(zhuǎn)率;(11)LD(Loan Defaults)—企業(yè)貸款違約(經(jīng)營狀況好的企業(yè)記為1,經(jīng)營狀況不好的企業(yè)記為-1)。其中,ST公司判別來自Wind數(shù)據(jù)庫,上市公司相關(guān)比率數(shù)據(jù)來自CSMAR數(shù)據(jù)庫。相關(guān)變量選擇及其定義見表1,相關(guān)變量描述性統(tǒng)計見表2。

      表1 變量的選擇

      表2 主要代理變量的描述性統(tǒng)計

      (三)實(shí)驗(yàn)結(jié)果分析

      如前文所述,本文將樣本數(shù)據(jù)集隨機(jī)抽取其中70%作為訓(xùn)練集,目的是為了建立支持向量機(jī)(SVM)模型,而將剩余30%作為測試集,目的是為了測試模型預(yù)測準(zhǔn)確性以評價模型是否準(zhǔn)確。然而,在支持向量機(jī)模型中,損失函數(shù)決定著什么樣的模型是好的模型,因此對整個模型的影響十分巨大。本文使用十折交叉檢驗(yàn)來確定支持向量機(jī)模型中的損失懲罰參數(shù)C以及核函數(shù)的參數(shù)。非線性SVM的核函數(shù)通常有多項式核、徑向基核 (Radial Basis Function,簡記為RBF),本文使用兩種核函數(shù)并對兩種不同核函數(shù)建立的SVM模型進(jìn)行比較和評價。最后,再使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,以比較分析SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型在預(yù)測銀行信用風(fēng)險上的優(yōu)劣。本文使用R軟件的e1071包中的SVM函數(shù)進(jìn)行SVM建模,并使用tune.svm函數(shù)自動實(shí)現(xiàn)十折交叉檢驗(yàn),得到最佳損失懲罰參數(shù)C=100,核函數(shù)參數(shù)gamma=3,再使用R軟件中的nnet包中的nnet函數(shù)實(shí)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)建模。得到結(jié)果如表3所示。

      表3 SVM和BPN分類準(zhǔn)確性比較

      從表3中可以看出,一般情況下,預(yù)測商業(yè)銀行信用風(fēng)險時,SVM模型和BPN模型的預(yù)測精度都在可接受范圍內(nèi),使用SVM模型的預(yù)測準(zhǔn)確度要高于使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測時的準(zhǔn)確度,而同樣使用SVM模型時,徑向基核比多項式核預(yù)測結(jié)果更加準(zhǔn)確,并且多項式核函數(shù)SVM在計算機(jī)領(lǐng)域訓(xùn)練所需時長也要多于徑向基核函數(shù)SVM,即相對于徑向基核函數(shù)SVM,多項式核函數(shù) SVM 性能要差些(Tay&Cao,2001;Huang et al.,2004)[12,13]。

      四、結(jié)論與啟示

      本文與以往銀行信用風(fēng)險預(yù)測文章中使用傳統(tǒng)logistic回歸、多元判別分析方法等、單一使用SVM方法不同,使用并比較兩種不同的人工智能的方法:SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型,并結(jié)合使用PCA方法進(jìn)行變量降維處理,通過對2015-2016年間的我國144家滬深兩市上市公司進(jìn)行研究預(yù)測,得到了以下結(jié)論:第一,SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型都具有良好的預(yù)測能力。第二,相比于多項式函數(shù)SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型,徑向基核函數(shù)SVM的預(yù)測準(zhǔn)確性最佳。由于BPN學(xué)習(xí)模型有其固有的一些限制,并且SVM模型能將復(fù)雜的分類問題轉(zhuǎn)化為簡單以解決的分類問題,是一個性能更佳且預(yù)測能力更強(qiáng)的模型。因此,相信在人工智能時代背景下,SVM模型這種機(jī)器學(xué)習(xí)方法將會取代一些傳統(tǒng)的方法或者與傳統(tǒng)分類方法結(jié)合使用來預(yù)測銀行信用風(fēng)險。本文研究成果有助于銀行更好地判斷自身的信用風(fēng)險情況。值得指出的是,本文將SVM模型運(yùn)用于商業(yè)銀行信用風(fēng)險預(yù)測上,其實(shí),如企業(yè)破產(chǎn)預(yù)測、銀行信用評級、銀行客戶獲得預(yù)測等金融領(lǐng)域以及相關(guān)金融風(fēng)險管理領(lǐng)域也都能使用SVM模型進(jìn)行問題分析與解決。因此,本文研究成果的啟示性意義十分巨大,可被各行各業(yè)所借鑒。

      另外,需要指出的是,SVM模型進(jìn)行預(yù)測時有其固有的一些不足之處,如在預(yù)測銀行信用風(fēng)險或企業(yè)破產(chǎn)預(yù)測時,只能判斷企業(yè)是否會破產(chǎn),不能用來估計相關(guān)的概率,可能需要結(jié)合其他方法進(jìn)行綜合評估。

      猜你喜歡
      超平面信用風(fēng)險分類器
      全純曲線的例外超平面
      涉及分擔(dān)超平面的正規(guī)定則
      以較低截斷重數(shù)分擔(dān)超平面的亞純映射的唯一性問題
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      淺析我國商業(yè)銀行信用風(fēng)險管理
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      京東商城電子商務(wù)信用風(fēng)險防范策略
      個人信用風(fēng)險評分的指標(biāo)選擇研究
      分擔(dān)超平面的截斷型亞純映射退化性定理
      特克斯县| 朔州市| 广南县| 阿合奇县| 阜平县| 临泉县| 高邮市| 兴山县| 高密市| 娄底市| 五指山市| 攀枝花市| 兴义市| 南郑县| 祁连县| 吴忠市| 巨鹿县| 五原县| 武强县| 新源县| 和田市| 威信县| 桂阳县| 清流县| 手游| 汶川县| 江城| 定襄县| 民勤县| 正阳县| 奇台县| 桂阳县| 甘谷县| 太仆寺旗| 锡林浩特市| 伊吾县| 乐昌市| 阜宁县| 荆门市| 连平县| 彰化县|