程冬民,彭 雷
(1.山東財經大學馬克思主義學院,山東濟南 250014;2.山東臨朐中國建設銀行,山東臨朐 262600)
商業(yè)銀行的信用風險管理一直是人們關注的焦點,在商業(yè)銀行建立后的幾百年里,盡管人們幾乎采用了各種方法對信用風險進行判別和控制,但是現有的信用風險評估模型因為自身的局限仍然難以適應非線性風險的復雜性。因此,構建具有較強的逼近非線性函數的信用風險模型具有重要現實意義和應用價值。
1990年Odom&Sharda[1]建立神經網絡模型并運用該模型對銀行破產進行了考察,開創(chuàng)了神經網絡應用于信用風險管理的先河。此后Tam&Kiang[2](1991)使用神經網絡信用風險評估模型對企業(yè)的財務指標信用評分的研究,以及Altman&Macro[3](1994)對意大利財務危機的預測,Kiviluoto[4](1998)用自組織神經網絡和學習向量機(Learning Vector Quantization,LVQ),Salchenberger[5](1992)使用神經網絡系統(tǒng)和LR對于信用風險管理進行的比較,都說明了神經網絡在處理非線性問題方面的優(yōu)勢。但是他們對于神經網絡只是停留在使用的層面上,沒有進一步的探尋優(yōu)化神經網絡的方法。
隨著神經網絡在信用風險管理上的應用,許多學者逐漸認識到神經網絡在處理財務數據時存在的問題,因而在數據的處理上或是在方法的優(yōu)化上做出了很大的努力。Back[6](1996)等建議用遺傳算法與神經網絡結合起來協(xié)同工作,Piramuthu[7](1998)等采用符號特征樣本的技術處理輸入數據都取得了較為明顯的效果。國內學者在引進神經網絡以后,也為神經網絡模型的優(yōu)化進行了卓有成效的努力。如許佳娜、西寶[8](2004)采用層次分析法對神經網絡模型的改進,以及郭英見、吳沖[9](2009)采用DS證據理論將神經網絡和SVM的輸出結果進行的融合,都在一定程度上增強了神經網絡模型的判別準確率,但他們在神經網絡的權值設定上仍然沒有找到很好的設定規(guī)則。
本文從理論層面闡述了可以應用于商業(yè)銀行信用風險管理的BP-Adaboost強分類器信用風險管理模型,并以2012年350家上市公司的財務數據為樣本基礎,考察了該系統(tǒng)應用于商業(yè)銀行信用風險管理的可行性,并比較了該模型與原有的BP神經網絡系統(tǒng)的優(yōu)劣。最后對該系統(tǒng)在商業(yè)銀行的應用前景進行了分析評價。
在人工神經網絡(Artificial Neural Network,ANN)中根據信息流向和網絡的拓撲結構,可以將ANN分為前饋網絡和反饋網絡兩大類。反向傳播(Back Propagation,BP)網絡(如圖1)就是一種多層前饋神經網絡,采用誤差反向傳播算法(Error Back-propagation Algorithm,簡稱BP算法),是目前應用最廣泛的一種神經網絡。但是根據之前較多學者的研究結果,BP神經網絡卻難以克服特征記憶無選擇性的缺點,導致訓練好的分類器系統(tǒng)分類可信度受到影響。而Adaboost算法以多次迭代算作為運算核心思想,可以提取有效分類信息并進行迭代運行,從而可以起到優(yōu)化BP神經網絡的效果。
BP-Adaboost強分類器模型的構建是在基于BP(Back Propagation,BP)神經網絡的弱分類器基礎之上,通過加入Adaboost算法,構建一種更為高級的分類器系統(tǒng),從而對神經網絡系統(tǒng)特別是BP神經網絡系統(tǒng)的分類以及特征記憶能力給予很好的優(yōu)化。具體來講,其核心思想即:針對同一個訓練集訓練不同的分類器(弱分類器),然后把這些弱分類器集合起來,構成一個更強的最終分類器(強分類器)。對于弱分類器中分類誤差較大的訓練數據組調整并給予更大的權重,然后重新予以訓練,直到取得較好的訓練效果。每個分類函數都有一個權重,分類越好的函數,對應的權重就越大。經過多次迭代以后,最終的強分類器由各個弱分類器加權得到。BP-Adaboost模型把BP神經網絡作為弱分類器,反復訓練BP神經網絡的預測輸出,通過Adaboost算法把得到的多個BP神經網絡弱分類器組成一個強分類器。
在模型的初始設計基本完成后,需要將經過篩選和處理的數據輸入到模型當中進行模型的訓練和記憶,并不斷調整原有參數的設置,這樣才能夠訓練出符合分類標準的模型。
1.樣本數據財務指標的選取
在進行模型的初始處理時,需要選取多少樣本數據,以及選擇樣本數據中的哪些指標進行系統(tǒng)訓練都會影響系統(tǒng)訓練的準確性。樣本選取太多,雖然能在一定程度上增強系統(tǒng)的泛化能力,但又會使系統(tǒng)對稀少特征失靈[10]。本文在進行數據選擇時,總結了在神經網絡信用風險研究領域取得過一定學術成果的專家的研究成果,并以現行商業(yè)銀行進行信用風險評估的數據指標為基礎,共收集了2012年350家上市公司的財務數據,這其涵蓋了房地產、醫(yī)藥、機械、化學化工、有色金屬行業(yè)、煤炭、鋼鐵等幾個較大的板塊,沒有包含銀行和券商等金融板塊的上市公司。其中ST公司80家,正常上市公司270家。對這350家公司在其營業(yè)能力、現金流量、營運能力、發(fā)展能力、風險水平、償債能力六大類數據指標的基礎上,共收集了35個財務數據指標。
由于企業(yè)的財務數據指標之間不可能完全獨立,而且數據之間存在多重共線性的可能性較大,因而較多的數據指標“必然會使提供的數據發(fā)生重疊,甚至會抹殺事物的真正特征”[11]且較多的指標會造成系統(tǒng)構建的復雜,因而本文在進行數據預處理的時候采用主成分分析,選取其中能夠最大程度體現樣本特征的數據作為系統(tǒng)訓練和預測樣本。
經過主成分分析,保留方差累計貢獻率大于85%的主成分得到以下指標:營業(yè)利潤率、凈資產收益率、資產報酬率、現金流量比、資本支出折舊比存貨周轉率、營業(yè)收入增長率、總資本增長率、營業(yè)收入增長率、財務杠桿系數、速動比率、現金比率、產權比率、成本費用率等13個主成分指標。根據主成分負荷矩陣可以了解主成分與原始數據指標的相關關系。
2.異常財務數據指標的處理
由于目前部分公司在進行貸款評估時,為了提高授信級別,會采用虛假的財務數據報告。這種虛假表現出上市公司提供的財務數據指標不正常。財務數據指標異常模式通常以統(tǒng)計異常模式和專家知識異常模式兩種方式出現在商業(yè)銀行信用風險的評估當中。統(tǒng)計異常模式是指個體過度偏離整體的數據行為,如某個企業(yè)的現金流量通過不斷的現金交易而虛增,某企業(yè)以虛構資產結構的形式改變資產負債率等等。統(tǒng)計模式異常體現在財務數據報告中的數據特征明顯偏離正常的行業(yè)品均數據水平,在進行統(tǒng)計模式異常的檢驗時,通常以行業(yè)平均水平與樣本數據的波動率為比較標準,如果與計算的行業(yè)平均指標嚴重偏離,則可認為存在統(tǒng)計模式異常。專家知識異常模式是指違約企業(yè)利用尋機性會計進行財務粉飾,其中包括對企業(yè)償債能力、現金及可變現資產的流動性以及企業(yè)獲利能力的粉飾。對于異常財務指標,本文在進行信用風險預測模型訓練前,通過設定的數據識別系統(tǒng)進行異常數據指標的識別和清除。這樣,就可以使得為了進行模型訓練的而輸入到初始樣本集中的數據在一定程度上的準確性,從而減少財務數據指標不正常系統(tǒng)初始設置給企業(yè)帶來的誤差。
本文在對財務數據指標進行預處理時,對于統(tǒng)計異常模式,以某行業(yè)的多數正常企業(yè)的均值與波動率之比確定隸屬函數[12],以該函數提出異常企業(yè)的財務數據指標。通過較為固定的計算方式考察該企業(yè)的財務數據指標是否可以作為模型訓練樣本。對于專家知識異常模式,本文主要參照同類文獻的處理方法,以某行業(yè)某公司長期的年報數據為參考進行判斷,從而避免納入異常財務指標。
作為學習樣本來講,樣本選取最有利的原則就是既要滿足系統(tǒng)平穩(wěn)發(fā)展的要求,又要使系統(tǒng)能夠體現突變的特征,能夠準確概括輸入數據的一般性和特殊性。在本文中,筆者將350家樣本中的240家財務狀況良好的公司數據樣本以及60家ST公司的數據樣本作為訓練數據;以剩余50家企業(yè)的財務數據樣本作為預測樣本。輸出結果為布爾型離散變量1和0,對應輸出結果為“正?!?、“違約”。
在以上設計的基礎上,我們利用Matlab設計了一個系統(tǒng)對上述程序進行仿真。網絡拓撲結構可由用戶根據需要來確定,網絡的隱含層數及節(jié)點數可以根據用戶的需要和實際情況來確定,學習因子和動量因子都是根據需要通過鍵盤輸入確定,使一個程序能夠實現多個研究項目共享同一套程序代碼。另外,我們將初始權值、學習好的權值、訓練數據集、測試數據集、應用數據集等數據分別建立文件。樣本學習只需進行一次,學習成功后將學習好的權值保存到文件中,測試和實際應用時直接調用已學習好的權值和數據文件。如果系統(tǒng)有較大變動,使不同信用公司的財務比率特征有新的差異,這時可重新選擇樣本,并進行成功學習后,模型又可投入使用。從這種意義上說,本模型屬動態(tài)可調整模型,具有良好的適應性。對于兩種分類預測模型的預測結果比較,筆者在文中通過考察收斂速度和判誤率等指標進行比較。
對于單隱層的BP-Adaboost模型,由于網絡層次設置的不同特別是隱含層數節(jié)點數會對模型的收斂效率和準確率產生影響,因而在本文中筆者嘗試采用不同的隱含成節(jié)點數構建系統(tǒng),通過實證結果比較采用不同隱含層節(jié)點數設置時模型的仿真結果(見表1)。
由表1可以看出,在采用不同隱含層節(jié)點數構建系統(tǒng)時,系統(tǒng)的仿真結果會產生大小不同的誤差。根據前人在進行神經網絡的研究時得到的結果,隱含層節(jié)點數不宜采用超過輸入數據指標的個數,否則會造成模型泛化能力的降低。本文沿襲了這一規(guī)律進行模型的設定和構建,因而本文對于超過14的節(jié)點數,沒有考慮進行模型的仿真模擬。同時,系統(tǒng)隱含層節(jié)點書如果少于系統(tǒng)的層次設定數量,也會造成模型對于數據指標的特征抽取能力過弱,所以對于小于4的節(jié)點數,本文同樣沒用納入模型的仿真處理。而且隨著隱層節(jié)點數逐漸接近于樣本維數,系統(tǒng)對于訓練樣本進行判別時所產生的第一類錯誤和第二類錯誤[13]都呈現逐漸減少的趨勢。隱含層節(jié)點數到達10以后,兩類錯誤的判別出現率幾乎降低為零。同樣,對于預測樣本而言,也呈現了同樣的變化趨勢。
表1 不同隱含層節(jié)點數系統(tǒng)誤差一覽表
由此可以看出,在不斷增進隱含層節(jié)點數至樣本維數的情況下,模型對于樣本的泛化能力有了較為明顯的提高。但是在提高模型運算精度的時候,需要將模型的收斂速度考慮到其中。由于系統(tǒng)在隱含層節(jié)點數達到13的時候系統(tǒng)誤差達到了一個較為理想的判誤比率水平,因而本文將隱含層節(jié)點數設定為13進行初始系統(tǒng)的構建。通過預測樣本的輸入訓練、BP系統(tǒng)自身的回饋調整以及Adaboost算法的加權優(yōu)化,本文得到了強弱預測器對預測樣本的處理結果對比(見圖1)。
可以看出,在50個預測樣本輸入到模型當中以后,在BP神經網絡中兩個樣本的預測結果的誤差值都降低到了極低的水平,這也再次說明了采用13的隱含層節(jié)點數設置是符合本文所選定的財務數據指標的要求的。但是可以看出,經過Adaboost算法優(yōu)化后的強預測器卻實現了比原有BP神經網絡更好的分類預測要求。對于圖1中體現的序列15左右的樣本,可能是由于數據預處理工作中出現的正常誤差,沒有剔除個別行業(yè)的異常數據造成的。同時,經濟形式的變化、行業(yè)發(fā)展形勢的差別也會造成一定波動。
圖1 單隱層模型強弱分類器預測誤差比較
為進一步驗證Adaboost算法BP神經網絡系統(tǒng)的改進,本文嘗試考察雙隱含層模型的分類效果對比。與之前的模型設置類似,只需要在隱含層之后再加入一道隱含層,其他的參數設置如節(jié)點數,迭代算法等,本文仍然采用與單一隱含層模型相同的設置。將預測樣本輸入到模型當中以后,得到的強弱預測器的預測結果如下(見圖2)。
可以看出與單一隱含層強弱預測器比較,雙隱含層預測器的對預測樣本的考察結果具有較大的不穩(wěn)定性,誤差的絕對值范圍有了較為明顯的變大趨勢。
圖2 雙隱層模型強弱分類器預測誤差比較
這也從實證中驗證了“理論上講增加隱含層數可以提高網絡的預測精度”這一前人的判斷是不準確的。Lippman R P[14](1997)曾經指出,一定條件下,對于較小規(guī)模的網絡,增加隱含層數并不能提高網絡的預測準確率;利用單一的三層神經網絡可以逼近任意較為簡單的映射關系。比較強弱預測器的預測結果,可以得出同樣的結論:Adaboost算法以其加權和注重重點的優(yōu)勢,可以較為準確的判斷出那些樣本特征是在企業(yè)貸款違約中起到較為明顯作用的重點。雖然我們看不見重點,卻可以將判斷企業(yè)貸款違約的這個“黑盒子”進一步優(yōu)化。
就以上實證結果進行分析可以看出,采用Adaboost算法對原有BP神經網絡進行優(yōu)化以后,可以在較大程度上提高商業(yè)銀行信用風險評估系統(tǒng)的準確率,提高系統(tǒng)的判別精度。同時,本文中筆者還進行了相關收斂速度的考察,得出BP-Adaboost強分類器在提高模型預測精度的同時,并沒有在很大程度上影響模型的收斂速度。
本文的研究,在一定程度上為商業(yè)銀行信用風險管理模型的改進提供了一種改進的可能。在目前國內多家多有商業(yè)銀行仍然使用以Logitech模型為基礎的信用風險評估系統(tǒng)的情況下,一種符合非線性數據特征的模型亟待浮出水面。與現行信用風險評估模型相比較,BP-Adaboost模型的優(yōu)點體現在以下幾個方面:第一,非線性擬合的特點可以更準確的識別客戶財務數據的特征,從而避免在進行信用風險評估時的偏差;第二,多重數據的特征通過不通的網絡層次設置,也可以避免單純采用加權平均得分帶來的單一性,使得信用風險評估所帶來的結果具有說服力;第三,BP-Adaboost強分類器信用風險評估模型中參數的設置比較靈活,可以將代表不同時期經濟發(fā)展特征因素添加進去,增加了與時俱進的因素。
當然,由于模型的效果只是基于理論上的探討,還有經過實踐徹底的檢驗,所以在各個商業(yè)銀行考慮進行基于該模型的商業(yè)銀行信用風險系統(tǒng)的開發(fā)時,也需要考慮到自身模型的發(fā)展階段與該模型的差距,如何利用已有的數據庫模式充分的訓練該模型的準確性和收斂性,以及自身客戶所具備的實際條件和財務數據狀況。
[1]OdomM D,Sharda R A.Neural Network for Bankruptcy Prediction,International Joint Conference on Neural Network[R].San Diego,CA,1990:163-168.
[2]TamK Y,Kiang M.Managerial Applications of Neural Networks,the Case of Bank Failure Predictions[J].Management Sciences,1987,vol.38(l):926-947.
[3]Altman E.Marco Getal.Corporrate distress diagnosis:comparisons using linear discriminant analysis and neural networks(the Italian experience)[J].Journal of Bank-ing and Finance,1994(18):511-540.
[4]Kiviluoto K.Predicting Bankruptcies with the Self-organizing Map [J].Neurocomputing 1998(21):199-201.
[5]Salchenberer L M,Ciner E M,Lash N A.Neural Networks:A New Tool for Predicting Thrift Failu-res[J].Decision Sciences,1992(23):899-916.
[6]Back B,Laitinen K.Sere.Neural networks and genetic algorithms for ankruptcypredictions[J].Expert Syst.,1996(4):407-413.
[7]Piramuthu S,Raghavan H,Shaw M.Using feature construction to improve the Performance of neural network[J].Management Science,1998(44):416-430.
[8]徐佳娜,西 寶.基于HAP-ANN模型的商業(yè)銀行信用風險評估[J].哈爾濱理工大學學報,2004(6):94-95.
[9]郭英見,吳 沖.基于信息融合的商業(yè)銀行信用風險評估模型研究[J].金融研究,2009(1):95-106.
[10]于立勇.商業(yè)銀行信用風險評估預測模型研究[J].管理科學報,2003,6(5):46-52.
[11]高鐵梅.計量經濟分析方法與建模[M].北京:清華大學出版社,2005:465-466.
[12]張德峰.MATLAB神經網絡仿真與應用[M].北京:電子工業(yè)出版社,2009:320-321.
[13]Tam K.Neural Network Models and the Prediction of Bankruptcy[J].omega,1991,vol.119(19):429-445.
[14]Stanley B.Lippman,C++Primer(3RD)[M].北京:人民郵電出版社,2006:145-146.