姚慧敏
(山西晉路道生實業(yè)有限公司 山西省太原市 030000)
當(dāng)前影響商業(yè)銀行發(fā)展的關(guān)鍵因素就是企業(yè)客戶失信,不良貸款給商業(yè)銀行帶來了較大的經(jīng)濟(jì)損失,增大了銀行業(yè)信用風(fēng)險,因此對企業(yè)客戶的信貸風(fēng)險進(jìn)行有效評估、預(yù)測具有重要意義,能夠顯著增強(qiáng)商業(yè)銀行風(fēng)險管控能力。隨著大數(shù)據(jù)時代的到來,商業(yè)銀行可以充分發(fā)揮大數(shù)據(jù)算法的優(yōu)勢,對企業(yè)客戶資料信息進(jìn)行全面的搜集、審核,依托大數(shù)據(jù)技術(shù)開展企業(yè)客戶信息分析、建模操作,并構(gòu)建企業(yè)客戶信貸風(fēng)險評價模型,由此能夠顯著降低商業(yè)銀行不良貸款問題,這對企業(yè)信貸風(fēng)險管理能力和的提升和持續(xù)發(fā)展均有很大的幫助。
基于大數(shù)據(jù)算法下,對商業(yè)銀行企業(yè)客戶信貸風(fēng)險評價模型進(jìn)行構(gòu)建的過程中,會應(yīng)用到數(shù)據(jù)挖掘模型,包括:支持向量機(jī)、多元判別分析法、神經(jīng)網(wǎng)絡(luò)模型、Logistic 回歸模型及決策樹模型等。不同模型的用途和功能有所差異,由于商業(yè)銀行面向的是企業(yè)用戶,所以應(yīng)對合理模型進(jìn)行選取。
(1)支持向量機(jī)。作為模式識別領(lǐng)域內(nèi)的全新工具,支持向量機(jī)在二分類、模式識別、回歸分析等方面有著廣泛運(yùn)用,其作為經(jīng)典監(jiān)督學(xué)習(xí)模型,建立在統(tǒng)計學(xué)習(xí)理論的基礎(chǔ)之上,有效彌補(bǔ)了經(jīng)典學(xué)習(xí)法的弊端,例如:局部極小、維數(shù)災(zāi)難等[1]。即使樣本較小,支持向量機(jī)也擁有較強(qiáng)泛化能力,然而也存在模型性能同參數(shù)值選擇質(zhì)量密切相關(guān)的問題,無法有效處理大量數(shù)據(jù),會懲罰不正確參數(shù);
(2)多元判別分析法。建立在財務(wù)比率前提下的多元辨別分析法,屬于多變量統(tǒng)計模型,可以結(jié)合辨別函數(shù)對指標(biāo)進(jìn)行運(yùn)算,并有效分類處理判別指標(biāo)。該模型規(guī)定數(shù)據(jù)必須達(dá)到下述標(biāo)準(zhǔn):不同組數(shù)據(jù)協(xié)方差一致、服從正態(tài)分布、已明確相關(guān)參數(shù),其中參數(shù)包括:判別代價、先驗概率、均值向量等,所以該模型應(yīng)用范圍有限;
(3)神經(jīng)網(wǎng)絡(luò)模型。該模型主要構(gòu)成是處理單元,對人的大腦神經(jīng)系統(tǒng)進(jìn)行了簡化抽象模擬和建模處理,屬于特殊并行分布式處理器,擁有很多連接,且可以借助學(xué)習(xí)的方式來掌握知識,從而有效解決問題。該模型具有多方面的優(yōu)勢,例如:自適應(yīng)和自學(xué)習(xí)能力較強(qiáng),神經(jīng)網(wǎng)絡(luò)能夠?qū)ξ粗到y(tǒng)進(jìn)行處理;非線性模擬能力較強(qiáng),屬于一種非線性模型;對數(shù)據(jù)分布沒有要求,無需對自變量、因變量函數(shù)關(guān)系進(jìn)行描述,也不要求組間協(xié)方差一致;可以對定性變量進(jìn)行處理,信息綜合能力優(yōu)越,非常適用于不確定、繁瑣非線性目標(biāo)[2]。然而神經(jīng)網(wǎng)絡(luò)模型也存在一定不足,即:需耗時開展權(quán)重學(xué)習(xí),存在反復(fù)循環(huán)狀況;無法獲取直觀解答,要由專業(yè)人士開展研究和定義,對其他人而言有著較高要求;獲取權(quán)重的過程非常不容易結(jié)實,且比較繁瑣。
(4)Logistic 回歸模型。作為多元回歸模型,Logistic 回歸模型適用于非正態(tài)分布,且數(shù)據(jù)相應(yīng)變量值非連續(xù)性的狀況,規(guī)定因變量Y 應(yīng)為二元變量,數(shù)值是0、1。明確自變量X 時,因變量于特定水平中取值為1 的概率就是其條件期望,該模型廣泛應(yīng)用在分類問題中,具有良好的穩(wěn)健性、準(zhǔn)確性。然而該模型嚴(yán)格規(guī)定著樣本質(zhì)量、容量,預(yù)測結(jié)果概率轉(zhuǎn)化為S 型,為非線性過程,可能會出現(xiàn)預(yù)測結(jié)果不夠準(zhǔn)確的問題。
(5)決策樹模型。運(yùn)用該模型進(jìn)行建模的過程中,根節(jié)點(diǎn)涵蓋了所有數(shù)據(jù),需要結(jié)合指標(biāo)對最優(yōu)變量進(jìn)行探尋,參考該變量值的特定條件,將數(shù)據(jù)劃分為數(shù)據(jù)子集(≥2 個),不斷重復(fù)直至符合提前設(shè)定條件即可停止,可以獲得倒著的樹形圖[3]。在回歸、分類問題的處理中都會應(yīng)用決策樹模型,鑒于該模型在重復(fù)迭代過程中很容易因為較小的數(shù)據(jù)變化而出現(xiàn)差異化的分支結(jié)果,所以存在穩(wěn)定性差、方差較大的問題,
針對商業(yè)銀行企業(yè)客戶信貸風(fēng)險評價問題,綜合分析各方面要素,可以依托神經(jīng)網(wǎng)絡(luò)模型對信貸風(fēng)險評價體系進(jìn)行構(gòu)建,以此來提高商業(yè)銀行的信貸風(fēng)險管理水平。
神經(jīng)網(wǎng)絡(luò)一般包括輸入層、隱含層、輸出層,其中輸入層負(fù)責(zé)傳輸信號,隱含層可以通過非線性函數(shù)、線性函數(shù)進(jìn)行傳遞,輸出層發(fā)揮著線性加權(quán)功能。各網(wǎng)絡(luò)結(jié)點(diǎn)代表獨(dú)立神經(jīng)元,傳遞函數(shù)一般都為Sigmoid 型函數(shù)。各對神經(jīng)元間均對加權(quán)系數(shù)進(jìn)行了連接,能夠?qū)ι舷聜鬏數(shù)膬蓚€神經(jīng)元的刺激進(jìn)行減弱、強(qiáng)化處理。所取加權(quán)系數(shù)一般是權(quán)值,權(quán)值的修改規(guī)則叫做權(quán)值算法。專家系統(tǒng)構(gòu)建在BP 神經(jīng)網(wǎng)絡(luò)的前提下,可以結(jié)合特定算法來學(xué)習(xí)樣本數(shù)據(jù),對網(wǎng)絡(luò)權(quán)值進(jìn)行明確,輸入信息、理想輸出共同構(gòu)成了樣本[4]。若網(wǎng)絡(luò)實際輸出、理想輸出相同的情況下,代表完成訓(xùn)練,反之則應(yīng)對閾值、權(quán)值進(jìn)行合理的調(diào)整,確保網(wǎng)絡(luò)輸出同期望輸出相統(tǒng)一,由此能夠提高自適應(yīng)能力和自學(xué)習(xí)能力。若完成神經(jīng)網(wǎng)絡(luò)訓(xùn)練,那么能夠運(yùn)用到商業(yè)銀行企業(yè)客戶信貸風(fēng)險評價工作中。本研究所選取的是BP 神經(jīng)網(wǎng)絡(luò),在此基礎(chǔ)上構(gòu)建了商業(yè)銀行企業(yè)客戶信貸風(fēng)險評價模型,詳如圖1 所示。
圖1:基于神經(jīng)網(wǎng)絡(luò)的商業(yè)銀行信貸風(fēng)險評價模型
表1:定性評價指標(biāo)的評價標(biāo)準(zhǔn)
基于神經(jīng)網(wǎng)絡(luò)的商業(yè)銀行信貸風(fēng)險評價模型在明確指標(biāo)值、歸一化處理方面:對于多項商業(yè)銀行信貸風(fēng)險指標(biāo),可以劃分為定量、定性兩類。因為各項指標(biāo)基于差異化的角度對商業(yè)銀行企業(yè)客戶信貸風(fēng)險活動能力進(jìn)行了體現(xiàn),指標(biāo)量綱存在差異,因此不能開展比較工作[5]。所以要想明確最終評價值,要定量化處理定性指標(biāo),可以借助專家打分法,選取0-100 的分值,定性評價指標(biāo)的評價標(biāo)準(zhǔn)分值詳見表1 所示。
此外,還要兼顧神經(jīng)網(wǎng)絡(luò)訓(xùn)練收斂問題,借助無量綱歸一化處理指標(biāo)的方式,有效降低指標(biāo)量綱干擾,歸一化處理公式如下:
選取某省多家商業(yè)銀行,掌握和分析銀行企業(yè)客戶經(jīng)營、貸款等各方面的狀況,在深入了解企業(yè)客戶貸款信息的基礎(chǔ)上,開展實地走訪調(diào)查,借助網(wǎng)絡(luò)途徑來搜索企業(yè)財務(wù)報表資料,統(tǒng)一匯總、整理銀行企業(yè)客戶的財務(wù)數(shù)據(jù),特征變量即所涵蓋的指標(biāo)為17 個,企業(yè)存在還貸不及時違約狀況與否表示響應(yīng)變量,為y。進(jìn)而,開展建立商業(yè)銀行神經(jīng)網(wǎng)絡(luò)信貸風(fēng)險評價模型操作之前,應(yīng)對樣本數(shù)據(jù)開展預(yù)處理,需要?dú)w一化處理相關(guān)數(shù)據(jù)信息。數(shù)據(jù)歸一化處理主要指的是將全部數(shù)據(jù)進(jìn)行[0,1]范圍內(nèi)數(shù)值的轉(zhuǎn)化,有效消除不同維度數(shù)據(jù)在數(shù)量級方面的差異,減少數(shù)據(jù)在輸入、輸出過程中由于數(shù)據(jù)量級差距大而出現(xiàn)過大網(wǎng)絡(luò)預(yù)測誤差問題的發(fā)生幾率。
本研究主要通過R 語言來構(gòu)建商業(yè)銀行神經(jīng)網(wǎng)絡(luò)信貸風(fēng)險評價模型,主要運(yùn)用的是nnet 軟件包。在對單隱藏層前饋神經(jīng)網(wǎng)絡(luò)模型進(jìn)行建立時,借助nnet ()函數(shù),包括了兩大不同的模式,分別為:結(jié)合已知數(shù)據(jù)構(gòu)建模型、參考既定公式構(gòu)建模型??梢圆扇‰S機(jī)的方式對數(shù)據(jù)集進(jìn)行測試集、訓(xùn)練集的劃分,前者為30%數(shù)據(jù),而后者為70%數(shù)據(jù)。對R 代碼進(jìn)行運(yùn)行的過程中,能夠獲得三層網(wǎng)絡(luò)結(jié)構(gòu),其中輸出層是兩個節(jié)點(diǎn)、隱含層是八個節(jié)點(diǎn)、輸入層是十七個節(jié)點(diǎn)。該模型的權(quán)值衰減參數(shù)是1e- 05,迭代次數(shù)是627 步,此時網(wǎng)絡(luò)相對穩(wěn)定,為收斂狀態(tài),且實際數(shù)值同預(yù)測數(shù)值二者的相關(guān)系數(shù)為0.8524。由此體現(xiàn)出基于BP 神經(jīng)網(wǎng)絡(luò)構(gòu)建的商業(yè)銀行信貸風(fēng)險評價模型預(yù)測效果較好。
對于商業(yè)銀行企業(yè)客戶神經(jīng)網(wǎng)絡(luò)信貸風(fēng)險評價模型的評價:
(1)該模型預(yù)測的準(zhǔn)確性較高。完成信貸風(fēng)險評價模型構(gòu)建工作之后,通過 predict()函數(shù)開展預(yù)測測試集的操作。本研究的測試集中共涵蓋的企業(yè)共為46 家,信用較差的企業(yè)為8 家,該模型所預(yù)測的不良信用企業(yè)為6 家,其中2 家被誤判為擁有良好信用的企業(yè);信用較好的企業(yè)共38 家,評價模型通過預(yù)測所判定的信用較差的企業(yè)為1 家,預(yù)測信用情況準(zhǔn)確的企業(yè)共37 家,模型預(yù)測的正確判斷率達(dá)到了72.4%,錯誤判斷率是27.6%,因此模型預(yù)測明確程度較高。因此實際運(yùn)用信貸風(fēng)險評價模型的過程中,借助神經(jīng)網(wǎng)絡(luò)對企業(yè)客戶信用進(jìn)行預(yù)測的實用性較強(qiáng),且最終預(yù)測結(jié)果能夠基本反映出企業(yè)客戶的實際信用狀況。
(2)該模型應(yīng)用的進(jìn)一步展望。商業(yè)銀行神經(jīng)網(wǎng)絡(luò)信貸風(fēng)險評價模型具有較高的預(yù)測準(zhǔn)確性,但是也有一些不足,有待進(jìn)一步的完善和健全。在對神經(jīng)網(wǎng)絡(luò)信貸風(fēng)險評價模型進(jìn)行建立時,因為需要獲取企業(yè)相關(guān)數(shù)據(jù)信息,所以選取樣本量不大,同銀行所掌握數(shù)據(jù)總量相差較大[6]。同時,本研究應(yīng)用到17 項企業(yè)特征變量,同商業(yè)銀行對企業(yè)客戶信用開展評估時所選取的指標(biāo)不可能完全相同。商業(yè)銀行借助此信貸風(fēng)險評價模型開展時間評估工作時,可以調(diào)用數(shù)據(jù)庫內(nèi)的全部數(shù)據(jù)信息,所以可以有效增強(qiáng)預(yù)測精確程度。大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,使商業(yè)銀行可以借助網(wǎng)絡(luò)媒體,從多個角度來獲取企業(yè)客戶的信息,包括:財務(wù)信息、電子商務(wù)信息、社交媒體信息等,所獲得的可能是非結(jié)構(gòu)化數(shù)據(jù),也可能是結(jié)構(gòu)化數(shù)據(jù)。所以不要結(jié)合實際狀況,合理、科學(xué)地對特征變量進(jìn)行調(diào)控、修改,從而達(dá)到增強(qiáng)模型信貸風(fēng)險預(yù)測精確程度的目的。
處在當(dāng)前大數(shù)據(jù)時代背景下,借助神經(jīng)網(wǎng)絡(luò)模型來構(gòu)建商業(yè)銀行企業(yè)客戶信貸風(fēng)險評價體系,能夠使信貸風(fēng)險預(yù)測精確性、效率得到顯著增強(qiáng)。因為數(shù)據(jù)挖掘法類型較多,各具優(yōu)勢,這就要求商業(yè)銀行要結(jié)合所獲取的企業(yè)客戶數(shù)據(jù)信息特征,對合理的大數(shù)據(jù)算法進(jìn)行選取,建立有效的信貸風(fēng)險評價模型,確保商業(yè)銀行信貸審核工作的有效開展,全面改善信貸風(fēng)險評估準(zhǔn)確程度,減少不良貸款問題的出現(xiàn)。