鄭建華,黃灝然,李曉龍
(1.仲愷農(nóng)業(yè)工程學院信息科學與技術學院,廣東 廣州 510225;2.肇慶學院經(jīng)濟與管理學院,廣東 肇慶 526061;3.暨南大學經(jīng)濟學院,廣東 廣州 510632)
小微企業(yè)是我國企業(yè)的重要組成部分,當前我國小微企業(yè)數(shù)量占企業(yè)總數(shù)量九成以上,小微企業(yè)的產(chǎn)值占我國GDP 六成以上,小微企業(yè)在保障就業(yè)、活躍市場、推動創(chuàng)新、穩(wěn)定社會等方面發(fā)揮巨大作用。長期以來由于信息不對稱的原因,加上小微企業(yè)缺乏擔保物,企業(yè)治理和財務體系不規(guī)范,金融機構難以了解小微企業(yè)真實的狀況,怕承擔極大的違約風險,使得小微企業(yè)難以獲得金融機構支持,成為制約小微企業(yè)發(fā)展的瓶頸。信用評級是對信用價值的一種判斷,金融機構以此價值判斷為基礎,決定授予信用主體某種機會、某筆商業(yè)交易或具體的融資金額。傳統(tǒng)信用評級主要基于企業(yè)財務狀況或者銀行信貸數(shù)據(jù)實現(xiàn),但現(xiàn)實中并不是所有金融機構都能獲取到企業(yè)的真實財務數(shù)據(jù),同時影響企業(yè)信用的不僅僅是財務數(shù)據(jù),企業(yè)一些不合規(guī)行為也會影響其信用,因此傳統(tǒng)信用評級方式難以直接適用于小微企業(yè)。隨著大數(shù)據(jù)時代來臨,可獲取的企業(yè)數(shù)據(jù)豐富且多樣,處理技術更加先進,使得從多維度評估企業(yè)信用成為可能,比如吳育輝等以中國A 股上市公司作為樣本,研究了企業(yè)信息披露質量與企業(yè)的信用評級的關系,研究表明企業(yè)信息披露質量越高,則企業(yè)管理層的能力越高,企業(yè)的信用評級也越高。2015 年我國發(fā)布的《十三個五年規(guī)劃的建議》將大數(shù)據(jù)提升到國家戰(zhàn)略高度,因此在大數(shù)據(jù)背景下,如何科學、合理地構建小微企業(yè)信用評級模型,既能讓小微企業(yè)獲得急需的信貸,又能減少金融機構的風險,成為當前我國征信體系中亟須解決的問題。
根據(jù)麥肯錫全球數(shù)據(jù)分析研究所的定義,大數(shù)據(jù)是指大小超出了典型數(shù)據(jù)庫軟件工具收集、存儲、管理和分析能力的數(shù)據(jù)集。大數(shù)據(jù)不僅僅是數(shù)量大(Volume),其還具其他4V 特征,分別是:Variety(多樣性)、Velocity(時效性)、Veracity(準確性)、Value(高價值) 等。由于大數(shù)據(jù)5V 特征的存在,不僅僅使數(shù)據(jù)的存儲、計算方式帶來了巨大變革,更加重要的是使傳統(tǒng)業(yè)務模式發(fā)生了天翻地覆的變化。
傳統(tǒng)小微企業(yè)信用評級主要以銀行信貸和財務數(shù)據(jù)為主,由于當前我國小微企業(yè)財務制度普遍不夠規(guī)范,財務造假的情況時有發(fā)生,加上主觀評價導致的誤差,使得信用評級可信度不高。同時,企業(yè)的銀行信貸數(shù)據(jù)都存于銀行內(nèi)部,數(shù)據(jù)的封閉性導致很難為外部機構獲取,因此以銀行信貸數(shù)據(jù)為主的評級模型難以滿足互聯(lián)網(wǎng)金融機構的信用評估需求。
在大數(shù)據(jù)時代,企業(yè)公開發(fā)布的數(shù)據(jù)更多,因此可以利用大數(shù)據(jù)技術全面收集、高效處理企業(yè)多維度數(shù)據(jù),打破以財務信息為核心的傳統(tǒng)信用評級模式,利用多維度、多類型數(shù)據(jù)對企業(yè)信用展開動態(tài)評級。基于大數(shù)據(jù)的小微企業(yè)信用評級具有以下優(yōu)勢:
利用大數(shù)據(jù)技術可以獲取企業(yè)工商、行政處罰、稅務、知識產(chǎn)權、網(wǎng)絡電商交易、股東信用、股東社交關系、企業(yè)安全事故等多維度豐富而真實的海量數(shù)據(jù),這種些數(shù)據(jù)都是企業(yè)信用的外在反映,在利用大數(shù)據(jù)技術對這些數(shù)據(jù)合理處理后更能全面體現(xiàn)企業(yè)的信用狀況。
數(shù)據(jù)源是信用評級的基礎,獲取來自工商、稅務、知識產(chǎn)權、法院等各部門公布的權威數(shù)據(jù),這樣能夠提供給模型計算的特征變量個數(shù)往往多達幾千甚至上萬個,這樣提升了評級結果的可信度。同時隨著人工智能技術的飛速發(fā)展,采用深度學習、隨機森林、決策樹、XGBoost 等理論基礎更為復雜的機器學習算法實現(xiàn)信用評級成為可能,通過執(zhí)行一段計算機程序即可實現(xiàn)信用自動評級,這種過程有效避免了專家評級的主觀性,進一步提升評級的可信度。
在大數(shù)據(jù)時代,利用爬蟲技術將散布在互聯(lián)網(wǎng)各個角落的各種信息匯聚在一起,隨后采用數(shù)據(jù)挖掘算法對這些海量數(shù)據(jù)進行處理、挖掘,形成小微企業(yè)征信體系中的各種量化指標。應用大數(shù)據(jù)、人工智能等技術快速計算這些指標,形成企業(yè)信用評級結果,實現(xiàn)數(shù)據(jù)實時處理,效率優(yōu)勢明顯。以上過程一直持續(xù)進行,實現(xiàn)企業(yè)信用評級結果的動態(tài)優(yōu)化。
傳統(tǒng)的信用評級需要評級機構專人對企業(yè)進行各種調查,耗費大量的人力成本、時間成本和資金成本,而基于大數(shù)據(jù)信用評級,通過執(zhí)行計算機程序即可快速得到企業(yè)信用評級,顯著減少了成本。
鑒于大數(shù)據(jù)的企業(yè)信用評級的優(yōu)勢,近年來已經(jīng)涌現(xiàn)出許多研究成果。
國外的益百利融合企業(yè)基本信息、信用信息、支付信息、貿(mào)易支付信息、金融交易信息等超過140 項數(shù)據(jù)來展示企業(yè)信用。鄧白氏采用了類似的信息,此外還包含了用于財務能力評價和商業(yè)信用評價的鄧白氏指標。艾可飛的特色在于整合了企業(yè)信息和個人信息,形成一份完整信用報告。
國內(nèi)學者溫妮則從企業(yè)的歷史和未來,定量分析和判斷等方面,構建了一個包括企業(yè)財務狀況、互聯(lián)網(wǎng)輿情導向、發(fā)展環(huán)境、市場競爭力和商務行為五個因素的指標體系。馮文芳從產(chǎn)業(yè)分布、發(fā)展需求、市場現(xiàn)狀等更多領域提取數(shù)據(jù)來反映企業(yè)的信用信息。
針對小微企業(yè)信用評級方面,陸萍采用文獻閱讀、專家問卷調查確定了企業(yè)外部環(huán)境、企業(yè)信息、企業(yè)主信息和企業(yè)財務指標4 個一級指標的工業(yè)類小微企業(yè)征信指標,構建了定性指標和定量指標的評估模型。呂秀梅采用專家評分加權方法挑選出財務信息、發(fā)展信息、信用信息和網(wǎng)絡信息4 大類共24 個對中小微企業(yè)信用評估形成顯著影響的因素。朱兆迪認為小微企業(yè)經(jīng)營者和企業(yè)自身狀況兩方面是評價小微企業(yè)信用的主要因素,其中企業(yè)經(jīng)營者的信用水平影響最大。
在企業(yè)界,京東金融依托京東電商平臺和物流平臺,通過對商家的銷售、采購、財務、物流數(shù)據(jù)進行分析,為京東的金融產(chǎn)品提供決策分析。網(wǎng)商銀行與淘寶、天貓、阿里巴巴等平臺合作,獲取這些平臺的企業(yè)交易、訂單、評價等數(shù)據(jù),從而構建了各種預測模型和風控模型。
除了企業(yè),大數(shù)據(jù)征信也可被用于個人信用評級,楊亞仙等認為大數(shù)據(jù)征信是傳統(tǒng)征信業(yè)務強有力的補充,能夠適用的業(yè)務場景也更加多元化,例如風控決策系統(tǒng)。蔡金鑫等通過改進“5C 信用評估法”,構建了基于大數(shù)據(jù)的個人信用評估指標體,并應用模糊數(shù)層次分析法計算相關指標的權重。
上述現(xiàn)狀表明,采用大數(shù)據(jù)技術進行信用評級已經(jīng)獲得學者和企業(yè)界的認可,但是實際上市場上真正投入使用的信用評級模型并不多見。投入使用的模型都依賴于完備的自身領域內(nèi)數(shù)據(jù),比如阿里電商數(shù)據(jù)、京東電商數(shù)據(jù)、騰訊社交數(shù)據(jù)。
造成這種現(xiàn)狀的主要原因有:
(1) 數(shù)據(jù)獲取困難。比如有些模型要求融入企業(yè)的互聯(lián)網(wǎng)訂單、用戶評價等數(shù)據(jù),但是電商平臺不愿意公開這些數(shù)據(jù),導致數(shù)據(jù)難獲取,評級無法完成。
(2) 數(shù)據(jù)涉及隱私。比如有些模型建議融入小微企業(yè)經(jīng)營者的支付寶、微信支付等社交消費數(shù)據(jù),但是這些數(shù)據(jù)涉及隱私,不可能直接被應用。
(3) 數(shù)據(jù)缺乏權威且難以被量化。比如有些模型提出要融合自媒體、新媒體、傳統(tǒng)媒體的評價信息,但是這種評價散布在互聯(lián)網(wǎng)的各個角落,發(fā)布者水平參差不齊,而且還有可能有大量的水軍,因此基本沒有權威性,也難以被量化。
由于以上原因導致當前小微企業(yè)的信用評級模型使用困難很大。而僅僅針對自身領域內(nèi)數(shù)據(jù)進行信用評級的模型缺乏對企業(yè)信息全面展示,導致其使用范圍有限,故目前急需構建一個基于公開權威數(shù)據(jù)的具有可操作性的小微企業(yè)信用評級模型。
對于指標體系的設置,張紅玲提出了全面性、針對性、可比較性、集約性和可操作性5 大原則。張永丹類似地提出了全面性、可續(xù)性、公正性、可操作性幾大原則。張維等則認為應該遵從全面性與重要性相結合原則、減少對企業(yè)財務報表依賴性原則、定量分析與定性分析相結合原則、關聯(lián)性原則、可操作性原則。鑒于當前信用評估模型存在的問題,研究認為建立實際可行的大數(shù)據(jù)信用評級指標體系尤為重要。
建立面向公開數(shù)據(jù)的小微企業(yè)信用評級模型,需要重點考慮數(shù)據(jù)的可獲取性、數(shù)據(jù)可用性,這樣既能便于充分反映一個企業(yè)的真實情況,又能便于采用大數(shù)據(jù)技術、人工智能的方法實時、便捷的計算信用等級。數(shù)據(jù)可獲取性指的是能夠通過公開途徑獲取企業(yè)該項指標的信息。數(shù)據(jù)可用性指的是獲取到的數(shù)據(jù)具有一定的權威性和能夠用于計算,且這些數(shù)據(jù)的相互合作能夠形成互補和支撐,能夠全面地評價一個企業(yè)信用狀況。比如張虹等從企業(yè)創(chuàng)新產(chǎn)出(具體包括知識產(chǎn)權類能力、標準成果、科研類成果) 和企業(yè)信用風險的量化數(shù)據(jù)評價企業(yè)活力指數(shù),為企業(yè)融資評估提供支撐數(shù)據(jù),實證分析表明通過以上可量化指標計算得到的企業(yè)活力值與企業(yè)融資情況基本契合。
考慮到當前中國小微企業(yè)的財務制度尚不健全,提供的財務數(shù)據(jù)有所失真,而且當前銀行已有的征信體系主要采用財務和信貸數(shù)據(jù),因此文章僅考慮非財務指標體系,在財務指標方面不再重新贅述。對于財務指標設計及權重也可以參考文獻所列。實際上當前企業(yè)違約風險有相當多是由于非財務問題引發(fā),企業(yè)管理層能力的提升,有助于提升企業(yè)信用評級。類似的,傅鈺等研究表明除了傳統(tǒng)征信要素即財務企業(yè)財務指標外,包括創(chuàng)新能力、企業(yè)家特質、企業(yè)聲譽等與有形資產(chǎn)無關的非傳統(tǒng)征信要素對企業(yè)信用的評估具有重要影響。同樣,岳愛東等研究發(fā)現(xiàn)企業(yè)運營與管理水平、制度環(huán)境對小微企業(yè)融資的影響最為明顯,抵質押擔保、銀行信用與資信的影響相對并不顯著。總結以上研究成果表明,非財務因素同樣可以對企業(yè)的信用評級產(chǎn)生重大影響,故可以作為企業(yè)信用評級的主要指標因素。
根據(jù)研究設定的原則,在考慮數(shù)據(jù)的可獲取性和數(shù)據(jù)可用性前提下,以非財務指標為主,綜合應用信用平臺、工商、法院、稅務、知識產(chǎn)權等各機構公開的權威數(shù)據(jù),并結合百度信用、天眼查、企查查等商業(yè)平臺數(shù)據(jù),構建了一個基于公開數(shù)據(jù)的小微企業(yè)信用評級指標體系,并能采用大數(shù)據(jù)技術實現(xiàn)評級自動化。
本指標體系把企業(yè)發(fā)展?jié)摿?、企業(yè)發(fā)展環(huán)境、企業(yè)經(jīng)營者信息、企業(yè)行為合規(guī)度四個維度作為一級指標。每個一級指標由2-3 個二級指標構成,例如衡量企業(yè)發(fā)展?jié)摿Φ亩壷笜擞衅髽I(yè)信息完整性、企業(yè)發(fā)展階段、企業(yè)市場競爭能力;衡量企業(yè)發(fā)展環(huán)境的二級指標有所在區(qū)域經(jīng)濟指數(shù)、所屬行業(yè)景氣指數(shù);企業(yè)經(jīng)營者信息的二級指標有主要股東信用記錄、股東主要社會關系和企業(yè)資本組成情況。企業(yè)行為合規(guī)度的二級指標有法律訴訟、行政處罰和稅務處罰或等級。各維度的二級指標數(shù)據(jù)獲取方式以及指標解釋如表1 所列。
表1 小微企業(yè)信用評級指標體系
層次分析法(AHP)是美國T.L.Satty 教授提出的一種將定性問題進行定量分析的多目標決策方法,該方法通過采用數(shù)學方法計算每一層指標的重要性權重,然后再計算出在各層次之間的權重,從而實現(xiàn)對目標的定量描述。其中的權重數(shù)學計算方法可以是特征值法、算術平均法、幾何平均法。
采用特征值法計算某一層指標的權重計算流程如下:
第一,構建指標兩兩比較判斷矩陣A。
第二,求解矩陣A 的最大特征值λmax和特征向量。
第四,對特征向量進行歸一化處理,得到每個指標的權重。
以一級指標為例演示以上算法過程,構件如下兩兩比較判斷矩陣如表2 所示。
表2 一級指標判斷矩陣
計算此矩陣得到最大特征值為4.04。
并計算:
這表明該矩陣通過檢驗,繼而對特征向量歸一化得到權重向量:
W=[0.302 0.076 0.152 0.47]T
從以上權重可以發(fā)現(xiàn),研究設計的信用評級指標體系比較偏重對企業(yè)行為合規(guī)度的懲罰,企業(yè)經(jīng)營合規(guī)度越高則信用越好。
采用類似的方法可以得到企業(yè)發(fā)展?jié)摿Α⑵髽I(yè)發(fā)展環(huán)境、企業(yè)經(jīng)營者信息,企業(yè)行為合規(guī)度下二級指標的權重向量分別為:
W1=[0.143 0.285 0.572]T
W2=[0.5 0.5]T
W3=[0.557 0.170 0.273]T
W4=[0.164 0.539 0.297]T
表3 二級指標權重
據(jù)此可以設計出每個二級指標的綜合權重。
根據(jù)以上可以得到小微企業(yè)量化的信用評分,如下公式所示:
注:在使用上式時,本文約定對于企業(yè)行為合規(guī)度的取值均為負值,因此總分會出現(xiàn)負數(shù)情況,為了保證總分值在0~100之間,需要在計算結果后面加上43。
當前我國企業(yè)征信采用依據(jù)GB/T 22116-2008《企業(yè)信用等級表示方法》,為了保持與國家標準一致,文章仍基于以上標準,將小微信用等級分為10 個等級,分別為AAA,AA,A,BBB,BB,B,CCC,CC,C,D。具體分值如表4 所示。:
為了查看信用模型中二級指標的企業(yè)統(tǒng)計分布情況,研究抓取了超過10 萬家廣州市企業(yè),對二級指標進行統(tǒng)計?!捌髽I(yè)市場競爭力”對企業(yè)信用評分影響起正向積極作用,表5 是對企業(yè)的專利和軟著申請進行統(tǒng)計分析。同時,處罰對一個企業(yè)信用的影響非常大,表明了企業(yè)經(jīng)營的合規(guī)度,表6 是對抓取企業(yè)的行政處罰情況進行統(tǒng)計。
表5 企業(yè)市場競爭力情況統(tǒng)計
從以上兩個表可以發(fā)現(xiàn),97.62%的企業(yè)沒有申請專利或者軟著,但是只有90.82%的企業(yè)沒有接收到任何行政處罰,這說明至少有6.8%的企業(yè)沒有申請一項專利或者軟著,但是至少一項行政處罰的企業(yè)卻接受了,這并不有利于企業(yè)的發(fā)展。
依據(jù)本文設計的信用評級模型,表7 列出來部分代表企業(yè)評級情況,可以發(fā)現(xiàn)評分較高的企業(yè)在市場競爭力這一塊都較強,通過分數(shù)較好的反映了一個企業(yè)的各方面信息。
表6 企業(yè)接受行政處罰情況統(tǒng)計
以銀行信貸和財務數(shù)據(jù)為主的傳統(tǒng)的企業(yè)信用評級模式難以適應時代需求。大數(shù)據(jù)時代帶來了多維、多類型數(shù)據(jù),以及數(shù)據(jù)處理方式的變革,這給解決傳統(tǒng)信用評級模式難以適用小微企業(yè)問題帶來思路。文章以大數(shù)據(jù)技術為基礎,針對小微企業(yè)信用評級難題,研究了大數(shù)據(jù)時代的企業(yè)信用評級問題,設計了面向小微企業(yè)的信用評級體系,并取得以下研究成果:
表7 部分典型信用評級
第一,基于大數(shù)據(jù)的小微企業(yè)信用評級具有全面、可信、高效、低成本的優(yōu)勢,有助于打破以財務信息為主的傳統(tǒng)小微企業(yè)信用評級模式,可為我國未來的征信模式提供重要補充。
第二,針對大數(shù)據(jù)信用評級的現(xiàn)狀,文章總結出制約當前大數(shù)據(jù)信用評級被廣泛使用的三點主要原因:數(shù)據(jù)獲取困難、數(shù)據(jù)涉及隱私、數(shù)據(jù)缺乏權威且難以被量化。這為行業(yè)制定相關規(guī)范和政府制定相關政策提供了參考和依據(jù)。
第三,研究在重點考慮數(shù)據(jù)的可獲取性、數(shù)據(jù)可用性基礎上,構建了以企業(yè)發(fā)展?jié)摿Α⑵髽I(yè)發(fā)展環(huán)境、企業(yè)經(jīng)營者信息、企業(yè)行為合規(guī)度四個維度作為一級指標的小微企業(yè)信用評級體系,并采用層次分析法量化二級指標權重,構建了小微企業(yè)信用評級量化模型。
第四,以廣州市企業(yè)為研究對象,實證分析了不同企業(yè)的信用評級情況,結果表明該模型能較好反映企業(yè)綜合能力,對不同的企業(yè)具有較好的區(qū)分能力,這為企業(yè)融資提供了有力依據(jù)。
以上成果表明研究所設計的小微企業(yè)信用評級模型能為小微企業(yè)提供一種客觀的評價,能成為當前我國信用評級體系的有益補充。
在大數(shù)據(jù)時代,可以采集的數(shù)據(jù)越來越多,因此也可以從更多的維度評價一個企業(yè),能夠從更細微的角度衡量一個企業(yè),如果后續(xù)有更多的私有數(shù)據(jù)開放(比如支付寶和微信支付信息、京東和蘇寧等采購信息),可以將更多的私有信息融入到模型,實現(xiàn)不同的數(shù)據(jù)互補。同時在后續(xù)研究中,可以探索將各種數(shù)據(jù)都保存在區(qū)塊鏈系統(tǒng)上,利用區(qū)塊鏈的去中心化、防偽溯源、信任機制等技術特征保障已有數(shù)據(jù)的不可篡改性,進一步提升企業(yè)信用評級的可信度。在此基礎上,提出以下建議:
黨的十九大報告指出“要建設數(shù)字中國、智慧社會,發(fā)展數(shù)字經(jīng)濟、共享經(jīng)濟”。顯然豐富的數(shù)據(jù)有助于更精準的評估企業(yè)信用。建議國家出臺相關政策,在數(shù)字中國建設背景下,規(guī)范數(shù)據(jù)采集方式,同時實現(xiàn)電商、社交、交通等企業(yè)數(shù)據(jù)共享,實現(xiàn)工商、稅務、法院、知識產(chǎn)權等部門的相關數(shù)據(jù)共享。這樣有助于研究者專注于技術開發(fā),提高評級模型的精度。
當前大數(shù)據(jù)、云計算、機器學習、深度學習、區(qū)塊鏈技術在交通、政務、醫(yī)療、教育等行業(yè)都取得大量研究成果。未來,在數(shù)據(jù)開放的基礎上,建議將大數(shù)據(jù)、云計算和區(qū)塊鏈技術引入到小微企業(yè)信用信息數(shù)據(jù)的存儲上,將深度學習和機器學習技術引入到小微企業(yè)信用評級模型計算上,實現(xiàn)更大規(guī)模的數(shù)據(jù)存儲、更先進數(shù)據(jù)計算,從而達成更穩(wěn)定的評估預測結果。這對推動小微企業(yè)信用評級,進一步推動我國個人、企業(yè)信用體系建設非常有益。