邵 梅,蔣禮仁 SHAO Mei, JIANG Li-ren
(1. 西南交通大學 交通運輸與物流學院,四川 成都610031;2. 東莞市城建規(guī)劃設計院,廣東 東莞523129)
(1. Transport and Logistics Institute of Southwest Jiaotong University, Chengdu 610031, China; 2. Dongguan City Urban Construction Planning and Design Institute, Dongguan 523129, China)
中小企業(yè)的蓬勃發(fā)展已經(jīng)成為推動中國經(jīng)濟向前的重要力量。但是,由于國家政策的傾斜、中小企業(yè)自身規(guī)模等原因,資金瓶頸問題已經(jīng)成為其發(fā)展道路的主要障礙。中小企業(yè)具有信用等級較低、固定資產(chǎn)所有權(quán)不明確、融資抵押物和擔保匱乏等特點。銀行等金融機構(gòu)為控制貸款風險僅以固定資產(chǎn)抵押擔保方式為中小企業(yè)提供貸款服務,幾乎不對其做信用貸款。那么,如何解決中小企業(yè)融資困境呢?解決中小企業(yè)融資問題的核心在于金融創(chuàng)新。物流金融通過引入物流企業(yè),優(yōu)化了銀行和企業(yè)間的信息不對稱所帶來的逆向選擇和道德風險問題,使得銀行對中小企業(yè)授信的收益成本得到明顯改善。
物流金融是金融服務和物流服務相互集成的創(chuàng)新綜合服務。浙江大學經(jīng)濟學院的唐元琦和鄒小芃(2004) 首次提出了物流金融的概念,他們認為物流金融就是面向物流業(yè)的運營過程,通過開發(fā)、提供和應用各種金融服務和金融產(chǎn)品,有效地組織和調(diào)劑物流領(lǐng)域中的信用和資金的運動,達到物流、信息流和資金流的有機統(tǒng)一。物流金融不僅能提高第三方物流企業(yè)的競爭力、創(chuàng)造新的利潤增長點,還能夠拓寬金融機構(gòu)的業(yè)務范圍、提升利潤空間,更能解決中小企業(yè)長期面臨的融資難問題。
物流金融作為一項較新的金融業(yè)務模式,在實現(xiàn)銀行、物流企業(yè)和中小企業(yè)三方共贏的同時也給銀行帶來了各種各樣的風險,比如信用風險、市場風險、操作風險以及流動性風險等。信用風險是指交易一方不能履約或不能完全履約而給另一方帶來的風險,是最主要的風險,主要來源于委托人和代理人之間的信息不對稱。從信用風險產(chǎn)生的主體來看,融資企業(yè)是最主要的風險來源。因此,如何識別融資企業(yè)的信用好壞,對銀行等金融機構(gòu)來說就顯得尤其重要。隨著信息技術(shù)在物流企業(yè)的普及,大量的數(shù)據(jù)被存儲,這些數(shù)據(jù)中隱藏了眾多信息和關(guān)鍵業(yè)務模式,決策樹等數(shù)據(jù)挖掘技術(shù)可以從這些數(shù)據(jù)中提取出潛在的有用信息和知識。把決策樹等數(shù)據(jù)挖掘技術(shù)應用到物流金融領(lǐng)域,對海量物流數(shù)據(jù)信息進行處理、分析和優(yōu)化,可以充分挖掘出這些信息潛在價值,從而有利于銀行等金融機構(gòu)對需要融資的中小企業(yè)的信用進行分類,識別出具有良好信用融資企業(yè)的特征屬性,為信用風險的防范提供參考依據(jù)。
物流金融起源于物資融資業(yè)務。國外物流和金融的結(jié)合可以追溯到公元前2400 年美索不達米亞的“谷物倉單”。國內(nèi)關(guān)于物流金融的研究起步相對較晚,1987 年陳淮提出了關(guān)于構(gòu)建物資銀行的設想,但由于種種原因,這一設想沒有被充分發(fā)現(xiàn)和認識。隨后又出現(xiàn)了物流銀行、倉單質(zhì)押、融通倉、金融物流等概念。
儲雪儉等提出目前我國金融物流信貸風險防范中的四個主要難點,并給予了相關(guān)的對策建議。孫穎對物流金融的業(yè)務風險、宏觀環(huán)境風險和法律風險進行了分析,提出了相關(guān)的風險管理建議。王元元認為物流金融業(yè)務中進行融資的中小企業(yè)是銀行最主要的信用風險來源,其次,物流企業(yè)也是銀行面臨的信用風險來源。
隨著定性研究的逐步深入,定量研究開始出現(xiàn)。潘永明從物流金融運營狀況、第三方物流企業(yè)綜合實力、中小企業(yè)綜合實力和行業(yè)狀況四個方面對物流金融信用風險的影響因素進行分析,建立了物流金融信用風險評價指標體系。劉哲等利用模糊層次綜合法從企業(yè)基本特征、財務能力、貨物風險、履約能力、發(fā)展?jié)摿Φ任鍌€方面構(gòu)建物流金融信用評價指標體系,并對這些指標因素進行細分,建立了三級四層的指標評價體系。何明珂運用BP 神經(jīng)網(wǎng)絡評估模型以及Matlab 軟件將某一項具體的物流金融業(yè)區(qū)分為高、中、低三種風險。
綜上所述,國內(nèi)對物流金融的研究多集中在物流金融基本知識、風險種類及防范和信用評價指標體系建立等方面。
數(shù)據(jù)挖掘(Data Mining,DM) 就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在的有用信息和知識的過程。數(shù)據(jù)挖掘又稱數(shù)據(jù)庫知識發(fā)現(xiàn)。決策樹是數(shù)據(jù)挖掘諸多技術(shù)和方法中常見的一種,它的優(yōu)勢在于通過對已知類別訓練集的分析,可以提取出有價值的分類規(guī)則,從而對新數(shù)據(jù)的類別進行預測,給決策者提供一定的參考。
ID3 算法是基于決策樹的挖掘算法,以信息增益作為屬性測試,并選取具有最高增益的屬性值作為分裂屬性,自頂向下地構(gòu)建決策樹,直到不能再劃分為止。ID3 算法的核心問題是如何選取決策樹的每個節(jié)點要測試的屬性。
設S是s個樣本數(shù)據(jù)的集合,將樣本劃分為m個不同類Ci(i=1,…,m)的信息熵按式(1) 計算(其中pi是任意樣本屬于Ci的概率):
假設屬性A作為決策樹的根節(jié)點,屬性A具有v個不同取值,把數(shù)據(jù)集S劃分成v個子集{S1,S2,…,Sv},根據(jù)屬性A劃分成的子集熵按式(2) 計算:
信息增益為原來的信息需求(基于類比例) 與新的信息需求(對A劃分之后得到的) 之間的差,即式(3):
決策樹技術(shù)應用于物流金融信用風險中的基本思路是:根據(jù)已知樣本和原始信用評價狀態(tài),發(fā)現(xiàn)貸款企業(yè)信用狀態(tài)與其某些特征屬性之間的關(guān)系,進而通過對這些企業(yè)屬性的具體觀察值,對其信用狀況進行預測。本文利用ID3 算法給出某物流企業(yè)的具有高還款風險客戶的特征屬性,為銀行等金融機構(gòu)進行風險控制提供參考依據(jù)。
3.1 數(shù)據(jù)選擇和預處理。假設從某物流企業(yè)的數(shù)據(jù)庫中收集到的客戶信息有注冊方式、信用等級、企業(yè)規(guī)模、企業(yè)性質(zhì)等。需要注意的是進行相關(guān)分析的數(shù)據(jù)不是只存儲在一個數(shù)據(jù)庫中,還可能存在于其它數(shù)據(jù)集中,要根據(jù)實際需要進行相關(guān)的收集整理。收集后的數(shù)據(jù)往往不能直接挖掘,需要進行一定的選擇、清理、轉(zhuǎn)換和歸納等預處理工作,數(shù)據(jù)預處理工作準備是否充分,對于挖掘算法的效率乃至正確性都有關(guān)鍵性的影響。
ID3 算法比較適合處理離散數(shù)值的屬性,表1 中的注冊資本和銷售業(yè)績是連續(xù)屬性,可以通過分箱、直方圖分析、直觀劃分等離散方法將屬性的值劃分為幾個區(qū)間,然后就可采用和離散值處理相同的方法。由于考慮的是一組具有高還款風險物流企業(yè)的客戶的特征屬性,選取企業(yè)規(guī)模、企業(yè)性質(zhì)、企業(yè)地點、銀行資信等級和還款風險屬性來進行分類預測。
3.2 信息增益的計算。決策屬性為高還款風險和低還款風險,S1(高還款風險)=8,S2(低還款風險)=12,則信息熵I(S1,S2)
公司規(guī)模分為大型企業(yè)、中型企業(yè)、小型企業(yè)三組,在大型企業(yè)中具有高還款風險屬性的企業(yè)有0 個,具有低還款風險屬性的企業(yè)有6 個,
在中型企業(yè)中具有高還款風險屬性的企業(yè)有4 個,還款風險低的企業(yè)有5 個,則信息熵=0.9911。
在小型企業(yè)中還款風險高的企業(yè)有4 個,具有低還款風險屬性的企業(yè)有1 個,則信息熵為=0.7219。
表1 企業(yè)信息表
企業(yè)地點分為上海、成都、北京三個地方:
銀行資信等級分為A,B,C 三組:
各屬性的信息增益:
G(企業(yè)規(guī)模)=0.9710-0.6265=0.3445
G(企業(yè)性質(zhì))=0.9710-0.9121=0.0589
G(企業(yè)地點)=0.9710-0.8846=0.0864
G(銀行資信等級)=0.9710-0.7992=0.1718
我們知道,信息增益越大,選擇測試屬性對分類提供的信息越多。從上面計算出的值可以看出具有高信息增益的屬性是企業(yè)規(guī)模,所以選擇企業(yè)規(guī)模為根節(jié)點。當企業(yè)規(guī)模都為大企業(yè)時,企業(yè)的還款風險低,當企業(yè)規(guī)模為中型企業(yè)或者小型企業(yè)時,企業(yè)的還款風險或者低或者高,沒有具體的特征屬性,所以可以繼續(xù)對屬性進行分類。
對中型企業(yè)進行分類:
S1(還款風險高)=4,S2(還款風險低)=5
G(企業(yè)性質(zhì))=0.991-0.660=0.3311
G(企業(yè)地點)=0.991-0.612=0.3791
G(銀行資信等級)=0.991-0.988=0.0311
對于中型企業(yè)來說,選擇屬性企業(yè)地點為節(jié)點進行分類。類似,可以給小型企業(yè)選擇信息增益最大的屬性作為節(jié)點進行分類。經(jīng)過進一步的分類,得到如圖1 所示的決策樹。在這里,采用預剪枝的方法進行剪枝,停止樹的增長,防治過度擬合。
3.3 結(jié)果分析。由圖1 可以得到如下規(guī)則:(1) 如果公司規(guī)模是大型企業(yè),則還款風險低;(2) 如果是中型公司且公司地點在上海,則還款風險低;(3)如果公司是小型企業(yè),則具有高還款風險。
根據(jù)上述結(jié)論,具有高風險還款能力的是小型企業(yè)或地點在北京或者成都的中型企業(yè),還款風險低的是大型企業(yè)或在上海的中型企業(yè)。針對這種分類,銀行在對物流公司進行還款風險預測時,可以將主要精力集中在具有低還款風險特征屬性的物流企業(yè)上。
圖1 決策樹
隨著信息化水平的提高,銀行和物流企業(yè)都積累了各種各樣的數(shù)據(jù),如何從大量的數(shù)據(jù)中挖掘出潛在的應用價值,有效地降低物流金融的信用風險是個值得探討的問題。本文利用決策樹ID3 算法對某物流企業(yè)客戶的高還款風險特征屬性進行了挖掘,能夠給銀行進行信用風險分類預測時提供一些參考,克服人為經(jīng)驗因素帶來的不確定性,降低信用風險。需要指出的是,在實際應用時,可以根據(jù)實際情況選擇相應的屬性進行分類,以期找到更加符合現(xiàn)實情況的分類,為物流金融信用風險的防范提供一定的科學依據(jù)。
[1] Jiawei Han Micheline Kamber. 數(shù)據(jù)挖掘概念與技術(shù)[M]. 范明,孟小峰,等譯. 北京:機械工業(yè)出版社,2006:128-137.
[2] 陳祥鋒,石代倫,朱道立. 金融供應鏈與融通倉服務[J]. 物流技術(shù)與應用,2006(3):93-95.
[3] 裴英梅. 基于數(shù)據(jù)挖掘技術(shù)的現(xiàn)代物流決策研究[J]. 物流技術(shù),2008,27(7):47-49.
[4] 郭洪濤,郭永紅. 數(shù)據(jù)挖掘技術(shù)在物流信息系統(tǒng)中的應用[J]. 科技信息,2009(4):262-263.
[5] 薛華,朱杰. 物流決策中決策樹分類技術(shù)的應用研究[J]. 商場現(xiàn)代化,2012,10(698):72-73.
[6] 謝江林,何宜慶,陳濤. 數(shù)據(jù)挖掘在供應鏈金融風險控制中的應用[J]. 南昌大學學報,2008,6(32):278-281.
[7] 唐元琦,鄒小芃. 物流金融淺析[J]. 浙江金融,2004(5):20-21.