韓茜 任麗蓉 劉道瞳 千夢強(qiáng) 楊天尊 郭凱
摘 要:隨著互聯(lián)網(wǎng)的快速發(fā)展,國內(nèi)征信市場涌現(xiàn)出若干互聯(lián)網(wǎng)征信公司,他們利用大數(shù)據(jù)等技術(shù)創(chuàng)建的個人信用評分與傳統(tǒng)個人信用評分相比,在數(shù)據(jù)維度、獲取方式、數(shù)據(jù)量級、數(shù)據(jù)時(shí)效性和應(yīng)用場景等方面具有一定優(yōu)勢。
關(guān)鍵詞:大數(shù)據(jù);個人信用評分
中圖分類號:F832.4 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-0037(2018)2-83-3
Abstract: With the rapid development of Internet, the domestic credit market emerged several Internet credit reporting companies, they used big data and other technologies to create personal credit score, which compared with the traditional personal credit score,has certain advantages in data dimension, data access, data scale, timeliness and application scenario and so on.
key words: big data; personal credit score
大數(shù)據(jù)征信的實(shí)質(zhì)是利用互聯(lián)網(wǎng)獲取信用信息,它不僅能夠收集傳統(tǒng)征信所能收集到的信息,還能捕獲傳統(tǒng)征信未能覆蓋的信用信息。此外,利用互聯(lián)網(wǎng)技術(shù)能夠?qū)Σ煌瑧?yīng)用場景的大量信息進(jìn)行實(shí)時(shí)獲取并歸類,以最低的成本和最高的效率獲得最有價(jià)值的個人信用信息。大數(shù)據(jù)征信不再局限于征信機(jī)構(gòu)提供的個人基本信息,而是把信用主體在互聯(lián)網(wǎng)上的行為習(xí)慣、消費(fèi)偏好以及社交關(guān)系等多方面的瀏覽軌跡轉(zhuǎn)化為有利于評估信息主體信用風(fēng)險(xiǎn)的可靠數(shù)據(jù)信息,在一定程度上將信用風(fēng)險(xiǎn)降到最低。同時(shí)大數(shù)據(jù)征信相對于傳統(tǒng)征信還有一個突出的特征,即大數(shù)據(jù)征信下的個人信用評分模型更看重信用主體信用信息的實(shí)時(shí)性、動態(tài)性、共享性,因?yàn)樗腔谛庞弥黧w的日常行為軌跡來研究的,一定程度上能夠較為精確地評估其履約能力、違約系數(shù)。隨著科學(xué)技術(shù)的發(fā)展,征信體系的建設(shè)也應(yīng)與時(shí)俱進(jìn),充分利用好大數(shù)據(jù)使其發(fā)揮最大的作用。
1 個人信用評分
如今互聯(lián)網(wǎng)金融蓬勃發(fā)展,人們對于風(fēng)險(xiǎn)建模的技術(shù)和應(yīng)用不斷升級,使傳統(tǒng)信用評分模型向大數(shù)據(jù)方向轉(zhuǎn)變,但是從本質(zhì)上來講,大數(shù)據(jù)下的信用評分模型仍是傳統(tǒng)信用評分模型的拓展。
1.1 時(shí)代背景
21世紀(jì),人類社會高速發(fā)展,尤其是互聯(lián)網(wǎng)應(yīng)用的日益頻繁,信息流通和信息交流密切,人類進(jìn)入了大數(shù)據(jù)時(shí)代。2012年以來,大數(shù)據(jù)被越來越多的人所提及。哈佛大學(xué)社會學(xué)教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程[1]?!?/p>
隨著大數(shù)據(jù)時(shí)代的到來和近幾年的發(fā)展,可用于評估人們信用的數(shù)據(jù)越來越豐富,金融機(jī)構(gòu)了解客戶的數(shù)據(jù)更加全面和多元化。
1.2 理論研究
信用評分模型運(yùn)用先進(jìn)的數(shù)據(jù)挖掘技術(shù)和統(tǒng)計(jì)分析方法,通過對消費(fèi)者的個人信息和消費(fèi)歷史記錄等數(shù)據(jù)進(jìn)行綜合分析,構(gòu)建模型以對消費(fèi)者未來信用表現(xiàn)加以預(yù)測,并依據(jù)信用評分對消費(fèi)信貸管理做出決策[2]。而信用評分則是根據(jù)消費(fèi)者的信用歷史資料,利用一定的信用評分模型,得到不同等級的信用分?jǐn)?shù)。
無論是傳統(tǒng)信用評分模型還是大數(shù)據(jù)下的信用評分模型,其本質(zhì)沒有變化,目標(biāo)也沒有變化,都是為了將風(fēng)險(xiǎn)控制在一定范圍內(nèi),從而讓經(jīng)濟(jì)平穩(wěn)運(yùn)行。信用評分模型的基本原理是確定影響違約概率的因素,然后給予權(quán)重,計(jì)算其信用分?jǐn)?shù)。
1.3 經(jīng)典模型
國際上最具代表性的信用評分系統(tǒng)是FICO(費(fèi)埃哲評分系統(tǒng)),它是由Fair Isaac公司推出的一套評分系統(tǒng),它以“5C”分析法為理論基礎(chǔ),而國內(nèi)的芝麻信用在這方面與其類似。因此,以FICO和芝麻信用為例,對比分析傳統(tǒng)個人信用評分模型與大數(shù)據(jù)背景下的個人信用評分模型數(shù)據(jù)維度的差異。
FICO評分系統(tǒng)信用分?jǐn)?shù)區(qū)間是300~850分。若借款人信用分?jǐn)?shù)低于620分,貸款方可要求借款人增加擔(dān)保,或拒絕貸款;若借款人信用分?jǐn)?shù)介于620~680,貸款方可進(jìn)一步調(diào)查核實(shí),采用其他信用分析方法個案分析;若借款人信用分?jǐn)?shù)高于680分,貸款方可認(rèn)為該借款人信用非常好,予其貸款。由此,信用分?jǐn)?shù)越高,貸款方所面臨信用風(fēng)險(xiǎn)越小。圖1是FICO評分系統(tǒng)主要考慮的5個維度。信用評分是不帶個人主觀偏見的,把種族、性別、宗教等因素排除在外,使FICO評分更具客觀公正性[3]。FICO評分主要用于貸款方快速、客觀地度量客戶的信用風(fēng)險(xiǎn),縮短授信過程。
芝麻信用的信用評分區(qū)間是350~950分。若用戶的信用分?jǐn)?shù)介于350~550,則用戶信用極差;若用戶的信用分?jǐn)?shù)介于550~600,則用戶信用中等;若用戶的信用分?jǐn)?shù)介于600~650,則用戶信用良好;若用戶的信用分?jǐn)?shù)介于650~700,則用戶信用優(yōu)秀;若用戶的信用分?jǐn)?shù)介于700~950,則用戶信用極好。分值越高代表信用越好,相應(yīng)違約率相對較低,較高的芝麻分可以幫助用戶獲得更高效、更優(yōu)質(zhì)的服務(wù)。與FICO評分系統(tǒng)相似,芝麻信用以“5C”分析法為理論基礎(chǔ),其五維數(shù)據(jù)主要有信用歷史、行為偏好、履約能力、身份特質(zhì)、人脈關(guān)系[4]。由于數(shù)據(jù)來源的不同,芝麻信用收集的數(shù)據(jù)不僅涉及個體的信用歷史情況,還包含了個體的生活方面,而FICO評分系統(tǒng)收集的數(shù)據(jù)更偏向于金融性,數(shù)據(jù)維度太單一,不能完整體現(xiàn)個人的信用情況,在大數(shù)據(jù)時(shí)代,個人信用評分收集數(shù)據(jù)趨向多維化。
2 個人信用評分發(fā)展趨勢
2.1 征信數(shù)據(jù)維度
傳統(tǒng)的個人信用評分模型一般依托“5C”分析法的“品德”“能力”“資產(chǎn)”“抵押擔(dān)?!薄敖?jīng)濟(jì)狀況”這五方面[5],收集消費(fèi)者的基本信息、償債情況、歷史支付記錄、業(yè)務(wù)往來等結(jié)構(gòu)化信息,數(shù)據(jù)維度相當(dāng)有限,加上受數(shù)據(jù)時(shí)效性等因素的影響,并不能完全體現(xiàn)個人的信用情況。截至2017年5月底,中國人民銀行征信中心收錄了9.26億自然人的信用信息,但是由于其采用傳統(tǒng)的信用評分模型,過于依賴有限的數(shù)據(jù)維度,致使只有4億左右的人擁有信貸記錄,這樣就無法評價(jià)其余5億自然人的信用情況。隨著互聯(lián)網(wǎng)的快速發(fā)展,基于大數(shù)據(jù)背景下的互聯(lián)網(wǎng)征信公司不斷誕生,其中有8家獲得個人征信牌照,主要有芝麻信用、騰訊征信、鵬元征信等機(jī)構(gòu)。這些公司利用云計(jì)算技術(shù),對其平臺上收集的用戶的多維度大數(shù)據(jù)進(jìn)行分析,以大規(guī)模維度的個人信用信息降低信用風(fēng)險(xiǎn)評估的不準(zhǔn)確性,加上數(shù)據(jù)時(shí)效性強(qiáng),可以較為完整地體現(xiàn)個人的信用情況。
2.2 獲取方式、量級及時(shí)效性
大數(shù)據(jù)下的信用評分模型通過一切可行的渠道獲取所需數(shù)據(jù),在數(shù)據(jù)獲取方式上比傳統(tǒng)信用評分模型的維度更廣。傳統(tǒng)信用評分模型所使用的數(shù)據(jù)主要來自銀行和少數(shù)征信機(jī)構(gòu),而大數(shù)據(jù)下的征信不僅要用到來自銀行征信機(jī)構(gòu)的數(shù)據(jù),還有政府相關(guān)部門(包括公安部門、稅務(wù)部門、房屋登記部門等)和第三方機(jī)構(gòu)(包括公共事業(yè)單位如醫(yī)療機(jī)構(gòu)等、專門從事征信系統(tǒng)建設(shè)的公司如京東金融等、社交類公司如騰訊等)。
傳統(tǒng)信用評分模型的數(shù)據(jù)來源少,并且調(diào)查維度較為局限,數(shù)據(jù)量級常以TB為單位,而大數(shù)據(jù)下信用評分模型由于有互聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù)作為支撐,各大互聯(lián)網(wǎng)公司在不同的緯度參與征信系統(tǒng)建設(shè),并且加大了數(shù)據(jù)挖掘的深度,所以大數(shù)據(jù)征信所處理的數(shù)據(jù)量也極大幅度地增長,數(shù)據(jù)量級已超過PB水平。在互聯(lián)網(wǎng)尚未普及的年代,傳統(tǒng)信用評分模型通常需要采用隨機(jī)抽樣的方式,建立各種模型來預(yù)測信用風(fēng)險(xiǎn),系統(tǒng)誤差和抽樣誤差勢必會影響建模結(jié)果的精準(zhǔn)性。在信息技術(shù)發(fā)達(dá)的今天,云計(jì)算技術(shù)能輕松分析大量的數(shù)據(jù),我們可以直接對總體數(shù)據(jù)進(jìn)行分析。大數(shù)據(jù)思維的特點(diǎn)之一在于“樣本=總體”,搜集的征信數(shù)據(jù)越多,越容易發(fā)現(xiàn)一些細(xì)節(jié)信息和異常情況,對信用風(fēng)險(xiǎn)的預(yù)測就越準(zhǔn)確[6]。
傳統(tǒng)征信和大數(shù)據(jù)征信對數(shù)據(jù)源時(shí)效性的要求也不一樣。大數(shù)據(jù)征信中數(shù)據(jù)信息有相當(dāng)一部分是由征信公司提供(如支付寶的個人交易信息),這些數(shù)據(jù)具有隨著時(shí)間變化實(shí)時(shí)更新的特征,所以數(shù)據(jù)具有很強(qiáng)的時(shí)效性。而傳統(tǒng)信用評分模型的時(shí)效性較差,由于其獲得的是消費(fèi)者的歷史數(shù)據(jù),再加上獲取數(shù)據(jù)途徑少,導(dǎo)致其信息更新周期更長,且具有嚴(yán)重的滯后性。
2.3 應(yīng)用場景
大數(shù)據(jù)與傳統(tǒng)信用評分也有良好的交互性和融合性,使其發(fā)生了翻天覆地的變化。大數(shù)據(jù)信用評分的數(shù)據(jù)信息主要來源于互聯(lián)網(wǎng),而傳統(tǒng)信用評分是對信用報(bào)告的數(shù)字解讀。因此,采用數(shù)據(jù)挖掘等技術(shù)構(gòu)建大數(shù)據(jù)背景下的個人信用評分模型具有更高的價(jià)值性和準(zhǔn)確性,如芝麻信用分受到了更多的認(rèn)可和青睞。中國科學(xué)院院士、西安交通大學(xué)教授徐宗本曾提出關(guān)于大數(shù)據(jù)產(chǎn)業(yè)的兩種模式,分別是全鏈條模式和節(jié)點(diǎn)聚焦模式,它們也適用于大數(shù)據(jù)征信。不論是對于擁有雄厚實(shí)力采用全鏈條模式的大公司,還是專注于某一方面使用節(jié)點(diǎn)聚焦模式的小公司,這都是大數(shù)據(jù)背景下個人信用評分模型發(fā)展的機(jī)遇。
全鏈條模式下的大公司有著得天獨(dú)厚的優(yōu)勢,在數(shù)據(jù)的收集、數(shù)據(jù)的存儲、技術(shù)的支持和數(shù)據(jù)的分析等方面可以無縫銜接自成一套體系。專注于其中某一項(xiàng)的小公司也可以將本公司的產(chǎn)品做好做精,然后出售給其他公司和機(jī)構(gòu),快速實(shí)現(xiàn)變現(xiàn)和贏利。這不僅降低了信用評分的成本,而且大大提高了信用評分的質(zhì)量,同時(shí)促進(jìn)了這個產(chǎn)業(yè)的發(fā)展,為構(gòu)建更為合理有效的個人信用評分模型起到了重要的作用,解決了傳統(tǒng)征信下評分模型局限性的問題(如數(shù)據(jù)的來源方式、數(shù)據(jù)的不共享、數(shù)據(jù)的安全性和覆蓋人群等各種因素,限制了征信的業(yè)務(wù)范圍[7],導(dǎo)致不能準(zhǔn)確地對企業(yè)和個人進(jìn)行良好的信用定位以及分析解讀出的信用評分不準(zhǔn)確,從而帶來一系列的負(fù)面影響)。
大數(shù)據(jù)背景下數(shù)據(jù)的爆發(fā)性增長,容易引起量變產(chǎn)生質(zhì)變的反應(yīng),使數(shù)據(jù)的價(jià)值倍增,通過多維角度對數(shù)據(jù)分析得出的信用報(bào)告將更為合理、準(zhǔn)確、有效。構(gòu)建的個人信用評分模型也更為完善準(zhǔn)確,可以應(yīng)用于生活的各個方面,當(dāng)然,最終的應(yīng)用落腳點(diǎn)是企業(yè)和個人。通過對數(shù)據(jù)的分析,不僅可以得出當(dāng)前該企業(yè)或個人的信用系數(shù),而且更注重綜合多方情況預(yù)測出將來的變化,給出一個讓人信服的信用評分報(bào)告,減少各方不必要的損失。以最傳統(tǒng)的借貸為例,在大數(shù)據(jù)下每個人都無所遁形,在互聯(lián)網(wǎng)公司或其他機(jī)構(gòu)存在的信貸記錄都一目了然。個人信用評分模型可以給出直觀的信用評分?jǐn)?shù)據(jù),為今后的借貸等活動提供更全面的參考。
當(dāng)然,個人信用評分模型數(shù)據(jù)的來源和應(yīng)用不僅是借貸,應(yīng)用對象也不僅是只擁有借貸記錄的人群,它的應(yīng)用場景十分豐富多元,且直觀準(zhǔn)確,涉及日常生活的方方面面。不僅在金融領(lǐng)域發(fā)揮著重要作用,還在租房租車、酒店住宿、簽證和保險(xiǎn)等各個生活場景都有著廣泛應(yīng)用,并且對政府政策制定和公共服務(wù)水平的提升等都有著重要的促進(jìn)作用[8]。每個城市的發(fā)展情況不一樣,借助個人信用評分模型,可以為人們的衣食住行提供更好的保障,同時(shí)在此過程中利用互聯(lián)網(wǎng)獲取最為詳盡的信息以便充實(shí)信用評分模型。
3 結(jié)語
建立基于大數(shù)據(jù)的個人征信已是大勢所趨,大數(shù)據(jù)征信并非替代傳統(tǒng)征信,而是兩者相輔相成。大數(shù)據(jù)征信的引入能夠彌補(bǔ)傳統(tǒng)征信過程中存在的一些不足:一是通過利用獲得的大數(shù)據(jù)保證了信息來源的及時(shí)性、全面性和可靠性;二是大數(shù)據(jù)征信對信息具有更高的保密性;三是大數(shù)據(jù)征信能夠在很大程度上解決當(dāng)前構(gòu)建個人信用評分模型所面臨的信息不對稱造成的信用風(fēng)險(xiǎn)問題。盡管大數(shù)據(jù)可以從數(shù)據(jù)維度、覆蓋廣度和應(yīng)用場景等方面更精確地進(jìn)行信用風(fēng)險(xiǎn)評估,但當(dāng)覆蓋范圍超過一定限度時(shí)將會出現(xiàn)信用主體間信息匹配度低等一系列問題出現(xiàn),因此,在利用大數(shù)據(jù)征信的同時(shí)也不能忽視傳統(tǒng)征信的作用。通過對比分析得出結(jié)論,將二者相結(jié)合能夠最大限度地促進(jìn)新時(shí)代個人信用評分模型建設(shè)的發(fā)展。
參考文獻(xiàn):
[1] 佚名.帶您了解大數(shù)據(jù)[J].統(tǒng)計(jì)與經(jīng)濟(jì),2014(4):61.
[2] 陳建.信用評分模型技術(shù)與應(yīng)用[M].北京:中國財(cái)政經(jīng)濟(jì)出版社,2007.
[3] 姜琳.美國FICO評分系統(tǒng)述評[M].研究與討論,2006:81-84.
[4] 張琪,張鑫.我國個人征信體系市場化研究:以芝麻信用分為例[M].政策與商法研究,2015(16):173-175.
[5] Nir Kshetri.Big Datas Role in Expanding Access to Financial Services in China[J].International Journal of Information Management,2016(36):297-308.
[6] 王波,陳標(biāo),魏宇航.電信大數(shù)據(jù)在征信領(lǐng)域的應(yīng)用研究[J].移動通信,2016(8):80-83.
[7] 盧芮欣.大數(shù)據(jù)時(shí)代中國征信的機(jī)遇與挑戰(zhàn)[J].金融理論與實(shí)踐,2015(2):103-107.
[8] 馬小林.征信[J].金融理論與實(shí)踐,2017(8):41-43.