楊 晟,施元元
(中訊郵電咨詢(xún)?cè)O(shè)計(jì)院有限公司,上海 200050)
基于電信運(yùn)營(yíng)商大數(shù)據(jù)分析的個(gè)人征信評(píng)估模型
楊 晟,施元元
(中訊郵電咨詢(xún)?cè)O(shè)計(jì)院有限公司,上海 200050)
電信運(yùn)營(yíng)商在征信領(lǐng)域極具價(jià)值,主要研究了如何利用電信運(yùn)營(yíng)商大數(shù)據(jù)分析結(jié)果來(lái)構(gòu)建個(gè)人征信評(píng)估模型。
電信運(yùn)營(yíng)商;互聯(lián)網(wǎng);身份信息;位置信息
電信運(yùn)營(yíng)商目前在征信行業(yè)被視為一塊可口的蛋糕。電信運(yùn)營(yíng)商在征信行業(yè)具有天然優(yōu)勢(shì):①數(shù)據(jù)覆蓋極廣。手機(jī)號(hào)碼基本人手一個(gè),三大運(yùn)營(yíng)商基本能覆蓋所有人群。在這一點(diǎn)上,即使BAT等互聯(lián)網(wǎng)巨頭也是難以望其項(xiàng)背。②隨著實(shí)名制的普及,身份證號(hào)碼、手機(jī)號(hào)碼、姓名等真實(shí)身份信息之間的關(guān)聯(lián)越來(lái)越強(qiáng),大大降低了征信行業(yè)的偽冒風(fēng)險(xiǎn),冒名申請(qǐng)、代辦養(yǎng)卡等行為的難度陡增。③運(yùn)營(yíng)商數(shù)據(jù)能方便地構(gòu)建出個(gè)人關(guān)系網(wǎng)。④運(yùn)營(yíng)商能提供位置信息的變化,從而建立征信預(yù)警機(jī)制。
電信運(yùn)營(yíng)商的數(shù)據(jù)優(yōu)勢(shì)表現(xiàn)在全面、及時(shí)、多形式等方面,如何提取有價(jià)值信息,構(gòu)建合理的個(gè)人征信評(píng)估模型,是本文研究的方向。
我們將從用戶(hù)基本信息、消費(fèi)信息、活動(dòng)信息、通話分析、數(shù)據(jù)流量分析、關(guān)系分析六大類(lèi)型數(shù)據(jù)著手,聚合形成個(gè)人的信用評(píng)分。
用戶(hù)基本信息包括:①身份證件信息。運(yùn)營(yíng)商認(rèn)可的實(shí)名制證件包括了身份證、警官證、軍官證、戶(hù)口本、港澳居民通行證、臺(tái)胞證這幾種。這部分信息主要用于驗(yàn)真使用,對(duì)于軍官證、警官證可以進(jìn)行加分處理。②性別信息。性別信息可從身份證件信息中提取。③年齡信息。年齡信息可從身份證件信息中提取,不同年齡段設(shè)置不同信息分值。④家庭住址。用戶(hù)預(yù)留在運(yùn)營(yíng)商處的住址信息,如果用戶(hù)有寬帶業(yè)務(wù),則可以設(shè)定為寬帶地址。⑤入網(wǎng)時(shí)間。用戶(hù)名下最早號(hào)碼的入網(wǎng)時(shí)間,入網(wǎng)越早信用度越高。⑥VIP等級(jí)。用戶(hù)在運(yùn)營(yíng)商處最高的VIP等級(jí)。⑦號(hào)碼數(shù)量。由于雙卡手機(jī)的普及,一個(gè)身份證號(hào)碼可能有多個(gè)號(hào)碼。⑧名下其他業(yè)務(wù)。比如企業(yè)業(yè)務(wù)、寬帶業(yè)務(wù)、專(zhuān)線業(yè)務(wù)等。用戶(hù)基本信息主要用來(lái)貸前驗(yàn)真使用,可以作為用戶(hù)信用分的基本分。
消費(fèi)信息包括:①名下總消費(fèi)。用戶(hù)名下所有業(yè)務(wù)的月度總消費(fèi),可以是半年的平均消費(fèi)。②名下最高套餐評(píng)級(jí)。根據(jù)用戶(hù)不同套餐類(lèi)型,設(shè)定不同評(píng)級(jí)分。③套餐外消費(fèi)金額。用戶(hù)超過(guò)套餐的消費(fèi)金額。④消費(fèi)變化趨勢(shì)。月度消費(fèi)的變化趨勢(shì)。⑤終端型號(hào)。用戶(hù)所使用終端的品牌、型號(hào)。⑥終端價(jià)格。按1 000元以下、1 000~2 000元、2 000~4 000元、4 000元以上四檔分檔計(jì)算信用分。⑦終端更換次數(shù)。提取一年內(nèi)用戶(hù)終端更換次數(shù)。⑧終端更換價(jià)格變化趨勢(shì)。根據(jù)更換終端的價(jià)格變化情況計(jì)算信用分。⑨欠費(fèi)次數(shù)。月均欠費(fèi)次數(shù)。
活動(dòng)信息包括:①住宅區(qū)域。根據(jù)用戶(hù)在夜晚(比如每日22:00—6:00)登錄基站次數(shù)最多的位置列為用戶(hù)的住宅區(qū)域??梢苑譃楦邫n住宅、普通住宅、城中村、鄉(xiāng)鎮(zhèn)農(nóng)村、廠區(qū)等不同檔次區(qū)域,分別計(jì)算信用分。②工作區(qū)域。根據(jù)用戶(hù)在工作日工作時(shí)間(非周末的9:30—11:00,14:00—16:00)的位置列為用戶(hù)的工作區(qū)域??梢苑譃楣I(yè)區(qū)、高檔寫(xiě)字樓、普通寫(xiě)字樓、科技園區(qū)、政府機(jī)關(guān)、軍隊(duì)、學(xué)校、醫(yī)院等各種類(lèi)型,分別計(jì)算信用分。③晚餐區(qū)域。根據(jù)用戶(hù)在晚餐時(shí)間(18:00—19:30)位置列為用戶(hù)的晚餐區(qū)域。將晚餐區(qū)域分類(lèi),可以分為高檔飯店、普通飯店、綜合體、快餐等,根據(jù)用戶(hù)在不同場(chǎng)所出現(xiàn)的次數(shù)分別計(jì)算信用分。④娛樂(lè)區(qū)域。根據(jù)用戶(hù)在晚餐后時(shí)間(19:30—22:00)位置,列為用戶(hù)娛樂(lè)區(qū)域。將娛樂(lè)區(qū)域分類(lèi),可以分為KTV、會(huì)所、電影院、超市等,根據(jù)用戶(hù)在不同場(chǎng)所出現(xiàn)的次數(shù)分別計(jì)算信用分。⑤漫游天數(shù)。根據(jù)用戶(hù)月均漫游到外地的天數(shù),計(jì)算信用分。
用戶(hù)活動(dòng)位置的判斷主要基于主服務(wù)小區(qū)更新信息、MR采樣信息等判斷,同時(shí),前期需要對(duì)不同場(chǎng)所進(jìn)行手動(dòng)分類(lèi)。比如對(duì)高檔住宅、普通住宅等做好分類(lèi)標(biāo)簽。
通話分析的內(nèi)容包括:①單月總語(yǔ)音時(shí)間;②單月總通話次數(shù);③單月本地通話次數(shù);④省內(nèi)國(guó)內(nèi)漫游通話次數(shù);⑤通話時(shí)間次數(shù)變化趨勢(shì)分析。
根據(jù)用戶(hù)的通話次數(shù)、通話時(shí)間、不同漫游地通話次數(shù)、通話時(shí)間次數(shù)變化趨勢(shì)對(duì)用戶(hù)進(jìn)行信用評(píng)分。
數(shù)據(jù)流量分析的內(nèi)容包括:①數(shù)據(jù)流量。用戶(hù)月均數(shù)據(jù)流量使用量。②數(shù)據(jù)流量使用變化趨勢(shì)分析。③即時(shí)通訊類(lèi)流量占比。④各類(lèi)流量的比例,比如視頻流量、游戲流量等。⑤淘寶、京東等消費(fèi)類(lèi)網(wǎng)站訪問(wèn)次數(shù)。
根據(jù)用戶(hù)的月均流量使用情況、變化趨勢(shì)、不同流量占比、消費(fèi)類(lèi)網(wǎng)站訪問(wèn)次數(shù)對(duì)用戶(hù)進(jìn)行信用評(píng)分。
關(guān)系分析的內(nèi)容包括:①快遞人員通話次數(shù)。結(jié)合號(hào)碼庫(kù),計(jì)算月均和快遞人員的通話次數(shù)。②司機(jī)人員通話次數(shù)。計(jì)算月均和滴滴快車(chē)等網(wǎng)約車(chē)、出租車(chē)司機(jī)通話次數(shù)。③外賣(mài)人員通話次數(shù)。計(jì)算月均和餓了嗎等外賣(mài)騎手的通話次數(shù)。④親密聯(lián)系人。提取多位,比如10位頻繁通話聯(lián)系人。
基于上述6類(lèi)指標(biāo),采用多指標(biāo)聚類(lèi)系數(shù)化的方法對(duì)上述不同數(shù)據(jù)進(jìn)行整合,形成個(gè)人的信用評(píng)分,計(jì)算公式:消費(fèi)信息得分+活動(dòng)信息得分+通話分析得分+數(shù)據(jù)流量得分+關(guān)系分析得分×用戶(hù)基本信息得分=個(gè)人信用得分。電信運(yùn)營(yíng)商可以直接提供個(gè)人信用得分供征信企業(yè)使用,也可以給出各個(gè)子模塊得分,由征信企業(yè)自行使用。
目前,用于征信的數(shù)據(jù)多種多樣,比如基本的社保、公積金信息,也有互聯(lián)網(wǎng)企業(yè)的相關(guān)信息,比如芝麻信用等。這些信息的實(shí)時(shí)性都沒(méi)有運(yùn)營(yíng)商的高,手機(jī)的普及使得運(yùn)營(yíng)商時(shí)刻掌握運(yùn)用的位置估計(jì)、通信行為,可以據(jù)此建立征信風(fēng)險(xiǎn)預(yù)警體系。
根據(jù)用戶(hù)通信行為的變化,對(duì)用戶(hù)進(jìn)行提前征信預(yù)警,可以從下列幾個(gè)方面評(píng)分:①名下手機(jī)號(hào)碼增加。②通信行為變化。例如通話次數(shù)顯著減少,通話時(shí)長(zhǎng)縮短;③和特定高風(fēng)險(xiǎn)用戶(hù)聯(lián)系增多。比如高利貸提供者、境外賭場(chǎng)、彩票站等;④待機(jī)狀態(tài)變化。關(guān)機(jī)次數(shù)增多、掛機(jī)次數(shù)增多、關(guān)機(jī)時(shí)間增加等;⑤親密聯(lián)系人有急劇變化。⑥出現(xiàn)在高風(fēng)險(xiǎn)位置。例如澳門(mén)、拉斯維加斯等賭場(chǎng)區(qū)域或者傳銷(xiāo)聚集區(qū)域,例如以前的廣西北海。⑦異常網(wǎng)絡(luò)行為。比如接入賭博類(lèi)APP、用搜索引擎搜索“賭博”“高利貸”等關(guān)鍵詞。
一旦用戶(hù)出現(xiàn)上述非正常的通信行為,偏離其長(zhǎng)期平均的模式,即可發(fā)出對(duì)該用戶(hù)的征信預(yù)警,供征信企業(yè)使用。
如果用戶(hù)已經(jīng)成為高風(fēng)險(xiǎn)人員,例如出現(xiàn)逾期不還的情況,或者已被提前預(yù)警警示,則我們利用運(yùn)營(yíng)商大數(shù)據(jù)分析可對(duì)用戶(hù)進(jìn)行高風(fēng)險(xiǎn)警示判斷,基本模型為:出現(xiàn)在高鐵站、機(jī)場(chǎng)、本市高速?lài)?guó)道出城口等區(qū)域;訪問(wèn)攜程、去哪兒、各大航空公司官網(wǎng)等出行相關(guān)網(wǎng)站、APP,或與此類(lèi)業(yè)務(wù)提供商通話;本人或親密聯(lián)系人長(zhǎng)時(shí)間非正常時(shí)間關(guān)機(jī),比如工作日連續(xù)關(guān)機(jī)超過(guò)5 h。一旦出現(xiàn)上述行為,則可以觸發(fā)高風(fēng)險(xiǎn)警示,并提供給相關(guān)征信企業(yè)。
電信運(yùn)營(yíng)商在征信領(lǐng)域具有天然優(yōu)勢(shì),傳統(tǒng)的征信方法和電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)公司提供的大數(shù)據(jù)分析應(yīng)該起到互補(bǔ)的作用。電信運(yùn)營(yíng)商大數(shù)據(jù)分析對(duì)傳統(tǒng)征信無(wú)力涉及領(lǐng)域的覆蓋,極大提升了征信服務(wù)的實(shí)時(shí)性、提高征信結(jié)果的準(zhǔn)確性。同時(shí),電信運(yùn)營(yíng)商也必須承擔(dān)相應(yīng)義務(wù),比如如何確保用戶(hù)數(shù)據(jù)的匿名狀態(tài),對(duì)數(shù)據(jù)的匿名安全性作出評(píng)估,如果數(shù)據(jù)交易的對(duì)象具備對(duì)數(shù)據(jù)復(fù)原身份屬性的能力,則應(yīng)當(dāng)限制此類(lèi)交易。在交易協(xié)議中,需要通過(guò)協(xié)議來(lái)明確交易各方對(duì)于數(shù)據(jù)安全的責(zé)任,尤其約束交易方不得再進(jìn)行身份識(shí)別性的利用。
F626
A
10.15913/j.cnki.kjycx.2017.20.056
2095-6835(2017)20-0056-02
〔編輯:張思楠〕