楊穎+趙守香
摘要:互聯(lián)網(wǎng)環(huán)境下,信用卡應用場景由線下轉向線上,面對日新月異的信用卡欺詐行為,傳統(tǒng)單一的反欺詐系統(tǒng)顯得力不從心。針對這種現(xiàn)象,通過分析了近幾年信用卡反欺詐的現(xiàn)狀和問題,結合現(xiàn)在信用卡欺詐特點,提出將規(guī)則引擎、數(shù)據(jù)挖掘模型、人工校驗有機結合起來,形成一套互助互補、更加高效的信用卡反欺詐模式。
關鍵詞:互聯(lián)網(wǎng);信用卡;反欺詐;數(shù)據(jù)挖掘
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)01-0050-03
Abstract: Under the background of the Internet, the credit card application scenarios turn the off-line to the on-line, faced with the rapid changes of the credit card fraud, the traditional single anti-fraud system seems powerless. In view of this phenomenon, through the analysis of the current situation and problems of credit card fraud in recent years, put forward a model combining rule engine, data mining model and manual check to form a set of Cooperative, complementary and more efficient anti-fraud mode of credit card.
Key words: Internet; credit card; anti-fraud; data mining
1 概述
近年來,我國經(jīng)濟迅速崛起,信用卡消費變得越來越普及,規(guī)模日益壯大。據(jù)《中國銀行卡產(chǎn)業(yè)發(fā)展藍皮書(2016)》顯示,截至2016年年底,銀行卡累計發(fā)卡量63.7億張,當年新增發(fā)卡量7.6億張,同比增長13.5%,并且近幾年一直保持著穩(wěn)定的增速。與此同時,2016年信用卡欺詐案件上萬起,詐騙金額持續(xù)攀升,由此帶來帶來的財產(chǎn)損失不計其數(shù),信用卡欺詐儼然成為影響信用卡環(huán)境健康發(fā)展的重要因素。
在互聯(lián)網(wǎng)時代,大數(shù)據(jù)無疑是把雙刃劍,在成為信用卡發(fā)展助力軍的同時也給銀行提出了前所未有的挑戰(zhàn)。隨著信用卡業(yè)務日益壯大,人力成本的不斷上升,以及詐騙手段的不斷更新,傳統(tǒng)的反欺詐方案已經(jīng)難以適應信用卡精細化管理的需求,構筑一道高效率的反欺詐安全盾牌勢在必行。
2 互聯(lián)網(wǎng)環(huán)境下信用卡欺詐的特點
快速興起的互聯(lián)網(wǎng)技術和廣泛使用的智能終端帶給人們便捷的生活的同時,也使得信用卡相關數(shù)據(jù)變得復雜和龐大。多樣化的支付方式和服務模式也同樣衍生出更新式的欺詐手法,[2]具體來說,近幾年信用卡欺詐有以下幾個特點:
①隱蔽性
近些年,互聯(lián)網(wǎng)支付的迅速盛行使得信用卡的支付從現(xiàn)場轉向背后,由線下轉向了線上,與原來傳統(tǒng)的實體介質支付不同,互聯(lián)網(wǎng)支付具有迅速交易、場景虛擬、方式多樣等特點。于是,這幾年很多的欺詐分子轉移到了互聯(lián)網(wǎng)渠道上作案,他們藏在互聯(lián)網(wǎng)的后面,利用短信、電話、郵件、釣魚網(wǎng)站等等方式竊取他人隱私,實施盜刷、套現(xiàn),使得信用卡反欺詐變得比以前更加棘手。
②專業(yè)性
近現(xiàn)代的專業(yè)技能也是這些詐騙分子的欺詐“利器”。他們具備一定的專業(yè)知識和技能,懂得利用一些網(wǎng)絡技術設計陷阱,研究信用卡申請、交易流程,尋找規(guī)則漏洞。比如,通過包裝個人信息、偽造互聯(lián)網(wǎng)行為等方式提高個人資質,騙領信用卡;入侵免費WIFI、變身銀行官方號碼偽基站、制造山寨二維碼、發(fā)送病毒短信、郵件等方式竊取客戶信用卡信息并實施盜取。
③規(guī)?;?/p>
互聯(lián)網(wǎng)時代,信用卡欺詐不僅“革新”了技術手段,也從“小團隊作戰(zhàn)”發(fā)展到有組織、有預謀的產(chǎn)業(yè)化作案,他們通過互聯(lián)網(wǎng)渠道進行勾結,跨境跨界,分工明確,涉及領域也十分廣泛,銀行、第三方支付、網(wǎng)絡運營商、電子商務等多個環(huán)節(jié)。這些不法分子從對銀行業(yè)務和規(guī)則的研究,到技術攻擊,再到客戶信息的騙取,流程清晰,計劃縝密,儼然已經(jīng)形成了一條黑色產(chǎn)業(yè)鏈。
結合現(xiàn)在信用卡欺詐手段的特點,反欺詐也要從多方位入手進行實施,比如硬件的革新,技術模型的完善,跨境跨界信息的共享等等,只有這樣,才能使信用卡欺詐無所遁形。
3 信用卡反欺詐的現(xiàn)狀與問題
銀行業(yè)具有天然的數(shù)據(jù)屬性。[1]隨著互聯(lián)網(wǎng)的普及、大數(shù)據(jù)技術的快速更新,商業(yè)銀行在信用卡反欺詐方面取得了不錯的成績。深耕現(xiàn)有的數(shù)據(jù),將客戶網(wǎng)上行為記錄、社交活動記錄等互聯(lián)網(wǎng)中的數(shù)據(jù)納入到信用卡反欺詐系統(tǒng)中,實現(xiàn)精準實時的反欺詐模式,提高了對欺詐行為的偵查、監(jiān)控能力。
雖然各大銀行積極進行反欺詐研究,但面對自身系統(tǒng)與反欺詐系統(tǒng)的銜接問題,規(guī)則模型的滯后性,反欺詐的實施效率問題,以及日新月異的欺詐手段,銀行也會陷入應接不暇的狀態(tài),其中反欺詐系統(tǒng)的研究是信用卡反欺詐的核心,也是信用卡中心亟待解決的問題。
一般來說反欺詐模型有兩種,一種是基于大量欺詐樣本、利用應用規(guī)則引擎和統(tǒng)計分析技術進行多維度多規(guī)則的組合,提煉出來的每條規(guī)則被賦予相應的權重,并以累計得分來判斷客戶行為是否存在欺詐,或者命中某一規(guī)則時直接進行警報,直接駁回客戶交易、申請。這種規(guī)則模型是現(xiàn)在銀行用得比較多的,簡單、易實施、準確性高,但規(guī)則引擎多依賴于專家、知識庫,無法適應快速變換的欺詐手段,容易出現(xiàn)誤判,而且人工運營成本比較高。另一種反欺詐模型是反欺詐數(shù)據(jù)挖掘模型,它采用數(shù)據(jù)挖掘方法,依賴于大量的數(shù)據(jù),這種模型對比規(guī)則模型優(yōu)勢體現(xiàn)在它可以囊括更多維的數(shù)據(jù)、預測能力強、學習能力好,準確度也會更高,但它需要不斷的樣本數(shù)據(jù)進入,才能更好進行分析預測。這幾年,不少銀行兩種模型都在研究實施,但模型孤立、單一,雖然有效果,但并沒有有效地發(fā)揮模型的所有價值,只有將兩種模型有機地結合起來,形成一種互助互補機制,才能實現(xiàn)反欺詐“1+1>2”的效果。endprint
4 互聯(lián)網(wǎng)環(huán)境下信用卡反欺詐系統(tǒng)
置身于復雜的互聯(lián)網(wǎng)的環(huán)境中,大數(shù)據(jù)技術在反欺詐系統(tǒng)中越來越受到重視。僅僅依靠傳統(tǒng)的統(tǒng)計方法和專家規(guī)則庫已經(jīng)無法滿足處理海量結構、非結構化數(shù)據(jù)的需求以及日新月異的欺詐手段,當然僅僅依靠數(shù)據(jù)挖掘模型也沒有辦法完全地實施反欺詐,只有規(guī)則、模型、人工有機結合在一起才能不斷完善反欺詐系統(tǒng)。[3]下面結合現(xiàn)有的研究理論和我國國內(nèi)信用卡反欺詐的背景,從規(guī)則識別、模型識別、人工校驗三個方面來構建互聯(lián)網(wǎng)環(huán)境下信用卡反欺詐系統(tǒng)(如圖1)。
4.1 規(guī)則引擎
規(guī)則引擎模塊是從海量的銀行數(shù)據(jù)以及互聯(lián)網(wǎng)數(shù)據(jù)中提取有效、有價值的部分,進行統(tǒng)計分析,選擇變量,進行數(shù)據(jù)預處理,提取規(guī)則,并賦予權重、閾值,作為規(guī)則引擎識別信用卡欺詐的核心。
4.1.1 選擇變量
變量的選擇主要是從用戶行為數(shù)據(jù)中提取能夠反映個人信用的變量。反映用戶信用的變量非常豐富,除了銀行中即有的一些變量,互聯(lián)網(wǎng)中也有很多,選取什么變量就有賴于各個銀行的訴求以及其所擁有的互聯(lián)網(wǎng)數(shù)據(jù)。不過這些變量大致可以分為以下幾個方面:
用戶數(shù)據(jù):用戶的性別、年齡、婚否、受教育程度、收入、戶口地……
征信數(shù)據(jù):用戶在銀行中的征信記錄,在各個征信系統(tǒng)的中記錄……
交易數(shù)據(jù):用戶儲蓄額度、交易頻次、交易地點、交易賬戶
非儲蓄數(shù)據(jù):理財、保險、基金等交易情況……
消費數(shù)據(jù):用戶消費時間、消費地點、消費金額、消費喜好……
社交數(shù)據(jù):用戶好友數(shù)量,身份,信用級別……
由于反欺詐模型的復雜性,候選變量可能上百上千,后續(xù)可以計算每個變量的IV值,IV值越高,說明這個變量越重要,可以進行保留;同時,比較每個變量的建模樣本和校驗樣本的WOE分布[5],選取具有穩(wěn)定性的變量;最后,在同類變量中利用聚類選取IV值最高的變量進入模型。[4]
4.1.2 數(shù)據(jù)的預處理
原始數(shù)量集通常不能直接進行計算和統(tǒng)計,我們需要對其進行預處理操作,以滿足統(tǒng)計、模型的要求。數(shù)據(jù)預處理主要分為一下幾部分:
①標準化:對于數(shù)據(jù)的量綱、數(shù)據(jù)量和計數(shù)方式進行統(tǒng)一
②補充缺失值:真實的數(shù)據(jù)集往往存在部分數(shù)據(jù)缺失的情況,針對缺失值占樣本極小數(shù)的情況下,可以直接刪除或者均值填補。但如果缺失值占比比較大,我們可以采取EM算法、最近鄰算法等。
③異常值:我們可以通過數(shù)據(jù)分布圖找到異常值,如箱圖,如果異常值對總體影響不大,一般將其舍棄。
④變量量化:多數(shù)情況下,原始數(shù)據(jù)中會出現(xiàn)非量化數(shù)據(jù),這種情況下,需要對變量進行量化,比如“男,女”量化為“1,2”。
⑤降維:由于高維數(shù)據(jù)很容易造成模型過擬合以及大大增加計算的復雜度,所以需要對變量進行降維處理,常用的方法有主成分分析、LASSO、LDA、PCA等。
4.1.3 設置規(guī)則
以專家為主,結合銀行業(yè)務邏輯和過往的經(jīng)驗設置規(guī)則,并對規(guī)則賦予權重或閾值,生成用戶欺詐分數(shù)。這種規(guī)則引擎能在一定程度上能有效地預防一些詐騙行為,但是由于我國目前征信體系并不完善,數(shù)據(jù)的滯后性和數(shù)據(jù)的不全面,使其不能跟上日益隱蔽和變化的欺詐手段,起不到真正的全面風險控制。
4.2 數(shù)據(jù)挖掘模型
通過有效的規(guī)則引擎,已經(jīng)可以攔截、警告一部分欺詐交易,接下來就需要通過數(shù)據(jù)挖掘模型對用戶行為進一步探索和根據(jù)客戶信息對交易、申請量化欺詐概率進行量化,預測其欺詐風險的程度。近幾年,反欺詐數(shù)據(jù)挖掘模型已經(jīng)在一些銀行中嶄露頭角,為反欺詐增加了一道更加堅固的安全保障。
4.2.1 神經(jīng)網(wǎng)絡模型
應用在反欺詐數(shù)據(jù)挖掘模型中的算法很多,如邏輯回歸、神經(jīng)網(wǎng)絡、決策樹、線性回歸等等,其中神經(jīng)網(wǎng)絡是經(jīng)過實踐后反響比較好的一種算法。神經(jīng)網(wǎng)絡是一種通過模擬動物神經(jīng)細胞工作特點,將若干個具有處理功能的神經(jīng)元連接到一起的數(shù)學模型。而BP算法是至今應用最為廣泛、成熟的神經(jīng)網(wǎng)絡,它具有良好自適應性和泛化能力。[5]對于一個三層的BP網(wǎng)絡,主要是友輸入層、隱含層、輸出層組成,其中輸入向量為,輸出層向量為O=,隱層輸入向量為Y=。[6]
公式(1)-(5)共同組成了三層BP神經(jīng)網(wǎng)絡。
將之前處理好的樣本數(shù)據(jù)放入模型中,反復對模型進行訓練、學習,使模型的誤差最小化,最后可使用ROC曲線和F-Score指標對模型進行評估,修正,使之可以達到對欺詐行為的預判,并且生成欺詐等級。
4.3 人工校驗
盡管規(guī)則引擎和數(shù)據(jù)挖掘模型還可以大大降低人力成本,但卻不能100%完全確定最終的結果,因為模型不可避免地會出現(xiàn)誤判的情況,如果武斷地阻止客戶交易、申請行為,或則輕易地放過可能存在欺詐的行為,那么可能會給銀行和客戶帶來難以挽回的損失或則失去良好的用戶體驗,所以為了最大化反欺詐的效果,人工校驗是必不可少的一個環(huán)節(jié)。
人工校驗主要通過信息調(diào)查、電話回訪、實地調(diào)研等方式進行信息反饋,校驗后的結果會再次反饋給模型[7],以便數(shù)據(jù)挖掘模型進行再訓練。在模型積累一定的高欺詐等級數(shù)據(jù)樣本后,再對樣本進行欺詐規(guī)則的提取,可以選擇關聯(lián)規(guī)則等方法,最后將提取好的規(guī)則載入規(guī)則引擎,這樣規(guī)則引擎的判斷結果可以更為準確有效,以此適應不斷變化的欺詐手段。
5 結束語
互聯(lián)網(wǎng)環(huán)境下的信用卡反欺詐管理是一項需要結合金融、法律、科技學科、互聯(lián)網(wǎng)技術的高復雜度綜合管理工程,除了加強信用卡的立法,促進其法制化,還需要更加完善的征信機制,建立合理有效的風險管理機制,和不斷革新反欺詐技術,只有這樣才能真實有效地實現(xiàn)反欺詐。
參考文獻:
[1] 彭惠新.大數(shù)據(jù)應用和全流程防控為信用卡風險管理護航[J].中國信用卡,2016,6:45-47.
[2] 吳載斌. 互聯(lián)網(wǎng)時代的信用卡欺詐風險管理淺析[J].中國信用卡,2017.04:15-17.
[3] 萬浩文. 基于數(shù)據(jù)挖掘的互聯(lián)網(wǎng)金酷反欺詐系統(tǒng)研究[D].廣州:暨南大學,2016:13-14.
[4] 岳曼娣,陳芝凱.基于評分模型的信用卡交易欺詐風險防范研究[J].中國信用卡,2014,6:53-56.
[5] 章毅,郭泉王,建勇.大數(shù)據(jù)分析的神經(jīng)網(wǎng)絡方法[J].工程科學與技術,2017,1:9-18.
[6] 韓力群. 人工神經(jīng)網(wǎng)絡理論、設計及應用[M].北京:化學工業(yè)出版社,2007:47-50.
[7] 丁慎勇. 反欺詐模型在電子銀行的應用研究[D].山東:山東大學,2014:27-31.endprint