• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于大數(shù)據(jù)技術(shù)的銀行卡異常交易檢測和監(jiān)管應(yīng)用研究

    2023-08-14 11:14:32趙啟斌張軍徐亮陳思樂益矣
    區(qū)域治理 2023年16期
    關(guān)鍵詞:欺詐銀行卡閾值

    趙啟斌,張軍,徐亮,陳思,樂益矣

    1.四川省大數(shù)據(jù)中心;2.西南財(cái)經(jīng)大學(xué)工商管理學(xué)院

    一、研究背景

    在金融系統(tǒng)當(dāng)中,打擊洗錢、欺詐交易等違法行為始終是金融風(fēng)險(xiǎn)防控的工作重點(diǎn)。一些危害十分嚴(yán)重的違法犯罪活動(dòng)通常與洗錢行為密不可分,犯罪分子謀求通過復(fù)雜的轉(zhuǎn)移手段將非法獲益轉(zhuǎn)化為合法的財(cái)產(chǎn),這一系列的活動(dòng)將會(huì)嚴(yán)重破壞正常的金融市場秩序,影響社會(huì)穩(wěn)定[1]。而欺詐交易通常是指欺詐者通過盜取客戶信息、偽造銀行卡等方式偽冒客戶進(jìn)行取款、轉(zhuǎn)賬、匯款等竊取客戶資金的行為[2]。

    從國家監(jiān)管體系的角度來看,打擊洗錢犯罪將遏止貪污腐敗、恐怖融資等犯罪活動(dòng),有效地維護(hù)國家安全、社會(huì)穩(wěn)定。另一方面,提前防范、及時(shí)干預(yù)欺詐交易的能力也體現(xiàn)了金融機(jī)構(gòu)維護(hù)客戶財(cái)產(chǎn)安全的決心,間接地影響著金融機(jī)構(gòu)的聲譽(yù)。因此,銀行作為金融風(fēng)險(xiǎn)防控的重要前線,基于監(jiān)管要求和自身利益的雙重因素,始終需要把反欺詐、反洗錢工作置于風(fēng)控體系中的重點(diǎn)位置。

    銀行卡欺詐與洗錢行為雖然動(dòng)機(jī)不同,但在具體的交易呈現(xiàn)方面存在共同點(diǎn),即犯罪分子為了躲避監(jiān)管,利用銀行的監(jiān)測漏洞,會(huì)極力將自身的交易行為偽裝成正常的客戶行為。然而犯罪分子與普通客戶的目的不同,同時(shí)考慮到實(shí)施偽裝所帶來的成本,這些在犯罪實(shí)施過程中所產(chǎn)生的交易流水不可能完全與普通客戶的行為一致,往往會(huì)暴露出與客戶交易習(xí)慣不相符或與客戶身份不相符的異常特征[3]。因此銀行在長期反欺詐、反洗錢的實(shí)踐中,都是針對交易流水進(jìn)行檢測,試圖通過交易特征區(qū)分出正常交易與異常交易,然后再對篩選出的異常交易實(shí)施精細(xì)化的人工調(diào)查核驗(yàn),由此可見其在異常交易檢測實(shí)施環(huán)節(jié)中擁有共同的理論基礎(chǔ)。例如中國人民銀行發(fā)布的《金融機(jī)構(gòu)大額交易和可疑交易報(bào)告管理辦法》中所提到的大額交易判定標(biāo)準(zhǔn)就是基于以上原則對交易流水進(jìn)行篩選。

    隨著互聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步,社會(huì)經(jīng)濟(jì)的持續(xù)發(fā)展,銀行的各項(xiàng)業(yè)務(wù)形態(tài)也在發(fā)生轉(zhuǎn)變。傳統(tǒng)的柜面業(yè)務(wù)已向多種渠道拓展,現(xiàn)已呈現(xiàn)出自動(dòng)化、線上化的特點(diǎn),并逐漸朝著智能化發(fā)展。ATM 機(jī)與POS 機(jī)的普及,網(wǎng)上銀行與移動(dòng)支付的出現(xiàn),使得以銀行卡為主體的交易業(yè)務(wù)迎來井噴式增長。僅2018 年,中國反洗錢監(jiān)測分析中心共接收報(bào)告機(jī)構(gòu)報(bào)送的大額交易報(bào)告9.19億份;可疑交易報(bào)告160.20 萬份①。交易量的增多、交易渠道的豐富意味著非法交易的模式變得更加復(fù)雜,這給傳統(tǒng)的異常交易檢測機(jī)制提出了挑戰(zhàn):既要保證能快速適應(yīng)交易模式的變化,又要保證異常交易的誤檢率保持在較低水平,否則檢出的異常交易數(shù)量過于龐大,給后續(xù)負(fù)責(zé)人工調(diào)查核驗(yàn)的風(fēng)控人員造成過大的工作壓力,進(jìn)而增加銀行的人力成本。

    大數(shù)據(jù)、機(jī)器學(xué)習(xí)相關(guān)技術(shù)隨著計(jì)算力的提升開始興起,其已廣泛運(yùn)用于各行各業(yè)當(dāng)中,取得了驚人的效果。而近年來,銀行業(yè)監(jiān)管機(jī)構(gòu)也愈發(fā)重視大數(shù)據(jù)技術(shù)在金融機(jī)構(gòu)風(fēng)險(xiǎn)防控中的應(yīng)用,《中國銀行業(yè)信息科技“十三五”發(fā)展 規(guī)劃監(jiān)管指導(dǎo)意見》中要求:“推進(jìn)大數(shù)據(jù)應(yīng)用,全面提升數(shù)據(jù)治理與數(shù)據(jù)服務(wù)能力”;《關(guān)于強(qiáng)化銀行卡磁條交易安全管理的通知》(銀辦發(fā)〔2017〕120 號文)要求:要“建立基于大數(shù)據(jù)技術(shù)的風(fēng)險(xiǎn)防控機(jī)制”“完成基于大數(shù)據(jù)技術(shù)的銀行卡風(fēng)險(xiǎn)防控系統(tǒng)建設(shè)”;在《關(guān)于印發(fā)銀行業(yè)金融機(jī)構(gòu)數(shù)據(jù)治理指引的通知》(銀保監(jiān)發(fā)〔2018〕22號)中,更是明確要求:“銀行業(yè)金融機(jī)構(gòu)應(yīng)當(dāng)加強(qiáng)數(shù)據(jù)應(yīng)用,持續(xù)改善風(fēng)險(xiǎn)管理方法,有效識別、計(jì)量、評估、監(jiān)測、報(bào)告和控制各類風(fēng)險(xiǎn)?!?/p>

    因此,運(yùn)用大數(shù)據(jù)技術(shù)加強(qiáng)銀行卡異常交易檢測能力,不僅是銀行風(fēng)控管理效率提升的內(nèi)在需求,從宏觀層面也是整個(gè)金融體系持續(xù)健康、穩(wěn)定發(fā)展的重要保障。

    二、文獻(xiàn)綜述

    近年來,隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的成熟,面對逐漸增加且形態(tài)多變的金融欺詐行為,金融機(jī)構(gòu)不得不投入資源研究自動(dòng)化的反欺詐、反洗錢系統(tǒng),以適應(yīng)科技的發(fā)展,滿足快速響應(yīng)的需求。

    當(dāng)前銀行業(yè)主要面臨的欺詐可以分為三大類型:客戶交易欺詐、內(nèi)部欺詐和洗錢。根據(jù)以往的報(bào)告來看,客戶交易欺詐和洗錢對金融機(jī)構(gòu)造成的損失占欺詐損失的一半以上[2]。而銀行卡詐騙與洗錢活動(dòng)往往都會(huì)暴露出與客戶交易習(xí)慣不相符或與客戶身份不相符的異常特征。吳朝平(2011)認(rèn)為雖然反洗錢與銀行卡反欺詐在實(shí)際工作中有一些差異,但反洗錢工作多年發(fā)展所形成的客戶身份識別、大額和可疑交易報(bào)告、客戶身份資料和交易記錄保存三大核心體系對反欺詐工作有重要的借鑒意義[3]。這兩類非法活動(dòng)都需要通過銀行的交易業(yè)務(wù)完成資金的轉(zhuǎn)移,銀行卡作為所有交易渠道的賬戶,其交易流水所體現(xiàn)出來的行為模式將作為判斷交易是否可疑的重要因素。

    高增安(2007)將交易模式依據(jù)合法性程度劃分為5 類:合法交易、慣常交易、異常交易、可疑交易、非法交易,其合法性依次遞減。其中慣常交易指符合客戶長期行為習(xí)慣的交易,對于一個(gè)正常的客戶,他的慣常交易都為合法交易,而對于長期參與洗錢的犯罪分子來說,他的交易行為很可能是可疑甚至非法的;異常交易則體現(xiàn)在其特征與以往的歷史記錄表現(xiàn)不一致或是與大多數(shù)交易表現(xiàn)不一致;可疑交易是指因不同于歷史記錄和(或)同類參照組而值得懷疑的交易,如滿足《金融機(jī)構(gòu)大額交易和可疑交易報(bào)告管理辦法》可疑交易標(biāo)準(zhǔn)的即為此類交易。反洗錢工作中需要通過數(shù)據(jù)分析手段區(qū)分慣常交易與異常交易,然后再通過人工調(diào)查取證判定慣常交易是否為合法交易、異常交易是否為非法交易。[1]

    根據(jù)業(yè)界實(shí)際應(yīng)用和學(xué)界的研究中可以總結(jié)如下:銀行卡異常交易檢測是銀行業(yè)反欺詐、反洗錢工作的重要環(huán)節(jié),也是后續(xù)人工調(diào)查取證工作的前提。

    三、建??傮w流程

    本研究實(shí)驗(yàn)所使用的數(shù)據(jù)為某銀行1 年的原始交易流水,交易渠道以線下交易為主。在將模型部署至檢測框架投入使用以前,首先需要對模型進(jìn)行設(shè)計(jì)、訓(xùn)練、調(diào)整,整個(gè)建模流程可以分為以下幾個(gè)主要階段。

    (1)數(shù)據(jù)預(yù)處理階段。首先需要對原始交易流水?dāng)?shù)據(jù)進(jìn)行清洗,對一些非人為產(chǎn)生的交易進(jìn)行排除,如系統(tǒng)自動(dòng)生成的手續(xù)費(fèi)、結(jié)息等。隨后將過濾后的數(shù)據(jù)送入特征工程流程,形成特征向量,完成訓(xùn)練集的收集。

    (2)模型訓(xùn)練階段。將訓(xùn)練集送入構(gòu)建好的稀疏自編碼器模型中進(jìn)行無監(jiān)督式訓(xùn)練,直到達(dá)到訓(xùn)練輪數(shù)的上限或是檢測到出現(xiàn)過擬合現(xiàn)象時(shí)提前終止訓(xùn)練。

    (3)檢測閾值劃定階段。利用訓(xùn)練好的稀疏自編碼器為訓(xùn)練集計(jì)算每條數(shù)據(jù)的還原度,通過整個(gè)數(shù)據(jù)集的還原度分布,劃定中、高風(fēng)險(xiǎn)的判定閾值。

    (4)模型檢驗(yàn)階段。對模型的訓(xùn)練效果進(jìn)行檢驗(yàn),如果沒有達(dá)到預(yù)期,則需要調(diào)整模型訓(xùn)練參數(shù)或是數(shù)據(jù)特征。

    (5)模型部署階段。如果模型的效果能達(dá)到預(yù)期,則可以部署至檢測框架中,開始對新出現(xiàn)的交易進(jìn)行實(shí)時(shí)檢測。

    (一)實(shí)時(shí)檢測總體流程

    為滿足銀行對于監(jiān)控交易情況以及及時(shí)干預(yù)非法交易行為的需求,框架必須具備實(shí)時(shí)檢測的能力,因此需要引入流式計(jì)算技術(shù)。當(dāng)一筆交易發(fā)生時(shí),檢測框架實(shí)時(shí)接收核心系統(tǒng)推送的交易流水報(bào)文信息,并查詢相應(yīng)的歷史流水進(jìn)行特征衍生工作從而組裝成為輸入向量,將輸入向量送入模型完成最終的檢測。

    對于某些滿足特定條件的交易,銀行需要將其篩選出來并直接進(jìn)行上報(bào)或是干預(yù),例如《金融機(jī)構(gòu)大額交易和可疑交易報(bào)告管理辦法》所規(guī)定的大額交易。然而這些交易的特征可能與模型學(xué)習(xí)到的導(dǎo)致交易異常的特征不一致,同時(shí)檢測模型也無法給出判定為異常的具體原因。另外,由于模型的判定依賴于歷史統(tǒng)計(jì)特征,而一些銀行卡可能是新開卡或是活躍度極低,從而缺乏足夠的歷史記錄作為參考,難以判斷風(fēng)險(xiǎn),對于此類交易只能通過某些硬性條件判斷其是否觸發(fā)了絕對風(fēng)險(xiǎn)。基于以上兩點(diǎn)原因,在使用模型對交易進(jìn)行檢測之前有必要根據(jù)這些規(guī)則設(shè)置一個(gè)過濾器,將這部分交易篩選出來,單獨(dú)輸出。

    (二)交易數(shù)據(jù)預(yù)處理方法

    1.利用風(fēng)控規(guī)則指導(dǎo)特征衍生

    針對稀疏自編碼器模型的學(xué)習(xí)特點(diǎn)和解釋困難的問題, 交易流水的特征衍生需要注重兩方面原則:(1)衍生出的特征對于檢測任務(wù)的有效性,即這些特征是否能更好地體現(xiàn)出正常交易與異常交易間的區(qū)別;(2)特征本身含義的可讀性,衍生出的特征如果能容易被解讀,那么在后續(xù)能幫助人們更好地理解模型的決策邏輯。

    銀行在過去的反欺詐、反洗錢工作中積累了大量的檢測規(guī)則,經(jīng)過長期的實(shí)踐證明,這些規(guī)則在一定程度上能夠反映出異常交易某些方面的特點(diǎn),因此特征的衍生可以參考這些規(guī)則。

    例如,參考規(guī)則“同一天在非發(fā)卡地發(fā)生夜間POS 消費(fèi)交易n 筆以上”,可以設(shè)計(jì)出特征變量“當(dāng)天到該條交易前在非發(fā)卡地發(fā)生夜間POS 消費(fèi)次數(shù)”。

    本研究結(jié)合實(shí)驗(yàn)數(shù)據(jù)的渠道特點(diǎn),整理了一系列銀行卡交易風(fēng)險(xiǎn)規(guī)則,其涵蓋了交易頻次、交易金額、交易地點(diǎn)三大主題,受限于銀行的保密制度,因此本研究不對這些規(guī)則的細(xì)節(jié)做進(jìn)一步闡述。

    基于整理出的規(guī)則,本研究為原始交易流水設(shè)計(jì)了四個(gè)類別的特征變量,用戶個(gè)人信息,本次交易之前t 天內(nèi)交易特征統(tǒng)計(jì)量,本次交易之前當(dāng)天內(nèi)交易特征統(tǒng)計(jì)量,以及本次交易基本信息。以下是各類特征變量的詳細(xì)說明。

    用戶的個(gè)人信息是在銀行卡辦理時(shí)采集的,包括用戶的ID,性別,年齡,辦卡時(shí)間,工作性質(zhì)等。這部分?jǐn)?shù)據(jù)表明了用戶的基本狀態(tài),時(shí)變特性非常小,在利用以往一段時(shí)間的數(shù)據(jù)進(jìn)行分析時(shí),可以認(rèn)為他們是不變。顯然,在一年的時(shí)間范圍內(nèi),年齡屬性也是不變的量,即使更新也很方便。

    用戶以往的交易信息是對銀行卡每一次使用的記錄,包含了銀行卡的使用時(shí)間,地點(diǎn),發(fā)生金額,余額變化等信息,對用戶過去較長一段時(shí)間的交易記錄進(jìn)行分析能夠挖掘出用戶對銀行卡的基本使用習(xí)慣。顯然,當(dāng)新的交易記錄與以往的使用習(xí)慣發(fā)生偏離時(shí),就是一個(gè)值得關(guān)注的風(fēng)險(xiǎn)信號。如果沒有以往的交易記錄作為依據(jù),模型判斷風(fēng)險(xiǎn)的魯棒性會(huì)非常差。例如,假設(shè)只考慮交易發(fā)生時(shí)間這一個(gè)因素,用戶A 習(xí)慣在凌晨交易,用戶B 從不在凌晨產(chǎn)生交易。那么當(dāng)用戶A 和B 同時(shí)產(chǎn)生一條在凌晨時(shí)段的交易記錄時(shí),缺少用戶習(xí)慣信息的系統(tǒng)只能對兩條信息給出相同的結(jié)果,即都是安全的或者都具有風(fēng)險(xiǎn)。而實(shí)際上用戶B 的交易信息透露出了風(fēng)險(xiǎn)信號。

    將以上四部分特征進(jìn)行合并即可形成訓(xùn)練數(shù)據(jù):

    2.訓(xùn)練樣本生成流程

    在利用歷史交易流水生成訓(xùn)練樣本集時(shí),必須保證每筆交易的歷史統(tǒng)計(jì)窗口一致,并且窗口中不能出現(xiàn)相對當(dāng)前交易而言的未來交易信息,因此在生成訓(xùn)練樣本時(shí)需要嚴(yán)格按照時(shí)間進(jìn)行計(jì)算。具體的生成流程分為五步。

    (1)將原始數(shù)據(jù)集按時(shí)間升序排序,并以銀行卡號進(jìn)行分組。

    (2)針對每個(gè)分組,根據(jù)設(shè)置的歷史統(tǒng)計(jì)特征時(shí)間跨度t 定位訓(xùn)練樣本生成起點(diǎn)。例如,原始數(shù)據(jù)集總時(shí)間跨度為360 天,且設(shè)置的歷史統(tǒng)計(jì)特征時(shí)間跨度t 為180 天,則選取第181 天的第1 條交易記錄作為訓(xùn)練樣本生成起點(diǎn)。

    (3)選取當(dāng)前交易記錄的前t 天數(shù)據(jù)進(jìn)行歷史統(tǒng)計(jì)特征的計(jì)算,依次向后迭代生成訓(xùn)練樣本。

    (4)若當(dāng)前交易記錄前t天內(nèi)交易記錄少于閾值n,則跳過此條交易記錄不為其生成訓(xùn)練樣本。這類信息不足的樣本會(huì)影響模型最終的效果,它們的風(fēng)險(xiǎn)判斷將交由過濾器進(jìn)行處理。此處的交易記錄數(shù)量閾值n 目前設(shè)置為3。

    (5)歸集每個(gè)分組生成的樣本形成完整的訓(xùn)練樣本集。

    (三)稀疏自編碼異常檢測模型

    1.模型構(gòu)建

    自動(dòng)編碼器模型從形態(tài)上分為編碼器和解碼器兩大部分,它們的網(wǎng)絡(luò)結(jié)構(gòu)互相對稱,模型的輸入維度與輸出維度一致。數(shù)據(jù)從編碼器流入經(jīng)過編碼被映射到新的特征空間,而解碼器會(huì)嘗試將經(jīng)過編碼的特征還原到原始特征空間上。

    在異常交易檢測任務(wù)中,基本思想是使用自動(dòng)編碼器學(xué)習(xí)如何將原始數(shù)據(jù)壓縮為較低維的表現(xiàn)形式,在這個(gè)過程中模型可以學(xué)習(xí)到各個(gè)變量間的相關(guān)性與相互作用。在正常交易數(shù)量遠(yuǎn)遠(yuǎn)大于異常交易數(shù)量的假設(shè)下,模型會(huì)更多地學(xué)習(xí)到正常交易特征間的關(guān)系,因此在嘗試還原由正常交易提取的中間特征時(shí),可以實(shí)現(xiàn)較小的還原誤差。反之,在嘗試還原由異常交易提取的中間特征時(shí),還原誤差將高于平均值。

    自動(dòng)編碼器的訓(xùn)練過程如下:

    (1)編碼階段。首先將訓(xùn)練數(shù)據(jù)X輸入編碼器,經(jīng)過編碼過程變換得到X?。中間層編碼得到的X?比輸入的數(shù)據(jù)維度低,但是能夠完整的還原輸入數(shù)據(jù)X。因此,X?中包含了X中所有有用的信息,并且具有不同的數(shù)據(jù)結(jié)構(gòu),X?即是提取到的特征,能夠以更精煉的形式表達(dá)樣本的信息。

    (2)解碼階段。將X?輸入解碼器,經(jīng)過解碼過程變換得到X?,X?的維度與原始數(shù)據(jù)X一致。

    (3)優(yōu)化階段。設(shè)置目標(biāo)函數(shù)為:

    由于深度神經(jīng)網(wǎng)絡(luò)模型具有極強(qiáng)的擬合能力,為了防止模型同時(shí)充分?jǐn)M合正常交易與異常交易特征,因此需要給自動(dòng)編碼器施加稀疏性限制,變型為稀疏自編碼器。

    稀疏自編碼的思想是通過抑制大部分神經(jīng)元的激活,得到一個(gè)能夠用最稀疏的單元表達(dá)原始數(shù)據(jù)特征的數(shù)據(jù)結(jié)構(gòu)。首先計(jì)算中間層的平均激活度:

    其中σ(Z)為輸入某樣本時(shí)中間層神經(jīng)元的激活值,m 表示輸入樣本數(shù)量。

    在目標(biāo)函數(shù)中加入懲罰項(xiàng):

    其中β為懲罰系數(shù),p通常取接近于0 的常數(shù),當(dāng)前取0.05。該懲罰項(xiàng)會(huì)迫使隱藏層所有節(jié)點(diǎn)的平均激活度接近0。

    2.風(fēng)險(xiǎn)等級分類閾值的選擇

    稀疏自編碼模型本身不具備檢測能力,檢測功能需通過比較還原誤差值實(shí)現(xiàn),首先定義還原誤差:

    還原誤差越大,則代表該筆交易與絕大部分交易間的差異越大,即風(fēng)險(xiǎn)程度越高。通過為還原誤差劃分分類閾值,可以區(qū)分正常交易與異常交易。更進(jìn)一步地,劃分高低兩個(gè)層級的分類閾值即可區(qū)分高風(fēng)險(xiǎn)與中風(fēng)險(xiǎn)交易。

    (1)利用訓(xùn)練好的稀疏自編碼模型為訓(xùn)練集中所有樣本計(jì)算出還原誤差,統(tǒng)計(jì)還原誤差的平均值μ以及標(biāo)準(zhǔn)差σ。

    (2)分別令中風(fēng)險(xiǎn)閾值δ與高風(fēng)險(xiǎn)閾值為:

    (四)實(shí)驗(yàn)分析

    本研究采用的實(shí)驗(yàn)數(shù)據(jù)為某銀行1 年的線下渠道原始交易流水?dāng)?shù)據(jù),未經(jīng)過標(biāo)注。原始交易流水經(jīng)過清洗、特征衍生、標(biāo)準(zhǔn)化等流程最終形成3,336,035條樣本,數(shù)據(jù)規(guī)模滿足模型訓(xùn)練需求。

    1.模型訓(xùn)練結(jié)果

    將數(shù)據(jù)集按7:3 的比例分為訓(xùn)練集與驗(yàn)證集,驗(yàn)證集用于模型訓(xùn)練過程中監(jiān)控過擬合現(xiàn)象。為訓(xùn)練過程設(shè)置早停策略,若是驗(yàn)證集的損失不再下降,則提前終止訓(xùn)練。

    訓(xùn)練集和驗(yàn)證集的損失十分接近,下降的趨勢也相似,因此可以斷定模型沒有出現(xiàn)過擬合現(xiàn)象。

    模型訓(xùn)練結(jié)束后,通過計(jì)算所有樣本的還原誤差,劃定中風(fēng)險(xiǎn)、高風(fēng)險(xiǎn)分類閾值。為更加清晰展現(xiàn)閾值選擇過程,本文從數(shù)據(jù)集中隨機(jī)抽樣出一個(gè)子集進(jìn)行還原誤差的統(tǒng)計(jì)。還原誤差呈現(xiàn)出明顯的長尾分布。絕大多數(shù)樣本的還原誤差都集中在0 附近,證明模型有效地?cái)M合了絕大多數(shù)樣本,同時(shí)有極少數(shù)尾部的樣本還原誤差遠(yuǎn)遠(yuǎn)高于平均值,這些樣本的特征可能與其他樣本有相當(dāng)大的差異。將還原誤差繪制成散點(diǎn)圖,并按照風(fēng)險(xiǎn)閾值的選定方法繪制分界線,僅有極少數(shù)的樣本被認(rèn)定為有風(fēng)險(xiǎn),說明模型具備區(qū)分正常交易與異常交易的能力。

    2.模型有效性驗(yàn)證與解釋

    由于缺乏有效的樣本標(biāo)簽,因此只能采用第三方模型對稀疏自編碼器檢測結(jié)果的有效性進(jìn)行交叉驗(yàn)證。

    在對數(shù)據(jù)集的檢測結(jié)果中隨機(jī)抽樣一部分正常交易,與檢測出的異常交易共同組成相對平衡的子數(shù)據(jù)集,分別使用支持向量機(jī)、決策樹、隨機(jī)森林、貝葉斯網(wǎng)絡(luò)進(jìn)行二分類的有監(jiān)督學(xué)習(xí),并輸出各模型對子數(shù)據(jù)集的預(yù)測結(jié)果。分別利用這些模型的預(yù)測結(jié)果與稀疏自編碼模型的檢測結(jié)果計(jì)算重合度,結(jié)果顯示最低重合度達(dá)到95%,證明本檢測方法有效。

    為了解釋模型的檢測邏輯,將上述提到的決策樹模型進(jìn)行可視化,并重點(diǎn)關(guān)注根節(jié)點(diǎn)附近的分叉邏輯,對決策樹節(jié)點(diǎn)分裂起到關(guān)鍵作用的有兩個(gè)特征:

    (1)S6——當(dāng)天到該條交易前夜間ATM 在發(fā)卡地交易(動(dòng)賬)次數(shù),節(jié)點(diǎn)分裂閾值為24.5;

    (2)S18——當(dāng)天到該條交易前其他時(shí)間段ATM 在發(fā)卡地交易(動(dòng)賬)次數(shù),節(jié)點(diǎn)分裂閾值為169.5;

    S6、S18 的分布與決策樹分裂邏輯呈現(xiàn)一定相關(guān)性,即某些特征的離群度可能會(huì)被模型視作分離正常交易與異常交易的關(guān)鍵因素。

    3.模型評價(jià)

    經(jīng)過訓(xùn)練, 模型基于3,336,035 條樣本數(shù)據(jù)中識別出疑似高風(fēng)險(xiǎn)樣本832 個(gè),疑似中風(fēng)險(xiǎn)645 個(gè),共計(jì)1477 個(gè)。經(jīng)模型識別的風(fēng)險(xiǎn)樣本數(shù)不到總樣本數(shù)的4.43?,高風(fēng)險(xiǎn)樣本約占2.49?,這將大大減輕銀行工作人員的追蹤和篩查工作量。

    通過分析得知,衍生出的統(tǒng)計(jì)特征能有效幫助模型區(qū)分正常交易與異常交易。同時(shí),這些統(tǒng)計(jì)特征具備較好的可讀性,在后續(xù)進(jìn)行人工核查時(shí),銀行工作人員可以通過這些特征的含義直觀地理解交易異常的可能原因,從而確定調(diào)查的方向。

    四、總結(jié)與展望

    本研究雖然在銀行卡異常交易檢測和監(jiān)管方面的研究取得了一定成果,但該方案更多是用于起步階段建設(shè),依然存在精度不足、解釋力度欠缺的問題,其實(shí)現(xiàn)的效果還不足以支撐起智能風(fēng)險(xiǎn)預(yù)警、智能高危行為阻斷等一些高級應(yīng)用,因此后續(xù)還將進(jìn)一步研究以下內(nèi)容。

    (1)在收集到一定符合訓(xùn)練標(biāo)準(zhǔn)的有標(biāo)簽樣本的前提下,嘗試?yán)糜斜O(jiān)督深度學(xué)習(xí)模型構(gòu)建輔助檢測模型,進(jìn)一步優(yōu)化檢測能力。

    (2)利用有標(biāo)簽的樣本庫,對檢測體系的能力進(jìn)行標(biāo)準(zhǔn)指標(biāo)的評估,同時(shí)研究基于樣本個(gè)體的檢測結(jié)果解釋方案。

    (3)利用逐漸完善的知識庫體系,探索更多能夠?qū)ψR別異常交易有影響的因素,并提煉相應(yīng)的特征補(bǔ)充至樣本庫中。

    (4)針對異常交易檢測的下游任務(wù)如反欺詐、反洗錢進(jìn)行更加深入的研究,嘗試將單筆交易為粒度的檢測信息融入以交易賬戶為視角的下游檢測任務(wù)中,引入圖計(jì)算等先進(jìn)技術(shù),構(gòu)建賬戶關(guān)系網(wǎng)絡(luò),從網(wǎng)絡(luò)中識別出疑似參與非法活動(dòng)的群體。

    除了單純的技術(shù)應(yīng)用研究,管理模式的研究也將會(huì)是未來的熱點(diǎn)。大數(shù)據(jù)時(shí)代的來臨,各行各業(yè)都開始嘗試將人工智能技術(shù)應(yīng)用于多種業(yè)務(wù)場景中,而該領(lǐng)域目前正處于飛速發(fā)展的階段,各種理論、模型甚至是硬件日新月異。銀行掌握著海量的金融數(shù)據(jù),其本身就是一筆無法估量的財(cái)富。然而出于數(shù)據(jù)安全與用戶隱私的限制,要充分挖掘這些數(shù)據(jù)的價(jià)值,銀行必須在內(nèi)部培養(yǎng)起融匯多學(xué)科的研究型團(tuán)隊(duì),在充分理解銀行業(yè)務(wù)模式的基礎(chǔ)上,注重科技上的創(chuàng)新,而與之對應(yīng)的即是建立起合適的先進(jìn)管理體系。

    可以預(yù)見,在監(jiān)管不斷收緊,大眾對金融服務(wù)水平要求不斷提高的未來,銀行業(yè)乃至整個(gè)金融行業(yè)的機(jī)構(gòu)都會(huì)逐步加大自研項(xiàng)目的比例。特別是一些與銀行利益息息相關(guān)的業(yè)務(wù)也離不開智能化技術(shù)的支持,例如信貸風(fēng)控、獲客營銷等,以往的行業(yè)經(jīng)驗(yàn)與通用的解決方案將有很大機(jī)率被個(gè)性化的需求所擊垮,因此越早地發(fā)揮出數(shù)據(jù)的能量,就越能在激烈的競爭環(huán)境中搶占先機(jī)。在外部壓力和內(nèi)部需求的雙重作用下,銀行有充分的動(dòng)力投入到這場變革之中,而在這個(gè)以數(shù)據(jù)驅(qū)動(dòng)為主全新體系下,有別于傳統(tǒng)的管理模式將會(huì)是創(chuàng)新的發(fā)動(dòng)機(jī)。因此,伴隨著技術(shù)的發(fā)展,適用于銀行智能化業(yè)務(wù)的管理模式更迭將會(huì)成為一個(gè)充滿意義的研究方向。

    注釋

    ①數(shù)據(jù)來源,中國人民銀行反洗錢報(bào)告2018.

    猜你喜歡
    欺詐銀行卡閾值
    關(guān)于假冒網(wǎng)站及欺詐行為的識別
    關(guān)于假冒網(wǎng)站及欺詐行為的識別
    復(fù)雜背景下銀行卡號識別方法研究
    銀行卡被同學(xué)擅自透支,欠款誰償還?
    公民與法治(2020年3期)2020-05-30 12:29:58
    小波閾值去噪在深小孔鉆削聲發(fā)射信號處理中的應(yīng)用
    警惕國際貿(mào)易欺詐
    中國外匯(2019年10期)2019-08-27 01:58:04
    基于自適應(yīng)閾值和連通域的隧道裂縫提取
    誰劃走了銀行卡里的款
    比值遙感蝕變信息提取及閾值確定(插圖)
    河北遙感(2017年2期)2017-08-07 14:49:00
    室內(nèi)表面平均氡析出率閾值探討
    龙江县| 成安县| 冀州市| 石门县| 舟山市| 阿鲁科尔沁旗| 什邡市| 沽源县| 平阴县| 杭州市| 和硕县| 通许县| 太和县| 庆阳市| 贵定县| 伊川县| 新巴尔虎右旗| 天门市| 莱西市| 石嘴山市| 麟游县| 怀集县| 商河县| 南华县| 平度市| 贡山| 大新县| 宜丰县| 东丽区| 会东县| 大田县| 兴宁市| 普兰店市| 禄丰县| 阳原县| 公主岭市| 永德县| 夏河县| 富锦市| 宝兴县| 江城|