(江西警察學(xué)院,江西 南昌 330100)
20世紀(jì)50年代,隨著計(jì)算機(jī)的出現(xiàn)和計(jì)算機(jī)圖形學(xué)的發(fā)展,人們開始利用計(jì)算機(jī)技術(shù)在屏幕上繪制出各種數(shù)據(jù)的圖形圖表,開啟了數(shù)據(jù)可視化的先河。最初,可視化技術(shù)被大量應(yīng)用于統(tǒng)計(jì)學(xué)領(lǐng)域,主要用來繪制統(tǒng)計(jì)圖表,如圓環(huán)圖、餅圖、柱狀圖、直方圖、散點(diǎn)圖等;21世紀(jì)初,數(shù)據(jù)可視化技術(shù)得到進(jìn)一步發(fā)展,逐漸應(yīng)用于地理信息系統(tǒng)、大數(shù)據(jù)挖掘分析、商務(wù)智能等,有效地促進(jìn)了人類對不同類型數(shù)據(jù)的分析與理解。[1]
在經(jīng)濟(jì)犯罪偵查中,偵查員常常要分析大量的涉案資金交易數(shù)據(jù),我們稱之為違法資金數(shù)據(jù)分析。違法資金數(shù)據(jù)分析通常要涉及資金數(shù)據(jù)的采集、清洗、數(shù)據(jù)質(zhì)量檢測、資金流展示、多維度分析、涉案資金交易的溯源與追蹤、嫌疑人/嫌疑賬戶定位等各種業(yè)務(wù)需求。在解決這些業(yè)務(wù)需求過程中,不僅要進(jìn)行統(tǒng)計(jì)嫌疑賬戶的交易金額、研判出賬/入賬的特征等簡單分析,而且要在大數(shù)據(jù)背景下實(shí)現(xiàn)關(guān)聯(lián)交易的挖掘、找出犯罪團(tuán)伙、刻畫犯罪資金流向等復(fù)雜分析。數(shù)據(jù)可視化分析技術(shù)的引入很好地解決了以上問題,在違法資金數(shù)據(jù)分析中發(fā)揮了至關(guān)重要的作用。
由于可視化分析技術(shù)在違法資金數(shù)據(jù)分析中的廣泛應(yīng)用,我們可以抽象出資金數(shù)據(jù)可視化分析的概念。資金數(shù)據(jù)可視化分析是指將涉案資金數(shù)據(jù)以圖形圖像的形式表示出來,并利用數(shù)據(jù)分析和開發(fā)工具進(jìn)行統(tǒng)計(jì)、分析、研判并發(fā)掘其中的涉案線索,形成破案情報(bào)的技術(shù)處理過程。數(shù)據(jù)可視化技術(shù)在違法資金數(shù)據(jù)分析領(lǐng)域的應(yīng)用,不僅僅是對涉案資金數(shù)據(jù)的簡單圖形化,而是主要體現(xiàn)在對資金數(shù)據(jù)的深度挖掘。
資金數(shù)據(jù)可視化分析中要處理的最核心的數(shù)據(jù)就是資金交易數(shù)據(jù)。相比其他各種數(shù)據(jù),資金交易數(shù)據(jù)是一種特點(diǎn)鮮明的數(shù)據(jù)。首先,資金交易數(shù)據(jù)主要是結(jié)構(gòu)化數(shù)據(jù)。資金交易數(shù)據(jù)的字段通常包含交易卡號、交易賬號、交易戶名、交易證件號碼、交易時(shí)間、交易金額、交易余額、收付標(biāo)志、交易對手賬卡號、現(xiàn)金標(biāo)志、對手戶名、對手身份證號、開戶行、交易場所、IP地址等交易信息。這些交易字段中最核心的是交易雙方的賬號、戶名、交易金額、交易時(shí)間,收付標(biāo)志。無論是銀行賬卡號的交易還是第三方支付交易,對這些核心交易字段進(jìn)行標(biāo)準(zhǔn)化相對較容易,也便于對調(diào)單數(shù)據(jù)進(jìn)行整體清洗。其次,由于資金交易數(shù)據(jù)有賬戶主體之間出賬和入賬(收和付)的關(guān)聯(lián)關(guān)系,使得數(shù)據(jù)抽象之后不僅適合關(guān)系型數(shù)據(jù)庫的存儲(chǔ)和處理,也適用于圖數(shù)據(jù)庫的存儲(chǔ)和計(jì)算。圖數(shù)據(jù)庫是基于圖模型的數(shù)據(jù)庫。相比較于關(guān)系型數(shù)據(jù)庫,圖數(shù)據(jù)庫是真正注重“關(guān)系”的數(shù)據(jù)庫。圖的邏輯可以很好地解決大數(shù)據(jù)時(shí)代經(jīng)常遇到的關(guān)聯(lián)數(shù)據(jù)分析問題,比如,繪制用戶社交關(guān)系圖譜做社交影響力排名、好友推薦;通過繪制資金交易圖譜做大數(shù)據(jù)征信、反欺詐等應(yīng)用;構(gòu)建設(shè)備關(guān)系網(wǎng)絡(luò)圖譜實(shí)現(xiàn)物聯(lián)網(wǎng)建模分析、供電網(wǎng)絡(luò)建模分析等等。圖數(shù)據(jù)庫支持?jǐn)?shù)據(jù)的實(shí)時(shí)增刪查改,保證ACID事務(wù)性①ACID,指數(shù)據(jù)庫事務(wù)正確執(zhí)行的四個(gè)基本要素的縮寫。包含:原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)。,同時(shí)提供可視化、高可用、備份恢復(fù)等功能。
正是由于資金數(shù)據(jù)的上述特征,在處理、分析大量資金交易數(shù)據(jù)時(shí),可以將資金數(shù)據(jù)以圖數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)并進(jìn)行挖掘。對資金數(shù)據(jù)可視化分析中正需要解決圖數(shù)據(jù)庫擅長的大量關(guān)聯(lián)數(shù)據(jù)分析問題。比如,對大額可疑資金的溯源、追蹤資金流的去向、厘清嫌疑賬戶之間的交易關(guān)系、挖掘資金交易中的核心犯罪證據(jù)等。可以說,大數(shù)據(jù)時(shí)代違法資金數(shù)據(jù)分析的需求、資金數(shù)據(jù)的特征和圖數(shù)據(jù)庫的優(yōu)勢三者一拍即合,產(chǎn)生了資金數(shù)據(jù)可視化分析這個(gè)應(yīng)用場景。
資金數(shù)據(jù)可視化分析可以應(yīng)用圖計(jì)算的很多成熟理論。比如,在虛開增值稅專用發(fā)票犯罪的偵查中,偵查員常常要解決查找資金環(huán)路的問題,如果采取傳統(tǒng)關(guān)系型數(shù)據(jù)挖掘方法,從海量的資金數(shù)據(jù)中進(jìn)行篩選,效率比較低,分析結(jié)果也不夠直觀,缺乏易讀性。而將資金數(shù)據(jù)轉(zhuǎn)換為圖形,同時(shí)在底層以圖數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲(chǔ)和計(jì)算,從資金交易流中查找出資金交易環(huán)路問題可以抽象成從具有多重邊的有向圖中搜索環(huán)路問題,而這個(gè)問題的求解就有很多成熟的算法可以選擇了。事實(shí)上,圖的環(huán)路搜索一直以來都是各個(gè)領(lǐng)域研究圖論算法應(yīng)用的熱點(diǎn),尤其是針對搜索最小獨(dú)立閉合環(huán)路的算法,就有深度優(yōu)先搜索算法、基于鄰接矩陣變換算法、基于生成樹和余樹的搜索算法等。[2]
資金數(shù)據(jù)可視化分析的價(jià)值主要體現(xiàn)在數(shù)據(jù)觀察、視覺美感、洞察問題、科學(xué)分析、決策支持等方面?,F(xiàn)代經(jīng)濟(jì)犯罪偵查中要分析的資金數(shù)據(jù)量巨大,為了偵破個(gè)案,偵查員常常要調(diào)取數(shù)百萬條甚至千萬條資金交易數(shù)據(jù)和其他情報(bào)數(shù)據(jù)。資金數(shù)據(jù)的可視化分析一方面可以將枯燥乏味的數(shù)據(jù)轉(zhuǎn)化為豐富生動(dòng)的視覺效果,有助于簡化偵查員的分析過程,提高觀察、分析數(shù)據(jù)的效率;另一方面,可視化分析技術(shù)可以將數(shù)據(jù)集生成資金數(shù)據(jù)圖像,將數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的視覺形式表示,并提供交互能力,這有助于分析人員從不同的維度發(fā)現(xiàn)、挖掘涉案資金數(shù)據(jù)背后的規(guī)律,不僅對偵破個(gè)案具有指導(dǎo)價(jià)值,而且會(huì)為把握相關(guān)經(jīng)濟(jì)犯罪規(guī)律,預(yù)測、預(yù)防類罪發(fā)案提供有效決策支持。
資金數(shù)據(jù)可視化工具大致可以分為三類。第一類是基于軟件的可視化工具,用戶上手比較容易,只要學(xué)會(huì)軟件操作,就可以進(jìn)行可視化分析,對于使用者的技術(shù)要求較低。該類軟件一般可以單機(jī)使用,運(yùn)行速度快,初級版一般免費(fèi),但高級功能可能要收費(fèi)。第二類是基于網(wǎng)絡(luò)平臺(tái)的可視化工具,資金數(shù)據(jù)的可視化網(wǎng)絡(luò)平臺(tái)一般部署于公安專網(wǎng),以經(jīng)偵領(lǐng)域居多,公安民警必須使用數(shù)字證書登錄使用?;谄脚_(tái)的可視化工具在服務(wù)器上遠(yuǎn)程運(yùn)行,速度一般,可視化功能相對固定,不夠靈活。第三類是基于編程的數(shù)據(jù)可視化工具,這類工具屬于專家級應(yīng)用軟件,需要用戶具備一定的編程能力和數(shù)據(jù)分析基礎(chǔ),入門比較困難,但掌握好之后功能調(diào)用靈活,數(shù)據(jù)處理效率高。
基于軟件的可視化工具有Power BI、Tableau等通用可視化工具和公安情報(bào)可視化專業(yè)軟件I2、火眼金精、資金流向追蹤系統(tǒng)等?;谄脚_(tái)的可視化工具一般嵌入公安網(wǎng)的大數(shù)據(jù)應(yīng)用平臺(tái),在數(shù)據(jù)采集、清洗之后進(jìn)行可視化分析,公安民警常用的有違法犯罪資金查控平臺(tái)、BDP 大數(shù)據(jù)分析平臺(tái)等?;诰幊痰臄?shù)據(jù)可視化工具有D3、Matplotlib、R 等,這些工具一般要求掌握某種編程語言,比如D3 的全稱是Data Driven Documents,其本質(zhì)是提供了一個(gè)用于網(wǎng)頁作圖、生成互動(dòng)圖形的JavaScript 函數(shù)庫;Matplotlib 則是基于Python語言的一個(gè)圖形繪制庫;而R 是一個(gè)用于統(tǒng)計(jì)計(jì)算和制圖的開源軟件,具有強(qiáng)大的編程功能,可以進(jìn)行數(shù)組運(yùn)算、實(shí)現(xiàn)分支、循環(huán)以及用戶自定義的專業(yè)數(shù)據(jù)分析與制圖等,常用于大數(shù)據(jù)集的統(tǒng)計(jì)分析。[3]
資金數(shù)據(jù)可視化的效果圖一般有散點(diǎn)圖、柱狀圖、層級關(guān)系圖、資金流向圖等,在實(shí)際應(yīng)用中根據(jù)分析需求不同,有很多中表現(xiàn)形式,可謂千變?nèi)f化。但從解決問題的角度來看,基本可以分為以下五類,分別是時(shí)間序列類、比例類、組織關(guān)系類、資金流向類、空間關(guān)系類。[4]
圖1 某犯罪團(tuán)伙資金交易頻率分析
1.時(shí)間序列類
在違法資金交易的偵查中,常常要按時(shí)間維度進(jìn)行分析統(tǒng)計(jì),比如按交易時(shí)間統(tǒng)計(jì)某幾個(gè)嫌疑賬戶每天的資金交易金額,以判斷這些賬戶是否涉嫌洗錢犯罪,是否存在中間賬戶。這些以時(shí)間元素為核心的可視化分析圖形就屬于時(shí)間序列類,時(shí)間序列類圖形包括按時(shí)間軸排列的資金交易圖、按時(shí)間特征標(biāo)注的賬戶資金金額變化圖等。柱狀圖、散點(diǎn)圖、階梯圖、曲線圖常用于時(shí)間序列類的圖形表達(dá)。圖1 為某犯罪團(tuán)伙的資金交易頻率分析 (按時(shí)間關(guān)系對團(tuán)伙成員的交易次數(shù)進(jìn)行統(tǒng)計(jì))。
2.比例類
比例類圖形主要用于分析數(shù)據(jù)的比例關(guān)系,可用于顯示涉案資金賬戶進(jìn)/出賬金額占交易總金額的比例,直觀展現(xiàn)某些交易金額的最大值、最小值、總體分布情況等等。比如在某些網(wǎng)絡(luò)傳銷犯罪中,返利金額的比例計(jì)算,就可以通過比例類圖形直觀展現(xiàn)。餅圖、堆疊面積圖、板塊層級圖(Treemap)等常用于展現(xiàn)比例關(guān)系。
圖2 某傳銷團(tuán)伙層級關(guān)系
3.組織關(guān)系類
組織關(guān)系類圖形主要展示社交網(wǎng)絡(luò)關(guān)系和犯罪組織層級,在涉眾型經(jīng)濟(jì)犯罪、黑社會(huì)性質(zhì)的組織犯罪的情報(bào)分析中常要用到。組織關(guān)系類圖形主要探索犯罪主體之間的關(guān)聯(lián)關(guān)系,上、下線關(guān)系等,結(jié)合可視化分析工具,可用于社交網(wǎng)絡(luò)分析和社區(qū)發(fā)現(xiàn)。組織關(guān)系類圖形常見的有氣泡圖、樹狀圖、層級結(jié)構(gòu)圖等。圖2 為某傳銷團(tuán)伙層級關(guān)系。
4.資金流向類
資金流向類圖形是違法資金交易可視化分析中的核心圖形,主要展現(xiàn)資金的流向,一般從資金來源、中間賬戶、資金去向?qū)崿F(xiàn)資金的整個(gè)交易流程的可視化。在可視化分析工具中,可以將所有交易數(shù)據(jù)圖形化,并應(yīng)用圖計(jì)算的一些算法,進(jìn)行遍歷或最小生成樹、最短路徑計(jì)算等,對大額可疑資金的流向進(jìn)行追蹤或資金回路發(fā)現(xiàn)。在資金流向圖上可以根據(jù)各種權(quán)重進(jìn)行不同顏色、不同線條粗細(xì)的設(shè)置,顯示資金交易關(guān)系,還可以通過用戶交互進(jìn)行不同布局的選擇。[5]圖3 為某地下錢莊犯罪資金流向(局部)(見圖3)。
圖3 某地下錢莊犯罪資金流向(局部)
5.空間關(guān)系類
空間關(guān)系類圖形主要借助電子地圖,顯示犯罪熱點(diǎn)分析結(jié)果、嫌疑人地域分布情況、涉案資金交易區(qū)域化密度關(guān)系等。空間關(guān)系類圖形可以引入時(shí)間元素,形成動(dòng)態(tài)顯示圖??臻g關(guān)系類可視化分析一般要調(diào)用一些電子地圖工具(Google Fusion Tables、Modest Maps、ArcGIS等)和時(shí)間線工具(Timetoast、Xtimeline等),用于輔助資金數(shù)據(jù)分析。著色技巧在空間關(guān)系類圖形中應(yīng)用較廣。
從經(jīng)濟(jì)犯罪偵查的宏觀角度來看,在違法資金數(shù)據(jù)分析中,主要的可視化分析內(nèi)容包括資金數(shù)據(jù)檢測、資金流向展示、重點(diǎn)嫌疑人/團(tuán)伙畫像、嫌疑人/嫌疑賬戶定位、預(yù)警監(jiān)測輔助五大應(yīng)用場景。在這五大應(yīng)用場景中,都可以用到資金數(shù)據(jù)可視化分析,使紛繁蕪雜的枯燥數(shù)據(jù)轉(zhuǎn)換為直觀、清晰的圖形展示,令偵查人員迅速理解數(shù)據(jù),挖掘有價(jià)值的情報(bào),指導(dǎo)偵查破案方向。
涉案資金數(shù)據(jù)的來源一般是多家銀行業(yè)金額結(jié)構(gòu)、第三方支付機(jī)構(gòu)的數(shù)據(jù)庫。在辦案單位調(diào)取涉案資金數(shù)據(jù)并進(jìn)行標(biāo)準(zhǔn)化清洗之后、進(jìn)一步深挖擴(kuò)線之前,要對資金數(shù)據(jù)集進(jìn)行一個(gè)總體評估,并通過直觀地展現(xiàn)以便了解已經(jīng)獲取的所有涉案資金數(shù)據(jù)的全貌。大數(shù)據(jù)時(shí)代的資金數(shù)據(jù)評估一般由程序自動(dòng)完成,這個(gè)總體的評估過程,我們稱之為資金數(shù)據(jù)檢測。在具體檢測方法上,從單賬戶、單主體、賬戶組(團(tuán)伙)、全賬單多角度,以交易金額、交易筆數(shù)、凈流入/流出、交易頻度、銀行卡BIN碼等多維度,進(jìn)行統(tǒng)計(jì)分析、檢測評估??梢暬夹g(shù)在這一階段用于各種統(tǒng)計(jì)圖表的輸出,展現(xiàn)數(shù)據(jù)集的全貌。
資金數(shù)據(jù)檢測可以涵蓋通用內(nèi)容檢測、特定內(nèi)容檢測和嫌疑目標(biāo)檢測三大類。通用內(nèi)容檢測是所有資金數(shù)據(jù)量較大的案件都基本要評估的常規(guī)內(nèi)容,即針對資金交易要素,刻畫涉案資金的規(guī)模、變量、對手等情況,以圖表形式予以可視化展現(xiàn)。通用內(nèi)容檢測具體包括交易主體、交易對手、資金交易規(guī)模、賬戶組(團(tuán)伙)資金進(jìn)出情況、交易頻率、最大單筆交易等。其中,針對交易主體的檢測可以通過開戶信息對賬戶主體進(jìn)行分析,收集身份信息、住址、聯(lián)系方式等多維度信息,完善主體個(gè)人身份信息及關(guān)聯(lián)信息。交易對手的檢測包括人員和機(jī)構(gòu),可以對交易明細(xì)中的對手人員的卡號和姓名進(jìn)行匯集,明確對手卡號、人員數(shù)量;對交易明細(xì)中出現(xiàn)的機(jī)構(gòu)情況進(jìn)行匯集,并對機(jī)構(gòu)性質(zhì)進(jìn)行初步判斷,分析主體與機(jī)構(gòu)的交易是否符合身份特征和一般規(guī)律,發(fā)現(xiàn)可疑點(diǎn);此外,從對手分布情況可以確定作案范圍及受害人分布情況,便于對案件的準(zhǔn)確定性、定量、定范圍。資金交易規(guī)模的檢測可以從交易總筆數(shù)、總金額、交易頻率、資金流動(dòng)量等要素入手,分析一定時(shí)間內(nèi)交易金額的進(jìn)出規(guī)模,用于明確犯罪危害程度、變化規(guī)律、應(yīng)重點(diǎn)關(guān)注的涉案時(shí)間段等。賬戶組資金進(jìn)出情況檢測目的是統(tǒng)計(jì)疑似團(tuán)伙賬戶的總?cè)胭~金額,判斷涉案金額情況;統(tǒng)計(jì)總出賬金額,為下一步資金追蹤指明方向;統(tǒng)計(jì)總差額情況,判斷截留資金情況,為追贓挽損提供數(shù)據(jù)支撐。交易頻率檢測是對單個(gè)賬戶或賬戶組交易頻率的研判,針對資金交易不同時(shí)間段會(huì)有不同的特征,如虛開犯罪,在月末時(shí)間,呈現(xiàn)出一定的集中特征;從賬戶組的情況來看,則呈現(xiàn)多個(gè)賬戶輪換使用的特點(diǎn)。最大單筆交易檢測目的是從眾多交易流水中,及時(shí)發(fā)現(xiàn)最大單筆資金,為查找重要受害人或追查資金去向提供方向。
資金特定內(nèi)容檢測是對一些有規(guī)律的資金交易特征進(jìn)行識別,主要包括小額測試(大額交易前的小額測試,測試賬卡號是否被凍結(jié))、固定金額(識別是否工資發(fā)放、頂額轉(zhuǎn)賬以規(guī)避反洗錢監(jiān)控等)、現(xiàn)金業(yè)務(wù)(小額異地取現(xiàn)、大額現(xiàn)存或現(xiàn)取,提示資金斷點(diǎn))、公轉(zhuǎn)私業(yè)務(wù)、沉睡期等要素,開展特定內(nèi)容檢測,發(fā)現(xiàn)交易中需要重點(diǎn)關(guān)注的賬戶和主體。
嫌疑目標(biāo)檢測是結(jié)合賬戶、主體比對歷史案件庫發(fā)現(xiàn)前科情況,根據(jù)涉嫌犯罪案件及線索與違法犯罪資金查控信息碰撞比對的結(jié)果,發(fā)現(xiàn)重點(diǎn)嫌疑目標(biāo),為偵查辦案提供指引。所有的檢測、評估項(xiàng)紛繁復(fù)雜,如果以數(shù)字形式呈現(xiàn),不易讀且難以理解,因此這一階段的可視化主要是對統(tǒng)計(jì)報(bào)表的可視化展現(xiàn),比例類、時(shí)間序列類圖形應(yīng)用較多。
資金流向展示是將資金數(shù)據(jù)集的所有資金交易來源、去向、鏈路、環(huán)路的全部可視化的過程。在具體方法上,通過圖計(jì)算對資金數(shù)據(jù)關(guān)聯(lián)關(guān)系要素的計(jì)算和對依法調(diào)取及數(shù)據(jù)庫中存量數(shù)據(jù)分析,實(shí)現(xiàn)涉案資金追蹤溯源和斷路資金接續(xù)可視化查詢功能,進(jìn)而發(fā)現(xiàn)資金的來源、去向、鏈路、環(huán)路等資金流轉(zhuǎn)形態(tài)。例如,按交易方式、對象類別、進(jìn)出流量比,分析資金的來源和去向;對指定的交易,進(jìn)行路徑追蹤,形成資金鏈路(即資金的單向流動(dòng)或樹枝狀流動(dòng));自動(dòng)發(fā)現(xiàn)以各種關(guān)系形成的資金環(huán)路(即資金從實(shí)際控制人轉(zhuǎn)出后經(jīng)多個(gè)環(huán)節(jié),又轉(zhuǎn)回實(shí)際控制人處的環(huán)形流動(dòng)),為發(fā)現(xiàn)犯罪運(yùn)作模式提供依據(jù)。
圖計(jì)算的一些經(jīng)典算法或改進(jìn)算法可以用于資金的溯源與追蹤。[6]資金的溯源與追蹤對象有兩類,一類是單賬戶資金流向追蹤(單筆資金的追蹤),一類是多賬戶的資金流向追蹤(賬戶組的資金流向追蹤)。單筆資金的追蹤主要根據(jù)資金額度、時(shí)間、交易方式、地點(diǎn)等要素進(jìn)行相關(guān)性統(tǒng)計(jì),確定資金鏈路方向,是否形成環(huán)路。如果資金流轉(zhuǎn)中出現(xiàn)了取現(xiàn),則需要標(biāo)注大額取現(xiàn)交易,根據(jù)同柜存取或冠字號接續(xù)資金鏈路,實(shí)現(xiàn)斷路追蹤;如果出現(xiàn)資金轉(zhuǎn)換資產(chǎn),譬如購買房產(chǎn)、理財(cái)?shù)龋瑒t需要根據(jù)資金流向律,查詢資產(chǎn)的實(shí)際控制人與嫌疑人之間的關(guān)系。多賬戶(賬戶組)的資金流向追蹤,主要考查重點(diǎn)交易主體或賬戶組在特定時(shí)間區(qū)間的資金來往關(guān)系,通過迭代計(jì)算的方法,追蹤賬戶組的資金去向,實(shí)現(xiàn)交易主體資金流轉(zhuǎn)之間的交叉識別。
圖計(jì)算的底層技術(shù)加上可視化的應(yīng)用,可以將分析目標(biāo)的資金流向、交易金額、交易時(shí)間等關(guān)鍵要素直觀展現(xiàn)出來,令偵查人員能夠一目了然地觀察資金的整個(gè)流轉(zhuǎn)過程。這一階段的資金數(shù)據(jù)可視化主要輸出資金流向類圖形,展現(xiàn)多種資金流向布局方式,比如以時(shí)間軸為中心展示出賬與入賬的金額大小、方向、關(guān)鍵節(jié)點(diǎn),或直接挖掘資金環(huán)路并進(jìn)行高亮顯示等。
重點(diǎn)嫌疑人/團(tuán)伙畫像是利用數(shù)據(jù)挖掘技術(shù)研判涉案資金賬戶關(guān)聯(lián)度、辨識核心賬戶,并對賬戶組及犯罪團(tuán)伙整體畫像進(jìn)行可視化的過程。在具體方法上,通過資金賬戶穿透和歷史資源比對分析,發(fā)現(xiàn)賬戶、資金的實(shí)際控制人,進(jìn)而判斷賬戶性質(zhì)(沉淀賬戶、取現(xiàn)賬戶、過渡賬戶等),發(fā)現(xiàn)涉案賬戶關(guān)聯(lián),辨識重點(diǎn)嫌疑賬戶或團(tuán)伙。
重點(diǎn)嫌疑人/團(tuán)伙畫像分三個(gè)層面,一是賬戶鎖定,通過開戶信息、交易時(shí)空、交易行為的分析,鎖定賬戶實(shí)際控制人。賬戶鎖定除了要進(jìn)行資金交易分析,還要關(guān)注開戶地址、交易地址、賬單、話單、出行軌跡、銀行聯(lián)網(wǎng)核查等大數(shù)據(jù),通過對交易賬戶的IP/MAC地址、綁定電話、預(yù)留地址等要素進(jìn)行穿透、比對、關(guān)聯(lián),發(fā)現(xiàn)違法犯罪資金的實(shí)際控制人。二是賬戶分層,目的是根據(jù)資金交易規(guī)律,刻畫賬戶在資金鏈路中的層級關(guān)系和賬戶性質(zhì),從而發(fā)現(xiàn)核心賬戶,以可視化圖形方式予以直觀呈現(xiàn)?,F(xiàn)代經(jīng)濟(jì)犯罪已經(jīng)發(fā)展到專業(yè)分工極其細(xì)密的階段,通過賬戶分層,可以判斷資金沉淀賬戶、取現(xiàn)賬戶、過渡賬戶、生活賬戶、吸金賬戶,挖掘核心交易賬戶。三是賬戶關(guān)聯(lián),即通過交易主體、交易對手、交易手法、交易背景、交易時(shí)間等要素進(jìn)行關(guān)聯(lián)分析,定量計(jì)算各要素之間的親密度,發(fā)現(xiàn)犯罪嫌疑人控制的賬戶組,厘清犯罪團(tuán)伙架構(gòu)。賬戶關(guān)聯(lián)計(jì)算中判別的維度越多,關(guān)聯(lián)性越強(qiáng),對于犯罪團(tuán)伙的整體畫像越精確。重點(diǎn)嫌疑人/團(tuán)伙畫像在底層涉及智能研判、機(jī)器學(xué)習(xí)領(lǐng)域的前沿技術(shù),這一階段的資金數(shù)據(jù)可視化分析主要輸出組織關(guān)系類、資金流向類等關(guān)系圖形,并附有各種標(biāo)簽圖例。
嫌疑人/嫌疑賬戶定位是利用資金活動(dòng)要素和痕跡,對資金及其控制人進(jìn)行物流空間定位、鎖定的過程。在具體定位方法上,利用電子地圖、研判工具,抓取資金交易活動(dòng)中的時(shí)間和地理位置信息,運(yùn)用可視化技術(shù)展示時(shí)空軌跡,確定犯罪嫌疑人在特定時(shí)期內(nèi)的活動(dòng)地、居住地等物理位置。
實(shí)踐中,對嫌疑人/嫌疑賬戶定位要依賴很多地址類信息。部分地址類信息可在調(diào)單的資金交易表中作為數(shù)據(jù)項(xiàng)直接獲得反饋。違法犯罪資金查控平臺(tái)的數(shù)據(jù)反饋標(biāo)準(zhǔn)要求各銀行業(yè)金融機(jī)構(gòu)提供涉案賬戶開戶行、卡歸屬地、ATM、營業(yè)網(wǎng)點(diǎn)地址、IP地址等。銀行聯(lián)網(wǎng)核查信息和JASS數(shù)據(jù)都有詳細(xì)的地址反饋,第三方支付反饋的信息中也有客戶端IP、收貨人地址等地理位置信息。要實(shí)現(xiàn)嫌疑人/嫌疑賬戶定位,必須結(jié)合GIS(Geographic Information System)地理信息系統(tǒng),根據(jù)資金分析中的時(shí)空信息,提取交易記錄中的時(shí)間和地點(diǎn)字段,展現(xiàn)在電子地圖上,刻畫人員軌跡。
資金數(shù)據(jù)可視化分析在這一階段可利用拓展出的資金交易發(fā)生地、銀行聯(lián)網(wǎng)核查地點(diǎn)信息、銀聯(lián)交易POS機(jī)、ATM所在網(wǎng)點(diǎn)、IP/MAC地址、移動(dòng)支付GIS等位置信息,輔之交易發(fā)生時(shí)間,并整合其他技術(shù)偵查、大數(shù)據(jù)分析手段,對資金、賬戶控制人進(jìn)行時(shí)空定位和軌跡監(jiān)測,為偵查取證和緝捕追逃提供支撐。這一應(yīng)用場景下,資金數(shù)據(jù)可視化分析主要輸出空間關(guān)系類圖形,并可形成動(dòng)圖。
上述四個(gè)應(yīng)用場景主要集中在案發(fā)后的回溯型偵查領(lǐng)域,在資金數(shù)據(jù)不斷積累、海量數(shù)據(jù)不斷匯聚的背景下,各級公安機(jī)關(guān)也在如火如荼地建設(shè)經(jīng)濟(jì)犯罪預(yù)警監(jiān)測平臺(tái)。預(yù)警監(jiān)測平臺(tái)可以圍繞不明性質(zhì)的資金交易和金融活動(dòng),通過監(jiān)督和無監(jiān)督的機(jī)器學(xué)習(xí)算法,對社會(huì)生產(chǎn)中的資金異常交易性質(zhì)、行為、歸屬、特征等進(jìn)行智能分析和實(shí)時(shí)監(jiān)測,提前預(yù)警犯罪風(fēng)險(xiǎn)。
可視化分析技術(shù)可以輔助預(yù)警監(jiān)測信息的展示和推送,為犯罪預(yù)防提供預(yù)案模板和決策支持。在具體方法上,通過構(gòu)建基于資金數(shù)據(jù)的主體、賬戶、交易等多維計(jì)算指標(biāo)體系,匯集開戶時(shí)間、地點(diǎn)和交易時(shí)間、額度、地點(diǎn)、對手?jǐn)?shù)量、對手類別等多維度要素,并實(shí)時(shí)收集相關(guān)互聯(lián)網(wǎng)信息數(shù)據(jù),歸納類罪資金交易特征和偵查實(shí)戰(zhàn)中資金分析研判的經(jīng)驗(yàn)規(guī)則,通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法,智能分析判定高危風(fēng)險(xiǎn)。實(shí)踐中,聚類分析(Cluster Analysis)在資金數(shù)據(jù)的機(jī)器學(xué)習(xí)研判中應(yīng)用最廣泛。聚類分析起源于分類。從前,人們主要依靠經(jīng)驗(yàn)和專業(yè)知識來實(shí)現(xiàn)事物的分類,很少利用數(shù)學(xué)工具進(jìn)行定量的分類。隨著科學(xué)技術(shù)的發(fā)展,人們逐漸地把數(shù)學(xué)工具引用到了分類學(xué)中,形成了數(shù)值分類學(xué),之后又將多元分析的技術(shù)引入到數(shù)值分類學(xué)形成了聚類分析。聚類分析又稱群分析,是根據(jù)“物以類聚”的原理,對樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法,聚類分析的目的是根據(jù)在數(shù)據(jù)中發(fā)現(xiàn)的描述對象及其關(guān)系的信息,將數(shù)據(jù)對象分組,組內(nèi)的對象相互之間是相似的(相關(guān)的),而不同組中的對象是不同的(不相關(guān)的)。組內(nèi)相似性越大,組間差距越大,說明聚類效果越好。聚類分析在資金交易網(wǎng)絡(luò)分析、犯罪團(tuán)伙挖掘、類罪預(yù)警監(jiān)測中都有很好的應(yīng)用效果。
資金聚類分析的結(jié)果可以通過可視化推送的形式不斷輸送出線索和預(yù)警信息。比如,可以將目標(biāo)資金數(shù)據(jù)與非法從事資金支付結(jié)算業(yè)務(wù)、非法買賣外匯、虛開增值稅發(fā)票、騙取出口退稅等類型的犯罪活動(dòng)的資金交易特征進(jìn)行匹配,發(fā)現(xiàn)目標(biāo)資金與類罪行為的關(guān)聯(lián)和內(nèi)在規(guī)律,為串并案和多維度線索拓展提供依據(jù)。針對數(shù)據(jù)特征明顯的經(jīng)濟(jì)犯罪,可以圍繞高危籍貫維度、主體前科維度、賬戶特征維度、交易特征維度等設(shè)置均值或參數(shù),通過聚類分析,進(jìn)行風(fēng)險(xiǎn)識別和推送。比如某些甘肅、寧夏等重點(diǎn)地域地下錢莊高危人員和浙江臺(tái)州、廣東饒平等重點(diǎn)地域涉稅高危人員的涉嫌違法犯罪行為,可以通過實(shí)時(shí)監(jiān)測預(yù)警的方式進(jìn)行預(yù)測、預(yù)防。在這一應(yīng)用場景中,資金數(shù)據(jù)可視化主要起輔助作用,推送出的主要是組織關(guān)系類、空間關(guān)系類圖形。