韓 旭 熊 鑫
?
大數(shù)據(jù)背景下的犯罪情報(bào)研判——以PGIS平臺(tái)為中心的情報(bào)體系構(gòu)建
韓 旭 熊 鑫*
大數(shù)據(jù)時(shí)代背景下,原本依靠人工計(jì)算和推演的犯罪情報(bào)研判體系一步步更新升級(jí)。借助可視化技術(shù),犯罪活動(dòng)實(shí)時(shí)分布態(tài)勢(shì)、趨勢(shì)預(yù)測(cè)的工作也從單調(diào)冗長(zhǎng)的文本數(shù)據(jù)逐漸變成了清晰分明的曲線(xiàn)和地理犯罪圖譜。我國(guó)警務(wù)工作借助PGIS平臺(tái),初步完成了數(shù)據(jù)可視化的基礎(chǔ)建設(shè),并已經(jīng)能夠初步進(jìn)行二維平面的犯罪時(shí)空軌跡、犯罪熱點(diǎn)分析。但在提高工作效率的同時(shí)也暴露出了理論和實(shí)踐結(jié)合不甚嚴(yán)密、各平臺(tái)口徑不一和協(xié)作不足、數(shù)據(jù)甄別挖掘和轉(zhuǎn)化能力不足等相關(guān)問(wèn)題。對(duì)此,可以以PGIS平臺(tái)的完善為突破口,多端口寬口徑的接入數(shù)據(jù)后,嵌入對(duì)數(shù)據(jù)的匯總篩選分級(jí),構(gòu)建起警員、犯罪嫌疑人、受害人等不同主體的行為模型,并借助Moran’sI指數(shù)及公式為代表的空間自相關(guān)性分析方法檢驗(yàn)其輸出結(jié)果的合理性,最后運(yùn)用回歸聚類(lèi)模型和可視化工具分析出犯罪風(fēng)險(xiǎn)地域和時(shí)空軌跡,初步推導(dǎo)出犯罪類(lèi)型及犯罪熱點(diǎn)的安全區(qū)與多發(fā)高發(fā)區(qū)域,對(duì)比分析后推導(dǎo)犯罪誘因并制定針對(duì)性的解決方法,為現(xiàn)實(shí)的警力分配、犯罪控制提供數(shù)據(jù)支撐,也為未來(lái)以PGIS平臺(tái)為突破口的現(xiàn)代犯罪情報(bào)研判體系構(gòu)建提供發(fā)展方向。
大數(shù)據(jù);數(shù)據(jù)挖掘;可視化;情報(bào)建模
大數(shù)據(jù),顧名思義,實(shí)踐概括出的類(lèi)型多樣(Variety)、數(shù)據(jù)量大(Volume)、增長(zhǎng)速度快(Velocity)是大數(shù)據(jù)的突出特點(diǎn),幾經(jīng)發(fā)展后來(lái)者又加入了真實(shí)(Veracity)、可視化(Visualization)和正當(dāng)性(Validity)等要素,從3V理論到6V說(shuō),名稱(chēng)雖不停在變,但由于數(shù)據(jù)時(shí)代下個(gè)人行為信息痕跡愈發(fā)明顯,大數(shù)據(jù)內(nèi)涵在聯(lián)系犯罪情報(bào)研判應(yīng)用中聯(lián)系也愈發(fā)緊密,尤其是之后新增的可視化、正當(dāng)性等要素。
大數(shù)據(jù),核心價(jià)值在于數(shù)據(jù)信息的運(yùn)用。在大數(shù)據(jù)的具體運(yùn)用里,不同于早期粗糙的地理環(huán)境學(xué)派,現(xiàn)代情報(bào)研判要面對(duì)前所未有的數(shù)據(jù)洪流。因此如何在日常預(yù)防打擊犯罪中,在數(shù)據(jù)海洋中及時(shí)的搜集篩選出真實(shí)有效的情報(bào)信息并將其分類(lèi)、建模、可視化幫助偵查人員推進(jìn)執(zhí)法進(jìn)程便成了相關(guān)研究的重難點(diǎn)?,F(xiàn)實(shí)中包括PGIS警用地理信息系統(tǒng)平臺(tái)(英文全稱(chēng)為Police Geographic Information System Platform,下文簡(jiǎn)稱(chēng)為PGIS)等在內(nèi)的現(xiàn)代犯罪情報(bào)研判體系也已經(jīng)逐漸開(kāi)始適應(yīng)——從依靠原始人力智力和單人手工到越來(lái)越依靠以SPSS和Ucinet[1]等為代表的集群大數(shù)據(jù)分析及可視化工具來(lái)開(kāi)展工作,包括情報(bào)數(shù)據(jù)的搜集、篩選、分析、挖掘、制圖、實(shí)時(shí)支援等步驟,最終在上述數(shù)據(jù)綜合平臺(tái)上展示分析的結(jié)果,包含行為模式預(yù)測(cè)、犯罪熱點(diǎn)分析、犯罪時(shí)空規(guī)律研判等多重?zé)衢T(mén)難點(diǎn),而且隨著建模技術(shù)和數(shù)據(jù)的運(yùn)用度提高,工作中也可以依據(jù)合理數(shù)據(jù)針對(duì)警員、犯罪人、受害人不同主體構(gòu)建出不同模型以供參考,反過(guò)來(lái)再針對(duì)PGIS平臺(tái)數(shù)據(jù)搜集到最終呈現(xiàn)等環(huán)節(jié)中的不足并加以改進(jìn)。
在對(duì)犯罪情報(bào)數(shù)據(jù)的運(yùn)用上,早在18世紀(jì)便已經(jīng)有了犯罪地理學(xué)的早期研究,但真正意義上的大數(shù)據(jù)背景下的犯罪情報(bào)研究卻是出現(xiàn)在GIS技術(shù)(地理信息系統(tǒng))、MIS(警用電子信息系統(tǒng))和Ucinet等成熟之后,隨著電子技術(shù)的發(fā)展,基于犯罪時(shí)空軌跡分析和數(shù)據(jù)可視化的新型情報(bào)研判已成大勢(shì)。
國(guó)外從早期的地理環(huán)境決定論、芝加哥犯罪學(xué)派到犯罪行為學(xué)派一路走過(guò)來(lái),引入了實(shí)證主義、科際整合理論等學(xué)說(shuō),并衍生出來(lái)社會(huì)解組理論、日?;顒?dòng)理論、犯罪可防范空間理論、理性選擇理論、回歸理論等理論,從不同角度的犯罪誘發(fā)因子分類(lèi)歸納,在宏觀的層面上探討了犯罪現(xiàn)象在同種族隔離、收入差距、居住流動(dòng)性、土地利用情況等多種因子影響下的關(guān)聯(lián)關(guān)系,從而為犯罪情報(bào)研判體系構(gòu)建提供了基本坐標(biāo)和較大的借鑒意義。
20世紀(jì)80年代,由于大數(shù)據(jù)的到來(lái)使得情報(bào)信息需要更加細(xì)致的篩選和分析,加上犯罪率居高不下,情報(bào)研判也從事后被動(dòng)的案發(fā)型情報(bào)搜集到事前型搜集分析情報(bào),理論研究則開(kāi)始轉(zhuǎn)入微觀層面,學(xué)者們更多的轉(zhuǎn)向研究情報(bào)預(yù)測(cè)研判,結(jié)合專(zhuān)業(yè)人員設(shè)備,開(kāi)啟新的思維方式和運(yùn)作模型。比較具有代表性的有如艾克勒姆提出的五步分解法,用來(lái)來(lái)收集情報(bào)(information gathering)、分析解讀(analysis and interpretation)、戰(zhàn)略設(shè)計(jì)(devising strategies)、戰(zhàn)略實(shí)施(implementation)科學(xué)評(píng)估(evaluation),和DIKI鏈的思維模式——即數(shù)據(jù)(Digital)、信息(Information)、知識(shí)(Knowledge)、情報(bào)(Intelligence)模式。
具體實(shí)踐中由于20世紀(jì)90年代情報(bào)導(dǎo)向警務(wù)戰(zhàn)略(Intelligence-Led Policing strategy,簡(jiǎn)稱(chēng)ILP)的提出,西方各國(guó)均以減少和預(yù)防犯罪為目標(biāo),并依托現(xiàn)代計(jì)算機(jī)信息技術(shù)及其他先進(jìn)科技發(fā)展,如英國(guó)國(guó)家情報(bào)模式下的情報(bào)核心分析系統(tǒng)(ICAS)、美國(guó)的計(jì)算機(jī)統(tǒng)計(jì)模式下的比較數(shù)據(jù)系統(tǒng)(COMPSTAT)、澳大利亞的執(zhí)法情報(bào)網(wǎng)絡(luò)(ALEIN)、加拿大的自動(dòng)化犯罪情報(bào)信息系統(tǒng)(AlClS)等都是如此,以美國(guó)為代表的西方發(fā)達(dá)國(guó)家更是總結(jié)出了一套“數(shù)據(jù)統(tǒng)計(jì)+數(shù)據(jù)挖掘+犯罪制圖”的技術(shù)分析路線(xiàn),更衍生出了犯罪分析師等專(zhuān)門(mén)性職業(yè),并取得了不錯(cuò)的成績(jī)。有數(shù)據(jù)表明,美國(guó)洛杉磯警局目前已經(jīng)能利用大數(shù)據(jù)分析軟件,將轄區(qū)里的盜竊類(lèi)犯罪降低了33%,暴力類(lèi)犯罪降低了21%,財(cái)產(chǎn)類(lèi)犯罪降低12%[2]。
但同時(shí)情報(bào)研判體系的實(shí)踐探索仍是在社會(huì)學(xué)領(lǐng)域的日?;顒?dòng)理論和社會(huì)解組理論[3]指導(dǎo)下進(jìn)行的,理論的相對(duì)滯后使得工作停留于通過(guò)制定犯罪因子來(lái)探索犯罪發(fā)生規(guī)律的固定模式,一方面沒(méi)有真正打破科際邊界,對(duì)犯罪因子的“執(zhí)著”導(dǎo)致不能跳出區(qū)域?qū)哟沃笜?biāo)的限制,從而引入統(tǒng)計(jì)學(xué)和情報(bào)學(xué)的知識(shí)體系來(lái)迎接大數(shù)據(jù)時(shí)代帶來(lái)的挑戰(zhàn)。在PGIS等定位制圖工具日益更新的同時(shí),還停留在原本的某地域犯罪因子之間影響及平面規(guī)律的探尋,雖然較好的結(jié)合了現(xiàn)有技術(shù),在實(shí)踐上構(gòu)建出了一套犯罪情報(bào)研判體系,但仍無(wú)法就犯罪預(yù)測(cè)和防控的策略給予精準(zhǔn)有效的探索指導(dǎo)。
另一方面這仍是“被動(dòng)型”的偵查,對(duì)犯罪的預(yù)判預(yù)防顯得不足,只能在犯罪發(fā)生后依靠更多的人力物力抓獲罪犯,在“犯罪黑數(shù)”增長(zhǎng)的同時(shí),未能將宏觀層面的地理、亞文化、政策和微觀個(gè)人的心理生理、行為模式、人身特征等多方因素結(jié)合,甚至跳出社會(huì)學(xué)領(lǐng)域的限制使用統(tǒng)計(jì)學(xué)知識(shí)和網(wǎng)絡(luò)云計(jì)算能力構(gòu)建出一整套全局型、通用型的犯罪研判模型,達(dá)到預(yù)測(cè)預(yù)防犯罪的目的。
1.國(guó)內(nèi)理論探索
與西方國(guó)家不同是,我們國(guó)家原本由于歷史原因在這方面起步就較晚,近代最早的相關(guān)研究也是從改革開(kāi)放伊始。深入程度也參差不齊,受?chē)?guó)外行為學(xué)派、犯罪生態(tài)學(xué)派的影響,有最早的如祝曉光、王發(fā)曾等先驅(qū)們對(duì)的宏觀犯罪因子和犯罪空間等的相關(guān)研究,開(kāi)始嘗試運(yùn)用統(tǒng)計(jì)學(xué)方法研究城市犯罪的動(dòng)態(tài)變化規(guī)律,并通過(guò)對(duì)國(guó)內(nèi)外關(guān)于城市犯罪空間模式研究的講解評(píng)價(jià),對(duì)城市犯罪發(fā)展趨勢(shì)預(yù)判的方法(相關(guān)因素法、時(shí)間序列法)進(jìn)行了簡(jiǎn)要的介紹,但這些多集中于介紹國(guó)外學(xué)術(shù)理論,少有中國(guó)模式,但正因如此我們也可以在國(guó)外的有益經(jīng)驗(yàn)上加以借鑒。
改革開(kāi)放后期研究逐漸從宏觀轉(zhuǎn)向微觀層面研究影響因子,加上大數(shù)據(jù)理念的提出,開(kāi)始結(jié)合統(tǒng)計(jì)學(xué)模型和GIS技術(shù)探索適合我國(guó)的模式。耿莎莎等利用GIS軟件,通過(guò)分析中原地區(qū)某縣城10年的城區(qū)犯罪案例數(shù)據(jù),結(jié)合城區(qū)土地利用現(xiàn)狀圖、道路圖、社區(qū)人口統(tǒng)計(jì)資料,對(duì)該縣城區(qū)不同犯罪類(lèi)型和不同年份的犯罪數(shù)據(jù)進(jìn)行了空間分析。杜德斌和湯建中教授通過(guò)純粹的數(shù)學(xué)建模,推導(dǎo)并得出犯罪期望效用和成功概率共同決定犯罪行為空間區(qū)位選擇的結(jié)論,建立了犯罪區(qū)位選擇的微觀模型;毛媛媛、戴慎志等以公安年鑒和晚報(bào)報(bào)道的犯罪數(shù)據(jù)為研究基礎(chǔ),通過(guò)統(tǒng)計(jì)和回歸分析,得出了上海市一定時(shí)期內(nèi)犯罪案件間分布特征,并嘗試著從城市規(guī)劃和建筑設(shè)計(jì)等角度為犯罪防控做了一些探索和建議;而陳屹立博士也在其論文中,嘗試用泰爾指數(shù)分析了我國(guó)犯罪的省際差異[4]。
因?yàn)閷?shí)際學(xué)者所接觸的數(shù)據(jù)有限以及沿用理論的相對(duì)一致(多為社會(huì)解組和日常活動(dòng)理論),我國(guó)如今研究犯罪問(wèn)題的方向角度較多且偏向于實(shí)用性,并能突破科際結(jié)合建筑學(xué)、規(guī)劃學(xué)等相關(guān)學(xué)科的知識(shí),系統(tǒng)的發(fā)展了犯罪空間防控等理論,但由于信息限制等多方因素在犯罪行為空間選擇、社區(qū)犯罪等熱點(diǎn)問(wèn)題上深度廣度不夠。而且在“具備”上文描述的發(fā)達(dá)國(guó)家類(lèi)似弊病之外,大多只是考慮到了大數(shù)據(jù)的影響,在對(duì)關(guān)于大數(shù)據(jù)背景如何具體運(yùn)用現(xiàn)有數(shù)據(jù)使其用于犯罪預(yù)判的研究則相對(duì)較少,課題研究仍在探索階段。
2.國(guó)內(nèi)情報(bào)研判體系構(gòu)建現(xiàn)狀
在中外合作方面,我國(guó)堅(jiān)持注重和國(guó)際接軌的同時(shí)加強(qiáng)了自主研發(fā)。上海市公安局也單獨(dú)研發(fā)了案件時(shí)空分析系統(tǒng),該系統(tǒng)在各種原有公開(kāi)和警用信息資料基礎(chǔ)上,加以技術(shù)、人力信息、財(cái)務(wù)信息、車(chē)輛信息等的有機(jī)整合,逐步建立了有關(guān)違法犯罪人員原籍統(tǒng)計(jì)分析制度、有關(guān)毒品地下交易價(jià)格監(jiān)測(cè)制度、有關(guān)違法犯罪案件時(shí)空走勢(shì)分析制度等。我國(guó)公安部門(mén)與美國(guó)有名的GIS軟件公司Esih進(jìn)行的全面警用地理信息系統(tǒng)方面開(kāi)發(fā)的項(xiàng)目合作,也于2010年公安部正式發(fā)布了1.0版警用地理信息系統(tǒng)平臺(tái)軟件——即PGIS,一定程度上講,這套不斷完善的系統(tǒng)完成了犯罪情報(bào)研判體系的初次構(gòu)建。
隨著“十二五”工程國(guó)家科技支撐計(jì)劃“新一代警用GIS關(guān)鍵技術(shù)及其應(yīng)用”的開(kāi)展,驗(yàn)收竣工了“金盾”一期工程。而作為“金盾工程”二期建設(shè)的龍頭項(xiàng)目的公安“大情報(bào)”系統(tǒng)應(yīng)運(yùn)而出,我國(guó)的PGIS平臺(tái)也進(jìn)一步發(fā)展。但從實(shí)踐上總體說(shuō)來(lái),國(guó)內(nèi)這方面還是有很大的空白區(qū)未深入,尤其是在警務(wù)情報(bào)方面。而這其中犯罪情報(bào)分析預(yù)測(cè)技術(shù)的關(guān)鍵步驟——各平臺(tái)的數(shù)據(jù)整合及共享的欠缺則是制約大數(shù)據(jù)情報(bào)研判的瓶頸。導(dǎo)致大部分有用的情報(bào)無(wú)法及時(shí)轉(zhuǎn)化成數(shù)據(jù)以致錯(cuò)失冗積,在爆炸浪潮一般的數(shù)據(jù)不能去偽存真,經(jīng)過(guò)艱辛錄入的數(shù)據(jù)更不能及時(shí)規(guī)范的轉(zhuǎn)化成圖表圖譜,各單位之間數(shù)據(jù)由于整合標(biāo)準(zhǔn)、計(jì)算公式的不一,口徑參差不齊以致情報(bào)數(shù)據(jù)資源被浪費(fèi)空置而不能轉(zhuǎn)化成三維甚至是二維的可視化情報(bào),因此對(duì)于這些問(wèn)題問(wèn)題,在仔細(xì)研究后,本文針對(duì)薄弱環(huán)節(jié)做一系列的PGIS的完善構(gòu)想。
犯罪情報(bào)研判體系建設(shè)完善作為一個(gè)動(dòng)態(tài)的發(fā)展過(guò)程,在大數(shù)據(jù)時(shí)代也升級(jí)換代,體現(xiàn)出了如數(shù)據(jù)化、多維可視化、智能化等多種特性和趨勢(shì),最終在PGIS平臺(tái)的發(fā)展基礎(chǔ)之上,構(gòu)建成一個(gè)包含犯罪時(shí)空軌跡、犯罪熱點(diǎn)、實(shí)時(shí)犯罪現(xiàn)場(chǎng)等多種類(lèi)信息的犯罪情報(bào)研判體系。
1.數(shù)據(jù)化
大數(shù)據(jù)時(shí)代的來(lái)到,光靠紙筆人力的運(yùn)算和分析已經(jīng)捉襟見(jiàn)肘。人力有窮時(shí),更多時(shí)候通過(guò)諸如PGIS平臺(tái)等數(shù)據(jù)處理終端,憑借犯罪分子在犯罪預(yù)備時(shí)的交易、出行、通話(huà)以及金融數(shù)據(jù)快速勾勒出其犯罪動(dòng)向和時(shí)空軌跡,而這些是人力短時(shí)間所辦不到的。在這其中,數(shù)據(jù)的收集和分析是整個(gè)體系的發(fā)展方向,也是建模預(yù)測(cè)分析的基礎(chǔ)。當(dāng)然對(duì)于相關(guān)數(shù)據(jù)的保護(hù)和運(yùn)用缺陷也必須要引起我們的重視和完善。
2.多維可視化
數(shù)據(jù)種類(lèi)的增多、可視化技術(shù)的提高直接促進(jìn)了犯罪信息多維化、可視化程度的提高。前期已經(jīng)能夠?qū)⑽淖趾蛿?shù)據(jù)轉(zhuǎn)化為電子平面表格、趨勢(shì)圖,現(xiàn)在則能再進(jìn)一步,將電子信息地圖、個(gè)人信息、GIS實(shí)時(shí)定位、天眼監(jiān)控、電子投影等的功能整合,展現(xiàn)出包含3D犯罪現(xiàn)場(chǎng)、實(shí)時(shí)電子時(shí)空軌跡等二維、三維的可視場(chǎng)景,以供偵查部門(mén)工作參考。
3.智能化
由于數(shù)據(jù)的多樣和具體案件參考因素的不一,數(shù)據(jù)的整合現(xiàn)階段還停留在人工錄入、人工編程分析的階段,將數(shù)據(jù)錄入后再依據(jù)具體案件從數(shù)據(jù)庫(kù)中找尋自己需要的數(shù)據(jù),各數(shù)據(jù)庫(kù)信息平時(shí)不相連也不會(huì)發(fā)生碰撞,而數(shù)據(jù)信息代表的深層聯(lián)系也全憑偵查辦案人員的“頭腦風(fēng)暴”,這在無(wú)形中喪失了很多辦案線(xiàn)索,加大了偵破難度。在未來(lái)的發(fā)展趨勢(shì)中,高危人員、犯罪分子的數(shù)據(jù)智能整合分析無(wú)疑是一大方向,還能直接預(yù)測(cè)犯罪的同時(shí)減少警力的浪費(fèi)、有效打擊犯罪。同時(shí)人機(jī)交互體驗(yàn)的程度較低也是制約智能化的一大難題,加強(qiáng)系統(tǒng)的智能反饋,提高人機(jī)交互程度也是實(shí)踐和研究的一大方向。
體系作用總體歸納后,可以分為戰(zhàn)略目標(biāo)和戰(zhàn)術(shù)目標(biāo)兩個(gè)層次,有歷史穩(wěn)定的靜態(tài)分析、實(shí)時(shí)動(dòng)態(tài)的情報(bào)支援,未來(lái)犯罪熱點(diǎn)和趨勢(shì)預(yù)測(cè)三大工作任務(wù)。
1. 應(yīng)用目標(biāo)
具體而言,戰(zhàn)略層面的應(yīng)用包括犯罪發(fā)生地環(huán)境分析、犯罪熱點(diǎn)分析、犯罪趨時(shí)空勢(shì)分析與預(yù)測(cè)、多類(lèi)犯罪信息圖層疊加分析等;戰(zhàn)術(shù)層面的應(yīng)用包括串并案件時(shí)空軌跡分析、定位與管轄匹配分析、路線(xiàn)與指揮調(diào)度分析、數(shù)據(jù)碰撞分析、連線(xiàn)分析等針對(duì)具體案件實(shí)時(shí)動(dòng)態(tài)的情報(bào)支援等。
2. 應(yīng)用實(shí)況
在實(shí)際的運(yùn)用中(以美國(guó)為例),整個(gè)體系運(yùn)作從數(shù)據(jù)庫(kù)的搜集入手,從早期的依靠文本卷宗和人腦記憶口口相傳到手機(jī)、PC端、網(wǎng)絡(luò)數(shù)據(jù)、車(chē)載電子數(shù)據(jù)、行業(yè)及交易數(shù)據(jù)等多方面錄入,并包括視頻、圖像、語(yǔ)音、文字符號(hào)等多種形式,情報(bào)的甄別分類(lèi)也更多的由電腦預(yù)定程序輸入分級(jí),通過(guò)關(guān)鍵字索引和文本語(yǔ)義分析,將數(shù)據(jù)海洋匯總分流,最后借助統(tǒng)計(jì)學(xué)上的鄰近重復(fù)建模,通過(guò)回歸聚類(lèi)模型和可視化工具分析出犯罪風(fēng)險(xiǎn)地域和時(shí)空軌跡(例如由Twitter開(kāi)發(fā)的開(kāi)源實(shí)時(shí)分析計(jì)算工具Storm),并以Moran’sI指數(shù)[5](從社會(huì)學(xué)領(lǐng)域衍生而來(lái)計(jì)算某種社會(huì)現(xiàn)象空間自相關(guān)的理論)及公式檢驗(yàn)其合理性,最終構(gòu)建出一整套由一區(qū)一地上升到國(guó)家層面的犯罪情報(bào)研判體系。
而我國(guó)而為了適應(yīng)信息化和大數(shù)據(jù)時(shí)代的需求,于2006年8月正式推出的“金盾工程”二期建設(shè)初步方案,其中警用地理信息系統(tǒng)平臺(tái)便是國(guó)家“金盾工程”二期[6]提出的重點(diǎn)建設(shè)的三大高端應(yīng)用平臺(tái)之一,是公安將情報(bào)信息數(shù)據(jù)整合和深層次應(yīng)用的技術(shù)平臺(tái)。它在公安信息網(wǎng)絡(luò)的基礎(chǔ)上,借助警用電子地圖和數(shù)據(jù)分析平臺(tái),以服務(wù)于公安業(yè)務(wù)管理、情報(bào)信息共享和決策支持的可視化為目標(biāo),是“大情報(bào)”工程中信息化基礎(chǔ)設(shè)施的重要建設(shè)方向之一。針對(duì)不同環(huán)節(jié)的薄弱和不足,與其相對(duì)應(yīng)的完善建設(shè)步驟可以基本分為情報(bào)數(shù)據(jù)的搜集、篩選、挖掘、顯現(xiàn)四大部分,如下頁(yè)圖1所示。
圖1
1.必要性
(1)作為一種現(xiàn)實(shí)的剛性需求,大數(shù)據(jù)興起以來(lái),現(xiàn)實(shí)犯罪類(lèi)型和手法多樣化、犯罪水平和技術(shù)更加高超和隱蔽,同時(shí)利用數(shù)據(jù)的能力也越來(lái)越高,如果不想現(xiàn)實(shí)中上演“道高一尺魔高一丈”,讓處于灰色地帶的“數(shù)據(jù)勢(shì)力”掌握數(shù)據(jù)信息的強(qiáng)大力量,這種潛在的威脅時(shí)刻提醒著我們要加強(qiáng)數(shù)據(jù)挖掘運(yùn)用,加上響應(yīng)國(guó)家“十二五”建設(shè)國(guó)策的號(hào)召,因此最經(jīng)濟(jì)有效地構(gòu)建現(xiàn)代意義上的犯罪情報(bào)研判體系的方式便是對(duì)現(xiàn)階段推出的PGIS進(jìn)行完善。
(2)其次合理運(yùn)用PGIS平臺(tái)進(jìn)行數(shù)據(jù)建模,同時(shí)也是優(yōu)化現(xiàn)實(shí)警力配置的必經(jīng)之路。我國(guó)的警力相比于歐美國(guó)家本就稍顯不足,在2002年時(shí)我國(guó)的警力配置平均分別為10.86人/萬(wàn)人和10.4人/100平方公里,所以在搭配PGIS平臺(tái)的運(yùn)用后,既能緩解警力的數(shù)量不足,又可以幫助提升警務(wù)水平形成新一代“情報(bào)+警力+數(shù)據(jù)點(diǎn)”的模式,進(jìn)一步打擊犯罪。
(3)再次,以PGIS平臺(tái)為中心的現(xiàn)代犯罪情報(bào)研判體系興起發(fā)展不過(guò)短短數(shù)年,雖然具有強(qiáng)大的政策支援和發(fā)展?jié)摿?,但是也逐漸暴露除了平臺(tái)系統(tǒng)數(shù)據(jù)搜集、運(yùn)用、分析等方面存在的各方面缺陷,作為犯罪情報(bào)研判系統(tǒng)本身的不足,同樣也是現(xiàn)階段可以?xún)?yōu)化升級(jí)的關(guān)鍵部分。
④最后,理論的發(fā)展促使著實(shí)踐的進(jìn)步,越來(lái)越多的學(xué)者看到主動(dòng)型偵查的必要性和優(yōu)勢(shì)。隨著現(xiàn)代警務(wù)理論和技術(shù)的提高,同時(shí)發(fā)揮已有PGIS平臺(tái)的功用不致早期投入的資源、錄入的大量數(shù)據(jù)信息閑置浪費(fèi),在整合犯罪信息收集整理、犯罪熱點(diǎn)和時(shí)空規(guī)律分析等功能后,在現(xiàn)有的PGIS平臺(tái)基礎(chǔ)上構(gòu)建出具備大數(shù)據(jù)分析能力的犯罪情報(bào)研判體系勢(shì)在必行。
2.重要性
一方面出于對(duì)國(guó)家安全保障、社會(huì)穩(wěn)定秩序維護(hù)得考慮,必須進(jìn)一步提升警務(wù)水平保證面對(duì)新型犯罪不至于束手無(wú)策,而PGIS已經(jīng)成為我國(guó)警務(wù)系統(tǒng)不可或缺的一部分,所以我們不妨以此為突破口加以完善。
另一方面來(lái)講,大數(shù)據(jù)的運(yùn)用不止于如此,而PGIS為中心犯罪情報(bào)研判體系的建設(shè)最后所發(fā)揮的實(shí)際作用也不止于此。真正的大數(shù)據(jù),這些來(lái)自不同維度、不同途徑的數(shù)據(jù),并不限于文字圖片、聲音視頻、時(shí)空位置等,而將這些不同維度的數(shù)據(jù)放在一起判斷,得出來(lái)的趨勢(shì)才能更真實(shí)。當(dāng)數(shù)據(jù)庫(kù)的數(shù)據(jù)成體量成模式后,不限于日常犯罪預(yù)測(cè),更可延展至社會(huì)、教育、反恐、金融等多個(gè)領(lǐng)域,預(yù)測(cè)風(fēng)險(xiǎn)、規(guī)避雷區(qū),幫助國(guó)家做出合理決策,促進(jìn)和諧發(fā)展。
1.信息數(shù)據(jù)的來(lái)源和搜集
數(shù)據(jù)來(lái)源于信息,信息是情報(bào)之始。大數(shù)據(jù)下的情報(bào)收集一般說(shuō)來(lái)可以分成傳統(tǒng)企業(yè)數(shù)據(jù)(產(chǎn)品消費(fèi)明細(xì)、公司財(cái)務(wù)數(shù)據(jù)等),機(jī)器和傳感器數(shù)據(jù)(包括呼叫記錄、智能儀表和工業(yè)設(shè)備傳感器數(shù)據(jù),交易數(shù)據(jù),包括手機(jī)端和PC端在內(nèi)的設(shè)備日志),社交數(shù)據(jù)(包括如Twitter、Facebook、QQ、微信等社交平臺(tái)上的用戶(hù)行為記錄,反饋數(shù)據(jù)等)三類(lèi)。而打擊犯罪屬于國(guó)家職能,必要情況還可以依據(jù)法律動(dòng)用公權(quán)力建立的人口、財(cái)務(wù)、車(chē)輛、手機(jī)定位等特殊數(shù)據(jù),結(jié)合原有錄入公安刑事行政等案件資料庫(kù)的卷宗資料,從而奠定了先天的資源優(yōu)勢(shì)(如圖2所示[7],大部分黑色陰影所代表的信息資源都具有教大的潛力和易用性,政府信息稍有例外,下文有解釋?zhuān)梢砸源私㈥P(guān)于跨地域多主體(犯罪人、犯罪客體)的情報(bào)研判體系,幫助有效的預(yù)測(cè)并打擊犯罪。
圖2
2.信息數(shù)據(jù)的篩選
情報(bào)數(shù)據(jù)的洪量一方面帶來(lái)了更多的線(xiàn)索和路徑,同時(shí)在頭羊效應(yīng)和蝴蝶效應(yīng)影響下,也容易讓情報(bào)分析人員和智能系統(tǒng)陷入數(shù)據(jù)陷阱,在滿(mǎn)目繁多亦真亦假的數(shù)據(jù)里迷失。所以情報(bào)研判的必經(jīng)一步便是篩選,并分為辨別真假、分類(lèi)分級(jí)兩步。即首先在信息的錄入之初便進(jìn)行虛假資料甄別,并在數(shù)據(jù)碰撞分析環(huán)節(jié)進(jìn)行不合理數(shù)據(jù)單列的方式盡可能提高情報(bào)可信度。同時(shí)將所得來(lái)的數(shù)據(jù)信息按照區(qū)域、罪名類(lèi)別、作案人員人身社會(huì)特征、作案手段、作案時(shí)間、作案對(duì)象等多個(gè)方面劃分危險(xiǎn)和類(lèi)似性級(jí)別,以備數(shù)據(jù)分析挖掘之用。
3.數(shù)據(jù)的挖掘分析
經(jīng)過(guò)了“睜大眼睛”的數(shù)據(jù)錄入、“擦亮眼睛”的情報(bào)篩選,便到了“火眼金睛”剝繭抽絲的分析環(huán)節(jié),作為可視化前的最后一躍,數(shù)據(jù)的碰撞聚類(lèi)分析是最復(fù)雜也是最關(guān)鍵的一步。因?yàn)?,由?shù)據(jù)轉(zhuǎn)化為情報(bào),既包含了去粗取精去偽存真的剝離,更需要結(jié)合案件發(fā)生的狀況,借助統(tǒng)計(jì)學(xué)和社會(huì)學(xué)的模型對(duì)顯著犯罪因子進(jìn)行回歸、聚類(lèi)的建模分析,并通過(guò)如Moran’sI指數(shù)和HHI指數(shù)[8]來(lái)進(jìn)行顯著性測(cè)試檢驗(yàn)分析結(jié)果的合理性,最后得出可信的數(shù)據(jù)結(jié)論。
4.情報(bào)可視化
在借助如新型的可視化技術(shù)(Wordle圖[9]、故事線(xiàn)圖、平行坐標(biāo)圖、散點(diǎn)圖矩陣[10])轉(zhuǎn)化后,數(shù)據(jù)在最后一步中將以二維圖表圖像展示出來(lái),甚至在借助新的LIDAR系統(tǒng)、[11]ArcEngine可視化平臺(tái)[12]以及相關(guān)統(tǒng)計(jì)通用軟件(如SPSS/SAS/SPLUS、EXCEL、ACESS、CADmine等)和專(zhuān)用軟件I2系列軟件[13]后,可以實(shí)現(xiàn)全新的三維電子模擬場(chǎng)景的方式展示。同時(shí)現(xiàn)在不斷發(fā)展的VR技術(shù),也可能用于展示犯罪情報(bào)、現(xiàn)場(chǎng)犯罪勘察等方面,幫助犯罪情報(bào)的研判。
大數(shù)據(jù)背景下以PGIS為中心這套情報(bào)研判體系都是構(gòu)建在數(shù)據(jù)的運(yùn)用基礎(chǔ)之上,所以主要的薄弱環(huán)節(jié)也在數(shù)據(jù)的搜集、分析環(huán)節(jié),主要問(wèn)題則有以下幾點(diǎn)。
1.可用電子數(shù)據(jù)少而雜
在以往的公安工作中,PGIS中犯罪情報(bào)來(lái)源較窄、類(lèi)型單一且時(shí)空線(xiàn)索雜亂,無(wú)法直接用于流水線(xiàn)方式的數(shù)據(jù)情報(bào)轉(zhuǎn)化,因?yàn)榇蠖嗲閳?bào)來(lái)自于工作中人工接警出警后制作的犯罪人證人口供筆錄、案底卷宗、現(xiàn)場(chǎng)痕跡物證以及調(diào)查走訪(fǎng)中獲得的環(huán)境人情信息,多以文本甚至警員人腦記憶存在,這就直接導(dǎo)致數(shù)據(jù)庫(kù)里面的有效數(shù)據(jù)較少。除此之外,大多數(shù)錄入電子數(shù)據(jù)庫(kù)的人口車(chē)輛資料只是作為佐證在訊問(wèn)和法庭審判中使用,也沒(méi)有專(zhuān)門(mén)歸類(lèi)建模發(fā)揮其專(zhuān)業(yè)性,沒(méi)有完全發(fā)揮出應(yīng)有的全部效力用于云計(jì)算的犯罪時(shí)空分析。
2.數(shù)據(jù)庫(kù)協(xié)同度低
2016年3月5日,據(jù)李克強(qiáng)總理在全國(guó)推進(jìn)簡(jiǎn)政放權(quán)放管結(jié)合優(yōu)化服務(wù)改革電視電話(huà)會(huì)議上談話(huà)內(nèi)容,目前我國(guó)信息數(shù)據(jù)資源80%以上掌握在各級(jí)政府部門(mén)手里,這樣的“深藏閨中”是一種極大浪費(fèi)。如文中圖2所示,政府、公司、科研機(jī)構(gòu)都各自掌握著大量數(shù)據(jù),尤其是政府信息和金融貿(mào)易類(lèi),對(duì)國(guó)民生活影響巨大。但同時(shí)政府?dāng)?shù)據(jù)的易用性極低,代表著大量的數(shù)據(jù)情報(bào)沒(méi)有專(zhuān)門(mén)分類(lèi)管理,數(shù)據(jù)冗積雜糅彼此之間相互不聯(lián)通,體制化管理下其他信息主體有心使用數(shù)據(jù)也無(wú)處接觸,從而數(shù)據(jù)關(guān)聯(lián)不強(qiáng),數(shù)據(jù)無(wú)法形成一個(gè)暢通的數(shù)據(jù)鏈進(jìn)行數(shù)據(jù)交流和碰撞。
除此之外,考慮到國(guó)家行業(yè)安全和政治穩(wěn)定,PGIS平臺(tái)對(duì)于大數(shù)據(jù)的利用也只是限于部分行業(yè)。但是在保證穩(wěn)定安全的前提下,嘗試行業(yè)部門(mén)間的有用數(shù)據(jù)共享交流是個(gè)很好的選擇。
3.建模分析方法繁瑣不一
(1)我國(guó)現(xiàn)代嘗試研究犯罪因子的統(tǒng)計(jì)學(xué)方法多樣,各有優(yōu)缺,有如杜德斌、湯建中基于犯罪期望理論對(duì)城市犯罪區(qū)位選擇的數(shù)學(xué)模擬研究,有如學(xué)者佟瑞鵬基于基尼系數(shù)法的全國(guó)安全社區(qū)數(shù)量分布規(guī)劃研究,但由于實(shí)際工作操作性的限制,當(dāng)前PGIS的云計(jì)算中終究沒(méi)有一套較為便捷可行的犯罪系數(shù)計(jì)算公式來(lái)確定國(guó)家和區(qū)域?qū)用娴姆缸飯D譜,無(wú)法形成一套完整的研判體系。
(2)各地方開(kāi)發(fā)的犯罪電子研判系統(tǒng)對(duì)犯罪影響因子和采用計(jì)算方法的不一,也導(dǎo)致各自的口徑大小不同,難以實(shí)現(xiàn)完全的對(duì)接共享,對(duì)于區(qū)域協(xié)同帶來(lái)了不便。
(3)建模分析采用的絕大多數(shù)方法局限于統(tǒng)計(jì)學(xué)、社會(huì)學(xué)的理論運(yùn)算,而對(duì)犯罪行為涉及的心理學(xué)、人類(lèi)行為學(xué)等現(xiàn)實(shí)因素考慮不深,使得建模在用于實(shí)踐中稍顯不足。
4.三維化程度低
我國(guó)當(dāng)前的PGIS基本能做到在電子地圖上疊加部分犯罪數(shù)據(jù),形成簡(jiǎn)單的二維犯罪電子地圖,能夠應(yīng)對(duì)宏觀和簡(jiǎn)單犯罪因子的情報(bào)研判。但是面對(duì)局部微觀層面的犯罪現(xiàn)場(chǎng)觀測(cè)、多因子犯罪預(yù)測(cè)和實(shí)時(shí)情報(bào)支援時(shí),則需要虛擬三維化(即在3D視角下可通過(guò)電子模擬出可多角度多維度查看犯罪信息的犯罪現(xiàn)場(chǎng))的電子情報(bào)支援,而這方面我國(guó)尚在摸索。
5.法律空白多
在目前,出于對(duì)隱私權(quán)權(quán)方面和實(shí)際警務(wù)情報(bào)工作進(jìn)展的考慮,對(duì)犯罪情報(bào)收集尚有諸多法律的限制和空白,諸如國(guó)家公權(quán)力在管理參考公民個(gè)人信息的程序規(guī)范問(wèn)題、企業(yè)在搜集手機(jī)端用戶(hù)偏好及個(gè)人身份財(cái)務(wù)信息的侵權(quán)問(wèn)題、公民日常財(cái)務(wù)數(shù)據(jù)的保管和保護(hù)問(wèn)題等仍待解決。
1.擴(kuò)大數(shù)據(jù)錄入面
在試驗(yàn)不變的條件下重復(fù)試驗(yàn)多次,隨機(jī)事件的頻率近似于它實(shí)際發(fā)生的幾率。而隨著計(jì)算機(jī)的處理能力的日益強(qiáng)大,能獲得的數(shù)據(jù)量越大,所能挖掘到的價(jià)值就越多,同時(shí)對(duì)事件發(fā)生的預(yù)判也越準(zhǔn)確。區(qū)別于傳統(tǒng)情報(bào)工作,在大數(shù)據(jù)的海洋里“捕魚(yú)”,可供犯罪預(yù)測(cè)的情報(bào)數(shù)據(jù)也遠(yuǎn)不止前文如此,所以可視化情報(bào)數(shù)據(jù)的多渠道搜集才是基礎(chǔ)。
(1)增錄手機(jī)端數(shù)據(jù)。PGIS的數(shù)據(jù)庫(kù)在原本手機(jī)信號(hào)基站定位的使用基礎(chǔ)上,增加錄入經(jīng)用戶(hù)授權(quán)后報(bào)警APP數(shù)據(jù)及其他網(wǎng)絡(luò)數(shù)據(jù)。例如,于2016年研制并嘗試推廣的兩款情報(bào)終端APP——FAFA(Fighting Against Fraud Applicant,中文名發(fā)發(fā))與智慧110,用戶(hù)已經(jīng)能夠在手機(jī)上錄入犯罪情況、罪犯特征并上傳視頻聲像資料,真正的“隨手轉(zhuǎn)發(fā)正能量”,同時(shí)后臺(tái)能夠通過(guò)云計(jì)算將某一區(qū)域或某一類(lèi)型的犯罪率通過(guò)顏色的深淺和標(biāo)識(shí)表現(xiàn)在地圖上,類(lèi)似國(guó)外的Crime Reports電子地圖(如圖4)。
圖4
(2)各行業(yè)數(shù)據(jù)庫(kù)數(shù)據(jù)共享。自2013年3月公布“大數(shù)據(jù)研發(fā)計(jì)劃”后,中央情報(bào)局將與亞馬遜網(wǎng)頁(yè)服務(wù)公司合作,美國(guó)便開(kāi)啟了私營(yíng)領(lǐng)域與公共事業(yè)部門(mén)在包括地理情報(bào)在內(nèi)的的跨界合作。我國(guó)可以加以借鑒,在原本的犯罪數(shù)據(jù)上整合特種行業(yè)的數(shù)據(jù)庫(kù)(包括常駐暫住人口資料、機(jī)動(dòng)車(chē)輛數(shù)據(jù)、工商登記注冊(cè)數(shù)據(jù)、戶(hù)籍身份數(shù)據(jù)、高危及重點(diǎn)人員資料、指紋及DNA數(shù)據(jù)、民航數(shù)據(jù)、住宿數(shù)據(jù)、執(zhí)法記錄、通信記錄、公交IC卡數(shù)據(jù)、銀行存取數(shù)據(jù)、車(chē)輛卡口及其GPS數(shù)據(jù)、網(wǎng)絡(luò)服務(wù)記錄、水電交易數(shù)據(jù)等),打造一張覆蓋全國(guó)的數(shù)據(jù)網(wǎng),從而在技術(shù)角度更好的摸清犯罪形勢(shì)軌跡,同時(shí)為后面的數(shù)據(jù)分析挖掘提供更多的方向和影響因子,提高預(yù)測(cè)的準(zhǔn)度。
2.強(qiáng)化數(shù)據(jù)篩選
(1)工作專(zhuān)門(mén)化
一方面加強(qiáng)對(duì)情報(bào)人員的數(shù)據(jù)串連篩選能力培訓(xùn),能夠熟練的掌握基本的數(shù)據(jù)統(tǒng)計(jì)分析和犯罪制圖技術(shù),能夠編程設(shè)計(jì)和靈活使用如類(lèi)似爬蟲(chóng)軟件的信息篩選抓取程序;另一方面借鑒國(guó)外的做法采用經(jīng)過(guò)專(zhuān)業(yè)準(zhǔn)入門(mén)檻考核的數(shù)據(jù)分析師去專(zhuān)門(mén)管理數(shù)據(jù)。
(2)分級(jí)分區(qū)
理清類(lèi)別級(jí)別之間的標(biāo)準(zhǔn),并單劃出不拘泥于行政區(qū)劃的犯罪預(yù)測(cè)區(qū)?;诙嗥鸢讣陌l(fā)案地圍繞其平均中心正態(tài)分布的理論[14],以劃定犯罪預(yù)測(cè)區(qū)的基本分析模型對(duì)系列案件發(fā)生地的預(yù)測(cè),在數(shù)據(jù)錄入之初便進(jìn)行數(shù)據(jù)的歸類(lèi)標(biāo)準(zhǔn)包括危險(xiǎn)程度、犯罪風(fēng)格、犯罪人同一性、是否為前科或團(tuán)伙犯罪等方面劃定,這些都能為后面的工作開(kāi)展提供極大便利,目前有香港模式四級(jí)模式[15]、珠海四級(jí)模式、歐美“4×4體系”。這擺脫了行政區(qū)劃的思維桎梏,同時(shí)也有利于警方跨區(qū)域的協(xié)同觀測(cè)辦案。
(3)提高有效關(guān)鍵詞抓取
關(guān)鍵詞抓取是在語(yǔ)義處理、文本數(shù)據(jù)檢索中常用的方法,但關(guān)鍵詞的選取和組合必須要提高效度。例如美國(guó)居民在用Google搜索‘高壓鍋’+‘背包’后被反恐部隊(duì)遭搜查住宅的事件在2013年盛傳,雖事后證明事情有夸大曲折之處,但是也應(yīng)引起我們的警惕。
(4)排除數(shù)據(jù)間的虛假關(guān)聯(lián)
①在法律許可的情況下堅(jiān)決貫徹實(shí)名制注冊(cè),杜絕源頭的虛假用戶(hù)資料。
②由于亞文化的普遍存在,文化差異導(dǎo)致的語(yǔ)義分別也會(huì)反映在數(shù)字世界中,要依目標(biāo)所處情境對(duì)“異?!边M(jìn)行有效界定,確保獲取的“異?!贝_屬異常。
③及時(shí)辟謠,防止虛假信息的蝴蝶效應(yīng),在冤假錯(cuò)案后也及時(shí)“沉冤昭雪”更新數(shù)據(jù)庫(kù)內(nèi)容,保持權(quán)威數(shù)據(jù)的真實(shí)性。
④同時(shí)定時(shí)清理冗積在資料庫(kù)中的無(wú)用的、重復(fù)的、帶陷阱病毒的垃圾數(shù)據(jù),這樣避免了冗余值的意外溢出導(dǎo)致程序出現(xiàn)紕漏,統(tǒng)計(jì)結(jié)果而受到影響,促進(jìn)數(shù)據(jù)能迅速的轉(zhuǎn)化為情報(bào)。
3.數(shù)據(jù)分析與挖掘
(1)數(shù)據(jù)建模
簡(jiǎn)單的依靠人力眼力分析犯罪熱點(diǎn)和時(shí)空規(guī)律只能在小范圍個(gè)別案件比較實(shí)用,面對(duì)案件數(shù)量和地域的擴(kuò)寬,要提高工作的效率和質(zhì)量,就必須依靠平臺(tái)的數(shù)據(jù)建模功能進(jìn)行智能的批量分析。由于PGIS的數(shù)據(jù)庫(kù)建立的根基在于GIS系統(tǒng),所以數(shù)據(jù)建模更適合用空間自相關(guān)方法來(lái)進(jìn)行聚類(lèi)和回歸分析,通俗的講就是看菜吃飯,通過(guò)觀察地區(qū)犯罪的相似度和關(guān)聯(lián)性分析出某一類(lèi)犯罪事件或者犯罪主客體的獨(dú)立集聚效果、犯罪熱點(diǎn)地帶,從而為犯罪劃區(qū)監(jiān)測(cè)研判提供導(dǎo)向。這就跳出了前期犯罪因子選擇的限制,可以口徑一致的用于全國(guó)范圍。
建模的方法必須依靠統(tǒng)計(jì)學(xué),而討論空間自相關(guān)[16]時(shí)多用Moran’s I指數(shù)(分為全局型、局地型[17]兩種)和G系數(shù)[18]。G系數(shù)探測(cè)聚集現(xiàn)象的能力受規(guī)模的影響穩(wěn)定性較差;全局型Moran’s I指數(shù)偏向概括側(cè)重整體趨勢(shì)分布,探測(cè)出空間聚集范圍的擴(kuò)展,但無(wú)法具體到熱點(diǎn)關(guān)聯(lián)分布;而局地型則剛好彌補(bǔ)了這種缺陷,能夠判斷空間數(shù)據(jù)是高值聚集還是低值聚集,因此需要結(jié)合兩種運(yùn)算方法來(lái)建模。權(quán)衡之下故本文選擇了Moran’sI指數(shù)。
Moran’s I考察的是相鄰的區(qū)域是否存在相似或相異的指標(biāo)值,I取值范圍為-1到+1,若Moran’s I接近1,說(shuō)明相似的值在空間上存在明顯的集聚(同高或同低,正相關(guān))。若Moran’s I接近-1,則說(shuō)明迥異的值存在集聚現(xiàn)象(此高彼低,負(fù)相關(guān))。若Moran’s I接近于0,則說(shuō)明該空間現(xiàn)象傾向于隨機(jī)分布,不存在空間自相關(guān)現(xiàn)象。
(2)公式檢驗(yàn)
針對(duì)Moran’s I指數(shù)的合理性,正態(tài)Z(I)進(jìn)行顯著性檢驗(yàn)[19],當(dāng)Z(I)值大于1.96,即為顯著性高于95%,則為通過(guò)顯著性檢驗(yàn),結(jié)論證明熱點(diǎn)集聚。而Z值絕對(duì)值愈大,則表明空間集聚或自相關(guān)現(xiàn)象愈明顯。最后滿(mǎn)足局部地域型Moran’sI指數(shù)絕對(duì)值接近1且Z(I)值大于1.96等條件既可以完成犯罪熱點(diǎn)的判定。
(3)數(shù)據(jù)挖掘
當(dāng)然,數(shù)據(jù)的運(yùn)用遠(yuǎn)遠(yuǎn)不止在頻率統(tǒng)計(jì)、共詞計(jì)算層次上,單串?dāng)?shù)據(jù)承載的信息是破碎的、單線(xiàn)索式的,因此如果需要結(jié)合信息集成分析和數(shù)據(jù)對(duì)比串連來(lái)深入挖掘背后的隱藏線(xiàn)索,從而使能達(dá)到以下目標(biāo)。
①通過(guò)大數(shù)據(jù)可以鎖定犯罪分子人身信息及位置,在信息集成分析理論的指導(dǎo)下,完善以PGIS為代表的犯罪信息系統(tǒng)中的精確檢索、自動(dòng)交叉比對(duì)和模糊查詢(xún)等功能,以案件已有信息為先導(dǎo),進(jìn)行網(wǎng)上查證摸排后串并案件,鎖定破案方向,從而真正落實(shí)了情報(bào)信息主導(dǎo)警務(wù)戰(zhàn)略。
②還原重現(xiàn)犯罪過(guò)程和犯罪活動(dòng)的時(shí)空軌跡模式,是根據(jù)作案人員、工具、痕跡、物品、動(dòng)機(jī)、手段和時(shí)機(jī)選擇等方面不同的信息數(shù)據(jù)集合的相似以及在時(shí)空上的關(guān)聯(lián)(如空間上的首尾相接、時(shí)間線(xiàn)上的前后相連、作案手法的繼承等),運(yùn)用數(shù)據(jù)挖掘技術(shù)從更廣泛的角度進(jìn)行案件的串并[20]。
③進(jìn)行犯罪專(zhuān)題研究,發(fā)現(xiàn)犯罪規(guī)律與特點(diǎn)。如高危群體分析、節(jié)假日刑事案件分析、“兩搶一偷”案件與交通的關(guān)系等,進(jìn)行情報(bào)的內(nèi)在關(guān)聯(lián)分析,再結(jié)合嫌疑人行為軌跡特點(diǎn)篩選重點(diǎn)嫌疑對(duì)象,從而使情報(bào)的檢測(cè)研判有的放矢。
④通過(guò)多套數(shù)據(jù)庫(kù)對(duì)比,對(duì)同類(lèi)型罪犯、案件、環(huán)境進(jìn)行犯罪行為模式建模,為犯罪事件的預(yù)測(cè)做好數(shù)據(jù)準(zhǔn)備。
4.情報(bào)多維可視化
經(jīng)過(guò)基礎(chǔ)的綜合各城市地塊人口分布、案件性質(zhì)、道路交通格局各個(gè)與犯罪緊密相關(guān)的數(shù)據(jù)錄入后,公式計(jì)算、顯著性檢驗(yàn)及最后經(jīng)過(guò)圖層疊加分析的地圖輸出都可以通過(guò)ArcGIS10軟件來(lái)實(shí)現(xiàn),最后利用ArcGIS10[21]技術(shù),制作核心密度估計(jì)圖(即犯罪熱點(diǎn)地圖)來(lái)實(shí)現(xiàn)犯罪分布模式和犯罪趨勢(shì)面的可視化。
現(xiàn)在PGIS平臺(tái)經(jīng)過(guò)圖層疊加和電子地圖的結(jié)合,也基本能在較宏觀的層面根據(jù)坐標(biāo)指數(shù)實(shí)現(xiàn)情報(bào)的二維平面展示,能夠進(jìn)行基本的定位和分析,制作刑事案件斑點(diǎn)圖,如圖5。
圖5
但是隨著犯罪情報(bào)的需要,更趨向微觀和實(shí)時(shí)顯示的多維化也越來(lái)越需要關(guān)注,主要體現(xiàn)在全息位置地圖、多維動(dòng)態(tài)場(chǎng)景模擬兩大方面。
全息位置地圖是以空間位置為基礎(chǔ),全面反映位置本身地理人文信息及其與位置相關(guān)的各種特征、事件或物體的數(shù)字地圖,相比二維地圖能夠承載更多的信息細(xì)節(jié),如作為基礎(chǔ)圖層的圖6[22],圖7[23]。
圖6
圖7
多維動(dòng)態(tài)場(chǎng)景模擬則包括搭建室內(nèi)室外三維模型(如憑建筑數(shù)據(jù)做出的3D動(dòng)態(tài)模擬場(chǎng)景)、多信息多圖層疊加下的全景地圖、現(xiàn)場(chǎng)重建動(dòng)態(tài)模擬、影像地圖一體化整合等多重內(nèi)容,可以實(shí)現(xiàn)室外案件中包括涉案建筑場(chǎng)所、交通路線(xiàn)、重點(diǎn)涉案人員等的軌跡疊加分析,指揮部門(mén)可動(dòng)態(tài)模擬某犯罪嫌疑人或所駕車(chē)輛的逃離路線(xiàn)和速度,也可模擬人員的流動(dòng)軌跡,形象直觀地輔助公安人員科學(xué)決策,如人機(jī)交互式可視化。除了必要的室外追逃,人類(lèi)約80%~90%的時(shí)間處于室內(nèi),室內(nèi)環(huán)境的多維動(dòng)態(tài)場(chǎng)景建模也顯得十分迫切和重要。
5.合法化
因?yàn)橛脩?hù)隱私信息、商業(yè)秘密等都屬于私權(quán)范圍,業(yè)內(nèi)常遵循“誰(shuí)擁有誰(shuí)控制”原則,又當(dāng)裁判又當(dāng)運(yùn)動(dòng)員的情況下缺乏中立的獨(dú)立主體有效監(jiān)督。而情報(bào)數(shù)據(jù)過(guò)程中,搜集階段常常通過(guò)技偵手段秘密進(jìn)行以及數(shù)據(jù)的授權(quán)性使用,又極易侵犯公民的隱私權(quán)和自由權(quán),因而招致很多議。同時(shí)由記者斯諾登曝光的美國(guó)“棱鏡計(jì)劃”事件以及原重慶公安局長(zhǎng)王立軍濫用技偵手段秘密搜集情報(bào)等新聞?lì)l發(fā),也引發(fā)了公眾對(duì)此的排斥。
因此我們一方面要加強(qiáng)對(duì)PGIS數(shù)據(jù)收集的規(guī)范性,提升執(zhí)法人員的法律素養(yǎng),嚴(yán)格保護(hù)公民的合法權(quán)益以及隱私;同時(shí)借鑒西方比如美國(guó)的陽(yáng)光法、科學(xué)數(shù)據(jù)共享法令、合同協(xié)議機(jī)制立法等,加強(qiáng)相關(guān)信息使用的法律立法,對(duì)大數(shù)據(jù)的合理使用正規(guī)化、合法化。
在本項(xiàng)研究中,由于實(shí)證數(shù)據(jù)的缺乏,同大部分理論一樣,措施構(gòu)想仍停留在紙面理論而未能置于實(shí)踐中論證其合理可行性。對(duì)于數(shù)據(jù)多維可視化的發(fā)展方向部分靈感來(lái)自影視作品的理論構(gòu)想,PGIS平臺(tái)技術(shù)的發(fā)展是否能現(xiàn)實(shí)實(shí)現(xiàn)還有待實(shí)證。
同時(shí),在文中所用于數(shù)據(jù)分析的公式,一方面,跳出了實(shí)際犯罪因子數(shù)據(jù)指標(biāo)的限制,可以統(tǒng)一各地口徑用于全國(guó)層面的大數(shù)據(jù)建設(shè),但是另一方面也一定程度的脫離區(qū)域?qū)嶋H,可能導(dǎo)致后期數(shù)據(jù)搜集的偏離,從而影響全局的數(shù)據(jù)分析挖掘。同時(shí)在檢驗(yàn)其顯著性時(shí),公式本身也有一些如未能采用標(biāo)準(zhǔn)差,采用方差等生硬的缺點(diǎn),在數(shù)據(jù)計(jì)算分析上可能會(huì)有偏差。對(duì)于犯罪情報(bào)數(shù)據(jù)的研判理論部分,沿用社會(huì)解組理論和日?;顒?dòng)理論,心理學(xué)、社會(huì)學(xué)、統(tǒng)計(jì)學(xué)仍然停留在比較初級(jí)的綜合運(yùn)用水平上,沒(méi)有很好的綜合三大學(xué)科來(lái)解釋犯罪集群效應(yīng)的變化發(fā)展,對(duì)于眾多的犯罪事件也能是取一瓢飲,管窺蠡測(cè)之下不免有缺陷和疏漏,所以仍待進(jìn)一步的改進(jìn)。
[1] Ucinet,由加州大學(xué)歐文(Irvine)分校的一群網(wǎng)絡(luò)分析者編寫(xiě)的網(wǎng)絡(luò)分析集成軟件,包含子群分析、統(tǒng)計(jì)分析、矩陣分析、可視化分析等模塊,是目前最流行的,也是最容易上手的社會(huì)網(wǎng)絡(luò)分析軟件。
[2]王萌:《警務(wù)大數(shù)據(jù)案例:大數(shù)據(jù)預(yù)測(cè)分析與犯罪預(yù)防》,來(lái)源http://www.ctocio.com/ccnews/15551.html,最后訪(fǎng)問(wèn)日期2019年5月7日。
[3]美國(guó)學(xué)者Sampson和Groves在1989年提出了社會(huì)解組理論(研究鄰里社區(qū)環(huán)境中經(jīng)濟(jì)社會(huì)地位、種族多樣性和人口流動(dòng)性因素對(duì)犯罪發(fā)生的影響),學(xué)者Cohn和Felson提出了日?;顒?dòng)理論——主要研究有動(dòng)機(jī)的犯罪(motivated offenders)、合適的目標(biāo)(suitable targets)和犯罪防范的缺失(absence of capable guardians against crime)三大因素對(duì)犯罪發(fā)生的影響。這兩大理論在社會(huì)學(xué)領(lǐng)域內(nèi)分別探討了不同犯罪因子對(duì)犯罪發(fā)生的催化作用,是犯罪地理學(xué)、犯罪生態(tài)學(xué)的核心理論之一。
[4]劉大千:《長(zhǎng)春市犯罪空間分析及規(guī)劃管理防控》,東北師范大學(xué)2012年博士學(xué)位論文,第25-26頁(yè)。
[6] “金盾”工程,實(shí)質(zhì)上就是公安通信網(wǎng)絡(luò)與計(jì)算機(jī)信息系統(tǒng)建設(shè)工程,1999年開(kāi)始啟動(dòng)準(zhǔn)備,工程包括全國(guó)公安綜合業(yè)務(wù)通信網(wǎng)、全國(guó)違法犯罪信息中心(CCIC)、全國(guó)公安指揮調(diào)度系統(tǒng)工程、全國(guó)公共網(wǎng)絡(luò)安全監(jiān)控中心等系統(tǒng)建設(shè),現(xiàn)已經(jīng)實(shí)施到第二期?!敖鸲芄こ獭倍谌髴?yīng)用平臺(tái)分別是指是指“公安情報(bào)信息綜合平臺(tái)”、“警用地理信息基礎(chǔ)應(yīng)用平臺(tái)”和“部門(mén)間信息共享與服務(wù)平臺(tái)”。
[7]圖例中初始數(shù)據(jù)統(tǒng)計(jì)來(lái)源于美國(guó)勞動(dòng)統(tǒng)計(jì)局,基礎(chǔ)圖層出自麥肯錫公司會(huì)議報(bào)告上.Bigdata:The next frontier for innovation,competition,and productivity,2011
[8] 赫芬達(dá)爾—赫希曼指數(shù)(Herfindahl-HirschmanIndex),簡(jiǎn)稱(chēng)HHI,來(lái)自于經(jīng)濟(jì)學(xué)中研究大企業(yè)對(duì)市場(chǎng)的影響程度——數(shù)值越接近1,壟斷集中度越高,現(xiàn)多用于檢測(cè)自相關(guān)性和聚集效應(yīng)的分析。
[9] Wordle圖,即采用用色相區(qū)分不同的關(guān)鍵詞類(lèi)型的著色可視化方法。
[10]散點(diǎn)圖矩陣是散點(diǎn)圖的高維擴(kuò)展,可以添加其他圖形元素,以增強(qiáng)表達(dá)力,最常見(jiàn)的添加劑有坐軸須、直方圖、箱線(xiàn)圖、平滑曲線(xiàn)、擬合曲線(xiàn)等。它從一定程度上克服了在平面上展示高維數(shù)據(jù)的困難,在展示多維數(shù)據(jù)的兩兩關(guān)系時(shí)有著不可替代的作用。
[11]一種軟件系統(tǒng),能獲取高精度、高密度的三維坐標(biāo)點(diǎn)云數(shù)據(jù)和空間對(duì)象的深度信息,構(gòu)建具有準(zhǔn)確幾何信息的三維立體模型。
[12]一個(gè)用于構(gòu)建定制應(yīng)用的完整的嵌入式的GIS組件庫(kù),可以用于數(shù)據(jù)可視化。
[13] I2軟件是IBM公司的一款面向警務(wù)、情報(bào)、調(diào)查及商業(yè)組織提供領(lǐng)先全球的可視化情報(bào)分析調(diào)查的軟件產(chǎn)品。
[14] 根據(jù)這一理論,犯罪發(fā)生在距離平均中心一個(gè)標(biāo)準(zhǔn)差距離內(nèi)的概率為68%,發(fā)生在距離平均中心兩個(gè)標(biāo)準(zhǔn)差距離內(nèi)的概率為95%。也就是說(shuō),在這一分析模型中,下一起案件只有5%的概率會(huì)發(fā)生在兩個(gè)標(biāo)準(zhǔn)差距離的劃定范圍之外。
[15]一種情報(bào)分級(jí)制度,按照情報(bào)提供人參與程度將情報(bào)來(lái)源渠道分為“親自參與、親眼目睹、直接耳聞、間接耳聞”四級(jí)。
[16]空間自相關(guān)是指同一個(gè)變量在不同空間位置上的相關(guān)性,通俗的講便是測(cè)量同一類(lèi)事物之間互相影響從而出現(xiàn)的特殊分布規(guī)律。
[17]這里是基于全局型Moran’s I指數(shù)的缺點(diǎn),Anselin在1995年提出的LISA(local indicators of spatial association,空間關(guān)聯(lián)局域指標(biāo)),與全局空間自相關(guān)成比例,能夠比較契合的找到了相關(guān)具體犯罪熱點(diǎn)。
[18]全局G系數(shù),Getis和Ord于1992年提出用于測(cè)量空間自相關(guān)性的公式。
[19]針對(duì)Moran’s I指數(shù)的合理性檢驗(yàn),有標(biāo)準(zhǔn)近似值(normal approximation)的正態(tài)Z(I)和隨機(jī)化試驗(yàn)化進(jìn)行兩種方式進(jìn)行顯著性檢驗(yàn),因?yàn)榍罢吒?jiǎn)便,故采用前者。
[20]張春敏、郭云嫣、劉全海著:《室內(nèi)外多維時(shí)空數(shù)據(jù)融合及其在PGIS中的應(yīng)用》,載《測(cè)繪通報(bào)》2016年第12期。
[21] 2010年,Esri公司推出ArcGIS10,作為全球首款支持云架構(gòu)的GIS平臺(tái),實(shí)現(xiàn)了GIS由共享向協(xié)同的飛躍;同時(shí)ArcGIS10具備了真正的3D建模、編輯和分析能力,并實(shí)現(xiàn)了由三維空間向四維時(shí)空的飛躍,逐步做到了真正的RS(遙感)與GIS一體化。
[22]圖6為通過(guò)三維建模后結(jié)合電子信息地圖搭建的實(shí)地模型,可以查閱包括海拔高度、地形分布、經(jīng)緯位置、水文分布等多重信息。
[23]圖7是SkylineGlobe公司推出的軟件做出的3D視域分析,可以幫助快速找到各類(lèi)信息的分布及狀況程度,還可以在此基礎(chǔ)上再借助該過(guò)程僅依靠簡(jiǎn)單連續(xù)的標(biāo)準(zhǔn)二維圖像(如傾斜攝影測(cè)量影像),創(chuàng)建一組高分辨率的三維網(wǎng)格模型,無(wú)需人工干預(yù),快速構(gòu)建城市級(jí)3D模型。
本文系國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目(項(xiàng)目批準(zhǔn)號(hào):17VHL004)的階段性成果。
*韓旭,男,四川大學(xué)法學(xué)院教授、博士生導(dǎo)師,中國(guó)法學(xué)會(huì)犯罪學(xué)研究會(huì)常務(wù)理事。
熊鑫,男,四川大學(xué)法學(xué)院,訴訟法學(xué)碩士生,研究方向偵查學(xué)、訴訟法學(xué)。
(責(zé)任編輯:廖根為)