張文英 耿秋實(shí) 張雪瑩 李慧波
摘要:大數(shù)據(jù)時(shí)代,數(shù)據(jù)資源共享開(kāi)放和綜合利用給公共安全領(lǐng)域警務(wù)模式帶來(lái)了重大變革。論文首先分析了大數(shù)據(jù)在社會(huì)安全中的應(yīng)用現(xiàn)狀及其具有的重要地位與作用;給出了天空地一體化大數(shù)據(jù)的定義及其存在的新特征,結(jié)合天空地一體化大數(shù)據(jù)在社會(huì)治安防控和反恐維穩(wěn)方面的實(shí)際應(yīng)用需求,利用大數(shù)據(jù)的理論和方法,開(kāi)展系統(tǒng)的總體架構(gòu)設(shè)計(jì),最后以系統(tǒng)建設(shè)過(guò)程中的數(shù)據(jù)協(xié)同感知與處理、數(shù)據(jù)融合關(guān)聯(lián)、分析建模、應(yīng)用為主線探討各個(gè)環(huán)節(jié)涉及的關(guān)鍵技術(shù)。
關(guān)鍵詞:天空地一體化大數(shù)據(jù);社會(huì)安全;融合關(guān)聯(lián);事件預(yù)測(cè);可視化
中圖分類號(hào):TP399 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)10-0055-03
大數(shù)據(jù)時(shí)代的來(lái)臨,推動(dòng)了數(shù)據(jù)資源共享開(kāi)放和開(kāi)發(fā)應(yīng)用。目前,大數(shù)據(jù)已在電子商務(wù)、交通、公共衛(wèi)生、金融等行業(yè)發(fā)揮了重要作用,也為社會(huì)安全治安防控提供新途徑、新手段。美國(guó)是國(guó)際上較早就利用大數(shù)據(jù)進(jìn)行反恐的國(guó)家之一。據(jù)調(diào)查:美國(guó)政府(NATGRID)情報(bào)部門通過(guò)利用21個(gè)不同的部門和機(jī)構(gòu)的海量數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,綜合利用重點(diǎn)關(guān)注人員平時(shí)產(chǎn)生的各種信息,包括交通、購(gòu)物、交友、通話、電子郵件、聊天記錄、視頻等,以清晰勾勒出犯罪嫌疑人的行蹤和面貌。基于大數(shù)據(jù)技術(shù)的信息安全智能化在幫助美國(guó)打擊恐怖分子中起到了巨大的作用。近年來(lái),我國(guó)各地公安機(jī)關(guān)也在不斷探索大數(shù)據(jù)的實(shí)戰(zhàn)應(yīng)用,紛紛利用大數(shù)據(jù)開(kāi)展反恐維穩(wěn)預(yù)測(cè)、治安形勢(shì)預(yù)測(cè)、社會(huì)安全治理、社會(huì)輿情預(yù)測(cè)等方面的應(yīng)用探索工作[1]。
由此可見(jiàn),大數(shù)據(jù)在社會(huì)安全領(lǐng)域具有很大的利用價(jià)值。但是目前的很多公安大數(shù)據(jù)平臺(tái)還存在數(shù)據(jù)采集不全面、信息融合不夠、關(guān)聯(lián)性弱等問(wèn)題,本文重點(diǎn)從反恐維穩(wěn)、社會(huì)治安防控的角度,研究天空地一體化大數(shù)據(jù)在社會(huì)安全領(lǐng)域的應(yīng)用,旨在利用大數(shù)據(jù)、云計(jì)算等信息手段提升公安部門對(duì)違法犯罪行為和管控對(duì)象進(jìn)行有效預(yù)警和打擊處理的能力。
1 天空地一體化大數(shù)據(jù)的定義及特征
1.1 天空地一體化大數(shù)據(jù)的定義
什么是天空地一體化大數(shù)據(jù)?這里的天空地一體化大數(shù)據(jù)泛指空天領(lǐng)域的衛(wèi)星和航拍影像以及地面檢測(cè)采集的各類數(shù)據(jù)的統(tǒng)稱。根據(jù)天空地一體化大數(shù)據(jù)中所涉及的不同領(lǐng)域和來(lái)源,對(duì)數(shù)據(jù)進(jìn)行分類:
(1)衛(wèi)星和航拍影像數(shù)據(jù)
衛(wèi)星和航拍影像數(shù)據(jù)包括航天、航空多種平臺(tái)上多個(gè)傳感器產(chǎn)生的數(shù)據(jù),如全色、多光譜、高光譜、紅外、合成孔徑雷達(dá)(SAR)、激光雷達(dá)(LiDAR)等拍攝的遙感影像數(shù)據(jù)。
(2)公安業(yè)務(wù)部門數(shù)據(jù)
公安業(yè)務(wù)部門數(shù)據(jù)掌握在各個(gè)部門手中,主要包括電子卡口數(shù)據(jù)、監(jiān)控視頻錄像、電子圍欄、電子警察、出入境辦證信息、出入境記錄、接處警信息、常住人口、重點(diǎn)人員、機(jī)動(dòng)車、駕駛員、歷史案例等[1]。
(3)社會(huì)數(shù)據(jù)
社會(huì)數(shù)據(jù)主要指政府部門和社會(huì)單位系統(tǒng)記錄的數(shù)據(jù),如交通票務(wù)系統(tǒng)、運(yùn)營(yíng)商系統(tǒng)、酒店住宿系統(tǒng)、醫(yī)療衛(wèi)生系統(tǒng)、工商管理系統(tǒng)、民政司法系統(tǒng)、教育宗教系統(tǒng)、地理信息系統(tǒng)、物流系統(tǒng)等的數(shù)據(jù)。
(4)網(wǎng)絡(luò)數(shù)據(jù)
網(wǎng)絡(luò)數(shù)據(jù)主要包括:一是微博、微信、QQ、社區(qū)、電子郵件等社交網(wǎng)絡(luò)中的用戶生成數(shù)據(jù),二是搜索引擎、運(yùn)營(yíng)商、網(wǎng)購(gòu)、金融服務(wù)等網(wǎng)絡(luò)行為所產(chǎn)生的用戶行為、交易日志等數(shù)據(jù)。
(5)其他數(shù)據(jù)
其他數(shù)據(jù)是指未歸入上述類型,但是可能會(huì)對(duì)公共安全有一定影響的數(shù)據(jù)。
1.2 天空地一體化大數(shù)據(jù)的特性
天空地一體化大數(shù)據(jù)在滿足大數(shù)據(jù)4V特性的基礎(chǔ)上[2],由于其數(shù)據(jù)來(lái)源跨層級(jí)、跨地域、跨系統(tǒng)、跨部門、跨業(yè)務(wù),又表現(xiàn)出了新的特性:
(1)多元化
天空地一體化大數(shù)據(jù)由于需要匯聚衛(wèi)星遙感影像數(shù)據(jù)、跨時(shí)空視頻數(shù)據(jù)、電磁信息、網(wǎng)絡(luò)數(shù)據(jù)、社會(huì)數(shù)據(jù)及公安部門數(shù)據(jù)等,多元化不僅僅體現(xiàn)在數(shù)據(jù)類型的多樣性,還體現(xiàn)在數(shù)據(jù)之間的多尺度、多粒度,如遙感觀測(cè)的傳感器種類包括全色、多光譜、高光譜、紅外、合成孔徑雷達(dá)(SAR)、激光雷達(dá)(LiDAR)等,它們的觀測(cè)范圍各不一樣,產(chǎn)生的數(shù)據(jù)格式也不盡相同;同樣是軌跡數(shù)據(jù),如遙感影像拍攝的軌跡與視頻監(jiān)控、手機(jī)等拍攝的軌跡數(shù)據(jù)。
(2)演化性
天空地一體化大數(shù)據(jù),具有鮮明的時(shí)空屬性,即數(shù)據(jù)隨時(shí)間和空間的變化而變化,比如,實(shí)體的某些屬性在不同時(shí)間點(diǎn)或空間可能產(chǎn)生變化,這就要求合理建模演化行為,保證數(shù)據(jù)一致性。同時(shí),在反恐維穩(wěn)領(lǐng)域,對(duì)數(shù)據(jù)處理有較高的時(shí)效性要求。
(3)準(zhǔn)確性
天空地一體化大數(shù)據(jù)由于其數(shù)據(jù)源多、數(shù)據(jù)多樣的特點(diǎn),不同的數(shù)據(jù)源或者不同時(shí)刻產(chǎn)生的數(shù)據(jù),有可能會(huì)相互矛盾或沖突,因此在數(shù)據(jù)分析之前,應(yīng)該處理信息源之間的內(nèi)容沖突,消除信息的歧義。同時(shí),單一數(shù)據(jù)源的數(shù)據(jù)有時(shí)包含的信息不夠全面,獲取多個(gè)信息源的數(shù)據(jù)進(jìn)行融合關(guān)聯(lián),可以補(bǔ)全信息或者對(duì)信息進(jìn)行相互印證,從而提高數(shù)據(jù)的準(zhǔn)確性[3]。
天空地一體化大數(shù)據(jù)的這些新特性,為數(shù)據(jù)的接入、處理、存儲(chǔ)、融合關(guān)聯(lián)提出了更高的要求。
2 天空地一體化大數(shù)據(jù)在社會(huì)安全領(lǐng)域的應(yīng)用需求分析
天空地一體化大數(shù)據(jù)在社會(huì)安全領(lǐng)域的應(yīng)用,是一個(gè)相對(duì)較新的研究方向,隨著高分遙感技術(shù)、人臉車輛識(shí)別、語(yǔ)音識(shí)別、文本識(shí)別等各項(xiàng)技術(shù)的發(fā)展,在單場(chǎng)景中對(duì)異常行為的識(shí)別能力有了很大的提高,依托大數(shù)據(jù)分析技術(shù),將這些數(shù)據(jù)資源進(jìn)行跨層級(jí)、跨地域、跨系統(tǒng)、跨部門、跨業(yè)務(wù)的融合關(guān)聯(lián),并通過(guò)建立智能化分析模型,應(yīng)用在犯罪線索挖掘、犯罪活動(dòng)預(yù)測(cè)、犯罪分子及團(tuán)伙發(fā)現(xiàn)、犯罪分子追蹤等方面,從而解決公安部門的實(shí)際需求問(wèn)題。
2.1 線索挖掘
正所謂“存在就有痕跡,聯(lián)系就有信息”,當(dāng)今社會(huì)充斥著各類流動(dòng)的信息,人流、物流、資金流、信息流相互交錯(cuò)融合,給公共安全領(lǐng)域事件預(yù)測(cè)預(yù)警帶來(lái)很大的風(fēng)險(xiǎn)。在這種情況下,依靠人的管理和單一的監(jiān)控手段顯然不行,可以依靠大數(shù)據(jù)優(yōu)勢(shì)構(gòu)建一個(gè)聯(lián)合的信息環(huán)境,根據(jù)這些信息挖掘各種犯罪線索:如分析高分衛(wèi)星遙感影像數(shù)據(jù),可以快速有效地監(jiān)測(cè)空間動(dòng)態(tài)信息的變化,挖掘出恐怖分子的訓(xùn)練營(yíng)及活動(dòng)通道;偏遠(yuǎn)地區(qū)的無(wú)業(yè)游民,整天用國(guó)際化的聊天工具和外界溝通聯(lián)系,可能是恐怖分子的一些特征。
2.2犯罪活動(dòng)預(yù)測(cè)
犯罪分子的活動(dòng)具有隱蔽性,不太容易掌控,但仍然具有一定的規(guī)律可循。比如恐怖團(tuán)伙要策劃一場(chǎng)具有一定規(guī)模的恐怖事件,必須滿足人力、物力、資金的需求,恐怖分子之間要通過(guò)各種手段聯(lián)系,整個(gè)過(guò)程要進(jìn)行周密的策劃[4]。具體到“3.01”昆明火車站暴力恐怖事件,多名新疆分裂主義分子到達(dá)當(dāng)?shù)?,?duì)作案地進(jìn)行長(zhǎng)時(shí)間的偵察與策劃,就應(yīng)該為分析預(yù)測(cè)提供線索。因此,通過(guò)實(shí)時(shí)采集的天空地一體化大數(shù)據(jù),對(duì)數(shù)據(jù)實(shí)現(xiàn)多尺度、多粒度的關(guān)聯(lián),能夠動(dòng)態(tài)地掌握犯罪分子的活動(dòng)空間規(guī)律、群體行為法則,及時(shí)識(shí)別異常行為及異常人員,對(duì)預(yù)測(cè)犯罪事件、犯罪熱點(diǎn)地區(qū)和犯罪趨勢(shì)具有很大的潛在優(yōu)勢(shì)[5]。
2.3重點(diǎn)人員管控
通過(guò)大數(shù)據(jù)分析,開(kāi)展重點(diǎn)人員日常管控,嚴(yán)密監(jiān)控其所有網(wǎng)絡(luò)行為與日常社交行為對(duì)象,建立人群高維關(guān)系網(wǎng)絡(luò)知識(shí)圖譜,并將人、物、案(事)件、組織的重要屬性特征,與各類數(shù)據(jù)庫(kù)中的信息資源進(jìn)行一對(duì)一、一對(duì)多、多對(duì)一或多對(duì)多的關(guān)聯(lián)碰撞比對(duì),及時(shí)發(fā)現(xiàn)犯罪人員及團(tuán)伙。
2.4犯罪分子追蹤
案件發(fā)生后,犯罪分子發(fā)生逃匿,可通過(guò)將公安部門的追蹤信息,重要場(chǎng)所的監(jiān)控視頻,普通民眾利用微博、微信、QQ、社區(qū)等社交網(wǎng)絡(luò)發(fā)布的信息等進(jìn)行關(guān)聯(lián)分析,動(dòng)態(tài)地掌握犯罪分子的行蹤,實(shí)現(xiàn)對(duì)犯罪分子的追蹤。
3 面向社會(huì)安全的天空地一體化大數(shù)據(jù)平臺(tái)構(gòu)建
近年來(lái),我國(guó)各地公安機(jī)關(guān)也在不斷探索大數(shù)據(jù)的實(shí)戰(zhàn)應(yīng)用,公安機(jī)關(guān)本身掌握著海量數(shù)據(jù)資源,具有較好的數(shù)據(jù)資源基礎(chǔ)。通過(guò)搭建基于天空地一體化大數(shù)據(jù)平臺(tái),整合空天領(lǐng)域的衛(wèi)星和航拍影像、公安業(yè)務(wù)數(shù)據(jù)、社會(huì)單位數(shù)據(jù)及網(wǎng)絡(luò)數(shù)據(jù)等各類資源,將大數(shù)據(jù)存儲(chǔ)、計(jì)算技術(shù)融入到系統(tǒng)總體架構(gòu)設(shè)計(jì)中,改變社會(huì)公共安全領(lǐng)域 “事后查證”的模式,致力于事前預(yù)警和事中快速響應(yīng)能力的全面提升。
3.1總體架構(gòu)設(shè)計(jì)
為滿足海量多源異構(gòu)數(shù)據(jù)的處理、分析需求,系統(tǒng)的總體架構(gòu)應(yīng)建立在大數(shù)據(jù)、云計(jì)算架構(gòu)的基礎(chǔ)之上,確保數(shù)據(jù)存儲(chǔ)和計(jì)算的高效、穩(wěn)定及系統(tǒng)的可擴(kuò)展性。系統(tǒng)采用分層架構(gòu),自下而上分為基礎(chǔ)設(shè)施層(IAAS)、平臺(tái)支撐層(PAAS)和業(yè)務(wù)應(yīng)用層(SAAS)。其中,基礎(chǔ)設(shè)施層提供對(duì)計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)等各類資源管理和調(diào)度;平臺(tái)支撐層包括數(shù)據(jù)支撐和服務(wù)支撐,數(shù)據(jù)支撐實(shí)現(xiàn)對(duì)數(shù)據(jù)的匯聚、按需存儲(chǔ)和處理,服務(wù)支撐提供服務(wù)管理功能,為應(yīng)用提供分析服務(wù)和基礎(chǔ)服務(wù);業(yè)務(wù)應(yīng)用層面向一線實(shí)戰(zhàn)應(yīng)用需求,提供異常行為告警、重點(diǎn)人員管控、團(tuán)伙挖掘、事件預(yù)測(cè)等業(yè)務(wù)功能。
3.2關(guān)鍵技術(shù)研究
針對(duì)系統(tǒng)建設(shè)過(guò)程中的數(shù)據(jù)感知與處理、數(shù)據(jù)融合關(guān)聯(lián)、分析建模及應(yīng)用四個(gè)環(huán)節(jié),研究和探討各個(gè)環(huán)節(jié)涉及的關(guān)鍵技術(shù),為系統(tǒng)的實(shí)現(xiàn)提供技術(shù)保障。
(1)跨系統(tǒng)、跨網(wǎng)絡(luò)數(shù)據(jù)協(xié)同感知與處理
數(shù)據(jù)的智能感知與處理技術(shù),是大數(shù)據(jù)分析的基礎(chǔ),數(shù)據(jù)的質(zhì)量,直接影響分析結(jié)果。天空地一體化大數(shù)據(jù),由于存在數(shù)據(jù)來(lái)源廣、數(shù)據(jù)格式多樣、結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)并存等特點(diǎn),在數(shù)據(jù)的協(xié)同感知與處理方面,需要研究以下幾項(xiàng)關(guān)鍵技術(shù):一是多源異構(gòu)數(shù)據(jù)采集與交換接口技術(shù);二是數(shù)據(jù)清洗,消除數(shù)據(jù)中存在的大量噪聲、冗余數(shù)據(jù),提高數(shù)據(jù)的質(zhì)量;三是模式識(shí)別技術(shù),研究如何將遙感影像、跨時(shí)空視頻、音頻和網(wǎng)絡(luò)文本等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成能為計(jì)算機(jī)自動(dòng)識(shí)別的結(jié)構(gòu)化數(shù)據(jù)。
(2)多源異構(gòu)數(shù)據(jù)融合關(guān)聯(lián)
數(shù)據(jù)融合基于時(shí)序?qū)?shù)據(jù)進(jìn)行提取、轉(zhuǎn)換、綜合等操作的核心技術(shù),完成多源異構(gòu)數(shù)據(jù)之間的整理與歸并。海量多源異構(gòu)數(shù)據(jù)的融合是目前大數(shù)據(jù)應(yīng)用和智能決策過(guò)程的瓶頸。多元化信息的融合是當(dāng)前數(shù)據(jù)融合的一個(gè)發(fā)展趨勢(shì),在天空地一體化大數(shù)據(jù)融合中主要表現(xiàn)為空天遙感數(shù)據(jù)之間的融合、空天地一體化的融合、歷史數(shù)據(jù)與實(shí)時(shí)數(shù)據(jù)的融合、動(dòng)態(tài)數(shù)據(jù)與靜止數(shù)據(jù)的融合、實(shí)體空間與網(wǎng)絡(luò)虛擬空間的融合、內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)的融合等。大數(shù)據(jù)融合的難點(diǎn)在于大數(shù)據(jù)的3V(海量、高速、類型多樣)特征,它所需要的關(guān)鍵支撐技術(shù)有模式(本體)對(duì)齊技術(shù)、實(shí)體鏈接技術(shù)、沖突解決技術(shù)和關(guān)系推演[6]。通過(guò)融合關(guān)聯(lián),實(shí)現(xiàn)多元數(shù)據(jù)協(xié)同處理,從而為公共安全的監(jiān)控預(yù)警和應(yīng)急處理提供技術(shù)支撐。
(3)分析建模
利用大數(shù)據(jù)分析的方法與工具,比如分類與回歸算法、基于時(shí)空序列的模式分析、關(guān)聯(lián)分析等技術(shù),根據(jù)實(shí)際的應(yīng)用需求,構(gòu)建各種分析模型,如人流激增預(yù)警模型、犯罪預(yù)測(cè)模型、人員智能畫像、涉恐系數(shù)分析模型、人員親密度模型、異常人員分析模型等,通過(guò)各種模型的綜合應(yīng)用,實(shí)現(xiàn)異常行為告警、分析研判、事件預(yù)測(cè)等功能,筑成社會(huì)安全領(lǐng)域預(yù)測(cè)和早期階段預(yù)防的第一道防線。
(4)可視化應(yīng)用
大數(shù)據(jù)分析中,可視化展現(xiàn)技術(shù)是使海量數(shù)據(jù)集變得直觀、易于理解的有效方式。典型的可視化包括多維信息可視化、專業(yè)領(lǐng)域知識(shí)可視化和預(yù)測(cè)分析結(jié)果的可視化[3] 。針對(duì)天空地一體化多源大數(shù)據(jù)可視化交互應(yīng)用場(chǎng)景的廣泛性、無(wú)規(guī)律、缺乏靈活的可視化手段的問(wèn)題,研究可視化分析工具集,提供二維或三維概念圖、關(guān)系圖、趨勢(shì)圖、對(duì)象統(tǒng)計(jì)圖、時(shí)間軸分析工具、數(shù)據(jù)流分析工具、語(yǔ)義網(wǎng)絡(luò)等全方位互聯(lián)互通可擴(kuò)展的可視化分析工具,滿足對(duì)知識(shí)圖譜、趨勢(shì)展示和分析預(yù)警等場(chǎng)景的應(yīng)用需求。
4 總結(jié)
天空地一體化大數(shù)據(jù)在社會(huì)公共安全領(lǐng)域的應(yīng)用,充分利用大數(shù)據(jù)的預(yù)測(cè)能力,構(gòu)建一種主動(dòng)的、預(yù)防為主的公共安全警務(wù)模式[8],為提升公共安全保障能力提供了歷史契機(jī)。隨著海量數(shù)據(jù)的積累以及大數(shù)據(jù)技術(shù)的不斷成熟,大數(shù)據(jù)分析、預(yù)測(cè)的準(zhǔn)確度也會(huì)不斷提高,必將進(jìn)一步提升情報(bào)挖掘、事件預(yù)測(cè)預(yù)警能力,更好地服務(wù)于社會(huì)安全的實(shí)際應(yīng)用需求。
參考文獻(xiàn):
[1] 劉向榮,農(nóng)忠海,陳雅.公安大數(shù)據(jù)應(yīng)用研究的幾點(diǎn)思考[J].數(shù)字通信世界,2016(11):38-41.
[2] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
[3] 黃河燕,曹朝,馮沖.大數(shù)據(jù)情報(bào)分析發(fā)展機(jī)遇及其挑戰(zhàn)[J].智能系統(tǒng)學(xué)報(bào),2016,11(6):719-727.
[4] 李本先,張薇,梅建明,等.大數(shù)據(jù)在反恐情報(bào)工作中的應(yīng)用研究[J].情報(bào)雜志,2014(12):1-5.
[5] 馮冠籌.大數(shù)據(jù)時(shí)代實(shí)施預(yù)測(cè)警務(wù)探究[J].廣東公安科技,2014,22(1):23-27.
[6] 孟小峰,杜治娟.大數(shù)據(jù)融合研究:?jiǎn)栴}與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2016,53(2):231-246.
[7] 王海燕,胡婷,劉際鵬,等.基于數(shù)據(jù)中心的公安大數(shù)據(jù)應(yīng)用研究[J].智能計(jì)算機(jī)與應(yīng)用,2017,7(5):60-65.
[8] 彭知輝.大數(shù)據(jù):讓情報(bào)主導(dǎo)警務(wù)成為現(xiàn)實(shí)[J].情報(bào)雜志,2015(5):1-6.