謝振東 文帆 周子雅 歐輝
摘 要 恐怖襲擊威脅人類社會(huì)安全.選取全球恐怖主義數(shù)據(jù)庫(Global Terrorism Database,GTD)中2015-2017年世界上發(fā)生的恐怖襲擊事件的記錄,根據(jù)相關(guān)性對(duì)2015-2016年未知作案組織或個(gè)人對(duì)應(yīng)的事件數(shù)據(jù)進(jìn)行整合簡(jiǎn)化,使用二階聚類得到最大分類數(shù),根據(jù)危害性從大到小選出前5個(gè)犯罪嫌疑人,利用判別分析對(duì)2017年未知作案組織或個(gè)人對(duì)應(yīng)的事件進(jìn)行概率預(yù)測(cè),得出嫌疑人的嫌疑程度.選取影響恐怖襲擊的重要指標(biāo),應(yīng)用因子分析研究2015-2017年恐怖襲擊事件發(fā)生規(guī)律,得到恐怖事件地域發(fā)展趨勢(shì).
關(guān)鍵詞社會(huì)統(tǒng)計(jì)學(xué);趨勢(shì)預(yù)測(cè);多元分析;恐怖襲擊
中圖分類號(hào) C812文獻(xiàn)標(biāo)識(shí)碼 A
Abstract Terrorist attacks threaten the security of human society and cause social unrest to a certain extent. Selection of Global Terrorism Database (Global Terrorism Database, GTD) in 2015~2017 terrorist attacks in the world record of events, from 2015 to 2016 unknown crime organization or individual corresponding event data integration based on association simplified second order clustering are used to get the maximum number of classification, and according to the harm from big to small chosen five suspects, using discriminate analysis for 2017 unknown crime organization or individual corresponding event probability prediction, it is concluded that the suspect's degree of suspicion; After that, important indicators affecting terrorist attacks were selected to apply factor analysis to study the occurrence law of terrorist attacks in 2015~2017, and the regional development trend of terrorist incidents was obtained.
Key words Social statistics; Trend prediction; Multivariate analysis; Terrorist attacks
1 引 言
恐怖主義是人類的共同威脅,對(duì)恐怖襲擊事件相關(guān)數(shù)據(jù)的深入分析有助于加深人們對(duì)恐怖主義的認(rèn)識(shí),為反恐防恐提供有價(jià)值的信息支持.Sofia(2016)[1]探索了40多年來全球恐怖主義在地理和時(shí)間上的集中性與持續(xù)性,說明恐怖襲擊事件非隨機(jī),具有可研究性.Thomas(2016)[2]提出了對(duì)歐洲圣戰(zhàn)主義十年的預(yù)測(cè),未來10年,圣戰(zhàn)分子在歐洲發(fā)動(dòng)襲擊的頻率可能會(huì)呈現(xiàn)波動(dòng)曲線,峰值將逐漸升高.李益斌(2018)[3]利用聚類分析法,以GTD中恐怖襲擊的頻率和烈度為依據(jù),對(duì)2001-2010年和2011-2016年兩階段的歐洲恐怖襲擊按國家進(jìn)行分類,根據(jù)實(shí)驗(yàn)結(jié)果中的異同來分析當(dāng)前歐洲恐怖襲擊的新態(tài)勢(shì).楊振柳等(2019) [4]對(duì)GTD進(jìn)行數(shù)據(jù)挖掘,利用主成分分析方法建立了Kmeans算法的聚類模型.通過該聚類模型,將相似特征的事件進(jìn)行歸納處理,為偵破恐怖襲擊事件提供信息支撐.華雅倫和王奇(2018) [5]通過使用GTD數(shù)據(jù)對(duì)2001-2015年間歐洲恐怖主義活動(dòng)進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)呈現(xiàn)出以熱點(diǎn)地區(qū)為中心的擴(kuò)散輻射圈,恐怖分子襲擊日趨專業(yè)化和技術(shù)化的特點(diǎn),總結(jié)了歐洲國家的反恐經(jīng)驗(yàn).彭如香等(2019) [6]以2001-2016年的GTD數(shù)據(jù),對(duì)全球恐怖主義活動(dòng)進(jìn)行定量分析與可視化分析,得出近些年全球恐怖主義活動(dòng)的發(fā)展態(tài)勢(shì).結(jié)合近幾年全球恐怖事件的特點(diǎn),總結(jié)出全球恐怖主義活動(dòng)的特征和發(fā)展趨勢(shì)是有價(jià)值的.
數(shù)據(jù)均來自于GTD或公開發(fā)表及出版的文獻(xiàn),其中的缺失部分采用期望值最大化方法即EM算法估計(jì)所得.采用二階聚類的方法,可對(duì)含有類別變量和連續(xù)變量的大型數(shù)據(jù)集進(jìn)行分析,并自動(dòng)確定最終的分類個(gè)數(shù).采用的貝葉斯判別法不僅能夠考慮到各個(gè)總體出現(xiàn)的先驗(yàn)概率,又能考慮到錯(cuò)判造成的損失,且其判別效果相比于其他幾種判別方法更加理想.
2 分析方法
2.1 統(tǒng)計(jì)分析步驟
1.對(duì)2015-2016年發(fā)生的、尚未有組織或個(gè)人宣稱負(fù)責(zé)的恐怖襲擊事件進(jìn)行分析,找出主導(dǎo)某恐怖襲擊事件最有可能的嫌疑人.第一步將相關(guān)聯(lián)的事件根據(jù)相關(guān)性進(jìn)行整合.第二步利用二階聚類模型對(duì)2015-2016年處理過的數(shù)據(jù)進(jìn)行二階聚類分析,將數(shù)據(jù)進(jìn)行分類并按照危害性從大到小選出前五個(gè)犯罪嫌疑人.第三步依據(jù)判別分析法中的貝葉斯方法對(duì)數(shù)據(jù)進(jìn)行建模與分析,得出嫌疑人的嫌疑程度.
2.研究近三年來恐怖襲擊事件發(fā)生規(guī)律.選取恐怖襲擊發(fā)生在城市中心的次數(shù)、疑似恐怖襲擊的次數(shù)、恐怖襲擊成功的次數(shù)、恐怖襲擊造成的死亡總?cè)藬?shù)、亡人事件百分比、平均每起事件死亡人數(shù)、恐怖襲擊造成的受傷總?cè)藬?shù)、人質(zhì)遭受綁架的次數(shù)等8個(gè)指標(biāo)以區(qū)域?yàn)榉诸愖兞窟M(jìn)行分析,研究下一年全球或某些重點(diǎn)地區(qū)的恐怖襲擊態(tài)勢(shì).
恐怖主義指數(shù)受許多因素的影響.依據(jù)世界經(jīng)濟(jì)與和平研究所發(fā)布的156個(gè)國家的恐怖主義風(fēng)險(xiǎn)指數(shù)報(bào)告,選取了其中的總起數(shù)、總亡數(shù)、總受傷人數(shù)和財(cái)產(chǎn)損失等四個(gè)指標(biāo),通過計(jì)算四個(gè)指標(biāo)分值再合并得到綜合分值.考慮到目前財(cái)產(chǎn)損失的價(jià)格數(shù)值估計(jì)并不十分準(zhǔn)確且獲取較為困難,而中心城市是一個(gè)國家的經(jīng)濟(jì)政治中心,尤為重要,所以加入“恐怖襲擊發(fā)生在城市中心的次數(shù)”這個(gè)指標(biāo).人質(zhì)的綁架會(huì)給人們帶來巨大的心理壓力,造成社會(huì)一定程度的動(dòng)蕩不安.對(duì)于國家面對(duì)恐怖襲擊的風(fēng)險(xiǎn)既要考慮直接恐怖襲擊風(fēng)險(xiǎn),還要考慮國家面對(duì)恐怖襲擊的脆弱性,脆弱性低意味著同類別的恐怖襲擊可能會(huì)造成更大的人員傷亡和財(cái)產(chǎn)損失,所以加入“亡人事件百分比、平均每起事件死亡人數(shù)這兩個(gè)指標(biāo)”.
2.2 統(tǒng)計(jì)模型
1.二階聚類模型
第一步為準(zhǔn)聚類過程(Precluster Step),采用專門應(yīng)用于巨型數(shù)據(jù)的BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)聚類算法.建構(gòu)一個(gè)多水平結(jié)構(gòu)的聚類特征樹(Cluster Feature Tree,CFtree),其特點(diǎn)在于它是一種高度平衡的樹(heightbalanced tree).—般用CFVectors建立CFtree.
3 依據(jù)事件特征發(fā)現(xiàn)恐怖襲擊事件制造者
對(duì)2015-2016年發(fā)生的、尚未有組織或個(gè)人宣稱負(fù)責(zé)的恐怖襲擊事件,運(yùn)用二階聚類的方法將可能是同一個(gè)恐怖組織或個(gè)人在不同時(shí)間、不同地點(diǎn)多次作案的若干案件歸為一類,并選出前五個(gè)犯罪嫌疑人,依據(jù)貝葉斯判別分析的方法對(duì)2017年所發(fā)生事件的犯罪嫌疑人可能性大小進(jìn)行歸類,判別2017年中主導(dǎo)某恐怖襲擊事件最有可能的嫌疑人.
由于數(shù)據(jù)的復(fù)雜性以及海量性,先將相關(guān)聯(lián)的事件進(jìn)行整合,整合規(guī)則由下列指標(biāo)決定:eventid、extended、region、vicinity、doubtterr、success、suicide、attacktype1、targ type1、weaptype1、nkill、nwound、property、ishostkid、INT_ANY.接著利用二階聚類模型對(duì)2015-2016年處理過的數(shù)據(jù)進(jìn)行二階聚類分析,結(jié)果如圖1所示,考慮到恐怖組織與個(gè)人的種類復(fù)雜性與多樣性,在滿足分類數(shù)據(jù)差異性的前提下,將2015-2016年處理過的數(shù)據(jù)分為250類.
基于貝葉斯判別分析模型來進(jìn)行判斷組織或個(gè)人嫌疑程度的大小,根據(jù)14個(gè)指標(biāo)變量提取4個(gè)特征變量,以某組織或個(gè)人對(duì)做了該恐怖襲擊事件的概率大小作為衡量標(biāo)準(zhǔn),列出分類函數(shù)系數(shù)如表1所示.
圖2可清晰看出危險(xiǎn)度排序的前五位以及其組質(zhì)心,可以通過概率大小判別2017年各個(gè)事件是這五個(gè)危險(xiǎn)度最高的個(gè)人或組織所為的可能性大小.
例如:選取201701090031、201702210037.
表2即事件201701090031為一號(hào)嫌疑人所為的概率是0.79001,四號(hào)嫌疑人所為的概率是0.20999.201702210037為一號(hào)嫌疑人所為的概率是0.00002,二號(hào)嫌疑人所為的概率是0.99997,四號(hào)嫌疑人所為的概率是0.00001.
4 對(duì)未來恐怖襲擊態(tài)勢(shì)的分析
對(duì)近三年即2015-2017年的恐怖襲擊事件分別分析并進(jìn)行橫向和縱向的對(duì)比找出規(guī)律,研究下一年全球或某些重點(diǎn)地區(qū)的恐怖襲擊態(tài)勢(shì).
經(jīng)過KMO和巴特利檢驗(yàn)(表3)顯示KMO取樣適切性量數(shù)為0.632大于0.5,所以該數(shù)據(jù)適合做因子分析.根據(jù)表4采用主成分分析集中了8個(gè)原始變量信息的96.176%.
以各因子的方差貢獻(xiàn)率占兩個(gè)因子總方差貢獻(xiàn)率的比重作為權(quán)重進(jìn)行加權(quán)且匯總,基于因子分析模型得出各城市的綜合得分,其表達(dá)式為:
F=(67.615×F1+28.561×F2)÷96.176(10)
由表4可知,公共因子1在“襲擊城市中心的次數(shù)”、“疑似恐怖襲擊的次數(shù)”、“襲擊成功的次數(shù)”、“死亡總?cè)藬?shù)”、“受傷總?cè)藬?shù)”、“人質(zhì)遭受綁架的次數(shù)”上的載荷值都很大,主要反映整體遭受恐怖襲擊的風(fēng)險(xiǎn),命名為基本風(fēng)險(xiǎn)因子.而公共因子2在“亡人事件百分比”、“平均每起事件死亡人數(shù)”的載荷值較高,主要反映應(yīng)對(duì)恐怖襲擊的能力,命名為脆弱性因子.
得出2015-2017年的F1(基本風(fēng)險(xiǎn)因子)、F2(脆弱性因子)兩個(gè)主要因子,對(duì)比如表5和表6所示.
基本風(fēng)險(xiǎn)因子得分反映該地區(qū)遭受恐怖襲擊的風(fēng)險(xiǎn)程度.經(jīng)過縱向?qū)Ρ瓤芍?,區(qū)域10(中東和北非)近三年的基本風(fēng)險(xiǎn)因子得分均最高,是最需要加強(qiáng)防范恐怖襲擊事件的地區(qū).區(qū)域4(東亞)風(fēng)險(xiǎn)性最低,安全性最高.橫向比較可知,區(qū)域10(中東和北非)盡管三年期間的風(fēng)險(xiǎn)性有所下降,但依然位于12個(gè)地區(qū)的首位,所以仍是反恐的重點(diǎn)地區(qū).區(qū)域6(南亞)風(fēng)險(xiǎn)性還在提高,所以該地區(qū)下一年為反恐的重點(diǎn)地區(qū).
脆弱性因子得分反映該地區(qū)應(yīng)對(duì)恐怖襲擊事件的能力.經(jīng)過縱向?qū)Ρ瓤芍?,區(qū)域11(撒哈拉以南的非洲)近三年的脆弱性因子得分均最高,是最需要提高其應(yīng)對(duì)能力的地區(qū).相對(duì)來說區(qū)域12(澳大利亞和大洋洲)的應(yīng)對(duì)能力最強(qiáng).橫向比較可知區(qū)域11(撒哈拉以南的非洲)三年間應(yīng)對(duì)處理恐怖襲擊的能力還在下降,值得一提的是,區(qū)域4(東亞)的應(yīng)對(duì)能力在不斷提高.
結(jié)合基本風(fēng)險(xiǎn)因子和脆弱性因子得到綜合得分,由圖3可知區(qū)域10(中東和北非)及區(qū)域6(南亞)恐怖襲擊事態(tài)較為嚴(yán)重,不僅遭受恐怖襲擊的風(fēng)險(xiǎn)性高,而且其應(yīng)對(duì)處理恐怖襲擊的能力也較低.另外區(qū)域5(東南亞)的綜合得分不斷提高,可知恐怖襲擊事件有向東南亞區(qū)域轉(zhuǎn)移的趨勢(shì).
5 結(jié) 論
通過靈活應(yīng)用二階聚類、判別分析、因子分析來對(duì)恐怖襲擊事件記錄數(shù)據(jù)進(jìn)行量化分析.考慮到事件的相關(guān)性,對(duì)2015-2016年的未知作案組織或個(gè)人對(duì)應(yīng)的事件數(shù)據(jù)進(jìn)行整合簡(jiǎn)化.應(yīng)用二階聚類,充分利用數(shù)據(jù)差異性,選取最大分類數(shù)為250類.因?yàn)榭植澜M織與個(gè)人的種類繁多且具有多樣性,在這250類中每類所包含的事件數(shù)的多少來從大到小選出其中的前5個(gè).對(duì)于恐怖事件的嫌疑程度,基于貝葉斯判別分析模型來進(jìn)行判斷組織或個(gè)人嫌疑程度的大小,根據(jù)14個(gè)指標(biāo)變量提取4個(gè)主要特征,計(jì)算出某組織或個(gè)人實(shí)施該恐怖襲擊事件的概率,根據(jù)其大小作為衡量標(biāo)準(zhǔn).
根據(jù)主要原因、時(shí)空特性、蔓延特性、級(jí)別分布等規(guī)律,進(jìn)而分析總結(jié)近三年來恐怖襲擊事件發(fā)生規(guī)律和并預(yù)測(cè)下一年全球某些重點(diǎn)地區(qū)的恐怖襲擊態(tài)勢(shì).選取了8個(gè)指標(biāo)以區(qū)域?yàn)榉诸愖兞窟M(jìn)行因子分析,最后得到2015-2017年關(guān)于12個(gè)地區(qū)在兩個(gè)公共因子上的得分和總得分,經(jīng)過橫向和縱向的對(duì)比,可知區(qū)域10(中東和北非)恐怖襲擊事態(tài)較為嚴(yán)重,不僅體現(xiàn)在遭受恐怖襲擊的風(fēng)險(xiǎn)性高,而且其應(yīng)對(duì)處理恐怖襲擊的能力也較低,為下一年反恐的重點(diǎn)地區(qū).同時(shí)區(qū)域10(中東和北非)與區(qū)域11(撒哈拉以南的非洲)也是需要加強(qiáng)反恐的地區(qū).另外根據(jù)區(qū)域5(東南亞)的綜合得分不斷提高,可知恐怖襲擊事件有向東南亞區(qū)域轉(zhuǎn)移的趨勢(shì),總體來說,近三年的恐怖事件發(fā)生的區(qū)域及其風(fēng)險(xiǎn)性較為穩(wěn)定.
參考文獻(xiàn)
[1]
SOFIA P K. The nonrandom nature of terrorism: An exploration of where and how global trends of terrorism have developed over 40 years[J].Studies in Conflict Terrorism,2016,39(12):1031-1049.
[2] THOMAS H. The future of jihadism in Europe: A pessimistic view [J] .Perspectives on Terrorism,2016,10(6):156-170.
[3] 李益斌.歐洲恐怖主義的新態(tài)勢(shì)及原因分析——基于聚類分析法[J].情報(bào)雜志,2018,37(3):55-63.
[4] 楊振柳,李穎,鐘子森.基于數(shù)據(jù)挖掘的恐怖襲擊嫌疑對(duì)象判斷研究[J].情報(bào)探索,2019(4):35-40.
[5] 華雅倫,王奇.基于GTD數(shù)據(jù)庫的歐洲反恐形勢(shì)分析及對(duì)我國的啟示[J].犯罪研究,2018(5):91-105.
[6] 彭如香,張奧博,楊濤,孔華鋒.基于GTD的全球恐怖主義活動(dòng)現(xiàn)狀與發(fā)展趨勢(shì)研究[J].計(jì)算機(jī)應(yīng)用與軟件,2019,36(1):1-5+21.