朱 琳, 黃一洲
(中國人民武裝警察部隊學(xué)院, 河北廊坊 065000)
Lorenz曲線在毒品情報分析中的應(yīng)用研究
朱 琳, 黃一洲
(中國人民武裝警察部隊學(xué)院, 河北廊坊 065000)
Lorenz曲線可以用來對毒品犯罪案件的時間、空間、模式分布狀況進(jìn)行分析,通過分布分析可以發(fā)現(xiàn)毒品犯罪案件的分布規(guī)律并預(yù)測未來發(fā)展趨勢,為禁毒部門提供決策支持?;贚orenz曲線構(gòu)建分析模型,并通過模擬數(shù)據(jù)進(jìn)行計算說明。該方法簡單實用,在毒品情報分析領(lǐng)域中具有廣闊的應(yīng)用前景。
Lorenz曲線; 毒品情報; 分布分析; 聚集性分布; 毒品犯罪
Lorenz曲線可以用來對分布狀況進(jìn)行分析,這種方法廣泛應(yīng)用于公安情報分析領(lǐng)域,是一種定量研究方法[1]。本文將Lorenz曲線引入毒品情報分析中來,用該曲線對毒品犯罪案件各要素的分布狀況進(jìn)行分析,不僅可以有效分析毒品犯罪的活動規(guī)律與作案手段,還能預(yù)測未來發(fā)展趨勢,為開展有針對性的預(yù)防與偵查措施、制定禁毒策略等提供借鑒和參考。在大數(shù)據(jù)時代以及情報主導(dǎo)警務(wù)的戰(zhàn)略背景下,Lorenz曲線在毒品情報分析中具有廣闊的應(yīng)用前景。
Lorenz曲線(Lorenz curve)是美國統(tǒng)計學(xué)家洛倫茲提出的用來描述社會收入分配狀況的一種曲線,它由所觀察的人口數(shù)占總?cè)丝谥械陌俜直扰c這部分人口所獲得的收入占總收入中的百分比狀況來表示。通過Lorenz曲線,可以直觀地看到一個國家收入分配均衡狀況[2]。基尼系數(shù)就是根據(jù)Lorenz曲線進(jìn)行數(shù)學(xué)計算而得出的。除了收入分配研究領(lǐng)域外,其在人力、衛(wèi)生、能源資源配置,以及經(jīng)濟(jì)領(lǐng)域的風(fēng)險投資、信貸、就業(yè)、產(chǎn)業(yè)結(jié)構(gòu)等方面的配置與優(yōu)化中均有廣泛應(yīng)用。值得一提的是,Lorenz曲線已被應(yīng)用于對全球恐怖襲擊的時空分布進(jìn)行聚集性分析[3]。
信息、知識和情報是以離散形式分布的,并在離散分布基礎(chǔ)上趨向于集中[4]。離散分布現(xiàn)象不僅僅存在于文獻(xiàn)情報領(lǐng)域,在毒品情報中也普遍存在。在實際工作中往往發(fā)現(xiàn),毒品犯罪案件通常集中于特定的時間、人群、地點(diǎn),采用特定的手段,也就是說,一定時期內(nèi)某一類少數(shù)人群實施的某一類型毒品犯罪案件占到全部同類型案件的較大比重。毒品犯罪的不均衡性,要求警方必須有針對性地合理配置、調(diào)度警力資源,做到有效預(yù)防和控制犯罪。而這一切的基礎(chǔ),就在于對這種不均衡分布規(guī)律的分析、發(fā)現(xiàn)和把握。Lorenz曲線能對分布狀況進(jìn)行分析,判斷是否呈聚集性分布,并能在聚集性分布的情況下得出有價值的信息,以滿足毒品情報分析的需要。
綜上所述,從Lorenz曲線的定義與特點(diǎn)出發(fā),可以清楚地看到,應(yīng)用Lorenz曲線進(jìn)行分布分析的方法在毒品情報分析中是可行的,分析結(jié)果對打擊毒品犯罪具有一定參考價值。
毒品情報的Lorenz曲線分析模型可以用來對毒品犯罪案件的分布狀況進(jìn)行分析。在毒品犯罪案件分布狀況的分析中,每一種分布模式都由事件與因素兩個要素組成,是事件在因素中的數(shù)量分布。例如,在事件“在20%的小區(qū)中實施了80%以上的毒品犯罪案件”中,“小區(qū)”(小區(qū)以個為單位,每個小區(qū)都是可比、對等的),就是毒品犯罪案件分布的因素。構(gòu)建Lorenz曲線分析模型,首先應(yīng)把所分析事件的各個不同因素對應(yīng)的頻率按從低到高順序進(jìn)行排序,再計算各因素對應(yīng)事件的累計百分比,然后以累計百分比作為y軸,每個因素占所有因素個數(shù)累計百分比作為x軸作圖,即得到Lorenz曲線,如圖1所示。
圖1 Lorenz曲線分析模型
如果毒品犯罪案件在不同因素上呈現(xiàn)均勻分布,則Lorenz曲線在圖1中表現(xiàn)為與對角線y=x重合,說明毒品犯罪案件在該分析對象上不存在聚集性與熱點(diǎn)。如果毒品犯罪案件存在特殊的熱點(diǎn),則Lorenz曲線的表現(xiàn)特征為:毒品犯罪案件的對應(yīng)事件累計百分比在初始階段非常緩慢地增長,然后到最后幾個因素時快速增長并很快達(dá)到坐標(biāo)點(diǎn)(1,1)。如圖1所示,如果把Lorenz曲線和對角線y=x之間的面積設(shè)定為A,Lorenz曲線與x軸間的面積設(shè)定為B,則A/(A+B)這一比值即可以用來判斷該曲線是否呈聚集性分布,在收入分配領(lǐng)域,A/(A+B)這一比值即為基尼系數(shù),本文中稱其為毒品犯罪案件的聚集性系數(shù)G。而從數(shù)學(xué)角度來看,計算聚集性系數(shù)G往往采用積分公式進(jìn)行計算(式中L為Lorenz曲線的函數(shù)表達(dá)式):
一般而言,聚集性系數(shù)G越大說明分布狀況越不均衡,即聚集性越明顯,綜合Lorenz曲線已有的應(yīng)用經(jīng)驗來看,如果聚集性系數(shù)G大于0.4,可以認(rèn)為該Lorenz曲線呈現(xiàn)聚集性分布,如果大于0.5,則屬于分布狀況極端不均衡,即毒品犯罪案件在特定因素中存在嚴(yán)重的分布不均現(xiàn)象,即具有極強(qiáng)的聚集性,這一結(jié)果也表明毒品犯罪案件在特定因素中可能存在熱點(diǎn)。
在可能存在熱點(diǎn)的情況下,為確定不同因素對應(yīng)的毒品犯罪案件熱點(diǎn),引入ABC分類管理法。該方法可辨識多個樣本中的主要事物和次要事物,即把累計頻率曲線分為3個區(qū)間(如圖1所示):20%~100%所對應(yīng)的部分為Ⅰ類區(qū)間,對應(yīng)的研究對象稱之為主要事物;10%~20%為Ⅱ類區(qū)間,對應(yīng)的研究對象稱之為次要事物;而0~10%為Ⅲ類區(qū)間,對應(yīng)的對象稱為更次要事物[6]。在本文的研究中,Ⅰ類區(qū)間對應(yīng)的研究對象即為毒品犯罪案件的熱點(diǎn)因素。
Lorenz曲線廣泛應(yīng)用于毒品情報分析中,如上文所述,只要將分析對象劃分為若干類,每一類可通過某種計量標(biāo)準(zhǔn)統(tǒng)計得出一個具體的數(shù)量,那么都可以對分布狀況進(jìn)行分析并得出具體熱點(diǎn)。毒品犯罪情報分析主要包括以下幾方面。
3.1 時間分布分析
如果毒品犯罪案件在作案時間上呈現(xiàn)聚集性分布,那么就可以得出高危時段在什么時候。也就是說,從全年來看,可以知道是哪幾個月毒品犯罪案件數(shù)量高發(fā),從某個月來看,可以知道是上旬、中旬還是下旬毒品犯罪案件數(shù)量高發(fā),從一天的時間段來看,如果以1小時或2小時這樣的時間段為單位劃分成若干個時間段,就可以知道是哪幾個時間段毒品犯罪案件高發(fā)。只要掌握的毒品情報信息足夠多,達(dá)到海量的程度,則分析結(jié)果就越精確,這就可以為公安機(jī)關(guān)制定有針對性的防控、打擊戰(zhàn)略提供參考,在防范、打擊活動的時間規(guī)劃上更加科學(xué),從而更加合理地調(diào)度警力資源,達(dá)到理想的效果。
表1所示為某地區(qū)過去一年里所統(tǒng)計的每月毒品犯罪案件數(shù)量情況(文中的數(shù)據(jù)均為虛擬數(shù)據(jù),用于舉例說明),根據(jù)上文所構(gòu)建分析模型,如表2所示,首先將每月案件數(shù)量進(jìn)行升序排列,并將由低到高排列的月份從1~12進(jìn)行編號,將每個月份對應(yīng)的編號除以總的編號12,由此可得出編號累計占比,所得各結(jié)果依次為Lorenz曲線圖的x軸上的坐標(biāo)點(diǎn)。將每月案件數(shù)量除以一年總的案件數(shù)量,就可得出每月案件數(shù)量占全年案件數(shù)量的所占比例,再將這一占比根據(jù)升序排列的月份次序依次進(jìn)行累加,得到數(shù)量累計占比,所得各結(jié)果依次即為Lorenz曲線圖的y軸上的坐標(biāo)點(diǎn)。根據(jù)編號累計占比(x軸)及數(shù)量累計占比(y軸)作出對應(yīng)Lorenz曲線圖,如圖2所示。
表1 每月毒品犯罪案件數(shù)量
表2 Lorenz曲線分析模型構(gòu)建
圖2 毒品犯罪案件每月數(shù)量Lorenz圖
據(jù)此可算出聚集性系數(shù)G為0.506,超出0.5這一極端值,因此可認(rèn)為該地區(qū)毒品犯罪案件數(shù)量在全年的分布狀況呈現(xiàn)強(qiáng)聚集性,其中10、11、6、5、4、12月份位于Ⅰ區(qū)間,即熱點(diǎn),也就是高危時段所在,其中12、4月份案件數(shù)量聚集性更加明顯,由于Ⅰ區(qū)間這6個月份集中在一年中的第二季度、第四季度,以這一結(jié)果作為參考,公安機(jī)關(guān)可以在這兩個季度加大防控與打擊力度,或者可以開展專項行動等。而在這兩個季度中,可分別以4月和12月作為重點(diǎn)月份開展工作。分別統(tǒng)計這兩個月毒品犯罪案件數(shù)量分布情況,還可以得出應(yīng)該在上旬、中旬還是下旬開展專項行動。
3.2 空間分布分析
此處的空間指的是地理位置。從每一起毒品犯罪案件中,公安機(jī)關(guān)收集到關(guān)于地理位置的信息,經(jīng)過整理可以得出有價值的毒品情報,用來進(jìn)行毒品犯罪案件空間分布分析。例如,公安機(jī)關(guān)可以將轄區(qū)劃為若干地段,統(tǒng)計某個時間段內(nèi)每個地段的毒品犯罪案件數(shù)量,然后進(jìn)行空間分布分析,如果呈現(xiàn)空間上的聚集性分布,就可以發(fā)現(xiàn)哪里是高危區(qū)域,從而有針對性地部署防控與打擊行動。表3所示為過去某段時間內(nèi)將某地劃分為若干轄區(qū)后統(tǒng)計的查獲毒品犯罪案件數(shù)量,以此得出Lorenz曲線分析結(jié)果,如圖3所示。圖中Lorenz曲線的聚集性系數(shù)為0.722,屬于強(qiáng)聚集性分布,結(jié)果顯示圖3中①~④號(分別對應(yīng)表3中15、9、5、14號轄區(qū))是查獲的毒品犯罪案件的熱點(diǎn)區(qū)域,應(yīng)當(dāng)加大在這4個區(qū)域的公開查緝力度或者有針對性地開展專項行動以打擊毒品犯罪。
表3 各轄區(qū)查獲的毒品犯罪案件數(shù)量
圖3 各轄區(qū)查獲的毒品犯罪案件數(shù)量Lorenz曲線圖
不僅僅是毒品犯罪案件中可以獲得有關(guān)空間信息的毒品情報,對吸食毒品的人員進(jìn)行登記、管理,從中也可以獲得有關(guān)空間信息的毒品情報,例如,可以統(tǒng)計經(jīng)常吸食毒品的地點(diǎn),或經(jīng)常進(jìn)行毒品交易、獲取毒品的地點(diǎn),以進(jìn)行空間分布分析。
3.3 模式分布分析
模式的類型有很多,如身份模式、行為模式、吸食毒品類型模式等,對毒品犯罪案件的模式分布進(jìn)行分析,其目的在于找出特征模式,以指導(dǎo)防控與打擊工作。例如,無論是販毒人員還是吸毒人員,其個人信息,如職業(yè)、年齡、收入、文化程度、籍貫等,都可以直接或按一定標(biāo)準(zhǔn)的區(qū)間劃分為若干類,對每一類進(jìn)行數(shù)量統(tǒng)計,就可以進(jìn)行分布分析,從而可以用來指導(dǎo)判斷哪些類型的人員屬于高危人員,為偵查、訊問工作提供參考。當(dāng)前,販毒分子不斷變換藏毒方式、販運(yùn)手法、路線,使販毒手段更加隱蔽化、智能化,可以說販毒手法層出不窮,以藏毒方式來說,可以分為箱體藏毒、人體外藏毒、車體藏毒、食品藏毒、工具藏毒、生活用品藏毒、人體內(nèi)藏毒等,統(tǒng)計每種藏毒方式對應(yīng)的案件數(shù)量,并進(jìn)行分布分析,就有可能發(fā)現(xiàn)一段時期內(nèi)販毒人員的熱點(diǎn)藏毒方式,這對開展公開查緝、邊防檢查有指導(dǎo)意義。統(tǒng)計每一件毒品犯罪案件涉及的毒品種類、重量等信息,對此開展分布分析,可以從宏觀層面了解毒品犯罪趨勢,對于禁毒工作的開展與毒品檢驗工作都具有指導(dǎo)意義。
在當(dāng)前情報信息主導(dǎo)警務(wù)的戰(zhàn)略背景下,不僅是公安機(jī)關(guān),包括各有關(guān)戒毒機(jī)構(gòu)、銀行等,都掌握有海量的有關(guān)毒品犯罪案件的信息,將這些海量信息進(jìn)行處理,形成毒品情報,深入挖掘其背后隱藏的價值,進(jìn)行毒品情報分析以指導(dǎo)毒品犯罪案件的防控與打擊工作[6]。本文將Lorenz曲線的方法引入毒品情報分析領(lǐng)域,進(jìn)行時間、空間、模式的分布分析,并通過ABC分類管理法找出相應(yīng)熱點(diǎn)。在實際應(yīng)用與下一步工作中還需要注意、做好以下兩點(diǎn):
(1)雖然Lorenz曲線的理論與實踐研究都比較成熟,并且從已有研究成果看,無論是在收入分配領(lǐng)域,還是在廣泛的其他應(yīng)用領(lǐng)域中,均以基尼系數(shù)(即本文的聚集性系數(shù)G)數(shù)值大于0.4作為判斷分布狀況是否具有聚集性的標(biāo)準(zhǔn),有的研究當(dāng)中還把此系數(shù)數(shù)值大于0.5作為具有較強(qiáng)聚集性的標(biāo)準(zhǔn),但是在毒品情報分析領(lǐng)域,0.4作為判斷聚集性的警戒值是否合理,還有待進(jìn)一步地分析研究與實例驗證。
(2)為了得出呈聚集性分布的具體熱點(diǎn),本文選用ABC分類管理法將累計頻率占比分為3個區(qū)間(Ⅰ、Ⅱ、Ⅲ區(qū)間),其中20%~100%的Ⅰ區(qū)間為熱點(diǎn)所在區(qū)間,該區(qū)間已被用于判斷恐怖襲擊的時空分布熱點(diǎn)[4],而在毒品犯罪案件中,這一區(qū)間是否最合理,也有待更多的實例分析加以界定。0~10%、10%~20%這兩個區(qū)間雖然不是熱點(diǎn)分布所在,但也不能忽略不計,因為在這兩個區(qū)間內(nèi)的要素一旦產(chǎn)生作用,其影響程度很有可能比熱點(diǎn)區(qū)間的影響更大。此外,毒品犯罪案件與Lorenz曲線在上文提及的其他應(yīng)用領(lǐng)域相比,有其特殊性,其熱點(diǎn)分布是不斷變化的,例如,公安機(jī)關(guān)在高危時段、高危地段,或者對某類販毒方式開展有針對性的打擊行動之后,毒品犯罪分子往往會轉(zhuǎn)變其作案時段、地段、方式,這樣,雖然仍然呈聚集性分布,但熱點(diǎn)分布會發(fā)生動態(tài)變化,因此要進(jìn)行動態(tài)分析。
[1] 謝曉專,周西平. 基于層次結(jié)構(gòu)的公安情報分析方法研究進(jìn)展[J]. 圖書情報工作,2012(10):103-109.
[2] 杜榮川. 洛倫茲曲線的模擬與基尼系數(shù)的測定[J]. 云南經(jīng)濟(jì)管理干部學(xué)院學(xué)報,2000(2):51-53.
[3] 李國輝. 全球恐怖襲擊時空演變及風(fēng)險分析研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2014.
[4] 靖繼鵬,馬費(fèi)成,張向先. 情報科學(xué)理論[M]. 北京:科學(xué)出版社, 2009:32-35.
[5] 楊曉樓. ABC分類管理法在物流領(lǐng)域的應(yīng)用[J]. 物流技術(shù),2013(21):67-69.
[6] 郭冠男. 大數(shù)據(jù)視野下禁毒情報工作存在的問題及對策[J]. 河南司法警官職業(yè)學(xué)院學(xué)報,2016(3):116-119.
(責(zé)任編輯 于瑞華)
2016年河北省高等學(xué)校人文社會科學(xué)項目“面向邊境安全風(fēng)險防控的情報分析預(yù)警體系研究”(SQ162023)。
朱 琳(1972—),女,黑龍江哈爾濱人,副教授。研究方向為公安情報學(xué)。
D918.2