段開宇 徐漫琳
摘 要:BP神經(jīng)網(wǎng)絡(luò)是重要的分類預(yù)測方法之一,該文一方面在考察與分析單一因素預(yù)測警情的基礎(chǔ)上,探討了一種由多個因素作為神經(jīng)網(wǎng)絡(luò)的輸入層的預(yù)測模型,另一方面,通過合理部署警力、強(qiáng)化重點(diǎn)區(qū)域管控等相關(guān)防控措施,重新進(jìn)行引導(dǎo)預(yù)測,為維護(hù)社會治安提供動態(tài)監(jiān)控和科學(xué)決策。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò) 警情預(yù)測 決策支持
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2015)06(c)-0230-02
對于公安來說,要保證社會治安穩(wěn)定良好,就必須在接處警工作中降低轄區(qū)內(nèi)警情,從而針對性的按照案件發(fā)生轄區(qū)對所有案件發(fā)生數(shù)量進(jìn)行預(yù)測,根據(jù)預(yù)測結(jié)果分析出哪些轄區(qū)的警情會增加,從而可以適當(dāng)增強(qiáng)這些轄區(qū)的警力配置。而警情的產(chǎn)生是一個復(fù)雜的非線性動態(tài)系統(tǒng),利用傳統(tǒng)的時間序列預(yù)測技術(shù)很難揭示其內(nèi)在的規(guī)律。該文在利用神經(jīng)網(wǎng)絡(luò)技術(shù)的基礎(chǔ)上,探討了一種面向公安警情分析、預(yù)測和決策的的預(yù)測模型。
1 BP神經(jīng)網(wǎng)絡(luò)的理論研究
1.1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及處理單元模型
BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1,由輸入層、隱含層、輸出層共三層網(wǎng)絡(luò)組建而成,為了不失一般性,選取BP神經(jīng)網(wǎng)絡(luò)任意兩層介紹其處理單元的數(shù)學(xué)模型。BP神經(jīng)網(wǎng)絡(luò)處理單元的結(jié)構(gòu),如圖1-1右上所示,其中L1層的n個處理單元與L2層的p個處理單元全連接,連接權(quán)向量;L1層的n個處理單元的輸出構(gòu)成了L2層各個處理單元的輸入列變量,L2層各個處理單元的閾值為,因此,L2層各個處理單元接收的輸入加權(quán)和為[1]:
(1.1)
L2層各個處理單元的輸出由轉(zhuǎn)移函數(shù)決定。BP神經(jīng)網(wǎng)絡(luò)通常采用Sigmoid函數(shù)作為轉(zhuǎn)移函數(shù)(在實(shí)際應(yīng)用中,也可以采用雙曲正切函數(shù)作為轉(zhuǎn)移函數(shù))。
BP神經(jīng)網(wǎng)絡(luò)選取Sigmoid函數(shù)作為轉(zhuǎn)移函數(shù)是因?yàn)镾igmoid函數(shù)的輸出接近生物神經(jīng)元的信號輸出形式,能夠模擬生物神經(jīng)元的非線性特征。同時,Sigmoid函數(shù)具有的非線性特征也能夠增強(qiáng)神經(jīng)網(wǎng)絡(luò)的非線性映射能力。
1.2 誤差反向傳播學(xué)習(xí)算法
BP神經(jīng)網(wǎng)絡(luò)采用BP算法進(jìn)行學(xué)習(xí),其學(xué)習(xí)過程分為四個階段[2]:
(1)學(xué)習(xí)模式是由輸入層(不做處理)經(jīng)過隱含層然后,向輸出層逐層傳播的“順傳播”過程;(2)網(wǎng)絡(luò)的輸出層得期望輸出與實(shí)際學(xué)習(xí)模式的輸出之差,即誤差信號,是由輸出層經(jīng)隱含層向輸入層逐層修正連接權(quán)值的“誤差逆?zhèn)鞑ァ边^程;(3)由“模式順傳播”過程和“誤差逆?zhèn)鞑ァ边^程反復(fù)交替進(jìn)行的網(wǎng)絡(luò)“記憶訓(xùn)練”過程;(4)網(wǎng)絡(luò)趨向收斂,即網(wǎng)絡(luò)的全局誤差趨向極小值的“學(xué)習(xí)收斂”過程[2]。
前人已經(jīng)對這方面內(nèi)容有了深入的研究,這里就不在詳述。
2 基于BP神經(jīng)網(wǎng)絡(luò)的警情預(yù)測模型分析
2.1 單因素預(yù)測建模過程
在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)警情短期預(yù)測中,大部分采用的是滑動窗口時間段內(nèi)的警情數(shù)量,作為神經(jīng)網(wǎng)絡(luò)的輸入,即網(wǎng)絡(luò)的輸入層,選取的是一段連續(xù)時間內(nèi)連續(xù)的警情數(shù),未來的預(yù)測值作為輸出,然后通過樣本訓(xùn)練進(jìn)行權(quán)值的學(xué)習(xí)。在現(xiàn)實(shí)生活中,警情的發(fā)生因素很多,這種預(yù)測方法中對預(yù)測因素的分析是明顯不足的。上述這種預(yù)測方法叫做現(xiàn)狀外推預(yù)測,即通過對歷史警情數(shù)的提取,在當(dāng)前客觀狀態(tài)下,對未來警情數(shù)的預(yù)測;在實(shí)際生活中,警情的發(fā)生有很多因素,諸如由于警力部署、季節(jié)性流動人口的不同,會導(dǎo)致轄區(qū)某地區(qū)發(fā)生的警情數(shù)也不同。另外,警情數(shù)預(yù)測的目的是通過調(diào)整警力或者有針對的預(yù)防措施減少轄區(qū)某區(qū)域的發(fā)案數(shù)。
2.2 改進(jìn)的警情預(yù)測建模過程
介于上節(jié)所述原因,我們嘗試在使用神經(jīng)網(wǎng)絡(luò)預(yù)測過程中,加入了環(huán)比警情數(shù)、部署警力數(shù)、該地區(qū)常住人口數(shù)、暫住人口數(shù)及重點(diǎn)防控區(qū)域數(shù)燈相關(guān)參數(shù),使用神經(jīng)網(wǎng)絡(luò)做預(yù)測分類是,首先要確定網(wǎng)絡(luò)輸入層、隱含層和輸出層神經(jīng)元節(jié)點(diǎn)的數(shù)量,輸入層,節(jié)點(diǎn)主要選取影響預(yù)測目標(biāo)的各個因素,即上述包含的相關(guān)參數(shù)。輸出層節(jié)點(diǎn),主要選取要預(yù)測的未來警情數(shù)。所以,在實(shí)際仿真中選擇三層前饋式的神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò),包含了7個輸入節(jié)點(diǎn)和1個輸出節(jié)點(diǎn),具體如圖2所示。
從圖中我們可以看出該文所使用的模型相比單因素的神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有較大的改進(jìn),由于加入了幾個影響警情發(fā)生的要素,我們可以在外推預(yù)測階段結(jié)束后,根據(jù)實(shí)際情況作出調(diào)整,諸如由于放假造成的流動人口增多或減少。根據(jù)防控要求作出的警力調(diào)整等各方面條件之后,再次進(jìn)行預(yù)測,形成了有目的的預(yù)測。
3 樣本訓(xùn)練及預(yù)測結(jié)果分析
建立預(yù)測模型,至少需要2組數(shù)據(jù)樣本,前一組數(shù)據(jù)用來構(gòu)成訓(xùn)練樣本,對神經(jīng)網(wǎng)絡(luò)單元的權(quán)重、閾值進(jìn)行訓(xùn)練,后一組數(shù)據(jù)作為檢驗(yàn)樣本對預(yù)測結(jié)果進(jìn)行檢驗(yàn)。該例子中選擇了某派出所2014年4月到2015年4月的實(shí)際數(shù)據(jù)作為樣本。對樣本進(jìn)行歸一化處理,勢必導(dǎo)致數(shù)值大的分量絕對誤差變大,一般而言,樣本的輸入和輸出值都限定在0.1至0.9之間。在訓(xùn)練ANN時,應(yīng)根據(jù)情況確定輸入輸出層的各神經(jīng)元所代表實(shí)際量的最小、最大值Xmin,Xmax,通過代入逆變換公式換算出的真實(shí)量。
故,對原始數(shù)據(jù)按照BP人工神經(jīng)網(wǎng)絡(luò)的具體算法的第一步,歸一化處理原始數(shù)據(jù),可將原始數(shù)據(jù)轉(zhuǎn)化為[0.1,0.9]上的無量綱指標(biāo)屬性值,如表2所示。
利用訓(xùn)練完成后神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和權(quán)值參數(shù),我們首先將剩余的其他沒有參與訓(xùn)練的測試數(shù)據(jù),作為神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行警情數(shù)的預(yù)測,然后通過網(wǎng)絡(luò)的輸出值與實(shí)際值比較,以此來驗(yàn)證預(yù)測模型的準(zhǔn)確度和泛化能力。
4 結(jié)語
該文從預(yù)測結(jié)果比較所示可以得到的結(jié)論有:(1)預(yù)測數(shù)據(jù)與真實(shí)數(shù)據(jù)在數(shù)值上盡管存在一些差距,但是在升降的趨勢方向上是較為準(zhǔn)確的。(2)改進(jìn)的多因素BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型采用了8個影響警情發(fā)生因素指標(biāo)作為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的輸入,利用神經(jīng)網(wǎng)絡(luò)的自適應(yīng)、自學(xué)習(xí)能力對歷史樣本數(shù)據(jù)進(jìn)行訓(xùn)練,通過網(wǎng)絡(luò)的輸出獲得了與真實(shí)數(shù)據(jù)趨勢一致的預(yù)測值。根據(jù)預(yù)測的趨勢情況,可通過強(qiáng)化巡邏、不同區(qū)域配置不停警力等方式進(jìn)行引導(dǎo)預(yù)測,這樣可以如實(shí)的反應(yīng)出變更防控措施后的優(yōu)勢與不足。
參考文獻(xiàn)
[1] 劉莉,徐玉生,馬志新.數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理技術(shù)綜述[J].甘肅科學(xué)學(xué)報, 2003,15(1):117-119.
[2] 馬銳,人工神經(jīng)網(wǎng)絡(luò)原理[D].北京:機(jī)械工業(yè)出版社,2010.
[3] 焦李成.神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論[M].西安:西安電子科技大學(xué)出版社,1996.