付鳳杰,阮琳琦,王 澤
(1.浙江警察學(xué)院交通管理工程系,浙江杭州 310053;2.浙江警察學(xué)院計(jì)算機(jī)與信息安全系,浙江杭州 310053)
近年來(lái),網(wǎng)約車(chē)在中國(guó)迅速普及。第47次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》指出,截至2020年12月,中國(guó)網(wǎng)約車(chē)用戶(hù)已達(dá)3.65億,占網(wǎng)民整體的36.9%[1]。但是,法律空白和監(jiān)管困難給乘客帶來(lái)了嚴(yán)重的風(fēng)險(xiǎn),網(wǎng)約車(chē)司機(jī)殺人、強(qiáng)奸等暴力刑事案件時(shí)有發(fā)生,2018年5月6日和2018年8月24日,兩名網(wǎng)約車(chē)乘客在出行途中,被司機(jī)強(qiáng)奸并殺害。保障網(wǎng)約車(chē)乘客的安全成為了網(wǎng)約車(chē)運(yùn)營(yíng)和監(jiān)管的基礎(chǔ)和重中之重,網(wǎng)約車(chē)司機(jī)嚴(yán)重違法風(fēng)險(xiǎn)預(yù)警技術(shù)的探索和發(fā)展迫在眉睫。
關(guān)于網(wǎng)約車(chē)安全的研究,國(guó)內(nèi)學(xué)者們主要集中于探討政府部門(mén)、立法與司法機(jī)關(guān)等主體在管理上的改進(jìn)[2-3],乘客安全監(jiān)測(cè)和司機(jī)嚴(yán)重違法風(fēng)險(xiǎn)預(yù)警研究較少。隨著移動(dòng)互聯(lián)時(shí)代的到來(lái),基于車(chē)輛移動(dòng)軌跡數(shù)據(jù)時(shí)空挖掘方面的研究逐漸增多,但是大多學(xué)者僅聚焦于異常軌跡/行為檢測(cè)算法。例如,傳統(tǒng)的異常軌跡檢測(cè)算法基本思路為:將同一OD之間的軌跡進(jìn)行聚類(lèi),旨在將常見(jiàn)的、相似度較大的軌跡歸為正常軌跡類(lèi),將罕見(jiàn)的、與眾不同的軌跡歸為異常軌跡類(lèi)[4-5]。該類(lèi)算法主要對(duì)已完成的歷史軌跡進(jìn)行判別,并不適用于對(duì)未完成的軌跡進(jìn)行實(shí)時(shí)判別,難以應(yīng)用于風(fēng)險(xiǎn)預(yù)警。一些學(xué)者提出了移動(dòng)軌跡監(jiān)測(cè)/判別方法,例如Xpa等利用軌跡的位置、速度、方向數(shù)據(jù),通過(guò)計(jì)算軌跡的多因素不一致性系數(shù),實(shí)現(xiàn)異常軌跡的判別[6]。這類(lèi)算法計(jì)算復(fù)雜度隨時(shí)間的推移而顯著增加,更重要的是網(wǎng)約車(chē)安全監(jiān)測(cè)是一個(gè)綜合性的復(fù)雜研究,不僅需要考慮人文地理學(xué)、心理學(xué)、交通運(yùn)輸學(xué),更需要結(jié)合犯罪地理學(xué)和概率統(tǒng)計(jì)理論等對(duì)車(chē)輛行駛軌跡和司機(jī)駕駛行為及犯罪行為進(jìn)行分析和預(yù)判。
違法犯罪行為與時(shí)空因素高度相關(guān),往往會(huì)集中在一個(gè)高發(fā)時(shí)期及某些熱點(diǎn)空間區(qū)域,且該類(lèi)區(qū)域的人口密度、經(jīng)濟(jì)情況以及區(qū)域類(lèi)別等有著顯著的特征[7-8]。如錢(qián)漢偉等人[9]建立違法犯罪數(shù)據(jù)模型,挖掘社交網(wǎng)絡(luò)數(shù)據(jù)具有潛在價(jià)值和線索,識(shí)別異常特征的可疑人群。顏峻[10]以社區(qū)盜竊案件發(fā)案率為例,建立了盜竊違法犯罪率與社區(qū)人口密度、路網(wǎng)密度、社區(qū)距派出所距離等因素之間的局部分析模型,并發(fā)現(xiàn)違法犯罪空間分布與人口、環(huán)境等因素的關(guān)系隨空間位置而改變。因此,基于時(shí)空規(guī)律的違法犯罪位置預(yù)測(cè)和違法犯罪率預(yù)測(cè)成為了研究熱點(diǎn)。違法犯罪位置預(yù)測(cè)主要包括違法犯罪熱點(diǎn)識(shí)別[11-12]和基于違法犯罪熱點(diǎn)分析的違法犯罪位置預(yù)測(cè),如肖漢等人[13]考慮時(shí)間距離因素、違法犯罪率因素、人口數(shù)量因素、警察因素、地理環(huán)境因素和被害人職業(yè)因素等影響因子,建立研究區(qū)域的違法犯罪概率評(píng)價(jià)函數(shù),得到違法犯罪分子下一步最有可能違法犯罪的預(yù)測(cè)區(qū)域。Tayebi等人[14]提出了基于違法犯罪熱點(diǎn)和嫌疑人活動(dòng)空間的違法犯罪位置概率模型。違法犯罪率預(yù)測(cè)是指利用回歸分析等方法對(duì)某一區(qū)域內(nèi)的違法犯罪率進(jìn)行建模和預(yù)測(cè)[15],例如Wang H等人[16]利用Poi數(shù)據(jù)和出租車(chē)流量數(shù)據(jù),建立了基于負(fù)二項(xiàng)模型的地理加權(quán)回歸模型,用以預(yù)測(cè)某街區(qū)的違法犯罪率[16]。但是,這些研究都基于大量的歷史違法犯罪數(shù)據(jù)。當(dāng)特定種類(lèi)的違法犯罪數(shù)據(jù)過(guò)少,并且需要在個(gè)體層面對(duì)研究對(duì)象的違法犯罪風(fēng)險(xiǎn)進(jìn)行監(jiān)測(cè)時(shí),往往需要采用模糊綜合評(píng)價(jià)模型。例如,錢(qián)振等、周侗等[17-18]提出了一種安全狀態(tài)監(jiān)測(cè)模型,從地理時(shí)空角度,分析案件發(fā)生的區(qū)域和時(shí)間特征,提取城市“潛在危險(xiǎn)區(qū)域”,構(gòu)建車(chē)輛OD距離、異常速度、行駛時(shí)間等因子,實(shí)時(shí)綜合分析乘客安全狀態(tài)。但是一方面,該研究直接給出了危險(xiǎn)因子的權(quán)重值,忽略了專(zhuān)家經(jīng)驗(yàn)及比較判斷矩陣;另一方面,評(píng)價(jià)模型未考慮乘客因素。網(wǎng)約車(chē)司機(jī)嚴(yán)重違法風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)包括司機(jī)/乘客特征、地理環(huán)境(違法犯罪場(chǎng)所分布)、社會(huì)環(huán)境(人口聚集情況)、出行路線、駕駛行為等,不同指標(biāo)對(duì)不同司機(jī)的影響程度不同。因此,應(yīng)相應(yīng)地結(jié)合公安專(zhuān)家處理相關(guān)違法犯罪案件的經(jīng)驗(yàn),提高各個(gè)指標(biāo)權(quán)重的科學(xué)合理性;利用貝葉斯定理,融入乘客因素,提高評(píng)價(jià)結(jié)果的合理性。
綜上,本項(xiàng)目以網(wǎng)約車(chē)為研究對(duì)象,期望通過(guò)融合多維時(shí)空數(shù)據(jù),搭建網(wǎng)約車(chē)司機(jī)嚴(yán)重違法風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系、挖掘和提取嚴(yán)重違法風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)、建立基于層次分析法的嚴(yán)重違法風(fēng)險(xiǎn)評(píng)價(jià)模型、構(gòu)建面向不同對(duì)象的嚴(yán)重違法風(fēng)險(xiǎn)多級(jí)預(yù)警機(jī)制,實(shí)現(xiàn)網(wǎng)約車(chē)司機(jī)嚴(yán)重違法風(fēng)險(xiǎn)監(jiān)測(cè)和預(yù)警,為網(wǎng)約車(chē)乘客的出行安全提供保障。
本文的嚴(yán)重違法行為主要指網(wǎng)約車(chē)司機(jī)在出行過(guò)程中可能構(gòu)成搶劫、殺人、強(qiáng)奸等暴力犯罪的嚴(yán)重違法行為。犯罪行為是否發(fā)生與自身主觀條件、客觀環(huán)境和犯罪條件有關(guān)。自身主觀條件包括性別、年齡、性格等因素,客觀環(huán)境主要是社會(huì)和地理環(huán)境,犯罪條件主要包括時(shí)空條件、工具條件和侵害對(duì)象。因此,本文考慮司機(jī)特征(司機(jī)性別、年齡、接單數(shù)、綜合評(píng)分、差評(píng)比例)、客觀環(huán)境因素(整體風(fēng)險(xiǎn)、出行實(shí)時(shí)風(fēng)險(xiǎn))、時(shí)空條件(出行特征、車(chē)輛實(shí)時(shí)行駛狀態(tài))及乘客特征(性別、年齡、人數(shù))等,建立網(wǎng)約車(chē)司機(jī)嚴(yán)重違法風(fēng)險(xiǎn)預(yù)警系統(tǒng),設(shè)計(jì)思路如圖1所示。
圖1 風(fēng)險(xiǎn)預(yù)警系統(tǒng)設(shè)計(jì)思路
相同的客觀環(huán)境因素和時(shí)空條件對(duì)不同特征的司機(jī)的影響、約束作用不同。為提高專(zhuān)家對(duì)各因素重要性打分的準(zhǔn)確度和合理性,繼而提高嚴(yán)重違法概率預(yù)測(cè)精度,需對(duì)司機(jī)進(jìn)行聚類(lèi)分析。獲取了某一城區(qū)300名網(wǎng)約車(chē)司機(jī)的基礎(chǔ)數(shù)據(jù),包括每個(gè)司機(jī)的性別、年齡、接單數(shù)、綜合評(píng)分、差評(píng)比例、投訴比例等。樣本比例達(dá)到1.64%,能夠保證統(tǒng)計(jì)結(jié)果達(dá)到10%的置信水平、5%的誤差水平。由于不同量綱的特征處于不同數(shù)值量級(jí),對(duì)數(shù)據(jù)進(jìn)行處理,得到任意司機(jī)i的6維屬性xi={xi1,xi2,xi3,xi4,xi5,xi6},具體方法如下:
(1)虛擬變量:性別男xi1=0,性別女xi1=1;
(2)標(biāo)準(zhǔn)化處理:年齡、接單數(shù)、綜合評(píng)分,即xij=(x′ij-μij)/σij。
式中,x′ij是司機(jī)i第j個(gè)屬性的原始值,xij是x′ij的標(biāo)準(zhǔn)化結(jié)果,μij和σij分別是司機(jī)i第j個(gè)屬性原始值的平均值和方差。
利用K-means算法對(duì)樣本集合R6進(jìn)行聚類(lèi)分析,R6={x1,…,xM}。由于分類(lèi)過(guò)多會(huì)造成專(zhuān)家打分困難,準(zhǔn)確度降低,因此,根據(jù)實(shí)際經(jīng)驗(yàn)將K值取為3,并將類(lèi)別名稱(chēng)定義為穩(wěn)重資深型、穩(wěn)步上升型、沖動(dòng)兼職型。
算法主要步驟有兩個(gè):
步驟一:隨機(jī)選取3個(gè)聚類(lèi)質(zhì)心點(diǎn)為μ1,μ2,μ3∈R6;
步驟二:分別利用公式(1)和公式(2)重復(fù)迭代類(lèi)別劃分和質(zhì)心計(jì)算,直至質(zhì)心不變或者變化很小。
(1)
(2)
式中,ci表示第i個(gè)司機(jī)與3個(gè)聚類(lèi)質(zhì)心點(diǎn)中距離最近的類(lèi),xi表示第i個(gè)司機(jī)的6維屬性,μk表示第k個(gè)聚類(lèi)質(zhì)心點(diǎn),μkj表示第k個(gè)聚類(lèi)質(zhì)心點(diǎn)的第j個(gè)特征值,M表示司機(jī)的樣本數(shù)。
與網(wǎng)約車(chē)出行安全相關(guān)的客觀環(huán)境主要是指偏僻無(wú)人空曠區(qū)域的分布,用人口聚集情況和偏僻場(chǎng)所的分布來(lái)表征。人口聚集情況用活動(dòng)場(chǎng)所(生活服務(wù)、美食、購(gòu)物)來(lái)描述。選用這3類(lèi)數(shù)據(jù)的原因有4點(diǎn):一是生活服務(wù)、美食、購(gòu)物分布稀疏的區(qū)域一定程度上能夠代表城市偏僻無(wú)人空曠區(qū)域;二是生活服務(wù)、美食、購(gòu)物場(chǎng)所相對(duì)較小,較為安全;三是這些數(shù)據(jù)為開(kāi)放性數(shù)據(jù),任何城市都可以獲取,能夠保證模型和預(yù)警系統(tǒng)的實(shí)時(shí)性和有效性;四是生活服務(wù)、美食、購(gòu)物的營(yíng)業(yè)與否能夠一定程度上反映人口聚集情況的動(dòng)態(tài)變化。偏僻場(chǎng)所用以表征網(wǎng)約車(chē)司機(jī)嚴(yán)重違法行為實(shí)施場(chǎng)所,主要包括山林、公園??陀^環(huán)境對(duì)嚴(yán)重違法風(fēng)險(xiǎn)的影響體現(xiàn)在兩方面:一是整體風(fēng)險(xiǎn),即出行路線沿線的平均風(fēng)險(xiǎn);二是實(shí)時(shí)風(fēng)險(xiǎn),即當(dāng)前定位處的實(shí)時(shí)風(fēng)險(xiǎn)。整體風(fēng)險(xiǎn)主要影響司機(jī)出行初始時(shí)刻的心理定位,而實(shí)時(shí)風(fēng)險(xiǎn)則影響司機(jī)的隨機(jī)行為。
利用百度地圖API獲取了同一城區(qū)表征客觀環(huán)境的基礎(chǔ)數(shù)據(jù)點(diǎn),并將生活服務(wù)、美食、購(gòu)物數(shù)據(jù)點(diǎn)的權(quán)重p賦值為1,將樹(shù)林和工地的權(quán)重p分別賦值為-5和-2。利用ArcMap和Python對(duì)所有數(shù)據(jù)點(diǎn)進(jìn)行核密度分析,得到固定客觀環(huán)境熱力圖及核密度計(jì)算結(jié)果,如圖2所示。任意位置(x,y)處的核密度f(wàn)(x,y)的計(jì)算公式如下,
(3)
(4)
(5)
圖2 客觀環(huán)境熱力圖
每間隔100 m選取一個(gè)采集點(diǎn),根據(jù)區(qū)域核密度分析計(jì)算結(jié)果,可以確定出行路線上任意一采集點(diǎn)的核密度值。本文依據(jù)所有采集點(diǎn)的核密度平均值計(jì)算整體風(fēng)險(xiǎn),依據(jù)實(shí)時(shí)定位處的核密度值計(jì)算實(shí)時(shí)風(fēng)險(xiǎn),利用Min-Max標(biāo)準(zhǔn)化方法對(duì)二者進(jìn)行歸一化處理。
(6)
(7)
式中,Rf表示整體風(fēng)險(xiǎn),即路線沿線J個(gè)采集點(diǎn)核密度平均值的歸一化結(jié)果,f(xj,yj)為第j個(gè)采集點(diǎn)處的核密度值,f(xt,yt)為實(shí)時(shí)定位(xt,yt)處的核密度值,Rr表示實(shí)時(shí)風(fēng)險(xiǎn),即實(shí)時(shí)定位(xt,yt)處核密度值的歸一化結(jié)果,fmin表示當(dāng)前區(qū)域核密度最小值,fmax表示當(dāng)前區(qū)域核密度最大值。
時(shí)空條件中出行特征主要指出發(fā)時(shí)刻t0、出行距離s等信息,可以直接通過(guò)網(wǎng)約車(chē)平臺(tái)獲取。由于網(wǎng)約車(chē)司機(jī)作案一般多發(fā)于夜晚,因此,本文以22:00作為最大值,以10:00作為最小值,對(duì)出發(fā)時(shí)刻進(jìn)行歸一化處理。由于大部分網(wǎng)約車(chē)出行為城市內(nèi)部出行,因此,本文將100 km作為出行距離最大值,對(duì)出行距離進(jìn)行歸一化處理,大于100 km的取值為1。
車(chē)輛實(shí)時(shí)行駛狀態(tài)主要指是否發(fā)生異常偏航和異常停車(chē)。出行過(guò)程中,偏航的原因有很多,包括道路復(fù)雜、司機(jī)不熟悉路線、前方發(fā)生重大擁堵需要繞行或切換路線等等。同樣,擁堵、拼車(chē)、信號(hào)控制等原因都會(huì)造成車(chē)輛靜止。因此,僅僅依據(jù)偏航距離(與目的地的距離差)或停車(chē)時(shí)間(靜止或低速行駛時(shí)間),提高嚴(yán)重違法風(fēng)險(xiǎn)計(jì)算結(jié)果,甚至直接進(jìn)行預(yù)警,會(huì)大大提高誤判率,不僅增加平臺(tái)及公安部門(mén)的工作量,也會(huì)降低系統(tǒng)可信度。本文提出了基于常用行駛路線的異常偏航距離比和基于實(shí)時(shí)路況的異常停車(chē)時(shí)間比計(jì)算方法。
當(dāng)司機(jī)偏航且并非切換至常用路線時(shí),被認(rèn)為是異常偏航。根據(jù)出行OD,利用百度地圖API獲取歷史最優(yōu)出行路線,包括不同工作日、非工作日下不同時(shí)段(早高峰、平峰、晚高峰、低峰)內(nèi)時(shí)間最短、距離最短、躲避擁堵等常用路線,得到常用路線集合L={L1,L2,…,LN}。設(shè)置異常偏航距離初始值為0(ds=0),可能切換路線集合L′={L1,L2,…,LE},可能切換路線數(shù)的初始值為E(E=N-1),則異常偏航距離比的計(jì)算方法和步驟如下:
步驟一:依據(jù)公式(8)計(jì)算當(dāng)前定位(xt,yt)與D點(diǎn)(xD,yD)之間的距離dDt、上一定位(xt′,yt′)與(xD,yD)之間的距離dDt′及二者之差ΔdDt。
(8)
步驟二:當(dāng)ΔdDt>0時(shí),跳至步驟三;否則返回結(jié)果為正常行駛,βd=0,跳至步驟一。
步驟三:依據(jù)公式(9),依次計(jì)算當(dāng)前定位(xt,yt)與各個(gè)常用路線的最短距離及其變化Δdpt。
Δdpt=d((xt,yt),Lp)-d((xt′,yt′),Lp),p=1,2,…,E
(9)
步驟四:p=1,2,…,E,依次判別Δdpt;當(dāng)Δdpt≥0時(shí),E=E-1,在L′中剔除Lp。
步驟五:若E>0,則返回至步驟一;否則跳至步驟六。
步驟六:令異常偏航距離ds=ΔdDt,異常偏航距離比(歸一化值)βd=ΔdDt/s,t=t+10,返回步驟一。
當(dāng)實(shí)時(shí)路況為暢通,而車(chē)輛速度過(guò)低(小于5 km/h)時(shí),被認(rèn)為是異常停車(chē)。若行駛時(shí)間大于預(yù)計(jì)行程時(shí)間,則利用危險(xiǎn)系數(shù)對(duì)異常停車(chē)時(shí)間進(jìn)行擴(kuò)大。利用百度地圖API和GPS終端(如手機(jī)),可以獲取車(chē)輛的實(shí)時(shí)信息,包括速度vt,行駛時(shí)間T,預(yù)計(jì)行程時(shí)間T0,車(chē)輛所處路段的實(shí)時(shí)路況Slt:擁堵(0)、緩慢(1)、暢通(2)。設(shè)置異常停車(chē)時(shí)間初始值為0(ts=0)具體步驟如下:
步驟一:計(jì)算異常停車(chē)危險(xiǎn)系數(shù)η,公式如下,
η=max (Tt/T0,1)
(10)
步驟二:實(shí)時(shí)判別路況和車(chē)速,當(dāng)Slt=2且vt<5 km/h時(shí),ts=ts+10,令異常停車(chē)時(shí)間ts′=ηts,異常停車(chē)時(shí)間比(歸一化值)βt=ts′/T0。
步驟三:t=t+10,返回步驟一。
本文定量化司機(jī)特征聚類(lèi)、客觀環(huán)境因素、時(shí)空條件等因素后,利用層次分析法,構(gòu)建嚴(yán)重違法先驗(yàn)的概率計(jì)算模型。邀請(qǐng)32位公安部門(mén)的專(zhuān)家,憑借處理相關(guān)違法犯罪案件的經(jīng)驗(yàn),對(duì)不同類(lèi)別司機(jī)的整體風(fēng)險(xiǎn)Rf、實(shí)時(shí)風(fēng)險(xiǎn)Rr、出發(fā)時(shí)刻t0、出行距離s、異常偏航距離比βd、異常停車(chē)時(shí)間比βt等6個(gè)因素進(jìn)行重要性打分。以穩(wěn)步上升型司機(jī)為例,打分表格結(jié)構(gòu)、匯總表及最終平均分如表1所示。
表1 穩(wěn)步上升型司機(jī)嚴(yán)重違法因素相對(duì)重要性分值匯總表
根據(jù)表1可以得到第i個(gè)因素與第j個(gè)因素的相對(duì)重要性分值aij,令aji=1/aij,補(bǔ)充其他元素值,構(gòu)造判斷矩陣A,如表2所示。
表2 網(wǎng)約車(chē)司機(jī)嚴(yán)重違法概率預(yù)測(cè)判斷矩陣
確定判斷矩陣的最大特征值,并根據(jù)公式(11)計(jì)算一致性指標(biāo)CI,查表確定平均隨機(jī)一致性指標(biāo)RI,最后根據(jù)公式(12)計(jì)算一致性比例CR,具體結(jié)果如表3所示。
(11)
(12)
表3 一致性驗(yàn)證結(jié)果
由表3可知,判斷矩陣通過(guò)一致性檢驗(yàn)。利用算數(shù)平均法、幾何平均法和特征值法求出6個(gè)因素的權(quán)重,并計(jì)算其平均值。Rf、Rr、t0、s、βd、βt6個(gè)因素的權(quán)重分別為:0.06、0.14、0.07、0.09、0.31、0.33。同理,可以得到6個(gè)因素對(duì)其他兩種類(lèi)型司機(jī)的權(quán)重。因此,不考慮其他情況和條件時(shí),網(wǎng)約車(chē)司機(jī)嚴(yán)重違法的先驗(yàn)值概率p(C)的計(jì)算公式如下,
(13)
2017年10月至2020年10月網(wǎng)約車(chē)司機(jī)實(shí)施犯罪案例50起,同時(shí)隨機(jī)選取500個(gè)正常出行案例。按照年齡、性別和人數(shù)將乘客分為5類(lèi),統(tǒng)計(jì)每類(lèi)乘客在正常出行中和司機(jī)刑事犯罪出行中的比例如表4所示,分別對(duì)應(yīng)已知出行正常時(shí)每類(lèi)乘客的條件概率p(P|N)和已知司機(jī)刑事犯罪時(shí)每類(lèi)乘客的條件概率p(P|C)。
表4 正常出行和司機(jī)刑事犯罪出行中不同類(lèi)別乘客的比例
提取乘客信息,主要包括性別、年齡和人數(shù),對(duì)乘客類(lèi)別進(jìn)行判斷。根據(jù)網(wǎng)約車(chē)司機(jī)嚴(yán)重違法概率先驗(yàn)值和該類(lèi)別乘客的條件概率,利用貝葉斯定理,計(jì)算網(wǎng)約車(chē)司機(jī)嚴(yán)重違法概率的后驗(yàn)值。
(14)
式中,P表示乘客類(lèi)別,P=1、2、3、4、5;p(C|P)表示已知乘客為類(lèi)別P時(shí),網(wǎng)約車(chē)司機(jī)嚴(yán)重違法概率值,p(N)表示司機(jī)未嚴(yán)重違法的概率。
依據(jù)嚴(yán)重違法概率大小和風(fēng)險(xiǎn)預(yù)警對(duì)象(乘客、乘客緊急聯(lián)系人、網(wǎng)約車(chē)平臺(tái)和公安機(jī)關(guān)),相應(yīng)地建立四級(jí)預(yù)警機(jī)制,各級(jí)預(yù)警的條件和措施如表5所示。
(1)當(dāng)p(C|P)>p3時(shí),啟動(dòng)四級(jí)預(yù)警:自動(dòng)向乘客發(fā)出預(yù)警提醒和確認(rèn)消息,提醒乘客注意司機(jī)駕駛行為,并確認(rèn)司機(jī)是否有可疑行為,正常反饋ξ2=1,無(wú)反饋或有問(wèn)題時(shí)ξ2=0。一般p3取值為0.4。
(2)當(dāng)p3≤p(C|P) (3)當(dāng)p2≤p(C|P) (4)當(dāng)p(C|P)≥p1&ξ3ξ2ξ1=0時(shí),啟動(dòng)一級(jí)預(yù)警:自動(dòng)向公安機(jī)關(guān)發(fā)送車(chē)輛及司機(jī)信息,公安機(jī)關(guān)利用卡口數(shù)據(jù)確認(rèn)司機(jī)和乘客當(dāng)前狀態(tài)。 表5 各級(jí)預(yù)警的條件和措施 以滴滴樂(lè)清案件為例,司機(jī)類(lèi)別為Ⅲ,乘客類(lèi)別為Ⅳ,各個(gè)關(guān)鍵節(jié)點(diǎn)對(duì)應(yīng)的時(shí)刻、定位、6個(gè)因素取值、嚴(yán)重違法概率預(yù)測(cè)值及預(yù)警情況如表6所示。根據(jù)表6,對(duì)幾點(diǎn)重要內(nèi)容解釋如下: (1)路線的整體風(fēng)險(xiǎn)較高,在進(jìn)入盤(pán)山公路之后,實(shí)時(shí)風(fēng)險(xiǎn)顯著提高,這是因?yàn)榫W(wǎng)約車(chē)司機(jī)選擇了人跡罕至的山路,并逐漸遠(yuǎn)離出發(fā)地點(diǎn)。 (2)異常偏航距離比都較低,這是因?yàn)樵撀肪€雖是山路,但同時(shí)屬于最短距離路線,另外網(wǎng)約車(chē)司機(jī)一直在路線沿線往返作案,無(wú)法將其判別為偏航或者異常偏航。 (3)13:50進(jìn)入楊嶺公路后,實(shí)時(shí)風(fēng)險(xiǎn)顯著增加,嚴(yán)重違法概率值達(dá)到閾值p3,向乘客發(fā)出四級(jí)預(yù)警,并得到乘客反饋。 (3)14:09進(jìn)入石角龍村后,實(shí)時(shí)風(fēng)險(xiǎn)增加,嚴(yán)重違法概率值達(dá)到閾值p2,向緊急聯(lián)系人發(fā)出三級(jí)預(yù)警,并得到緊急聯(lián)系人反饋。 (4)14:14進(jìn)入江岙村后,嚴(yán)重違法概率值雖未達(dá)到閾值p1,但是乘客、緊急聯(lián)系人反饋均為0,向平臺(tái)發(fā)出二級(jí)預(yù)警。 (5)14:32異常停車(chē)時(shí)長(zhǎng)比顯著增加,嚴(yán)重違法概率值達(dá)到閾值p1,同時(shí)乘客、緊急聯(lián)系人反饋均為0,向公安部門(mén)發(fā)出一級(jí)預(yù)警。 (6)系統(tǒng)發(fā)出一級(jí)預(yù)警到網(wǎng)約車(chē)司機(jī)殺害乘客,有18分鐘的救援時(shí)間。雖然時(shí)間較短,但是一方面,緊急聯(lián)系人和公安部門(mén)已獲取車(chē)輛相關(guān)信息;另一方面,距離上江岙3 km的位置設(shè)有巡防隊(duì)。這些均能為乘客提供救援機(jī)會(huì)。 表6 各個(gè)關(guān)鍵節(jié)點(diǎn)嚴(yán)重違法概率預(yù)測(cè)結(jié)果 本文首先采用K-means算法對(duì)網(wǎng)約車(chē)司機(jī)進(jìn)行聚類(lèi)分析,得到3個(gè)類(lèi)別的司機(jī);利用核密度分析法將定性的客觀環(huán)境因素轉(zhuǎn)換定量的嚴(yán)重違法風(fēng)險(xiǎn);利用異常偏航距離比和異常時(shí)間比計(jì)算算法,將時(shí)空條件轉(zhuǎn)化為異常偏航距離比和異常停車(chē)距離比。其次,通過(guò)調(diào)查問(wèn)卷和層次分析法,得到各個(gè)因素的權(quán)重,建立網(wǎng)約車(chē)司機(jī)嚴(yán)重違法先驗(yàn)概率模型;根據(jù)不同類(lèi)別乘客的比例,利用貝葉斯定理,計(jì)算網(wǎng)約車(chē)司機(jī)嚴(yán)重違法后驗(yàn)概率值。最后,建立網(wǎng)約車(chē)司機(jī)嚴(yán)重違法四級(jí)預(yù)警系統(tǒng),并利用滴滴樂(lè)清案件,對(duì)預(yù)警系統(tǒng)進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,本文提出的嚴(yán)重違法風(fēng)險(xiǎn)預(yù)警系統(tǒng)能夠較為準(zhǔn)確地預(yù)測(cè)網(wǎng)約車(chē)司機(jī)嚴(yán)重違法概率,為及時(shí)防范、發(fā)現(xiàn)并制止嚴(yán)重違法行為提供可能。 本研究主要?jiǎng)?chuàng)新點(diǎn)如下: (1)與現(xiàn)有研究相比,增加了網(wǎng)約車(chē)司機(jī)特征和乘客特征因素,改進(jìn)了異常偏航距離和異常停車(chē)時(shí)間計(jì)算方法,并利用不同數(shù)據(jù)分析方法實(shí)現(xiàn)多維時(shí)空數(shù)據(jù)融合,提高司機(jī)嚴(yán)重違法概率預(yù)測(cè)結(jié)果的合理性和精度; (2)與現(xiàn)有研究相比,通過(guò)考慮不同對(duì)象,增加了預(yù)警級(jí)別,建立了四級(jí)預(yù)警機(jī)制,充分利用不同面向?qū)ο蟮膶?shí)時(shí)反饋,提高預(yù)警結(jié)果的可靠性和有效性,同時(shí)保證救援的及時(shí)性。 后續(xù)研究工作將從以下幾方面進(jìn)行: (1)通過(guò)數(shù)據(jù)分析,自動(dòng)確定嚴(yán)重違法概率閾值,而非經(jīng)驗(yàn)設(shè)置; (2)考慮多種異常情況,例如網(wǎng)約車(chē)司機(jī)在出行沿線作案,改進(jìn)異常偏航距離比計(jì)算算法,在保證算法準(zhǔn)確度的基礎(chǔ)上提高算法靈敏度; (3)挖掘并還原更多的犯罪案件細(xì)節(jié),增加實(shí)驗(yàn)分析。4.2 結(jié)果分析
5 結(jié)束語(yǔ)
中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版)2021年4期
——大湄公河流域樣本定性研究