為預(yù)防和減少道路交通事故的發(fā)生,各地公安交通管理部門(mén)全力開(kāi)展交通安全隱患排查整治攻堅(jiān)行動(dòng),與此同時(shí),隨著全國(guó)公安交通管理部門(mén)持續(xù)推廣大數(shù)據(jù)和人工智能技術(shù)應(yīng)用,形成了一些實(shí)戰(zhàn)的數(shù)據(jù)模型,用于道路交通管控、風(fēng)險(xiǎn)預(yù)測(cè)、執(zhí)勤執(zhí)法和監(jiān)管服務(wù)。在此背景之下,利用交管大數(shù)據(jù)開(kāi)展交通安全隱患對(duì)象的排查,包括對(duì)隱患駕駛?cè)?、?chē)輛、道路及重點(diǎn)企業(yè)的研判,是一項(xiàng)值得探索和實(shí)踐的工作。
構(gòu)建包括駕駛?cè)?、?chē)輛、企業(yè)、道路、事故、違法等核心交通管理要素的全息檔案??紤]到這些對(duì)象的登記信息、業(yè)務(wù)辦理記錄、道路過(guò)車(chē)記錄等分散在不同的信息系統(tǒng)內(nèi),而不同對(duì)象之間具有關(guān)聯(lián)性,因此將每個(gè)對(duì)象的所有信息經(jīng)過(guò)數(shù)據(jù)治理、標(biāo)簽畫(huà)像構(gòu)建關(guān)系圖譜,綜合各類(lèi)信息形成全息檔案。其中,標(biāo)簽是對(duì)某一對(duì)象的基本屬性、違法行為、事故行為等維度進(jìn)行畫(huà)像得到的,如重型貨車(chē)、頻繁違法、多次傷人事故等,能夠清晰地了解該對(duì)象的特征,可以按照標(biāo)簽組合的形式進(jìn)行查詢(xún),快速定位到符合特定標(biāo)簽特征的對(duì)象。以車(chē)輛全息檔案為例,每輛機(jī)動(dòng)車(chē)的檔案中包括基本信息、車(chē)主、標(biāo)簽、風(fēng)險(xiǎn)評(píng)價(jià)、關(guān)系分析、車(chē)輛軌跡、活躍時(shí)段分析以及各種業(yè)務(wù)辦理記錄。車(chē)輛的關(guān)系分析中包括了與人的駕乘、登記、違法處理關(guān)系,與企業(yè)的從屬關(guān)系以及與違法、事故之間的關(guān)聯(lián)關(guān)系等。關(guān)系圖譜可以幫助交通管理部門(mén)更便捷地洞察不同對(duì)象之間的關(guān)聯(lián)性,有助于打破數(shù)據(jù)孤島,便于快速掌握一個(gè)對(duì)象的全面信息,并可以通過(guò)關(guān)系圖譜逐層挖掘、溯源,為隱患對(duì)象研判奠定數(shù)據(jù)底座。
1.隱患車(chē)輛研判。隱患車(chē)輛主要包括非法改裝車(chē)輛、疑似超員車(chē)輛、逾期未報(bào)廢或未年檢的重點(diǎn)車(chē)輛、頻繁違法或事故車(chē)輛等。
(1)非法改裝車(chē)輛研判。在海量車(chē)輛過(guò)車(chē)圖像的基礎(chǔ)上,利用AI圖像識(shí)別技術(shù)可以識(shí)別非法加裝燈帶的大貨車(chē)。這一方法需要提前采集大量的素材,通過(guò)AI算法訓(xùn)練,得到準(zhǔn)確的圖像識(shí)別算法?;诳诘母咔遄ヅ膱D像,通過(guò)AI圖像識(shí)別技術(shù),分析車(chē)輛特征,比對(duì)研判是否疑似加裝燈帶的車(chē)輛。對(duì)于加裝燈帶導(dǎo)致車(chē)輛號(hào)牌無(wú)法識(shí)別的,可以通過(guò)以圖搜圖技術(shù),識(shí)別出號(hào)牌正常且外觀特征高度相似的車(chē)輛,根據(jù)車(chē)輛的全息檔案和關(guān)系圖譜快速找到車(chē)主,獲取車(chē)輛日常軌跡特征,便于攔截處罰(見(jiàn)圖1)。
圖1 非法加裝燈帶大貨車(chē)識(shí)別
對(duì)于車(chē)輛輪廓超限的車(chē)輛,主要利用前端卡口抓拍圖像和激光檢測(cè)輪廓數(shù)據(jù),結(jié)合車(chē)管庫(kù)信息進(jìn)行研判。在監(jiān)測(cè)點(diǎn),采用卡口抓拍車(chē)輛過(guò)車(chē)圖像,經(jīng)結(jié)構(gòu)化后獲得車(chē)牌號(hào)、車(chē)型、顏色、品牌等特征數(shù)據(jù),采用橫縱激光檢測(cè)單元掃描車(chē)輛采集輪廓數(shù)據(jù),包括長(zhǎng)度、寬度、高度及欄板高度,通過(guò)匹配車(chē)輛輪廓數(shù)據(jù)與車(chē)輛特征數(shù)據(jù),與交通運(yùn)輸部規(guī)定的超限標(biāo)準(zhǔn)閾值比對(duì),可判定車(chē)輛是否超限;與車(chē)管庫(kù)數(shù)據(jù)比對(duì),可對(duì)涉嫌非法加高欄板的非法改裝進(jìn)行研判。
(2)疑似超員車(chē)輛研判。對(duì)于疑似超員車(chē)輛,主要針對(duì)高速、國(guó)省道的場(chǎng)景,可以利用卡口牌識(shí)信息和手機(jī)信令數(shù)據(jù),采用定點(diǎn)時(shí)空分析的方法進(jìn)行研判(見(jiàn)圖2)。通過(guò)間隔一定距離的多個(gè)監(jiān)測(cè)點(diǎn),每個(gè)監(jiān)測(cè)點(diǎn)利用前端卡口采集車(chē)輛號(hào)牌信息、車(chē)碼采集器采集手機(jī)IMSI信息及經(jīng)過(guò)時(shí)間,通過(guò)多點(diǎn)數(shù)據(jù)的碰撞比對(duì),獲取通過(guò)各監(jiān)測(cè)點(diǎn)的相同目標(biāo),作為車(chē)輛實(shí)載人數(shù),再根據(jù)車(chē)牌號(hào)與車(chē)管庫(kù)中車(chē)輛核載人數(shù)比對(duì)。若實(shí)載人數(shù)大于核載人數(shù),則為疑似超員車(chē)輛。
圖2 超員車(chē)輛監(jiān)測(cè)點(diǎn)示意圖
(3)逾期未報(bào)廢或未年檢的重點(diǎn)車(chē)輛、頻繁違法或事故車(chē)輛的研判。利用信息網(wǎng)中的車(chē)管庫(kù)數(shù)據(jù)、違法數(shù)據(jù)和事故數(shù)據(jù),通過(guò)信息的篩選、數(shù)據(jù)的碰撞,判定是否符合業(yè)務(wù)規(guī)則,符合的車(chē)輛即為需要重點(diǎn)關(guān)注的隱患車(chē)輛。例如根據(jù)事故數(shù)據(jù),可統(tǒng)計(jì)得到一年內(nèi)發(fā)生事故3次以上且事故責(zé)任為同責(zé)以上的車(chē)輛,這些車(chē)輛即為頻繁事故車(chē)輛,存在較大的安全風(fēng)險(xiǎn)。
2.隱患駕駛?cè)搜信小k[患駕駛?cè)酥饕ㄓ馄谖磽Q證或未審驗(yàn)以及頻繁違法、多次嚴(yán)重違法或頻繁發(fā)生交通事故的人員。研判方法同車(chē)輛類(lèi)似,通過(guò)數(shù)據(jù)比對(duì)、信息篩選判定隱患駕駛?cè)?,通過(guò)打上對(duì)應(yīng)的標(biāo)簽,按照標(biāo)簽可以快速查找對(duì)應(yīng)類(lèi)型的隱患駕駛?cè)恕?/p>
3.隱患企業(yè)研判。隱患企業(yè)主要是隱患車(chē)輛較多的企業(yè),根據(jù)隱患車(chē)輛的所屬關(guān)系,可溯源隱患企業(yè),進(jìn)行源頭治理。為了對(duì)企業(yè)的安全風(fēng)險(xiǎn)進(jìn)行綜合的研判,可以基于交管大數(shù)據(jù)從企業(yè)狀態(tài)、車(chē)證核驗(yàn)、交通違法、交通事故和文明行為這五個(gè)維度出發(fā),通過(guò)特征積分方式對(duì)企業(yè)進(jìn)行量化的綜合安全風(fēng)險(xiǎn)評(píng)價(jià),確定企業(yè)風(fēng)險(xiǎn)等級(jí),將風(fēng)險(xiǎn)等級(jí)較高的列為隱患企業(yè)。根據(jù)綜合評(píng)價(jià),當(dāng)企業(yè)名下的車(chē)輛和駕駛?cè)说能?chē)證核驗(yàn)情況比較拖沓,發(fā)生的違法和事故比較多,表示該企業(yè)的安全風(fēng)險(xiǎn)是比較大的。
4.隱患道路研判。隱患道路主要是事故多發(fā)點(diǎn)段,大多存在交通安全設(shè)施不到位、交通組織設(shè)計(jì)不合理、違法監(jiān)管缺失等問(wèn)題。對(duì)隱患點(diǎn)段的研判,可以綜合利用交通事故和違法數(shù)據(jù),基于自然語(yǔ)言處理的地址解析技術(shù)對(duì)事故地點(diǎn)和違法地點(diǎn)進(jìn)行解析,獲取地點(diǎn)的經(jīng)緯度。每個(gè)路口、路段的事故數(shù)、違法數(shù)及詳細(xì)的類(lèi)型可以基于統(tǒng)一的時(shí)空基準(zhǔn)進(jìn)行統(tǒng)計(jì)和分析,通過(guò)圖上研判,能夠直觀地看出違法和事故數(shù)據(jù)的時(shí)空分布。對(duì)于事故數(shù)據(jù),相對(duì)比較客觀地反映了一個(gè)地點(diǎn)發(fā)生的事故數(shù)量(除去未報(bào)案的事故沒(méi)有記錄)。對(duì)于違法數(shù)據(jù),由于非現(xiàn)場(chǎng)執(zhí)法的違法數(shù)據(jù)反映了電子警察抓拍的違法情況,現(xiàn)場(chǎng)執(zhí)法的違法數(shù)據(jù)一定程度上反映了路面執(zhí)勤民警的覆蓋情況,因此違法數(shù)據(jù)較少的地點(diǎn)則說(shuō)明缺少現(xiàn)場(chǎng)和非現(xiàn)場(chǎng)的違法監(jiān)管。于是,通過(guò)圖上研判,可以識(shí)別出事故多違法少、事故多違法也多的地點(diǎn),這些地點(diǎn)或是交通設(shè)計(jì)存在問(wèn)題,或是缺少違法監(jiān)管,路口隱患嚴(yán)重,需要重點(diǎn)關(guān)注和治理。
對(duì)于非法改裝大貨車(chē)、疑似超員車(chē)輛等隱患人、車(chē),當(dāng)前端感知設(shè)備采集數(shù)據(jù)并經(jīng)后端算法研判為疑似隱患車(chē)輛后,通過(guò)系統(tǒng)預(yù)警,追蹤到車(chē)輛出現(xiàn)的位置,根據(jù)軌跡預(yù)測(cè),由交警指揮中心調(diào)動(dòng)警力在下游位置實(shí)施攔截查處,現(xiàn)場(chǎng)進(jìn)行處罰和教育。
關(guān)系圖譜是通過(guò)物信融合、圖數(shù)據(jù)庫(kù)、可視分析等技術(shù),將接入的標(biāo)準(zhǔn)化數(shù)據(jù)按圖數(shù)據(jù)庫(kù)方式進(jìn)行關(guān)聯(lián)、時(shí)空分析,計(jì)算多種配置條件下關(guān)鍵要素之間的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)數(shù)據(jù)底層關(guān)聯(lián),形成龐大的關(guān)系圖譜。關(guān)系圖譜支持多層拓展,可以實(shí)現(xiàn)數(shù)據(jù)由“點(diǎn)”到“線(xiàn)”、到“面”、再到“多維”的逐層關(guān)系演進(jìn),同時(shí)支持通過(guò)可視化技術(shù)進(jìn)行交互和展示,可以更便捷地洞察多維數(shù)據(jù)背后不同對(duì)象之間的關(guān)聯(lián)性,深度挖掘?qū)ο箝g的關(guān)系,進(jìn)一步提高數(shù)據(jù)分析、挖掘和情報(bào)研判的效率。在交通管理領(lǐng)域中,各對(duì)象之間的關(guān)系主要是人、車(chē)、企、道路、違法、事故之間的關(guān)系,在其他部門(mén)數(shù)據(jù)支撐下,還可拓展車(chē)、保險(xiǎn)公司、維修廠(chǎng)家等關(guān)系。
特征積分是以積分引擎為基礎(chǔ),結(jié)合對(duì)象的特征規(guī)則,利用積分算法對(duì)對(duì)象的特征積分進(jìn)行計(jì)算,可用于一個(gè)對(duì)象的多維評(píng)價(jià)。一個(gè)對(duì)象的特征可以分為多個(gè)維度,每個(gè)維度包含多個(gè)特征單項(xiàng)。特征單項(xiàng)根據(jù)特征規(guī)則從對(duì)象的相關(guān)數(shù)據(jù)中進(jìn)行提取,每個(gè)單項(xiàng)可以設(shè)定最大、最小閾值和分別對(duì)應(yīng)的分值。一個(gè)積分運(yùn)算可對(duì)不同維度、特征單項(xiàng)賦予不同的權(quán)重、閾值等,最后采用加權(quán)平均和加權(quán)求和的方式計(jì)算對(duì)象的特征積分值。特征積分服務(wù)提供積分運(yùn)算能力,可以提供執(zhí)行策略,定時(shí)批量執(zhí)行計(jì)算任務(wù)。根據(jù)特征積分得到的結(jié)果,可以為不同對(duì)象的研判、標(biāo)簽畫(huà)像等提供數(shù)據(jù)支撐。
由于類(lèi)似事故和違法數(shù)據(jù)中涉及地點(diǎn)的描述存在不規(guī)范、無(wú)統(tǒng)一標(biāo)準(zhǔn)的情況,例如“江南大道江陵路口”和“江陵路江南大道交叉口”為同一路口的不同描述方式。因此對(duì)于數(shù)據(jù)中的非標(biāo)準(zhǔn)地址,采用基于自然語(yǔ)言處理(NLP)的地址解析技術(shù),將其轉(zhuǎn)化為標(biāo)準(zhǔn)化的地址,并根據(jù)地圖服務(wù)引擎獲取地址的經(jīng)緯度,從而可以用于數(shù)據(jù)空間分布的計(jì)算和圖上研判。通過(guò)標(biāo)準(zhǔn)地址轉(zhuǎn)換,能夠輸出自然語(yǔ)句中包含的道路名稱(chēng)、道路ID、路口/路段名、路口/路段ID及經(jīng)緯度信息。首先需要通過(guò)自然語(yǔ)言處理(NLP)對(duì)原始的事故、違法地址的描述做分詞工程處理,即將字符串通過(guò)分詞技術(shù)轉(zhuǎn)換為結(jié)構(gòu)化的詞語(yǔ)形式。然后再結(jié)合地址抽取和解析定位能力,實(shí)現(xiàn)將非結(jié)構(gòu)化的地址文本轉(zhuǎn)化為空間數(shù)據(jù),將目標(biāo)地址準(zhǔn)確的解析抽取出來(lái)。最后通過(guò)地圖服務(wù)實(shí)現(xiàn)事故和違法事件的定位,并支持道路名字、路口或路段名字、經(jīng)緯度等定位信息的輸出。
綜上,本文以人工智能圖像識(shí)別技術(shù)、關(guān)系圖譜、特征積分、地址解析等技術(shù)為支撐,采用了物信融合的數(shù)據(jù)匹配、基于業(yè)務(wù)規(guī)則的數(shù)據(jù)碰撞、多維綜合評(píng)價(jià)和圖上研判等方法,可以提高交通管理部門(mén)隱患排查的效率和精準(zhǔn)性。但在實(shí)踐的過(guò)程中發(fā)現(xiàn),研判的準(zhǔn)確性和可靠性與數(shù)據(jù)質(zhì)量有著密切的關(guān)系,例如卡口抓拍圖片的有效性、準(zhǔn)確性、地址錄入的規(guī)范性等。因此,在未來(lái)依賴(lài)大數(shù)據(jù)的分析研判應(yīng)用中,需要制定一套標(biāo)準(zhǔn)和規(guī)范的數(shù)據(jù)治理流程和方法,并且貼合每一類(lèi)數(shù)據(jù)的特征,保證有效的數(shù)據(jù)為分析所用。