• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于文本挖掘的道路交通事故風(fēng)險(xiǎn)因素分析

      2023-09-25 07:23:32李興兵
      智能城市 2023年8期
      關(guān)鍵詞:案情詞庫(kù)分詞

      李興兵

      (1.湖南交通工程學(xué)院,湖南 衡陽(yáng) 421001;2.湖南信息學(xué)院,湖南 長(zhǎng)沙 410151)

      隨著我國(guó)交通運(yùn)輸體系信息化程度不斷提升,特別是大數(shù)據(jù)、云計(jì)算、人工智能等信息技術(shù)在交通管理領(lǐng)域的廣泛應(yīng)用,使道路交通管理模式逐漸從傳統(tǒng)的現(xiàn)場(chǎng)管控、事后管控、人工管控,逐漸轉(zhuǎn)為以交通態(tài)勢(shì)實(shí)時(shí)采集、預(yù)先研判、提前干預(yù)為主的智能化交通管控模式,交通管理大數(shù)據(jù)的采集、存儲(chǔ)、融合、開(kāi)發(fā)、利用成為提升道路交通安全管理水平新的增長(zhǎng)點(diǎn)。從交通管理業(yè)務(wù)數(shù)據(jù)中挖掘有效信息,識(shí)別易導(dǎo)致交通事故的高風(fēng)險(xiǎn)交通要素,成為當(dāng)前控制道路交通事故率、提升道路交通安全水平亟待解決的現(xiàn)實(shí)問(wèn)題。通過(guò)應(yīng)用文本挖掘技術(shù),從道路交通事故案情文本數(shù)據(jù)中識(shí)別出易導(dǎo)致交通事故的交通參與者及其不規(guī)范交通行為,是提升交通管理大數(shù)據(jù)開(kāi)發(fā)利用水平的重要突破點(diǎn)。

      1 道路交通事故案情文本挖掘需求

      從道路交通事故數(shù)據(jù)產(chǎn)生和積累情況來(lái)看,目前道路交通管理主要側(cè)重對(duì)機(jī)動(dòng)車(chē)及其駕駛?cè)说淖坟?zé)和處理,對(duì)道路交通事故中涉及的非機(jī)動(dòng)車(chē)因素分析,如行人隨意橫穿公路等非駕人員交通行為以及未進(jìn)入機(jī)動(dòng)車(chē)管理系統(tǒng)的共享單車(chē)、電動(dòng)車(chē)、三輪車(chē)等非機(jī)動(dòng)車(chē)輛的不規(guī)范駕駛等因素,沒(méi)有形成結(jié)構(gòu)化存儲(chǔ)和管理,只是融合在用于描述道路交通事故案情的文本數(shù)據(jù)中。如何對(duì)非結(jié)構(gòu)化的文本數(shù)據(jù)進(jìn)行挖掘分析,得出能夠支撐道路交通事故風(fēng)險(xiǎn)分析的有價(jià)值信息,是當(dāng)前道路交通事故數(shù)據(jù)分析利用的一個(gè)難點(diǎn)?;谝陨闲枨?,需要研究實(shí)現(xiàn)針對(duì)道路交通事故案情文本數(shù)據(jù)的挖掘分析方法,通過(guò)文本分詞、文本分類(lèi)、自動(dòng)識(shí)別,將交通事故案情文本數(shù)據(jù)中蘊(yùn)含的非機(jī)動(dòng)車(chē)涉事車(chē)輛、行人及其交通違法行為等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行標(biāo)識(shí),識(shí)別出交管執(zhí)法中信息錄入不完整,但實(shí)際上引發(fā)交通事故的潛在風(fēng)險(xiǎn)因素,支撐道路交通事故的致因要素分析和管控。道路交通事故案情文本數(shù)據(jù)中“跑步橫過(guò)馬路”“道路右側(cè)橫過(guò)”“無(wú)號(hào)牌電動(dòng)車(chē)”等是需要通過(guò)非結(jié)構(gòu)化文本數(shù)據(jù)挖掘技術(shù)識(shí)別出來(lái)的易導(dǎo)致交通事故因素,而在交管執(zhí)法認(rèn)定的違法行為記錄情況數(shù)據(jù)中,通常沒(méi)有對(duì)上述因素的結(jié)構(gòu)化記錄。因此,需要通過(guò)對(duì)交通事故案情文本數(shù)據(jù)進(jìn)行挖掘分析,對(duì)其進(jìn)行自動(dòng)化識(shí)別和統(tǒng)計(jì)分析。

      2 道路交通事故案情文本分詞方法

      2.1 分詞方法概述

      文本挖掘(TM)又稱(chēng)文本數(shù)據(jù)挖掘(TDM),指為發(fā)現(xiàn)知識(shí)從文本數(shù)據(jù)中抽取隱含的、以前未知的潛在有用模式的過(guò)程[1-3]。其中,文本分詞技術(shù)是進(jìn)行文本挖掘和特征提取的基礎(chǔ)性工作[4]。解決道路交通事故案情文本數(shù)據(jù)挖掘問(wèn)題,關(guān)鍵在于采用合適的中文分詞算法,將半結(jié)構(gòu)化、非結(jié)構(gòu)化的交通事故案情文本數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化的特征描述數(shù)據(jù),在此基礎(chǔ)上識(shí)別容易導(dǎo)致道路交通事故的潛在風(fēng)險(xiǎn)因素。目前主流的中文文本分詞方法包括基于詞庫(kù)的分詞算法和無(wú)詞典的分詞技術(shù)[5]。基于詞庫(kù)的分詞算法基本思路是構(gòu)建領(lǐng)域關(guān)鍵詞詞庫(kù),按照一定的規(guī)則將待處理文本與詞庫(kù)中的關(guān)鍵詞進(jìn)行匹配,得到對(duì)待處理文本的結(jié)構(gòu)化分詞匹配結(jié)果,其優(yōu)勢(shì)在于直觀簡(jiǎn)單,可以根據(jù)業(yè)務(wù)的需求靈活構(gòu)建和維護(hù)領(lǐng)域關(guān)鍵詞詞庫(kù),不斷優(yōu)化分詞效果,缺點(diǎn)是分詞效果依賴(lài)領(lǐng)域詞庫(kù)是否完善,分詞方法具有領(lǐng)域?qū)S眯浴?/p>

      無(wú)詞典分詞技術(shù)包括基于統(tǒng)計(jì)的分詞方法、基于理解的分詞方法[6]?;诮y(tǒng)計(jì)的分詞方法基本思路是基于一定的語(yǔ)法規(guī)則構(gòu)建語(yǔ)言模型,對(duì)待處理文本進(jìn)行無(wú)差別字詞劃分,對(duì)劃分結(jié)果采用隱馬爾可夫(HMM)或條件隨機(jī)場(chǎng)(CRF)等算法進(jìn)行概率統(tǒng)計(jì),將概率最大的分詞方式作為最終分詞結(jié)果?;诶斫獾姆衷~方法通過(guò)引入機(jī)器學(xué)習(xí)方法,基于樣本語(yǔ)料庫(kù)對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,構(gòu)建神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)對(duì)大規(guī)模語(yǔ)料的自動(dòng)化分詞。無(wú)詞典分詞技術(shù)的優(yōu)勢(shì)在于分詞效果受領(lǐng)域詞庫(kù)的影響較小,分詞方法具有普適性,能夠較好地處理新詞和消除歧義,適合對(duì)大規(guī)模語(yǔ)料庫(kù)的分詞處理,缺點(diǎn)是分詞算法的訓(xùn)練過(guò)程要依賴(lài)大量的樣本語(yǔ)料庫(kù),算法訓(xùn)練和運(yùn)行對(duì)計(jì)算資源要求較高。

      本文研究道路交通事故案情文本分詞與特征提取,目的是解決交通管理中的潛在風(fēng)險(xiǎn)因素識(shí)別問(wèn)題,通過(guò)對(duì)交通管理部門(mén)重點(diǎn)關(guān)注的交通參與者、不規(guī)范交通行為等進(jìn)行調(diào)研和統(tǒng)計(jì),可以建立較為完善的領(lǐng)域關(guān)鍵詞詞庫(kù)。因此,適合采用基于詞庫(kù)的分詞算法解決道路交通事故案情文本分詞問(wèn)題。

      2.2 道路交通事故案情文本分詞算法框架

      第一,從道路交通事故數(shù)據(jù)庫(kù)中讀取待挖掘分析的道路交通案情文本數(shù)據(jù);第二,采用jieba分詞庫(kù)中的posseg模塊對(duì)案情文本數(shù)據(jù)進(jìn)行分詞處理,同時(shí)標(biāo)注詞性;第三,參照交通管理部門(mén)業(yè)務(wù)調(diào)研形成的交通參與者業(yè)務(wù)詞庫(kù)、交通違法行為業(yè)務(wù)詞庫(kù),對(duì)道路交通案情文本數(shù)據(jù)分詞及詞性標(biāo)注結(jié)果數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,提取出道路交通事故涉及的交通參與者數(shù)據(jù)、交通違法行為數(shù)據(jù);第四,分別對(duì)涉交通事故的交通參與者、易導(dǎo)致交通事故的交通違法行為進(jìn)行統(tǒng)計(jì)分析;第五,基于統(tǒng)計(jì)分析結(jié)果數(shù)據(jù)識(shí)別易導(dǎo)致交通事故的潛在風(fēng)險(xiǎn)因素,建立交通事故潛在風(fēng)險(xiǎn)因素?cái)?shù)據(jù)庫(kù),對(duì)結(jié)果進(jìn)行分析與可視化展示,形成可供相關(guān)部門(mén)參考的決策建議。道路交通事故案情文本分詞算法框架如圖1所示。

      圖1 道路交通事故案情文本分詞算法框架

      3 道路交通事故案情文本挖掘示例

      本研究基于python編程語(yǔ)言實(shí)現(xiàn)道路交通事故案情文本分詞算法框架,采用jieba分詞模塊中的中文分詞算法[7],對(duì)較大以上事故的簡(jiǎn)要案情文本數(shù)據(jù)進(jìn)行挖掘分析。較大以上事故一般指發(fā)生了人員傷亡的道路交通事故,容易導(dǎo)致人身傷害、財(cái)產(chǎn)損失等嚴(yán)重后果。通過(guò)分析導(dǎo)致該類(lèi)交通事故的交通參與者及其交通違法行為等潛在風(fēng)險(xiǎn)因素,可以為交通管理部門(mén)明確工作重點(diǎn)、提升道路交通安全管理水平提供有價(jià)值的輔助決策信息。

      本研究采集H省2019年第四季度發(fā)生的較大以上道路交通事故數(shù)據(jù)作為示例數(shù)據(jù),采集的道路交通事故數(shù)據(jù)包含事故編號(hào)、事故發(fā)生時(shí)間、事故發(fā)生地點(diǎn)、事故簡(jiǎn)要案情等列。通過(guò)對(duì)“事故簡(jiǎn)要案情”列的道路交通事故案情文本數(shù)據(jù)進(jìn)行挖掘分析,可以提取和分析容易導(dǎo)致較大以上道路交通事故的交通參與者類(lèi)型及其交通違法行為等信息,將其作為關(guān)鍵詞,識(shí)別為容易導(dǎo)致較大以上道路交通事故的風(fēng)險(xiǎn)因素。道路交通事故案文本挖掘分析統(tǒng)計(jì)如表1所示。

      表1 道路交通事故案情文本挖掘分析統(tǒng)計(jì) 單位:起

      發(fā)生較大以上交通事故的交通參與者類(lèi)型中,排名前10位的交通參與者包括摩托車(chē)、行人、貨車(chē)、轎車(chē)、客車(chē)、無(wú)牌車(chē)等。其中,摩托車(chē)、行人、無(wú)牌車(chē)、電動(dòng)車(chē)、自行車(chē)、三輪車(chē)這幾類(lèi)事故高發(fā)的交通參與者,在機(jī)動(dòng)車(chē)數(shù)據(jù)庫(kù)中沒(méi)有實(shí)現(xiàn)完全的結(jié)構(gòu)化數(shù)據(jù)管理,是道路交通安全管控中的難點(diǎn),應(yīng)引起交通管理部門(mén)的重點(diǎn)關(guān)注。

      導(dǎo)致較大以上事故發(fā)生的交通違法行為中,排名前10位的交通違法行為包括行人或非機(jī)動(dòng)車(chē)橫過(guò)馬路、橫穿公路、機(jī)動(dòng)車(chē)倒車(chē)、機(jī)動(dòng)車(chē)駕駛?cè)顺傩旭偟刃袨?。其中,橫過(guò)/橫穿公路、逆向行駛、行人跑步過(guò)公路等行為,屬于非機(jī)動(dòng)車(chē)駕駛?cè)说慕煌ㄟ`法行為,通常沒(méi)有對(duì)其進(jìn)行專(zhuān)門(mén)的結(jié)構(gòu)化錄入和管理,只是在交通事故簡(jiǎn)要案情文本中有所體現(xiàn)。從交通事故預(yù)防的角度來(lái)說(shuō),交通管理部門(mén)不能僅著眼于記錄和管控機(jī)動(dòng)車(chē)駕駛?cè)说慕煌ㄟ`法行為,對(duì)于非駕駛?cè)说慕煌▍⑴c者違法行為也應(yīng)出臺(tái)相應(yīng)的管控措施,實(shí)現(xiàn)對(duì)交通事故的精準(zhǔn)防控。

      為了方便把握易導(dǎo)致交通事故的風(fēng)險(xiǎn)因素,明確道路交通管理重點(diǎn),可以繪制容易導(dǎo)致較大以上道路交通事故的高頻風(fēng)險(xiǎn)因素詞云圖[8],對(duì)其進(jìn)行直觀展示。借助熱點(diǎn)詞云圖能夠直觀展示交通事故頻發(fā)的交通參與者類(lèi)型、易導(dǎo)致交通事故頻發(fā)的交通違法行為,可以輔助交通管理部門(mén)更方便快捷地明確易導(dǎo)致較大以上交通事故發(fā)生的風(fēng)險(xiǎn)因素,提高道路交通安全管理的針對(duì)性和工作效率。

      4 結(jié)語(yǔ)

      基于文本挖掘算法對(duì)道路交通事故案情文本數(shù)據(jù)進(jìn)行挖掘分析,可以有效提取信息,實(shí)現(xiàn)交通事故風(fēng)險(xiǎn)因素結(jié)構(gòu)化數(shù)據(jù)的描述、統(tǒng)計(jì)和分析,輔助交通管理部門(mén)管控道路交通安全風(fēng)險(xiǎn),提高道路交通管理的針對(duì)性和準(zhǔn)確性,實(shí)現(xiàn)對(duì)交通管理大數(shù)據(jù)的進(jìn)一步利用。本研究目前主要實(shí)現(xiàn)了對(duì)非駕駛?cè)私煌▍⑴c者及其交通違法行為兩類(lèi)風(fēng)險(xiǎn)因素的挖掘和提取。后續(xù)可以考慮引入關(guān)聯(lián)規(guī)則挖掘算法,對(duì)交通參與者及其交通違法行為與道路交通事故發(fā)生概率進(jìn)一步挖掘和統(tǒng)計(jì),形成量化描述,提升道路交通事故風(fēng)險(xiǎn)識(shí)別的科學(xué)性和準(zhǔn)確性。

      猜你喜歡
      案情詞庫(kù)分詞
      結(jié)巴分詞在詞云中的應(yīng)用
      是誰(shuí)下的毒
      值得重視的分詞的特殊用法
      詞庫(kù)音系學(xué)的幾個(gè)理論問(wèn)題芻議
      報(bào)案者
      “兩高”刑事指導(dǎo)性案例的文本分析及改進(jìn)
      環(huán)境變了,詞庫(kù)別變
      電腦迷(2014年14期)2014-04-29 00:44:03
      高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
      QQ手機(jī)輸入法如何導(dǎo)入分類(lèi)詞庫(kù)
      電腦迷(2012年15期)2012-04-29 17:09:47
      論英語(yǔ)不定式和-ing分詞的語(yǔ)義傳承
      冷水江市| 黎城县| 新晃| 保康县| 灵寿县| 大兴区| 托里县| 阿城市| 雅江县| 确山县| 小金县| 宜宾县| 衡阳市| 新营市| 迭部县| 沙湾县| 工布江达县| 赞皇县| 彭泽县| 砀山县| 兴山县| 贵阳市| 教育| 定兴县| 霞浦县| 宜兰市| 南宫市| 洞头县| 石台县| 大悟县| 蓝田县| 赤壁市| 昌都县| 天津市| 金乡县| 崇明县| 凌云县| 临泽县| 胶南市| 定襄县| 巍山|