• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向涉毒案件案情及行為序列可視化方法研究

      2023-12-11 07:11:14單志華黃瑞章段錫輝陳艷平秦永彬
      計算機(jī)工程與應(yīng)用 2023年23期
      關(guān)鍵詞:案情可視化語義

      單志華,黃瑞章,段錫輝,陳艷平,秦永彬

      1.貴州大學(xué) 公共大數(shù)據(jù)國家重點實驗室,貴陽 550025

      2.貴州大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院,貴陽 550025

      根據(jù)2021 年中國毒品形勢報告顯示,我國涉毒類案件呈現(xiàn)以下新變化:在冊吸毒人員不斷增加,新型合成毒品濫用人員不斷增加,吸毒人員存在低齡化、多元化,毒品種類多樣化。毒品犯罪已成為對社會安定產(chǎn)生巨大威脅的犯罪之一,引發(fā)了越來越多的人對于涉毒案件研究的關(guān)注。當(dāng)前的涉毒案件中的案件數(shù)量不斷增加、案件內(nèi)容繁復(fù),為司法及公安人員快速直觀了解案件內(nèi)容和案件中存在的規(guī)律帶來了困難。如何幫助司法人員簡潔直觀地了解案件案情信息和發(fā)現(xiàn)涉毒人員行為規(guī)律,成為司法領(lǐng)域可視化中的難點和痛點。因此對于案件可視化分析處理能力提出了更高的要求。

      文本可視化[1-6]是通過可視化技術(shù)幫助用戶了解文本中信息。涉毒案件案情可視化是對單個案件案情文本內(nèi)容進(jìn)行可視化,幫助快速了解案件發(fā)展過程。使用傳統(tǒng)的文本可視化方法將會丟失案件中重要語義信息,并且不能展示案情的發(fā)展脈絡(luò)。序列可視化[7-12]是通過序列模式挖掘和可視化展示序列中的規(guī)律和序列之間的差異性等。傳統(tǒng)的序列可視化方法大都是針對序列中節(jié)點類型較少、序列之間差異性較小的開展。而本文由多個涉毒案件案情抽取獲得的多個犯罪行為序列(涉毒類案件中行為詞構(gòu)建而成的序列)節(jié)點類型較多,序列差異性較大,傳統(tǒng)方法不能處理。

      對于單個涉毒案件案情文本可視化存在以下困難:案件內(nèi)容信息過多,全部展現(xiàn)將給使用者帶來視覺干擾,展現(xiàn)內(nèi)容信息過少或缺失內(nèi)容之間的聯(lián)系,將給理解案件內(nèi)容帶來大量誤差,將丟失案件中大量的語義。如何對案件信息詳略得當(dāng)?shù)乜梢暬⑶夷鼙A粑谋局兄匾Z義將成為關(guān)鍵。

      對于從多個涉毒案件案情中發(fā)現(xiàn)犯罪人員行為規(guī)律存在以下困難:犯罪人員行為詞中存在同一含義的行為被表示成不同行為詞,將導(dǎo)致行為詞的種類繁多,進(jìn)而導(dǎo)致序列中節(jié)點類型多、序列之間差異性大。這為發(fā)現(xiàn)犯罪行為序列的共性帶來困難。

      基于上面提出的兩個問題,本文提出一種面向涉毒案件案情及行為序列的可視化方法。該方法對單個案件案情內(nèi)容采用案情描述圖進(jìn)行可視化,挖掘多個案件中的犯罪行為序列模式并可視化。從單個案件到多個案件對案件進(jìn)行不同維度探索。本文主要貢獻(xiàn)如下:

      (1)設(shè)計了一個探究案件案情中犯罪行為序列模式及案情文本概述的可視化系統(tǒng)。在真實司法數(shù)據(jù)上對方法進(jìn)行驗證,用戶訪談證明了系統(tǒng)和方法的有效性。

      (2)提出一種文本可視化方法,以“先后關(guān)系、主次關(guān)系”為核心思想進(jìn)行設(shè)計,將案情文本按時間先后順序構(gòu)建成由核心信息和次要信息組成的案情描述圖。解決傳統(tǒng)文本可視化中丟失文本重要語義及語義先后順序的問題。

      (3)提出一種序列可視化方法,構(gòu)建相似節(jié)點樹,根據(jù)用戶的喜好選取相似節(jié)點樹中與案件法條之間關(guān)聯(lián)密切的節(jié)點進(jìn)行相似節(jié)點合并,并使用序列模式挖掘算法發(fā)現(xiàn)序列中存在的模式并進(jìn)行可視化。解決傳統(tǒng)序列可視化不能處理序列中節(jié)點類型多、序列差異性大的問題。

      1 相關(guān)工作

      1.1 文本可視化

      文本可視化[1]是通過圖形展示文本中的信息,是幫助對文本內(nèi)容理解的重要工具。文本可視化廣泛應(yīng)用于新聞文本、微博文本等數(shù)據(jù)進(jìn)行可視化。

      基于關(guān)鍵詞的文本可視化是提取文本中關(guān)鍵詞信息進(jìn)行可視化布局用以快速了解文本信息。Docu-Burst[2]將文本關(guān)鍵詞組成徑向布局,徑向中外層布局是內(nèi)層詞的下位詞,同時使用顏色對詞頻進(jìn)行編碼。Document Cards[3]將提取的關(guān)鍵詞與關(guān)鍵圖片結(jié)合起來展現(xiàn)文本內(nèi)容,幫助快速了解新聞文本中存在的關(guān)鍵信息。基于文本關(guān)鍵詞的文本可視化,其主要思想是通過將文本內(nèi)容以標(biāo)簽或關(guān)鍵詞的形式進(jìn)行可視化布局,使用關(guān)鍵詞的字體大小、顏色、所處的視圖與中心位置距離來表示其重要性。但是這些方法都會嚴(yán)重缺失文本中上下文語義。這些文本可視化方法只關(guān)注關(guān)鍵詞的可視化,缺少關(guān)鍵詞之間的聯(lián)系,缺少語義補(bǔ)充說明,很大程度上缺失了上下文語義,給理解文本內(nèi)容帶來誤差。

      基于時間順序的文本可視化是指按文本中事件發(fā)生的時間先后順序?qū)ξ谋緝?nèi)容進(jìn)行可視化。適用于故事情節(jié)、新聞事件等隨時間變化的文本進(jìn)行可視化。SparkClouds[4]顯示關(guān)鍵詞隨時間的演變。ThemeRiver[5]主題河流是反映多個主題隨著時間的變化。StoryFlow[6]使用故事流表示隨著時間變化故事的發(fā)展過程,每條線表示一個人物線,故事發(fā)展過程中每個人物聯(lián)系,從而產(chǎn)生相交。但是這種時間順序的文本內(nèi)容可視化由于線條過多而給用戶造成大量的視覺干擾。主要反映的文本內(nèi)容隨時間的變化,缺少文本內(nèi)部的聯(lián)系。

      文本可視化中存在的交互操作,改變文本顏色、透明度、移動、縮放等交互方式。使用這些交互方式將為用戶探索提供便利。

      以上的文本可視化方法,為了解文本中信息提供便利,但是存在顯示內(nèi)容過多、造成視覺干擾,丟失文本中上下文的語義等問題。涉毒案件案情可視化需要有主次保留上下文語義、有時間脈絡(luò)地對案情進(jìn)行可視化。因此傳統(tǒng)文本可視化方法不能應(yīng)用于涉毒案件案情可視化。

      1.2 序列可視化

      序列可視化[7]是通過可視化技術(shù)和序列模式挖掘技術(shù)發(fā)現(xiàn)序列中存在規(guī)律并進(jìn)行展示。其廣泛應(yīng)用于電子健康記錄和app 應(yīng)用使用日志(EHRs,application log)等數(shù)據(jù)進(jìn)行序列可視化分析,幫助醫(yī)療領(lǐng)域?qū)ふ野l(fā)病的規(guī)律給決策提供幫助、發(fā)現(xiàn)用戶使用應(yīng)用習(xí)慣。

      單個序列進(jìn)行可視化分析,如Lifelines[8]、Cloud-Lines[9]、timeSlice[10]等針對單個序列且序列事件類型較少的情況進(jìn)行的序列可視化,著重于對單個序列中詳細(xì)信息進(jìn)行展示。但序列數(shù)量過多時將給用戶帶來較大的視覺干擾。

      多序列進(jìn)行可視化分析,用以解決序列數(shù)量過多造成可視化視覺混亂的問題。EventFlow[11]、TrailExplorer[12]和CoreFlow[13]通過從事件序列中挖掘并可視化為樹狀圖,如Sequen-C[14]將序列中相似的部分進(jìn)行歸并。

      序列可視化中存在交互操作,LifeLines2[15]、DecisionFlow[16]、MAQUI[17]、COQUITO[18]等使用了序列查詢、序列對齊等交互方式。這些交互方式提升用戶的探索效率。

      以上的交互式序列可視化方法是針對節(jié)點類型較少序列差異性小的序列進(jìn)行可視化并為探索序列中信息提供了便利。而本文的數(shù)據(jù)是節(jié)點類型多、序列差異性大的序列,傳統(tǒng)方法無法解決這個問題。

      1.3 智慧司法

      智慧司法是通過科學(xué)技術(shù)為司法領(lǐng)域賦能,推動司法領(lǐng)域不斷向前發(fā)展。

      當(dāng)前的北大法寶、中國裁判文書網(wǎng)等網(wǎng)站為研究司法案件提供了數(shù)據(jù)基礎(chǔ)。司法案件數(shù)據(jù)不斷積累、案件內(nèi)容復(fù)雜。呂帥等[19]通過可視化分析,探究我國刑事政策知識演化過程。王慧等[20]、陳建峽等[21]通過文檔圖譜視圖提取案情文本特征構(gòu)建案情圖譜,但是圖譜會丟失了案件中重要的語義。當(dāng)前面向司法領(lǐng)域的案件內(nèi)容可視化分析的研究工作較少。挖掘案件存在的犯罪模式,張?zhí)旆驳萚22]使用社區(qū)監(jiān)測算法挖掘犯罪人員之間存在的模式。本文針對裁判文書案件案情內(nèi)容進(jìn)行可視化便于案件內(nèi)容理解,并探究涉毒類案件中犯罪人員行為順序中存在的規(guī)律,將司法與可視化進(jìn)行結(jié)合,通過交互式可視化方法對司法案件案情數(shù)據(jù)從多個視圖進(jìn)行解讀,具有一定的創(chuàng)新性。

      2 系統(tǒng)設(shè)計和數(shù)據(jù)處理

      2.1 系統(tǒng)任務(wù)分析和設(shè)計目標(biāo)

      通過與貴州省高級人民法院工作人員溝通交流,以涉毒類案件司法裁判文書為基礎(chǔ)展開分析確定以下的分析任務(wù)。

      任務(wù)1:對單個案件內(nèi)容進(jìn)行展示,快速了解案件內(nèi)容。

      任務(wù)2:對多個案件進(jìn)行分析,發(fā)現(xiàn)案件中犯罪人員行為中潛在的規(guī)律。

      針對上述的任務(wù),構(gòu)建以下的設(shè)計目標(biāo):

      目標(biāo)1:抽取單個案件中信息并選取其中重要信息如單句中關(guān)鍵的行為詞、施事者和受事者等信息,并根據(jù)主次信息進(jìn)行可視化布局。

      目標(biāo)2:抽取案件中犯罪人員的行為詞,構(gòu)建成犯罪行為序列,挖掘序列中存在的模式并進(jìn)行序列可視化布局。

      2.2 系統(tǒng)流程介紹

      本文系統(tǒng)流程如圖1所示,首先對數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理獲取到(S,P,O,L)四元組,之后從中選取關(guān)鍵信息,以關(guān)鍵信息中動詞P作為重點進(jìn)行展示成案情描述圖。并將四元組中動詞P按時間先后順序構(gòu)建成序列,對序列中節(jié)點進(jìn)行合并、序列挖掘、序列可視化展示。

      圖1 系統(tǒng)流程圖Fig.1 System flow chart

      2.3 數(shù)據(jù)處理

      (1)數(shù)據(jù)脫敏,由于是司法數(shù)據(jù)涉及到個人隱私信息,因此對數(shù)據(jù)進(jìn)行數(shù)據(jù)脫敏。如表1所示將涉案人員姓名、身份證號通過掩碼屏蔽,將案件號通過隨機(jī)化映射到長度固定的編碼。

      表1 脫敏映射規(guī)則Table 1 Desensitization mapping rules

      (2)信息抽取,將裁判文書中案件案情部分抽取成為結(jié)構(gòu)化文本。將案件案情文本按句進(jìn)行切分,使用哈工大LTP 工具中依存句法分析將案情處理成(S,P,O,L)結(jié)構(gòu)即主謂賓表。由于涉毒類案件案情中每一句話的平均長度大于30 且涉及的動詞較多,因此需要對案件內(nèi)容進(jìn)行拆解分析。通過依存句法分析抽取每句話中存在的主謂賓表結(jié)構(gòu)并根據(jù)動詞之間的先后順序?qū)釉~進(jìn)行串聯(lián)。如圖2是一個句子中部分語句,提取成為(S:趙琴,P:乘車,O:,L:),(S:,P:到達(dá),O:,L:白云區(qū))形式。

      圖2 依存句法分析Fig.2 Dependency parsing

      首先通過詞性標(biāo)注識別出獲取句子中的觸發(fā)詞,之后進(jìn)行依存句法分析每個動詞存在的主謂關(guān)系、動賓關(guān)系、定中關(guān)系將每個動詞及其關(guān)聯(lián)的關(guān)系表示成(S,P,O,L)的結(jié)構(gòu),根據(jù)動詞之間的并列關(guān)系和動詞之間的先后順序?qū)γ總€句子中的動詞進(jìn)行排序。

      (3)對案情文本進(jìn)行分詞處理,并去除無關(guān)用詞,使用word2vec將案件案情文本中詞映射為詞向量。

      (4)案件類型分類,通過案件案由對案件類型進(jìn)行分類。案件類型分類結(jié)果如表2所示。

      表2 涉毒案件類型分類Table 2 Classification of drug-related cases

      3 案件案情及犯罪行為序列可視化

      本文對案件案情文本內(nèi)容進(jìn)行信息抽取并可視化;對提取的犯罪人員行為詞序列進(jìn)行分析發(fā)現(xiàn)犯罪人員行為中存在的規(guī)律并進(jìn)行可視化,系統(tǒng)整體效果如圖3所示。

      圖3 系統(tǒng)總體概覽圖Fig.3 Overview of system

      3.1 案情文本可視化

      本文由講話、講故事的特點受到啟發(fā)。講一個故事最基本且最重要的要求是按照時間先后順序?qū)﹃P(guān)鍵信息表達(dá),并在此基礎(chǔ)上添加次要信息進(jìn)行補(bǔ)充,能夠準(zhǔn)確表達(dá)故事的意思,即遵循“先后關(guān)系、主次關(guān)系”思想。案情文本可視化案情文本內(nèi)以句子先后順序,單句內(nèi)以動詞先后順序來構(gòu)建先后關(guān)系。單句中以犯罪人員實施的核心動作為關(guān)鍵信息并以動作的實施者、受事者補(bǔ)充,而單句中其他動詞作為次要信息并以動作的實施者、受事者等作為上下文語義補(bǔ)充。由此構(gòu)建以“先后關(guān)系、主次關(guān)系”為核心思想的文本描述圖。

      主要方法如下:假定案件案情文檔數(shù)據(jù)集為W={w1,w2,…,wn},將每個案件案情文本wi按句子進(jìn)行切分wi={l1,l2,…,ln},將每個句子li通過信息抽取成(S,P,O,L)簡寫為spol結(jié)構(gòu)構(gòu)成數(shù)據(jù)集合li={spol1,spol2,…,spoln},通過每個句話li中P的tfidf選取關(guān)鍵信息spolj。以li中關(guān)鍵信息spolj表示該單句,li中其他spol作為次要信息補(bǔ)充上下文語義。按單個句子內(nèi)按動詞發(fā)生順序連接構(gòu)成圖4案情描述圖。

      圖4 單句文本可視化Fig.4 Single sentence text visualization

      為了更加凝練表達(dá)案件信息,提取關(guān)鍵行為序列中存在的共性,文檔wi中每句子中關(guān)鍵信息構(gòu)成文檔核心信息wci={spol1j,spol2j,…,spolnj},將wci中每個p構(gòu)建成核心序列sci={p1,p2,…,pn} 。所有文檔中的序列構(gòu)成核心序列集WSC={sc1,sc2,…,scn} 。通過AprioriAll挖掘所有文檔中核心序列中模式,并進(jìn)行總結(jié)序列模式的概括詞。如獲得“交給”“攜帶”“召回”的概括“運(yùn)輸”,并進(jìn)行可視化。

      可視化布局,單個案件案情可視化如圖5所示。整體從上到下、從左到右、以動詞為核心布局,對單個文本wi中每句話li中關(guān)鍵信息spolj中動詞p按時間順序進(jìn)行連接紅色虛線箭頭連接,一句話li內(nèi)所有spol中所有動詞p按時間順序通過黑色實線連接。箭頭線連接的兩個動詞節(jié)點、箭頭線開始動詞節(jié)點事件發(fā)生時間上先于箭頭線末尾節(jié)點、箭頭線上人名是線開始動詞節(jié)點的施事者。每個動詞節(jié)點周圍的小節(jié)點是該動詞的所屬的賓語或定語進(jìn)行補(bǔ)充語義。核心序列模式獲得的概括詞用黃色的節(jié)點是表示對動詞序列的概括。高亮顯示法官、公安關(guān)注的毒品類型、重量等信息。

      圖5 案情描述圖Fig.5 Case description

      案情文本交互式可視化操作設(shè)計。為快速預(yù)覽案件內(nèi)容,隱藏次要事件只保留核心事件,顯示核心事件的屬性如:事件參與者、事件目的等信息,如圖6 所示。并支持對圖進(jìn)行大小縮放、圖片保存等操作。

      圖6 關(guān)鍵信息Fig.6 Key information

      3.2 犯罪行為序列可視化

      為探究涉毒類案件案情中犯罪人員行為中存在的規(guī)律,幫助公安和司法人員直觀了解犯罪人員的犯罪行為模式。將文檔集W中每個文檔wi提取的spol結(jié)構(gòu)中的P按時間順序構(gòu)建成犯罪行為序列。即對行為序列可視化能夠幫助探究不同類型案件中存在的規(guī)律。而提取出的行為序列存在一個問題即:行為動詞的種類較多,序列中差異性大,導(dǎo)致序列挖掘及可視化效果差如圖7。對案情探究發(fā)現(xiàn)產(chǎn)生相似行為動詞的原因。

      圖7 序列中相似動詞Fig.7 Similar verbs in sequence

      同一行為在案件描述時存在差異性,從而導(dǎo)致節(jié)點類型過多,進(jìn)而導(dǎo)致序列總體差異性大。如“行駛”動作被抽取成“行駛至”“行駛在”“行駛到”“行車”等。

      為解決該問題提出以下的解決方法:

      相似節(jié)點樹構(gòu)建,通過數(shù)據(jù)處理獲取每個動詞的詞向量。通過層次聚類算法設(shè)定關(guān)鍵動詞向量的相似度和動詞字符之間的相似性為目標(biāo)函數(shù)公式(1)構(gòu)建相似節(jié)點樹,對部分通過篩選構(gòu)建的單個相似節(jié)點樹如圖8所示。

      圖8 相似節(jié)點樹Fig.8 Similar node tree

      其中,α+β=1,x、y表示動詞對應(yīng)的詞向量,a、b是動詞的bow特征向量。

      信息量度量,根據(jù)樹結(jié)構(gòu)中每個節(jié)點與法條之間的相關(guān)性計算每個節(jié)點的信息度量。選取司法領(lǐng)域較為關(guān)注的與法條相關(guān)的節(jié)點。為相似節(jié)點樹中每個i節(jié)點定義一個節(jié)點向量ni,向量表示每個案件對應(yīng)的序列中是否存在該節(jié)點或該節(jié)點的子節(jié)點。每種法條j定義向量oj表示每個案件中是否使用該法條。通過jaccard計算向量之間的相關(guān)性,其中向量長度為n即案件個數(shù)。

      對兩個向量統(tǒng)計得表3。

      表3 統(tǒng)計表Table 3 Statistical table

      根據(jù)兩者的相關(guān)性進(jìn)行計算信息量。

      其中,k為所有案件中涉及的不相同的法條個數(shù)。Hi為樹中節(jié)點i的信息量。

      節(jié)點選擇,選取節(jié)點樹中信息量較大的節(jié)點,其子節(jié)點將被合并成該節(jié)點。從樹種根節(jié)點開始深度優(yōu)先搜索遍歷、搜索節(jié)點樹中子節(jié)點比父節(jié)點信息量大的子節(jié)點個數(shù)與子節(jié)點總數(shù)l比值大于γ的父節(jié)點或者是葉子節(jié)點如圖9所示。

      圖9 節(jié)點選擇Fig.9 Node selection

      其中,γ∈[0,1],通過調(diào)節(jié)γ選擇節(jié)點合并的程度。

      節(jié)點合并,將所有序列中的被選擇的節(jié)點其子節(jié)點將轉(zhuǎn)化為該節(jié)點,如圖7中所有序列中子節(jié)點將被轉(zhuǎn)化為父節(jié)點。通過修改γ對序列中節(jié)點類型數(shù)量影響如圖10所示。

      圖10 γ 變化對節(jié)點類型數(shù)量影響Fig.10 Impact of γ changes on number of node types

      序列模式挖掘,使用Chen 等[23]提出的最小描述長度MinDL+lsh 的序列模式挖掘。并通過record 記錄已經(jīng)計算過的序列對,從而優(yōu)化算法減少算法時間開銷。在Agavue 數(shù)據(jù)集上進(jìn)行對比,添加record 對優(yōu)化前后時間消耗進(jìn)行對比,如圖11所示。

      圖11 優(yōu)化前后時間消耗Fig.11 Time consumption before and after optimization

      序列模式可視化,對序列模式中所有的序列模式節(jié)點顏色進(jìn)行編輯。序列模式與原始序列對應(yīng),且相同節(jié)點顏色對應(yīng)如圖3(b)、(c)中所示。

      4 案例分析與用戶調(diào)研

      4.1 案例分析

      4.1.1 案情文本可視化分析

      本案例通過本文中案情文本可視化方法展示案件案情的發(fā)展過程。圖3(a)中通過搜索案件號展示該案件的案情描述圖在圖3(d)。選取涉毒案件中運(yùn)輸類案件案情的案情進(jìn)行展示如圖5案件案情描述圖,從圖中能夠較為詳細(xì)地展現(xiàn)案件的發(fā)展過程。為快速了解案件的主要發(fā)展過程,對案件信息進(jìn)行簡化如圖6關(guān)鍵信息所示。

      4.1.2 犯罪行為序列可視化分析

      本案例方法能幫助警察及司法人員發(fā)現(xiàn)犯罪人員的行為中存在的規(guī)律,有助于提升抓捕效率、降低判案的成本。根據(jù)案件案情內(nèi)容將涉毒類案件劃分為5 種類型如表2所示。

      數(shù)據(jù)過濾。用戶使用圖3(a)堆疊圖選擇器選取感興趣的案件類型。使用選擇圖3(a)中合并指數(shù)來指定相似節(jié)點的合并程度從而減少相似節(jié)點類型數(shù)量。

      動作先后關(guān)系探索。通過行為動詞的對齊,便于發(fā)現(xiàn)對該動作前后之間存在的因果關(guān)系進(jìn)行分析。如圖12可以發(fā)現(xiàn)關(guān)鍵動作中存在的因果關(guān)系。

      圖12 對齊動作Fig.12 Align action

      詳細(xì)信息探究。點擊單個圖3(b)中單個序列模式,展示該序列模式中是從哪些原始行為序列挖掘得到的如圖3(c)。最后,為了解行為9序列中所對應(yīng)的具體案情內(nèi)容,可以點擊圖3(c)中單個序列展示序列所對應(yīng)的案情文本描述圖3(d),幫助快速了解案情的發(fā)展過程。對比分析探究。通過對比圖3(b)不同序列模式,發(fā)現(xiàn)不同案件中犯罪行為模式中存在的不同。通過對所有類型的案件進(jìn)行探究,發(fā)現(xiàn)如圖13 通過觀察不同的行為模式發(fā)現(xiàn)販賣毒品是一般是多次聯(lián)系才構(gòu)成交易,且涉及的毒品大多為傳統(tǒng)毒品。運(yùn)輸類案件多次駕駛行為,且涉及的毒品量較大。

      圖13 不同行為模式對比Fig.13 Comparison of different behavior patterns

      4.2 案情可視化對比

      使用文本可視化的方法wordCloud對圖5相同案情文本內(nèi)容進(jìn)行可視化產(chǎn)生圖14。圖中丟失了大量的語義信息,較難理解案情文本的發(fā)展過程。而本文中的案情描述圖5較為完善地保留案情文本中的語義信息,能夠快速了解案情。

      圖14 案情文本詞云Fig.14 Case text word cloud

      使用王慧等[20]提出的司法判決文書數(shù)據(jù)文檔圖譜視圖方法對相同的案情文本進(jìn)行可視化結(jié)果如圖15。圖中以類似于特征提取的方式保留了案情中部分語義信息,但是本文方法不僅保留了案情文本中重要和次要的語義信息,同時也通過時間先后的順序可視化了案情的發(fā)展過程。

      圖15 文檔圖譜視圖Fig.15 Document atlas view

      4.3 用戶調(diào)研

      為了分析本文設(shè)計的涉毒案件分析系統(tǒng)的有效性,邀請20 名法學(xué)院的研究生同學(xué)、10 名貴陽市花溪區(qū)公安人員、10名貴州省最高人民法院司法人員進(jìn)行使用調(diào)研,介紹并指導(dǎo)使用的過程。從以下幾個方面進(jìn)行評價:(1)是否能夠快速理解案件案情;(2)是否發(fā)現(xiàn)不同案件犯罪人員行為規(guī)律;(3)界面設(shè)計是否友好;(4)能否幫助快速捕捉到需要的信息。所有參與的評價任務(wù)完成之后,讓每個參與者在李克特量表上對評價任務(wù)進(jìn)行打分,打分的標(biāo)準(zhǔn)從1~5 表示非常不滿意到非常滿意。打分結(jié)果如圖16所示,對任務(wù)1、2的評分的均值大于4.1,對任務(wù)3、4 的評分大于3.5。通過對這幾方面的調(diào)研,用戶表示系統(tǒng)能夠快速幫助捕捉需要的信息,并且用戶指導(dǎo)設(shè)計方面需要改進(jìn)。

      圖16 任務(wù)評分表Fig.16 Task scoring table

      該系統(tǒng)為貴陽市司法工作人員、公安人員演示如何快速了解涉毒類案情文本,發(fā)現(xiàn)犯罪人員行為的規(guī)律操作。司法工作人員、公安人員等人均認(rèn)為該系統(tǒng)能夠幫助其提供對犯罪人員規(guī)律的探究,快速了解案情內(nèi)容。認(rèn)為該系統(tǒng)存在巨大的潛在價值,對于司法領(lǐng)域智能化存在重要意義。并提出意見希望能夠?qū)缑孢M(jìn)行優(yōu)化,減少對案件探究的時間。

      5 結(jié)語

      本文提出面向涉毒類案情的文本可視化方法,該可視化方法將案情文本可視化成便于理解的案情描述圖,幫助快速直觀地了解案件中案情發(fā)展過程。提出構(gòu)建相似節(jié)點樹的方法來有效地解決了犯罪行為序列中節(jié)點類型較多的問題。實驗結(jié)果表明該方法能夠有效減少節(jié)點類型?;谏鲜鰞蓚€方法構(gòu)建本案情可視化系統(tǒng)構(gòu)建序列幫助用戶探索案件中犯罪行為序列模式,根據(jù)案件中的案情文本設(shè)計并進(jìn)行可視化能夠有效地幫助理解案件案情。通過向法學(xué)院、法院、公安人員進(jìn)行調(diào)研,驗證了本系統(tǒng)的有效性。本可視化系統(tǒng)能夠幫助其提升工作效率。

      猜你喜歡
      案情可視化語義
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運(yùn)行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      基于CGAL和OpenGL的海底地形三維可視化
      語言與語義
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      是誰下的毒
      “上”與“下”語義的不對稱性及其認(rèn)知闡釋
      報案者
      認(rèn)知范疇模糊與語義模糊
      “兩高”刑事指導(dǎo)性案例的文本分析及改進(jìn)
      吉首市| 巩义市| 仲巴县| 丽水市| 张家界市| 穆棱市| 云龙县| 洪洞县| 泾阳县| 抚松县| 新和县| 壤塘县| 垣曲县| 佛冈县| 富平县| 西平县| 东乡族自治县| 岳阳市| 鄯善县| 柳林县| 吉林省| 伊宁市| 嘉兴市| 额敏县| 泊头市| 庆安县| 松江区| 平乡县| 临沂市| 龙泉市| 凭祥市| 潮州市| 徐汇区| 新河县| 炎陵县| 三江| 简阳市| 分宜县| 北辰区| 永昌县| 锡林浩特市|