• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多通道自注意力機(jī)制的刑事案件量刑技術(shù)

      2021-12-17 00:56:18蔡怡蕾李尚葉麟張宏莉
      關(guān)鍵詞:量刑注意力向量

      蔡怡蕾,李尚,葉麟,張宏莉

      (哈爾濱工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,哈爾濱 150001)

      0 引言

      目前司法刑事案件在其審查判決過程中,主要依靠法官等一系列的司法工作者對(duì)案件進(jìn)行審查,并依據(jù)國(guó)家律法和案件真實(shí)情況對(duì)其進(jìn)行理解和決策分析,從而對(duì)案件進(jìn)行可信、公正地判決。依據(jù)中國(guó)對(duì)刑事案件判案依據(jù)的有關(guān)規(guī)定,在不與《中華人民共和國(guó)憲法》等國(guó)家級(jí)法規(guī)相抵觸的前提下,可參考地方相應(yīng)的法律法規(guī)進(jìn)行審判,且法官在案件量刑中擁有一定程度的自由裁量權(quán)。因此,會(huì)造成針對(duì)同一案件,不同的地區(qū)、不同的法官對(duì)案件判決的側(cè)重點(diǎn)不同的情況,從而導(dǎo)致對(duì)案件的量刑有失偏頗。而且近年來(lái)刑事案件一審判決數(shù)量顯著增加,而司法工作者人數(shù)反而有縮減趨勢(shì)。目前司法判決中的主要矛盾即是日益增長(zhǎng)的數(shù)據(jù)與不平衡、不充分的司法人力和司法公正之間的矛盾,如何更好的滿足人民群眾對(duì)司法的需求,減輕司法工作人員的繁重負(fù)擔(dān)是當(dāng)今司法領(lǐng)域亟需解決的問題。近年來(lái),隨著科技的發(fā)展,人工智能技術(shù)日趨完善,利用人工智能技術(shù)處理海量數(shù)據(jù),將計(jì)算機(jī)技術(shù)引入司法領(lǐng)域已經(jīng)成為不可阻擋的趨勢(shì),是當(dāng)下“案多人少”、效率低等問題的有效解決辦法。

      當(dāng)前司法領(lǐng)域中,“AI+”正處于發(fā)展階段,現(xiàn)有方法還不夠成熟,無(wú)法滿足人民群眾對(duì)智慧司法的需求。現(xiàn)如今已有的案件判決中存在著很多高質(zhì)量的判決案例,且隨著社會(huì)的發(fā)展數(shù)據(jù)量不斷增多,這足以為“人工智能+司法”提供良好的數(shù)據(jù)基礎(chǔ)。本文借助歷史案件數(shù)據(jù),采用合適的模型對(duì)案件量刑進(jìn)行學(xué)習(xí),使其逐漸承擔(dān)法官的案件決策工作,為法官提供決策建議,逐步解放法官,減輕司法工作者工作負(fù)擔(dān),使其更加高效、公正的進(jìn)行司法決策,從而促進(jìn)司法工作的透明性和可信度的提高。同時(shí),智慧司法可打破非司法工作者與專業(yè)人士之間的壁壘,使法律判決的結(jié)果更加可信。

      本文以司法決策為目的,著重研究司法決策中的輔助量刑問題,結(jié)合人工智能和領(lǐng)域知識(shí)對(duì)案件進(jìn)行剖析,充分發(fā)揮計(jì)算機(jī)科學(xué)與其他學(xué)科相結(jié)合的優(yōu)勢(shì),努力打造透明、公正的司法量刑,為人民群眾提供公開合法的司法判決,對(duì)于維護(hù)司法公正,構(gòu)建法治社會(huì)具有重要意義。

      1 相關(guān)工作

      早在上世紀(jì)五十年代,研究學(xué)者就意識(shí)到了智慧司法的重要性,提出將法律領(lǐng)域信息化,結(jié)合計(jì)算機(jī)領(lǐng)域知識(shí)推出自動(dòng)檢索和案件判決模型。現(xiàn)如今,智慧司法主要方向包括案件分類、輔助量刑、證據(jù)推理、法律推理、類案推送、文書編寫、法律問答以及信息檢索與查詢等[1]。

      在刑期預(yù)測(cè)方面,林等人在強(qiáng)盜罪和恐嚇取財(cái)罪2 個(gè)罪名的案件中提取出21 個(gè)要素標(biāo)簽,并增加自動(dòng)提取特征標(biāo)簽,通過對(duì)標(biāo)簽一系列的分析后,對(duì)這2 種罪名進(jìn)行罪名分類和刑期預(yù)測(cè)[2];Li等人使用多通道層次注意力神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)案件事實(shí)、被告人基本信息以及法律法規(guī)之間的內(nèi)在聯(lián)系和深層語(yǔ)義,從而構(gòu)造罪名預(yù)測(cè)、法律推薦以及刑期預(yù)測(cè)的統(tǒng)一框架,在評(píng)估指標(biāo)上都達(dá)到了新的高度[3];Zhong等人認(rèn)為法律判決預(yù)測(cè)中罪名預(yù)測(cè)、法條推薦、刑期預(yù)測(cè)、罰款預(yù)測(cè)等各個(gè)子任務(wù)之間存在一定的拓?fù)湟蕾囆裕虼藢⒃撘蕾囮P(guān)系轉(zhuǎn)化為圖結(jié)構(gòu),構(gòu)建包含拓?fù)潢P(guān)系的多任務(wù)學(xué)習(xí)框架進(jìn)行司法判決多任務(wù)共同預(yù)測(cè),從而提高法律判決的可信性和可解釋性[4];Yang等人基于LJP 子任務(wù)之間的關(guān)系,提出可以基于注意力機(jī)制的多角度雙向神經(jīng)網(wǎng)絡(luò),通過前向預(yù)測(cè)和后向驗(yàn)證,顯著提高了各子任務(wù)的預(yù)測(cè)準(zhǔn)確率[5];Chen等人基于案件罪名進(jìn)行刑期預(yù)測(cè),提出針對(duì)罪名的特征篩選機(jī)制的深度神經(jīng)網(wǎng)絡(luò)模型,該模型可針對(duì)多罪名案件進(jìn)行刑期預(yù)測(cè),提高了基于各個(gè)罪名的刑期預(yù)測(cè)以及總刑期預(yù)測(cè)的準(zhǔn)確率[6]。在司法判決預(yù)測(cè)(LJP)中,還有其它各類子問題,如證據(jù)推理問題中,Vlek等人認(rèn)為所有案件的判決必須經(jīng)過一系列的證據(jù)推理,為案件準(zhǔn)確判決提供堅(jiān)實(shí)基礎(chǔ),同時(shí)結(jié)合敘述性和辯論性方法,通過貝葉斯網(wǎng)絡(luò)生成不同證據(jù)的概率值,從而還原真實(shí)的案件信息[7];Walker等人提供了一個(gè)用于建模復(fù)雜法律推理的可視框架,該框架基于多謂詞默認(rèn)邏輯將法律法規(guī)與專家知識(shí)進(jìn)行結(jié)合,在規(guī)則推論和證據(jù)評(píng)估上發(fā)揮巨大作用[8]。在案件分類問題中,Luo等人基于案件事實(shí)的信息構(gòu)建罪名預(yù)測(cè)模型框架,提出基于Attention 機(jī)制的深度神經(jīng)網(wǎng)絡(luò)對(duì)案件事實(shí)部分和法律法規(guī)部分進(jìn)行向量表示,并將法律法規(guī)信息融入案件事實(shí),從而實(shí)現(xiàn)罪名預(yù)測(cè)[9];Wang等人根據(jù)法律文本以及案件描述的文本特點(diǎn),將罪名預(yù)測(cè)問題劃分為分層多標(biāo)簽分類問題,將父子標(biāo)簽進(jìn)行匹配,從而優(yōu)化案件罪名預(yù)測(cè)問題[10]。

      近年來(lái),隨著人工智能的發(fā)展,“AI+NLP”問題取得了一系列的突出成果,其中一些基礎(chǔ)神經(jīng)網(wǎng)絡(luò)模型得到業(yè)界廣泛認(rèn)可,如Word2Vec、卷積神經(jīng)網(wǎng)絡(luò)以及循環(huán)神經(jīng)網(wǎng)絡(luò)等。在此基礎(chǔ)之上,業(yè)界學(xué)者對(duì)其進(jìn)行深入研究,并產(chǎn)生了許多具有跨時(shí)代意義的研究成果。ELMo(Embeddings from Language Models)模型開辟了多義詞向量的大門,該模型不同于以往單詞與向量之間的一一映射的固定模式,而是考慮到語(yǔ)法和語(yǔ)義的復(fù)雜性,結(jié)合上下文產(chǎn)生適合當(dāng)前語(yǔ)言環(huán)境的詞向量[11];BERT 的提出是NLP領(lǐng)域內(nèi)重要的里程碑,在11 個(gè)NLP 任務(wù)中取得卓越表現(xiàn),訓(xùn)練出的Word-Level 向量變成Sentence-Level 的向量,下游具體NLP 任務(wù)調(diào)用更方便[12];Yang 針對(duì)文本結(jié)構(gòu)提出層次注意力機(jī)制(Hierarchical Attention Networks,HAN),該注意力機(jī)制可以將模型結(jié)構(gòu)拆分為2 部分,分別為句子級(jí)別的Attention 結(jié)構(gòu)和單次級(jí)別的Attention 結(jié)構(gòu),在文本分類任務(wù)上準(zhǔn)確率有大幅度提升[13];Google 團(tuán)隊(duì)與2017 年提出自注意力機(jī)制(Self-Attention)在業(yè)界引起極大轟動(dòng),解決了RNN 系列注意力機(jī)制中存在的參數(shù)多,速度慢等問題,在各個(gè)任務(wù)上均取得優(yōu)秀表現(xiàn)[14]。

      2 模型

      基于多通道自注意力機(jī)制的刑事案件輔助量刑技術(shù)模型的基本結(jié)構(gòu)如圖1 所示。該模型將被告人基本信息、案件事實(shí)描述與法律條文進(jìn)行融合,構(gòu)建刑事案件的輔助量刑模型。本文將該模型的輸入輸出形式化的表示如式(1)(2)所示。

      圖1 基于多通道自注意力機(jī)制的刑事案件輔助量刑技術(shù)模型基本結(jié)構(gòu)圖Fig.1 The basic structure of criminal case auxiliary sentencing technology model based on multi-channel self-attention mechanism

      其中,Sp為被告人基本信息,包括被告人犯罪歷史、精神狀況等信息;Sa為法律條文知識(shí)庫(kù),中國(guó)法律條文甚多,其中涉及到量刑的法條主要為《中華人民共和國(guó)刑法》,本文主要研究的是刑事案件中的故意傷害罪,但由于案情中所出現(xiàn)的情況較多,可能會(huì)涉及到除《中華人民共和國(guó)刑法》第二百三十四條以外的其它條文,如針對(duì)自首情節(jié)的第六十七條法文、針對(duì)未成年人犯故意傷害罪量刑規(guī)定的第十七條條文等;Sf為案件事實(shí)描述,該部分含有被告人進(jìn)行犯罪的原因、實(shí)施過程、犯罪性質(zhì)、犯罪后果、對(duì)社會(huì)危害程度以及犯罪后悔過態(tài)度等信息,該部分是量刑的主要信息部分;Rt為刑期的判決結(jié)果,由于本文采用回歸的方法對(duì)刑期進(jìn)行預(yù)測(cè),因此,Rt為向量空間的一個(gè)非負(fù)實(shí)數(shù)。

      利用上述模型進(jìn)行刑期預(yù)測(cè)的步驟如下:

      (1)輸入數(shù)據(jù)在經(jīng)過分詞后進(jìn)行向量化表示,構(gòu)成詞向量矩陣;

      (2)以被告人基本信息和案件事實(shí)描述為輸入,將其輸入至法條提取器中,對(duì)法律條文知識(shí)庫(kù)中的法律條文數(shù)據(jù)進(jìn)行提取,找出和當(dāng)前案件可能有關(guān)系的前若干條法律條文,并將其作為法律條文部分的輸入,本文中該法條提取器為SVM 分類器;

      (3)將各部分輸入數(shù)據(jù)輸入到Embedding 層,對(duì)詞向量進(jìn)行進(jìn)一步的調(diào)節(jié),為后續(xù)工作提供良好基礎(chǔ);

      (4)將各部分的輸入通過編碼器進(jìn)行文檔編碼,鑒于注意力機(jī)制在自然語(yǔ)言處理中表現(xiàn)出來(lái)的優(yōu)異能力,此部分采用多頭自注意力機(jī)制進(jìn)行文檔編碼處理,被告人基本信息、案件事實(shí)描述和法律條文的向量表示分別表示為dp、df和da;

      (5)將法律條文的文檔表示da輸入到文檔聚合器中,將被告人基本信息dp和案件事實(shí)描述df聯(lián)合起來(lái)形成2 部分的上下文向量表示,并以此作為文檔聚合器注意力機(jī)制的Query 部分進(jìn)行編碼計(jì)算形成向量表示dw;

      (6)最后,將文檔聚合器所生成向量dw輸入至多層感知機(jī)(MLP)中進(jìn)行刑期預(yù)測(cè)回歸計(jì)算。

      2.1 法條提取器算法

      法條提取器是根據(jù)被告人基本信息和案件事實(shí)描述,在法律條文知識(shí)庫(kù)中選取其可能依據(jù)的前若干條法律條文,法條提取過程如圖2 所示。

      圖2 法條提取過程圖Fig.2 The process of law extraction

      本文采用TF-IDF 進(jìn)行文本特征處理,得到文本中每個(gè)詞的特征值。在使用SVM 進(jìn)行文本多分類時(shí),采用OVO 的方法,將多標(biāo)簽分類問題轉(zhuǎn)化為多個(gè)二分類問題。在OVO 方法中,若要對(duì)文本進(jìn)行n分類,在其中包含n(n-1)/2 個(gè)分類器。本文中法律條文知識(shí)庫(kù)為《中華人民共和國(guó)刑法》集合,其中包括有452 條法律法規(guī)。

      2.2 文檔編碼器算法

      本文采用多頭自注意力機(jī)制進(jìn)行文檔編碼,其原因在于:

      (1)自注意力機(jī)制比CNN 和RNN 神經(jīng)網(wǎng)絡(luò)參數(shù)少,計(jì)算復(fù)雜度低;

      (2)自注意力機(jī)制不同于基于RNN 的注意力機(jī)制,其可實(shí)現(xiàn)并行計(jì)算,速度較快;

      (3)自注意力機(jī)制進(jìn)行計(jì)算時(shí)采用詞與詞之間直接進(jìn)行相似度計(jì)算的方法,使每?jī)蓚€(gè)單詞之間的距離均為1,解決了RNN 網(wǎng)絡(luò)中過長(zhǎng)序列導(dǎo)致的長(zhǎng)期以來(lái)關(guān)系削弱的問題;

      (4)多頭注意力機(jī)制在自注意力機(jī)制的基礎(chǔ)上進(jìn)行擴(kuò)展,從以往的一個(gè)關(guān)注點(diǎn)增至多個(gè)關(guān)注點(diǎn),每個(gè)頭學(xué)習(xí)到不同表示空間的特征,側(cè)重點(diǎn)各有不同,從而更加全面學(xué)習(xí)文本信息。

      自注意力機(jī)制基本結(jié)構(gòu)如圖3 所示。文本中的每個(gè)單詞都要和其它所有詞進(jìn)行相似度計(jì)算,以學(xué)習(xí)到句子內(nèi)部關(guān)系。在計(jì)算相似度時(shí),為防止點(diǎn)積計(jì)算結(jié)果過大,選取縮放點(diǎn)積的方法對(duì)其進(jìn)行調(diào)節(jié),即在點(diǎn)積計(jì)算后除以尺度標(biāo)度,其中dk為詞向量維度;之后對(duì)相似度值歸一化為概率分布,其中,并且∈[0,1] ;將權(quán)重向量再乘以Value 后再將各向量進(jìn)行相加,得到最終的Attention值。其公式如式(3)所示。

      圖3 自注意力機(jī)制基本模型結(jié)構(gòu)Fig.3 The structure of self-attention mechanism

      其中,Q為Query;K為Key;V為Value。Q,K,V3 個(gè)矩陣均是文本詞向量矩陣進(jìn)行線性變化得到的,其公式(4)、公式(5)和公式(6)如下,其中Q'=K'=V'。

      多頭自注意力機(jī)制的基本模型結(jié)構(gòu)如圖4 所示,其本質(zhì)是構(gòu)造多個(gè)不同自注意力機(jī)制,在對(duì)不同的注意力機(jī)制計(jì)算得到結(jié)果后,將結(jié)果進(jìn)行拼接,通過線性層的轉(zhuǎn)化得到最終的注意力值,計(jì)算公式如式(7)所示。的注意力結(jié)果;W*是權(quán)重矩陣;b*為偏置。為使

      圖4 多頭注意力機(jī)制基本模型結(jié)構(gòu)Fig.4 The structure of multi-h(huán)ead Attention mechanism

      其中,headi表示多頭自注意力機(jī)制的第i個(gè)頭每個(gè)頭都有各自的側(cè)重點(diǎn),每個(gè)自注意力機(jī)制的輸入需不同,headi計(jì)算公式(8)所示。

      其中,Wi為第i個(gè)頭計(jì)算所需的權(quán)重矩陣,不同的頭進(jìn)行線性變換所使用的權(quán)重矩陣不同,從而使注意力更為廣泛。

      2.3 文檔聚合器算法

      文檔聚合器中使用的方法在自注意力機(jī)制的基礎(chǔ)上進(jìn)行改進(jìn),在式(3)Self-Attention 中計(jì)算Query時(shí)所使用并非法條信息,而是使用被告人基本信息和案件事實(shí)描述的上下文向量,由式(9)經(jīng)線性變化得到。Query 的計(jì)算方法如式(10)所示。

      其中,dp為被告人基本信息向量表示,df為案件事實(shí)描述向量表示。

      3 實(shí)驗(yàn)

      3.1 實(shí)驗(yàn)數(shù)據(jù)

      文本中實(shí)驗(yàn)數(shù)據(jù)均爬取自中國(guó)裁判文書網(wǎng)(http:/ /wenshu.court.gov.cn/),本文主要爬取關(guān)于故意傷害罪有關(guān)裁判文書一審判決書,其中北京市11 003 條,湖北省10 956 條,河南省12 955 條,山東省11 692條。裁判文書格式較為固定,如圖5 所示,方便對(duì)裁判文書中被告人基本信息、案件事實(shí)描述以及案件判決中罪名、所涉及《中華人民共和國(guó)刑法》法條以及刑期進(jìn)行信息提取。

      圖5 判決文書示例Fig.5 The example of judgment document

      3.2 實(shí)驗(yàn)結(jié)果與分析

      3.2.1 部分參數(shù)調(diào)節(jié)

      (1)法條提取器參數(shù)調(diào)節(jié):使用SVM 進(jìn)行刑期提取的實(shí)驗(yàn)評(píng)判結(jié)果見表1,其中刑期預(yù)測(cè)誤差采用平均絕對(duì)誤差(MAE)進(jìn)行衡量。由實(shí)驗(yàn)結(jié)果可知,隨著法條提取條數(shù)的增加,法條的召回率逐漸增加,即分類器對(duì)正確標(biāo)簽識(shí)別率增加??紤]到召回率增加到一定程度會(huì)使刑期預(yù)測(cè)的誤差增大,且模型的訓(xùn)練時(shí)間增加,本文中選取7為法條提取數(shù)量;

      表1 法條提取數(shù)量對(duì)比實(shí)驗(yàn)結(jié)果Tab.1 Comparative experiment on the number of law strips extracted

      (2)文檔編碼器參數(shù)調(diào)節(jié):實(shí)驗(yàn)結(jié)果見表2,其中刑期預(yù)測(cè)誤差采用平均絕對(duì)誤差(MAE)進(jìn)行衡量。由此可見,其實(shí)驗(yàn)與理論相一致,刑期預(yù)測(cè)的誤差隨著頭數(shù)量的增多而有一定程度的增加,但到達(dá)一定程度后會(huì)呈現(xiàn)下降趨勢(shì),且頭的數(shù)量與每一輪的訓(xùn)練時(shí)間成正比。

      表2 多頭注意力機(jī)制中頭的數(shù)量對(duì)比實(shí)驗(yàn)Tab.2 The comparative experiment on the number of heads in the multi-h(huán)ead attention mechanism

      3.2.2 刑期預(yù)測(cè)

      本文中使用的實(shí)驗(yàn)基線模型有以下幾個(gè):

      (1)LSTM-Linear:LSTM-Linear 模型以LSTM網(wǎng)絡(luò)對(duì)文本進(jìn)行向量化表示,最后通過全連接層對(duì)刑期進(jìn)行預(yù)測(cè);

      (2)BiLSTM-Linear:考慮到文本中某一詞語(yǔ)不僅與前文有關(guān),后續(xù)文本同樣對(duì)其有所影響,因此采用Bi-LSTM 模型對(duì)文本進(jìn)行向量化表示,更好的學(xué)習(xí)到全文特征,之后再采用全連接層對(duì)刑期進(jìn)行預(yù)測(cè);

      (3)Fact_Law_Info_NN:Fact_Law_Info_NN 模型即基于多通道自注意力機(jī)制的刑事案件量刑模型;

      (4)Fact_Law_NN:為了驗(yàn)證本文中加入被告人基本信息的有效性,F(xiàn)act_Law_NN 模型在Fact_Law_Info_NN 模型的基礎(chǔ)上減少被告人基本信息通道,其余結(jié)構(gòu)與參數(shù)不變,進(jìn)行刑期預(yù)測(cè)。

      本文中所采用的評(píng)價(jià)指標(biāo)有以下幾種,其中y為預(yù)測(cè)值,為真實(shí)值:

      (1)平均絕對(duì)誤差(MAE),式(11)。

      (2)對(duì)稱平均絕對(duì)百分比誤差(SMAPE),式(12)。

      (3)精準(zhǔn)匹配率(Exact Match,EM),預(yù)測(cè)值和真實(shí)值相等的數(shù)量占總數(shù)量的百分比,∑()為真實(shí)值與預(yù)測(cè)值相等的數(shù)量,式(13)。

      (4)ACC_p%:預(yù)測(cè)值與真實(shí)值誤差在p%以內(nèi)的比值,式(14)。其中,∑((y≥(1-p%) )∧(y≤(1+p%) ))為預(yù)測(cè)值y∈[(1-p%),(1+p%) ]的數(shù)量,本文中選取p=10、p=20 以及p=30 這3 個(gè)值。

      實(shí)驗(yàn)結(jié)果見表3。從實(shí)驗(yàn)結(jié)果可見,MAE在Fact_Law_Info_NN 模型上的結(jié)果最好,在ACC_10%指標(biāo)上提升了近5%,F(xiàn)act_Law_Info_NN 的精準(zhǔn)匹配率同樣在各個(gè)模型中脫穎而出。綜合來(lái)看,F(xiàn)act_Law_Info_NN 模型在刑期預(yù)測(cè)任務(wù)上具有最好的表現(xiàn)效果。

      表3 實(shí)驗(yàn)結(jié)果Tab.3 The results of experimental

      為了考察不同階段刑期預(yù)測(cè)的情況,現(xiàn)將刑期分為以下幾段:(1)0~6 個(gè)月;(2)6~12 個(gè)月;(3)12~36 個(gè)月;(4)36~120 個(gè)月;(5)120 個(gè)月以上。在Fact_Law_Info_NN 模型上對(duì)其進(jìn)行各個(gè)階段準(zhǔn)確率的實(shí)驗(yàn)。其計(jì)算方式如式(15)所示。

      其中,y為預(yù)測(cè)值;為真實(shí)值;Count(y∈[a,b))為y取值在區(qū)間[a,b)的個(gè)數(shù)。實(shí)驗(yàn)結(jié)果如圖6 所示。

      圖6 刑期分段準(zhǔn)確率Fig.6 Accuracy rate of sentence

      由實(shí)驗(yàn)結(jié)果可見,刑期在[6,12)和[36,120)區(qū)間的準(zhǔn)確率較高,其主要原因如下:

      (1)刑期較低的案件其案件較為簡(jiǎn)單,所犯罪行較輕,此時(shí)認(rèn)罪態(tài)度、被害人諒解程度對(duì)其影響較大,且法官存在自由裁量權(quán)。除此之外,部分人為因素也會(huì)導(dǎo)致對(duì)于相似案件的判決差別較大;

      (2)刑期較高的案件,往往較為復(fù)雜,對(duì)于案件的判決影響因素較多,因此相較于中間階段的刑期準(zhǔn)確率較低。

      考慮到不同地方法院對(duì)案件的判決具有細(xì)微差別的量刑方法,因此,將不同省份的數(shù)據(jù)分別單獨(dú)提取并采用Fact_Law_Info_NN 模型進(jìn)行訓(xùn)練,實(shí)驗(yàn)結(jié)果見表4。由實(shí)驗(yàn)結(jié)果可見,各個(gè)省份的準(zhǔn)確率均不同,但大多低于全數(shù)據(jù)集的準(zhǔn)確率,其原因主要有以下兩點(diǎn):

      表4 各省份實(shí)驗(yàn)結(jié)果Tab.4 Experimental results of different provinces

      (1)不同的省份在刑事案件量刑中均依據(jù)《中華人民共和國(guó)刑法》,但是不同地方根據(jù)當(dāng)?shù)貙?shí)際情況對(duì)其在法定范圍內(nèi)進(jìn)行調(diào)整。同時(shí),法官具有一定的自由裁量權(quán),因此導(dǎo)致不同地方對(duì)相似案件的量刑有所不同;

      (2)各個(gè)省份的訓(xùn)練數(shù)據(jù)集較少,當(dāng)訓(xùn)練迭代一定輪次后,出現(xiàn)過擬合現(xiàn)象,且此現(xiàn)象的出現(xiàn)較訓(xùn)練全數(shù)據(jù)集更早,因此其準(zhǔn)確率不如全數(shù)據(jù)集的準(zhǔn)確率高。

      4 結(jié)束語(yǔ)

      本文圍繞刑事案件的輔助量刑進(jìn)行研究,提出基于多通道自注意力機(jī)制的刑事案件輔助量刑模型,通過對(duì)被告人基本信息、案件事實(shí)描述以及法律法規(guī)的深層次學(xué)習(xí),將其結(jié)合表示,從而對(duì)刑期進(jìn)行預(yù)測(cè)。在實(shí)驗(yàn)驗(yàn)證中,本文所提出模型在MAE、SMAPE、EM以及ACC_10%等測(cè)量指標(biāo)上均具有優(yōu)越性。在MAE指標(biāo)上,基于多通道自注意力機(jī)制的刑事案件輔助判決模型達(dá)到最優(yōu),其將誤差降低至4.34,在ACC_10%等指標(biāo)上,該模型相較于其他模型有所提升。在此基礎(chǔ)上,將刑期進(jìn)行分段,評(píng)估不同階段刑期預(yù)測(cè)的準(zhǔn)確率。同時(shí),本文將各個(gè)省份的數(shù)據(jù)分別進(jìn)行訓(xùn)練,以驗(yàn)證不同省份數(shù)據(jù)對(duì)于該模型的靈敏度影響。

      猜你喜歡
      量刑注意力向量
      向量的分解
      讓注意力“飛”回來(lái)
      刑事程序法向度的量刑規(guī)范化研究
      聚焦“向量與三角”創(chuàng)新題
      “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
      A Beautiful Way Of Looking At Things
      向量垂直在解析幾何中的應(yīng)用
      向量五種“變身” 玩轉(zhuǎn)圓錐曲線
      論自首在量刑中的適用
      西藏科技(2015年5期)2015-09-26 11:55:20
      潛逃歸案疑犯的量刑規(guī)范
      广汉市| 云霄县| 将乐县| 石景山区| 蕉岭县| 云梦县| 晋城| 皋兰县| 太白县| 额济纳旗| 常山县| 海兴县| 万全县| 镇平县| 长子县| 江陵县| 徐汇区| 阿勒泰市| 丹东市| 舟山市| 旌德县| 张家口市| 巴东县| 永仁县| 东乡县| 德昌县| 乐安县| 临朐县| 镇原县| 宁南县| 志丹县| 鱼台县| 含山县| 法库县| 信宜市| 夹江县| 唐海县| 上杭县| 沧源| 静乐县| 晋宁县|