• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    司法大數(shù)據(jù)與人工智能開發(fā)的技術障礙*

    2018-02-06 16:29:09王祿生
    中國法律評論 2018年2期
    關鍵詞:類案量刑裁判

    王祿生

    東南大學法學院副教授

    江蘇高校區(qū)域法治發(fā)展協(xié)同創(chuàng)新中心研究員

    大約從2013年開始,我國法院進入了以智能化為核心的“智慧法院”建設時期。這實際上就是在傳統(tǒng)司法信息化建設的基礎之上,進一步利用大數(shù)據(jù)與人工智能等前沿技術,在人民法院全業(yè)務、全方位和全流程實現(xiàn)網(wǎng)絡化、陽光化和智能化。此后,“智慧法院”建設的司法現(xiàn)代化規(guī)劃逐步被國家戰(zhàn)略所認可。2016年7月,中共中央辦公廳、國務院辦公廳印發(fā)《國家信息化發(fā)展戰(zhàn)略綱要》和《“十三五”國家信息化規(guī)劃》,將建設“智慧法院”列入國家信息化發(fā)展戰(zhàn)略。2017年7月出臺的《新一代人工智能發(fā)展規(guī)劃》中則明確將“智慧法庭”列入規(guī)劃??梢灶A見,在未來一段時間內,大數(shù)據(jù)與人工智能驅動的“智慧法院”建設將會成為法院系統(tǒng)的工作重心之一。值得注意的是,在司法大數(shù)據(jù)與人工智能開發(fā)的過程中出現(xiàn)了片面技術理性的論調,這突出表現(xiàn)在認為技術能夠解決一切問題。從科技哲學的視角來看,科學技術都必然面臨一定的限度。因此,要更好地推動大數(shù)據(jù)與人工智能的司法應用,首先必須明晰它們的技術障礙所在。本文試對該問題談談淺見。

    一、司法大數(shù)據(jù)與人工智能開發(fā)的典型功能

    在“智慧法院”的整體架構下,大數(shù)據(jù)與人工智能技術被整合到四大應用場景之內——服務社會公眾、服務案件審判、服務判決執(zhí)行、服務司法管理。其中,為法官辦案提供智能輔助是“智慧法院”建設的核心目標之一。從目前全國各地的實踐來看,類案推薦、量刑輔助與偏離預警是大數(shù)據(jù)與人工智能技術在輔助法官辦案(“審判智能化”)領域最為典型的應用。1參見李林、田禾、呂艷濱:《中國法院信息化發(fā)展報告No.1(2017)》,社會科學文獻出版社2017年版,第9—10頁。在最高法院出臺的《關于加快建設智慧法院的意見》中,上述三大功能就被放置在“運用大數(shù)據(jù)和人工智能技術,按需提供精準智能服務”的標題之下。

    (一)“類案推薦”的功能概述

    類案推薦,顧名思義,即推薦與在辦案件最為相似的案件。判斷是否類似的標準主要是案件情節(jié)、適用法條與爭議焦點。該功能是目前全國各地智能法院辦案系統(tǒng)幾乎必備的模塊,主要包含類案的快速查詢、智能推送等功能,并可以進一步衍生出類似案件適用法條推薦、爭議焦點推薦、主要證據(jù)推薦等功能。日常生活中,我們的手機APP會收到各種推送,這些推送通過提取用戶喜愛的產(chǎn)品的特性,在數(shù)據(jù)庫中尋找相關的類別,再推送給用戶。類案推薦也是通過提取案件情節(jié),在數(shù)據(jù)庫中尋找情節(jié)最為類似的案件,推薦給法官。當然,對案件情節(jié)結構化工作(也稱“案件畫像”)的精細程度在很大程度上影響類案推薦的準確度。這一點將在后文的技術路徑中展開。

    類案推送在司法輔助中將占據(jù)重要地位。此前,江蘇、北京、上海等地法院的智能輔助辦案系統(tǒng)中均嵌入了類案推送的模塊。2參見《江蘇“智慧法院”信息化建設升級 為司法能力現(xiàn)代化注入新動力》,載《法制日報》2017年3月20日;《北京“睿法官”推進同案同判》,載《北京晨報》2017年2月24日;《上海應用“人工智能”辦案防范冤假錯案 全國首個“智能輔助辦案系統(tǒng)”問世》,載《法制日報》2017年7月11日。2018年1月5日,最高人民法院推出的“類案智能推送系統(tǒng)”也正式上線運行,具備類案快速查詢和智能推送等功能。3參見《周強在“智慧法院導航系統(tǒng)”“類案智能推送系統(tǒng)”上線活動上強調加快推進新時代智慧法院建設》,載《法制日報》2018年1月5日。

    (二)“量刑輔助”的功能概述

    量刑規(guī)范化改革是法治進步和時代發(fā)展的客觀需要?!耙?guī)范裁量權,將量刑納入法庭審理程序”是中央確定的重大司法改革項目。4參見《最高人民法院關于深化司法公開、促進司法公正情況的報告》,載《人民法院報》2016年11月9日。在此背景下,法官量刑輔助系統(tǒng)應運而生。應當明確的是,該系統(tǒng)只是為法官提供參考的工具,直接讓人工智能作出裁判并不符合司法的基本倫理。從技術路徑來看,量刑輔助系統(tǒng)就像天氣預報系統(tǒng),運用函數(shù)對各種變量(案件情節(jié))運算推測結果。具體而言,該功能模塊是采用正則表達式、上下文無關文法、命名實體識別等方式提取法律文書的情節(jié)信息,之后對提取的信息進行結構化,用數(shù)學模型來描述數(shù)據(jù)的特點和規(guī)律,算出與其最相符的數(shù)學模型或算法,人工智能通過模擬算法,根據(jù)情節(jié)推導量刑結果。5參見張德:《自然語言處理技術在司法過程中的應用研究》,載《信息與電腦》2017年第17期。從目前的開發(fā)來看,部分系統(tǒng)可以根據(jù)司法辦案系統(tǒng)內部的文書(如起訴書、庭審筆錄)自動提取情節(jié),從而匹配案件并進行量刑的推薦;部分系統(tǒng)則可以基于法官勾選情節(jié)的方式實現(xiàn)量刑推薦;也有部分系統(tǒng)兩種功能實現(xiàn)方式兼而有之。量刑推薦是司法大數(shù)據(jù)與人工智能開發(fā)的核心模塊之一,貴州的“法鏡系統(tǒng)”、6參見《貴州政法機關扎實推進科技創(chuàng)新與司法體制改革深度融合——大數(shù)據(jù)辦案 精準又公正》,載《人民日報》2017年7月 10 日。上?!?06工程”開發(fā)的“智能輔助辦案系統(tǒng)”7參見《上海應用“人工智能”辦案防范冤假錯案 全國首個“智能輔助辦案系統(tǒng)”問世》,載《法制日報》2017年7月11日。都具有量刑輔助的功能模塊,海南高院則專門開發(fā)了“量刑規(guī)范化智能輔助系統(tǒng)”為法官辦案提供決策參考。8參見《讓現(xiàn)代科技更好助力司法改革——海南智能量刑系統(tǒng)運行“多快好省”》,載《人民法院報》2017年12月9日。

    (三)“偏離預警”的功能概述

    如果說“量刑推薦”是針對法官未決案件的智能輔助的話,“偏離預警”則在更大程度上定位于對已決案件的質量控制。它是指人工智能依據(jù)算法推測的量刑幅度與法官裁判的量刑幅度進行比較,計算二者的偏離程度,針對偏離程度的高低給予不同等級的預警。它就像電梯的超重警報,對法官的裁判具有防控風險的功能。以刑事案件為例,在類案推送與量刑輔助系統(tǒng)的支撐下,系統(tǒng)通過運算能獲得關于本案的量刑區(qū)間,這個量刑區(qū)間的準確性也依賴于系統(tǒng)的成熟度與數(shù)據(jù)的完整度,數(shù)據(jù)越完整,量刑區(qū)間就越準確。系統(tǒng)把法官審理案件的裁判情況與人工智能的量刑區(qū)間進行對比,偏離特別高的話,意味著裁判結果可能存在合法性、合理性問題。當然,偏離預警是一個涵蓋面很廣的功能模塊,用類似的思路不僅可以解決判決結果的偏離預警,同樣可以通過對案件處理全流程的偏離情況進行預警,比如某個案件的辦理時間明顯超過其他類似案件的辦理時間。前者是實體偏離預警,后者則是程序偏離預警。據(jù)不完全統(tǒng)計,上海、江蘇、浙江、貴州、云南等省市已經(jīng)上線了包含“偏離預警”功能模塊的審判輔助系統(tǒng)。以江蘇為例,該省擁有最高人民法院在全國范圍內設立的首家“人民法院司法大數(shù)據(jù)研究基地”(江蘇省高院與東南大學共建)。依托科研優(yōu)勢,基地開發(fā)的“同案不同判預警系統(tǒng)”通過對海量刑事文書的深度學習,形成量刑算法,對高偏離度的案件進行自動預警,從而為統(tǒng)一裁判尺度提供技術支撐。9參見《貴州探索司法體制改革與科技創(chuàng)新深度融合譜寫“數(shù)字政法”“智慧司法”新篇章》,載《法制日報》2017年7月10 日;《大數(shù)據(jù)服務司法創(chuàng)新 云平臺助推司法公正——浙江高院聯(lián)手阿里巴巴打造“智慧法院”》,載《人民法院報》2015年11月25日;《大數(shù)據(jù)統(tǒng)一裁判尺度 直播提高司法公信力》,載《南方日報》2017年9月14日;《司法信息網(wǎng)絡化運行 大數(shù)據(jù)助力執(zhí)法辦案——云南探索智慧法院建設新模式》,載《人民法院報》2018年1月5日;《江蘇“智慧法院”信息化建設升級 為司法能力現(xiàn)代化注入新動力》,載《法制日報》2017年3月20日。

    二、司法大數(shù)據(jù)與人工智能開發(fā)的基本思路

    從技術路徑來看,類案推送、量刑輔助與偏離預警三大典型應用模塊在依照一條依次推進的技術路線展開,三者之間有很大的技術邏輯關聯(lián),同時也代表著司法大數(shù)據(jù)與人工智能應用“數(shù)據(jù)源—數(shù)據(jù)整合—知識構建”的一般思路。

    (一)圖譜構建

    知識圖譜是結構化的語義知識庫,用于以符號形式描述物理世界中的概念及其相互關系。知識圖譜的架構,包括知識圖譜自身的邏輯結構以及構建知識圖譜所采用的技術(體系)架構。10參見劉嶠、李楊、段宏、劉瑤、秦志光:《知識圖譜構建技術綜述》,載《計算機研究與發(fā)展》2016年第3期。從這個角度出發(fā),案件知識圖譜就是用符號形式描述的法律案件要素相互關系的——在類案推薦與偏離預警的應用場景下,主要是案件情節(jié)與裁判結果之間關系的——結構。以刑事案件為例,包括犯罪構成要件、量刑情節(jié)、法律規(guī)范、刑事政策等方面。知識圖譜有自頂而下和自底而上兩種構建方式。自頂而下指借助百科類網(wǎng)站等結構化數(shù)據(jù)源,從高質量數(shù)據(jù)中提取本體和模式信息,加入到知識庫中;而自底而上構建,則是借助一定的技術手段,從公開采集的數(shù)據(jù)中提取出資源模式,選擇其中置信度較高的新模式,經(jīng)人工審核之后,加入到知識庫中。11參見朱木易潔、鮑秉坤、徐常勝:《知識圖譜發(fā)展與構建的研究進展》,載《南京信息工程學報》(自然科學版)2017年第6期。案件知識圖譜的構建在實踐中也存在兩種模式。其一是自頂而下,即事先人為地設定好案件圖譜的相關結構,如主體、客體、客觀方面、主觀方面,以法律邏輯展開,形成系統(tǒng)的圖譜結構。然后,從海量的裁判文書、法律、司法解釋中提取相應的情節(jié)來充實形成完整的圖譜。比如在“盜竊金額”方面就可以細分為“數(shù)額較大”“數(shù)額巨大”“數(shù)額特別巨大”,并與具體金額掛鉤。其二則是自底而上,即事先不設定案件知識結構,而是通過對海量裁判文書的深度學習,自動地搭建出案件知識圖譜??梢园l(fā)現(xiàn),無論采用哪種模式,都離不開海量案件文書的支撐。因此,目前百花齊放的司法大數(shù)據(jù)與人工智能應用在某種程度上與中國裁判文書網(wǎng)的司法公開息息相關。

    (二)情節(jié)提取

    案件知識圖譜構建完成后,司法人工智能就可以嘗試依照知識圖譜確定的框架體系來識別每個案件。情節(jié)提取實際上就是將裁判文書中半結構化、非結構化的數(shù)據(jù)進行提取整合,形成結構化的標簽。當然,僅有知識圖譜還不能直接提取案件情節(jié),還需要一道橋梁,就是“自然語義識別技術”。在大數(shù)據(jù)時代,對海量文本信息進行有效的語義分析已經(jīng)是自然語言處理、信息檢索、信息分類、信息過濾、語義挖掘、文本的機器學習等諸多應用領域基礎且關鍵的研究問題,它影響著上層信息服務與信息共享的質量和水平。12參見秦春秀、祝婷、趙捧未、張毅:《自然語言語義分析研究進展》,載《圖書情報工作》2014年第22期。自然語義識別技術是處理自然語言的前提條件,自然語言一般是指人類社會中逐漸發(fā)明和演變的用于溝通交流的語言,表現(xiàn)為語音、手勢語、書面語言等。通過自然語義識別技術的框架,就可以自動實時、明確地從海量司法文書中提取知識圖譜構建所需的情節(jié),這是一個非常關鍵的環(huán)節(jié)。

    (三)類案識別

    完成情節(jié)的提取后,第三步就可以做類案識別。它的基本思路是依據(jù)已經(jīng)構建好的案件知識圖譜,通過自然語義識別技術從海量文書中提取情節(jié),將每個案件全方位地結構化與標簽化,然后,將具備相似情節(jié)的案件進行整合分類,形成不同維度之下的“類案”。目前許多類案推薦的基本原理就是在識別目標案件情節(jié)的基礎之上(也可以通過用戶勾選情節(jié)選擇),從已經(jīng)標簽化的案件大數(shù)據(jù)庫中匹配符合情節(jié)的案例。用技術語言來表述就是系統(tǒng)構建案件畫像,基于案情畫像知識庫,構建案例知識索引,便于加速檢索匹配過程。利用案情語義匹配功能,與案例知識庫進行案情相似性匹配和裁判結果相似性匹配,綜合二者匹配度獲得初步的類案。13參見張德:《自然語言處理技術在司法過程中的應用研究》,載《信息與電腦》2017年第17期。這很像圖書館把圖書依據(jù)性質分類,讀者再依據(jù)圖書種類查詢類似圖書的過程。

    (四)模型訓練

    實現(xiàn)類案識別后,就要對人工智能進行模型訓練,這是最為關鍵的一步,也是體現(xiàn)各個研發(fā)單位核心競爭力的步驟。當人工智能學習法律文書達到一定數(shù)量之后,就能夠讓人工智能模擬算法或者函數(shù),根據(jù)錄入文書提取的各種案件情節(jié),通過深度學習,得出應當?shù)玫降暮瘮?shù)結果(通常是判決結果)。模型訓練的基本原理是人工智能通過對大規(guī)模裁判文書分析建模,尋找案件要素特征到裁判罪名和量刑之間的高置信度的關聯(lián)規(guī)則,實現(xiàn)案件要素有機重構。關聯(lián)規(guī)則是如同“X→Y”的蘊含式,表示通過 X 應當可以推導“得到”Y,其中 X 和 Y 分別稱為關聯(lián)規(guī)則的先導和后繼。通過關聯(lián)規(guī)則挖掘能夠發(fā)現(xiàn)案件要素特征以及裁判罪名量刑之間的關聯(lián),分析案件判決邏輯過程與依據(jù)。這種能夠表征實際判案過程中的高置信度規(guī)則需要人工智能模擬訓練,14參見張德:《自然語言處理技術在司法過程中的應用研究》,載《信息與電腦》2017年第17期。其過程是一種從具體到抽象總結、升華的過程,如同推導數(shù)學公因式一樣,人工智能通過對海量學習案例庫、知識庫的內容,尋找情節(jié)與量刑間的關聯(lián)規(guī)則,得出“X→Y”的蘊含式或算法。系統(tǒng)根據(jù)不同的情節(jié)模擬出了相關算法,實際上是訓練了不同的模型。

    (五)量刑預測

    模型訓練的結果是形成量刑的算法,而算法的實質就是根據(jù)海量案件情節(jié)的組合擬合出符合量刑結果的函數(shù)。海量精準算法的積累使量刑預測成為可能:當一個案件傳入法官的裁判系統(tǒng)之后,就算僅有公訴文書,人工智能也可以通過自然語義識別技術,提取案件情節(jié),根據(jù)先前形成的算法推導量刑結果。公訴文書提供的情節(jié)一般比較少,細節(jié)也不清晰,所以可能預測結果不準確,但是隨著案件訴訟程序向前推進,相關的信息就會越來越多,系統(tǒng)做出的量刑預測就會更準確。量刑預測就像預測天氣情況一樣,根據(jù)條件推出可能的結果,離不開前面四個環(huán)節(jié)高效的運轉。預測天氣是為了未雨綢繆,預測量刑則是為法官尚未裁判的案件提供參考,幫助法官發(fā)現(xiàn)、解決問題,這關系著司法輔助系統(tǒng)的第二個模塊——量刑輔助。

    (六)偏離度測算

    量刑預測與偏離預警的功能都是為法官提供參考,不同的是量刑預測是針對未決案件,為法官提供量刑輔助,是判決前的參考;而偏離預警則是在法官裁判后提供參考,針對已決案件。案件偏離度測算實質是對已決案件的情節(jié)進行實時自動提取,再按照系統(tǒng)中的算法進行運算,從而計算出案件裁判的偏離度。按照偏離度的大小劃分等級,如果案件裁判偏離度很大,系統(tǒng)就會自動預警。對于偏離度較高的案件,法官可以在界面中看到偏離度偏高的原因,從而幫助法官衡量所作裁判的合理性。同樣,借助偏離預警功能模塊,法院案件管理部門也可以在判后完成對法官辦案質量的全樣本篩查。

    三、司法大數(shù)據(jù)與人工智能開發(fā)的技術障礙

    (一)圖譜構建的技術障礙

    知識圖譜構建是司法大數(shù)據(jù)與人工智能引用的關鍵環(huán)節(jié),其中信息抽取(information extraction)又是知識圖譜構建的第一步,分為實體抽取、關系抽取、屬性抽取。15參見劉嶠、李楊、段宏、劉瑤、秦志光:《知識圖譜構建技術綜述》,載《計算機研究與發(fā)展》2016年第3期。現(xiàn)階段,法律知識圖譜的構建尚未達到自動化的水平。也就是說,由于法律數(shù)據(jù)主要以非結構化和半結構化形式存在,對結構化數(shù)據(jù)有較大依賴度的“自底而上”的自動化、半自動化構建圖譜面臨極大的困難,人工智能通常無法自主、準確、高效地完成法律知識圖譜中的實體抽取、關系抽取與屬性抽取等工作。故而,多數(shù)研發(fā)主體采用“自頂而下”的方式,通過人工構造語法與語義規(guī)則推進知識圖譜的構建工作。然而,刑事案件的案由有400多種,民事案件的案由更是可以細分為上千種,所以,“自頂而下”法律知識圖譜構建過程對人工的過度依賴是現(xiàn)階段司法大數(shù)據(jù)人工智能發(fā)展面臨的最大難題之一。進而言之,由于案件知識圖譜構建速度與精度不足導致現(xiàn)有的智能辦案輔助系統(tǒng)的案由覆蓋十分有限,如2017年7月上線的 “上海刑事案件智能輔助辦案系統(tǒng)”(簡稱“206工程”)只覆蓋了18個罪名;16參見《上海應用“人工智能”辦案防范冤假錯案 全國首個“智能輔助辦案系統(tǒng)”問世》,載《法制日報》2017年7月11日。隨后,“上海民商事、行政案件智能輔助辦案系統(tǒng)”(簡稱“206工程”民商事版)第一階段只覆蓋了8個案由。17參見《上海智能輔助辦案覆蓋民商行政全領域 “206”工程民商事版試運行上線》,載《人民法院報》2017年12月3日。貴州法院打造的智慧審判模式在刑事方面也主要覆蓋了故意傷害、搶劫、盜竊等常見案由。18參見《貴州政法機關扎實推進科技創(chuàng)新與司法體制改革深度融合——大數(shù)據(jù)辦案 精準又公正》,載《人民日報》2017年7月 10 日。

    (二)情節(jié)提取的技術障礙

    眾所周知,盡管法律文書大致按照統(tǒng)一的格式展開,但法官和檢察官在撰寫法律文書時就相同事項卻存在多樣化表述方式。也就是說,在知識圖譜構建之后,無法通過傳統(tǒng)的關鍵詞匹配的方式提取情節(jié),而是必須借助成熟的自然語言處理技術。自然語言處理技術的實質是讓人工智能能夠從法律文書的法律語言中(自然語言的一種狀態(tài))準確提取相應情節(jié)。舉例而言,在法律文書中,被告人自首可能有相當多樣的自然語言表述,除了“自首”之外還可能是“自動投案”“代為投案”“如實供述罪名”等表述。自然語言處理技術的目標是能夠把一切實際上表示“自首”的自然語言表述精準識別,哪怕整個文書中并未出現(xiàn)“自首”二字。此種技術相較于傳統(tǒng)關鍵詞嚴格匹配的提取技術而言無疑有著極為顯著的優(yōu)勢?,F(xiàn)階段不同的研發(fā)主體,在該技術積累方面相差懸殊。實踐中,絕大多數(shù)研發(fā)主體較多地運用了通用的自然語義識別技術,未有針對性地根據(jù)司法場景進行迭代開發(fā)。這就會讓人工智能在基于案件知識圖譜提取案件情節(jié)時出現(xiàn)錯誤與遺漏,比如,盜竊罪案件中,法官對盜竊金額的描述可能分布在文書的不同位置,如果一個案件事實是盜竊了5000元,而自然語義識別技術卻將金額識別為2000元,那么就會導致后面的環(huán)節(jié)包括類案識別、量刑的模型訓練產(chǎn)生錯誤,進而造成前序相關工作功虧一簣。正因為普遍存在法律場景中自然語言處理技術的短板,現(xiàn)階段有相當部分研發(fā)主體采用純人工的方式為每個案件的情節(jié)打標簽。這無疑極大地限制了情節(jié)提取的效率,同時也給后續(xù)的類案識別與模型訓練制造了障礙。19模型訓練需要海量樣本的深度學習,而人工為情節(jié)打標簽的方法無疑極大限制了學習樣本的數(shù)量。

    (三)類案識別的技術障礙

    類案識別,其實是司法決策輔助都會必然運用到的,每個研發(fā)單位對這一方面都非常重視。類案識別面臨的問題主要是在具體的識別過程中,準確率偏低。類案識別準確率偏低的原因有兩點。一方面,在法律場景這個垂直領域的類案,不管是圖譜的構建還是自然語義識別,在技術上遭遇瓶頸。如前文所述,由于自然語義識別技術的不成熟,極有可能造成情節(jié)提取不完全、不準確,而類案識別是建立在對案件情節(jié)分析的基礎上,情節(jié)都沒有提取到位,這必然會導致類案識別準確率的下降。另一方面,非常重要的原因是,一線開發(fā)的技術人員往往未能準確定位一線法官對類案推薦的實際需求。具體而言,一線法官在不同場景對類案推薦的業(yè)務需求是差異化的。對于簡單案件而言,法官期待的“類案”可能是情節(jié)高度匹配,而對于復雜案件,法官對“類案”的期待則可能是法律關系或者爭議焦點相同。在這種應用場景中,完全情節(jié)匹配反而無法滿足法官的需求。

    解決類案識別準確率低的問題,不僅需要完善圖譜構建、自然語義識別技術,還需要設計、開發(fā)多種識別類案的方式。目前主要是以加權情節(jié)的類案匹配方式,即根據(jù)通過海量數(shù)據(jù)計算出不同情節(jié)與裁判結果之間的相關性強弱,從而對情節(jié)進行權重排序,在類案推薦時優(yōu)先匹配高權重情節(jié)。這種類案推薦方式的準確度要高于通過部分情節(jié)權重而匹配的推薦方式。當然未來的方向是以法律關系及案件爭議焦點為中心作類案識別,但是從現(xiàn)在人工智能還處于弱人工智能時代的背景來看,讓人工智能自動識別法律關系以及爭議焦點是不切實際的,難度很大,所以這也是類案識別開發(fā)過程中的技術障礙之一。

    (四)模型訓練的技術障礙

    模型訓練有多種方式,但是不管運用哪種方式,模擬訓練都存在一個很大的問題,也就是人工智能的悖論:“Garbage in, garbage out”(垃圾進,垃圾出),意思是說拿不好或不對的數(shù)據(jù)去做分析,會產(chǎn)生糟糕或是無用的結論。目前,司法人工智能通過模擬訓練形成的算法,都建立在對海量文書學習、訓練的基礎上,但是研發(fā)人員在現(xiàn)有技術條件下無法保證訓練的樣本文書全都是絕對正確的。如果文書本身就是錯誤或者存在瑕疵的,基于這些文書訓練產(chǎn)生的模型與算法就可能遭遇精確性困境。進而,再遵循這些算法對法官辦案進行輔助,可能的結果就是歷史的經(jīng)驗錯誤被不斷放大并形成、固化錯誤的“路徑依賴”。

    模型訓練還面臨“小樣本難題”。也就是說,人工智能的量刑模型訓練往往需要結合海量文書的深度學習形成,而司法實踐中部分案件整體樣本較少。在樣本不足的情況下,大數(shù)據(jù)智能將面臨困境。從目前的技術方向看,遷移學習是一個潛在的方向。遷移學習是運用已存有的知識對不同但相關領域問題進行求解的一種新的機器學習方法。兩個不同領域共享的因素越多,遷移學習就越容易。20參見莊福振、羅平、何清、史忠植:《遷移學習研究進展》,載《軟件學報》2015年第1期。比如,一個會騎自行車的人,往往很容易學會騎電動車。然而,理念與現(xiàn)實之間仍然有很大的差距,遷移學習作為可欲的方向之一至少在司法人工智能的開發(fā)領域尚未出現(xiàn)被實踐充分認可的成果。一方面,小樣本案件能否尋找到“臨近”的、有足夠相似度的大樣本進行遷移學習;另一方面,遷移學習之后的函數(shù)與小樣本案件之間擬合度是否充分。這都是法律人工智能模型訓練技術創(chuàng)新過程中的重要障礙。

    此外,模型訓練還面臨“過擬合”(overfitting)的技術“瓶頸”。一般而言,如果一個模型只在訓練樣本上表現(xiàn)得很好而不能對于新的數(shù)據(jù)樣本做出很好的預測,則稱為模型過擬合。21參見姚海鵬、王露瑤、劉韻潔:《大數(shù)據(jù)與人工智能導論》,人民郵電出版社2017年版,第27頁。當前量刑預測的模型訓練十分依賴判決樣本數(shù)據(jù)集的訓練,也就不可避免出現(xiàn)過擬合的現(xiàn)象——在訓練的判決書樣本之內,模型精準度很高,而當面臨新的判決書時,則準確性急劇下降。

    (五)量刑預測的技術障礙

    量刑預測是通過一套算法作量刑的預測,包括罪名預測、刑期預測和罰金預測。法官們本應因為有個得力的助手而感到期待,然而事實上,一線法官對這種量刑預測的系統(tǒng),似乎有些憂慮甚至并不買賬。一線法官對這種系統(tǒng)的擔憂在于,他們認為這套算法是個“黑盒子”,他們不知道算法是什么,不清楚這種量刑預測是如何計算出來的。這其實也是人工智能的悖論導致的,即人工智能算法的隱蔽性和案件裁判過程透明性間的沖突。這一沖突無法通過簡單的“可視化”就有效解決。這是因為,現(xiàn)在的人工智能司法輔助系統(tǒng),與20世紀90年代出現(xiàn)的量刑機器人不同。90年代將量刑視為一個線性模型,好比“1+1=2”這種決策方式,認為量刑可以是一系列加重、減輕情節(jié)的加減計算。但事實上,大數(shù)據(jù)的研究已經(jīng)揭示,法官的裁判過程并非是線性模型,法官要綜合考慮犯罪構成要件,加重、減輕、從輕等情節(jié),最終的判決結果往往是一個模糊決策?;诖?,許多研發(fā)主體在量刑決策的算法形成中也常常得到一個模糊決策函數(shù),在這種情況下,人工智能量刑預測的過程就很難通過可視化的方式呈現(xiàn)或將算法完全公開,法官與公眾也很可能因為技術門檻而無法充分理解。

    (六)偏離度測算的技術障礙

    偏離預警技術的研發(fā)目標實質上在于實現(xiàn)案件的同案同判。而在該技術的開發(fā)過程中,面臨諸多技術障礙,其中最為明顯的是偏離度測算模型的數(shù)據(jù)本地化問題。對于刑事案件,不同地區(qū)之間的量刑差異是較為顯著的,以盜竊罪為例,對于同樣的盜竊金額,經(jīng)濟發(fā)達地區(qū)的量刑很可能系統(tǒng)地低于經(jīng)濟不發(fā)達地區(qū)。因此,從偏離度預警模型構建的技術來看,勢必要考慮不同地區(qū)之間的量刑差異?,F(xiàn)階段,部分研發(fā)主體采用分省域構建數(shù)據(jù)本地化模型,也就是對不同省份的數(shù)據(jù)進行分別訓練,從而形成本地化的量刑模型。此種工作雖然有助于提升偏離度預警的準確性,但實際上在省域范圍內量刑的差異也是十分顯著的(如蘇南與蘇北,珠三角與粵東、粵西、粵北)。由此,對于技術開發(fā)主體而言,預警模型本地化工作的顆粒度就成為一個技術障礙,如果顆粒度過大(如以全國數(shù)據(jù)構建模型)其偏離度預警準確度將很可能存在系統(tǒng)性偏差;如果顆粒度過小(如以一個縣域數(shù)據(jù)構建模型),不僅會面臨樣本不足的問題,同樣還會使偏離預警追求同案同判的制度目標被消解。

    四、結語

    本文討論了在“弱人工智能時代”司法大數(shù)據(jù)與人工智能研發(fā)面臨的一些技術障礙,旨在冷靜反思當前過熱的司法技術主義熱潮。當然,這絕非對科技介入司法的全盤否定。實際上,前沿科技與司法領域的融合確實改變了傳統(tǒng)司法運作的面相,也實質上為司法效率與司法公正的提升創(chuàng)造了全新可能。從人類社會科技史來看,科學技術呈現(xiàn)出一種加速發(fā)展的態(tài)勢,當前存在的技術障礙也許在不遠的將來就可能被突破。尤其值得關注的是,2018年1月9日,科技部發(fā)布國家重點研發(fā)計劃(司法專題任務),第一批投入4.5億元(總投入9億元)來專門研究司法領域的科技問題,本文提及的技術障礙都在這一專項擬定研究的指南范圍之內。隨著全國范圍內對司法領域科技研究投入的增加,我們有理由期待司法領域的科技應用將迎來一個新的高潮。

    猜你喜歡
    類案量刑裁判
    刑事程序法向度的量刑規(guī)范化研究
    類案同判的司法裁判方法分析*——以“類比的運用”為考察點
    法律方法(2021年3期)2021-03-16 05:57:22
    推進“類案同判”構筑司法公平正義
    類案裁判中的法律方法運用
    法律方法(2020年2期)2020-11-16 01:23:18
    法官如此裁判
    法官如此裁判
    大數(shù)據(jù)助力“類案類判”的邏輯技術突破
    法大研究生(2020年1期)2020-07-22 06:04:54
    法律裁判中的比較推理
    法律方法(2019年4期)2019-11-16 01:07:10
    清代刑事裁判中的“從重”
    法律史評論(2018年0期)2018-12-06 09:22:28
    論自首在量刑中的適用
    西藏科技(2015年5期)2015-09-26 11:55:20
    张家界市| 高唐县| 华蓥市| 越西县| 库车县| 屯门区| 菏泽市| 巧家县| 抚宁县| 互助| 奈曼旗| 确山县| 祁连县| 栾城县| 滨海县| 堆龙德庆县| 乌拉特前旗| 上思县| 汉阴县| 道真| 定襄县| 中江县| 仁寿县| 凭祥市| 沧州市| 秦皇岛市| 涿鹿县| 沙河市| 乌兰察布市| 新田县| 枣庄市| 镇赉县| 台中市| 武定县| 兰州市| 德庆县| 和林格尔县| 静宁县| 孟州市| 凤庆县| 扬中市|