陳志奎,劉 杰,丁 鋒,王光澤,林 杰,鐘芳明,應志紅
(1.大連理工大學 軟件學院,遼寧 大連 116620;2.浪潮軟件集團有限公司,山東 濟南 250110;3.北京華宇信息技術有限公司,北京 100084)
智慧法院建設是在新一輪司法改革背景下提出的一項覆蓋全國各級人民法院的創(chuàng)新工程,旨在利用互聯網技術和人工智能技術,結合人民法院工作實際,為人民群眾提供更好的司法服務[1],實現審判執(zhí)行能力的現代化,促進司法為民和司法公正[2]。
跨域立案服務是貫徹落實“加快推進跨域立案訴訟服務改革,推動訴訟事項跨區(qū)域遠程辦理、跨層級聯動辦理”的重要舉措[3],能讓公民免于為了起訴立案長途奔波,免受舟車勞頓之苦,是一件實實在在的便民舉措[4]。然而,在跨域立案具體落實階段還存在一些問題,如:法院工作人員不足,技術和裝備缺乏,制度宣傳、釋明不到位,法院案多人少矛盾加劇等[5]。尤其是在對當事人的法律釋明方面[6],缺乏智能化手段以協(xié)助法官提高法律釋明效率。因此,基于人工智能的法律釋明算法研究具有重要的意義。該文以跨域立案中的法律釋明為背景,主要關注對當事人的適用法律條文推薦,研究適用法律的推薦方法。
該文針對跨域立案過程中的法律釋明業(yè)務需求,以向當事人釋明適用案件法律為目標,研究基于案例推理的適用法律推薦方法,并以民間借貸案由為例,對上述方法進行分析和驗證。首先,構建案例指標體系,以表示每一個案例,實現案例數據的數值化表示;其次,根據每個指標的重要程度,通過屬性值標準化處理、屬性值比重計算、屬性值的信息熵計算確定指標權重;在此基礎上,進行案例相似度計算,實現相似案例的查找,為后續(xù)的相似案例適用法律條文推薦提供支持;最后,提出一種排序權重方法對top5相似案例中的法律條文進行加權,計算推薦權值,根據推薦權值和設定的閾值條件,生成一組案件適用法律條文,推薦給跨域立案中的當事人。通過自行收集的民間借貸案由數據驗證,結果表明,該文提出的基于案例的推薦方法對于跨域立案中的適用法律條文推薦是有效的,推薦的法律條文具有參考價值。
案例推理運用過往經驗和知識解決問題,已成為人工智能領域的一個研究熱點,得到廣泛應用[7-11]。案例推理系統(tǒng)一般包括4個過程:案例檢索、案例重用、案例修改和案例保存[12]。而基于案例的推理是用歷史案例的信息或知識進行相似案問題求解的一種推理方法[13]。
推薦算法作為案例推理的關鍵技術,是依靠智能算法精準、高效推送信息服務或咨詢決策的一種技術[14]。推薦算法主要包括基于內容、基于協(xié)同、基于關聯規(guī)則、基于知識和組合推薦等。協(xié)同過濾算法通過收集、分析大量的數據來計算數據之間的相似性,進而生成與目標事務最相近的信息予以推薦;基于內容的協(xié)同算法是根據歷史行為來預測推薦結果[15-17]。如吳朋洋根據數據集的詞向量模型構建基于文檔相似度的數據模型[15],運用到法律文書推薦系統(tǒng)中;張虎等通過挖掘司法文書事實描述部分的特征,提出了基于多模型融合的法律推薦方法[16]?;陉P聯規(guī)則的推薦算法是將強關聯規(guī)則過濾和拆分,然后將拆分后的強關聯規(guī)則集成到相似度矩陣中。而基于混合的推薦則是將以上兩者或者更多的推薦結果融合在一起進行綜合推薦。
此外,通過調研發(fā)現,現階段法律條文推薦方面的工作未考慮不同的案由對應的指標屬性存在的差異,因此該文考慮通過設計特定的指標特征,通過計算指標權重之間的相似度并排序,為排名最高的N個所對應的法律條文設置權重,權重總和最大的N個作為輸出推薦給用戶。
該文提出的基于案例推理的跨域立案中民間借貸適用法律推薦的整體框架如圖1所示。圖中左側實線部分為構建歷史案例庫的流程,右側虛線表示對目標案例的驗證測試流程。該方法由四個步驟構成:第一步是指標數值化,將案件文本信息提取成向量;第二步是指標權重分析,設置不同的指標權重;第三步是相似案例計算,查找歷史案例庫中的最相似案例;最后一步是為目標案例推薦一組適用法律。下面將對每一個步驟進行詳細介紹。
圖1 文中方法總體框架
該文設計一套指標體系來描述案件,作為案件的特征用于相似度計算。指標的選取準則依據能夠盡可能地表示該案由,同時能夠區(qū)分其他的案由。對于民間借貸案件而言,依據《最高人民法院關于審理民間借貸案件適用法律若干問題的規(guī)定》、《最高人民法院關于適用〈中華人民共和國合同法〉若干問題的解釋(一)》等法律法規(guī),法院可根據借款金額、交付憑證、當事人的交易方式、交易習慣以及當事人的陳述等因素,對借貸事實進行綜合研判。因此,該文通過現有的民間借貸案件在審理過程中參考的法律法規(guī)進行初步的指標選取。此外,還在收集了裁判文書網上民間借貸案件材料的基礎上,對案件的判決情況進行分析,并將案件的實際判決依據與法律法規(guī)規(guī)定的要素對應上,形成本文描述民間借貸案由的主要指標。下面將詳細介紹民間借貸案件主要指標的選取過程與依據:
在民間借貸案件中,當事人的陳述與書證是最常見的證據形式。由于當事人陳述的特殊性,且證據效力客觀上弱于其他證據,因此,民間借貸案件更加依賴于書證,民間借貸的書證主要有借據與支付憑證兩種形式?!蹲罡呷嗣穹ㄔ宏P于審理民間借貸案件適用法律若干問題的規(guī)定》中第二條規(guī)定,出借人向人民法院起訴時,應當提供借據、收據、欠條等債權憑證以及其他能夠證明借貸法律關系存在的證據,借條、承諾書、轉賬說明、微信記錄等均為借貸證據,因此可根據證物的不同設計5種指標X1-X5;《最高人民法院關于審理民間借貸案件適用法律若干問題的規(guī)定》第九條規(guī)定現金支付、銀行轉賬、票據交付等付款方式,分別設計指標X6-X9表示付款方式;《最高人民法院關于審理民間借貸案件適用法律若干問題的規(guī)定》中第十六條規(guī)定,原告僅依據借據、收據、欠條等債權憑證提起民間借貸訴訟,被告抗辯已經償還借款,被告應當對其主張?zhí)峁┳C據證明,因此設計指標X10,表示是否償還借款;以同樣的方式設計其他指標,依據《最高人民法院關于審理民間借貸案件適用法律若干問題的規(guī)定》第十九條設計指標X11,表示償還金額;依據第二十五條、第三十條、第三十一條設計指標X12,表示是否有利息;依據第二十六條、第二十八條、第二十九條、第三十條、第三十一條設計指標X13,表示年利率;依據第二十九條設計指標X15,表示違約金及其他費用;依據第三十條、第三十一條設計指標X16,表示是否逾期;依據第三十二條設計指標X17,表示已歸還金額;依據第十六條設計指標X18,表示尚欠款金額;依據第十七條設計指標X19,表示是否有流水轉賬;在借貸過程中,借貸雙方約定實現債權的費用的承擔方式,根據《訴訟費用交納辦法》第五章第二十九條、《最高人民法院關于適用〈中華人民共和國合同法〉若干問題的解釋(一)》第二十六條設計指標X14,表示是否承擔訴訟費、保全費、擔保費、律師費。其中指標X1、X2、X3、X4、X5、X6、X7、X8、X9、X10、X12、X14、X16、X19為是(真)時,指標取值為1;為否(假),則指標取值為0。另外指標X11、X13、X15、X17、X18取值為實際具體的數值。由此便形成了文中用于描述民間借貸案件的指標體系,如表1所示,一共19個指標,即案件的特征描述可定義為一個19維的向量。
表1 民間借貸案件指標設計
該文以民間借貸案由為例展開說明指標的選取方法、適用法律的推薦等,對于跨域立案中的其他案由的案例可采用類似的方法進行指標的選取,從而能夠為不同案由的案例推薦適用法律。
在法律案例指標體系中,由于每個指標的重要程度和表達信息不同,因此需要確定法律案例指標體系中各個指標的重要程度。通常采用計算權重的方法來衡量指標重要性,而現有計算權重方法包含主觀賦權法、客觀賦權法、綜合賦權法。該文采用客觀賦權法中最常用的熵權法[18]計算指標權重。在該方法中,指標的信息熵值大小表示了指標變化程度的大小,熵值越大,指標權重也就越大。
下面介紹指標權重分析的具體步驟:
(1)屬性值標準化處理:
(1)
(2)特征屬性值比重計算:
(2)
式中,pij表示第i個案例的第j個指標屬性值占案例庫中該指標屬性值總和的比率。
(3)計算特征屬性值的熵值:
(3)
式中,ej表示第j個指標特征屬性值的熵值。
(4)特征屬性值信息熵計算:
dj=1-ej
(4)
式中,dj表示第j個指標特征屬性值的信息熵。
(5)特征屬性值權重計算:
(5)
式中,wj表示第j個指標特征屬性值的權重。
經過以上權重計算之后,便獲得了所設計的指標體系中各個指標的重要程度,以幫助在后續(xù)相似度計算中提高計算準確率。
基于案例推理中的重要步驟就是相似度的計算,該文在采用信息熵計算指標權重的基礎上,使用余弦相似度來計算各個案例之間的相似度關系。
相似度計算是基于案例推理中的關鍵一步,經過指標權重計算,衡量了各個指標的重要程度,在此基礎上,該文采用余弦相似度度量不同案例的相似度。
假設有n個案例構成案例庫A={a1,a2,…,an},每一個案例用向量表示為ai=(x1,x2,…,xm),目標案例是由向量b=(y1,y2,…,ym)表示,wj作為第j個指標特征屬性的權重,所以目標案例與案例庫中的每個案例之間的相似度計算公式為:
(6)
式中,歷史案例ai與目標案例b之間的相似度計算用sim(ai,b)表示;歷史案例ai的第j個指標特征屬性值為xj;目標案例b的第j個指標特征屬性值為yj;wj為公式(5)計算的權重參數。
通過式(6)能夠得到目標案例b與案例庫A中n個案例的相似度,將相似度按降序排列,得到一個相似度從大到小的排序結果,從而進行下一步的推薦。
根據計算出的案例相似度集合,選取與目標案例相似度最高的top5歷史案例。根據經驗,最相似的案例應該優(yōu)先被推薦,因為其中的適用法律更具參考性。然而,僅僅推薦top1案例的法律條文不足以滿足要求。例如,某一條法律沒有出現在top1案例中,但是在其他top5案例中都出現了,極有可能是目標案例的適用法律。因此,該文提出了一種排序權重方法對top5案例中的法律條文進行加權,計算推薦權值,該法律條文的被推薦權值大于等于某一閾值時,則加入到推薦列表中。此方法能夠讓排序靠前的案例的法律條文在推薦結果中占比較大,同時兼顧出現次數較多的法律條文。推薦權值的計算方法為:計算該法律條文所出現在的top5案例的權重和。top5案例的權重按照排序計算如公式(7)所示:
(7)
根據以上案例權重排序,則可以計算法律條文的推薦權值。
該文從裁判文書網收集了2 942 280條案由為民間借貸的案例,由于傳統(tǒng)的自動提取指標的方法,無法有效適用民間借貸案例,推薦適用法律條文的準確率偏低,因此通過對民間借貸案例的綜合分析,設計了一套符合其案例的特征屬性,手動提取150條案例,并將其劃分為測試數據和案例庫數據,其中案例庫數據為130條,測試數據20條。經過指標和數值化之后,每個案例表示為19維的向量。為了保證指標特征的提取和法律條文的預測能力,該文考慮僅對單個案由民間借貸的案件進行法律條文的預測推薦。
由于推薦的法律條文結果存在多于、少于適用法律條文結果,或者與適用法律條文不匹配的現象,所以在推薦精準率和召回率的基礎上,該文采用METEOR和F1-Score兩種評價指標,它們在圖像標注領域應用廣泛,能夠很好地反映推薦性能。METEOR方法基于1元組的精度和召回的調和平均來計算。該方法將1條法律條文當作1個單詞,并對其一致性進行衡量。METEOR結果越高,適用法律推薦的性能越好。F1-Score是分類問題的一個衡量指標,F1-Score測量值綜合考慮了查全率和查準率的性能評價指標。
推薦法律條文是建立在與目標案例相似度最高的top5的基礎上,將相似度top5的案例對應的法律條文進行加權求和,每一條法律條文將得到一個推薦權值,用wr表示;在實驗中,設置法律條文被推薦的權值閾值t,當被推薦權值大于等于t,則該條法律被推薦。根據2.4節(jié)中的推薦權值計算方式,若一條法律僅出現在top1案例中,則推薦權值為1。因為相似度最高的top1案例中的法律條文最具有參考價值,基于此,該文將閾值t設置為1。如此,top1案例的法律條文全部推薦,同時,在其他top5案例中的法律條文,若推薦權值滿足條件也進行推薦。例如,在相似度排名第二的案例中的某一條法律在后續(xù)的案例中也出現且次數大于1,則同樣會被推薦。
除了該文使用的指標設計及數值化方法之外,還設置了此方法的對比方法——基于TF-IDF(詞頻逆文檔率)對文本進行向量化表示,將每個文本轉換成一個60維的向量,用來表示一個案例。
3.4.1 性能評價
通過民間借貸中20個目標案例與130個歷史案例的實驗,統(tǒng)計每個目標案例的法律條文推薦結果,推薦法律條文的精準度為0.331 6,召回率為0.574 2,所以METEOR、F1-Score兩個值分別為0.496 5、0.382 6。實驗結果如表2所示。
表2 評價指標結果
通過對比指標提取方法TF-IDF,該文采用法律條文推薦方法的精準度、召回率、METEOR、F1-Score的值均高于IF-IDF方法的對應值(見圖2)。實驗結果表明,該文采用確定指標的方法更加準確,推薦結果也更加準確。
圖2 文中方法與TF-IDF對比結果
3.4.2 案例分析
為了進一步形象化地分析該文提出方法的性能,下面隨機選擇幾個案例作為目標案例,進行實際案例分析。隨機選擇4個案例,分析之后,獲得最相似的5個歷史案例。然后,針對每一個案例,從它最相似的5個案例中,抽取出推薦法律條文,結果如圖3所示。圖中,第一列代表目標案例;第二列為實際法律條文,即目標案例在最終的判決結果中適用的法律條文;第三列為推薦法律條文,即經過法律案例相似度計算模型,選取相似案例,對相似案例的法律條文加權之后的結果。圖中*表示推薦正確的法律條文,**表示推薦錯誤的法律條文,***表示未被推薦到的法律條文。
從案例1中可以發(fā)現,待推薦的法律條文與實際適用法律條文數量相同,都為4條,其中有3條推薦結
圖3 推薦法律條文與參考法律條文對比示例
果與參考法律條文匹配,準確率為75%,召回率為75%。從案例2的對比結果可以發(fā)現,實際適用法律條文有5條,而推薦法律條文為4條,且推薦結果準確率達到75%,但是推薦結果有紕漏,推薦的完成性(召回率)為60%。案例3中參考法律條文有6條,而推薦法律條文7條,5條結果推薦正確,準確率為71%,召回率為83%。以上是三種比較常見的結果。從以上實際案例分析來看,該文提出的方法基本上能夠滿足跨域立案中對于適用法律的推薦的要求,推薦結果具有參考價值。
針對跨域立案中對于法律釋明向當事人推薦適用法律的需求,基于民間借貸案件,該文提出了一種基于案例推理的方法。通過民間借貸案由數據的實驗驗證,提出的方法在該任務上是有效的。該文在驗證模型有效性方面只考慮了民間借貸一個案由,搜集的數據量較少,未來將進一步擴充數據量,增加案由的可選擇性。