郭小丁,張宏莉
(哈爾濱工業(yè)大學 計算機科學與技術學院,哈爾濱 150001)
司法案例建模方法旨在將司法案例表示為案例相關預測算法能處理的數(shù)據(jù)結構,該數(shù)據(jù)結構保留原始數(shù)據(jù)中的有用信息,去除冗余信息,減少其對后續(xù)預測算法的干擾。司法案例建模方法是上層法律服務的基礎,為其提供數(shù)據(jù)支撐。簡潔有效的案例描述能有效地提高預測算法的準確率,降低其計算復雜度。
傳統(tǒng)司法案例建模方法主要基于特征模型和矩陣分解。特征模型利用特征詞典和特征抽取算法將司法案件表示為二維矩陣,如圖1 所示。然而,當特征和案例規(guī)模較大時,特征模型極易發(fā)生數(shù)據(jù)稀疏和維度爆炸。針對上述問題,基于矩陣分解的司法案例建模方法將特征模型得出的原始矩陣進行分解,并利用得出的矩陣表征案例。當矩陣分解算法與共現(xiàn)矩陣、主題模型相結合時,得出的司法案例表示具有一定的語義信息,如詞匯間相似性、主題與特征間關聯(lián)性。
圖1 基于特征模型以及矩陣分解的司法案例建模方法Fig.1 Judicial case modeling method based on feature models and matrix decomposition
基于矩陣分解的司法案例建模方法降低矩陣維度,避免維度爆炸及數(shù)據(jù)稀疏,有利于提高后續(xù)預測算法的準確率。但這類方法基于特征模型,存在特征模型的天然缺陷,無法從多個層面描述案例,難以捕捉不同案例模塊間的關聯(lián)信息。上述因素不利于提高后續(xù)預測算法的準確率。
針對司法案例建模問題,早期的研究主要圍繞特征模型展開,大體分為基于案例推理、本體模型、分類算法的司法案例建模方法。根據(jù)大量的法律專家知識和人工標注工作,上述方法利用特征抽取算法從原始案例數(shù)據(jù)中獲取案例特征,結合案例推理、本體模型與分類算法,依據(jù)現(xiàn)有特征預測出新的案例特征,得出基于特征標簽的司法案例模型。
針對司法案例建模問題,最早期的研究是利用大量的人工標注為案例及案例要素分配索引,進而從結構合理的案例文本中提取案例事實,并將其用于案例摘要分類和案例推理系統(tǒng)中。隨著數(shù)據(jù)挖掘技術的發(fā)展,研究者提出一種基于信息抽取的司法案例建模方法。結合特定領域的知識,該方法抽取出案例中的事件經(jīng)過,利用特征抽取技術捕捉個體行為中的動作,并對其進行識別。
Zeleznikow 一種新的用于信息檢索的司法案例建模方法[1]。該方法擴展傳統(tǒng)案例因素和組件,將每一個因素分解為更加細致的案例要素,同時將所有要素分為主觀要素、客觀要素和天然要素,針對每一個司法案例利用特征挖掘技術匹配案例特征,進而得出案例表征。實驗結果表明,針對信息檢索問題,該方法具有更高的準確率和滿意度,主要因素在于層次特征的使用。
長期以來,基于法律案例的推理(Legal Case-Based Reasoning,LCBR)一直是AI 和法律感興趣的話題,各種各樣的方法已經(jīng)發(fā)展。LCBR 的一項重要工作始于HYPO,HYPO 根據(jù)法律規(guī)范中的論點與反論點在每個維度對司法案例進行建模,提出一種基于案件要素的建模方法。Kevin 出一系列利用特征模型刻畫司法案例的方法,如CATO 和IBP,并將其用于法律案例推理應用中,根據(jù)大量調(diào)研和實踐,上述方法構建案例框架,從司法案例中抽取出原告、被告、指控罪名、主觀以及客觀態(tài)度等案例要素,為每一個案例要素設置索引,進而完成案例表征[2]。
Breuker 提出一種基于法律知識及用例分析的司法案例建模方法[3]。該方法根據(jù)專業(yè)人士從法律法規(guī)中獲取的案例要素信息,利用特征挖掘算法從真實案例中抽取出案例要素,根據(jù)大量調(diào)研,構建結構化論點模型,生成案例本體,進而建立案例要素與案例本體之間的映射,得出司法案例表征。Ashley 提出司法案例中責任與因果關系的發(fā)現(xiàn)方法,在充分考慮當事人責任歸屬的前提下,該方法構建專用的本體模型,并用其表征司法案例[4]。該模型涵蓋法律領域中常見的責任與因果關系,如職位責任、雇傭關系、競爭關系等。根據(jù)已有責任劃分和因果關系,該模型利用推理規(guī)則,自動獲取新的因果鏈以及責任歸屬?;诒倔w的司法案例責任與因果關系發(fā)現(xiàn)方法需要大量的概念知識庫,該知識庫中包含法律規(guī)范、法律概念和術語以及人們?nèi)粘I钪谐WR性詞匯表達等。
在此基礎上,研究者提出一種基于Web 本體語言的司法案例建模方法,以CATO 和LCBR為基礎,構建司法案例本體,確定本體中的關鍵案例要素,利用網(wǎng)絡中案例將本體實例化,進而實現(xiàn)不同案例間的組件共享[5-7]?;贠WL 的司法案例建模方法在案例信息檢索和案例推理方面具有廣泛的應用。
Lagos以司法案例中事件為單位,提出一種基于事件抽取的司法案例建模方法[5]。該方法從原始案例數(shù)據(jù)中抽取出關鍵實體,如案件中當事人、當事人參與的事件以及當事人接觸的其他人物等信息,利用規(guī)則推理技術抽取出實體之間的關系,進而得出實體與關系構成的事件,完成司法案例表征;Henry提出一種基于規(guī)則推理和啟發(fā)式要素搜索的司法案例建模方法,將規(guī)則推理嵌入案例建模過程中,半自動化抽取案例特征,在一定程度上減少了建模過程中的人工工作[6]。針對不同類型的司法案例,該方法依據(jù)大量的歷史案例數(shù)據(jù)庫,將最佳歷史案例作為指導性案例,根據(jù)指導性案例中的法律推理規(guī)則及決策結果,提出不同的案例要素推理規(guī)則與裁決方法,并將其用于后續(xù)司法案例的建模過程中。
基于特征模型的司法案例建模方法將司法案例表示為二維矩陣,此類方法主要存在以下不足:
(1)需要大量的法律專業(yè)知識和人工標注工作。特征模型構建特征詞典,并利用特征挖掘算法抽取出案例特征,進而將其表示為二維矩陣;
(2)對數(shù)據(jù)庫中詞匯和語法信息的依賴性強。當新增案例或者案例的特征詞典發(fā)生變化時,特征模型易發(fā)生較強波動,影響后續(xù)預測算法的準確率和穩(wěn)定性;
(3)極易發(fā)生維度爆炸和數(shù)據(jù)稀疏。當司法案例數(shù)量規(guī)模較大時,特征模型中易出現(xiàn)大量冗余信息,進而導致特征詞典命中率降低,發(fā)生數(shù)據(jù)稀疏和維度爆炸;
(4)無法從多個層面描述案例,捕捉不同案例模塊間的關聯(lián)信息。
當司法案例規(guī)模和案例特征數(shù)量較大時,基于特征模型的司法案例建模方法極易發(fā)生數(shù)據(jù)稀疏和維度爆炸。為了解決上述問題,研究者提出一系列基于矩陣分解的司法案例建模方法。
矩陣分解算法將特征模型得出的代表司法案例的原始矩陣分解為維度更低的矩陣,去除了原始矩陣中冗余信息,有效地提高后續(xù)預測算法的計算復速度和準確率。在以往研究中,矩陣分解算法常與共現(xiàn)矩陣、潛在語義分析相結合(Latent Semantic Analysis,LSA),共同完成司法案例建模。
當司法案例規(guī)模和特征數(shù)量較大時,特征模型極易出現(xiàn)數(shù)據(jù)稀疏和維度爆炸。為了解決上述問題,矩陣分解算法被廣泛用于主成分抽取和矩陣降維中。矩陣的奇異值分解理論是矩陣理論的重要組成部分,是研究最小兩乘積、廣義逆矩陣等問題的有力工具。目前存在多種矩陣分解算法,如奇異值分解(Singular Value Decomposition,SVD)、非負矩陣分解(Non-negative Matrix Factorization,NMF)。矩陣分解算法旨在將代表司法案例的原始矩陣映射到新的向量空間中。該向量空間由一組新的基構成。原始矩陣集合在新向量空間中的投影更加離散、具有區(qū)分性。矩陣分解算法去除原始矩陣中大量無用信息,保留有效信息,有助于提高后續(xù)預測算法的計算速度和準確率。
Gui 總結了矩陣分解在文本建模方面的應用,其提出的基于奇異值分解的矩陣分解算法可被用于司法案例建模[7]。該方法建立特征詞詞典,利用特征挖掘技術從原始數(shù)據(jù)中抽取特征詞匯,將司法案例表示為二維原始矩陣。在此基礎上,該方法利用基于奇異值分解的矩陣分解算法,將原始矩陣分解為維度更小的矩陣,并用其表征司法案例。實驗結果表明,對于司法案例文本類別預測,相較于特征模型,基于奇異值分解的矩陣分解算法更有利于提高預測算法準確率和計算速度。主要原因在于矩陣分解算法去除了原始矩陣中大量無用信息。
Yin 提出一種基于奇異值分解的司法案例建模方法,并將其用于法律咨詢系統(tǒng)中[8]。該方法利用空間向量模型作為表示方法,借助潛在語義分析理論,通過奇異值分解的降維方法構建一個低維的語義空間,并在語義空間上實現(xiàn)了咨詢問題與解答語句之間的相似度計算。針對司法案例中語句,該方法分別使用分詞、去停用詞、互信息擴展以及潛在語義分析,將咨詢語句映射至主題語義空間中,并利用SVD 分解得出其低維向量表示。
Symeonidis 提出一種基于聚合矩陣分解的司法案例建模方法[9]。該方法在奇異值分解的基礎上,根據(jù)文檔的主題和可讀性,利用余弦相似度或歐氏距離對司法案例進行建模。該方法使用特征模型將司法案例表示為二維矩陣,利用SVD 算法降低原始矩陣的維度,結合當前案例和相似案例的向量表示,獲得當前司法案例的數(shù)字化表征。實驗結果表明,相對于矩陣分解算法,聚合矩陣分解更有利于提高后續(xù)預測算法的準確率。
基于矩陣分解的司法案例建模方法在特征模型的基礎上,將得出的代表司法案例的原始矩陣分解為維度更小的矩陣。矩陣分解算法極大地降低原始矩陣維度,減少后續(xù)預測算法的計算復雜度。矩陣分解算法去除了原始矩陣中冗余信息,提高后續(xù)預測算法準確率。然而,基于矩陣分解的司法案例建模方法仍然存在特征模型的天然缺陷,不能從多個層面描述案例,捕捉不同案例模塊之間的關聯(lián)信息。
本文針對司法案例建模問題,給出近年來的相關研究成果,將司法案例建模方法劃分為兩類,即基于特征模型的方法和矩陣分解模型的方法,分析了二者的優(yōu)缺點,為研究人員提供參考和指導。