張舟 劉文清
(江蘇師范大學(xué) 江蘇 徐州 221116)
隨著人工智能技術(shù)的迅猛發(fā)展,其在各領(lǐng)域的應(yīng)用也日益廣泛,在計算機視覺、自然語言處理、語音識別等領(lǐng)域取得了重要突破。法律領(lǐng)域作為檢驗人工智能理論價值與技術(shù)性能的有效領(lǐng)域之一,也自然而然地接入了人工智能技術(shù)。智慧法院、智慧檢務(wù)建設(shè)等國家重大工程,便是法律人工智能的落地應(yīng)用之一。我國還探索建立了一些法律人工智能模型,如:冪律智能和智譜AI 聯(lián)合推出的基于中文千億大模型的法律垂直大模型PowerLawGLM;清華大學(xué)自然語言處理實驗室開發(fā)的OpenCLaP、LawFormer 等。這些垂直模型一定程度上規(guī)避了通用大模型應(yīng)用于法律領(lǐng)域時由于專業(yè)知識及數(shù)據(jù)的欠缺而出現(xiàn)的法律知識錯誤、專業(yè)引用偏差等問題。此外,大數(shù)據(jù)和人工智能技術(shù)已經(jīng)被廣泛應(yīng)用在自動定罪量刑、法律信息檢索、法律依據(jù)推薦、類案推送、自動法律問答等若干領(lǐng)域,協(xié)助解決技術(shù)含量低且重復(fù)率高的工作,提升了法律實踐的質(zhì)量和效率。法律推理是由已知的法律命題或事實命題推導(dǎo)出未知法律命題(結(jié)論)的過程[1],是法律人工智能的核心論題,探索建立法律推理的模型有利于進(jìn)一步發(fā)展法律人工智能。
“人工智能法律系統(tǒng)的發(fā)展源于兩種動力:一是法律實踐自身的要求。二是人工智能發(fā)展的需要。[2]”法律實踐需要人工智能,人工智能技術(shù)的價值體現(xiàn)為提升法律實踐的質(zhì)效,法律實踐對人工智能的渴求成為驅(qū)動兩者融合的源動力。
現(xiàn)階段人工智能在法律領(lǐng)域的應(yīng)用多為輔助司法裁判、預(yù)測刑期及類案檢索等輔助性工作,雖在一定程度上提升了法律任務(wù)執(zhí)行的質(zhì)效,緩解了“案多人少”的窘境,但仍無法步入司法審判核心領(lǐng)域??傮w而言,法律人工智能的技術(shù)機理是由感知智能走向認(rèn)知智能,再形成法律決策的過程。感知智能屬于初階智能,主要包含語音識別與合成、圖像識別和視頻智能化處理技術(shù),意在模擬人類的語言表達(dá)、視覺和聽覺感知能力。感知智能在法律領(lǐng)域的應(yīng)用場景主要包括:庭審語音的轉(zhuǎn)錄,圖像證據(jù)識別、庭審視頻自動巡查等[3]。如在“北京菲林律師事務(wù)所訴北京百度網(wǎng)訊科技有限公司侵害作品信息網(wǎng)絡(luò)傳播權(quán)案”中,法院參考使用了人工智能技術(shù)來分析涉案作品的獨創(chuàng)性等問題從而做出判決。認(rèn)知智能是人工智能的高級階段,旨在模擬人類的高階智能,主要包括:自然語言表達(dá)、語義理解、知識表達(dá)、邏輯推理和自主學(xué)習(xí)等能力。認(rèn)知智能在法律領(lǐng)域的應(yīng)用主要是在法律文本分析、法律知識表達(dá)、法律推理和法律論證,以及多種依賴法律知識決策的多樣化任務(wù)[3]。如北京市高級人民法院推出的“睿法官”人工智能系統(tǒng),可以通過自然語言處理技術(shù)對大量的裁判文書進(jìn)行分析和處理,幫助法官更快地找到相關(guān)的法律條款和案例,提高工作效率,但其處理結(jié)果僅能作為最終裁判的參考。
法律人工智能的發(fā)展史經(jīng)歷了三次波峰,第一次波峰是以法律推理刻畫法律人的理性思維和邏輯推理,第二次波峰是以法律專家系統(tǒng)支持法律任務(wù)決策,第三次波峰是當(dāng)前由法律大數(shù)據(jù)所驅(qū)動的人工智能的全面應(yīng)用[4]。整個發(fā)展過程不只是將大量的法律文本信息化、數(shù)據(jù)化,而是通過多輪多次高質(zhì)量法律文本數(shù)據(jù)清洗及模型增量訓(xùn)練形成垂直應(yīng)用模型,為法律實踐提供所需的解決問題的理論、技術(shù)與方法。
盡管人工智能技術(shù)在法律領(lǐng)域具有廣泛的應(yīng)用前景,但在實際應(yīng)用過程中仍面臨挑戰(zhàn),主要包括以下幾個方面:一是數(shù)據(jù)安全與隱私保護(hù)問題:人工智能技術(shù)的開發(fā)與應(yīng)用中涉及到的海量數(shù)據(jù)的質(zhì)量與隱私保護(hù)問題成為制約其發(fā)展的重要因素;二是法律法規(guī)滯后問題:隨著人工智能技術(shù)的發(fā)展,可能出現(xiàn)一些新的法律法規(guī)無法適應(yīng)的現(xiàn)象,這就需要及時關(guān)注并跟進(jìn)相關(guān)法律法規(guī)的發(fā)展動態(tài);三是技術(shù)成熟度與可靠性問題:目前,人工智能技術(shù)在法律領(lǐng)域的應(yīng)用尚未完全成熟,部分技術(shù)可能存在誤判的風(fēng)險;四是人工智能倫理道德問題:隨著人工智能技術(shù)的廣泛應(yīng)用,如何在保障技術(shù)發(fā)展的同時兼顧倫理道德問題成為亟待解決的問題。
隨著人工智能技術(shù)的發(fā)展,現(xiàn)階段人工智能的核心問題可歸結(jié)為實現(xiàn)機器的自動推理[5],相應(yīng)的,法律人工智能的核心問題也轉(zhuǎn)變?yōu)樽詣臃赏评淼膶崿F(xiàn)問題。從法律人工智能發(fā)展史來看,法律人工智能領(lǐng)域中自動法律推理建模有兩種經(jīng)典路徑:一是規(guī)則推理路徑;二是案例推理路徑。然而,大數(shù)據(jù)時代的到來卻催生了第三種推理建模路徑,即大數(shù)據(jù)推理建模路徑[6]。無論法律推理建模路徑如何發(fā)展選擇,其最終目的都是使人工智能可以通過分析大量的法律數(shù)據(jù)來識別相關(guān)的案例和法規(guī),并將其應(yīng)用于當(dāng)前的案件中。在人工智能背景下建立法律推理模型需要充分了解現(xiàn)有的法律法規(guī)體系,搜集相關(guān)案例和數(shù)據(jù),選擇合適的算法和技術(shù),并對模型的性能進(jìn)行評估。人工智能法律推理模型作為一種垂直大模型,其構(gòu)建方法同通用大模型構(gòu)建的基礎(chǔ)方法基本相同,但又有其獨特之處。在建立法律推理模型時,要在確定模型目標(biāo)與應(yīng)用場景的基礎(chǔ)上收集整理用于訓(xùn)練模型的相關(guān)法律數(shù)據(jù),選擇合適的算法和技術(shù)并對模型進(jìn)行評估和優(yōu)化。通過數(shù)據(jù)預(yù)處理、模型訓(xùn)練優(yōu)化、模型選擇應(yīng)用等步驟,從基座層、對話層、應(yīng)用層三層結(jié)構(gòu)入手進(jìn)行開發(fā)建構(gòu)。
人工智能法律推理模型構(gòu)建中的數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、特征選擇、數(shù)據(jù)融合等步驟,以提高數(shù)據(jù)質(zhì)量和適用性。具體處理步驟如下:首先是數(shù)據(jù)清洗,指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤,包括檢查數(shù)據(jù)一致性,處理無效值和缺失值等,通過這一步驟以達(dá)成去除重復(fù)數(shù)據(jù)、缺失數(shù)據(jù)、異常數(shù)據(jù)的目的。其次是數(shù)據(jù)整合,即將不同數(shù)據(jù)源的數(shù)據(jù)收集整理后加載入新的數(shù)據(jù)源提供統(tǒng)一數(shù)據(jù)視圖,提高數(shù)據(jù)質(zhì)量和完整性,提升數(shù)據(jù)管理效率和利用率,從準(zhǔn)確和相關(guān)的數(shù)據(jù)中更快獲取有意義的見解。再次是數(shù)據(jù)轉(zhuǎn)換,即將文本數(shù)據(jù)轉(zhuǎn)化為可供模型輸入的向量表示。數(shù)據(jù)轉(zhuǎn)換的目的和方法包括數(shù)據(jù)類型轉(zhuǎn)換、數(shù)據(jù)語義轉(zhuǎn)換、數(shù)據(jù)粒度轉(zhuǎn)換、圖標(biāo)或數(shù)據(jù)拆分、行列轉(zhuǎn)換、數(shù)據(jù)離散化、提煉新字段、屬性構(gòu)造、數(shù)據(jù)壓縮等。最后是數(shù)據(jù)標(biāo)注,即對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化標(biāo)注的過程,用于提高數(shù)據(jù)的可用性和可比較性,以便計算機識別。在對大量的法律法規(guī)、案例資料等法律文本數(shù)據(jù)化、信息化的基礎(chǔ)上,通過多輪高質(zhì)量的數(shù)據(jù)清洗與標(biāo)注整合,提高人工智能模型對法律文本的敏感度,同時確保模型的準(zhǔn)確性和時效性。
要根據(jù)具體應(yīng)用場景和需求,選擇合適的人工智能模型,如基于知識圖譜的法律推理模型、基于深度學(xué)習(xí)的法律推理模型等。法律人工智能推理模型的選擇需要考慮多個因素,如模型的可解釋性、模型的準(zhǔn)確性、模型的效率等。一些研究表明,基于規(guī)則的推理模型在法律領(lǐng)域中表現(xiàn)出色,但是這種方法可能會導(dǎo)致模型過于復(fù)雜,難以解釋和修改。另一種方法是使用機器學(xué)習(xí)技術(shù),例如決策樹、支持向量機等來訓(xùn)練模型。這種方法可以提高模型的準(zhǔn)確性和效率,但是需要更多的數(shù)據(jù)和計算資源。在建立法律推理模型時,還需要選擇合適的算法和技術(shù)并關(guān)注這些算法和技術(shù)在不同領(lǐng)域的應(yīng)用效果,以便選擇最適合的法律推理模型。
通過機器學(xué)習(xí)算法對模型進(jìn)行訓(xùn)練和優(yōu)化,以提高模型的準(zhǔn)確性和可靠性。包括模型參數(shù)調(diào)整、模型評估與驗證等步驟。在訓(xùn)練階段,可將法律數(shù)據(jù)大規(guī)模注入模型,并對這些知識進(jìn)行特殊處理和加強,以確保模型在后續(xù)推理中具備法律先驗知識并保持穩(wěn)健。在訓(xùn)練好法律推理模型后,需要對模型進(jìn)行評估和驗證,確保其符合預(yù)期的性能要求??梢酝ㄟ^與專業(yè)律師的對比測試、實際案例的預(yù)測結(jié)果等方式對其進(jìn)行性能評估。若模型性能不滿足預(yù)期,則需對模型進(jìn)行進(jìn)一步調(diào)整和優(yōu)化。
模型應(yīng)用即將訓(xùn)練好的模型應(yīng)用于實際案例中,嘗試進(jìn)行案例分析、法律問答與審判輔助等實踐操作,并根據(jù)實際應(yīng)用效果對模型進(jìn)一步調(diào)整優(yōu)化。法律推理模型的應(yīng)用場景有其特殊性,對結(jié)果的準(zhǔn)確性、可解釋性要求較高,直接使用大模型來端到端生成回答會面臨很多效果問題,例如引用失效法律、杜撰法條案例等“人工智能幻覺”現(xiàn)象。因此,為保證人工智能法律推理模型的應(yīng)用效果,需要進(jìn)行人工評測,法律從業(yè)者從專業(yè)角度對法律推理模型所生成的結(jié)果進(jìn)行全方位、多維度的測評。評測的維度包括:對問題點的把握是否準(zhǔn)確、對問題所含信息的分析是否全面準(zhǔn)確、答案的操作可行性強弱、答案的法律專業(yè)性程度、法律依據(jù)有無,以及準(zhǔn)確性全面性程度。
綜上所述,法律推理模型的開發(fā)者應(yīng)當(dāng)設(shè)計一系列通用型及場景特定型的工程化優(yōu)化方案,通過閱讀投喂大量法律文本進(jìn)行數(shù)據(jù)預(yù)處理的基座層、利用大量的法律領(lǐng)域?qū)υ挃?shù)據(jù)進(jìn)行模型選擇訓(xùn)練與監(jiān)督微調(diào)的對話層以及保證輸出結(jié)果質(zhì)量和可靠性的應(yīng)用層這三層構(gòu)建結(jié)構(gòu)出發(fā),提升大模型對法律專業(yè)文本的理解、推理與生成能力。
從法律人工智能應(yīng)用現(xiàn)狀來看,其主要適用于證據(jù)搜集、法律文書撰寫等司法輔助領(lǐng)域,從整體趨勢上看,信息歸類、法律檢索等耗時長、重復(fù)性高的工作將完全由其代替。國內(nèi)知名的大成律師事務(wù)所在2016 年就創(chuàng)建了自己的人工智能實驗室Nextlaw Labs,并與IBM 公司的認(rèn)知技術(shù)平臺沃森(Watson)合作開發(fā)了法律人工智能產(chǎn)品ROSS[7]。使用法律人工智能具有顯而易見的優(yōu)勢:通過自動化處理大量法律文書和案例,幫助法律從業(yè)者更快地找到相關(guān)信息,提高工作效率;利用人工智能技術(shù),可以更準(zhǔn)確地分析案件,提高法律服務(wù)質(zhì)量;部分工作的自動化處理能夠減少從業(yè)人員工作量從而降低法律服務(wù)成本。
人工智能能否得到飛躍性發(fā)展,認(rèn)知智能的突破是關(guān)鍵。認(rèn)知智能可以幫助機器跨越模態(tài)理解數(shù)據(jù),學(xué)習(xí)到最接近人腦認(rèn)知的“一般表達(dá)”,獲得類似人腦的多模感知能力[8]。人工智能法律推理要求將整個法律推理的過程都交給人工智能去處理,在建立全樣本數(shù)據(jù)庫的基礎(chǔ)上通過算法的運行自動獲得裁判結(jié)果[9]。但目前人工智能技術(shù)的發(fā)展水平顯然無法完全模擬法律人的思維過程,法律推理模型對法律文本的處理分析結(jié)果僅能作為司法裁判過程中的輔助性參考,需要在“人機交互”的運行模式下進(jìn)一步探索發(fā)展。隨著人工智能技術(shù)的不斷突破發(fā)展,法律推理模型具有廣闊的應(yīng)用前景,其將在基于大數(shù)據(jù)和自然語言處理的法律文書智能化處理、基于模型的法律信息檢索、面向電子取證和其他應(yīng)用的機器學(xué)習(xí)與數(shù)據(jù)挖掘以及多智能體系統(tǒng)中的法律推理等方面發(fā)揮重要作用。
基于大數(shù)據(jù)的法律文書智能化處理能夠自動化處理大量法律文書,從海量數(shù)據(jù)中篩選提取出個案有關(guān)的信息,在節(jié)省人力與時間成本的同時,提高法規(guī)檢索及類案查找的準(zhǔn)確性與周嚴(yán)性,從而提升法律服務(wù)效率、降低法律風(fēng)險?;谌斯ぶ悄艿姆赏评砟P屯ㄟ^機器學(xué)習(xí)和自然語言處理技術(shù),對輸入的數(shù)據(jù)進(jìn)行分析和預(yù)測,挖掘出數(shù)據(jù)背后的規(guī)律和趨勢,利于對類案進(jìn)行總結(jié)歸納,實現(xiàn)法律推理模型的案例推理路徑,從而提高判決的準(zhǔn)確性,更好地促進(jìn)司法公正、保障人權(quán)。法律推理模型還可以通過可視化技術(shù)將復(fù)雜的法律概念轉(zhuǎn)化為簡單易懂的形式,提高法律法規(guī)的可解釋性,推動法律科技的發(fā)展,助力法治建設(shè)。此外,人工智能法律推理不同于傳統(tǒng)法律推理,傳統(tǒng)法律推理是在對法律規(guī)則及其文本解析的基礎(chǔ)上通過人類思維活動將價值判斷融入推理過程中,得出的裁判結(jié)果始終充斥法官個人主觀利益衡量的影子。而人工智能法律推理則更注重通過對同案判決的深度學(xué)習(xí)自主挖掘法律外因素,以案例推理作為規(guī)則推理的補充,輔之以大數(shù)據(jù)推理吸納法律文本外的裁判規(guī)則作為演繹的基礎(chǔ),能夠為法官的司法裁判、律師等法律從業(yè)者對裁判結(jié)果的預(yù)測提供良好的參照。
盡管基于人工智能的法律推理模型具有廣闊的發(fā)展前景,但在實際應(yīng)用過程中仍需關(guān)注以下風(fēng)險并提出相應(yīng)的應(yīng)對措施:
一是技術(shù)風(fēng)險,包括數(shù)據(jù)安全、隱私保護(hù)和算法公正性等方面。法律推理模型需要大量的法律數(shù)據(jù)進(jìn)行訓(xùn)練,如何確保這些數(shù)據(jù)的安全及相關(guān)隱私權(quán)益是一個重要問題。首先要確保數(shù)據(jù)來源的安全性,除公開的數(shù)據(jù)資料外,涉及個人隱私、商業(yè)秘密的法律文本在獲取時應(yīng)同權(quán)利人簽訂保密協(xié)議,明確數(shù)據(jù)使用范圍和保密責(zé)任。其次在數(shù)據(jù)處理時,應(yīng)對收集到的數(shù)據(jù)進(jìn)行去標(biāo)識化處理,進(jìn)一步保護(hù)所涉權(quán)益人的隱私,同時建立完善的數(shù)據(jù)備份和恢復(fù)機制,以防止數(shù)據(jù)丟失或泄露。最后應(yīng)該明確規(guī)定數(shù)據(jù)使用范圍和目的,嚴(yán)格遵守相關(guān)法律法規(guī),建立完善的數(shù)據(jù)安全管理制度,確保數(shù)據(jù)在存儲、傳輸和使用過程中的安全。此外,為了保證算法公正性,防止對某些特定群體產(chǎn)生不公平的影響,算法設(shè)計應(yīng)該遵循平等機會、非歧視性、透明度等公平性原則,并建立完善的監(jiān)督機制,以確保其公正性。
二是法律風(fēng)險,包括法律法規(guī)滯后、法律適用準(zhǔn)確度、法律責(zé)任界定等方面。一方面,為解決法律法規(guī)滯后同社會發(fā)展與技術(shù)更新之間的矛盾,需要模型開發(fā)者及時跟進(jìn)相關(guān)法律法規(guī)的發(fā)展動態(tài),推動法律法規(guī)的更新與完善以適應(yīng)新技術(shù)、新社會現(xiàn)象。另一方面,技術(shù)發(fā)展也存在局限性,現(xiàn)有技術(shù)的局限同法律適用準(zhǔn)確度之間存在矛盾,要化解這一矛盾必須突破技術(shù)發(fā)展局限,在充分發(fā)展人工智能技術(shù)的基礎(chǔ)上尋求提高法律人工智能法律適用準(zhǔn)確度的破局之策。此外,當(dāng)法律推理模型出現(xiàn)錯誤時,如何界定其法律責(zé)任是一個復(fù)雜的問題。
三是其他風(fēng)險,主要包括倫理道德風(fēng)險與人工智能技術(shù)特性固有的風(fēng)險,如人工智能工具屬性與人工智能模型的可解釋性問題。倫理道德風(fēng)險主要體現(xiàn)為設(shè)計風(fēng)險、算法風(fēng)險和應(yīng)用場景風(fēng)險,具體而言開發(fā)者的個人道德準(zhǔn)則、“算法黑箱”以及法律領(lǐng)域具體應(yīng)用的道德問題都可能成為法律推理模型的應(yīng)用風(fēng)險。此外還需進(jìn)一步研究以尋求人工智能工具屬性的單一功能與法官辦案充分運用法、情與理的矛盾之解決良策。
目前的法律人工智能系統(tǒng)離真正意義上的“智能”仍有不小的距離,還屬于“技術(shù)輔助”的范疇。由于技術(shù)條件的限制,人工智能還不能完全模擬法律從業(yè)者在面對具體個案時的全部思維過程,法律人工智能背景下的法律推理也受到算法和邏輯的掣肘,但其作為一種輔助性工具在司法裁判領(lǐng)域的應(yīng)用,也具有不可小覷的價值與功用。應(yīng)當(dāng)充分重視法律推理模型的重要性,在分析其技術(shù)現(xiàn)狀的基礎(chǔ)上嘗試性地提出模型構(gòu)建方法并分析其應(yīng)用前景與風(fēng)險,力圖以法律推理模型實現(xiàn)更加智能化的法律服務(wù),推動審判體系和審判能力現(xiàn)代化。