摘要:人工智能應(yīng)用推動了我國法院數(shù)字化發(fā)展,但在實(shí)踐中也暴露了困境:既往的智能化裁判面臨技術(shù)發(fā)展瓶頸,而傳統(tǒng)人工智能下的司法應(yīng)用不僅對法官形成技術(shù)規(guī)訓(xùn),在處理價(jià)值沖突與法律漏洞的疑難案件時(shí)也存在功能缺失。生成式人工智能的興起為突破這些困境提供了契機(jī)。從價(jià)值維度分析,生成式人工智能基于其特有的運(yùn)作原理,與司法公正價(jià)值之間存在內(nèi)在契合性。從功能維度分析,生成式人工智能在補(bǔ)強(qiáng)傳統(tǒng)人工智能技術(shù)的同時(shí),既能有效保障法官的主體性地位,又能在疑難案件中發(fā)揮價(jià)值判斷與規(guī)則探索的有限功能。基于價(jià)值和功能的雙重耦合,生成式人工智能得以嵌入司法裁判,但這一過程還需要構(gòu)建適配司法場景的裁判大模型,并通過明確法官在技術(shù)應(yīng)用中的義務(wù)來建立風(fēng)險(xiǎn)防范機(jī)制,從而為生成式人工智能嵌入司法裁判提供規(guī)范化進(jìn)路。
關(guān)鍵詞:生成式人工智能;司法裁判;司法人工智能;數(shù)字法院
作者簡介:蘇杭,廣東外語外貿(mào)大學(xué)法學(xué)院講師(廣州510420)
基金項(xiàng)目:廣東省哲學(xué)社會科學(xué)規(guī)劃青年項(xiàng)目“生成式人工智能輔助司法裁判的規(guī)范進(jìn)路研究”(GD25YFX04)
DOI編碼:10.19667/j.cnki.cn23-1070/c.2025.04.010
黨的二十屆三中全會提出,要完善生成式人工智能發(fā)展和管理機(jī)制。與以往的決策型人工智能相比,生成式人工智能具備強(qiáng)大的語義理解與文本生成能力,能夠通過用戶指令或根據(jù)所輸入的文本而自動生成復(fù)雜內(nèi)容。隨著當(dāng)下GPT、DeepSeek、Claude等大模型的蓬勃發(fā)展,生成式人工智能正在深刻重塑人們的生活方式和社會各領(lǐng)域的運(yùn)作模式。2023年1月,哥倫比亞的一名法官在審理一起醫(yī)療保險(xiǎn)糾紛時(shí),首次使用了ChatGPT來擴(kuò)展觀點(diǎn)并優(yōu)化判決。①這一舉動表明,生成式人工智能的應(yīng)用場景拓展到了司法領(lǐng)域,由生成式人工智能輔助法官辦案已成為現(xiàn)實(shí)。我國各地法院在中共中央加快建設(shè)數(shù)字中國的號召下,積極探索司法審判與生成式人工智能的深度融合。2024年6月,廣東省深圳市中級人民法院正式啟用人工智能輔助審判系統(tǒng),實(shí)現(xiàn)了立案、閱卷、庭審以及文書撰寫的全流程AI賦能,極大地提升了司法工作的質(zhì)效。①值此重要節(jié)點(diǎn),厘清生成式人工智能在司法裁判領(lǐng)域的作用機(jī)制,構(gòu)建生成式人工智能輔助法官裁判的規(guī)范體系,既是數(shù)字法院建設(shè)的現(xiàn)實(shí)需求,也是應(yīng)對技術(shù)變革的理論挑戰(zhàn)。本文立足于我國以往司法人工智能應(yīng)用的實(shí)踐困境,結(jié)合生成式人工智能的技術(shù)原理,深入剖析新興技術(shù)與司法裁判二者在價(jià)值和功能上的耦合關(guān)系及作用方式,同時(shí),正視生成式人工智能嵌入司法裁判所面臨的風(fēng)險(xiǎn)挑戰(zhàn),為新技術(shù)賦能司法提供必要的規(guī)范引導(dǎo)。
一、我國以往司法人工智能應(yīng)用的實(shí)踐困境
對我國以往司法實(shí)踐中人工智能應(yīng)用的檢視發(fā)現(xiàn),人工智能在提升審判質(zhì)效的同時(shí),也暴露出諸多困境,這些困境不僅體現(xiàn)在技術(shù)層面的發(fā)展瓶頸,更涉及法官與技術(shù)的關(guān)系定位,以及在疑難案件中的功能缺失。推動我國數(shù)字法院建設(shè),需要在直面困境的基礎(chǔ)上積極尋找破解之道。
(一)法院開展智能化裁判的技術(shù)瓶頸
我國法院的信息化建設(shè)始于20世紀(jì)90年代,互聯(lián)網(wǎng)、大數(shù)據(jù)和云計(jì)算等信息技術(shù)加快了司法的現(xiàn)代化發(fā)展,人工智能的出現(xiàn)更是促進(jìn)了法院的智慧轉(zhuǎn)型。2025年2月,中共中央印發(fā)《關(guān)于加強(qiáng)新時(shí)代審判工作的意見》,強(qiáng)調(diào)加強(qiáng)數(shù)字法院建設(shè)。數(shù)字法院建設(shè)是以往智慧法院建設(shè)的迭代升級,其采用新興人工智能技術(shù)推動案件審判、審判管理乃至司法治理的全面革新。其中,案件審理作為法院主要職責(zé),是數(shù)字法院建設(shè)的重點(diǎn)內(nèi)容。從整體上來看,目前案件審理的數(shù)字化建設(shè)主要集中在兩個層面:一是在線化辦案,即法院依托網(wǎng)絡(luò)平臺,實(shí)現(xiàn)司法流程和審判業(yè)務(wù)的全過程在線。為此,最高人民法院(以下簡稱“最高法”)曾在2022年前后發(fā)布了三大在線規(guī)則,②為實(shí)現(xiàn)在線化辦案構(gòu)建了完備的規(guī)則體系。二是智能化裁判,即將人工智能應(yīng)用于裁判領(lǐng)域,輔助法官的司法決策。在這種情況下,由于技術(shù)實(shí)質(zhì)性地介入到個案的處理之中,因此對技術(shù)和司法的融合程度要求更高。正因如此,從以往的制度實(shí)踐來看,相較于在線化辦案方面的快速發(fā)展,我國法院在智能化裁判方面的建設(shè)稍顯滯后。
智能化裁判方面,根據(jù)人工智能在技術(shù)功能上的區(qū)別,又可以劃分出兩大類應(yīng)用,其一是依據(jù)強(qiáng)力法而構(gòu)建的法律專家系統(tǒng),其二是依據(jù)訓(xùn)練法而構(gòu)建的裁判預(yù)測系統(tǒng)。③強(qiáng)力法和訓(xùn)練法是人工智能中的兩大技術(shù),所謂的強(qiáng)力法是指在形式化模型的基礎(chǔ)上對復(fù)雜問題進(jìn)行推導(dǎo)或搜索出答案的技術(shù)。④由于法律知識具有較好的結(jié)構(gòu)性,而法律推理又是基于形式化邏輯,因此專家系統(tǒng)能夠較好地契合裁判的邏輯,在司法領(lǐng)域,該技術(shù)被應(yīng)用于具有顯式編碼和封閉規(guī)則的法律專家系統(tǒng)。⑤該系統(tǒng)可以模擬人類法律專家,在給定的知識和場景下進(jìn)行法律推理,進(jìn)而對法官決策提供有效的技術(shù)支持。然而,強(qiáng)力法也面臨著一定的技術(shù)瓶頸。這是因?yàn)閺?qiáng)力法的本質(zhì)在于人工建模,其知識、場景以及相關(guān)關(guān)系都是預(yù)先設(shè)定的,因此一旦面對真實(shí)的案件事實(shí)與龐大的法律規(guī)范體系,就需要大量的計(jì)算資源與復(fù)雜的推理能力作為支持。進(jìn)一步說,即便滿足了技術(shù)要求,試圖通過人工建模的方式來窮盡某個法律規(guī)范所涵攝的全部可能情形也是不可行的,法律語言的開放性特征、規(guī)則的可解釋空間都增加了技術(shù)實(shí)現(xiàn)的難度,依賴建模來求解的強(qiáng)力法難以應(yīng)對法律的不確定性。①
人工智能的另一類技術(shù)訓(xùn)練法則是以數(shù)據(jù)為驅(qū)動,通過人工神經(jīng)元網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)發(fā)現(xiàn)既定規(guī)律并對未來加以預(yù)測。與強(qiáng)力法的形式主義進(jìn)路不同,訓(xùn)練法通過對承載以往審判經(jīng)驗(yàn)的數(shù)據(jù)進(jìn)行自主分析和學(xué)習(xí),具有顯著的經(jīng)驗(yàn)主義導(dǎo)向,其通過發(fā)現(xiàn)先前判例中的裁判規(guī)律,進(jìn)而對當(dāng)下案件作出預(yù)測,并且能夠在一定程度上協(xié)助法官進(jìn)行法政策學(xué)意義上的權(quán)衡。②事實(shí)上,鑒于強(qiáng)力法的技術(shù)瓶頸,加之深度學(xué)習(xí)的興起,使得訓(xùn)練法顯現(xiàn)出了更大的發(fā)展?jié)摿?,然而,從目前來看,?xùn)練法在司法中的應(yīng)用仍停留在較為初級的階段。究其原因,訓(xùn)練法依靠數(shù)據(jù)驅(qū)動,對數(shù)據(jù)質(zhì)量要求極高。反觀我國目前建成的司法案例庫、規(guī)則庫以及信息庫,其內(nèi)容并不夠規(guī)范與完備,不但包含了大量的非結(jié)構(gòu)和半結(jié)構(gòu)化的信息,而且這些公開的數(shù)據(jù)集可信性和有效性有限,難以充分滿足裁判預(yù)測應(yīng)用的訓(xùn)練需求。對此,訓(xùn)練法通常采用人工標(biāo)注的方式來獲取高質(zhì)量的樣本數(shù)據(jù),以促成模型的監(jiān)督式學(xué)習(xí)。但人工標(biāo)注的方式,既要事先制定統(tǒng)一的標(biāo)注方式和規(guī)范,又要由法律專業(yè)人員耗費(fèi)大量的時(shí)間精力進(jìn)行操作,在完成標(biāo)注后,技術(shù)人員還要對標(biāo)注質(zhì)量予以評估和反饋。這樣的技術(shù)流程不但需要投入大量的經(jīng)濟(jì)和時(shí)間成本,而且面對專業(yè)性強(qiáng)又內(nèi)容復(fù)雜的司法數(shù)據(jù)集,人工標(biāo)注時(shí)的錯誤和偏見也會影響訓(xùn)練數(shù)據(jù)的質(zhì)量。正因如此,訓(xùn)練法雖然較之強(qiáng)力法有更廣闊的發(fā)展空間,但是如果無法解決數(shù)據(jù)質(zhì)量和人工標(biāo)注的問題,也難以在司法裁判中發(fā)揮真正價(jià)值。
(二)對法官形成的技術(shù)規(guī)訓(xùn)
在最高法的制度預(yù)期中,司法人工智能的應(yīng)用應(yīng)當(dāng)為法官提供全流程的智能輔助??v觀以往司法與技術(shù)的融合實(shí)踐,人工智能在提高司法效率和服務(wù)方面確實(shí)具有顯著功能,但與此同時(shí),隨著人工智能全方位地介入司法領(lǐng)域,法官的行為和決策也一并被納入和整合進(jìn)了智能裁判系統(tǒng),這使得在司法人工智能應(yīng)用的過程中逐漸形成了一種由技術(shù)規(guī)訓(xùn)法官的邏輯。③在福柯(MichelFoucault)的語境中,“規(guī)訓(xùn)”特指一種作用于個體的權(quán)力技術(shù),其往往采用層級監(jiān)控、規(guī)范化裁決與檢查的手段來實(shí)現(xiàn)對個體的干預(yù)與矯正。④法院顯然不同于工廠和學(xué)校等公共場域,法官也不是只會被動接受權(quán)力的客體。但不得不承認(rèn),在司法人工智能應(yīng)用中確實(shí)存在一種規(guī)范化的力量,使之產(chǎn)生了類似于規(guī)訓(xùn)的作用效果。這種規(guī)范化力量在設(shè)定了某種準(zhǔn)則的前提下,會對偏離標(biāo)準(zhǔn)的行為進(jìn)行矯正乃至懲罰,從而縮小不同個體之間的行為差距,使其符合規(guī)范的統(tǒng)一要求。⑤人工智能應(yīng)用將司法流程的各個節(jié)點(diǎn)予以記錄,對法官的審判行為予以時(shí)刻觀察,運(yùn)用數(shù)字化的標(biāo)準(zhǔn)來拆解并評判法官的裁判過程和結(jié)果,從而將法官納入一個有著科技支持、精密計(jì)算以及持續(xù)監(jiān)督的權(quán)力機(jī)制之中。
近年來,我國法院數(shù)字化建設(shè)的重點(diǎn)在于推行類案推送與案件裁判偏離度預(yù)警的智能系統(tǒng)。最高法研發(fā)了“類案智能推送系統(tǒng)”,各地方法院也相繼推出了一系列的智能化應(yīng)用,比如北京高院的“睿法官智能研判系統(tǒng)”、貴州法院的“法鏡大數(shù)據(jù)系統(tǒng)”、江蘇法院的“同案不同判預(yù)警系統(tǒng)”等。這些智能系統(tǒng)一方面有利于實(shí)現(xiàn)法律適用的統(tǒng)一,另一方面也強(qiáng)化了對法官的日常審判工作的監(jiān)管。尤其是當(dāng)技術(shù)應(yīng)用被確定為法官的強(qiáng)制性義務(wù)時(shí),規(guī)訓(xùn)的效果也得到了進(jìn)一步加強(qiáng),我國2017年發(fā)布的《最高人民法院司法責(zé)任制實(shí)施意見(試行)》確立了類案全面強(qiáng)制檢索機(jī)制,要求法官在審理案件時(shí),對已審結(jié)或正在審理的類案和關(guān)聯(lián)案件進(jìn)行全面檢索,并制作檢索報(bào)告。⑥除了類案推送系統(tǒng)之外,裁判偏離預(yù)警機(jī)制也在無形中強(qiáng)化了對法官審判的技術(shù)規(guī)訓(xùn),這是因?yàn)樵摍C(jī)制重在對判決進(jìn)行事后糾偏,其運(yùn)作的核心原理在于通過將法官當(dāng)下作出的判決和既往類似案件確定的裁判均值進(jìn)行比較,①當(dāng)偏離值較大則會觸發(fā)預(yù)警,同時(shí)也以數(shù)據(jù)的形式記錄和保存在法院的信息化平臺,庭長、院長以及上級法院的監(jiān)管人員可以隨時(shí)調(diào)出并檢查。事實(shí)上,在??滤枋龅囊?guī)訓(xùn)的作用模式中,檢查恰恰是展示權(quán)力的一種方式,而規(guī)訓(xùn)對象只能被迫可見,②這正如法官的決策和行為始終處于司法人工智能系統(tǒng)的動態(tài)監(jiān)管之下。由此可見,人工智能應(yīng)用在輔助裁判的同時(shí)極易使法官成為技術(shù)規(guī)訓(xùn)的對象。
(三)在疑難案件中的功能缺失
雖說每一個案件都勾連著事實(shí)與規(guī)范,但所謂的疑難案件,一般認(rèn)為是不包含那些在事實(shí)層面難以認(rèn)定和查證的案件,而專指在法律規(guī)范的適用上存在困難的案件。③由于疑難案件的范圍界定與審理方式表征著依法裁判和實(shí)質(zhì)正義之間的張力,因此向來是理論學(xué)界討論的重點(diǎn)。哈特和德沃金就曾圍繞法官如何審理疑難案件這一核心議題來闡釋各自的法理論。在哈特的理論中,由于法律規(guī)則由日常語言所構(gòu)成,因而具有語言的“開放性結(jié)構(gòu)”,如果某一案件事實(shí)落入這種結(jié)構(gòu)的邊緣地帶,那么能否適用法律規(guī)則是存疑的,這也就構(gòu)成了哈特所謂的疑難案件。面對這種難題,哈特認(rèn)為只有賦予法官以有限的立法權(quán)力,才能填補(bǔ)法律漏洞。④德沃金對此持相反觀點(diǎn),他在闡釋規(guī)則與原則區(qū)別的基礎(chǔ)上提出,疑難案件雖然在法律規(guī)則的調(diào)整范圍之外,但是卻能被更為抽象的法律原則涵蓋,因此法官在處理疑難案件時(shí),并不用行使帶有造法性質(zhì)的“強(qiáng)自由裁量權(quán)”,而是應(yīng)當(dāng)去發(fā)現(xiàn)既存的法律權(quán)利。⑤
結(jié)合哈特和德沃金圍繞疑難案件闡述的理論,本文從類型化的角度區(qū)分,將疑難案件所指涉的具體情形分為兩種:其一,價(jià)值沖突型疑難案件,這種情形針對那些雖落入規(guī)則“開放性結(jié)構(gòu)”的邊緣地帶,但卻能夠被原則所涵蓋的案件。不過,即便法官在審理這些案件時(shí)可以將法律原則作為裁判依據(jù),然而由于喪失了規(guī)則的明確指引,因此在關(guān)于多大程度上能夠適用原則以及能夠適用何種原則等問題是有待商榷的,尤其是當(dāng)規(guī)則和原則之間、原則和原則之間在處理個案時(shí)存在沖突的時(shí)候,將導(dǎo)致此類案件的審理更為復(fù)雜棘手。面對這種情形,法官往往需要根據(jù)社會群體共識性的道德觀點(diǎn)進(jìn)行價(jià)值判斷,這樣的價(jià)值判斷顯然無法依靠形式邏輯得出,而需要法官觀照到個案的實(shí)質(zhì)正義。在這里,法官積累的實(shí)踐智慧與所洞悉的社會情感發(fā)揮了更大的作用,而這恰恰是難以被技術(shù)理解與通約的,傳統(tǒng)人工智能在價(jià)值判斷上的短板導(dǎo)致法官無法通過技術(shù)獲得最佳闡釋,可以說,傳統(tǒng)人工智能難以有效應(yīng)對價(jià)值沖突型的疑難案件。
其二,法律漏洞型疑難案件。這指的是既有規(guī)則和原則都難以涵蓋和調(diào)整的案件類型,也即新型案件。對于這類案件的處理需要調(diào)用所謂的“強(qiáng)自由裁量權(quán)”,對此,英美法系的國家往往賦予法官以一定的造法權(quán)限來應(yīng)對規(guī)范的空白和缺失,而在我國,則通常是由最高法通過發(fā)布司法解釋的形式來填補(bǔ)在審判實(shí)踐中發(fā)現(xiàn)的漏洞。傳統(tǒng)人工智能在面對此類疑難案件時(shí)也暴露了其功能缺陷,這是因?yàn)椋夹g(shù)所分析和處理的數(shù)據(jù)都是從法官以往的制度性實(shí)踐中獲取的,其運(yùn)行邏輯在于抽取當(dāng)下案件信息中的關(guān)鍵性要素,與數(shù)據(jù)庫中的案例加以比對并檢索類案,最終在類案基礎(chǔ)上對當(dāng)下的裁判進(jìn)行推理和預(yù)測。因此,如果是無法在司法大數(shù)據(jù)中檢索到的新型案件,那么技術(shù)既無法對比類案,也難以提煉總結(jié)裁判規(guī)律。由此可見,以往的司法人工智能應(yīng)用無法為新型案件的及時(shí)妥當(dāng)處理提供幫助。
二、生成式人工智能與司法裁判的價(jià)值性耦合
以往司法人工智能應(yīng)用在實(shí)踐中面臨的困境,為新興技術(shù)的引入提供了契機(jī)。生成式人工智能憑借其強(qiáng)大的語言處理和內(nèi)容生成能力,不僅在技術(shù)層面實(shí)現(xiàn)了重大突破,更在價(jià)值理念上與司法公正的要求形成了內(nèi)在契合。
(一)生成式人工智能的核心技術(shù)原理
近年來,OpenAI、Google和Anthropic等公司團(tuán)隊(duì)在生成式人工智能的研發(fā)方面取得了突破性進(jìn)展,發(fā)布了一系列語言模型。其中,由OpenAI在2022年11月推出的ChatGPT以其逼真的對話能力和強(qiáng)大的文本生成功能,一經(jīng)問世便迅速引發(fā)強(qiáng)烈反響,并掀起了全球范圍內(nèi)對生成式人工智能技術(shù)的追捧浪潮。以GPT系列模型為例,支持生成式人工智能獲得強(qiáng)大功能的核心技術(shù)主要有三項(xiàng)。
其一,Transformer架構(gòu)。Transformer是一種專門用于序列建模的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),在自然語言處理領(lǐng)域,它使用全新的自注意力機(jī)制(Self-Attention)來構(gòu)建序列間的依賴關(guān)系。與以往序列模型中常用的RNN相比,Transformer不但可以做到輸入輸出各位置間計(jì)算的操作并行,而且還能更好地捕捉長序列間的遠(yuǎn)距離依賴關(guān)系。①簡言之,Transformer通過自注意力機(jī)制,可以根據(jù)每個詞的所在位置推斷出其和其他詞之間的相關(guān)性,進(jìn)而生成關(guān)聯(lián)度最高的信息,即使是面對長文本也可以順利捕捉上下文關(guān)系。②正因如此,Transformer在機(jī)器翻譯、語義分析和文本生成等方面取代了RNN的傳統(tǒng)架構(gòu)。
其二,預(yù)訓(xùn)練模型(Pre-trainedModel)。預(yù)訓(xùn)練是GPT獲得強(qiáng)大語言能力的關(guān)鍵,其以Transformer為模型架構(gòu),通過對大規(guī)模且未標(biāo)注的語料進(jìn)行無監(jiān)督訓(xùn)練,獲取關(guān)于語言的一般特征,從而形成一個具有通用性質(zhì)的語言模型。在此基礎(chǔ)上,通過小樣本乃至零樣本的“微調(diào)”(Fine-tuning),就可以使其適配并應(yīng)用到下游任務(wù)。③GPT模型的預(yù)訓(xùn)練所使用的語料一部分是從維基百科、搜索引等基于互聯(lián)網(wǎng)媒介上自動爬取所得,其不但具有范圍廣、規(guī)模大、易獲得等優(yōu)勢,而且有效減少了人工標(biāo)注的高昂成本。在GPT的迭代過程中,訓(xùn)練的數(shù)據(jù)量級不斷攀升,GPT-3的參數(shù)量高達(dá)上千億級別,與此同時(shí),模型的學(xué)習(xí)能力也隨之大幅度提高。④可以說,預(yù)訓(xùn)練是生成式人工智能模型獲得泛化語言理解和表達(dá)能力的基礎(chǔ)與關(guān)鍵。
其三,基于人類反饋的強(qiáng)化學(xué)習(xí)(ReinforcementLearningfromHumanFeedback)。預(yù)訓(xùn)練模型在大規(guī)模數(shù)據(jù)上進(jìn)行無監(jiān)督學(xué)習(xí),雖然由此獲得良好的通用性與泛化性,但是因此缺乏人類的監(jiān)督與反饋,會導(dǎo)致模型出現(xiàn)捏造事實(shí)、輸出有偏見或有害信息等情況,降低了模型的安全性和有效性。雖然可以通過標(biāo)注好的樣本數(shù)據(jù)對模型進(jìn)行“微調(diào)”,但是由于內(nèi)容生成的邏輯在于從文本數(shù)據(jù)中預(yù)測下一個最大關(guān)聯(lián)度的詞元(Token),而這樣生成的結(jié)果顯然和用戶想要的內(nèi)容仍存在較大差距,因此,如何促使人類意圖和模型生成之間的一致性,讓語言模型更好地實(shí)現(xiàn)人類所希望達(dá)成的目標(biāo),是GPT面臨的又一大挑戰(zhàn)。對此,InstructGPT采用了基于人類反饋的強(qiáng)化學(xué)習(xí),即在以往“微調(diào)”模型上訓(xùn)練一個全新的獎勵模型,并在強(qiáng)化學(xué)習(xí)的框架下進(jìn)一步優(yōu)化原有模型。其中,獎勵模型就建立在人類對模型生成內(nèi)容偏好排序的基礎(chǔ)上,具體來說,通過在模型中輸入提示詞(Prompt),使其輸出幾個不同的結(jié)果,再通過用戶反饋來對輸出的多個結(jié)果予以排序,并將其轉(zhuǎn)換為模型可理解的正向或負(fù)向的獎勵信號,從而使排序越靠前的內(nèi)容越能符合人類的意圖與需求。如此一來,既能夠減少通過人工標(biāo)注對齊用戶指令的規(guī)模和成本,也有助于解決參數(shù)量級巨大模型的安全性及有效性問題。①
(二)生成式人工智能與司法公正的內(nèi)在契合
裁判是法院業(yè)務(wù)的核心,承載的是法官依據(jù)案件事實(shí)和法律規(guī)范所作出的糾紛處理結(jié)果。由于裁判不但關(guān)涉當(dāng)事人權(quán)利的救濟(jì)與義務(wù)的再分配,而且直接影響著社會大眾對司法的認(rèn)可與評價(jià),因此一般認(rèn)為,裁判應(yīng)當(dāng)是由客觀中立的法官,依據(jù)自身的理性和經(jīng)驗(yàn),在合理的時(shí)限內(nèi)對糾紛公正地作出判決的行為??梢姡痉ú门刑N(yùn)含著效率和公正的雙重價(jià)值。以往的司法人工智能應(yīng)用不但能夠有效減少法官的重復(fù)性工作,提高審判效率,而且技術(shù)本身的價(jià)值中立也增強(qiáng)了裁判的客觀性。可見,傳統(tǒng)人工智能技術(shù)已經(jīng)有助于司法效率和程序公正的實(shí)現(xiàn)。然而,對于人工智能是否有助于實(shí)體意義上的司法公正這一問題向來是存在爭議的。這是因?yàn)椋粝雽?shí)現(xiàn)實(shí)體公正,需要法官將目光在案件事實(shí)與法律規(guī)范之間往返流轉(zhuǎn),并運(yùn)用理性和智慧對案件結(jié)論達(dá)至內(nèi)心確認(rèn),這樣的過程融合了邏輯推理、經(jīng)驗(yàn)復(fù)用和價(jià)值判斷,傳統(tǒng)人工智能雖然能模擬人類思維方式,但卻難以應(yīng)對復(fù)雜的人類情感與多元的社會價(jià)值。對此,新興的生成式人工智能基于在技術(shù)上的重大突破,能夠擴(kuò)大傳統(tǒng)人工智能的技術(shù)優(yōu)勢,更有助于司法效率與程序公正的實(shí)現(xiàn),即便對于實(shí)體公正的價(jià)值來說,生成式人工智能也與之存在一定的契合,只要技術(shù)運(yùn)用得當(dāng),也能夠起到一定的積極促進(jìn)作用。
一般認(rèn)為,實(shí)體意義上的司法公正分為兩個層次,一是形式正義,二是實(shí)質(zhì)正義,而生成式人工智能的司法應(yīng)用均將有助于二者的實(shí)現(xiàn)。首先,形式正義要求法官對于相同情況相同對待,“同案同判”的理念是形式正義的外在表征。②從人類智能的角度來看,司法實(shí)踐中“同案不同判”產(chǎn)生的根本誘因就在于法官基于個人感情、思想和經(jīng)驗(yàn)而作出決策,其雖然對應(yīng)的是自由裁量權(quán)的行使,但是對于追求“同案同判”的形式正義并沒有太大助益。③相比之下,技術(shù)的應(yīng)用可以促進(jìn)裁判的客觀化和理性化,尤其是在生成式人工智能的技術(shù)支持下,類案推送和檢索機(jī)制將得到進(jìn)一步完善,從而推動“同案同判”的實(shí)現(xiàn)。具體而言,“同案同判”的一般實(shí)現(xiàn)程式是由法官先行識別出類案,在此基礎(chǔ)上從先前的類案中提煉出可普遍化的裁判標(biāo)準(zhǔn)或規(guī)則,再將其作為法律推理的大前提適用于當(dāng)下的待決案件。由于生成式人工智能建立在大語言模型的基礎(chǔ)上,因此在這個過程中,其既可以在海量的司法數(shù)據(jù)中快速抓取孤立分散的個案信息,縮短類案的匹配速度、提升推送的精確度,又能夠?qū)Υ罅款愃瓢讣M(jìn)行系統(tǒng)化整合,從而生成出可普遍化的標(biāo)準(zhǔn)與一般性的裁判規(guī)則供法官適用。④可見,生成式人工智能的引入有助于實(shí)現(xiàn)“同案同判”目標(biāo)下的形式正義。
其次,生成式人工智能可以通過強(qiáng)化個案的裁判說理來促進(jìn)實(shí)質(zhì)正義的實(shí)現(xiàn)。在個案的審判過程中,判決結(jié)果固然重要,但是否滿足實(shí)質(zhì)正義的要求還要看裁判的說理是否充分,尤其是當(dāng)實(shí)質(zhì)正義與“依法裁判”的形式要求發(fā)生抵牾的時(shí)候,法官更是要通過裁判說理來化解兩者的沖突。根據(jù)最高法2018年出臺的《關(guān)于加強(qiáng)和規(guī)范裁判文書釋法說理的指導(dǎo)意見》,在裁判文書中釋法說理需要闡明事理、釋明法理、講明情理、講究文理。傳統(tǒng)人工智能雖然也能夠基于案件事實(shí)檢索相關(guān)案例與依據(jù),并給法官提供一定的裁判參考,但無論是在事理和法理方面的邏輯論證,還是在情理與文理方面的意義考究都不夠詳實(shí)充分,這導(dǎo)致以往自動生成的判決文書重復(fù)冗雜且語言生搬硬套,難以體現(xiàn)個案的特殊性。與傳統(tǒng)人工智能不同,生成式人工智能具備強(qiáng)大的文本生成能力,可以快速生成語言流暢、邏輯清楚的長文本,進(jìn)而有利于自動生成高質(zhì)量的判決文書。此外,生成式人工智能還具備先進(jìn)的人機(jī)交互技術(shù),法官可以通過輸入提示詞與大模型進(jìn)行專業(yè)的法律問答。這個過程中,無論案情的分析梳理還是規(guī)則的適用,乃至是基于不同的說理邏輯而產(chǎn)生的不同判決結(jié)果,都會逐一呈現(xiàn)在法官面前,法官不但可以追溯模型的推理邏輯,還可以通過交互問答的方式詢問模型的決策理由。這樣一來,技術(shù)應(yīng)用不但能夠有效擴(kuò)展法官的裁判思路,而且能夠強(qiáng)化裁判的說理與論證。進(jìn)一步說,生成式人工智能甚至可以通過學(xué)習(xí)法官的語言風(fēng)格,在自動生成的判決文書中模擬法官的表述習(xí)慣,使其更貼近真實(shí)的法律文書,增強(qiáng)公眾的可接受性。綜上所述,對生成式人工智能的合理運(yùn)用不但不會消解司法的固有價(jià)值屬性,而且還能通過強(qiáng)化裁判說理有助于實(shí)質(zhì)正義的實(shí)現(xiàn)。
三、生成式人工智能與司法裁判的功能性耦合
生成式人工智能與公正價(jià)值的內(nèi)在契合,是新技術(shù)得以介入司法裁判領(lǐng)域的前提條件。然而,僅有價(jià)值基礎(chǔ)還不足以支撐生成式人工智能與司法審判的深度融合,技術(shù)能否真正發(fā)揮效用,關(guān)鍵在于其是否具備與司法裁判活動相匹配的功能特性。生成式人工智能憑借其技術(shù)功能,能夠有效破解我國以往司法人工智能應(yīng)用的實(shí)踐困境。具體而言,生成式人工智能在司法裁判中發(fā)揮三個方面的功能:一是對傳統(tǒng)人工智能的技術(shù)補(bǔ)強(qiáng),通過有機(jī)結(jié)合強(qiáng)力法與訓(xùn)練法來突破現(xiàn)有技術(shù)瓶頸;二是保障法官的主體性地位,改善以往法官被技術(shù)規(guī)訓(xùn)的傾向;三是在疑難案件中能夠發(fā)揮一定的價(jià)值判斷與規(guī)則探索功能,協(xié)助法官應(yīng)對價(jià)值沖突和法律漏洞。正是這些功能使生成式人工智能真正實(shí)現(xiàn)對司法裁判的有效賦能,從而形成價(jià)值理念與技術(shù)功能的雙重耦合。
(一)對傳統(tǒng)人工智能的技術(shù)補(bǔ)強(qiáng)
如前所述,人工智能主要包含強(qiáng)力法與訓(xùn)練法兩大類技術(shù)。在司法裁判領(lǐng)域,強(qiáng)力法難以應(yīng)對法律的不確定性問題,而訓(xùn)練法在數(shù)據(jù)質(zhì)量和人工標(biāo)注方面則提出了較高要求,這就制約了司法人工智能的進(jìn)一步發(fā)展。生成式人工智能的司法應(yīng)用可以做到兩種技術(shù)的有機(jī)結(jié)合,即先運(yùn)用訓(xùn)練法獲取經(jīng)驗(yàn)知識,再通過強(qiáng)力法在預(yù)先獲得的知識庫中進(jìn)行搜索和推理,進(jìn)而得出最優(yōu)判斷。如此不但能發(fā)揮兩者的優(yōu)勢,而且在一定程度上也能化解現(xiàn)階段司法人工智能應(yīng)用所遭遇的技術(shù)難題,具體來說如下。首先,對于強(qiáng)力法來說,法律的不確定性是其始終難以回避的問題,生成式人工智能雖然無法直接簡化復(fù)雜的事實(shí)關(guān)系與法律表述,但是能夠通過技術(shù)手段來限制強(qiáng)力法的不確定性問題。其一,由于生成式人工智能以預(yù)訓(xùn)練模型為基礎(chǔ),因此可以通過訓(xùn)練大量文本來建立概率語言模型,這種概率建??梢院w更為復(fù)雜開放的情況,在一定程度上能應(yīng)對因法律語言的開放性特征而引發(fā)的不確定性。其二,生成式人工智能可以引入知識圖譜來控制不確定性。在構(gòu)建知識圖譜時(shí),生成式人工智能可以通過預(yù)訓(xùn)練模型從大量非結(jié)構(gòu)化文本中提取結(jié)構(gòu)化知識,這相當(dāng)于限定了強(qiáng)力法進(jìn)行計(jì)算和搜索的空間,因此能夠有效約束生成結(jié)果的不確定性。其三,生成式人工智能具有強(qiáng)大的人機(jī)交互性,在判決文書生成的過程中,法官可以輸入提示詞對文本生成設(shè)置附加條件,使生成的內(nèi)容得以“對齊”(Alignment)自身的想法和預(yù)期,如此一來,原本不確定的法律解釋空間也能得以有效限縮。
其次,生成式人工智能能夠?yàn)橛?xùn)練法提供有力的技術(shù)支持。以往的司法人工智能應(yīng)用不但需要預(yù)先構(gòu)建一個涵蓋各類案例和規(guī)則的數(shù)據(jù)庫,還需要調(diào)動大量法律專業(yè)人士對案件事實(shí)、裁判依據(jù)以及判決結(jié)果進(jìn)行人工標(biāo)注。生成式人工智能的預(yù)訓(xùn)練模式能夠有效減少對標(biāo)注數(shù)據(jù)的依賴。事實(shí)上,生成式人工智能中的預(yù)訓(xùn)練原本就基于訓(xùn)練法的技術(shù)原理,因此其十分擅長從大量無標(biāo)注的數(shù)據(jù)中提取較高質(zhì)量的結(jié)構(gòu)化信息。進(jìn)一步說,隨著模型數(shù)據(jù)量級的不斷增大,生成式人工智能語言理解和學(xué)習(xí)能力也會得到質(zhì)的飛躍,因此在應(yīng)用于下游任務(wù)和場景時(shí),僅需少量樣本乃至零樣本就能對模型進(jìn)行“微調(diào)”,而無須大規(guī)模人工標(biāo)注下的監(jiān)督式學(xué)習(xí)。這種技術(shù)突破對于司法人工智能應(yīng)用具有更重要的意義,這是因?yàn)椋痉ú门猩婕按罅康膶I(yè)知識,無論是提取高質(zhì)量數(shù)據(jù),還是人工標(biāo)注示范樣本的做法都面臨難度大、成本高的現(xiàn)實(shí)問題,生成式人工智能預(yù)訓(xùn)練模式下的自監(jiān)督學(xué)習(xí)更適配于司法的特定場景,強(qiáng)化了以往的訓(xùn)練法技術(shù)。
(二)保障法官的主體性地位
傳統(tǒng)人工智能在司法裁判中的功能定位是輔助法官,然而其應(yīng)用卻停留在較為初級的階段,難以真正起到輔助裁判的功能。例如,目前的類案檢索和推送系統(tǒng)不夠精確,法官仍需在較大范圍中對案例進(jìn)行逐一的人工篩選;裁判預(yù)測系統(tǒng)的準(zhǔn)確度較低,難以模擬法官真實(shí)的思維過程;判決文書的自動生成基于模板而無法針對特殊情形生成個案化的解釋與分析。究其原因,一方面是因?yàn)閭鹘y(tǒng)人工智能的技術(shù)制約,其大多依賴于人工輸入的規(guī)則和程式,無法理解復(fù)雜法律概念,也難以生成基于非形式化邏輯的法律論證。另一方面,是因?yàn)閭鹘y(tǒng)人工智能多被應(yīng)用于審判管理之中,技術(shù)對法官的行為和決策產(chǎn)生了規(guī)訓(xùn)而非輔助作用??v觀我國的審判制度,雖然法官是司法決策的主體,但是出于對自由裁量權(quán)的制度性約束,上級法院以及本級法院的院長、庭長都具有審判監(jiān)督和管理的權(quán)力,尤其是當(dāng)案件本身存在爭議或者在法律可解釋的范圍內(nèi)存在不同的論證路徑時(shí),除主審法官之外的其他主體也可以通過既定的司法程序,諸如專業(yè)法官會議、審判委員會等參與到集體決策之中。這樣的做法實(shí)則在無形中將法官裁判置于科層化管理之中。在這種背景下,傳統(tǒng)人工智能的司法應(yīng)用構(gòu)成了對法官的技術(shù)規(guī)訓(xùn),以至于削弱了法官在裁判中的主體性地位。
生成式人工智能的作用邏輯與傳統(tǒng)人工智能有著顯著不同,在其應(yīng)用過程中,法官并非技術(shù)規(guī)訓(xùn)的對象,而能夠保有裁判的主體性地位。這是因?yàn)?,生成式人工智能在裁判中所發(fā)揮的功能是在其與法官的交互對話中實(shí)現(xiàn)的,而法官對于人機(jī)交互的方向與進(jìn)程掌握著主動權(quán)。具體而言,其一,法官可以通過輸入提示,要求模型對自動生成的內(nèi)容進(jìn)行解釋或擴(kuò)充,直到形成完備的論證鏈。其二,法官可以要求模型生成反面論證,為其在判決中實(shí)現(xiàn)“證否”提供參考依據(jù)。其三,法官還可以讓模型生成多種可能的論證路徑,以此開闊裁判思路,形成新的法律見解。可見,在人機(jī)交互的過程中,法官始終處于主導(dǎo)性地位,其既可以引導(dǎo)模型生成裁判所需的內(nèi)容,也保有對是否采納自動生成內(nèi)容的決定權(quán),這些都顯著提升了法官在司法決策過程中的話語權(quán)。此外,值得關(guān)注的是,在生成式人工智能的輔助下,判決文書的裁判說理將日臻完善,而說理的強(qiáng)化將增強(qiáng)司法在智識上的權(quán)威性,這種權(quán)威不但更易被公眾所理解與接受,而且也使得主審法官之外的主體很難憑借集體決策的名義對裁判施加科層化的干預(yù)與影響,從而間接保障法官在人機(jī)協(xié)作裁判模式中的主體性地位。
(三)價(jià)值判斷與規(guī)則探索的有限功能
韋伯曾把法官比作“自動售貨機(jī)”,認(rèn)為他們所做的不過是根據(jù)案件事實(shí)在法典中尋找對應(yīng)的規(guī)范,再依據(jù)司法三段論作出判決。如果僅依據(jù)這樣的論斷,那么擅長形式化邏輯的傳統(tǒng)人工智能技術(shù)或許可以替代法官作出決策。然而,真實(shí)的司法裁判過程不但需要將當(dāng)下的社會需求與未來的社會發(fā)展納入權(quán)衡范疇,而且充斥著倫理道德的約束與價(jià)值取舍的判斷,法官始終需要在裁判的可預(yù)測性與自由裁量、法的安定性與社會進(jìn)步之間尋找到平衡。也正因如此,傳統(tǒng)人工智能在疑難案件中是存在功能缺失的,如前所述,其既難以在價(jià)值沖突的案件中作出合理判斷,也無法發(fā)現(xiàn)新的裁判規(guī)則來填補(bǔ)法律漏洞。然而,與傳統(tǒng)人工智能不同,生成式人工智能憑借其技術(shù)優(yōu)勢可以輔助法官進(jìn)行價(jià)值判斷與規(guī)則探索的活動,從而在疑難案件中發(fā)揮一定的功能。
在價(jià)值判斷方面,雖然在每個案件中不同價(jià)值所占的分量與比例無法形成放之四海的統(tǒng)一標(biāo)準(zhǔn),但是價(jià)值這一事項(xiàng)本身卻是可以被數(shù)據(jù)化的。事實(shí)上,人類在作出價(jià)值判斷的時(shí)候也會無意識地對不同價(jià)值予以賦值和排序,而人工智能恰恰是以數(shù)據(jù)的方式還原了這一過程,即在客觀描述價(jià)值表現(xiàn)性質(zhì)的基礎(chǔ)上為其設(shè)定屬性值,進(jìn)而形成某種可供數(shù)學(xué)計(jì)算的關(guān)于價(jià)值的特征向量。①這實(shí)際上是將法官的內(nèi)心確信以可視化的數(shù)據(jù)形式展現(xiàn)出來,為技術(shù)介入價(jià)值判斷領(lǐng)域提供了可行性。在此基礎(chǔ)上,生成式人工智能可以進(jìn)一步推動價(jià)值判斷中的技術(shù)應(yīng)用。具體而言,其一,生成式人工智能的應(yīng)用有助于彌合法官個人理念與社會普遍價(jià)值觀之間的差距。生成式人工智能的訓(xùn)練數(shù)據(jù)來源廣泛、量級巨大且主要基于無監(jiān)督學(xué)習(xí),因此與法官個人帶有主觀性的判斷相比,模型輸出的結(jié)果反而更能體現(xiàn)社會的某種價(jià)值共識,法官以此為參考,可以有效遏制個人偏見對裁判客觀公正性的不利影響。其二,先行構(gòu)建制定法淵源之外的規(guī)范數(shù)據(jù)庫,包括自由、平等、公平、正義乃至社會同理心等倫理道德因素,以此作為預(yù)訓(xùn)練模型的語料庫,保證模型生成的內(nèi)容將所有可能涉及的價(jià)值因素都納入權(quán)衡范疇,進(jìn)而避免法官陷入單一的價(jià)值偏好。其三,生成式人工智能預(yù)測分析能力顯著提高,可以預(yù)估不同判決結(jié)果帶來的社會影響,進(jìn)而輔助法官進(jìn)行后果主義裁量。根據(jù)后果主義裁量的理論觀點(diǎn),法官不能只機(jī)械適用法律而忽視其可能造成的非正義后果,其有必要在裁判過程中將判決可能引發(fā)的法律效果和社會效果都納入決策過程。對此,生成式人工智能可以將過往真實(shí)案例的社會效果與專家預(yù)測的可能效應(yīng)作為訓(xùn)練數(shù)據(jù),發(fā)掘待決案件與社會環(huán)境中復(fù)雜因素的關(guān)聯(lián)性,進(jìn)而對裁判可能導(dǎo)致的連鎖反應(yīng)進(jìn)行事先的預(yù)測與評估,厘清案件的全貌。
面對新型案件的法律漏洞,生成式人工智能雖然不具備人類智慧,但是法官可以通過交互對話的方式與模型開展“頭腦風(fēng)暴”,提高法官對于法律適用的想象力與創(chuàng)造力。我國司法雖然不具備造法的權(quán)力,但是在實(shí)踐中卻常常承擔(dān)著“試行立法”的職責(zé),②一方面是為正式立法積累前期經(jīng)驗(yàn),另一方面是化解在新型案件中無據(jù)可依的審判難題。因此,在我國生成式人工智能雖然不能輔助法官直接創(chuàng)制規(guī)則,但是可以幫助法官在新型案件中探索新的裁判規(guī)則。事實(shí)上,生成式人工智能對于新型案件從發(fā)現(xiàn)到應(yīng)對的各個環(huán)節(jié)都有所助益。
首先,當(dāng)法官發(fā)現(xiàn)既有法律難以涵蓋和調(diào)整案件事實(shí)時(shí),要先行判斷其是否屬于新型案件的范疇,此時(shí),生成式人工智能可以列舉所有可能相關(guān)的規(guī)則與案例供法官予以排除,也可以發(fā)掘法律條文新的解釋空間供法官參考。其次,如果確認(rèn)既有規(guī)范難以調(diào)整,那么意味著該案件可能具有首案效應(yīng)或者具有法律適用的普遍指導(dǎo)意義。在我國,這類案件往往會由上級法院提級管轄并以審理典型案例的方式確定具體裁判規(guī)則。在這個過程中,生成式人工智能可以在語言模型的基礎(chǔ)上構(gòu)建知識圖譜并進(jìn)行語義關(guān)聯(lián),在窮盡法律規(guī)則和法律原則時(shí),可以從非正式法律淵源,諸如司法政策、最高法的司法解釋性質(zhì)文件、地方法院的審判業(yè)務(wù)文件、參考性案例、社會慣習(xí)乃至道德規(guī)范中尋找和匹配相關(guān)依據(jù),為裁判規(guī)則的適用提供效力論證。最后,在新的裁判規(guī)則被制定后,生成式人工智能仍可以對其進(jìn)行修正和優(yōu)化,一方面可以確保新的裁判規(guī)則與既有法律體系的融貫而不矛盾,另一方面也可以使模型針對新規(guī)則的邊界情況生成特定的假想案例,從而發(fā)掘規(guī)則的可能漏洞,完善規(guī)則的語言表達(dá)。
綜上所述,疑難案件的審理雖仍然需要由法官主導(dǎo)裁判,不過應(yīng)當(dāng)承認(rèn)的是,生成式人工智能可能通過發(fā)揮有限的價(jià)值判斷功能與規(guī)則探索功能來協(xié)助法官化解價(jià)值沖突和法律漏洞的實(shí)踐困境。
四、生成式人工智能嵌入司法裁判的路徑構(gòu)建
生成式人工智能在價(jià)值和功能層面能與司法裁判形成雙重耦合,但若想使二者耦合關(guān)系更為緊密,還需要從技術(shù)規(guī)范和制度構(gòu)建的雙重維度探索生成式人工智能嵌入司法裁判的具體路徑。從技術(shù)規(guī)范的維度來說,“通專結(jié)合”是生成式人工智能在特定領(lǐng)域的發(fā)展趨勢,因此有必要在基礎(chǔ)模型上建立專門適配于司法場景的裁判大模型,并對其開發(fā)過程進(jìn)行嚴(yán)格監(jiān)督和規(guī)范。從制度構(gòu)建的維度來說,由于生成式人工智能尚存在潛在風(fēng)險(xiǎn),因此需要在明確技術(shù)功能定位的前提下,通過設(shè)定法官義務(wù)來實(shí)現(xiàn)風(fēng)險(xiǎn)的及時(shí)識別與有效防范。
(一)司法裁判專業(yè)大模型的技術(shù)建構(gòu)規(guī)范
生成式人工智能以預(yù)訓(xùn)練模型為基石,具有很強(qiáng)的通用性與泛化性,這的確為各行業(yè)的應(yīng)用提供了智能引擎。然而,即便模型經(jīng)過了千億級別數(shù)據(jù)的預(yù)訓(xùn)練而具備高水平文本生成能力,但也只能算作是完成了“通識”教育,由于不同場景中知識與信息的壁壘,在執(zhí)行具體下游任務(wù)時(shí),為了能夠更好地適配場景特性,需要在預(yù)訓(xùn)練的基礎(chǔ)上根據(jù)特定領(lǐng)域的知識與經(jīng)驗(yàn)進(jìn)行小樣本的“微調(diào)”,才能使模型在“通識”教育基礎(chǔ)上再完成專業(yè)教育。①可以說,當(dāng)下生成式人工智能的發(fā)展路徑正在從通用能力向?qū)>较蜓葸M(jìn)。當(dāng)將生成式人工智能引入司法裁判時(shí),為了能更好地契合司法的運(yùn)行邏輯,同樣應(yīng)當(dāng)采取“預(yù)訓(xùn)練+微調(diào)”的技術(shù)路徑,訓(xùn)練出專業(yè)的裁判大模型。2024年11月,最高人民法院發(fā)布國內(nèi)首個法律行業(yè)基座大模型——“法信法律基座大模型”,標(biāo)志著我國司法領(lǐng)域開始探索使用大模型以實(shí)現(xiàn)技術(shù)賦能。在此背景下,有必要對司法裁判大模型的技術(shù)建構(gòu)過程進(jìn)行系統(tǒng)規(guī)范。
首先,在預(yù)訓(xùn)練階段,由于模型是在沒有標(biāo)注的數(shù)據(jù)上進(jìn)行自我監(jiān)督式學(xué)習(xí),因此訓(xùn)練數(shù)據(jù)的質(zhì)量至關(guān)重要。目前我國的司法數(shù)據(jù)庫包含各級法院司法大數(shù)據(jù)平臺上存儲的內(nèi)部審判數(shù)據(jù)以及在裁判文書網(wǎng)等網(wǎng)站上可以搜索到的公開信息,這些數(shù)據(jù)雖然看似數(shù)量龐大,但其中包含大量程序運(yùn)轉(zhuǎn)類信息和行政管理類信息,真正涉及裁判的內(nèi)容較為有限。另外,由于案件之間關(guān)于事實(shí)判定和法律關(guān)系尚未建立有效關(guān)聯(lián),加之法官錄入平臺的信息不夠規(guī)范且時(shí)有錯誤,因此這些內(nèi)容多呈現(xiàn)為非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)。②對此,有必要對接受預(yù)訓(xùn)練的司法數(shù)據(jù)進(jìn)行清洗,由最高法參與設(shè)定專門的篩選規(guī)則,去掉重復(fù)的、無關(guān)的以及有害的司法數(shù)據(jù),避免數(shù)據(jù)侵權(quán)或者當(dāng)事人隱私信息泄露,再通過構(gòu)建法律知識圖譜提取結(jié)構(gòu)化信息,進(jìn)而為裁判大模型的預(yù)訓(xùn)練提供高質(zhì)量的語料庫。其次,在經(jīng)過大數(shù)據(jù)預(yù)訓(xùn)練后,為了能夠更好適配司法場景和盡可能滿足法官的裁判需求,需要對模型進(jìn)行“微調(diào)”。
對此,最高法可以組織一批有經(jīng)驗(yàn)的法官和法律專家來組成專門團(tuán)隊(duì),一方面,團(tuán)隊(duì)可以為模型提供一定數(shù)量的標(biāo)注樣本。雖然生成式人工智能所需要的標(biāo)注樣本數(shù)量較于傳統(tǒng)的訓(xùn)練法已經(jīng)大幅度降低,但通過少量樣本的半監(jiān)督式學(xué)習(xí)有助于增強(qiáng)模型在司法場景中的有效性。另一方面,團(tuán)隊(duì)可以對給定提示下模型所生成的多種結(jié)果進(jìn)行排序,并訓(xùn)練獎勵模型,從而促使該模型生成內(nèi)容更符合司法審判需求。再次,在開發(fā)專業(yè)裁判大模型時(shí),法院系統(tǒng)內(nèi)部應(yīng)當(dāng)設(shè)置相應(yīng)的審查委員會,對預(yù)訓(xùn)練數(shù)據(jù)的篩選標(biāo)準(zhǔn)以及樣本數(shù)據(jù)的標(biāo)注與排序等事項(xiàng)進(jìn)行全面監(jiān)督,防止裁判大模型被滲透進(jìn)有悖于司法公正的理念。最后,司法行政機(jī)關(guān)應(yīng)當(dāng)與生成式人工智能的研發(fā)團(tuán)隊(duì)保持密切合作,技術(shù)開發(fā)者應(yīng)承擔(dān)算法的可解釋性義務(wù),降低算法黑箱和算法歧視等人工智能的共性問題所造成的不利影響,也可以考慮引入第三方對模型公平性的評估機(jī)制,通過對模型運(yùn)行的監(jiān)測以持續(xù)改進(jìn)其合規(guī)性。
(二)生成式人工智能輔助裁判的風(fēng)險(xiǎn)防范
雖說目前從技術(shù)功能的角度來說能夠建構(gòu)出專門適配司法場景的裁判大模型,但是對于生成式人工智能在裁判中的具體應(yīng)用還需審慎推進(jìn)。這是因?yàn)椋c其他領(lǐng)域相比,司法的公正與否不但事關(guān)公民的權(quán)利義務(wù)分配,也影響到法律權(quán)威與社會秩序,生成式人工智能作為一項(xiàng)新興技術(shù),仍有不可忽視的潛在風(fēng)險(xiǎn)與不確定性,如應(yīng)用不當(dāng)則可能貶損司法價(jià)值,損害裁判公正。具體來說如下。
首先,生成式人工智能存在“知識幻覺”現(xiàn)象。①生成式人工智能是通過計(jì)算文本出現(xiàn)的概率來預(yù)測生成內(nèi)容,本質(zhì)上類似于一種“文字接龍”的游戲程序。事實(shí)上,生成式人工智能仍屬于弱AI系統(tǒng),其所生成的內(nèi)容只是在概率上最有可能出現(xiàn)的結(jié)果,而不能確保其真實(shí)性。但即便是虛構(gòu)的結(jié)論,由于其建立在對足夠多的數(shù)據(jù)的分析和統(tǒng)計(jì)基礎(chǔ)上,因此生成內(nèi)容往往看起來十分可信,但卻會讓人產(chǎn)生混淆。例如,在生成式人工智能的某平臺輸入問題“在中國判定闖紅燈是否違法的依據(jù)是什么?”,模型自動生成了這樣的回答:“《中華人民共和國道路交通安全法》第六十一條明確規(guī)定,遇紅燈必須停車,不得闖紅燈。違反者將被處以警告或者100元以上500元以下的罰款?!边@是一條虛構(gòu)的法律條款,但乍看卻十分符合“行為模式+法律后果”的規(guī)則結(jié)構(gòu),如不熟悉相關(guān)規(guī)定很容易誤以為這是一條真實(shí)的法律規(guī)則。事實(shí)上,回答這個問題并不困難,只要在法律法規(guī)檢索平臺中根據(jù)要素檢索即可獲得相關(guān)法條依據(jù),然而具有強(qiáng)大技術(shù)功能的生成式人工智能反而表現(xiàn)得不盡如人意,原因在于該模型生成的內(nèi)容只是基于概率的文字組合,而非真知,因此即便提升數(shù)據(jù)量級,也難以完全規(guī)避該問題。
其次,生成式人工智能生成內(nèi)容的有害性。生成式人工智能雖然在客觀上可以起到輔助法官價(jià)值判斷的功能,但該技術(shù)本身缺乏人類的倫理觀念,難以對生成內(nèi)容進(jìn)行道德判定。從本質(zhì)上來說,生成式人工智能是對事實(shí)關(guān)系的一種數(shù)據(jù)映射,其強(qiáng)大的語義理解與生成能力都是通過在海量數(shù)據(jù)上的深度學(xué)習(xí)而獲取,因此,如果預(yù)訓(xùn)練數(shù)據(jù)來源單一或者樣本數(shù)據(jù)內(nèi)含偏見,都可能會導(dǎo)致生成內(nèi)容的有害性。當(dāng)介入司法領(lǐng)域時(shí),生成式人工智能的有害性風(fēng)險(xiǎn)主要體現(xiàn)在三個方面:其一,過于依賴既往判例易導(dǎo)致生成內(nèi)容帶有明顯的傾向性。既往判例是裁判模型的重要訓(xùn)練數(shù)據(jù),然而這些判例只為生成式人工智能的強(qiáng)化學(xué)習(xí)提供了正樣本,其作用在于使模型生成內(nèi)容更符合人類預(yù)期。然而,過于依賴正樣本,會導(dǎo)致裁判模型難以覆蓋負(fù)樣本的可能情境,也容易對正樣本中高頻出現(xiàn)的情形產(chǎn)生傾向性,進(jìn)而有違司法的客觀中立。例如,有學(xué)者就指出,機(jī)器無法根據(jù)有罪判決所構(gòu)建的刑事案例庫而作出無罪判決。②其二,生成內(nèi)容對法律行為和結(jié)果之間存在不當(dāng)歸因的情況。由于生成式人工智能只是基于當(dāng)前輸入而對輸出文本的概率預(yù)測,加之技術(shù)本身缺乏道德評價(jià)能力,因此容易建立錯誤的因果關(guān)系。例如,自動生成判決中可能會將性犯罪原因與女性受害人特征之間直接掛鉤。其三,生成判決中可能會包含歧視性的負(fù)面言論。未經(jīng)人工標(biāo)注的數(shù)據(jù)本身是現(xiàn)實(shí)世界的投射,而歧視現(xiàn)象是社會中客觀存在的事實(shí),模型經(jīng)過海量數(shù)據(jù)的預(yù)訓(xùn)練后往往會放大這些既存偏見。即便有人工標(biāo)注下的“微調(diào)”予以矯正,但是也難以避免相關(guān)人員在調(diào)試過程中摻入新的偏好與歧視。
從上述分析可以看出,生成式人工智能即便具備強(qiáng)大功能,但囿于技術(shù)潛在的風(fēng)險(xiǎn),其始終無法取代法官而作出司法決策。我國在2022年發(fā)布的《最高人民法院關(guān)于規(guī)范和加強(qiáng)人工智能司法應(yīng)用的意見》中就提出,“無論技術(shù)發(fā)展到何種水平,人工智能都不得代替法官裁判”,明確這二者的功能定位有助于防范生成式人工智能潛在的技術(shù)風(fēng)險(xiǎn)。在此基礎(chǔ)上,還應(yīng)當(dāng)進(jìn)一步明確法官在使用該技術(shù)時(shí)所承擔(dān)的法定義務(wù):第一,法官負(fù)有審查真實(shí)性的義務(wù)。生成式人工智能的“知識幻覺”現(xiàn)象導(dǎo)致其生成內(nèi)容可能是對案件事實(shí)、法律規(guī)定甚至是對既往判例的虛構(gòu),因此,在運(yùn)用生成式人工智能整理案情和分析爭議焦點(diǎn)的時(shí)候,法官應(yīng)當(dāng)提前掌握案件基本情況,確保自動生成的內(nèi)容與法官對案件的基本認(rèn)識和把握相一致,以此來審核生成內(nèi)容的真實(shí)性。第二,法官負(fù)有解釋性義務(wù)。在裁判說理中,法官如果采納了生成式人工智能的觀點(diǎn),則應(yīng)當(dāng)在判決中對采納的原因予以具體解釋或說明。技術(shù)的先進(jìn)性并不意味著由其所生成內(nèi)容的正當(dāng)性,裁判的權(quán)威還是要訴諸說理與論證,因此,法官如若認(rèn)為有必要采納生成內(nèi)容,則應(yīng)當(dāng)論證生成內(nèi)容的無害性、合理性和有效性,為生成式人工智能的融入提供充足的說理依據(jù)。第三,法官負(fù)有引用標(biāo)注的義務(wù)。模型生成的內(nèi)容并不等同于法官個人的觀點(diǎn),法官如認(rèn)為合理,可以對其采納,但應(yīng)當(dāng)明確標(biāo)注來源,說明該觀點(diǎn)屬于模型自動化生成,這主要是避免法官用而不說、權(quán)責(zé)混亂。我國2023年發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》中也提到對生成內(nèi)容進(jìn)行標(biāo)識的要求,法官的義務(wù)設(shè)定可以加以參照。第四,法官負(fù)有使用留痕的義務(wù)。法官在裁判中運(yùn)用的生成式人工智能應(yīng)當(dāng)是由法院專門建構(gòu)的司法裁判大模型,而不應(yīng)使用市場上面向所有用戶開放的基礎(chǔ)模型,這是為了記錄和保存法官和模型交互問答的全過程,防止法官通過輸入提示與問題引導(dǎo)繞過生成式人工智能的安全防線,進(jìn)而達(dá)成不正當(dāng)目的或者生成有害內(nèi)容。
綜上所述,法官作為裁判的決策主體與責(zé)任主體,應(yīng)當(dāng)對生成式人工智能合理、審慎地利用。但法官所承擔(dān)的上述義務(wù)也給其運(yùn)用技術(shù)造成一定負(fù)擔(dān),降低其使用意愿。對此,可以從司法制度的層面制定相應(yīng)的激勵措施,鼓勵法官積極運(yùn)用新技術(shù)輔助辦案。例如,法院可以組織技術(shù)技能培訓(xùn)會和技術(shù)應(yīng)用交流會,既降低使用技術(shù)的門檻,也減輕法官對新興技術(shù)的畏難情緒。此外,各級法院也可以采取內(nèi)部評選的方式,對那些使用生成式人工智能輔助辦案且取得良好效果的法官給予物質(zhì)或非物質(zhì)獎勵,并作為典型案例加以推廣,供其他法官學(xué)習(xí)和參考??傊墒饺斯ぶ悄茉谒痉ú门蓄I(lǐng)域的具體應(yīng)用和制度建設(shè)還有非常廣闊的發(fā)展空間,而這有賴于在日后的司法實(shí)踐中不斷地探索與發(fā)掘。
[責(zé)任編輯李宏弢]