張瑞祥 趙志梟
摘? ?要:人工智能、大數(shù)據(jù)不僅重塑人類(lèi)生活,也在重塑學(xué)術(shù)研究。當(dāng)前,計(jì)算社會(huì)科學(xué)、計(jì)算人文以至“計(jì)算X”正在如火如荼展開(kāi),計(jì)算法學(xué)由此應(yīng)運(yùn)而生。由于法學(xué)具有較強(qiáng)的實(shí)踐性,與計(jì)算相遇、相融的時(shí)間較早,在經(jīng)歷了計(jì)量法學(xué)、法律信息學(xué)等發(fā)展階段后,學(xué)術(shù)界往來(lái)反復(fù)地辯難,計(jì)算法學(xué)的相關(guān)概念逐漸被厘清,近年終于以計(jì)算法學(xué)學(xué)科的創(chuàng)立迎來(lái)重大突破。當(dāng)計(jì)算法學(xué)不再需要通過(guò)不斷為自己正名而具有學(xué)科支撐后,學(xué)界也將更加關(guān)注其實(shí)踐的有效性。為了呈現(xiàn)我國(guó)計(jì)算法學(xué)研究現(xiàn)狀,合理預(yù)測(cè)其發(fā)展前景,文章對(duì)近年計(jì)算法學(xué)相關(guān)中外論文進(jìn)行聚類(lèi)分析,最終揭示計(jì)算法學(xué)在數(shù)據(jù)集、算法以及應(yīng)用等領(lǐng)域的重要成就,并闡釋其未來(lái)發(fā)展趨勢(shì)。
關(guān)鍵詞:計(jì)算法學(xué);人工智能;計(jì)算人文;算法;數(shù)據(jù)集
中圖分類(lèi)號(hào):D90? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?DOI:10.11968/tsyqb.1003-6938.2023005
Abstract Artificial intelligence and big data are reshaping not only human life but also academic research. Flourishing disciplines like computational social science, computational humanities, and "computational X" demonstrate this phenomenon. Computational Jurisprudence is also on the rise, as law has a strong practical aspect and has been intersecting with computation for a long time, going through various development stages such as Jurimetrics and Legal Informatics, and undergoing repeated debates in the academic community. The relevant concepts of Computational Jurisprudence have gradually been clarified, and with the establishment of the Computational Jurisprudence discipline in recent years, a major breakthrough has been achieved. With the support of a disciplinary foundation, Computational Jurisprudence no longer needs to constantly justify itself, and the academic community can now focus more on its practical effectiveness. To present the current research status of Computational Jurisprudence in China and predict its future prospects, a clustering analysis of recent domestic and foreign papers on Computational Jurisprudence was conducted. Finally, the important achievements of Computational Jurisprudence in the areas of data sets, algorithms, and applications were revealed, and future development trends were discussed.
Key words computational jurisprudence; artificial intelligence; computational humanities; algorithm; data set
隨著人工智能的不斷發(fā)展,人類(lèi)社會(huì)與人工智能的聯(lián)系越來(lái)越緊密,法律作為現(xiàn)代人類(lèi)社會(huì)治理的重要基石,其與人工智能的結(jié)合已是大勢(shì)所趨。將人工智能應(yīng)用到司法實(shí)踐,可以極大提升法律實(shí)施效率,為立法、司法提供參考和決策依據(jù)。而在法學(xué)研究中,隨著人工智能特別是ChatGPT等基于自然語(yǔ)言處理的標(biāo)志性產(chǎn)品推出,計(jì)算法學(xué)作為法學(xué)與計(jì)算跨學(xué)科結(jié)合的新方向和新方法,受到了進(jìn)一步的關(guān)注。計(jì)算法學(xué)也得益于計(jì)算社會(huì)科學(xué)與計(jì)算人文的長(zhǎng)足進(jìn)步,“計(jì)算社會(huì)科學(xué)”這一名稱(chēng)2009年在《科學(xué)》上被系統(tǒng)地提出并作了闡述[1]。在大數(shù)據(jù)迅猛發(fā)展的推動(dòng)下,數(shù)據(jù)驅(qū)動(dòng)、第四范式等研究模式在社會(huì)科學(xué)領(lǐng)域得到廣泛而深入地應(yīng)用。人文學(xué)科與計(jì)算相遇甚早,但是邁出的腳步卻遜于社會(huì)科學(xué),近年來(lái),計(jì)算在人文學(xué)科研究中所扮演的角色越來(lái)越重要,主要表現(xiàn)就是“數(shù)字人文”崛起。對(duì)于以數(shù)據(jù)驅(qū)動(dòng)、人工智能為突出表現(xiàn)形式的人文社會(huì)科學(xué)新的研究?jī)?nèi)容、領(lǐng)域和方法以及體系,黃水清等從問(wèn)題定義、數(shù)據(jù)集構(gòu)建、技術(shù)實(shí)現(xiàn)、問(wèn)題求解、結(jié)果評(píng)價(jià)及呈現(xiàn)等五個(gè)方面對(duì)這一人文社會(huì)科學(xué)的研究范式進(jìn)行了概括和總結(jié)[2-4]。在社會(huì)科學(xué)、人文科學(xué)與計(jì)算相融合的過(guò)程中,涌現(xiàn)出了計(jì)算人文、計(jì)算社會(huì)科學(xué)、數(shù)字人文、人文計(jì)算等相對(duì)宏觀(guān)而具有概括性的概念。但根據(jù)黃水清對(duì)人文社會(huì)科學(xué)與計(jì)算相融合的五個(gè)組成部分來(lái)看,“計(jì)算人文”這一概念在大數(shù)據(jù)、人工智能與人文研究融合的背景更加合理科學(xué)。法學(xué)既有人文科學(xué)屬性也有社會(huì)科學(xué)屬性,因此計(jì)算法學(xué)一定意義上也可以納入計(jì)算人文的學(xué)科體系,如針對(duì)法哲學(xué)、法律史等問(wèn)題的計(jì)算人文研究,即是計(jì)算人文與計(jì)算社會(huì)科學(xué)學(xué)科相關(guān)性的具體呈現(xiàn)。不過(guò),據(jù)分析計(jì)算法學(xué)[5]目前主要面向法律文檔的分析與計(jì)量,逐漸形成了包括海量判決書(shū)分析、自動(dòng)化法律推理、裁判文書(shū)推薦等獨(dú)具特色的研究方向[6-7]。
在人工智能蓬勃發(fā)展的時(shí)代背景下,通過(guò)梳理計(jì)算法學(xué)概念界定的過(guò)程,本文梳理了計(jì)算法學(xué)相關(guān)研究,并從數(shù)據(jù)、算法和具體應(yīng)用的角度對(duì)計(jì)算法學(xué)所取得的成就進(jìn)行總結(jié),進(jìn)而對(duì)人工智能視域下的計(jì)算法學(xué)發(fā)展趨勢(shì)進(jìn)行初步研判。
1? ?計(jì)算法學(xué)何以可能
在法學(xué)研究和實(shí)踐中使用計(jì)算方法并非新事物,20世紀(jì)40年代,西方計(jì)量法學(xué)(Jurimetrics)、法律信息學(xué)(Legal Informatics)就已經(jīng)出現(xiàn),而被稱(chēng)之為學(xué)科的“計(jì)算法學(xué)”(Computational Jurisprudence)則是近十年來(lái)學(xué)術(shù)界才開(kāi)始討論的話(huà)題,在人工智能、大數(shù)據(jù)技術(shù)興起和我國(guó)“新文科”建設(shè)的時(shí)代大背景下,傳統(tǒng)人文社會(huì)科學(xué)都將或主動(dòng)或被動(dòng)地接受數(shù)據(jù)化的洗禮,作為社會(huì)科學(xué)屬性尤為顯著的法學(xué)勢(shì)必首當(dāng)其沖。有鑒于此,計(jì)算法學(xué)在我國(guó)也迅速成為研究熱點(diǎn),涌現(xiàn)出了一大批成果,其中《計(jì)算法學(xué)導(dǎo)論》首先明確提出了計(jì)算法學(xué)概念[8],并對(duì)相關(guān)概念、發(fā)展史、實(shí)踐等做了充分論證。盡管有學(xué)者非常謹(jǐn)慎地承認(rèn)計(jì)算法學(xué)只是一種新的法學(xué)研究方法[5],但并未阻擋計(jì)算法學(xué)快速前進(jìn)的步伐。
從目前的發(fā)展趨勢(shì)看,我國(guó)法學(xué)界已經(jīng)非常積極主動(dòng)地探究法律實(shí)證研究、計(jì)算法學(xué)等相關(guān)問(wèn)題。而有關(guān)計(jì)算法學(xué)的討論套用康德式的提法,可以表述為“計(jì)算法學(xué)何以可能”的問(wèn)題,核心問(wèn)題包括計(jì)算法學(xué)是什么(What)與計(jì)算法學(xué)如何計(jì)算(How)。
(1)計(jì)算法學(xué)是什么。通常展現(xiàn)為法學(xué)與計(jì)算機(jī)、信息技術(shù)相融合的發(fā)展史,由最初算法驅(qū)動(dòng)、數(shù)據(jù)驅(qū)動(dòng)的計(jì)量法學(xué)逐漸演變?yōu)閿?shù)據(jù)驅(qū)動(dòng)、算法驅(qū)動(dòng)與問(wèn)題驅(qū)動(dòng)相平衡的新興交叉學(xué)科[9]。從學(xué)科門(mén)類(lèi)看,計(jì)算法學(xué)仍然屬于實(shí)證法學(xué)的范疇,與法律實(shí)證研究一樣都是具有數(shù)據(jù)計(jì)算基礎(chǔ)的量化研究,而且“計(jì)算法學(xué)與法律實(shí)證研究在研究對(duì)象、研究方法和研究領(lǐng)域上相通,其本質(zhì)上是實(shí)證研究在新材料、新方法興起后的應(yīng)用與拓展?!鄙踔量梢哉f(shuō)計(jì)算法學(xué)就是“法律實(shí)證研究的衍生或者2.0版本”[10]。當(dāng)然,計(jì)算法學(xué)并不是以數(shù)據(jù)計(jì)算取代傳統(tǒng)思辨、推理研究,而是借助大數(shù)據(jù)技術(shù)輔助和豐富法學(xué)研究和實(shí)踐。面對(duì)人工智能、大數(shù)據(jù)浪潮,沒(méi)有人會(huì)視而不見(jiàn),法學(xué)界在計(jì)算和法學(xué)深度交匯融合的時(shí)代趨勢(shì)中,既熱情擁抱數(shù)據(jù)技術(shù)之長(zhǎng)也冷靜思考發(fā)展之不足??紤]到我國(guó)現(xiàn)實(shí)情況,無(wú)論是法學(xué)研究還是實(shí)踐都離不開(kāi)人的參與,但若只有人參與其中,效率和客觀(guān)性可能都得不到保證,相形之下大數(shù)據(jù)參與法學(xué)研究和實(shí)踐都更加高效而客觀(guān)。事實(shí)上,我國(guó)法學(xué)研究和實(shí)踐也的確具有大數(shù)據(jù)化傾向,可以說(shuō)走向計(jì)算法學(xué)也將是大勢(shì)所趨[11]。
(2)計(jì)算法學(xué)如何計(jì)算??梢哉归_(kāi)為三個(gè)問(wèn)題:主體、對(duì)象和制度。首先,計(jì)算法學(xué)的主體并不僅是從事法學(xué)研究和實(shí)踐的人,法律和技術(shù)本身也構(gòu)成主體。計(jì)算法學(xué)的主體之一人要具有計(jì)算思維和跨學(xué)科思維[12],作為融合法學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)等跨學(xué)科研究,只有思維轉(zhuǎn)變才能推動(dòng)研究與實(shí)踐的實(shí)質(zhì)性進(jìn)步[13]。思維轉(zhuǎn)變的核心還包括承認(rèn)技術(shù)的主體地位,人工智能作為技術(shù)引起了學(xué)術(shù)界有關(guān)技術(shù)是否有意識(shí)、情感的哲學(xué)大討論,這個(gè)問(wèn)題證實(shí)和證偽均有難度,但它對(duì)人的沖擊力乃至造成的危機(jī)感卻是實(shí)在的。因此,我們不妨?xí)呵覕R置這一問(wèn)題,姑且從技術(shù)工具論轉(zhuǎn)向技術(shù)主體論,在實(shí)踐中檢驗(yàn)完善;其次,計(jì)算法學(xué)的對(duì)象即是數(shù)據(jù),不同于常規(guī)數(shù)據(jù)庫(kù)建設(shè),計(jì)算法學(xué)所需的數(shù)據(jù)是動(dòng)態(tài)變化的[10],而且與純學(xué)術(shù)研究不同,法律直接關(guān)系到國(guó)計(jì)民生。因此,計(jì)算法學(xué)數(shù)據(jù)源建設(shè)必然需要政府、研究機(jī)構(gòu)等多方同心同力;最后,計(jì)算法學(xué)的長(zhǎng)足發(fā)展還需要頂層設(shè)計(jì)和制度保障,作為學(xué)科進(jìn)行建設(shè)非常有必要,而且計(jì)算法學(xué)作為學(xué)科加快發(fā)展建設(shè)也是順大勢(shì)而為,也有助于我國(guó)社會(huì)主義事業(yè)建設(shè)[14]。當(dāng)計(jì)算法學(xué)不再需要通過(guò)不斷為自己正名而具有學(xué)科支撐后,學(xué)界也將更加關(guān)注其實(shí)踐的有效性。
2? ?計(jì)算法學(xué)的發(fā)展
融合人工智能和法學(xué)的計(jì)算法學(xué)作為一門(mén)涉及多學(xué)科知識(shí)的綜合性交叉學(xué)科,其研究不能只看做人工智能與法學(xué)兩個(gè)領(lǐng)域知識(shí)的簡(jiǎn)單堆砌,更重要的是人工智能與法學(xué)兩個(gè)學(xué)科的相互融合和促進(jìn)。從計(jì)量法學(xué)到計(jì)算法學(xué),并不是傳統(tǒng)法學(xué)研究的落寞,而是計(jì)算法學(xué)為傳統(tǒng)法學(xué)研究提供更多的道路和方法[15]。當(dāng)然計(jì)算法學(xué)美好廣闊的前景不會(huì)一帆風(fēng)順,其發(fā)展歷程也不是一蹴而就的,在法學(xué)研究和實(shí)踐中引入計(jì)算方法,到最終形成計(jì)算法學(xué)經(jīng)歷了多個(gè)階段。
鑒于法學(xué)的實(shí)踐維度,面對(duì)海量法律文書(shū)時(shí)人力顯得極其渺小,因此當(dāng)計(jì)算機(jī)出現(xiàn)后,法學(xué)界很快將其引入法律實(shí)踐。通過(guò)計(jì)算機(jī)建構(gòu)法律模型輔助法律判案,隨著20世紀(jì)70年代Buchanan和Headrick有關(guān)法律推理模型的可行性探討,標(biāo)志著計(jì)算法學(xué)作為法學(xué)學(xué)科研究分支的誕生[16]。之后越來(lái)越多的法學(xué)工作者將計(jì)算方法應(yīng)用到法律實(shí)踐中,用于提升法律案件處理的效率。而計(jì)算方法的大規(guī)模應(yīng)用,確實(shí)在短時(shí)間內(nèi)優(yōu)化了法律實(shí)踐工作,為司法、執(zhí)法、辯護(hù)提供了行之有效的輔助作用。無(wú)論是Deedma和Smith以加拿大法律案件為基礎(chǔ)構(gòu)建的專(zhuān)家斷案系統(tǒng)[17],還是Biedermann等使用貝葉斯網(wǎng)絡(luò)針對(duì)火災(zāi)事故的法醫(yī)調(diào)查[18-19],亦或是Riesen和Serpen在犯罪數(shù)據(jù)(NCVS)中引入貝葉斯信念網(wǎng)絡(luò)(BBN)以促進(jìn)自動(dòng)分析的方式向非專(zhuān)家表示復(fù)雜的數(shù)據(jù)集[20],均非常優(yōu)秀地使用計(jì)算方法解決法律問(wèn)題。
在法律實(shí)踐具體層面之外,計(jì)算也為法學(xué)理論研究提供了新方法新思維,法理猶如法哲學(xué)是純思辨性的,但是法理基礎(chǔ)一旦成為共識(shí)進(jìn)而成為法律,那么其運(yùn)作如“依法治國(guó)”就要依靠法律進(jìn)行邏輯推理,而邏輯推理正是計(jì)算擅長(zhǎng)的領(lǐng)域。在不借助計(jì)算以前,法律實(shí)踐全憑法官、律師個(gè)人的博學(xué)才智,但是法律實(shí)踐的規(guī)則仍然是依靠法條的邏輯推理。正如史學(xué)研究最理想的狀態(tài)是窮盡史料,法學(xué)研究和實(shí)踐同樣如此,因此海量法律文本的數(shù)據(jù)化和計(jì)算分析也逐漸成為法學(xué)研究熱點(diǎn)。Hamann等引入計(jì)算機(jī)輔助法律語(yǔ)言學(xué)作為一種半自動(dòng)化方法,通過(guò)系統(tǒng)地分析大量法律文本來(lái)“理解”法律話(huà)語(yǔ),使用統(tǒng)計(jì)算法來(lái)分析大量文本滿(mǎn)足了律師對(duì)經(jīng)驗(yàn)數(shù)據(jù)日益增長(zhǎng)的需求[21];Giacalone等基于司法判決評(píng)估的web數(shù)據(jù)構(gòu)建調(diào)查系統(tǒng),旨在通過(guò)文本挖掘技術(shù)提升法律實(shí)施效率,并進(jìn)一步構(gòu)建關(guān)于事實(shí)和判斷的智能系統(tǒng)[22],均是借助大數(shù)據(jù)計(jì)算方法輔助法律實(shí)踐的代表成果。事實(shí)上,計(jì)算方法不僅促進(jìn)了法律實(shí)踐的進(jìn)步,有研究表明,大數(shù)據(jù)技術(shù)對(duì)于處于發(fā)展初級(jí)階段的律師事務(wù)所亦有著非常重要的積極影響[23]。
人工智能、大數(shù)據(jù)、云計(jì)算等技術(shù)對(duì)于法律信息化的實(shí)施有著極大的推動(dòng)作用,通過(guò)現(xiàn)代計(jì)算技術(shù),可以加速推動(dòng)司法系統(tǒng)的完善,從而支持立法者對(duì)相關(guān)法律做出調(diào)整。與此同時(shí),人工智能的飛速發(fā)展帶來(lái)的法律、倫理道德等影響也成為法學(xué)研究的重要內(nèi)容,對(duì)于人工智能的監(jiān)管規(guī)范以及數(shù)據(jù)獲取過(guò)程中的信息問(wèn)題亟待進(jìn)一步解決完善。在時(shí)代的浪潮下,人工智能與法律的融合已是必然,在不斷完善法律人工智能體系的同時(shí),法律對(duì)于人工智能的約束也應(yīng)放在重要地位。無(wú)論是國(guó)內(nèi)外有關(guān)計(jì)算法學(xué)的學(xué)科屬性的探討,還是對(duì)計(jì)算大數(shù)據(jù)的法律思考,都指向一個(gè)主題,那就是“為計(jì)算立法”。在計(jì)算法學(xué)發(fā)展的初期,學(xué)界主要關(guān)心甚至擔(dān)心數(shù)據(jù)化、信息化浪潮對(duì)于人類(lèi)社會(huì)的挑戰(zhàn),更希望通過(guò)法律約束計(jì)算。正是在此時(shí)代背景下,20世紀(jì)末,周慶山看到社會(huì)信息化帶來(lái)的各種信息矛盾,提出了加強(qiáng)信息法學(xué)研究和教育的建議[24];馬海群和喬立春則通過(guò)對(duì)中國(guó)信息法律和信息立法研究的歷史、現(xiàn)狀、主要成果的考察,分析了中國(guó)信息法學(xué)的研究基礎(chǔ)、重點(diǎn)領(lǐng)域和研究缺陷,提出要明確信息法學(xué)學(xué)科歸屬,強(qiáng)化信息法學(xué)概念認(rèn)同,以解決綜合性現(xiàn)實(shí)問(wèn)題為研究目的[25]。不過(guò),隨著人工智能大數(shù)據(jù)的突飛猛進(jìn),尤其是國(guó)內(nèi)學(xué)界的認(rèn)知也從“挑戰(zhàn)”演變?yōu)椤皺C(jī)遇”,從警惕信息化的法律風(fēng)險(xiǎn)轉(zhuǎn)變?yōu)榻⒂?jì)算法學(xué)學(xué)科。國(guó)內(nèi)眾多學(xué)者[5,11,26-28]均做出了有益的嘗試,而曾赟則更進(jìn)一步,他基于科學(xué)研究的“第四種范式”(數(shù)據(jù)科學(xué))提出了“數(shù)據(jù)法學(xué)”[29]。
可以看到人工智能技術(shù)與法學(xué)研究的相互影響成就了當(dāng)前的計(jì)算法學(xué),計(jì)算法學(xué)的相關(guān)理論已經(jīng)獲得了法學(xué)、人工智能、計(jì)算機(jī)、數(shù)學(xué)等領(lǐng)域的廣泛認(rèn)可,這是計(jì)算社會(huì)科學(xué)的重大突破。與此同時(shí),國(guó)內(nèi)的相關(guān)研究則呈現(xiàn)出比較奇特的景象:一者國(guó)內(nèi)在計(jì)算法學(xué)的實(shí)踐應(yīng)用上,與國(guó)際相比仍然處于較為落后的階段;二者國(guó)內(nèi)計(jì)算法學(xué)制度設(shè)計(jì)的探討卻遙遙領(lǐng)先。這也是由我國(guó)實(shí)際情況決定的,就學(xué)術(shù)而言,計(jì)算法學(xué)需要法學(xué)領(lǐng)域和人工智能領(lǐng)域?qū)<业纳疃群献鳎挥腥绱瞬拍苷嬲龑?shí)現(xiàn)專(zhuān)業(yè)化突破;而在我國(guó)想要更快實(shí)現(xiàn)研究成果轉(zhuǎn)化,改革法律人才培養(yǎng)模式,讓計(jì)算法學(xué)切實(shí)改變法律社會(huì)的運(yùn)行模式,為全面依法治國(guó)服務(wù),就需要學(xué)科體制的支撐。所以當(dāng)西方法學(xué)界更多用力于即時(shí)的法律實(shí)踐研究時(shí),我們則更偏重于計(jì)算法學(xué)學(xué)科體制建設(shè)的討論。
當(dāng)然,計(jì)算法學(xué)的發(fā)展并不意味著傳統(tǒng)法學(xué)的落寞,恰恰相反,作為法學(xué)研究的分支,計(jì)算法學(xué)的發(fā)展為傳統(tǒng)法學(xué)開(kāi)拓了前景,最新的人工智能技術(shù)讓法學(xué)研究能夠更加快捷地處理批量的法律數(shù)據(jù),從而更好地適應(yīng)新的時(shí)代變化。而這一趨勢(shì)正隨著國(guó)內(nèi)外學(xué)術(shù)交流相互促進(jìn),全球人工智能技術(shù)大會(huì)特設(shè)了“法律人工智能”專(zhuān)題、人工智能與法律國(guó)際會(huì)議、計(jì)算法學(xué)國(guó)際會(huì)議等均以穩(wěn)定的形式召開(kāi)。在法律人工智能熱潮下,形而上學(xué)的冷思考也浮出水面,計(jì)算法學(xué)及其相關(guān)的人工智能法律、倫理道德、人類(lèi)命運(yùn)等問(wèn)題變得日益緊迫。毫無(wú)疑問(wèn),當(dāng)前人工智能技術(shù)與計(jì)算法學(xué)仍存在較大局限需要改進(jìn):一方面,現(xiàn)有技術(shù)仍然無(wú)法替代人的思考,僅在重復(fù)勞動(dòng)和知識(shí)儲(chǔ)備等方面表現(xiàn)突出,在提升計(jì)算法學(xué)與當(dāng)前社會(huì)兼容性方面的技術(shù)需要較大改進(jìn);另一方面,法律的主體仍然是人,目前來(lái)看,計(jì)算法學(xué)可以通過(guò)數(shù)據(jù)支持輔助決策,但法律的制定者、執(zhí)行者仍然是主體性的人。如果說(shuō)計(jì)算法學(xué)的加入為法學(xué)研究增添了更多理性,那么人的參與就讓法學(xué)研究兼有理性與感性色彩,而“感性”恰恰是當(dāng)前人優(yōu)于人工智能的關(guān)鍵所在。
3? ?計(jì)算法學(xué)的數(shù)據(jù)、算法和應(yīng)用
2022年底,ChatGPT的橫空出世,讓人工智能進(jìn)入了一個(gè)新的階段,隨著人工智能的發(fā)展,社會(huì)各界與人工智能的聯(lián)系也越來(lái)越緊密,法律作為人類(lèi)社會(huì)的伴生物,其與人工智能的結(jié)合已是大勢(shì)所趨。將人工智能應(yīng)用到司法實(shí)踐,可以極大提升法律實(shí)施效率,為立法者提供立法參考和決策依據(jù)。人工智能下的計(jì)算法學(xué)在法律領(lǐng)域的實(shí)踐主要包括三個(gè)方面:數(shù)據(jù)集的構(gòu)建、智能處理算法的研究、計(jì)算法學(xué)在法學(xué)領(lǐng)域的實(shí)踐應(yīng)用。
3.1? ? 計(jì)算法學(xué)的數(shù)據(jù)集
無(wú)論是傳統(tǒng)機(jī)器學(xué)習(xí)還是深度學(xué)習(xí),數(shù)據(jù)質(zhì)量都是影響模型、算法性能的重要因素。法律文本作為專(zhuān)業(yè)性較強(qiáng)的規(guī)范語(yǔ)言,法律文本數(shù)據(jù)集的構(gòu)建往往需要法律專(zhuān)家的參與。在現(xiàn)實(shí)研究中,不同研究團(tuán)隊(duì)的專(zhuān)業(yè)背景和社會(huì)資源不同,所以數(shù)據(jù)集構(gòu)建方法也有所不同。
在純手工標(biāo)注方面,Du等通過(guò)人工注釋的方法構(gòu)建了法律領(lǐng)域的第一個(gè)中文問(wèn)答數(shù)據(jù)集(LawQA),用于評(píng)估模型的有效性[30]。Sharafat等基于巴基斯坦法院公開(kāi)的判決數(shù)據(jù),編寫(xiě)法律實(shí)體標(biāo)注指南,構(gòu)建了用于提取各種法律實(shí)體的標(biāo)注數(shù)據(jù)集,并使用條件隨機(jī)場(chǎng)(CRF)在數(shù)據(jù)集上進(jìn)行自動(dòng)命名實(shí)體識(shí)別[31]。Duan等提出了一個(gè)中文司法閱讀理解(CJRC)數(shù)據(jù)集,其中包含大約10000個(gè)法律文書(shū)和近50000個(gè)帶答案的問(wèn)題,其中文書(shū)來(lái)自裁判文書(shū),問(wèn)題由法律專(zhuān)家批注,在該數(shù)據(jù)集上基于BERT和BiDAF構(gòu)建了兩個(gè)模型[32]。Ma等構(gòu)建了中國(guó)法律案例檢索數(shù)據(jù)集(LeCaRD),其中包含107個(gè)查詢(xún)案例和超過(guò)43,000個(gè)候選案例,查詢(xún)和結(jié)果采用中國(guó)最高人民法院公布的刑事案例。在相關(guān)性定義方面,提出了一系列判斷標(biāo)準(zhǔn),并由法律專(zhuān)家進(jìn)行相應(yīng)的候選案例標(biāo)注[33]。Urchs等基于德國(guó)32個(gè)法院的748131項(xiàng)判決,構(gòu)建了兩個(gè)德語(yǔ)法律文本語(yǔ)料庫(kù),第一個(gè)語(yǔ)料庫(kù)為所有判決及其元數(shù)據(jù),第二個(gè)語(yǔ)料庫(kù)包含隨機(jī)抽取的200個(gè)判決文本,語(yǔ)料庫(kù)由法律專(zhuān)家進(jìn)行人工標(biāo)注[34]。
人工標(biāo)注可以獲得較為準(zhǔn)確的數(shù)據(jù)集,但也會(huì)耗費(fèi)大量的時(shí)間和資源,有一些學(xué)者通過(guò)半自動(dòng)化的方式構(gòu)建數(shù)據(jù)集。如Boonchom和Soonthornphisaj開(kāi)發(fā)了一種蟻群算法用于自動(dòng)擴(kuò)展最初由法律專(zhuān)家創(chuàng)建的種子本體,基于繼承法和家庭法兩個(gè)種子本體,使用最高法院判決作為語(yǔ)料庫(kù)進(jìn)行擴(kuò)展,通過(guò)向本體中嵌入權(quán)重值,提升了建設(shè)系統(tǒng)的性能[35]。Chen等提出了一種半自動(dòng)化的機(jī)器學(xué)習(xí)框架用于大型數(shù)據(jù)集的數(shù)據(jù)增強(qiáng)和質(zhì)量評(píng)估,通過(guò)創(chuàng)建小量的初始語(yǔ)料庫(kù),使用生成對(duì)抗網(wǎng)絡(luò)(GAN)進(jìn)行數(shù)據(jù)生成和增強(qiáng)[36]。
也有學(xué)者通過(guò)對(duì)已有信息進(jìn)行自動(dòng)化組織處理,構(gòu)建無(wú)標(biāo)注數(shù)據(jù)集,如Dydare和Lampach基于歐盟存續(xù)期間向歐洲法院移交案件的整個(gè)法院的地理坐標(biāo)構(gòu)建了法院地理坐標(biāo)數(shù)據(jù)集(GEOCOURT),用于探索跨時(shí)間、成員國(guó)和法院層級(jí)的空間差異和集群效應(yīng)[37]。Bradford等引入了兩個(gè)關(guān)于全球競(jìng)爭(zhēng)法制度的數(shù)據(jù)集——競(jìng)爭(zhēng)法數(shù)據(jù)集和比較競(jìng)爭(zhēng)執(zhí)法數(shù)據(jù)集,數(shù)據(jù)涵蓋了1990年-2010年間的競(jìng)爭(zhēng)法和相關(guān)競(jìng)爭(zhēng)機(jī)構(gòu)數(shù)據(jù),提供了較為全面的競(jìng)爭(zhēng)法圖景,為市場(chǎng)監(jiān)管的法律制度實(shí)證研究提供了基礎(chǔ)[38]。
數(shù)據(jù)集構(gòu)建是人工智能應(yīng)用于法律的第一步,在大數(shù)據(jù)時(shí)代下,雖然每天產(chǎn)生的數(shù)據(jù)量非常巨大,但其中大多為非結(jié)構(gòu)化、非專(zhuān)業(yè)化的數(shù)據(jù),難以應(yīng)用到法律領(lǐng)域研究。如何將零散的數(shù)據(jù)結(jié)構(gòu),形成可供研究使用的高質(zhì)量規(guī)范數(shù)據(jù)集,是當(dāng)前人工智能領(lǐng)域需要解決的問(wèn)題。
3.2? ? 計(jì)算法學(xué)相關(guān)的算法
法律數(shù)據(jù)集的構(gòu)建為人工智能技術(shù)在法學(xué)領(lǐng)域的應(yīng)用提供了基礎(chǔ),由于法律文本的特殊性,往往需要對(duì)當(dāng)前的技術(shù)進(jìn)行優(yōu)化,針對(duì)不同類(lèi)型的法律,使用不同的方法,在推動(dòng)法律智能處理技術(shù)發(fā)展的過(guò)程中,也完善了法律人工智能體系。
有些學(xué)者將多個(gè)模型進(jìn)行組合以提升模型性能,如周曉輝提出了一個(gè)基于隱式馬爾科夫的法律命名實(shí)體識(shí)別模型,使用多個(gè)HMM模型串聯(lián)對(duì)文本進(jìn)行由淺至深的實(shí)體識(shí)別,并利用搜索引擎識(shí)別并消解同義命名實(shí)體,從而完成針對(duì)法律文本的命名實(shí)體識(shí)別過(guò)程[39]。韓金波以故意殺人案和繼承案為切入點(diǎn),分析了故意殺人案與繼承案在樣本集中的差異,發(fā)現(xiàn)了繼承案樣本分布不均勻、樣本數(shù)量過(guò)小的問(wèn)題,提出一種基于Siamese網(wǎng)絡(luò)和多核CNN模型相結(jié)合的案件判決區(qū)間預(yù)測(cè)模型Siamese-CNN[40]。張虎等分析了法律文書(shū)的事實(shí)描述和法條的具體司法解釋?zhuān)岢隽嘶诙嗄P腿诤系姆l推薦方法,將不同參數(shù)的CNN或RNN通過(guò)概率相加的方式進(jìn)行融合,以達(dá)到模型互補(bǔ)的效果,提高法條推薦的準(zhǔn)確性[41]。Pande和Alam基于新西蘭就業(yè)局(NZERA)數(shù)據(jù)集,使用LDA結(jié)合RNN、CNN和CapsNet模型,首次進(jìn)行了就業(yè)相關(guān)的司法案件結(jié)果分析和預(yù)測(cè),研究發(fā)現(xiàn),基于CapsNet的LDA模型具有最高的準(zhǔn)確性和一致性[42]。鄭潔等基于BERT模型,將法律知識(shí)與案情文本拼接,讓模型同時(shí)學(xué)習(xí)法律知識(shí)和文本信息的特征,并使用LSTM網(wǎng)絡(luò)對(duì)文本進(jìn)行分段建模,之后,結(jié)合三元組損失和基于對(duì)抗的對(duì)比損失共同訓(xùn)練模型,提升了相似案例匹配任務(wù)的準(zhǔn)確率[43]。
也有一部分學(xué)者嘗試在已有方法的基礎(chǔ)上,針對(duì)特定領(lǐng)域的法律問(wèn)題進(jìn)行改良優(yōu)化,如楊超群等提出了一個(gè)基于法律事實(shí)的適用法條推薦模型,選取了刑事詐騙罪和民事離婚糾紛兩個(gè)案由的裁判文書(shū)數(shù)據(jù)集,使用FastText模型,基于遷移學(xué)習(xí)方法從預(yù)訓(xùn)練的通用詞向量出發(fā)訓(xùn)練法律詞向量,再以此為基礎(chǔ)進(jìn)行文本分類(lèi)[45]。Vuong等提出了一種新的方法(SM-BERT-CR)用于解決法律案例檢索過(guò)程中的長(zhǎng)文檔和相似度匹配問(wèn)題,并提出一種自動(dòng)創(chuàng)建大型弱標(biāo)記數(shù)據(jù)集的方法,用于解決數(shù)據(jù)匱乏問(wèn)題[45]。Juang等提出一種解決法律文章不平衡問(wèn)題和判決缺失值問(wèn)題的智能法律文章預(yù)測(cè)方案,通過(guò)向量相似度加權(quán)機(jī)制解決判決缺失值問(wèn)題,通過(guò)權(quán)重共享和遷移學(xué)習(xí)解決法律文字不平衡問(wèn)題[46]。Sovrano等基于法律語(yǔ)言在文本結(jié)構(gòu)和單詞方面的特殊性,將深度學(xué)習(xí)的準(zhǔn)確性與淺層學(xué)習(xí)處理少量數(shù)據(jù)的能力相結(jié)合,提出了一種可以在較小數(shù)據(jù)集上執(zhí)行較為準(zhǔn)確的分類(lèi)或問(wèn)答任務(wù)的新技術(shù)(SyntagmTuner)[47]。
過(guò)去幾年,基于BERT模型的文本分類(lèi)和命名實(shí)體識(shí)別技術(shù)受到廣泛的關(guān)注,ChatGPT的誕生或許會(huì)改變自然語(yǔ)言處理的發(fā)展方向,讓更多人投身到文本生成的研究中,法律判決文本、律師辯護(hù)文本的自動(dòng)生成也存在一定的可能性。但有一點(diǎn)是肯定的,無(wú)論技術(shù)的發(fā)展方向是什么,其最終目的都要回歸現(xiàn)實(shí),推動(dòng)法律人工智能的發(fā)展,讓人工智能切實(shí)解決現(xiàn)實(shí)生活中的法律問(wèn)題。
3.3? ? 計(jì)算法學(xué)領(lǐng)域的具體應(yīng)用
相較于針對(duì)某一特定任務(wù)的法律自然語(yǔ)言處理技術(shù),人工智能在法學(xué)領(lǐng)域的實(shí)際應(yīng)用要涉及更多的內(nèi)容和工作。其中主要包括:原始數(shù)據(jù)的獲取、數(shù)據(jù)集的構(gòu)建、算法的選擇和優(yōu)化、功能模塊的劃分、前端搭建等等。根據(jù)實(shí)現(xiàn)的功能和目標(biāo)用戶(hù)的不同主要可以分為:針對(duì)普通人的法律咨詢(xún)系統(tǒng)和針對(duì)專(zhuān)業(yè)人士的決策輔助系統(tǒng)。
在法律咨詢(xún)系統(tǒng)方面,王海亮基于對(duì)判決文書(shū)的挖掘分析,研究并構(gòu)建了法律咨詢(xún)系統(tǒng),基于Word2Vec詞向量技術(shù),提出了一種新型的文本表達(dá)形式(World2Vec_GL),系統(tǒng)還根據(jù)案件的困難指數(shù),提出了一種新的律師推薦方法,律師推薦、關(guān)鍵詞檢索、文書(shū)統(tǒng)計(jì)、文書(shū)推薦、信息抽取共同組成了該系統(tǒng)[48]。Seeam等探討了針對(duì)勞動(dòng)法和就業(yè)法的專(zhuān)家答疑系統(tǒng)的構(gòu)建,該系統(tǒng)基于機(jī)器學(xué)習(xí)技術(shù),通過(guò)Web頁(yè)面為用戶(hù)提供法律答疑,同時(shí),該系統(tǒng)配備的龐大知識(shí)庫(kù)使其能夠自行學(xué)習(xí)就業(yè)法相關(guān)知識(shí),可以通過(guò)對(duì)知識(shí)庫(kù)的及時(shí)更新保證系統(tǒng)的時(shí)效性[49]。
針對(duì)專(zhuān)業(yè)人士的輔助系統(tǒng)構(gòu)建往往需要法律專(zhuān)業(yè)人士的參與,Barros等基于監(jiān)督機(jī)器學(xué)習(xí)方法,通過(guò)文本提取、文本分析、數(shù)據(jù)標(biāo)注、機(jī)器學(xué)習(xí)的模式,將知識(shí)發(fā)現(xiàn)應(yīng)用于司法判決數(shù)據(jù)庫(kù),提供了一個(gè)幫助律師以快速、可視化、探索性的方式獲取信息的應(yīng)用程序[50]。Mokanov介紹了Lexum實(shí)驗(yàn)團(tuán)隊(duì)在法律人工智能方面的優(yōu)勢(shì)和成果,Lexum基于CanII數(shù)據(jù)庫(kù)中數(shù)百萬(wàn)份法律數(shù)據(jù)及其元數(shù)據(jù),結(jié)合蒙塔利爾大學(xué)算法研究所團(tuán)隊(duì)的技術(shù)經(jīng)驗(yàn),構(gòu)建了一個(gè)用于將事實(shí)推理到法律的應(yīng)用程序(Facts2Law),該程序可以為任何給定的文本預(yù)測(cè)最相關(guān)的法律來(lái)源[51]。Fernandes等構(gòu)建了一個(gè)法律判決系統(tǒng)以執(zhí)行上訴法院修改提取任務(wù),該系統(tǒng)基于法律文本信息提取相關(guān)研究,以巴西上訴法院的判決文本為語(yǔ)料庫(kù),嘗試了多種機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法,并使用里約熱內(nèi)盧州上訴法院判例數(shù)據(jù)庫(kù)的公開(kāi)數(shù)據(jù)構(gòu)建了Kauane Junior語(yǔ)料庫(kù)用于訓(xùn)練和評(píng)估系統(tǒng)[52]。
人工智能在法律實(shí)踐方面的未來(lái)是非常廣闊且潛力巨大的。當(dāng)然,完備、時(shí)效性強(qiáng)的數(shù)據(jù)和技術(shù)是人工智能更好地應(yīng)用到法律事件中的基礎(chǔ),在當(dāng)前這個(gè)信息和技術(shù)快速迭代的時(shí)代,系統(tǒng)的構(gòu)建固然重要,對(duì)系統(tǒng)的更新、維護(hù)也值得更多關(guān)注。我們也需要明白,在人工智能為律師、法官、個(gè)人提供便捷、高效服務(wù)的同時(shí),倫理、隱私問(wèn)題也是不可避免的,如何讓人工智能戴著“鐐銬”起舞,需要從法律和人工智能雙重角度進(jìn)行深入探討。
4? ?計(jì)算法學(xué)的發(fā)展趨勢(shì)
從法律文本智能處理來(lái)看,國(guó)內(nèi)研究更加側(cè)重于法律文本分類(lèi),國(guó)外研究更加側(cè)重于法律文本特征提取。在技術(shù)發(fā)展方面,國(guó)外研究已經(jīng)開(kāi)始重視基于少量樣本的訓(xùn)練方法,隨著研究的不斷發(fā)展,高質(zhì)量的可用數(shù)據(jù)集會(huì)愈加匱乏,確實(shí)有必要開(kāi)辟一條新的“數(shù)據(jù)之路”;在實(shí)際應(yīng)用方面,國(guó)內(nèi)研究更加注重量刑、法律咨詢(xún)等案件預(yù)測(cè)相關(guān)內(nèi)容,國(guó)外研究對(duì)于人工智能輔佐數(shù)字取證更感興趣。總的來(lái)說(shuō),人工智能技術(shù)在法律層面應(yīng)用即計(jì)算法學(xué)的進(jìn)一步發(fā)展離不開(kāi)以下幾個(gè)方面的支持:
第一,高質(zhì)量、高標(biāo)準(zhǔn)的法律數(shù)據(jù)集。這可以說(shuō)就是計(jì)算法學(xué)的“語(yǔ)料”,但由于法律既有極強(qiáng)的學(xué)理性,法律事件又需要極高的專(zhuān)業(yè)素養(yǎng),因此高質(zhì)量法律數(shù)據(jù)集的采集建設(shè)就需要法律專(zhuān)業(yè)人士和信息資源管理相關(guān)研究人員的通力合作。而在法律數(shù)據(jù)標(biāo)注層面,可以探索更多半監(jiān)督、弱監(jiān)督的數(shù)據(jù)標(biāo)注方法或者針對(duì)較小量樣本的訓(xùn)練模式。借鑒西方經(jīng)驗(yàn)和我國(guó)實(shí)際情況,高質(zhì)量法律數(shù)據(jù)集建設(shè)尤其離不開(kāi)黨和政府的支持,不同于純理論研究,法律的應(yīng)用性較強(qiáng),除了學(xué)術(shù)研究成果外,法律事件中形成的法律數(shù)據(jù)就極其龐大,但這些數(shù)據(jù)各有所屬,其中人民法院、檢察院的法律數(shù)據(jù)尤為豐富,這也將是未來(lái)計(jì)算法學(xué)研究的重要素材。而且國(guó)內(nèi)除了有普通法還有“黨內(nèi)法規(guī)”[53],也是我黨治國(guó)理政的重要組成部分,這類(lèi)數(shù)據(jù)若沒(méi)有黨和政府的支持,也將很難納入研究。
第二,在算法層面針對(duì)特定法律案例做出改進(jìn)優(yōu)化。人工智能ChatGPT掀起了生成式語(yǔ)言模型的熱潮,讓我們看到人工智能超乎想象的理解力和創(chuàng)造力,這樣的應(yīng)用也為法律文本的自動(dòng)生成技術(shù)提供了更加廣闊的前景?,F(xiàn)代法律在我國(guó)的研究和實(shí)踐時(shí)間還比較短,尤其是普通民眾對(duì)于法律的認(rèn)知度、認(rèn)可度還不夠,雖然經(jīng)歷了數(shù)十年的普法宣傳教育,但民眾真正需要法律支持的成本依然較高,這也客觀(guān)上阻礙了民眾對(duì)于法律的熱情,極不利于“全面依法治國(guó)”的推行??梢灶A(yù)見(jiàn),法律自動(dòng)生成語(yǔ)言模型建設(shè)將極大降低民眾法律學(xué)習(xí)實(shí)踐的成本,也將極大降低司法、執(zhí)法成本。
第三,將理論與實(shí)際結(jié)合,實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn),將法律智能化相關(guān)技術(shù)應(yīng)用到現(xiàn)實(shí)生產(chǎn)生活中,通過(guò)在現(xiàn)實(shí)環(huán)境中的表現(xiàn)提出進(jìn)一步的改進(jìn)措施,逐步完善法律人工智能體系。在政府公權(quán)力的監(jiān)督下,還可以引入商業(yè)運(yùn)作模式,由政府、學(xué)者、商業(yè)、民眾等多方參與,在不斷訓(xùn)練的基礎(chǔ)上提高法律智能化水平,也可以讓法律真正起到維護(hù)國(guó)家社會(huì)安定、人民幸福安康的作用。
5? ?結(jié)語(yǔ)
高質(zhì)量法律數(shù)據(jù)集建設(shè)不同于相對(duì)穩(wěn)定的古籍?dāng)?shù)據(jù)庫(kù),它具有動(dòng)態(tài)特性,既需要處理過(guò)往法律數(shù)據(jù),也面向不斷增加的法律數(shù)據(jù)。法律實(shí)踐是“理”與“情”的統(tǒng)一,在司法執(zhí)法過(guò)程中因?yàn)殡x不開(kāi)人的參與,而人的主觀(guān)情感總難免摻雜其中。隨著計(jì)算法學(xué)深入研究提供的理論基礎(chǔ)不斷完善,人工智能技術(shù)實(shí)踐日臻成熟可靠,也許在不久的將來(lái)人工智能會(huì)在司法裁判中起到必要的輔助作用,從而規(guī)避因?yàn)槿说闹饔^(guān)情感帶來(lái)的主觀(guān)誤判。
但這一過(guò)程不是一蹴而就的,計(jì)算法學(xué)尚且處于起步階段。正如學(xué)者一再提醒,目前能做到發(fā)現(xiàn)法律中的“相關(guān)性”而難以解釋法律中的“因果律”。我們也應(yīng)看到人工智能憑借超乎人類(lèi)想象的學(xué)習(xí)能力,以往觀(guān)念認(rèn)為人工智能很難充分掌握或模擬人的思維和意識(shí),但現(xiàn)在看來(lái)或許并不難實(shí)現(xiàn)。ChatGPT、百度的ERNIE Bot(文心一言)、復(fù)旦開(kāi)發(fā)的MOSS等產(chǎn)品不斷刷新人們認(rèn)知,屆時(shí)我們可能最急迫的工作不再是探究人工智能與人的差異,法學(xué)研究和實(shí)踐中是否要或如何應(yīng)用人工智能,反而更需要注意的可能是還有什么是人工智能不能做的,進(jìn)而將進(jìn)一步考慮如何為人工智能立法。
參考文獻(xiàn):
[1]? David Lazer A P,Lada A,Sinan A,et al.Life in the network:the coming age of computational social science[J].Science,2009,323(5915):721-723.
[2]? 黃水清,劉瀏,王東波.計(jì)算人文的發(fā)展及展望[J].科技情報(bào)研究,2021,3(4):1-12.
[3]? 黃水清,劉瀏,王東波.國(guó)內(nèi)外數(shù)字人文研究進(jìn)展[J].情報(bào)學(xué)進(jìn)展,2022,14(1):50-84.
[4]? 黃水清.回歸人文:從人文計(jì)算到計(jì)算人文[N].社會(huì)科學(xué)報(bào), 2021-09-09(5).
[5]? 鄧矜婷,張建悅.計(jì)算法學(xué):作為一種新的法學(xué)研究方法[J].法學(xué),2019(4):104-122.
[6]? 申衛(wèi)星,劉云.法學(xué)研究新范式:計(jì)算法學(xué)的內(nèi)涵、范疇與方法[J].法學(xué)研究,2020,42(5):3-23.
[7]? 梁柱,沈思,葉文豪,等.基于結(jié)構(gòu)內(nèi)容特征的裁判文書(shū)自動(dòng)推薦研究[J].情報(bào)學(xué)報(bào),2022,41(2):167-175.
[8]? 張妮,蒲亦非.計(jì)算法學(xué)導(dǎo)論[M].成都:四川大學(xué)出版社,2015.
[9]? 于曉虹,王翔.大數(shù)據(jù)時(shí)代計(jì)算法學(xué)興起及其深層問(wèn)題闡釋?zhuān)跩].現(xiàn)代法學(xué),2019(3):110-117.
[10]? 左衛(wèi)民.中國(guó)計(jì)算法學(xué)的未來(lái):審思與前瞻[J].清華法學(xué),2022,16(3):196-208.
[11]? 錢(qián)寧峰.走向“計(jì)算法學(xué)”:大數(shù)據(jù)時(shí)代法學(xué)研究的選擇[J].東南大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2017,19(2):43-50,146.
[12]? 張妮,徐靜村.計(jì)算法學(xué):法律與人工智能的交叉研究[J].現(xiàn)代法學(xué),2019,41(6):77-90.
[13]? 辛巧巧.論人工智能時(shí)代的計(jì)算法學(xué)方法[J].人民論壇·學(xué)術(shù)前沿,2020,(18):120-123.
[14]? 于寅虎.加快計(jì)算法學(xué)學(xué)科建設(shè) 助力數(shù)字經(jīng)濟(jì)發(fā)展[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理.2023,42(1):1-3.
[15]? 張妮,蒲亦非.計(jì)量法學(xué)、計(jì)算法學(xué)到認(rèn)知法學(xué)的演進(jìn)[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,58(2):7-12.
[16]? Buchanan BG,Headrick TE.Some speculation about artificial intelligence and legal reasoning[J].Stan L Rev,1970,23:40.
[17]? Deedman C,Smith J.The nervous shock advisor:A legal expert system in case-based law[J].Operational Expert Systems in Canada,1991.
[18]? Biedermann A,Taroni F,Delemont O,et al.The evaluation of evidence in the forensic investigation of fire incidents(Part II):Practical examples of the use of Bayesian networks[J].Forensic Science International,2005,147(1):59-69.
[19]? Biedermann A,Taroni F,Delemont O,et al.The evaluation of evidence in the forensic investigation of fire incidents (Part I):an approach using Bayesian networks[J].Forensic Science International,2005,147(1):49-57.
[20]? Riesen M,Serpen G.Validation of a bayesian belief network representation for posterior probability calculations on national crime victimization survey[J].Artificial Intelligence and Law,2008,16:245-276.
[21]? Hamann H,Vogel F,Gauer I.Computer Assisted Legal Linguistics(CAL(2))[A].Bex F,Villata S.Legal Knowledge and Information Systems:294[C].Amsterdam:Ios Press,2016:195-198.
[22]? Giacalone M,Cusatelli C,Romano A,et al.Big Data and forensics:An innovative approach for a predictable jurisprudence[J].Information Sciences,2018,426:160-170.
[23]? 陳亮,郭佳雯,武建功,等.基于法計(jì)算學(xué)理論的人工智能輔助決策算法研究[J].華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2019(5):85-99.
[24]? 周慶山.面向21世紀(jì)的信息法學(xué)[J].情報(bào)理論與實(shí)踐,1998(1):10-13.
[25]? 馬海群,喬立春.論我國(guó)信息法學(xué)的研究基礎(chǔ)與學(xué)科建設(shè)[J].中國(guó)圖書(shū)館學(xué)報(bào),2001(1):16-20.
[26]? 張妮,蒲亦非.計(jì)算法學(xué):一門(mén)新興學(xué)科交叉分支[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,56(6):1187-1192.
[27]? 劉艷紅.人工智能法學(xué)研究的反智化批判[J].東方法學(xué),2019(5):119-126.
[28]? 左衛(wèi)民.熱與冷:中國(guó)法律人工智能的再思考[J].環(huán)球法律評(píng)論,2019,41(2):53-64.
[29]? 曾赟.第四種法學(xué)知識(shí)新形態(tài)——數(shù)據(jù)法學(xué)的研究定位[J].法制與社會(huì)發(fā)展,2023,29(1):41-59.
[30]? Du W,Li B,Yang M,et al.A Multi-Task Learning Approach for Answer Selection:A Study and a Chinese Law Dataset[A].Thirty-Third Aaai Conference on Artificial Intelligence/Thirty-First Innovative Applications of Artificial Intelligence Conference/Ninth Aaai Symposium on Educational Advances in Artificial Intelligence[C].Palo Alto:Assoc Advancement Artificial Intelligence,2019:9935-9936.
[31]? Sharafat S,Nasar Z,Jaffry SW.Data mining mining for smart legal systems[J].Computers & Electrical Engineering,2019,78:328-342.
[32]? Duan X,Wang B,Wang Z,et al.Cjrc:A reliable human-annotated benchmark dataset for chinese judicial reading comprehension[A].Chinese Computational Linguistics:18th China National Conference,CCL 2019[C].Kunming,China,Proceedings 18.Springer,2019:439-451.
[33]? Ma Y,Shao Y,Wu Y,et al.LeCaRD:A Legal Case Retrieval Dataset for Chinese Law System[A].Sigir21-Proceedings of the 44th International Acm Sigir Conference on Research and Development in Information Retrieval[C].New York:Assoc Computing Machinery,2021:2342-2348.
[34]? Urchs S,Mitrovic J,Granitzer M.Design and Implementation of German Legal Decision Corpora[A].Rocha AP,Steels L,VandenHerik J.Icaart:Proceedings of the 13th International Conference on Agents and Artificial Intelligence-Vol 2[C].Setubal:Scitepress,2021:515-521.
[35]? Boonchom V sit,Soonthornphisaj N.Thai Succession and Family Law Ontology Building Using Ant Colony Algorithm[A].Nakakoji K,Murakami Y,McCready E.New Frontiers in Artificial Intelligence:Vol 6284[C].Berlin:Springer-Verlag Berlin,2010:19-32.
[36]? Chen H,Pieptea LF,Ding J.Construction and Evaluation of a High-Quality Corpus for Legal Intelligence Using Semiautomated Approaches[J].Ieee Transactions on Reliability,2022,71(2):657-673.
[37]? Dyevre A,Lampach N.Subnational disparities in EU law use:exploring the GEOCOURT dataset[J].Journal of European Public Policy,2021,28(4):615-631.
[38]? Bradford A,Chilton AS,Megaw C,et al.Competition Law Gone Global:Introducing the Comparative Competition Law and Enforcement Datasets[J].Journal of Empirical Legal Studies,2019,16(2):411-443.
[39]? 周曉輝.基于隱式馬爾科夫模型的法律命名實(shí)體識(shí)別模型的設(shè)計(jì)與應(yīng)用[D].廣州:華南理工大學(xué),2017.
[40]? 韓金波.Siamese-CNN算法研究及其在法院裁判預(yù)測(cè)中的應(yīng)用[D].大連:大連理工大學(xué),2018.
[41]? 張虎,王鑫,王沖,等.面向法律裁判文書(shū)的法條推薦方法[J].計(jì)算機(jī)科學(xué),2019,46(9):211-215.
[42]? Pande R,Alam S.Predicting the outcome of judicial cases using semantic analysis[A].2020 Ieee Symposium Series on Computational Intelligence (ssci)[C].New York:Ieee,2020:1757-1761.
[43]? 鄭潔,黃輝,秦永彬.一種融合法律知識(shí)的相似案例匹配模型[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2022,6(7):99-106.
[44]? 楊超群,龐彥燕,嚴(yán)若冰,等.基于遷移學(xué)習(xí)的適用法條推薦模型[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,58(2):13-18.
[45]? Vuong YTH,Bui QM,Nguyen HT,et al.SM-BERT-CR:a deep learning approach for case law retrieval with supporting model[J].Artificial Intelligence and Law,2022.
[46]? Juang TY,Hsu CS,Chen YS,et al.A concurrent prediction of criminal law charge and sentence using twin convolutional neural networks[J].International Journal of Ad Hoc and Ubiquitous Computing,2022,41(1):29-43.
[47]? Sovrano F,Palmirani M,Vitali F.Combining shallow and deep learning approaches against data scarcity in legal domains[J].Government Information Quarterly,2022,39(3):101715.
[48]? 王海亮.基于文本挖掘的法律咨詢(xún)系統(tǒng)研究和實(shí)現(xiàn)[D].北京:北京化工大學(xué),2017.
[49]? Seeam P,Teckchandani N,Booneyad H,et al.Employment Law Expert System[A].2018 International Conference on Intelligent and Innovative Computing Applications (iconic)[C].New York:Ieee,2018:358-363.
[50]? Barros R,Peres A,Lorenzi F,et al.Case Law Analysis with Machine Learning in Brazilian Court[A].Mouhoub M,Sadaoui S,Mohamed OA,et al.Recent Trends and Future Technology in Applied Intelligence,Iea/Aie 2018:Vol 10868[C].Cham:Springer International Publishing Ag,2018:857-868.
[51]? Mokanov I.Facts2Law-Using Deep Learning to Provide a Legal Qualification to a Set of Facts[A].Araszkiewicz M,RodriguezDoncel V.Legal Knowledge and Information Systems (jurix 2019):Vol 322[C].Amsterdam:Ios Press,2019:247-250.
[52]? Fernandes WPD,Silva LJS,F(xiàn)rajhof IZ,et al.Appellate Court Modifications Extraction for Portuguese[J].Artificial Intelligence and Law,2020,28(3):327-360.
[53]? 夏錦文,張瑞祥.我國(guó)黨內(nèi)法規(guī)研究的文獻(xiàn)數(shù)據(jù)分析(1992-2021年)——基于核心期刊數(shù)據(jù)和內(nèi)容分析法[J].學(xué)海,2021(3):14-21.
作者簡(jiǎn)介:張瑞祥,南京師范大學(xué)法學(xué)院博士研究生;趙志梟,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院碩士研究生。