衛(wèi)晨曙
達(dá)馬斯卡認(rèn)為:“站在20世紀(jì)末思考證據(jù)法的未來(lái),很大程度上就是要探討正在演進(jìn)的事實(shí)認(rèn)定科學(xué)化的問(wèn)題?!?1)[美]達(dá)馬斯卡:《漂移的證據(jù)法》,李學(xué)軍、劉曉丹等譯,何家弘校,北京:中國(guó)政法大學(xué)出版社,2003年,第200頁(yè)。然而,科學(xué)技術(shù)的迭代變革,已經(jīng)遠(yuǎn)超出達(dá)馬斯卡在20世紀(jì)末的設(shè)想。近年來(lái)大數(shù)據(jù)、人工智能技術(shù)迅猛發(fā)展,許多以大數(shù)據(jù)、人工智能技術(shù)生成的證據(jù)材料逐漸從“幕后”走向“臺(tái)前”(2)程雷:《大數(shù)據(jù)偵查的法律控制》,《中國(guó)社會(huì)科學(xué)》2018年第11期。,事實(shí)認(rèn)定已經(jīng)逐步呈現(xiàn)出自動(dòng)化、智能化的趨勢(shì)。大數(shù)據(jù)證據(jù)便是在這一新技術(shù)革命背景下誕生的一種新的證據(jù)形式。大數(shù)據(jù)證據(jù)是指運(yùn)用大數(shù)據(jù)技術(shù),對(duì)海量數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、分析所形成的能夠證明案件事實(shí)的證據(jù)信息,這些數(shù)據(jù)難以憑借人類經(jīng)驗(yàn)進(jìn)行分析和處理,因而大數(shù)據(jù)證據(jù)呈現(xiàn)出以海量數(shù)據(jù)為基礎(chǔ),以智能算法為核心,以自主判斷為表征的特點(diǎn)。當(dāng)前,大數(shù)據(jù)證據(jù)已經(jīng)出現(xiàn)在國(guó)內(nèi)外司法實(shí)踐當(dāng)中。例如,在美國(guó)康涅狄格州的一起殺妻案中,一位男子聲稱其妻子是在躲避入侵他們住宅的罪犯時(shí)被殺害,但是妻子所佩戴的FitBit(3)FitBit是美國(guó)的一家消費(fèi)電子產(chǎn)品和健身公司,主要產(chǎn)品包括活動(dòng)追蹤器、智能手表和無(wú)線可穿戴式智能產(chǎn)品。https://web.archive.org/web/20190331155429/https://www.reuters.com/finance/stocks/company-profile/FIT.N,最后訪問(wèn)日期:2022-01-09。卻顯示當(dāng)時(shí)她正在外散步,與該男子所描述的事實(shí)有所出入(4)See Christine Hauser, In Connecticut Murder Case, a Fitbit Is a Silent Witness, The N.Y. Times, Apr. 27, 2017.,該男子隨后被指控謀殺。在我國(guó),有法院在司法證明中運(yùn)用人臉識(shí)別系統(tǒng)的運(yùn)行結(jié)論,例如一份法院判決書載明:“根據(jù)??迪到y(tǒng)人臉識(shí)別高級(jí)運(yùn)算法則,人臉相似度大于95%,可以認(rèn)定為同一人,確定本案的嫌疑人為王某某。”(5)參見湖南省株洲市中級(jí)人民法院(2021)湘02刑終3號(hào)刑事裁定書。但是,大數(shù)據(jù)證據(jù)在事實(shí)認(rèn)定過(guò)程中蘊(yùn)含著風(fēng)險(xiǎn),主要包括:第一,人為偏誤。大數(shù)據(jù)證據(jù)的真實(shí)性取決于生成該證據(jù)的機(jī)器學(xué)習(xí)程序代碼,但該程序代碼是需要人類程序員進(jìn)行設(shè)計(jì)與訓(xùn)練的,它們執(zhí)行的是人類程序員的指令,因而它們反映的是程序設(shè)計(jì)者的事實(shí)預(yù)設(shè)和價(jià)值取向(6)Andrea Roth, Trial by Machine, Georgetown Law Journal, vol.104, no.5, 2016, pp.1-48.。例如在智慧司法領(lǐng)域經(jīng)常被提及的美國(guó)COMPAS量刑程序軟件,其所暴露的種族歧視風(fēng)險(xiǎn)被社會(huì)所詬病(7)https://www.propublica.org/article/how-we-analyzed-the-compas-recidivism-algorithm,最后訪問(wèn)日期:2022-03-25。。第二,算法失真。由于機(jī)器學(xué)習(xí)技術(shù)具有自主性,會(huì)對(duì)其所處理的數(shù)據(jù)進(jìn)行再加工,從而導(dǎo)致原始事實(shí)失真。例如有科技界人士曾評(píng)論稱,華為P30Pro手機(jī)拍照,可能存在AI軟件對(duì)照片進(jìn)行加工的可能(8)轉(zhuǎn)引自何邦武《網(wǎng)絡(luò)刑事電子數(shù)據(jù)算法取證難題及其破解》,《環(huán)球法律評(píng)論》2019年第5期。,這可能導(dǎo)致以音視頻形式呈現(xiàn)的大數(shù)據(jù)證據(jù)的準(zhǔn)確性降低,這些證據(jù)風(fēng)險(xiǎn)很可能成為事實(shí)認(rèn)定錯(cuò)誤的誘因。因此,為了規(guī)范大數(shù)據(jù)證據(jù)的適用,降低事實(shí)認(rèn)定錯(cuò)誤的風(fēng)險(xiǎn),本文首先分析大數(shù)據(jù)證據(jù)的技術(shù)原理,明晰大數(shù)據(jù)證據(jù)的證據(jù)屬性,在此基礎(chǔ)上構(gòu)建大數(shù)據(jù)證據(jù)的審查體系和配套機(jī)制。
當(dāng)前,大數(shù)據(jù)、人工智能技術(shù)往往同時(shí)出現(xiàn)在人們的視野當(dāng)中,這是因?yàn)槎咧g存在著緊密的聯(lián)系。一方面,當(dāng)前的人工智能建立在海量數(shù)據(jù)基礎(chǔ)之上,數(shù)據(jù)越多,人工智能的行為結(jié)果就越近似于人類行為;另一方面,大數(shù)據(jù)技術(shù)為人工智能提供了強(qiáng)勁的數(shù)據(jù)存儲(chǔ)、計(jì)算能力(9)林子雨編著:《大數(shù)據(jù)導(dǎo)論》,北京:人民郵電出版社,2020年,第41~54頁(yè)。。因而,有論者又將大數(shù)據(jù)證據(jù)稱為人工智能證據(jù)(10)參見馬國(guó)洋《論刑事訴訟中人工智能證據(jù)的審查》,《中國(guó)刑事法雜志》2021年第5期。。為了保持與既有大數(shù)據(jù)證據(jù)學(xué)術(shù)討論的一致性,本文不特別區(qū)分大數(shù)據(jù)技術(shù)與人工智能技術(shù),統(tǒng)一稱作大數(shù)據(jù)技術(shù)。大數(shù)據(jù)技術(shù)離不開數(shù)據(jù)與算法的支撐,前者是大數(shù)據(jù)技術(shù)的“燃料”,后者是大數(shù)據(jù)技術(shù)的“引擎”(11)參見左衛(wèi)民《關(guān)于法律人工智能在中國(guó)運(yùn)用前景的若干思考》,《清華法學(xué)》2018年第2期。,二者共同構(gòu)成了大數(shù)據(jù)技術(shù)的架構(gòu)。一方面,從算法的角度而言,算法(algorithm)是數(shù)學(xué)或計(jì)算機(jī)科學(xué)領(lǐng)域的專用術(shù)語(yǔ),本質(zhì)而言是解決某一特定問(wèn)題的步驟,而且該步驟具有有限性與明確性(12)[美]科爾曼等: 《算法導(dǎo)論(第三版)》,殷建平等譯,北京:機(jī)械工業(yè)出版社,2013年,第3頁(yè)。。不同的算法采取了不同的數(shù)據(jù)處理路徑,因而一項(xiàng)大數(shù)據(jù)技術(shù)的目標(biāo)或功能是由算法決定的。另一方面,從數(shù)據(jù)的角度而言,與目前的大數(shù)據(jù)技術(shù)相比,傳統(tǒng)的數(shù)據(jù)分析技術(shù)并不具備智能化、自反應(yīng)性與自適應(yīng)性的特點(diǎn)。申言之,傳統(tǒng)數(shù)據(jù)處理程序僅能處理人工輸入的數(shù)據(jù),而不具備對(duì)數(shù)據(jù)的自動(dòng)選取、清洗以及篩除功能。而當(dāng)前大數(shù)據(jù)技術(shù)憑借“機(jī)器學(xué)習(xí)”這一技術(shù)關(guān)鍵,實(shí)現(xiàn)了數(shù)據(jù)的自動(dòng)提取、挖掘、碰撞與分析。其中深度學(xué)習(xí)(deep learning)是機(jī)器學(xué)習(xí)的重要分支,當(dāng)前絕大多數(shù)的大數(shù)據(jù)、人工智能技術(shù)主要采取這一技術(shù)路徑。本文關(guān)于大數(shù)據(jù)技術(shù)原理的介紹主要圍繞深度學(xué)習(xí)技術(shù)展開。
深度學(xué)習(xí)模仿的是人類的神經(jīng)元網(wǎng)絡(luò)。從生物學(xué)意義而言,在人腦中,細(xì)胞體、軸突和樹突構(gòu)成一個(gè)神經(jīng)元,多個(gè)神經(jīng)元構(gòu)成相互聯(lián)結(jié)的神經(jīng)網(wǎng)絡(luò)。一個(gè)神經(jīng)元得到信息輸入后,單個(gè)神經(jīng)元會(huì)把計(jì)算負(fù)擔(dān)分?jǐn)偟秸麄€(gè)網(wǎng)絡(luò)上進(jìn)行“并行處理”,并由整個(gè)網(wǎng)絡(luò)負(fù)責(zé)信息輸出(13)徐英瑾:《心智、語(yǔ)言和機(jī)器:維特根斯坦哲學(xué)和人工智能科學(xué)的對(duì)話》 ,北京:人民出版社,2013年,第43~53頁(yè)。,這為工程學(xué)意義上的神經(jīng)網(wǎng)絡(luò)奠定了生物學(xué)結(jié)構(gòu)基礎(chǔ)。所謂深度學(xué)習(xí)就是用很多層神經(jīng)元構(gòu)成的神經(jīng)網(wǎng)絡(luò)達(dá)到機(jī)器學(xué)習(xí)的功能(14)尼克:《人工智能簡(jiǎn)史》,北京:人民郵電出版社,2017年,第97~115頁(yè)。。其中,數(shù)據(jù)就相當(dāng)于“神經(jīng)元”,算法就相當(dāng)于“神經(jīng)元的聯(lián)結(jié)方法”。具體而言,一項(xiàng)深度學(xué)習(xí)任務(wù)的完成一般分為兩步:第一是設(shè)立深度學(xué)習(xí)的目標(biāo)或任務(wù),比如圖像或面部識(shí)別、數(shù)值預(yù)測(cè)、語(yǔ)音轉(zhuǎn)錄文本、機(jī)器翻譯等等(15)Ian Goodfellow, Yoshua Bengo & Aaron Courville,Deep Learning 2-3(9th ed.),Massachusetts:MIT Press,2016,pp. 99-103.。第二是在此基礎(chǔ)上進(jìn)行數(shù)據(jù)訓(xùn)練。比如人臉識(shí)別,程序員先將某人的面部特征數(shù)據(jù)化并將其輸入機(jī)器,這些數(shù)據(jù)被稱為“訓(xùn)練數(shù)據(jù)”,程序員在訓(xùn)練數(shù)據(jù)的基礎(chǔ)上引導(dǎo)機(jī)器學(xué)習(xí),挖掘面部特征數(shù)據(jù)與特定人之間的關(guān)系,這一過(guò)程被稱為“監(jiān)督學(xué)習(xí)”。如果機(jī)器經(jīng)過(guò)監(jiān)督學(xué)習(xí)能夠?qū)υ撊说拿娌窟M(jìn)行識(shí)別,那么程序員會(huì)將其放入一個(gè)數(shù)據(jù)測(cè)試集中進(jìn)行測(cè)試,調(diào)試機(jī)器識(shí)別的準(zhǔn)確率直至達(dá)到所預(yù)期的精度水平,該機(jī)器便可在更大范圍的環(huán)境內(nèi)進(jìn)行人臉識(shí)別(16)Ian Goodfellow, Yoshua Bengo & Aaron Courville,Deep Learning 2-3 (9th ed.), pp. 103-104.。
在計(jì)算機(jī)學(xué)科中,算法、程序、軟件是三個(gè)聯(lián)系緊密又有所區(qū)別的概念。概而言之,算法是解決某一問(wèn)題的思路,而程序是將算法轉(zhuǎn)化成能夠被計(jì)算機(jī)執(zhí)行的命令語(yǔ)言,是算法在計(jì)算機(jī)上的實(shí)現(xiàn),軟件則是一個(gè)或多個(gè)程序的集合(17)轉(zhuǎn)引自張凌寒《算法權(quán)力的興起、異化與法律規(guī)制》,《法商研究》2019年第4期。。因而,上文所描述的大數(shù)據(jù)證據(jù)的技術(shù)原理,需要一整套具有機(jī)器學(xué)習(xí)功能的計(jì)算機(jī)程序予以實(shí)現(xiàn),而計(jì)算機(jī)程序以代碼為載體。一般而言,計(jì)算機(jī)程序代碼的編寫主要包括源代碼編寫和由編譯器將源代碼轉(zhuǎn)為機(jī)器代碼前后相繼的兩部分。源代碼(source code)是指計(jì)算機(jī)程序的源生代碼,是由程序員編寫的原始文件;而機(jī)器代碼又被稱為目標(biāo)代碼(object code),是源代碼經(jīng)過(guò)編譯器轉(zhuǎn)化輸出的二進(jìn)制形式的機(jī)器指令。就二者關(guān)系而言,源代碼在計(jì)算機(jī)程序中發(fā)揮著基礎(chǔ)性作用,如果需要對(duì)目標(biāo)代碼進(jìn)行修改的話,必須先行修改源代碼(18)https://www.thecrazyprogrammer.com/2018/05/source-code-and-object-code.html,最后訪問(wèn)日期:2022-02-06。。以上文所述的“人臉識(shí)別”功能為例,計(jì)算機(jī)程序員首先確定程序代碼欲以實(shí)現(xiàn)的人臉識(shí)別目標(biāo),在此基礎(chǔ)上運(yùn)用C、C++、Java以及Python等計(jì)算機(jī)程序語(yǔ)言進(jìn)行源代碼編寫,然后運(yùn)用“調(diào)試器”對(duì)已經(jīng)編寫好的源代碼進(jìn)行測(cè)試,觀察能否達(dá)到最初的功能預(yù)期并進(jìn)行優(yōu)化調(diào)試,之后再通過(guò)“編譯器”將源代碼轉(zhuǎn)譯為由“0”和“1”組成的二進(jìn)制代碼,該二進(jìn)制代碼是能夠被計(jì)算機(jī)識(shí)別的機(jī)器代碼。至此,一套具有人臉識(shí)別能力的計(jì)算機(jī)程序代碼才得以完成。
構(gòu)建大數(shù)據(jù)證據(jù)審查體系的前提是辨明證據(jù)屬性。在證據(jù)法理論中,不同的證據(jù)屬性要求特定的審查規(guī)則。例如言詞證據(jù)側(cè)重于證人的可信性審查,主要審查證人的作證能力以及誠(chéng)實(shí)性;而包括電子證據(jù)在內(nèi)的實(shí)物證據(jù)則注重對(duì)證據(jù)進(jìn)行鑒真,保障證據(jù)的同一性與真實(shí)性。當(dāng)前學(xué)界關(guān)于大數(shù)據(jù)證據(jù)的屬性之爭(zhēng)尚無(wú)定論,有論者將之視為類鑒定意見(19)參見劉品新《論大數(shù)據(jù)證據(jù)》,《環(huán)球法律評(píng)論》2019年第1期。,有論者認(rèn)為其屬于實(shí)物證據(jù)(20)參見元軼《大數(shù)據(jù)證據(jù)二元實(shí)物證據(jù)屬性及客觀校驗(yàn)標(biāo)準(zhǔn)》,《山西大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》2021年第5期。,有論者主張應(yīng)當(dāng)將大數(shù)據(jù)證據(jù)作為一項(xiàng)獨(dú)立的證據(jù)種類(21)參見徐惠、李曉東《大數(shù)據(jù)證據(jù)之證據(jù)屬性證成研究》,《中國(guó)人民公安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)》2020年第1期。。這些觀點(diǎn)普遍采取了單一化視角,忽視了大數(shù)據(jù)證據(jù)內(nèi)部證明機(jī)理和所處的外部環(huán)境對(duì)證據(jù)屬性產(chǎn)生的多元化影響。具體而言,大數(shù)據(jù)證據(jù)的證據(jù)屬性主要表現(xiàn)為以下兩方面:
首先,從內(nèi)部證明機(jī)理而言,大數(shù)據(jù)證據(jù)以專家證據(jù)為證據(jù)內(nèi)核。在證據(jù)理論中,意見證據(jù)是指作證人發(fā)表對(duì)案件事實(shí)的評(píng)論、判斷、推測(cè)等意見性主張。根據(jù)作證主體的不同,意見證據(jù)可以分為普通證人意見證據(jù)和專家證人意見證據(jù)。從證人作證的一般原理而言,證人應(yīng)當(dāng)根據(jù)自己的親身感知或第一手知識(shí)進(jìn)行陳述,不能在此基礎(chǔ)上作出對(duì)案件事實(shí)的意見性論斷,因?yàn)槠胀ㄗC人的意見性評(píng)論可能會(huì)存在謬誤,誤導(dǎo)事實(shí)認(rèn)定者,并且有可能僭越本應(yīng)由事實(shí)認(rèn)定者所享有的對(duì)證據(jù)進(jìn)行評(píng)價(jià)和判斷的權(quán)力(22)參見馬貴翔、張海洋《意見證據(jù)規(guī)則探析》,《華東師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》2009年第2期。。因而,為了保障事實(shí)認(rèn)定的準(zhǔn)確性,證據(jù)規(guī)則會(huì)對(duì)普通證人意見證據(jù)予以排除。但專家證人意見證據(jù)與之相反,因?yàn)閷<易C人具備事實(shí)認(rèn)定者缺乏的專業(yè)知識(shí)或技能,能夠有效彌補(bǔ)事實(shí)認(rèn)定者的認(rèn)知短板(23)參見李學(xué)軍《意見證據(jù)規(guī)則要義——以美國(guó)為視角》,《證據(jù)科學(xué)》2012年第5期。,因而面對(duì)案件中的專業(yè)性問(wèn)題,專家證人根據(jù)專業(yè)知識(shí)、技能經(jīng)驗(yàn)所作的推論或意見能夠有效彌補(bǔ)事實(shí)認(rèn)定者的專業(yè)鴻溝,從而能夠進(jìn)入事實(shí)認(rèn)定者的視野。
大數(shù)據(jù)證據(jù)遵循與專家證人意見證據(jù)相同的證明機(jī)理。大數(shù)據(jù)證據(jù)依賴深度學(xué)習(xí)技術(shù),這就決定了大數(shù)據(jù)證據(jù)是生成性質(zhì)的。換言之,大數(shù)據(jù)證據(jù)是通過(guò)數(shù)據(jù)挖掘與數(shù)據(jù)碰撞產(chǎn)生了不同于既有數(shù)據(jù)的“新”的信息,這是與當(dāng)前電子數(shù)據(jù)這一法定證據(jù)種類的本質(zhì)區(qū)別(24)2016年最高人民法院、最高人民檢察院以及公安部聯(lián)合頒布的《關(guān)于辦理刑事案件收集提取和審查判斷電子數(shù)據(jù)若干問(wèn)題的規(guī)定》(下文稱《電子數(shù)據(jù)規(guī)定》)第1條規(guī)定:“電子數(shù)據(jù)是案件發(fā)生過(guò)程中形成的,以數(shù)字化形式存儲(chǔ)、處理、傳輸?shù)?,能夠證明案件事實(shí)的數(shù)據(jù)?!?。一方面,大數(shù)據(jù)證據(jù)的海量數(shù)據(jù)已經(jīng)遠(yuǎn)超法官的專業(yè)范疇或技能范圍,數(shù)據(jù)的提取、固定以及處理模型的構(gòu)建均需借助專業(yè)知識(shí)。大數(shù)據(jù)技術(shù)能夠破除法官所面對(duì)的專業(yè)壁壘,輔助事實(shí)認(rèn)定者進(jìn)行事實(shí)認(rèn)定。另一方面,與傳統(tǒng)專家意見不同的是,大數(shù)據(jù)技術(shù)是通過(guò)從數(shù)據(jù)海洋中提煉數(shù)據(jù)經(jīng)驗(yàn)并形成自主判斷,發(fā)現(xiàn)難以通過(guò)人工方式總結(jié)的客觀規(guī)律以及隱藏的、人類難以發(fā)現(xiàn)的客觀聯(lián)系,例如運(yùn)用深度神經(jīng)網(wǎng)絡(luò)對(duì)相關(guān)數(shù)據(jù)特征進(jìn)行提取,發(fā)現(xiàn)犯罪組織的資金轉(zhuǎn)移規(guī)律(25)參見劉品新、唐超琰《穿透式取證:涉眾型經(jīng)濟(jì)犯罪的法律應(yīng)對(duì)》,《法律適用》2022年第1期。。這一知識(shí)發(fā)現(xiàn)過(guò)程主要依靠的是具有機(jī)器學(xué)習(xí)功能的程序代碼(26)例如由美國(guó)Cyber Genetics公司研發(fā)的DNA比對(duì)軟件TrueAllele能夠推斷DNA樣本中的基因圖譜,并自動(dòng)(automatically)與DNA數(shù)據(jù)庫(kù)中的圖譜進(jìn)行比對(duì)。See DNA Casework, CYBERGENETICS, http://www.cybgen.com/systems/ casework.shtml.,最后訪問(wèn)日期:2020-10-02。。機(jī)器學(xué)習(xí)技術(shù)在大數(shù)據(jù)證據(jù)的生成過(guò)程中發(fā)揮著更具基礎(chǔ)性的作用,人類專家的主體地位在此過(guò)程中不斷式微,程序代碼甚至反過(guò)來(lái)“控制”著人類專家(27)關(guān)于專家與法庭科學(xué)技術(shù)之間的關(guān)系,有學(xué)者總結(jié)出了三種類型:第一,輔助模式。在這一模式中,專家掌握著主動(dòng)權(quán),科學(xué)技術(shù)僅為專家更高效地完成任務(wù)提供輔助作用,例如專家應(yīng)用計(jì)算機(jī)存儲(chǔ)信息、運(yùn)用計(jì)算機(jī)進(jìn)行數(shù)學(xué)演算等;第二,協(xié)同模式,在這一模式中,專家與科學(xué)技術(shù)的地位平等,處于交互合作關(guān)系,專家離開科學(xué)技術(shù)可能無(wú)法對(duì)相關(guān)事實(shí)進(jìn)行認(rèn)定,科學(xué)技術(shù)離開專家的解釋與分析可能無(wú)法發(fā)揮其證明作用,例如運(yùn)用X射線對(duì)相關(guān)病情進(jìn)行診斷等;第三,控制模式,在這一模式中,隨著科學(xué)技術(shù)自動(dòng)化、智能化程度不斷提高,生成專家證據(jù)的專家知識(shí)或經(jīng)驗(yàn),轉(zhuǎn)變成了如今的計(jì)算機(jī)程序代碼。See Itiel E. Dror & Jennifer L. Mnookin,The Use of Technology in Human Expert Domains: Challenges and Risks Arising from the Use of Automated Fingerprint Identifification Systems in Forensic Science,Law Probability & Risk,vol.9,no.1,2010,p.48-50.,可以說(shuō)程序代碼才是生成大數(shù)據(jù)證據(jù)的“專家”。所以,大數(shù)據(jù)證據(jù)可以看作是由人工智能程序代碼生成的新型專家證據(jù)(28)See Erin Murphy, The New Forensics: Criminal Justice, False Certainty, and the Second Generation of Scientifific Evidence, California Law Review, vol.95, no.2, 2007, pp.721-797.。
其次,從所處外部環(huán)境而言,大數(shù)據(jù)證據(jù)以電子數(shù)據(jù)為表現(xiàn)形式。大數(shù)據(jù)證據(jù)雖然衍生于以大數(shù)據(jù)、人工智能為代表的新技術(shù)革命,但并非橫空出世的一種證據(jù)形式,電子數(shù)據(jù)載體仍然是其存在方式。根據(jù)現(xiàn)行刑事訴訟法,電子數(shù)據(jù)作為一種法定的證據(jù)種類,具有獨(dú)立的證據(jù)地位。但是,電子數(shù)據(jù)作為一種信息的載體或媒介,任何證據(jù)形式都可以電子數(shù)據(jù)的形式表現(xiàn)出來(lái),有學(xué)者甚至認(rèn)為“電子數(shù)據(jù)實(shí)際上就是傳統(tǒng)證據(jù)電子化”(29)喻海松:《刑事電子數(shù)據(jù)的規(guī)制路徑與重點(diǎn)問(wèn)題》,《環(huán)球法律評(píng)論》2019年第1期。。大數(shù)據(jù)證據(jù)同樣也難以擺脫電子數(shù)據(jù)的形式外衣。一方面,從當(dāng)前數(shù)據(jù)社會(huì)的角度而言,萬(wàn)事萬(wàn)物都浸潤(rùn)在數(shù)據(jù)海洋之中,大數(shù)據(jù)證據(jù)即是在這種數(shù)據(jù)化環(huán)境之中凝練出的“數(shù)據(jù)經(jīng)驗(yàn)”,會(huì)以電子化數(shù)據(jù)的形式呈現(xiàn)出來(lái);另一方面,從證據(jù)制度的演進(jìn)視角而言,有論者稱大數(shù)據(jù)證據(jù)是電子數(shù)據(jù)的高階形式(30)有學(xué)者將大數(shù)據(jù)證據(jù)稱為第三代電子數(shù)據(jù)。參見劉品新、陳麗《電子證據(jù)的迭代與立規(guī)》,《人民法院報(bào)》,2020年10月22日第5版。,“只是在數(shù)量級(jí)和復(fù)雜性上與前者(電子數(shù)據(jù))存在差別”(31)元軼:《證據(jù)制度循環(huán)演進(jìn)視角下大數(shù)據(jù)證據(jù)的程序規(guī)制——以神示證據(jù)為切入》,《政法論壇》2021年第3期。。因而,電子數(shù)據(jù)作為大數(shù)據(jù)證據(jù)的載體或媒介,在構(gòu)建大數(shù)據(jù)證據(jù)審查體系時(shí)不能脫離電子數(shù)據(jù)的審查規(guī)則。鑒于電子數(shù)據(jù)自身的技術(shù)性、依賴性以及無(wú)痕性等特點(diǎn),仍須將電子數(shù)據(jù)的提取、固定、審查和認(rèn)定等規(guī)則考慮在內(nèi)。這種證據(jù)審查方式在當(dāng)前的規(guī)范層面上已有規(guī)定。例如,在以電子數(shù)據(jù)形式呈現(xiàn)的言詞證據(jù)審查問(wèn)題上,《電子數(shù)據(jù)規(guī)定》第1條第3款規(guī)定:“以數(shù)字化形式記載的證人證言、被害人陳述以及犯罪嫌疑人、被告人供述和辯解等證據(jù),不屬于電子數(shù)據(jù)。確有必要的,對(duì)相關(guān)證據(jù)的收集、提取、移送、審查,可以參照適用本規(guī)定。”該條款明確了以數(shù)字化形式呈現(xiàn)的言詞類證據(jù)不屬于電子數(shù)據(jù),要適用言詞證據(jù)的審查規(guī)則,但同時(shí)表明了數(shù)字化形式可能會(huì)對(duì)該類證據(jù)形式的真實(shí)性和完整性產(chǎn)生影響,因而在必要情況下也可適用電子數(shù)據(jù)審查的有關(guān)規(guī)定。
總而言之,大數(shù)據(jù)證據(jù)具有以電子數(shù)據(jù)為表現(xiàn)形式,以科學(xué)證據(jù)作為證據(jù)內(nèi)核的證據(jù)屬性,是一種重疊著傳統(tǒng)與現(xiàn)代、實(shí)物證據(jù)與意見證據(jù)的證據(jù)形式。所以,大數(shù)據(jù)證據(jù)審查體系的構(gòu)建需要考慮其多元化的證據(jù)形式,既不能脫離電子數(shù)據(jù)審查的傳統(tǒng),同時(shí)也應(yīng)當(dāng)根據(jù)專家證據(jù)證明特點(diǎn)設(shè)置相應(yīng)的審查規(guī)則。
鑒真(authentication),是指證據(jù)提出者必須用證據(jù)充分證明所提出的特定證據(jù)確實(shí)是其所主張的證據(jù)(32)參見聯(lián)邦證據(jù)規(guī)則901(a)。。鑒真是審查實(shí)物證據(jù)證據(jù)能力的重要環(huán)節(jié),鑒真不僅能夠?qū)?shí)物證據(jù)的真實(shí)性進(jìn)行鑒別,同時(shí)也能保證實(shí)物證據(jù)的相關(guān)性(33)參見陳瑞華《實(shí)物證據(jù)的鑒真問(wèn)題》,《法學(xué)研究》2011年第5期。。以證據(jù)鑒真作為大數(shù)據(jù)證據(jù)審查的第一步,是因?yàn)榇髷?shù)據(jù)證據(jù)以電子數(shù)據(jù)為存在方式,由于電子數(shù)據(jù)的虛擬性與依賴性,其遵循不同于一般實(shí)物證據(jù)的鑒真機(jī)制,有學(xué)者將之稱為電子數(shù)據(jù)的雙重鑒真模式(34)參見劉譯礬《論電子數(shù)據(jù)的雙重鑒真》,《當(dāng)代法學(xué)》2018年第3期。。概而言之,一方面要審查電子數(shù)據(jù)的物理存儲(chǔ)介質(zhì),例如計(jì)算機(jī)、手機(jī)、硬盤等;另一方面要審查能夠使電子數(shù)據(jù)以證據(jù)事實(shí)的形式為人感知的載體,例如聲音、圖像、數(shù)字、代碼等。在大數(shù)據(jù)語(yǔ)境中,大數(shù)據(jù)證據(jù)一方面需要依托有形的物質(zhì)載體,例如計(jì)算機(jī)、智能手機(jī)、運(yùn)動(dòng)手環(huán)等一系列智能終端;另一方面,生成數(shù)字、圖像以及音視頻的內(nèi)部數(shù)據(jù)或代碼,是大數(shù)據(jù)證據(jù)能夠?yàn)槿藗兯兄闹饕浇?。因此,大?shù)據(jù)證據(jù)的鑒真也主要從以下兩方面展開:
首先,需要對(duì)大數(shù)據(jù)證據(jù)的物質(zhì)載體進(jìn)行鑒真。物質(zhì)載體的鑒真主要分為兩種情況:第一,如果物質(zhì)載體屬于特定物,具有與眾不同的特征,容易辨認(rèn),那么直接對(duì)該物質(zhì)載體進(jìn)行辨認(rèn)就能達(dá)到鑒真的目的;第二,如果物質(zhì)載體是種類物,不具有區(qū)別于其他物體的獨(dú)特特征,則適用保管鏈證明。保管鏈證明是指從偵查機(jī)關(guān)搜查、扣押證據(jù)開始到法庭出示證據(jù)這段區(qū)間內(nèi)物質(zhì)載體保管、流轉(zhuǎn)的完整性。大數(shù)據(jù)證據(jù)的外部載體鑒真與一般實(shí)物證據(jù)鑒真并無(wú)二致,應(yīng)當(dāng)著重審查證據(jù)保管鏈條的主體是否合法、是否盡到證據(jù)保管義務(wù)、證據(jù)流轉(zhuǎn)是否連續(xù)完整等。另外,還需要注意的情況是,在原始介質(zhì)無(wú)法封存、不便移動(dòng)時(shí),根據(jù)2020年底頒布的《最高人民法院關(guān)于適用〈中華人民共和國(guó)刑事訴訟法〉的解釋》(下文稱《新刑訴法解釋》)第110條第1款的規(guī)定,需要審查有無(wú)說(shuō)明原因,以及是否有對(duì)電子數(shù)據(jù)的收集、提取程序,存儲(chǔ)介質(zhì)原始存放地點(diǎn)以及電子數(shù)據(jù)來(lái)源等情況予以說(shuō)明。大數(shù)據(jù)證據(jù)物質(zhì)載體的封存以及大數(shù)據(jù)證據(jù)內(nèi)部數(shù)據(jù)和代碼的收集和提取,同樣適用于該條規(guī)定。
其次,大數(shù)據(jù)證據(jù)內(nèi)部數(shù)據(jù)或程序代碼的鑒真。第一,計(jì)算機(jī)程序代碼和數(shù)據(jù)與之生成的大數(shù)據(jù)證據(jù)的同一性審查。上文已述及,不同的計(jì)算機(jī)程序代碼具有不同的功能指向,因而需要對(duì)涉案大數(shù)據(jù)證據(jù)所對(duì)應(yīng)的特定的計(jì)算機(jī)程序軟件進(jìn)行同一性審查。第二,生成大數(shù)據(jù)證據(jù)的數(shù)據(jù)或代碼的完整性審查,防止數(shù)據(jù)或代碼被調(diào)換、裁剪或編輯。同時(shí),需要注意的是,生成大數(shù)據(jù)證據(jù)的數(shù)據(jù)庫(kù)內(nèi)的在線數(shù)據(jù)不僅數(shù)量巨大,并且處于實(shí)時(shí)變動(dòng)之中,可能導(dǎo)致在不同的時(shí)間節(jié)點(diǎn)下生成不同的大數(shù)據(jù)證據(jù),從而影響大數(shù)據(jù)證據(jù)的同一性或完整性。針對(duì)此問(wèn)題,在鑒真時(shí),一方面應(yīng)當(dāng)運(yùn)用電子數(shù)據(jù)凍結(jié)措施,例如,《電子數(shù)據(jù)規(guī)定》第11條、第12條分別規(guī)定了電子數(shù)據(jù)凍結(jié)的情形和方法,通過(guò)電子數(shù)據(jù)凍結(jié)保障大數(shù)據(jù)證據(jù)的實(shí)時(shí)性和同一性;另一方面,可以憑借新興的技術(shù)手段保障大數(shù)據(jù)證據(jù)的完整性,例如及時(shí)運(yùn)用完整性校驗(yàn)、哈希值校驗(yàn)以及當(dāng)下的區(qū)塊鏈技術(shù)等防止數(shù)據(jù)篡改的技術(shù)手段固定數(shù)據(jù)。
如果說(shuō)專家證人的資質(zhì)和可信性是影響專家證言的關(guān)鍵,那么生成大數(shù)據(jù)證據(jù)的源代碼的可靠性則是決定證據(jù)可靠性的核心因素。一方面,源代碼作為計(jì)算機(jī)程序的通識(shí)語(yǔ)言,具有可識(shí)讀性。源代碼是由通用的程序語(yǔ)言編寫的,其他編程人員也能夠進(jìn)行讀寫與理解(35)https://www.thecrazyprogrammer.com/2018/05/source-code-and-object-code.html,最后訪問(wèn)日期:2022-02-06。。另一方面,如上文所述,源代碼是主導(dǎo)大數(shù)據(jù)證據(jù)生成的核心,證據(jù)的可靠性與源代碼緊密相關(guān),因?yàn)樵创a的準(zhǔn)確性是計(jì)算機(jī)程序正常運(yùn)行的最根本保障(36)Ryan Christopher Fox, Old Law and New Technology: The Problem of Computer Code and the First Amendment, U.C.L.A.Law Review, vol.49, no.2, 2002, p.871.。大數(shù)據(jù)證據(jù)的可靠性依賴于計(jì)算機(jī)程序的準(zhǔn)確性,而充分理解計(jì)算機(jī)程序的唯一途徑就是閱讀程序的源代碼(37)Christian Chessman, A “Source” of Error: Computer Code, Criminal Defendants, and the Constitution, California Law Review, vol.105, no.1, 2017, p.182.,有論者曾言,“如果不對(duì)源代碼進(jìn)行審查,就發(fā)現(xiàn)不了程序的錯(cuò)誤”(38)Andrew Morin et al., Shining Light into Black Boxes, Science, vol.336, 2012, p.159.。
首先,監(jiān)督學(xué)習(xí)過(guò)程中源代碼的“訓(xùn)練數(shù)據(jù)集”審查。根據(jù)上文所述的技術(shù)原理,機(jī)器學(xué)習(xí)的前提是要有一套訓(xùn)練數(shù)據(jù)集,以此為基礎(chǔ)訓(xùn)練算法,使其具備根據(jù)目標(biāo)任務(wù)自主抓取、挖掘、分析數(shù)據(jù)的能力。訓(xùn)練數(shù)據(jù)集是機(jī)器學(xué)習(xí)的開端,在審查大數(shù)據(jù)證據(jù)時(shí),應(yīng)首先對(duì)訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)質(zhì)量進(jìn)行審查。第一是在數(shù)據(jù)收集階段。大數(shù)據(jù)技術(shù)離不開數(shù)據(jù)的“喂養(yǎng)”,“垃圾進(jìn),垃圾出”表明了數(shù)據(jù)收集是影響大數(shù)據(jù)技術(shù)可靠性的首道關(guān)口。數(shù)據(jù)收集一般可以分為數(shù)據(jù)源和收集方式兩部分,數(shù)據(jù)源一般是指各類系統(tǒng)、網(wǎng)站以及傳感設(shè)備,數(shù)據(jù)源是否運(yùn)行穩(wěn)定、是否經(jīng)過(guò)篡改、是否被網(wǎng)絡(luò)黑客所攻擊等因素是評(píng)估數(shù)據(jù)源可靠性與真實(shí)性的主要標(biāo)準(zhǔn)。與此同時(shí),大數(shù)據(jù)的收集方式也是影響數(shù)據(jù)真實(shí)性與完整性的重要因素,比如,互聯(lián)網(wǎng)數(shù)據(jù)爬取是當(dāng)前數(shù)據(jù)收集的主要方式之一,而爬取互聯(lián)網(wǎng)數(shù)據(jù)的爬蟲軟件的時(shí)間設(shè)置則是影響原始數(shù)據(jù)收集范圍與時(shí)效性的重要因素,在證據(jù)審查時(shí)應(yīng)當(dāng)著重關(guān)注。第二是在數(shù)據(jù)預(yù)處理階段。數(shù)據(jù)預(yù)處理主要是對(duì)所收集的數(shù)據(jù)進(jìn)行“清洗”或“標(biāo)注”。監(jiān)督學(xué)習(xí)型的大數(shù)據(jù)技術(shù),在這一階段一般需要大數(shù)據(jù)技術(shù)工程師人工介入進(jìn)行處理,因而人為因素是影響這一階段數(shù)據(jù)質(zhì)量的主要因素。對(duì)此可以從以下幾方面進(jìn)行審查:數(shù)據(jù)標(biāo)注是否有統(tǒng)一的行業(yè)標(biāo)準(zhǔn),對(duì)數(shù)據(jù)采集點(diǎn)、采集內(nèi)容以及采集頻率等數(shù)據(jù)標(biāo)注流程是否有明確的操作規(guī)定;數(shù)據(jù)標(biāo)注過(guò)程中數(shù)據(jù)工程師的綜合素質(zhì)——他們是否專業(yè)化、能否中立地進(jìn)行數(shù)據(jù)標(biāo)注、工作態(tài)度是否認(rèn)真、是否在數(shù)據(jù)標(biāo)注過(guò)程中為達(dá)到某一數(shù)據(jù)處理目的而數(shù)據(jù)造假等因素,是評(píng)估數(shù)據(jù)預(yù)處理階段訓(xùn)練數(shù)據(jù)集的主要標(biāo)準(zhǔn)。
其次,大數(shù)據(jù)證據(jù)源代碼的可靠性審查。傳統(tǒng)專家意見證據(jù)的可靠性審查,重心在于專家所依賴的理論或技術(shù)的可靠性和準(zhǔn)確性。美國(guó)多伯特案件為專家證據(jù)的可靠性審查提供了標(biāo)準(zhǔn),主要包括四個(gè)方面:(1)專家證言所依賴的理論或技術(shù)能否以及是否能夠經(jīng)過(guò)測(cè)試或檢驗(yàn);(2)該理論或技術(shù)是否經(jīng)過(guò)同行評(píng)議;(3)該種理論或技術(shù)已知以及潛在的錯(cuò)誤率是多少;(4)該理論或技術(shù)是否為相關(guān)領(lǐng)域所普遍接受(39)Daubert v. Merrell Dow Pharmaceuticals, Inc.,509 U.S.579,587( 1993).。這四項(xiàng)標(biāo)準(zhǔn)為大數(shù)據(jù)證據(jù)源代碼的可靠性審查提供了思路。第一是源代碼的可重復(fù)性測(cè)試(40)“只有當(dāng)一個(gè)裝置反復(fù)應(yīng)用后給出了同樣的讀數(shù)或圖像,這樣的裝置才是可靠的。如果該裝置沒有得到適當(dāng)養(yǎng)護(hù),就不能提供可靠讀數(shù)。例如,如果一支警用雷達(dá)槍沒有定期檢測(cè)或?qū)掖问軗p,就不可能指望它提供汽車速度的可靠標(biāo)示”。[美]特倫斯·安德森等《證據(jù)分析》,張保生等譯,北京:中國(guó)人民大學(xué)出版社,2012年,第86頁(yè)。。根據(jù)上文所述,源代碼是一套預(yù)先設(shè)置的解決某一問(wèn)題的固定步驟,這使得源代碼的處理結(jié)果具有可預(yù)測(cè)性,不受反復(fù)無(wú)常的主觀化個(gè)人的影響。因而,對(duì)源代碼進(jìn)行可重復(fù)性測(cè)試,并且評(píng)估每次測(cè)試結(jié)果的一致程度便可以評(píng)估源代碼的可靠性,這同時(shí)也規(guī)避了算法黑箱的技術(shù)難題。美國(guó)紐約上東區(qū)法院在審理一起案件時(shí)發(fā)現(xiàn),紐約州警局犯罪實(shí)驗(yàn)室未對(duì)STRMix這一DNA分析軟件進(jìn)行任何內(nèi)部驗(yàn)證(internal study),法院因此排除了這一軟件生成的DNA報(bào)告(41)People v.Hillary, Case No. 2015-15, at 8 (N.Y. Sup. Ct. Aug. 26, 2016).。第二是源代碼的同行評(píng)議。計(jì)算機(jī)程序語(yǔ)言的兩個(gè)頂級(jí)會(huì)議 POPL和PLDI發(fā)布了有關(guān)計(jì)算機(jī)程序語(yǔ)言論文的嚴(yán)格評(píng)審流程(42)POPL發(fā)布的論文評(píng)審流程參見http://popl.mpi-sws.org/PrinciplesofPOPL.pdf,最后訪問(wèn)日期:2021-11-30;PLDI發(fā)布的論文評(píng)審流程參見http://www.sigplan.org/sites/default/files/PracticesofPLDI.pdf,最后訪問(wèn)日期:2021-11-30。,因而,法官可以通過(guò)評(píng)估有關(guān)源代碼程序語(yǔ)言的論文發(fā)表刊物級(jí)別、會(huì)議層級(jí)、是否有嚴(yán)格的同行評(píng)議機(jī)制等因素對(duì)源代碼的可靠性進(jìn)行審查。第三是源代碼的錯(cuò)誤率。由于錯(cuò)誤率對(duì)計(jì)算機(jī)程序的穩(wěn)定運(yùn)行十分關(guān)鍵,計(jì)算機(jī)科學(xué)家也總結(jié)出了許多評(píng)估計(jì)算機(jī)程序代碼錯(cuò)誤率的方法,概括而言,可以從源代碼的使用年限、復(fù)雜性以及源代碼的歷史故障率等方面進(jìn)行評(píng)估。第四是源代碼在相關(guān)領(lǐng)域的普遍接受度。由于不同的源代碼所實(shí)現(xiàn)的程序功能不同,關(guān)于源代碼的接受度不能一概而論,因而應(yīng)當(dāng)從特定的源代碼適用領(lǐng)域,比如人臉識(shí)別、數(shù)字金融、智慧健康醫(yī)療領(lǐng)域等等出發(fā)來(lái)評(píng)價(jià)其普遍接受度。在此基礎(chǔ)上,可以通過(guò)相關(guān)源代碼的行業(yè)聲譽(yù)、適用范圍、適用時(shí)長(zhǎng)、用戶滿意度等要素對(duì)其普遍接受度進(jìn)行評(píng)估。
上文所構(gòu)建的審查體系是大數(shù)據(jù)證據(jù)審查的應(yīng)然范式,將這種理想樣態(tài)落實(shí)到實(shí)踐中仍然需要一系列配套的體制機(jī)制,主要包括以下三方面:
法定證據(jù)種類是我國(guó)證據(jù)規(guī)則構(gòu)建的邏輯前提,但是這種法定的證據(jù)種類制度難以應(yīng)對(duì)日新月異的社會(huì)進(jìn)步以及紛繁復(fù)雜的司法實(shí)踐,例如在《新刑訴法解釋》頒布之前,廣泛存在于司法實(shí)踐之中的價(jià)格認(rèn)定報(bào)告、會(huì)計(jì)審計(jì)報(bào)告等證據(jù)形式,均因不屬于法定證據(jù)種類而難以納入證據(jù)審查體系。當(dāng)前新技術(shù)革命催生出的大數(shù)據(jù)證據(jù)也不例外,面臨著相同的證據(jù)種類歸屬難題。因而,為了破解這一問(wèn)題,需要突破當(dāng)前法定證據(jù)種類的制度約束,探求契合司法實(shí)踐的大數(shù)據(jù)證據(jù)審查路徑。
首先,應(yīng)當(dāng)注重證據(jù)審查規(guī)則的構(gòu)建和完善,避免過(guò)度糾纏大數(shù)據(jù)證據(jù)的證據(jù)種類問(wèn)題。為了實(shí)現(xiàn)這一目標(biāo),可以大陸法系證據(jù)理論中的證據(jù)方法為進(jìn)路(43)林喜芬:《大數(shù)據(jù)證據(jù)在刑事司法中的運(yùn)用初探》,《法學(xué)論壇》2021年第3期。。在大陸法系的證據(jù)理論中,證據(jù)包括證據(jù)資料與證據(jù)方法,證據(jù)資料是指可能與待證事實(shí)相關(guān)的所有的資訊內(nèi)容或速素材,而證據(jù)方法則是調(diào)查證據(jù)資料內(nèi)容的手段(44)林鈺雄:《刑事訴訟法(上冊(cè) 總論編)》,北京:中國(guó)人民大學(xué)出版社,2005年,第349頁(yè)。。因而,在證據(jù)法中,“法定”的不應(yīng)當(dāng)是某類證據(jù)類型所攜帶的證據(jù)信息,因?yàn)槿魏我环N人、地、物都有可能是與待證犯罪事實(shí)直接或間接相關(guān)的資訊內(nèi)容或素材,而應(yīng)當(dāng)是審查類證據(jù)的調(diào)查方法。例如,歐陸刑事訴訟中法定的證據(jù)方法主要包括五種,即人證(詢問(wèn))、勘驗(yàn)、鑒定、文書(宣讀)以及被告(訊問(wèn))。對(duì)于我國(guó)的法定證據(jù)種類制度,有學(xué)者批評(píng)道:“就是沒有充分認(rèn)識(shí)到證據(jù)法的基本功能在于對(duì)訴訟中運(yùn)用證據(jù)的行為進(jìn)行規(guī)范?!?45)孫遠(yuǎn):《論法定證據(jù)種類概念之無(wú)價(jià)值》,《當(dāng)代法學(xué)》2014年第2期。因而,面對(duì)大數(shù)據(jù)證據(jù),在明晰證據(jù)屬性的基礎(chǔ)上應(yīng)當(dāng)注重具體審查規(guī)則的構(gòu)建和更新,以規(guī)范大數(shù)據(jù)證據(jù)的審查行為,而不應(yīng)當(dāng)過(guò)度糾纏其到底屬于何種法定證據(jù)種類。同時(shí),“證據(jù)方法具有一定的開放性,并不必然對(duì)應(yīng)某一種證據(jù)形式”(46)林喜芬:《大數(shù)據(jù)證據(jù)在刑事司法中的運(yùn)用初探》,《法學(xué)論壇》2021年第3期。,同一證據(jù)可以組合多種證據(jù)方法予以審查。這也契合了大數(shù)據(jù)證據(jù)兼具電子數(shù)據(jù)與專家證據(jù)的多元證據(jù)屬性。
其次,可以通過(guò)司法控制的方式為大數(shù)據(jù)證據(jù)審查規(guī)則提供規(guī)范路徑。大數(shù)據(jù)證據(jù)的可靠性審查要深入至機(jī)器學(xué)習(xí)的源代碼,而當(dāng)前的證據(jù)審查規(guī)則尚未對(duì)機(jī)器學(xué)習(xí)源代碼審查有完善的規(guī)定,這可以通過(guò)司法解釋或指導(dǎo)性案例的方式予以實(shí)現(xiàn)。這種通過(guò)司法調(diào)控確立證據(jù)審查規(guī)則的方法在我國(guó)當(dāng)前的司法實(shí)踐中并不鮮見。例如,《新刑訴法解釋》第100條規(guī)定:“因無(wú)鑒定機(jī)構(gòu),或者根據(jù)法律、司法解釋的規(guī)定,指派、聘請(qǐng)有專門知識(shí)的人就案件的專門性問(wèn)題出具的報(bào)告,可以作為證據(jù)使用?!边@條規(guī)定賦予了專門性問(wèn)題報(bào)告在審判中的證據(jù)資格地位,同時(shí)也明確了其審查規(guī)則(47)《新刑訴法解釋》第100條規(guī)定,專門性問(wèn)題報(bào)告的審查參照適用鑒定意見審查的規(guī)定。,回應(yīng)了我國(guó)司法實(shí)踐中大量存在的“價(jià)格鑒定報(bào)告書”“會(huì)計(jì)審計(jì)報(bào)告”等證據(jù)材料的法律地位和證據(jù)審查難題。又如,最高人民法院2020年12月29日發(fā)布的第26批指導(dǎo)性案例中明確了專門性問(wèn)題報(bào)告的證據(jù)地位(48)參見最高人民法院第26批指導(dǎo)性案例147號(hào)“張永明、毛偉明、張鷺故意損毀名勝古跡案”。。這種通過(guò)司法解釋或指導(dǎo)性案例的方式,能夠疏解法定證據(jù)種類制度的封閉性和滯后性,也可以有效應(yīng)對(duì)當(dāng)下大數(shù)據(jù)證據(jù)審查規(guī)范依據(jù)闕如的困境。
當(dāng)然,借由司法解釋的路徑將審查大數(shù)據(jù)證據(jù)規(guī)則規(guī)范化,是應(yīng)對(duì)當(dāng)前新技術(shù)革命的權(quán)衡之策,因?yàn)橥ㄟ^(guò)司法解釋創(chuàng)設(shè)證據(jù)審查規(guī)則,會(huì)侵蝕證據(jù)規(guī)則體系的合法性與融貫性(49)參見吳洪淇《刑事證據(jù)制度的體系化塑造及其隱憂——最高院“新刑訴解釋證據(jù)規(guī)定”的宏觀分析》,《當(dāng)代法學(xué)》2021年第5期。。造成這種困境的原因,在于我國(guó)證據(jù)制度中證據(jù)種類與證據(jù)審查規(guī)則的聯(lián)結(jié)過(guò)于緊密,證據(jù)審查規(guī)則完全依照證據(jù)種類展開,而證據(jù)種類劃分又不周延,導(dǎo)致一些新興證據(jù)形式難以歸入既有的證據(jù)審查規(guī)則進(jìn)行審查。因而為了實(shí)現(xiàn)證據(jù)種類與證據(jù)審查規(guī)則的適度分離,可以通過(guò)整合我國(guó)當(dāng)前的法定證據(jù)種類,將之歸納為言詞證據(jù)、實(shí)物證據(jù)和派生證據(jù)這種證據(jù)范疇容納性更高的證據(jù)類型(50)參見吳洪淇《刑事證據(jù)制度的體系化塑造及其隱憂——最高院“新刑訴解釋證據(jù)規(guī)定”的宏觀分析》,《當(dāng)代法學(xué)》2021年第5期。,實(shí)現(xiàn)證據(jù)審查規(guī)則的靈活適用。而這一過(guò)程并不是一蹴而就的,其有賴于立法、司法以及理論界的持續(xù)努力。
根據(jù)上文所提及的大數(shù)據(jù)證據(jù)與電子數(shù)據(jù)的關(guān)系可知,大數(shù)據(jù)證據(jù)的鑒真鑲嵌于電子數(shù)據(jù)的鑒真機(jī)制當(dāng)中,因而完善電子數(shù)據(jù)鑒真機(jī)制,對(duì)于保障大數(shù)據(jù)證據(jù)的真實(shí)性與同一性具有十分重要的意義。在2010年最高人民法院、最高人民檢察院、公安部、國(guó)家安全部、司法部頒布的《關(guān)于辦理死刑案件審查判斷證據(jù)若干問(wèn)題的規(guī)定》(下文稱《關(guān)于死刑案件證據(jù)規(guī)定》)中,開始出現(xiàn)了對(duì)電子數(shù)據(jù)的鑒真規(guī)定,之后的2012年刑訴法解釋吸收了《關(guān)于死刑案件證據(jù)規(guī)定》中關(guān)于電子數(shù)據(jù)鑒真的規(guī)則,一套關(guān)于電子數(shù)據(jù)鑒真的規(guī)則體系初見雛形。但是,2013至2014年間引發(fā)巨大爭(zhēng)議的快播案暴露出了我國(guó)電子數(shù)據(jù)鑒真的嚴(yán)重問(wèn)題,2016年出臺(tái)了《電子數(shù)據(jù)證據(jù)規(guī)定》。這是我國(guó)首次以單獨(dú)一部司法解釋就某一特定證據(jù)種類進(jìn)行規(guī)制,其中鑒真規(guī)定占比達(dá)三分之二(51)參見謝登科《電子數(shù)據(jù)的鑒真問(wèn)題》,《國(guó)家檢察官學(xué)院學(xué)報(bào)》2017年第5期。。這無(wú)疑是我國(guó)電子數(shù)據(jù)鑒真體系的一大進(jìn)步,但仍然存在著諸多有待完善之處,比如鑒真規(guī)則體系不完善、鑒真方法單一、鑒真程序依賴筆錄類證據(jù)等(52)參見劉品新《電子證據(jù)的鑒真問(wèn)題:基于快播案的反思》,《中外法學(xué)》2017年第1期。。大數(shù)據(jù)證據(jù)的鑒真要求,可能成為進(jìn)一步完善電子數(shù)據(jù)鑒真鑒定規(guī)則的“證據(jù)法時(shí)刻”(53)Jeffrey Bellin,E-Hearsay, Minnesota Law Review,vol.98, no.7, 2013, pp.11-12.。
首先,豐富電子數(shù)據(jù)的鑒真方法,實(shí)現(xiàn)證據(jù)鑒真實(shí)質(zhì)化、高效化。一方面,從鑒真實(shí)質(zhì)化而言,我國(guó)當(dāng)前的物證鑒真實(shí)踐中,主要依賴于筆錄類證據(jù),由于該類證據(jù)主觀性較強(qiáng)、易于修改且難以完整還原物證提取、收集以及固定等過(guò)程的原貌,導(dǎo)致鑒真流于形式(54)白冰:《論實(shí)物證據(jù)的鑒真規(guī)則》,《當(dāng)代法學(xué)》2018年第1期。。有鑒于此,應(yīng)當(dāng)豐富電子數(shù)據(jù)的鑒真方法,逐步脫離對(duì)筆錄類證據(jù)的依賴。比如,知情人鑒真。知情人鑒真是物證鑒真中較為常用的方法,一般是指對(duì)物證的外部特征、收集、固定以及保管程序有親身知識(shí)的人進(jìn)行的作證。就大數(shù)據(jù)證據(jù)而言,知情人可以分為大數(shù)據(jù)證據(jù)數(shù)據(jù)或程序代碼的設(shè)計(jì)者或制作者,大數(shù)據(jù)證據(jù)所存在的載體或終端的使用者以及大數(shù)據(jù)證據(jù)的收集、固定和保存者,他們可以對(duì)案件中大數(shù)據(jù)證據(jù)的同一性進(jìn)行作證,實(shí)現(xiàn)鑒真目的。再如,推定鑒真。推定鑒真是專門針對(duì)電子數(shù)據(jù)鑒真而提出的鑒真方法。因?yàn)樵诋a(chǎn)生電子數(shù)據(jù)的程序或設(shè)備中會(huì)產(chǎn)生關(guān)于該電子數(shù)據(jù)的附屬信息,例如時(shí)間、地點(diǎn)、設(shè)備名稱等,這些信息產(chǎn)生于系統(tǒng)或設(shè)備的運(yùn)行之中,受人的主觀性影響較小(55)郭金霞:《電子數(shù)據(jù)鑒真規(guī)則解構(gòu)》,《政法論壇》2019年第3期。,可以根據(jù)這類附屬信息對(duì)電子數(shù)據(jù)的完整性和同一性進(jìn)行推定鑒真。另一方面,從鑒真高效化而言,可以憑借智能技術(shù)進(jìn)行鑒真。隨著人工智能技術(shù)的發(fā)展,知情人、技術(shù)專家可能也難以辨識(shí)人工智能算法對(duì)證據(jù)的修改,因而在一些圖像智能化處理領(lǐng)域,有論者主張運(yùn)用AI技術(shù)對(duì)人工智能算法加工的圖像進(jìn)行鑒真(56)2018年,Rossler等研究人員創(chuàng)建了一個(gè)包含約50萬(wàn)張圖像的數(shù)據(jù)庫(kù)(來(lái)自1000多個(gè)視頻),并發(fā)表了他們的研究成果,成果表明,他們開發(fā)的機(jī)器學(xué)習(xí)算法(XceptionNet)可以在不對(duì)圖像進(jìn)行修改的條件下區(qū)分人臉圖像是否存在互換的情況。See Marie-Helen Maras & Alex Alexandrou, Determining Authenticity of Video Evidence in the Age of Artificial Intelligence and in the Wake of Deepfake Videos, The International Journal of Evidence & Proof, vol.23, no.3, 2019, p.255.。此外,可以嘗試引入自我鑒真規(guī)則。自我鑒真(self-authentication),是指物證、書證等展示性證據(jù)的真實(shí)性已經(jīng)得到證明,無(wú)需外部證據(jù)進(jìn)行證明。美國(guó)聯(lián)邦證據(jù)規(guī)則902條款列舉了包括帶有簽章的國(guó)內(nèi)公文、官方出版物等在內(nèi)的12種自我鑒真的情形。在大數(shù)據(jù)證據(jù)的鑒真過(guò)程中,可以設(shè)立自我鑒真規(guī)則,例如由政府機(jī)關(guān)收集的數(shù)據(jù)或認(rèn)證的源代碼生成的大數(shù)據(jù)證據(jù),或由獨(dú)立第三方評(píng)估過(guò)的程序代碼生成的大數(shù)據(jù)證據(jù)等可以納入自我鑒真的情形。
其次,平衡新技術(shù)發(fā)展與司法鑒定管理制度之間的關(guān)系。鑒真是鑒定的前提與基礎(chǔ),鑒定是鑒真的延伸與補(bǔ)充。當(dāng)大數(shù)據(jù)證據(jù)因?qū)I(yè)技術(shù)問(wèn)題而存在著鑒真難題時(shí),法官可以將證據(jù)審查訴諸司法鑒定。但是,與美國(guó)由法官裁量評(píng)估新技術(shù)可靠性的方式不同,我國(guó)是借由國(guó)家標(biāo)準(zhǔn)或行業(yè)標(biāo)準(zhǔn)等規(guī)定對(duì)新技術(shù)進(jìn)入司法鑒定領(lǐng)域提供門檻,并且當(dāng)前的鑒定機(jī)構(gòu)并不具備自行制定有關(guān)技術(shù)規(guī)范的權(quán)力。這種司法鑒定管理體制意味著大數(shù)據(jù)證據(jù)的鑒定仍然要嚴(yán)格依照規(guī)范化的國(guó)家標(biāo)準(zhǔn)或行業(yè)標(biāo)準(zhǔn),但是目前關(guān)于大數(shù)據(jù)證據(jù)鑒定的標(biāo)準(zhǔn)依舊付之闕如。因而,應(yīng)當(dāng)尋求新技術(shù)發(fā)展與司法鑒定管理制度之間的平衡路徑,樹立技術(shù)自治的理念,恢復(fù)司法鑒定機(jī)構(gòu)技術(shù)規(guī)范制定的自主性,通過(guò)向司法行政部門進(jìn)行事前報(bào)備、事后評(píng)估監(jiān)管的方式釋放新技術(shù)在司法鑒定領(lǐng)域的效能。在此基礎(chǔ)上,應(yīng)當(dāng)加快相關(guān)技術(shù)國(guó)家標(biāo)準(zhǔn)或行業(yè)標(biāo)準(zhǔn)的制定步伐,為大數(shù)據(jù)證據(jù)鑒定提供規(guī)范化的制度標(biāo)準(zhǔn),為大數(shù)據(jù)證據(jù)鑒定創(chuàng)造制度空間。此外,辦案機(jī)關(guān)應(yīng)當(dāng)探索高效靈活的大數(shù)據(jù)證據(jù)審查機(jī)制,破解當(dāng)下大數(shù)據(jù)證據(jù)的鑒定困境。例如北京市海淀區(qū)檢察院探索出“檢察官+數(shù)據(jù)審查員”新型辦案模式,通過(guò)招錄具有計(jì)算機(jī)背景和法學(xué)背景的人才,將具有計(jì)算機(jī)專業(yè)知識(shí)的檢察員作為數(shù)據(jù)審查員,并吸收本院具有鑒定資質(zhì)的專業(yè)人員,在不脫離各自崗位的情況下對(duì)電子數(shù)據(jù)進(jìn)行審查分析,為專業(yè)鑒定機(jī)構(gòu)先行鎖定了海量電子數(shù)據(jù)中的“重點(diǎn)鑒定范圍”,提高了電子數(shù)據(jù)的鑒定質(zhì)效(57)參見《讓數(shù)據(jù)不再成為“孤島”》,《檢察日?qǐng)?bào)》,2021年11月8日第5版。。
我國(guó)《新刑訴法解釋》第71條規(guī)定:“證據(jù)未經(jīng)當(dāng)庭出示、辨認(rèn)、質(zhì)證等法庭調(diào)查程序查證屬實(shí),不得作為定案的根據(jù)?!庇捎诖髷?shù)據(jù)證據(jù)特殊的證明機(jī)理,主導(dǎo)證據(jù)生成的源代碼應(yīng)成為證據(jù)質(zhì)證的焦點(diǎn)(58)Edward K. Cheng and G. Alexander Nunn, Beyond the Witness: Bringing a Process Perspective to Modern Evidence Law, Texas Law Review, vol.97, no.6, 2019, pp.1077-1124.。從域外的討論來(lái)看,主張被追訴人獲知(access)用作指控的機(jī)器證據(jù)的源代碼并對(duì)其進(jìn)行對(duì)質(zhì)已經(jīng)成了共識(shí)(59)Alex Nunn, Machine-generated Evidence, The SciTech Lawyer,vol.16, no.4, 2020, pp.3-7.。具體而言,在我國(guó)的司法語(yǔ)境中,大數(shù)據(jù)證據(jù)的質(zhì)證機(jī)制應(yīng)當(dāng)從以下兩方面展開:
首先,大數(shù)據(jù)證據(jù)源代碼的開示。因?yàn)樵创a在生成大數(shù)據(jù)證據(jù)的過(guò)程中發(fā)揮著核心作用,源代碼的準(zhǔn)確性與可靠性決定著大數(shù)據(jù)證據(jù)的可靠性,甚至有論者主張將源代碼的公開作為大數(shù)據(jù)證據(jù)可采性的條件之一(60)Christian Chessman, A “Source” of Error: Computer Code, Criminal Defendants, and the Constitution, California Law Review, vol.105, no.1, 2017, pp.179-228.。但是,源代碼一般涉及相關(guān)企業(yè)的商業(yè)秘密保護(hù)等權(quán)益,在國(guó)外的司法實(shí)踐中,以商業(yè)秘密保護(hù)為由拒絕披露源代碼的上訴請(qǐng)求得到了法院的支持。但是,多數(shù)學(xué)者認(rèn)為在刑事審判中對(duì)商業(yè)秘密保護(hù)賦予證據(jù)上的特免權(quán)地位有過(guò)度保護(hù)的傾向(61)Rebecca Wexler, Life, Liberty, and Trade Secrets: Intellectual Property in the Criminal Justice System,Stanford Law Review, vol.70, no.5, 2018, pp.1343-1429.,為了保障證據(jù)裁判的正當(dāng)性,應(yīng)當(dāng)對(duì)源代碼進(jìn)行開示。鑒于源代碼特殊的商業(yè)秘密價(jià)值,源代碼開示的關(guān)鍵在于開示的情形、程序與方式。第一,從公開情形而言,當(dāng)大數(shù)據(jù)證據(jù)是證明案件要件事實(shí)的關(guān)鍵證據(jù)時(shí),源代碼應(yīng)當(dāng)公開;當(dāng)大數(shù)據(jù)證據(jù)充當(dāng)?shù)氖情g接證據(jù)、補(bǔ)強(qiáng)證據(jù)時(shí),源代碼可以公開,如果被告人及其辯護(hù)律師申請(qǐng)公開并擔(dān)負(fù)保密義務(wù)的,應(yīng)當(dāng)向其公開;第二,從公開范圍而言,大數(shù)據(jù)證據(jù)的源代碼公開僅限于經(jīng)過(guò)鑒真的源代碼,與該案無(wú)關(guān)的源代碼禁止公開;第三,從公開對(duì)象而言,大數(shù)據(jù)證據(jù)源代碼應(yīng)當(dāng)主要向辯護(hù)律師公開,未聘請(qǐng)辯護(hù)律師的,可以向被告人及其近親屬公開,為了維護(hù)源代碼的商業(yè)秘密價(jià)值,在向其公開的同時(shí)應(yīng)要求保守秘密;第四,從公開的方式而言,可以通過(guò)口頭解釋或者通過(guò)可視化的動(dòng)畫演示,以當(dāng)事人的理解為標(biāo)準(zhǔn);第五,從公開的階段而言,可以主要集中于庭前會(huì)議階段。
其次,適用專家輔助人制度。因?yàn)榇髷?shù)據(jù)證據(jù)的專業(yè)性程度較高,這種知識(shí)上的不對(duì)等加劇了控辯之間的不平等關(guān)系,導(dǎo)致證據(jù)質(zhì)證難以進(jìn)行,為了緩解這一難題,可以借助專家輔助人制度。在我國(guó)的訴訟語(yǔ)境中,專家輔助人又被稱為“有專門知識(shí)的人”。我國(guó)2012年修改的《刑事訴訟法》第192條規(guī)定:“公訴人、當(dāng)事人和辯護(hù)人、訴訟代理人可以申請(qǐng)法庭通知有專門知識(shí)的人出庭,就鑒定人做出的鑒定意見提出意見?!北M管從文本上看,專家輔助人的作用僅局限于對(duì)鑒定意見進(jìn)行質(zhì)證,但是在司法實(shí)踐中,在一些情況下專家輔助人已經(jīng)超越了規(guī)范文本所規(guī)定的角色功能,例如就專業(yè)問(wèn)題提供意見等,并且并未帶來(lái)庭審失控的后果(62)吳洪淇:《刑事訴訟中的專家輔助人:制度變革與優(yōu)化路徑》,《中國(guó)刑事法雜志》2018年第5期。。因而,第一,應(yīng)當(dāng)適度擴(kuò)大專家輔助人的功能定位,不再局限于對(duì)鑒定意見提出意見,也可就相關(guān)專業(yè)問(wèn)題提供意見。2020年頒布的《新刑訴法解釋》明確了有專門知識(shí)的人就專門性問(wèn)題出具的報(bào)告的證據(jù)地位,這為專家輔助人有效介入大數(shù)據(jù)證據(jù)質(zhì)證提供了合法依據(jù)。第二,明晰專家輔助人的法庭準(zhǔn)入標(biāo)準(zhǔn)??梢跃C合考慮專家輔助人的執(zhí)業(yè)經(jīng)驗(yàn)、職稱、行業(yè)知名度以及專業(yè)對(duì)口程度等因素,聘請(qǐng)專業(yè)化的計(jì)算機(jī)程序工程師等專業(yè)人員對(duì)源代碼進(jìn)行識(shí)讀分析,判斷計(jì)算機(jī)程序源代碼的準(zhǔn)確性和可靠性。第三,明確專家輔助人質(zhì)證的程序細(xì)節(jié)。從質(zhì)證對(duì)象而言,專家輔助人應(yīng)當(dāng)僅能對(duì)與本案有關(guān)的程序代碼發(fā)表意見;從權(quán)利義務(wù)角度而言,專家輔助人在享有發(fā)表專業(yè)意見的權(quán)利之外,同時(shí)也要擔(dān)負(fù)獨(dú)立客觀以及對(duì)非開源源代碼保守秘密的義務(wù);如果專家輔助人出庭作證,為了保障其專業(yè)性與客觀性,應(yīng)在其發(fā)表完專業(yè)意見并接受詢問(wèn)后退庭,不得旁聽案件的其他庭審環(huán)節(jié)。
證據(jù)法學(xué)家達(dá)馬斯卡在20世紀(jì)末展望證據(jù)法的未來(lái)時(shí)斷言:“越來(lái)越多的對(duì)訴訟程序非常重要的事實(shí),現(xiàn)在只能通過(guò)高科技手段查明。隨著人類感官察覺的事實(shí)與用來(lái)發(fā)掘感官所不能及的世界的輔助工具所揭示的真相之間鴻溝的擴(kuò)大,人類感官在事實(shí)認(rèn)定中的重要性已經(jīng)開始下降?!?63)[美]達(dá)馬斯卡:《漂移的證據(jù)法》,李學(xué)軍、劉曉丹等譯,何家弘校,第200頁(yè)。當(dāng)前,大量涌現(xiàn)在庭審中的科學(xué)證據(jù),諸如DNA測(cè)序、血液酒精濃度測(cè)試等,都讓位給超出人類感官經(jīng)驗(yàn)的機(jī)器代碼,事實(shí)認(rèn)定者主要依靠一系列“真相機(jī)器”來(lái)查明案件事實(shí)(64)Andrea Roth, Trial by Machine, Georgetown Law Journal, vol.104, no.5, 2016, pp.1-48.,因而在傳統(tǒng)司法證明過(guò)程中人類的主體性認(rèn)知,逐漸演變成了數(shù)據(jù)社會(huì)背景下的人機(jī)分布式認(rèn)知。大數(shù)據(jù)證據(jù)就是在這種認(rèn)知模式轉(zhuǎn)型的背景下誕生的一種證據(jù)形式,它通過(guò)機(jī)器學(xué)習(xí)技術(shù)在海量數(shù)據(jù)中凝練的“數(shù)據(jù)經(jīng)驗(yàn)”進(jìn)行自主判斷,這種超越人類感官、憑借程序代碼生成的證據(jù),在當(dāng)下的司法實(shí)踐中成了一種新的專家證據(jù)。面對(duì)這種誕生于新技術(shù)革命的證據(jù)形式,我國(guó)尚處于發(fā)展完善階段的證據(jù)制度,不得不面對(duì)舊的問(wèn)題尚未解決、新的疑難已經(jīng)誕生的窘境。這種新舊問(wèn)題交疊的現(xiàn)實(shí)難題要求我們對(duì)大數(shù)據(jù)證據(jù)審查體系進(jìn)行調(diào)整和創(chuàng)新。一方面,大數(shù)據(jù)證據(jù)不可能脫離當(dāng)下的電子信息社會(huì)而真空存在,與電子數(shù)據(jù)之間的緊密關(guān)聯(lián)既要求我們對(duì)既有電子數(shù)據(jù)審查制度進(jìn)行完善更新;另一方面,機(jī)器學(xué)習(xí)等新技術(shù)對(duì)司法證明領(lǐng)域的滲透不可避免地存在著大數(shù)據(jù)證據(jù)失真風(fēng)險(xiǎn)和技術(shù)倫理困境,又要求我們對(duì)機(jī)器學(xué)習(xí)源代碼的審查體系,以及證據(jù)種類、證據(jù)開示以及法庭對(duì)質(zhì)等一系列證明機(jī)制進(jìn)行反思與創(chuàng)新,最終為大數(shù)據(jù)證據(jù)的可靠性審查確立一套完善的審查體系。