高 波
當前的訴訟制度改革是以審判為中心展開的,司法實踐中證據(jù)分析的精細化對證據(jù)分析提出了更高的要求,收集并挖掘電子數(shù)據(jù)的深層含義,已經(jīng)成為電子數(shù)據(jù)應(yīng)用于訴訟活動中的重要途徑。這迫使人們對電子數(shù)據(jù)的認識活動提高到一個新的水平,對如何從海量電子數(shù)據(jù)中去挖掘并分析那一絲與訴訟相關(guān)聯(lián)的電子數(shù)據(jù)證據(jù)提出了挑戰(zhàn)。雖然探討計算法律(computational law)、算法裁判以及人工智能代替法官直接作出裁判為時尚早,但科學地運用人工智能的規(guī)則與推理手段、建構(gòu)電子數(shù)據(jù)證據(jù)分析框架模型,卻可以從海量的電子數(shù)據(jù)中獲取隱藏于其中的證據(jù)信息并發(fā)現(xiàn)其中的模式和內(nèi)在關(guān)系,人工智能電子數(shù)據(jù)的證據(jù)分析已成為輔助司法的重要手段。
20世紀60 年代,人工智能便開始進入司法證明領(lǐng)域,但由于當時的人工智能大多是建立在確定性或者精確性基礎(chǔ)之上的機器智能,不斷暴露出因為其公理系統(tǒng)的強形式化,即所謂的嚴格、精確而帶來的諸多局限。而在圖靈機器運算發(fā)展到互聯(lián)網(wǎng)云端計算后,人工智能也從確定性數(shù)學和符號邏輯來模擬人腦思維活動進入到模擬人類認知過程的不確定性人工智能新時代,即從人類認知的不確定性出發(fā),對不確定性知識的表示、處理,尋找并形象化地展現(xiàn),發(fā)現(xiàn)不確定性知識的規(guī)律性,利用機器、系統(tǒng)或網(wǎng)絡(luò)模擬人類認識客觀世界和人類自身的認識過程,使其具有智能。但不確定性人工智能獲取與分析的電子數(shù)據(jù)構(gòu)成的“可能證據(jù)”會對證據(jù)法中的“可采證據(jù)”產(chǎn)生巨大影響,因此,此類電子數(shù)據(jù)證據(jù)的來源可信性問題,以及從數(shù)據(jù)到概念、從概念到知識的定性定量轉(zhuǎn)換和連接信息點的發(fā)現(xiàn)、直至數(shù)據(jù)信息由細粒度到粗粒度的逐步歸納簡約的證據(jù)分析過程,是基于不確定性人工智能電子數(shù)據(jù)證據(jù)研究的重要問題。
知識的表示問題成為不確定性人工智能中的重要問題,司法人工智能就是以知識為中心的。邊沁在《引論性觀點》中指出:“證據(jù)領(lǐng)域不過是知識領(lǐng)域”,事實認定者需要全面認識證據(jù)。但是,即使認識了大量的證據(jù)還不等于認識了事實,從主體知識認識的角度看,事實作為一種真實存在,總是以某種判斷的形式被人們所把握;從知識表達的角度看,人們之間相互傳遞關(guān)于事實的知識是通過“語言”來實現(xiàn)的;從知識理解的角度看,人們能夠?qū)W習知識是因為命題與事實之間具有同構(gòu)性。認識主體必須通過推論性思維,通達人腦對客觀事物本質(zhì)屬性和內(nèi)在聯(lián)系的反映和認知,才能對大量的證據(jù)及其相互之間的關(guān)系進行科學的分析和判斷,由表及里,去偽存真,才能準確認定待證事實。
人類在認知過程不可避免地伴隨有不確定性,知識的獲取也凸顯出不確定性,在量子力學研究粒子構(gòu)成的微觀世界里,原子或者粒子構(gòu)成的群體的運動既具有波動性,又具有粒子性,據(jù)此德國物理學家沃納·海森伯格(Werner Heisenberg)提出了“測不準原理”,這表現(xiàn)在電子數(shù)據(jù)信息獲取過程中,就是電子數(shù)據(jù)信息具有隨機性、模糊性、不完備性等不確定性屬性。而認識過程的不確定性體現(xiàn)在感覺的不確定性、知識結(jié)構(gòu)的不確定性、記憶的不確定性、思維的不確定性。認知的不確定性決定了不確定性人工智能需要定性定量雙向轉(zhuǎn)換的認知模型,運用不確定性知識發(fā)現(xiàn)的物理學方法,在電子數(shù)據(jù)云計算、自然語言理解、圖像識別、數(shù)據(jù)挖掘領(lǐng)域可以發(fā)揮巨大作用。
不確定性人工智能是用概率對隨機性信息進行量化,借助隨機變量的分布函數(shù)來獲取隨機電子數(shù)據(jù)信息。而“在法律爭議中,不存在能以絕對確定性來闡述的結(jié)論。所以,概率概念在法律語境推論中的使用,與其他語境中的使用同樣普遍”。從證據(jù)法的視角來看,基于不確定性人工智能技術(shù),電子數(shù)據(jù)證據(jù)的獲取隨著信息技術(shù)應(yīng)用的普及,呈現(xiàn)多樣性和多元化趨勢,可以在不同粗細的概念粒度上進行深度學習,具體來說集中于知識工程的信息點挖掘、模式識別以及證據(jù)標準的表達方式這三個方面。
首先,基于不確定性人工智能的電子數(shù)據(jù)連接信息點的挖掘與分析。在法律實踐中,事實調(diào)查是一項重要和困難的任務(wù),在事實調(diào)查中需要分析出電子數(shù)據(jù)必要成分的生成要素。這些成分涉及電子數(shù)據(jù)證據(jù)論證中的假設(shè)或命題、各種電子數(shù)據(jù)證據(jù)及其連接假設(shè)。因此,事實調(diào)查涉及電子數(shù)據(jù)證據(jù)的分析和收集,這需要有足夠的信息來預報該事實,需要強大的整理和分析這些信息的能力。而大數(shù)據(jù)時代很難靠自然人力去發(fā)現(xiàn)電子數(shù)據(jù)的“連接信息點”(connect the dots),或者無法從大量電子數(shù)據(jù)中鑒別出某些有意義的瑣事,不確定性人工智能為諸如相關(guān)性規(guī)則等證據(jù)規(guī)則的分析提供了方法。
其次,運用不確定性人工智能技術(shù)對獲取電子數(shù)據(jù)的識別模式?;诓淮_定性人工智能識別是技術(shù)層問題,包括計算機視覺識別、生物識別、語言文字識別、自然語言處理等,而這些技術(shù)的實現(xiàn)離不開大數(shù)據(jù)、計算力和算法等基礎(chǔ)支持層,其中不確定性人工智能的模糊聚類、貝葉斯網(wǎng)絡(luò)等算法對電子數(shù)據(jù)的特征提取、分類、聚類和模式匹配,使得電子數(shù)據(jù)的識別技術(shù)成為保障經(jīng)濟和社會安全的重要工具。例如,在公安、海關(guān),甚至諸多服務(wù)性系統(tǒng)中得到普遍應(yīng)用的人臉識別正是不確定性人工智能領(lǐng)域商業(yè)化應(yīng)用較為成熟的業(yè)務(wù)。相比其他識別方式,人臉識別具有非強制性、非接觸性、并發(fā)性、人工審核容易等特點,其成為人工智能獲取電子數(shù)據(jù)證據(jù)的重要方式。
再次,一般來說,電子數(shù)據(jù)總是不完全的(always incomplete),事實判斷者不可能掌握所有電子數(shù)據(jù),獲取的電子數(shù)據(jù)常常是含糊的(ambiguous),事實判斷者不能完全理解電子數(shù)據(jù)傳達了什么信息。這影響著電子數(shù)據(jù)證明力的評估方式,最終會影響法庭推理認證的結(jié)果,這種推理風險是司法證明過程的伴生風險。各類證據(jù)據(jù)以證明待證事實的過程都存在不同程度、不同類型的推理風險。鑒于電子數(shù)據(jù)信息的更具隱蔽性、易變性,導致在分析證明領(lǐng)域中的電子數(shù)據(jù)推理風險顯得更加突出。有效識別電子數(shù)據(jù)的推理風險,需要強化對電子數(shù)據(jù)證明過程的解析,構(gòu)建獨立的證據(jù)認定體系??梢赃\用不確定性人工智能技術(shù),結(jié)合先驗概率和后驗概率,將復雜的聯(lián)合概率密度分解成一系列相對簡單的模塊,降低了電子數(shù)據(jù)信息發(fā)現(xiàn)和概率復雜程度,這使得不確定性人工智能在電子數(shù)據(jù)信息表達和推理方面更具有科學性和嚴密性,因為不確定性人工智能的表現(xiàn)形式是網(wǎng)狀思維結(jié)構(gòu)和概率分析,基礎(chǔ)數(shù)據(jù)是先驗知識和樣本數(shù)據(jù)。
經(jīng)法庭審查具有證據(jù)能力的訴訟證據(jù),如果在庭審證據(jù)調(diào)查程序進行質(zhì)證后,仍存在無法解釋的矛盾,或者無法與其他證據(jù)相互印證,就將因欠缺證明力而不能作為定案的根據(jù)。電子數(shù)據(jù)存在失真風險,這直接關(guān)系到電子數(shù)據(jù)的證明力。傳統(tǒng)上有關(guān)證據(jù)證明力的判斷,主要是以經(jīng)驗為基礎(chǔ),沒有科學的規(guī)則和標準可供遵循。而電子數(shù)據(jù)證據(jù)審查判斷方法的核心是對每一個電子數(shù)據(jù)鏈條的證明力都進行評估,并最終整合所有鏈條評估來決定與最終待證事實有關(guān)電子數(shù)據(jù)的凈證明力(net probative value)。
電子數(shù)據(jù)證據(jù)可信性與電子數(shù)據(jù)的具體表現(xiàn)形式密切相關(guān),而評價每一種證據(jù)形式的可信性時,必須考慮的屬性是不同的,電子數(shù)據(jù)的可信性不止涉及一個維度或?qū)傩浴T诓淮_定性人工智能視域中,當有海量電子數(shù)據(jù)證據(jù)需要審查時,有兩種電子數(shù)據(jù)證據(jù)形式在法律爭端中是非常重要的——基于有形物的電子數(shù)據(jù)證據(jù)和基于語言(包括自然語言與人工語言)的電子數(shù)據(jù)證據(jù)。
基于有形物的電子數(shù)據(jù)證據(jù)有多種形式,包括數(shù)據(jù)化的物體、文件、傳感圖像、測量結(jié)果,以及諸如電子示意圖、地圖等各種表現(xiàn)形式。所有這些種類的有形物的電子數(shù)據(jù)證據(jù)都可以接受檢查。在特定情況下,它們實際揭示的內(nèi)容并不總是明顯的。問題是,基于有形物的電子數(shù)據(jù)證據(jù)并不總是像它看起來那樣,電子數(shù)據(jù)可以偽造,視頻、圖像可以錯誤標記,數(shù)據(jù)傳感器可能存在故障等。在評價獲取基于有形物的電子數(shù)據(jù)證據(jù)的可信性時,有三個重要屬性必須加以考慮。
(1)真實性(authenticity)。真實性是基于有形物的電子數(shù)據(jù)證據(jù)具有可信性的最重要的因素。當事人必須提供“足以支持一項所主張事項之認定”的證據(jù)。而司法證明中所要求的電子數(shù)據(jù)具有客觀真實性需要的是證據(jù)中的信息不以人的意志為轉(zhuǎn)移的客觀存在,充分體現(xiàn)了電子數(shù)據(jù)所承載的信息是證明的關(guān)鍵,但電子數(shù)據(jù)證據(jù)的一個重要特征是可再生性,這意味著如果除提出該主張的人之外其他任何人在同等條件下,通過使用基本相同或類似的儀器或程序,就會得到與提出該電子數(shù)據(jù)當事人基本相同的或類似的有形物“表象”。因此,在電子數(shù)據(jù)證據(jù)獲取過程中,真實性檢驗標準是其可信性的關(guān)鍵。
(2)準確性、靈敏度(accuracy、sensitivity)。基于有形物的電子數(shù)據(jù)證據(jù)信息在糾紛中發(fā)揮作用的關(guān)鍵,是證明的重要序參量。所有種類的電子數(shù)據(jù)感應(yīng)裝置都能提供基于有形物的電子數(shù)據(jù)證據(jù),例如監(jiān)控視頻和其他傳感記錄的影像形式,但電子數(shù)據(jù)證據(jù)的可信性問題更關(guān)注電子數(shù)據(jù)感應(yīng)裝置是否為我們提供了問題解決的必要程度。因為,從信息的角度來看,通信的基本問題是在將信息從一端精確地或近似地傳遞到另一端。在某些情況下,感應(yīng)裝置的準確性可能由于控制裝置的設(shè)置不適當而造成數(shù)據(jù)信息衰減。對于基于有形物的電子數(shù)據(jù)證據(jù)而言,它是以電子形式反映出來的數(shù)據(jù)信息,采用的是計算機編碼或其他復雜的程序,其準確性和靈敏度受到限制,本身未必可以直接反映所要證明的內(nèi)容,往往需要一定的轉(zhuǎn)化,必須通過質(zhì)證,辨認可能削弱它們所含信息的準確性方面存在的瑕疵,法院才能采納。
(3)可靠性(reliability)。基于有形物的電子數(shù)據(jù)證據(jù)是依據(jù)人類科學技術(shù)成果之一的電子技術(shù)而形成的,其“科技性”往往會讓人們忽略對電子數(shù)據(jù)產(chǎn)生的軟硬件系統(tǒng)質(zhì)疑。雖然電子數(shù)據(jù)的高科技特性是不容質(zhì)疑的,但電子數(shù)據(jù)并不是一種科學證據(jù)。
可靠論證要求不僅結(jié)構(gòu)正確而且所有前提均真。當事人是利用何種技術(shù)措施對電子數(shù)據(jù)進行收集、怎樣進行有效的保全,這是從技術(shù)可靠性的角度對電子數(shù)據(jù)的真實提出質(zhì)疑。如何審查判斷其來源的可靠性、傳輸過程的安全性等問題,不破壞電子數(shù)據(jù)真實性是需要通過專門技術(shù)來解決的。電子數(shù)據(jù)的收集、保全要在技術(shù)可靠的源頭上保障電子數(shù)據(jù)真實可靠性。電子數(shù)據(jù)生成、傳輸設(shè)備是否符合規(guī)范的標準進行安裝使用,其設(shè)備硬件的完整程度、軟件系統(tǒng)運行成為電子數(shù)據(jù)的可靠性檢驗的要求。例如在案中
,法院參酌其他實務(wù)上的見解,認為一個可靠的過程,是可重復、可信賴或具有一致性的過程,提出證據(jù)的一方必須證明該數(shù)據(jù)的可靠性 (reliability)作為合適的基礎(chǔ)(proper foundation),合適的基礎(chǔ)必須是由可靠的設(shè)備,在日常業(yè)務(wù)活動有規(guī)律的實施中所記錄與保存的數(shù)據(jù),并且由管理人或其他有資格的證人出面作證,而這些數(shù)據(jù)還必須符合連續(xù)性及負責盡職性(conscientiously)。自然語言具有不確定性,但自然語言中的不確定性,不妨礙人們正確理解自然語言所表達的內(nèi)容,也不妨礙人們思維推理的進行,因為人們是借助語言進行思維的,通常并不涉及過多的數(shù)學運算,不確定性人工智能可以解決語言文字中不確定性的形式化問題。分析基于不確定性人工智能獲取語言性電子數(shù)據(jù)的可信性,需要從自然語言和人工語言兩個角度來看。
(1)從自然語言的角度看,不確定性人工智能獲取電子數(shù)據(jù)的可信性主要表現(xiàn)在以下兩方面: 一是不確定性人工智能對自然語言不確定的判斷。“語言的不確定性”是自然語言的普遍特征。Halliday在早期系統(tǒng)功能語法描寫中提出了“蓋然性”、“近似性”的概念,說明詞匯的開放集合特征、方言學里兩個因素的特征、兩極歸一性方法不能準確處理的語言事實,如人際功能系統(tǒng)的語氣系統(tǒng)和情態(tài)系統(tǒng)里的多層次、多級別、多選項特征。
在文本層面,法國哲學家德里達指出,表意(signification) 總是一個指稱其他符號的過程,沒有僅指一個符號本身的符號,他認為這個過程是無盡頭的參照過程,永遠找不到意義本身。 語言文字中的不確定性,并沒有妨礙我們的理解,反而會給人們帶來無限的遐想。例如,唐代王勃的詩句“落霞與孤鶩齊飛,秋水共長天一色”,展現(xiàn)了一幅優(yōu)美的畫卷,這是精確數(shù)字無法替代的。不僅如此,一些自然語言在不同領(lǐng)域使用的不一致也會導致潛在且不必要的混淆。二是不確定性人工智能對司法常識的判斷。人工智能領(lǐng)域普遍認為,有無常識是人和機器的根本區(qū)別之一,人的常識知識能否被物化,將決定人工智能最終能否實現(xiàn)?!霸谌祟惏盐帐澜绲母鞣N方式中,常識是一種最基本和最普遍的方式,它是其他的各種方式(神話、宗教、藝術(shù)、科學、哲學、倫理等)得以形成和發(fā)展的基礎(chǔ)?!背WR作為“普通、平常但又持久、經(jīng)常起作用的知識”,來源于經(jīng)驗,符合于經(jīng)驗,依附于經(jīng)驗,其最本質(zhì)的特性就是經(jīng)驗性。正是在此意義上, 我們常常把經(jīng)驗與常識連用, 稱為“經(jīng)驗常識”。這其中也有著太多的不確定性。如當代科學哲學家瓦托夫斯基說:“常識性知識的特征就在于:它既不是明確地系統(tǒng)的,也不是明確地批判的,就是說,既沒有把它的所有各個部分同所有其他部分聯(lián)系起來,也沒有自覺地企圖把它當做一個首尾一貫的真理體系。”另外,常識告訴人們的往往是表象,而不是本質(zhì)。常識雖然“在一定的限制內(nèi)足夠精確,但它很難含有那種對事實為什么是它們被斷言的那樣的說明”。常識更多地讓人們“知其然”而不“知其所以然”。更要注意的是,“常識有錯的概率其實很高, 不僅因為時代的變遷,也因為認識的局限?!倍淮_定性人工智能只有將這些司法常識物化,才能真正實現(xiàn)人工智能推理判斷。例如,法官判斷案件事實重要的推理規(guī)則——經(jīng)驗法則,是人們從生活經(jīng)驗中歸納獲得的關(guān)于事物因果關(guān)系或?qū)傩誀顟B(tài)的法則或知識。經(jīng)驗法則包括一般人日常生活所歸納的常識。不確定性人工智能對于這些常識的判斷,需要存在由大量背景信息(包含常識)所組成的“知識庫”。特文寧教授認為“一個知識庫”不是由那些業(yè)已經(jīng)過了單獨、實證檢驗并且已經(jīng)清楚明確地作出的命題所組成的;相反,從個人和集體的角度看,在我們的頭腦中都存在著一些錯誤定義的信息板塊,而這些就典型地構(gòu)成了一個知識庫,它是一個容納了具有良好理由的信息、深思熟慮的模式、逸聞趣事的記憶、影響、故事、神話、愿望、陳腔濫調(diào)、思考和偏見等諸多內(nèi)容的復雜的大雜燴。經(jīng)驗法則本身不是法官作出裁決的事實根據(jù),而是法官判斷案件事實重要的推理規(guī)則,那么對于“利害關(guān)系”的分析,如果提供證據(jù)的主體與案件有利害關(guān)系,主體的可信性必然會受到影響,進而影響到其所提供證據(jù)的證明力。
(2)從人工智能的人工語言角度來看,人工語言是一類適應(yīng)于人工智能和知識工程領(lǐng)域,使用符號處理和邏輯推理來編寫程序求解非數(shù)值計算、知識處理、推理、規(guī)劃、決策等具有智能的各種復雜問題的計算機程序設(shè)計語言。人工智能要解決的問題,需要建立一個包含事實和推理規(guī)則的知識庫,計算機程序根據(jù)環(huán)境和所給的輸入信息以及所要解決的問題來決定自己的行動。即借助計算機程序運行和人工智能算法能夠更為嚴格地執(zhí)行既定規(guī)則和邏輯。因此,人工智能是在環(huán)境模式的制導下的推理過程。雖然這種人工智能方法有極大自我解釋能力和學習能力,但是基于確定性人工智能的人機對話,存在的問題有兩個方面:一方面,迄今為止的語法都限于分析一個孤立的句子,無法有效地對上下文關(guān)系和談話環(huán)境對本句的約束和影響進行分析,因此分析語言歧義、話語省略、代詞的指向、同一句話在不同場合或由不同的人說出來,帶有的不同語氣所具有的不同含義等問題尚無明確規(guī)律可循,需要加強語用學的研究才能逐步解決。另一方面,人理解一個句子不是單憑語法,還運用了大量的有關(guān)知識,包括生活知識和專門知識,這些知識無法全部貯存在計算機里。這些問題不是一個容易的問題,需要運用人工語言,通過盡可能多地告訴計算機關(guān)于世界的知識來解決。
以前人工智能是基于復雜的形式化符號,忽略了即使是嚴謹?shù)臄?shù)學也是用自然語言來作為元語言支撐這一事實。不確定性人工智能可以使用不同風格人工語言編程以及設(shè)計計算機系統(tǒng)將知識與其推理方式分開,即形成不確定性人工智能的“陳述知識表示”。既然陳述知識表示與程序的其余部分保持分開,甚至更像自然語言而不是像計算機編碼形式,因此,處理人機對話比較容易,而法律和法律觀點經(jīng)常發(fā)生變化,因此這對于法律適用來講特別重要。
科學的電子數(shù)據(jù)證據(jù)分析方法,既是有效發(fā)現(xiàn)、識別電子數(shù)據(jù)證據(jù)的前提,也是準確判斷電子數(shù)據(jù)證據(jù)價值、審視案件假說的基礎(chǔ)。法庭在認定證據(jù)、查明事實過程中,需要遵循科學、可行的證據(jù)評估方案,從而確定如何基于大量復雜的電子數(shù)據(jù)得出特定的結(jié)論。通過掌握科學的電子數(shù)據(jù)證據(jù)分析方法,堅持理性的司法證明規(guī)則,有助于確保有罪的人得到公正審判,無罪的人不受刑事追究。不確定性人工智能正是通過對問題域的貝葉斯網(wǎng)絡(luò)建模,用定性的語言概念替代定量的數(shù)值,形式化地表示電子數(shù)據(jù)信息中的規(guī)律性,使之能夠為事實判定者提供分析結(jié)果或者發(fā)現(xiàn)電子數(shù)據(jù)信息連接點,實現(xiàn)電子數(shù)據(jù)證據(jù)分析的科學化。
人們對法的模糊性的認識由來已久,有思想家留下了對事物模糊性的經(jīng)典詠嘆:“當上帝本人用人類的語言對他們說話時,他的意思雖然一定是明確的,但是通過傳達的朦朧媒介,也會使他的意思弄得含糊不清,疑問多端?!痹蛟谟凇澳:F(xiàn)象既來自用以觀察的器官,也來自事物的本身”。電子數(shù)據(jù)證據(jù)的推論到處都存在著不確定性,因為吉爾伯特以蓋然性為基礎(chǔ)構(gòu)建證據(jù)分類體系后,所有關(guān)于證據(jù)規(guī)則的論述都暗含著 “事實主張必然具有一定程度的蓋然性”的思維, 這種蓋然性通過逐層的推論最終轉(zhuǎn)移到結(jié)論中去。例如,在概率推理中常用言詞而不是用數(shù)字來表示電子數(shù)據(jù)證據(jù)的強度,因為我們沒有根據(jù)來提供精確的單一概率值甚或概率區(qū)間,對它們的不確定性給予了深刻的認識,威格莫爾對證明力的分級方法,就是模糊概率或分檔的例子。
正確認識過去事實的,只能通過對證據(jù)進行理性的推理而獲得,證據(jù)法領(lǐng)域中大量使用模糊概率的修飾語,例如:確信無疑、清楚可信的證據(jù)、合理根據(jù)等。由于不能提供任何種類與其關(guān)聯(lián)的精確且無爭議的數(shù)字概率,因此法庭裁決標準必定是模糊的。不確定性人工智能對電子數(shù)據(jù)證據(jù)的分析中,則充分利用規(guī)則表示概念之間的關(guān)系,即定性知識,其進行推理時不要求給出被控對象的嚴密的精確數(shù)學模型,也不要求給出主觀隸屬度,更不去創(chuàng)造任何擴展了的模糊算子。由于電子數(shù)據(jù)規(guī)則發(fā)生器中的前件和后件中的概念,都可能含有不確定性,因此不確定性人工智能在輸入一個特定的條件激活多條定性規(guī)則時,通過推理引擎,即實現(xiàn)帶有不確定性的推理和控制。每次得到的輸出控制值都具有不確定性,這正體現(xiàn)了不確定性推理的本質(zhì)。
隨機性和模糊性是不確定性的兩個基本特征。因此,需要用概念的方法把握量的不確定性,這種方法比數(shù)學表達更真實、更具有普適性。由于人腦的思維不是純數(shù)學的,自然語言才是思維的載體,與概念直接關(guān)聯(lián)的語言值能夠起到濃縮認知的作用,將客觀世界進一步分類,并把概念結(jié)構(gòu)的復雜性降低到可以掌握的程度,對事物和現(xiàn)象的感覺和知覺,在頭腦中進行加工的過程中,概念起到了關(guān)鍵作用,以概念為基礎(chǔ)的語言、理論、模型是人類認知和理解世界的方法。這需要對計算機已有的嵌入式、傳統(tǒng)的人機交流的處理證據(jù)方式進行改進。
不確定性人工智能技術(shù)為電子數(shù)據(jù)的司法證明分析過程提供了科學性模型,即電子數(shù)據(jù)的定性定量轉(zhuǎn)換的認知模型——云模型, 在這種證據(jù)分析模型中存有已經(jīng)被驗證了的知識和推理方式,實現(xiàn)了定性概念與定量數(shù)值之間的雙向轉(zhuǎn)換。即在論域空間中,大量云滴構(gòu)成的云,可伸縮、無邊沿,遠觀有形,近看無邊,與自然現(xiàn)象中的云有著相似之處,所以用“云”來命名概念與數(shù)值之間的數(shù)學轉(zhuǎn)換是很自然的。云成為運用語言值表示的某個定性概念與其定量表示之間的雙向認知模型,用以反映自然語言中概念的不確定性,不但可以通過經(jīng)典的概率論和模糊數(shù)學給出解釋,而且反映了隨機性和模糊性之間的關(guān)聯(lián),尤其是用概率的方法去研究模糊性,構(gòu)成定性和定量之間的相互映射。具體而言,在海量電子數(shù)據(jù)集合中,用隸屬度來刻畫亦此亦彼的程度,隸屬度相對于概率論中非此即彼的假設(shè),是認識上的一大進步。
“在證明科學領(lǐng)域利用貝葉斯定理對事實裁判者的認知過程加以量化, 便成為這種‘古典蓋然性’證明理論的現(xiàn)代化身”。但證據(jù)不是以統(tǒng)計意義上的概率為基礎(chǔ)來計算的,什么是證據(jù)或什么不是證據(jù)需要根據(jù)特定情況去判斷。我們所需要的不是計算每個命題真假可能性的數(shù)字方法,而是判斷包含案件中所有相關(guān)證據(jù)的每個推論權(quán)重的整體方法,統(tǒng)計學家A.瓦爾德在1950年提出一種數(shù)理統(tǒng)計學的理論后,司法證明科學中將貝葉斯定理運用于證明責任以及在證據(jù)信息不確定情形下作出的判決。尤其是1986年J.Pearl教授通過對拓撲結(jié)構(gòu)圖和變量條件獨立之間關(guān)系的研究后,提出了貝葉斯網(wǎng)絡(luò)(Bayesian networks,簡稱BNs),BNs便成為不確定性電子數(shù)據(jù)的重要分析工具。
不確定性是訴訟的固有主觀特征, 無論貝葉斯定理與我們在其他自然科學探索中所使用的方法有何不同, 它都為我們分析司法證明過程提供了幫助。
基于貝葉斯網(wǎng)絡(luò)的不確定性人工智能將論證網(wǎng)絡(luò)中推論的鏈接在一起。實現(xiàn)從整體上評價雙方的論證,以判斷一方或另一方是否履行了相應(yīng)的證明責任。假設(shè)在獲得電子數(shù)據(jù)證據(jù)的情況下,要重新評估待證事實的相關(guān)性概率,根據(jù)BNs, 電子數(shù)據(jù)證據(jù)的相關(guān)性主要取決于其能在多大程度上改變預先的可能性,而這又取決于假定該電子數(shù)據(jù)證據(jù)所主張的事實確實存在, 以及人們能夠在多大程度上獲得該項電子數(shù)據(jù)證據(jù)。這個概率稱為后驗概率(posterior probability),因為它關(guān)注的是我們獲得這一新證據(jù)之后這個命題的概率。為了確定后驗概率,需要兩個要素。首先是先驗概率(prior probability),它表示在獲得新電子數(shù)據(jù)證據(jù)之前對這個命題為真的確信程度。其次是似然度(likelihood),它表示電子數(shù)據(jù)在把先驗概率轉(zhuǎn)變?yōu)楹篁灨怕蔬^程中的強度和力度。從刑事證據(jù)分析來看, 電子數(shù)據(jù)證據(jù)分析的起點對犯罪嫌疑人所做的是無罪推定, 那么概率賦值為零, 隨著其他證據(jù)的不斷發(fā)現(xiàn),概率值亦發(fā)生變化。威格莫爾正是通過運用精心的邏輯來找尋推論之事實支持的方式發(fā)展出了用于組織和評估訴訟證據(jù)的第一套體系。他認為,推理鏈條中待證事實之間的聯(lián)系本質(zhì)上是蓋然性的,即推理鏈條中包括可疑來源或不確定性,他用言語而非數(shù)字描述了這些概率聯(lián)系的強度。在很多場合中,我們沒有根據(jù)來給某些事件分配精確的數(shù)字化概率,但又希望向其他人傳達我們關(guān)于這些事件可能性的信念時,我們都會這樣做。但威格莫爾也使用“力量(force)”這個術(shù)語來描述這些概率性聯(lián)系的強度。一直以來,電子數(shù)據(jù)專家都認為本應(yīng)可以預測到美國“911”事件的發(fā)生,因為美國情報機構(gòu)已經(jīng)收到一些信息,但他們未能“連接信息點(connect the dots)”,或者無法從大量數(shù)據(jù)中鑒別出某些有意義的瑣事,這些信息從各種渠道流入不同的機構(gòu)。如今大數(shù)據(jù)時代,數(shù)據(jù)流規(guī)模已經(jīng)大到無法在一定時間內(nèi)用常規(guī)數(shù)據(jù)庫或者數(shù)據(jù)倉庫的軟件工具對其內(nèi)容進行抓取、管理和處理,并快速獲取有價值的信息。而數(shù)據(jù)庫和數(shù)據(jù)倉庫規(guī)模的迅速擴大,必然導致“數(shù)據(jù)豐富,信息貧乏,缺少知識”的尷尬局面。于是,從數(shù)據(jù)庫中發(fā)現(xiàn)知識(Knowledge Discovery in Database, KDD)成為技術(shù)熱點。根據(jù)系統(tǒng)科學中“結(jié)構(gòu)決定功能”原理,可以將電子數(shù)據(jù)信息的元素抽象為節(jié)點,元素之間的關(guān)系視為連接,系統(tǒng)就構(gòu)成一個具有復雜連接關(guān)系的網(wǎng)絡(luò)。這些看似毫不相干、形態(tài)各異的真實電子數(shù)據(jù)信息網(wǎng)絡(luò)常常具有某些相同的拓撲性質(zhì),受制于某些基本的演化法則??梢杂猛負鋭菝枋鲭娮訑?shù)據(jù)信息節(jié)點間的相互作用,將區(qū)域內(nèi)電子數(shù)據(jù)視為拓撲勢的局部高勢區(qū),通過尋找被低勢區(qū)域所分割的高勢區(qū)域,實現(xiàn)電子數(shù)據(jù)信息網(wǎng)絡(luò)的劃分,可以發(fā)現(xiàn)電子數(shù)據(jù)間具有不確定性的重疊節(jié)點現(xiàn)象,進而對電子數(shù)據(jù)信息節(jié)點進行分析。
在大數(shù)據(jù)時代,電子數(shù)據(jù)信息節(jié)點的重要性是顯著的。有時少數(shù)度很大的關(guān)鍵節(jié)點決定著整個事實行為,絕大部分節(jié)點的度相對很小,構(gòu)成無標度數(shù)據(jù)信息網(wǎng)絡(luò),并不能簡單地把數(shù)據(jù)信息從它出現(xiàn)的語境中抽取出來,作為一般形式來使用。事實上,節(jié)點重要性不僅取決于節(jié)點自身的連接情況,還與鄰近節(jié)點的重要性相關(guān)。一些電子數(shù)據(jù)從表面看來可能不包含關(guān)鍵的證據(jù)信息,但是通過不確定性人工智能技術(shù)分析海量數(shù)據(jù),以及對多個數(shù)據(jù)庫進行綜合分析,最終完全可能通過推演得到關(guān)鍵的證據(jù)信息。區(qū)分生成假設(shè)與用可獲得的相反數(shù)據(jù)驗證它的必要性、信息過剩與相關(guān)和可信證據(jù)的缺乏產(chǎn)生的不同問題、歧義與不完整性之間的差異、對模糊證據(jù)進行選擇性解釋的價值,這些在具體案件中將會有一個存在爭議的主要或基本待證事實,我們稱為最終待證事實。用于決定原告或公訴人是否有權(quán)獲得救濟的法律規(guī)則,可被視為一個大前提。最終待證事實為小前提,如果電子數(shù)據(jù)證據(jù)對最終待證事實為真的確證,達到了所要求的確定性程度,那么裁決必須有利于公訴人或原告。
近些年來,人工智能雖然取得了很大成就,但許多是建立在確定性或者精確性基礎(chǔ)之上的機器智能,不斷暴露出因為其公理系統(tǒng)的強形式化,即所謂的嚴格、精確而帶來的諸多局限,尤其是不能模擬人類思維過程中的不確定性。而案例的多少,以及案例中電子數(shù)據(jù)信息點的分布,反映了推理和控制中最關(guān)鍵的控制點,實際上表現(xiàn)出了輸出和輸入之間的非線性關(guān)系的拐點。這類非線性關(guān)系常常很難形式化,更難用精確的數(shù)學函數(shù)表達出來,利用不確定性人工智能的電子數(shù)據(jù)分析可以解決這一難題。
在大數(shù)據(jù)時代,需要不確定性人工智能的解決方案,以便迅速、有效地發(fā)現(xiàn)電子數(shù)據(jù)的證據(jù)價值,因為“放在天平上的分量不是證據(jù)的數(shù)量而是由證據(jù)產(chǎn)生的蓋然性以及案件的全部環(huán)境決定的”。英國學者彼特·莫菲認為在民事案件中的證明標準就是,足以表明案件中負有法定證明責任當事人就其主張的事實上的真實性大于不真實性,即要求“或然性權(quán)衡”和“蓋然性占優(yōu)勢”的標準
。而蓋然性占優(yōu)勢證明標準意味著,凡是對于特定事實的存在有說服負擔的當事人,必須以證據(jù)的優(yōu)勢確立其存在。證據(jù)的優(yōu)勢與證人的多寡或證據(jù)的數(shù)量沒有關(guān)系。因為用于待證事實的證據(jù)不是一項數(shù)量標準,而是一項質(zhì)量標準,反映了證據(jù)的可信度和說服力。