陶亮
[摘 要]隨著人工智能技術(shù)的發(fā)展,數(shù)據(jù)的收集、保存、使用和表達(dá)大都需要借助智能技術(shù),使得當(dāng)前數(shù)據(jù)與傳統(tǒng)少量而孤立的數(shù)據(jù)形成了巨大差異,呈現(xiàn)出“智慧化”。但人與原始數(shù)據(jù)之間的距離亦被越來越多的智能設(shè)備不斷擴(kuò)寬,數(shù)據(jù)存在著偶然錯(cuò)誤、智能算法缺陷,或是人為而導(dǎo)致其導(dǎo)出結(jié)果不符合實(shí)際情況卻被人所相信的情形,即產(chǎn)生“數(shù)據(jù)陷阱”問題。隨著數(shù)據(jù)發(fā)展到第五階段,即智慧數(shù)據(jù)階段,數(shù)據(jù)陷阱問題進(jìn)一步突出。然而一方面人們?cè)谟^念上普遍迷信數(shù)據(jù),缺乏對(duì)數(shù)據(jù)陷阱問題的重視,并且,這不僅體現(xiàn)在人們的日常生活中,我國(guó)學(xué)界涉及數(shù)據(jù)陷阱的研究成果對(duì)比國(guó)外而言亦明顯過少;另一方面,對(duì)數(shù)據(jù)管理和數(shù)據(jù)表達(dá)的規(guī)范亦有所不足,對(duì)其的完善建議局限于對(duì)傳統(tǒng)中心化管理模式和平臺(tái)責(zé)任歸責(zé)模式的借鑒。對(duì)此,首先需要審慎看待數(shù)據(jù),破除數(shù)據(jù)迷信;其次,突出對(duì)數(shù)據(jù)陷阱問題的研究,使得對(duì)于數(shù)據(jù)陷阱的規(guī)制性立法更加具有針對(duì)性;再次,逐步轉(zhuǎn)變數(shù)據(jù)管理模式,依據(jù)區(qū)塊鏈等新的數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)管理做出積極的法律思考;最后,引進(jìn)和創(chuàng)造新的法學(xué)基本概念,借以解釋和發(fā)展新的數(shù)據(jù)表達(dá)制度。
[關(guān)鍵詞]數(shù)據(jù)陷阱;人工智能;區(qū)塊鏈
[中圖分類號(hào)]D90 [文獻(xiàn)標(biāo)志碼]A [文章編號(hào)]1000-8284(2020)01-0045-06
近幾年,人工智能引起了人們普遍的關(guān)注,特別是2016年AlphaGo擊敗世界圍棋冠軍、職業(yè)九段棋手李世石之后,可謂是一石驚起千層浪,無論是學(xué)界還是日常生活中,人工智能都成為熱門話題。并且,隨著人工智能技術(shù)的發(fā)展,“智慧互聯(lián)網(wǎng)”“智慧社會(huì)”被越來越多的人所提及和研究。同時(shí),數(shù)據(jù)領(lǐng)域也正發(fā)生著向“智慧數(shù)據(jù)”的轉(zhuǎn)型,數(shù)據(jù)的收集、保存和使用都借助了智能技術(shù)??梢哉f,當(dāng)代數(shù)據(jù)與傳統(tǒng)少量而孤立的數(shù)據(jù)形成了巨大差異,呈現(xiàn)出“智慧化”。但智慧數(shù)據(jù)所帶來的是否都是對(duì)人類有利之事?事實(shí)上,伴隨著人工智能的發(fā)展,人們將自己的權(quán)利越來越多的“讓渡”了出去,過于放心地將對(duì)數(shù)據(jù)的收集、處理交托給了機(jī)器,這使得人與原始數(shù)據(jù)之間的距離被越來越多的智能設(shè)備所不斷擴(kuò)寬。在這樣的背景之下,數(shù)據(jù)存在著或偶然或智能算法缺陷或人為導(dǎo)致其喪失客觀性,或?qū)С鼋Y(jié)果不符合實(shí)際情況卻被人所相信的情形,即產(chǎn)生“數(shù)據(jù)陷阱”問題,對(duì)此,亟須給與足夠的重視并思考問題的解決之策。
一、數(shù)據(jù)陷阱的歷史沿革
對(duì)于數(shù)據(jù)陷阱,目前學(xué)界還沒有統(tǒng)一的定義,但大體上的涵義即是指人們對(duì)數(shù)據(jù)過于信任所可能導(dǎo)致的風(fēng)險(xiǎn)和危機(jī)。其中,“數(shù)據(jù)”從字面上來說,由“數(shù)”和“據(jù)”兩部分所構(gòu)成。所謂“數(shù)”,即“數(shù)字”,對(duì)事物大小、數(shù)量等進(jìn)行計(jì)量;而“據(jù)”,即“根據(jù)”,也可以說是計(jì)量之語境、單位。因此,僅從字面上而言,所謂“數(shù)據(jù)”,即為有根據(jù)的數(shù)字,是具體事物與數(shù)字符號(hào)的結(jié)合體,使得數(shù)字在特定的語境之下表達(dá)出超乎符號(hào)本身的涵義。[1]
追溯歷史,數(shù)據(jù)陷阱問題在數(shù)據(jù)的伊始及初始階段是沒有意義的,問題具有討論意義乃是基于數(shù)據(jù)發(fā)展到了一定程度。筆者認(rèn)為,“數(shù)據(jù)”從古至今的發(fā)展可以分為五個(gè)階段。第一階段即為“數(shù)覺”。在古時(shí)人們就可以意識(shí)到事物的大小、多少。這種對(duì)世界自發(fā)進(jìn)行朦朧認(rèn)知的能力便為“數(shù)覺”,甚至根據(jù)調(diào)查,“數(shù)覺”也并非人類所獨(dú)有,[2]第二階段即人們運(yùn)用“數(shù)”“量”等具象化“數(shù)覺”之階段。此時(shí)人們可以對(duì)事物大小、數(shù)量作簡(jiǎn)單表達(dá),這也意味著人們對(duì)世界從自發(fā)的朦朧印象到自覺的簡(jiǎn)單觀察歸納。第三階段即為近代的“數(shù)據(jù)”,或稱為“小數(shù)據(jù)”。不同于“數(shù)”“量”等對(duì)世界的簡(jiǎn)單表達(dá),近代的“小數(shù)據(jù)”已經(jīng)具備所謂的“根據(jù)”,換句話說,其具備“語境意義”,而不是簡(jiǎn)單的符號(hào)。按照黃欣榮教授對(duì)數(shù)據(jù)的劃分,其屬于第二次數(shù)據(jù)變革的產(chǎn)物,即從生活數(shù)據(jù)轉(zhuǎn)變?yōu)榭茖W(xué)數(shù)據(jù)。[3]此三個(gè)階段即為筆者所謂數(shù)據(jù)的起源和初級(jí)階段。
數(shù)據(jù)陷阱于第四階段,即現(xiàn)代的“大數(shù)據(jù)”階段方才具備討論價(jià)值。在此階段,“大數(shù)據(jù)”與哪怕是第三階段的數(shù)據(jù),也即是近代意義上的“小數(shù)據(jù)”,都有著極大的差異,這種差異也不僅僅是體現(xiàn)在“量”上的“大”與“小”,更多的是一種質(zhì)的變化,這種質(zhì)變反映在獲取數(shù)據(jù)的速度、成本,以及數(shù)據(jù)所具備的經(jīng)濟(jì)效益、多樣性等各個(gè)方面。進(jìn)入大數(shù)據(jù)時(shí)代,表示以往的那種有目的的、大多需要依靠主動(dòng)收集才能取得少量數(shù)據(jù)的時(shí)代已經(jīng)成為過去式,數(shù)據(jù)已經(jīng)更多來源于隨時(shí)隨刻,看似無意義,卻隨時(shí)可能變廢為寶的采集。
第五階段的數(shù)據(jù)才可謂“智慧數(shù)據(jù)”,即當(dāng)代人工智能背景之下的大數(shù)據(jù),其不僅僅具有現(xiàn)代大數(shù)據(jù)的所有特性,同時(shí)由于人工智能技術(shù)的不斷發(fā)展,大量因?yàn)辇嫶?、冗雜而在以往無法計(jì)算和利用的數(shù)據(jù)變得能夠被調(diào)動(dòng)處理起來,但也是隨著人工智能技術(shù)的發(fā)展,產(chǎn)生了“算法黑箱”等人與數(shù)據(jù)之間的壁壘,使得人與初始數(shù)據(jù)的接觸機(jī)會(huì)被空前降低。此時(shí),“數(shù)據(jù)陷阱”問題被空前放大,并且這種放大的進(jìn)程并不會(huì)因?yàn)橹悄芗夹g(shù)的發(fā)展而消減,相反,智能技術(shù)越是發(fā)達(dá),數(shù)據(jù)越顯智慧,人與初始數(shù)據(jù)之間的距離就越容易被拉大,數(shù)據(jù)的采集、分類、統(tǒng)計(jì)、計(jì)算等過程就越是難以被把控和監(jiān)督,數(shù)據(jù)的客觀性就越是存疑,數(shù)據(jù)陷阱問題也會(huì)愈加突出。因此,對(duì)數(shù)據(jù)的收集、保存、使用和表達(dá)等方面均需更好地加以規(guī)范。而現(xiàn)有的規(guī)范方式,則可按照其對(duì)數(shù)據(jù)陷阱的作用方面,大致分為兩類:一是對(duì)數(shù)據(jù)管理的規(guī)范,即規(guī)范數(shù)據(jù)的收集、存放,保證數(shù)據(jù)源的安全,并對(duì)數(shù)據(jù)的使用進(jìn)行規(guī)范;二是對(duì)數(shù)據(jù)表達(dá)進(jìn)行規(guī)范,對(duì)不當(dāng)表達(dá)數(shù)據(jù)的行為進(jìn)行歸責(zé)。但針對(duì)這兩個(gè)方面所用的方法多是借鑒于圖書館管理模式等傳統(tǒng)管理模式,以及傳統(tǒng)商業(yè)廣場(chǎng)的平臺(tái)責(zé)任制度,而隨著“區(qū)塊鏈”等新的去中心化數(shù)據(jù)庫(kù)以及淘寶等互聯(lián)網(wǎng)購(gòu)物平臺(tái)的崛起,過去的研究范式作用正不斷降低,很多新的問題在法律上已然很難得到十分合理的解釋與解決。
二、數(shù)據(jù)陷阱法律規(guī)制的現(xiàn)實(shí)困境
向智慧數(shù)據(jù)轉(zhuǎn)型使得我們比以往任何時(shí)候都要更容易獲得和分析龐大的數(shù)據(jù),這些數(shù)據(jù)也不會(huì)僅僅對(duì)企業(yè)發(fā)揮作用。實(shí)際上,各種代表著“民意”和“專家意見”的數(shù)據(jù)對(duì)于我國(guó)法律和政策的制定都有著很大的影響,但這些數(shù)據(jù)是否與被采集者的真實(shí)意思一致?數(shù)據(jù)統(tǒng)計(jì)分類的模型是否足夠保證輸出結(jié)果客觀?面向智慧數(shù)據(jù)的轉(zhuǎn)型,人與初始數(shù)據(jù)之間的壁壘越加堅(jiān)固,導(dǎo)致數(shù)據(jù)陷阱問題日益成為當(dāng)今智慧數(shù)據(jù)時(shí)代下的巨大隱患,需要被充分認(rèn)識(shí)和解決。
(一)人們觀念上普遍存在對(duì)數(shù)據(jù)的迷信
在智慧數(shù)據(jù)階段,人們對(duì)數(shù)據(jù)的需要已經(jīng)遍布包括經(jīng)濟(jì)、政治、環(huán)境和健康事業(yè)的各個(gè)社會(huì)發(fā)展層面。[4]甚至在一定程度上,人們已經(jīng)對(duì)數(shù)據(jù)產(chǎn)生了迷信的心理。但數(shù)據(jù)的就是科學(xué)的?數(shù)據(jù)的就是客觀的?并不盡然。例如,谷歌曾對(duì)2011到2012年美國(guó)的流感病毒趨勢(shì)進(jìn)行大數(shù)據(jù)預(yù)測(cè),結(jié)果卻和實(shí)際相差甚大。[5]
并且,目前我國(guó)人們?cè)谟^念上普遍存在的對(duì)數(shù)據(jù)迷信的現(xiàn)象,不僅是體現(xiàn)在人們的日常生活中,在學(xué)界亦有著一定的表現(xiàn),這點(diǎn)可以在學(xué)界研究的重心上得到一定的印證。以中國(guó)知網(wǎng)作為檢索數(shù)據(jù)庫(kù),在高級(jí)檢索選定檢索范圍為“全文”,并輸入檢索詞匯“數(shù)據(jù)陷阱”,發(fā)表時(shí)間為“從2000到2018”(包括2018年所發(fā)表的期刊,下同),僅僅找到了61條結(jié)果。而同樣的條件之下,選定檢索詞匯為“數(shù)據(jù)”,共可找到9 214 297條結(jié)果之巨,并且總體呈現(xiàn)快速增長(zhǎng)的態(tài)勢(shì)。在中文文獻(xiàn)中發(fā)表時(shí)間“從2000到2018”的文獻(xiàn)增長(zhǎng)了約5.4倍;發(fā)表時(shí)間為“從2015到2018”也增長(zhǎng)了約66%。再以中文社會(huì)科學(xué)引文索引為檢索數(shù)據(jù)庫(kù),在高級(jí)檢索中設(shè)定為檢索“所有字段”,并輸入“數(shù)據(jù)陷阱”,限定學(xué)科類別為“法學(xué)”,發(fā)文年代選定“從2000至2018”,非精確檢索,甚至找不到一篇論文。而在同樣條件之下,更改“所有字段”欄為“數(shù)據(jù)”,則找到有505條結(jié)果之多,其中僅2018年就有64篇,可見我國(guó)學(xué)界近年來對(duì)于“數(shù)據(jù)”本體或者工具性的價(jià)值已經(jīng)相當(dāng)重視,并且這種重視程度大體是呈現(xiàn)上升姿態(tài)的,而對(duì)于“數(shù)據(jù)陷阱”問題卻少有提及,存在一定程度上的忽視。
反觀國(guó)外,由William S. Hein & Co.,Inc.公司出品HeinOnlion法學(xué)期刊全文數(shù)據(jù)庫(kù)被美國(guó)所有法學(xué)院所訂購(gòu),頗享盛名,可以作為檢索數(shù)據(jù)庫(kù)以供研究。在Advanced Search中選定“Full Text”一欄為“Date Trap”,Date欄為“2000to2018”,共找到30 298條結(jié)果之多。在同樣條件下,更改Full Text一欄為“Data”,則可找到1 103 615條結(jié)果??梢哉f國(guó)外涉及“數(shù)據(jù)陷阱”(Date Trap)的理論研究成果已經(jīng)占據(jù)了涉及“數(shù)據(jù)”研究成果的一定比例,這表示國(guó)外學(xué)者在重視“數(shù)據(jù)”本體或者工具價(jià)值的同時(shí),對(duì)“數(shù)據(jù)陷阱”問題同樣有著相當(dāng)程度上的重視。
對(duì)比國(guó)內(nèi)外關(guān)于“數(shù)據(jù)陷阱”的研究成果總量,可以發(fā)現(xiàn),相比于國(guó)外對(duì)數(shù)據(jù)陷阱所表示的重視態(tài)度,國(guó)內(nèi)對(duì)于數(shù)據(jù)陷阱的理論研究過于匱乏。當(dāng)然,本文這種對(duì)“數(shù)據(jù)陷阱”理論研究現(xiàn)狀的調(diào)查方法可能有所遺漏,但這至少?gòu)膫?cè)面反映了兩種可能,即第一,目前我國(guó)學(xué)界對(duì)面向智慧數(shù)據(jù)轉(zhuǎn)型下的“數(shù)據(jù)陷阱”問題還沒有做出及時(shí)的了解;第二,學(xué)界對(duì)于數(shù)據(jù)陷阱問題已經(jīng)有所了解,但是沒有引起足夠的關(guān)注,或者至少?zèng)]有認(rèn)為這個(gè)問題值得做出一定的理論思考。然而不論是哪種可能,結(jié)合當(dāng)前學(xué)界對(duì)數(shù)據(jù)或數(shù)據(jù)型研究的重視,無疑都反映出目前我國(guó)存在對(duì)數(shù)據(jù)有利之處的過度放大,和對(duì)數(shù)據(jù)背后陷阱一定程度上的無視。這說明,在科學(xué)研究向數(shù)據(jù)密集型發(fā)生著轉(zhuǎn)變的當(dāng)下,對(duì)比我國(guó)對(duì)數(shù)據(jù)的狂熱態(tài)度,以及國(guó)外對(duì)數(shù)據(jù)陷阱的重視程度,我國(guó)在一定程度上,人們存在著一定的“數(shù)據(jù)迷信”心理,即過于信任數(shù)據(jù)而導(dǎo)致缺乏對(duì)其背后“陷阱”的關(guān)注,這種現(xiàn)象是我國(guó)關(guān)于數(shù)據(jù)陷阱立法實(shí)踐工作的一大阻礙。
(二)實(shí)踐中對(duì)數(shù)據(jù)陷阱法律規(guī)制不足
正如前文所言,當(dāng)前我國(guó)對(duì)數(shù)據(jù)陷阱規(guī)制的立法依舊有著明顯的不足,并主要體現(xiàn)在兩個(gè)方面。首先是在數(shù)據(jù)管理方面,對(duì)數(shù)據(jù)源的保護(hù)以及對(duì)數(shù)據(jù)使用的規(guī)范并不完善;其次是在數(shù)據(jù)表達(dá)方面,對(duì)于故意或者過失造成的數(shù)據(jù)表達(dá)錯(cuò)誤還未建立完備的規(guī)制體系。并且,在智慧數(shù)據(jù)的大背景之下,如果依舊完全以傳統(tǒng)管理模式或者歸責(zé)模式對(duì)其進(jìn)行規(guī)制,將面臨諸多問題無法解決的尷尬境地。
1.數(shù)據(jù)管理立法上尚不完善。首先,在數(shù)據(jù)源保護(hù)性立法上,隨著互聯(lián)網(wǎng)與智能技術(shù)的發(fā)展,法律滯后的缺陷使得對(duì)數(shù)據(jù)源的保護(hù)性立法始終“慢一步”。就當(dāng)下而言,對(duì)數(shù)據(jù)源主要的污染風(fēng)險(xiǎn)可以分為兩類,一類即數(shù)據(jù)管理方造成的污染;另一類即為來自非管理方的污染。這些規(guī)制的不足使得對(duì)數(shù)據(jù)源的污染行為,既有被民法、行業(yè)規(guī)范規(guī)制,也有被刑法所規(guī)制的情況,關(guān)鍵點(diǎn)在于對(duì)污染行為本身的法律界定,但滯后的法律難以提供十分準(zhǔn)確的法律判斷根據(jù)。需要說明的是,非管理方對(duì)數(shù)據(jù)源的污染行為并非一定伴有惡意,比如谷歌運(yùn)用大數(shù)據(jù)預(yù)測(cè)流感乃是基于地區(qū)內(nèi)人們對(duì)“流感”之類詞匯的搜索,但現(xiàn)實(shí)中很多人搜索“流感”并不是因?yàn)樯磉叞l(fā)生了流感,而是對(duì)谷歌的此番作為感到好奇等原因。其次,在數(shù)據(jù)使用上,立法規(guī)制也并不完善。數(shù)據(jù)使用的第一個(gè)問題,就是誰有權(quán)使用什么數(shù)據(jù),而目前學(xué)界依舊對(duì)數(shù)據(jù)的權(quán)利界定和歸屬問題存在較大爭(zhēng)議,相關(guān)立法也有待進(jìn)一步完善。事實(shí)上,哪怕只是數(shù)據(jù)權(quán)利的界定和歸屬也并不是個(gè)容易一概而論的問題,比如科研領(lǐng)域數(shù)據(jù)權(quán)利的界定和歸屬、網(wǎng)絡(luò)聊天之中數(shù)據(jù)權(quán)利的界定和歸屬,甚至是各個(gè)數(shù)據(jù)庫(kù)之間數(shù)據(jù)權(quán)利的界定和歸屬等,很難歸納出同一個(gè)適用標(biāo)準(zhǔn)。
對(duì)此,目前一般以圖書館等傳統(tǒng)數(shù)據(jù)收集、存放、使用模式作為數(shù)據(jù)管理問題思考之視角。例如陳祖琴、蔣勛、蘇新寧2015年發(fā)表于《情報(bào)雜志》的《圖書館視角下的大數(shù)據(jù)資源共建共享》;周曉燕、宰冰欣2016年發(fā)表于《圖書館情報(bào)知識(shí)》的《澳大利亞高??蒲袛?shù)據(jù)保存政策分析》;邢文明、華小琴2018年發(fā)表于《知識(shí)管理論壇》的《澳大利亞高??蒲袛?shù)據(jù)政策內(nèi)容分析》,都是基于圖書館管理等傳統(tǒng)模式對(duì)當(dāng)下數(shù)據(jù)的管理進(jìn)行思考。這些研究成果雖是以不同的角度進(jìn)行研究,并最終對(duì)問題的解決提出了新的解決方法,但無可否認(rèn)的是,這些研究都是基于傳統(tǒng)管理模式,即傳統(tǒng)的數(shù)據(jù)收集、存放、使用模式,在這種模式之下,認(rèn)為數(shù)據(jù)的管理具有中心化機(jī)構(gòu),也即是一個(gè)類似于圖書館或者科研機(jī)構(gòu)對(duì)數(shù)據(jù)進(jìn)行管理,再借由一個(gè)專門的數(shù)據(jù)調(diào)度平臺(tái)對(duì)數(shù)據(jù)的使用進(jìn)行賦權(quán)和調(diào)度。然而事實(shí)上,區(qū)塊鏈等新興“去中心化”數(shù)據(jù)庫(kù)出現(xiàn),無疑對(duì)此類傳統(tǒng)管理模式形成了巨大的沖擊。