劉偉偉,桑彥娟
(1.山西大學(xué) 哲學(xué)社會學(xué)學(xué)院,山西 太原 030006;2.中南大學(xué) 公共管理學(xué)院,湖南 長沙 410083)
大數(shù)據(jù)技術(shù)的蓬勃發(fā)展給科學(xué)哲學(xué)和技術(shù)哲學(xué)帶來了前所未有的挑戰(zhàn)和機(jī)遇,其中一個重要的問題就是關(guān)于其實(shí)在論基礎(chǔ)的考察,而這一問題在當(dāng)前國內(nèi)外研究中還比較薄弱。當(dāng)代科學(xué)實(shí)在論在超越傳統(tǒng)實(shí)在論立場的基礎(chǔ)上,從本體論、認(rèn)識論和方法論等各個層面上重建了實(shí)在論的思想大廈,進(jìn)而能夠?yàn)槲覀冄芯慨?dāng)代科學(xué)、技術(shù)問題提供重要的支撐。從實(shí)在論的角度上來看,大數(shù)據(jù)技術(shù)的實(shí)在性是在其“技術(shù)”的層面上突顯出其意義的,然而作為其核心的則是“關(guān)系實(shí)在”,即大數(shù)據(jù)技術(shù)所主要把握的是事物之間實(shí)在的“相關(guān)關(guān)系”,為此我們有必要對大數(shù)據(jù)技術(shù)的關(guān)系實(shí)在論基礎(chǔ)進(jìn)行深入研究。
大數(shù)據(jù)技術(shù)的實(shí)在基礎(chǔ)究竟是什么,這需要從“實(shí)在”概念本身說起。不同哲學(xué)家對于“實(shí)在”概念理解上的分歧造成了“實(shí)在”概念的不清,這使得“實(shí)在”的意義具有了多樣化的解讀模式,既然要對一種技術(shù)的實(shí)在基礎(chǔ)進(jìn)行探討,我們就有必要先從“實(shí)在”概念的理解入手對此問題進(jìn)行澄清。廣義上的“實(shí)在”概念有兩個方面的內(nèi)涵:一是“界定性或規(guī)范性的,即用相應(yīng)的其它概念來界定,突出‘實(shí)在’的獨(dú)立性、在先性和第一性”;二是“描述性或構(gòu)造性的,即用其它的實(shí)在基元或要素來描述,突出‘實(shí)在’的本質(zhì)特征、結(jié)構(gòu)或?qū)傩浴盵1]。第一種界定方法強(qiáng)調(diào)實(shí)在本身是可以獨(dú)立于其它一切事物的、具有第一性的概念。這種對于實(shí)在的定義是通過與其它事物定義的比較中得出的,這使其具有了普遍意義上的本體論色彩,其意義類似于我們一般所說的“本體”,這種實(shí)在觀本質(zhì)上是一種概念實(shí)在觀。但是,這里的“實(shí)在”存在“人工物悖論”,而大數(shù)據(jù)技術(shù)作為一種有人參與的“人工物”,是人類發(fā)揮主觀能動性而創(chuàng)造出來的心與物的結(jié)合體,這一點(diǎn)并不符合概念實(shí)在觀認(rèn)為實(shí)在“獨(dú)立于人類心靈”的基本原則,因而,我們顯然不能用概念實(shí)在觀來對于大數(shù)據(jù)技術(shù)的本質(zhì)進(jìn)行定義。
第二種界定方法,是從“殊相”的角度去定義實(shí)在,這種定義方法更加側(cè)重以實(shí)在所表示事物的性質(zhì)的描述作為界定實(shí)在的依據(jù)。這里的“實(shí)在”,并不具有一般哲學(xué)意義上的“本體”含義,這種定義實(shí)在的方法可以解決概念實(shí)在觀所可能出現(xiàn)的“空名”、語義上的悖論和概念解釋不清等問題,因此它也被叫做性質(zhì)實(shí)在觀。性質(zhì)實(shí)在觀是對概念實(shí)在觀的發(fā)展,它意味著個體的實(shí)在性是關(guān)于其性質(zhì)的實(shí)在性,即“性質(zhì)”本身就是一種實(shí)在。性質(zhì)實(shí)在觀還使得“實(shí)在”所表示的范圍有所擴(kuò)大,這一點(diǎn)為科學(xué)實(shí)在和技術(shù)實(shí)在的豐富內(nèi)涵奠定了基礎(chǔ),“科學(xué)實(shí)在是在人的活動中經(jīng)由物理操作和心智操作而建構(gòu)起來的。它是人的感性物質(zhì)活動和理性思維活動的共同結(jié)果?!盵2]113-116也就是說,“科學(xué)實(shí)在”的建立不僅基于人類物質(zhì)性的活動,而且也依賴于人本身的主觀能動性和思維活動。
對于大數(shù)據(jù)科學(xué)而言,其實(shí)在基礎(chǔ)就是數(shù)據(jù)之間的隱含關(guān)系及其內(nèi)在規(guī)律。那么數(shù)據(jù)是什么?數(shù)據(jù)本身就是事實(shí),事實(shí)就是世界的本原,即數(shù)據(jù)是世界的本原。關(guān)于數(shù)據(jù)的本質(zhì),當(dāng)今學(xué)界有兩種觀點(diǎn):一是表征論,二是關(guān)系論。表征論認(rèn)為數(shù)據(jù)表征事實(shí),“表征”可以簡單地理解為“表現(xiàn)、體現(xiàn)或者反映”,也就是說數(shù)據(jù)只是單純反映事實(shí)本身。國內(nèi)學(xué)者黃欣榮教授認(rèn)為,“數(shù)據(jù)從本質(zhì)上來說應(yīng)該是主體對物質(zhì)客體世界的一種主觀建構(gòu),是我們?nèi)祟惱米约旱闹饔^能動的意識對客觀物質(zhì)及其關(guān)系的一種數(shù)量描述”[3];關(guān)系論認(rèn)為,數(shù)據(jù)的本質(zhì)是關(guān)系,數(shù)據(jù)是反映事物之間關(guān)系的,而不是僅僅反映事實(shí)本身,數(shù)據(jù)是信息的載體,數(shù)據(jù)以反映信息為其核心宗旨,大數(shù)據(jù)技術(shù)無需單純描摹簡單事實(shí),而是需要將海量數(shù)據(jù)承載的信息進(jìn)行析取、整合,并根據(jù)結(jié)果分析出事實(shí)之間的關(guān)系,以便人們更好地了解和認(rèn)識這個世界。盡管如此,科學(xué)不同于技術(shù),大數(shù)據(jù)科學(xué)也不同于大數(shù)據(jù)技術(shù)??茖W(xué)的發(fā)展需要進(jìn)行大量的研究和實(shí)驗(yàn),而進(jìn)行各種各樣的科學(xué)活動就免不了會運(yùn)用一些儀器和設(shè)備,這些儀器和設(shè)備正是作為技術(shù)的表征而出現(xiàn)的。以大數(shù)據(jù)科學(xué)為例,它與計(jì)算機(jī)科學(xué)的發(fā)展是密不可分的,計(jì)算機(jī)系統(tǒng)將具體的事物現(xiàn)象轉(zhuǎn)化為抽象的數(shù)據(jù),其算法、集群體系、計(jì)算框架和數(shù)據(jù)管理方法等都是用來集中處理大量數(shù)據(jù)信息的,這正是信息科學(xué)對大數(shù)據(jù)技術(shù)的影響。在此過程中,信息化的進(jìn)步促進(jìn)了數(shù)據(jù)的增長,而數(shù)據(jù)的增長又促進(jìn)了大數(shù)據(jù)技術(shù)的迅速發(fā)展?!按髷?shù)據(jù)”本身具有規(guī)模性、多樣性、高速性和價值性特征,這些特征決定了大數(shù)據(jù)科學(xué)理論最終是要應(yīng)用于社會且服務(wù)于大眾的。具體來說,“大數(shù)據(jù)”的存在具有工具性和價值性的兩個維度,“從工具維度看,大數(shù)據(jù)是研究方法……從價值維度看,大數(shù)據(jù)是潛在資源”[4],這兩個維度的真正實(shí)現(xiàn)都必須依托于大數(shù)據(jù)技術(shù)。
由此可見,大數(shù)據(jù)技術(shù)以大數(shù)據(jù)科學(xué)的發(fā)展為依托,而大數(shù)據(jù)技術(shù)的實(shí)在基礎(chǔ)也不同于其大數(shù)據(jù)科學(xué)的實(shí)在基礎(chǔ)。在這一點(diǎn)上,比利時哲學(xué)家霍托伊斯提出了與“純科學(xué)”相對的“技科學(xué)”概念,其意為帶有技術(shù)性質(zhì)的應(yīng)用基礎(chǔ)科學(xué)研究。在“技科學(xué)”出現(xiàn)之前,科學(xué)只是純粹的理論基礎(chǔ)研究,而“技科學(xué)”則是指“科學(xué)和技術(shù)相互雜合的各種實(shí)踐”[5],這一點(diǎn)充分凸顯了技術(shù)和科學(xué)之間的緊密聯(lián)系??茖W(xué)實(shí)在論研究的“科學(xué)實(shí)在”是指純科學(xué),純科學(xué)幾乎不涉及理論性結(jié)論的價值,而技科學(xué)是科學(xué)和技術(shù)的結(jié)合,甚至更偏向技術(shù)層面,具有價值關(guān)涉的客觀性。大數(shù)據(jù)技術(shù)就可以被歸類為這樣一種“技科學(xué)”,其實(shí)在基礎(chǔ)自然不能等同于一般的科學(xué)實(shí)在,而是更傾向于以技術(shù)本身而存在,“技術(shù)本身作為一種實(shí)在以及通過技術(shù)而顯現(xiàn)的實(shí)在”[6]77。那么,我們將大數(shù)據(jù)技術(shù)的實(shí)在基礎(chǔ),也就是大數(shù)據(jù)技術(shù)的本質(zhì)看作技術(shù)實(shí)在是否可行?對于技術(shù)本身而言,它可以被分為兩類:一是人工制品,狹義上是指人類制造出的工具、儀器等宏觀可見設(shè)備,對大數(shù)據(jù)技術(shù)來說,其依托的就是互聯(lián)網(wǎng)、計(jì)算機(jī)等電子設(shè)備,然而這些設(shè)備并不能等同于大數(shù)據(jù)技術(shù)本身;二是人工制品所營造出的一種虛擬環(huán)境,比如,電子屏幕上顯示的可以傳達(dá)信息的數(shù)字,制造商新開發(fā)的軟件和應(yīng)用等,這也叫“虛擬實(shí)在”。這兩種對技術(shù)的分類也分別可被叫做“一級技術(shù)實(shí)在”和“二級技術(shù)實(shí)在”(1)“二級技術(shù)實(shí)在”的概念由我國上海社會科學(xué)院的成素梅教授最先提出。, “技術(shù)實(shí)在一方面是指經(jīng)由人的技術(shù)活動而創(chuàng)造出來的具有實(shí)物形態(tài)的技術(shù)產(chǎn)品(主要指科學(xué)儀器)……另一方面,是指通過人的技術(shù)活動呈現(xiàn)出來的非實(shí)物形態(tài)的信息與環(huán)境”[2]113-116。一級技術(shù)實(shí)在具有實(shí)用性,二級技術(shù)實(shí)在具有再現(xiàn)性和對象性。大數(shù)據(jù)技術(shù)本身不是計(jì)算機(jī)這樣的人工制品,它需要通過挖掘數(shù)據(jù)以實(shí)現(xiàn)其在社會中的應(yīng)用,所以說大數(shù)據(jù)技術(shù)是二級技術(shù)實(shí)在,二級技術(shù)實(shí)在同時具有一級技術(shù)實(shí)在的具體可感性和“科學(xué)實(shí)在”的主客觀統(tǒng)一性,因此大數(shù)據(jù)技術(shù)也承接了科學(xué)實(shí)在和一級技術(shù)實(shí)在,大數(shù)據(jù)技術(shù)在非實(shí)物形態(tài)的技術(shù)活動的層面上可以說是技術(shù)實(shí)在,即大數(shù)據(jù)技術(shù)以技術(shù)活動呈現(xiàn)出來的虛擬環(huán)境的方式而存在。
把大數(shù)據(jù)技術(shù)的實(shí)在基礎(chǔ)當(dāng)成技術(shù)實(shí)在,也就是默認(rèn)大數(shù)據(jù)技術(shù)本身就是以二級技術(shù)實(shí)在形態(tài)存在,是否合理?這就又涉及技術(shù)本身是目的還是手段的問題。在這里,我們認(rèn)為技術(shù)更主要的是一種手段。原因在于,技術(shù)本來就比科學(xué)多了價值的屬性,“技術(shù)作為一種有用的、工具(無論是生產(chǎn)工具還是生活工具)性的實(shí)在,一定程度上含有工具論的色彩”[6]73。把自然物改造成人工物不是技術(shù)的最終目的,技術(shù)的工具性和功用性決定了效用是技術(shù)價值的核心。大數(shù)據(jù)技術(shù)是一種海量數(shù)據(jù)的采集、挖掘和處理的技術(shù),但如果大數(shù)據(jù)技術(shù)僅存在于“數(shù)據(jù)”這一層面,那么其功能也就沒有任何意義了,因?yàn)閿?shù)據(jù)本來就具有一定的“客觀實(shí)在性”,但數(shù)據(jù)背后的信息及其內(nèi)在的關(guān)系則是單獨(dú)的技術(shù)表征層面所不能揭示的。據(jù)此來看,大數(shù)據(jù)技術(shù)的實(shí)體實(shí)在具有一定的功能性,也就是某種實(shí)際的效用。這種效用決定了大數(shù)據(jù)技術(shù)是以什么樣的形式存在,而不只是單純的“技術(shù)”,“技術(shù)實(shí)在就應(yīng)該是一種在現(xiàn)實(shí)中實(shí)現(xiàn)其功能的工具或手段……是一種關(guān)系實(shí)在。”[6]74本質(zhì)上來看,這種關(guān)系就是工具手段和功能效用之間的關(guān)系,大數(shù)據(jù)技術(shù)作為工具手段具有一定的效用,它的效用取決于數(shù)據(jù)的功能。同時,數(shù)據(jù)既可以反映事實(shí),也可以表征關(guān)系,表征關(guān)系就是數(shù)據(jù)的功能之一,而大數(shù)據(jù)技術(shù)的效用就在于服務(wù)于人們用數(shù)據(jù)來表征事物之間關(guān)系的意圖,從價值論的角度來看,大數(shù)據(jù)技術(shù)實(shí)在的核心和基礎(chǔ)就是關(guān)系實(shí)在。
要想探究大數(shù)據(jù)技術(shù)如何表征事物之間具有實(shí)在性的“關(guān)系”,就要先從哲學(xué)史上的關(guān)系問題說起。關(guān)系本身有很多種,而因果關(guān)系和相關(guān)關(guān)系是人們最常見的兩種關(guān)系形態(tài)。那么,大數(shù)據(jù)技術(shù)是如何重構(gòu)事物之間的因果性關(guān)系的呢?回顧歷史,作為經(jīng)驗(yàn)論者,休謨認(rèn)為觀念和觀念之間相互連接,心靈從一個觀念過渡到另一個觀念共有三種性質(zhì):接近關(guān)系、相似關(guān)系和因果關(guān)系,其中因果關(guān)系在人類認(rèn)識世界的過程中所占的比例是最大的,“有關(guān)實(shí)際事情的一切推理似乎都是建立在因果關(guān)系上的”[7]。在實(shí)際生活中,人們往往把時間相近發(fā)生的事情看作是彼此之間具有某種關(guān)系,并且把發(fā)生在前面的事實(shí)或者行為自動當(dāng)成后發(fā)生的事實(shí)或者行動的原因,這使得一切具有相近關(guān)系的事物都可以處在因果關(guān)系之中??梢哉f,因果關(guān)系的確立來自于人直接的感覺經(jīng)驗(yàn),而因果關(guān)系也是人類一切科學(xué)知識的基礎(chǔ)。但是,休謨卻對因果關(guān)系的必然性產(chǎn)生了懷疑。原因在于,只是因?yàn)閮蓚€事實(shí)的發(fā)生在時間上相近,就能說明時間靠前的事件是靠后一個的原因么?為什么經(jīng)驗(yàn)會產(chǎn)生“事物必有因”的原則觀念?根據(jù)經(jīng)驗(yàn)主義的基本原則,人類一切知識都來自于人直接的感覺經(jīng)驗(yàn),那么關(guān)于事物因果關(guān)系的推論就來自于感覺經(jīng)驗(yàn)的印象,即恒常匯合的經(jīng)驗(yàn)。我們先對一種事物產(chǎn)生印象,然后再由這種印象推出另一事物的觀念。由此可見,這種恒常會合的經(jīng)驗(yàn)建立在我們的習(xí)慣和記憶之上,而并非通過理性推演獲得。因此,對于兩個在時間上接近的事物,我們只能假設(shè)它們之間具有一定的關(guān)系,但是不能由此判斷出它們一定存在因果關(guān)系。休謨因果問題的核心就是,把因果關(guān)系當(dāng)成切入點(diǎn),然后通過對因果關(guān)系建立過程中一切不證自明問題的懷疑,實(shí)現(xiàn)對因果關(guān)系本身的沖擊。嚴(yán)密的因果推理是理性的基礎(chǔ),懷疑因果關(guān)系相當(dāng)于懷疑理性,而康德正是建立了一個嚴(yán)密的知識體系來說明人在先天認(rèn)識范式的規(guī)范之下能夠形成普遍必然的知識,從而達(dá)到為理性做辯護(hù)的目的。在邏輯上,可以說康德基本解決了休謨問題,而在實(shí)質(zhì)上此問題仍然沒有得到真正的解決。在康德的時代,因果關(guān)系問題并未得到切實(shí)的解決,那么在數(shù)據(jù)時代和信息時代,人們能否在關(guān)于因果關(guān)系的哲學(xué)層面上得到新的突破呢?
眾所周知,因果關(guān)系是人類最常用的思維模式,“因果關(guān)系是解釋客觀世界中事物產(chǎn)生的現(xiàn)象和具有的本質(zhì)之間存在的某種普遍聯(lián)系中先后順序和互相制約的關(guān)系”[8]。正是因?yàn)橐蚬P(guān)系連接了現(xiàn)象與本質(zhì),所以因果關(guān)系才成為了一切科學(xué)和哲學(xué)問題的基礎(chǔ),這個基礎(chǔ)一旦被動搖,那么一切知識的產(chǎn)生基礎(chǔ)也就不存在了。在大數(shù)據(jù)技術(shù)的發(fā)展之下,普遍意義上的因果關(guān)系逐漸發(fā)生著變化,人們對事物的探索方式和思維也不僅僅限于傳統(tǒng)的因果關(guān)系了。關(guān)于因果關(guān)系,學(xué)界存在著多種不同類型的定義。張志林先生在《因果觀念與休謨問題》中提到三種最有研究價值的因果關(guān)系定義:馬奇定義、薩普斯定義和邦格定義。其中,馬奇定義可以被理解為一種決定論:“所謂原因是結(jié)果的一個非必要而充分的條件中的一個非充分而必要條件?!盵9]41他把原因看作是結(jié)果發(fā)生的一個條件。如果原因是A,結(jié)果是B,那么其充分條件則是A能推出B,在此充分條件中B又能推出A,其中原因和結(jié)果是一種單一的推理關(guān)系。薩普斯定義則傾向于概率論:“因?yàn)樽鳛樵蚴录腅1的出現(xiàn)會改變作為結(jié)果事件的E2出現(xiàn)的概率,亦即E1的出現(xiàn)會引起E2出現(xiàn)的概率發(fā)生改變,所以可以把E1和E2之間的因果關(guān)系界定為它們之間的某種特定的概率關(guān)系?!盵9]43在薩普斯定義中,原因和結(jié)果的對應(yīng)關(guān)系就不是那么完全確定了。如果原因是A,結(jié)果是B,它出現(xiàn)之后,只是增大了B出現(xiàn)的概率而已,并不是A發(fā)生之后B就一定會發(fā)生,這種概率論定義下的因和果不再一一完全對應(yīng)。邦格對因果關(guān)系的精確定義是:“令在時間T1和T2分別有事件E1∈Se(x)和E2∈Se(y),而且這些時間和事件都是相對于同一參考系而言的。又設(shè)物質(zhì)客體x對y施加了作用A(x,y)。我們說E1是E2的原因,當(dāng)且僅當(dāng):(1)T1≤T2;(2)E2∈A(x,y)?Se(y)。”[9]47這個定義用函數(shù)表示事件,事件E1和E2分別是兩個函數(shù)中的一個自變量,其中有A(x,y)的作用,當(dāng)時間T1在時間T2之前,且后發(fā)生的E2在A的作用下包含于S函數(shù)這兩個條件同時滿足,那么我們就可以說事件E1和事件E2之間有因果關(guān)系。這種因果關(guān)系可以總結(jié)為一個函數(shù)作用于另外一個函數(shù),這個作用是確定的。當(dāng)兩個條件都滿足的話,這個作用必然發(fā)生,事件E1和E2之間一定具有因果關(guān)系。當(dāng)然,邦格定義和馬奇定義的核心思想比較類似,它們都表示因果關(guān)系是確定的,而薩普斯定義則認(rèn)為原因只是在一定概率上促進(jìn)結(jié)果的發(fā)生。
本質(zhì)上來說,大數(shù)據(jù)技術(shù)對于因果關(guān)系的創(chuàng)新在原理上與薩普斯定義相類似。大數(shù)據(jù)技術(shù)的運(yùn)用使得更多的數(shù)據(jù)得以被人們發(fā)現(xiàn),而其中所承載著的眾多信息也更為清晰地呈現(xiàn)在人們面前。例如,人類在當(dāng)今時代一年所接觸的事件和信息的總量大大超過以前幾百年可以接觸到的信息總量,而在這么龐大的信息數(shù)據(jù)群中,數(shù)據(jù)所表征的事實(shí)之間是否還有非常確定的因果關(guān)系呢?具體來看,大數(shù)據(jù)技術(shù)可以實(shí)現(xiàn)對海量數(shù)據(jù)的動態(tài)化管理,而數(shù)據(jù)和數(shù)據(jù)之間不再具有確定的因果關(guān)系,這意味著事實(shí)與事實(shí)之間也不具有完全確定和對應(yīng)的因果關(guān)系了。例如,一個數(shù)據(jù)群的挖掘只是增加了另一個數(shù)據(jù)群所表征的事實(shí)發(fā)生的概率,二者并不一定連續(xù)發(fā)生。另一方面,數(shù)據(jù)之間的關(guān)聯(lián)性變?nèi)?,事物的“因”與“果”之間也不一定一一對應(yīng)了,可能出現(xiàn)一個原因?qū)?yīng)多個結(jié)果,一個結(jié)果有著多種原因。這種因果關(guān)系的復(fù)雜性始終存在,只不過人們以往并沒有對其加以充分的重視??傮w來看,在大數(shù)據(jù)技術(shù)的數(shù)據(jù)分析過程中,由于數(shù)據(jù)層面上的“平等性”和“客觀性”,人們不再簡單地追求數(shù)據(jù)與數(shù)據(jù)之間的簡單因果關(guān)聯(lián)。事實(shí)上這種“追求”在大數(shù)據(jù)分析本身的技術(shù)平臺中也是沒有任何意義的,因?yàn)槿藗兏嚓P(guān)注的是在大數(shù)據(jù)分析過程中數(shù)據(jù)之間的淺層表象“關(guān)聯(lián)”,而所謂的“因果性”關(guān)聯(lián)則需要借助于概率性的工具來加以判斷,且這種判斷在程度上、層次上和標(biāo)準(zhǔn)性等方面還需要依托于人為的主觀 “認(rèn)定”。由此可見,借助于智能化的、數(shù)據(jù)化的技術(shù)平臺而展開的概率性分析在對于事物的因果性認(rèn)知方面具有了顯著的變革,這使得人們在關(guān)于事物的因果性本質(zhì)認(rèn)識方面具有了新的實(shí)在論辯護(hù)路徑。
以因果關(guān)系為主導(dǎo)的傳統(tǒng)思維模式具有諸多弊端,這些弊端在大數(shù)據(jù)時代尤為明顯。對于因果關(guān)系而言,其最大的特點(diǎn)是時間上的“前后相繼”,人們要想探究真理,獲得真的知識,就必須對研究對象之間內(nèi)在的關(guān)系進(jìn)行探究。以科學(xué)實(shí)驗(yàn)為例,通常人們需要先設(shè)計(jì)實(shí)驗(yàn)步驟,設(shè)置變量組控制變量,然后對實(shí)驗(yàn)現(xiàn)象進(jìn)行觀察,收集數(shù)據(jù)。得到實(shí)驗(yàn)結(jié)果后,人們再對實(shí)驗(yàn)結(jié)果進(jìn)行分析,這是根據(jù)結(jié)果來推斷原因的真理追求過程。問題在于,這種由果推因的方法一旦推及到別的領(lǐng)域當(dāng)中的時候,就未必正確了。首先,想要推測一個事件發(fā)生的原因,就要先假設(shè)和推測,然后再想辦法來證明假設(shè)的合理性。對于一個結(jié)果可能出現(xiàn)的原因,人們會提出多個假設(shè),對每個假設(shè)都分別進(jìn)行驗(yàn)證是一個浩大的工程,龐大的工作量會消費(fèi)極多的人力、物力和財(cái)力,而且還不一定會得到正確的結(jié)果。一旦假設(shè)的出發(fā)點(diǎn)出現(xiàn)一點(diǎn)差錯,后面的探究之路就完全偏離了正確的軌道,可謂“失之毫厘,謬以千里”。其次,環(huán)境的變化對于原因的探究也會產(chǎn)生影響。兩個事物之間的因果關(guān)系和環(huán)境的關(guān)系是非常緊密的,一旦因果關(guān)系產(chǎn)生的環(huán)境發(fā)生變化,此關(guān)系就可能不復(fù)存在。最后,對單純因果關(guān)系的探究并不能讓人們認(rèn)識到某些現(xiàn)象背后所隱藏著的深層次的內(nèi)在關(guān)聯(lián),一些事物之間的關(guān)系不只是由A一定能推出B那么簡單,而相關(guān)關(guān)系分析則可以較好地解決以上問題。
前面已經(jīng)說到大數(shù)據(jù)技術(shù)重構(gòu)了因果關(guān)系的確定性,將不同事物之間的確定關(guān)系由決定論引向了概率論,事物之間的聯(lián)系沒有那么緊密且對應(yīng)了,即使兩個事物之間仍具有因果關(guān)系,但是前一個事件也只是增加后一個事件發(fā)生的概率而已。那么,這兩個事件還能不能在嚴(yán)格意義上被稱作具有因果關(guān)系呢?我們認(rèn)為可以,因?yàn)橄嚓P(guān)關(guān)系和因果關(guān)系并不是截然對立的。以往,相關(guān)關(guān)系被看作是一種和因果關(guān)系有著明顯區(qū)別和分界的關(guān)系類型,但相關(guān)關(guān)系實(shí)際上是一種關(guān)聯(lián)性較弱的因果關(guān)系,大數(shù)據(jù)技術(shù)的運(yùn)用很好地體現(xiàn)了這一點(diǎn),數(shù)據(jù)本身就是碎片化和去中心化的,碎片之間擁有平等的地位,不可互相取代,它們很難形成有序的體系,因此也很難具有強(qiáng)相關(guān)關(guān)系?;蛘哒f,相關(guān)關(guān)系其實(shí)是一種弱因果關(guān)系。在相關(guān)關(guān)系尚未引起人們重視的年代,事物之間的相關(guān)關(guān)系只是一個模糊的概念而已,因?yàn)椴痪哂幸蚬P(guān)系的確定性,相關(guān)關(guān)系很難被量化。相反,大數(shù)據(jù)技術(shù)的產(chǎn)生,將具有相關(guān)性的事物之間的相關(guān)度轉(zhuǎn)化為具體的度量數(shù)值,這在一定程度上就可以把相關(guān)關(guān)系進(jìn)行量化。那么,大數(shù)據(jù)技術(shù)是如何具體體現(xiàn)事物之間的相關(guān)關(guān)系呢?維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時代》一書中說:“相關(guān)關(guān)系的核心是量化兩個數(shù)據(jù)值之間的數(shù)理關(guān)系?!盵10]也就是說,大數(shù)據(jù)技術(shù)是通過對數(shù)據(jù)的收集,并觀察不同數(shù)據(jù)值的變化來確定數(shù)據(jù)背后所代表的事實(shí)之間的關(guān)系的。當(dāng)兩個事實(shí)背后的數(shù)據(jù)增長或減少成正比的時候,二者之間的相關(guān)關(guān)系較強(qiáng);當(dāng)兩個事實(shí)背后的數(shù)據(jù)變化沒什么關(guān)系,互不影響,就說明二者之間的相關(guān)關(guān)系較弱,我們用函數(shù)值表示就是:
其中,R是關(guān)系參數(shù),N是變化趨勢。N越大,說明數(shù)據(jù)x,y的變化是成正比的(x增大時y也增大,x減小時y也減小),R的值也越大,即二者相關(guān)關(guān)系很強(qiáng)。N越小則相反。P是概率,N越大,相關(guān)關(guān)系越強(qiáng)烈,x變化引起y變化的概率也越大。當(dāng)然,一個數(shù)據(jù)值增大時,另一個數(shù)據(jù)值也增大,這并不代表它們之間必然會有相關(guān)關(guān)系,因而我們對于數(shù)據(jù)變化情況進(jìn)行觀察的時候,很難在其中發(fā)現(xiàn)穩(wěn)定的、可靠的規(guī)律。
總體來說,大數(shù)據(jù)技術(shù)的“關(guān)系實(shí)在”在“本體性”上更傾向于表征事物之間的相關(guān)關(guān)系,同時它也使得人們的思維由因果思維向相關(guān)思維轉(zhuǎn)化。但是,過分注重相關(guān)關(guān)系也會出現(xiàn)一定的問題。例如,數(shù)據(jù)的變化并不具備穩(wěn)定可尋的規(guī)律。理論上,即使沒有相關(guān)性,兩個數(shù)值的變化也可能有關(guān)聯(lián)。另外,相關(guān)關(guān)系不像因果關(guān)系那樣有非常強(qiáng)烈的對應(yīng)性和確定性,因此,相關(guān)關(guān)系更具有復(fù)雜性,需要我們用復(fù)雜性科學(xué)的思維進(jìn)行深入的考察。當(dāng)然,相關(guān)關(guān)系探究起來也很容易出現(xiàn)錯誤,再加上數(shù)據(jù)的龐大及其變化的多樣性,人們往往會斷章取義,做出錯誤的判斷。由此可見,我們對于相關(guān)關(guān)系的把握需要立足于整體論的思想來進(jìn)行展開,而假如我們只局限于某一部分?jǐn)?shù)據(jù),或者當(dāng)數(shù)據(jù)樣本不夠大的時候,我們就很難從中得出真正有效的判斷,事實(shí)上,當(dāng)我們需要探究事物內(nèi)在的客觀規(guī)律時,“強(qiáng)相關(guān)性”的因果關(guān)系深層思考仍然是非常有價值的,只有平衡好因果性分析和相關(guān)性分析之間的關(guān)系,使二者盡量做到互相配合、協(xié)調(diào)統(tǒng)一,這樣才能夠在實(shí)踐當(dāng)中為關(guān)于事物的因果關(guān)系和相關(guān)關(guān)系探索建立起可靠的科學(xué)實(shí)在論基礎(chǔ),進(jìn)而為其它科學(xué)與哲學(xué)難題的求解發(fā)揮更大的作用。