(中共山西省委黨校 理論研究室,山西 太原 030006)
“早在古希臘時(shí)代,西方學(xué)者即已自覺探討知識(shí)概念的內(nèi)涵。蘇格拉底堅(jiān)持從功能、 意義方面定義知識(shí), 認(rèn)為知識(shí)即人的智力、自我認(rèn)識(shí)和道德的修煉。”[1]其后有很多哲學(xué)家研究知識(shí)的定義和構(gòu)成條件,“知識(shí)構(gòu)成的三個(gè)條件分別是信念、真和證實(shí)?!盵2]國(guó)內(nèi)有學(xué)者在對(duì)知識(shí)不同概念的分析基礎(chǔ)上認(rèn)為,“知識(shí)是人類正確的認(rèn)識(shí)及合理運(yùn)用與組合的總和?!盵1]可以說,隨著社會(huì)的進(jìn)步,知識(shí)的內(nèi)涵在不斷發(fā)展。大數(shù)據(jù)時(shí)代,大數(shù)據(jù)來源于傳感器、互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、政府統(tǒng)計(jì)部門以及各專業(yè)醫(yī)療部門、金融部門、科研部門等。大數(shù)據(jù)成為知識(shí)新的來源,大數(shù)據(jù)技術(shù)對(duì)大數(shù)據(jù)的存儲(chǔ)、分析、挖掘、可視化等發(fā)現(xiàn)知識(shí),并將這些知識(shí)應(yīng)用于實(shí)踐。大數(shù)據(jù)知識(shí)是相對(duì)于傳統(tǒng)小數(shù)據(jù)知識(shí)而言的,其不僅追求對(duì)客觀實(shí)在的真實(shí)反映,而且還應(yīng)該保護(hù)不同主體的數(shù)據(jù)安全,最后還能解決現(xiàn)實(shí)的經(jīng)濟(jì)、環(huán)境、交通、醫(yī)療等治理問題。這樣大數(shù)據(jù)知識(shí)是真、善、效、美的統(tǒng)一。可以說,大數(shù)據(jù)知識(shí)是基于大數(shù)據(jù)被證實(shí)為真并具有善、效、美的命題或信念。“知識(shí)論的討論要能夠?qū)ふ页龃嬖谟谝磺锌赡艿闹R(shí)中的共同的本性。”[3]46大數(shù)據(jù)知識(shí)論在于尋找大數(shù)據(jù)知識(shí)中共同的本性。
圖靈獎(jiǎng)得主、美國(guó)計(jì)算機(jī)專家吉姆·格雷提出最著名的第四科學(xué)范式理論。在他看來,科學(xué)研究具有經(jīng)驗(yàn)、理論、計(jì)算機(jī)模擬和數(shù)據(jù)密集型科學(xué)四種范式。這四種范式也是知識(shí)實(shí)現(xiàn)的四種方法。對(duì)于知識(shí)論來講,我們不僅研究知識(shí)的發(fā)現(xiàn)問題,還研究知識(shí)的確證問題和實(shí)踐問題。傳統(tǒng)知識(shí)論主要側(cè)重研究認(rèn)識(shí)論層面知識(shí)主體如何發(fā)現(xiàn)知識(shí),如重視知覺、經(jīng)驗(yàn)、想象、理性等在知識(shí)發(fā)現(xiàn)過程中的作用。知識(shí)作為真的信念是需要確證的,知識(shí)的確證問題主要關(guān)注知識(shí)與經(jīng)驗(yàn)世界的相符合性等。知識(shí)的實(shí)踐問題關(guān)注知識(shí)的經(jīng)濟(jì)、社會(huì)、生態(tài)等方面價(jià)值。大數(shù)據(jù)時(shí)代,大數(shù)據(jù)知識(shí)的實(shí)現(xiàn)過程包括大數(shù)據(jù)知識(shí)的發(fā)現(xiàn)、確證和實(shí)踐,大數(shù)據(jù)知識(shí)的實(shí)現(xiàn)方法包括發(fā)現(xiàn)、確證和實(shí)踐三個(gè)層面,包括大數(shù)據(jù)歸納方法、基于關(guān)聯(lián)的因果分析方法和遞歸分析方法,不同方法解決不同的問題,彰顯大數(shù)據(jù)知識(shí)實(shí)現(xiàn)方法的新范式。
大數(shù)據(jù)方法起源于20世紀(jì)宇宙學(xué),當(dāng)時(shí)積累了大量觀測(cè)和計(jì)算機(jī)模擬數(shù)據(jù)。面對(duì)海量數(shù)據(jù),如何發(fā)現(xiàn)這些數(shù)據(jù)中的價(jià)值成為急需解決的時(shí)代課題,大數(shù)據(jù)方法因此登上歷史舞臺(tái)?!袄^演繹法和歸納法之后,大數(shù)據(jù)方法正在成為人類認(rèn)識(shí)和改造世界的新工具?!盵4]“傳統(tǒng)的數(shù)據(jù)通常是結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)(行數(shù)據(jù))是指存儲(chǔ)在數(shù)據(jù)庫(kù)里可以用二維表結(jié)構(gòu)來邏輯表達(dá)實(shí)現(xiàn)的數(shù)據(jù),大數(shù)據(jù)則是混合形態(tài)的數(shù)據(jù)。在大數(shù)據(jù)中,結(jié)構(gòu)化數(shù)據(jù)占15%,更多的則是非結(jié)構(gòu)化的數(shù)據(jù),如圖片、日志、音頻、視頻、地理位置等數(shù)據(jù),這些數(shù)據(jù)大都是非結(jié)構(gòu)化的?!盵5]“目前全世界的數(shù)據(jù)已經(jīng)有約75%都是非結(jié)構(gòu)化數(shù)據(jù)。”[6]大數(shù)據(jù)方法主要通過歸納結(jié)構(gòu)性和非結(jié)構(gòu)性大數(shù)據(jù),發(fā)現(xiàn)大數(shù)據(jù)中包含的潛在知識(shí)。這樣,大數(shù)據(jù)方法可以更準(zhǔn)確地說是大數(shù)據(jù)歸納方法。
(一)大數(shù)據(jù)歸納方法的重要性
不斷地發(fā)現(xiàn)知識(shí)和應(yīng)用知識(shí)是人類最本質(zhì)的特征之一。知識(shí)發(fā)現(xiàn)的途徑主要有歸納法和演繹法。演繹法主要從少量普遍且可靠的前提出發(fā),推演出眾多個(gè)別的結(jié)論。演繹法具有嚴(yán)謹(jǐn)和理性等特點(diǎn),但其致命缺點(diǎn)是強(qiáng)調(diào)推理,并不能使后驗(yàn)知識(shí)增加。歸納法主要通過對(duì)實(shí)驗(yàn)和經(jīng)驗(yàn)世界運(yùn)行狀況進(jìn)行歸納,從中找出事物發(fā)展的規(guī)律。但是,由于歸納的無(wú)窮量特征,如果有反例存在,歸納的結(jié)論就可能被證偽,這就需要修正原來的理論或者重新提出新理論。大數(shù)據(jù)歸納方法不是從某個(gè)前提推演出來,也不是對(duì)有限樣本的歸納。所以,大數(shù)據(jù)歸納方法不是傳統(tǒng)意義上的歸納法,大數(shù)據(jù)歸納方法主要對(duì)海量大數(shù)據(jù)進(jìn)行分析,是對(duì)經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界的解蔽。與傳統(tǒng)的歸納方法相比較,大數(shù)據(jù)歸納方法的重要性和特性是非常明顯的。
1.擴(kuò)大知識(shí)的來源。小數(shù)據(jù)時(shí)代,知識(shí)來源于數(shù)據(jù)量小、相對(duì)不復(fù)雜的結(jié)構(gòu)性數(shù)據(jù)。大數(shù)據(jù)時(shí)代,知識(shí)來源于結(jié)構(gòu)性大數(shù)據(jù)和音頻、視頻、聊天記錄等非結(jié)構(gòu)性大數(shù)據(jù)。大數(shù)據(jù)歸納方法是對(duì)結(jié)構(gòu)性和非結(jié)構(gòu)性大數(shù)據(jù)歸納基礎(chǔ)上的存儲(chǔ)、分析、挖掘和可視化,解蔽這些大數(shù)據(jù)中隱含的知識(shí)。大數(shù)據(jù)歸納方法擴(kuò)展了知識(shí)來源的渠道,使大量的非結(jié)構(gòu)性大數(shù)據(jù)成為知識(shí)新的來源,同時(shí)將結(jié)構(gòu)性和非結(jié)構(gòu)性數(shù)據(jù)整合起來發(fā)現(xiàn)潛在知識(shí)。正是大數(shù)據(jù)歸納方法對(duì)復(fù)雜大數(shù)據(jù)的歸納性凸顯出其強(qiáng)大的處理能力和歸納能力。
2.動(dòng)態(tài)的全樣本大數(shù)據(jù)突破傳統(tǒng)隨機(jī)數(shù)據(jù)的局限性。小數(shù)據(jù)時(shí)代,數(shù)據(jù)多來源于隨機(jī)采樣,這往往會(huì)產(chǎn)生樣本的局限性。大數(shù)據(jù)時(shí)代,通過對(duì)全樣本的海量大數(shù)據(jù)進(jìn)行分析,可彰顯對(duì)經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界圖景的全面新展示。目前,大數(shù)據(jù)歸納方法已應(yīng)用于政府治理、社會(huì)治理和企業(yè)治理等領(lǐng)域,如企業(yè)通過大數(shù)據(jù)歸納方法可以篩選出不合格的產(chǎn)品,也可以預(yù)測(cè)不合格產(chǎn)品的特征和分布等。
3.非預(yù)設(shè)能發(fā)現(xiàn)更多的潛在知識(shí)。小數(shù)據(jù)時(shí)代,我們先預(yù)設(shè)研究的目標(biāo)和前提,根據(jù)研究目標(biāo)去采集數(shù)據(jù),這個(gè)過程中會(huì)將不相關(guān)的數(shù)據(jù)過濾掉,目標(biāo)是很明確的,前提的預(yù)設(shè)使知識(shí)發(fā)現(xiàn)建立在預(yù)設(shè)條件的基礎(chǔ)之上。大數(shù)據(jù)時(shí)代,大數(shù)據(jù)知識(shí)的發(fā)現(xiàn)并沒有提前預(yù)設(shè)目標(biāo)和前提,而是“讓數(shù)據(jù)說話”。大數(shù)據(jù)倉(cāng)庫(kù)中包含結(jié)構(gòu)性和非結(jié)構(gòu)性大數(shù)據(jù),通過對(duì)復(fù)雜的大數(shù)據(jù)的分析,從而實(shí)現(xiàn)對(duì)經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界的認(rèn)知。因?yàn)闆]有預(yù)設(shè)目標(biāo)和前提,其全樣本性分析會(huì)發(fā)現(xiàn)我們預(yù)想不到的結(jié)果,如美國(guó)沃爾瑪超市發(fā)現(xiàn)蛋撻與啤酒的強(qiáng)相關(guān)性,因而通過對(duì)大數(shù)據(jù)分析會(huì)發(fā)現(xiàn)更多的潛在知識(shí)。
4.通過歸納彰顯客觀世界的相關(guān)關(guān)系。歸納方法的本質(zhì)在于發(fā)現(xiàn)事物發(fā)展現(xiàn)象背后的因果性和客觀規(guī)律。有專家認(rèn)為大數(shù)據(jù)知識(shí)來源于對(duì)現(xiàn)象的解蔽,外在世界的展示過程就是顯像的過程,而顯像可以通過揭示大數(shù)據(jù)之間的相關(guān)關(guān)系展示出來。這種相關(guān)性的展示,可能是偶然相關(guān)或必然相關(guān),也可能是強(qiáng)相關(guān)或弱相關(guān)。通過大數(shù)據(jù)歸納方法可以將經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界中大數(shù)據(jù)的相關(guān)性展示出來。有些強(qiáng)相關(guān)性反映事物發(fā)展的規(guī)律性,某種程度上是一種因果關(guān)系,這需要進(jìn)一步確證。
(二)大數(shù)據(jù)歸納方法發(fā)現(xiàn)大數(shù)據(jù)潛在知識(shí)的路徑
大數(shù)據(jù)知識(shí)實(shí)現(xiàn)過程包括大數(shù)據(jù)知識(shí)的發(fā)現(xiàn)、確證和實(shí)踐三個(gè)層面。大數(shù)據(jù)知識(shí)的發(fā)現(xiàn)主要通過大數(shù)據(jù)歸納方法來實(shí)現(xiàn)。大數(shù)據(jù)歸納方法通過對(duì)大數(shù)據(jù)的收集、存儲(chǔ)、分析、挖掘和可視化,發(fā)現(xiàn)大數(shù)據(jù)知識(shí)中包含的潛在知識(shí),其具體路徑體現(xiàn)為以下幾個(gè)方面。
從技術(shù)上看,大數(shù)據(jù)歸納方法是大數(shù)據(jù)技術(shù)的應(yīng)用。小數(shù)據(jù)時(shí)代,數(shù)據(jù)的采集、存儲(chǔ)、分析等多是依靠人,數(shù)據(jù)量較小,處理相對(duì)容易。大數(shù)據(jù)時(shí)代,海量大數(shù)據(jù)客觀要求一種新的技術(shù)能夠承擔(dān)對(duì)大數(shù)據(jù)存儲(chǔ)、分析等一系列工作,減輕人類腦力勞動(dòng)和體力勞動(dòng)的負(fù)擔(dān)。大數(shù)據(jù)技術(shù)正是在這種需求下誕生的。大數(shù)據(jù)技術(shù)包括大數(shù)據(jù)存儲(chǔ)技術(shù)、分析技術(shù)、挖掘技術(shù)和可視化技術(shù)等,正是依托大數(shù)據(jù)技術(shù),大數(shù)據(jù)歸納方法才可能實(shí)現(xiàn)。目前,大數(shù)據(jù)技術(shù)通過分布式算法實(shí)現(xiàn)對(duì)大數(shù)據(jù)進(jìn)行的一系列處理,在此過程中整合結(jié)構(gòu)性和非結(jié)構(gòu)性大數(shù)據(jù),實(shí)現(xiàn)對(duì)經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界的數(shù)據(jù)鏡像化,通過可視化技術(shù)將這種相關(guān)性展示出來。
從實(shí)現(xiàn)過程看,大數(shù)據(jù)歸納方法的運(yùn)用是多語(yǔ)境整合的過程。大數(shù)據(jù)歸納方法體現(xiàn)為對(duì)結(jié)構(gòu)性和非結(jié)構(gòu)性大數(shù)據(jù)的歸納,還彰顯為對(duì)歷史語(yǔ)境、倫理語(yǔ)境、技術(shù)語(yǔ)境、認(rèn)知語(yǔ)境、語(yǔ)言語(yǔ)境等的歸納。從經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界到大數(shù)據(jù),需要這些客觀世界的全樣本數(shù)據(jù),此過程需要?dú)v史語(yǔ)境中社會(huì)需要的支撐。由于一些大數(shù)據(jù)涉及國(guó)家安全、個(gè)人隱私和企業(yè)秘密等,對(duì)這些大數(shù)據(jù)的處理需要相應(yīng)的倫理語(yǔ)境作支撐,保障大數(shù)據(jù)的安全。大數(shù)據(jù)技術(shù)從技術(shù)層面實(shí)現(xiàn)對(duì)大數(shù)據(jù)的存儲(chǔ)、分析、挖掘和可視化等,沒有大數(shù)據(jù)技術(shù)就沒有大數(shù)據(jù)知識(shí)。人類認(rèn)知決定大數(shù)據(jù)知識(shí)發(fā)現(xiàn)可能的邊界,而從大數(shù)據(jù)到大數(shù)據(jù)潛在知識(shí)的展示,需要語(yǔ)言語(yǔ)境,即將潛在的知識(shí)用語(yǔ)言表征為顯性的知識(shí)。所以,大數(shù)據(jù)歸納方法的運(yùn)用不僅體現(xiàn)在技術(shù)層面,更多的體現(xiàn)在多語(yǔ)境的整合層面。
從實(shí)現(xiàn)結(jié)果看,大數(shù)據(jù)歸納方法實(shí)現(xiàn)對(duì)經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界潛在知識(shí)的表征。邁克爾·波拉尼將知識(shí)分為隱性知識(shí)和顯性知識(shí),通常以書面文字、圖表和數(shù)學(xué)公式加以表述的知識(shí),稱為顯性知識(shí);在行動(dòng)中所蘊(yùn)含的未被表述的知識(shí),稱為隱性知識(shí)。要確證知識(shí)和實(shí)現(xiàn)知識(shí)的價(jià)值,必須將隱性知識(shí)轉(zhuǎn)化為顯性知識(shí)。大數(shù)據(jù)歸納方法通過相關(guān)性發(fā)現(xiàn)客觀世界隱含的潛在知識(shí),需要通過語(yǔ)言、圖表、文字等形式將將這種知識(shí)表征出來,即在可視化表征基礎(chǔ)上通過語(yǔ)言的再加工形成大數(shù)據(jù)潛在知識(shí)。當(dāng)然,對(duì)于可視化結(jié)果我們需要理性地看,并不是所有的可視化結(jié)果都能成為潛在知識(shí)。這就涉及到下一個(gè)問題即關(guān)于知識(shí)的確證問題。
大數(shù)據(jù)知識(shí)發(fā)現(xiàn)過程客觀要求對(duì)全樣本共享的大數(shù)據(jù)進(jìn)行挖掘。由于這種特性,有些專家特別是大數(shù)據(jù)經(jīng)驗(yàn)主義者認(rèn)為,“用數(shù)據(jù)說話”“讓數(shù)據(jù)發(fā)聲”,僅依靠大數(shù)據(jù)就可以預(yù)測(cè)了。其實(shí),這是不夠的。原因在于事物之間的強(qiáng)相關(guān)性并非一定彰顯事物運(yùn)行的客觀規(guī)律,也就是說強(qiáng)相關(guān)性和知識(shí)之間并不是一一對(duì)應(yīng)關(guān)系。從相關(guān)程度看,有些事物之間的相關(guān)度是很低的,可以說是低相關(guān)性或偶然性相關(guān),這種相關(guān)性并不能構(gòu)成知識(shí),原因在于并沒有反映一種可靠的必然的關(guān)系。沒有因果的相關(guān)性,只能是一種建議或者地方性知識(shí)。有些相關(guān)性較高,但獲得的結(jié)果也不一定是知識(shí)。原因在于即便強(qiáng)相關(guān)也不一定存在必然性或因果關(guān)系,如病例與疾病的關(guān)系,雖然二者存在高相關(guān)性但是二者之間并不存在因果性,而基因突變與疾病之間存在因果性。所以,我們需要透過現(xiàn)象看事物的本質(zhì),這就需要基于關(guān)聯(lián)的因果分析方法,確證大數(shù)據(jù)知識(shí)的真。
(一)基于關(guān)聯(lián)的因果分析方法的重要性
大數(shù)據(jù)時(shí)代,僅依靠大數(shù)據(jù)歸納方法獲得的相關(guān)性分析結(jié)果往往具有時(shí)效性和地域性特點(diǎn),即小知識(shí)的特點(diǎn)。所以,大數(shù)據(jù)經(jīng)驗(yàn)主義者認(rèn)為大數(shù)據(jù)知識(shí)依靠相關(guān)性獲得,時(shí)效性強(qiáng),“我們無(wú)法追求每個(gè)問題的因果性,或者來不及細(xì)究因果性就必須即刻給出問題的解決之道,在此情境之下,相關(guān)關(guān)系分析法就顯得更加有效”[5]。但是,這種急于求成而獲得的解決之道并不是事物客觀運(yùn)行的真實(shí)反映?;陉P(guān)聯(lián)的因果分析方法能夠通過因果分析挖掘現(xiàn)象背后真正的原因,以確證大數(shù)據(jù)潛在知識(shí)的真,將潛在知識(shí)確證為知識(shí)。
1.挖掘大數(shù)據(jù)潛在知識(shí)背后的原因。不忘初心,知其然更要知其所以然,這是知識(shí)的本質(zhì)要求。只有被確證為真的潛在知識(shí)才能構(gòu)成真正意義上的知識(shí)。大數(shù)據(jù)歸納方法彰顯的是經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界的相關(guān)性,這只是知其然的展示,這種相關(guān)性的展示結(jié)果只是一種潛在知識(shí),其能否轉(zhuǎn)化為知識(shí),需要進(jìn)一步確證。因果分析是確證知識(shí)較常用的一種方法。相關(guān)性有些是偶然的,不具有因果性,也就不構(gòu)成知識(shí),就被剔除。有些強(qiáng)相關(guān)性也不一定是知識(shí),其本質(zhì)需要通過對(duì)現(xiàn)象分析挖掘進(jìn)而形成知識(shí)。這樣,即使對(duì)強(qiáng)相關(guān)性也需要分析其原因,因?yàn)檫@種強(qiáng)相關(guān)性只是現(xiàn)象的展示,現(xiàn)象本身并不構(gòu)成事物的本質(zhì),也不構(gòu)成客觀知識(shí)。
2.確證大數(shù)據(jù)潛在知識(shí)為真。從知識(shí)實(shí)現(xiàn)進(jìn)程看,當(dāng)一種方法無(wú)法發(fā)現(xiàn)知識(shí)時(shí)客觀要求一種新的方法來代替或完善。大數(shù)據(jù)歸納方法主要用于發(fā)現(xiàn)大數(shù)據(jù)中存在的潛在知識(shí),但其具有局限性?!按髷?shù)據(jù)強(qiáng)調(diào)相關(guān)性而非因果性的研究取向限制了其探究因果關(guān)系的能力……大數(shù)據(jù)缺乏發(fā)現(xiàn)因果關(guān)系的優(yōu)勢(shì),應(yīng)該將其與實(shí)驗(yàn)設(shè)計(jì)和觀察研究相結(jié)合來獲取有價(jià)值的知識(shí)?!盵7]目前,大數(shù)據(jù)歸納方法主要通過歸納形成相關(guān)性關(guān)系的展示。這樣,就需要因果性分析方法作為彌補(bǔ),在知其然基礎(chǔ)上明白其所以然,以確證潛在知識(shí)與經(jīng)驗(yàn)世界、網(wǎng)絡(luò)世界運(yùn)行規(guī)律的相符合性,確證潛在知識(shí)為真。大數(shù)據(jù)所獲得的有限的總體并不能反映經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界的普遍性。正是由于此,因果分析方法作為補(bǔ)充是很必要的。
(二)基于關(guān)聯(lián)的因果分析方法確證大數(shù)據(jù)知識(shí)的路徑
基于關(guān)聯(lián)的因果分析方法是確證大數(shù)據(jù)潛在知識(shí)為真的重要方法,要實(shí)現(xiàn)該方法,我們需要做好以下工作。
1.對(duì)強(qiáng)相關(guān)性進(jìn)行因果分析。對(duì)于知識(shí)的確證目前有三種理論,即基礎(chǔ)主義、融貫論和外在主義,基礎(chǔ)主義認(rèn)為“知識(shí)的證實(shí)建立在某種基礎(chǔ)之上,這一基礎(chǔ)就是證實(shí)的初始前提”[2];融貫論認(rèn)為“所有的信念都將由它們與其他信念,將由所有這些信念相互之間的一致的關(guān)系,而得到證實(shí)”[2];外在主義認(rèn)為“真正所必需的只是信念和外在事物之間的某種外在關(guān)系”[2]。對(duì)于經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界來說,通過大數(shù)據(jù)歸納方法獲得的相關(guān)性,有弱的偶然性的相關(guān)性,有強(qiáng)的必然性的相關(guān)性,也有強(qiáng)的偶然性的相關(guān)性等。可見,大數(shù)據(jù)知識(shí)確證并沒有明顯的初始前提,相關(guān)性某種程度上反映大數(shù)據(jù)潛在知識(shí)與其他信念的一致性,而這種一致性的存在,關(guān)鍵在于潛在知識(shí)與外在事物之間的因果性關(guān)系,僅依靠相關(guān)性獲得的表征只是現(xiàn)象的描述并不能構(gòu)成知識(shí)。對(duì)相關(guān)性背后的原因進(jìn)行挖掘是知識(shí)確證很重要的途徑和方法。這些原因,有一果一因、一果多因、多果一因等情況,我們需要具體問題具體分析。
2.以思維創(chuàng)新對(duì)相關(guān)性進(jìn)行因果分析。對(duì)經(jīng)驗(yàn)世界來說,傳統(tǒng)意義上追求普遍性和客觀性是其使命。而通過大數(shù)據(jù)歸納方法獲得的是經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界相關(guān)性這個(gè)果,這個(gè)果是否有原因,需要執(zhí)果索因。相關(guān)關(guān)系指兩種或兩種以上的社會(huì)經(jīng)濟(jì)現(xiàn)象間存在著相互依存關(guān)系,但在數(shù)量上沒有確定的對(duì)應(yīng)關(guān)系。統(tǒng)計(jì)學(xué)上研究有關(guān)社會(huì)經(jīng)濟(jì)現(xiàn)象之間相互依存關(guān)系的密切程度叫做相關(guān)系數(shù)。通過相關(guān)分析,還可以測(cè)定和控制預(yù)測(cè)的誤差,掌握預(yù)測(cè)結(jié)果的可靠程度,把誤差控制在一個(gè)范圍內(nèi)。社會(huì)經(jīng)濟(jì)現(xiàn)象之間的相互關(guān)系是非常復(fù)雜的,表現(xiàn)出不同的類型和形態(tài)。從變量之間相互關(guān)系的方向來看,分為正相關(guān)和負(fù)相關(guān)。從變量之間相互關(guān)系的表現(xiàn)形式來看,可分為直線相關(guān)與非直線相關(guān)。對(duì)于大數(shù)據(jù)知識(shí)來講,大數(shù)據(jù)歸納方法將客觀世界復(fù)雜的相關(guān)關(guān)系展示出來,我們可以通過辯證思維、理性思維創(chuàng)新確證大數(shù)據(jù)潛在知識(shí)是否為真。
“對(duì)大數(shù)據(jù)認(rèn)識(shí)論的批判更多地指向數(shù)據(jù)主義者‘重相關(guān)輕因果’‘重事實(shí)輕理論’‘重技術(shù)輕研究’的傾向?!盵8]大數(shù)據(jù)知識(shí)作為知識(shí)的一種形態(tài),特別是作為對(duì)經(jīng)驗(yàn)世界和網(wǎng)絡(luò)世界等客觀世界的鏡像反映,追求普遍性和客觀性是其重要任務(wù),要形成對(duì)大數(shù)據(jù)知識(shí)因果分析、理論分析是很必需的。因果分析方法和遞歸分析方法正是通過彌補(bǔ)大數(shù)據(jù)歸納方法的不足,彰顯大數(shù)據(jù)知識(shí)的因果性、理論性、普遍性和客觀性。對(duì)于大數(shù)據(jù)知識(shí)來說,我們不僅需要發(fā)現(xiàn)和確證大數(shù)據(jù)知識(shí),還要實(shí)踐大數(shù)據(jù)知識(shí),即實(shí)現(xiàn)大數(shù)據(jù)知識(shí)的效。而對(duì)大數(shù)據(jù)知識(shí)的實(shí)踐需要遞歸分析方法。
(一)遞歸分析方法的重要性
“所謂遞歸就是把未知的歸結(jié)為已知的,把較復(fù)雜情形的計(jì)算,遞次地歸結(jié)為較簡(jiǎn)單情況的計(jì)算,并得到計(jì)算結(jié)果為止。”[9]也就是說,遞歸是把一個(gè)不能或不好直接求解的“大問題”轉(zhuǎn)化成一個(gè)或幾個(gè)“小問題”來解決,“小問題”再分解,直到每個(gè)“小問題”都可以直接解決。某些問題的解決是環(huán)環(huán)相扣,前一步完成才能到后一步,這樣的問題可以用遞歸方法來解決。遞歸方法要求有遞歸程度的設(shè)計(jì)?!斑f歸設(shè)計(jì)就是要給出合理的‘較小問題’,然后確定‘大問題’的解與‘較小問題’之間的關(guān)系,即確定遞歸體,最后朝此方向分解,必然有一個(gè)單基本問題解,以此作為遞歸出口?!盵9]大數(shù)據(jù)知識(shí)的產(chǎn)生直接來源于社會(huì)實(shí)踐的需求。目前,大數(shù)據(jù)知識(shí)已被廣泛應(yīng)用于交通、環(huán)保、醫(yī)療等領(lǐng)域。遞歸分析方法是實(shí)現(xiàn)大數(shù)據(jù)知識(shí)效用的重要方法。
1.彰顯大數(shù)據(jù)知識(shí)實(shí)現(xiàn)的遞歸性。遞歸分析方法分為向前遞歸和向后退回。從大數(shù)據(jù)知識(shí)實(shí)現(xiàn)過程看,一是向后遞歸,彰顯大數(shù)據(jù)發(fā)現(xiàn)、確證、實(shí)踐的動(dòng)態(tài)性。首先,要借助大數(shù)據(jù)技術(shù)發(fā)現(xiàn)大數(shù)據(jù)中包含的潛在知識(shí),其次需要確證其為真,構(gòu)成大數(shù)據(jù)知識(shí),最后將大數(shù)據(jù)知識(shí)應(yīng)用于社會(huì)實(shí)踐。可以說,大數(shù)據(jù)知識(shí)實(shí)現(xiàn)過程就是從大數(shù)據(jù)——大數(shù)據(jù)潛在知識(shí)——大數(shù)據(jù)知識(shí)——大數(shù)據(jù)知識(shí)應(yīng)用不斷向后遞歸的過程。二是向前遞歸,彰顯大數(shù)據(jù)知識(shí)應(yīng)用對(duì)大數(shù)據(jù)知識(shí)確證、發(fā)現(xiàn)的反作用。大數(shù)據(jù)知識(shí)作為知識(shí)的一種形態(tài),在被應(yīng)用過程中會(huì)發(fā)現(xiàn)大數(shù)據(jù)知識(shí)的不完善或缺陷,這就需要向前遞歸,修正大數(shù)據(jù)知識(shí)的確證方法,完善大數(shù)據(jù)倉(cāng)庫(kù)等,進(jìn)一步推動(dòng)大數(shù)據(jù)知識(shí)的發(fā)展。
2.彰顯大數(shù)據(jù)知識(shí)實(shí)踐從“大問題”向“小問題”不斷遞歸。遞歸分析方法需要將“大問題”遞歸為“小問題”,并尋找一個(gè)單基本問題解,以此作為遞歸口。大數(shù)據(jù)知識(shí)的實(shí)踐是從“大問題”向“小問題”不斷遞歸的過程。具體來說,大數(shù)據(jù)知識(shí)實(shí)踐的主體包括政府、企業(yè)、民眾、科研院所等,大數(shù)據(jù)知識(shí)實(shí)踐是個(gè)“大問題”,可以遞歸為不同主體在觀念、生產(chǎn)生活方式、制度、文化等方面應(yīng)用大數(shù)據(jù)知識(shí)的“小問題”,以實(shí)現(xiàn)大數(shù)據(jù)知識(shí)的實(shí)踐價(jià)值。如對(duì)于醫(yī)療大數(shù)據(jù)應(yīng)用的“大問題”,我們可以遞歸為具體的生活方式、觀念變革、文化創(chuàng)新等。我們發(fā)現(xiàn)很多疾病的產(chǎn)生都與民眾不良生活方式有很大的關(guān)系,政府需要宣傳與健康生活方式相關(guān)的觀念,使民眾在觀念層面認(rèn)識(shí)到生活方式對(duì)健康的重要性,與此同時(shí)塑造和形成良好的生活方式,并在文化層面形成健康文化。對(duì)于企業(yè)來講,“企業(yè)如果能在這些非結(jié)構(gòu)化數(shù)據(jù)中挖掘出新的知識(shí)并與業(yè)務(wù)融合,不但其決策的依據(jù)將會(huì)更加全面和準(zhǔn)確,而且有可能形成新的核心競(jìng)爭(zhēng)力,進(jìn)而在生產(chǎn)模式、商業(yè)模式、管理模式等方面發(fā)生深刻變革?!盵10]大數(shù)據(jù)知識(shí)可用于篩選不合格產(chǎn)品,提高企業(yè)的管理效率,這就促進(jìn)企業(yè)生產(chǎn)方式的變革。
(二)遞歸分析方法實(shí)踐大數(shù)據(jù)知識(shí)的路徑
為了更好地利用遞歸分析方法,將大數(shù)據(jù)知識(shí)的效表征出來,我們需要做好以下工作。
構(gòu)建大數(shù)據(jù)知識(shí)遞歸的雙向路線圖。對(duì)于大數(shù)據(jù)知識(shí)來講,一是向后遞歸,從對(duì)大數(shù)據(jù)的存儲(chǔ)、分析、挖掘和可視化發(fā)現(xiàn)大數(shù)據(jù)中包含的潛在知識(shí),進(jìn)而通過關(guān)聯(lián)的因果分析確證大數(shù)據(jù)潛在知識(shí)的真,再到大數(shù)據(jù)知識(shí)的實(shí)踐應(yīng)用。這個(gè)遞歸過程必須是暢通的。二是向前遞歸,即從大數(shù)據(jù)知識(shí)實(shí)踐向前不斷遞歸。大數(shù)據(jù)知識(shí)應(yīng)用過程不僅彰顯大數(shù)據(jù)知識(shí)的價(jià)值,而且會(huì)發(fā)現(xiàn)大數(shù)據(jù)知識(shí)存在的缺陷和不足。這可能與大數(shù)據(jù)知識(shí)的發(fā)現(xiàn)、確證等都有直接的關(guān)系,進(jìn)而需要修正發(fā)現(xiàn)、確證等層面存在的不足。正是大數(shù)據(jù)知識(shí)遞歸雙向路線的不斷修正和完善,才能實(shí)現(xiàn)大數(shù)據(jù)知識(shí)的螺旋式向前發(fā)展。如對(duì)于醫(yī)療大數(shù)據(jù)知識(shí)的應(yīng)用,我們發(fā)現(xiàn)由于患者填寫個(gè)人信息的不真實(shí)性,使醫(yī)療大數(shù)據(jù)倉(cāng)庫(kù)所獲得的大數(shù)據(jù)存在虛假性,這直接影響大數(shù)據(jù)知識(shí)的發(fā)現(xiàn)、確證和實(shí)踐。我們需要剔除虛假大數(shù)據(jù),在此基礎(chǔ)上構(gòu)建大數(shù)據(jù)知識(shí)遞歸雙向路線圖。還有些時(shí)候,可能是確證或?qū)嵺`方面存在問題,最后影響大數(shù)據(jù)知識(shí)的實(shí)現(xiàn)。總之,構(gòu)建大數(shù)據(jù)知識(shí)遞歸雙向路線圖,就是發(fā)現(xiàn)大數(shù)據(jù)實(shí)現(xiàn)存在問題并不斷修正的過程。
尋找“小問題”的遞歸口。從實(shí)踐層面看,大數(shù)據(jù)知識(shí)的應(yīng)用是通過改變政府、企業(yè)、民眾、科研人員的觀念、生產(chǎn)生活方式、制度、文化等實(shí)現(xiàn)的。對(duì)于不同方面又可以進(jìn)一步遞歸為單問題基本解,這構(gòu)成“小問題”的遞歸口,也成為大數(shù)據(jù)知識(shí)實(shí)踐最基本的落腳點(diǎn)。大數(shù)據(jù)知識(shí)與傳統(tǒng)知識(shí)最大區(qū)別在于大數(shù)據(jù)知識(shí)直接服務(wù)于實(shí)踐需要。因此,對(duì)于大數(shù)據(jù)知識(shí)實(shí)踐應(yīng)用必須遞歸到最基本點(diǎn),才可能有真正價(jià)值。如對(duì)于醫(yī)療大數(shù)據(jù)知識(shí),我們通過宣傳將相應(yīng)知識(shí)內(nèi)化于民眾觀念中,進(jìn)而影響民眾的生活方式,并通過生活作息制度和飲食制度等規(guī)范民眾生活習(xí)慣,在更高層面塑造健康文化。對(duì)于企業(yè)來講,可以通過大數(shù)據(jù)知識(shí)對(duì)不合格產(chǎn)品的篩選,進(jìn)一步分析產(chǎn)生不合格產(chǎn)品的原因,如流水線設(shè)計(jì)不合理、材料質(zhì)量問題、人為因素等,我們就需要在這些方面進(jìn)行創(chuàng)新,提高企業(yè)產(chǎn)品的合格率。
大數(shù)據(jù)時(shí)代,大數(shù)據(jù)知識(shí)作為知識(shí)的新來源,彰顯大數(shù)據(jù)技術(shù)的重要性、大數(shù)據(jù)知識(shí)實(shí)現(xiàn)方法的整體性、大數(shù)據(jù)知識(shí)的多元價(jià)值性和知識(shí)實(shí)現(xiàn)方法的繼承性和創(chuàng)新性。
(一)彰顯大數(shù)據(jù)技術(shù)的重要性??茖W(xué)技術(shù)作為知識(shí)的一種形態(tài),在知識(shí)實(shí)現(xiàn)過程中起著至關(guān)重要的作用。古代,由于科學(xué)技術(shù)比較落后,“古人對(duì)自然界的認(rèn)識(shí)是從最簡(jiǎn)單的外部現(xiàn)象開始的,建立在直觀基礎(chǔ)上,當(dāng)直觀材料不夠用時(shí),就用猜測(cè)來彌補(bǔ)。”[11]隨著科學(xué)技術(shù)的發(fā)展,人們對(duì)客觀世界的認(rèn)識(shí)可以借助技術(shù)工具來實(shí)現(xiàn)?!艾F(xiàn)代知識(shí)論要討論的問題是作為主體的人通過什么樣的方法或途徑才能認(rèn)識(shí)或達(dá)到作為客觀的外界對(duì)象?!盵3]408大數(shù)據(jù)知識(shí)的實(shí)現(xiàn)直接來源于大數(shù)據(jù)技術(shù)。大數(shù)據(jù)技術(shù)實(shí)現(xiàn)對(duì)零散的結(jié)構(gòu)性與非結(jié)構(gòu)性大數(shù)據(jù)的存儲(chǔ)、分析、挖掘和可視化,才使大數(shù)據(jù)可能轉(zhuǎn)化為有價(jià)值的大數(shù)據(jù)知識(shí)。大數(shù)據(jù)技術(shù)提高了人們對(duì)客觀世界的解蔽能力。
(二)彰顯大數(shù)據(jù)實(shí)現(xiàn)方法的整體性。從發(fā)展歷程看,知識(shí)論從關(guān)注知識(shí)的本體向知識(shí)的認(rèn)識(shí)論和實(shí)踐論轉(zhuǎn)向。不同時(shí)期關(guān)注知識(shí)實(shí)現(xiàn)方法的層面是不同的。古代,注重感性、理性、經(jīng)驗(yàn)等在知識(shí)發(fā)現(xiàn)過程中的重要作用,重視歸納方法和演繹方法的應(yīng)用,以發(fā)現(xiàn)客觀世界中的知識(shí)。近現(xiàn)代,隨著實(shí)驗(yàn)方法、計(jì)算方法和模擬方法的不斷應(yīng)用,知識(shí)發(fā)現(xiàn)的方法逐步走向多元化。伴隨著知識(shí)發(fā)現(xiàn)方法的不斷進(jìn)步,知識(shí)確證的方法也在不斷發(fā)展,主要有基礎(chǔ)主義、融貫論和外在主義。知識(shí)經(jīng)濟(jì)的興起,知識(shí)的實(shí)踐方法顯得越來越重要??梢哉f,古代側(cè)重知識(shí)發(fā)現(xiàn)方法的挖掘;近代在知識(shí)發(fā)現(xiàn)基礎(chǔ)上重視對(duì)知識(shí)的確證;當(dāng)代知識(shí)經(jīng)濟(jì)的興起,如何挖掘知識(shí)的經(jīng)濟(jì)價(jià)值已成為方法論研究的重點(diǎn)。大數(shù)據(jù)時(shí)代,大數(shù)據(jù)技術(shù)成為發(fā)現(xiàn)大數(shù)據(jù)知識(shí)重要的工具,基于關(guān)聯(lián)的因果分析方法用于確證大數(shù)據(jù)知識(shí)的真,而遞歸分析方法彰顯大數(shù)據(jù)知識(shí)在實(shí)踐中的治理價(jià)值??梢姡髷?shù)據(jù)知識(shí)實(shí)現(xiàn)方法具有整體性,是發(fā)現(xiàn)方法、確證方法和實(shí)踐方法的辯證統(tǒng)一。
(三)彰顯大數(shù)據(jù)知識(shí)價(jià)值的多元性。人類掌握知識(shí)不僅在于認(rèn)識(shí)世界,更重要的在于改造世界,所以知識(shí)具有兩個(gè)很重要的價(jià)值維度,即真與效。大數(shù)據(jù)知識(shí)當(dāng)然也追求真與效,但是由于大數(shù)據(jù)本身可能涉及個(gè)人隱私、企業(yè)秘密和國(guó)家安全,所以大數(shù)據(jù)知識(shí)在實(shí)現(xiàn)過程中還有一個(gè)重要的價(jià)值維度,即善,保護(hù)大數(shù)據(jù)本身的安全性。大數(shù)據(jù)被應(yīng)用于環(huán)境環(huán)保、醫(yī)療等領(lǐng)域,其價(jià)值還體現(xiàn)美和健康等社會(huì)價(jià)值。
(四)彰顯知識(shí)實(shí)現(xiàn)方法的繼承性和創(chuàng)新性。從知識(shí)實(shí)現(xiàn)的方法看,歸納方法、演繹方法、因果分析方法、觀察方法、統(tǒng)計(jì)方法等一直以來都是知識(shí)實(shí)現(xiàn)的重要方法。只是隨著科學(xué)技術(shù)進(jìn)步,這些方法應(yīng)用的內(nèi)容和形式在不斷創(chuàng)新。大數(shù)據(jù)知識(shí)作為知識(shí)的新形態(tài),大數(shù)據(jù)知識(shí)實(shí)現(xiàn)方法既具有繼承性,又體現(xiàn)為創(chuàng)新性。一方面,大數(shù)據(jù)歸納方法繼承了傳統(tǒng)歸納方法的精神實(shí)質(zhì),即對(duì)結(jié)構(gòu)性和非結(jié)構(gòu)性大數(shù)據(jù)進(jìn)行歸納分析形成潛在知識(shí),但是又不同于傳統(tǒng)歸納方法,即通過利用大數(shù)據(jù)技術(shù)不局限于對(duì)結(jié)構(gòu)性大數(shù)據(jù)的分析,還包括對(duì)非結(jié)構(gòu)性大數(shù)據(jù)的分析,也就是說歸納的對(duì)象和方法都具有創(chuàng)新性。另一方面,基于關(guān)聯(lián)的因果分析方法繼承了傳統(tǒng)因果分析方法的精髓,即通過對(duì)強(qiáng)相關(guān)性分析挖掘其背后的因果性;但是它這種強(qiáng)相關(guān)性的因果分析是建立在對(duì)大數(shù)據(jù)全樣本基礎(chǔ)上的因果分析,而不是簡(jiǎn)單的隨機(jī)數(shù)據(jù)基礎(chǔ)上的因果分析,體現(xiàn)了創(chuàng)新性。遞歸分析方法的整體性更多體現(xiàn)為創(chuàng)新性。
總之,對(duì)于大數(shù)據(jù)知識(shí)來講,大數(shù)據(jù)歸納方法、基于關(guān)聯(lián)的因果分析方法和遞歸分析方法主要用于解決大數(shù)據(jù)知識(shí)的發(fā)現(xiàn)、確證和實(shí)踐問題。不同方法與不同問題之間并不是簡(jiǎn)單的一一對(duì)應(yīng)關(guān)系,在現(xiàn)實(shí)中三種方法往往交織在一起,各自需要解決的問題側(cè)重點(diǎn)不同。另外,除了這三種方法,大數(shù)據(jù)知識(shí)的實(shí)現(xiàn)還離不開人的主觀能動(dòng)性的發(fā)揮及其他的辯證分析方法、歷史分析方法和邏輯分析方法等。
山東科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2019年1期