張少初
摘 要:本文分析了大數(shù)據(jù)思維特征,包括整體性與涌現(xiàn)性,多樣性與非線性。
關(guān)鍵詞:大數(shù)據(jù);思維;非線性
了解大數(shù)據(jù)思維的提出,這是理解大數(shù)據(jù)思維的前提,是把握大數(shù)據(jù)思維的基礎(chǔ)。然而,要對大數(shù)據(jù)思維擁有深刻、全面的把握,還必須進一步揭示大數(shù)據(jù)思維的特征。在現(xiàn)代科技革命的背景下,大數(shù)據(jù)思維在各領(lǐng)域中顯示出巨大應(yīng)用潛力,我們更應(yīng)對大數(shù)據(jù)思維的特征進行討論,本章就將從整體性與涌現(xiàn)性、多樣性與非線性、相關(guān)性與不確定性等三個方面提煉大數(shù)據(jù)思維的特征。
1 整體性與涌現(xiàn)性
牛頓以來,機械自然觀的思維方式在近代科學(xué)研究中流行開來,機械論自然觀在很大程度上指導(dǎo)了科學(xué)家的科研活動,這種機械論自然觀在方法論上是還原論的。然而,在現(xiàn)代科技革命的背景下,機械論自然觀的不變性、基本性、直觀性、既成性的特點暴露出了還原論的局限。辯證自然觀登上歷史舞臺以后,在人與世界關(guān)系問題上,采取了將人與世界看作一個整體的態(tài)度,具有整體論的特點。大數(shù)據(jù)時代,通過數(shù)據(jù)考察人與世界的關(guān)系問題,世界在大數(shù)據(jù)維度上呈現(xiàn)出現(xiàn)前所未有的新氣象,在大數(shù)據(jù)思維的背景下,涌現(xiàn)性成為描述全體數(shù)據(jù)最合適的詞匯。整體性和涌現(xiàn)性成為大數(shù)據(jù)思維的首要特征。
1.1 整體性
整體性是相對于系統(tǒng)的部分或者元素講的,大數(shù)據(jù)思維要求人們將所獲得的大數(shù)據(jù)作為一個系統(tǒng),那么這個系統(tǒng)的首要特征就是整體性。大數(shù)據(jù)思維的整體性是指在數(shù)據(jù)挖掘的過程中,我們需要重視全體數(shù)據(jù)的追求和分析,在把握問題的方法上,注重從整體把握對象。古希臘時期,世界的本原問題就是哲學(xué)家們追問最多的問題之一。亞里士多德說,世界的存在物都由本原組成,存在物在原初都從本原產(chǎn)生,最后又復(fù)歸為它。古希臘哲學(xué)家針對世界本原的問題上,經(jīng)歷了從對世界感性直觀到對世界超感性抽象的過程。在大數(shù)據(jù)時代里,人與世界的關(guān)系、思維與存在的關(guān)系通過海量數(shù)據(jù)緊密聯(lián)系起來,大數(shù)據(jù)在某種程度將成為世界本原的新解讀。
在大數(shù)據(jù)時代中,整體性思維是面對問題、解決問題時的首選。數(shù)據(jù)量增長迅速的情況下,與以隨機樣本為核心的小數(shù)據(jù)思維形成鮮明對比的是,以全體數(shù)據(jù)為核心的大數(shù)據(jù)思維顯現(xiàn)出的巨大能量,即整體性。大數(shù)據(jù)思維主張進行全體數(shù)據(jù)的獲取和分析,也就是通過整體思維的方式來把握研究對象。舉一個簡單的例子,我國每10年進行一次全國人口普查,兩次人口普查的時間終點,進行一次1%人口抽樣調(diào)查。新中國成立以后,我國共進行了六次全國普查和三次1%人口抽樣調(diào)查,社會各界投入的人力、財力成本巨大,以2010年北京市人口普查有關(guān)數(shù)據(jù)為準(zhǔn),北京市級財政和區(qū)縣財政投入相加,人口普查總投入超過6億元人民幣,由此可見全國人口普查所占用的財力將是巨大的。相比于全國人口普查的全國人口的廣泛覆蓋和龐大的調(diào)查費用,1%人口抽樣調(diào)查是一種省時又省力的人口調(diào)查方式,但是抽樣的結(jié)果往往有一定的誤差,在統(tǒng)計學(xué)上誤差是無法避免的,只可能在一定條件下降到最低。在大數(shù)據(jù)時代,我們假設(shè)在時間上、技術(shù)上等方面不存在難點,每10年的人口普查將變得比現(xiàn)在的人工入戶普查的方式高效得多,1%人口抽樣調(diào)查也可以變?yōu)槿丝谄詹榱耍敲?%人口抽樣調(diào)查甚至可以被全國性的人口普查替代。針對大數(shù)據(jù)思維的整體性特征,刊登在《學(xué)習(xí)時報》上的兩篇文章頗具代表性。
1.2 涌現(xiàn)性
涌現(xiàn)性通常是系統(tǒng)整體具有的特征,是指在系統(tǒng)中各部分、各元素單獨存在時不具有,但是將它們組合成一個整體后系統(tǒng)所具有的特征,也被稱為“整體涌現(xiàn)性”。在大數(shù)據(jù)思維的背景下,新情況在不斷地涌現(xiàn),涌現(xiàn)性也成為大數(shù)據(jù)思維的重要屬性。全體大數(shù)據(jù)整體具有的,而小數(shù)據(jù)單獨、部分或者所有小數(shù)據(jù)所不具有的屬性、特征和功能等可以稱為大數(shù)據(jù)思維的涌現(xiàn)性。也就是說,當(dāng)我們把大數(shù)據(jù)拆分為各個小部分時,大數(shù)據(jù)所具有的這些屬性、特征和功能等便不可能體現(xiàn)在小數(shù)據(jù)上或者所有小數(shù)據(jù)上。
來源一:構(gòu)材效應(yīng)。苗東升教授將系統(tǒng)的涌現(xiàn),歸結(jié)于系統(tǒng)的構(gòu)成上。系統(tǒng)由組分構(gòu)成,或者由它的元素構(gòu)成。那么,系統(tǒng)的涌現(xiàn)性也就來源于這里。整體涌現(xiàn)性的出現(xiàn)在特定的組分和元素構(gòu)成的系統(tǒng)中,如果更換了系統(tǒng)中的組分、元素,則原涌現(xiàn)性就無法出現(xiàn)。
來源二:規(guī)模效應(yīng)。系統(tǒng)的規(guī)模大小也是影響涌現(xiàn)的基本要素,涌現(xiàn)性的出現(xiàn)需要足夠多的組分或者元素,也就是足夠的材料,沒有足夠大的系統(tǒng),是無法出現(xiàn)涌現(xiàn)的。涌現(xiàn)的出現(xiàn),依賴于系統(tǒng)在一定程度的復(fù)雜性。
來源三:結(jié)構(gòu)效應(yīng)。組分之間的不同結(jié)構(gòu),以及不同組分間的相同結(jié)構(gòu),均會產(chǎn)生不同的涌現(xiàn)性。在整體系統(tǒng)中,組分之間的相互作用、相互位置不同,產(chǎn)生的作用力就不同。比較特殊的兩個現(xiàn)象是同分異構(gòu)和物理學(xué)超導(dǎo)現(xiàn)象,在組分、元素相同的情況下會表現(xiàn)出兩種不同的涌現(xiàn)特征。
來源四:環(huán)境效應(yīng)。系統(tǒng)處于特定環(huán)境條件下,就會受到環(huán)境條件的影響和制約,現(xiàn)代科技條件下的系統(tǒng)通常是開放系統(tǒng),無法避免的與系統(tǒng)外進行信息交換,在這種條件下也會產(chǎn)生特定的性質(zhì),表現(xiàn)出涌現(xiàn)性特征。
2 多樣性與非線性
2.1 多樣性
大數(shù)據(jù)思維的多樣性特征是通過數(shù)據(jù)種類的不同體現(xiàn)的。關(guān)系數(shù)據(jù)庫中存儲的基本是結(jié)構(gòu)化數(shù)據(jù),例如整齊的文字、數(shù)據(jù)或者同一種類的文件。而非關(guān)系數(shù)據(jù)庫的中存儲的多源異構(gòu)數(shù)據(jù)(就是前文提到的半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)),例如不整齊(雜亂)的圖標(biāo)、表格、網(wǎng)頁、視頻或者其他類型的異構(gòu)數(shù)據(jù),成為了大數(shù)據(jù)思維多樣性的主要來源。多樣性并不僅存在于大數(shù)據(jù)領(lǐng)域,我們?nèi)祟惿畹姆椒矫婷婢嬖诙鄻有?,可以說,在社會、自然甚至宇宙萬物都依賴多樣性而存在。托夫勒在上世紀(jì)80年代所寫的未來學(xué)書目《第三次浪潮》中,就已經(jīng)提到了人類因電子計算機發(fā)展迅速,信息革命開始,傳統(tǒng)的傳播工具群體化特征將不再明顯,“傳播工具將急劇的非群體化”,傳播對象將變得多樣起來。人類社會中,人是社會關(guān)系的總和,社會關(guān)系是多樣的,不同地區(qū)文化是多樣的。自然領(lǐng)域中,包括海洋環(huán)境、陸地環(huán)境、大氣環(huán)境,生物多樣性的存在讓生物圈多姿多彩。事物的發(fā)展變化總離不開多樣性,如此看來,大數(shù)據(jù)思維中存在的多樣性特征不可避免,我們在注意到大數(shù)據(jù)思維中存在多樣性的同時,應(yīng)盡可能全方位把握多樣的存在,搞清楚多樣性在大數(shù)據(jù)思維中的具體表現(xiàn),為我們利用大數(shù)據(jù)思維奠定基礎(chǔ)。
2.2 非線性
進入大數(shù)據(jù)時代以后,人類認(rèn)識世界的方式將發(fā)生改變,大數(shù)據(jù)思維非線性特征將幫助人類在認(rèn)識世界、考察世界的過程中,建立非線性觀點。非線性(nonlinear)是相對于線性(linear)來說的,是指方程的解滿足疊加定理(superposition principle)的現(xiàn)象或者系統(tǒng)所具有的特征,非線性是線性的否定。在數(shù)學(xué)中,線性是一種具有比例關(guān)系的性質(zhì),函數(shù)表現(xiàn)是成比例的、直線的,方程的解滿足齊次性或者加和性。而非線性是一種沒有比例關(guān)系的性質(zhì),函數(shù)表現(xiàn)是不成比例的、不成直線的。我們在科學(xué)研究中采取的線性思維,可以看作非線性現(xiàn)實的簡化。由于世界本身是非線性的,采取線性思維,就是一種近似思維,這樣一來,我們看到的世界將是不真實的,也脫離了世界的本來面貌。然而,大數(shù)據(jù)思維的出現(xiàn)帶來了整體思維,這樣的思維方式生來就對真實世界親近又抱有好感,人類可以利用采集海量大數(shù)據(jù)的方法,得到現(xiàn)實世界第一手的數(shù)據(jù),通過這些數(shù)據(jù)來了解我們的世界,將更加接近真實、接近現(xiàn)實。在這樣的意義上,大數(shù)據(jù)思維在本質(zhì)上表現(xiàn)出了非線性特征。
參考文獻
[1]周世佳.大數(shù)據(jù)思維初探:提出,特征及意義.中共山西省直機關(guān)黨校學(xué)報,2014,5:10-12.
[2]張義禎.大數(shù)據(jù)帶來的四種思維.學(xué)習(xí)時報,2015-1-26(第四版).