我們作為個人不僅是數(shù)據(jù)的接收者,也是數(shù)據(jù)的生產(chǎn)者。一方面我們下載、閱讀瀏覽,因此我們在消費數(shù)據(jù);另一方面,我們又上傳、撰寫、參加各種活動,各種活動就可以留下我們的很多痕跡,因此我們也在留痕,我們實際又在產(chǎn)生數(shù)據(jù)。在這樣一個既是消費又是生產(chǎn)的環(huán)境中,我們從方方面面已經(jīng)和數(shù)據(jù)分不開了。大數(shù)據(jù)已經(jīng)在沖擊各行各業(yè)。
對經(jīng)濟金融的影響
比如經(jīng)濟金融領域。股價的預測其實一直是個難題,傳統(tǒng)的股價預測,實際是通過一些專業(yè)的模型來估計風險、收益、評價企業(yè),有專門的理論和方法來估計股價。但是影響股價的除了這些因素之外還有人們的“期望”,而估計“期望”是非常難的,因為“期望”既涉及外部因素環(huán)境,又涉及心理預期。現(xiàn)在一個新視角是考慮公眾關注,比如搜索。若對某些企業(yè)比較關心,可能就搜索其企業(yè)狀況、新聞事件,這種搜索體現(xiàn)了大眾對于具體企業(yè)的股票價格和價值走向的關心。這是一個跟過去特別不同的角度,因為這不是特別專業(yè)的角度,它是從專業(yè)外人士的行為來估計的角度。這種關注和搜索與股價的走勢有相當強的關聯(lián)度。這和幾年前谷歌通過搜索來估計流感是一樣的,實際上它不是采用了所謂流行病學的專業(yè)模型,而是某段時間很多人有癥狀,頭疼、咳嗽、吃了什么藥,大家有很多信息的交換,這種交換的強度、交流的走向,恰恰可能跟流行病的流行模式非常相關。所以,我們也可以從搜索的角度來估計它和股價之間的影響和關聯(lián)度。但是,要特別指出,雖然搜索和股價的走勢有聯(lián)系,但是僅這一個因素來估計股價是不夠的,還有大量的因素需要專業(yè)模型。因此,一方面需要能夠擴展或者沖擊傳統(tǒng)的定式和視角,另一方面應該把其他專業(yè)視角引進來,大數(shù)據(jù)的股價預測應該是包括內(nèi)部與外部、專業(yè)與非專業(yè)因素的模型構(gòu)建。
對會計學的影響
大數(shù)據(jù)也開始在改變會計學。傳統(tǒng)的會計學衡量企業(yè)的狀況是通過三張報表:資產(chǎn)負債表、現(xiàn)金流量表、利潤表,這三張報表反映了一個企業(yè)的運營能力、償債能力和盈利能力。雖然這三張報表是非?;A和非常重要的,但是大家突然發(fā)現(xiàn),有一大類企業(yè)是高風險的,特別是一些IT企業(yè)、創(chuàng)業(yè)企業(yè)、新行業(yè)企業(yè),長期負債,但是同時又有非常高的市值,人們又有非常強的忠誠度,如果用這三張報表衡量,似乎不能完全體現(xiàn)它的價值,也就是說,傳統(tǒng)會計學的三張報表可能就不夠用了。因此,人們在呼喚“第四張報表”的出現(xiàn),業(yè)界和學界都在做研究。長周期、高負債、高不確定性企業(yè)的價值可能受到的是口碑、忠誠度、品牌、公允價值,包括無形資產(chǎn)的影響。這些東西我們可以稱之為數(shù)據(jù)資產(chǎn)。所以,這是從會計學的角度來看我們碰到的一個沖擊,很多新的現(xiàn)象導致呼喚新的模型、新的理論框架。
對體育、藝術(shù)的影響
大數(shù)據(jù)也在為體育界帶來變革。現(xiàn)在我們都在積極籌備冬奧會,我們國家有少數(shù)冰雪項目水平比較高,但總體的水平不是特別高。主要的問題是長期的傳統(tǒng)做法比較粗獷、比較經(jīng)驗型。冰雪項目中有一大類是姿態(tài)類項目,運動員的關節(jié)、角度、力量和跳躍的高度、旋轉(zhuǎn)的速度以及動作的完成質(zhì)量密切相關,現(xiàn)在大家已經(jīng)意識到這個問題,因此有些隊會用手機照一些照片、視頻,但是數(shù)據(jù)粒度沒有到關節(jié)這項,也沒有到姿勢、力量和角度上,所以數(shù)據(jù)粒度不夠。第二,視角也不夠,可能需要更加專業(yè)的采集設備,更加專業(yè)的還原設備來完成。比如現(xiàn)在簡單的二維的圖像應該變成動態(tài)三維的還原,并且可以分解,這樣就可能幫助總體的競賽水平得到提高。
別的項目,像籃球、像NBA就做得非常好,通過收集肌肉、血液、心臟、動作、戰(zhàn)術(shù)、團隊等全景式的數(shù)據(jù)來幫助訓練和比賽,因為這些因素都有可能影響整個比賽的結(jié)果。像壘球、網(wǎng)球的角度、落點、戰(zhàn)術(shù)都有不同的大數(shù)據(jù)分析。
可見,科技體育這幾年有巨大的空間,傳統(tǒng)的師傅帶徒弟,師傅的傳幫帶確實非常重要,但是應該有更細粒度、更加多角度、更加全景式的手段,采用大數(shù)據(jù)技術(shù)來提升整體的競賽水平。
大數(shù)據(jù)在藝術(shù)上也有很多影響。傳統(tǒng)繪畫,不管是古典的還是現(xiàn)代的畫,都有自己的素材和表現(xiàn)形式。現(xiàn)在出現(xiàn)了一種新的素材——數(shù)據(jù)素材,也就有了新的表現(xiàn)形式。比如飛機航班的數(shù)據(jù)軌跡就可以構(gòu)成一幅新穎的畫。由數(shù)據(jù)作為素材,有新視角進來,作為整體的新型創(chuàng)作出現(xiàn)。
對哲學、歷史學的影響
大數(shù)據(jù)已經(jīng)影響到經(jīng)濟、管理、體育、藝術(shù)等領域,在其他的領域也有非常多的應用,比如農(nóng)業(yè)就有蔬菜革命、精準扶貧,這些都是利用大數(shù)據(jù)的例子。在醫(yī)療健康領域,醫(yī)院內(nèi)醫(yī)院外,得病和未得病之間的關聯(lián),也是大數(shù)據(jù)問題。文學上通過大數(shù)據(jù)技術(shù)對一些詞語、作者、關系、背景等進行分析。
哲學里一個重要的方向是認識論和方法論,這里包括我們近些年提煉出來的新的研究成果。傳統(tǒng)的哲學認識論追求探索因果關系,因此基本叫做模型驅(qū)動范式,也就是說通過刻劃變量之間的聯(lián)系,比如自變量和因變量,通過構(gòu)建這兩個之間的函數(shù)關系,比如線性、非線性等,可以知道一個自變量一個單位的變化會導致因變量有幾個單位的變化,試圖反映變量之間的邏輯的因果上的機理。但是,這個模型驅(qū)動的范式在大數(shù)據(jù)時代會受到一些挑戰(zhàn),或者說它碰到一些問題時會捉襟見肘。比如,當數(shù)據(jù)變量的組合數(shù)特別多時,當很多變量是潛變量和隱變量時,當很多的變量雖然重要,但是不可測不可獲時,還有當數(shù)據(jù)的樣本規(guī)模特別大時,這些問題用傳統(tǒng)的模型驅(qū)動的做法就會比較困難。
因此,就出現(xiàn)了一個新的范式轉(zhuǎn)變,催生了大數(shù)據(jù)驅(qū)動范式。這個范式想表達的是,對于管理決策,我們希望能夠?qū)崿F(xiàn)既有關聯(lián)又有因果的訴求,這個新范式簡單地說由外部嵌入、技術(shù)增強和使能創(chuàng)新三方面構(gòu)成。外部嵌入是指引入視角之外的變量,有些變量我們知道重要,但是沒有辦法放進模型里,比如我知道股價,我預測股價有個計量模型,但是如果今天這個公司出了一個事情,或者是上面有個新聞,或者行業(yè)里有個新的政策,我們覺得可能會影響股價,但是這些變化很可能是視頻、語音或者文本,沒有辦法融入到傳統(tǒng)的模型中去。所以,需要引入外部視角。這些圖像、視頻、新聞文本要引入進來,就是要使得我們引入的變量可測、可獲,這就是第二條,技術(shù)上要增強。當這些變量引入進來的時候,我的變量空間就發(fā)生了變化,這個時候我們可能會研究新的X到Y(jié)的轉(zhuǎn)換,也就是變量關系和映射要重新定義和審視,這就是使能創(chuàng)新。這是大數(shù)據(jù)驅(qū)動范式框架的三個方面。
歷史學其實也和大數(shù)據(jù)密不可分。傳統(tǒng)的歷史記錄內(nèi)容都是帝王將相、英雄豪杰、國家、政治、重大的軍事事件等,很難在歷史中看到平民和我們自己。一個是過去的粒度不夠,第二手段也不行,存不下來。大數(shù)據(jù)環(huán)境下就可能自下而上反映歷史。比如國家圖書館互聯(lián)網(wǎng)信息戰(zhàn)略保存項目,和新浪合作,把新浪公開的相關博客文章作為歷史資料記錄下來,通過自上而下與自下而上的史學觀的融合,使得我們可以更細粒度地反映歷史和社會,同時也可以獲得更加全面的歷史畫面。
對法律行業(yè)的影響
法律也和大數(shù)據(jù)相關。比如下載一個App,憑什么問我要這么多權(quán)限?我不給權(quán)限行不行?沒有辦法,不給就不能用。我在網(wǎng)上購物、瀏覽,我的痕跡、數(shù)據(jù)腳印,都被公司采集了,我有沒有權(quán)利說你把我的這些痕跡抹掉、遺忘掉?這就是被遺忘權(quán)。所謂被遺忘權(quán)是指數(shù)據(jù)主體有權(quán)要求數(shù)據(jù)控制者永久刪除有關數(shù)據(jù)主體的個人數(shù)據(jù),有權(quán)被互聯(lián)網(wǎng)遺忘,除非數(shù)據(jù)的保留有合法的理由。2018年歐盟出臺了《通用數(shù)據(jù)保護條例》,強調(diào)了被遺忘權(quán)。這也是由大數(shù)據(jù)激發(fā)出來的新問題,對傳統(tǒng)的法學研究產(chǎn)生了新的挑戰(zhàn),或者說帶來了新的發(fā)展空間。