沈大嵬
大數(shù)據(jù)是指那些太大、太復(fù)雜、過于動態(tài)的數(shù)據(jù),一般的工具難以儲存,難以分析和管理。掌握大數(shù)據(jù),可以預(yù)見趨勢,提供更好的服務(wù)與產(chǎn)品。
大數(shù)據(jù)帶來的興奮與期待
一些怪誕有趣的問題吊起了MIT媒體實驗室研究員們的胃口,有些問題與我們個人的生活息息相關(guān):
寵物般可愛的嬰兒,是如何逐漸獲得了語言與交流能力?
如何通過“可穿戴計算”更好地了解自己的健康、睡眠與情緒?
銀行掌握著我們的消費(fèi)行為,手機(jī)運(yùn)營商了解我們的移動位置信息、通信模式,甚至了解我們真實世界中的社交網(wǎng)絡(luò),他們?nèi)绾文芴峁┯袃r值的個性化服務(wù)?我們作為力量相對薄弱的個體,該如何面對個人數(shù)據(jù)的隱私與安全?
有些問題在深究企業(yè)的市場、運(yùn)行與效率:
如果一家企業(yè)在春晚或者中國好聲音節(jié)目中播放了自己的廣告,如何通過社交媒體數(shù)據(jù)精確測量廣告的覆蓋人群面積以及受眾的反饋?
企業(yè)內(nèi)的有效的信息共享與知識傳播是如何增強(qiáng)員工工作效率并轉(zhuǎn)化為實際收益的?
如何衡量企業(yè)的“軟性資產(chǎn)”,也就是領(lǐng)導(dǎo)與下屬之間,同事與同事之間的交流、溝通與默契?這些軟資產(chǎn)又如何影像個人的工作表現(xiàn)和團(tuán)隊的整體競爭力?
有些問題則著眼于一個城市甚至是一個國家的宏觀整體:
哪里是一個城市感覺最浪漫的地方?
如何利用移動通信數(shù)據(jù)做更智能的城市交通規(guī)劃以減少擁堵?
一個國家的經(jīng)濟(jì)與國家收入與其生產(chǎn)產(chǎn)品的種類與多樣性有何聯(lián)系?
這些形形色色的問題涵蓋了我們工作生活的方方面面。而研究員們的解決方案是類似的:新穎的研究方案設(shè)計,尤其是多數(shù)據(jù)源的確定。如果沒有現(xiàn)成的數(shù)據(jù)源,則需要設(shè)計新的硬件器材與傳感器進(jìn)行采集與存儲。然后對大量數(shù)據(jù)進(jìn)行統(tǒng)計分析或者機(jī)器學(xué)習(xí)得到研究結(jié)論。在數(shù)據(jù)分析處理過程中時常會有新的疑問與靈感出現(xiàn),再進(jìn)一步擴(kuò)大研究的范圍與成果。MIT媒體實驗室的研究院們獲得了很多有趣的,時常與我們直覺并不相符的成果。在研究過程中積累的技術(shù)與智慧已經(jīng)締造了許多家成功的創(chuàng)業(yè)公司。
大數(shù)據(jù)之所以令人充滿期待,絕不僅僅是因為我們有機(jī)會創(chuàng)造一些軟硬件去采集、存儲和訪問海量的數(shù)據(jù),我們更著迷于這些數(shù)據(jù)本身帶給我們的信息與智慧,為我們提供一個全新的理解世界和理解人類自己的方法與視角,去回答一些傳統(tǒng)研究方法無法回答的問題。我們常講用“事實”戰(zhàn)勝雄辯,或用“實踐”去檢驗真理,那么“事實”與“實踐”本身即可通過大數(shù)據(jù)分析獲得更嚴(yán)格的界定與支持。
大數(shù)據(jù)到底大在哪?有多大?
討論大數(shù)據(jù)無疑是近期的一種流行時尚,無論是在學(xué)術(shù)界、企業(yè)界、政府、創(chuàng)業(yè)公司,或者是風(fēng)險投資界,“大數(shù)據(jù)”三個字本身指征了新的價值創(chuàng)造、新的智能收集與新的商業(yè)機(jī)遇。
“大”字首先讓人們想到的是大數(shù)據(jù)4V中的第一“V”,即容量(Volume)。曾經(jīng)習(xí)慣使用MB和GB的我們突然需要在腦中進(jìn)行一些運(yùn)算才能理解(PB)和(EB)的概念?!按蟆弊忠搀w現(xiàn)在大數(shù)據(jù)影像行業(yè)之多,應(yīng)用領(lǐng)域之廣,涵蓋交通、金融、醫(yī)療、企業(yè)管理、用戶服務(wù)等多領(lǐng)域。從技術(shù)或者工程的角度去看大數(shù)據(jù),“大”也體現(xiàn)在其涉及交叉學(xué)科領(lǐng)域之多,從數(shù)據(jù)采集到最終從數(shù)據(jù)中挖掘出價值,每一個環(huán)節(jié)都有相應(yīng)的技術(shù)難點與創(chuàng)新點。
然而“大”數(shù)據(jù)正如我們這個信息爆炸的社會一樣給人最深刻的感受卻是困惑與無所適從。繁復(fù)的數(shù)據(jù)源,分散的價值創(chuàng)造機(jī)遇,具有挑戰(zhàn)性的技術(shù)與非技術(shù)上的難題,要求每一位大數(shù)據(jù)參與者必須去消化大數(shù)據(jù)這個新興生態(tài)系統(tǒng)帶來的不確定性、模糊性甚至是風(fēng)險。簡單地講,大數(shù)據(jù)技術(shù)分成“強(qiáng)健內(nèi)核”與“創(chuàng)新外沿”兩部分?!皬?qiáng)健內(nèi)核”指的是一個可靠、安全、可擴(kuò)展的IT架構(gòu)用于大數(shù)據(jù)的采集,存儲,與高效處理;“創(chuàng)新外沿”則是解決如何用這些數(shù)據(jù)來為個人、企業(yè)、政府提供價值,甚至是意想不到的價值。
MIT的計算機(jī)科學(xué)與人工智能實驗室(CSAIL)在今年與八家企業(yè)聯(lián)合建立了大數(shù)據(jù)研究組,通過學(xué)術(shù)界與工業(yè)界具體問題的結(jié)合來進(jìn)一步推進(jìn)大數(shù)據(jù)的研究。研究的角度主要側(cè)重于四個研究主題:1)計算平臺,2)可升級算法,3)機(jī)器學(xué)習(xí)與辨識,4)隱私與安全。應(yīng)該說,這四個主題很好地概括了大數(shù)據(jù)從計算機(jī)科學(xué)角度出發(fā)的技術(shù)需求,為4V中的兩個V,Volume(數(shù)據(jù)量)與Velociy(速度)提供了進(jìn)一步的科研儲備。市場上已有的產(chǎn)品化的解決方案也更多的是側(cè)重于此,這是強(qiáng)健內(nèi)核的部分,同時加入該研究組的還有金融、醫(yī)療、教育、交通各個學(xué)科的教授,從各個應(yīng)用領(lǐng)域去挖掘大數(shù)據(jù)帶來的機(jī)會,所謂的創(chuàng)新外沿。
大數(shù)據(jù)的障礙與挑戰(zhàn)絕不僅僅是更多更快的處理數(shù)據(jù)。遠(yuǎn)比數(shù)據(jù)體積與速度重要的是數(shù)據(jù)分析理念與應(yīng)用的創(chuàng)新,即如何從紛繁的數(shù)據(jù)中理清變量之間的聯(lián)系,發(fā)覺通常無法認(rèn)識的規(guī)律,幫助我們更好的理解并改進(jìn)系統(tǒng)設(shè)計。從這個意義上講,大數(shù)據(jù)的參與者應(yīng)先把“大”字忘掉,而更關(guān)注于“數(shù)據(jù)”本身。
數(shù)據(jù)面包屑—尋找誠實的信號
大數(shù)據(jù)首先對社會學(xué)、行為學(xué)、企業(yè)設(shè)計等領(lǐng)域的傳統(tǒng)研究方法帶來了沖擊與革新。這些領(lǐng)域傳統(tǒng)的研究方法主要依賴于訪談、問卷調(diào)查、民意測驗等等。比如如果我們想了解一家企業(yè)內(nèi)部員工之間的交流模式,我們會向所有員工發(fā)問卷詢問他們與同事之間的交流頻繁度,是否經(jīng)常與其他部門的同事交流,是更多地用Email還是面對面的交流,談話時的肢體語言等等,然后用收回的問卷數(shù)據(jù)進(jìn)行分析。再比如一家飲料廠商在推出新的配方之前,往往會邀請一批測試用戶試新的飲料,并記錄他們的意見,根據(jù)他們反饋的滿意度決定是否最終將新產(chǎn)品推向市場。
然而研究人員發(fā)現(xiàn)這樣獲得的研究結(jié)果通常有很大的不確定性。從企業(yè)調(diào)查問卷中獲得的結(jié)論對企業(yè)內(nèi)部的交流協(xié)作并無明顯的指導(dǎo)意義,而由測試用戶一致稱贊的飲料時常在市場上失敗。原來,人們在需要回憶事實,并有意地發(fā)表意見的時候,往往帶有模糊性與偏見性,發(fā)送的是“不誠實的信號”。正如《誠實的信號》一書作者,MIT媒體實驗室Sandy Pentland教授曾提到過的,“數(shù)據(jù)的面包屑”—我們不經(jīng)意間留下的數(shù)據(jù)痕跡,比如我們信用卡的賬單,比如我們手機(jī)或藍(lán)牙設(shè)備留下的位置信息與通信記錄,才真正全面地反映了我們生活里的真實行動與選擇。而我們刻意要表達(dá)的自己,比如通過問卷調(diào)查中的回復(fù)、甚至是社交平臺上的評論、轉(zhuǎn)發(fā)、喜愛或者不喜愛的投票,與我們真實的自己都存在一定程度的偏差。
Sandy Pentland教授一直是大數(shù)據(jù)領(lǐng)域創(chuàng)新的先驅(qū)者。Tim OReilly和福布斯稱之為世界上七位最有影響力的數(shù)據(jù)科學(xué)家之一。他和他的研究組在大數(shù)據(jù)的多個應(yīng)用領(lǐng)域均有涉獵,尤其是在企業(yè)管理上。他一直倡導(dǎo)利用企業(yè)內(nèi)的大數(shù)據(jù),或者收集新穎的,卻時常被忽視的數(shù)據(jù)來協(xié)助企業(yè)內(nèi)部的決策與流程設(shè)計。Pentland教授的團(tuán)隊曾開發(fā)了一種可佩戴的“徽章(Badge)”配發(fā)給企業(yè)的員工們使用?;照吕锛闪嗽S多種傳感器來收集收據(jù),比如用麥克風(fēng)來收集員工說話時的音量與抑揚(yáng)頓挫、用3D加速器來收集員工工作時的移動或者交流時的肢體語言、用紅外裝置來監(jiān)測那些員工之間有面對面的交流。利用這些采集到的數(shù)據(jù),配合著企業(yè)現(xiàn)有的其他數(shù)據(jù)集,比如員工的績效數(shù)據(jù)、Email數(shù)據(jù)、電話記錄等等,可以產(chǎn)生新的視角去理解企業(yè)內(nèi)的動態(tài),尤其是企業(yè)內(nèi)部各員工之間,各部門之間的溝通與協(xié)作對每個個體的效率與企業(yè)整體競爭力所產(chǎn)生的影響。通過對聲音和肢體動作的分析則可以幫助員工理解如何能更有效地在會議中表達(dá)自己的觀點,或者如何更好地展示自己的領(lǐng)導(dǎo)力,避免沖突。
在這樣的分析框架下,我們并不需要員工去主動地、有意識地分享任何信息。通過各種傳感器所捕捉到的這些“數(shù)據(jù)面包屑”更精確地記錄了人們真實的習(xí)慣與工作狀態(tài)。Sandy Pentland教授提出了“現(xiàn)實挖掘”的理念來概括對這種大數(shù)據(jù)的感知、收集與分析。同樣的理念也貫穿于其他的一些項目中。
在MIT的校園里,每天同學(xué)們的情緒都是怎么樣的?興奮的,平淡的,還是壓抑的?MIT媒體實驗室的Roz Picard教授和她的研究組并沒有發(fā)調(diào)查問卷來詢問同學(xué),而是開發(fā)了“心情探測器”—在校園多個位置安裝了攝像頭,并利用視頻情緒識別技術(shù)直接通過同學(xué)們的面部表情來統(tǒng)計他們校園生活中的喜怒哀樂。
同樣的思路也適用于我們?nèi)祟愓J(rèn)識自己。嬰兒剛出生時只會做簡單的聲音與動作,難以與周圍復(fù)雜的環(huán)境做任何交互,可隨著嬰兒漸漸長大,他們會奇幻般地掌握了語言能力并且可以理解周圍的人與事并與之交流。這個有些不可思議的過程一直都是醫(yī)學(xué)、生物學(xué)、教育學(xué)中有趣,卻又沒有完全解開的謎題。MIT媒體實驗室的Deb Roy教授另辟蹊徑,從數(shù)據(jù)的角度去探索這個課題。他在他家的一間臥房里安裝了攝影頭,麥克風(fēng)等數(shù)據(jù)采集裝置,對他初生的兒子在這個特殊房間里的一言一行記錄了三年,近十萬小時的多軌數(shù)據(jù)。他通過對視頻以及聲音海量數(shù)據(jù)的挖掘與處理來學(xué)習(xí)他的兒子是如何掌握語言能力并與人交流的。
Y變量—精確地測量數(shù)據(jù)的價值
分析大數(shù)據(jù)的工程師與科學(xué)家們時常遇到的一個挑戰(zhàn),就是如何為大數(shù)據(jù)的“投資回報”進(jìn)行合理化的辯護(hù)。
換而言之,如何證明對大數(shù)據(jù)的分析結(jié)果確實帶來了經(jīng)濟(jì)上的實際效益?如果有,又該如何精確評估甚至量化這個回報?
這是一個極為關(guān)鍵卻又時常讓人感覺無從著手的挑戰(zhàn)。如前所述,大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)形成了一個龐大的生態(tài)系統(tǒng),而這個系統(tǒng)存在的經(jīng)濟(jì)基礎(chǔ),就是大數(shù)據(jù)最終必須要為個人、企業(yè)、公關(guān)服務(wù)創(chuàng)造具體的實際價值。這個價值越有形,越能被衡量,大數(shù)據(jù)的價值意義就越深刻,越能被人接受。
·電子商務(wù)企業(yè)對用戶的瀏覽行為進(jìn)行挖掘,商家、銀行或者支付系統(tǒng)的提供商對用戶消費(fèi)行為進(jìn)行挖掘,提供更個性化的產(chǎn)品與服務(wù),推薦更適合的商品。我們希望更直觀地理解商家如何提高了自己的銷量與附加增值服務(wù),消費(fèi)者從中獲得的價值能否通過節(jié)省的時間、獲得的折扣來衡量?
·對企界數(shù)據(jù)進(jìn)行采集與挖掘,在內(nèi)部可以發(fā)現(xiàn)企界管理運(yùn)行中漏洞并加以改善,提供企業(yè)運(yùn)行的效率與生產(chǎn)力,在外部可以優(yōu)化市場營銷、客戶管理、物流管理等以增強(qiáng)企業(yè)競爭力。我們該如何量化這樣的改善與優(yōu)化?
·對更宏觀的數(shù)據(jù)進(jìn)行分析,比如手機(jī)數(shù)據(jù)、物流數(shù)據(jù)可以幫助一個地區(qū)進(jìn)行城市設(shè)計與交通規(guī)劃,甚至預(yù)防犯罪、反恐。我們?nèi)绾螠y量大數(shù)據(jù)為公共服務(wù)領(lǐng)域創(chuàng)造的價值?
其中一個有效的思路,是注意尋找或者添加數(shù)據(jù)集當(dāng)中與價值直接相關(guān)的變量,比如銷售額、員工工資與獎金,支出開銷等直接以人民幣、美元為單位的變量。將其作為數(shù)據(jù)挖掘或者回歸分析中的“Y變量”,探究其他非與價值直接相關(guān)的“X變量”是如何影響和決定價值相關(guān)的“Y變量”的。比如說MIT數(shù)字商務(wù)研究中心的Marshall Van Alstyne教授曾經(jīng)研究企業(yè)內(nèi)部的有效信息分享與企業(yè)生產(chǎn)力的關(guān)系。他所使用的數(shù)據(jù)集是一家企業(yè)的全部電子郵件數(shù)據(jù)。通過這些電子郵件數(shù)據(jù),我們可以挖掘到許多有意義的員工的工作與交流模式,比如重要的信息的出現(xiàn)更多是以自上而下還是自下而上的方向傳播;員工在回信時有哪些習(xí)慣,是固定時間批量回信還是常開著郵箱立刻回信等等。這些發(fā)現(xiàn)對企業(yè)認(rèn)識自身固然有很大的幫助,但是對于企業(yè)領(lǐng)導(dǎo)者來說其價值體現(xiàn)還是不夠直觀。于是Van Alstyne教授將員工在公司中的職位、銷售業(yè)績、獎金等績效帶入數(shù)據(jù)分析作為“Y變量”,這樣所得到的分析結(jié)果對每個人就清晰多了:在企業(yè)內(nèi)部交流中,每多獲得一個單詞的信息,意味著你在工作中可以多創(chuàng)造價值。
游戲化與激勵機(jī)制—更新穎的數(shù)據(jù)采集模式
前文中舉到的很多大數(shù)據(jù)應(yīng)用的例子都不僅局限于現(xiàn)有的各種基礎(chǔ)設(shè)施與架構(gòu)下已經(jīng)在收集和存儲的數(shù)據(jù)。大數(shù)據(jù)一個有趣的挑戰(zhàn)就是定義和收集新型“數(shù)據(jù)面包屑”上的創(chuàng)新:我們對什么樣的問題給予熱情?需要什么樣的數(shù)據(jù)才能幫助我們回答這些問題?怎么樣才能迅速準(zhǔn)確地收集這樣的數(shù)據(jù)?尤其是當(dāng)我們需要“用戶產(chǎn)生內(nèi)容(Uer-Generated Contents)”的數(shù)據(jù)時,如何鼓勵大眾來準(zhǔn)確及時地提供信息是一個很熱門的話題。
卡內(nèi)基梅隆大學(xué)年僅32歲的Luis von AhN教授的近幾年的研究項目取得了舉世的關(guān)注。他創(chuàng)造了許多游戲化的機(jī)制,通過眾包(Crowdsourcing)調(diào)動大眾的智慧來完成似乎不可能完成的任務(wù)。在他創(chuàng)立的“ESP游戲”中,線上的兩位玩家面對同一幅圖片,在有限的時間內(nèi)盡可能地用更多地詞匯來描述這幅畫,當(dāng)兩位玩家使用了相同的詞的時候,會得到積分獎勵。而他們?yōu)榱嗣枋鲞@幅圖畫所提供的詞匯則在不經(jīng)意間成為了這幅圖片非常準(zhǔn)確的標(biāo)簽,或者叫“元數(shù)據(jù)”。Google收購了這項技術(shù)并曾經(jīng)使用它為Google圖片搜索提供更準(zhǔn)確的標(biāo)簽改善搜索精度。在2007年von Ahn教授又發(fā)明了reCAPTCHA,他希望能夠幫助將古老的紙裝書籍進(jìn)行數(shù)字化,尤其是那些因為紙張年久會變得模糊而無法辨認(rèn)的部分。今天許多的網(wǎng)站在用戶注冊,或者用戶改變參數(shù)設(shè)置時,用戶需要辨識一些圖片里出現(xiàn)的字母并正確輸入才可以繼續(xù)操作。reCAPTCHA將古籍中這些難以辨識的部分剪輯成圖片處理之后使用在這些網(wǎng)站當(dāng)中??梢韵胂?,當(dāng)足夠的用戶對這些難以辨識的文字進(jìn)行“人工”識別并將結(jié)果返回reCAPTCHA時,reCAPTCHA有效地提高了這些古籍?dāng)?shù)字化的效率與精度。
當(dāng)大數(shù)據(jù)的來源是用戶的參與與輸入時,如何將數(shù)據(jù)輸入的過程包裝成一個看似不直接相干的游戲或者其他環(huán)節(jié),是很有趣的一個方向。醉翁之意不在酒,在用戶獲得放松與趣味性的同時,不經(jīng)意間貢獻(xiàn)了數(shù)據(jù)解決了問題。
MIT媒體實驗室Cesar Hidalgo教授的研究組想回答一組很簡單卻又與我們城市生活息息相關(guān)的問題。這個問題模版就是:在XXX這個城市里,哪里給人的感覺最XXX?比如說,在紐約,哪里給人的感覺最浪漫?Hidalgo教授和他的研究員們開發(fā)了一套游戲化的工具平臺來解決這個問題:他們通過利用“Google街道景觀(Street View)”的API,對一個城市幾乎每一個角落都會抓取一張照片,或者每隔一段距離就抓取一張照片,這樣一個城市就會自動生成一個照片集。每一位用戶在參與這個游戲的時候每次都會看到兩張照片,并選擇:“哪一張照片里的場景看起來你覺得更不安全?”用戶則可以很快地憑他們的個人感受進(jìn)行選擇。當(dāng)足夠多的用戶參與這個游戲的時候,研究院們就收集到了大量的兩兩比較的數(shù)據(jù),進(jìn)而可以計算出所有這些城市的地點在人們心中關(guān)于安全性,或者“浪漫”程度的排序。
個人數(shù)據(jù)是新型的資產(chǎn)—隱私與安全
我們前文中提到的幾乎所有大數(shù)據(jù)的應(yīng)用例子,在展示了大數(shù)據(jù)本身的價值和潛力的同時,也不由得讓我們皺起眉頭,產(chǎn)生一些疑慮。因為這些數(shù)據(jù)的采集和應(yīng)用嚴(yán)重涉及到了我們個人的隱私和安全。個人的移動信息、通訊信息、消費(fèi)信息、醫(yī)療記錄、信用記錄、甚至是駕駛記錄;在企業(yè)內(nèi)的范疇里Email通信記錄、績效表現(xiàn);甚至是社交媒體上留下的一句評論、上傳的一張照片、電腦里安裝刪除了什么軟件,這一切的一切都是大數(shù)據(jù)有可能去挖掘的對象。善意地利用這些數(shù)據(jù)可以更好地推進(jìn)科學(xué),為我們創(chuàng)造價值,而惡意地利用這些數(shù)據(jù)則有可能對個人,對家庭帶來災(zāi)難性的后果。
大數(shù)據(jù)在創(chuàng)造價值的同時,對公民權(quán)利、社會道德體系,國家立法也提出了刻不容緩的要求。正因為大數(shù)據(jù)難以估量的巨大潛在價值,我們的個人數(shù)據(jù)已經(jīng)成為一種新的有價資產(chǎn)(Asset),政府或企業(yè)都像盡能地收集和利用這些數(shù)據(jù)。在這些數(shù)據(jù) 的觸角正在伸向我們每個人和社會的時候,我們需要盡早從技術(shù)、道德、立法多個角度去思考這個問題并做好準(zhǔn)備。
Sandy Pentland教授在這個問題上做過很多前瞻性的思考與工作。他向世界經(jīng)濟(jì)論壇提出了“數(shù)據(jù)新協(xié)定(The new deal on data)”的主張。他認(rèn)為,我們每個人對我們個人的數(shù)據(jù)具有無可置疑的“擁有權(quán)”與“處置權(quán)”。
對個人數(shù)據(jù)的應(yīng)用與分析以及產(chǎn)生了哪些相應(yīng)的個性化服務(wù)必須用明確的語言向用戶進(jìn)行解釋,用戶有權(quán)選擇不加入或者不接受這些服務(wù)。用戶同時有權(quán)利要求拷貝、轉(zhuǎn)移或者刪除自己的數(shù)據(jù),不被他用。任何大數(shù)據(jù)的參與者都需要遵守這些準(zhǔn)則。他的這些早期主張獲得了關(guān)注并幾經(jīng)討論。今年,美國推出了《用戶數(shù)據(jù)權(quán)利法案》(Consumer Data Bill of Rights),歐盟官員也宣稱數(shù)據(jù)的權(quán)力是公民一項基礎(chǔ)的權(quán)力。
這種對用戶數(shù)據(jù)隱私與安全的考慮也帶來許多技術(shù)與模式上創(chuàng)新的機(jī)會。在技術(shù)上,比如如何在網(wǎng)上不無意識地泄漏個人身份,如何在數(shù)據(jù)分析時有效地加密敏感信息而不影像分析結(jié)果;在模式上,如何讓愿意分享個人數(shù)據(jù)的人得到補(bǔ)償,得到更多的有價值的服務(wù),如何在政府,企業(yè),與用戶之間建立一個互信的機(jī)制,這些挑戰(zhàn)其實都是很好的創(chuàng)新點。
大數(shù)據(jù)的核心是人,大數(shù)據(jù)創(chuàng)造價值的根源是對我們?nèi)吮旧砀羁痰牧私?。關(guān)于我們?nèi)俗约海谝唬还芪覀內(nèi)绾慰桃獾匮陲椬约?,甚至偽裝自己,我們不經(jīng)意間的行為習(xí)慣留下的痕跡還是會“暴露”真實的自己;第二,我們每個人都深受環(huán)境以及周圍的親人朋友同事的影響,人們常說“每個人都是他周圍人的平均數(shù)?!倍髷?shù)據(jù)正是有力量來沿著我們留下的這些數(shù)字軋跡推測我們真實的自己,來尋找人與人、人與環(huán)境變量之間的聯(lián)系,去更準(zhǔn)確地了解我們。這種理解和體會可能超出了我們自己對自己的認(rèn)知。
然后數(shù)據(jù)也好,大數(shù)據(jù)也好,帶來的智慧都是基于歷史過去的事件,在未來這個很有基于數(shù)據(jù)而設(shè)計建立的社會里,我們要隨時準(zhǔn)備迎接可能給我們帶來困擾,也有可能帶來欣喜的黑天鵝。
(本文轉(zhuǎn)自《新知》試刊號)