馬云退休了嗎?否。他又有了新的工作,出任深圳菜鳥網(wǎng)絡科技有限公司董事長,力圖千億打造大數(shù)據(jù)圖景下的大物流網(wǎng)絡。事實是,如同上世紀的石油和礦山,大數(shù)據(jù)正在成為新世紀最重要的資產(chǎn)。
當“大數(shù)據(jù)”成為業(yè)界新的熱點之時,在這一領域有著深入研究的維克托·邁爾·舍恩伯格和肯尼斯·庫克耶于近日出版了其新作《大數(shù)據(jù)時代:生活、工作與思維的大變革》(以下簡稱《大數(shù)據(jù)時代》),通過一個個生動的案例向讀者介紹大數(shù)據(jù)的價值及其將會帶來的改變。
如果說去年本刊曾為讀者推薦的涂子沛所著《大數(shù)據(jù)》為華人世界帶來了一次有關歷史與思維的變革,那么《大數(shù)據(jù)時代》則為我們推開了一扇觀察商業(yè)世界成功的數(shù)據(jù)案例,從谷歌、IBM、亞馬遜到GPS傳感器,以及對沖基金公司利用微博數(shù)據(jù)套利……
中國傳媒大學教授沈浩提醒我們,大數(shù)據(jù)時代已經(jīng)來臨,如何從海量數(shù)據(jù)中發(fā)現(xiàn)知識,尋找隱藏在大數(shù)據(jù)中的模式、趨勢和相關性,揭示社會現(xiàn)象與社會發(fā)展規(guī)律,以及可能的商業(yè)應用前景,都需要我們擁有更好的數(shù)據(jù)洞察力。
全體性,相關性
盡管大數(shù)據(jù)成為今年IT界最熱門的概念之一,然而對于“大數(shù)據(jù)是什么”,連許多業(yè)界人士也說不出子丑寅卯,甚至有人告訴我,大數(shù)據(jù)的熱度大多來源于炒作,概念的落地尚需時日。
在維克托看來,大數(shù)據(jù)當然不是一個偽命題,不過大數(shù)據(jù)也無法直接給出確切的定義——在《大數(shù)據(jù)時代》的引言部分,他明確指出“大數(shù)據(jù)并非一個確切的概念”。不過,他用三大轉變描述了大數(shù)據(jù)的特性。
在書中時,他詳細闡釋了大數(shù)據(jù)帶來的三個轉變。
第一,不再是隨機樣本,而是全體數(shù)據(jù)。在大數(shù)據(jù)時代,我們可以獲得和某個現(xiàn)象相關的所有數(shù)據(jù),而不只是少量的樣本。例如一項針對相撲比賽中非法操縱比賽結果的研究對64000場比賽進行了分析,這算不上一個很大的數(shù)字,但由于這是過去十年所有的比賽,所以它是大數(shù)據(jù)。大數(shù)據(jù)是相對的而非絕對的。
在人類歷史長河中,即使是現(xiàn)代社會日新月異的發(fā)展中,人們還主要是依賴抽樣數(shù)據(jù),局部數(shù)據(jù),片面數(shù)據(jù),甚至是在無法獲得實證數(shù)據(jù)的時候純粹依賴經(jīng)驗,理論,假設和價值觀去發(fā)現(xiàn)未知領域的規(guī)律。所以,人們對世界的認識往往是表面的,膚淺的,簡單的,扭曲的或者是無知的。舍恩伯格指出,大數(shù)據(jù)時代的來臨使人類第一次有機會和條件在非常多的領域和非常深入的層次獲得和使用全面數(shù)據(jù),完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),深入探索現(xiàn)實世界的規(guī)律,獲取過去不可能獲取的知識,得到過去無法企及的商機。
第二,不再追求精確性,而是混雜行。由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對于一個事物只有50個數(shù)據(jù)點,那么每一個數(shù)據(jù)點都必須非常精確,因為每個數(shù)據(jù)點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。
第三,分析海量數(shù)據(jù)并找到相關關系,目的在于預測未來是什么,而不是解釋為什么。商業(yè)社會關注的是揭示哪些事情將會發(fā)生的相關關系,而非揭示為什么這些事情會發(fā)生的因果關系。在尋找商業(yè)機會的時候,商家只需要知道“是什么”就足夠了。例如,知道流感將會擴散到哪里就足夠了,不需要知道為什么;知道什么時候在網(wǎng)上購買機票能夠獲得最優(yōu)惠的價格就足夠了,不需要知道為什么此時價格最低。
量化的價值
數(shù)據(jù)被人類利用的頻率遠遠沒有被計算機利用得多。事實上,只要一點想象,萬事萬物就能轉化為數(shù)據(jù)形式,并一直帶給我們驚喜?!坝辛舜髷?shù)據(jù)的幫助,我們不再將世界看作是我們自認為或自然或社會現(xiàn)象的事件,我們會意識到本質(zhì)上世界是由信息構成的?!?/p>
而這種驚喜不僅是生活、思維更是商業(yè)的。Asthmapolis公司將一個傳感器綁定到哮喘病人佩戴的呼吸器上,通過GPS定位,再匯總收集起來的數(shù)據(jù),可以判斷出環(huán)境因素對哮喘的影響。
Emergent Technology和Intuit公司在對未來七年的數(shù)據(jù)趨勢預測報告中指出,“對這些海量信息不斷增長的訪問量,以及提煉和分析能力讓大數(shù)據(jù)成為了一種與資本和勞動力同等重要的新型資源。先進的分析法將從專家階層轉向日常用戶。數(shù)據(jù)將成為二十一世紀數(shù)字經(jīng)濟中實現(xiàn)全球經(jīng)濟增長的關鍵推動力,并對商業(yè)、科學、保健、財經(jīng)、政府和娛樂等社會的方方面面產(chǎn)生深遠影響?!?/p>
在維克托看來,亞馬遜、Google這些大公司已經(jīng)積累了很多數(shù)據(jù),這些大公司的強大之處在于他們的服務器集群等基礎設施。如今有了云計算,創(chuàng)業(yè)公司可以根據(jù)需要購買計算和存儲能力,以解決基礎設施方面的不足,但他們沒有數(shù)據(jù)。數(shù)據(jù)是一些大公司獨家擁有的。
然而,這并不意味著小公司沒有機會。維克托認為,如果小公司選擇了正確的領域切入,也能夠獲得數(shù)據(jù)。例如,Inrix公司開發(fā)導航軟件,還能提供實時路況,告訴你哪里堵車。Inrix的基礎導航服務是免費的,如果用戶同意下載這個應用,它就會將用戶的行駛速度等信息傳回后端,于是每天有數(shù)百萬人使用Inrix。因此,Inrix通過免費用戶的信息反饋,獲取了大量的數(shù)據(jù)。他們能記錄在特定天氣下人們的駕駛速度,并將這些信息告訴保險公司,或者告訴政府作為加強道路安全的參考。
大數(shù)據(jù)時代為創(chuàng)業(yè)者們帶來了機會均等,這不僅在美國,在中國同樣受用。北京一家成立三年的為開發(fā)者提供移動應用統(tǒng)計分析服務團隊——創(chuàng)新工場旗下的友盟,被阿里巴巴以8000萬美元的價格收購,同樣是大數(shù)據(jù)商業(yè)化初期的成功案例。寬帶資本董事長田溯寧說:“只要我們以開放的心態(tài)、創(chuàng)新的勇氣擁抱‘大數(shù)據(jù)時代’,就一定會抓住歷史賦予中國創(chuàng)新的機會?!?/p>