人物簡(jiǎn)介
涂子沛,江西吉安人,生于1973年。本科畢業(yè)于華中科技大學(xué)計(jì)算機(jī)系,研究生分別就讀于中山大學(xué)和卡內(nèi)基梅隆大學(xué)?,F(xiàn)居美國(guó)硅谷。2012年其著作《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》在中國(guó)社會(huì)開大數(shù)據(jù)之先河。
網(wǎng)上搜索涂子沛的資料,百度百科里關(guān)于他身份的介紹只有3個(gè)詞:信息技術(shù)經(jīng)理人、數(shù)據(jù)專家、自由撰稿人。對(duì)于一個(gè)研究大數(shù)據(jù)的人來說,其自身的數(shù)據(jù)怎么能這么少?在長(zhǎng)安街西側(cè)中國(guó)職工之家的咖啡廳內(nèi),涂子沛笑著向環(huán)球人物雜志記者解釋:“每個(gè)人都有數(shù)據(jù),每個(gè)組織都有數(shù)據(jù)。差別在于,有些人的數(shù)據(jù)是死的,而另一些人的數(shù)據(jù)是活的。”
什么樣的數(shù)據(jù)是死的?涂子沛認(rèn)為,“沒有在線,沒有電子化,數(shù)據(jù)將無法被搜索、分析”,就是死的。而隨著科技的進(jìn)步,人類所有的歷史記錄,無論是數(shù)字、文檔、圖片,還是音頻、視頻,都將以數(shù)據(jù)的形式存在?!皵?shù)據(jù)就是靜態(tài)的歷史,歷史就是動(dòng)態(tài)的數(shù)據(jù)?!?/p>
第一個(gè)寫大數(shù)據(jù)專著的中國(guó)人
2012年,涂子沛出版《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》時(shí),國(guó)內(nèi)才剛剛興起對(duì)大數(shù)據(jù)的討論。而這個(gè)概念,他已經(jīng)聽了將近20年。
1992年,涂子沛考入華中科技大學(xué)計(jì)算機(jī)科學(xué)專業(yè),從此與數(shù)據(jù)結(jié)緣。畢業(yè)后,他進(jìn)入武警邊防部隊(duì),設(shè)計(jì)了“中國(guó)第一套反偷渡系統(tǒng)”,據(jù)說這套系統(tǒng)前幾年還在用。之后的10年,涂子沛做過緝私艇指揮官、外經(jīng)貿(mào)局的公務(wù)員。2006年,他辭去公職赴美留學(xué),就讀于卡內(nèi)基梅隆大學(xué),獲信息技術(shù)碩士學(xué)位。
本科時(shí),涂子沛就知道大數(shù)據(jù)浪潮。但那時(shí)候,因?yàn)榫W(wǎng)絡(luò)還不夠普及,數(shù)據(jù)信息對(duì)人們的生活影響甚微,這個(gè)概念也不受人關(guān)注。 2010年之后,大數(shù)據(jù)逐漸為人熟知,憑借多年的研究,涂子沛成了第一個(gè)寫大數(shù)據(jù)專著的中國(guó)人。2012年,他出版了《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》。有評(píng)論認(rèn)為,這本書開啟了中國(guó)人對(duì)大數(shù)據(jù)的認(rèn)識(shí)。而他的新書《數(shù)據(jù)之巔》則從歷史的角度說明,對(duì)數(shù)據(jù)的理解和掌握是人類文明進(jìn)步的標(biāo)志。
《數(shù)據(jù)之巔》分為兩個(gè)部分。第一部分以美國(guó)歷史為主線,展現(xiàn)了大數(shù)據(jù)文化是如何形成并深入人心的。第二部分,涂子沛詳細(xì)考證了大數(shù)據(jù)浪潮的來龍去脈,并結(jié)合3次工業(yè)革命分析了大數(shù)據(jù)對(duì)商業(yè)運(yùn)營(yíng)、社會(huì)治理的深遠(yuǎn)影響。他認(rèn)為,更大的數(shù)據(jù)爆炸時(shí)代正在到來,大數(shù)據(jù)浪潮最終將引領(lǐng)人類社會(huì)邁進(jìn)一個(gè)新的形態(tài)——智能型社會(huì)。
大數(shù)據(jù)是一場(chǎng)社會(huì)革命
環(huán)球人物雜志:讀您新書的最深印象是,它用數(shù)據(jù)解構(gòu)了歷史。能否解釋一下用數(shù)據(jù)描述的歷史和用文字描述的歷史有何不同?
涂子沛:文字描述的歷史當(dāng)然會(huì)更加鮮活,但數(shù)據(jù)描述的歷史更加精確。美國(guó)有一名數(shù)學(xué)家出身的總統(tǒng)詹姆斯·艾伯拉姆·加菲爾德(1880年當(dāng)選美國(guó)第二十任總統(tǒng)),他曾經(jīng)說過:“歷史學(xué)家只能給我們講述帝王將相以及戰(zhàn)爭(zhēng)的故事,但關(guān)于人民本身——我們龐大社會(huì)中每個(gè)生命的成長(zhǎng)、各種力量、細(xì)節(jié)及其規(guī)律,他們說不出太多的東西?!钡珨?shù)據(jù)是對(duì)客觀世界的測(cè)量和記錄,包括社會(huì)方方面面以及每一個(gè)普通人的生活。用數(shù)據(jù)建構(gòu)的歷史,因?yàn)榫_的細(xì)節(jié)而永遠(yuǎn)鮮活,數(shù)據(jù)越豐富,后世的歷史學(xué)家也就越能經(jīng)由數(shù)據(jù)更好地再現(xiàn)當(dāng)時(shí)的社會(huì)。
環(huán)球人物雜志:大數(shù)據(jù)和傳統(tǒng)分析方式最大的不同在哪里?
涂子沛:說到這里,就要理解什么是大數(shù)據(jù)。大數(shù)據(jù)的特點(diǎn)絕對(duì)不是量大,而是多個(gè)源頭。不僅僅包括數(shù)字,還包括文字、音頻、視頻等。人類知識(shí)的來源就是對(duì)過去經(jīng)驗(yàn)的記錄和整理,如果說傳統(tǒng)的數(shù)據(jù)是人類部分知識(shí)的來源,那隨著人類記錄范圍的不斷擴(kuò)大,知識(shí)的邊界也在擴(kuò)大,現(xiàn)代意義上的大數(shù)據(jù)將逐漸成為人類全部知識(shí)的來源。
另外,大量的、多元的數(shù)據(jù)匯集到一起可以更好地還原事實(shí)。人類在做決策的時(shí)候首先要從事實(shí)出發(fā),而當(dāng)所有決策都以數(shù)據(jù)為依據(jù)時(shí),我們就必須達(dá)到一種“數(shù)據(jù)最優(yōu)”狀態(tài),靠精準(zhǔn)的記錄、計(jì)算和預(yù)測(cè)來推動(dòng)社會(huì)發(fā)展。如果你不能達(dá)到這個(gè)狀態(tài),而別人達(dá)到了,那你就要出局。
環(huán)球人物雜志:人類進(jìn)入大數(shù)據(jù)時(shí)代是一種必然嗎?
涂子沛:電子化是大數(shù)據(jù)的一個(gè)基本條件。我經(jīng)常用石油比喻大數(shù)據(jù)。石油早就埋在地下了,是因?yàn)橛辛碎_采石油的技術(shù)才進(jìn)入了石油時(shí)代。大數(shù)據(jù)也一樣,數(shù)據(jù)自古就有,只是我們現(xiàn)在用電子化的手段能更好地使用它,獲得價(jià)值,這才進(jìn)入了一個(gè)新的時(shí)代。
大數(shù)據(jù)時(shí)代會(huì)帶來很多變化,比如說反腐,現(xiàn)在我們說人人都有反腐力量,“表叔”楊達(dá)才的故事就是個(gè)鮮明的例子。在大數(shù)據(jù)時(shí)代,網(wǎng)友能從海量的網(wǎng)絡(luò)信息里查找到楊達(dá)才戴過那么多表的照片;而在小數(shù)據(jù)時(shí)代,這些資料沒有被記錄下來,也沒有途徑去發(fā)現(xiàn)。
環(huán)球人物雜志:大數(shù)據(jù)的概念會(huì)不會(huì)像現(xiàn)在的“互聯(lián)網(wǎng)思維”一樣,被大家過度消費(fèi)了?現(xiàn)在做什么都言必稱“互聯(lián)網(wǎng)思維”,好像不提就落伍了。
涂子沛:不會(huì)。大數(shù)據(jù)不是一場(chǎng)技術(shù)革命,是一場(chǎng)思想革命、管理革命、社會(huì)革命。從商業(yè)的角度來講,大數(shù)據(jù)代表粗放的競(jìng)爭(zhēng)開始向精細(xì)的競(jìng)爭(zhēng)轉(zhuǎn)移。比如,2013年5月,加拿大蒙特利爾交通局宣布,將利用大數(shù)據(jù)處理平臺(tái),對(duì)所有顧客的消費(fèi)歷史和個(gè)人信息進(jìn)行分析,然后按照其偏好、習(xí)慣和需求,量身定制消費(fèi)計(jì)劃和個(gè)性化票價(jià),目的就是優(yōu)化公共交通的運(yùn)營(yíng)。這就用大數(shù)據(jù)把消費(fèi)和服務(wù)推向了一個(gè)高度個(gè)性化的時(shí)代。
隱私教育像性教育一樣重要
環(huán)球人物雜志:大數(shù)據(jù)難道沒有缺點(diǎn)和局限嗎?
涂子沛:沒有萬能的東西,我們也不能把大數(shù)據(jù)極端化。大數(shù)據(jù)有很多不靠譜的地方,但關(guān)鍵是,一個(gè)東西在你手里看你怎么去用。我在書里講了一個(gè)故事,北京師范大學(xué)有個(gè)女學(xué)生引起了校方的注意,因?yàn)閺男7秸莆盏臄?shù)據(jù)看,她每天吃飯都花很少的錢。學(xué)校于是發(fā)信給這個(gè)女學(xué)生,問:你是不是生活困難,沒有錢吃飯?而事實(shí)上那個(gè)女學(xué)生是在減肥。這就說明校方的數(shù)據(jù)源頭不夠多,沒有正確地反映事實(shí)。如果還能收集其它的數(shù)據(jù)互相印證,就不會(huì)有這種失誤了。
環(huán)球人物雜志:如果順著多方收集數(shù)據(jù)這個(gè)思路,提倡大數(shù)據(jù)是否會(huì)干涉普通人的隱私?
涂子沛:大數(shù)據(jù)關(guān)系到每個(gè)人的隱私、權(quán)利、資產(chǎn)。隱私大家都能理解。什么是權(quán)利呢?比如PM2.5,過去我們不知道這個(gè)概念,也不清楚數(shù)值,但在大數(shù)據(jù)的時(shí)代,每個(gè)人都要求有對(duì)此事的知情權(quán)。還有資產(chǎn),臉書網(wǎng)上的數(shù)據(jù)現(xiàn)在已可以買賣了,公司把數(shù)據(jù)賣給第三方,一個(gè)人的數(shù)據(jù)值14美元(約合87元人民幣)。還有很多公司愿意給你一些折扣和便利來?yè)Q你的信用卡消費(fèi)記錄,就是為了得到你的數(shù)據(jù)。
環(huán)球人物雜志:聽上去都是公司在謀利,個(gè)人能有什么好處?
涂子沛:購(gòu)物網(wǎng)站向你推送的很多消息中,大部分是你需要的,如果它不推送,你根本不知道有這樣一件東西。而獲取你的數(shù)據(jù)越多,它的推送才能越準(zhǔn)。當(dāng)然,這也是雙刃劍。有些人在網(wǎng)上搜了一回棺材、壽衣,結(jié)果一連幾個(gè)月全收到這種廣告。
環(huán)球人物雜志:大數(shù)據(jù)時(shí)代有可能做個(gè)隱形人嗎?
涂子沛:很難,因?yàn)槟愕男袨槎急浑娮踊⒂涗浵聛?。這些數(shù)據(jù)不在你這里,在別人那里。購(gòu)物網(wǎng)站上有很多有趣的記錄,比如情人節(jié)時(shí),上海最暢銷的是玫瑰花,而北京最暢銷的是安全套。這都是很隱私的東西?,F(xiàn)在家家都裝智能電表,它可以每分鐘讀表,你家里一開什么電器,它都知道。所以它能推算出你什么時(shí)候在家,什么時(shí)候做飯,什么時(shí)候看電視,你的行為它都清清楚楚,那你說還有隱私嗎?
環(huán)球人物雜志:那該怎么保護(hù)個(gè)人隱私?
涂子沛:隱私問題是整個(gè)大數(shù)據(jù)時(shí)代的挑戰(zhàn)。不少學(xué)者進(jìn)行了研究,提出數(shù)據(jù)經(jīng)由第三方委托監(jiān)管、數(shù)據(jù)讀取匿名化等辦法。我認(rèn)為,未來的發(fā)展要把選擇權(quán)交給個(gè)人,是要這個(gè)服務(wù)呢,還是要保護(hù)隱私,讓個(gè)人來選擇。必須要有這層設(shè)計(jì),通過法律讓商家制定一套技術(shù)來把選擇權(quán)交給消費(fèi)者??梢钥隙?,下一代人,數(shù)據(jù)和隱私,將成為伴隨他們一生的話題。隱私教育從少兒就要開始,就像性教育一樣重要。
中國(guó)文化缺乏數(shù)據(jù)的因子
環(huán)球人物雜志:中美大數(shù)據(jù)應(yīng)用上有何差別?
涂子沛:差別很大。從工具層面上講,基本所有應(yīng)用工具都是外來的,中國(guó)連一款像樣的軟件都沒有。在理論層面,統(tǒng)計(jì)學(xué)等科學(xué)的起源都在西方,大數(shù)據(jù)本身也是美國(guó)人提出的一個(gè)概念。而在意識(shí)層面,中國(guó)文化也缺乏數(shù)據(jù)的因子。
環(huán)球人物雜志:您認(rèn)為這種差別的根源何在?
涂子沛:中國(guó)在歷史上缺乏這種數(shù)據(jù)文化。中國(guó)數(shù)學(xué)歷史學(xué)家張奠宙先生曾講過,古希臘的民主政治推動(dòng)了數(shù)學(xué)的發(fā)展。在古希臘的政治環(huán)境下,要想證明自身觀點(diǎn)的正確性,需要在平等的基礎(chǔ)上,用充分的理由說服對(duì)方,反映在學(xué)術(shù)上,就是“證明”。歐幾里得的名作《幾何原本》就是在這樣的背景下產(chǎn)生的。相比之下,中國(guó)歷史上數(shù)學(xué)家的工作則主要是丈量田畝、興修水利、計(jì)算稅收等,是“管理數(shù)學(xué)”和“木匠數(shù)學(xué)”,缺乏抽象的數(shù)學(xué)思維。
環(huán)球人物雜志:您在書中說,試圖在中國(guó)把數(shù)據(jù)從科技符號(hào)轉(zhuǎn)變?yōu)槲幕?hào),二者的區(qū)別是什么?
涂子沛:科技符號(hào)當(dāng)然是讓人產(chǎn)生科技聯(lián)想的,比如二氧化碳的化學(xué)符號(hào),你一看就知道說的是這個(gè)東西。文化符號(hào)不一樣,它和每個(gè)人息息相關(guān),看不見但卻深深影響你。比如一說龍就想到中國(guó)、炎黃子孫。大數(shù)據(jù)變成文化符號(hào)以后,每個(gè)人就會(huì)更傾向于用數(shù)據(jù)解決問題。舉個(gè)簡(jiǎn)單的例子,在餐廳吃飯,老有人抱怨“都來這么久了,菜怎么還沒上?”“久”是多長(zhǎng)時(shí)間,每個(gè)人標(biāo)準(zhǔn)不同,其實(shí)他可能才來了10分鐘。
對(duì)大數(shù)據(jù)的認(rèn)識(shí)和使用,我們已經(jīng)起步晚了。未來在這方面,政府應(yīng)該發(fā)揮主導(dǎo)作用,首先在公共領(lǐng)域推行數(shù)據(jù)治國(guó)的理念,力爭(zhēng)在全社會(huì)形成“用數(shù)據(jù)說話、用數(shù)據(jù)管理、用數(shù)據(jù)決策、用數(shù)據(jù)創(chuàng)新”的文化氛圍和時(shí)代特點(diǎn)。