鄭渝川
一提到大數(shù)據(jù),很多人就會(huì)想到谷歌的“流感趨勢(shì)”預(yù)測(cè)系統(tǒng)。2008年起,谷歌就在監(jiān)控跟流感相關(guān)的搜索項(xiàng),這一項(xiàng)目由數(shù)據(jù)驅(qū)動(dòng),最終成為一項(xiàng)效率上遠(yuǎn)超美國(guó)官方衛(wèi)生部門及醫(yī)療行業(yè)監(jiān)控效能的公共衛(wèi)生預(yù)警系統(tǒng)。
然而,2012—2013年的流感高發(fā)期,谷歌的預(yù)測(cè)系統(tǒng),準(zhǔn)確性卻發(fā)生了下滑,預(yù)測(cè)數(shù)據(jù)稱11%的美國(guó)人將在高峰期患上流感,實(shí)際情況卻只有6%。這樣的誤判并非個(gè)例。
谷歌的流感趨勢(shì)系統(tǒng)經(jīng)常被看做是大數(shù)據(jù)方法獲得勝利的證據(jù)。誤判的存在,卻也說(shuō)明,依托于對(duì)實(shí)時(shí)數(shù)據(jù)及其相關(guān)性的算法進(jìn)行識(shí)別分析,很可能遺漏語(yǔ)境,產(chǎn)生高估或低估。流感趨勢(shì)系統(tǒng)曾被證明其預(yù)測(cè)準(zhǔn)確,贏得公共衛(wèi)生部門及醫(yī)療行業(yè)的信任。如果這種信任延續(xù),公共衛(wèi)生部門顯然會(huì)根據(jù)大數(shù)據(jù)預(yù)測(cè)調(diào)撥應(yīng)急物資,通知企業(yè)生產(chǎn)疫苗,并適時(shí)啟動(dòng)應(yīng)急預(yù)案——這種情況下,要是出現(xiàn)誤判,不僅會(huì)造成資源浪費(fèi),還可能因資源錯(cuò)配使得疫病傳播等緊急情況變得更為突出。
金融行業(yè)更早引入數(shù)據(jù)挖掘分析的理念和工具,甚至因此形成對(duì)數(shù)據(jù)分析及預(yù)測(cè)的盲目崇拜。2008年美國(guó)金融危機(jī)及之后引發(fā)的歐債危機(jī)表明,數(shù)據(jù)分析不能僅僅依托于相關(guān)性分析。金融行業(yè)、商業(yè)領(lǐng)域,戰(zhàn)略與政策制定既需要積極借助數(shù)據(jù)挖掘分析來(lái)提高精準(zhǔn)度,同樣也需要融合反映因果關(guān)系的理論、假設(shè)、觀念。而這本身正是大數(shù)據(jù)時(shí)代需要進(jìn)一步深化提升的重要目標(biāo)。
普利策獎(jiǎng)獲獎(jiǎng)團(tuán)隊(duì)成員史蒂夫·洛爾所著的《大數(shù)據(jù)主義》,向讀者展現(xiàn)了一幅仍在野蠻生長(zhǎng)、不斷優(yōu)化完善的大數(shù)據(jù)進(jìn)化圖景。很多人可能因?yàn)榇髷?shù)據(jù)已經(jīng)體現(xiàn)的分析威力和應(yīng)用效益,而忽略大數(shù)據(jù)的發(fā)展與應(yīng)用。大數(shù)據(jù)的未來(lái)應(yīng)用前景、理論上應(yīng)當(dāng)實(shí)現(xiàn)的作用,目前還沒有得到比較完美的積極呈現(xiàn),包括數(shù)據(jù)科學(xué)家在內(nèi)的各界學(xué)者、企業(yè)家、公司人、消費(fèi)者,都還在路上。
《大數(shù)據(jù)主義》這本書不同于之前以大數(shù)據(jù)為主題的許多商業(yè)暢銷書,作者為了說(shuō)明大數(shù)據(jù)的演進(jìn)特點(diǎn),選取了大數(shù)據(jù)主義思想的典型代表、雅虎的前數(shù)據(jù)工程師杰夫·哈梅巴赫,以及數(shù)據(jù)時(shí)代最為成功的標(biāo)桿企業(yè)之一的IBM公司,分別以這樣一個(gè)數(shù)據(jù)科學(xué)家和數(shù)據(jù)企業(yè)為樣本,深入介紹了大數(shù)據(jù)時(shí)代是如何隨著數(shù)據(jù)理念、技術(shù)和方法的不斷發(fā)展而前進(jìn)。作者并不諱言在大數(shù)據(jù)時(shí)代的各階段,數(shù)據(jù)理念、技術(shù)和方法都存在相應(yīng)的局限性甚至缺陷,包括在起步階段早期對(duì)相關(guān)性、可測(cè)量性的過(guò)度推崇,但強(qiáng)調(diào)數(shù)據(jù)科學(xué)具有很強(qiáng)的開放性,將積極融合其他學(xué)科領(lǐng)域的成果,增強(qiáng)對(duì)于醫(yī)藥、能源、農(nóng)藥等行業(yè)運(yùn)作情況的把握。
大數(shù)據(jù)主義的基本內(nèi)核,是要求猜測(cè)和基于經(jīng)驗(yàn)的推理,服從于基于數(shù)據(jù)分析的科學(xué)判斷。這并不是說(shuō)經(jīng)驗(yàn)與直覺就毫無(wú)意義,事實(shí)上,“好的直覺其實(shí)就是大量數(shù)據(jù)的綜合,只不過(guò)這些數(shù)據(jù)難以量化為數(shù)字罷了”。大數(shù)據(jù)時(shí)代的演進(jìn),通過(guò)計(jì)量與數(shù)據(jù)水平的提升,人類的直覺與經(jīng)驗(yàn)不僅有望更為清晰的具象化,轉(zhuǎn)化為數(shù)據(jù),而且還能反過(guò)來(lái)為科學(xué)、藝術(shù)、醫(yī)學(xué)及其他方面的擁有豐富經(jīng)驗(yàn)、良好直覺的天才進(jìn)一步提高自己的判斷能力服務(wù)。
借助大數(shù)據(jù),更多企業(yè)和公共部門將原本雜亂無(wú)章的信息,梳理得井然有序,為構(gòu)建人類行為模型提供助力,依據(jù)各方面翔實(shí)準(zhǔn)確的數(shù)據(jù),算法可以精確量化人的性格特征,精準(zhǔn)預(yù)測(cè)人的行為不再只是空想。當(dāng)然,這也因此引發(fā)倫理爭(zhēng)議,人們擔(dān)憂受到更多操縱,會(huì)因?yàn)殡[私的更多外泄遭遇更多風(fēng)險(xiǎn)。
(《大數(shù)據(jù)主義》, [美]史蒂夫·洛爾 著,中信出版社2015年9月版)
新書推薦
《胡耀邦文選》
中共中央文獻(xiàn)編輯委員會(huì) 編
人民出版社
2015年11月版
這部文選,收入了胡耀邦同志1952年5月至1986年10月這段時(shí)間內(nèi)的重要著作77篇,約49萬(wàn)字,包括文章、講話、報(bào)告、談話、批示、書信、題詞等,相當(dāng)一部分是第一次公開發(fā)表。
《頹廢與沉默:透視犬儒文化》
徐 賁 著
東方出版社
2015年7月版
犬儒原指古希臘犬儒學(xué)派的哲學(xué)家。他們提出絕對(duì)的個(gè)人精神自由,輕視一切社會(huì)虛套、習(xí)俗和文化規(guī)范,過(guò)著禁欲的簡(jiǎn)陋生活,被當(dāng)時(shí)人譏為窮犬,故稱。后亦泛指具有這些特點(diǎn)的人。面對(duì)中國(guó)現(xiàn)階段知識(shí)分子的犬儒心態(tài)、社會(huì)的犬儒主義狀態(tài),作者針砭時(shí)弊,鼓勵(lì)人們思考和反思,共同尋求解救之道。
《宮崎市定中國(guó)史》
[日]宮崎市定 著
浙江人民出版社
2015年11月版
日本歷史學(xué)家、漢學(xué)家宮崎市定畢生致力于中國(guó)史的研究與教學(xué)。本書是他積40年研究與教學(xué)經(jīng)驗(yàn)、面向普通讀者的結(jié)晶之作,以世界史眼光和社會(huì)經(jīng)濟(jì)史視角把精致的實(shí)證研究與大氣恢弘的通史敘述緊密結(jié)合,集中體現(xiàn)了他的研究成果和特色。
《權(quán)力與選擇:政治科學(xué)導(dǎo)論》
[美]W.菲利普斯·夏夫利 著
世界圖書出版公司·后浪出版公司
2015年9月版
本書最大的特點(diǎn)在于,從“權(quán)力”與“選擇”兩個(gè)角度來(lái)剖析解讀政治,通過(guò)這條主線,將零碎的知識(shí)組合成完備的政治學(xué)體系。作者從政治的概念、國(guó)家與公共政策、公民與政體、國(guó)家機(jī)器、國(guó)際政治這五方面入手,引導(dǎo)讀者全面詳盡地理解政治學(xué)的知識(shí)領(lǐng)域。