他在2008年美國(guó)大選中曾準(zhǔn)確預(yù)測(cè)了49個(gè)州的選舉結(jié)果,而2012年的美國(guó)大選,他則準(zhǔn)確預(yù)測(cè)了全部50個(gè)州的選舉結(jié)果。34歲的內(nèi)特·希爾沃憑著自己的數(shù)學(xué)模型打敗了所有時(shí)政記者、政黨媒體顧問(wèn)和政治評(píng)論員。美國(guó)公眾沸騰了,媒體稱(chēng)他為超級(jí)極客、“算法之神”,并認(rèn)為其成功讓所有書(shū)果子揚(yáng)眉吐氣。
準(zhǔn)確預(yù)測(cè)美大選結(jié)果
內(nèi)特·希爾沃可以說(shuō)是超級(jí)政治明星,他知道自己在說(shuō)什么。在美國(guó)人看來(lái),權(quán)威專(zhuān)家一直是擁有合適的發(fā)型、潔白的牙齒或者符合保守派觀點(diǎn)的人。希爾沃完全不符合這些條件,他有的只是數(shù)據(jù),許許多多的數(shù)據(jù),而美國(guó)總統(tǒng)大選之夜證實(shí)了這些數(shù)據(jù)的準(zhǔn)確性。
投票前,許多評(píng)論家都認(rèn)為無(wú)法預(yù)計(jì)哪方會(huì)獲勝。他們預(yù)計(jì)本次選舉兩名候選人的得票率將不相上下。但事實(shí)并非如此。結(jié)果證明奧巴馬和羅姆尼完全不是旗鼓相當(dāng),正如希爾沃幾個(gè)月來(lái)的預(yù)測(cè)。在大選日當(dāng)天,他預(yù)測(cè)奧巴馬將有90.9%的可能獲得大半選舉人票,如果按州計(jì)算,他準(zhǔn)確預(yù)測(cè)了所有州的選舉結(jié)果。
“你們知道誰(shuí)是今晚(選舉開(kāi)票夜)的贏家嗎?”美國(guó)微軟全國(guó)廣播公司節(jié)目新聞主播自問(wèn)自答,“是內(nèi)特·希爾沃。”
“算法之神”受到狂熱追捧
推特瞬間沸騰了,各大博客網(wǎng)站也為希爾沃沸騰了。希爾沃的處女作《信號(hào)和噪音:預(yù)測(cè)學(xué)的藝術(shù)與科學(xué)》的銷(xiāo)量一夜間增長(zhǎng)800%,排到了暢銷(xiāo)榜第二位。媒體一致認(rèn)為本次大選預(yù)測(cè)的成功并不只是希爾沃個(gè)人的勝利,它還使所有書(shū)呆子都揚(yáng)眉吐氣。希爾沃憑他的數(shù)學(xué)模型打敗了所有時(shí)政記者、政黨媒體顧問(wèn)和政治評(píng)論員。
希爾沃一點(diǎn)也不像電視新星,也不像《華盛頓郵報(bào)》所說(shuō)的言論界新寵,現(xiàn)年34歲的他反倒更像美劇《超人前傳》中克拉克肯特變身前的形象。他謙遜而不招搖,當(dāng)他低著頭拖著步子走進(jìn)屋里,他似乎對(duì)自己被采訪而感到尷尬。
“整個(gè)事情變得有點(diǎn)瘋狂,”他說(shuō),但他并不認(rèn)為這種狂熱與他有關(guān),“我仿佛具有這種象征性力量,然而人們對(duì)我所做事情的推崇遠(yuǎn)超了我所應(yīng)得的。我必須首先說(shuō)明大家應(yīng)該知道兼聽(tīng)則明,而不是把某個(gè)人的意見(jiàn)當(dāng)成神諭。”
然而,這忠告似乎來(lái)得有點(diǎn)晚了。大選后的第二天當(dāng)他出現(xiàn)在《每日秀》脫口秀節(jié)目時(shí),節(jié)目主持人喬恩斯圖爾特稱(chēng)他為“算法之神”。
選舉前的數(shù)周,他的批評(píng)者們(大多數(shù)是不滿(mǎn)他預(yù)測(cè)奧巴馬將獲勝的保守派們)不僅攻擊了他的預(yù)測(cè)方法,還對(duì)他進(jìn)行了人身攻擊。迪安錢(qián)伯斯召集人們抵制希爾沃的“巫術(shù)數(shù)據(jù)”,宣稱(chēng)他神志不清,并嘲諷他是個(gè)矮小瘦弱的娘娘腔。
不過(guò)從某些角度來(lái)說(shuō),人們的奉承似乎更難以應(yīng)付。“奉承的話(huà)讓我感到緊張,因?yàn)槲掖_定我們將會(huì)出錯(cuò)?!边@里的“我們”指的是他在2007年設(shè)立的提供以數(shù)據(jù)為主的時(shí)政分析的博客“FiveThirtyEight”(因538張選舉人票總數(shù)得名)。2010年,他把博客轉(zhuǎn)移到了《紐約時(shí)報(bào)》的網(wǎng)站上。
希爾沃那界面簡(jiǎn)陋的博客在大選前為《紐約時(shí)報(bào)》網(wǎng)站帶來(lái)了20%的瀏覽量。如果說(shuō)希爾沃不是“大數(shù)據(jù)”超人,那么他肯定是超級(jí)極客,也是極客界的偶像級(jí)人物。
用數(shù)學(xué)模型分析棒球
希爾沃一直是數(shù)據(jù)的愛(ài)好者?!拔乙恢倍急蝗朔Q(chēng)作書(shū)呆子?!彼錾谠诿苄荩亦l(xiāng)的棒球隊(duì)底特律猛虎在他6歲的時(shí)候贏得了美國(guó)職業(yè)棒球全國(guó)錦標(biāo)賽的冠軍,而他也是在那個(gè)時(shí)候接觸了各種統(tǒng)計(jì)數(shù)據(jù)并愛(ài)上了數(shù)據(jù)。
從芝加哥大學(xué)獲得經(jīng)濟(jì)學(xué)學(xué)位后,他在專(zhuān)門(mén)提供審計(jì)、稅務(wù)和咨詢(xún)等服務(wù)的畢馬威公司當(dāng)了4年顧問(wèn),接著,他開(kāi)始迷上了網(wǎng)絡(luò)撲克。那時(shí)候許多玩網(wǎng)絡(luò)撲克的人對(duì)撲克并沒(méi)有很多了解,而他卻能從他們手中贏錢(qián),這些錢(qián)足夠讓他辭掉工作靠玩撲克養(yǎng)活自己。
撲克就像希爾沃生命中的天然磁石,不僅教會(huì)了他抓住機(jī)遇,還使他明白機(jī)遇在人生中扮演怎樣的角色。“玩撲克對(duì)我而言是最好的訓(xùn)練,我從中學(xué)會(huì)了怎樣衡量新信息的作用,怎樣辨別信息的重要性。我們的直覺(jué)在分析信息方面并不是十分在行,我們總是傾向于高估新信息的重要性?!?/p>
希爾沃說(shuō):“技巧和運(yùn)氣間存在著微妙而又模糊的關(guān)聯(lián)。贏錢(qián)的時(shí)候是因?yàn)榕萍己眠€是運(yùn)氣好,你永遠(yuǎn)也不知道?!毕栁止浪闼约寒?dāng)時(shí)從網(wǎng)絡(luò)賭博中贏了有大概40萬(wàn)美元,這些錢(qián)足夠他去追求他另一項(xiàng)愛(ài)好棒球。棒球這項(xiàng)體育運(yùn)動(dòng)正在不斷的改變中,而希爾沃是最早發(fā)現(xiàn)這項(xiàng)運(yùn)動(dòng)有數(shù)據(jù)導(dǎo)向潛在可能性的少數(shù)人之一。他后來(lái)建立了Peeota網(wǎng)站,該網(wǎng)站建模分析預(yù)測(cè)美國(guó)職業(yè)棒球大聯(lián)盟運(yùn)動(dòng)員的職業(yè)前景,后來(lái)他又把該網(wǎng)站賣(mài)給了《棒球簡(jiǎn)介》。
棒球預(yù)測(cè)就像一場(chǎng)保守的情報(bào)員與善于分析數(shù)據(jù)的新成員之間的斗爭(zhēng),這場(chǎng)斗爭(zhēng)后來(lái)被邁克爾·路易斯在暢銷(xiāo)書(shū)《點(diǎn)球成金》中記錄了下來(lái),后來(lái)布拉德坡特主演了同名電影。2007年,希爾沃開(kāi)始尋找新的契機(jī)。
擔(dān)心會(huì)在未來(lái)影響選情
“我當(dāng)時(shí)在尋找像棒球分析那樣的,有龐大的數(shù)據(jù)庫(kù)而且鮮有競(jìng)爭(zhēng)者的新領(lǐng)域,就在那個(gè)時(shí)候我找到了政治這個(gè)領(lǐng)域?!逼鸪?,他使用筆名“Poblmo”。幾個(gè)月后,他開(kāi)始使用真名。
希爾沃覺(jué)得自己當(dāng)時(shí)將已有的數(shù)據(jù)套用貝葉斯理論,如此一來(lái)他將“小有優(yōu)勢(shì)”。美國(guó)政治領(lǐng)域原本就充斥著許多數(shù)據(jù),而他所使用的貝葉斯理論也不是什么尖端科技。英國(guó)神父貝葉斯于18世紀(jì)初發(fā)現(xiàn)了計(jì)算有條件的事件發(fā)生可能性的貝葉斯理論。
在美國(guó)政治評(píng)論圈里,希爾沃的選情分析是前所未有地準(zhǔn)確。希爾沃不會(huì)見(jiàn)說(shuō)客、黨派媒體顧問(wèn)、競(jìng)選經(jīng)理及新聞發(fā)言人之類(lèi)的人。簡(jiǎn)而言之,他不是“體制內(nèi)”的人。美英兩國(guó)的政治報(bào)道就像一個(gè)類(lèi)似壟斷集團(tuán)的體制。在英國(guó),政治圈里彌漫的這種狼狽為奸的氛圍是在議員報(bào)銷(xiāo)丑聞后才受到質(zhì)疑,而這丑聞則是政治圈外的記者最早曝光的。在美國(guó),希爾沃將政治形容成“交易”。
“如果你表現(xiàn)良好,偶爾會(huì)得到獨(dú)家消息,但這不過(guò)是許多既得利益間的游戲。我盡量回避和兩邊的競(jìng)選團(tuán)隊(duì)打交道,因?yàn)樗麄兯o的信息大都是干擾性的噪音?!庇幸馑嫉氖?,競(jìng)選團(tuán)隊(duì)(尤其是奧巴馬的團(tuán)隊(duì))本身也清楚數(shù)據(jù)的重要性。據(jù)奧巴馬團(tuán)隊(duì)的競(jìng)選經(jīng)理吉姆梅西納稱(chēng),他們請(qǐng)了一位“首席專(zhuān)家”,目的是“量化一切”。數(shù)據(jù)告知他們應(yīng)當(dāng)關(guān)注哪些選民及如何吸引他們。由此看來(lái),希爾沃的技能對(duì)競(jìng)選活動(dòng)至關(guān)重要。
希爾沃認(rèn)為“書(shū)呆子”才是他的“秘密武器”?!拔铱傆X(jué)得自己是個(gè)局外人。我身邊總有朋友,可是我總是有跟他們不一樣的觀點(diǎn)。我覺(jué)得這點(diǎn)很重要?!毕栁譂u漸開(kāi)始擔(dān)心:他的能力是否意味著將來(lái)他不僅能預(yù)測(cè)選舉結(jié)果,還將影響選情。此外,他還擔(dān)心失去旁觀者的優(yōu)勢(shì)?!拔耀@得各種機(jī)遇,不過(guò)我不希望自己墮落或者淹沒(méi)在體制內(nèi)。”
希爾沃正在尋找下一個(gè)目標(biāo)——個(gè)擁有許多數(shù)據(jù)卻沒(méi)有太多競(jìng)爭(zhēng)對(duì)手的領(lǐng)域。他認(rèn)為經(jīng)濟(jì)新聞是一個(gè)不錯(cuò)的選擇,而地方政府選舉則是“難以預(yù)測(cè)”。幾年前他曾經(jīng)對(duì)紐約的社區(qū)進(jìn)行過(guò)分析,“你可以通過(guò)自己所關(guān)注的因素(例如綠化空間和好學(xué)校)結(jié)合從市長(zhǎng)辦公室獲得的數(shù)據(jù),得到個(gè)性化的居住社區(qū)選擇分析?!?/p>
希爾沃在成功預(yù)測(cè)了2008年美國(guó)大選結(jié)果(準(zhǔn)確預(yù)測(cè)了50個(gè)州中49個(gè)州的選舉結(jié)果)后簽下了一份價(jià)值70萬(wàn)美元的出版合約,他在書(shū)的序言里坦言,與出版社簽約的原因是希望他能寫(xiě)出一本“書(shū)呆子的勝利”之類(lèi)的書(shū)。但當(dāng)時(shí)沒(méi)有人能料到他會(huì)有多大的成就。