陳賽
一場沒有懸念的人機大戰(zhàn)
這是一場沒有懸念的比賽。至少,誰輸誰贏,根本沒有任何懸念。全世界都知道柯潔會輸。畢竟,我們都領(lǐng)教過AlphaGo的進化速度:
2015年10月,第一代AlphaGo以5∶0第一次擊敗歐洲冠軍樊麾;
2016年3月,第二代AlphaGo以4∶1擊敗李世石,過去10年里最偉大的人類圍棋手。
從樊麾到李世石,對人類可能是一輩子都無法跨越的鴻溝,而AlphaGo只花了5個月時間。
AlphaGo進化史
第一代,是擊敗樊麾的AlphaGo Fan。與Zen/Crazy Stone等之前的圍棋軟件相比,棋力要高出4子。
第二代,是擊敗李世石的AlphaGo Lee。與上一代相比,棋力高出3子。
第三代,是柯潔如今的對手,也是年初60連勝的:AlphaGo Master。相比于擊敗李世石的版本,棋力又再次提升3子。
在李世石之后,AlphaGo又經(jīng)歷了一輪新的進化:
DeepMind修補了當時與李世石決戰(zhàn)時系統(tǒng)暴露的漏洞。整個系統(tǒng)架構(gòu)經(jīng)過了重新設(shè)計,神經(jīng)網(wǎng)絡(luò)從原來的12層增加到40層,而且,不再借助人類棋譜,而是完全通過機器的自我對弈來訓練——通過這種自我對弈產(chǎn)生高質(zhì)量的數(shù)據(jù),這意味著它正在按照它的創(chuàng)造者德米斯·哈薩比斯最初制定的目標演化——一個能夠自主學習、自我適應的智能體。
經(jīng)過一年的算法結(jié)構(gòu)優(yōu)化,從李世石版的50個TPU(谷歌專門為機器學習而設(shè)計的處理器)并行式運算,變成由4個TPU組成“單機版”,運算量降低了90%。AlphaGo的訓練時間不再以月計算,而是以周計算。
AlphaGo Lee,運行于谷歌云,耗用50個TPU進行計算,每次搜索計算后續(xù)50步,計算速度為10000個位置/秒,2016年在首爾擊敗李世石。
AlphaGo Master,運行于谷歌云,但只用一個TPU機器,自學成才,AlphaGo自我對弈提高棋力,擁有更強大的策略/價值網(wǎng)絡(luò)。
從某種角度來說,我們已經(jīng)見識了新版的AlphaGo有多強大——2017新年,AlphaGo再次以“Master”的網(wǎng)名在各大圍棋對弈網(wǎng)站連勝60場,擊敗了當世幾乎所有的頂尖高手。
柯潔與AlphaGo的第一局賽后,DeepMind的首席科學家大衛(wèi)·席爾瓦(David Silver)透露AlphaGo Master可以讓李世石版本的AlphaGo 3個子,立刻引來全場嘩然。午餐的時候,我剛好坐在一桌棋手邊上,所有人都在談?wù)?子,全是一副下巴掉下來的表情。
這個差距有多大呢?
用柯潔的話說,“簡單地解釋一下就是,一人一手輪流下的圍棋,對手連續(xù)讓你下三步……又像武林高手對決讓你先捅三刀一樣……”
后來,大衛(wèi)·席爾瓦特意向所有媒體寫信做了更正:“新版本的AlphaGo,已經(jīng)過幾百萬次的自我訓練,并在檢測舊版本弱點方面表現(xiàn)出色。也因此,新版本的AlphaGo可以讓舊的版本3子。但當AlphaGo與從未對弈過的人類棋手對局時,這樣的優(yōu)勢就不復存在了,尤其是柯潔這樣的圍棋大師,他可能幫助我們發(fā)現(xiàn)AlphagGo未曾展露的新弱點。這樣的衡量標準是無法比較的?!?/p>
盡管如此,我們還是疑惑,為什么還有必要再進行一次人機大戰(zhàn)?
是谷歌重回中國市場的一次外交嘗試,還是相信DeepMind的官方解釋,“這是因為盡管已經(jīng)連戰(zhàn)連捷,AlphaGo仍然有繼續(xù)探索的空間。我們?nèi)匀幌朐趪孱I(lǐng)域繼續(xù)追問:我們離最優(yōu)解還有多遠?怎樣才是完美棋局?人類3000年的對弈沒有找到最佳下法,AlphaGo可以與人類棋手共同探尋這些奧秘”。
去年的那場人機大戰(zhàn),AlphaGo對戰(zhàn)李世石,用李世石自己的話說,第一局震驚,第二局無語,第三局深感無力,第四局力挽狂瀾、贏回一局,到第五局再度落敗時,深深嘆息人類創(chuàng)造力的局限性。
這次柯潔與AlphaGo Master的比賽,到本文發(fā)稿之前為止,已經(jīng)輸了兩場。但去年那種悲情的氣氛已經(jīng)消失了,取而代之的,是對于一種異類智能的好奇、敬畏,甚至拜服。
在比賽現(xiàn)場,不少九段棋手追著DeepMind的工程師,想要觀摩AlphaGo的后臺數(shù)據(jù)——AlphaGo每走一步對雙方的勝負概率都有預估。他們急于知道,機器到底是怎么評價人類的表現(xiàn)的。
不止一位九段棋手表示,很愿意被讓2子,甚至3子,與AlphaGo Master對弈,以了解對方的真實水平。
每一個頂尖棋手都在苦心鉆研年初AlphaGo Master掃蕩棋壇后留下的60張棋譜。作為棋手,他們不得不承認,AlphaGo對圍棋是有它自己的“理解”的,而且這種理解的強大與精妙之處,遠遠超出了人類的想象。
“很多棋,我們理解不了,我們理解不了的時候就說我喜歡這樣,我個性如此……”在第一局賽事后的間歇,著名的九段棋手江鑄久這樣告訴我,“比如,如果不是AlphaGo,我們不會理解吳清源有多好。AlphaGo的招式是從16萬張人類棋譜里選出來的,選出來很多是吳清源的招式?!?/p>
他再次談起AlphaGo與李世石的第二局比賽中的第37手?!坝腥苏J為不夠好,有人表示看不懂,當時我一看,就覺得熱淚盈眶,我想,莫非是吳老師回來了?”
“只有吳清源才會這么下棋。”
AlphaGo可以走多遠?
從某種角度來說,是歷史選定了這些圍棋手,作為第一批與“機器智能”正面交鋒的人類,領(lǐng)悟這種智能的強大與奇妙,詭譎與怪異,并被迫重新評估自身的角色、信仰、目標、身份。
作為一名觀戰(zhàn)者,這次人機大戰(zhàn)對我最大的觸動之一,就是這些頂級的棋手對于AlphaGo沒有絲毫輕慢之心。連曾經(jīng)那么年少輕狂的柯潔,也在第二局戰(zhàn)敗之后這樣感慨:“在AlphaGo沒出現(xiàn)之前,我可能對棋的了解有50%。AlphaGo出現(xiàn)之后,我對人生看法都有巨大改變,未來不是我等凡夫俗子可以預測的。如果對圍棋規(guī)則了解就算知道1%,我可能只能算是知道2%。”
是的,未來不是我們這些凡夫俗子所能預測。這場人機大戰(zhàn)真正的懸念也許在于AlphaGo的未來。它還可以走多遠?它還可以變得多強大?如果一個科技公司能在兩三年的時間內(nèi)把一個機器訓練成圍棋大師,是否也可以把更多的機器訓練成一個律師、一個醫(yī)生、一個程序員,甚至一個作家、一個藝術(shù)家?對于人類而言,這到底是福是禍?
事實上,AlphaGo的腳步并不止于圍棋。哈薩比斯曾經(jīng)說過,他創(chuàng)辦DeepMind真正的目的是攻克人類的“智力”難題。他認為,學習和通用(general)是人類智力最根本的特征。他想發(fā)明一種“通用人工智能”(General AI)——不是自上而下,一點點教機器規(guī)則,讓它從規(guī)則中理解語言、識別人臉;而是自下而上,讓機器像人類一樣,從觀察、經(jīng)驗中學習,像人類一樣根據(jù)環(huán)境的變化做出靈活的決策,像人類一樣舉一反三,執(zhí)行各種不同的任務(wù)。
機器真能這樣智能嗎?
2015年,美國麻省理工學院一次關(guān)于人工智能的研討會上,有人問喬姆斯基怎么看機器學習,他的反應是嗤之以鼻,認為不過是數(shù)據(jù)預測,一場華麗的天氣預報而已。即使神經(jīng)網(wǎng)絡(luò)的翻譯獲得了某種完美的功能性,它仍然無法揭示語言的本質(zhì)。機器也許能比人類醫(yī)生更好地檢測腫瘤,但機器永遠不會告訴你是什么引發(fā)了腫瘤。
但谷歌一向是典型的工程師思維。對他們來說,人工智能更重要的不是關(guān)于理解心智的本質(zhì),而是關(guān)于制造工具、解決現(xiàn)實的問題。
事實上,根據(jù)谷歌在“人工智能的未來”論壇上(與此次人機大戰(zhàn)同期舉行)發(fā)布的數(shù)據(jù),他們的機器學習模型診斷眼疾的準確率,甚至高于一些通過美國認證委員會認證的眼科醫(yī)生。這些模型還能比放射科醫(yī)生更快地在醫(yī)學影像中找到腫瘤,甚至根據(jù)病理報告的文本做出診斷。
在這次論壇上,哈薩比斯還透露,AlphaGo的算法已經(jīng)被應用于谷歌數(shù)據(jù)中心的節(jié)電項目,并成功節(jié)能40%。至于它的未來,可以在材料、醫(yī)療、智能手機和教育等各種領(lǐng)域。
“癌癥、氣候變遷、能源、基因組學、宏觀經(jīng)濟學、金融系統(tǒng)、物理學等,太多我們想掌握的系統(tǒng)知識正變得極其復雜。如此巨大的信息量讓最聰明的人窮其一生也無法完全掌握。那么,我們?nèi)绾尾拍軓娜绱她嫶蟮臄?shù)據(jù)量中篩選出正確的見解呢?而一種通用人工智能思維的方式則是自動將非結(jié)構(gòu)化信息轉(zhuǎn)換為可使用知識的過程。我們所研究的東西可能是針對任何問題的元解決方法(meta-solution)?!?/p>
“神經(jīng)網(wǎng)絡(luò)和深度學習的爆發(fā)是我此生所經(jīng)歷過的最大變革?!鼻皝韰⒓尤藱C大戰(zhàn)的谷歌董事長埃里克·施密特(Eric Schmidt)在賽后的一次對談中這樣表示。
“在谷歌內(nèi)部,人工智能不只是研發(fā)人員的事情,而是貫穿整個公司的戰(zhàn)略和技術(shù)。無論硬件領(lǐng)域、產(chǎn)品組、服務(wù)組等,都在AI的連接下交叉配合,比如谷歌翻譯、谷歌照片、谷歌醫(yī)療、無人車等產(chǎn)品和項目,背后都有人工智能貫穿其間?!?/p>
與去年一樣,在激烈的比賽間隙,杰夫·迪恩(Jeff Dean),谷歌工程師的精神領(lǐng)袖,也是谷歌大腦的負責人于百忙之中介紹了谷歌大腦在過去一年的技術(shù)進展。從項目上看與去年韓國首爾所見似乎沒有什么大的區(qū)別,但技術(shù)進展的加速度卻令人震驚。以圖片識別為例,2011年,機器的圖像識別錯誤率為26%,到2016年已經(jīng)降低到了3%,比人類的識別錯誤率(5%)還要低。
在媒體上引發(fā)最大轟動的,是在過去9個月的時間里,谷歌徹底拆除了原先的翻譯系統(tǒng),引入神經(jīng)網(wǎng)絡(luò),大幅提高了翻譯的準確率,其中一些語言的準確率甚至提高了85%。隨之發(fā)布的多語言互譯系統(tǒng),將兩種語言的翻譯學習“遷移”到更多的語種,比如通過中英互譯的學習,就能直接把模型算法遷移到中日、日英等多語種互譯方面。如杰夫·迪恩所說,機器“學習如何學習”,將是谷歌未來最重要的研究方向。
舊翻譯系統(tǒng):基于短語的翻譯,先把句子分成一個個短語和單詞,然后獨立翻譯,最后對翻譯出來的獨立短語解釋進行邏輯整理,變成句子
新翻譯系統(tǒng):神經(jīng)機器翻譯,將整個句子視作翻譯單元,對句子中的每一部分進行帶有邏輯的關(guān)聯(lián)翻譯,翻譯每一個字或單詞時都包含著整句話的邏輯
我們應該警惕的危機
當我們想象人工智能未來的時候,總是想著庫茲韋爾那些關(guān)于“奇點”的古怪預言,比如不久的將來,我們會制造出比我們更聰明的機器,它們再造出比它們自己更聰明的機器,如此這般,整個世界朝著我們無法預計的巨型超智能的方向狂奔;再比如,我們很快就能將人的思維載入計算機中,在計算機的電路里獲得超強的智力,甚至永生。2014年的反烏托邦電影《超驗駭客》中就有一個情節(jié)受此啟發(fā),其中有個類似庫茲韋爾的科學家,他的思維被人載入網(wǎng)絡(luò),給人類帶來了毀滅性的后果。
去年,尤瓦爾·赫拉利來中國宣傳他的《人類簡史》時,我有機會采訪到他。他談到當今世界最重要的變化,就在于“權(quán)力和權(quán)威正在從人類轉(zhuǎn)移到人工智能、到算法等,而人類卻毫無知覺”。
是的,今天的人工智能與人類智能還有著本質(zhì)的差異——它不具備情感、不具備欲望,所以,它不會有統(tǒng)治世界、奴役人類的興趣與野心。但無人駕駛汽車不需要任何欲望或情感就能代替司機,因為按照現(xiàn)實世界經(jīng)濟系統(tǒng)的設(shè)定,司機的工作就是把人/物從a送到b,廉價、迅速即可。如果在這方面機器做得更出色,經(jīng)濟系統(tǒng)就會更傾向于機器,而不是有欲望、有情感的人,于是人就變成了多余。
關(guān)于人工智能,我們應該警惕的危機,不是“奇點”,不是超級智能,不是人機大戰(zhàn),而是當下這些因為具備了越來越強的學習能力而變得越來越聰明的平凡機器。
當然,從機器學習到機器理解,人工智能還有很遠的路要走,就像一位人類學家告訴我的,“相信奇點,就像重新相信上帝一樣”。但是,作為人類,我們對于這些“聰明”的機器的信任已經(jīng)超過了自己,而近乎相信上帝了。
本來,上帝死后,人是一切世界意義和權(quán)威的來源,而人的感情、人的感覺、人的自由選擇是所有問題最終的答案。但現(xiàn)在,我們正不假思索地將控制權(quán)讓渡到那些距離真正的“思考”“理解”還很遙遠的機器手中,甚至將整個文明置入自動化的快車道。最吊詭的是,在整個權(quán)力/權(quán)威的交接過程中,每一步都顯得如此的理所當然,令人無可拒絕。
今天,再沒有人用自己的頭腦來做加減運算,因為計算器要快速準確得多。我們信任百度地圖,遠遠勝過自己的方向感。學習一門新的語言聽起來是一件性價比越來越低的事情,因為谷歌的翻譯越來越強大了。
我們依賴機器告訴我們,哪些信息更重要、更有用、更值得關(guān)注;我們依賴機器告訴我們,應該看什么電影、讀什么書、聽什么歌,甚至選擇什么樣的伴侶;更深入一點,當面對一個生死攸關(guān)的醫(yī)療選擇時,你覺得你會相信自己、相信醫(yī)生,還是相信機器?當年安吉麗娜·朱莉切除兩側(cè)乳房,不是因為她自己的身體出現(xiàn)問題,也不是出于醫(yī)生的診斷,而是機器告訴她,她所攜帶的一種突變基因,意味著她有7%的可能性將來會患上乳腺癌。所以,很有可能,在我們此后一生當中,關(guān)于我們的身體,那些性命攸關(guān)的醫(yī)學決定,都將不再取決于你自己的感覺,甚至醫(yī)生的意見,而是會由計算機、電子算法和巨大的數(shù)據(jù)庫來決定。
“工作,本來應該由人來完成的,現(xiàn)在越來越多地由機器來完成。決定,本來應該由人憑借感覺與理性做出的,現(xiàn)在越來越多地由算法來做出。而且,每一步都讓你覺得無法拒絕?!焙绽f,“在此過程中,人漸漸變得無用、多余。這是為什么你知道世界正在發(fā)生非常嚴重的變化。”