陳勁松
2016年12月,美國著名的科普網(wǎng)站,科學新聞(ScienceNew.org)在評選十大新聞中,名列第一的是“AlphaGo戰(zhàn)勝李世石”。
“AlphaGo在克服復雜問題上爬過了一座陡峭的山峰,在最復雜的智力游戲中戰(zhàn)勝了人類”,在回顧中,科學新聞評價道,“現(xiàn)實世界的復雜程度遠超這些游戲,但AlphaGo的進步讓大家看到了電腦解決復雜問題的曙光?!?/p>
是的,由于AlphaGo的出現(xiàn),人類作為一個整體應該意識到,世界不一樣了,另一種文明,已經(jīng)嶄露頭角。
時間倒回到2016年3月10日,首爾光化門的四季酒店,這里正在進行圍棋“人機大戰(zhàn)”第二局。在9日進行的第一局比賽中,谷歌的程序AlphaGo擊敗了李世石,取得了歷史性的突破。在第二局的比賽中,AlphaGo下出的第37手,一個簡單的肩沖,又讓李世石進入了難局。
觀戰(zhàn)室里還有一名職業(yè)圍棋選手,他是三屆歐洲圍棋冠軍樊麾(Fan Hui)。一開始,第37手也令他感到困惑。但他和AlphaGo很熟悉,有五個月時間,樊麾與這臺機器進行過成百上千局對弈。樊麾經(jīng)常輸給AlphaGo,但他也漸漸比任何人都明白它。在樊麾眼里,那一步肩沖不像是人類會下的一步棋。思索了十秒后,樊麾才恍然大悟?!斑@步太漂亮了,”他又重復了一遍,“太漂亮了。”
日后這一手不斷被職業(yè)棋手所模仿,包括世界排名第一的柯潔,棋迷們也將這手稱為“阿狗流”,與圍棋戰(zhàn)法中著名的“秀策流”、“中國流”并列。在李世石眼中,37手的阿狗流,表現(xiàn)出了圍棋棋手所說的“直覺”——一種讓它能以像人類一樣的方式,甚至超越人類的方式下出優(yōu)美棋局的能力。
在決定與谷歌的AlphaGo對決前,李世石對他的對手幾乎一無所知,雖然AlphaGo已經(jīng)以5:0戰(zhàn)勝了歐洲冠軍樊麾,但五盤棋譜尚未公布,李世石并不知道AlphaGo有多厲害,甚至沒過問獎金一事。直到簽完保密合同后才知道,獎金為100萬美元。李世石說,“這個比賽本身的意義,比獎金大得多。這是因為,我代表人類同計算機對戰(zhàn)?!?/p>
人類的代表李世石,在第37手面前陷入沉默。一分鐘過去,又一分鐘過去——整整15分鐘過去了,最終,李世石拿起了一枚棋子放在了棋盤上,在對方肩沖的黑子上貼了一手,事后證明,這一手是本局的敗招,4小時20分鐘后,李世石選擇認輸。
谷歌雖然是一個美國公司,但AlphaGo的創(chuàng)造者是兩個英國人,大衛(wèi)·席爾瓦(David Silver)和戴米斯·哈薩比斯(Demis Hassabis),他們是劍橋同學,專業(yè)都是計算神經(jīng)科學。1998年畢業(yè)后,兩人合開了一家電子游戲公司。
哈薩比斯經(jīng)常和一名同事下圍棋,席爾瓦在他的影響下也開始自學圍棋。他們還加入了當?shù)貒寰銟凡?,和二三段棋手對弈,這是圍棋中非常低的水平,兩個高智商的家伙并不滿足于此。他們?nèi)滩蛔∷伎?,為什么電腦可以打敗西洋跳棋、國際象棋的選手,卻從未破解圍棋。
對人工智能來說,圍棋游戲的難度在于,決策空間實在太大。決策(Decision Making) 是人工智能的關鍵要素,使得機器能夠在人類的世界中發(fā)揮作用。在圍棋以及任何游戲中,一次決策往往使得游戲更新到一個新局面,于是影響到接下來的決策,一直影響到最終游戲的勝負。人工智能的關鍵就是在決策空間中搜索達到最大效益的路徑,最終體現(xiàn)在當前決策中。圍棋棋盤上棋子可能的組合方式的數(shù)量就有10的170 次方之多,超過宇宙原子總數(shù)。在近乎無窮的決策空間中,去暴力搜索出當前棋盤的下一步最優(yōu)定子是絕對不可能的事情。
2010年,哈薩比斯在倫敦成立了一個名為DeepMind的人工智能公司,席爾瓦隨后而來,在這里他們開始了真正的人工智能之旅。這家公司之后又被谷歌公司收購,這也解決了他們的資金問題。
在倫敦國王十字車站附近的DeepMind辦公室中,這支團隊將3000萬步人類下出的圍棋步法輸入到一個深度神經(jīng)網(wǎng)絡中,這個網(wǎng)絡的硬件和軟件能大致模擬人腦中的神經(jīng)網(wǎng)。
神經(jīng)網(wǎng)絡其實很常見,F(xiàn)acebook用它給照片中的人臉加上標簽,谷歌則用它來識別安卓手機收到的語音命令——給它輸入足夠的話語,它就能識別你所說的話。輸入3000萬步圍棋步法,它就能學會下圍棋。在經(jīng)過五年的進化之后,AlphaGo取得了重大突破,成為第一位擊敗職業(yè)棋手的程序,而第一滴血,就是觀戰(zhàn)室的樊麾二段。
樊麾是西安人,職業(yè)二段,2000年移居法國,隨后成為歐洲最強棋手。2015 年9 月底,樊麾第一次去Deepmind 公司參觀,純粹抱著旅游的心態(tài)。雙方確定了比賽時間、比賽方式等等。樊麾發(fā)現(xiàn)他們對于人工智能方面可能很擅長,但對于這個比賽要怎么弄,一點經(jīng)驗都沒有。最讓他驚訝的是對方詢問: “萬一機器贏了,下圍棋的人會不會恨我們?會不會因此傷害到很多人的利益?”
樊麾和AlphaGo的比賽定在了2015 年10 月5 日至9 日,共5天。比賽是一天兩場,一共10 盤。5 盤正式的,還有5 盤非正式的快棋。正式的比賽樊麾0:5 敗,非正式的快棋樊麾2勝3 負。2016 年1月,哈薩比斯等人在英國 《自然》 雜志上發(fā)文說,在英國圍棋協(xié)會見證下,AlphaGo 以5:0 戰(zhàn)勝歐洲圍棋冠軍、前中國職業(yè)棋手樊麾,成為第一個擊敗人類職業(yè)棋手的電腦程序。
在圍棋界,職業(yè)棋手第一次輸給電腦是個非常令人震驚的 “意外事件”,在AlphaGo戰(zhàn)勝樊麾之前,最好的電腦圍棋也要被頂級棋手讓四五子。職業(yè)圍棋選手紛紛對這個結果表示震驚,他們不愿意接受這個消息,甚至開始懷疑樊麾的水平只有業(yè)余五段左右。但隨即,AlphaGo團隊向李世石發(fā)起了挑戰(zhàn),人類和人工智能的重要對決終于到來。
在與李世石進行的五場比賽中,兩位解說員都稱AlphaGo為“他”,而不是“它”。李世石剛出場時,還向那個看不見摸不著的對手——不知疲倦亦無憂懼的AlphaGo君鞠了一個躬。
比賽之前,誰也沒有想到AlphaGo會強到如此地步。世界冠軍常昊預計正常情況下李世石是一盤都不會輸,如果AlphaGo贏一盤已經(jīng)是非常大的突破了。在職業(yè)圍棋界,99%的人都和常昊做出同樣的預測。只有一些計算機領域?qū)<遥瑢徤髡J為AlphaGo能贏一到兩局,比如李開復。但結果,AlphaGo第一局就贏了。圍棋界一片驚呼不說,韓國的媒體甚至將這一局的意義和人類登月相提并論。
從第二局開始,形勢已經(jīng)發(fā)生了逆轉(zhuǎn)。在此之前,是AlphaGo挑戰(zhàn)李世石,但在此之后,已經(jīng)是李世石在挑戰(zhàn)AlphaGo了。韓國報紙上開始稱AlphaGo為“阿爾法十段”。在韓國,圍棋九段與中國古代的一品一樣,稱為“入神”,十段差不多就是“神”的意思了。
李世石緊接著輸?shù)袅说谌?,AlphaGo在五局三勝中取得了勝利。在后來的新聞發(fā)布會上,李世石坐在哈薩比斯旁邊,因為讓人類失望而道歉:“我本可以拿出更好的成績,帶來更好的結局?!?/p>
李世石發(fā)言時,一種意料之外的感覺開始啃食哈薩比斯的內(nèi)心。作為AlphaGo的創(chuàng)造人之一,看著這臺機器實現(xiàn)了人們認為其不能實現(xiàn)的成績,他感到驕傲,甚至飄飄然,但他同時也因為自己是人類的一員而感到不甘。他開始希望李世石能夠贏下一局。
第四局下了2個小時。李世石這局下得咄咄逼人,對棋盤上的特定區(qū)域發(fā)起猛攻。但是AlphaGo采取了更加豪邁的風格,以著眼整體的方式對整局局勢進行衡量。
AlphaGo已經(jīng)贏得了整場比賽。李世石不再為了勝利下棋,而是為了人類。他用右手的前兩個手指執(zhí)起一枚白棋,放在了緊挨著棋盤中心的地方。這是這局棋的第78手,一步“挖” 步,即在兩片大范圍緊密的地區(qū)中間插入一棋。在AlphaGo的控制室,運行機器的人們都停下了手里的工作,盯著他們的顯示屏看。在李世石下出那絕妙的第78手前,AlphaGo計算自己的勝算為70%。八步之后,這一數(shù)字變得不值一提。李世石的78手被古力稱為“神之一手”,這手棋讓AlphaGo崩潰,讓人類棋手保留了最后一絲希望。
2016年3月13日,韓國首爾,2016年圍棋人機大戰(zhàn)第4局,李世石艱難贏得一戰(zhàn)。
五局比賽的最終結果是四比一,AlphaGo也憑借這五局棋一直排在世界第二的位置,威脅著世界第一人,中國棋手柯潔。8月份,DeepMind團隊在波士頓宣布,AlphaGo已經(jīng)從李世石對戰(zhàn)的第18個版本進化到了V25,現(xiàn)在這個版本可以讓頂尖職業(yè)棋手兩子。隨后,中國棋圣聶衛(wèi)平宣布柯潔將不會與AlphaGo進行比賽,為職業(yè)棋手保全最后一絲顏面。
然而,人工智能的大門已經(jīng)打開,一個新時代,已經(jīng)到來了?!?016年是人工智能走向主流的元年”,微軟亞太研發(fā)集團前主席、百度公司總裁張亞勤接受媒體采訪時說。這一年,除了AlphaGo與李世石的“人機大戰(zhàn)”,IBM、微軟、Facebook等互聯(lián)網(wǎng)巨頭,都投入巨大的人力、財力和精力在人工智能平臺。Facebook創(chuàng)始人扎克伯格甚至預言,“人類基本的聽、說、讀、寫等核心感知力,在未來5-10年,計算機一定能做得比人類自己更好。”
到那時,人們或許才會更真切理解這場“人機大戰(zhàn)”的意義,也才會更清楚,公元2016年3月10日,AlphaGo下出37手的那一刻,對人類到底意味著什么。