江鑄久
2017年5月30日,我去香港鳳凰衛(wèi)視,參加錄制鏘鏘三人行的節(jié)目,談AlphaGo對柯潔的人機(jī)大戰(zhàn)第二季。想起去年3月,李世石和AlphaGo的第五局時(shí),我也是一路奔到香港,邊和文濤聊著圍棋與人工智能,邊掛念著戰(zhàn)況。
一年多過去,AlphaGo從一開始的職業(yè)棋手都覺得下不過李世石,到現(xiàn)在成為很多人心中的圍棋上帝,這世界變化得太快了。
還記得對李世石的第一局,AlphaGo贏了之后,整個(gè)圍棋界都震動了。芮乃偉那時(shí)候就非常難過。我倒還好,因?yàn)橘惽拔乙杨A(yù)測AlphaGo會贏,電腦戰(zhàn)勝人類的時(shí)刻就要到來。之所以這么認(rèn)為,是因?yàn)槎嗄昵?,我在美國時(shí)就接觸過一些立志開發(fā)圍棋人工智能的IT人士,還給他們當(dāng)過參謀。之后,我也一直關(guān)注著這方面的發(fā)展。圍棋人工智能的發(fā)展十分緩慢,早在1990年代,IBM的深藍(lán)就打敗了國際象棋特級大師,但是電腦解決不了圍棋海量的計(jì)算,解決不了圍棋里“虛”的東西。當(dāng)所有的智力游戲都被攻克時(shí),圍棋依然一花獨(dú)放。不過,看了2016年初Google發(fā)表的AlphaGo 5∶0戰(zhàn)勝歐洲冠軍樊麾的棋譜,我覺得我們將要見證歷史了。
但是我的預(yù)想圖是AlphaGo會贏一至兩盤,沒想到他第一局就贏了,而且贏得非常漂亮,也沒想到最后4∶1的結(jié)果,居然是李世石只贏了一盤。當(dāng)然那是一盤偉大的勝局,李世石在形勢不利的情況下弈出神的一手,引出了AlphaGo的bug。
從那次人機(jī)大戰(zhàn)的整體看,AlphaGo下得漂亮。比如第二局黑37手的尖沖,令人蕩氣回腸,感覺是吳清源老師回來了。吳老師曾說他200歲在宇宙中還要下棋。那么,這是AlphaGo將吳老師的思想傳遞回來了吧?我非常感動。
2017新年AlphaGo再度出山,以Master的網(wǎng)名在各大圍棋對弈網(wǎng)站下了60盤棋,全勝。我認(rèn)真研究了這60盤棋并寫下打譜心得給我的學(xué)生們學(xué)習(xí)。知道孩子們要理解這些還有點(diǎn)早,但我愿意埋一顆種子,期待在他們的心中慢慢發(fā)芽。
5月末,人機(jī)大戰(zhàn)第二季在烏鎮(zhèn)開戰(zhàn)。
此次人機(jī)大戰(zhàn)的勝負(fù)基本是沒有懸念的,當(dāng)然我們希望柯潔贏,但是60局所顯現(xiàn)的AlphaGo太強(qiáng)大了。因此,奔向?yàn)蹑?zhèn)時(shí),我期待看到AlphaGo下出更加神奇的,甚至是我們職業(yè)棋士也看不懂的招法,期待看到人機(jī)之間更加精彩的對抗。
三番棋分別在5月23、25、27日進(jìn)行。大會場里,屏幕上除了對局的進(jìn)程外,還可以看到柯潔對局中的表情和動作,現(xiàn)場感很強(qiáng)。
第一局,AlphaGo執(zhí)白勝1/4子,在中國規(guī)則里是最小的差距,但棋盤上的內(nèi)容是一面倒的。柯潔似乎有點(diǎn)拘謹(jǐn),AlphaGo一直掌控著局勢。
第二局,感覺柯潔放開了,下得非常出色,成功地把AlphaGo拖入混戰(zhàn)中,有一度很有機(jī)會,可以說是逼AlphaGo使出了渾身解數(shù)。據(jù)賽后公布的數(shù)據(jù),AlphaGo認(rèn)為前100手是雙方最善。雖然后半盤柯潔弈出問題手,棋局戛然而止。但是那一局棋,令許許多多的觀眾熱血沸騰。
27日第三局,澎湃新聞開通在線直播,我們和IT專家、紐約大學(xué)教授張崢老師一起講解??聺嵡鞍氡P弈出問題手,之后奮力拼搏,一度使形勢非常接近,但還是未能翻盤。
3∶0,這個(gè)結(jié)果并不意外。那么,看一場意料之中的賽事,看人類敗于機(jī)器,有意思嗎?有。
有柯潔近乎悲壯的對AlphaGo的死磕,有AlphaGo在棋盤上展現(xiàn)出來的奇思妙想,也有人機(jī)聯(lián)手等好玩的賽事,更有DeepMind團(tuán)隊(duì)的講座和互動,這次的烏鎮(zhèn)圍棋峰會內(nèi)容豐富精彩,我們站在了歷史的節(jié)點(diǎn)上。
24日那天是論壇。DeepMind CEO哈薩比斯(Damis Hassabis)先生和AlphaGo技術(shù)負(fù)責(zé)人席爾瓦(David Silver)先生的講座非常精彩,令觀眾了解了AlphaGo是如何依靠他們的策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)進(jìn)行剪枝和判斷的。但是最令人震撼的是席爾瓦先生在講話中說,AlphaGo Master經(jīng)過這一段的深度學(xué)習(xí),已經(jīng)比同李世石下棋時(shí)的版本進(jìn)步了Three Stones。聽到這個(gè)說法,柯潔立刻在微博上發(fā)表了“天哪”的感嘆。
三子啊,真是令人難以置信。午餐時(shí)我們特地去找哈薩比斯先生求證。哈薩比斯先生首先肯定了這Three Stones就是三個(gè)子,而不是三目(Three points),然后解釋說這是系統(tǒng)自己測定的,按照“AlphaGo李”同“AlphaGo柯”自己對下的勝率估算出的實(shí)力差距,并不說明和人類下也能讓三子。不過,他又補(bǔ)充了一句:“也許是讓兩子……”
嗯,這也已經(jīng)足夠令人震驚了。想起今年3月份我到日本的時(shí)候,碰到了武宮正樹老師、趙治勛老師和小林光一老師,他們都不約而同地認(rèn)為如果是60連勝,按照棋份來說,那是兩個(gè)子的棋份了。
哈薩比斯先生還說,他們已經(jīng)修復(fù)了對李世石時(shí)的bug,即使形勢不利(基本不太可能),AlphaGo也不會亂來了。趁此機(jī)會,我提出,希望能多給我們看一些AlphaGo左右互搏的棋譜。哈薩比斯先生答應(yīng)考慮一下。
下午,一不小心去了Jeff Dean的記者會(后來才知道他有多牛,據(jù)說谷歌員工認(rèn)為谷歌搜索驚人的速度都?xì)w功于他)。會后,主辦方好意安排我和他聊幾句。我問他,AlphaGo的開發(fā)會一直繼續(xù)下去嗎?有沒有目標(biāo)?他嚴(yán)肅地回答這個(gè)要去問DeepMind團(tuán)隊(duì)……好吧,那我再問,你覺得人工智能,比如AlphaGo,在對孩子的教育方面有些什么幫助?Jeff很認(rèn)真地說,人工智能會很好地啟發(fā)孩子們的創(chuàng)造力……
26日上午,大舞臺上是配對賽,古力和AlphaGo對陣連笑和AlphaGo。雖然是表演賽,但大家相當(dāng)期待,都想看人和電腦會配合成什么樣子。而且,如果是人機(jī)對戰(zhàn),機(jī)器優(yōu)勢了,就會挑穩(wěn)妥的路走,不求最好,只選擇勝率最高的一手。所以我們預(yù)想,到了后半盤,是不是可以由人類高手領(lǐng)著AlphaGo下出最善的著手呢?
很有意思的一盤棋。布局,執(zhí)白的連笑弈出問題手,黑棋優(yōu)勢。但是緊接著黑方的AlphaGo下了一步無比堅(jiān)實(shí)的自補(bǔ),我相信任何一個(gè)職業(yè)棋手都是不會往那里想棋的。是不是阿老師覺得優(yōu)勢了呢?我們笑說,這一步似乎把古力的調(diào)子打亂了。
據(jù)說后臺數(shù)據(jù)黑棋勝率曾到達(dá)75,古力下了某一手后掉到60多一點(diǎn),再后來又掉到45……好玩的是有位女棋手在朋友圈轉(zhuǎn)了這條消息,然后寫道:“我想說,是時(shí)候讓你們體會體會女棋手在混雙賽中的壓力了。”確實(shí),一到混雙賽,女棋手常常是戰(zhàn)戰(zhàn)兢兢的,怕下錯(cuò)了。局后古力聽了大笑,說幸虧阿老師不會說話,不然我肯定要受責(zé)備了。這個(gè)角色轉(zhuǎn)換令人莞爾。
后半盤,黑棋處于劣勢了,黑方AlphaGo要認(rèn)輸,古力不同意。局后古力說,他和連笑商量好了,不管哪一方的電腦要求認(rèn)輸,都要拒絕。結(jié)果,阿老師似乎是發(fā)脾氣了,連續(xù)損目,古力只好也拿起牌子來,示意認(rèn)輸,他的同伴爽快接受。這么看來,劣勢情況下,要率領(lǐng)AlphaGo繼續(xù)兢兢業(yè)業(yè)地收官,不是一件容易的事情。
連笑局后的感想是,和阿老師配合心里很有底。問為什么,答中盤時(shí)覺得形勢不好,但是同伴仍然不緊不慢地很穩(wěn)健,所以心就定了,想是不是也沒有那么糟。一等一的高手形勢判斷要依仗阿老師了,這又是配對賽有意思的地方。真希望這樣的對局多來幾盤,可以好好欣賞一下人機(jī)配合的各種有趣。
下午是陳耀燁、周睿羊、時(shí)越、羋昱廷、唐韋星五位世界冠軍對陣AlphaGo。一個(gè)長條桌上擺著棋盤,四個(gè)人坐在后面,周睿羊在另一面和大家一起討論,他轉(zhuǎn)過身就是比賽用的正式棋盤,商量定了就由他在盤上落子。AlphaGo橫空出世后,周睿羊最先采用阿老師的很多下法,贏了不少棋,因此得了一個(gè)“阿爾法羊”的美稱。
賽前,大家都不看好這場所謂的群毆,因?yàn)殡p方各兩個(gè)半小時(shí)的用時(shí),對人類一方實(shí)在是太少了,一個(gè)人下都有點(diǎn)緊巴巴的,五個(gè)人稍一討論,十來分鐘就沒有了,何況對面是一秒鐘能算百萬步的阿老師,更加覺得有壓力了。果然,大盤講解的古力、王磊等一直在為他們擔(dān)心:還不下???時(shí)間又過去十分鐘啦。想想看,五個(gè)棋風(fēng)不同的高手一起討論,哪能那么快就達(dá)成一致呢?所以,我們在屏幕上,總是看到阿爾法羊在笑,等著大家統(tǒng)一意見的樣子。
中盤時(shí),AlphaGo有一個(gè)靠然后小尖的連環(huán)手筋,是屬于讓人大吃一驚的思路。但是據(jù)說研究室里柯潔先于AlphaGo擺出了這兩步棋,不禁感慨,柯潔真是最適合大戰(zhàn)AlphaGo的人啊!
最后小官子階段,是AlphaGo小勝的局面,讀秒后替換周睿羊坐到棋盤前的唐韋星在白棋空里二二點(diǎn)了一手。這是一步騙招,完全沒有棋的地方,但是阿老師很穩(wěn)健地補(bǔ)了一手,損目了,當(dāng)然這和勝負(fù)無關(guān)。五個(gè)年輕的世界冠軍笑得不可開交,有一張他們捂著臉撐著頭笑著的照片瞬間刷爆了朋友圈。這步棋是一種測試,AlphaGo應(yīng)錯(cuò)了。不過這不算什么。我們非常想知道,如果補(bǔ)一手會輸,阿老師還會像實(shí)戰(zhàn)那樣走嗎?當(dāng)然,答案其實(shí)是很明顯的。
27日第三局結(jié)束后的新聞發(fā)布會上,哈薩比斯先生宣布AlphaGo將退出圍棋賽事!DeepMind團(tuán)隊(duì)同時(shí)宣布,將陸續(xù)公布AlphaGo左右互搏的50局棋譜,今天先公布10局。我看了幾個(gè)片段,那真的是有著許多可以顛覆圍棋觀的內(nèi)涵,谷歌的武功秘籍公開了。
非常感傷,一段傳奇就要這樣離開嗎?
回味這場“絕唱”,在傳承方面,AlphaGo吸收了很多前輩高手的精華并予以再創(chuàng)造。在棋局中,我看到它的很多招法有當(dāng)年吳清源老師的影子,心里非常感動。也許,上天是通過AlphaGo映照出了很多職業(yè)棋手在歷史上那些讓人難忘的場景,那些可歌可泣的精神。
三歲的AlphaGo打敗了人類幾千年的進(jìn)化。人類棋手要戰(zhàn)勝電腦已經(jīng)不可能了。但是,通過學(xué)習(xí),我們可以在自身的基礎(chǔ)上獲得提高。我想,生活在現(xiàn)代的職業(yè)棋士是幸運(yùn)的,阿老師幫助我們突破自身的局限,使我們能夠以更加自由的心靈和開闊的視野去面對棋盤,也更加能夠體會圍棋的美好。