樂(lè)佳
近日,搜狗CEO王小川在發(fā)表公開演講時(shí),動(dòng)情地回憶起了2016年他在新浪直播全程見證了李世石被機(jī)器打敗,并坦言當(dāng)時(shí)對(duì)他沖擊很大,他認(rèn)為那是人類歷史上堪比文藝復(fù)興的一場(chǎng)啟蒙運(yùn)動(dòng)。今天我們?cè)賮?lái)深入地解讀一下,阿爾法狗——人工智能邁出一大步背后的秘密。
2016年3月,由谷歌旗下公司DeepMind開發(fā)的人工智能程序阿爾法狗(AlphaGo)以總比分4:1戰(zhàn)勝韓國(guó)天王級(jí)職業(yè)圍棋選手李世石九段。此役使得AlphaGo聲名鵲起,也使得人工智能、深度學(xué)習(xí)成為了世人關(guān)注的熱點(diǎn)。僅僅過(guò)了幾個(gè)月,同年的12月29日,一個(gè)神秘賬號(hào)“Master”出現(xiàn)在了中文網(wǎng)絡(luò)圍棋平臺(tái)弈城網(wǎng)上,并在短短幾日之內(nèi)以60勝0負(fù)1和的傲人戰(zhàn)績(jī)戰(zhàn)勝了包括世界排名第一的柯潔九段、“棋圣”聶衛(wèi)平在內(nèi)的多個(gè)職業(yè)圍棋領(lǐng)域的大師級(jí)人物。當(dāng)人們還在震驚中猜測(cè)Master到底是何方神圣時(shí),Google對(duì)外宣布Master的真實(shí)身份就是AlphaGo。AlphaGo是人工智能領(lǐng)域的一個(gè)里程碑,它的出現(xiàn)昭示著人工智能領(lǐng)域的研究又向前邁進(jìn)了一大步。那么,AlphaGo到底有何過(guò)人之處,其在圍棋領(lǐng)域取得的成績(jī)?yōu)楹螘?huì)產(chǎn)生如此之大的反響?
其實(shí),人工智能在棋類運(yùn)動(dòng)中戰(zhàn)勝人類早已有先例,早在1997年5月IBM的“深藍(lán)計(jì)算機(jī)”在國(guó)際象棋比賽中就戰(zhàn)勝了當(dāng)時(shí)的世界衛(wèi)冕冠軍卡斯帕羅夫。相較于國(guó)際象棋,圍棋具有更復(fù)雜的規(guī)則和更多的棋盤狀態(tài),所以在“深藍(lán)”戰(zhàn)勝了世界冠軍后的很長(zhǎng)一段時(shí)間內(nèi)很多人都認(rèn)為計(jì)算機(jī)在圍棋上是無(wú)法戰(zhàn)勝人類的,甚至有人把圍棋稱為“人類最后的堡壘”。而如今,“人類最后的堡壘”也已經(jīng)被攻破,勢(shì)必會(huì)引起人們的強(qiáng)烈反應(yīng)。
AlphaGo的成功一方面得益于硬件設(shè)備計(jì)算能力的極大提升,相較于20年前,如今計(jì)算設(shè)備的計(jì)算能力有了質(zhì)的飛躍;另一方面,則得益于采用了深度學(xué)習(xí)算法。同“深藍(lán)”采用的暴力解題的方式不同,AlphaGo通過(guò)使用深度學(xué)習(xí)來(lái)獲得更加抽象的概念。AlphaGo的核心組成是兩個(gè)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN):策略網(wǎng)絡(luò)(Policy Network)和價(jià)值網(wǎng)絡(luò)(Value Network)。簡(jiǎn)單來(lái)說(shuō),策略網(wǎng)絡(luò)用于針對(duì)當(dāng)前棋盤,輸出在當(dāng)前棋盤各個(gè)空白處落子的概率;價(jià)值網(wǎng)絡(luò)則會(huì)給出在各個(gè)位置落子后的勝率;最后,AlphaGo使用一種蒙特卡羅樹搜索(Monte Carlo Tree Search, MCTS)算法結(jié)合前面的兩個(gè)網(wǎng)絡(luò)輸出最佳的落子策略。因此,AlphaGo厲害之處就在于當(dāng)它的對(duì)手可能還在思考下在哪里的時(shí)候,它已經(jīng)猜出了對(duì)手可能下子的位置,并利用對(duì)手思考的時(shí)間,繼續(xù)計(jì)算后面的棋路。此外,AlphaGo還使用了強(qiáng)化學(xué)習(xí)算法(Reinforcement Learning, RL):通過(guò)讓策略網(wǎng)絡(luò)不斷地自我對(duì)弈,來(lái)不斷提升策略網(wǎng)絡(luò)預(yù)測(cè)落子概率的準(zhǔn)確性。當(dāng)然,AlphaGo的實(shí)際計(jì)算過(guò)程比這要復(fù)雜得多,此處主要是為了方便理解而對(duì)其對(duì)弈的計(jì)算過(guò)程做了大量的簡(jiǎn)化。
人工智能一般可以分為弱人工智能和強(qiáng)人工智能,兩者最大的區(qū)別在于制造出來(lái)的智能機(jī)器是否具有自我意識(shí)。強(qiáng)人工智具有理解問(wèn)題、思考問(wèn)題、計(jì)劃并解決問(wèn)題的能力,甚至擁有自我意識(shí)和知覺(jué)。而弱人工智能雖然能解決一些人類才能解決的問(wèn)題,但實(shí)際上它并不真正具備理解問(wèn)題、思考問(wèn)題的能力,也沒(méi)有自我意識(shí)。自從AlphaGo擊敗眾多圍棋高手以來(lái),不少人都覺(jué)得人類離人工智能統(tǒng)治人類的那一天又更近了一步。其實(shí),盡管AlphaGo的確是人工智能領(lǐng)域的一個(gè)里程碑,但本質(zhì)上AlphaGo仍然是一個(gè)計(jì)算機(jī)程序,它沒(méi)有自我意識(shí),也沒(méi)有真正理解圍棋,它只是算出了幾個(gè)可以構(gòu)建最佳落子策略的函數(shù)而已,它仍然屬于弱人工智能。