周潔
對于人工智能來說,1997 年5月11日是歷史性的一天。
IBM的超級計算機“深藍”(Deep Blue)以2勝1負3平的成績戰(zhàn)勝了當(dāng)時世界排名第一的國際象棋大師加里·卡斯帕羅夫,一時間全球轟動。
“深藍”的設(shè)計者們在當(dāng)時就想到了下一個小目標:“何時計算機也能下圍棋呢?”
2016年3月15日,谷歌圍棋人工智能“阿爾法狗”(Alpha Go)與韓國棋手李世石對弈并以4:1的成績獲勝,這場“人機大戰(zhàn)”成為人工智能史上一座新的里程碑,也再次為人工智能技術(shù)做了科普——
從“深藍”到“阿爾法狗”,這二十多年的發(fā)展似乎也在預(yù)示著,人工智能終將改變?nèi)祟惖纳睢?h3>計算機的勝利
超越人類的思維限制,創(chuàng)造出一種能夠自我學(xué)習(xí)、自我進步的超級大腦,一直是人類的終極夢想。
IBM的“深藍”最早可以追溯到1985年,當(dāng)時卡內(nèi)基梅隆大學(xué)的博士生許峰雄開始開發(fā)一種名為“芯片測試”的國際象棋電腦“深思”(Deep Thought)(來源于科幻小說《銀河系漫游指南》中的一臺機器)。后來,許峰雄和他的同事被IBM聘用,繼續(xù)從事國際象棋的研究工作。
卡斯帕羅夫是國際象棋史上最偉大的棋手之一,他不僅精通國際象棋,還是一位數(shù)學(xué)家、計算機專家,并且精通15國語言。他的棋風(fēng)活潑,有異常敏銳的感知判斷力,對弈時常常能以出人意料的策略贏得比賽。
卡斯帕羅夫曾在1989年的兩場比賽中輕松擊敗“深思”,于是IBM團隊繼續(xù)改進他們的超級計算機,1993年將其重新命名為“深藍”,這是Deep Thought和IBM藍色LOGO的組合。
1996年2月17日,卡斯帕羅夫?qū)﹃嘔BM“深藍”計算機,最終,卡斯帕羅夫以4:2戰(zhàn)勝“深藍”,一舉奪得40萬美元獎金。
這場比賽給許峰雄團隊帶來了信心,因為出乎他們的意料,世界象棋冠軍在第一場比賽中輸給了“深藍”。比賽結(jié)束后,許峰雄團隊一直在為“深藍”做升級,升級后,“深藍”每秒可以檢測2億個不同的國際象棋位置。
1997年5月3日,又一場人機大戰(zhàn)開始了??ㄋ古亮_夫贏了第一場,深藍贏了第二場。第三、第四和第五局以平局告終。5月11日,深藍以3.5比2.5的比分贏得了第六場比賽。
對于這場勝利,“深藍”設(shè)計者許峰雄認為,這主要是依靠“深藍”強大的計算能力窮舉所有路數(shù)來選擇最佳策略:“深藍”靠硬算可以預(yù)判12步,卡斯帕羅夫可以預(yù)判10步。
如今“深藍”的性能已經(jīng)不再值得一提,就CPU來說,早在2006年,英特爾推出的第一代酷睿2就已經(jīng)超過了“深藍”,我們國家超級計算機天河二號的浮點運算能力,則是“深藍”的30萬倍。
但計算機戰(zhàn)勝人類的開端,則為人工智能的從業(yè)者帶來了更大的想象空間。
從今人的角度來看,“深藍”還算不上足夠智能,它的算法核心是暴力搜索:生成盡可能多的走法,執(zhí)行盡可能深的搜索,換言之,它每走一步,幾乎都是在遍歷后續(xù)所有可能的情況下作出的決策。
因此,很多人認為這是計算機的勝利,而不是人工智能的勝利。
但2016年一戰(zhàn)成名的Alpha Go不同。圍棋和國際象棋在復(fù)雜程度上不可同日而語,圍棋變數(shù)極多,一回合有250種可能,而一盤棋可以長達150回合。顯然“深藍”式的硬算在圍棋上行不通。
Alpha Go勝利的秘訣不僅僅是計算機強大的計算能力,更依賴其精妙的算法。Alpha Go的算法的核心則依靠強化學(xué)習(xí)、深度學(xué)習(xí)和蒙特卡洛樹搜索?!皬娀瘜W(xué)習(xí)讓Alpha Go有了自學(xué)能力,深度學(xué)習(xí)讓Alpha Go通過數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)有了估值量化能力,蒙特卡洛樹則是一個連接所有技術(shù)和動作的框架?!?/p>
“感覺就像一個有血有肉的人在下棋一樣,該棄的地方也會棄,該退出的地方也會退出,非常均衡的一個棋風(fēng),真是看不出出自程序之手。”柯潔曾這樣評價Alpha Go。
2017年,Alpha Go進一步升級為新版程序 Alpha Go Zero:從空白狀態(tài)學(xué)起,在不利用人類任何圍棋比賽數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的條件下,它能夠迅速通過2900萬次自我博弈、自學(xué)圍棋,并以 89比11 的戰(zhàn)績擊敗“前輩”。
有專家形容Alpha Go Zero在某種程度上部分突破了人類認知學(xué)習(xí)的能力,原理上可以習(xí)得包括圍棋在內(nèi)的其他觀測信息是完備的、狀態(tài)動作空間是可數(shù)的各種人類技藝,甚至展現(xiàn)出“直覺”判斷能力。
人工智能的應(yīng)用當(dāng)然不會只是用來下棋,智能搜索、無人駕駛汽車、智能機器人……人工智能已經(jīng)在試探著進入人類實際生活之中,許多人說,未來人類的大部分工作或許都將被人工智能取代。
對于這一點,卡斯帕羅夫或許有更深的感受。
作為第一個工作受到機器威脅的知識工作者,23年后2020年,卡斯帕羅夫再次回到了被“深藍”打敗的紐約一個酒店的宴會廳參加活動,他說自己已經(jīng)與人工智能和平相處。
“這場比賽不是詛咒,而是福氣,因為我成為了一件非常重要事情的一部分。 22年前,我的想法可能不同?!笨ㄋ古亮_夫表示,每種技術(shù)都會在創(chuàng)造就業(yè)機會之前就破壞就業(yè)機會。也許在未來,人類角色將會是牧羊人。人類只需輕輕推動智能算法,將正確的機器放在正確的空間中執(zhí)行正確的任務(wù),那么剩下的事就可以交給機器來完成。
而當(dāng)下,幾乎所有人都認為,目前人工智能發(fā)展水平還處在初級階段?!澳壳叭斯ぶ悄芩惴ù蠖嘁蕾嚫哔|(zhì)量的海量數(shù)據(jù),需要的功率也遠高于人類大腦的能耗水平,同時也很難應(yīng)用于多種場景。一個明顯的例子就是,Alpha Go的實現(xiàn)方法在明確定義的環(huán)境下效果明顯,而在開放環(huán)境下,結(jié)果往往不盡如人意。”
但從“深藍”到“阿爾法狗”,人工智能已經(jīng)走上了正確方向,一切才剛剛開始。
1951年5月12日,第一顆氫彈爆炸試驗成功。
1968年5月13日,法國五月風(fēng)暴興起。
1948年5月14日,以色列正式宣布獨立。
1991年5月15日,法國第一位女總理克勒松夫人就任。
1929年5月16日,第一屆電影“學(xué)院獎”(后來的奧斯卡)在好萊塢頒獎。
1973年5月17日,美參議院專門小組開始水門事件聽證會。