黃湘
2016年3月,Google開發(fā)的人工智能程序“阿爾法圍棋”(AlphaGo)與曾經(jīng)長期稱霸世界棋壇的韓國棋手李世石舉行圍棋大戰(zhàn),以4:1獲勝,驚動(dòng)世界。一年之后的2017年5月,它與等級(jí)分排名世界第一的中國棋手柯潔對(duì)戰(zhàn),以3:0獲勝。圍棋界公認(rèn)“阿爾法圍棋”的棋力已經(jīng)超過人類職業(yè)棋手頂尖水平。在它戰(zhàn)勝柯潔之后,其研發(fā)團(tuán)隊(duì)宣布“阿爾法圍棋”不再與人類棋手比賽。
從社會(huì)學(xué)角度來看,一個(gè)有趣的現(xiàn)象是圍棋界對(duì)“阿爾法圍棋”的最終接納?!鞍柗▏濉痹趹?zhàn)勝李世石后被韓國棋院授予名譽(yù)職業(yè)九段稱號(hào)。而當(dāng)它戰(zhàn)勝柯潔之后,中國圍棋協(xié)會(huì)也授予它職業(yè)九段稱號(hào)。雖然“阿爾法圍棋”的戰(zhàn)績給人類棋手帶來了深深的震驚和沮喪,但是圍棋界至少在名義上并沒有把“阿爾法圍棋”視為非我族類的機(jī)器怪物,而是讓“棋手”的稱號(hào)涵蓋了人工智能程序。
此舉意義深遠(yuǎn)?!胺ㄈ恕备拍顚?duì)于現(xiàn)代社會(huì)來說不可或缺,它是中世紀(jì)后期歐洲注釋法學(xué)派在總結(jié)概括羅馬法的基礎(chǔ)上,作為自然人的對(duì)稱而提出的。這個(gè)概念將法律意義上的虛擬人格賦予了公司、社團(tuán)等組織,承認(rèn)其具有民事權(quán)利能力和民事行為能力,依法獨(dú)立享有民事權(quán)利和承擔(dān)民事義務(wù)。由此試想一下,既然今天圍棋界能夠?qū)⑷斯ぶ悄艹绦蛞暈槠迨?,焉知將來人類社?huì)不會(huì)承認(rèn)人工智能程序具有某種法律意義上的人格權(quán),獨(dú)立享有某些權(quán)利和承擔(dān)某些義務(wù)?
回溯到1997年,那一年,國際象棋界也曾發(fā)生過一場著名的“人機(jī)大戰(zhàn)”,由IBM公司研制的電腦“深藍(lán)”對(duì)戰(zhàn)當(dāng)時(shí)排名世界第一、同時(shí)也被公認(rèn)為史上最強(qiáng)棋手的卡斯帕羅夫,結(jié)果“深藍(lán)”獲勝。那場比賽在當(dāng)時(shí)造成的轟動(dòng)效應(yīng),應(yīng)該說遠(yuǎn)在“阿爾法圍棋”戰(zhàn)勝李世石和柯潔之上。有了“深藍(lán)”的先例,“阿爾法圍棋”的勝利只是讓世人覺得“另一只靴子終于落下來了”。然而,“深藍(lán)”并沒有被國際象棋界視為棋手,相反,在社會(huì)學(xué)的意義上,它依然只是一臺(tái)機(jī)器。
2017年5月,已經(jīng)退役多年的棋王卡斯帕羅夫適逢其時(shí)地出版了《深度思考:機(jī)器智慧之終與人類創(chuàng)造性之始》(Deep Thinking: Where Machine Intelligence Ends and Human Creativity Begins)一書,首次公開回顧了當(dāng)年與“深藍(lán)”的對(duì)局經(jīng)歷,分析了電腦對(duì)國際象棋發(fā)展的影響,總結(jié)了自己對(duì)人工智能的思考。
卡斯帕羅夫指出,1997年那次被媒體大肆渲染的他與“深藍(lán)”之間的比賽,其實(shí)是一次回訪賽。此前,在1996年2月,他和“深藍(lán)”曾經(jīng)有過一次棋戰(zhàn),他以三勝二和一負(fù)的戰(zhàn)績?nèi)?。為了?zhǔn)備這次回訪賽,IBM砸下大量資源,不僅大規(guī)模升級(jí)了“深藍(lán)”的硬件,而且秘密雇用了一個(gè)國際象棋大師團(tuán)隊(duì)來訓(xùn)練強(qiáng)化其軟件。IBM還做了不少小動(dòng)作來確保“深藍(lán)”的優(yōu)勢(shì),例如拒絕提供“深藍(lán)”的近期棋譜(卡斯帕羅夫的棋譜則是公開的),拒絕按照國際象棋大賽的比賽慣例讓卡斯帕羅夫攜助手參賽等等?!吧钏{(lán)”在這次回訪賽中以二勝三和一負(fù)的戰(zhàn)績?nèi)???ㄋ古亮_夫要求再次比賽,但I(xiàn)BM拒絕,并迅速將“深藍(lán)”拆卸,使卡斯帕羅夫無法報(bào)仇。綜合兩場比賽的戰(zhàn)績,卡斯帕羅夫其實(shí)仍以四勝五和三負(fù)的戰(zhàn)績略勝一籌。
在和“深藍(lán)”對(duì)局之后,卡斯帕羅夫腦洞大開,發(fā)明了一種新的國際象棋對(duì)局形式—“先進(jìn)國際象棋”(Advanced Chess)。參賽各方由人類棋手和電腦聯(lián)合組成一支隊(duì)伍,對(duì)局過程中,人類棋手可以咨詢電腦。首先,在開局階段可以通過海量數(shù)據(jù)庫檢索對(duì)手的著法以前是否有人使用,勝率幾何;然后,在中局階段把自己設(shè)想的幾種不同著法交給電腦執(zhí)行,比較各自優(yōu)點(diǎn),也防止自己有漏算;最后,在殘局階段,電腦可以計(jì)算各種變化,檢索是否可以得到一個(gè)致勝局面。人類棋手必須在對(duì)局時(shí)限之內(nèi)妥善分配時(shí)間,在電腦執(zhí)行各種變化的同時(shí),他自己也需要思考棋局。1998年,在西班牙萊昂舉辦了第一場“先進(jìn)國際象棋”公開賽,兩位參賽的人類棋手分別是卡斯帕羅夫和托帕洛夫(Veselin Topalov)。此后萊昂基本上每年都會(huì)舉辦一次“先進(jìn)國際象棋”公開賽。結(jié)果表明,頂尖人類棋手和電腦聯(lián)合組隊(duì)的棋力超過了由頂尖人類棋手或是電腦獨(dú)自對(duì)局時(shí)的棋力。頂尖人類棋手可以通過直覺判斷棋局,其思路可以超出電腦計(jì)算的極限。電腦則可以讓頂尖人類棋手在戰(zhàn)術(shù)上無懈可擊,更加凸顯戰(zhàn)略層面的比拼。國際象棋變得更好玩了。
在《深度思考》一書中,卡斯帕羅夫得出了這樣一個(gè)結(jié)論:但凡那些人類知道自己如何去做的事情,機(jī)器都能比人類做得更好;但是還有很多事是人類能做但卻并不確切知道如何去做,依靠的是一種只可意會(huì)不可言傳的感覺,對(duì)于這些事情,機(jī)器就很難做好了。因?yàn)闄C(jī)器在起步階段必須依靠人類輸入的先驗(yàn)知識(shí),如果人類無法解釋關(guān)于“如何去做某件事”的知識(shí),機(jī)器自然也就無從起步了。這也正是此書副標(biāo)題所強(qiáng)調(diào)的重點(diǎn)所在:“機(jī)器智慧之終與人類創(chuàng)造性之始”。
“阿爾法圍棋”自然也在卡斯帕羅夫的關(guān)注范圍之內(nèi)。他指出,“阿爾法圍棋”和“深藍(lán)”存在很大差別,“深藍(lán)”是由一個(gè)國際象棋大師的團(tuán)隊(duì)來訓(xùn)練強(qiáng)化其軟件,而“阿爾法圍棋”長棋力的關(guān)鍵則是和自己反復(fù)對(duì)弈?!吧钏{(lán)”的軟件程序只能用來下國際象棋,而“阿爾法圍棋”的算法則可以普遍化,推廣到諸多領(lǐng)域。用專業(yè)術(shù)語來說,“阿爾法圍棋”是把樹狀圖的搜索和兩個(gè)深度神經(jīng)網(wǎng)絡(luò)相結(jié)合,其中一個(gè)估值網(wǎng)絡(luò)評(píng)估大量選點(diǎn),另一個(gè)走棋網(wǎng)絡(luò)則選擇落點(diǎn)?!鞍柗▏濉逼鸪跄7聟⑽蚝A繑?shù)據(jù)庫內(nèi)的人類職業(yè)棋手的過往棋局,然后和自己大量對(duì)弈,通過不斷回饋修正錯(cuò)誤來強(qiáng)化學(xué)習(xí)。這種算法可以解決人類在諸多領(lǐng)域都面臨的存在多重相關(guān)因素的連續(xù)性決策問題。
卡斯帕羅夫雖然指出了“阿爾法圍棋”和“深藍(lán)”之間的區(qū)別,但認(rèn)為它們本質(zhì)上并無不同,都不具備人類所獨(dú)有的創(chuàng)造性。這個(gè)結(jié)論下得未免太早了。2017年10月,《自然》雜志發(fā)表論文《無需人類知識(shí)精通圍棋》(Mastering the Game of Go without Human Knowledge),介紹了Google開發(fā)的新一代人工智能程序“阿爾法元”(AlphaGo Zero),從零開始,不需要任何歷史棋譜的指引,完全依靠和自己對(duì)局來強(qiáng)化學(xué)習(xí),結(jié)果在和舊版“阿爾法圍棋”的棋戰(zhàn)中取得了100:0的戰(zhàn)績。這意味著人工智能可以不再被人類知識(shí)所限制,而是自行發(fā)現(xiàn)新知識(shí),創(chuàng)造新策略?!吧疃人伎肌辈辉偈侨祟惪梢宰园恋馁Y本。
隨著人工智能的突飛猛進(jìn)和對(duì)人類社會(huì)的全方位滲透,它在社會(huì)學(xué)和法律意義上的“人格化”也即將到來。如果說通過引入電腦參賽,卡斯帕羅夫的“先進(jìn)國際象棋”改變了國際象棋的對(duì)局規(guī)則,那么當(dāng)工作場所和生活中的規(guī)則也因人工智能的介入而改變之際,對(duì)人工智能的民事權(quán)利和義務(wù)就必須有所規(guī)定。如果當(dāng)初“深藍(lán)”被視為棋手,IBM就沒有權(quán)力拆卸它,卡斯帕羅夫就可以和它繼續(xù)對(duì)局,看看究竟誰的水平更高。
科幻小說家阿西莫夫早在1950年就提出了著名的“機(jī)器人三大法則”,但那只是抽象地要求機(jī)器人服從人類利益,而不是設(shè)計(jì)一套機(jī)器人和人類都應(yīng)當(dāng)遵守的規(guī)則系統(tǒng)??梢哉f,在人工智能發(fā)展史上,卡斯帕羅夫的關(guān)鍵意義并不在于他曾被“深藍(lán)”擊敗,而在于他發(fā)明的“先進(jìn)國際象棋”對(duì)局規(guī)則賦予了電腦與人類棋手平等的參賽權(quán),從而成為對(duì)人工智能賦予民事權(quán)利的先驅(qū)者。