曹坤澤
人工智能,也被稱為機(jī)器智能,是指人類制造的能夠展現(xiàn)出一定的智能的機(jī)器或系統(tǒng)。近幾年來,隨機(jī)計(jì)算機(jī)技術(shù)的發(fā)展,人工智能也隨之快速崛起,很多人工智能的產(chǎn)品已經(jīng)廣泛應(yīng)用。在國(guó)家層面,人工智能相關(guān)的政策也陸續(xù)出臺(tái)。2017 年7 月,《新一代人工智能發(fā)展規(guī)劃》由國(guó)務(wù)院頒布,這一規(guī)劃明確了我國(guó)人工智能的發(fā)展方向,是我國(guó)的人工智能發(fā)展的戰(zhàn)略性規(guī)劃?!兑?guī)劃》提出到2030 年,我國(guó)的人工智能理論、技術(shù)、市場(chǎng)應(yīng)用都要達(dá)到全球先進(jìn)水平,并成為全球人工智能的重要中心之一[1]。
我國(guó)游戲市場(chǎng)產(chǎn)值越來越大,擁有巨大前景。2019 年,我國(guó)游戲用戶超過6 億,游戲市場(chǎng)實(shí)際銷售收入2 330.2 億,同比增長(zhǎng)8.7%。中國(guó)電競(jìng)市場(chǎng)預(yù)計(jì)在2020 年超越韓國(guó),成為繼美國(guó)之后的第二大電競(jìng)市場(chǎng)。游戲產(chǎn)業(yè)在蓬勃發(fā)展的同時(shí)也開始引入人工智能技術(shù),以提高游戲的可玩性。本文將對(duì)人工智能在游戲領(lǐng)域中的應(yīng)用進(jìn)行討論,以期為其未來發(fā)展提供借鑒。
1920 年,一位名為巴貝奇的英國(guó)科學(xué)家研制出全球第一臺(tái)“計(jì)算機(jī)器”,它的出現(xiàn)標(biāo)志著計(jì)算機(jī)硬件的開始,如今也被認(rèn)為是人工智能的前身。電子計(jì)算機(jī)的發(fā)展和應(yīng)用,讓人工智能的實(shí)現(xiàn)成為了現(xiàn)實(shí)。人工智能可以對(duì)人類行為進(jìn)行模仿學(xué)習(xí),并且隨著人們對(duì)人工智能的探索越來越深以及計(jì)算機(jī)的計(jì)算能力越來越強(qiáng)大,人工智能也變得更“智能”。人工智能的發(fā)展經(jīng)歷了十分漫長(zhǎng)的歷史。17世紀(jì),萊布尼茨和巴斯卡首次有了關(guān)于人工智能的想法,他們是最早有智能機(jī)器想法的人。
游戲人工智能是人工智能技術(shù)在游戲領(lǐng)域發(fā)展的產(chǎn)物,一直是其發(fā)展的前沿,被認(rèn)為是人工智能界的“果蠅”[2]?!兜萝娍偛?D》(Wolfenstein 3D)早在1992 年就發(fā)布了,其游戲中的士兵也有一個(gè)基本的人工智能形式。這種智能主要借助有限狀態(tài)機(jī)(Finite State Machine,F(xiàn)SM)算法實(shí)現(xiàn)。設(shè)計(jì)者首先創(chuàng)建一個(gè)機(jī)器人可能經(jīng)歷的所有事件(狀態(tài))的列表,然后,分配機(jī)器人對(duì)每種情況的具體響應(yīng)。但有限狀態(tài)機(jī)算法并不適用于所有游戲。例如,在策略游戲中使用有限狀態(tài)機(jī)的話,系統(tǒng)將以同樣的方式做出響應(yīng),那玩家將會(huì)很快學(xué)會(huì)相關(guān)的戰(zhàn)勝計(jì)算機(jī)的策略。因而會(huì)產(chǎn)生重復(fù)的游戲體驗(yàn),降低了玩家的游戲體驗(yàn)。因此,必須加入一定的隨機(jī)性,即讓人工智能學(xué)會(huì)思考,在不同情況下作出合理的決策,例如可以采用蒙特卡洛樹搜索(Monte Carlo Search Tree,MCST)算法。
借助人工智能,可以增加電子游戲中的玩家挑戰(zhàn),構(gòu)建不同智能等級(jí)的模擬敵人/玩家,從而增加游戲的樂趣。目前,利用計(jì)算機(jī)圖形技術(shù)已經(jīng)可以模擬真實(shí)的世界,VR 技術(shù)已經(jīng)可以為玩家?guī)沓两降捏w驗(yàn)。
由美國(guó)IBM 公司生產(chǎn)的“深藍(lán)”是一臺(tái)可以進(jìn)行象棋博弈的電腦?!吧钏{(lán)”擁有32 個(gè)微型處理器。近1 個(gè)世紀(jì)的200 多萬棋局被輸入這一臺(tái)計(jì)算機(jī),使其具有強(qiáng)大的國(guó)際象棋能力?!吧钏{(lán)”的計(jì)算模式采用的是并行計(jì)算,用于棋局對(duì)弈的程序是由C語言寫成,其所運(yùn)行的操作系統(tǒng)為AIX 系統(tǒng)。1996年的“深藍(lán)”版本僅為每秒1 億步棋,而到了1997年其運(yùn)算速度約為1997 年的2 倍。在1997 年6 月發(fā)布的世界超級(jí)電腦排名中,深藍(lán)位于第259 位,其每秒的運(yùn)算能力可達(dá)113.8 億。在當(dāng)時(shí)一名頂尖棋手只可對(duì)隨后策略估算10 步的情況下,“深藍(lán)”就已可達(dá)12 步棋之多。
深藍(lán)所運(yùn)用的算法模式是α-β 剪枝,該算法是由約翰·麥卡錫提出。這位算法的研究者也是當(dāng)時(shí)著名人工智能研究者、圖靈獎(jiǎng)獲得者。他在1950年就開始研究如何將計(jì)算機(jī)使用在棋類領(lǐng)域中,并由此提出了α-β 剪枝算法。該算法的主要核心思想是通過利用已經(jīng)搜索過的狀態(tài)對(duì)搜索空間進(jìn)行剪枝,并以此對(duì)搜索的精準(zhǔn)度和速率進(jìn)行進(jìn)一步提高。算法主要分為以下幾個(gè)步驟,首先是對(duì)雙方的博弈過程進(jìn)行模仿,在對(duì)弈過程中,通過對(duì)進(jìn)行中的棋局進(jìn)行打分并向上遞送分?jǐn)?shù)。隨后在自己已有的分?jǐn)?shù)基礎(chǔ)上搜索其他走法,實(shí)現(xiàn)最大化提高我方所得分?jǐn)?shù),并以此為依據(jù)走下面的步數(shù)。
阿爾法圍棋是由谷歌團(tuán)隊(duì)所研發(fā)的一個(gè)人工智能機(jī)器人[3],是至今為止第一個(gè)擊敗圍棋世界冠軍的人工智能機(jī)器。“深度學(xué)習(xí)”是其運(yùn)用的主要核心技術(shù)。所謂的“深度學(xué)習(xí)”是由大量人工神經(jīng)網(wǎng)絡(luò)構(gòu)成。該算法對(duì)人類大腦中的生物神經(jīng)系統(tǒng)進(jìn)行了深度模擬,通過一系列的關(guān)聯(lián)將諸多組織相互銜接,從而構(gòu)成類神經(jīng)網(wǎng)絡(luò)形式的處理模式,可對(duì)面臨的問題進(jìn)行準(zhǔn)確快速處理。阿爾法圍棋的處理模式則是由兩種模式組合而成,一種是“落子選擇器”,它的作用是對(duì)當(dāng)前棋局情況作出評(píng)估,從而尋找到最合適的下一步。另一種模式則為“棋局評(píng)估器”,它是通過棋子已經(jīng)定位的情況下,對(duì)雙方的贏率進(jìn)行預(yù)測(cè)。在訓(xùn)練中需要不停的反復(fù),并在此過程中對(duì)參數(shù)進(jìn)行調(diào)節(jié),從而使得下一次的結(jié)果更好。
在2016 年度,阿爾法與李世石進(jìn)行了一場(chǎng)圍棋比賽,李世石是一名圍棋職業(yè)九段棋手,并獲得了世界冠軍。最后這場(chǎng)比賽阿爾法以4 比1 的總比分獲勝;在2017 年度,阿爾法在中國(guó)烏鎮(zhèn)圍棋峰會(huì)上,它與柯潔進(jìn)行了圍棋對(duì)戰(zhàn),柯潔當(dāng)時(shí)是排名世界第一的圍棋冠軍,最終阿爾法仍然以3 比0 的總比分獲勝。阿爾法如今已被圍棋界公認(rèn)其能力超過人類頂尖水平。同年10 月,谷歌研發(fā)了新一代的阿爾法圍棋人工智能機(jī)器人,并取名為AlphaGo Zero。新一代的AlphaGo Zero 與AlphaGo 不同,AlphaGoZero 不再僅僅依賴于人類棋譜,它具備了更為強(qiáng)大的學(xué)習(xí)模式,這種新型的學(xué)習(xí)模式就是自我博弈。僅通過三天的訓(xùn)練,AlphaGoZero 就打敗了舊版本AlphaGo。
MOBA(Multiplayer Online Battle Arena)中文譯為多人在線戰(zhàn)術(shù)競(jìng)技游戲,如《英雄聯(lián)盟》《王者榮耀》等。相比棋類游戲,MOBA 更加復(fù)雜。在這類游戲中,人工智能的應(yīng)用也十分普遍[4]。例如,當(dāng)玩家掛機(jī)(由于網(wǎng)絡(luò)等原因退出游戲)后,游戲會(huì)彈出窗口:隊(duì)友退出游戲,是否需要他跟隨你??蛇x擇“基地掛機(jī)”和“跟隨我”。如果選擇了“基地掛機(jī)”,那么掛機(jī)玩家將會(huì)什么都不做,停留在基地。而“跟隨我”選項(xiàng)就運(yùn)用到了人工智能,電腦會(huì)鎖定選了此選項(xiàng)的玩家,與他一起行動(dòng),并且掛機(jī)的玩家會(huì)對(duì)此玩家攻擊的對(duì)象進(jìn)行攻擊。在《王者榮耀》中的“AI 托管”即是此類應(yīng)用。“AI 托管”所用的人工智能比“跟隨我”所用的人工智能更加強(qiáng)大?!癆I 托管”的操作十分強(qiáng)大,技能釋放的精準(zhǔn)度比玩家更高。
除了掛機(jī)時(shí)人工智能會(huì)起到作用,人工智能還在游戲中有另一種存在形式。在新手剛剛接觸游戲時(shí),由于技術(shù)不強(qiáng),為了不讓新手與老玩家匹配到,游戲公司會(huì)向低端水平對(duì)局中釋放“機(jī)器人”。新手在剛接觸游戲后的幾次對(duì)局中,基本都是跟“機(jī)器人”進(jìn)行的對(duì)局。當(dāng)新手變強(qiáng)后,便不會(huì)再匹配到“機(jī)器人”了。
《英雄聯(lián)盟》《守望先鋒》都運(yùn)用了人工智能。游戲中“機(jī)器人”的出現(xiàn)最初是為了解決游戲低水平玩家不至于因人數(shù)過少而導(dǎo)致無法匹配的問題。部分游戲公司開發(fā)了人對(duì)戰(zhàn)人工智能的關(guān)卡。幫助玩家進(jìn)行訓(xùn)練。游戲公司運(yùn)用人工智能除了可以幫助玩家進(jìn)行訓(xùn)練以外,還可以用人工智能與玩家進(jìn)行的對(duì)戰(zhàn)數(shù)據(jù)進(jìn)行檢測(cè),有助于游戲開發(fā)方對(duì)玩家的操作進(jìn)行研究,并且利于游戲公司在后臺(tái)對(duì)游戲進(jìn)行的優(yōu)化。
人工智能的運(yùn)用對(duì)于游戲開發(fā)方來說有許多益處。對(duì)人工智能在游戲中的應(yīng)用研究可以增加開發(fā)方對(duì)于游戲的理解。這使得開發(fā)方開發(fā)游戲的不同玩法,有助于游戲和人工智能的共同發(fā)展[5]。在電子游戲中,如何更好的使用人工智能技術(shù),這密切關(guān)系到游戲的可玩性。在游戲中在合適的領(lǐng)域加入更好的人工智能技術(shù)是設(shè)計(jì)游戲的主要難點(diǎn)之一,想要設(shè)計(jì)出優(yōu)秀的智能游戲,是需要建立在能夠充分理解玩家與人工智能的共通點(diǎn)的基礎(chǔ)上,只有這樣才可以周全考慮到玩家的需求。