人工智能阿爾法狗去年4勝1負戰(zhàn)勝圍棋高手李世石,經(jīng)過9個多月的瘋狂學習后,它升級了。阿爾法狗披著Master的馬甲,在圍棋對戰(zhàn)網(wǎng)上以60勝0負的戰(zhàn)績橫掃中日韓圍棋大師,包括“棋圣”聶衛(wèi)平。
圍棋棋路復雜多變,一直被視為人類智慧的門檻,許多人終其一生都在研究。阿爾法狗“年紀輕輕”已經(jīng)達到甚至超過圍棋職業(yè)九段水平,這在圍棋界和科技界可是件了不得的事情——機器的智慧接近甚至戰(zhàn)勝了人類。
許多人知道阿爾法狗是一款厲害的人工智能圍棋程序,但不知道阿爾法是怎么樣學習圍棋的。其實它的學習過程模仿了人類小孩,但更加瘋狂。
人類小孩學習的過程,可以看做從書本、老師、家長和生活實際中學習知識,在頭腦中理解知識,在考試、生活中應用知識三個階段。就像先輸入,再整合,最后輸出。
用傳統(tǒng)的英語學習過程打比方,第一個階段是輸入,是不斷背單詞、記句式、語法的過程。完成這個階段已經(jīng)很不容易,但是只完成這些還是不會用英語交流,和老外對話。
這個時候,就該進入第二個階段,整合。在腦海中整合第一階段的知識,才知道如何把單詞組合成地道的句子,知道什么場合用什么話。
在第三階段,就要輸出了,能用英語交流,表達自己的想法。
人類學習概括起來就是經(jīng)歷從積累經(jīng)驗到總結規(guī)律,最終靈活運用這三個階段。
那么,應該怎樣教會機器學習呢?
機器沒有辦法讀萬卷書,行萬里路,那么第一階段只能從人類給它的數(shù)據(jù)中學習了。
在第二階段,該怎么樣教會機器從數(shù)據(jù)中總結規(guī)律,是機器學習的主要問題。幾十年間,科學家們發(fā)明了各式各樣的機器學習算法。通過編程,告訴機器學習需要的模型、執(zhí)行學習的流程、學習模型中的參數(shù)。
我們用機器學習圍棋做例子。專家們編寫算法,把圍棋的規(guī)則當模型,讓機器執(zhí)行自己和自己下棋的流程,并且下棋速度非??臁T跈C器下了成千上萬盤棋后,就能獲得許多參數(shù),比如怎樣的局勢能贏,怎樣的局勢會輸,對手的棋子占據(jù)哪些地方我輸?shù)母怕蚀?,我的棋子占?jù)哪些地方贏的概率大……
漸漸地,機器就學會了下圍棋,而且能戰(zhàn)勝人類,完成了學習的第三階段。
這樣看來,機器學習的過程是模仿人類小孩的,甚至更簡單,它不會像人類小孩一樣會聯(lián)想,會想象。
但機器學習的瘋狂之處在于,突破了人類學習的速度、腦袋的容量和生命長短的限制。阿爾法狗可以在短時間內(nèi)自己和自己下棋千萬局,人類窮其一生也下不了百萬局棋。
機器學習的模式簡單,和人類如出一轍,但瘋狂的量的積累,讓機器有無限量的智慧和經(jīng)驗。