文 / 吳飛 浙江大學(xué)人工智能研究所
人工智能:從規(guī)則學(xué)習(xí),到數(shù)據(jù)驅(qū)動,再到能力增強
文 / 吳飛 浙江大學(xué)人工智能研究所
1955年8月,John McCarthy(時任美國達特茅斯學(xué)院數(shù)學(xué)系助理教授,1971年圖靈獎獲得者)、Marvin Lee Minsky(時任哈佛大學(xué)數(shù)學(xué)和神經(jīng)學(xué)初級研究員,1969年圖靈獎獲得者)、Claude Elwood Shannon(時任貝爾實驗室數(shù)學(xué)研究員,后來被譽為信息論之父)以及Nathaniel Rochester(時任IBM公司信息研究經(jīng)理)四位學(xué)者聯(lián)名給美國洛克菲勒基金會提交了一份名為“人工智能達特茅斯夏季研討會”的項目申請書,在這個申請書中首次提出“人工智能(Artificial Intelligence,AI)”這一術(shù)語,并指出“人工智能”研究目標(biāo)是實現(xiàn)能模擬人類的機器,機器能使用語言,具有概念抽象和理解能力,完成人類自身才能完成的任務(wù)并且不斷提高機器自己。
實際上,在這份申請書中,四位學(xué)者希望洛克菲勒基金會能夠于1956年夏季資助10個人在美國達特茅斯學(xué)院工作2個月,解決如下人工智能領(lǐng)域的7個問題:自動計算機、計算機編程、神經(jīng)網(wǎng)絡(luò)、計算復(fù)雜性理論、計算的自我改進提升、計算抽象(直覺)、隨機性和創(chuàng)造性。從現(xiàn)在的眼光來看,這份申請書中提出了一些時至今日也無法解決的難題,如難以用形式化方法來精確描述的直覺和創(chuàng)造性等,而這些難題也正是當(dāng)今從弱人工智能(也稱領(lǐng)域相關(guān)人工智能)向強人工智能(也稱通用人工智能)邁進突破的艱辛所在。
人工智能從其誕生之日開始,就在人類追求“類人智能”這一樸實夢想感召下獲得了蓬勃發(fā)展。圖靈獎獲得者、美國卡耐基梅隆大學(xué)Raj Reddy教授曾對21世紀(jì)之前的人工智能研究劃分為定理證明和象棋博弈(1950s)、問題求解和語言理解(1960s)、語音-視覺和專家系統(tǒng)(1970s)、機器人和知識系統(tǒng)(1980s)、語言翻譯-搜索和神經(jīng)網(wǎng)絡(luò)(1990s)等幾個階段。
但由于各種原因,人工智能在70年發(fā)展過程中曾經(jīng)遭遇過三次挫折。
1973年,英國科學(xué)研究理事會委托劍橋大學(xué)盧卡斯講席教授、物理學(xué)家James LightHill爵士領(lǐng)導(dǎo)了一個小組對當(dāng)時英國人工智能研究現(xiàn)狀進行調(diào)查,這個小組提交了一份獨立報告,指出自動機和神經(jīng)網(wǎng)絡(luò)研究有價值,但是進展令人失望,機器人的研究沒有價值,進展非常令人失望,建議取消機器人的研究。這一報告的發(fā)表,直接導(dǎo)致英國政府幾乎停止了對人工智能相關(guān)研究的資助,被稱為人工智能發(fā)展史上的嚴(yán)冬(AI Winter),也就是人工智能發(fā)展史上的第一次挫折。從第一次嚴(yán)冬挫折可以看出,從一個新生事物初始階段,很難預(yù)測其未來,因此需要對其抱以一定的寬容之心。應(yīng)該說,英國在人工智能早期研究中表現(xiàn)得十分活躍,如理論計算機之父圖靈提出了對機器智能進行評測的“圖靈測試”、Donald Michie教授在愛丁堡大學(xué)建立了英國第一個(也是世界最早之一)的AI實驗室且逐步發(fā)展成為歐洲人工智能研究中心,而這些陡然而來的努力進步隨著第一次嚴(yán)冬的到來戛然而止。
1982年,日本啟動了研制第五代計算機的計劃,其動機在于從單純計算與存儲的計算機模型向知識推理的新型結(jié)構(gòu)過渡,即從“計算”向“算計”躍升。第五代計算機應(yīng)該具有邏輯和推理等高級功能的“語言”(如類似邏輯編程語言Prolog等),有別于第一代以0和1構(gòu)成的機器指令編碼、第二代的匯編語言、第三代的高級語言(如C等)、第四代的領(lǐng)域相關(guān)高級語言(如用于數(shù)據(jù)庫操作的SQL)。同時,為了支持邏輯和推理,第五代計算機還被要求連接一個龐大的知識庫以支撐并行推理。但是,由于目標(biāo)過于龐大和當(dāng)時人工智能水平尚未具備這樣的能力,1992年第五代計算機研制宣告失敗,這是人工智能發(fā)展歷史上的第二次挫折。第五代計算機研制的失敗告訴我們:類似人腦推理的“工具”需要軟件、硬件和知識的相互配合。
對知識的獲取是人工智能的一個本質(zhì)功能,即從各種感知數(shù)據(jù)(如視覺、聽覺和自然語言文字等)獲取人類社會所普遍認(rèn)同的概念、實體和關(guān)系等知識。知識的不斷累積將會推動智能產(chǎn)生質(zhì)的飛躍。20世紀(jì)80年代開始,人工智能學(xué)者開始嘗試通過手工來建設(shè)涵蓋人類常識性概念和關(guān)系的知識庫,如1984年開始建設(shè)的知識庫Cyc。但是,在建設(shè)過程中,人們發(fā)現(xiàn)這種通過手工方式來編制本身就具有不確定性的知識網(wǎng)絡(luò)是一項無法完成的任務(wù)。如果沒有知識庫,則知識推理等活動則會變成無源之水,于是人工智能發(fā)展遭遇了第三次挫折,這次挫折帶來的后果是歷史上出現(xiàn)的若干專家系統(tǒng)難以在更為開放的環(huán)境中使用。這次挫折帶給我們的啟發(fā)是知識不能完全依賴于專家產(chǎn)生,而是要將專家智慧與機器學(xué)習(xí)(即從數(shù)據(jù)中學(xué)習(xí))結(jié)合起來。
早期人工智能重點研究的是基于規(guī)則的知識推理方法。在這種方法中,會有一些規(guī)則和一套推理方法,其目標(biāo)是基于推理方法去驗證命題或謂詞正確與否,或者學(xué)習(xí)推導(dǎo)出新規(guī)則/新知識。如IBM的沃森和卡耐基梅隆大學(xué)研制的NELL(永不停息的語言學(xué)習(xí))。基于規(guī)則學(xué)習(xí)的人工智能方法解釋性強(與人類邏輯推理過程相符),但其可拓展性較弱,難以構(gòu)建完備的知識庫以及具有完善的推理方法,。
當(dāng)前不斷涌現(xiàn)的大數(shù)據(jù)史無前例地記錄和鏈接人類社會中個體和群體,刻畫個體和群體生活、生產(chǎn)復(fù)雜模式或規(guī)律的知識隱藏在這些大數(shù)據(jù)本身之中,難以事先定義。因此,數(shù)據(jù)驅(qū)動的人工智能方法成為熱點,這一方法利用機器學(xué)習(xí)等手段直接從數(shù)據(jù)中直接析取深層次知識(而不是事先定義)。如谷歌公司利用網(wǎng)絡(luò)搜索引擎得到的大數(shù)據(jù)來預(yù)測疾病流行、百度公司利用手機APP數(shù)據(jù)和商業(yè)信息來預(yù)測“鬼城”等等。
目前,深度學(xué)習(xí)已經(jīng)成為數(shù)據(jù)驅(qū)動學(xué)習(xí)方法的一種主流技術(shù),深度學(xué)習(xí)是一種端到端(end-end)的機器學(xué)習(xí)方法,其基本動機在于構(gòu)建多層網(wǎng)絡(luò)來學(xué)習(xí)隱含在數(shù)據(jù)內(nèi)部的關(guān)系,從而使學(xué)習(xí)得到的特征具有更強、更泛化的表達能力。在大規(guī)模數(shù)據(jù)上所進行的實驗表明,通過深度學(xué)習(xí)所得到的特征表示在自然語言處理、知識圖譜構(gòu)建、圖像分類、語音識別和視頻識別等領(lǐng)域表現(xiàn)了良好性能。但是,深度學(xué)習(xí)這種“端到端”學(xué)習(xí)機制解釋性較弱,并且其依賴于標(biāo)注大數(shù)據(jù),難以利用未標(biāo)注數(shù)據(jù),這是深度學(xué)習(xí)下一步要攻克的“黑洞”難題。
人類在學(xué)習(xí)過程中還存在另外一種學(xué)習(xí)方式,即問題引導(dǎo)下的試錯學(xué)習(xí)。在這種學(xué)習(xí)方法中,我們事先不知道最終答案,于是在學(xué)習(xí)過程中不斷嘗試各種解決問題的可能途徑,然后根據(jù)結(jié)果反饋來相應(yīng)調(diào)整學(xué)習(xí)方法,這一學(xué)習(xí)機制叫強化學(xué)習(xí)。強化學(xué)習(xí)是一種學(xué)習(xí)的能力,從過去的經(jīng)驗中不斷學(xué)習(xí),提升能力。如Deepmind公司研制的圍棋人工智能AlphaGo就是在自我博弈中不斷提升棋力、卡耐基梅隆大學(xué)研制的德州撲克人工智能Libratus在與人類選手對弈中不斷提高牌技。
規(guī)則學(xué)習(xí)是通過邏輯推理引擎來學(xué)習(xí)新知識,數(shù)據(jù)驅(qū)動是基于假設(shè)空間和先驗來學(xué)習(xí)潛在模式,能力增強是通過問題引導(dǎo)來學(xué)習(xí)策略,這三種人工智能形成了從知識到數(shù)據(jù)、從數(shù)據(jù)到能力的三部曲。這三種方法各有優(yōu)劣,目前正在走向相互融合的過程,如AlphaGo身上凝聚著蒙特卡洛樹搜索,深度學(xué)習(xí)和強化學(xué)習(xí)就是一次將傳統(tǒng)規(guī)則學(xué)習(xí)方法、數(shù)據(jù)驅(qū)動模式和能力提升手段相互結(jié)合的一種嘗試。
當(dāng)前,人工智能正成為提升國家競爭力、維護國家安全的戰(zhàn)略利器,成為社會經(jīng)濟發(fā)展的新引擎,世界主要國家紛紛出臺規(guī)劃和政策,圍繞核心技術(shù)、頂尖人才和標(biāo)準(zhǔn)規(guī)范等展開激烈爭奪,力圖在新一輪國家競技場中搶占主導(dǎo)權(quán),如美國決定在國家科學(xué)技術(shù)委員會中設(shè)立“人工智能和機器學(xué)習(xí)委員會”來協(xié)調(diào)指導(dǎo)全美各界在人工智能領(lǐng)域的行動。
為了推動人工智能與經(jīng)濟社會深度融合、提升我國人工智能科技創(chuàng)新能力,中國政府正布局2030年的一項中國人工智能2.0重大科技項目。
中國工程院原常務(wù)副院長潘云鶴院士2016年12月在中國工程院院刊《Engineering》發(fā)表了題為“Heading toward artificial intelligence 2.0”的論文,從人工智能60年的發(fā)展歷史出發(fā),通過分析促成人工智能2.0形成的外部環(huán)境與目標(biāo)的轉(zhuǎn)變,提出了人工智能2.0的核心理念,并結(jié)合中國發(fā)展的社會需求與信息環(huán)境特色,給出了發(fā)展人工智能2.0的建議。潘云鶴院士指出,人工智能2.0將著眼于人工智能從1.0到2.0的如下五個方面的躍變:從人工知識表達技術(shù)到大數(shù)據(jù)驅(qū)動知識學(xué)習(xí);從處理類型單一的數(shù)據(jù)到跨媒體認(rèn)知、學(xué)習(xí)和推理;從追求“機器智能”到邁向人機混合的增強智能;從聚焦研究“個體智能”到基于互聯(lián)網(wǎng)絡(luò)的群體智能;從機器人到自主無人系統(tǒng)的跨越。
杭州市目前是人工智能產(chǎn)業(yè)應(yīng)用的高地,如阿里巴巴電商大數(shù)據(jù)的智能服務(wù)、??低?016年在智能安防躍居全球榜單。我們相信,在人工智能2.0這一背景下,杭州市將迎來更加美好的智能社會。
從我國古代的偃師造人、木牛流馬到希臘神話中赫菲斯托斯的黃金機器女仆,人類從未放棄過對人工智能的追求與探索。站在當(dāng)前背景下進行歷史回顧與未來展望,我們認(rèn)為可解釋、更魯棒和更通用的人工智能是今后重要發(fā)展方向,其表現(xiàn)為:從淺層計算到深度神經(jīng)推理;從單純依賴于數(shù)據(jù)驅(qū)動的模型到數(shù)據(jù)驅(qū)動與知識引導(dǎo)相結(jié)合學(xué)習(xí);從領(lǐng)域任務(wù)驅(qū)動智能到更為通用條件下的強人工智能(從經(jīng)驗中學(xué)習(xí))。
我們深信,下一代人工智能(AI 2.0)將改變計算本身,它會將大數(shù)據(jù)轉(zhuǎn)變?yōu)橹R以支持人類作出更好決策。
(作者系浙江大學(xué)計算機學(xué)院副院長、浙江大學(xué)人工智能研究所所長,博士生導(dǎo)師。主要研究領(lǐng)域為人工智能、跨媒體計算、多媒體分析與檢索和統(tǒng)計學(xué)習(xí)理論。)