潘云鶴
Chinese Academy of Engineering, Beijing 100088, China
Research Artificial Intelligence—Perspective
人工智能走向2.0
潘云鶴
Chinese Academy of Engineering, Beijing 100088, China
a r t i c l e i n f o
Article history:
Received 2 December 2016
Revised 9 December 2016
Accepted 13 December 2016
Available online 16 December 2016
人工智能2.0大數(shù)據(jù)
群體智能
跨媒體
人機(jī)混合智能
無人智能系統(tǒng)
隨著互聯(lián)網(wǎng)的普及、傳感網(wǎng)的滲透、大數(shù)據(jù)的涌現(xiàn)、信息社區(qū)的崛起,以及數(shù)據(jù)和信息在人類社會、物理空間和信息空間之間的交叉融合與相互作用,當(dāng)今人工智能(AI)發(fā)展所處信息環(huán)境和數(shù)據(jù)基礎(chǔ)已經(jīng)發(fā)生了深刻變化,人工智能的目標(biāo)和理念正面臨重要調(diào)整,人工智能的科學(xué)基礎(chǔ)和實(shí)現(xiàn)載體也面臨新的突破,人工智能正進(jìn)入一個新的階段。這個源于傳統(tǒng)而又與之不同的人工智能新階段被稱為人工智能2.0(AI 2.0)。本文從人工智能60年的發(fā)展歷史出發(fā),通過分析促成人工智能2.0形成的外部環(huán)境與目標(biāo)的轉(zhuǎn)變,分析技術(shù)萌芽,提出了人工智能2.0的核心理念,并結(jié)合中國發(fā)展的社會需求與信息環(huán)境特色,給出了發(fā)展人工智能2.0的建議。
? 2016 THE AUTHORS. Published by Elsevier LTD on behalf of Chinese Academy of Engineering and Higher Education Press Limited Company. This is an open access article under the CC BY-NC-ND license
(http://creativecommons.org/licenses/by-nc-nd/4.0/).
近年來,產(chǎn)業(yè)界、媒體、政界等都對人工智能產(chǎn)生了濃厚興趣,人工智能的研究與應(yīng)用在國內(nèi)外迅速升溫。
產(chǎn)業(yè)界首先對布局人工智能展開行動。根據(jù)美國風(fēng)投數(shù)據(jù)公司CBInsight 2016年7月的報告[1],從2011年以來的5年中,美國谷歌、微軟、Twitter、Intel、Apple等IT巨頭收購了約140家人工智能領(lǐng)域的創(chuàng)業(yè)公司。僅2016年上半年,資本市場對人工智能方向的投入就已經(jīng)超過2015年全年。200家與人工智能相關(guān)的公司在股市上籌集到了15億美元。
大量的并購與資本的涌入加速了人工智能技術(shù)更緊密地與應(yīng)用結(jié)合,更快地向經(jīng)濟(jì)轉(zhuǎn)化。以谷歌為例,2013年,當(dāng)谷歌高價收購由多倫多大學(xué)的教授Geoffrey Hinton創(chuàng)辦的只有3位員工的神經(jīng)網(wǎng)絡(luò)公司DNNresearch時,曾引起軒然大波,如今Geoffrey Hinton發(fā)起的深度學(xué)習(xí),已經(jīng)成為產(chǎn)業(yè)界最熱門的技術(shù),幫助谷歌切實(shí)提升了圖像搜索的準(zhǔn)確度,成為谷歌眼鏡、谷歌無人車等項目的核心支撐。2014年,谷歌又以4億英鎊收購了DeepMind公司。2016年,DeepMind研制的AlphaGo戰(zhàn)勝了圍棋世界冠軍而嶄露頭角。谷歌自稱正在從一個移動優(yōu)先(Mobile first)的公司進(jìn)化到人工智能優(yōu)先(AI first)的公司。
人工智能與產(chǎn)業(yè)需求的結(jié)合也催生出服務(wù)模式的重大轉(zhuǎn)變,如微軟開發(fā)的小冰聊天機(jī)器人,正在引導(dǎo)傳統(tǒng)使用方式從“圖形界面”向“自然語言和情感理解交互界面”轉(zhuǎn)變。微軟在2016年6月以262億美元收購社交網(wǎng)站LinkedIn[2],準(zhǔn)備利用人工智能技術(shù)來重建互聯(lián)網(wǎng)社區(qū)。IBM開發(fā)的Watson系統(tǒng),已經(jīng)在醫(yī)院運(yùn)行,包括快速篩選癌癥治療史中的150萬份患者記錄、診斷疑難白血病、提供治療方案的建議,正在改變腫瘤治療與臨床診斷的運(yùn)作模式。中國的百度公司也因在機(jī)器翻譯、自然語言理解和智能汽車的布局,被評為“最聰明的公司”。
這一系列引人矚目的突破與轉(zhuǎn)變,也提升了大眾對人工智能技術(shù)的預(yù)期,尤其近期谷歌DeepMind研發(fā)的AlphaGo引起了媒體的高度關(guān)注。AlphaGo結(jié)合深度強(qiáng)化學(xué)習(xí)和自我博弈策略訓(xùn)練得到策略網(wǎng)絡(luò)與價值網(wǎng)絡(luò),并結(jié)合蒙特卡洛樹搜索(Monte Carlo Tree Search, MCTS) [3]來學(xué)習(xí)與運(yùn)用圍棋知識,于2016年3月,以4∶1戰(zhàn)勝了圍棋世界冠軍李世石。李世石在賽后表示,AlphaGo有兩點(diǎn)讓他感到震驚:一是其初期布局能力;二是在他感覺雙方都很難落子的情況下機(jī)器往往出手干脆。AlphaGo所表現(xiàn)出來的超越人類智能的行為,引發(fā)了世人的震驚與思考。法新社報道說:英國物理學(xué)家霍金表示,人工智能的完全開發(fā)“可能導(dǎo)致人類的滅絕”[4],“從現(xiàn)在起的一百年內(nèi),計算機(jī)將比人類聰明”[5]。
2016年6月,《科學(xué)美國人》發(fā)表題為“人工智能覺醒”[6]的專題報道,其副標(biāo)題為“人工智能,曾經(jīng)被認(rèn)為是過時丟棄的技術(shù),如今正在強(qiáng)力復(fù)蘇”。本文下面將分析提出,這種看似的復(fù)蘇實(shí)質(zhì)上正預(yù)示著一次人工智能的技術(shù)飛躍。
從誕生至今,人工智能已經(jīng)經(jīng)歷了60年的發(fā)展。這60年的成果是豐富的,歷程也是坎坷的?;仡櫰渲械慕?jīng)驗教訓(xùn),能使我們進(jìn)一步看清人工智能的發(fā)展趨向。
2.1. 人工智能的誕生
1956年,斯坦福大學(xué) McCarthy 教授、麻省理工學(xué)院 Minsky教授、卡內(nèi)基梅隆大學(xué)的 Simont 和 Newell教授(以上四位皆為圖靈獎獲得者)以及貝爾實(shí)驗室的Shannon (信息論提出者)、IBM 公司的 Rochester 等學(xué)者在美國達(dá)特茅斯(Dartmouth)學(xué)院首次確立了“人工智能”的概念[7],即讓機(jī)器能像人那樣理解、思考和學(xué)習(xí),即用計算機(jī)模擬人的智能。
自20世紀(jì)70年代以來,人工智能形成了如下典型研究領(lǐng)域:機(jī)器定理證明、機(jī)器翻譯、專家系統(tǒng)、博弈、模式識別、機(jī)器學(xué)習(xí)、機(jī)器人與智能控制等。在探索這些領(lǐng)域的過程中,發(fā)展了大量技術(shù),從中又形成了符號學(xué)派、連接學(xué)派、行為學(xué)派等多個學(xué)派。
2.2. 人工智能的三次低谷
然而人工智能的發(fā)展并非一帆風(fēng)順,60年中經(jīng)歷了三次大低谷。第一次挫折發(fā)生在1973年,英國發(fā)表了James Lighthill報告[8]。該報告主要評判人工智能基礎(chǔ)研究中自動機(jī)、機(jī)器人和中央神經(jīng)系統(tǒng),并得出結(jié)論:“自動機(jī)和中央神經(jīng)系統(tǒng)的研究有價值,但進(jìn)展令人失望。機(jī)器人的研究沒有價值,進(jìn)展非常令人失望。建議取消機(jī)器人的研究。”遭此打擊之后,人工智能進(jìn)入嚴(yán)冬(AI Winter)?,F(xiàn)在看來,當(dāng)時的人工智能尚屬嬰兒期,其實(shí)很難對其進(jìn)行準(zhǔn)確的評判。
人工智能的第二次挫折是由日本智能(第五代)計算機(jī)的研制失敗導(dǎo)致。日本通產(chǎn)省1982年開始了第五代計算機(jī)的研制計劃,希望計算機(jī)具備能直接推理與知識處理的新型結(jié)構(gòu)。該計劃的目標(biāo)是:構(gòu)成一個具有1000個處理單元的并行推理機(jī),連接10億信息組的數(shù)據(jù)和知識庫,具備聽說能力。到1992年,該計劃耗資約8.5億美元,因沒能突破關(guān)鍵性的技術(shù)難題,最終以失敗告終。這次的失敗說明:驅(qū)動人工智能的發(fā)展主要靠創(chuàng)新的知識和軟件,硬件的作用是支持其運(yùn)行。
人工智能的第三次挫折開始于1984年,斯坦福大學(xué)試圖通過專家人工的方式,來構(gòu)建一個包含人類常識的知識百科全書Cyc[9],并期望基于此實(shí)現(xiàn)類人的推理能力。截至2015年11月,雖然Cyc已包括23萬多個概念、實(shí)體和200多萬個三元組,但因為搜索引擎開始崛起,互聯(lián)網(wǎng)和大數(shù)據(jù)更顯威力,實(shí)際上,Cyc在20世紀(jì)90年代后期就開始衰敗。雖然Cyc后來也開始鏈接外部知識庫(如Dbpedia[10]、Freebase[11]、CIA World Factbook[12]等),但已無法挽回頹勢。這次挫折的教訓(xùn)是:海量知識不能靠專家人工表達(dá),要從環(huán)境中自動學(xué)習(xí)。
回顧人工智能發(fā)展歷程中的主要挫折,我們不難發(fā)現(xiàn),當(dāng)它與信息環(huán)境的變化趨勢不符時,往往就會導(dǎo)致失敗。促使人工智能變化的動力既有來自人工智能研究的內(nèi)部驅(qū)動力,也有來自信息環(huán)境與社會目標(biāo)的外部驅(qū)動力,兩者都很重要,但相比之下,往往后者的動力更加強(qiáng)大。
當(dāng)前,隨著互聯(lián)網(wǎng)的普及、傳感器的泛在、大數(shù)據(jù)的涌現(xiàn)、電子商務(wù)的發(fā)展、信息社區(qū)的興起,數(shù)據(jù)和知識在人類社會、物理空間和信息空間之間的交叉融合與相互作用,人工智能發(fā)展所處的信息環(huán)境和數(shù)據(jù)基礎(chǔ)已經(jīng)發(fā)生了巨大而深刻的變化,這些變化形成了驅(qū)動人工智能走向新階段的外在動力。與此同時,一系列的技術(shù)萌芽也預(yù)示著內(nèi)存動力的成長。
3.1. 促進(jìn)人工智能走向2.0的外在動力
促進(jìn)人工智能2.0形成的外在動力至少來自四種外部環(huán)境的變化:
第一,21世紀(jì)的信息環(huán)境已發(fā)生巨大而深刻的變化。隨著移動終端、互聯(lián)網(wǎng)、傳感器網(wǎng)、車聯(lián)網(wǎng)、穿戴設(shè)備等的流行,感知設(shè)備已廣泛遍布城市,計算也與人類密切相伴,遍布全球的網(wǎng)絡(luò)正史無前例地連接著個體和群體,開始快速反映與聚集他們的發(fā)現(xiàn)、需求、創(chuàng)意、知識和能力。與此同時,世界已從二元空間結(jié)構(gòu)PH (Physics, Human Society)演變?yōu)槿臻g結(jié)構(gòu)CPH (Cyber, Physics, Human Society)。CPH的互動將形成各種新計算,包括感知融合、“人在回路中”、增強(qiáng)現(xiàn)實(shí)(AR)、跨媒體計算等。
第二,社會對人工智能的需求急劇擴(kuò)大。人工智能的研究正從過去的學(xué)術(shù)牽引迅速轉(zhuǎn)化為需求牽引。智能城市、智能醫(yī)療、智能交通、智能物流、智能機(jī)器人、無人駕駛、智能手機(jī)、智能游戲、智能制造、智能社會、智能經(jīng)濟(jì)等應(yīng)用中的新目標(biāo)、新問題,都迫切需要人工智能的新發(fā)展。為此,很多企業(yè)和城市已主動布局,進(jìn)行人工智能新研發(fā)。
第三,人工智能的目標(biāo)和理念也在發(fā)生大的轉(zhuǎn)變。人工智能的目標(biāo)正從過去追求“用計算機(jī)模擬人的智能”轉(zhuǎn)化為:①http://www.chinacloud.cn/upload/2014-01/14010707562274.pdf.用機(jī)器與人結(jié)合成增強(qiáng)的混合智能系統(tǒng);②用機(jī)器、人、網(wǎng)絡(luò)結(jié)合組織成新的群體智能系統(tǒng);③用人、機(jī)器、網(wǎng)絡(luò)和物相結(jié)合而成的智能城市等更復(fù)雜的智能系統(tǒng)。
第四,人工智能的數(shù)據(jù)資源也在發(fā)生大的改變。人工智能的基本方法是數(shù)據(jù)驅(qū)動的算法。今后會更多地涌現(xiàn)出大數(shù)據(jù)驅(qū)動計算、傳感器和網(wǎng)絡(luò)驅(qū)動計算、跨媒體驅(qū)動計算。因此,大數(shù)據(jù)智能、感知融合智能、跨媒體智能的發(fā)展均為不可避免的趨勢。而傳統(tǒng)的以字符為基礎(chǔ)的機(jī)器智能測試圖靈方法[13]將受到挑戰(zhàn)。
上述種種環(huán)境的巨變,將促成人工智能技術(shù)的重大提升,為人工智能2.0的形成與發(fā)展創(chuàng)造了切實(shí)的外部環(huán)境。同時,一系列新智能技術(shù)已處萌芽階段。
3.2. 人工智能走向2.0的技術(shù)萌芽
在新的外部環(huán)境下,若干新的技術(shù)變化已初露端倪,并表現(xiàn)在近幾年來的人工智能技術(shù)的前沿中。
3.2.1. 大數(shù)據(jù)智能
大數(shù)據(jù)的知識化,以DeepMind的AlphaGo技術(shù)為一大熱門。與傳統(tǒng)博弈人工知識不同,AlphaGo深度強(qiáng)化學(xué)習(xí)發(fā)展了“直覺感知”(下一步在哪)、“棋局推理”(全局獲勝機(jī)會如何)和“新穎落子”(想人所不敢想)等能力,并將記憶人類棋局和自我博弈積累棋局結(jié)合了起來。此外,DeepMind的軟件還控制著Google數(shù)據(jù)中心的制冷系統(tǒng)、風(fēng)扇和窗戶等120個變量,使其用電效率提升了15%,幾年內(nèi)共節(jié)約電費(fèi)數(shù)億美元[14]。中國的諸多數(shù)據(jù)中心也需類似改造。據(jù)統(tǒng)計,它們的總能耗相當(dāng)于三峽水電站的發(fā)電量①。
在此領(lǐng)域中,目前深度學(xué)習(xí)技術(shù)很重要,但其缺陷是不可解釋、不夠通用。解決此類問題,將形成大數(shù)據(jù)智能的發(fā)展。
3.2.2. 互聯(lián)網(wǎng)群體智能
基于網(wǎng)絡(luò)的群體智能技術(shù)已經(jīng)萌芽。今年,Science的“群智之力量”的論文[15],將群體智能計算按難易程度分為三種類型:實(shí)現(xiàn)任務(wù)分配的眾包模式(Crowdsourcing),較復(fù)雜、支持工作流模式的群體智能(Complex workflows),以及最復(fù)雜的協(xié)同求解問題的生態(tài)系統(tǒng)模式(Problem solving ecosystem)。事實(shí)上,大規(guī)模個體通過互聯(lián)網(wǎng)參與和交互,可以表現(xiàn)出超乎尋常的智慧能力,是新的智能系統(tǒng)。普林斯頓大學(xué)Connectome項目開發(fā)了EyeWire游戲[16],讓玩家可以對顯微圖像中單個細(xì)胞及其神經(jīng)元連接,按功能進(jìn)行涂色[17]。來自145個國家的165 000多名科學(xué)家(及志愿者)參與了這個游戲,從而第一次詳細(xì)描述了哺乳動物視網(wǎng)膜的神經(jīng)組織如何檢測運(yùn)動的結(jié)構(gòu)功能關(guān)系[12]。類似的還有Wiki百科、百度問答、知乎問答等研發(fā)的項目。
群體智能計算能極大地提高人類社會的智能水平,有廣泛而重要的用途,目前其理論和技術(shù)尚在初期階段。它的發(fā)展將提供一種前所未有的人工智能。
3.2.3.跨媒體智能
人類智能的重要特點(diǎn)之一,是綜合利用視覺、語言、聽覺等各種感知所記憶的信息,從而完成識別、推理、設(shè)計、創(chuàng)作、預(yù)測等功能。中國科學(xué)家據(jù)此提出“跨媒體計算”概念[18]。2010年,Nature的“2020 Vision”一文中,Norvig等[19]指出:文本、圖像、語音、視頻及其交互屬性將緊密混合在一起,即為“跨媒體”。2014年,Lazer等在Science上發(fā)表的論文指出,多源融合及具有知識演化和系統(tǒng)演化特性的智能分析方法,是解決“大數(shù)據(jù)傲慢”(big data hubris)的必要手段[20]。蒙特利爾大學(xué)的Yao等[21,22]提出了一系列從視頻中生成文本描述的方法。風(fēng)靡全球的“精靈寶可夢GO” [23]游戲,是利用跨媒體的增強(qiáng)現(xiàn)實(shí)技術(shù),將3D圖形與手機(jī)實(shí)時視頻有機(jī)結(jié)合起來。
近年來,隨著計算機(jī)網(wǎng)絡(luò)、多媒體以及移動終端的不斷發(fā)展,全球數(shù)據(jù)呈現(xiàn)多媒體爆炸式增長的特性??缑襟w智能是實(shí)現(xiàn)機(jī)器認(rèn)知外界環(huán)境的基礎(chǔ)智能,在語言、視覺、圖形和聽覺之間的語義貫通,是實(shí)現(xiàn)聯(lián)想、設(shè)計、概括、創(chuàng)造等智能行為的關(guān)鍵。
當(dāng)前的跨媒體智能,尚處于發(fā)展萌芽狀態(tài),可望形成新一代人工智能的重要領(lǐng)域。
3.2.4. 人機(jī)混合增強(qiáng)智能
人們經(jīng)常會提出的問題是:機(jī)器智能會超過人類智能嗎?人工智能專家的回答多數(shù)是:在專用領(lǐng)域,是的;對通用智能,至少在下一個60年內(nèi)不會發(fā)生。
人的智能是自然生物的智能,它和人工智能各有不同的優(yōu)劣。用計算機(jī)來模擬人的智能固然重要,而讓計算機(jī)與人協(xié)同,取長補(bǔ)短成為一種“1+1>2”的增強(qiáng)性智能系統(tǒng)則更為重要。當(dāng)前,各種穿戴設(shè)備、智能駕駛、外骨骼設(shè)備、人機(jī)協(xié)同手術(shù)紛紛出現(xiàn),預(yù)示著人機(jī)協(xié)同增強(qiáng)智能系統(tǒng)將有一個廣闊的發(fā)展前景。
3.2.5.自主智能系統(tǒng)
從人工智能誕生之時起,機(jī)器人就列入其目標(biāo)領(lǐng)域,仿生學(xué)自然也成為重要的發(fā)展方向。但60年來所出現(xiàn)過的各種仿生機(jī)器人,多數(shù)已在實(shí)用中敗下陣來。最著名的是四腿負(fù)重行走的“機(jī)械騾”,美國陸軍試用后放棄,轉(zhuǎn)用無人戰(zhàn)車。另一類耳熟能詳?shù)睦邮菬o人飛機(jī)和無人汽車,其發(fā)展之迅猛,已遠(yuǎn)遠(yuǎn)超過了機(jī)器人。
越來越多的例子說明,對機(jī)械裝備進(jìn)行智能化和自主化的升級,往往比類人機(jī)器人更加高效。因此,自主智能系統(tǒng)將成為新一代人工智能的重要發(fā)展方向。把握這一趨勢,對中國制造業(yè)的升級尤為重要。
3.3. 人工智能2.0的核心理念
綜上所述,可以給出人工智能2.0的初步定義為:基于重大變化的信息新環(huán)境和發(fā)展新目標(biāo)的新一代人工智能。其中,信息新環(huán)境是指:互聯(lián)網(wǎng)與移動終端的普及、傳感網(wǎng)的滲透、大數(shù)據(jù)的涌現(xiàn)和網(wǎng)上社區(qū)的興起等。新目標(biāo)是指:智能城市、智能經(jīng)濟(jì)、智能制造、智能醫(yī)療、智能家居、智能駕駛等從宏觀到微觀的智能化新需求。可望升級的新技術(shù)有:大數(shù)據(jù)智能、跨媒體智能、自主智能、人機(jī)混合增強(qiáng)智能和群體智能等。
人工智能2.0技術(shù)將具有如下顯著特征:一是從知識表達(dá)技術(shù)到當(dāng)今大數(shù)據(jù)驅(qū)動知識學(xué)習(xí),轉(zhuǎn)向數(shù)據(jù)驅(qū)動和知識指導(dǎo)相結(jié)合的方式,其中,機(jī)器學(xué)習(xí)不但可自動,而且可解釋,應(yīng)用更廣泛;二是從處理分類型數(shù)據(jù),如視覺、聽覺、文字等,邁向跨媒體認(rèn)知、學(xué)習(xí)和推理的新水平;三是從追求“智能機(jī)器”到高水平的人機(jī)協(xié)同融合,走向混合型增強(qiáng)智能的新計算形態(tài);四是從聚焦研究“個體智能”到基于互聯(lián)網(wǎng)的群體智能,形成在網(wǎng)上激發(fā)組織群體智能的技術(shù)與平臺;五是將研究的理念從機(jī)器人轉(zhuǎn)向更加廣闊的智能自主系統(tǒng),從而改造各種機(jī)械、裝備和產(chǎn)品,引領(lǐng)其走向智能化的道路。
人工智能2.0是人工智能發(fā)展的新形態(tài)。它既區(qū)別于過去60年來出于某個流派或領(lǐng)域的一系列研究,也不同于現(xiàn)在的針對某種熱門技術(shù)而延展的改進(jìn)方向[16]。人工智能2.0的目標(biāo)是結(jié)合內(nèi)外雙重驅(qū)動力,以求在新形勢、新需求下實(shí)現(xiàn)人工智能的質(zhì)的突破。相比于歷史上的任何時刻,人工智能2.0將以更接近人類智能的形態(tài)存在,以提高人類智力活動能力為主要目標(biāo)。它將緊密地融入我們的生活(跨媒體和無人系統(tǒng)),甚至成為我們身體的一部分(混合增強(qiáng)智能),可以閱讀、管理、重組人類知識(知識計算引擎),為生活、生產(chǎn)、資源、環(huán)境等社會發(fā)展問題提出建議(智慧城市、智慧醫(yī)療),在某些專門領(lǐng)域中的博弈、識別、控制、預(yù)測等智能接近甚至超越人的水平。
人類在人工智能2.0的輔助下能進(jìn)一步認(rèn)識與把握復(fù)雜的宏觀系統(tǒng),如城市發(fā)展、生態(tài)保護(hù)、經(jīng)濟(jì)管理、金融風(fēng)險等;也有利于進(jìn)一步提高解決具體問題的能力,如醫(yī)療診治、產(chǎn)品設(shè)計、安全駕駛、能源節(jié)約等。
4.1.中國發(fā)展人工智能2.0的需求與可能
中國正值工業(yè)化、城鎮(zhèn)化、信息化、農(nóng)業(yè)現(xiàn)代化和綠色化的發(fā)展高潮,迫切需要發(fā)展人工智能技術(shù)來改善人民日常生活水平,解放社會生產(chǎn)力;優(yōu)化城鎮(zhèn)發(fā)展結(jié)構(gòu)、提高資源利用效率,支持可持續(xù)發(fā)展;加快解決教育、醫(yī)療、貧困、環(huán)境、資源等一系列緊迫問題。
中國工程院近年來在研究“智能城市”“大數(shù)據(jù)”“智能制造”“創(chuàng)新設(shè)計”“數(shù)字創(chuàng)意產(chǎn)業(yè)”和“知識中心”等有關(guān)中國發(fā)展戰(zhàn)略的項目時,深切感受到人工智能的重要性。而且,中國人工智能的市場需求和社會需求已經(jīng)迅速擴(kuò)大。如在2014年,搜索引擎已達(dá)600億元[24],2015年,智能語音產(chǎn)業(yè)達(dá)到46.8億元[25],工業(yè)機(jī)器人銷量猛增54%,達(dá)5.6萬臺[26]。全國已有400余個城市建設(shè)“智慧城市”,市場規(guī)模估計達(dá)800億元[27]。聯(lián)合國教科文組織(UNESCO)在2014年于中國工程院啟動了“國際工程科技知識中心”,從而開始了首個大數(shù)據(jù)和知識服務(wù)的國際合作中心。
值此新一代人工智能恰需整體布局、及時推進(jìn)之際,我們應(yīng)當(dāng)勇于創(chuàng)新、有所貢獻(xiàn),予以前瞻性研究,盡快布局實(shí)施。在布局實(shí)施人工智能2.0時,須與先前積累的發(fā)展成果相互動,如電子政務(wù)、電子商務(wù)、快遞物流、智能社區(qū)、分享經(jīng)濟(jì)、智能手機(jī)、家用電器、制造業(yè)升級和新型城鎮(zhèn)化等。而創(chuàng)新設(shè)計、跨媒體計算、圖像編碼、中文識別、知識中心、智能城市及其大數(shù)據(jù)等先行理念或技術(shù)成果也應(yīng)予以結(jié)合。
4.2. 發(fā)展人工智能2.0的建議
4.2.1.大數(shù)據(jù)智能
大數(shù)據(jù)智能研究從數(shù)據(jù)到知識、從知識到智能行為的能力,打穿數(shù)據(jù)孤島,形成鏈接多領(lǐng)域的知識中心,支撐新技術(shù)和新業(yè)態(tài)的跨界融合與創(chuàng)新服務(wù)。為此,需要研究面向CPH三元空間的知識表達(dá)新體系,鏈接實(shí)體、關(guān)系和行為。研究數(shù)據(jù)驅(qū)動與其他技術(shù)相結(jié)合的知識挖掘、自主學(xué)習(xí)和動態(tài)演化等知識計算新方法、新軟件。建議應(yīng)用于智能醫(yī)療、智能經(jīng)濟(jì)、智能城市等。
4.2.2.互聯(lián)網(wǎng)群體智能
互聯(lián)網(wǎng)群體智能研究群體智能的形成理論、管理方法和組織技術(shù);研究群體智能在互聯(lián)網(wǎng)上的協(xié)同、秩序、安全、演化、學(xué)習(xí)與進(jìn)化的機(jī)理及平臺;研究群體智能的各種產(chǎn)業(yè)生態(tài)。該方向的應(yīng)用為群體智能科研、群體智能知識庫、分享經(jīng)濟(jì)等。
4.2.3.跨媒體智能
跨媒體智能研究跨媒體感知、學(xué)習(xí)、推理和創(chuàng)造;研究綜合邏輯與形象的工作機(jī)理,以語義相通相容為媒介,實(shí)現(xiàn)跨媒體分析、推理、類比、聯(lián)想,建立“耳聰目明”和“融會貫通”的智能新技術(shù)。這一方向的研究工作包括建立語言、視覺、圖形、聽覺等多媒體感知分析和語義相通相容的理論和模型;建立和研制智能感知、跨媒體自主學(xué)習(xí)與推理的新理論、新方法、新軟件、新硬件。其示范應(yīng)用有智能安全、創(chuàng)新設(shè)計、數(shù)字創(chuàng)意等。
4.2.4.人機(jī)混合增強(qiáng)智能
人機(jī)協(xié)調(diào)增強(qiáng)智能研究生物智能系統(tǒng)與機(jī)器智能系統(tǒng)的緊密結(jié)合、協(xié)同工作,形成比兩者都更高的智能水平。實(shí)現(xiàn)人機(jī)、腦機(jī)協(xié)同的環(huán)境/情境理解、問題求解、調(diào)度與決策。其應(yīng)用包括穿戴式設(shè)備、新型機(jī)器人、輔助教育及人機(jī)一體化的新產(chǎn)品。
4.2.5.自主智能系統(tǒng)
自主智能系統(tǒng)研究各種自主智能載運(yùn)平臺、自主生產(chǎn)加工系統(tǒng)和智能調(diào)度監(jiān)控系統(tǒng),深入研究自主智能系統(tǒng)的技術(shù)、架構(gòu)、平臺和設(shè)計標(biāo)準(zhǔn)。其應(yīng)用為無人車、無人機(jī)、各種服務(wù)設(shè)備、機(jī)器人和智能工廠等。
4.3.建議推動人工智能2.0研究的國際合作
鑒于人工智能2.0技術(shù)對人類發(fā)展的重要影響,建議中國推動全球各國科學(xué)家與智庫開展合作,共同推動人工智能技術(shù)沿著正確的方向升級。
致謝
感謝徐匡迪和周濟(jì)院長,沒有他們的幫助,本文不可能在今天完成。
感謝李未、高文、鄭南寧、吳澄、李伯虎、陳左寧、陳純等院士和莊越挺教授,很多概念是在與他們的討論中才得以完善。
感謝李仁涵、吳飛、湯斯亮教授,他們?yōu)楸疚牡男纬商峁┝撕芏嘀匾馁Y料。
[1] CB Insights. The race for AI: Google, Twitter, Intel, Apple in a rush to grab artificial intelligence startups [Internet]. New York: CB Insights. 2016 Dec 6 [cited 2016 Dec 10]. Available from: https://www.cbinsights.com/blog/topacquirers-ai-startups-ma-timeline/.
[2] Ferrucci D, Levas A, Bagchi S, Gondek D, Mueller ET. Watson: beyond jeopardy! Artif Intell 2013;199—200:93—105.
[3] Silver D, Huang A, Maddison CJ, Guez A, Sifre L, van den Driessche G, et al. Mastering the game of Go with deep neural networks and tree search. Nature 2016;529(7587):484—9.
[4] Cellan-Jones R. Stephen Hawking warns artificial intelligence could end mankind [Internet]. London: BBC News. 2014 Dec 2 [cited 2016 Nov 20]. Availablefrom: http://www.bbc.com/news/technology-30290540.
[5] Gaudin S. Stephen Hawking fears robots could take over in 100 years [Internet]. Massachusetts: IDG Communications, Inc. 2015 May 14 [cited 2016 Nov 20]. Available from: http://www.computerworld.com/article/2922442/robotics/stephen-hawking-fears-robots-could-take-over-in-100-years.html.
[6] Bengio Y, Shladover SE, Russell S. The rise of AI. Sci Am 2016;314:44—5.
[7] Crevier D. AI: the tumultuous history of the search for artificial intelligence. New York: Basic Books, Inc.; 1993.
[8] Lighthill J. Artificial intelligence: a paper symposium. London: Science Research Council; 1973.
[9] Poli R, Healy M, Kameas A, editors. Theory and applications of ontology: computer applications. Berlin: Springer; 2010.
[10] Auer S, Bizer C, Kobilarov G, Lehmann J, Cyganiak R, Lves Z. DBpedia: a nucleus for a web of open data. In: Aberer K, Choi KS, Noy N, Allemang D, Lee K, Nixon L, et al., editors The semantic web. Berlin: Springer; 2007. p. 722—35.
[11] Bollacker K, Evans C, Paritosh P, Sturge T, Taylor J. Freebase: a collaboratively created graph database for structuring human knowledge. In: Proceedings of the 2008 ACM SIGMOD International Conference on Management of Data; 2008 Jun 9—12; Vancouver, Canada. 2008. p. 1247—50.
[12] The world factbook [Internet]. Washington, DC: Central Intelligence Agency. [cited 2016 Nov 20]. Available from: https://www.cia.gov/library/publications/the-world-factbook/.
[13] Moor JH, editor. The Turing test: the elusive standard of artificial intelligence. Dordrecht: Kluwer Academic Publishers; 2003.
[14] Mearian L. Google’s DeepMind A.I. can slash data center power use 40% [Internet]. Massachusetts: IDG Communications, Inc. 2016 Jul 20 [cited 2016 Nov 20]. Available from: http://www.computerworld.com/article/3098325/ data-center/googles-deepmind-ai-can-slash-data-center-power-use-40.html.
[15] Michelucci P, Dickinson JL. The power of crowds. Science 2016;351(6268):32—3.
[16] Lee K. Crowd intelligence in EyeWire [Internet]. [cited 2016 Nov 20]. Available from: http://kisuklee.wdfiles.com/local--files/research/crowdintelligence_ EyeWire.pdf.
[17] Cook G. Sebastian Seung’s quest to map the human brain. The New York Times [Internet]. 2015 Jan 8 [cited 2016 Nov 20]. Available from: http://www. nytimes.com/2015/01/11/magazine/sebastian-seungs-quest-to-map-the-human-brain.html.
[18] Yang Y, Zhuang YT, Wu F, Pan YH. Harmonizing hierarchical manifolds for multimedia document semantics understanding and cross-media retrieval. IEEE Trans Multimed 2008;10(3):437—46.
[19] Norvig P, Relman DA, Goldstein DB, Kammen DM, Weinberger DR, Aiello LC, et al. 2020 visions. Nature 2010;463:26—32.
[20] Lazer D, Kennedy R, King G, Vespignani A. The parable of Google Flu: traps in big data analysis. Science 2014;343(6176):1203—5.
[21] Yao L, Torabi A, Cho K, Ballas N, Pal C, Larochelle H, et al. Describing videos by exploiting temporal structure. In: ICCV 2015: Proceedings of the 2015 IEEE International Conference on Computer Vision; 2015 Dec 7—13; Santiago, Chile. 2015. p. 4507—15.
[22] Yao L, Torabi A, Cho K, Ballas N, Pal C, Larochelle H, et al. Video description generation incorporating spatio-temporal features and a soft-attention mechanism. Eprint Arxiv 2015:arXiv:1502.08029.
[23] McCartney M, Margaret McCartney: game on for Pokémon Go. Brit Med J 2016;354:i4306.
[24] The release of core data for Chinese internet economy in 2014: online advertising [Internet]. Shanghai: iResearch; c2002—16 [cited 2016 Nov 20]. Available from: http://news.iresearch.cn/zt/247057.shtml. Chinese.
[25] China Business Intelligence. Global and China speech recognition industry report, 2015—2020 [Internet]. 2016 Apr [cited 2016 Nov 20]. Report No.: ZLC030. Available from: http://www.researchinchina.com/Htmls/Report/2016/10246. html.
[26] OFweek. The sales of industrial robots in China reached 56,000 in 2014 [Internet]. Shenzhen: OFweek. 2015 Jul 27 [cited 2016 Nov 20]. Available from: http://en.ofweek.com/news/The-sales-of-industrial-robots-in-Chinareached-56-000-in-2014-32517.
[27] Enjoy the intelligent cities: urban construction confronts both opportunities and challenges [Internet]. Nanjing: Nanjing Innovative Data Technologies, Inc.; c2013—16 [cited 2016 Nov 20]. Available from: http://www.smartcitychina.cn/MingJiaGuanDian/2014-12/3838.html. Chinese.
E-mail address: zhs@cae.cn
2095-8099/? 2016 THE AUTHORS. Published by Elsevier LTD on behalf of Chinese Academy of Engineering and Higher Education Press Limited Company. This is an open access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).
英文原文: Engineering 2016, 2(4): 409—413
Yunhe Pan. Heading toward Artificial Intelligence 2.0. Engineering, http://dx.doi.org/10.1016/J.ENG.2016.04.018