今天所說的人工智能,它是指在機器上實現(xiàn)的人類智能。包括認知智能、感知智能、決策智能等。我們通常所說的人工智能,實際上是廣義的人工智能?,F(xiàn)在技術(shù)實現(xiàn)的智能,其實分成兩類:一類叫做強人工智能也叫廣義人工智能,幾乎所有人類擁有智能的行為機器都能做,這叫通用人工智能;另外一類人工智能叫狹義人工智能或?qū)S萌斯ぶ悄?,它是指特定的智能。比如人臉識別系統(tǒng),它只能做人臉識別,它是特定人工智能系統(tǒng)或狹義人工智能系統(tǒng)。狹義的人工智能和廣義人工智能并不等同,并不是用幾個狹義人工智能堆起來就是廣義的人工智能,沒有這么簡單。了解了這個概念,我們可以講人工智能的“3144”了。
人工智能三個階段
人工智能的3144,第一個“3”,是指人工智能到現(xiàn)在為止經(jīng)歷了三個歷史階段。第一個階段,叫做基于符號邏輯的推理證明階段,第二個階段,叫做基于人工規(guī)則的專家系統(tǒng)階段。第三個階段,是從2006年到今天,叫做大數(shù)據(jù)驅(qū)動的深度神經(jīng)網(wǎng)絡(luò)階段。第一階段從1956年開始,當時大家認為,所謂人工智能是在機器上實現(xiàn)人的智能,人和動物最大的差別是邏輯推理,如果能進行邏輯推理就有智能。所以用計算機實現(xiàn)邏輯推理是當時最核心的動機。為了實現(xiàn)邏輯推理,當時采用布爾代數(shù)、演繹推理、三段論,后來又專門設(shè)計。
第一階段數(shù)學的幾何定理證明。1956年,卡內(nèi)基梅隆大學就羅素所著《數(shù)學原理》的定理做了證明。到1959年,洛克菲勒的數(shù)學家王浩把所有350條都證明了,這是比較頂級的工作。由于開始時很順暢,大家很樂觀,1958年有兩位非常著名的人工智能專家,提出非常著名的四個寓言:十年內(nèi),計算機將戰(zhàn)勝國際象棋冠軍;十年內(nèi),計算機將證明數(shù)學定理;十年內(nèi),計算機能譜曲;十年內(nèi),計算機將能實現(xiàn)心理學理論。只做了數(shù)理證明其他遙遙無期,再加上一個英國學者在1973年寫了一篇文章,對人工智能狠狠地潑冷水,人工智能第一次跌入低谷。
1976年以后人工智能慢慢回暖,有兩個原因:一是研究人工智能的人反思了一下,人工智能總做陽春白雪、數(shù)學定理證明不行,必須接地氣,要做專家系統(tǒng),讓老百姓真正接觸到。當時有人做心理咨詢專家系統(tǒng)、故障診斷專家系統(tǒng)、治病專家系統(tǒng)、醫(yī)生專家系統(tǒng),各種專家系統(tǒng)。國內(nèi)在20世紀80年代開始有各種各樣的系統(tǒng),比如農(nóng)業(yè)專家系統(tǒng),是那個階段主要的方向。在那個時期,專家系統(tǒng)主要用兩種工具,一個工具是用邏輯推理的,基本是基于規(guī)則的。另外一個技術(shù)基礎(chǔ)是神經(jīng)網(wǎng)絡(luò)。
又發(fā)展了十多年,遇到瓶頸,總有壓倒駱駝的最后一根稻草。第一根稻草是日本研究第五代機器化,不成功,草草收場;第二根稻草是美國以斯坦福大學的專家為主做知識圖譜,把百科全書所有知識輸入到計算機,有什么問題,百科全書都可以回答。這個系統(tǒng)做了十多年,互聯(lián)網(wǎng)興起后,很快被互聯(lián)網(wǎng)超越。所以這個項目也失敗了。這兩個項目的失敗,導致大家又對人工智能失去信心。
第三次是算力加上大數(shù)據(jù)共同發(fā)力導致的人工智能的浪潮。這次完全是從數(shù)據(jù)驅(qū)動的,這也是這次和前兩次的區(qū)別。
這次人工智能浪潮的里程碑是2006年有一名加拿大學者叫Geoffrey在科學雜志上發(fā)表了一篇論文,提到深度神經(jīng)網(wǎng)絡(luò)可以進行大規(guī)模的學習,可以訓練、進行推理。2012年Geoffrey的學生用他的思路做了神經(jīng)網(wǎng)絡(luò)并參加比賽,一鳴驚人,把第二名遠遠甩在后面。
華人的貢獻在2015年,當時在微軟亞洲研究院工作的孫劍博士,領(lǐng)著他的團隊提出“殘差網(wǎng)絡(luò)”。殘差網(wǎng)絡(luò)提出后,在比賽里取得第一的好成績。孫劍錯誤率降到了3.57%,遠高于排在第二名的谷歌團隊的6.7%。當時孫劍的成績已經(jīng)超過人的圖像分類的能力,當然他使用的網(wǎng)絡(luò)也不一樣,別人用的網(wǎng)絡(luò)是22層、19層的,他是用152層的網(wǎng)絡(luò)。這個網(wǎng)絡(luò)現(xiàn)在非常有名,大家知道,AlphaGo后面是AlphaZero,AlphaZero用孫劍的網(wǎng)絡(luò),這個網(wǎng)絡(luò)就是非常有名的深度學習的工具。
AlphaGo,2014年4:1戰(zhàn)勝韓國的當時世界圍棋冠軍李世石?;厝ヒ院髨F隊進行了分析,原來李世石走了一步棋譜里沒有的棋,機器不知道怎么下,隨機走了一步就輸了比賽。當時人類能夠有記錄的棋譜共3000副,所有可能的棋譜是1.5億副,當時用來訓練AlphaGo的數(shù)據(jù),占所有可能數(shù)據(jù)的20%多,還有70%多的數(shù)據(jù)是沒有的,因為沒有數(shù)據(jù),當遇到你沒有的數(shù)據(jù)時可能會輸。最后AlphaGo重新設(shè)計了系統(tǒng),設(shè)計了AlphaZero,并讓其自己互相下,走棋譜里沒有的棋,把所有可能的棋都下了一遍,用1.5億個棋譜訓練了AlphaZreo,所以AlphaZreo是無敵的。
人工智能的一個判斷
做智慧廣電,要用深度網(wǎng)絡(luò)學習,深度網(wǎng)絡(luò)學習要有最全的數(shù)據(jù)、好的算法、足夠的算力,三個加在一起會做出出色的智慧廣電。數(shù)據(jù)、算力、算法是這一輪人工智能最基本的三個要素。這輪人工智能發(fā)展還有一個特點,所有頂級的人工智能科學家都是和企業(yè)一起研究。因為企業(yè)的數(shù)據(jù)是最完整的,要想做一個好的智慧系統(tǒng),沒有大數(shù)據(jù)是不能實現(xiàn)的。
人工智能3144,“1”一個判斷。現(xiàn)在就弱人工智能或?qū)m椚斯ぶ悄軄碚f,只要數(shù)據(jù)夠全,就可以做得不錯。為什么會有那么成熟的人臉識別系統(tǒng)、語音識別系統(tǒng)、機器翻譯系統(tǒng)?因為數(shù)據(jù)用訓練可以做得好。弱人工智能大規(guī)模應(yīng)用已經(jīng)“成勢”,要乘勢而上,順勢而為。人工智能是不是行了呢?強人工智能現(xiàn)在還不行,還有非常長的路需要探索,可能是10年、20年,30年、40年也都有可能,這個取決于現(xiàn)有的機器架構(gòu),做強人工智能是馬太效應(yīng),大車要用更強的系統(tǒng)拉,那個系統(tǒng)是什么,現(xiàn)在不知道。有可能是類腦系統(tǒng)、量子系統(tǒng),也可能是其他系統(tǒng),現(xiàn)在的算力做強人工智能還不夠,弱人工智能沒有問題,這是基本判斷。
人工智能的四個優(yōu)勢與短板
3144中的第一個“4”,是我們國家發(fā)展人工智能有四個優(yōu)勢條件。第一是有政策優(yōu)勢,我們國家對人工智能非常重視。第二是數(shù)據(jù)資源的優(yōu)勢,我們國家擁有海量數(shù)據(jù),這是其他任何一個國家沒有辦法比擬的。第三是豐富的應(yīng)用場景優(yōu)勢。我們有非常豐富的應(yīng)用場景,不管是城鎮(zhèn)化、老齡化、制造業(yè)轉(zhuǎn)型升級還是互聯(lián)網(wǎng)市場。所有這些都給我們提供了非常好的應(yīng)用場景。第四個是我國的青年人才,儲備非常充足。我們有全世界最大的高等教育體系,工科學生占的比例非常高,這些學生都是將來進入人工智能領(lǐng)域潛在的青年才俊。當然我們也有四個薄弱環(huán)節(jié):一是起步晚,再加上前些年科技領(lǐng)域的評估需要短平快,所以一個人很難研究一件事,冷板凳坐30、40年。像有一位加拿大那位教授研究了40年,最后發(fā)出一篇論文引爆這個領(lǐng)域。由于這兩個原因,我們原創(chuàng)性的東西略微差一些,這個我們實事求是,必須要承認。所以真正原創(chuàng)的研究,大多數(shù)來自美國、加拿大和英國。二是高端芯片。不管GPU、ASIC、FPGA,主要掌握在別國企業(yè)的手里。不光是芯片,也包括傳感器,對這部分研究,我們也需要補短板。三是缺乏有國際影響的人工智能開源開放平臺?,F(xiàn)在有影響的開源開放平臺基本都是別國做的,像谷歌、微軟、亞馬遜、Facebook、IBM。國內(nèi)企業(yè)也在推廣,但影響力非常小。第四是高端人才的短板。我們高端人才不足,剛才說青年才俊很多,但是高端人工智能的人才和美國相比,只是美國總數(shù)的20%左右。
(根據(jù)高文院士的公開演講整理而成,未經(jīng)本人確認。)