自2006年以來(lái),深度學(xué)習(xí)算法的突破,加上GPU等并行計(jì)算方式和海量數(shù)據(jù)的加持,AI在圖像、視覺(jué)和語(yǔ)音等方面表現(xiàn)出了超越人類的能力。
但深度學(xué)習(xí)的效果取決于網(wǎng)絡(luò)結(jié)構(gòu)和節(jié)點(diǎn)的設(shè)計(jì)、訓(xùn)練數(shù)據(jù)的質(zhì)量和訓(xùn)練方法的合理性等,還存在不少瓶頸,可能存在天花板。
算法方面存在問(wèn)題
一是無(wú)論深度學(xué)習(xí)還是黑盒子,缺乏理論指導(dǎo),對(duì)神經(jīng)網(wǎng)絡(luò)內(nèi)部涌現(xiàn)出的所謂“智能”還不能做出合理解釋。二是事先無(wú)法預(yù)知學(xué)習(xí)的效果。為了提高訓(xùn)練的效果,除了不斷增加網(wǎng)絡(luò)深度和節(jié)點(diǎn)數(shù)量、為更多數(shù)據(jù)和增加算力,然后反復(fù)調(diào)整參數(shù)基本就沒(méi)別的招數(shù)了。三是調(diào)參還是在碰運(yùn)氣。還沒(méi)有總結(jié)出一套系統(tǒng)經(jīng)驗(yàn)做指導(dǎo),完全依賴個(gè)人經(jīng)驗(yàn),甚至靠運(yùn)氣。四是通用性仍有待提高,沒(méi)有記憶能力。目前幾乎所有的機(jī)器學(xué)習(xí)系統(tǒng)都是被訓(xùn)練于執(zhí)行單一任務(wù),做之前任務(wù)的記憶。
計(jì)算能力仍處于初級(jí)階段
我們今天的人工智能其實(shí)還是一種蠻力計(jì)算,靠無(wú)數(shù)的計(jì)算資源解決一些問(wèn)題,今天所有的技術(shù)都是開(kāi)源的,開(kāi)源的重要特征就是希望根據(jù)我的開(kāi)源搞一套生態(tài),這是高手的玩法,就是一開(kāi)始就要玩生態(tài),要玩生態(tài)必須開(kāi)源,讓大家跟著你一塊走。我們今天說(shuō)大數(shù)據(jù),大數(shù)據(jù)是石油,石油在地球上存在多少萬(wàn)年了,為什么以前不是戰(zhàn)略資源,現(xiàn)在才是戰(zhàn)略資源,就跟數(shù)據(jù)一樣,因?yàn)槲覀兲幚硎偷某杀窘档土耍?jīng)濟(jì)上劃算了,同樣我們處理數(shù)據(jù)的成本降低了。另外我們?cè)贕PU等并行式計(jì)算硬件取得了巨大進(jìn)步,但算力仍然是性能的限制性瓶頸,并且能夠大幅提高算力的硅芯片已逼近物理和經(jīng)濟(jì)成本上的極限,摩爾定律即將失效,計(jì)算性能的增長(zhǎng)曲線變得不可預(yù)測(cè)。
數(shù)據(jù)的處理仍落后
首先我們數(shù)據(jù)的透明度不夠高,雖然深度學(xué)習(xí)方法是公開(kāi)透明的,但是訓(xùn)練用的數(shù)據(jù)往往是不透明的,在利益方的誘導(dǎo)下容易出現(xiàn)數(shù)據(jù)改變信仰的情況。其次如果輸入的數(shù)據(jù)細(xì)微抖動(dòng)就可能導(dǎo)致算法的失效,如果發(fā)起對(duì)抗性樣本攻擊,系統(tǒng)很容易被“洗腦”癱瘓。最后深度學(xué)習(xí)需要海量的大數(shù)據(jù),并且需要打上標(biāo)簽進(jìn)行監(jiān)督學(xué)習(xí),而目前給海量的大數(shù)據(jù)都打上標(biāo)簽幾乎不可能。
AI進(jìn)步需要各方面大融合
目前AI取得的進(jìn)步屬于“連接主義學(xué)派”(基于神經(jīng)生物學(xué)和認(rèn)知科學(xué))。在對(duì)智能的基本認(rèn)知方面,缺乏與具有邏輯推理能力的“符號(hào)主義學(xué)派”(認(rèn)為智能源于數(shù)理邏輯)等的融合能力。比如,還無(wú)法理解實(shí)體的概念,無(wú)法分析因果關(guān)系,無(wú)法識(shí)別關(guān)鍵影響因素,不會(huì)直接學(xué)習(xí)知識(shí),不善于解決復(fù)雜數(shù)學(xué)運(yùn)算,缺乏倫理道德等方面的常識(shí)等。
到2017年,機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)已具有數(shù)千到數(shù)百萬(wàn)個(gè)神經(jīng)元和數(shù)百萬(wàn)個(gè)的連接。這樣的復(fù)雜度還只相當(dāng)于一個(gè)蠕蟲(chóng)的大腦,與有1000億神經(jīng)元和10000億連接的人類大腦,差了N個(gè)數(shù)量級(jí)。但盡管如此,神經(jīng)網(wǎng)絡(luò)下圍棋的能力已遠(yuǎn)高于一只蠕蟲(chóng)。與此同時(shí),一只蠕蟲(chóng)所具有的自繁衍、捕食和躲避天敵等智能,無(wú)論是人類智能還是人工智能,都還望塵莫及。
人工智能的發(fā)展需要依托三大基礎(chǔ)力量,新數(shù)據(jù)、新硬件、新算法。我們以前用CPU,后來(lái)有GPU,今天谷歌說(shuō)我們需要給人工智能設(shè)計(jì)專用的硬件,所以硬件技術(shù)的進(jìn)步使得它的算法或者能力提高了,當(dāng)然算法的改進(jìn)也是很重要的,但是所有的事情都是兩面性的,進(jìn)入深度的時(shí)候一定是把廣度縮小了。
AI仍處于新一輪技術(shù)發(fā)展的初期,現(xiàn)在很多的突破并不是顛覆性的,是很穩(wěn)定的一個(gè)增長(zhǎng),主要靠的是蠻力,今天如果你不說(shuō)大數(shù)據(jù),人工智能就是算法。
到2017年,機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)已經(jīng)具有數(shù)千到數(shù)百萬(wàn)個(gè)神經(jīng)元和數(shù)百萬(wàn)個(gè)鏈接,這樣的復(fù)雜程度相當(dāng)于一個(gè)蠕蟲(chóng)的大腦,為此大家很擔(dān)心隨著人工智能的發(fā)展其會(huì)不會(huì)控制人類,顛覆人類,但我認(rèn)為是不會(huì)的。我們的IT行業(yè)有三個(gè)教父級(jí)的人物,我們今天使用的計(jì)算機(jī)是馮·諾依曼算法。比特的定義,是香農(nóng)定義的,他說(shuō)比特是剝離了語(yǔ)義的。有些事情,是不可計(jì)算,這是阿蘭·圖靈講的,從三位教父的觀點(diǎn)我們可以得出一個(gè)結(jié)論,我個(gè)人的觀點(diǎn)是至少我們這一代的IT技術(shù),基于我們這一代IT技術(shù)的人工智能是不可能超過(guò)人類的,人工智能只是我們的工具,我們需要新的技術(shù)理論,技術(shù)架構(gòu),技術(shù)突破,這一代的技術(shù)是往南走的,人工智能會(huì)往北走,走是可以走的,大家會(huì)非常累。(本文根據(jù)2017年8月13日何寶宏公開(kāi)發(fā)表文章進(jìn)行整理,有刪節(jié),未經(jīng)本人確認(rèn)。)