志剛
人工智能的浪潮正在席卷全球,諸多詞匯時(shí)刻縈繞在我們耳邊:人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)。不少人對(duì)這些高頻詞匯的含義及其背后的關(guān)系總是似懂非懂、一知半解。
為了幫助大家更好地理解人工智能,這篇文章用最簡單的語言解釋了這些詞匯的含義,理清它們之間的關(guān)系,希望對(duì)剛?cè)腴T的同行有所幫助。
1956年,幾個(gè)計(jì)算機(jī)科學(xué)家相聚在達(dá)特茅斯會(huì)議,提出了“人工智能”的概念,夢想著用當(dāng)時(shí)剛剛出現(xiàn)的計(jì)算機(jī)來構(gòu)造復(fù)雜的、擁有與人類智慧同樣本質(zhì)特性的機(jī)器。其后,人工智能就一直縈繞于人們的腦海之中,并在科研實(shí)驗(yàn)室中慢慢孵化。之后的幾十年,人工智能一直在兩極反轉(zhuǎn),或被稱作人類文明耀眼未來的預(yù)言,或被當(dāng)成技術(shù)瘋子的狂想扔到垃圾堆里。直到2012年之前,這兩種聲音還在同時(shí)存在。
2012年以后,得益于數(shù)據(jù)量的上漲、運(yùn)算力的提升和機(jī)器學(xué)習(xí)新算法(深度學(xué)習(xí))的出現(xiàn),人工智能開始大爆發(fā)。據(jù)領(lǐng)英近日發(fā)布的《全球AI領(lǐng)域人才報(bào)告》顯示,截至2017年一季度,基于領(lǐng)英平臺(tái)的全球AI(人工智能)領(lǐng)域技術(shù)人才數(shù)量超過190萬,僅國內(nèi)人工智能人才缺口達(dá)到500多萬。
人工智能的研究領(lǐng)域也在不斷擴(kuò)大,人工智能研究出現(xiàn)了各個(gè)分支,包括專家系統(tǒng)、機(jī)器學(xué)習(xí)、進(jìn)化計(jì)算、模糊邏輯、計(jì)算機(jī)視覺、自然語言處理、推薦系統(tǒng)等。
但目前的科研工作都集中在弱人工智能這部分,并很有希望在近期取得重大突破,電影里的人工智能多半都是在描繪強(qiáng)人工智能,而這部分在目前的現(xiàn)實(shí)世界里難以真正實(shí)現(xiàn)(通常將人工智能分為弱人工智能和強(qiáng)人工智能,前者讓機(jī)器具備觀察和感知的能力,可以做到一定程度的理解和推理,而強(qiáng)人工智能讓機(jī)器獲得自適應(yīng)能力,解決一些之前沒有遇到過的問題)。
弱人工智能有希望取得突破,是如何實(shí)現(xiàn)的,“智能”又從何而來呢?這主要?dú)w功于一種實(shí)現(xiàn)人工智能的方法——機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)最基本的做法,是使用算法來解析數(shù)據(jù)、從中學(xué)習(xí),然后對(duì)真實(shí)世界中的事件做出決策和預(yù)測。與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同,機(jī)器學(xué)習(xí)是用大量的數(shù)據(jù)來“訓(xùn)練”,通過各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)。
舉個(gè)簡單的例子,當(dāng)我們?yōu)g覽網(wǎng)上商城時(shí),經(jīng)常會(huì)出現(xiàn)商品推薦的信息。這是商城根據(jù)你往期的購物記錄和冗長的收藏清單,識(shí)別出這其中哪些是你真正感興趣,并且愿意購買的產(chǎn)品。這樣的決策模型,可以幫助商城為客戶提供建議并鼓勵(lì)產(chǎn)品消費(fèi)。
機(jī)器學(xué)習(xí)直接來源于早期的人工智能領(lǐng)域,傳統(tǒng)的算法包括決策樹、聚類、貝葉斯分類、支持向量機(jī)、EM等。從學(xué)習(xí)方法上來分,機(jī)器學(xué)習(xí)算法可以分為監(jiān)督學(xué)習(xí)(如分類問題)、無監(jiān)督學(xué)習(xí)(如聚類問題)、半監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
傳統(tǒng)的機(jī)器學(xué)習(xí)算法在指紋識(shí)別、人臉檢測、物體檢測等領(lǐng)域的應(yīng)用基本達(dá)到了商業(yè)化的要求或者特定場景的商業(yè)化水平,但每前進(jìn)一步都異常艱難,直到深度學(xué)習(xí)算法的出現(xiàn)。
深度學(xué)習(xí)本來并不是一種獨(dú)立的學(xué)習(xí)方法,其本身也會(huì)用到有監(jiān)督和無監(jiān)督的學(xué)習(xí)方法來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。但由于近幾年該領(lǐng)域發(fā)展迅猛,一些特有的學(xué)習(xí)手段相繼被提出(如殘差網(wǎng)絡(luò)),因此越來越多的人將其單獨(dú)看作一種學(xué)習(xí)的方法。
最初的深度學(xué)習(xí)是利用深度神經(jīng)網(wǎng)絡(luò)來解決特征表達(dá)的一種學(xué)習(xí)過程。深度神經(jīng)網(wǎng)絡(luò)本身并不是一個(gè)全新的概念,可大致理解為包含多個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。為了提高深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果,人們對(duì)神經(jīng)元的連接方法和激活函數(shù)等方面做出相應(yīng)的調(diào)整。其實(shí)有不少想法早年間也曾有過,但由于當(dāng)時(shí)訓(xùn)練數(shù)據(jù)量不足、計(jì)算能力落后,因此最終的效果不盡如人意。
深度學(xué)習(xí)摧枯拉朽般地實(shí)現(xiàn)了各種任務(wù),使得似乎所有的機(jī)器輔助功能都變?yōu)榭赡?。無人駕駛汽車,預(yù)防性醫(yī)療保健,甚至是更好的電影推薦,都近在眼前,或者即將實(shí)現(xiàn)。
機(jī)器學(xué)習(xí)是一種實(shí)現(xiàn)人工智能的方法,深度學(xué)習(xí)是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù)。我們就用最簡單的方法——同心圓,可視化地展現(xiàn)出它們?nèi)叩年P(guān)系。
目前,業(yè)界有一種錯(cuò)誤的較為普遍的意識(shí),即“深度學(xué)習(xí)最終可能會(huì)淘汰掉其他所有機(jī)器學(xué)習(xí)算法”。這種意識(shí)的產(chǎn)生主要是因?yàn)?,?dāng)下深度學(xué)習(xí)在計(jì)算機(jī)視覺、自然語言處理領(lǐng)域的應(yīng)用遠(yuǎn)超過傳統(tǒng)的機(jī)器學(xué)習(xí)方法,并且媒體對(duì)深度學(xué)習(xí)進(jìn)行了大肆夸大的報(bào)道。
深度學(xué)習(xí),作為目前最熱的機(jī)器學(xué)習(xí)方法,但并不意味著是機(jī)器學(xué)習(xí)的終點(diǎn)。起碼目前存在以下問題:
1. 深度學(xué)習(xí)模型需要大量的訓(xùn)練數(shù)據(jù),才能展現(xiàn)出神奇的效果,但現(xiàn)實(shí)生活中往往會(huì)遇到小樣本問題,此時(shí)深度學(xué)習(xí)方法無法入手,傳統(tǒng)的機(jī)器學(xué)習(xí)方法就可以處理;
2. 有些領(lǐng)域,采用傳統(tǒng)的簡單的機(jī)器學(xué)習(xí)方法,可以很好地解決了,沒必要非得用復(fù)雜的深度學(xué)習(xí)方法;
3. 深度學(xué)習(xí)的思想,來源于人腦的啟發(fā),但絕不是人腦的模擬,舉個(gè)例子,給一個(gè)三四歲的小孩看一輛自行車之后,再見到哪怕外觀完全不同的自行車,小孩也十有八九能做出那是一輛自行車的判斷,也就是說,人類的學(xué)習(xí)過程往往不需要大規(guī)模的訓(xùn)練數(shù)據(jù),而現(xiàn)在的深度學(xué)習(xí)方法顯然不是對(duì)人腦的模擬。
科學(xué)不是戰(zhàn)爭而是合作,任何學(xué)科的發(fā)展從來都不是一條路走到黑,而是同行之間互相學(xué)習(xí)、互相借鑒、博采眾長、相得益彰,站在巨人的肩膀上不斷前行。機(jī)器學(xué)習(xí)的研究也是一樣,你死我活那是邪教,開放包容才是正道。
進(jìn)入21世紀(jì),縱觀機(jī)器學(xué)習(xí)發(fā)展歷程,研究熱點(diǎn)可以簡單總結(jié)為2000~2006年的流形學(xué)習(xí)、2006年~2011年的稀疏學(xué)習(xí)、2012年至今的深度學(xué)習(xí)。未來哪種機(jī)器學(xué)習(xí)算法會(huì)成為熱點(diǎn)呢?深度學(xué)習(xí)三大巨頭之一吳恩達(dá)曾表示,“在繼深度學(xué)習(xí)之后,遷移學(xué)習(xí)將引領(lǐng)下一波機(jī)器學(xué)習(xí)技術(shù)”。但最終機(jī)器學(xué)習(xí)的下一個(gè)熱點(diǎn)是什么,誰又能說得準(zhǔn)呢。(編輯/高緯時(shí))