李健
【摘 要】人工智能學(xué)科自1956年誕生以來,便長期處于計算機(jī)學(xué)科的前沿地位。但由于標(biāo)準(zhǔn)的、規(guī)范的定義的缺失,以及部分影視作品的影響,使得大眾對人工智能的理解是片面的,錯誤的。筆者認(rèn)為當(dāng)代人工智能的發(fā)展的一個重要分支是基于機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的弱人工智能,即使機(jī)器在完成任務(wù)時,更“聰明”一些。
【Abstract】Since the birth of artificial intelligence discipline in 1956, it has been in the forefront of computer science for a long time. However, due to the lack of standard and normative definitions and the influence of some films and TV works, the public understanding of artificial intelligence is one-sided and wrong. The author believes that an important branch of the development of modern artificial intelligence is the weak artificial intelligence based on machine learning and depth learning, which makes machines accomplish their missions more “wisely”.
【關(guān)鍵詞】人工智能;圖靈測試 ;機(jī)器學(xué)習(xí);大數(shù)據(jù) ;數(shù)據(jù)挖掘
【Keywords】artificial intelligence; turing test; machine learning; big data; data mining
【中圖分類號】TP181 【文獻(xiàn)標(biāo)志碼】A 【文章編號】1673-1069(2017)07-0192-03
1 引言
人工智能(Artificial Intelligence)是目前引領(lǐng)計算機(jī)行業(yè)發(fā)展的重要力量之一,圖靈獎更是于2010年與2011年,連續(xù)兩年度均授予了為人工智能做出突出貢獻(xiàn)的科學(xué)家萊斯利·瓦倫特和朱迪亞·珀爾。然而就是這樣一個計算機(jī)科學(xué)領(lǐng)域的重要分支,自學(xué)科誕生以來便沒有一個明確的定義。
人工智能學(xué)科一路走來歷經(jīng)了三個重要的階段:推理期、知識期以及當(dāng)前流行的學(xué)習(xí)期。
首當(dāng)其沖的便是推理期。很長一段時間,我們把邏輯推理能力作為人工智能的重要衡量標(biāo)準(zhǔn)。在這一時期,最有代表性的成就便是艾倫·紐厄爾和赫伯特·西蒙開發(fā)的自動定理證明系統(tǒng),后來這兩位也因為這個貢獻(xiàn)加冕了1975年的圖靈獎。
第二個時期便是知識期。人們很快發(fā)現(xiàn),僅有邏輯推理能力是遠(yuǎn)遠(yuǎn)不夠的,還需要輔以大量的知識儲備。于是專家系統(tǒng)應(yīng)運(yùn)而生。圖1為一般專家系統(tǒng)的結(jié)構(gòu)框架。
為專家系統(tǒng)做出突出貢獻(xiàn)的愛德華·費根鮑姆榮獲1994年的圖靈獎。時至今日,專家系統(tǒng)依然是絕大多數(shù)服務(wù)類軟件的基礎(chǔ)架構(gòu)。
第三階段也便是我們所熟知的當(dāng)前空前繁榮的機(jī)器學(xué)習(xí)時期。專家系統(tǒng)問世后不久人們便發(fā)現(xiàn),如何建模將知識傳遞給專家系統(tǒng)成為了最大的難題[1]。學(xué)習(xí)無疑是獲取知識的最有效途徑,因此機(jī)器學(xué)習(xí)的概念便應(yīng)運(yùn)而生。
機(jī)器學(xué)習(xí)這一概念自誕生以來便受到各行業(yè)人士的追捧。一篇發(fā)表于《Computer World》中的文章詳盡的解析了雇主們無法拒絕的12項計算機(jī)相關(guān)技能時,機(jī)器學(xué)習(xí)力壓群雄奪得榜首。
隨著大數(shù)據(jù)時代的到來,所需處理的數(shù)據(jù)規(guī)模也越來越大,機(jī)器學(xué)習(xí)也逐步滲透到了人們生活工作的方方面面。圖2為大規(guī)模機(jī)器學(xué)習(xí)流程的構(gòu)建與部署。2人工智能與圖靈測試
2.1 人工智能的定義
人工智能(Artificial Intelligence)自學(xué)科誕生以來便沒有一個明確的定義,縱觀整個自然科學(xué)的發(fā)展史也是鮮有出現(xiàn)的。
IQ測試是評價一個人智力水平的重要指標(biāo)之一;但所有智商測試的題目計算機(jī)均可以回答的近乎完美,然而我們并不認(rèn)為計算機(jī)具有了智能。記憶力同樣是衡量一個人智力水準(zhǔn)的因素之一;計算機(jī)的存儲能力遠(yuǎn)超目前人類記憶的極限,我們卻也難說計算機(jī)具有了智能。數(shù)學(xué)水平與計算能力一度等同于“智商”二字,而計算機(jī)的計算能力人類始終難以望其項背,我們也從未以此來說明計算機(jī)具有了智能。究竟什么是人工智能?究竟什么是智能?1969年圖靈獎得主馬文·明斯基定義為:“什么事情是智能的,通過機(jī)器來做就是人工智能?!边@一定義并沒有得到計算機(jī)人的廣泛認(rèn)可[2]。隨后,著名數(shù)學(xué)家、計算機(jī)科學(xué)家愛德華·費根鮑姆對智能的定義逐漸被計算機(jī)科學(xué)家接受。時至今日,對人工智能定義的爭論仍在繼續(xù),而我堅持認(rèn)為,基于機(jī)器學(xué)習(xí)是人工智能重要的評價指標(biāo)之一。
2.2 阿蘭·圖靈與圖靈測試
每每提及計算機(jī)科學(xué),便有一位名人物在腦海中浮現(xiàn),那就是偉大的英國數(shù)學(xué)家、計算機(jī)學(xué)家阿蘭·麥席森·圖靈。素有“計算機(jī)學(xué)科的諾貝爾獎”之稱的圖靈獎便由他的名字命名,圖3為圖靈與圖靈獎杯。
阿蘭圖靈在其發(fā)表的論文《論可計算數(shù)在判定問題中的應(yīng)用》的腳注中提出了“圖靈機(jī)”的概念,這奠定了這個計算機(jī)科學(xué)的基礎(chǔ)[3]。隨后在1950年提出了圖靈測試的概念。
在圖靈測試發(fā)布短短的幾年中,便有超過1000篇的論文在討論與圖靈測試相關(guān)的問題。長久以來,圖靈測試一直被認(rèn)為是判定人工智能的重要依據(jù),然而圖靈測試真的是合格的人工智能的試金石么?目前,計算機(jī)科學(xué)家們普遍不認(rèn)為圖靈測試對人工智能的評判有決定意義的主要有兩方面原因:其一是機(jī)器能否了解人類的認(rèn)知水平(機(jī)器是否能夠通過圖靈測試);其二則是即使通過了圖靈測試,能否從“表現(xiàn)”來評判“智能”。endprint
2.2.1 機(jī)器究竟能否通過圖靈測試
機(jī)器能否通過圖靈測試的關(guān)鍵在于機(jī)器能否了解人類的認(rèn)知水平,即有效地規(guī)避“人為陷阱”。對于類似“《康熙字典》中第1234頁的第5行的第6個字是什么?”這種類型的問題,正常的人類是一定回答不出來的,而如果這個被測試機(jī)器的數(shù)據(jù)庫中恰好存有《康熙字典》的內(nèi)容,它就可以立刻的回答出來,從而使圖靈測試失敗。
再者,如果人類被反復(fù)提問同一問題時會表現(xiàn)出煩躁、不耐煩、甚至厭惡等消極情緒。而對于目前的計算機(jī)來說,又該如何衡量乃至表現(xiàn)這種“消極的情緒”?
就上述兩個問題我們不難發(fā)現(xiàn),要想通過上述這兩個測試,就需要機(jī)器出除了需要預(yù)先存儲所問問題的答案,還需要可以了解目前人類所能認(rèn)知的極限。而這個問題已經(jīng)遠(yuǎn)超出我們目前已知和建立的數(shù)學(xué)模型所能描述的一切范圍。
2.2.2 能否從“表現(xiàn)”評判“智能”
即使有機(jī)器可以通過圖靈測試,那么是否就可以斷定它具有了人工智能呢?答案當(dāng)然是否定的。
1996年,天才棋手卡斯帕羅夫接受電腦“深藍(lán)”的挑戰(zhàn),結(jié)果卡斯帕羅夫以4:2宣告勝利。時隔一年,1997年,“更深的藍(lán)”卷土重來,這一次卡斯帕羅夫在6局較量中敗下陣來。
在對局中,“更深的藍(lán)”曾經(jīng)使出十分精明的“棄子戰(zhàn)術(shù)”,讓卡斯帕羅夫一度認(rèn)為有人為因素參與。賽后采訪時,卡斯帕羅夫表示與他對戰(zhàn)的機(jī)器只有幾步展現(xiàn)出了大師級的水準(zhǔn)而其他的落子方式則頗為幼稚,也因此他拒絕承認(rèn)“更深的藍(lán)”具有了人工智能。
時光荏苒,2016年AlphaGo4:1擊敗韓國棋手李世石;2017年AlphaGo再度披掛出征3:0橫掃柯潔。我們似乎都并未曾把AlphaGo作為完全意義上的人工智能。
究竟什么是人工智能,目前尚沒有人能給出明確的定義。就上述問題來看,圍棋的解空間樹完全超出了人類所能用數(shù)學(xué)表示的極限。因此預(yù)先把所有解存入電腦的數(shù)據(jù)庫中是不現(xiàn)實的。而機(jī)器學(xué)習(xí)就為解決這個問題提供了完美的解決方案:通過一定的訓(xùn)練來自主學(xué)習(xí)、分析下棋的方法,大大縮小了解空間樹[4]。
因此我認(rèn)為當(dāng)代人工智能的發(fā)展是基于機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的弱人工智能。
3 基于機(jī)器學(xué)習(xí)的深度學(xué)習(xí)
3.1 機(jī)器學(xué)習(xí)
我們每天也都在不知不覺中使用或受服務(wù)與機(jī)器學(xué)習(xí):我們?yōu)g覽網(wǎng)站購物時,系統(tǒng)會自動為你推薦最近瀏覽次數(shù)最多的商品;自動駕駛系統(tǒng)也在如火如荼的發(fā)展中。我們每天都在享受著機(jī)器學(xué)習(xí)為我們的生活帶來的便利,那么究竟什么是機(jī)器學(xué)習(xí)?
這是計算機(jī)領(lǐng)域另一個未被明確定義的概念,在我看來:機(jī)器學(xué)習(xí)是一個高度跨學(xué)科的研究領(lǐng)域,各領(lǐng)域的科學(xué)家都希望借以機(jī)器學(xué)習(xí)的算法來解決諸如計算機(jī)視覺、機(jī)器人領(lǐng)域、生物醫(yī)學(xué)甚至自然語言學(xué)方面的問題。它是人工智能的核心,也是使計算機(jī)具有智能的最根本途徑,其應(yīng)用遍及人工智能的各個領(lǐng)域。
3.2 機(jī)器學(xué)習(xí)的主要方法分類
目前學(xué)界主流的機(jī)器學(xué)習(xí)分類方法之一是基于學(xué)習(xí)方法,即根據(jù)對輸入、輸出數(shù)據(jù)流的限制可將機(jī)器學(xué)習(xí)劃分為:監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)。
在監(jiān)督式學(xué)習(xí)模式下,輸入數(shù)據(jù)流被稱為“訓(xùn)練數(shù)據(jù)”,且每組訓(xùn)練數(shù)據(jù)有且僅有一個明確的標(biāo)識或結(jié)果。在建立預(yù)測模型時,監(jiān)督式學(xué)習(xí)將建立一個完整的學(xué)習(xí)過程,使預(yù)測結(jié)果與“訓(xùn)練數(shù)據(jù)”的實際結(jié)果進(jìn)行比較,并不斷進(jìn)行相對應(yīng)的適應(yīng)性調(diào)整,使預(yù)測結(jié)果能夠達(dá)到一個較高的準(zhǔn)確率。
在非監(jiān)督式學(xué)習(xí)中,數(shù)據(jù)并不會被特殊標(biāo)識,學(xué)習(xí)模型只是為了推斷出數(shù)據(jù)的可能存在的一些內(nèi)在結(jié)構(gòu)。常見的應(yīng)用場景包括關(guān)聯(lián)規(guī)則的學(xué)習(xí)以及聚類等。
在強(qiáng)化學(xué)習(xí)模式下,輸入數(shù)據(jù)流作為對模型的反饋,并不僅是作為一個檢查模型正確與否的方式,而是要求輸入數(shù)據(jù)直接反饋到模型,模型必須對此立刻作出相應(yīng)反饋與調(diào)整。圖4為部分常見的機(jī)器學(xué)習(xí)方法的分類。
近年來又出現(xiàn)、興起了半監(jiān)督式學(xué)習(xí)。在這種學(xué)習(xí)方式下,輸入數(shù)據(jù)流會被部分被標(biāo)識,而其余部分則不會被標(biāo)識[5]。這種學(xué)習(xí)模型可以用于進(jìn)行預(yù)測,但是模型首先需要學(xué)習(xí)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)以便合理的組織數(shù)據(jù)來進(jìn)行預(yù)測。此類學(xué)習(xí)算法常應(yīng)用于分類和回歸,算法包括一些對常用監(jiān)督式學(xué)習(xí)算法的延伸,類似算法會試圖對未被標(biāo)識數(shù)據(jù)進(jìn)行建模,并以此為基礎(chǔ),再對已標(biāo)識數(shù)據(jù)進(jìn)行預(yù)測。
4 結(jié)語
人工智能學(xué)科一路走來,學(xué)科分支也不斷發(fā)展壯大。而機(jī)器學(xué)習(xí)作為目前應(yīng)用最為廣泛、影響最為深刻的分支之一也在不斷地發(fā)展著:愈來愈多的算法涌現(xiàn),越來越多的非計算機(jī)學(xué)科使用機(jī)器學(xué)習(xí)算法等也從側(cè)面映證了這一觀點:當(dāng)代人工智能的發(fā)展的一個重要分支是基于機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的弱人工智能,即使機(jī)器在完成任務(wù)時,更“聰明”一些。
【參考文獻(xiàn)】
【1】周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2003.
【2】安德魯·霍奇斯.艾倫·圖靈傳——如謎的解謎者[M].長沙:湖南科學(xué)技術(shù)出版社,2012.
【3】阿蘭·麥席森·圖靈.論可計算數(shù)在判定問題中的應(yīng)用[C].倫敦數(shù)學(xué)會文集,1936:42.
【4】Stanford University, Stanford University Open Courses,http://open.163.com/special/opencourse/machinelearning.html.
【5】伯樂在線學(xué)術(shù)論壇[DB/OL],http://blog.jobbole.com/77620/l.endprint