Michael Berthold
拿起雜志,瀏覽技術(shù)博客,或在行業(yè)會(huì)議上與同行聊天。你會(huì)很快注意到,技術(shù)世界中幾乎所有的事物似乎都有人工智能或機(jī)器學(xué)習(xí)的元素。討論人工智能的方式,聽(tīng)起來(lái)像是在宣傳布道。人工智能是一種可以滿足我們所有需求的真正技術(shù)! 它們正在拯救我們所有人!
我們可以使用基于人工智能的技術(shù)做許多神奇的事情,這是真的。但是通常情況下我們并沒(méi)有完全體現(xiàn)“智能”這一術(shù)語(yǔ)的含義。智能意味著一個(gè)人們可以與之進(jìn)行創(chuàng)造性對(duì)話的系統(tǒng),即具有思想和創(chuàng)新能力的系統(tǒng)。這一術(shù)語(yǔ)存在著爭(zhēng)議。今天的“人工智能”通常描述的是實(shí)現(xiàn)了人類(lèi)在某些方面的能力,例如物體或語(yǔ)音識(shí)別,但肯定不是人類(lèi)智慧的全部潛力。
因此,對(duì)于描述我們今天正在使用的“新”機(jī)器學(xué)習(xí)技術(shù)來(lái)說(shuō),“人工智能”可能并不是最佳術(shù)語(yǔ),但是事已至此,盡管機(jī)器學(xué)習(xí)還不是機(jī)器智能的代名詞,但是它們無(wú)疑已經(jīng)變得更加強(qiáng)大,更具能力并且更易于使用。人工智能(指神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)以及“經(jīng)典”機(jī)器學(xué)習(xí))最終將成為分析工具包的標(biāo)準(zhǔn)組成部分。
既然我們已經(jīng)進(jìn)入了AI革命,或者更確切地說(shuō)是進(jìn)化,那么重要的是要看一下人工智能的概念被采納的方式、原因以及未來(lái)的意義。下面讓我們更為深入地研究探討一下人工智能(即使是一些誤解的說(shuō)法)在當(dāng)今引起關(guān)注的原因。
在當(dāng)前的炒作周期中,人工智能或機(jī)器學(xué)習(xí)經(jīng)常被描述為是相對(duì)較新的技術(shù)。這些技術(shù)正突然變得成熟起來(lái),并在最近從概念階段過(guò)渡到應(yīng)用程序集成階段。
人們普遍認(rèn)為,獨(dú)立的機(jī)器學(xué)習(xí)產(chǎn)品是最近幾年才開(kāi)發(fā)出來(lái)的。實(shí)際上,人工智能取得的重要發(fā)展成就并不是新事物。今天的人工智能只是過(guò)去幾十年來(lái)取得的進(jìn)步的延續(xù)。變化與AI技術(shù)本身并無(wú)太大關(guān)系,而是與人工智能技術(shù)相關(guān)的周邊技術(shù),即數(shù)據(jù)生成和處理能力。我們之所以會(huì)誤認(rèn)為人工智能技術(shù)發(fā)生了變化,是因?yàn)槿斯ぶ悄芗夹g(shù)出現(xiàn)在了許多地方。
我并不想用“我們很快就要存儲(chǔ)多少ZB數(shù)據(jù)”這樣的話讓大家感到焦慮不安。我們都知道,我們生成和收集數(shù)據(jù)的能力正在顯著增長(zhǎng)。同時(shí),我們發(fā)現(xiàn)可用的計(jì)算能力也在驚人地增長(zhǎng)。從單核處理器向多核的轉(zhuǎn)變以及通用圖形處理單元(GPGPU)的開(kāi)發(fā)和采用為深度學(xué)習(xí)提供了足夠的算力。我們甚至不需要內(nèi)部處理計(jì)算,只需簡(jiǎn)單地租用云端中某個(gè)地方的算力即可。
有了如此多的數(shù)據(jù)和大量的計(jì)算資源,數(shù)據(jù)科學(xué)家終于可以使用完全不同于過(guò)去幾十年的方法。在20世紀(jì)90年代,需要花上幾天的時(shí)間訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別數(shù)以萬(wàn)計(jì)的手寫(xiě)樣本數(shù)字。如今,我們可以通過(guò)數(shù)以千萬(wàn)計(jì)的圖像來(lái)訓(xùn)練更復(fù)雜的(即“深度”)神經(jīng)網(wǎng)絡(luò),以識(shí)別動(dòng)物、面容和其他復(fù)雜物體。我們可以部署深度學(xué)習(xí)模型以實(shí)現(xiàn)主流業(yè)務(wù)應(yīng)用程序中的任務(wù)和決策自動(dòng)化,例如檢測(cè)和預(yù)測(cè)產(chǎn)品成熟度或路由打入的電話。
這聽(tīng)起來(lái)可能像建立真實(shí)的智能一樣令人感到可疑,但是需要著重指出的是,在這些系統(tǒng)下,我們只是在調(diào)整數(shù)學(xué)性相依參數(shù),盡管這是一個(gè)相當(dāng)復(fù)雜的參數(shù)。人工智能方法并不擅長(zhǎng)獲取“新”知識(shí),它們只能從呈現(xiàn)給它們的東西中學(xué)習(xí)。換句話說(shuō),人工智能不會(huì)問(wèn)“為什么”這樣的問(wèn)題。系統(tǒng)的運(yùn)行方式不會(huì)像孩子在試圖了解周?chē)澜鐣r(shí)不斷向父母問(wèn)這問(wèn)那。系統(tǒng)只知道它被“喂”了什么,它們不會(huì)識(shí)別以前未出現(xiàn)過(guò)的任何東西。
在其他“經(jīng)典”機(jī)器學(xué)習(xí)場(chǎng)景中,了解我們的數(shù)據(jù)并清楚我們希望該系統(tǒng)如何找到模式非常重要。例如,知道生日對(duì)客戶是沒(méi)有用的,除非將生日轉(zhuǎn)換為客戶的年齡。我們也都知道季節(jié)性的影響,但是我們不應(yīng)該期望系統(tǒng)會(huì)獨(dú)立于季節(jié)來(lái)學(xué)習(xí)時(shí)尚購(gòu)買(mǎi)方式。此外,我們可能還想在系統(tǒng)中注入一些其他信息,讓系統(tǒng)在已知的基礎(chǔ)上進(jìn)行學(xué)習(xí)。與深度學(xué)習(xí)不同,這種機(jī)器學(xué)習(xí)已經(jīng)被企業(yè)使用了數(shù)十年時(shí)間,并正在穩(wěn)步發(fā)展。
人工智能的最新進(jìn)展主要集中在數(shù)據(jù)科學(xué)家能夠模仿人類(lèi)識(shí)別能力的領(lǐng)域,例如識(shí)別圖像中的對(duì)象或聲音信號(hào)中的單詞。對(duì)于識(shí)別諸如音頻流或圖像之類(lèi)的復(fù)雜信號(hào)中的東西,其學(xué)習(xí)能力是非常強(qiáng)大的,強(qiáng)大到足以使許多人懷疑為什么我們沒(méi)有在所有地方都使用深度學(xué)習(xí)技術(shù)。
企業(yè)領(lǐng)導(dǎo)者可能會(huì)問(wèn)他們什么時(shí)候應(yīng)該使用人工智能。在神經(jīng)網(wǎng)絡(luò)解決與模仿人類(lèi)擅長(zhǎng)行為方面(對(duì)象識(shí)別和語(yǔ)音識(shí)別是兩個(gè)最突出的例子)基于AI的研究已經(jīng)取得了巨大進(jìn)展。每當(dāng)有人問(wèn)“好的對(duì)象表示法是什么?”且你無(wú)法回答時(shí),深度學(xué)習(xí)模型就可能值得嘗試一下。如果數(shù)據(jù)科學(xué)家能夠構(gòu)建語(yǔ)義豐富的對(duì)象表示形式,那么經(jīng)典的機(jī)器學(xué)習(xí)方法可能是一個(gè)更好的選擇(嘗試找到一個(gè)好的對(duì)象表示形式是值得認(rèn)真花一些心思的)。
人們只是想在同一平臺(tái)上嘗試不同的技術(shù),他們不想讓軟件供應(yīng)商限制他們的選擇,也不想因軟件供應(yīng)商無(wú)法跟上當(dāng)前發(fā)展而影響到他們的選擇。這就是為什么開(kāi)源平臺(tái)是該市場(chǎng)的領(lǐng)導(dǎo)者的原因。這樣可以使從業(yè)人員將當(dāng)前的最新技術(shù)與最新的前沿技術(shù)相結(jié)合。
展望未來(lái),隨著團(tuán)隊(duì)在使用機(jī)器學(xué)習(xí)來(lái)實(shí)現(xiàn)目標(biāo)和方法上變得一致,深度學(xué)習(xí)將成為每個(gè)數(shù)據(jù)科學(xué)家工具箱的一部分。對(duì)于許多任務(wù)來(lái)說(shuō),在其中添加深度學(xué)習(xí)方法將提供巨大的價(jià)值。由于當(dāng)前人們已經(jīng)在收集和注釋足夠的數(shù)據(jù)方面遇到了麻煩,因此我們通過(guò)預(yù)先訓(xùn)練的人工智能系統(tǒng)合并現(xiàn)有的語(yǔ)音或語(yǔ)音識(shí)別組件。最終我們會(huì)意識(shí)到,就像之前的經(jīng)典機(jī)器學(xué)習(xí)一樣,深度學(xué)習(xí)實(shí)際上只是另一種工具而已。
就像二十年前一樣,我們面臨的障礙之一是:理解人工智能系統(tǒng)學(xué)到的東西以及它們是如何做出預(yù)測(cè)的是一件極為困難的事情。在預(yù)測(cè)客戶是否喜歡某一特定產(chǎn)品時(shí),這一點(diǎn)可能并不重要。但是,當(dāng)解釋為什么一個(gè)與人類(lèi)交互的系統(tǒng)會(huì)以一種意想不到的方式運(yùn)行時(shí),問(wèn)題就出現(xiàn)了。人類(lèi)愿意接受“人類(lèi)的失敗”,因?yàn)椴黄谕祟?lèi)是完美的。但是我們不會(huì)接受人工智能系統(tǒng)的失敗,尤其是如果我們不能解釋它們失敗的原因(并進(jìn)行糾正)。
隨著我們對(duì)深度學(xué)習(xí)的逐漸熟悉,我們將意識(shí)到(就像我們二十年前對(duì)機(jī)器學(xué)習(xí)所做的那樣),盡管系統(tǒng)很復(fù)雜且用于訓(xùn)練的數(shù)據(jù)量很大,但是如果沒(méi)有領(lǐng)域知識(shí),就無(wú)法理解許多模式。人類(lèi)的語(yǔ)音識(shí)別之所以如此有效,是因?yàn)槲覀兺ǔ?梢酝ㄟ^(guò)了解當(dāng)前對(duì)話的上下文來(lái)彌補(bǔ)未聽(tīng)出來(lái)的地方。
當(dāng)今的人工智能系統(tǒng)還沒(méi)有這么強(qiáng)的理解能力。我們現(xiàn)在看到的智能還處于非常淺顯的階段,即模仿孤立的人類(lèi)識(shí)別能力,有時(shí)甚至在孤立的任務(wù)中它們表現(xiàn)的要優(yōu)于人類(lèi)。通過(guò)數(shù)十億個(gè)示例對(duì)系統(tǒng)進(jìn)行訓(xùn)練如今僅僅是關(guān)系到擁有的數(shù)據(jù)量和足夠計(jì)算資源的問(wèn)題,已經(jīng)不再是成敗的決定性條件。
人工智能還遠(yuǎn)遠(yuǎn)達(dá)不到像宣傳的那樣“拯救世界”。不過(guò),它們將成為人們手中的一件令人難以置信的工具,幫助人們更快更好地完成工作。
本文作者M(jìn)ichael Berthold為開(kāi)源數(shù)據(jù)分析公司KNIME的聯(lián)合創(chuàng)始人兼首席執(zhí)行官。其在數(shù)據(jù)科學(xué)領(lǐng)域擁有25年以上的工作經(jīng)驗(yàn),在學(xué)術(shù)界曾先后擔(dān)任過(guò)加利福尼亞大學(xué)(伯克利分校)、卡內(nèi)基梅隆大學(xué)、德國(guó)康斯坦茨大學(xué)的教授,在產(chǎn)業(yè)界先后擔(dān)任過(guò)英特爾的神經(jīng)網(wǎng)絡(luò)小組、Utopy和Tripos的專(zhuān)家。
原文網(wǎng)址
https://www.infoworld.com/article/3438322/artificial-intelligence-today-whats-hype-and-whats-real.html