袁文
在IBM的計(jì)劃中,沃森要打造的是一個(gè)生態(tài)系統(tǒng)
如果你認(rèn)為機(jī)器人離人類生活還很遙遠(yuǎn),不妨看看以下這些真實(shí)的場(chǎng)景:
無(wú)聊郁悶時(shí),我在微博上發(fā)了一句“不開(kāi)心,怎么破?”并@微軟小冰,20秒后,她就送上了回復(fù):“抱抱?皺著眉頭容易長(zhǎng)抬頭紋哦,不騙你,是真的!”
只要我愿意,聊天就會(huì)一直持續(xù)下去。看這些機(jī)智溫暖或逗比的回答,真有點(diǎn)云開(kāi)霧散的效果。這樣會(huì)聊天的小冰最近還登上了東航飛機(jī),在無(wú)聊的空中飛行時(shí)間里為人解悶。
大家都熟悉的Siri和微軟Cortana(國(guó)內(nèi)稱為“小娜”),則是存活在手機(jī)里的小秘書(shū),在你需要時(shí),做些類似查詢天氣、撥打電話、發(fā)短信、查新聞的事情。
就在前不久,我的一些媒體同行在北京享用了一頓特別午餐,大廚是IBM沃森(Watson),它會(huì)根據(jù)食材特質(zhì)自主設(shè)計(jì)菜譜,人類廚師只需要完成加工的簡(jiǎn)單工作;而在美國(guó)的一些醫(yī)院和研究機(jī)構(gòu),沃森已經(jīng)開(kāi)始幫助醫(yī)生治療癌癥患者。
1月31日蘋果公司發(fā)布一季度財(cái)報(bào)后,美聯(lián)社在幾分鐘后就發(fā)表文章《蘋果打破華爾街第一季度預(yù)期》,作者正是熟悉蘋果風(fēng)格的機(jī)器人。美聯(lián)社在半年前開(kāi)始采用機(jī)器人記者,每個(gè)季度能產(chǎn)生3000篇這樣的稿件。
類似場(chǎng)景之多,大概講上幾天也是沒(méi)有問(wèn)題的。小冰、小娜、沃森這樣的計(jì)算機(jī)虛擬人物,雖然沒(méi)有科幻大片里那樣酷炫的實(shí)體,但他們可以識(shí)別理解人類語(yǔ)義,模仿人類大腦運(yùn)行,并按照人類習(xí)慣的語(yǔ)言方式給出答案,所以也算機(jī)器人的一種。
那么問(wèn)題來(lái)了:他們是如何實(shí)現(xiàn)向人類進(jìn)化的?
學(xué)習(xí)自然語(yǔ)言聽(tīng)懂人類
“芯片是硅做的,人是碳做的,硅與碳在元素周期表上正是同一族。讓機(jī)器像人一樣思考,是順理成章的事?!盜BM全球副總裁王陽(yáng)在介紹人工智能和沃森技術(shù)時(shí),曾經(jīng)這樣表述。
要說(shuō)機(jī)器人技術(shù)哪家強(qiáng),IBM沃森肯定算得上業(yè)內(nèi)翹楚了。它在2007年誕生于IBM研究院的實(shí)驗(yàn)室,以IBM創(chuàng)始人Thomas J. Watson命名,首次為世人所熟知,是在2011年參加美國(guó)老牌智力競(jìng)賽節(jié)目“Jeopardy!”(危險(xiǎn)邊緣),以高比分落差戰(zhàn)勝兩位人類答題高手。
不過(guò),與電影里機(jī)器人拯救或摧毀世界的酷炫場(chǎng)景不同,所謂沃森機(jī)器人,其實(shí)就是IBM超級(jí)計(jì)算機(jī)沃森所具備的AI技術(shù)。它包括數(shù)十臺(tái)IBM Power7服務(wù)器,根據(jù)不同應(yīng)用場(chǎng)景進(jìn)行運(yùn)算,給出人類需要的答案。
沃森的工作流程大致是:通過(guò)語(yǔ)法語(yǔ)義分析問(wèn)題——搜索知識(shí)庫(kù),提取備選答案(它可以在不到5秒的時(shí)間查看約2億頁(yè)內(nèi)容)——針對(duì)備選答案搜尋證據(jù)——啟動(dòng)邏輯推理程序,對(duì)備選答案進(jìn)行合并和可信度排名——得出最佳選項(xiàng)。
聽(tīng)起來(lái)似乎只是一堆冷冰冰的計(jì)算機(jī)在跑程序,但I(xiàn)BM研究院蘇中博士告訴《時(shí)間線》,以《危險(xiǎn)邊緣》為例,沃森的神奇之處在于,它參賽時(shí)并沒(méi)有聯(lián)網(wǎng),所有知識(shí)都來(lái)自過(guò)去四年IBM工作人員的培訓(xùn)。
培訓(xùn)開(kāi)始前,沃森在開(kāi)放領(lǐng)域的答題準(zhǔn)確率只有20%至30%。期間算法不斷完善,類似人類的記憶學(xué)習(xí)過(guò)程,機(jī)器在讀懂自然語(yǔ)言后,進(jìn)行自主學(xué)習(xí)、分析、預(yù)測(cè),最后做到3秒中精準(zhǔn)回答問(wèn)題。為了提高準(zhǔn)確率,避免答錯(cuò)扣分,這只聰明的家伙還會(huì)選擇放棄一些不確定答案的問(wèn)題。
沃森所代表的認(rèn)知計(jì)算,被藍(lán)巨人認(rèn)為是未來(lái)的重要發(fā)展方向。2014年1月,IBM為其在紐約成立了專門的業(yè)務(wù)集團(tuán)Watson Group,提供10億美元資金支持。IBM總裁、董事長(zhǎng)及首席執(zhí)行官羅睿蘭也在2014年一封致股東的年度信中稱,Watson認(rèn)知計(jì)算技術(shù)、云計(jì)算及互動(dòng)系統(tǒng)將徹底改變IBM。
在沃森可能帶來(lái)的這場(chǎng)變革中,蘇中認(rèn)為,其最重要的突破在于理解人類語(yǔ)義——“它首先得明白問(wèn)題的意思是什么”。
要知道,沃森面臨的問(wèn)題,可不僅僅是“1+1=?”這樣的直接提問(wèn),比如在《危險(xiǎn)邊緣》里,沃森需要理解主持人的段子、諷刺、謎語(yǔ)等表達(dá)方式。這是此前的計(jì)算機(jī)很難達(dá)到的程度,也是機(jī)器向人類進(jìn)化所要跨越的第一步。
IT 巨頭們自然都不會(huì)放過(guò)參與機(jī)器進(jìn)化的機(jī)會(huì)。在理解自然語(yǔ)言方面,谷歌、微軟也有著各自的動(dòng)作。
比如《時(shí)間線》了解到,奇點(diǎn)大學(xué)校長(zhǎng)、谷歌工程總監(jiān)雷·庫(kù)茲韋爾在最近到訪中國(guó),與周鴻祎會(huì)面期間,就以Google Tranlsate為例,介紹了機(jī)器是如何理解人類語(yǔ)言的:
“在幾年前其實(shí)就是文字匹配,我們創(chuàng)造一個(gè)數(shù)據(jù)庫(kù),然后去尋找跟這個(gè)數(shù)據(jù)庫(kù)里匹配的翻譯?,F(xiàn)在我們?cè)噲D用更深層次的機(jī)器學(xué)習(xí)來(lái)打造這個(gè)產(chǎn)品,我現(xiàn)在做的工作就是模擬真正人類的翻譯模式。比如當(dāng)你試圖理解我在說(shuō)什么的時(shí)候,你是在自己頭腦中創(chuàng)造另一種想法,來(lái)匹配我的意愿,創(chuàng)造一個(gè)階級(jí)狀的語(yǔ)義模型,然后用另一種語(yǔ)言詮釋出來(lái)。”
而微軟最近的代表作就是“萌妹子”小冰了。這款智能聊天機(jī)器人的資料庫(kù)包括中國(guó)近7億網(wǎng)民多年積累的全部公開(kāi)聊天記錄,微軟從中精煉了1500萬(wàn)條語(yǔ)料庫(kù),讓小冰可以通過(guò)上下文語(yǔ)境進(jìn)行回復(fù)。
不過(guò),小冰的智能程度顯然與沃森還不在同一量級(jí)。這位“16歲少女”的智商并不穩(wěn)定,答非所問(wèn)的表現(xiàn)會(huì)不時(shí)提醒你:陪你聊天的終究還只是一位虛擬機(jī)器人。
建立深度神經(jīng)網(wǎng)絡(luò)認(rèn)識(shí)世界
相比沃森,IBM的另一項(xiàng)新技術(shù)更加充滿未來(lái)感。
在2014年8月的《科學(xué)》雜志上,IBM公司與康奈爾大學(xué)的課題研究人員發(fā)表了一項(xiàng)計(jì)算機(jī)芯片成果——他們模仿人腦結(jié)構(gòu),制造出一款集成54億個(gè)晶體管、包含4096多個(gè)神經(jīng)突觸核心的芯片。
在這款芯片中,每個(gè)神經(jīng)突觸都有自己的計(jì)算結(jié)構(gòu),并與人腦生物組成部分相對(duì)應(yīng)。人腦的運(yùn)作原理被搬進(jìn)芯片。核心內(nèi)存相當(dāng)于腦神經(jīng)突觸,處理器相當(dāng)于核心的神經(jīng)元,接線相當(dāng)于大腦軸突的神經(jīng)纖維。
芯片兼具高效和節(jié)能的優(yōu)點(diǎn)。根據(jù)文章介紹,芯片被設(shè)計(jì)成類似一種脈沖神經(jīng)網(wǎng)絡(luò)。與普通神經(jīng)網(wǎng)絡(luò)每隔固定時(shí)間處理一次數(shù)據(jù)不同的是,脈沖神經(jīng)網(wǎng)絡(luò)只會(huì)在電量超過(guò)闋值時(shí)才會(huì)被激發(fā),被激發(fā)的部位再反過(guò)來(lái)影響其他“神經(jīng)元”。據(jù)此,每觸發(fā)一次,芯片可以產(chǎn)生100萬(wàn)個(gè)可編程的脈沖神經(jīng)元,和2.56億個(gè)可配置的神經(jīng)突觸。
研究人員用一場(chǎng)實(shí)驗(yàn)測(cè)試了它的節(jié)能程度。提供一段視頻,讓芯片從背景中找出行人等特定人員或物體,與之做對(duì)比的模擬器同樣基于人工神經(jīng)網(wǎng)絡(luò),但使用的是多用途微處理器。對(duì)比發(fā)現(xiàn),新芯片消耗能量只有模擬器1/176000,解析速度卻提高了100倍。
盡管新芯片離真正的人腦還有很遠(yuǎn)——人腦有800億個(gè)神經(jīng)元細(xì)胞,100萬(wàn)億個(gè)連接,其中信息處理過(guò)程也完全不同于電腦程序——但這的確代表機(jī)器向人類的進(jìn)化的又一次嘗試。雷·庫(kù)茲韋爾在暢銷書(shū)《奇點(diǎn)大學(xué)》里提出的那個(gè)著名觀點(diǎn):人工智能將在2045年完全超越人類智能,似乎聽(tīng)起來(lái)也沒(méi)有那么癲狂了。
如果說(shuō)理解自然語(yǔ)言是機(jī)器聽(tīng)懂世界的過(guò)程,那么計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)的構(gòu)建,大概就是一首機(jī)器感知并領(lǐng)會(huì)世界的舞曲了。
比如谷歌有名的“貓臉識(shí)別”實(shí)驗(yàn)。Google X實(shí)驗(yàn)室用1.6萬(wàn)片CPU核處理器、10億個(gè)內(nèi)部節(jié)點(diǎn)構(gòu)建了一個(gè)當(dāng)時(shí)全球最大的電子模擬神經(jīng)系統(tǒng),向其展示來(lái)自YouTube的1000萬(wàn)段視頻,在沒(méi)有外界指令的自發(fā)條件下,10天后,“大腦”認(rèn)識(shí)了什么是貓,在隨后的2萬(wàn)張圖片中,準(zhǔn)確找出貓的照片。
這個(gè)類似小朋友識(shí)圖認(rèn)字的過(guò)程看起來(lái)簡(jiǎn)單,但基于神經(jīng)網(wǎng)絡(luò)的“人工大腦”技術(shù)若真正成熟,由此帶來(lái)的改變卻是革命性的。
深度神經(jīng)網(wǎng)絡(luò)技術(shù)最初受到關(guān)注,是在1980年代的大數(shù)據(jù)預(yù)測(cè)和分析領(lǐng)域,但當(dāng)時(shí)受到計(jì)算機(jī)速度限制。直到近幾年,計(jì)算機(jī)開(kāi)始呈摩爾定律發(fā)展,深度神經(jīng)網(wǎng)絡(luò)技術(shù)“復(fù)活”,才開(kāi)始真正發(fā)揮出威力。
目前,神經(jīng)網(wǎng)絡(luò)技術(shù)的一個(gè)重要應(yīng)用領(lǐng)域就是語(yǔ)音識(shí)別。比如,谷歌就正在野心勃勃地想消滅鍵盤——利用公司海量數(shù)據(jù)的語(yǔ)音系統(tǒng),讓電腦可以聽(tīng)懂并“思考”人們的語(yǔ)音。新技術(shù)使用上下文、物理位置和其他因素進(jìn)行假設(shè),由此理解語(yǔ)音真正含義。
谷歌工程師約翰·沙爾克維克在接受媒體采訪時(shí)介紹,3年前,谷歌的語(yǔ)音識(shí)別技術(shù)還只能認(rèn)出3/4的口語(yǔ)單詞,現(xiàn)在,Google Now已經(jīng)可以正確識(shí)別12/13的單詞。想象一下,當(dāng)未來(lái)鍵盤真正消失,計(jì)算機(jī)的外型設(shè)計(jì)也有了更多自由,嗯,至少在外型上,機(jī)器有可能變得更加像人。
在云端
如果沒(méi)有云平臺(tái),未來(lái)機(jī)器人恐怕永遠(yuǎn)只能停留在科幻小說(shuō)和影視作品里——總不能家家都騰出一間臥室,安放存儲(chǔ)著海量數(shù)據(jù)和復(fù)雜運(yùn)行程序的計(jì)算機(jī)吧!
正是云平臺(tái)的發(fā)展,讓沃森有機(jī)會(huì)從實(shí)驗(yàn)室走向市場(chǎng)。“參加比賽的沃森已經(jīng)變成了產(chǎn)品?!碧K中告訴《時(shí)間線》,Watson Group成立后,通過(guò)云平臺(tái)向企業(yè)提供服務(wù),“沃森不是一個(gè)封閉系統(tǒng),而是開(kāi)放式的創(chuàng)新,投資部門、有靈感的創(chuàng)意公司都可以訪問(wèn)到它?!?/p>
比如2014年3月,IBM宣布利用沃森云計(jì)算系統(tǒng)與紐約基因組中心合作,幫助后者開(kāi)發(fā)治療腦膠質(zhì)瘤的方案。具體做法是,基因組中心對(duì)患者進(jìn)行DNA測(cè)序,通過(guò)沃森把數(shù)據(jù)和臨床信息結(jié)合起來(lái),得出有針對(duì)性的治療方案。
DNA測(cè)序產(chǎn)生的大量數(shù)據(jù),用人工處理基本不太可能。IBM高級(jí)副總裁與研究主管約翰·凱利形容這個(gè)過(guò)程“像在草垛里尋針,而且這個(gè)草垛極為巨大”。借助沃森的云計(jì)算系統(tǒng),人類需要花幾年去完成的事情,如今幾秒鐘就可以搞定。
而實(shí)現(xiàn)這一切,紐約基因組中心并沒(méi)有購(gòu)置龐大的計(jì)算機(jī),而是接入沃森的云服務(wù),所有數(shù)據(jù)運(yùn)算工作在云端就可以輕松完成?,F(xiàn)在,沃森針對(duì)某個(gè)特定行業(yè)的培訓(xùn),只需要6個(gè)月左右。
在IBM的計(jì)劃中,沃森要打造的是一個(gè)生態(tài)系統(tǒng)。IBM全球副總裁王陽(yáng)曾介紹:“沃森不是只有IBM能夠應(yīng)用和開(kāi)發(fā),我們會(huì)把沃森通過(guò)云平臺(tái)開(kāi)放給所有人,這對(duì)IBM來(lái)說(shuō)也是非常明智的戰(zhàn)略選擇?!?/p>
2014年9月發(fā)布的Watson Analytics,就是沃森開(kāi)放計(jì)劃的一部分。用戶可以通過(guò)Web或者移動(dòng)設(shè)備進(jìn)行訪問(wèn),享受沃森基于自然語(yǔ)言的認(rèn)知服務(wù),商務(wù)人士還可以將其作為預(yù)測(cè)和可視化分析的工具。免費(fèi)測(cè)試期間,有超過(guò)2000位用戶報(bào)名參加。
Watson Analytics之外,沃森通過(guò)云平臺(tái)輸出的產(chǎn)品還包括Watson Discovery Advisor、Watson Explorer等,都是借助沃森的人工智能技術(shù),幫助企業(yè)用戶解決實(shí)際問(wèn)題。
公開(kāi)數(shù)據(jù)顯示,目前沃森的客戶已經(jīng)達(dá)到數(shù)百位,領(lǐng)域覆蓋金融、醫(yī)療、零售和日常生活等。在中國(guó),沃森也有望進(jìn)入更多的應(yīng)用場(chǎng)景,蘇中舉例:
“比如老年人照料,中國(guó)已經(jīng)進(jìn)入老年社會(huì),沃森可以成為醫(yī)生的個(gè)人助手,針對(duì)每位老人提供輔助服務(wù);針對(duì)知識(shí)工程師,沃森可以承擔(dān)相對(duì)基礎(chǔ)的工作,比如為記者擬好采訪提綱,后期人工潤(rùn)色就可以……沃森可以為很多工作帶來(lái)變化?!?/p>
機(jī)器人究竟會(huì)給我們帶來(lái)怎樣的未來(lái)?技術(shù)發(fā)展正在讓一切變得更富想象空間。比如康奈爾大學(xué)機(jī)械制造實(shí)驗(yàn)室主任霍德·利普森認(rèn)為,未來(lái)機(jī)器人可能會(huì)寫社論、帶孩子,甚至自己創(chuàng)造另外一個(gè)機(jī)器人。而早在2013年年底,谷歌就陸續(xù)買下了Boston Dynamics、maker of BigDog、WildCat等8家機(jī)器人公司,這也讓外界對(duì)未來(lái)機(jī)器人多了一個(gè)期待的理由。
看來(lái),可以確定的是,機(jī)器人進(jìn)化的腳步是停不下來(lái)了。至于人類將來(lái)會(huì)成為這場(chǎng)進(jìn)化的受益者還是受害者,就要取決于我們自己的進(jìn)化能力了。