借助人工智能,或許能揭開有關(guān)生命運(yùn)作方式的部分奧秘?!?戴密斯·哈薩比斯(Demis Hassabis)是人工智能公司DeepMind的聯(lián)合創(chuàng)始人。他領(lǐng)銜的團(tuán)隊(duì)近期解決了生物學(xué)的一大艱深問題。
比賽前的媒體造勢階段,李世石很是自信。他即將和一位特殊的選手對弈——人工智能圍棋程序AlphaGo。不過,身為人類頂尖棋手之一的李世石認(rèn)為自己會輕松獲勝。“我覺得,AlphaGo的基本機(jī)制是概率計(jì)算,只不過是一臺機(jī)器而已?!崩钍朗?dāng)時這么說。即便是在輸?shù)舻谝粓霰荣愔?,他也認(rèn)為這只是因?yàn)锳lphaGo不會犯錯。接著,在第二場對局之中,這個人工智能程序下出了如今已是聲名在外的第37手。AlphaGo就像改寫了圍棋規(guī)則一樣,下出了根本不會有人類想到的一手棋。最終以1:4的總比分輸?shù)舯荣惖睦钍朗@呆了:“這手棋實(shí)在是太有想象力、太巧妙了?!?/p>
李世石和AlphaGo的這個五番棋比賽是人工智能發(fā)展歷程中的重要時刻,而德米斯·哈薩比斯正是推動人工智能發(fā)展的主要人物之一。2010年,他與合作者共同創(chuàng)建了DeepMind公司,并且開始研發(fā)比人類圍棋水平更高的人工智能。那個時候,人們普遍認(rèn)為,人工智能很難精通圍棋,畢竟這項(xiàng)棋類運(yùn)動中可能出現(xiàn)的變化要比宇宙中的原子總數(shù)還多。然而,AlphaGo在2016年戰(zhàn)勝了李世石,這也讓DeepMind——以及哈薩比斯——迅速成為全世界的焦點(diǎn)。1997年,IBM公司的“深藍(lán)”擊敗了國際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov)。AlphaGo在2016年的這場勝利是繼深藍(lán)之后,人工智能的又一大重要時刻。
2016年之后,DeepMind——現(xiàn)在,哈薩比斯的這家公司已經(jīng)隸屬于谷歌的母公司Alphabet了——一直在完善算法,并且把目光投向了棋類項(xiàng)目以外。2020年11月,DeepMind開發(fā)的新人工智能程序AlphaFold破解了預(yù)測蛋白質(zhì)結(jié)構(gòu)這一極為艱深的生物學(xué)問題。哈薩比斯認(rèn)為,這還只是人工智能在科學(xué)領(lǐng)域發(fā)揮作用的開端。就此,《新科學(xué)家》(New Scientist)雜志編輯蒂莫西·雷維爾(Timothy Revell)采訪了哈薩比斯。
目前的目標(biāo)是什么?
我們的愿景是解決人工智能問題。具體來說,就是從根本上認(rèn)識智能,并且通過人工手段再現(xiàn)智能,然后再利用人工智能幫助我們認(rèn)識世界,從而產(chǎn)生積極影響。加快科學(xué)發(fā)現(xiàn)的腳步就是我們希望看到的積極影響之一。
具體哪些類型的智能應(yīng)該編碼在人工智能程序中,你們是怎么確定的?
神經(jīng)科學(xué)給了我們很多啟示。我本人既有神經(jīng)科學(xué)背景,又有計(jì)算科學(xué)背景:我本科階段學(xué)習(xí)計(jì)算機(jī)科學(xué),博士階段則從事神經(jīng)科學(xué)研究。人類大腦的能力及運(yùn)作方式給了我們靈感,也讓我們確定了將神經(jīng)科學(xué)同計(jì)算機(jī)科學(xué)聯(lián)系在一起的目標(biāo)。
你們現(xiàn)在所做的項(xiàng)目中,最令人激動的是哪些?
DeepMind目前研究的項(xiàng)目有很多。首先,我們要認(rèn)證那些令我們感興趣同時具有學(xué)科交叉屬性的科學(xué)問題。要想有所建樹,明確的目標(biāo)和一定量的訓(xùn)練數(shù)據(jù)都是必需的。另一個我們重點(diǎn)考慮的因素是影響力:如果我們解決了這個問題,是否就能開啟某個全新的科學(xué)分支?蛋白質(zhì)折疊問題就符合我剛才所說的全部要求。除此之外,我們還關(guān)注量子化學(xué)、數(shù)學(xué)、物理學(xué)和材料科學(xué)等領(lǐng)域的前沿問題。
在蛋白質(zhì)方面已經(jīng)取得了重大成就。當(dāng)初,為什么你們會選擇這個項(xiàng)目?
在我看來,蛋白質(zhì)是一種非常精致的結(jié)構(gòu)。它們就像一臺臺微型生化機(jī)器,在我們身體的各個部位轉(zhuǎn)運(yùn)養(yǎng)分。它們是開關(guān)、是馬達(dá)、是一座座小工廠。從數(shù)學(xué)角度和計(jì)算機(jī)科學(xué)的角度來看,那種層面上的生物學(xué)開始變得有點(diǎn)數(shù)字化,并且?guī)缀蹙拖裼?jì)算機(jī)編碼一樣,確實(shí)很有意思。
目前,我們只知道大約10萬種蛋白質(zhì)的結(jié)構(gòu),可是,自然界中總共有大約2億種蛋白質(zhì),這個比例實(shí)在是很小了。
如果能解決蛋白質(zhì)折疊的問題,就很可能能夠加速藥物的研發(fā)過程。借助人工智能,我們或許能以比傳統(tǒng)實(shí)驗(yàn)(這種方法速度慢、難度大,還牽扯很多人力、物力)快得多的速度揭開部分有關(guān)生命運(yùn)作方式的奧秘,從而更深入地認(rèn)識疾病。我認(rèn)為,未來10~20年中,科學(xué)領(lǐng)域的一項(xiàng)重大轉(zhuǎn)變會是:通過這種計(jì)算機(jī)科學(xué)的方式認(rèn)識越來越多的生物學(xué)內(nèi)容。
蛋白質(zhì)結(jié)構(gòu)非常復(fù)雜,通常需要數(shù)年的實(shí)驗(yàn)才能確定
人工智能可以幫助我們?nèi)〉媚男﹤鹘y(tǒng)方法無法企及的生物學(xué)成就?
20世紀(jì)初,人類已經(jīng)取得了許多相對容易的科學(xué)成就——雖說是相對容易一些,但也需要像愛因斯坦這樣的天才才能完成。如今,我們面對的是更為復(fù)雜的系統(tǒng),它們本身并不是某幾條簡單的定律就能描述的。就目前的情況來說,人們普遍認(rèn)為,生物學(xué)實(shí)在太過復(fù)雜,太缺少規(guī)律性,因而無法應(yīng)用傳統(tǒng)物理學(xué)方法加以研究。不過,計(jì)算機(jī)科學(xué)和人工智能或許可以幫助我們跨過這道鴻溝。在我看來,這正是人工智能的最佳應(yīng)用領(lǐng)域。
你可以把它看作一位隨時能為你服務(wù)的世界最佳科研助手。人工智能能夠找到合適的模式,它們可以從各種各樣的論文中找出看似不相干的信息,并發(fā)現(xiàn)其中的聯(lián)系。至于目標(biāo)以及目標(biāo)重要性的確定,則仍是人類科學(xué)家的責(zé)任。博士生現(xiàn)在做的很多工作都比較枯燥且缺乏創(chuàng)造性,如果能引入人工智能這樣的自動化系統(tǒng),省掉一些這樣的苦差事,就能解放學(xué)生,讓他們有精力思考更有創(chuàng)新性的解決方案。
有一種批評觀點(diǎn)認(rèn)為,像AlphaFold這樣的系統(tǒng),它們可以很擅長某項(xiàng)任務(wù),但做不了其他任何事情。我們是否需要從根本上重新審視人工智能,讓它們從設(shè)計(jì)上就變得更通用一些?
不,我認(rèn)為不需要。不過,這個批評還是有道理的。我們之前開發(fā)過一款叫作AlphaZero的程序,它會所有一對一的棋類項(xiàng)目,并且可以在不做任何修改的前提下與對手對弈,但它有個缺點(diǎn),就是每從事一項(xiàng)新項(xiàng)目都得從頭學(xué)習(xí),沒有觸類旁通的能力。AlphaZero學(xué)到的東西沒法遷移。有些人會說,這也沒什么,你們有通用的算法就行了。還有些人則不會滿足于這點(diǎn)。
我個人認(rèn)為,如果某個人工智能程序主要學(xué)習(xí)的是國際象棋,那么它對圍棋的認(rèn)識至少也不能是零,肯定要有一些能夠遷移的東西。人類在這方面就做得特別好,畢竟我們顯然負(fù)擔(dān)不起每執(zhí)行一個新任務(wù)就從頭學(xué)起的代價。這就叫遷移學(xué)習(xí),并且也是人工智能目前沒有攻破的難關(guān)。遷移學(xué)習(xí)是一個非常活躍的研究領(lǐng)域,我個人目前也在做這方面的研究。當(dāng)然,我們或許還需要更多的模塊,比如情境記憶和注意力機(jī)制。
這些新增模塊會在哪些方面起作用呢?
人類大腦似乎至少擁有兩個計(jì)算模塊。其一是大腦皮層,這個模塊學(xué)習(xí)速度比較慢,而且需要大量案例學(xué)習(xí),但勝在穩(wěn)定。另一個模塊就是海馬體,這也是我博士生階段研究的課題。海馬體是人類大腦的關(guān)鍵部件,并且擁有極快的學(xué)習(xí)能力。你是怎么記住昨天午餐吃了什么的?全靠海馬體。
于是,你或許會有這種疑問,為什么人類大腦沒有進(jìn)化出一個超大的海馬體?學(xué)習(xí)速度肯定是越快越好嘛。實(shí)際上,老鼠的大腦基本上就是一個巨大的海馬體,并且,從體型大小來評判,這種動物算得上很聰明了。然而,問題在于——當(dāng)然,這只是我個人的猜測——如果你只是學(xué)習(xí)速度快,那么學(xué)到新東西之后,未必能穩(wěn)定把這些知識保留下來。你在學(xué)騎自行車的時候,可能要把彈鋼琴的專長給忘掉。因?yàn)槟銓W(xué)得實(shí)在是太快了,沒法控制具體哪些知識會被覆蓋。
如果你現(xiàn)在正努力在已有知識結(jié)構(gòu)的頂層構(gòu)筑新知識體系,那么肯定不希望大腦那么不穩(wěn)定。不過,另一方面,你肯定不想黃昏時分在水坑里遇到獅子兩次以上才發(fā)現(xiàn)這種情況真的很危險。因此,大腦皮層和海馬體這兩種系統(tǒng)你都需要,而且很可能還需要這兩個系統(tǒng)之間的某種遷移學(xué)習(xí)功能。這正是我們睡覺時大腦做的無數(shù)工作之一。
這是不是說,人工智能也需要某種形式的睡眠?
可能是這樣。我們也確實(shí)在做這方面的研究。在公司成立初期,我們曾訓(xùn)練人工智能玩雅達(dá)利生產(chǎn)的那種電子游戲,記憶回放是人工智能能做到這點(diǎn)的一大關(guān)鍵原因。它不僅僅是在玩游戲,更是在把剛才完成的關(guān)鍵動作回放給自己看。不過,很明顯,你不能把這個叫作睡眠,實(shí)際上,它也不是真正的睡眠。對人工智能來說,這是一種離線模式。
假設(shè)有一個人工智能發(fā)展進(jìn)度條,進(jìn)度條的一端是掃地機(jī)器人,另一端是擁有人類智能的人工智能。那么,我們目前處在進(jìn)度條的哪里?
大概是中間點(diǎn)附近的某個地方吧。不過,對于這個問題,有很多種見解。有些人認(rèn)為,我們這些研究深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的人走錯了路,所以未來肯定會碰壁;還有一些支持我們的人就會說,瞧,我們現(xiàn)在什么都有了,接下去不過是一些繼續(xù)升級換代、擴(kuò)大技術(shù)規(guī)模的問題:運(yùn)用更多的計(jì)算機(jī),處理更多的數(shù)據(jù),然后,終于有一天,我們就得到了擁有人類這個級別智能的通用人工智能。
我覺得,這兩派意見都有失偏頗。在我看來,我們目前已經(jīng)開發(fā)出的人工智能,肯定是沒走錯路,并且還超級有用。不過,我不覺得我們已經(jīng)擁有了一切。要想達(dá)到那個終極目標(biāo),還需要依賴其他的技術(shù)飛躍。
DeepMind公司有做過新冠病毒方面的研究嗎?
現(xiàn)在就指望人工智能可以為這樣的突發(fā)疫情帶來許多實(shí)質(zhì)性的幫助,未免有些太早了。我希望未來再也不會出現(xiàn)新冠病毒這樣的疫情了,但如果不幸出現(xiàn)了,我希望人工智能到時能夠在應(yīng)對疫情方面發(fā)揮更大的作用。
中國的研究人員很早就測繪了新冠病毒中蛋白質(zhì)的基因序列。就當(dāng)時的情況來說,我們也已經(jīng)通過實(shí)驗(yàn)知曉了其中某些蛋白質(zhì)的結(jié)構(gòu),但仍然還有大概十幾種相關(guān)蛋白質(zhì)的結(jié)構(gòu)沒有掌握。當(dāng)時,我們已經(jīng)認(rèn)為AlphaFold系統(tǒng)足夠精確,但由于它沒有經(jīng)過實(shí)踐檢驗(yàn),我們也就沒有大肆宣揚(yáng)AlphaFold找到的那些蛋白質(zhì)結(jié)構(gòu)。不過,我們同時也認(rèn)為,這個人工智能程序絕對可以為科學(xué)界帶來幫助,所以立刻發(fā)表了AlphaFold研究的那些蛋白質(zhì)的最佳模型。
說起人類生存威脅這個話題,我想問問,人工智能可以為氣候變化做點(diǎn)什么嗎?
我們?yōu)楣雀杷龅淖畛雒ぷ髦?,就是控制?shù)據(jù)中心的冷卻系統(tǒng)。每個人都會用到這些數(shù)據(jù)中心,比如你看YouTube視頻的時候。我們通過更高效地開關(guān)風(fēng)扇、水泵以及數(shù)據(jù)中心內(nèi)其他一切神奇設(shè)備,使得數(shù)據(jù)中心的能耗下降了30%。這對節(jié)約成本來說,顯然是一項(xiàng)巨大的進(jìn)步,同時也實(shí)現(xiàn)了環(huán)境保護(hù)。
我們應(yīng)該可以把同類型的優(yōu)化升級措施應(yīng)用到其他機(jī)構(gòu),甚至是電網(wǎng)上,那肯定會節(jié)約大量能源。未來,人工智能還會在材料設(shè)計(jì)、蛋白質(zhì)設(shè)計(jì)這樣的領(lǐng)域大顯身手,幫助我們得到可以分解廢物塑料或是生產(chǎn)可再生生物燃料的蛋白質(zhì)。
未來10年,人工智能能產(chǎn)生最大影響的領(lǐng)域是哪個?
我希望能在重大科學(xué)問題上看到數(shù)十項(xiàng)突破,以及由此產(chǎn)生的各種產(chǎn)品、服務(wù)與進(jìn)步。如果我們沒能在10年內(nèi)完成這個目標(biāo),那我應(yīng)該會非常驚訝。我們希望在各種科學(xué)分支中扮演重要角色,比如可再生能源(尤其是核聚變技術(shù))、量子化學(xué)、材料設(shè)計(jì)以及疾病療法。
DeepMind有這么多項(xiàng)目同時進(jìn)行,你每天都是怎么安排的?
我的工作安排比較奇怪,因?yàn)槲业墓ぷ骱蜕钇鋵?shí)是相互交織在一起的。我每天有兩個工作時段。白天,我處理公司管理方面的事務(wù),當(dāng)然也少不了開會。到了晚上,我又開始工作。我是個夜貓子,晚上特別清醒,大概22點(diǎn)左右又會坐下來干活,一直干到天亮前的幾小時。這段時間,我主要用來撰寫自己的研究論文,閱讀并考察各個領(lǐng)域的最新思想、方法,并深入研究。晚上工作很安靜,沒人打擾,因此,我很喜歡在這段時間工作,一周七天,每晚如此。
聽起來,你睡覺時間并不多啊。要知道,無論對人,還是對人工智能來說,睡眠都很重要。
沒錯,我也知道,睡得少確實(shí)不是一件好事。我不知道自己還能維持這種工作方式幾年,所以,我盡量保證每天睡至少6小時,但有時就是做不到。周末的時候,我會睡睡懶覺,補(bǔ)一點(diǎn)睡眠。當(dāng)然,規(guī)律作息肯定更好。
資料來源 New Scientist