2024年諾貝爾科學(xué)獎項頒給了微小RNA的發(fā)現(xiàn)者、人工智能模型的先驅(qū)以及那些將人工智能用于蛋白質(zhì)結(jié)構(gòu)預(yù)測的人。顯然,人工智能在2024年諾貝爾獎中大獲全勝。
諾貝爾科學(xué)獎一直在用自己的方式表彰人類智慧。2024年,人工智能(AI)的變革潛力首次得到諾貝爾獎的認(rèn)可。10月8日,瑞典皇家科學(xué)院將物理學(xué)獎授予普林斯頓大學(xué)的約翰 · 霍普菲爾德(John Hopfield)和多倫多大學(xué)的杰弗里 · 辛頓(Geoffrey Hinton),以表彰倆人在計算機(jī)科學(xué)領(lǐng)域取得的突破。他們的成果對當(dāng)今許多最強(qiáng)大AI模型的開發(fā)至關(guān)重要。
10月9日,一款神奇AI模型的開發(fā)者也接到斯德哥爾摩的來電。他們就是谷歌人工智能公司DeepMind的核心人物,德米斯 · 哈薩比斯(Demis Hassabis)和約翰 · 江珀(John Jumper),因創(chuàng)造能精準(zhǔn)預(yù)測蛋白質(zhì)三維結(jié)構(gòu)的AlphaFold而獲得化學(xué)獎。
長期以來,蛋白質(zhì)結(jié)構(gòu)預(yù)測是生物化學(xué)領(lǐng)域的重大挑戰(zhàn)。當(dāng)然,這兩位只分得一半榮譽(yù),另一半授予華盛頓大學(xué)的生物化學(xué)家大衛(wèi) · 貝克(David Baker),以表彰他利用計算機(jī)輔助設(shè)計新蛋白質(zhì)的工作。
人工智能并不是這次結(jié)果揭曉的唯一共同點(diǎn)。在一些嚴(yán)謹(jǐn)?shù)娜耸靠磥恚?024年諾獎委員會對物理獎和化學(xué)獎的頒發(fā)是“越界”的,因為人工智能研究屬于計算機(jī)科學(xué),而蛋白質(zhì)研究則應(yīng)歸屬于生物學(xué)。
破界
這種靈活“跨界”并非史無前例。例如,1973年,3位常與蜜蜂、鵝和棘魚打交道的動物行為學(xué)先鋒被“強(qiáng)行”授予諾貝爾生理學(xué)或醫(yī)學(xué)獎。不過辛頓和霍普菲爾德所做出的諾獎成就有更深遠(yuǎn)的影響。
2024年諾貝爾科學(xué)獎獲得者:杰弗里·辛頓(左一)、約翰·霍普菲爾德(左二)、德米斯·哈薩比斯(左三)、大衛(wèi)·貝克(左四)、約翰·江珀(右三)、加里·魯夫昆(右二)、維克多·安布羅斯(右一)
兩位大師都在1980年代初完成了他們的關(guān)鍵工作,但當(dāng)時計算機(jī)硬件無法充分利用它?;羝辗茽柕略O(shè)計了一種后來被稱為霍普菲爾德神經(jīng)網(wǎng)絡(luò)的人工神經(jīng)網(wǎng)絡(luò),其構(gòu)建模式類似物理學(xué)中的自旋玻璃模型——這讓瑞典皇家科學(xué)院有理由稱這屬于“物理學(xué)”。辛頓的貢獻(xiàn)是使用所謂的反向傳播算法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
人工神經(jīng)網(wǎng)絡(luò)是計算機(jī)程序,大致基于人們認(rèn)為的真實生物神經(jīng)細(xì)胞或神經(jīng)元網(wǎng)絡(luò)的工作方式。具體而言,此類網(wǎng)絡(luò)中“節(jié)點(diǎn)”(相當(dāng)于神經(jīng)元)之間連接的強(qiáng)度(稱為權(quán)重)具有可塑性。這種可塑性賦予網(wǎng)絡(luò)根據(jù)過往表現(xiàn)以不同方式處理信息的能力,換言之,就是學(xué)習(xí)能力。霍普菲爾德網(wǎng)絡(luò)中每個節(jié)點(diǎn)都連接到除自身之外的所有節(jié)點(diǎn),這種網(wǎng)絡(luò)特別擅長“從稀疏或嘈雜的數(shù)據(jù)中提取模式”。
辛頓通過他設(shè)計的算法,讓神經(jīng)網(wǎng)絡(luò)在三維空間中工作,增強(qiáng)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力?;羝辗茽柕戮W(wǎng)絡(luò)及其同類網(wǎng)絡(luò)本質(zhì)上是二維的。盡管它們實際上僅作為軟件中的模擬而存在,但它們可以被視為節(jié)點(diǎn)的物理層。但是,將這些層堆疊在一起,信號在層之間來回移動(即反向傳播和前向傳播)時通過調(diào)整權(quán)重來訓(xùn)練它們,您將擁有一個更加復(fù)雜的學(xué)習(xí)系統(tǒng)。
此外,辛頓博士還利用物理學(xué)的一個分支,即統(tǒng)計力學(xué),對霍普菲爾德的網(wǎng)絡(luò)做出改進(jìn),創(chuàng)建了玻爾茲曼機(jī)。玻爾茲曼機(jī)可用于創(chuàng)建以無人監(jiān)督的方式學(xué)習(xí)的系統(tǒng),無須明確教授即可發(fā)現(xiàn)數(shù)據(jù)中的模式。[統(tǒng)計力學(xué)是熱力學(xué)第二定律的基礎(chǔ),由與阿爾弗雷德 · 諾貝爾(Alfred Nobel)同時代的路德維希 · 玻爾茲曼(Ludwig Boltzmann)創(chuàng)立。]
因此,這兩位研究人員的工作讓機(jī)器學(xué)習(xí)真正發(fā)揮了作用。人工智能模型現(xiàn)在不僅能學(xué)習(xí),還可以創(chuàng)造(或者,用懷疑論者的話說,以最復(fù)雜方式重組和照搬)。這些工具已經(jīng)從執(zhí)行高度特化的任務(wù),例如識別組織樣本中的癌細(xì)胞或精簡大量粒子物理數(shù)據(jù),轉(zhuǎn)變至能應(yīng)付從為本科生寫論文到運(yùn)行機(jī)器人的各種事務(wù)。
接受媒體采訪時,辛頓博士似乎流露出對自己的成果既擔(dān)心又自豪的態(tài)度。他和領(lǐng)域內(nèi)許多人一樣,擔(dān)心超越人類的機(jī)器智能會怎樣對待創(chuàng)造它自己的人。另一方面,他也沉思:通過協(xié)助腦力勞動,AI能否帶來如工業(yè)革命之于體力勞動那樣巨大的影響?
這樣的沉思來得正是時候。不到24小時后頒發(fā)的諾貝爾化學(xué)獎似乎是對上述問題的回復(fù)。瑞典皇家科學(xué)院表彰了利用AI模型預(yù)測蛋白質(zhì)結(jié)構(gòu)的3位先鋒。
折疊
蛋白質(zhì)是生命的主要化學(xué)組成部分。它們的基本組成單位是氨基酸,這些小分子排列成長鏈,以相當(dāng)復(fù)雜和特定的方式折疊。最終的折疊形態(tài),也就是蛋白質(zhì)三維結(jié)構(gòu),決定其生物功能。換言之,我們要了解蛋白質(zhì)——進(jìn)而理解生物學(xué)——就必須了解蛋白質(zhì)結(jié)構(gòu)。
貝克博士通過實踐獲得了這種理解。他在2003年的一篇具有里程碑意義的論文中介紹了自己設(shè)計的全新蛋白質(zhì)。據(jù)稱,借助計算機(jī)程序Rosetta,他發(fā)現(xiàn)了一種能以此前從未見于自然界的方式折疊的氨基酸序列。貝克在實驗室重新創(chuàng)建該序列并制得蛋白質(zhì),接著用X射線晶體學(xué)技術(shù)確定其最終結(jié)構(gòu)——與他設(shè)想的折疊形態(tài)非常接近。Rosetta(現(xiàn)在叫作Rosetta Common)很快成為全球蛋白質(zhì)化學(xué)家使用的軟件包。蛋白質(zhì)計算設(shè)計已在各個方面發(fā)揮作用,例如疫苗開發(fā)和有毒化學(xué)物質(zhì)檢測。
另一方面,若要根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測其三維結(jié)構(gòu),那就是更艱巨的任務(wù)了。鑒于蛋白質(zhì)可以折疊出近乎無限種形態(tài)——據(jù)估計,一個復(fù)雜蛋白質(zhì)有10300種可能的空間結(jié)構(gòu)——因此即使用計算機(jī)也只能獲得有限結(jié)果。DeepMind的AlphaFold 1和2(均為人工神經(jīng)網(wǎng)絡(luò))分別于2018年和2020年發(fā)布,是第一種接近無限可能的神經(jīng)網(wǎng)絡(luò)。AlphaFold 2目前擁有一個包含超過2億種蛋白質(zhì)結(jié)構(gòu)預(yù)測的數(shù)據(jù)庫,預(yù)測準(zhǔn)確率高達(dá)約90%。
在此次諾貝爾獎結(jié)果揭曉前,2024年德米斯和江珀出現(xiàn)于各大科技獎項的候選人名單中,當(dāng)然,許多人質(zhì)疑,現(xiàn)在就向AlphaFold致敬是否為時過早??蔁o論如何,AlphaFold正改變科學(xué)。
DeepMind表示,大約200萬科學(xué)家已經(jīng)在研究中使用此工具。2024年5月發(fā)布的AlphaFold 3不再局限于蛋白質(zhì)研究,還能預(yù)測大量其他生物分子的結(jié)構(gòu),諸如DNA,以及可能作為藥物發(fā)揮作用的小分子;它也可以預(yù)測不同結(jié)構(gòu)的不同分子怎樣組合到一起,例如病毒的刺突蛋白如何與宿主體內(nèi)的抗體和糖相互作用。
“見微知著”
2024年的諾貝爾生理學(xué)或醫(yī)學(xué)獎與AI毫無關(guān)聯(lián),也沒有受到所謂跨學(xué)科的爭議。評審團(tuán)隊繼續(xù)關(guān)注分子和細(xì)胞層面的“最微小”成果(而非生理學(xué)或器官方面的研究)的趨勢,因為最令人興奮的科學(xué)前沿正是在這些微觀尺度上。
馬薩諸塞大學(xué)醫(yī)學(xué)院的維克多 · 安布羅斯(Victor Ambros)和麻省總醫(yī)院的加里 · 魯夫昆(Gary Ruvkun)因發(fā)現(xiàn)微小RNA(miRNA)及其在“轉(zhuǎn)錄后基因調(diào)控”中的作用而共同獲獎。微小RNA是一類僅由20~24個核苷酸組成的小分子非編碼RNA,在細(xì)胞的運(yùn)作中發(fā)揮關(guān)鍵作用。
每個人體細(xì)胞的細(xì)胞核內(nèi)都有一套完整指令用于創(chuàng)建人體,那就是基因組。生物學(xué)的一個重要問題是,同一套基因和指令怎樣導(dǎo)致身體產(chǎn)生從肌肉細(xì)胞到肝細(xì)胞各種不同類型的細(xì)胞。答案是,并非細(xì)胞核內(nèi)所有基因都會轉(zhuǎn)化為蛋白質(zhì)。不同類型的細(xì)胞遵循自己的發(fā)育途徑,只選用與自己生長發(fā)育相關(guān)的遺傳指令。而能在一定程度上控制它們的選擇的,正是由安布羅斯和魯夫昆發(fā)現(xiàn)的微小RNA分子。
微小RNA主要通過與細(xì)胞內(nèi)另一種分子的靶標(biāo)部分結(jié)合來發(fā)揮作用,它就是信使RNA(mRNA)——負(fù)責(zé)將信息從基因組的DNA傳遞到細(xì)胞內(nèi)的蛋白質(zhì)制造工廠 。通過干擾mRNA,miRNA可以改變或阻止蛋白質(zhì)的產(chǎn)生。值得一提的是,2023年諾貝爾生理學(xué)或醫(yī)學(xué)獎授予了mRNA疫苗領(lǐng)域的兩位先驅(qū)。
微小RNA首次發(fā)現(xiàn)于1993年,現(xiàn)已知人類基因組中有超過1000種這樣的小分子。它們的生物學(xué)影響不可謂不深遠(yuǎn):微小RNA分子的調(diào)節(jié)異??赡軐?dǎo)致癌癥和癲癇;編碼miRNA分子的基因突變會引發(fā)先天性聽力喪失等疾病,并被認(rèn)為與許多眼部疾病的病理有關(guān),例如白內(nèi)障、青光眼和黃斑變性;此外,miRNA分子似乎也是許多骨骼疾病的一大成因,如骨質(zhì)疏松癥、骨肉瘤和骨轉(zhuǎn)移等。
1980年代末,安布羅斯和魯夫昆在麻省理工學(xué)院的同一實驗室工作,并利用生物學(xué)研究中的關(guān)鍵工具秀麗隱桿線蟲(Caenorhabditis elegans)發(fā)現(xiàn)了miRNA分子。他們當(dāng)時正研究秀麗隱桿線蟲的兩種突變株,這些株系的基因存在缺陷,而線蟲的發(fā)育和工作方式又由基因決定。二人觀察到,一種名為lin-4的基因會產(chǎn)生一種異常短小的RNA分子,該分子不編碼任何蛋白質(zhì),而且似乎能抑制另一個基因的活性。
瑞典卡羅林斯卡醫(yī)學(xué)院的諾貝爾委員會在揭曉獲獎名單時指出,當(dāng)科學(xué)家發(fā)表他們的研究成果時,他們遭遇了“來自科學(xué)界的幾乎震耳欲聾的沉默”。人們起初認(rèn)為秀麗隱桿線蟲體內(nèi)這種不尋常的基因調(diào)控機(jī)制是該生物所特有的一種特性,與人類或其他更復(fù)雜的生物無關(guān)。但這種觀點(diǎn)后來發(fā)生了轉(zhuǎn)變,因為大家發(fā)現(xiàn),編碼miRNA的基因遍布整個動物界。
丹麥制藥巨頭諾和諾德是嘗試?yán)胢iRNA制造藥物的公司之一。2024年,他們收購了德國生物制藥企業(yè)Cardior,后者研發(fā)的miR-132反義抑制劑CDR132L能阻斷特定miRNA,有望幫助患慢性心力衰竭和心臟肥大(心壁增厚和變硬)的病人。
追諾路萬條
對于世界各地越來越多依靠人工智能進(jìn)行研究的科學(xué)家來說,2024年諾貝爾獎傳遞了有趣的信號——或許他們有一天也能獲得科學(xué)界最高獎項。江珀表示:“我希望我們未來將會迎來許多乘勢AI的不可思議的科學(xué)突破。”
資料來源 The Economist