編譯 劉迪一
繼解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)這一生物學(xué)領(lǐng)域大難題后,人工智能(AI)又揭示了蛋白質(zhì)相互作用連接形成復(fù)合物的過(guò)程,還構(gòu)想出新的蛋白質(zhì)結(jié)構(gòu)——它們有望被轉(zhuǎn)化為藥物,在我們的科學(xué)、健康和生活方面扮演關(guān)鍵角色。
不過(guò)面對(duì)龐雜的蛋白質(zhì)復(fù)合物結(jié)構(gòu),人工智能的預(yù)測(cè)工作進(jìn)展緩慢。直到2022年6月,一項(xiàng)刊載于《科學(xué)》的研究宣告對(duì)復(fù)合謎團(tuán)的成功破解。研究團(tuán)隊(duì)設(shè)計(jì)的新算法破譯了一個(gè)由大約1 000種蛋白質(zhì)組成的巨大復(fù)合體——此龐然大物把守著生物遺傳的核心要道,能幫助將DNA指令引導(dǎo)至細(xì)胞其他部分。新一代AI模型在人工智能公司DeepMind的AlphaFold和華盛頓大學(xué)教授戴維?貝克(David Baker)的實(shí)驗(yàn)室研發(fā)的RoseTTAfold基礎(chǔ)上構(gòu)建得到,而這兩項(xiàng)模型此前已開(kāi)源,供科研工作者免費(fèi)使用。
細(xì)胞核之于DNA就如同城堡之于堡主。城堡構(gòu)造周密,戒備森嚴(yán),只允許特定分子進(jìn)出城門,以傳遞堡內(nèi)主人合成的遺傳指令至外界。這里的“外界”可以是細(xì)胞內(nèi)的蛋白質(zhì)制造工廠,即核糖體,在接收到RNA指令后便將其翻譯為蛋白質(zhì)。
核孔是開(kāi)在核膜上的微小孔口。每個(gè)核孔都被一個(gè)八重對(duì)稱、呈籃狀結(jié)構(gòu)的核孔復(fù)合體包圍。核孔復(fù)合體主要由胞質(zhì)環(huán)、核質(zhì)環(huán)、核籃等結(jié)構(gòu)組成。核孔與核孔復(fù)合體的組合是細(xì)胞核、細(xì)胞質(zhì)間交流的重要通道
城門的核心守衛(wèi)是核孔復(fù)合體(NPC),鑲嵌于內(nèi)外核膜上,嚴(yán)格把控核孔的開(kāi)與關(guān),監(jiān)管分子信使往來(lái)。(你可以將分界細(xì)胞核、細(xì)胞質(zhì)的核膜比作城墻,開(kāi)在核膜上的核孔比作城門。)
生物學(xué)教材圖示中的NPC看著像球體表面的數(shù)千坑洼。實(shí)際上,每個(gè)核孔復(fù)合體都是一個(gè)極其復(fù)雜的環(huán)形建筑奇觀,也是人體內(nèi)最大蛋白質(zhì)復(fù)合物之一。
由于核孔復(fù)合體是DNA信息傳遞的管控者,因此解析NPC結(jié)構(gòu)之于基因治療、mRNA疫苗、CRISPR技術(shù)以及其他我們?nèi)噪y想象的潛在基因相關(guān)療法,可謂至關(guān)重要。
《科學(xué)》雜志高級(jí)編輯江滌博士表示:“核孔復(fù)合體是疾病相關(guān)突變和宿主-病原體相互作用的熱點(diǎn),新報(bào)道的NPC結(jié)構(gòu)預(yù)測(cè)工作標(biāo)志著實(shí)驗(yàn)結(jié)構(gòu)生物學(xué)的勝利。”
在此之前,細(xì)胞生物學(xué)家眼中的NPC是一個(gè)“歷史悠久卻又意義重大的謎團(tuán)”。
如前文所述,身為一堡之主的DNA必須得到周全保護(hù)。這些攜帶遺傳信息的核苷酸長(zhǎng)鏈纏繞于組蛋白軸上,形成核小體,并被核膜包裹在細(xì)胞核內(nèi),從而免受潛在有害化學(xué)物質(zhì)、病毒或其他廢物的侵害。
另一方面,堡主也需要發(fā)號(hào)施令,做好細(xì)胞遺傳控制的工作。細(xì)胞通過(guò)將來(lái)自核中央的DNA編碼翻譯成蛋白質(zhì),以構(gòu)建物理組織,或控制基本生物學(xué)功能——告訴細(xì)胞何時(shí)分裂或死亡、平衡新陳代謝以及抵御病原體入侵。
在轉(zhuǎn)錄和翻譯的過(guò)程中,大量蛋白質(zhì)信使需要通過(guò)核孔進(jìn)入核區(qū),將DNA指令轉(zhuǎn)錄成mRNA,之后又護(hù)送mRNA離開(kāi)城堡回到細(xì)胞質(zhì),并交付于核糖體,后者開(kāi)展翻譯工作。每次往來(lái)都必須經(jīng)過(guò)NPC守衛(wèi)。
長(zhǎng)期以來(lái),科學(xué)界一直試圖破譯核孔復(fù)合體的結(jié)構(gòu),施展生化魔法來(lái)修改其正常功能,或使用X射線掃描其晶體結(jié)構(gòu),但這些工作進(jìn)行得異常艱難。通過(guò)分析大量數(shù)據(jù),專家們發(fā)現(xiàn)了組成NPC的兩類主要蛋白質(zhì)。
第一類被稱為核孔蛋白(NUP),負(fù)責(zé)搭建門禁系統(tǒng)——嚴(yán)格來(lái)說(shuō),進(jìn)出核孔的本質(zhì)就是穿過(guò)這些蛋白質(zhì)門禁的“中心孔道”。第二種類型則類似服務(wù)人員,它們沿門禁系統(tǒng)分布并延伸至中心孔道,能夠抓住往來(lái)的分子以幫助其移動(dòng)。
核孔復(fù)合體由近1 000種蛋白質(zhì)組成,可形成大約30種不同的門禁系統(tǒng)——其結(jié)構(gòu)會(huì)動(dòng)態(tài)變化,形成近30類核孔蛋白結(jié)構(gòu),因此解析NPC的工作難度極大。例如,多種相互連接的蛋白質(zhì)能像鉸鏈裝置那樣運(yùn)動(dòng),從而改變孔道的構(gòu)型或大小。
新算法的設(shè)計(jì)團(tuán)隊(duì)由德國(guó)馬克斯?普朗克生物物理研究所(MPIB)的格哈德?哈姆爾(Gerhard Hummer)和馬丁?貝克(Martin Beck),以及歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)的揚(yáng)?科辛斯基(Jan Kosinski)領(lǐng)導(dǎo)。根據(jù)他們的解釋,由于整個(gè)結(jié)構(gòu)“緊密地包圍”核膜,因此不能孤立研究核孔復(fù)合體。到目前為止,科學(xué)家即便采用最先進(jìn)的生化手段,也只解析了46%的NPC結(jié)構(gòu)。
科辛斯基說(shuō)道:“這就像拆卸和重裝電子設(shè)備一樣??倳?huì)有一些螺絲剩下來(lái),你不知道該把它們安在哪里,不過(guò)多虧了人工智能,我們終于能讓大多數(shù)零件都各歸其位,現(xiàn)在我們確切知道NPC的身份信息、所作所為以及行事方法。”
哈姆爾等人首先對(duì)時(shí)下流行的一種NPC分析方法,即低溫電子斷層掃描術(shù)分析(cryo-ET)進(jìn)行了挖掘和改造。該方法于2015年聲名鵲起,因?yàn)樗鼘⒓?xì)胞結(jié)構(gòu)解析至近原子尺度。研究團(tuán)隊(duì)解釋稱,解決NPC結(jié)構(gòu)的難點(diǎn)之一在于過(guò)往數(shù)據(jù)集的分辨率很不理想。在這里,他們收集了比之前“大了差不多4倍的數(shù)據(jù)集”,并使用一種新計(jì)算方法來(lái)分析數(shù)據(jù)。
通過(guò)查看新繪制的地圖,他們能夠區(qū)分核膜(或者說(shuō)“DNA包裹”)處于緊縮還是相對(duì)放松的狀態(tài)。此外,研究團(tuán)隊(duì)利用AlphaFold和RoseTTAfold來(lái)預(yù)測(cè)了一套全面的NPC蛋白質(zhì)模型,結(jié)果喜人——這兩柄AI神器能以高可信度模擬大多數(shù)核蛋白,并匹配來(lái)自傳統(tǒng)微觀分析方法的數(shù)據(jù)。
當(dāng)然,項(xiàng)目進(jìn)展并非一帆風(fēng)順。NPC與蛋白質(zhì)運(yùn)輸方式密切相關(guān),而這些運(yùn)輸方式通常很難進(jìn)行三維建模。針對(duì)此難題,哈姆爾等人利用自己的模型,將蛋白接頭的“錨點(diǎn)”映射至NPC主孔道,之后進(jìn)一步的建模構(gòu)建了一幅關(guān)于接頭連接方式的“谷歌地圖”。
使用人工智能解決蛋白質(zhì)結(jié)構(gòu),被夸贊為近十年的科學(xué)大突破。而此項(xiàng)研究是首個(gè)證明算法能在凌亂而復(fù)雜的現(xiàn)實(shí)世界中發(fā)揮強(qiáng)大功能的成果。
貝克表示:“此項(xiàng)成果展示了未來(lái)結(jié)構(gòu)生物學(xué)將如何融合細(xì)胞生物學(xué),從而創(chuàng)建在細(xì)胞不同部分發(fā)揮不同功能的更大分子組裝的原子模型?!?/p>
變革已經(jīng)開(kāi)始。與哈姆爾等人的論文同期發(fā)表的,還有哈佛醫(yī)學(xué)院吳皓博士團(tuán)隊(duì)的新作。他們結(jié)合顯微鏡成像與AlphaFold,利用非洲爪蟾卵解析了部分NPC結(jié)構(gòu)。(非洲爪蟾算是生化研究的寵兒了。)
不過(guò)人工智能還算不上學(xué)科救世主。正如麻省理工學(xué)院生物學(xué)教授托馬斯?施瓦茨(Thomas Schwartz,未參與研究)所指出的,核孔復(fù)合體是可以改變自身構(gòu)型的活系統(tǒng)。例如,當(dāng)它們開(kāi)心依偎于核膜內(nèi)時(shí),中心孔道往往更寬敞;而在被拉到顯微鏡下觀察后,通道就沒(méi)那么敞亮了。換言之,蛋白質(zhì)復(fù)合物很難被破譯和控制。當(dāng)然了,AI始終站在我們這邊。
施瓦茨說(shuō)道:“我們現(xiàn)在可以考慮建立一個(gè)完整的NPC動(dòng)態(tài)模型,并以原子級(jí)別的分辨率模擬核轉(zhuǎn)運(yùn)過(guò)程?!被贏I的蛋白質(zhì)預(yù)測(cè)的未來(lái),令人無(wú)比期待!
資料來(lái)源 singularityhub.com