• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      正向和反向蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)破解生命密碼

      2025-01-28 00:00:00郭曉強(qiáng)郭貝一
      科學(xué) 2025年1期
      關(guān)鍵詞:貝克氨基酸蛋白質(zhì)

      蛋白質(zhì)是生物體的基本組成部分,也是最重要的生物功能大分子,擁有多樣的生物學(xué)功能,幾乎每一步生命過(guò)程都有它們的身影,從物質(zhì)代謝到能量生成,從生長(zhǎng)發(fā)育到細(xì)胞通信等。結(jié)構(gòu)是功能的基礎(chǔ),蛋白質(zhì)結(jié)構(gòu)的奧秘是生命科學(xué)領(lǐng)域最迫切需要解決的核心問(wèn)題之一,至今已有十余項(xiàng)蛋白質(zhì)相關(guān)成果榮獲諾貝爾化學(xué)獎(jiǎng)[1],其重要性不言而喻。

      蛋白質(zhì)結(jié)構(gòu)

      蛋白質(zhì)是一種由基本單位——氨基酸構(gòu)成的生物大分子。為研究方便蛋白質(zhì)結(jié)構(gòu)被賦予層次化屬性:有一級(jí)、二級(jí)、三級(jí)、四級(jí)結(jié)構(gòu)之分。

      蛋白質(zhì)結(jié)構(gòu)層次化

      氨基酸

      氨基酸是蛋白質(zhì)的基本組成單位。顧名思義,氨基酸就是既有氨基又有羧基的有機(jī)物。構(gòu)成蛋白質(zhì)的天然氨基酸共20種(差別在于側(cè)鏈的R基團(tuán)不同),除甘氨酸外,其他都為L(zhǎng)-α-氨基酸。一個(gè)氨基酸的氨基可與另一個(gè)氨基酸的羧基發(fā)生脫水縮合反應(yīng)生成二肽,形成的化學(xué)鍵稱肽鍵。多個(gè)氨基酸發(fā)生類似反應(yīng)生成多肽,分子量較大的多肽通常稱為蛋白質(zhì),二者間并無(wú)嚴(yán)格界限。

      蛋白質(zhì)一級(jí)結(jié)構(gòu)

      一級(jí)結(jié)構(gòu)又稱初級(jí)結(jié)構(gòu),指蛋白質(zhì)鏈狀分子中氨基酸的線性排列順序,它是不同蛋白質(zhì)差異的基礎(chǔ)。1955年,英國(guó)生物化學(xué)家桑格(F.Sanger)完成了胰島素兩條多肽鏈一級(jí)結(jié)構(gòu)的測(cè)序及二硫鍵位置的確定,榮獲1958年諾貝爾化學(xué)獎(jiǎng)。

      蛋白質(zhì)二級(jí)結(jié)構(gòu)

      二級(jí)結(jié)構(gòu)指蛋白質(zhì)部分主鏈形成的局部結(jié)構(gòu)。1951年,美國(guó)理論化學(xué)家鮑林(L.Pauling,1954年諾貝爾化學(xué)獎(jiǎng)獲得者)和生物化學(xué)家科里(R.B.Corey)提出了二級(jí)結(jié)構(gòu)的兩種主要形式:α-螺旋和β-折疊。

      蛋白質(zhì)三級(jí)結(jié)構(gòu)

      三級(jí)結(jié)構(gòu)指一條多肽鏈構(gòu)成的完整三維結(jié)構(gòu),即包括主鏈形成的框架結(jié)構(gòu),并涵蓋側(cè)鏈之間的相對(duì)位置。1957年,英國(guó)生物化學(xué)家肯德魯(J.C.Kendrew)首次確定肌紅蛋白三級(jí)結(jié)構(gòu),分享了1962年諾貝爾化學(xué)獎(jiǎng)。

      蛋白質(zhì)四級(jí)結(jié)構(gòu)

      四級(jí)結(jié)構(gòu)指兩條或兩條以上獨(dú)立多肽鏈構(gòu)成的完整空間結(jié)構(gòu)。1959年,英國(guó)生物化學(xué)家佩魯茨(M.F.Perutz)首次確定血紅蛋白四級(jí)結(jié)構(gòu),分享1962年諾貝爾化學(xué)獎(jiǎng)。

      蛋白質(zhì)空間結(jié)構(gòu)的實(shí)驗(yàn)研究

      為解析蛋白質(zhì)空間結(jié)構(gòu)(三級(jí)和四級(jí)結(jié)構(gòu)),而先后開(kāi)發(fā)出的X-射線晶體衍射、磁共振波譜、冷凍電鏡等眾多技術(shù),由于其高昂的費(fèi)用、漫長(zhǎng)的時(shí)間和高技術(shù)門檻等限制,使得蛋白質(zhì)空間結(jié)構(gòu)研究主要由少數(shù)實(shí)驗(yàn)室完成,至今實(shí)驗(yàn)解析的蛋白質(zhì)空間結(jié)構(gòu)只有幾十萬(wàn)種。

      相較而言,一級(jí)結(jié)構(gòu)測(cè)定較為容易,特別是多個(gè)物種基因組計(jì)劃的完成和運(yùn)用中心法則從DNA堿基序列推導(dǎo)蛋白質(zhì)中氨基酸的序列,至今已破譯上億種蛋白質(zhì)的一級(jí)結(jié)構(gòu),二者之間的巨大差異使研究人員決定另辟蹊徑。

      一級(jí)結(jié)構(gòu)決定高級(jí)結(jié)構(gòu)

      1961年,美國(guó)生物化學(xué)家安芬森(C.B.Anfinsen)借助核糖核酸酶變性-復(fù)性實(shí)驗(yàn)得出結(jié)論:蛋白質(zhì)初級(jí)結(jié)構(gòu)決定高級(jí)結(jié)構(gòu)(安芬森定則),他因此分享了1972年諾貝爾化學(xué)獎(jiǎng)。安芬森定則清晰地說(shuō)明了蛋白質(zhì)空間結(jié)構(gòu)并非隨機(jī)形成,而是根植于蛋白質(zhì)一級(jí)結(jié)構(gòu),這一規(guī)律成為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的理論基礎(chǔ)。

      蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)

      1970年代開(kāi)始,研究人員開(kāi)始嘗試進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)研究,但一直進(jìn)展緩慢,直到21世紀(jì)初,隨著計(jì)算機(jī)的應(yīng)用和人工智能技術(shù)的發(fā)展,該領(lǐng)域取得了一系列重大突破,尤以2024年3位諾貝爾獎(jiǎng)獲得者的貢獻(xiàn)最為突出。蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)有兩種策略:一是正向預(yù)測(cè),即從一級(jí)結(jié)構(gòu)推測(cè)空間結(jié)構(gòu);一是反向預(yù)測(cè),即從三維結(jié)構(gòu)反推氨基酸序列,又稱蛋白質(zhì)計(jì)算設(shè)計(jì)。

      正向蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)

      蛋白質(zhì)理論預(yù)測(cè)發(fā)展已有較全面描述[1],這里簡(jiǎn)要介紹。

      蛋白質(zhì)數(shù)據(jù)庫(kù)(proteindatabank,PDB)

      1971年建立PDB,目的在于隨時(shí)收集采用實(shí)驗(yàn)方法解析的各種蛋白質(zhì)空間結(jié)構(gòu)信息,以供全球研究人員方便使用,它是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的重要基礎(chǔ)。最初只有7種蛋白質(zhì)結(jié)構(gòu)信息,2014年已突破10萬(wàn)種,且還在快速增加,已成為結(jié)構(gòu)預(yù)測(cè)取得一系列重大突破的原動(dòng)力。

      結(jié)構(gòu)預(yù)測(cè)基本策略

      策略主要有同源建模和從頭計(jì)算。同源建?;诓煌鞍踪|(zhì)間一級(jí)結(jié)構(gòu)保守性,從結(jié)構(gòu)已被解析的蛋白質(zhì)推測(cè)新蛋白質(zhì)結(jié)構(gòu)。從頭計(jì)算是依據(jù)最終形成的蛋白質(zhì)三維結(jié)構(gòu)能量最低原理,利用能量函數(shù)計(jì)算不同結(jié)構(gòu)的能量值獲得最終結(jié)構(gòu)。兩種方法相輔相成,在結(jié)構(gòu)預(yù)測(cè)發(fā)展過(guò)程中取得了一定成功,但整體效果并不理想。

      蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估(CASP)

      1994年,為推動(dòng)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)而發(fā)起的每?jī)赡昱e辦一次的全球競(jìng)賽,為研究人員創(chuàng)建了聚集一堂分享該領(lǐng)域新進(jìn)展的機(jī)會(huì)。主辦方將未解結(jié)構(gòu)的蛋白質(zhì)氨基酸序列交給參賽者進(jìn)行預(yù)測(cè),同時(shí)與實(shí)驗(yàn)專家合作進(jìn)行測(cè)定,最終將預(yù)測(cè)結(jié)構(gòu)與實(shí)驗(yàn)測(cè)定的結(jié)構(gòu)進(jìn)行對(duì)比,判定預(yù)測(cè)準(zhǔn)確度。評(píng)判標(biāo)準(zhǔn)為全局距離測(cè)試(globaldistancetest,GDT)評(píng)分,GDT采用百分制,分?jǐn)?shù)越高則意味著理論預(yù)測(cè)精確度越高。該項(xiàng)賽事為研究人員提供了一個(gè)廣泛交流的平臺(tái),促使大家群策群力,共同推進(jìn)結(jié)構(gòu)預(yù)測(cè)的進(jìn)步。

      自CASP舉辦以來(lái),蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面確實(shí)取得一系列進(jìn)展,但距離預(yù)期仍差距巨大,如2016年第12屆CASP(CASP12)中,對(duì)無(wú)模板蛋白質(zhì)預(yù)測(cè)的GDT得分只有40分。但2018年CASP迎來(lái)了革命性突破,GDT一躍達(dá)到60多分,其原因是基于人工智能技術(shù)AlphaFold(簡(jiǎn)稱AF)的橫空出世。

      第一代AF的成功

      哈薩比斯(D.Hassabis)是計(jì)算機(jī)和認(rèn)知神經(jīng)領(lǐng)域的專家,于2010年主導(dǎo)成立DeepMind公司,最初是想開(kāi)發(fā)棋類游戲的人工智能模型,公司于2014年被谷歌收購(gòu),但基本架構(gòu)不變。兩年后,DeepMind引起全球轟動(dòng),源于開(kāi)發(fā)的人工智能工具AlphaGo擊敗了圍棋世界冠軍。哈薩比斯決定挑戰(zhàn)更大的難題,那就是用人工智能方法解決蛋白質(zhì)的折疊問(wèn)題,因此成立AF項(xiàng)目組。2018年,哈薩比斯領(lǐng)導(dǎo)的團(tuán)隊(duì)基于卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)策略構(gòu)建第一代AF(AF1),使預(yù)測(cè)準(zhǔn)確度大幅提升。AF1利用PDB已有的結(jié)構(gòu)進(jìn)行訓(xùn)練,生成基于多重序列比對(duì)所得氨基酸間空間距離圖(確切地說(shuō),是距離概率分布圖),它們提供的信息足夠充足,從而可以在此基礎(chǔ)上構(gòu)建出蛋白質(zhì)三維結(jié)構(gòu)。相較于先前的方法,AF1確實(shí)是一個(gè)巨大進(jìn)步,但所得結(jié)果與實(shí)驗(yàn)測(cè)定的蛋白質(zhì)結(jié)構(gòu)在精度方面仍有較大差距。哈薩比斯團(tuán)隊(duì)繼續(xù)完善AF1,期待進(jìn)一步突破,但殘酷的現(xiàn)實(shí)是該方法遇到了瓶頸。無(wú)論如何改進(jìn)都無(wú)法更近一步,江珀(J.M.Jumper)的加入破解了這一難題。

      第二代AF重大突破

      江珀是一位理論化學(xué)博士,專長(zhǎng)于蛋白質(zhì)動(dòng)力學(xué)的深度學(xué)習(xí)策略研究,2017年10月加入DeepMind公司并于2018年7月成為AF項(xiàng)目主管,開(kāi)啟新征程。江珀對(duì)AF1進(jìn)行了大刀闊斧的改進(jìn),擯棄卷積神經(jīng)網(wǎng)絡(luò)而啟用轉(zhuǎn)換器(transformer)架構(gòu),同時(shí)引入深度學(xué)習(xí)中廣泛使用的注意力機(jī)制(attentionmechanism)。第二代AF(AF2)包括兩個(gè)主要模塊,分別是進(jìn)化轉(zhuǎn)換器(evoformer)和結(jié)構(gòu)(structure)。進(jìn)化轉(zhuǎn)換器同時(shí)處理多序列比對(duì)表示(不同物種比對(duì)序列構(gòu)成的二維矩陣)和氨基酸對(duì)表示(20種氨基酸對(duì)構(gòu)成的二維矩陣)產(chǎn)生的信息,重要的是深度學(xué)習(xí)過(guò)程中兩個(gè)數(shù)集之間相互交換信息并及時(shí)更新,從而實(shí)現(xiàn)共同進(jìn)化。然后,結(jié)構(gòu)模塊直接應(yīng)用氨基酸對(duì)表示和目標(biāo)氨基酸序列構(gòu)建三維骨架結(jié)構(gòu),每種氨基酸的核心原子(N-Cα-C)定義為一種三角形。隨后通過(guò)空間旋轉(zhuǎn)和位置移動(dòng)產(chǎn)生主鏈結(jié)構(gòu),再進(jìn)一步確定側(cè)鏈構(gòu)象,從而初步得到預(yù)測(cè)的三維結(jié)構(gòu),此結(jié)構(gòu)多次回傳到進(jìn)化轉(zhuǎn)換器進(jìn)行改進(jìn),最終直接輸出三維結(jié)構(gòu)[2]。

      在2020年的CASP14中,AF2展現(xiàn)出更大成功,不僅大幅領(lǐng)先其他預(yù)測(cè)方法,復(fù)雜蛋白GDT得分達(dá)到90(這一數(shù)值預(yù)示與實(shí)驗(yàn)所測(cè)結(jié)構(gòu)相當(dāng)),且在分辨率方面(約1?)也媲美實(shí)驗(yàn)所得結(jié)構(gòu)。AF2的成功表明,哈薩比斯和江珀已將人工智能神經(jīng)網(wǎng)絡(luò)工具在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面應(yīng)用得出神入化,可視為對(duì)蛋白質(zhì)結(jié)構(gòu)重大科學(xué)問(wèn)題(困擾蛋白質(zhì)結(jié)構(gòu)學(xué)家達(dá)60年之久)的首次突破。AF2源代碼的公開(kāi)進(jìn)一步增加了其影響力,促使它在全球被廣泛測(cè)試和驗(yàn)證,從而在基礎(chǔ)科學(xué)問(wèn)題解決和藥物研發(fā)等領(lǐng)域發(fā)揮了推動(dòng)作用。2024年,DeepMind公司進(jìn)一步推出第三代AF,在原有精準(zhǔn)度基礎(chǔ)上增加了使用范圍,如預(yù)測(cè)蛋白質(zhì)復(fù)合物、蛋白質(zhì)-核酸/小分子配體等三維結(jié)構(gòu)。

      反向蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)

      蛋白質(zhì)在自然界數(shù)量眾多,其神奇的功能引起科學(xué)界的極大興趣,其巨大的應(yīng)用潛力更是成為關(guān)注的焦點(diǎn)。但天然蛋白存在諸多缺陷,如催化反應(yīng)有限、穩(wěn)定性差和半衰期短等,因此新型蛋白質(zhì)就成為科學(xué)家研究的重要方向。目前新型蛋白質(zhì)制備主要有兩種策略:一是定向進(jìn)化(天然蛋白質(zhì)的修改),這一方法的實(shí)現(xiàn)使美國(guó)科學(xué)家阿諾德(F.H.Arnold)分享了2018年諾貝爾化學(xué)獎(jiǎng);另一種是理性設(shè)計(jì)。

      哈薩比斯、江珀與蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)

      蛋白質(zhì)理性設(shè)計(jì)又有兩種方式,一種是組合策略,另一種是從頭設(shè)計(jì)。組合策略就是把兩種或多種蛋白質(zhì)的局部結(jié)構(gòu)進(jìn)行合理的組合,從而產(chǎn)生嵌合體,這種策略在實(shí)際中已廣泛應(yīng)用,像基因編輯工具ZFN和TELAN技術(shù),免疫學(xué)的人源化抗體和CART技術(shù)等,這種方法可看作對(duì)自然界已有蛋白質(zhì)的“簡(jiǎn)單”拼接。從頭設(shè)計(jì)則是設(shè)計(jì)并制備出自然界中不存在的具有全新氨基酸序列的蛋白質(zhì)。

      分子設(shè)計(jì)一直是化學(xué)家研究的重要內(nèi)容,如2016年諾貝爾化學(xué)獎(jiǎng)授予紹瓦熱(J.Sauvage)、斯托達(dá)特(J.F.Stoddart)和費(fèi)林加(B.L.Feringa)三位科學(xué)家就是表彰他們?cè)凇胺肿訖C(jī)器的設(shè)計(jì)與合成”方面的貢獻(xiàn)。這些都是小分子設(shè)計(jì),與此相比,作為大分子的蛋白質(zhì)其設(shè)計(jì)難度就相當(dāng)巨大,因此長(zhǎng)期不被看好。

      蛋白質(zhì)從頭設(shè)計(jì)的初期探索

      蛋白質(zhì)從頭設(shè)計(jì)研究開(kāi)始于1970年代,長(zhǎng)期以來(lái)進(jìn)展緩慢,一是蛋白質(zhì)設(shè)計(jì)本身就是一種巨大挑戰(zhàn),二是當(dāng)時(shí)蛋白質(zhì)結(jié)構(gòu)解析剛起步,被闡明的蛋白質(zhì)結(jié)構(gòu)極為有限,從而大大限制了結(jié)構(gòu)信息的借鑒。所以研究之初,從頭設(shè)計(jì)被認(rèn)為是不可能完成的任務(wù),直到1980年代才有所改觀,先后經(jīng)歷了手動(dòng)設(shè)計(jì)、計(jì)算設(shè)計(jì)和模型設(shè)計(jì)三個(gè)階段。

      手動(dòng)設(shè)計(jì)

      利用簡(jiǎn)單生物物理原理并結(jié)合經(jīng)驗(yàn)進(jìn)行設(shè)計(jì)。20種氨基酸可歸類為疏水性(h)和極性(p)兩類,其不同類別的組合與蛋白質(zhì)二級(jí)結(jié)構(gòu)存在一定對(duì)應(yīng)關(guān)系(基于經(jīng)驗(yàn))。如“hpphppp”匹配α-螺旋,“hphp”匹配β-折疊等。1979年,格特(B.Gutte)基于此設(shè)計(jì)出一個(gè)35個(gè)氨基酸的RNA結(jié)合蛋白。1988年,里根(L.Regan)和德格拉多(W.F.DeGrado)構(gòu)建了一個(gè)4螺旋蛋白[3],其在水溶液中具有協(xié)同折疊的球狀結(jié)構(gòu),且非常穩(wěn)定,成為蛋白質(zhì)設(shè)計(jì)史上的第一個(gè)里程碑。

      計(jì)算設(shè)計(jì)

      通過(guò)數(shù)學(xué)方程定義主鏈構(gòu)象,并結(jié)合側(cè)鏈重排算法設(shè)計(jì)完整序列。1997年,達(dá)希亞特(B.I.Dahiyat)和梅奧(S.L.Mayo)利用這一策略設(shè)計(jì)出人工鋅指結(jié)構(gòu),與天然鋅指結(jié)構(gòu)的28個(gè)氨基酸相比,僅有6個(gè)氨基酸相同(表明為全新結(jié)構(gòu)),磁共振波譜證明最終結(jié)構(gòu)與設(shè)定非常符合,這標(biāo)志著蛋白質(zhì)從頭設(shè)計(jì)史上又一個(gè)重要里程碑。但是,該法主要局限于短序列。

      模型設(shè)計(jì)

      又稱基于碎片和生物信息學(xué)的計(jì)算設(shè)計(jì),主要源于PDB中越來(lái)越多的蛋白質(zhì)結(jié)構(gòu)信息。PDB中特定蛋白質(zhì)的完整結(jié)構(gòu)信息被分解成不同形狀的結(jié)構(gòu)碎片,每個(gè)碎片都賦予序列偏好和相互作用模式,這些碎片可根據(jù)人類需求重新組裝出新型結(jié)構(gòu)的蛋白質(zhì)。這一階段始于21世紀(jì)初,多位科學(xué)家做出了卓越貢獻(xiàn),其中以貝克(D.Baker)的工作最為顯著。

      模型設(shè)計(jì)的首度突破

      1962年,貝克出生于美國(guó)西雅圖的一個(gè)學(xué)術(shù)家庭,父親馬歇爾(MarshallBaker)是物理學(xué)家,母親馬西婭(MarciaBaker)是地球物理學(xué)家,可謂名副其實(shí)“學(xué)二代”。在哈佛大學(xué)期間,貝克最初的專業(yè)是哲學(xué)和社會(huì)科學(xué),然而在修完發(fā)育生物學(xué)課程并閱讀《雙螺旋》一書(shū)后,他的興趣在最后一學(xué)年轉(zhuǎn)向了生物學(xué)。1984年,他進(jìn)入加州大學(xué)伯克利分校,師從細(xì)胞生物學(xué)家謝克曼(R.Schekman,2013年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)獲得者),以酵母為材料研究囊泡的運(yùn)輸機(jī)制。

      1989年博士畢業(yè)后,貝克進(jìn)入加州大學(xué)舊金山分校結(jié)構(gòu)生物學(xué)家阿加德(D.Agard)的實(shí)驗(yàn)室進(jìn)行博士后研究。他在細(xì)胞組織和分子結(jié)構(gòu)方面的訓(xùn)練為將來(lái)從事蛋白質(zhì)設(shè)計(jì)工作奠定了基礎(chǔ)。1993年,貝克進(jìn)入西雅圖華盛頓大學(xué)醫(yī)學(xué)院的生物化學(xué)系建立團(tuán)隊(duì),采用常規(guī)實(shí)驗(yàn)方法如質(zhì)譜和磁共振波譜研究蛋白質(zhì)結(jié)構(gòu)。與此同時(shí),他還將研究范圍擴(kuò)大到計(jì)算機(jī)建模,這為蛋白質(zhì)折疊產(chǎn)生三維結(jié)構(gòu),以及這些結(jié)構(gòu)與蛋白質(zhì)功能的相關(guān)性研究提供了關(guān)鍵見(jiàn)解。此時(shí),他決定挑戰(zhàn)生物化學(xué)領(lǐng)域的重大難題之一——蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。

      貝克在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)研究過(guò)程中開(kāi)發(fā)出計(jì)算平臺(tái)羅塞塔(Rosetta)[4]。羅塞塔將PDB中具有相似局部序列的無(wú)關(guān)結(jié)構(gòu)碎片進(jìn)行組裝,同時(shí)優(yōu)化序列和結(jié)構(gòu)以適應(yīng)目標(biāo)主鏈構(gòu)象;計(jì)算中使用了蒙特卡洛優(yōu)化、能量函數(shù),并考慮范德華力、氫鍵和溶劑效應(yīng)等因素。羅塞塔參加了1998年的CASP3,比賽中表現(xiàn)良好,成功預(yù)測(cè)了給定序列的空間結(jié)構(gòu),算得上一大進(jìn)步,但整體效果不佳。提升羅塞塔的效果就需要消耗更多計(jì)算資源,此時(shí)小科研團(tuán)隊(duì)就顯得捉襟見(jiàn)肘,難以應(yīng)付,貝克為此啟動(dòng)了一個(gè)名為“羅塞塔@家園”的項(xiàng)目,讓全球志愿者在自己電腦上協(xié)助計(jì)算,群策群力逐步改進(jìn)程序。但遺憾的是,羅塞塔在結(jié)構(gòu)預(yù)測(cè)方面遲遲沒(méi)有大的突破。貝克團(tuán)隊(duì)卻意外發(fā)現(xiàn)反向使用羅塞塔卻較為成功,就是根據(jù)給定蛋白質(zhì)的結(jié)構(gòu)信息來(lái)獲取氨基酸序列。貝克的研究也從最初的結(jié)構(gòu)預(yù)測(cè)轉(zhuǎn)向理性設(shè)計(jì),并率先獲得成功,算得上“失之東隅,收之桑榆”。

      貝克與蛋白質(zhì)計(jì)算設(shè)計(jì)

      2003年,貝克及同事完成了93個(gè)氨基酸的蛋白Top7從頭設(shè)計(jì)和合成,并得到實(shí)驗(yàn)確認(rèn)[5]。這是蛋白質(zhì)從頭設(shè)計(jì)領(lǐng)域第一個(gè)真正意義上的突破,理由是:一是分子量大,93個(gè)氨基酸遠(yuǎn)超以前的設(shè)計(jì);二是精確性高,預(yù)定結(jié)構(gòu)與最終結(jié)構(gòu)高度一致;三是創(chuàng)新性強(qiáng),Top7蛋白與天然蛋白質(zhì)同源性極低,是一種自然界不存在的全新人工蛋白;四是設(shè)計(jì)難度大,PDB中可供參考的信息非常有限,真正的從頭設(shè)計(jì)。這次成功使科學(xué)界普遍接受了蛋白質(zhì)從頭設(shè)計(jì)的可行性,但這一策略是否具有通用性,特別是能否用于具生理功能蛋白質(zhì)的設(shè)計(jì)呢?

      砥礪前行

      貝克團(tuán)隊(duì)隨后進(jìn)一步改進(jìn)羅塞塔程序,提高性能,并嘗試從頭設(shè)計(jì)功能蛋白,首先選擇具有催化功能的酶。2008年,貝克等人首次實(shí)現(xiàn)了酶的計(jì)算設(shè)計(jì),最終獲得的人工酶催化反應(yīng)速率遠(yuǎn)快于非酶促反應(yīng),但與天然酶相比,整體效率尚存在不足[6],借助阿諾德定向進(jìn)化策略最終獲得更高活性酶。這一成果說(shuō)明從頭設(shè)計(jì)功能蛋白的可行性,但在策略上尚需進(jìn)一步完善。

      貝克團(tuán)隊(duì)結(jié)合從頭設(shè)計(jì)領(lǐng)域的最新進(jìn)展和自己團(tuán)隊(duì)的經(jīng)驗(yàn),對(duì)設(shè)計(jì)策略進(jìn)行了全面提升,并通過(guò)合成一系列新性能的人工蛋白質(zhì)證明其方法的可行性。他們首先嘗試設(shè)計(jì)配體結(jié)合蛋白,獲得的類固醇結(jié)合蛋白具有高親和力和高選擇性,進(jìn)一步結(jié)合其他方法將親和力從納摩爾提升至皮摩爾的水平。2016年,他們創(chuàng)造出具有自我組裝能力的二十面體病毒樣顆粒,蛋白質(zhì)分子量達(dá)兆道爾頓,直徑24~40納米[7]。他們還在多個(gè)應(yīng)用領(lǐng)域設(shè)計(jì)出新功能蛋白,如蛋白質(zhì)開(kāi)關(guān)和傳感器等[8],特別需要提及的是,新型冠狀病毒感染流行期間,他們還設(shè)計(jì)出用于診斷和治療的新蛋白質(zhì),為疫苗研發(fā)提供了重要的幫助。

      天然蛋白質(zhì)都是基于適應(yīng)特定自然環(huán)境而長(zhǎng)期選擇的產(chǎn)物,不可避免會(huì)存在諸多缺陷,而從頭設(shè)計(jì)則可有效規(guī)避部分問(wèn)題,所設(shè)計(jì)和合成的人工蛋白質(zhì)具有更好的穩(wěn)定性和新性能,增加了實(shí)用性[9]。

      需補(bǔ)充的是,為更好地進(jìn)行計(jì)算設(shè)計(jì),天然結(jié)構(gòu)的借鑒是必不可少的一環(huán)。因此,貝克團(tuán)隊(duì)也在時(shí)刻關(guān)注蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面的進(jìn)展。在哈薩比斯和江珀引入人工智能開(kāi)發(fā)出有效的AF2后,貝克也將人工智能策略引入到羅塞塔程序,從而獲得自己的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具[10],進(jìn)一步反哺蛋白質(zhì)設(shè)計(jì)方面的工作。

      造福人類

      2024年諾貝爾化學(xué)獎(jiǎng)的兩項(xiàng)成果堪稱完美互補(bǔ),一項(xiàng)是認(rèn)識(shí)蛋白質(zhì),一項(xiàng)是改造蛋白質(zhì),且都是在更高緯度實(shí)現(xiàn)突破。在化學(xué)家眼中,蛋白質(zhì)是一種略顯“不普通”的重要生物大分子,而蛋白質(zhì)在生命科學(xué)乃至醫(yī)學(xué)領(lǐng)域則具有更為舉足輕重的地位,所以解決蛋白質(zhì)結(jié)構(gòu)問(wèn)題無(wú)疑對(duì)化學(xué)和生理學(xué)與醫(yī)學(xué)均具有重要價(jià)值,因此他們獲得諾貝爾獎(jiǎng)實(shí)至名歸?;瘜W(xué)更看重普適性(蛋白質(zhì)整體研究),而生理學(xué)或醫(yī)學(xué)更偏向特殊性(某種或某類蛋白質(zhì)研究),看來(lái)授予化學(xué)獎(jiǎng)顯然更合適。

      任何科學(xué)突破都非一朝一夕或單純極少數(shù)天才人物的貢獻(xiàn),而是一代代科學(xué)家前赴后繼、長(zhǎng)期探索和積累的結(jié)果。從上面的介紹可清晰看出結(jié)構(gòu)生物學(xué)、蛋白質(zhì)合成、計(jì)算機(jī)科學(xué)、人工智能等領(lǐng)域的科學(xué)家均發(fā)揮了重要作用,2024年的三位獲獎(jiǎng)?wù)哒窃诮梃b和吸收前人成果基礎(chǔ)上并結(jié)合自身敏銳的洞察力和卓越的創(chuàng)造力實(shí)現(xiàn)了集成式創(chuàng)新,而這些成果又為將來(lái)的新突破奠定了重要基礎(chǔ)。

      蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的成功為揭開(kāi)眾多生命奧秘和開(kāi)發(fā)新型藥物提供了強(qiáng)大工具,而蛋白質(zhì)計(jì)算設(shè)計(jì)則為這種原本重要的生物大分子賦予了更強(qiáng)大的功能,拓展了其應(yīng)用范圍。后續(xù)的研究和應(yīng)用都將在推動(dòng)人類健康事業(yè)發(fā)展和提升生活質(zhì)量方面發(fā)揮重大作用,從而體現(xiàn)諾貝爾獎(jiǎng)?lì)C發(fā)的真諦——造福人類。

      總之,貝克、哈薩比斯和江珀在蛋白質(zhì)計(jì)算設(shè)計(jì)與蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的卓越貢獻(xiàn),其影響極為深遠(yuǎn)(有些很難預(yù)測(cè)),他們開(kāi)啟了生物化學(xué)和生物學(xué)研究的新紀(jì)元,使我們能夠以前所未有的方式理解和利用蛋白質(zhì),這將對(duì)人類的生活和生產(chǎn)帶來(lái)重大改變。

      (本文部分內(nèi)容參考了諾貝爾獎(jiǎng)官方網(wǎng)站的信息,在此表示感謝?。?/p>

      [1]郭貝一,郭曉強(qiáng).AlphaFold和蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè).科學(xué),2024,76(5):39-44.

      [2]JumperJ,EvansR,PritzelA,etal.HighlyaccurateproteinstructurepredictionwithAlphaFold.Nature,2021,596(7873):583-589.

      [3]ReganL,DeGradoWF.Characterizationofahelicalproteindesignedfromfirstprinciples.Science,1988,241(4868):976-978.

      [4]SimonsKT,BonneauR,RuczinskiI,etal.AbinitioproteinstructurepredictionofCASPIIItargetsusingROSETTA.Proteins,1999,Suppl3:171-176.

      [5]KuhlmanB,DantasG,IretonGC,etal.Designofanovelglobularproteinfoldwithatomic-levelaccuracy.Science,2003,302(5649):1364-1368.

      [6]JiangL,AlthoffEA,ClementeFR,etal.Denovocomputationaldesignofretro-aldolenzymes.Science,2008,319(5868):1387-1391.

      [7]BaleJB,GonenS,LiuY,etal.Accuratedesignofmegadaltonscaletwo-componenticosahedralproteincomplexes.Science,2016,353(6297):389-394.

      [8]LanganRA,BoykenSE,NgAH,etal.Denovodesignofbioactiveproteinswitches.Nature,2019,572(7768):205-210.

      [9]HuangPS,BoykenSE,BakerD.Thecomingofageofdenovoproteindesign.Nature,2016,537(7620):320-327.

      [10]BaekM,DiMaioF,AnishchenkoI,etal.Accuratepredictionofproteinstructuresandinteractionsusingathree-trackneuralnetwork.Science,2021,373(6557):871-876.

      關(guān)鍵詞:諾貝爾化學(xué)獎(jiǎng)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)從頭設(shè)計(jì)■

      猜你喜歡
      貝克氨基酸蛋白質(zhì)
      蛋白質(zhì)自由
      肝博士(2022年3期)2022-06-30 02:48:48
      人工智能與蛋白質(zhì)結(jié)構(gòu)
      海外星云(2021年9期)2021-10-14 07:26:10
      月桂酰丙氨基酸鈉的抑菌性能研究
      貝貝克Populist餐吧
      UFLC-QTRAP-MS/MS法同時(shí)測(cè)定絞股藍(lán)中11種氨基酸
      中成藥(2018年1期)2018-02-02 07:20:05
      蛋白質(zhì)計(jì)算問(wèn)題歸納
      嗚嗷,怪獸登陸
      一株Nsp2蛋白自然缺失123個(gè)氨基酸的PRRSV分離和鑒定
      迷你貝克街
      愛(ài)冒險(xiǎn)的貝克(二)
      库尔勒市| 宁武县| 汾西县| 于都县| 阳城县| 孟津县| 会理县| 清远市| 大英县| 永靖县| 乌拉特后旗| 嘉鱼县| 松滋市| 万盛区| 姚安县| 同德县| 镇巴县| 龙陵县| 金阳县| 新疆| 濉溪县| 铜鼓县| 台前县| 建阳市| 巴彦县| 关岭| 仁怀市| 潍坊市| 青田县| 都兰县| 平邑县| 兴隆县| 河池市| 新巴尔虎左旗| 循化| 麻江县| 田东县| 五原县| 合肥市| 雷山县| 柞水县|