楊冬
蛋白質(zhì)結(jié)構(gòu)與藥物的研發(fā)密切相關(guān),在談蛋白質(zhì)結(jié)構(gòu)之前,讓我們先聊聊藥物。常言道,一把鑰匙開一把鎖,對(duì)于人體來說,藥物相當(dāng)于一把“鑰匙”,它必須要找到人體內(nèi)與之對(duì)應(yīng)的那把“鎖”才能發(fā)揮作用。人體內(nèi)的“鎖”往往是一些生物大分子(如蛋白質(zhì)、DNA或者RNA),被稱為藥物的靶點(diǎn)。
研發(fā)新型藥物的工作有點(diǎn)兒類似配鑰匙,如果我們能知道靶點(diǎn)的精確結(jié)構(gòu),就相當(dāng)于知道了“鎖”的結(jié)構(gòu),對(duì)于新藥研發(fā)會(huì)有很大幫助。那么,藥物研發(fā)專家如何確定蛋白質(zhì)(或者其他生物大分子)的結(jié)構(gòu)呢?
蛋白質(zhì)是由氨基酸組成的生物大分子。在生物體內(nèi),有20種不同的氨基酸(如丙氨酸、絲氨酸、酪氨酸)。我們可以把氨基酸想象成一塊塊五顏六色的樂高積木,比如,丙氨酸是紅色的,絲氨酸是綠色的,酪氨酸是藍(lán)色的,這種“樂高積木”首尾相連就形成了一條彩色的長鏈。我們可以將這條長鏈看作蛋白質(zhì)的“一級(jí)結(jié)構(gòu)”。不過,蛋白質(zhì)并不是停留在這種長鏈的狀態(tài)下。這條長鏈還會(huì)反復(fù)扭曲,最后形成一個(gè)復(fù)雜的三維結(jié)構(gòu),這個(gè)過程被稱為蛋白質(zhì)折疊。如果再形象化一點(diǎn)兒,也可以把蛋白折疊想象為將一根毛線扭成一個(gè)毛線團(tuán)。
研究表明,每一個(gè)特定的蛋白質(zhì)都包含特定的氨基酸序列,用樂高積木類比,就相當(dāng)于顏色各異的樂高積木根據(jù)一定順序連接在一起,從而形成不同的長鏈。每一個(gè)特定的蛋白質(zhì)還有其固有的三維結(jié)構(gòu),蛋白質(zhì)的三維結(jié)構(gòu)是由它的氨基酸序列決定的。因此,從理論上看,如果知道一個(gè)蛋白質(zhì)的氨基酸序列,就有可能通過計(jì)算機(jī)結(jié)構(gòu)預(yù)測(cè)軟件推算出它的三維結(jié)構(gòu)。
不過,根據(jù)氨基酸序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)并非易事。長期以來,人們更常用的方法是使用實(shí)驗(yàn)手段測(cè)定蛋白質(zhì)結(jié)構(gòu),常用的方法包括X射線晶體衍射、核磁共振(NMR)和冷凍電鏡。X射線晶體衍射是測(cè)定蛋白質(zhì)結(jié)構(gòu)的黃金標(biāo)準(zhǔn),并且直到今天通過X射線晶體衍射得到的蛋白質(zhì)結(jié)構(gòu)信息的分辨率也是最高的。不過,對(duì)于特別大的生物大分子復(fù)合物(如核糖體),冷凍電鏡有很大的優(yōu)勢(shì),因?yàn)檫@些分子往往很難形成高質(zhì)量的可供衍射的晶體。核磁共振則對(duì)測(cè)定一些特別小的生物分子(如肽段)有重要價(jià)值。
隨著通過實(shí)驗(yàn)手段測(cè)定的蛋白質(zhì)結(jié)構(gòu)越來越多,從事蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的科學(xué)家也擁有了更多的可供參考的數(shù)據(jù),這樣就可以改善蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)軟件的質(zhì)量。但是,這里出現(xiàn)了一個(gè)問題,現(xiàn)在有形形色色的預(yù)測(cè)方法,每一種方法的開發(fā)者都認(rèn)為自己開發(fā)的預(yù)測(cè)方法是有效的,那么,是否有客觀的標(biāo)準(zhǔn)來評(píng)估哪一種結(jié)構(gòu)預(yù)測(cè)方法更靠譜呢?
為了解決這個(gè)問題,國際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競賽(CASP)于1994年拉開帷幕。CASP被稱為“競賽”,實(shí)際上,每一支CASP參賽隊(duì)伍都是一個(gè)開發(fā)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法的團(tuán)隊(duì),每次競賽都是一次蛋白質(zhì)結(jié)構(gòu)研究者的交流大會(huì)。每年競賽的組委會(huì)向參賽隊(duì)伍提供若干蛋白質(zhì)的氨基酸序列供預(yù)測(cè)。這些氨基酸序列對(duì)應(yīng)的是一些近期剛剛用實(shí)驗(yàn)方法完成解析但還暫時(shí)處于保密狀態(tài)的蛋白質(zhì)三維結(jié)構(gòu)。等到參賽團(tuán)隊(duì)完成預(yù)測(cè)并遞交“答卷”后,組委會(huì)會(huì)將他們的答案與實(shí)際測(cè)得的結(jié)構(gòu)進(jìn)行比較。如果你的預(yù)測(cè)更加接近實(shí)際結(jié)構(gòu),你就可以得到高分。得分越高,說明你開發(fā)的軟件越靠譜。
那么, CASP參賽團(tuán)隊(duì)一般能得多少分呢?現(xiàn)實(shí)是殘酷的,滿分100分,大部分團(tuán)隊(duì)常常只能得到40分左右。但是,DeepMind公司的人工智能系統(tǒng)AlphaFold在2018年橫空出世后,馬上就奪得了近60分的“高分”。2020年,在第14屆CASP上,DeepMind又推出了新的版本—AlphaFold2,結(jié)果拿到了前所未有的高分,達(dá)到90分以上。也就是說,AlphaFold2所預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)中,大部分已經(jīng)和實(shí)驗(yàn)測(cè)定的結(jié)構(gòu)相差無幾了。那么,AlphaFold2到底有什么神奇之處呢?
AlphaFold以及它的升級(jí)版本AlphaFold2使用了與當(dāng)初擊敗人類圍棋大師的AlphaGo類似的深度學(xué)習(xí)技術(shù)。DeepMind公司的開發(fā)人員利用已經(jīng)通過實(shí)驗(yàn)測(cè)定的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)來訓(xùn)練AlphaFold2。為了讓AlphaFold2預(yù)測(cè)的結(jié)果更加精準(zhǔn),開發(fā)人員一共使用了17萬個(gè)不同的蛋白質(zhì)結(jié)構(gòu)對(duì)其進(jìn)行訓(xùn)練。不過,AlphaFold2雖然得到了很好的成績,但它離徹底“破解”蛋白質(zhì)結(jié)構(gòu)還有一定距離。目前,這個(gè)系統(tǒng)對(duì)于比較簡單的蛋白質(zhì)的預(yù)測(cè)效果比較好,但是對(duì)于含有很多氨基酸的復(fù)雜蛋白質(zhì),或者是幾個(gè)蛋白質(zhì)形成的復(fù)合物暫時(shí)還不能有效預(yù)測(cè)?!皫讉€(gè)蛋白質(zhì)形成的復(fù)合物” 可以理解為,幾條樂高積木組成的長鏈分別先扭曲成幾個(gè)特定的形狀,然后再堆積成一個(gè)更加復(fù)雜的結(jié)構(gòu)。當(dāng)然,我們可以推測(cè),隨著技術(shù)不斷進(jìn)步,AlphaFold的某個(gè)未來版本有可能徹底“破解”蛋白質(zhì)結(jié)構(gòu),甚至包括DNA和RNA在內(nèi)的所有生物大分子的結(jié)構(gòu)。
如果蛋白質(zhì)結(jié)構(gòu)真的被人工智能“破解”了,那么對(duì)我們的世界又有什么影響呢?
首先,研究者可以更方便地獲得藥物靶點(diǎn)的三維結(jié)構(gòu)。獲取藥物靶點(diǎn)的三維結(jié)構(gòu)后,制藥公司就能開發(fā)出更多新型藥物,用來治療癌癥、艾滋病、阿爾茨海默病等嚴(yán)重危害人類健康的疾病。
此外,蛋白質(zhì)是生物體發(fā)揮正常功能的最重要的因素之一。要理解生命中的很多本質(zhì)問題,我們需要獲得蛋白質(zhì)的結(jié)構(gòu)。以前,獲取蛋白質(zhì)結(jié)構(gòu)的唯一解決方案就是開展實(shí)驗(yàn)去進(jìn)行結(jié)構(gòu)解析。未來,如果人工智能可以預(yù)測(cè)大部分的蛋白質(zhì)三維結(jié)構(gòu),顯然可以大大加快生物領(lǐng)域各種研究工作的步伐。
另一個(gè)從中受益的可能是蛋白質(zhì)設(shè)計(jì)。如果科學(xué)家需要得到具有某種特定結(jié)構(gòu)的蛋白質(zhì),可以先通過計(jì)算機(jī)設(shè)計(jì)出一個(gè)氨基酸序列,然后根據(jù)設(shè)計(jì)的序列把這個(gè)蛋白質(zhì)合成出來,而且合成出來的蛋白質(zhì)具有預(yù)期的特定結(jié)構(gòu)。
科學(xué)家為什么要費(fèi)這么大力氣進(jìn)行蛋白質(zhì)設(shè)計(jì)呢?這是因?yàn)榈鞍踪|(zhì)設(shè)計(jì)在醫(yī)療方面有很重要的應(yīng)用價(jià)值,其中一個(gè)非常重要的應(yīng)用是可以利用蛋白質(zhì)設(shè)計(jì)開發(fā)新型疫苗。
通常情況下,將疫苗注射到人體后,體內(nèi)的免疫細(xì)胞就會(huì)產(chǎn)生針對(duì)疫苗中所含的某種抗原的抗體,從而幫助疫苗接種者抵抗未來病原體的入侵。例如,為了預(yù)防乙型肝炎,我們會(huì)注射乙肝疫苗,疫苗中的抗原就是乙肝表面抗原,它是一種分布在乙肝病毒表面的蛋白質(zhì)。人體免疫細(xì)胞遇到這個(gè)抗原后就會(huì)產(chǎn)生針對(duì)它的抗體,這些抗體可以結(jié)合在抗原表面的某個(gè)位點(diǎn)上。如果某一天真有乙肝病毒入侵,血液中的抗體通過與乙肝病毒表面抗原結(jié)合,就會(huì)破壞病毒的功能,導(dǎo)致乙肝病毒失去侵入人體的能力,即被“中和”了,所以這種抗體也被稱為“中和抗體”。
然而,很多病毒是非常“狡猾”的,它們常常會(huì)發(fā)生突變,因此每一代病毒表面蛋白質(zhì)的氨基酸序列都會(huì)有所變化。這樣它們就可以逃脫人體內(nèi)抗體的中和作用,因?yàn)槟軌蜃R(shí)別“舊抗原”的抗體不見得能夠識(shí)別“新抗原”。人們要每年注射流感疫苗,就是因?yàn)榱鞲胁《臼翘貏e善于突變的病毒,所以我們要每年注射“最合適版本”的疫苗。
在病毒表面的蛋白質(zhì)中,并不是每一個(gè)位點(diǎn)(蛋白質(zhì)的某些區(qū)域)都可以發(fā)生突變。蛋白質(zhì)的某些位點(diǎn)對(duì)于該蛋白質(zhì)的功能特別重要,無論在什么情況下,這些位點(diǎn)都不會(huì)發(fā)生改變,因此也被稱為保守位點(diǎn)。如果改變了保守位點(diǎn)的氨基酸,病毒就失去了這個(gè)蛋白質(zhì)的功能,因此也就失去了感染人體的能力。
那么,能否讓人體專門合成針對(duì)保守位點(diǎn)的抗體呢?如果這種方法可行,豈不是一勞永逸?不幸的是,在很多情況下,傳統(tǒng)的疫苗很難誘導(dǎo)人體產(chǎn)生針對(duì)這些保守位點(diǎn)的抗體。
為了解決這個(gè)問題,蛋白質(zhì)設(shè)計(jì)就上場了!如果科學(xué)家可以設(shè)計(jì)一個(gè)人造蛋白質(zhì)作為“載體”,然后把抗原中組成保守位點(diǎn)的幾個(gè)氨基酸都移植到“載體”的暴露位置上,之后將這種人造蛋白質(zhì)作為疫苗注入人體,那么人體內(nèi)的免疫細(xì)胞就可能合成專門針對(duì)這個(gè)保守位點(diǎn)的抗體。這種針對(duì)保守位點(diǎn)的抗體,有可能抵御病原體的各種突變。
不過,要進(jìn)行此類蛋白質(zhì)設(shè)計(jì),精確的蛋白結(jié)構(gòu)預(yù)測(cè)就是絕對(duì)的先決條件。因?yàn)楸灰浦驳健拜d體”中的保守位點(diǎn)的形狀(在生物化學(xué)中被稱為構(gòu)象)必須和它在原先抗原蛋白質(zhì)中的形狀完全一樣。只有在這樣的條件下,利用人造蛋白質(zhì)作為疫苗產(chǎn)生的抗體,才能識(shí)別病原體中的相應(yīng)抗原,從而產(chǎn)生中和效果。如果兩者形狀不同,那么能夠識(shí)別人造蛋白質(zhì)中這個(gè)位點(diǎn)的抗體并不能夠識(shí)別真正病原體(如病毒)中抗原里面的相應(yīng)位點(diǎn),那么這種抗體就無法起到任何保護(hù)作用。
很多病毒有特別高的突變率,因此開發(fā)針對(duì)這些病毒的有效疫苗非常困難。這些病毒中,危害最大的就是導(dǎo)致艾滋病的人體免疫缺陷病毒(HIV)。試圖利用蛋白質(zhì)設(shè)計(jì)開發(fā)有效的艾滋病疫苗的研究工作已經(jīng)開展了很多年,然而由于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)能力的局限性,目前并沒有實(shí)現(xiàn)突破性的進(jìn)展??梢韵胂螅绻斯ぶ悄苣芡耆捌平狻钡鞍踪|(zhì)結(jié)構(gòu),那么科學(xué)家很有可能制造出有效的艾滋病疫苗。
2020年,對(duì)人類而言是特殊的一年,新冠肺炎疫情在全球蔓延不僅導(dǎo)致了大量人員感染、死亡,同時(shí)嚴(yán)重影響了全球貿(mào)易,對(duì)世界政治、經(jīng)濟(jì)、文化產(chǎn)生了深遠(yuǎn)影響。這個(gè)事實(shí)再次提醒我們,以前未曾出現(xiàn)的新型病毒可能是未來人類需要面對(duì)的巨大威脅,同時(shí)這次疫情讓我們更深刻地意識(shí)到,有效的疫苗開發(fā)方法將對(duì)人類社會(huì)的正常運(yùn)轉(zhuǎn)意義重大。所以,蛋白質(zhì)設(shè)計(jì)作為一個(gè)極富潛力的疫苗研發(fā)手段,很有可能在未來大放異彩,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)作為蛋白質(zhì)設(shè)計(jì)的基礎(chǔ)也將為人類健康做出重要貢獻(xiàn)。