中圖分類號:Q81
文獻標(biāo)志碼:A
近年來,人工智能技術(shù)在蛋白質(zhì)研究中的應(yīng)用引發(fā)了蛋白結(jié)構(gòu)與功能預(yù)測領(lǐng)域的革命性突破,也為人工酶的從頭設(shè)計(denovodesign)提供了新的方法和工具,如圖1所示。2020年,Madani等發(fā)表了基于語言生成模型的蛋白生成模型ProGen,該模型的訓(xùn)練采用了來自1.9萬個蛋白家族的總計2.8億條蛋白序列。運用該模型,Madani等獲得了序列有別于天然酶的溶菌酶、馬來酸脫氫酶等人工酶[2]。2021年,Baker團隊[3提出了用于從頭設(shè)計蛋白質(zhì)的深度網(wǎng)絡(luò)幻想方法,所設(shè)計的蛋白質(zhì)序列中有約20% 能夠在細菌中順利表達,且蛋白折疊結(jié)構(gòu)與預(yù)測結(jié)果相似。2022年,Baker團隊[4開發(fā)了“hallucination”和\"inpainting\"這兩種可用于生成包含功能位點的骨架結(jié)構(gòu)的深度學(xué)習(xí)方法,展示了其在蛋白設(shè)計領(lǐng)域的應(yīng)用潛力,但并未對所設(shè)計的酶進行活性驗證。2023年,他們在RoseTTAFold基礎(chǔ)上結(jié)合去噪擴散概率模型,開發(fā)出模型RFdiffusion5。該模型可從最小活性位點(催化殘基主鏈)構(gòu)象出發(fā),通過去噪迭代生成完整的新骨架,在單體蛋白質(zhì)、對稱寡聚體、蛋白質(zhì)結(jié)合蛋白的設(shè)計任務(wù)中表現(xiàn)出色。Baker團隊還開發(fā)了用于生成給定蛋白骨架的氨基酸序列的逆折疊模型ProteinMPNN和LigandMPNN[7,并在金屬離子、小分子以及DNA結(jié)合蛋白的設(shè)計中進行了實驗驗證。這類模型還能對天然蛋白質(zhì)的氨基酸序列進行優(yōu)化,提高其結(jié)構(gòu)穩(wěn)定性和可表達性[8。在酶的設(shè)計方面,Yang團隊開發(fā)了基于綜合計算評分蛋白質(zhì)序列篩選標(biāo)準(zhǔn)COMPSS(Co-evolutionaryandMotif-based ProteinSequenceScreening),它能夠從人工智能生成的候選序列中高效識別出具有活性的酶。經(jīng)過三輪迭代優(yōu)化,最終篩選出的蘋果酸脫氫酶和銅鋅超氧化物歧化酶的人工酶能夠在大腸桿菌中表達、純化,且具備催化活性。Baker團隊lio通過RosettaMatch算法將血紅素結(jié)合位點整合至環(huán)形支架中心空腔,接著利用Rosetta組合方法設(shè)計血紅素結(jié)合位點兩側(cè)的氨基酸序列,獲得了活性口袋大、可塑性和穩(wěn)定性高的人工血紅素酶?;趫D神經(jīng)網(wǎng)絡(luò)算法,Baker團隊采用全家族幻覺(Family-widehallucination)算法和基于軟件Rosetta的序列設(shè)計,對核轉(zhuǎn)運因子2(NTF2)家族的蛋白骨架結(jié)構(gòu)進行幻想生成,并對底物結(jié)合的口袋精細調(diào)整,成功構(gòu)建了一種小型的高熱穩(wěn)定性的熒光素酶,展示了人工酶設(shè)計的巨大潛力[。但是,由于熒光素酶催化機制簡單,在設(shè)計過程中僅需要考慮人工酶的活性中心對目標(biāo)底物二苯四嗪陰離子的穩(wěn)定化作用,并不涉及更復(fù)雜的蛋白分子動力學(xué),因此該方法并不適用于其他復(fù)雜酶的設(shè)計。對具有更復(fù)雜的活性位點、并需要介導(dǎo)多步復(fù)雜催化反應(yīng)的酶,其設(shè)計仍然面臨諸多挑戰(zhàn)。并且,上述方法所設(shè)計出的蛋白,其骨架多樣性仍受限于所選擇的天然蛋白家族模板。如何突破進化限制,設(shè)計具有不同蛋白骨架或折疊形式的人工酶,也是人工酶設(shè)計領(lǐng)域的難題。
絲氨酸水解酶(Serinehydrolase)是一類以絲氨酸的羥基為親核基團,通過進攻羰基來實現(xiàn)酯鍵、酰胺鍵水解的酶。絲氨酸水解酶廣泛參與包括脂質(zhì)代謝、蛋白質(zhì)降解、信號轉(zhuǎn)導(dǎo)、代謝調(diào)控等多種生理代謝過程,在疾病治療方面也發(fā)揮著重要作用。例如,乙酰膽堿酯酶調(diào)節(jié)神經(jīng)遞質(zhì)乙酰膽堿的代謝,其異常與阿爾茨海默病相關(guān)[12]。脂肪酸酰胺水解酶能夠降解內(nèi)源性大麻素類物質(zhì) N. -花生酰乙醇胺,影響內(nèi)源性大麻素系統(tǒng)的功能,進而對腫瘤細胞的生長、增殖、凋亡等生理過程產(chǎn)生影響[13]。絲氨酸水解酶還是一類重要的工業(yè)酶。例如,脂肪酶在油脂改性、肉類脫脂、酯類香料合成以及日化洗滌劑等領(lǐng)域中具有廣泛的應(yīng)用。最近發(fā)現(xiàn)的可催化聚酯塑料高效降解的角質(zhì)酶、聚對苯二甲酸乙二醇酯(PET)水解酶等也都屬于絲氨酸水解酶[14-15]。這類酶通過酸堿催化機制加速底物的水解,其活性中心由一個絲氨酸殘基、一個酸殘基(通常為谷氨酸或天冬氨酸)和一個堿殘基(通常為組氨酸)組成,構(gòu)成一組催化三聯(lián)體。絲氨酸的羥基作為親核基團攻擊底物的羰基碳原子,形成四面體中間產(chǎn)物,同時酸殘基和堿殘基協(xié)同調(diào)節(jié)質(zhì)子轉(zhuǎn)移,促進反應(yīng)進行。氧負離子穴通過氫鍵網(wǎng)絡(luò)穩(wěn)定過渡態(tài)的氧負離子,降低反應(yīng)活化能,從而加速底物的水解[16]。
絲氨酸水解酶清晰的催化機制為其從頭設(shè)計奠定了基礎(chǔ)。Guallar團隊[7]利用天然蛋白骨架,在無催化活性的FragaceatoxinC蛋白質(zhì)納米孔中構(gòu)建了8組催化三聯(lián)體,實現(xiàn)了對PET納米顆粒的水解,但對微米級以上的PET顆粒無水解活性。這類復(fù)雜催化酶的設(shè)計需要綜合評價關(guān)鍵催化殘基在整個反應(yīng)進程中結(jié)合底物的位置變化。為解決這個問題,
Baker團隊[18]開發(fā)了反應(yīng)路徑預(yù)組織評估工具PLACER,利用深度神經(jīng)網(wǎng)絡(luò)模擬催化循環(huán)中的關(guān)鍵狀態(tài),評估各反應(yīng)步驟的活性位點兼容性和多態(tài)預(yù)組織程度?;赗Fdiffusion和PLACER設(shè)計人工絲氨酸水解酶的工作流程如圖2(a)所示,通過整合RFdiffusion和PLACER,從頭設(shè)計了具有全新折疊結(jié)構(gòu)和酯催化活性的人工絲氨酸水解酶。以4-甲基香豆素苯乙酸酯為底物,最佳的人工酶的催化效率(kcat/Km) 達到 2.2×105mol/(L?s) (轉(zhuǎn)化數(shù)( kcat) 為 0.057s-1 米氏常數(shù) (Km) 為 0.26μmol/L )。這項研究展示了人工智能在蛋白質(zhì)設(shè)計中的巨大潛力。但是,該人工酶與天然絲氨酸水解酶相比,其催化效率仍然較低(例如,乙酰膽堿酯酶對乙酰膽堿的 kcat/Km 值超過108mol/(L?s)[19]) ,且 kcat 僅為 0.057s-1 ,難以滿足實際應(yīng)用的需要。
除了小分子底物,很多絲氨酸水解酶還能高效地催化蛋白、聚酯等大分子的降解。這類酶的設(shè)計不僅要求相關(guān)的活性位點滿足特定的幾何排布和預(yù)組織方式,還需要保持活性位點位于蛋白表面。本課題組2展示了以已知的天然酶活性位點為基礎(chǔ)、將深度學(xué)習(xí)算法和常規(guī)分子模擬相結(jié)合的工作流程,用于設(shè)計全新的PET水解酶。我們首先從天然的枝葉堆肥角質(zhì)酶(LCC)中提取了含有催化三聯(lián)體基序的二級結(jié)構(gòu)片段,然后利用改進的RoseTTAFold網(wǎng)絡(luò) (RFjoint) 生成用于支撐所提取基序的蛋白質(zhì)序列,并使用AlphaFold2對新的序列進行蛋白結(jié)構(gòu)預(yù)測?;?RFjoint 和傳統(tǒng)計算篩選策略設(shè)計人工PET水解酶的工作流程如圖2(b)所示。在此基礎(chǔ)上,通過評估以下指標(biāo)篩選具有潛在催化活性的序列:(1)結(jié)構(gòu)預(yù)測建模得分(TemplateModeling score,TM-score gt;0.7 0;(2)每個殘基局部距離差檢驗的預(yù)測值(per-residue Local Distance Difference Test,pLDDT gt;70 );(3)基序復(fù)現(xiàn)精度均方根偏差(MotifRMSDlt;2.5AA 1AA=1×10-10m) ;(4)模式底物2-羥乙基-(對苯二甲酸單羥乙基 )3 的結(jié)合能(Binding energy,-16.7kJ/mol~0 ;(5)催化距離約束(絲氨酸殘基上的氧原子與底物羰基碳間距小于 4AA ;(6分子動力學(xué)模擬(MDsimulation)穩(wěn)定性( 20ns 分子動力學(xué)模擬中骨架 a 碳原子的RMSD小于 5AA )。最后,通過實驗驗證和序列優(yōu)化,成功地開發(fā)出了比LCC序列長度短 30% 的人工酶,且能復(fù)制PET水解活性。其中,人工酶RsPETasel表現(xiàn)突出,其 kcat/Km 與LCC相當(dāng),且具備良好的熱穩(wěn)定性(熔融溫度為 56°C ),但與LCC的序列相似性僅為 34% 。該策略的成功實施,證明可以在保留酶的核心功能結(jié)構(gòu)的前提下,盡可能去除冗余序列,獲得尺寸更小、折疊更緊湊的新酶。該方法有望應(yīng)用于更多種類的絲氨酸水解酶的設(shè)計中,幫助人們獲得更多的“微型酶”,提高酶的結(jié)構(gòu)穩(wěn)定性和催化效率,降低酶的生產(chǎn)成本。
人工智能技術(shù)在絲氨酸水解酶設(shè)計方面的突破,為具有復(fù)雜催化機制的酶的設(shè)計奠定了基礎(chǔ)。近年來,各類新的深度學(xué)習(xí)算法不斷涌現(xiàn),在新催化中心設(shè)計、蛋白質(zhì)骨架構(gòu)建和氨基酸序列生成等方面展現(xiàn)出強大的能力,顯著提升了人工酶的設(shè)計成功率。這些人工酶的構(gòu)建不僅有效地擴展了酶的序列和結(jié)構(gòu)多樣性,也為理解蛋白質(zhì)序列與功能之間的映射關(guān)系、蛋白動力學(xué)和催化活性之間的關(guān)系提供了新的研究途徑。隨著人工酶在穩(wěn)定性、專一性及催化效率等方面不斷接近甚至超越天然酶,高性能人工酶有望替代天然酶,在醫(yī)藥合成、食品加工、生物能源、環(huán)境治理等關(guān)鍵領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用,推動相關(guān)產(chǎn)業(yè)技術(shù)的深度變革與創(chuàng)新發(fā)展。
參考文獻:
[1] MADANI A,MCCANNB,NAIKN,etal.ProGen:Languagemodeling for protein generation[EB/OL]. (2020-03- 07)[2020-05-29].https://www.biorxiv.org/content/10.1101/ 2020.03.07.982272v2.
[2] MADANI A,KRAUSEB,GREENEER,etal.Large language models generate functional protein sequences across diverse families[J].Nature Biotechnology,2023, 41(8): 1099-1106.
[3] ANISHCHENKOI,PELLOCKSJ,CHIDYAUSIKU M, et al. De novo protein design by deep network hallucination[J]. Nature,2021, 600(7889): 547-552.
[4] WANG J,LISANZA S, JUERGENSD, et al. Scaffolding protein functional sites using deep learning[J].Science, 2022,377:387-394.
[5] WATSONJL,JUERGENSD, BENNETT NR,et al. De novo design of protein structure and function with RFdiffusion[J].Nature,2023, 620(7976):1089-1100.
[6] DAUPARASJ,ANISHCHENKOI,BENNETTN,etal. Robust deep learning-based protein sequence design using ProteinMPNN[J].Science,2022,378(6615): 49-56.
[7] DAUPARASJ,LEEGR,PECORAROR,etal.Atomic context-conditioned protein sequence design using LigandMPNN[J].NatureMethods,2025,22:717-723.
[8] SUMIDAKH,NUNEZ-FRANCOR,KALVETI, etal. Improvingproteinexpression,stability,and functionwith ProteinMPNN[J].Journalof theAmericanChemicalSociety,2024,146(3): 2054-2061.
[9] JOHNSON SR,F(xiàn)U X, VIKNANDER S,et al. Computational scoring and experimental evaluation of enzymes generated by neural networks[J].Nature Biotechnology,2025, 43:396-405.
[10] KALVET I,ORTMAYER M, ZHAO J,et al.Design ofheme enzymes with a tunable substrate binding pocket adjacent to an open metal coordination site[J]. Journal of theAmerican Chemical Society,2023,145(26):14307- 14315.
[11] YEHAH W,NORNC,KIPNISY,et al. De novo design ofluciferases using deep learning[J].Nature,2023, 614(7949): 774-780.
[12] REMYA R S, RAMALAKSHMI N, NALINI C N, et al. Design synthesis and in vitro evaluation of tacrine-flavone hybrids as multifunctional cholinesterase inhibitors for Alzheimer's disease[J]. Current Computer-Aided Drug Design,2022,18(4): 271-292.
[13] TIANM, TIAN Z,YAO D, et al.A NIR fluorescent probe for fatty acid amide hydrolase bioimaging and its application in development of inhibitors[J].Journal of Materials Chemistry B,2021,9(32): 6460-6465.
[14] HAN X,LIU W,HUANG JW,et al. Structural insight into catalytic mechanismofPEThydrolase[J].Nature Communication,2017,8:2106.
[15] SULAIMAN S,YOU D J,KANAYA E,et al. Crystal structure and thermodynamic and kinetic stabilityof metagenome-derived LC-cutinase[J].Biochemistry,2014, 53(11): 1858-1869.
[16] DU S,KRETSCH R C,PARRES-GOLD J,et al. Conformational ensembles reveal the origins of serine protease catalysis[J]. Science,2025,387(6735):eado5068.
[17] ROBLES-MARTIN A, AMIGOT-SANCHEZ R, FERNANDEZ-LOPEZ L,et al. Sub-micro- and nano-sized polyethylene terephthalate deconstruction with engineered protein nanopores[J]. Nature Catalysis,2023,6(12):1174- 1185.
[18] LAUKO A,PELLOCK SJ, SUMIDAKH, et al. Computational design of serine hydrolases[J]. Science,2025, 388(5744): eadu2454.
[19] BAR-EVENA,NOORE,SAVIRY, et al. The moderately efficient enzyme:Evolutionaryand physico-chemical trends shaping enzyme parameters[J].Biochemistry,2011, 50(21): 4402-4410.
[20] DINGY,ZHANG S,KONGX,et al.Replicating PET hydrolytic activity by positioning active sites with smaller synthetic protein scaffolds[J]. Advanced Science,2025, 12(18): 2500859.
Recent Advances in Artificial Intelligence-Enabled Design of Serine Hydrolases
ZHANG Yifei,DING Yujing,SHE Ao (State Key Laboratory of Chemical Resources Engineering, Beijing Advanced Innovation Center for Soft Mater Science and Engineering, Beijing University of Chemical Technology, Beijing l0oo29, China)
Abstract:Recent advances in artificial intelligence have revolutionized the structure predictionand functional design of proteins,providing novel methodsand tools for the de novo design of artificial enzymes.Serine hydrolases have emergedas arepresentative model in the task of artificial enzyme design due to their well-defined catalytic mechanism.This reviewsummarizes key deep learning algorithms recently developed for artificial enzyme engineering andhighlights their typical applications,witha focusonthe latest successs in designingartificial serine hydrolases. These breakthroughs pave the way for the development of artificial enzymes with enhanced catalytic eficiency and stability, marking a new stage in enzyme design that could transform biomanufacturing and related industries.
Key words: artificial intelligence;computational enzyme design;deep learning; protein enginering;serine hydrolase
(責(zé)任編輯:李娟)