金交羽,周佳海
(中國科學(xué)院深圳理工大學(xué),深圳合成生物學(xué)創(chuàng)新研究院,中國科學(xué)院定量工程生物學(xué)重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518055)
DNA 由4 種不同的脫氧單磷酸核苷(dNMPs)構(gòu)成,dNMPs 的區(qū)別在于分子結(jié)構(gòu)中堿基的不同。這4 種堿基分別為:胞嘧啶(Cytosine,C)、胸腺嘧啶(Thymine,T)、腺嘌呤(Adenine,A)和鳥嘌呤(Guanine,G)。DNA的堿基上可以被添加各種化學(xué)基團(tuán),其中包括甲基、羥基、氨基酸、多胺、單糖和雙糖等[1]。目前報(bào)道的堿基修飾已經(jīng)超過了50 種[2]。在真核生物中,DNA 的堿基修飾可以在不改變基因型的情況下影響基因的表達(dá)表型,部分堿基被修飾過的DNA 可以通過與蛋白質(zhì)間的形成相互作用使DNA 免于被降解,并參與基因的調(diào)控[3]。比如研究得比較充分的胞嘧啶甲基化,甲基轉(zhuǎn)移酶基因能夠與限制性內(nèi)切酶基因形成配對,在破壞外源DNA 的同時可保護(hù)自身的DNA 免受限制性內(nèi)切酶的切割[4]。盡管DNA 的堿基修飾種類繁多,但大多數(shù)遵循經(jīng)典的Watson-Crick堿基互補(bǔ)配對原則[4-5]。
1977 年,Ivan Khudyakov 等[6]從噬菌體(cyanophage)S-2L 的基因組分離和鑒定出一種特殊的堿基--2,6-二氨基嘌呤(Z)。與典型的腺嘌呤堿基(A)相比,Z 堿基在嘌呤分子的2號碳原子上多出一個氨基基團(tuán)。在經(jīng)典的Watson-Crick堿基互補(bǔ)配對原則中,A 和T形成2根氫鍵[圖1(a)],G和C形成3 根氫鍵[7]。研究發(fā)現(xiàn),S-2L 的基因組中的Z完全取代了A,并與T 互補(bǔ)配對形成3 根氫鍵,Z堿基額外的氨基可與T形成第三根氫鍵[圖1(b)],從而增加DNA 雙螺旋結(jié)構(gòu)的熱穩(wěn)定性[8]。此后,多家研究單位,包括法國巴斯德研究所,都向Ivan Khudyakov 索要噬菌體S-2L 及其宿主。2002年,法國巴斯德研究所的研究者將噬菌體S-2L 進(jìn)行測序,并把它的序列及潛在的應(yīng)用申請了專利(WO2003093461)。他們在專利中推測,噬菌體基因組中腺苷琥珀酸合成酶(PurA)的同源蛋白可能參與Z堿基的生物合成。但多年來,此蛋白的功能一直沒有被闡釋清楚,且dZTP 是如何被選擇性地整合到噬菌體S-2L 的DNA 上等生物學(xué)問題也沒有得到更深入研究。
圖1 胸腺嘧啶與腺嘌呤、二氨基嘌呤形成的氫鍵作用Fig.1 Thymine forms hydrogen bonds with adenine and diaminopurine
2021 年4 月30 日,上??萍即髮W(xué)趙素文助理教授、天津大學(xué)張雁教授和伊利諾伊大學(xué)厄巴納-香檳分校/新加坡科技研究局趙惠民教授合作在Science上發(fā)表了題為“A widespread pathway for substitution of adenine by diaminopurine in phage genomes”的論文,報(bào)道了參與Z 堿基生物合成的多酶系統(tǒng),闡明了以dGTP 為起點(diǎn),一步步轉(zhuǎn)化為可被DNA聚合酶利用的dZTP的完整路徑,并提出噬菌體的Z-基因組能夠幫助逃避宿主限制性內(nèi)切酶攻擊的基礎(chǔ)[9]。
由于NCBI數(shù)據(jù)庫中并無噬菌體S-2L的基因組注釋,合作團(tuán)隊(duì)首先對噬菌體S-2L 的基因組進(jìn)行了注釋,順利發(fā)現(xiàn)了此前專利中所提到的PurA 同源蛋白,并將該酶命名為PurZ。接下來以EcPurA為模板,構(gòu)建CpPurZ的結(jié)構(gòu)模型,并與EcPurA的活性口袋進(jìn)行比對,發(fā)現(xiàn)EcPurA 中的催化殘基Asp13 在CpPurZ 中對應(yīng)的是Ser15,這個殘基正好對著嘌呤的2 號碳,因此他們推測Asp 到Ser 的突變正好可以容納比腺嘌呤更大的片段。這一推測被接下來的分子對接所驗(yàn)證,分子對接的結(jié)果表明,CpPurZ 及其在其他噬菌體中的同源蛋白(ApPurZ、SbPurZ、VpPurZ 和SpPurZ)的底物可能是dGMP/GMP 和ATP。他們利用質(zhì)譜實(shí)驗(yàn)對幾種PurZs 酶活性反應(yīng)的中間體和產(chǎn)物進(jìn)行定性和定量的檢測,最終發(fā)現(xiàn)4 種PurZs 在鎂離子存在時,以dGMP、ATP 和L-天冬氨酸為底物生成2-氨基脫氧單磷酸腺苷琥珀酸(ADAS)。由于這些噬菌體中并不存在嘌呤從頭合成通路中的腺苷琥珀酸裂解酶(PurB),因此他們推測宿主菌中的PurB應(yīng)該具有一定的泛雜性,可以將ADAS裂解為dZMP和延胡索酸。隨后他們使用大腸桿菌的EcPurB 進(jìn)行了假設(shè)驗(yàn)證,發(fā)現(xiàn)它的確可以將ADAS 裂解為dZMP和延胡索酸(圖2)。
圖2 dZMP的生物合成通路Fig.2 Biosynthetic pathway for dZMP
合作團(tuán)隊(duì)通過構(gòu)建PurZ 編碼基因的基因組鄰近區(qū)相似性網(wǎng)絡(luò),發(fā)現(xiàn)PurZ 編碼基因周圍存在2個功能相關(guān)基因。其中一個基因編碼的蛋白屬于金屬依賴的磷酸水解酶HD 家族。該蛋白的功能隨后被證實(shí)為dATP 磷酸水解酶(因此被命名為dATPase),它可在鈷離子的存在下,將dATP/dADP/dAMP 水解為磷酸和2'-脫氧腺苷(dA)。dATPase 的生物學(xué)功能是不可逆地降低宿主菌中的dATP 的濃度。而另一個基因編碼了屬于DUF550家族的蛋白。經(jīng)實(shí)驗(yàn)證明,DUF550 為脫氧嘌呤核苷三磷酸的焦磷酸水解酶,可在鈷離子的存在下,將dATP/dGTP 水解為dAMP/dGMP 和焦磷酸。因此,DUF550 一方面可以降低宿主細(xì)胞中的dATP濃度,另一方面可以為PurZ 提供反應(yīng)底物dGMP。綜合來看,dATPase 和DUF550 都發(fā)揮了降低宿主菌中dATP濃度的作用,這使得噬菌體的DNA聚合酶更容易優(yōu)先選擇熱力學(xué)上更穩(wěn)定的dZTP,來進(jìn)行噬菌體DNA的合成。
同時,他們還發(fā)現(xiàn)細(xì)菌中的GMP 激酶能夠?qū)ZMP 磷酸化生成dZDP 及dZTP,dZTP 從而可能被噬菌體的DNA 聚合酶利用,與dTTP、dGTP 及dCTP一起參與Z-基因組的合成(圖3)。
圖3 推測的Z-基因組生物合成通路Fig.3 Proposed biosynthetic pathway for Z-genome in phage
合作團(tuán)隊(duì)通過酶解法水解含有Z-基因組的Acinetobacterphage SH-Ab 15497(由上海交通大學(xué)醫(yī)學(xué)院的何平教授提供)DNA,并使用HPLCMS 檢測水解產(chǎn)物發(fā)現(xiàn),噬菌體DNA 中的確存在2'-脫氧2-氨基腺苷(dZ),MS/MS結(jié)果也可以觀察到Z 堿基的存在。同樣的水解產(chǎn)物用HPLC-UV 檢測發(fā)現(xiàn),dZ/dT和dC/dG的比值分別為0.99和1.05。他們使用納米孔測序法對含有Z-基因組的Acinetobacterphage SH-Ab 15497 進(jìn)行測序,結(jié)果顯示dZTP 被整合到噬菌體的DNA 上。 對Acinetobacterphage SH-Ab 15497 的DNA 進(jìn)行 的 限制性內(nèi)切酶實(shí)驗(yàn)表明,識別序列中含有A 的限制性內(nèi)切酶EcoRI、PstI和Sau3AI 并不能切開噬菌體的DNA,其中Sau3AI在該噬菌體的DNA上含有超過200 個識別位點(diǎn)[10]。這些結(jié)果表明,Z 完全取代了A,并且Z-基因組賦予噬菌體能夠躲避宿主限制性內(nèi)切酶攻擊的優(yōu)勢。
Z-基因組生物合成通路的解析,為科學(xué)家研究DNA 的修飾、結(jié)構(gòu)、組裝與調(diào)控等打開了一扇新的大門。多個含Z-基因組的活性生物體發(fā)現(xiàn),使通過生物方法制備含Z 堿基的新型核酸產(chǎn)品得以實(shí)現(xiàn),也將促進(jìn)含Z 堿基的DNA 納米技術(shù)開發(fā)。在用核酸構(gòu)建人工設(shè)計(jì)的結(jié)構(gòu)中,一旦A堿基被Z 堿基所替代,將會在對應(yīng)的堿基配對處增加一對氫鍵的鍵能,這對于核酸鏈的穩(wěn)定性和結(jié)構(gòu)產(chǎn)生明顯的影響,許多新的DNA 折紙結(jié)構(gòu)將被設(shè)計(jì)出來。在基于DNA 的數(shù)據(jù)存檔研究中[11],當(dāng)Z 堿基被用于替代A 堿基后,能夠躲避宿主限制性內(nèi)切酶攻擊,提高了儲存數(shù)據(jù)在活體細(xì)胞中的穩(wěn)定性,而數(shù)據(jù)的讀取可以通過納米孔測序技術(shù)獲得且質(zhì)量不受影響。另外,這項(xiàng)工作也有望應(yīng)用到合成生物學(xué)領(lǐng)域,如通過將Z-基因組生物合成酶結(jié)合到工程噬菌體中,特別是已成功應(yīng)用于多耐藥細(xì)菌的臨床治療并挽救了患者生命的那些噬菌體中[12-13],或許可以擴(kuò)大這些噬菌體的宿主范圍。
Science上同期報(bào)道了兩項(xiàng)來自法國的Z-基因組相關(guān)研究工作,其中一篇文章的主要發(fā)現(xiàn)與趙素文等的結(jié)果類似,但是用了較多的篇幅在描述PurZ 蛋白及其系列復(fù)合物的晶體結(jié)構(gòu)信息[14];另一篇文章則側(cè)重于DNA 聚合酶DpoZ 的發(fā)現(xiàn)和鑒定,研究結(jié)果表明在復(fù)制階段該酶催化dZTP 加到鏈上的活性比dATP 強(qiáng)[15]。Z-基因組生物中所發(fā)現(xiàn)的DNA 聚合酶能夠容忍非經(jīng)典堿基對的能力是非常值得關(guān)注的,在Watson-Crick經(jīng)典堿基配對原則得到擴(kuò)充的同時保持DNA 復(fù)制的高保真度,這對維持生命有機(jī)體遺傳信息的完整性具有非常重要的意義。值得一提的是,2021 年4 月23 日Nature Communications發(fā)表的一篇文章報(bào)道了dATP 磷酸水解酶DatZ 的系列晶體結(jié)構(gòu)和一個疑似聚合酶PrimPol 的晶體結(jié)構(gòu)[16],不過PrimPol 對催化dZTP與dATP 加到鏈上的活性沒有區(qū)分度,這一點(diǎn)與前面提到的DpoZ不同。