王雁南,孫宇輝
(武漢大學(xué)藥學(xué)院,組合生物合成與新藥發(fā)現(xiàn)教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430071)
自DNA 雙螺旋結(jié)構(gòu)發(fā)現(xiàn)和重組DNA 技術(shù)發(fā)明以來(lái),人們對(duì)于如何高效地實(shí)現(xiàn)基因的精準(zhǔn)分析和定向改造的探索就不曾停止過(guò)。基于CRISPR/Cas 系統(tǒng)開發(fā)的一系列基因編輯工具,因其靈活、高效、普適的特點(diǎn)得到了非常廣泛的應(yīng)用,2020年諾貝爾化學(xué)獎(jiǎng)授予對(duì)CRISPR/Cas 系統(tǒng)的發(fā)現(xiàn)和發(fā)展做出重要貢獻(xiàn)的Emmanuelle Charpentier 和Jennifer Doudna,更使CRISPR/Cas 系統(tǒng)及其相關(guān)技術(shù)受到了人們的矚目和厚望。
原核生物的CRISPR/Cas 系統(tǒng)是一類可遺傳的適應(yīng)性免疫系統(tǒng),它可以存儲(chǔ)原核生物曾被感染的信息,當(dāng)再次被感染時(shí),可利用RNA 引導(dǎo)的核酸酶破壞噬菌體遺傳物質(zhì),從而發(fā)揮防御或免疫功能。人們將該系統(tǒng)中成簇規(guī)律間隔的短回文重復(fù)序列命名為CRISPR(clustered regularly interspaced short palindromic repeats)序列,而將一些鄰近CRISPR 序列且具有特征性的相關(guān)基因命名為Cas(CRISPR?associated gene)[1]。CRISPR/Cas 系統(tǒng)被用作基因編輯工具時(shí),通常由單鏈引導(dǎo)RNA(single guide RNA, sgRNA)引導(dǎo)Cas 蛋白結(jié)合在目標(biāo)位點(diǎn)并產(chǎn)生雙鏈斷裂(double strand break,DSB),隨后經(jīng)細(xì)胞的同源修復(fù)(homology?directed repair, HDR)介導(dǎo)精準(zhǔn)編輯或非同源末端連接修復(fù)(nonhomologous end?joining, NHEJ)引入插入和缺失(insertions and deletions, Indels)等突變,從而實(shí)現(xiàn)對(duì)目標(biāo)序列的靶向編輯[2?3]。盡管CRISPR/Cas 系統(tǒng)相比于以往基因編輯技術(shù),已經(jīng)展現(xiàn)出巨大優(yōu)勢(shì)和成功,但人們發(fā)現(xiàn)CRISPR/Cas 系統(tǒng)在使用時(shí)仍存在不少問(wèn)題,例如在對(duì)人類遺傳疾病中最常見的遺傳變異--點(diǎn)突變[4]進(jìn)行編輯修復(fù)或是構(gòu)建遺傳疾病模型時(shí),依靠HDR 進(jìn)行修復(fù)的策略編輯效率較低,并且在應(yīng)用時(shí)還存在一系列的限制條件。此外,Cas 蛋白可能會(huì)在脫靶位點(diǎn)產(chǎn)生雙鏈斷裂,甚至目標(biāo)位點(diǎn)DNA 修復(fù)途徑的活化都可能對(duì)細(xì)胞產(chǎn)生不利影響[5?6]。因此,一種無(wú)需引入雙鏈斷裂即可實(shí)現(xiàn)堿基轉(zhuǎn)換的基因編輯工具--堿基編輯器(base editor, BE)應(yīng)運(yùn)而生[7]。該工具通過(guò)將胞苷或腺苷脫氨酶以及其他功能元件與失去雙鏈切割活性的Cas 蛋白相融合,由sgRNA引導(dǎo),實(shí)現(xiàn)對(duì)基因組上目標(biāo)位置的胞嘧啶或腺嘌呤的堿基轉(zhuǎn)換。堿基編輯技術(shù)一經(jīng)問(wèn)世,便在生物學(xué)、醫(yī)學(xué)等領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。
合成生物學(xué)是近些年發(fā)展日益蓬勃的交叉學(xué)科,它將工程原理應(yīng)用于對(duì)生命系統(tǒng)的研究和改造,以期對(duì)細(xì)胞行為進(jìn)行創(chuàng)建、編程和控制。合成生物學(xué)在過(guò)去數(shù)十年中,在化工、能源、材料、農(nóng)業(yè)、環(huán)境和醫(yī)藥等領(lǐng)域已展露出巨大的生命力。隨著合成生物學(xué)的發(fā)展,越來(lái)越多的化合物可以通過(guò)改造培養(yǎng)微生物獲得,人們也在不斷追求高效精準(zhǔn)地改造微生物的能力。而CRISPR/Cas 系統(tǒng)的人工靶向可設(shè)計(jì)性等優(yōu)點(diǎn)受到了合成生物學(xué)領(lǐng)域研究者的青睞,基于CRISPR/Cas 系統(tǒng)開發(fā)的堿基編輯技術(shù)在保留上述CRISPR/Cas 系統(tǒng)優(yōu)點(diǎn)的同時(shí),避免了對(duì)目標(biāo)位點(diǎn)DNA 造成雙鏈斷裂,降低了基因編輯產(chǎn)生的細(xì)胞毒性。因此,本文對(duì)目前已開發(fā)的幾類主要的DNA 堿基編輯器的發(fā)展和工作原理進(jìn)行了闡述,并重點(diǎn)介紹了堿基編輯器靶向范圍受限和拓展措施,以及造成的脫靶編輯的檢測(cè)和優(yōu)化兩方面內(nèi)容。同時(shí),本文還介紹了我國(guó)部分科研工作者在微生物合成生物學(xué)領(lǐng)域運(yùn)用堿基編輯技術(shù)的一些應(yīng)用,并展望了堿基編輯技術(shù)的發(fā)展及其在微生物合成生物學(xué)領(lǐng)域的應(yīng)用前景。
1.1.1 胞嘧啶堿基編輯器和腺嘌呤堿基編輯器的發(fā)展
DNA 堿基編輯器最初是由美國(guó)哈佛大學(xué)David R. Liu 研究團(tuán)隊(duì)于2016 年開發(fā)的一種基因編輯工具[7],其開發(fā)的胞嘧啶堿基編輯器(cytosine base editor, CBE)可以實(shí)現(xiàn)堿基對(duì)C?G 到T?A 的轉(zhuǎn)換。他們將大鼠來(lái)源的胞苷脫氨酶APOBEC1 通過(guò)一段XTEN linker 連接在dCas9(含D10A 和H840A 突變)的N 端,得到的第一代堿基編輯器BE1通過(guò)sgRNA引導(dǎo)結(jié)合在目標(biāo)位點(diǎn),由dCas9打開雙鏈DNA形成DNA:RNA R?loop結(jié)構(gòu)。胞苷脫氨酶對(duì)暴露出的單鏈DNA 上局部的胞嘧啶脫氨,形成尿嘧啶。U·G 堿基對(duì)隨后經(jīng)過(guò)體內(nèi)DNA 修復(fù)或復(fù)制依次形成U·A、T?A 堿基對(duì),即在DNA 非靶標(biāo)鏈上4~8 號(hào)位的窗口內(nèi)(將NGG PAM 所在位置定義為21~23,下同)實(shí)現(xiàn)了C 到T 的轉(zhuǎn)換。較低的編輯效率可能是由于體內(nèi)的尿嘧啶DNA 糖基化酶(uracil DNA glycosylase, UDG)切除了脫氨形成的U,使得DNA 被修復(fù)回C?G 堿基對(duì)。于是該團(tuán)隊(duì)將抑制UDG活性的尿嘧啶DNA糖基化酶抑制劑(uracil DNA glycosylase inhibitor, UGI)連接于BE1 中dCas9 的C 端,得到的第二代堿基編輯器BE2 編輯活性有了明顯的提升。而第三代堿基編輯器BE3 則是將BE2 中的dCas9 替換為nCas9(D10A),通過(guò)在DNA 靶標(biāo)鏈上產(chǎn)生切刻,使DNA 以發(fā)生脫氨后的DNA 非靶標(biāo)鏈為模板進(jìn)行修復(fù),進(jìn)一步提升了堿基編輯的效率,而且僅產(chǎn)生了1.1%的Indels突變(表1)。
表1 代表性堿基編輯器比較Table 1 Comparison of representative base editors
隨后,David R. Liu研究團(tuán)隊(duì)[30]通過(guò)更換BE3各功能元件之間的linker,并在UGI 的C 端再連接一個(gè)UGI,得到的第四代堿基編輯器BE4進(jìn)一步提高了堿基編輯的效率。在BE4 的N 端連接來(lái)自噬菌體Mu 的Gam 蛋白,利用Gam 蛋白結(jié)合雙鏈斷裂的DNA 末端,使DNA 免于降解,BE4?Gam 相比BE4降低了Indels突變的產(chǎn)生頻率,并且BE4和BE4?Gam 均提高了C 轉(zhuǎn)換為T 的產(chǎn)物純度。此外,他們還通過(guò)在BE4 兩端加上核定位信號(hào),并對(duì)BE4 進(jìn)行密碼子優(yōu)化及祖先序列重構(gòu)(ancestral reconstruction),由此獲得的BE4max 和AncBE4 max 成為目前編輯效率最高的CBE 之一[10]。巧合的是,同在2016 年,日本神戶大學(xué)Akihiko Kondo研究團(tuán)隊(duì)[8]也報(bào)道了他們研發(fā)的Target?AID(activation?induced cytidine deaminase)胞嘧啶堿基編輯器,由nCas9 (D10A)的C 端連接七鰓鰻來(lái)源的胞苷脫氨酶(Petromyzon marinuscytidine deaminase 1,PmCDA1)和UGI 組成,其編輯窗口相比于BE3更靠近PAM遠(yuǎn)端的2~4號(hào)位。
2017 年,David R. Liu 研究團(tuán)隊(duì)[22]進(jìn)一步報(bào)道了可以實(shí)現(xiàn)堿基對(duì)A?T到G?C轉(zhuǎn)換的腺嘌呤堿基編輯器(adenine base editor, ABE)。與CBE 不同,自然界未發(fā)現(xiàn)以DNA 為底物的腺苷脫氨酶,于是該研究團(tuán)隊(duì)通過(guò)定向進(jìn)化和蛋白質(zhì)工程使大腸桿菌tRNA 腺苷脫氨酶(Escherichia colitRNA adenosine deaminase,ecTadA)克服了這一限制,利用二聚的TadA 與nCas9(D10A)相連接,并通過(guò)一系列優(yōu)化,獲得了腺嘌呤堿基編輯器ABE7.10(wtTadA?TadA*?nCas9,*表示蛋白變體)。ABE7.10在sgRNA 引導(dǎo)下結(jié)合在目標(biāo)位點(diǎn),由nCas9 打開雙鏈DNA,二聚的TadA 對(duì)暴露的單鏈DNA 上局部的腺嘌呤脫氨,形成次黃嘌呤I,經(jīng)過(guò)體內(nèi)的錯(cuò)配修復(fù)和復(fù)制過(guò)程,I·T 堿基對(duì)依次轉(zhuǎn)換為I·C,G?C 堿基對(duì),實(shí)現(xiàn)在DNA 非靶標(biāo)鏈上4~7 號(hào)位編輯窗口內(nèi)A到G的轉(zhuǎn)換,產(chǎn)物純度極高,且該過(guò)程中Indels 突變的發(fā)生頻率幾乎可以忽略不計(jì)。之后,David R. Liu 研究團(tuán)隊(duì)[10]一直在設(shè)法提高ABE 的編輯效率,通過(guò)在ABE7.10 兩端添加核定位信號(hào)和密碼子優(yōu)化,獲得了活性更強(qiáng)的ABEmax。進(jìn)一步通過(guò)對(duì)TadA?7.10 使用噬菌體輔助進(jìn)化方法進(jìn)行優(yōu)化,獲得的ABE8e 催化速率相比ABE7.10提高了590倍,顯示出編輯活性以及與各種Cas蛋白變體和同系物兼容性的大幅提升,由此帶來(lái)更多的脫靶編輯也可以通過(guò)在TadA?8e中引入V106W突變來(lái)加以改善[23]。
1.1.2 其他堿基編輯器的發(fā)展
隨著CBE 和ABE 相繼問(wèn)世,越來(lái)越多的堿基編輯需求寄望于依靠堿基編輯器來(lái)實(shí)現(xiàn),但是CBE和ABE僅能實(shí)現(xiàn)在目標(biāo)位點(diǎn)C?G到T?A或A?T到G?C 的堿基對(duì)轉(zhuǎn)換,無(wú)法實(shí)現(xiàn)其他堿基之間的轉(zhuǎn)變。于是人們自然想到通過(guò)將胞苷脫氨酶和腺苷脫氨酶一起融合在nCas9的同側(cè)或兩側(cè),獲得的ACBE(fusion adenine and cytocine base editor)可以同時(shí)實(shí)現(xiàn)目標(biāo)位點(diǎn)C?G 到T?A 和A?T 到G?C 堿基對(duì)的轉(zhuǎn)換[26,31?35]。人們將融合了胞苷脫氨酶和腺苷脫氨酶的版本ACBE在哺乳動(dòng)物細(xì)胞和植物細(xì)胞中進(jìn)行了測(cè)試,并對(duì)系統(tǒng)中的其他因素,例如蛋白之間的linker 及sgRNA 的長(zhǎng)度進(jìn)行了系統(tǒng)的考察,發(fā)現(xiàn)這些ACBE都具有較低的脫靶活性。除了將兩個(gè)不同的脫氨酶與nCas9融合的策略,也有研究團(tuán)隊(duì)利用普通版本的CBE 或ABE 并通過(guò)在sgRNA 上引入MS2 RNA 適配體招募另一種脫氨酶的策略,也可以實(shí)現(xiàn)ACBE 的相似功能[27]。這些ACBE 豐富了目標(biāo)位點(diǎn)堿基轉(zhuǎn)換的產(chǎn)物種類,在遺傳疾病的治療、細(xì)胞譜系追蹤以及基因隨機(jī)突變領(lǐng)域都具有巨大的應(yīng)用前景[26,31?35]。
在堿基編輯器的研究和應(yīng)用過(guò)程中,人們發(fā)現(xiàn)CBE 和ABE 不僅僅介導(dǎo)C 到T 或A 到G 的堿基轉(zhuǎn)換,還可能會(huì)引起C 到G 或C 到A 的堿基顛換[36?38]。通過(guò)分析,發(fā)現(xiàn)這一現(xiàn)象可能由于C脫氨后形成的U 被UDG 切除形成AP 位點(diǎn)(apurinic/apyrimidinic site)后,經(jīng)歷細(xì)胞內(nèi)的堿基切除修復(fù)過(guò)程而導(dǎo)致。于是人們利用UDG 替代CBE 中的UGI,促進(jìn)細(xì)胞切除C 脫氨形成的U,提高了C 堿基顛換的效率。由此開發(fā)的GBE(glycosylase base editors)和CGBE(C?to?G base editors)可以實(shí)現(xiàn)哺乳動(dòng)物細(xì)胞內(nèi)C 到G[28,39],以及大腸桿菌中C 到A 的堿基顛換[39]。此外,有研究利用參與堿基切除修復(fù)途徑的rXRCC1蛋白,以及改善影響C 到G 轉(zhuǎn)變過(guò)程的其他因素,開發(fā)了不同版本的CGBE[29,40?41]。雖然相繼有這一類堿基編輯器的開發(fā)被報(bào)道,但是細(xì)胞內(nèi)C到G的轉(zhuǎn)變過(guò)程并未揭示清晰,這也使得該堿基編輯器在研究和使用過(guò)程中遇到的一些問(wèn)題還難以解答,如GBE 在哺乳動(dòng)物細(xì)胞和大腸桿菌中產(chǎn)生了不同的編輯結(jié)果[39]。不過(guò)隨著該過(guò)程的機(jī)制被逐漸闡明,更多更高效的CGBE版本有望被開發(fā)出來(lái)。
此外,人們還開發(fā)了可以同時(shí)編輯DNA 雙鏈的堿基編輯器:David R. Liu 研究團(tuán)隊(duì)通過(guò)將能對(duì)DNA雙鏈中的胞嘧啶進(jìn)行脫氨的細(xì)菌間毒素DddA蛋白拆分成兩個(gè)部分,并分別與靶向定位作用的轉(zhuǎn)錄激活因子樣效應(yīng)物(transcription activator?like effector, TALE)或者不同的Cas 蛋白以及UGI 融合,可以實(shí)現(xiàn)當(dāng)兩個(gè)定位蛋白在DNA 上結(jié)合位置相距較近時(shí),聚合的DddA 可以對(duì)兩者之間的DNA 雙鏈上的C 同時(shí)進(jìn)行脫氨。而其他情況下,兩個(gè)拆分的DddA 無(wú)法在體內(nèi)聚合,大大降低了該編輯工具的細(xì)胞毒性[20]。其中,將拆分的DddA與兩個(gè)TALE融合得到的堿基編輯器DdCBEs(RNA?free DddA?derived cytosine base editors),因無(wú)需RNA 引導(dǎo)便可發(fā)揮作用,使其可以對(duì)無(wú)法通過(guò)CRISPR/Cas系統(tǒng)進(jìn)行編輯的線粒體DNA 和葉綠體DNA實(shí)現(xiàn)有效的編輯[42]。但是,人們通過(guò)全基因組測(cè)序方法檢測(cè)到DdCBE 會(huì)在細(xì)胞核內(nèi)造成大量的DNA脫靶編輯[43]。而將分裂的DddA與兩個(gè)不同的Cas蛋白[如dSpCas9和SaKKH?Cas9(D10A)]融合之后形成的編輯器,由于系統(tǒng)過(guò)于繁復(fù),反而使得其應(yīng)用變得有限。韓國(guó)首爾國(guó)立大學(xué)Jin?Soo Kim 研究團(tuán)隊(duì)[21]也發(fā)表了類似的工作,他們開發(fā)的鋅指脫氨酶(zinc finger deaminase, ZFD)將分裂的DddA 與鋅指DNA 結(jié)合蛋白(zinc?finger DNA binding protein)相融合,也能在核DNA和線粒體DNA 上實(shí)現(xiàn)類似的編輯。之后,Jin?Soo Kim研究團(tuán)隊(duì)[44]在DdCBE 的基礎(chǔ)上結(jié)合腺苷脫氨酶TadA,經(jīng)歷一系列優(yōu)化改造,開發(fā)出了可以在線粒體基因組實(shí)現(xiàn)A 到G 轉(zhuǎn)化的堿基編輯器TALED(TALE?linked deaminase)。
1.1.3 RNA堿基編輯器的發(fā)展
除了DNA 堿基編輯器,人們也開發(fā)了一系列RNA 堿基編輯器來(lái)避免DNA 編輯所帶來(lái)的遺傳信息不可逆改變以及安全與倫理問(wèn)題。RNA 堿基編輯使用的脫氨酶大多來(lái)自ADAR (adenosine deaminases that act on RNA)家族的腺苷脫氨酶,ADAR 包含獨(dú)特的RNA 結(jié)合基序,識(shí)別定位雙鏈RNA 的部分區(qū)域,ADAR 脫氨酶域(ADAR deaminase domain, ADARDD)將腺苷脫去氨基,實(shí)現(xiàn)A 到I 的轉(zhuǎn)變[45?46]。人們利用引入發(fā)夾結(jié)構(gòu)或者化學(xué)修飾的反義RNA 與目標(biāo)RNA 互補(bǔ),供融合了其他蛋白結(jié)合域或標(biāo)簽的ADARDD結(jié)合[47?53],并將需要編輯的腺苷對(duì)側(cè)的反義RNA 設(shè)計(jì)為非互補(bǔ)的胞苷,提高更傾向在A·C 錯(cuò)配處脫氨的ADAR在目標(biāo)腺苷處的編輯效率[50],這一策略被應(yīng)用于大多數(shù)RNA 堿基編輯器的設(shè)計(jì)中。而北京大學(xué)魏文勝研究團(tuán)隊(duì)[54]通過(guò)設(shè)計(jì)ADAR 招募RNA(ADAR?recruiting RNA, arRNA)來(lái)招募細(xì)胞內(nèi)天然的ADAR1 或ADAR2 蛋白,實(shí)現(xiàn)目標(biāo)RNA 從A 到I 的轉(zhuǎn)換。美國(guó)哈佛大學(xué)張鋒研究團(tuán)隊(duì)將ADAR2DD與dPspCas13b 融合,通過(guò)RNA 引導(dǎo)至目標(biāo)位點(diǎn),開發(fā)了新的RNA 堿基編輯工具REPAIR(RNA Editing for Programmable A?to?I Replacement)。
REPAIR 對(duì)報(bào)告基因轉(zhuǎn)錄產(chǎn)物的編輯效率高于之前通過(guò)反義RNA 實(shí)現(xiàn)的RNA 堿基編輯,而在細(xì)胞內(nèi)源全轉(zhuǎn)錄本的編輯中,其效率也與之前的技術(shù)相比更好或持平。為了提升REPAIR 的編輯特異性,張鋒研究團(tuán)隊(duì)在ADAR2DD引入了E488Q 和T375G兩個(gè)點(diǎn)突變,開發(fā)出了REPAIRv2,大幅減少了全轉(zhuǎn)錄組水平和目標(biāo)腺苷上下游近端的脫靶編輯,但也一定程度上降低了目標(biāo)位點(diǎn)的編輯效率[55]。他們之后通過(guò)對(duì)ADAR2DD進(jìn)行定向進(jìn)化,開發(fā)出了RESCUE (RNA Editing for Specific C to U Exchange)系統(tǒng),可以實(shí)現(xiàn)目標(biāo)位點(diǎn)RNA 堿基從C 到U 的轉(zhuǎn)換,同時(shí)保留了A 到I 轉(zhuǎn)換的活性,僅需通過(guò)在目標(biāo)核苷酸對(duì)側(cè)的gRNA中設(shè)計(jì)不同的錯(cuò)配核苷酸即可實(shí)現(xiàn)差異化的編輯[56]。除了ADAR家族的脫氨酶,上??萍即髮W(xué)池天研究團(tuán)隊(duì)和中國(guó)科學(xué)院植物生理生態(tài)研究所李軒研究團(tuán)隊(duì)基于APOBEC3A 的RNA 的催化活性,構(gòu)建出可實(shí)現(xiàn)C到U 的RNA 堿基編輯器,其中郝沛研究團(tuán)隊(duì)還基于晶體結(jié)構(gòu)開發(fā)了只具有RNA 催化功能的APOBEC3A(A3A)變體[57?58]。
堿基編輯工具在不引入DNA 雙鏈斷裂的情況下,實(shí)現(xiàn)了高效率的堿基轉(zhuǎn)換(包括顛換),其優(yōu)異的性能使人們希望堿基編輯器可以適用于更多位點(diǎn)的編輯。堿基編輯器可編輯的位點(diǎn)受限于Cas蛋白的定位以及Cas 蛋白打開DNA 雙鏈之后形成的R?loop 與脫氨酶相互作用。人們從這兩方面入手,開發(fā)了一系列具有不同靶向位點(diǎn)和編輯窗口的堿基編輯器。
1.2.1 堿基編輯器靶向位點(diǎn)的拓展
David R. Liu研究團(tuán)隊(duì)[59]通過(guò)將rAPOBEC1與Cas9 的工程變體融合,獲得了可以靶向非NGG PAM 的堿基編輯器SaBE3、Sa(KKH)?BE3、VQR?BE3、VRER?BE3 和EQR?BE3。2018 年,該研究團(tuán)隊(duì)又開發(fā)了可識(shí)別NG、GAA 和GAT PAM 的xCas9,并考察了它與胞苷脫氨酶和腺苷脫氨酶融合后的編輯效果,發(fā)現(xiàn)xCas9 與BE3、ABE7.10(指除了Cas9 蛋白的其余部分)有很好的兼容性,可以靶向它們之前無(wú)法編輯的位點(diǎn),且xCas9(3.7)?ABE 的編輯效率甚至高于ABE7.10[60]。之后,他們通過(guò)定向進(jìn)化獲得了可以識(shí)別NRRH、NRTH和NRCH PAM的Cas9變體,結(jié)合脫氨酶后,使堿基編輯器可以對(duì)PAM 為NR 的位點(diǎn)進(jìn)行編輯[61]。SpCas9?NG 和SpRY 也被用于對(duì)非NGG PAM的位點(diǎn)進(jìn)行堿基編輯,研究發(fā)現(xiàn)nSpCas9?NG?AID(Target?AID?NG)的編輯效率要優(yōu)于xCas9?BE4[12];而融合SpRY 的堿基編輯器幾乎可以獨(dú)立于PAM 靶向目標(biāo)位置[62]。此外,人們還開發(fā)了基于ScCas9 和SmacCas9 的堿基編輯器,分別識(shí)別NNG 和NAAA 序列的PAM[63?65]。除了利用Cas9 蛋白變體拓展靶向位點(diǎn),Cas12a 蛋白也被用于脫氨酶的定位。上??萍即髮W(xué)陳佳研究團(tuán)隊(duì)[11]通過(guò)將rAPOBEC1 與dLbCpf1(dLbCas12a)融合,獲得了可以識(shí)別富含胸腺嘧啶核苷酸PAM(TTTV)的dCpf1?BE。美國(guó)麻省總醫(yī)院J. Keith Joung 研究團(tuán)隊(duì)[66]通過(guò)結(jié)構(gòu)改造獲得了可以識(shí)別非TTTV PAM的AsCas12a 蛋白變體enAsCas12a,其可以引導(dǎo)胞苷脫氨酶(enAsBE)在非TTTV PAM 的靶點(diǎn)進(jìn)行堿基編輯。然而,與這些融合Cas9 變體的CBE 不同,使用Cas9 蛋白變體構(gòu)建的ABE 與經(jīng)典的ABE版本(ABE7.10)相比,大部分的堿基編輯效率較低,可能是因?yàn)門adA 蛋白最初是基于與SpCas9 融合后共同進(jìn)化而來(lái)。此外,美國(guó)Beam Therapeutics公司Giuseppe Ciaramella 研究團(tuán)隊(duì)[67]也通過(guò)基于ABE7.10 的進(jìn)化獲得了TadA*8,其融合SpCas9?NG和SaCas9展現(xiàn)了較高的編輯活性。
1.2.2 堿基編輯器編輯窗口的拓展
通過(guò)更換一些堿基編輯器的Cas蛋白,也可以拓寬堿基編輯器的編輯窗口。如SaABEmax 和SaKKH?ABEmax 編輯器,相較ABEmax(SpCas9)將編輯窗口擴(kuò)大為4~14 號(hào)位[68]。David R. Liu 研究團(tuán)隊(duì)[69]通過(guò)將脫氨酶與不同方式循環(huán)排列的SpCas9(Cas9 circular permutants, Cas9?CPs)相融合,試圖使脫氨酶更容易接觸到單鏈DNA底物。融合獲得的兩個(gè)CP?CBEmax 保持了與CBEmax 一致的編輯活性,而將編輯窗口拓展為4~11 號(hào)位,并且同時(shí)提高了C到T的產(chǎn)物純度。這一結(jié)果印證了循環(huán)排列的SpCas9 的新末端使融合的脫氨酶和UGI 更容易接觸到單鏈DNA 底物,從而擴(kuò)大編輯窗口并阻止UDG 切除U 的推測(cè)。而融合后的CP?ABEmax 將編輯窗口擴(kuò)大到了4~12 號(hào)位,還有一例雖未擴(kuò)大編輯窗口,但是顯示出編輯窗口的平移,并且這些CP?CBEmax 和CP?ABEmax 造成的Indels突變比例均有所下降[68]。
除了可以通過(guò)更換Cas 蛋白靶向更多的位點(diǎn),也可以通過(guò)更換脫氨酶拓展堿基編輯器的編輯窗口,并改變堿基編輯的序列偏好性。中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所高彩霞研究團(tuán)隊(duì)[13]通過(guò)用APOBEC3A 替換APOBEC1,將堿基編輯器的編輯窗口擴(kuò)大到1~17 號(hào)位,并且有效地解決了APOBEC1 偏好編輯T 下游的C(5'?TC?3'基序偏好性),而對(duì)G 下游的C(GC 基序)編輯效率低的問(wèn)題,A3A?PBE 堿基編輯器對(duì)C 上下游序列幾乎沒(méi)有選擇性。融合APOBEC3A 的堿基編輯器也彌補(bǔ)了APOBEC1 脫氨酶無(wú)法對(duì)甲基化的C 進(jìn)行編輯的缺陷[9]。David R. Liu 研究團(tuán)隊(duì)[70]通過(guò)用CDA1 替換APOBEC1,并經(jīng)過(guò)密碼子優(yōu)化構(gòu)建了CDA1?BE4max,將編輯窗口擴(kuò)大到1~9 號(hào)位。將其進(jìn)一步定向進(jìn)化獲得的evoCDA1?BE4max 將編輯窗口擴(kuò)大到1~13 號(hào)位,其與用類似方式優(yōu)化獲得的另外兩個(gè)堿基編輯器evoAPOBEC1?BE4max 和evoFERNY?BE4max 均對(duì)GC 基序中的C 展現(xiàn)良好的編輯活性。美國(guó)萊斯大學(xué)高雪研究團(tuán)隊(duì)[15]通過(guò)利用僅保留C 端結(jié)構(gòu)域的APOBEC3G(A3G)替換APOBEC1,并通過(guò)蛋白質(zhì)工程改造,獲得了A3G?BE4.4、A3G?BE5.13 和A3G?BE5.14 三個(gè)版本的堿基編輯器,將編輯窗口擴(kuò)大到約4~15 號(hào)位,并且在編輯底物為CC 基序的情況下只編輯第二個(gè)C,大幅減少了對(duì)第一個(gè)C 的編輯。上??萍即髮W(xué)黃行許研究團(tuán)隊(duì)[71]通過(guò)優(yōu)化人A3G 蛋白,開發(fā)出的oA3G?BE3 對(duì)CC 和CCC 基序中下劃線所在位置的C的編輯相比BE3更具選擇性。吉林大學(xué)李占軍研究團(tuán)隊(duì)[72]通過(guò)在AID 脫氨酶中引入突變,融合在nCas9(D10A)的N 端,獲得的堿基編輯器eAID?BE4max將編輯窗口拓展為1~11號(hào)位。中國(guó)科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心仇子龍研究團(tuán)隊(duì)[73]通過(guò)融合nCas9(D10A)及一系列七鰓鰻胞苷脫氨酶開發(fā)了一系列編輯窗口位于PAM 遠(yuǎn)端、近端以及覆蓋整個(gè)Protospacer 區(qū)域的堿基編輯器。
也有人通過(guò)改變脫氨酶與DNA 的相互作用來(lái)拓展編輯的范圍。黃行許研究團(tuán)隊(duì)開發(fā)了BE?PLUS 編輯器,利用了包含多個(gè)GCN4 多肽的SunTaq 信號(hào)放大系統(tǒng)[74],通過(guò)將SunTaq 標(biāo)簽融合在nCas9(D10A)的N 端,招募單獨(dú)表達(dá)的scFV?APOBEC?UGI?GB1(scFV 抗體特異性識(shí)別GCN4多肽,GB1 為促溶標(biāo)簽,消除蛋白質(zhì)聚集),可以將編輯窗口拓寬到4~16 號(hào)位[14]。華東師范大學(xué)李大力研究團(tuán)隊(duì)通過(guò)在BE4max、A3A?BE4max 及eA3A?BE4max[75]三個(gè)堿基編輯器的脫氨酶與Cas蛋白之間融合Rad51 蛋白的單鏈DNA 結(jié)合域(single?stranded DNA?binding domain, ssDBD),獲得的hyBE4max、hyA3A?BE4max 和heyA3A?BE4max 三個(gè)堿基編輯器相比之前的版本大幅拓寬了編輯窗口[76]。四川大學(xué)姚少華研究團(tuán)隊(duì)[77]將胞苷脫氨酶嵌合在Cas9 蛋白的PAM 相互作用域(PAM?interacting domain, PI domain)內(nèi),獲得了編輯窗口拓展為4~14 號(hào)位的堿基編輯器BE?PIGS。復(fù)旦大學(xué)程天林研究團(tuán)隊(duì)[25]通過(guò)將腺苷脫氨酶嵌合于Cas9 內(nèi)部的特定位點(diǎn),獲得了多個(gè)版本的ABE?nSpCas9?DS 堿基編輯器,這一系列的堿基編輯器將ABE 編輯窗口拓寬為2~16 號(hào)位,并且降低了RNA 脫靶編輯的風(fēng)險(xiǎn)。瑞士蘇黎世聯(lián)邦理工學(xué)院Gerald Schwank 研究團(tuán)隊(duì)[78]通過(guò)用TadA替換Cas9 的HNH 結(jié)構(gòu)域,縮小了整個(gè)編輯器的大小,并獲得了編輯窗口靠近PAM的堿基編輯器。
此外, Jin?Soo Kim 研究團(tuán)隊(duì)[79]通過(guò)在sgRNA 5'端延長(zhǎng)2~3 nt,將ABE7.10 的編輯窗口向PAM 遠(yuǎn)端延伸2~3 nt。類似編輯窗口延伸的現(xiàn)象也在dCas?CDA?UL、nCas9(D10A)?AID 和CRISPR?CDA?nCas9?UGI等堿基編輯器結(jié)合5'端延長(zhǎng)的sgRNA時(shí)被發(fā)現(xiàn)[80?82]。
除了拓寬編輯窗口,許多的堿基編輯場(chǎng)景需要堿基編輯器擁有更小的編輯窗口從而產(chǎn)生更精準(zhǔn)的編輯。David R. Liu 研究團(tuán)隊(duì)通過(guò)引入突變降低rAPOBEC1 的編輯活性及底物結(jié)合能力,獲得了四種(YE1?BE3、EE?BE3、YE2?BE3 和YEE?BE3)相比于BE3略微降低了編輯活性但是將編輯窗口范圍縮小到1~2 nt 的堿基編輯器,而通過(guò)使用截短的sgRNA 未能很好地實(shí)現(xiàn)這一點(diǎn)[59]。之后李占軍研究團(tuán)隊(duì)[83]在YE1 的基礎(chǔ)上構(gòu)建了YFE?BE4max,同樣將編輯窗口縮小到3 nt 并在兔子中實(shí)現(xiàn)高效率、低脫靶的編輯。德國(guó)馬普分子植物生理所Ralph Bock 研究團(tuán)隊(duì)[16,84]通過(guò)用5~7 個(gè)氨基酸的剛性linker(PAPAP/PAPAPAP)替換BE3 中原有的XTEN linker,將編輯窗口縮小到了5~7 號(hào)位,而在nSpCas9 的N 端融合截短C 端的CDA1 或A3A,分別使得堿基編輯幾乎只發(fā)生在3 號(hào)位或5~6 號(hào)位。J. Keith Joung 研究團(tuán)隊(duì)[19]為了減少堿基編輯器引發(fā)的RNA 隨機(jī)突變,開發(fā)了兩個(gè)在脫氨酶中引入突變的堿基編輯器變體--BE3?R33A和BE3?R33A/K34A,其在大幅降低RNA 隨機(jī)突變頻率的同時(shí),也將編輯窗口縮小到了5~7 號(hào)位。中國(guó)科學(xué)院天津工業(yè)生物技術(shù)研究所張學(xué)禮研究團(tuán)隊(duì)[85]通過(guò)設(shè)計(jì)非完全匹配的sgRNA 增加了堿基編輯器對(duì)目標(biāo)序列單個(gè)堿基的編輯比例,并且提高了堿基編輯的效率。
1.3.1 堿基編輯器脫靶編輯的檢測(cè)
在開發(fā)和應(yīng)用單堿基編輯器的過(guò)程中,人們發(fā)現(xiàn)單堿基編輯器可以在目標(biāo)位點(diǎn)及脫靶位點(diǎn)產(chǎn)生多種不需要的編輯副產(chǎn)物。因此,研究者針對(duì)性地開發(fā)出了一系列具有更高特異性的單堿基編輯器,以改善這些問(wèn)題。
通用的編輯產(chǎn)物檢測(cè)方法包括對(duì)目標(biāo)位點(diǎn),以及對(duì)通過(guò)軟件預(yù)測(cè)或文獻(xiàn)已發(fā)表的脫靶位點(diǎn)進(jìn)行桑格測(cè)序(Sanger sequencing)或深度測(cè)序(deep sequencing),從而進(jìn)行定點(diǎn)考察[7],或是通過(guò)全基因組測(cè)序(whole?genome sequencing, WGS)了解在全基因組的脫靶情況[80],這些方法都具有各自的局限性。
Jin?Soo Kim研究團(tuán)隊(duì)[86]最早在CBE脫靶編輯的全基因組檢測(cè)方面取得突破,他們使用BE3ΔUGI在體外對(duì)編輯位點(diǎn)脫氨并在DNA 靶標(biāo)鏈上產(chǎn)生切刻,之后利用尿嘧啶特異性切除試劑,即一種尿嘧啶DNA 糖基化酶及DNA 糖基化酶?裂解酶內(nèi)切酶Ⅷ的混合物,將C脫氨形成的U所在位置的DNA 鏈切斷,形成雙鏈斷裂。之后,DNA 樣本在末端修復(fù)和連接后通過(guò)全基因組測(cè)序,與參考基因組序列或未經(jīng)編輯處理的對(duì)照基因組測(cè)序序列比對(duì),尋找基因組上BE3ΔUGI 的編輯位點(diǎn),該方法被稱為Digenome?seq(digested?genome sequencing)。隨后,中山大學(xué)松陽(yáng)洲研究團(tuán)隊(duì)和Jin?Soo Kim 研究團(tuán)隊(duì)[87?88]分別開發(fā)了針對(duì)ABE 脫靶編輯全基因組檢測(cè)的方法,通過(guò)類似的策略,先用ABE7.10 在體外對(duì)基因組DNA 編輯并產(chǎn)生切刻,之后用內(nèi)切酶Ⅴ對(duì)DNA 再次進(jìn)行處理,切斷脫氨形成的肌苷3'下游的第二個(gè)磷酸二酯鍵,從而產(chǎn)生雙鏈斷裂,經(jīng)過(guò)DNA 末端修復(fù)后通過(guò)全基因組測(cè)序?qū)ふ揖庉嬑稽c(diǎn)。但是這種檢測(cè)ABE 脫靶位點(diǎn)的方法會(huì)遺漏ABE 導(dǎo)致的C 到其他堿基的轉(zhuǎn)變,并且以上幾種方法都是檢測(cè)體外編輯的產(chǎn)物,并不能客觀地展示體內(nèi)真實(shí)發(fā)生的編輯,于是高彩霞研究團(tuán)隊(duì)和中國(guó)科學(xué)院神經(jīng)科學(xué)研究所楊輝研究團(tuán)隊(duì)分別對(duì)水稻和小鼠體內(nèi)的堿基編輯進(jìn)行了全基因組分析:高彩霞研究團(tuán)隊(duì)[89]分別用三種不同的堿基編輯器編輯水稻,并設(shè)置只轉(zhuǎn)化堿基編輯器而不轉(zhuǎn)化sgRNA 的對(duì)照,之后對(duì)編輯植株及野生型植株基因組DNA 進(jìn)行測(cè)序,用野生型植株的測(cè)序結(jié)果過(guò)濾背景突變,便可觀測(cè)到堿基編輯器所引發(fā)的突變;楊輝研究團(tuán)隊(duì)[90]在小鼠受精卵分裂為兩個(gè)細(xì)胞的時(shí)候,對(duì)其中一個(gè)細(xì)胞注射堿基編輯的相關(guān)元件以及熒光蛋白基因,在胚胎成長(zhǎng)后的第14.5 天,對(duì)胚胎進(jìn)行消化,通過(guò)流式細(xì)胞儀對(duì)基于熒光蛋白表達(dá)分選出發(fā)生編輯和未發(fā)生編輯的細(xì)胞,并對(duì)二者進(jìn)行全基因組測(cè)序。對(duì)比測(cè)序結(jié)果,過(guò)濾掉未編輯細(xì)胞中的背景突變,便可得到發(fā)生編輯細(xì)胞的突變情況,這種方法被命名為GOTI(genome?wide off?target analysis by two?cell embryo injection)。David R. Liu 研究團(tuán)隊(duì)和美國(guó)Beam Therapeutics 公司Nicole M. Gaudelli研究團(tuán)隊(duì)[18,91]還利用報(bào)告系統(tǒng)或者通過(guò)其他Cas9蛋白結(jié)合DNA 形成R?loop 結(jié)構(gòu)暴露出單鏈DNA,分別設(shè)計(jì)了在細(xì)菌和哺乳動(dòng)物細(xì)胞中不需要通過(guò)全基因組測(cè)序即可檢測(cè)堿基編輯器脫靶編輯的方法。之后北京大學(xué)伊成器研究團(tuán)隊(duì)[92]開發(fā)了針對(duì)胞嘧啶堿基編輯敏感度更高的檢測(cè)技術(shù)Detect?seq(dU?detection enabled by C?to?T transition during sequencing), 通過(guò)利用化學(xué)標(biāo)記和生物素Pulldown 技術(shù),追蹤C(jī)BE 體內(nèi)編輯后的基因組產(chǎn)物中的中間體脫氧尿苷來(lái)揭示CBE 的編輯組(editome)。
1.3.2 堿基編輯器在目標(biāo)位點(diǎn)產(chǎn)生的編輯副產(chǎn)物及優(yōu)化策略
通過(guò)上述檢測(cè)手段,人們發(fā)現(xiàn)堿基編輯器造成的非預(yù)期編輯包括堿基顛換、旁觀者編輯(bystander editing)以及Indels 突變。產(chǎn)生堿基顛換的原因在前文已有介紹,即C脫氨后形成的U被UDG切除,形成AP位點(diǎn)后經(jīng)歷細(xì)胞內(nèi)的堿基切除修復(fù)而產(chǎn)生C 到A 或G 的顛換;而ABE 的編輯A的過(guò)程中發(fā)生堿基顛換則未見報(bào)道,可能由于體內(nèi)從DNA 中切除肌苷的酶的活性或豐度較低,導(dǎo)致A 被編輯后經(jīng)歷堿基切除修復(fù)的可能性極?。?2]。當(dāng)編輯窗口內(nèi)存在多個(gè)C 或者A 時(shí),除了目標(biāo)堿基,周圍的堿基也被編輯,這種情況被稱為旁觀者編輯。雖然在某些情況下旁觀者編輯的影響不大,例如由于密碼子簡(jiǎn)并性,旁觀者編輯可能只會(huì)導(dǎo)致沉默突變,或者導(dǎo)致同類型氨基酸的轉(zhuǎn)變,但是其他情況下,旁觀者編輯可能會(huì)產(chǎn)生非預(yù)期的嚴(yán)重后果。Indels 突變的產(chǎn)生則主要由堿基編輯器中nCas9產(chǎn)生的切刻或是堿基脫氨之后經(jīng)歷堿基切除修復(fù)所導(dǎo)致。檢測(cè)結(jié)果顯示,堿基編輯后確實(shí)有少量的Indels突變發(fā)生,并且CBE產(chǎn)生的頻率一般要高于ABE[22],但堿基編輯導(dǎo)致Indels 突變產(chǎn)生的機(jī)理還未被完全揭示[93]。
針對(duì)上述情況,人們采取了一系列的改進(jìn)措施。為了避免產(chǎn)生堿基顛換,人們?cè)趬A基編輯器中引入更多的UGI 來(lái)降低堿基顛換的概率[14,30]。為了減少旁觀者編輯,人們一方面通過(guò)上文介紹的縮小編輯窗口的方法,減少脫氨酶可接觸的底物數(shù)量。另一方面利用脫氨酶編輯序列的偏好性,使得脫氨酶只編輯某些位置的C,例如改造的A3G幾乎只編輯CC 基序中的第二個(gè)C[15]。此外,韓國(guó)漢陽(yáng)大學(xué)Sangsu Bae 研究團(tuán)隊(duì)[94]通過(guò)在TadA7.10中引入突變,降低了其對(duì)旁觀者胞嘧啶脫氨的活性及RNA 編輯的活性。美國(guó)萊斯大學(xué)Anatoly B.Kolomeisky 等研究團(tuán)隊(duì)[95]通過(guò)數(shù)學(xué)建模分析預(yù)測(cè)目標(biāo)堿基和旁觀者堿基的編輯效率,并據(jù)此開發(fā)了提高目標(biāo)堿基與旁觀者堿基編輯比的A3A 版本。針對(duì)Indels突變,通過(guò)使用dCas9[7]或AsCas12a[66]引導(dǎo)脫氨酶,或者利用噬菌體Mu 的Gam 蛋白[30]均可以降低Indels突變的發(fā)生頻率。
1.3.3 堿基編輯器造成的sgRNA 依賴和非sgRNA依賴的DNA脫靶編輯及優(yōu)化策略
除了在目標(biāo)位點(diǎn)產(chǎn)生非預(yù)期的編輯外,堿基編輯器脫靶到其他DNA 位點(diǎn)也會(huì)產(chǎn)生非預(yù)期的編輯產(chǎn)物,包括sgRNA 依賴的DNA 脫靶編輯以及非sgRNA依賴的DNA脫靶編輯。
堿基編輯器所造成的sgRNA 依賴的DNA 脫靶編輯的發(fā)生位點(diǎn)并不完全與sgRNA 引導(dǎo)Cas 蛋白所造成的脫靶編輯的位點(diǎn)相同,其中還受到編輯窗口內(nèi)是否存在脫氨底物、底物上下游的核苷酸種類以及脫氨酶能否接觸到R?loop 結(jié)構(gòu)中DNA 鏈等因素影響。人們發(fā)現(xiàn)這一類脫靶編輯的發(fā)生相比非sgRNA 依賴的脫靶編輯概率較小[89],但仍給堿基編輯器的應(yīng)用帶來(lái)了潛在的風(fēng)險(xiǎn),因此人們對(duì)該問(wèn)題進(jìn)行了一系列的優(yōu)化。通過(guò)使用高保真Cas 蛋白替換野生型Cas 蛋白可以有效降低CBE 和ABE 這一類脫靶編輯發(fā)生頻率,例如HF?Cas9,xCas9(3.7)、Sniper?Cas9、HypaCas9 等[17,60,75,87,96]。中國(guó)科學(xué)院廣州生物醫(yī)藥與健康研究院賴良學(xué)與五邑大學(xué)鄒慶劍研究團(tuán)隊(duì)合作將腺苷脫氨酶或胞苷脫氨酶與轉(zhuǎn)錄激活因子樣效應(yīng)子融合,并依靠靶向附近的dCas9 打開DNA 雙鏈,開發(fā)了TaC9?ABE 和TaC9?CBE 堿基編輯器。該系統(tǒng)可以消除sgRNA 依賴的脫靶編輯,而不影響靶向編輯效率[24,97]。有研究顯示使用截短的sgRNA 可以在不大幅降低目標(biāo)位點(diǎn)編輯活性的情況下,減少堿基編輯器sgRNA依賴的DNA脫靶編輯[96],但是也有研究發(fā)現(xiàn)使用截短的sgRNA 會(huì)導(dǎo)致堿基編輯器在目標(biāo)位點(diǎn)和脫靶位點(diǎn)的編輯活性均有所降低,并且當(dāng)sgRNA 與DNA 的錯(cuò)配出現(xiàn)在PAM 遠(yuǎn)端時(shí),使用截短的sgRNA 反而會(huì)展現(xiàn)出更高的脫靶活性[86],表明在堿基編輯器中使用截短sgRNA 來(lái)提升特異性的方法并不如在Cas9 中適用[98]。而使用5'端添加1~2 個(gè)G 的sgRNA 則可以在不降低目標(biāo)位點(diǎn)編輯活性的情況下減少sgRNA 依賴的DNA 脫靶編輯[86],但也有研究顯示脫靶的減少只在sgRNA 5'端添加2個(gè)G的情況下出現(xiàn)[88]。武漢大學(xué)孫宇輝研究團(tuán)隊(duì)[99]通過(guò)在sgRNA 的5'端引入氣泡發(fā)夾結(jié)構(gòu),也可以有效地提升堿基編輯器的編輯特異性。
堿基編輯器所造成的非sgRNA 依賴的DNA 脫靶編輯通常由CBE 引發(fā),即使在沒(méi)有sgRNA 的情況下,CBE 也能引發(fā)一定量的非sgRNA 依賴的DNA 脫靶編輯。而在ABE 的編輯產(chǎn)物中幾乎沒(méi)有檢測(cè)到此類脫靶編輯,發(fā)生頻率僅接近自發(fā)突變。這些突變主要是C到T的單核苷酸變異,被認(rèn)為是由胞苷脫氨酶和UGI 在整個(gè)基因組中長(zhǎng)期隨機(jī)的反應(yīng)而產(chǎn)生。而DNA 腺苷脫氨酶本身由RNA 腺苷脫氨酶進(jìn)化而來(lái),與DNA 結(jié)合能力較弱,所以ABE 幾乎不引發(fā)非sgRNA 依賴的DNA 脫靶編輯[89?90,100]。針對(duì)這一問(wèn)題,David R. Liu 研究團(tuán)隊(duì)[18]通過(guò)測(cè)試, 發(fā)現(xiàn)YE1?BE4、 YE2?BE4、R33A+K34A?BE4 等7 個(gè)堿基編輯器均減少了DNA層面的各種脫靶問(wèn)題,其中YE1與其他Cas變體展現(xiàn)了更好的兼容性,可以高效地編輯更多的位點(diǎn)。Nicole M. Gaudelli 研究團(tuán)隊(duì)[91]從153 個(gè)脫氨酶中篩選出4 個(gè)脫氨酶變體--PpABOBEC1、RrA3F、AmAPOBEC1和SsAPOBEC3b,由它們所構(gòu)建的堿基編輯器降低了非sgRNA 依賴的脫靶編輯活性,并通過(guò)對(duì)這些脫氨酶進(jìn)行工程改造,進(jìn)一步降低了融合這些脫氨酶的堿基編輯器DNA 和RNA 的脫靶編輯頻率。楊輝研究團(tuán)隊(duì)[101]從23 個(gè)理性設(shè)計(jì)的CBE 變體中篩選出在目標(biāo)位點(diǎn)保留了高編輯效率,同時(shí)引發(fā)極低DNA 和RNA 脫靶編輯和旁觀者編輯的YE1?BE3?FNLS變體。
1.3.4 堿基編輯器造成的RNA 脫靶編輯及優(yōu)化策略
此外,人們還通過(guò)RNA 測(cè)序,發(fā)現(xiàn)堿基編輯器除了造成DNA 層面的脫靶編輯,還會(huì)引起大量的非sgRNA 依賴的RNA 脫靶編輯[19,102?104],脫靶的原因被認(rèn)為是CBE 和ABE 脫氨酶均具有對(duì)RNA脫氨的活性。而RNA 脫靶編輯除了低水平、廣泛而隨機(jī)地發(fā)生在內(nèi)源RNA 上,也可能造成對(duì)sgRNA 和堿基編輯器mRNA 的編輯,進(jìn)而可能誘發(fā)DNA 層面脫靶編輯的發(fā)生[19]。針對(duì)這些問(wèn)題,人們通過(guò)在脫氨酶中引入突變,構(gòu)建了多種堿基編輯器變體,減少了RNA脫靶編輯的發(fā)生,其中一些突變也減少了DNA脫靶編輯的發(fā)生[19,23,67,91,101?104]。另外,也有研究通過(guò)將腺苷脫氨酶嵌合于Cas9 內(nèi)部的特定位點(diǎn),限制了腺苷脫氨酶的活性,減少了RNA脫靶編輯的發(fā)生[25]。
1.3.5 堿基編輯器特異性優(yōu)化的其他策略
除了蛋白層面的工程改造,也可以通過(guò)時(shí)空控制減少堿基編輯器的劑量或作用時(shí)間來(lái)提升堿基編輯器的特異性。堿基編輯器可以通過(guò)核糖核蛋白[17?18,23,105?106]、mRNA[61,67,79,107]或逆轉(zhuǎn)錄病毒顆粒[108]的方式遞送到細(xì)胞內(nèi)。通過(guò)這幾種方式遞送的堿基編輯器在體內(nèi)都更容易被降解,減少了堿基編輯器在體內(nèi)的存在時(shí)間,從而減少脫靶編輯發(fā)生的機(jī)會(huì)。利用anti?CRISPR 蛋白AcrⅡA5 可以有效地抑制Cas9的活性[109],利用anti?deaminase(Ade)蛋白可以有效地抑制脫氨酶APOBEC3A 的活性[110],從而減少堿基編輯器的脫靶。通過(guò)在sgRNA 中設(shè)計(jì)RNA 適體酶(aptamer)來(lái)招募脫氨酶編輯可以提升編輯的特異性[111]。此外通過(guò)類似于拆分Cas蛋白的方式[112?113]拆分脫氨酶[114],可以精準(zhǔn)地控制編輯的時(shí)間,減少額外編輯的發(fā)生。陳佳研究團(tuán)隊(duì)[115]利用其首次發(fā)現(xiàn)的、具有胞苷脫氨酶抑制作用的胞苷脫氨酶的調(diào)節(jié)結(jié)構(gòu)域調(diào)控胞苷脫氨酶,開發(fā)了高特異性的堿基編輯器tBEs(transformer base editors)。
由于堿基編輯器可以在不引入雙鏈DNA 斷裂的情況下實(shí)現(xiàn)堿基的轉(zhuǎn)換,于是人們可以方便地將堿基編輯器應(yīng)用于提前終止密碼子的引入和修復(fù)。如CBE 可以將CAA、CAG、CGA 或TGG 密碼子轉(zhuǎn)換為終止密碼子TAA、TAG 和TGA 來(lái)提前終止基因的表達(dá)[116?117],以及通過(guò)ABE 將起始密碼子ATG 轉(zhuǎn)變成ACG 擾亂基因翻譯的起始,都可以起到類似基因失活的作用[118],用于考察基因的功能或定向改造生物代謝途徑。相反,ABE 也可以通過(guò)將提前的終止密碼子變成谷氨酰胺(CAA、CAG)或精氨酸(CGA)的密碼子,使提前終止的基因翻譯恢復(fù)正常[119]。在以代謝產(chǎn)物為主要研究目標(biāo)的微生物中,人們對(duì)于脫靶所帶來(lái)的非預(yù)期后果的容忍度遠(yuǎn)高于以人類疾病治療為目標(biāo)的研究。因此,堿基編輯技術(shù)和策略迅速被運(yùn)用于微生物合成生物學(xué)研究領(lǐng)域,我國(guó)科研工作者在許多重要微生物天然產(chǎn)物的生物合成途徑研究及改造中一展身手,也為基因編輯技術(shù)的發(fā)展提供了持續(xù)不斷的驅(qū)動(dòng)力。例如:
中國(guó)科學(xué)院分子植物卓越中心楊晟研究團(tuán)隊(duì)[120]利用其構(gòu)建的適用于梭菌Clostridium beijerinckii的胞嘧啶堿基編輯器pCBEclos?opt,在C. beijerinckiiNCIMB 8052 中使得編碼木糖代謝的轉(zhuǎn)錄調(diào)節(jié)因子xylR產(chǎn)生C?G 至T?A 的突變,所獲得的突變株木糖消耗量比野生型菌株高10%。
北京大學(xué)席建中研究團(tuán)隊(duì)通過(guò)CBE(dCas9?CDA1?UL)在基因中引入提前的終止密碼子,逐個(gè)敲除了紅細(xì)菌Rhodobacter sphaeroides2.4.1 中參與抗氧化劑輔酶Q10生物合成的系列基因,揭示了這些基因在合成輔酶Q10過(guò)程中的重要性。還通過(guò)敲除八氫番茄紅素合酶基因crtB,以及同時(shí)敲除crtB和參與光合氧化還原信號(hào)調(diào)節(jié)的基因ppsR,將野生型中輔酶Q10的產(chǎn)量分別提高了6% 和39%[121],向人們展現(xiàn)出了該技術(shù)和策略的實(shí)用性。
孫宇輝研究團(tuán)隊(duì)[122]構(gòu)建了適用于鏈霉菌屬的CBE 和ABE,并通過(guò)CBE 在Streptomyces avermitilisMA?4680中olm、rpp、pks1、pks4和pks8五個(gè)甚至多達(dá)九個(gè)PKS 基因簇內(nèi)同時(shí)引入提前終止密碼子,提高S. avermitilisMA?4680 中阿維菌素的產(chǎn)量。之后,該研究團(tuán)隊(duì)將其開發(fā)的適用于鏈霉菌的堿基編輯器成功應(yīng)用于揭示潮霉素B 的生物合成途徑。他們利用CBE 在Streptomyces hygroscopicussubsp.hygroscopicusDSM 40578 參與潮霉素B 生物合成的五個(gè)候選基因內(nèi)引入提前的終止密碼子或突變編碼區(qū)內(nèi)的保守殘基序列使基因失活。結(jié)合體內(nèi)外的實(shí)驗(yàn)證據(jù)揭示了蛋白HygJ、HygL 和HygD 負(fù)責(zé)核苷二磷酸庚糖的連續(xù)脫氫、轉(zhuǎn)氨基和轉(zhuǎn)糖基化,HygY 是一種不同尋常、作用于羥基碳的自由基S?腺苷甲硫氨酸依賴的差向異構(gòu)酶,而HygM 是一個(gè)在多平行代謝網(wǎng)絡(luò)中發(fā)揮作用的多功能甲基轉(zhuǎn)移酶。這些工作,特別在多基因同步考察上都展現(xiàn)出了堿基編輯器有別于傳統(tǒng)方法和策略在天然產(chǎn)物生物合成機(jī)制研究領(lǐng)域的獨(dú)特優(yōu)越性[123]。
中國(guó)科技大學(xué)俞漢青研究團(tuán)隊(duì)[124]也在希瓦氏菌Shewanella oneidensisMR?1 中開發(fā)了快速且強(qiáng)大的堿基編輯器pCBEso,并應(yīng)用該工具快速鑒定出S. oneidensisMR?1 內(nèi)參與N?乙酰氨基葡萄糖(GlcNAc)或葡萄糖代謝的關(guān)鍵基因。此外,他們還利用pCBEso 構(gòu)建了具有擴(kuò)展碳源利用譜的S.oneidensisMR?1 工程菌株,當(dāng)葡萄糖或GlcNAc 成為唯一碳源時(shí),其對(duì)多種有機(jī)污染物(偶氮染料和有機(jī)砷化合物)的降解率高于野生型菌株。
上海交通大學(xué)肖毅研究團(tuán)隊(duì)[125]針對(duì)假單胞菌屬的腺嘌呤堿基編輯器開發(fā)了一種基于ABE 的蛋白質(zhì)功能障礙預(yù)測(cè)方法DABE?CSP(dysfunctionviaABE through CRISPOR?SIFT prediction),利用該方法,他們發(fā)現(xiàn)了黏康酸(muconic acid)代謝途徑中的基因catB失活或catB和catC同時(shí)失活會(huì)導(dǎo)致黏康酸的積累,并且后者以100%的產(chǎn)率積累黏康酸。DABE?CSP 方法的建立可以加快對(duì)假單胞菌屬物種的研究。
上海師范大學(xué)蘆銀華研究團(tuán)隊(duì)[126]利用其構(gòu)建的胞嘧啶堿基編輯器dCas9?CDA?ULstr,在鏈霉菌Streptomyces rapamycinicus2001 內(nèi)抑制雷帕霉素合成的基因rapS中引入提前終止密碼子,使雷帕霉素產(chǎn)量提高了63.3%。
浙江大學(xué)吳堅(jiān)平研究團(tuán)隊(duì)[127]利用其構(gòu)建的適用于假單胞菌屬的多重胞嘧啶堿基編輯系統(tǒng)提高了Pseudomonas putidaKT2440 中兒茶酸的產(chǎn)量。他們利用該系統(tǒng)在原兒茶酸3,4?雙加氧酶的β亞基(PcaH)和丙酮酸激酶(PykA)編碼基因中引入提前終止密碼子,并通過(guò)該系統(tǒng)在3?脫氧?2?阿拉伯庚酮糖?7?磷酸合成酶的同工酶AroF?2 內(nèi)引入了不同的點(diǎn)突變(G136E、G136K 和G136R),其中KT2440::AroF2(G136E)?PJ23119ΔpcaHΔpykA 菌株搖瓶發(fā)酵的兒茶酸產(chǎn)量較AroF?2 未編輯菌株和原始菌株分別增加了69.01%和611.17%。
中國(guó)科學(xué)院天津工業(yè)生物技術(shù)研究所馬延和研究團(tuán)隊(duì)[128]開發(fā)了基于堿基編輯器的一種多重自動(dòng)化谷氨酸棒桿菌堿基編輯方法(multiplex automatedCorynebacterium glutamicumbase editing method,MACBETH),并利用MACBETH 產(chǎn)生多重基因失活、用于提高谷氨酸產(chǎn)量的突變株文庫(kù),發(fā)現(xiàn)丙酮酸激酶編碼基因pyk和乳酸脫氫酶編碼基因ldhA雙基因失活菌株可將谷氨酸產(chǎn)量相較野生型提高3 倍。此外,他們通過(guò)集成機(jī)器人系統(tǒng)實(shí)現(xiàn)了MACBETH 的自動(dòng)化,使該方法能夠每月生成數(shù)千個(gè)定向設(shè)計(jì)的C. glutamicum代謝工程的菌株。該研究團(tuán)隊(duì)利用自動(dòng)化平臺(tái)構(gòu)建了一個(gè)包含94 個(gè)轉(zhuǎn)錄因子基因失活的文庫(kù),成功率達(dá)到100%,該工作展現(xiàn)了堿基編輯器快速便捷地生成突變菌株庫(kù)的能力,成為工業(yè)應(yīng)用中多重自動(dòng)化細(xì)菌基因組編輯的強(qiáng)大工具[128]。隨后該研究團(tuán)隊(duì)利用拓展了PAM序列的Cas蛋白變體(nVQR?Cas9(D10A)、nVRER?Cas9 (D10A)、 nxCas9 3.7 (D10A) 和nCas9?NG(D10A)),替換了MACBETH方法中構(gòu)建的CBE 中的野生型nCas9,拓展了CBE 在C.glutamicum中的編輯范圍,利用nxCas9 3.7(D10A)?AID去除了lysC基因編碼的天冬氨酸激酶產(chǎn)生的反饋抑制,使工程菌株產(chǎn)生1.7 g/L 賴氨酸,而在野生型菌株中,賴氨酸的產(chǎn)量低至幾乎無(wú)法檢測(cè)[82]。之后,該研究團(tuán)隊(duì)還開發(fā)了一種基于堿基編輯器靶向且無(wú)模板的表達(dá)調(diào)控方法(base editor?targeted and template?free expression regulation, BETTER)用于在微生物中大規(guī)模微調(diào)基因的表達(dá),它可以在原位生成大量不同的核糖體結(jié)合位點(diǎn)、5'非翻譯區(qū)或啟動(dòng)子的遺傳組合,并無(wú)需合成、轉(zhuǎn)化和整合DNA 供體。他們應(yīng)用BETTER 在模式微生物C.glutamicum和Bacillus subtilis中同時(shí)調(diào)節(jié)多達(dá)十個(gè)基因的表達(dá),以增強(qiáng)宿主的底物攝取或天然產(chǎn)物生物合成,分別獲得改善了木糖分解代謝、甘油分解代謝或番茄紅素生物合成的工程菌株[129]。
江南大學(xué)周哲敏研究團(tuán)隊(duì)[81]構(gòu)建了可以實(shí)現(xiàn)體內(nèi)原位蛋白進(jìn)化的工具CRISPR?CDA?nCas9?UGI,并利用該工具在芽孢桿菌B. subtilis中對(duì)影響細(xì)胞功能的Sec轉(zhuǎn)位酶進(jìn)行進(jìn)化突變,獲得了提升運(yùn)輸能力的突變株。此外,他們還利用CRISPR?CDA?nCas9?UGI 對(duì)抗菌肽抗性決定因子bceB基因進(jìn)行進(jìn)化,獲得了對(duì)抗菌肽抗性更高的突變株。BceB 蛋白在保護(hù)細(xì)胞壁生物合成靶點(diǎn)免受抗菌肽的抑制方面發(fā)揮重要作用,桿菌肽抗性突變體的創(chuàng)建對(duì)于構(gòu)建產(chǎn)生桿菌肽的細(xì)胞工廠具有重要價(jià)值[81]。
此外,脫氨酶還可以與隨機(jī)結(jié)合DNA 的蛋白融合,設(shè)計(jì)成為產(chǎn)生DNA 隨機(jī)突變的工具。浙江大學(xué)連佳長(zhǎng)研究團(tuán)隊(duì)[130]將不同的非特異性ssDNA 結(jié)合蛋白與胞苷脫氨酶融合,理論上可以實(shí)現(xiàn)在酵母菌Saccharomyces cerevisiae全基因組將胞嘧啶替換成胸腺嘧啶的突變。他們利用這些rBE,提高了S. cerevisiae對(duì)異丁醇和乙酸鹽的耐受性并增加了產(chǎn)β?胡蘿卜素S. cerevisiae的β?胡蘿卜素產(chǎn)量。他們還使用rBE 對(duì)S. cerevisiae基因組進(jìn)行持續(xù)進(jìn)化,獲得了對(duì)濃度為9%的異丁醇具有抗性的S. cerevisiae細(xì)胞。張學(xué)禮研究團(tuán)隊(duì)[131]將DNA 解旋酶與活化誘導(dǎo)的胞苷脫氨酶(AID)融合形成酶復(fù)合物Helicase?AID,Helicase?AID 可以在細(xì)胞內(nèi)整個(gè)染色體中隨機(jī)引入堿基突變。該研究團(tuán)隊(duì)利用這一工具分別對(duì)產(chǎn)β?胡蘿卜素的E. coliKH001 和S. cerevisiae4742crt 進(jìn)行多輪隨機(jī)突變,使得突變株β?胡蘿卜素產(chǎn)量分別增加371.4%和75.4%。
堿基編輯器自問(wèn)世以來(lái),從最初可以實(shí)現(xiàn)目標(biāo)位點(diǎn)編輯窗口內(nèi)C 到T、A 到G 的堿基轉(zhuǎn)換,到之后開發(fā)和優(yōu)化出的堿基變換種類不斷豐富,編輯窗口、靶向位點(diǎn)不斷拓展以及特異性不斷優(yōu)化的新版本,極大地加速了堿基編輯器在生物學(xué)、醫(yī)學(xué)等領(lǐng)域的應(yīng)用。然而,堿基編輯器的堿基編輯偏好性,可以靶向編輯的位點(diǎn)和堿基受限,以及脫靶編輯的問(wèn)題仍有待進(jìn)一步完善。例如,雖然目前較多的堿基編輯器在編輯窗口上都比早期版本有所拓展,但是堿基編輯器對(duì)于單個(gè)或少數(shù)堿基的精確編輯仍較難實(shí)現(xiàn),而精確地在基因元件中進(jìn)行堿基轉(zhuǎn)換對(duì)于改造微生物來(lái)說(shuō)也至關(guān)重要。此外,堿基編輯器的脫靶編輯所造成的細(xì)菌毒性以及微生物的表型變化也會(huì)給微生物代謝途徑改造帶來(lái)障礙,雖然目前已報(bào)道了一些脫靶效應(yīng)低至與自發(fā)突變水平相當(dāng)?shù)膲A基編輯器,但是這些系統(tǒng)往往包含較多的元件,系統(tǒng)繁復(fù),效能有限,因此開發(fā)或者尋找到適合微生物的簡(jiǎn)便精準(zhǔn)的堿基編輯器還需要合成生物學(xué)研究工作者的不斷努力。同時(shí),還可以通過(guò)對(duì)以堿基為底物的酶的發(fā)現(xiàn)和改造或是對(duì)生物體內(nèi)核酸參與的生化反應(yīng)的深入了解,利用堿基結(jié)構(gòu)的變化或是體內(nèi)不同的核酸修復(fù)途徑,創(chuàng)造更多堿基變換的可能,例如由嘌呤變嘧啶等,將更能拓展堿基編輯器的應(yīng)用場(chǎng)景。
此外,與其他在微生物中使用的基因編輯工具一樣,堿基編輯器也存在著對(duì)難以建立遺傳操作的微生物無(wú)法遞送外源DNA 的障礙。而由堿基編輯器實(shí)現(xiàn)的堿基轉(zhuǎn)變也需要考慮到微生物產(chǎn)生回復(fù)突變的可能性。
堿基編輯器在微生物合成生物學(xué)中的應(yīng)用雖然較CRISPR/Cas 系統(tǒng)的基因編輯有較大優(yōu)勢(shì),但是主要的問(wèn)題仍舊是堿基編輯所能實(shí)現(xiàn)的堿基變換種類較少,雖然可以實(shí)現(xiàn)引入提前終止密碼子等,但是對(duì)于某些氨基酸密碼子的轉(zhuǎn)變?nèi)詿o(wú)能為力。因此創(chuàng)造堿基編輯器更多堿基變換的可能變得尤為重要。
可以相信隨著人們研究的不斷深入,堿基編輯器的性能也將日趨完善,在基礎(chǔ)科學(xué)、農(nóng)業(yè)和醫(yī)學(xué)等領(lǐng)域?qū)l(fā)揮更大的作用。