張雅玲,王鋅和,李構(gòu)思,曾棟昌,祝欽瀧,陳樂天,劉耀光
(亞熱帶農(nóng)業(yè)生物資源保護與利用國家重點實驗室/嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實驗室/華南農(nóng)業(yè)大學(xué) 生命科學(xué)學(xué)院, 廣東 廣州 510642)
基因編輯技術(shù)是指能夠?qū)μ囟ㄈ旧w區(qū)段或基因進行核苷酸堿基的定點重組、敲除和定點插入/替換的技術(shù)。作為21世紀(jì)生命科學(xué)領(lǐng)域最重要的突破性、革命性技術(shù)之一,基因編輯技術(shù)的開發(fā)與應(yīng)用被迅速地推廣至包括人類在內(nèi)的動植物基因功能、遺傳改良和疾病治療等領(lǐng)域,極大地推動了生物學(xué)各個學(xué)科的發(fā)展,使生物基礎(chǔ)科學(xué)和應(yīng)用科學(xué)進入了前所未有的廣度和深度。基因編輯技術(shù)的發(fā)展始于序列特異識別元件與核酸酶的融合,歷經(jīng)3個發(fā)展階段且越來越簡潔高效:第1代是鋅指核酸酶(Zinc finger nucleases,ZFNs)基因編輯系統(tǒng),它由負責(zé)識別特定序列的鋅指蛋白和負責(zé)切割的核酸內(nèi)切酶FokⅠ組成,其中,鋅指蛋白包含多個串聯(lián)的、能識別3個特異連續(xù)堿基對的鋅指結(jié)構(gòu)[1-4];第2代是類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(Transcription activator-like effector nucleases,TALENs)基因編輯系統(tǒng),它由識別單個堿基對的轉(zhuǎn)錄激活因子類效應(yīng)子(Transcription activator-like effector,TALE)基序串聯(lián)形成序列識別模塊,融合核酸內(nèi)切酶FokⅠ后對特異片段進行定向切割[5-7];第3代是由成簇的規(guī)則間隔短回文重復(fù)系列(Clustered regularly interspaced short palindromic repeat,CRISPR)及CRISPR相關(guān)核酸酶蛋白(CRISPR-associated protein,Cas)組成的新型基因編輯系統(tǒng),CRISPR/Cas系統(tǒng)主要包含單鏈引導(dǎo)RNA(Signal guide RNA,sgRNA)和Cas核酸酶組成,Cas核酸酶能在sgRNA的引導(dǎo)下定向切割雙鏈DNA[8]。以CRISPR/Cas9為代表的CRISPR/Cas系統(tǒng)載體構(gòu)建簡單,編輯效率高,成本低且能實現(xiàn)同時多靶點編輯,因此成為目前使用最為廣泛的基因編輯工具[9-11]。核酸酶FokⅠ或Cas蛋白都能切割DNA序列產(chǎn)生雙鏈斷裂(Double-stranded break,DSB),生物體內(nèi)的DNA發(fā)生DSB后會啟動內(nèi)源修復(fù),其中,最主要的修復(fù)方式是非同源末端連接(Non-homologous end joining,NHEJ)修復(fù)[12-13]。當(dāng)存在同源DNA模板時,該DSB也能被同源定向修復(fù)途徑(Homologydirected repair,HDR)修復(fù)。NHEJ介導(dǎo)的修復(fù)響應(yīng)迅速高效但容易出錯,大概率會在切割位點附近產(chǎn)生堿基的隨機插入或缺失突變(Insertions and deletions,Indels),并破壞靶基因功能;同源重組途徑可以產(chǎn)生精準(zhǔn)的修復(fù),但是效率低,目前尚難以廣泛使用[12-13]。因此,CRISPR/Cas系統(tǒng)對目標(biāo)片段的編輯具有不可控的隨機性,可以破壞基因功能,但不能對單個堿基進行精準(zhǔn)替換編輯。然而,許多人類疾病的發(fā)生或作物重要農(nóng)藝性狀的改變是由單堿基變異引起的[14-15],開發(fā)高效、精準(zhǔn)的單堿基替換編輯系統(tǒng)對基因治療或作物育種研究非常重要。為了更加精準(zhǔn)地編輯特定片段或堿基,DNA堿基編輯系統(tǒng)應(yīng)運而生。目前已有多種DNA堿基編輯器被開發(fā),包括能將C·G至T·A轉(zhuǎn)換的胞嘧啶單堿基編輯器(Cytosine base editors,CBEs)、能將A·T至G·C轉(zhuǎn)換的腺嘌呤單堿基編輯器(Adenine base editors,ABEs)、C·G至G·C顛換的糖基化酶單堿基編輯器(Glycosylase base editors,GBEs)、能同時實現(xiàn)同一位點的C·G至T·A和A·T至G·C轉(zhuǎn)換的雙堿基編輯器(Dual base editors,DBEs)、適應(yīng)所有堿基之間轉(zhuǎn)換的引導(dǎo)編輯器(Prime editors,PEs)以及線粒體DNA編輯器。DNA堿基編輯器的開發(fā)為植物基因組功能解析和作物精準(zhǔn)育種提供了強有力的技術(shù)支撐,本文著重總結(jié)上述DNA編輯器最新研究進展及優(yōu)化歷程,介紹它們在作物遺傳改良中的應(yīng)用,并對堿基編輯技術(shù)今后的發(fā)展進行了展望。
1.1.1 CBEs的建立 單堿基編輯系統(tǒng)是基于CRISPR/Cas9系統(tǒng)開發(fā)的更為精準(zhǔn)的堿基替換系統(tǒng)。CRISPR/Cas9系統(tǒng)工作時,sgRNA和Cas9核酸酶蛋白形成復(fù)合體,Cas9蛋白在sgRNA的引導(dǎo)下,找到編輯受體基因組的目標(biāo)靶點位置并與之結(jié)合形成三元復(fù)合體,隨后Cas9核酸酶的2個核酸酶結(jié)構(gòu)域HNH和RucV-like分別在前間區(qū)序列鄰近基序(Protospacer adjacent motif,PAM)上游3 nt的位置對互補鏈和非互補鏈進行單鏈切割,形成了平末端DSB位點。為避免Cas9核酸酶介導(dǎo)的雙鏈切割,哈佛大學(xué)David Liu團隊將Cas9蛋白的第10位(天冬氨酸Asp→丙氨酸Ala,D10A)和第840位氨基酸(組氨酸His→丙氨酸Ala,H840A)進行點突變,獲得了能被sgRNA引導(dǎo)并結(jié)合DNA但核酸酶功能喪失的dCas9(Catalytically dead Cas9),開創(chuàng)性地將dCas9與僅作用于單鏈DNA的高活性大鼠胞苷脫氨酶rAPOBEC1融合表達,首次開發(fā)出了不依賴DNA雙鏈斷裂且無需同源模板就能夠?qū)崿F(xiàn)定向轉(zhuǎn)換C·G至T·A的胞嘧啶堿基編輯器BE1,編輯窗口是PAM上游-17~-13位之間約5 nt的區(qū)段[16]。BE1的基本工作原理是dCas9-rAPOBEC1融合蛋白在sgRNA的引導(dǎo)下結(jié)合至靶點位置,rAPOBEC1將編輯窗口區(qū)內(nèi)胞嘧啶C脫氨基轉(zhuǎn)換成尿嘧啶U,在后續(xù)的DNA復(fù)制或修復(fù)過程中,U被識別為胸腺嘧啶T,互補鏈中相應(yīng)位置的鳥嘌呤G也被轉(zhuǎn)換為腺嘌呤A,因此產(chǎn)生了C·G至A·T的定向轉(zhuǎn)換。Komor等[16]研究發(fā)現(xiàn)BE1在人源H293T細胞中編輯效率僅為0.8%~7.7%,遠遠低于體外試驗(25%~40%),猜測是體內(nèi)尿嘧啶DNA糖基化酶(Uracil DNA glycosylase,UDG)會識別錯配的U·G,催化去除U后啟動堿基切除修復(fù)(Base-excision repair,BER)過程,將U·G恢復(fù)為C·G?;谶@一猜測,該團隊將尿嘧啶DNA糖基化酶抑制蛋白(Uracil DNA glycosylase inhibitor,UGI)融合到BE1,開發(fā)出第2代堿基編輯器BE2,成功將細胞內(nèi)C·G至T·A編輯效率提高至20%。真核生物的錯配修復(fù)機制(Eukaryotic mismatch repair,MMR)可以利用新合成DNA鏈上的切口識別錯誤堿基并進行切除和重新合成,為了進一步操縱DNA堿基修復(fù)過程,該團隊嘗試恢復(fù)dCas9蛋白的HNH核酸酶結(jié)構(gòu)域的切割活性,Cas9缺刻酶(Nickase Cas9,nCas9)能在互補鏈上產(chǎn)生單鏈切口,從而誘導(dǎo)激活MMR或BER途徑,使錯配的U·G被優(yōu)先修復(fù)為U·A,進而獲得目標(biāo)突變T·A,這一方式構(gòu)建的編輯系統(tǒng)即為第3代堿基編輯器BE3(圖1a)。與BE2相比,BE3在人類細胞中的C-T編輯效率(約37%)提高了2~6倍,編輯窗口仍為PAM上游-17~-13位[16]。這一系列極具創(chuàng)新的研究成果迅速點燃了生物科學(xué)領(lǐng)域科研工作者的研究熱情,基于BE3進行優(yōu)化或改進的單堿基編輯器版本層出不窮,編輯對象由人類細胞推廣至各類動植物和微生物。
圖1 CBE、ABE和GBE堿基編輯器原理Fig. 1 Schematic diagrams of CBE, ABE and GBE systems
1.1.2 CBEs的優(yōu)化 CBE系統(tǒng)的優(yōu)化和改造主要涉及以下5個方面:1)優(yōu)化UGI的拷貝數(shù)、增加游離的UGI分子或利用胞嘧啶脫氨酶對底物序列的偏好性,降低非目的編輯產(chǎn)物。Komor等[17]通過在BE3系統(tǒng)中融入第2份UGI構(gòu)建了第4代堿基編輯器BE4,該系統(tǒng)的C·G至T·A轉(zhuǎn)換效率增加了約50%,且減少了一半的非C至T副產(chǎn)物。Komor等[17]將BE4與DSB末端保護蛋白Gam融合,成功構(gòu)建了與BE4相比C·G至T·A編輯能力不變而Indels發(fā)生頻率大幅減少的BE4-Gam系統(tǒng)。Wang等[18]通過共表達BE3系統(tǒng)和游離的UGI分子獲得了增強型堿基編輯器(Enhanced base editor,eBE),該系統(tǒng)在抑制非目的Indels和替換編輯的同時,有效提高了B E 3的編輯準(zhǔn)確度。Geheke等[19]和Zhang等[20]通過改造人類胞嘧啶脫氨酶hAPOBEC3A創(chuàng)建了eA3A-BE3,強化了其對TC序列的偏好性,能高效引起TC模塊中C的突變而不編輯其他C,在減少了非目的編輯的同時縮小了編輯窗口。
2)優(yōu)化堿基編輯器的表達、融合其他功能性分子,提高CBE編輯活性。在BE4的表達核兩端融入核定位信號后,新系統(tǒng)BE4max編輯效率較BE4提升了1.3倍,通過優(yōu)化祖先序列的密碼子增強表達構(gòu)建的AncBE4max展現(xiàn)出比BE4max更優(yōu)越的編輯能力[21]。Zafra等[22]通過優(yōu)化BE3、BE4-Gam和xBE3的密碼子和增加額外的核定位信號,開發(fā)FNLS系列CBE,進一步大幅提高了編輯效率,編輯窗口內(nèi)的C·G至T·A轉(zhuǎn)換率提升了15~150倍。Zhang等[20]將DNA修復(fù)相關(guān)蛋白Rad51的單鏈DNA結(jié)合結(jié)構(gòu)域融合到nCas9和脫氨酶之間,構(gòu)建了具有超高編輯活性、更寬編輯窗口的CBE系統(tǒng)hyBE4max、hyA3A-BE4max和hyeA3A-BE4max。
3)篩選高特異性Cas9蛋白和胞嘧啶脫氨酶變體,降低sgRNA依賴/非依賴性脫靶效應(yīng)。Rees等[23]通過對Cas9核酸酶已知功能位點的突變,增強其DNA特異性,創(chuàng)建了脫靶效應(yīng)降低的高保真型BE3系統(tǒng)(High-fidelity BE3,HF-BE3)。Lee等[24]在大腸埃希菌中建立了定向進化技術(shù),篩選獲得了對靶序列具有高特異性的Sniper-Cas9,降低了脫靶效應(yīng)。Wang等[25]利用胞嘧啶脫氨酶的抑制序列結(jié)構(gòu)域(Deoxycytidine deaminase inhibitor,dCDI)開發(fā)可抑制脫靶位點編輯的變形式堿基編輯系統(tǒng)tBEs,降低了識別基因組特定DNA序列定位的定位器產(chǎn)生的Cas9/sgRNA依賴性脫靶效應(yīng)和對該特定基因組DNA序列進行編輯的效應(yīng)器產(chǎn)生的Cas9/sgRNA非依賴性單鏈DNA脫靶效應(yīng)。
4)改造或更換胞嘧啶脫氨酶,擴大或縮小編輯窗口。Kim等[26]構(gòu)建了CBE新系統(tǒng)YE1-BE3、YE2-BE3、EE-BE3和YEE-BE3,將BE3的編輯窗口核苷酸從5個縮小至1~2個,證實了胞嘧啶脫氨酶結(jié)構(gòu)域的突變會強烈影響編輯窗口大小。通過循環(huán)排列nCas9策略構(gòu)建的CP-CBEmax將編輯窗口核苷酸從4~5個擴大到8~9個,并減少了副產(chǎn)物的生成[27]。Nishida等[28]利用七鰓鰻激活誘導(dǎo)胞苷脫氨酶(Activation-induced cytidine deaminase,AID)同源蛋白PmCDA1創(chuàng)建了新的CBE系統(tǒng)Target-AID,編輯窗口為PAM上游第18位堿基附近3~5個堿基(集中在第16~20位)。Ma等[29]則在單堿基編輯系統(tǒng)TAM(Targeted AID-mediated mutagenesis)中融合了人類AID變體hAIDx(Haid P182X),編輯活性窗口為PAM上游-16~-12位堿基。美國斯坦福大學(xué)Michael Bassik團隊開發(fā)的CRISPR-X系統(tǒng)可以實現(xiàn)PAM下游+20~+40位窗口內(nèi)平均突變效率為20.6%。
5)篩選識別不同PAM序列的Cas蛋白,拓寬CBE靶向序列范圍。Kim等[26]構(gòu)建了識別PAM序列為NNGRRT的SaBE3、識別NGA的SpVQRCas9、識別NGAG的SpEQR-Cas9、識別NGCG的SpVRER-Cas9和識別NNNRRT的SaKKH-Cas9,使CBE系統(tǒng)能編輯的靶序列范圍擴增了2.5倍;該團隊還創(chuàng)建了可以識別包括NG、GAA和GAT在內(nèi)的多種PAM序列SpCas9變體(xCas9)[30]。Nishimasu等[31]創(chuàng)建了識別NG PAM位點的SpCas9-NG。Li等[32]構(gòu)建了特異識別PAM序列TTTV(V為A/C/G)的dCpf1-BE,編輯窗口為PAM序列下游第8~13位(PAM位點計為1)。
1.1.3 在植物中開發(fā)的高效胞嘧啶堿基編輯器 CBE在動物細胞被成功開發(fā)后,在植物中也得到了廣泛測試和改良。早期的BE3系統(tǒng)在植物中編輯效率(0~40%)較低[33-34];BE4在植物中的編輯效率(0~60%)得到一定的提升,但總體偏低且不穩(wěn)定[35-36];BE4max使得CBE在植物中的編輯效率提高至0~80%[37]。Target-AID在植物中實現(xiàn)了編輯效率4%~90%的高效編輯,編輯窗口(C2~C12)也得到拓展[38-39]。BE3、BE4和BE4max中使用的是rAPOBEC1或pamCDA1脫氨酶,它們對靶點序列環(huán)境有較強的偏好性,不能實現(xiàn)穩(wěn)定編輯,在植物的較多靶點中存在編輯效率為0的情況。
Zong等[40]將人源胞嘧啶脫氨酶hA3A替換成rAPOBEC1后,實現(xiàn)了不受靶點序列環(huán)境影響的高編輯效率(6%~80%)。Wang等[41]通過增加核定位信號拷貝數(shù)(F4NLS)提高了rAPOBEC1在植物中的編輯效率;該團隊還建立了一種基于靶向差異sgRNAs的代理報告系統(tǒng)(Discriminated sgRNAs based SurroGate system,DisSUGs),編輯效率比常規(guī)編輯方法提高了3~5倍[42]。華南農(nóng)業(yè)大學(xué)劉耀光團隊根據(jù)水稻密碼子偏好優(yōu)化evorAPOCBEC1、evoFERNY、evoCDA1和hA3A的核酸序列,并將它們與Cas9n-NG(識別NGN-PAM靶點)變體融合,開發(fā)出一套植物高效廣靶向胞嘧啶堿基編輯器PhieCBEs;與BE4對照相比,PhieCBEs的平均編輯效率提高了3~8倍,消除了堿基序列環(huán)境的偏好性,展現(xiàn)出穩(wěn)定的編輯能力[43]。
1.2.1 ABEs的建立 人類致病性的SNPs中需要被糾正的A·T至G·C類型占總數(shù)的48%,CBEs堿基編輯器雖然可以實現(xiàn)C·G至T·A的堿基編輯,但可替換的堿基類型非常有限,限制了堿基編輯器的應(yīng)用范圍。Gaudelli等[44]在2017年開發(fā)了可以實現(xiàn)A·T至G·C轉(zhuǎn)換的ABEs,擴大了堿基編輯的范圍;研究發(fā)現(xiàn)自然界中存在的腺嘌呤脫氨酶只在游離腺嘌呤、游離腺苷、RNA中的腺苷或錯配的RNA-DNA異源雙鏈中脫氨,不能以雙鏈DNA或單鏈DNA作為底物對A堿基脫氨,因此不能將自然界中存在的腺嘌呤脫氨酶直接運用于堿基編輯系統(tǒng)中。由于大腸埃希菌RNA腺苷脫氨酶TadA不需要小分子激活且作用于多核苷酸,該團隊以TadA作為改造對象進行人工馴化,通過易錯PCR、DNA重排等策略對野生型TadA的氨基酸位點進行隨機突變,經(jīng)過7輪的改造成功開發(fā)出可以作用于單鏈DNA的ABE系統(tǒng)ABE1.2至ABE7.10;在哺乳動物細胞中,A·T至G·C的平均編輯效率由ABE1.2的3%提高至ABE7.10的58%[44]。ABE開發(fā)的過程實現(xiàn)了重大突破,對獲得和利用特定功能酶有重要的借鑒意義。
1.2.2 ABEs的優(yōu)化 由于自然界中缺乏可以直接作用于DNA的腺嘌呤脫氨酶,優(yōu)化策略主要是在TadA7.10的基礎(chǔ)上進行,如優(yōu)化密碼子、更換核定位信號、更換識別不同PAM的Cas核酸酶等。Koblan等[21]通過使用GenScript公司優(yōu)化的密碼子序列,將SV40 NLS換成bipartite NLS(bpNLS),并在TadA7.10的N端增加bpNLS,優(yōu)化出編輯效率比ABE7.10進一步穩(wěn)定提高的ABEmax。Huang等[27]將預(yù)測結(jié)構(gòu)比SpCas9更接近R-loop ssDNA的4個SpCas9變體CP1012、CP1028、CP1041和CP1249分別融入ABEmax系統(tǒng),擴大了ABE系統(tǒng)的編輯窗口;將識別不同PAM序列的SpCas9變體VRQR(PAM:NGA)、VRER(PAM:NGCG)、xCas9(PAM:NG)和Cas9NG(PAM:NG)融入ABEmax系統(tǒng),拓展了ABEmax在基因組的可編輯范圍。此外,利用不同菌株來源的Cas9蛋白,如SaCas9(PAM:NNGRRT)、SaCas9-KKH(PAM:NNNRRT)和ScCas9(PAM:NNGN)等 在ABE7.10或ABEmax的基礎(chǔ)上試驗,拓展了基因組的編輯范圍[45-46]。
前期對ABE的改良主要是在ABE7.10的基礎(chǔ)上進行,包括替換核定位信號、優(yōu)化ABE7.10的密碼子以及使用不同Cas9變體拓展PAM的靶向范圍,這些均沒有實質(zhì)性提高TadA脫氨酶的活性。2020年,Richter等[47]通過噬菌體輔助連續(xù)進化系統(tǒng)(PACE)篩選到在ABE7.10的基礎(chǔ)上增加8個新突變位點的突變體TadA8e,其脫氨活性及與Cas蛋白的兼容性均大幅提高;與ABE7.10相比,利用TadA8e構(gòu)建的ABE8e(圖1b)堿基編輯活性增加了590倍。Lapinaite等[48]對ABE8e的超高分辨率冷凍電鏡結(jié)構(gòu)分析結(jié)果顯示,ABE8e催化DNA脫氨的速度比早期的ABE7.10和miniABEmax快約1100倍,超高的脫氨速度增強了ABE堿基編輯的有效性和適用性,擴大了ABE的應(yīng)用范圍。
1.2.3 在植物中開發(fā)的高效腺嘌呤堿基編輯器工具 在水稻、擬南芥、小麥、油菜等植物中,ABE系統(tǒng)也得到了廣泛測試和改良。Li等[49]在ABE7.10的基礎(chǔ)上通過優(yōu)化脫氨酶密碼子、調(diào)整脫氨酶和NLS的位置、使用不同的NLS個數(shù)等策略優(yōu)化組合,最終獲得植物腺嘌呤堿基編輯器PABE-7,其在小麥和水稻中的編輯效率比ABE7.10提高了1.1倍。中國科學(xué)院上海植物逆境生物學(xué)研究中心朱健康團隊開發(fā)了ABE-P1(ABE7.10)、ABE-P1S(只含TadA*)、ABE-P2(ABE-SaCas9)、ABE-P3(VQRABE)、ABE-P4(VRER-ABE)、ABE-P5(SaKKHABE)、ABE-P6(xCas93.6)、ABE-P7(xCas93.7)、ABE-NG(Cas9-NG)、ABE-NG-S(只含單個TadA*7.10)、ABEmax-nCas9/nCas9-NG(ABEmax)等,在一定程度上提高了植物編輯效率、拓展了靶向范圍[37,50-53]。Zeng等[35]在水稻中對Cas9n-ABE、xCas9n-ABE、Cas9n-NG-ABE和eCas9n-NGABE測試后發(fā)現(xiàn),ABE7.10的編輯效率較低。在擬南芥中使用pRPS5 A啟動子驅(qū)動ABE7.10可以實現(xiàn)有效編輯,而使用p35S和pYAO啟動子的未發(fā)現(xiàn)有效編輯[54];ABE-xCas9、ABE-nCas9-NG也在擬南芥中實現(xiàn)了有效編輯,但效率均不高[55]??梢?,植物中ABE系統(tǒng)ABE7.10的編輯活性并不高,這也證明了TadA*7.10的脫氨活性較低。
高效腺嘌呤堿基編輯器ABE8e在動物細胞中報道后,植物科研工作者對ABE8e也開展了廣泛的研究。Tan等[56]根據(jù)水稻密碼子偏好性優(yōu)化TadA8e、單鏈DNA結(jié)合DBD的核苷酸序列,并將它們分別與2種識別NGN-PAM(PAM-less)的SpCas9n變體編碼基因SpCas9n-NG和SpGn以及一種識別NNN-PAM(PAM-free)的SpCas9n變體編碼基因SpRYn融合,開發(fā)了一套植物高效廣靶向的腺嘌呤單堿基編輯器PhieABEs(hyABE8e-NG、hyABE8e-SpG和hyABE8e-SpRY),平均編輯效率分別為67.8%、73.9%和78.5%,比對照組ABE7.10(2.6%)提高了26~30倍。Yan等[57]將TadA8e、TadA9(TadA8e+V82S+Q154R)分別融合不同的Cas9變體(包括SpCas9n、SpCas9n-NG、SpRYn和ScCas9n),這些Cas9變體兼容性非常高,特別是TadA9整合SurroGate系統(tǒng),多個測試靶位點的堿基編輯效率超過90%。與Cas9變體融合的TadA8e均表現(xiàn)出A·T至G·C的高編輯效率[58-60]。
CBE或ABE介導(dǎo)的堿基編輯器主要實現(xiàn)同類堿基間的轉(zhuǎn)換編輯(嘌呤至嘌呤、嘧啶至嘧啶)。如何開發(fā)可實現(xiàn)堿基顛換編輯的新型堿基編輯器成了相關(guān)領(lǐng)域?qū)<夜餐伎嫉膯栴}。2020年7月,美國哈佛醫(yī)學(xué)院Kurt等[61]和中國科學(xué)院天津工業(yè)生物技術(shù)研究所Zhao等[62]以背靠背的形式分別在《Nature Biotechnology》在線發(fā)表了能有效介導(dǎo)C-G及CA堿基顛換的新型單堿基編輯器GBEs,2項研究遵循了類似的研究思路,在CBE系統(tǒng)的基礎(chǔ)上去除UGI,同時增加UDG以期獲得更高的C-G顛換率,GBE的創(chuàng)建填補了堿基編輯器功能空缺。Kurt等[61]開發(fā)了2種堿基顛換編輯器CGBE1(圖1c)和miniCGBE1,前者基于BE4max系統(tǒng)改造,由RNA引導(dǎo)的nCas9、rAPOBEC1(R33A)及大腸埃希菌來源的尿嘧啶DNA N-糖基化酶eUNG組成,其中,rAPOBEC1(R33A)有利于減少RNA脫靶、增強DNA編輯活性,后者在CGBE1的基礎(chǔ)上去除了eUNG;這2種堿基編輯器都可以有效介導(dǎo)目標(biāo)序列C-G堿基顛換,并減少非目的C-W(W為A/T)和indels產(chǎn)生;CGBE1在HEK293T細胞中的C-G顛換效率平均為14.4%,miniCGBE1則降低了indels產(chǎn)生的頻率且伴隨編輯效率(13%)小幅降低。Zhao等[62]則創(chuàng)建了能在大腸埃希菌中實現(xiàn)CA顛換的AID-nCas9-Ung(即GBE),該系統(tǒng)的平均編輯特異性是93.8%、編輯效率為24.1%;開發(fā)了能在哺乳動物細胞中實現(xiàn)C-G顛換的單堿基編輯器APOBEC-nCas 9-Ung,對靶序列第6位的C(PAM序列記為21~23)有較高的編輯特異性,CG顛換效率為5.3%~53.0%。新加坡科技研究局基因組研究所開發(fā)了nCas9融合脫氨酶及不同堿基切除修復(fù)蛋白的系列CGBE系統(tǒng),其中,rAPOBECnCas9-rXRCC1的編輯效率(15.4%)最高,編輯產(chǎn)物純度高達90%[63-64]。
Yuan等[65]通過改變UNG和脫氨酶的種類和相關(guān)位置,結(jié)合密碼子優(yōu)化,開發(fā)了OPTI-CGBEs。Koblan等[66]針對DNA修復(fù)基因的CRISPRi篩選,確定了影響C·G至G·C編輯結(jié)果的因素,開發(fā)了與機器學(xué)習(xí)模型配套的系列工程化CGBE,實現(xiàn)了更高效、特異的C·G至G·C顛換編輯,并通過靶點文庫分析和機器學(xué)習(xí)創(chuàng)建了能夠準(zhǔn)確預(yù)測CGBE編輯結(jié)果的CGBE-Hive。Chen等[67]利用SpRY Cas9變體進一步拓寬了CGBE的基因組靶向范圍。Sun等[63]對GBE系統(tǒng)進行了升級,將人類Ung換成了釀酒酵母源的Ung,融入Rad51蛋白的單鏈DNA結(jié)合結(jié)構(gòu)域,并在APOBEC1中引入R33A突變,最終構(gòu)建了GBE2.0,編輯效率達30.88%、C·G至G·C顛換編輯產(chǎn)物純度為35.57%~92.92%。目前,GBE系統(tǒng)已經(jīng)被應(yīng)用到擬南芥、水稻、番茄、白楊等植物的堿基編輯中[68-71]。
2020年Li等[72]開發(fā)的雙重堿基編輯器-飽和靶向內(nèi)源基因突變堿基編輯器STEME(Saturated targeted endogenous mutagenesis editors),實現(xiàn)了植物基因的定向進化和功能篩選,揭開了雙重堿基編輯器D B E研究的序幕。該團隊在nCas9的N端同時融合了2種脫氨酶(胞嘧啶脫氨酶A P O B E C 3 A和腺嘌呤脫氨酶ecTad AecTadA7.10),并在nCas9的C端融合1個UGI拷貝或自由表達2個UGI拷貝,創(chuàng)建的STEME-1~STEME-4和Cas-NG版本的STEME-5可以在單個sgRNA的引導(dǎo)下誘導(dǎo)靶位點同時產(chǎn)生C·G至T·A和A·T至G·C的突變;STEME-1(圖2a)在水稻原生質(zhì)體中C·G至T·A編輯效率高達61.61%,而C·G至T·A和A·T至G·C同時突變的效率也高達15.50%;在20個sgRNA的引導(dǎo)下,STEMENG能對水稻乙酰輔酶A羧化酶OsACC編碼的56個氨基酸產(chǎn)生接近飽和的突變,編輯效率達73.21%,并獲得了抗除草劑的水稻材料[72]。隨后,《Nature Biotechnology》發(fā)表了3款構(gòu)建方案和功能類似的雙堿基編輯器[73-75]。Zhang等[73]將胞嘧啶脫氨酶rAPOBEC1、腺嘌呤脫氨酶TadA與nCas9進行不同形式的組裝融合,用具有更高誘導(dǎo)突變活性的hAID替換rAPOBEC1,并輔以密碼子優(yōu)化、NLS優(yōu)化、UGI串聯(lián)形式優(yōu)化和linker序列優(yōu)化等調(diào)整,獲得了雙堿基編輯器A&C-BEmax;與單堿基編輯器ABEmax和AID-BE4max相比,A&CBEmax對腺嘌呤的活性略有降低、編輯窗口一致,但對胞嘧啶的活性有所提高、編輯窗口從C3~C13擴大至C2~C17且RNA脫靶活性大幅降低。Sakata等[74]開發(fā)的Target-ACEmax選擇CBE系統(tǒng)Target-AID作為雙堿基編輯器融合基礎(chǔ),融合了ABE7.10。Grünewald等[75]開發(fā)的SPACE則融合了Target-AID和體量更小的miniABEmaxV82G。與同時表達2個單堿基編輯器相比,SPACE在目標(biāo)位點具有更高效的雙重編輯活性,Target-ACEmax的雙重編輯效率與原有的單堿基編輯器編輯效率相當(dāng)。
2021年,Xu等[76]開發(fā)了適用于植物的雙堿基編輯器pDuBE1,利用日本七鰓鰻胞嘧啶脫氨酶同源物CDA1L-4構(gòu)建了在C1~C12有較高編輯效率的C端胞嘧啶堿基編輯器CT-CBE,并在CTCBE的N端融合了TadA-8e,開發(fā)出pDuBE1,編輯效率可達87.6%,在穩(wěn)定轉(zhuǎn)化的植物細胞中C·G至T·A和A·T至G·C的同時轉(zhuǎn)換頻率高達49.7%。Xiong等[77]報道了包括多種雙堿基編輯器CBE-ABE在內(nèi)的植物堿基編輯工具箱,融合了AID10、nCas9和ABE8e,能夠?qū)Π行蛄?~8位的A或不同區(qū)域的C進行同時編輯,豐富了編碼基因和非編碼基因的功能研究工具。Liang等[78]將ABE與CGBE融合,開發(fā)出多功能雙堿基編輯器AGBE,可以在單個sgRNA的引導(dǎo)下誘導(dǎo)同一靶位點發(fā)生A-G、C-G、C-T和C-A 4種堿基轉(zhuǎn)換,大幅增加了編輯產(chǎn)物的多樣性,有利于飽和突變文庫的構(gòu)建;通過全基因組和轉(zhuǎn)錄組測序分析,確認AGBE沒有引起明顯的DNA或RNA水平的脫靶效應(yīng),是高效、安全的堿基編輯工具。
單堿基編輯器始終有其特定的適用范圍,普適性編輯靶序列是當(dāng)前的技術(shù)熱點。2019年Anzalone等[79]報道了一種通用的、能精確編輯基因組的引導(dǎo)編輯器PE1~PE3,可以在不產(chǎn)生DSB和不需要DNA供體的情況下,通過“搜索和替代”介導(dǎo)人類細胞中的小片段靶向插入、刪除以及所有12種可能的堿基轉(zhuǎn)/顛換。相比于CBE或ABE,PE1系統(tǒng)主要在sgRNA和Cas9蛋白2個方面進行了重點改造:1)在sgRNA的3′末端增加了一段RNA序列(該序列由與目標(biāo)DNA鏈互補的引物結(jié)合位點PBS和攜帶編輯后模板信息的逆轉(zhuǎn)錄模板序列RTtemplate組成),改造后的sgRNA被命名為pegRNA;2)將切割非互補鏈的nCas9(H840A)與M-MLV逆轉(zhuǎn)錄酶融合。PE的工作原理是:pegRNA引導(dǎo)nCas9(H840A)在靶序列的非互補鏈上進行切割(即切割PAM識別鏈PAM上游3 nt處);隨后,pegRNA的PBS序列與非互補鏈識別配對,M-MLV逆轉(zhuǎn)錄酶以攜帶編輯后模板信息的RT template為模板合成編輯后的新序列,新序列在切口附近形成動態(tài)平衡中的5′ flap和3′ flap結(jié)構(gòu);在修復(fù)過程中,不攜帶突變的5′ flap會被結(jié)構(gòu)特異性內(nèi)切酶優(yōu)先切除,攜帶目的編輯序列的3′ flap得以保留,插入或刪除后不能匹配的DNA雙鏈會通過錯配修復(fù)機制修復(fù)互補鏈,最終保留突變序列。PE1在293T細胞中的編輯效率并不高,點突變率0.7%~5.5%、indels突變率4%~17%。該團隊優(yōu)化了M-MLV逆轉(zhuǎn)錄酶部分氨基酸序位點創(chuàng)建了PE2(圖2b),改善了熱穩(wěn)定性、DNA/RNA雜交緊密性、逆轉(zhuǎn)錄連續(xù)性,使PE1的indels編輯效率提升了2倍以上;在pegRNA下游增加了可介導(dǎo)互補鏈切割的sgRNA,獲得了PE3,編輯效率(約55%)提升了1.5~4.2倍,并在PE3的基礎(chǔ)上開發(fā)了降低indels突變率的PE3b版本[79]。這項研究受到了廣泛關(guān)注,PE系統(tǒng)也被迅速應(yīng)用到植物研究中。
圖2 DBE、PE、線粒體堿基編輯器原理Fig. 2 Schematic diagrams of DBE, PE and mitochondrial base editors
2020年,Lin等[80]將PE2、PE3、PE3b進行密碼子、啟動子和編輯條件的優(yōu)化,獲得了適用于植物的引導(dǎo)編輯系統(tǒng)(Plant prime editor systems,PPEs)PPE2、PPE3和PPE3b,并成功在水稻和小麥原生質(zhì)體中實現(xiàn)了靶位點的點突變、插入和缺失精準(zhǔn)編輯,編輯效率0.2%~8.0%;與26 ℃相比,37 ℃高溫培養(yǎng)原生質(zhì)體可以顯著提升PPE的編輯效率。隨后,多個團隊在水稻中開展了PE的應(yīng)用試驗[81-85]。Li等[81]精準(zhǔn)編輯了水稻外源突變基因hptII和內(nèi)源基因OsEPSPS,獲得了精準(zhǔn)編輯純合和雜合植株,編輯效率分別為9.38%和2.22%。Xu等[82]在水稻細胞中實現(xiàn)了精準(zhǔn)編輯,但編輯效率僅為0.05%~1.55%;測試了不同PBS長度、RT長度、編輯事件類型、nsgRNA等因素對PE編輯效率的影響。Tang等[83]在水稻穩(wěn)定轉(zhuǎn)化系中引入多個目標(biāo)位點的精準(zhǔn)編輯,但編輯效率不穩(wěn)定。Hua等[84]改造的sp-PE2和sp-PE3均可以高效介導(dǎo)外源基因GFP失活位點的編輯,但對內(nèi)源靶點效率很低。Butt等[85]成功在水稻愈傷組織中精準(zhǔn)編輯了乙酰乳酸合成酶編碼基因OsALS,創(chuàng)制了除草劑抗性的水稻材料,編輯效率為0.26%~2.00%;對株型調(diào)控基因OsIPA和OsTB1編輯后獲得了相應(yīng)表型。Lu等[86]在雙子葉植物番茄中進行了PE編輯嘗試,在再生嫩芽不同位點的編輯效率為0.0025%~1.6600%,后代穩(wěn)定植株中編輯效率為3.4%~6.7%。以上研究針對PE編輯器的各個元件都進行了優(yōu)化嘗試,但始終未在編輯效率上獲得大的突破,在植物系統(tǒng)中PE3、PPE3b的編輯效率并沒有比PE2的高,說明在植物系統(tǒng)中互補鏈切口的引入不能提升編輯效率。Nelson等[87]發(fā)現(xiàn)pegRNA包含PBS和RT template的3′端,容易降解,影響了PE系統(tǒng)的編輯效率;在PE系統(tǒng)的pegRNA 3′端融合了結(jié)構(gòu)化的RNA模塊(epegRNA),在不增加脫靶效應(yīng)的情況下,編輯效率提升了3~4倍。
為了突破PE系統(tǒng)在植物中的編輯效率限制,科研人員做了諸多嘗試。Jiang等[88]增強了pegRNA的表達,在玉米中獲得了更高的編輯效率,2個位點分別獲得了53.2%和6.5%的精準(zhǔn)點突變。Lin等[89]發(fā)現(xiàn)當(dāng)PBS的熔解溫度為30 ℃左右時,PE系統(tǒng)在水稻多數(shù)位點的編輯效率最高;與單個pegRNA相比,dual-pegRNA策略(設(shè)計2個pegRNA分別靶向靶序列的2條鏈)將編輯效率提升了3倍;上述2種方法疊加使PE效率提高至17.4倍。此外,建立了基于Tm值指導(dǎo)的PBS序列設(shè)計,開發(fā)了植物pegRNA設(shè)計網(wǎng)站PlantPegDesigner(http://www.plantgenomeediting.net),方便研究人員快速設(shè)計適合特定靶序列的高活性pegRNA。Jin等[90]通過全基因組重測序?qū)PE系統(tǒng)的脫靶效應(yīng)進行了全面評估,確認了PPE系統(tǒng)在全基因組水平上具有高特異性。Xu等[91]在人類細胞、水稻愈傷組織和穩(wěn)定系中測試發(fā)現(xiàn),在反轉(zhuǎn)錄模板中引入同義錯配堿基能提高該靶位點的編輯效率;將MMLV融合在nCas9(H840A)的N端(其他植物PEs沿用了M-MLV融合在nCas9 C端的方式)能有效提高編輯效率;引入同義錯配堿基和N端融合時,構(gòu)建的PE-P3-RT-M編輯效率具有倍增協(xié)同效應(yīng),在玉米和水稻上的編輯效率提高了3倍,在原低效靶點處的編輯效率提高了10倍以上。Zong等[92]針對PE系統(tǒng)的蛋白組分進行優(yōu)化,建立了對植物更高效、適用性更廣泛的ePPE(Engineered plant prime editor)系統(tǒng),改進策略包括刪除影響RNA/DNA結(jié)合穩(wěn)定性的M-MLV RT的RNase H結(jié)構(gòu)域、在M-MLV RT的N端融合M-MLV RT的輔助因子病毒核衣殼蛋白(Nucleocapsid,NC),使堿基替換、片段插入和刪除的效率比PPE提高了5.8倍;ePPE系統(tǒng)與dual-pegRNA、epegRNA策略相結(jié)合可以提高編輯效率,利用ePPE系統(tǒng)獲得了甲咪唑煙酸和煙嘧磺隆除草劑抗性水稻新材料。Li等[93]創(chuàng)制了能篩選PE編輯陽性植株的3個代理引導(dǎo)編輯器,即基于HygromycinY46*的代理引導(dǎo)基因編輯器(P E 3-H S)、基于OsALSS627I的代理引導(dǎo)基因編輯器(PE3-AS)以及基于HygromycinY46*和OsALSS627I的雙代理引導(dǎo)基因編輯器(PE3-DS),精準(zhǔn)編輯了水稻內(nèi)源基因OsSPL14、OsDHDPS和OsNR2。Zou等[94]在PPE3的基礎(chǔ)上優(yōu)化pegRNA 3′末端,建立了編輯效率更高的PPE3-evopreQ1和PPE3-mpknot系統(tǒng),并對水稻內(nèi)源基因OsCDC48、OsALS、OsDEP1、OsEPSPS和OsROC5精準(zhǔn)編輯。
早期的PE系統(tǒng)在小片段DNA精確插入或刪除方面已有良好的表現(xiàn),實現(xiàn)了最長44 bp的精準(zhǔn)插入和80 bp的精準(zhǔn)刪除[79]。與CRISPR/Cas系統(tǒng)相比,PE系統(tǒng)對大片段的操控還不夠成熟。2021年《Nature Biothechnology》發(fā)表了精確刪除大片段DNA的方法PRDAR(PE-Cas9-based deletion and repair)[95]和PRIME-Del[96],這2種方法都用了類似的雙pegRNA策略。PEDAR系統(tǒng)用功能齊全的Cas9替換了nCas9,雙pegRNA在預(yù)切除DNA片段的兩端產(chǎn)生DSB切口后,逆轉(zhuǎn)錄酶發(fā)揮功能,在兩側(cè)合成短的互補延伸序列,最終通過修復(fù)機制完成精準(zhǔn)刪除,在細胞系中實現(xiàn)了以最高60 bp序列精準(zhǔn)替換1~10 kb的基因組片段,并在小鼠模型中去除Fah基因中1.38 kb的致病性插入并恢復(fù)了Fah在肝臟中的表達[95]。PRIME-Del則沿用nCas9設(shè)計了2個pegRNA,分別在預(yù)刪除DNA片段上形成對側(cè)缺口,實現(xiàn)10 kb以內(nèi)任意片段大小的精準(zhǔn)刪除,并能在刪除片段的同時引入短插入(最長30 bp)而不會顯著影響效率或精度,編輯效率為1%~30%,顯著高于CRISPR/Cas9系統(tǒng);PRIME-Del的刪除和插入效率較高且錯誤率低,還能同時實現(xiàn)多重刪除[96]。Anzalone等[97]開發(fā)的雙引導(dǎo)編輯系統(tǒng)TwinPE(Twin prime editing)融合能切除、倒位和整合DNA大片段序列的位點特異性重組酶,實現(xiàn)人類基因組大片段的刪除、替換和倒位;5.6 kb片段的插入編輯效率為1.4%~6.8%,40 kb片段的倒位效率約9%。Wang等[98]開發(fā)的GRAND中,2個pegRNA的逆轉(zhuǎn)錄模板區(qū)與目標(biāo)位點不同源但相互互補,可通過逆轉(zhuǎn)錄過程高效靶向插入20~1000 bp的DNA片段,150 bp片段插入的編輯效率高達60%,250 bp片段的插入效率達30%。Tao等[99]證明了將nick sgRNA定位在pegRNA的模板序列附近有助于針對性地刪除大片段,將2個sgRNA都改造為pegRNA以實現(xiàn)雙向prime編輯(Bi-PE),編輯效率提高了16倍、編輯產(chǎn)物的準(zhǔn)確性提高了60倍。這些新技術(shù)比CRISPR/Cas系統(tǒng)更適用于精準(zhǔn)、靈活的基因大片段刪除和整合。
線粒體作為真核生物最重要的細胞器之一,既是細胞的能量代謝中心,也是細胞內(nèi)離子穩(wěn)態(tài)調(diào)節(jié)、氧化還原穩(wěn)態(tài)調(diào)節(jié)、細胞凋亡調(diào)控等重要生理過程的信號樞紐[100]。線粒體攜帶環(huán)形的具有半自主復(fù)制能力的線粒體DNA(Mitochondrial DNA,mtDNA),mtDNA突變或線粒體功能異常被認為與上百種人類疾病相關(guān),如阿爾茨海默病和帕金森氏病等神經(jīng)退行性疾病、心血管氧化應(yīng)激損傷等[101]。如何將sgRNA轉(zhuǎn)運至線粒體一直是CRISPR/Cas系統(tǒng)應(yīng)用于線粒體堿基編輯器開發(fā)的瓶頸問題,目前尚無較好的解決方案。早期線粒體編輯器依賴于無RNA介導(dǎo)的核酸酶ZFNs[102]和TALENs[103-105]與線粒體靶向信號的融合,從而誘導(dǎo)mtDNA雙鏈斷裂,線性化的mtDNA被迅速降解。這些方法不能在mtDNA中引入特定的核苷酸突變,當(dāng)應(yīng)用在同質(zhì)mtDNA時,會因為破壞所有mtDNA拷貝而損害生物體;當(dāng)應(yīng)用在異質(zhì)mtDNA中時,野生型mtDNA被降解,突變型mtDNA形成比例優(yōu)勢產(chǎn)生表型漂變,可用于線粒體基因功能研究或疾病治療研究[106-107]。伯克氏菌編碼的脫氨酶DddA是一種由細胞間蛋白傳遞系統(tǒng)T6SS介導(dǎo)運輸?shù)募毦舅兀珼ddA的毒性結(jié)構(gòu)域DddAtox與APOBEC酶結(jié)構(gòu)接近,能催化雙鏈DNA序列的胞嘧啶突變?yōu)槟蜞奏?。Mok等[107]將DddAtox與TALE、MTS融合,開發(fā)了不依賴sgRNA的新型線粒體編輯器DdCBE(圖2c),能催化mtDNA中目的序列G·C至A·T的精準(zhǔn)編輯,在HEK293T細胞中的編輯效率為4.6%~49.0%;為避免DddAtox的毒性,將其分為2個DddAtox半體(DddAtox-N和DddAtox-C),分別導(dǎo)入線粒體后在靶標(biāo)位點重組為活性脫氨酶;DdCBE對底物序列有嚴格的偏好性,主要編輯TC轉(zhuǎn)換至T-T。針對這一缺陷,該團隊利用噬菌體輔助連續(xù)進化(PACE)和噬菌體輔助非連續(xù)進化(PANCE)技術(shù)對DdCBE進行了升級,創(chuàng)建了編輯更高效、靶向更廣泛的線粒體編輯器新版本DddA6和DddA11,將MTS置換成NLS后,也可以作為核DNA的堿基編輯器,大大提高了DdCBE的有效性和適用性[108]。Cho等[109]融合MTS、TALE、腺嘌呤脫氨酶TadA8e和DddAtox,構(gòu)建了線粒體嘌呤編輯器轉(zhuǎn)錄激活因子效應(yīng)物相關(guān)脫氫酶(Transcription activator-like effector-linked deaminase, TALED),DddAtox幫助TadA8e接近mtDNA,使其更容易實現(xiàn)對線粒體基因組的A-G堿基轉(zhuǎn)換編輯;TALED在人類細胞中編輯能力高效穩(wěn)定、無細胞毒性、極少線粒體或基因組脫靶效應(yīng),該技術(shù)突破了線粒體基因組A-G的堿基轉(zhuǎn)換技術(shù)難關(guān);通過調(diào)整TALED的組成部分,開發(fā)出可同時實現(xiàn)C-T和A-G堿基轉(zhuǎn)換的工具。
Kang等[110]基于DdCBE系統(tǒng)組裝了針對線粒體和葉綠體基因的堿基編輯系統(tǒng),在生菜或油菜籽愈傷組織的線粒體中堿基編輯效率高達25%、在葉綠體中高達38%。Li等[111]改造了DdCBEs系統(tǒng)并將其應(yīng)用至葉綠體基因編輯,使用水稻黃單胞菌中的TALE融合葉綠體信號肽CTP、UGI以及2個DddAtox半體,對光系統(tǒng)I中葉綠素a的保守葉綠體基因psaA進行堿基編輯,編輯效率達64%。
基因編輯技術(shù)發(fā)展至今,已被廣泛應(yīng)用于植物基因功能研究及作物遺傳改良,其中大部分是基于NHEJ修復(fù)途徑引起的基因敲除。然而,在實際生產(chǎn)應(yīng)用中,控制作物性狀的等位基因間往往僅存在一個或多個堿基的變異,此時便無法通過基因敲除達到創(chuàng)建優(yōu)良等位基因的目的。堿基編輯器則能在不破壞基因功能的基礎(chǔ)上,通過改變編碼區(qū)或表達調(diào)控區(qū)的單個堿基實現(xiàn)等位基因間的精準(zhǔn)替換和基因表達的精細調(diào)節(jié),擴大了基因編輯技術(shù)在作物遺傳改良中的應(yīng)用范圍。如在已發(fā)現(xiàn)的調(diào)控水稻關(guān)鍵農(nóng)藝性狀的基因變異位點當(dāng)中,超過一半為單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)位點,這些位點的58%為C-T/A-G的堿基轉(zhuǎn)換,可由CBE/ABE編輯器實現(xiàn)精準(zhǔn)編輯[112]。GBE、PE等編輯系統(tǒng)理論上能與CBE/ABE編輯器互為補充,實現(xiàn)對所有單堿基的任意轉(zhuǎn)換/顛換編輯。此外,堿基編輯器還能在編碼序列人為創(chuàng)建終止密碼子,實現(xiàn)基因敲除的效果。
目前,利用堿基編輯器改良作物性狀的研究主要集中于水稻,并逐漸拓展到小麥、玉米、油菜、番茄、土豆、西瓜等作物[113-114]。通過改造已知的功能基因有效提高了作物的產(chǎn)量和抗逆性、改良了作物品質(zhì)。例如,通過編輯氮轉(zhuǎn)運相關(guān)基因NRT1.1B提高氮利用效率,實現(xiàn)了作物增產(chǎn)[34,49,115];通過編輯株型控制基因SPL14[50,84,115-116]、穗型控制基因DEP1[36,49]和粒型控制基因GRF3/4[117]等增加單株穗粒數(shù)和千粒質(zhì)量;對在不同物種中保守存在的基因ALS進行編輯能夠提高多個作物對除草劑的抗性[39-40,49,82,84,118-124];編輯抗性基因Pi-d2增強了水稻的稻瘟病抗性[118];對水稻SLR1進行改造則能降低株高[34,84],從而提高作物抗倒伏能力。在作物品質(zhì)改良方面的工作目前主要圍繞谷粒食味優(yōu)化和營養(yǎng)強化展開,如通過編輯基因Waxy調(diào)節(jié)稻米直鏈淀粉含量[35,117,125],編輯番茄紅素脫氫酶基因PDS豐富大米營養(yǎng)成分[32,126]。
單堿基編輯器作為研究由單堿基變異引起的遺傳性狀的重要工具,其靶向特異性或脫靶效應(yīng)受到廣泛關(guān)注。宗媛等[127]將堿基系統(tǒng)的脫靶分為傳統(tǒng)的可預(yù)測脫靶、全基因組范圍內(nèi)不可預(yù)測脫靶和轉(zhuǎn)錄水平脫靶。研究表明,單堿基編輯器會導(dǎo)致大量無法預(yù)測的脫靶突變[128-129]。Jin等[128]發(fā)現(xiàn)BE3和HF-BE3會誘導(dǎo)水稻的全基因組產(chǎn)生不依賴于sgRNA的C-T轉(zhuǎn)換突變,這些突變主要富集在轉(zhuǎn)錄的基因區(qū)域且無法預(yù)測;ABE脫靶效應(yīng)則不明顯,表明脫靶效應(yīng)可能與胞苷脫氨酶或UGI等組分有關(guān)。Zuo等[129]建立了新型脫靶檢測技術(shù)GOTI(Genome-wide off-target analysis by two-cellembryo injection),并對小鼠受精卵轉(zhuǎn)化系進行全基因組測序分析,確認了BE3存在嚴重的脫靶效應(yīng)且部分靶點出現(xiàn)在抑癌基因上,帶來了臨床安全隱患。Grünewald等[130]發(fā)現(xiàn),單堿基編輯器在編輯DNA后還會造成大量的RNA突變。Zhou等[131]的研究也證實了相關(guān)結(jié)論,他們以人類細胞系為模型發(fā)現(xiàn),BE3、ABE7.1都顯著提升了mRNA的突變率。Li等[132]的研究表明,用高效腺嘌呤脫氨酶TadA8和TadA9組裝的ABE系統(tǒng)同樣也會引起DNA和RNA的隨機脫靶突變。這些研究為單堿基編輯器的開發(fā)和應(yīng)用帶來更多的思考,開發(fā)的版本主要采用蛋白質(zhì)生物工程技術(shù)篩選保留胞嘧啶脫氨酶的催化活性、降低DNA和RNA脫靶效應(yīng)[133-135]。2022年賴良學(xué)團隊將脫氨酶與Cas9蛋白的引導(dǎo)系統(tǒng)分離,創(chuàng)制了脫氨酶與轉(zhuǎn)錄激活因子類效應(yīng)子(TALE)融合、Cas9蛋白與sgRNA融合的新型堿基編輯系統(tǒng)TaC9-ABE/CBE,可以完全消除Cas9依賴性脫靶而不影響靶向編輯效率[136-137]。Jin等[135,138]開發(fā)了基于水稻原生質(zhì)體和突變體植株的高通量堿基編輯器特異性評價方法;Kim等[139]開發(fā)了鑒別人類細胞中堿基編輯脫靶位點的改良版Digenome-seq。相比于動物基因功能研究或人類疾病治療研究,堿基編輯的脫靶效應(yīng)對植物應(yīng)用研究的影響小一些,這是因為:1)脫靶是否引起了突變表型可以通過后代的分離分析來確認,很大程度上可以鎖定研究基因與突變表型的關(guān)系;2)脫靶效應(yīng)若帶來了負向影響,在育種過程中將被自然或人為淘汰,若帶來正向影響,也能幫助基礎(chǔ)研究或推進育種[140-141]。
Wei等[142]通過GOTI分析發(fā)現(xiàn),線粒體編輯器DdCBE在小鼠胚胎的核基因組上產(chǎn)生了大量的單核苷酸變異脫靶位點,原因是線粒體定位信號不能完全正確靶向線粒體,對細胞核也有一定的靶向效應(yīng)。Lei等[143]的研究成果也證實了這一結(jié)論,該團隊在人類HEK29T細胞系中評估發(fā)現(xiàn),部分核基因組脫靶效應(yīng)依賴于單側(cè)TALE序列,部分則不依賴于TALE序列但與維持細胞三維結(jié)構(gòu)的CTCF結(jié)合基序存在某種關(guān)聯(lián);利用融入核輸出信號、抑制核內(nèi)DdCBE編輯活性等優(yōu)化策略改造了DdCBE,降低了核基因組的脫靶水平。
堿基編輯技術(shù)能實現(xiàn)基因修正或變異,在生物學(xué)基礎(chǔ)研究、疾病研究和作物遺傳改良應(yīng)用上前景廣闊,因而核酸編輯器的研究持續(xù)火爆,越來越多功能明確的優(yōu)化版本被開發(fā)、應(yīng)用到全新的科學(xué)領(lǐng)域。PE系統(tǒng)在植物或人類細胞系中的脫靶編輯效應(yīng)都非常低,幾乎不引起pegRNA非依賴型的全基因組范圍內(nèi)脫靶,而pegRNA依賴型的脫靶效應(yīng)可通過優(yōu)化引物設(shè)計避免[90,92,98,144]。PE系統(tǒng)與其他編輯系統(tǒng)相比,適用范圍更廣、脫靶效應(yīng)更低。因此,開發(fā)具有更高編輯效率、更強編輯能力(長序列編輯)的PE系統(tǒng),有望進一步挖掘基因編輯工具在基因治療、功能研究上的潛能,建立更安全高效、功能強大的編輯工具。
新型堿基編輯器的開發(fā)充滿著機遇與挑戰(zhàn),如何進一步提升堿基編輯器的編輯效率、產(chǎn)物純度、特異性,平衡編輯范圍與編輯窗口大小,開發(fā)更安全高效、適用性更廣泛的編輯工具,是該領(lǐng)域亟待解決的技術(shù)問題。目前,CBE和ABE的開發(fā)還不夠完善,編輯效率和范圍還未達到理想的程度。除了PE編輯器,所有其他種類的單堿基編輯器都受靶點位置、編輯窗口、堿基轉(zhuǎn)換關(guān)系等因素的影響,難以實現(xiàn)任意位點、任意設(shè)計堿基的精準(zhǔn)(無副產(chǎn)物堿基)編輯。因此,開發(fā)高效率長序列編輯的PE編輯器和高效的同源重組基因編輯技術(shù),將是今后繼續(xù)努力的主要目標(biāo),為進一步推動人類疾病治療、作物遺傳改良以及基礎(chǔ)科學(xué)研究的發(fā)展做出積極貢獻。