許志錳,謝震
(清華大學自動化系,北京信息科學與技術國家研究中心,生物信息學研究部,生物信息學教育部重點實驗室,合成與系統(tǒng)生物學研究中心,北京 100084)
CRISPR/Cas9系統(tǒng)及其衍生的堿基編輯器、引導編輯器是當前應用最廣泛的基因編輯技術,已成功應用于多種細菌、植物以及動物中[1]。CRISPR/Cas9系統(tǒng)源于細菌或古菌的獲得性免疫系統(tǒng),其作用原理是Cas9在引導RNA(single guide RNA,sgRNA)的引導下,切割靶點形成雙鏈斷裂(double-strand break, DSB),此后會引發(fā)非同源末端連接(non-homologous end joining, NHEJ)、微同源末端連接(microhomology-mediated end joining, MMEJ)或同源重組(homology dependent repair, HDR)[2]。DSB往往會產生大量不可控的小插入或缺失(indel),甚至是大片段缺失,還會引發(fā)p53介導的DNA損傷反應,致使細胞周期停止甚至細胞凋亡[3-4]。
野生型Cas9蛋白可以切割DNA雙鏈,而引入D10A或H840A突變可以使Cas9損失切割其中一條DNA單鏈的能力,使Cas9成為Cas9切口酶(Cas9 nickase,Cas9n)。將Cas9n與脫氨酶結構域相融合而成的胞嘧啶堿基編輯器(cytosine base editor, CBE)可以將DNA上的胞嘧啶(C)脫氨而成尿嘧啶(U),經過內源DNA修復或復制過程后轉化為胸腺嘧啶(T),最終實現(xiàn)C到T的替換。CBE一經報道,其不引入雙鏈斷裂、編輯效率較高等優(yōu)良特性迅速吸引學界關注和廣泛應用[5]。此后,研究人員又報道了可實現(xiàn)A到G[6]、C到G[7]、A到C[8]以及G到T[9]等其他堿基替換的堿基編輯器,近期也有報道將Cas9的遠古祖先——IscB蛋白開發(fā)成堿基編輯器[10],堿基編輯器領域可謂蓬勃發(fā)展。但堿基編輯器也存在編輯窗口局限,不能實現(xiàn)全部12種堿基替換,也有不能達到單堿基精度的替換等問題[1]。
2019年David Liu課題組[11]報道了引導編輯器(prime editor,PE)。PE將Cas9n(H840A)與莫洛尼鼠白血病病毒逆轉錄酶(Moloney murine leukemia virus reverse transcriptase,M-MLV RT)融合,將原sgRNA的3′端延長,延長區(qū)可分為引物結合區(qū)(primer binding site,PBS)和逆轉錄模板區(qū)(RT template,RTT)。在pegRNA的引導下,Cas9n在靶點形成單鏈缺刻,之后PBS與DNA單鏈互補配對,M-MLV RT以RT template為模板,將DNA單鏈逆轉錄延伸,形成含有編輯內容的3′flap結構。3′flap與5′flap相互競爭平衡,在一定機制下,5′flap被切除,DNA雙鏈被修復,完成編輯(圖1)。David Liu課題組也對M-MLV RT引入多個點突變,提高了編輯效率,命名為PE2。后又引入單獨的一條sgRNA,使非編輯鏈形成缺刻,進一步提高了編輯效率,命名為PE3或PE3b。
圖1 PE原理示意圖Fig.1 Schematic diagram for PE
PE相較BE而言,可以實現(xiàn)單堿基精度的堿基替換,且編輯窗口遠大于BE,可以實現(xiàn)全部12種堿基替換[11]。遺憾的是,盡管PE在編輯功能上相較BE更為全面,但就堿基替換而言,PE的編輯效率較為有限[11-12],且PE表達盒的編碼序列過長,難以通過單AAV遞送,這限制了其作為基因治療工具的發(fā)展。
PE一經問世就受到全球研究者的廣泛關注,并迅速掀起了對PE深入研究和擴展開發(fā)的熱潮。從目前的研究來看,PE的相關研究思路與BE領域有類似之處,研究者需要評估其精確性、安全性,以及提高其編輯效率。進一步地,將PE應用于基因治療也是研究者重點關注的研究目標。
通過分析不同的PBS長度、RTT長度對編輯效率的影響,Anzalone等[11]建議從約13nt的PBS和10nt以上的RTT開始優(yōu)化,并且pegRNA的3′端堿基不宜為C。Lin等[13]率先將PE引入植物系統(tǒng),并發(fā)現(xiàn)PBS長度對目的編輯產物影響較小,而RT模板長度影響明顯;不同反應溫度對編輯效率也有影響,37 ℃條件下編輯效率要顯著高于26 ℃。Lin等[14]還發(fā)現(xiàn)在植物PE中設計pegRNA時,PBS區(qū)的Tm值與編輯效率密切相關,其在30 ℃時PE編輯效率最高。但Ponnienselvan等[15]報道稱PBS區(qū)與待編輯位置的原間隔序列存在固有互補性,如果發(fā)生互補配對會限制編輯效率。減少PBS區(qū)長度,PBS區(qū)Tm值約37 ℃時,是哺乳動物細胞中編輯效率最優(yōu)的條件。
根據sgRNA的序列特點,以高通量方式以及機器學習方法分析并預測編輯效率在以往的Cas9、Cas12研究中起到了重要作用[16-20]。對于PE系統(tǒng),研究者也開發(fā)出了多款效率預測工具(表1)。
表1 PE編輯效率預測工具Table 1 Efficiency prediction tools of PE
Kim等[12]通過建立不同靶點、PBS長度、RT模板長度等條件的近5.5萬條pegRNA而構成的高通量文庫,分析pegRNA影響PE2編輯效率的因素,并給出了設計pegRNA時推薦的參數值。Kim等建議設計pegRNA時,使用13 nt的PBS與12 nt的RTT,并且PBS要有較高的GC比。這與Anzalone等[11]推薦的設計條件類似。但在pegRNA的3′端的堿基問題上,Kim等發(fā)現(xiàn)這與RTT長度有關,在RTT不超過12 nt時,C反而更優(yōu)。在該研究組進一步的工作中,作者將研究范圍擴展到HEK293T、HCT116、MDA-MB-231、HeLa、DLD1、A549和NIH3T3七種細胞系,在其中探究了包含松弛PAM的Cas9n變體、PEmax以及PE4、PE5等優(yōu)化后的PE編輯效率的影響因素,并開發(fā)了DeepPrime工具[21]。
Koeppel等[23]報道插入序列長度、核苷酸組成以及二級結構都會影響PE插入片段的編輯效率,并使用機器學習方法對PE插入片段的編輯效率、分析規(guī)律加以預測,實現(xiàn)了平均R=0.68的精度。而Mathis等[22]則分析了逾9萬條pegRNA的高通量結果數據,訓練了一個基于注意力機制的雙向遞歸神經網絡PRIDICT,實現(xiàn)了R=0.85級別的高準確率編輯效率預測。
是否存在脫靶效應是決定基因編輯工具安全性的關鍵指標。脫靶效應又可分為Cas9依賴和非Cas9依賴兩種類型。而由于人類基因組本身就有內源逆轉錄元件和端粒酶,說明PE的逆轉錄酶結構域對人類細胞并沒有內在的毒性[11],所以現(xiàn)有的研究多關注于Cas9n結構域導致的脫靶效應。
Anzalone等[11]測試了16個脫靶位點,僅在1個位點發(fā)現(xiàn)了高于1%的脫靶編輯,遠低于直接使用Cas9而產生的indel,是比較安全的基因編輯工具。Kim等[24]開發(fā)了nDigenome-seq技術,在HEK293T細胞系中無偏評估了PE中Cas9n導致的脫靶效應,發(fā)現(xiàn)在測試的9個基因組位點中,僅有5個脫靶位點產生了可檢出的脫靶編輯,效率僅有0.1%~1.9%,證明了PE在全基因組范圍內具有較高的精確性。Habib等[25]在人多能干細胞(human pluripotent stem cell,hPSC)中應用并評估了PE的安全性。作者也比較了PE和BE,發(fā)現(xiàn)PE的逆轉錄酶結構域與BE的脫氨酶結構域不同,不會導致獨立于gRNA的脫靶突變。Gao等[26]重點分析了逆轉錄酶結構域對基因組和轉錄組的影響,發(fā)現(xiàn)在PE3編輯中沒有證據表明存在非pegRNA依賴的脫靶,PE3也不會影響端粒區(qū)域和內源逆轉錄元件,沒有發(fā)現(xiàn)pegRNA被整合進基因組或是影響轉錄組,甚至也不會影響剪接或基因表達模式。Kwon等[27]使用PE將標簽序列插入基因組,超聲隨機打斷基因組后對標簽序列處測序用以分析全基因組脫靶情況,命名為TAPE-seq。相較于GUIDE-seq和nDigenome-seq,TAPE-seq直接利用的是PE的功能,而非Cas9n的功能,更能精準反映PE本身的脫靶;TAPE-seq所不能檢出的脫靶位點比前述二者也更少,更為靈敏。與之類似,Liang等[28]也使用PE引入標簽序列,但使用Tn5轉座酶打斷基因組,Liang等發(fā)現(xiàn)PE僅存在gRNA依賴的脫靶,不存在獨立于gRNA的脫靶。
Jin等[29]通過全基因組測序在水稻中對Cas9依賴的和非Cas9依賴的脫靶效應進行了全面分析,發(fā)現(xiàn)PE系統(tǒng)僅產生了0.23%的Cas9依賴性的脫靶效應,不產生非Cas9依賴的脫靶效應。通過逆轉錄相關的分析也發(fā)現(xiàn)PE不會影響植物細胞的內源轉錄機制。
PE系統(tǒng)主要發(fā)揮編輯功能的是其蛋白質模塊,所以對蛋白的優(yōu)化尤為重要(表2)。
加入新的結構域是基因工具開發(fā)的常見思路(圖2,上),比如DNA結合結構域曾在堿基編輯器的開發(fā)中有所報道[49]。Song等[32]報道了在PE2的Cas9n與RT結構域中間融合加入DNA結合結構域Rad51,開發(fā)出hyPE2,提高了編輯效率,同時在脫靶效應上與原PE2相當。Song等[32]也發(fā)現(xiàn)PBS的Tm是hyPE2效率提高的重要參數,在Tm較低時,hyPE2表現(xiàn)更好。Park等[33]在PE中融合染色質操控肽,可以改善目標位點的染色質開放性,進而提高編輯效率;也有報道發(fā)現(xiàn)轉錄因子P65也能提高染色質開放性,繼而可以提高PE編輯效率[50]。Velimirovic等[51]報道在PE的N端融合85氨基酸的短肽可以提高PE編輯效率,并開發(fā)了篩選這種短肽的高通量方法。Liu等[30]優(yōu)化了PE2的核定位序列(nuclear localization sequence, NLS),開發(fā)出PE2*,也提高了編輯效率。Yarnall等[35]將Bxb1絲氨酸整合酶結構域與PE相融合,在基因組插入attB位點的同時,也導入含有attP位點的DNA供體,整合酶結構域使供體序列可以整合進基因組特定位置,最終可以在細胞系中實現(xiàn)最長達36 kb的大段DNA的基因組插入,效率達10%~20%。
圖2 PE典型改進方式示意圖Fig. 2 Diagrams for major strategies to improve PE efficiency
調整原有結構域的方法也受到許多研究者的關注[圖2(a)]。Xu等[42]發(fā)現(xiàn)在水稻中,Cas9n和MMLV RT對調位置后編輯效率更高。甚至有研究者發(fā)現(xiàn)將PE的Cas9n和MMLV RT直接拆分仍然可以實現(xiàn)相近的編輯效率[46,52]。將M-MLV RT中的RNaseH結構域刪除,可以稍微減小尺寸而不降低其編輯效率[41,43-44]。還有研究者嘗試Cas9n恢復成切割雙鏈的野生型Cas9,實現(xiàn)更大片段的刪除,盡管會導致更多雙鏈斷裂,降低了安全性,但可以通過調控胞內NHEJ途徑來優(yōu)化[37-38];而對Cas9n(H840A)結構域引入新的點突變N863A可以減少由Cas9n結構域產生的DSB,減少了意外的indel產生,提高目的產物純度,引入N854A雖然也能減少indel產生,提高目的產物純度,但會犧牲正確編輯的效率[39]。
由于PE由Cas9n和逆轉錄酶結構域兩部分組成,將其中一部分更換為同類的具有其他特性的結構域,可以為PE引入諸如改善靶向范圍、改變逆轉錄能力等新特性[圖2(a)]。比如可以將SpCas9換替為松弛PAM要求的Cas9變體[47],也有研究者換成了SaCas9、CjCas9、SauriCas9或FnCas9等同源物[30-31,44,48]。同理,逆轉錄酶結構域也可以更換為marathon RT(一種從E.rectale中發(fā)現(xiàn)的逆轉錄酶),但在部分位點的編輯效率略低[52]。Manoj等[40]將M-MLV RT結構域更換為LINE-1逆轉錄酶,并同時導入RNA模板,可以實現(xiàn)約1.5 kb的插入。
pegRNA是PE系統(tǒng)的關鍵組分,起到引導作用,又要作為逆轉錄模板,其結構和穩(wěn)定性對PE編輯效率非常重要(表3)。
表3 pegRNA優(yōu)化方式Table 3 Optimization methods for pegRNA
Nelson等[53]報道了對pegRNA的3′端添加額外的tevopreQ1或mpknot特殊RNA基序結構,可以防止pegRNA的3′端意外降解,使PE編輯效率提高3~4倍。此策略也可與2′-O-甲基化、硫代磷酸等常見RNA保護手段進一步結合使用[53]。同理,在pegRNA的3′端添加xrRNA基序結構[54]或G-quadruplex基序結構[55],均實現(xiàn)了編輯效率提升。
pegRNA本身的序列特性或二級結構也會影響PE編輯效率[圖2(b)]。由于pegRNA的spacer區(qū)域與PBS區(qū)域是互補配對的,可能造成pegRNA意外成環(huán),影響編輯效率。Liu等[36]在pegRNA的3′端引入名為Csy4識別位點的發(fā)夾結構,可以減少環(huán)化。進一步地,作者在Csy4識別位點之后串聯(lián)nick sgRNA,并共表達Csy4蛋白,可以在Csy4識別位點之后剪切,釋放nick sgRNA。Li等[56]在pegRNA的RT模板區(qū)引入同義突變,改善其二級結構,顯著提高了編輯效率,最高近5000倍,該方法命名為sPE;作者也發(fā)現(xiàn)優(yōu)化pegRNA的發(fā)夾結構可使編輯效率平均提高2.77倍,命名為aPE。近期有報道將gRNA恒定區(qū)的第一頸環(huán)結構替換成一種超穩(wěn)定頸環(huán)結構,提高了gRNA穩(wěn)定性,減少了因gRNA錯誤折疊而無法編輯的情況,此種原理或亦可用于pegRNA[57]。
使用成對的pegRNA可以極大擴展PE的編輯能力限制,不僅能提高編輯效率,還能實現(xiàn)長片段的替換、插入及刪除[表4,圖2(b)]。
表4 成對pegRNATable 4 Paired pegRNA
Lin等[14]發(fā)現(xiàn)在水稻中可以使用雙pegRNA策略提高PE編輯效率,最高提高了近28倍。HOPE系統(tǒng)[58]、GRAND系統(tǒng)[61]、PRIME-Del系統(tǒng)[60]、twinPE系統(tǒng)[59]、PEDAR系統(tǒng)[62]及Bi-PE系統(tǒng)[64]等在待編輯的大片段兩側頭對頭地設計一對pegRNA,產生兩條可以互補配對的DNA單鏈,實現(xiàn)kb級的片段刪除或高達250 bp的片段插入。
Anzalone等使用CRISPRi篩選發(fā)現(xiàn)細胞內的DNA錯配修復(mismatch repair,MMR)過程中的多種蛋白質會抑制PE編輯效率。作者發(fā)現(xiàn)使用失活MLH1(MLH1dn)可以在MMR豐富的細胞中有效抑制MMR,從而提高編輯效率并改善產物純度[31]。作者將共表達了MLH1dn的PE2、PE3系統(tǒng)分別命名為PE4、PE5。Ferreira da Silva等[65]篩選了32個DNA修復相關的因子,發(fā)現(xiàn)在缺失MMR通路基因的單倍體HAP1細胞系中PE編輯效率提高了2~7倍,用siRNA敲低MMR相關基因也可以提高PE編輯效率約2倍。Koeppel等[23]也發(fā)現(xiàn)MMR通路中的TREX1、TREX2會抑制長片段插入。
組蛋白脫乙酰酶抑制劑(histone deacetylase inhibitors, HDACi)可以提高組蛋白乙?;?,促進染色質開放,Liu等[66]報道nexturastat A、abexinostat以及vorinostat等小分子HDACi可以提高PE編輯效率近2倍。
Cas9直接切斷基因組會誘發(fā)p53因子介導的細胞壓力反應和細胞周期停滯,不利于基因編輯進行[3-4,67]。盡管PE理論上不涉及DSB,但Li等[68]發(fā)現(xiàn)在hPSC中表達p53失活片段p53DD可以顯著提高PE編輯效率,Huang等[69]也發(fā)現(xiàn)使用SV40LT抑制p53可以提高PE在hESC中的編輯效率,但相關機理尚未闡明。
設計pegRNA的PBS、RT模板區(qū)并不像protospacer區(qū)一樣直觀,而且其長度、二級結構都會影響編輯效率,因此自動化輔助設計工具對研究人員意義重大(表5)。目前已報道有多款在線pegRNA輔助設計工具,可以允許用戶輸入位點和意圖實現(xiàn)的編輯結果,給出參考pegRNA序列,部分工具還允許選擇不同的Cas9,甚至還可以預測編輯效率[14,70-78]。
表5 pegRNA輔助設計工具Table 5 Assisted design tools for pegRNA
有效遞送PE和pegRNA到細胞中是實驗過程中的關鍵步驟之一。在哺乳動物細胞系的基因編輯實驗中,最常見的遞送方法是轉染質粒DNA,使之瞬時表達,該方法最為簡單便捷,脫靶率不高,再配合易轉染細胞系如HEK293T等,可以實現(xiàn)很高的轉染效率[11]。在動物實驗中,流體動力學注射在小鼠實驗中也應用廣泛[30,43]。但轉染DNA存在DNA重組進基因組的隱患,轉染編碼PE的mRNA和pegRNA的安全性和有效性更佳,電轉尤其適用于人誘導多能干細胞(human induced pluripotent stem cell, hiPSC)、原代T細胞等難以化學轉染的細胞[31,79-80]。直接轉染PE蛋白和pegRNA組成的核糖蛋白復合體(ribonucleoprotein, RNP),由于不涉及胞內的轉錄翻譯過程,編輯時間更短,安全性更好。Petri等[81]在斑馬魚胚胎細胞中使用PE RNP實現(xiàn)了高達30%的編輯效率。然而有報道指出,轉染RNP的編輯效率要低于質?;騧RNA,轉染效率也更差[31,46],在基因編輯實驗中研究者要權衡安全性和效率二者的關系。
如需將PE整合進細胞基因組,或構建穩(wěn)轉細胞系,或是在難以轉染的細胞系或原代細胞中進行實驗,piggyBac轉座子和慢病毒是常用的工具。Wolff等[82]發(fā)現(xiàn)piggyBac系統(tǒng)將PE2和pegRNA整合到基因組后,由于編輯時間的延長,編輯效率會有所提升。Eggenschwiler等[83]使用piggyBac轉座子在hiPSC細胞中構建了穩(wěn)定表達的PE,配合熒光報告系統(tǒng),評價不同pegRNA的性能。而慢病毒載體由于容量限制(一般不超過8 kb),Anzalone等[11]使用intein系統(tǒng)拆分PE3后,用兩個慢病毒載體在小鼠原代皮層神經細胞中實現(xiàn)了單堿基替換的編輯結果。
腺相關病毒(adeno-associated virus, AAV)因其非整合性、組織特異性而應用廣泛,但其裝載容量僅有約4.5 kb,面對逾6 kb的PE,只能拆分PE后用雙AAV載體遞送[43,45,84]。反式剪接雙AAV載體(trans-splicing AAV,tsAAV)的遞送能力可以高達10 kb[85],Jang等[86]將PE3拆分后使用tsAAV載體遞送,在小鼠中成功編輯了視網膜細胞。Davis等[87]使用雙AAV載體遞送PE,實現(xiàn)了對小鼠大腦(最高達42%)、肝臟(最高達46%)和心臟(最高達11%)的編輯,證明了雙AAV載體遞送PE對基因療法的潛在價值。腺病毒(adenovirus, AdV)的裝載容量高達8.5 kb,可以單載體遞送PE系統(tǒng)。B?ck等[44]使用單個AdV載體遞送PE2系統(tǒng)在小鼠苯丙酮尿癥模型中修正了Pahenu2突變位點;作者還發(fā)現(xiàn)單AdV載體的PE遞送效率要優(yōu)于拆分的雙AAV載體。Wang等[88]使用完全病毒基因缺失的腺病毒載體(adenovector particle, AdVP)遞送PE,在HEK293細胞系中轉導效率可以高達99%。Aulicino等[89]報道了使用桿狀病毒載體(baculoviral-vector, BV)遞送長達20 kb的同時編輯4個位點的PE系統(tǒng),成功在HEK293T、RPE-1和SH-SY5Y細胞中實現(xiàn)高效編輯。
PE由于其全能編輯能力,迅速在動植物和遺傳病研究等各個研究領域廣泛應用。
Liu等[90]在小鼠胚胎中顯微注射PE2 mRNA和pegRNA建立了人類短指并指畸形相關基因Hoxd13突變疾病模型。Gao等[91]通過顯微注射PE2 mRNA和pegRNA成功地在小鼠Tspan2啟動子引入突變,造成平滑肌功能喪失。Liu等[30]使用流體動力學注射方法,在小鼠體內糾正了α1-抗胰蛋白酶缺乏癥 (α1-antitrypsin deficiency, AATD)的致病突變SERPINA1 E342K,也成功引入Ctnnb1 S45F突變建立了肝癌模型。Jang等[86]用AAV遞送PE2和PE3成功糾正了小鼠的酪氨酸血癥和萊伯氏黑矇癥。Lin等[92]顯微注射PE3質粒到小鼠胚胎,造成了Crygc基因外顯子3上的移碼突變,建立了白內障小鼠模型。
對于其他哺乳動物,Qian等[93]通過顯微注射PE2 mRNA和pegRNA到兔子胚胎,造成β-己糖胺酶A(β-hexosaminidase A, HexA)缺陷,建立了Tay-Sachs?。═ay-Sachs disease, TSD)模型。Kim等[94]使用PE糾正了已患有髖關節(jié)發(fā)育不良(hip dysplasia, HD)家犬的耳成纖維細胞中的致病突變,并使用已經糾正的耳成纖維細胞克隆出兩只幼犬。
在非哺乳動物中,Petri等[81]在斑馬魚胚胎中注射PE RNP,引入了當前不能使用BE實現(xiàn)的兩種突變,即眼皮白化病基因TYR P301L和原癌基因KRAS G12V,證明了PE在斑馬魚中構建人類疾病模型的能力。Atsuta等[95]成功編輯了雞成纖維細胞和原始生殖細胞,但遺憾的是并沒有進一步培養(yǎng)出成體雞。對于無脊椎動物,Bosch等[96]成功編輯了果蠅的體色基因,并且可遺傳給子代果蠅,但作者也發(fā)現(xiàn)在果蠅細胞中PE的編輯效率遠低于哺乳動物細胞。
在遺傳性代謝疾病方面,PE用于糾正遺傳性酪氨酸血癥(hereditary tyrosinemia, HT)、萊伯氏黑矇癥(Leber’s congenital amaurosis, LCA)、AATD、苯丙酮尿癥(phenylketonuria, PKU)等病的潛在能力在小鼠模型中已得以驗證[30,44,86,97]。
一些罕見遺傳病的PE治療已通過細胞系水平的驗證。杜氏肌營養(yǎng)不良(Duchenne muscular dystrophy, DMD)是一種致命的伴X遺傳病,Chemello等[98]在hiPSC衍生的心肌細胞中糾正了外顯子51缺失突變,Mbakam等[99]糾正了人成肌細胞系中的c.8713C>T突變,驗證了PE治療DMD的潛在能力。Lv等調研了一個X連鎖色素性視網膜炎(X-linked recessive retinitis pigmentosa,XLRP)的患者家族,發(fā)現(xiàn)該家族攜帶RPGR ORF15 c. 2234_2237del突變,作者在HEK293細胞系中驗證了用ePE糾正這一突變[36,100]。隱性萎縮性表皮松解癥(recessive dystrophic epidermolysis bullosa,RDEB)是一種嚴重的皮膚脆性疾病,由COL7A1基因的功能喪失性突變引起,Hong等[101]在患者的成纖維細胞中驗證了PE糾正該致病突變的能力。Eggenschwiler等[83]在患者來源的iPSC中糾正了家族性肌萎縮側索硬化癥(amyotrophic lateral sclerosis,ALS)的致病SOD1 R115G突變。Zhou等[102]在iPSC中通過刪除SMN2基因內含子的剪接沉默子,驗證了PE治療脊髓性肌萎縮癥(spinal muscular atrophy, SMA)的可能性。Zhang等[103]使用PE3成功在紅細胞祖細胞系HUDEP-2的HBB基因中引入了β-地中海貧血(β-thalassemia, β-thal)突變,為β-地中海貧血的研究提供了疾病模型;在該作者的另一項研究中,作者驗證了在小鼠模型中糾正β-地中海貧血IVS-II-654突變的能力[104]。
在癌癥方面,Abuhamad等[105]在T47D luminal A乳腺癌細胞系中糾正了TP53(L194F)錯義突變,為PE應用于癌癥治療提供了驗證。Tremblay等[106]在HEK293細胞系中驗證了向淀粉樣前體蛋白(amyloid precursor protein,APP)引入冰島突變,探索了阿爾茨海默?。ˋlzheimer’s disease,AD)的一種可能的預防方案。
對水稻、小麥等單子葉植物,在PE技術誕生之后研究人員迅速跟進了相關研究,然而其本身編輯效率卻比較低[13,107-108],結合刪減RT RNaseH結構域、添加病毒核衣殼蛋白等PE蛋白優(yōu)化手段,以及結合epegRNA或雙pegRNA策略等pegRNA優(yōu)化手段,可以有效提高PE系統(tǒng)在水稻中的編輯效率[14,41]。Jin等[109]還總結了在單子葉植物中的PE實驗流程,為其他研究者參考提供了便利。Xu等[110]基于PE開發(fā)了一種飽和誘變方法,在水稻OsACC1基因上篩選出多個除草劑抗性突變,驗證了PE在農業(yè)生產領域的應用潛力。玉米也是一種重要的單子葉糧食作物,也有報道使用PE成功在玉米乙酰乳酸合酶(acetolactate synthase, ALS)基因中引入突變[111-112]。
擬南芥是一種重要的雙子葉模式生物,在科學研究中扮演了重要的角色,Jiang等[113]使用PE在擬南芥中引入突變,但平均編輯效率僅有1.15%。在雙子葉農作物方面,Lu等[114]使用針對植物優(yōu)化的PE可以在二倍體番茄中引入3%的編輯,Perroud等[115]在四倍體馬鈴薯中用PE2實現(xiàn)了極低的編輯效率,而PE3甚至不能檢出編輯,也有報道在花生、鷹嘴豆和豇豆中實現(xiàn)了不足1%的編輯[116]。以上數據表明在雙子葉植物中,PE的表現(xiàn)遠差于單子葉植物。然而即便是在單子葉植物中,PE的編輯效率也遠不及哺乳動物細胞中高達百分之幾十的效率,開發(fā)在植物細胞中可用的高效PE工具依然任重道遠。
PE是目前功能最全面的基因編輯工具,可以實現(xiàn)12種堿基替換、插入和刪除。其編輯效率不高的缺點正逐漸被研究者通過蛋白質工程或pegRNA改造等手段改善,效果較為顯著。PE推動了基因編輯領域新的研究高潮,然而其使用單AAV遞送PE仍然囿于其過大的尺寸尚不能實現(xiàn),且indel和脫靶問題仍然不能忽視,這限制了基因治療方面的進一步應用。我們期待在全球學者的共同努力下,早日誕生更小更安全的PE,推動罕見遺傳病的基因治療實現(xiàn)新的發(fā)展。