曹中正,張心怡,徐藝源,周卓,4,5,6,魏文勝1,,4,5,6
(1 北大-清華生命科學(xué)聯(lián)合中心,北京 100871;2 北京大學(xué)前沿交叉學(xué)科研究院,北京 100871;3 北京大學(xué)生命科學(xué)學(xué)院,北京 100871;4 北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心,北京 100871;5 北京未來基因診斷高精尖創(chuàng)新中心,北京100871;6 北京大學(xué)基因組編輯研究中心,北京 100871)
隨著人類基因組計劃的完成和測序數(shù)據(jù)的不斷積累,研究者們已經(jīng)掌握了海量的DNA 遺傳信息,但是這些信息所代表的生物學(xué)意義卻有待進一步的挖掘。近年來,以基因組編輯為代表的新型生物技術(shù)正在飛速發(fā)展。這種簡單易行的技術(shù)使得研究者們可以對基因組或者基因轉(zhuǎn)錄后產(chǎn)物進行編輯,從而大大提高了科學(xué)家們解碼基因功能以及調(diào)控基因表達的能力。基因組編輯這一革命性技術(shù)的發(fā)現(xiàn)與完善,必將對人類的基礎(chǔ)科學(xué)研究、工農(nóng)業(yè)生產(chǎn)以及生命健康等諸多領(lǐng)域產(chǎn)生深遠的影響。本文將著重介紹以CRISPR 系統(tǒng)為代表的新型基因組編輯技術(shù),并對該技術(shù)在合成生物學(xué)中的應(yīng)用進行闡述。
基因組編輯技術(shù),是指一種對目標基因進行編輯或修飾的基因工程技術(shù)。目前,應(yīng)用最為廣泛的主要有以下3種技術(shù):鋅指蛋白核酸酶(zincfinger nuclease,ZFN)[1]、類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(transcription activator-like effector nuclease,TALEN)[2]以及CRISPR/Cas(clustered regularly interspaced short palindromic repeats,CRISPR;CRISPR-associated,Cas)系統(tǒng)[3-5]。
1.1.1 ZFN技術(shù)
ZFN 是由鋅指蛋白(zinc-finger protein,ZFP)DNA 結(jié)合域與核酸內(nèi)切酶FokI切割結(jié)構(gòu)域融合而成的一種基因編輯工具[1]。鋅指是構(gòu)成鋅指蛋白的基本單元,每個鋅指大約含有30 個氨基酸,并通過保守的Cys2-His2 殘基與鋅原子螯合,形成穩(wěn)定而緊實的β-β-α(N 端-C 端)基序[6-8]。鋅指α 螺旋表面的氨基酸殘基與DNA 雙螺旋大溝中的堿基通過相互作用進行識別,每個鋅指能夠識別3個堿基。因此,將不同的鋅指進行串聯(lián)就可以設(shè)計出識別特定DNA序列的鋅指蛋白[9-10]。
FokI是一種ⅡS 型限制性核酸內(nèi)切酶[11],與識別特定DNA 序列的鋅指蛋白融合后,可構(gòu)成一個鋅指蛋白核酸酶的單體[1]。只有當(dāng)兩組鋅指蛋白核酸酶的單體分別靶向DNA 的正反兩條鏈,并在基因組上具備適宜的間隔時(通常是5~7 bp),F(xiàn)okI 才能夠形成具有切割活性的二聚體[12-13]。ZFN 產(chǎn)生雙鏈斷裂(double-stranded break,DSB)后, 會激活細胞內(nèi)非同源末端連接(nonhomologous end joining,NHEJ)[14]或同源重組(homologous recombination,HR)[15]修復(fù)途徑,從而實現(xiàn)對特定基因的編輯。但ZFN 設(shè)計成本昂貴,制備復(fù)雜,且容易受到上下文效應(yīng)(context effect)的影響,嚴重限制了該技術(shù)的推廣與應(yīng)用[8]。
1.1.2 TALEN技術(shù)
類轉(zhuǎn)錄激活因子效應(yīng)物(transcription activator-like effector,TALE)是一種來自于植物致病菌黃單胞桿菌(Xanthomonas)中的蛋白[16]。TALE 蛋白N 端是轉(zhuǎn)運信號(translocation signal)[17], C 端含有核定位信號(nuclear localization signal)[18]與轉(zhuǎn)錄激活結(jié)構(gòu)域(activation domain)[19],中間部分則是具有特異性識別和結(jié)合DNA 功能的結(jié)構(gòu)域[20]。這些DNA 結(jié)合結(jié)構(gòu)域由33~35 個氨基酸組成的重復(fù)序列串聯(lián)而成,在這些重復(fù)序列中,第12、13 位氨基酸是高度可變的,被稱為重復(fù)可變雙殘基(repeat variable di-residue,RVD)[21-22]。RVD 的不同決定了TALE識別堿基的特異性,例如NI、HD、NG和NN 四種RVD 分別對應(yīng)識別A、C、T 和G 四種堿基[21]。與ZFN 類似,研究者們將不同TALE 蛋白串聯(lián)后與FokI 融合形成TALEN,兩個TALEN 單體分別靶向DNA 的兩條鏈即可達到基因編輯的目的[2]。由于TALEN 的制備比較復(fù)雜,其應(yīng)用也有著一定的限制。
1.2.1 CRISPR/Cas系統(tǒng)的發(fā)現(xiàn)與發(fā)展
CRISPR/Cas 系統(tǒng)是細菌和古生菌中一種抵御外源遺傳物質(zhì)入侵的適應(yīng)性免疫機制。1987 年,科學(xué)家們最早在大腸桿菌中發(fā)現(xiàn)了間隔串聯(lián)重復(fù)序列[23],隨后的研究發(fā)現(xiàn)這樣的重復(fù)序列廣泛存在于細菌與古生菌中[24]。2007 年,Barrangou等[25]提供了CRISPR 作為免疫系統(tǒng)抵抗噬菌體侵染的首個直接證據(jù)。2010 年,Garneau 等[26]首次證實了crRNA(CRISPR RNA)可以在體內(nèi)介導(dǎo)CRISPR 系統(tǒng)切割雙鏈DNA。2011 年,Siksnys 課題組[27]將嗜熱鏈球菌的CRISPR 系統(tǒng)轉(zhuǎn)移到大腸桿菌中,發(fā)現(xiàn)這種異源系統(tǒng)可以抵抗質(zhì)粒轉(zhuǎn)化和噬菌 體 侵染。2012 年,Doudna 和Charpentier 課題組[4]以及Siksnys 課題組[28]證實,體外重構(gòu)的CRISPR 系統(tǒng)可以對雙鏈DNA 進行切割。2013 年,Zhang 課題組[3]和Church 課 題 組[5]成 功 運 用CRISPR 系統(tǒng),在哺乳動物細胞中實現(xiàn)內(nèi)源基因的編輯。至此,CRISPR 系統(tǒng)開始發(fā)展成為快捷高效的基因組編輯工具。
CRISPR/Cas 通常由一系列CRISPR 相關(guān)(CRISPR-associated,Cas)基因與CRISPR 陣列組成。CRISPR 陣列由一系列高度保守的正向重復(fù)序列和序列特異的間隔序列組成。目前CRISPR 系統(tǒng)可以被分為2大類和6小型[29-31],1類系統(tǒng)包括I型、Ⅲ型和Ⅳ型,2 類系統(tǒng)包括Ⅱ型、V型和Ⅵ型,每種類型使用一組獨特的Cas蛋白和crRNA來行使功能[32]。本文作者將以Ⅱ型CRISPR 系統(tǒng)產(chǎn)膿鏈球菌的SpCas9(Streptococcus pyogenesCas9)蛋白為例,介紹其具體的作用機理。
1.2.2 CRISPR/Cas9系統(tǒng)的作用機制
CRISPR 介導(dǎo)的防御機制可分為3 個階段:適應(yīng)、表達與干擾[33]。在適應(yīng)階段,系統(tǒng)對入侵質(zhì)?;蚴删w的DNA 片段進行選擇和切割[25],在Cas1-Cas2 復(fù)合體的幫助下,將其整合成新的間隔序列[33]。間隔序列的選擇由原間隔區(qū)相鄰基序(protospacer adjacent motif,PAM)引導(dǎo),不同物種來源的CRISPR/Cas 系統(tǒng)具有不同的PAM,同時PAM 對于系統(tǒng)區(qū)分自身序列和外源序列具有至關(guān)重要的作用[34]。在表達階段,系統(tǒng)將CRISPR陣列轉(zhuǎn)錄成長的前體CRISPR RNA(pre-crRNA),同時轉(zhuǎn)錄出與pre-crRNA 中重復(fù)序列互補配對的反式激活crRNA (trans-activating crRNA, tracrRNA)。pre-crRNA 與tracrRNA 的互補配對能夠觸發(fā)體內(nèi)RNase Ⅲ等核酸酶的切割機制,產(chǎn)生一系列間隔序列不同的成熟crRNA[4,35]。在干擾階段,Cas9 蛋白與tracrRNA-crRNA 形成的復(fù)合物在外源基因組上尋找PAM 序列,并在PAM 序列處停留與識別。一旦間隔序列能夠與外源基因組上的序列完全互補配對,Cas9 蛋白就會對基因組位點進行切割,從而達到降解外源遺傳物質(zhì)的目的[36]。
1.2.3SpCas9的結(jié)構(gòu)及其系統(tǒng)優(yōu)化
SpCas9 的結(jié)構(gòu)被分為α 螺旋識別區(qū)(recognition lobe, REC) 和 核 酸 酶 區(qū)(nuclease lobe,NUC)[37]。前者是Cas9 蛋白家族中序列保守度最低的區(qū)域,負責(zé)RNA-DNA的識別,而核酸酶區(qū)則包含了HNH、RuvC 以及負責(zé)與PAM 識別的PI 結(jié)構(gòu)域。RuvC 和HNH 是兩個核酸酶結(jié)構(gòu)域,其中HNH 以獨立的形式存在,而RuvC 則被分成3 個亞結(jié)構(gòu)域,RuvC I位于SpCas9 的N 端,RuvC Ⅱ和Ⅲ排列在HNH結(jié)構(gòu)域的兩端。HNH結(jié)構(gòu)域?qū)gRNA的互補鏈進行切割,而RuvC結(jié)構(gòu)域則對sgRNA的非互補鏈進行切割(圖1)。兩個區(qū)之間通過富含精氨酸的橋螺旋(bridge helix,BH)連接起來,該部分與sgRNA有直接的相互作用。
為了更便捷地使用CRISPR/Cas9 系統(tǒng),研究人員對其進行了一些優(yōu)化。Jinek 等[4]通過一段GAAA序列將crRNA的3?端與tracrRNA的5?端融合在一起,形成了單鏈引導(dǎo)RNA(single guide RNA,sgRNA),在不影響效率的同時簡化了系統(tǒng)組分(圖1)。此外,Zhang 課題組[3]對SpCas9 蛋白進行密碼子優(yōu)化,并加入核定位信號,提高了SpCas9 蛋白轉(zhuǎn)運到哺乳動物細胞核內(nèi)的效率。有研究表明,sgRNA 在哺乳動物細胞內(nèi)的表達水平較低,限制了CRISPR/Cas9 系統(tǒng)的應(yīng)用[38]。因此Chen 等[39]對sgRNA 的骨架結(jié)構(gòu)進行了優(yōu)化:他們將sgRNA 莖環(huán)結(jié)構(gòu)中第4 個連續(xù)的U 替換為A,避免了Pol Ⅲ啟動子的提前終止;同時他們將sgRNA 骨架上的發(fā)夾結(jié)構(gòu)延伸了5 對堿基,以便SpCas9 與sgRNA 的結(jié)合。基于以上的優(yōu)化,CRISPR/Cas9 系統(tǒng)只需要導(dǎo)入Cas9 與sgRNA 即可實現(xiàn)高效的基因組編輯。
圖1 CRISPR/Cas9系統(tǒng)介導(dǎo)基因編輯Fig.1 Schematic of the CRISPR/Cas9 mediated genome editing
1.2.4 多種CRISPR/Cas系統(tǒng)
由于1 類CRISPR 系統(tǒng)需要多個Cas 蛋白形成復(fù)合物才能發(fā)揮功能,而2 類系統(tǒng)只需要單個Cas蛋白即可對靶向序列進行切割[29],因此2 類系統(tǒng)被廣泛應(yīng)用于各項研究中。除了SpCas9,目前還有多種系統(tǒng)正處于開發(fā)和應(yīng)用的過程中。SaCas9(Staphylococcus aureusCas9)是來自金黃色葡萄球菌的Cas9 蛋白,其作用機理和編輯效率與SpCas9類似,識 別NNGRRT 的PAM 序列[40]。SaCas9 蛋白較小,只有1053 個氨基酸,可以和sgRNA 一起被裝載進單個腺相關(guān)病毒(adeno-associated virus,AAV)載體中,因此在基因治療的臨床應(yīng)用上具有優(yōu)勢。2015 年,Zetsche 等[41]報道了另一種2 類系統(tǒng)Cpf1(也稱Cas12a),該系統(tǒng)只需要crRNA 介導(dǎo)即可進行基因組編輯,不依賴于tracrRNA 的產(chǎn)生。Cpf1識別PAM序列為TTN,切割靶向DNA后會產(chǎn)生黏性末端。隨后,通過對CRISPR/Cas 基因座進行序列比對分析, Shmakov 等[30]與Abudayyeh 等[42]報 道 了C2c1(Cas12b)、C2c2(Cas13a)等新系統(tǒng)。其中C2c2 是靶向RNA 的系統(tǒng),通過一條crRNA 介導(dǎo),能夠?qū)崿F(xiàn)對單鏈RNA的切割。相信在不遠的將來,具有新型應(yīng)用特點的CRISPR系統(tǒng)會不斷被發(fā)現(xiàn)。
1.2.5 CRISPR/Cas延展技術(shù)
隨著研究的深入,人們對CRISPR 結(jié)構(gòu)和功能的認知越來越清晰,多種基于CRISPR 系統(tǒng)的新工具也應(yīng)運而生。2013 年,Qi 等[43]對Cas9 核酸酶結(jié)構(gòu)域進行突變(H840A,D10A),產(chǎn)生了只有結(jié)合功能但不具有切割活性的dCas9(dead Cas9),實現(xiàn)了利用CRISPR 進行基因表達調(diào)控的目的,他們將這一系統(tǒng)命名為 CRISPRi (CRISPR interference)。該技術(shù)通過靶向基因的轉(zhuǎn)錄起始位點(transcriptional starting site,TSS),干擾RNA聚合酶或轉(zhuǎn)錄因子與DNA 的結(jié)合以及轉(zhuǎn)錄的延伸,從而達到抑制基因表達的目的。在此基礎(chǔ)上,Gilbert等[44]將dCas9 與轉(zhuǎn)錄抑制因子KRAB 融合,提高了CRISPRi 的效率,有效抑制了內(nèi)源基因的表達。此外,研究人員將dCas9與招募轉(zhuǎn)錄激活因子的蛋白例如VP64 或p65 激活結(jié)構(gòu)域(p65AD)融合,開發(fā)出CRISPRa(CRISPR activation)系統(tǒng),可以高效上調(diào)基因的表達[44-46]。
如果將調(diào)節(jié)轉(zhuǎn)錄的結(jié)構(gòu)域替換成其他功能的蛋白,則可以產(chǎn)生多種不同的工具。例如,通過將dCas9 與組蛋白去甲基化酶LSD1 進行融合,Kearns 等[47]建立了一種可以檢測遠端順式調(diào)控元件的方法。Hilton 等[48]將dCas9 與乙酰轉(zhuǎn)移 酶p300 進行融合,開發(fā)了可以在表觀修飾水平上調(diào)節(jié)基因表達的工具。在活細胞成像領(lǐng)域dCas9系統(tǒng)同樣大放異彩,例如Chen 等[39]將EGFP 與dCas9蛋白融合在一起,利用sgRNA 介導(dǎo),成功在活細胞中實現(xiàn)了端粒重復(fù)元件與編碼基因的成像,促進了自然狀態(tài)下染色體構(gòu)象和動力學(xué)的研究。
2016 年,多個課題組開發(fā)了可以將胞嘧啶轉(zhuǎn)換為胸腺嘧啶的堿基編輯器(cytosine base editor,CBE),在不引入DSB 的情況下,實現(xiàn)了精準的單堿基編輯[49-51]。經(jīng)過一系列的優(yōu)化[52],CBE 目前常用的形式是將胞嘧啶脫氨酶與Cas9 切口酶(nickase Cas9,nCas9)融合,通過sgRNA 靶向到特定序列,脫氨酶將編輯窗口內(nèi)單鏈DNA 上的胞嘧啶脫氨成尿嘧啶,nCas9 則在與sgRNA 互補的DNA 鏈上進行切割,造成單鏈斷裂,激活細胞內(nèi)DNA 修復(fù)機制,促使細胞以被脫氨后的單鏈為模板進行修復(fù),將原有的C-G 堿基對替換為T-A。同時融合表達的尿嘧啶DNA 糖苷酶抑制劑(uracil DNA glycosylase inhibitor,UGI)能夠抑制堿基切除修復(fù)途徑,提高編輯效率。2017 年,Liu 課題組[53]進一步擴大了堿基編輯系統(tǒng)的類型,通過將人工進化的腺嘌呤脫氨酶與nCas9融合,開發(fā)出能將腺嘌呤轉(zhuǎn)換為鳥嘌呤的腺嘌呤堿基編輯器(adenine base editor,ABE)。腺嘌呤脫氨后變成次黃嘌呤,在下一次DNA 復(fù)制過程中被識別為鳥嘌呤,實 現(xiàn)A 到G 的替 換。2019 年,Liu 課 題 組[54]又報道了Prime Editor 技術(shù),將逆轉(zhuǎn)錄酶融合在nCas9 的C 端,同時在sgRNA 的3?端延伸出一段序列作為逆轉(zhuǎn)錄的引物和模板,實現(xiàn)了任意堿基之間的替換以及特定堿基序列的插入與刪除。
1.2.6 CRISPR/Cas系統(tǒng)的應(yīng)用
CRISPR/Cas9系統(tǒng)作為一種高效的基因組編輯技術(shù),目前已成功應(yīng)用于釀酒酵母[55]、線蟲[56]、果 蠅[57]、斑 馬 魚[58]、擬 南 芥[59]、水 稻[60]、小鼠[61]、大鼠[62]以及多種人類細胞系[3,5]中,同時其在高通量篩選、基因治療、農(nóng)作物育種及性狀改良等方面也有著廣泛的應(yīng)用。
CRISPR/Cas9系統(tǒng)在建立混合文庫型高通量篩選策略之后[63-66],被迅速運用于多種細胞系中必需基因的篩選[67]以及非編碼調(diào)控元件的篩選[68-72],這些研究極大促進了科學(xué)家們對基因功能的理解。單細胞測序技術(shù)與CRISPR 高通量篩選技術(shù)的結(jié)合,大大拓寬了高通量篩選的適用場景[73-77]。研究者們將等溫擴增技術(shù)與CRISPR/Cas13a、CRISPR/Cas12a 等系統(tǒng)結(jié)合,開發(fā)了一系列快速靈敏的核酸檢測技術(shù)[78-82],可以在短時間內(nèi)檢測病原物的存在,例如寨卡病毒、登革熱病毒等。此外,利用CRISPR/Cas9 與第3 代納米孔測序技術(shù),研究人員實現(xiàn)了在起始基因組量很少的情況下,對DNA 突變、區(qū)域修飾以及結(jié)構(gòu)改變等的檢測[83]。
作為一種特殊的基因治療方式,CRISPR 系統(tǒng)可以通過基因組編輯對細胞進行工程改造,從而治療多種疾病,例如單基因遺傳病的突變校正、嵌合抗原受體(chimeric antigen receptor,CAR)T細胞療法的改進以及再生醫(yī)學(xué)的應(yīng)用等[84]。例如,β-地中海貧血病的治療是通過腺相關(guān)病毒將CRISPR/Cas9系統(tǒng)與同源重組模板遞送到病人造血干細胞中,實現(xiàn)HBB基因突變位點的校正[85]。Xu等[86]通過CRISPR/Cas9 系統(tǒng)對成體造血干細胞的CCR5基因進行編輯,并回輸?shù)交加邪滩『桶籽〉幕颊唧w內(nèi),成功緩解了兩種疾病的癥狀。此外,利用CRISPR/Cas9 技術(shù)編輯內(nèi)源基因,可以最大限度地減弱T細胞受體或人類白細胞抗原介導(dǎo)的排異反應(yīng),產(chǎn)生更高效的CAR-T 細胞[87-89]。在作物育種與性狀改良方面,CRISPR 系統(tǒng)也發(fā)揮了巨大的作用,研究人員已經(jīng)實現(xiàn)了作物產(chǎn)量相關(guān)性狀的改良[90-92]、營養(yǎng)質(zhì)量的提高[93-95]以及抗逆抗病能力的增強[96-98]。
合成生物學(xué)是一門新興的交叉學(xué)科,主要利用工程學(xué)的思維在生物學(xué)領(lǐng)域進行應(yīng)用,旨在提高解碼和重編程生物學(xué)系統(tǒng)的能力[99]。合成生物學(xué)能夠改造和優(yōu)化已有的自然生物體系,或者重新設(shè)計合成具有特定功能的人工生物體系,實現(xiàn)在化工、能源、醫(yī)藥、環(huán)境等領(lǐng)域的規(guī)模化應(yīng)用。在合成生物學(xué)的標準化以及模塊化等諸多過程中,基因組編輯技術(shù)起著重要的作用。下面將介紹基因組編輯技術(shù)在合成生物學(xué)中的應(yīng)用,著重以CRISPR系統(tǒng)為例(圖2)。
圖2 CRISPR系統(tǒng)在合成生物學(xué)中的應(yīng)用Fig.2 Applications of the CRISPR system in synthetic biology
基因組編輯技術(shù)可以進行精準的轉(zhuǎn)錄調(diào)控,因此被廣泛應(yīng)用于基因動態(tài)過程的調(diào)控以及細胞命運的操縱。
Rivenbark 等[100]將ZFP 與DNA 甲 基 轉(zhuǎn) 移 酶DNMT3a融合,使得Maspin和SOX2基因的啟動子區(qū)域產(chǎn)生甲基化修飾,在乳腺癌細胞中實現(xiàn)了長期穩(wěn)定的基因表達下調(diào)。Khalil 等[101]利用人工合成的ZFP 與多種轉(zhuǎn)錄因子融合,構(gòu)建了正交合成的轉(zhuǎn)錄因子文庫,通過改變不同的轉(zhuǎn)錄因子輸入信號,可以在酵母中研究單個轉(zhuǎn)錄因子以及轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的功能。Keung 等[102]將223 個酵母染色質(zhì)調(diào)節(jié)因子與ZFP 融合,通過研究不同時空組合下染色質(zhì)調(diào)節(jié)因子所產(chǎn)生的轉(zhuǎn)錄行為,解析了染色質(zhì)調(diào)控的復(fù)雜性,為染色質(zhì)介導(dǎo)的轉(zhuǎn)錄調(diào)控提供了新的工具。Maeder 等[103]利用TALE 與TET1羥化酶的融合蛋白,實現(xiàn)了啟動子區(qū)域CpG 位點的去甲基化,從而調(diào)節(jié)了內(nèi)源基因的表達。Mendenhall 等[104]將TALE 與組蛋白去甲基化酶LSD1 融合,通過在靶位點上去除增強子相關(guān)的染色質(zhì)修飾,下調(diào)近端基因的表達。Konermann等[105]將TALE 與光敏蛋白CRY2 及其互作蛋白CIB1 融合,開發(fā)了一套基于光誘導(dǎo)的雙雜交轉(zhuǎn)錄效應(yīng)物系統(tǒng)LITE,成功在小鼠神經(jīng)元細胞以及大腦中實現(xiàn)了可逆的內(nèi)源基因表達及染色質(zhì)表觀修飾調(diào)控。Zhang 等[106]通過融合TALE 與VP64,在293FT 細胞中實現(xiàn)了內(nèi)源基因SOX2與KLF4的上調(diào)表達。
Chavez 等[107]通過dCas9 與轉(zhuǎn)錄激活結(jié)構(gòu)域VP64-p65-Rta 的順序組合,建立dCas9-VPR 系統(tǒng),成功在體內(nèi)激活內(nèi)源的編碼基因和非編碼基因,促使人誘導(dǎo)多能干細胞向神經(jīng)元細胞的分化。Tanenbaum 等[108]通過在dCas9 的C 端融合表達多個肽簇,同時表達該肽簇對應(yīng)抗體與VP64 的融合蛋白,建立了Suntag 系統(tǒng),高效地實現(xiàn)了CXCR4等基因的激活調(diào)控。Konermann 等[109]通過在sgRNA 上拼接適配體,并通過表達能夠識別RNA適配體的轉(zhuǎn)錄激活因子融合蛋白,建立了SAM 系統(tǒng),成功實現(xiàn)了內(nèi)源基因和非編碼基因的激活,同時完成了BRAF 抑制劑的全基因組篩選。Chakraborty 等[110]利用dCas9-VP64 系統(tǒng)上調(diào)小鼠MYOD1基因的表達,成功使得小鼠胚胎成纖維細胞分化為骨骼肌細胞。Kearns 等[111]利用dCas9-VP64 系統(tǒng)上調(diào)了指征人胚胎干細胞中內(nèi)胚層分化的SOX17基因的表達,同時也利用CRISPRi 系統(tǒng)對人胚胎干細胞OCT4基因和NANOG基因進行抑制,從而影響了干細胞的多能 性。Liu 等[112]將dCas9 與DNMT3a 或Tet1 融合,通過催化甲基化或者去甲基化,在體內(nèi)外均能夠?qū)崿F(xiàn)基因的表達抑制或激活。Kwon等[113]通過將dCas9 與組蛋白去乙?;窰DAC3融合,發(fā)現(xiàn)可以對內(nèi)源基因?qū)崿F(xiàn)轉(zhuǎn)錄抑制,并且抑制效率與sgRNA 呈現(xiàn)劑量依賴效應(yīng)。誘導(dǎo)型的轉(zhuǎn)錄調(diào)控系統(tǒng)可以響應(yīng)光或小分子等外界信號,在特定信號存在時,啟動轉(zhuǎn)錄調(diào)控,這一手段對了解基因的動態(tài)網(wǎng)絡(luò)十分重要[114-117]。Qi 課題組[117]報道了誘導(dǎo)型的正交轉(zhuǎn)錄調(diào)控系統(tǒng),在同一細胞內(nèi)實現(xiàn)了復(fù)雜的轉(zhuǎn)錄調(diào)控?;赿SpCas9 與dSaCas9 的正交性, 他們利用dSpCas9-KRAB 和dSaCas9-VPR 在抑制EGFP 報 告基因表達的同時上調(diào)了mCherry 報告基因的表達。此外,他們將脫落酸誘導(dǎo)系統(tǒng)和赤霉素誘導(dǎo)系統(tǒng)與轉(zhuǎn)錄調(diào)控系統(tǒng)組合,產(chǎn)生多種AND、OR、 NAND 及NOR 的 布 爾 邏 輯 門。 同 時CRISPR 系統(tǒng)介導(dǎo)的真核轉(zhuǎn)錄調(diào)控在遺傳性疾病的臨床治療中也發(fā)揮著重要的作用。Liao 等[118]通過對SAM 系統(tǒng)進行優(yōu)化,利用AAV 遞送靶向序列較短的sgRNA 和野生型的Cas9 進入杜氏肌營養(yǎng)不良的小鼠中,成功上調(diào)了DMD基因的表達,顯著改善了小鼠的肌肉功能。Liu 等[119]利用dCas9-Tet1 融合蛋白,在脆性X 染色體綜合征病人的誘導(dǎo)多功能干細胞中,成功激活了FMRP基因的轉(zhuǎn)錄表達,這種激活作用能夠持續(xù)至少兩周時間,并且沒有檢測到明顯的脫靶作用。Moreno 等[120]利用兩個AAV 載體,將CRISPRi系統(tǒng)遞送至色素性視網(wǎng)膜炎小鼠模型的視網(wǎng)膜下空間,成功實現(xiàn)了對Nr1基因的抑制,調(diào)控了視桿細胞向視錐細胞分化,達到了治療的效果。
微生物一直是許多抗生素類藥物和活性天然產(chǎn)物的重要合成來源,但是這些次級代謝產(chǎn)物在衍生品開發(fā)和規(guī)模化制備等方面都存在瓶頸,需要對特定的基因或者同時對合成通路里面的多個基因進行編輯,從而達到改良菌種的目的。
Zhang 課 題 組[121]利用TALEN 在 釀酒酵母(Saccharomyces cerevisiae)中對乙醇脫氫酶ADH2進行敲除,從而大幅度提高了酒精的產(chǎn)量。而后該課題組[122] 在纖維素堆囊菌(Sorangium cellulosum)中,利用TALE-VP64 與dCas9-VP64系統(tǒng),使埃博霉素的產(chǎn)量得到了不同程度的提升。研究者們將CRISPRi 系統(tǒng)用于谷氨酸棒狀桿菌(Corynebacterium glutamicum),可以提升L-賴氨酸的效價,增加L-谷氨酸的產(chǎn)量[123-124]。Wu 等[125]在大腸桿菌(Escherichia coli)中應(yīng)用CRISPRi 系統(tǒng)對糖酵解途徑、TCA 循環(huán)、脂肪酸合成途徑進行調(diào)控,實現(xiàn)了類黃酮的增產(chǎn)。此外,Schwartz等[126]在耶氏解脂酵母(Yarrowia lipolytica)中利用CRISPRa 系統(tǒng)提高β-葡糖苷酶的表達,獲得了以纖維二糖為碳源的改良菌株,拓寬了這一工程菌的適用范圍。
研究者們也利用CRISPR 系統(tǒng)進行多基因的編輯,希望能夠快速高效地獲得目標菌株。Cobb等[127]開發(fā)出pCRISPomyces 方法,成功地在變鉛青鏈霉菌(Streptomyces lividans)中同時敲除了redN和actVA-ORF5基因,并證實該方法在白色鏈霉菌(Streptomyces albus) 和產(chǎn)綠色鏈霉菌(Streptomyces viridochromogenes) 中具有67%~100%不等的敲除效率。Jia 等[128]通過對環(huán)狀鏈霉菌(Streptomyces rimosus)的zwf2和devB基因進行敲除,使抗菌藥物土霉素的產(chǎn)量提高了36.8%。Zhang等[129]在釀酒酵母中利用gRNA-tRNA串聯(lián)的陣列,能夠同時靶向8個目的基因,他們將此方法應(yīng)用于簡化酵母脂質(zhì)代謝網(wǎng)絡(luò),成功使得游離脂肪酸的產(chǎn)量提高了30倍。Li等[130]利用CRISPR/Cpf1系統(tǒng)在天藍色鏈霉菌(Streptomyces coelicolor)中實現(xiàn)了一個或者多個基因的敲除,效率最高可達95%。Tong 等[131]利用堿基編輯技術(shù)開發(fā)出CRISPR-BEST 系統(tǒng),成功地在放線菌黃色霉素合成通路的kirN基因中引入提前的終止密碼子,通過結(jié)合Csy4 他們還實現(xiàn)了多個位點的同時編輯。另外,通過對多個基因進行快速敲除,能夠鑒定未知的生物合成途徑。例如在旱地小單孢菌(Micromonospora chersina)中,通過敲除8個不同的基因簇,Cohen 等[132]成功鑒定出聚酮合酶DynE8同時參與烯二炔和蒽醌的生物合成。除此之外,CRISPR/Cas9系統(tǒng)還可以將異源的啟動子定點整合至基因的上游,從而激活基因的表達。例如,Zhang 等[133]利用該策略在玫瑰鏈球菌(Streptomyces roseosporus)得到具有抗真菌活性的物質(zhì)、 在委內(nèi)瑞拉鏈霉菌(Streptomyces venezuelae)中得到具有抗瘧原蟲活性的物質(zhì)以及在產(chǎn)綠色鏈霉菌中得到新型的色素類產(chǎn)品。
基因組編輯技術(shù)的出現(xiàn)使得人們可以在活細胞中動態(tài)地更改遺傳信息,并利用基因組DNA 的強大承載力對信息進行存儲[134]?;蚪M編輯技術(shù)通過響應(yīng)光、溫度或金屬離子等對分子記錄器元件進行控制,可以實現(xiàn)對特定信號的活細胞記錄。分子記錄系統(tǒng)在研究細胞分化、免疫細胞的發(fā)育、疾病及環(huán)境監(jiān)測等領(lǐng)域有著重要應(yīng)用。
依賴于CRISPR 系統(tǒng)的分子記錄器可以分為3 類:①堿基編輯器介導(dǎo)的分子記錄系統(tǒng);②Cas9核酸酶及sgRNA 介導(dǎo)的分子記錄系統(tǒng);③Cas1-Cas2蛋白介導(dǎo)的分子記錄系統(tǒng)。
堿基編輯器介導(dǎo)的分子記錄系統(tǒng)是利用dCas9(或nCas9)和脫氨酶的融合蛋白,在sgRNA 的引導(dǎo)下,對特定位點進行脫氨,達到改寫的目的。Liu 研 究 組[135]開 發(fā) 的CAMERA 技 術(shù) 和Lu 研 究組[136]開發(fā)的DOMINO 技術(shù)均是利用可調(diào)控的堿基編輯器,在被檢測信號存在時,完成位點特異性的編輯,并通過熒光信號的變化或該位點編輯比例的變化指征事件的發(fā)生。這一類系統(tǒng)由于產(chǎn)生精準的突變類型,可以被用于模擬記錄、數(shù)字記錄和各類復(fù)雜計算中。
Cas9 核酸酶及sgRNA 介導(dǎo)的分子記錄系統(tǒng)是指,通過NHEJ修復(fù)途徑在靶位點產(chǎn)生的豐富突變作為每一個細胞特有的條形碼,對特定的信號或細胞的發(fā)育過程進行記錄,以完成譜系追蹤。Shendure 研究 組及合 作 者[137]開發(fā)了GESTALT(genome editing of synthetic target arrays for lineage tracing)技術(shù),通過細胞之間突變模式的不同來區(qū)分它們的世代關(guān)系,并對斑馬魚的細胞進行譜系重構(gòu),發(fā)現(xiàn)大多數(shù)成體斑馬魚的細胞均來自于少數(shù)胚胎祖細胞。Cai 研究組及合作者[138]報道了MEMOIR(memory by engineered mutagenesis with opticalin situreadout)技術(shù),在CRISPR/Cas9 系統(tǒng)產(chǎn)生突變后利用單分子RNA 熒光雜交(smFISH)技術(shù),完成了胞內(nèi)發(fā)生事件的記錄以及胚胎干細胞的譜系重構(gòu)。除對外源的靶位點進行突變以外,sgRNA 表達序列本身也可以被當(dāng)作靶位點[139-140]。Lu 研究組[140]開發(fā)了mSCRIBE (mammalian synthetic cellular recorders integrating biological events)技術(shù),將sgRNA 表達序列作為靶位點,利用sgRNA 自切割所產(chǎn)生的多種突變作為條形碼,完成了NF-κB 通路激活和LPS 介導(dǎo)的炎癥反應(yīng)的記錄。
Cas1-Cas2 蛋白介導(dǎo)的分子記錄系統(tǒng)是利用CRISPR 系統(tǒng)的間隔序列獲取機制,將外源DNA整合進前導(dǎo)序列中,以記錄特定序列的存在。間隔序列的順序,也指征著該特定序列被Cas1-Cas2蛋白獲取的先后次序[141-143]。Church 研究組[142]利用Cas1-Cas2 介導(dǎo)的間隔序列獲取系統(tǒng),對黑白圖像的像素值和一部數(shù)字電影進行了編碼,并將其記錄在細菌中。Wang 研究組[143]開發(fā)了TRACE(temporal recording in arrays by CRISPR expansion)系統(tǒng),以生物錄音帶的形式將外界信號記錄儲存下來,同時他們也嘗試了對銅、海藻糖和巖藻糖這類代謝物進行記錄。
合成生物學(xué)是一個高度交叉的研究領(lǐng)域,涉及基礎(chǔ)的生物學(xué)研究、工程技術(shù)和計算機建模等諸多方面,因此合成生物學(xué)的突破依賴于各個學(xué)科的協(xié)調(diào)發(fā)展?;蚪M編輯技術(shù)的出現(xiàn)加速了合成生物學(xué)的發(fā)展,但是該技術(shù)仍然存在一些問題以及改善的空間,同時該技術(shù)在合成生物學(xué)領(lǐng)域的應(yīng)用也有待進一步的開發(fā)。
初代的基因組編輯技術(shù)ZFN 和TALEN,雖說在構(gòu)建上略顯煩瑣,但是在某些應(yīng)用場景中仍然具有獨特的優(yōu)勢,例如對真核細胞線粒體基因組的編輯。而目前以CRISPR/Cas9 為代表的新型基因組編輯工具最為研究者們所關(guān)注的問題有三點:一是拓寬可編輯的范圍;二是減少脫靶效應(yīng);三是提高遞送效率。由于CRISPR 系統(tǒng)主要來源于微生物,研究者們可以通過生物信息學(xué)的方法從環(huán)境微生物(例如極端環(huán)境微生物)的測序數(shù)據(jù)中發(fā)掘出具有不同特性的新型系統(tǒng),利用此方法拓寬可編輯的范圍是未來的一個重要研究方向。同時研究者們也可以對已有的系統(tǒng)進行優(yōu)化,使其具有識別更廣闊PAM 的能力[144-148]。這些方法雖然一定程度上減弱了PAM 限制,但是大多時候也會降低原始PAM 的限制作用,從而加劇脫靶效應(yīng),在使用時應(yīng)當(dāng)按照實際需求選擇適宜的突變體。對于減少脫靶效應(yīng),目前研究者們可以通過結(jié)構(gòu)優(yōu)化或者隨機突變的形式獲得高保真的突變體[149-151]。但是這些突變體均不完美,都是以犧牲打靶效率為代價來降低脫靶效應(yīng),因此繼續(xù)優(yōu)化發(fā)展真正意義上的高保真突變體將是未來的研究重點。此外,小型Cas 蛋白的發(fā)現(xiàn)[152-153]或現(xiàn)有Cas 蛋白的長度優(yōu)化[154]對于提高AAV 等病毒載體的遞送效率具有重要的意義。
雖然基因組編輯技術(shù)在合成生物學(xué)領(lǐng)域已經(jīng)有了諸多的應(yīng)用,但是依然存在較大的改善空間。首先在基因表達調(diào)控方面,發(fā)展多種正交的系統(tǒng)可以實現(xiàn)對不同基因不同方向的表達調(diào)控,這對于基因網(wǎng)絡(luò)的研究具有十分重要的作用。同時,發(fā)展可控的表達調(diào)控系統(tǒng)(例如小分子誘導(dǎo)或者光控)以及運用布爾邏輯門也有助于對目的基因的精準調(diào)控。其次在微生物編輯方面,目前絕大多數(shù)情況下只能通過效率較低的同源重組對雙鏈斷裂進行修復(fù)[155],極大限制了該技術(shù)的應(yīng)用。未來可以通過堿基編輯器和引導(dǎo)編輯器(PE 系統(tǒng))等不產(chǎn)生雙鏈斷裂的技術(shù)提高編輯效率或者結(jié)合CRISPR 系統(tǒng)與重組酶等實現(xiàn)高效的插入和刪除,從而達到改良菌種、優(yōu)化更多生物合成路徑的目的。此外,合成生物學(xué)利用CRISPR 系統(tǒng)已經(jīng)能夠初步實現(xiàn)信息的存儲和讀取,但在效率、容量和穩(wěn)定性方面仍有較大的提升空間,希望將來可以將生物存儲應(yīng)用于更多的場景。
綜上所述,基因組編輯技術(shù)的發(fā)展能夠極大促進合成生物學(xué)的應(yīng)用,同時合成生物學(xué)又能夠指導(dǎo)和優(yōu)化現(xiàn)有的基因組編輯工具,兩者相輔相成,必將在生物醫(yī)藥、化工生產(chǎn)、環(huán)境能源等諸多領(lǐng)域取得突破性的進展。