吳偉鑫 , 蓋新娜 , 周 磊
(中國農(nóng)業(yè)大學(xué)動物醫(yī)學(xué)院 , 北京 海淀 100193)
有規(guī)律成簇間隔短回文重復(fù)序列(Clustered regularly interspaced short palindromic repeats, CRISPR)廣泛存在于絕大多數(shù)細菌和古細菌中,其轉(zhuǎn)錄產(chǎn)生的crRNA(CRISPR-RNA)與反式激活的tracrRNA(trans-activating CRISPR RNA)共同構(gòu)成引導(dǎo)RNA(guide RNA, gRNA),gRNA可引導(dǎo)核酸內(nèi)切酶Cas蛋白(CRISPR associated protein)對噬菌體的基因片段進行切割,構(gòu)成細菌的CRISPR-Cas免疫防御系統(tǒng)。人們發(fā)現(xiàn)可以通過人工合成的gRNA模擬自然的tracrRNA和crRNA結(jié)構(gòu),與Cas蛋白一起特異性識別和剪切核酸序列,構(gòu)成新一代的基因編輯技術(shù)。2013年,2個團隊[1-2]首次使用嗜熱鏈球菌和化膿性鏈球菌構(gòu)建Ⅱ型CRISPR-Cas9系統(tǒng),隨后該系統(tǒng)日趨成熟,并被廣泛用于哺乳動物細胞的基因組編輯。 2015年,該家族內(nèi)的另一系統(tǒng)CRISPR-CasC2c2[3](現(xiàn)稱Cas13)被成功鑒定,與Cas9不同, Cas13結(jié)合和切割的對象為RNA。目前科學(xué)家們已經(jīng)從Leptotrichiabuccalis(Lbu)、Leptotrichiawadei(Lwa)、Leptotrichiashahii(Lsh)以及Lachnospiraceaebacterium(Lba)等多種細菌中解析出了Cas13a結(jié)構(gòu),根據(jù)其來源不同分別稱為LbuCas13a[4]、LwaCas13a[5]、LshCas13a[6]和LbaCas13a[7]。
目前CRISPR-Cas系統(tǒng)分為2類、6型和30多種亞型[8]。其中1類系統(tǒng)(包括Ⅰ型、Ⅲ型和Ⅳ型)具有多個亞單位效應(yīng)復(fù)合物,包括多個Cas蛋白;而2類系統(tǒng)(包括Ⅱ型、Ⅴ型和Ⅵ型)中效應(yīng)物是種類單一、體積較大、多結(jié)構(gòu)域的蛋白分子[9](見中插彩版圖1)。研究表明,所有的CRISPR-Cas系統(tǒng)可能來源于同一個祖先,1類系統(tǒng)在進化過程中變?yōu)榫哂袉我还δ艿腃as基因,同時丟失其他的Cas基因從而形成2類系統(tǒng)[10]。CRISPR-Cas13系統(tǒng)屬于2類CRISPR系統(tǒng)的Ⅵ型,根據(jù)結(jié)構(gòu)還可再細分為a、b、c、d四個亞型。
圖1 兩類CRISPR-Cas系統(tǒng)的結(jié)構(gòu)差異及主要組成[9]
以CRISPR-Cas13a系統(tǒng)為例,高分辨率結(jié)構(gòu)分析[4]顯示細菌Leptotrichiabuccalis(Lbu)中解析出的LbuCas13a屬于“雙瓣葉”球狀蛋白質(zhì)結(jié)構(gòu),由1個crRNA識別瓣葉(Recognition lobe, REC)和1個核酸酶瓣葉(Nuclease lobe, NUC)組成,其NUC上有2個高等真核生物和原核生物核苷酸結(jié)合域(Higher eukaryotes and prokaryotes nucleotide-binding, HEPN)。
圖2 LbuCas13a、crRNA、靶RNA復(fù)合物的復(fù)合結(jié)構(gòu)[4]
Cas13a效應(yīng)蛋白在識別靶RNA上的前間區(qū)序列鄰近基序(Protospacer adjacent motif, PAM)(在Cas13a中稱為Protospacer flanking site,PFS)并與其結(jié)合的過程中可發(fā)生構(gòu)象變化,HEPN1結(jié)構(gòu)域在靶RNA結(jié)合后向HEPN2方向移動,形成一個活化的HEPN催化位點?;罨腍EPN催化位點表現(xiàn)出兩種核糖核酸酶(Ribonuclease, RNase)活性,一種可將自身的pre-crRNA處理為crRNA,令一種表現(xiàn)為HEPN-RNase活性,對靶RNA或游離RNA進行切割[4]。
圖3 Cas13a構(gòu)象改變和HEPN活化以及表現(xiàn)RNase活性的過程[4]
Cas13a的催化位點位于外表面,所以一旦Cas13a被靶標RNA結(jié)合激活,就可以發(fā)揮非特異性RNA酶功能,裂解任何可觸及的單鏈RNA(single-stranded RNA, ssRNA),而不論它們是否與crRNA同源或是否存在PFS,這種效應(yīng)稱為附帶切割效應(yīng)(Collateral effect)。相比之下,Cas9和Cas12只能在其HNH或RuvC兩個核酸酶催化位點的引導(dǎo)鏈(gRNA)上切割靶標雙鏈DNA(double-stranded DNA, dsDNA)[4]。Cas13b同樣包含2個HEPN結(jié)構(gòu)域,因此有類似Cas13a的功能,Cas13d在大多數(shù)方面表現(xiàn)與先前研究的Cas13類似,而Cas13c相關(guān)研究較少[11]。
自2015年C2c2(現(xiàn)稱Cas13)系統(tǒng)被發(fā)現(xiàn)以來,其研究突飛猛進,并于2017年被《Nature Methods》評為2016年度革新技術(shù)[12]。該靶向RNA的核酸編輯技術(shù)在多個領(lǐng)域均有所應(yīng)用。
4.1 RNA示蹤 Cas13a蛋白的HEPN 結(jié)構(gòu)域中Arg(精氨酸)和His(組氨酸)突變可形成核酸酶活性缺失的dCas13a(dead Cas13a),其能夠結(jié)合目標RNA但不切割,因此成為一個可編程的RNA結(jié)合蛋白(RNA binding protein, RBP),利用其與特定RNA序列的結(jié)合特性,配合熒光標記技術(shù)可對胞內(nèi)特定RNA片段進行示蹤[13]。
4.2 臨床診斷 通過設(shè)計與目標核酸互補的gRNA,并與Cas13蛋白組裝可組成RNA檢測報告系統(tǒng)。其報告基因通常一端為熒光基團,另一端是化學(xué)猝滅劑,當報告基因與樣品中的特異性靶標核酸結(jié)合時,Cas酶將對報告基因進行裂解,從猝滅劑中釋放熒光基團發(fā)出熒光,且信號可量化。利用該技術(shù)可對待測基因進行精確測量或定性分析[14]。
圖4 應(yīng)用報告基因reporter進行核酸檢測[14]
利用Cas13在靶識別時表現(xiàn)出的附帶切割效應(yīng),Gootenberg[15]等通過設(shè)計報告基因并結(jié)合恒溫核酸依賴性擴增檢測技術(shù)(Nuclear acid sequence-based amplification, NASBA)建立了基于CRISPR的診斷系統(tǒng)(CRISPR-based diagnostic, CRISPR-dx)。其可提供渺摩爾級(attomolar, aM, 10-8mol/L)的具有單堿基錯配敏感性和特異性的快速核酸(DNA或RNA)檢測方法。該方法既可用于基因組中單核苷酸多態(tài)性(Single nucleotide polymorphisms, SNPs)分析,也可用于監(jiān)測血液中極少量的腫瘤 DNA。鑒于其高敏感性,該系統(tǒng)被稱為SHERLOCK(Specific high sensitivity enzymatic reporter unlocking),可被用于檢測寨卡和登革熱病毒的特定毒株以及區(qū)分不同的其他病原菌。其后,該團隊繼續(xù)研究出了進一步優(yōu)化的SHERLOCK version2(SHERLOCK v2)[16]。
近期,河南農(nóng)業(yè)大學(xué)常亞飛[17]等利用SHERLOCK系統(tǒng),通過結(jié)合LwCas13a附帶切割效應(yīng)和重組酶聚合酶擴增(Recombinase polymerase amplification, RPA)技術(shù),建立一種可以在37 ℃下恒溫進行豬繁殖與呼吸綜合征病毒核酸檢測的方法。該方法具有恒溫反應(yīng)、靈敏、特異、結(jié)果直觀、利于現(xiàn)場操作的特點。同時,由于SHERLOCK高度的錯配敏感性,該技術(shù)可對序列高度同源的病毒株進行區(qū)分。
4.3 基于CRISPR-Cas13的抗病毒研究 與Cas9 系統(tǒng)對DNA 病毒核酸的切割破壞效應(yīng)相似,Cas13的RNA特異性靶向切割能力可用于拮抗RNA病毒,以及復(fù)制過程中有RNA中間體的DNA病毒。Rashid Aman[18]以及Xiaohui Zhan[19]等人最早用LshCas13a系統(tǒng)干擾蕪菁花葉病毒(TuMV)以及馬鈴薯Y病毒(Potato virus Y, PVY)等植物病毒的復(fù)制增殖。近期Freije等[20]證明Cas13可被用于靶向和破壞多種感染哺乳動物的ssRNA病毒的基因組。該研究通過生物信息學(xué)技術(shù)對數(shù)百種可能感染人類的ssRNA病毒進行分析,并預(yù)測了數(shù)千個Cas13 crRNA的潛在靶點,同時經(jīng)實驗證實Cas13可拮抗淋巴細胞脈絡(luò)叢腦膜炎病毒(Lymphocytic choriomeningitis virus, LCMV)、甲型流感病毒(Influenza A virus, IAV)和水皰性口炎病毒(Vesicular stomatitis virus, VSV)這3種不同的ssRNA病毒的增殖和復(fù)制。此外,該研究還分析了介導(dǎo)Cas13靶向作用的影響因素,確定了crRNA設(shè)計標準,進一步優(yōu)化了該抗病毒方法,為后期該技術(shù)在抗病毒領(lǐng)域的廣泛應(yīng)用奠定了重要基礎(chǔ)。
基于CRISPR-Cas13系統(tǒng)的核酸檢測以及抗病毒技術(shù)將在獸醫(yī)研究領(lǐng)域大有可為,原因有三:(1)SHERLOCK檢測系統(tǒng)具有高靈敏度、特異性、可恒溫反應(yīng)、結(jié)果直觀、利于現(xiàn)場操作的特點,非常利于開發(fā)可在養(yǎng)殖場和動物醫(yī)院現(xiàn)場使用的核酸檢測試紙條,這為開發(fā)輕量化、便捷的檢測技術(shù)提供了重要思路;(2)SHERLOCK具有高度的錯配敏感性,該技術(shù)可對序列高度同源的病毒株進行區(qū)分;(3)基于CRISPR-Cas13的抗病毒策略在動物疫病的預(yù)防治療研究中較人類有更低的試錯成本。同時,該技術(shù)還可與轉(zhuǎn)基因抗病育種技術(shù)相結(jié)合,以培育對某種疾病具有天然抗性的動物。
雖然CRISPR-Cas13技術(shù)的發(fā)展突飛猛進,但目前該技術(shù)仍有諸多不足有待解決。首先,sgRNA對靶位點的正確識別需要特定PAM序列,降低了靶區(qū)選擇和相應(yīng)sgRNA設(shè)計的靈活性,也使sgRNA的設(shè)計更加復(fù)雜化。其次,crRNA與目標核酸序列的結(jié)合可容忍一定程度的錯配,進而導(dǎo)致脫靶效應(yīng)(off-target effect),阻礙了 CRISPR-Cas系統(tǒng)在生產(chǎn)實踐中的使用。當前主要通過sgRNA和PAM序列的設(shè)計以及CRISPR系統(tǒng)的優(yōu)化(Cas的構(gòu)象和Cas-sgRNA的用量等)3個方面進行降低脫靶效率的研究來提升其作用的準確性。再者,基因編輯效率(efficiency of genome editing)的提高對于CRISPR-Cas基因編輯技術(shù)的開發(fā)應(yīng)用同樣重要。此外,由于RNA酶的廣泛存在,核酸的檢測和編輯很容易受到影響,因此,在CRISPR-Cas系統(tǒng)中偏向使用更長的sgRNA來放大核酸檢測信號,以確保sgRNA沒有被RNase消化變短或降解,從而有效避免假陰性結(jié)果[21]。而CRISPR-Cas13技術(shù)若想真正用于臨床開發(fā),其Cas13 蛋白以及gRNA在體內(nèi)的精確遞呈、代謝消除、免疫激活反應(yīng)以及其他安全性相關(guān)指標均需要系統(tǒng)評估。若能解決以上諸多問題,將有利于Cas13技術(shù)的進一步完善,為傳染病快速、準確的診斷以及抗病毒藥物的開發(fā)提供新的思路和技術(shù)。