郭曉強(qiáng)
深圳市第二人民醫(yī)院,廣東 深圳 518035
CRISPR-Cas9技術(shù)發(fā)展史:25年的科學(xué)歷程
郭曉強(qiáng)?
深圳市第二人民醫(yī)院,廣東 深圳 518035
CRISPR-Cas是一種重要的原核生物獲得性免疫系統(tǒng)。CRISPR序列可轉(zhuǎn)錄并加工為非編碼RNA——crRNA,而Cas利用其DNA核酸外切酶完成RNA介導(dǎo)的靶DNA剪切,從而抵御噬菌體和質(zhì)粒等DNA的入侵。在這一系統(tǒng)基礎(chǔ)上改進(jìn)并發(fā)明目前生命科學(xué)領(lǐng)域廣泛應(yīng)用的CRISPR-Cas9基因編輯技術(shù)。通過(guò)對(duì)CRISPR序列發(fā)現(xiàn)、結(jié)構(gòu)命名、功能預(yù)測(cè)、實(shí)驗(yàn)證實(shí)、機(jī)制研究和系統(tǒng)改進(jìn)等的描述,以期能對(duì)CRISPR-Cas9技術(shù)的誕生過(guò)程有一個(gè)全面的了解。
獲得性免疫系統(tǒng);原核生物;基因編輯;CRISPR-Cas9
1953年,DNA雙螺旋模型的提出確立了DNA在分子生物學(xué)乃至整個(gè)生命科學(xué)的“中心”地位。由于DNA是遺傳信息載體,因此對(duì)DNA進(jìn)行精確操作(DNA編輯)進(jìn)而調(diào)控生物學(xué)性狀的研究,其重要性不言而喻。三位在DNA編輯技術(shù)——基因敲除方面做出奠定性貢獻(xiàn)的科學(xué)家分享了2007年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)。然而,傳統(tǒng)基因敲除技術(shù)盡管在闡明某些基因的功能方面發(fā)揮了重要作用,但操作過(guò)程較為繁瑣,周期長(zhǎng),費(fèi)時(shí)費(fèi)力,亟需進(jìn)一步完善。隨后出現(xiàn)一系列DNA編輯技術(shù),如ZFN(zinc fnger nuclease)和TALEN(transcription activator-like (TAL) effector nuclease)等,尤其是2012年出現(xiàn)的CRISPR-Cas9技術(shù)更是以操作簡(jiǎn)便、快速、高效而迅速成為實(shí)驗(yàn)室的必備技術(shù)之一,對(duì)推動(dòng)生命科學(xué)的發(fā)展具有重要意義。此外,CRISPR-Cas9技術(shù)的發(fā)明也是一個(gè)具有傳奇色彩的歷程。
這項(xiàng)技術(shù)發(fā)明在一定程度上可追溯到20世紀(jì)50年代開(kāi)始的微生物遺傳學(xué)、生物化學(xué)和基因組學(xué),三位大師級(jí)科學(xué)家萊德伯格(Joshua Lederberg)、科恩伯格(Arthur Kornberg)和桑格(Frederick Sanger)為此做出了奠基性貢獻(xiàn)。萊德伯格奠定細(xì)菌遺傳學(xué)基礎(chǔ),從而使簡(jiǎn)單的細(xì)菌成為分子生物學(xué)模式生物[1];科恩伯格則奠定細(xì)菌分子生物學(xué)酶學(xué)基礎(chǔ),開(kāi)創(chuàng)酶學(xué)研究科學(xué)范式[2];桑格則于1977年發(fā)明基因測(cè)序方法[3],從而使基因測(cè)序成為常規(guī)研究?jī)?nèi)容。CRISPR-Cas系統(tǒng)的發(fā)現(xiàn)則開(kāi)始于細(xì)菌測(cè)序。
1987年,日本微生物學(xué)家石野良純(Yoshizumi Ishino)在但中田(Atsuo Nakata)實(shí)驗(yàn)室對(duì)大腸桿菌的堿性磷酸酶同工酶(alkaline phosphatase isozyme, iap)進(jìn)行測(cè)序,為更好地理解基因表達(dá)調(diào)節(jié)的機(jī)制,在對(duì)編碼區(qū)進(jìn)行檢測(cè)的同時(shí)順便對(duì)基因上游和下游序列完成了測(cè)序。在常規(guī)報(bào)道iap基因編碼序列的同時(shí),他們意外地發(fā)現(xiàn)終止密碼子后的非編碼區(qū)存在一些異常重復(fù)序列[4]。之所以異常源于兩個(gè)原因:一方面原核生物如細(xì)菌的DNA利用率較高,因此它的重復(fù)序列較少(真核生物存在大量重復(fù)序列);另一方面?zhèn)鹘y(tǒng)的重復(fù)序列常為串聯(lián)重復(fù),而這次發(fā)現(xiàn)卻是“重復(fù)-居間序列(spacer)-重復(fù)”這一排列特征(圖1)。論文最后一句話是:“到目前為止,在其他原核生物未發(fā)現(xiàn)同源序列,并且這些序列的生物學(xué)意義尚不清晰?!盵4]對(duì)這段重復(fù)序列的討論說(shuō)明他們也部分意識(shí)到這一現(xiàn)象,但就當(dāng)時(shí)有限的知識(shí)而言,不可能對(duì)其有進(jìn)一步理解。然而這一發(fā)現(xiàn)存在一個(gè)缺陷,就是尚不知這種現(xiàn)象是否具有普適性。如果僅僅是大腸桿菌iap基因特有,則重要性就大打折扣,因此科學(xué)界首先需要解決的是這種“詭異”的序列是否普遍存在。然而,后續(xù)研究進(jìn)入一個(gè)緩慢發(fā)展期,很少有人對(duì)此現(xiàn)象進(jìn)行研究(石野良純等也轉(zhuǎn)向翻譯機(jī)制的研究)。
圖1 CRISPR序列的發(fā)現(xiàn)
20世紀(jì)80年代末,西班牙阿利坎特大學(xué)(University of Alicante)的博士生莫伊察(Francisco Mojica)在一種嗜鹽古菌(Haloferax mediterranei)中也發(fā)現(xiàn)一類“重復(fù)-居間序列-重復(fù)”特征序列[5]。莫伊察對(duì)這種現(xiàn)象非常感興趣,因此進(jìn)一步在其他微生物中尋找類似結(jié)構(gòu),基因組測(cè)序技術(shù)的突飛猛進(jìn)為這項(xiàng)研究提供了極大便利。莫伊察通過(guò)對(duì)多種已完成基因組測(cè)序的原核生物進(jìn)行序列比對(duì)分析發(fā)現(xiàn)這種現(xiàn)象非常普遍,到2000年,已在20多種不同微生物中發(fā)現(xiàn)這種特異序列。為便于進(jìn)一步研究,將其命名為短規(guī)律間隔重復(fù)(short regularly spaced repeat, SRSR)[6]。
2002年,荷蘭烏得勒支大學(xué)(Utrecht University)的詹森(Ruud Jansen)進(jìn)一步發(fā)現(xiàn)多個(gè)微生物中存在這種特殊結(jié)構(gòu),并且不同物種的重復(fù)序列堿基數(shù)存在巨大差異,從21到37不等,如鼠傷寒沙門(mén)氏菌(Salmonella typhimurium)為21,而化膿性鏈球菌(Streptococcus pyogenes)為37。此外,他還發(fā)現(xiàn)這種序列只在原核生物存在,而病毒和真核生物均缺乏。為更好地規(guī)范相關(guān)研究,詹森在和莫伊察溝通后,將這種特殊結(jié)構(gòu)重新定義為成簇規(guī)律性間隔短回文重復(fù)(clustered regularly interspaced short palindromic repeat, CRISPR)[7]。詹森還發(fā)現(xiàn)CRISPR序列附近還存在多個(gè)編碼序列,推測(cè)它們參與了CRISPR的生理功能,因此將其命名為CRISPR相關(guān)基因(CRISPR-associated gene, Cas)(這種推測(cè)主要基于原核生物基因組多以操縱子形式存在,即功能相關(guān)基因串聯(lián)分布在一起)。至此,在原核生物(包括細(xì)菌和古菌)中發(fā)現(xiàn)一個(gè)由特殊DNA序列(CRISPR)和多個(gè)編碼基因(Cas)構(gòu)成的獨(dú)特系統(tǒng),當(dāng)然這個(gè)系統(tǒng)的作用尚一無(wú)所知。隨后研究人員提出多種假說(shuō)來(lái)解釋這一系統(tǒng),但大多基于一種想當(dāng)然的推測(cè),并未有太多的邏輯推理和數(shù)據(jù)支持。
2005年,CRISPR研究出現(xiàn)一個(gè)根本轉(zhuǎn)折。來(lái)自西班牙和法國(guó)的三個(gè)研究小組幾乎同時(shí)報(bào)道了一個(gè)重大發(fā)現(xiàn):通過(guò)對(duì)CRISPR居間序列的系統(tǒng)分析,意外發(fā)現(xiàn)它們并非原核生物自身序列,而是來(lái)自病毒或質(zhì)粒[8-10]。這一發(fā)現(xiàn)提出了一個(gè)重要問(wèn)題:那就是原核生物獲取這些序列的目的何在?
美國(guó)國(guó)立生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI)進(jìn)化生物學(xué)家?guī)鞂?Eugene Koonin)很早就對(duì)CRISPR-Cas系統(tǒng)擁有濃厚興趣,但苦于無(wú)法理解它的生物學(xué)意義。當(dāng)獲悉CRISPR的居間序列來(lái)自病毒DNA后,庫(kù)寧立刻意識(shí)到細(xì)菌可利用CRISPR作為一種防御病毒侵染的重要武器。在自然界,細(xì)菌時(shí)刻面臨噬菌體(細(xì)菌病毒)等的攻擊,但它們絕非被動(dòng)受害者,而是在進(jìn)化過(guò)程中形成多種防御措施,著名的如修飾-限制系統(tǒng)(對(duì)自身DNA堿基進(jìn)行甲基化修飾,再利用限制性內(nèi)切酶對(duì)入侵DNA進(jìn)行剪切從而實(shí)現(xiàn)防御目的)。
早在2002年就發(fā)現(xiàn)原核生物中不編碼蛋白質(zhì)的CRISPR序列也可轉(zhuǎn)錄產(chǎn)生RNA[5],而1998年在真核生物中發(fā)現(xiàn)RNA干擾現(xiàn)象,即非編碼的小RNA可影響mRNA穩(wěn)定性或翻譯效率?;谶@些事實(shí),庫(kù)寧提出解釋CRISPR-Cas作為獲得性免疫系統(tǒng)的作用機(jī)制:細(xì)菌通過(guò)特定方式獲取噬菌體DNA片段并將其整合到自身CRISPR重復(fù)序列之間形成居間序列,從而對(duì)外源入侵病毒產(chǎn)生“記憶”;這些序列可被轉(zhuǎn)錄出非編碼RNA;當(dāng)噬菌體再次感染時(shí),這些RNA可依靠居間序列信息識(shí)別并破壞入侵者(圖2)[11]。
圖2 CRISPR干擾假說(shuō)的提出
在庫(kù)寧提出這一假說(shuō)時(shí),科學(xué)界對(duì)CRISPR和Cas蛋白的作用還知之甚少,但這一思想激發(fā)了法國(guó)微生物學(xué)家巴蘭古(Rodolphe Barrangou)的動(dòng)力,他決定驗(yàn)證這一假說(shuō)的可靠性。巴蘭古之所以會(huì)驗(yàn)證這一假說(shuō),動(dòng)力來(lái)源不僅僅在于假說(shuō)的迷人魅力,更重要是出于工作需要。巴蘭古在著名的酸奶公司丹尼斯克(Danisco)工作,時(shí)常面臨的一大問(wèn)題是產(chǎn)酸奶的嗜熱鏈球菌(Streptococcus thermophilus)有時(shí)會(huì)爆發(fā)噬菌體感染而導(dǎo)致死亡,最終影響酸奶生產(chǎn)。庫(kù)寧假說(shuō)意味著可利用CRISPR-Cas系統(tǒng)來(lái)實(shí)現(xiàn)增強(qiáng)細(xì)菌抵抗噬菌體的目的。
巴蘭古在霍瓦特(Philippe Horvath)等協(xié)助下首先利用兩株噬菌體(P1和P2)侵染鏈球菌,結(jié)果殺死大部分細(xì)菌,但仍有部分“幸運(yùn)”細(xì)菌保留下來(lái),且當(dāng)它們被進(jìn)一步培養(yǎng)時(shí)獲得噬菌體抗性。對(duì)這些抗性細(xì)菌的基因組分析表明,其CRISPR居間序列中出現(xiàn)噬菌體序列,并且與P1序列一致則對(duì)P1產(chǎn)生抗性,若與P2序列一致則對(duì)P2產(chǎn)生抗性,而如果為兩株噬菌體公用序列,則對(duì)兩株噬菌體均產(chǎn)生抗性(圖3)。當(dāng)將抗性細(xì)菌去除噬菌體序列則導(dǎo)致抗性消失,相反直接將噬菌體序列整合到未感染過(guò)噬菌體的細(xì)菌CRISPR中,細(xì)菌對(duì)首次噬菌體感染產(chǎn)生抗性[12]。這是首次在實(shí)驗(yàn)上證實(shí)CRISPR-Cas是一種細(xì)菌獲得性免疫系統(tǒng)。
巴蘭古等的發(fā)現(xiàn)既是CRISPR-Cas系統(tǒng)研究的一個(gè)里程碑,也是一個(gè)轉(zhuǎn)折點(diǎn)和分水嶺。許多團(tuán)隊(duì)也開(kāi)始意識(shí)到這一系統(tǒng)的重要性,從而促進(jìn)這一領(lǐng)域的快速進(jìn)展。
圖3 CRISPR與細(xì)菌獲得性免疫
2008年,荷蘭瓦赫寧恩大學(xué)的范德歐斯特(John van der Oost)等通過(guò)研究大腸桿菌的CRISPR-Cas系統(tǒng)(Ⅰ型)發(fā)現(xiàn)CRISPR序列可轉(zhuǎn)錄并加工出非編碼RNA——crRNA(CRISPR RNA),而crRNA介導(dǎo)了隨后的干擾機(jī)制[13]。同一年,西北大學(xué)的松特海默爾(Erik Sontheimer)等則在表皮葡萄球菌(Staphylococcus epidermidis)的CRISPR-Cas系統(tǒng)(Ⅲ型)中發(fā)現(xiàn),crRNA發(fā)揮干擾作用的靶點(diǎn)是DNA,而不像真核生物作用靶點(diǎn)為RNA[14]。這一發(fā)現(xiàn)不僅糾正了庫(kù)寧假說(shuō),更重要的是為DNA編輯埋下伏筆。
2010年,對(duì)CRISPR-Cas系統(tǒng)的基本生物學(xué)作用和分子機(jī)制已有較清晰的理解,并將其應(yīng)用于減少細(xì)菌噬菌體感染和細(xì)菌進(jìn)化分析等。然而,CRISPR-Cas系統(tǒng)的應(yīng)用范圍極為有限,主要原因在于當(dāng)時(shí)已研究的兩種類型(Ⅰ型和Ⅲ型)都過(guò)于復(fù)雜,因此,尋找更為簡(jiǎn)單的體系成為一個(gè)重要方向。
卡彭蒂耶(Emmanuelle Marie Charpentier)是一位法國(guó)微生物學(xué)家,最初愛(ài)好為鋼琴和舞蹈,但對(duì)醫(yī)學(xué)的熱愛(ài)使她最終投身于生命科學(xué)的研究。在巴黎皮埃爾和瑪麗居里大學(xué)完成本科學(xué)業(yè)后,卡彭蒂耶來(lái)到附近的巴斯德研究所攻讀博士學(xué)位。在這里她對(duì)基礎(chǔ)科學(xué)產(chǎn)生了濃厚興趣,特別是對(duì)細(xì)菌耐藥機(jī)制尤為熱愛(ài)。博士畢業(yè)后,卡彭蒂耶進(jìn)入美國(guó)洛克菲勒大學(xué)開(kāi)展博士后研究,重點(diǎn)關(guān)注肺炎鏈球菌的耐藥性。后來(lái)她又在紐約大學(xué)醫(yī)學(xué)院開(kāi)展哺乳動(dòng)物基因調(diào)控研究。在此過(guò)程中她一方面發(fā)現(xiàn)哺乳動(dòng)物過(guò)于復(fù)雜,因此決定重回細(xì)菌研究;另一方面也意識(shí)到當(dāng)時(shí)過(guò)于繁瑣的哺乳動(dòng)物基因編輯技術(shù)亟待改進(jìn)。
2002年,卡彭蒂耶回到歐洲,首先在奧地利維也納大學(xué)獲得一份職位,并擁有獨(dú)立的小實(shí)驗(yàn)室。盡管主要依賴短期基金項(xiàng)目支持,但仍孜孜不倦開(kāi)展科學(xué)實(shí)驗(yàn)。隨著哺乳動(dòng)物RNA干擾現(xiàn)象的發(fā)現(xiàn),卡彭蒂耶也開(kāi)始關(guān)注細(xì)菌中非編碼RNA的作用。在德國(guó)馬普感染生物學(xué)研究所分子生物學(xué)家沃格爾(J?rg Vogel)協(xié)助下,卡彭蒂耶結(jié)合生物信息學(xué)方法在化膿鏈球菌(Streptococcus pyogenes)發(fā)現(xiàn)多種非編碼RNA,特別是一類在CRISPR序列附近的新型小RNA,將其命名為反式激活CRISPR來(lái)源RNA(trans-activating CRISPR-derived RNA, tracrRNA),并推測(cè)它們與CRISPR系統(tǒng)有密切關(guān)系[15]。
由于當(dāng)時(shí)已鑒定crRNA參與基因組DNA剪切,因此卡彭蒂耶推測(cè)tracrRNA可能通過(guò)與crRNA相互作用來(lái)引導(dǎo)酶發(fā)揮功能??ㄅ淼僖倪@一假說(shuō)非常激進(jìn),與傳統(tǒng)觀念相差甚遠(yuǎn)。一般認(rèn)為特定序列DNA的識(shí)別由蛋白質(zhì)如限制性內(nèi)切酶、轉(zhuǎn)錄因子(ZFN和TELEN技術(shù)原理就是依據(jù)轉(zhuǎn)錄因子特異識(shí)別DNA序列實(shí)現(xiàn)剪切)等完成,尚未發(fā)現(xiàn)RNA介導(dǎo)。卡彭蒂耶這一“離經(jīng)叛道”的想法嚇壞了很多人,大部分研究生都不愿接手這一項(xiàng)目,最終德?tīng)柷型?Elitza Deltcheva)主動(dòng)要求通過(guò)實(shí)驗(yàn)來(lái)驗(yàn)證卡彭蒂耶的假說(shuō)。
2009年6月,卡彭蒂耶離開(kāi)奧地利,加入新建的瑞典于默奧大學(xué)(Ume? University)微生物研究中心,但仍在維也納大學(xué)保留實(shí)驗(yàn)室。德?tīng)柷型叩膶?shí)驗(yàn)進(jìn)展比較順利,不久就證實(shí)了卡彭蒂耶當(dāng)初的推測(cè)。為避免文章被拒或延遲發(fā)表,他們花費(fèi)一年多時(shí)間重復(fù)和完善實(shí)驗(yàn)以保證每一個(gè)結(jié)果的可靠性。2011年,卡彭蒂耶的發(fā)現(xiàn)在《自然》雜志發(fā)表,首次闡明tracrRNA在crRNA加工中的作用(圖4):tracrRNA與轉(zhuǎn)錄出的CRISPR重復(fù)序列互補(bǔ)結(jié)合,這種結(jié)合在Cas9因子存在前提下被RNA酶Ⅲ識(shí)別和剪切,最終產(chǎn)生成熟crRNA[16]。這一發(fā)現(xiàn)具有十分重要的意義,相對(duì)于其他CRISPR系統(tǒng)往往需要一種crRNA但同時(shí)需多種Cas9蛋白參與,這一系統(tǒng)(Ⅱ型)則需兩種RNA(crRNA和tracrRNA),雖增加RNA數(shù)量,卻只需一種Cas9蛋白完成。這個(gè)系統(tǒng)如此簡(jiǎn)單,卡彭蒂耶意識(shí)到可將其改造為一種強(qiáng)有力的遺傳操作工具用作基因編輯。
2011年,在波多黎各首都圣胡安(San Juan)舉辦的美國(guó)微生物會(huì)議上,卡彭蒂耶與美國(guó)加州大學(xué)伯克利分校結(jié)構(gòu)生物學(xué)家杜德娜(Jennifer Anne Doudna)相遇。通過(guò)交流她們都對(duì)tracrRNA這一發(fā)現(xiàn)很感興趣,隨后決定合作開(kāi)展進(jìn)一步工作。
圖4 tracrRNA生物作用的發(fā)現(xiàn)
杜德娜有著輝煌的學(xué)術(shù)背景,可稱得上一位名副其實(shí)的“學(xué)術(shù)二代”。她從小就對(duì)科學(xué)發(fā)現(xiàn)充滿巨大興趣,1985年從波莫納大學(xué)獲得化學(xué)學(xué)士后進(jìn)入哈佛大學(xué)跟隨紹斯塔克(Jack Szostak,2009年由于端粒發(fā)現(xiàn)分享諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng))進(jìn)行博士學(xué)習(xí)。20世紀(jì)80年代,核酶(具有催化功能的RNA)的發(fā)現(xiàn)使科學(xué)界開(kāi)始重新審視RNA的生物學(xué)功能,并越來(lái)越意識(shí)到RNA遠(yuǎn)比當(dāng)初克里克中心法則中“遺傳信息傳遞的中介”(三種RNA負(fù)責(zé)將DNA遺傳信息傳遞給蛋白質(zhì))這一作用重要的多。因此,杜德娜開(kāi)始關(guān)注RNA廣泛的生物學(xué)作用,并在博士期間制備成功具有催化自我復(fù)制能力的RNA。
杜德娜在RNA方面的重要工作引起科羅拉多大學(xué)切赫(Tom Cech,1989年由于核酶發(fā)現(xiàn)而分享諾貝爾化學(xué)獎(jiǎng))的注意,因此邀請(qǐng)杜德娜加入實(shí)驗(yàn)室開(kāi)展博士后研究——借助結(jié)構(gòu)生物學(xué)工具研究核酶的作用機(jī)制。1991年,杜德娜成功制備出第一個(gè)核酶(四膜蟲(chóng)I類核酶)晶體,并采用X射線衍射技術(shù)獲得這種RNA的三維結(jié)構(gòu),對(duì)理解核酶機(jī)制具有重要幫助。1994年,杜德娜加入耶魯大學(xué),繼續(xù)與切赫合作開(kāi)展核酶研究,同時(shí)她也逐漸成長(zhǎng)為一位在RNA研究領(lǐng)域冉冉升起的科學(xué)新星。2002年,杜德娜從耶魯大學(xué)轉(zhuǎn)到加州大學(xué)伯克利分校,更為先進(jìn)的技術(shù)平臺(tái)使研究更加得心應(yīng)手,她開(kāi)始研究病毒RNA的作用。1998年,RNA干擾現(xiàn)象的發(fā)現(xiàn)進(jìn)一步使科學(xué)家意識(shí)到RNA還是一類重要的基因表達(dá)調(diào)節(jié)分子,而杜德娜也將研究領(lǐng)域拓展到RNA干擾,研究參與這一過(guò)程的RNA酶如Argonaute和Dicer等的作用機(jī)制。杜德娜的學(xué)術(shù)貢獻(xiàn)獲得了科學(xué)界的高度認(rèn)可,2004年當(dāng)選為美國(guó)科學(xué)院院士[17]。
2005年,杜德娜也獲悉原核生物CRISPRCas系統(tǒng),并對(duì)此產(chǎn)生濃厚興趣。由于當(dāng)時(shí)推測(cè)采用RNA干擾方式殺死病毒,但詳細(xì)機(jī)制可能不同于真核細(xì)胞。2007年,巴蘭古等發(fā)現(xiàn)CRISPR-Cas系統(tǒng)的細(xì)菌免疫作用進(jìn)一步堅(jiān)定了杜德娜的決心,打算借助結(jié)構(gòu)生物學(xué)方法探索這一新型“RNA干擾”中酶的作用機(jī)制。為此她專門(mén)成立一個(gè)細(xì)菌CRISPR-Cas系統(tǒng)的青年研究小組,主要包括博士后韋登赫福特(Blake Wiedenheft)和伊內(nèi)克(Martin Jinek)等。該小組的優(yōu)勢(shì)在于擁有堅(jiān)實(shí)的分子生物學(xué)、結(jié)構(gòu)生物學(xué)和生物化學(xué)等基礎(chǔ),可將多種Cas蛋白完成純化、結(jié)晶和結(jié)構(gòu)測(cè)定,同時(shí)借助其他手段闡述酶的作用機(jī)制。他們先后確定Cas蛋白擁有DNA酶活性、RNA序列依賴的DNA核酸內(nèi)切酶活性、crRNA加工活性[18]等。通過(guò)這些研究,杜德娜小組確定CRISPR-Cas是一種可對(duì)特定DNA序列進(jìn)行定向剪切的細(xì)菌防御系統(tǒng),但鑒于已研究的系統(tǒng)過(guò)于復(fù)雜,因此限制了這種系統(tǒng)的其他應(yīng)用。
2011年之所以非常愉快地達(dá)成合作,原因在于杜德娜對(duì)這種簡(jiǎn)單的Ⅱ型系統(tǒng)特別是tracrRNA很著迷,而卡彭蒂耶則對(duì)Cas9作用機(jī)制更感興趣。一位RNA專家(卡彭蒂耶)與一位酶學(xué)專家(杜德娜)的鼎力合作實(shí)現(xiàn)了最大程度的優(yōu)勢(shì)互補(bǔ),而CRISPR-Cas9技術(shù)簡(jiǎn)單而言就是RNA(sgRNA)和酶(Cas9)。為盡快解決科學(xué)難題,合作溝通由杜德娜博士后伊內(nèi)克和卡彭蒂耶博士后黑林斯基(Krzysztof Chylinski)具體負(fù)責(zé),巧合的是他們都來(lái)自波蘭,因此交流非常順暢。他們合作純化了Cas9蛋白,并證明Cas9具有依賴兩種RNA的DNA核酸內(nèi)切酶活性。Cas9擁有兩個(gè)內(nèi)切酶結(jié)構(gòu)域,可分別對(duì)兩條鏈進(jìn)行切割。這個(gè)發(fā)現(xiàn)一方面拓展了卡彭蒂耶最初的發(fā)現(xiàn),使tracrRNA擁有了雙重作用(crRNA加工和靶DNA切割);另一方面還發(fā)現(xiàn)tracrRNA可與crRNA形成特殊二級(jí)結(jié)構(gòu)來(lái)指導(dǎo)DNA剪切。這一現(xiàn)象立刻激發(fā)了研究激情,他們?cè)诒A舳?jí)結(jié)構(gòu)基礎(chǔ)上,將tracrRNA與crRNA兩種RNA連接成一種RNA,稱為單鏈引導(dǎo)RNA(single guide RNA,sgRNA),體外實(shí)驗(yàn)表明sgRNA也可指導(dǎo)Cas9蛋白完成對(duì)靶DNA的雙鏈剪切(圖5)。這一發(fā)現(xiàn)最終于2012年6月發(fā)表,它預(yù)示著可利用CRISPRCas9系統(tǒng)實(shí)現(xiàn)對(duì)目標(biāo)DNA剪切,從而達(dá)到基因編輯的目的[19]。
卡彭蒂耶和杜德娜的發(fā)現(xiàn)既是細(xì)菌獲得性免疫系統(tǒng)領(lǐng)域研究的里程碑,又是基因編輯領(lǐng)域的里程碑。CRISPR-Cas9 DNA精確剪切系統(tǒng)迅速成為多個(gè)實(shí)驗(yàn)室追逐的研究對(duì)象。
圖5 CRISPR-Cas9技術(shù)的發(fā)明
早在2011年,立陶宛維爾紐斯大學(xué)的斯克尼斯(Virginijus Siksnys)小組首次將嗜熱鏈球菌的CRISPR-Cas9系統(tǒng)導(dǎo)入大腸桿菌,結(jié)果可使大腸桿菌獲得噬菌體抵抗能力[20]。這一發(fā)現(xiàn)意味著CRISPR-Cas9系統(tǒng)可在不同物種內(nèi)發(fā)揮相同功能,為將來(lái)應(yīng)用于哺乳動(dòng)物基因組編輯奠定堅(jiān)實(shí)基礎(chǔ)。此外,斯克尼斯小組也于2012年下半年實(shí)現(xiàn)體外DNA編輯[5]。2013年初,哈佛大學(xué)張鋒和丘齊(George Church)則進(jìn)一步在哺乳動(dòng)物細(xì)胞內(nèi)完成特定基因的編輯[21-22],特別是可利用多個(gè)sgRNA而實(shí)現(xiàn)多基因同時(shí)敲除,從而極大提升編輯效率和適用范圍。2013年,先后有多家實(shí)驗(yàn)室成功利用CRISPR-Cas9完成基因編輯,引起了一場(chǎng)持續(xù)至今的研究熱潮[23-24]。
CRISPR-Cas9技術(shù)已在全世界上千家實(shí)驗(yàn)室得到廣泛應(yīng)用。最主要的應(yīng)用領(lǐng)域是基因組編輯,已在人細(xì)胞系和多種模式生物如酵母、果蠅、線蟲(chóng)、斑馬魚(yú)、小鼠、大鼠、豬和猴等完成感興趣基因的編輯,并在此基礎(chǔ)上建立多種疾病模型,為闡明疾病發(fā)生的分子機(jī)制和藥物篩選提供重要平臺(tái)。天然Cas9酶還被進(jìn)行人工改造,一方面可減少基因編輯過(guò)程的脫靶效應(yīng),另一方面還被應(yīng)用于轉(zhuǎn)錄調(diào)控(激活或抑制)等研究。隨著CRISPR-Cas9技術(shù)的完善和安全性的改進(jìn),也可能在將來(lái)疾病治療方面發(fā)揮重要作用[24-25]。
CRISPR-Cas9技術(shù)本身不僅取得巨大成功,還推動(dòng)基因編輯新工具的層出不窮,出現(xiàn)了一系列改進(jìn)版和更新版。Cpf1與Cas9類似,也是一種RNA依賴的DNA核酸內(nèi)切酶,但在剪切靶DNA時(shí)只需crRNA參與,而無(wú)需tracrRNA輔助[26],用做基因編輯時(shí)可大大縮短引導(dǎo)RNA長(zhǎng)度,因此CRISPR-Cpf1系統(tǒng)將更為簡(jiǎn)單。2009年,庫(kù)寧等進(jìn)一步提出假說(shuō),原核生物除CRISPR-Cas系統(tǒng)外,Argonaute蛋白(Ago)系統(tǒng)(不同于CRISPRCas系統(tǒng)只存在于原核生物,Argonaute蛋白從原核生物到真核生物都普遍存在,并且在真核生物RNA干擾過(guò)程中的作用機(jī)制已得到全面研究)也可發(fā)揮免疫作用以抵御質(zhì)粒等外源DNA入侵,暗示著也可被改造為基因編輯工具。2014年,范德歐斯特等首次利用古菌——噬熱棲熱菌(Thermus thermophilus)的Ago蛋白(TtAgo)完成單鏈DNA(single stranded DNA,ssDNA)指導(dǎo)的靶DNA剪切[27],然而這種蛋白只能在65℃以上才發(fā)揮活性,從而限制了細(xì)胞及機(jī)體內(nèi)的應(yīng)用。這三種系統(tǒng)采用類似策略完成對(duì)目的基因的編輯(圖6),隨著技術(shù)的完善,將在基礎(chǔ)研究和實(shí)際應(yīng)用方面有著廣闊的發(fā)展空間。
圖6 三種編輯方法的比較
CRISPR-Cas9技術(shù)的廣泛應(yīng)用證明了這項(xiàng)發(fā)明的重要意義,這一技術(shù)也于2013和2015年兩次入選美國(guó)《科學(xué)》評(píng)選的十大科學(xué)突破,許多為此技術(shù)發(fā)明做出卓越貢獻(xiàn)的科學(xué)家特別是卡彭蒂耶和杜德娜等已獲得多項(xiàng)科學(xué)大獎(jiǎng)[28]??茖W(xué)界普遍認(rèn)為,這項(xiàng)發(fā)明將來(lái)獲得諾貝爾獎(jiǎng)是毋容置疑的[15]。從獲獎(jiǎng)?lì)悇e上講,類似DNA重組、聚合酶鏈?zhǔn)椒磻?yīng)等技術(shù)授予化學(xué)獎(jiǎng)的可能性更高。但無(wú)論如何,這一突破對(duì)生命科學(xué)、醫(yī)學(xué)等發(fā)展具有極大的推動(dòng)作用。
CRISPR-Cas9技術(shù)的發(fā)明歷程為我們提供了三個(gè)方面的思考。
首先,重視微生物研究。這是科恩伯格在酶學(xué)研究“十誡”中的名言[29]。微生物基礎(chǔ)生命現(xiàn)象的生物化學(xué)機(jī)制研究為生物技術(shù)提供了思想源泉和操作工具。聚合酶鏈?zhǔn)椒磻?yīng)(PCR)和桑格法測(cè)序來(lái)源于對(duì)微生物復(fù)制研究基礎(chǔ)上DNA聚合酶純化和機(jī)制研究,基因工程的突破來(lái)自微生物限制-修飾系統(tǒng)研究中發(fā)現(xiàn)的限制性內(nèi)切酶,而CRISPR-Cas9技術(shù)則是對(duì)細(xì)菌獲得性免疫系統(tǒng)的深入研究。因此,一系列重大生物技術(shù)的突破可稱得上是微生物學(xué)與生物化學(xué)的完美結(jié)合。
其次,重視基礎(chǔ)科學(xué)研究。這是科學(xué)發(fā)展的一般規(guī)律。科學(xué)與技術(shù)發(fā)展往往相輔相成,互相促進(jìn)??茖W(xué)理論突破為技術(shù)發(fā)明提供了思想源泉,而技術(shù)革新則為科學(xué)進(jìn)步提供實(shí)驗(yàn)保證。科學(xué)的真諦原本就是為了探索自然界奧秘,在認(rèn)識(shí)世界的基礎(chǔ)上最終達(dá)到改造世界的目的,從而為人類生產(chǎn)能力提高和生活水平改善提供重要幫助。CRISPR-Cas9技術(shù)就是通過(guò)對(duì)細(xì)菌奇異序列的深入探索發(fā)現(xiàn)了新型的細(xì)菌獲得性免疫系統(tǒng),而進(jìn)一步的機(jī)制研究觸發(fā)了改造該系統(tǒng)應(yīng)用于基因編輯的靈感。
最后,重視科學(xué)發(fā)展規(guī)律??茖W(xué)研究一個(gè)重要特點(diǎn)就在于“前人植樹(shù),后人乘涼”。從最初不經(jīng)意的發(fā)現(xiàn)(1987年),到沉默十幾年的過(guò)渡(1987年到2005年),再到一朝突破(2007年和2011年)引發(fā)科學(xué)快速發(fā)展,到最終的技術(shù)發(fā)明(2012年),前后跨越25年(圖7)。CRISPR-Cas9技術(shù)的發(fā)明是一種水到渠成的結(jié)果,而非刻意為之可達(dá)到的效果。科學(xué)研究充滿了巨大的不確定性,因此應(yīng)更多地鼓勵(lì)和支持“看不到明顯效益”的基礎(chǔ)研究。目前科研領(lǐng)域過(guò)多關(guān)注研究的應(yīng)用價(jià)值和市場(chǎng)潛力,然而欲速則不達(dá),這種短視的眼光束縛了科學(xué)更好的發(fā)展。
圖7 CRISPR-Cas9技術(shù)發(fā)展的重大事件時(shí)間表
(2016年5月24日收稿)■
[1] 郭曉強(qiáng). 細(xì)菌遺傳學(xué)之父——喬舒亞·萊德伯格[J]. 自然雜志, 2012, 34(2): 119-124.
[2] 郭曉強(qiáng). DNA酶學(xué)之父——科恩伯格[J]. 自然雜志, 2009, 31(4): 245-248.
[3] 郭曉強(qiáng). 基因組學(xué)之父: 桑格[J]. 科學(xué), 2014, 66(5): 59-62.
[4] SHINO Y, SHINAGAWA H, MAKINO K, et al. Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identifcation of the gene product [J]. J Bacteriol, 1987, 169(12): 5429-5433.
[5] LANDER E S. The heroes of CRISPR [J]. Cell, 2016, 164(1/2): 18-28.
[6] MOJICA F J, DíEZ-VILLASE?OR C, SORIA E, et al. Biological signifcance of a family of regularly spaced repeats in the genomes of Archaea, Bacteria and mitochondria [J]. Mol Microbiol, 2000, 36(1): 244-246.
[7] JANSEN R, EMBDEN J D, GAASTRA W, et al. Identification of genes that are associated with DNA repeats in prokaryotes [J]. Mol Microbiol, 2002, 43(6): 1565-1575.
[8] MOJICA F J, DíEZ-VILLASE?OR C, GARCíA-MARTíNEZ J, et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements [J]. J Mol Evol, 2005, 60(2): 174-182.
[9] POURCEL C, SALVIGNOL G, VERGNAUD G. CRISPR elements in Yersinia pestis acquire new repeats by preferential uptake of bacteriophage DNA, and provide additional tools for evolutionary studies [J]. Microbiology, 2005, 151(3): 653-663.
[10] BOLOTIN A, QUINQUIS B, SOROKIN A, et al. Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin [J]. Microbiology, 2005, 151(8): 2551-2561.
[11] MAKAROVA K S, GRISHIN N V, SHABALINA S A, et al. A putative RNA-interference-based immune system in prokaryotes: computational analysis of the predicted enzymatic machinery, functional analogies with eukaryotic RNAi, and hypothetical mechanisms of action [J]. Biol Direct, 2006, 1: 7.
[12] BARRANGOU R, FREMAUX C, DEVEAU H, et al. CRISPR provides acquired resistance against viruses in prokaryotes [J]. Science, 2007, 315(5819): 1709-1712.
[13] BROUNS S J, JORE M M, LUNDGREN M, et al. Small CRISPR RNAs guide antiviral defense in prokaryotes [J]. Science, 2008, 321(5891): 960-964.
[14] MARRAFFINI L A, SONTHEIMER E J. CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA [J]. Science, 2008, 322(5909): 1843-1845.
[15] ABBOTT A. The quiet revolutionary: How the co-discovery of CRISPR explosively changed Emmanuelle Charpentier’s life [J]. Nature, 2016, 532(7600): 432-434.
[16] DELTCHEVA E, CHYLINSKI K, SHARMA C M, et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III [J]. Nature, 2011, 471(7340): 602-607.
[17] MARINO M. Biography of Jennifer A. Doudna [J]. Proc Natl Acad Sci USA, 2004, 101(49): 16987-16989.
[18] HAURWITZ R E, JINEK M, WIEDENHEFT B, et al. Sequence- and structure-specific RNA processing by a CRISPR endonuclease [J]. Science, 2010, 329(5997): 1355-1358.
[19] JINEK M, CHYLINSKI K, FONFARA I, et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity [J]. Science, 2012, 337(6096): 816-821.
[20] SAPRANAUSKAS R, GASIUNAS G, FREMAUX C, et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli [J]. Nucleic Acids Res, 2011, 39(21): 9275-9282.
[21] CONG L, RAN F A, COX D, et al. Multiplex genome engineering using CRISPR/Cas systems [J]. Science, 2013, 339(6121): 819-823.
[22] MALI P, YANG L, ESVELT K M, et al. RNA-guided human genome engineering via Cas9 [J]. Science, 2013, 339(6121): 823-826.
[23] PENNISI E. The CRISPR craze [J]. Science, 2013, 341(6148): 833-836.
[24] DOUDNA J A, CHARPENTIER E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9 [J]. Science, 2014, 346(6213): 1258096.
[25] HSU P D, LANDER E S, ZHANG F. Development and applications of CRISPR-Cas9 for genome engineering [J]. Cell, 2014, 157(6): 1262-1278. [26] ZETSCHE B, GOOTENBERG J S, ABUDAYYEH O O, et al. Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system [J]. Cell, 2015, 163(3): 759-771.
[27] SWARTS D C, JORE M M, WESTRA E R, et al. DNA-guided DNA interference by a prokaryotic Argonaute [J]. Nature, 2014, 507(7491): 258-261.
[28] 郭曉強(qiáng), 黃衛(wèi)人, 蔡志明. 一種全新DNA編輯工具——CRISPR-Cas9技術(shù)[J]. 科學(xué)通報(bào), 2015, 60(30): 2833-2835.
[29] KORNBERG A. Ten commandments: lessons from the enzymology of DNA replication [J]. J Bacteriol, 2000, 182(13): 3613-3618.
(編輯:沈美芳)
The invention of CRISPR-Cas9 technology: 25-years scientific journey
GUO Xiaoqiang
Shenzhen Second People’s Hospital, Shenzhen 518035, Guangdong Province, China
CRISPR-Cas (clustered regularly interspaced short palindromic repeat-CRISPR-associated) is an important acquired immune system for prokaryotes. CRISPR sequences can be transcribed and processed into non-coding RNA, crRNA (CRISPRRNA). These Cas proteins can complete the RNA mediated target DNA cut using their DNA exonuclease, which is important for bacteriophage and plasmid DNA invader defense in prokaryotes. The CRISPR-Cas9 gene editing was invented on the system, which is widely used in life science. In the article, the following knowledge was described including discovery of CRISPR sequence, nomenclature of CRISPR, prediction of biological role, confrmation of experiment, research on mechanism and improvement of system. It is important for the comprehensive understanding of CRISPR-Cas9 technology invention.
acquired immune system, prokaryote, gene editing, CRISPR-Cas9
10.3969/j.issn.0253-9608.2016.04.008
?通信作者,E-mail: xiaoqiangguo123@163.com