岳鵬鵬,唐琴艷,李欣怡,陳 玲,付 燦,于鴻浩
成簇規(guī)律間隔短回文重復(fù)序列系統(tǒng)(Clustered regularly interspaced short palindromic repeats,associated RNA guided endonuclease Cas,CRISPR/Cas)是細(xì)菌和古細(xì)菌在長(zhǎng)期進(jìn)化過程中形成的抵御外來遺傳物質(zhì)的獲得性免疫防御機(jī)制[1-2]。研究者根據(jù)其免疫防御機(jī)制,經(jīng)過基因工程改造,發(fā)明了可以實(shí)現(xiàn)真核細(xì)胞基因組DNA打靶的CRISPR/Cas9系統(tǒng)。CRISPR/Cas9系統(tǒng)中,Cas9核酸內(nèi)切酶在向?qū)NA(Small Guide RNA, sgRNA)的指引下,通過堿基互補(bǔ)配對(duì)原則,結(jié)合到基因組靶點(diǎn)位置,切割DNA雙鏈,產(chǎn)生雙鏈斷裂損傷,從而引發(fā)細(xì)胞內(nèi)的修復(fù)機(jī)制,即非同源末端連接途徑或同源重組定向修復(fù),在修復(fù)過程中可發(fā)生堿基的缺失或插入,最終達(dá)到基因編輯的目的[3-5]。近年來,CRISPR/Csa9基因編輯技術(shù)的問世,帶動(dòng)了生物、醫(yī)學(xué)以及藥學(xué)等學(xué)科的發(fā)展[6-7]。
II型糖原貯積病(Pompe病)又稱酸性麥芽糖酶缺陷病,是一種罕見的進(jìn)展性溶酶體貯積病,遺傳特征為常染色體隱性遺傳。依據(jù)發(fā)病年齡該病分為嬰兒型和晚發(fā)型,發(fā)病年齡與α-葡糖苷酶缺乏程度有關(guān),α-葡糖苷酶活性降低程度越嚴(yán)重,發(fā)病年齡越早,病情進(jìn)展越快[8-11]。主要癥狀表現(xiàn)為四肢肌力、肌張力下降,呈進(jìn)行性肌無力、運(yùn)動(dòng)發(fā)育遲緩、吞咽困難、心肌肥厚、肝腫大以及反復(fù)性肺炎等癥狀[12]。目前關(guān)于該病的分子機(jī)制認(rèn)識(shí)不夠,尚無根治辦法。臨床上常采用多學(xué)科協(xié)作治療,包括對(duì)癥治療、支持治療、飲食治療、物理治療等[13]。
II型糖原貯積病的遺傳學(xué)病因是由位于第17號(hào)染色體上的酸性α-葡糖苷酶基因(Alpha-1,4-glucosidase,GAA)突變所致。目前已發(fā)現(xiàn)的GAA基因的突變已超過400余種,突變類型包括無義突變、移碼突變、拼接位點(diǎn)突變等[13]。這些突變均會(huì)導(dǎo)致溶酶體內(nèi)α-葡糖苷酶活性缺乏,糖原降解障礙,沉積在骨骼肌、心肌和平滑肌細(xì)胞溶酶體內(nèi),造成細(xì)胞破壞和臟器損傷,并引起一系列臨床表現(xiàn)。不同突變類型引起的臨床癥狀亦不相同。有研究對(duì)GAA突變嚴(yán)重程度進(jìn)行了分級(jí),其中無義突變、移碼突變和拼接位點(diǎn)突變?yōu)榉浅?yán)重的致病突變[13]??傮w來說,不同突變類型引起的臨床癥狀、臨床表現(xiàn)亦不相同,具有遺傳和臨床異質(zhì)性。因此,有必要篩查明確的、典型的GAA強(qiáng)致病突變位點(diǎn),并將突變位點(diǎn)定位于小鼠基因組上,然后通過CRISPR/Cas9系統(tǒng)對(duì)該位點(diǎn)進(jìn)行打靶,方可建立GAA基因突變細(xì)胞模型或小鼠動(dòng)物模型,從而精準(zhǔn)的模擬II型糖原貯積病,為深入的理解GAA基因的致病機(jī)制以及探索可行的治療策略奠定基礎(chǔ)。
1.1材 料小鼠N2a細(xì)胞、sgRNA表達(dá)質(zhì)粒pGL3-U6-sgRNA(addgene #51133)、Cas9表達(dá)質(zhì)粒pST1374-NLS-flag-linker-Cas9(addgene #44758)由上??萍即髮W(xué)黃行許教授惠贈(zèng)。大腸埃希菌感受態(tài)細(xì)胞DH5α菌株和去內(nèi)毒素質(zhì)粒中提試劑盒購(gòu)自康維世紀(jì)公司;Premix TaqTM、TaKaRa Ex Taq?Hot Start Version、pMDTM19-T Vector Cloning Kit、DL2000 DNA Marker、10× Loading Buffer購(gòu)自寶日醫(yī)生物技術(shù)有限公司;BsaI-HF、T7 Endonuclease I (T7EN I)酶購(gòu)自NEB公司;Puromycin 、Blasticidin、Lipofectamine?3000 Transfection Reagent購(gòu)自Thermo Fisher公司;Trans2K Plus DNA Marker、TransDirect Animal Tissue PCR Kit購(gòu)自北京全式金生物技術(shù)有限公司;測(cè)序由上海百力格生物技術(shù)有限公司完成。高通量測(cè)序由廣州生工生物工程股份有限公司完成。
1.2方法
1.2.1 人類GAA基因致病突變位點(diǎn)的篩查II型糖原貯積病是由GAA基因突變引起的,首先利用OMIM數(shù)據(jù)庫篩查了人GAA基因的致病突變;利用ExAC在線數(shù)據(jù)庫檢索到GAA功能失活突變;再利用ClinVar數(shù)據(jù)庫檢索GAA致病突變情況。綜合分析3個(gè)數(shù)據(jù)的結(jié)果,確定人GAA典型的、明確的強(qiáng)致病變異位點(diǎn)。
1.2.2小鼠Gaa基因致病突變位點(diǎn)的定位由于人和小鼠的物種差異,同一功能基因的基因結(jié)構(gòu)可能不同,因此利用Clustal Omega在線軟件比對(duì)了人GAA和小鼠Gaa蛋白序列,在蛋白水平將人典型的、明確的強(qiáng)致病變異位點(diǎn)定位于小鼠Gaa蛋白上,找到小鼠Gaa蛋白的擬突變位點(diǎn)。然后從Ensembl數(shù)據(jù)庫中導(dǎo)出小鼠Gaa基因序列,利用Vector NTI軟件定位擬突變位點(diǎn)的DNA編碼序列,根據(jù)CRISPR/Cas9系統(tǒng)的原理及序列要求在其附近設(shè)計(jì)基因打靶位點(diǎn)。
1.2.3致病位點(diǎn)的sgRNA設(shè)計(jì)符合5'-N(21)GG序列特征的位點(diǎn)為CRISPR/Cas9系統(tǒng)的編輯靶點(diǎn)。利用Vector NTI軟件的“Find Motifs”功能搜索具有5'-N(21)GG序列特征的靶點(diǎn),然后找到擬突變位點(diǎn)編碼序列附近的靶點(diǎn),根據(jù)靶點(diǎn)序列設(shè)計(jì)sgRNA序列。
1.2.4sgRNA表達(dá)載體的構(gòu)建根據(jù)設(shè)計(jì)化學(xué)合成sgRNA的編碼序列及其互補(bǔ)序列,合成時(shí)分別加上與pGL3-U6-sgRNA骨架質(zhì)粒互補(bǔ)的粘性末端。將合成的DNA溶解,并退火,使其互補(bǔ)配對(duì),形成帶有黏性末端的雙鏈DNA。
提取pGL3-U6-sgRNA表達(dá)質(zhì)粒,利用BsaI酶切,膠回收酶切產(chǎn)物pGL3-U6-sgRNA-BsaI。退火產(chǎn)物和膠回收的酶切產(chǎn)物pGL3-U6-sgRNA-Bsa I連接,然后轉(zhuǎn)化大腸桿菌感受態(tài)細(xì)胞,并提取質(zhì)粒pGL3-U6-GAA-sgRNA1、pGL3-U6-GAA-sgRNA2、pGL3-U6-GAA-sgRNA3,用于細(xì)胞轉(zhuǎn)染。
1.2.5小鼠N2a細(xì)胞的培養(yǎng)、轉(zhuǎn)染與打靶效力鑒定用含10%胎牛血清DMEM完全培養(yǎng)基于37 ℃,5%CO2濃度和飽和濕度條件下于六孔板中培養(yǎng)N2a細(xì)胞。使用Lipofectamine?3000轉(zhuǎn)染試劑盒將已構(gòu)建好的GAA-M-sgRNA1/2/3分別和Cas9共轉(zhuǎn)染N2a細(xì)胞,每個(gè)孔共轉(zhuǎn)染sgRNA質(zhì)粒2.5 μg和Cas9質(zhì)粒2.5 μg。轉(zhuǎn)染24 h后加藥(14 μg/mL Puromycin + 110 μg/mL Blasticidin S)篩選,48~72 h后收集細(xì)胞。
收集的細(xì)胞采用TransDirect Animal Tissue PCR Kit進(jìn)行處理,然后以細(xì)胞裂解液為模板進(jìn)行打靶位點(diǎn)PCR擴(kuò)增,PCR產(chǎn)物進(jìn)行Sanger測(cè)序和T7ENI酶切實(shí)驗(yàn)。根據(jù)Sanger測(cè)序和T7ENI酶切結(jié)果初步判定打靶是否成功。打靶成功的樣品通過PCR產(chǎn)物高通量測(cè)序深入分析基因型和打靶效率。
2.1人類GAA基因致病位點(diǎn)篩查首先利用OMIM數(shù)據(jù)庫篩查了人GAA基因的致病突變,共篩查到16個(gè)突變位點(diǎn),見表1。由于OMIM收錄的突變位點(diǎn)有限,本研究也利用ExAC數(shù)據(jù)庫篩查了人GAA基因的功能失活突變,共檢索到GAA突變46種,列出20種突變,見表2。然后利用ClinVar數(shù)據(jù)庫檢索GAA堿基缺失突變情況,共檢索83種突變,列出10種突變,見表3。綜合分析3個(gè)數(shù)據(jù)的結(jié)果,最終確定了人GAA p.Tyr609為擬突變位點(diǎn)。
表 1 OMIM數(shù)據(jù)庫中人GAA基因致病突變情況
表 2 ExAC數(shù)據(jù)庫中人GAA基因部分功能失活突變情況
表 3 ClinVar數(shù)據(jù)庫中人GAA基因缺失突變情況
2.2小鼠Gaa基因致病位點(diǎn)的定位及打靶位點(diǎn)的設(shè)計(jì)利用Clustal Omega在線軟件比對(duì)了人GAA和小鼠Gaa蛋白序列,發(fā)現(xiàn)人GAA p.Tyr609位點(diǎn)與小鼠Gaa p.Tyr609位點(diǎn)相對(duì)應(yīng)。從Ensembl數(shù)據(jù)庫中導(dǎo)出小鼠Gaa基因序列,利用Vector NTI軟件定位p.Tyr609位點(diǎn)的DNA編碼序列,然后在其附近設(shè)計(jì)了基因打靶位點(diǎn),見圖1。
2.3sgRNA表達(dá)載體構(gòu)建SgRNA編碼DNA的退火產(chǎn)物和pGL3-U6-sgRNA-Bsa I連接轉(zhuǎn)化后挑克隆進(jìn)行菌液PCR實(shí)驗(yàn),電泳結(jié)果顯示目的條帶大小與預(yù)期相符。質(zhì)粒提取并進(jìn)行瓊脂糖凝膠電泳檢測(cè),發(fā)現(xiàn)質(zhì)粒大小與預(yù)期相符,質(zhì)粒質(zhì)量較好。進(jìn)一步的Sanger測(cè)序驗(yàn)證表明目標(biāo)序列正確連接在質(zhì)粒載體中可用于細(xì)胞轉(zhuǎn)染,見圖2。
2.4轉(zhuǎn)染、藥篩及打靶效力分析根據(jù)sgRNA表達(dá)質(zhì)粒和Cas9表達(dá)質(zhì)粒上所攜帶的抗性基因,本研究選擇Puromycin和Blasticidin S藥物篩選陽性共轉(zhuǎn)染細(xì)胞,藥篩48 h后,待對(duì)照組全部死亡,成功收集了各組陽性細(xì)胞,并通過PCR擴(kuò)增反應(yīng)得到了打靶區(qū)域DNA片段。PCR產(chǎn)物大小為601 bp,經(jīng)變性、退火和T7EN I酶切發(fā)現(xiàn)300 bp大小的片段,結(jié)果顯示在靶點(diǎn)位置可能發(fā)生的堿基突變。進(jìn)一步的PCR產(chǎn)物Sanger測(cè)序顯示在靶點(diǎn)位置出現(xiàn)了套峰,說明有堿基變異的情況,初步判定各打靶位點(diǎn)均發(fā)生了基因編輯,見圖3。
圖 1 小鼠Gaa基因打靶設(shè)計(jì)圖
1、2:分別為pGL3-U6-sgRNA1;3、4:分別為pGL3-U6-sgRNA2;5、6:分別為pGL3-U6-sgRNA3;M:DNA Marker
1:對(duì)照組;2-4:分別為pGL3-U6-sgRNA1、pGL3-U6-sgRNA2和pGL3-U6-sgRNA3打靶位點(diǎn)DNA;M:DNA Marker
2.5基因分型及打靶效率分析pGL3-U6-sgRNA1位點(diǎn)共捕獲65 295條有效序列,其中22 527條序列在靶點(diǎn)位置發(fā)生了堿基變異,打靶效率為34.5%;pGL3-U6-sgRNA2位點(diǎn)共捕獲22 298條有效序列,其中15 883條序列在靶點(diǎn)位置發(fā)生堿基變異,打靶效率為71.23%;pGL3-U6-sgRNA3位點(diǎn)共捕獲29 176條有效序列,其中20 645條序列在靶點(diǎn)位置發(fā)生堿基變異,打靶效率為70.91%,見圖4。
紅色字體為打靶位點(diǎn)序列;斜體為PAM結(jié)構(gòu);WT代表野生型序列;“-”代表堿基缺失;“N/N”代表特定基因型在所有序列中的比例
CRISPR/Cas9系統(tǒng)被稱為第3代基因編輯系統(tǒng),該系統(tǒng)的主要特點(diǎn)和優(yōu)勢(shì)是通過堿基互補(bǔ)配對(duì)的方式將核酸內(nèi)切酶引入到目標(biāo)靶點(diǎn),而前兩代的鋅指核酸酶系統(tǒng)以及TALENs系統(tǒng)均是通過蛋白與DNA結(jié)合的方式將核酸內(nèi)切酶引入到目標(biāo)靶點(diǎn)[14-16]。因此,CRISPR/Cas9系統(tǒng)的基因編輯效率非常高,為基因工程動(dòng)物制備,基因編輯細(xì)胞模型奠定了技術(shù)基礎(chǔ)[17-19]。高效靶向目標(biāo)基因的sgRNA是CRISPR-Cas9系統(tǒng)能否特異性編輯目標(biāo)基因的關(guān)鍵。通常,sgRNA選擇目標(biāo)基因前一、二號(hào)外顯子作為設(shè)計(jì)區(qū)域[20-21];涉及多個(gè)轉(zhuǎn)錄本的基因時(shí)選擇保守的外顯子區(qū)域設(shè)計(jì)靶點(diǎn);同時(shí)利用在線軟件評(píng)估其脫靶效應(yīng),選擇低脫靶效應(yīng)的位點(diǎn)作為靶點(diǎn)。其目的是在靶點(diǎn)位置形成移碼突變,導(dǎo)致基因功能失活,進(jìn)而研究基因功能[22]。本研究最主要的目的是通過突變小鼠Gaa基因模擬人類GAA基因的致病變異,為后續(xù)建立Gaa基因工程小鼠奠定基礎(chǔ),可見本文的研究目的與一般的基因敲除研究基因功能略有不同。因此我們首先通過3個(gè)數(shù)據(jù)庫的檢索篩查了人GAA基因的變異及致病情況,綜合比對(duì)后確定了明確的、典型的致病位點(diǎn)(人GAA p.Tyr609)為擬突變位點(diǎn)。進(jìn)一步通過蛋白序列比對(duì),將擬突變位點(diǎn)定位于小鼠Gaa蛋白中,再根據(jù)編碼DNA序列和CRISPR/Cas9系統(tǒng)對(duì)序列PAM結(jié)構(gòu)的要求,創(chuàng)新性設(shè)計(jì)了3個(gè)可模擬人II型糖原貯積病突變位點(diǎn)的靶向小鼠Gaa基因sgRNA序列。其中,兩個(gè)sgRNA的打靶效率為70%以上,亦表明了CRISPR/Cas9系統(tǒng)的高效性。另外一個(gè)sgRNA的打靶效率雖較本研究設(shè)計(jì)的其他兩個(gè)sgRNA低一些,但仍接近或高于文獻(xiàn)中基于CRISPR/Cas9系統(tǒng)的打靶效率[23-24],其相對(duì)較低的打靶效率可能是由于序列本身的特異性不高引起的。
基因編輯研究中通常采用經(jīng)TA克隆測(cè)序鑒定和分析突變后的基因型和打靶效率,但由于測(cè)序數(shù)量受限,僅能在有限的樣本數(shù)中分析。本文采用高通量測(cè)序的方法在幾萬個(gè)序列中進(jìn)行分析,體現(xiàn)了真實(shí)可靠的基因型和打靶效率。打靶效率的提高與轉(zhuǎn)染效率密切相關(guān),為了實(shí)現(xiàn)高效轉(zhuǎn)染本研究使用了Lipofectamine?3000 Transfection Reagent試劑盒,明顯好于Lipofectamine?2000轉(zhuǎn)染試劑。此外,也嚴(yán)格控制細(xì)胞的生長(zhǎng)狀態(tài)、細(xì)胞接種密度、轉(zhuǎn)染時(shí)間以及藥物篩選時(shí)間等實(shí)驗(yàn)要素。值得關(guān)注的是藥物篩選濃度直接決定陽性細(xì)胞獲得率,本文采用的藥物殺傷濃度較大,以期獲得抗性基因表達(dá)量高的陽性轉(zhuǎn)染細(xì)胞。高濃度的藥物篩選會(huì)導(dǎo)致大量細(xì)胞死亡,最終收集到的陽性細(xì)胞數(shù)量較少,不利于后續(xù)的TA克隆測(cè)序分析。為了解決此問題,實(shí)驗(yàn)中未使用普通基因組DNA提取純化試劑盒,而是使用全式金TransDirect?Mouse Genotyping Kit,其獨(dú)特裂解液裂解細(xì)胞后無需純化,裂解物可直接作為模板進(jìn)行后續(xù)擴(kuò)增,提高了實(shí)驗(yàn)效率??傊?jīng)過各方面實(shí)驗(yàn)細(xì)節(jié)的優(yōu)化我們?cè)O(shè)計(jì)的CRISPR/Cas9系統(tǒng)得到了滿意的結(jié)果。本研究通過篩查II型糖原貯積病致病基因GAA的變異情況,明確其典型的強(qiáng)致病突變位點(diǎn),并將其定位于小鼠基因組上。然后基于CRISPR/Cas9系統(tǒng)設(shè)計(jì)了3個(gè)靶點(diǎn),并在小鼠N2a細(xì)胞上實(shí)現(xiàn)了高效的基因打靶,成功構(gòu)建了模擬人致病突變的、靶向小鼠Gaa基因的基因編輯系統(tǒng),為后續(xù)建立基因工程動(dòng)物模型奠定基礎(chǔ)。