吳云華,楊盼春,李 勇
(中南民族大學 生命科學學院,生物技術國家民委重點實驗室,武漢 430074)
轉(zhuǎn)錄激活子樣效應因子(TALEs)最早發(fā)現(xiàn)于植物致病菌黃單胞桿菌中,它是一種能特異性識別并激活植物基因啟動子的蛋白質(zhì)[1,2]. 除N-端和C-端結(jié)構(gòu)域外,TALE蛋白由一連串的重復單體結(jié)構(gòu)域組成,并通過單體結(jié)構(gòu)域的可變區(qū)(RVDs)實現(xiàn)對雙鏈DNA堿基對的識別[3]. 由于通過改變單體結(jié)構(gòu)域的排布順序能實現(xiàn)TALE蛋白對任何一種DNA序列的特異性識別,因此,在基因編輯和人工基因調(diào)控等研究中[4-6],通過在能夠識別特定DNA序列的TALE蛋白的C-端融合核酸酶或轉(zhuǎn)錄調(diào)控因子,可實現(xiàn)活細胞內(nèi)目的基因的編輯或轉(zhuǎn)錄調(diào)控[4-6],并有望將該技術應用于腫瘤等重大疾病的治療中[7, 8].
最近研究表明:雖然TALE蛋白對DNA的識別具有較高的特異性,但在實際的基因編輯過程中仍然存在著一定的“脫靶”概率[9]. 所謂“脫靶”主要是指在TALE蛋白在基因組的非特異位點上結(jié)合并發(fā)揮功能,對細胞產(chǎn)生不可預期的影響[10],這為基于TALE蛋白的基因編輯技術的安全性帶來了嚴重的挑戰(zhàn),并極大地限制了該技術在生物醫(yī)學中的應用.為克服“脫靶”問題,需要對TALE蛋白與DNA相互作用進行定性和定量的分析. 因此,對TALE蛋白進行特異性標記,將其與DNA的結(jié)合轉(zhuǎn)變?yōu)楦哽`敏的可測量信號成為研究學者的共識[11].
本文將一種最新報道的新型螢光素酶報告基因融合在了TALE蛋白的C-端,實現(xiàn)了對TALE蛋白的特異性標記. 經(jīng)表達、純化得到的融合蛋白不僅可對靶標DNA進行特異性識別,同時也能產(chǎn)生螢光素酶的特征發(fā)光信號. 由于螢光素酶具有分子量小、穩(wěn)定性和量子產(chǎn)率高等優(yōu)點[12],基于其開發(fā)的TALE蛋白標記和檢測技術有望為分析和闡明TALE蛋白與DNA相互作用機制提供有力的工具.
大腸桿菌菌株DH5α、BL21(DE3)和原核表達載體pET-26b(+)為本實驗保藏.內(nèi)切酶NdeI、SalI、BsmBI、BsaI、聚合酶鏈式反應(PCR)所用Phusion超保真酶、T4和T7連接酶、蛋白質(zhì)分子量Marker(Thermo),30%丙烯酰胺/甲叉雙丙酰胺(摩爾比為29∶1)儲液(上海生工),DNA分子量Marker、鎳親和純化柱和微量BCA蛋白質(zhì)定量試劑盒(康為世紀生物),螢光素酶底物(furimazine,Promega), 螢光素酶編碼序列克隆自本實驗室保存質(zhì)粒,TALE蛋白質(zhì)單體編碼序列及其N端和C端編碼序列由金唯智公司合成,引物合成及測序由上海生工完成.
瓊脂糖及聚丙烯酰胺凝膠電泳儀(DYY-6D,北京六一),光譜儀(F-2500,HITACHI).
通過重疊PCR將TALE蛋白N端和C端編碼序列(NI,NG,NN,HD 4種)分別與螢光素酶編碼序列(簡稱Luc)相連后,用NdeI和SalI進行酶切,并連接到載體pET-26b(+)中,分別構(gòu)建出pNI-Luc,pNG-Luc,pNN-Luc和pHD-Luc 4種重組載體.
完整的TALE蛋白編碼序列通過Golden Gate技術進行連接和克隆[13]. 先根據(jù)待識別的靶標DNA序列,選擇相應的TALE蛋白質(zhì)單體編碼序列,并通過Golden Gate反應將單體編碼序列連接成為六聚體. 所得六聚體產(chǎn)物進一步通過PCR擴增后,用Golden Gate反應連接成為十八聚體,并克隆到相應的pNG-Luc載體中,通過酶切和測序驗證最終載體的正確性,并命名為pTALE-TDRF-Luc.
通過已報道的化學轉(zhuǎn)化法[14, 15], 將構(gòu)建好的pTALE-TDRF-Luc重組載體轉(zhuǎn)化至大腸桿菌菌株BL21(DE3)中. 挑取轉(zhuǎn)化所得的單菌落接種到5 mL含卡那霉素的LB液體培養(yǎng)基中(1%蛋白胨,0.5%酵母提取物,0.5% NaCl,30 μg/mL卡那霉素,pH 7.0),于28 ℃,150 r/min培養(yǎng)12 h. 按1∶100的體積比接種到50 mL含卡那霉素的LB液培養(yǎng)基中,于28 ℃,150 r/min培養(yǎng)2 h后,加入終濃度為0.5 mM的異丙基硫代半乳糖苷(IPTG)進行誘導,于28 ℃,150 r/min繼續(xù)培養(yǎng)8 h.
離心收集經(jīng)過誘導的菌體,并用6 mL細菌蛋白抽提液(20 mM Tris-Cl,500 mM NaCl,2 mM TCEP,10 mM 咪唑,pH 8.0)重懸,同時加入200 μL溶菌酶(10 mg/mL)和20 μL蛋白酶抑制劑. 上述菌懸液通過超聲波破碎后,用30000 g離心15 min,收集上清后,用0.22 μm過濾器過濾到鎳親和純化柱中進行蛋白質(zhì)的純化. 先用25倍柱體積的洗滌緩沖液(20 mM Tris-Cl,500 mM NaCl,40 mM 咪唑,pH 8.0)沖洗柱子,再用2倍柱體積的洗脫緩沖液(20 mM Tris-Cl,500 mM NaCl,500 mM 咪唑,pH 8.0)洗脫目的蛋白質(zhì). 所得蛋白質(zhì)樣品通過透析脫鹽,并分裝保存于-80 ℃冰箱中.
取分裝好的蛋白質(zhì)樣品,用BCA法進行濃度測定,測定方法參見微量BCA蛋白定量試劑盒說明書.
為了驗證蛋白質(zhì)的分子量和完整性,對純化的蛋白質(zhì)進行了SDS-PAGE分析[16]. 向40 μL蛋白質(zhì)樣品中加入10 μL 5×上樣緩沖液,混勻后于100 ℃加熱15 min進行變性處理. 取10 μL經(jīng)過處理的樣品上樣至SDS-PAGE凝膠中(5%濃縮膠,8%分離膠)進行電泳分離. 電泳條件為:濃縮膠電壓35 V,分離膠電壓80 V. 電泳結(jié)束后的凝膠經(jīng)過染色和脫色,于凝膠成像系統(tǒng)上進行拍照分析.
經(jīng)過純化的TDRF-Luc蛋白與其可特異性識別的雙鏈DNA在1×TALE 緩沖液(20 mM Tris-Cl,60 mM KCl,5 mM MgCl2,2 mM TCEP,5%甘油,pH 8.8)中,于室溫下反應1.5 h,反應體系中雙鏈DNA與TDRF-Luc蛋白摩爾比為1∶10. 反應結(jié)束后,反應產(chǎn)物通過4%的瓊脂糖凝膠進行電泳檢測,并拍照分析.
用1× TALE 緩沖液將TDRF-Luc蛋白質(zhì)稀釋成終濃度為50 nM的溶液,并按照體積比為1∶50的比例加入底物后,于光譜儀上進行檢測,結(jié)果通過Origin軟件進行分析和處理.
由于TALE蛋白的C端序列決定了其所識別的靶標DNA序列中的最后1個堿基,為滿足對所有DNA序列的識別需要,分別合成了4種TALE蛋白的C端序列. 通過重疊PCR技術,進一步分別將上述序列與TALE蛋白的N端編碼序列和螢光素酶編碼序列進行了融合(見圖1),并克隆到pET-26b(+)載體中. 最終獲得了4種重組載體,并分別命名為:pNI-Luc, pNG-Luc, pNN-Luc, pHD-Luc. 根據(jù)已報道的識別關系[3,13],pNI-Luc, pNG-Luc, pNN-Luc, pHD-Luc編碼產(chǎn)生的蛋白識別的最后1個堿基分別為A, T, G, C.
圖1 pNI-Luc, pNG-Luc, pNN-Luc, pHD-Luc重組載體示意圖Fig.1 Schematic diagram of pNI-Luc, pNG-Luc, pNN-Luc, and pHD-Luc recombined carriers
上述構(gòu)建得到的載體通過限制性內(nèi)切酶NdeI和SalI進行了雙酶切鑒定(見圖2). 結(jié)果表明:4種重組載體通過酶切均產(chǎn)生了大小約為1200 bp的目的片段,其大小與預期相符. DNA測序的結(jié)果進一步驗證了上述序列的正確性.
M) DL5000 Marker;1) pET-26 b(+); 2~5) pNI-Luc, pNG-Luc, pNN-Luc, pHD-Luc的Nde I和Sal I雙酶切結(jié)果圖2 pNI-Luc, pNG-Luc, pNN-Luc, pHD-Luc重組載體的鑒定Fig.2 Identification of recombined carriers pNI-Luc, pNG-Luc, pNN-Luc and pHD-Luc
基于上述4種重組載體,進一步構(gòu)建了能編碼識別特定DNA序列的完整TALE蛋白表達載體. 后續(xù)實驗中,待識別的靶標DNA片段為:5′- TTTATCCGCCTCCATCCAGT-3′,最后1個識別堿基為胸腺嘧啶(T). 由于對靶標DNA的最后1個堿基的識別是由TALE蛋白的C端序列決定,根據(jù)TALE蛋白與識別堿基的對應關系(NI識別A,NG識別T,NN識別G,HD識別C),選擇pNG-Luc載體作為后續(xù)實驗的出發(fā)載體.
對TALE蛋白的單體編碼序列進行了選擇和排序(見圖3),通過Golden Gate技術將經(jīng)過排序的單體編碼序列克隆到pNG-Luc載體,所得載體通過NdeI和SalI進行雙酶切鑒定(見圖4). 構(gòu)建所得載體可釋放大小約為3000 bp的目的片段,與預期相符;進一步測序驗證表明融合表達載體pTALE-TDRF-Luc構(gòu)建成功.
圖3 TDRF-Luc蛋白質(zhì)單體排布及其識別DNA序列Fig.3 Monomer arrangements of TDRF-Luc and the target DNA sequences
M) DL5000 Marker;1, 2) pNG-Luc和pTALE-TDRF-Luc的Nde I和Sal I雙酶切結(jié)果圖4 pTALE-TDRF-Luc載體的鑒定Fig.4 Identificatin of pTALE-TDRF-Luc carrier
為獲得TDRF-Luc蛋白進行后續(xù)研究,將構(gòu)建成功的pTALE-TDRF-Luc重組載體轉(zhuǎn)化至大腸桿菌菌株BL21(DE3)中,并對目的蛋白進行了誘導表達和分離純化,最終通過SDS-PAGE,對TDRF-Luc蛋白的分子量和完整性進行了驗證,結(jié)果見圖5. 由圖5可見:純化所得蛋白質(zhì)在凝膠中條帶清晰且基本無雜帶,其分子量約為100 kDa,與TDRF-Luc蛋白的理論分子量一致(106.49 kDa),表明TDRF-Luc重組蛋白成功獲得了表達和純化,且產(chǎn)物具有較高的純度和完整性.
M)蛋白質(zhì)Marker;1) 純化所得的TDRF-Luc蛋白樣品圖5 TDRF-Luc蛋白的SDS-PAGE分析Fig.5 Analysis of TDRF-Luc by SDS-PAGE
TDRF-Luc蛋白融合了能夠識別靶標DNA序列的TALE結(jié)構(gòu)域和具有生物發(fā)光效應的螢光素酶結(jié)構(gòu)域. 為了進一步分析TDRF-Luc蛋白的功能,分別對該蛋白結(jié)合靶標DNA的能力及其發(fā)光特性進行了驗證.先通過凝膠遷移實驗分析了TDRF-Luc蛋白對靶標DNA的結(jié)合能力. 由于靶標DNA與TDRF-Luc蛋白相互作用后,分子量顯著增大,負電荷減小,因此,在凝膠電泳時相對單獨的DNA分子形成了一條滯后的條帶(見圖6),說明TDRF-Luc蛋白具有對特定DNA識別和結(jié)合的能力.
M) 100 bp DNA Marker;1) 靶標DNA;2) 結(jié)合了TDRF-Luc蛋白的靶標DNA圖6 TDRF-Luc蛋白與靶標DNA相互作用的凝膠遷移分析Fig.6 Gel shift analysis of interaction between TDRF-Luc and target DNA
接著分析了TDRF-Luc蛋白的發(fā)光特性. 向TDRF-Luc蛋白樣品中添加底物furimazine后,樣品可產(chǎn)生明顯的特征光譜(見圖7). 該光譜的最大發(fā)射波長為450 nm,半峰寬為68 nm,與已報道的螢光素酶光譜性質(zhì)一致[12];說明TDRF-Luc蛋白不僅能與靶標DNA進行特異性識別,還能產(chǎn)生可檢測的生物發(fā)光光譜.
本文將TALE蛋白的N-端、C-端和螢光素酶編碼序列進行了融合,并分別構(gòu)建了4種相應的重組載體:pNI-Luc, pNG-Luc, pNN-Luc, pHD-Luc;并通過Golden Gate技術實現(xiàn)了TALE蛋白重復單體結(jié)構(gòu)域編碼序列的組裝,構(gòu)建了重組載體pTALE-TDRF-Luc,對該載體編碼的TDRF-Luc融合蛋白進行了表達與純化. 純化所得的TDRF-Luc融合蛋白不僅可對靶標DNA序列進行特異性識別,還能產(chǎn)生螢光素酶的特征性光譜(最大發(fā)射波長為450 nm,半峰寬為68 nm). 以上結(jié)果表明:通過螢光素酶成功地實現(xiàn)了對TALE蛋白的特異性標記,所得重組蛋白既有靶標DNA的識別功能,也可產(chǎn)生高靈敏的生物發(fā)光信號.上述雙功能的實現(xiàn)為后續(xù)定性、定量分析TALE蛋白與DNA的相互作用奠定了基礎.