周 項, 朱海霞, 黃 強
復(fù)旦大學(xué) 生命科學(xué)學(xué)院, 上海 200438
單堿基編輯是一種由Cas蛋白主導(dǎo)的基因編輯技術(shù)[1],具有不依賴于DNA鏈的DSB(Double strand break)的特點,可以對靶位點上的單堿基進行替換[2-3]。近年來,該技術(shù)已廣泛應(yīng)用于動植物模型的建立、疾病發(fā)病機制以及微生物的研究等領(lǐng)域[4-7]。在應(yīng)用過程中,單堿基編輯技術(shù)展現(xiàn)出了高效、高靶向性等特點,因此該技術(shù)備受研究人員的關(guān)注,有望在基因治療中大放異彩。根據(jù)堿基的轉(zhuǎn)換類型,單堿基編輯技術(shù)可以分為兩大類,分別是胞嘧啶堿基編輯器(Cytosine base editors, CBE)和腺嘌呤堿基編輯器(Adenine base editors, ABE)。在一些動植物的基因編輯實驗中,ABE比CBE表現(xiàn)出了更好的特異性、有效性和安全性[5, 8],因此,ABE具有廣闊的應(yīng)用前景。通過多代定向進化優(yōu)化,人們獲得了迄今最為優(yōu)秀的一個腺嘌呤堿基編輯器:ABE8e[2]。
目前,ABE8e的結(jié)構(gòu)已被解析,結(jié)構(gòu)顯示其天然形態(tài)為二聚體結(jié)構(gòu)[9]。但是,我們在ABE8e的體外純化制備過程中卻發(fā)現(xiàn)其多聚體比例較高。在其它相關(guān)文獻中,ABE8e的制備緩沖體系中含有一定量的還原劑[10]。當(dāng)?shù)鞍踪|(zhì)混合液中含有大量多聚體時,會導(dǎo)致蛋白質(zhì)性質(zhì)不穩(wěn)定,進而使結(jié)構(gòu)發(fā)生改變[11]。因此,在蛋白質(zhì)的體外制備過程中需要盡可能地控制多聚體的比例,以保持樣品的穩(wěn)定性[12]。
在本文中,為了降低ABE8e多聚體的比例,我們首先分析了ABE8e的三維結(jié)構(gòu),了解其多聚體形成的分子根源。然后,在結(jié)構(gòu)信息的指導(dǎo)下推測分子間的聚集源于ABE8e二聚化界面中疏水區(qū)域的曝露。為驗證理論推測的正確性,我們構(gòu)建了相應(yīng)的ABE8e突變體(ABE8e-T),對其進行表達和純化。ABE8e-T的純化結(jié)果證實了多聚體成因的理論推測。在此基礎(chǔ)上,我們有針對性地優(yōu)化了緩沖體系,從而降低了ABE8e多聚體的比例,有效地提高了純化制備的效率。
1.1.1質(zhì)粒與菌株
本研究使用的ABE8e及ABE8e-T質(zhì)粒由課題組保存。DH5α、Rosetta (DE3)大腸桿菌感受態(tài)細胞購自天根生化科技(北京)有限公司。
1.1.2主要試劑
表達:氨芐青霉素、IPTG、氯霉素及LB Broth購自生工生物工程(上海)股份有限公司。純化:咪唑、Tris、KCl、精氨酸及鹽酸購自生工生物工程(上海)股份有限公司。醋酸、SDS、考馬斯亮藍、甲醇購自滬試實驗室器材(上海)股份有限公司。電泳膠配制緩沖液購自天根生化科技(北京)有限公司。突變體構(gòu)建:質(zhì)粒小提試劑盒、點突變試劑盒及感受態(tài)細胞購自天根生化科技(北京)有限公司。
1.1.3主要設(shè)備
表達:恒溫搖床購自上海天呈實驗儀器制造有限公司。純化:AKTA Avant 25購自格來賽生命科技(上海)有限公司。電泳儀購自北京六一生物科技有限公司。凝膠成像系統(tǒng)購自上海勤翔科學(xué)儀器有限公司。
1.1.4主要耗材
純化:Ni-NTA Agarose購自凱杰生物工程(深圳)有限公司。凝膠層析柱為Superdex 200 Increase 10/300及HiLoad Superdex 200 16/600,均購自格來賽生命科技(上海)有限公司。
1.2.1表達步驟
將復(fù)蘇好的菌液添加至含有氨芐及氯霉素的LB培養(yǎng)基中,進行擴大培養(yǎng)。擴大培養(yǎng)的溫度設(shè)為37 ℃,轉(zhuǎn)速設(shè)為200 r/min,培養(yǎng)4 h~5 h后檢測OD值。當(dāng)OD值為0.8~1.2 時,進行表達培養(yǎng)。表達培養(yǎng)的溫度設(shè)置為20 ℃,轉(zhuǎn)速設(shè)置為200 r/min,培養(yǎng)12 h~14 h后停止培養(yǎng)。將菌液進行離心,收集菌體,保存至-80 ℃,以備后用。
1.2.2純化步驟
Ni柱親和層析的實驗步驟依次為:平衡1、平衡2、上樣、淋洗及洗脫。其中,平衡1及洗脫步驟的緩沖體系為:20 mmol/L Tris,500 mmol/L KCl,300 mmol/L咪唑pH 8.0;平衡2與淋洗步驟的緩沖體系為:20 mmol/L Tris,500 mmol/L KCl,10~20 mmol/L咪唑pH 8.0。平衡1沖洗體積大于5個柱體積,平衡2的沖洗體積大于5個柱體積;淋洗體積大于5個柱體積;洗脫體積大于3個柱體積,在洗脫的過程中可以分管收集洗脫液,根據(jù)SDS-PAGE電泳結(jié)果分析各泳道蛋白的分子量、濃度以及純度,并進行下一步驟。
凝膠層析的實驗步驟依次為:平衡、上樣、再平衡。其中,優(yōu)化前的緩沖體系為:20 mmol/L Tris,500 mm/L KCl pH 8.0,優(yōu)化后的緩沖體系為:20 mmol/L Tris,0.5 mol/L精氨酸鹽酸,0.5 mol/L KCl pH 8.0。此外,還設(shè)置了對照緩沖體系:20 mmol/L Tris,0.5 mol/L 精氨酸鹽酸 pH 8.0。流速設(shè)置為0.5 mL/min~1.0 mL/min,平衡與再平衡的體積為1個柱體積。
1.2.3突變體突變流程
采用點突變的方式進行質(zhì)粒構(gòu)建。實驗流程為首先提取ABE8e的質(zhì)粒,其次對進行點突變。突變完成后,轉(zhuǎn)化入細胞內(nèi)并挑選單克隆,最后對其進行測序確認序列的正確性。
1.2.4PyMOL及Rosetta軟件的應(yīng)用
運用PyMOL軟件觀察ABE8e的三維結(jié)構(gòu),觀察的主要內(nèi)容是:疏水性氨基酸在三維結(jié)構(gòu)中所處的位置,分子之間的靜電勢等信息。從觀察結(jié)果中更深入地分析分子之間的相互作用,從而了解多聚化的原因及確認可能的氨基酸突變位點。
用Rosetta軟件中的fixbb模塊對需要突變的氨基酸位點進行隨機氨基酸突變,經(jīng)排列組合后,得到多種突變體。根據(jù)fixbb輸出的5 000個突變體結(jié)果,通過Python編程剔除序列完全相同的重復(fù)突變體,最后根據(jù)Rosetta能量由低到高排序,從而選出能量最低的突變設(shè)計結(jié)構(gòu)。
核酸酶大多為堿性蛋白質(zhì),在中性pH條件下,表面氨基酸帶有大量正電荷,與帶有負電荷的靶標(biāo)DNA相互吸引并結(jié)合,捕獲靶標(biāo)DNA。但是,在體外制備核酸酶的過程中,一般不直接添加靶標(biāo)DNA。因此,在緩沖體系中缺乏負電荷的情況下,核酸酶的結(jié)構(gòu)有可能會不穩(wěn)定。所以,在核酸酶制備緩沖體系中,通常使用高鹽緩沖體系提供一定的負離子環(huán)境。以SpCas9為例,在高鹽緩沖體系中,該蛋白質(zhì)以單體為主;而在相同的緩沖體系中,ABE8e則是含有34.2%的多聚體。
為了抑制多聚體的形成并降低其比例,首先分析了ABE8e的結(jié)構(gòu),了解多聚體的成因。蛋白質(zhì)分子結(jié)構(gòu)的形成與分子間的相互作用取決于靜電作用力、疏水作用力、氫鍵與范德華力的共同影響,其中靜電作用力和疏水作用力起到了非常關(guān)鍵性的作用。多聚體的產(chǎn)生往往因為蛋白質(zhì)自身之間發(fā)生了非正常的結(jié)合,通常與靜電作用力和疏水作用力相關(guān)[13-15]。因此,我們詳細分析了ABE8e的三維結(jié)構(gòu)、TadA-8e的氨基酸序列、疏水性氨基酸分布、電荷分布等性質(zhì),以了解多聚體的成因。具體如下:
(1) TadA-8e氨基酸序列分析。ABE8e主要由兩部分組成,分別是nCas9和TadA-8e。其中nCas9僅在野生型SpCas9上突變了一個氨基酸(D10A)。我們和其他人的研究表明,野生型SpCas9的純化結(jié)果顯示其僅含有少量的多聚體(結(jié)果未顯示)。因此,首先考慮分析TadA-8e的氨基酸序列。
TadA-8e是從TadA野生型(wtTadA)定向進化而來。從圖1可知,進化后所得的TadA-8e一共突變了19個氨基酸,其中三個疏水性氨基酸突變?yōu)橛H水性氨基酸(W23R、A109S、F149Y),5個為親水性氨基酸突變?yōu)槭杷园被?H36L、P48A、R51L、E155 V、T166I)。相較于野生型TadA,TadA-8e新增了兩個疏水性氨基酸。所以,由表1可知,TadA-8e共有166個氨基酸,其中70個氨基酸為疏水性氨基酸,疏水性氨基酸占比42%。
表1 TadA-8e疏水性氨基酸分布概況表
(a) wtTadA 和 TadA-8e 序列對比圖
當(dāng)疏水性氨基酸含量較高時,分子形態(tài)的改變可能會造成更多的疏水區(qū)域曝露,從而造成分子間聚集,產(chǎn)生大量的多聚體。考慮到ABE8e疏水性氨基酸占比較高,推斷其存在易于聚集的風(fēng)險。但是,當(dāng)疏水性氨基酸位于分子內(nèi)部時,將有助于分子結(jié)構(gòu)的穩(wěn)固,并不會引起分子間聚集。因此,需要進一步觀察TadA-8e的疏水性氨基酸在結(jié)構(gòu)中的分布。
(2) TadA-8e疏水性氨基酸分布分析。TadA-8e序列如下:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHA
EIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNSKRGAAGS
LMNVLNYPGMNHRVEITEGILADECAALLCDFYRMPRQVFNAQKKAQSSI
圖2(a)展示了TadA-8e的疏水性氨基酸分布,從圖中可以觀察到,其疏水性氨基酸主要分布于分子內(nèi)部、柔性部位及分子表面,其中柔性部位也大多位于分子表面。疏水性氨基酸密集地位于蛋白質(zhì)分子表面時,易造成分子間的聚集。圖2(c)展示了TadA-8e疏水性氨基酸分布較密集的區(qū)域。由圖可知,柔性部位的疏水性氨基酸雖分布在分子表面,但分布較松散。分子表面的疏水性氨基酸主要密集地分布在兩個α螺旋的外表面,占比約17.1%(表2)。然而,這部分的區(qū)域為TadA-8e的二聚化界面,當(dāng)TadA-8e呈二聚體形態(tài)時,二聚化界面內(nèi)的疏水性氨基酸聚攏在分子間,有助于穩(wěn)固二聚體的構(gòu)象。圖2(b)展示了TadA8e的電勢分布,可以看到:在二聚化界面中,除了疏水作用力,界面中的靜電勢相互吸引,界面三維結(jié)構(gòu)呈互補形態(tài),二聚化界面結(jié)合的非常緊密。綜上,我們推斷:當(dāng)帶有TadA-8e的ABE8e分子以二聚體形態(tài)存在時,分子表面密集的疏水性區(qū)域較少,不易造成聚集。
表2 TadA-8e二聚化界面疏水性氨基酸概況表
(a) TadA-8e 疏水性氨基酸分布圖
(3) ABE8e三維結(jié)構(gòu)分析。根據(jù)上述理論分析結(jié)果可知,ABE8e以二聚體為主要結(jié)構(gòu)形態(tài)時,多聚體較少。但是,ABE8e的體外純化結(jié)果顯示:蛋白混合液中約含有34.2%的多聚體。因此,我們進一步考察ABE8e的三維結(jié)構(gòu)。
由圖2(d) ABE8e的三維結(jié)構(gòu)可以發(fā)現(xiàn):nCas9的分子較大,當(dāng)TadA-8e通過linker連接上nCas9后,增加了蛋白質(zhì)的剛性。分子剛性的增加限制了TadA-8e的移動,減少了TadA-8e二聚化界面碰撞結(jié)合的機會。當(dāng)二聚化界面沒有相結(jié)合時,相關(guān)界面中的疏水性區(qū)域可能會和蛋白質(zhì)其他區(qū)域的疏水性氨基酸相互結(jié)合,特別是分子表面及柔性部位。這種結(jié)合將會造成多聚體的形成。
綜上,本研究提出關(guān)于多聚體形成的假說:由于TadA-8e二聚化界面中疏水性區(qū)域的曝露,造成了分子間的聚集,從而產(chǎn)生大量的多聚體。當(dāng)ABE8e無法形成二聚體結(jié)構(gòu)時,其更傾向形成多聚體,而非單體。
為了驗證多聚體的形成是否與二聚化界面的打開有關(guān),我們突變了TadA-8e二聚化界面的關(guān)鍵氨基酸,以阻礙其二聚化。觀察二聚化界面進一步打開后,多聚體的比例是否會發(fā)生改變。若多聚體的比例增加,則可證明以上假說的正確性。
(1) 突變體的構(gòu)建。為了尋找二聚化界面的關(guān)鍵氨基酸,運用PyMOL軟件分析了該界面中特異性較高的部分。從圖3(a) ABE8e二聚化界面的三維結(jié)構(gòu)細節(jié)圖可以發(fā)現(xiàn):64位和74位的精氨酸位于此部位,且精氨酸帶有正電荷,與對面的負電荷相互吸引??梢酝茢啵哼@兩個位點的氨基酸是二聚化界面中影響二聚化的核心氨基酸。
在確定需要突變的氨基酸后,使用Rosetta軟件中的Fixbb模塊對ABE8e的64及74位氨基酸進行突變優(yōu)化。Fixbb模塊共輸出5000個結(jié)果,先通過Python程序剔除重復(fù)結(jié)果,再以蛋白質(zhì)的能量值由低到高進行排序,然后選出能量最低的突變體。這樣,最終確定的突變體中R64突變?yōu)長;R74突變?yōu)镋。我們將此突變體命名為ABE8e-T。從圖3(b)突變體的測序圖中可以看出,64位的核酸序列為CTG;74位的核酸序列為GAA,說明突變體ABE8e-T的表達質(zhì)粒構(gòu)建成功。
(a) ABE8e突變位點圖
(2) 突變體的純化。 為了觀察ABE8e-T的結(jié)構(gòu)形態(tài),采用平臺工藝條件對ABE8e-T進行表達純化。先進行Ni柱純化,再取其Ni柱層析收獲的洗脫液進行凝膠層析純化,分離多聚體和二聚體。ABE8e-T的Ni柱親和層析純化結(jié)果見圖4(b)。由圖可知,ABE8e-T經(jīng)Ni柱純化后純度較高。ABE8e-T的凝膠層析純化結(jié)果如圖4(c)所示。從分子篩的實驗結(jié)果見圖4(c)中可知,在20 mmol/L Tris 0.5 mol/L KCL 緩沖體系中,F(xiàn)1的出峰位置約在7.2 mL,F(xiàn)2的出峰位置約為9.3 mL。根據(jù)Superdex的說明書可知,660 kDa的標(biāo)準(zhǔn)蛋白出峰位置約在8.0 mL,440 kDa的標(biāo)準(zhǔn)蛋白出峰位置約在8.8mL,66 kDa的標(biāo)準(zhǔn)蛋白的出峰位置約在12.5 mL。ABE8e的單體理論分子量為182 kDa,二聚體理論分子量為364 kDa。因此,我們判斷,F(xiàn)1為多聚體,占比為34.2%,F(xiàn)2為二聚體,占比為43.8%。凝膠層析實驗結(jié)果顯示ABE8e-T的多聚體占比為71.6%,比例遠高于二聚體的占比27.1%。對比ABE8e-T與ABE8e的凝膠層析圖譜見圖4(d)后發(fā)現(xiàn):ABE8e-T的多聚體比例大幅度上升,二聚體比例大幅度下降。由此說明,在二聚化界面打開后,ABE8e-T沒有傾向變成單體,而是傾向于多聚體。
綜上,ABE8e-T的體外純化實驗結(jié)果驗證了2.1中對ABE8e多聚體形成的理論分析假說。
(3) 緩沖液優(yōu)化。在蛋白質(zhì)制備的過程中,通過優(yōu)化緩沖溶液的組分,可以有效地防止及抑制蛋白質(zhì)聚集傾向[12]。在確認了ABE8e聚集體的成因后,本研究擬通過此方法來抑制多聚體的比例,從而幫助ABE8e恢復(fù)其二聚體結(jié)構(gòu)。精氨酸因其對蛋白質(zhì)分子有良好的保護作用,已經(jīng)廣泛地應(yīng)用于制劑及下游純化工藝中[16-18],其中精氨酸鹽酸體系抑制分子間聚集的效果最佳[19, 20]。探究其機理,有兩方面可能的影響因素:其一,精氨酸側(cè)鏈能夠與某些氨基酸側(cè)鏈產(chǎn)生有利的相互作用,特別是對疏水性氨基酸上的芳香烴類的側(cè)鏈[17]。其二,精氨酸側(cè)鏈中的胍基能以游離基團的形式存在于緩沖體系中,并與蛋白質(zhì)分子表面產(chǎn)生相互作用[21],減弱分子間的作用力。因此,精氨酸可以在不影響蛋白質(zhì)二級及三級結(jié)構(gòu)折疊的情況下,減少蛋白質(zhì)與蛋白質(zhì)之間的疏水作用力,從而有效地抑制蛋白質(zhì)之間的聚集[19, 21]。所以,本研究在原緩沖體系中添加了0.5 mol/L 精氨酸,將緩沖體系優(yōu)化為:20 mmol/L Tris,0.5 mol/L KCl,0.5 mol/L 精氨酸鹽酸 pH 8.0,以抑制ABE8e多聚體的形成。
從圖4(c)和圖4(d)的凝膠層析實驗結(jié)果可知,優(yōu)化了緩沖體系后,ABE8e的二聚體比例上升到52.8%,多聚體比例降至18.2%。對比兩種緩沖體系下凝膠層析譜發(fā)現(xiàn):在保持其它條件不變的情況下,僅在原緩沖體系中添加0.5 mol/L 精氨酸鹽酸后,ABE8e的二聚體比例上升了8.8%,多聚體比例下降了16.0%??梢姡彼崮苡行У匾种贫嗑垠w的形成。
圖4 ABE8e-T及ABE8e緩沖體系優(yōu)化純化實驗結(jié)果
此外,我們還嘗試了僅含有20 mmol/L Tris 0.5 mol/L精氨酸pH 8.0的緩沖體系。在這個緩沖體系下,負電荷相對減少了一定數(shù)目,因而ABE8e的多聚體比例也提升到40.6%,二聚體占比為35.4%。這再次表明,在缺少負電荷的環(huán)境下,ABE8e不穩(wěn)定,容易形成多聚體。
前期研究表明,ABE8e在提純的過程中發(fā)現(xiàn)了出現(xiàn)多聚體比例偏高的現(xiàn)象。為降低多聚體的比例,提高二聚體的含量,本研究首先探究了多聚體產(chǎn)生的原因。通過研究與分析TadA-8e疏水性氨基酸分布、電荷分布及ABE8e的三維結(jié)構(gòu),推測ABE8e分子在未形成二聚體的情況下,曝露了二聚化界面中疏水性區(qū)域,這些區(qū)域傾向與分子表面的其它疏水性氨基酸結(jié)合。這種傾向加劇了分子之間的結(jié)合力,從而導(dǎo)致了多聚體的形成。
為了驗證理論推測的正確性,本研究構(gòu)建了可進一步阻礙二聚體形成的相應(yīng)突變體ABE8e-T。ABE8e-T的純化結(jié)果證實了ABE8e多聚體形成的理論推測。在找到多聚體的成因后,本研究通過優(yōu)化緩沖體系,在緩沖液中添加0.5 mol/L 精氨酸鹽酸后,有效地降低了多聚體的比例。優(yōu)化后的緩沖體系可以為其它堿基編輯器的制備提供了一種新的技術(shù)方案。
在常規(guī)緩沖體系優(yōu)化的過程中,一般通過試錯的方式來摸索工藝條件。這樣的方式費時費力,效率低下。在本研究中,使用PyMOL建模軟件分析了蛋白質(zhì)的結(jié)構(gòu)信息,可以快速精準(zhǔn)地尋找引起聚集的關(guān)鍵氨基酸。這樣,在確認具體原因后再尋找解決方案可以有效地提高了緩沖體系的優(yōu)化效率。不難預(yù)見,當(dāng)其它堿基編輯器遇到類似聚集問題時,也可考慮應(yīng)用相同的方式解決,這為純化制備工藝的開發(fā)提供了有用的思路。
還有,現(xiàn)有的ABE定向進化優(yōu)化主要方向是通過增強其與底物DNA 的結(jié)合力來實現(xiàn)提高編輯活性及降低脫靶效應(yīng)。本文的結(jié)果提示,當(dāng)?shù)鞍踪|(zhì)不易發(fā)生聚集時,將有助于提高蛋白質(zhì)的穩(wěn)定性,增加其編輯活性。所以,本研究的結(jié)果也可以為ABE的定向進化優(yōu)化提供了新的方向。