張曉元,郝榮華,劉 飛,2,3*,袁丹丹,陳 勉,凌沛學(xué),2,3
(1. 山東省藥學(xué)科學(xué)院 山東省生物藥物重點實驗室 山東省多糖類藥物工程實驗室 多糖類藥物發(fā)酵與精制國家地方聯(lián)合工程實驗室 博士后科研工作站,山東 濟南 250101;2. 山東大學(xué) 藥學(xué)院,山東 濟南 250012;3. 山東福瑞達醫(yī)藥集團有限公司,山東 濟南 250101)
海藻糖合成酶(trehalose synthase)通過分子內(nèi)轉(zhuǎn)苷作用,可催化麥芽糖中兩個葡萄糖分子α,α-1,4 糖苷鍵轉(zhuǎn)變成葡萄糖α,α-1, 1 糖苷鍵,從而生成海藻糖。已報道利用生物酶法合成海藻糖存在TPS/TPP、TS、TreY/TreZ、TreP、TreT等5種途徑[1-2]。其中海藻糖合成酶途徑(TS途徑,又稱Tres途徑)僅需一種酶一步酶反應(yīng),在海藻糖的工業(yè)化生產(chǎn)中,相比傳統(tǒng)酵母細胞提取法及其他生物合成途徑具有底物廉價、工藝簡單、易于調(diào)控等顯著優(yōu)點,是生物酶法工業(yè)化合成海藻糖的研究熱點[3-4]。
來源于灰色鏈霉菌Streptomyces griseus subsp.Griseus的海藻糖合成酶轉(zhuǎn)化效率高、反應(yīng)速度快,葡萄糖副產(chǎn)物少[5]。但該酶在天然的灰色鏈霉菌中屬胞內(nèi)酶,表達量極低,需濃縮上千倍才能檢測到海藻糖合成酶活性[5]。大腸桿菌(Escherichia coli)繁殖迅速、培養(yǎng)簡單、遺傳背景清楚、表達系統(tǒng)成熟,利用基因工程法構(gòu)建大腸桿菌工程菌株來表達灰色鏈霉菌海藻糖合成酶,有望解決這一問題。外源蛋白在大腸桿菌中的表達差異,除受表達條件的直觀影響外,外源基因自身特性的影響也至關(guān)重要。其中密碼子的選擇是左右表達量的參數(shù)之一, 基因表達水平高低與嗜好密碼子的使用程度之間存在較強的相關(guān)性?;疑溍咕艽a子偏好性與大腸桿菌存在著很大差別,本研究旨在不改變灰色鏈霉菌海藻糖合成酶氨基酸組成的前提下,將編碼灰色鏈霉菌TreS蛋白的密碼子優(yōu)化為大腸桿菌的偏愛密碼子,以減少翻譯過程中產(chǎn)生的瓶頸效應(yīng),實現(xiàn)外源蛋白在大腸桿菌體內(nèi)表達量的提高。
Multitron通用型振蕩培養(yǎng)箱(伊孚森生物技術(shù)公司);HPS-250生化培養(yǎng)箱(哈爾濱東聯(lián));GelDocXR+全自動凝膠成像系統(tǒng)(Bio-rad);Power Pac BasicTM型蛋白電泳儀(Bio-rad);生物樣品均質(zhì)器(Bertin);1200型高效液相色譜儀(Agilent)。
質(zhì)粒pET-26b(+)作為表達載體,大腸桿菌E.coliBL21(DE3)作為表達宿主,均為本實驗室保藏。
LB種子培養(yǎng)基(g/L):蛋白胨 10,酵母粉5,氯化鈉10,pH 7.0,固體培養(yǎng)基含1.5 %瓊脂粉。
液體發(fā)酵培養(yǎng)基(g/L):蛋白胨12,酵母粉24,甘油4,KH2PO42.31,K2HPO412.54,pH 7.5。
限制性內(nèi)切酶,T4 DNA連接酶等(NEB);低分子量標(biāo)準(zhǔn)蛋白(Fermentas);質(zhì)粒小提試劑盒,DNA純化回收試劑盒,瓊脂糖凝膠回收試劑盒等(Tiangen);其他化學(xué)試劑均為國產(chǎn)分析純。
根據(jù)http://www.kazusa.or.jp/codon、CodonW 1.4.2與GenScript Rare Codon Analysis Tool對編碼灰色鏈霉菌海藻糖合成酶基因序列(Genbank:HQ915641.1)密碼子組成、GC含量組成、密碼子使用頻率等進行分析,發(fā)現(xiàn)灰色鏈霉菌海藻糖合成酶基因存在多處大腸桿菌稀有密碼子。利用密碼子優(yōu)化軟件Jcat等進行序列優(yōu)化,優(yōu)化前提:不改變氨基酸序列,密碼子偏好性參考大腸桿菌K12 MG1655。
優(yōu)化前、優(yōu)化后海藻糖合成酶基因序列tres、tres1由濟南博尚生物科技有限公司合成,序列首尾分別設(shè)計引入NcoI、XhoI酶切位點。NcoI/XhoI雙酶切tres、tres1全基因序列與同樣處理過的pET-26b(+)質(zhì)粒在T4 DNA 連接酶作用下進行連接,得重組質(zhì)粒載體pET-26b(+)-tres、pET-26b(+)-tres1。構(gòu)建好的重組質(zhì)粒采用CaCl2法轉(zhuǎn)化大腸桿菌E. coliBL21(DE3)感受態(tài)細胞,37 ℃,LB平板培養(yǎng)18~24 h,直至長出轉(zhuǎn)化子。挑取單菌落接種于含50 μg/ml卡那霉素的LB液體培養(yǎng)基中,37 ℃,220 r/min培養(yǎng)過夜,提取質(zhì)粒雙酶酶切及序列測定驗證讀碼框正確性。
將經(jīng)電泳及測序鑒定正確的陽性轉(zhuǎn)化子,過夜培養(yǎng)活化后,按1 %的接種量轉(zhuǎn)接于含50 μg/ml卡那霉素的LB 液體培養(yǎng)基中培養(yǎng),37 ℃、220 r/min振蕩培養(yǎng)至OD600=1.0時,加入異丙基硫代半乳糖苷(IPTG)至終濃度1 mmol/L,25 ℃、每2 h取1.5 ml培養(yǎng)液至18 h,所取樣品采用生物樣品均質(zhì)器Precellys 24均質(zhì)破碎,均質(zhì)速度5500 r/min,3個循環(huán),每個循環(huán)運行時間為15 s,循環(huán)間隔10 s。均質(zhì)液12 000 r/min離心后上清即為粗酶液。
將不同時間取樣制備的粗酶液進行酶活性測定,取200 μl酶液,加入200 μl 10 %麥芽糖溶液(0.1 mol/L pH 6.5磷酸鹽緩沖液配制),24 ℃水浴反應(yīng)1 h后,沸水浴10 min終止反應(yīng)。酶反應(yīng)產(chǎn)物進行高效液相色譜(HPLC)分析。HPLC條件:分離柱ZORBAX NH2,4.6 mm×250 mm,5 μm,流動相為乙腈:水=75:25,柱溫:50 ℃,流速 1.0 ml/min。海藻糖合酶酶活力1 U定義:24 ℃、pH 6.5反應(yīng)條件下,以10 % 麥芽糖溶液為底物,每1 min產(chǎn)生1 μmoL海藻糖所需酶量。
以牛血清蛋白為標(biāo)準(zhǔn)蛋白,采用Bradford法[6]測定粗酶液的蛋白質(zhì)含量。
取發(fā)酵粗酶液,加入適量5×SDS上樣緩沖液,沸水浴處理10 min,4 ℃,12 000 r/min離心5 min,取10 μl進行SDS-PAGE電泳檢測。
灰色鏈霉菌的海藻糖合成酶tres基因開放閱讀框(ORF)共計1707 bp,因灰色鏈霉菌與大腸桿菌存在物種間差異,對照圖1E. coliK-12 MG1655密碼子使用情況,縱坐標(biāo)Wij代表編碼第i個氨基酸的第j個同義密碼子的“相對適應(yīng)性”,即該同義密碼子的觀察值除以編碼該氨基酸的同義密碼子的最大值,其值在0~1之間,越高則表明該基因的密碼子使用偏好性越強。tres基因所用三聯(lián)密碼子存在大腸桿菌稀有密碼子或低頻使用密碼子,如CCC(14個)、CGG(12個)、GGG(8個)、GGA(2個)、AGG(1個)、CGA(1個)等(見表1),這些密碼子的存在會影響tres基因在大腸桿菌異源表達水平。經(jīng)Jcat密碼子優(yōu)化軟件優(yōu)化得基因序列tres1,tres1與tres基因密碼子優(yōu)化前后的核甘酸序列對比分析結(jié)果見圖2。由圖2可見,優(yōu)化后的tres1基因序列共有268 bp堿基進行大腸桿菌適應(yīng)性變化,但所編碼的氨基酸的序列無任何改變。
表1 海藻糖合成酶tres基因優(yōu)化前后編碼密碼子數(shù)量統(tǒng)計表
圖1 E. coli K-12 MG1655密碼子使用情況
圖2 海藻糖合成酶基因tres和tres1的核苷酸序列
GC含量是鳥嘌呤和胞嘧啶所占DNA 4種堿基的比率。GC含量隨DNA來源物種不同而異。GC含量高低影響DNA的密度,GC含量高,相應(yīng)DNA密度也高,加熱及加堿均不易使之變性,GC含量理想的比例范圍是30 %~70 %[7]。鏈霉菌基因組GC含量整體較高[8],經(jīng)計算,來源于灰色鏈霉菌tres基因的GC含量約為65.8 %,高于大腸桿菌平均50 %左右的GC含量。序列優(yōu)化后,如圖3所示:優(yōu)化后的tres1基因序列平均GC含量降低至54.4 %,更接近大腸桿菌表達基因的GC百分比,有利于基因高效表達。
圖3 優(yōu)化前后基因序列GC含量分布曲線圖
密碼子適應(yīng)指數(shù)(codon adaption index,CAI)反映基因編碼區(qū)所有同義密碼子中某一指定密碼子的使用頻率與最優(yōu)密碼子頻率相符合的程度。取值范圍在0~1之間,表達量較高的基因常具有較高的CAI值,表達量較低的基因則具有較低的CAI值。CAI已廣泛應(yīng)用于基因表達水平的預(yù)測[9-11]。經(jīng)優(yōu)化軟件測算,基因tres1經(jīng)合理優(yōu)化后,密碼子適應(yīng)指數(shù)CAI值由0.37提升至0.97,符合GenScript's OptimumGeneTM密碼子優(yōu)化軟件所建議的高表達優(yōu)化CAI 0.8~1.0取值范圍。密碼子使用頻率分布(condon frequency distribution,CFD)見圖4。由圖4可見,優(yōu)化前基因序列出現(xiàn)使用頻率小于30 %的密碼子,存在阻礙基因高效表達的可能性,優(yōu)化后基因多數(shù)密碼子的使用頻率在90 %以上,未發(fā)現(xiàn)有使用頻率小于50 %的密碼子,有利于基因高效表達。
圖4 密碼子優(yōu)化前后密碼子使用頻率分布情況
采用CaCl2法進行了tres、tres1基因的大腸桿菌轉(zhuǎn)化,測序鑒定篩選出正確的陽性轉(zhuǎn)化子進行搖瓶誘導(dǎo)發(fā)酵。pET-26b(+)載體設(shè)計含有pelB信號肽,蛋白表達時可將目的基因定位于細胞周質(zhì)。因此,含質(zhì)粒pET-26b(+)-tres、pET-26b(+)-tres1基因工程菌株在加入IPTG誘導(dǎo)后每2 h所取發(fā)酵液,均質(zhì)破碎,取上清做表達產(chǎn)物分析。SDS-PAGE分析結(jié)果見圖5。由表5可見,tres、tres1氨基酸序列編碼相同的568個氨基酸,相對分子質(zhì)量(Mr)理論值約66×103。有圖5可見,含密碼子優(yōu)化的tres1大腸桿菌基因工程菌株Mr66×103的條帶明顯濃于tres基因工程菌株,目的蛋白表達量高。
圖5 Tres1、Tres蛋白表達SDS-PAGE電泳圖
灰色鏈霉菌海藻糖合成酶在轉(zhuǎn)化麥芽糖生成海藻糖過程中會產(chǎn)生少量葡萄糖副產(chǎn)物,產(chǎn)生的海藻糖與未反應(yīng)的麥芽糖分子量大小一致,HPLC不易區(qū)分。本實驗優(yōu)選色譜柱 ZORBAX NH2(4.6 mm×250 mm,5 μm),流動相采用乙腈:水=75:25,柱溫 50 ℃,流速 1.0 ml/min。該條件下海藻糖與麥芽糖具備了較好的區(qū)分度,且出峰時間短(<10 min),易于海藻糖的快速檢測(見圖6)。
圖6 葡萄糖、麥芽糖、海藻糖 HPLC圖譜
含質(zhì)粒pET-26b(+)-tres、pET-26b(+)-tres1基因工程菌株在同樣條件下采用IPTG誘導(dǎo)后2,4,6,8,10,12,14 ,16 和18 h 分別取樣進行酶活力的測定,比較結(jié)果見圖7,由圖7可見在誘導(dǎo)反應(yīng)開始的2 h內(nèi),兩者的酶活力幾乎都不存在。2 h后海藻糖合成酶均開始表達,優(yōu)化后菌株海藻糖合成酶活性在誘導(dǎo)4 h后呈明顯增加趨勢,12 h時即可達到未優(yōu)化菌株18 h發(fā)酵水平。優(yōu)化菌株18 h取樣測定酶活性為48.9 U/ml,比未優(yōu)化對照菌株酶活性30.5U/ml提高了60.3 %。經(jīng)蛋白含量測定,計算海藻糖合成酶蛋白比活性不存在顯著性差異,這與優(yōu)化前后氨基酸序列無改變直接相關(guān),單位時間內(nèi)產(chǎn)酶量的增加,推測與優(yōu)化后的tres1翻譯效率提高關(guān)系密切。
圖7 基因優(yōu)化前后產(chǎn)酶酶活性曲線圖
天然蛋白質(zhì)的氨基酸可由1~6個核苷酸三聯(lián)密碼子編碼,稱為同義密碼子。不同物種其基因在同義密碼子的使用上存在偏愛性。密碼子偏愛性的不匹配是外源基因在宿主系統(tǒng)表達不好的主要原因之一,利用生物信息學(xué)方法統(tǒng)計物種間不同密碼子使用頻率,把不匹配的非偏愛性密碼子加以定點突變,可改變外源基因的密碼子偏愛性使之和宿主系統(tǒng)更加匹配,從而得到較高產(chǎn)量的表達產(chǎn)物。
已全基因組測序的鏈霉菌編碼基因普遍具有較高GC含量[8]。本研究來源自灰色鏈霉菌的海藻糖合成酶基因GC含量就高達65.8 %,三聯(lián)密碼子第三位簡并密碼子更傾向于GC,CodonW軟件分析GC3s(密碼子第三位G或C)出現(xiàn)頻率0.955很好驗證這一特點。序列合理優(yōu)化后,tres基因GC含量下降至54.5 %,GC3s出現(xiàn)頻率降低至0.592,密碼子適應(yīng)指數(shù)CAI值由0.37提升至0.97,更接近于大腸桿菌基因編碼特點,基因工程菌株表達海藻糖合成酶酶活性也因此提高了60.3 %。該密碼子優(yōu)化方法為不同物種來源的外源蛋白在大腸桿菌高效表達提供理論指導(dǎo)。然而,外源基因表達水平不僅僅與密碼子偏愛性直接相關(guān),還取決于基因表達啟動子終止子強度、識別密碼子的tRNA豐度、序列二級結(jié)構(gòu)復(fù)雜程度等。因此,開發(fā)一種基于DNA序列組成方面的多尺度、系統(tǒng)性、綜合性的生物信息學(xué)分析方法對實現(xiàn)外源基因在不同物種間高效表達至關(guān)重要。