馬紅武 陳修來(lái) 袁倩倩 劉立明 孫際賓
基因工程技術(shù)的出現(xiàn)使得人類(lèi)不再受限于自然變異和篩選,通過(guò)有目的的基因組改造可以大幅度地提升菌株的生產(chǎn)性能。例如,通過(guò)對(duì)代謝網(wǎng)絡(luò)中酶基因的引入、敲除或精細(xì)調(diào)控可以創(chuàng)造新的細(xì)胞,將廉價(jià)的原料轉(zhuǎn)化為有價(jià)值的目標(biāo)產(chǎn)品。這正是目前代謝工程和合成生物學(xué)研究的主要內(nèi)容。從原料到產(chǎn)品的生物轉(zhuǎn)化途徑常常包括幾十步的酶反應(yīng),目前常用的代謝工程改造策略主要就是過(guò)表達(dá)和優(yōu)化產(chǎn)物合成途徑中的關(guān)鍵酶、敲除副產(chǎn)物生成途徑、解除產(chǎn)物合成抑制等。通過(guò)這種傳統(tǒng)的代謝工程改造策略,人們已經(jīng)獲得大量工程菌株應(yīng)用于生物化學(xué)品(如氨基酸、有機(jī)酸、維生素、抗生素)、生物燃料(如乙醇)、生物材料(如聚羥基脂肪酸酯、聚乳酸等)的生產(chǎn),以可再生的原料和綠色的生產(chǎn)方式,推動(dòng)人類(lèi)工業(yè)經(jīng)濟(jì)發(fā)展進(jìn)入一個(gè)新的階段。
代謝工程研究遇到的主要瓶頸就是細(xì)胞代謝網(wǎng)絡(luò)的復(fù)雜性。自然存在的細(xì)胞是長(zhǎng)期進(jìn)化的結(jié)果,常包括上千個(gè)酶基因并具有復(fù)雜的調(diào)控機(jī)制,僅僅對(duì)原料到產(chǎn)品合成途徑上的少數(shù)基因進(jìn)行改造很多時(shí)候并不能達(dá)到預(yù)期的結(jié)果。隨著基因組測(cè)序技術(shù)的快速發(fā)展,完成全基因組測(cè)序的生物越來(lái)越多;通過(guò)基因組注釋信息可以快速確定其基因組能夠編碼哪些酶、進(jìn)行哪些反應(yīng),由此構(gòu)建出該生物的代謝網(wǎng)絡(luò)模型。這些基因組規(guī)模代謝網(wǎng)絡(luò)模型和長(zhǎng)期積累形成的跨物種代謝反應(yīng)數(shù)據(jù)庫(kù),如KEGG和MetaCyc等為代謝網(wǎng)絡(luò)計(jì)算模擬和設(shè)計(jì)奠定了基礎(chǔ),為合成生物學(xué)和代謝工程提供了新的策略,從而大幅度加快了菌種定向開(kāi)發(fā)和工業(yè)化應(yīng)用進(jìn)程。
通過(guò)引入外源基因使某一生物合成其原來(lái)不能合成的新產(chǎn)品,這是一種常用的代謝工程手段。例如,Galanie等通過(guò)將來(lái)源于6種不同生物(包括植物、哺乳動(dòng)物和細(xì)菌)的10余個(gè)基因引入酵母中實(shí)現(xiàn)了鴉片類(lèi)藥物的人工合成。通過(guò)微生物細(xì)胞工廠(chǎng)合成植物來(lái)源的天然產(chǎn)物,其好處是微生物生長(zhǎng)更快,單位時(shí)空內(nèi)產(chǎn)量更高,可以通過(guò)較小的發(fā)酵工廠(chǎng)代替大面積的農(nóng)業(yè)種植,大大降低生產(chǎn)成本。
從無(wú)到有的設(shè)計(jì)首先需要確定在底盤(pán)細(xì)胞中引入哪些外源基因才能打通該新產(chǎn)品的合成途徑。因此,需要將底盤(pán)細(xì)胞代謝網(wǎng)絡(luò)與代謝反應(yīng)數(shù)據(jù)庫(kù)(如KEGG、MetaCyc等)相結(jié)合,通過(guò)一定的計(jì)算方法找出需要在底盤(pán)細(xì)胞中引入的新反應(yīng),形成新的途徑,以實(shí)現(xiàn)新產(chǎn)品的合成。例如,Zhang等將KEGG反應(yīng)引入到大腸桿菌代謝網(wǎng)絡(luò)中,構(gòu)建了包含7316個(gè)反應(yīng)的復(fù)合代謝網(wǎng)絡(luò)模型;基于該模型,以葡萄糖為底物進(jìn)行通量平衡分析發(fā)現(xiàn),1777個(gè)異源產(chǎn)品可以通過(guò)在大腸桿菌中引入適當(dāng)外源反應(yīng)合成。這一研究為選擇合適外源基因構(gòu)建大腸桿菌的人工細(xì)胞工廠(chǎng)提供了指導(dǎo)。該方法還可以計(jì)算其他微生物為底盤(pán)時(shí)的結(jié)果,并通過(guò)比較分析確定針對(duì)某一特定產(chǎn)品的最優(yōu)底盤(pán)生物(需引入外源基因少,相應(yīng)前體合成能力強(qiáng)等)。Chatsurachai等分別以大腸桿菌、谷氨酸棒桿菌和釀酒酵母為底盤(pán)細(xì)胞,通過(guò)逐級(jí)擴(kuò)展算法將來(lái)源于KEGG、BRENDA和ENZYME 3個(gè)數(shù)據(jù)庫(kù)中的異源代謝物和反應(yīng)添加到 3個(gè)菌株代謝模型中以合成新的產(chǎn)物。該擴(kuò)展算法首先從數(shù)據(jù)庫(kù)中找出那些反應(yīng)物在(但產(chǎn)物不在)該菌株代謝網(wǎng)絡(luò)中的反應(yīng),通過(guò)將這些反應(yīng)添加到模型中,使該模型可以生成那些新反應(yīng)中的產(chǎn)物。隨后在擴(kuò)展的模型基礎(chǔ)上重復(fù)該新反應(yīng)添加過(guò)程,直到?jīng)]有新反應(yīng)可以添加。最終,針對(duì)每一個(gè)底盤(pán)細(xì)胞得到其可以合成的新產(chǎn)品列表及生成某一新產(chǎn)品需要引入的新反應(yīng)。作者通過(guò)該方法預(yù)測(cè)出大腸桿菌和釀酒酵母是 1,3-丙二醇合成的可行宿主,并且只需要在這兩種株菌中引入甘油脫氫酶和 1,3-丙二醇氧化還原酶便可實(shí)現(xiàn)產(chǎn)品合成。
上述方法均需基于特定代謝反應(yīng)數(shù)據(jù)庫(kù)擴(kuò)展特定底盤(pán)細(xì)胞的代謝網(wǎng)絡(luò),要合成的代謝物和相關(guān)反應(yīng)必須存在于數(shù)據(jù)庫(kù)中才能設(shè)計(jì)出相關(guān)途徑,而自然界中還存在許多未知的生化反應(yīng)并未包含在這些數(shù)據(jù)庫(kù)中。例如,很多酶,如醛縮酶等均具有廣譜催化活性,除了已知反應(yīng)外還可能催化其他代謝物的轉(zhuǎn)化。通過(guò)酶改造,構(gòu)建具有新催化活性的酶可以實(shí)現(xiàn)新的轉(zhuǎn)化過(guò)程獲得新的生物產(chǎn)品,甚至是合成出自然界不存在的全新生物分子。針對(duì)這一問(wèn)題,人們提出了基于生化反應(yīng)規(guī)則和化合物結(jié)構(gòu)特征來(lái)設(shè)計(jì)新反應(yīng)的方法。例如,Hatzimanikatis的研究組基于化學(xué)信息學(xué),在KEGG數(shù)據(jù)庫(kù)中反應(yīng)的基礎(chǔ)上擴(kuò)展酶反應(yīng),創(chuàng)建了ATLAS數(shù)據(jù)庫(kù),其中包含13萬(wàn)多個(gè)在已知反應(yīng)基礎(chǔ)上通過(guò)結(jié)構(gòu)相似性設(shè)計(jì)得到的新生化反應(yīng)。利用該數(shù)據(jù)庫(kù),他們?cè)O(shè)計(jì)了多條可以生成生物燃料丁酮的全新途徑,并對(duì)不同途徑的理論得率進(jìn)行了比較分析,以獲得最優(yōu)途徑。
在賦予了細(xì)胞新的合成能力,實(shí)現(xiàn)了從無(wú)到有的改造之后,代謝工程的下一個(gè)目標(biāo)就是以最小的原料消耗生產(chǎn)最多的產(chǎn)品。消耗單位原料(底物)可以生成的產(chǎn)物的量常用“得率”來(lái)表征,其是反映原料成本的一個(gè)重要指標(biāo),尤其對(duì)大宗化學(xué)品來(lái)說(shuō)原料成本是影響產(chǎn)品生產(chǎn)成本的最主要因素。對(duì)某些通過(guò)簡(jiǎn)單途徑就可以合成得到的產(chǎn)品,如乙醇、乳酸等,通過(guò)直觀(guān)觀(guān)察就可以得到得率最大化的代謝途徑;但對(duì)大部分代謝產(chǎn)物,如核苷酸、芳香族氨基酸等,由于其合成途徑復(fù)雜,涉及副產(chǎn)物及多個(gè)前體,很難通過(guò)簡(jiǎn)單觀(guān)察或手工計(jì)算得到其理論得率。此外,在產(chǎn)品合成過(guò)程中還涉及能量(ATP)和還原力的產(chǎn)生和消耗,需要額外消耗底物產(chǎn)生能量和還原力,或通過(guò)某種途徑消耗掉多余的能量還原力,這使得產(chǎn)物得率的計(jì)算更為復(fù)雜。基于代謝網(wǎng)絡(luò)模型,人們提出了通量平衡分析(flux balance analysis,F(xiàn)BA)的計(jì)算分析方法,以準(zhǔn)確計(jì)算該網(wǎng)絡(luò)中產(chǎn)物的理論得率及能達(dá)到該理論得率的最優(yōu)轉(zhuǎn)化途徑。FBA基于代謝網(wǎng)絡(luò)模型中的生化反應(yīng)計(jì)量關(guān)系(可以理解為一個(gè)反應(yīng)中各種反應(yīng)物和產(chǎn)物的摩爾比)和反應(yīng)的不可逆性約束,通過(guò)求解約束最優(yōu)化問(wèn)題,得到使產(chǎn)物生成最大化并且滿(mǎn)足物料和能量平衡的產(chǎn)品合成最優(yōu)途徑。由于求得的途徑是通過(guò)對(duì)整體網(wǎng)絡(luò)計(jì)算分析得到的,比由生化知識(shí)得出的常規(guī)合成途徑更為全面,該方法能考慮能量平衡、輔因子平衡、多前體的平衡以及合成途徑中副產(chǎn)物的再回收利用。該方法可以獲得實(shí)現(xiàn)同樣最大得率的多種不同策略,可能超越我們對(duì)生物化學(xué)知識(shí)的理解,得到與已知傳統(tǒng)代謝途徑不同的新途徑,從而提供全新的改造靶點(diǎn)和策略。例如,很多生物產(chǎn)品都是以乙酰輔酶A為前體合成得到,但以葡萄糖為底物時(shí),乙酰輔酶A一般由糖酵解終產(chǎn)物丙酮酸脫羧生成,這導(dǎo)致葡萄糖中的2個(gè)碳原子都以CO2形式損失掉而不能進(jìn)入產(chǎn)物,1個(gè)葡萄糖(含6個(gè)碳原子)最多得到2個(gè)乙酰輔酶A(共4個(gè)碳原子)。因此,即使全部乙酰輔酶A中的碳都轉(zhuǎn)化到產(chǎn)品中,產(chǎn)物的最大碳摩爾得率也只能達(dá)到0.67。而以大腸桿菌代謝網(wǎng)絡(luò)模型iJO1366通過(guò)FBA對(duì)乙酰輔酶A衍生產(chǎn)品聚3-羥基丁酸酯(P3HB)最優(yōu)得率計(jì)算結(jié)果卻可達(dá)到 0.86,這表明在其代謝網(wǎng)絡(luò)存在一些新途徑可以減少碳損失。由求得的最優(yōu)途徑中的通量分布可見(jiàn),在該途徑中除了常規(guī)葡萄糖經(jīng)過(guò)EMP途徑生成丙酮酸進(jìn)而生成乙酰輔酶 A途徑外,還有一條稱(chēng)之為蘇氨酸循環(huán)的途徑回收甲酸和 CO2,由磷酸烯醇式丙酮酸再回到丙酮酸同時(shí)生成一個(gè)乙酰輔酶A用于產(chǎn)品合成,從而提高了產(chǎn)品得率?;谠撏緩接?jì)算結(jié)果,Lin等在大腸桿菌中通過(guò)解調(diào)控等激活了該循環(huán)途徑,將P3HB得率提高了將近一倍。
外源基因的引入不但可以使細(xì)胞從無(wú)到有獲得合成新產(chǎn)品的能力,也可以形成新的途徑提高已有產(chǎn)品的得率。Bogorad等通過(guò)在大腸桿菌中引入來(lái)源于B. adolescentis的戊糖/己糖磷酸轉(zhuǎn)酮酶(Fxpk)構(gòu)建了非氧化酵解途徑(non-oxidative glycolysis,NOG)。通過(guò)該途徑可以實(shí)現(xiàn)1個(gè)葡萄糖生成3個(gè)乙酸,即完全沒(méi)有碳損失。我們?cè)诖竽c桿菌 iJO1366模型中引入該反應(yīng)后通過(guò)FBA分析對(duì)上百種生物產(chǎn)品的理論得率進(jìn)行了計(jì)算,發(fā)現(xiàn)至少有幾十種生化產(chǎn)品的得率都有了顯著提高。在這一計(jì)算結(jié)果指導(dǎo)下,構(gòu)建了含NOG途徑的大腸桿菌菌株并分別用于 P3HB、丙酮和異丙醇的生產(chǎn)。改造后的菌株與出發(fā)菌株相比得率均有顯著提高。最近 Meadows等將NOG途徑引入到釀酒酵母細(xì)胞中構(gòu)建了法尼烯合成細(xì)胞工廠(chǎng),最終菌株法尼烯對(duì)葡萄糖的碳摩爾得率由0.52提高到0.65。
基于FBA模型獲得的反應(yīng)列表及其通量代表了理想狀態(tài)下反應(yīng)速度最佳比例,可以作為代謝工程改造的終極目標(biāo)——酶的實(shí)際表達(dá)量與活性要?jiǎng)偤脻M(mǎn)足實(shí)現(xiàn)最佳代謝通量的要求,不多也不少。實(shí)際代謝工程實(shí)踐中,容易做到酶活性的“有無(wú)”調(diào)控或者叫“靜態(tài)控制”,比如通過(guò)基因敲除徹底失活某個(gè)生化反應(yīng),或者通過(guò)外源基因的引入增加某個(gè)反應(yīng),但是難以做到按照FBA模型預(yù)測(cè)的通量要求精確地調(diào)控每個(gè)酶的活性大小。實(shí)際上,細(xì)胞在長(zhǎng)期進(jìn)化中已經(jīng)形成多種多樣的動(dòng)態(tài)調(diào)控機(jī)制,根據(jù)不同的環(huán)境,精準(zhǔn)地調(diào)控酶的表達(dá)(誘導(dǎo)與阻遏),精準(zhǔn)地控制酶的活性(激活與抑制),確保代謝網(wǎng)絡(luò)能夠適應(yīng)環(huán)境,實(shí)現(xiàn)全局最優(yōu)化。例如,在發(fā)酵培養(yǎng)過(guò)程中細(xì)胞適應(yīng)環(huán)境變化不斷調(diào)整自身的代謝狀態(tài),形成延遲期、指數(shù)生長(zhǎng)期和產(chǎn)物生成期等不同階段,每個(gè)階段對(duì)基因蛋白表達(dá)水平、代謝物濃度和通量分布都有不同要求。學(xué)習(xí)自然進(jìn)化形成的動(dòng)態(tài)調(diào)控機(jī)制,近年來(lái)人們提出了動(dòng)態(tài)代謝工程(dynamic metabolic engineering)的概念和方法,即根據(jù)胞內(nèi)狀態(tài)和環(huán)境條件的變化對(duì)基因表達(dá)和活性進(jìn)行動(dòng)態(tài)調(diào)控,避免中間代謝產(chǎn)物的積累或不足,滿(mǎn)足不同階段的生長(zhǎng)和產(chǎn)物合成對(duì)代謝通量分布的差異化需求?;蚧芈坊蚍Q(chēng)轉(zhuǎn)錄調(diào)節(jié)回路,是最常用的動(dòng)態(tài)調(diào)控手段,借助于小分子與轉(zhuǎn)錄因子(一種蛋白質(zhì))的相互作用和轉(zhuǎn)錄因子與特殊DNA區(qū)域(如啟動(dòng)子、增強(qiáng)子、沉默子)的相互作用,將胞內(nèi)外環(huán)境信號(hào)轉(zhuǎn)化為對(duì)酶蛋白表達(dá)的精準(zhǔn)控制,確保細(xì)胞隨時(shí)調(diào)節(jié)代謝活動(dòng)以適應(yīng)環(huán)境變化。通過(guò)動(dòng)態(tài)控制酶的水平,可以實(shí)現(xiàn)代謝途徑流向的動(dòng)態(tài)轉(zhuǎn)向調(diào)控,或?qū)崿F(xiàn)代謝活性的精準(zhǔn)平衡。
基因回路可以在特定的時(shí)間和細(xì)胞密度下關(guān)閉或開(kāi)啟基因表達(dá),實(shí)現(xiàn)代謝流向在細(xì)胞生長(zhǎng)的內(nèi)源代謝途徑和化學(xué)品生產(chǎn)的異源途徑之間的切換。切換控制主要集中在生長(zhǎng)必需基因上,因?yàn)橥ㄟ^(guò)它們可以實(shí)現(xiàn)生物量形成和產(chǎn)品生物合成之間最直接的控制。基因回路除了可以用于控制酶的合成速度,還可以精細(xì)調(diào)節(jié)酶的降解速度。例如,葡萄糖-6-磷酸(G6P)是一個(gè)代謝流控制的重要節(jié)點(diǎn),既可以通過(guò)磷酸果糖激酶-1(Pfk-1)進(jìn)入糖酵解途徑從而進(jìn)入內(nèi)源代謝,也可以通過(guò)合成途徑進(jìn)入異源代謝。通過(guò)基因回路控制 Pfk-1的活性就可能將碳代謝流的流向從“生長(zhǎng)模式”切換到“生產(chǎn)模式”。為實(shí)現(xiàn)這一目的,Brockman和Prather設(shè)計(jì)了一種蛋白質(zhì)降解回路,將Pfk-1與SsrA降解標(biāo)簽融合,SsrA標(biāo)簽?zāi)軌蚩刂七m配蛋白SspB的結(jié)合、ClpXP蛋白酶招募和蛋白水解降解,從而實(shí)現(xiàn)Pfk-1降解速度的動(dòng)態(tài)控制。將該回路用于大腸桿菌生產(chǎn)肌醇,與靜態(tài)控制相比,肌醇的積累量提高了2倍?;蚧芈吠ㄟ^(guò)控制必需基因的表達(dá)水平實(shí)現(xiàn)代謝途徑的動(dòng)態(tài)調(diào)控,成為工業(yè)菌株代謝工程設(shè)計(jì)改造的有效手段:通過(guò)對(duì)內(nèi)源代謝網(wǎng)絡(luò)進(jìn)行重新布線(xiàn),替代傳統(tǒng)靜態(tài)控制,實(shí)現(xiàn)基因表達(dá)的時(shí)間依賴(lài)性控制以及多個(gè)基因或途徑的平衡互作等,擁有廣泛的應(yīng)用前景。
代謝中間產(chǎn)物的過(guò)量積累可能引發(fā)副反應(yīng),占據(jù)重要細(xì)胞資源(如磷酸鹽、輔因子),以及產(chǎn)生直接或間接的細(xì)胞毒性,對(duì)細(xì)胞生長(zhǎng)或產(chǎn)物合成不利?;蚧芈房梢越柚鷮?duì)中間產(chǎn)物濃度響應(yīng)的生物傳感器,激活代謝途徑下游酶,阻遏代謝途徑上游酶,實(shí)現(xiàn)中間代謝物合成和利用速度適配,提高整個(gè)代謝途徑的合成效率。例如,莽草酸是芳香族氨基酸代謝途徑的中間體,莽草酸的積累會(huì)與芳香族氨基酸的代謝產(chǎn)生競(jìng)爭(zhēng)??梢酝ㄟ^(guò)響應(yīng)莽草酸的基因回路控制莽草酸代謝途徑關(guān)鍵酶——莽草酸激酶(AroK)實(shí)現(xiàn)代謝途徑各分支的平衡,實(shí)現(xiàn)碳代謝流在莽草酸積累與芳香族氨基酸代謝之間的平衡。Mahr等通過(guò)篩選和組裝適當(dāng)?shù)纳飩鞲衅髟?,包括半乳糖響?yīng)啟動(dòng)子和苯丙氨酸響應(yīng)啟動(dòng)子,構(gòu)建了代謝產(chǎn)物響應(yīng)回路網(wǎng)絡(luò)。該回路的應(yīng)用使得工程菌株E. coliK-12 MG1655/pJC1-mtr sensor-type1的苯丙氨酸產(chǎn)量與出發(fā)菌株E. coliK-12 MG1655相比提高了 4.3倍。除了直接響應(yīng)中間代謝物濃度以外,細(xì)胞生長(zhǎng)狀態(tài)、輔因子失衡程度等都可以用于構(gòu)建生物傳感器。
生物合成速度的最大化取決于單位菌體生產(chǎn)能力和菌體總量。通常情況下,生長(zhǎng)和生產(chǎn)競(jìng)爭(zhēng)使用同樣的細(xì)胞資源,需要進(jìn)行合理的安排和均衡,才能實(shí)現(xiàn)生物合成速度整體的最大化。能夠?qū)?xì)胞密度進(jìn)行響應(yīng)的基因回路——群體感應(yīng)系統(tǒng)(quorum sensing,QS)為調(diào)控生長(zhǎng)和生產(chǎn)的關(guān)系提供了新的手段。例如,科研人員借助特征性啟動(dòng)子和不同強(qiáng)度核糖體結(jié)合位點(diǎn),組裝源自Pantoea stewartii的部分量子感應(yīng)元件,實(shí)現(xiàn)了在特定時(shí)間和細(xì)胞密度下pfk-1等基因表達(dá)的開(kāi)與關(guān),工程菌株E. coliL19S的肌醇產(chǎn)量與靜態(tài)控制相比提高了5.5倍。借助QS回路控制aroK表達(dá)的工程菌株E. coliL19SA,其莽草酸的產(chǎn)量由0提高到105 mg/L。
代謝網(wǎng)絡(luò)模型及基于代謝網(wǎng)絡(luò)模型的計(jì)算設(shè)計(jì)方法為代謝工程菌株改造提供了新的方法和策略。通過(guò)這些計(jì)算設(shè)計(jì)方法,人們可以選擇合適的外源基因構(gòu)建新途徑實(shí)現(xiàn)從無(wú)到有的新產(chǎn)品合成,也可以確定改造靶點(diǎn)優(yōu)化已有產(chǎn)品的得率,或者通過(guò)基因回路將細(xì)胞發(fā)酵培養(yǎng)過(guò)程中的狀態(tài)環(huán)境變化與特定基因的表達(dá)相關(guān)聯(lián),使細(xì)胞適應(yīng)不同的目標(biāo)而始終保持最優(yōu)狀態(tài),最大化目標(biāo)產(chǎn)物的生成。隨著人們對(duì)細(xì)胞機(jī)理和相關(guān)調(diào)控機(jī)制的了解不斷深入,有可能建立全細(xì)胞模型對(duì)細(xì)胞內(nèi)代謝物、蛋白和基因表達(dá)水平的變化進(jìn)行精確描述和準(zhǔn)確預(yù)測(cè),實(shí)現(xiàn)完全模型指導(dǎo)下的代謝工程策略設(shè)計(jì)。
(摘自《中國(guó)科學(xué)院院刊》2018年第11期)