姜金國(guó),宋理富,鄭平,賈士儒,孫際賓
1 天津科技大學(xué)生物工程學(xué)院,天津 300457
2 中國(guó)科學(xué)院天津工業(yè)生物技術(shù)研究所,天津 300308
3 中國(guó)科學(xué)院系統(tǒng)微生物工程重點(diǎn)實(shí)驗(yàn)室,天津 300308
細(xì)胞的各種組成分子在一定的空間內(nèi)相互作用,協(xié)調(diào)實(shí)現(xiàn)生命的機(jī)能。所有的細(xì)胞分子及其相互作用,就構(gòu)成了細(xì)胞網(wǎng)絡(luò)。細(xì)胞網(wǎng)絡(luò)是系統(tǒng)生物學(xué)的重要研究?jī)?nèi)容之一,是從全局和整體上把握和理解復(fù)雜的代謝生理現(xiàn)象、實(shí)現(xiàn)對(duì)生命的有效調(diào)控、部分改造和從頭設(shè)計(jì)創(chuàng)造的基礎(chǔ)[1]。盡管生物分子發(fā)揮其機(jī)能是借助于同一個(gè)細(xì)胞網(wǎng)絡(luò),但是在傳統(tǒng)研究中,根據(jù)研究者研究興趣和生物分子參與的反應(yīng)類型,往往將細(xì)胞網(wǎng)絡(luò)人為分解成不同類型的子網(wǎng)絡(luò)分別研究,如基因組規(guī) 模 代 謝 網(wǎng) 絡(luò) (Genome-scale metabolic network,GSMN)、轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò) (Transcriptional regulatory network,TRN) 和信號(hào)轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)(Signal transduction network) 等[2-3]。近年來(lái),研究者已經(jīng)逐步認(rèn)識(shí)到這種分解所帶來(lái)的問(wèn)題,比如Ma等[4]研究大腸桿菌轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)時(shí),發(fā)現(xiàn)其中找不到生物學(xué)中最常見的反饋調(diào)控,進(jìn)一步研究表明,這些轉(zhuǎn)錄反饋調(diào)控大部分是通過(guò)代謝網(wǎng)絡(luò)與轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)協(xié)同實(shí)現(xiàn)的,僅有7個(gè)是發(fā)生在轉(zhuǎn)錄調(diào)控這一單一網(wǎng)絡(luò)層次上[5]。如今,以單一網(wǎng)絡(luò)為基礎(chǔ)的多網(wǎng)絡(luò)集成,已成為系統(tǒng)生物學(xué)領(lǐng)域的重要發(fā)展趨勢(shì),雖然相關(guān)的分析軟件還相對(duì)缺乏,但是集成分析已經(jīng)產(chǎn)生了一些重要的結(jié)果。Wang等[6]集成了轉(zhuǎn)錄調(diào)控和蛋白質(zhì)相互作用網(wǎng)絡(luò),認(rèn)為網(wǎng)絡(luò)集成后更接近于真實(shí)的生物網(wǎng)絡(luò)。Yeang[7]、Herrg?rd[8]和 Chandrasekaran[9]等通過(guò)集成調(diào)控與代謝網(wǎng)絡(luò),認(rèn)為集成網(wǎng)絡(luò)比單一網(wǎng)絡(luò)更能擬合生物的生長(zhǎng)狀態(tài)。Covert[10]和Lee[11]等整合了信號(hào)轉(zhuǎn)導(dǎo)、代謝和調(diào)控網(wǎng)絡(luò),發(fā)現(xiàn)多網(wǎng)絡(luò)的集成在表型預(yù)測(cè)時(shí)更加準(zhǔn)確。
谷氨酸棒狀桿菌是最重要的工業(yè)微生物之一,被廣泛應(yīng)用于氨基酸 (如谷氨酸、賴氨酸等)、維生素 (如泛酸等) 和核酸的工業(yè)化生產(chǎn)[12],所生產(chǎn)的產(chǎn)品總量達(dá)到每年數(shù)百萬(wàn)噸的規(guī)模。谷氨酸棒狀桿菌細(xì)胞結(jié)構(gòu)和調(diào)控關(guān)系相對(duì)簡(jiǎn)單,對(duì)于簡(jiǎn)單原料和復(fù)雜工業(yè)環(huán)境適應(yīng)性好,生長(zhǎng)快速,具有較好的分子改造基礎(chǔ),這些優(yōu)勢(shì)使得谷氨酸棒狀桿菌具備了作為一個(gè)通用優(yōu)秀細(xì)胞工廠的基礎(chǔ),研究者正在研究和改造棒桿菌生產(chǎn)有機(jī)酸、醇等大宗化學(xué)品[13]。日本學(xué)者 Okino等[14]通過(guò)改造谷氨酸棒狀桿菌生產(chǎn)丁二酸,其產(chǎn)品濃度和發(fā)酵速度都達(dá)到了世界領(lǐng)先的水平,成為棒桿菌細(xì)胞工廠改造的一個(gè)范例。對(duì)工業(yè)菌株的研究和改造離不開對(duì)其細(xì)胞網(wǎng)絡(luò)的了解和認(rèn)識(shí),谷氨酸棒狀桿菌的基因轉(zhuǎn)錄調(diào)控和代謝網(wǎng)絡(luò)也一直是人們關(guān)注的焦點(diǎn)。Ikeda等[15]和Kalinowski等[16]分別完成了谷氨酸棒狀桿菌 Corynebacterium glutamicum ATCC13032菌株的基因組測(cè)序,將谷氨酸棒狀桿菌的研究帶入了系統(tǒng)生物學(xué)新紀(jì)元。Kjeldsen等[17]和 Shinfuku等[18]利用基因組注釋數(shù)據(jù)庫(kù)分別構(gòu)建了含有約500個(gè)反應(yīng)的谷氨酸棒狀桿菌基因組規(guī)模代謝網(wǎng)絡(luò)。Brinkrolf等[19]通過(guò)對(duì)文獻(xiàn)報(bào)道數(shù)據(jù)的整理構(gòu)建了首個(gè)谷氨酸棒狀桿菌轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)。但是目前關(guān)于谷氨酸棒狀桿菌的研究大多只是針對(duì)單一網(wǎng)絡(luò),由于單一網(wǎng)絡(luò)突現(xiàn)的信息割裂的局限性,限制了棒桿菌的研究和開發(fā)利用,急需構(gòu)建基因組規(guī)模多網(wǎng)絡(luò)集成的細(xì)胞網(wǎng)絡(luò)。
本研究在前人工作的基礎(chǔ)上,系統(tǒng)整理和分析了谷氨酸棒狀桿菌的轉(zhuǎn)錄調(diào)控信息,對(duì)以往報(bào)道的代謝網(wǎng)絡(luò)進(jìn)行擴(kuò)展,并借鑒bow-tie模型[20]的分析方法對(duì)谷氨酸棒狀桿菌的代謝網(wǎng)絡(luò)進(jìn)行初步分析,最后以基因-酶-反應(yīng)關(guān)系為接口對(duì)轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)和代謝網(wǎng)絡(luò)進(jìn)行集成,為大規(guī)模的數(shù)據(jù)整合和模擬計(jì)算分析奠定了基礎(chǔ)。同時(shí)文中還以賴氨酸的生物合成為例提出一種從集成細(xì)胞網(wǎng)絡(luò)中提取代謝調(diào)控子網(wǎng)絡(luò)的新方法,希望從系統(tǒng)水平上能更好地理解氨基酸等產(chǎn)品的生物合成與調(diào)控機(jī)制,對(duì)工程菌株的定向設(shè)計(jì)改造提出指導(dǎo)性建議。
從谷氨酸棒狀桿菌調(diào)控網(wǎng)絡(luò)數(shù)據(jù)庫(kù)CoryneRegNet[21]5.0提取轉(zhuǎn)錄調(diào)控信息,并結(jié)合文獻(xiàn)[22-24]對(duì)數(shù)據(jù)補(bǔ)充和校正,去掉不確定的調(diào)控關(guān)系 sugR (cg2115)→ramA(cg2831) 和 uriR (cg1547)→rbsR (cg1410) (文獻(xiàn)報(bào)道中無(wú)此調(diào)控關(guān)系的結(jié)論)。用轉(zhuǎn)錄調(diào)控因子 (Transcription factors,TF) 的編碼基因來(lái)代替TF本身 (即所有節(jié)點(diǎn)均為基因),再根據(jù)基因的cg號(hào)進(jìn)行排序,用 VBA程序處理成可視化軟件 Cytoscape[25]和Pajek[26]可識(shí)別的文件格式。
我們借鑒Ma等[27]報(bào)道的分層思想對(duì)谷氨酸棒狀桿菌的TRN進(jìn)行分解,首先將出度為0的節(jié)點(diǎn)分配到網(wǎng)絡(luò)第一層;然后移除這些節(jié)點(diǎn),從剩余的節(jié)點(diǎn)中,將出度為0的節(jié)點(diǎn)分配到網(wǎng)絡(luò)的第二層;依次類推,直到把所有的節(jié)點(diǎn)分配到不同的層中。
1.3.1 數(shù)據(jù)采集
用Perl程序,從KEGG 數(shù)據(jù)庫(kù) (http://www. genome.jp/kegg/) 的 Ligand/reaction文件中提取反應(yīng)數(shù)據(jù),結(jié)合谷氨酸棒狀桿菌基因組注釋信息(cgb_enzyme和cgb_ko文件),并保留自發(fā)反應(yīng),便可生成谷氨酸棒狀桿菌GSMN的初始模型。
同時(shí),我們根據(jù)文獻(xiàn)數(shù)據(jù)[17-18]提供的化合物信息,用VBA程序從KEGG/Ligand/compound和glycan數(shù)據(jù)中搜索對(duì)應(yīng)的化合物編號(hào) (C number和G number),再由化合物編號(hào)從KEGG/Ligand/ reaction/reaction數(shù)據(jù)中搜索到相應(yīng)的反應(yīng)號(hào)(R number),然后從上述GSMN的初始模型中去掉與文獻(xiàn)數(shù)據(jù)中反應(yīng)號(hào)重疊的反應(yīng),但是保留先前反應(yīng)的反應(yīng)對(duì) (Reactant pairs,指底物與產(chǎn)物的對(duì)應(yīng)關(guān)系。例如,在反應(yīng)R00299:ATP+D-葡萄糖<=>ADP+D-葡萄糖 6-磷酸中,D-葡萄糖與D-葡萄糖6-磷酸就是一個(gè)反應(yīng)對(duì)) 的信息。例如文獻(xiàn)[18]中的反應(yīng):丙酮酸+CoA+NAD+=>乙酰-CoA+CO2+NADH+H+,我們通過(guò)VBA程序搜索后發(fā)現(xiàn)它與 KEGG中的反應(yīng) R00209:丙酮酸+CoA+NAD+<=>乙酰-CoA+CO2+NADH+H+基本匹配,但是KEGG中該反應(yīng)的可逆性與文獻(xiàn)中的不一致,鑒于文獻(xiàn)中的數(shù)據(jù)有計(jì)算模擬和實(shí)驗(yàn)的支持,而KEGG中的數(shù)據(jù)僅供參考,所以最終我們把反應(yīng) R00209定義為:丙酮酸+CoA+NAD+=>乙酰-CoA+CO2+NADH+H+,反應(yīng)對(duì)信息仍采用KEGG中R00209的反應(yīng)對(duì) (因?yàn)槲墨I(xiàn)中的反應(yīng)沒(méi)有反應(yīng)對(duì)的信息),即NAD+—NADH、CoA—乙酰-CoA、丙酮酸—乙酰-CoA和丙酮酸—CO2。最后,通過(guò)將 KEGG數(shù)據(jù)和文獻(xiàn)代謝網(wǎng)絡(luò)數(shù)據(jù)相整合,生成谷氨酸棒狀桿菌GSMN模型。
1.3.2 反應(yīng)方向的重新定義
反應(yīng)的方向?qū)τ谏锞W(wǎng)絡(luò)構(gòu)建非常重要,但是 KEGG中很多反應(yīng)的方向并不可靠或沒(méi)有定義,對(duì)此我們主要以文獻(xiàn)報(bào)道數(shù)據(jù)中的反應(yīng)方向?yàn)橹?,其余的采用Ma等[28]總結(jié)的11條規(guī)則重新定義。
1.3.3 反應(yīng)對(duì)的拆分
KEGG中的很多反應(yīng)并未給出反應(yīng)對(duì)信息,我們根據(jù)KEGG對(duì)已有反應(yīng)對(duì)的拆分規(guī)律RDM (Reaction center, R; Difference region, D; Matched region, M) 模式[29]對(duì)信息不全的反應(yīng)進(jìn)行拆分。
1.3.4 特殊反應(yīng)對(duì)的刪除
在GSMN中某些化合物出現(xiàn)的頻率很高,被稱為通用代謝物 (Currency metabolites),如ATP、ADP、NADH、H2O、Pi等,它們通常攜帶一些供轉(zhuǎn)移的小分子化學(xué)基團(tuán) (如磷酸基、氨基、一碳單位、甲基等)[28]。這些通用代謝物所連接的一些特殊反應(yīng)對(duì)必須去掉,否則整個(gè)網(wǎng)絡(luò)的路徑將會(huì)縮短,不利于后期拓?fù)浣Y(jié)構(gòu)的分析,而且與實(shí)際的生物學(xué)意義不符 (如 R00258:L-丙氨酸+2-酮戊二酸<=>丙酮酸+L-谷氨酸中的反應(yīng)對(duì) L-丙氨酸—L-谷氨酸和 2-酮戊二酸—丙酮酸應(yīng)該去掉,僅保留L-丙氨酸—丙酮酸和2-酮戊二酸—L-谷氨酸)。
為了降低網(wǎng)絡(luò)復(fù)雜度,谷氨酸棒狀桿菌的GSMN中節(jié)點(diǎn)均為代謝物。文中綜合Zhao等[30]和Ma等[20]對(duì)代謝網(wǎng)絡(luò)的分解方法,首先借助軟件 Pajek求出最大強(qiáng)連通體 (Giant strong component,GSC),然后收縮GSC為單節(jié)點(diǎn),再分別求出 GSC的輸入域 (S) 和輸出域 (P),剩余的節(jié)點(diǎn)歸為孤立子集 (Isolated subset,IS) (同一個(gè)代謝物在細(xì)胞不同部位出現(xiàn)時(shí),分別賦予不同的 ID,例如細(xì)胞膜上和細(xì)胞內(nèi)同一代謝物的ID不同)。
以基因→酶的關(guān)系為接口可以將轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò) (調(diào)節(jié)子→靶基因) 和代謝網(wǎng)絡(luò) (底物→反應(yīng)→產(chǎn)物;酶→反應(yīng)) 整合起來(lái),形成調(diào)節(jié)子→靶基因→酶→反應(yīng)和底物→反應(yīng)→產(chǎn)物的集成細(xì)胞網(wǎng)絡(luò)模型 (Integrated cellular network,ICN)。
1) 在 ICN 數(shù)據(jù)中用酶的編碼基因?qū)⒚柑鎿Q,然后求葡萄糖的輸出域,從生成的子網(wǎng)絡(luò)中提取賴氨酸的輸入域得到節(jié)點(diǎn)集A。
2) 將A收縮為單節(jié)點(diǎn) (借鑒Zhao等[30]的方法),并求其 K輸入節(jié)點(diǎn)集 (在有向圖中,如果某節(jié)點(diǎn)j在K步之內(nèi)可以到達(dá)節(jié)點(diǎn)i,那么這些節(jié)點(diǎn)j組成的集合就是節(jié)點(diǎn)i的K輸入節(jié)點(diǎn)集),并從中去掉表示代謝物的節(jié)點(diǎn),僅保留基因節(jié)點(diǎn),組成Genes節(jié)點(diǎn)集合。
3) 將 Genes收縮為單節(jié)點(diǎn),從其輸出域中去掉節(jié)點(diǎn)集A,得到節(jié)點(diǎn)集B。
4) 求A的1近鄰輸入節(jié)點(diǎn)集K1,并從K1中提取僅是A的輸入不是B的輸入節(jié)點(diǎn)集記為K11;K11中調(diào)控關(guān)系已明確的節(jié)點(diǎn)集記為C,反之記為H;K1中既是A的輸入又是B的輸入的節(jié)點(diǎn)集記為K12;K12中調(diào)節(jié)基因已明確的節(jié)點(diǎn)集記為F,反之記為G。
5) 求A的2近鄰輸入節(jié)點(diǎn)集K2 (調(diào)節(jié)子);從K2中提取既調(diào)控F又調(diào)控C的基因集記為E,僅調(diào)控C的記為D。
以上步驟的分析均是借助Pajek軟件和作者自己編寫的VBA程序?qū)崿F(xiàn)的。
2.1.1 TRN的功能模塊分析
我們最終構(gòu)建的谷氨酸棒狀桿菌TRN含有660個(gè)基因,基于基因功能的生物學(xué)意義可以將其劃分為5大功能模塊[19]:A (碳水化合物代謝),B (細(xì)胞分裂與分隔),C (常量元素與金屬離子的體內(nèi)平衡),D (SOS應(yīng)激反應(yīng)),E (特殊的生物合成與運(yùn)輸途徑) (圖1)。
圖1 谷氨酸棒狀桿菌TRN分解Fig. 1 The decomposition of TRN of Corynebacterium glutamicum. (A) Carbohydrate metabolism. (B) Cell division and septation. (C) Macroelement and metal homeostasis. (D) SOS and stress response. (E) Specific biosynthesis and transport pathways.
模塊 A中的調(diào)控關(guān)系最為復(fù)雜 (212個(gè)基因),它控制著谷氨酸棒狀桿菌的中心代謝。其中sugR、glxR、ramA、ramB和sigB還具有跨模塊調(diào)節(jié)的作用,如全局調(diào)節(jié)子 glxR可以直接調(diào)控以上5個(gè)模塊中的基因。此外,位于模塊C的dtxR調(diào)節(jié)子還調(diào)控模塊A和模塊D中的基因。模塊E中的ArgR通過(guò)阻遏轉(zhuǎn)氨酶的轉(zhuǎn)錄從而調(diào)控精氨酸代謝,同時(shí)抑制谷氨酸脫氫酶的轉(zhuǎn)錄進(jìn)而影響谷氨酸轉(zhuǎn)化和NADP的體內(nèi)平衡。模塊B中未發(fā)現(xiàn)轉(zhuǎn)錄調(diào)節(jié)子,基因均受到來(lái)自其他模塊調(diào)節(jié)子的調(diào)控,如細(xì)胞分裂蛋白基因ftsK的轉(zhuǎn)錄要受到阻遏蛋白LexA (模塊D) 的抑制。
2.1.2 全局調(diào)節(jié)子的重新定義
在細(xì)胞網(wǎng)絡(luò)中,某些調(diào)節(jié)子可調(diào)控20個(gè)以上屬于不同轉(zhuǎn)錄單元的并且從屬于多個(gè)功能模塊的靶基因,被稱為全局調(diào)節(jié)子[31-32]。Brinkrolf等[22]通過(guò)搜索調(diào)節(jié)子直接調(diào)控的靶基因和功能模塊的數(shù)量,認(rèn)為在谷氨酸棒狀桿菌TRN中只存在一個(gè)全局調(diào)節(jié)子glxR (cg0350)。而事實(shí)上,有些調(diào)節(jié)子的靶基因同樣也是調(diào)節(jié)基因。因此,我們引入調(diào)節(jié)子的輸出域 (Output domain) 來(lái)替換其出度 (Out-degree) 重新分析,并用自己編寫的VBA程序廣度搜索了調(diào)節(jié)子直接和間接調(diào)控的總模塊數(shù)(表1)。
表1 谷氨酸棒狀桿菌調(diào)節(jié)子調(diào)控的目標(biāo)基因與模塊的統(tǒng)計(jì)分析Table 1 Statistic analysis of target genes and modules which are regulated by regulons in Corynebacterium glutamicum
結(jié)果我們發(fā)現(xiàn)了8個(gè)調(diào)節(jié)子調(diào)控影響范圍廣泛 (直接和間接調(diào)控的目的基因總數(shù)不少于20,調(diào)控模塊總數(shù)不少于 4),可以認(rèn)定為全局調(diào)節(jié)子:glxR (cg0350),lexA (cg2114),ramA (cg2831),ramB (cg0444),sigH (cg0876),sugR (cg2115),rel (cg1861) 和dtxR (cg2103)。雖然有些調(diào)節(jié)子直接調(diào)控的功能模塊并不多,但是它們還可以通過(guò)調(diào)控其他調(diào)節(jié)子間接調(diào)控一些模塊。如 rel (cg1861) 通過(guò)調(diào)控調(diào)節(jié)子sigH (cg0876) 實(shí)現(xiàn)對(duì)cg2810 (Na+/H+泵轉(zhuǎn)運(yùn)系統(tǒng),模塊C) 的間接調(diào)控。這8個(gè)全局調(diào)節(jié)子共調(diào)控387個(gè)基因,調(diào)控范圍覆蓋了整個(gè)TRN的59%。
2.1.3 TRN的分層分解
借助網(wǎng)絡(luò)分析軟件Pajek我們發(fā)現(xiàn)谷氨酸棒狀桿菌TRN中無(wú)強(qiáng)連通體存在,這與枯草芽胞桿菌[33]和大腸桿菌[5]有所不同,說(shuō)明在 TRN中無(wú)反饋環(huán) (基因A調(diào)控基因B,基因B也直接或間接調(diào)控基因A) 的存在,因此可以對(duì)TRN按層次分解,如圖2所示。
其中底層的基因最多 (572個(gè)),其次為第2層 (68個(gè))。分層后可以清楚地看到,rel (cg1861)和dtxR (cg2103) 分別位于頂層和第4層,是重要的全局調(diào)節(jié)子。并且基因之間的調(diào)控關(guān)系還可以跨層實(shí)現(xiàn),如rel (cg1861) 調(diào)節(jié)子對(duì)底層基因cg0877 (rshA) 的調(diào)控不僅可以通過(guò)sigH間接實(shí)現(xiàn),還能直接完成,這可以很好地解釋谷氨酸棒狀桿菌TRN的平均路徑長(zhǎng)度只有1.27,即存在調(diào)控捷徑。
2.2.1 GSMN模型
經(jīng)過(guò)對(duì)公共數(shù)據(jù)庫(kù)和文獻(xiàn)數(shù)據(jù)的收集和處理,我們最終構(gòu)建的GSMN模型含有1 384個(gè)生化反應(yīng) (其中978個(gè)為不可逆反應(yīng),406個(gè)可逆反應(yīng)) 和1 276個(gè)代謝物,如圖3A所示。去除經(jīng)過(guò)通用代謝物的連接后,連接數(shù)由原來(lái)的3 783縮減為2 803,網(wǎng)絡(luò)直徑和平均路徑[28]分別由原來(lái)的17和4.74變成了32和9.66,網(wǎng)絡(luò)明顯得到了簡(jiǎn)化,如圖3B所示。
圖2 谷氨酸棒狀桿菌TRN的分層結(jié)構(gòu)Fig. 2 The hierarchical structure of TRN of Corynebacterium glutamicum.
圖3 谷氨酸棒狀桿菌GSMN模型. (A) 含有經(jīng)過(guò)通用代謝物連接的GSMN. (B) 不含經(jīng)過(guò)通用代謝物連接的GSMNFig. 3 The GSMN model of Corynebacterium glutamicum. All the nodes represent metabolites. (A) GSMN including the connections through currency metabolites. (B) GSMN not including the connections through currency metabolites. The red lines with arrows correspond to irreversible reactions and the blue lines without arrows to reversible reactions.
2.2.2 Bow-tie結(jié)構(gòu)
經(jīng)過(guò)分析,我們發(fā)現(xiàn)谷氨酸棒狀桿菌的基因組規(guī)模代謝網(wǎng)絡(luò)GSMN共102個(gè)強(qiáng)連通體 (節(jié)點(diǎn)數(shù)≥2),其中最大的強(qiáng)連通體GSC包含456個(gè)代謝物,占整個(gè)代謝網(wǎng)絡(luò)的36% (圖4)。GSC的平均路徑為9.08,而整個(gè)網(wǎng)絡(luò)的平均路徑為9.66,這說(shuō)明與網(wǎng)絡(luò)中的其他模塊相比GSC中節(jié)點(diǎn)之間的聯(lián)系更加緊密。按照KEGG對(duì)代謝反應(yīng)的類別劃分,我們將GSC分解成10大功能模塊(圖5)。結(jié)果顯示GSC幾乎覆蓋了所有的代謝功能,是整個(gè)代謝網(wǎng)絡(luò)的核心,并且模塊之間并非獨(dú)立存在,而是通過(guò)“代理”(Broker)[27]或橋(Bridges)[34](表2) 相互聯(lián)系。
圖4 谷氨酸棒狀桿菌GSMN的bow-tie結(jié)構(gòu)Fig. 4 The bow-tie structure of GSMN for Corynebacterium glutamicum. GSC: giant strong component; S: substrate subset; P: product subset; IS: isolated subset.
圖5 GSC的分解Fig. 5 The decomposition of GSC. A: amino acid metabolism; C: carbohydrate metabolism; E: energy metabolism; Ts: membrane transport or signal transduction; Gc: glycan biosynthesis and metabolism; Ge: genetic information processing; L: lipid metabolism; Nu: nucleotide metabolism; Pk: metabolism of terpenoids and polyketides; Vt: metabolism of cofactors and vitamins.
2.2.3 GSC的中心性分析
緊密度中心性 (Closeness centrality,CC)[27]和介數(shù)中心性 (Betweenness centrality,BC)[35-36]是用來(lái)衡量節(jié)點(diǎn)地位的重要參數(shù),值越大節(jié)點(diǎn)就越重要,后者也常用來(lái)尋找網(wǎng)絡(luò)的“代理”[27]或橋[34]以及分解網(wǎng)絡(luò)[37]。經(jīng)過(guò)計(jì)算分析,我們找到了 29個(gè)中心代謝物 (Central metabolites)[20](表2)。
很多化合物不僅僅參與了一個(gè)功能模塊中的反應(yīng),如丙酮酸 (Pyruvate) 不僅是糖酵解和TCA的樞紐,而且連接著碳水化合物代謝和氨基酸代謝,并通過(guò)反應(yīng)R05553 (4-氨基-4脫氧分支酸<=>4-氨基苯甲酸+丙酮酸) 參與葉酸鹽的生物合成。乙酰-CoA (Acetyl-CoA) 是網(wǎng)絡(luò)的輸出中心,連接著糖酵解、TCA、肽聚糖生物合成和脂類代謝以及氨基酸代謝。草酰乙酸(Oxaloacetate) 是TCA中重要的代謝物,同時(shí)經(jīng)反應(yīng) R00355 (草酰乙酸+L-谷氨酸<=>L-天冬氨酸+α-酮戊二酸) 使碳水化合物代謝與氨基酸代謝連接起來(lái)。
我們以基因、酶、反應(yīng)和代謝物為節(jié)點(diǎn),相互作用關(guān)系為弧 (邊),去除通用代謝物參與的特殊反應(yīng)對(duì)以及文獻(xiàn)和數(shù)據(jù)庫(kù)之間的冗余部分,最終所構(gòu)建的谷氨酸棒狀桿菌集成細(xì)胞網(wǎng)絡(luò)包括1 050個(gè)基因,785個(gè)酶,1 384個(gè)反應(yīng),1 276個(gè)代謝物,88個(gè)調(diào)節(jié)子,999對(duì)轉(zhuǎn)錄調(diào)控關(guān)系(圖6)。
表2 GSC網(wǎng)絡(luò)中中心性最大的幾種中心代謝物Table 2 The top central metabolites with higher centrality in GSC
圖6 谷氨酸棒狀桿菌集成細(xì)胞網(wǎng)絡(luò)Fig. 6 The integrated cellular network of Corynebacterium glutamicum. pink cirle: gene; blue triangle: enzyme; green diamond: metabolite; green yellow square: reaction; →activationrepression.
利用Pajek軟件從構(gòu)建的集成細(xì)胞網(wǎng)絡(luò)中,我們找到了 8個(gè)基于轉(zhuǎn)錄與代謝調(diào)控的反饋環(huán)路。例如,dtxR編碼的轉(zhuǎn)錄因子DtxR可以抑制基因hrrA (對(duì)hmuO的轉(zhuǎn)錄有激活作用) 和hmuO的轉(zhuǎn)錄,hmuO編碼的血紅素氧化酶 (Heme oxygenase,HmuO) 可以催化亞鐵血紅素 Heme生成鐵離子,而鐵離子又是DtxR發(fā)揮作用時(shí)必需的輔因子,這樣就構(gòu)成了一個(gè)反饋環(huán)路,如圖7A所示。該反饋回路對(duì)于維持 Heme的體內(nèi)平衡[38]和鐵代謝[39]具有重要意義。此外,在天冬氨酸家族 (如甲硫氨酸[40-42]) 和一些芳香族氨基酸的生物合成中也同樣存在轉(zhuǎn)錄與代謝協(xié)同作用的復(fù)雜調(diào)控關(guān)系。例如,在色氨酸的合成中,幾個(gè)關(guān)鍵酶 ANS (Anthranilate synthase)、PRT (Anthranilate phosphoribosyltransferase) 和 TS (Tryptophan synthase) 除了受終產(chǎn)物色氨酸的反饋抑制外,其編碼基因的轉(zhuǎn)錄還受到色氨酸的衰減作用 (Attenuation) 的控制[43],如圖7B所示。這些發(fā)生在細(xì)胞內(nèi)的轉(zhuǎn)錄與代謝雙層次復(fù)合調(diào)控關(guān)系在單一的代謝網(wǎng)絡(luò)[17-18]或轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)[19]中是無(wú)法體現(xiàn)的。
分別以葡萄糖為底物約束和賴氨酸為產(chǎn)物約束,從集成細(xì)胞網(wǎng)絡(luò)中提取了賴氨酸生物合成的代謝調(diào)控子網(wǎng)絡(luò) (圖8)。它涉及的代謝功能模塊有氨基酸代謝、碳水化合物代謝、能量代謝、膜運(yùn)輸與信號(hào)轉(zhuǎn)導(dǎo)、多糖合成與代謝、遺傳信息處理、脂類代謝、核酸代謝、萜類與聚酮代謝以及輔因子與維生素代謝,而傳統(tǒng)的賴氨酸合成途徑[44]僅包括糖酵解、TCA以及賴氨酸、蘇氨酸等氨基酸合成途徑。
圖7 谷氨酸棒狀桿菌中的復(fù)合調(diào)控回路. (A) 血紅素鐵代謝的轉(zhuǎn)錄與代謝調(diào)控反饋環(huán). (B) 色氨酸的生物合成與調(diào)控Fig. 7 Complex regulation loop in Corynebacterium glutamicum. (A) A feedback loop for transcriptional and metabolic regulation of Heme iron. (B) The biosynthetic pathway of tryptophan and its regulation. DS: 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase; blue ellipse: gene; green box: corresponding protein; →activation; ━┫repression. The dotted lines indicate feedback inhibition.
圖8 賴氨酸生物合成代謝調(diào)控子網(wǎng)絡(luò)Fig. 8 The metabolic and regulatory sub-network for lysine biosynthesis. (A) Lysine biosynthesis. (B) Other biosynthesis. C, F, G and H represent enzyme-coding genes. D and E represent regulons. Circle: gene; diamond: metabolite; square: reaction; arrow: the direction of material interaction.
模塊C中的基因可以編碼催化模塊A中代謝反應(yīng)的酶,同時(shí)受到模塊D和模塊E的調(diào)控。模塊F和模塊G中的基因所編碼的酶不僅可以催化賴氨酸生物合成,還可以催化模塊 B中的反應(yīng),例如pfkA (cg1409) 編碼的磷酸果糖激酶既是中心代謝途徑的重要限速酶 (R00756,模塊 A),也是塔格糖酵解的重要酶 (R03236,模塊B),同時(shí)受到全局調(diào)節(jié)子glxR和sugR以及sigB (σ因子) 的調(diào)控 (模塊 E)。rel (cg1861,PPGPP合成酶,模塊 E) 不僅可以編碼催化R00336 (模塊A)和R00429 (模塊B)的酶,而且還是全局調(diào)節(jié)子。此外,模塊F中的基因受到模塊E中調(diào)節(jié)子的調(diào)控,而模塊G和模塊H所對(duì)應(yīng)的調(diào)節(jié)基因,目前為止尚不清楚。
關(guān)于谷氨酸棒狀桿菌轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)和代謝網(wǎng)絡(luò)的研究已有相關(guān)文獻(xiàn)介紹,但是對(duì)于集成細(xì)胞網(wǎng)絡(luò)的分析尚未發(fā)現(xiàn)有人報(bào)道。文中從網(wǎng)絡(luò)數(shù)據(jù)庫(kù)和文獻(xiàn)信息提取數(shù)據(jù),成功構(gòu)建了谷氨酸棒狀桿菌的集成細(xì)胞網(wǎng)絡(luò)模型,網(wǎng)絡(luò)涉及1 384個(gè)生化反應(yīng)和999對(duì)調(diào)控關(guān)系。通過(guò)后續(xù)的網(wǎng)絡(luò)分析,發(fā)現(xiàn)了一些在單一網(wǎng)絡(luò)中很難體現(xiàn)的轉(zhuǎn)錄與代謝雙層次協(xié)同作用的復(fù)合調(diào)控關(guān)系,這為重新設(shè)計(jì)和優(yōu)化改造谷氨酸棒狀桿菌,發(fā)展新型細(xì)胞工廠奠定了基礎(chǔ)。
通過(guò)對(duì)基因轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的分析,我們重新定義了8個(gè)全局調(diào)節(jié)子,其調(diào)控范圍覆蓋整個(gè)轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的59%。轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)可分為5層,并且有調(diào)控捷徑的存在,這可能有利于生物體提高自身對(duì)環(huán)境變化的適應(yīng)能力。
我們?cè)诠劝彼岚魻顥U菌的代謝網(wǎng)絡(luò)中找到了和大腸桿菌類似的bow-tie結(jié)構(gòu),其中GSC的強(qiáng)連通性可能有利于提高生物體的魯棒性(Robustness)。通過(guò)對(duì)GSC的進(jìn)一步分析,我們找到了 29個(gè)中心代謝物,它們像橋梁一樣將一個(gè)個(gè)分開的反應(yīng)模塊緊密地連接在一起,對(duì)于微生物而言,這種結(jié)構(gòu)可能有利于節(jié)省空間和資源,使生物代謝更加經(jīng)濟(jì)高效。
最后,基于集成細(xì)胞網(wǎng)絡(luò)我們提出了一種代謝調(diào)控子網(wǎng)絡(luò)的提取方法,與傳統(tǒng)意義上的代謝途徑相比,前者的代謝反應(yīng)更加全面,物質(zhì)間相互作用關(guān)系也更為復(fù)雜。應(yīng)用這種提取方法,我們研究了從葡萄糖合成賴氨酸的代謝調(diào)控子網(wǎng)絡(luò),發(fā)現(xiàn)在這個(gè)復(fù)雜的子網(wǎng)絡(luò)中,有些基因不僅編碼賴氨酸合成代謝途徑中的酶,同時(shí)還是其他代謝反應(yīng)的酶編碼基因 (如 cg1280 (odhA) 和cg1409 (pfkA)),更有甚者,如rel不僅編碼賴氨酸合成途徑中涉及的酶,同時(shí)還是全局調(diào)節(jié)子。這一結(jié)果告訴我們,在運(yùn)用基因工程手段對(duì)菌株進(jìn)行定向改造時(shí),應(yīng)該從系統(tǒng)生物學(xué)角度出發(fā),通盤考慮轉(zhuǎn)錄調(diào)控和代謝反應(yīng),否則某些基因的改變可能會(huì)導(dǎo)致細(xì)胞整體代謝反應(yīng)失去平衡,整個(gè)細(xì)胞生理機(jī)能發(fā)生改變。
本研究的工作,僅僅是谷氨酸棒狀桿菌系統(tǒng)生物學(xué)工作的開始。在本研究提出的集成細(xì)胞網(wǎng)絡(luò)的基礎(chǔ)上,能夠集成更多的實(shí)驗(yàn)數(shù)據(jù),包括轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組、通量組數(shù)據(jù),對(duì)發(fā)酵過(guò)程的動(dòng)態(tài)數(shù)據(jù)進(jìn)行全面地整合分析,將發(fā)現(xiàn)更多的代謝調(diào)控機(jī)制,進(jìn)一步完善集成型細(xì)胞網(wǎng)絡(luò)模型。同時(shí),發(fā)展整合細(xì)胞網(wǎng)絡(luò)的模擬計(jì)算方法,從代謝和調(diào)控的全局開發(fā)新型細(xì)胞工廠設(shè)計(jì)方法,提出最佳基因組改造策略,有可能大幅度改進(jìn)谷氨酸棒狀桿菌的性能,為新型生物制造產(chǎn)業(yè)的發(fā)展貢獻(xiàn)力量。致謝 感謝英國(guó)愛(ài)丁堡大學(xué)馬紅武博士的修改意見。
[1] Kitano H. Systems biology: a brief overview. Science, 2002, 295(5560): 1662?1664.
[2] Kim TY, Kim HU, Lee SY. Data integration and analysis of biological networks. Curr Opin Biotechnol, 2010, 21(1): 78?84.
[3] Sik KJ, Yun H, Kim HU, et al. Resources for systems biology research. J Microbiol Biotechnol, 2006, 16(6): 832?848.
[4] Ma HW, Buer J, Zeng AP. Hierarchical structure and modules in the Escherichia coli transcriptional regulatory network revealed by a new top-down approach. BMC Bioinformatics, 2004, 5: 199.
[5] Ma HW, Kumar B, Ditges U, et al. An extended transcriptional regulatory network of Escherichia coli and analysis of its hierarchical structure and network motifs. Nucl Acids Res, 2004, 32(22): 6643?6649.
[6] Wang YC, Chen BS. Integrated cellular network of transcription regulations and protein-protein interactions. BMC Syst Biol, 2010, 4: 20.
[7] Yeang CH, Vingron M. A joint model of regulatory and metabolic networks. BMC Bioinformatics, 2006, 7: 332.
[8] Herrg?rd MJ, Lee BS, Portnoy V, et al. Integrated analysis of regulatory and metabolic networks reveals novel regulatory mechanisms in Saccharomyces cerevisiae. Genome Res, 2006, 16(5): 627?635.
[9] Chandrasekaran S, Price ND. Probabilistic integrative modeling of genome-scale metabolic and regulatory networks in Escherichia coli and Mycobacterium tuberculosis. Proc Natl Acad Sci USA, 2010, 107(41): 17845?17850.
[10] Covert MW, Xiao N, Chen TJ, et al. Integrating metabolic, transcriptional regulatory and signal transduction models in Escherichia coli. Bioinformatics, 2008, 24(18): 2044?2050.
[11] Lee JM, Gianchandani EP, Eddy JA, et al. Dynamic analysis of integrated signaling, metabolic, and regulatory networks. PLoS Comput Biol, 2008, 4(5): e1000086.
[12] Eggeling L, Bott M. Handbook of Corynebacterium glutamicum. Boca Raton: CRC Press, 2005: 1?616.
[13] Wendisch VF, Bott M, Eikmanns BJ. Metabolic engineering of Escherichia coli and Corynebacterium glutamicum for biotechnological production of organic acids and amino acids. Curr Opin Microbiol, 2006, 9(3): 268?274.
[14] Okino S, Noburyu R, Suda M, et al. An efficient succinic acid production process in a metabolically engineered Corynebacterium glutamicum strain. Appl Microbiol Biotechnol, 2008, 81(3): 459?464. [15] Ikeda M, Nakagawa S. The Corynebacterium glutamicum genome: features and impacts on biotechnological processes. Appl Microbiol Biotechnol, 2003, 62(2/3): 99?109.
[16] Kalinowski J, Bathe B, Bartels D, et al. The complete Corynebacterium glutamicum ATCC 13032 genome sequence and its impact on the production of L-aspartate-derived amino acids and vitamins. J Biotechnol, 2003, 104(1/3): 5?25.
[17] Kjeldsen KR, Nielsen J. In silico genome-scale reconstruction and validation of the Corynebacterium glutamicum metabolic network. Biotechnol Bioeng, 2009, 102(2): 583?597.
[18] Shinfuku Y, Sorpitiporn N, Sono M, et al. Development and experimental verification of a genome-scale metabolic model for Corynebacterium glutamicum. Microb Cell Fact, 2009, 8: 43.
[19] Brinkrolf K, Brune I, Tauch A. The transcriptional regulatory network of the amino acid producer Corynebacterium glutamicum. J Biotechnol, 2007, 129(2): 191?211.
[20] Ma HW, Zeng AP. The connectivity structure, giant strong component and centrality of metabolic networks. Bioinformatics, 2003, 19(11): 1423?1430.
[21] Baumbach J, Wittkop T, Kleindt CK, et al. Integrated analysis and reconstruction of microbial transcriptional gene regulatory networks using CoryneRegNet. Nat Protoc, 2009, 4(6): 992?1005. [22] Brinkrolf K, Schr?der J, Pühler A, et al. The transcriptional regulatory repertoire of Corynebacterium glutamicum: reconstruction of the network controlling pathways involved in lysine and glutamate production. J Biotechnol, 2010, 149(3): 173?182.
[23] Nentwich SS, Brinkrolf K, Gaigalat L, et al. Characterization of the LacI-type transcriptional repressor RbsR controlling ribose transport in Corynebacterium glutamicum ATCC 13032. Microbiology, 2009, 155(1): 150?164.
[24] Engels V, Lindner SN, Wendisch VF. The global repressor SugR controls expression of genes of glycolysis and of the L-Lactate dehydrogenase LdhA in Corynebacterium glutamicum. J Bacteriol, 2008, 190(24): 8033?8044.
[25] Cline MS, Smoot M, Cerami E, et al. Integration of biological networks and gene expression data using Cytoscape. Nat Protoc, 2007, 2(10): 2366?2382.
[26] Batagelj V, Mrvar A. Pajek-analysis and visualization of large networks//Jünger M, Mutzel P. Graph Drawing Software. Berlin: Springer, 2003: 77?103.
[27] Ma HW, Silva MR, Sun JB, et al. Reconstruction and structural analysis of metabolic and regulatory networks//Choi S. Introduction to Systems Biology. New Jersey: Humana Press, 2007: 124?146.
[28] Ma HW, Zeng AP. Reconstruction of metabolic networks from genome data and analysis of their global structure for various organisms. Bioinformatics, 2003, 19(2): 270-277.
[29] Kotera M, Okuno Y, Hattori M, et al. Computational assignment of the EC numbers for genomic-scale analysis of enzymatic reactions. J Am Chem Soc, 2004, 126(50): 16487?16498.
[30] Zhao J, Tao L, Yu H, et al. Bow-tie topological features of metabolic networks and the functional significance. Chin Sci Bull, 2007, 52(8): 1036?1045.
[31] Rodionov DA. Comparative genomic reconstruction of transcriptional regulatory networks in bacteria. Chem Rev, 2007, 107(8): 3467?3497.
[32] Moreno-Campuzano S, Janga SC, Pérez-Rueda E. Identification and analysis of DNA-binding transcription factors in Bacillus subtilis and other Firmicutes-a genomic approach. BMC Genomics, 2006, 7: 147.
[33] Liu Y, Zhao XM, Ma HW. The structure and decomposition of the transcriptional regulatory network of Bacillus subtilis. Chin J Bioprocess Eng, 2007, 5(3): 58?63.劉楊, 趙學(xué)明, 馬紅武. 枯草芽孢桿菌轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的連接結(jié)構(gòu)及分解. 生物加工過(guò)程, 2007, 5(3): 58?63.
[34] Pinney JW, Westhead DR. Betweenness-based decomposition methods for social and biological networks. In: Barber S, Baxter PD, Mardia KV, et al. Interdisciplinary Statistics and Bioinformatics. Leeds, UK: Leeds University Press, 2006: 87?90. [35] Freeman LC. A set of measures of centrality based on betweenness. Sociometry, 1977, 40(1): 35?41. [36] Brandes U. A faster algorithm for betweenness centrality. J Math Sociol, 2001, 25(2): 163?177.
[37] Holme P, Huss M, Jeong H. Subnetwork hierarchies of biochemical pathways. Bioinformatics, 2003, 19(4): 532?538.
[38] Frunzke J, G?tgens C, Brocker M, et al. Control of heme homeostasis in Corynebacterium glutamicum by the two-component system HrrSA. J Bacteriol, 2011, 193(5): 1212?1221.
[39] Brune I, Werner H, Hüser AT, et al. The DtxR protein acting as dual transcriptional regulator directs a global regulatory network involved in iron metabolism of Corynebacterium glutamicum. BMC Genomics, 2006, 7: 21.
[40] Rey DA, Pühler A, Kalinowski J. The putative transcriptional repressor McbR, member of the TetR-family, is involved in the regulation of the metabolic network directing the synthesis of sulfur containing amino acids in Corynebacterium glutamicum. J Biotechnol, 2003, 103(1): 51?65.
[41] Rey DA, Nentwich SS, Koch DJ, et al. The McbR repressor modulated by the effector substance S-adenosylhomocysteine controls directly the transcription of a regulon involved in sulphur metabolism of Corynebacterium glutamicum ATCC 13032. Mol Microbiol, 2005, 56(4): 871?887.
[42] Kr?mer JO, Heinzle E, Schr?der H, et al. Accumulation of homolanthionine and activation of a novel pathway for isoleucine biosynthesis in Corynebacterium glutamicum McbR deletion strains. J Bacteriol, 2006, 188(2): 609?618.
[43] Ikeda M. Towards bacterial strains overproducing L-tryptophan and other aromatics by metabolic engineering. Appl Microbiol Biotechnol, 2006, 69(6): 615?626.
[44] Wittmann C. Analysis and engineering of metabolic pathway fluxes in Corynebacterium glutamicum. Adv Biochem Eng Biotechnol, 2010, 120: 21?49.