劉立明,陳堅(jiān)
江南大學(xué) 食品科學(xué)與技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,無(wú)錫 214122
代謝工程
基因組規(guī)模代謝網(wǎng)絡(luò)模型構(gòu)建及其應(yīng)用
劉立明,陳堅(jiān)
江南大學(xué) 食品科學(xué)與技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,無(wú)錫 214122
微生物制造產(chǎn)業(yè)的發(fā)展迫切需要進(jìn)一步提高認(rèn)識(shí)、設(shè)計(jì)和改造微生物細(xì)胞代謝的能力,以推動(dòng)工業(yè)生物技術(shù)快速發(fā)展。隨著微生物全基因組序列等高通量數(shù)據(jù)的不斷積聚和生物信息學(xué)策略的持續(xù)涌現(xiàn),使全局性、系統(tǒng)化地解析、設(shè)計(jì)、調(diào)控微生物生理代謝功能成為可能。而基于基因組序列注釋和詳細(xì)生化信息整合的基因組規(guī)模代謝網(wǎng)絡(luò)模型 (GSMM) 構(gòu)建為全局理解和理性調(diào)控微生物生理代謝功能提供了最佳平臺(tái)。以下在詳述GSMM的應(yīng)用基礎(chǔ)上,描述了如何構(gòu)建一個(gè)高精確度的GSMM,并展望了未來(lái)的發(fā)展方向。
基因組規(guī)模代謝網(wǎng)絡(luò),微生物制造,構(gòu)建,應(yīng)用
Abstract:The exploitation of microbial manufacture process (MMP) in industrial biotechnology requires a comprehensive understanding and an efficient modification of microorganism physiology. The availability of genome sequences and accumulation of-omics data allow us to understand of microbial physiology at the systems level, and genome-scale metabolic model (GSMM)represents a valuable framework for integrative analysis of metabolism of microorganisms. Genome scale metabolic models are reconstructed based on a combination of genome sequence and the more detailed biochemical knowledge, and these reconstructed models can be used for analyzing and simulating the operation of metabolism in response to different perturbations. Here we describe the reconstruction protocols for GSMM in further detail and provide the perspective of GSMM.
Keywords:genome scale metabolic model, microbial manufacture process, reconstruction, application
面對(duì)石油等不可再生的化石資源嚴(yán)重短缺并日漸枯竭,以及化學(xué)加工對(duì)環(huán)境污染日益加深的現(xiàn)實(shí),世界經(jīng)濟(jì)發(fā)展模式逐漸從不計(jì)消耗、犧牲環(huán)境的化石經(jīng)濟(jì)模式轉(zhuǎn)向以可再生的碳水化合物為原料、利用生物細(xì)胞或酶的生物催化功能進(jìn)行大規(guī)模物質(zhì)加工與轉(zhuǎn)化的生物經(jīng)濟(jì)模式,從而在源頭上解決資源短缺與環(huán)境污染問(wèn)題[1]。生物經(jīng)濟(jì)的重要支柱之一是微生物制造。然而,由于微生物細(xì)胞或酶具有為自身服務(wù)的本能,其代謝過(guò)程處于最經(jīng)濟(jì)的狀態(tài),使得其工作效率成為制約微生物制造產(chǎn)業(yè)發(fā)展的瓶頸。因此,迫切需要通過(guò)代謝工程等策略以進(jìn)一步提高認(rèn)識(shí)、設(shè)計(jì)和改造微生物細(xì)胞代謝功能的能力,推動(dòng)微生物制造技術(shù)的進(jìn)步,支持工業(yè)可持續(xù)發(fā)展。但是,以往一系列的代謝工程改造策略,包括減弱反饋抑制、消除競(jìng)爭(zhēng)途徑、過(guò)量表達(dá)主要合成途徑、提升細(xì)胞轉(zhuǎn)運(yùn)能力、引入全新代謝途徑以修飾微生物代謝途徑中的某一個(gè)或幾個(gè)基因,不一定能獲得預(yù)期的代謝通量增大或降低的效果[2]。出現(xiàn)這一狀況的原因在于缺乏對(duì)微生物代謝網(wǎng)絡(luò)全局調(diào)控和表達(dá)調(diào)控網(wǎng)絡(luò)的充分理解。
另一方面,隨著基因組及其相關(guān)技術(shù)的發(fā)展,幾乎所有重要工業(yè)微生物模式種的全基因組都已經(jīng)或即將公布,微生物制造研究進(jìn)入了后基因組時(shí)代。后基因組時(shí)代的微生物制造具有以下特點(diǎn):1) 源于微生物基因組的蛋白質(zhì)組數(shù)據(jù)的積聚,使認(rèn)識(shí)、理性設(shè)計(jì)、定向改變酶的性能更為容易;2) 轉(zhuǎn)錄組學(xué)、代謝組學(xué)等數(shù)據(jù)的積聚有助于理解、提高工業(yè)微生物抵御微生物制造過(guò)程中的惡劣環(huán)境;3) 從對(duì)微生物中個(gè)別基因或蛋白質(zhì)功能的局部性研究,轉(zhuǎn)移到以細(xì)胞內(nèi)全部基因、mRNA、蛋白質(zhì)以及代謝產(chǎn)物為研究對(duì)象的工業(yè)微生物生理研究;4) 基于生物信息學(xué)的基因組規(guī)?;蛘{(diào)控網(wǎng)絡(luò)、信號(hào)轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)、蛋白質(zhì)相互作用網(wǎng)絡(luò)和代謝網(wǎng)絡(luò)的構(gòu)建、模擬與分析,逐步將代謝工程推入更為理性的系統(tǒng)代謝工程時(shí)代[3];5) 采用合成生物學(xué)的技術(shù)精確控制代謝途徑、合成目的蛋白,構(gòu)建“人工細(xì)胞”,顯著提高微生物制造效率。前已述及,由于基因與蛋白質(zhì)傾向于成組地通過(guò)網(wǎng)狀相互作用而影響微生物細(xì)胞功能,因此對(duì)工業(yè)微生物生理功能的理解和全局調(diào)控的研究必須構(gòu)建并分析其相互作用的網(wǎng)絡(luò)。這些分子和基因相互作用網(wǎng)絡(luò)包括基因調(diào)控網(wǎng)絡(luò)、信號(hào)轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)、蛋白質(zhì)相互作用網(wǎng)絡(luò)和代謝網(wǎng)絡(luò)等。其中,基于基因組注釋的代謝網(wǎng)絡(luò)把微生物細(xì)胞內(nèi)所有生化反應(yīng)構(gòu)建為一個(gè)網(wǎng)絡(luò)模型,反映了所有參與代謝過(guò)程的化合物之間以及所有催化酶之間的相互作用?;诨蚪M數(shù)據(jù)構(gòu)建的特定微生物代謝網(wǎng)絡(luò),及其結(jié)構(gòu)和功能的分析,為從全局規(guī)模上深刻認(rèn)識(shí)和高效、定向調(diào)控微生物生理功能奠定了堅(jiān)實(shí)基礎(chǔ),從而為代謝工程的發(fā)展創(chuàng)造了前所未有的機(jī)遇[4-5]。
基因組規(guī)模代謝網(wǎng)絡(luò)模型 (Genome scale of metabolic network model,GSMM) 包含了其所給定微生物內(nèi)部發(fā)生的絕大部分生化反應(yīng)。BIGG (http://bigg.ucsd.edu/) 數(shù)據(jù)庫(kù)表明,原核微生物的代謝網(wǎng)絡(luò)包含了1 000多個(gè)代謝物、1 200多個(gè)基因和2 000多個(gè)生化反應(yīng) (以E. coli為例);而真核微生物代謝網(wǎng)絡(luò)模型包括1 200多個(gè)代謝物、1 000多個(gè)基因和1 500多個(gè)生化反應(yīng) (以S. cerevisiae為例)?;蚪M規(guī)模代謝網(wǎng)絡(luò)模型一般能注釋約 6%~15% (真核微生物) 和25% (原核微生物)的開(kāi)放閱讀框 (ORF)。因此,基因組規(guī)模代謝網(wǎng)絡(luò)模型能提供一個(gè)高效平臺(tái)以全局理解微生物生理代謝功能 (圖 1)。主要應(yīng)用于以下4個(gè)方面[6](表1):1) 分析代謝網(wǎng)絡(luò)屬性;2) 預(yù)測(cè)和分析微生物生長(zhǎng)表型;3) 基于模型的組學(xué)數(shù)據(jù)闡釋[7];4) 系統(tǒng)代謝工程。
通過(guò)GSMM,可以從代謝物和代謝流兩個(gè)水平上充分理解微生物的代謝特性。在代謝物水平上,將基因組規(guī)模代謝網(wǎng)絡(luò)模型中的代謝物濃度范圍與GC-MS實(shí)驗(yàn)所測(cè)定的S. cerevisiae中間代謝產(chǎn)物真實(shí)濃度進(jìn)行比較,發(fā)現(xiàn)有52種代謝物濃度存在差異,并結(jié)合轉(zhuǎn)錄組數(shù)據(jù)的分析,找到了調(diào)控S. cerevisiae代謝功能的關(guān)鍵因子[31]。另一方面,整合 C13同位素標(biāo)記實(shí)驗(yàn)數(shù)據(jù),GSMM用以預(yù)測(cè)難以測(cè)定的中間代謝物濃度范圍、反應(yīng)進(jìn)行方向、Gibbs自由能范圍和潛在的調(diào)控反應(yīng)等[32]。此外,GSMM還可預(yù)測(cè)代謝反應(yīng)的中間代謝物之間的共生與保守關(guān)系[33]。在代謝流水平上[34-35],通過(guò)分析不同環(huán)境下不同代謝反應(yīng)上代謝流分布的情況,發(fā)現(xiàn)微生物細(xì)胞是由少數(shù)承擔(dān)著絕大部分代謝通量的骨干代謝途徑和大量附屬代謝途徑組成。與此相類(lèi)似,借助GSMM還可發(fā)現(xiàn)不同代謝反應(yīng)之間的關(guān)系和依賴(lài)性,鑒別新代謝途徑,發(fā)現(xiàn)任何狀態(tài)下不承擔(dān)任何代謝流的生化反應(yīng),研究必需代謝途徑等。
表1 基因組規(guī)模代謝網(wǎng)絡(luò)模型的應(yīng)用Table 1 Application of genome scale metabolic model
續(xù)表1
圖1 基因組規(guī)模代謝網(wǎng)絡(luò)模型是系統(tǒng)理解微生物代謝功能的平臺(tái)Fig.1 GSMM offer a platform to globally and comprehensive understanding the microbial physiology.
微生物細(xì)胞內(nèi)的代謝調(diào)控發(fā)生在基因-基因、基因-蛋白質(zhì)、蛋白質(zhì)-蛋白質(zhì)、蛋白質(zhì)-代謝物以及物理間相互作用等水平上。通過(guò)與其他組學(xué)數(shù)據(jù),如轉(zhuǎn)錄組、蛋白質(zhì)組等的整合,GSMM用以充分理解微生物細(xì)胞內(nèi)的調(diào)控機(jī)制。通過(guò)比較不同碳源下恒化培養(yǎng)時(shí)S. cerevisiae的代謝流分布和轉(zhuǎn)錄組數(shù)據(jù),研究人員重構(gòu)了一個(gè)由348個(gè)代謝基因和55個(gè)調(diào)節(jié)子組成的代謝調(diào)節(jié)網(wǎng)絡(luò),揭示了S. cerevisiae的代謝調(diào)節(jié)機(jī)制[36]。借助代謝流分析,研究人員深度解析了E. coli全局代謝調(diào)控蛋白ArcA、ArcB、Cra、Crp、Cya、Fnr和Mlc對(duì)葡萄糖代謝的影響[37]。pckA和pps的表達(dá)水平因csrA的刪除而受到抑制,從而導(dǎo)致氨基酸合成前體磷酸烯醇式丙酮酸的胞內(nèi)濃度不斷下降[38]。相反,若過(guò)量表達(dá)pps則能有效提高苯丙氨酸的產(chǎn)量[39]。進(jìn)一步深入比較分析E. coli基因組規(guī)模代謝網(wǎng)絡(luò)模型的代謝通量和轉(zhuǎn)錄組數(shù)據(jù)發(fā)現(xiàn),代謝相關(guān)基因的表達(dá)水平及通過(guò)酶節(jié)點(diǎn)的代謝通量不僅具有相同的表達(dá)模式,還受相同的轉(zhuǎn)錄調(diào)控子所調(diào)控。
由于 GSMM 是由一系列用于合成微生物生長(zhǎng)所必需的能量和前體代謝物的生化反應(yīng)所組成,因此,GSMM廣泛應(yīng)用于定性與定量預(yù)測(cè)不同代謝或環(huán)境攪動(dòng)條件下細(xì)胞生長(zhǎng)的表型。包括:1) 采用代謝流平衡分析 (Flux balance analysis,F(xiàn)BA),預(yù)測(cè)不同營(yíng)養(yǎng)物吸收速率、代謝副產(chǎn)物合成速率和細(xì)胞生長(zhǎng)速率之間的全局性關(guān)系;2) 預(yù)測(cè)不同類(lèi)型培養(yǎng)基上細(xì)胞產(chǎn)率和生長(zhǎng)比速率;3) 基于基因-蛋白質(zhì)-反應(yīng) (Gene-protein-reaction,GPR) 原則預(yù)測(cè)基因刪除對(duì)細(xì)胞生長(zhǎng)表型的影響;4) 預(yù)測(cè)并構(gòu)建微生物生長(zhǎng) (或合成目標(biāo)代謝產(chǎn)物) 必需基因集;5) 定量預(yù)測(cè)不同環(huán)境或代謝攪動(dòng)下微生物生長(zhǎng)表型。
建立在充分理解微生物細(xì)胞代謝功能基礎(chǔ)之上,借助重組DNA技術(shù)有目的地設(shè)計(jì)和改造微生物細(xì)胞內(nèi)代謝網(wǎng)絡(luò)和表達(dá)網(wǎng)絡(luò),以提高微生物代謝效率的代謝工程技術(shù),有效地克服了傳統(tǒng)育種手段的突變非定向性和設(shè)計(jì)非理性的缺點(diǎn),廣泛應(yīng)用于微生物制造領(lǐng)域以提高目標(biāo)代謝產(chǎn)物生產(chǎn)效率。隨著基因組規(guī)模技術(shù)的發(fā)展,代謝工程逐漸轉(zhuǎn)移到系統(tǒng)代謝工程,也即從全局的角度研究和調(diào)控微生物細(xì)胞的代謝與調(diào)控網(wǎng)絡(luò)?;诖?,GSMM為代謝工程提供了研究目標(biāo)微生物代謝功能的有效工具:1)根據(jù)代謝能力或最大理論轉(zhuǎn)化率選擇宿主菌;2) 根據(jù)代謝流分布確定微生物細(xì)胞內(nèi)瓶頸反應(yīng),確定代謝工程目標(biāo),發(fā)展代謝工程策略;3) 預(yù)測(cè)和評(píng)價(jià)代謝改造后突變株的代謝表型。
3.1 GSMM構(gòu)建所需數(shù)據(jù)庫(kù)與軟件
基因組規(guī)模代謝網(wǎng)絡(luò)模型構(gòu)建過(guò)程是建立基因-蛋白質(zhì)-生化反應(yīng)之間聯(lián)系的過(guò)程,涉及到基因組、蛋白質(zhì)和酶、中間代謝產(chǎn)物、生化反應(yīng)、代謝途徑等諸多方面的數(shù)據(jù)。所需數(shù)據(jù)庫(kù)和計(jì)算工具的介紹發(fā)表在每年的“Nucleic Acids Research”(NAR database issue) 第1期上。構(gòu)建過(guò)程所需的數(shù)據(jù)庫(kù)和工具詳細(xì)列于表 2,主要分為以下幾類(lèi):1) 基因組數(shù)據(jù)庫(kù)。收集了來(lái)自全球的核酸序列主要包括EMBL數(shù)據(jù)庫(kù) (由歐洲生物信息學(xué)研究所管理)、GenBank (由美國(guó)國(guó)家生物技術(shù)信息中心管理) 和DDBJ (由日本三島信息生物學(xué)中心管理)。上述3個(gè)數(shù)據(jù)庫(kù)雖然格式有所不同,但內(nèi)容完全相同。一般而言,能從上述3個(gè)數(shù)據(jù)庫(kù)獲得所給定微生物的全基因組序列 (核酸或蛋白質(zhì))。此外,一些已經(jīng)測(cè)序的微生物建立了自己特有的數(shù)據(jù)庫(kù),不斷更新經(jīng)注釋的基因組信息,如黑曲霉 (http://genome.jgi-psf.org/Aspni1/Aspni1.home.html) 的基因組數(shù)據(jù)庫(kù)。這些專(zhuān)業(yè)數(shù)據(jù)庫(kù)收集的是與明確功能類(lèi)別或分類(lèi)學(xué)標(biāo)準(zhǔn)相關(guān)的生物學(xué)數(shù)據(jù)。由于是經(jīng)過(guò)修正和分析后產(chǎn)生的注釋數(shù)據(jù)庫(kù),數(shù)據(jù)的精確度和驗(yàn)證能力更勝一籌。2) 蛋白質(zhì)數(shù)據(jù)庫(kù)。蛋白質(zhì)數(shù)據(jù)庫(kù)收集了蛋白質(zhì)序列、分類(lèi)、功能、結(jié)構(gòu)域、蛋白質(zhì)模體 (Motif)、亞細(xì)胞定位等信息,而酶學(xué)數(shù)據(jù)庫(kù)則收集了酶的分類(lèi)、功能、催化反應(yīng)、標(biāo)準(zhǔn)命名以及酶相關(guān)特性,如溫度、Km值、pH等以及與之相關(guān)的事實(shí)文獻(xiàn)。3) 代謝物數(shù)據(jù)庫(kù)。GSMM構(gòu)建中所涉及的中間代謝產(chǎn)物的信息,如代謝物名稱(chēng)、化學(xué)式、InChI、化學(xué)結(jié)構(gòu)、生物學(xué)功能等從ChEBI、PubChem和KEGG等3個(gè)數(shù)據(jù)庫(kù)中獲得。4) 代謝途徑數(shù)據(jù)庫(kù)。代謝途徑數(shù)據(jù)庫(kù)提供了微生物細(xì)胞內(nèi)代謝反應(yīng)的名稱(chēng)、代謝物、輔因子、反應(yīng)方向、代謝途徑等信息。最為典型的代謝途徑數(shù)據(jù)庫(kù)是 EcoCyc Ontology和KEGG。EcoCyc Ontology收錄了E. coli基因和其他一些相關(guān)微生物代謝途徑,同時(shí)通過(guò)途徑/基因組的用戶(hù)界面可視化地展現(xiàn)了細(xì)菌染色體內(nèi)的基因輪廓、單個(gè)生化反應(yīng)和整個(gè)生化代謝途徑。KEGG收錄了所有與途徑相關(guān)的數(shù)據(jù),包括途徑中相關(guān)的基因和化合物的目錄[40]。KEGG還提供了途徑圖譜、直系族表、分子目錄、基因組圖譜和基因目錄等數(shù)據(jù)。這些數(shù)據(jù)不僅相互之間互為鏈接并與其他相關(guān)數(shù)據(jù)庫(kù)進(jìn)行鏈接,且能通過(guò)整合的數(shù)據(jù)庫(kù)進(jìn)行檢索。5) 文獻(xiàn)事實(shí)數(shù)據(jù)庫(kù)[41]。隨著高通量技術(shù)手段的不斷發(fā)展,生物學(xué)實(shí)驗(yàn)手段和研究方法均發(fā)生了巨大變化,由此帶來(lái)實(shí)驗(yàn)數(shù)據(jù)以指數(shù)方式增長(zhǎng)。以隸屬于美國(guó)國(guó)家生物技術(shù)信息中心的 MEDLINE為例,該數(shù)據(jù)庫(kù)收集了全世界 4 800多種生物學(xué)及醫(yī)學(xué)雜志所發(fā)表的1.3億余篇文獻(xiàn),并以每月幾萬(wàn)篇的速度增長(zhǎng)。文獻(xiàn)事實(shí)數(shù)據(jù)庫(kù)為 GSMM構(gòu)建提供以下信息[42-43]:(I) 給定基因的名稱(chēng)、序列、亞細(xì)胞位置、轉(zhuǎn)錄調(diào)節(jié)以及相應(yīng)生理功能;(II) 蛋白質(zhì)序列、結(jié)構(gòu)域、功能模塊、結(jié)構(gòu)特性和功能;(III) 酶的名稱(chēng)、EC號(hào)、生理與功能參數(shù)、結(jié)構(gòu)特征、穩(wěn)定性、抑制劑或激活劑、應(yīng)用以及與特定微生物相關(guān)的信息;(IV) 生化反應(yīng)底物與產(chǎn)物、輔因子、單個(gè)生化反應(yīng)和代謝途徑;(V) 代謝網(wǎng)絡(luò)與蛋白質(zhì)相互作用網(wǎng)絡(luò);(VI) 轉(zhuǎn)錄調(diào)控、底物和代謝產(chǎn)物的跨膜轉(zhuǎn)運(yùn)、代謝產(chǎn)物的種類(lèi);(VII) 細(xì)胞組成成分、生理參數(shù)和特定微生物的相關(guān)生化參數(shù) (如培養(yǎng)基組分等)。6) 模型構(gòu)建的軟件:構(gòu)建過(guò)程使用的軟件主要是 Matlab,需要構(gòu)建者熟悉Matlab編程;另一類(lèi)是模型可視化軟件,主要是Illustrator和CellDesigner。后者可與其他組學(xué)數(shù)據(jù)如轉(zhuǎn)錄組進(jìn)行交互闡釋。
表2 基因組規(guī)模代謝網(wǎng)絡(luò)模型構(gòu)建所需數(shù)據(jù)庫(kù)Table 2 Database and software for reconstruction of genome scale metabolic network
續(xù)表2
圖2 基于基因組注釋的粗略代謝網(wǎng)絡(luò)構(gòu)建步驟Fig.2 Elements and reconstruction protocol of the draft model based on the genome annotation.
GSMM構(gòu)建一般分為5個(gè)階段[44]:1) 基因組注釋與粗略模型的獲得;2) 構(gòu)建精細(xì)代謝模型;3) 數(shù)學(xué)模型的轉(zhuǎn)換;4) 識(shí)別與填補(bǔ)代謝空洞 (Metabolic gaps);5) 模擬與可視化。
3.2 基于基因組注釋的粗略代謝模型構(gòu)建
構(gòu)建 GSMM 需要從基因組數(shù)據(jù)庫(kù)獲取目標(biāo)微生物的全基因組序列,再通過(guò) Blastp、KAAS等方法對(duì)全基因組進(jìn)行注釋?zhuān)越⒒?蛋白質(zhì)反應(yīng)之間的關(guān)系。從基因組注釋到構(gòu)建粗略模型過(guò)程中需要收集的信息詳列于圖 2中。在將基因組序列注釋為蛋白質(zhì) (酶的名稱(chēng)和EC號(hào)) 進(jìn)而到生化反應(yīng)的過(guò)程中需要注意以下問(wèn)題:1) 有些蛋白質(zhì)雖能注釋為酶的催化活性但沒(méi)有EC號(hào);2) 有些蛋白質(zhì)功能注釋過(guò)程中僅提供GO,而沒(méi)有分配系統(tǒng)的EC號(hào);3)同一個(gè)酶能催化不同底物為不同的產(chǎn)物;4) 同工酶雖由不同基因編碼,但只能催化同一個(gè)反應(yīng);5) 不同基因編碼復(fù)合酶所催化的不同反應(yīng),但其所處的亞細(xì)胞位置不盡相同。上述問(wèn)題的解決依賴(lài)于進(jìn)一步的文獻(xiàn)挖掘。
3.3 基于手工修正的精細(xì)代謝網(wǎng)絡(luò)
通過(guò)基因組注釋得到粗略代謝網(wǎng)絡(luò)(以Excel形式存儲(chǔ))的基礎(chǔ)上,需要添加一系列基因組注釋過(guò)程中無(wú)法提供的生化反應(yīng)以降低dead-end代謝物的數(shù)量 (圖3):自發(fā)反應(yīng) (Spontaneous reactions);跨膜運(yùn)輸反應(yīng);胞內(nèi)細(xì)胞器間運(yùn)輸反應(yīng);交換反應(yīng)(Exchange reactions)。但若代謝網(wǎng)絡(luò)模型中包含過(guò)多的運(yùn)輸反應(yīng),會(huì)導(dǎo)致很多無(wú)效循環(huán)的發(fā)生。因此,在基于文獻(xiàn)挖掘添加上述反應(yīng)的基本原則是:添加確實(shí)需要的生化反應(yīng)。同時(shí),評(píng)價(jià)一個(gè)基因組規(guī)模代謝網(wǎng)絡(luò)模型成功與否的標(biāo)準(zhǔn)是該模型能否在給定培養(yǎng)條件下真實(shí)預(yù)測(cè)細(xì)胞生長(zhǎng),因此,GSMM需包括與細(xì)胞生長(zhǎng)的相關(guān)反應(yīng):蛋白質(zhì)合成反應(yīng);細(xì)胞壁組分合成反應(yīng);脂類(lèi)合成反應(yīng);核苷酸類(lèi)物質(zhì)合成反應(yīng);脫氧核苷酸類(lèi)物質(zhì)合成反應(yīng);細(xì)胞生長(zhǎng)和細(xì)胞維持所需ATP等。緊隨其后,需采用人工核查的方式檢查每一個(gè)生化反應(yīng),包括:?jiǎn)蝹€(gè)反應(yīng)所需底物、產(chǎn)物、輔因子的種類(lèi)、分子式、化學(xué)計(jì)量學(xué)平衡等;基于吉布斯自由能的生化反應(yīng)方向;生化反應(yīng)的亞細(xì)胞定位、子系統(tǒng);源自文獻(xiàn)挖掘的實(shí)驗(yàn)證據(jù)。
3.4 轉(zhuǎn)換為數(shù)學(xué)模型
GSMM構(gòu)建的第3個(gè)階段是在安裝COBRA和SBML工具箱后,利用Matlab將精細(xì)代謝網(wǎng)絡(luò)轉(zhuǎn)換為數(shù)學(xué)模型,以供后續(xù)驗(yàn)證和模擬使用。然而,采用 GSMM 模擬細(xì)胞生長(zhǎng)或目標(biāo)代謝產(chǎn)物的合成始終與實(shí)驗(yàn)數(shù)據(jù)存在一定的差距,其原因在于模擬代謝流的分布缺乏一定的約束條件。為了使GSMM模擬結(jié)果更接近微生物真實(shí)的代謝,在GSMM模擬過(guò)程中通常添加一定的約束條件:物理-化學(xué)約束;拓?fù)浼s束;環(huán)境條件約束;代謝調(diào)控約束。GSMM中最常用的約束條件是物理-化學(xué)約束和環(huán)境條件約束 (圖 4):代謝通量平衡 (S?v=0);能量平衡 (ΔE=0);酶催化或細(xì)胞轉(zhuǎn)運(yùn)的能力 (vi≤vmax) 以及熱動(dòng)力學(xué)參數(shù) (0≤vmin)。
3.5 評(píng)估基因組規(guī)模代謝網(wǎng)絡(luò)模型
圖3 精細(xì)GSMM需要添加的反應(yīng)與示例Fig.3 Added reactions to GSMM during the manual reconstruction refinement.
圖4 GSMM模擬的約束條件Fig.4 Physic-chemical and environmental conditions constraints for GSMM simulation.
將代謝網(wǎng)絡(luò)模型轉(zhuǎn)換為數(shù)學(xué)模型后,隨后的工作是采取一系列步驟評(píng)估與修正所構(gòu)建的代謝網(wǎng)絡(luò)模型:1) 從碳、氮、硫、磷、氫和電荷等方面查找和修補(bǔ)物質(zhì)或電子不平衡的生化反應(yīng);2) 查找代謝末端 (Metabolic dead ends) 以鑒定代謝漏洞(Metabolic gaps),進(jìn)而通過(guò)基因注釋和文獻(xiàn)挖掘?qū)ふ蚁鄳?yīng)生化反應(yīng)修補(bǔ)相應(yīng)的代謝漏洞;3) 添加缺失的交換反應(yīng)(Exchange reactions) 以及設(shè)置交換反應(yīng)的約束條件;4) 基于熱力學(xué)特性、ATP和 NADH合成與利用調(diào)整生化反應(yīng)方向;5) 鑒定孤兒反應(yīng)(Orphan reaction),調(diào)整或刪除引起代謝冗余的生化反應(yīng)。在填補(bǔ)代謝漏洞的過(guò)程中,需要注意的事項(xiàng)是新添加到代謝網(wǎng)絡(luò)中的生化反應(yīng)可能會(huì)導(dǎo)致新漏洞出現(xiàn)。因此,當(dāng)加入新的反應(yīng)時(shí),應(yīng)確保所有代謝物能連接到已構(gòu)建好的代謝網(wǎng)絡(luò)。評(píng)價(jià)GSMM構(gòu)建精確性還包括以下指標(biāo):是否在不同培養(yǎng)基和給定的培養(yǎng)條件下合成細(xì)胞生長(zhǎng)所需的前體物質(zhì);典型培養(yǎng)基上能否生長(zhǎng);不同培養(yǎng)基上的細(xì)胞濃度和生長(zhǎng)速度的比較;合成目標(biāo)代謝產(chǎn)物的能力及其合成速率。
3.6 GSMM模擬和可視化
通過(guò)GSMM構(gòu)建與模擬,研究人員能在不同組學(xué)水平上全局性、定量化理解微生物細(xì)胞的生理代謝功能,進(jìn)而設(shè)計(jì)代謝工程策略,獲取所需的生理表型,提高微生物制造的效率。然而,由于難以全面獲取微生物細(xì)胞酶動(dòng)力學(xué)相關(guān)數(shù)據(jù)和相關(guān)的調(diào)控機(jī)制,導(dǎo)致不能全面正確地解析和調(diào)控微生物細(xì)胞的代謝功能,進(jìn)而提高工業(yè)生物過(guò)程的效率。為了更好地理解和整合微生物細(xì)胞內(nèi)代謝調(diào)節(jié)機(jī)制和酶動(dòng)力學(xué)知識(shí),因此需要設(shè)計(jì)和應(yīng)用更為新穎的生物信息學(xué)工具與方法。因此,為了更好地在全局性解析微生物生理功能的基礎(chǔ)上,發(fā)展高效代謝工程策略,定向改造微生物菌株為工業(yè)生物技術(shù)服務(wù),今后的研究應(yīng)注重以下兩個(gè)方面:構(gòu)建更為全面、準(zhǔn)確的包含調(diào)控機(jī)制和動(dòng)態(tài)動(dòng)力學(xué)參數(shù)的GSMM;發(fā)展新的模擬計(jì)算方法和約束條件,以更加準(zhǔn)確地模擬真實(shí)的微生物細(xì)胞代謝。
REFERENCES
[1] Otero JM, Nielsen J. Industrial systems biology.Biotechnol Bioeng, 2009, 105: 439?460.
[2] Feist AM, Palsson BO. The growing scope of applications of genome-scale metabolic reconstructions usingEscherichia coli.Nat Biotechnol, 2008, 26: 659?667.
[3] Park JH, Lee SY. Towards systems metabolic engineering of microorganisms for amino acid production.Curr Opin Biotechnol, 2008, 19: 454?460.
[4] Patil KR, Akesson M, Nielsen J. Use of genome-scalemicrobial models for metabolic engineering.Curr Opin Biotechnol, 2004, 15: 64?69.
[5] Feist AM, Palsson BO. The growing scope of applications of genome-scale metabolic reconstructions usingEscherichia coli.Nat Biotechnol, 2008, 26: 659?667.
[6] Durot M, Bourguignon PY, Schachter V. Genome-scale models of bacterial metabolism: reconstruction and applications.FEMS Microbiol Rev, 2009, 33: 164?190.
從2003年的孫志剛案最終導(dǎo)致廢除收容審查制度,到如今于海明案讓我們對(duì)長(zhǎng)期處于“認(rèn)定模糊地帶”的法律概念——正當(dāng)防衛(wèi),有了更深刻的理解,我們相信,每一位有著最樸素正義觀的人民群眾,在一起起個(gè)案中共同提升了法律素養(yǎng)和法治意識(shí);我們更相信,法律從來(lái)不是冰冷的,而中國(guó)司法也必將在追求法律效果和社會(huì)效果的統(tǒng)一中,溫暖而堅(jiān)定地前行!如同習(xí)近平總書(shū)記說(shuō),“努力讓人民群眾在每一個(gè)司法案件中都感受到公平正義”!
[7] Hanisch D, Zien A, Zimmer R,et al. Co-clustering of biological networks and gene expression data.Bioinformatics, 2002, 18(suppl 1): S145?S154.
[8] Reed JL, Palsson BO. Genome-scalein silicomodels ofE. colihave multiple equivalent phenotypic states:assessment of correlated reaction subsets that comprise network states.Genome Res, 2004, 14: 1797?1805.
[9] Mahadevan R, Schilling CH. The effects of alternate optimal solutions in constraint-based genome-scale metabolic models.Metab Eng, 2003, 5: 264?276.
[10] Schilling CH, Palsson BO. Assessment of the metabolic capabilities ofHaemophilus influenzaeRd through a genome-scale pathway analysis.J Theor Biol, 2000, 203:249?283.
[11] Klamt S, Stelling J. Two approaches for metabolic pathway analysis?Trends Biotechnol, 2003, 21: 64?69.
[12] Burgard AP, Nikolaev EV, Schilling CH,et al. Flux coupling analysis of genome-scale metabolic network reconstructions.Genome Res, 2004, 14: 301?312.
[13] Nikolaev EV, Burgard AP, Maranas CD. Elucidation and structural analysis of conserved pools for genome-scale metabolic reconstructions.Biophys J, 2005, 88: 37?49.
[14] Imielinski M, Belta C, Halasz A,et al. Investigating metabolite essentiality through genome-scale analysis ofEscherichia coliproduction capabilities.Bioinformatics,2005, 21: 2008?2016.
[15] Varma A, Palsson BO. Stoichiometric flux balance models quantitatively predict growth and metabolic byproduct secretion in wild-typeEscherichia coliW3110.Appl Environ Microb, 1994, 60: 3724?3731.
[16] Segre D, Vitkup D, Church GM. Analysis of optimality in natural and perturbed metabolic networks.Proc Natl Acad Sci USA, 2002, 99: 15112?15117.
[17] Shlomi T, Berkman O, Ruppin E. Regulatory on/off minimization of metabolic flux changes after genetic perturbations.Proc Natl Acad Sci USA, 2005, 102:7695?7700.
[18] Imielinski M, Belta C. Exploiting the pathway structure of metabolism to reveal high-order epistasis.BMC Syst Biol,2008, 2: 40.
[19] Sauer U. Metabolic networks in motion: 13C-based flux analysis.Mol Syst Biol, 2006, 2: 6.
[20] Herrgard MJ, Fong SS, Palsson B?. Identification of genome-scale metabolic network models using experimentally measured flux profiles.PLoS Comput Biol,2006, 2: e72.
[21] Schuetz R, Kuepfer L, Sauer U. Systematic evaluation of objective functions for predicting intracellular fluxes inEscherichia coli.Mol Syst Biol, 2007, 3: 119.
[22] Oh YK, Palsson BO, Park SM,et al. Genome-scale reconstruction of metabolic network inBacillus subtilisbased on high-throughput phenotyping and gene essentiality data.J Biol Chem, 2007, 282: 28791?28799.
[23] Henry CS, Broadbelt LJ, Hatzimanikatis V.Thermodynamics-based metabolic flux analysis.Biophys J, 2007, 92: 1792?1805.
[24] Patil KR, Nielsen J. Uncovering transcriptional regulation of metabolism by using metabolic network topology.Proc Natl Acad Sci USA, 2005, 102: 2685?2689.
[25] Akesson M, Forster J, Nielsen J. Integration of gene expression data into genome-scale metabolic models.Metab Eng, 2004, 6: 285?293.
[26] Becker SA, Palsson BO. Context-specific metabolic networks are consistent with experiments.PLoS Comput Biol, 2008, 4: e1000082.
[27] Barrett CL, Palsson BO. Iterative reconstruction of transcriptional regulatory networks: an algorithmic approach.PLoS Comput Biol, 2006, 2: e52.
[28] Alper H, Miyaoku K, Stephanopoulos G. Construction of lycopene-overproducingE. colistrains by combining systematic and combinatorial gene knockout targets.Nat Biotechnol, 2005, 23: 612?616.
[29] Pharkya P, Burgard AP, Maranas CD. OptStrain: a computational framework for redesign of microbial production systems.Genome Res, 2004, 14: 2367?2376.
[30] Lee KH, Park JH, Kim TY,et al. Systems metabolic engineering ofEscherichia colifor L-threonine production.Mol Syst Biol, 2007, 3: 149.
[31] Imielinski M, Belta C, Rubin H,et al. Systematic analysis of conservation relations inEscherichia coligenome-scale metabolic network reveals novel growth media.Biophys J,2006, 90: 2659?2672.
[32] Kummel A, Panke S, Heinemann M. Putative regulatory sites unraveled by network-embedded thermodynamic analysis of metabolome data.Mol Sys Biol, 2006, 2: 10.
[33] Becker SA, Price ND, Palsson BO. Metabolite coupling in genome-scale metabolic networks.BMC Bioinformatics,2006, 7: 14.
[34] Braunstein A, Mulet R, Pagnani A. Estimating the size of the solution space of metabolic networks.BMC Bioinformatics, 2008, 9: 13.
[35] Teusink B, Wiersma A, Molenaar D,et al. Analysis of growth ofLactobacillus plantarumWCFS1 on a complex medium using a genome-scale metabolic model.J Biolog Chem, 2006, 281: 40041?40048.
[36] Herrgard MJ, Lee BS, Portnoy V,et al. Integrated analysis of regulatory and metabolic networks reveals novel regulatory mechanisms inSaccharomyces cerevisiae.Genome Res, 2006, 16: 627?635.
[37] Perrenoud A, Sauer U. Impact of global transcriptional regulation byArcA,ArcB,Cra,Crp,Cya,Fnr, andMlcon glucose catabolism inEscherichia coli.J Bacteriol, 2005,187: 3171?3179.
[38] Tatarko M, Romeo T. Disruption of a global regulatory gene to enhance central carbon flux into phenylalanine biosynthesis inEscherichia coli.Curr Microbiol, 2001,43: 26?32.
[39] Wahl A, El Massaoudi M, Schipper D,et al. Serial13C-based flux analysis of an L-phenylalanine-producingE. colistrain using the sensor reactor.Biotech Prog, 2004,20: 706?714.
[40] Okuda S, Yamada T, Hamajima M,et al. KEGG Atlas mapping for global analysis of metabolic pathways.Nucleic Acids Res, 2008, 36: W423?W426.
[41] Jensen LJ, Saric J, Bork P. Literature mining for the biologist: from information retrieval to biological discovery.Nat Rev Gene, 2006, 7: 119?129.
[42] Ananiadou S, Kell DB, Tsujii J. Text mining and its potential applications in systems biology.Trends in Biotech, 2006, 24: 571?579.
[43] Leitner F, Valencia A. A text-mining perspective on the requirements for electronically annotated abstracts.FEBS Lett, 2008, 582: 1178?1181.
[44] Thiele I, Palsson BO. A protocol for generating a high-quality genome-scale metabolic reconstruction.Nat Protoc, 2010, 5: 93?121.
Reconstruction and application of genome-scale metabolic network model
Liming Liu, and Jian Chen
State Key Laboratory of Food Science and Technology,Jiangnan University,Wuxi214122,China
Received:May 9, 2010;Accepted:August 3, 2010
Supported by:National Outstanding Youth Foundation of China (No. 20625619), Foundation for the Author of National Excellent Doctoral Dissertation of China (No. 200962).
Corresponding author:Liming Liu. Tel: +86-510-85918307; E-mail: mingll@jiangnan.edu.cn
Jian Chen. E-mail: jchen@jiangnan.edu.cn
國(guó)家杰出青年基金 (No. 20625619),全國(guó)優(yōu)秀博士學(xué)位論文作者專(zhuān)項(xiàng)資金 (No. 200962) 資助。