葉超,徐楠,陳修來(lái),劉立明
應(yīng)用代謝網(wǎng)絡(luò)模型解析工業(yè)微生物胞內(nèi)代謝
葉超1,2,徐楠3,陳修來(lái)1,2,劉立明1,2
1 江南大學(xué) 食品科學(xué)與技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,江蘇 無(wú)錫 214122 2 江南大學(xué) 工業(yè)生物技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 無(wú)錫 214122 3 揚(yáng)州大學(xué) 生物科學(xué)與技術(shù)學(xué)院,江蘇 揚(yáng)州 225009
為了快速、高效地理解工業(yè)微生物胞內(nèi)代謝特征,尋找潛在的代謝工程改造靶點(diǎn),基因組規(guī)模代謝網(wǎng)絡(luò)模型(GSMM) 作為一種系統(tǒng)生物學(xué)工具越來(lái)越受到人們的關(guān)注。文中在回顧GSMM 20年發(fā)展歷程的基礎(chǔ)上,分析了當(dāng)前GSMM的研究現(xiàn)狀,總結(jié)了GSMM的構(gòu)建及分析方法,從預(yù)測(cè)細(xì)胞表型和指導(dǎo)代謝工程兩個(gè)方面闡述了GSMM在解析工業(yè)微生物胞內(nèi)代謝中的應(yīng)用,并展望了GSMM未來(lái)的發(fā)展趨勢(shì)。
微生物胞內(nèi)代謝,生產(chǎn)性能,基因組規(guī)模代謝網(wǎng)絡(luò)模型,系統(tǒng)生物學(xué)
基因組規(guī)模代謝網(wǎng)絡(luò)模型 (Genome-scale metabolic model, GSMM) 作為一種數(shù)學(xué)模型,其本質(zhì)是用于表征基因-蛋白-反應(yīng) (GPR) 三者之間的關(guān)系。GSMM包括一系列化學(xué)計(jì)量平衡的生化反應(yīng),通過(guò)形成一個(gè)矩陣S,將其轉(zhuǎn)化成一個(gè)數(shù)學(xué)模型。矩陣S的每行代表代謝物,每列代表反應(yīng)。GSMM已經(jīng)廣泛應(yīng)用在分析網(wǎng)絡(luò)特性、預(yù)測(cè)細(xì)胞表型、指導(dǎo)菌株設(shè)計(jì)、驅(qū)動(dòng)模型發(fā)現(xiàn)、研究進(jìn)化過(guò)程和分析相互作用等6個(gè)方面(圖1)[1-2]。
工業(yè)微生物胞內(nèi)代謝活動(dòng)具有較高的復(fù)雜性,單一的研究手段難以系統(tǒng)地理解其調(diào)控機(jī)制,且無(wú)法高效地獲取所需表型。目前利用GSMM分析工業(yè)微生物胞內(nèi)的代謝調(diào)控,尤其是篩選代謝工程改造靶點(diǎn),提高目標(biāo)產(chǎn)物產(chǎn)量方面已經(jīng)取得了一定的進(jìn)展。例如,Nocon等利用MOMA算法鑒定出乙醇脫氫酶是畢赤酵母中過(guò)量生成胞質(zhì)人超氧化物歧化酶(hSOD) 基因敲除靶點(diǎn),實(shí)驗(yàn)證實(shí)的敲除使得hSOD產(chǎn)量增加了20%[3]。Song等利用流量響應(yīng)分析方法,篩選出擴(kuò)增磷酸烯醇丙酮酸羧化酶() 使富馬酸產(chǎn)量提高了2.8倍[4]。這些基于GSMM預(yù)測(cè)和實(shí)驗(yàn)結(jié)合的方法,在乙醇[5-6]、丁醇[7-8]、琥珀酸[9-10]、乳酸[11]、番茄紅素[12]、氨基酸[13-14]、香蘭素[15]和1,4-丁二醇[16]等產(chǎn)品生產(chǎn)中展現(xiàn)了巨大的應(yīng)用前景。
本文綜述了目前GSMM的研究進(jìn)展,比較了目前常見(jiàn)的模型構(gòu)建及評(píng)價(jià)標(biāo)準(zhǔn),總結(jié)出流量平衡類和遺傳擾動(dòng)類模型分析方法的應(yīng)用范圍。進(jìn)一步結(jié)合這些模型分析工具,系統(tǒng)地闡述GSMM在工業(yè)微生物表型預(yù)測(cè)、代謝改造等胞內(nèi)代謝研究中的應(yīng)用。同時(shí)展望了GSMM的未來(lái)發(fā)展趨勢(shì),以期能夠利用系統(tǒng)生物學(xué)工具,為“濕實(shí)驗(yàn)”提供理論指導(dǎo)。
自1999年完成流感嗜血桿菌GSMM的構(gòu)建以來(lái),GSMM經(jīng)歷了20年的發(fā)展,截至2019年3月,已經(jīng)有超過(guò)153種微生物,348個(gè)GSMMs完成了構(gòu)建(圖2)[1-17]。其中一些模式菌株的GSMMs,如大腸桿菌K12和釀酒酵母S288c,經(jīng)過(guò)不斷的修正和完善,分別構(gòu)建了6個(gè)和12個(gè)GSMMs[17-18]。改進(jìn)后的GSMMs,不僅增加了模型規(guī)模(基因、反應(yīng)、代謝物),而且提高了模型預(yù)測(cè)結(jié)果的準(zhǔn)確性。如最新.模型ML1515預(yù)測(cè)基因敲除表型的準(zhǔn)確率為93.4%,相較JO1366準(zhǔn)確率89.8%提高了3.6%[19]。
圖1 GSMM在工業(yè)微生物中的應(yīng)用
圖2 已發(fā)表代謝網(wǎng)絡(luò)模型的統(tǒng)計(jì)
由于傳統(tǒng)的GSMM主要是通過(guò)對(duì)底物的利用作為約束條件進(jìn)行模擬分析,魯棒性分析碳源吸收速率與細(xì)胞生長(zhǎng)之間的關(guān)系通常呈線性相關(guān)。表明隨著碳源吸收速率的增加,細(xì)胞比生長(zhǎng)速率可以一直增加,最終遠(yuǎn)大于菌株的最大比生長(zhǎng)速率。因此,為了提高模型預(yù)測(cè)結(jié)果的準(zhǔn)確性,需要在傳統(tǒng)GSMM的基礎(chǔ)上整合其他方法。目前的改進(jìn)方法主要有4個(gè)方面:1) 整合組學(xué)數(shù)據(jù)[20-22]:如通過(guò)整合轉(zhuǎn)錄組學(xué)數(shù)據(jù),得到基因表達(dá)模型(ME-model),預(yù)測(cè)結(jié)果的準(zhǔn)確性從91.2%提高至92.3%[20];2) 添加各種約束條件[23-26]:將動(dòng)力學(xué)參數(shù)整合至.核心GSMM中,模擬結(jié)果與實(shí)驗(yàn)數(shù)據(jù)的皮爾森相關(guān)系數(shù)達(dá)到了0.84[23];3) 整合多種生物模型:在GSMM基礎(chǔ)上整合基因表達(dá)數(shù)據(jù)、轉(zhuǎn)錄調(diào)控模型、信號(hào)轉(zhuǎn)導(dǎo)網(wǎng)絡(luò),得到.整合模型,皮爾森相關(guān)系數(shù)提高了2倍[27];4) 構(gòu)建微生物全細(xì)胞模型:利用生殖支原體全細(xì)胞模型不僅可以從單細(xì)胞水平描述一個(gè)細(xì)胞周期內(nèi)個(gè)體分子及其相互作用,而且實(shí)現(xiàn)了一系列可觀察到的細(xì)胞行為的準(zhǔn)確預(yù)測(cè)[28]。
1.2.1 互作網(wǎng)絡(luò)模型
自然界中的微生物相互作用關(guān)系主要存在互生、共生、競(jìng)爭(zhēng)和寄生。通過(guò)構(gòu)建微生物群體互作模型,模擬不同物種之間的代謝物交換,已經(jīng)被用于鑒定微生物之間的相互作用關(guān)系。通過(guò)構(gòu)建維生素C混菌發(fā)酵模型WZ-KV-663-BM-1055,共培養(yǎng)條件下,生酮基古龍酸菌和巨大芽孢桿菌的最大比生長(zhǎng)速率分別比單獨(dú)培養(yǎng)提高了1.5倍和6.6倍,表明兩菌之間存在共生關(guān)系,并且是通過(guò)代謝物交換實(shí)現(xiàn)的:.能為.提供6種氨基酸、3種核苷酸、6種維生素和輔因子、3種有機(jī)酸以及甘油等營(yíng)養(yǎng)物質(zhì);而.通過(guò)分泌苯丙氨酸、富馬酸和甲酸促進(jìn).生長(zhǎng)[29]。類似地,通過(guò)分別構(gòu)建木質(zhì)纖維素生產(chǎn)丁醇菌株丙酮丁醇梭菌和解纖維梭菌的GSMMs,模擬共培養(yǎng)條件下丁醇發(fā)酵過(guò)程,發(fā)現(xiàn).和.之間也是代謝物交換而實(shí)現(xiàn)共生(圖3)[30]。
1.2.2 泛基因組模型
泛基因組(Pan-genome) 是指某一物種全部基因的總稱,包括核心基因組(Core genome) 和附加基因組(Dispensable genome)。通過(guò)構(gòu)建泛基因組模型,對(duì)核心基因和附加基因進(jìn)行組合分析,比較同一物種不同菌株之間的表型差異,從而分析菌株特異性。目前已經(jīng)完成構(gòu)建的泛基因組模型主要有:包含了55株.的泛基因組模型[31]、64株金黃色葡萄球菌泛基因組模型[32]以及410株沙門氏菌屬[33]的泛基因組模型。由于涉及的菌株都是致病性菌株,主要是利用泛基因組模型預(yù)測(cè)不同菌株之間的代謝能力差異,從而鑒定致病性。例如,在泛基因組模型中,通過(guò)預(yù)測(cè)410株在530種環(huán)境中的生長(zhǎng)能力,鑒定出這些存在顯著差異的代謝途徑包括碳代謝和細(xì)胞壁合成,并且代謝特異性與每個(gè)菌株的血清型和分離宿主相對(duì)應(yīng)[33]。
1.2.3 宏基因組模型
宏基因組 (Meta-genome) 是指特定環(huán)境中全部微生物的總DNA。物種豐富度(用來(lái)描述和量化微生物群落,反映特定區(qū)域物種的數(shù)量),是宏基因組數(shù)據(jù)的重要評(píng)價(jià)指標(biāo)。在單個(gè)微生物GSMM的基礎(chǔ)上,通過(guò)構(gòu)建宏基因組網(wǎng)絡(luò)模型,一方面可以結(jié)合模型分析菌群在不同環(huán)境中的代謝特征,另一方面可以預(yù)測(cè)不同微生物之間的相互作用關(guān)系。目前已經(jīng)構(gòu)建完成的宏基因組模型是包含773個(gè)腸道微生物的宏基因組模型[34]和包含1 562個(gè)人類相關(guān)微生物的宏基因組模型[35]??紤]到宏基因組數(shù)據(jù)的物種豐富度,需要批量構(gòu)建成百上千個(gè)GSMMs,因此在構(gòu)建宏基因組模型的過(guò)程中需要開發(fā)特定的方法,如AGORA[34]和MOMBO[35]。這些算法的特點(diǎn)在于實(shí)現(xiàn)模型批量構(gòu)建的過(guò)程中,建立了特定的模型質(zhì)量評(píng)價(jià)體系,從而滿足模擬分析。
根據(jù)Palsson實(shí)驗(yàn)室發(fā)表在上的GSMM構(gòu)建教程[36-37],GSMM的構(gòu)建主要包括4個(gè)部分:粗模型的構(gòu)建、模型的精煉、模型的數(shù)學(xué)轉(zhuǎn)換、模型的調(diào)試和驗(yàn)證,涉及102個(gè)具體步驟。而GSMM的構(gòu)建方式有3種:手動(dòng)構(gòu)建、自動(dòng)構(gòu)建和半自動(dòng)構(gòu)建。手動(dòng)構(gòu)建方法依賴于基因組注釋結(jié)果,結(jié)合KEGG中的pathway map,對(duì)每個(gè)代謝途徑涉及的基因-蛋白-反應(yīng)進(jìn)行收集與整理,這種方法的優(yōu)勢(shì)在于模型的準(zhǔn)確性較高,缺點(diǎn)則是模型構(gòu)建過(guò)程耗時(shí)。自動(dòng)構(gòu)建方法則是通過(guò)已有的工具,提交相關(guān)的信息,如基因組序列,從而自動(dòng)得到目的菌株的GSMM,目前已經(jīng)開發(fā)了許多工具,如COBRA[37]、RAVEN[38]、Model SEED[39]和IMGMD[17],用于GSMM的自動(dòng)化構(gòu)建。這種方式的優(yōu)勢(shì)在于可以實(shí)現(xiàn)模型的快速、批量構(gòu)建,缺點(diǎn)則是構(gòu)建得到的模型準(zhǔn)確性低。半自動(dòng)構(gòu)建的方法則是先通過(guò)一些自動(dòng)化構(gòu)建工具得到GSMM,然后在該模型的基礎(chǔ)上進(jìn)行手動(dòng)精煉,得到精確的模型。
在完成模型的構(gòu)建后,需要進(jìn)行一系列的驗(yàn)證,從而判斷其覆蓋范圍是否完整,以及與現(xiàn)有的模型相比是否具有更好的預(yù)測(cè)能力。常見(jiàn)的模型評(píng)價(jià)指標(biāo)主要有:通用指標(biāo)、連通度指標(biāo)、生長(zhǎng)指標(biāo)和基因敲除指標(biāo) (表1)。前兩個(gè)屬于描述模型的指標(biāo) (定量和定性),后兩個(gè)是預(yù)測(cè)生物行為的指標(biāo)[40]。通過(guò)將不同培養(yǎng)條件下的模擬結(jié)果與實(shí)驗(yàn)值進(jìn)行比較,從而判斷模型模擬結(jié)果的準(zhǔn)確性。
2.2.1 流量平衡分析類算法
代謝流量(Flux) 是胞內(nèi)分子通過(guò)代謝途徑的轉(zhuǎn)換率,受到代謝途徑中涉及的酶調(diào)控。流量平衡分析(FBA) 作為最基本的數(shù)學(xué)算法,目前已經(jīng)被廣泛應(yīng)用于計(jì)算最優(yōu)條件下的生長(zhǎng)速率或者代謝產(chǎn)物合成速率[41]。然而由于FBA算法局限性是只能模擬穩(wěn)態(tài)條件下的流量分布,并且通過(guò)底物的吸收速率作為約束條件,限制了FBA預(yù)測(cè)流量分布的準(zhǔn)確性。因此,在FBA的基礎(chǔ)上開發(fā)了一系列的算法對(duì)代謝流量進(jìn)行額外的約束(表2)。這些算法一方面提高了模型預(yù)測(cè)流量分布結(jié)果的準(zhǔn)確性,例如,通過(guò)整合轉(zhuǎn)錄調(diào)控信息,開發(fā)了rFBA算法,根據(jù)培養(yǎng)基中的代謝物濃度對(duì)反應(yīng)流量添加布爾約束,能夠解釋、分析和預(yù)測(cè)轉(zhuǎn)錄調(diào)控在系統(tǒng)水平上對(duì)細(xì)胞代謝的影響[42]。在rFBA的基礎(chǔ)上,進(jìn)一步整合常微分方程(ODEs),開發(fā)了iFBA算法[43],模擬結(jié)果表明,相較于rFBA,iFBA對(duì)334個(gè)單基因擾動(dòng)和野生型的預(yù)測(cè)更準(zhǔn)確。另一方面拓展了模型的應(yīng)用,如dFBA算法將FBA擴(kuò)展至能夠考慮動(dòng)力學(xué)因素,實(shí)現(xiàn)代謝流量的動(dòng)態(tài)模擬。應(yīng)用該算法,準(zhǔn)確預(yù)測(cè)了.在葡萄糖分批補(bǔ)料條件下的二次生長(zhǎng)情況[44]。cFBA則通過(guò)將反應(yīng)化學(xué)計(jì)量數(shù)、熱力學(xué)和生態(tài)系統(tǒng)作為約束條件,用于研究微生物群體的代謝行為[45]。
表1 用于評(píng)價(jià)代謝網(wǎng)絡(luò)模型的主要指標(biāo)
表2 常見(jiàn)的流量平衡分析方法
2.2.2 遺傳擾動(dòng)類算法
微生物遺傳改造主要是通過(guò)對(duì)微生物基因組進(jìn)行修飾,改變基因型,從而獲得不同表型微生物。結(jié)合GSMM,開發(fā)相應(yīng)的算法可以實(shí)現(xiàn)對(duì)這些擾動(dòng)的模擬(表3)。這些算法可以分為基因敲除、添加、上調(diào)/下調(diào)或者異源途徑導(dǎo)入等。Optknock是典型的基因敲除方法,是基于雙目標(biāo)方程,即分別對(duì)生物量方程和目標(biāo)產(chǎn)物求解,篩選出能夠提高目標(biāo)產(chǎn)物的基因敲除靶點(diǎn)[51]。在OptKnock的基礎(chǔ)上進(jìn)行改進(jìn),得到了ReacKnock 算法,能夠?qū)崿F(xiàn)多達(dá)20個(gè)基因敲除靶點(diǎn)的篩選[52]。OptSwap作為基因添加類唯一的算法,主要是一種確定氧化還原酶輔因子特異性(NAD(H)和NADP(H)) 的最佳修飾的方法,用于微生物生產(chǎn)菌株的設(shè)計(jì)[53]。在基因上調(diào)、下調(diào)方面,OptForce通過(guò)比較突變菌株和野生型的反應(yīng)流量差異,從而確定上調(diào)或下調(diào)的靶點(diǎn),實(shí)現(xiàn)目標(biāo)產(chǎn)物的過(guò)量合成[54]。而k-OptForce則是OptForce的擴(kuò)展,通過(guò)整合酶動(dòng)力學(xué)常數(shù),預(yù)測(cè)酶編碼基因的上調(diào)或下調(diào)[55]。異源表達(dá)相關(guān)的算法目前有OptStrain和SimOptStrain。前者通過(guò)在包含一系列酶催化反應(yīng)的反應(yīng)庫(kù)中檢索,篩選能夠滿足最大產(chǎn)物合成速率下的最小修飾路徑添加至宿主細(xì)胞中[56]。后者則是不僅能夠?qū)崿F(xiàn)異源途徑的添加,同時(shí)鑒定出宿主細(xì)胞中需要?jiǎng)h除的反應(yīng)[57]。
表3 常見(jiàn)的模擬菌株設(shè)計(jì)方法
在工業(yè)菌株生產(chǎn)過(guò)程中,微生物的表型是基因型和外部環(huán)境共同作用的結(jié)果。微生物的表型主要涉及細(xì)胞生長(zhǎng)、能量利用、底物利用、產(chǎn)物合成和基因必需性等方面。利用GSMM對(duì)細(xì)胞表型進(jìn)行預(yù)測(cè),從而理解微生物的表型潛力。
為了預(yù)測(cè)微生物的細(xì)胞生長(zhǎng),利用FBA算法,計(jì)算穩(wěn)態(tài)條件下的各個(gè)反應(yīng)的流量分布。通過(guò)設(shè)定不同底物的吸收速率,以生物量方程為目標(biāo)方程求解,從而計(jì)算出.的最大比生長(zhǎng)速率()[41]。
通過(guò)改變目標(biāo)方程,探討微生物代謝在不同目標(biāo)方程下的流量分布,以檢驗(yàn)滿足細(xì)胞功能背后的驅(qū)動(dòng)力,進(jìn)而理解能量利用與細(xì)胞次優(yōu)行為之間的關(guān)系。通過(guò)評(píng)價(jià)11種目標(biāo)方程下的流量分布,模擬不同條件下的最大ATP得率,與6種環(huán)境下的C13標(biāo)記實(shí)驗(yàn)進(jìn)行比較,證實(shí)模型能夠準(zhǔn)確預(yù)測(cè)微生物胞內(nèi)能量利用[67]。
通過(guò)改變培養(yǎng)條件,模擬不同培養(yǎng)基中底物利用對(duì)微生物生長(zhǎng)的影響,從而鑒定最優(yōu)培養(yǎng)基。利用維生素C生產(chǎn)菌株.WSH001模型WZ663,通過(guò)FBA模擬,發(fā)現(xiàn)從完全培養(yǎng)基中分別去除甘氨酸、半胱氨酸、甲硫氨酸、色氨酸、腺嘌呤、胸腺嘧啶、硫胺素和泛酸會(huì)導(dǎo)致細(xì)胞生長(zhǎng)分別下降1%、21%、16%、1%、26%、57%、73%和24%?;谶@些結(jié)果開發(fā)了.最小合成培養(yǎng)基,不僅滿足了.的生長(zhǎng),而且2-酮基-L-古龍酸產(chǎn)量達(dá)到了完全培養(yǎng)基條件下的96.5%[68]。
利用魯棒性分析算法,對(duì)生物量方程進(jìn)行約束,以產(chǎn)物合成反應(yīng)作為目標(biāo)方程求解,能夠得到一個(gè)解空間,反映了不同生長(zhǎng)速率下的產(chǎn)物合成能力。結(jié)合OptKnock算法,篩選.過(guò)量生成乳酸的靶點(diǎn),結(jié)合適應(yīng)性進(jìn)化策略,最終得到能夠在M9培養(yǎng)基中同時(shí)滿足快速生長(zhǎng)和乳酸大量分泌的.菌株[11]。
利用單基因敲除程序,對(duì)微生物的必需基因鑒定。通過(guò)比較不同培養(yǎng)條件下的必需基因差異,從而理解基因的絕對(duì)必需性和相對(duì)必需性。在最小培養(yǎng)基中,高山被孢霉的模型CY1106中有86個(gè)基因被鑒定為必需基因;而在酵母提取物培養(yǎng)基中,只有49個(gè)基因是必需基因。進(jìn)一步分析,前者有36.05%的必需基因?qū)儆诎被岽x途徑,而后者有23.26%的必需基因參與核苷酸代謝[69]。表明在營(yíng)養(yǎng)豐富的培養(yǎng)條件下,氨基酸可以通過(guò)從培養(yǎng)基中直接攝入,不需要從頭合成,因此氨基酸代謝相關(guān)的基因是相對(duì)必需的。
綜上所述,在細(xì)胞表型預(yù)測(cè)方面,GSMM展現(xiàn)了巨大的應(yīng)用前景。利用GSMM不僅可以模擬微生物在不同培養(yǎng)條件下的生長(zhǎng)情況,為發(fā)酵過(guò)程優(yōu)化提供參考,而且實(shí)現(xiàn)了胞內(nèi)代謝流分布的定量分析,為代謝瓶頸的鑒定提供了理論依據(jù)。
代謝工程改造目標(biāo)菌株,提高產(chǎn)量是一種有效策略,已經(jīng)被廣泛地應(yīng)用[70]。但是由于缺乏對(duì)微生物整個(gè)代謝活動(dòng)的系統(tǒng)認(rèn)識(shí),單一水平上的基因改造策略難以高效地實(shí)現(xiàn)目標(biāo)。利用GSMM,結(jié)合不同的遺傳改造方法,可以從全局水平模擬:1) 競(jìng)爭(zhēng)路徑的消除;2) 合成路徑關(guān)鍵基因的強(qiáng)化;3) 反饋抑制的消除;4) 外源路徑的導(dǎo)入;5) 輔因子優(yōu)化等改造策略對(duì)目標(biāo)產(chǎn)物的影響,為系統(tǒng)代謝工程提供指導(dǎo)[71]。
為了消除競(jìng)爭(zhēng)路徑,通過(guò)一系列的算法篩選基因敲除靶點(diǎn),對(duì)基因敲除結(jié)果的組合優(yōu)化,從而提高目標(biāo)產(chǎn)品的產(chǎn)量。利用OptCouple,鑒定出大腸桿菌分別過(guò)量生產(chǎn)丙酸、衣康酸的一系列基因敲除靶點(diǎn),這些靶點(diǎn)大多存在于其競(jìng)爭(zhēng)途徑,此外還鑒定出甲基化修飾提高產(chǎn)量的靶點(diǎn)[61]。
在基因敲除菌株的基礎(chǔ)上,表達(dá)特定基因,模擬合成路徑關(guān)鍵基因的強(qiáng)化,分析基因表達(dá)對(duì)產(chǎn)物合成的影響。利用OptORF算法鑒定出敲除轉(zhuǎn)錄因子,同時(shí)敲除基因、和,在此基礎(chǔ)上過(guò)量表達(dá),使得乙醇得率從39.3%提高至86.2%[63]。
反饋抑制的消除主要是通過(guò)不同的算法模擬代謝路徑中某個(gè)基因的上調(diào)或下調(diào),從而使碳流更多地流向目標(biāo)產(chǎn)物。利用OptForce算法,對(duì)不同鏈長(zhǎng)脂肪酸合成過(guò)程中的上調(diào)、下調(diào)、敲除靶點(diǎn)進(jìn)行了鑒定。發(fā)現(xiàn)上調(diào)和acyl-ACP硫酯酶,同時(shí)敲除,最小M9培養(yǎng)基中C14-16脂肪酸的產(chǎn)量達(dá)到了1.7 g/L,得率為0.14 g/g葡萄糖(最大理論得率的39%)[72]。同樣地,利用該方法鑒定出敲除和,同時(shí)上調(diào)ACC、PGK、GAPD和PDH的表達(dá),能夠使胞內(nèi)丙酰輔酶A的含量提高3.1倍[73]。
對(duì)于非天然產(chǎn)物的合成,通常涉及異源途徑的導(dǎo)入。利用SimOptStrain鑒定出在.中敲除、和的同時(shí),引入氧代戊二酸脫氫酶(EC: 1.2.1.52) 催化的反應(yīng)(2-酮戊二酸+ CoA+NADP+=琥珀酰輔酶A+CO2+NADPH),使得琥珀酸得率達(dá)到了最大理論得率的32.5%[57]。
通過(guò)改善產(chǎn)物合成路徑中關(guān)鍵酶的輔因子的偏好性,消除輔因子失衡所造成的負(fù)面效應(yīng),有助于構(gòu)建高效的產(chǎn)物合成路徑?;贠ptSwap算法設(shè)計(jì)和優(yōu)化光滑球擬酵母生產(chǎn)丙酮酸,得到了12種輔因子交換和敲除策略,導(dǎo)致丙酮酸合成速率從0最高增加至 20.42 mmol/(g DW·h)[74]。
綜上所述,基于GSMM,篩選不同代謝改造靶點(diǎn)并組合,用于指導(dǎo)代謝工程,進(jìn)而通過(guò)實(shí)驗(yàn)進(jìn)行驗(yàn)證。應(yīng)用這種策略,已經(jīng)成功地應(yīng)用在有機(jī)酸、氨基酸、醇類等化學(xué)品的生產(chǎn)中。模型與實(shí)驗(yàn)相結(jié)合,不僅實(shí)現(xiàn)了菌株改造的理性設(shè)計(jì),提高了代謝工程改造效率,而且能夠從全局水平考慮遺傳擾動(dòng)對(duì)整個(gè)微生物胞內(nèi)代謝的影響,有助于實(shí)現(xiàn)代謝流的精準(zhǔn)調(diào)控。
針對(duì)工業(yè)微生物胞內(nèi)代謝的研究,國(guó)內(nèi)外研究人員采用生化工程和代謝工程等策略,開展了卓有成效的研究。結(jié)合GSMM,可以將理性設(shè)計(jì)與實(shí)驗(yàn)操作結(jié)合,從而高效地獲得工業(yè)生產(chǎn)菌株。GSMM經(jīng)過(guò)20年的發(fā)展,一方面通過(guò)不斷添加約束條件,提高了模型預(yù)測(cè)結(jié)果的準(zhǔn)確性,另一方面從單一菌株的模型發(fā)展至宏基因組模型。隨著一系列模型構(gòu)建工具和分析方法的開發(fā),不僅實(shí)現(xiàn)了微生物GSMM的快速構(gòu)建,而且能夠從預(yù)測(cè)細(xì)胞表型、指導(dǎo)代謝工程這兩個(gè)方面對(duì)微生物胞內(nèi)代謝活動(dòng)進(jìn)行系統(tǒng)分析。
隨著GSMM構(gòu)建工具的不斷開發(fā)和完善,目前已經(jīng)可以實(shí)現(xiàn)GSMM的快速、批量構(gòu)建,但是受限于模型構(gòu)建方法及構(gòu)建團(tuán)隊(duì)自身水平的限制,導(dǎo)致構(gòu)建的GSMMs質(zhì)量參差不齊,此外,這些GSMMs中的反應(yīng)和代謝物列表中的展現(xiàn)形式也缺乏統(tǒng)一,限制了GSMM的進(jìn)一步應(yīng)用。雖然目前已有一些數(shù)據(jù)庫(kù),如BIGG Models實(shí)現(xiàn)了已發(fā)表GSMMs的標(biāo)準(zhǔn)化,但是該數(shù)據(jù)庫(kù)目前僅收錄了85個(gè)模型[18]。因此亟需建立相應(yīng)的標(biāo)準(zhǔn)對(duì)模型進(jìn)行統(tǒng)一,并且搭建功能更全面的數(shù)據(jù)庫(kù)平臺(tái),提供GSMMs的檢索和下載。
雖然GSMM已經(jīng)被廣泛地應(yīng)用在多個(gè)方面,但是這些模型的約束參數(shù)都是固定的。而最新發(fā)展的機(jī)器學(xué)習(xí)(Machine learning) 方法,基于黑箱理論(Black-box),不需要對(duì)約束參數(shù)進(jìn)行設(shè)定,只需要提供一系列的訓(xùn)練集(Training data),就能夠?qū)?shù)進(jìn)行自動(dòng)修正,從而實(shí)現(xiàn)模型的精確預(yù)測(cè)。此外,為了克服黑箱機(jī)器學(xué)習(xí)方法無(wú)法直接揭示生物分子與細(xì)胞表型之間的相互作用關(guān)系的不足,Yang等進(jìn)一步開發(fā)了白箱理論(White-box) 用于揭示抗生素作用機(jī)制[75]。機(jī)器學(xué)習(xí)方法,作為一種新興的技術(shù),在現(xiàn)代社會(huì)展現(xiàn)了巨大的應(yīng)用潛力,已經(jīng)廣泛地應(yīng)用在語(yǔ)言識(shí)別、視覺(jué)對(duì)象識(shí)別、物體檢測(cè)、藥物發(fā)現(xiàn)和基因組分析等方面[76-78]。因此,采用機(jī)器學(xué)習(xí)方法對(duì)GSMM進(jìn)行分析,除了進(jìn)一步實(shí)現(xiàn)代謝流調(diào)控的精準(zhǔn)預(yù)測(cè),還可以用于復(fù)雜環(huán)境下相互作用關(guān)系的表征,則是未來(lái)GSMM的發(fā)展趨勢(shì)。
[1] Kim WJ, Kim HU, Lee SY. Current state and applications of microbial genome-scale metabolic models. Curr Opin Syst Biol, 2017, 2: 10–18.
[2] O'Brien EJ, Monk JM, Palsson BO. Using genome-scale models to predict biological capabilities. Cell, 2015, 161(5): 971–987.
[3] Nocon J, Steiger MG, Pfeffer M, et al. Model based engineering ofcentral metabolism enhances recombinant protein production. Metab Eng, 2014, 24: 129–138.
[4] Song CW, Kim DI, Choi S, et al. Metabolic engineering offor the production of fumaric acid. Biotechnol Bioeng, 2013, 110(7): 2025–2034.
[5] Dikicioglu D, Pir P, Onsan ZI, et al. Integration of metabolic modeling and phenotypic data in evaluation and improvement of ethanol production using respiration-deficient mutants of. Appl Environ Microbiol, 2008, 74(18): 5809–5816.
[6] Lee KY, Park JM, Kim TY, et al. The genome-scale metabolic network analysis ofZM4 explains physiological features and suggests ethanol and succinic acid production strategies. Microb Cell Fact, 2010, 9: 94.
[7] Lee J, Yun H, Feist AM, et al. Genome-scale reconstruction andanalysis of theATCC 824 metabolic network. Appl Microbiol Biotechnol, 2008, 80(5): 849–862.
[8] Ranganathan S, Maranas CD. Microbial 1-butanol production: identification of non-native production routes andengineering interventions. Biotechnol J, 2010, 5(7): 716–725.
[9] Lee SJ, Lee DY, Kim TY, et al. Metabolic engineering offor enhanced production of succinic acid, based on genome comparison andgene knockout simulation. Appl Environ Microbiol, 2005, 71(12): 7880–7887.
[10] Mienda BS, Shamsir MS, Illias RM. Model-guided metabolic gene knockout of gnd for enhanced succinate production infrom glucose and glycerol substrates. Comput Biol Chem, 2016, 61: 130–137.
[11] Fong SS, Burgard AP, Herring CD, et al.design and adaptive evolution offor production of lactic acid. Biotechnol Bioeng, 2005, 91(5): 643–648.
[12] Choi HS, Lee SY, Kim TY, et al.identification of gene amplification targets for improvement of lycopene production. Appl Environ Microbiol, 2010, 76(10): 3097–3105.
[13] Lee KH, Park JH, Kim TY, et al. Systems metabolic engineering offorL-threonine production. Mol Syst Biol, 2007, 3(1): 149.
[14] Park JH, Lee KH, Kim TY, et al. Metabolic engineering offor the production ofL-valine based on transcriptome analysis andgene knockout simulation. Proc Natl Acad Sci USA, 2007, 104(19): 7797–7802.
[15] Brochado AR, Matos C, M?ller BL, et al. Improved vanillin production in baker’s yeast throughdesign. Microb Cell Fact, 2010, 9: 84.
[16] Yim H, Haselbeck R, Niu W, et al. Metabolic engineering offor direct production of 1,4-butanediol. Nat Chem Biol, 2011, 7(7): 445–452.
[17] Ye C, Xu N, Dong C, et al. IMGMD: a platform for the integration and standardisation ofmicrobial genome-scale metabolic models. Sci Rep, 2017, 7(1): 727.
[18] King ZA, Lu J, Dr?ger A, et al. BiGG Models: a platform for integrating, standardizing and sharing genome-scale models. Nucleic Acids Res, 2016, 44(D1): D515–D522.
[19] Monk JM, Lloyd CJ, Brunk E, et al.ML1515, a knowledgebase that computestraits. Nat Biotechnol, 2017, 35(10): 904–908.
[20] O’Brien EJ, Lerman JA, Chang RL, et al. Genome-scale models of metabolism and gene expression extend and refine growth phenotype prediction. Mol Syst Biol, 2013, 9(1): 693.
[21] Yizhak K, Benyamini T, Liebermeister W, et al. Integrating quantitative proteomics and metabolomics with a genome-scale metabolic network model. Bioinformatics, 2010, 26(12): i255–i260.
[22] Feng XY, Zhao HM. Investigating xylose metabolism in recombinantvia13C metabolic flux analysis. Microb Cell Fact, 2013, 12: 114.
[23] Khodayari A, Maranas CD. A genome-scalekinetic metabolic model k-ecoli457 satisfying flux data for multiple mutant strains. Nat Commun, 2016, 7: 13806.
[24] Krumholz EW, Libourel IGL. Thermodynamic constraints improve metabolic networks. Biophys J, 2017, 113(3): 679–689.
[25] Sánchez BJ, Zhang C, Nilsson A, et al. Improving the phenotype predictions of a yeast genome-scale metabolic model by incorporating enzymatic constraints. Mol Syst Biol, 2017, 13(8): 935.
[26] Brunk E, Sahoo S, Zielinski DC, et al. Recon3D enables a three-dimensional view of gene variation in human metabolism. Nat Biotechnol, 2018, 36(3): 272–281.
[27] Carrera J, Estrela R, Luo J, et al. An integrative, multi-scale, genome-wide model reveals the phenotypic landscape of. Mol Syst Biol, 2014, 10(7): 735.
[28] Karr JR, Sanghvi JC, Macklin DN, et al. A whole-cell computational model predicts phenotype from genotype. Cell, 2012, 150(2): 389–401.
[29] Ye C, Zou W, Xu N, et al. Metabolic model reconstruction and analysis of an artificial microbial ecosystem for vitamin C production. J Biotechnol, 2014, 182–183: 61–67.
[30] Salimi F, Zhuang K, Mahadevan R. Genome-scale metabolic modeling of a clostridial co-culture for consolidated bioprocessing. Biotechnol J, 2010, 5(7): 726–738.
[31] Monk JM, Charusanti P, Aziz RK, et al. Genome-scale metabolic reconstructions of multiplestrains highlight strain-specific adaptations to nutritional environments. Proc Natl Acad Sci USA, 2013, 110(50): 20338–20343.
[32] Bosi E, Monk JM, Aziz RK, et al. Comparative genome-scale modelling ofstrains identifies strain-specific metabolic capabilities linked to pathogenicity. Proc Natl Acad Sci USA, 2016, 113(26): E3801–E3809.
[33] Seif Y, Kavvas E, Lachance JC, et al. Genome-scale metabolic reconstructions of multiplestrains reveal serovar-specific metabolic traits. Nat Commun, 2018, 9(1): 3771.
[34] Magnúsdóttir S, Heinken A, Kutt L, et al. Generation of genome-scale metabolic reconstructions for 773 members of the human gut microbiota. Nat Biotechnol, 2017, 35(1): 81–89.
[35] Garza DR, Van Verk MC, Huynen MA, et al. Towards predicting the environmental metabolome from metagenomics with a mechanistic model. Nat Microbiol, 2018, 3(4): 456–460.
[36] Schellenberger J, Que R, Fleming RMT, et al. Quantitative prediction of cellular metabolism with constraint-based models: the COBRA Toolbox v2.0. Nat Protoc, 2011, 6(9): 1290–1307.
[37] Heirendt L, Arreckx S, Pfau T, et al. Creation and analysis of biochemical constraint-based models using the COBRA Toolbox v.3.0. Nat Protoc, 2019, 14(3): 639–702.
[38] Wang H, Marci?auskas S, Sánchez BJ, et al. RAVEN 2.0: a versatile toolbox for metabolic network reconstruction and a case study on. PLoS Comput Biol, 2018, 14(10): e1006541.
[39] Alper HS. Systems Metabolic Engineering. New York: Humana Press, 2013: 17–45.
[40] Sanchez BJ, Nielsen J. Genome scale models of yeast: towards standardized evaluation and consistent omic integration. Integr Biol (Camb), 2015, 7(8): 846–858.
[41] Orth JD, Thiele I, Palsson B?. What is flux balance analysis? Nat Biotechnol, 2010, 28(3): 245–248.
[42] Covert MW, Schilling CH, Palsson B. Regulation of gene expression in flux balance models of metabolism. J Theor Biol, 2001, 213(1): 73–88.
[43] Covert MW, Xiao N, Chen TJ, et al. Integrating metabolic, transcriptional regulatory and signal transduction models in. Bioinformatics, 2008, 24(18): 2044–2050.
[44] Mahadevan R, Edwards JS, Doyle III FJ. Dynamic flux balance analysis of diauxic growth in. Biophys J, 2002, 83(3): 1331–1340.
[45] Khandelwal RA, Olivier BG, Roling WFM, et al. Community flux balance analysis for microbial consortia at balanced growth. PLoS ONE, 2013, 8(5): e64567.
[46] Lewis NE, Hixson KK, Conrad TM, et al. Omic data from evolved.are consistent with computed optimal growth from genome-scale models. Mol Syst Biol, 2010, 6(1): 390.
[47] Thiele I, Fleming RMT, Bordbar A, et al. Functional characterization of alternate optimal solutions of’s transcriptional and translational machinery. Biophys J, 2010, 98(10): 2072–2081.
[48] Benyamini T, Folger O, Ruppin E, et al. Flux balance analysis accounting for metabolite dilution. Genome Biol, 2010, 11(4): R43.
[49] Kelk SM, Olivier BG, Stougie L, et al. Optimal flux spaces of genome-scale stoichiometric models are determined by a few subnetworks. Sci Rep, 2012, 2: 580.
[50] Smallbone K, Simeonidis E. Flux balance analysis: a geometric perspective. J Theor Biol, 2009, 258(2): 311–315.
[51] Burgard AP, Pharkya P, Maranas CD. OptKnock: a bilevel programming framework for identifying gene knockout strategies for microbial strain optimization. Biotechnol Bioeng, 2003, 84(6): 647–657.
[52] Xu ZX, Zheng P, Sun JB, et al. ReacKnock: identifying reaction deletion strategies for microbial strain optimization based on genome-scale metabolic network. PLoS ONE, 2013, 8(12): e72150.
[53] King ZA, Feist AM. Optimizing cofactor specificity of oxidoreductase enzymes for the generation of microbial production strains—OptSwap. Ind Biotechnol, 2013, 9(4): 236–246.
[54] Ranganathan S, Suthers PF, Maranas CD. OptForce: an optimization procedure for identifying all genetic manipulations leading to targeted overproductions. PLoS Comput Biol, 2010, 6(4): e1000744.
[55] Chowdhury A, Zomorrodi AR, Maranas CD. k-OptForce: integrating kinetics with flux balance analysis for strain design. PLoS Comput Biol, 2014, 10(2): e1003487.
[56] Pharkya P, Burgard AP, Maranas CD. OptStrain: a computational framework for redesign of microbial production systems. Genome Res, 2004, 14(11): 2367–2376.
[57] Kim J, Reed JL, Maravelias CT. Large-scale bi-level strain design approaches and mixed-integer programming solution techniques. PLoS ONE, 2011, 6(9): e24162.
[58] Segrè D, Vitkup D, Church GM. Analysis of optimality in natural and perturbed metabolic networks. Proc Natl Acad Sci USA, 2002, 99(23): 15112–15117.
[59] Ren SG, Zeng B, Qian XN. Adaptive bi-level programming for optimal gene knockouts for targeted overproduction under phenotypic constraints. BMC Bioinformatics, 2013, 14(S2): S17.
[60] Tepper N, Shlomi T. Predicting metabolic engineering knockout strategies for chemical production: accounting for competing pathways. Bioinformatics, 2010, 26(4): 536–543.
[61] Jensen K, Broeken V, Hansen ASL, et al. OptCouple: joint simulation of gene knockouts, insertions and medium modifications for prediction of growth-coupled strain designs. Metab Eng Commun, 2019, 8: e00087.
[62] Patil KR, Rocha I, F?rster J, et al. Evolutionary programming as a platform formetabolic engineering. BMC Bioinformatics, 2005, 6: 308.
[63] Kim J, Reed JL. OptORF: optimal metabolic and regulatory perturbations for metabolic engineering of microbial strains. BMC Syst Biol, 2010, 4: 53.
[64] Gu DQ, Zhang C, Zhou SG, et al. IdealKnock: a framework for efficiently identifying knockout strategies leading to targeted overproduction. Comput Biol Chem, 2016, 61: 229–237.
[65] Pharkya P, Maranas CD. An optimization framework for identifying reaction activation/inhibition or elimination candidates for overproduction in microbial systems. Metab Eng, 2006, 8(1): 1–13.
[66] Rockwell G, Guido NJ, Church GM. Redirector: designing cell factories by reconstructing the metabolic objective. PLoS Comput Biol, 2013, 9(1): e1002882.
[67] Schuetz R, Kuepfer L, Sauer U. Systematic evaluation of objective functions for predicting intracellular fluxes in. Mol Syst Biol, 2007, 3(1): 119.
[68] Fan SC, Zhang ZY, Zou W, et al. Development of a minimal chemically defined medium forWSH001 based on its genome-scale metabolic model. J Biotechnol, 2014, 169: 15–22.
[69] Ye C, Xu N, Chen HQ, et al. Reconstruction and analysis of a genome-scale metabolic model of the oleaginous fungus. BMC Syst Biol, 2015, 9: 1.
[70] Chen XL, Gao C, Guo L, et al. DCEO Biotechnology: tools to design, construct, evaluate, and optimize the metabolic pathway for biosynthesis of chemicals. Chem Rev, 2018, 118(1): 4–72.
[71] Choi KR, Jang WD, Yang D, et al. Systems metabolic engineering strategies: integrating systems and synthetic biology with metabolic engineering. Trends Biotechnol, 2019, 37(8): 817–837.
[72] Ranganathan S, Tee TW, Chowdhury A, et al. An integrated computational and experimental study for overproducing fatty acids in. Metab Eng, 2012, 14(6): 687–704.
[73] Xu P, Ranganathan S, Fowler ZL, et al. Genome-scale metabolic network modeling results in minimal interventions that cooperatively force carbon flux towards malonyl-CoA. Metab Eng, 2011, 13(5): 578–587.
[74] Xu N, Ye C, Chen XL, et al. Genome-scale metabolic modelling common cofactors metabolism in microorganisms. J Biotechnol, 2017, 251: 1–13.
[75] Yang JH, Wright SN, Hamblin M, et al. A white-box machine learning approach for revealing antibiotic mechanisms of action. Cell, 2019, 177(6): 1649–1661.e9.
[76] LeCun Y, Bengio Y, Hinton G. Deep learning. Nature, 2015, 521(7553): 436–444.
[77] Moen E, Bannon D, Kudo T, et al. Deep learning for cellular image analysis. Nat Methods, 2019, doi: 10.1038/s41592-019-0403-1.
[78] Gazestani VH, Lewis NE. From genotype to phenotype: augmenting deep learning with networks and systems biology. Curr Opin Syst Biol, 2019, 15: 68–73.
Application of metabolic network model to analyze intracellular metabolism of industrial microorganisms
Chao Ye1,2, Nan Xu3, Xiulai Chen1,2, and Liming Liu1,2
1 State Key Laboratory of Food Science and Technology, Jiangnan University, Wuxi 214122, Jiangsu, China 2 Key Laboratory of Industrial Biotechnology, Ministry of Education, Jiangnan University, Wuxi 214122, Jiangsu, China 3 College of Bioscience and Biotechnology, Yangzhou University, Yangzhou 225009,Jiangsu, China
To quickly and efficiently understand the intracellular metabolic characteristics of industrial microorganisms, and to find potential metabolic engineering targets, genome-scale metabolic network models (GSMMs) as a systems biology tool, are attracting more and more attention. We review here the 20-year history of metabolic network model, analyze the research status and development of GSMMs, summarize the methods for model construction and analysis, and emphasize the applications of metabolic network model for analyzing intracellular metabolic activity of microorganisms from cellular phenotypes, and metabolic engineering. Furthermore, we indicate future development trend of metabolic network model.
intracellular metabolic activity of microorganisms, production performance, genome-scale metabolic model, systems biology
10.13345/j.cjb.190257
劉立明 博士、教授、博士生導(dǎo)師,教育部長(zhǎng)江學(xué)者特聘教授。研究方向?yàn)楣I(yè)生物技術(shù)、代謝工程、生物轉(zhuǎn)化和生物催化。在,、、、、、《生物工程學(xué)報(bào)》《微生物學(xué)報(bào)》等國(guó)內(nèi)外生物工程類主流學(xué)術(shù)期刊上以第一或責(zé)任作者身份發(fā)表學(xué)術(shù)論文120余篇,其中SCI論文100余篇。出版科技著作2部。獲得授權(quán)發(fā)明專利28項(xiàng),申請(qǐng)或公開發(fā)明專利20余項(xiàng)。研究成果近5年來(lái)獲國(guó)家技術(shù)發(fā)明二等獎(jiǎng)、教育部科技進(jìn)步一等獎(jiǎng)、中國(guó)石油與化學(xué)工業(yè)聯(lián)合會(huì)科技進(jìn)步一等獎(jiǎng)等5項(xiàng)科技獎(jiǎng)勵(lì)。
葉超, 徐楠, 陳修來(lái), 等. 應(yīng)用代謝網(wǎng)絡(luò)模型解析工業(yè)微生物胞內(nèi)代謝. 生物工程學(xué)報(bào), 2019, 35(10): 1901–1913.
Ye C, Xu N, Chen XL, et al. Application of metabolic network model to analyze intracellular metabolism of industrial microorganisms. Chin J Biotech, 2019, 35(10): 1901–1913.
June 16, 2019;
August 19, 2019
Supported by:National Key Research and Development Program of China (No. 2018YFA0901401), the Scientific and Technological Innovation Leading Talents of National “Ten Thousand Talent Program” (2018), the National Natural Science Foundation of China (No. 21808083), the Key Technologies Research and Development Program of Jiangsu Province (Nos. BE2018623, BE2017622), the Key Field Research and Development Program of Guangdong Province (No. 2019B020218001).
Liming Liu. Tel/Fax: +86-510-85197875; E-mail: mingll@jiangnan.edu.cn
國(guó)家重點(diǎn)研發(fā)計(jì)劃 (No. 2018YFA0901401),2018年“萬(wàn)人計(jì)劃”科技創(chuàng)新領(lǐng)軍人才支持經(jīng)費(fèi),國(guó)家自然科學(xué)基金 (No. 21808083),江蘇省科技支撐計(jì)劃社會(huì)發(fā)展項(xiàng)目 (Nos. BE2018623, BE2017622),廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃項(xiàng)目 (No. 2019B020218001) 資助。
(本文責(zé)編 陳宏宇)