禹 偉,高教琪,周雍進
(中國科學(xué)院大連化學(xué)物理研究所,中國科學(xué)院分離分析化學(xué)重點實驗室,遼寧 大連 116023)
微生物代謝工程通過改造或重構(gòu)微生物代謝途徑,使微生物利用廉價原料合成目的代謝產(chǎn)物,包括大宗化學(xué)品、精細化學(xué)品、生物燃料和天然產(chǎn)物等[1-4]。然而,由于微生物在進化過程中獲得了魯棒性強、調(diào)控緊密的代謝網(wǎng)絡(luò),制約著理性代謝工程改造[5]。近年來,隨著DNA/RNA測序和質(zhì)譜檢測技術(shù)的快速發(fā)展,基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué)等多組學(xué)策略的運用使我們更容易獲取與細胞生理和代謝相關(guān)的生物“大數(shù)據(jù)”,這些數(shù)據(jù)為改造和優(yōu)化生產(chǎn)菌株提供重要線索。
圖1 蛋白質(zhì)組學(xué)和代謝組學(xué)在微生物代謝工程中的應(yīng)用Fig.1 Application of proteomics and metabolomics in microbial metabolic engineering
蛋白質(zhì)組學(xué)運用雙向聚丙烯酰胺凝膠電泳(2D SDS-PAGE)和質(zhì)譜等技術(shù),大規(guī)模、高通量、系統(tǒng)化研究某一生物所表達的全部蛋白質(zhì)及其特征,包括蛋白質(zhì)表達水平、翻譯后修飾、蛋白質(zhì)與蛋白質(zhì)的相互作用等。蛋白質(zhì)組學(xué)除了能夠提供定量的數(shù)據(jù)以外,還能提供包括蛋白質(zhì)定位和修飾的定性信息,因此對深入理解生物代謝具有重要作用[6]。而代謝組學(xué)則運用質(zhì)譜、核磁共振、液相色譜-質(zhì)譜聯(lián)用、氣相色譜-質(zhì)譜聯(lián)用等技術(shù),對某一生物在特定生理時期內(nèi)所有相對分子質(zhì)量較低(<1 000)的代謝物同時進行定性和定量分析。由此可見,質(zhì)譜技術(shù)在蛋白質(zhì)組學(xué)和代謝組學(xué)的研究中發(fā)揮至關(guān)重要的作用,而關(guān)于質(zhì)譜技術(shù)的發(fā)展已有詳細綜述[7],在此不再贅述。轉(zhuǎn)錄組主要測定生物體內(nèi)各基因的轉(zhuǎn)錄水平,由于轉(zhuǎn)錄水平受多方面因素的調(diào)控,如底物濃度、誘導(dǎo)劑濃度、抑制劑濃度等,測定的基因轉(zhuǎn)錄水平很難直接預(yù)測表型,因此蛋白質(zhì)組學(xué)和代謝組學(xué)相對于轉(zhuǎn)錄組而言,對于生物表型的鑒定或預(yù)測更加直觀可靠。需要強調(diào)的是,蛋白質(zhì)(尤其是酶)的含量并不一定與其酶活力相匹配,而代謝組學(xué)能夠直接測定特定條件下的代謝物水平以及代謝流向,因而可以與蛋白質(zhì)組學(xué)數(shù)據(jù)相互補充。目前廣泛使用的基因組尺度代謝模型(genome scale metabolic model,簡稱GEM),就是整合基因組學(xué)、轉(zhuǎn)錄組學(xué)、代謝流組學(xué)、蛋白質(zhì)組學(xué)等多組學(xué)數(shù)據(jù)的代謝網(wǎng)絡(luò)模型,GEM從全局角度理解代謝功能,通過測定基因轉(zhuǎn)錄水平、代謝物種類,不僅可以預(yù)測微生物生長表型,還能指導(dǎo)系統(tǒng)代謝工程改造[8]。
除了整合多組學(xué)策略進行系統(tǒng)代謝工程,單獨運用蛋白質(zhì)組學(xué)或代謝組學(xué)也可以指導(dǎo)微生物代謝工程改造。蛋白質(zhì)組學(xué)定量分析微生物體內(nèi)全部蛋白質(zhì)(酶)的含量,通過比較不同條件下酶的相對表達水平,尋找需要優(yōu)化表達水平的酶作為代謝工程靶點,以提高目的產(chǎn)物的產(chǎn)量[9]。而代謝組學(xué)通過分析菌株不同條件下代謝物含量的變化,可以指導(dǎo)菌株高效合成目的產(chǎn)物,提高菌株對產(chǎn)物對環(huán)境脅迫的耐受性,預(yù)測限速步驟等[10-12]。另外,蛋白質(zhì)組學(xué)和代謝組學(xué)相結(jié)合,還可以挖掘植物次級代謝途徑,促進微生物代謝工程合成更豐富的天然產(chǎn)物[13]。本文重點對近年來蛋白質(zhì)組學(xué)和代謝組學(xué)在微生物代謝工程中的應(yīng)用(見圖1)進行綜述和展望。
GEM以基因組學(xué)數(shù)據(jù)為基礎(chǔ),整合蛋白質(zhì)組學(xué)和代謝組學(xué)等多組學(xué)數(shù)據(jù),描述微生物體內(nèi)所有代謝反應(yīng)、催化反應(yīng)的酶以及酶的編碼基因三者間的相互關(guān)系(見圖2),已經(jīng)成為系統(tǒng)研究微生物代謝的重要工具[14]。GEM模擬代謝過程,對于特定目的產(chǎn)物,提出潛在菌種改造策略,例如敲除或弱化競爭代謝途徑、過表達目的代謝途徑的關(guān)鍵酶、改變代謝流方向等,從而提高目的代謝產(chǎn)物產(chǎn)量[15]。
圖2 基因組尺度代謝模型的構(gòu)建流程Fig.2 Construction procedure of genome scale metabolic model
光滑球擬酵母(Candidaglabrata)是一種高產(chǎn)丙酮酸的工業(yè)微生物,為了深入理解該菌種的生理和細胞代謝,Xu等[16]構(gòu)建了C.glabrata的GEM,該模型包含804個基因、1 287個代謝反應(yīng)和1 025種代謝物,分析確定了高產(chǎn)丙酮酸的原因,包括高效的葡萄糖轉(zhuǎn)運系統(tǒng)、3條丙酮酸合成途徑,以及吡哆醛、硫胺素、煙酸和生物素合成關(guān)鍵步驟的缺失;在此模型預(yù)測的基礎(chǔ)上,提出其他目標(biāo)產(chǎn)物代謝工程策略:(1)抑制α-酮戊二酸脫氫酶的活性,增加硫胺素的添加量,提高線粒體中ATP的水平,進一步增加了α-酮戊二酸的產(chǎn)量;(2)過表達丙酮酸羧化酶和蘋果酸脫氫酶基因,提高糖酵解和細胞質(zhì)還原途徑的流量,實現(xiàn)了5.4 g/L富馬酸的積累;(3)過表達α-乙酰乳酸脫羧酶(催化丙酮酸裂解形成乙偶姻),實現(xiàn)了1.2 g/L乙偶姻的積累。該研究證明了GEM策略用于簡化代謝工程靶點的通用性。
巴斯德畢赤酵母(Pichiapastoris,最新命名Komagataellaphaffii)由于其高效的甲醇誘導(dǎo)型醇氧化酶強啟動子,廣泛用于異源蛋白質(zhì)表達[17]。Ye等[18]在最新的基因組注釋和文獻基礎(chǔ)上,構(gòu)建了全新的P.pastoris的代謝模型iRY1243,新模型包含2 407個代謝反應(yīng)、1 094種代謝物、1 243個基因。運用該模型,作者成功預(yù)測了在葡萄糖為碳源的合成培養(yǎng)基上生長時的123個生長必需基因,這些基因與輔因子代謝、三羧酸循環(huán)、脂類合成有關(guān)。另外,模型預(yù)測敲除甲醇氧化酶編碼基因aox1、腺苷甲硫氨酸脫羧酶編碼基因spe2、胱硫醚β-合成酶編碼基因cys4、插入鏈霉殺陽菌素裂解酶編碼基因vgb,以及過表達葡萄糖-6-磷酸脫氫酶編碼基因zwf1、甲硫氨酸腺苷轉(zhuǎn)移酶編碼基因sam2,可增加S-腺苷甲硫氨酸(SAM)的產(chǎn)量,實驗結(jié)果與預(yù)測一致,說明該模型具有指導(dǎo)畢赤酵母代謝工程改造的應(yīng)用前景。
解酯耶氏酵母(Yarrowialipolytica)是一種模式產(chǎn)油酵母,胞內(nèi)最多可積累自身干重50%的油脂,而油脂可用于生產(chǎn)高品質(zhì)生物柴油[19]。Pan等[20]結(jié)合基因組注釋和代謝組學(xué)、蛋白質(zhì)組學(xué)等多組學(xué)數(shù)據(jù)庫的信息,構(gòu)建了Y.lipolytica的基因組尺度代謝模型iYL619_PCP,其中包含619個基因、843種代謝物和1 142個生化反應(yīng);該模型成功預(yù)測了Y.lipolytica的最小成分培養(yǎng)基以及在不同底物上的生長能力,利用代謝流平衡分析模擬單基因敲除過程,預(yù)測了模型的必需基因和半必需基因;另外,在該模型的基礎(chǔ)上通過代謝組學(xué)進行代謝流擾動分析,得出乙酰-輔酶A(CoA)羧化酶是提高油脂合成的關(guān)鍵酶,以及2-磷酸甘油酸轉(zhuǎn)化為丙酮酸的兩個酶編碼基因的敲除可增加絲氨酸的合成。
目前,大量相繼報道的組學(xué)數(shù)據(jù)已經(jīng)被用于構(gòu)建更豐富的微生物GEM,這必將在預(yù)測微生物表型和指導(dǎo)代謝工程等方面做出重要貢獻。
運用蛋白質(zhì)組學(xué)和代謝組學(xué)分析不同表型和基因型的菌株,探究菌株生產(chǎn)與酶水平、代謝物水平之間的關(guān)聯(lián),確定菌株改造靶點,可以指導(dǎo)菌株生物的合成。
Alonso-Gutierrez等[9]報道了一種定量靶向蛋白質(zhì)組學(xué)數(shù)據(jù)分析方法:蛋白質(zhì)組主成分分析(PCAP)。研究人員[9]將甲羥戊酸(MVA)途徑的9個基因分成3個基因簇,并分別通過單質(zhì)粒和雙質(zhì)粒表達的排列組合,構(gòu)建了27株大腸桿菌(Escherichiacoli)工程菌,然后分析各菌株產(chǎn)量與MVA途徑酶水平的關(guān)聯(lián),得出萜類合成酶的過表達和其他酶的平衡表達使檸檬烯產(chǎn)量提高40%,而且將該策略應(yīng)用于生物燃料-甜沒藥烯的合成,產(chǎn)量達到最高報道值(1 150 mg/L),相比之前報道的雙質(zhì)粒表達系統(tǒng)[21],產(chǎn)量提高2倍以上。
Redding-Johanson等[22]報道了另一種靶向蛋白質(zhì)組學(xué)數(shù)據(jù)分析方法:選擇性反應(yīng)監(jiān)測(SRM)質(zhì)譜。研究人員[22]通過SRM技術(shù)發(fā)現(xiàn),由9個基因組成的紫穗槐二烯合成途徑中蛋白表達量的增加直接促進產(chǎn)量的增加;由于該途徑中來源于釀酒酵母(Saccharomycescerevisiae)的甲羥戊酸激酶(MK)和磷酸甲羥戊酸激酶(PMK)在SRM檢測中幾乎沒有表達,推測是轉(zhuǎn)錄水平低導(dǎo)致蛋白質(zhì)表達困難,而經(jīng)過密碼子優(yōu)化后由強啟動子控制MK和PMK基因的表達,使蛋白質(zhì)表達水平明顯提高,產(chǎn)物紫穗槐二烯的產(chǎn)量提高了3倍。
除了蛋白質(zhì)組學(xué)指導(dǎo)菌株代謝工程改造外,代謝組學(xué)通過測定工程菌改造前后的代謝物變化,也可以為進一步代謝途徑優(yōu)化提供潛在的改造靶點。Gold等[10]使用靶向代謝組學(xué)評估代謝工程策略,以提高S.cerevisiae中L-酪氨酸的產(chǎn)量,通過定向測定不同改造菌株中心碳代謝途徑和酪氨酸合成途徑的葡萄糖、丙酮酸、磷酸烯醇式丙酮酸、赤蘚糖-4-磷酸、脫氫莽草酸、預(yù)苯酸、酪氨酸以及香豆酸等代謝物比濃度的時間變化,最終確定葡萄糖-6-磷酸脫氫酶Zwf1、環(huán)己二烯脫氫酶TyrC、反饋抑制耐受性3-脫氧-7-磷酸景天庚酮糖合成酶Aro4為重要的代謝調(diào)控點,敲除ZWF1、過表達TYRC以及解除果糖-1,6-二磷酸對3-脫氧-7-磷酸景天庚酮糖合成酶的抑制的ARO4FBR基因后,酪氨酸產(chǎn)量相比原始菌株提高384倍,達到520 μmol/g DCW。
綜上,蛋白質(zhì)組學(xué)和代謝組學(xué)指導(dǎo)菌株生物合成的主要策略是,通過檢測代謝物水平或酶蛋白質(zhì)表達水平,確定與生物合成相關(guān)的代謝途徑調(diào)控靶點,然后通過基因工程改造相應(yīng)的靶點進行驗證,最終通過多策略結(jié)合實現(xiàn)菌株生物合成的改善。
以微生物細胞工廠生產(chǎn)生物能源,如乙醇、丁醇等,可部分替代石油基運輸燃料,被認為是可持續(xù)、環(huán)境友好型生物制造過程[23]。然而,這些低碳醇類對微生物具有一定的毒害作用,因此提高產(chǎn)物耐受性非常重要,可提高菌株生長能力以及目標(biāo)產(chǎn)物產(chǎn)量[24]。由于耐受性受多個相互關(guān)聯(lián)的機制調(diào)控[25],因此難以獲得特異的耐受性調(diào)控靶點。而代謝組學(xué)可以測定不同菌株在不同條件下的代謝物水平,尋找與菌株耐受性相關(guān)的代謝物及相應(yīng)的改造位點;蛋白質(zhì)組學(xué)可以比較不同耐受性菌株的差異表達蛋白質(zhì),尋找與耐受性相關(guān)的靶點蛋白質(zhì)及其調(diào)控網(wǎng)絡(luò),為菌株耐受性改造提供指導(dǎo)(見表1)。
Hasunuma等[11]構(gòu)建了一株利用木糖的S.cerevisiae工程菌,借助基于毛細管電泳-質(zhì)譜聯(lián)用的代謝組學(xué)方法,測定不同乙酸濃度下的胞內(nèi)代謝物水平,研究乙酸對菌株木糖發(fā)酵的影響;代謝組學(xué)分析表明,在添加乙酸后非氧化磷酸戊糖(PPP)途徑的代謝物-7-磷酸景天庚酮糖、5-磷酸核酮糖、5-磷酸核糖和4-磷酸赤蘚糖顯著積累,說明乙酸減慢了PPP途徑的下游代謝步驟;在此信息指導(dǎo)下,過表達磷酸戊糖途徑關(guān)鍵基因轉(zhuǎn)酮酶基因TKL1和轉(zhuǎn)醛酶基因TAL1,顯著提高了菌株對乙酸的耐受性,工程菌株在60 mmol/L乙酸存在下乙醇產(chǎn)量比出發(fā)菌株提高9.47倍。Teoh等[26]應(yīng)用一種基于代謝組學(xué)的半理性策略提高S.cerevisiae對1-丁醇的耐受性,借助氣相色譜-質(zhì)譜聯(lián)用非靶向代謝組學(xué),測定不同丁醇耐受性的19株單基因敲除菌株的代謝物指紋圖譜,并建立代謝物豐度與脅迫生長速率之間的回歸模型;模型分析得出,蘇氨酸濃度與菌株生長顯著正相關(guān),而檸檬酸濃度與菌株生長顯著負相關(guān),因此提出菌株改造的策略為增加蘇氨酸積累量、減少檸檬酸積累量。與出發(fā)菌株相比,工程菌株在丁醇脅迫條件下比生長速率更高,即提高了菌株對丁醇的耐受性。Ohta等[27]運用同樣的策略,檢測出與S.cerevisiae乙醇耐受性相關(guān)的化合物,如纈氨酸、肌醇等,因此這兩種代謝物被認為是潛在的改造目標(biāo),經(jīng)過代謝工程改造增加纈氨酸的積累、加強肌醇的還原,最終顯著提高菌株對乙醇的耐受性。
表1 蛋白質(zhì)學(xué)和代謝組學(xué)指導(dǎo)菌株耐受性改造Table1 Guidance of microbial stress tolerance engineering by proteomics and metabolomics
2DE:two-dimensional electrophoresis;iTRAQ:isobaric tags for relative and absolute quantitation.
Mao等[32]運用比較蛋白質(zhì)組學(xué)分析野生型和高丁醇耐受性丙酮丁醇羧菌(Clostridiumacetobutylicum)在產(chǎn)酸階段和產(chǎn)溶劑階段的差異表達蛋白質(zhì);等級聚類分析表明,在丁醇耐受菌株中伴侶蛋白質(zhì)和產(chǎn)溶劑相關(guān)蛋白質(zhì)在兩階段都上調(diào),而氨基酸代謝和蛋白質(zhì)合成相關(guān)蛋白質(zhì)都下調(diào);這一結(jié)果闡述了C.acetobutylicum的丁醇耐受性機制,為丁醇耐受性改造提供了潛在的靶點蛋白質(zhì)。Jia等[33]通過基因組比對得到了與丁醇耐受性相關(guān)的雙功能未知基因SMB_G1518-1519,敲除該基因提高了C.acetobutylicum的丁醇耐受性;為進一步分析耐受性提高的機制,運用蛋白質(zhì)組學(xué)比較基因敲除菌株與原始菌株,發(fā)現(xiàn)與碳代謝、細胞流動、伴侶蛋白質(zhì)和脂肪酸合成相關(guān)的蛋白質(zhì)表達量都增加2倍以上,證明SMB_G1518-1519是丁醇耐受性的負調(diào)控因子。
代謝途徑一般由多步酶促反應(yīng)組成,但往往這些酶催化效率很難完全協(xié)調(diào)匹配,其中酶催化效率較低的反應(yīng)便成為限制該代謝途徑的瓶頸,即限速步驟。代謝工程優(yōu)化細胞生產(chǎn)性能的一般策略,是在首輪改造后鑒定限速步驟,對限速步驟進行下一輪改造[36]。因此,鑒定限速步驟是改造中的重要環(huán)節(jié)。代謝組學(xué)可以通過定量分析胞內(nèi)代謝物濃度,尋找濃度明顯差異的代謝物,進而鑒定代謝途徑的限速步驟(見圖3)。
藍藻(Synechocystissp.)可以通過光合作用利用CO2生產(chǎn)燃料和化學(xué)品。Noguchi等[12]在藍藻中引入來源于梭菌的CoA途徑,改造后的菌株可以使CO2轉(zhuǎn)化為1-丁醇。為了優(yōu)化CoA途徑,研究人員[12]使用離子對液相色譜-三重四極桿質(zhì)譜,以13C標(biāo)記的藍藻細胞提取物為內(nèi)標(biāo),測定胞內(nèi)各代謝物的水平,結(jié)果分析表明丁酰-CoA還原為丁醇的反應(yīng)是該途徑的限速步驟,優(yōu)化該反應(yīng)后不僅增加丁醇的產(chǎn)量,還提高了胞內(nèi)乙酰-CoA和丙二酰-CoA含量,從而驗證了丁酰-CoA還原反應(yīng)為限速步驟的推測。
圖3 代謝組學(xué)預(yù)測代謝途徑限速步驟Fig.3 Prediction of rate-limiting steps in metabolic pathway via metabolomics
Tamakawa等[37]構(gòu)建了一株能夠利用木糖產(chǎn)乙醇的產(chǎn)朊假絲酵母(Candidautilis),但乙醇產(chǎn)量較低,因此利用CE-TOF MS對菌株全局代謝物進行代謝組學(xué)分析,結(jié)果表明木糖發(fā)酵菌株相比原始菌株積累較多的磷酸戊糖途徑中間代謝物、還原型煙酰胺腺嘌呤二核苷酸(NADH)和3-磷酸甘油醛上游的糖酵解代謝物,由于磷酸戊糖途徑的上游木糖利用和糖酵解途徑都與NADH有關(guān),推測高比例的NADH/煙酰胺腺嘌呤二核苷酸(NAD+)是木糖產(chǎn)乙醇的限速步驟;因此過表達了NADH依賴型的醇脫氫酶ADH1,該酶在催化乙醛轉(zhuǎn)化為乙醇的同時將NADH轉(zhuǎn)化為NAD+,使乙醇產(chǎn)量增加了17%。
Hasunuma等[38]利用藍藻生產(chǎn)琥珀酸,通過CE-MS代謝組學(xué)測定菌株在黑暗厭氧條件下還原三羧酸途徑生產(chǎn)琥珀酸的13C標(biāo)記代謝物的動態(tài)變化,發(fā)現(xiàn)與磷酸烯醇式丙酮酸和乙酰-CoA相比,下游檸檬酸、蘋果酸、延胡索酸和琥珀酸增加速度慢,推測催化丙酮酸生成草酰乙酸的丙酮酸羧化酶可能是一個限速酶;通過過表達丙酮酸羧化酶基因以及供應(yīng)碳酸鹽,顯著提高了琥珀酸的產(chǎn)量(由120 mg/L提高到192 mg/L,提高60%)。
圖4 蛋白質(zhì)組學(xué)和代謝組學(xué)挖掘植物次級代謝途徑Fig.4 Excavation of plant secondary metabolic pathway via proteomics and metabolomics 2D SDS-PAGE:two-dimensional sodium dodecyl sulfate polyacrylamide gel electrophoresis;PCA:principal component analysis;PCC:pearson correlation coefficient;HCA:hierarchical cluster analysis;BL-SOM:batch-learning self-organizing map.
次級代謝產(chǎn)物是在生命周期或形態(tài)分化的特定時期產(chǎn)生的低相對分子質(zhì)量的活性物質(zhì)的總稱。植物次級代謝產(chǎn)物種類繁雜,可廣泛用于食品添加劑、香料、殺蟲劑、色素和生物燃料等。而通過植物本身生產(chǎn)次級代謝產(chǎn)物面臨產(chǎn)量低、分離成本高、規(guī)模放大困難等挑戰(zhàn)。因此,微生物合成植物次級代謝產(chǎn)物具有一定應(yīng)用前景,例如在微生物中構(gòu)建青蒿素前體青蒿酸的生物合成途徑能顯著提高青蒿素的產(chǎn)量[39]。次級代謝產(chǎn)物微生物合成需要清晰的合成途徑相關(guān)基因原件,而蛋白質(zhì)組學(xué)和代謝組學(xué)的發(fā)展加速了對次級代謝途徑的闡述和解析。使用多組學(xué)方法可以發(fā)現(xiàn)植物次級代謝新基因,從全局水平理解基因功能,并在此基礎(chǔ)上挖掘新的次級代謝途徑,為微生物代謝工程合成天然產(chǎn)物提供重要理論依據(jù)(見圖4)。
次級代謝產(chǎn)物的合成與調(diào)控受多個基因的控制,鑒定這些基因是揭示次級代謝的首要任務(wù)。蛋白質(zhì)組學(xué)可以鑒定植物次級代謝的酶和調(diào)控蛋白質(zhì),根據(jù)美國國立生物技術(shù)信息中心(NCBI)序列同源性比對找到相應(yīng)的基因。例如,Decker等[40]運用蛋白質(zhì)組學(xué)分析了富含罌粟的蛋白質(zhì)乳液中75個蛋白質(zhì)點,其中69個蛋白質(zhì)通過與已知蛋白質(zhì)同源比對確定其功能,最終鑒定出參與嗎啡生物合成的關(guān)鍵酶:可待因酮還原酶。Lei等[41]運用蛋白質(zhì)組學(xué)分析模式豆類蒺藜狀苜蓿細胞懸液的蛋白質(zhì)組分,鑒定和定量檢測1 367個蛋白質(zhì),其中約5%的蛋白質(zhì)與次級代謝相關(guān),包括與黃酮/異黃酮、查爾酮代謝相關(guān)的酶。
隨著后基因組時代的到來,植物基因組測序積累了海量的基因信息,但如何注釋這些基因的功能仍面臨一定挑戰(zhàn)。代謝組學(xué)是聯(lián)系基因型和表型的紐帶,但代謝物與基因之間并不總具有直接聯(lián)系。為解決這一問題,Raamsdonk等[42]基于代謝物的相關(guān)變化能反映沉默基因的作用位點這一思想,推測相似的基因?qū)е孪嗨频拇x物變化,而未知功能的基因可通過代謝物比較來鑒定,據(jù)此發(fā)明了一種利用比較代謝組學(xué)測定代謝物變化來鑒定未知基因功能的方法。鑒定新基因的另一策略是非靶向轉(zhuǎn)錄組學(xué)和代謝組學(xué)分析,這一策略利用batch-learning self-organizing gene mapping策略把受同一機制調(diào)控的一系列代謝物和基因聚為一類,該方法將3個未表征的潛在的磺基轉(zhuǎn)移酶基因鑒定為芥子油苷生物合成基因,而重組基因體外酶活測試也證明了這3個基因為脫磺芥子油苷磺基轉(zhuǎn)移酶,驗證了該策略的效果[43]。
萜類化合物是種類多樣的天然產(chǎn)物,已發(fā)現(xiàn)的萜類生物合成途徑有兩種:甲醛戊酸(MVA)途徑和2-C-甲基-D-赤蘚糖醇-4-磷酸(MEP)途徑[44]。雖然上游代謝途徑的基因非常保守,但大多數(shù)萜類物質(zhì)下游合成途徑及關(guān)鍵的合成酶基因都是未知的,成為其微生物合成的限制因素。Farag等[45]運用代謝組學(xué)研究蒺藜狀苜蓿中一個新的異黃酮生物合成途徑,通過高效液相色譜-離子肼色譜分析響應(yīng)酵母粉誘導(dǎo)的苜蓿細胞懸浮培養(yǎng)物胞內(nèi)和胞外次級代謝物的組分,發(fā)現(xiàn)3種新的甲基化異黃酮,同位素標(biāo)記實驗表明前兩種異黃酮均來源于芒柄花黃素,標(biāo)記實驗和相關(guān)性分析最終揭示了這兩種異黃酮的生物合成途徑。另外,非靶向代謝組學(xué)是一種檢測未知途徑新代謝物的高通量方法。Keurentjes等[46]應(yīng)用高效液相色譜-飛行時間質(zhì)譜鑒定了不同來源擬南芥的代謝物,比較分析并發(fā)現(xiàn)了一些未知代謝途徑,再通過定量特性位點分析得到了一個新的脂肪族芥子油苷生物合成途徑網(wǎng)絡(luò)。
本文總結(jié)了蛋白質(zhì)組學(xué)和代謝組學(xué)在微生物代謝工程中的應(yīng)用,特別介紹了整合多組學(xué)數(shù)據(jù)構(gòu)建基因組尺度代謝模型、菌株生物合成優(yōu)化、菌株耐受性改造以及代謝途徑限速步驟預(yù)測的成功案例。除此之外,蛋白質(zhì)組學(xué)和代謝組學(xué)能加快植物次級代謝途徑挖掘,為微生物合成天然產(chǎn)物提供新酶基因。
雖然研究報道了越來越多的微生物代謝模型,目前代謝模型在線預(yù)測的準確性還有待進一步提高。例如自動化構(gòu)建的模型一般都是粗模型,缺乏細胞酶動力學(xué)數(shù)據(jù)和相關(guān)調(diào)控機制,因而只能反映代謝特征而不能精確定量模擬。因此,需要整合更多的蛋白質(zhì)組學(xué)、代謝組學(xué)、流量組學(xué)、調(diào)控組學(xué)等多組學(xué)數(shù)據(jù)以及代謝酶催化速率,進一步提高模型準確性和精確度。目前,研究人員關(guān)于微生物生理和代謝相關(guān)的多組學(xué)數(shù)據(jù)通常都是發(fā)表在各自的論文中,缺乏系統(tǒng)性的收集和整理,人工匯集這些珍貴的實驗數(shù)據(jù)又相當(dāng)困難。然而,隨著生物“大數(shù)據(jù)”的不斷積累和人工智能的日益發(fā)展,如果研究人員將各自分散的多組學(xué)數(shù)據(jù)匯聚于統(tǒng)一的數(shù)據(jù)庫,運用數(shù)據(jù)科學(xué)和人工智能的策略對多樣化數(shù)據(jù)進行分析整理,不斷更新和修正已有的系統(tǒng)生物學(xué)信息,有望更好地指導(dǎo)微生物代謝工程,從而高效合成更多重要化學(xué)品。