史碩博,陳濤,趙學(xué)明
1 天津大學(xué) 系統(tǒng)生物工程教育部重點(diǎn)實(shí)驗(yàn)室,天津 300072
2 愛(ài)丁堡大學(xué)-天津大學(xué)系統(tǒng)生物學(xué)與合成生物學(xué)聯(lián)合研究中心,天津 300072
代謝工程
轉(zhuǎn)錄組平臺(tái)技術(shù)及其在代謝工程中的應(yīng)用
史碩博1,2,陳濤1,2,趙學(xué)明1,2
1 天津大學(xué) 系統(tǒng)生物工程教育部重點(diǎn)實(shí)驗(yàn)室,天津 300072
2 愛(ài)丁堡大學(xué)-天津大學(xué)系統(tǒng)生物學(xué)與合成生物學(xué)聯(lián)合研究中心,天津 300072
組學(xué)技術(shù)在系統(tǒng)水平上對(duì)細(xì)胞代謝進(jìn)行全面的分析,極大地促進(jìn)了代謝工程的發(fā)展和應(yīng)用。全基因組水平的轉(zhuǎn)錄分析可以使研究者更加精確地評(píng)估細(xì)胞表型,加深對(duì)細(xì)胞代謝的理解。而且轉(zhuǎn)錄組分析也有助于研究者鑒定菌種改良的目標(biāo)基因,加速對(duì)微生物細(xì)胞工廠的合理設(shè)計(jì)及構(gòu)建。文中介紹了 3種主要轉(zhuǎn)錄組平臺(tái)技術(shù)的原理,并總結(jié)了轉(zhuǎn)錄組學(xué)在代謝工程領(lǐng)域中應(yīng)用的最新進(jìn)展和未來(lái)發(fā)展趨勢(shì)。
轉(zhuǎn)錄組,代謝工程,基因芯片,serial analysis of gene expression (SAGE),massively parallel signature sequencing(MPSS),RNA-seq
Abstract:Omics technologies have profoundly promoted development and applications of metabolic engineering by analysis of cell metabolism at a system level. Whole genome transcription profiles have provided researchers more rigorous evaluation of cell phenotype and an increased understanding of cellular metabolism. Furthermore, transcriptome analysis can conduce to identification of effective gene targets for strain improvement, and consequently accelerates rational design and construction of microbial cell factories for desired product. In this review, we briefly introduced the principle of three main platforms of transcriptome, and reviewed the recent applications of the transcriptome to metabolic engineering, finally provided conclusions and future prospects.
Keywords:transcriptome, metabolic engineering, microarray, SAGE, MPSS, RNA-seq
近年來(lái),包括基因組、轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組和代謝通量組的各種組學(xué)技術(shù)在揭示細(xì)胞生理活動(dòng)規(guī)律的研究中起著越來(lái)越重要的作用[1-2]。通過(guò)組學(xué)技術(shù),可以系統(tǒng)評(píng)價(jià)細(xì)胞表型,并根據(jù)評(píng)價(jià)結(jié)果進(jìn)一步設(shè)計(jì)、修飾和重構(gòu)細(xì)胞,提升代謝工程的合理性和有效性[3-4],這就是在后基因組時(shí)代所強(qiáng)調(diào)采取組學(xué)技術(shù)指導(dǎo)的代謝工程研究方法,稱之為“系統(tǒng)代謝工程”[5]。
在各種組學(xué)技術(shù)中,轉(zhuǎn)錄組學(xué)是率先發(fā)展起來(lái)以及應(yīng)用最廣泛的技術(shù)[6]。細(xì)胞的功能是從基因的表達(dá)開(kāi)始的,轉(zhuǎn)錄組是指某一時(shí)間細(xì)胞內(nèi)所有基因轉(zhuǎn)錄而來(lái)的RNA總稱。通過(guò)分析轉(zhuǎn)錄組,可高通量地獲得基因表達(dá)的RNA水平有關(guān)信息,可以揭示基因表達(dá)與一些生命現(xiàn)象之間的內(nèi)在聯(lián)系。據(jù)此我們可以高通量表征細(xì)胞生理活動(dòng)規(guī)律,確定細(xì)胞代謝特性,并進(jìn)而對(duì)細(xì)胞進(jìn)行修飾改造[7-8]。本文介紹了轉(zhuǎn)錄組學(xué)主要技術(shù)平臺(tái)及其原理,總結(jié)和評(píng)述了轉(zhuǎn)錄組學(xué)在代謝工程中的應(yīng)用及進(jìn)展。
為了高通量并行分析基因的表達(dá)情況,各種轉(zhuǎn)錄組技術(shù)平臺(tái)得到迅速發(fā)展,主要包括:基因芯片技術(shù) (Microarray)、基因表達(dá)系列分析技術(shù) (Serial analysis of gene expression,SAGE)、大規(guī)模平行測(cè)序技術(shù) (Massively parallel signature sequencing,MPSS)以及最新提出的 RNA測(cè)序技術(shù) (RNA sequencing,RNA-seq),這些技術(shù)的工作流程如圖1所示。
圖1 主要轉(zhuǎn)錄組技術(shù)平臺(tái)工作流程示意圖Fig.1 Outline protocols of the main transcriptome platforms.
1.1 基因芯片技術(shù) (Microarray)
在轉(zhuǎn)錄組研究中應(yīng)用最早及最廣泛的為基因芯片技術(shù),首先從待檢測(cè)樣品中提取RNA,并利用熒光標(biāo)記的核苷酸將其反轉(zhuǎn)錄成 cDNA,經(jīng)過(guò)標(biāo)記的核苷酸序列可與基因芯片特定位點(diǎn)上的探針雜交,經(jīng)檢測(cè)雜交信號(hào)而獲取細(xì)胞基因表達(dá)信息?;蛐酒夹g(shù)已成為一項(xiàng)非常穩(wěn)定可信的實(shí)驗(yàn)技術(shù),目前公布的大量轉(zhuǎn)錄組數(shù)據(jù)主要是利用基因芯片技術(shù)產(chǎn)生的。
為了促進(jìn)基因芯片數(shù)據(jù)的交流和比較,2001年基因芯片表達(dá)數(shù)據(jù)協(xié)會(huì) (Microarray gene expression data society) 提出了基因芯片試驗(yàn)的標(biāo)準(zhǔn)方案,即MIAME方案 (Minimal information about a microarray experiment)[9];由美國(guó)食品藥物管理局 (US food and drug administration,F(xiàn)DA) 領(lǐng)導(dǎo)實(shí)施的基因芯片質(zhì)量控制聯(lián)盟 (MAQC) 發(fā)表的報(bào)告顯示在不同實(shí)驗(yàn)室之間基因芯片技術(shù)平臺(tái)內(nèi)部的數(shù)據(jù)具有高度的一致性和重現(xiàn)性[10]?;蛐酒亲钤玳_(kāi)發(fā)出來(lái)的高通量轉(zhuǎn)錄組檢測(cè)技術(shù),且成本適中,其對(duì)較高表達(dá)的基因檢測(cè)比較準(zhǔn)確,數(shù)據(jù)分析軟件較多,整個(gè)方法較為成熟,主要缺點(diǎn)是對(duì)低表達(dá)基因檢測(cè)敏感度不夠,前期工作基礎(chǔ)要求較高,而且很難檢測(cè)出融合基因轉(zhuǎn)錄、多順?lè)醋愚D(zhuǎn)錄等異常轉(zhuǎn)錄產(chǎn)物。
1.2 基因表達(dá)系列分析技術(shù) (SAGE) 與大規(guī)模平行測(cè)序技術(shù) (MPSS)
SAGE技術(shù)是一種基于測(cè)序技術(shù)、開(kāi)放式的、快速高效的分析細(xì)胞基因表達(dá)狀態(tài)的方法,該技術(shù)不需任何基因序列的信息,能夠全局性地檢測(cè)所有基因的表達(dá)水平,除了具有顯示基因差異表達(dá)譜的作用外,還對(duì)于那些未知基因特別是那些低拷貝基因的發(fā)現(xiàn)起到了巨大的推動(dòng)作用[11]。SAGE技術(shù)首先從待檢測(cè)樣品中提取RNA,并用生物素?zé)晒鈽?biāo)記的核苷酸將其反轉(zhuǎn)錄成 cDNA,隨后用一種被稱為錨定酶的限制性內(nèi)切酶 (Anchoring enzyme) 切割雙鏈cDNA,將回收得到的cDNA片段與不同的接頭連接,再用標(biāo)簽酶酶切處理后得到SAGE標(biāo)簽,連接SAGE標(biāo)簽形成標(biāo)簽二聚體并進(jìn)行PCR擴(kuò)增,最后錨定酶切除接頭序列以形成標(biāo)簽二聚體的多聚體,對(duì)其測(cè)序可得轉(zhuǎn)錄組。
MPSS技術(shù)是對(duì) SAGE技術(shù)的改進(jìn),但其原理都是基于短標(biāo)簽測(cè)序 (Tag-based sequencing) 的方法。MPSS技術(shù)可獲得更長(zhǎng)的短標(biāo)簽,因而精度更高;此外,MPSS技術(shù)特有的微球熒光測(cè)序可直接高通量讀出序列,簡(jiǎn)化了測(cè)序過(guò)程[12]。MPSS技術(shù)首先從待檢測(cè)樣品提取RNA并反轉(zhuǎn)錄為cDNA,克隆至帶有不同adaptor的載體文庫(kù)中,隨后PCR擴(kuò)增帶有不同adaptor的cDNA片段,在T4 DNA聚合酶和 dGTP的作用下使其轉(zhuǎn)換為單鏈文庫(kù),最后通過(guò)雜交將其結(jié)合在帶有 Anti-adaptor的微載體上進(jìn)行測(cè)序。
SAGE技術(shù)和 MPSS技術(shù)都需要大量的測(cè)序工作,但高通量基因測(cè)序儀的迅速發(fā)展緩解了這一問(wèn)題,有力推動(dòng)了它們的推廣與應(yīng)用。但是這些技術(shù)的難度較大,而且涉及酶切、PCR擴(kuò)增、克隆等可能會(huì)產(chǎn)生堿基偏向性的操作步驟,從而影響轉(zhuǎn)錄本的正確識(shí)別[12]。Illumina公司于2007年在MPSS技術(shù)的基礎(chǔ)上推出新一代測(cè)序儀 Illumina/Solexa Genome Analyzer,正迅速得到普及。
1.3 RNA測(cè)序技術(shù) (RNA-seq)
新一代高通量基因組測(cè)序儀的迅速發(fā)展(Solexa,454 GS-FLX,SOLiD,tSMS) 不僅給基因組領(lǐng)域帶來(lái)革命性的突破,同時(shí)也給轉(zhuǎn)錄組檢測(cè)方法帶來(lái)重大革新。采用類似SAGE技術(shù)和MPSS技術(shù)的理念,新一代高通量基因組測(cè)序儀可以通過(guò)測(cè)定細(xì)胞全部轉(zhuǎn)錄產(chǎn)物序列,通過(guò)序列比對(duì)得到最后的轉(zhuǎn)錄組,一個(gè)新的測(cè)定轉(zhuǎn)錄組的“RNA測(cè)序”法出現(xiàn)了,該技術(shù)稱為RNA測(cè)序技術(shù) (RNA-seq)[13-14]。
RNA測(cè)序技術(shù)的原理與SAGE技術(shù)和MPSS技術(shù)一致,即對(duì)細(xì)胞轉(zhuǎn)錄產(chǎn)物進(jìn)行測(cè)序,統(tǒng)計(jì)測(cè)得的每條序列獲得每個(gè)特定轉(zhuǎn)錄本的表達(dá)量,可提供精確的數(shù)字化表達(dá)譜檢測(cè)。該技術(shù)首先將細(xì)胞中的所有轉(zhuǎn)錄產(chǎn)物反轉(zhuǎn)錄為cDNA文庫(kù),然后將cDNA文庫(kù)中的 DNA隨機(jī)剪切為小片段(片段大小根據(jù)采取的測(cè)序方法的讀長(zhǎng)而不同),利用新一代高通量測(cè)序儀測(cè)序直到獲得足夠的序列。高通量測(cè)序避免了亞克隆過(guò)程中引入的偏差,且其確定的短序列長(zhǎng)度顯著增加。獲得長(zhǎng)度顯著增加的短序列所包含信息可以提高識(shí)別其對(duì)應(yīng)的基因的準(zhǔn)確性,然后計(jì)算這些短序列的個(gè)數(shù)和分析其在整個(gè)基因組中的分布,可以計(jì)算出細(xì)胞的轉(zhuǎn)錄組表達(dá)水平[14]。
RNA-seq技術(shù)可以提供更多信息,可以得到用基因芯片難以得到的轉(zhuǎn)錄可變剪接序列[14];該技術(shù)對(duì)低表達(dá)基因的檢測(cè)更加準(zhǔn)確,并且可以定量確定轉(zhuǎn)錄水平。核苷酸多態(tài)性、GC偏向會(huì)影響 SAGE和MPSS測(cè)定轉(zhuǎn)錄組時(shí)的精確性,而RNA-seq技術(shù)克服了這些不足。RNA-seq技術(shù)得到的標(biāo)簽長(zhǎng)度(由采取的高通量測(cè)序技術(shù)的讀長(zhǎng)而定,可達(dá)400 bp)比SAGE和MPSS顯著增加,提高了識(shí)別轉(zhuǎn)錄本的特異性和準(zhǔn)確性[15]。
RNA測(cè)序技術(shù)目前發(fā)展很快,在轉(zhuǎn)錄組研究中迅速得到廣泛應(yīng)用,受到高度好評(píng)。由于RNA測(cè)序技術(shù)產(chǎn)生海量的數(shù)據(jù),面臨著一系列新的信息學(xué)方面的難題,其中包括如何最好地詮釋和比對(duì)鑒定多個(gè)類似的同源基因;如何確定最佳測(cè)序量,獲得高質(zhì)量的轉(zhuǎn)錄圖譜等[16]。
1.4 轉(zhuǎn)錄組技術(shù)平臺(tái)比較
目前應(yīng)用在轉(zhuǎn)錄組研究中的幾種高通量基因表達(dá)分析技術(shù)各有特點(diǎn) (表 1),這些技術(shù)在應(yīng)用的某些方面存在重疊和競(jìng)爭(zhēng),RNA測(cè)序技術(shù)具有的優(yōu)勢(shì)較多,然而就目前來(lái)說(shuō),這些技術(shù)在更多方面體現(xiàn)的是優(yōu)勢(shì)互補(bǔ)、數(shù)據(jù)互補(bǔ),不同方法協(xié)同配合使用,可以互相彌補(bǔ)各自的遺漏部分,將提供以前的單種技術(shù)難以提供的更加全面的轉(zhuǎn)錄組分析[17-19]。例如,對(duì)同樣的樣品,分別采用基因芯片和RNA測(cè)序技術(shù)產(chǎn)生的轉(zhuǎn)錄組數(shù)據(jù)其相關(guān)性只有 0.45[20],分別采用基因芯片和SAGE技術(shù)產(chǎn)生的轉(zhuǎn)錄組數(shù)據(jù)也存在類似的相關(guān)性[21]。這些數(shù)據(jù)差異主要是由不同技術(shù)的原理特性造成的,每種技術(shù)都會(huì)丟失部分信息,并不是僅僅由于檢測(cè)靈敏性造成的[18,22]。
表1 幾種高通量基因表達(dá)分析技術(shù)的比較Table 1 Comparison of methods used in global analysis of gene expression of organism
全基因組水平的轉(zhuǎn)錄分析可以使研究者更加精確地評(píng)估細(xì)胞表型與基因表達(dá)的關(guān)系,加深對(duì)細(xì)胞代謝的理解,而且轉(zhuǎn)錄組分析也有助于研究者鑒定菌種改良的目標(biāo)基因,加速對(duì)微生物細(xì)胞工廠的合理設(shè)計(jì)及構(gòu)建。目前轉(zhuǎn)錄組在代謝工程領(lǐng)域的應(yīng)用正快速得到普及和發(fā)展。
2.1 微生物細(xì)胞特性的改造
2.1.1優(yōu)化菌種耐受性及減少代謝副產(chǎn)物合成
微生物在發(fā)酵生產(chǎn)過(guò)程中必然會(huì)遭受一些抑制細(xì)胞正常生長(zhǎng)及產(chǎn)物合成的不利環(huán)境因素,細(xì)胞對(duì)不利環(huán)境的耐受性是一種非常復(fù)雜的表型,通過(guò)對(duì)不同環(huán)境中生長(zhǎng)的菌株的轉(zhuǎn)錄組比較,往往可以發(fā)現(xiàn)那些和表型密切相關(guān)的基因,從而使研究者可以更好地通過(guò)代謝工程來(lái)增強(qiáng)菌種對(duì)不利環(huán)境的耐受性。Hirasawa等[23]比較了兩株具有不同的乙醇耐受性的S. cerevisiae轉(zhuǎn)錄組差異,利用聚類分析方法發(fā)現(xiàn)色氨酸合成基因的表達(dá)水平與乙醇耐受性緊密關(guān)系。過(guò)量表達(dá)色氨酸合成基因可以使乙醇耐受性低的菌株對(duì)5% (V/V)的乙醇具有耐受性,而且外源添加色氨酸并同時(shí)增強(qiáng)表達(dá)色氨酸透性酶同樣可以增加對(duì)乙醇的耐受性。Hirasawa等[24]還通過(guò)分析高鹽條件下兩株不同滲透壓耐受性S. cerevisiae的轉(zhuǎn)錄組,發(fā)現(xiàn)鈉離子泵與銅金屬硫蛋白基因與菌體滲透壓耐性密切相關(guān),提高上述基因的表達(dá)水平可顯著提高菌株的滲透壓耐性。Veit等[25]通過(guò)對(duì)E. coli轉(zhuǎn)錄組的分析發(fā)現(xiàn)sdhCDAB、sucB、sucC、acnB、lpdA、fumC、mdh等基因以及acs-yjcH-actP操縱子的表達(dá)與乙酸形成負(fù)相關(guān),增強(qiáng)sdhCDAB-b0725-sucABCD系列基因表達(dá)顯著降低乙酸的形成,同時(shí)不影響菌株的生長(zhǎng)速率。由于E. coli的生長(zhǎng)主要受到其自身分泌的乙酸的抑制,而采取直接阻斷乙酸合成途徑的策略會(huì)顯著降低菌體的生長(zhǎng)速率,上述研究結(jié)果無(wú)疑是一種更好的替代策略。
2.1.2擴(kuò)大底物利用范圍
擴(kuò)大菌株的底物利用范圍對(duì)于利用生物質(zhì)資源生產(chǎn)生物基化學(xué)品具有重要的意義,一些微生物對(duì)木糖、半乳糖等底物快速利用的表型 (尤其是在厭氧條件下) 也涉及到復(fù)雜的基因表達(dá)變化。Bro等[26]利用轉(zhuǎn)錄組分析了具有不同半乳糖攝取速率的S. cerevisiae菌株,鑒定出編碼葡糖磷酸變位酶的PGM2基因?yàn)樾碌陌袠?biāo),通過(guò)增強(qiáng)該基因的表達(dá)使工程菌半乳糖攝取速率提高了70%,該研究還表明如果對(duì)底物消耗速度不同的多株菌株同時(shí)進(jìn)行轉(zhuǎn)錄組分析,則獲得有用信息的效率將大為提高。Guimaraes等[27]比較了一株由進(jìn)化工程獲得的可快速利用乳糖的S. cerevisiae突變株與野生株的轉(zhuǎn)錄組差異,大部分差異表達(dá)基因的功能集中在與RNA介導(dǎo)的轉(zhuǎn)座、DNA修復(fù)與重組、抗逆性、染色體重建、細(xì)胞周期控制、有絲分裂調(diào)控,少部分差異表達(dá)基因與糖酵解和乙醇發(fā)酵路徑相關(guān),這些差異表達(dá)基因能較好地解釋突變株的表型,為進(jìn)一步的工程菌的設(shè)計(jì)提供了基礎(chǔ)。Bengtsson等[28]分析了4株具有不同木糖利用能力的S. cerevisiae與正常菌株的轉(zhuǎn)錄組差異,發(fā)現(xiàn)有13個(gè)基因的表達(dá)在4個(gè)菌株中都發(fā)生了變化。在正常菌株中相應(yīng)過(guò)表達(dá)或缺失這些差異基因,發(fā)現(xiàn)有 5個(gè)基因可有效提高菌株對(duì)木糖的利用能力,上述研究結(jié)果表明轉(zhuǎn)錄組是對(duì)復(fù)雜表型進(jìn)行高效分析的有力工具,其在菌株的代謝工程改造以及通過(guò)反向代謝工程重構(gòu)具有目標(biāo)表型的菌株中具有不可替代的作用。
2.1.3合成異源蛋白產(chǎn)物
轉(zhuǎn)錄組指導(dǎo)的代謝工程加速了構(gòu)建產(chǎn)外源蛋白微生物細(xì)胞工廠。例如,Choi等[29]利用基因芯片分析了高細(xì)胞濃度下重組E. coli生產(chǎn)類胰島素生長(zhǎng)因子I的融合蛋白 (IGF-If) 的轉(zhuǎn)錄組,發(fā)現(xiàn)共有 529個(gè)基因的表達(dá)水平顯著發(fā)生改變。結(jié)合已有文獻(xiàn)經(jīng)分析后增強(qiáng)表達(dá)兩個(gè)下調(diào)基因prsA(編碼磷酸核糖焦磷酸合成酶,核酸和氨基酸合成的關(guān)鍵酶) 和glpF(甘油運(yùn)輸?shù)鞍?,有利于菌體生長(zhǎng)),使 IGF-If的產(chǎn)量由1.8 g/L提高到4.3 g/L。這是一個(gè)典型的利用轉(zhuǎn)錄組數(shù)據(jù)表征細(xì)胞表型并據(jù)此分析進(jìn)而通過(guò)遺傳修飾進(jìn)行菌株改良的例子。Gasser等[30]分析了產(chǎn)人類胰蛋白酶P. pastoris工程菌及野生菌的轉(zhuǎn)錄組差異,共有 524個(gè)基因表達(dá)水平發(fā)生明顯改變。分別擴(kuò)增其中13個(gè)與蛋白分泌、應(yīng)激反應(yīng)相關(guān)的上調(diào)表達(dá)基因,發(fā)現(xiàn)新確定的6個(gè)基因Bfr2、Bmh2、Ssa4、Sse1、Cup5、Kin2明顯提高人類胰蛋白酶的比生產(chǎn)速率,并增加了蛋白總產(chǎn)量。由于蛋白質(zhì)的合成分為設(shè)計(jì)剪切、折疊、分泌等多個(gè)步驟,傳統(tǒng)代謝靶標(biāo)分析方法在這里受到很大的局限,包括轉(zhuǎn)錄組在內(nèi)的組學(xué)技術(shù)可深入對(duì)菌體代謝理解,對(duì)增強(qiáng)蛋白質(zhì)合成能力提供重要的信息。
2.1.4提高代謝產(chǎn)物產(chǎn)率和產(chǎn)量
基于轉(zhuǎn)錄組分析來(lái)改良細(xì)胞合成目標(biāo)代謝產(chǎn)物的產(chǎn)率和產(chǎn)量也有大量的應(yīng)用實(shí)例。Lee等[5]分析了E. coli工程菌在過(guò)量生產(chǎn)蘇氨酸時(shí)菌體轉(zhuǎn)錄組的變化,發(fā)現(xiàn)編碼磷酸烯醇式丙酮酸羧化酶的ppc基因表達(dá)水平?jīng)]有處于最優(yōu)狀態(tài)。作者增強(qiáng)了ppc基因表達(dá),同時(shí)缺失轉(zhuǎn)錄調(diào)節(jié)子iclR基因以加強(qiáng)乙醛酸支路通量,新構(gòu)建的工程菌蘇氨酸產(chǎn)量提高51.4%,作者在這篇文章中率先提出了“系統(tǒng)代謝工程”的概念,強(qiáng)調(diào)了組學(xué)尺度生理分析對(duì)代謝工程的重要意義。Sindelar等[31]通過(guò)轉(zhuǎn)錄組分析確定編碼轉(zhuǎn)甲基酶的NCgl0855基因,以及編碼銨吸收系統(tǒng)的amtA-ocd-soxA操縱子為影響賴氨酸生產(chǎn)的潛在靶點(diǎn),增強(qiáng)NCgl0855或amtA-ocd-soxA操縱子的表達(dá),可使賴氨酸產(chǎn)量提高40%。Park等[32]基于產(chǎn)纈氨酸E. coli工程菌與野生菌的轉(zhuǎn)錄組差異,分別擴(kuò)增了通用調(diào)節(jié)子lrp基因以及編碼纈氨酸運(yùn)輸?shù)鞍椎膟gaZH基因,纈氨酸產(chǎn)量分別增加了 21.6%和41.7%;共擴(kuò)增上述基因則使纈氨酸產(chǎn)量可增加113%,作者指出新確定的基因修飾靶點(diǎn)是常規(guī)分析方法難以確定的,這充分顯示出轉(zhuǎn)錄組等系統(tǒng)分析方法的優(yōu)越性。van den Berg等[33]利用基因芯片技術(shù)對(duì)P. chrysogenumDS17690的青霉素G高產(chǎn)工程菌與實(shí)驗(yàn)室標(biāo)準(zhǔn)菌株進(jìn)行轉(zhuǎn)錄組比較,揭示了以前未知的68個(gè)β-內(nèi)酰胺運(yùn)輸?shù)鞍?,同時(shí)通過(guò)敲除部分差異表達(dá)基因確定了這些基因?qū)Ξa(chǎn)青霉素G的影響,最終獲得幾株產(chǎn)量得到不同程度提高的工程菌株。Harris等[34]構(gòu)建了一株產(chǎn)頭孢菌素前體物己二酰化-7-氨基甲?;^孢烷酸的工程菌P. chrysogenumDS49834,通過(guò)轉(zhuǎn)錄組分析發(fā)現(xiàn)工程菌中頭孢菌素生物合成基因以及引入的外源基因表達(dá)水平很高,導(dǎo)致己二酰化-7-氨基甲?;^孢烷酸合成過(guò)程中消耗了大量的氨甲酰磷酸,造成氨甲酰磷酸的供給不足,由此確定限制目標(biāo)產(chǎn)物產(chǎn)量提高的代謝靶點(diǎn)為氨甲酰磷酸合成酶。Lum等[35]分析泰樂(lè)菌素高產(chǎn)菌株的基因組表達(dá)情況發(fā)現(xiàn)編碼?;o酶A脫氫酶的aco基因和編碼異丁酰輔酶A變位酶的icmA基因的轉(zhuǎn)錄水平較野生型菌株有很大提高,增加這兩個(gè)基因的拷貝數(shù)能為泰樂(lè)菌素的生產(chǎn)提供更多的脂肪酸前體。Kang等[36]通過(guò)轉(zhuǎn)錄組分析發(fā)現(xiàn)在產(chǎn)阿霉素S. peucetius工程菌中轉(zhuǎn)錄因子wblA與阿霉素合成負(fù)相關(guān)。基于此分析,Noh等[37]隨后通過(guò)敲除轉(zhuǎn)錄因子wblA使S. peucetius工程菌抗生素產(chǎn)量提高70%,同時(shí)比較了敲除轉(zhuǎn)錄因子wblA的重組菌與其親株的轉(zhuǎn)錄組,鑒定出受轉(zhuǎn)錄因子wblA調(diào)控的靶基因。在這些靶基因中選取SCO4967在wblA敲除菌中進(jìn)一步增強(qiáng)表達(dá)水平可提高130%的抗生素產(chǎn)量。Im等[38]分析了不同阿維菌素產(chǎn)量S. avermitilis工程菌株的轉(zhuǎn)錄組,鑒定出與阿維菌素合成正相關(guān)的50個(gè)新基因,其中SAV213、SAV3818、 SAV4023等3個(gè)基因可促進(jìn)阿維菌素合成。此外SAV3818基因的增強(qiáng)表達(dá)還可促進(jìn)放線紫紅素的生物合成,表明SAV3818基因?yàn)橐慌c抗生素合成相關(guān)的重要調(diào)控因子[39]。Koetsier等[40]在發(fā)酵培養(yǎng)基中添加己二酸,觀察其對(duì)Penicillium chrysogenum轉(zhuǎn)錄組影響,發(fā)現(xiàn)aclA基因?yàn)楸磉_(dá)提高最顯著的基因。缺失aclA基因使菌體己二酸比消耗速率下降32%,aclA基因在E. coli中表達(dá)產(chǎn)物可以己二酸為底物,該基因的確定有助于構(gòu)建頭孢菌素高產(chǎn)菌株。本研究組[41]通過(guò)轉(zhuǎn)錄組分析從基因表達(dá)水平上揭示產(chǎn)核黃素工程菌B. subtilisRH33的主要生理特點(diǎn),發(fā)現(xiàn)在產(chǎn)核黃素工程菌中PurR蛋白調(diào)控基因表達(dá)水平全部降低,而這些基因主要涉及核黃素前體物合成途徑。繼而通過(guò)基因修飾,增強(qiáng)工程菌胞內(nèi)磷酸核糖焦磷酸(PRPP) 濃度,解除PurR蛋白對(duì)其調(diào)控基因的抑制作用,增加核黃素前體物的供給,從而使核黃素產(chǎn)量提高25%。上述研究工作表明通過(guò)轉(zhuǎn)錄組分析可以發(fā)現(xiàn)與表型有關(guān)的重要調(diào)節(jié)子的表達(dá)變化,并根據(jù)該變化對(duì)菌種改造作出相應(yīng)的合理設(shè)計(jì)。Hirasawa等[42]研究了產(chǎn)乳酸S. cerevisiae工程菌株的轉(zhuǎn)錄組,發(fā)現(xiàn)有 388個(gè)基因表達(dá)水平明顯改變,從中選取了 289個(gè)基因進(jìn)行單基因缺失,同時(shí)隨機(jī)選取56個(gè)基因進(jìn)行單基因缺失。結(jié)果表明,只有基于轉(zhuǎn)錄組結(jié)果選取的基因可對(duì)乳酸產(chǎn)量發(fā)生影響,而隨機(jī)選取的基因?qū)耆樗岙a(chǎn)量基本無(wú)作用。Wierckx等[43]通過(guò)轉(zhuǎn)錄組分析指出導(dǎo)致P. putidaS12TPL3高產(chǎn)苯酚的重要原因?yàn)槔野彼岷铣赏緩交虻纳险{(diào)表達(dá)以及色氨酸合成途徑基因的下調(diào)表達(dá)。為了增加胞內(nèi)酪氨酸濃度,作者敲除了hpd、pobA、phhA、aroP1等 4個(gè)基因,然而苯酚的產(chǎn)量反而下降。作者推測(cè)P. putidaS12TPL3合成酪氨酸的代謝通路已經(jīng)處于很好的優(yōu)化狀態(tài),酪氨酸供給已非限制因素;此時(shí)限制苯酚生成的為酪氨酸-苯酚裂解酶,并通過(guò)酶活分析以及隨后的通量分析驗(yàn)證了這一假設(shè)[44],這是一個(gè)通過(guò)轉(zhuǎn)錄組分析揭示菌株代謝特征的典型研究實(shí)例。
2.2 植物細(xì)胞特性的改造
2.2.1提高植物抗逆性
植物的生長(zhǎng)發(fā)育及產(chǎn)量與外界環(huán)境密切相關(guān),通過(guò)代謝工程手段可以顯著提高植物對(duì)環(huán)境脅迫的抗性,保護(hù)植物免受外界環(huán)境的不良影響。Seki等[45]對(duì)擬南芥轉(zhuǎn)錄組分析,得到了44個(gè)受干旱誘導(dǎo)基因以及19個(gè)受冷誘導(dǎo)的基因,其中有12個(gè)基因被確定為植物脅迫應(yīng)答的重要調(diào)節(jié)因子 CBF/DREB(C-repeat-binding-factor/dehydration-responsive-elem ent-binding) 的靶基因。這些靶基因的確認(rèn)對(duì)深入認(rèn)識(shí)植物產(chǎn)生環(huán)境脅迫抗性的機(jī)理具有重要意義。Benedict等[46]將擬南芥的冷脅迫應(yīng)答轉(zhuǎn)錄因子CBF1轉(zhuǎn)入楊樹(shù),使其冷耐受性明顯增強(qiáng),同時(shí)發(fā)現(xiàn)楊樹(shù)中受擬南芥CBF1調(diào)控的基因與擬南芥中相應(yīng)基因具有高度一致性。該研究指出 CBF/DREB1冷調(diào)控機(jī)制可增強(qiáng)植株對(duì)多種逆境的抵抗性。類似地,Vogel等[47]發(fā)現(xiàn)在低溫環(huán)境下擬南芥基因表達(dá)水平改變最大的 25個(gè)基因受已知的冷脅迫應(yīng)答途徑的關(guān)鍵轉(zhuǎn)錄因子 CBF/DREB以及新發(fā)現(xiàn)的轉(zhuǎn)錄因子ZAT12調(diào)控,通過(guò)增加轉(zhuǎn)錄因子ZAT12的表達(dá),擬南芥可提高其冷耐受性。然而Fowler等[48]通過(guò)檢測(cè)擬南芥轉(zhuǎn)錄組發(fā)現(xiàn) CBF/DREB 途徑并不是獲得冷耐受性的唯一途徑,在表達(dá)水平發(fā)生改變的306個(gè)基因中,只有 12%為 CBF/DREB的靶基因。隨后Kim等[49]從這些顯著上調(diào)表達(dá)的基因中選擇并擴(kuò)增了兩個(gè)編碼DEAD-box RNA解旋酶的基因 (AtRH9和AtRH25),只有增強(qiáng)AtRH25基因表達(dá)水平的轉(zhuǎn)基因擬南芥提高了對(duì)低溫的耐受性。除此之外,Dai等[50]發(fā)現(xiàn)在低溫環(huán)境下水稻共有328個(gè)基因表達(dá)水平發(fā)生顯著變化,將表達(dá)水平增加的基因OsMYB3R-2引入擬南芥能提高轉(zhuǎn)基因擬南芥對(duì)低溫、干旱、高鹽等的耐受性。何飛等[51]分析了不同擬南芥野生居群在冷脅迫處理下轉(zhuǎn)錄水平的差異,不同擬南芥野生居群在冷脅迫下皆上調(diào)基因 (如MAPKs、CBFs、COR等基因) 可能對(duì)植物在低溫下生存十分重要。李利華等[52]發(fā)現(xiàn)水稻在低磷脅迫后大量基因(1 207個(gè)) 在轉(zhuǎn)錄水平上發(fā)生了變化,這些差異表達(dá)基因包括了代謝調(diào)節(jié)離子轉(zhuǎn)運(yùn)、信號(hào)傳導(dǎo)、轉(zhuǎn)錄調(diào)節(jié)、和逆境應(yīng)答等方面的基因,為提高水稻低磷耐受性提供了有用的信息。
2.2.2提高次級(jí)代謝產(chǎn)物產(chǎn)率和產(chǎn)量
植物次級(jí)代謝物為醫(yī)藥、輕工、化工、食品及農(nóng)藥等工業(yè)的發(fā)展提供了豐富的資源,然而其調(diào)控是一個(gè)十分復(fù)雜的系統(tǒng),造成其產(chǎn)量極低。通過(guò)轉(zhuǎn)錄組分析挖掘次級(jí)代謝物合成相關(guān)基因,可有力促進(jìn)相關(guān)植物細(xì)胞改造。Jennewein等[53]分析了受茉莉酮酸甲酯誘導(dǎo)而處于生產(chǎn)紫杉醇階段的東北紅豆杉基因表達(dá)水平,在10 000個(gè)cDNA片段中,確定了3 563個(gè)基因由茉莉酸甲酯誘導(dǎo)轉(zhuǎn)錄參與生產(chǎn)紫杉醇。這些基因除了包括已知的紫杉烷代謝所需羥化酶外,還提供了參與紫杉醇合成反應(yīng)的其他潛在基因,為改良生產(chǎn)菌株提供了有價(jià)值的信息。Teoh等[54]在青蒿的轉(zhuǎn)錄組文庫(kù)經(jīng)序列比對(duì)確定一種多功能的P450氧化酶 (由CYP71AV1基因編碼),并將其在酵母中表達(dá),發(fā)現(xiàn)其可以催化FPP環(huán)化產(chǎn)物紫穗槐-4,11-二烯 (amorpha-4,11-diene) 到青蒿酸的多步氧化反應(yīng),該關(guān)鍵基因的確定推動(dòng)了高產(chǎn)青蒿素工程菌的構(gòu)建[55-56]。Nagel等[57]在蛇麻腺體(Lupulin glands) 的含有10 581表達(dá)序列標(biāo)簽的基因轉(zhuǎn)錄文庫(kù)中鑒定出 4個(gè)編碼 S-腺苷甲硫氨酸-甲基轉(zhuǎn)移酶(S-adenosyl-L-methionine-dependent O-methyltransferases,OMTs) 的基因,為催化黃腐醇生物合成的關(guān)鍵基因,將加速生產(chǎn)植株的構(gòu)建。Hirai等[58]通過(guò)計(jì)算數(shù)據(jù)庫(kù)中公開(kāi)發(fā)表的1 388張基因芯片數(shù)據(jù)的皮爾森相關(guān)系數(shù)發(fā)現(xiàn),擬南芥中脂肪族芥子油苷生物合成基因與兩個(gè)未報(bào)道的轉(zhuǎn)錄因子Myb28(At5g61420) 和Myb29(At5g07690) 相關(guān)性很大。通過(guò)基因缺失和基因異位表達(dá)表明脂肪族芥子油苷生物合成主要受轉(zhuǎn)錄因子Myb28調(diào)控,增強(qiáng)轉(zhuǎn)錄因子Myb28的表達(dá)水平可致使擬南芥合成大量芥子油苷。這些結(jié)果表明在轉(zhuǎn)錄組指導(dǎo)下可高效確定細(xì)胞改造策略。
2.3 動(dòng)物細(xì)胞特性的改造
動(dòng)物細(xì)胞系目前已經(jīng)被廣泛用于蛋白質(zhì)藥物等產(chǎn)品的大量生產(chǎn)上,利用動(dòng)物細(xì)胞表達(dá)蛋白其優(yōu)勢(shì)在于有助于蛋白質(zhì)正確折疊、組裝并進(jìn)行翻譯后的修飾,目標(biāo)蛋白質(zhì)可正常行使其功能[59]。轉(zhuǎn)錄組分析在減少細(xì)胞代謝負(fù)擔(dān)、控制細(xì)胞貼壁性、調(diào)控細(xì)胞生長(zhǎng)活性等方面都有成功的應(yīng)用。
Khoo等[60]發(fā)現(xiàn)一株具有單抗生產(chǎn)能力的鼠骨髓瘤細(xì)胞 (GS-NS0 6A1-100) 與相應(yīng)野生型 (NS0 WT) 生長(zhǎng)代謝速率接近,進(jìn)而比較了兩株細(xì)胞系表達(dá)譜差異,推測(cè)這些基因表達(dá)差異使 GS-NS0 6A1-100細(xì)胞可高效利用底物,補(bǔ)償了其合成單抗造成的代謝負(fù)擔(dān),使兩株細(xì)胞系生長(zhǎng)速率類似。Beer等[61]發(fā)現(xiàn)小鼠NIH 3T3細(xì)胞在32℃可最優(yōu)生產(chǎn)雙嗜性白血病毒4070A,而當(dāng)溫度提高到37℃時(shí)病毒產(chǎn)量降低。他們通過(guò)轉(zhuǎn)錄組分析發(fā)現(xiàn)37℃培養(yǎng)時(shí)膽固醇合成與運(yùn)輸相關(guān)基因的表達(dá)受到抑制,音猬因子信號(hào)通路 (Sonic hedgehog signalling pathway) 相關(guān)基因的表達(dá)降低。這些溫度誘導(dǎo)的差異表達(dá)基因會(huì)影響細(xì)胞生長(zhǎng)代謝和蛋白合成速率,是今后改良細(xì)胞工廠的靶標(biāo)基因。Jaluria等[62]通過(guò)聚類分析算法分析非貼壁依賴性與貼壁依賴性 HeLa細(xì)胞轉(zhuǎn)錄組差異,鑒定出siat7e和lama4兩個(gè)細(xì)胞貼壁性相關(guān)基因,降低siat7e基因的表達(dá)或提高lama4基因的表達(dá)皆可改善 HeLa細(xì)胞系的貼壁性。Jaluria等[63]在生長(zhǎng)迅速且具非貼壁依賴性 HeLa細(xì)胞系的轉(zhuǎn)錄組中發(fā)現(xiàn)兩個(gè)上調(diào)表達(dá)基因 (cdkl3和cox15) 與細(xì)胞增殖密切相關(guān),其中cdkl3基因編碼細(xì)胞周期依賴性蛋白激酶,cox15基因編碼細(xì)胞色素氧化酶亞單位。在 HeLa細(xì)胞、人胚腎 293細(xì)胞 (Human embryonic kidney-293,HEK-293)、中國(guó)倉(cāng)鼠卵巢細(xì)胞 (Chinese hamster ovary,CHO)、犬腎上皮細(xì)胞(Madin-darby canine kidney,MDCK) 中,引入并過(guò)表達(dá)這兩個(gè)基因皆可提高細(xì)胞增殖速率同時(shí)增加了最高活性細(xì)胞密度。Wong等[64]通過(guò)比較產(chǎn)重組人干擾素γ的中國(guó)倉(cāng)鼠卵巢細(xì)胞不同時(shí)期的轉(zhuǎn)錄組差異,發(fā)現(xiàn)9個(gè)早期細(xì)胞凋亡信號(hào)基因 (FasL、Fadd、Bim、Bak、Faim、Bad、Bax、Alg-2、Requiem)。Fadd、Faim、Alg-2和Requiem基因在隨后的研究中分別在中國(guó)倉(cāng)鼠卵巢細(xì)胞增強(qiáng)或降低其表達(dá)水平[65],這4個(gè)相關(guān)基因表達(dá)水平改變后都提高了細(xì)胞凋亡抗性及活性細(xì)胞密度,最優(yōu)的一株重組細(xì)胞系重組人干擾素產(chǎn)量提高至原始產(chǎn)量的2.5倍。
由于細(xì)胞內(nèi)各個(gè)層次間的調(diào)控互相關(guān)聯(lián),單一組學(xué)分析具有一定局限性,另外轉(zhuǎn)錄組分析并不能完全準(zhǔn)確地反應(yīng)細(xì)胞內(nèi)基因的翻譯情況,對(duì)于帶有大量突變的突變株,基因序列的突變可能對(duì)其轉(zhuǎn)錄水平?jīng)]有影響,但可顯著降低翻譯的效率,這時(shí)單純依靠轉(zhuǎn)錄組分析就會(huì)遺漏重要的差異表達(dá)信息。因此轉(zhuǎn)錄組與其他組學(xué)技術(shù)的整合分析顯得異常重要,各種組學(xué)技術(shù)的綜合運(yùn)用有利于重要信息的補(bǔ)充和整合,將加深對(duì)復(fù)雜生物系統(tǒng)的認(rèn)識(shí)、加速對(duì)代謝靶標(biāo)的識(shí)別 (表2)。
表2 多種組學(xué)相結(jié)合在代謝工程中的應(yīng)用Table 2 Examples of combined omics guided metabolic engineering
Yoon等[66]研究了處于高菌體濃度狀態(tài)下的E. coli的轉(zhuǎn)錄組與蛋白質(zhì)組數(shù)據(jù),實(shí)驗(yàn)表明在細(xì)胞密度增加時(shí)表達(dá)氨基酸合成的基因受到抑制,直接導(dǎo)致目標(biāo)重組蛋白產(chǎn)量降低,同時(shí)發(fā)現(xiàn)伴侶基因(clpB、dnaJK、hslSG、groEL、groES) 的表達(dá)也明顯增加,表明菌體處于營(yíng)養(yǎng)匱乏狀態(tài)。Askenazi等[67]利用層次聚類 (Hierarchical clustering) 和主成分分析 (Principle component analysis) 等方法分析了具有不同洛伐他汀產(chǎn)量的Aspergillus terreus菌株轉(zhuǎn)錄組、代謝物組數(shù)據(jù),鑒定出影響產(chǎn)物形成的靶標(biāo)并對(duì)其進(jìn)行成功改造。Askenazi等研究人員的工作是一個(gè)綜合運(yùn)用組學(xué)數(shù)據(jù)提高微生物生產(chǎn)能力的典型案例。Zamboni等[68]發(fā)現(xiàn)高產(chǎn)核黃素工程菌B. subtilisRB50::pRF69不同生長(zhǎng)階段產(chǎn)核黃素速率不同,通過(guò)研究相應(yīng)階段的轉(zhuǎn)錄組和代謝通量組數(shù)據(jù),揭示了核黃素生產(chǎn)階段碳代謝流分布,即菌株主要采取非氧化磷酸戊糖途徑獲取核黃素合成前體物,指出了此時(shí)限制核黃素生產(chǎn)的代謝瓶頸。Lee等[69]采用轉(zhuǎn)錄組和蛋白質(zhì)組技術(shù)綜合分析了E. coliW3110及其過(guò)量產(chǎn)蘇氨酸突變株 TF5015,發(fā)現(xiàn)有54個(gè)基因表達(dá)水平差異顯著,乙醛酸循環(huán)、三羧酸循環(huán)以及氨基酸生物合成途徑被激活。通過(guò)基因測(cè)序,發(fā)現(xiàn)蘇氨酸合成基因thrA不僅表達(dá)水平提高而且其序列還發(fā)生了突變,此外在表達(dá)未改變的異亮氨酸合成基因ilvA中也發(fā)生了突變,發(fā)生的突變有助于解除對(duì)蘇氨酸合成路徑的反饋抑制,從而使蘇氨酸過(guò)量合成。將發(fā)生突變的蘇氨酸合成基因?qū)隕. coliW3110可提高其蘇氨酸產(chǎn)量。Dubouzet等[70]比較了正常日本晴與產(chǎn)色氨酸轉(zhuǎn)基因日本晴的轉(zhuǎn)錄組和代謝物組,發(fā)現(xiàn)轉(zhuǎn)基因日本晴中與色氨酸共享莽草酸途徑的苯丙氨酸、酪氨酸的濃度未受影響,其合成途徑的轉(zhuǎn)錄水平未有明顯改變,說(shuō)明代謝流未過(guò)多進(jìn)入與色氨酸合成存在競(jìng)爭(zhēng)的分支代謝途徑。此外轉(zhuǎn)基因日本晴中,轉(zhuǎn)化色氨酸的色氨酸脫羧酶酶活較低,有利于色氨酸的累積。鼠骨髓瘤細(xì)胞 (NS0) 正常生長(zhǎng)通常需要外源添加膽固醇,為了改良培養(yǎng)基而降低成本,Seth等[71]比較了需添加膽固醇的鼠骨髓瘤細(xì)胞 (NS0) 與不需添加膽固醇的突變鼠骨髓瘤細(xì)胞 (NS0 revertant) 轉(zhuǎn)錄組與蛋白質(zhì)組差異,結(jié)果表明表達(dá)降低的Hsd17b7基因?qū)е履懝檀紶I(yíng)養(yǎng)缺陷型,并通過(guò)實(shí)驗(yàn)驗(yàn)證[72]。Zagrobelny等[73]通過(guò)Roche公司454的焦磷酸測(cè)序法測(cè)定了六星燈蛾Zygaena filipendulae的轉(zhuǎn)錄組,隨后結(jié)合各轉(zhuǎn)錄本序列的長(zhǎng)度和拷貝數(shù)分析,以及六星燈蛾與黑腹果蠅、家蠶、產(chǎn)氰蝶Heliconius的系統(tǒng)發(fā)育關(guān)系的分析確定了生物活性物質(zhì)氰苷的潛在合成基因,該研究表明基于焦磷酸測(cè)序技術(shù)的轉(zhuǎn)錄組分析方法在獲取生物體內(nèi)天然生物活性物質(zhì)的合成基因等相關(guān)信息方面具有非常重要的作用。
近些年來(lái)代謝工程手段被引入到細(xì)胞工廠改良的研究中,并取得不錯(cuò)的效果,特別是以轉(zhuǎn)錄組學(xué)為代表的組學(xué)技術(shù)的應(yīng)用增強(qiáng)了代謝工程的指導(dǎo)性與可預(yù)見(jiàn)性,使代謝工程得到重大革新,有力推動(dòng)了工業(yè)生物技術(shù)發(fā)展[74]。目前,在以轉(zhuǎn)錄組學(xué)為代表的組學(xué)技術(shù)指導(dǎo)下的代謝工程正日益成為研究的熱點(diǎn),國(guó)內(nèi)外關(guān)于組學(xué)研究的研究中心及公司紛紛成立,科學(xué)工作者獲得了空前大量的反映生命活動(dòng)的數(shù)據(jù)。與此同時(shí),如何更好地理解、運(yùn)用這些生命信息也成為擺在我們面前的一個(gè)重大挑戰(zhàn),目前組學(xué)數(shù)據(jù)分析主要是通過(guò)比較組學(xué)數(shù)據(jù)差異完成的,組學(xué)層次模型還不多見(jiàn)。為了更加合理、高效地實(shí)現(xiàn)細(xì)胞改良,還需要不同專業(yè)背景的科學(xué)工作者通力合作,特別是在信息學(xué)、數(shù)學(xué)的幫助下模擬和設(shè)計(jì)合成新的生物系統(tǒng),建立相應(yīng)動(dòng)力學(xué)模型和控制模型,從而提高現(xiàn)有生物基產(chǎn)品的產(chǎn)量、合成新的生物基產(chǎn)品。
REFERENCES
[1] Nielsen J, Olsson L. An expanded role for microbial physiology in metabolic engineering and functional genomics: moving towards systems biology.FEMS Yeast Res, 2002, 2(2): 175?181.
[2] Zhao XM, Wang JY, Chen T,et al. Metabolic engineering in the post genomic era: opportunities and challenges.Chin J Bioprocess Eng, 2004, 2: 1?7.
趙學(xué)明, 王靖宇, 陳濤, 等. 后基因組時(shí)代的代謝工程:機(jī)遇與挑戰(zhàn). 生物加工過(guò)程, 2004, 2: 1?7.
[3] Ideker T, Galitski T, Hood L. A new approach to decoding life: systems biology.Annu Rev Genomics Hum Genet,2001, 2(1): 343?372.
[4] Lee SY, Lee DY, Kim TY. Systems biotechnology for strain improvement.Trends Biotechnol, 2005, 23(7):349?358.
[5] Lee KH, Park JH, Kim TY,et al. Systems metabolic engineering ofEscherichiacolifor L-threonine production.Mol Syst Biol, 2007, 3: 149?156.
[6] Lockhart DJ, Winzeler EA. Genomics, gene expression and DNA arrays.Nature, 2000, 405(6788): 827?836.
[7] Jewett MC, Oliveira AP, Patil KR,et al. The role of high-throughput transcriptome analysis in metabolic engineering.Biotechnol Bioproc Eng, 2005, 10: 385?399.
[8] Donson J, Fang Y, Espiritu-Santo G,et al. Comprehensive gene expression analysis by transcript profiling.Plant Mol Biol, 2002, 48: 75?97.
[9] Brazma A, Hingamp P, Quackenbush J,et al. Minimum information about a microarray experiment (MIAME)-toward standards for microarray data.Nat Genet, 2001,29(4): 365?372.
[10] Shi L, Reid LH, Jones WD,et al. The MicroArray Quality Control (MAQC) project shows inter-and intraplatform reproducibility of gene expression measurements.Nat Biotechnol, 2006, 24(9): 1151?1161.
[11] Velculescu VE, Zhang L, Vogelstein B,et al. Serial analysis of gene expression.Science, 1995, 270: 484?487.
[12] Brenner S, Johnson M, Bridgham J,et al. Gene expression analysis by massively parallel signature sequencing(MPSS) on microbead arrays.Nat Biotechnol, 2000, 18:630?634.
[13] Mortazavi A, Williams BA, McCue K,et al. Mapping and quantifying mammalian transcriptomes by RNA-Seq.Nat Methods, 2008, 5(7): 621?628.
[14] Wang Z, Gerstein M, Snyder M. RNA-Seq: arevolutionary tool for transcriptomics.Nat Rev Genet,2009, 10: 57?63.
[15] Siddiqui AS, Delaney AD, Schnerch A,et al. Sequence biases in large scale gene expression profiling data.Nucleic Acids Res, 2006, 34(12): e83.
[16] van Vliet A. Next generation sequencing of microbial transcriptomes: challenges and opportunities.FEMS Microbiol Lett, 2010, 302: 1?7.
[17] Oudes AJ, Roach JC, Walashek LS,et al. Application of affymetrix array and massively parallel signature sequencing for identification of genes involved in prostate cancer progression.BMC Cancer, 2005, 5: 86.
[18] Liu F, Jenssen TK, Trimarchi J,et al. Comparison of hybridization-based and sequencing-based gene expression technologies on biological replicates.BMC Genomics, 2007, 8: 153?166.
[19] Hanriot L, Keime C, Gay N,et al. A combination of LongSAGE with Solexa sequencing is well suited to explore the depth and the complexity of transcriptome.BMC Genomics, 2008, 9: 418?426.
[20] Weber APM, Weber KL, Carr K,et al. Sampling theArabidopsistranscriptome with massively parallel pyrosequencing.Plant Physiol, 2007, 144(1): 32?42.
[21] van Ruissen F, Ruijter JM, Schaaf GJ,et al. Evaluation of the similarity of gene expression data estimated with SAGE and Affymetrix GeneChips.BMC Genomics, 2005,6: 91?106.
[22] Sultan M, Schulz M, Richard H,et al. A global view of gene activity and alternative splicing by deep sequencing of the human transcriptome.Science, 2008, 321(5891):956?959.
[23] Hirasawa T, Yoshikawa K, Nakakura Y,et al.Identification of target genes conferring ethanol stress tolerance toSaccharomyces cerevisiaebased on DNA microarray data analysis.J Biotechnol, 2007, 131: 34?44.
[24] Hirasawa T, Nakakura Y, Yoshikawa K,et al. Comparative analysis of transcriptional responses to saline stress in the laboratory and brewing strains ofSaccharomyces cerevisiaewith DNA microarray.Appl Microbiol Biotechnol, 2006, 70: 346?357.
[25] Veit A, Polen T, Wendisch VF. Global gene expression analysis of glucose overflow metabolism inEscherichia coliand reduction of aerobic acetate formation.Appl Microbiol Biotechnol, 2007, 74(2): 406?421.
[26] Bro C, Knudsen S, Regenberg B,et al. Improvement of galactose uptake inSaccharomyces cerevisiaethrough overexpression of phosphoglucomutase: Example of transcript analysis as a tool in inverse metabolic engineering.Appl Environ Microbiol, 2005, 71(11):6465?6472.
[27] Guimaraes P, Le Berre V, Sokol S,et al. Comparative transcriptome analysis between original and evolved recombinant lactose-consumingSaccharomyces cerevisiaestrains.Biotechnol J, 2008, 3: 1591?1597.
[28] Bengtsson O, Jeppsson M, Sonderegger M,et al.Identification of common traits in improved xylose-growingSaccharomyces cerevisiaefor inverse metabolic engineering.Yeast, 2008, 25(11): 835?847.
[29] Choi JH, Lee SJ, Lee SJ,et al. Enhanced production of insulin-like growth factor I fusion protein inEscherichia coliby coexpression of the down-regulated genes identified by transcriptome profiling.Appl Environ Microbiol, 2003, 69: 4737?4742.
[30] Gasser B, Sauer M, Maurer M,et al. Transcriptomicsbased identification of novel factors enhancing heterologous protein secretion in Yeasts.Appl Environ Microbiol, 2007, 73: 6499?6507.
[31] Sindelar G, Wendisch VF. Improving lysine production byCorynebacteriumglutamicumthrough DNA microarray-based identification of novel target genes.Appl Microbiol Biotechnol, 2007, 76: 677?689.
[32] Park JH, Lee KH, Kim TY,et al. Metabolic engineering ofEscherichia colifor the production of L-valine based on transcriptome analysis and in silico gene knockout simulation.Proc Natl Acad Sci USA, 2007, 104:7797?7802.
[33] van den Berg MA, Albang R, Albermann K,et al. Genome sequencing and analysis of the filamentous fungus Penicillium chrysogenum.Nat Biotechnol, 2008, 26:1161?1168.
[34] Harris DM, Westerlaken I, Schipper D,et al. Engineering ofPenicillium chrysogenumfor fermentative production of a novel carbamoylated cephem antibiotic precursor.Metab Eng, 2009, 11: 125?137.
[35] Lum A, Huang J, Hutchinson C,et al. Reverse engineering of industrial pharmaceutical-producing actinomycete strains using DNA microarrays.Metab Eng, 2004, 6(3):186?196.
[36] Kang SH, Huang J, Lee HN,et al. Interspecies DNA microarray analysis identifies WblA as a Pleiotropic Down-Regulator of antibiotic biosynthesis inStreptomyces.J Bacteriol, 2007, 189(11): 4315?4319.
[37] Noh J, Kim S, Lee H,et al. Isolation and genetic manipulation of the antibiotic down-regulatory gene, wblA ortholog for doxorubicin-producingStreptomycesstrain improvement.Appl Microbiol Biotechnol, 2010, 86: 1?9.
[38] Im J, Kim M, Kim E. Comparative transcriptome analysis for avermectin overproduction viaStreptomyces avermitilismicroarray system.J Microbiol Biotechnol,2007, 17(3): 534.
[39] Duong C, Lee H, Choi S,et al. Functional expression of SAV3818, a putative TetR-family transcriptional regulatory gene fromStreptomyces avermitilis, stimulates antibiotic production inStreptomycesspecies.J Microbiol Biotechnol, 2009, 19(2): 136?139.
[40] Koetsier MJ, Gombert AK, Fekken S,et al. ThePenicillium chrysogenumaclAgene encodes a broadsubstrate-specificity acyl-coenzyme A ligase involved in activation of adipic acid, a side-chain precursor for cephem antibiotics.Fungal Genet Biol,2010, 47(1):33?42.
[41] Shi SB, Chen T, Zhang ZG,et al. Transcriptome analysis guided metabolic engineering ofBacillus subtilisfor riboflavin production.Metab Eng, 2009, 11: 243?252.
[42] Hirasawa T, Ookubo A, Yoshikawa K,et al. Investigating the effectiveness of DNA microarray analysis for identifying the genes involved in l-lactate production bySaccharomyces cerevisiae.Appl Microbiol Biotechnol,2009, 84(6): 1149?1159.
[43] Wierckx NJP, Ballerstedt H, de Bont JAM,et al.Transcriptome analysis of a Phenol-producingPseudomonas putidaS12 construct: genetic and physiological basis for improved production.J Bacteriol, 2008, 190: 2822?2830.
[44] Wierckx N, Ruijssenaars HJ, de Winde JH,et al.Metabolic flux analysis of a phenol producing mutant ofPseudomonas putidaS12: verification and complementation of hypotheses derived from transcriptomics.J Biotechnol,2009, 143(2): 124?129.
[45] Seki M, Narusaka M, Abe H,et al.Monitoring the expression pattern of 1300Arabidopsisgenes under drought and cold stresses by using a full-length cDNA microarray.Plant Cell, 2001, 13(1): 61?72.
[46] Benedict C, Skinner J, Meng R,et al.The CBF1-dependent low temperature signalling pathway,regulon and increase in freeze tolerance are conserved inPopulusspp.Plant Cell Environ, 2006, 29(7): 1259.
[47] Vogel J, Zarka D, Van Buskirk H,et al. Roles of the CBF2 and ZAT12 transcription factors in configuring the low temperature transcriptome ofArabidopsis.Plant J, 2005,41(2): 195?211.
[48] Fowler S, Thomashow MF.Arabidopsistranscriptome profiling indicates that multiple regulatory pathways are activated during cold acclimation in addition to the CBF cold response pathway.Plant Cell, 2002, 14(8):1675?1690.
[49] Kim JS, Kim KA, Oh TR,et al.Functional characterization of DEAD-Box RNA helicases inArabidopsis thalianaunder abiotic stress conditions.Plant Cell Physiol, 2008, 49(10): 1563?1571.
[50] Dai X, Xu Y, Ma Q,et al.Overexpression of an R1R2R3 MYB gene,OsMYB3R-2, increases tolerance to freezing,drought, and salt stress in transgenicArabidopsis.Plant Physiol, 2007, 143(4): 1739?1751.
[51] He F, Kang JQ, Zhou X,et al.Monitoring expression profiles ofArabidopsisgenes during cold acclimation.Chin Sci Bull, 2008, 53(18): 2206?2215.
何飛, 康菊清, 周鑫, 等. 中國(guó)野生擬南芥居群冷脅迫下的表達(dá)譜變異. 科學(xué)通報(bào), 2008, 53(18): 2206?2215.
[52] Li LH, Qiu XH, Li XH,et al.Expression profiles of low nitrogen stress in rice.Chin Sci Bull, 2010, 3: 12?19.
李利華, 邱旭華, 李香花, 等. 水稻低磷脅迫基因表達(dá)譜分析. 科學(xué)通報(bào), 2010, 3: 12?19.
[53] Jennewein S, Wildung M, Chau M,et al.Random sequencing of an inducedTaxuscell cDNA library for identification of clones involved in Taxol biosynthesis.Proc Natl Acad Sci USA, 2004, 101(24): 9149?9154.
[54] Teoh K, Polichuk D, Reed D,et al. Artemisia annuaL.(Asteraceae) trichome-specific cDNAs reveal CYP71AV1, a cytochrome P450 with a key role in the biosynthesis of the antimalarial sesquiterpene lactone artemisinin.FEBS Lett, 2006, 580(5): 1411?1416.
[55] Arsenault P, Wobbe K, Weathers P. Recent advances in artemisinin production through heterologous expression.Curr Med Chem, 2008, 15(27): 2886?2896.
[56] Kirby J, Keasling J. Metabolic engineering of microorganisms for isoprenoid production.Nat Prod Rep,2008, 25(4): 656?661.
[57] Nagel J, Culley L, Lu Y,et al.EST analysis of hop glandular trichomes identifies an O-methyltransferase that catalyzes the biosynthesis of xanthohumol.Plant Cell,2008, 20(1): 186?200.
[58] Hirai MY, Sugiyama K, Sawada Y,et al.Omics-based identification ofArabidopsisMyb transcription factors regulating aliphatic glucosinolate biosynthesis.Proc Natl Acad Sci USA, 2007, 104(15): 6478?6483.
[59] Wurm FM. Production of recombinant protein therapeutics in cultivated mammalian cells.Nat Biotechnol, 2004,22(11): 1393?1398.
[60] Khoo S, Falciani F, Al-Rubeai M. A genome-wide transcriptional analysis of producer and non-producer NS0 myeloma cell lines.Biotechnol Appl Biochem, 2007, 47:85?95.
[61] Beer C, Buhr P, Hahn H,et al.Gene expression analysis of murine cells producing amphotropic mouse leukaemia virus at a cultivation temperature of 32 and 37°C.J Gen Virol, 2003, 84(7): 1677?1686.
[62] Jaluria P, Betenbaugh M, Konstantopoulos K,et al.Application of microarrays to identify and characterize genes involved in attachment dependence in HeLa cells.Metab Eng, 2007a, 9(3): 241?251.
[63] Jaluria P, Betenbaugh M, Konstantopoulos K,et al.Enhancement of cell proliferation in mammalian cells by gene insertion of a cyclin-dependent kinase homolog.BMC Biotechnol, 2007b, 7: 71?81.
[64] Wong DCF, Wong KTK, Lee YY,et al.Transcriptional profiling of apoptotic pathways in batch and fed-batch CHO cell cultures.Biotechnol Bioeng, 2006a, 94(2):373?382.
[65] Wong DCF, Wong KTK, Nissom PM,et al.Targeting early apoptotic genes in batch and fed-batch CHO cell cultures.Biotechnol Bioeng, 2006b, 95(3): 350?361.
[66] Yoon SH, Han MJ, Lee SY,et al.Combined transcriptome and proteome analysis ofEscherichia coliduring high cell density culture.Biotechnol Bioeng, 2003, 81: 753?767.
[67] Askenazi M, Driggers EM, Holtzman DA,et al.Integrating transcriptional and metabolite profiles to direct the engineering of lovastatin-producing fungal strains.Nat Biotechnol, 2003, 21(2): 150?156.
[68] Zamboni N, Fischer E, Muffler A,et al.Transient expression and flux changes during a shift from high to low riboflavin production in continuous cultures ofBacillus subtilis.Biotechnol Bioeng, 2005, 89(2): 219?232.
[69] Lee JH, Lee DE, Lee BU,et al.Global analyses of transcriptomes and proteomes of a parent strain and an L-threonine-overproducing mutant strain.J Bacteriol,2003, 185(18): 5442?5451.
[70] Dubouzet J, Ishihara A, Matsuda F,et al.Integrated metabolomic and transcriptomic analyses of high-tryptophan rice expressing a mutant anthranilate synthase alpha subunit.J Exp Bot, 2007, 58(12): 3309?3321.
[71] Seth G, Philp RJ, Denoya CD,et al.Large-scale gene expression analysis of cholesterol dependence in NSO cells.Biotechnol Bioeng, 2005, 90(5): 552?567.
[72] Seth G, Ozturk M, Hu WS. Reverting cholesterol auxotrophy of NS0 cells by altering epigenetic gene silencing.Biotechnol Bioeng, 2005, 93(4): 820?827.
[73] Zagrobelny M, Scheibye-Alsing K, Jensen NB,et al.454 pyrosequencing based transcriptome analysis ofZygaena filipendulaewith focus on genes involved in biosynthesis of cyanogenic glucosides.BMC Genomics, 2009, 10:574?588.
[74] Li Y. Metabolic engineering: an evolving technology for strain improvement.Chin J Biotech, 2009, 25(9):1281?1284.
李寅. 代謝工程: 一項(xiàng)不斷發(fā)展的菌株改造技術(shù). 生物工程學(xué)報(bào), 2009, 25(9): 1281?1284.
Transcriptome platforms and applications to metabolic engineering
Shuobo Shi1,2, Tao Chen1,2, and Xueming Zhao1,2
1Key Laboratory of Systems Bioengineering,Ministry of Education,Tianjin University,Tianjin300072,China
2Edinburg-Tianjin Joint Research Centre for Systems Biology and Synthetic Biology,Tianjin300072,China
Received:April 30, 2010;Accepted:July 22, 2010
Supported by:National Science Foundation of China (Nos. 20806055, 20875068), National Basic Research Program of China (973 Program) (No.2007CB707802).
Corresponding author:Tao Chen. Tel: +86-22-27406770; E-mail: chentao@tju.edu.cn
國(guó)家自然科學(xué)基金項(xiàng)目 (Nos. 20806055, 20875068),國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃 (973計(jì)劃) (No. 2007CB707802) 資助。