儲(chǔ)攀,朱靜雯,黃文琦,劉陳立,傅雄飛
(1 中國科學(xué)院深圳先進(jìn)技術(shù)研究院,深圳合成生物學(xué)創(chuàng)新研究院,中國科學(xué)院定量工程生物學(xué)重點(diǎn)實(shí)驗(yàn)室,廣東省合成基因組學(xué)重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518055;2 中國科學(xué)院大學(xué),北京 100049)
本世紀(jì)初兩項(xiàng)創(chuàng)造性的工作——撥動(dòng)開關(guān)[1]和壓縮振蕩子[2]——利用工程化的思想設(shè)計(jì)了人工基因回路并使其實(shí)現(xiàn)特定的生理功能。秉承這一思想,合成生物學(xué)在眾多學(xué)科的交叉中誕生,在生命科學(xué)領(lǐng)域的研究中逐漸受到廣泛的關(guān)注。近20 年來該學(xué)科出現(xiàn)許多重要的突破:一方面,通過對(duì)基因組的挖掘,人類得到大量定量刻畫的生物元件[3-5],并設(shè)計(jì)出了越來越復(fù)雜的基因邏輯回路[6-7],它們能響應(yīng)特定的外界信號(hào)并輸出預(yù)期的結(jié)果;另一方面,利用合成生物學(xué)工具,人類對(duì)生命系統(tǒng)的工作機(jī)理有了更深層次的認(rèn)識(shí),例如揭示細(xì)胞生長、分裂的普適機(jī)制[8-9];利用化學(xué)合成技術(shù)合成細(xì)胞基因組[10-11]為實(shí)現(xiàn)從頭設(shè)計(jì)合成生命打下物質(zhì)基礎(chǔ)。另外,在產(chǎn)業(yè)方面,大量具有高價(jià)值的復(fù)雜產(chǎn)物通過合成基因回路實(shí)現(xiàn)了工業(yè)化生產(chǎn),有望取代傳統(tǒng)化工合成,降低對(duì)環(huán)境的破壞和對(duì)化石能源的依賴性[12-13]。
盡管如此,我們對(duì)基因的解讀能力仍處在較低的水平:DNA 序列提供的信息高度復(fù)雜,通過人工組合、設(shè)計(jì)的復(fù)雜基因回路放入到底盤細(xì)胞后,底盤細(xì)胞對(duì)特定信號(hào)的響應(yīng)往往出乎我們的預(yù)期[14-15]。細(xì)胞在執(zhí)行命令的過程中存在許多細(xì)節(jié)我們?nèi)圆磺宄螂y以定量描述,但這些細(xì)節(jié)卻也是基因回路功能實(shí)現(xiàn)的重要環(huán)節(jié)。基因回路同底盤細(xì)胞之間存在種種聯(lián)系,回路功能實(shí)現(xiàn)依賴細(xì)胞的DNA 復(fù)制系統(tǒng)、轉(zhuǎn)錄和翻譯系統(tǒng)以及各種代謝產(chǎn)物前體。不同的菌株、不同的生長條件,都會(huì)對(duì)基因的表達(dá)量產(chǎn)生影響[16-17],而基因回路中不同基因的表達(dá)量決定了回路的輸出結(jié)果;同時(shí),外源的基因回路的表達(dá)對(duì)于底盤細(xì)胞而言是一種“負(fù)擔(dān)”[18-19],外源基因表達(dá)將占用有限的DNA、RNA、蛋白質(zhì)的合成機(jī)器以及各種底物,這種資源上的占用將改變底盤細(xì)胞內(nèi)源的基因表達(dá),進(jìn)而改變底盤細(xì)胞的生理狀態(tài)。因此,基因回路和底盤細(xì)胞兩者存在天然的耦合。然而長期以來,我們對(duì)合成基因的回路設(shè)計(jì)思路主要集中在單獨(dú)元件的定量和預(yù)測上,忽略了底盤細(xì)胞與基因回路元件之間的影響。所以,使用特定條件下的單個(gè)基因模塊的定量數(shù)據(jù)來預(yù)測不同工作背景下在基因回路的行為會(huì)出現(xiàn)偏差,導(dǎo)致合成基因回路設(shè)計(jì)不可避免地進(jìn)入無限循環(huán)的“設(shè)計(jì)?構(gòu)建?調(diào)試”中。不僅如此,許多工程菌,如環(huán)境治理工程菌、腸道菌群改造工程菌等,其工作環(huán)境往往不是標(biāo)準(zhǔn)的實(shí)驗(yàn)室條件,底盤細(xì)胞生理顯然受環(huán)境的影響而發(fā)生了變化,導(dǎo)致很多基因回路無法實(shí)現(xiàn)預(yù)期功能[20]。
得益于系統(tǒng)生物學(xué)理論以及組學(xué)實(shí)驗(yàn)方法的發(fā)展,近年來,許多工作使得我們對(duì)于底盤細(xì)胞生理的理解有了更加全面、定量的認(rèn)識(shí)[15,21-22]。將底盤細(xì)胞的生理狀態(tài)納入到對(duì)基因回路行為的理解中,許多反常規(guī)的問題迎刃而解[23];同時(shí),這些理論也被應(yīng)用到了合成基因回路設(shè)計(jì)的實(shí)踐中,給合成基因回路設(shè)計(jì)帶來了新的思路。除此之外,開發(fā)正交性元件和更加精巧的模塊化設(shè)計(jì)也為解決這一問題提供了新的思路[24]。
本文將梳理近年來合成基因回路與底盤細(xì)胞相互耦合的理論研究,介紹底盤細(xì)胞與基因回路的相互作用,以及與之相關(guān)的定量技術(shù),并進(jìn)一步介紹近年來關(guān)于解開底盤-回路耦合的成果。
細(xì)胞通過一系列的生理生化過程從外界環(huán)境中攝取維持生長所需的物質(zhì),通過同化作用轉(zhuǎn)化為復(fù)制、轉(zhuǎn)錄、翻譯和酶促反應(yīng)等生物過程所需的資源。在不同底盤細(xì)胞中,或者同一底盤細(xì)胞在不同的環(huán)境和生長條件中,細(xì)胞會(huì)將其資源以不同的策略分配給不同的環(huán)節(jié),以最大限度地提高其適應(yīng)性[9,21,25-26],分配策略的變化會(huì)導(dǎo)致回路的響應(yīng)變化。同時(shí)基因回路作為外源基因,會(huì)競爭各種共享資源,如RNA 聚合酶、核糖體和氨基酸,以及各種生化反應(yīng)所需的酶和能量[27-29]對(duì)底盤細(xì)胞的生理狀態(tài)產(chǎn)生影響,導(dǎo)致細(xì)胞生長緩慢、形態(tài)發(fā)生變化,這些變化同樣作為基因回路的輸入函數(shù),影響基因回路行為,并可能產(chǎn)生難以預(yù)料的結(jié)果[30]。而且不同回路模塊之間同樣也存在競爭,這種競爭同樣會(huì)導(dǎo)致回路的輸出不符合預(yù)期[圖1(a)]。本節(jié)將介紹回路-底盤相互作用的機(jī)制研究成果,并討論這些機(jī)制帶來的生理效應(yīng)。
圖1 底盤細(xì)胞和基因回路之間的相互作用[31-32]Fig.1 Schematic of interactions between host cells and genetic circuits[31-32]
不同生物底盤細(xì)胞之間的基因背景差異會(huì)導(dǎo)致標(biāo)準(zhǔn)化的基因元件的輸出結(jié)果的差異[33-34],這為合成生物學(xué)的標(biāo)準(zhǔn)化設(shè)計(jì)提出了重大挑戰(zhàn)。Moser等[35]研究指出轉(zhuǎn)化到不同Escherichia coli菌株中的與邏輯門(AND 門)會(huì)有不同的表現(xiàn)。同一培養(yǎng)條件下,AND 門回路在E.coliDS68637 中能夠正常響應(yīng),而轉(zhuǎn)入到E.coliDH10B 菌株中卻完全失去功能。而不同營養(yǎng)成分的培養(yǎng)基以及不同的培養(yǎng)條件也會(huì)對(duì)基因元件的響應(yīng)產(chǎn)生改變[16,36-37]。AND 門在LB 培養(yǎng)基中對(duì)誘導(dǎo)劑的響應(yīng)非常靈敏;而轉(zhuǎn)入貧瘠培養(yǎng)基后,誘導(dǎo)劑的加入甚至使細(xì)胞停止生長。
除了底盤細(xì)胞的遺傳背景差異以及培養(yǎng)環(huán)境差異對(duì)基因回路造成的影響之外,底盤細(xì)胞的生長速率也是影響回路功能的關(guān)鍵因素之一。細(xì)胞中蛋白的降解主要以細(xì)胞生長的方式對(duì)胞內(nèi)蛋白進(jìn)行稀釋[38],因此表達(dá)水平往往和底盤細(xì)胞生長速率相耦合,而蛋白表達(dá)水平的濃度高低則決定了基因線路的輸出行為[39]。Tan 等[40]分析了由自激活突變體T7 RNA 聚合酶組成的基因回路,雖然該自激活過程是非協(xié)同的,但該回路的基因表達(dá)水平卻呈現(xiàn)出雙穩(wěn)態(tài)。這一反常規(guī)的現(xiàn)象可以解釋為,基因回路的表達(dá)引起了細(xì)胞生長速率的減慢,而細(xì)胞的生長對(duì)基因元件的表達(dá)存在著正反饋調(diào)節(jié),進(jìn)一步增加蛋白的積累,從而實(shí)現(xiàn)了雙穩(wěn)態(tài)現(xiàn)象。
人工基因回路的表達(dá)占用了底盤細(xì)胞生長代謝相關(guān)的資源,影響細(xì)胞的正常生長[41-42]。外源基因回路對(duì)RNA聚合酶和核糖體[36]的競爭是導(dǎo)致這種壓力的主要因素。當(dāng)E.coli細(xì)胞表達(dá)與生存不相關(guān)蛋白占細(xì)胞蛋白總量約30%時(shí),細(xì)胞會(huì)完全停止生長[25,43]。除此之外,元件與底盤細(xì)胞的特異互作可能導(dǎo)致毒性,比如代謝過程中的酶發(fā)生互作等。
另外,外源基因的表達(dá)甚至?xí)鸬妆P細(xì)胞的整體資源分配策略的改變。細(xì)胞本身存在動(dòng)態(tài)調(diào)節(jié)分配策略的機(jī)制[44-46],(p)ppGpp[guanosine tetra-phosphate or penta-phosphate,鳥苷四(五)磷酸]轉(zhuǎn)錄翻譯調(diào)節(jié)機(jī)制,當(dāng)外源蛋白持續(xù)表達(dá)幾代之后,E.coli細(xì)胞可以利用(p)ppGpp 的調(diào)控機(jī)制,實(shí)現(xiàn)對(duì)全局性資源的重新分配[44,47]。較高的(p)ppGpp 水平通過直接抑制核糖體合成以及蛋白翻譯速度來抑制細(xì)胞生長。較低的(p)ppGpp 水平限制參與細(xì)胞代謝相關(guān)蛋白的表達(dá)水平。在引入外源基因回路的條件下,外源基因?qū)?xì)胞內(nèi)氨基酸資源的消耗,使得(p)ppGpp 水平升高,降低核糖體的水平,提高代謝相關(guān)蛋白的表達(dá)量,這一策略在貧瘠培養(yǎng)基中可以有效協(xié)調(diào)細(xì)菌的資源分配。
基因回路中不同的模塊之間也會(huì)競爭細(xì)胞資源[48-51]。當(dāng)外源回路中的基因都在爭奪這些有限的資源時(shí),基因之間就會(huì)產(chǎn)生非預(yù)期的相互作用。這些相互作用可以極大改變基因回路的預(yù)期行為,導(dǎo)致實(shí)驗(yàn)結(jié)果與模型預(yù)測完全不符。例如,Qian等[52]的工作表明,當(dāng)兩個(gè)激活模塊單獨(dú)存在時(shí),希爾函數(shù)可以很好地吻合實(shí)驗(yàn)結(jié)果。但是將兩個(gè)模塊串聯(lián)形成更復(fù)雜的體系后,理論預(yù)測的結(jié)果甚至和實(shí)驗(yàn)結(jié)果完全相反。Wei 等[50]則建立了粗粒化的模型框架,用于描述生命體中轉(zhuǎn)錄因子、核糖體、蛋白降解酶等資源的競爭行為,通過統(tǒng)一的模型框架可以有效評(píng)估和理解基因回路中可能存在的競爭效應(yīng)。
除了上述三種競爭效應(yīng)外,底盤細(xì)胞和基因回路的互作還帶來了一系列其他效應(yīng),例如增加同基因群體的異質(zhì)性、降低遺傳穩(wěn)定性以及毒性效應(yīng)。
即使是相同基因型的細(xì)胞,在生長分裂等動(dòng)態(tài)過程以及各種生理生化過程都存在噪聲,造成了表型多樣性[53-55]。研究表明,這種差異往往隨著生長速率的減小而變得顯著[56-57]。因此,外源基因的表達(dá)使得這種擾動(dòng)變得更加明顯,從而導(dǎo)致底盤細(xì)胞的生理異質(zhì)性增強(qiáng)。而這種異質(zhì)性導(dǎo)致一部分表達(dá)量相對(duì)較低的細(xì)胞獲得相對(duì)較快的生長速度,這類細(xì)胞便可以在不斷的傳代培養(yǎng)中取得優(yōu)勢,最終導(dǎo)致合成基因回路的失效[40][圖1(b)]。另外,在細(xì)菌細(xì)胞中,資源的分配比例也可能會(huì)隨著個(gè)體的差異而不同。例如,外源基因和底盤細(xì)胞基因往往公用E.coli內(nèi)源蛋白質(zhì)降解系統(tǒng)ClpXP,過量表達(dá)的蛋白可能導(dǎo)致不同蛋白的降解出現(xiàn)“排隊(duì)效應(yīng)”,這一隨機(jī)的分配過程導(dǎo)致細(xì)胞的異質(zhì)性增強(qiáng)[48]。
細(xì)胞的生長壓力帶來的負(fù)向篩選作用會(huì)減弱人工基因回路的遺傳穩(wěn)定性。研究表明基因回路功能可以給細(xì)胞帶來很大的適應(yīng)性劣勢(fitness disadvantage)[31],并且發(fā)生適應(yīng)性進(jìn)化以減輕與表達(dá)外源蛋白質(zhì)相關(guān)的代謝負(fù)荷或毒性。基因回路給底盤細(xì)胞帶來壓力,同時(shí)導(dǎo)致底盤細(xì)胞生長速率往往低于野生型菌株,而突變導(dǎo)致的含有失效的基因回路的菌株往往具有更好的適應(yīng)性,這樣一來,在連續(xù)培養(yǎng)的過程中,帶有期望功能的合成菌株會(huì)逐漸失去優(yōu)勢。Sleight 等[31]評(píng)估了帶有不同的調(diào)控元件的3 種熒光蛋白在E.coli中的遺傳穩(wěn)定性,發(fā)現(xiàn)表達(dá)量低和帶有更少重復(fù)序列的基因回路具有更好的遺傳穩(wěn)定性[圖1(c),修改自文獻(xiàn)[31]]。重復(fù)序列容易導(dǎo)致基因重組進(jìn)而導(dǎo)致序列丟失,因此有必要建立更大的優(yōu)質(zhì)元件庫,減少元件在同一基因回路中的重復(fù)使用,使用低拷貝的質(zhì)?;蛘邔⒒蚧芈氛系交蚪M也可以降低重組發(fā)生的概率[58]。同時(shí)在設(shè)計(jì)的環(huán)節(jié)中加入同源序列檢查的過程,避免元件組合的過程中產(chǎn)生意外的同源序列。
在基因回路的測試過程,往往會(huì)發(fā)現(xiàn)有些基因元件或回路會(huì)導(dǎo)致細(xì)胞形態(tài)發(fā)生變化,如纖維化。一般認(rèn)為這種現(xiàn)象是由基因回路與細(xì)胞的一些生理過程發(fā)生了意外相互作用引起的。一種可能是,異源DNA 中存在一些意外的功能序列。如,DnaA Box 會(huì)嚴(yán)重影響細(xì)菌的分裂[59];另外,富含AT 序列的DNA 序列可能是未知的啟動(dòng)子,高頻的轉(zhuǎn)錄占用了細(xì)胞大量RNAP,造成RNAP不足[60]。另外,外源基因的表達(dá)產(chǎn)物也可能與底盤細(xì)胞的基因組意外互作,例如TetR 家族中一些阻遏的蛋白異常調(diào)節(jié)底盤細(xì)胞的基因表達(dá)[61-62]。高表達(dá)dCas9 也會(huì)嚴(yán)重影響細(xì)胞生理。組學(xué)實(shí)驗(yàn)發(fā)現(xiàn)dCas9 蛋白在高表達(dá)水平下,能夠非特異性結(jié)合到基因組上影響部分基因的轉(zhuǎn)錄水平[32][圖1(d),修改自文獻(xiàn)[32]],導(dǎo)致細(xì)胞生長速率的急劇下降和細(xì)胞形態(tài)的纖維化。另外,也有實(shí)驗(yàn)表明gRNA 只含有9 堿基與目標(biāo)位點(diǎn)匹配的情況下,也能有效結(jié)合到基因組上引起轉(zhuǎn)錄下調(diào)[63]。目前,還沒有系統(tǒng)性的定量毒性的方法,對(duì)于這些意外的互作情況,使用組學(xué)技術(shù),如RNA-seq 等[36],可以有效地進(jìn)行評(píng)估。
綜上所述,基因表達(dá)與細(xì)胞生長之間存在著多方面的聯(lián)系。對(duì)這些關(guān)系的認(rèn)識(shí)可以提高對(duì)基因回路行為認(rèn)識(shí)和預(yù)測,為合成基因回路的理性設(shè)計(jì)提供指導(dǎo)?;谏鲜鰧?shí)驗(yàn)證據(jù),很多數(shù)學(xué)模型被用于描述這些機(jī)制,以進(jìn)一步解釋更復(fù)雜的生理現(xiàn)象。
由于底盤細(xì)胞與基因回路之間存在復(fù)雜的相互作用,近年來不少工作利用數(shù)學(xué)模型解釋了不同生長速度和藥物作用下的細(xì)胞的行為[25],將基因回路與底盤同時(shí)納入到模型的框架中,使得許多基因回路失效的案例得到了解釋,并為下一步底盤改造提供了方向。本節(jié)將介紹近年來出現(xiàn)的代表性的工作,介紹如何用生物物理模型去預(yù)測耦合效應(yīng)。
近十幾年來,隨著合成生物學(xué)的發(fā)展,用生物物理模型描述回路與底盤的互作逐漸興起,但模擬細(xì)胞內(nèi)全部或主要生理過程的思想早在1979 年就有報(bào)道[64]。進(jìn)入20 世紀(jì)以來,伴隨著組學(xué)技術(shù)、生物定量技術(shù)的發(fā)展以及運(yùn)算能力的提高,出現(xiàn)了全盤考慮所有已知生化過程的數(shù)學(xué)模型,其被稱為全細(xì)胞模型(whole cell model)[65-67][圖2(a),修改自文獻(xiàn)[67]]。也有忽略大部分生化過程,僅考慮關(guān)鍵的幾個(gè)生化過程的粗粒化的模型(coarsegrained model)[25,68-69][圖2(b),修改自文獻(xiàn)[69]]。
隨著組學(xué)技術(shù)的興起,構(gòu)建全細(xì)胞模型的想法自然而然地產(chǎn)生,自2000 年以來經(jīng)歷了構(gòu)建全基因組網(wǎng)絡(luò)結(jié)構(gòu)、整合組學(xué)數(shù)據(jù)階段[65],到目前擁有一定的預(yù)測能力。
2012 年,Karr 等[67]基于多維組學(xué)數(shù)據(jù)對(duì)Mycoplasma genitalium進(jìn)行全細(xì)胞建模,將細(xì)胞的生理過程分為28 個(gè)子過程并用16 個(gè)細(xì)胞變量將子過程整合起來,用合適的數(shù)學(xué)模型進(jìn)行模擬,例如細(xì)胞代謝產(chǎn)物使用流平衡分析(flux-balance analysis,F(xiàn)BA)方法,蛋白質(zhì)等代謝產(chǎn)物降解采用泊松過程。在每個(gè)細(xì)胞周期內(nèi),每個(gè)子過程都在一個(gè)較短的時(shí)間尺度內(nèi)獨(dú)立模擬,并通過細(xì)胞變量整合。該模型可以對(duì)基因組各基因與轉(zhuǎn)錄因子之間的互作等諸多細(xì)胞行為做出預(yù)測,在這基礎(chǔ)上通過對(duì)單基因擾動(dòng)的模擬發(fā)現(xiàn)了已注釋基因的新功能。除了M.genitalium以外,另一個(gè)比較成熟的生物模型是E.coli模型,有研究以它為對(duì)象嘗試建立對(duì)應(yīng)全細(xì)胞模型,成功預(yù)測大部分基因或環(huán)境擾動(dòng)對(duì)生長速率的影響[70]。除了預(yù)測實(shí)驗(yàn)現(xiàn)象以外,全細(xì)胞模型在生理機(jī)制證明方面也有應(yīng)用,通過將染色體上的DnaA Box 整合進(jìn)全細(xì)胞復(fù)制模型,可以建立染色體復(fù)制起始時(shí)間決策的模型[71]。從全細(xì)胞模型出發(fā)研究關(guān)于噪聲對(duì)基因開關(guān)的影響,發(fā)現(xiàn)生長狀態(tài)對(duì)噪聲大小存在影響,由于轉(zhuǎn)錄翻譯元件擴(kuò)散速度慢和自我復(fù)制特性會(huì)產(chǎn)生正反饋機(jī)制,導(dǎo)致快速生長條件下的細(xì)胞存在更大的噪聲[72]。通過在模型中加入基因線路模塊,全細(xì)胞模型也可以進(jìn)行基因線路動(dòng)力學(xué)預(yù)測,Purcell 等[73]在回路噪聲模擬問題上初步應(yīng)用了M.genitalium全細(xì)胞模型,再現(xiàn)了自抑制振蕩回路中的噪聲現(xiàn)象。
全細(xì)胞模型涉及大量的參數(shù),在M.genitalium的全細(xì)胞模型中整理了1900 個(gè)參數(shù),包括小分子和蛋白質(zhì)濃度、DNA 蛋白質(zhì)親和力大小、RNA 蛋白質(zhì)降解速率、超螺旋程度影響等,以及更多當(dāng)前無法定量的參數(shù)[74]。另外,繁雜的參數(shù)使得模型模擬結(jié)果與參數(shù)之間的關(guān)系變得難以解讀。從“一切從簡”的觀點(diǎn)出發(fā)的粗?;P统蔀榱伺c之互補(bǔ)的另一條途徑。
人們希望通過一些簡化模型,抓住所關(guān)注問題的核心機(jī)制,來對(duì)現(xiàn)象進(jìn)行解釋。早期細(xì)胞生理學(xué)家通過粗?;P拖胍卮鸬膯栴}是,如何預(yù)測特定環(huán)境下的細(xì)胞生長速度。然而單純從營養(yǎng)物質(zhì)能量大小出發(fā),無法解釋實(shí)驗(yàn)結(jié)果,于是科學(xué)家們注意到前體代謝物對(duì)生長的關(guān)鍵作用以及蛋白質(zhì)合成和底物之間的調(diào)節(jié)效應(yīng),相關(guān)內(nèi)容總結(jié)于文獻(xiàn)[75],這算是最初的粗?;P?。而Scott等[25]基于實(shí)驗(yàn)現(xiàn)象,進(jìn)一步將蛋白質(zhì)組分為核糖體相關(guān)部分、代謝部分和其他部分,通過構(gòu)建粗粒化模型得以解釋實(shí)驗(yàn)中觀察得到的現(xiàn)象。2015 年Wei?e 等[68]又系統(tǒng)性地從能量角度整合Scott 的研究結(jié)果并精簡了相關(guān)因素,對(duì)細(xì)胞生長做出了更為準(zhǔn)確的預(yù)測,并進(jìn)一步討論了其中回路與宿主之間的作用機(jī)制。2017 年,Liao 等[69]引入ppGpp 作為全局調(diào)控因子,進(jìn)一步對(duì)營養(yǎng)物質(zhì)切換時(shí)細(xì)胞生長的實(shí)驗(yàn)現(xiàn)象進(jìn)行了解釋,并且引入了更多的競爭機(jī)制成功解釋了基因回路相關(guān)的實(shí)驗(yàn)現(xiàn)象。粗粒化模型對(duì)細(xì)胞生理行為的描述越發(fā)準(zhǔn)確,并且細(xì)胞與回路之間的互作也被越來越多地考慮到其中。粗粒化模型的參數(shù)數(shù)量比全細(xì)胞模型的要少得多,Liao等[69]的關(guān)于E.coli的粗?;P椭械膮?shù)僅97 個(gè),實(shí)驗(yàn)測得有52 個(gè),其中部分參數(shù)相對(duì)穩(wěn)定,不需要重復(fù)測量,可解釋性和可實(shí)現(xiàn)性方面比全細(xì)胞模型更具有優(yōu)勢。
研究底盤-回路耦合效應(yīng),要抓住兩者之間相互作用的關(guān)鍵節(jié)點(diǎn),資源的競爭和全局性調(diào)度是繞不開的話題。根據(jù)不同的研究需要,抓住資源競爭過程中的瓶頸和底盤細(xì)胞相互作用的調(diào)節(jié)分子,研究人員構(gòu)建了一系列模型幫助理解底盤-回路相互耦合的源頭。外源基因回路的表達(dá),對(duì)底盤細(xì)胞轉(zhuǎn)錄和翻譯資源的競爭已經(jīng)通過模型和實(shí)驗(yàn)得到了闡述,例如,Vecchio 課題組[49]和Macía課題組[42]分別對(duì)宿主細(xì)胞內(nèi)的不同基因回路資源競爭進(jìn)行研究,提出了基因表達(dá)的“等成本曲線”模型,將RNA 聚合酶資源和核糖體資源納入到模型框架中,并成功地解釋了實(shí)驗(yàn)現(xiàn)象。
另外,在資源較強(qiáng)的競爭條件下,隨機(jī)性也會(huì)被放大,類似于“排隊(duì)過程”。例如,蛋白質(zhì)翻譯過程中不同種mRNA 的豐度對(duì)有限核糖體結(jié)合競爭帶來的基因表達(dá)波動(dòng)[76],類似的作用機(jī)制在轉(zhuǎn)錄、蛋白質(zhì)降解[48]過程中都會(huì)有所體現(xiàn),Wei等[50]提出的分子競爭粗?;P蜑榻忉尭偁庍^程在基因調(diào)控網(wǎng)絡(luò)中的影響提供模型框架。
本質(zhì)上,全細(xì)胞模型和粗粒化模型是兩種不同的思考方向,全細(xì)胞模型是自下而上地逐一還原生化細(xì)節(jié)來構(gòu)建完整細(xì)胞模型,而粗?;P褪亲陨隙碌貙?duì)細(xì)胞進(jìn)行簡化。或許未來某個(gè)時(shí)刻這兩條回路最終會(huì)到達(dá)一個(gè)終點(diǎn),伴隨著自動(dòng)化實(shí)驗(yàn)技術(shù)的成熟,發(fā)展出一套成熟的細(xì)胞模型刻畫體系,加快生物資源開發(fā)效率[77]。
通過生物物理模型,可以幫助有效理解回路-底盤耦合的根源。減弱或者規(guī)避這種耦合可以大幅降低預(yù)測、構(gòu)建大規(guī)?;蚧芈返碾y度。目前主要有兩種思路,回路元件正交化[78]和設(shè)計(jì)模塊化[79-80]。前者通過人工的改造和導(dǎo)入各個(gè)層次上的正交元件(包括正交DNA 堿基,正交rRNA、tRNA、mRNA,正交蛋白質(zhì)),來減弱甚至最終消除回路與細(xì)胞之間的耦合效應(yīng);后者通過基因互作拓?fù)浣Y(jié)構(gòu)的設(shè)計(jì),來增強(qiáng)回路本身魯棒性,減少其受宿主本身狀態(tài)影響的效果。
正交化希望實(shí)現(xiàn)在維持回路其內(nèi)部的邏輯調(diào)控的前提下,盡可能減少其內(nèi)部元件與元件之間,以及元件與底盤細(xì)胞自身系統(tǒng)的不必要的交互。基因回路會(huì)不可避免地使用底盤細(xì)胞的各種資源,在特定情況下也需要建立與底盤細(xì)胞系統(tǒng)的接口,比如在進(jìn)行天然產(chǎn)物的生產(chǎn)中,對(duì)底盤細(xì)胞原有的代謝網(wǎng)絡(luò)進(jìn)行連接[81-82]。正交化基因回路,減少了與底盤細(xì)胞的過多交互,在進(jìn)行模擬預(yù)測時(shí)可以減少參數(shù),提高系統(tǒng)的可預(yù)測性。通過在基因庫中挖掘,正交化的DNA 復(fù)制、轉(zhuǎn)錄、翻譯系統(tǒng)也不斷涌現(xiàn)出來,正交中心法則系統(tǒng)這一概念也被提出。正交中心法則系統(tǒng)希望中心法則中涉及的生物合成過程使用一套正交的系統(tǒng)完成,可以類比為計(jì)算機(jī)科學(xué)中虛擬機(jī)的概念[83]。正交轉(zhuǎn)錄機(jī)器則早已在合成生物領(lǐng)域廣泛使用,噬菌體RNA 聚合酶是使用最多的元件,這類RNA 聚合酶識(shí)別特定的啟動(dòng)子序列進(jìn)行轉(zhuǎn)錄,大多為單體酶,且具有很強(qiáng)的轉(zhuǎn)錄活性。同時(shí)它們也容易被改造成為蛋白質(zhì)相互作用層次的邏輯門,例如對(duì)其結(jié)構(gòu)域進(jìn)行分割,融合其他類型的蛋白質(zhì)或結(jié)構(gòu)域可以豐富其功能,例如,感光T7 RNAP[84-85]。類似地,將RNA聚合酶與DNA識(shí)別能力的蛋白[例如鋅指蛋白(ZFNs)、轉(zhuǎn)錄激活因子(TALENs)或CRISPR Cas 蛋白等]進(jìn)行融合表達(dá),可以擴(kuò)展其使用的范疇。例如拓展理性化設(shè)計(jì)的啟動(dòng)子的轉(zhuǎn)錄動(dòng)力學(xué)范圍[86]。
另一類正交轉(zhuǎn)錄系統(tǒng)則基于σ因子,利用不同來源的胞質(zhì)外功能(extracytoplasmic function,ECF)σ因子對(duì)啟動(dòng)子序列的親和性不同,通過共享RNA 聚合酶核心酶庫和不同家族的ECFσ因子,可以設(shè)計(jì)出正交的ECFσ因子組合,實(shí)現(xiàn)在轉(zhuǎn)錄層面的絕緣[87]。蛋白的翻譯涉及大量復(fù)雜的生物過程,利用理性化和定向進(jìn)化等手段,近年來,正交翻譯體系也取得大量的進(jìn)展。例如,改造氨酰tRNA 合成酶可以將非天然氨基酸引入到蛋白質(zhì)的序列中,有希望給蛋白質(zhì)帶來更多樣的生理功能;得益于DNA 合成成本的降低,F(xiàn)reden 等從頭設(shè)計(jì)DNA 序列替換細(xì)菌天然基因組,成功將E.coli中64 種密碼子壓縮到了61 種,為擴(kuò)充非天然氨基酸到合成生命的蛋白庫打下了基礎(chǔ)[88]。改變核糖體16S rRNA 的序列,則可以得到正交核糖體,識(shí)別非典型的核糖體結(jié)合位點(diǎn)(ribosomal binding site,RBS)序列,從而絕緣合成基因回路和底盤細(xì)胞的基因表達(dá)[78,89]。
轉(zhuǎn)錄因子是合成基因回路設(shè)計(jì)中主要承擔(dān)邏輯運(yùn)算的元件,這類元件識(shí)別特定的序列激活或抑制下游基因的轉(zhuǎn)錄,未經(jīng)正交化的轉(zhuǎn)錄因子存在交叉識(shí)別對(duì)應(yīng)結(jié)合位點(diǎn)的風(fēng)險(xiǎn)。另外,結(jié)合到管家基因相關(guān)的DNA 序列上可能影響細(xì)胞正常代謝,產(chǎn)生毒性。
通過定向進(jìn)化等手段對(duì)阻遏蛋白進(jìn)行優(yōu)化,增強(qiáng)其序列識(shí)別的特異性,也有助于降低細(xì)胞毒性[90]。除了典型的阻遏蛋白和激活蛋白外,許多具有識(shí)別序列功能的蛋白都可以通過理性化設(shè)計(jì)成為轉(zhuǎn)錄因子,如dCas9、TALENs 等,由于上述的非特異性結(jié)合等原因,高表達(dá)此類蛋白往往給細(xì)胞帶來較大的代謝壓力。正交化設(shè)計(jì)的dCas9*_Phlf 在dCas9 上引入了R1335K 的突變,去除了dCas9 的PAM(protospacer adjacent motif,前間區(qū)序列鄰近基序)結(jié)合依賴性,并融合阻遏蛋白Phlf,使得它需要同時(shí)識(shí)別20 堿基的sgRNA 結(jié)合序列和30 堿基的Phlf 特異序列才能結(jié)合到DNA上,擴(kuò)充了特異性結(jié)合序列的長度,降低了脫靶的風(fēng)險(xiǎn),使細(xì)胞能耐受更高的表達(dá)量[91]。
合成生物學(xué)的一大愿景是實(shí)現(xiàn)基因元件的即插即用[92],即通過對(duì)基因元件的排列組合實(shí)現(xiàn)復(fù)雜的網(wǎng)絡(luò)調(diào)控。傳統(tǒng)的模塊化主要是指元件模塊化,即對(duì)啟動(dòng)子、編碼序列、終止子等功能序列定義其邊界,將它們獨(dú)立出來。除了在元件設(shè)計(jì)過程中的模塊化,更高層次的功能回路模塊化方案最近備受關(guān)注。功能回路模塊化將功能回路(例如邏輯門等)看作一個(gè)功能單元,通過合理的設(shè)計(jì)使每一個(gè)實(shí)現(xiàn)特定功能的回路的輸入輸出水平在插入到基因回路中時(shí)不受外部參數(shù)影響而發(fā)生變化[24]?;蚧芈分懈鱾€(gè)功能模塊之間的相互作用主要由轉(zhuǎn)錄因子來實(shí)現(xiàn),例如結(jié)合到基因位點(diǎn)將導(dǎo)致游離轉(zhuǎn)錄因子濃度下降,進(jìn)而擾動(dòng)上游模塊;對(duì)于底盤細(xì)胞而言,基因回路對(duì)轉(zhuǎn)錄翻譯資源的消耗,將改變細(xì)胞生長速率以及各種資源庫的總量,進(jìn)而又影響了基因線中的各種動(dòng)力學(xué)參數(shù),這就產(chǎn)生了所謂的回溯效力(retroactivity)[52],回溯效力的存在導(dǎo)致功能模塊之間以及功能模塊與細(xì)胞生理發(fā)生干擾,導(dǎo)致隨著基因回路增加,功能模塊的動(dòng)力學(xué)屬性發(fā)生變化。如何能夠消除或規(guī)避回溯效力,實(shí)現(xiàn)回路的功能模塊化呢?控制理論中反饋控制和非協(xié)同前饋環(huán)(incoherent feedforward loop,iFFL)[93]為功能模塊化提供了思路。在原先的功能模塊中加入一個(gè)控制器,來執(zhí)行反饋調(diào)節(jié)功能或與原先模塊組成一個(gè)非協(xié)同前饋環(huán),在一定程度上解決了這一問題。
負(fù)反饋調(diào)節(jié)可以使基因回路的穩(wěn)態(tài)輸出水平僅與自生元件的動(dòng)力學(xué)性質(zhì)決定,而不受基因表達(dá)生成和稀釋速率影響[圖3(a)]。當(dāng)前大量基于反饋控制的解決方案已經(jīng)被應(yīng)用到基因回路的設(shè)計(jì)上,可以歸結(jié)為局部水平和全局水平兩類(圖3)。
局部水平的反饋策略主要著眼于功能模塊輸出本身的穩(wěn)定性,希望利用負(fù)反饋系統(tǒng)來隔離模塊與模塊之間,以及模塊與底盤細(xì)胞之間的相互影響[94-95]。例如,使用轉(zhuǎn)錄后調(diào)控元件sRNA 形成負(fù)反饋環(huán),使每一模塊的穩(wěn)態(tài)表達(dá)水平都得以固定,使得它們對(duì)來自資源競爭產(chǎn)生的擾動(dòng)具有抵抗的能力[圖3(b)][95]。類似地,Aoki 等[96]則采用了對(duì)偶積分反饋的策略,在保證了模塊的抗擾動(dòng)能力的同時(shí),實(shí)現(xiàn)了模塊穩(wěn)態(tài)輸出的可調(diào)性[圖3(c)]。
基于全局的資源調(diào)控反饋策略能夠根據(jù)基因回路表達(dá)帶來的負(fù)擔(dān)對(duì)所需的資源進(jìn)行調(diào)控。這樣的模塊化策略還可以與正交系統(tǒng)聯(lián)用。例如,正交核糖體基因表達(dá)系統(tǒng)中加入反饋控制模塊,能夠?qū)崿F(xiàn)對(duì)正交核糖體與內(nèi)源核糖體比例的動(dòng)態(tài)分配,使正交核糖體的比例按需分配給基因回路,減輕基因回路內(nèi)部的資源競爭帶來的耦合[圖3(d)][97]。
圖3 模塊化的基因回路設(shè)計(jì)Fig.3 Modularity of circuits design
另一種反饋策略則由宿主生理狀態(tài)決定,根據(jù)代謝壓力的大小來決定外源基因的表達(dá)。通過實(shí)驗(yàn)篩選出外源基因高表達(dá)時(shí)轉(zhuǎn)錄水平上調(diào)的啟動(dòng)子,利用這類啟動(dòng)子激活下游基于dCas9的轉(zhuǎn)錄抑制系統(tǒng),從而確保外源基因回路對(duì)細(xì)胞的壓力維持在一個(gè)較低的水平[圖3(e)][98]。
正反饋回路雖然無法使模塊的輸出水平更加穩(wěn)定,但也有獨(dú)特的用處。在代謝工程領(lǐng)域,為了增強(qiáng)基因回路的遺傳穩(wěn)定性,會(huì)利用與生理狀態(tài)偶聯(lián)的正反饋回路[圖3(f)],這一策略使得表達(dá)目的產(chǎn)物的個(gè)體具有生長優(yōu)勢[99-100]。
除了反饋環(huán)這一策略外,另一種基于轉(zhuǎn)錄調(diào)控的模塊化手段則采用了非協(xié)調(diào)前饋環(huán),Segall-Shapiro 等[101]通過對(duì)iFFL 模體的分析,指出當(dāng)iFFL 模體中阻遏蛋白無協(xié)同效應(yīng)時(shí),穩(wěn)態(tài)下模體的輸出將為一個(gè)常數(shù)而不依賴基因的拷貝數(shù)、細(xì)胞生長速度,通過這一簡單的策略,可以使基因在不同拷貝數(shù)下實(shí)現(xiàn)穩(wěn)定表達(dá)[圖3(g)]。
過去20 年來,合成生物學(xué)領(lǐng)域涌現(xiàn)出了大量創(chuàng)造性的工作,從復(fù)雜而精巧的邏輯門回路,到多功能生物活性材料,乃至藥物、化工產(chǎn)品的生物合成,都證明了利用合成生物學(xué)理論、方法的可行性;同時(shí),利用合成基因回路,通過自上而下的手段,擾動(dòng)生命體系,總結(jié)規(guī)律,這樣一種“建物致知”的研究范式,讓我們對(duì)生命的基本運(yùn)行法則有了更加深入的認(rèn)識(shí)。合成基因回路從實(shí)驗(yàn)室走出來,進(jìn)入到工業(yè)大規(guī)模應(yīng)用,必須要能夠適應(yīng)更多的遺傳背景迥異的底盤細(xì)胞,以及更加復(fù)雜多變的使用環(huán)境。然而,由于對(duì)底盤細(xì)胞缺乏更系統(tǒng)的認(rèn)識(shí),導(dǎo)致更為復(fù)雜的人工生命系統(tǒng)的開發(fā)工作效率低下。
本文總結(jié)了近年來底盤細(xì)胞生理、底盤細(xì)胞之間相互耦合機(jī)制的研究進(jìn)展,以及避免因耦合引起的基因回路失效等方面的策略。誠然,生命系統(tǒng)的復(fù)雜遠(yuǎn)遠(yuǎn)超出了我們的想象,掌握生命運(yùn)行的基本規(guī)律是我們理性化設(shè)計(jì)基因回路的根基。目前,我們已經(jīng)對(duì)合成生命體系的穩(wěn)態(tài)行為有了較為全面的認(rèn)識(shí)。然而,生物定量手段的匱乏、底盤細(xì)胞生理機(jī)制的空白、優(yōu)質(zhì)的生物元件庫的缺乏仍然是限制人類實(shí)現(xiàn)完全自下而上設(shè)計(jì)生命體的瓶頸,未來,我們應(yīng)當(dāng)更加注重于以下幾個(gè)方面的研究:
(1)開發(fā)更加精準(zhǔn)、高通量的定量手段,利用多層次的組學(xué)技術(shù),為定量刻畫底盤細(xì)胞-基因回路相互作用機(jī)制提供更加可靠、全面的數(shù)據(jù)。生命系統(tǒng)是一個(gè)非線性復(fù)雜系統(tǒng),精準(zhǔn)的定量有助于研究這一充滿噪聲的系統(tǒng),找到隱藏在“平均數(shù)”后的復(fù)雜機(jī)制。
(2)更加系統(tǒng)、定量化的底盤細(xì)胞生理研究,理清底盤細(xì)胞在各種條件下(如逆境、非穩(wěn)態(tài))的資源調(diào)控機(jī)制,擴(kuò)大的底盤細(xì)胞研究種類。在真實(shí)應(yīng)用場景下,不論是發(fā)酵生產(chǎn)還是疾病治療,基因線路不可避免地經(jīng)歷外界環(huán)境變化,因此,在亞穩(wěn)態(tài)下,基因回路行為遵循的規(guī)律是回路設(shè)計(jì)能力提升繞不開的門檻。
(3)挖掘、定量、優(yōu)化更多的正交基因調(diào)控元件,闡明不同遺傳背景的底盤細(xì)胞基因元件的性能。隨著合成回路的規(guī)模日益龐大,高質(zhì)量的正交元件可以減少回路邏輯網(wǎng)絡(luò)中意外產(chǎn)生的拓?fù)浣Y(jié)構(gòu),提高回路的可預(yù)測性。
(4)建立更加精準(zhǔn)的模型預(yù)測框架,包括:將底盤細(xì)胞與回路的模型描述整合在一起,結(jié)合高質(zhì)量定量數(shù)據(jù),將非穩(wěn)態(tài)狀態(tài)下的行為納入到模型的模擬范疇中,增強(qiáng)基因回路行為的可預(yù)測性;從DNA 序列生成環(huán)節(jié)出發(fā),檢查序列組合中隨機(jī)產(chǎn)生的功能序列,如DnaA、啟動(dòng)子、轉(zhuǎn)錄因子結(jié)合序列等。
(5)規(guī)避“非預(yù)期”的底盤細(xì)胞與基因回路相互作用的解決方案,如利用反饋控制機(jī)制設(shè)計(jì)更加模塊化的基因回路。