王瑞琦,陳洛南
(1 上海大學(xué)數(shù)學(xué)系,上海 200444; 2 中國科學(xué)院分子細胞科學(xué)卓越創(chuàng)新中心,上海生物化學(xué)與細胞生物學(xué)研究所系統(tǒng)生物學(xué)重點實驗室,上海 200031; 3 浙江省系統(tǒng)健康科學(xué)重點實驗室,中國科學(xué)院中國科學(xué)院大學(xué)杭州高等研究院,浙江 杭州 310024)
自從里程碑式的合成基因開關(guān)[1]與基因振子[2]出現(xiàn),合成生物學(xué)已走過了二十多年,在此期間合成生物學(xué)在設(shè)計方法、建模與分析手段、網(wǎng)絡(luò)的構(gòu)建與實驗實現(xiàn)等多方面取得了長足的進展[3]。這些進展為我們進一步設(shè)計具有理想特性的合成生物個體分子、模塊乃至更大網(wǎng)絡(luò)提供了保證。生物分子工程建立了一系列用于特定目的的蛋白質(zhì)和核酸的產(chǎn)生方法。通過合理設(shè)計進行工程設(shè)計,預(yù)先改變生物分子的序列,以實現(xiàn)所需的功能。各種模塊的動力學(xué)已經(jīng)研究得較為充分,尤其是網(wǎng)絡(luò)模塊功能與網(wǎng)絡(luò)拓撲結(jié)構(gòu)的相關(guān)性已獲得了廣泛的研究,例如正反饋回路網(wǎng)絡(luò)只會收斂到平衡點,而不會出現(xiàn)振蕩等復(fù)雜的動力學(xué)行為[4];而具有環(huán)狀網(wǎng)絡(luò)結(jié)構(gòu)的系統(tǒng)也僅會出現(xiàn)周期振蕩或平衡點,而不會出現(xiàn)更加復(fù)雜的動力學(xué),如混沌等[5]。特別地,當(dāng)負的反饋回路足夠強時,系統(tǒng)只會出現(xiàn)周期振蕩。一些基因振子具有這樣的結(jié)構(gòu),例如 Repressilator[2]以及生物鐘的單環(huán)模型[6]。一些其他振子在特定假設(shè)(如擬穩(wěn)態(tài)近似)下,也可以轉(zhuǎn)化為環(huán)狀網(wǎng)絡(luò)的結(jié)構(gòu)。
合成生物學(xué)一般采用“自下而上”的思路,從合成具有調(diào)控功能的生物大分子,使其成為標(biāo)準(zhǔn)化“元件”開始,通過分子間的調(diào)控關(guān)系并創(chuàng)建調(diào)控通路或回路等全新生物部件與細胞“底盤”,從而構(gòu)建具有各類特定用途的人造生命系統(tǒng)。合成生物學(xué)采用工程學(xué)“設(shè)計-合成-測試”的研究方法,或?qū)ψ匀簧锵到y(tǒng)“重編程”,或從頭設(shè)計具有全新特征的人工生命體系。另外,大量新技術(shù)的發(fā)展如新的DNA組裝、合成、編輯技術(shù)以及轉(zhuǎn)錄組上多種多樣、普遍存在的化學(xué)修飾的準(zhǔn)確鑒定技術(shù),為設(shè)計和控制基因表達提供了新的技術(shù)支持。
本文重點從生物分子網(wǎng)絡(luò)動力學(xué)的角度,深入闡述各種具有特定功能的合成生物網(wǎng)絡(luò)背后的理論基礎(chǔ)與分析方法,其中包括生物功能器件如開關(guān)與振子,以及從數(shù)學(xué)與網(wǎng)絡(luò)理論相關(guān)的因素,包括正負反饋回路與動力學(xué)的相關(guān)性、非線性因素與時間延遲產(chǎn)生的原因、穩(wěn)定性與分支相關(guān)理論、周期振子的魯棒性、周期可調(diào)性等動力學(xué)相關(guān)的理論基礎(chǔ)與分析方法,為進一步設(shè)計更為復(fù)雜或者更易實驗合成的生物器件提供可以借鑒的理論分析方法。
為了研究某個或者某一些基因的作用,科學(xué)家需要在某一特定時間打開或關(guān)閉這些基因的表達。這就需要一個靈敏基因開關(guān)。最簡單的基因開關(guān)模型包含一個轉(zhuǎn)錄因子TF-A[7],該轉(zhuǎn)錄因子激活其自身的轉(zhuǎn)錄。TF-A形成同二聚體并通過與增強子(TF-RE)結(jié)合來實現(xiàn)激活轉(zhuǎn)錄。轉(zhuǎn)錄速率隨TF-A二聚體濃度飽和至最大速率,其與TF-A磷酸化成比例。通過改變TF-A磷酸化程度可以模擬對刺激的反應(yīng),并進而實現(xiàn)TF-A在表達高低之間的切換,從而實現(xiàn)基因tf-a的開與關(guān)[7]。對于單個基因而言,產(chǎn)生基因開關(guān)一般有如下情形:單體轉(zhuǎn)錄因子且具有兩個結(jié)合位點的單個基因或者具有二聚體轉(zhuǎn)錄因子的單個結(jié)合位點的基因[8]。
更進一步,包含兩個相互抑制的基因的合成基因開關(guān)也被設(shè)計出來,且在大腸桿菌中得以實施。該開關(guān)由排列在相互抑制網(wǎng)絡(luò)中的任意兩個可抑制啟動子構(gòu)成。在該開關(guān)中,一個啟動子-抑制子對為Ptrc-2啟動子與Lac抑制子(lacI),另外一個啟動子-抑制子對為PLs1con啟動子與溫度敏感的λ抑制子(cIts)或為PLtetO-1啟動子與tetR抑制子[1]。兩個穩(wěn)定的狀態(tài)為定義為“低”與“高”狀態(tài),分別對應(yīng)第二個抑制子的表達與否。通過使用瞬態(tài)化學(xué)或熱感應(yīng)在穩(wěn)定狀態(tài)之間實現(xiàn)切換,從而實現(xiàn)開關(guān)的目的。
從開關(guān)實現(xiàn)的原理來講,該開關(guān)類似于具有單個基因中二聚體轉(zhuǎn)錄因子的單個結(jié)合位點的情形,也就是需要協(xié)同綁定。事實上,沒有協(xié)同也可以實現(xiàn)基因開關(guān),例如對于一系列生物相關(guān)條件,網(wǎng)絡(luò)結(jié)構(gòu)和隨機效應(yīng)的適當(dāng)組合,即使沒有協(xié)同結(jié)合,也會產(chǎn)生雙穩(wěn)態(tài)[9]。從非線性的角度講,產(chǎn)生多穩(wěn)態(tài)這些不同的條件從本質(zhì)上來講是增加系統(tǒng)的非線性,并進而產(chǎn)生多個平衡態(tài),因為較低的非線性難以產(chǎn)生多個平衡態(tài)。
從動力學(xué)分析的角度講,以常微分方程為例,假設(shè)一個基因調(diào)控網(wǎng)絡(luò)可以通過常微分方程[式(1)]來表示:
式中,x為所有分子構(gòu)成的向量,表示所有分子的濃度;而向量函數(shù)f的每一個分量表示每一個分子的所有調(diào)控,包括該分子的生成、轉(zhuǎn)化、退化等所有調(diào)控;p為系統(tǒng)的參數(shù)向量。對于基因開關(guān)的分析首先從系統(tǒng)的平衡態(tài)開始。如果(p)滿足式(2),則稱(p)為系統(tǒng)的平衡點。
事實上,當(dāng)參數(shù)p發(fā)生改變時,我們得到的(p)為平衡點曲線。接下來,我們討論平衡點的局部穩(wěn)定性。系統(tǒng)在(p)處的Jacobian矩陣為:
如果矩陣A的所有特征值具有負實部,也就是如果Re(λi)<0,則該平衡點為局部穩(wěn)定的;相反,如果存在某個具有正實部的特征值,則該平衡點為不穩(wěn)定的。從幾何角度講,所謂局部穩(wěn)定,即從一個平衡點附近出發(fā),系統(tǒng)最終仍然會收斂到該平衡點。如果平衡點為不穩(wěn)定的,則當(dāng)受到擾動時,系統(tǒng)會遠離該平衡點。
基因開關(guān)的其中一個條件為多穩(wěn)態(tài),也就是對適當(dāng)?shù)膮?shù)p,系統(tǒng)存在多個穩(wěn)定平衡點。以當(dāng)參數(shù)p=時系統(tǒng)具有三個平衡點xs,1,xu,xs,2為例。一般情形下,三個平衡點中兩個為穩(wěn)定的,即xs,1與xs,2,而一個為不穩(wěn)定的,即xu。通常情況下,動力系統(tǒng)的分支理論可以用來研究系統(tǒng)的動力學(xué)行為隨參數(shù)的變化情況。如果在特定參數(shù)值下,其兩側(cè)的動力學(xué)行為發(fā)生了定性的改變,則稱在該點發(fā)生了分支。常見的局部分支有鞍結(jié)點分支、岔分支、跨臨界分支、Hopf分支等[10-11]。由于多個穩(wěn)態(tài)的存在,穩(wěn)態(tài)不會是全局性的。如果系統(tǒng)有唯一的穩(wěn)定平衡點,一般可以采用構(gòu)造Lyapunov函數(shù)的方法來研究其全局穩(wěn)定性,盡管有時候構(gòu)造該函數(shù)非常困難。在研究基因開關(guān)時,最常見的分支是鞍結(jié)點分支,此時Jacobian矩陣具有一個零實部特征值。在鞍結(jié)點分支點的一側(cè),系統(tǒng)具有多穩(wěn)態(tài),多穩(wěn)態(tài)的產(chǎn)生與消失經(jīng)常伴隨著鞍結(jié)點分支的發(fā)生。另外一種分支為岔分支,其特征為在岔分支的一側(cè),具有一條穩(wěn)定的平衡點曲線,岔分支發(fā)生后,原來穩(wěn)定的平衡點曲線失去穩(wěn)定性,同時伴隨著出現(xiàn)兩條穩(wěn)定的平衡點曲線。由于這兩種分支均在分支點的一側(cè)具有多穩(wěn)態(tài),因而經(jīng)常被用來研究基因開關(guān)的多穩(wěn)態(tài)現(xiàn)象出現(xiàn)或者消亡。
從動力學(xué)的角度來講,開關(guān)的實現(xiàn)需要兩個條件:多穩(wěn)態(tài)與擾動。從理論的角度來看,不管是在離散的布爾模型還是連續(xù)的微分方程模型中,正反饋回路對于多穩(wěn)態(tài)都是必要的[12-13]。正反饋回路可以是直接的,就像單基因開關(guān)中轉(zhuǎn)錄因子激活自己基因的情形[7];正反饋回路也可以是間接的,就像兩個轉(zhuǎn)錄因子抑制彼此的轉(zhuǎn)錄一樣[1]。在這種情況下,兩個轉(zhuǎn)錄因子彼此抑制,第一個轉(zhuǎn)錄因子通過抑制第二個轉(zhuǎn)錄因子,間接有利于第一個轉(zhuǎn)錄因子進一步增加,類似的情形對第二個轉(zhuǎn)錄因子也成立,從而產(chǎn)生了雙穩(wěn)態(tài)。
從動力學(xué)方面來講,每一個穩(wěn)態(tài),一般指的是平衡點,都具有一個吸引域,以該區(qū)域的點作為初始點,系統(tǒng)隨著時間的演化,最終都會收斂到該穩(wěn)態(tài)。因此,在沒有外部干擾的情況下,系統(tǒng)一般不會跳出一個穩(wěn)態(tài)的吸引域,進而進入另一個穩(wěn)態(tài)的吸引域,并最終收斂到另一個穩(wěn)態(tài)。要實現(xiàn)不同穩(wěn)態(tài)間的切換,也就是實現(xiàn)開與關(guān)之間的切換,一般需要較大的外部干擾,能夠使系統(tǒng)逐漸跳出原來的吸引域,并最終停留在另外的穩(wěn)態(tài),如圖1(a)所示。在Toggle switch中,通過使用瞬態(tài)化學(xué)或熱感應(yīng)在穩(wěn)定狀態(tài)之間實現(xiàn)切換,就是這樣的道理。
圖1 常見的開關(guān)動力學(xué)(a)和周期振蕩(b)Fig. 1 Common switching dynamics for the intervals Ⅰ and Ⅲ, the system is monostable, but for the interval Ⅱ, the system is bistable (a), and periodic oscillations (b)
多穩(wěn)態(tài)模型對擾動的響應(yīng)將取決于擾動時網(wǎng)絡(luò)的狀態(tài)。區(qū)別于常微分方程模型,在時滯微分方程的模型中,對給定擾動的響應(yīng)不僅取決于擾動時刻系統(tǒng)各分子的表達水平,而且取決于延遲所包含的先前時間范圍內(nèi)各分子表達水平的歷史。因此,根據(jù)研究對象的不同,采用不同的動力學(xué)模型,其分析方法也有所不同。
如上所說,盡管不同的模型都提到正的反饋回路對于多穩(wěn)態(tài)都是必要的[14],但一直缺少嚴(yán)格的理論依據(jù)。2003年,東京大學(xué)合原教授以及現(xiàn)任職中國科學(xué)院分子細胞科學(xué)卓越創(chuàng)新中心的陳洛南研究員等[4],基于單調(diào)動力系統(tǒng)理論,從理論上嚴(yán)格證明了只有正反饋環(huán)的網(wǎng)絡(luò)沒有穩(wěn)定的振蕩,而只有穩(wěn)定的平衡點,其穩(wěn)定性與時滯無關(guān)?;诖死碚?,他們進一步提出了一種利用單調(diào)動力學(xué)系統(tǒng)設(shè)計具有多基因和時滯的合成遺傳開關(guān)網(wǎng)絡(luò)的新方法,可以在不考慮時間延遲的情況下設(shè)計基因開關(guān),因為系統(tǒng)可以從函數(shù)空間減少到歐幾里得空間。因此,即使存在不確定的延遲,也可以確保設(shè)計的開關(guān)準(zhǔn)確地工作。他們還進一步提出了一種設(shè)計開關(guān)的程序,這大大簡化了開關(guān)的設(shè)計與分析難度,并使理論分析和設(shè)計(即使對于大規(guī)模系統(tǒng))也變得容易起來。他們還設(shè)計了一個包含三個基因lacI、tetR和cI的合成基因開關(guān)。
事實上,基因開關(guān)伴隨著生命發(fā)育的幾乎所有階段,因為在整個發(fā)育過程中,始終伴隨著不同基因的打開與關(guān)閉。例如Tet控制的可誘導(dǎo)基因表達系統(tǒng)允許動物(包括昆蟲、蒼蠅、小鼠和大鼠)個體基因活性的變化。在該開關(guān)中,當(dāng)tTA與合成的tTA依賴性啟動子Ptet結(jié)合時,tTA啟動轉(zhuǎn)錄;而在存在Tet的情況下,tTA不能與啟動子Ptet結(jié)合,Ptet控制的基因轉(zhuǎn)錄被關(guān)閉。在小鼠中,Tet控制的基因表達為我們了解各種生物學(xué)過程如發(fā)育、疾病和行為等提供幫助。在特定選擇的時間點誘導(dǎo)控制基因表達將進一步促進相互關(guān)聯(lián)分析,從而可靠地將基因活性的變化與細胞生理學(xué)和動物行為的表型變化聯(lián)系起來[15]。該開關(guān)有諸多優(yōu)點,例如原核來源的TetR的結(jié)合特異性高,哺乳動物細胞中沒有類似的DNA靶向序列,所以Tet系統(tǒng)調(diào)控特異性高,并且宿主基因不受到影響,適合于體內(nèi)外的各種基因表達的調(diào)控。另外,Tet系統(tǒng)的誘導(dǎo)藥物為Tet或Dox,Tet作為一種抗生素已被人們應(yīng)用了很長時間,是對人體較為安全的一種藥物。除此之外,Tet系統(tǒng)具有可逆性,在去除誘導(dǎo)劑后可使系統(tǒng)關(guān)閉,也可反復(fù)加入誘導(dǎo)劑,多次啟動誘導(dǎo)反應(yīng)。
國內(nèi)的研究者也在人工基因開關(guān)的研究方面取得了良好的進展,例如2010年,北京大學(xué)歐陽頎、婁春波等學(xué)者[16]設(shè)計出了一種push-on pushoff開關(guān),該基因開關(guān)通過兩個模塊的耦合來實現(xiàn),兩個模塊分別為:①雙穩(wěn)態(tài)開關(guān)存儲模塊;②雙抑制啟動子NOR門模塊。耦合后的調(diào)控網(wǎng)絡(luò)可以被重復(fù)地或者由相同的輸入信號觸發(fā),發(fā)揮作為推上推下開關(guān)的功能。更進一步地,該課題組提出了一種無需特別調(diào)整就能自動設(shè)計遺傳設(shè)備的方法。通過將隨機模型與核糖體結(jié)合位點(RBS)設(shè)計方法相結(jié)合,他們開發(fā)了一種將RBS DNA序列與基因開關(guān)雙穩(wěn)態(tài)聯(lián)系起來的生物物理模型[17]。
除了常見的雙穩(wěn)態(tài)之外,2021年,加州理工學(xué)院Elowitz課題組[18]提出了一種自然激發(fā)的合成網(wǎng)絡(luò)的設(shè)計方法,該方法可以產(chǎn)生七種不同的穩(wěn)定狀態(tài)。他們通過鋅指轉(zhuǎn)錄因子設(shè)計了一種基因電路,鋅指轉(zhuǎn)錄因子通過同源二聚和異源二聚相互作用,并可由控制轉(zhuǎn)錄因子二聚和穩(wěn)定性的小分子調(diào)控。在培養(yǎng)的哺乳動物細胞中引入三種設(shè)計好的轉(zhuǎn)錄因子可以使細胞進入七種不同的穩(wěn)定狀態(tài)。這種多穩(wěn)定性在合成生物學(xué)中是有重要意義的,除了產(chǎn)生長期的多穩(wěn)定性外,這些穩(wěn)態(tài)以及它們之間的切換將為我們理解自然條件下細胞命運控制系統(tǒng)的關(guān)鍵因素與特性提供幫助。
基因開關(guān)在很多方面有著良好的應(yīng)用,并且各種新的應(yīng)用也在逐漸開發(fā)出來。例如,波士頓大學(xué)的Collins團隊[19]設(shè)計的基于RNAi和阻遏蛋白的可調(diào)基因開關(guān),可以有效地關(guān)閉任意基因。在關(guān)閉狀態(tài)下,Lac抑制因子被表達并抑制Tet抑制因子(tetR)以及感興趣基因(GOI)。一種短發(fā)夾RNA(shRNA)阻止任何殘留的基因表達。在開啟狀態(tài)下,藥物抑制lacI表達,導(dǎo)致GOI和Tet抑制因子的表達,從而抑制shRNA。事實上,一個具有良好特性的基因開關(guān)可以被結(jié)合到更復(fù)雜的調(diào)控網(wǎng)絡(luò)設(shè)計中,從而實現(xiàn)一些特定的目標(biāo),例如打開或關(guān)閉一些特定的基因,或者借助特定的蛋白酶敏感基因開關(guān)來增加報告基因的表達并準(zhǔn)確報告蛋白酶活性/抑制[20]。
從單個基因到多個基因,在合適的調(diào)控條件下,均可以構(gòu)成基因開關(guān)。通過不同的外源或內(nèi)源刺激實現(xiàn)穩(wěn)態(tài)間的切換并實現(xiàn)開關(guān)的功能。在生物分子調(diào)控的不同層次,大量地存在各種開關(guān),例如上述提到開關(guān)主要是通過轉(zhuǎn)錄調(diào)控實現(xiàn)的。除此之外,調(diào)控也可能發(fā)生在轉(zhuǎn)錄后修飾、翻譯以及蛋白調(diào)控等其他調(diào)節(jié)過程中?;蜷_關(guān)幾乎應(yīng)用于細胞生物學(xué)的所有領(lǐng)域,從基因治療和組織工程到生物工程和藥物發(fā)現(xiàn),再到構(gòu)建轉(zhuǎn)基因小鼠,以及在基礎(chǔ)和應(yīng)用研究中建立基因功能的相關(guān)性等多方面。
與合成基因開關(guān)Toggle switch發(fā)生在同一年,也就是2000年,普林斯頓大學(xué)的學(xué)者實現(xiàn)了更為復(fù)雜的功能模塊,即基因表達振蕩器[2]。該器件利用三個基因模塊彼此間的抑制作用實現(xiàn)了輸出信號的規(guī)律振蕩。這兩項工作在實驗層面證明了設(shè)計生物元器件的可能性,對合成生物學(xué)發(fā)展有重要指導(dǎo)意義,因此被稱為“合成生物學(xué)的里程碑”[21]。
從數(shù)學(xué)意義上來講,基因振蕩器的振蕩類型為極限環(huán),也就是孤立且穩(wěn)定的周期振蕩,如圖1(b)所示。與基因開關(guān)主要由正反饋回路產(chǎn)生不同,基因振蕩器的產(chǎn)生主要由負反饋回路產(chǎn)生。最簡單的合成基因振子由一個帶有時滯的負反饋回路產(chǎn)生[22],在該振蕩器中,其啟動子為LlacO-1,單個基因為lacI。如果不考慮時滯,對于單個負反饋回路,只有當(dāng)回路包含至少三個變量并且反饋項包含抑制物質(zhì)濃度的高次項時,振蕩才可能[23]。從這些研究成果來看,基因振子需要負反饋回路以及較強的非線性。
從動力學(xué)的角度,時滯會影響到平衡點的穩(wěn)定性,也會影響到周期解的產(chǎn)生或消失,當(dāng)然也會影響到周期解的周期和振幅。既然時滯對基因調(diào)控網(wǎng)絡(luò)動力學(xué)的影響很大,那時滯在基因調(diào)控網(wǎng)絡(luò)中是如何產(chǎn)生的,在數(shù)學(xué)建模的時候又如何引入時間延遲呢?數(shù)學(xué)模型中的時滯一般是對轉(zhuǎn)錄、翻譯、轉(zhuǎn)運、磷酸化等需要較長時間的調(diào)控過程所需的時間。時滯通常采用離散化的或者分布式的方式。更準(zhǔn)確地說,假如每個分子從其合成位置轉(zhuǎn)移到其發(fā)揮作用的位置需要相同的時間長度,則時間延遲可以設(shè)定為離散的。例如在單基因的具有時滯的反饋抑制模型中,時滯定義為mRNA開始形成的時間和功能性LacI四聚體產(chǎn)生的時間之間的延遲[22]。而如果每個分子從其合成位置轉(zhuǎn)移到其發(fā)揮作用的位置需要時間長度變化的幅度較大,則分布式時滯將是合適的建??蚣埽?4]。由于時滯對基因調(diào)控網(wǎng)絡(luò)的動力學(xué)有著重要的影響,因此,時滯可以作為一種控制機制,例如控制周期或振幅等[25]。
為了產(chǎn)生合成基因振子所需要的極限環(huán)振動,除了負的反饋回路、時間延遲外,非線性也是一個也無法回避的問題。在基因振子的建模過程,非線性通常體現(xiàn)在所采用的Hill函數(shù)上。一些簡單的模塊,即較少的分子個數(shù),也不包含時滯,為了產(chǎn)生振蕩行為,往往需要較大的Hill指數(shù)。事實上,Hill函數(shù)的產(chǎn)生可以通過生物化學(xué)反應(yīng),在一些擬穩(wěn)態(tài)近似與保守條件下,即假設(shè)快反應(yīng)處于平衡狀態(tài)以及結(jié)合和未結(jié)合的蛋白總數(shù)守恒,可以推導(dǎo)出來。在轉(zhuǎn)錄水平上,Hill函數(shù)反映的是阻遏蛋白復(fù)合物的形成或阻遏物與基因啟動子的協(xié)同結(jié)合。因此從Hill函數(shù)的描述對象看,Hill指數(shù)不應(yīng)該大于4,因為從分子的角度講,多于四倍體的聚合物比較少見。為了降低產(chǎn)生振蕩所需要的Hill指數(shù)值,比如說對Goodwin振子模型,提出不同的策略,其中包括引入時間延遲、非線性退化(Michaelis-Menten)、多位點磷酸化等手段[26]??傮w上來說,這些策略為引入時滯或者其他額外的非線性因素[27]。
著名學(xué)者Tyson[28]總結(jié)了生物振子的要求。第一,負反饋是將反應(yīng)網(wǎng)絡(luò)帶回其振蕩的“起點”所必需的。第二,負反饋信號在時間上必須充分延遲,以使生物化學(xué)反應(yīng)不會停留在穩(wěn)定的平衡點。第三,反應(yīng)機制的動力學(xué)速率定律必須足夠“非線性”,從而使得穩(wěn)定的平衡點失穩(wěn)。第四,產(chǎn)生和消耗的生化反應(yīng)必須在允許網(wǎng)絡(luò)產(chǎn)生振蕩的適當(dāng)時間尺度上發(fā)生。文中對時滯的產(chǎn)生也做了總結(jié),即分子的轉(zhuǎn)錄、翻譯、轉(zhuǎn)運等需要的時間,具有中間反應(yīng)物的長反應(yīng)鏈,或者動態(tài)滯后[28]。因而,在許多由常微分方程描述的動態(tài)模型中,如果沒有時滯,則狀態(tài)變量相對較多,其中的一些變量與它們之間的生化反應(yīng)與時滯起到了類似的作用。
事實上,除了上述因素外,對于周期振蕩而言,我們還需要研究其周期、振幅、可調(diào)性以及魯棒性等問題。為了產(chǎn)生周期可調(diào)且魯棒的基因振子[29],斯坦福大學(xué)的學(xué)者們通過廣泛的計算模擬發(fā)現(xiàn),當(dāng)負調(diào)控回路耦合到正調(diào)控回路時,可以容易地實現(xiàn)周期的可調(diào)性(同時保持振幅幾乎恒定)。也正因為如此,我們發(fā)現(xiàn)大多數(shù)的基因振子都具有這種正負反饋回路的網(wǎng)絡(luò)結(jié)構(gòu)。例如,許多生物鐘模型都具有這種結(jié)構(gòu),且表現(xiàn)出了良好的對抗環(huán)境波動的魯棒性。還有研究表明增加負反饋回路的長度可以增加周期可調(diào)性,例如原來的Repressilator有三個負調(diào)控,進一步增加負調(diào)控的個數(shù)且保持整體上為負反饋回路,周期可調(diào)性會變得更好[30]。
與增加負反饋回路長度的思想類似,我們在更早時候,也就是2006年與2007年,提出了一種網(wǎng)絡(luò)分解的手段[25,31]。把描述基因振子的網(wǎng)絡(luò)分成幾個子網(wǎng)絡(luò),也就是把原來的封閉系統(tǒng)變?yōu)閹讉€開放系統(tǒng),通過它們之間的相互輸入輸出進行耦合,并在不同的開放系統(tǒng)間引入時間延遲,我們同樣發(fā)現(xiàn)原來的Repressilator周期可調(diào)性更好[25]。從數(shù)學(xué)角度講,增加負反饋回路長度效果與引入時滯相似,這也在其他的振子網(wǎng)絡(luò)中發(fā)現(xiàn)類似的結(jié)論,比如對Goodwin振子模型引入時間延遲或者引入其他調(diào)控過程如多位點磷酸化等手段[26]。網(wǎng)絡(luò)分解的思想可以更好地幫我們從開放系統(tǒng)的平衡點來確定周期振動的振幅,而其周期可以通過時滯或者其他調(diào)控來進行調(diào)節(jié)。顯然周期振動在波峰與波谷處對時間的導(dǎo)數(shù)為零,因此振動波峰與波谷的值為描述其動力學(xué)的微分方程系統(tǒng)中某些方程的平衡點,也可以說是擬穩(wěn)態(tài)。如果系統(tǒng)的所有方程都為零,則該零點為整個系統(tǒng)的平衡點。因此,網(wǎng)絡(luò)分解正好可以解決這些問題,也就是通過研究不同子模塊或者子網(wǎng)絡(luò)的平衡點來確定整個系統(tǒng)的振幅。對于更為復(fù)雜的通過互鎖的正負反饋回路構(gòu)建的生物鐘網(wǎng)絡(luò),此網(wǎng)絡(luò)分解的方法也非常有效[25,31]。
合成基因振子的類型以及其網(wǎng)絡(luò)拓撲結(jié)構(gòu)有很多。除了上述提到的一些因素外,還有一些其他因素,例如利用不同的時間尺度,并進而產(chǎn)生松弛振蕩[32]。類似地,我們也在很久前構(gòu)建了基因松弛振子[33]。通過一個正的自反饋的基因與兩個基因間的負反饋回路的耦合,并利用兩個蛋白的不同時間尺度,構(gòu)建了基因松弛振子。此類松弛振子可以采用分析快慢流行的方法進行研究。除了松弛振子,不同的時間尺度在設(shè)計與構(gòu)建基因振子時,起著重要的作用。眾所周知,蛋白之間的結(jié)合或者蛋白與啟動子的結(jié)合顯然比轉(zhuǎn)錄與翻譯等過程滿得多。因此,在許多合成基因網(wǎng)絡(luò)的設(shè)計與分析時,經(jīng)常假設(shè)快反應(yīng)處于擬平衡狀態(tài),從而可以大大簡化分析[34-36]。
魯棒性也是基因振子所必須考慮的因素,生物魯棒性是指在受到外部擾動或內(nèi)部參數(shù)攝動等不確定因素干擾時,生物系統(tǒng)保持其結(jié)構(gòu)和功能穩(wěn)定的一種特性[37]。一般而言,正負耦合的反饋回路具有更好的魯棒性。對比研究發(fā)現(xiàn),調(diào)控網(wǎng)絡(luò)的拓撲結(jié)構(gòu)對動力學(xué)與魯棒性有著重要的影響[38]。局部的調(diào)控結(jié)構(gòu)也對魯棒性有著重要的影響,例如系統(tǒng)的計算分析發(fā)現(xiàn),相對于一致的輸入,非一致的輸入有助于增強振子的魯棒性[39]。另外,在單擾動的情況下,相較于單反饋回路,雙反饋回路的結(jié)構(gòu)有助于生物鐘的魯棒微調(diào)[40]。對生物振蕩魯棒性的研究,通常采用參數(shù)敏感性分析,如周期敏感性、振幅敏感性、總體狀態(tài)敏感性分析等[40-41]。除了振子的魯棒性,其他網(wǎng)絡(luò)的魯棒性也同樣重要。最新研究結(jié)果表明,分層反饋控制克服了合成生物分子網(wǎng)絡(luò)中的魯棒性與速度性能權(quán)衡,也就是分層反饋具有良好的魯棒性與收斂速度[42]。
從數(shù)學(xué)角度對基因振子進行建模與分析時,確定性的方法通常為時滯微分方程或者常微分方程。隨機性方法包括化學(xué)主方程或朗之萬方程等。對確定系統(tǒng)的分析,振動的產(chǎn)生通常通過Hopf分支產(chǎn)生,其為局部分支,往往伴隨著某個平衡點的失穩(wěn)。在Hopf分支點,Jacobian矩陣具有一對純虛根,且隨著參數(shù)的進一步變化,純虛根變?yōu)橐粚哂姓龑嵅康膹?fù)特征值,平衡點失去穩(wěn)定性,同時產(chǎn)生周期振蕩。全局分支也會產(chǎn)生周期振蕩,如不變環(huán)上的鞍結(jié)點分支(saddle-node on invariant circle bifurcation,SNIC),有時也叫鞍結(jié)點同宿分支(saddle-node homoclinic bifurcation)[43]。
總而言之,設(shè)計、分析以及實驗實現(xiàn)理想的基因振子需要充分考慮到以上提到的諸多因素,包括魯棒性、周期可調(diào)性、非線性、負反饋回路、時滯、時間尺度、網(wǎng)絡(luò)的整體與局部拓撲結(jié)構(gòu)、振蕩產(chǎn)生與消失的機理等。我們希望本文能有助于大家更好地理解細胞振蕩的機理,并認(rèn)識到定量建模在研究這些振蕩中的重要性。
合成基因振子的下一步是為其設(shè)計細胞信號機制,以創(chuàng)建多細胞尺度上的振蕩動力學(xué)。在一個細胞群體中,細胞間耦合基因表達最常見方法是使用來自細菌的群體感應(yīng)系統(tǒng),它通常涉及細胞間通訊和細胞內(nèi)信號處理[44]。這些系統(tǒng)使用一種酶將S-腺苷甲硫氨酸(SAM)代謝為N-酰基-絲氨酸內(nèi)酯(AHL),該內(nèi)酯可以擴散到群體內(nèi)的細胞內(nèi)外,并作為轉(zhuǎn)錄因子的配體。該群體感應(yīng)模式分為三部分:信號分子的合成、擴散、接收[45]。群體感應(yīng)系統(tǒng)已成功地應(yīng)用于許多應(yīng)用中,包括能夠控制細胞種群個數(shù)的多細胞合成調(diào)控網(wǎng)絡(luò)。通過細胞間通信將基因表達與細胞生存和死亡相結(jié)合,可以編程種群的動態(tài)。通過構(gòu)建一個“種群控制”網(wǎng)絡(luò),便可以自主調(diào)節(jié)死亡率和大腸桿菌種群的密度。該合成多細胞網(wǎng)絡(luò)中采用了蛋白LuxI與LuxR,它們由合成啟動子plac/ara-132控制,用兩種質(zhì)粒pLuxRI2和pluxCcdB3進行實驗實施,殺手基因(lacZa-ccdB)由pluxI15控制[46]。
合成的多細胞振子間的協(xié)作行為也取得了長足進展[47-48]。例如通過構(gòu)建合成的多細胞網(wǎng)絡(luò),合成生物學(xué)家可以研究單細胞中的振蕩如何耦合以產(chǎn)生群體水平上的同步[49-56]。這些不同的合成多細胞網(wǎng)絡(luò)均采用了細胞間通信的方式進行耦合,且從不同的方面對同步行為進行了研究,包括共同的外部波動(即噪聲),外部輸入控制等實現(xiàn)多細胞間的同步,但這些結(jié)論均需要一個共同的條件,即充分的細胞間通信。
模式形成也是單細胞和多細胞生物中協(xié)調(diào)細胞行為的標(biāo)志,例如Basu等學(xué)者[57]通過構(gòu)建合成的多細胞系統(tǒng)對空間模式形成的研究。在該系統(tǒng)中,“受體”細胞為基于由“發(fā)送”細胞合成的?;呓z氨酸內(nèi)酯(AHL)信號的化學(xué)梯度形成環(huán)狀分化模式。在受體細胞中,“波段檢測”基因網(wǎng)絡(luò)對AHL濃度范圍做出反應(yīng)。通過融合不同熒光蛋白作為輸出,他們得到了不同的空間模式,如橢圓和丁香等。這種合成的多細胞系統(tǒng)的構(gòu)建和研究可以用于組織工程、生物材料制造和生物傳感的應(yīng)用等多方面。
本文回顧與展望了從生物分子網(wǎng)絡(luò)動力學(xué)的角度,深入闡述各種具有特定功能的合成生物網(wǎng)絡(luò)背后的理論基礎(chǔ)與分析方法,其中包括:生物功能器件(如開關(guān)與振子);從數(shù)學(xué)與網(wǎng)絡(luò)理論相關(guān)的因素(包括正負反饋回路與動力學(xué)的相關(guān)性、非線性因素與時間延遲產(chǎn)生的原因、穩(wěn)定性與分支相關(guān)理論、周期振子的魯棒性、周期可調(diào)性等動力學(xué)相關(guān)的理論基礎(chǔ)與分析方法),為進一步設(shè)計更為復(fù)雜或者更易實驗合成的生物器件提供可以借鑒的理論分析方法。
事實上,除了文中提到的開關(guān)與振子的動力學(xué)與網(wǎng)絡(luò)結(jié)構(gòu)有著密切的關(guān)系,還有一些其他簡單的模塊被廣泛研究,即網(wǎng)絡(luò)motif,它可以被認(rèn)為是網(wǎng)絡(luò)中頻繁出現(xiàn)的子圖模式,是復(fù)雜網(wǎng)絡(luò)的“構(gòu)建塊”[58]。 這些頻繁出現(xiàn)的motif很顯然在信息處理過程中會發(fā)揮重要的功能,例如負的自調(diào)控可以加快反應(yīng)并減少波動,而正的自調(diào)控可以減緩反應(yīng)并增加細胞與細胞間的差異。當(dāng)然,其他不同的motif展現(xiàn)了不同的動力學(xué)行為,詳見文獻[59]。另外,北京大學(xué)理論生物學(xué)中心湯超教授課題組和加州大學(xué)舊金山分校Lim教授課題組合作[60],通過在理論上窮舉所有可能的三個結(jié)點的調(diào)控網(wǎng)絡(luò),發(fā)現(xiàn)具有適應(yīng)性的網(wǎng)絡(luò)都可以被分為兩大類:包含兩條符號相反的從輸入到輸出的信號通路(不一致前饋回路);或者不包含前饋回路,卻包含至少一個負反饋回路[60]。
除了上述提到的關(guān)于簡單模塊分析的相關(guān)理論或計算研究,還有很多。這些簡單網(wǎng)絡(luò)的動力學(xué)性質(zhì)為進一步研究更為復(fù)雜的合成生物學(xué)的設(shè)計與分析提供了良好的理論基礎(chǔ)。無論在合成還是自然存在許多較為復(fù)雜的網(wǎng)絡(luò)中,網(wǎng)絡(luò)分解的思想經(jīng)常被采用,通過分析各個子網(wǎng)絡(luò)的性質(zhì),并最終讓它們成功匹配,可以大大簡化分析的難度。例如前文提到的push-on push-off 開關(guān),就是通過兩個模塊的耦合來實現(xiàn)[14]。類似地,DNA在受到輻射損傷時,p53通過兩個簡單的開關(guān)模型與一個振蕩模型實現(xiàn)其命運選擇[61]。
隨著科技的進步,越來越多的新策略被提出。在合成生物學(xué)的第一波浪潮中,基因元件間的調(diào)控回路實現(xiàn)了簡單的功能,并被用來控制單個細胞的功能。在第二波合成生物學(xué)研究浪潮中,簡單的模塊被整合成復(fù)雜的電路,形成系統(tǒng)級功能,從而使得理論分析的難度加大,因此,提出了一些策略如組合優(yōu)化等[62]。其他方法如人工智能方法也逐漸被提出來[63]。和已有的方法一起,這些新的方法將大大推動合成生物學(xué)的發(fā)展,為進一步設(shè)計更復(fù)雜的合成基因網(wǎng)絡(luò)以及實現(xiàn)不同的應(yīng)用場景(例如在個體或者群體水平上設(shè)計或合成混沌振子)[28,64]發(fā)揮重要作用。