顏錢明 張鵬程 喬 榕 古 槿 汪小我
1948 年,Wiener 在其著作《控制論:關(guān)于在動物和機器中控制和通訊的科學(xué)》中首次提出了“控制論”的概念,闡述了自然科學(xué)以及社會科學(xué)等各個領(lǐng)域的控制思想,強調(diào)了對生命與機器統(tǒng)一的控制規(guī)律,奠定了“控制論”的基礎(chǔ).同時,它提出了兩大類控制對象,即無生命的機器和有生命的動物[1].大半個世紀(jì)以來,機器控制領(lǐng)域不斷有著突破性的進展,已經(jīng)逐漸形成一套較為完備且先進的控制理論,并廣泛應(yīng)用于各種工程項目中.而生命作為一個完整的系統(tǒng),大至生態(tài)系統(tǒng)的平衡,小至單個細胞內(nèi)的穩(wěn)態(tài)建立,處處體現(xiàn)著控制論的思想,與機器控制有許多共通之處.因此,理論上來說,通過選擇與設(shè)計適當(dāng)?shù)姆椒?,人們同樣可以控制生命的基本組成單位 — 細胞.
然而,長期以來,由于生物系統(tǒng)的強復(fù)雜性以及基因表達的高隨機性等諸多原因[2-3],細胞控制研究進展緩慢.隨著合成生物學(xué)與系統(tǒng)生物學(xué)的不斷發(fā)展以及相關(guān)技術(shù)的逐漸成熟,人們對細胞內(nèi)的生命過程以及細胞間相互作用機制的理解日益深入,并開始利用合成基因線路對細胞內(nèi)基因表達及其他生命活動進行控制,構(gòu)成人工生物系統(tǒng).在合成生物學(xué)領(lǐng)域,抑制子振蕩器[4]與雙穩(wěn)態(tài)開關(guān)模型[5]是兩個經(jīng)典的人工合成基因線路.抑制子振蕩器通過三個互相抑制的基因線路 (tetR,λcI,lacI)構(gòu)成基因網(wǎng)絡(luò),當(dāng)給予一定初始濃度的誘導(dǎo)物時,三個基因的表達會呈現(xiàn)出振蕩特性(圖1(a)).而雙穩(wěn)態(tài)開關(guān)模型則是通過兩個互相抑制的基因線路 (lacI,tetR)以及能夠分別抑制兩種基因表達產(chǎn)物的化學(xué)誘導(dǎo)劑來實現(xiàn)類似開關(guān)的雙穩(wěn)態(tài)特性(圖1(b)).它們都是以互相抑制的基因線路構(gòu)成負反饋來實現(xiàn)對基因表達特性的調(diào)控.實際上,反饋機制大量存在于細胞內(nèi)源的基因網(wǎng)絡(luò)中,目前也已經(jīng)有許多工作通過向細胞中引入人工反饋環(huán)的方式實現(xiàn)對基因表達量、表達噪聲以及表達穩(wěn)定性的調(diào)控[6-14].
雖然通過合成基因線路,人們能夠?qū)毎纳顒舆M行調(diào)控,但是傳統(tǒng)的基因線路存在著以下局限性:1)設(shè)計符合要求的基因線路十分困難,需要考慮元件功能、元件正交性、穩(wěn)定性等諸多因素.2)基因線路的規(guī)模受到細胞環(huán)境和細胞內(nèi)資源的限制,因而難以實現(xiàn)復(fù)雜的生物功能.3)基因線路的調(diào)控是“一次性”的.一旦合成基因線路導(dǎo)入質(zhì)粒并轉(zhuǎn)化到細胞中,其調(diào)控模式就不可更改.如果調(diào)控結(jié)果無法達到預(yù)期,研究者需要修改甚至重新設(shè)計基因線路,材料消耗大,時間周期長,可調(diào)節(jié)性弱[15-16].相較于此,科學(xué)家們更期望設(shè)計一種簡便、高效的細胞控制模式,通過細胞的實時響應(yīng),研究其內(nèi)部線路的動態(tài)特性.
圖1 利用人工合成基因線路控制細胞的基因表達Fig.1 Control gene expression using artificial synthetic gene circuits
近年來,控制遺傳學(xué)(Cybergenetics)概念的提出使科學(xué)家們開始關(guān)注和探索一種全新的基于細胞—計算機交互(以下簡稱胞機交互)的體外細胞控制模式[16-17].它類比自動控制領(lǐng)域中由控制器、執(zhí)行器、被控對象、測量變送器構(gòu)成的系統(tǒng)結(jié)構(gòu):以計算機為控制器,通過運行相應(yīng)的控制算法,不斷對測量變送器的反饋信號進行處理并施加相應(yīng)的控制信號;以光源、加藥泵等能直接控制細胞內(nèi)基因線路的工具為執(zhí)行器,將來自控制器的控制信號轉(zhuǎn)換為相應(yīng)的形式;以細胞內(nèi)的基因線路為被控對象,接受來自執(zhí)行器的輸入并將自身的響應(yīng)由測量變送器返回給控制器;以顯微鏡、相機等作為測量變送器,將輸出信號轉(zhuǎn)換為能被控制器識別的熒光圖像、細胞影像等形式(圖2).由于計算機程序運算準(zhǔn)確、響應(yīng)快速、易于修改,胞機交互系統(tǒng)能夠?qū)崟r觀測細胞表達量,并通過程序計算得到當(dāng)前時刻所需的控制輸入量,實現(xiàn)在線細胞控制.并且,相比于要在細胞內(nèi)部完成復(fù)雜計算、控制功能的基因線路,通過計算機來完成控制運算可以顯著減小基因線路規(guī)模和設(shè)計實現(xiàn)難度.
在計算機與細胞的連接過程中,執(zhí)行器的控制信號與測量變送器的反饋信號對細胞狀態(tài)進行著實時控制與監(jiān)測,起到關(guān)鍵的接口作用.控制信號不僅應(yīng)當(dāng)在維持細胞內(nèi)部其他生理功能正常運轉(zhuǎn)的前提下,激發(fā)細胞內(nèi)部基因線路的表達,還需要能夠被計算機精準(zhǔn)地調(diào)節(jié),根據(jù)當(dāng)前的細胞狀態(tài)快速改變?nèi)≈?而反饋信號則應(yīng)當(dāng)真實反映細胞的狀態(tài)變化,并將其轉(zhuǎn)換為計算機能夠準(zhǔn)確識別和處理的形式.目前常用作細胞控制信號的有化學(xué)誘導(dǎo)因子[18-24],環(huán)境因素如滲透壓[25]、溫度[26]等,特別地,隨著近幾年各種光遺傳學(xué)工具的發(fā)現(xiàn),使用不同波長的光照控制細胞活動成為了一大焦點,許多合成生物學(xué)家開始利用光作為控制信號[27-35].相比于化學(xué)藥物以及環(huán)境因素,光照對細胞的損傷更小,可控性更強,操作也更簡便.對于反饋信號,由于計算機圖像處理技術(shù)的成熟,目前的方法通常是由計算機對顯微鏡下細胞的熒光圖像或影像進行分析,得到細胞形態(tài)、位置、熒光強度等一系列參數(shù)信息,用于控制信號的計算[32,36].
圖2 胞機交互系統(tǒng)示意圖Fig.2 A scheme for cell-computer interface
本文著眼于近年來胞機交互控制模式在細胞控制領(lǐng)域取得的研究進展,對已有的相關(guān)工作進行總體概述,介紹其中所用的細胞狀態(tài)的監(jiān)測與控制手段以及相關(guān)控制算法,重點闡述生物系統(tǒng)的復(fù)雜性以及控制算法在細胞中實現(xiàn)的特殊性與挑戰(zhàn),展望細胞控制未來的發(fā)展方向,特別是國內(nèi)在此領(lǐng)域的研究現(xiàn)狀與前景.
在胞機交互系統(tǒng)中,細胞的培養(yǎng)、狀態(tài)的讀寫是進行細胞控制的前提,它們在保證細胞活性的前提下,構(gòu)成了細胞與計算機耦合的接口.活細胞與計算機的耦合依賴于對細胞狀態(tài)的實時監(jiān)測與控制,即細胞狀態(tài)參數(shù)的讀取和控制信號的寫入.以合成生物學(xué)技術(shù)為主要技術(shù)的人工基因線路為我們實現(xiàn)這種細胞—計算機之間的耦合接口創(chuàng)造了條件.目前,合成生物學(xué)技術(shù)的快速發(fā)展,使得我們可以合成任意排列的DNA 序列,從而按照功能需求來設(shè)計和構(gòu)建人工的基因線路.將這種特定功能的基因線路植入細胞,充當(dāng)細胞內(nèi)的生物傳感器[37-38],研究者就可以通過其檢測活細胞內(nèi)的代謝物、RNA、蛋白等生物分子狀態(tài)的變化,并將其轉(zhuǎn)換為熒光亮度等易于被硅基系統(tǒng)監(jiān)測的輸出信號[39-41].同樣,利用人工基因線路編碼特定蛋白來接受人為控制的化學(xué)藥物、滲透壓、光照等控制信號,并將信號接入到細胞內(nèi)源的調(diào)控網(wǎng)絡(luò),就可以將細胞納入控制系統(tǒng)的閉環(huán).本部分將從細胞控制的需求出發(fā),簡要地介紹細胞培養(yǎng)與實現(xiàn)細胞與計算機兩方面耦合接口所依賴的相關(guān)技術(shù)、培養(yǎng)平臺以及常用的控制信號.
要實現(xiàn)對細胞實時施加合適的控制信號,選擇能夠直觀反映當(dāng)前時刻細胞狀態(tài)的輸出變量是必不可少的.熒光成像、細胞影像等常用狀態(tài)反映手段都是將不可測的細胞狀態(tài)轉(zhuǎn)化為易于觀察分析的變量.通過合成生物學(xué)技術(shù)在細胞內(nèi)嵌入標(biāo)記信號,利用熒光成像技術(shù),如熒光蛋白、mRNA 探針、免疫雜交反應(yīng)等,可以快速測量活細胞內(nèi)的生物分子信號,從而直觀地反映基因表達水平;而通過一系列圖像處理技術(shù),細胞影像也能提供豐富的狀態(tài)信息,包括細胞形態(tài)、位置以及其他與研究問題相關(guān)的動力學(xué)參數(shù).除此以外,細胞的外泌物如細胞因子、代謝物質(zhì)、外泌體等也有潛力用于細胞狀態(tài)的監(jiān)測.
細胞影像的處理過程一般包括細胞分割與細胞追蹤兩個階段,針對影像的每一幀,我們首先將細胞識別并分割出來,分割的方式既可采用數(shù)字圖像處理的方法,如閾值法、分水嶺算法等,也可以采用如文獻[42-43]的神經(jīng)網(wǎng)絡(luò)方法.在分割出每一幀的細胞之后,我們需要將同一個細胞在不同幀的位置聯(lián)系起來,即細胞追蹤.細胞追蹤的方法大致可分為基于運動模型的方法[44]和基于深度學(xué)習(xí)網(wǎng)絡(luò)的方法[45]:基于運動模型的方法要求對細胞的外形、移動、交互、碰撞、遮擋等活動進行建模,然后采用卡爾曼濾波等方法根據(jù)歷史幀信息對當(dāng)前幀細胞位置進行預(yù)測,通過比較預(yù)測結(jié)果與當(dāng)前幀細胞位置的相似程度,確定兩個細胞是否應(yīng)被視為同一目標(biāo).而基于深度學(xué)習(xí)網(wǎng)絡(luò)的方法則要求提取細胞的外形、位置等多維特征,依據(jù)提取的特征對不同幀細胞之間進行匹配.細胞追蹤完成后,我們就可以從圖像中讀出各個細胞當(dāng)前的具體狀態(tài),從而根據(jù)控制算法改變控制信號的輸入.
而在實際操作中,由于活細胞體積微小、數(shù)量眾多且活動范圍較大,想要在顯微鏡下跟蹤細胞狀態(tài)、直接運行圖像處理算法獲得狀態(tài)參數(shù)、對每個細胞都施加精準(zhǔn)的控制信號是十分困難的.并且,長時間控制細胞需要維持細胞的活性,為細胞提供合適的生長環(huán)境與充足的營養(yǎng)物質(zhì).因此,胞機交互的培養(yǎng)平臺需要能夠維持細胞的長期生存;適當(dāng)限制細胞的活動范圍,以便于跟蹤每個細胞的位置;在單細胞水平上進行狀態(tài)參數(shù)的讀取以及控制信號的精準(zhǔn)寫入等.在目前的細胞培養(yǎng)技術(shù)中,微流控是能夠滿足上述條件的一種培養(yǎng)系統(tǒng)[46-54].
微流控采用微管道技術(shù),以精確、自動化的控制進行微小體積液體的操作,能夠同時并行多個實驗,并最大限度地減少手工操作帶來的誤差,在單細胞水平上精確地控制細胞.同時,通過將細胞限制在長窄通道[47]或是小培養(yǎng)室[51]內(nèi),微流控能最大程度地及時排出增殖的細胞,避免細胞擁擠,限制細胞的活動范圍,使細胞位置易于追蹤,簡化控制信號與被控細胞間的校準(zhǔn)問題.結(jié)合顯微鏡成像技術(shù),研究者們能夠在單細胞水平上得到微流控平臺中細胞的實時影像,進而通過圖像處理技術(shù),快速計算讀取細胞反饋回的狀態(tài)參數(shù),極大地便利了胞機交互的實施.
隨著合成生物學(xué)的發(fā)展,人工生物系統(tǒng)能夠感知的信號類型越來越豐富,人們對細胞的控制手段也越來越多樣化.從傳統(tǒng)生物學(xué)采用的溫度、營養(yǎng)和化學(xué)試劑等控制手段[26,55-56],到當(dāng)前合成生物學(xué)中采用的化學(xué)小分子信號,磁信號[57-60],電信號[61-62]和光信號[63-66]等,通過計算機對相關(guān)執(zhí)行器的控制,并以細胞中導(dǎo)入的人工合成基因線路作為媒介,對細胞內(nèi)的分子狀態(tài)和基因表達狀態(tài)進行控制,人們控制細胞的手段逐漸擴展并相互融合.
采用化學(xué)信號控制的分子開關(guān)在整個合成生物學(xué)的發(fā)展過程中起著核心作用[38],但隨著合成生物學(xué)的發(fā)展,人們也逐漸意識到化學(xué)信號的固有缺陷,誘導(dǎo)劑的難以去除,誘導(dǎo)劑的毒害性,擴散效應(yīng)的滯后性等問題逐漸顯現(xiàn)出來.同時,隨著對生物系統(tǒng)的進一步認識,研究者們發(fā)現(xiàn),通過相關(guān)基因線路的設(shè)計,將細胞改造為能夠接收光、電、磁等控制信號的細胞,同樣能實現(xiàn)對細胞的調(diào)控.其中由于光學(xué)信號具備時間和空間上的高分辨率和可逆性,光遺傳學(xué)在近十幾年內(nèi)發(fā)展迅速,研究者們已經(jīng)在細菌[67]、酵母[68]和哺乳動物細胞[69]內(nèi)設(shè)計出了可用的光遺傳學(xué)工具,極大地拓寬了人們控制細胞的手段.
隨著光遺傳學(xué)的逐漸發(fā)展,各類光敏元件逐漸被發(fā)現(xiàn)或人工構(gòu)建,在細菌和真核生物中的光傳感器均已能夠感知紫外光、藍光、綠光和紅光等不同波長的光信號[70].光傳感器接收特定波長的光信號后會發(fā)生蛋白結(jié)構(gòu)的變化,例如蛋白封閉、二聚反應(yīng)、齊聚反應(yīng)和解聚反應(yīng)等[71].
光遺傳學(xué)系統(tǒng)通??梢愿鶕?jù)光傳感器的參與組分分為兩類,第一類為單組分系統(tǒng)(One-component system),光傳感器游離在細胞質(zhì)中,接受光信號后發(fā)生結(jié)構(gòu)變化進而調(diào)控基因表達.另一類為雙組分系統(tǒng)(Two-component system),需要細胞膜上光傳感器蛋白接受光信號后,通過磷酸化途徑和輔因子傳遞給細胞質(zhì)蛋白再進行基因的表達調(diào)控.
1)單組分系統(tǒng):單組分系統(tǒng)中光傳感器能夠在接受特定光信號后,直接使蛋白結(jié)構(gòu)發(fā)生一定的變化,導(dǎo)致蛋白活性產(chǎn)生影響,而不需要輔因子的參與.其主要為包含LOV 結(jié)構(gòu)域(Light-oxygen-voltagesensing domain)類型的光敏元件(圖3(a)).例如,利用EL222 蛋白設(shè)計的光敏啟動子,能夠在藍光照射下形成二聚體蛋白,結(jié)合特定DNA 序列進行基因表達調(diào)控[72].
2)雙組分系統(tǒng):雙組分的光響應(yīng)系統(tǒng)在接受光信號后,需要特定的輔因子進行活性調(diào)節(jié),將信號通過磷酸化作用進一步轉(zhuǎn)遞,直到終末蛋白對特定的啟動子進行調(diào)控(圖3(b)).例如紫外光響應(yīng)系統(tǒng)UirS/UirR[73],藍光響應(yīng)系統(tǒng)YF1/FixJ[74],綠光響應(yīng)系統(tǒng)CcaS/CcaR[75],紅光響應(yīng)系統(tǒng)Cph8/OmpR[67]均為雙組分系統(tǒng),需要一定的輔因子參與級聯(lián)反應(yīng).
近年來光遺傳學(xué)的迅速發(fā)展為人們進行細胞控制提供了一種更有效和準(zhǔn)確的途徑.例如在圖3(c)中,我們參照文獻[76]中構(gòu)建的光控基因表達系統(tǒng),將感光基因線路導(dǎo)入細胞,通過投影儀照射,使處在特定位置的細菌表達色素基因,與相應(yīng)的底物反應(yīng),從而顯示出所照射的圖像,展現(xiàn)了利用光照作為控制信號的有效性與精準(zhǔn)性.光的高分辨率和高度可控性,為保證細胞控制輸入信號的穩(wěn)定性提供了堅實的基礎(chǔ).但目前光遺傳學(xué)元件尚處于發(fā)展階段,一些問題仍需解決,例如,光控基因表達本底較高、光敏元件交叉反應(yīng)[77]等.
在控制領(lǐng)域中,控制方式可根據(jù)是否存在反饋分為閉環(huán)控制與開環(huán)控制,這對于細胞的控制同樣適用.開環(huán)控制需要選擇合適的輸入量與輸出量,通過實驗觀測和系統(tǒng)辨識的方法對所研究的生物系統(tǒng)進行準(zhǔn)確的建模,然后根據(jù)模型和輸出期望值計算得到所需輸入,一次性施加到生物系統(tǒng)當(dāng)中.2014 年,萊斯大學(xué)的Olson 等[34]在大腸桿菌細胞中建立了一套精確的數(shù)學(xué)模型,以多種波長的光照序列開環(huán)調(diào)控大腸桿菌基因表達量隨時間的變化,得到了可以產(chǎn)生自定義波形的生物信號發(fā)生器.2017 年,該團隊進一步增強了模型的定量預(yù)測能力,優(yōu)化了模型參數(shù)的校準(zhǔn)過程,使多路光遺傳學(xué)系統(tǒng)能夠同時對細胞的基因表達進行穩(wěn)定控制[35].
然而,在生物系統(tǒng)中,各項生命活動的影響因素很多,如果將所有影響因素都納入考慮,會使模型變得極為復(fù)雜甚至不可解,因此,對所有系統(tǒng)都進行精確地建模是十分困難的.一般在建模時,我們僅可能考慮理想情況下存在的主要生命活動和反應(yīng),這實際上是對真實網(wǎng)絡(luò)的簡化,只能在一定程度上體現(xiàn)基因網(wǎng)絡(luò)的動態(tài)特性.并且,模型參數(shù)的精確性依賴于特定的培養(yǎng)環(huán)境,當(dāng)環(huán)境出現(xiàn)變化和擾動時,預(yù)測精度就會下降,所以開環(huán)系統(tǒng)一般不適用于對細胞的長期控制[27].閉環(huán)系統(tǒng)則不同,它根據(jù)當(dāng)前的實際輸出與期望輸出的誤差來實時改變控制量輸入,從而對意外的擾動和噪聲有更強的抑制或補償作用,相較開環(huán)控制能更好地減小誤差,降低對模型精度的要求,增強穩(wěn)定性.因此,目前大多數(shù)細胞控制工作所采用的控制方式都是反饋控制[16].本節(jié)重點針對反饋控制算法在細胞控制系統(tǒng)中的應(yīng)用進行綜述,比較各控制算法在細胞控制問題上的性能優(yōu)劣,歸納和總結(jié)細胞控制與機器控制的不同點和難點.
圖3 利用光遺傳學(xué)工具控制細胞的基因表達Fig.3 Control gene expression using optogenetic tools
在胞機交互的控制體系下,控制算法由計算機程序?qū)崿F(xiàn),并通過藥物濃度、光照強度、波長等控制信號與細胞連接,研究者可以根據(jù)具體情況選擇、設(shè)計和運用各種合適的控制算法.在控制領(lǐng)域中,使用最廣泛的控制方法當(dāng)屬比例—積分—微分控制(Proportional-Integral-Derivative control,PID),它通過實際輸出與期望輸出之間誤差的比例、積分、微分項來對系統(tǒng)進行調(diào)控.2011 年,PI 控制算法首次被用于調(diào)控蛋白質(zhì)的定位過程,通過引入Phy-PIF 光遺傳學(xué)系統(tǒng),并構(gòu)造帶有光敏素互作因子(Phytochrome-interacting factor,PIF)標(biāo)記的融合蛋白,細胞膜就能夠隨不同的發(fā)光二極管 (Light emitting diode,LED)照射改變招募蛋白的強度,而計算機又反過來通過招募蛋白的程度調(diào)整LED光源,從而使膜蛋白招募的動態(tài)特性完美符合人們的預(yù)期響應(yīng)[28].目前已有越來越多的工作采用PI 控制算法來控制細胞內(nèi)基因表達特性[18-21,23,29]、細胞生長速度[27]等生命活動指標(biāo).
PID 控制的計算簡單,不依賴于模型,但在非線性長時延系統(tǒng)中效果較差[20].為了解決生物系統(tǒng)中的時延問題,模型預(yù)測控制(Model predictive control,MPC)是一種常用的、更精細化的反饋控制方法.模型預(yù)測控制利用控制對象的動態(tài)模型計算出未來一段時間內(nèi)系統(tǒng)的輸出值,進而根據(jù)預(yù)測的輸出施加相應(yīng)的控制輸入,補償了系統(tǒng)時延造成的影響.目前,模型預(yù)測控制也被廣泛地運用在生物信號發(fā)生器[16]、基因表達調(diào)控[24,30]以及細胞狀態(tài)(如細胞生長[27]、細胞周期[22]) 的控制等研究當(dāng)中.
除此以外,起停式控制方法(Bang-bang control)也可用于細胞控制.起停式控制是最簡單的反饋控制算法之一,其控制量根據(jù)實際輸出與設(shè)定閾值的大小關(guān)系分別取兩個不同的固定值,這種二值的控制輸入類似于電路中的開關(guān),因此起停式控制也被稱為開關(guān)控制.目前,研究者已成功利用起停式控制方法實現(xiàn)了細胞內(nèi)蛋白濃度的實時調(diào)節(jié)[33]、將細胞狀態(tài)穩(wěn)定在雙穩(wěn)態(tài)開關(guān)模型的非穩(wěn)態(tài)平衡點附近[19]等功能.另外,來自意大利的Fiore 等[20]和Guarino 等[23]還將電力系統(tǒng)控制中的零平均動態(tài)(Zero average dynamics,ZAD)控制方法運用到基因表達動態(tài)特性的控制當(dāng)中.ZAD 控制是一種數(shù)字控制方法,它利用脈寬調(diào)制技術(shù)(Pulse width modulation,PWM)調(diào)節(jié)輸出值,通過尋找合適的脈沖寬度,ZAD 使得每一個PWM 周期內(nèi)輸出值與參考值的誤差均值為0[78].表1 總結(jié)了上述各種控制算法的優(yōu)勢與不足.
2.1.1 胞機交互調(diào)控基因表達
在細胞內(nèi),基因表達過程具有高隨機性,受到多種環(huán)境因素如溫度、營養(yǎng)物質(zhì)、藥物誘導(dǎo)等的影響,在時間與空間上都存在較大的噪聲[2-3].噪聲的存在使得準(zhǔn)確預(yù)測基因表達量,探索基因調(diào)控網(wǎng)絡(luò)的內(nèi)部機制變得困難,而利用胞機交互的手段,研究者可以對所研究的基因加入實時可調(diào)的控制信號,對外界擾動及基因表達的內(nèi)源噪聲進行補償,控制基因表達量處于一個穩(wěn)定的水平.例如,加利福尼亞大學(xué)舊金山分校的Harrigan 等分別突變了酵母增殖信息素通路中與負反饋相關(guān)的三個信息素基因,利用基于光遺傳學(xué)工具和模型預(yù)測控制的體外控制方法,使得三種缺少內(nèi)源反饋通路的突變型細胞均能夠表現(xiàn)出與野生型相同的表觀特性[30].外部控制的引入補償了基因突變引起的擾動,降低了基因表達的噪聲,增強了其可預(yù)測性與穩(wěn)定性.
2.1.2 胞機交互控制細胞狀態(tài)
細胞狀態(tài)主要依賴于細胞內(nèi)基因表達的情況,因此,通過控制與各項生命活動相關(guān)的基因或其他信號分子,胞機交互就能夠控制細胞的大小、周期、生長速度等狀態(tài)參數(shù).2016 年,蘇黎世聯(lián)邦理工學(xué)院的Milias-Argeitis 等[27]通過將細胞內(nèi)控制甲硫氨酸生物化學(xué)合成的metE 基因改造成光控基因,以紅色和綠色的LED 光照作為控制信號,采用PI 控制算法得到了在不同光照下具有不同生長速度的突變型大腸桿菌.
此外,胞機交互還能夠在一定程度上影響細胞決策.細胞的生命過程包含了大量的決策,例如哪些基因表達、基因何時表達、表達出多少蛋白質(zhì)等,不同的決策會引導(dǎo)細胞走向完全不同的狀態(tài)[79].細胞決策的不同實際上反映了細胞所處穩(wěn)態(tài)平衡點的不同,因此,如果能控制多穩(wěn)態(tài)系統(tǒng)進入設(shè)定的穩(wěn)態(tài),就相當(dāng)于控制了細胞決策.雙穩(wěn)態(tài)開關(guān)模型是一個典型的雙穩(wěn)態(tài)系統(tǒng),它包含兩個穩(wěn)定平衡點和一個不穩(wěn)定平衡點[5],利用PI 和起停式控制方法控制雙穩(wěn)態(tài)開關(guān)模型中誘導(dǎo)劑無水四環(huán)素 (Anhydrotetracycline,aTc) 和異丙基-β-D-硫代半乳糖苷(Isopropylβ-D-1-thiogalactopyranoside,IPTG)的輸入量,細胞狀態(tài)可以被穩(wěn)定在雙穩(wěn)態(tài)開關(guān)模型的非穩(wěn)定平衡點附近[19],通過周期性地施加合適的aTc 和IPTG 信號,細胞會分別落入不同的穩(wěn)態(tài)平衡點,實現(xiàn)對細胞狀態(tài)決策的控制.
雖然通過將細胞看作與機器相互統(tǒng)一的系統(tǒng),目前已經(jīng)有部分研究者成功地采用經(jīng)典控制算法實現(xiàn)了對細胞的初步控制,但是,細胞作為生物體基本的結(jié)構(gòu)和功能單位,它是自然界經(jīng)過數(shù)十億年進化的產(chǎn)物,擁有比世界上任意一臺機器更精細的內(nèi)部結(jié)構(gòu)與機理,它本身存在許多尚未揭開的奧秘,加上細胞體積微小,只有在顯微鏡下才可見,細胞控制的控制量輸入與結(jié)果觀測都比機器控制更加復(fù)雜.另外,細胞的生命活動對環(huán)境與營養(yǎng)物質(zhì)有苛刻的要求,胞內(nèi)的各種酶需要在最適溫度和酸堿度條件下才能正常行使功能,否則,即使控制算法和系統(tǒng)模型設(shè)計無誤,我們也無法觀測到預(yù)期的現(xiàn)象.本節(jié)綜合說明實際操作時細胞控制與機器控制相比的特殊性與控制算法設(shè)計時需要注意的一些問題及其解決手段.
表1 細胞控制常用控制算法優(yōu)缺點比較Table 1 Pros and cons of several control algorithms in cell control
2.2.1 控制信號的限制
PID 等經(jīng)典控制算法在計算控制信號輸入時一般是沒有條件限制的,其結(jié)果取值范圍往往是整個實數(shù)域,但是在實際操作中,由于受到閥門、光源等執(zhí)行器的固有屬性限制,當(dāng)控制算法計算得到的控制量超過執(zhí)行器的調(diào)節(jié)范圍(閥門的最大開度,光源的最大亮度)時,執(zhí)行器不會對該控制量做出應(yīng)有的響應(yīng),此時的控制系統(tǒng)相當(dāng)于開環(huán)系統(tǒng),實際輸出與預(yù)期輸出的誤差隨時間積累會越來越大,最終造成系統(tǒng)產(chǎn)生超調(diào)或時延,這種現(xiàn)象稱為積分飽和,在機器控制領(lǐng)域普遍存在,而在細胞控制中尤為顯著.在進行雙穩(wěn)態(tài)開關(guān)模型的穩(wěn)定實驗時,研究者便有意忽略了前兩個小時的積分來避免這一現(xiàn)象[19].除此之外,還可以在反饋閉環(huán)中加入antiwindup 模塊[20,80],當(dāng)控制器正常工作時,anti-windup模塊不發(fā)揮作用;一旦執(zhí)行器的輸入與輸出信號不相同,anti-windup 模塊便會計算輸入輸出的誤差,并據(jù)此調(diào)節(jié)PID 控制器中積分項的大小,避免飽和帶來的超調(diào)和時延[80].
社會保險費征管職責(zé)劃轉(zhuǎn)稅務(wù)部門后,由稅務(wù)部門征收的險種有:基本養(yǎng)老保險費(含城鎮(zhèn)職工基本養(yǎng)老保險、城鄉(xiāng)居民基本養(yǎng)老保險、機關(guān)事業(yè)單位養(yǎng)老保險)、基本醫(yī)療保險費(含城鎮(zhèn)職工基本醫(yī)療保險、城鄉(xiāng)居民基本醫(yī)療保險、新型農(nóng)村合作醫(yī)療保險)、失業(yè)保險、工傷保險和生育保險等各項社會保險費。為了順利完成社會保險費征管職責(zé)劃轉(zhuǎn)工作,本文從廣西社會保險費征繳現(xiàn)狀入手,分析稅務(wù)部門承接征收的困難和問題,對承接征收社會保險費提出對策建議。
控制信號可能受到的另一種限制是執(zhí)行器不能按照控制算法得到的結(jié)果向被控對象傳輸精確而連續(xù)的控制信號,例如閥門只能打開一個大致的開度、執(zhí)行器只能進行離散的檔位調(diào)節(jié)等.在細胞控制領(lǐng)域,控制信號的細微差異,可能會對細胞的整個狀態(tài)帶來巨大的變化,甚至?xí)?dǎo)致細胞死亡.為解決此問題,研究者們想到利用電力電子技術(shù)中的脈寬調(diào)制技術(shù)(PWM),在控制器后加入PWM調(diào)制模塊,將數(shù)字信號等效轉(zhuǎn)化為所需的模擬信號[18],使執(zhí)行器的離散信號表現(xiàn)出等價于連續(xù)信號的控制效果.對于能夠連續(xù)取值的控制工具例如LED、激光等光源,則可以有效避免此問題.
2.2.2 細胞固有屬性的限制
細胞與機器最明顯的區(qū)別在于細胞是一個生命體,會進行運動、生長、增殖等生命活動,且自身體積微小,需在顯微鏡下方可觀察,而控制工具的分辨率很難達到單細胞水平,因此實驗中往往只能控制細胞的群體特性,難以捕獲單細胞的動態(tài).即使利用某種精密的控制手段實現(xiàn)了單細胞的控制,由于細胞間的基因表達差異,每個細胞所需的控制信號輸入也是不同的,加上細胞會不斷運動和增殖,如何完成控制信號和被控細胞間的校準(zhǔn)、如何處理分裂后的細胞、如何對細胞信號進行測量都是需要解決的問題.這就要求有專門的實驗平臺來精確地控制每一個細胞與讀取細胞狀態(tài).
早期的胞機交互控制多是針對細胞群體水平上基因表達量的控制,但近年來,越來越多的科學(xué)家開始嘗試利用微流控系統(tǒng)和高分辨率的投影儀進行單細胞水平的反饋控制.第1 節(jié)中提到,微流控系統(tǒng)能夠最大程度地限制細胞的活動范圍,解決了細胞運動與分裂的問題,使細胞易于追蹤.而在單細胞水平上對細胞施加控制信號則可以由數(shù)字微鏡(Digital micromirror device,DMD)投影儀實現(xiàn).DMD 投影儀的核心由微型反射鏡陣列構(gòu)成,通過獨立開閉每個反射鏡,DMD 投影儀能夠改變單像素的光信號強度,實現(xiàn)單細胞水平上的高通量控制[81].例如,2018 年,來自蘇黎世聯(lián)邦理工學(xué)院的Rullan 等[36]利用胞機交互的控制方式,以DMD 投影儀為控制信號源,微流控系統(tǒng)為培養(yǎng)平臺,實現(xiàn)了對釀酒酵母mRNA 水平上的單細胞基因表達控制.
2.2.3 基因表達特性的限制
在細胞內(nèi),基因表達包括轉(zhuǎn)錄、翻譯等多步過程,細胞對信號產(chǎn)生響應(yīng)需要一定的時間,所以控制信號寫入到系統(tǒng)響應(yīng)和觀測之間存在較大的時滯.其次,細胞基因表達調(diào)控的傳遞函數(shù)近似滿足希爾方程的形式,是高度非線性的.因此,基因表達過程是一個典型的非線性時延系統(tǒng)[82].前文提到PID 控制更適用于無時延和無劇烈波動的系統(tǒng),因此在進行跟蹤控制時,PID 控制方法往往難以取得理想的效果,而MPC 等依賴模型的算法則能夠根據(jù)模型預(yù)測補償基因表達的時滯,有效避免這一問題.另一方面,生物系統(tǒng)具有較強的隨機性.生物系統(tǒng)中,參與反應(yīng)的分子數(shù)量很少,大約只有幾十個,根據(jù)薛定諤在《生命是什么》一書中提出的律:一個具有n個分子的反應(yīng)系統(tǒng)的變異系數(shù)約為
[83],基因表達反應(yīng)過程中隨機漲落引起的內(nèi)蘊隨機性是很明顯的.此外,上游調(diào)控蛋白的隨機性與環(huán)境因素的波動也會引入外部噪聲[84],使生物系統(tǒng)模型復(fù)雜化.雖然微分方程與隨機模型能夠定量、隨機地描述生物系統(tǒng),但隨著網(wǎng)絡(luò)規(guī)模的增大以及對含噪系統(tǒng)刻畫的深入,計算復(fù)雜性會大幅增加,識別未知參數(shù)的難度也會大幅提高[82].另外,基因網(wǎng)絡(luò)中普遍存在著分子多靶點競爭現(xiàn)象,調(diào)控模塊之間高度耦合,造成了網(wǎng)絡(luò)內(nèi)復(fù)雜的隱藏調(diào)控機制[85-86].這些因素使得建立精確的數(shù)學(xué)模型十分困難,以致依賴于模型的MPC、ZAD 等控制算法在模型精確度不高的情況下也難以發(fā)揮優(yōu)勢.
總而言之,在基因表達特性的限制下,PID 控制不依賴于精確的數(shù)學(xué)模型,相比依賴于模型的控制方法具有更好的可遷移性,但無法處理基因表達過程中的時延和噪聲;MPC、ZAD 等控制方法雖然能夠解決時延問題,但數(shù)學(xué)模型的建立需要耗費大量的時間,且數(shù)學(xué)模型不可通用,在不同的控制問題下需要建立不同的模型.在實際研究中,研究者需要根據(jù)基因的表達特性選擇合適的控制算法.
生物控制與機器控制是控制領(lǐng)域的兩個重要分支,雖然在控制對象上,生物與機器存在著很大差異,但是在控制規(guī)律上,兩者構(gòu)成了統(tǒng)一的整體.近年來,隨著控制遺傳學(xué)(Cybergenetics)概念的提出以及相關(guān)工具和平臺的完善,胞機交互引起了生物學(xué)家與控制學(xué)家們的廣泛關(guān)注,這種新興的控制手段根據(jù)細胞狀態(tài)實時調(diào)整控制信號,在線優(yōu)化細胞的動態(tài)特性,相比利用合成基因線路的胞內(nèi)控制更加便捷有效.
在細胞狀態(tài)的監(jiān)測與控制方面,相關(guān)生物學(xué)工具與平臺的發(fā)展為細胞控制提供了精準(zhǔn)的控制手段.圖像處理算法與深度學(xué)習(xí)的發(fā)展使得計算機能夠準(zhǔn)確追蹤每一個細胞,從細胞影像中提取所需的細胞信號;而光遺傳技術(shù)的發(fā)展則使得研究者可以通過光照對細胞施加控制信號,相較化學(xué)藥物誘導(dǎo)等控制手段,光照具有低傷害、高度可控、迅速可逆等優(yōu)勢.高分辨率投影儀如DMD 則可以通過控制每個像素點的光信號強度,配合微流控系統(tǒng),將光控制信號精確到單個細胞,從而在單細胞水平上研究細胞的基因表達特性以及細胞間的異質(zhì)性[36,81].
在控制算法方面,盡管一些經(jīng)典控制算法如PID 控制、模型預(yù)測控制已經(jīng)在細胞的基因表達控制上取得了一定成果,但是目前的控制方法各自都有一定的局限性,如何設(shè)計一套更適合生物系統(tǒng)的控制算法,是胞機交互領(lǐng)域下一步應(yīng)當(dāng)考慮的問題.一種想法是綜合當(dāng)前各種控制算法的優(yōu)點,例如采用PID 控制作為整體框架,同時利用MPC 對系統(tǒng)狀態(tài)進行預(yù)測,解決PID 控制不適用于長時延系統(tǒng)以及準(zhǔn)確的數(shù)學(xué)模型難以建立的問題.此外,面對生物系統(tǒng)在各類干擾和參數(shù)下的不確定性,以及模型的建立困難和不完整等特點,模糊控制[87]、抗干擾控制[88]和深度強化學(xué)習(xí)[89]都是十分值得探索的方向.同時,應(yīng)充分考慮分子調(diào)控的自身特性,通過特定的網(wǎng)絡(luò)結(jié)構(gòu)和分子組成實現(xiàn)非常魯棒的控制[9,90-91].
另一方面,當(dāng)前受到廣泛關(guān)注的人工智能技術(shù)也為細胞控制方法提供了新的思路.最近,美國麻省理工學(xué)院的Bashivan 等[92]利用深度神經(jīng)網(wǎng)絡(luò)模型模擬目標(biāo)視覺系統(tǒng)的行為,并用該模型產(chǎn)生新的合成圖像,刺激獼猴的大腦,發(fā)現(xiàn)獼猴視覺皮層的相應(yīng)細胞產(chǎn)生了強烈反應(yīng),證明了利用人工神經(jīng)網(wǎng)絡(luò)模擬神經(jīng)細胞狀態(tài)的可行性.類似地,哈佛大學(xué)的Ponce 等[93]成功地利用生成對抗網(wǎng)絡(luò)(Generative adversarial network,GAN) 和遺傳算法生成了能夠激活猴腦中識別面部的特定神經(jīng)元的圖像,并根據(jù)神經(jīng)元信號的實時反饋不斷迭代優(yōu)化合成圖像,反映出神經(jīng)元興奮程度在網(wǎng)絡(luò)迭代優(yōu)化中不斷提高.這些工作啟發(fā)我們,胞機交互不僅可以實現(xiàn)將基因線路替換成計算機程序的細胞反饋控制,它還可以在細胞與計算機上建立起一套平行系統(tǒng),它們各自可以獨立地運行,但同時又相互對應(yīng):計算機的模擬結(jié)果可以反映細胞的真實狀態(tài),而細胞的狀態(tài)響應(yīng)又反過來進一步優(yōu)化計算機模型,實現(xiàn)并行優(yōu)化的目的.
目前,胞機交互的應(yīng)用更多地局限于對特定熒光蛋白表達量的控制上,真正能夠?qū)毎纳顒舆M行完全實時控制的工作仍然較少,國內(nèi)目前尚缺乏胞機交互相關(guān)工作發(fā)表.雖然如此,國內(nèi)的科學(xué)家們在光遺傳學(xué)與基因網(wǎng)絡(luò)分析等方面已經(jīng)有了一定的積累:在光遺傳學(xué)方面,華東師范大學(xué)的Ye等[94]和Shao 等[95]成功地利用光遺傳學(xué)元件通過LED 光照控制小鼠生成胰島素,同時將小鼠的血糖水平轉(zhuǎn)化為電信號控制LED 的亮度,實現(xiàn)了小鼠血糖的反饋調(diào)節(jié);華東理工大學(xué)的Wang 等[63]和Chen 等[96]也分別構(gòu)建了哺乳動物和細菌的光控基因表達系統(tǒng),能夠在光照條件下快速啟動或抑制下游基因的表達.而在基因網(wǎng)絡(luò)分析方面,中山大學(xué)的Liang 等[97]、Zhou 等[98]、Zhang 等[99]與中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院的Gu 和Lv 等[82,100]都在基因調(diào)控網(wǎng)絡(luò)的建模與控制、復(fù)雜網(wǎng)絡(luò)系統(tǒng)的動力學(xué)分析等方面有出色的工作,我們團隊也在基因網(wǎng)絡(luò)的競爭效應(yīng)、噪聲調(diào)控等研究方面有所積累[85-86].這表明,胞機交互在國內(nèi)有著深厚的基礎(chǔ)和巨大的發(fā)展?jié)摿?,只是還缺乏對不同領(lǐng)域研究成果的充分綜合.
雖然基于胞機交互實現(xiàn)的細胞控制尚處于概念驗證的嘗試階段,但正是這些嘗試性的細胞控制工作,為我們解決系統(tǒng)生物學(xué)問題、治療疑難疾病提供了全新的思路與手段,具有廣闊的發(fā)展前景.首先,通過胞機交互的方式,研究者能得到關(guān)于被控基因網(wǎng)絡(luò)的大量輸入—輸出數(shù)據(jù),有助于徹底揭示被控基因網(wǎng)絡(luò)內(nèi)部機制,建立更加精確的動力學(xué)模型.其次,現(xiàn)階段對相互獨立的細胞狀態(tài)的控制可以發(fā)展為對器官或組織中細胞狀態(tài)的控制,實現(xiàn)細胞的定向分化和器官的再生與修復(fù)等.以及通過胞機交互與光遺傳學(xué)的結(jié)合,人們可以更加穩(wěn)定高效地控制與疾病相關(guān)的離子通道[101],治療心腦血管疾病[102]、失明[103]、腫瘤[104]、神經(jīng)疾病[105]等疑難雜癥.
學(xué)科交叉是科學(xué)發(fā)展的必然趨勢,胞機交互作為計算機科學(xué)、控制科學(xué)、系統(tǒng)與合成生物學(xué)交叉的產(chǎn)物,將會極大地改變?nèi)祟悓τ谏锵到y(tǒng)的探索方式.細胞與計算機的結(jié)合可以為人類打開細胞與基因網(wǎng)絡(luò)的大門、深入理解細胞的內(nèi)部機制、實現(xiàn)細胞的在線智能控制提供新途徑,為重大疾病防治、生物制造、新一代農(nóng)業(yè)等做出貢獻,造福于人類的健康生活.