羅周卿,戴俊彪
?
合成基因組學:設計與合成的藝術
羅周卿,戴俊彪
清華大學合成與系統(tǒng)生物學中心生命科學學院,北京 100084
羅周卿, 戴俊彪. 合成基因組學:設計與合成的藝術. 生物工程學報, 2017, 33(3): 331–342.Luo ZQ, Dai JB.Synthetic genomics: the art of design and synthesis. Chin J Biotech, 2017, 33(3): 331–342.
隨著基因組相關技術 (測序、編輯、合成等) 和知識 (功能基因組學) 的日益成熟,合成基因組學在本世紀迎得了發(fā)展的契機。病毒、原核生物的全基因組相繼被化學合成并支持生命的存活,第1個真核生物合成基因組計劃已經(jīng)完成過半,人類基因組編寫計劃提上日程。在基因組合成的實踐過程中,研究者們不斷探索對基因組進行重編和設計所應遵循的規(guī)則,提高從頭合成、組裝和替換基因組的技術手段。合成基因組在工業(yè)、環(huán)境、健康和基礎研究領域有著廣闊的應用前景,同時也帶來了相應的倫理問題。結(jié)合在Sc2.0計劃中的基因組合成研究和近期合成基因組學所取得的重大進展,本文綜述了基因組設計和合成相關的科學、技術和倫理內(nèi)容,并探討了未來發(fā)展所面對的挑戰(zhàn)。作為合成生物學最重要的領域之一,合成基因組學方興未艾。
合成基因組學,基因組重新設計,DNA合成,DNA組裝與替換
“基因組”這一概念最早于1920年由H. Winkler提出,用來代表一個生物體所包含的整套遺傳物質(zhì)。近十年來由于二代和三代測序技術的發(fā)展使得測序的速度、精度和深度都有了巨大的提高,成本也發(fā)生了顯著的下降,越來越多物種的基因組被測序。TALEN以及CRISPR/Cas系統(tǒng)的成功應用極大地提高了對基因組特定位點的編輯能力,基因組的功能逐步被解析。隨著基因組閱讀能力 (測序) 和修改能力 (基因組編輯) 的提升,人類對基因組的認識達到了一個前所未有的高度。研究者們開始探索:我們能否根據(jù)已有的認知全方位改造一個基因組,甚至從頭設計與合成一個嶄新的基因組?DNA合成和組裝技術的發(fā)展,特別是基于芯片的 DNA 合成技術的成功應用,極大降低了DNA的合成成本并同時提高了通量,使得“編寫” (化學從頭合成) 一個基因組成為可能。合成基因組學作為一個匯集DNA閱讀、修改和編寫等各方面技術的新學科領域呈現(xiàn)在人們的面前。
本綜述將針對合成基因組學所取得的進展,介紹合成基因組學相關的設計理念與技術手段。與此同時,合成基因組學的后期應用以及倫理問題也將在本綜述中進行討論。
合成基因組學,指的是通過一系列的技術手段從頭化學全合成整個基因組或者是基因組的大部分。它的出現(xiàn)使得同時改變一個生物的遺傳物質(zhì)的多個方面成為可能,從而成為合成生物學領域中對生物體復雜功能體系和全新生物體進行合成的重要方面[1]。
為什么要合成一個基因組?除了對創(chuàng)造一個嶄新生命的原始好奇心,還包括了其他許多更加切合實際的目的。首先,盡管最近基因編輯領域的技術進展足以令人稱奇,但是仍然需要較長的時間來進行一項基因組水平的改變,比如說從大腸桿菌的基因組中去除一個密碼子[2-3]。而合成基因組學為這類問題提供了另外一種解決方案。并且,通過合成基因組學的相關研究還可以開發(fā)和完善相關的基因組編輯技術,從而實現(xiàn)良性循環(huán)。其次,通過對合成基因組的設計、合成和檢測,可以對一些之前無法或者很難很好地研究的問題提供答案。比如說,占據(jù)了人類基因組超過50%的重復序列到底有沒有功能?如果有,是什么?再次,我們對基因組的已有認知指導了我們現(xiàn)階段的合成基因組學實踐。反過來,通過合成基因組的過程和對合成的基因組的研究,將有助于進一步加深我們對基因組功能的理解 (Built to understand)。最后,在人類基因組計劃初期,人們對于是否值得花費如此多的人力、物力和財力去進行人類基因組測序有著廣泛的分歧[4]。而目前合成基因組學也處在這么一個類似的時期,我們并不清楚它最后具體能給我們帶來什么,但是至少目前的展望不亞于當年的人類基因組計劃。
從寡核苷酸鏈的化學合成開始,第一個人工合成的基因——丙氨酸t(yī)RNA編碼基因 (77 bp),于1970年被Khorana組成功合成[5]。2002年,第一個合成基因組——脊髓灰質(zhì)炎病毒 (Poliovirus) 基因組被成功合成并產(chǎn)生活的病毒顆粒[6],證明了利用已有的基因組序列而不依賴于天然模板從頭化學合成基因組的可行性。2008年,自然界中已知的最小原核生物基因組—— 583 kb的生殖支原體 () 基因組被化學全合成[7]。Gibson等在2010年成功利用人工合成的,長達1.08 Mb的蕈狀支原體 () 基因組支持JCVI- syn1.0的存活,誕生了第一個由合成基因組控制的原核生物[8]。從2011年開始,來自世界上多個不同國家的研究者們在Boeke的帶領下開展了第一個真核生物基因組合成計劃 (Sc2.0),目前已經(jīng)完成了2、3、5、6、10和12號染色體的合成與組裝[9-17]。就在Sc2.0進行的過程中,Boeke于2016年提出了人類基因組編寫計劃 (HGP-Write)[18],使合成基因組學成為大眾的焦點 (圖1)。
圖1 合成基因組學大事記
雖然現(xiàn)在我們可以很方便地進行基因組的測序和編輯,但是我們對基因組的認識還非常有限。以早期完成基因組測序的模式生物為例,中有大約20%的基因功能未知,釀酒酵母中有大約一半的基因功能未知[19-20]。根據(jù)對基因組的已有認知、對一些基因和代謝通路的合成嘗試,人們探索出了一些基因組重編和設計的規(guī)則。顯而易見,這些規(guī)則目前還缺乏系統(tǒng)性。因此,目前合成基因組學主要進行前期技術的儲備,對基因組重編的程度都比較小。2017年3月10日雜志發(fā)表了第1個專門為全基因組技術而編寫的軟件平臺——BioStudio,可以根據(jù)研究者的需要按照一定的原則進行全基因范圍的重編[13]。相信隨著對生命現(xiàn)象了解的深入以及邊合成邊測試能力的不斷提高,這些原則將被更好地定義和理解,使得合成基因組學朝著更加可預測的方向發(fā)展。
3.1 對基因組編碼區(qū)域的重編和設計
生物體中的蛋白質(zhì)主要通過基因組的編碼區(qū)域進行編碼。通過對基因編碼區(qū)域的重編和設計,可以改變蛋白的表達特性。編碼區(qū)域的重編和設計主要基于密碼子的簡并性進行,并根據(jù)實驗的目的綜合考慮不同的因素。這些因素包括密碼子的使用頻率 (Codon bias)[21]、密碼子上下游序列 (Codon context bias)[22]以及mRNA的二級和三級結(jié)構(gòu)等。首先,在不同的生物體中,同義密碼子的使用頻率通常并不相同。不同的密碼子頻率可以影響蛋白的翻譯速率,從而影響蛋白的表達。因此在合成基因的設計過程中通常會對其密碼子進行優(yōu)化,尤其是在代謝工程領域,使其適應新的表達環(huán)境。常用的密碼子偏好性計算方法包括以及等[23-26]。其次,密碼子上下游序列環(huán)境在基因的翻譯效率調(diào)控中也扮演了重要的角色。由于細胞中的tRNA使用完后可以重新加載氨基酸再用于同一mRNA的翻譯 (Codon reuse),在同一個mRNA轉(zhuǎn)錄本的某一區(qū)域通常傾向于使用同一密碼子編碼某一種氨基酸,以便提高翻譯效率。再次,編碼區(qū)域的重編將有可能改變mRNA的二級和三級結(jié)構(gòu),從而影響mRNA的穩(wěn)定性以及翻譯效率。基于熱力學參數(shù)和最小自由能,許多算法被開發(fā)出來用于計算RNA的結(jié)構(gòu),包括UNAFold和ViennaRNA等[27-28]。此外,限制性內(nèi)切酶識別位點在DNA的分子操作過程中發(fā)揮了重要的作用。通過同義重編,可以移除或者是引入相應的酶切位點便于后續(xù)的研究操作。其他如序列的GC含量和隱藏的終止密碼子等也是重編過程中要考慮的因素。針對這些因素和不同的實驗目的,許多軟件被開發(fā)出來用于編碼區(qū)域的重編,包括Synthetic Gene Developer、Gene Designer 2.0和Codon Optimization OnLine (COOL) 等[29-31]。目前這些軟件都只考慮這些因素中的一種或者幾種??紤]的因素越多,對計算能力的要求越大。如何定量預測密碼子同義替換對蛋白翻譯的影響將是這一領域未來的發(fā)展方向之一。
在最早合成的脊髓灰質(zhì)炎病毒 (Poliovirus) 基因組中,研究者們通過改變總共20個核苷酸序列引入了13個新的酶切位點,去除了一個I酶切位點[6]。在Sc2.0項目中,為了區(qū)別合成的和野生型的序列,根據(jù)同義密碼子原則我們引入了一系列的PCR標簽,把TAG終止密碼子替換成TAA,并且引入或剔除某些酶切位點[9]。通過替換野生型序列和表型測試,我們發(fā)現(xiàn)一些基因的同義替換會對其表達和功能造成重要的影響[12,14-15,17]。通過同義密碼子替換,Church組希望能夠構(gòu)建出一個只含有57個密碼子的合成大腸桿菌。通過初期的功能測試,他們發(fā)現(xiàn)2 229個基因中有13個基因的重編不能支持大腸桿菌的存活[32]。由這些實踐可以看出目前并不能很好地預測重編帶來的影響,但是研究者們的這些嘗試將為成功預測重編帶來的影響提供大量的研究材料。
根據(jù)基因的功能進行重編是合成基因組設計的另外一個方面。在合成的JCVI-1.0基因組中,基因被抗生素基因破壞,從而去除致病性,并且給合成的基因組提供了一個篩選標記[7]。在Sc2.0計劃中,所有tRNA編碼基因都將被轉(zhuǎn)移到一條新的染色體上[9]。在合成12號染色體的過程中,我們發(fā)現(xiàn)tRNA拷貝數(shù)的下降會導致細胞周期在G2/M轉(zhuǎn)化過程中的延遲[17]。對于已有基因組序列的分析顯示:在進化過程中具有類似功能或者表達的基因通常傾向于聚集在一起,而且基因的排序也不是隨機的[33-34]。利用合成基因組學的手段改變基因的排序?qū)檠芯窟@一問題提供新的材料。
基因的冗余性是基因組的特征之一,冗余基因的敲除通常不會帶來大的表型變化。除此之外,基因組中還有許多的非必需基因,這些基因的敲除將有助于簡化基因組。最小基因組的構(gòu)建將有助于優(yōu)化細胞對目的代謝途徑的物質(zhì)和能量投入。利用改造的Tn5轉(zhuǎn)座子,的基因組可以被減小200 kb[35]。通過設計、合成、表型測試的循環(huán),Venter組在2016年成功將基因組從1.08 Mb縮小到531 kb。這一基因組比自然界中已知的任何基因組都要小。他們總共刪除了428個基因,在剩下的473個基因中仍然還有149個基因功能未知[36]。這一最小基因組將為研究基因組中的核心功能以及探索如何從頭合成一個有功能的基因組提供一個通用的平臺。
3.2 對基因組其他區(qū)域的重編和設計
相對于編碼區(qū)域,基因組其他區(qū)域的重編和設計目前還處于比較初級的狀態(tài)。在合成的基因組中,一些“watermark”被插入到基因組中的基因間區(qū)。為了減少對基因組生物功能的可能影響,他們選擇了一些耐受轉(zhuǎn)座子插入的位置作為插入位點[7]。類似的策略也被用于合成基因組的設計[8]。在Sc2.0計劃中,基因組內(nèi)所有的轉(zhuǎn)座子、長末端重復序列和亞端粒末端重復序列都被刪去,以期能獲得更加穩(wěn)定的基因組和探索這些元件在進化上對于基因組的意義[9]。
基因組的非編碼區(qū)域有很大一部分是基因的啟動子和終止子。通過對這些元件的描述 (Characterization) 和模塊化 (Modularization),使其擁有更加可控的輸出和適配性能,一直是代謝工程和合成生物學的一個重要方面。目前在合成基因組學領域并沒有相關的研究報道這部分內(nèi)容的重編與設計。在Sc2.0計劃中,研究者們在每個非必需基因的3′末端引入了一個位點,設計了介導的合成染色體重組和修飾進化系統(tǒng) (Synthetic chromosome recombination and modification by loxP-mediated evolution,簡稱SCRaMbLE)。通過SCRaMbLE將有可能改變這些基因的啟動子和終止子,從而為研究它們的功能提供材料[9,37-38]。通過對12號染色體的染色體啟動SCRaMbLE,我們發(fā)現(xiàn)的3′UTR對于其mRNA的穩(wěn)定性至關重要 (未發(fā)表數(shù)據(jù))。
近年來的一些研究逐步發(fā)現(xiàn)基因組的三維結(jié)構(gòu)對于基因組的功能和調(diào)控起著重要的作用。莊小威組成功利用高分辨成像技術觀測了染色體的高級結(jié)構(gòu)域,分辨率可達kbp到Mbp的水平[39-40]。如何將基因組的三維結(jié)構(gòu)和表觀遺傳狀態(tài)考慮到基因組的重編和設計中來,將是合成基因組學發(fā)展中的重要方向。鑒于目前的合成基因組都是建立在已有基因組的基礎上,我們期望能夠通過不斷的嘗試,找到一些普遍的規(guī)律,逐步增大重編的程度,最終完全從頭設計一個新的基因組。
DNA合成技術的進展使得在較短的時間內(nèi)以可承受的價格獲得足量的DNA成為可能,這也促使了合成基因組學時代的真正到來。對于計算機設計好的基因組序列,如何快速合成、組裝并替換原有的野生型基因組,是合成基因組學在實踐過程中必須要解決的關鍵技術問題。這一部分將結(jié)合已有的基因組合成實踐,介紹如何從化學合成的寡聚核苷酸鏈開始,到最后組裝成一個有功能的基因組 (圖2)。
圖2 化學從頭合成基因組
4.1 基因組DNA的從頭合成
目前在寡鏈核苷酸從頭合成中使用最多的是固相亞磷酰胺化學合成法。該法通過去保護、聯(lián)結(jié)、加帽和氧化四步反應的循環(huán)在反應柱中逐步合成寡核苷酸鏈[41]。由于化學反應效率隨著寡核苷酸鏈的增長而降低,DNA合成的完整性、精確度和產(chǎn)量隨長度的增長而發(fā)生下降,合成的DNA長度一般不超過200 bp[42]。微陣列介導的DNA合成技術的出現(xiàn)極大降低了合成的成本,提高了通量。由于邊緣效應、去嘌呤反應等原因,微陣列合成的DNA相較于柱合成的DNA擁有較高的突變率。近年來,微陣列介導的DNA合成技術在合成的質(zhì)量、效率和自動化程度上都有了顯著提高。通過對反應過程的優(yōu)化,微陣列合成的寡鏈核苷酸現(xiàn)在也可以達到和柱合成類似的長度 (最長可達200 bp) 和精確度 (錯誤率在1/600左右)[42-43]。將二代測序與芯片合成有機結(jié)合起來,利用二代測序鑒定并回收序列正確的DNA片段,成為提高合成精確度的一個有效手段[44]。
4.2 基因組DNA的組裝
化學合成的寡核苷酸鏈長度有限,并不能滿足基因和基因組合成的需求,需要進一步組裝變成更長的DNA片段。現(xiàn)有的體外酶促DNA拼接技術主要包括限制性內(nèi)切酶依賴的拼接技術 (BioBrickstTM、BglBricks 和 Golden gate等) 和同源序列依賴的拼接技術 (In-FusionTM、SLIC和Gibson恒溫組裝等)。Golden gate拼接利用Ⅱ型限制性內(nèi)切酶切割位點在識別序列外部的特點,通過設計切割后的4 bp懸掛序列來實現(xiàn)DNA片段的無縫順序拼接[45]?;贕olden gate的原理,本實驗室成功構(gòu)建了YeastFab和EcoExpress兩個系統(tǒng)用于代謝工程的優(yōu)化和蛋白的表達,DNA拼接的效率可達90%以上[46-47]。Gibson assembly利用5′外切酶、DNA聚合酶和耐熱DNA連接酶的混合物實現(xiàn)DNA片段之間的無痕連接[48]。一步恒溫反應減少了大片段DNA分子在操作過程中的斷裂風險,較高的連接溫度 (50 ℃) 也減少了二級結(jié)構(gòu)的形成。但是該方法酶的價格較高,限制了其大規(guī)模的應用。
對于芯片合成的DNA,其復雜程度使得整個組裝過程更加具有挑戰(zhàn)性。利用核苷酸選擇性雜交的原則設計“block oligos”,可以將錯誤的序列排除在最終的組裝序列之外[49-50]。在合成酵母12號染色體的過程中,我們通過引入“oligo block”可以成功地將5個左右的1.6 kb片段一次拼接成10 kb的片段[17]。其他的一些方法,比如寡核苷酸庫的選擇性擴增、芯片分區(qū)和基于單鏈DNA缺口和鏈替換的原位基因合成,也被開發(fā)出來提高芯片合成DNA的組裝效率和準確率[51-52]。錯配剪切 (Mismatch-cleavage) 等手段也可用來進一步降低最終組裝產(chǎn)物的錯誤率。
宿主體內(nèi)的同源重組系統(tǒng)也可以用來進行大片段DNA的組裝。Itaya等將3.5 Mb的PCC6803基因組通過迭代替換的方法克隆到了的基因組中,變成一個7.7 Mb的融合基因組[53]。的同源重組系統(tǒng)非常高效,可以同時組裝多個帶有重疊序列的DNA片段,是目前利用合成DNA片段組裝基因組的最佳選擇。Gibson等通過轉(zhuǎn)化輔助的重組技術可以將25個24 kb左右的DNA片段在酵母體內(nèi)一次性組裝成整個的基因組[54]。此外,酵母對外源DNA的承載能力很強,目前已報道的最大承載是 1.8 Mb的的基因組[55],并且承載的上限并不清楚。需要注意的是,外源基因組中的毒性基因的表達會對酵母的存活產(chǎn)生較大的影響。比如說基因組中的一個內(nèi)切酶編碼基因必須被失活以使得其可以在酵母中克隆[56]。另外,酵母基因組中的復制起始位點通常擁有較低的GC含量,并且每隔大概150 kb就需要一個復制起始位點以保證染色體的穩(wěn)定。2.7 Mb的基因組擁有55%的GC含量,在酵母體內(nèi)克隆大于200 kb的基因組片段需要插入酵母內(nèi)源的復制起始位點才能成功。
4.3 基因組DNA的移植和替換
將DNA組裝成較大的DNA片段甚至是全基因組后,需要用這些合成的序列替換掉原有的野生型序列,并保持原有細胞的存活。對于擁有小型基因組的病毒如Poliovirus,合成的基因組cDNA可通過RNA聚合酶轉(zhuǎn)錄成病毒RNA,然后就可以體外在細胞提取液中進行翻譯和復制,組裝成一個有功能的病毒顆粒[6]。對于基因組較大的原核生物和真核生物,基因組替換的過程要困難許多。對于在酵母中組裝完成的基因組 (和JCVI-syn3.0最小基因組),可以通過原生質(zhì)體融合來實現(xiàn)酵母和其他生物間基因組的快速轉(zhuǎn)移,并同時減少機械剪切力對基因組DNA大片段的損傷[7-8,36]。而對于酵母自身基因組的合成,我們采用了基于同源重組的逐步替換的方法。每條酵母染色體被分為幾個到幾十個30 kb的片段 (Megachunk),每個megachunk帶有一個營養(yǎng)缺陷型或者標記基因。通過和的交互循環(huán)替代最終將整條染色體變成合成的序列。為了加快整條染色體替換的速度和及早發(fā)現(xiàn)存在于合成序列中的可能問題,我們組在合成酵母12號染色體的過程中建立了基于酵母減數(shù)分裂的快速組裝辦法 (Meiotic recombination based assembly,MRA)[17]。對于酵母以外的生物,直接依賴于自身的同源重組系統(tǒng)并不能夠滿足快速進行基因組替換的需求?;讦?Red噬菌體單鏈DNA結(jié)合蛋白β的MAGE和CAGE的出現(xiàn),使得快速多位點編輯的基因組成為可能[2,57]。CRISPR/Cas9編輯系統(tǒng)的出現(xiàn),使得對高等生物細胞的編輯變得更加高效[58-60]。這些基因組編輯技術的出現(xiàn)將有助于在不同的生物體內(nèi)實現(xiàn)像酵母一樣的原位合成基因組替換。
合成基因組學的發(fā)展不僅展示了人類在基因組水平合成生命系統(tǒng)的能力,同時在這過程中所發(fā)展的各種技術將從全新的角度,引領生命科學各領域的顛覆性創(chuàng)新。比如大片段DNA分子的組裝技術將有助于復雜代謝途徑的構(gòu)建和優(yōu)化,從而生產(chǎn)全新的藥物分子和生物能源物質(zhì)。又比如合成基因組的過程,通過重編、合成和表型測試的實踐提供了一個“自下而上”研究基因組中所有編碼和非編碼序列功能的嶄新的手段。并且,合成的基因組可以引入某些生物學特性,使得合成的生物體有著更加廣闊的應用前景。合成的無毒力病毒可用于相關病毒疫苗的研發(fā)[61],最小基因組將為代謝工程提供優(yōu)良的底盤細 胞[36],擁有57個密碼子的大腸桿菌將和其他細菌產(chǎn)生遺傳隔離從而阻斷基因的水平轉(zhuǎn)移[32]。在Sc2.0計劃中,合成的基因組包含了一個可誘導的自動進化系統(tǒng)SCRaMbLE。通過誘導SCRaMbLE可以產(chǎn)生多種多樣的基因組,從而加速菌株的進化,優(yōu)化代謝工程的底盤細胞[38]。
作為一個嶄新的研究領域,合成基因組學對傳統(tǒng)生命觀念所帶來的沖擊是巨大的,而且充滿了不確定性。就像一把雙刃劍,合成基因組學在帶來社會效益的同時也有可能帶來損害。所有的合成基因組學研究者都必須深刻認識到這里面將可能涉及的倫理和政策問題,包括合成基因組學所帶來的知識產(chǎn)權(quán)、生物安全以及自我管控能力建設等問題。合成有機體如果進入到自然環(huán)境中,將有可能會對環(huán)境產(chǎn)生負面的影響,污染自然基因庫。因此,一些合成生物控制系統(tǒng)同時被研究出來防止合成生物的逃逸[62-63]。我們所有的研究都必須要以益處最大化和可能帶來的風險最小化為準繩,開展有責任的創(chuàng)新。為了管控DNA重組和合成技術可能帶來的生物安全問題,NIH制定了相應的指導性原則 (NIH guidelines for research involving recombinant or synthetic nucleic acid molecules),并根據(jù)研究進展保持更新。2010年5月,瑞士聯(lián)邦非人類生物技術倫理委員會 (Federal ethics committee on non-human biotechnology,ECNH)發(fā)布了題為《合成生物學——倫理問題》的報告。同年12月,美國生物倫理研究委員會發(fā)表了題為《新方向:合成生物學和新出現(xiàn)技術的倫理》的報告。為了更好地處理這些問題,合成基因組學的研究者們應該加強自我監(jiān)管,建立開放的跨學科討論平臺,與社會學家和哲學家們合作,在研究的早期階段公開討論項目的倫理問題。
進入21世紀以來,合成基因組學獲得了突飛猛進的發(fā)展。原核生物基因組被不斷成功合成,第一個真核生物基因組已經(jīng)合成過半,人類基因組的合成也提上了議事日程。但是,目前的合成基因組學還處于起步發(fā)展階段,許多方面都尚未成熟。
一方面,由于目前對基因組各部分序列的功能了解得尚不夠清楚,基因組的重編程度仍然較低。如何合成一個功能可預知、可控制的基因組是當前合成基因組學需要解決的一個重大問題。為解決這一問題,需要將基因組的各部分元件標準化、模塊化,使其變得更加可控;也需要建立各部分元件的功能的標準化表征體系,用以衡量合成細胞的各個輸出;更需要在系統(tǒng)生物學、定量生物學等層面深入理解各元件之間的輸入和輸出關系,提高對合成基因組的預知能力。通過“設計-合成-測試”這樣的循環(huán)發(fā)展,合成基因組學必將大幅加深我們對基因組的序列與功能對應關系的理解。
另外一方面,基因組合成的成本目前仍然相對較高,DNA的合成、組裝和替換技術各方面都有著很大的降價空間。開發(fā)新的DNA合成策略,降低合成成本,加快合成速度,實現(xiàn)合成基因組學的工程化、經(jīng)濟化將是未來幾年內(nèi)合成基因組學走向?qū)嶋H應用的必經(jīng)之路。
[1] K?nig H, Frank D, Heil R, et al. Synthetic genomics and synthetic biology applications between hopes and concerns. Curr Genomics, 2013, 14(1): 11–24.
[2] Isaacs FJ, Carr PA, Wang HH, et al. Precise manipulation of chromosomesenables genome-wide codon replacement. Science, 2011, 333(6040): 348–353.
[3] Lajoie MJ, Rovner AJ, Goodman DB, et al. Genomically recoded organisms expand biological functions. Science, 2013, 342(6156): 357–360.
[4] DeLisi C. Meetings that changed the world: Santa Fe 1986: human genome baby-steps. Nature, 2008, 455(7215): 876–877.
[5] Agarwal KL, Büchi H, Caruthers MH, et al. Total synthesis of the gene for an alanine transfer ribonucleic acid from yeast. Nature, 1970, 227(5253): 27–34.
[6] Cello J, Paul AV, Wimmer E. Chemical synthesis of poliovirus cDNA: generation of infectious virus in the absence of natural template. Science, 2002, 297(5583): 1016–1018.
[7] Gibson DG, Benders GA, Andrews-Pfannkoch C, et al. Complete chemical synthesis, assembly, and cloning of agenome. Science, 2008, 319(5867): 1215–1220.
[8] Gibson DG, Glass JI, Lartigue C, et al. Creation of a bacterial cell controlled by a chemically synthesized genome. Science, 2010, 329(5987): 52–56.
[9] Dymond JS, Richardson SM, Coombes CE, et al. Synthetic chromosome arms function in yeast and generate phenotypic diversity by design. Nature, 2011, 477(7365): 471–476.
[10] Annaluru N, Muller H, Mitchell LA, et al. Total synthesis of a functional designer eukaryotic chromosome. Science, 2014, 344(6179): 55–58.
[11] Mercy G, Mozziconacci J, Scolari VF, et al. 3D organization of synthetic and scrambled chromosomes. Science, 2017, 355(6329): eaaf4597.
[12] Mitchell, LA, Wang, A, Stracquadanio G, et al. Synthesis, debugging, and effects of synthetic chromosome consolidation: synVI and beyond. Science, 2017, 355(6329): eaaf4831.
[13] Richardson SM, Mitchell LA, Stracquadanio G, et al. Design of a synthetic yeast genome. Science, 2017, 355(6329): 1040–1044.
[14] Shen Y, Wang Y, Chen T, et al. Deep functional analysis of synII, a 770-kilobase synthetic yeast chromosome. Science, 2017, 355(6329): eaaf4791.
[15] Wu Y, Li BZ, Zhao M, et al. Bug mapping and fitness testing of chemically synthesized chromosome X. Science, 2017, 355(6329): eaaf4706.
[16] Xie ZX, Li BZ, Mitchell LA, et al. “Perfect” designer chromosome V and behavior of a ring derivative. Science, 2017, 355(6329): eaaf4704.
[17] Zhang W, Zhao G, Luo Z, et al. Engineering the ribosomal DNA in a megabase synthetic chromosome. Science, 2017, 355(6329): eaaf3981.
[18] Boeke JD, Church G, Hessel A, et al. The genome project-write. Science, 2016, doi: 10.1126/ science.aaf6850.
[19] Keseler IM, Collado-Vides J, Santos-Zavaleta A, et al. EcoCyc: a comprehensive database ofbiology. Nucleic Acids Res, 2011, 39(S1): D583–D590.
[20] Pe?a-Castillo L, Hughes TR. Why are there still over 1000 uncharacterized yeast genes. Genetics, 2007, 176(1): 7–14.
[21] Gustafsson C, Govindarajan S, Minshull J. Codon bias and heterologous protein expression. Trends Biotechnol, 2004, 22(7): 346–353.
[22] Cannarozzi G, Schraudolph NN, Faty M, et al. A role for codon order in translation dynamics. Cell, 2010, 141(2): 355–367.
[23] Ikemura T. Correlation between the abundance oftransfer RNAs and the occurrence of the respective codons in its protein genes: a proposal for a synonymous codon choice that is optimal for the.translational system. J Mol Biol, 1981, 151(3): 389–409.
[24] dos Reis M, Savva R, Wernisch L. Solving the riddle of codon usage preferences: a test for translational selection. Nucleic Acids Res, 2004, 32(17): 5036–5044.
[25] Sharp PM, Li WH. The codon Adaptation Index-a measure of directional synonymous codon usage bias, and its potential applications. Nucleic Acids Res, 1987, 15(3): 1281–1295.
[26] Wright F. The ‘effective number of codons’ used in a gene. Gene, 1990, 87(1): 23–29.
[27] Markham NR, Zuker M. UNAFold: software for nucleic acid folding and hybridization//Keith JM, Ed. Bioinformatics. Clifton: Humana Press, 2008: 3–31.
[28] Schuster P, Fontana W, Stadler PF, et al. From sequences to shapes and back: a case study in RNA secondary structures. Proc Roy Soc B: Biol Sci, 1994, 255(1344): 279–284.
[29] Chin JX, Chung BKS, Lee DY. Codon Optimization OnLine (COOL): a web-based multi-objective optimization platform for synthetic gene design. Bioinformatics, 2014, 30(15): 2210–2212.
[30] Villalobos A, Ness JE, Gustafsson C, et al. Gene designer: a synthetic biology tool for constructing artificial DNA segments. BMC Bioinformatics, 2006, 7: 285.
[31] Wu G, Bashir-Bello N, Freeland SJ. The Synthetic Gene Designer: a flexible web platform to explore sequence manipulation for heterologous expression. Protein Expr Purif, 2006, 47(2): 441–445.
[32] Ostrov N, Landon M, Guell M, et al. Design, synthesis, and testing toward a 57-codon genome. Science, 2016, 353(6301): 819–822.
[33] Tamames J. Evolution of gene order conservation in prokaryotes. Genome Biol, 2001, 2(6): research0020.
[34] Hurst LD, Pál C, Lercher MJ. The evolutionary dynamics of eukaryotic gene order. Nat Rev Genet, 2004, 5(4): 299–310.
[35] Goryshin IY, Naumann TA, Apodaca J, et al. Chromosomal deletion formation system based on Tn5 double transposition: use for making minimal genomes and essential gene analysis. Genome Res, 2003, 13(4): 644–653.
[36] Hutchison III CA, Chuang RY, Noskov VN, et al. Design and synthesis of a minimal bacterial genome. Science, 2016, 351(6280): aad6253.
[37] Shen Y, Stracquadanio G, Wang Y, et al. SCRaMbLE generates designed combinatorial stochastic diversity in synthetic chromosomes. Genome Res, 2016, 26(1): 36–49.
[38] Dymond J, Boeke JD. TheSCRaMbLE system and genome minimization. Bioengineered, 2012, 3(3): 170–173.
[39] Wang SY, Su JH, Beliveau BJ, et al. Spatial organization of chromatin domains and compartments in single chromosomes. Science, 2016, 353(6299): 598–602.
[40] Boettiger AN, Bintu B, Moffitt JR, et al. Super-resolution imaging reveals distinct chromatin folding for different epigenetic states. Nature, 2016, 529(7586): 418–422.
[41] Caruthers MH, Barone AD, Beaucage SL, et al. Chemical synthesis of deoxyoligonucleotides by the phosphoramidite method. Methods Enzymol, 1987, 154: 287–313.
[42] LeProust EM, Peck BJ, Spirin K, et al. Synthesis of high-quality libraries of long (150mer) oligonucleotides by a novel depurination controlledprocess. Nucleic Acids Res, 2010, 38(8): 2522–2540.
[43] Saaem I, Ma KS, Marchi AN, et al. In-situ synthesis of DNA microarray on functionalized cyclic olefin copolymer substrate. ACS Appl Mater Interfaces, 2010, 2(2): 491–497.
[44] Matzas M, St?hler PF, Kefer N, et al. High-fidelity gene synthesis by retrieval of sequence-verified DNA identified using high-throughput pyros equencing. Nat Biotechnol, 2010, 28(12): 1291–1294.
[45] Engler C, Kandzia R, Marillonnet S. A one pot, one step, precision cloning method with high throughput capability. PLoS ONE, 2008, 3(11): e3647.
[46] Qin YR, Tan C, Lin JW, et al. EcoExpress-highly efficient construction and expression of multicomponent protein complexes in. ACS Synth Biol, 2016, 5(11): 1239–1246.
[47] Guo YK, Dong JK, Zhou T, et al. YeastFab: the design and construction of standard biological parts for metabolic engineering in. Nucleic Acids Res, 2015, 43(13): e88.
[48] Gibson DG, Young L, Chuang RY, et al. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods, 2009, 6(5): 343–345.
[49] Tian JD, Gong H, Sheng NJ, et al. Accurate multiplex gene synthesis from programmable DNA microchips. Nature, 2004, 432(7020): 1050–1054.
[50] Borovkov AY, Loskutov AV, Robida MD, et al. High-quality gene assembly directly from unpurified mixtures of microarray-synthesized oligonucleotides. Nucleic Acids Res, 2010, 38(19): e180.
[51] Kosuri S, Eroshenko N, LeProust EM, et al. Scalable gene synthesis by selective amplification of DNA pools from high-fidelity microchips. Nat Biotechnol, 2010, 28(12): 1295–1299.
[52] Quan JY, Saaem I, Tang N, et al. Parallel on-chip gene synthesis and application to optimization of protein expression. Nat Biotechnol, 2011, 29(5): 449–452.
[53] Itaya M, Tsuge K, Koizumi M, et al. Combining two genomes in one cell: stable cloning of thePCC6803 genome in the168 genome. Proc Natl Acad Sci USA, 2005, 102(44): 15971–15976.
[54] Gibson DG, Benders GA, Axelrod KC, et al. One-step assembly in yeast of 25 overlapping DNA fragments to form a complete syntheticgenome. Proc Natl Acad Sci U S A, 2008, 105(51): 20404–20409.
[55] Karas BJ, Jablanovic J, Sun LJ, et al. Direct transfer of whole genomes from bacteria to yeast. Nat Methods, 2013, 10(5): 410–412.
[56] Karas BJ, Tagwerker C, Yonemoto IT, et al. Cloning thePG-8A genomeinas a yeast centromeric plasmid. ACS Synth Biol, 2012, 1(1): 22–28.
[57] Wang HH, Isaacs FJ, Carr PA, et al. Programming cells by multiplex genome engineering and accelerated evolution. Nature, 2009, 460(7257): 894–898.
[58] Ran FA, Hsu PD, Wright J, et al. Genome engineering using the CRISPR-Cas9 system. Nat Protoc, 2013, 8(11): 2281–2308.
[59] Doudna JA, Charpentier E. The new frontier of genome engineering with CRISPR-Cas9. Science, 2014, 346(6213): 1258096.
[60] Cong L, Ran FA, Cox D, et al. Multiplex genome engineering using CRISPR/Cas systems. Science, 2013, 339(6121): 819–823.
[61] Coleman JR, Papamichail D, Skiena S, et al. Virus attenuation by genome-scale changes in codon pair bias. Science, 2008, 320(5884): 1784–1787.
[62] Gallagher RR, Patel JR, Interiano AL, et al. Multilayered genetic safeguards limit growth of microorganisms to defined environments. Nucleic Acids Res, 2015, 43(3): 1945–1954.
[63] Cai YZ, Agmon N, Choi WJ, et al. Intrinsic biocontainment: multiplex genome safeguards combine transcriptional and recombinational control of essential yeast genes. Proc Natl Acad Sci USA, 2015, 112(6): 1803–1808.
(本文責編 陳宏宇)
戴俊彪 博士,現(xiàn)任中國科學院深圳先進技術研究院研究員。1997年本科畢業(yè)于南京大學基礎學科教學強化部,2000年碩士畢業(yè)于清華大學生命科學與技術系。2006年于美國愛荷華州立大學分子、細胞及發(fā)育生物學專業(yè)獲得博士學位。2006?2011年在美國約翰霍普金斯大學醫(yī)學院從事博士后研究。2011?2017年任清華大學生命科學學院研究員。主要從事合成生物學研究,開發(fā)基因合成、組裝及全基因組設計與合成技術,是國際合成酵母基因組計劃的主要成員。已在、、、、等刊物上發(fā)表學術論文30多篇,申請/授權(quán)專利8項。2011年獲得美國約翰霍普金斯大學醫(yī)學院頒發(fā)的Albert Lehninger研究獎,同年入選中組部首批青年“千人計劃”。
Synthetic genomics: the art of design and synthesis
Zhouqing Luo, and Junbiao Dai
School of Life Sciences, Center for Synthetic and Systems Biology, Tsinghua University, Beijing 100084, China
Benefited from the rapid development of high-throughput sequencing, genome editing, DNA synthesis and functional genomics, synthetic genomics gains the momentum in this century. The entire genomes of several viruses and one prokaryote have been chemically synthesized and applied to drive normal cellular processes. The first eukaryotic genome synthesis project (Sc2.0) is on-going and about half of the genome has been synthesized and functionally tested. The Human Genome Project-Write (HGP-Write) was proposed in 2016, which pushes the tide of synthetic genomics to a position we have never seen before. Technologies on genome-scale design and DNA synthesis have been rapidly developed, aiming to construct a more predictable and controllable genome at reasonable cost. The generation of synthetic organisms not only has promising applications for industry, environment, healthy and basic researches, but also raises ethic and policy concerns. This review presents the development of synthetic genomics, with emphasis on technologies for whole genome design, synthesis and assembly. We also discussed ethics, prospective and challenge in synthetic genomics. As one of the major branches in synthetic biology, synthetic genomics is still at its infant stage. A lot of excitement will come in the next few years.
synthetic genomics, genome redesign, DNA synthesis, DNA assembly and genome construction
October 30, 2016; Accepted: December 9, 2016
Junbiao Dai. Tel: +86-10-62796190; E-mail: jbdai@tsinghua.edu.cn
Supported by: Funding from Young Thousand Talent Program, Tsinghua University Initiatives (No. 20161080088).
青年千人計劃,清華大學自主科研項目(No. 20161080088) 資助。