何博,付宗恒,吳毅,趙廣榮
(天津大學(xué)化工學(xué)院,系統(tǒng)生物工程教育部重點(diǎn)實(shí)驗(yàn)室,教育部合成生物學(xué)前沿科學(xué)中心,天津 300072)
DNA 是原核生物和真核生物的主要遺傳物質(zhì),指導(dǎo)細(xì)胞的各種生命活動(dòng)。不同于原核生物遺傳物質(zhì)裸露于細(xì)胞質(zhì)中,真核生物以染色體的形式將其龐大、復(fù)雜的遺傳信息組織起來。按照合成生物學(xué)的經(jīng)典理念--了解事物工作原理的最佳方法就是設(shè)計(jì)重構(gòu)[1],“編寫”基因組可以進(jìn)一步理解基本生命過程。
隨著多組學(xué)的不斷進(jìn)步以及DNA 合成組裝技術(shù)的快速發(fā)展,“編寫”生物基因組也逐漸成為現(xiàn)實(shí)[2-3],通過對基因組進(jìn)行理性設(shè)計(jì)、從頭化學(xué)合成、組裝、轉(zhuǎn)移以及功能重塑,實(shí)現(xiàn)生命遺傳物質(zhì)的人工合成及重塑。近十多年來合成基因組學(xué)在較低等生物的基因組設(shè)計(jì)與合成中取得了一系列重要進(jìn)展和里程碑式的突破,合成基因組學(xué)的研究對象實(shí)現(xiàn)了由病毒到原核生物再到真核生物的發(fā)展,設(shè)計(jì)深度也由簡單的復(fù)制序列發(fā)展為多元化甚至顛覆性的基因組重塑。目前已經(jīng)實(shí)現(xiàn)支原體[4-5]、大腸桿菌全基因組[6-7]的設(shè)計(jì)再造,以及釀酒酵母Ⅱ號(hào)[8]、Ⅲ號(hào)[9]、Ⅴ號(hào)[10]、Ⅵ號(hào)[11]、Ⅹ號(hào)[12]和Ⅻ號(hào)[13]染色體的全化學(xué)合成。
高等動(dòng)物基因組的設(shè)計(jì)與合成被視為合成基因組學(xué)領(lǐng)域的下一個(gè)任務(wù)和挑戰(zhàn)。通過高等動(dòng)物基因組的設(shè)計(jì)與合成加深對高等生物基因組的理解,同時(shí)開發(fā)在藥物研發(fā)、疾病治療等方面的潛在應(yīng)用場景,其潛在應(yīng)用可包括復(fù)雜疾病模型、人源化動(dòng)物、抗病毒超級細(xì)胞系、器官移植等。然而相對于大腸桿菌、釀酒酵母等低等模式生物,哺乳動(dòng)物細(xì)胞的基因組更為龐大,具有復(fù)雜的表觀遺傳修飾以及染色體三維結(jié)構(gòu),除此之外,基因組注釋不完善以及復(fù)雜的時(shí)空調(diào)控機(jī)制也增加了哺乳動(dòng)物基因組的設(shè)計(jì)難度。通過設(shè)計(jì)-合成-檢驗(yàn)-學(xué)習(xí)的循環(huán)發(fā)展,哺乳動(dòng)物合成基因組學(xué)也將推動(dòng)技術(shù)的進(jìn)步同時(shí)加深對基因組的進(jìn)一步理解,進(jìn)而指導(dǎo)哺乳動(dòng)物基因組的設(shè)計(jì)。
2016年6 月,由來自美中英等多個(gè)國家的跨學(xué)科團(tuán)隊(duì)[2]提出基因組編寫計(jì)劃(Genome Projectwrite,GP-write),將促進(jìn)基因組規(guī)模編寫DNA 新技術(shù)的開發(fā),有望如20 年前人類基因組計(jì)劃(Genome Project-read,GP-read)一樣對研究生物學(xué)以及改善人類健康方面產(chǎn)生變革式的影響?;蚪M編寫計(jì)劃正在分階段進(jìn)行,以評估相關(guān)研究的可行性和應(yīng)用價(jià)值。重新編碼人類細(xì)胞基因組需要對合成構(gòu)建和測試人工基因組的技術(shù)進(jìn)行突破式的重大改進(jìn)。在染色體或基因組尺度的DNA合成、組裝以及活細(xì)胞內(nèi)測試的技術(shù)路線中,關(guān)鍵步驟仍存在技術(shù)難題,目前大多數(shù)合成基因組編寫技術(shù)仍處于實(shí)驗(yàn)室開發(fā)階段[14],如化學(xué)合成寡核苷酸需進(jìn)一步降低成本并提高化學(xué)合成更長的寡核苷酸鏈精確度;開發(fā)新的組裝宿主和分子生物學(xué)工具用于高GC 含量和直接重復(fù)序列等復(fù)雜序列的組裝;開發(fā)染色體規(guī)模的高效率、高通量的轉(zhuǎn)移方法;需要基礎(chǔ)研究進(jìn)一步闡明基因型-表型的關(guān)系以及序列-表觀遺傳調(diào)控指導(dǎo)基因組結(jié)構(gòu)的機(jī)制等。通過推動(dòng)創(chuàng)新和增加需求,基因組編寫計(jì)劃可進(jìn)一步推動(dòng)新技術(shù)的開發(fā)和改進(jìn)。
基因組編寫計(jì)劃等相關(guān)項(xiàng)目的逐步開展,可為哺乳動(dòng)物基因組設(shè)計(jì)提供理論指導(dǎo),為哺乳動(dòng)物中大片段DNA 的操縱提供新方法,將極大推動(dòng)哺乳動(dòng)物合成基因組學(xué)的發(fā)展。
設(shè)計(jì)構(gòu)建不同于天然基因組的合成基因組或染色體,一方面能檢驗(yàn)和提高對基因組生物學(xué)知識(shí)的理解和認(rèn)識(shí),另一方面可以賦予生物體新的功能,揭示表型與基因型的關(guān)系。合成基因組的設(shè)計(jì)原則依據(jù)對基因組重塑的方式可以分為:簡化(simplification)、擴(kuò)展(expansion)、重構(gòu)(reconstruction)等(圖1)?;蚪M簡化設(shè)計(jì)原則指導(dǎo)探索不同條件下支持生命活動(dòng)所需的最少基因集合及其對應(yīng)的生理功能,包括基因水平的簡化[5]和基因間區(qū)的簡化等。合成基因組的擴(kuò)展設(shè)計(jì)原則旨在通過向天然基因組中增添DNA 序列從而使生命體獲得新的表型和功能,包括在脫氧核苷酸水平將天然堿基對擴(kuò)展至更多種非天然堿基對,以及在基因水平引入外源基因或路徑等[15]。合成基因組的重構(gòu)設(shè)計(jì)原則根據(jù)對天然基因組的設(shè)計(jì)再造維度從小到大(從密碼子、基因表達(dá)盒內(nèi)部元件、多基因排列到染色體或整個(gè)基因組結(jié)構(gòu)),可包括密碼子重新編碼(recoding)[16]、元件模塊化(modularization)、基因成簇化(gene clustering)、染色體結(jié)構(gòu)重排(rearranging)等[17-23]。此外,研究表明DNA 的轉(zhuǎn)錄、翻譯、調(diào)控等也受到表觀遺傳修飾等的影響[24],這也將是合成基因組設(shè)計(jì)應(yīng)考慮的因素之一。
圖1 基因組的設(shè)計(jì)原則Fig.1 Design principles for genomes
合成基因組學(xué)在支原體、大腸桿菌、釀酒酵母等低等生物中的創(chuàng)新性設(shè)計(jì)取得了一系列具有重大科學(xué)意義的成果。不僅證明全化學(xué)合成基因組可以替代天然基因組作為生物體的遺傳物質(zhì)調(diào)控生命正常功能,而且通過“自上而下”的設(shè)計(jì)再造方式檢驗(yàn)和完善了對現(xiàn)有生命系統(tǒng)的認(rèn)知和理解。
JCVI-syn1.0[4]實(shí)現(xiàn)了絲狀支原體(Mycoplasma mycoides)基因組的全化學(xué)合成,JCVI-syn3.0[5]項(xiàng)目根據(jù)基因組簡化設(shè)計(jì)原則,探索生命所需最基本的基因,使用了全基因組設(shè)計(jì)和完整的化學(xué)合成方法,將JCVI-syn1.0 長達(dá)1.079 Mb 的合成型基因組簡化至531 kb,只保留了473 個(gè)基因。根據(jù)基因組擴(kuò)增設(shè)計(jì)原則,可在基因組中引入非天然堿基對[15,25]或異源基因,如Luo等[26]通過引入異源的代謝路徑實(shí)現(xiàn)了在釀酒酵母中全合成大麻素及其非天然類似物。根據(jù)基因組重構(gòu)設(shè)計(jì)原則,英國劍橋大學(xué)Jason W.Chin 團(tuán)隊(duì)利用開發(fā)的在大腸桿菌中可迭代地循環(huán)替換約100 kb 基因組的技術(shù)[27],完成了對大腸桿菌18 214 個(gè)密碼子的重新編碼[7],創(chuàng)建僅具有61 個(gè)密碼子的4 Mb 基因組的大腸桿菌變體(a variant ofEscherichia coli),空出來的密碼子可以用來編碼新氨基酸,從而創(chuàng)造具有新功能的蛋白,賦予生命體新功能。2021 年,該團(tuán)隊(duì)敲除合成型菌株密碼子TCG、TGA、TAG的tRNAs 和釋放因子,從而使菌株獲得對噬菌體的抵抗能力,同時(shí)實(shí)現(xiàn)了對密碼子的再利用,賦予合成型菌株新的功能[28]。
在真核基因組設(shè)計(jì)領(lǐng)域,Sc2.0 項(xiàng)目[29]是全世界第一個(gè)真核生物基因組設(shè)計(jì)合成的國際合作項(xiàng)目,該項(xiàng)目旨在對釀酒酵母基因組進(jìn)行系統(tǒng)性設(shè)計(jì)和化學(xué)合成再造以獲得具有生物活性的合成型釀酒酵母基因組,Sc2.0 采用“自下而上”的基因組合成策略以及模塊化組裝、多輪迭代替換的方式構(gòu)建釀酒酵母染色體,已完成釀酒酵母Ⅱ、Ⅲ、Ⅴ、Ⅵ、Ⅹ和Ⅻ號(hào)染色體的全化學(xué)合成。Sc2.0 項(xiàng)目通過計(jì)算機(jī)輔助真核基因組設(shè)計(jì)[30],根據(jù)基因組簡化設(shè)計(jì)原則刪除tRNA、轉(zhuǎn)座子等不穩(wěn)定元件,提升基因組穩(wěn)定性,同時(shí)根據(jù)基因組重構(gòu)設(shè)計(jì)原則引入多個(gè)LoxPsym 位點(diǎn)增加基因組可操作性,構(gòu)建了一個(gè)人工基因組重排系統(tǒng)(SCRaMbLE),可實(shí)現(xiàn)染色體結(jié)構(gòu)重排并在實(shí)驗(yàn)室條件下加速釀酒酵母的基因型進(jìn)化和表型進(jìn)化?,F(xiàn)階段哺乳動(dòng)物基因組的設(shè)計(jì)仍處于萌芽初期,未來基因組設(shè)計(jì)旨在將更多元更具顛覆性的設(shè)計(jì)引入到染色體級別的DNA 序列設(shè)計(jì)中。
設(shè)計(jì)更復(fù)雜的哺乳動(dòng)物基因組需要全面分析更多的數(shù)據(jù)信息,包括更加完善的基因組功能元件注釋、轉(zhuǎn)錄組、蛋白組、代謝組、DNA-蛋白質(zhì)結(jié)合位點(diǎn)數(shù)據(jù)、表觀遺傳修飾數(shù)據(jù)以及基因組三維結(jié)構(gòu)數(shù)據(jù)等。
近年來隨著ENCODE、gnomAD、GWAS等一系列項(xiàng)目的推進(jìn),可為哺乳動(dòng)物基因組的設(shè)計(jì)提供支持。DNA 元件百科全書(The ENCyclopedia Of DNA Elements,ENCODE)項(xiàng)目旨在鑒定人類基因組序列中的所有功能性元件[31-32]。截至2020年ENCODE[33]確 定 了20 225 個(gè) 蛋 白 質(zhì) 編 碼 基 因、37 595個(gè)非編碼蛋白質(zhì)基因、2 157 387個(gè)開放染色質(zhì)區(qū)域,750 392 個(gè)組蛋白修飾區(qū)域、1 224 154 個(gè)轉(zhuǎn)錄因子和染色質(zhì)相關(guān)蛋白結(jié)合區(qū)域,845 000 個(gè)RNA結(jié)合蛋白占據(jù)的RNA子區(qū)域(RNAsubregions),還鑒定出超過130 000 個(gè)遠(yuǎn)距離相互作用的染色質(zhì)基因座(chromatin loci),并注釋了約90 萬個(gè)人類基因組中的和約30 萬個(gè)小鼠基因組中的調(diào)控元件信息。2019年,UCSU發(fā)布了人類調(diào)控元件及相關(guān)靶基因的數(shù)據(jù)庫--GeneHancer track[34],它集成了7 個(gè)全基因組數(shù)據(jù)庫(ENCODE、Ensembl、FANTOM5、 VISTA、 dbSUPER、 EPDNew 和UCNEbase)包括超過100 萬個(gè)調(diào)控元件。與此同時(shí),高通量測序技術(shù)的發(fā)展促進(jìn)對個(gè)體基因組的測序工作及基因組突變的相關(guān)研究?;蚪M聚合數(shù)據(jù)庫(GenomeAggregation Database,gnomAD)匯總了15 708個(gè)來自不同個(gè)體的完整基因組和125 748個(gè)外顯子組,整理并分析不同類型的變異對功能或表型的潛在影響[35]。全基因組關(guān)聯(lián)研究(genomewide association studies,GWAS)鑒定發(fā)現(xiàn)人類基因組中不同個(gè)體之間的變異位點(diǎn)90%以上都位于非編碼區(qū)[36]。發(fā)現(xiàn)和解析不同人種和不同個(gè)體之間基因組多樣性豐富了對基因組的認(rèn)識(shí),可幫助識(shí)別引起疾病的基因突變并確定潛在的藥物靶標(biāo),是哺乳動(dòng)物基因組設(shè)計(jì)合成的重要數(shù)據(jù)資源。
盡管小鼠、人等哺乳動(dòng)物基因組測序工作已基本完成[37-39],新的測序技術(shù)對基因組測序數(shù)據(jù)進(jìn)行不斷的補(bǔ)充[40],大量的基因組注釋工作也取得持續(xù)性進(jìn)展,但對基因組的注釋工作仍不完善。人類基因組中蛋白質(zhì)編碼序列所占比例不到2%[41],因此在解析基因編碼區(qū)的同時(shí)不斷完善非編碼區(qū)的注釋才能為哺乳動(dòng)物基因組的深度設(shè)計(jì)提供支撐。在簡化、擴(kuò)展、重構(gòu)等設(shè)計(jì)原則指導(dǎo)下,基因組的高效設(shè)計(jì)一般除了需要從已有的生物信息數(shù)據(jù)庫[14]獲取基本的元件信息,還需通過計(jì)算機(jī)來實(shí)現(xiàn)基因組規(guī)模的序列設(shè)計(jì)。如Sc2.0 借助計(jì)算機(jī)輔助設(shè)計(jì)合成型釀酒酵母染色體[29],JCVI 3.0 借助計(jì)算機(jī)輔助設(shè)計(jì)結(jié)合DBT(Design-Build-Test)循環(huán)成功構(gòu)建出簡化的支原體基因組[5]。人工智能已在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域取得突破性進(jìn)展[42-43],AlphaFold2預(yù)測的蛋白質(zhì)結(jié)構(gòu)能達(dá)到原子水平的準(zhǔn)確度,確定了覆蓋幾乎整個(gè)人類蛋白質(zhì)組(98.5%的所有人類蛋白)的蛋白質(zhì)結(jié)構(gòu),該工作的研究者期望這一精準(zhǔn)的預(yù)測算法可以讓蛋白質(zhì)結(jié)構(gòu)解析技術(shù)促進(jìn)基因組學(xué)的發(fā)展。隨著各種生物信息數(shù)據(jù)庫以及基因組注釋的不斷完善,人工智能有望在高等生物基因組設(shè)計(jì)、改善表型預(yù)測等方面發(fā)揮重要作用。
設(shè)計(jì)構(gòu)建獨(dú)立于基因組的合成型染色體是哺乳動(dòng)物基因組設(shè)計(jì)的一個(gè)重要策略。設(shè)計(jì)構(gòu)建的染色體可從其傳代穩(wěn)定性、承載能力、復(fù)制能力、穿梭能力、表達(dá)能力等幾個(gè)方面來進(jìn)行評估。染色體基本功能元件使其在細(xì)胞中穩(wěn)定存在并發(fā)揮功能,其基本功能元件包括著絲粒、端粒、自主復(fù)制起始位點(diǎn)、啟動(dòng)子、增強(qiáng)子、沉默子等在分配、復(fù)制、轉(zhuǎn)錄、翻譯等不同階段發(fā)揮重要功能的元件。其中,端粒是維持線性染色體穩(wěn)定的重要元件,而構(gòu)建環(huán)形染色體可在不使用端粒的情況下實(shí)現(xiàn)染色體的穩(wěn)定。
高等哺乳動(dòng)物著絲粒區(qū)域長、序列復(fù)雜,且高級重復(fù)(higher-order repeat,HOR)單元陣列長度個(gè)體之間差異極大[44]。目前人類基因組中只有8 號(hào)、X 和Y 染色體的著絲粒序列測序組裝完成[45],天然著絲粒序列由復(fù)雜的高度重復(fù)序列構(gòu)成,對于測序和合成都是巨大的挑戰(zhàn),這些因素限制了高等哺乳動(dòng)物著絲粒作為通用元件的使用。不同于釀酒酵母染色體上序列明確的點(diǎn)著絲粒區(qū)域,研究表明哺乳動(dòng)物染色體依靠組蛋白H3 變體CENP-A 從表觀遺傳的角度確定著絲粒的位置[46-52],合成型哺乳動(dòng)物染色體著絲粒區(qū)域的設(shè)計(jì)構(gòu)建是哺乳動(dòng)物合成基因組學(xué)研究的重要內(nèi)容,其設(shè)計(jì)構(gòu)建可分為自下而上(bottom-up)和自上而下(top-down)兩種。著絲粒區(qū)域自下而上構(gòu)建又稱從頭構(gòu)建(de novo),指化學(xué)合成包含天然著絲粒序列或其他能發(fā)揮著絲粒功能的非天然序列[圖2(a)、(b)]。1997 年,Harrington 等[53]使用人17號(hào)染色體的2.7 kb重復(fù)序列陣列,產(chǎn)生約173 kb大小載體,其在細(xì)胞內(nèi)自發(fā)形成6~10 Mb 的穩(wěn)定HAC,并在6 個(gè)月內(nèi)能正常復(fù)制、分配至子代細(xì)胞。Oshimura 課題組[54]開發(fā)了可誘導(dǎo)型著絲粒合成型哺乳動(dòng)物染色體Alphoidtet-O-HAC,將6000 拷貝的42 bp 四環(huán)素操縱子(tet-O)序列插入兆堿基大小的合成DNA 陣列中,利用tet-O 被tet 阻遏物(tet-R)結(jié)合的高親和力和特異性,通過tet-R 融合蛋白來靶向HAC 中的tet-O 序列使著絲粒功能失活并 誘 導(dǎo)HAC 丟 失。Kouprina 等[55-56]進(jìn) 一 步 將Alphoidtet-O-HAC 開發(fā)成一個(gè)用于將大片段DNA 向哺乳動(dòng)物細(xì)胞轉(zhuǎn)移的工具,通過在CHO 細(xì)胞中的Alphoidtet-O-HAC 上進(jìn)行DNA 片段多輪迭代組裝實(shí)現(xiàn)大片段功能區(qū)域的組裝,可用于糾正人類細(xì)胞的遺傳缺陷[57]。Pesenti 課題組[58]利用人21 號(hào)染色體上著絲粒序列從頭構(gòu)建了α21-ITetO和α21-ⅡLacO/Gal4HAC,分析和研究在HAC 形成初期的復(fù)雜的DNA 重排。2019 年Ben E.Black 團(tuán)隊(duì)[46]開發(fā)了一種從頭構(gòu)建哺乳動(dòng)物染色體載體的新方法,該方法繞過傳統(tǒng)自下而上載體對天然alpha satellite、CENP-B boxes 序列的需要,利用被稱為新型著絲粒(neocentromere)的非重復(fù)序列(4q21)代替重復(fù)的著絲粒序列,并在載體上添加LacO重復(fù)序列,由于LacI-LacO相互作用,經(jīng)誘導(dǎo)表達(dá)的LacI-HJURP被定位至LacO 序列上,隨后HJURP 募集CENP-A,被附近的DNA 包裹,形成著絲粒。這項(xiàng)工作避開了對原著絲粒大片段重復(fù)DNA 的合成組裝,對動(dòng)物人工染色體載體設(shè)計(jì)構(gòu)建具有重要意義。自上而下的載體是通過同源重組在天然染色體臂上引入人工端?;騆oxP位點(diǎn)對天然染色體進(jìn)行截短得到,被稱為微染色體(minichromosome)。雞淋巴瘤細(xì)胞DT40同源重組能力強(qiáng),是微染色體的構(gòu)建的主要工具[59][圖2(c)]?;谌祟?4 號(hào)、21 號(hào)、X、Y 染色體都被改造成微染色體[60]。
圖2 合成型哺乳動(dòng)物染色體著絲粒區(qū)域(a)基于衛(wèi)星(satellite)重復(fù)序列自下而上構(gòu)建的著絲粒區(qū)域;(b)基于非天然重復(fù)序列自下而上構(gòu)建的著絲粒區(qū)域;(c)自上而下截短的人工染色體Fig.2 Centromeric regions of synthetic mammalian chromosomes(a)Bottom-up centromere region based on satellite repeat sequence;(b)Bottom-up centromere region based on non-natural repetitive sequences;(c)Top-down artificial chromosomes from truncated natural chromosomes
從頭構(gòu)建(de novo)的著絲粒穩(wěn)定性依賴HT1080 細(xì)胞,其低Suv39h1 甲基轉(zhuǎn)移酶表達(dá)量有利于合成型著絲粒功能的實(shí)現(xiàn)[51],這也就導(dǎo)致最初著絲粒功能的實(shí)現(xiàn)局限在極少數(shù)的細(xì)胞系。包含從頭構(gòu)建著絲粒序列的載體在細(xì)胞中會(huì)發(fā)生3種不同的變化:①整合到染色體臂上;②發(fā)生多聚化形成一個(gè)能自我復(fù)制以及隨傳代穩(wěn)定分裂的獨(dú)立HAC(細(xì)胞群體可以包含兩者的混合物);③整體或部分丟失。造成包括功能DNA 序列在內(nèi)的不可預(yù)測的改變,限制了其應(yīng)用。自上而下構(gòu)建的微染色體的“微”是相對于天然染色體而言,其自身的大小也在Mb 級別,無法在大腸桿菌、釀酒酵母等模式微生物中進(jìn)行組裝和編輯,且其轉(zhuǎn)移的方式也受到極大的限制。如何設(shè)計(jì)構(gòu)建合成型哺乳動(dòng)物染色體載體,使其大小上能通過常規(guī)轉(zhuǎn)染方式進(jìn)行轉(zhuǎn)移,在體內(nèi)以穩(wěn)定的游離形式存在且序列與初始保持一致,是合成型哺乳動(dòng)物染色體載體設(shè)計(jì)接下來面臨的任務(wù)和挑戰(zhàn)。
除了設(shè)計(jì)獨(dú)立于哺乳動(dòng)物基因組的合成型染色體,設(shè)計(jì)構(gòu)建大片段DNA 整合到哺乳動(dòng)物細(xì)胞基因組上也是在哺乳動(dòng)物細(xì)胞中操縱大片段DNA的一個(gè)重要策略。該策略可利用大片段操縱技術(shù)實(shí)現(xiàn)大片段的敲入等,從而將基因組設(shè)計(jì)的重點(diǎn)放在基因組研究內(nèi)容的設(shè)計(jì)上。2018 年,基因組編寫計(jì)劃(GP-write)宣布第1 個(gè)大型試點(diǎn)項(xiàng)目:能夠抵抗天然病毒以及潛在的輻射、冷凍、衰老和癌癥的“超安全”(“ultra-safe”)版本的人類細(xì)胞系(明確限于在細(xì)胞中研究)。超安全細(xì)胞系的構(gòu)建預(yù)計(jì)將需要對人類基因組進(jìn)行至少40 萬處更改,基于簡化和密碼子重新編碼的設(shè)計(jì)原則,從所有20 000 多個(gè)人類基因中刪除特定的冗余密碼子,通過“重新編碼”所有基因的冗余密碼子并刪除對其進(jìn)行解碼的tRNA 來實(shí)現(xiàn)抗病毒功能[16,61],通過改造p53 等抑癌基因的突變熱點(diǎn)序列降低突變率或增加抑癌基因的拷貝數(shù)從而降低細(xì)胞癌變的風(fēng)險(xiǎn),團(tuán)隊(duì)期望在10 年內(nèi)完成該項(xiàng)工作。由于全基因組關(guān)聯(lián)研究(GWAS)繪制人類疾病和性狀相關(guān)變異的圖譜發(fā)現(xiàn)大多數(shù)變體(90%以上)位于非編碼區(qū),因此關(guān)于非編碼區(qū)如啟動(dòng)子、增強(qiáng)子、CTCF 結(jié)合位點(diǎn)等調(diào)控區(qū)域以及內(nèi)含子等的設(shè)計(jì)工作具有重要意義。此外,由于逆轉(zhuǎn)座子導(dǎo)致的基因組不穩(wěn)定性使干細(xì)胞治療存在潛在風(fēng)險(xiǎn)[62],設(shè)計(jì)合成刪除逆轉(zhuǎn)座子的簡化基因組可提高基因組的穩(wěn)定性。大多數(shù)的非編碼序列具有功能,盲目的刪減可能有潛在的研究風(fēng)險(xiǎn)。在開展研究前需要對于涉及的基因組進(jìn)行廣泛而深入的調(diào)研,對于注釋不明的序列應(yīng)采取相對保守的設(shè)計(jì)。Bradley團(tuán)隊(duì)[63]構(gòu)建的人源化抗體轉(zhuǎn)基因小鼠,對小鼠自身的免疫球蛋白基因座采取倒置失活而不是直接敲除,是因?yàn)樾∈竺庖咔虻鞍字劓溁蜃泻衅渌兄匾δ艿幕蛞约胺蔷幋aRNA,盲目刪除存在巨大的未知風(fēng)險(xiǎn)。盡管現(xiàn)階段哺乳動(dòng)物基因組的設(shè)計(jì)充滿挑戰(zhàn),但是哺乳動(dòng)物基因組設(shè)計(jì)-合成-檢驗(yàn)-學(xué)習(xí)的循環(huán)發(fā)展也會(huì)提升對基因組序列與功能關(guān)系的理解。
目前對于哺乳動(dòng)物基因的設(shè)計(jì)仍局限在局部小范圍的設(shè)計(jì),仍不能像低等生物基因組的設(shè)計(jì)一樣實(shí)現(xiàn)整個(gè)基因組的全局性設(shè)計(jì)。哺乳動(dòng)物基因組的復(fù)雜性如精密的基因時(shí)空調(diào)控系統(tǒng)、基因間相互作用網(wǎng)絡(luò)、表觀遺傳調(diào)控、細(xì)胞間相互作用等也給基因組設(shè)計(jì)工作引入了更多的挑戰(zhàn)。哺乳動(dòng)物基因組信息量龐大,現(xiàn)有的計(jì)算機(jī)軟件輔助設(shè)計(jì)工具無法滿足合成型哺乳動(dòng)物基因組的設(shè)計(jì),有效的輔助設(shè)計(jì)工具還有待開發(fā)。雖然哺乳動(dòng)物基因組的設(shè)計(jì)面臨諸多挑戰(zhàn),但低等生物基因組的設(shè)計(jì)思路可為高等生物基因組的設(shè)計(jì)提供參考,并隨著高等生物基因組注釋不斷完善以及設(shè)計(jì)合成哺乳動(dòng)物基因組的研究陸續(xù)開展,哺乳動(dòng)物基因組的設(shè)計(jì)將立足于生物醫(yī)學(xué)研究和生物技術(shù)開發(fā)的重要需求朝更具開創(chuàng)性、更多元化的方向發(fā)展。
大片段DNA(百kb 到Mb 級別DNA)組裝技術(shù)是合成基因組學(xué)的核心技術(shù)之一。較小的DNA片段通??梢栽隗w外通過酶切連接、Gibson 組裝等方法進(jìn)行組裝,而高分子量的DNA 分子通常通過同源重組(homologous recombination)在體內(nèi)進(jìn)行組裝。大腸桿菌、枯草芽孢桿菌和釀酒酵母是體內(nèi)DNA 組裝的主要微生物宿主,其中釀酒酵母由于其較高的同源重組能力而成為同時(shí)組裝多個(gè)DNA片段的首選底盤[64]。
革蘭氏陽性細(xì)菌枯草芽孢桿菌(Bacillus subtilis)和革蘭氏陰性細(xì)菌大腸桿菌(E.coli)是許多生物技術(shù)和合成生物學(xué)應(yīng)用中經(jīng)常使用的宿主,可用于組裝DNA。枯草芽孢桿菌是天然的感受態(tài)細(xì)胞,具有吸收外源DNA 的能力[65],可將胞外DNA 轉(zhuǎn)化到細(xì)胞質(zhì)中。然后通過RecA 介導(dǎo)的同源重組將導(dǎo)入的DNA 整合到枯草芽孢桿菌基因組中??莶菅挎邨U菌基因組(B.subtilisgenome,BGM)可直接 作 為DNA 克 隆 的 載 體。2005 年Itaya 等[66]將3.5 Mb 的藍(lán)藻PCC6803 基因組整合到4.2 Mb 的枯草芽孢桿菌基因組上形成一個(gè)7.7 Mb 的雜合基因組。Itaya 等[67]開 發(fā) 了 多 米 諾 骨 牌 法(domino method)組裝技術(shù)進(jìn)一步提高在枯草芽孢桿菌中組裝的可操作性,其通過兩種抗生素標(biāo)記基因的交替使用,在BGM載體中進(jìn)行多輪多米諾片段延伸來組裝超大DNA片段,成功將163 kb的小鼠線粒體基因組和134.5 kb的水稻葉綠體基因組整合到BGM載體上。
大腸桿菌中天然的RecA 重組系統(tǒng)由于效率較低,未被作為組裝工具廣泛使用。1998 年Zhang等[68]引入了λ 噬菌體中λRed 基因,開發(fā)了λRed/ET 重組系統(tǒng),可用于在大腸桿菌中實(shí)現(xiàn)片段、載體以及基因組之間的同源重組。2012年Fu等[69]將Rac噬菌體的RecET 重組系統(tǒng)用于在大腸桿菌中組裝大型DNA 片段,將發(fā)光腸桿菌的所有巨型合成酶基因(每個(gè)長度為10~52 kb)直接克隆到大腸桿菌表達(dá)載體上。λRed 系統(tǒng)更適用于線性和環(huán)狀DNA 分子之間的重組,而Rac RecET 系統(tǒng)更適用于兩個(gè)線性DNA分子之間的重組。
在原核細(xì)胞中組裝的大分子DNA 經(jīng)過擴(kuò)增、提取、純化后,再通過合適的技術(shù)轉(zhuǎn)移至哺乳動(dòng)物細(xì)胞中。
釀酒酵母具有強(qiáng)大的同源重組能力,因此在合成基因組學(xué)為組裝大片段DNA 和分子構(gòu)建的工具被廣泛使用。Gibson 等[70]在釀酒酵母細(xì)胞中將25個(gè)超過20 kb的DNA片段組裝成完整的生殖支原體基因組。人工合成酵母基因組計(jì)劃(Sc2.0)[29]旨在化學(xué)合成世界上首個(gè)真核生物基因組,利用釀酒酵母高效同源重組實(shí)現(xiàn)合成型染色體通過多輪順序迭代替換野生型釀酒酵母染色體。釀酒酵母合成型染色體的構(gòu)建是一個(gè)多層次逐級組裝的過程,首先將化學(xué)合成的單鏈DNA體外組裝為750 bp的雙鏈DNA磚塊(building blocks),接著繼續(xù)在體外進(jìn)一步組裝成2~3 kb 的小模塊(minichunks)或8~10 kb 的大模塊(megachunks),然后一次性將6~12個(gè)模塊導(dǎo)入酵母細(xì)胞中,利用同源重組完成大片段DNA 的組裝同時(shí)替換對應(yīng)的野生型染色體序列。Zhou 等[71]將CRISPR/Cas9 和酵母同源重組結(jié)合開發(fā)了CasHRA 技術(shù)并成功構(gòu)建了1.03 Mb MGE-syn1.0(大腸桿菌最小基因組),CasHRA 通過釀酒酵母原生質(zhì)體轉(zhuǎn)化向釀酒酵母中同時(shí)引入2~3 個(gè)數(shù)十萬堿基對的大型環(huán)狀DNA,之后環(huán)狀DNA 被gRNA-Cas9 蛋白復(fù)合物切割線性化暴露同源臂,最終在酵母體內(nèi)完成組裝。Mitchell 等[72]利用釀酒酵母成功組裝101 kb 人類基因HPRT1,并通過電轉(zhuǎn)將總共114 kb 的YCP 轉(zhuǎn)移至小鼠胚胎干細(xì)胞進(jìn)行基因組位點(diǎn)特異性整合,該研究對在釀酒酵母中DNA 組裝的一些細(xì)節(jié)做了分析,如選擇的目標(biāo)序列的復(fù)雜程度對組裝的影響、合適的同源臂長度、一輪組裝中使用的DNA 片段數(shù)與組裝效率之間的關(guān)系等,可為在釀酒酵母中組裝DNA片段的相關(guān)研究提供參考。Postma等[73]探索在釀酒酵母中組裝的DNA 片段的數(shù)量和大小、效率和保真度等的極限,利用釀酒酵母強(qiáng)大的同源重組能力,可通過一次轉(zhuǎn)化實(shí)現(xiàn)多達(dá)44 個(gè)DNA 片段從頭組裝成50 kb 和100 kb 的模塊化的釀酒酵母人工染色體(yeast artificial chromosome,YAC)。2018 年,Shao 等[74]將釀酒酵母的16 條染色體合成為一條染色體,產(chǎn)生有正常功能的單染色體酵母,證明理論上在釀酒酵母中單條染色體的承載能力可達(dá)12 Mb。在釀酒酵母中,通常具有不少于40 bp 重疊序列的DNA 片段就能被有效連接起來,但釀酒酵母本身對序列的耐受能力、序列的GC 含量和序列的重復(fù)程度都是影響DNA 片段能否正確組裝以及組裝效率的重要因素。在釀酒酵母中組裝細(xì)菌基因組的工作表明[75-76],釀酒酵母可以組裝并維持穩(wěn)定GC 含量在32%~38%之間的細(xì)菌基因組序列,但高GC 含量可能會(huì)限制在酵母中組裝的DNA 的長度[77]。盡管高等哺乳動(dòng)物基因組上均勻分布有能作為酵母復(fù)制起始位點(diǎn)元件的序列,但對于高GC 含量的難以組裝的序列也可以考慮在合成的序列中額外添加釀酒酵母復(fù)制起始位點(diǎn)序列[78],以提高組裝的成功率。在釀酒酵母中組裝的DNA 大分子可通過釀酒酵母原生質(zhì)體與哺乳動(dòng)物細(xì)胞融合的方式直接轉(zhuǎn)移到目的宿主中。
目前釀酒酵母被廣泛用作大片段從頭組裝的工具細(xì)胞,而除了釀酒酵母以及前文提到的可用于組裝的原核細(xì)胞,基因組染色體或合成型染色體上大片段DNA 的敲除(knock-out)或敲入(knock-in)通常在DT40(雞淋巴瘤細(xì)胞)[54,79-82]中完成,如Kuroiwa 團(tuán)隊(duì)截取分別位于3 條人類染色體(chr2、chr14 和chr22)中的抗體基因,在DT40 細(xì)胞中通過Cre/LoxP 系統(tǒng)整合到人工染色體載體上[82],通過微細(xì)胞介導(dǎo)的轉(zhuǎn)移將包含人免疫球蛋白基因座的微染色體轉(zhuǎn)移到小鼠ES細(xì)胞[80]和牛成纖維細(xì)胞中[81],最終構(gòu)建產(chǎn)人源化抗體的小鼠和牛。由于目前DNA 大片段的轉(zhuǎn)移效率普遍較低,因此在選擇和開發(fā)用于DNA 大片段重組的哺乳動(dòng)物的底盤時(shí)需要考慮在哺乳動(dòng)物細(xì)胞中組裝完成的大片段DNA 是否能進(jìn)行有效的轉(zhuǎn)移操作。在DT40 細(xì)胞中操縱后的染色體可通過微細(xì)胞介導(dǎo)的轉(zhuǎn)移技術(shù)(MMCT)轉(zhuǎn)移至目的細(xì)胞。除了DT40 細(xì)胞,中國倉鼠卵巢細(xì)胞系(CHO)也是MMCT技術(shù)常用的供體細(xì)胞,可考慮將其開發(fā)成大片段DNA 重組整合的工具細(xì)胞[79]。相比于其他動(dòng)物細(xì)胞,DT40 細(xì)胞的同源重組能力較強(qiáng),非同源末端 連 接(non-homologous end joining,NHEJ)能力較低[83],有望被開發(fā)成組裝大片段DNA 的動(dòng)物細(xì)胞。
不同于細(xì)胞中天然的DNA,化學(xué)合成的DNA是裸露的DNA,未經(jīng)過表觀遺傳修飾,而細(xì)胞內(nèi)的DNA 會(huì)發(fā)生不同的表觀遺傳修飾。在原核細(xì)胞中,DNA 腺嘌呤甲基化在DNA 復(fù)制、修復(fù)等許多過程中起著至關(guān)重要的作用,由甲基化酶和限制性核酸內(nèi)切酶組成的限制性修飾系統(tǒng)是細(xì)菌進(jìn)化出的對抗病毒侵襲的重要方法。真核細(xì)胞中表觀遺傳修飾比原核細(xì)胞更加復(fù)雜,除了DNA 的修飾還包括組蛋白的修飾,可通過修飾組蛋白調(diào)節(jié)基因表達(dá),在哺乳動(dòng)物細(xì)胞胚胎發(fā)育以及整個(gè)生命過程中起著重要作用[84]。體內(nèi)-體外、供體-受體細(xì)胞中DNA 表觀遺傳修飾的差異可能會(huì)影響合成型基因組的序列穩(wěn)定性與功能實(shí)現(xiàn)。2009 年Lartigue等[85]將從釀酒酵母中組裝的絲狀支原體(Mycoplasma mycoides)完整基因組提取后直接移植到山羊支原體(Mycoplasma capricolum)細(xì)胞后,由于釀酒酵母與支原體表觀遺傳修飾系統(tǒng)不兼容,外源性絲狀支原體基因組會(huì)被限制酶降解,而通過體外供體基因組甲基化或受體細(xì)胞限制酶失活,可避免降解。在酵母、DT40等異源細(xì)胞中組裝完的DNA大分子的表觀遺傳修飾與目的哺乳動(dòng)物細(xì)胞中不同,可能影響合成型哺乳動(dòng)物染色體的穩(wěn)定性與功能。
原核生物如大腸桿菌生長傳代的速度比釀酒酵母稍快,且更利于組裝的DNA 分子的富集、提取純化,但其同源重組的能力遠(yuǎn)不及釀酒酵母,很難一次性組裝數(shù)十個(gè)DNA 片段,且其自身承載外源DNA 大分子的能力也受到很大的限制,不能滿足大片段DNA 組裝的需求。動(dòng)物細(xì)胞的同源重組能力較弱,難以滿足從頭組裝大片段DNA 的需求。目前大片段DNA 的組裝技術(shù)主要依賴釀酒酵母體內(nèi)同源重組,但同源重組利用相同重疊序列來實(shí)現(xiàn)片段之間組裝的原理也導(dǎo)致了該技術(shù)的局限性,即難以有效組裝復(fù)雜的重復(fù)序列。通過前期設(shè)計(jì)避免同源臂區(qū)域出現(xiàn)重復(fù)序列,可一定程度減輕重復(fù)序列對同源重組組裝的干擾,但是對于著絲粒等大段高度重復(fù)區(qū)域,仍缺少有效的組裝方法。大片段DNA 的組裝朝著容量更大、效率更高、成本更低的方向發(fā)展,對于難以用現(xiàn)有組裝方法精確組裝的長片段重復(fù)序列和復(fù)雜的高GC含量序列等還需開發(fā)新方法。
大片段DNA 的高效轉(zhuǎn)移方法是其在目的細(xì)胞發(fā)揮功能的前提和基礎(chǔ)。細(xì)胞膜由磷脂雙分子層和鑲嵌蛋白組成,帶有凈負(fù)電荷,DNA 等大分子無法直接通過。可以借助物理、化學(xué)或生物方法實(shí)現(xiàn)DNA 的轉(zhuǎn)移(表1)。①物理方法:通過電穿孔、基因槍、顯微注射等方法將核酸直接導(dǎo)入細(xì)胞質(zhì)或細(xì)胞核內(nèi)。②化學(xué)方法:使用脂質(zhì)體包裹DNA、PEG 介導(dǎo)等使其能通過細(xì)胞膜。③生物方法:采用經(jīng)過遺傳學(xué)改造的病毒轉(zhuǎn)移非病毒基因至細(xì)胞內(nèi)(又稱為轉(zhuǎn)導(dǎo))、細(xì)胞間融合等(圖3)。
圖3 哺乳動(dòng)物細(xì)胞大片段DNA的轉(zhuǎn)移方法(a)由釀酒酵母組裝的DNA分子在大腸桿菌中富集后提取純化到體外并通過顯微注射、脂質(zhì)體轉(zhuǎn)染、電穿孔轉(zhuǎn)移或病毒介導(dǎo)的轉(zhuǎn)染等方法轉(zhuǎn)移到宿主細(xì)胞中;(b)由釀酒酵母組裝的DNA分子通過PEG介導(dǎo)的酵母原生質(zhì)體與哺乳動(dòng)物細(xì)胞融合轉(zhuǎn)移到宿主細(xì)胞中;(c)在供體細(xì)胞中通過自上而下構(gòu)建的人工染色體以微細(xì)胞介導(dǎo)的染色體轉(zhuǎn)移方式轉(zhuǎn)移到宿主細(xì)胞Fig.3 Method for delivering large fragments of DNA to mammalian cells(a)DNA molecules assembled by S.cerevisiae are enriched in E.coli,extracted and purified in vitro and transferred to host cells by microinjection,lipofection,electroporation,or virus-mediated transduction;(b)DNA molecules assembled by S.cerevisiae are transferred to host cells through the PEG-mediated fusion of yeast protoplasts and mammalian cells;(c)Top-down artificial chromosomes constructed in donor cell are transferred to host cell through the microcell-mediated chromosome transfer
表1 哺乳動(dòng)物細(xì)胞大片段DNA的轉(zhuǎn)移方法Tab.1 Method for delivering large fragments of DNA to mammalian cells
傳統(tǒng)的DNA 轉(zhuǎn)移方法都需要在體外操縱DNA分子,但是大片段DNA 分子受體外操縱的剪切力后極易發(fā)生斷裂,完整性被破壞[96]。目前,針對Mb 級別的DNA 整合,一般通過多次導(dǎo)入來實(shí)現(xiàn),2014 年Murphy 團(tuán)隊(duì)[97-98]通過Velocigen 技術(shù)分9 步將約1 Mb 的人免疫球蛋白重鏈區(qū)敲入小鼠基因座中。但多級組裝費(fèi)時(shí)費(fèi)力效率低,開發(fā)大片段DNA 一次轉(zhuǎn)移的方法可有效解決該問題?;诃傊前窈湍と诤系霓D(zhuǎn)移技術(shù)避免了DNA 的體外直接操縱,理論上能實(shí)現(xiàn)更大尺度的DNA轉(zhuǎn)移。
將大片段DNA 包埋至瓊脂糖中,避免剪切力等外界因素對DNA 完整性的影響,后續(xù)使用脈沖場凝膠電泳分離提純大片段DNA,該方法分離得到的大片段DNA 的純度以及完整性能用于顯微注射等后續(xù)實(shí)驗(yàn)。Lartigue 等[99]使用瓊脂糖包埋方法將1.1 Mb 的Mycoplasma mycoides基因組分離,并通過PEG 介導(dǎo)轉(zhuǎn)移至Mycoplasma capricolum細(xì)胞中。Montoliu 等[100-101]利用瓊脂糖包埋法從釀酒酵母中分離出人工染色體,經(jīng)脈沖場凝膠電泳純化后,將大于300 kb 的DNA 顯微注射至細(xì)胞中。Lee等[102]使用瓊脂糖包埋方法將2.3 Mb的YAC 分離純化,隨后通過聚L-賴氨酸(PLL)或聚乙烯亞胺(PEI)中和DNA 的負(fù)電荷,形成更緊湊的分子,進(jìn)一步避免大片段DNA 受剪切力導(dǎo)致的斷裂,提高其完整性,最終通過脂質(zhì)體轉(zhuǎn)染將DNA引入小鼠胚胎干細(xì)胞。
瓊脂糖包埋法只在分離提純過程中保護(hù)DNA不受剪切力的影響,但是轉(zhuǎn)移還要依賴脂質(zhì)體轉(zhuǎn)染、PEG、顯微注射等技術(shù)工具,受轉(zhuǎn)移方法本身的承載上限以及效率的影響。
微細(xì)胞介導(dǎo)染色體轉(zhuǎn)移(microcell-mediated chromosome transfer,MMCT)技術(shù)[103],是目前較常用的一種染色體轉(zhuǎn)移技術(shù)。MMCT 過程分為三步:①核化,通過有絲分裂抑制劑將攜帶人工染色體的DT40、CHO、A9 細(xì)胞周期同步至M 期;②核去除,通過細(xì)胞松弛素破壞細(xì)胞骨架,密度梯度離心,制備單染色體的微核細(xì)胞;③融合,通過PEG、電融合、仙臺(tái)病毒介導(dǎo),使微核細(xì)胞與目的細(xì)胞融合,完成染色體的轉(zhuǎn)移。雖然MMCT 被廣泛使用,但操作步驟煩瑣,通過PEG介導(dǎo)的MMCT 融合效率極低,一般在10?6~10?5[93,104]。提高微核的生成效率以及微核與目的細(xì)胞的融合效率可以改進(jìn)MMCT 技術(shù)。2016 年Liskovykh 等[105]使 用 TN-16、 Griseofulvin 和Latrunculin B 分別替代Colcemid 和Cytochalasin B破壞細(xì)胞骨架,并在供體細(xì)胞中過表達(dá)Collagen/Laminin促進(jìn)黏附,使MMCT的轉(zhuǎn)移效率提高了近6 倍;2016 年Teruhiko 等[106]在供體細(xì)胞CHO 表達(dá)
鼠類白血病病毒(murine leukemia retroviruses,MLVs)的包膜蛋白(EnvΔR)與目的細(xì)胞膜表面受體蛋白Pit-2(sodium-dependent phosphate transporter)結(jié)合進(jìn)而促進(jìn)膜融合的發(fā)生,使MMCT 的效率提高了26.5倍。
釀酒酵母具有強(qiáng)大的同源重能力,可用于從頭組裝Mb級別的合成型染色體。通過PEG 介導(dǎo)的釀酒酵母原生質(zhì)體-哺乳動(dòng)物細(xì)胞融合能實(shí)現(xiàn)大片段DNA 轉(zhuǎn)移。1993 年Klapholz 等[107]通過PEG 介導(dǎo)的細(xì)胞融合將YAC 轉(zhuǎn)移至哺乳動(dòng)物細(xì)胞,在該過程中釀酒酵母通過酶解去除細(xì)胞壁,形成原生質(zhì)體,在PEG 作用下與目的細(xì)胞發(fā)生膜融合,使YAC 轉(zhuǎn) 移 至 目 的 細(xì) 胞。2013 年Li 等[95,108]通 過PEG 介導(dǎo)的酵母原生質(zhì)體-哺乳動(dòng)物細(xì)胞融合,將在釀酒酵母中組裝的1.4 Mb 大小的人T 細(xì)胞受體基因轉(zhuǎn)移至小鼠胚胎干細(xì)胞,產(chǎn)生人源化T細(xì)胞受體小鼠。但是,PEG 介導(dǎo)的酵母向哺乳動(dòng)物細(xì)胞轉(zhuǎn)移大尺度DNA 效率極低,在10?6~10?5。其低效的原因之一是通過融合轉(zhuǎn)移的大片段DNA 大多數(shù)位于動(dòng)物細(xì)胞質(zhì)中,不能穩(wěn)定到達(dá)細(xì)胞核內(nèi)發(fā)揮功能。為了提高DNA 轉(zhuǎn)移至細(xì)胞核的效率,2017 年Brown 等[94]用秋水仙素、Nocodazole 等有絲分裂微管形成抑制劑處理受體細(xì)胞,使細(xì)胞處于M 期,此時(shí)細(xì)胞核膜消失,融合后細(xì)胞重新進(jìn)入周期,處于胞質(zhì)中的YAC 被新生核膜包裹,進(jìn)入細(xì)胞核內(nèi),轉(zhuǎn)移效率提高了近300倍。目前,通過釀酒酵母原生質(zhì)體-哺乳動(dòng)物細(xì)胞融合技術(shù)轉(zhuǎn)移大片段DNA 的同時(shí),釀酒酵母基因組也會(huì)轉(zhuǎn)移至動(dòng)物細(xì)胞中,并可能發(fā)生隨機(jī)整合,存在對動(dòng)物細(xì)胞基因組造成擾動(dòng)的風(fēng)險(xiǎn)。
綜合比較以上3種方法,MMCT和釀酒酵母原生質(zhì)體-哺乳動(dòng)物細(xì)胞融合過程都需借助PEG,高PEG 濃度和長接觸時(shí)間能顯著提高轉(zhuǎn)移效率,但同時(shí)PEG 對細(xì)胞的毒性增加[94]。由于PEG 介導(dǎo)的融合機(jī)制尚不清楚,無法針對其進(jìn)行有理論指導(dǎo)的改進(jìn)。生理過程中的膜融合例如病毒感染、突觸小泡融合、骨骼肌細(xì)胞的融合、精子-卵子的融合等過程,有望為MMCT 以及釀酒酵母原生質(zhì)體-哺乳動(dòng)物細(xì)胞融合提供理論指導(dǎo)。膜融合介導(dǎo)的轉(zhuǎn)移不僅能繞過DNA 的體外操縱步驟,實(shí)現(xiàn)大片段DNA 的完整轉(zhuǎn)移,更重要的是將從頭合成的合成型動(dòng)物染色體直接轉(zhuǎn)移至目的細(xì)胞,極大簡化了操作步驟。對膜融合介導(dǎo)的轉(zhuǎn)移效率的優(yōu)化研究,有望打通合成型動(dòng)物染色體的合成組裝與功能研究之間的鴻溝,為動(dòng)物合成基因組學(xué)提供關(guān)鍵研究工具。
哺乳動(dòng)物合成基因組學(xué)采用自下而上的策略,引入多元化設(shè)計(jì),以不同于常規(guī)傳統(tǒng)方法的新方式揭示基因功能和調(diào)控以及疾病發(fā)生發(fā)展的機(jī)制。為了更好地了解人類疾病,數(shù)十年來研究者們創(chuàng)建出來多種動(dòng)物模型,基因組改造的范圍從單個(gè)核苷酸、特定氨基酸、單個(gè)外顯子、單基因、多基因、大片段基因座到染色體級。哺乳動(dòng)物大片段DNA 設(shè)計(jì)與操縱可在人類醫(yī)藥健康領(lǐng)域發(fā)揮重要的作用。
合成基因組學(xué)的大片段操縱技術(shù)可為研究人類重要基因及基因異常導(dǎo)致的嚴(yán)重疾病提供技術(shù)支持。編碼人α-珠蛋白和β-珠蛋白兩個(gè)亞基的血紅蛋白基因的異常或缺失會(huì)導(dǎo)致地中海貧血,Suzuki等[109]將包含五個(gè)功能基因(ε、Gγ、Aγ、δ和β)大小約130 kb 的人β-珠蛋白基因簇引入HAC,隨后轉(zhuǎn)移至小鼠胚胎干細(xì)胞中并研究其表達(dá)模式。合成基因組學(xué)的技術(shù)可設(shè)計(jì)α-珠蛋白和β-珠蛋白基因編碼區(qū)域及調(diào)控區(qū)域的變體來替代小鼠和小鼠細(xì)胞系中天然存在的α-球蛋白基因和β-珠蛋白基因,以研究它們對血紅蛋白產(chǎn)生的影響并揭示地中海貧血的致病機(jī)理。相比于傳統(tǒng)的研究方法,設(shè)計(jì)合成的變體可以從新的角度解析致病機(jī)理,同時(shí)為疾病治療提供新思路,并進(jìn)一步使我們對基因表達(dá)的總體調(diào)控方式有所了解。
大片段DNA 操縱技術(shù)還可用于構(gòu)建非整倍體性綜合征模型和染色體大片段變異導(dǎo)致的癌癥模型。21 三體綜合征(Trisomy 21)也稱為唐氏綜合征(Down syndrome),是最常見的染色體異常疾病。O′Doherty 等[110]將幾乎完整的人21 號(hào)染色體轉(zhuǎn)移到小鼠中構(gòu)建出人唐氏綜合征的小鼠模型,以研究非整倍體染色體疾病。大部分癌癥細(xì)胞的基因組呈非整倍性,包括染色體結(jié)構(gòu)與數(shù)目的異常。染色體的不穩(wěn)定性可能在直腸癌等癌癥的發(fā)生發(fā)展中起一定作用[110],通過合成型哺乳動(dòng)物染色體構(gòu)建癌癥模型,可研究癌細(xì)胞中引發(fā)染色體不穩(wěn)定的機(jī)制以及基因組的非整倍體異常如何促進(jìn)癌癥的發(fā)展。
大片段操縱技術(shù)不僅能構(gòu)建動(dòng)物模型,而且有望在已經(jīng)明確致病機(jī)制的多基因遺傳病和涉及大片段基因區(qū)域的疾病的治療中發(fā)揮作用。2010 年Oshimura團(tuán)隊(duì)[111]將大小約2.4 Mb的肌營養(yǎng)不良蛋白基因完整序列引入至人工染色體載體上,通過MMCT轉(zhuǎn)移至杜氏肌肉營養(yǎng)不良(Duchenne muscular dystrophy,DMD)模型小鼠和人類DMD患者的誘導(dǎo)性多能干細(xì)胞(iPS)中,糾正了由肌營養(yǎng)不良蛋白的缺失或突變引發(fā)的疾病表型。
將Mb 級別的人免疫球蛋白基因序列引入小鼠中,為研究人免疫反應(yīng)、開發(fā)單克隆抗體提供模型。20 世紀(jì)90 年代,多個(gè)團(tuán)隊(duì)將人免疫球蛋白基因座整合至小鼠基因組上[112-118],培育出能夠產(chǎn)生人免疫球蛋白的小鼠,這些人源化抗體小鼠模型是藥物研發(fā)領(lǐng)域的重要進(jìn)步,但是第1代人源化抗體小鼠主要有3個(gè)問題:①隨機(jī)插入引起基因組不穩(wěn)定,人免疫球蛋白基因區(qū)域中的調(diào)控序列與宿主自身調(diào)控分子相互作用弱,導(dǎo)致其B細(xì)胞的發(fā)育和功能受損;②人源化抗體恒定區(qū)與小鼠B細(xì)胞受體相互作用受損,影響B(tài)細(xì)胞譜系發(fā)育;③全人源化抗體與Fc 受體結(jié)合能力受損,導(dǎo)致親和選擇下降和抗體血清濃度降低。這三個(gè)問題都可以通過免疫球蛋白基因的原位替換來解決。2014 年Murphy 團(tuán)隊(duì)[97-98]使用同源重組技術(shù),Bradley 團(tuán)隊(duì)[63]使用重組酶介導(dǎo)的盒式交換技術(shù),均在mES細(xì)胞中實(shí)現(xiàn)了Mb 級別的原位迭代替換,培育出第2 代人源化抗體小鼠。與第1 代人源化抗體小鼠不同,這些小鼠的B細(xì)胞發(fā)育以及免疫系統(tǒng)均沒有損傷,這些新的小鼠模型為治療性抗體的發(fā)現(xiàn)提供了強(qiáng)大的通用平臺(tái)。與引入天然的免疫球蛋白基因序列不同,2021 年Xu 等[119]從羊駝、單峰駝、駱駝中選出并合成30 個(gè)VHHs 基因片段,通過CRISPR/Cas9 技術(shù)替換約2.5 Mb 的小鼠免疫球蛋白重鏈V 基因區(qū),生成能產(chǎn)生駝科納米抗體的納米小鼠(nanomouse),并能產(chǎn)生針對SARS-CoV-2的納米抗體,展現(xiàn)出重新設(shè)計(jì)免疫球蛋白基因座的獨(dú)特優(yōu)勢重要應(yīng)用價(jià)值。
此外,將人免疫球蛋白基因引入牛等大型哺乳動(dòng)物中,可快速、高效、大量生產(chǎn)針對未知病毒(新抗原)的人源化抗體,在突發(fā)性疾病預(yù)防上具有獨(dú)特的應(yīng)用前景。2002 年Kuroiwa 團(tuán)隊(duì)[81]構(gòu)建了包含人免疫球蛋白重鏈和λ鏈的人工染色體載體,之后通過MMCT、體細(xì)胞核移植,培育出表達(dá)人源化抗體的牛,但是牛源抗體仍然占主要部分。將人源免疫球蛋白基因調(diào)控區(qū)域替換成牛源序列能夠大幅提高人源化抗體的產(chǎn)量。2013 年Kuroiwa 等[82]將人抗體重鏈基因恒定區(qū)替換為牛源恒定區(qū),人源抗體量最高可達(dá)9 g/L。隨后,2015 年Kuroiwa 等[120]將人源免疫球蛋白基因類型轉(zhuǎn)換元件換成牛源序列,全人源抗體平均產(chǎn)量為5 g/L,最高可達(dá)15 g/L。2016年,針對中東呼吸綜合征(MERS),SAB公司利用人源抗體牛生產(chǎn)全人源化IgG,最高可達(dá)15 g/L[121-122]。2018 年,該研究已經(jīng)進(jìn)行健康志愿者人體實(shí)驗(yàn),有望在未來進(jìn)入臨床試驗(yàn)[123]。
異種器官移植有望解決器官短缺的重大醫(yī)學(xué)問題。2017 年,Yang 等[124]通過CRISPR/Cas9 基因編輯技術(shù)失活了豬原代細(xì)胞中所有的25 個(gè)豬內(nèi)源性逆轉(zhuǎn)錄病毒(porcine endogenous retroviruses,PERVs)基因,并通過體細(xì)胞核移植,最終培育出內(nèi)源性逆轉(zhuǎn)錄病毒失活的豬。2019年Yang團(tuán)隊(duì)[125]使CRISPR/Cas9 和轉(zhuǎn)座子系統(tǒng)在42 個(gè)等位基因上設(shè)計(jì)改造豬基因組,并生產(chǎn)了無內(nèi)源性逆轉(zhuǎn)錄病毒、異種抗原基因敲除且攜帶9個(gè)抗免疫排斥功能人源基因的轉(zhuǎn)基因豬。利用大片段DNA 操縱技術(shù)構(gòu)建抗免疫排斥人源化染色體,結(jié)合高效的內(nèi)源基因組編輯技術(shù),有望加速異種器官移植的研究。
由于物種之間的差異,小鼠、大鼠等動(dòng)物模型無法真實(shí)反映人體相關(guān)代謝情況,可以通過引入完整的人源代謝通路,實(shí)現(xiàn)在人源化的動(dòng)物模型中模擬人體環(huán)境進(jìn)行相關(guān)研究。完整的人源代謝通路往往包含較大的基因組區(qū)域,或涉及多個(gè)位點(diǎn)的大片段基因,很難通過常規(guī)技術(shù)將完整的人源代謝通路引入小鼠中。哺乳動(dòng)物細(xì)胞大片段DNA 操縱技術(shù)的發(fā)展可為人源代謝通路的引入提供技術(shù)支持。2013 年Oshimura 團(tuán)隊(duì)[126]以自上而下構(gòu)建的微染色體為載體將大小約700 kb 的天然人源CYP3A(cytochrome P450 family 3 subfamily A)基因區(qū)域引入小鼠中,構(gòu)建人源化動(dòng)物模型。CYP3A 基因編碼參與藥物代謝的酶,并與大約50%的市售藥物的代謝有關(guān)[127],人源化的CYP3A模型動(dòng)物可用于預(yù)測CYP3A 相關(guān)的藥代動(dòng)力學(xué)和新藥在人體內(nèi)的毒性。2019 年Kazuki 團(tuán)隊(duì)[128]將UGT2(UDP glucuronosyltransferase family 2)的編碼基因區(qū)域(約1.5 Mb)引入大鼠中,構(gòu)建了人源化藥物糖基化代謝模型動(dòng)物。
設(shè)計(jì)和操縱哺乳動(dòng)物大片段DNA 在多基因以及染色體疾病的研究上有獨(dú)特的優(yōu)勢。將多個(gè)功能相關(guān)基因成簇化排列,設(shè)計(jì)合成有特定功能的大型DNA 區(qū)域,一步直接改造目的細(xì)胞,將避免分步改造操作煩瑣、效率低等問題;承載大片段DNA 的合成型哺乳動(dòng)物染色體不僅能用來構(gòu)建疾病模型,結(jié)合干細(xì)胞治療技術(shù),有望用于臨床上治療復(fù)雜遺傳性疾病。
在哺乳動(dòng)物細(xì)胞中設(shè)計(jì)與操縱大片段DNA 具有重要的科學(xué)意義,對高等哺乳動(dòng)物基因組的設(shè)計(jì)再造將推動(dòng)對高等生物的理解,在人類醫(yī)學(xué)健康領(lǐng)域具有廣闊的運(yùn)用前景。包括設(shè)計(jì)-組裝-轉(zhuǎn)移在內(nèi)的大片段DNA 操縱技術(shù)是哺乳動(dòng)物合成基因組學(xué)研究的基礎(chǔ)。與現(xiàn)有微生物合成基因組學(xué)領(lǐng)域相比,多細(xì)胞真核水平的動(dòng)物合成基因組學(xué)在設(shè)計(jì)和操縱上仍具有挑戰(zhàn)。
當(dāng)前,哺乳動(dòng)物基因組設(shè)計(jì)的挑戰(zhàn)主要體現(xiàn)在由于對基因組解析不夠完善,基因組的復(fù)雜性如精密的基因時(shí)空調(diào)控系統(tǒng)、基因間相互作用網(wǎng)絡(luò)、表觀遺傳調(diào)控、細(xì)胞間相互作用、多細(xì)胞發(fā)育等,設(shè)計(jì)再造哺乳動(dòng)物基因組向更大尺度的進(jìn)展受到阻礙。利用計(jì)算機(jī)輔助基因組設(shè)計(jì),并隨著ENCODE、GWAS 等基因組注釋項(xiàng)目的不斷推進(jìn),未來哺乳動(dòng)物合成基因組學(xué)可進(jìn)一步實(shí)現(xiàn)更大尺度的、更加多元化的設(shè)計(jì),在更深入理解哺乳動(dòng)物基因組的同時(shí)提供新的見解,進(jìn)一步揭示高等真核生物基因組的奧秘。著絲粒是合成型哺乳動(dòng)物染色體在細(xì)胞內(nèi)穩(wěn)定存在及正確分配的保障,目前新型合成型著絲??梢岳@過傳統(tǒng)合成型著絲粒對天然微衛(wèi)星序列以及CENP-B結(jié)合序列的需要,為哺乳動(dòng)物染色體著絲粒序列研究提供了一個(gè)新思路。
依托現(xiàn)有的技術(shù),能初步實(shí)現(xiàn)大片段DNA 的組裝、轉(zhuǎn)移,但存在操作難、效率低的問題。大片段DNA 的組裝主要依靠釀酒酵母細(xì)胞內(nèi)的同源重組,對于難以組裝的復(fù)雜序列目前仍沒有有效的方法精準(zhǔn)組裝,Mb 級別DNA 難以快速高效組裝?,F(xiàn)有的DNA 大片段組裝主要基于技術(shù)相對成熟的釀酒酵母同源重組,但復(fù)雜的DNA 序列,尤其是高等哺乳動(dòng)物細(xì)胞中常見的高度重復(fù)序列在釀酒酵母細(xì)胞中存在不穩(wěn)定現(xiàn)象,限制了酵母組裝在哺乳動(dòng)物基因組學(xué)中的應(yīng)用。開發(fā)新的組裝底盤以及調(diào)控釀酒酵母同源重組,使其在完成高效組裝的同時(shí)又能穩(wěn)定高度重復(fù)序列,是DNA 大片段組裝技術(shù)發(fā)展方向之一。大片段DNA 的跨物種轉(zhuǎn)移技術(shù)是哺乳動(dòng)物合成基因組學(xué)研究中的重大挑戰(zhàn),需在體外純化DNA 的轉(zhuǎn)移技術(shù)因大片段DNA 的不穩(wěn)定而受到限制,大片段DNA 細(xì)胞間轉(zhuǎn)移技術(shù)如MMCT、釀酒酵母原生質(zhì)體融合等都有較大的使用局限性,如MMCT 技術(shù)只能將DT40、A9 等能形成微核的細(xì)胞中的人工染色體轉(zhuǎn)移到哺乳動(dòng)物細(xì)胞中,而釀酒酵母原生質(zhì)體融合方法轉(zhuǎn)移的大片段DNA 通常只能是在釀酒酵母細(xì)胞中能被成功組裝、在釀酒酵母細(xì)胞中能穩(wěn)定存在的序列,因此該方法不適用于轉(zhuǎn)移自上而下截短的染色體?;瘜W(xué)、材料等學(xué)科的發(fā)展為經(jīng)純化過的DNA 向細(xì)胞內(nèi)的轉(zhuǎn)移提供新載體工具,對生理過程中膜融合現(xiàn)象的研究能為細(xì)胞間轉(zhuǎn)移提供新思路。此外,由于哺乳動(dòng)物細(xì)胞較低等生物細(xì)胞更為復(fù)雜,在其中操縱大片段DNA 可能導(dǎo)致許多與預(yù)期不同的結(jié)果,如編輯過程中的脫靶效應(yīng)、大片段的意外刪除或重排等,因此在哺乳動(dòng)物細(xì)胞中快速找到并修正這些與預(yù)期不同的錯(cuò)誤也是操縱工作的一大難點(diǎn)。需技術(shù)的進(jìn)一步優(yōu)化和開發(fā)推動(dòng)領(lǐng)域的發(fā)展。相關(guān)技術(shù)以及新成果的不斷涌現(xiàn),可為大片段DNA 在哺乳動(dòng)物細(xì)胞中的設(shè)計(jì)和操縱提供參考。
對于大片段DNA 在哺乳動(dòng)物細(xì)胞中的存在形式,除了設(shè)計(jì)獨(dú)立于哺乳動(dòng)物基因組的合成型染色體,設(shè)計(jì)構(gòu)建大片段DNA 整合到哺乳動(dòng)物細(xì)胞基因組上也是在哺乳動(dòng)物細(xì)胞中操縱大片段DNA的一個(gè)重要策略。整合策略可根據(jù)研究內(nèi)容的具體需求進(jìn)行非特異性整合或位點(diǎn)特異性原位整合,且整合到宿主基因組后引入的大片段DNA 能像內(nèi)源DNA 一樣穩(wěn)定存在。而獨(dú)立于宿主基因組的合成型染色體相比于將大片段整合到基因組上能很大程度地減少對宿主基因組的擾動(dòng),此外利用合成型染色體策略的瓶頸主要為轉(zhuǎn)移步驟,而大片段整合策略的效率除受到轉(zhuǎn)移步驟的制約外還受到大片段DNA 整合到基因組上效率的制約,綜合來看兩種存在形式的策略各有利弊。對基因組大尺度的改造還應(yīng)考慮到對后續(xù)研究如表觀遺傳調(diào)控、發(fā)育生物學(xué)等的影響。
哺乳動(dòng)物合成基因組學(xué)處于發(fā)展的初期,雖然哺乳動(dòng)物細(xì)胞中大片段DNA“設(shè)計(jì)-組裝-轉(zhuǎn)移”的技術(shù)路線仍充滿挑戰(zhàn),但技術(shù)難題正逐個(gè)被攻破。哺乳動(dòng)物合成基因組學(xué)自下而上的研究在染色體疾病模型構(gòu)建、異種器官移植、人源化免疫系統(tǒng)構(gòu)建等研究領(lǐng)域具有重要應(yīng)用??梢灶A(yù)見,隨著哺乳動(dòng)物合成基因組學(xué)的發(fā)展,對高等生命系統(tǒng)的理解和認(rèn)識(shí)將進(jìn)一步加深,并為人類醫(yī)藥健康做出貢獻(xiàn)。