彭凱,逯曉云,程健,劉瑩,江會鋒,郭曉賢
(1 中國科學(xué)院天津工業(yè)生物技術(shù)研究所系統(tǒng)微生物工程重點(diǎn)實(shí)驗(yàn)室,天津 300308;2 天津科技大學(xué)生物工程學(xué)院,天津 300457)
合成生物學(xué)是繼DNA 雙螺旋發(fā)現(xiàn)催生分子生物學(xué),“人類基因組計(jì)劃”實(shí)施催生基因組學(xué)后的第三次生物技術(shù)革命。DNA 合成技術(shù)是合成生物學(xué)的核心使能技術(shù)之一。隨著我們對生命系統(tǒng)認(rèn)識的深入,生命體系的重新設(shè)計(jì)和創(chuàng)造已成為生物學(xué)領(lǐng)域最富想象力和活力的研究領(lǐng)域。大規(guī)?;蚪MDNA 設(shè)計(jì)和合成賦予我們改造細(xì)胞功能甚至創(chuàng)造人工生命的能力,有助于提高我們對生命體的理解、預(yù)測和操控的能力[1-5]。
自20 世紀(jì)50 年代以來,大量科研工作者嘗試通過化學(xué)和酶促方法合成DNA。首先獲得成功的是化學(xué)合成技術(shù)。經(jīng)過多年優(yōu)化和改進(jìn),DNA 化學(xué)合成經(jīng)歷了從柱式合成到芯片合成的變革發(fā)展,并得到了廣泛的市場化應(yīng)用。但是現(xiàn)有化學(xué)方法的偶聯(lián)效率和副反應(yīng)使寡核苷酸合成長度局限于200~300 nt,難以到達(dá) kb 級的基因長度[6-8]。因此更長片段則需通過組裝技術(shù)拼接寡核苷酸片段,直至獲得基因、染色體或基因組長度的DNA[9]。然而,寡核苷酸片段合成和DNA 組裝過程會產(chǎn)生很多錯(cuò)誤,降低長片段DNA 的正確率。糾錯(cuò)技術(shù)的應(yīng)用可去除DNA 合成和組裝過程引入的大量錯(cuò)誤,進(jìn)而降低正確DNA 片段的篩選與測序成本[10]。本文作者將重點(diǎn)綜述DNA 合成、組裝與糾錯(cuò)技術(shù)相關(guān)的研究進(jìn)展,以此期望促進(jìn)我國DNA合成相關(guān)技術(shù)創(chuàng)新發(fā)展。
寡核苷酸的化學(xué)合成始于20 世紀(jì)50 年代,于80 年代開發(fā)出亞磷酰胺三酯化學(xué)合成法[11],并應(yīng)用于柱式合成,在90 年代又應(yīng)用到基于芯片的高通量合成技術(shù)中[12]。亞磷酰胺三酯合成法由脫保護(hù)(deprotection)、偶聯(lián)(coupling)、加帽(capping)和氧化(oxidation)四步化學(xué)反應(yīng)組成循環(huán),通過分步活化結(jié)合在核苷酸3'位和5'位的化學(xué)活性保護(hù)基團(tuán)實(shí)現(xiàn)可控合成,在固相載體上從3'到5'方向逐個(gè)延伸合成寡核苷酸鏈[13](圖1)。
圖1 固相亞磷酰胺寡核苷酸合成反應(yīng)循環(huán)Fig.1 Reaction cycle for solid-phase phosphoramidite synthesis of oligonucleotide
基于亞磷酰胺三酯合成法的柱式DNA 合成技術(shù),以填充多孔玻璃(controlled pore glass,CPG)或聚苯乙烯(polystyrene,PS)篩板的合成柱作為固相載體,帶保護(hù)的單體經(jīng)過化學(xué)試劑分步活化被逐個(gè)按序添加到固定在合成柱的引發(fā)劑上。目前商品化的柱式DNA合成反應(yīng)偶聯(lián)效率可達(dá)98%~99.8%,錯(cuò)誤率約為1/600 nt,產(chǎn)量一般在1 μmol以內(nèi),單個(gè)循環(huán)耗時(shí)6~8 min。權(quán)衡效率與成本后最長合成長度通??刂圃?00 nt 左右[14]。若將合成柱固定到多孔裝載板上,單輪合成通量可提高到1536 根,平均偶聯(lián)效率為99.5%,錯(cuò)誤率約1.53/717 nt,成本大約 0.277美分/堿基[15]。
柱式DNA 合成技術(shù)發(fā)展至今,自動化合成設(shè)備成熟。能夠方便、靈活地提取用于合成某段基因所需的任意寡核苷酸片段,滿足一般實(shí)驗(yàn)的要求。隨著合成生物學(xué)領(lǐng)域?qū)Υ笠?guī)?;蚝突蚪M合成需求的日益高漲,柱式合成持續(xù)合成能力弱、化學(xué)試劑耗費(fèi)大、副反應(yīng)多、通量低等不足也日益凸顯[14]。為突破低效率、低通量、高成本的限制,尋求DNA 合成技術(shù)持續(xù)發(fā)展的研究主要致力于:①開發(fā)具備高反應(yīng)通量、多重功能的集成芯片作為固相載體,并行合成寡核苷酸;②開發(fā)基于無模板單鏈DNA合成的酶促寡核苷酸合成技術(shù)。
芯片可作為DNA 合成固相載體,以高密度、集成方式在其表面特定位點(diǎn)上進(jìn)行合成反應(yīng),從而在節(jié)省試劑的同時(shí)實(shí)現(xiàn)高通量合成。芯片DNA合成技術(shù)仍以亞磷酰胺合成法四步反應(yīng)循環(huán)為基礎(chǔ),但采用不同的“脫保護(hù)”定點(diǎn)控制方法,分別發(fā)展出了光刻合成、電化學(xué)合成和噴墨打印合成等DNA合成平臺[12]。
最早出現(xiàn)的光刻合成通過精確控制光在芯片表面指定位點(diǎn)的投射,分解光敏保護(hù)基團(tuán)或光敏催化劑產(chǎn)酸進(jìn)行脫保護(hù),實(shí)現(xiàn)核苷酸在不同合成位點(diǎn)的有序添加。根據(jù)光照控制方式又分為掩模光刻合成[16-17](為Affymetrix 采用)與無掩模光刻合成[18-20](為 NimbleGen 和 LC Sciences 采用)。電化學(xué)合成利用電化學(xué)反應(yīng)產(chǎn)生酸,控制聚合物膜上常規(guī)亞磷酰胺單體的加成[21],被CustomArray(已被Genscript收購)所采用。Agilent的噴墨打印合成則通過將酸溶液或試劑噴射在反應(yīng)位點(diǎn)催化脫保護(hù)[22-23]。
芯片DNA 合成的通量高,通過精密的自動化控制,芯片上單個(gè)微反應(yīng)室能以皮升級的反應(yīng)體系進(jìn)行合成反應(yīng)。不同芯片合成通量在3×103~3×106之間,合成密度在 105~106/cm2,成本低至0.001~0.1 美分/堿基。與柱式合成相比,在進(jìn)行大規(guī)模基因合成時(shí),芯片合成法占有絕對優(yōu)勢。但芯片制作工藝復(fù)雜,隨著合成密度的增加,對芯片生產(chǎn)技術(shù)以及合成儀的自動化控制技術(shù)要求也高。此外,芯片合成還存在由定點(diǎn)錯(cuò)位或試劑隔離不良而產(chǎn)生“邊緣效應(yīng)”、脫保護(hù)反應(yīng)不徹底、脫嘌呤等副反應(yīng)多的問題[6]。這些因素直接影響合成序列的完整性和正確性,使DNA 芯片合成的效率在90%~99%,合成長度限制在25~200 nt。芯片單個(gè)微量反應(yīng)體系合成的寡核苷酸產(chǎn)量低(約為10-15mol),錯(cuò)誤率也高于柱式合成,難以單獨(dú)分離純化。因此,不適用于單基因或小規(guī)模的基因、常規(guī)探針以及引物合成。
DNA 化學(xué)合成中大量使用有毒、易燃且不穩(wěn)定的有機(jī)試劑,環(huán)境友好度低,因而生物合成又重新受到人們的關(guān)注。常規(guī)的DNA 聚合酶具有模板依賴性,無法用于DNA 的從頭合成。尋找非模板依賴性的DNA合成酶成為酶法DNA合成技術(shù)開發(fā)的首要任務(wù)。此外,使酶在受控條件下逐個(gè)添加指定的核苷酸是酶促寡核苷酸合成技術(shù)的另一挑戰(zhàn)[24]。
Mackey 和 Gilham[25]使 用 核 苷 酸磷 酸 化 酶(PNPase)將引入2'末端封閉的5'-二磷酸-2'-O-(α-甲氧基乙基)核苷酸偶聯(lián)到寡腺苷酸引物的3'末端,定序合成了寡聚核糖核苷酸鏈。Gillam 和Smith[26]采用相同的方法合成了寡聚脫氧核糖核苷酸鏈。England 和 Uhlenbeck[27]則是首先將連接法用于 DNA 合成,使用 T4 RNA 連接酶將 5',3'-核糖核苷二磷酸底物偶聯(lián)到引發(fā)鏈的3'末端合成寡核糖核苷酸鏈。1999 年,T4 RNA 連接酶首次被用于固相酶法 DNA 合成[28]。盡管 PNPase 和 T4 RNA 連接酶能夠合成RNA 和DNA,但兩者偶聯(lián)效率低,單輪循環(huán)耗時(shí)長,用于DNA 合成技術(shù)的局限性大于可用性[29]。
Bollum 首先發(fā)現(xiàn)末端脫氧核苷酸轉(zhuǎn)移酶(TdT)[30],并于 1962 年提出 TdT 可用于單鏈寡核苷酸合成[31]。1984 年,Schott 和 Schrade 用 TdT 將dNTPs 添加到不同長度的引發(fā)鏈[32]。研究發(fā)現(xiàn)TdT 對四種核苷酸的偏好性差異小、偶聯(lián)效率高,持續(xù)合成和延伸單鏈DNA 可產(chǎn)生長達(dá)8000 nt的均聚物[29-30,33-34]。TdT用于可控酶促DNA合成還需有效的可逆終止方法。使用帶有阻斷基團(tuán)的RT-dNTP(RT 為可逆終止子,可在 dNTP 的 3'-OH 或其他位置)為底物[35],通過偶聯(lián)-去阻斷兩步循環(huán)迭代,有望將TdT 用于長鏈寡核苷酸的定序合成[24]。具有開發(fā)潛力的阻斷基團(tuán)包括氨基、烯丙基、磷酸基團(tuán)、2-硝基芐基、3'-O-(2-氰乙基)等[29]。2018 年,Keasling 團(tuán)隊(duì)[8]另辟蹊徑在單分子TdT上用可裂解接頭連接單個(gè)核苷酸,利用TdT將核苷酸添加到引物鏈后仍保持與DNA 鏈的連接,有效地阻止DNA 鏈的進(jìn)一步延伸(圖2)。裂解接頭釋放TdT 后,DNA 即可重新進(jìn)行新一輪的核苷酸添加循環(huán)。該方法平均偶聯(lián)效率可達(dá)97.7%,單個(gè)循環(huán)僅需2~3 min。最近,DNA script公司通過TdT 改造結(jié)合阻斷基團(tuán)宣稱通過酶法以高達(dá)99.5%的偶聯(lián)效率合成了長達(dá)280nt 的寡核苷酸。而Camena Bioscience 所宣傳的酶法DNA 合成技術(shù)gSynth 的偶聯(lián)效率更高達(dá)99.9%。同時(shí),gSynth在合成300 nt寡核苷酸片段時(shí),產(chǎn)物中全長序列比例達(dá)到了85.3%,遠(yuǎn)高于亞磷酰胺合成法的22.7%。雖然酶法DNA 合成技術(shù)至今還未見商業(yè)化,但從其所具有的潛力可以預(yù)見酶法DNA 合成技術(shù)將引領(lǐng)新一輪的DNA合成技術(shù)革命。
圖2 TdT-dNTP 交聯(lián)體介導(dǎo)的可逆終止用于寡核苷酸合成循環(huán)Fig.2 The oligo synthesis cycle by TdT-dNTP conjugates mediated reversible termination
酶作為酶促DNA 合成的關(guān)鍵分子機(jī)器,控制聚合物的形成。因此,酶促合成技術(shù)的特征與酶功能緊密相關(guān)。酶的聚合方式和反應(yīng)條件溫和的特點(diǎn),使基于酶促的偶聯(lián)-去阻斷兩步法循環(huán)更為簡單,并能有效減少合成過程中發(fā)生的DNA 損傷和副反應(yīng),有持續(xù)合成更長的寡核苷酸片段的潛力?,F(xiàn)在DNA 酶促合成技術(shù)處于快速發(fā)展期,合成過程還存在諸多亟待解決的問題。包括天然酶對修飾RT-dNTP 的摻入效率低、阻斷基團(tuán)的去除、合成無法從頭起始或需要一定長度的引發(fā)鏈(如TdT,>3 nt)等。這些問題的核心在于對酶分子機(jī)器功能的設(shè)計(jì)改造和控制策略的開發(fā)。通過挖掘新酶、改造酶、研制人工酶等方法提升DNA 合成酶的功能,以高效摻入RT-dNTP;開發(fā)新的可控策略適應(yīng)酶促合成自動化,如通過精細(xì)控制輔因子來控制酶活,以提高可控合成效率和長度,也將有助于推動酶促DNA合成的應(yīng)用。
DNA 的化學(xué)和酶促合成技術(shù)的就是根據(jù)人為指定的核酸序列,通過相應(yīng)的合成規(guī)則(形成3',5'-磷酸二酯鍵)從頭將核苷酸聚合成寡核苷酸片段。實(shí)際得到商業(yè)化應(yīng)用的DNA 合成技術(shù)仍限于上述提到的幾種。影響這些技術(shù)市場化的因素有多種,其中兩個(gè)主要的技術(shù)評估指標(biāo)是:可控和效率。無模板DNA 合成技術(shù)的關(guān)鍵在于可控地逐個(gè)添加核苷酸,從而延伸多聚核苷酸鏈。理論上,當(dāng)單個(gè)核苷酸實(shí)現(xiàn)了可控添加時(shí),則全序列即可實(shí)現(xiàn)可控合成。在實(shí)現(xiàn)可控合成循環(huán)后,合成效率和偶聯(lián)效率將是DNA 合成技術(shù)是否具有產(chǎn)業(yè)化價(jià)值的另一評估指標(biāo)。合成效率反映在添加單個(gè)核苷酸添加循環(huán)所耗費(fèi)的時(shí)間(t),柱式法合成一條長度為xnt 的寡核苷酸合成所需總時(shí)間T=t×(x?1)。偶聯(lián)效率則是100 nt 的寡核苷酸分子中的1 個(gè)在偶聯(lián)步驟期間不能反應(yīng)的概率,可被表述為99%的偶聯(lián)效率(CE),則全長產(chǎn)物(FLP)=(CE)n,其中n是循環(huán)迭代次數(shù)(n=x?1)。例如,具有99%CE 的合成200 nt鏈,單循環(huán)為8 min,理論上在1592 min 后產(chǎn)物中只有13%的FLP,87%的為短鏈或其他錯(cuò)誤鏈。這兩個(gè)效率與寡核苷酸合成成本緊密相關(guān),也影響更長片段合成的組裝和檢測篩選過程的耗費(fèi)。
目前DNA 片段從頭合成的長度有限,更長的基因或基因組則需要通過寡核苷酸片段的酶促組裝或體內(nèi)組裝獲得。通常使用的寡核苷酸組裝方法有兩種:連接酶組裝法(ligase chain reaction,LCR) 和聚合酶組裝法(polymerase cycling assembly, PCA)[6]。連接酶組裝法通過DNA 連接酶將首尾相連、重疊雜交的5'磷酸化寡核苷酸片段連接成雙鏈DNA。聚合酶組裝法則利用DNA 聚合酶延伸雜交的重疊寡核苷酸片段獲得不同長度的混合物,最后用引物擴(kuò)增出成功組裝的全長片段(圖3)。PCA 具有良好的兼容性,也被應(yīng)用于芯片合成的寡核苷酸組裝[36-37]。
為了提高基因合成通量并降低成本,整合了合成和組裝的微型化和自動化基因合成技術(shù)也取得了新進(jìn)展。2011 年,Tian 等[38]開發(fā)了一種采用多功能芯片和組合酶技術(shù)的基因合成方法,將整個(gè)基因合成過程從寡核苷酸庫合成、庫擴(kuò)增、糾錯(cuò)到基因組裝等所有步驟整合到同一塊芯片上,中途無需更換反應(yīng)體系,極大地簡化了基因合成流程。Twist Bioscience 公司以Agilent 的寡核苷酸原位合成技術(shù)為基礎(chǔ),開發(fā)了一套對接式硅片反應(yīng)器用于自動化基因合成。整合了合成和組裝的酶促基因合成技術(shù)也取得了新進(jìn)展。據(jù)報(bào)道,gSynth 酶法DNA 合成技術(shù)通過合成與組裝的循環(huán)實(shí)現(xiàn)了2.7 kb的pUC19質(zhì)粒的從頭合成。
對于寡核苷酸組裝后雙鏈DNA 的進(jìn)一步拼接,早期的方法依靠限制性內(nèi)切酶產(chǎn)生的黏性末端來串聯(lián)DNA 片段。由此發(fā)展出來的有BioBrick與BglBrick 系統(tǒng)以及采用ⅡS 型限制性內(nèi)切酶切割產(chǎn)生黏性末端實(shí)現(xiàn)組裝的Golden Gate 技術(shù)[39](圖3)。但序列依賴性和DNA 殘痕的引入以及煩瑣的操作過程限制了這類方法的應(yīng)用。利用核酸外切酶、DNA 聚合酶與連接酶的單獨(dú)或協(xié)同作用開發(fā)的組裝方法則擺脫了對限制性內(nèi)切酶的依賴。這類方法通過產(chǎn)生同源單鏈互補(bǔ)末端進(jìn)行組裝,包括 SLⅠC[40]、SLiCE[41]、LCR[42]、CPEC[43]和Gibson 組裝[44](圖3)等多種高效簡單的組裝方法。其中Gibson 組裝通過體外一步拼接可以無縫組裝長達(dá)幾十萬堿基對的基因組水平的片段。
圖3 常見體外和體內(nèi)DNA組裝技術(shù)及流程Fig.3 Summary of general schemes of in vitro and in vivo DNA assembly
隨著片段長度的增加,DNA 在體外很容易受常規(guī)操作影響而變得不穩(wěn)定,超過20 kb 片段的拼接更多借助生物體內(nèi)的重組系統(tǒng)進(jìn)行(圖3)。大腸桿菌、枯草芽孢桿菌和釀酒酵母是體內(nèi)DNA 長片段組裝的主要宿主細(xì)胞[45],經(jīng)重組系統(tǒng)與細(xì)菌人工染色體(BAC)[46]、枯草芽孢桿菌基因組(BGM)[47]或酵母人工染色體(YAC)[48]重組后,這些宿主細(xì)胞可穩(wěn)定攜帶大片段DNA,其中BGM具有超過3 Mb 的克隆能力[49]。相較于大腸桿菌和枯草芽孢桿菌,釀酒酵母擁有更高的同源重組率,對長片段的兼容性好,是同時(shí)裝配多個(gè)DNA 片段的首選底盤,基于該系統(tǒng)開發(fā)的應(yīng)用方法也更多[50-52]。Gibson 等[53]在釀酒酵母中一步裝配 25 個(gè)DNA 片段,形成一個(gè)長592 kb 的環(huán)狀支原體基因組。中國科學(xué)院的研究人員甚至將接近12 Mb的釀酒酵母完整基因組拼接成單一的染色體[54]。
現(xiàn)有DNA合成技術(shù)的局限,使DNA組裝成為基因合成不可或缺的過程。組裝過程受連接效率和拼接次數(shù)影響顯著。使用短初始片段組裝染色體或基因組長度DNA 所需的分層組裝次數(shù)較多,過程中所需的克隆挑選和測序等質(zhì)控成本也會相應(yīng)增多。此外,組裝技術(shù)仍面臨著一系列問題,需要進(jìn)一步克服聚合序列、長重復(fù)序列和非規(guī)范的DNA 結(jié)構(gòu)對組裝的抑制作用,開發(fā)能穩(wěn)定得到全長無差錯(cuò)遺傳系統(tǒng)的載體等。組裝工藝優(yōu)化或新組裝技術(shù)的開發(fā)有待于對上述組裝影響因素的微觀認(rèn)識和有效控制。通過計(jì)算機(jī)算法對影響組裝的問題序列進(jìn)行拆分和序列轉(zhuǎn)換,發(fā)展智能組裝技術(shù),將有助于解決復(fù)雜長片段DNA 的組裝難題。具有低成本、自動化和一體化特性的微流控組裝體系將成為寡核苷酸體外合成和組裝整合平臺開發(fā)的方向;而擁有高效重組系統(tǒng)新宿主的篩選與應(yīng)用將為DNA體內(nèi)組裝提供更多的選項(xiàng)。
寡核苷酸合成與酶促組裝過程都不可避免地產(chǎn)生多種類型的錯(cuò)誤。常見的錯(cuò)誤包括核苷酸的插入、缺失和取代。糾錯(cuò)技術(shù)的使用可有效地去除不同類型的錯(cuò)誤從而提高合成產(chǎn)物的正確率[55]。
經(jīng)化學(xué)合成的寡核苷酸鏈含有大量錯(cuò)誤,對這樣的寡核苷酸池的糾錯(cuò)過程主要根據(jù)合成錯(cuò)誤造成的分子量或基團(tuán)的差異進(jìn)行分離純化。如對柱式合成可通過高效液相色譜法(HPLC)[56]、聚丙烯酰胺凝膠電泳(PAGE)[57]或疏水性純化柱過濾[10]去除合成不完全的片段。這些方法通量低,對錯(cuò)誤區(qū)分精確度有限,分離過程損失較大。芯片合成寡核苷酸的糾錯(cuò)可通過直接與序列正確的寡核苷酸捕獲探針進(jìn)行雜交選擇[37],或是Tm均一化(熱力學(xué)參數(shù))嚴(yán)格雜交篩選手段[58],過濾寡核苷酸池中的錯(cuò)誤片段。Evonetix 的DNA 合成平臺則通過對溫度的控制將合成、組裝、糾錯(cuò)進(jìn)行整合,其糾錯(cuò)過程由精確的溫度控制去除非完全匹配的DNA 鏈。還可以使用NGS 技術(shù)糾錯(cuò),結(jié)合DNA 芯片合成與高通量測序平臺,將合成、組裝、測序糾錯(cuò)一體化[59]。
經(jīng)互補(bǔ)配對后的雙鏈DNA片段的核苷酸插入、缺失、取代錯(cuò)誤主要表現(xiàn)為錯(cuò)配和凸起等,這些錯(cuò)誤的去除更多是借助基于生物體內(nèi)的DNA 修復(fù)體系開發(fā)出的DNA 酶促糾錯(cuò)技術(shù)[60-61]。通過對互補(bǔ)序列退火,暴露出錯(cuò)配信號,再利用具有錯(cuò)配結(jié)合或錯(cuò)配切割活性的酶對DNA 雙鏈糾錯(cuò)(圖4),從而富集正確序列[10,55]。
圖4 基于錯(cuò)配切割和錯(cuò)配結(jié)合的糾錯(cuò)策略Fig.4 Strategies for error-removal based on mismatch cleavage and mismatch binding
參與DNA修復(fù)的錯(cuò)配結(jié)合酶MutS及其同源蛋白可以識別并結(jié)合各種含錯(cuò)配堿基與單鏈環(huán)的DNA[62-63],然后可通過凝膠電泳、毛細(xì)管電泳、親和磁珠或吸附樹脂等方法使MutS 結(jié)合含錯(cuò)配的異源雙鏈與未被結(jié)合的同質(zhì)雙鏈分離。這樣兩輪重復(fù)后,可將錯(cuò)誤率降低到1/10 kb,與傳統(tǒng)的基因合成技術(shù)相比錯(cuò)誤降低超過15 倍[64-65]。針對錯(cuò)配結(jié)合酶MutS 的工程改造,在提其高穩(wěn)定性的同時(shí)也有助于市場化應(yīng)用[66]。對于錯(cuò)誤率高的寡核苷酸池,Binkowski 等[67]利用 MutS 進(jìn)一步開發(fā)了同序改組法,通過引入限制性內(nèi)切酶對DNA 雙鏈進(jìn)行片段化,使得MutS 不需要去除整條錯(cuò)誤的雙鏈DNA,從而保留大量含有正確序列的短片段,最后通過OE-PCR 組裝回收全長序列。測試發(fā)現(xiàn)3.5 kb 的片段經(jīng)過兩輪同序改組后錯(cuò)誤率降低至1/3.5 kb,正確率提高了3.5~4.3倍。MutS糾錯(cuò)方法本質(zhì)是對含錯(cuò)DNA 雙鏈的物理分離。為保證MutS處理后樣品中有足夠的正確片段,寡核苷酸池中需要有相當(dāng)一部分序列正確的片段。
運(yùn)用錯(cuò)配切割酶能達(dá)到在原處理池中糾正錯(cuò)誤的目的。錯(cuò)配切割酶是識別DNA 雙鏈錯(cuò)配位點(diǎn)并在錯(cuò)配位點(diǎn)附近切割的一組錯(cuò)配特異性核酸內(nèi)切酶。主要包括識別單堿基錯(cuò)配的核酸內(nèi)切酶和單鏈特異性核酸酶[68-70],這些酶與聚合酶共同作用,利用具有核酸外切酶活性的聚合酶水解切割錯(cuò)誤區(qū)域,然后通過OE-PCR 組裝回收全長序列。這種方法可以消除單堿基水平的錯(cuò)誤,同時(shí)保留大部分序列正確的區(qū)域,并且可以進(jìn)行多次“糾錯(cuò)-組裝”循環(huán),直到獲得所需純度的產(chǎn)品。T4 核酸內(nèi)切酶Ⅶ,T7 核酸內(nèi)切酶Ⅰ和E.coli核酸內(nèi)切酶Ⅴ等可識別并切割雙鏈DNA 中單堿基錯(cuò)配、單核苷酸凸起等類型的錯(cuò)誤,能有效減少合成基因產(chǎn)物中錯(cuò)配、缺失和插入等錯(cuò)誤[69,71-73]。單鏈特異性核酸酶中CEL 可在中性pH 值下特異性切割不同類型的堿基錯(cuò)配和DNA 畸變[74-76]。在芯片的基因合成糾錯(cuò)中結(jié)合使用CEL 核酸酶可以將合成基因產(chǎn)物的錯(cuò)誤率從1/526 bp減少到1/3883 bp。兩次酶解錯(cuò)誤切割反應(yīng)可進(jìn)一步將錯(cuò)誤率降低至1/8700 bp,錯(cuò)誤減少了16倍以上[77]。
現(xiàn)有DNA 糾錯(cuò)方法大部分還停留在對含錯(cuò)片段的去除,開發(fā)基于錯(cuò)配切除并對錯(cuò)誤進(jìn)行修復(fù)的糾錯(cuò)方法有望顛覆傳統(tǒng)的糾錯(cuò)技術(shù)。錯(cuò)配修復(fù)需要正確的模板鏈,體內(nèi)的錯(cuò)配修復(fù)系統(tǒng)通過甲基化修飾區(qū)分模板鏈與新合成子鏈,并根據(jù)模板鏈來修復(fù)新合成鏈上的錯(cuò)誤。借鑒類似的原理在體外區(qū)分正確片段與待修復(fù)片段,在此基礎(chǔ)上識別錯(cuò)誤并對錯(cuò)誤區(qū)域進(jìn)行單鏈切割,進(jìn)而以正確片段為模板修復(fù)錯(cuò)誤。以此開發(fā)的糾錯(cuò)技術(shù)將擺脫傳統(tǒng)糾錯(cuò)技術(shù)的局限,實(shí)現(xiàn)真正的體外DNA糾錯(cuò)。
寡核苷酸合成、組裝與糾錯(cuò)三個(gè)過程的核心目標(biāo)都是核酸。從單核苷酸到寡核苷酸,從短片段到長片段,從高錯(cuò)誤率到低錯(cuò)誤率的目標(biāo),最終獲得準(zhǔn)確序列的長片段DNA。通過不同的酶分子機(jī)器來實(shí)現(xiàn)各過程的目標(biāo),進(jìn)而相互補(bǔ)充以達(dá)到更高目標(biāo)。在以酶為核心的DNA 酶促合成中,酶作為實(shí)際過程的首要執(zhí)行者,其功能直接影響最終產(chǎn)物的質(zhì)量。然而用于不同階段的酶分子機(jī)器在反應(yīng)機(jī)制和控制技術(shù)上差異巨大。自然界篩選獲得的酶分子機(jī)器又無法直接滿足DNA 合成應(yīng)用的需求,這就要求我們對相應(yīng)的酶進(jìn)行改造。按設(shè)計(jì)方法去找尋甚至設(shè)計(jì)新酶,或依賴酶去設(shè)計(jì)新方法這兩種方案的精細(xì)化控制,也將伴隨著其他技術(shù)的進(jìn)步,成為高效DNA合成的重要方法。
近年來,DNA 合成、組裝與錯(cuò)誤糾正技術(shù)的不斷發(fā)展,使染色體或基因組的合成、人工設(shè)計(jì)基因組的創(chuàng)造、可控細(xì)胞工廠與人工生物的構(gòu)建都成為可能[78-82]。這些研究也推動了合成生物學(xué)的快速發(fā)展,其中,設(shè)計(jì)構(gòu)建新功能基因、遺傳網(wǎng)絡(luò)甚至基因組,以實(shí)現(xiàn)從頭合成、按需合成和生物大分子的定向改造的時(shí)代已經(jīng)到來。各界對高效保真的DNA 合成技術(shù),高通量的組裝與錯(cuò)誤校正體系開發(fā)等基因合成相關(guān)技術(shù)的需求更為強(qiáng)烈。DNA 合成技術(shù)在生物醫(yī)療、生物制造、DNA 存儲等諸多領(lǐng)域具有廣闊應(yīng)用前景與巨大的市場潛力[83-84],預(yù)計(jì) 2030 年全球 DNA 合成市場將增長到1.6萬億美元。然而2018年11月,合成生物學(xué)被美國列為擬限制出口的前沿生物技術(shù)領(lǐng)域之一,高性能DNA 合成儀已禁止向中國銷售,這將嚴(yán)重影響我國合成生物學(xué)的健康發(fā)展。因此,推動DNA合成、組裝、糾錯(cuò)等技術(shù)的發(fā)展,開發(fā)長片段高效無差錯(cuò)的微量DNA 合成技術(shù),利用計(jì)算機(jī)設(shè)計(jì)序列優(yōu)化組裝過程,結(jié)合酶促或NGS 測序技術(shù)開發(fā)DNA 合成糾錯(cuò)平臺,以綠色、高通量、自動化和一體化的方式低成本高質(zhì)量地合成DNA,實(shí)現(xiàn)大規(guī)?;蚝突蚪M合成,具有重要科學(xué)意義和重大應(yīng)用價(jià)值。