秦子陽(yáng)
(四川省成都市郫都區(qū)嘉祥外國(guó)語(yǔ)學(xué)校,四川 成都 610000)
基因是在DNA 上具有遺傳信息的片段,所以基因的結(jié)構(gòu)和DNA 一樣,基因也是由四種堿基(ATCG)所對(duì)應(yīng)的脫氧核糖核苷酸組成的。這四種脫氧核糖核酸可以組成一條單鏈,再和另外一條互補(bǔ)鏈組成雙鏈結(jié)構(gòu)。DNA 最大的特點(diǎn)之一便是半保留復(fù)制,意思是在復(fù)制的時(shí)候,雙鏈解開,其他的游離的脫氧核苷酸以其中一條母鏈為模板進(jìn)行復(fù)制,半保留復(fù)制這個(gè)特點(diǎn)有著很重要的意義[1]。
2.1 焦磷酸(一代)測(cè)序基本原理及測(cè)序儀。Sanger 法是1977 年由Sanger 發(fā)明的,也是在第 一代測(cè)序技術(shù)中被應(yīng)用最多的技術(shù)。其測(cè)序的基本原理是,在DNA 合成的體系中加入雙脫氧核糖核酸(ddNTP)。當(dāng)雙脫氧核糖核酸和DNA 鏈結(jié)合的時(shí)候,就不會(huì)形成磷酸二酯鍵,所以反應(yīng)就終止了,因此形成了很多的DNA 模板[2]。每一個(gè)雙脫氧核糖核酸上面有一定的放射性標(biāo)記,而且每一個(gè)都不一樣,然后通過(guò)凝膠電泳,檢測(cè)放射性同位素的標(biāo)記,然后我們就可以通過(guò)分析來(lái)確定各個(gè)位點(diǎn)上所對(duì)應(yīng)的堿基。該測(cè)序技術(shù)代表性DNA 測(cè)序儀器為:毛細(xì)管測(cè)序儀。
2.2 第二代測(cè)序基本原理及測(cè)序儀。由于第一代測(cè)序技術(shù)的優(yōu)化與發(fā)展是建立在 Sanger 法的原理之上,所以測(cè)序中的電泳過(guò)程始終 是限制第一代測(cè)序技術(shù)效率的瓶頸。第二代測(cè)序 技術(shù)又稱下一代測(cè)序(next-generation sequencing,NGS)技術(shù),是對(duì)第一代測(cè)序技術(shù)的劃時(shí)代變革[3]。
第二代測(cè)序儀先通過(guò)物理或者化學(xué)的方法將DNA 打碎成小片段(分子量片段大小為200-500bp),然后在這些DNA 片段上面添加接頭,形成了DNA 文庫(kù)。然后在flowcell 中引物會(huì)和樣品DNA 中的接頭結(jié)合,將其固定在通道的表面,形成bridge[4-5]。然后通過(guò)橋式PCR 擴(kuò)增,可以增強(qiáng)堿基的信號(hào)強(qiáng)度。在橋式PCR 擴(kuò)增中,因?yàn)樵? 端的羥基有特殊的保護(hù),所以每次只能添加一個(gè)dNTP,然后其他的DNA 鏈就會(huì)被洗掉,只留下這一條鏈。然后再加入緩沖液來(lái)激發(fā)熒光,再通過(guò)光學(xué)儀器捕捉光學(xué)信號(hào),然后把信號(hào)傳輸?shù)接?jì)算機(jī)里,計(jì)算機(jī)就可以把光學(xué)信號(hào)轉(zhuǎn)化為堿基的序列。該DNA 測(cè)序技術(shù)代表性測(cè)序儀為:①焦磷酸測(cè)序:454 測(cè)序儀、Ion Torrent/Proton 等;②新一代SBS:Illumina、BGISEQ-500、Max-Seq、LaserGen;③連接測(cè)序:solid。
2.3 第三代測(cè)序基本原理及測(cè)序儀。雖然第二代測(cè)序技術(shù)已經(jīng)得到了廣泛的應(yīng)用,并在各技術(shù)方面趨于成熟,但是無(wú)法避免的是在必要的流程上,如PCR 擴(kuò)增、熒光分析等方 面,帶來(lái)的成本和效率限制以及不可避免的系統(tǒng)誤差。第三代測(cè)序技術(shù),又被成為“下、下一代測(cè)序”,基于單分子讀取技術(shù),不需要PCR 擴(kuò)增,具有巨大的應(yīng)用前景。
Pacbio:在DNA 合成的體系中,加入DNA 聚合酶,然后DNA 聚合酶就會(huì)捕獲這些DNA 模板,將其束縛在零模波導(dǎo)孔中,再加入dNTP,隨著不同的堿基進(jìn)入,就會(huì)發(fā)出不同的熒光,通過(guò)分析光的波長(zhǎng)和峰值就可以判斷這個(gè)堿基的類型Nanopore:納米孔技術(shù)主要是用了電信號(hào)來(lái)判斷堿基類型。當(dāng)DNA 堿基通過(guò)納米孔的時(shí)候,他們會(huì)使電荷發(fā)生變化,從而短暫的影響通過(guò)納米孔的電流強(qiáng)度,因?yàn)槊恳环N堿基所造成的電流變化的幅度不同,所以通過(guò)電子設(shè)備來(lái)檢測(cè)這個(gè)差異就可以從中分析通過(guò)的堿基是哪一種[6-7]。
3.1 點(diǎn)測(cè)序(PCR 擴(kuò)增原理和方法)。點(diǎn)測(cè)序是專門專注于某個(gè)片段的測(cè)序方法。而這種方法就需要用的PCR 擴(kuò)增方法。PCR 擴(kuò)增是通過(guò)模擬體內(nèi)的環(huán)境,使DNA 片段在體外進(jìn)行指數(shù)bei7 的擴(kuò)增。當(dāng)DNA 被提取出來(lái)以后,被放入熱循環(huán)儀里進(jìn)行擴(kuò)增,同時(shí)需要的還有dNTP,DNA 聚合酶,引物,以及鎂離子。
PCR 擴(kuò)增主要有三個(gè)步驟:變性,退火,延伸。當(dāng)DNA 被加熱到大約93-95 度時(shí),DNA 的雙鏈會(huì)解開,形成兩條DNA 模板。在下一個(gè)步驟退火的時(shí)候,溫度大約會(huì)降至比變性溫度低25 度的溫度,這個(gè)時(shí)候引物會(huì)以DNA 母鏈為模板進(jìn)行互補(bǔ)配對(duì)結(jié)合。在延伸的階段時(shí),dNTP 會(huì)在DNA 聚合酶的作用下合成新的互補(bǔ)鏈,通過(guò)多次重復(fù)以上的操作,DNA 會(huì)在體外呈指數(shù)倍擴(kuò)增。
3.2 靶區(qū)域測(cè)序。靶區(qū)域測(cè)序是對(duì)一個(gè)較大的區(qū)域或者幾個(gè)不同的基因組區(qū)域進(jìn)行測(cè)序的方法,也是屬于DNA 捕獲(DNA capture)的方法。這種技術(shù)就是把基因組的DNA隨機(jī)打斷成小片段,然后再片段的兩頭加上特異性接頭,然后芯片上的特異性結(jié)構(gòu)和接頭連接后,就會(huì)連在一起,然后對(duì)他們進(jìn)行洗脫,把最后得到的再拼接起來(lái),這就是靶區(qū)域測(cè)序。
3.3 全基因組測(cè)序。全基因組測(cè)序是將DNA 模板隨機(jī)打斷,然后將所有片段的序列整體組裝成為一個(gè)整個(gè)的基因組的序列。
3.4 Indexing 測(cè)序。Index 是像一個(gè)標(biāo)簽,他對(duì)每一個(gè)測(cè)試的個(gè)體,每一個(gè)序列上面都要加上一個(gè)標(biāo)簽,每次測(cè)完之后,這種標(biāo)簽可以把每一個(gè)樣本相互區(qū)分開,再通過(guò)其他方法去掉標(biāo)簽。
隨著科技水平的持續(xù)進(jìn)步,DNA 測(cè)序技術(shù)的發(fā)展呈現(xiàn)出加速趨勢(shì),不斷地從物理學(xué)、光學(xué)、電學(xué)等領(lǐng)域借鑒最新的發(fā)明技術(shù)來(lái)滿足生物領(lǐng)域?qū)y(cè)序技術(shù)日益提高的要求[8-9]。當(dāng)然,DNA 測(cè)序技術(shù)也在逐步擴(kuò)展其應(yīng)用領(lǐng)域,在目的DNA片段被鑒定出來(lái)后及時(shí)地進(jìn)行測(cè)序,有助于進(jìn)一步深入研究的開展。
各類的測(cè)序儀產(chǎn)生的大量數(shù)據(jù)也給研究人員帶來(lái)困難。一方面,測(cè)序儀產(chǎn)生的數(shù)據(jù)量很大,研究人員需要掌握生物信息學(xué)的相關(guān)技術(shù),并且懂得如何對(duì)數(shù)據(jù)進(jìn)行分類儲(chǔ)存整理,才能有可能挖掘出原始測(cè)序結(jié)果背后潛在的意義。而通常對(duì)測(cè)序結(jié)果進(jìn)行分析的工作是由負(fù)責(zé)測(cè)序的生物公司進(jìn)行的。另一方面,測(cè)序儀生產(chǎn)商只提供了特定的測(cè)序結(jié)果處理軟件,并未有其他下游的生物學(xué)信息分析軟件可以選擇[10-11]。如何建立標(biāo)準(zhǔn)化的測(cè)序信息分析軟件是亟需待解決的問(wèn)題。相信隨著DNA 測(cè)序技術(shù)的不斷完善,各類的測(cè)序儀之間也會(huì)建立統(tǒng)一的測(cè)序標(biāo)準(zhǔn)。