陳新周 王明珠 何丹 周慧 林方欣 李粉霞★
·論著·
微陣列比較基因組雜交技術(shù)與二代基因測序檢測拷貝數(shù)變異的對比
陳新周1王明珠2何丹1周慧1林方欣1李粉霞2★
目的對比分析微陣列比較基因組雜交技術(shù)(array?based comparative genomic hybridiza?tion,aCGH)和第二代基因測序技術(shù)(nextgeneration sequencing,NGS)在基因組拷貝數(shù)變異(copy number variation,CNV)上的一致性,為臨床檢測CNV提供新的檢測方法。方法提取15例流產(chǎn)組織臨床樣本的基因組DNA,然后分別使用aCGH和NGS 2種方法對上述DNA進(jìn)行檢測,分析對比每個樣本的CNV的數(shù)目。結(jié)果aCGH共檢測到CNV數(shù)有109個,最小的片段有16 kb,最大的片段有34Mb,其中小于200 kb的有20個,大于200 kb小于1Mb的有34個,大于1Mb小于5Mb的有26個,大于5Mb小于34Mb的有29個。NGS共檢出68個CNV,其中小于200 kb的有3個,檢出率為15.0%;大于200 kb小于1Mb的有22個,檢出率為64.7%;大于1Mb小于5 Mb的有20個,檢出率為76.9%;大于5 Mb小于34Mb的有29個,檢出率為100.0%。結(jié)論對于目前的數(shù)據(jù)量來說,NGS在檢測大于5Mb的大片段CNV上檢出率較高,與aCGH具有一定的一致性,可以應(yīng)用于流產(chǎn)組織中CNV的檢測。對于小片段的CNV的檢測,需要增加相應(yīng)的讀取的數(shù)據(jù)量進(jìn)行檢測。
基因組拷貝數(shù)變異;第二代基因測序;微陣列比較基因組雜交技術(shù)
自然流產(chǎn)(spontaneous abortion,SA)在妊娠中的發(fā)生率為10%~15%[1]。孕12周之前的流產(chǎn)稱為早期SA。與同一配偶發(fā)生連續(xù)2次或多次SA稱為復(fù)發(fā)性流產(chǎn)。早期SA的病因復(fù)雜,50%以上的胚胎是由染色體異常造成的,染色體異常包括染色體數(shù)目異常,如單體、三體、多倍體;結(jié)構(gòu)異常,如斷裂、缺失、易位等。發(fā)生SA時的孕周越短,染色體異常的可能性越大。
拷貝數(shù)變異(copy number variation,CNV)指人類基因組中廣泛存在的缺失、插入、重復(fù)和復(fù)雜位點的變異,長度為1 kb以上,突變率遠(yuǎn)高于單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)。越來越多的研究表明[2?3],CNV與許多疾病有著密切的聯(lián)系,在許多遺傳疾病中扮演著重要的角色,特別是癌癥、精神分裂等疾病,引起了研究者們的廣泛興趣。隨著技術(shù)的發(fā)展,芯片技術(shù)[微陣列比較基因組雜交技術(shù)(array?based comparative genom ic hybridiza?tion,aCGH)或單核苷酸多態(tài)性微陣列技術(shù)(array single nucleotide polymorphism,SNP array)]也成為最近幾年新興的一種檢測方法,能將檢出率提高,不過受限于其技術(shù)原理,芯片探針無法覆蓋的染色體區(qū)段將無法檢測,這也限制發(fā)現(xiàn)新的染色體畸變,進(jìn)而限制了發(fā)現(xiàn)新的染色體疾病的可能。然而高通量測序技術(shù)的迅猛發(fā)展,使得測序技術(shù)用于染色體拷貝數(shù)變異(CNV)檢測的優(yōu)越性越來越明顯。本研究將通過aCGH和NGS 2種方法對流產(chǎn)組織CNV的檢測,探討NGS能否作為新的CNV的檢測方法。
1.1 研究對象
研究對象為15例流產(chǎn)組織臨床樣本。
1.2 試劑
提取DNA所用的QIAamp?DNA M ini Kit試劑盒購自于德國QIAGEN公司,aCGH試劑盒購自于美國Agilent公司,NGS所用的建庫試劑盒,模板制備試劑盒,測序試劑盒均購自于美國Life Technology公司。
1.3 儀器
aCGH芯片掃描儀SureScan M icroarray Scanner由美國Agilent公司研制。NGS使用的2100生物分析儀由美國Agilent公司研制,Ion One Touch 2和Ion One TouchTMES由美國Life公司研制,DA8600基因測序儀由中山大學(xué)達(dá)安基因股份有限公司提供。
1.4 方法
1.4.1 aCGH檢測CNV
1.4.1.1 gDNA的提取
按照QIAamp?DNA M ini Kit說明書進(jìn)行g(shù)DNA提取。
1.4.1.2 aCGH芯片上機(jī)前處理
將提取的DNA與試劑盒提供的reference進(jìn)行片段化和隨機(jī)擴(kuò)增,然后使用Cy3和Cy5 2種染料標(biāo)記DNA,并純化標(biāo)記后的DNA,使用NanoDrop 2000 UV?VIS分光光度計來檢測并計算產(chǎn)量與比活度,只有產(chǎn)量和比活度符合要求后才能進(jìn)行下一步的雜交。將符合要求的DNA加入到試劑盒提供的雜交室中,封閉雜交室并放入雜交箱中進(jìn)行雜交。
1.4.1.3 上機(jī)檢測
將芯片從雜交室中取出,并用純水和試劑盒提供的Wash Buffer進(jìn)行清洗,清洗后使用SureS?can M icroarray Scanner進(jìn)行芯片的掃描,掃描后的圖片結(jié)果可以使用Agilent公司提供的Agilent CytoGenom ics Edition軟件進(jìn)行分析。
1.4.2 NGS檢測CNV
1.4.2.1 gDNA的提取
按照QIAamp?DNA M ini Kit說明書進(jìn)行g(shù)DNA提取。
1.4.2.2 構(gòu)建上機(jī)文庫
將提取的gDNA按照文庫構(gòu)建試劑盒進(jìn)行文庫構(gòu)建。首先DNA片段末端的補(bǔ)平,然后加上末端接頭,最后PCR擴(kuò)增DNA片段。擴(kuò)增完后需要對所構(gòu)建的文庫進(jìn)行檢測,用Qubit檢測DNA濃度,用生物分析儀檢測片段長度。
1.4.2.3 DA8600上機(jī)測序
上機(jī)測序前,需要制備上機(jī)模板,并將模板進(jìn)行富集。將DA8600進(jìn)行清洗,先氯洗后再進(jìn)行水洗,清洗完后將儀器初始化并設(shè)置上機(jī)Plan。芯
片上機(jī)前需要進(jìn)行清洗和校準(zhǔn),校準(zhǔn)完才能進(jìn)行上機(jī)測序。上機(jī)測序結(jié)果可以在DA8600服務(wù)器上查看,利用染色體非整倍體檢測數(shù)據(jù)分析系統(tǒng)進(jìn)行數(shù)據(jù)分析,得到每個測序樣本的Z值,根據(jù)參考范圍進(jìn)行結(jié)果判斷。
2.1 實驗結(jié)果
2種實驗的結(jié)果都可以通過檢測的log2ratio值的大小來判斷染色體的拷貝數(shù)變異,圖1為隨機(jī)選取實驗中一個樣本的2號染色體2種結(jié)果的對比圖,圖1a為aCGH結(jié)果,圖1b為NGS的檢測結(jié)果。2個結(jié)果中都顯示出該樣本的2號染色體在2q37.1q37.3(232,612,296?242,690,037)片段缺失,如圖中藍(lán)色箭頭所示。
本次研究中,aCGH共檢測到CNV數(shù)有109個,最小的片段有16 kb,最大的片段有34 Mb,其中小于200 kb的有20個,大于200 kb小于1 Mb的有34個,大于1Mb小于5Mb的有26個,大于5Mb的有29個。NGS的檢測是共有74個CNV,其中小于200 kb的有3個,檢出率為15.0%;大于200 kb小于1 Mb的有22個,檢出率為64.7%;大于1Mb小于5Mb的有20個,檢出率為76.9%;大于5Mb小于34Mb的有29個,檢出率為100.0%,見表1所示。
表1 aCGH與NGS的檢測染色體拷貝數(shù)變異結(jié)果對比Table 1 Comparison of chromosomal copy number variants analysis by aCGH and NGS
遺傳變異是生命進(jìn)化演變的基本特征。從細(xì)胞遺傳學(xué)水平看,DNA的變異主要包括染色體數(shù)目的變異和染色體結(jié)構(gòu)的變異。數(shù)目變異包括染色體組成倍地增加或減少,以及單條染色體的增加或減少;結(jié)構(gòu)變異主要指染色體片段的重復(fù)、缺失、倒位和易位等[4]。這些變異均會產(chǎn)生相應(yīng)的遺傳學(xué)效應(yīng),可能會導(dǎo)致變異個體表型發(fā)生嚴(yán)重改變,甚至死亡,也可能會發(fā)生現(xiàn)在未知的或許良性的改變。隨著檢測技術(shù)方法的不斷發(fā)展,從染色體核型分析到原位熒光雜交,芯片到測序技術(shù)的使用,使得對染色體識別精確率逐步提高[5]。
染色體非整倍體改變?nèi)匀皇橇鳟a(chǎn)胚胎的主要因素,集中在13、14、15、16、18、21、22號染色體,X單體也是早期流產(chǎn)常見的染色體核型[6]。雙重三體較少見,約占流產(chǎn)胚胎所有核型的0.21%~2.8%[7]。
本研究中的15例流產(chǎn)物中,aCGH與NGS檢出9例異常,異常率60%,與以往報道的異常率55%~66%[8]和51%[9]基本相符。15例流產(chǎn)物檢測中,測序顯示多態(tài)4例,還有2例檢測陽性查詢后顯示致病性未知,而這些都是流產(chǎn)物中檢出的,多態(tài)是否有致病效應(yīng)存在一定爭議,在公共數(shù)據(jù)庫中查出致病性未知的這一部分是需要更多的經(jīng)驗積累,更進(jìn)一步地研究這些多態(tài)和致病性間的關(guān)系。但從我們的結(jié)果可以看出,以目前的數(shù)據(jù)量來說,高通量測序技術(shù)相對于芯片方法來說,小片段的拷貝數(shù)變化并不能全部得到檢測,但是大于5Mb的片段的檢出率為100%。若相應(yīng)的增加數(shù)據(jù)量,應(yīng)該會達(dá)到更大的分辨率,這一點我們也會繼續(xù)進(jìn)行驗證。
從對操作要求上來看,與已成相當(dāng)規(guī)模的芯片雜交技術(shù)相比,NGS也有其獨到的優(yōu)勢,在DNA質(zhì)量的要求上,NGS對DNA的質(zhì)量要求不
高,很低的濃度便可以滿足實驗的要求。而aCGH對于DNA的質(zhì)量和純度的要求都很高,如本次使用的安捷倫公司的芯片對于DNA濃度的要求需要在40 ng/μL,這就增加了對樣本的要求。
本研究中用的測序方法是單端測序,則該測序方法與aCGH方法均不能解決平衡性的易位、倒位、整倍體等問題。而有研究表明隨著測序讀長的不斷增加,NGS通過mate?pair文庫或稱跨步文庫可能實現(xiàn)平衡易位的檢測[10],不久的將來平衡異位可通過測序進(jìn)行檢測,這一個難點的突破將大大的提高測序的價值與意義,將會成為NGS最大的優(yōu)勢。NGS還有其他的優(yōu)勢,如其可以檢測新的未知基因變異,同時因其可能更為低廉的高通量優(yōu)勢成本而利于臨床推廣;此外,與腫瘤發(fā)生相關(guān)基因的拷貝數(shù)變異和基因多態(tài)性分析等都有著足夠應(yīng)用的空間和優(yōu)勢[11?12]。
隨著測序技術(shù)的不斷發(fā)展和廣泛運用,從產(chǎn)前診斷的游離DNA的測序[13?14],到流產(chǎn)物、羊水的測序CNV檢測,到用母體外周血測序測胎兒CNV檢測、單基因疾病檢測,到單細(xì)胞植入前診斷測序檢測、腫瘤游離DNA檢測等廣泛運用[15],測序技術(shù)用于流產(chǎn)物分析既可較為全面得出導(dǎo)致流產(chǎn)的遺傳物質(zhì)的改變原因,又可積累新染色體疾病的發(fā)現(xiàn),還可用于生殖領(lǐng)域的促進(jìn),分析流產(chǎn)原因,測序技術(shù)用于胚胎植入前遺傳學(xué)篩查(preimplantation ge?netic screening,PGS)可有效提高成功率[16?17]。
綜上所述,對于較大片段的拷貝數(shù)變化的檢測,NGS技術(shù)和aCGH技術(shù)的診斷成功率及染色體異常檢出率均較高,在早期SA妊娠物核型分析中具有顯著優(yōu)越性,可作為遺傳學(xué)檢測的一種補(bǔ)充技術(shù),也可為流產(chǎn)夫婦進(jìn)行遺傳學(xué)病因分析,從而為再次妊娠提供指導(dǎo),有較高的臨床應(yīng)用價值。
[1]殷研.孕婦營養(yǎng)狀況與枯萎卵妊娠關(guān)系的研究[D].北京:中國協(xié)和醫(yī)科大學(xué),2008,8-9.
[2]盧永娟,王瑞,倪華美,等.拷貝數(shù)變異(CNVs)導(dǎo)致遺傳變異的研究進(jìn)展[J].黑龍江畜牧獸醫(yī),2015,21:58-60,63.
[3]馬天駿,鄧禎祥,陳詩哲,等.DNA拷貝數(shù)變異及其研究進(jìn)展[J].中華臨床醫(yī)師雜志:電子版,2013,7(14):6592-6595.
[4]夏家輝.醫(yī)學(xué)遺傳學(xué)[M].北京:人民衛(wèi)生出版社,2004,166.
[5]眭維國,歐明林,戴勇,等.先天性疾病研究及產(chǎn)前診斷中Array CGH的應(yīng)用[J].國際婦產(chǎn)科學(xué)雜志,2010,37(2):81-83.
[6]Stephenson MD,Awartani KA,Robinson WP.Cyto?genetic analysis of miscarriages from couples w ith re?currentmiscarriage:a case?control study[J].Hum Re?prod,2002,17(2):446-451.
[7]Diego?Alvarez D,Ramos?Corrales C,Garcia?Hoyos M,et al.Double trisomy in spontaneousmiscarriages:cytogenetic and molecular approach[J].Hum Reprod,2006,21(4):958-966.
[8]Lim JH,Kim MH,Han YJ,et al.Cell?free fetal DNA and cell?free total DNA levels in spontaneous abortion w ith fetal chromosomal aneuploidy[J].Plos One,2013,8(2):e56787.
[9]Sugiura?Ogasawara M,Ozaki Y,Katano K,et al.Abnonnal embryonic karyotype is the most frequent cause of recurrent m iscarriage[J].Hum Reprod,2012,27(8):2297-2303.
[10]TalkowskiME,Ordulu Z,Pillalamarri V,etal.Clini?cal diagnosis by whole genome sequencing of a prena?tal sample[J].N Engl JMed,2012,367(23):2226-2232.
[11]Pan Q,ShaiO,Lee LJ,etal.Deep surveying of alter?native splicing complexity in the human transcriptome by high?through put sequencing[J].NatGenet,2008,40(12):1413-1415.
[12]Pfifer GP,Besaratinia A.Mutational sqectra of human cancer[J].Hum Genet,2009,125(5/6):493-506.
[13]賴允麗,陳筠,易升,等.無創(chuàng)產(chǎn)前檢測的臨床應(yīng)用及隨訪研究[J].重慶醫(yī)學(xué),2016,45(11):1471-1475.
[14]賈蓓,鐘梅.高通量測序技術(shù)在無創(chuàng)產(chǎn)前檢測中的應(yīng)用[J].中國實用婦科與產(chǎn)科雜志,2015,31(9):807-810.
[15]張小珍,尤崇革.下一代基因測序技術(shù)新進(jìn)展[J].蘭州大學(xué)學(xué)報:醫(yī)學(xué)版,2016,42(3):73-80.
[16]張靜.人類早期胚胎植入前高通量測序遺傳學(xué)篩查的研究[D].天津:天津醫(yī)科大學(xué),2015.
[17]譚躍球.下一代測序與PGS[A].2015年浙江省醫(yī)學(xué)遺傳學(xué)學(xué)術(shù)年會暨高通量基因測序產(chǎn)前篩查與診斷技術(shù)研討會論文匯編,2015,10.
The com parison between array?CGH w ith next generation sequencing in the detection of copy number variations
CHEN Xinzhou1,WANGM ingzhu2,HEDan1,ZHOU Hui1,LIN Fangxin1,LIFenxia2★
(1.Guangzhou Darui Biotechnology Co.,Ltd.,Guangzhou,Guangdong,China,510665;2.Schoolof Labora?tory Medicine and Biotechnology,Southern Medical University,Guangzhou,Guangdong,China,510515)
Objective To provide a new method for clinical detection of copy number variants (CNV)by comparing the consistency between array?based comparative genomic hybridization(aCGH)and next generation sequencing(NGS)in the genome copy number variation.Methods DNA was extracted from 15 cases of clinical specimens and detected by both aCGH and NGSmethods.CNV numbers were analyzed in each sample.Results The results showed thataCGH identified 109 CNVs,in that the shortest CNV was 16 KB,and the longestCNV was 34MB.Therewere 20 CNVs shorter than 200 kb,34 CNVs between 200 kb and 1Mb,26 CNVs between 1Mb and 5Mb,and 29 CNVs between 5Mb and 34Mb.NGS identified 68 CNVs,of them 3 were shorter than 200 kb(15%),22 between 200 kb and 1 Mb(64.7%),20 between 1 Mb and 5 Mb (76.9%),29 between 5Mb and 34Mb(100%).Conclusion NGS has good consistency w ith aCGH in detect?ing CNVs longer than 5 Mb.Therefor it can be a reliablemethod to test the CNV.The performance of NGS in testing the short CNVs,especially the CNVs shorter than 200 kb w ill have a better resultby increasing the read
Copy number variation;Nextgeneration sequencing;Array based comparative genom ic hybridization
廣州市科技計劃產(chǎn)學(xué)研協(xié)同創(chuàng)新重大專項(201604020104);廣東省科技計劃項目公益研究與能力建設(shè)專項(2015A030401040);廣州市重大科技攻關(guān)項目子課題(2014Y2-00220)
1.廣州市達(dá)瑞生物技術(shù)股份有限公司,廣東,廣州510665 2.南方醫(yī)科大學(xué)檢驗與生物技術(shù)學(xué)院,廣東,廣州510515
★通訊作者:李粉霞,E?mail:lifenxia123@qq.com
data.