郭廣君, 孫 茜, 劉金兵, 潘寶貴, 刁衛(wèi)平, 戈 偉, 高長洲, 王述彬
(江蘇省農(nóng)業(yè)科學院蔬菜研究所/江蘇省高效園藝作物遺傳改良重點實驗室,江蘇 南京 210014)
辣椒(Capsicum spp.)屬于茄科 (Solanaceae) 辣椒屬(Capsicum)作物,作為一種重要的蔬菜作物和調(diào)味品,廣泛栽培于南北美、亞洲、歐洲和大洋洲等世界各地。隨著消費者需求的多樣性,利用傳統(tǒng)方法在辣椒的遺傳改良上取得了很大進展,但是分子標記[1]和第二代測序技術(shù)[2]的出現(xiàn)為辣椒的遺傳改良提供了更大的機遇[3]。目前辣椒分子標記的開發(fā)和應(yīng)用主要集中于利用公用數(shù)據(jù)或者基因組文庫開發(fā)SSR標記[4-8]。隨著高通量測序技術(shù)的發(fā)展和辣椒基因組數(shù)據(jù)的發(fā)布,使得辣椒分子標記的開發(fā)和應(yīng)用進入了一個新的階段[9-10],第三代分子標記SNP標記和InDel標記的開發(fā)和應(yīng)用在辣椒中逐漸廣泛[11-14]。
插入/缺失多態(tài)性(Insertion/deletion,InDel)標記是由于等位基因位點處的DNA序列在不同個體間發(fā)生了核苷酸片段的插入/缺失而產(chǎn)生的長度多態(tài)性變異[15]。根據(jù)目標位點兩側(cè)的序列設(shè)計特異引物進行PCR擴增,擴增片段的長度多態(tài)性即是InDel標記。在整個基因組中,InDel標記的多態(tài)性頻率僅次于SNP標記,遠高于SSR標記。InDel標記多態(tài)性可通過聚合酶鏈式反應(yīng)(PCR)和瓊脂糖凝膠電泳或非變性聚丙烯酰胺凝膠電泳等簡單的步驟達到基因分型的目的[16-17],相對于SNP標記,其標記的設(shè)計和檢測更為簡易,應(yīng)用也更為方便[18]。此外,InDel標記的另一優(yōu)點是不可能在同1個基因組位點上發(fā)生同樣長度的2個 InDel位點突變,所以具有共同InDel突變位點的2個物種間代表其具有血緣一致性(Identity-by-descent)[19]。綜上所述,In-Del標記為共顯性標記,具有較好的穩(wěn)定性和較為豐富的多態(tài)性,是高分辨率圖譜構(gòu)建,關(guān)聯(lián)分析和基因定位等方面最佳的候選標記[20]。但是,辣椒中已開發(fā)和應(yīng)用的InDel標記數(shù)量非常少,本研究的目的在于基于辣椒基因組重測序數(shù)據(jù)開發(fā)InDel標記,利用不同遺傳背景的辣椒種質(zhì)對開發(fā)出的InDel標記進行驗證,篩選獲得有效的InDel標記,進一步探討InDel標記在種質(zhì)鑒定中的應(yīng)用。
本研究利用重測序數(shù)據(jù)與參考基因組進行比對查找InDel位點。參考基因組版本為pepper.V.1.55,下載網(wǎng)址:http://peppergenome.snu.ac.kr/ download.php。采用illumina HiSeqTM2500測序平臺對一年生辣椒(Capsicum annuum)“G29”和灌木狀辣椒(Capsicum.frutescents)“G108”進行測序。將測序得到的原始Reads進行質(zhì)量評估并過濾得到Clean Reads。利用bwa軟件比對定位Clean Reads在參考基因組上的位置。InDel的檢測主要使用GATK軟件工具包實現(xiàn)。根據(jù)Clean Reads在參考基因組的定位結(jié)果,使用 Samtools進行去重復(Mark duplicates),使用GATK軟件進行局部比對(Local realignment)和堿基質(zhì)量值校正(Base recalibration)等預處理,以保證檢測結(jié)果的準確性,再使用GATK軟件進行變異檢測和校準,選取可靠的In-Del位點[21-22]。利用SnpEff軟件根據(jù)InDel位點在參考基因組上的位置信息,對比參考基因組的基因、CDS位置等信息對其進行注釋和預測其影響。
根據(jù)重測序數(shù)據(jù)中預測到InDel位點,篩選出插入/缺失堿基數(shù)為5~10個堿基的位點?;诶苯坊蚪M序列,將篩選出的位點定位在基因組上,取InDel位點兩翼各200 bp堿基長度,共401 bp長度進行引物設(shè)計。采用Primer 3.0進行引物設(shè)計,上游引物設(shè)計范圍在1~195 bp,下游引物設(shè)計范圍為205~401 bp,產(chǎn)物大小為150~250 bp,退火溫度為52~60℃。
優(yōu)化后的擴增反應(yīng)采用10 μl反應(yīng)體系,包括20 ng模板DNA、5 μl 2×Mix混合液(含Mg2+的10×PCR buffer、2.5 mmol/L的 dNTPs、0.5 U Taq DNA聚合酶)、每個引物終濃度為0.2 μmol/L。反應(yīng)程序為94℃預變性4 min;94℃變性30 s,55℃復性30 s,72℃延伸40 s,循環(huán)30次;72℃延伸7 min,置于4℃下保存。擴增產(chǎn)物用10%非變性聚丙烯酰胺凝膠電泳,銀染顯色,統(tǒng)計分析條帶類型。
用于檢測標記有效性的辣椒材料來源于國外和國內(nèi)多個科研單位,其中包括一年生辣椒(Capsicum annuum)21份、灌木狀辣椒(Capsicum frutescents)2份,下垂辣椒(Capsicum baccatum)1份。除11份辣椒品種外,其余13份以G開頭的材料為項目組引進的國外種質(zhì)資源(表1)。采用改良CTAB法提取葉片的基因組DNA[23],經(jīng)瓊脂糖凝膠電泳和微量分光光度計檢測,DNA濃度調(diào)至50 ng/μl備用。
通過與參考基因組序列比對,一年生辣椒品種G29和灌木狀辣椒品種G108的全基因組范圍內(nèi)共檢測到的InDel數(shù)量分別為533 523個和1 664 770個,其中編碼區(qū)的InDel數(shù)量分別為1 019個和2 515個,具體結(jié)果見表2。通過進一步比較分析,G29和G108之間的全基因組范圍內(nèi) InDel數(shù)量為1 586 427個。
表1 24份供試辣椒種質(zhì)基本信息Table 1 The information of 24 tested pepper ge rmplasm
表2 全基因組和編碼區(qū)InDel位點信息Table 2 The information of InDel loci within the whole genome and CDS
根據(jù)預測的InDel位點,在2號染色體上隨機選擇了40個InDel位點設(shè)計引物,引物信息見表3。以24份不同來源的辣椒材料驗證標記的有效性。經(jīng)過PCR和產(chǎn)物檢測發(fā)現(xiàn),40對引物在24份辣椒材料中均能擴增出條帶,擴增條帶的大小與預測產(chǎn)物大小基本相同。如圖1為引物InDel-2-3對24份辣椒種質(zhì)PCR擴增結(jié)果。經(jīng)統(tǒng)計,在24份材料中共擴增出70個清晰可辨的位點,其中35個標記表現(xiàn)出多態(tài)性,5個無多態(tài)性,多態(tài)率達到87.5%。
利用Popgene32軟件對40對引物在24份辣椒材料中的擴增結(jié)果進行分析發(fā)現(xiàn),每對引物反映的基因多樣性指數(shù)范圍為 0.08~0.50,其均值為0.20;Shannon′s多樣性信息指數(shù)分布在0.17至0.80之間,其均值為0.34(表3)。
利用NTSYSpc 2.10e中的UPGMA方法對24份材料進行聚類分析,由聚類結(jié)果(圖2)可以看出,在遺傳相似系數(shù)0.42處,24份辣椒種質(zhì) 分為2個大類,一類為21份一年生辣椒,另一大類為2份灌木狀辣椒(C.frutescens)和1份下垂辣椒(C.baccatum)。21份一年生辣椒中可以聚類為羊角形辣椒、牛角形(長燈籠形)辣椒和甜椒三大類別。同時,聚類結(jié)果顯示牛角形(長燈籠形)辣椒和甜椒相似度更高,同一單位品種間相似度高于不同單位間相似度。
表3 本研究開發(fā)的辣椒InDel標記信息Table 3 The information of pepper InDel markers developed in the study
圖1 引物InDel-2-3對24份辣椒種質(zhì)的擴增結(jié)果Fig.1 Amplification of 24 pepper germplasm DNA with marker InDel-2-3
圖2 基于Nei′s遺傳距離的24份辣椒種質(zhì)的UPMGA聚類圖Fig.2 UPGMA dendrogram of 24 pepper germplasm based on the Nei′s genetic distance
InDel標記為共顯性標記,具有較好的穩(wěn)定性和較為豐富的多態(tài)性。雖然在整個基因組中,其多態(tài)性頻率次于SNP標記[24],但是,相對于SNP標記,InDel標記在引物設(shè)計、多態(tài)性檢測等方面更為簡易,應(yīng)用也更為方便[16-17,25]。但是,目前辣椒中In-Del標記的開發(fā)數(shù)量較少,應(yīng)用較為有限,這一現(xiàn)狀急待改善[11]。
本研究基于全基因組重測序數(shù)據(jù),通過與參考基因組序列比對,在一年生辣椒品種G29和灌木狀辣椒品種G108的全基因組范圍內(nèi)檢測到的InDel數(shù)量分別為533 523個和1 664 770個。以上結(jié)果說明利用全基因組重測序技術(shù)可以在辣椒中更好地挖掘InDel位點,為全基因組范圍內(nèi)的InDel設(shè)計提供了更優(yōu)選擇。這一觀點已經(jīng)在包括辣椒在內(nèi)的多個物種中得以驗證[12,26-27]。
利用24份辣椒材料對2號染色體上的40個標記的有效性進行驗證,發(fā)現(xiàn)24份材料在40個標記中共擴增出70個清晰可辨的位點,其中35個標記表現(xiàn)出多態(tài)性,多態(tài)率達到87.5%。這一結(jié)果很好地驗證了本研究開發(fā)出的InDel標記的有效性和較高的多態(tài)性。目前辣椒分子標記的開發(fā)和應(yīng)用主要集中于利用公用數(shù)據(jù)或者基因組文庫開發(fā)SSR標記,但是大部分研究結(jié)果表明SSR標記的多態(tài)性及其應(yīng)用率遠低于InDel標記。如Huang等人基于數(shù)據(jù)庫中的辣椒序列開發(fā)出12個SSR標記,其中多態(tài)性標記為5個,多態(tài)率為41.7%[5];Lee等構(gòu)建辣椒分子遺傳連鎖圖譜時開發(fā)出76個SSR標記,其中具有多態(tài)性的標記為46個,多態(tài)率為60.5%[4];Yi等開發(fā)出1 201個EST-SSR標記,其多態(tài)性標記只有150個,多態(tài)率僅為29.2%[6];Huang等依據(jù)EST序列開發(fā)出SSR標記755個,利用8份辣椒栽培種對其中的210個進行驗證,其多態(tài)性標記為127個,多態(tài)率為60.5%[8];Shirasawa等基于辣椒EST序列設(shè)計了5 751個SSR標記,利用辣椒材料對其中77個進行驗證,其中60個表現(xiàn)出多態(tài)性,多態(tài)率為77.9%[7]。但是,也有少數(shù)研究結(jié)果顯示,InDel標記與SSR標記的多態(tài)率并無明顯差異。Li等利用InDel標記構(gòu)建辣椒種內(nèi)遺傳圖譜時顯示,1 000個InDel標記中251個標記可以成功應(yīng)用于圖譜構(gòu)建,其多態(tài)率為25.1%[11]。隨后,該團隊(2015年)基于SSR和InDel標記構(gòu)建辣椒種間遺傳圖譜時,分別篩選了1 038個InDel標記和674個SSR標記,其中多態(tài)性標記分別為140個和102個,多態(tài)率分別為13.5%和15.1%[12]。
利用NTSYSpc 2.10e中的UPGMA方法對24份材料進行聚類分析,結(jié)果表明35個InDel標記不僅可以有效區(qū)分出21份一年生辣椒、2份灌木狀辣椒和1份下垂辣椒,而且21份材料中又可以聚類為不同種類,其聚類結(jié)果與表型特征非常吻合。這一結(jié)果表明InDel標記在種質(zhì)資源的遺傳分析、品種鑒定和品種保護方面具有極大的應(yīng)用價值。但同一單位育成品種的相似度很高,說明可利用的辣椒種質(zhì)的遺傳背景較窄,對于品種改良極為不利,需要開發(fā)和應(yīng)用新的種質(zhì)進行品種的選育和改良。
總的來說,基于全基因組重測序數(shù)據(jù)開發(fā)InDel標記可以有效地應(yīng)用于辣椒種質(zhì)鑒定,遺傳圖譜的構(gòu)建,關(guān)聯(lián)分析和基因定位等方面,是辣椒種質(zhì)資源開發(fā)利用和分子標記輔助育種的高效工具。
[1] 王述彬,刁衛(wèi)平,劉金兵,等.辣椒胞質(zhì)雄性不育相關(guān)基因的克隆及表達[J].江蘇農(nóng)業(yè)學報,2014,30(4):833-838.
[2] 徐婉莉,裴徐梨,荊贊革,等.辣椒actin基因電子克隆與生物信息學分析[J].江蘇農(nóng)業(yè)科學,2014,42(5):46-48.
[3] RAMCHIARY N,KEHIE M,BRAHMA V,et al.Application of genetics and genomics towards Capsicum translational research[J].Plant Biotechnology Reports,2014,8(2):101-123.
[4] LEE J M,NAHM S H,KIM Y M,et al.Characterization and molecular genetic mapping of microsatellite loci in pepper[J].Theoretical and Applied Genetics,2004,108(4):619-627.
[5] HUANG S W,ZHANG B X,MILBOURNE D,et al.Development of pepper SSR markers from sequence databases[J].Euphytica,117,2(2001):163-167.
[6] YI G,LEE J M,LEE S,et al.Exploitation of pepper EST-SSRs and an SSR-based linkage map[J].Theoretical and Applied Genetics,2006,114(1):113-130.
[7] SHIRASAWA K,ISHII K,KIM C,et al.Development of Capsicum EST-SSR markers for species identification and in silico mapping onto the tomato genome sequence[J].Molecular Breeding,2013,31(1):101-110.
[8] HUANG H H,ZHANG Z H,ZHANG Z H,et al.Analysis of SSRs information in Capsicum spp.from EST database[J].Agricultural Sciences in China,2011,10(10):1532-1536.
[9] QIN C,YU C,SHEN Y,et al.Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization[J].Proceedings of the National Academy of Sciences,2014,111(14):5135-5140.
[10]KIM S,PARK M,YEOM S I,et al.Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species[J].Nature Genetics,2014,46(3):270-278.
[11]LI W,CHENG J,WU Z,et al.An InDel-based linkage map of hot pepper(Capsicum annuum)[J].Molecular Breeding,2015,35(1):219-319.
[12]TAN S,CHENG J W,ZHANG L,et al.Construction of an interspecific genetic map based on InDel and SSR for mapping the QTLs affecting the initiation of flower primordia in pepper(Capsicum spp.)[J].Plos One,2015,10(3):1-15.
[13]LU F H,KWON S W,YOON M Y,et al.SNP marker integration and QTL analysis of 12 agronomic and morphological traits in F^sub 8^RILs of pepper(Capsicum annuum L.)[J].Molecules and Cells,2012,34(1):25-34.
[14]LIU W Y,KANG J H,JEONG H S,et al.Combined use of bulked segregant analysis and microarrays reveals SNP markers pinpointing a major QTL for resistance to Phytophthora capsici in pepper[J].Theoretical and Applied Genetics,2014,127(11): 2503-2513.
[15]JANDER G,NORRIS S R,ROUNSLEY S D,et al.Arabidopsis map-based cloning in the post-genome era[J].Plant Physiology,2002,129(2):440-450.
[16]V?LIü,BRANDSTR?M M,JOHANSSON M,et al.Insertion-deletion polymorphisms(indels)as genetic markers in natural populations[J].BMC Genet,2008,9(1):1-8.
[17]VARSHNEY R.Gene-based marker systems in plants:high throughput approaches for marker discovery and genotyping[M].New York:Springer Netherlands,2009.
[18]HAYDEN M J,TABONE T,MATHER D E.Development and assessment of simple PCR markers for SNP genotyping in barley[J].Theoretical and Applied Genetics,2009,119(5):939-951.
[19]SHEDLOCK A M,OKADA N.SINE insertions:powerful tools for molecular systematics,Bioessays[J].2000,22(2):148-160.
[20]MILLS E R,LUTTIG T C,LARKINS E C,et al.An initial map of insertion and deletion(INDEL)variation in the human genome[J].Gemome Research,2006,16:1182-1190.
[21]MCKENNA A,HANNA M,BANKS E,et al.The genome analysis toolkit:A map reduce framework for analyzing next-generation DNA sequencing data[J].Genome Research,2010,20(9): 1297-1303.
[22]LI H,HANDSAKER B,WYSOKER A,et al.The sequence alignment/map format and SAMtools[J].Bioinformatics,2009,25(16):2078-2079.
[23]ZHANG X,WANG L,SHOU L.Modified CTAB method for extracting genomic DNA from wheat leaf[J].Agricultural Science&Technology,2013,14(7):946-949.
[24]BROOKES A J.The essence of SNPs[J].Gene,1999,234 (2):177-186.
[25]CHUNG W H,ISHII H,NISHIMURA K,et al.Genetic analysis and PCR-based identification of major Fusarium species causing head blight on wheat in Japan[J].Journal of General Plant Pathology:JGPP,2008,74(5):364-374.
[26]PǎCURAR D I,PǎCURAR M L,STREET N,et al.A collection of INDEL markers for map-based cloning in seven Arabidopsis accessions[J].Journal of Experimental Botany,2012,63(7): 2491-2501.
[27]LIU B,WANG Y,ZHAI W,et al.Development of InDel markers for Brassica rapa based on whole-genome re-sequencing[J].Theoretical and Applied Genetics,2013,126(1):231-239.