馮汝龍 王彥剛 常晨晨 景濤 馮錫鴻 申太榮 董建力
摘要 [目的]明確番茄耐裂基因在染色體上的位置。[方法]以耐裂果番茄14FP5和易裂果番茄14FP26為試材,將二者雜交得到F1代,F(xiàn)1自交得到F2,分別構(gòu)建2個極端性狀的DNA混合池,采用BSA-seq方法進行定位。[結(jié)果]利用 BSA-seq 對F2 群體的2個極端混池進行基因組重測序分析,將番茄耐裂基因定位在5號染色體上,位于34 140 000~38 120 000 pb,區(qū)間大小為3.98 Mb,候選區(qū)間內(nèi)共注釋到38個基因,其中非同義突變基因4個。[結(jié)論]該研究結(jié)果可為番茄耐裂基因的精細(xì)定位提供數(shù)據(jù)支撐,為番茄耐裂分子育種奠定基礎(chǔ)。
關(guān)鍵詞 番茄;耐裂性;BSA-seq;基因定位;候選基因
中圖分類號 S126? 文獻(xiàn)標(biāo)識碼 A? 文章編號 0517-6611(2024)10-0120-05
doi:10.3969/j.issn.0517-6611.2024.10.025
Extraction of Tomato Cracking Tolerance Candidate Genes Based on BSA-seq Technique
FENG Ru-long,WANG Yan-gang,CHANG Chen-chen et al
(Ningxia Zhongqing Agricultural Science Co. Ltd., Yinchuan, Ningxia 750001)
Abstract [Objective] To determine the position of tomato crack tolerance gene on chromosome.[Method]Tomato 14FP5 which is resistant to cracking and tomato 14FP26 which is easy to crack are used as test materials,cross the two to get F1 generation, F1 self-cross to get F2,DNA mixing pools with two extreme traits were constructed respectively,BSA-seq method was used to locate the location.[Result]BSA-seq was used for genome resequencing analysis of 2 extreme mixed pools of F2 population.The tomato anti-cracking gene was initially located on chromosome 5,located between 34 140 000 and 38 120 000 pb,the interval size is 3.98 Mb,a total of 38 genes were annotated in the candidate region,including 4 non-synonymous mutant genes.[Conclusion]The results provide data support for the fine localization of tomato crack tolerance genes, and lay a foundation for tomato crack tolerance molecular breeding.
Key words Tomato;Cracking-resistant;BSA-seq;Assignment of genes;Candidate gene
基金項目 寧夏自然科學(xué)基金項目(2020AAC03508);寧夏回族自治區(qū)重大科技項目(2017DC55)。
作者簡介 馮汝龍(1990—),男,山東濟南人,助理農(nóng)藝師,從事瓜菜育種與栽培研究。*通信作者,研究員,從事作物生物技術(shù)育種研究。
收稿日期 2023-07-02;修回日期 2023-07-20
番茄作為人們喜愛的果蔬,在我國有著“長壽果”的美譽。隨著番茄種植面積的不斷擴大,番茄在農(nóng)業(yè)增效、農(nóng)民增收及人們生活方面有著重要的位置。由于番茄在生產(chǎn)中易出現(xiàn)裂果現(xiàn)象,嚴(yán)重影響了番茄種植的經(jīng)濟效益。裂果已成為生產(chǎn)、銷售中的一大危害。在生產(chǎn)中,通過栽培管理措施可以在一定程度上減輕番茄裂果的發(fā)生,卻很難從根本上解決問題。因此,番茄耐裂品種的選育成為重要課題。
番茄裂果性屬數(shù)量性狀遺傳,在開發(fā)特異性分子標(biāo)記中存在成本高、周期長、效率低等缺點,較難獲得特異性分子標(biāo)記。群體分離分析法(bulked segregant analysis,BSA)通過表型差異構(gòu)建分離群體快速篩選和定位目標(biāo)性狀相關(guān)基因[1]。BSA-seq 技術(shù)基于高通量測序技術(shù),具有試驗周期短、定位準(zhǔn)確,開發(fā)的分子標(biāo)記分布均勻、密度高等優(yōu)點[2-3]。該方法在動植物功能基因定位研究中應(yīng)用廣泛[4-5]。
目前,關(guān)于高通量測序技術(shù)開發(fā)番茄耐裂特異分子標(biāo)記鮮見報道。筆者在前期試驗結(jié)果的基礎(chǔ)上,利用BSA-seq技術(shù)對番茄耐裂基因進行定位,旨在為番茄耐裂分子育種奠定基礎(chǔ)。
1 材料與方法
1.1 材料
供試易裂果番茄自交系14FP26和耐裂果番茄自交系14FP5,均來源于寧夏平羅中青種業(yè)公司。14FP26作母本與14FP5雜交,F(xiàn)1代自交產(chǎn)生F2分離群體,通過混合BSA法,分別選擇20株耐裂單株和30株易裂單株構(gòu)建混合DNA池的樣品。
1.2 方法
1.2.1 裂果性鑒定。番茄裂果性鑒定采用蘇彥賓等[6]的方法進行。
1.2.2
混池構(gòu)建及測序。取F2極端耐裂和易裂各30株頂端幼嫩葉片1片,干冰保存寄往北京百邁克生物科技有限公司進行檢測,采用改良的CTAB法提取DNA,將耐裂DNA和易裂DNA分別等量混合,構(gòu)建2個后代極端DNA混池,利用 Illumina HiSeq 平臺完成建庫測序。
1.2.3 測序數(shù)據(jù)分析。
將構(gòu)建的樣品文庫上機測序得到測序數(shù)據(jù)(raw reads),經(jīng)Base Calling分析轉(zhuǎn)化為原始測序序列(Sequenced Reads),其中含有帶接頭、低質(zhì)量的Reads,為了保證信息分析質(zhì)量,對Raw Reads進行過濾,得到Clean Reads,將Clean reads通過BWA 軟件與番茄基因組進行比對。根據(jù)Clean read比對結(jié)果,利用 GATK 軟件檢測和過濾得到檢測樣品與參考基因組之間高質(zhì)量的可信SNP位點和序列插入與缺失(InDel)位點。利用歐式距離法[7](euclidean distance,ED)和SNP-index 法計算與性狀關(guān)聯(lián)的候選區(qū)域。利用SNPindex 進行關(guān)聯(lián)分析[7-8]。
1.2.4 候選區(qū)域篩選與功能注釋。 關(guān)聯(lián)分析結(jié)果合并取交集,用 BLAST[9]通過多個數(shù)據(jù)庫(NR、Swiss-Prot、GO、KEGG、COG[10-11])深度注釋候選區(qū)間內(nèi)的編碼基因,快速篩選候選基因。
2 結(jié)果與分析
2.1 番茄耐裂性鑒定
種植F2代群體單株共243株,從243株 F2群體中經(jīng)表型鑒定獲得裂果嚴(yán)重單株24株,中度裂果單株27株,輕度裂果單株55株,抗裂單株67株,中抗單株42 株,高抗單株28株。其抗性呈近似正態(tài)分布,這表明番茄耐裂性符合數(shù)量性狀遺傳。從裂果嚴(yán)重和高抗裂果中各取20株嫩葉,構(gòu)建抗裂和易裂DNA混池。
2.2 測序數(shù)據(jù)量及數(shù)據(jù)質(zhì)量
利用SLAF-seq技術(shù)對父本、母本和極端混池DNA進行測序,過濾后共獲得了1 148 198 726條reads數(shù)據(jù),其中,父本和母本分別為221 566 116、203 712 478條(表1),抗裂池和易裂池分別為345 739 096、377 181 036條。測序質(zhì)量值 Q30為93.85%~95.01%,平均為94.52%,說明測序堿基錯誤率低,所獲數(shù)據(jù)合格。測序獲得GC含量在34.85%~35.40%,平均在35.13%。插入片段長度呈正態(tài)分布(圖1),說明測序數(shù)據(jù)文庫構(gòu)建無異常。父本、母本和極端混池樣品與參考基因組平均比對率為99.49%,基因組平均覆蓋深度約為53.25X,1%覆蓋率超過97.02%,5%覆蓋率超過95.77%,10%覆蓋率超過94.26%(表1),結(jié)果表明,測試數(shù)據(jù)符合標(biāo)準(zhǔn),可進一步檢測和篩選。
2.3 SNP和InDel變異檢測與注釋
SNP檢測結(jié)果顯示,共獲得6 340 143個SNP,引起非同義突變的SNP共59 846個。其中,親本P1、P2之間共獲得2 710 004個SNP,非同義突變的SNP共24 737個,混合池C1、C4之間共獲得3 630 139個SNP,引起非同義突變的SNP共17 767個。通過InDel檢測,親本之間共獲得431 661個小片段插入與缺失(small InDel),混合池之間共獲得 560 795個smal lnDel(圖2)。大部分SNP和InDel分布在基因間、基因上游區(qū)段、基因下游區(qū)段。
2.4 關(guān)聯(lián)分析
2.4.1 SNP關(guān)聯(lián)分析。對SNP進行過濾后得到質(zhì)量高的可信SNP位點1 487 748 個。采用ED算法和SNP-index算法對這些位點數(shù)據(jù)進行關(guān)聯(lián)分析,得到4個染色體候選區(qū)段與番茄抗裂性相關(guān)聯(lián),區(qū)域所注釋到的基因總長度為8.34 Mb。Chr05區(qū)段長度為3.98 Mb,位于34 140 000~38 120 000 bp,Chr05區(qū)段長度為3.98 Mb,位于40 640 000~44 620 000 bp,Chr011區(qū)段長度為0.08 Mb,位于3 740 000~3 820 000 bp(表2、圖3)。根據(jù)SNP-index 算法關(guān)聯(lián)閾值(0.95)判定,共得到2個與番茄抗裂性相關(guān)聯(lián)的染色體區(qū)段,關(guān)聯(lián)分布見圖4,區(qū)段注釋到的基因總長度為2.18 Mb,其中 Chr05區(qū)段長度最小,為0.06 Mb,位于42 240 000~42 300 000 bp。2種關(guān)聯(lián)分析方法取交集,得到2個與性狀相關(guān)的侯選交集區(qū)段,區(qū)段總長度為4.28 Mb(表2、圖4)。
2.4.2 InDel關(guān)聯(lián)分析。對 InDel位點進行過濾后得到質(zhì)量高的可信InDel 位點192 616 個。根據(jù)ED關(guān)聯(lián)閾值判定,共得到8個區(qū)段,總長度為12.54 Mb。采用與SNP關(guān)聯(lián)分析時相同的方法(SNP-index),當(dāng)置信度為0.99時,共得到5個區(qū)段,總長度為7.18 Mb。2種關(guān)聯(lián)分析方法取交集,得到2個與番茄抗裂性相關(guān)的侯選區(qū)段,區(qū)段總長度為0.36 Mb(表3)。
2.5 候選區(qū)段篩選與基因注釋
將SNP關(guān)聯(lián)分析結(jié)果與InDel關(guān)聯(lián)結(jié)果進行統(tǒng)計分析后取交集,InDel交集結(jié)果為空,該項目默認(rèn)采用SNP的候選區(qū)間結(jié)果(表2),最終鎖定番茄耐裂性候選區(qū)段在5號染色體上,位于34 140 000~38 120 000 pb,區(qū)間大小為3.98 Mb。利用 GO[12]、KEGG[11]等數(shù)據(jù)庫對候選區(qū)段內(nèi)的基因進行深度注釋,有38個基因被注釋,其中非同義突變基因4個。
利用番茄基因組數(shù)據(jù)庫信息,利用 BlAST軟件對候選區(qū)段內(nèi)的基因進行NR、GO、KEGG、COG數(shù)據(jù)庫進行深度注釋,在候選區(qū)段內(nèi)共注釋到 38個基因,其中在 NR、trEMBL數(shù)據(jù)庫中均注釋到 38 個基因,Swiss Prot數(shù)據(jù)庫中注釋到29個基因,GO 數(shù)據(jù)庫中注釋到31個基因,KEGG數(shù)據(jù)庫中注釋到23個基因,COG數(shù)據(jù)庫中注釋到12個基因(表4)。
2.5.1 GO數(shù)據(jù)庫分析。
利用GO數(shù)據(jù)庫對候選基因和基因產(chǎn)物在細(xì)胞組分、分子功能和生物學(xué)過程3個方面,將候選區(qū)段內(nèi)38個基因進行GO功能注釋,有31個基因(表4)分別被注釋到7個細(xì)胞組分、3個分子功能和 13 個生物學(xué)過程中(圖5)?;蛟诩?xì)胞組分中主要存在于細(xì)胞器中的葉綠體;基因在分子功能中主要發(fā)揮催化活性、信號傳遞等功能;基因在生物學(xué)過程中主要參與代謝、生物合成及生物調(diào)節(jié)等。這說明當(dāng)番茄受到不良因素開裂時,番茄的抗裂響應(yīng)可能有細(xì)胞轉(zhuǎn)化、細(xì)胞膜修復(fù)、氨基酸代謝、生物調(diào)節(jié)信息傳遞等。
2.5.2 ?KEGG數(shù)據(jù)庫分析。
利用KEGG數(shù)據(jù)庫對候選基因區(qū)段進行 Pathway 富集分析,38個候選基因被注釋到的基因數(shù)為23個,這23個基因(表4)所參與的代謝通路主要為植物激素信號傳導(dǎo)、苯丙氨酸酪氨酸的生物合成、甘氨酸、絲氨酸和蘇氨酸的代謝等(圖5)。這表明當(dāng)番茄開裂時,體內(nèi)會出現(xiàn)傳導(dǎo)開裂信號的響應(yīng),體內(nèi)合成、代謝和生物調(diào)控增加,產(chǎn)生各種蛋白酶與核酸等物質(zhì),同時進行生物調(diào)控、代謝,促進細(xì)胞間的黏合力抵御開裂。
3 結(jié)論與討論
該試驗利用BSA-seq方法快速挖掘到抗裂候選基因區(qū)段位于5號染色體上,關(guān)聯(lián)區(qū)段總長度為3.98 Mb,對候選區(qū)段內(nèi)的基因進行生物信息學(xué)分析后,共注釋到38個基因,經(jīng)過多個數(shù)據(jù)庫的分析發(fā)現(xiàn),5號染色體上關(guān)聯(lián)區(qū)段內(nèi)的基因有可能在番茄裂果過程中發(fā)揮著重要作用,成為控制番茄裂果的主效基因,為番茄抗裂基因的精細(xì)定位和分子克隆提供了科學(xué)依據(jù)。
目前對番茄果實裂果性狀進行基因定位的研究并不多見,張冬野等[13]利用SSR和AFLP分子標(biāo)記對F2群體進行QTL定位及遺傳連鎖圖譜的構(gòu)建,找到與番茄果質(zhì)量、果形指數(shù)、果皮韌度等相關(guān)的QTLs位于3號染色體上。陳斌等[14]利用QTL-seq 分析檢測到2個調(diào)控番茄不規(guī)則裂果性狀的QTLs,分別位于2號染色體的38.75 ~ 42.14 Mb 區(qū)段和5號染色體的49.07~49.48 Mb 區(qū)段。該研究結(jié)果顯示,番茄抗裂性基因位點位于5號染色體上,推測5號染色體上抗裂基因富集區(qū)段至少有3位點,這表明5號染色體上的位點對番茄抗裂性有重要控制作用。
該研究使用NR、GO、KEGG、COG功能數(shù)據(jù)庫進行深度注釋,在5號染色體上注釋到38個候選基因,發(fā)現(xiàn)這些基因顯著富集在番茄的生物代謝、生物合成及生物調(diào)節(jié)等途徑中,該代謝通路可增加番茄細(xì)胞間的黏合力,控制黏合力的基因與細(xì)胞轉(zhuǎn)化、細(xì)胞膜修復(fù)、氨基酸代謝密切相關(guān)。由于注釋到的基因較多,至于哪些區(qū)段的基因為控制番茄耐裂的主效基因,需進一步進行基因精細(xì)定位、功能和表達(dá)驗證。在該研究的基礎(chǔ)上,期待進一步挖掘控制番茄抗裂基因,同時開發(fā)番茄抗裂基因分子標(biāo)記,對于闡明番茄與抗裂果的互作機制及抗裂分子標(biāo)記輔助育種具有重要意義。
參考文獻(xiàn)
[1] MICHELMORE R W,PARAN I,KESSELI R V.Identification of markers linked to disease-resistance genes by bulked segregant analysis:A rapid method to detect markers in specific genomic regions by using segregating populations[J].Proc Natl Acad Sci USA,1991,88(21):9828-9832.
[2] ABE A,KOSUGI S,YOSHIDA K,et al.Genome sequencing reveals agronomically important loci in rice using MutMap[J].Nat Biotechnol,2012,30(2):174-178.
[3] ZHANG H,WANG X,PAN Q,et al.QTG-seq accelerates QTL fine mapping through QTL partitioning and whole-genome sequencing of bulked segregant samples[J].Mol Plant,2019,12(3):426-437.
[4] ZOU C,WANG P X,XU Y B.Bulked sample analysis in genetics,genomics and crop improvement[J].Plant Biotechnoll,2016,14(10):1941-1955.
[5] POOL J E.Genetic mapping by bulk segregant analysis in Drosophila:Experimental design and simulation-based inference[J].Genetics,2016,204(3):1295-1306.
[6] 蘇彥賓,劉玉梅,方智遠(yuǎn),等.結(jié)球甘藍(lán)耐裂球性狀遺傳分析[J].園藝學(xué)報,2012,39(8):1482-1490.
[7] HILL J T,DEMAREST B L,BISGROVE B W,et al.MMAPPR:Mutation mapping analysis pipeline for pooled RNA-seq[J].Genome Res,2013,23(4):687-697.
[8]FEKIH R,TAKAGI H,TAMIRU M,et al.MutMap +:Genetic mapping and mutant identification without crossing in rice[J].PLoS One,2013,8(7):1-10.
[9] ALTSCHUL S F,MADDEN T L,SCHFFER A A,et al.Gapped BLAST and PSI-BLAST:A new generation of protein database search programs[J].Nucleic Acids Res,1997,25(17):3389-3402.
[10] 鄧泱泱,荔建琦,吳松鋒,等.nr數(shù)據(jù)庫分析及其本地化[J].計算機工程,2006,32(5):71-73,76.
[11] KANEHISA M,GOTO S,KAWASHIMA S,et al.The KEGG resource for deciphering the genome[J].Nucleic Acids Res,2004,32(S1):D277-D280.
[12] ASHBURNER M,BALL C A,BLAKE J A,et al.Gene ontology:Tool for the unification of biology[J].Nat Genet,2000,25(1):25-29.
[13] 張冬野,李會佳,楊歡歡,等.番茄裂果性狀及QTL定位分析[J].北方園藝,2017(17):44-51.
[14] 陳斌,吳震,文軍琴,等.番茄不規(guī)則裂果性狀的QTL定位及候選基因分析[J].園藝學(xué)報,2021,48(7):1329-1339.