陶星星 吳亞輝 劉 蕊 李國華 杜小珍 張志標(biāo)
(1 廣東省梅州市農(nóng)林科學(xué)院果樹研究所,梅州 514071;2 廣東省梅州市農(nóng)林科學(xué)院糧油研究所,梅州 514071)
基因突變指的是DNA 分子中發(fā)生堿基對的替換、增添和缺失而引起的基因結(jié)構(gòu)的改變?;蛲蛔冎饕▎魏塑账岫鄳B(tài)性(SNP,Single nucleotide polymorphysim)、插 入 和 缺 失(InDel,Insertion and deletion)、結(jié)構(gòu)變異(SV,Structural variation)、拷貝數(shù)變異(CNV,Copy-number variation)等幾種[1]。SNP主要是指在基因組水平上由單個核苷酸的變異所引起的DNA 序列多態(tài)性,包括單個堿基的轉(zhuǎn)換、顛換等。InDel 指小片段的插入和缺失。編碼區(qū)或剪接位點處發(fā)生的插入缺失都可能會改變蛋白的翻譯。移碼變異,其插入或缺失的堿基串的長度為3 的非整數(shù)倍則可能導(dǎo)致整個閱讀框的改變;移碼變異與非移碼變異相比較,前者對基因功能的影響更大,同時在群體中受到更大的篩選壓力。SV 指基因組水平上大片段的插入(INS,Insertion)、缺失(DEL,Deletion)、倒置(INV,Inversion)、染色體內(nèi)部遷移(ITX,Intra-chromosomal translocation)、染色體間的遷移(CTX,Inter-chromosomal translocation)[2]。CNV 指基因組片段的拷貝數(shù)增加或者減少,由基因組發(fā)生重排而導(dǎo)致,一般指長度為1Kb 以上的基因組大片段的拷貝數(shù)增加或者減少,主要表現(xiàn)為亞顯微水平的缺失和重復(fù),是基因組研究的主要多態(tài)性類型之一。
琯溪蜜柚果肉白色、味甜、微酸[3]。三紅蜜柚是由琯溪蜜柚經(jīng)過2 次芽變株系選育得到的優(yōu)良品種,其果實外皮呈粉紅色,果皮下的海綿層也是粉紅色的,果肉呈紅色,由此得名三紅蜜柚[4]。水晶香柚是三紅蜜柚芽變新品種,其果肉肉質(zhì)爽脆、果味香氣濃郁,成熟期比三紅蜜柚早。三紅蜜柚、琯溪蜜柚和水晶香柚3 者之間親緣關(guān)系較近,在重要的農(nóng)藝、產(chǎn)量性狀上也存在較高的相似性,理論上來說除了個別基因變異之外,3 者大部分基因是相同的。
由于對3 者的親緣關(guān)系及遺傳相似性的認(rèn)知僅限于表型性狀描述和經(jīng)驗為主,為進(jìn)一步挖掘3 個品種的親緣關(guān)系和遺傳多樣性信息,通過對三紅蜜柚、琯溪蜜柚和水晶香柚進(jìn)行重測序,在全基因組水平系統(tǒng)解析了3 者的遺傳組成差異,以期對今后蜜柚的親本利用、重要性狀基因區(qū)間追溯、新品種系譜分析、基因組水平上研究重要種質(zhì)的遺傳組成等方面提供重要參考。
1.1 材料試驗材料取自廣東省梅州市蕉嶺縣蕉城鎮(zhèn)東山村柚果園,供試品種:琯溪蜜柚(編號為W3)、三紅蜜柚(編號為R2)、水晶香柚(編號為S1)。植株生長健康、掛果正常,果園管理措施一致。
1.2 果實農(nóng)藝性狀測定每個品種隨機(jī)選擇10 個果實,果實完全成熟后采集。果實重量使用電子天平(精度:0.001g)測定,重復(fù)3 次,取平均值;果實成熟期、果實形狀、果皮顏色與光滑度、種子數(shù)量、果肉顏色等采用直觀觀測;可食率=(單果重量-不可食部分重量)/單果重量×100%;可溶性固形物手持測糖儀型號:ATAGO(艾拓)通用型可溶性固體物濃度計PAL-1(NFC);參照GB 5009.86—2016《食品安全國家標(biāo)準(zhǔn)食品中抗壞血酸的測定》測定維生素C 含量[5];可溶性糖參考NY/T 2742—2015《水果及制品可溶性糖的測定3,5-二硝基水楊酸比色法》測定[6];可滴定酸參考GB/T 12293—1990《水果、蔬菜制品可滴定酸度的測定》測定[7]。
1.3 全基因組重測序與多態(tài)性位點鑒定用CTAB法分別提取3 個品種葉片的DNA。用瓊脂糖凝膠電泳分析DNA 降解程度以及是否存在雜帶、RNA及蛋白污染,并通過Nanodrop 檢測DNA 的純度(OD260/280 比值);然后通過Thermo Qubit 3.0 熒光計對DNA 濃度進(jìn)行精確定量,選擇OD 值在1.8~2.0之間,總量在1.5μg 以上的DNA 樣品通過Covaris破碎機(jī)隨機(jī)打斷成長度為350bp 的片段后,采用Illumina NGS DNA Library Construction Kit 文庫構(gòu)建試劑盒進(jìn)行建庫。文庫構(gòu)建完成后,先使用Qubit 3.0 進(jìn)行初步定量,稀釋文庫至1ng/μL,隨后使用安捷倫Agilent 2100 生物分析儀對文庫的Insert size 進(jìn)行檢測,Insert size 符合預(yù)期后,使用Q-PCR方法對文庫的有效濃度進(jìn)行準(zhǔn)確定量(文庫有效濃度>2nmol/L),以保證文庫質(zhì)量。庫檢完成后用Illumina 平臺進(jìn)行PE150 雙端測序,建庫和測序由北京諾禾致源科技股份有限公司完成。有效測序數(shù)據(jù)通過 Burrow-Wheeler Aligner(BWA)軟件[6]比對到華中農(nóng)業(yè)大學(xué)柚子(Citrus maxima)參考基因組[7](http://citrus.hzau.edu.cn/orange/download/HWB.chromosome.fa.tar.gz),比對結(jié)果經(jīng)高通量測序數(shù)據(jù)處理軟件SAMtools[8]去除重復(fù),根據(jù)比對結(jié)果,進(jìn)行SNP、InDel、SV 和CNV 的檢測及注釋。
1.4 SNP 檢測及注釋本研究采用SAMtools(參數(shù):mpileup-m2-F 0.002-d1000)進(jìn)行個體SNP 的檢測。為了降低SNP 檢測的錯誤率,選用SNP 的reads 支持?jǐn)?shù)不低于4;比對質(zhì)量值(MQ)不低于20為標(biāo)準(zhǔn)進(jìn)行過濾。
1.5 InDel 檢測及注釋本研究利用SAMtools(參數(shù):mpileup -m2-F0.002-d1000)檢測長度小于50bp 的小片段插入與缺失(InDel),利用ANNOVAR軟件對檢測出的InDel 進(jìn)行注釋[9]。
1.6 SV 檢測及注釋本研究利用結(jié)構(gòu)變異檢測軟件BreakDancer[9],基于Pair-end reads 方法將樣品測序序列比對到參考基因組上,檢測樣品序列與參考基因組間的插入(INS)、缺失(DEL)、倒置(INV)、染色體內(nèi)部遷移(ITX)、染色體間的遷移(CTX),過濾去掉Paired-end reads 支持?jǐn)?shù)小于2 的SV 結(jié)果,并且對其中的INS、DEL、INV、ITX、CTX 通過ANNOVAR[10]進(jìn)行變異注釋。
1.7 拷貝數(shù)變異區(qū)間鑒定及比較分析通過CNVnator(參數(shù):-call100)進(jìn)行對供試材料相對于柚子參考基因組的CNV 變異區(qū)間檢測,即通過基因組上不同的reads 覆蓋深度,判斷潛在的拷貝數(shù)減少(Deletion)和拷貝數(shù)增加(Duplication),并通過遺傳變異位點注釋軟件ANNOVAR 進(jìn)行變異注釋[11]。
2.1 農(nóng)藝性狀比較田間調(diào)查發(fā)現(xiàn)3 個柚類品種植株樹勢基本相同,差異主要體現(xiàn)在果實和果肉外觀上(圖1、圖2、表1)。在果實重量方面,水晶香柚平均單果重1480g,三紅蜜柚平均單果重1775g,琯溪蜜柚平均單果重2100g;在果型方面,水晶香柚呈高扁圓型,三紅蜜柚和琯溪蜜柚呈倒卵圓型;在果皮方面,琯溪蜜柚成熟期為黃綠色,三紅蜜柚和水晶香柚成熟期為黃色但略有紅色光澤;琯溪蜜柚果皮下的海綿層為白色,三紅蜜柚和水晶香柚果皮下的海綿層為淡粉色;在果肉顏色方面,琯溪蜜柚果肉無色,三紅蜜柚和水晶香柚果肉為紅色;在種子數(shù)量方面,水晶香柚平均種子個數(shù)110 個,三紅蜜柚和琯溪蜜柚一般無籽或種子發(fā)育不良,僅約芝麻大?。辉诔墒炱诜矫?,水晶香柚要比三紅蜜柚和琯溪蜜柚早20d 左右;在可溶性固形物、可滴定酸、可溶性糖、維生素C 含量和可食率方面,3 者之間均差別不大;在果頂表現(xiàn)方面,水晶香柚果頂印圈明顯完整,三紅蜜柚和琯溪蜜柚無印圈或印圈很淺、不明顯(圖2)。
表1 3 個供試品種的農(nóng)藝性狀
圖1 3 個供試品種果實果形及橫剖面對比
圖2 三紅蜜柚和水晶香柚果頂印圈對比
2.2 全基因組多態(tài)性位點檢測利用Illumina 平臺對三紅蜜柚、琯溪蜜柚、水晶香柚3 個品種進(jìn)行全基因組測序,分別獲得了12.1Gb、11.9Gb、12.4Gb 的重測序數(shù)據(jù)(表2)。參考基因組大小為345779982bp,所有樣本重測序序列的比對率在98.83%~98.93%之間。通過和參考基因組序列進(jìn)行測序數(shù)據(jù)的對比并除去重復(fù)序列,最終3 個品種重測序數(shù)據(jù)對參考基因組的平均覆蓋深度在28.90×到29.89×之間。
表2 重測序樣品測序數(shù)據(jù)質(zhì)量與參考基因組比對情況
2.3 SNP 檢測及注釋結(jié)果經(jīng)過SAMtools 檢測,與柚子參考基因組相比,三紅蜜柚、琯溪蜜柚、水晶香柚分別鑒定出1672671、1654727、1561376 個SNP(表3),包括外顯子區(qū)域變異(終止密碼子獲得變異、終止密碼子失去變異、外顯子同義變異、外顯子非同義變異)、內(nèi)含子區(qū)域變異、剪接位點變異、基因上游1Kb 區(qū)域變異、基因下游1Kb 區(qū)域變異、基因上下游1Kb 區(qū)域同時變異、基因間區(qū)變異等類型,其中基因間區(qū)變異最多,終止密碼子失去變異最少。
表3 重測序樣品測序數(shù)據(jù)SNP 檢測及注釋結(jié)果統(tǒng)計
2.4 InDel 檢測及注釋結(jié)果經(jīng)過SAMtools 檢測、ANNOVAR 軟件進(jìn)行變異注釋,與柚子參考基因組相比,三紅蜜柚、琯溪蜜柚、水晶香柚分別鑒定出247867 個、239948 個、236264 個InDel,包括基因上游1Kb 區(qū)域變異、外顯子區(qū)域變異(終止密碼子獲得變異、終止密碼子丟失變異、缺失導(dǎo)致蛋白質(zhì)編碼框改變變異、插入導(dǎo)致蛋白質(zhì)編碼框改變變異、缺失但蛋白質(zhì)編碼框未改變變異、插入但蛋白質(zhì)編碼框未改變變異)、內(nèi)含子區(qū)域變異、剪接位點變異、基因下游1Kb 區(qū)域變異、基因上下游1Kb 區(qū)域同時變異、基因間區(qū)變異等類型,其中基因間區(qū)變異最多,終止密碼子丟失變異最少(表4)。
表4 重測序樣品測序數(shù)據(jù)InDel 檢測及注釋結(jié)果統(tǒng)計
2.5 SV 檢測及注釋結(jié)果經(jīng)過BreakDancer 軟件比對、ANNOVAR 軟件進(jìn)行變異注釋,與柚子參考基因組相比,三紅蜜柚、琯溪蜜柚、水晶香柚分別鑒定出23591 個、22816 個、22378 個SV,包括基因上游1Kb 區(qū)域變異、外顯子區(qū)域變異、基因下游1Kb 區(qū)域變異、內(nèi)含子區(qū)域變異、基因上下游1Kb區(qū)域同時變異、基因間區(qū)變異、剪接位點變異、片段插入變異、片段丟失變異、片段倒位變異、染色體內(nèi)部重排變異、染色體間重排變異等類型,片段丟失變異SV(DEL)最多,片段插入變異SV(INS)最少,3個品種均沒有片段插入變異(表5)。
表5 重測序樣品測序數(shù)據(jù)SV 檢測及注釋結(jié)果統(tǒng)計
2.6 CNV 檢測及注 釋 結(jié)果經(jīng)過CNVnator 檢測、ANNOVAR 軟件進(jìn)行變異注釋,與柚子參考基因組相比,三紅蜜柚、琯溪蜜柚、水晶香柚分別鑒定出5440 個、5445 個、5336 個CNV,包括基因上游1Kb 區(qū)域變異、外顯子區(qū)域變異、內(nèi)含子區(qū)域變異、基因下游1Kb 區(qū)域變異、基因上下游1Kb 區(qū)域同時變異、基因間區(qū)變異、拷貝數(shù)增加變異、拷貝數(shù)減少變異等類型,其中拷貝數(shù)減少變異CNV 最多,基因上下游1Kb 區(qū)域同時變異類CNV 最少(表6)。與柚子參考基因組相比,3 個品種基因組拷貝數(shù)減少長度在48335200~49301100bp 之間,拷貝數(shù)增加長度在14816900~18582000bp 之間。
表6 重測序樣品測序數(shù)據(jù)CNV 檢測及注釋結(jié)果統(tǒng)計
本研究對三紅蜜柚、琯溪蜜柚、水晶香柚的農(nóng)藝性狀進(jìn)行了調(diào)查和比較,3 個柚類品種差異主要體現(xiàn)在果實和果肉外觀上,在可溶性固形物、可滴定酸、可溶性糖、維生素C 含量和可食率方面3 者之間相差不大,水晶香柚果實重量比三紅蜜柚、琯溪蜜柚輕,品質(zhì)與三紅蜜柚、琯溪蜜柚不相上下,但成熟期更早。推廣種植水晶香柚滿足梅州柚種植戶對早熟新品種的需求,能有效搶占市場先機(jī),可以有效解決梅州柚成熟期較為集中的問題,優(yōu)化梅州蜜柚品種結(jié)構(gòu)。
本研究通過對三紅蜜柚、琯溪蜜柚和水晶香柚3 個柑橘品種的重測序數(shù)據(jù)進(jìn)行分析,系統(tǒng)研究了3 個品種在基因組水平上存在的CNV 區(qū)間和SNP 熱點區(qū)間,比較了單核苷酸多態(tài)性(SNP)、插入/缺失(InDel)、結(jié)構(gòu)變異(SV)、品種拷貝數(shù)變異(CNV)序列差異,在全基因組水平解析了3 者的遺傳差異。與柚子參照基因組比較發(fā)現(xiàn),3 個品種均有大量SNP、InDel、SV、CNV,變異類型總數(shù)SNP>InDel>SV>CNV,其中基因間區(qū)SNP 最多,終止密碼子失去變異類SNP 最少;基因間區(qū)InDel 最多,終止密碼子丟失InDel 最少;片段丟失變異SV(DEL)最多,片段插入變異SV(INS)最少;拷貝數(shù)減少變異CNV 最多,基因上下游1Kb 區(qū)域同時變異類CNV 最少;與柚子參照基因組相比,3 個品種基因組中各類變異的數(shù)量非常接近。本研究為進(jìn)一步研究三紅蜜柚、琯溪蜜柚和水晶香柚提供了重要的基因組變異數(shù)據(jù),為今后柚子育種改良中更好地利用提供了重要遺傳信息。本研究的方法為以后借助基因組測序方法快速定位和克隆候選基因提供了新的參考。