崔承齊,劉艷陽,杜振偉,武 軻,江曉林,鄭永戰(zhàn),梅鴻獻
(河南省農(nóng)業(yè)科學院 芝麻研究中心,河南 鄭州 450002)
芝麻(Sesamum indicumL.)屬胡麻科胡麻屬,是我國重要的特色油料作物[1]。芝麻種子含油量45%~60%,蛋白質(zhì)含量15%~25%,還含有豐富的維生素和獨特的抗氧化物質(zhì),如芝麻素和芝麻林素等[2-3]。研究表明,由于抗氧化物質(zhì)的存在,芝麻油具有降血壓、降膽固醇、保護腦神經(jīng)的作用[4-6]。因此,芝麻不僅被應用于優(yōu)質(zhì)食用油生產(chǎn)和食品加工,也被廣泛應用于醫(yī)療保健等方面。近年來,隨著人們對芝麻膳食及其保健功效認識的不斷提高,市場對含油量高、抗氧化物質(zhì)含量高的優(yōu)質(zhì)芝麻需求急劇增加。因此,提高芝麻種子含油量和抗氧化物質(zhì)含量,改善芝麻食用品質(zhì)已經(jīng)成為芝麻育種的重要目標之一。
作物品質(zhì)性狀是典型的復雜數(shù)量性狀,受多基因控制,且基因間、基因與環(huán)境間存在廣泛的互作[7-9],傳統(tǒng)育種方法難以實現(xiàn)對這些復雜性狀的高效遺傳操作。大量研究證明,傳統(tǒng)育種和分子標記輔助選擇相結合是改良復雜農(nóng)藝性狀的有效方法[10-12]。數(shù)量性狀位點(Quantitative trait loci,QTL)是進行重要農(nóng)藝性狀分子標記輔助選擇的先決條件。目前,在主要農(nóng)作物上利用連鎖分析和關聯(lián)分析定位了大量控制重要農(nóng)藝性狀的QTL[13-20],為目標性狀的分子標記輔助選擇和遺傳改良奠定了堅實的基礎。芝麻作為小作物研究相對滯后,由于缺乏分子標記和參考基因組信息,長期以來一直限制著重要農(nóng)藝性狀的遺傳解析[21]。危文亮等[22]利用20對簡單重復序列(Simple sequence repeats,SSR)標記、43 對相關序列多態(tài)性(Sequence-related amplified polymorphisms,SRAP)標記及16 對擴增片段 長 度 多 態(tài) 性(Amplified fragment length polymorphisms,AFLP)標記在2 個環(huán)境下重復檢出8個與含油量顯著關聯(lián)的標記。LI 等[23]利用112 對SSR 標記,通過關聯(lián)分析檢測到19 個標記與含油量關聯(lián),24個標記與蛋白質(zhì)含量關聯(lián)。隨著測序技術的快速發(fā)展和芝麻參考基因組的釋放[24-26],單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)等高通量標記被成功應用于芝麻遺傳連鎖作圖和全基因組關聯(lián)分析[3]。WEI 等[27]利用1 805 413 個SNP 標記,通過全基因組關聯(lián)分析檢測到549個與產(chǎn)量、品質(zhì)等性狀關聯(lián)的信號。吳坤等[28]利用包含1 230 個標記的高密度遺傳圖譜定位了21 個與白芝麻籽粒油脂、蛋白質(zhì)及芝麻素含量相關的QTL。目前,雖然在芝麻上已經(jīng)鑒定到了一些與品質(zhì)性狀相關的QTL/基因[22-23,27-31],但由于其數(shù)量性狀的復雜特性,在不同群體或環(huán)境間檢測到的很多QTL 重復性差,大大限制了品質(zhì)性狀的遺傳解析。鑒于此,利用豫芝4 號和孟加拉小籽為親本構建了F2:3、BC1和BC1F2等3 個不同世代群體,對其脂肪、蛋白質(zhì)、芝麻素和芝麻林素含量等4 個品質(zhì)性狀進行QTL 定位,并在不同世代群體和不同環(huán)境間相互驗證以提高定位的準確性,為芝麻品質(zhì)性狀的分子標記輔助選擇和改良提供依據(jù)。
豫芝4 號是河南省駐馬店市農(nóng)業(yè)科學院于20世紀90年代選育的芝麻品種,多年來在黃淮流域芝麻產(chǎn)區(qū)廣泛種植,千粒質(zhì)量3.1 g,含油量和蛋白質(zhì)含量分別為55.9%和21.14%;孟加拉小籽引種自孟加拉國,千粒質(zhì)量1.6 g,含油量和蛋白質(zhì)含量分別為46.8%和19.26%。以豫芝4 號為母本,孟加拉小籽為父本配制F1組合,自交構建F2群體,同時以豫芝4 號為輪回親本進行回交,構建BC1群體,然后分別在F2和BC1群體中隨機選取150 個單株自交衍生出F2:3和BC1F2家系用于表型鑒定。
2014 年冬季在海南省三亞市(2014SY)種植BC1群體;2018 年分別在河南省南陽市(2018NY)、駐馬店市平輿縣(2018PY)、漯河市(2018LH)3 個試驗點種植150 個BC1F2家系;2019 年和2020 年分別在海南省三亞市(2019SY 和2020SY)種植150 個F2:3家系。田間試驗均為單行區(qū),2.5 m 行長,2 次重復,隨機區(qū)組排列,正常田間管理。植株正常成熟后,BC1群體按單株收獲,BC1F2家系和F2:3家系每小區(qū)選取5株進行混收,充分晾干、脫粒,并進行品質(zhì)檢測。
利用DA7200 型近紅外分析儀進行脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量的測定[32],每份樣品重復測定3 次,取平均值。分別以F2:3家系和BC1F2家系各重復平均值代替F2單株和BC1單株的表型值進行QTL分析。
采用改良的CTAB 法[33]提取親本及群體植株的DNA,利用Illumina HiSeq 2000平臺對BC1群體DNA進行特異位點擴增片段簡化測序(Specific-locus amplified fragment sequencing(SLAF-seq),然后參照MEI 等[21]的方法開發(fā)SLAF 標記,具體方法如下:首先利用BWA 軟件將BC1群體和雙親的高質(zhì)量測序序列比對到Zhongzhi No.13 version 1.0 參考基因組[25],獲得28 731個在雙親間存在多態(tài)性的SLAF標記;然后根據(jù)基因型編碼規(guī)則,篩選獲得28 731 個符合aa×bb型的SLAF標記;其次過濾掉在雙親中深度小于10×的SLAF 標記,再過濾掉子代群體中缺失率>10%的SLAF 標記;最終獲得3 548 個高質(zhì)量SLAF標記用于后續(xù)圖譜構建。
SSR 標記開發(fā):首先基于Zhongzhi No.13 version 1.0 參考基因組序列,利用MISA 軟件檢測全基因組SSR 位點,然后篩選豫芝4 號和孟加拉小籽之間的差異SSR 位點,獲得1 024 個均勻分布在基因組上的SSR 序列,再利用PRIMER 3 軟件進行引物設計,在雙親間進行多態(tài)性驗證,獲得351個具有多態(tài)性的SSR標記用于后續(xù)圖譜構建。
PCR 擴增及擴增產(chǎn)物檢測參考WEI 等[34]的方法,PCR 反應條件:95 ℃預變性4 min;94 ℃變性30 s,55~57 ℃退火45 s,72 ℃延伸1 min,進行30 個循環(huán);循環(huán)結束后,72 ℃延伸7 min,10 ℃保溫10 min。擴增產(chǎn)物經(jīng)非變性聚丙烯酰胺凝膠電泳進行分離,采用9%凝膠,電泳緩沖液為0.5 倍TBE,180 V 恒壓電泳1.5 h。電泳結束后,進行銀染,清水沖洗,在凝膠成像系統(tǒng)上照相并記錄基因型數(shù)據(jù)。
參照MEI 等[33]的方法,利用JoinMap 4.0 軟件,結合上述3 548個SLAF 標記和351個SSR 標記進行BC1群體的高密度遺傳圖譜構建,最終共有3 294 個SLAF 標記和347 個SSR 標記上圖;在351 個SSR 標記中隨機選取166個均勻分布在基因組上的標記進行F2群體的圖譜構建,獲得一張包含152 個標記的遺傳圖譜。
利用QTL IciMapping 4.2 軟件的完備區(qū)間作圖法對芝麻的脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量進行QTL 檢 測,LOD(Logarithm of odds)閾 值 設 為2.5[35]。將至少在1 個環(huán)境中表型變異解釋率大于10%的位點定義為主效QTL;在同一連鎖群定位于5 cM 內(nèi)并且加性效應方向一致的QTL 定義為相同QTL[33]。QTL 命名方式是以字母“q”開頭表示QTL,后接性狀名稱的縮寫,再接連鎖群的編號,最后是該染色體上控制此性狀的QTL 序號(q+性狀名稱縮寫+連鎖群編號+QTL 序號)[36],脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量的縮寫分別為OC、PC、Smin、Smol。
用于連鎖作圖的BC1、BC1F2和F2:3群體在不同環(huán)境下脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量均值描述統(tǒng)計結果如表1。3個群體不同環(huán)境下,脂肪含量和蛋白質(zhì)含量變異系數(shù)分別為2.22%~5.75%和5.40%~16.93%,而芝麻素含量和芝麻林素含量變異系數(shù)分別是16.49%~25.57%和12.20%~33.36%,說明芝麻素含量和芝麻林素含量更易受環(huán)境影響。除了個別環(huán)境外,4 個品質(zhì)性狀的峰度和偏度絕對值均小于1,基本符合正態(tài)分布或近似正態(tài)分布,表明這些性狀都是受多基因控制的數(shù)量性狀,適于用QTL定位的方法進行遺傳基礎剖析。
對BC1F2和F2:3的品質(zhì)性狀表型數(shù)據(jù)平均值進行相關性分析(表2),發(fā)現(xiàn)脂肪含量與蛋白質(zhì)含量呈極顯著負相關,而與芝麻素、芝麻林素含量呈極顯著正相關;芝麻素含量與芝麻林素含量呈極顯著正相關;蛋白質(zhì)含量與芝麻林素含量呈極顯著負相關;另外,蛋白質(zhì)含量僅在F2:3群體中與芝麻素含量呈極顯著負相關,而在BC1F2群體中與芝麻素含量相關性不顯著。
表2 BC1F2 和F2:3 2個芝麻群體品質(zhì)性狀之間的相關性Tab.2 Phenotypic correlation coefficients of seed quality-related traits in sesame BC1F2 and F2:3 populations
2.2.1 F2:3群 體4 個 品 質(zhì) 性 狀 的QTL 定 位 利 用QTL IciMapping 4.2 軟件的ICIM-ADD 作圖模型對F2:3家系的脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量等4個品質(zhì)性狀進行QTL 定位,共檢測到16個QTL,分別 位 于LG01、LG03、LG05、LG07、LG08、LG10 和LG13連鎖群上(圖1、表3),LOD值為2.55~10.28,解釋相應表型變異的5.08%~27.12%,其中9 個QTL 的表型變異解釋率達到10%以上,被認為是主效QTL。
圖1 芝麻F2:3、BC1和BC1F2群體脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量的QTL定位Fig.1 QTLs detected for oil content,protein content,sesamin content and sesamolin content in sesame F2:3,BC1 and BC1F2 populations
表3 芝麻F2:3、BC1、BC1F2群體4個品質(zhì)性狀的QTL定位Tab.3 QTLs for traits related to seed quality detected in sesame F2:3,BC1,BC1F2 populations
與脂肪含量相關的QTL 有5 個,解釋表型變異的5.08%~27.12%,其中定位在LG10 連鎖群上的主效QTLqOC_10-1在2 個環(huán)境被同時檢測到,分別解釋9.62%和27.12%的表型變異;主效QTLqOC_8-1僅在1 個環(huán)境被檢測到,解釋表型變異的11.76%。微效QTLqOC_5-1在2 個環(huán)境被重復檢測到,解釋表型變異的5.08%~7.77%。與蛋白質(zhì)含量相關的4個QTL 解釋表型變異的9.67%~11.87%,其中主效QTLqPC_5-1、qPC_7-1和qPC_8-1僅在1 個環(huán)境被檢測到,分別解釋表型變異的10.32%、10.24%和11.87%。與芝麻素含量相關的4個QTL解釋表型變異 的7.60%~16.62%,其 中 主 效QTLqSmin_1-1、qSmin_1-2和qSmin_7-1的表型變異解釋率分別為16.62%、16.18%和10.30%。與芝麻林素含量相關的1 個主效QTLqSmol_3-1解釋表型變異的11.12%,2 個微效QTLqSmol_7-1和qSmol_13-1分別解釋表型變異的7.64%和9.74%。
2.2.2 BC1和BC1F2群體4 個品質(zhì)性狀的QTL 定位
在BC1群體和BC1F2家系中共檢測到35 個與品質(zhì)性狀相關的QTL,分布于除LG11 的12 條連鎖群上(圖1、表3);LOD 值是2.55~31.73,表型變異解釋率為1.51%~26.75%,其中,14 個QTL 的表型解釋率在至少1 個環(huán)境中達到10%以上,被認為是主效QTL。
與脂肪含量相關的12 個QTL 表型變異解釋率為4.34%~13.64%,其中3個主效QTL分別是qOC_1-3、qOC_4-1和qOC_10-2。qOC_4-1和qOC_10-2均 在3個環(huán)境中被重復檢測到,分別解釋表型變異的8.08%~12.42% 和11.95%~12.60%;qOC_1-3僅 在1個環(huán)境中被檢測到,解釋表型變異的13.64%。
與蛋白質(zhì)含量相關的5個QTL表型變異解釋率為7.51%~11.74%,其中僅有1 個QTLqPC_7-2為主效QTL,解釋表型變異的11.74%;微效QTL 位點qPC_4和qPC_10均在2 個環(huán)境被重復檢測到,分別解釋表型變異的7.51%~7.98%和7.53%~8.69%。
與芝麻素含量相關的10 個QTL 解釋表型變異的1.51%~26.75%,其中qSmin_7-2和qSmin_8為主效QTL。qSmin_7-2在3 個環(huán)境被重復檢測到,解釋表型變異的4.24%~10.56%;qSmin_8在2 個環(huán)境被重復檢測到,解釋表型變異的13.36%~26.75%。
與芝麻林素含量相關的8個QTL表型解釋率為5.77%~18.40%,其中主效QTLqSmol_5-2和qSmol_7-2均在2個環(huán)境被重復檢測到,分別解釋表型變異的11.44%~14.33%和5.77%~12.38%;其余6 個主效QTL 均在單個環(huán)境被檢測到,解釋表型變異的10.26%~18.40%。
2.2.3 QTL 共定位分析 將F2:3群體的16 個QTL 和BC1、BC1F2群體的35 個QTL 整合到同一遺傳圖譜(圖1、表3),共發(fā)現(xiàn)10 個QTL 簇,分布于LG01、LG02、LG04、LG05、LG07、LG08、LG10 連 鎖 群(表4)。
loci4 位于LG04 連鎖群上,與脂肪和蛋白質(zhì)含量相關聯(lián),包含主效QTL 位點qOC_4-1和微效QTL位點qPC_4。qOC_4-1定位于LG04 的5.21~6.09 cM區(qū)間,qPC_4定位于LG04的2.62~5.82 cM區(qū)間。
loci7 位于LG07 連鎖群上,與芝麻素、芝麻林素含量相關聯(lián),包含3 個主效QTLqSmin_7-1、qSmin_7-2、qSmol_7-2和1 個 微 效QTL 位 點qSmol_7-1。qSmin_7-1和qSmin_7-2分別定位在LG07 的64.74~70.13 cM 和57.69~64.45 cM;qSmol_7-1和qSmol_7-2分 別 定 位 于LG07 的53.27~57.36 cM 和62.26~64.74 cM。
loci8 位于LG08 連鎖群上,與脂肪和芝麻素含量相關。與脂肪含量相關的QTLqOC_8-2位于LG08 的24.96~25.24 cM;與芝麻素含量相關的主效QTLqSmin_8定位于LG08的22.11~25.24 cM。
loci10 位于LG10 連鎖群上,與脂肪、蛋白質(zhì)和芝麻素含量相關。與脂肪含量相關的主效QTLqOC_10-1和qOC_10-2分 別 位 于LG10 的34.38~49.03 cM 和34.95~45.88 cM 區(qū)間;與蛋白質(zhì)含量相關的QTLqPC_10定位于LG10 的36.24~45.88 cM;與芝麻素含量相關QTLqSmin_10定位于LG10 的36.24~45.88 cM。
芝麻脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量與品質(zhì)密切相關,是芝麻品質(zhì)育種的重要選擇目標。張秀榮等[37]對48 份芝麻育成品種的品質(zhì)性狀進行分析發(fā)現(xiàn):芝麻素含量和芝麻林素含量分別為1.87~8.42 mg/g 和0~1.93 mg/g;芝麻素含量與脂肪含量呈極顯著正相關,與蛋白質(zhì)含量呈極顯著負相關。梅鴻獻等[38]發(fā)現(xiàn),芝麻素含量變異幅度為1.32~5.00 mg/g;芝麻素含量與脂肪含量呈顯著正相關,與蛋白質(zhì)含量不存在顯著相關性。吳坤等[28]發(fā)現(xiàn),芝麻素含量與脂肪含量呈顯著正相關,與蛋白質(zhì)含量呈顯著負相關。在本研究中,芝麻素含量和芝麻林素含量分別是0.85~6.98 mg/g 和0.51~5.28 mg/g,與以往研究的變異范圍基本相近;相關性分析表明,芝麻素、芝麻林素含量均與脂肪含量呈極顯著正相關,與蛋白質(zhì)含量呈極顯著負相關(除BC1F2外),表明在提高芝麻脂肪含量的同時也可以提高芝麻素和芝麻林素的含量。
芝麻脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量受多基因調(diào)控,易受外界環(huán)境的影響,發(fā)掘芝麻品質(zhì)相關的穩(wěn)定主效QTL 是開展分子標記輔助選擇育種的重要前提。同一分離群體在不同環(huán)境條件下鑒定到的QTL 數(shù)目、貢獻率可能不完全一樣[39],另外,控制同一性狀的QTL 在不同環(huán)境或者不同遺傳群體中的表達情況也可能不一致[40]。因此,多群體和多環(huán)境鑒定對于提高QTL 定位的準確性至關重要。雖然F2和BC1群體具有遺傳信息豐富和分離廣泛等優(yōu)點,但低重復性限制了2類群體的應用,其對應的F2:3家系和BC1F2家系既有F2和BC1群體的遺傳豐富性,又可以在一定程度上增加重復性。因此,本研究利用豫芝4號和孟加拉小籽構建的F2:3和BC1F2群體,分別在2 個和3 個環(huán)境中對脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量等4 個品質(zhì)性狀進行表型鑒定和多環(huán)境的QTL 定位。利用連鎖作圖共定位了51 個品質(zhì)性狀相關的QTL,分布在除LG11 外的其余連鎖群上,LOD 值為2.55~31.73,表型變異解釋率為1.51%~27.12%。芝麻脂肪含量的主效QTLqOC_4-1和qOC_10-2在3個環(huán)境被重復檢測到,qOC_10-1在2 個環(huán)境被重復檢測到;蛋白質(zhì)含量的主效QTLqPC_7-1(F2:3群體)和qPC_7-2(BC1群體)定位區(qū)間相重合,為同一QTL 位點;芝麻素含量的主效QTLqSmin_7-2和qSmin_8分別在3 個和2 個環(huán)境被重復檢測到;芝麻林素含量的主效QTLqSmol_5-2和qSmol_7-2均在2 個環(huán)境被重復檢測到。上述鑒定的穩(wěn)定主效QTL 可用于芝麻品質(zhì)性狀的分子標記輔助選擇育種和遺傳改良。
目前,利用連鎖分析或者關聯(lián)分析檢測到了多個與芝麻脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量相關的QTL/SNP[22-23,27-31]。以S.indicumcv.Baizhima”[26]為參考基因組,本研究通過連鎖分析定位到8 個QTL與已有QTL/SNP 位點相近或重合,如:與脂肪含量相關的qOC_10-2與吳坤等[28]檢測到的Qpc-1相臨近;與芝麻林素含量相關的qSmol_2-1和qSmol_2-2均與吳坤等[28]檢測到的Qsc-8相重疊。WEI 等[27]鑒定到的脂肪含量相關SNP(LG11:11711506)定位到qOC_8-1附近;與芝麻素含量關聯(lián)的SNP(LG3:15765268)和SNP(LG6:6879276)分 別 定 位 到qSmin_5-2和qPC_7-2附近或區(qū)間內(nèi);與芝麻林素含量 關 聯(lián) 的SNP(LG1:16715677 )和SNP(LG4:8016804)分別定位在qSmol_3-1和qSmol_2-2區(qū)間內(nèi)或附近位置。
通過比較QTL 的定位結果可以發(fā)現(xiàn),不同性狀相關QTL 存在共定位的現(xiàn)象,比如:脂肪含量相關QTLqOC_4-1與蛋白質(zhì)含量相關QTLqPC_4的定位區(qū)間在連鎖群LG04 上存在部分重疊,其中qOC_4-1的加性效應為正值,qPC_4的加性效應為負值;LG07 連鎖群上的qSmin_7-1、qSmin_7-2、qSmol_7-1和qSmol_7-2的定位區(qū)間相近或重疊,加性效應均為負值;qOC_10-1與qOC_10-2定位區(qū)間基本一致,被認為是同一個QTL,它們與qPC_10和qSmin_10共定位于連鎖群LG10 上,除了qPC_10的加性效應是負值外,其余位點的加性效應均為正值。這些結果從分子機制上印證了脂肪、蛋白質(zhì)、芝麻素、芝麻林素含量之間相關性分析的結果,也反映其相關QTL 存在緊密連鎖或一因多效的關系。