趙丹陽(yáng),朱 婷,王衛(wèi)東,張思妮,夏雪姣,翟曉光,丁 勤,馬翎健
(西北農(nóng)林科技大學(xué),陜西楊陵 712100)
基因關(guān)聯(lián)分析是以連鎖不平衡為基礎(chǔ),對(duì)自然群體中目標(biāo)性狀的遺傳變異與基因多樣性進(jìn)行關(guān)聯(lián),篩選與表型變異相關(guān)分子標(biāo)記的一種策略,具有低耗費(fèi)、高精度、強(qiáng)實(shí)用性等優(yōu)點(diǎn),目前已廣泛應(yīng)用于水稻[1]、小麥[2]、玉米[3-6]、油菜[7]等作物遺傳育種研究。近年來(lái),小麥的關(guān)聯(lián)分析研究主要圍繞株高、穗粒數(shù)、可育小穗數(shù)、千粒重等產(chǎn)量性狀進(jìn)行。如Wu等[8]對(duì)黃淮麥區(qū)175份小麥的株高、產(chǎn)量相關(guān)性狀進(jìn)行了關(guān)聯(lián)分析,從中篩選出23個(gè)顯著關(guān)聯(lián)的SSR標(biāo)記。有研究發(fā)現(xiàn),Xwmc134與小麥株高相關(guān),在WMC363~Xgwm234之間含控制穗長(zhǎng)的QTL位點(diǎn),Xwmc710、Xbarc235和Xbarc252能以高頻率從親本遺傳于后代,且與穗粒數(shù)、產(chǎn)量緊密相關(guān),Xubc873a~Xwmc63區(qū)間內(nèi)有與可育小穗數(shù)相關(guān)的QTL位點(diǎn),Wmc48與粒重相關(guān)[9-13]。此外,Mir等[14]還發(fā)現(xiàn)了11個(gè)與小麥粒重關(guān)聯(lián)的新型分子標(biāo)記。但是,關(guān)于小麥株高、穗長(zhǎng)、單株穗數(shù)、可育小穗數(shù)、穗粒數(shù)、千粒重等多個(gè)重要產(chǎn)量性狀與分子標(biāo)記的關(guān)聯(lián)分析研究仍較少。
本研究主要以52份黃淮麥區(qū)小麥品種(系)為材料,對(duì)6個(gè)重要產(chǎn)量性狀進(jìn)行兩年多點(diǎn)表型鑒定,利用覆蓋小麥21條染色體全基因組的226個(gè)SSR標(biāo)記和22個(gè)SNP標(biāo)記進(jìn)行關(guān)聯(lián)分析,以期為小麥產(chǎn)量性狀相關(guān)等位變異的鑒定挖掘及分子標(biāo)記輔助育種提供參考。
供試的52份小麥材料中,包括24個(gè)黃淮麥區(qū)主栽品種和28個(gè)西北農(nóng)林科技大學(xué)近期培育的小麥品系。其中,黃淮麥區(qū)主栽品種中,陜西有7個(gè),河南有8個(gè),山東有5個(gè),河北有2個(gè),安徽和江蘇各有1個(gè)(表1)。
2015年將52份供試材料種植于陜西楊凌西北農(nóng)林科技大學(xué)和河南南陽(yáng)農(nóng)科院試驗(yàn)站。2016年將供試材料分別種植于陜西楊凌西北農(nóng)林科技大學(xué)試驗(yàn)站、江蘇宿遷中江種業(yè)育種基地與河南駐馬店農(nóng)科院試驗(yàn)站。按照完全隨機(jī)區(qū)組設(shè)計(jì),單行種植,行長(zhǎng)、行距、株距分別為1.5 m、20 cm、10 cm,每行點(diǎn)播15粒種子,并進(jìn)行常規(guī)田間管理。2016年5月下旬于陜西楊凌、河南南陽(yáng)和2017年5月下旬于陜西楊凌、河南駐馬店、安徽宿遷調(diào)查供試材料表型性狀。每地每個(gè)材料隨機(jī)選取5個(gè)單株測(cè)量其株高、穗長(zhǎng),并對(duì)單株穗數(shù)、可育小穗數(shù)及穗粒數(shù)進(jìn)行計(jì)數(shù)。收獲時(shí)每行隨機(jī)收取10個(gè)單穗,脫粒、烘干、去除碎粒后稱量得其千粒重。
通過(guò)參考文獻(xiàn)和GrainGenes數(shù)據(jù)庫(kù)(http://avena.pw.usda.gov/GG2/index. shtml)篩選出覆蓋小麥全基因組的365對(duì)SSR引物,初篩后最終獲得226對(duì)多態(tài)性引物(A基因組55個(gè),B基因組73個(gè),D基因組98個(gè))。通過(guò)查閱文獻(xiàn)和NCBI數(shù)據(jù)庫(kù)篩選89對(duì)SNP引物對(duì)供試小麥材料進(jìn)行KASP(kompetitive allele specific PCR)基因分型,篩選出多態(tài)性高的22對(duì)SNP引物(A基因組10個(gè),B基因組5個(gè),D基因組7個(gè))。
2016年11月在陜西楊凌小麥育種中心實(shí)驗(yàn)基地取小麥嫩葉,采用改良CTAB法[15]提取DNA,DNA提取液進(jìn)行質(zhì)控后稀釋備用。
SSR標(biāo)記鑒定步驟如下:(1)SSR實(shí)驗(yàn)操作程序和PCR擴(kuò)增參照簡(jiǎn)化的SSR分析體系[16]操作;(2)擴(kuò)增產(chǎn)物用6%非變性聚丙烯酞胺凝膠(polyacrylamide gelelectrophoresis,PAGE)分離,以改進(jìn)的銀染方法[17]染色并于凝膠成像儀中觀察讀帶;(3)分析每對(duì)SSR引物膠圖,因?yàn)樵?50~300 kb間條帶多樣性豐富,從此區(qū)間讀取3條多態(tài)性帶,并按照軟件DataFormater“0,1”帶型格式[18]整理SSR信息。SNP標(biāo)記鑒定均參照AS-PCR[19]擴(kuò)增及產(chǎn)物檢測(cè)的方法,用384孔板進(jìn)行高通量PCR,于微孔板熒光分析儀得到所需數(shù)據(jù)。由于SNP引物較少,且其分型結(jié)果與SSR 標(biāo)記格式不同,后續(xù)分析將其轉(zhuǎn)化為SSR的“0,1”格式進(jìn)行軟件分析。
表1 試驗(yàn)材料編號(hào)及其來(lái)源Table 1 Origin and name of the tested materials
運(yùn)用SPSS 22.0對(duì)表型數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析和方差分析,作出5種環(huán)境的表型分析表。通過(guò)DataFormater軟件將,標(biāo)記的“0,1”帶型轉(zhuǎn)為“bp”帶型及其他分子遺傳學(xué)軟件可導(dǎo)入的格式。利用Powermarker 進(jìn)行遺傳多樣性分析,獲得每個(gè)分子標(biāo)記的基因多樣性指數(shù)、等位變異豐富度及多態(tài)性信息含量(polymorphism information content,PIC)等信息。并進(jìn)行UPGMA聚類分析,結(jié)合iTOL(http://itol.embl.de/)網(wǎng)站進(jìn)行聚類圖的繪制與修飾。通過(guò)NTsys軟件分析獲得供試材料的親緣關(guān)系矩陣,并進(jìn)行親緣關(guān)系聚類熱圖繪制,并與UPGMA聚類結(jié)果進(jìn)行比對(duì)。運(yùn)用Structure 軟件估計(jì)52份材料的群體結(jié)構(gòu),基于貝葉斯方法得到每個(gè)材料對(duì)應(yīng)的Q值,將52份材料劃分為不同的亞群,繪制群體遺傳結(jié)構(gòu)圖。
基于供試材料表型數(shù)據(jù)分析與分子標(biāo)記遺傳多樣性、聚類、親緣關(guān)系及群體結(jié)構(gòu)分析,利用獲得的表型數(shù)據(jù)、群體Q值、親緣關(guān)系Kinship值、標(biāo)記帶型等與TASSEL 3.0 軟件結(jié)合其混合線性模型(multilevel linear model, MLM)進(jìn)行表型性狀與標(biāo)記間的關(guān)聯(lián)分析。通過(guò)關(guān)聯(lián)分析獲得關(guān)聯(lián)位點(diǎn),進(jìn)行優(yōu)異等位基因的發(fā)掘并計(jì)算在P<1/N時(shí)對(duì)標(biāo)記位點(diǎn)表型變異的解釋率(R2)。
描述性統(tǒng)計(jì)分析(表2)表明,不同地區(qū)間、性狀間小麥兩年表型性狀差別均較大。在地區(qū)間,產(chǎn)量由河南、安徽、陜西依次遞減,6個(gè)重要產(chǎn)量性狀的這種趨勢(shì)基本一致;在性狀間,穗長(zhǎng)和單株穂數(shù)的變異系數(shù)最大,可育小穗數(shù)和穗粒數(shù)次之,千粒重和株高的變異系數(shù)最小。方差分析(表3)表明,6個(gè)性狀在不同地區(qū)間和材料間均存在顯著或極顯著差異,說(shuō)明這些小麥性狀受環(huán)境和遺傳因素影響均較大。
表2 供試群體6個(gè)產(chǎn)量性狀表型的描述性統(tǒng)計(jì)分析Table 2 Descriptive statistics of six yield traits of 52 wheat accessions
表3 52個(gè)小麥品種(系)6個(gè)性狀兩年表型數(shù)據(jù)方差分析Table 3 ANOVA for six phenotypic traits in 52 wheat varieties(lines) observed in two years
利用均勻分布于小麥21條染色體上的248個(gè)分子標(biāo)記,在52份小麥材料中共檢測(cè)到899個(gè)等位變異(表4與圖1),每個(gè)位點(diǎn)平均檢測(cè)到3.625個(gè)等位變異,變化范圍為1~5。遺傳多樣性指數(shù)的變化范圍為0.301~0.715,平均值為0.586,其最大和最小值的分子標(biāo)記分別是gwm635和barc204;多態(tài)性信息含量(PIC)變化范圍為0.280~0.666,平均值為0.510,達(dá)到高度多態(tài)的水平(PIC≥0.5),PIC最大和最小值的分子標(biāo)記分別為gwm635和barc204。在基因組水平上,B染色體組的等位變異總數(shù)和平均等位變異豐富度均最高,D染色體組次之,A染色體組最低;A染色體組的遺傳多樣性指數(shù)和多態(tài)性信息含量(PIC值)最高,B染色體組中等,D染色體組最低。
表4 248個(gè)標(biāo)記在供試小麥群體基因組水平上的遺傳多樣性分析Table 4 Genetic diversity analysis among genome in 52 wheat accessions
圖1 等位變異數(shù)與遺傳多樣性指數(shù)(GI)和多態(tài)性信息含量(PIC)的散點(diǎn)圖Fig.1 Scatter plot of allele number,gene diversity(GI) and PIC
利用Structure 2.3.4軟件分析,得到52份小麥材料群體結(jié)構(gòu)Q值與極大似然值LnP(D),由LnP(D)計(jì)算不同K值間的ΔK來(lái)確定最佳K值(圖2)。當(dāng)K=4時(shí),LnP(D)改變平滑趨勢(shì)且ΔK曲線具有明顯的拐點(diǎn),即52個(gè)材料被劃分為4個(gè)亞群(圖3),4個(gè)亞群所含品種數(shù)分別為12、24、7、9,占總材料數(shù)的比例分別為23.1%、46.1%、13.5%和17.3%。分群結(jié)果表明,各類群中材料與品種(系)育成時(shí)間及地理來(lái)源不完全相關(guān)。
通過(guò)比較UPGMA聚類結(jié)果(圖4)與利用NTsys得到的親緣關(guān)系(圖5),所得群體遺傳結(jié)構(gòu)分類結(jié)果基本一致,也將群體基本劃分為4個(gè)亞群,2種分類方法所劃分的亞群中,僅編號(hào)為20、32、33、42的4個(gè)品種(系)分群有差異。
經(jīng)關(guān)聯(lián)分析,在兩年多點(diǎn)共5種環(huán)境下,與供試材料的株高、穗長(zhǎng)、單株穗數(shù)、可育小穗數(shù)、穗粒數(shù)及千粒重顯著關(guān)聯(lián)的位點(diǎn)有13個(gè),表型變異解釋率(R2)為6.74%~82.71%(表5)。與株高、穗粒數(shù)、千粒重關(guān)聯(lián)的位點(diǎn)各有1個(gè),分別位于3A、4A、7D染色體上;與穗長(zhǎng)關(guān)聯(lián)的位點(diǎn)有5個(gè),其中位于A、B染色體組的位點(diǎn)各2個(gè),位于D染色體組的位點(diǎn)1個(gè);與單株穂數(shù)關(guān)聯(lián)的位點(diǎn)有5個(gè),其中位于A染色體組3個(gè),位于D染色體組的位點(diǎn)有2個(gè);與可育小穗數(shù)關(guān)聯(lián)的分子標(biāo)記有3個(gè),其中位于B染色體組的標(biāo)記2個(gè),D染色體組的標(biāo)記1個(gè)。其中分子標(biāo)記xwmc580、xwmc181與穗長(zhǎng)、單株穗數(shù)均顯著關(guān)聯(lián),貢獻(xiàn)率最高的分子標(biāo)記為wmc331。與產(chǎn)量性狀顯著關(guān)聯(lián)的SNP標(biāo)記及其引物序列已列出以供參考(表6)。
圖2 LnP(D)、ΔK估算群體結(jié)構(gòu)圖Fig.2 Estimation of population structure by the likelihood distribution and delta K values(ΔK)
圖3 利用 Structure 軟件對(duì)供試材料的群體遺傳結(jié)構(gòu)Fig.3 Population structure(K=4) of materials by Structure software
圖4 52份供試小麥材料聚類圖Fig.4 Dendrogram of 52 wheat accessions by UPGMA cluster analysis
圖5 52份供試小麥材料親緣關(guān)系聚類熱圖Fig.5 Image clustering of 52 wheat accessions by Kingship analysis
表5 與產(chǎn)量性狀顯著相關(guān)的標(biāo)記位點(diǎn)Table 5 SSR loci significantly associated with yield-related traits in wheat
表6 所得顯著關(guān)聯(lián)SNP標(biāo)記及其引物序列Table 6 SNP loci and primer sequences significantly associated with yield-related traits in wheat
在遺傳多樣性評(píng)價(jià)體系中,平均等位變異豐富度、基因遺傳多樣性、多態(tài)性信息含量均被普遍應(yīng)用[20]。本試驗(yàn)所選分子標(biāo)記平均等位變異豐富度分布(B>D>A)和遺傳多樣性指數(shù)與多態(tài)性信息含量分布(A>B>D)不同,且與人們普遍認(rèn)為的小麥基因組遺傳多樣性B>A>D有所差異。究其原因,一方面可能由于分子標(biāo)記只是一段較短DNA序列,不能代表所有基因在染色體上的分布特征,當(dāng)所用標(biāo)記數(shù)量不同時(shí),分析結(jié)果可能不同[21]。如李 遠(yuǎn)等[22]用86對(duì)與趙 檀等[21]用231對(duì)多態(tài)性SSR引物對(duì)相同小麥材料遺傳多樣性的分析結(jié)果差異明顯。另一方面,本研究的試驗(yàn)群體較小,且多為陜西省培育的小麥品種(系),可能存在部分基因座,盡管等位變異較少,但其PIC值仍然很高,即引物的多態(tài)性信息含量高,其等位變異位點(diǎn)不一定多。趙 檀等[21]、ZHANG等[23]研究認(rèn)為,評(píng)價(jià)種質(zhì)資源遺傳多樣性不能僅僅用平均等位變異豐富度或基因多樣性、多態(tài)性信息含量作為評(píng)判標(biāo)準(zhǔn),而有必要對(duì)各指標(biāo)進(jìn)行權(quán)衡。 因此,本研究初步認(rèn)為,由 52個(gè)黃淮麥區(qū)小麥品種(系)組成的試驗(yàn)群體,其遺傳多樣性水平在三個(gè)染色體組間沒(méi)有明顯差異。
本試驗(yàn)將52份供試材料分為4個(gè)亞群,此分群結(jié)果表明各類群中材料與品種(系)育成時(shí)間及地理來(lái)源不完全相關(guān),分析其原因可能是黃淮麥區(qū)生態(tài)條件較為相似,育種材料共享力度加大,常用骨干親本有限,導(dǎo)致了黃淮麥區(qū)品種(系)間親緣關(guān)系較近,遺傳多樣性降低。今后,育種工作應(yīng)重視擴(kuò)大引進(jìn)與利用國(guó)外資源,挖掘中國(guó)豐富的地方種質(zhì)資源,不斷拓寬改造中國(guó)小麥的遺傳基礎(chǔ)。
本研究中與穗長(zhǎng)、單株穗數(shù)均顯著相關(guān)的標(biāo)記為xwmc181、xwmc580。要燕杰等[24]發(fā)現(xiàn),xwmc580與8個(gè)品質(zhì)和產(chǎn)量性狀在0.01水平上顯著相關(guān),且其被推測(cè)與較好綜合農(nóng)藝性狀[25]有關(guān)聯(lián),在長(zhǎng)穗偃麥草研究及小麥遺傳改良中有重要利用價(jià)值,這與本研究結(jié)果一致。xwmc181被定位到2DL,且與小麥黃花葉病毒的抗性相關(guān)[26]。此標(biāo)記也與直立和下披旗葉性狀連鎖[27]。本試驗(yàn)中與穗長(zhǎng)顯著相關(guān)的標(biāo)記還有xwmc719,其與水稻植株的矮化性狀關(guān)聯(lián)[28],也與小麥抗條銹病性狀[29-30]緊密連鎖。gwm296、barc178和xwmc331與可育小穗數(shù)顯著相關(guān)。在這三個(gè)分子標(biāo)記中,barc178與小麥花前持續(xù)時(shí)間呈正相關(guān)[31],結(jié)合本試驗(yàn)檢測(cè)結(jié)果,推測(cè)該區(qū)段基因可能與小麥開(kāi)花期發(fā)育相關(guān);gwm296不僅與雌性不育小麥XND126育性基因連鎖[32],還與植株的抗葉銹病基因 Lr22a>緊密連鎖[33],與抗葉銹病基因 LrSV1>關(guān)聯(lián)[34];xwmc331被定位于4D染色體42.9 cM處[35],其與耐鋁[36]、抗赤霉病[37]等性狀相關(guān)聯(lián),是用于小麥育種輔助選擇優(yōu)良分子標(biāo)記。與千粒重顯著相關(guān)標(biāo)記gwm44位于7DS上,是識(shí)別小麥持久抗條銹病基因 Yr18>關(guān)聯(lián)的候選標(biāo)記[38]。綜上所述,本試驗(yàn)中與產(chǎn)量性狀顯著關(guān)聯(lián)位點(diǎn)與前人利用 SSR、QTL等定位位點(diǎn)的位置相同或接近,但所關(guān)聯(lián)性狀有所不同。
作為第三代分子標(biāo)記,SNPs的缺失率明顯低于SSRs,SNP具有穩(wěn)定遺傳、高效、快捷的特點(diǎn)[39]。本試驗(yàn)綜合兩者,用226個(gè)微衛(wèi)星標(biāo)記與22個(gè)SNP標(biāo)記進(jìn)行遺傳多樣性及關(guān)聯(lián)分析,其結(jié)果更為可信。已有研究表明,在關(guān)聯(lián)分析中同時(shí)使用Q值(群體結(jié)構(gòu)信息)和Kinship值(品種間親緣關(guān)系)的MLM(Q+K)模型優(yōu)于單獨(dú)使用Q值或Kinship值的GLM(Q)和MLM(K)模型[40-41]。 為了提高所關(guān)聯(lián)標(biāo)記的可靠性,本研究對(duì)基因型數(shù)據(jù)采用了Tassel軟件中的混合線性模型MLM(Q+K)進(jìn)行群體結(jié)構(gòu)的分析,最終獲得顯著關(guān)聯(lián)的13個(gè)分子標(biāo)記,這些優(yōu)異等位基因有待進(jìn)一步的精確定位,可為后續(xù)相關(guān)性狀基因的關(guān)聯(lián)定位提供依據(jù)。