,,,,,,*
(1.石河子大學(xué),新疆 石河子832003;2.中國農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所,北京100193)
開花性狀是紫花苜蓿(Medicagosativa)重要的農(nóng)藝性狀,產(chǎn)量積累主要發(fā)生在開花之前,通過推遲始花期能夠提高產(chǎn)量[1]。開花是植物由營養(yǎng)生長向生殖生長轉(zhuǎn)變的重要標志之一,對植物的有性生殖起著決定性的作用[2]。始花期與苜蓿干草的產(chǎn)量和品質(zhì)密切相關(guān),一直是苜蓿遺傳育種過程中的主要關(guān)注指標之一。掌握始花期遺傳規(guī)律能夠幫助管理者選擇最適合的放牧?xí)r期和收獲期,從而獲得更高的經(jīng)濟效益[3]。與其他作物相比,苜蓿開花性狀的相關(guān)報道比較少,這主要與紫花苜蓿遺傳性狀的復(fù)雜性及相關(guān)分析技術(shù)的限制有關(guān)。苜蓿為無限花序,一般群體的開花時間可以延續(xù)40~60 d。將始花期作為一個苜蓿開花過程的基準,有助于更加精細地描述、分析和預(yù)測植物的發(fā)育。始花期屬于多基因控制的數(shù)量性狀,由遺傳因素和環(huán)境因素共同決定[4]。研究始花期性狀的遺傳構(gòu)成對深入研究開花性狀的遺傳規(guī)律具有重要意義。前人利用紫花苜蓿雜交后代研究不同農(nóng)藝性狀之間的關(guān)系已有報道,通過調(diào)控始花期能夠獲得更高的產(chǎn)量[5]。將始花期具有差異的材料進行雜交能夠獲得始花期性狀差異明顯的F1代材料[6]。但是從表型性狀進行紫花苜蓿早熟遺傳的相關(guān)研究國內(nèi)還未見報道,而通過IECM算法計算主+多基因混合遺傳模型是分析數(shù)量性狀遺傳規(guī)律的有效方法[7]。在紫花苜蓿研究中,利用主多基因進行表型性狀分析的研究還比較少,這主要是因為主多基因一般應(yīng)用于二倍體聯(lián)合世代分析[8]。但是利用該方法分析F2代遺傳模型的研究也有報道[9],這說明利用主多基因模型進行遺傳分析也可以應(yīng)用于單個世代。曹錫文[10]開發(fā)出主多基因SEA軟件,這也為主多基因分析提供了極大的便利條件。
紫花苜蓿為同源四倍體,其雜合水平高,導(dǎo)致多種構(gòu)圖群體存在偏差。由于多倍體復(fù)雜的遺傳特性和相關(guān)的輔助構(gòu)圖軟件的限制,使得遺傳圖譜的構(gòu)建相對困難。借助二倍體分析軟件對紫花苜蓿進行研究是一種有效的方法[11]。分子遺傳連鎖圖譜的構(gòu)建是數(shù)量性狀基因定位、分子標記輔助育種以及基因克隆的重要理論基礎(chǔ), 利用遺傳連鎖圖譜尋找分子標記與控制優(yōu)良性狀基因之間的連鎖關(guān)系,對植物基礎(chǔ)遺傳育種研究具有重要的應(yīng)用價值[12]。王夢穎等[13]對早熟材料產(chǎn)生的雜交F1群體進行分析,初步構(gòu)建出紫花苜蓿遺傳連鎖圖譜。賈瑞等[14]也利用15個雜交組合產(chǎn)生的F1代單株進行了生物學(xué)性狀測定。近年來植物遺傳圖譜的構(gòu)建研究相對來說比較多,北柴胡(Bupleurumchinense)[15]、甘薯(Dioscoreaesculenta)[16]等植物的遺傳圖譜已經(jīng)被構(gòu)建。但是利用紫花苜蓿進行遺傳連鎖圖譜研究的報道仍然較少,使得相關(guān)QTL定位分析相對困難,難以加快苜蓿的育種進程。GBS技術(shù)的出現(xiàn)彌補了分子標記數(shù)量的限制,較傳統(tǒng)的標記檢測方法來說能夠獲得更多的SNP標記,提高遺傳連鎖圖譜的密度。本研究利用紫花苜?;ㄆ诓町惷黠@的F1代群體進行相關(guān)研究,并結(jié)合GBS測序技術(shù)進行遺傳分析,重點分析始花期性狀的遺傳特性,并進行早熟性狀的QTL定位分析,以期利用植物遺傳連鎖圖以及QTL定位方法,為解析紫花苜蓿開花性狀的遺傳規(guī)律、培育高產(chǎn)苜蓿新品種提供理論依據(jù)。
供試材料為中苜系列品種選育過程中的中間材料:低產(chǎn)早熟紫花苜蓿(父本,來源于滄州苜蓿)、高產(chǎn)晚熟紫花苜蓿(母本,來源于中苜1號 )單株個體及二者雜交產(chǎn)生的152個F1代單株個體。
雜交群體表型觀測試驗于2014-2016年在中國農(nóng)業(yè)科學(xué)院國際農(nóng)業(yè)高新技術(shù)產(chǎn)業(yè)園基地(河北省廊坊市境內(nèi))進行。該地位于河北省西北部,屬暖溫帶大陸性季風(fēng)氣候, 年平均氣溫11.9 ℃左右, 最冷月份(1月)平均氣溫為-4.7 ℃, 最熱月份(7月)平均氣溫為26.2 ℃。年降水量554.9 mm。土質(zhì)為中壤土,含有機質(zhì)1.69%,pH值7.37。
雜交種子在溫室培養(yǎng)獲得F1代幼苗,對幼苗進行DNA提取并按照王夢穎等[13]的方法利用SSR分子標記鑒定雜交種,最終獲得152個F1代單株個體。通過扦插獲得親本和F1代單株個體的3個重復(fù)。采用隨機區(qū)組排列進行試驗,設(shè)3次重復(fù),行距1 m,株距0.8 m。在2014年入冬前進行一次刈割,從而保證不同單株間的一致性。于2015和2016年進行始花期的調(diào)查。每年從5月1日起統(tǒng)計不同單株的開花情況,始花期計算從連續(xù)5 d日平均溫度大于10 ℃算起(2015年3月10日;2016年3月16日),直至第一朵小花出現(xiàn)即表示開花所需天數(shù)。
通過對測序數(shù)據(jù)進行分析,獲得20334個親本間具有差異的SNP位點。按照Li等[11]對紫花苜蓿遺傳連鎖圖譜構(gòu)建過程中的分析,僅利用親本間的單雜合位點分析來解決同源四倍體分離復(fù)雜的簡便算法,并且具有較高的準確性[17]。本研究篩選出缺失值小于10%的單雜合SNP位點(AAAAXAAAB型),得到7468個SNP位點(雜合父本5888個,雜合母本1580個)。最后篩選出具有子代分離比為1∶1(P>0.001)的候選位點1320個,雜合父本位點1011個,雜合母本位點309個(表4,表5)。以這些SNP位點為遺傳標記進行連鎖圖譜構(gòu)建及QTL定位。
將2015,2016年的154個單株的3個重復(fù)均值進行基本統(tǒng)計分析,并利用3個重復(fù)的親本數(shù)據(jù)進行親本差異性T檢驗;運用主多基因遺傳模型分析遺傳率。利用R繪制正態(tài)分布圖。根據(jù)植物數(shù)量性狀主多基因混合模型分析方法對不同表型性狀進行分析。采用極大似然法和IECM算法估計各世代、各成分分布的參數(shù),利用AIC值,U12、U22、U32檢驗,Smimov檢驗(nW2),Kolmogorov檢驗(Dn)和Heritability參數(shù),選擇最優(yōu)遺傳模型。使用SEA軟件包進行植物數(shù)量性狀主基因+多基因遺傳體系分析。遺傳連鎖圖譜構(gòu)建主要利用GBS測序產(chǎn)生的SNP標記,根據(jù)親本和F1雜交后代的分離類型進行標記分析。將篩選到的SNP標記導(dǎo)入Joinmap軟件中,以LOD=3為標準構(gòu)建連鎖圖譜,最終構(gòu)建出紫花苜蓿的遺傳連鎖圖譜。將表型數(shù)據(jù)和基因型數(shù)據(jù)導(dǎo)入QTL IciMapping中進行QTL定位分析,軟件參數(shù)為默認參數(shù)。
由表1結(jié)果可知,兩年試驗結(jié)果具有一致性,并且試驗重現(xiàn)性較好。親本間始花期數(shù)據(jù)差異明顯,平均開花時間相差達13 d,T檢驗表明親本間差異達到極顯著水平,同時Levene’s 檢驗證明親本間方差具有同質(zhì)性。F1代均值介于雙親之間,但是變異系數(shù)不大。F1代變異范圍超過雙親差異范圍,這表現(xiàn)出超親分布的特點。
表1 親本和雜交F1代的始花期性狀基本統(tǒng)計分析Table 1 Summary statistics analysis of phenotypes for early flowering-time in the F1 progeny and parents
從圖1的概率密度分布圖中可知,大部分單株開花時間集中在一個區(qū)域,但是有少部分植株開花時間集中在另一個區(qū)域。父本和母本的始花期差異達到極顯著水平(P<0.01)。同時父本開花較早,母本開花較晚,親本差異明顯。另外152個F1代植株的開花期差別也很大,最早開花和最晚開花植株間差異能夠達到20 d,同時兩年始花期數(shù)據(jù)結(jié)果具有相似的分離特點。
正態(tài)性檢驗(Kolmogorov-Smirnov)表明,F1代單株分布為非正態(tài)分布(P<0.05),圖1表明F1代單株的分布呈現(xiàn)出雙峰分布的特點,黑色實線為正態(tài)分布曲線。
圖1 2015年和2016年始花期的概率密度分布圖Fig.1 Density estimate of initial time of flowering in 2015 and 2016 P1, P2分別代表父本,母本。P1, P2 represent paternal and maternal, respectively.
利用數(shù)量性狀主多基因分析法對F1代單株兩年始花期數(shù)據(jù)進行基因聯(lián)合分析,通過極大似然法和IECM算法估算AIC值。根據(jù)最適遺傳模型篩選原則,篩選出AIC值最小和較小者,2015年篩選出2MG-A和2MG-ADI兩個最適遺傳模型(表2)。并對候選模型進行適合性檢驗,結(jié)果顯示2MG-A的nW2檢驗達到顯著水平,其他檢驗未達到顯著水平。而2MG-ADI的U32和nW2檢驗達到顯著水平,這兩個模型都具有兩對主效基因,同時適合性檢驗結(jié)果類似。因此2MG-A和2MG-ADI都可作為候選遺傳模型。2016年篩選出2MG-ADI和2MG-A兩個最適遺傳模型(表3)。并對候選模型進行適合性檢驗,結(jié)果顯示2MG-ADI的nW2檢驗達到顯著水平,其他檢驗未達到顯著水平。而2MG-A的U22和nW2檢驗達到顯著水平,這兩個模型都具有兩對主效基因,同時適合性檢驗結(jié)果類似。因此2MG-A和2MG-ADI都可作為候選遺傳模型,兩年試驗結(jié)果具有一致性,始花期數(shù)據(jù)由兩對主效基因控制,并且兩年結(jié)果具有相同的遺傳模型。
表2 2015年始花期的遺傳參數(shù)估計Table 2 Estimates of genetic parameters for early flowering-time in 2015
MG:主基因;A:加性效應(yīng);D:顯性效應(yīng);I:上位性效應(yīng);E:相等;N:負向。U12、U22、U32、nW2、Dn 分別指均勻性U12、U22、U32檢驗, Smimov檢驗和Kolmogorov檢驗。Heritability:主基因遺傳率。AIC:Akaike信息準則。下同。
MG: Major gene model; A: Additive effect; D: Dominance effect; I: Epistatic interaction; E: Equal; N:Negative. U12、U22、U32、nW2、Dn represent the uniform test U12, U22, U32, Smimov test and Kolmogorov test, respectively. Heritability: Heritability of major gene. AIC:Akaike’s information criterion. The same below.
表3 2016年始花期的遺傳參數(shù)估計Table 3 Estimates of genetic parameters for early flowering-time in 2016
根據(jù)不同遺傳模型的極大似然估計值,確定不同遺傳模型的遺傳參數(shù)(表2和表3)。同時根據(jù)AIC值和適合性檢驗得到最適遺傳模型為2MG-A和2MG-ADI。2015年試驗結(jié)果表明,二者主基因遺傳率都達到98%以上,但是2016年結(jié)果僅有2MG-A達到98%,因此本研究判斷候選模型為2MG-A,主基因的遺傳率為99%。始花期主要受兩對主效基因控制,同時具有加性作用。
將上步篩選到的SNP標記(20334個)導(dǎo)入Joinmap軟件中,按照SNP標記所在的染色體進行連鎖群設(shè)定標準,以LOD=3為標準構(gòu)建連鎖圖譜,進而以重組率小于0.4和LOD值大于1進行SNP標記的排序和篩選,最終得到遺傳圖譜。父本連鎖圖共有430個SNP標記,覆蓋圖距1386 cM,平均標記間圖距3.2 cM,連鎖群長度在122.696~208.514 cM,其中g(shù)roup 8連鎖群最短(表4和圖2)。母本連鎖圖共有99個SNP標記,覆蓋圖距798.73 cM, 平均圖距8.07 cM,連鎖群長度在54.476~148.826 cM,其中g(shù)roup 6連鎖群最短(表5和圖3)。
表5 母本連鎖群基本信息Table 5 Maternal chain group basic information
圖2 父本遺傳連鎖圖Fig.2 Paternal genetic linkage map cM表示重組頻率的測量單位。左側(cè)表示SNP標記在染色體上的相對位置。右側(cè)代表父本SNP編號。cM represents the unit of measurement of the recombination frequency. The left side represents the relative position of the SNP on the chromosome. The right side represents the paternal SNP number.
圖3 母本遺傳連鎖圖Fig.3 Maternal genetic linkage map cM表示重組頻率的測量單位。左側(cè)表示SNP標記在染色體上的相對位置。右側(cè)代表母本SNP標記的編號。cM represents the unit of measurement of the recombination frequency. The left side represents the relative position of the SNP on the chromosome. The right represents the maternal SNP number.
利用SNP標記信息和2年表型信息進行QTL定位,最終兩年數(shù)據(jù)分別定位到2個QTL位點。其中2015年結(jié)果定位到的QTL位點位于3號連鎖群上,2016年定位到的QTL位點位于2號連鎖群上,兩年結(jié)果并沒有相同的QTL位點(表6)。兩個QTL位點的LOD值分別為3.1299 和3.6756,貢獻率分別為12.1334%和11.0157%。
表6 父本QTL定位結(jié)果Table 6 Paternal QTL mapping results
PVE:Phenotypic variation explained by QTL at the current position.
主多基因模型是用傳統(tǒng)方法預(yù)測表型變異信息的一種有效方法,它在許多植物中都有應(yīng)用。周清元等[18]采用主+多基因混合模型預(yù)測甘藍型油菜(Brassicanapus)6世代變異信息,得出果身長、角果長、果喙長等性狀的遺傳模型,并根據(jù)不同遺傳模型的參數(shù)結(jié)果估計出加性效應(yīng)和顯性效應(yīng)值,進而從不同模型間的相互作用中推斷出遺傳進化過程。李忠南等[19]對玉米(Zeamays)6世代進行聯(lián)合分析得出,葉綠素SPAD值主要受兩對主基因+多基因控制。同時該遺傳模型也可以應(yīng)用于動物研究[20],這些模型適合性檢驗結(jié)果良好,因此該方法非常適合應(yīng)用于遺傳分析研究。同時該方法已經(jīng)被沿用多年,在預(yù)測準確性方面有一定的優(yōu)勢,且各種試驗結(jié)果良好。因此該方法適合作為關(guān)聯(lián)分析的基礎(chǔ)步驟,通過表型預(yù)測初步估計遺傳變異信息,為進一步的遺傳分析研究提供參考依據(jù)。
兩年試驗結(jié)果,能夠通過不同年份的試驗結(jié)果信息消除環(huán)境因素,進一步通過不同環(huán)境中穩(wěn)定存在的主多基因模型預(yù)測始花期性狀的遺傳變異規(guī)律。兩年數(shù)據(jù)結(jié)果具有一致性,始花期性狀的最適遺傳模型為2MG-A和2MG-ADI,這兩個遺傳模型在不同年份分別具有最小的AIC值,同時主基因遺傳率能夠解釋98%以上的表型變異信息。此外兩個遺傳模型都是由2對主效基因控制,因此可推斷始花期性狀由兩對主效基因控制。但是2MG-ADI的主基因遺傳率在2016年為0.45%,因此并不是最優(yōu)遺傳模型。而2MG-A遺傳模型在兩年結(jié)果中都能解釋98%的表型變異信息,因此始花期性狀的遺傳信息可以被2MG-A遺傳模型較好解釋,同時始花期性狀受環(huán)境影響因素較小,該性狀主要被遺傳因素影響,相關(guān)遺傳信息能夠在不同環(huán)境中穩(wěn)定表達。
紫花苜蓿為同源四倍體,異花授粉植物,其雜合水平高,因此導(dǎo)致多種構(gòu)圖群體存在偏差。由于多倍體復(fù)雜的遺傳特性和相關(guān)的輔助構(gòu)圖軟件的限制,使得遺傳圖譜的構(gòu)建相對困難[21]。在四倍體苜蓿中已經(jīng)建立了一些基因連鎖圖譜。應(yīng)用QTL作圖,一些重要的農(nóng)藝性狀,如產(chǎn)量[22-23]、耐寒性等[24-25]QTL已鑒定出來。同時已有大量試驗證實在蒺藜苜蓿(Medicagotruncatula)中鑒定出的QTL,對苜蓿的改良具有應(yīng)用價值。如蒺藜苜蓿的遺傳圖譜在抗春季黑莖病和葉斑病的QTL中被確定[26],而且與氮素營養(yǎng)[27-28]及形態(tài)特征[29-30]相關(guān)的QTL也被鑒定出。因此,蒺藜苜蓿QTL定位與遺傳圖譜構(gòu)建的研究為四倍體苜蓿的相關(guān)研究奠定了良好的基礎(chǔ)[26-31]。目前只有為數(shù)不多的幾個完整的紫花苜蓿的遺傳圖譜。最早的報道是用F1群體,分析32個RAPD標記的分離結(jié)果,發(fā)現(xiàn)了9個連鎖群,并且構(gòu)建了四倍體苜蓿的遺傳圖譜[32]。Irwin等[33]利用RAPD和AFLP標記對紫花苜蓿親本進行抗炭疽病研究, 共得到了10個與抗炭疽顯著相關(guān)的標記。Musial等[34]運用RAPD、AFLP和SSR技術(shù)從紫花苜蓿的遺傳圖譜中得到與產(chǎn)量正相關(guān)的標記及與產(chǎn)量負相關(guān)的基因。然而,大多數(shù)分子標記,如SSR等不能夠滿足基因的精細定位和全基因組關(guān)聯(lián)研究[17]。SNP標記構(gòu)建遺傳圖譜,具有共顯性,位點穩(wěn)定等優(yōu)點,是構(gòu)建遺傳圖譜較為理想的分子標記之一。本試驗通過對測序數(shù)據(jù)進行分析,獲得20334個親本間具有差異的SNP位點。最后篩選出具有子代分離比為1∶1(P>0.001)的候選位點1320個,雜合父本位點1011個,雜合母本位點309個,最終構(gòu)建了包含8個連鎖群的遺傳圖譜。父本遺傳圖譜覆蓋圖距為1386 cM,標記間平均圖距3.2 cM, 母本覆蓋圖距798.73 cM, 平均圖距8.07 cM。同時定位到早熟性狀相關(guān)的兩個QTL位點。本結(jié)論和前人研究結(jié)果存在一定差異[11],這主要是分析方法的差別。本研究利用蒺藜苜蓿作為參考基因組進行SNP分型,這樣進行分析的優(yōu)點是SNP在染色體上的位置能夠確定,但是定位到染色體上的SNP標記較少。結(jié)合性狀鑒定結(jié)果,本研究定位到早熟性狀QTL位點,并且表型解釋率較高,因此可以說明本研究的分析方法具有現(xiàn)實可行性。同時也說明這兩個標記附近是控制開花性狀的重要區(qū)域,這些區(qū)域的發(fā)現(xiàn)為紫花苜蓿早熟育種的分子標記輔助選擇提供了有利證據(jù)。
1)利用數(shù)量性狀主多基因分析法對紫花苜蓿雜交F1代單株的兩年始花期數(shù)據(jù)進行基因聯(lián)合分析,篩選出2MG-A為最適遺傳模型。2015年的主基因遺傳率為99%,2016年的主基因遺傳率為98.5%。始花期主要受兩對主效基因控制,同時具有加性作用。
2)構(gòu)建了紫花苜蓿遺傳連鎖圖譜,其中父本遺傳圖譜覆蓋圖距為1386 cM,標記間平均圖距3.2 cM;母本覆蓋圖距798.73 cM, 平均圖距8.07 cM。QTL定位分析獲得2個早熟相關(guān)QTL位點,LOD值分別為3.1299 和3.6756,貢獻率分別為12.1334%和11.0157%。