王 鵬,田 甜,張沛沛,劉 媛,陳 濤,王彩香,程宏波,楊德龍
(1.甘肅省干旱生境作物學重點實驗室,甘肅蘭州 730070;2.甘肅農(nóng)業(yè)大學生命科學技術學院,甘肅蘭州 730070)
籽粒長度和寬度決定小麥(Triticumaestivum)種子的大小,進而影響小麥的產(chǎn)量和品質,是小麥育種中的重要農(nóng)藝性狀[1]。研究表明,小麥的粒長和粒寬是典型的數(shù)量性狀,由多基因控制,其遺傳基礎復雜,易受環(huán)境因素的影響[2]。目前,QTL定位是深入研究復雜數(shù)量性狀遺傳基礎的有效方法之一,已廣泛應用于作物農(nóng)藝性狀遺傳解析[3]。許多研究者利用不同遺傳背景材料和遺傳圖譜,對小麥粒長和粒寬進行了QTL定位和遺傳分析。Ramya等[4]以Rye Selection 111×中國春構建的RIL群體,檢測到8個控制粒長的QTL和15個控制粒寬的QTL,分布在1A、1D、2B、2D、4B、5A、5B和5D染色體上,單個QTL可解釋4.4%~11.5%的表型變異。Kumari等[5]以NW1014×HUW468構建的RIL群體,在4A和5A染色體上檢測到2個控制粒長的QTL,在6A和7D染色體上檢測到2個控制粒寬的QTL,單個QTL可解釋7.66%~53.84%的表型變異。Xie等[6]以面包小麥×Spelt構建的RIL群體,在1D、2A、3B、4A、5A和7B染色體上檢測到8個控制粒長的QTL;在2D和5A染色體上檢測到2個控制粒寬的QTL,單個QTL可解釋6.6%~31.8%的表型變異。然而,由于群體材料遺傳背景、統(tǒng)計方法、標記類型和環(huán)境條件的不同,導致定位到的控制小麥粒長和粒寬的QTL數(shù)目、染色體位置和遺傳效應差異較大,難以獲得真實、穩(wěn)定的QTL區(qū)段和位點,無法直接在育種實踐中應用。因此,通過整合QTL,可提高小麥粒長和粒寬定位的精確度。
元分析是一種整合前人研究數(shù)據(jù)的統(tǒng)計分析方法,應用于動、植物的QTL整合分析。Arcade等[7]開發(fā)出用于元分析的BioMercator軟件,該軟件可將目標性狀相關的所有QTL位點映射整合在一張遺傳圖譜上,通過比對分析,預測一致性真實QTL位點,并可進一步縮小置信區(qū)間,為精細定位奠定基礎。Semagn等[8]收集183個與玉米花期和產(chǎn)量相關的QTL位點進行元分析,發(fā)現(xiàn)68個一致性QTL(meta quantitative trait loci,MQTL)。雷 蕾等[9]對344個水稻耐鹽相關性狀QTL進行元分析,最終獲得46個MQTL,共篩選出9個與耐鹽性狀相關的候選基因。江培順等[10]通過對584個控制玉米穗行數(shù)、行粒數(shù)、粒重相關的QTL進行元分析,分別發(fā)現(xiàn)7、22和44個與行粒數(shù)、穗行數(shù)和粒重相關的MQTL,最終得到10個與玉米產(chǎn)量性狀相關的基因。本研究將已報道的控制小麥粒長和粒寬的QTL進行歸納整理,以小麥高密度遺傳圖譜作為參考圖譜,利用BioMercator 4.2軟件將這些QTL映射到參考圖譜上,構建小麥粒長和粒寬QTL一致性圖譜,并預測MQTL區(qū)間內與小麥粒長和粒寬相關的候選基因,以期為深入研究小麥粒長粒寬的遺傳機制提供理論依據(jù)。
以美國農(nóng)業(yè)部小麥公共數(shù)據(jù)庫(http://wheat.pw.usda.gov/)和已發(fā)表的文獻中控制小麥籽粒長度和寬度的QTL信息[2-4,6,11-21]為研究對象。
1.2.1 小麥粒長和粒寬QTL信息的收集整合
收集已報道的控制小麥粒長和粒寬QTL定位信息,按照BioMercator 4.2軟件(https://www.mybiosoftware.com/biomercator-2-1-genetic-maps-qtl-integration.html)要求進行數(shù)據(jù)整理,包括QTL名稱、染色體位置、置信區(qū)間、連鎖系數(shù)、貢獻率、臨近標記、LOD值和群體大小等,其中,QTL位置(置信區(qū)間和QTL的最大可能位置)和遺傳貢獻率是進行QTL元分析的兩個必要參數(shù)。
1.2.2 小麥粒長和粒寬QTL映射
確定收集到的QTL所涉及的染色體,選取Wheat composite 2004(https://wheat.pw.usda.gov/cgi-bin/GG3/report.cgi?class=mapdata;query=;name=Wheat,+Composite,+2004)高密度遺傳圖譜作為參考圖譜,將目標QTL的位置信息按比例標注到參考圖譜上,即QTL映射。將映射失敗的標記先映射到Somers等[22]繪制的小麥整合圖譜(即中介圖譜)上,然后對共有分子標記進行映射,剔除有爭議的QTL。
1.2.3 小麥粒長和粒寬QTL元分析
利用BioMercator 4.2軟件將位于同一染色體相同位點附近的N個獨立存在的與小麥粒長和粒寬相關的QTL進行運算,對獨立來源的同一性狀且位于同一座位或重疊座位的QTL計算出一個MQTL。每個MQTL給出5個模型(1、2、3、4和N),其中,赤池信息量準則值(akaike-type criteria values,AIC)最小的模型為真實QTL模型,按照最大似然函數(shù)比方法通過高斯定理計算其置信區(qū)間及物理位置。若某一QTL置信區(qū)間未知,可通過Darvasi等[23]應用的公式進行推斷:
(1)C.I.=530/(N×R2)
(2)C.I.=163/(N×R2)
其中C.I.指QTL 95%的置信區(qū)間,N指作圖群體的大小,R2指QTL的遺傳貢獻率,F(xiàn)2和BC群體用公式(1)進行計算,RIL、DH及NIL群體用公式(2)進行計算。若已知QTL置信區(qū)間,也可根據(jù)此公式計算其遺傳貢獻率[24]。
1.2.4 基于小麥粒長和粒寬MQTL范圍內候選基因的發(fā)掘
利用生物信息學手段進行目標性狀QTL的整合,獲得粒長和粒寬MQTL區(qū)域,根據(jù)這些區(qū)域內的EST或DNA序列搜索候選基因。該方法的原理為:物種內及物種間存在序列同源性,基因的功能和序列緊密相關,當序列的相似性超過一定的范圍時,它們執(zhí)行的功能可能相同,通過對比未知功能序列和已知功能序列,預測序列功能。
在參考圖譜Wheat composite 2004上,通過元分析所得的小麥粒長和粒寬MQTL區(qū)域由兩端標記界定。對MQTL區(qū)間內相關基因位點進行整理,根據(jù)基因位點名稱,在GrainGenes (https://wheat.pw.usda.gov/)網(wǎng)站上下載相關基因序列和各種標記的原始序列,從而確定MQTL在物理圖譜上的位置。利用小麥基因組數(shù)據(jù)庫(http://202.194.139.32/)中JBrowse工具檢索MQTL內的基因信息,并獲得該區(qū)間內所有基因的功能注釋信息,利用NCBI網(wǎng)站(https://blast.ncbi.nlm.nih.gov/Blast.cgi)BLAST比對相關基因序列,預測目標性狀候選基因[25]。
從表1可以看出,從小麥公共數(shù)據(jù)庫和已發(fā)表的文獻共收集到113個與粒長相關的QTL和86個與粒寬相關的QTL,它們來自于川35050×山農(nóng)483、大粒飽×BYL8、Rye Selection 112×中國春、面包小麥×Spelt、波蘭小麥×普通小麥、0911-46×42、Rye Selection 111×中國春、山農(nóng)0431×魯麥21、南大2149×望水白、西藏半野生Q1028×鄭麥9023、0911-14×42、G18-16×Langdon、6044×01-35、人工合成小麥SHW-L1×川麥32共14個不同遺傳背景的作圖群體。利用BioMercator 4.2軟件中的QTL projection功能將收集到的QTL映射到Wheat composite 2004小麥參考圖譜上。與粒長相關的QTL LOD值范圍為 2.00~12.90,遺傳貢獻率為0.04%~ 32.60%;與粒寬相關的QTL LOD值范圍為 2.00~8.57,遺傳貢獻率為 0.03%~40.79%。
表1 小麥粒長和粒寬QTL數(shù)據(jù)整合Table 1 Integration of QTL data for the kernel length and width in wheat
將收集到的原始圖譜上的QTL通過BioMercator 4.2軟件映射到參考圖譜Wheat composite 2004上,構建小麥粒長和粒寬QTL一致性圖譜。結果(圖1)表明,與粒長、粒寬相關的QTL在各染色體上分布不均勻,部分QTL在同一染色體上成簇存在。如在2B、2D、3A、4B和5A染色體上各有1個QTL簇。這些QTL大都出現(xiàn)在一段區(qū)間內,彼此之間有區(qū)間的重疊。其中,4B染色體上170.00 cM左右和5A染色體上85.00 cM左右各有3個QTL,說明該區(qū)間可能存在更為真實的QTL位點。
利用BioMercator 4.2軟件中的Maps-analysis程序對小麥粒長、粒寬QTL進行元分析,以每次元分析中AIC值最小的模型為準,確定1個真實QTL,最終得到18個控制粒長的MQTL,分別位于小麥的1A(4個)、2A(2個)、2B(3個)、2D(2個)、3A(1個)、4B(2個)、5A(1個)、5B(1個)、7A(1個)和7D(1個)染色體上,平均每條染色體上含有1.8個MQTL。根據(jù)其所在染色體的位置排列為MQTL1~MQTL18,其中,圖距小于3 cM的MQTL位點有2個,即MQTL5(0.57 cM)和MQTL6(2.80 cM)。MQTL7(118.48~125.73 cM)和MQTL8 (119.58~139.22 cM)置信區(qū)間存在很大的重合,推測此重疊區(qū)段可能存在控制小麥粒長的重要基因(表2)。
表2 小麥粒長QTL的元分析Table 2 Meta-analysis of QTLs for the kernel length in wheat
通過元分析得到了8個控制粒寬的MQTL,其中,2個MQTL定位在4B染色體上,3個MQTL定位在5A染色體上,在1A、3B和5B染色體上分別定位到1個MQTL。根據(jù)其所在染色體的位置排列為MQTL1~MQTL8,其中MQTL2和MQTL7圖距小于4.00 cM,分別為3.70 cM和3.60 cM(表3)。
表3 小麥粒寬QTL的元分析Table 3 Meta-analysis of QTL for the kernel width in wheat
根據(jù)MQTL在物理圖譜上的位置,利用小麥基因組數(shù)據(jù)庫所提供的基因注釋信息,預測小麥粒長和粒寬QTL定位區(qū)域內的候選基因。由于選取較小的MQTL AIC值和圖距有利于提高QTL定位的準確度,因此,將小麥粒長和粒寬QTL定位結果中AIC值和圖距均較小的MQTL進行物理圖譜定位,統(tǒng)計MQTL區(qū)間內所包含的基因個數(shù)。結果發(fā)現(xiàn),在5A染色體上,控制粒長的MQTL15其側翼標記為Xgwm293~Xgwm304,圖距為6.60 cM,包含28個基因;控制粒寬的MQTL7其側翼標記為Xgpw2120~Xgpw2273a,遺傳距離為3.60 cM,包含82個基因。在這兩個MQTL區(qū)段進行Jbrowse檢索,共篩選出22個候選基因(表4)。其中TraesCS5A01 G122300LC.1與小麥粒長相關,TraesCS5A01G-484900.1、TraesCS5A01G652600LC.1、Traes-CS5A01G652700LC.1、TraesCS5A01G487500.1、TraesCS5A01G651000LC.1、TraesCS5A01G651400LC.1共6個基因與小麥粒寬相關。它們通過編碼光系統(tǒng)CP43反應中心蛋白、LEA蛋白、F-box蛋白、U-box蛋白和絲氨酸/蘇氨酸蛋白磷酸酶,參與到小麥籽粒生長發(fā)育過程,如信號轉導、光合作用和器官發(fā)育等途徑,進而影響小麥粒長和粒寬,但具體功能有待進一步驗證。
表4 小麥粒長和粒寬MQTL內預測到的候選基因Table 4 Candidate genes within MQTL related to the kernel lenqth and width in wheat
染色體左側“點”至“橫線”表示QTL所在位點的遺傳貢獻率大小的連續(xù)變化;“豎線”表示QTL所在置信區(qū)間。The “dot”to “transverse line”on the left side of chromosome mean the successive change in the genetic contribution rate of QTL;“Vertical line”means the confidence interval of QTL.圖1 小麥粒長和粒寬QTL一致性圖譜Fig.1 Map of QTLs for the kernel length and width in wheat
高密度的遺傳圖譜可提高QTL映射的準確性和高效性。本研究選取整合了11個標準圖譜的Wheat composite 2004作為參考圖譜,其主要包含AFLP、RFLP和SSR標記,共涉及3 741個標記,總長度為3 236 cM。此圖譜密度較大,但某些研究中原始圖譜與參考圖譜存在標記一致性較差的問題,導致部分目標性狀QTL不能直接映射成功。因此,本研究利用Somers等[22]繪制的小麥整合圖譜作為中介圖譜,該圖譜涉及到 1 234個SSR標記,總長度為2 540 cM,與Wheat composite 2004參考圖譜存在大量共有標記,可以提高映射效果,縮短兩標記距離,為精細定位奠定基礎。
元分析技術可以對不同研究中定位的QTL進行比較整合,縮小其置信區(qū)間,提高QTL定位的精確性。目前,該技術已應用于多種作物目標性狀QTL的遺傳改良。吉海蓮等[26]收集了22個抗玉米黑穗病QTL,發(fā)掘出2個抗病MQTL區(qū)間,并在其中初步確定1個抗病基因;楊鑫雷等[27]構建了含63個棉花纖維品質性狀QTL的整合圖譜,在12條染色體上獲得15個相關性狀的MQTL;李修平等[28]對43個作圖群體的207個水稻抽穗期QTL信息進行整理,以Cornell 2001為參考圖譜,共獲得14個與水稻抽穗期相關的MQTL。利用元分析對小麥不同數(shù)量性狀進行QTL整合的研究報道較少,王健維等[29]對控制小麥品質相關性狀的585個QTL進行元分析,得到264個MQTL,其中34個與吸水率相關,26個與面粉蛋白質相關,84個與籽粒蛋白質含量相關,52個與籽粒硬度相關,39個與沉降值相關,29個與濕面筋含量相關,最小的置信區(qū)間為0.04 cM,表明基于元分析的 QTL 圖譜整合及其在目標性狀精細定位中具有重要應用價值。本研究收集14個群體113個控制小麥粒長的QTL和86個控制小麥粒寬的QTL,構建小麥粒長和粒寬QTL一致性圖譜。通過元分析得到18個粒長MQTL和8個粒寬MQTL,置信區(qū)間均縮短,其中最小可縮短至0.57 cM,減小了QTL定位的誤差。其中,本研究在5A染色體上Xgwm239~Xgwm304區(qū)間內獲得的控制粒長的MQTL與王建維等[29]發(fā)現(xiàn)的控制小麥品質的MQTL(P41/M49-76~Xwmc492)有重疊區(qū)段,說明這些位點的表達可能存在遺傳關聯(lián),或存在“一因多效”現(xiàn)象。
QTL定位的準確性和置信區(qū)間大小是定位和克隆目標性狀相關候選基因的基礎,利用元分析的方法確定和縮小置信區(qū)間,能夠有效提高候選基因克隆效率。隨著更多目標性狀QTL的精細定位,借助生物信息學、模式作物的基因測序結果和比較基因組學方法,在MQTL區(qū)域內可以得到更多DNA序列,這些序列具有較完整的基因結構,根據(jù)同源對比,可以預測基因的功能,確定目標性狀候選基因。本研究在控制小麥粒長和粒寬的MQTL內初步確定了7個候選基因。其中,Traes CS5A01G484900.1編碼LEA蛋白,研究表明,LEA蛋白在植物種子脫水成熟過程中積累,調控種子含水量的降低速率,進而影響種子形態(tài)[30];TraesCS5A01G651000LC.1和TraesCS 5A01G651400LC.1編碼絲氨酸/蘇氨酸蛋白磷酸酶,可調節(jié)植物激素信號通路中關鍵基因的表達,影響細胞周期蛋白的磷酸化狀態(tài),最終影響種子形態(tài)[31];TraesCS5A01G 652600LC.1和TraesCS5A01G652700LC.1編碼光系統(tǒng)CP43反應中心蛋白,CP43是一種葉綠素-蛋白質復合物,主要參與太陽能的捕獲、激發(fā)能量向光化學反應中心的有效轉移,調節(jié)能量流動進而影響種子形態(tài)形成[32];TraesCS5A01G122300LC.1編碼U-box型泛素連接酶E3,參與蛋白降解、細胞周期調節(jié)、信號傳導和形態(tài)發(fā)生等過程,從而影響植物的生長發(fā)育[33];TraesCS5A01G487500.1編碼F-box蛋白,是組成E3泛素連接酶的成分,參與植物的信號轉導、形態(tài)發(fā)生和器官發(fā)育等過程[34],Chen等[35]在水稻中發(fā)現(xiàn)了一個F-box基因OsFBK12,發(fā)現(xiàn)其可通過影響種子發(fā)育和籽粒灌漿調控種子大小。本研究通過對來自不同作圖群體的小麥粒長和粒寬QTL進行整合,通過元分析方法獲得更為精確的MQTL,在相應區(qū)段發(fā)掘候選基因,為小麥粒形QTL精細定位和基因圖位克隆奠定理論基礎,對小麥粒形分子標記輔助選擇育種具有重要的意義。
借助小麥高密度遺傳圖譜,對199個來自不同遺傳作圖群體的控制小麥粒長(113)和粒寬(86)的QTL進行元分析。建立一致性圖譜,共獲得18個控制粒長的MQTL和8個控制粒寬的MQTL,置信區(qū)間最短縮短至0.57 cM。在5A染色體上預測到7個與小麥粒長(1)和粒寬(6)相關的基因,但具體功能有待進一步驗證,這為小麥粒形分子標記輔助選擇育種提供參考依據(jù)。