韓英鵬,田利崢,姜海鵬,包冬芳,王 俊,趙 雪
(東北農(nóng)業(yè)大學大豆研究所,大豆生物學教育部重點實驗室,農(nóng)業(yè)農(nóng)村部東北大豆生物學與遺傳育種重點實驗室,哈爾濱150030)
大豆胞囊線蟲?。⊿oybean cyst nematode,SCN,Heterodera glycines Ichinohe)是大豆生產(chǎn)重要病害,主要分布于中國、美國、巴西、日本等國家。大豆胞囊線蟲病害分布廣泛,可造成20~30%產(chǎn)量損失,病害嚴重時高達80%,甚至絕產(chǎn),嚴重危害大豆生產(chǎn)[1]。
大豆胞囊線蟲病生理小種分化明顯,Riggs 等利用大豆4個鑒別寄主和1個對照感病寄主調(diào)查胞囊線蟲反應,將其劃分為16 個生理小種[2],根據(jù)7個鑒別寄主區(qū)劃分為HG 類型[3]。目前,我國大豆主產(chǎn)區(qū)發(fā)現(xiàn)1~7 號、9 號、11 號、13 號、14 號等11個SCN生理小種,其中3號生理小種在我國分布最廣,主要分布在東北三省和內(nèi)蒙古;4號生理小種浸染能力更強,主要分布在黃淮和西北地區(qū);6號生理小種主要發(fā)現(xiàn)于黑龍江省內(nèi)[4]??共∑贩N(系)選育是防治SCN 最有效方法,挖掘SCN 抗性基因是分子輔助育種基礎,而QTL 定位是挖掘抗性基因最有效方法之一。
Weismann 等首次將抗性基因Rhg4 定位在pBLT24 與pBLT56 區(qū)間[5]。Concibido 定位多個SCN抗性QTL,且整合1994~2004年發(fā)表文獻報道的60多個SCN 抗性QTL,分布在除2、9、10 等以外17個染色體[6]。目前,國內(nèi)外文獻已報道大量不同SCN生理小種抗性QTL,但因遺傳抗性材料和接種方法不同,且不同地理環(huán)境和遺傳背景對QTL 穩(wěn)定性影響較大,導致QTL 基因組區(qū)域與實際所在基因組區(qū)域不完全相同。
Goffinet 建立可整合不同遺傳背景和不同材料一致性QTL 元分析方法,基于最大鄰接法整合不同來源QTL,縮小置信區(qū)間,提高QTL 定位結果有效性和準確性[7]。通過meta分析在QTL區(qū)段發(fā)現(xiàn)相關性狀候選基因在大豆和其他作物中被廣泛利用。李長育等利用BioMercatorV2.1軟件通過meta分析獲得2個一致性QTL位點,得到與大豆根瘤相關的8 個候選基因[8]。在玉米中,通過meta 分析方法,在847 個有關玉米籽粒蛋白質(zhì)含量候選基因中,發(fā)現(xiàn)13個影響該性狀的關鍵基因[9]。
大豆SCN抗性研究已定位和鑒定160多個QTL(http://www.soybase.or),其中,一些QTL未經(jīng)重復驗證,不同試驗條件下,鑒定結果不一致。目前,已克隆和鑒定2 個主要SCN 抗性位點rhg1 和Rhg4,并揭示新的大豆抗病機制。目前已有栽培品種對SCN 抗 性 主 要 來 自PI88788、PI437654 和Peking,SCN 在不斷適應過程中,易克服大豆寄主單一抗性,因此需鑒定新的SCN抗性位點和基因。
本研究使用圖譜整合軟件BioMercatorV4.2 將不同來源SCN Race 3 抗性QTL 整合到遺傳圖譜GmComposite 2003,并通過元分析方法縮小QTL置信區(qū)間,進一步提高QTL 準確性并獲得一致性QTL,選取區(qū)間內(nèi)所有基因并作基因注釋,進一步篩選與SCN Race 3 相關抗性基因,分析其抗病機理,最終為分子輔助育種尤其選育抗SCN 品種(系)提供種質(zhì)資源和理論依據(jù)。
收集已發(fā)表的SCN Race 3 抗性QTL 信息,包括QTL 位置、置信區(qū)間、LOD 值、遺傳貢獻率、作圖群體類型、群體規(guī)模和臨近標記等信息。其中,我國品種(系)有中品03-5373 和L-10,中品03-5373 對SCN Race 3 抗性來自Peking、PI437654和灰皮支黑豆等3 個抗源,L-10 對9 個胞囊線蟲小種均有抗性;美國品種(系)有PI437655、PI438489B、PI567516C、 PI89772、 Bell、 Msoy8001 和PI437654,均具有多種胞囊線蟲小種抗性,其中PI437655、 PI438489B、 PI567516C、 PI89772 和PI437654等均為野生型大豆。
利用BioMercatorV4.2 軟件完成各作圖群體SCN Race 3 抗性QTL 映射及meta-QTL 分析?;诿總€QTL 圖譜名稱(Map name)、QTL 所在染色體(Chromosome)、群 體 規(guī) 模(Size)、群 體 類 型(Type)、QTL 名稱(QTL name)、QTL 位置(Position)、遺傳貢獻率(R2)、LOD 值和各原始圖譜與公共圖譜上相關標記,構建一致性遺傳圖譜(Consensus map),隨后利用ConsMap 和QTLProj 功能將每個原始圖譜中QTL 映射到GmComposite2003 上。利用Veyrieras元分析作meta-QTL分析。
meta-QTL 分析后得到5 個模型,每個模型均按照最大似然函數(shù)比方法,利用高斯定理推導出在染色體上最可能排列位置和置信區(qū)間。根據(jù)AIC(Akaike-type-criteria-values)最小值原則,當在每條染色體上選取meta-QTL 數(shù)目時,首先考慮AIC 最小值對應的meta-QTL 數(shù)目模型,參考一致性圖譜上原始QTL 分布及數(shù)目,選取合適數(shù)目,獲取一致性置信區(qū)間。
利用已獲得的QTL 一致性置信區(qū)間,根據(jù)基因組預測注釋信息,挖掘SCN Race 3 抗性相關基因。查找已克隆的與大豆胞囊線蟲病抗性相關基因,下載其表達序列,分析其結構域特征。將本研究所獲置信區(qū)間內(nèi)基因作為候選基因,同時根據(jù)其包含的不同功能結構域,將抗性基因分類,將所得抗性基因與大豆EST 數(shù)據(jù)庫比對、注釋。
在Phytozome網(wǎng)站(https://phytozome.jgi.doe.gov/)利用Glycine max Williams82 基因組數(shù)據(jù)庫,獲得基因參考序列,通過網(wǎng)站Functional Annotation 工具分析蛋白結構域,并使用繪圖軟件IBS繪圖。
分析收集的SCN Race 3 抗性QTL 信息可見,共涉及7 個作圖群體,獲得33 個SCN Race 3 相關QTL 信息(見表1),分布于11 個連鎖群,其中G(chr18)分布較多,為5 個;F(chr13)、I(chr20)較少,均為1個。
表1 大豆胞囊線蟲病3號小種抗性QTL相關信息Table 1 Information related to QTL resistance of soybean cyst nematode race 3 published
共有21 個報道成功的QTL 映射到大豆參考圖譜,利用BioMercatorV4.2 軟件中的QTL meta-analyses程序分析計算,每次運算后以AIC最小值為原則,根據(jù)QTL模型得到3個一致性QTL,分別位于M(chr7)、E(chr15)和G(chr18)(見表2、圖1)等3個連鎖群中,其中置信區(qū)間指數(shù)(CI)為95%。這些一致性QTL 可為分子標記輔助育種、QTL 精細定位、挖掘抗性候選提供重要位置信息。
挖掘利用BioMercatorV4.2 獲得的一致性置信區(qū)間內(nèi)候選基因,根據(jù)基因組測序注釋信息,共發(fā)現(xiàn)18 個SCN Race 3 抗性相關基因(見表3),17個蛋白激酶(PK)型基因和1 個亮氨酸重復序列類受體蛋白激酶(LRR)型基因。
表2 候選QTL位點Table 2 Candidate QTL loci
表3 抗病基因類型統(tǒng)計Table 3 Types statistics of resistance genes
通過Functional Annotation工具分析基因結構域,發(fā)現(xiàn)17個PK型基因分為絲/蘇氨酸蛋白激酶、半胱氨酸蛋白激酶、組/精/賴氨酸蛋白激酶3類(見圖2)。
絲/蘇氨酸蛋白激酶包括Glyma.18G074200、Glyma.18G096500、Glyma.18G026700、Glyma.18G0 26800、Glyma.18G026900、Glyma.18G062500、Glyma.07G003200、 Glyma.18G060900、 Glyma.18G042200、Glyma.18G038500 和Glyma.07G021100, 其 中Glyma.18G074200和Glyma.18G096500具有鈣依賴蛋白激酶活性;Glyma.07G003200 和Glyma.18G060900具有分裂原活化蛋白激酶活性,該結構域參與大豆PTI和ETI兩種防御機制,從而影響大豆對胞囊線蟲抗性。半胱氨酸蛋白激酶包括Glyma.18G0 46100、Glyma.18G046200、 Glyma.18G046300、 Glyma.8G0 46600 和Glyma.18G046400,該結構域通過誘導大豆PTI防御機制從而影響大豆對胞囊線蟲抗性;組/精/賴氨酸蛋白激酶包括Glyma.18G054100;Glyma.15G155600 為LRR 型基因,具有亮氨酸重復序列類受體蛋白激酶活性,該結構域通過參與大豆ETI防御機制從而影響大豆對胞囊線蟲的抗性。
利用精細定位方法可從已定位QTL 中準確確定候選基因,但耗時耗力。利用元分析方法獲得QTL一個較小置信區(qū)間,將目的基因鎖定在較小置信區(qū)間內(nèi),再根據(jù)抗病基因保守性挖掘目標基因,最后利用EST 注釋信息進一步確認所獲基因,該方法省時省力且費用極低。?,|等利用BioMercator2.1 軟件,通過已知SCN 抗性QTL 和參考圖譜GmComposite2003獲得一致性位點,根據(jù)大豆20個連鎖標記(SSR、SNP 和RFLP)序列和大豆全基因組數(shù)據(jù)構建物理圖譜,與已獲得一致性QTL 位點,根據(jù)hmmsearch 搜索結果獲得77 個抗性基因[20]。在77個候選基因中,多數(shù)基因已證明與SCN抗性有關。因此,通過元分析計算確定一致性QTL位點從而準確篩選候選基因,為大豆分子輔助育種尤其是選育抗SCN 品種(系)提供一種新的思路和途徑。
Li等研究中品03-5373(抗性)與中黃13(感性)及其后代所構成群體,根據(jù)其基因型和表型,經(jīng)全基因組關聯(lián)分析(GWAS),發(fā)現(xiàn)基因Glyma.18G026900具有SCN 抗性連鎖的單核苷酸多態(tài)性(SNP)位點(C/T)[21]。因此,可推斷其同源基因Glyma.18G026700、Glyma.18G026800 和Glyma.18G062500 等也可能具有SCN抗性連鎖的單核苷酸多態(tài)性(SNP)位點。但其余15個有關SCN抗性基因尚無報道。
Glyma.18G026900及其同源基因具有絲氨酸/蘇氨酸蛋白激酶活性,屬于PK 酶(蛋白激酶)的一種。植物蛋白激酶在逆境脅迫信號傳導中發(fā)揮關鍵作用,維持植物體正常生命活動,根據(jù)底物特異性,植物蛋白激酶分為絲/蘇氨酸蛋白激酶、組/精/賴氨酸蛋白激酶、酪氨酸蛋白激酶、半胱氨酸蛋白激酶、天冬酰胺基/谷氨酰胺基蛋白激酶等5類[22]。其中絲/蘇氨酸蛋白激酶包括分裂原活化蛋白激酶(MAPK)和鈣依賴蛋白激酶(CDPK):當大豆受體蛋白參與植物體PTI 防御機制時,MAPK 在其下游的防御機制中發(fā)揮重要作用,植物體特異抗病蛋白,用于識別效應蛋白,即防御機制ETI,大豆通過MAPK在大豆胞囊線蟲防御機制ETI中發(fā)揮重要作用[23];CDPK 主要調(diào)節(jié)植物體中鹽信號傳導,其在大豆胞囊線蟲中抗性機理還需進一步研究。半胱氨酸類受體激酶(Cysteine-rich receptorlike-kinases,CRKs)屬于蛋白激酶,在植物體受病原菌脅迫時,CRK 誘導分泌甲基SA 誘導植物體PTI防御機制,使植物局部過敏性壞死,保護植物體[24]。其余蛋白激酶在植物非生物脅迫中發(fā)揮作用,但在生物脅迫中,尤其在SCN抗性中尚無報道。
LRR 型蛋白因其結構域中富含亮氨酸重復序列而得名。參與植物體防御反應的LRR 型蛋白可分為類受體蛋白激酶、抗病基因編碼蛋白質(zhì)、多聚半乳糖醛酸酶抑制蛋白和伸展蛋白等4類[25]。類受體蛋白激酶主要參與植物體PTI防御過程;植物抗病基因編碼蛋白質(zhì)主要參與植物體ETI 過程[26];多聚半乳糖醛酸酶抑制蛋白(Polygalac-turonase-inhibiting proteins,PGIPs)通過保護植物細胞壁抵御病原菌入侵;伸展蛋白含有組成植物體細胞壁的結構蛋白,是防止病原物侵入和擴散的屏障。Kanazin 等在16 號染色體上定位到一個具有LRRTM 結構域的基因,已證實其與大豆胞囊線蟲抗性相關[27]。
本研究在整合前人QTL 信息基礎上,采用圖譜整合軟件BioMercatorV4.2 挖掘SCN Race 3 抗性基因,將收集和整理的33 個QTL 整合在遺傳圖譜GmComposite2003上,并通過元分析方法得到一致性QTL,獲得3 個抗性候選區(qū)段,發(fā)現(xiàn)18 個與SCN Race 3 抗性相關基因。本研究選取的SCN Race 3抗性QTL信息及所構建遺傳圖譜描述較為詳細,因此可使用meta 分析方法發(fā)現(xiàn)與SCN Race 3抗性相關基因,對發(fā)現(xiàn)其他SCN 生理小種抗性基因具有借鑒意義。該方法為分子輔助育種提供新的思路和途徑,也為后期篩選候選基因,分析其抗病機理,最終為選育抗SCN 品種(系)提供種質(zhì)資源和理論基礎。
采集美國、中國和巴西等發(fā)表的33 個與SCN Race 3抗性相關QTL及其相關信息,利用QTL-meta分析得到3 個一致性QTL,從中發(fā)現(xiàn)18 個與SCN Race 3 抗性相關基因,其中17 個PK 型基因,1 個LRR 型基因。17 個PK 型基因位于連鎖群M(chr7)和連鎖群G(chr18),1個LRR型基因位于連鎖群E(chr15)。通過蛋白結構域分析,在17 個PK 基因中,1個基因具有組/精/賴氨酸蛋白激酶活性、5個基因具有半胱氨酸蛋白激酶活性、11 個基因具有絲/蘇氨酸蛋白激酶活性。