陳凱凌 武濤,2 徐逸群,2 高佳,2 張美俊,2 李欣 賈舉慶,2
(1.山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,太谷 030801;2.山西農(nóng)業(yè)大學(xué)雜糧種質(zhì)資源創(chuàng)新與分子育種國家實(shí)驗(yàn)室(籌),太原 030031)
燕麥(Avena sativa L.)為異源六倍體(AACCDD,2n=6X=42),包含A、C、D 三個亞基因組,每組包含7 條染色體,是一種重要的特色雜糧。中國作為裸燕麥(莜麥)的起源地,在內(nèi)蒙古、山西等地廣泛種植[1]。燕麥?zhǔn)且环N可全谷物食用的健康谷物,由于其含有獨(dú)特的燕麥蛋白、燕麥多肽、β-葡聚糖等營養(yǎng)物質(zhì),對于人體健康與疾病防治有重要作用而受到廣泛關(guān)注[2]。
由于燕麥基因組較大、基因組結(jié)構(gòu)復(fù)雜并缺少高質(zhì)量的參考基因組,相較于同為禾本科的小麥、水稻、玉米而言,燕麥功能基因發(fā)掘與分子進(jìn)化的相關(guān)研究起步較晚[3]。在2022 年,相繼公布了2 個六倍體燕麥參考基因組[4-5],為燕麥基因組學(xué)研究提供了強(qiáng)有力的工具。
開發(fā)SSR 標(biāo)記的方法主要有根據(jù)全基因組測序結(jié)果開發(fā)[6]、轉(zhuǎn)錄組測序結(jié)果開發(fā)[7]、SSR 富集文庫構(gòu)建開發(fā)[8]及利用已報道的SSR 標(biāo)記交叉擴(kuò)增[9]?;谵D(zhuǎn)錄組開發(fā)SSR 標(biāo)記所包含的物種基因信息較少,構(gòu)建SSR 富集文庫開發(fā)成本較高,近緣物種交叉擴(kuò)增有效率較低?;趨⒖蓟蚪M開發(fā)SSR 標(biāo)記簡單、經(jīng)濟(jì)并且包含基因信息豐富。
在燕麥中,基于基因組開發(fā)的SSR 分子標(biāo)記數(shù)量有限,主要集中在燕麥抗冠銹?。?-10]、高矮[11]、β-葡聚糖[12]含量相關(guān)SSR 標(biāo)記的開發(fā)與基因定位,其次是基于EST 序列開發(fā)的SSR 標(biāo)記[13],關(guān)于燕麥皮裸性狀的多態(tài)性SSR 標(biāo)記鮮有報道。
本研究利用公布的六倍體裸燕麥“三分三”全基因組進(jìn)行SSR 位點(diǎn)檢索并對其進(jìn)行特征分析,同時開發(fā)出52 對多態(tài)性SSR 引物,并進(jìn)行克隆測序驗(yàn)證其真實(shí)性。在F2遺傳群體材料中進(jìn)行小規(guī)模擴(kuò)增,為后續(xù)燕麥皮裸基因克隆、遺傳圖譜構(gòu)建、群體多樣性分析等提供了科學(xué)的參考依據(jù)。
選取2 個六倍體裸燕麥白燕2 號(父本)與皮燕麥Banner(母本)作為雜交親本。雙親種質(zhì)資源由山西農(nóng)業(yè)大學(xué)生物技術(shù)實(shí)驗(yàn)室提供。將白燕2 號和Banner 通過人工去雄雜交獲得F1單株種子,F(xiàn)1種子自交、結(jié)實(shí)、收獲、鑒定,獲得F2種子。于2022 年3 月,將F2及雙親種子播種在山西農(nóng)業(yè)大學(xué)農(nóng)作站實(shí)驗(yàn)基地,期間進(jìn)行科學(xué)的田間水肥管理。在F2群體中分別在2 個極端表型(皮燕麥和裸燕麥)中隨機(jī)選取皮裸性狀差異明顯的植株各10 株,共計(jì)20 個單株為試驗(yàn)材料。
1.2.1 燕麥全基因組序列下載及SSR 位點(diǎn)檢索 在NCBI 網(wǎng)站下載裸燕麥“三分三”參考基因組序列,登錄號為PRJNA727473。利用TBtools(v1.09876-63)[14]中SSR 檢索工具對全基因組序列SSR 位點(diǎn)進(jìn)行搜索。搜索標(biāo)準(zhǔn)為單堿基至少重復(fù)10 次、雙堿基至少重復(fù)6 次,三堿基、四堿基、五堿基與六堿基至少重復(fù)5 次。同一SSR 最長不超過2 kb。將搜索數(shù)據(jù)利用Excel 與SPSS 軟件進(jìn)行統(tǒng)計(jì)分析。
1.2.2 燕麥SSR 引物設(shè)計(jì)和PCR 驗(yàn)證 選取SSR 位點(diǎn)上下游500 bp 序列,將和控制燕麥籽粒皮裸性N1連鎖的分子標(biāo)記序列[15]與“三分三”基因組比對,判斷N1 在染色體上的物理區(qū)段,從該區(qū)段中挑選長度大于40 bp 的SSR 位點(diǎn)100 個,在基因組上截取SSR 位點(diǎn)上下游500 bp 序列,將這些序列分別比對“三分三”和“Sang”基因組,以去除非特異性位點(diǎn)及在兩個測序的燕麥品種中無多態(tài)性的SSR 位點(diǎn)。剩余的序列利用Primer3 在線設(shè)計(jì)SSR 引物,引物設(shè)計(jì)參數(shù)設(shè)置為長度18-22 bp,退火溫度為55-59℃,擴(kuò)增產(chǎn)物長度為250-400 bp;應(yīng)避免引物間二聚體、發(fā)夾結(jié)構(gòu)等結(jié)構(gòu)出現(xiàn)。并將設(shè)計(jì)引物在“三分三”和“Sang”基因組中進(jìn)行電子PCR 分析,去除有非特異擴(kuò)增與在2 個燕麥基因組中擴(kuò)增片段相同的引物,提高其特異性與多態(tài)性。將設(shè)計(jì)完成的引物序列交由北京華大科技有限公司合成。
1.2.3 皮裸性狀調(diào)查 對雜交雙親及F2群體中選取的燕麥植株進(jìn)行皮裸性狀調(diào)查。
1.2.4 DNA 提取 選取試驗(yàn)材料苗期的幼嫩葉片,按照北京天根生化科技有限公司提供的DNA 提取試劑盒提取DNA。用1%瓊脂糖凝膠電泳檢測其完整性,并將DNA 稀釋為50 ng/μL,-20℃保存?zhèn)溆谩?/p>
1.2.5 燕麥SSR 引物的開發(fā)與多態(tài)性檢測 將親本DNA 進(jìn)行初步PCR 擴(kuò)增,篩選出具有目的條帶的SSR 引物,進(jìn)一步在20 個F2群體燕麥單株和雙親DNA 中進(jìn)行PCR 擴(kuò)增,篩選出多態(tài)性明顯、條帶清楚的穩(wěn)定SSR 引物。SSR-PCR 反應(yīng)體系:1.0 μL DNA(50 ng/μL)、左右引物各0.5 μL(0.5 μmol/L)、1.0 μL 10×PCR buffer(含Mg2+)、0.8 μL dNTP(0.23 nmol/L)、0.12 μL Taq DNA 聚合酶(5 U)和ddH2O 6.08 μL。反應(yīng)程序:94℃ 4 min;94℃ 45 s,56℃(依據(jù)引物最佳退火溫度而定)45 s,72℃ 20 s,30 個循環(huán);72℃ 10 min,4℃保存。PCR 擴(kuò)增產(chǎn)物用8%非變性聚丙烯酰胺凝膠電泳檢測,染色、顯影,并拍照保存。
1.2.6 SSR 引物的驗(yàn)證 經(jīng)非變性聚丙烯酰胺凝膠檢測后,回收擴(kuò)增的目的產(chǎn)物,加入100 μL 無菌水,用無菌玻璃棒將其研磨充分,55℃溶解30 min,離心;取1 μL 上清液作為模板DNA 進(jìn)行PCR 擴(kuò)增,擴(kuò)增條件同1.2.5。將擴(kuò)增產(chǎn)物經(jīng)2%瓊脂糖凝膠電泳分離,用DNA 回收試劑盒將目的基因進(jìn)行切膠回收,并連接至T 載體,轉(zhuǎn)入JM109 感受態(tài)細(xì)胞,挑選陽性克隆菌液送至北京華大科技有限公司進(jìn)行測序。利用Jalview 軟件對測序序列進(jìn)行多序列比對。
在NCBI 網(wǎng)站下載六倍體裸燕麥“三分三”及“Sang”全基因組序列,“三分三”的基因組總長為11 Gb。燕麥基因組共分為3 個亞基因組,每個亞基因組各有7 條染色體,共計(jì)21 條染色體,每條染色體長度為293.84-701.82 Mb。利用TBtools 軟件在21條染色體上共檢索到828 138 個SSR 位點(diǎn)(表1),在1A(46 585)、3C(49 132)和4C(46 713)位點(diǎn)最為豐富,在6D(22 043)分布最少。在全基因組中,平均每12.90 kb 會出現(xiàn)一個SSR 位點(diǎn),在1C 出現(xiàn)SSR 位點(diǎn)距離最長;全基因組平均SSR 密度為78.16個/Mb,在2A 上SSR 分布密度最高。表明燕麥全基因組SSR 位點(diǎn)數(shù)量豐富、分布均勻。
表1 SSR 數(shù)量分布特征Table 1 SSR quantitative distribution characteristics
燕麥染色體大小和SSR 密度、SSR 距離、SSR數(shù)量之間均符合正態(tài)分布,結(jié)果顯示,染色體大小與SSR 數(shù)量之間呈正相關(guān)關(guān)系,相關(guān)系數(shù)為0.81。同時,染色體大小與SSR 密度、SSR 距離之間無相關(guān)關(guān)系(表2),在A、C、D 三個亞基因組間C 亞基因組染色體最長、SSR 數(shù)目最多,但是SSR 密度最低;A 亞基因組染色體長度與SSR 數(shù)目適中,但SSR 密度最高(表3)。
表2 相關(guān)性分析Table 2 Correlation analysis
表3 亞基因組間SSR 分布特征Table 3 SSR distribution characteristics among subgroups
在燕麥全基因組中共檢測到6 種核苷酸重復(fù)類型(表4),其中,單核苷酸(29.85%)、雙核苷酸(33.69%)和三核苷酸(33.79%)重復(fù)類型占主導(dǎo)優(yōu)勢;四核苷酸(1.81%)、五核苷酸(0.28%)、六核苷酸(0.59%)占比較少。在全部SSR 位點(diǎn)中,重復(fù)次數(shù)在5-567 次之間均有檢索到,最小重復(fù)次數(shù)為5 次,最多重復(fù)次數(shù)為一個雙核苷酸重復(fù)類型的SSR 重復(fù)567 次。在重復(fù)次數(shù)的數(shù)量上分析,大于10 次的重復(fù)次數(shù)最多(310 749),在不大于10 次的重復(fù)次數(shù)中5 次(177 356)和6 次(185 716)重復(fù)次數(shù)數(shù)量最多,其余重復(fù)次數(shù)數(shù)目均較少。在核苷酸重復(fù)類型和重復(fù)次數(shù)兩個復(fù)合條件下分析,隨著核苷酸重復(fù)類型的基元序列變長和核苷酸重復(fù)次數(shù)增加,SSR 位點(diǎn)數(shù)量逐漸減少,其中,三核苷酸重復(fù)、重復(fù)5 次數(shù)目最多(164 814),五核苷酸重復(fù)、重復(fù)大于10 次數(shù)目最少(96)。
表4 燕麥全基因組SSR 重復(fù)類型、重復(fù)次數(shù)和占比Table 4 SSR repeat type,repeat number and proportion of whole genome of oat
在燕麥全基因組中共檢索到1 548 種不同的重復(fù)類型(表5),不同基元重復(fù)類型在6 種不同核苷酸類型中均有出現(xiàn)。在單核苷酸重復(fù)中,2 種基元類型A/T(58.80%)與C/G(41.20%)占比大致相當(dāng);在雙核苷酸重復(fù)中4 種基元類型占比差異較大,AG/CT(49.15%)為優(yōu)勢基元,CG/CG(1.67%)占比最小;在三核苷酸重復(fù)中AAC/GTT(24.49%)、ATC/ATG(20.50%)為優(yōu)勢基元;在四、五、六核苷酸重復(fù)中的優(yōu)勢基元分別為AAAT/ATTT(15.29%)、TAAGA/TCTTA(39.21%)、CCTGGG/CCCAGG(41.91%)。隨著核苷酸重復(fù)類型基元序列變長,基元類型顯著增加,但各基元數(shù)量明顯減少。在檢索的所有優(yōu)勢基元中,含有A、T 堿基的SSR數(shù)量明顯高于含有C、G 堿基的SSR 數(shù)量,說明在燕麥全基因組SSR 位點(diǎn)中含有大量A、T 堿基。
表5 燕麥全基因組各SSR 重復(fù)類型中優(yōu)勢基元類型及分布Table 5 Types and distribution of dominant motifs in each SSR repeat type of oat genome
決定一個SSR 位點(diǎn)能否使用取決于其多態(tài)性的有無,序列長度越長的SSR 具有多態(tài)性的可能越大。對燕麥全基因組SSR 位點(diǎn)長度分布進(jìn)行分析,能夠檢索到最長的SSR 序列為1 587 bp,最短的為11 bp,SSR 平均長度為17.55 bp。其中,SSR 序列長度為11(123 990)、12(177 110)和15 bp(176 477)的SSR 位點(diǎn)數(shù)目占主導(dǎo)優(yōu)勢(圖1)。長度在12 bp以下(低度多態(tài)性)的SSR 位點(diǎn)數(shù)目為123 990 個,長度在12-20 bp(中度多態(tài)性)的SSR 位點(diǎn)數(shù)目為582 176 個,長度大于20 bp(高度多態(tài)性)的SSR位點(diǎn)數(shù)目為121 972 個,表明在燕麥全基因組中SSR位點(diǎn)呈現(xiàn)中度多態(tài)性。
圖1 燕麥基因組SSR 長度分布Fig.1 SSR length distribution of oat genome
將設(shè)計(jì)的100 對引物在2 個親本DNA 中進(jìn)行PCR 擴(kuò)增,使用非變性聚丙烯酰胺凝膠電泳檢測,除10 對引物無擴(kuò)增片段,其余引物擴(kuò)增產(chǎn)物均符合預(yù)期長度,有效擴(kuò)增率為90%;在有效擴(kuò)增的引物中52 對在2 個親本間具有多態(tài)性(表6),擴(kuò)增多態(tài)率為58%。將多態(tài)性SSR 引物進(jìn)一步在F2群體的20 個單株中進(jìn)行擴(kuò)增,均可以看到多態(tài)性條帶(圖2),52 對引物在親本中的擴(kuò)增片段進(jìn)行克隆測序,并將結(jié)果進(jìn)行比對“三分三”基因組發(fā)現(xiàn),PCR 擴(kuò)增位點(diǎn)與SSR 引物設(shè)計(jì)位點(diǎn)一致,且PCR 擴(kuò)增片段的多態(tài)性確由SSR 造成(圖3)。說明本研究基于燕麥基因組開發(fā)的SSR 分子標(biāo)記,無論是PCR 擴(kuò)增的特異性還是產(chǎn)物的多態(tài)性,都可用于后續(xù)的燕麥N1及其他基因的定位研究。
圖2 引物A-1(A)和A-2(B)在試驗(yàn)材料中擴(kuò)增結(jié)果Fig.2 Amplification results of primers A-1(A)and A-2(B)in experimental materials
圖3 引物A-1(A)和A-2(B)在2 個親本中的擴(kuò)增序列比對結(jié)果Fig.3 Amplification sequence alignment of primers A-1(A)and A-2(B)in two parents
表6 開發(fā)的燕麥多態(tài)性SSR 引物信息Table 6 Information of SSR primers developed for oats polymorphism
由于第三代測序技術(shù)的出現(xiàn),使得小麥[16]、燕麥[4-5]等六倍體作物的參考基因組組裝得以實(shí)現(xiàn)。本研究利用最新公布的燕麥參考基因組,對全基因組進(jìn)行SSR 位點(diǎn)鑒定與特征分析,并利用鑒定的SSR 位點(diǎn)開發(fā)52 對多態(tài)性引物并克隆測序驗(yàn)證其真實(shí)性,證明基于參考基因組開發(fā)SSR 標(biāo)記有效可行,相較于轉(zhuǎn)錄組測序、物種間交叉擴(kuò)增和構(gòu)建富集文庫的開發(fā)方法[6-9]簡單高效,為后續(xù)大規(guī)模開發(fā)燕麥SSR 標(biāo)記提供科學(xué)參考依據(jù)。
通過對燕麥全基因組SSR 位點(diǎn)鑒定發(fā)現(xiàn),在數(shù)量上遠(yuǎn)高于一般農(nóng)作物如玉米[17]、苦蕎[18]、谷子[19],以及蔬果類如花生[20]、黃瓜[21]、蘋果[22]、甜菜[23]等基因組。此現(xiàn)象的主要原因是由于燕麥為六倍體作物,染色體條數(shù)多,基因組龐大。但與同為六倍體的小麥中國春基因組[24]相比,兩者SSR 數(shù)量相差較大,主要在于檢索SSR 標(biāo)準(zhǔn)不同,小麥中未檢索單核苷酸的重復(fù)類型。已有研究表明,隨著基因組的擴(kuò)大,SSR 位點(diǎn)數(shù)量不會無限擴(kuò)增,其分布密度會相對減少[25],在燕麥中也符合這一規(guī)律。燕麥基因組相比于四倍體馬鈴薯[26]的SSR 密度減少較多;同時發(fā)現(xiàn)在燕麥基因組的不同亞組間也符合這一規(guī)律,表明在不同物種間和同一物種的不同亞組間,DNA 在同一條染色體復(fù)制過程中發(fā)生的滑動錯配的概率會隨著染色體增長而降低。
在燕麥SSR 的優(yōu)勢基元中,與薏苡[27]、黃麻[28]、煙草[29]、綠豆[30]等其他物種相比,不同物種SSR優(yōu)勢基元不盡相同,但比較發(fā)現(xiàn)不同物種優(yōu)勢基元中均含有豐富的A、T 堿基。這種現(xiàn)象可能是由于A、T 堿基之間含有2 個氫鍵相較于C、G 堿基之間3 個氫鍵更容易被打開所導(dǎo)致。
在燕麥基因組中檢索得到的所有SSR 序列長度占全基因組序列比例遠(yuǎn)小于動物的SSR 含量,相較于植物如擬南芥和玉米,其SSR 含量也較少[31]。表明在燕麥基因組中SSR 位點(diǎn)數(shù)量雖然豐富,但是其含量并不豐富。已有研究發(fā)現(xiàn),SSR 位點(diǎn)在基因組中的擴(kuò)張與物種進(jìn)化密切相關(guān)[31],燕麥較低的SSR含量表明燕麥相較于魚類和擬南芥等物種進(jìn)化相對緩慢。燕麥SSR 含量與同為麥類作物的節(jié)節(jié)麥[32](0.10%)相比含量稍高,節(jié)節(jié)麥?zhǔn)橇扼w小麥(AABBDD)D 套染色體的二倍體祖先。燕麥由于染色體結(jié)構(gòu)復(fù)雜,導(dǎo)致染色體間重組更為頻繁,從而導(dǎo)致更易出現(xiàn)SSR 位點(diǎn),同為六倍體的小麥染色體間的重組導(dǎo)致物種基因組出現(xiàn)馬賽克結(jié)構(gòu)[16],推測燕麥SSR 含量可能與燕麥基因組的馬賽克結(jié)構(gòu)相關(guān)。
本研究開發(fā)的52 對多態(tài)性SSR 標(biāo)記,能夠用于后續(xù)燕麥相關(guān)基因定位克隆、DNA 指紋圖譜和遺傳圖譜構(gòu)建、種群群體分析等研究。但是開發(fā)SSR標(biāo)記隨機(jī)性仍舊較大,比較依賴參考基因組的準(zhǔn)確性,通過非變形聚丙烯酰胺凝膠判別條帶人為誤差較大,而且耗時耗力,后續(xù)可以開發(fā)KASP 標(biāo)記進(jìn)行基因分型或者使用毛細(xì)管電泳的方法檢測 SSR 序列的多態(tài)性。
通過對燕麥“三分三”參考基因組進(jìn)行SSR 位點(diǎn)檢索發(fā)現(xiàn),該基因組SSR 位點(diǎn)多樣、數(shù)量豐富。根據(jù)檢索結(jié)果設(shè)計(jì)引物,在構(gòu)建的F2代群體小規(guī)模進(jìn)行擴(kuò)增,開發(fā)了52 對具有多態(tài)性的引物,并克隆測序驗(yàn)證其真實(shí)性。表明在燕麥“三分三”參考基因組中開發(fā)SSR 標(biāo)記可行有效,開發(fā)的多態(tài)性SSR標(biāo)記可以用于后續(xù)燕麥皮裸基因定位。