王恒波 祁舒婷 陳姝琦 郭晉隆 闕友雄
研究簡報
甘蔗栽培種單倍體基因組SSR位點的發(fā)掘與應(yīng)用
王恒波 祁舒婷 陳姝琦 郭晉隆 闕友雄*
福建農(nóng)林大學(xué)農(nóng)業(yè)部福建甘蔗生物學(xué)與遺傳育種重點實驗室 / 國家甘蔗工程技術(shù)研究中心, 福建福州 350002
甘蔗是世界上最重要的糖料作物之一, 由于尚未完全破譯栽培種基因組, 導(dǎo)致SSR標(biāo)記匱乏, 難以覆蓋全基因組, 限制了甘蔗遺傳研究的進(jìn)展。本研究以栽培種R570的4660個BAC文庫片段序列(累計總長為382 Mb, 預(yù)測到25,316個編碼蛋白基因)組裝成的一套甘蔗單倍體基因組的模板, 利用MISA (Microsatellite identification tool)軟件, 發(fā)掘SSR位點; 并綜合分析其與4種禾本科植物(高粱、玉米、水稻和二歲短柄草)SSR位點的分布特征; 選取50對以TG和AG重復(fù)基序的SSR引物, 分別利用4個甘蔗屬材料(R570、ROC1、LA purple和SES208)和24個重要甘蔗親本, 對SSR引物進(jìn)行擴增效率驗證和多態(tài)性分析。共發(fā)掘到27,241個SSR位點, 平均每個BAC片段有6.29個SSR位點, 平均密度為71.33個SSR Mb-1, 遠(yuǎn)低于高粱的平均密度(350.00個SSR Mb-1)。在重復(fù)基序中, 占比前2位的分別為單核苷酸基序(11,079個)和三核苷酸重復(fù)基序(6447個), 合計占總SSR位點數(shù)的64.33%。與甘蔗不同的是, 4種禾本科植物中的三核苷酸基序類型數(shù)量最多、占比最大。此外, 在單核苷酸重復(fù)基序中, A/T所占比例最高, 為84.8%, C/G所占比例最低, 為15.2%; 在三核苷酸重復(fù)基序中, TGT/ACA所占比例最高, 為16.04%。總之, 禾本科植物基因組富含A/T的基序。在50對SSR引物(TG基序41對和AG基序9對)的多態(tài)性驗證中, 共有45對(90%)能夠擴增出清晰的條帶, 其中35對(70%)在4個甘蔗材料上呈現(xiàn)多態(tài)性。進(jìn)一步利用20對多態(tài)性較高的SSR引物對24個甘蔗重要親本材料進(jìn)行分析, 共擴增到95個等位基因, 平均每對引物擴增4.75個, 驗證了這些引物應(yīng)用于甘蔗遺傳多樣性研究的可行性。本研究鑒定的甘蔗栽培種單倍體基因組SSR標(biāo)記, 有效增加了甘蔗遺傳研究中可用的分子標(biāo)記數(shù)量, 可直接用于甘蔗群體遺傳多樣性分析和重要性狀遺傳機制的解析, 為甘蔗分子育種的深入研究奠定了基礎(chǔ)。
甘蔗栽培種; BAC 文庫; SSR; 標(biāo)記開發(fā); 多態(tài)性
甘蔗(spp. hybrid)是人類最早利用的C4植物, 是世界上最重要的糖料作物, 其食糖占世界總產(chǎn)的80%, 同時也是一種重要生物能源作物, 其生物乙醇產(chǎn)量占世界總產(chǎn)的40%[1]。甘蔗是一種具有適應(yīng)性強、生物量高、光合效率高、可連續(xù)多年種植及CO2補償點低的糖料作物。同時, 甘蔗是世界上生物量最大的作物之一, 2017年甘蔗產(chǎn)量已經(jīng)超過玉米, 位居世界第三[2]。
1887年, 在爪哇和西印度巴巴多斯試驗場發(fā)現(xiàn)甘蔗種子可以產(chǎn)生幼苗, 開啟了甘蔗有性雜交的歷史[3]?,F(xiàn)代甘蔗栽培種是由甘蔗祖先熱帶種(L., 2= 80,= 10)和割手密種(L., 2= 40~128,= 8)雜交產(chǎn)生的真正意義上的甘蔗雜種, 為了恢復(fù)高含糖量性狀, 將雜種后代與熱帶種回交1次, 母本性狀通過2染色體傳遞給后代, 由于種間雜交和非孟德爾的遺傳方式(2+), 造成雜種后代具有高度雜合、多倍體和非整倍體性, 染色體數(shù)目在2= 100~130之間[4]。鑒于甘蔗栽培種的多倍及非整倍體的遺傳背景, 其復(fù)雜性超過了大多數(shù)作物, 使相關(guān)的遺傳研究、育種及基因組測序都面臨極大的困難[5-6]。
簡單重復(fù)序列(simple sequence repeats, SSR)具有高度的多態(tài)性、廣泛分布于真核生物的基因組[5-6], 且分布隨機[7], 但更偏向于低重復(fù)、富含基因的區(qū)域[8]。SSR位點產(chǎn)生于DNA復(fù)制和修復(fù)時, DNA聚合酶滑動或不均等重組[9], 因而可以根據(jù)在種內(nèi)或種間產(chǎn)生大量的長度變異[10], 開發(fā)和篩選出多態(tài)性高、重復(fù)性好的SSR分子標(biāo)記, 進(jìn)而廣泛應(yīng)用于各種動、植物的品種指紋圖譜鑒定[11]、遺傳多樣性分析[12-14]、遺傳圖譜構(gòu)建[15-17]及重要性狀(基因)的遺傳定位或解析[18]等領(lǐng)域。然而, 相對于其他禾本科植物等模式作物, 甘蔗SSR分子標(biāo)記開發(fā)及遺傳連鎖圖譜的構(gòu)建都比較落后, 相關(guān)的國內(nèi)外報道較少。Singh等[13]從4085個EST序列中鑒定出351個EST-SSRs, 驗證后發(fā)現(xiàn)134個有多態(tài)性。Shamshad等[19]從NCBI數(shù)據(jù)庫中獲得10,000個EST序列, 鑒定出406個SSRs, 驗證了63個后發(fā)現(xiàn)42個具有多態(tài)性。Oliveira等[14]從甘蔗EST數(shù)據(jù)庫中鑒定出2005個SSRs, 驗證了342個, 其中224個(65.5%)呈多態(tài)性。甘蔗為同源多倍體作物, 染色體數(shù)目多(100~130), 遺傳背景復(fù)雜, 基因組龐大(約10 Gb)[20], 大規(guī)模開發(fā)甘蔗基因組SSR標(biāo)記面臨很大的困難, 嚴(yán)重制約了甘蔗分子遺傳研究相關(guān)工作的進(jìn)展[16]。迄今, 與其他禾本科植物(如高粱、小麥、大麥、水稻、藜麥、玉米、二穗短柄草)相比, 甘蔗已開發(fā)的SSR標(biāo)記數(shù)量少、多態(tài)性低, 難以滿足甘蔗分子標(biāo)記輔助育種和遺傳作圖等工作的要求。
甘蔗和高粱同源染色體片段(BAC)的比較分析表明, 二者存在較高的基因共線性和序列保守性, 且甘蔗單倍體基因組大小約為800~900 Mb, 接近高粱基因組大小(750 Mb)[20]。普遍認(rèn)為, 一個單倍型序列可為其他單倍型同源染色體提供較好的參考。目前, 甘蔗栽培種R570具有一個103,296個克隆的BAC文庫, 它代表14×單倍體基因組覆蓋率和1.3×R570全基因組覆蓋度[21], 已被廣泛應(yīng)用于比較基因組分析[22-24]。Garsmeur等[25]用全基因組分析(WGP)技術(shù)將甘蔗栽培種R570的BAC與高粱基因組比對, 確定了一個由4660個甘蔗BAC文庫片段組成的覆蓋甘蔗單倍體基因組常染色質(zhì)的BAC的最小標(biāo)記路徑(MTP), 并完成了甘蔗栽培種R570的單倍體基因組測定。目前, 甘蔗栽培種全基因組SSR鑒定尚未報道。本研究旨在分析和驗證甘蔗栽培種R570單倍體基因組數(shù)據(jù), 利用生物信息學(xué)方法發(fā)掘SSR位點的特征及其分布規(guī)律, 并設(shè)計和合成SSR引物, 驗證其多態(tài)性, 為甘蔗栽培種的分子指紋圖譜構(gòu)建、品種間遺傳多樣性分析、重要農(nóng)藝性狀的遺傳機制研究及分子育種的推進(jìn)奠定一定的基礎(chǔ)。
甘蔗屬包括1個割手密種、1個熱帶種及世界各國培育的甘蔗栽培種, 都來自于廣州甘蔗糖業(yè)研究所海南甘蔗育種場(表1)。
表1 甘蔗品種資源名稱和來源
通過EMBL-歐洲生物信息學(xué)研究所的公共數(shù)據(jù)庫獲得甘蔗栽培種R570基因組數(shù)據(jù)(登錄號為ERZ654945), 或者也可以從法國農(nóng)業(yè)研究所甘蔗基因組中心(http:// sugarcane-genome.cirad.fr/)直接獲得。其他4種禾本科植物SSR位點序列特征來自鄭燕等[26]分析結(jié)果。
應(yīng)用MISA (Microsatellite identification tool)軟件掃描甘蔗栽培種R570的基因組BAC序列[27], 該軟件下載自http://pgrc.ipk-gatersleben.de/misa/, 在配置文件中設(shè)置核苷酸重復(fù)基序(motif)分別為單(mononucleotide repeats MDRs)、二(dinucleotide repeats DNRs)、三(trinucleotide repeats TNRs)、四(tetranucleotide repeats TtNRs)、五(pentanucleotide repeats PNRs)、六(hexanucleotide repeats HNRs), 序列長度分別為10、12、15、16、15、18。對SSR位點兩側(cè)各截取200 bp序列設(shè)計引物, 借助MISA軟件提供的與Primer3的接口工具, 把MISA識別出來的SSR序列轉(zhuǎn)為Primer3需要的格式。用Primer3 (http://frodo.wi.mit.edu/primer3/)在線設(shè)計引物, 引物設(shè)計參數(shù)為primer length: 18~28 bp; annealing temperature: 55~65℃; amplicon size: 100~500 bp; GC content: 45%~65%[13]。
PCR 體系為25 μL, 包含DNA (25 ng μL–1) 2.0 μL、正反向引物(10 μmol μL–1)各0.5 μL、2×Plus Master Mix (Dye) 12.5 μL (試劑購自北京康為世紀(jì)生物科技有限公司)、9.5 μL ddH2O。鑒于引物較多, 統(tǒng)一使用降落PCR程序, 在T100 Thermal Cycler (Bio-Rad Research, USA)擴增儀上進(jìn)行。擴增程序為94℃預(yù)變性5 min; 94℃變性30 s, 65℃退火30 s, 72℃延伸30 s, 共10個循環(huán), 每個循環(huán)退火溫度降低0.7℃; 94℃變性30 s, 55℃退火30 s, 72℃延伸30 s, 共25個循環(huán); 最后72℃延伸7 min, 4℃保存。PCR產(chǎn)物經(jīng)6%非變性聚丙烯酰胺凝膠電泳分離, 140 V恒壓下電泳3.0 h, 染色、照相及保存, 其中染色采用電泳后泡染法, 用水和0.1 mol L-1NaCl稀釋GelStain 10,000X儲備試劑3300倍, 即標(biāo)準(zhǔn)染色液。GelStain染料購自北京全式金生物技術(shù)有限公司(貨號: GS101-01)。
SSR頻率是指基因組中出現(xiàn)一個SSR位點的距離, 即每若干kb出現(xiàn)一個SSR位點; SSR豐度是指基因組中所有SSR位點的數(shù)量之和; SSR相對豐度是指每百萬個堿基中所含的SSR位點數(shù)量。按電泳擴增結(jié)果, 選擇清晰的擴增條帶人工讀帶, 在相同水平遷移位置上, 有條帶的記為“1”, 沒有條帶的記為“0”, 缺失數(shù)據(jù)記為“-”, 根據(jù)統(tǒng)計的結(jié)果建立0~1矩陣。利用NTSYS-pc 2.1軟件中的子程序SIMQUAL計算樣品間的相似性系數(shù)(SM), 然后用子程序SAHN中的非加權(quán)平均法UPGMA (unweighted pair-group method with arithmetic means)進(jìn)行聚類分析, 最后利用Tree plot繪制樹狀聚類圖。參考Smith[28]的方法計算引物的多態(tài)性信息量(polymorphism information content, PIC)。PIC=1-∑P2, 其中P為某標(biāo)記擴增的第個等位基因出現(xiàn)的頻率, PIC的范圍為0~1, 當(dāng)PIC≥0.5時為高多態(tài)性引物; 0.25 利用MISA軟件掃描甘蔗栽培種R570的4660個BAC文庫序列(總長為382 Mb), 通過分析1~6核苷酸重復(fù)基序,設(shè)定SSR位點的長度不低于10 bp, 共找到27,241個SSR位點(表1), 平均每1.08個基因或14.01 kb含有1個SSR位點。其中單核苷酸重復(fù)基序類型出現(xiàn)的頻率最高, 為11,079個位點, 占總數(shù)的40.67%; 三核苷酸重復(fù)基序類型次之, 為6447個位點, 占總數(shù)的23.67%, 兩者合計占總數(shù)的63.33%。而二、四、五、六核苷酸類型及復(fù)合型所占的比例相對較低, 分別為11.97%、4.92%、9.32%和9.45%, 合計占總數(shù)的36.67%。 對于不同SSR核苷酸重復(fù)基序類型而言, 重復(fù)次數(shù)越少, 出現(xiàn)的頻率越高。在1~6核苷酸重復(fù)基序類型中, 優(yōu)勢重復(fù)基序類型數(shù)量占比最多的重復(fù)次數(shù)都接近其篩選標(biāo)準(zhǔn), 平均重復(fù)次數(shù)分別是11.68、11.23、6.10、4.78、3.38、3.30。在單核苷酸重復(fù)基序類型數(shù)量中, 優(yōu)勢重復(fù)次數(shù)最多的是10次重復(fù), 有6297個, 占總位點數(shù)23.12%, 與三核苷酸重復(fù)基序總數(shù)基本相當(dāng), 但比二、四、五、六核苷酸重復(fù)基序的總數(shù)還多。在三核苷酸重復(fù)基序類型中, 優(yōu)勢重復(fù)次數(shù)最多的是5次重復(fù), 有3718個, 占總位點數(shù)13.65%, 除了單核苷酸重復(fù)類型外, 也都超過了其他4種類型重復(fù)基序類型的總數(shù)。二、四、五、六核苷酸重復(fù)基序類型優(yōu)勢重復(fù)次數(shù)相對較少, 其中四核苷酸重復(fù)基序的總數(shù)最少, 其優(yōu)勢重復(fù)次數(shù)為4次重復(fù), 僅有941個, 占總位點數(shù)3.45%??傮w而言, 重復(fù)次數(shù)在3~10之間的總SSR位點數(shù)為21,270個, 占總位點數(shù)的78.08%。在1~6核苷酸重復(fù)基序類型中, 優(yōu)勢重復(fù)次數(shù)占比分別從56.83%、37.09%、57.67%、70.17%、80.54%和81.74%, 除了二核苷酸重復(fù)基序較低外, 其他基序類型呈現(xiàn)出逐步遞升趨勢。此外, 在設(shè)計SSR引物成功率上, 隨著核苷酸重復(fù)基序類型的增多和優(yōu)勢重復(fù)次數(shù)的降低, 設(shè)計到符合標(biāo)準(zhǔn)的SSR引物的成功率在逐漸下降。 表2 甘蔗栽培種R570基因組上各類核苷酸重復(fù)基序分布特征信息 選取了4種具有代表性的禾本科植物(高粱、玉米、水稻、二穗短柄草)和甘蔗比較, 它們的基因組變化范圍在272 Mb (二穗短柄草)和2061 Mb (玉米)之間(表3)。SSR數(shù)量與基因組大小存在極顯著的正相關(guān)(= 0.92;< 0.01), 但SSR的相對豐度和頻率與基因組大小沒有相關(guān)性。在1~6核苷酸重復(fù)基序中, 水稻SSR位點相對豐度都是最高的, 其次是二穗短柄草(除二和六核苷酸重復(fù)基序外), 而甘蔗的SSR相對豐度基本都是最低的(除單核苷酸重復(fù)基序外)。總的相對豐度從高到低分別為水稻(566.45)、二穗短柄草(361.15)、高粱(350.00)、玉米(152.54)、甘蔗(71.33), SSR位點分布在禾本科植物中存在豐富的多樣性。同時, SSR出現(xiàn)的頻率也與SSR數(shù)量成正比, 頻率從高到低呈現(xiàn)相同的變化趨勢。 5種禾本科植物的6種不同核苷酸重復(fù)基序的SSR的相對數(shù)量(豐度)比較(表3)表明, 除甘蔗的單核苷酸外, 其他物種都表現(xiàn)出三核苷酸的相對數(shù)量(豐度)最多, 六核苷酸重復(fù)基序次之, 且都是玉米的SSR數(shù)量最高, 水稻和甘蔗最少, 而相對數(shù)量(豐度)上水稻最高, 玉米和甘蔗最低。 甘蔗和高粱同屬于禾本科黍亞科, 兩者大約在八至九百萬年前由共同祖先分化而來, 且高粱進(jìn)化相對較慢, 保持了其祖先相對完整的基因組組成[22]。甘蔗和玉米是5個禾本科物種中基因組最大的2個, 因此, 也最有可能出現(xiàn)長SSR序列。從表4可以看出, 所有物種的1~6核苷酸重復(fù)基序中, 前3種最長的SSR基序類型基本都是A/T堿基組成的重復(fù)基序類型, 而不是C/G重復(fù)類型。在單核苷酸重復(fù)和二核苷酸重復(fù)基序類型中, 最長的核苷酸重復(fù)A(88)和AC(910)均出現(xiàn)在玉米的基因組內(nèi), 而甘蔗和水稻相對都是最低的。在三核苷酸重復(fù)類型中, 最長的核苷酸重復(fù)(TGT)369和(ACT)366分別出現(xiàn)在甘蔗和高粱中, 水稻中則最低。對于四核苷酸到六核苷酸重復(fù)基序, 長的SSR序列都出現(xiàn)在高粱中, 甘蔗次之。同時, 5個禾本科植物都有一個最長ACAT重復(fù)基序, 其余類型除了有1個C/G外, 都由A/T組成。在所有的五核苷酸重復(fù)類型中, AATAT重復(fù)基序最多, 占到9個, 其余類型只含有1~3個G/C, 說明大多數(shù)長的五核苷酸重復(fù)類型都是由A/T組成。在六核苷酸重復(fù)類型中, 玉米、水稻和二穗短柄草的重復(fù)序列長度都遠(yuǎn)遠(yuǎn)低于高粱和甘蔗。 表3 5種禾本科植物中1~6核苷酸重復(fù)基序類型的SSR數(shù)量和相對豐度 表4 5種禾本科植物中前3種最長SSR基序類型 在甘蔗栽培種基因組中, 單、二、三核苷酸重復(fù)基序占比達(dá)到76.31%以上, 因此分析其優(yōu)勢重復(fù)基序和各種類型SSR序列的堿基組成, 對于進(jìn)一步篩選和驗證多態(tài)性SSR引物具有重要作用。如圖1所示, 從基序結(jié)構(gòu)出現(xiàn)的頻率上看, A/T和G/C占各占84.78%和15.22%, 分別是甘蔗栽培種基因組 SSR 中單核苷酸出現(xiàn)頻率最高和最低的結(jié)構(gòu); AT/TA(31.51%)和CG/GC(6.32%)分別是二核苷酸中出現(xiàn)最多和最少的基序結(jié)構(gòu); 三核苷酸出現(xiàn)頻率最多的結(jié)構(gòu)是TGT/ACA(16.04%), 其次是CGC/GCG、CCG/GGC和GCC/CGG基序結(jié)構(gòu)類型, 分別占12.02%、11.31%、10.67%, 合計占34.00%; 最少的則是TCA/AGT, 占0.35%。甘蔗和4種禾本科植物SSR基序都有堿基的偏好性和規(guī)律, 在單核苷酸中, 甘蔗、高粱和水稻A/T的比例也都高于G/C的比例, 分別為84.78%、65.60%和64.40%, 但在玉米和二穗短柄草的結(jié)果完全相反; 在二核苷酸中, 甘蔗(31.51%)和其他4個物種(22.6%~54.2%)都是AT/TA重復(fù)比例最高, 而GC/CG重復(fù)的比例最低, 基本都在3.1%~6.6%之間; 在三核苷酸類型中, CGC/GCG、CCG/GGC和GCC/CGG三者合計在所有物種中都最高, 且以水稻(44.75%)最高, 甘蔗(34.0%)次之, 玉米(12.74%)最低[26]。 根據(jù)Pan[12]篩選到21對多態(tài)性豐富的SSR引物對應(yīng)的重復(fù)基序類型, 它們以TG和AG重復(fù)基序為主, 本研究選擇以TG和AG基序類型以及重復(fù)次數(shù)分別在TG(11~69)、AG(23~38)之間的SSR位點, 對其進(jìn)行引物設(shè)計和合成, 共計50對SSR引物, 對4個不同甘蔗屬材料(栽培種R570, 栽培種ROC1, 熱帶種LA purple 和割手密種SES208)進(jìn)行SSR擴增和多態(tài)性篩選。共有45對引物能夠擴增出清晰的擴增條帶, 其余的5對引物沒有擴增條帶或者擴增產(chǎn)物量較弱, 其中35對引物在4個材料上呈現(xiàn)多態(tài)性(表5), 多態(tài)率為70% (35/50), 其中TG重復(fù)類型的引物有28對, AG重復(fù)類型的引物有7對。圖2顯示了部分引物篩選擴增結(jié)果。為了進(jìn)一步驗證本研究鑒定到SSR引物的多態(tài)性, 選用20對多態(tài)性較高的SSR引物, 對我國50年來育成163個甘蔗品種的18個骨干親本(它們的血緣來自熱帶種、割手密種、大莖野生種和印度種的2~4個種, 且具有較低的共祖系數(shù))、2個甘蔗祖先種(割手密種SES 208和熱帶種LA purple)和4個重要甘蔗栽培種(LCP85-384、R570、ROC16和ROC22)進(jìn)行遺傳多樣性分析。結(jié)果20對引物在24個甘蔗實驗材料上呈現(xiàn)多態(tài)性, 共擴增得到等位基因95個, 每對擴增出1~7個等位基因(表5), 平均每一對引物擴增出4.75個等位基因。圖3展示了其中FAFUR-S22引物在24個供試甘蔗材料上的PCR擴增電泳圖譜。 圖1 1~3核苷酸重復(fù)基序類型及數(shù)量 圖2 7對不同SSR引物在4個甘蔗屬材料上擴增的電泳圖 1~4: FAFUR-S44; 5~8: FAFUR-S45; 9~12: FAFUR-S46; 13~16: FAFUR-S47; 17~20: FAFUR-S48; 21~24: FAFUR-S49; 25~28: FAFUR-S50。4個擴增產(chǎn)物為SES208 (1, 5, 9, 13, 17, 21, 25)、LA purple (2, 6, 10, 14, 18, 22, 26)、ROC16 (3, 7, 11, 15, 19, 23, 27)和R570 (4, 8, 12, 16, 20, 24, 28); M: 50 bp DNA ladder (3421A)。 1–4: FAFUR-S44; 5–8: FAFUR-S45; 9–12: FAFUR-S46; 13–16: FAFUR-S47; 17–20: FAFUR-S48; 21–24: FAFUR-S49; 25–28: FAFUR-S50. The amplification products of four samples were SES208 (1, 5, 9, 13, 17, 21, 25), LA purple (2, 6, 10, 14, 18, 22, 26), ROC16 (3, 7, 11, 15, 19, 23, 27), and R570 (4, 8, 12, 16, 20, 24, 28). M: 50 bp DNA ladder (3421A). 基于上述20對SSR引物所給出的95種等位基因類型, 對24份甘蔗屬材料的UPGMA聚類分析, 供試材料之間的遺傳相似系數(shù)分布在0.40~0.82之間(圖4), 在遺傳相似性系數(shù)為0.525時, 可將24個甘蔗材料分成5種類型, 第1種類型包含甘蔗栽培種Co 1001和Co 419; 第2種類型有19個甘蔗材料; 第3種類型為1個甘蔗材料熱帶種類型LA purple; 第4類型為1個甘蔗栽培種材料CP28-11; 第5種類型為1個割手密種SES 208。需要注意的是, 在相似性系數(shù)為0.4時, 割手密種SES208與其他甘蔗栽培種和熱帶種(LA purple)較早分開, 表明割手密種與甘蔗栽培種具有較遠(yuǎn)的遺傳關(guān)系。根據(jù)張瓊等[29]分析結(jié)果, CP28-11具有熱帶種(0.5)、割手密(0.125)和印度種(0.375)的血緣關(guān)系, 遺傳關(guān)系介于割手密和熱帶種之間。本研究中, 熱帶種(LA purple)在相似性系數(shù)為0.525時與其他栽培種分開, 接著是印度種Co 1001和Co 419在相似性系數(shù)為0.551時與其他栽培種分開, 表明印度種親緣關(guān)系介于熱帶種與甘蔗栽培種之間, 也具有較豐富的遺傳多樣性。 圖3 SSR引物(FAFUR-S22)在24個甘蔗材料上擴增的電泳圖 1: Co 1001; 2: Co 419; 3: CP28-11; 4: CP49-50; 5: CP67-412; 6: CP72-1210; 7: F108; 8: NCo310; 9: ROC1; 10: 川73-219; 11: 桂糖11號; 12: 華南56-12; 13: POJ2878; 14: 科5; 15: 崖城71-374; 16: 粵農(nóng)73-204; 17: 云蔗65-225; 18: 華南56-21; 19: LCP85-384; 20: R570; 21: ROC16; 22: ROC22; 23: LA purple; 24: SES208; M: 50 bp DNA ladder (3421A)。 1: Co 1001; 2: Co 419; 3: CP28-11; 4: CP49-50; 5: CP67-412; 6: CP72-1210; 7: F108; 8: NCo310; 9: ROC1; 10: C73-219; 11: Guitang 11; 12: Huanan 56-12; 13: POJ2878; 14: Ke 5; 15: Yacheng 71-374; 16: Yuenong 73-204; 17: Yunzhe 65-225; 18: Huanan 56-21; 19: LCP85-384; 20: R570; 21: ROC16; 22: ROC22; 23: LA purple; 24: SES208; M: 50 bp DNA ladder (3421A). 表5 具有擴增多態(tài)性的甘蔗SSR引物信息表 (續(xù)表5) #表示引物對的多態(tài)性相對較低。#indicates that the primer pairs have relatively low polymorphism. 圖4 基于SSR分子標(biāo)記的24份甘蔗屬材料的UPGMA聚類分析 SSR分子標(biāo)記具有多態(tài)性高、重復(fù)性好、操作簡便及共顯性等優(yōu)點, 被廣泛應(yīng)用于甘蔗指紋圖譜構(gòu)建[11]、遺傳多樣性分析[12-14]、遺傳連鎖圖譜構(gòu)建及QTL定位等方面[15-18]。但目前尚未完全破譯甘蔗栽培種基因組, 對于SSR標(biāo)記開發(fā)僅僅停留在BAC文庫和表達(dá)序列標(biāo)簽(EST)水平。本研究首次利用已經(jīng)完成的甘蔗栽培種單倍體基因組數(shù)據(jù), 分析SSR在基因組分布頻率、基序類型及序列特征等相關(guān)信息, 對于甘蔗基因組遺傳研究和分子標(biāo)記開發(fā)提供重要數(shù)據(jù)支撐。 本研究從甘蔗栽培種R570的4660個BAC文庫序列組裝的單倍體基因組(累計總長為382 Mb, 預(yù)測到25,316個編碼蛋白基因)中, 共發(fā)現(xiàn)27,241個SSR位點, 在基因組中1~6核苷酸重復(fù)基序中, 單核苷酸重復(fù)基序占比最高, 達(dá)到40.67%, 其次是三核苷酸(占23.67%)、二核苷酸重復(fù)基序(占11.97%)。這與擬南芥[30]、水稻[30]、小麥[31]、玉米[3]、棉花[31]、馬鈴薯[32]、蘋果[15]和葡萄[33]的基因組SSR位點中存在大量的單、二、三核苷酸的結(jié)果基本一致; 與高粱[26,34]、根瘤菌和秀麗線蟲[35]的研究結(jié)果不同, 它們的基因組SSR位點以四、五、六核苷酸重復(fù)基序為主。一般情況下, 短重復(fù)基序占多數(shù)表明物種進(jìn)化水平相對較高[36], 而長重復(fù)基序占多數(shù)的物種具有較低的突變頻率或較短的進(jìn)化時間[37]。甘蔗與高粱在八至九百萬年前由共同祖先分化而來, 高粱進(jìn)化相對較慢, 保持了相對完整的祖先基因組構(gòu)成[22]。本研究結(jié)果進(jìn)一步說明, 與高粱相比, 甘蔗在進(jìn)化與分類地位中處于相對較高水平, 其基因組也經(jīng)歷了較長的進(jìn)化時間或具有較高的突變頻率。但是, 甘蔗栽培種基因組遺傳基礎(chǔ)復(fù)雜、雜合度高, 尚未完成基因組測序, 本研究僅依據(jù)高粱基因組為參考, 利用BAC文庫序列拼裝一套甘蔗單倍體基因組作為SSR挖掘的模板[25], 基因組數(shù)據(jù)并不完整。因此, 分析結(jié)果尚無法與其他物種上的SSR數(shù)據(jù)比較, 但是也初步證明了與大多數(shù)禾本科植物具有相似的核苷酸基序組成。 在不同物種的SSR位點信息特征研究方面, SSR基序的結(jié)構(gòu)組成, 尤其是1~3核苷酸重復(fù)基序具有明顯的偏好性和規(guī)律性, 但4~6核苷酸重復(fù)基序, 由于基序類型呈現(xiàn)指數(shù)上升(分別是2,521,020和4092), 堿基偏好性和規(guī)律性表現(xiàn)的不明顯。本研究結(jié)果顯示, 甘蔗栽培種基因組序列中, 單核苷酸重復(fù)基序類型以A/T出現(xiàn)的次數(shù)最多(占84.78%), 這與水稻、高粱[26]、蘋果[15]和煙草[38]的研究結(jié)果一致, 但是與二穗短柄草、玉米G/C基序結(jié)構(gòu)出現(xiàn)次數(shù)不一致[26]; 而二核苷酸重復(fù)基序類型則以AT/TA出現(xiàn)的次數(shù)最多(占31.51%), CG/GC(占6.32%)最少, 該結(jié)果與高粱、煙草、蘋果的研究結(jié)果一致, 但是在其他禾本科植物小麥[39]、二穗短柄草、水稻和玉米中不一致[26], 它們是以AG重復(fù)類型最多; 三核苷酸重復(fù)基序類型以TGT/ACA (16.04%)出現(xiàn)的次數(shù)最多(占16.04%), 其次是含有CGC/GCG等6類不同組合基序類型(合計占34.0%), 與擬南芥(AAG/TTC)、煙草(AAC/TTG)、蘋果(AAC/GTT)基本相似, 與大麥、小麥、玉米、水稻、高粱、黑麥等其他禾本科作物有所不同, 它們以CCG/GCC出現(xiàn)次數(shù)最多, 而ATT/TAA最少。綜合以上, 甘蔗的1~3核苷酸重復(fù)基序均以A和T核苷酸構(gòu)成的基序為主要類型, 這與真核生物基因組SSR位點分析結(jié)果基本一致[36], 產(chǎn)生這樣的結(jié)果有2種可能原因, 一是甲基化的C殘基轉(zhuǎn)變?yōu)門[40]; 二是在DNA復(fù)制過程中產(chǎn)生SSR位點, 基于A、T結(jié)構(gòu)類型基序比G、C類型需要較少能量, 導(dǎo)致富含A、T堿基結(jié)構(gòu)類型比G、C類型容易產(chǎn)生[38], 但是隨著核苷酸重復(fù)類型從3增至6時, 這種氫鍵的能量優(yōu)勢就相對不明顯了。 近年來, 隨著基因組測序技術(shù)進(jìn)步和測序成本的降低, 已經(jīng)完成許多生物基因組測序, 這些測序結(jié)果對于相應(yīng)物種基因組SSR標(biāo)記開發(fā)和應(yīng)用提供了數(shù)據(jù)支撐, 還可以利用所開發(fā)的SSR標(biāo)記對未測序的近緣物種進(jìn)行遺傳分析, 加快其群體結(jié)構(gòu)分析、遺傳多樣性研究、親緣關(guān)系鑒定、重要性狀的功能基因QTL定位及關(guān)聯(lián)標(biāo)記開發(fā)與應(yīng)用。本研究通過分析Pan等[12]篩選和鑒定的21對多態(tài)性豐富的SSR引物的重復(fù)基序類型, 選擇了50對SSR引物, 它們由TG(41對)和AG(9對)基序重復(fù)類型組成。此外, 利用4個甘蔗屬材料進(jìn)行PCR擴增和多態(tài)性分析, 共有45對引物擴增到預(yù)期的擴增片段, 其中TG和AG基序類型的分別有37對(擴增效率90.24%)和8對, 擴增效率為88.89%, 遠(yuǎn)高于Cordeiro等[41]開發(fā)甘蔗EST-SSR引物的60%, 也高于Oliveira等[14]開發(fā)的甘蔗基因組SSR的70%、Bushman等[42]針對多年生黑麥草開發(fā)的基因組和EST-SSR的75 %、Fernandez等[43]獲得的甜瓜基因組和EST的79 %和Hwang等[44]發(fā)掘的西瓜EST-SSR的79%。此外, 在我們設(shè)計的50對SSR引物中, 有35對呈現(xiàn)出明顯的多態(tài)性, TG和AG基序類型分別有28對和7對, 且AG基序的多態(tài)性(77.78%)高于TG類型(68.29%)。 本研究還在對SSR標(biāo)記初步擴增分析的基礎(chǔ)上, 進(jìn)一步利用24個甘蔗重要親本材料驗證上述20對SSR引物的多態(tài)性。結(jié)果20對引物擴增出95種不同等位基因, 每對引物擴增1~8個等位基因, 平均每對引物擴增4.75個。與Pinto等[45]的6.04個、Oliveira等[14]的7.55個、Marconi等[46]的6.0個相比, 本研究開發(fā)的甘蔗SSR引物擴增出的等位基因偏少, 主要原因應(yīng)該是不同研究所采用的電泳分離方法存在差異, 當(dāng)將本研究鑒定的SSR引物應(yīng)用于甘蔗遺傳研究時, 建議進(jìn)一步優(yōu)化PCR擴增條件, 同時采用分辨率更高的電泳分離方法, 比如變性聚丙烯酰胺凝膠電泳、毛細(xì)管電泳等, 以便更準(zhǔn)確和高效地對目標(biāo)材料進(jìn)行擴增和多態(tài)性分析。同時, 20對SSR引物擴增的多態(tài)性信息量(PIC)的變異幅度在0.61~0.92之間, 平均值為0.78, 說明本研究所篩選和鑒定的SSR引物所擴增出來的條帶多態(tài)性豐富。特別需要指出的是, 川73-219和粵農(nóng)73-204在相似性系數(shù)為0.9時沒有分開, 說明兩者親緣關(guān)系非常近, 需要用更多SSR引物鑒定和分析。 綜上所述, 本研究利用大小約為382 Mb的甘蔗栽培種R570的單倍體基因組, 開發(fā)了27,241個SSR位點, 平均每BAC片段有6.29個。通過分析和比較其他物種基因組序列上SSR位點、類型及結(jié)構(gòu)等特征, 設(shè)計了50對SSR引物, 分別利用4個甘蔗屬近緣種(R570、ROC1、LA purple和SES 208)和24個甘蔗重要雜交親本材料, 進(jìn)行擴增效率和多態(tài)性分析, 獲得了20對引物擴增條帶清晰、多態(tài)性條帶比率高, 具有較好應(yīng)用前景的SSR標(biāo)記。這20對引物在24個甘蔗雜交親本中擴增出95種不同等位基因, 每對引物擴增1~8個等位基因之間, 平均為4.75個。本研究建立的SSR引物篩選和鑒定方法, 對于開發(fā)高質(zhì)量多態(tài)性SSR標(biāo)記具有積極的借鑒作用; 所開發(fā)的20對具有良好多態(tài)性的SSR標(biāo)記, 能夠為甘蔗及其近緣種的品系鑒定、遺傳多樣性分析、遺傳圖譜構(gòu)建及重要性狀的遺傳機制解析等提供了分子標(biāo)記支撐。 [1] 劉燕群, 李玉萍, 梁偉紅, 宋啟道, 秦小立, 葉露. 國外甘蔗產(chǎn)業(yè)發(fā)展現(xiàn)狀.世界農(nóng)業(yè), 2015, (8): 147–152. Liu Y Q, Li Y P, Liang W H, Song Q D, Qin X L, Ye L. Current situation of sugarcane industr in the world,, 2015, (8): 147–152 (in Chinese with English abstract). [2] FAOSTAT: http://www.fao.org/faostat/zh/#data?tdsourcetag=s_ pctim_aiomsg. [3] 彭紹光. 甘蔗育種學(xué). 北京. 農(nóng)業(yè)出版社, 1990. pp 4–5. Peng S G. Sugarcane Genetic Breeding. Beijing: Agricultural Press, 1990. pp 4–5 (in Chinese). [4] Hermann S R, Aitken K S, Jackson P A, George A W, Piperidis N, Wei X, Kilian A, Detering F. Evidence for second division restitution as the basis for 2+maternal chromosome transmission in a sugarcane cross.,2012, 187: 359–368. [5] Piperidis G, Piperidis N, D’Hont A. Molecular cytogenetic investigation of chromosome composition and transmission in sugarcane., 2010, 284: 65–73. [6] Wang H B, Chen P H, Yang Y Q, D'Hont A, Lu Y H. Molecular insights into the origin of the brown rust resistance geneamongspecies.,2017, 130: 2431–2443. [7] Smith D, Devey M E. Occurrence and inheritance of microsatellites in., 1994, 37: 977–983. [8] Morgante M, Hanafey M, Powell W. Microsatellites are preferentially associated with nonrepetitive DNA in plant genomes.,2002, 30: 194–200. [9] Levinson G, Gutman G A. Slipped-strand mispairing: a major mechanism for DNA sequence evolution., 1987, 4: 203–221. [10] Michael K, Eva-Maria D, Ugo R, Nicoletta C, Uta-Dorothee I, Manfred K, Wolfgang R M. Haplotype studies support slippage as the mechanism of germline mutations in short tandem repeats., 2004, 25: 3344–3348. [11] Liu X L, Ma L, Chen X K, Ying X M, Cai Q, Liu J Y, Wu C W. Establishment of DNA fingerprint identity for sugarcane cultivars in Yunnan, China.2010, 36: 202–210. [12] Pan Y B. Highly polymorphic microsatellite DNA markers for sugarcane germplasm evaluation and variety identity testing.,2006,8: 246–256. [13] Ram K S, Satya N J, Suhail K, Sonia Y, Nandita B, Saurabh R, Vasudha B, Sanjay K D, Raman K, Sushil SDevelopment, cross-species/genera transferability of novel EST-SSR markers and their utility in revealing population structure and genetic diversity in sugarcane.,2013,524: 309–329. [14] Oliveira K M, Pinto L R, Marconi T G, Mollinari M, Ulian E C, Chabregas S M, Falco M C, Burnquist W, Garcia A A, Souza A P. Characterization of new polymorphic functional markers for sugarcane.,2009, 52: 191–209. [15] 關(guān)玲, 章鎮(zhèn), 王新衛(wèi), 薛華柏, 劉艷紅, 王三紅, 喬玉山. 蘋果基因組SSR位點分析與應(yīng)用. 中國農(nóng)業(yè)科學(xué),2011, 44: 4415–4428. Guan L, Zhang Z, Wang X W, Xue H B, Liu Y H, Wang S H, Qiao Y S. Evaluation and application of the SSR loci in apple genome., 2011, 44: 4415–4428 (in Chinese with English abstract). [16] 劉新龍, 毛鈞, 陸鑫, 馬麗, Karen S A, Jackson P A, 蔡青, 范源洪. 甘蔗SSR和AFLP分子遺傳連鎖圖譜構(gòu)建. 作物學(xué)報, 2010, 36: 177–183. Liu X L, Mao J, Lu X, Ma L, Karen S A, Jackson P A, Cai Q, Fan Y H. Construction of molecular genetic linkage map of sugarcane based on SSR and AFLP markers., 2010, 36: 177–183 (in Chinese with English abstract). [17] Andru S, Pan Y B, Thongthawee S, Burner D M, Kimbeng C A. Genetic analysis of the sugarcane (spp.) cultivar ‘LCP 85-384’: I. linkage mapping using AFLP, SSR, and TRAP markers., 2011, 123: 77–93. [18] Yang X, Islam M S, Sood S, Maya S, Hanson E A, Comstock J, Wang J. Identifying quantitative trait loci (QTLs) and developing diagnostic markers linked to orange rust resistance in sugarcane (spp.)., 2018, 9: 350. [19] Shamshad U H, Kumar P, Singh R K, Verma K S, Bhatt R, Sharma M, Kachhwaha S, Kothari S L. Assessment of functional EST-SSR markers (Sugarcane) in cross-species transferability, genetic diversity among Poaceae plants, and bulk segregation analysis., 2016, 2016: 7052323. [20] Jianping W, Bruce R, Simone M, Qingyi Y, Jan E M, Haibao T, Cuixia C, Fares N, Graham W, John BMicrocollinearity between autopolyploid sugarcane and diploid sorghum genomes., 2010, 11: 261. [21] Laurent G, Paulo A. Sugarcane genomics: depicting the complex genome of an important tropical crop., 2002, 5: 122–127. [22] Jannoo N, Grivet L, Chantret N, Garsmeur O, Glaszmann J C, Arruda P, D’Hont A. Orthologous comparison in a gene-rich region among grasses reveals stability in the sugarcane polyploid genome., 2007, 50: 574–585. [23] Paterson A H, Bowers J E, Bruggmann R, Dubchak I, Grimwood J, Gundlach H, Haberer G, Hellsten U, Mitros T, Poliakov AThe Sorghum bicolor genome and the diversification of grasses.,2009, 457: 551–556. [24] Garsmeur O, Charron C, Bocs S, Jouffe V, Samain S, Couloux A, Droc G, Zini C, Glaszmann J, Van Sluys MHigh homologous gene conservation despite extreme autopolyploid redundancy in sugarcane., 2011, 189: 629–642. [25] Garsmeur O, Droc G, Antonise R, Grimwood J, Potier B, Aitken K, Jenkins J, Martin G, Charron C, Hervouet CA mosaic monoploid reference sequence for the highly complex genome of sugarcane.,2018, 9: 2638–2638. [26] 鄭燕, 張耿, 吳為人. 禾本科植物微衛(wèi)星序列的特征分析和比較. 基因組學(xué)與應(yīng)用生物學(xué), 2011, 30: 513–520. Zheng Y, Zhang Z, Wu W R. Characterization and comparison of microsatellites in Gramineae., 2011, 30: 513–520 (in Chinese with English abstract). [27] Martins W, de Sousa D, Proite K, Guimar?es P, Moretzsohn M, Bertioli D. New softwares for automated microsatellite marker development.,2006, 34: e31. [28] Smith J S, Chin E C, Shu H, Smith O S, Wall S J, Senior M L, Mitchell S E, Kresovich S, Ziegle J. An evaluation of the utility of SSR loci as molecular markers in maize (L.): comparisons with data from RFLPS and pedigree.,1997, 95: 163–173. [29] 張瓊, 齊永文, 張垂明, 陳勇生, 鄧海華. 我國大陸甘蔗骨干親本親緣關(guān)系分析.廣東農(nóng)業(yè)科學(xué), 2009, (10): 44–48. Zhang Q, Qi Y W, Zhang T M, Chen Y S, Deng H H. Pedigree analysis of genetic relationship among core parents of sugarcane in mainland China., 2009, (10): 44–48 (in Chinese with English abstract). [30] Lawson M J, Zhang L. Distinct patterns of SSR distribution in theand rice genomes.,2006, 7: R14. [31] Kantety R V, La Rota M, Matthews D E, Sorrells M E. Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat., 2002, 48: 501–510. [32] Tang J, Baldwin S J, Jacobs J M, Linden C G, Voorrips R E, Leunissen J A, van Eck H, Vosman B. Large-scale identification of polymorphic microsatellites using an in silico approach., 2008, 9: 374. [33] 蔡斌, 李成慧, 姚泉洪, 周軍, 陶建敏, 章鎮(zhèn). 葡萄全基因組SSR分析和數(shù)據(jù)庫構(gòu)建. 南京農(nóng)業(yè)大學(xué)學(xué)報, 2009, 32(4): 28–32. Cai B, Li C H, Yao Q H, Zhou J, Tao J M, Zhang Z. Analysis of SSRs in grape genome and development of SSR database., 2009, 32(4): 28–32 (in Chinese with English abstract). [34] 陸景標(biāo), 李杰勤, 盧杰, 詹秋文. 高梁非編碼區(qū)SSR引物設(shè)計以及e-PCR的驗證. 種子, 2010, 29(9): 1–6. Lu J B, Li J Q, Lu J, Zhan Q W. Design of SSR primers and verification of e-PCR in non-coding regions of sorghum genome., 2010, 29(9): 1–6 (in Chinese with English abstract). [35] 高亞梅, 韓毅強, 湯輝, 孫東梅, 王彥杰, 王偉東. 根瘤菌基因組內(nèi)簡單重復(fù)序列的分析. 中國農(nóng)業(yè)科學(xué)2008, 41: 2992–2998. Gao Y M, Han Y Q, Tang H, Sun D M, Wang Y J, Wang W D. Analysis of simple sequence repeats in Rhizobium genomes., 2008, 41: 2992–2998 (in Chinese with English abstract). [36] Toth G, Gaspari Z, Jurka J. Microsatellites in different eukaryotic genomes: survey and analysis., 2000, 10: 967–981. [37] Harr B, Schlotterer C. Long microsatellite alleles in Drosophila melanogaster have a downward mutation bias and short persistence times, which cause their genome-wide under representation., 2000, 155: 1213–1220. [38] 童治軍, 焦芳嬋, 肖炳光. 普通煙草及其祖先種基因組SSR位點分析. 中國農(nóng)業(yè)科學(xué),2015, 48: 2108–2117.Tong Z J, Jiao F C, Xiao B G. Analysis of SSR loci ingenome and its two ancestral species genome.,2015, 48: 2108–2117 (in Chinese with English abstract). [39] Yu J K, La Rota M, Kantety R V, Sorrells M E. EST derived SSR markers for comparative mapping in wheat and rice., 2004, 271: 742–751. [40] Schorderet D F, Gartler S M. Analysis of CpG suppression in methylated and nonmethylated species.,1992, 89: 957–961. [41] Cordeiro G M, Casu R, McIntyre C L, Manners J M, Henry R J. Microsatellite markers from sugarcane (spp.) ESTs cross transferable to erianthus and sorghum.,2001, 160: 1115–1123. [42] Bushman B S, Larson S R, Mott I W, Cliften P F, Wang R R, Chatterton N J, Hernandez A G, Ali S, Kim R W, Thimmapuram JDevelopment and annotation of perennial Triticeae ESTs and SSR markers.,2008, 51: 779–788. [43] Fernandez I, Eduardo I, Blanca J, Esteras C, Pico B, Nuez F, Arus P, Garcia J, Monforte A J. Bin mapping of genomic and EST-derived SSRs in melon (L.).,2008, 118: 139–150. [44] Hwang J Y, Ahn S G, Youl Oh J, Choi Y W, Kang J S, Park Y H. Functional characterization of watermelon (L.) EST-SSR by gel electrophoresis and high resolution melting analysis.,2011, 130: 715–724. [45] Pinto L R, Oliveira K M, Ulian E C, Garcia A A, de Souza A P. Survey in the sugarcane expressed sequence tag database (SUCEST) for simple sequence repeats.,2004, 47: 795–804. [46] Marconi T G, Costa E A, Miranda H R, Mancini M C, Cardoso C B, Oliveira K M, Pinto L R, Mollinari M, Garcia A A, Souza A P. Functional markers for gene mapping and genetic diversity studies in sugarcane.,2011, 4: 264. Development and application of SSR loci in monoploid reference genome of sugarcane cultivar WANG Heng-Bo, QI Shu-Ting, CHEN Shu-Qi, GUO Jin-Long, and QUE You-Xiong* Key Laboratory of Sugarcane Biology and Genetic Breeding (Fujian), Ministry of Agriculture, Fujian Agriculture and Forestry University / Sugarcane Research & Development Center, China Agricultural Technology System, Fuzhou 350002, Fujian, China Sugarcane is one of the most important sugar crops in the world. However, it is difficult to develop SSR on a large scale since the genome of cultivar has not been sequenced, which limits the genetic improvement of sugarcane. In this study, a template of monoploid sugarcane genome was assembled using a set of 4660 BAC library sequences (with a cumulative length of 382 Mb, predicting 25,316 genes) from cultivar ‘R570’. SSR loci were identified by using MISA (Microsatellite identification tool) software. The distribution characteristics of the monoploid genome ‘R570’ was comprehensively analyzed by comparing with the SSR loci of four Gramineae plants (,,, and). Fifty pairs of primers with TG and AG repeat motifs were designed to verify the amplification efficiency and polymorphism by PCR amplification in fourclones (R570, ROC1, LA purple, and SES208) and twenty four core parents of sugarcane. A total of 27,241 SSR loci were identified, with an average of 6.29 SSR loci per BAC clone and an average density of 71.33 SSR Mb–1which was much lower than that of sorghum (350.00 SSR Mb–1). The mono-nucleotide (11,079) and tri-nucleotide repeat motifs (6447) accounted for 64.33% of the total SSR loci. The number and proportion of tri-nucleotide repeat motifs were the largest in the four Gramineae plants. In addition, A/T (accounting for 84.8%) motif had the highest proportion and C/G (accounting for 15.2%) motif the lowest proportion in the mono-nucleotide repeat motifs and TGT/ACA (accounting for 16.04%) motif had the highest proportion in the trinucleotide repeat motifs. In general, the genomes in Gramineae plants are rich in A/T repeat motifs. In the polymorphism validation of 50 pairs of primers (41 pairs of TG motif and 9 pairs of AG motif), 45 pairs of primers (90%) were found to be able to amplify successfully, of which 35 (70%) were polymorphic in 4 sugarcane clones. Furthermore, 20 pairs of polymorphic SSR primers were used to detect 24 core parents of sugarcane, a total of 95 alleles were amplified with an average of 4.75 alleles per primer, verifying the application feasibility of these primers for the genetic diversity analysis in sugarcane. The development of SSR markers from the monoploid genome of cultivars ‘R570’ not only enriches the number of SSR markers available in sugarcane genetic analysis, but also facilitates the genetic diversity analysis of sugarcane population and the genetic mechanism dissection of important agronomic traits, which provides a foundation for the in-depth research of molecular breeding in sugarcane. sugarcane cultivars; bacterial artificial chromosome library; SSR; development; polymorphism 2019-09-11; 2019-12-26; 2020-01-15. 10.3724/SP.J.1006.2020.94135 闕友雄, E-mail: queyouxiong@126.com, Tel: 0591-83852547 E-mail: wanghengbo_0354@126.com, Tel: 0591-83789177 本研究由引進(jìn)國際先進(jìn)農(nóng)業(yè)科學(xué)技術(shù)計劃(948計劃)項目(2014-S18), 國家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(CARS-17)和福建農(nóng)林大學(xué)??萍及l(fā)展專項(KFA18025A)資助。 This study was supported by the Program of Introducing International Super Agricultural Science and Technology (948 Program) (2014-S18), the Agricultural Research System (CARS-17), and Fujian Agriculture and Forestry University Science and Technology Development Special Fund (KFA18025A). URL: http://kns.cnki.net/kcms/detail/11.1809.S.20200115.1136.020.html2 結(jié)果與分析
2.1 甘蔗栽培種SSR位點的數(shù)量、類型及分布頻率
2.2 甘蔗與其他4種禾本科植物SSR位點的數(shù)量和頻率特征比較
2.3 甘蔗SSR重復(fù)基序種類及頻率特征分析
2.4 SSR標(biāo)記的開發(fā)及其擴增效率和多態(tài)性驗證
3 討論
3.1 甘蔗栽培種基因組SSR位點的特征分析
3.2 甘蔗栽培種基因組SSR的多態(tài)性分析和應(yīng)用