王 立,王有國(guó),崔光芬,王祥寧,馬璐琳,段 青,杜文文,賈文杰*
(1.云南農(nóng)業(yè)大學(xué)園林園藝學(xué)院,云南 昆明 650201;2.云南省農(nóng)業(yè)科學(xué)院花卉研究所,云南 昆明 650205)
【研究意義】百合是享譽(yù)世界的著名球根花卉,擁有“球根花卉之王”的美譽(yù),觀賞性極佳,隨著中國(guó)經(jīng)濟(jì)的快速發(fā)展,人們對(duì)于百合鮮切花的需求也在日益劇增[1]。歐美國(guó)家自 20 世紀(jì)初即開(kāi)展了百合育種工作,選育了大量?jī)?yōu)良的雜種系,其中東方百合雜種系是世界,也是中國(guó)最為流行的切花運(yùn)用雜種系[2]。但是由于其花粉量大,往往在運(yùn)用時(shí)容易污染衣物和環(huán)境,因此,培育雄性不育的無(wú)花粉百合一直是百合育種的重點(diǎn)方向[3]。【前人研究進(jìn)展】如何開(kāi)發(fā)相關(guān)分子標(biāo)記技術(shù)來(lái)輔助實(shí)現(xiàn)無(wú)花粉百合的育種,是該項(xiàng)育種工作中的核心。目前利用分子標(biāo)記進(jìn)行的百合研究,主要集中在分析瀘定百合[4]、淡黃花百合[5]等不同群體的遺傳多樣性與親緣關(guān)系方面,運(yùn)用的是常用的分子標(biāo)記技術(shù),主要有RAPD、ISSR、AFLP、SRAP[6],也有基于EST序列開(kāi)發(fā)百合SSR分子標(biāo)記的研究[7],而基于東方百合雄性不育系轉(zhuǎn)錄組測(cè)序結(jié)果開(kāi)發(fā)SSR分子標(biāo)記,并利用SSR標(biāo)記進(jìn)行無(wú)花粉百合遺傳多樣性分析的研究鮮有報(bào)道。【本研究的切入點(diǎn)】本研究在雄性不育東方百合轉(zhuǎn)錄組測(cè)序結(jié)果基礎(chǔ)上,開(kāi)發(fā)SSR分子標(biāo)記,并驗(yàn)證其有效性。【擬解決的關(guān)鍵問(wèn)題】為實(shí)現(xiàn)利用SSR分子標(biāo)記技術(shù)進(jìn)行輔助無(wú)花粉百合的育種和品種指紋圖譜構(gòu)建奠定基礎(chǔ)。
轉(zhuǎn)錄組數(shù)據(jù)來(lái)源于云南省農(nóng)科院花卉所球根中心百合課題組2015年對(duì)東方百合高通量測(cè)序的結(jié)果。測(cè)序所用材料:東方百合可育系及其變異不育系造孢細(xì)胞期和四分體期花藥,每個(gè)時(shí)期取6朵花花藥[3]。分別提取2個(gè)時(shí)期的花藥RNA,測(cè)序時(shí)將2個(gè)時(shí)期的RNA分別等量混合后構(gòu)建文庫(kù),每個(gè)時(shí)期構(gòu)建2個(gè)文庫(kù)。委托北京諾禾致源生物信息科技有限公司對(duì)提取的RNA完成RNA-Seq測(cè)序,并通過(guò)Trinity方法組裝[8]。共得到135 483條Unigenes作為背景數(shù)據(jù)。
SSR分子標(biāo)記可用性實(shí)驗(yàn)材料為東方百合有花粉品種和云南省農(nóng)業(yè)科學(xué)院選育的東方百合無(wú)花粉品系,采樣共計(jì)24份,每個(gè)株系取4~5片新鮮葉片,用變色硅膠干燥,室溫保存直到DNA提取。
總DNA的提取采用改良的CTAB法進(jìn)行[4],針對(duì)百合多糖較多,增加去蛋白質(zhì)、多糖的步驟。選取DNA條帶清晰,亮度與Marker相當(dāng)?shù)挠脕?lái)篩選SSR引物。DNA母液稀釋后放入-20 ℃冰箱保存。
用Trinity軟件將轉(zhuǎn)錄組數(shù)據(jù)組裝,獲得轉(zhuǎn)錄本序列。組裝共得到222 365條Transcript和135 483條Unigene。采用MISA(1.0版,默認(rèn)參數(shù)。)按照各個(gè)unit size的最少重復(fù)次數(shù)標(biāo)準(zhǔn)1-10,2-6,3-5,4-5,5-5,6-5對(duì)Unigene進(jìn)行SSR檢測(cè),詳見(jiàn) http://pgrc.ipk-gatersleben.de/misa/misa.html。找出SSR標(biāo)記之后,采用Primer3(2.3.5版,默認(rèn)參數(shù))進(jìn)行SSR引物設(shè)計(jì)[9]。
SSR引物由精賽頓生物科技有限公司(云南)合成,從轉(zhuǎn)錄組SSR數(shù)據(jù)庫(kù)中隨機(jī)選取71對(duì)引物,其中包括各核苷酸重復(fù)類(lèi)型。從供試百合材料中隨機(jī)挑選 24個(gè)個(gè)體對(duì)71對(duì) SSR引物進(jìn)行初步篩選(表1)。PCR擴(kuò)增體系為10 μl:10×Buffer(Mg2+)1 μl;dNTP10 mmol/L 0.8 μl;上下游引物各 0.5 μl;Taq酶0.05 μl;DNA模板 0.5 μl,ddH2O 6.65 μl。擴(kuò)增反應(yīng)條件:95 ℃預(yù)變性5 min、95 ℃變性30 s、53 ℃(各引物有所不同)退火30 s 、72 ℃延伸30 s,反應(yīng)34個(gè)循環(huán),72 ℃延伸8 min,4 ℃保存。然后將PCR產(chǎn)物用1 %瓊脂糖凝膠電泳進(jìn)行多態(tài)性初篩,為了進(jìn)一步確定引物的多態(tài)性,對(duì)能擴(kuò)增出條帶的引物再進(jìn)行2 %瓊脂糖凝膠電泳,采用花青素的方法顯色,以得到條帶多且亮的引物。
表1 供試百合材料
表2 百合轉(zhuǎn)錄組中不同SSR類(lèi)型的數(shù)量以及頻率
注:c&c*均為復(fù)雜重復(fù)。
Note: c&c* are complex repeats.
用SSR的出現(xiàn)頻率和SSR的平均分布距離來(lái)描述SSR。計(jì)算公式分別為SSR的出現(xiàn)頻率:fc(%)=c/n×100,其中n為無(wú)冗余EST數(shù)量,c為搜索到的SSR數(shù)量;SSR的平均分布距離:fN=N/c,其中,N為無(wú)冗余EST數(shù)量的總堿基數(shù),c為搜索到的SSR數(shù)量。對(duì)瓊脂糖凝膠電泳結(jié)果的處理方法:采用人工讀帶的方式,在相同遷移的位置上,無(wú)帶的記為0,有帶的記為1,缺失的記為9,進(jìn)行統(tǒng)計(jì)擴(kuò)增結(jié)果,通過(guò)參考 Smith等[6]的方法計(jì)算多態(tài)信息含量(PIC)值。應(yīng)用 POPGENE Version 1.31軟件對(duì)標(biāo)記數(shù)據(jù)進(jìn)行遺傳參數(shù)分析。
轉(zhuǎn)錄組測(cè)序共獲得135 483條Unigenes,利用 MISA 軟件對(duì)獲得的Unigenes做SSR分析,發(fā)現(xiàn)其中11 649條Unigenes序列中包含有12 391個(gè)SSR位點(diǎn),其中包含2個(gè)或2個(gè)以上SSR位點(diǎn)的序列有742條,占6.4 %。SSR的類(lèi)型十分豐富,單核苷酸至六核苷酸重復(fù)類(lèi)型共11 948個(gè),同時(shí)還存在復(fù)雜重復(fù)類(lèi)型443個(gè)。
單核苷酸所占比例最大,為 63.94 %;其次是二核苷酸、三核苷酸分別占總 SSR 的 20.65 %和 11.21 %;四核苷酸、五核苷酸、六核苷酸重復(fù)類(lèi)型比較少,分別占 0.46 %、0.10 %、0.06 %,復(fù)雜重復(fù)類(lèi)型占3.58 %。轉(zhuǎn)錄組 SSR 重復(fù)單元的重復(fù)次數(shù)分布在 5~24次,單核苷酸重復(fù)單元主要在10次和10次以上,分別占總SSR的 26.10 %和37.84 %;二核苷酸至六核苷酸重復(fù)單元中,5次、6次重復(fù)所占比例最大,分別占7.66 %和9.13 %;通過(guò)分析,發(fā)現(xiàn)二核苷酸重復(fù)的次數(shù)主要在6、7、8 次;而三核苷酸的重復(fù)次數(shù)主要在 5、6、7 次。如表2所示。
百合轉(zhuǎn)錄組的SSR核苷酸基序類(lèi)型十分豐富,其中以單核苷酸重復(fù)類(lèi)型為主,單核苷酸主要重復(fù)次數(shù)為10次和10次以上,以A和T為主。A單核苷酸重復(fù)占4種單核苷酸重復(fù)的51.1 %,T單核苷酸重復(fù)占45.6 %,G單核苷酸重復(fù)占2.3 %,C單核苷酸重復(fù)占1.0 %,各單核苷酸詳細(xì)重復(fù)情況見(jiàn)圖1。
圖中縱坐標(biāo)軸為同類(lèi)核苷酸某一重復(fù)次數(shù)所占百分比The vertical axis in the figure means the percentage of a repetition of the same nucleotide圖1 單核苷酸重復(fù)類(lèi)型分析Fig.1 The types of mononucleotide repetition
二核苷酸主要以 AT/AT、TA/TA、AG/CT、CT/AG、GA/TC、TC/GA為主,其中,GA/TC所占比例最大,達(dá)到 4.70 %,AT/AT占2.59 %,AG/CT 占 3.28 %;三核苷酸重復(fù)的主要類(lèi)型較二核苷酸的類(lèi)型多,以 GGC/GCC、GAG/CTC、GGA/TCC為主,GGC/GCC占0.68 %,其次是GAG/CTC占0.65 %;四、五核苷酸基序類(lèi)型較二、三核苷酸基序類(lèi)型少,TAAA/TTTA、CCCA/TGGG、GTCCG/CGGAC是最主要的幾個(gè)類(lèi)型,但所占比重低。詳細(xì)SSR重復(fù)信息如表 3所示。
表3 SSR中二核苷酸和三核苷酸重復(fù)基元類(lèi)型的數(shù)量及頻率
續(xù)表3 Continued table 3
重復(fù)單元類(lèi)型Repeat motifsSSR重復(fù)基元類(lèi)型的數(shù)量(個(gè))The number of SSR repeat motifs5次重復(fù)6次重復(fù)7次重復(fù)8次重復(fù)9次重復(fù)10次重復(fù)>10次重復(fù)合計(jì)頻率(%)FrequencyCTC/GAG251451000450.36TG/CAG13210000160.13CTT/AAG14710000220.18GAA/TTC11820000210.17GAC/GTC410100060.05GAG/CTC522260000800.65GAT/ATC13110000150.12GCA/TGC15410000200.16GCC/GGC37691000530.43GCG/CGC251481000480.39GCT/AGC10421000170.14GGA/TCC481561000700.56GGC/GCC5517120000840.68GGT/ACC281130000420.34GTC/GAC410000050.04GTG/CAC13550000230.19GTT/AAC100000010.01TAA/TTA9661000220.18TAC/GTA010000010.01TAG/CTA100000010.01TAT/ATA24840000360.29TCA/TGA800000080.06TCC/GGA 21 221000260.21TCG/CGA 5 10000060.05TCT/AGA 13 021000160.13TGA/TCA 14 700000210.17TGC/GCA 12 320000170.14TGG/CCA 20 1031000340.27TTA/TAA 24 1090000430.35TTC/GAA 15 101000170.14TTG/CAA 4 20000060.05總計(jì) 8891123662382359393140394831.86百分比(%)7.179.065.343.082.903.171.1331.86
隨機(jī)選取71對(duì)引物,其中包括單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸及六核苷酸等6種重復(fù)基元的SSR位點(diǎn)進(jìn)行引物有效性驗(yàn)證。以東方百合材料的24個(gè)樣品進(jìn)行PCR擴(kuò)增,篩選。其中22對(duì)引物能擴(kuò)增出比較理想的產(chǎn)物,有效率為30.99 %。這說(shuō)明利用東方百合花藥EST序列開(kāi)發(fā)的SSR引物是高效可行的。圖2為部分引物在24份東方百合樣品中擴(kuò)增的情況。
在71對(duì)隨機(jī)選取的SSR引物中,22對(duì)能夠成功擴(kuò)增出條帶,有效率為30.99 %。利用驗(yàn)證的22對(duì)引物對(duì)24份東方百合材料進(jìn)行擴(kuò)增及多態(tài)性的評(píng)價(jià),22對(duì)SSR引物在東方百合中表現(xiàn)出多態(tài)性,共獲得了108個(gè)等位基因,分子標(biāo)記中等位基因最多為10,最少為3,平均等位基因數(shù)5個(gè),其中93017,191987,201703和 960002 4個(gè)引物的等位基因數(shù)分別是10,8,7,5個(gè)。觀望雜合度的范圍介于0.0154~0.4514,均值0.1977,期望雜合度的范圍介于0.1547~0.8471,均值0.4533。22個(gè)位點(diǎn)的PIC值變化范圍在0.1254~0.9248,平均值在0.5048,其中,高度多態(tài)的SSR分子標(biāo)記有11對(duì)(PIC≥0.5),表4為22對(duì)引物的多態(tài)性擴(kuò)增情況。
圖2 部分SSR引物PCR擴(kuò)增結(jié)果Fig.2 PCR amplification results of some SSR primers
表4 百合22個(gè)SSRs 標(biāo)記的特征
續(xù)表4 Continued table 4
引物編號(hào)Primer No.SSR 基序重復(fù)Repeat motif上、下游引物序列Primer sequence 5’-3’Tm(℃)等位基因數(shù)Na觀測(cè)雜合度Ho期望雜合度He多態(tài)信息含量PIC203915(CACTGC)13F:TGCCAACATTCTCCGCAGATR:GTGTTGGCAAAGGCAGTGTT6050.42580.33250.5149202350(CCTGCC)8F:GAAAGACCCCTGGGACATGGR:AGACAAGCTCGGGGTTCTTG6040.45140.58140.3269188282(CCGAGC)5F:CCCAAAATGCCCTTCCTCCTR:TGTTTCGAGGGAGTGAACGG6040.21560.21440.3547206853(GGGTG)5F:AGGTGTTCGAGCTTGGGTTCR:AGATTCTCTCAAACGCGGCA6040.15420.36540.1254220620(GTCCG)5F:ACCTAACGGAGCAATGCACAR:GCAAAGCCTGGACGAGTTTC6050.01980.21590.6559203915(CACTGC)13F:TGCCAACATTCTCCGCAGATR:GAGTGTTGGCAAAGGCAGTG6040.24870.44580.4225202620(GTCCG)5F:ACCTAACGGAGCAATGCACAR:GACGGGACAAGCGGACTTAT6050.03650.15470.5874193722(GGGAG)5F:AGGGAAAGGACAGGCTCTCAR:AGTCCTGCGGTGAAGGAAAT6040.24780.32650.2164平均值///50.19770.45330.5048
隨著高通量測(cè)序技術(shù)的迅猛發(fā)展,通過(guò)轉(zhuǎn)錄組測(cè)序來(lái)開(kāi)發(fā)EST-SSR引物的成本大為降低,對(duì)于類(lèi)似百合這樣由于基因組巨大而缺乏基因組信息的物種,該技術(shù)提供了前所未有的機(jī)遇,已在許多植物中得到了廣泛的應(yīng)用,如榧樹(shù)[10],云南松[11],西紅花[12],印度南瓜[13],南方紅豆杉[14],燈盞花[15]等。大量研究工作表明,利用轉(zhuǎn)錄組數(shù)據(jù)可以挖掘和開(kāi)發(fā)出豐富的SSR 標(biāo)記[16]。
本研究對(duì)東方百合可育系及其變異雄性不育系2個(gè)不同發(fā)育時(shí)期的百合花藥進(jìn)行轉(zhuǎn)錄組測(cè)序,共組裝得到222 365條Transcript和135 483條Unigene。利用MISA程序?qū)Y選得到的1 Kb 以上的Unigene做SSR位點(diǎn)搜索,共獲得12 391個(gè)SSR位點(diǎn)。SSR位點(diǎn)發(fā)生頻率為9.14 %,高于菊芋(8.64 %)[17]、魚(yú)腥草(7.51 %)[18]、云南松(3.07 %)[11]等植物,低于西紅花(18.73 %)[12]。表明東方百合雄性不育系轉(zhuǎn)錄組中SSR數(shù)量相當(dāng)豐富。
通過(guò)對(duì)基于東方百合雄性不育系轉(zhuǎn)錄組開(kāi)發(fā)的SSR重復(fù)基元分析發(fā)現(xiàn),該SSR分子標(biāo)記的重復(fù)基元種類(lèi)繁多,有單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸以及復(fù)雜重復(fù)基元等。而重復(fù)基元主要集中在單核苷酸、二核苷酸和三核苷酸重復(fù),其中以單核苷酸重復(fù)最多,這與榧樹(shù)[18]的SSR分布類(lèi)型極為相似、而與印度南瓜[13]、菊芋[17]、云南松[11]等植物多以二核苷酸、三核苷酸重復(fù)類(lèi)型為主的SSR分布類(lèi)型有所不同,說(shuō)明東方百合SSR重復(fù)基元與其他物種的情況存在相似性,同時(shí)也存在一定的差異性。與杜方[19]等研究者基于百合不同器官EST開(kāi)發(fā)的SSR多以二核苷酸和三核苷酸重復(fù)為主也有所不同,說(shuō)明基于同一種植物不同器官組織轉(zhuǎn)錄組測(cè)序結(jié)果開(kāi)發(fā)的SSR分布類(lèi)型也有所不同。22對(duì)可擴(kuò)增產(chǎn)物的SSR引物中,各對(duì)SSR等位基因多,多態(tài)信息含量PIC值高,說(shuō)明SSR引物表現(xiàn)穩(wěn)定可重復(fù)的多態(tài)性。
本研究成功篩選出22 對(duì)多態(tài)性較高、條帶清晰、穩(wěn)定性好的引物。隨機(jī)對(duì)24種不同來(lái)源的東方百合可育品種及雄性不育系初篩的引物進(jìn)行多態(tài)性驗(yàn)證分析,結(jié)果顯示在22對(duì)SSR引物中,引物表現(xiàn)穩(wěn)定可重復(fù)的多態(tài)性,各個(gè)位點(diǎn)的等位基因介于3~8個(gè),平均等位基因數(shù)5個(gè),多態(tài)信息含量PIC、觀測(cè)雜合度Ho、期望雜合度He的平均值分別是0.5048,0.1977和0.4533。研究表明通過(guò)對(duì)東方百合雄性不育系轉(zhuǎn)錄組分析可獲得較高頻率的SSR位點(diǎn)且類(lèi)型豐富。將為東方百合雄性不育分子標(biāo)記輔助育種和功能基因的挖掘等奠定基礎(chǔ),同時(shí)對(duì)東方百合分子標(biāo)記類(lèi)型、遺傳資源評(píng)價(jià)、繪制遺傳圖譜、實(shí)現(xiàn)特定性狀的輔助選擇和進(jìn)行比較基因組學(xué)研究也有重要意義。