蔣小剛,周武先,王 華,由金文,張美德
(湖北省農(nóng)業(yè)科學(xué)院中藥材研究所/農(nóng)業(yè)農(nóng)村部中藥材生物學(xué)與栽培重點(diǎn)實(shí)驗(yàn)室,湖北 恩施 445000)
【研究意義】川黨參(CodonopsistangshenOliv)為桔??泣h參屬多年生藤本植物,以干燥根入藥,具有健脾益肺、養(yǎng)血生津的功效,主要用于脾肺氣虛、食少倦怠、咳嗽虛喘、氣血不足等癥,具有藥食兩用性,收載于《中華人民共和國(guó)藥典》(2020年版)[1],主要分布于湖北西部、四川北部、湖南西北部和東部接壤地區(qū)及貴州北部。目前,川黨參野生種質(zhì)資源稀少,且栽培資源存在種質(zhì)混雜、尚無(wú)優(yōu)良品種和穩(wěn)定純系的問(wèn)題,種質(zhì)資源評(píng)價(jià)局限于藥材化學(xué)成分研究[2-4],因此亟需建立川黨參分子標(biāo)記體系,為高效鑒別川黨參種質(zhì)及資源保護(hù)提供科學(xué)依據(jù)?!厩叭搜芯窟M(jìn)展】簡(jiǎn)單重復(fù)序列(Simple sequence repeat, SSR),又稱微衛(wèi)星標(biāo)記或短串聯(lián)重復(fù)序列,由1~6個(gè)核苷酸重復(fù)單元組成,具有數(shù)量多、共顯性好、多態(tài)性高、重復(fù)性好的特點(diǎn)[5],廣泛應(yīng)用于水稻[6]、玉米[7]等作物和黃芪[8]、紅花[9]等藥用植物的種質(zhì)鑒定及遺傳多樣性研究。黨參屬三大基原植物包括黨參、川黨參和素花黨參,目前川黨參的SSR分子標(biāo)記研究還未見(jiàn)報(bào)道,僅陳大霞等[10]利用SRAP和ISSR標(biāo)記揭示了18份不同產(chǎn)地川黨參種質(zhì)較高的遺傳多樣性。而黨參和素花黨參的SSR分子標(biāo)記研究較多,王東等[11]通過(guò)分析黨參轉(zhuǎn)錄組數(shù)據(jù),開(kāi)發(fā)了4329 個(gè)SSR標(biāo)記,為研究黨參遺傳多樣性分析奠定基礎(chǔ)。曹玲亞等[12]開(kāi)發(fā)的EST-SSR篩選出10對(duì)EST-SSR將川黨參、素花黨參聚為一類,黨參居群聚為另一類。李忠虎等[13]采用磁珠富集法分離篩選10對(duì)黨參gSSR引物,揭示野生黨參居群豐富的遺傳多樣性。劉星星等[14]利用NCBI公布序列和通用引物篩選了16對(duì)多態(tài)性SSR引物,分析了甘肅黨參種質(zhì)遺傳多樣性,隨后針對(duì)輪葉黨參[15]EST-SSR序列,篩選5對(duì)多態(tài)性引物,發(fā)現(xiàn)能有效鑒別黨參屬及近源屬種?!颈狙芯壳腥朦c(diǎn)】目前,已有學(xué)者針對(duì)黨參和素花黨參進(jìn)行SSR分子標(biāo)記開(kāi)發(fā)和遺傳多樣性分析,但關(guān)于川黨參相關(guān)的研究鮮見(jiàn)報(bào)道?!緮M解決的關(guān)鍵問(wèn)題】本研究基于Illumina平臺(tái)對(duì)川黨參轉(zhuǎn)錄組進(jìn)行測(cè)序,并挖掘大量的EST-SSR位點(diǎn),同時(shí)分析轉(zhuǎn)錄組SSR位點(diǎn)的分布特征,并對(duì)含有SSR序列的Unigene進(jìn)行Go和KEGG功能注釋,通過(guò)驗(yàn)證篩選27對(duì)擴(kuò)增穩(wěn)定的引物,用于后續(xù)川黨參遺傳多樣性分析,為川黨參種質(zhì)鑒定、遺傳圖譜構(gòu)建和基因定位等研究奠定理論基礎(chǔ)。
試驗(yàn)材料為川黨參新鮮幼嫩葉片,采自恩施市新塘鄉(xiāng)川黨參種質(zhì)資源圃,種質(zhì)信息見(jiàn)表1。從恩施板橋的川黨參資源中,隨機(jī)選取3株植株的新鮮幼嫩葉片迅速放入-80 ℃液氮中速凍,帶回實(shí)驗(yàn)室置-80 ℃冰箱備用,用于轉(zhuǎn)錄組測(cè)序。隨機(jī)選取每個(gè)產(chǎn)地3株植株的新鮮幼嫩葉片作為1份樣品,用于基因組DNA提取。
表1 不同產(chǎn)地川黨參種質(zhì)資源信息
提取川黨參葉片RNA,經(jīng)質(zhì)量檢測(cè)合格后構(gòu)建測(cè)序文庫(kù),采用Illumina測(cè)序平臺(tái)進(jìn)行測(cè)序。利用生物信息學(xué)軟件Trinity對(duì)序列進(jìn)行拼接,通過(guò)去冗余和質(zhì)控獲得非冗余、高質(zhì)量Unigenes。通過(guò)MISA軟件搜索轉(zhuǎn)錄組序列的SSR位點(diǎn),參數(shù)設(shè)置:單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸的最少重復(fù)次數(shù)為10、6、5、5、5、5次。使用Primer 3軟件對(duì)SSR重復(fù)基元前后序列設(shè)計(jì)引物,經(jīng)校驗(yàn)后每條SSR產(chǎn)生3對(duì)引物。
采用新型植物DNA提取試劑盒(北京天根生物科技有限公司)提取表1中5個(gè)產(chǎn)地的川黨參基因組DNA。PCR擴(kuò)增體系:模板DNA 2.0 μL,2×Taqmaster mix 10.0 μL,10.0 μmol/L正反引物各0.2 μL,ddH2O 7.6 μL。反應(yīng)程序?yàn)?94 ℃,預(yù)變性3 min,94 ℃變性0.5 min,56 ℃退火0.5 min,72 ℃延伸0.5 min,共35個(gè)循環(huán),72 ℃延伸10 min,4 ℃保存。
采用Blast軟件將川黨參轉(zhuǎn)錄組中含SSR位點(diǎn)的Unigenes序列比對(duì)到NR(NCBI non-redundant protein sequences)、GO (Gene ontology)、KEGG(Kyoto encyclopedia of genes and genome)、eggNOG(Evolutionary genealogy of genes: Non-supervised Orthologous Groups)、Swiss-Prot、Pfam數(shù)據(jù)庫(kù),然后對(duì)注釋到的 Unigene 序列進(jìn)行GO和KEGG富集分析。
由表2可知,通過(guò)川黨參轉(zhuǎn)錄組測(cè)序,共鑒定到124 179個(gè)Unigene,其中26 084個(gè)Unigene含有SSR位點(diǎn),6978個(gè)Unigene含有1個(gè)以上SSR位點(diǎn),共發(fā)現(xiàn)35 827個(gè)SSR位點(diǎn)(包含4155個(gè)復(fù)合型SSR)。SSR出現(xiàn)頻率為28.85%,SSR發(fā)生頻率為21.01%。說(shuō)明川黨參轉(zhuǎn)錄組 SSR 位點(diǎn)信息分布廣且豐富。
表2 川黨參轉(zhuǎn)錄組SSR位點(diǎn)信息
由表3可知,川黨參轉(zhuǎn)錄組中二核苷酸SSR位點(diǎn)數(shù)最多(17 016個(gè)),單核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸SSR位點(diǎn)數(shù)分別為15 099、3177、356、70、109。共有165種重復(fù)基元類型,單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸重復(fù)分別有2、4、10、26、61、62種。從重復(fù)基元分布比例來(lái)看,單核苷酸重復(fù)基元A/T占SSR位點(diǎn)總數(shù)比例最高,為37.59%,其次是二核苷酸重復(fù)基元AG/CT、AC/GT、AT/AT,分別為25.38%、11.42%、10.57%,三核苷酸中重復(fù)基元以AAG/CTT最高,為2.13%,四核苷酸各重復(fù)基元整體小于0.27%,而五核苷酸和六核苷酸各重復(fù)基元比例最低,整體小于0.03%。從核苷酸重復(fù)基元平均距離來(lái)看,單核苷酸和二核苷酸平均距離較小,分別為5.97、5.30 kb,五核苷酸和六核苷酸平均距離較大,分別為1288.54、827.50 kb。說(shuō)明,重復(fù)類型中單核苷酸的重復(fù)更容易發(fā)生,核苷酸數(shù)量越多時(shí)重復(fù)發(fā)生頻率越低,表明川黨參轉(zhuǎn)錄組的單核苷酸重復(fù)變異類型最為活躍,同時(shí)以A/T的重復(fù)類型為主。
表3 川黨參轉(zhuǎn)錄組中的 SSR 類型分布
從圖1可知,川黨參轉(zhuǎn)錄組中SSR重復(fù)10次的最多,有7722個(gè),占SSR總數(shù)的21.55%,其次是重復(fù)6、11、7、8次,分別有5181(14.46%)、3892(10.86%)、3532(9.86%)、2720(7.59%)個(gè)。重復(fù)次數(shù)<10的SSR位點(diǎn)中,二核苷酸的重復(fù)類型所占比例最高,為76.81%,重復(fù)次數(shù)>9的SSR位點(diǎn)中,單核苷酸的重復(fù)類型所占比例最高(73.98%)。單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸重復(fù)類型的SSR位點(diǎn)的重復(fù)次數(shù)最多,分別為10、6、5、5、5、5次。
圖1 川黨參轉(zhuǎn)錄組中SSR 重復(fù)次數(shù)分布Fig.1 The distribution of SSR repeats in C.tangshen transcriptome
從圖2可知,川黨參轉(zhuǎn)錄組SSR序列長(zhǎng)度集中在12~19 bp,共19 628個(gè),頻率為54.79%;其次是10~12、20~30 bp,分別有9266(25.86%)、5192個(gè)(14.49%);少數(shù) (1741個(gè)) SSR序列的長(zhǎng)度在30 bp以上,頻率僅為4.86%,說(shuō)明川黨參轉(zhuǎn)錄組SSR序列長(zhǎng)度分布范圍廣,長(zhǎng)度為12~19 bp 的SSR更易發(fā)生。
圖2 川黨參轉(zhuǎn)錄組中SSR序列長(zhǎng)度分布Fig.2 The distribution of SSR length in C.tangshen transcriptome
采用MISA軟件搜索到川黨參轉(zhuǎn)錄組EST-SSR標(biāo)記位點(diǎn)共31 506個(gè),針對(duì)SSR位點(diǎn),用Primer 3.0軟件共設(shè)計(jì)引物72 687對(duì),篩選27對(duì)SSR引物對(duì)川黨參基因組DNA進(jìn)行擴(kuò)增,擴(kuò)增片段大小范圍為124~393 bp(表4)。基于5個(gè)產(chǎn)地川黨參資源的基因組DNA模板篩選了部分多態(tài)性標(biāo)記,表明擴(kuò)增條帶清晰,多態(tài)性較好(圖3)。
M為DL 2000 DNA Marker;1~5樣品名稱與表1相同,引物從左至右依次為 DN61457_c1_g6、DN62367_c9_g1、DN53197_c3_g1、DN53427_c0_g3、DN60647_c1_g3、DN70663_c0_g1。M is DL 2000 DNA marker; The names of samples 1-5 are the same as table 1, and the primers from left to right are DN61457 _ c1_ g6, DN62367_ c9_ g1, DN53197_ c3_ g1, DN53427_ c0_ g3, DN60647_ c1_ g3, DN70663_ c0_ g1.圖3 部分多態(tài)性引物擴(kuò)增Fig.3 Amplification of partial polymorphic primers
表4 川黨參SSR引物信息
含有Unigene的SSR序列共26 084條,對(duì)這些SSR序列進(jìn)行GO 和 KEGG 功能注釋。 GO注釋將 16 842個(gè) Unigene 劃分為分子功能(Molecular function)、細(xì)胞組成(Cellular component)和生物學(xué)過(guò)程(Biological process)的 50 個(gè)功能類群(圖4)。其中,在分子功能類別中, 這些Unigenes極顯著富集于特異性DNA序列結(jié)合(80個(gè))、轉(zhuǎn)錄調(diào)控(106個(gè))、轉(zhuǎn)錄共調(diào)控(25個(gè))、酶催化活性(676個(gè))、DNA結(jié)合(280個(gè))和酶結(jié)合(45個(gè));在細(xì)胞組成類別中,Unigenes極顯著富集于膜固有成分(1403個(gè))、膜組成成分(1392個(gè))、膜(6433個(gè))和高爾基體活動(dòng)(108個(gè));在生物學(xué)過(guò)程類別中,生物過(guò)程調(diào)節(jié)(548個(gè))、細(xì)胞過(guò)程調(diào)節(jié)(495個(gè))、生物學(xué)調(diào)節(jié)(627個(gè))等呈現(xiàn)極顯著富集。通過(guò)KEGG 注釋,4347個(gè)Unigene 被顯著富集為18種類別(圖5),其中信號(hào)轉(zhuǎn)導(dǎo)(208個(gè))、轉(zhuǎn)錄因子(169個(gè))、植物激素信號(hào)轉(zhuǎn)導(dǎo)(141個(gè))、泛素系統(tǒng)(252個(gè))、mRNA監(jiān)測(cè)途徑(83個(gè))、蛋白激酶(140個(gè))和甘油磷脂代謝(64個(gè))等途徑被極顯著富集。
圖4 川黨參轉(zhuǎn)錄組含 SSR 位點(diǎn)的 Unigene 序列 GO 功能富集Fig.4 GO functional enrichment of unigenes containing SSR loci in transcriptomes of C.tangshen
圖5 川黨參轉(zhuǎn)錄組含 SSR 位點(diǎn)的 Unigene 序列 KEGG 功能富集Fig.5 KEGG functional enrichment of unigenes containing SSR loci in transcriptomes of C.tangshen
隨著高通量測(cè)序技術(shù)的發(fā)展和測(cè)序成本的降低,轉(zhuǎn)錄組測(cè)序技術(shù)已被廣泛應(yīng)用于無(wú)參考基因組序列的物種EST-SSR分子標(biāo)記開(kāi)發(fā)。與基因組SSR分子標(biāo)記相比,EST-SSR分子標(biāo)記具有開(kāi)發(fā)成本較低、通用性和保守型較高、易與表型性狀相關(guān)聯(lián)的優(yōu)點(diǎn)[16-17]。本研究對(duì)川黨參轉(zhuǎn)錄組測(cè)序,從124 179條Unigenes中鑒定到35 827個(gè)SSR位點(diǎn),SSR出現(xiàn)頻率為28.85%,高于輪葉黨參(22.97%)[15]、黨參(12.22%)[11]、八角(14.20%)[18]、滇黃精(17.02%)[19]等藥用植物,低于睡蓮(33.89%)[20]、枸杞(58.68%)[21]、天麻(38.15%)[22]等藥用植物,表明川黨參轉(zhuǎn)錄組具有豐富的SSR位點(diǎn),樣品來(lái)源、物種、SSR搜索標(biāo)準(zhǔn)的不同可能導(dǎo)致川黨參SSR 發(fā)生頻率與其他物種存在差異。
不同物種SSR重復(fù)類型不一樣,但以二核苷酸和三核苷酸重復(fù)類型為主[23-24]。川黨參SSR位點(diǎn)中,二核苷酸重復(fù)類型數(shù)量最多,為17 016個(gè)(47.49%),其次是單核苷酸、三核苷酸,分別為15 099個(gè)(42.15%)、3177個(gè)(8.85%),四核苷酸、五核苷酸、六核苷酸僅占總數(shù)的1.49%,這與黑棗[25]、油茶[26]等的研究結(jié)果比較一致。從SSR出現(xiàn)頻率來(lái)看,單核苷酸重復(fù)基元A/T數(shù)量最多,其次是二核苷酸的重復(fù)基元AG/CT,三核苷酸的優(yōu)勢(shì)基元是AAG/CTT,這與黑棗[25]的研究結(jié)果相似,而川黨參與黑棗、油茶等物種在植物系統(tǒng)分類上差異較大,親緣關(guān)系較遠(yuǎn),表明SSR核苷酸重復(fù)類型分布與物種進(jìn)化無(wú)必然相關(guān)性。
SSR分子標(biāo)記的長(zhǎng)度是評(píng)價(jià)其多態(tài)性的重要因素。研究表明,當(dāng)SSR長(zhǎng)度在20 bp以上時(shí),具有較高的多態(tài)性,而在12~19 bp時(shí),多態(tài)性趨于保守,在12 bp以下時(shí)多態(tài)性較低[27]。本研究中,SSR長(zhǎng)度在20 bp以上的有6933個(gè),占總數(shù)的19.35%,其中37.67%是潛在多態(tài)性高的低級(jí)重復(fù)基元,包括單核苷酸(548)、二核苷酸(5174)、三核苷酸(676),這些多態(tài)性豐富的SSR將在后續(xù)研究中發(fā)揮重要作用。
本研究篩選了27對(duì)擴(kuò)增穩(wěn)定的川黨參EST-SSR引物,并篩選了部分多態(tài)性標(biāo)記,多態(tài)性潛能高于黨參[11]、輪葉黨參[15]等藥用植物。此外,本研究對(duì)含有SSR的Unigene進(jìn)行功能注釋,發(fā)現(xiàn)這些潛能SSR基因序列功能主要集中于轉(zhuǎn)錄調(diào)控、DNA結(jié)合、催化、信號(hào)轉(zhuǎn)導(dǎo)等生物學(xué)活動(dòng)。這些生物學(xué)活動(dòng)貫穿植物生長(zhǎng)發(fā)育的整個(gè)過(guò)程,表明這些含有SSR位點(diǎn)的Unigene具有潛在豐富的基因功能,將為后續(xù)開(kāi)發(fā)EST-SSR分子標(biāo)記提供科學(xué)依據(jù),從而進(jìn)一步為川黨參功能基因利用、分子輔助育種等奠定基礎(chǔ)。
本研究將川黨參轉(zhuǎn)錄組測(cè)序獲得的124 179條Unigene進(jìn)行SSR位點(diǎn)挖掘,共獲得35 827個(gè)SSR位點(diǎn),出現(xiàn)頻率為28.85%。SSR位點(diǎn)中二核苷酸、單核苷酸重復(fù)類型占主導(dǎo)地位,二核苷酸中AG/CT出現(xiàn)的頻率最高,單核苷酸中A/T出現(xiàn)頻率最高。不同SSR的重復(fù)10次最多,長(zhǎng)度分布集中在12~19 bp。對(duì)27對(duì)EST-SSR引物進(jìn)行擴(kuò)增,篩選部分多態(tài)性較高的引物。通過(guò)GO和KEGG富集分析,26 084個(gè)含有SSR序列的Unigenes極顯著富集于轉(zhuǎn)錄調(diào)控、DNA結(jié)合、催化、信號(hào)轉(zhuǎn)導(dǎo)等生物過(guò)程。開(kāi)發(fā)的EST-SSR引物將為川黨參遺傳多樣性分析、種質(zhì)鑒定、分子標(biāo)記輔助育種等提供研究基礎(chǔ)。