摘 要 采用高通量測序技術(shù)獲得了麥冬轉(zhuǎn)錄組53 466條Unigenes,并通過序列分析識別出35 832個SSR位點,分布于24 539條Unigenes上,SSR出現(xiàn)頻率高達67.02%,平均分布距離為4.88 kb。對包含SSR位點的24 539條Unigenes進行GO和KEGG注釋,結(jié)果顯示主要集中于生物學過程、植物-病原體互作等基因功能和代謝通路。從SSR重復基元類型來看,單核苷酸重復數(shù)目最多,占比57.06%,其中A/T為絕對優(yōu)勢類型,有20" 193個;五核苷酸重復平均分布距離最高,為4 069.34 kb。從重復次數(shù)來看,基元重復10次以上的類型數(shù)目最多,有20 849個,占比61.69%。隨機挑選30個不同類型的SSR基元位點并設(shè)計引物,對川麥冬、浙麥冬基因組DNA進行PCR擴增,結(jié)果顯示28對引物可以在兩個栽培種中擴增出條帶,其中16對引物可擴增出目的條帶。
關(guān)鍵詞 麥冬;轉(zhuǎn)錄組;SSR位點;引物設(shè)計
麥冬[Ophiopogon japonicus (L.f.) Ker-Gawl.]為百合科沿階草屬多年生草本植物,生于海拔2 000 m以下的山坡陰濕處、林下或溪旁,浙江、四川、廣西等地均有栽培[1]。其塊根為我國常用大宗藥材,在《神農(nóng)本草經(jīng)》中被列為上品,作為滋補成分入藥已有2000多年的歷史,臨床多用于治療肺燥干咳、陰虛癆嗽、喉痹咽痛、津傷口渴、內(nèi)熱消渴、心煩失眠和腸燥便秘[2]。其按照藥材產(chǎn)地來源可分為川麥冬和浙麥冬(杭麥冬),其中川麥冬又稱涪城麥冬,產(chǎn)于四川綿陽三臺縣涪江流域,為國家地理標志保護產(chǎn)品,種植面積達4 000 hm2,年均產(chǎn)量1.5×104" t,產(chǎn)值達30億元,市場流通量占全國麥冬市場的70%以上,出口量占全國80%以上[3]。無論是川麥冬還是浙麥冬,長期使用傳統(tǒng)的單分蘗或多分蘗分株栽植方式,造成產(chǎn)區(qū)品種單一,存在品種退化的風險,制約藥材產(chǎn)量與質(zhì)量提升,因此加強麥冬種質(zhì)資源研究,挖掘特異性種質(zhì)資源,利用分子手段選育新品種是實現(xiàn)該產(chǎn)業(yè)可持續(xù)發(fā)展的關(guān)鍵。
在麥冬上已開發(fā)的遺傳標記分為兩大類,一類為生物化學標記,有過氧化物(POD)同工酶[4]、酯酶(EST)同工酶[5];另一類為分子標記,有RAPD[6]、RSAP、TRAP[7]、ISSR、SRAP[8]、RAMP以及ITS序列標記[9]等顯性標記,而共顯性的遺傳標記為簡單重復序列(Simple Sequence Repeat, SSR)標記,主要通過轉(zhuǎn)錄組測序、基因組測序等高通量測序技術(shù)獲得,目前通過文獻查詢以及NCBI數(shù)據(jù)庫檢索獲取的麥冬SSR標記較少,尚不能滿足分子標記輔助育種的需要。SSR標記具有多等位、共顯性、多態(tài)性豐富等特點,加之操作簡單、檢測便捷,成為群體遺傳、連鎖構(gòu)建、指紋圖譜繪制、品種材料鑒定和分子輔助育種的重要方法之一,已成功應用于滇重樓[10]、百合屬[11]、滇黃精[12]等多種百合科藥用植物資源鑒定及遺傳多樣性研究。本研究利用前期轉(zhuǎn)錄組測序數(shù)據(jù)開發(fā)麥冬SSR標記,掌握其在轉(zhuǎn)錄組序列中的分布類型及特征,為基于SSR標記的麥冬資源遺傳評價及分子輔助育種研究提供數(shù)據(jù)" 參考。
1 材料與方法
1.1 試驗材料
轉(zhuǎn)錄組測序樣品來源于課題組前期培養(yǎng)的審定品種‘川麥冬1號’水培苗,待營養(yǎng)根長至約5 cm時,剪取其葉片及根組織,經(jīng)液氮低溫迅速研磨后轉(zhuǎn)入凍存管中,于-80 ℃儲存。開展SSR引物驗證的品種為審定品種‘川麥冬1號’及‘浙麥冬1號’,其葉片樣品采集于綿陽市農(nóng)業(yè)科學研究院麥冬種質(zhì)資源圃(31°23′16.4″N," 104°48′52.5″E),使用多糖多酚植物核酸提取試劑盒(天根生化科技有限公司,北京)提取其基因組DNA,提取結(jié)果經(jīng)NanoDropTM one微量UV-Vis分光光度計(Thermo Scientific,美國)和1%瓊脂糖凝膠電泳檢測其純度、濃度,統(tǒng)一稀釋至50ng/μL備用。
1.2 轉(zhuǎn)錄組測序與SSR位點識別
轉(zhuǎn)錄組測序委托北京百邁客生物科技有限公司開展,提取上述低溫冷凍樣品總RNA并構(gòu)建cDNA文庫,使用Illumina NovaSeq高通量測序平臺測序,經(jīng)過濾、質(zhì)控、組裝后得到Unigenes數(shù)據(jù)。使用Perl腳本應用MISA(Microsatellite identification tool)[13]識別Unigenes序列中的SSR位點,其中單核苷酸重復、二核苷酸重復、三核苷酸重復、四核苷酸重復、五核苷酸重復及六核苷酸重復的最小重復數(shù)分別設(shè)定為10、6、5、5、5和5。使用DIAMOND軟件[14]將包含SSR位點的Unigenes序列與GO、KEGG等數(shù)據(jù)庫進行比對,獲得Unigenes的注釋信息。
1.3 數(shù)據(jù)統(tǒng)計分析
以轉(zhuǎn)錄組中SSR位點的出現(xiàn)頻率、分布的平均距離、重復基元類型及重復次數(shù)、重復序列長度來分析麥冬轉(zhuǎn)錄組SSR的分布及其序列特征。相關(guān)參數(shù)計算公式:SSR位點出現(xiàn)頻率=SSR位點數(shù)/Unigenes總數(shù);SSR分布平均距離=Unigenes序列全長/SSR位點數(shù)。
1.4 SSR引物設(shè)計及驗證
使用Primer 3.0軟件[15]針對SSR位點批量設(shè)計上、下游引物序列,引物長度控制在18~22 bp內(nèi),GC含量為30%~70%,退火溫度為" 57 ℃~63 ℃且上、下游引物退火溫度差值不超過5 ℃,擴增產(chǎn)物大小為100~300 bp。隨機選取30個不同基元類型的SSR位點進行引物合成(北京擎科生物科技股份有限公司,北京)、PCR擴增和1.2%瓊脂糖凝膠電泳驗證。
PCR反應體系為:22 μL金牌Mix Ver.2(北京擎科生物科技股份有限公司,北京),1 μL模板DNA(50 ng/μL),各1 μL上、下游引物(10 μmol/L),共25 μL。以上反應在T100TM" Thermal Cycler PCR儀(Bio-Rad,美國)中進行,擴增程序為:" 98 ℃預變性2 min;98 ℃變性10 s," 60 ℃退火12 s,72 ℃延伸20 s,共30個循環(huán);" 72 ℃終延伸5 min;4 ℃保存。使用的DNA分子質(zhì)量標準為DNA Marker A(25~500 bp)(BBI生命科學有限公司,上海)。
2 結(jié)果與分析
2.1 麥冬轉(zhuǎn)錄組中含SSR的Unigenes功能注釋及分類
對測序平臺產(chǎn)出的Raw Data進行數(shù)據(jù)過濾,去除其中的接頭序列及低質(zhì)量Reads后共獲得467.35 Gb的Clean Data,Q30堿基百分比在92.13%及以上。組裝后共獲得53 466條Unigenes,序列總長174 981 470 bp,從全長序列中共識別到35 832個SSR位點,分布在24 539條Unigenes上。每個Unigene包含1~8個SSR位點,其中包含1個SSR位點的Unigenes最多,有16 388個;包含8個SSR位點的Unigenes最少,僅有24個。
對含有SSR位點的24 539條Unigenes進行GO數(shù)據(jù)庫功能注釋,可將其分為三大類,分別是生物過程(Biological Process)、細胞組分(Cellular Component)和分子功能(Molecular Function)。每一類別選取數(shù)目前10位進行展示,數(shù)目最多的功能條目分別為生物過程(GO:0008150)、ATP結(jié)合(GO:0005524)和整合膜組分(GO:0016021)(圖1)。同理,使用KEGG代謝途徑數(shù)據(jù)庫注釋并選擇數(shù)目前30位的條目進行展示,結(jié)果顯示植物-病原體互作(ko04626)、碳素代謝(ko01200)和植物激素信號轉(zhuǎn)導(ko04075)等代謝途徑位于前列(圖2)。
2.2 麥冬轉(zhuǎn)錄組SSR重復基元類型
統(tǒng)計結(jié)果顯示,麥冬轉(zhuǎn)錄組SSR出現(xiàn)頻率高達67.02%,平均分布距離為4.88 kb,高頻率分布特點證實后期利用轉(zhuǎn)錄組數(shù)據(jù)開發(fā)SSR引物的方式現(xiàn)實可行。此外,其SSR重復基元類型多樣,存在單核苷酸至六核苷酸重復基元類型,各類型間數(shù)目差異較大。其中單核苷酸重復數(shù)目最多,有20 448個,占SSR總數(shù)的57.06%;其次為二、三核苷酸重復,分別有7 563個和5 374個,占SSR總數(shù)的21.11%和15.00%;四至六核苷酸重復數(shù)量較少,占比均不足1.00%;復合類型的SSR有2 038個,占SSR總數(shù)的5.69%。從分布上看,五核苷酸重復的平均分布距離最高,為" 4 069.34 kb,但出現(xiàn)頻率僅為0.08%;單核苷酸重復的平均分布距離最小,為8.56 kb,出現(xiàn)頻率高達38.24%(表1)。
2.3 麥冬轉(zhuǎn)錄組SSR重復基元堿基組成及同類型占比
從堿基組成來看,單核苷酸重復類型最少,共有2種,其中A/T為絕對優(yōu)勢類型,形成20 193個位點,占該類基元的98.75%;二核苷酸重復共有4種,主要以AG/CT為主,形成4 805個位點,占該類基元的63.53%,而CG/CG類型最少,數(shù)量和同類型占比分別為76和1.00%;三核苷酸重復共有10種,以AAG/CTT(840,15.63%)形式最多,其次是AGC/CTG(746,13.88%)和AGG/CCT(745,13.86%),最少的是ACT/AGT(68,1.27%);四核苷酸重復共有26種,其中AAAT/ATTT(119,37.30%)為絕對優(yōu)勢類型,其次為AAAG/CTTT(42,13.17%),剩余類型占比均為10%以下,AGTT/AACT( 0.31%)和AGTC/ACTG( 0.31%)兩個類型最少;五核苷酸重復共有31種,但各類型數(shù)量較少,為1~3個,其中AAGAG/CTCTT(3,6.98%)和ACACG/CGTGT(3,6.98%)相較最多;六核苷酸重復類型最多,共有37種,各類型數(shù)量同樣僅為1~3個,其中AAATCC/ATTTGG(3," 6.38%)、AAATGG/ATTTCC(3,6.38%)和ATAGGG/ATCCCT(3,6.38%)相較最多" (表2)。
2.4 麥冬轉(zhuǎn)錄組SSR不同基元的重復次數(shù)
從重復次數(shù)來看,單核苷酸重復集中在10~22次,其中重復10次居多,占單核苷酸重復總數(shù)的53.82%;二核苷酸重復集中在6~11次,其中重復6次居多,占二核苷酸重復總數(shù)的37.08%,重復11次最少,占比0.87%;三核苷酸重復集中在5~10次,其中重復5次居多,占三核苷酸重復總數(shù)的64.76%,重復10次的僅有1個位點,沒有發(fā)現(xiàn)重復9次的位點;四核苷酸重復集中在" 5~7次,其中重復5次居多,占四核苷酸重復總數(shù)的92.79%,重復7次的最少且僅有1個位點;五核苷酸重復集中在5~8次,其中重復5次居多,占五核苷酸重復的79.07%,重復8次的最少且僅有1個位點;六核苷酸重復集中在" 5~7次,其中重復5次居多,占六核苷酸重復總數(shù)的63.83%,重復7次的最少且只有1個位點(表3)??傮w來看,麥冬轉(zhuǎn)錄組SSR基元重復10次以上的類型數(shù)目最多,有20" 849個,占比" 61.69%。
2.5 麥冬SSR引物設(shè)計及有效性檢測
對隨機選取的30個不同類型SSR基元分別設(shè)計上、下游引物并進行PCR擴增,以驗證分析位點的可靠性。隨機選取的重復基元類型如表4所示,包含了9個二核苷酸重復位點、16個三核苷酸重復位點、3個四核苷酸重復位點、1個五核苷酸重復位點和1個六核苷酸重復位點,預計擴增產(chǎn)物大小為139~280 bp。使用這30對引物分別對川麥冬和浙麥冬樣品進行擴增,擴增產(chǎn)物經(jīng)1.2%瓊脂糖凝膠電泳,結(jié)果如圖3所示。共有28對引物可以在川麥冬和浙麥冬中都擴增出條帶,其中16對引物的擴增產(chǎn)物包含目的條帶及雜帶,5對引物的擴增產(chǎn)物有且僅有一條清晰的目的條帶。
3 討論與結(jié)論
隨著高通量測序技術(shù)的飛速發(fā)展,越來越多的植物參考基因組被測序組裝,但一些染色體倍性復雜且涉及分子生物學研究較少的藥用植物仍缺乏參考基因組信息。有細胞學研究表明,栽培和野生麥冬材料中存在二倍體、四倍體、五倍體和六倍體的倍性變異[16],加大了全基因組測序和組裝難度。目前對麥冬的轉(zhuǎn)錄組測序仍需依靠其近緣科屬物種基因組信息作為參照,因而獲得的測序數(shù)據(jù)量、注釋Unigenes等較常見藥用植物少。在本研究中,經(jīng)轉(zhuǎn)錄組測序共獲得53 466個麥冬Unigenes,并從這些Unigenes中識別出35 832個SSR位點,SSR出現(xiàn)頻率為67.02%,遠高于已發(fā)表的連翹(25.15%)[17]、滇黃精(22.78%、" 13.11%)[12, 18]、竹節(jié)參(15.51%)[19]等藥用植物,說明麥冬中有著豐富的SSR位點,可應用于藥材道地性鑒定、種子種苗和品種鑒別、資源遺傳評價,以及利用分子標記輔助優(yōu)良品種選育工作。
根據(jù)目前發(fā)表的植物物種數(shù)據(jù)來看,大多以單核苷酸重復數(shù)量占優(yōu),但也有報道以二核苷酸重復為優(yōu)勢類型的物種,如夏蠟梅[20]、中泰南五味子[21]、日本莢蒾[22]等;以三核苷酸重復占優(yōu)勢的物種,如白三葉[23];少見其他重復基元優(yōu)勢物種,如望春玉蘭[24],以六核苷酸重復為優(yōu)勢類型。本次測序麥冬為川麥冬,轉(zhuǎn)錄組序列中以單核苷酸重復為絕對優(yōu)勢類型,占SSR總數(shù)的57.06%,而有研究表明浙麥冬轉(zhuǎn)錄組SSR以三核苷酸重復(38.43%)居多,其次為二核苷酸(31.21%)、單核苷酸重復(27.92%)[25]。從同類型基元內(nèi)堿基組成來看,川、浙麥冬也存在一定差異,如川麥冬三核苷酸重復中出現(xiàn)頻率最多的是AAG/CTT,而浙麥冬中則為AGC/CTG,且SSR整體分布密度上川麥冬(4.88 kb)大于浙麥冬(3.89 kb),造成這種差異的原因可能是測序平臺及測序方法的差異,也可能是兩個道地產(chǎn)區(qū)異質(zhì)性引起的遺傳變異。
因此,篩選出的SSR位點能否在川、浙麥冬中通用是麥冬資源遺傳評價研究中的關(guān)鍵。在本研究中,從6種核苷酸重復類型中隨機挑選的30對引物擴增結(jié)果來看,這些擴增位點在兩個產(chǎn)地的麥冬品種中擴增條帶差異較小,表明二者遺傳變異程度低,SSR引物序列可通用,但還需要更多引物的驗證試驗來證實這一結(jié)論。
參考文獻 Reference:
[1]
中國科學院中國植物志編輯委員會.中國植物志(第15卷)[M].北京:科學出版社,1978:163-164.
[2]國家藥典委員會.中華人民共和國藥典(2020年版第一部)[M].北京:中國醫(yī)藥科技出版社,2020:162-163.
[3]李文昌,甘我挺,郭寶林,等.巴戟天黨參等4種根及根莖類藥材商品電子交易規(guī)格等級標準[J].中國現(xiàn)代中藥,2016,18(11):1396-140 1415.
[4]劉 江,陳興福,楊文鈺,等.四川盆地麥冬種質(zhì)資源的過氧化物同工酶分析[J].草業(yè)學報,2009,18(6):259-263.
[5]楊美全,李品明,曾維群,等.川麥冬品種同工酶分析研究[J].中國中藥雜志,1998(5):14-15.
[6]李 敏,黃龍妹,陳 強.RAPD技術(shù)篩選麥冬分子鑒定標記的研究[J].浙江工業(yè)大學學報,2014,42(5):504-508.
[7]徐護朝.麥冬類植物遺傳變異的分子標記研究和表觀遺傳初探[D].福建泉州:華僑大學,2015.
[8]岑曉霞,孫 健,沈曉霞,等.基于SRAP和ISSR標記的栽培麥冬起源和遺傳多樣性研究[J].中藥材,202 44(3):555-561.
[9]黃玉潔.川渝麥冬資源的遺傳多樣性研究及ITS序列分析[D].成都:四川農(nóng)業(yè)大學,2014.
[10] 陳中蘇直,田 波,蔡傳濤.基于SSR分子標記的滇重樓遺傳多樣性研究[J].中草藥,2017,48(9):1834-1838.
[11]厚毅清,羅俊杰,歐巧明,等.卷丹及主要食用百合EST-SSR鑒別體系的構(gòu)建[J].中草藥,2020,51(16):4308-4315.
[12]錢麗華,嚴建立,吳曉疆,等.基于滇黃精轉(zhuǎn)錄組序列的SSR標記開發(fā)及其在黃精屬資源分析中的應用[J].江蘇農(nóng)業(yè)學報,2023,39(5):1120-1131.
[13]BEIER S,THIEL T,MNCH T,et al.MISA-web: a web server for microsatellite prediction[J].Bioinformatics,2017,33(16):2583-2585.
[14]BUCHFINK B,XIE C,HUSON D H.Fast and sensitive protein alignment using DIAMOND[J].Nature Methods,2015,12(1):59-60.
[15]UNTERGASSER A,CUTCUTACHE I,KORESSAAR T,et al.Primer3-new capabilities and interfaces[J].Nucleic Acids Research,2012,40(15):e115-e115.
[16]夏涵涵.麥冬Ophiopogon japonicus (L.f.)野生居群細胞學與遺傳多樣性研究[D].重慶:西南大學,2011.
[17]孟令芝.基于高通量測序技術(shù)的連翹轉(zhuǎn)錄組分析及SSR分子標記的開發(fā)[D].太原:山西農(nóng)業(yè)大學,2014.
[18]陳 浩,錢華麗,徐 哲,等.滇黃精轉(zhuǎn)錄組SSR位點信息分析[J].北方園藝,2022(22):104-109.
[19]程 揚,鄒 飄,張超凡,等.基于竹節(jié)參轉(zhuǎn)錄組的SSR分子標記開發(fā)和鑒定[J].中藥材,2017,40(12):2805-2809.
[20]黃耀輝,張 超,周莉花,等.基于轉(zhuǎn)錄組序列的夏蠟梅SSR位點特征與引物開發(fā)[J].浙江農(nóng)林大學學報,2017," 34(4):589-596.
[21]李靜宇,徐友陽,蔡時可,等.中泰南五味子轉(zhuǎn)錄組測序及生物信息學分析[J].廣州中醫(yī)藥大學學報,2022,39(10):2387-2393.
[22]柳 娟,岳春雷,朱 弘,等.日本莢蒾轉(zhuǎn)錄組SSR位點分析及多態(tài)性SSR標記開發(fā)[J].分子植物育種,2022," 20(21):7183-7192.
[23]張婷婷,張鶴山,宋康杰,等.白三葉轉(zhuǎn)錄組SSR位點特征分析及引物開發(fā)[J].草業(yè)科學,2023,40(9):2266-2275.
[24]徐正康,戴曉港,陳贏男.望春玉蘭基因組SSR引物開發(fā)與應用初探[J].林業(yè)科學,2023,59(10):113-127.
[25]劉慧君.浙麥冬轉(zhuǎn)錄組學研究[D].杭州:浙江工業(yè)大學,2019.
Analysis of SSR Sequence Characteristics and Primers Design
Based on Transcriptome Data of Ophiopogon japonicus
WANG Jun "DAI Wei "LAI Qianglong "YE Kunhao "CHEN Jie
FENG Lun2, LIU Yuan2, HE Aiping2 and ZHAO Dan1
(1.Mianyang Academy of Agricultural Science/Crop Characteristic Resources Creation and Utilization Key
Laboratory" of Sichuan Province, MianyangSichuan 621023, China; 2.Santai County Bureau of
Agriculture" and Rural Affairs, Mianyang" Sichuan 621100, China)
Abstract" Ophiopogon japonicus, a medicinal plant in the Liliaceae family, is listed as the supreme herb for nourishing Yin and moistening the lung in the Shennong’s Classic of Materia Medica. This study employed high-throughput sequencing technology to obtain a total of 53 466 Unigenes from the transcriptome of O.japonicus. A total of 35 832 SSR loci were identified in the Unigenes through sequence analysis. They were distributed across 24 539 Unigenes, with a high SSR occurrence frequency of 67.02% and an average distribution distance of 4.88 kb. GO and KEGG annotations of 24 539 Unigenes containing SSR loci revealed their main involvement in biological processes, plant-pathogen interaction, and other gene functions and metabolic pathways. Mononucleotide repeats were the mostabundant, accounting for 57.06%, with A/T (20" 193) being the absolute dominant type among all SSR repeat units. Pentonucleotide repeats had the highest average distribution distance (4 069.34 kb). From the perspective of repeat times, the types with repeat unit 10 or more had the most, with 20" 849 ones, accounting for 61.69%. 30 different repeats types were randomly selected and primers were designed to amplify the genomic DNA of Chuan-maidong (O.japonicus from Sichuan) and Zhe-maidong (O.japonicus from Zhejiang). The results showed that 28 pairs of primers could amplify bands in two cultivars, of which 16 pairs could amplify the target band. This study explored rich SSR loci information from the transcriptome data of O.japonicus, providing data and research foundation for genetic evaluation of resources and molecular marker assisted breeding research.
Key words Ophiopogon japonicus; Transcriptome; SSR loci; Primer design
Received" 2024-01-23 Returned 2024-03-22
Foundation item Sichuan Science and Technology Program (No.2021YFYZ0012,No.2021ZHFP0118); Key Projects at the Central Government Level: Capacity Building for Sustainable Utilization of Valuable Chinese Medicinal Resources (No.2060302); China Agriculture Research System of MOF and MARA (No. CARS-21); the Innovation Fund Project of Mianyang Academy of Agricultural Sciences (No.Cxjj89).
First author WANG Jun, male, Ph.D, assistant research fellow.Research area:medicinal botany." E-mail:wangjunmyaas@outlook.com
Correspondingauthor ZHAO Dan, female, associate research fellow.Research area:medicinal botany.E-mail:Zhaodan_3210@163.com
(責任編輯:成 敏 Responsible editor:CHENG" Min)