樓天靈,袁莉霞,張國芳,吳 浩,沈 嵐
(1.浙江藥科職業(yè)大學,浙江 寧波 315100; 2.寧波市農業(yè)科學研究院,浙江 寧波 315100)
鐵皮石斛(Dendrobiumcandidum)是多年生草本植物,屬于蘭科(Orchidaceae)石斛屬(Dendrobium),是一種傳統(tǒng)的名貴中草藥。其具有益胃生津、滋陰清熱之功效,富含多糖及幾十種微量元素,素有“千金草”“神仙草”之稱[1]。近年來,通過藥理及有效成分分析發(fā)現(xiàn),鐵皮石斛中的有效成分主要為多糖類物質,能提高免疫力,降低血糖,抗氧自由基及保護胃等功效[2]。隨著中藥在臨床用藥中的增加,野生資源的過度開采,野生資源蘊藏量顯著下降,難以滿足加工和臨床使用的需求。人工種養(yǎng)規(guī)模和產區(qū)范圍隨之均逐步擴大,藥材質量不穩(wěn)定、品種退化問題也隨之嚴峻。因此,篩選培育優(yōu)良種源,擴大新的藥源迫在眉睫。而植物物種間的遺傳親緣關系越接近,其所含的化學有效成分類型及含量也越相近[3],能較快地發(fā)現(xiàn)新藥源[4]。但目前有關鐵皮石斛的研究主要集中于藥理藥效、有效成分分析等方面[5-6],系統(tǒng)發(fā)育方面的研究較少。
葉綠體在植物細胞中起著至關重要的作用,能進行植物的光合作用,具有一套自主的遺傳物質,有研究表明,其源于內共生藍藻[7]。大量研究表明,多數(shù)被子植物的葉綠體基因組為雙鏈環(huán)狀四分體結構[8],大單拷貝區(qū)(Large Single Copy Region, LSC)、小單拷貝區(qū)(Small Single Copy Region, SSC)和反向重復區(qū)(Inverted Repeat Regions, IRa/IRb)。葉綠體基因組較核基因組及線粒體基因組更為保守,其長度在120~160 kb之間,總基因個數(shù)約為130個[9],具有單親遺傳不存在重組、序列變異度適中等特點[10]。近年來,隨著高通量測序的發(fā)展,葉綠體基因組的研究也越來越多,自1986年煙草[11]和地錢[12]首次公布以來,已有超3 000條葉綠體基因組被公布[13]。
本研究基于Illumina二代測序技術及生物信息學方法,分析了鐵皮石斛的葉綠體基因組全序列測序、基因功能注釋、圖譜構建,并對其結構特征作出解析。選取了已發(fā)表的13個蘭科植物以及2個外類群葉綠體基因組序列,做了親緣關系分析,為鐵皮石斛的藥用資源開發(fā)、遺傳多樣性、種間系統(tǒng)親緣關系及新藥源的開發(fā)等研究奠定理論基礎。
鐵皮石斛樣品采集自寧波市寧??h小宋村1個野生居群,由浙江省寧波市農業(yè)科學研究院沈嵐高級農藝師鑒定。標本存放于浙江省寧波市農業(yè)科學研究院石斛種質資源庫中。
取鮮嫩幼葉約2 g,液氮冷凍研磨至粉末,利用植物基因組DNA提取試劑盒(生工生物工程(上海)股份有限公司),參照說明書完成提取。根據(jù)1.5%的瓊脂糖凝膠電泳的條帶亮度及Nanodrop 1000檢測的D260/D280的比值和濃度,經檢驗合格的樣本送生工生物工程(上海)股份有限公司,通過Illumina HiSeq 2500-PE 150平臺進行建庫測序。
DNA質量檢測合格后,通過超聲波的方法將其破碎,純化并修復破碎的DNA片段,完成3′-端加ployA處理,連接測序頭[14],并利用1.5%的瓊脂糖凝膠電泳,區(qū)分不同大小的片段,完成PCR擴增。通過基因文庫質檢,獲得基因測序文庫。經檢測合格的文庫利用Illumina Hi Seq 2500完成基因測序。
對Illumina測序獲得的原始測序文件數(shù)據(jù)進行過濾,利用NGS QC ToolKit[15]除去測序接頭以及低質量的片段,盡可能保證序列的準確性,獲得高質量的測序結果。采用NOVOPlasty軟件[16],設定K-mer值為39,參考蘭科石斛屬石斛Dendrobiumnobile(Genebank No.:KX 377961.1)的葉綠體基因組(https://www.ncbi.nlm.nih.gov/nuccore/KX 377961.1/)的保守序列對鐵皮石斛的葉綠體基因組進行組裝,獲得完整的葉綠體基因組。得到的葉綠體組基因用Mitofy[17]完成基因功能注釋并利用CpGAVASpipeline[18]進行準確性驗證。最后再利用在線工具OGDraw[19](https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)繪制鐵皮石斛的葉綠體基因組物理圖譜,并上傳至NCBI(https://www.ncbi.nlm.nih.gov),獲得登錄號(MZ 129032)。
利用在線軟件REPuter[20](https://bibiserv.cebitec.uni-bielefeld.de/reputer)驗證鐵皮石斛的重復序列:正向重復序列(F)、反向重復序列(R)、正向互補序列(C)和回文序列(P),參數(shù)設置為:Minimal repeat size=30,Hamming distance=3;以及利用在線軟件MISA[21](http://pgrc.ipk-gatersleben.de/misa/)檢測簡單重復序列(SSR),設置參數(shù)為:單核苷酸重復≥10,二核苷酸重復≥5,三核苷酸重復≥4,四核苷酸重復≥3,五核苷酸及六核苷酸重復≥3。所有搜索得到的序列結果均通過人工予以驗證。
利用在線軟件VISTA[22](http://genome.lbl.gov/vista/mvista/instructions.shtml)中的mVISTA工具對鐵皮石斛及石斛屬的其他3個物種(霍山石斛Dendrobiumhuoshanense、細莖石斛Dendrobiummoniliforme、石斛Dendrobiumnobile)的葉綠體全基因組進行對比分析并繪制比對圖。
為了解鐵皮石斛在蘭科植物中的系統(tǒng)位置,從NCBI(https://www.ncbi.nlm.nih.gov)數(shù)據(jù)庫中下載了13個已發(fā)表的蘭科葉綠體基因組,2個百合科植物(外類群),分別為:長距蝦脊蘭(CalanthesylvaticaNC 044633)、通麥蝦脊蘭(CalanthegriffithiiMZ 474966)、伏生石豆蘭(BulbophyllumreptansMW 800884)、杜鵑蘭(CremastraappendiculataNC 037439)、霍山石斛(DendrobiumhuoshanenseMN 617016)、細莖石斛(DendrobiummoniliformeMN 617018)、石斛(DendrobiumnobileKX 377961)、沼蘭(LiparisjaponicaMK 886513)、箬葉蘭(SobraliacallosaKM 032623)、疏花火燒蘭(EpipactisveratrifoliaNC 030708)、大葉火燒蘭(EpipactismaireiNC030705)、日本對葉蘭(NeottiajaponicaMH 321184)、小葉兜蘭(PaphiopedilumbarbigerumNC 050870),蒜(AlliumsativumMK 335928)、韭(AlliumtuberosumNC 044709),與鐵皮石斛葉綠體基因組,通過MAFFT軟件[23]完成基因組序列的比對,再利用MEGA 7.0軟件[24]構建系統(tǒng)進化關系,確定鐵皮石斛與其他蘭科植物之間的親緣關系。
通過Illumina Hi Seq 2500平臺獲得6.98 GB的高質量測序數(shù)據(jù),鐵皮石斛葉綠體基因組結構與大多數(shù)被子植物類似,為雙鏈環(huán)狀的四分體結構(圖1),其大小為153 508 bp,大單拷貝區(qū)域(LSC)為85 759 bp,小單拷貝區(qū)域(SSC)為14 973 bp,兩個反向重復區(qū)域(IRs)為26 419 bp。
在鐵皮石斛葉綠體基因組中共被注釋了133個基因,其中包括93個蛋白編碼基因(CDS),32個轉運RNA(tRNA)基因以及8個核糖體rRNA(rRNA)基因(表1)。并對其堿基組成進行分析,發(fā)現(xiàn)GC的含量占總共堿基數(shù)量的37.51%,其中LSC區(qū)域對應的百分比為35.13%,SSC區(qū)域對應的百分比為30.24%、IRa區(qū)域對應的百分比為43.35%和IRb區(qū)域對應的百分比為43.35%。
表1 鐵皮石斛葉綠體基因組結構特征Table 1 Structural characteristics of Dendrobium candidum chloroplast genome
本研究利用在線軟件REPuter檢測了長重復序列(長度≥30 bp),鐵皮石斛共檢測到47個長重復序列,其中正向重復序列19個,反向重復序列20個,互補重復序列8個,其間隔序列大小均在30~50 bp之間(表2)。利用在線軟件MISA檢測鐵皮石斛葉綠體基因組中簡單重復序列(SSR),共檢測到簡單重復序列63個,其中單核重復序列(A/C/T/G)36個,二核苷酸重復序列(AT/GA/TA/TC)15個,三核苷酸重復序列(ATA/TAG/TAT)5個,四核苷酸重復序列(AGAA/ATTA/CTAT/GTCT/TAGT) 5個,五核苷酸重復序列(TCTAT)1個、六核苷酸重復序列(TCCATC)1個(表2、表3)。
表2 鐵皮石斛葉綠體基因組中長重復序列與SSR數(shù)量Table 2 The long repetitive sequences and SSR numbers of Dendrobium candidum chloroplast genomes 單位:個
表3 鐵皮石斛葉綠體基因組中SSR類型Table 3 SSR types of Dendrobium candidum chloroplast genomes
圖1 鐵皮石斛完整的葉綠體基因組圖譜Fig.1 The whole chloroplast genome map of Dendrobium candidum
以已注釋的鐵皮石斛葉綠體基因組序列(登錄號: MZ 129032)為參考,再通過在線軟件工具 mVISTA 對鐵皮石斛及石斛屬的其他3個物種的葉綠體基因組進行全基因組比較分析,結果(圖2)顯示4個葉綠體基因組均具有高度保守序列,且大部分變異均處于非編碼區(qū)。
圖2 霍山石斛、細莖石斛、石斛及鐵皮石斛的葉綠體基因組全局比對Fig.2 Global comparison of D. huoshanense, D. moniliforme, D. nobile and D.candidum chloroplast genomes
利用MAFFT軟件對從NCBI數(shù)據(jù)庫中發(fā)表的15個葉綠體基因組完成基因組與鐵皮石斛基因組序列的比對,再通過MEGA 7.0軟件構建系統(tǒng)進化樹。結果顯示,鐵皮石斛與霍山石斛、細莖石斛、石斛成一簇,其中與石斛親緣性最近(圖3)。
圖3 基于16個葉綠體基因組構建的進化樹Fig.3 The evolutionary tree contructed based on 16 chloroplast genomes
鐵皮石斛是珍貴的中藥材,藥用價值與經濟價值高。鐵皮石斛自然條件下種子與真菌共生才能萌發(fā),加上近年的過度采挖,導致野生石斛瀕臨滅絕,人工栽培面積逐步擴大,為保證種源的品質及穩(wěn)定性,已有研究人員通過EST-SSR[25]、ISSR[26]、SRAP[27]、TRAP[28]等分子手段為保證鐵皮石斛的品質提供了一定的參考。本研究通過葉綠體基因組的發(fā)育關系分析鐵皮石斛種間系統(tǒng)親緣關系,對上述研究進行進一步補充?;贗llumina高通量測序及生物信息學方法分析了鐵皮石斛葉綠體基因組全基因,研究結果顯示,與大多數(shù)被子植物類似,為雙鏈環(huán)狀的四分體結構,大小為153 508 bp,共編碼133個基因(93個CDS基因,32個tRNA基因以及8個rRNA基因),其結果符合被子植物葉綠體規(guī)律,編碼基因約為130個[9]。GC的含量占總堿基數(shù)量的37.51%,與劉潮等[29]研究結果一致,葉綠體基因組的GC含量區(qū)間為31.0%~38.0%,在LSC區(qū)域對應的百分比為35.13%,SSC區(qū)域對應的百分比為30.24%、IRa區(qū)域對應的百分比為43.35%和IRb區(qū)域對應的百分比為43.35%,其中IRs區(qū)GC含量最高,具體表現(xiàn)為:IRs區(qū)>LSC區(qū)>SSC區(qū),源于該區(qū)域rRNA基因所含的GC含量高,可能與其區(qū)域含有NADH基因有關[30]。
葉綠體遺傳多樣性分析對種質資源的收集具有一定的意義。葉綠體基因組中存在的長重復序列及簡單重復序列在序列變異中發(fā)揮著重要的作用[31],且因其SSR含量極其豐富、分布隨機、多態(tài)性高,為母系遺傳等優(yōu)點,被廣泛用于分子標記[32],被用于物種遺傳多樣性,基因組圖譜等的研究[33]。本研究利用在線軟件分析,獲得長重復序列47個(正向重復序列為19個,反向重復序列為20個,互補重復序列為8個),其結果與細莖石斛[34]相一致,與石豆蘭屬結果[35]不一致,說明植株的親緣性與重復序列的數(shù)量和類型存在一定的關聯(lián)性。簡單重復序列(SSR)63個(單核重復序列36個,二核苷酸重復序列15個,三核苷酸重復序列5個,四核苷酸重復序列5個,五核苷酸重復序列1個、六核苷酸重復序1個),葉綠體基因組中SSR以單核重復序列和二核重復序列較多,且A/T堿基含量較高,其中單核重復序列以多聚A和多聚T重復類型較多,多聚G和多聚C重復類型較少,其符合植物葉綠體基因組SSR序列組成的規(guī)律,該研究結果與其他物種相一致[36]。所獲得的重復序列為鐵皮石斛遺傳多樣性研究提供了可選用的分子標記。
近年來,對石斛屬植物利用了多種技術,包括EST-SSR[25]、ISSR[26]、SRAP[27]、TRAP[28]等,做了多項物種多樣性和種間多樣性的研究,但種間關系仍存在一定疑慮,基于葉綠體基因組的遺傳多樣性分析以及系統(tǒng)進化分析能夠在此基礎上提供更有利的證據(jù)。本研究NCBI數(shù)據(jù)庫中下載了13個已發(fā)表的蘭科葉綠體基因組,2個百合科植物(外類群),通過MAFF軟件進行序列的比對,利用MEGA 7.0軟件構建系統(tǒng)進化樹,確定鐵皮石斛與其他蘭科植物之間的親緣關系。結果顯示,鐵皮石斛與霍山石斛、細莖石斛、石斛成一簇,其中與石斛親緣性最近。本研究結果為我國鐵皮石斛植物資源的保護和遺傳育種提供了一定的理論依據(jù)。