王趁芳,黃守程,周玉麗,王曉鵬,劉愛榮,侯北偉,葉梅榮*
(1.安徽科技學(xué)院,安徽鳳陽233100;2.南京野生植物綜合利用研究所,江蘇南京211100)
測(cè)序基因分型技術(shù)(Genotyping by sequencing,GBS)是基于二代測(cè)序技術(shù)的簡(jiǎn)化基因組測(cè)序,可以檢測(cè)大量單核苷酸(Single nucleotide polymor?phisms,SNP)變異位點(diǎn),并且成本低[1]。SNP為第三代分子標(biāo)記、具有密度高、分布范圍廣、遺傳穩(wěn)定、分型簡(jiǎn)單、可自動(dòng)化等優(yōu)點(diǎn)[2],SNP多態(tài)性是指由于單個(gè)核苷酸變異所引起的基因組上DNA序列的多態(tài)性[3]。目前GBS-SNP標(biāo)記已廣泛用于動(dòng)植物群體的進(jìn)化、育種、親緣關(guān)系、遺傳結(jié)構(gòu)、物種鑒定等研究[4]。如周萍萍等[5]利用該標(biāo)記研究栽培六倍體燕麥(Avena sativaL.)的起源;Talaveraet al.[6]應(yīng)用該標(biāo)記研究牛油果(Persea americanaMill.)的遺傳多樣性和群體結(jié)構(gòu)。
霍山石斛(Dendrobium huoshanenseC.Z.Tang and S.J.Cheng)、鐵皮石斛(Dendrobium officinaleKimura et Migo)和 細(xì) 莖 石 斛(Dendrobium monili?forme(L.)Sw.)均為蘭科(Orchidaceae)石斛屬(Den?drobiumSw.)多年生附生草本植物,是我國(guó)傳統(tǒng)名貴的藥用植物[7]?;羯绞追Q米斛、霍石斛等,僅分布在我國(guó)大別山區(qū),如湖北英山、河南南召、安徽霍山等地區(qū)[7];而鐵皮石斛和細(xì)莖石斛分布范圍廣泛,從我國(guó)云南最南部的熱帶到北部的河南省均有分布[8-9]?;羯绞那o桿加工成的楓斗被稱為“金霍斗”,為“楓斗之王”;而鐵皮石斛和細(xì)莖石斛的莖桿被加工成著名的中藥“鐵皮楓斗”和“銅皮楓斗”[10-11]。中國(guó)約有40多種石斛作為傳統(tǒng)的中藥藥材,具有重要的藥用和保健功能,據(jù)《神農(nóng)本草經(jīng)》記載“石斛,一名林蘭。味甘,平,無毒。主傷中,除痹,下氣,補(bǔ)五藏虛勞贏瘦,強(qiáng)陰。久服厚腸胃,輕身延年”[12]?,F(xiàn)代藥理研究表明,石斛具有養(yǎng)胃潤(rùn)肺、清音明目、增強(qiáng)免疫力、抗氧化、抗腫瘤、降血糖、防衰老和延年益壽等功效[13]。因此石斛楓斗被當(dāng)作高檔保健飲品,價(jià)格昂貴,市場(chǎng)需求極大。雖然有近40多種石斛被作為藥用植物,而歷代本草及現(xiàn)在被公認(rèn)的優(yōu)質(zhì)“石斛”應(yīng)該指“鐵皮石斛”與“霍山石斛”[14]。目前關(guān)于霍山石斛、鐵皮石斛與細(xì)莖石斛的遺傳關(guān)系及其鑒別的研究報(bào)道已有不少,如羅宇琴等[15]從含量測(cè)定、指紋圖譜、藥理作用等方面分析霍山石斛和鐵皮石斛的異同。這3種石斛的遺傳關(guān)系一直是石斛研究者感興趣的問題,因此該文基于GBS標(biāo)記的SNP位點(diǎn)研究3種石斛的遺傳關(guān)系,為進(jìn)一步促進(jìn)3種石斛的研究提供參考。
該研究于2019年9月在安徽霍山地區(qū)只收集到栽培3年以上的霍山石斛樣本8份和栽培鐵皮石斛樣本7份。因霍山石斛、鐵皮石斛及細(xì)莖石斛的野生樣本稀缺,所以未能收集到霍山石斛和鐵皮石斛的野生樣本。而細(xì)莖石斛除收集到霍山地區(qū)栽培的3份樣本外,又收集到2份廣西偉江的野生樣本。所有石斛樣本均由王曉鵬教授鑒定并保存在安徽科技學(xué)院里。將樣本的新鮮葉片收集于密封袋,然后迅速投入液氮里速凍,取出密封袋埋藏于干冰里,運(yùn)送到菲莎基因有限公司進(jìn)行DNA提取和GBS分析。
用改良的十六烷基三甲基溴化銨法(Cetyltri?methylammonium bromide,CTAB)提取樣本的DNA,利用瓊脂糖凝膠電泳檢測(cè)樣品DNA的完整性及DNA片段長(zhǎng)度,DNA純度用Nanodrop微量分光光度計(jì)檢測(cè),DNA的濃度用Qubit 3.0精確定量,只有單個(gè)樣本的DNA濃度≧10μg才能用于文庫構(gòu)建;將檢測(cè)合格的DNA樣品用Covaris超聲波破碎儀隨機(jī)打斷,用Msel酶降解,末端修復(fù)后加A尾和測(cè)序接頭、純化、聚合酶鏈?zhǔn)椒磻?yīng)(Polymerase chain reaction,PCR)擴(kuò)增等步驟完成構(gòu)建整個(gè)文庫,用Illumina測(cè)序儀PE150對(duì)構(gòu)建好的文庫進(jìn)行測(cè)序。
測(cè)序平臺(tái)獲得的原始圖像數(shù)據(jù)文件用堿基識(shí)別分析轉(zhuǎn)化為原始測(cè)序序列即Raw data[所有Raw data數(shù)據(jù)已上傳美國(guó)國(guó)家生物技術(shù)信息中心(Na?tional center for biotechnology information,NCBI),登錄號(hào)為PRJNA659117],用Trimmomatic Version 0.38軟件對(duì)Raw data過濾,去除含有接頭、兩端連續(xù)質(zhì)量小于20堿基對(duì)(base pair,bp)及堿基長(zhǎng)度小于50 bp的測(cè)序片段,成對(duì)的測(cè)序片段被保留,即最后獲得干凈的測(cè)序片段稱為clean data或clean reads。用Burrows-wheeler alignment tool(BWA)[16-17]將clean data比對(duì)到黃石斛(Dendrobium catenatumLindl.)[18]參考基因組上。
Clean data的SNP數(shù)目用The genome analysis toolkit(GATK)[19]軟件進(jìn)行檢測(cè)和過濾,Minor allele frequency(MAF)<0.01和20%樣本沒有的SNP被去除掉,得到的SNP可用作遺傳結(jié)構(gòu)等分析。
居群遺傳結(jié)構(gòu)用Admixture軟件[20]進(jìn)行分析,交叉驗(yàn)證誤差最小的值為最適的K值,鄰接樹(Neigh?bor-joining tree,NJtree)用TreeBeST[21]構(gòu)建,為探討3種石斛的遺傳結(jié)構(gòu)關(guān)系用Genome-wide complex trait analysis(GCTA)[22]軟件進(jìn)行主成分分析。用GenAlEx軟件計(jì)算3種石斛的遺傳距離。
霍山石斛、細(xì)莖石斛和鐵皮石斛平均每個(gè)樣本產(chǎn)生的clean reads是霍山石斛>細(xì)莖石斛>鐵皮石斛,分別為1 535 753、1 380 009和1 208 693個(gè)。平均每個(gè)樣本產(chǎn)生的clean bases也是霍山石斛>細(xì)莖石斛>鐵皮石斛的,分別為436 387 047 bp、391 592 914 bp和344 268 426 bp。3種石斛比對(duì)到黃石斛參考基因組的reads數(shù)占比最高的是鐵皮石斛,為99.06%,霍山石斛和細(xì)莖石斛相差不明顯,分別為97.00%和96.98%;測(cè)序長(zhǎng)度符合一定閾值且雙端的reads都比對(duì)上參考基因組的reads數(shù)占比最高的也是鐵皮石斛,為91.35%,霍山石斛、細(xì)莖石斛之間差異不明顯,分別為79.79%和80.08%(表1)。
表1 每樣本產(chǎn)生干凈片段的數(shù)目和平均比對(duì)到參考基因組的比例Table 1 Summary of clean reads per specimen detected by GBSand percentage of alignment to reference genome sequence
霍山石斛、細(xì)莖石斛和鐵皮石斛的平均每個(gè)樣本產(chǎn)生的SNP數(shù)目霍山石斛>細(xì)莖石斛>鐵皮石斛,分別為1 509 648、1 364 605和903 183個(gè)。其轉(zhuǎn)換和顛換的SNP數(shù)目也是霍山石斛>細(xì)莖石斛>鐵皮石斛,分別為899 064和6 108 125,810 614和551 968,552 704和347 449個(gè),鐵皮石斛的轉(zhuǎn)換和顛換的比例是1.59,其余的都是1.47?;羯绞?、細(xì)莖石斛和鐵皮石斛平均每個(gè)樣本產(chǎn)生的雜合和純合SNP數(shù)分別為204 940和1 304 709,168 830和1 195 774,216 436和686 747個(gè),雜合SNP數(shù)占總SNP比最高的是鐵皮石斛為0.24,霍山石斛和細(xì)莖石斛差異不明顯分別為0.14和0.12(表2)。
表2 GBS檢測(cè)獲得的每個(gè)樣本SNP數(shù)目Table 2 Summary of average SNPs per specimen detected by GBS
Clean reads過濾后得到用于群體結(jié)構(gòu)分析的總SNP數(shù)為187 143個(gè),其中霍山石斛、細(xì)莖石斛和鐵皮石斛分別有120 734、97 441和73 787個(gè)。根據(jù)Tree BeST軟件計(jì)算遺傳距離陣,然后用鄰接法構(gòu)建系統(tǒng)NJ進(jìn)化樹(圖1),從圖1中看出明顯分為2大支,鐵皮石斛聚為一支,細(xì)莖石斛和霍山石斛聚為另一支,細(xì)莖石斛和霍山石斛又被嚴(yán)格分為2支。根據(jù)Admixture軟件分析的遺傳結(jié)構(gòu)(圖2A和圖2B)顯示:最佳的K值是2,鐵皮石斛聚為一支,霍山石斛和細(xì)莖石斛聚在一起,暗示其遺傳關(guān)系更接近;當(dāng)K=3時(shí),分為3支,3種石斛被嚴(yán)格分開與NJ樹相似。主成分分析(Principal component anal?ysis,PCoA)與Structure和NJ樹分析類似(見圖3),也是3種石斛被嚴(yán)格分開,總的遺傳變異是38.21%,而PC1和PC2分別為26.99%和11.22%。遺傳距離分析發(fā)現(xiàn):霍山石斛與鐵皮石斛間的遺傳距離最大為0.3052,其次是細(xì)莖石斛與鐵皮石斛間的為0.2792,最低為霍山石斛與細(xì)莖石斛間的為0.2141。
圖1 基于20個(gè)石斛植物樣本的187 143 SNPs-GBS的遺傳距離矩陣構(gòu)建鄰接樹Fig.1 NJ tree based on pairwise distance matrix representing the grouping of the 20 Dendrobium specimens obtained from 187 143 SNPs-GBS
圖2A 根據(jù)Admixture軟件構(gòu)建的20個(gè)石斛樣本的遺傳結(jié)構(gòu)圖Fig.2A Genetic structure of 20 Dendrobium specimens for K=2-8 based on the Admixture software
圖2B 交叉驗(yàn)證誤差和K值Fig.2B Cross-validation error and K value
圖3 根據(jù)樣本間匹配相似性構(gòu)建的主成分圖(PCoA)Fig.3 Principal coordinates analysis(PCoA)of pairwise sim?ple matching dissimilarities between specimens
霍山石斛、鐵皮石斛與細(xì)莖石斛都是我國(guó)傳統(tǒng)的名貴藥用植物,而關(guān)于三種石斛的遺傳關(guān)系一直是石斛研究者感興趣的問題。如鄧輝等[23]、劉明珍等[24]分別用重復(fù)序列聚合酶鏈?zhǔn)椒磻?yīng)(Inter-simple sequence repeat,ISSR)技術(shù)證明了霍山石斛與相似種鐵皮石斛、細(xì)莖石斛等存在較大的、穩(wěn)定的差異,認(rèn)為霍山石斛不屬于鐵皮石斛,應(yīng)為一獨(dú)立的種;樊洪泓等[25]根據(jù)隨機(jī)擴(kuò)增多態(tài)性DNA(Random am?plified polymorphic DNA,RAPD)分子標(biāo)記研究認(rèn)為霍山石斛與細(xì)莖石斛親緣關(guān)系更近,而與鐵皮石斛的親緣關(guān)系相對(duì)較遠(yuǎn);而其根據(jù)相關(guān)序列擴(kuò)增多態(tài)性(Sequence-related amplified polymorphism,SRAP)標(biāo)記研究認(rèn)為鐵皮石斛與霍山石斛也具有較近的親緣關(guān)系。陸安靜等[26]通過內(nèi)轉(zhuǎn)錄間隔序列(Inter?nal transcribed spacer,ITS)分析比較認(rèn)為細(xì)莖石斛與鐵皮石斛的親緣關(guān)系較近;李國(guó)良等[27]通過ITS、Nad intron2和psbA-trnH系列分析發(fā)現(xiàn),霍山石斛與鐵皮石斛在這些序列上具有明顯的堿基差異,而與細(xì)莖石斛差異不明顯,霍山石斛和鐵皮石斛之間的遺傳距離大于其和細(xì)莖石斛之間的遺傳距離。這些研究結(jié)果與該文研究結(jié)果類似,即這三種石斛的遺傳親緣關(guān)系都比較近,而霍山石斛與細(xì)莖石斛的遺傳關(guān)系比霍山石斛與鐵皮石斛的遺傳關(guān)系更近。
探討不同種石斛的遺傳關(guān)系,一般野生樣本更具有說服力,人工栽培因人為的選擇可能會(huì)造成遺傳多樣性的丟失或者遺傳背景的復(fù)雜,如Hou[28]利用三核苷酸微衛(wèi)星(Trinucleotide microsatellite)標(biāo)記分析發(fā)現(xiàn)異位收藏保護(hù)的鐵皮石斛和其野生居群相比基因多樣性并沒有顯著的差異,但Structure分析揭示了其在遺傳組成上具有明顯的差異;張君毅等[29]采用目標(biāo)區(qū)域擴(kuò)增多態(tài)性(Target region ampli?fication polymorphism,TRAP)和特異序列擴(kuò)增區(qū)域(Sequence-characterized amplified region,SCAR)標(biāo)記研究得出鐵皮石斛野生類群遺傳多樣性水平最高,而仿野生類群和栽培類群基本一致;而魏丹紅和徐紅[30]用ISSR標(biāo)記研究認(rèn)為金釵石斛栽培居群的遺傳多樣性和野生相比基本上沒有喪失;吳永輝等[31]利用保守DNA衍生多態(tài)性(Conserved DNA-de?rived polymorphism,CDDP)分子標(biāo)記研究表明鐵皮石斛人工栽培種具有豐富的遺傳多樣性;該研究因資金的有限和石斛野生資源的稀缺未能完成野生和栽培石斛遺傳關(guān)系的比較研究,而所選的細(xì)莖石斛栽培和野生樣本量太少,無法準(zhǔn)確判斷兩者差異,希望未來的研究能比較野生樣本和栽培樣本的遺傳差異。
總之,根據(jù)GBS-SNP標(biāo)記分析發(fā)現(xiàn)霍山石斛與鐵皮石斛遺傳關(guān)系較遠(yuǎn),而其和細(xì)莖石斛遺傳關(guān)系較近;遺傳結(jié)構(gòu)、NJ樹及主成分分析結(jié)果類似,3種石斛被明顯分開,證明GBS-SNP分子標(biāo)記可用于該3種石斛的鑒定研究。