張濤,李學(xué),張競(jìng),印軒鵬,賀水蓮
(云南農(nóng)業(yè)大學(xué) 園林園藝學(xué)院,云南 昆明 650201)
極小種群野生植物(plant species with extremely small populations,PSESP)指分布地域面積狹小或成間斷分布,且長(zhǎng)期以來(lái)遭受各類不同外界自然環(huán)境因素的脅迫影響,已經(jīng)遠(yuǎn)遠(yuǎn)小于穩(wěn)定生存范圍界限內(nèi)的最小生存種群,且隨時(shí)都有可能發(fā)生瀕臨滅絕的野生植物種類[1]。馨香玉蘭(Magnoliaodoratissima)為木蘭科(Magnoliaceae Juss.)木蘭屬(MagnoliaLinn.)常綠喬木,其花潔白芳香,枝繁葉茂,有較強(qiáng)的凈化環(huán)境和抗污染能力,為優(yōu)質(zhì)的觀賞樹(shù)木[2]。馨香玉蘭僅產(chǎn)于云南省,主要分布于文山壯族苗族自治州的廣南、麻栗坡和西疇等地,其所有居群都分布在自然保護(hù)區(qū)外,缺乏針對(duì)性的保護(hù)。馨香玉蘭的野生資源僅剩下5個(gè)居群,均處于高大喬木之下,光照不足,生長(zhǎng)前景很不樂(lè)觀,結(jié)實(shí)率低[3];種子中存在抑制發(fā)芽的物質(zhì),且抑制效果顯著[4]。由此可見(jiàn)其種群生存狀況堪憂。其瀕危級(jí)別已屬極危,并列入我國(guó)Ⅱ級(jí)重點(diǎn)保護(hù)野生植物[5],也是我國(guó)云南特有的極小種群物種,急需開(kāi)展保護(hù)。而今,已有學(xué)者對(duì)其種群生態(tài)學(xué)[6-8]、保護(hù)生物學(xué)[9]、林學(xué)[10]、育苗[11-12]等方面開(kāi)展了研究。然而,對(duì)于馨香玉蘭的分子標(biāo)記開(kāi)發(fā)、保護(hù)遺傳學(xué)研究還很薄弱。隨著分子生物學(xué)的發(fā)展,開(kāi)發(fā)分子標(biāo)記來(lái)對(duì)瀕危植物進(jìn)行遺傳評(píng)價(jià),從而提出精確保護(hù)策略,是保護(hù)瀕危植物的有效手段。
SLAF-seq(specific-locus amplified fragment sequencing)技術(shù)是通過(guò)構(gòu)建SLAF-seq數(shù)據(jù)庫(kù),將具有特異性長(zhǎng)度的片段(SLAF標(biāo)簽)篩選出來(lái)并進(jìn)行高通量測(cè)序,最后將得到的符合質(zhì)量要求的SLAF片段作為目標(biāo)物種的全基因組信息,進(jìn)而依據(jù)這些特異性SLAF標(biāo)簽?zāi)軌蛟谌蚍秶鷥?nèi)迅速鑒定準(zhǔn)確性高的SNP變異位點(diǎn)信息,利用特異性位點(diǎn)可以構(gòu)建遺傳連鎖圖譜、系統(tǒng)進(jìn)化樹(shù)、PCA分析、基因流分析等用于遺傳進(jìn)化和群體結(jié)構(gòu)分析。SLAF測(cè)序技術(shù)在保護(hù)遺傳學(xué)領(lǐng)域已經(jīng)得到了廣泛利用,并取得了一定的成果。如:Zheng等[15]基于SLAF-seq技術(shù)對(duì)紅橘×枳(Citrusreticulata×Poncirustrifoliata)雜交群體進(jìn)行了遺傳多樣性分析、Xia等[16]基于SLAF-seq技術(shù)對(duì)油棕(Elaeisguineensis)進(jìn)行了遺傳多樣性和群體結(jié)構(gòu)的評(píng)價(jià)、Chang等[17]基于SLAF-seq技術(shù)對(duì)側(cè)柏(Platycladusorientalis)進(jìn)行了遺傳保護(hù)研究。此類工作證實(shí)了SLAF-seq測(cè)序技術(shù)可以提供大量的SNPs以供群體遺傳學(xué)分析[18]。本研究以5個(gè)野生居群和2個(gè)栽培居群共70份馨香玉蘭資源為材料,采用SLAF-seq建立文庫(kù),通過(guò)篩選特異性相關(guān)位點(diǎn)擴(kuò)增片段,在全基因組范圍之內(nèi)開(kāi)發(fā)大量穩(wěn)定性高、特異性強(qiáng)的基因SNP位點(diǎn),可為馨香玉蘭的保護(hù)遺傳學(xué)、譜系地理學(xué)及種群生態(tài)學(xué)等研究提供分子標(biāo)記。
選取云南省文山州西疇、麻栗坡及廣南的5個(gè)野生居群以及云南省昆明市金殿公園、昆明植物園的2個(gè)栽培居群共70份馨香玉蘭資源為實(shí)驗(yàn)材料(表1)。采集其無(wú)病斑的新鮮葉片,用硅膠干燥。每個(gè)居群采集10個(gè)個(gè)體,個(gè)體間距離不低于10 m。
表1 7個(gè)馨香玉蘭居群的地理位置和取樣情況
采用改進(jìn)的CTAB法[21]提取馨香玉蘭樣品的基因組DNA,用NanoDrop 1000分光光度計(jì)評(píng)估所得DNA的濃度和質(zhì)量,并使用2%SDS-PAGE顯示結(jié)果;然后將DNA樣品稀釋至100 ng/μL,用于隨后的SLAF-seq技術(shù)分析。
由于馨香玉蘭的基因組數(shù)據(jù)尚未有研究,因此無(wú)法確定其基因組結(jié)構(gòu)大小及GC濃度等相關(guān)信息。本研究對(duì)70個(gè)馨香玉蘭個(gè)體分別進(jìn)行建庫(kù)處理。首先選取近緣種鵝掌楸(Liriodendronchinense)基因組(ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/003/013/855/GCA_003013855.1_ASM301385v1/GCA_003013855.1_ASM301385v1_genomic.fna.gz)作為參考基因組進(jìn)行酶切預(yù)測(cè)(鵝掌楸基因組大小為1.56 Gb、GC含量為39.06%),然后利用RsaI+EcoRV-HF?限制性內(nèi)切酶組合進(jìn)行酶切,對(duì)獲得的酶切片段(SLAF標(biāo)簽)進(jìn)行3′端加A處理、連接Dual-index[22]測(cè)序接頭、PCR擴(kuò)增、純化、混樣、切膠選取目的片段,經(jīng)文庫(kù)質(zhì)檢合格后用Illumina平臺(tái)完成檢測(cè)。
經(jīng)文庫(kù)質(zhì)檢合格后用Illumina HiSeqTM2500進(jìn)行測(cè)序。測(cè)序后獲得的序列通過(guò)去接頭、去低質(zhì)量閱讀框和去污處理方法,最后獲得到干凈序列。為充分保證評(píng)估后本次酶切實(shí)驗(yàn)結(jié)果的正確性,采用粳稻(Oryzasativassp.japonica)作為酶切實(shí)驗(yàn)結(jié)果對(duì)照,進(jìn)行了相同的數(shù)據(jù)處理參與建庫(kù)和測(cè)序。為有效保證每個(gè)樣本序列測(cè)序的數(shù)據(jù)質(zhì)量,對(duì)測(cè)序后所得的樣品序列數(shù)據(jù)進(jìn)行GC比例和Q30數(shù)據(jù)分析。
利用BWA軟件[23]將序列測(cè)序reads比對(duì)在不同參考基因組上,統(tǒng)計(jì)不同序列染色體上的SLAF標(biāo)簽和多態(tài)性SLAF標(biāo)簽。按照不同序列之間的相識(shí)程度,對(duì)不同馨香玉蘭樣本的序列進(jìn)行比對(duì)聚類,最后聚集在一起的reads來(lái)源于同一個(gè)SLAF標(biāo)簽,不同SLAF標(biāo)簽間的相似度相對(duì)于同一SLAF標(biāo)簽在不同樣品間的序列相似度較低。一個(gè)SLAF標(biāo)簽的不同樣品間序列有差異(即有多態(tài)性),被稱之為多態(tài)性SLAF標(biāo)簽。通常使用GATK[24]和SAMTOOLS[25]兩種篩選方法可以組合開(kāi)發(fā)出SNP,將兩種篩選方法結(jié)合得出的SNP標(biāo)記交集作為最終正確的SNP標(biāo)記數(shù)據(jù)集,篩選的標(biāo)準(zhǔn)值為MAF>0.05。
電子酶切預(yù)測(cè)以鵝掌楸為參考基因組,采用組合限制性內(nèi)切酶RsaI+EcoRV-HF?進(jìn)行酶切,將酶切片段為414~464 bp的序列定義為SLAF標(biāo)簽,共得到127 393個(gè)SLAF酶切標(biāo)簽(表2)。通過(guò)對(duì)粳稻檢測(cè)數(shù)據(jù)的評(píng)估監(jiān)控,從而判斷酶切方法的有效性。粳稻基因組大小為374.30 Mb,并通過(guò)SOAP[26]軟件將粳稻的測(cè)序reads與其參考基因組進(jìn)行比對(duì),比對(duì)后的結(jié)果見(jiàn)表3。經(jīng)比對(duì),雙端比對(duì)效率在90.39%(一條序列兩端在參考基因組上的比對(duì)跨度介于500~1 000 bp的reads占總數(shù)的比例),比對(duì)效率基本正常。樣品測(cè)序堿基分布情況見(jiàn)圖1。
表2 酶切預(yù)測(cè)確定的酶切方案信息統(tǒng)計(jì)
表3 粳稻測(cè)序reads比對(duì)結(jié)果統(tǒng)計(jì)
圖1 馨香玉蘭測(cè)序堿基分布
酶切效率是簡(jiǎn)化基因組測(cè)序是否成功的關(guān)鍵性指標(biāo)?;蜉d體上的結(jié)構(gòu)區(qū)域(如環(huán)狀結(jié)構(gòu)域、連續(xù)酶切位點(diǎn)等)復(fù)雜、基因組DNA樣品純度較低、酶切綜合利用持續(xù)時(shí)間短和質(zhì)量水平不足等這些客觀因素均有可能直接地影響限制性內(nèi)切酶的活力,從而造成酶切位點(diǎn)識(shí)別不準(zhǔn)確而未能完全切開(kāi)。根據(jù)reads插入片段中剩余酶切位點(diǎn)的具體檢測(cè)結(jié)果比例進(jìn)行測(cè)算,其比例越高,酶切效率越好[27]。粳稻數(shù)據(jù)的酶切效率統(tǒng)計(jì)結(jié)果見(jiàn)表4。粳稻對(duì)照組的酶切效率為91.46%,表明酶切反應(yīng)正常。90.39%的雙端比對(duì)效率和91.46%的酶切效率說(shuō)明SLAF建庫(kù)正常。
表4 粳稻數(shù)據(jù)酶切效率評(píng)估統(tǒng)計(jì)
通過(guò)對(duì)照雙端比對(duì)序列在基因組中的定位,可以估算SLAF標(biāo)簽的實(shí)際長(zhǎng)度,并繪制對(duì)照讀長(zhǎng)插入片段的長(zhǎng)度分布圖(圖2),從而估計(jì)實(shí)際的片段選擇范圍。序列的插入片段長(zhǎng)度都在預(yù)期的選擇范圍之內(nèi)(圖2),說(shuō)明序列測(cè)序數(shù)據(jù)質(zhì)量正常,采用的這種測(cè)序分析方法可信度高[28]。
圖2 對(duì)照序列插入片段分布
為提高綜合分析的結(jié)果質(zhì)量,以讀長(zhǎng)100 bp×2 的數(shù)據(jù)作為后續(xù)的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行綜合評(píng)估,以粳稻的數(shù)據(jù)為參考評(píng)估馨香玉蘭資料庫(kù)的數(shù)據(jù)準(zhǔn)確性。通過(guò)Illumina HiSeqTM2500平臺(tái)測(cè)序,總共得到了229.54 Mb reads的數(shù)據(jù)(表5),在各個(gè)實(shí)驗(yàn)樣本中所統(tǒng)計(jì)得到的數(shù)據(jù)讀長(zhǎng)長(zhǎng)度值的范圍為1 499 485~7 274 846個(gè)。其中:來(lái)自昆明金殿的JD4樣本所獲得數(shù)據(jù)量最大,為7 274 846個(gè)讀長(zhǎng);西疇縣對(duì)門山的DM7樣本數(shù)據(jù)量最小,為1 499 485個(gè)讀長(zhǎng)。樣本測(cè)序所獲得的GC比例為41.5%~44.38%,其中GC比例的最大值44.38%為來(lái)自廣南縣的GN7樣本、GC比例的最小值41.5%為來(lái)自西疇縣竜樹(shù)山的LS7樣本、GC比例的平均值為43.01%。由此可見(jiàn),GC比例普遍較低,說(shuō)明已達(dá)到測(cè)序條件。測(cè)序質(zhì)量值 Q30 的范圍為78.54%~93.22%,平均值為86.96%。其中:Q30測(cè)序的最小值來(lái)自于麻栗坡縣小箐的XQ2樣本,其值僅為78.54%;來(lái)自于昆明植物園的KIB9樣本的Q30測(cè)序值最大,為93.22%,每個(gè)樣本的Q30值都在70%以上。表明測(cè)序技術(shù)的堿基錯(cuò)誤率非常低,所獲數(shù)值均合格。
通過(guò)序列分析,從70份馨香玉蘭樣本的基因組中共獲得843 082個(gè)SLAF標(biāo)簽。標(biāo)簽的平均測(cè)序深度約是11.78 ×(表5),其中多態(tài)性SLAF的標(biāo)簽有287 843個(gè)。對(duì)獲得的多態(tài)性SLAF標(biāo)簽進(jìn)行分析,共得到2 998 167個(gè)馨香玉蘭群體SNP標(biāo)記,各樣品中SNP標(biāo)記數(shù)量為476 062~1 392 468個(gè),各樣品檢測(cè)到的SNP完整度為15.87%~46.44%、雜合率為3.42%~10.69%。篩選去除完整度≤50%以及次要基因頻率≤5%的SNP,總共獲得了180 650個(gè)高度一致性的群體SNP位點(diǎn),占SNP總量的6.03%。
表5 馨香玉蘭SLAF標(biāo)簽統(tǒng)計(jì)和SNP 信息統(tǒng)計(jì)及對(duì)照測(cè)序結(jié)果
續(xù)表5
基于180 650個(gè)高質(zhì)量SNP位點(diǎn),對(duì)馨香玉蘭5個(gè)野生居群及2個(gè)栽培居群進(jìn)行遺傳多樣性檢測(cè)(表6)。結(jié)果顯示:7個(gè)馨香玉蘭群體的觀測(cè)雜合度(Ho)范圍在0.136 3~0.355 1之間,其中最高的是XQ群體,最低的是JD群體;期望雜合度(He)的范圍在0.296 1~0.357 4之間,其中最高的是KIB群體,最低的是GN群體;Shannon指數(shù)(I)的范圍在0.455 3~0.535 9之間,其中最大值是KIB群體為0.535 9,最小值是GN群體為0.455 3;Nei多樣性指數(shù)的范圍在0.312 6~0.386 3之間,其中最大值是KIB群體為0.386 3,最小值為GN群體為0.312 6。7個(gè)馨香玉蘭群體在群體水平上都具有較為豐富的遺傳多樣性,其中KIB群體的遺傳多樣性水平相對(duì)較高,GN群體的遺傳多樣性水平相對(duì)較低。KIB為栽培居群,其遺傳多樣性指數(shù)相對(duì)處于較高水平,推測(cè)其個(gè)體可能來(lái)源于不同的野生居群。
表6 馨香玉蘭的遺傳多樣性指數(shù)
目前,我國(guó)在極小種群野生植物保育方面已做了大量工作,云南省在極小種群野生植物保育方面的成績(jī)尤為突出。隨著記錄了云南101種極小種群野生植物的主要識(shí)別特征、分布現(xiàn)狀、受威脅因素和主要保護(hù)建議等信息的圖書——《云南省極小種群野生植物保護(hù)名錄(2021版)》[29]的出版發(fā)行,將更進(jìn)一步地促進(jìn)云南極小種群野生植物的保育工作。隨著測(cè)序技術(shù)的發(fā)展,傳統(tǒng)的分子標(biāo)記已無(wú)法滿足研究需求,越來(lái)越多的研究者開(kāi)始采用高通量測(cè)序技術(shù)來(lái)進(jìn)行極小種群的保護(hù)遺傳學(xué)研究。馬永鵬等[30]為弄清漾濞槭(Aceryangbiense)極小種群的形成與維持機(jī)制,更好地指導(dǎo)保護(hù)工作,對(duì)漾濞槭105個(gè)個(gè)體開(kāi)展了重測(cè)序,從遺傳分化、基因流、遺傳多樣性、種群歷史、有害突變和近交等方面對(duì)漾濞槭進(jìn)行了深入研究。楊豐懋等[31]對(duì)顯脈木蘭(Magnoliafistulosa)進(jìn)行dd-RAD簡(jiǎn)化基因組測(cè)序,對(duì)顯脈木蘭的遺傳多樣性,種群歷史及第四紀(jì)冰期的有效居群大小等進(jìn)行了研究,對(duì)顯脈木蘭提出了精確保護(hù)策略。由此可見(jiàn),使用高通量測(cè)序深層次挖掘物種的遺傳多樣性、種群結(jié)構(gòu)及歷史、有害突變等信息具有明顯的優(yōu)勢(shì)。
馨香玉蘭基因組龐大而復(fù)雜,目前尚無(wú)全基因組序列信息公開(kāi),開(kāi)發(fā)傳統(tǒng)分子標(biāo)記耗時(shí)耗力,不能滿足馨香玉蘭保護(hù)遺傳學(xué)研究需求。因此,本實(shí)驗(yàn)運(yùn)用SLAF-seq技術(shù)對(duì)該物種的特異性分子標(biāo)記進(jìn)行開(kāi)發(fā),并對(duì)其遺傳多樣性參數(shù)進(jìn)行分析,結(jié)果顯示這些SNP標(biāo)記在馨香玉蘭不同群體中表現(xiàn)出較為豐富的多態(tài)性,與金蕊等[9]利用RAPD技術(shù)對(duì)馨香玉蘭進(jìn)行遺傳多樣性測(cè)定的結(jié)果(Shannon指數(shù)為0.568 6、Nei’s指數(shù)為0.390 3)相比,本研究得到的遺傳多樣性指數(shù)稍低,因?yàn)镽APD技術(shù)的穩(wěn)定性較差,是顯性遺傳,不能識(shí)別雜合子位點(diǎn),這使得遺傳分析相對(duì)復(fù)雜,在遺傳多樣性計(jì)算時(shí)會(huì)因顯性遮蓋作用而使計(jì)算位點(diǎn)間遺傳距離的準(zhǔn)確性下降,而使用SLAF-seq,穩(wěn)定性和準(zhǔn)確性較高。
馨香玉蘭被列為第一批極小種群物種,但跟其它木蘭科植物相比,如大果木蓮(M.grandis)[32](I=0.365 1,H=0.243 3)、樂(lè)昌含笑(Micheliachapensis)[33](I=0.475 1,H=0.325 5)等,其遺傳多樣性水平卻相對(duì)較高(I=0.5069,H=0.355 3)。這說(shuō)明馨香玉蘭雖然片段化明顯,僅剩的種群小,但仍具有較強(qiáng)的生存力,導(dǎo)致其瀕危的原因可能是外界環(huán)境的因素,如生存環(huán)境惡劣,上層喬木搶奪生存資源[33],而不是由物種本身遺傳多樣性單一導(dǎo)致。本研究探索利用SLAF-seq開(kāi)發(fā)分子標(biāo)記,既可為馨香玉蘭未來(lái)的種群結(jié)構(gòu)、遺傳進(jìn)化與種群演化歷史等提供高質(zhì)量的分子標(biāo)記,同時(shí)也可為馨香玉蘭分子輔助選育、高密度遺傳連鎖圖譜的建立等方面提供參考。