楊 永,楊 智,段一凡,方炎明
(南京林業(yè)大學(xué)生物與環(huán)境學(xué)院,江蘇 南京 210037)
樹木學(xué)(dendrology)是研究樹木的分類、地理分布、生物學(xué)和生態(tài)學(xué)特性的學(xué)科[1]。樹木學(xué)源于植物分類學(xué),傳承久遠(yuǎn),歷經(jīng)人為分類、自然分類和系統(tǒng)發(fā)生分類3個時期[2]。達(dá)爾文于1859年在其劃時代的巨著《物種起源》一書中創(chuàng)造性地提出物種來自物種,物種之間曾經(jīng)有共同祖先,所有生物都有一個共同祖先[3]。系統(tǒng)發(fā)生是由共同祖先開始,物種不斷分化形成一棵繁茂的生命之樹(Tree of Life),以此為基礎(chǔ)形成了地球上復(fù)雜的生物多樣性。自達(dá)爾文以來,人們追求按演化關(guān)系或親緣關(guān)系來進(jìn)行分類[2]。因此,重建系統(tǒng)發(fā)生或生命之樹一直是進(jìn)化生物學(xué)研究最重要、最核心的問題,生命之樹也是樹木學(xué)研究和樹木資源利用的重要基礎(chǔ)。
樹木學(xué)是一門不斷發(fā)展、高度綜合的學(xué)科。形態(tài)學(xué)、解剖學(xué)、細(xì)胞學(xué)、孢粉學(xué)、植物化學(xué)、化石等都是揭示系統(tǒng)發(fā)生關(guān)系的重要證據(jù)和數(shù)據(jù)來源[2]。但是,由于平行演化或趨同,使得利用這些特征得出的系統(tǒng)發(fā)生關(guān)系之間存在一些爭論,甚至,由于不同的研究人員所強(qiáng)調(diào)的特征的重要性不同,而得出不同的結(jié)論。裸子植物松柏類各個科的劃分和彼此之間的系統(tǒng)發(fā)生關(guān)系存在長期爭論,如鄭萬鈞等[4]、Arnold[5]、Chamberlain[6]、Fu等[7]、Keng[8]、Pilger[9]、Pilger & Melchior[10]多項研究的討論,焦點在于對銀杏(Ginkgobiloba)、非典型球果的羅漢松科(Podocarpaceae)和紅豆杉科(Taxaceae)以及買麻藤類的處理上[11]。銀杏是種子植物一條獨特的傳代線,其船形花粉和具鞭毛的精子與蘇鐵類相似,而枝性生胚珠長梗被認(rèn)為與松柏類的枝性種鱗有共同來源,單軸分枝方式和密木型木材支持銀杏與松柏類更為近緣[12-15]。基于形態(tài)特征建立的被子植物分類系統(tǒng)就有恩格勒系統(tǒng)、哈欽松系統(tǒng)、塔赫他間系統(tǒng)、索恩系統(tǒng)和達(dá)格瑞系統(tǒng)等,這些系統(tǒng)對被子植物的祖先群、現(xiàn)代類群的原始群以及科的親緣關(guān)系都存在不同意見[16-18]。新技術(shù)的發(fā)展為解決這些爭論提供了新的解決方案。
以DNA測序為基礎(chǔ)的分子系統(tǒng)學(xué)作為獨立的證據(jù),可以檢驗基于其他學(xué)科證據(jù)所得出的結(jié)論。自20世紀(jì)90年代以來,聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reaction, PCR)和一代桑格測序技術(shù)使得人們可以利用DNA序列進(jìn)行系統(tǒng)發(fā)生重建,促進(jìn)了植物分類學(xué)的發(fā)展,提出了APG系統(tǒng)[19]。一代測序通過設(shè)計引物和PCR擴(kuò)增目標(biāo)序列,并進(jìn)行測序。但是,一代測序在兩個方面受到限制:一是需要耗費(fèi)大量人力、物力和時間去野外或植物園采集新鮮材料或者是硅膠快速干燥的樣品[20],使得系統(tǒng)發(fā)生重建中物種代表性較低;二是過去常用于建樹的序列非常有限,如nrITS、matK、rbcL、trnL-trnF、psbA-trnH等,導(dǎo)致很多類群的系統(tǒng)發(fā)生樹問題尚未解決。
解決物種取樣問題和提高分辨率是系統(tǒng)發(fā)生重建的關(guān)鍵。二代測序(或新一代測序,next-generation sequencing,簡稱NGS)是一個技術(shù)革命,解決了利用標(biāo)本進(jìn)行基因組測序的技術(shù)瓶頸。它將基因組DNA序列打成短片段建庫,在片段兩端加標(biāo)簽后測序,再利用生物信息學(xué)技術(shù)拼接序列[21]。二代測序技術(shù)極大地拓展了DNA序列的使用深度,使得很多功能已知或未知的DNA序列均可用于系統(tǒng)發(fā)生重建。不僅如此,二代測序還很好地拓展了材料的使用。標(biāo)本是保存在全球標(biāo)本館中分類學(xué)知識的重要憑證,全球物種及其分布幾乎都有對應(yīng)的館藏標(biāo)本。全球3 400個標(biāo)本館,館藏超過3.9億份標(biāo)本(Index Herbariorum, http://sweetgum.nybg.org/science/ih/),這是分類學(xué)研究的重要資源庫。由于標(biāo)本制作過程中的高溫處理和保存過程中DNA的氧化等原因,使得標(biāo)本中的DNA降解嚴(yán)重,通常長度為50~200 bp。一代測序無法對破碎DNA片段進(jìn)行擴(kuò)增和測序,因此,難以利用標(biāo)本材料[22-23]。利用二代測序技術(shù),標(biāo)本材料所含破碎DNA無需被打斷即可建庫和測序,可以充分利用標(biāo)本材料來增加物種取樣。因此,二代測序技術(shù)的發(fā)展使得以前不能使用的研究材料也變得可以利用,且能夠獲取的序列數(shù)據(jù)量更大,從而在足夠的物種取樣和改進(jìn)系統(tǒng)發(fā)生樹的分辨率兩個方面對提升樹木分類研究有著巨大的促進(jìn)作用。
標(biāo)本組學(xué)(herbariomics/museomics)是近年發(fā)展起來的新方法,它基于二代測序技術(shù),可充分利用標(biāo)本材料,對標(biāo)本材料中的基因組DNA進(jìn)行建庫和測序,以獲得系統(tǒng)發(fā)生重建所需的大量序列[24-25]。生物信息學(xué)方法是基因組時代序列拼接和分析的重要方法。對標(biāo)本進(jìn)行基因組測序后,原始測序數(shù)據(jù)用Trimmomatic和FastQC等軟件進(jìn)行質(zhì)控和清理,生成有效數(shù)據(jù)(clean data);使用GetOrganelle[26]、NOVOPlasty[27]和HybPiper[28]程序包對序列進(jìn)行拼接;拼接好的序列就可以用于系統(tǒng)發(fā)生分析和研究。理論上,采用標(biāo)本組學(xué)可以獲得全基因組的序列數(shù)據(jù),因此,完全可以獲得滿足系統(tǒng)發(fā)生研究的DNA序列[21,25]。大量的研究也已經(jīng)表明,從標(biāo)本中獲取基因組DNA序列可行,能滿足系統(tǒng)發(fā)生重建的需要[29-31]。
相比于利用新鮮材料或硅膠干燥材料的一代測序和轉(zhuǎn)錄組等方案,標(biāo)本組學(xué)因可以使用標(biāo)本材料獲取基因組DNA而有著明顯的優(yōu)勢(表1)。第一,可獲得序列數(shù)據(jù)量大。一代測序獲得的nrITS、matK、psbA-trnH、rbcL等常規(guī)片段數(shù)據(jù)較少,這些序列對解決一些類群的系統(tǒng)發(fā)生分辨率不夠。標(biāo)本組學(xué)可以獲得基因組數(shù)據(jù),即使測序深度很低的情況下,都可以獲取高拷貝序列如nrITS、葉綠體基因組和線粒體基因組等序列[25,32]。適當(dāng)增加測序深度,甚至可以獲得單拷貝核基因序列[33]。第二,充分利用標(biāo)本材料可以增加物種取樣量。過去400多年來,全球植物學(xué)家采集了大量的標(biāo)本,成為目前植物物種多樣性知識的重要憑證材料,這些材料的利用幾乎可以實現(xiàn)已知物種的全面取樣,甚至包括那些野外已經(jīng)絕滅或者是極度瀕危且已經(jīng)被嚴(yán)格保護(hù)而無法取樣的物種都可以從標(biāo)本材料中獲得[24]。第三,利用標(biāo)本材料可以節(jié)約大量的研究時間,縮短研究周期。一代測序時期,依賴于新鮮材料和野外硅膠干燥葉片,研究人員通常需要花費(fèi)大量的時間去收集樣品。標(biāo)本組學(xué)使得標(biāo)本材料能用于獲取DNA序列,從標(biāo)本上收集材料可以短時間獲取大量樣品,同時,從標(biāo)本材料上取樣也可以節(jié)約野外采集成本,因此,標(biāo)本組學(xué)的應(yīng)用將大大降低野外采集樣品所需要的人力、財力資源,還可以節(jié)省大量時間。第四,利用標(biāo)本材料可以獲得較為準(zhǔn)確的物種鑒定。野外采集的材料只有經(jīng)過鑒定之后才能被用于研究,而鑒定物種常常需要依賴分類學(xué)專家。館藏標(biāo)本在過去400多年經(jīng)過很多分類學(xué)專家的研究和鑒定,甚至被專著和修訂的論文所引證,物種準(zhǔn)確率更為可信。因此,標(biāo)本組學(xué)完全稱得上是低成本、省時間、高效率、準(zhǔn)確度高的好方法。
表1 標(biāo)本組學(xué)與一代測序、擴(kuò)增子測序、淺層測序、轉(zhuǎn)錄組測序、簡化基因組和靶序列捕獲技術(shù)的比較(修改自Yu等[36])
實際工作中,研究人員可以按照實際需求,將標(biāo)本組學(xué)結(jié)合淺層測序(genome skimming)和靶序列捕獲(targeted sequence capture)等技術(shù)來獲取目標(biāo)DNA序列。淺層測序技術(shù)是對基因組進(jìn)行低深度測序獲得基因組DNA的技術(shù),通常用來獲得葉綠體基因組、線粒體基因組和核糖體DNA等細(xì)胞中的高拷貝DNA序列[23,34]。標(biāo)本組學(xué)結(jié)合淺層測序技術(shù)可以從標(biāo)本材料中獲得葉綠體基因組和nrITS等序列,這些序列已經(jīng)可以解決大部分研究問題,滿足進(jìn)化樹構(gòu)建和超級DNA條形碼研究的需要。靶序列捕獲是通過設(shè)計進(jìn)化上比較保守的外顯子序列的探針,利用探針從基因組DNA建庫樣品中捕獲基因及其兩端的非保守序列(圖1),這些序列不僅包含了進(jìn)化速率較慢的保守區(qū),還包含了進(jìn)化速率較快的保守區(qū)兩端的非編碼序列,因此,完全可以滿足系統(tǒng)發(fā)生重建的需要[35-36]。結(jié)合淺層測序和靶序列捕獲獲得葉綠體基因組和單拷貝核基因序列,如Hyb-Seq[37],甚至可以深度研究那些具復(fù)雜進(jìn)化歷史類群的系統(tǒng)發(fā)生和生物地理。
圖1 圖解靶序列捕獲技術(shù)原理
標(biāo)本組學(xué)在系統(tǒng)發(fā)生研究中的作用已經(jīng)逐漸顯現(xiàn)。Staats等[38]使用保存了43 a的擬南芥(Arabidopsisthaliana)標(biāo)本進(jìn)行測序,并且獲取了完整的核基因組數(shù)據(jù),這代表了首次基于標(biāo)本的被子植物核基因組序列。Bakker[22]對被子植物10科93種的標(biāo)本取樣,運(yùn)用淺層測序的方法成功獲取了74個樣品的葉綠體基因組,成功率達(dá)到了80%,標(biāo)本年齡最高可達(dá)到146 a,展現(xiàn)了運(yùn)用標(biāo)本組學(xué)進(jìn)行植物系統(tǒng)發(fā)生研究的可能性。基于標(biāo)本組學(xué)獲得的序列數(shù)據(jù)可以研究復(fù)雜進(jìn)化歷史,如對五加科鵝掌柴屬(Schefflera)[39]、金蓮木科(Orchnaceae)[40]研究。標(biāo)本組學(xué)也可以用于獲取線粒體基因組數(shù)據(jù),如Van de Paer等[41]利用一個已滅絕的木犀科單種屬爪瓣欖屬(Hesperelaea)唯一一份140 a的標(biāo)本,成功組裝了一個完整的線粒體基因組,以研究該屬的系統(tǒng)發(fā)生位置。這為難以獲取材料的珍稀瀕危物種的系統(tǒng)發(fā)生研究提供了案例。此外,靶序列捕獲的方法使得從標(biāo)本材料中提取大量的單拷貝核基因成為了可能[42-43],它已為金蓮木科(Orchnaceae)[44]、桑科菠蘿蜜屬(Artocarpus)[45]、大戟科大戟屬(Euphorbia)[46]和豆科印加屬(Inga)[47]等的系統(tǒng)發(fā)生重建提供了新的證據(jù)。靶序列捕獲技術(shù)還被運(yùn)用到了松屬(Pinus)中研究其不完全譜系分選和網(wǎng)狀進(jìn)化[46,48]。
標(biāo)本館是植物分類學(xué)和樹木學(xué)研究的重要基地[49]。標(biāo)本不僅記錄了植物的習(xí)性、形態(tài)、地理分布、物候等特征,而且作為實物憑證,可提供孢粉、微形態(tài)和結(jié)構(gòu),以及基因組研究的材料,對于系統(tǒng)學(xué)、生物地理學(xué)、生物多樣性、DNA條形碼、基因組學(xué)研究以及公眾科普教育均有不可替代的作用[50-51]。標(biāo)本及其衍生數(shù)據(jù)和產(chǎn)品應(yīng)用很多,標(biāo)本館甚至被稱為學(xué)術(shù)整合節(jié)點(academic nexes of integration),起著學(xué)科交匯和創(chuàng)新孵化器的作用[52]。16世紀(jì)意大利人哥亥尼發(fā)明了干標(biāo)本制作方法,他的學(xué)生茨博于1532年建立了植物學(xué)史上第一個植物標(biāo)本室[49]。標(biāo)本制作和標(biāo)本館的出現(xiàn)及發(fā)展使得植物分類學(xué)的發(fā)展變得可能。18—19世紀(jì),歐美等發(fā)達(dá)國家在全球收集了大量植物標(biāo)本,成為認(rèn)識全球植物物種多樣性的基礎(chǔ),同時也奠定了這些國家和機(jī)構(gòu)在全球植物分類學(xué)中的地位。我國自然科學(xué)研究起步較晚,20世紀(jì)初才開始,100余年當(dāng)中,收集植物標(biāo)本超過1 000余萬份[53],僅中國科學(xué)院植物研究所標(biāo)本館就館藏標(biāo)本280余萬份。基于這些標(biāo)本,我國植物學(xué)家完成了全球最大的國家植物志——《中國植物志》,還完成了英文版FloraofChina。但是,我國的館藏標(biāo)本基本上是采自我國地域范圍的標(biāo)本,對世界各地標(biāo)本收藏非常有限,對于分類學(xué)和樹木學(xué)研究來說還遠(yuǎn)遠(yuǎn)不夠,這也限制了新時期我國樹木學(xué)及相關(guān)學(xué)科的發(fā)展。
近年來,我國科學(xué)家前往南美洲、非洲和東南亞等地進(jìn)行植物標(biāo)本采集1 100余次,共采集標(biāo)本260余萬份[54]。這些標(biāo)本為我國研究人員編研境外植物志和相關(guān)類群的分類學(xué)研究提供了重要條件,如《肯尼亞植物志》《柬埔寨、老撾和越南植物志》[55]《An Inventory of Legume Species Diversity of Myanmar》[56]等。建立館藏全球物種的大標(biāo)本館,不僅為樹木學(xué)、生物多樣性、生物地理和資源利用等創(chuàng)造便利的研究條件,同時也在服務(wù)國家戰(zhàn)略、生物安全等方面發(fā)揮重要的支撐作用[57]。
標(biāo)本組學(xué)的研究打開了通向過去的窗戶,揭示了隱藏的歷史[58],現(xiàn)在正處于標(biāo)本組學(xué)時代的“黎明”時期[32]。在未來的幾年里,很有可能會因此獲得大量的植物標(biāo)本基因組數(shù)據(jù)[21]。這些新技術(shù)應(yīng)用和新數(shù)據(jù)的發(fā)掘,將極大地促進(jìn)樹木學(xué)和相關(guān)學(xué)科的研究,為全球植物資源的開發(fā)利用和物種保護(hù)研究提供更加強(qiáng)大的工具。不僅如此,DNA序列數(shù)據(jù)和系統(tǒng)發(fā)生研究方法已經(jīng)廣泛應(yīng)用于生態(tài)學(xué)、生物地理學(xué)、DNA條形碼等相關(guān)領(lǐng)域,標(biāo)本組學(xué)作為一種獲取數(shù)據(jù)的方法也為提升和改進(jìn)樹木學(xué)及相關(guān)學(xué)科的研究提供強(qiáng)有力的解決方案。