王 杰,賀文闖,向坤莉,武志強,3,顧翠花
(1.浙江農(nóng)林大學 風景園林與建筑學院 浙江省園林植物種質(zhì)創(chuàng)新與利用重點實驗室/南方園林植物種質(zhì)創(chuàng)新與利用國家林業(yè)和草原局重點實驗室,浙江 杭州 311300;2.中國農(nóng)業(yè)科學研究院 深圳農(nóng)業(yè)基因組研究所,廣東 深圳 518120;3.佛山鯤鵬現(xiàn)代農(nóng)業(yè)研究院,廣東 佛山 528200)
系統(tǒng)發(fā)育(phylogeny)的雛形最早出自達爾文在《物種起源》中手繪的代表物種進化關(guān)系的“生命之樹”。達爾文認為:地球上所有的生物都起源于一個共同的祖先,所有生命之間的譜系關(guān)系都可以通過生命之樹的“枝條”進行展示,無論是現(xiàn)存的還是已經(jīng)滅絕的生物,都可以在這棵樹上找到屬于自己的位置[1?2]。盡管生命形式多樣化,但不同生命之間擁有共同的祖先和進化歷史,因而存在著緊密或疏遠的聯(lián)系和淵源。開展進化生物學研究的重要前提之一就是要正確構(gòu)建和理解不同生物類群之間的親緣關(guān)系,這是界定和命名物種的依據(jù),也是開展其他生物學學科研究的理論基礎(chǔ)[3]。因此,如何通過建立科學可靠的系統(tǒng)發(fā)育樹,從而將各生物類群之間的親緣關(guān)系清晰形象地展示出來,不僅是系統(tǒng)發(fā)育研究的重點,也是解析生物類群起源擴散、性狀演化和成種機制的前提,是生物學研究的重要內(nèi)容[3]。
伴隨著測序技術(shù)的發(fā)展和測序成本的降低,不同物種的全部基因序列,即基因組數(shù)據(jù)能夠被獲取和研究,使得基因組學(genomics)得到了快速的發(fā)展,也使得大規(guī)模的分子數(shù)據(jù)集能夠被應用于系統(tǒng)發(fā)育學(phylogenetics)的研究領(lǐng)域,成為系統(tǒng)發(fā)育基因組學(phylogenomics)。對于大部分植物類群而言,除了2套半自主性遺傳的細胞器基因組?葉綠體基因組(chloroplast DNA,cpDNA)與線粒體基因組(mitochondrial DNA,mtDNA)外,遺傳信息龐大的核基因組(nuclear DNA,ncDNA)包含了大量的信息位點,因此,不同基因組數(shù)據(jù)集根據(jù)其自身特點能被整合應用于不同水平的植物類群系統(tǒng)發(fā)育學研究。本研究綜述了基因組時代植物系統(tǒng)發(fā)育基因組學研究進展,對不同基因組數(shù)據(jù)特征及其在植物系統(tǒng)發(fā)育研究應用中的前景和局限進行了探討,以期為研究植物系統(tǒng)發(fā)育關(guān)系提供參考。
在核苷酸序列和蛋白序列等分子證據(jù)被大規(guī)模開發(fā)和應用之前,早期的系統(tǒng)發(fā)育研究都是建立在化石記錄、物種形態(tài)學和生理學特征比較的基礎(chǔ)上,如花部結(jié)構(gòu)、果實類型、花粉性狀、葉片形狀及表皮解剖性狀等,從而構(gòu)建出物種進化歷史的主要框架[4?5],但這種方法極大依賴于生物學家自身對物種的認識和對不同分類特征的把握,無法得到客觀方法的有效驗證,也很難獲得統(tǒng)一的結(jié)論,不同學者之間的意見常有沖突。隨著分子DNA證據(jù)的不斷加入,系統(tǒng)發(fā)育研究能被程序化、可檢驗的分析方法所重建,極大提高了系統(tǒng)發(fā)育關(guān)系的穩(wěn)定性。相對于形態(tài)性狀,分子性狀具有可遺傳、容易確定同源性、系統(tǒng)發(fā)育信息豐富等優(yōu)點,因此,根據(jù)分子數(shù)據(jù)所建立的系統(tǒng)發(fā)育關(guān)系更能真實地反映類群的進化歷史[2]。分子數(shù)據(jù)用于系統(tǒng)發(fā)育研究同樣經(jīng)歷了從利用1,5-二磷酸核酮糖羧化酶/加氧酶大亞基(ribulose-1,5-bisphosphate carboxylase/oxygenase large subunit,rbcL)或成熟酶 K(maturase K,matK)等單個編碼基因以及細胞核內(nèi)轉(zhuǎn)錄間隔區(qū) (internal transcribed spacer,ITS)[6?7],到多基因或分子片段聯(lián)合[8?9],再到整合利用大規(guī)?;蚪M數(shù)據(jù)[10?12],即系統(tǒng)發(fā)育基因組學的發(fā)展過程。由于利用單基因或聯(lián)合少數(shù)基因所構(gòu)建的系統(tǒng)發(fā)育樹會受到信息位點不足、水平基因轉(zhuǎn)移(horizontal gene transfer,HGT)、旁同源基因(paralog)以及基因進化速率異質(zhì)性等因素的影響,缺乏高分辨率,因此全基因組數(shù)據(jù)成為更優(yōu)選擇,尤其是測序手段的發(fā)展和測序成本的降低使得越來越多的基因組資源被提供,系統(tǒng)發(fā)育研究也正式進入了基因組學的“黃金時代”。
系統(tǒng)發(fā)育基因組學是進化生物學領(lǐng)域中由系統(tǒng)發(fā)育學和基因組學交叉結(jié)合所形成的,研究個體間、群體間或物種間進化關(guān)系的學科,主要研究內(nèi)容不僅包括在基因組水平上用大規(guī)模的分子數(shù)據(jù)研究生物之間的系統(tǒng)發(fā)育關(guān)系,也可以反過來利用進化關(guān)系研究基因組的進化機制[3]。系統(tǒng)發(fā)育基因組學以包含生物所有遺傳信息的基因組為研究基礎(chǔ),利用不同類型的基因組(核基因組、線粒體基因組,以及植物中存在的葉綠體基因組)數(shù)據(jù)來構(gòu)建系統(tǒng)發(fā)育樹,以解析分類單元的系統(tǒng)發(fā)育關(guān)系,研究物種類群的進化歷史(表1)。由于基因組能提供更多的分子性狀,系統(tǒng)發(fā)育基因組學在解決疑難系統(tǒng)發(fā)育關(guān)系,如快速輻射類群的系統(tǒng)關(guān)系、孑遺類群的系統(tǒng)位置等應用廣泛。
表 1 基于不同基因組數(shù)據(jù)集的植物系統(tǒng)發(fā)育相關(guān)研究Table 1 Research on phylogenetics of plants based on various genome datasets
葉綠體(chloroplast)是植物細胞中特有的半自主細胞器,是植物進行光合作用將無機碳固定為有機碳的場所,同時承擔生物體內(nèi)脂類等有機物的合成與儲藏功能,為植物提供生命活動所需的基本物質(zhì),在植物生長中發(fā)揮十分重要的作用[28]。目前普遍被接受的內(nèi)共生起源學說認為:葉綠體起源于約12億年前古核生物吞噬的光合藍細菌,藍細菌通過內(nèi)共生將其絕大部分基因轉(zhuǎn)移到了宿主細胞內(nèi)[29]。雖然葉綠體擁有獨立的遺傳物質(zhì),但是由于大量基因轉(zhuǎn)移到古核生物細胞內(nèi),使其正常功能的行使需要依賴于大量的核編碼蛋白,因此葉綠體是一種半自主性細胞器[9]。葉綠體基因組以很高的拷貝數(shù)存在于植物細胞中,被子植物的葉綠體基因組大小通常為120~160 kb,編碼約110個基因,結(jié)構(gòu)上通常是雙鏈環(huán)狀DNA 分子,由大單拷貝區(qū) (large single-copy region,LSC)、小單拷貝區(qū) (small single-copy region,SSC)和1對反向重復區(qū)(inverted repeats,IRs)構(gòu)成,也存在少數(shù)的線性結(jié)構(gòu)和分支形等其他多態(tài)構(gòu)型[30]。同時,葉綠體基因組內(nèi)的基因數(shù)目和順序相對保守,且不容易發(fā)生重組,在大多數(shù)物種中又是單親遺傳(主要為母系遺傳),保留了很多進化歷史中的遺傳信息,使得其成為在系統(tǒng)發(fā)育研究中很有價值的分子工具,不僅僅是基因序列,其中一些結(jié)構(gòu)特征如反向重復區(qū)邊界滑動等在研究大尺度的進化上也具有系統(tǒng)發(fā)育的信號[31?32]。由于具有以上特點,葉綠體基因組已被當作研究遺傳變異的理想分子數(shù)據(jù)資源,廣泛應用于系統(tǒng)發(fā)育學和進化生物學等研究領(lǐng)域[12, 14, 33?34]。
研究者通過對不同物種的葉綠體基因組進行測序、組裝和注釋,從而得到完整的葉綠體基因組圖譜,并利用多序列比對方法獲得多物種的葉綠體基因組矩陣用于系統(tǒng)發(fā)育分析,為解決一些分類困難類群的系統(tǒng)發(fā)育關(guān)系提出了解決方案。ZHANG等[35]基于葉綠體基因組數(shù)據(jù)構(gòu)建了薔薇科系統(tǒng)發(fā)育樹,解析了薔薇科亞科間的系統(tǒng)發(fā)育關(guān)系;BARKALOV等[36]基于葉綠體基因組序列對蕨類植物系統(tǒng)發(fā)育關(guān)系進行解析,揭示了Equisetum是蕨類植物的基部群;LI等[14]利用來自2 881種物種的葉綠體基因組的80個直系同源(ortholog)的蛋白編碼基因,構(gòu)建了迄今為止最完備的被子植物系統(tǒng)發(fā)育樹,確認了被子植物8個主要分支和22個分支的系統(tǒng)框架,解決了諸多類群的歸屬問題;LI等[10]又利用來自4 792種開花植物的80個葉綠體直系同源基因,構(gòu)建了科級水平最為全面的開花植物系統(tǒng)發(fā)育樹,在爭議類群的系統(tǒng)發(fā)育關(guān)系解析上提供了更大的支持。此外,葉綠體基因組的一些基本特征,如基因含量、基因順序、內(nèi)含子有無、基因組大小、核苷酸組成和密碼子使用等也可在傳統(tǒng)分子系統(tǒng)發(fā)育基礎(chǔ)上提供一些重要的系統(tǒng)發(fā)育信息[37?38]。葉綠體上的一些結(jié)構(gòu)變化,特別是一些多基因倒置,雖比起序列信息具有較少的同源性,但同樣可以在一些難處理的系統(tǒng)發(fā)育問題中提供重要證據(jù)[39?40]。
線粒體(mitochondrion)同樣被認為是內(nèi)共生起源的一種半自主性細胞器,源于早期的α-古蛋白菌[41]。線粒體承擔細胞生命活動的能量供應,參與細胞內(nèi)的三羧酸循環(huán)、氧化磷酸化和磷脂合成等生物過程,具有十分重要的生理生化功能[42]。與葉綠體類似,線粒體也擁有獨立遺傳物質(zhì),能夠編碼部分與自身相關(guān)的蛋白,但仍要受到核編碼基因的調(diào)控。高等陸地植物的線粒體基因組一般包含50~60個基因,絕大部分是單親母系遺傳[43?44]。在高等植物中,線粒體基因組分子量比葉綠體基因組大,且變化范圍很大,從208 kb的油菜Brassica juncea[45]到大于2 400 kb的甜瓜Cucumis melo[46],再到目前已知最大的將近12 Mb的新疆落葉松Larix sibirica[47]。這種差異主要是由于線粒體蛋白質(zhì)編碼冗余(多拷貝)和線粒體基因組頻繁重組整合外源DNA導致的[48]。線粒體基因組的基因順序、基因組結(jié)構(gòu)和基因組大小在植物中是高度可變的[49]?!斑M化悖論”是植物線粒體的一個重要進化特征,即植物線粒體基因組序列突變率非常低,但其基因組結(jié)構(gòu)重排率卻很高[50?51]。植物線粒體基因組的序列進化非常緩慢,核苷酸同義替代速率比植物葉綠體與核基因組分別低了幾倍到幾十倍不等,比哺乳動物線粒體基因組甚至低了50~100倍[52]。部分物種線粒體的物理作圖和測序表明:線粒體的復雜結(jié)構(gòu)是通過自身主動重組基因轉(zhuǎn)移到細胞核,以及其他尚不清楚的因素來塑造的。結(jié)構(gòu)分析揭示了分子內(nèi)和分子間重組的高頻率,從而形成了基因組構(gòu)型的結(jié)構(gòu)動態(tài)組合。植物線粒體基因組的這種動態(tài)組合為基因組結(jié)構(gòu)和進化的研究提供了強有力的模型。這些線粒體基因組展示了保守的核苷酸替代速率和動態(tài)進化模式[53]。植物線粒體基因組在蛋白編碼基因等方面保守性高,但在基因組結(jié)構(gòu)方面變異大,對研究植物群體遺傳學和進化具有重要的意義[54]。
低等植物如藻類和苔蘚的線粒體基因組結(jié)構(gòu)相對簡單,而隨后早期的維管束植物如石松科Lycopodiaceae植物線粒體基因組就經(jīng)歷了大量的重排,但是仍然可以組裝成單分子的環(huán)形構(gòu)象,基因含量沒有太大變化。但水韭科Isoetaceae和卷柏科Selaginellaceae植物的線粒體基因組結(jié)構(gòu)則比較復雜,經(jīng)歷了大量的重排,丟失了很多基因尤其是轉(zhuǎn)運RNA(transfer RNA,tRNA)基因,也沒有穩(wěn)定的廣譜性構(gòu)象。這種由簡單趨向復雜的變異模式使得線粒體基因組通常用于高階分類單元的植物類群系統(tǒng)發(fā)育研究,如LIU等[21]利用60種苔蘚的41個線粒體基因重建了早期陸地植物間的系統(tǒng)關(guān)系。DONG等[20]基于91種被子植物代表物種的38個保守的線粒體基因進行系統(tǒng)發(fā)育分析,結(jié)果支持木蘭類(magnoliids)植物與單子葉植物+真雙子葉植物的姐妹群關(guān)系。一般而言,植物線粒體基因組因其進化速率較慢,在系統(tǒng)發(fā)育中應用較少,但線粒體基因組非常適合動物類群中的系統(tǒng)發(fā)育研究[55?56]。
在植物細胞的3套基因組中,核基因組占據(jù)主導地位,其遺傳信息總量十分龐大,決定著植物大部分的生理生化功能及形態(tài)性狀特征,蘊含豐富的遺傳變異。對于各植物類群,核基因組在大小、數(shù)量、排列以及基因組的拷貝數(shù)等方面均存在較大差異,如擬南芥Arabidopsis thaliana的基因組大小約130 Mb,油菜基因組大小1 008 Mb,而貝母屬Fritillaria物種基因組大小則達100 Gb[57]。此外,核基因組為雙親遺傳,可綜合揭示雙親譜系及系統(tǒng)網(wǎng)狀進化關(guān)系,即使對于近緣種或種下類群,核基因組也具有一定的區(qū)分能力,因此,核基因組在系統(tǒng)發(fā)育研究中具有更大的應用潛力,是未來植物系統(tǒng)學研究的主要發(fā)展方向[2, 58?59]。
盡管細胞器基因組(cpDNA和mtDNA)對于各植物類群的系統(tǒng)發(fā)育研究有重要的價值,但同樣也是受限于其自身的單親遺傳特性,只能體現(xiàn)單親的譜系歷史,在一些類群的系統(tǒng)發(fā)育研究中作用相對有限[60],因此包含雙親大量遺傳信息的核基因組在一些類群的系統(tǒng)發(fā)育研究中價值更大。但核基因組的測序和組裝的技術(shù)要求較高,且核基因組數(shù)據(jù)龐大,對于計算機運算能力要求高,同時由于物種核基因組復雜的遺傳背景和遺傳特性,合適可靠的建樹方法也是限制其大規(guī)模應用于系統(tǒng)發(fā)育研究的重要因素。目前,基于核基因組的系統(tǒng)發(fā)育研究不僅集中在解析單個物種或特定類群的系統(tǒng)位置[61],對于更高類群系統(tǒng)發(fā)育關(guān)系的解析也逐漸豐富,如金粟蘭Chloranthus spicatus[62]、睡蓮Nymphaea tetragona[63]等早期被子植物類群的核基因組解決了基部類群系統(tǒng)發(fā)育關(guān)系和物種演化的爭議[23]。早期核糖體RNA(ribosomal RNA,rDNA)內(nèi)的重復區(qū)序列尤其是ITS序列作為植物系統(tǒng)發(fā)育研究的主要核基因組數(shù)據(jù)被廣泛使用[64]。隨后越來越多的研究者開始使用單拷貝或低拷貝核基因。與細胞器基因組相比,單拷貝核基因不僅數(shù)量較多,還含有相對保守的外顯子以及較高堿基替換率的內(nèi)含子,可以提供較為豐富的位點變異信息[65]。除基因組測序外,基于轉(zhuǎn)錄組(transcriptome)、基因組淺層(genome skimming)測序、靶向富集 (target enrichment)和簡化基因組測序 (reduced-representation genome sequencing,RRGS)等技術(shù)數(shù)據(jù)獲得的大量低拷貝或單拷貝基因,也可以為系統(tǒng)發(fā)育分析提供更加充足的信息位點[16]。單拷貝核基因或低拷貝核基因是指核基因組中僅有1份或少數(shù)拷貝的基因,可以有效避免旁系同源的干擾。轉(zhuǎn)錄組測序數(shù)據(jù)可以通過無參組裝一次性獲得批量直系同源序列(orthologous sequences),因而在種及種以上水平的系統(tǒng)發(fā)育基因組學研究中被越來越多地應用[66]。例如“千種植物轉(zhuǎn)錄組計劃(1kP)”利用轉(zhuǎn)錄組獲得同源低拷貝基因來推斷綠色植物的系統(tǒng)發(fā)育關(guān)系,對不同植物類群的全基因組加倍(whole genome duplication, WGD)事件進行分析,推斷了許多基因家族進化歷史[67]。劉勉等[68]從29種物種的轉(zhuǎn)錄組數(shù)據(jù)中篩選出直系同源低拷貝核基因,對菊科Asteraceae紫菀亞科Asteroideae的系統(tǒng)發(fā)育關(guān)系進行研究,重新界定了新的紫菀亞科族間系統(tǒng)發(fā)育關(guān)系,并揭示了多個類群雜交起源的可能性。
目前主流的建樹算法主要包括鄰接法 (neighbor joining, NJ)、最大簡約法 (maximum parsimony, MP)、最大似然法 (maximum likelihood, ML)和貝葉斯推斷法 (bayesian inference, BI)。鄰接法基于最小進化距離的假設,常用于群體水平上基于單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)或單核苷酸變異(single nucleotide variant, SNV)的遺傳結(jié)構(gòu)劃分,如水稻Oryza sativa[69]、大豆Glycine max[70]、蓮Nelumbo nucifera[12]、梅花Prunus mume[71]等,鮮少獨立支撐物種以上水平進化關(guān)系為核心的系統(tǒng)發(fā)育研究。最大簡約法基于進化過程中堿基替代數(shù)目最少這一假設,適用于序列堿基差異小、變異速率近似、信息位點較多的序列矩陣。AMAR等[72]基于ITS序列,通過最大簡約法探討了柑橘屬Citrus的系統(tǒng)發(fā)育關(guān)系,將柑橘屬解析為7個進化枝。無論鄰接法還是最大簡約法,都比較適用于較小的數(shù)據(jù)集,且由于遵循“最小最簡”原則,因此當存在堿基替換飽和、回復突變或序列差異過大時,有可能產(chǎn)生如長枝吸引(long branch attraction, LBA)的問題,從而錯誤地將枝長較長的進化枝聚在一起。SOLTIS等[73]在利用最大簡約法對被子植物的系統(tǒng)發(fā)育關(guān)系構(gòu)建時發(fā)現(xiàn):無油樟Amborella trichopoda被錯誤地解析為比單子葉植物距離核心真雙子葉植物更近的分支,但通過增加蘭科Orchidaceae植物作為外類群后則恢復到了正常位置,指出可以通過增加合適的外類群來打破長枝吸引現(xiàn)象。最大似然法是目前為止應用最為廣泛的系統(tǒng)發(fā)育研究方法,在解決被子植物[10]、裸子植物[74]以及科屬水平[11?12, 34]等不同階元的進化關(guān)系中發(fā)揮重要作用。上述3種方法都需要通過自舉法(bootstrap)進行檢驗以確保分支可信度。
貝葉斯推斷法[75]是基于模型的統(tǒng)計推論法,可以處理復雜的進化模型,通過后驗概率(post probability)直觀反映出各分支的可靠程度,而不需要通過自舉法進行檢驗。在系統(tǒng)發(fā)育研究中,通常會綜合使用多種建樹方法推定系統(tǒng)發(fā)育關(guān)系,如WU 等[76]使用葉綠體基因組數(shù)據(jù),基于最大似然法和最大簡約法對禾本科中竹亞科Bambusoideae、稻亞科Oryzoideae和早熟禾亞科Pooideae分支(BEP Clade)的系統(tǒng)發(fā)育關(guān)系進行解析,得到了2種方法的一致支持;MU等[16]基于最大似然法和貝葉斯推斷法明確了胡桃科物種的系統(tǒng)發(fā)育位置和種間關(guān)系。
目前大部分系統(tǒng)發(fā)育基因組學,尤其是葉綠體系統(tǒng)發(fā)育基因組學研究采用的矩陣構(gòu)建方法是多基因串聯(lián)法(concatenate method),即將多個基因首尾串聯(lián)后經(jīng)過序列比對和處理后構(gòu)建數(shù)據(jù)矩陣,利用相應的建樹軟件構(gòu)建系統(tǒng)發(fā)育樹[34, 65]。盡管串聯(lián)法在許多類群中取得了較好的效果,但在一定程度上仍會由于信息量不足而無法反映真實的系統(tǒng)發(fā)育關(guān)系。基因間的GC含量差異、進化速率差異、堿基替換飽和度等系統(tǒng)偏差也會導致一系列問題,從而對最終建樹結(jié)果產(chǎn)生影響甚至誤導[30]。此外,當使用大量基因進行串聯(lián)時,基因間進化速率異質(zhì)性和直系同源的誤判、不完全譜系分選(incomplete lineage sorting,ILS)等會導致基因包含的系統(tǒng)發(fā)育信號彼此存在沖突,進而影響系統(tǒng)發(fā)育重建,導致基因樹沖突(genetree conflict)。如 MU 等[16]基于限制性核酸內(nèi)切酶 DNA 序列 (restriction-site-associated DNA sequencing,RAD-Seq)數(shù)據(jù)和葉綠體基因組數(shù)據(jù),研究了胡桃科系統(tǒng)發(fā)育關(guān)系,在幾個關(guān)鍵節(jié)點上檢測到了信號沖突,需要注意基因樹沖突問題。不同于串聯(lián)法將所有基因合并為整體,溯祖法(coalescent method)首先基于單個基因構(gòu)建單基因樹,然后根據(jù)所有基因樹整合推斷最可能的系統(tǒng)發(fā)育樹[77],因此可以很好地避免不完全譜系分選導致的基因樹沖突。尤其是在基于核基因組的系統(tǒng)發(fā)育研究中,相比于串聯(lián)法,溯祖法能夠更好地反映真實的系統(tǒng)發(fā)育關(guān)系。ZHAO等[78]挖掘利用了全基因組和轉(zhuǎn)錄組數(shù)據(jù)進行薔薇類(rosids)的系統(tǒng)發(fā)育關(guān)系探索,綜合比較基于串聯(lián)法和溯祖法的系統(tǒng)發(fā)育樹后發(fā)現(xiàn):在蒺藜目Zygophyllales的位置上存在結(jié)構(gòu)沖突,且通過進一步分析表明,串聯(lián)法可能是錯誤的結(jié)果,而溯祖法則較好地解決了基因樹沖突問題。也有研究表明:串聯(lián)法雖然能構(gòu)建較高支持率的系統(tǒng)發(fā)育樹,但往往可能不是正確的系統(tǒng)發(fā)育關(guān)系[76]。
植物的3套基因組都可用于系統(tǒng)發(fā)育研究,但具備各自的優(yōu)勢和局限性。相較于核基因組,葉綠體基因組易于測序和組裝的特性使其在數(shù)據(jù)資源豐富度方面要遠遠勝過基因組數(shù)據(jù),因而目前仍是植物系統(tǒng)發(fā)育研究的主流手段。由于線粒體基因組具有高度保守性和劇烈的結(jié)構(gòu)變異,使其在大尺度以及早期綠色植物如苔蘚的系統(tǒng)發(fā)育研究中具有重要價值。但細胞器基因組的單親遺傳特性不能反映物種形成歷史過程中的雜交和基因組滲入等事件,核基因組的雙親遺傳特性能夠為此類問題提供充分的見解,但其測序和分析成本的高昂、計算機運行能力和方法學等因素限制了核基因組數(shù)據(jù)資源的開發(fā)和利用。但不可否認的是,隨著測序技術(shù)的發(fā)展和成本的降低,核基因組將來會成為系統(tǒng)發(fā)育研究的主流方向。同時,隨著越來越多的類群系統(tǒng)位置被確定,物種形成和進化過程中的雜交、回交等雙親遺傳以及核質(zhì)互作、多倍化、功能適應以及趨同進化等問題將會成為系統(tǒng)發(fā)育研究的重點內(nèi)容。