摘 要: 由于DNA測序和PCR等分子技術(shù)的普及,植物系統(tǒng)學研究已經(jīng)從單一的形態(tài)學研究轉(zhuǎn)向通過分子手段或形態(tài)學與分子相結(jié)合探討其進化機制。作者結(jié)合有關(guān)文獻闡述談談對植物分子系統(tǒng)發(fā)育與進化的理解和認識。
關(guān)鍵詞: 植物分子系統(tǒng) 發(fā)育與進化 系統(tǒng)發(fā)生樹
自達爾文進化論問世以來,植物分類進入一個嶄新的階段——系統(tǒng)發(fā)育時期。化石保存的不完整性使由化石記錄推導出的譜系樹缺乏中間環(huán)節(jié),利用現(xiàn)存物種的比較形態(tài)學、比較細胞學、蛋白質(zhì)免疫和比較生理學等途徑的研究大致填補了化石譜系樹的空缺,但分類單元何時與最近祖先分歧等細節(jié)性問題含糊不清。直到30年前,形態(tài)性狀在進化和系統(tǒng)學研究中仍然占統(tǒng)治地位,但形態(tài)性狀易受環(huán)境影響,普遍存在趨同和平行進化現(xiàn)象,使許多分類群的進化地位難以確定。而DNA序列則不同,它直接反映物種的基因型,并記錄進化過程中發(fā)生的每一件事,含有極豐富的進化信息。依據(jù)DNA序列上的差異比較植物的親緣和演化關(guān)系,可以為植物系統(tǒng)進化研究提供最直接的證據(jù)。本文介紹分子進化研究中系統(tǒng)發(fā)生樹重建和分子進化的若干基礎(chǔ)理論問題。
1.系統(tǒng)發(fā)生與系統(tǒng)發(fā)生樹
系統(tǒng)發(fā)生是指一群有機體發(fā)生或進化的歷史。利用DNA序列進行發(fā)育分析就是推斷并評價分子水平的進化關(guān)系,并用分支圖表現(xiàn)出來,這種圖就是系統(tǒng)發(fā)生樹,簡稱系統(tǒng)樹。系統(tǒng)發(fā)生樹是描述一群有機體發(fā)生或進化順序的拓撲結(jié)構(gòu)。根據(jù)系統(tǒng)發(fā)生樹的具體表達形式,可分為物種(或種群)樹與基因樹。無論是物種(或種群)樹還是基因樹,都用樹一樣的拓撲結(jié)構(gòu)表示,其中將已標明最近共祖分類單元所在位置的樹稱為有根樹,將最近共祖分類單元所在位置未知的樹稱為無根樹。有根樹的根節(jié)點為全部分類單元最近共同祖先,它反映了分類單元間的進化關(guān)系,而無根樹僅反映分類單元間的分類關(guān)系。無根樹可通過加入外類群或利用分子鐘理論、DNA不可逆取代模型推導的方法轉(zhuǎn)化為有根樹。
2.分子系統(tǒng)發(fā)生樹的重建
在現(xiàn)代分子進化研究中,根據(jù)現(xiàn)有生物基因或物種多樣性重建生物的進化史是非常重要的問題。國內(nèi)有些學者將利用現(xiàn)有生物的形態(tài)或分子生物學數(shù)據(jù)推斷系統(tǒng)發(fā)生的過程稱為系統(tǒng)發(fā)生樹的構(gòu)建,也有學者認為應稱為重建。目前,利用分子生物學數(shù)據(jù)重建系統(tǒng)發(fā)生樹的方法很多。在重建時,對不同類型的數(shù)據(jù)應采用不同的重建方法。利用現(xiàn)代分子生物學技術(shù)獲得的生物多樣性的信息,可大致分為以下兩大類:
(1)離散特征數(shù)據(jù)。即獲得的兩個或更多的離散的值,它是賦給某一具體的運籌分類單位的,可進一步分為二態(tài)特征與多態(tài)特征。前者的離散特征只有兩種可能的狀況,即具有與不具有某特征項,通常用“0”或“1”表示,如限制性酶切位點、RAPD數(shù)據(jù)等。后者的離散特征具有三個或更多的可能狀態(tài),如核酸的序列信息,就某一位點來說,組成核苷酸的堿基具有A、T、G或C四種可能。
(2)相似性和距離數(shù)據(jù)。它并不是某一具體分類單元所具有的,而是用彼此間的相似性或距離表示的各分類單位間的相互關(guān)系,如免疫學方法與DNA雜交得到的只有分類單元間相似性信息。
3.系統(tǒng)發(fā)生樹的可靠性
在系統(tǒng)發(fā)生推斷中,統(tǒng)計分析的系統(tǒng)誤差和隨機誤差均影響所建樹的可靠性。對隨機誤差的影響,常采用一定的統(tǒng)計檢驗分析獲得的系統(tǒng)發(fā)生樹的可靠性。一種是利用某一參量來對所獲得的樹及其相近樹進行結(jié)構(gòu)差異檢驗。在ML法中常利用似然值,在最小進化法中則利用所有支的總長度。這種方法是一種保守檢驗方法,檢驗的程序非常復雜,需要很大的計算機內(nèi)存。另一種是分析每個內(nèi)支可靠性,其中常用的方法有:
(1)標準誤估計,即計算內(nèi)支長度及其標準誤,檢驗內(nèi)支長度與0間的偏差,得到一個置信概率(簡稱CP),CP值越高,支的長度就越可靠。通常,當CP≥0.95或0.99時,可認為該支的長度在統(tǒng)計上有效。
(2)自舉檢驗是一種重抽樣技術(shù),可用來估計在取樣分布不知道或難以分析得到的情況下內(nèi)支與統(tǒng)計有關(guān)的變異性。通過自舉檢驗,可得到一個自舉置信水平(簡稱BCL)。計算機模擬已表明當BCL>0.9時,CP值與BCL值非常相近。與自舉檢驗相近的另一種重抽樣方法是棄半復制檢驗。有研究表明,在研究的核苷酸數(shù)量較少的情況下,即使CP或BCL值達到95%,獲得的結(jié)果仍然不十分可信。因此,在研究中應從不同的基因中盡可能分析較多數(shù)量的核苷酸,特別在研究不同生物間進化關(guān)系時,因為不同基因遭受的進化壓力不同。此外,衰退/支持指數(shù)和T-PTP檢驗等方法亦可用來分析所得系統(tǒng)發(fā)生樹的可靠性。
通常用來降低系統(tǒng)誤差對系統(tǒng)發(fā)生分析影響,增加所建樹可靠性的方法有:①重新考慮分析時的假定,變換分析方法;②除去樹中的長支,因為樹中有許多長支,會使分析中的誤差復雜化;③去除不可靠的數(shù)據(jù);④對某些特征或某一特征狀態(tài)進行加權(quán)等。
4.結(jié)語
從系統(tǒng)發(fā)育生物學的角度看,基因組學的豐富數(shù)據(jù)既包括了大量序列信息,又蘊藏著有關(guān)重復基因、DNA片段缺失/插入、轉(zhuǎn)座子丟失/插入等信息,為系統(tǒng)發(fā)育研究提供了豐富的資料,使利用大規(guī)?;蚪M水平的數(shù)據(jù)進行系統(tǒng)發(fā)育分析成為可能。系統(tǒng)發(fā)育基因組學是利用基因組水平的海量數(shù)據(jù)信息進行系統(tǒng)發(fā)育分析的新興學科,它是后基因組時代的產(chǎn)物,也是未來進化生物學研究的重要趨勢之一。
目前利用DNA測序及分子標記等分子生物學手段進行植物分子系統(tǒng)學研究已經(jīng)十分普遍。分子數(shù)據(jù)是獨立于形態(tài)學性狀的數(shù)據(jù),易于獲取和分析,且排除了主觀因素,能有效地彌補形態(tài)分類學研究的不足。
參考文獻
[1]Boore JL.The use of genome-level characters for phylogenetic reconstruction.Trends in Ecology & Evolution,2006,21:439-446.
[2]Cummings M P,Otto S P,Wakeley J.Sampling properties of DNA sequence data in phylogenetic analysis.Molecular Biology and Evolution,1995,12:814-822.
[3]Fritsch,P.Phylogeny and biogeography of the flowering plant genus Styrax(Styracaceae)based on chloroplast DNA restriction sites and DNA sequences of the internal transcribed spacer region.Molecular phylogenetics and evolution,2001,19(3):387-408.