邢 鈺 馮慧喆
(1.西南林業(yè)大學(xué)林學(xué)院,云南 昆明 650224;2.棗莊學(xué)院,山東 棗莊 277160)
研究物種的進(jìn)化關(guān)系不僅可以為分類學(xué)提供理論依據(jù)和發(fā)展方向,還可以通過揭示物種之間親緣關(guān)系的遠(yuǎn)近和進(jìn)化關(guān)系,從而精確地估計(jì)物種的進(jìn)化地位,進(jìn)而更好地理解和保護(hù)生物的多樣性。傳統(tǒng)物種分類學(xué)的研究主要是基于對物種各部分形態(tài)的比較分析,如植物的分類學(xué)中對根、莖、葉、花、果實(shí)、種子等形態(tài)的觀察判斷。現(xiàn)如今,通過分子系統(tǒng)發(fā)育分析結(jié)果的檢驗(yàn),證明了傳統(tǒng)物種分類學(xué)的很多結(jié)論都是錯(cuò)誤的[1]。但是,由于形態(tài)學(xué)分析在野外采集初期中非常重要,且分子方面的分析研究耗時(shí)較長,所以傳統(tǒng)物種分類學(xué)仍不能被摒棄,并且將其與分子分析相結(jié)合,將會極大地提高物種系統(tǒng)發(fā)育學(xué)研究的準(zhǔn)確性。以往對植物系統(tǒng)發(fā)育學(xué)研究的研究主要集中在核型分類學(xué)分析、花粉形態(tài)分析、葉柄和果實(shí)解剖學(xué)分析等,而目前對進(jìn)化關(guān)系的研究,主要是結(jié)合形態(tài)學(xué)特性的分析結(jié)果與分子系統(tǒng)發(fā)育的關(guān)系,且后者的分析僅基于DNA序列的系統(tǒng)發(fā)育分析,特別是基于核基因組內(nèi)核糖體DNA的內(nèi)部轉(zhuǎn)錄間隔(ITS)區(qū)域。
真核細(xì)胞的細(xì)胞質(zhì)基因是存在于一些細(xì)胞器中的DNA分子,這些基因只能在細(xì)胞器(如葉綠體、線粒體)的內(nèi)部完成表達(dá)并控制某些性狀,而且子代細(xì)胞的細(xì)胞器全部來自母本(受精時(shí),由于精子中的細(xì)胞質(zhì)極少,所以可以認(rèn)為受精卵中的細(xì)胞質(zhì)全部來自母本)。因此,由細(xì)胞質(zhì)基因控制的性狀都由母本傳給后代,即母系遺傳[2]。細(xì)胞質(zhì)基因組(plasmon)是細(xì)胞質(zhì)中基因的總稱,細(xì)胞質(zhì)基因是細(xì)胞質(zhì)中存在的支配遺傳性狀的基因。在細(xì)胞質(zhì)基因中,存在于色素體中的基因稱為質(zhì)體基因,存在于線粒體中的基因稱為線粒體基因。細(xì)胞質(zhì)基因是雙螺旋結(jié)構(gòu),其以半保留的方式進(jìn)行復(fù)制,具有與核基因相同的突變率,但是個(gè)別的遺傳密碼子與核基因不同。
細(xì)胞質(zhì)基因和細(xì)胞核基因之間在結(jié)構(gòu)上是沒有區(qū)別的,并且兩者均由編碼區(qū)和非編碼區(qū)組成。唯一的區(qū)別是兩者的載體不同,真核細(xì)胞細(xì)胞質(zhì)基因的載體是葉綠體和線粒體,而細(xì)胞核基因的載體是染色體。就位置而言,質(zhì)基因本質(zhì)上是存在于細(xì)胞質(zhì)中的基因,而核基因是位于真核生物的細(xì)胞核中染色體上的基因;在遺傳方式上,細(xì)胞核遺傳時(shí)正反交的結(jié)果沒有區(qū)別,即子一代均表現(xiàn)出顯性親本的性狀;而細(xì)胞質(zhì)遺傳時(shí),則結(jié)果相反,即子一代的性狀只與母本相同,即母系遺傳[3]。在基因組成上,所有與質(zhì)基因相對應(yīng)的細(xì)胞質(zhì)基因構(gòu)成一個(gè)細(xì)胞質(zhì)基因組,其中包括線粒體基因組和葉綠體基因組等,而核基因組則只是一個(gè)簡單的DNA或RNA分子,通常也稱它為染色體。細(xì)胞核遺傳和細(xì)胞質(zhì)遺傳都相對獨(dú)立,但這并不意味著兩者沒有關(guān)聯(lián)。核基因是主要的遺傳物質(zhì),但它們必須要在細(xì)胞質(zhì)中才能表達(dá);盡管細(xì)胞質(zhì)控制著一些性狀,但它也受到細(xì)胞核的影響。因此,細(xì)胞質(zhì)基因和核基因是相互依存、相互制約的。與核基因組構(gòu)建的系統(tǒng)發(fā)育樹相比,質(zhì)體基因組樹的大多數(shù)分支都具有較高的支持值。因此,基于物種的質(zhì)體基因組重建系統(tǒng)發(fā)育關(guān)系至關(guān)重要,同時(shí)很有必要開發(fā)更有效的分子標(biāo)記,可以更好地解決相關(guān)物種的種間關(guān)系。
葉綠體是植物光合作用和其他生化反應(yīng)的關(guān)鍵細(xì)胞器。葉綠體基因組是植物中的三個(gè)DNA基因組之一,由于其相對穩(wěn)定的基因組結(jié)構(gòu)和完整的基因組序列,它已被生物學(xué)研究領(lǐng)域廣泛接受,為人們了解進(jìn)化生物學(xué)提供了有價(jià)值的信息數(shù)據(jù)源,并已成為解決植物系統(tǒng)發(fā)育的有力工具[4]。
將野外現(xiàn)場考察采集的樣本通過形態(tài)學(xué)特征鑒定后,將其記錄保存起來。確保每次添加的新鮮葉子都立即用硅膠干燥,以進(jìn)行進(jìn)一步的DNA提取。利用試劑盒技術(shù)從每個(gè)樣本中提取總基因組DNA,評估其數(shù)量和質(zhì)量后,將其分為平均大小的片段。通過對比數(shù)據(jù)庫的信息,使用Getorganelle和其他組裝軟件,不斷調(diào)整參數(shù),對原始片段進(jìn)行定性評估和組裝,然后進(jìn)行手動修訂,以確認(rèn)葉綠體基因組序列中模糊的核苷酸IRa、IRb、SSC和LSC四個(gè)連接區(qū)域。利用Bandange對組裝完成的fasta文件執(zhí)行成環(huán)檢測,并將拼接出的成環(huán)文件在NCBI與公開數(shù)據(jù)庫中執(zhí)行快速的局域?qū)ξ慌帕兴惴ǎㄟ^分析比對(blast)的結(jié)果來判斷目標(biāo)序列與參考序列的匹配程度,從而得出不同序列相似性的比較說明。再使用PGA軟件對blast結(jié)果更好的一條序列進(jìn)行注釋,并通過檢查注釋結(jié)果與參考基因組的數(shù)目、注釋結(jié)果中蛋白編碼基因的cds長度是不是3的倍數(shù)和蛋白編碼基因的cds是不是起始密碼子開頭ATG、是不是以終止密碼子結(jié)尾等,以避免潛在的注釋錯(cuò)誤[5]。利用OGDRAW或者Chloroplast對葉綠體基因組進(jìn)行繪制圈圖。最后,統(tǒng)計(jì)出葉綠體基因組的各個(gè)數(shù)據(jù)信息,包括葉綠體基因組大小,LSC、SSC、IR區(qū)域的大小和各區(qū)域的GC含量。通過對葉綠體基因組組裝和注釋結(jié)果的比較和分析,研究得出基因結(jié)構(gòu)、GC含量、序列排列和核酸多樣性,目的是識別積極的選擇基因和理解進(jìn)化關(guān)系。
被子植物中大多數(shù)葉綠體的基因組排列結(jié)構(gòu)、基因組成和基因含量高度保守。葉綠體具有典型的圓形四分體結(jié)構(gòu),其四分體結(jié)構(gòu)的大小范圍為115~165 kb,包括一個(gè)大單拷貝區(qū)域(LSC)、一個(gè)小單拷貝區(qū)域(SSC)和兩個(gè)編碼相同但方向相反的倒重復(fù)區(qū)域(IR)。其中LSC區(qū)域和SSC區(qū)域被兩個(gè)IR區(qū)域隔開,并且IR區(qū)域沒有完全丟失。無論系統(tǒng)發(fā)育的位置如何,葉綠體基因組都具有保守的性質(zhì)。GC含量在基因組識別中起著重要作用,通過堿基組成的變化,可以看出不同物種的基因組差異。種子植物葉綠體基因組中GC含量的正常范圍是34%~40%,倒重復(fù)區(qū)域內(nèi)的GC含量最高,這主要是因?yàn)樵搮^(qū)域中有4個(gè)GC含量高的rRNA基因,而rRNA基因在SSC區(qū)域的含量最低[6]。GC含量的不均勻分布可能是LSC和SSC區(qū)域相對于倒重復(fù)區(qū)域的保守性的一個(gè)重要因素。倒重復(fù)區(qū)域邊界的收縮和擴(kuò)張是改變?nèi)~綠體基因組長度的主要驅(qū)動因素之一。研究發(fā)現(xiàn),蛋白編碼基因進(jìn)化的速度受IRs收縮和擴(kuò)張的影響,這很可能有助于研究進(jìn)化模式。由于質(zhì)體基因組體積緊湊、母系遺傳、無重組且進(jìn)化率較低,所以通常被認(rèn)為是研究瀕危物種保護(hù)的理想選擇?;驕y序技術(shù)的發(fā)展,降低了質(zhì)體基因組測序的成本,為基于質(zhì)體基因組的相關(guān)分析提供了便利。學(xué)者們已經(jīng)基于全質(zhì)體基因開發(fā)了許多適用于種群遺傳學(xué)和系統(tǒng)發(fā)育學(xué)的分子標(biāo)記。
在整理數(shù)據(jù)并對結(jié)果進(jìn)行分析后,發(fā)現(xiàn)GC的含量在基因組識別中起著重要作用,通過研究堿基組成的變化,可以看出不同物種的基因組差異[7]。在被子植物中,質(zhì)體基因組大小的變化歸因于倒重復(fù)區(qū)域和單拷貝(SC)邊界區(qū)域的擴(kuò)張和收縮,這在進(jìn)化中起著至關(guān)重要的作用。研究結(jié)果表明,質(zhì)體基因組在基因組組成、順序和內(nèi)容上具有高度的相似性,但是倒重復(fù)區(qū)域(IR)和單拷貝區(qū)域(SC)的邊界存在著略微不一致的現(xiàn)象。倒重復(fù)區(qū)域的擴(kuò)張和收縮可能是質(zhì)體基因組長度變化的主要機(jī)制,這種波動可能有助于確定物種之間的進(jìn)化關(guān)系。