◎文/陸婉清(安徽省科學(xué)技術(shù)情報(bào)研究所)
茶樹起源于我國西南地區(qū),并通過古絲綢之路傳播至世界各地,目前全世界已有50多個(gè)國家引種茶樹。茶之所以廣受歡迎,除了有迷人的香氣和令人愉悅的滋味,還因?yàn)椴枞~中含有許多對人們健康有益的特征性成分,諸如茶多酚、茶氨酸、咖啡因、茶多糖、維生素、芳香油和礦物質(zhì)等。我國現(xiàn)存最早的中醫(yī)醫(yī)藥典籍《本草經(jīng)》記載:“神農(nóng)嘗百草,日遇七十二毒,得荼(茶)而解之。”這說明了茶的神奇功效。
茶樹屬于山茶科屬植物,該屬有100多個(gè)種植物,但只有茶組植物的葉子適合制茶,而非茶組植物,如茶花、油茶和金花茶等的葉片不能作為茶飲。原因在于茶樹和其他茶組植物富含茶多酚、茶氨酸和咖啡因等。除此之外,茶樹近期(3000萬年~4000萬年前)曾經(jīng)發(fā)生過一次全基因復(fù)制事件,加上大量的特異基因家族的擴(kuò)增,導(dǎo)致茶樹基因組里與茶葉的香氣、風(fēng)味與品質(zhì)密切相關(guān)的基因顯著擴(kuò)增,擴(kuò)增的結(jié)果不僅促進(jìn)茶樹適應(yīng)全球多樣化環(huán)境,還通過優(yōu)勝劣汰的自然選擇促進(jìn)了茶樹抗病基因家族的增長,使其成為世界性飲料植物。
世界主要栽培的茶樹分屬兩個(gè)變種:中國種(CSS)和阿薩姆種(CSA)。前者葉小,灌木型,抗寒性強(qiáng),分布廣泛,適合制綠茶等六大茶類;后者葉大,喬木型,抗寒性較弱,主要分布在熱帶和冬季溫暖的亞熱帶地區(qū),適合制紅茶和普洱茶。中國擁有3000多年的飲茶歷史,是世界上最大的茶葉種植國。來自國際茶樹委員會(huì)的數(shù)據(jù)顯示,2016年,全球茶葉產(chǎn)量546.3萬噸,其中中國產(chǎn)茶量235萬噸。然而,在世界三大飲料植物中,咖啡和可可的基因組相繼被歐美國家完成了測序,世界栽培最廣的中國種茶樹基因組卻遲遲未被破譯。
茶樹是一種自交不親和的異交植物,種間頻繁雜交導(dǎo)致基因組雜合度高(2.8%)。在過去5000萬年以來,茶樹基因組中長末端重復(fù)序列反轉(zhuǎn)錄轉(zhuǎn)座子家族經(jīng)歷了多次特別是近期的大量爆發(fā),它們長期而緩慢地?cái)U(kuò)增,卻又缺少有效的DNA刪除機(jī)制,導(dǎo)致茶樹基因組變得十分龐大(約3.0G)且重復(fù)序列含量極高,致使獲得高質(zhì)量參考基因組難度極大。
安徽農(nóng)業(yè)大學(xué)茶樹生物學(xué)與資源利用國家重點(diǎn)實(shí)驗(yàn)室宛曉春教授研究團(tuán)隊(duì),聯(lián)合深圳華大基因和中國科學(xué)院國家基因研究中心(上海)等相關(guān)研究團(tuán)隊(duì),解密了中國種茶樹的全基因組信息,研究成果在線發(fā)表于《PNAS》上。
中國種茶樹基因組組裝。研究團(tuán)隊(duì)以國家級茶樹品種舒茶早(中國種)為材料,整合二代Illumina Hiseq2000和三代PacBio兩大測序平臺(tái)的優(yōu)勢,采用雜合組裝策略,獲得了高質(zhì)量的茶樹全基因組信息。分析發(fā)現(xiàn),中國種基因組大小為3.1G,重復(fù)序列含量為64%;組裝的contig、scaffold N50 長度分別為 67.07kb、1.39Mb,注釋得到33932個(gè)高可信度的蛋白編碼基因 (見圖1A)。通過BAC文庫測序數(shù)據(jù)、其他的DNA序列和ESTs序列對組裝的準(zhǔn)確度及完整性進(jìn)行評估,同時(shí)與已報(bào)道的大葉種(阿薩姆種)基因組進(jìn)行了比較分析。BACs評估發(fā)現(xiàn)中國種茶樹基因組覆蓋度達(dá)到了98.3%,而阿薩姆種茶樹只有84.6%。同時(shí)BUSCO保守核心真核基因評估結(jié)果顯示中國種茶樹僅缺失6個(gè)保守基因(占2%),而阿薩姆種茶樹缺失16個(gè)保守基因(占5.2%)。來源于GeneBank的茶樹EST序列評估結(jié)果顯示,中國種茶樹覆蓋度為93%,而阿薩姆種茶樹為89%。
圖1 中國種茶樹基因組圖譜
中國種茶樹基因組進(jìn)化研究。研究發(fā)現(xiàn)茶樹原始祖先種與獼猴桃的物種分化時(shí)間大約發(fā)生在8000萬年前,阿薩姆種茶樹和中國種茶樹在38萬年~154萬年前由共同祖先發(fā)生進(jìn)化分歧。兩者間DNA、蛋白直系同源基因的平均序列相似性分別為92.4%、93.9%(見圖1B)。開花植物在進(jìn)化歷史中往往會(huì)存在全基因復(fù)制事件,并且這些基因與農(nóng)藝或植物特異性性狀相關(guān)?;蚬簿€性分析發(fā)現(xiàn)茶在歷史進(jìn)程中發(fā)生了兩次全基因復(fù)制事件,分別發(fā)生在9000萬年~1億年前和3000萬年~4000萬年前。
圖2 茶樹及6種近緣植物SCPL1A基因家族進(jìn)化
兒茶素類物質(zhì)是形成茶葉風(fēng)味的主要特征性次生代謝物。茶樹中之所以富含該類物質(zhì),與其關(guān)鍵合成酶基因擴(kuò)增有關(guān)。研究發(fā)現(xiàn),近期的全基因組復(fù)制事件及后續(xù)串聯(lián)復(fù)制導(dǎo)致了大多數(shù)次生代謝相關(guān)基因拷貝數(shù)顯著擴(kuò)增。值得關(guān)注的是,涉及包括兒茶素在內(nèi)的小分子次生代謝產(chǎn)物酰基化反應(yīng)的酰基轉(zhuǎn)移酶(SCPL)基因發(fā)生大量擴(kuò)增,其中的18%是由近期全基因組復(fù)制事件產(chǎn)生的,而68%則是通過近期串聯(lián)重復(fù)產(chǎn)生(見圖2)。兒茶素的生物合成受到復(fù)雜的轉(zhuǎn)錄調(diào)控,許多與生物逆境和非生物逆境相關(guān)的轉(zhuǎn)錄因子都與兒茶素含量高度相關(guān)(見圖3)。
圖3 茶樹兒茶素生物合成通路關(guān)鍵酶基因表達(dá)與進(jìn)化
圖4 茶樹茶氨酸代謝通路關(guān)鍵酶基因進(jìn)化與功能驗(yàn)證
咖啡堿是茶葉中主要苦味物質(zhì)。研究發(fā)現(xiàn)茶樹中咖啡堿合成途徑在進(jìn)化上獨(dú)立于可可和咖啡,合成咖啡堿的關(guān)鍵酶基因拷貝數(shù)擴(kuò)增也是通過茶樹近期全基因組復(fù)制事件和后續(xù)的串聯(lián)復(fù)制產(chǎn)生的。
茶氨酸是決定綠茶鮮爽味的主要物質(zhì)。研究發(fā)現(xiàn)并驗(yàn)證了一個(gè)參與茶氨酸合成的關(guān)鍵酶基因(CsTSI),通過表達(dá)模式分析、乙銨誘導(dǎo)處理、轉(zhuǎn)基因分析都證明CsTSI具有合成茶氨酸的酶活性(見圖4)。
通過與其他10種代表性的植物基因組比較發(fā)現(xiàn),與茶葉風(fēng)味相關(guān)的萜烯類等物質(zhì)的合成酶基因在茶樹基因組中也有顯著擴(kuò)增。
基礎(chǔ)研究。高質(zhì)量基因組圖譜的成功繪制揭示了決定茶葉適制性和風(fēng)味物質(zhì)形成的基因信息,將進(jìn)一步推動(dòng)茶組植物基因組進(jìn)化、茶樹起源和遺傳多樣性、茶葉特征性次生代謝物形成機(jī)理等重大基礎(chǔ)生物學(xué)問題的研究。
科學(xué)育種。中國種茶樹全基因組的破譯,將大大加速茶樹功能基因組學(xué)研究和優(yōu)異新基因及分子標(biāo)記發(fā)掘,加快提高茶葉品質(zhì)和適應(yīng)性的茶樹新品種培育,使茶樹品種按生產(chǎn)和市場的需求方向培育成為可能。
品種保護(hù)。基于茶樹基因組信息,可以開發(fā)用于茶樹品種鑒定與保護(hù)的分子指紋,進(jìn)而為保護(hù)品種選育人和消費(fèi)者合法權(quán)益提供技術(shù)支持。
文化傳播。中國種茶樹基因組圖譜的完成,將因其獨(dú)特的科技與文化魅力促進(jìn)中國文化的傳播,通過多樣化的風(fēng)味,在全球滿足和吸引更多的茶飲者,將中國茶和茶文化弘揚(yáng)光大。