鄒 智,肖艷華,張 麗,趙永國
1.中國熱帶農業(yè)科學院三亞研究院/中國熱帶農業(yè)科學院熱帶生物技術研究所/海南省南繁生物安全與分子育種重點實驗室,海南海口 571101;2.中南民族大學生命科學學院/武陵山區(qū)特色資源植物種質保護與利用湖北省重點實驗室,湖北武漢 430074;3.廣東石油化工學院生物與食品工程學院,廣東茂名 525000
草甘膦是現代農業(yè)生產上應用最廣的一類廣譜型除草劑,其作用靶標為莽草酸途徑的5-烯醇式丙酮酰莽草酸-3-磷酸合酶(5-enolpyruvylshikimate-3-phosphate synthase,EPSPS,EC 2.5.1.19)。草甘膦可競爭性地抑制EPSPS而使芳香氨基酸合成受阻,最終導致植物黃化死亡[1]。EPSPS基因于1983年首次在鼠傷寒沙門氏菌中得到克隆,后發(fā)現其廣泛存在于各類微生物和植物中[2]。根據進化關系及其對草甘膦的敏感性,微生物源EPSPS可分為兩大類,Ⅰ型對草甘膦敏感,Ⅱ型則具有較高的耐受能力,其典型代表是根癌農桿菌CP4-EPSPS,已被廣泛用于作物除草劑抗性育種[1,3]。植物源EPSPS按敏感性可歸為I型,然而,草甘膦的長期施用致使越來越多的雜草(>30種)出現抗性變異,其抗性機制主要表現為EPSPS基因擴張和單/多位點突變,主要對應于擬南芥EPSPS成熟蛋白的Thr102、Ala103和Pro106[2,4]。
油莎豆(Cyperus esculentusL.)隸屬于禾本目莎草科,是一種起源于非洲和地中海沿岸的多年生草本,但在生產上作為一年生作物栽培[5]。油莎豆地下結豆(即塊莖)、地上長草,其地上部分全為葉片,葉長80~150 cm,可產鮮草3×104kg/hm2以上,是牛、羊、兔等食草動物的優(yōu)質飼料;匍匐莖起源的塊莖富含淀粉(25%~45%)、油脂(24%~35%)和糖(15%~30%),以及豐富的蛋白質(5%~10%)、膳食纖維(8%~10%)、維生素C/E(8~14 mg/100 g)和礦物質(如鉀、磷、鈉、鈣、鎂),綜合利用價值高,可開發(fā)成可口食品、飲料、保健食用油、糖、醬油、醋、酒和飼料等。作為一種新型的油料作物,油莎豆具有產量高(產鮮豆1.2萬~3萬kg/hm2,折合油脂>100 kg)、適應性廣、抗逆性強、適合機械化等特點,這便于其在不擠占現有耕地的情況下利用沙化邊際土地增加我國的食用油和飼料原料供給,提高人民的生活質量,并減少對國外大豆的依賴程度,進而服務國家的戰(zhàn)略需求[6]。然而,隨著勞動力成本的日益攀升,草害成為制約油莎豆大面積推廣的重要因素,因此培育耐除草劑的新品種具有積極的現實意義。本研究對油莎豆的EPSPS基因進行克隆,并在此基礎上重點比較分析其序列特征、遺傳變異、進化及表達特性,以期為今后的開發(fā)與利用奠定基礎。
1.1.1 植物材料 供試材料為‘熱研1號’及另外55份油莎豆種質[7]。用于DNA提取的幼嫩葉片直接采集于中國熱帶農業(yè)科學院熱帶生物技術研究所文昌試驗基地,而用于RNA提取的‘熱研1號’參照鄒智等[8]的方法,在采樣前10 d移栽至海口溫室,然后單獨采集幼嫩葉片、成熟葉片、衰老葉片、芽、芽莖(即分化產生芽的匍匐莖)和塊莖等組織樣本。
1.1.2 菌株及載體 感受態(tài)大腸桿菌DH5α和植物表達載體pCAMBIA1301由本實驗室制備和保存。1.1.3 主要試劑 引物合成和常規(guī) DNA測序委托生工生物工程(上海)股份有限公司完成;Omega快速質粒小提試劑盒、Omega DNA純化回收試劑盒、諾唯贊 ClonExpress II One Step Cloning Kit(C112-02)試劑盒、寶生物高保真DNA聚合酶、普洛麥格DNase I及各類分析純生化試劑和實驗耗材均購自相應的試劑公司。
1.2.1EPSPS基因的鑒定 從Araport11(表1)下載擬南芥的AtEPSPS(AT2G45300)和AtEPSPS2(AT1G48860)基因,并以其蛋白序列作為種子tBLASTn搜索代表性植物的基因組(表1)和油莎豆的全長轉錄組[8]。
表1 生物信息學分析所用數據庫、軟件及其網址Tab.1 Databases, software and related websites used for bioinformatics analysis
1.2.2 總 RNA提取與 cDNA第一鏈的合成 不同組織的總RNA采用天根植物多糖多酚RNA提取試劑盒單獨提取,經純度、濃度和完整性檢測合格后,用普洛麥格DNase I清除殘存的DNA,并用賽默飛反轉錄試劑盒合成cDNA第一鏈。
1.2.3 基因克隆 基于轉錄組獲得的CeEPSPS轉錄本序列,采用Primer Premier 5.0設計引物對CeEPSPSF/R(GTCACCTCCACTGCATTTCTT/ACT TTGATACAAGCAATATGC)和 CeEPSPSHF/R(C ACGGGGGACTCTTGACC ATGGCGCAAGCGAC CATGGCC/CTGGTCACCTGTAATTCACACCTAA TATTTAGCAAACTTCTG ,下劃線為可與pCAMBIA1301重組的同源臂),分別用于基因克隆和植物表達載體的構建。基因克隆參照鄒智等[9]的方法,PCR產物用1%瓊脂糖凝膠電泳檢測;為進一步完成植物過表達載體的構建,以稀釋100倍的第一輪PCR產物作為模板,利用CeEPSPSHF/R進行第二輪PCR,產物電泳檢測后切膠回收目的條帶;同時,用NcoⅠ和PmlⅠ于37℃酶切pCAMBIA1301 12 h,產物經0.8%瓊脂糖凝膠電泳檢測后回收目的條帶;然后,將上述線性化載體和PCR膠回收產物按1∶2比例混合,并用ExnaseⅡ于37℃催化2 h,構建載體pCAMBIA1301-CeEPSPS。重組質粒轉化 DH5α感受態(tài)細胞后,參照鄒智等[9]的方法進行后續(xù)的菌落PCR、測序及質粒的提取。
1.2.4 生物信息學分析 參照肖艷華等[7]的方法,分析EPSPS成熟蛋白的理論分子量(Mw)、等電點(pI)、總平均疏水指數(GRAVY)、脂肪族指數(AI)、不穩(wěn)定系數(II)等,所用軟件及其網址詳見表1。
1.2.5 基因表達分析 熒光定量分析具體參照鄒智等[10]的方法,以18S rRNA作為內參,引物18SF/R(TGTGATGCCCTTAGATGTTCTGG/GAC GTAGTCAACGCGAGCTGA)和 CeEPSPSFq/Rq(CGAGTAGGGGTGCTGTTGTCA/TGCGATTG GAGAGGGATTTAG),每樣品3次生物學重復;用2ΔΔCT法和SPSS軟件分別進行基因相對表達分析和方差分析。
通過搜索團隊前期獲得的油莎豆全長轉錄組文庫[8]共得到2條同源轉錄本,其長度為1896、2144 bp,分別包含1545、1344 bp的開放讀碼框(ORF)。前者的序列如圖1所示,其編碼的蛋白序列和長度與其他植物類似,將該基因命名為CeEPSPS;后者則缺失了正常的C端。將序列比對到本地的油莎豆基因組,結果發(fā)現CeEPSPS含有7個內含子,而上述較長的轉錄本為第6內含子滯留的可變剪接形式。
圖1 CeEPSPS的全長cDNA及其推測編碼的氨基酸Fig.1 Full-length cDNA sequence of CeEPSPS and its deduced coding amino acids
為克隆CeEPSPS基因,在基因的轉錄非翻譯區(qū)(UTR)設計引物對CeEPSPSF/R,以‘熱研1號’反轉錄的cDNA作為模板,首輪PCR成功擴增得到一條約1853 bp的特異條帶;然后以上述PCR產物作為模板,CeEPSPSHF/R作為引物,第二輪PCR擴增得到一條約1584 bp的目標條帶,將該條帶切膠回收,再通過同源重組法克隆到pCAMBIA1301上。測序結果顯示,分離到的CDS與全長轉錄本的相應區(qū)域完全一致,并與 NCBI中釋放的 4條序列(登錄號為 KT757586.1、KT757587.1、KM052384.1和 KM052385.1)的一致性分別為100.00%、98.30%、98.50%和98.60%。
為揭示基因在單子葉植物中的進化特征,研究基于康藏嵩草(Carex littledalei)等植物的全基因組序列對EPSPS基因進行系統(tǒng)鑒定。結果顯示,EPSPS在研究的 13種代表性單子葉植物中多以單拷貝的形式存在,約占69.23%;含有2個拷貝的分別為椰棗(Phoenix dactylifera)、油棕(Elaeis guineensis)、菠蘿(Ananas comosus)和香蕉(Musa acuminata),其在核酸和蛋白水平的一致性分別為99.40%/99.40%、90.20%/89.70%、100.00%/100.00%、88.40%/90.90%,接近或略高于擬南芥的 89.60%/89.30%;擬南芥和 15種單子葉植物中的EPSPS基因均含有 7個內含子(表2)。此外,從 NCBI中還搜索到 4條香附子(C.rotundus)的EPSPS完整或部分編碼區(qū)序列,即KT757585.1(1545 bp)、KM052381.1(1530 bp)、KM052382.1(1474 bp)和KM052383.1(1477 bp),其與CeEPSPS的一致性分別為97.20%、97.50%、97.40%和97.10%。
表2 擬南芥和15種單子葉植物中EPSPS基因的結構及其編碼蛋白的理化特性Tab.2 Gene structures and protein physicochemical properties of EPSPS genes in arabidopsis and 15 monocots
2.3.1CeEPSPS基因編碼蛋白的理化特性、亞細胞定位及保守結構域分析 如圖1所示,CeEPSPS基因編碼區(qū)的GC含量為49.64%,預測編碼 514個氨基酸,其中含量較高的為 Ala(10.30%)、Gly(9.70%)、Val(9.10%)、Leu(8.90%)和Ser(8.20%);強酸性、強堿性、極性和疏水氨基酸分別占10.70%、11.09%、22.18%和37.16%。亞細胞定位及與擬南芥中的AtEPSPS蛋白比對分析顯示,CeEPSPS屬于葉綠體定位蛋白,其N端的前70個殘基為信號肽,長度與所分析的多數物種相近;值得注意的是,紫萍(Spirodela polyrhiza)中的SpEPSPS蛋白的信號肽僅有13個殘基,由堿基插入與缺失造成,其是否足以介導葉綠體定位還有待研究。EPSPS成熟蛋白的理論分子量、等電點、總平均疏水指數、脂肪族指數、不穩(wěn)定系數在所分析的物種中均非常接近,暗示其均為穩(wěn)定的疏水型酸性蛋白(表3)。TMHMM和SMART分析顯示,CeEPSPS無跨膜螺旋,其 77~508位為 EPSP合酶結構域(PF00275,E值 2.7e-150)(圖2);InterPro分析顯示,其主要參與芳香族氨基酸的生物合成(GO:0009073),具有 3-磷酸莽草酸-1-羧基乙烯基轉移酶活性(GO:0003866)、甲基以外的芳烴基轉移酶活性(GO:0016765)以及催化活性(GO:0003824)等分子功能。
2.3.2 SNP分析 如圖2所示,可引起草甘膦抗性改變的Thr102、Ala103和Pro106在所比對的蛋白間高度保守,暗示‘熱研1號’的CeEPSPS蛋白可能對該除草劑敏感。為摸清團隊所收集的其他種質是否存在抗性突變,我們利用前期獲得的基因組重測序數據(即將56份材料的葉片DNA等量混合后測序)[7]進行多態(tài)性位點鑒定,共計獲得20個單核苷酸多態(tài)性(SNP)位點(表3);經深入分析顯示,它們僅造成3個氨基酸的變異,即對應于成熟蛋白的His116Asn、Leu139Val和Asn153Asp。
表3 SNP分布情況Tab.3 Distribution of SNPs identified in this study
2.3.3 進化分析 為揭示 EPSPS的進化特征及油莎豆的分類學地位,研究構建了包括擬南芥EPSPS在內21個蛋白的無根進化樹。如圖3所示,AtEPSPS和AtEPSPS2作為唯一的雙子葉植物來源蛋白位于進化樹的基部,而單子葉植物來源蛋白較好地聚為7支,其中,同為莎草屬的CeEPSPS和 CrEPSPS聚在一起,并與同為莎草科的ClEPSPS形成一個分支;同為禾本目但隸屬于禾本科的 OsEPSPS、HvEPSPS、BdEPSPS、SiEPSPS、SbEPSPS和 ZmEPSPS聚為莎草科的姊妹支;棕櫚目棕櫚科的 PdEPSPS1/2、EgEPSPS1/2聚為一支;禾本目鳳梨科的AcEPSPS1/2、芭蕉目芭蕉科的MaEPSPS1/2、微子目蘭科的PeEPSPS和天南星目浮萍科的SpEPSPS則形成另外的5個分支。由于來自同一物種的旁系同源蛋白都聚在一起,并具有很高的序列相似性(89.3%~100.0%),暗示其可能通過物種特異性的基因重復產生。
圖3 EPSPS蛋白的進化分析Fig.3 Phylogenetic analysis of EPSPS proteins
為揭示CeEPSPS的表達特性,并為草甘膦的適時施用提供參考,研究采用qRT-PCR技術檢測基因在葉片(分幼嫩、成熟和衰老3個時期)、芽、芽莖和塊莖等主要組織中的表達水平。如圖4所示,CeEPSPS在成熟葉片和塊莖中的表達豐度最高,顯著高于芽、幼嫩葉片、衰老葉片和芽莖;從葉片的發(fā)育過程來看,基因呈現先增后減的趨勢,其在成熟葉片中的表達水平顯著高于幼嫩和衰老葉片,而幼嫩和衰老葉片之間差異不顯著。
圖4 CeEPSPS在不同組織中的表達模式Fig.4 Expression patterns of CeEPSPS in various tissues
作為莽草酸途徑的關鍵酶,EPSPS催化烯醇式丙酮酸和莽草酸-3-磷酸形成 EPSP,繼而參與酪氨酸、苯丙氨酸、色氨酸等芳香族氨基酸的生物合成,以及香豆素、綠原酸、類黃酮等次生代謝物的合成。同時,EPSPS又是廣譜型除草劑草甘膦的作用靶標[2]。雖然絕大多數植物的 EPSPS對草甘膦高度敏感,但高選擇壓引起的基因擴張及關鍵位點的突變賦予了部分群體或生態(tài)型的抗藥性,這些位點包括 Thr102、Ala103和 Pro106[2,4,11-12]。Pro106突變是抗性獲得的常見形式,至今已在 10種以上的雜草中發(fā)現,如Pro106Ser/Thr/Ala/Leu,雖然此類突變多賦予低水平的抗性(<10倍),但Pro106Ser突變在黑麥草、長芒莧和Leptochloa virgata等植物中也發(fā)現了高水平的抗性(>10倍);Thr102Ile突變一般賦予高水平的抗性,但Thr102Ser突變僅賦予低水平的抗性;與單突變相比,多位點突變如 Thr102Ile+Pro106Ser/Ala/Thr(TIPS/A/T)、Thr102Ile+Ala103Val+Pro106Ser可賦予更高水平的草甘膦抗性[4,13-16]。其中,編碼TIPS突變的EPSPS基因已成功用于玉米(Zea mays)除草劑抗性育種[17]。在油莎豆中,至今還未見有關于草甘膦抗性變異的報道。
本研究利用基因組和轉錄組數據對油莎豆及另外13種代表性單子葉植物的EPSPS基因進行了鑒定,并在此基礎上完成了CeEPSPS編碼區(qū)序列的分離及植物過表達載體的構建。這些單子葉植物包括莎草科的康藏嵩草,禾本科的水稻(Oryza sativa)、大麥(Hordeum vulgare)、二穗短柄草(Brachypodium distachyon)、谷子(Setaria italica)、高粱(Sorghum bicolor)和玉米,鳳梨科的菠蘿,棕櫚科的椰棗和油棕,芭蕉科的香蕉,蘭科的小蘭嶼蝴蝶蘭,以及浮萍科的紫萍。結果顯示,與擬南芥一樣,這些植物的EPSPS基因均含有7個內含子;多數植物以單拷貝的形式存在,而椰棗、油棕、菠蘿和香蕉中各自存在1對重復基因,主要通過物種特異性的基因重復產生(由于菠蘿AcEPSPS1和AcEPSPS12的編碼區(qū)序列完全一樣,不排除是基因組錯誤組裝所致);進化樹依科將所分析的蛋白分成9支,其中,屬于雙子葉的擬南芥位于基部,CeEPSPS與CrEPSPS的親緣關系最近,并與ClEPSPS形成莎草科分支;莎草科分支與禾本科分子形成姊妹支,支持油莎豆劃歸為禾本目[7,18-19]。
研究克隆到的CeEPSPS編碼514個氨基酸,其序列長度與其他物種相近,并含有葉綠體定位的信號肽和高度保守的 EPSPS合酶結構域。CeEPSPS成熟蛋白的分子量為47.32 kDa、pI為5.49、GRAVY 為 0.069、AI為 93.76、II為 31.73,與其他物種中同源蛋白的理化特性基本一致,即分別為 46.86~47.55 kDa、5.13~5.58、0.011~0.111、91.78~95.96、28.38~35.46,暗示其為穩(wěn)定的疏水型酸性蛋白。進一步的序列比對證實CeEPSPS不存在已知的草甘膦抗性突變。育種實踐中也發(fā)現團隊收集的 56份油莎豆種質均對草甘膦高度敏感,研究利用前期獲得的基因組重測序數據[8]進一步對相關SNP進行了鑒定,雖然獲得了20個SNP,但它們均與已知的抗藥性變異無關,這表明現有群體不存在抗藥性突變。從表達模式來看,CeEPSPS傾向于在成熟葉片和塊莖中表達,這與其活躍的次生代謝一致。
綜上,研究完成了包括油莎豆在內的代表性單子葉植物EPSPS基因的鑒定、CeEPSPS編碼區(qū)的分離與植物過表達載體的構建及序列特征、遺傳變異、進化和表達特性分析,較好地揭示了油莎豆的分類學地位,初步證實團隊前期收集的56份油莎豆種質不存在草甘膦抗性變異,這為油莎豆的開發(fā)與合理栽培提供了理論支撐,并為通過利用過表達或基因編輯技術創(chuàng)制油莎豆新種質奠定了堅實的基礎。