肖艷華 鄒智 趙永國(guó) 郭安平 張麗
(1.中南民族大學(xué)生命科學(xué)學(xué)院 武陵山區(qū)特色資源植物種質(zhì)保護(hù)與利用湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430074;2.中國(guó)熱帶農(nóng)業(yè)科學(xué)院三亞研究院 熱帶生物技術(shù)研究所 海南省南繁生物安全與分子育種重點(diǎn)實(shí)驗(yàn)室,海口 571101;3.廣東石油化工學(xué)院生物與食品工程學(xué)院,茂名 525000)
雜草是影響農(nóng)作物生長(zhǎng)與產(chǎn)量的重要限制因子。一直以來(lái),雜草防除都是病蟲(chóng)草害防治過(guò)程中的重中之重。除草劑,又名除莠劑,是一類(lèi)可使雜草徹底或選擇性枯死的藥劑。除草劑的發(fā)明及其在農(nóng)業(yè)生產(chǎn)上的廣泛應(yīng)用為雜草的高效防除創(chuàng)造了條件。根據(jù)有效成分的化學(xué)結(jié)構(gòu),除草劑可分為氨基酸類(lèi)、三嗪類(lèi)、苯脲類(lèi)、酰胺類(lèi)等,其作用機(jī)制是通過(guò)干擾與抑制生理代謝而使雜草死亡,如影響光合作用、影響脂肪酸的合成、影響色素的合成、阻礙氨基酸的合成、干擾葉酸的形成、干擾激素平衡等[1]。植物中目前已確定的除草劑靶標(biāo)約有10余種[2],其中,乙酰乳酸合酶(acetolactate synthase,ALS,EC2.2.1.6)或乙酰羥酸合酶(acetohydroxyacid synthase,AHAS)是合成纈氨酸、亮氨酸、異亮氨酸等支鏈氨基酸的關(guān)鍵酶,其在纈氨酸和亮氨酸的合成中催化2分子丙酮酸生成乙酰乳酸和二氧化碳,而在異亮氨酸的合成中催化1分子丙酮酸與1分子α-丁酮酸生成2-乙醛基-2-羥基丁酸和二氧化碳[3]。ALS基因廣泛分布于各類(lèi)植物以及真菌、細(xì)菌、古細(xì)菌和藻類(lèi)中,在基因組中以單拷貝或小家族的形式存在[3]。目前己開(kāi)發(fā)的ALS抑制劑有50多種,可歸為磺酰脲(sulfonylurea,SU)、咪唑啉酮(imidazolinone,IMI)、三唑并嘧啶(triazolopyrimidine,TP)、嘧啶硫代苯甲酸酯(pyrimidinyl-thiobenzoate,PTB)和磺酰胺羰基三唑啉酮(sulfonyl-aminocarbonyltriazolinone,SCT)等5大類(lèi)[4]。這些抑制劑通過(guò)與ALS結(jié)合而使其失活,進(jìn)而造成支鏈氨基酸合成受阻、蛋白質(zhì)合成停止、有絲分裂細(xì)胞停止在G1階段的S期(DNA合成期)和G2階段的M期,最終導(dǎo)致植物停止生長(zhǎng)并失綠黃化死亡,具有高效、低毒、環(huán)境友好、選擇性強(qiáng)等優(yōu)點(diǎn)[2,4]。雖然如此,ALS抑制劑的廣泛和長(zhǎng)期應(yīng)用極大加速了雜草的進(jìn)化,至今報(bào)道的抗性雜草已超過(guò)160種[5]??剐缘姆肿踊A(chǔ)主要源于A(yíng)LS的點(diǎn)突變,如Ala122、Pro197、Ala205、Asp376、Arg377、Trp574、Ser653和 Gly654( 對(duì) 應(yīng)于 AtALS 的相應(yīng)位點(diǎn))[4-5]。
油莎豆(Cyperus esculentus L.),又名油莎草、虎堅(jiān)果、鐵荸薺、黃色特格拉斯(yellow nutsedge)、地下板栗、地下核桃等,是一種優(yōu)質(zhì)、高產(chǎn)、綜合利用前景廣闊的集油、糧、草、飼于一體的經(jīng)濟(jì)作物[6]。與香附子(Cyperus rotundus)或紫色特格拉斯(purple nutsedge)一樣,隸屬于禾本目莎草科莎草屬的油莎豆地上長(zhǎng)草、地下結(jié)豆;不同的是,油莎豆的塊莖積累高水平的油脂(24%-35%)[7]。相比其他油料作物,油莎豆具有生育期短(70-150 d)、生物量大(畝產(chǎn)鮮豆800-2 000 kg、鮮草2 000 kg以上)、每畝產(chǎn)油量高(超過(guò)100 kg)、適應(yīng)性廣(我國(guó)多數(shù)地區(qū)均可種植)、病蟲(chóng)害少、抗逆性強(qiáng)(耐旱、耐澇、耐高溫、耐鹽堿、耐貧瘠等)、發(fā)展?jié)摿Υ?、適合機(jī)械化等特點(diǎn),便于在不擠占糧食和大豆生產(chǎn)面積的情況下增加我國(guó)的油脂和飼料原料供給,緩減對(duì)國(guó)外大豆的依賴(lài)程度,滿(mǎn)足國(guó)家的戰(zhàn)略需求[6,8]。但是,在我國(guó)華中、華南乃至華北地區(qū)大面積推廣種植油莎豆存在一定的生態(tài)風(fēng)險(xiǎn):首先,油莎豆的地下莖系統(tǒng)非常發(fā)達(dá),其中匍匐莖和塊莖均可繁殖,多數(shù)除草劑不能將其徹底清除,這也是為什么香附子成為世界惡性雜草的主要原因;其次,地里殘留的油莎豆塊莖萌發(fā)不整齊,且在上述區(qū)域可安全越冬,來(lái)年勢(shì)必成為連茬作物的雜草;此外,ALS抑制劑抗性在莎草屬的部分植物中已有發(fā)現(xiàn),其中包括油莎豆[9-12]。為摸清我國(guó)油莎豆資源的遺傳基礎(chǔ),本研究對(duì)油莎豆的ALS基因進(jìn)行克隆,并基于現(xiàn)有的種質(zhì)資源分析其遺傳變異,揭示其序列特征、進(jìn)化關(guān)系及表達(dá)特性,以期為今后的分子設(shè)計(jì)育種奠定基礎(chǔ)。
供試材料為種植于中國(guó)熱帶農(nóng)業(yè)科學(xué)院熱帶生物技術(shù)研究所文昌試驗(yàn)基地(海南文昌)的圓粒型油莎豆熱研1號(hào)及另外55份種質(zhì),早期初步發(fā)現(xiàn)其對(duì)ALS抑制劑無(wú)抗性。用于提取DNA的幼嫩葉片直接采集于試驗(yàn)地,而用于提取RNA的熱研1號(hào)于采樣前10 d移栽至溫室(海南??冢?,具體培養(yǎng)條件和樣品采集詳見(jiàn)文獻(xiàn)[8]。大腸桿菌DH5α感受態(tài)細(xì)胞和植物表達(dá)載體pCAMBIA1301由本實(shí)驗(yàn)室制備和保存;引物合成和常規(guī)DNA測(cè)序委托北京擎科生物技術(shù)有限公司完成;基因組測(cè)序委托武漢希望組生物科技有限公司完成;天根DNA Marker Ⅲ(貨號(hào)MD103)、天根植物多糖多酚RNA提取試劑盒、賽默飛cDNA第一鏈合成試劑盒、Omega快速質(zhì)粒小提試劑盒、Omega DNA純化回收試劑盒、諾唯贊ClonExpress II One Step Cloning Kit(C112-02)試劑盒、Promega DNase I酶、寶生物高保真DNA聚合酶及各類(lèi)分析純生化試劑和實(shí)驗(yàn)耗材均購(gòu)自相應(yīng)的試劑公司。
1.2.1 ALS基因的鑒定 擬南芥的ALS基因下載于A(yíng)raport11(https://www.arabidopsis.org/),并以其蛋白序列作為種子tBLASTn檢索研究組前期獲得的油莎豆全長(zhǎng)轉(zhuǎn)錄組[8]以及代表性植物的基因組[13-14]。
1.2.2 總RNA提取與cDNA第一鏈的合成 采用天根試劑盒單獨(dú)提取幼嫩葉片、成熟葉片、衰老葉片、芽、芽莖、塊莖等不同組織樣本的總RNA,經(jīng)純度、濃度和完整性檢測(cè)合格后用DNase I酶清除殘存的DNA,并用反轉(zhuǎn)錄試劑盒合成cDNA第一鏈,然后置于-80℃冰箱保存?zhèn)溆谩?/p>
1.2.3 基因克隆 基于上述轉(zhuǎn)錄組文庫(kù)獲得的CeALS轉(zhuǎn)錄本序列,采用PrimerPremier5.0軟件設(shè)計(jì)基因克隆和同源重組引物對(duì)CeALSF(5′-TCC TCT CCA TTC CAT TCC ATT CG-3′)/CeALSR(5′-ACA ACA CCT GAG GGA ACC GC-3′)和 CeALSHF(5′-CAC GGG GGA CTC TTG ACC ATG GCT TCC TCT TCC TCC CTC-3′)/CeALSHR(5′-CTG GTC ACC TGT AAT TCA CAC CTA GTA CAC AGT CCG GCC ATC-3′)(下劃線(xiàn)為可與pCAMBIA1301重組的同源臂)。基因克隆參照文獻(xiàn)[15]進(jìn)行,PCR產(chǎn)物采用1%瓊脂糖凝膠電泳檢測(cè);為一步完成植物表達(dá)載體的構(gòu)建,研究以稀釋100倍的第一輪PCR產(chǎn)物作為模板,利用同源重組引物進(jìn)行第二輪PCR,產(chǎn)物電泳檢測(cè)后切膠回收目的條帶;同時(shí),用Nco I和Pml I 37℃酶切pCAMBIA1301 12 h,產(chǎn)物經(jīng)0.8%瓊脂糖凝膠電泳檢測(cè)后回收目的條帶;然后,將上述線(xiàn)性化載體和PCR膠回收產(chǎn)物按1∶2比例混合,并用Exnase II 37℃催化2 h,構(gòu)建載體pCAMBIA1301-CeALS。重組質(zhì)粒轉(zhuǎn)化DH5α感受態(tài)后,參照文獻(xiàn)[15]進(jìn)行后續(xù)的菌落PCR、測(cè)序及質(zhì)粒的提取。
1.2.4 基因組測(cè)序與分析 采用改良的CTAB法[16]分別提取56份葉片材料的基因組DNA,經(jīng)純度、濃度和完整性檢測(cè)合格后等量混合,然后用全基因組鳥(niǎo)槍法構(gòu)建二代400 bp的小片段DNA文庫(kù),并利用NovaSeq 6000進(jìn)行150 bp雙末端測(cè)序。序列比對(duì)和SNP分析分別采用 bwa-mem(v0.7-17)[17]和GATK(v3.8.1)[18]。
1.2.5 序列分析 參照文獻(xiàn)[19],利用ProtParam(https://web.expasy.org/protparam/)分析蛋白的理化特性;利用Protscale(http://cn.expasy.org/tools/protscale.html)分析親水 /疏水性;利用 TMHMM 2.0(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測(cè)跨膜螺旋;利用ChloroP 1.1(http://www.cbs.dtu.dk/services/ChloroP/)預(yù)測(cè)亞細(xì)胞定位和葉綠體信號(hào)肽剪切位點(diǎn);利用CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 和 SMART(http://smart.embl-heidelberg.de/) 分析保守結(jié)構(gòu)域;利用InterPro(http://www.ebi.ac.uk/interpro/search/)預(yù)測(cè)生物學(xué)功能;利用MEGA6.0進(jìn)行多序列比對(duì)及進(jìn)化樹(shù)的構(gòu)建。
1.2.6 表達(dá)特性分析 熒光定量分析具體參照文獻(xiàn)[20],以18S rRNA作為內(nèi)參,引物對(duì)分別為18SF(5′-TGT GAT GCC CTT AGA TGT TCT GG-3′)/18SR(5′-GAC GTA GTC AAC GCG AGC TGA-3′)和 CeALSFq(5′-GCA GGT TTG GGT GCT ATG GG-3′)/CeALSRq(5′-TGG CCT TGA CAG GTA GGT TCT CTA T-3′),每樣品至少3次生物學(xué)重復(fù),基因相對(duì)表達(dá)值和方差分析分別用2ΔΔCt法和SPSS進(jìn)行。
通過(guò)搜索實(shí)驗(yàn)室前期構(gòu)建的油莎豆全長(zhǎng)轉(zhuǎn)錄組文庫(kù),獲得一條2 425 bp的轉(zhuǎn)錄本(圖1),該序列包含1 938 bp的開(kāi)放讀碼框(ORF),其序列長(zhǎng)度與其他植物相近,將基因命名為CeALS。為實(shí)驗(yàn)克隆該基因,在其5′和3′轉(zhuǎn)錄非翻譯區(qū)(UTR)分別設(shè)計(jì)引物CeALSF和CeALSR,目標(biāo)擴(kuò)增長(zhǎng)度為2 161 bp;通過(guò)以熱研1號(hào)反轉(zhuǎn)錄的cDNA作為模板進(jìn)行PCR擴(kuò)增,成功獲得一條約2 000 bp的特異條帶(圖2-A);隨后,以上述PCR產(chǎn)物作為模板、CeALSHF/HR作為引物進(jìn)行第二輪PCR,成功擴(kuò)增到一條約1 977 bp的清亮條帶(圖2-B)。將目標(biāo)條帶切膠回收后與線(xiàn)性化載體pCAMBIA1301混勻、孵育、轉(zhuǎn)化大腸桿菌,菌落PCR后挑取陽(yáng)性克隆進(jìn)行測(cè)序分析。結(jié)果顯示,研究分離到的序列與上述全長(zhǎng)轉(zhuǎn)錄本的編碼區(qū)(CDS)完全一致。
圖1 CeALS的全長(zhǎng)cDNA及其推測(cè)編碼的氨基酸Fig.1 Full-length cDNA sequence of CeALS and its deduced coding amino acids
圖2 油莎豆CeALS基因的PCR擴(kuò)增Fig.2 PCR amplification of CeALS in C.esculentus
為揭示油莎豆的分類(lèi)學(xué)地位并探討ALS基因在單子葉植物中的分布與進(jìn)化特征,研究基于公共數(shù)據(jù)庫(kù)中釋放的全基因組序列對(duì)ALS基因進(jìn)行了鑒定,從14種代表性的單子葉植物中共計(jì)鑒定到19個(gè)ALS基因;同時(shí),研究還從4種無(wú)參考基因組的莎草科植物中檢索獲得7個(gè)包含完整編碼區(qū)的ALS基因。如表1所示,ALS基因在這些植物中多以單拷貝的形式存在,而在康藏嵩草(Carex littledalei)、二穗短柄草(Brachypodium distachyon)、水稻(Oryza sativa)、玉米(Zea mays)和香蕉(Musa acuminata)中存在2個(gè)拷貝;基因在擬南芥和多數(shù)單子葉植物中無(wú)內(nèi)含子,而在康藏嵩草、短葉水蜈蚣(Cyperus brevifolius)、 螢 藺(Schoenoplectiella juncoides)、 豬毛草(Schoenoplectiella wallichii)和沼澤蘆葦(Schoenoplectiella mucronata)等莎草科植物中存在一個(gè)內(nèi)含子(表1)。
2.3.1 CeALS編碼蛋白的理化特性、亞細(xì)胞定位及保守結(jié)構(gòu)域 序列分析顯示,CeALS編碼區(qū)的GC含量為55.01%,預(yù)測(cè)編碼645個(gè)氨基酸(圖1),其中含量較高的依次為L(zhǎng)eu(9.30%)、Ala(9.30%)、Ser(8.37%)和Val(8.20%);強(qiáng)堿性、強(qiáng)酸性、極性和疏水氨基酸所占比例分別為9.61%、10.70%、24.19%和35.66%;蛋白的理論分子量(MW)為69.94 kD,等電點(diǎn)(pI)為6.10,pH 7.0時(shí)的帶點(diǎn)荷數(shù)(ch)為-4.785,脂肪族指數(shù)(AI)為89.36,這與其他物種相近;與多數(shù)物種類(lèi)似,CeALS的總平均疏水指數(shù)(GRAVY)<0,為-0.156,疏水性最高的為343位的Leu和345位的Phe(分值2.011)、親水性最高的為473位的Tyr和474位的Lys(分值-2.822);CeALS的不穩(wěn)定系數(shù)(II)與多數(shù)物種類(lèi)似,為44.93,屬于不穩(wěn)定蛋白(表1)。TMHMM分析顯示CeALS無(wú)跨膜螺旋;ChloroP分析顯示蛋白葉綠體定位,其前端的54個(gè)氨基酸殘基為信號(hào)肽;CDD分析顯示蛋白的67-645為乙酰乳酸合酶結(jié)構(gòu)域(PLN02470,E值0e+00);SMART分析進(jìn)一步顯示蛋白的72-240為硫胺素焦磷酸酶N端TPP結(jié)合結(jié)構(gòu)域(TPP_enzyme_N,PF02776,E值4.4e-50)、264-397為硫胺素焦磷酸酶中央結(jié)構(gòu)域(TPP_enzyme_M,PF00205,E值1.5e-42)、459-614為硫胺素焦磷酸酶C端TPP結(jié)合結(jié)構(gòu)域(TPP_enzyme_C,E值 2.3e-45)(圖2);InterPro分析顯示 CeALS主要參與分支氨基酸的生物合成(GO:0009082),具有TPP結(jié)合(GO:0030976)、FAD結(jié)合(GO:0050660)、Mg2+結(jié)合(GO:0000287)、催化活性(GO:0003824)和乙酰乳酸合酶活性(GO:0003984)等分子功能。
表1 擬南芥和20種單子葉植物中ALS基因的結(jié)構(gòu)及其編碼蛋白的理化特性Table 1 Gene structure and physicochemical properties of ALS genes in Arabidopsis and 20 monocots
2.3.2 SNP分析 如圖3所示,序列比對(duì)表明至今已報(bào)道可引起除草劑抗性改變的8個(gè)位點(diǎn)在CeALS與AtALS間完全一致。為進(jìn)一步摸清研究組收集的其他種質(zhì)是否存在相關(guān)抗性變異,我們對(duì)其進(jìn)行了基因組重測(cè)序,并從中獲得30個(gè)SNP(表2),深入分析顯示他們僅造成了4個(gè)氨基酸的變異,即Lys211Gln、Leu538Val、Asp568Asn 和 Ser591Ala。
表2 SNP分布情況Table 2 Distribution of SNPs
圖3 CeALS蛋白的多序列比對(duì)和序列特征Fig.3 Multiple sequence alignment and sequence features of CeALS protein
2.3.3 進(jìn)化分析 同源分析顯示,NCBI中至今僅報(bào)道了CeALS 716 bp的部分編碼區(qū)序列(序列號(hào)KM624613.1);而CeALS與莎草科植物中同源蛋白的一致性都在90%以上,其中,與CbALS的一致性甚至高達(dá)94.92%。進(jìn)一步的進(jìn)化分析證實(shí)了這種結(jié)果,CeALS與CbALS聚在一起,接著是同屬的CdALS以及同科物種來(lái)源的蛋白,其次才是同目的禾本科植物;雙子葉植物擬南芥位于基部,棕櫚目的油棕(Elaeis guineensis)和椰棗(Phoenix dactylifera)、芭蕉目的香蕉、微子目的小蘭嶼蝴蝶蘭(Phalaenopsis equestris)和天南星目的紫萍(Spirodela polyrhiza)都形成獨(dú)立的分支。有意思的是,除二穗短柄草和水稻外,其他來(lái)源于同一物種的旁系同源蛋白都聚在一起,暗示他們可能通過(guò)物種特異性的基因重復(fù)產(chǎn)生(圖4)。OsALS1/OsALS2和BdALS1/BdALS2的一致性分別為75.70%和83.60%,但OsALS1/BdALS1和OsALS2/BdALS2的一致性分別為89.30%和76.60%,這表明這些重復(fù)基因在兩物種分化之前就已產(chǎn)生。
圖4 ALS蛋白的進(jìn)化分析Fig.4 Phylogenetic analysis of ALS proteins
圖5所示的組織表達(dá)特性分析顯示,基因在成熟和衰老葉片中的表達(dá)豐度最高,顯著高于幼嫩葉片;在塊莖中的表達(dá)豐度與幼嫩葉片相當(dāng),顯著高于芽和芽莖。
圖5 CeALS在不同組織中的表達(dá)模式Fig.5 Expression pattern of CeALS in various tissues
作為支鏈氨基酸生物合成的關(guān)鍵酶,ALS是SU、IMI、TP、PTB和SCT等除草劑的作用靶標(biāo)[3]。雖然絕大多數(shù)植物原本對(duì)這些除草劑高度敏感,但高選擇壓引起的ALS突變賦予了部分生態(tài)型的抗藥性,并且有關(guān)抗藥突變的報(bào)道與日俱增[5]。如以模式植物擬南芥的ALS作為標(biāo)準(zhǔn)分子,目前的抗性突變主要集中在A(yíng)la122等8個(gè)位點(diǎn),他們對(duì)除草劑的種類(lèi)和抗性程度均存在較大的差異:Ala122Thr突變可產(chǎn)生IMI抗性,但對(duì)SU和PTB敏感,對(duì)于TP而言則似乎存在物種差異;Ala122Val突變產(chǎn)生SU和IMI抗性,卻對(duì)SCT、TP和PTB敏感;Ala122Asn突變則產(chǎn)生對(duì)SU、IMI、TP和PTB四類(lèi)除草劑的抗性;Pro197和Trp574是目前報(bào)道變異最多的位點(diǎn),Pro197突變主要引起SU抗性,而Trp574突變則可造成更為廣譜的抗性(含上述5類(lèi)除草劑);Ala205突變主要引起IMI和PTB抗性;Asp376突變可引起5類(lèi)除草劑的抗性,但抗性程度物種差異較大;Asp376His突變可引起SU、TP和SCT抗性;Ser653突變主要引起IMI和SCT抗性;Gly654突變可引起SU、IMI和SCT抗性,但對(duì)PTB敏感[4-5]。在莎草科中,至今已有7種植物發(fā)現(xiàn)抗藥性,即螢藺、沼澤蘆葦、短葉水蜈蚣、異花莎草(Cyperus difformis)、碎米莎草(Cyperus iria)、扁穗莎草(Cyperus compressus)和油莎豆[10-12,21-24]。螢藺至少含有 2個(gè) ALS基因,均含有一個(gè)內(nèi)含子,其任一拷貝的Pro197His/Ser/Leu突變都可賦予SU抗性,而其對(duì)SU、IMI和PTB的抗性則為SjALS2的Trp574Leu突變引起[21];此外,SjALS2的Asp376Glu突變可引起高水平的SU和PTB抗性以及低水平的IMI抗性[23]。沼澤蘆葦至少含有3個(gè)ALS基因,SmALS1和SmALS2包含1個(gè)內(nèi)含子,而SmALS3則無(wú)內(nèi)含子;作為主要表達(dá)的基因,SmALS1編碼蛋白的Pro197His和Trp574Leu均可引起抗藥性[22]。短葉水蜈蚣、異花莎草、扁穗莎草和碎米莎草可能僅編碼一個(gè)ALS基因,其在短葉水蜈蚣中含有1個(gè)內(nèi)含子,Pro197His/Ser/Ala突變是前3者抗藥性產(chǎn)生的原因,而Trp574Leu突變則是碎米莎草抗藥性產(chǎn)生的原因,這與油莎豆類(lèi)似[10-12,24-25]。
研究基于實(shí)驗(yàn)室前期獲得的油莎豆全長(zhǎng)轉(zhuǎn)錄組,首次完成了CeALS全長(zhǎng)cDNA的克隆。為便于進(jìn)化和比較分析,研究同時(shí)還從14個(gè)已完成基因組測(cè)序的代表性單子葉植物中鑒定到19個(gè)同源基因,其中,基因以單拷貝居多,約占64.29%。在含有2個(gè)拷貝的5種植物中,康藏嵩草隸屬于禾本目莎草科,二穗短柄草、水稻和玉米屬于禾本目禾本科,香蕉屬于芭蕉目;康藏嵩草的2個(gè)拷貝均含有1個(gè)內(nèi)含子,這與其他莎草科的螢藺、沼澤蘆葦、豬毛草和短葉水蜈蚣一致,而另外4種植物的2個(gè)拷貝均無(wú)內(nèi)含子,這與擬南芥和其他多數(shù)單子葉植物一致,暗示莎草科植物ALS基因的內(nèi)含子可能是在科分化后獲得,屬于莎草科特異的,而無(wú)內(nèi)含子的SmALS3可能通過(guò)逆轉(zhuǎn)錄產(chǎn)生[22]。事實(shí)上,將克隆到的CeALS轉(zhuǎn)錄本比對(duì)到油莎豆的基因組也證實(shí)該物種同樣也含有1個(gè)內(nèi)含子。與康藏嵩草、螢藺、沼澤蘆葦和豬毛草不同的是,油莎豆僅含有1個(gè)拷貝,暗示油莎豆在莎草科的分化過(guò)程沒(méi)有經(jīng)歷多倍化事件或者基因加倍后又發(fā)生了丟失。
基于葉綠體基因的進(jìn)化分析顯示油莎豆可歸為禾本目[26]。然而,前期的全長(zhǎng)轉(zhuǎn)錄組測(cè)序與分析顯示,在獲得的57 849條高質(zhì)量序列中,除將近30%的注釋為禾本科植物外,另有約40%的被注釋為油棕和椰棗[8]。為進(jìn)一步揭示油莎豆的分類(lèi)學(xué)地位,研究利用ALS蛋白構(gòu)建了包括擬南芥在內(nèi)的21種植物的無(wú)根進(jìn)化樹(shù)。與前期分類(lèi)學(xué)一致的是,擬南芥位于進(jìn)化樹(shù)的基部,天南星目、微子目、芭蕉目、棕櫚目和禾本目都形成獨(dú)立的分支。隸屬于粉狀胚乳目的菠蘿(Ananas comosus)雖然與禾本目聚在一支,但主要原因可能與低樣本量有關(guān),適當(dāng)增加粉狀胚乳目的物種數(shù)有望較好解決上述問(wèn)題。在禾本目分支中,進(jìn)化樹(shù)明顯支持莎草科與禾本科的姊妹科關(guān)系。
研究克隆到的CeALS編碼645個(gè)氨基酸,其理論分子量為69.94 kD、等電點(diǎn)為6.10、脂肪族指數(shù)為89.36、總平均疏水指數(shù)為-0.156,屬于葉綠體定位的親水性蛋白,這與其他物種類(lèi)似。CeALS蛋白含有乙酰乳酸合酶特有的PLN02470結(jié)構(gòu)域,其中 包 含TPP_enzyme_N、TPP_enzyme_M和TPP_enzyme_C三個(gè)完整的功能域,可與TPP、FAD和Mg2+三種輔助因子結(jié)合。序列比對(duì)和SNP分析證實(shí),熱研1號(hào)及本團(tuán)隊(duì)收集的其他55份種質(zhì)不存在抗藥性突變,這與生產(chǎn)實(shí)踐中ALS抑制劑可高效殺死這些種質(zhì)是一致的。根據(jù)表達(dá)分析結(jié)果,CeALS的表達(dá)水平隨著葉片的發(fā)育而顯著增加;值得注意的是,CeALS在塊莖中的表達(dá)豐度與幼嫩葉片相當(dāng),暗示其在該組織的分支氨基酸積累中可能起著重要的作用。
完成了油莎豆參與支鏈氨基酸合成的CeALS基因的克隆、序列特征、進(jìn)化及表達(dá)特性分析,較好地揭示了油莎豆的分類(lèi)學(xué)地位,同時(shí)也證實(shí)團(tuán)隊(duì)收集的56份油莎豆種質(zhì)不存在抗藥性變異。