劉潮 韓利紅 宋培兵 王德琴 王海波 唐利洲
摘要:[目的]明確桑樹基因組中WRKY轉(zhuǎn)錄因子家族結(jié)構(gòu)及其功能特征,為進(jìn)一步揭示W(wǎng)RKY轉(zhuǎn)錄因子家族生物學(xué)功能提供科學(xué)依據(jù)。[方法]利用生物信息學(xué)方法對桑樹WRKY轉(zhuǎn)錄因子的數(shù)目、類型、結(jié)構(gòu)、系統(tǒng)進(jìn)化關(guān)系、保守結(jié)構(gòu)域和密碼子使用偏性等進(jìn)行全面分析。[結(jié)果]基于桑樹全基因組蛋白數(shù)據(jù)庫,共鑒定出55個桑樹WRKY轉(zhuǎn)錄因子家族基因,占桑樹基因總數(shù)(29261)的1.88%。桑樹WRKY轉(zhuǎn)錄因子存在6種內(nèi)含子數(shù)量類型及15種內(nèi)含子相位類型,其中27個基因含有2個內(nèi)含子,25個基因的相位類型為2-2型。保守結(jié)構(gòu)域系統(tǒng)進(jìn)化分析結(jié)果顯示,桑樹WRKY轉(zhuǎn)錄因子家族蛋白主要分為三大類(Ⅰ、Ⅱ和Ⅲ),I類可分為IN和Ic兩個亞組,Ⅱ類根據(jù)聚類情況又可分為Ⅱa、Ⅱb、Ⅱc、Ⅱd和Ⅱe等5個亞組。桑樹WRKY轉(zhuǎn)錄因子蛋白保守結(jié)構(gòu)域分析發(fā)現(xiàn)有五類Motif的保守性較強(qiáng),桑樹WRKY轉(zhuǎn)錄因子蛋白中均包含c端Motif 1,I類蛋白同時含有N端Motif 3。桑樹WRKY轉(zhuǎn)錄因子家族基因啟動子區(qū)富含PBF(C2H2鋅指因子)和AHL(擬南芥hook因子)元件。密碼子使用偏性分析結(jié)果顯示,桑樹WRKY轉(zhuǎn)錄因子家族基因的有效密碼子數(shù)(ENC)介于48.00-60.00,密碼子第3位GC含量(GC3s)介于0.330-0.722,平均親水性值(Gravy)均為負(fù)值;同義密碼子相對使用度(RSCU)>I.000的密碼子有29個,且以A(6個)或T(11個)結(jié)尾較G(4個)或c(8個)結(jié)尾的略多。[結(jié)論]桑樹WRKY轉(zhuǎn)錄因子家族包含55個成員,內(nèi)含子相位類型一致的同組成員可能來源于同一祖先基因,且與基因復(fù)制和基因組重排有關(guān);蛋白序列高度保守,在植物抵御環(huán)境脅迫過程中發(fā)揮作用;基因密碼子使用偏性較弱,主要受堿基突變選擇壓力影響。
關(guān)鍵詞:桑樹;WRKY轉(zhuǎn)錄因子;密碼子使用偏性;系統(tǒng)進(jìn)化;生物信息學(xué)
0引言
[研究意義]WRKY轉(zhuǎn)錄因子家族是僅存于高等植物中的一類鋅指蛋白,參與植物的生長發(fā)育,能對環(huán)境脅迫和病原侵染作出響應(yīng)。首先,WRKY轉(zhuǎn)錄因子蛋白在植物免疫反應(yīng)中發(fā)揮重要作用,是植物免疫系統(tǒng)各通路的中心組件,包括MTI、PTI、ETI、基本防御及系統(tǒng)獲得抗性(Birkenbihl et al.,2016)。其次,WRKY轉(zhuǎn)錄因子在植物的應(yīng)激反應(yīng)中也起關(guān)鍵作用,其網(wǎng)絡(luò)涉及生物和非生物脅迫的各組成部分(Eulgem,2006;Zhu et al.,2013)。WRKY轉(zhuǎn)錄因子家族基因過表達(dá)能增強(qiáng)植物對鹽和干旱脅迫的耐受性,同時增強(qiáng)抗病性(Oiu and Yu,2009)。此外,WRKY轉(zhuǎn)錄因子還在植物種子發(fā)芽、衰老及其他發(fā)育反應(yīng)中發(fā)揮重要作用(Rushton et al.,2010;Verweij et al.,2016)。密碼子使用偏性是指各種生物體偏愛使用三聯(lián)密碼子(編碼相同氨基酸的同義密碼子)的現(xiàn)象,普遍存在于生物界中,且物種的親緣關(guān)系越近密碼子使用偏性越相似;密碼子使用偏性還與基因表達(dá)、蛋白質(zhì)功能等密切相關(guān)。因此,研究密碼子使用偏性對開展基因進(jìn)化壓力研究、基因表達(dá)水平預(yù)測及外源基因改良等均具有重要意義。[前人研究進(jìn)展]WRKY轉(zhuǎn)錄因子家族含有60個高度保守的氨基酸WRKY功能域,包含N端的WRKYGQK保守的氨基酸和C端非典型的鋅指結(jié)構(gòu)(Rushton et al.,2010)。根據(jù)WRKY結(jié)構(gòu)域數(shù)量和鋅指結(jié)構(gòu)氨基酸組成的不同,可將WRKY轉(zhuǎn)錄因子家族蛋白分為三大類:第1類含有2個WRKY結(jié)構(gòu)域,具有Cys2-His2型(CX46CX22-23HX1H)鋅指結(jié)構(gòu);第Ⅱ類和第Ⅲ類僅含有1個WRKY結(jié)構(gòu)域,其中第Ⅱ類的鋅指結(jié)構(gòu)與第1類的類似,第Ⅲ類的鋅指結(jié)構(gòu)為Cys2-His-Cys型(CXvCXE3HTC),根據(jù)保守氨基酸殘基的差異,第Ⅱ類又可分為5個亞類(Eulgem et al.,2000)。至今,已有多種植物WRKY轉(zhuǎn)錄因子家族基因被鑒定(Wu et al.,2005;Ross et al.,2007;Ling et al.,2011;Huang et aL,2012;Dmg et aL,2015;Song et al,2016;Zhang et al.,2016),并證實(shí)WRKY轉(zhuǎn)錄因子家族參與植物的多種生理生化過程,包括衰老(zhang et al.,2016)、纖維發(fā)育(Ding et al.,2015)、生物和非生物脅迫(Song et al.,2016;Wei et al.,2016)等。不同物種或同一物種不同基因問的密碼子使用偏性不同,與基因在進(jìn)化過程中所面對的選擇壓力不同有關(guān)。物種在進(jìn)化過程中受基因突變壓力和自然選擇壓力的雙重影響,但由于二者在基因進(jìn)化過程中所發(fā)揮作用的權(quán)重不同,導(dǎo)致密碼子使用偏性具有物種特異性(趙洋等,2016;曲俊杰等,2017)。密碼子使用偏性與GC含量有關(guān)時表示受突變壓力影響(Chen et al.,2004),與翻譯過程有關(guān)時表示受正向選擇壓力影響(Sharp et al.,2010)。因此,通過優(yōu)化密碼子可提高外源基因在寄主細(xì)胞中的表達(dá)水平(周宗梁等,2012;Zelasko et al.,2013)。[本研究切入點(diǎn)]桑樹(Morus notabilis)是一種常見的落葉喬木,其葉片是桑蠶的主要飼料,桑皮可用作造紙原料,桑果可供食用或釀酒,在我國多個省份均有栽培,但目前針對桑樹WRKY轉(zhuǎn)錄因子基因及其蛋白的研究鮮見報道。[擬解決的關(guān)鍵問題]在桑樹基因組測序工作的基礎(chǔ)上,利用生物信息學(xué)方法全面預(yù)測分析桑樹基因組中WRKY轉(zhuǎn)錄因子家族結(jié)構(gòu)及其功能特征,為進(jìn)一步揭示W(wǎng)RKY轉(zhuǎn)錄因子家族生物學(xué)功能提供科學(xué)依據(jù)。
1材料與方法
1.1蛋白序列獲取與鑒定
桑樹全基因組蛋白序列從GenBank數(shù)據(jù)庫中搜索獲得,以擬南芥WRKY轉(zhuǎn)錄因子蛋白序列為探針,在桑樹全基因組蛋白數(shù)據(jù)庫中進(jìn)行BLASTp同源序列比對分析,通過NCBI在線工具CDD(https://www.ncbi.nlm.nih.gov/cdd)和Pfam數(shù)據(jù)庫(http://pfam.xfam.org/)進(jìn)行蛋白結(jié)構(gòu)域分析,并剔除無WRKY結(jié)構(gòu)域的蛋白序列。
1.2基因及其蛋白結(jié)構(gòu)分析
從NCBI中獲得桑樹WRKY轉(zhuǎn)錄因子基因序列和CDS序列,使用基因結(jié)構(gòu)顯示系統(tǒng)(http://gsds.cbi.pku.edu.cn/index.php)繪制基因結(jié)構(gòu)示意圖;通過MEME SUITE(http://meme-suite.org/tools/meme)預(yù)測桑樹WRKY轉(zhuǎn)錄因子蛋白序列保守氨基酸Motif,參數(shù)設(shè)為默認(rèn)值。
1.3基因啟動子區(qū)特征分析
通過GenBank數(shù)據(jù)庫獲取桑樹WRKY轉(zhuǎn)錄因子家族基因轉(zhuǎn)錄起始位點(diǎn)上游的2 kb序列,以JASPAR(http://iaspar.genereg.net/)數(shù)據(jù)庫分析啟動子區(qū)富含轉(zhuǎn)錄調(diào)控基序。選擇植物啟動子基序數(shù)據(jù)庫作為搜索數(shù)據(jù)庫,相對閾值分?jǐn)?shù)選擇100%。
1.4蛋白系統(tǒng)進(jìn)化分析
所有桑樹WRKY家族蛋白通過Clustal x進(jìn)行比對分析,選取WRKY和鋅指結(jié)構(gòu)域保守序列,采用MEGA 5.0中的NJ(Neighbor-jioining)法構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹,參數(shù)選擇Bootstrap為1000。系統(tǒng)發(fā)育進(jìn)化樹的繪制與優(yōu)化使用Itol在線工具(http://itol.embl.de/)完成。
1.5基因密碼子使用偏性分析
利用CodonW 1.4.4對桑樹WRKY轉(zhuǎn)錄因子家族基因CDS序列密碼子的使用偏性進(jìn)行分析,包括密碼子適應(yīng)指數(shù)(CAI)、有效密碼子數(shù)(ENC)、密碼子第3位GC含量(GC3s)和平均親水性值(Gravy)等參數(shù)。以GC3s為橫坐標(biāo)、ENC為縱坐標(biāo)繪制ENC-plot圖譜。圖譜中的曲線為ENC預(yù)期值,表示密碼子使用偏性僅由堿基組成決定,計算公式為:ENC=2+GC3s+29/[GC3s2+(1-GC3s)2]。分布點(diǎn)越靠近標(biāo)準(zhǔn)曲線表示密碼子使用偏性受堿基突變影響越大,越遠(yuǎn)離標(biāo)準(zhǔn)曲線表示密碼子使用偏性受自然選擇影響越大。使用EMBOSS explorer網(wǎng)站(http://emboss.toulouse.inra.fr/)在線軟件Cusp對同義密碼子的相對使用度(Relative synonymous codon usage,RSCU)進(jìn)行分析。
2結(jié)果與分析
2.1桑樹WRKY轉(zhuǎn)錄因子家族成員鑒定及其序列分析結(jié)果
基于桑樹全基因組蛋白數(shù)據(jù)庫,經(jīng)BLASTp同源搜索和SMART保守結(jié)構(gòu)域鑒定,共獲得55個桑樹WRKV~錄因子基因(表1),占桑樹基因總數(shù)(29261)的1.88%。其中,蛋白氨基酸殘基數(shù)小于300 aa的基因序列占24%,介于300-650 aa的基因序列占71%,大于650 aa的基因序列占5%。
桑樹WRKY轉(zhuǎn)錄因子家族基因存在6種內(nèi)含子數(shù)量類型(圖1)。其中,有27個基因含有2個內(nèi)含子,為數(shù)量最多的類型;有10個基因含有4個內(nèi)含子;WRKY9基因的內(nèi)含子數(shù)量達(dá)14個,為內(nèi)含子數(shù)量最多的類型。桑樹WRKY轉(zhuǎn)錄因子家族基因內(nèi)含子相位類型有15種,呈多樣性。其中,有25個基因的內(nèi)含子相位為2-2型,是基因數(shù)量最多的類型;有6個基因的內(nèi)含子相位為2型。進(jìn)化組Ⅰ和進(jìn)化組Ⅱc中的基因內(nèi)含子數(shù)量和相位類型較多樣,說明組內(nèi)基因來源較復(fù)雜;進(jìn)化組Ⅱa、進(jìn)化組Ⅱb、進(jìn)化組Ⅱd、進(jìn)化組Ⅱe和進(jìn)化組Ⅲ中的基因結(jié)構(gòu)和內(nèi)含子相位類型高度一致,內(nèi)含子相位為2—2型,可能是由同一祖先基因復(fù)制而來。
2.2桑樹WRKY家族蛋白的系統(tǒng)進(jìn)化分析結(jié)果
利用MEGA 5.05對72個擬南芥WRKY轉(zhuǎn)錄因子蛋白和55個桑樹WRKY轉(zhuǎn)錄因子蛋白的保守結(jié)構(gòu)域序列進(jìn)行系統(tǒng)進(jìn)化分析,結(jié)果顯示,桑樹WRKY轉(zhuǎn)錄因子蛋白主要分為三大類(Ⅰ、Ⅱ和Ⅲ),其中,第Ⅰ類根據(jù)WRKY保守結(jié)構(gòu)域處于N端或C端,可分為ⅠN和ⅠC兩個亞組;第Ⅱ類根據(jù)聚類情況又可分為Ⅱa、Ⅱb、Ⅱc、Ⅱd和Ⅱe等5個亞組(圖2)。但MnWRKY49和MnWRKYlC未歸入以上分組。
2.3桑樹WRKY轉(zhuǎn)錄因子蛋白保守結(jié)構(gòu)域分析結(jié)果
使用MEME SUITE對桑樹WRKY轉(zhuǎn)錄因子保守氨基酸Motif進(jìn)行分析,結(jié)果發(fā)現(xiàn)有五類Moti啪保守性較強(qiáng),其正則表達(dá)式如圖3所示。其中,Motif 1是WRKY Motif,在桑樹WRKY轉(zhuǎn)錄因子家族中高度保守;Motif 3為進(jìn)化組I N端的WRKY保守結(jié)構(gòu)域;Motif 2為鋅指結(jié)構(gòu),僅MnWRKY28、MnWRKY43和MnWRKY54缺少該結(jié)構(gòu)域。55個WRKY轉(zhuǎn)錄因子蛋白均具有Motif 1,所有I類基因蛋白均具有Motif 1和Motif 3。Motif 4為未知結(jié)構(gòu)域,Motif 5為LXsLXgLX3L基序,類似LRR結(jié)構(gòu)域,進(jìn)化組I、進(jìn)化組Ⅱa和進(jìn)化組Ⅱc的基因蛋白結(jié)構(gòu)包含Motif4,進(jìn)化組Ⅱa、進(jìn)化組Ⅱb和進(jìn)化組Ⅲ的基因蛋白結(jié)構(gòu)包含Motif 5。部分桑樹WRKY轉(zhuǎn)錄因子保守結(jié)構(gòu)域和鋅指結(jié)構(gòu)存在變異,如進(jìn)化組Ⅱc中MnWRKY50和MnWRKY51的保守結(jié)構(gòu)域?yàn)閃RKYGKK,MnWRKY28和MnWRKY54的鋅指結(jié)構(gòu)缺少CX.sCX22.23部分,進(jìn)化組Ⅲ中MnWRKYl9和MnWRKY23的鋅指結(jié)構(gòu)分別為CX7CX23HRC和CX7CX23HIC,保守氨基酸殘基發(fā)生變異。
2.4桑樹WRKY轉(zhuǎn)錄因子家族基因啟動子區(qū)特征分析結(jié)果
桑樹WRKY轉(zhuǎn)錄因子家族基因啟動子區(qū)均含有PBF結(jié)合元件(AAAGC),每個基因啟動子平均含有4.8個元件(表2),PBF屬于Dof家族C2H2鋅指因子類,有助于bZIP轉(zhuǎn)錄因子結(jié)合DNA(Vicente-Carb aiosaet al.,1997);另外兩種C2H2鋅指因子類(DOF2.4和DOF5.3)含量也較高。55個桑樹WRKY轉(zhuǎn)錄因子家族基因中有28個基因的啟動子區(qū)含有AHL20結(jié)合元件(AATTAAAT),AHLl2與AHL20轉(zhuǎn)錄因子均屬于擬南芥hook因子,能特異性結(jié)合與核基質(zhì)附著相關(guān)且富含AT的DNA序列,通過下調(diào)PAMP引發(fā)的NH01和FRKl可負(fù)調(diào)控植物對病原菌的先天性免疫作用(Lu et al.,2010)。此外,部分桑樹WRKY轉(zhuǎn)錄因子家族基因啟動子區(qū)含有bZIP、ERF、GT-1、MYB、TGA和WRKY轉(zhuǎn)錄因子結(jié)合序列。
2.5桑樹WRKY轉(zhuǎn)錄因子家族基因密碼子使用偏性分析結(jié)果
為了解桑樹WRKY轉(zhuǎn)錄因子家族基因密碼子使用偏性,對ENC、GC3s和Gravy等參數(shù)進(jìn)行分析,結(jié)果發(fā)現(xiàn),桑樹WRKY轉(zhuǎn)錄因子家族基因ENC介于48.00-60.00,GC3s介于0.330-0.722,Gravy均為負(fù)值(表3),表明桑樹WRKY轉(zhuǎn)錄因子蛋白均為親水性蛋白,且多數(shù)具有強(qiáng)親水性。
ENC與GC3s的關(guān)聯(lián)分析結(jié)果顯示,基因分布越靠近ENC-plot圖譜標(biāo)準(zhǔn)曲線表示密碼子使用受堿基突變壓力影響越大,基因分布在標(biāo)準(zhǔn)曲線下方或遠(yuǎn)離曲線,表示基因受自然選擇壓力影響越大。GC3s分布則反映植物所受的選擇壓力,GC3s分布越廣泛,表明密碼子使用偏性受堿基突變壓力越大,GC3s分布范圍越小,表明密碼子使用偏性受正向選擇壓力影響越大(Kawabe and Mivashita,2003)。由圖4可知,桑樹WRKY轉(zhuǎn)錄因子家族基因的GC3s介于0.330-0.722,分布較廣泛,且多數(shù)基因ENC分布在標(biāo)準(zhǔn)曲線下方,表明桑樹WRKY轉(zhuǎn)錄因子家族基因同時受到堿基突變和正向選擇壓力的影響。
RSCU是同義密碼子實(shí)際使用量與理論使用量的比值。RSCU>1.000,表示密碼子使用頻率高于其他同義密碼子;反之則使用頻率低。由表4可知,RSCU>I.000的密碼子有29個,且以A(6個)或T(11個)結(jié)尾較G(4個)或C(8個)結(jié)尾的略多,說明桑樹WRKY轉(zhuǎn)錄因子家族基因的密碼子使用偏性較弱,略偏好A或T結(jié)尾。
3討論
WRKY轉(zhuǎn)錄因子蛋白為植物特有轉(zhuǎn)錄因子家族,廣泛參與植物多種生物學(xué)進(jìn)程的調(diào)控。至今,多個已完成基因組測序植物的WRKY轉(zhuǎn)錄因子家族基因被鑒定,番茄基因組中有81個WRKY轉(zhuǎn)錄因子家族基因(Wu et al.,2005),黃瓜有55個WRKY轉(zhuǎn)錄因子家族基因(Ross et al.,2007),大豆有176個WRKY轉(zhuǎn)錄因子家族基因(Ling et al.,2011),棉花有113個WRKY轉(zhuǎn)錄因子家族基因(Huang et al.,2012),粳稻有98個WRKY轉(zhuǎn)錄因子基因(周宗梁等,2012),擬南芥有72個WRKY轉(zhuǎn)錄因子家族基因(Zelasko et al.,2013),蘋果有132個WRKY家族基因(谷彥冰等,2015)。Baranwal等(2016)研究發(fā)現(xiàn),桑樹基因組中含有54個WRKY轉(zhuǎn)錄因子基因。同一家族基因的數(shù)量與植物進(jìn)化過程中基因復(fù)制、基因組重排等有關(guān),如水稻、番茄、蘋果和棉花的WRKY轉(zhuǎn)錄因子家族均存在基因復(fù)制現(xiàn)象(Wu et al.,2005;Huang et al.,2012;周宗梁等,2012),但在WRKY轉(zhuǎn)錄因子數(shù)量較少的黃瓜中未發(fā)現(xiàn)基因復(fù)制現(xiàn)象(Ross et al.,2007)。WRKY轉(zhuǎn)錄因子基因數(shù)目除了與物種基因組有關(guān)外,還與植物進(jìn)化過程中所受的環(huán)境壓力有關(guān)。本研究結(jié)果顯示,桑樹WRKY轉(zhuǎn)錄因子家族基因數(shù)量為55個,屬于WRKY轉(zhuǎn)錄因子家族基因相對較少的物種類型,說明進(jìn)化過程中該家族基因受到的環(huán)境壓力較小。
基因結(jié)構(gòu)中內(nèi)含子數(shù)量及相位類型是研究基因進(jìn)化的重要證據(jù)。根據(jù)剪接中位置的不同,內(nèi)含子分為3種相位類型,0型內(nèi)含子位于2個密碼子之間,1型內(nèi)含子位于密碼子的第1和第2堿基之間,2型內(nèi)含子位于密碼子的第2和第3堿基之間(Sharp,1981)。內(nèi)含子相位的改變會導(dǎo)致后續(xù)閱讀框發(fā)生變化,因此內(nèi)含子的相位通常比較保守。本研究中,桑樹WRKY家族蛋白主要分為三大類(Ⅰ、Ⅱ和Ⅲ),且有2個蛋白(MnWRKY49和MnWRKYlC)未進(jìn)行分組,與Baranwal等(2016)將桑樹WRKY轉(zhuǎn)錄因子家族分為四類的研究結(jié)果基本一致。本研究還發(fā)現(xiàn),同一進(jìn)化組的基因結(jié)構(gòu)內(nèi)含子數(shù)量和相位類型高度一致,進(jìn)化組Ⅱa和進(jìn)化組Ⅱb的內(nèi)含子相位類型全部為0型,進(jìn)化組Ⅱd、進(jìn)化組Ⅱe和進(jìn)化組Ⅲ全部為2型。約50%桑樹WRKY轉(zhuǎn)錄因子家族基因包含2個內(nèi)含子,其中有25個基因的內(nèi)含子相位為2-2型,分別屬于進(jìn)化組Ⅱc、進(jìn)化組Ⅱd、進(jìn)化組Ⅱe和進(jìn)化組Ⅲ,推測其來源于共同的祖先基因。
本研究的系統(tǒng)進(jìn)化分析結(jié)果顯示,桑樹WRKY家族蛋白主要分為三大類,Ⅱ類又分為5個亞組。所有成員均含有保守基序WRKYGQK(MnWRKY50和MnWRKY51為WRKYGKK外),Ⅰ類和Ⅱ類還包含有保守的鋅指結(jié)構(gòu)C2H2(除MnWRKY28和Mn-WRKY54缺少外),Ⅲ類的鋅指結(jié)構(gòu)為C2HC。Rinerson等(2015)研究認(rèn)為,植物中WRKY轉(zhuǎn)錄因子家族基因存在兩種可能的起源方式,一種起源于Ⅰ類蛋白C端WRKY結(jié)構(gòu)域,一種起源于藻類Ⅱa或Ⅱb的某一蛋白結(jié)構(gòu)域。桑樹WRKY轉(zhuǎn)錄因子蛋白保守結(jié)構(gòu)域分析發(fā)現(xiàn)有五類Motif的保守性較強(qiáng),所有桑樹WRKY蛋白中均包含C端Motif 1,Ⅰ類蛋白同時含有N端Motif 3。進(jìn)化組Ⅱa、進(jìn)化組Ⅱb和進(jìn)化組Ⅲ中含有類似LRR結(jié)構(gòu)域的Motif 5。可見,植物WRKY轉(zhuǎn)錄因子基因家族結(jié)構(gòu)上高度保守,桑樹WRKY轉(zhuǎn)錄因子可能起源于I類基因蛋白C端WRKY結(jié)構(gòu)域。
WRKY蛋白特異性結(jié)合DNA的最小基序TTGAC(C/T)稱作W-box。多數(shù)WRKY轉(zhuǎn)錄因子的目標(biāo)基因啟動子中均含有數(shù)量不定的W-box,彼此間或同向排列或形成回文結(jié)構(gòu),WRKY轉(zhuǎn)錄因子與其結(jié)合,而調(diào)節(jié)下游功能基因或其他轉(zhuǎn)錄因子的表達(dá)(Eulgem et al.,2000)。一些植物WRKY轉(zhuǎn)錄因子家族基因啟動子中也存在W-box,如擬南芥WRKYl8啟動子中的W-box是起負(fù)調(diào)控作用的順式作用元件,能阻止擬南芥WRKYl8在抗病期間的過量表達(dá),從而緩解該基因?qū)χ参锷L造成的影響(Chen andChen,2002)。多種WRKY轉(zhuǎn)錄因子可形成復(fù)合物以調(diào)控植物的抗病性。Baranwal等(2016)研究發(fā)現(xiàn),桑樹WRKY基因上游啟動子區(qū)富含AAAG、GAAAA和AGAAA等序列。本研究也發(fā)現(xiàn)桑樹WRKY轉(zhuǎn)錄因子家族基因啟動子區(qū)的AAAGC、AAAAAGT和GAAAAAG數(shù)量較多,且部分桑樹WRKY轉(zhuǎn)錄因子家族基因啟動子區(qū)含有bZIP、ERF、GT-1、MYB、TGA和WRKY轉(zhuǎn)錄因子結(jié)合序列,而這些轉(zhuǎn)錄因子大多與逆境脅迫有關(guān)。
桑樹WRKY轉(zhuǎn)錄因子家族基因同時受堿基突變和正向選擇壓力的影響,其中以堿基突變選擇壓力占主導(dǎo)地位。基因密碼子使用偏性與植物基因組組成及其所處的脅迫環(huán)境有直接關(guān)系(宋輝等,2015)。雙子葉植物偏好A/T結(jié)尾的密碼子,單子葉植物偏好G/C結(jié)尾的密碼子(Tatarinova et al.,2010),偏性強(qiáng)的基因偏好使用G/C結(jié)尾的密碼子(Gu0 et al.,2007)。桑樹屬于雙子葉植物,雖然RSCU>1.000的密碼子中以A/T結(jié)尾的略多,但密碼子使用偏性并不強(qiáng),多數(shù)屬于低表達(dá)基因。Baranwal等(2016)研究發(fā)現(xiàn),桑樹WRKY轉(zhuǎn)錄因子家族基因表達(dá)具有器官特異性,在54個WRKY轉(zhuǎn)錄因子家族基因中有13個基因在根部表達(dá),25個基因在樹皮中表達(dá),10個在雄蕊中表達(dá),但總體來看,檢測到的表達(dá)基因數(shù)目較少,基因相對表達(dá)倍數(shù)不高。這在本研究中得到進(jìn)一步證實(shí),即桑樹WRKY轉(zhuǎn)錄因子家族基因密碼子使用偏性較弱。
4結(jié)論
桑樹WRKY轉(zhuǎn)錄因子家族包含55個成員,內(nèi)含子相位類型一致的同組成員可能來源于同一祖先基因,且與基因復(fù)制和基因組重排事件有關(guān);蛋白序列高度保守,多數(shù)含有完整的WRKYGQK和鋅指結(jié)構(gòu),在植物抵御環(huán)境脅迫過程中發(fā)揮作用;基因密碼子使用偏性較弱,主要受堿基突變選擇壓力影響,多數(shù)屬于低表達(dá)基因,表明桑樹受環(huán)境脅迫壓力較小。