王嵐春, 沈方圓, 歐陽丹, 李 校
(四川大學(xué)生命科學(xué)學(xué)院 生物資源與生態(tài)環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室, 成都 610064)
生物體會(huì)通過基因的表達(dá)和沉默來調(diào)控自身的生長(zhǎng)發(fā)育,其調(diào)控過程是相互獨(dú)立而又相互依存的.這種調(diào)控可能發(fā)生在基因表達(dá)過程中的任意一個(gè)階段,如 DNA 的轉(zhuǎn)錄過程,mRNA的加工過程,以及 mRNA的翻譯過程等,且調(diào)控的發(fā)生需要各種酶和調(diào)節(jié)蛋白的相互配合[1].其中轉(zhuǎn)錄因子參與DNA轉(zhuǎn)錄起始過程來影響基因的表達(dá).轉(zhuǎn)錄因子通常被定義為具有序列特異性的DNA結(jié)合并能夠激活或抑制轉(zhuǎn)錄的蛋白質(zhì)[2].基因表達(dá)在轉(zhuǎn)錄水平上的調(diào)控影響或控制著細(xì)胞或有機(jī)體中的許多生物學(xué)過程,如細(xì)胞周期的進(jìn)展、代謝和生理平衡以及對(duì)環(huán)境的反應(yīng).
漫長(zhǎng)的自然選擇與進(jìn)化過程當(dāng)中,植物形成了其特有的基因表達(dá)和調(diào)控機(jī)制,以適應(yīng)不斷改變的生存環(huán)境.轉(zhuǎn)錄因子在這一過程中起到了很大的作用.MYB轉(zhuǎn)錄因子廣泛分布于所有真核生物中,是植物界最大的轉(zhuǎn)錄因子家族之一[1].大多數(shù)MYB蛋白起著轉(zhuǎn)錄因子的作用,具有不同數(shù)量的MYB結(jié)構(gòu)域重復(fù)序列,賦予它們結(jié)合DNA的能力[1].MYB蛋白是控制發(fā)育、代謝和對(duì)生物和非生物脅迫反應(yīng)的調(diào)控網(wǎng)絡(luò)中的關(guān)鍵因子[3].
MYB轉(zhuǎn)錄因子(TFs)是一組由1到4個(gè)MYB重復(fù)序列定義的全真核轉(zhuǎn)錄因子.50個(gè)氨基酸組成三個(gè)α螺旋,每個(gè)重復(fù)序列的第二個(gè)和第三個(gè)螺旋形成一個(gè)螺旋-旋轉(zhuǎn)-螺旋(HTH)結(jié)構(gòu),其中有三個(gè)間距規(guī)則的色氨酸(或疏水)殘基,形成疏水核心.每個(gè)重復(fù)序列的第三個(gè)螺旋是與DNA直接接觸的DNA識(shí)別螺旋[4]. HTH與啟動(dòng)子中的調(diào)節(jié)元件相互作用,而C-末端區(qū)域負(fù)責(zé)與真核轉(zhuǎn)錄機(jī)制的其他成分建立蛋白質(zhì)-蛋白質(zhì)相互作用[5].在DNA接觸過程中,兩個(gè)MYB重復(fù)序列緊密地堆積在主溝中,使兩個(gè)識(shí)別螺旋協(xié)同結(jié)合到特定的DNA識(shí)別序列基序上.MYB-DNA結(jié)合域的長(zhǎng)度為100~160個(gè)殘基,這取決于N-末端區(qū)域不完全重復(fù)(稱為R)的數(shù)量.根據(jù)MYB重復(fù)數(shù)和MYB重復(fù)序列的特性,MYB蛋白質(zhì)一般分為MYB-related、R2R3-MYB、R1R2R3-MYB和4R-MYB蛋白質(zhì)[1].在這四種類型中,R2R3MYB是高等植物特有的,在大多數(shù)植物中數(shù)量占優(yōu)勢(shì),其特點(diǎn)是存在保守的MYB結(jié)構(gòu)域和高度可變的C-末端區(qū)域[6, 7].MYB TFs是植物中最大的TF類之一,該類TF的規(guī)模主要?dú)w因于R2R3-MYB TF家族的迅速擴(kuò)張[8].先前的研究表明, R2R3-MYB TFs的數(shù)量隨著綠色植物進(jìn)化過程而增加[9].
越來越多的證據(jù)表明,R2R3MYB轉(zhuǎn)錄因子參與植物許多生理生化過程,如葉毛狀體分化[10]、次生壁形成[11]、花藥和花粉發(fā)育[12, 13]、腋生分生組織形成[14],二次代謝的調(diào)節(jié)包括類黃酮[15]、花青素[16]和木質(zhì)素[17].除此之外,R2R3MYB家族成員還參與植物對(duì)各種非生物和生物脅迫的防御和響應(yīng)[18-20],并在調(diào)節(jié)植物對(duì)包括吲哚乙酸[21]、脫落酸[21, 22]、赤霉素[23, 24]、乙烯、水楊酸和茉莉酸[24]等植物激素線索的反應(yīng)中發(fā)揮了作用,以及一些環(huán)境信號(hào)響應(yīng),如水可用性[25],光[26]和營(yíng)養(yǎng)元素[27].
隨著多種植物的全基因組測(cè)序完成,實(shí)驗(yàn)技術(shù)及手段的進(jìn)步,使得科研人員可以對(duì) R2R3-MYB 基因家族在內(nèi)的基因資源進(jìn)行更為廣泛和深入的研究.對(duì)于R2R3-MYB轉(zhuǎn)錄因子的生物功能研究也有了很大的進(jìn)展,越來越多的R2R3-MYB轉(zhuǎn)錄因子的功能被揭示.雖然在一些物種中已經(jīng)對(duì)該家族進(jìn)行了全基因組分析,但對(duì)簸箕柳(Salixsuchowensis)的R2R3-MYB基因知之甚少.簸箕柳屬于楊柳科中的柳屬,筐柳組,因其枝條強(qiáng)韌,經(jīng)常被用來編制筐籃等農(nóng)具,是一種有發(fā)展前途的經(jīng)濟(jì)植物.除此之外,簸箕柳也可用作固砂樹種、河堤邊的防浪林樹種,具有一定的生態(tài)價(jià)值.對(duì)簸箕柳進(jìn)行R2R3-MYB基因的全基因組鑒定,且對(duì)其進(jìn)行該家族的多樣性、進(jìn)化和其功能研究,有助于了解該蛋白的擴(kuò)展過程和機(jī)制以及隨后該蛋白的亞功能化和新功能化機(jī)制.進(jìn)一步探索R2R3-MYB參與簸箕柳生命生長(zhǎng)過程的途徑、方式、調(diào)控機(jī)制還可以為改良作物遺傳及抗逆提供理論依據(jù)及支持,也可以直接作為基因資源加以利用.更為詳細(xì)的關(guān)于系統(tǒng)發(fā)育分析、輔助基序和DNA結(jié)合特異性的發(fā)現(xiàn)也會(huì)為深入了解植物R2R3-MYB轉(zhuǎn)錄因子的進(jìn)化史提供線索.除此之外,因簸箕柳枝條強(qiáng)勁、十分耐澇,是河堤邊防浪林樹種的良好選擇,其具有耐性和韌性的枝條在水波中起到了很好的緩沖作用,但洪水或者大風(fēng)天過后往往造成樹木的倒伏,研究簸箕柳的抗重力刺激響應(yīng)為后期提升簸箕柳的抗倒伏性能提供了一定的理論基礎(chǔ).
從PopGenIE[28]數(shù)據(jù)庫(http://popgenie.org/)下載簸箕柳的基因組、蛋白質(zhì)序列和注釋文件;從轉(zhuǎn)錄因子數(shù)據(jù)庫PlantTFDB[29]v5.0(http://planttfdb.gao-lab.org/)下載擬南芥MYB轉(zhuǎn)錄因子蛋白序列.
2.2.1 簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族的鑒定及其保守結(jié)構(gòu)域分析 根據(jù)Pfam數(shù)據(jù)庫[30](http://pfam.xfam.org/)中MYB轉(zhuǎn)錄因子家族保守結(jié)構(gòu)域的HMM文件(PF00249),用HMMER 3.0[31]軟件對(duì)簸箕柳蛋白質(zhì)序列進(jìn)行本地搜索.將擬南芥R2R3-MYB轉(zhuǎn)錄因子蛋白序列作為查詢序列,對(duì)簸箕柳蛋白質(zhì)數(shù)據(jù)庫進(jìn)行BLASTP搜索.將簸箕柳蛋白質(zhì)序列傳入iTAK數(shù)據(jù)庫[32](http://itak.feilab.net/cgi-bin/itak/index.cgi)進(jìn)行線上轉(zhuǎn)錄因子家族鑒定.將上述方法得到的蛋白序列整合、去除冗余后,批量搜索Pfam數(shù)據(jù)庫[30]和NCBI-CDD數(shù)據(jù)庫[33](https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)去除結(jié)構(gòu)域不完整的蛋白序列.將鑒定出的蛋白進(jìn)行重新命名:SsMYB001-SsMYB158.
將上一步鑒定出的簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族的蛋白序列導(dǎo)入ClustalW[34]進(jìn)行多序列比對(duì),將得到的結(jié)果進(jìn)行統(tǒng)計(jì).利用網(wǎng)絡(luò)服務(wù)器MEME[35](http://meme-suite.org/tools/meme)繪制保守結(jié)構(gòu)域sequence logo圖形.
2.2.2 系統(tǒng)發(fā)育、基序組成、基因結(jié)構(gòu)分析 將上一步鑒定出來的簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族成員的序列導(dǎo)入MAGA-X[36]軟件,采用MAGA-X自帶的ClustalW進(jìn)行多序列比對(duì),鄰接法(NJ),檢驗(yàn)參數(shù)(Bootstrap)設(shè)置為1000,進(jìn)行系統(tǒng)發(fā)育分析,將得到的結(jié)果進(jìn)行亞組分類.使用網(wǎng)絡(luò)服務(wù)器MEME[35]尋找簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族成員的保守基序,預(yù)期搜索數(shù)量設(shè)置為20,允許最小寬度為6,允許最大寬度為50.
使用在線軟件iTOL[37](https://itol.embl.de/)進(jìn)行系統(tǒng)進(jìn)化分析和基序組成分析可視化.根據(jù)簸箕柳注釋文件,使用TBtools[38]進(jìn)行基因結(jié)構(gòu)分析可視化.
2.2.3 亞細(xì)胞定位及理化性質(zhì)分析 使用在線軟件CELLO[39](http://cello.life.nctu.edu.tw/)對(duì)簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族成員進(jìn)行亞細(xì)胞定位預(yù)測(cè).采用本地Perl腳本對(duì)簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族成員的基本理化性質(zhì)進(jìn)行分析,如理論等電點(diǎn)(pI)、分子量等.
2.2.4 染色體定位和基因復(fù)制分析 采用多重共線性工具包MCScanX[40]對(duì)簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族成員進(jìn)行基因復(fù)制事件分析,利用TBtools[38]和Circos[41]工具繪制共線性圖形.采用kaks_Calculator2.0[42]軟件計(jì)算基因?qū)Φ膋a/ks值.使用RepeatMasker[43]對(duì)簸箕柳基因組進(jìn)行重復(fù)序列鑒定,并統(tǒng)計(jì)重復(fù)序列和基因密度,基于相對(duì)于染色體其他區(qū)域的高重復(fù)序列豐度和低基因含量,預(yù)測(cè)了每條染色體的著絲粒位置.
2.2.5 GO注釋與基因表達(dá)分析 將SsMYBs與NCBI的Nr數(shù)據(jù)庫進(jìn)行blast比對(duì),結(jié)果導(dǎo)入Blast2GO[44],最后使用R語言的GGplot2將注釋結(jié)果可視化.
從NCBI_SRA數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/sra/)下載簸箕柳重力刺激相關(guān)RNA-Seq數(shù)據(jù)(SRA號(hào):SRR9849616、SRR9849619-SRR9849623).運(yùn)用HISAT2+Stringtie[45, 46]流程計(jì)算各基因表達(dá)量,再使用DEseq2[47]對(duì)兩組數(shù)據(jù)進(jìn)行差異表達(dá)分析,選擇logFC絕對(duì)值大于1且FDR小于0.01的基因?yàn)椴町惐磉_(dá)基因.
在簸箕柳中,經(jīng)Pfam數(shù)據(jù)庫和NCBI-CDD數(shù)據(jù)庫驗(yàn)證,去除相關(guān)結(jié)構(gòu)域不完整的蛋白序列,一共鑒定出158個(gè)簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族成員.將鑒定出的蛋白進(jìn)行重新命名:SsMYB001-SsMYB158.
在植物界,R2R3-MYB是MYB蛋白中最大的一個(gè)亞群,它含有由兩個(gè)相鄰MYB重復(fù)序列組成的高度保守的DNA結(jié)合域[48].為了探索SsMYBs(R2R3-MYB)成員結(jié)構(gòu)域的特征,提取了SsMYBs成員的MYB結(jié)構(gòu)域,并對(duì)其氨基酸序列進(jìn)行了多重序列比對(duì),結(jié)果可以用來檢測(cè)SsMYBs蛋白的R2和R3重復(fù)序列中每個(gè)殘基位置的保守性.通過數(shù)據(jù)統(tǒng)計(jì)和MEME可視化得到結(jié)構(gòu)域的一致性序列(圖1)和相關(guān)sequence logo(圖2).結(jié)果顯示,SsMYBs結(jié)構(gòu)域平均約含有105個(gè)氨基酸殘基(圖2),兩個(gè)重復(fù)序列中插入或缺失頻率很低.
根據(jù)先前的報(bào)道,R2和R3重復(fù)序列具有特征性氨基酸,包括一系列分布均勻且高度保守的Trp(W)色氨酸(或疏水氨基酸)殘基[7].在158個(gè)
圖1 簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族的保守結(jié)構(gòu)域橫坐標(biāo)為重復(fù)序列中氨基酸出現(xiàn)的相對(duì)位點(diǎn),縱坐標(biāo)為該位點(diǎn)占比最大氨基酸的百分比Fig.1 The conserve domain of S.suchowensis R2R3-MYB proteins
圖2 SsMYBs保守結(jié)構(gòu)域sequence logo圖Fig.2 The sequence logo of conserve domain of SsMYBs
SsMYBs蛋白中,R2重復(fù)序列含有3個(gè)色氨酸殘基,其分別位于第6、26和46位,這些色氨酸殘基形成疏水核心,是植物MYB結(jié)構(gòu)域的典型標(biāo)志.其中,其中第一個(gè)色氨酸殘基有部分被組氨酸(H)絲氨酸等殘基替代,第二個(gè)色氨酸殘基有部分被天冬酰胺(N)替代.在R3重復(fù)序列中,大多數(shù)成員的第一個(gè)色氨酸殘基(位于6)被苯丙氨酸(F)取代,第二個(gè)色氨酸殘基(位于25)和第三個(gè)色氨酸殘基(位于44)在幾乎所有SsMYBs中都很好地保存,尤其是存在于所有成員中的第二個(gè)色氨酸殘基.除了保守的W外,R2重復(fù)序列末端還存在十二個(gè)高度保守的氨基酸殘基:R-37、G-39、K-40、S-41、C-42等,R3重復(fù)序列中的E-10、G-22、A-29等也高度保守(圖2).如圖1所示,SsMYBs結(jié)合域中的保守區(qū)域主要位于兩個(gè)R重復(fù)序列的第二個(gè)和第三個(gè)色氨酸殘基(每個(gè)重復(fù)序列中HTH結(jié)構(gòu)域的第三螺旋)之間.SsMYBs結(jié)合域中每個(gè)R重復(fù)序列的第一個(gè)和第二個(gè)色氨酸殘基(第一螺旋)之間的氨基酸序列相對(duì)不保守.除此之外,通過sequence logo(圖2)可以更直觀的看出R3重復(fù)片段結(jié)構(gòu)域比R2要更為保守.相比之下,SsMYBs結(jié)構(gòu)域以外的區(qū)域在長(zhǎng)度和氨基酸組成方面的保守性較差.
通過多重序列比對(duì)和Bootstrap分析,研究了SsMYBs轉(zhuǎn)錄因子家族成員的系統(tǒng)發(fā)育分析(圖3).除SsMYB101未能很好地成簇外,其余157個(gè)家族成員一共被分為了23個(gè)亞組,不同的顏色代表了不同的亞組(圖3).基因結(jié)構(gòu)也可以提供進(jìn)化信息[49].為了深入了解SsMYBs家族的進(jìn)化,對(duì)158個(gè)SsMYBs基因的內(nèi)含子外顯子的數(shù)目和排列進(jìn)行了分析.結(jié)果表明,同一亞組中的基因通常具有相似的內(nèi)-外顯子結(jié)構(gòu)(圖3).SsMYBs成員的基因結(jié)構(gòu)存在顯著差異,包括外顯子和內(nèi)含子的數(shù)目和相對(duì)位置.其中,內(nèi)含子的數(shù)目從0到12不等,大多數(shù)基因有兩個(gè)內(nèi)含子(65%)或一個(gè)內(nèi)含子(23%).在四個(gè)SsMYBs基因中發(fā)現(xiàn)了三個(gè)內(nèi)含子:SsMYB069,SsMYB027,SsMYB033,SsMYB053.而在SsMYB059、SsMYB034、SsMYB058和SsMYB046中分別發(fā)現(xiàn)了7、10、11和12個(gè)內(nèi)含子.此外,10個(gè)SsMYBs基因被發(fā)現(xiàn)是無內(nèi)含子的.同一亞群中同源性最高的成員通常具有相同或平行的外顯子/內(nèi)含子模式,表現(xiàn)出相似的數(shù)量、位置和外顯子長(zhǎng)度.例如,C2中的七個(gè)SsMYBs擁有兩個(gè)外顯子和一個(gè)內(nèi)含子、C4中的兩個(gè)SsMYBs沒有內(nèi)含子、C11中的十個(gè)SsMYBs包括三個(gè)外顯子和兩個(gè)內(nèi)含子.但是,在C12和C18中各存在一個(gè)例外,SsMYB034、SsMYB059的外顯子和內(nèi)含子的位置以及長(zhǎng)度與同組其他成員存在顯著差異,成員間的遺傳相似性較低.值得注意的是,在每個(gè)亞組的末端節(jié)點(diǎn)中發(fā)現(xiàn)一對(duì)或多對(duì)高度同源的SsMYBs,這表明這些蛋白質(zhì)具有相似的功能.
利用MEME程序預(yù)測(cè)了SsMYBs蛋白的保守基序,共鑒定出20個(gè)不同的基序.這些基序被命名為基序1~20,同一亞組的SsMYB成員具有相似的基序結(jié)構(gòu).值得注意的是,motif14只在C7亞組中存在,motif8、motif10、motif13只在C2亞組中存在且十分保守,motif12只在C6亞組中存在,motif17只在C10亞組中存在,motif17只在C17亞組中存在,motif15只在C18亞組中存在.這些亞組中特有的motif可能有助于其功能分化.在同一亞組的成員,通常具有相似的基序組成和相似的基因結(jié)構(gòu)(圖3).
SsMYBs蛋白的長(zhǎng)度在164到1041個(gè)氨基酸之間,長(zhǎng)度普遍位于200~400 aa,平均長(zhǎng)度為332 aa.其中,SsMYB099是最長(zhǎng)的蛋白質(zhì),含有1041個(gè)氨基酸;SsMYB152和SsMYB106是最短的蛋白質(zhì),各含有164個(gè)氨基酸.SsMYBs的分子量在18.3到117.3 kD之間,平均分子量是37.2 kD.SsMYBs的理論等電點(diǎn)在4.61到10.14之間.158個(gè)SsMYBs蛋白呈現(xiàn)不規(guī)則的理論等電點(diǎn)特征,75個(gè)酸性蛋白(47.5%)和83個(gè)堿性蛋白(52.5%).大部分SsMYBs蛋白(87%)的亞細(xì)胞定位結(jié)果顯示其位于細(xì)胞核內(nèi)的.
圖 3 簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族的保守結(jié)構(gòu)域的系統(tǒng)發(fā)育樹、motif組成及基因結(jié)構(gòu)
片段重復(fù)和串聯(lián)復(fù)制是導(dǎo)致植物基因家族擴(kuò)張的兩個(gè)主要原因,由同一基因座擴(kuò)張而來的基因往往具有相似度較高的序列.根據(jù)簸箕柳注釋信息,對(duì)SsMYB基因進(jìn)行染色體定位分析,有7個(gè)基因無法定位到簸箕柳19條染色體上,而其余151個(gè)基因則不均勻、無規(guī)律地分布于19條染色體上(圖4).其中1號(hào)染色體上該家族基因數(shù)目最多,有15個(gè);11號(hào)染色體上的最少,只有一條.SsMYB基因在1、2、3號(hào)等染色體有較高的密度.相反,一些大的染色體區(qū)域缺乏SsMYB基因,如11號(hào)染色體的中央和底部部分、14號(hào)染色體的底部.
在SsMYB基因中存在兩組串聯(lián)復(fù)制,涉及5個(gè)SsMYB基因,分別位于13號(hào)染色體和19號(hào)染色體.此外,使用MCScanX對(duì)SsMYB基因進(jìn)行片段重復(fù)或全基因組重復(fù)分析(圖5).共鑒定出83個(gè)片段重復(fù)對(duì),涉及101個(gè)SsMYB基因.在這101個(gè)SsMYB基因中,58個(gè)基因只出現(xiàn)一次記錄,43個(gè)基因存在于不止一次的片段重復(fù)事件中.這些結(jié)果表明,約(104)65%的SsMYB基因可能是由重復(fù)事件產(chǎn)生的,在簸箕柳MYB基因家族的擴(kuò)展中起主要作用.
Ka/Ks比值用于估計(jì)中性突變、純化選擇和有益突變之間的平衡.計(jì)算了串聯(lián)和片段復(fù)制基因?qū)Φ腒a/Ks比值.結(jié)果表明,所有Ka/Ks比值均小于1,表明簸箕柳MYB復(fù)制成員在進(jìn)化過程中可能經(jīng)歷了純化選擇壓力.
圖 4 簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族在染色體上的分布和串聯(lián)復(fù)制事件
圖5 簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族的片段復(fù)制事件
相似的基因在不同物種中,其功能往往保守的.為了探索SsMYBs的功能,對(duì)這158個(gè)成員進(jìn)行了GO注釋.GO注釋可以預(yù)測(cè)一個(gè)功能未知基因可能執(zhí)行的分子功能(Molecular Function)、可能處于的細(xì)胞組分(Cellular Component)以及可能參與的生物學(xué)過程(Biological Process)[44].
簸箕柳MYB成員的GO注釋中分子功能結(jié)果顯示(圖6),大部分成員被預(yù)測(cè)為起轉(zhuǎn)錄調(diào)控(46)、細(xì)胞分化(23)、氣孔運(yùn)動(dòng)調(diào)節(jié)(7)等功能.對(duì)于細(xì)胞組分,約96%(151)的成員預(yù)測(cè)為處于細(xì)胞核內(nèi).對(duì)于生物學(xué)過程,大部分成員被預(yù)測(cè)為參與DNA 結(jié)合、轉(zhuǎn)錄調(diào)控區(qū)域特異性DNA結(jié)合、DNA結(jié)合轉(zhuǎn)錄因子活性、轉(zhuǎn)錄協(xié)同調(diào)節(jié)活性、序列特異性DNA結(jié)合等生物學(xué)過程.
圖 6 SsMYB蛋白的GO注釋Fig.6 Gene ontology annotation of SsMYB proteins
R2R3-MYB家族成員參與植物對(duì)各種非生物和生物脅迫的防御和響應(yīng)[18-20],并在調(diào)節(jié)植物對(duì)包括吲哚乙酸[21]、脫落酸[21, 22]、生長(zhǎng)素[50]等植物激素線索的反應(yīng)中發(fā)揮重要了作用.重力是調(diào)節(jié)植物生長(zhǎng)和發(fā)育的一種普遍輸入,各種植物譜系和器官已經(jīng)進(jìn)化不同的機(jī)制來調(diào)節(jié)相對(duì)于重力的生長(zhǎng)方向[51].在被子植物中,重力刺激的反應(yīng)木被稱為張力木,形成于莖的上側(cè),且產(chǎn)生張力,將莖向上拉.張力木是通過維管形成層中細(xì)胞分裂速率的增加而產(chǎn)生的,其特征是導(dǎo)水導(dǎo)管元件數(shù)量減少,并且含有凝膠細(xì)胞壁層(G層)的特殊張力木纖維被認(rèn)為是張力產(chǎn)生的核心[52].
圖 7 SsMYB基因在簸箕柳重力刺激下的差異表達(dá)分析Fig.7 Expression analysis of SsMYB gene under gravistimulation of S.suchowensis
為了探究SsMYBs在簸箕柳應(yīng)對(duì)重力刺激時(shí)可能發(fā)揮的作用,對(duì)正常莖和重力刺激下莖的張力木進(jìn)行差異表達(dá)分析,選取logFC>1或<-1和padj<0.01的MYB基因?yàn)椴町惐磉_(dá)基因.共篩選出20個(gè)差異表達(dá)R2R3-MYB基因(圖7),上調(diào)基因有11個(gè),下調(diào)基因9個(gè).其中,SsMYB103為顯著下調(diào)基因,其在擬南芥中的同源基因(AtMYB15)為擬南芥激活木質(zhì)素生物合成基因所必需的調(diào)節(jié)因子[53].G層的特征是低木質(zhì)素、高纖維素[52].推測(cè)SsMYB103參與了G層的形成進(jìn)而推動(dòng)了簸箕柳莖的背地性響應(yīng).
MYB家族是植物最大的轉(zhuǎn)錄因子家族之一,參與了植物的多種重要生物學(xué)過程,如初級(jí)和次級(jí)代謝、發(fā)育過程、生物和非生物脅迫反應(yīng)、細(xì)胞和器官形態(tài)發(fā)生以及細(xì)胞周期控制[3, 54].MYB轉(zhuǎn)錄因子的進(jìn)化和功能一直是研究的熱點(diǎn).MYB轉(zhuǎn)錄因子已在一些植物物種中被鑒定與分析,如擬南芥、水稻、馬鈴薯和茶樹[55-58],但對(duì)于簸箕柳MYB家族的了解卻很少.
本研究在簸箕柳中一共鑒定出158個(gè)R2R3-MYB轉(zhuǎn)錄因子家族成員.對(duì)這158個(gè)成員先后進(jìn)行了保守結(jié)構(gòu)域、系統(tǒng)進(jìn)化、基因結(jié)構(gòu)、基序組成、亞細(xì)胞定位、理化性質(zhì)、染色體定位、基因復(fù)制事件以及GO注釋等分析.
多序列比對(duì)后,發(fā)現(xiàn)SsMYBs結(jié)構(gòu)域平均約含有105個(gè)氨基酸殘基,其中,R2重復(fù)序列含有3個(gè)色氨酸殘基來形成疏水核心,R3重復(fù)序列中,其疏水核心中第一個(gè)色氨酸殘基被苯丙氨酸取代,第二個(gè)和第三個(gè)色氨酸殘基保守性很強(qiáng).相比之下,SsMYBs結(jié)構(gòu)域以外的區(qū)域在長(zhǎng)度和氨基酸組成方面的保守性較差,與之前其他植物該家族結(jié)構(gòu)域的研究一致.隨后進(jìn)行系統(tǒng)進(jìn)化分析,除SsMYB101未能很好地成簇外,其余157個(gè)家族成員一共被分為了23個(gè)亞組.在同一亞組中的基因通常具有相似的內(nèi)含子-外顯子結(jié)構(gòu)和相似的基序組成.值得注意的是,某些motif只存在于特定的亞組,這些亞組特異性motif可能有助于其功能分化.簸箕柳染色體組裝還不足夠完善,這可能是導(dǎo)致7個(gè)SsMYBs無法定位到染色體上的原因,其余151個(gè)基因則在19條染色體上不均勻、無規(guī)律地分布.片段重復(fù)和串聯(lián)復(fù)制是導(dǎo)致植物基因家族擴(kuò)展的兩個(gè)主要原因.在SsMYBs中存在兩組串聯(lián)復(fù)制事件,和83個(gè)片段重復(fù)對(duì),這些結(jié)果表明,片段重復(fù)和串聯(lián)復(fù)制在簸箕柳MYB基因家族的擴(kuò)展中起主要作用.Ka/Ks比值用于估計(jì)中性突變、純化選擇和有益突變之間的平衡.計(jì)算了串聯(lián)和片段復(fù)制基因?qū)Φ腒a/Ks比值.結(jié)果顯示,所有Ka/Ks比值均小于1,表明簸箕柳MYB復(fù)制成員在進(jìn)化過程中可能經(jīng)歷了純化選擇壓力.采用Blast2GO[44]對(duì)SsMYBs進(jìn)行GO注釋.大多數(shù)SsMYBs被預(yù)測(cè)位于細(xì)胞核內(nèi),約占96%.SsMYBs被預(yù)測(cè)參與簸箕柳很多的生物學(xué)過程,其中46位成員被預(yù)測(cè)為參與轉(zhuǎn)錄調(diào)控過程、23位成員被預(yù)測(cè)為參與細(xì)胞分化過程等.大多數(shù)SsMYBs被預(yù)測(cè)起DNA綁定分子功能.除此之外,本研究對(duì)簸箕柳莖抗重力刺激應(yīng)答相關(guān)的SsMYB進(jìn)行了分析.共鑒定出20個(gè)差異表達(dá)基因.其中,SsMYB103為顯著下調(diào)基因,為擬南芥AtMYB15的同源基因,可能通過參與了G層的形成進(jìn)而推動(dòng)了簸箕柳莖的背地性響應(yīng).
綜上所述,本研究對(duì)簸箕柳R2R3-MYB轉(zhuǎn)錄因子家族進(jìn)行了全基因組水平的鑒定與分析,為簸箕柳R2R3-MYB基因功能研究和家族特性提供了全面系統(tǒng)的信息,并為改善簸箕柳的生長(zhǎng)調(diào)節(jié)和抗倒伏性能提供了有價(jià)值的信息.