馬 霜 王博雅 曹 穎 胡尚連 高志民
(1. 西南科技大學(xué)生命科學(xué)與工程學(xué)院,綿陽 621000;2. 國家林業(yè)和草原局∕北京竹藤科學(xué)與技術(shù)重點(diǎn)開放實(shí)驗(yàn)室,國際竹藤中心竹藤資源基因科學(xué)與基因產(chǎn)業(yè)化研究所,北京 100102)
擴(kuò)展蛋白(Expansin)是一類參與細(xì)胞壁松弛功能的非酶類活性蛋白,其特異性為僅在酸性條件下作用于植物細(xì)胞壁,調(diào)控植物的生長發(fā)育。1992 年在黃瓜()中首次發(fā)現(xiàn)擴(kuò)展蛋白之后,又鑒定出有多種擴(kuò)展蛋白,根據(jù)結(jié)構(gòu)將其分為EXPA(Expansin A)、EXPB(Expansin B)、EXLA(Expansin-like A)、EXLB(Expansin-like B)四個亞家族。雙子葉和非禾本科單子葉植物的擴(kuò)展蛋白大多為EXPA,禾本科單子葉植物中的多為EXPB,而EXLA 和EXLB 鮮有報(bào)道,且家族功能尚未清楚。擴(kuò)展蛋白通常具有組織表達(dá)特異性,在與細(xì)胞壁修飾相關(guān)的各種生物學(xué)過程中發(fā)揮重要作用,如種子萌發(fā)、根系發(fā)育、葉片生長、花芽發(fā)育、莖和節(jié)間伸長以及生物和非生物脅迫響應(yīng)等。近年來從轉(zhuǎn)錄組水平和全基因組水平對擴(kuò)展蛋白進(jìn)行的研究越來越多,如在擬南芥()、水稻()、玉米()、煙草()、甘蔗()、二穗短柄草()中分別鑒定出31、40、88、52、92和38個成員。然而,在分子層面上擴(kuò)展蛋白是如何影響植物細(xì)胞壁和器官生長發(fā)育的研究甚少,尤其是有關(guān)竹子中的擴(kuò)展蛋白功能相關(guān)的研究尚未見報(bào)道。
竹子因具有生長快、材性好等優(yōu)點(diǎn),在木材供給不足的情況下是優(yōu)良的木材替代品。毛竹()是我國最具特色的木本竹資源,也是經(jīng)濟(jì)價值總量最高的竹種。人們已從解剖、生理生化、材料力學(xué)等多個方面對毛竹進(jìn)行了大量研究,隨著毛竹基因組草圖的發(fā)布,從分子層面的研究工作已全面展開。如木質(zhì)素是影響竹材材性的重要因素之一,其生物合成受到多種遺傳因子的參與,在毛竹基因組中鑒定出15 個s 和12 個s,它們是與細(xì)胞壁生物合成和次生細(xì)胞壁沉積有關(guān)的關(guān)鍵轉(zhuǎn)錄因子;另外,鑒定出19 個同源異型盒基因參與木質(zhì)部發(fā)育和木質(zhì)部與韌皮部模式形成調(diào)控,其中3個屬于KNOX 家族的成員作為核心調(diào)控因子與MYB、bHLH、OVATE 等轉(zhuǎn)錄因子共同發(fā)揮作用。然而,作為細(xì)胞壁蛋白,擴(kuò)展蛋白對毛竹的生長發(fā)育、竹材性能等方面的功能尚為空白。本研究采用生物信息學(xué)方法對毛竹中擴(kuò)展蛋白家族成員進(jìn)行了系統(tǒng)分析,并用qRT-PCR 技術(shù)分析了各基因在不同組織中的表達(dá)模式,以期為進(jìn)一步研究毛竹擴(kuò)展蛋白的生物學(xué)功能提供參考依據(jù)。
源自廣西省桂林地區(qū)的毛竹種子,播種萌發(fā)后置于溫度18 ℃∕22 ℃,光照200 μmol·m·s,光周期為光照16 h黑暗8 h的溫室中生長。選取3個月健康的實(shí)生苗,采集其根、莖、未展開葉(卷曲的幼葉)、展開葉(成熟葉)、老葉(基部泛黃葉片)5個不同組織,立即在液氮中冷凍至少10 min,并保存在-80 ℃冰箱中。
利用PLAZA數(shù)據(jù)庫(https:∕∕bioinformatics.psb.ugent.be∕plaza∕)和美國國立生物技術(shù)信息中心數(shù)據(jù)庫(NCBI)(https:∕∕www.ncbi.nlm.nih.gov∕)分別下載毛竹和水稻擴(kuò)展蛋白基因序列。通過和水稻擴(kuò)展蛋白基因進(jìn)行保守結(jié)構(gòu)域比對,篩選毛竹編碼擴(kuò)展蛋白完整結(jié)構(gòu)域的基因。利用MEGA 軟件采用Neighbor-joining 算法構(gòu)建基于毛竹和水稻擴(kuò)展蛋白的氨基酸序列的系統(tǒng)進(jìn)化樹,對結(jié)果使用“Bootstrap method”(replications 為1 000)來檢驗(yàn)進(jìn)化樹可靠性。在BambooGDB 上查找毛竹擴(kuò)展蛋白基因所在的Scaffold位置,并利用TBtools軟件作圖。利用在線工具GSDS 基因結(jié)構(gòu)分析軟件(http:∕∕gsds.cbi.pku.edu.cn∕)展示毛竹擴(kuò)展蛋白基因的基因結(jié)構(gòu)。
根據(jù)氨基酸的同義密碼子相對使用度(relative synonymous codon usage,RSCU),計(jì)算出相對同義密碼子使用頻率(relative frequency of synonymous codon,RFSC)。利用Codon W v1.4.4 密碼子分析軟件及EMBOSS(歐洲分子生物學(xué)開放軟件系統(tǒng))在線分析軟件(http:∕∕www.bioinformatics.nl∕emboss-explorer∕)中的CHIPS 程序?qū)γ駭U(kuò)展蛋白密碼子偏好性進(jìn)行統(tǒng)計(jì)分析。
利用在線工具ExPaSy 蛋白質(zhì)性質(zhì)分析軟件(https:∕∕www.expasy.org∕)計(jì)算每個蛋白序列的分子量和等電點(diǎn)等參數(shù)。利用在線軟件SOPMA(https:∕∕prabi.ibcp.fr∕htm∕site∕web∕home)和SWISSMODEL(https:∕∕swissmodel.expasy.org∕interactive)分析蛋白二級、三級結(jié)構(gòu)。
利用Prime Primer 5.0 軟件設(shè)計(jì)毛竹擴(kuò)展蛋白基因的實(shí)時定量PCR(qRT-PCR)引物(見表1),用Trizol 試劑(Takara)從保存的樣品(毛竹實(shí)生苗的根、莖、未展開葉、展開葉和老葉)中提取總RNA,用DNase Ⅰ(Takara)處理后用AMV逆轉(zhuǎn)錄酶(Promega)合成第一條cDNA 鏈,用于隨后的實(shí)時定量PCR(qRT-PCR)檢測表達(dá)模式。qRT-PCR 反應(yīng)體系為10 μL,包括0.8 μL的cDNA樣品,各0.2 μL的正反向引物,5 μL 的2×SYBR PCR mix,3.8 μL 的滅菌水,熱循環(huán)為:94 ℃1 min;94 ℃10 s,62 ℃10 s,72 ℃10 s,45 次循環(huán)。以內(nèi)參引物液泡膜內(nèi)嵌蛋白41 基因()為對照,構(gòu)建溶解曲線,使用2方法計(jì)算相對表達(dá)量,分析各基因的表達(dá)特異性。
表1 實(shí)時定量PCR引物序列Table 1 Primer sequences used in real-time quantitative PCR
從毛竹數(shù)據(jù)庫中查找擴(kuò)展蛋白同源基因47個。以水稻擴(kuò)展蛋白序列作為查詢序列,對候選基因進(jìn)行tblastn,剔除4 個E 值不滿足1×10的候選基因,最終獲得毛竹擴(kuò)展蛋白家族基因成員43個。
分別屬于4 個亞家族,依次命名為~、~、~和?;?組定 位分 析表明,43 個毛竹擴(kuò)展蛋白基因分布在37 個Scaffold上,較為分散且分布不均勻,但也有同一亞家族成員定位在同一Scaffold 上的成簇現(xiàn)象,如PH01000397和PH01001155上分別包含4個EXPB基因成員(見圖1),毛竹擴(kuò)展蛋白的成簇現(xiàn)象和水稻擴(kuò)展蛋白的成簇現(xiàn)象一致,成簇基因之間遺傳距離較近,成簇現(xiàn)象可能與進(jìn)化過程中的基因組復(fù)制有關(guān)。
圖1 毛竹擴(kuò)展蛋白基因在Scaffold上的分布Fig.1 Distribution of moso bamboo expansin genes on Scaffolds
對毛竹擴(kuò)展蛋白基因序列統(tǒng)計(jì)分析顯示,43個擴(kuò)展蛋白基因的CDS長度介于273~1 527 bp,編碼氨基酸長度91~508 aa。基因結(jié)構(gòu)分析顯示,除外均含有內(nèi)含子,大部分為1~3 個,最多的為11個()(見圖2),顯示出該家族基因成員的多樣性。進(jìn)一步分析發(fā)現(xiàn),同一亞家族中的成員具有相似的基因結(jié)構(gòu),如EXPA亞家族成員的大多數(shù)成員有2 個內(nèi)含子,EXPB 亞家族成員的大多數(shù)成員有3 個內(nèi)含子,EXLA 亞家族成員更趨向于4 個內(nèi)含子,表明它們進(jìn)化上具有一定的保守性。
圖2 毛竹擴(kuò)展蛋白家族成員的系統(tǒng)進(jìn)化樹和基因結(jié)構(gòu)Fig.2 Phylogenetic tree and gene structure of the expansin family members in moso bamboo
構(gòu)建基于毛竹、水稻和擬南芥擴(kuò)展蛋白氨基酸序列的系統(tǒng)進(jìn)化樹,分析發(fā)現(xiàn)它們被劃分為EXPA、EXPB、EXLA 和EXLB 四個亞家族,其中分別含有毛竹擴(kuò)展蛋白成員18個、17個、7個和1個,四個亞家族比例也與其它單子葉物種的比例相似,其中EXPA 和EXPB 亞家族成員所占比例較大,EXLA 亞家族成員較少,而毛竹、水稻和擬南芥中EXLB亞家族成員均只存在1個成員。
對毛竹擴(kuò)展蛋白的氨基酸序列統(tǒng)計(jì)分析表明,不同亞家族成員間序列長度存在著一定的差別,EXPA 亞家族成員蛋白的長度范圍為125~275 aa,平均長度為218 aa;EXPB亞家族成員的蛋白質(zhì)長度范圍為91~307 aa,平均長度為245 aa。EXLA亞家族的蛋白質(zhì)長度范圍為251~303 aa,平均長度為275 aa,而PeEXLB1 的長度最長為508 aa;蛋白分子量最小為12.52 kDa(PeEXB3),最大為76.77 kDa(PeEXLB1);不穩(wěn)定系數(shù)只有PeEXPB3低于10,脂肪系數(shù)為59~87.29,大部分蛋白為親水性蛋白;有12 個擴(kuò)展蛋白的理論等電點(diǎn)均<7,為酸性蛋白,而其它31個均為堿性蛋白(見表2)。
表2 毛竹擴(kuò)展蛋白的基本理化性質(zhì)分析Table 2 Analysis of basic physicochemical properties of expansins in moso bamboo
密碼子偏好性對基因的轉(zhuǎn)錄和翻譯過程具有重要調(diào)節(jié)作用,分析密碼子對于理解基因表達(dá)是非常必要的。對毛竹43 個擴(kuò)展蛋白家族成員的10 387 個密碼子進(jìn)行使用偏好性統(tǒng)計(jì)分析,篩選高頻密碼子,即某一個密碼子的RFSC大于60%或某一個密碼子的RFSC 超過其對應(yīng)氨基酸的同義密碼子平均頻率的1.5 倍。例如編碼苯丙氨酸(Phe)的UUU,其RFSC值為11%,而同為編碼苯丙氨酸的UUC,其RFSC 值為89%,即對苯丙氨酸而言UUC 具有明顯的偏好性。結(jié)果發(fā)現(xiàn),所有氨基酸(包括終止密碼子)都具有高頻密碼子,共計(jì)23個,其中亮氨酸(Leu)、纈氨酸(Val)、絲氨酸(Ser)、脯氨酸(Pro)均具有2個高頻密碼子(見表3)。
表3 毛竹擴(kuò)展蛋白基因密碼子的相對使用頻率Table 3 Relative usage frequency of gene codons in the expansins of moso bamboo(%)
蛋白二級結(jié)構(gòu)分析發(fā)現(xiàn),43 個毛竹擴(kuò)展蛋白均包含α螺旋、β折疊、β轉(zhuǎn)角、無規(guī)卷曲4種結(jié)構(gòu),除PeEXPB14 和PeEXLB16 中 的β 轉(zhuǎn) 角 比 例(11.25%和13.56%)略高于α 螺旋的比例外,其余40 個蛋白中β 轉(zhuǎn)角所占比例均為最少(4.51%~13.56%),而β 折疊占比例最大(26.85%~58.55%),無規(guī)卷曲占比例次之(21.37%~53.7%)。由此表明,毛竹擴(kuò)展蛋白的二級結(jié)構(gòu)主要為β 折疊和無規(guī)卷曲組成為主。
以水稻的2hcz.1 為模板對毛竹擴(kuò)展蛋白進(jìn)行同源建模,結(jié)果表明PeEXPA1、PeEXPB2、PeEXPB3 和PeEXLA1 的三級結(jié)構(gòu)和模板差異較大,其中PeEXPA1 比PeEXLA1 多了一段β 轉(zhuǎn)角(序列:PNYGLPADAGGVCNPP),PeEXPA1 和PeEXLA1與模板的相似率分別為30.23%和28.24%。PeEXPB2 和PeEXPB3 較模板少了幾段β 折疊(序列:KYPAGQKIVFHIEKGCNPNYLAVLVKYVADDGDI VLMEIQDKLSAEWKPMKLSWGAIWRMD -TAKALKGPFSIRLTS.. ESGKKVIAKDVIPANWRPDAVYTSNVQFY),PeEXPB2和PeEXPB3與模板的相似率分別為26.42%和32.10%;其余39 個家族成員的三級結(jié)構(gòu)和模板較為相似,大部分相似率在30%以上。從蛋白序列的三級結(jié)構(gòu)可以看出,相較于EXLA,EXPA 與EXPB 在結(jié)構(gòu)上更為相似(見圖3)。
圖3 毛竹擴(kuò)展蛋白的三級結(jié)構(gòu)Fig.3 Tertiary structure of expansin proteins in moso bamboo
結(jié)合轉(zhuǎn)錄組數(shù)據(jù)的表達(dá)譜熱圖分析結(jié)果,在毛竹擴(kuò)展蛋白的所有亞家族中,EXPA 和EXPB這兩個亞家族成員的基因表達(dá)量相對較高(圖略),可能對毛竹生長發(fā)育起更大的影響作用。因此,本研究檢測了EXPA亞家族基因在毛竹不同器官(根、莖、未展開葉、展開葉、老葉)中的表達(dá)水平(見圖4)。結(jié)果表明,18 個EXPA 基因均在葉片中表達(dá),除在根中高表達(dá)之外,其余的16 個擴(kuò)展蛋白基因均在葉片中高表達(dá),其中和等9 個基因在未展開葉中表達(dá)量最高,表明這9 個基因可能參與了葉的初始發(fā)育;5 個基因(和)在展開葉中表達(dá)量最高,推測這5個基因參與了葉片的成熟過程;和在老葉中表達(dá)量最高,推測可能參與毛竹葉片衰老過程。
圖4 擴(kuò)展蛋白基因在毛竹不同組織的qRT-PCR分析1.根;2.莖;3.未展開葉;4.展開葉;5.老葉Fig.4 qRT-PCR analysis of expansin genes in different tissues of moso bamboo1.Roots;2.Stems;3.Unexpanded leaves;4.Fully expanded leaves;5.Old leaves
擴(kuò)展蛋白是是一種參與植物細(xì)胞壁舒張的蛋白質(zhì),全面了解其基本理化性質(zhì)、結(jié)構(gòu)特點(diǎn)、表達(dá)模式對于解析其在細(xì)胞壁發(fā)育中的功能至關(guān)重要。本研究鑒定并定位了43個毛竹的擴(kuò)展蛋白基因,并根據(jù)其結(jié)構(gòu)分成了EXPA、EXPB、EXLA 和EXLB 四個亞家族,其中EXPA 和EXPB 亞家族中基因所占比例分別42%和40%。在雙子葉植物擬南芥和楊樹中EXPA 和EXPB 亞家族中基因所占分別為72%、17%和75%、8%,單子葉植物水稻則為59%和33%。由此可見,毛竹EXPA 和EXPB 中成員的比例更傾向于單子葉植物相對均衡的比例趨勢,且毛竹擴(kuò)展蛋白亞家族的內(nèi)含子占比、基因成簇等方面和水稻擴(kuò)展蛋白結(jié)果類似。同時,毛竹擴(kuò)展蛋白四個亞家族成員的差異特性表現(xiàn)在基因結(jié)構(gòu)、蛋白質(zhì)性質(zhì)、蛋白質(zhì)二級三級結(jié)構(gòu)等方面,體現(xiàn)該家族成員的多樣性。
密碼子是分類學(xué)的重要指標(biāo)之一,探索密碼子的偏好性,既有助于揭示其進(jìn)化規(guī)律,還可以優(yōu)化外源基因的密碼子,有利于提高外源基因表達(dá)效率。本研究發(fā)現(xiàn)毛竹擴(kuò)展蛋白所有的氨基酸都具有高頻密碼子(共計(jì)23 個),這與水稻擴(kuò)展蛋白的密碼子偏好性分析一致,且數(shù)量相似(水稻26個)。同時,不同物種擴(kuò)展蛋白的密碼子使用頻率表現(xiàn)不同,與楊樹相比,毛竹和水稻的密碼子偏好性規(guī)律較為接近,如毛竹的4 種氨基酸具有2個高頻密碼子,其中Leu、Val 和Ser 在水稻中也具有2個高頻密碼子。另外,毛竹和水稻的終止密碼子更傾向于使用UGA,且UGA 在毛竹和水稻中均為高頻密碼子。不同物種間的密碼子偏好性分析不僅顯示了種屬分類特征,更為之后的跨物種生物學(xué)研究奠定基礎(chǔ)。
基因的表達(dá)模式是基因功能的表現(xiàn)形式之一。qRT-PCR 結(jié)果表明毛竹擴(kuò)展蛋白基因在不同組織或不同發(fā)育階段表現(xiàn)出明顯的表達(dá)差異性,18 個EXPA 亞家族成員均在葉中有表達(dá),且13 個基因在葉中高表達(dá),其中9個在未展開葉中表達(dá)量最高,6個在展開葉中表達(dá)量最高,1個老葉中表達(dá)量最高。這些結(jié)果表明,EXPA 亞家族基因主要參與葉的生長發(fā)育過程。同時,分析發(fā)現(xiàn)與的同源性高達(dá)93.00%,與的同源性高達(dá)90.24%。能夠提高水稻對褐飛虱和稻瘟病的抗性,但降低了株高和籽粒大小,而鋁誘導(dǎo)的會參與水稻根細(xì)胞的伸長;參與水稻葉鞘基部的不對稱生長。水稻中擴(kuò)展蛋白的研究進(jìn)展為毛竹擴(kuò)展蛋白的功能提供了參考,我們今后的研究重點(diǎn)集中在毛竹擴(kuò)展蛋白對葉片發(fā)育的調(diào)控與脅迫響應(yīng)方面。