鐘子達(dá),鐘曉真,沈超
( 廣東石油化工學(xué)院 生物與食品工程學(xué)院,廣東 茂名 525000)
鱗狀啟動子結(jié)合蛋白樣(SPL)是植物特有的一類轉(zhuǎn)錄因子,在綠色植物中廣泛存在[1]。SPL含有一個高度保守的SBP-box的DNA 結(jié)合結(jié)構(gòu)域[2],SBP結(jié)構(gòu)域?qū)R蛔R別并結(jié)合一段以GTAC為核心元件的回文序列[3],具有2個均含有8個保守的半胱氨酸(Cys)或組氨酸(His)殘基的獨(dú)立鋅指結(jié)構(gòu)[4]。
SPL轉(zhuǎn)錄因子影響植物的頂芽、花序發(fā)育以及開花時間[5]。SPL最初是從金魚草[6]中發(fā)現(xiàn)的,它能識別并結(jié)合到SQUAMOSA (SQ-UA)的啟動子上,進(jìn)而參與調(diào)控金魚草早期的花發(fā)育和開花過程[7]。研究發(fā)現(xiàn),SPL對植物花和果實(shí)的發(fā)育、脅迫應(yīng)答、孢子形成、激素信號傳導(dǎo)以及植物階段轉(zhuǎn)變[8-17]等多種生理生化過程都有一定的調(diào)控作用,在植物的生長發(fā)育過程中發(fā)揮著重要的作用。
棉花是世界上重要的經(jīng)濟(jì)作物,也是天然纖維的主要來源。耕地面積的日益減少加劇了糧棉爭地的矛盾,培育短季棉品種成為當(dāng)前一個重要育種目標(biāo)[18]。開花提前可以縮短生育期,因此研究SPL基因家族,對短季棉育種具有重要促進(jìn)作用。本研究利用生物信息學(xué)方法,對棉花主要栽培種陸地棉中SPL基因家族成員進(jìn)行鑒定及分析,從全基因組水平解析其基本理化性質(zhì)、基因數(shù)目、基因結(jié)構(gòu)與Motif變化、基因的進(jìn)化和染色體定位等方面,為進(jìn)一步探究SPL基因在棉花的成花轉(zhuǎn)變、花發(fā)育中的功能和短季棉育種研究提供一定的理論基礎(chǔ)。
在Cotton FGD數(shù)據(jù)庫(https://cottonfgd.org)中下載陸地棉(AD1, HAU)的基因組數(shù)據(jù)。在Pfam數(shù)據(jù)庫(http://pfam.xfam.org/)下載SPL蛋白的hmm文件,標(biāo)號為PF03110。使用 HMMER 3.0 軟件(http://hmmer.org/)和BLASTP 程序比對含有SBP蛋白結(jié)構(gòu)域的序列。之后,用SMART (http://smart.embl-heidelberg.de)和保守結(jié)構(gòu)域數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進(jìn)行比對驗(yàn)證。
利用ExPASy的在線工具ProtParam(https://web.expasy.org/protparam)對陸地棉SPL基因家族成員的氨基酸長度、相對分子質(zhì)量、等電點(diǎn)、不穩(wěn)定系數(shù)等理化性質(zhì)進(jìn)行分析。使用ProtComp9.0 (http://www.softberry.com/berry.phtml?topic=protcomp-pl&group=programs&subgroup=proloc)預(yù)測其亞細(xì)胞定位。利用GSDS v2.0 (http://gsds.cbi.pku.edu.cn/)分析繪制其基因結(jié)構(gòu)圖。利用MEME (http://meme-suite.org/) 對SPL蛋白保守結(jié)構(gòu)域進(jìn)行分析,基序最大發(fā)現(xiàn)數(shù)量設(shè)置為10,其他參數(shù)為默認(rèn)值。利用NPSA (https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。利用TBtools v0.6731 (https://github.com/CJ-Chen/TBtools-Manual) 定位基因在染色體上的位置。
利用MEGA 7.0[19]軟件對獲得的SPL序列進(jìn)行多重序列比對?;诙嘈蛄斜葘Σ捎米畲笏迫环?gòu)建進(jìn)化樹,執(zhí)行參數(shù) Bootstrap 1000次重復(fù),其他參數(shù)為系統(tǒng)默認(rèn)值。
基于陸地棉RNA-seq數(shù)據(jù)[20]分析陸地棉SPL基因的表達(dá)模式,包括棉花的根、莖、葉、花瓣、花藥、柱頭和開花后5,10,15,20,25 d的纖維及0,1,3,10,20 d的胚珠等組織。
陸地棉SPL基因家族的生物信息學(xué)分析主要包括理化分析、系統(tǒng)進(jìn)化分析等內(nèi)容。
最終在陸地棉中鑒定到30個SPL基因(表1)。在陸地棉中,基因的長度為1125~8132 bp,其中Ghir_D13G016090基因最短,為1125 bp,Ghir_A12G013050基因最長,為8132 bp。理化性質(zhì)分析發(fā)現(xiàn):陸地棉中SPL編碼氨基酸的數(shù)量為141 ~ 1081,Ghir_A10G002400的氨基酸數(shù)量最少,為141,Ghir_A01G009280和Ghir_D01G009680的氨基酸數(shù)量最多,為1081,平均為527.9;相對分子質(zhì)量介于16.11 ~ 119.59 kDa,等電點(diǎn)為5.25~9.88,亞細(xì)胞定位表明有6個基因定位到細(xì)胞質(zhì)和細(xì)胞核(表1)。
表1 陸地棉中SPL特征
續(xù)表
系統(tǒng)發(fā)育分析表明:SPL基因家族可以分為6個亞群,同一分支的進(jìn)化程度相近,親緣性高,不同亞群中的基因數(shù)目不等(圖1)。
圖1 陸地棉SPL家族基因的進(jìn)化分析
陸地棉SPL基因家族成員結(jié)構(gòu)的外顯子數(shù)目為2 ~ 12個,其中Ghir_A10G010450的外顯子數(shù)目最多,為12個(圖2),進(jìn)一步分析得到10種保守基序,命名為Motif1—Motif10,每個成員含有3~10個Motif(圖3)。系統(tǒng)發(fā)育分析發(fā)現(xiàn),同一組內(nèi)具有相似的外顯子數(shù)目且具有相似的基因序列結(jié)構(gòu)。
圖2 陸地棉SPL的結(jié)構(gòu)分析 圖3 陸地棉SPL家族保守基序分析
SPL基因分布在陸地棉18條染色體上(圖4)。每條染色體上基因的分布數(shù)量不等,A亞基因組的A02、A03、A04、A07和A08以及 D亞基因組的D01、D02、D04和D08染色體上各有1個基因;A亞基因組的A10、A12、A13和D亞基因組的D10、D12、D13染色體上分別有2個基因;A亞基因組的A11染色體有3個基因(圖4)。
圖4 陸地棉SPL基因家族染色體定位
對陸地棉SPL蛋白的二級結(jié)構(gòu)分析,如表1所示。發(fā)現(xiàn)SPL基因家族均含有α螺旋、β折疊、延伸鏈和無規(guī)則卷曲等二級結(jié)構(gòu)原件。無規(guī)卷曲的占比最高(除基因Ghir_A01G005270,Ghir_A10G002400,Ghir_D10G003180外),其次是α螺旋、延伸鏈和β折疊(表1)。
通過對陸地棉SPL在棉花的根、莖、葉、花瓣、花藥、柱頭和開花后5,10,15,20,25 d的纖維及開花后 0,1,3,10,20 d的胚珠中的表達(dá)模式進(jìn)行分析,分析發(fā)現(xiàn)Ghir_D08G004350、Ghir_A08G004140、Ghir_A12G013050、Ghir_D12G013270、Ghir_D01G009680、Ghir_A01G009280、Ghir_A11G011170、Ghir_D11G011120、Ghir_D10G017550這9個基因在組織中的表達(dá)量很高(圖5),例如:Ghir_D08G004350在花瓣的表達(dá)最高,表明該基因可能參與調(diào)控花瓣的生長發(fā)育。有些基因的表達(dá)量非常低,例如:Ghir_A01G005270除了在根和柱頭表達(dá)量較高外,在其他組織的表達(dá)量很低,甚至不表達(dá)。
圖5 陸地棉SPL基因家族的組織表達(dá)分析
基因組測序技術(shù)的發(fā)展對基因組研究、轉(zhuǎn)錄因子的鑒定與表達(dá)分析起到了極大的促進(jìn)作用。SPL基因家族在許多物種中都得到了深入的研究,表明它們在植物的生長發(fā)育過程中發(fā)揮了重要作用,并且不同物種的SPL數(shù)量也不同。
隨著棉花基因組測序的完成與更新,本研究在陸地棉中鑒定30個SPL基因并進(jìn)一步預(yù)測了其理化性質(zhì)、二級結(jié)構(gòu)及親緣關(guān)系。研究結(jié)果表明,陸地棉中SPL相對分子質(zhì)量為16.11 ~ 119.59 kDa,等電點(diǎn)介于5.25 ~ 9.88。二級結(jié)構(gòu)主要元件為無規(guī)則卷曲。聚類分析顯示,SPL基因可以分為6個亞組,同一分支的進(jìn)化程度相近,親緣性高。結(jié)合基因結(jié)構(gòu)和保守基序分析發(fā)現(xiàn),同一組內(nèi)的SPL基因具有相似的外顯子、內(nèi)含子數(shù)目和保守基序,推測其結(jié)構(gòu)域進(jìn)化和基因的結(jié)構(gòu)多樣性相關(guān)?;虻娜旧w定位發(fā)現(xiàn)SPL基因并非出現(xiàn)在所有的染色體上。
進(jìn)一步分析SPL基因的組織表達(dá)模式發(fā)現(xiàn),在陸地棉中,Ghir_D08G004350基因可能參與調(diào)控花瓣的生長發(fā)育。Ghir_A01G005270基因可能與陸地棉的根和柱頭的生長發(fā)育有關(guān)。本研究全面分析了陸地棉SPL的性質(zhì)特征,表明其在棉花的發(fā)育過程中具有重要作用,可為SPL基因后續(xù)功能研究提供借鑒。