李 彤 楊晶晶
(1 蘭州財(cái)經(jīng)大學(xué)農(nóng)林經(jīng)濟(jì)管理學(xué)院,甘肅蘭州 730101;2 甘肅農(nóng)業(yè)大學(xué)園藝學(xué)院,甘肅蘭州 730070)
阿拉伯半乳糖蛋白(arabinogalactan proteins,AGPs)是高等植物中重要的一類(lèi)糖蛋白,廣泛存在于細(xì)胞壁、質(zhì)膜和細(xì)胞外基質(zhì)中,在細(xì)胞增殖與生長(zhǎng)、細(xì)胞分化、細(xì)胞程序性死亡、體細(xì)胞胚胎發(fā)生、花藥發(fā)育與花粉管生長(zhǎng)、合子分裂和胚胎發(fā)育等過(guò)程中發(fā)揮重要作用(Gaspar et al.,2001;馬浩力 等,2015)。類(lèi)成束阿拉伯半乳糖蛋白(fasciclinlike arabinogalactan proteins,F(xiàn)LAs)家族是AGPs家族的一個(gè)亞家族,除了含有類(lèi)AGP 的糖基化區(qū)域,還含有1~2 個(gè)具有粘附作用的類(lèi)成束蛋白(fasciclin-like,F(xiàn)AS)結(jié)構(gòu)域(Johnson et al.,2003;鐘靜 等,2017)。
FLA 基因家族成員參與植物多種生命活動(dòng),在植物的生長(zhǎng)發(fā)育過(guò)程中發(fā)揮著重要的調(diào)控作用(卞坤 等,2017)。在擬南芥中,突變體植株表現(xiàn)出側(cè)根數(shù)目增加,根和葉片的再生能力減弱,表明在根的發(fā)育和細(xì)胞分化過(guò)程起重要作用(Johnson et al.,2011);基因在小孢子發(fā)育過(guò)程中,尤其是在花粉細(xì)胞壁發(fā)育過(guò)程中起重要作用(Li et al.,2010);具有FLA4 H2 區(qū)氨基酸替換的鹽過(guò)度敏感突變體植株在一定鹽離子濃度下表現(xiàn)出根表皮細(xì)胞異常膨脹,根長(zhǎng)變短,表明與鹽離子耐受性和細(xì)胞膨脹有關(guān),并且能與ABA 協(xié)同作用參與ABA 信號(hào)通路調(diào)控,從而影響根的發(fā)育(Johnson et al.,2003);與與次生細(xì)胞壁發(fā)育有關(guān),與的雙突變體莖機(jī)械強(qiáng)度下降,具體表現(xiàn)為:細(xì)胞壁中纖維素、阿拉伯糖和半乳糖含量減少(MacMillan et al.,2010)。在棉花的纖維細(xì)胞中,基因大量表達(dá),參與棉纖維的發(fā)生和伸長(zhǎng),且過(guò)量表達(dá)可導(dǎo)致棉花纖維的長(zhǎng)度增加(Huang et al.,2008,2013)。
FLA基因家族廣泛分布在植物組織和細(xì)胞中,目前已在擬南芥()(Johnson et al.,2003)、水稻()(Ma &Zhao,2010)、小 麥()(Faik et al.,2006)等植物中鑒定出基因?,F(xiàn)已發(fā)現(xiàn)擬南芥中有21 個(gè)基因,水稻中有27 個(gè)基因,棉花中有19 個(gè)基因,小麥中有34 個(gè)基因。植物中FLA 基因家族的挖掘,對(duì)深入了解基因的生物學(xué)功能及促進(jìn)植物生產(chǎn)具有重要意義,但在辣椒(L.)中還鮮見(jiàn)關(guān)于FLA 基因家族成員的報(bào)道。因此,本試驗(yàn)采用生物信息學(xué)分析的方法,對(duì)辣椒基因組中FLA 基因家族成員進(jìn)行全面鑒定,包括對(duì)其蛋白質(zhì)理化性質(zhì)、系統(tǒng)進(jìn)化樹(shù)、保守基序、基因結(jié)構(gòu)、染色體定位及啟動(dòng)子順式作用元件等進(jìn)行分析,旨在揭示辣椒FLA 基因家族成員的數(shù)量、結(jié)構(gòu)和進(jìn)化特點(diǎn),進(jìn)一步為該家族成員的功能研究提供理論依據(jù)。
根據(jù)已報(bào)道的擬南芥FLA 基因家族的序列號(hào),在擬南芥基因組數(shù)據(jù)庫(kù)TAIR(http://www.arabidopsis.org)下載得到21 條FLAs 蛋白序列作為探針序列,并在茄科植物基因組數(shù)據(jù)庫(kù)(sol genomics network,SGN)中的辣椒品種遵辣1 號(hào)基因組(Qin et al.,2014)數(shù)據(jù)庫(kù)進(jìn)行BLASTP(evalue <l),獲得同源的辣椒候選基因(Schultz et al.,2002;Fernandez-Pozo et al.,2015)。然后利用Pfam〔Pfam:Home page(xfam.org)〕 和SMART〔SMART:Main page(emblheidelberg.de)〕數(shù)據(jù)庫(kù)鑒定候選基因是否含有FAS結(jié)構(gòu)域,刪除冗余的基因,進(jìn)而確定辣椒FLA 基因家族成員(El-Gebali et al.,2019;Letunic et al.,2021)。最后利用在線(xiàn)網(wǎng)站ProtParam(http://web.expasy.org/protparam/)分析辣椒FLA 基因家族成員編碼的蛋白質(zhì)序列長(zhǎng)度、分子量及等電點(diǎn)等理化性質(zhì)(Wilkins et al.,1999),利用Euk-mPLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/)進(jìn)行亞細(xì)胞定位預(yù)測(cè)(Chou &Shen,2010)。
利用MEGA-X 構(gòu)建辣椒和擬南芥FLAs 蛋白序列的系統(tǒng)進(jìn)化樹(shù),序列比對(duì)方法為MUSCLE,構(gòu)建方法為鄰接法(neighbor-joining,NJ),Bootstrap的重復(fù)次數(shù)設(shè)置為1 000,剩余設(shè)置選擇默認(rèn)選項(xiàng),然后利用在線(xiàn)網(wǎng)站Evolview(https://evolgenius.info/evolview-v2)對(duì)進(jìn)化樹(shù)進(jìn)行可視化(Saitou &Nei,1987;He et al.,2016;Kumar et al.,2018)。利用MEME 5.2.0〔MEME-Submission form(memesuite.org)〕軟件分析辣椒FLAs 蛋白保守基序,參數(shù)設(shè)置模體基序長(zhǎng)度最小為15 aa,最大為150 aa,保守序列數(shù)目最大為10(Bailey et al.,2015)。于在 線(xiàn) 網(wǎng) 站GSDS 2.0(http://gsds.gao-lab.org/index.php)中輸入辣椒FLAs 蛋白的基因序列和編碼序列(coding sequence,CDS),獲得辣椒的基因結(jié)構(gòu)(Hu et al.,2015)。通過(guò)TBtools 提取辣椒各條染色的總長(zhǎng),再依據(jù)辣椒FLA 基因家族的起始位置,利用Mapchart 2.3 進(jìn)行染色體定位分析及作圖(Voorrips,2002;Chen et al.,2020)。
利用TBtools v1.082 工具提取辣椒編碼序列的起始密碼子上游2 000 bp 序列,利用PlantCARE 預(yù)測(cè)辣椒順式作用元件,結(jié)果用TBtools v1.082進(jìn)行可視化(Rombauts et al.,1999;Chen et al.,2020)。
通過(guò)BLASTP 從辣椒全基因組中獲得25 個(gè)辣椒FLAs基因家族成員,命名為~。理化性質(zhì)分析結(jié)果表明(表1),25 個(gè)都含有1~2 個(gè)FLA 基因家族特有的FAS 結(jié)構(gòu)域,其中、、、、、、包含2 個(gè)FAS 結(jié)構(gòu)域,表明25 個(gè)基因均為辣椒的FLA 基因家族成員;CaFLAs 的蛋白長(zhǎng)度在201~449 aa 之間,平均長(zhǎng)度為328 aa;CaFLAs 蛋白分子量在20.73~49.14 kDa 之間;蛋白理論等電點(diǎn)在4.44~8.74 之間,大多數(shù)為酸性蛋白。亞細(xì)胞定位分析結(jié)果顯示,辣椒FLA 基因家族中除編碼的蛋白既定位在質(zhì)膜又定位在細(xì)胞核外,其余均定位于質(zhì)膜。
表1 辣椒FLA 基因家族成員基本特征
如圖1 所示,辣椒和擬南芥的FLAs 蛋白在蛋白序列上相對(duì)保守,且大多數(shù)Boostrap 大于70,表明FLAs 在辣椒和擬南芥進(jìn)化過(guò)程中相對(duì)保守。25 個(gè)CaFLAs 蛋白被分為3 個(gè)亞家族,其中CaFLA4、CaFLA6、CaFLA7、CaFLA8、CaFLA9、CaFLA10、CaFLA12、CaFLA15、CaFLA16 和CaFLA19 進(jìn)化關(guān)系較近,聚為第一亞族(Group1);CaFLA2、CaFLA11、CaFLA13、CaFLA14、CaFLA17、CaFLA18、CaFLA20、CaFLA21、CaFLA22、CaFLA23 和CaFLA24 聚為第二亞族(Group2);CaFLA1、CaFLA3、CaFLA5和CaFLA25 聚為第三亞族(Group3)。CaFLA3/CaFLA5、AtFLA3/AtFLA7、AtFLA5/AtFLA14、CaFLA2/CaFLA13、CaFLA8/CaFLA10、CaFLA12/CaFLA16、CaFLA15/CaFLA19、AtFLA4/CaFLA4、AtFLA2/AtFLA11、CaFLA6/CaFLA7是直系同源對(duì),且Boostrap 為100,表明兩者在蛋白結(jié)構(gòu)方面相似。
圖1 辣椒和擬南芥FLAs 蛋白的系統(tǒng)進(jìn)化樹(shù)
利用MEME 5.2.0 在線(xiàn)軟件對(duì)辣椒25 個(gè)CaFLAs 蛋白進(jìn)行保守基序分析,結(jié)果如圖2 所示。位于同一亞族的CaFLAs 蛋白具有相同的保守基序,如位于第一亞族的CaFLA4、CaFLA6、CaFLA7、CaFLA12、CaFLA15、CaFLA16、CaFLA19 都 含 有motif3、motif4、motif7、motif9基序,位于第二亞族的CaFLA2、CaFLA11、CaFLA13、CaFLA14、CaFLA17、CaFLA18、CaFLA20、CaFLA21、CaFLA22、CaFLA23 都含有motif1、motif2、motif3、motif5、motif10 基序,位于第三亞族的CaFLA1、CaFLA3、CaFLA5 都含有motif5 基序。經(jīng)Pfam 比對(duì)可知,motif1、motif2、motif3、motif4、motif5、motif7、motif8、motif9、motif10 是FAS 結(jié)構(gòu)域的一部分。同一亞族包含相同的保守基序,表明辣椒FLA 基因家族在遺傳進(jìn)化上是相對(duì)保守的。
圖2 辣椒FLAs 蛋白的保守基序分析
利用GSDS 2.0 在線(xiàn)網(wǎng)站對(duì)25 個(gè)基因進(jìn)行基因結(jié)構(gòu)分析,結(jié)果如圖3 所示。有20 個(gè)辣椒FLA 基因家族成員不含內(nèi)含子,其余成員(、、、和)只含有1 個(gè)內(nèi)含子,表明位于同一亞族的基因具有相似的基因結(jié)構(gòu)。
圖3 辣椒FLA 基因家族成員基因結(jié)構(gòu)分析
利用Mapchart 2.3 對(duì)25 個(gè)基因進(jìn)行染色體定位,結(jié)果如圖4 所示。25 個(gè)基因分別定位在0、1、3、6、7、9、10、11 號(hào)和12 號(hào)染色體上,在9 條染色體上不均勻分布,其中10 號(hào)染色體分布密度最高,分布了5 個(gè)基因;11 號(hào)和12 號(hào)染色體分布密度最低,僅存在1 個(gè)基因,其他染色體分布了2~4 個(gè)基因。
圖4 辣椒FLA 基因家族成員染色體定位
辣椒啟動(dòng)子區(qū)域的順式作用元件分析結(jié)果如圖5 所示,25 個(gè)均擁有響應(yīng)逆境脅迫的順式作用元件,共含有17 種,其中分布最廣的是光響應(yīng)元件(light responsiveness),在25個(gè)中均有發(fā)現(xiàn);分布較廣的是厭氧脅迫響應(yīng)元件(anaerobic induction),在20 個(gè)中被發(fā)現(xiàn);其次是赤霉素響應(yīng)元件(gibberellin responsiveness),在14 個(gè)中被發(fā)現(xiàn)。脫落酸響應(yīng)元件(abscisic acid responsiveness)、生長(zhǎng)素響應(yīng)元件(auxin responsiveness)、防御與脅迫響應(yīng)元件(defense and stress responsiveness)、低溫響應(yīng)元件(low temperature responsiveness)、茉莉酸甲酯響應(yīng)元件(MeJA responsiveness)、分生組織表達(dá)元件(meristem expression)、干旱誘導(dǎo)的MYB 結(jié)合位點(diǎn)元件(MYB in drought)、水楊酸響應(yīng)元件(salicylic acid responsiveness)、玉米醇溶蛋白代謝調(diào)節(jié)元件(zein metabolism regulation)、晝夜節(jié)律元件(circadian control)、缺氧特異性誘導(dǎo)元件(anoxic specific inducibility)、損傷響應(yīng)元件(wound responsiveess)、胚乳表達(dá)元件(endosperm expression)、類(lèi)黃酮生物合成的MYB 結(jié)合位點(diǎn)元件(MYB in flavonoid biosynthesis)不均一地分布在各個(gè)亞族的少數(shù)啟動(dòng)子上。表明辣椒基因參與辣椒的激素應(yīng)答、脅迫響應(yīng)(干旱、低溫)、光響應(yīng)等生物學(xué)過(guò)程。
圖5 辣椒FLAs 基因啟動(dòng)子順式作用元件分析結(jié)果
本試驗(yàn)在辣椒中共鑒定出25 個(gè)基因,與擬南芥(21 個(gè))(Johnson et al.,2003)、水稻(27個(gè))(Ma &Zhao,2010)相比,F(xiàn)LA 基因家族成員相差不大,表明在物種進(jìn)化過(guò)程中是相對(duì)保守的。對(duì)其理化性質(zhì)的分析結(jié)果顯示,辣椒FLA基因家族成員都含有1~2 個(gè)FLA 基因家族特有的FAS 結(jié)構(gòu)域;CaFLAs 蛋白等電點(diǎn)在4.44~8.74 之間,多數(shù)為酸性蛋白;絕大多數(shù)CaFLAs 蛋白定位在質(zhì)膜上,這可能與FLAs 參與細(xì)胞間信號(hào)轉(zhuǎn)導(dǎo)有關(guān)(Wang et al.,2015;鐘靜 等,2017)。系統(tǒng)進(jìn)化分析結(jié)果顯示,辣椒和擬南芥FLAs 蛋白被聚類(lèi)在3 個(gè)獨(dú)立的進(jìn)化分支中,每個(gè)進(jìn)化分支中都有辣椒和擬南芥FLAs 的分布,表明該家族成員可能擁有共同的祖先。
利用MEME 5.2.0 在線(xiàn)軟件分析得出,辣椒FLA 基因家族共有10 個(gè)保守基序,各基因中都有分布,屬于高保守基序;研究發(fā)現(xiàn)不同亞族之間保守基序的相似性與亞族間的系譜進(jìn)化密切相關(guān),辣椒FLA 基因家族各亞族保守基序基本相同,表明辣椒FLA 基因家族在進(jìn)化過(guò)程中具有高度保守性(黎幫勇 等,2015)。通過(guò)啟動(dòng)子順式作用元件分析可知,辣椒啟動(dòng)子含有多種激素響應(yīng)、逆境脅迫響應(yīng)、光響應(yīng)和植物生長(zhǎng)發(fā)育相關(guān)的順式作用元件,表明其可能具有較為廣泛的生物學(xué)功能,可能參與多種生物代謝過(guò)程(郝小聰 等,2019)。值得注意的是,與激素響應(yīng)有關(guān)的順式作用元件幾乎分布在所有的辣椒基因啟動(dòng)子中,表明辣椒FLA 基因家族可能參與辣椒生長(zhǎng)和發(fā)育的許多過(guò)程,類(lèi)似于其在擬南芥中的作用(馬浩力 等,2015)。