安爽, 劉金蓮, 占曉慧, 李永強(qiáng),2, 宗宇,2*
(1.浙江師范大學(xué) 化學(xué)與生命科學(xué)學(xué)院,浙江 金華 321004; 2.浙江省特色經(jīng)濟(jì)植物生物技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 金華 321004)
藍(lán)莓(Vacciniumspp.)是杜鵑花科越橘屬植物,富含花青素及其他營養(yǎng)成分,具有多種功效,被世界糧農(nóng)組織推薦為五大健康水果之一,因此,在國內(nèi)也有大量種植,在研究利用方面也越來越受科學(xué)家的關(guān)注,各種關(guān)于藍(lán)莓的性狀標(biāo)記、基因克隆及系譜分析等也得到廣泛研究。
藍(lán)莓適應(yīng)性強(qiáng),喜弱酸性土壤,一般要求土壤pH值為4.5~5.5,但國內(nèi)土壤性質(zhì)差異較大,藍(lán)莓在種植過程中易受到土壤酸堿性的影響[1],這也是藍(lán)莓得不到廣泛種植的原因之一。為了加快我國藍(lán)莓產(chǎn)業(yè)的發(fā)展,擴(kuò)大藍(lán)莓的栽培地域,了解藍(lán)莓在生長發(fā)育過程中能夠響應(yīng)土壤pH脅迫的相關(guān)基因是至關(guān)重要的,可以為進(jìn)一步研究藍(lán)莓相關(guān)基因奠定基礎(chǔ),提高藍(lán)莓對土壤pH脅迫的適應(yīng)能力,從而可以利用國內(nèi)鹽堿地、酸性土壤等進(jìn)行藍(lán)莓栽培,進(jìn)而提高我國的藍(lán)莓經(jīng)濟(jì)效益。
轉(zhuǎn)錄因子基因家族中,堿性亮氨酸拉鏈(basic region/leucine zipper motif,bZIP)類轉(zhuǎn)錄因子廣泛存在于所有真核生物。bZIP類轉(zhuǎn)錄因子參與植物生長、發(fā)育、成熟、衰老、損傷、防御以及對各種環(huán)境脅迫的響應(yīng)過程,因此,bZIP轉(zhuǎn)錄因子基因在植物生長過程中對抗寒性、耐鹽性、耐pH脅迫等都具有較重要的調(diào)控抗逆作用[2-3]。藍(lán)莓的種植普遍受土壤pH的影響,因此,研究藍(lán)莓bZIP轉(zhuǎn)錄因子基因以及其在根系pH脅迫條件下的表達(dá)模式,對藍(lán)莓在中國不同酸堿度土壤成功并高效率培育種植具有重要意義。
擬南芥數(shù)據(jù)庫中下載氨基酸序列,在北京大學(xué)轉(zhuǎn)錄因子數(shù)據(jù)庫,從家族列表中選擇要找的家族名,使用makeblastdb建立藍(lán)莓氨基酸序列blastp本地數(shù)據(jù)庫,利用擬南芥的氨基酸序列對藍(lán)莓氨基酸本地數(shù)據(jù)庫進(jìn)行blastp比對,同時利用HMMER進(jìn)行模塊化檢索。
從Pfam蛋白家族數(shù)據(jù)庫(http://pfam. sanger.ac.uk/)下載bZIP轉(zhuǎn)錄因子家族相關(guān)結(jié)構(gòu)域bZIP_1(PF00170)、bZIP_2(PF07716)、bZIP_Maf(PF03131)的HMMER索引文件[4],執(zhí)行hmmsearch利用索引文件從藍(lán)莓氨基酸序列中進(jìn)行搜索,調(diào)取blastp和hmmsearch檢索到的序列ID,根據(jù)ID利用Excel腳本去除重復(fù)序列;從藍(lán)莓氨基酸序列中調(diào)取出來進(jìn)行CDD(conserve domain database)分析。將調(diào)取出來的gff文件上傳到http://gsds.cbi.pku.edu.cn/進(jìn)行基因結(jié)構(gòu)分析,經(jīng)過鑒別之后獲取最終的氨基酸序列ID,進(jìn)一步篩選調(diào)取出藍(lán)莓bZIP家族氨基酸序列,再根據(jù)人工去冗余得到最終的序列。
下載鑒定到的藍(lán)莓bZIP蛋白質(zhì)序列,利用ExPASy提供的在線工具ProtParam (http://web.expasy.org/protparam/)對得到的藍(lán)莓bZIP蛋白質(zhì)序列進(jìn)行氨基酸數(shù)目、理論分子量、理論等電點(diǎn)、脂肪指數(shù)、親水性的平均值等理化性質(zhì)基本參數(shù)的分析,亞細(xì)胞定位則采用CELLO服務(wù)器V2.5進(jìn)行鑒定[5]。了解藍(lán)莓bZIP轉(zhuǎn)錄因子基因的一些理化性質(zhì),為之后的基因家族分類等提供重要依據(jù)。
利用生物學(xué)軟件MEGA 7.0中的Clustal W程序?qū)㈣b定到的bZIP氨基酸序列進(jìn)行多重序列比對,生成.meg格式文件,用鄰近法(neighbor-joining)進(jìn)行聚類分析并將所得到的比對結(jié)果構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹,具體參數(shù)為:Model為p-distance,Bootstrap值為1 000,其余參數(shù)為默認(rèn)[6-11]。將北大基因庫下載的擬南芥序列與得到的序列進(jìn)行整合,利用MEGA軟件中的Clustal W程序?qū)喜⑿蛄羞M(jìn)行alignment處理,進(jìn)行序列聯(lián)配操作,最后利用IQ-tree進(jìn)行建樹。將IQ-tree得到的結(jié)果利用Fig-Tree軟件打開,在Fig-Tree中對得到的進(jìn)化樹進(jìn)行分枝粗細(xì)、樣本名大小及顏色調(diào)整等處理,同時對比mega和Fig-Tree生成的進(jìn)化樹,選擇能夠更直觀地展現(xiàn)基因進(jìn)化趨勢及特點(diǎn)的進(jìn)化樹。根據(jù)擬南芥的分類標(biāo)準(zhǔn)[12]對結(jié)果進(jìn)行分類,分析藍(lán)莓轉(zhuǎn)錄因子和擬南芥轉(zhuǎn)錄因子之間的同源進(jìn)化關(guān)系。
將調(diào)取出來的氨基酸序列上傳到http://meme-suite.org/tools/meme,使用MEME在線分析工具對蛋白質(zhì)序列進(jìn)行motif保守結(jié)構(gòu)域分析(具體參數(shù)默認(rèn))[13],預(yù)測藍(lán)莓bZIP蛋白的保守基序序列。利用MEGA將藍(lán)莓氨基酸序列以nwk文件形式導(dǎo)出,同時利用TB-tools(TB-tools:https://github.com/CJ-Chen/TBtools)軟件,導(dǎo)入之前所得到的MEGA構(gòu)建進(jìn)化樹的nwk文件、相關(guān)基因的gff或者gff3文件、MEME的分析結(jié)果文件:meme.xml,繪制三圖合一,并進(jìn)行位置、顏色、距離等的調(diào)整,得到一張合適的進(jìn)化樹、基因結(jié)構(gòu)與motif結(jié)合的圖片,觀察分析轉(zhuǎn)錄因子序列的保守結(jié)構(gòu)域、基因結(jié)構(gòu)等。
下載藍(lán)莓不同組織各個基因的表達(dá)量FPKM(fragments per kilobase per million)以及藍(lán)莓根系在不同pH下不同基因的表達(dá)量FPKM[14]。通過linux系統(tǒng)將鑒定到的藍(lán)莓bZIP轉(zhuǎn)錄因子家族基因與2個測序數(shù)據(jù)分別進(jìn)行比對,得到不同組織bZIP轉(zhuǎn)錄因子基因的表達(dá)Reads數(shù)據(jù)以及藍(lán)莓根系在不同pH下bZIP轉(zhuǎn)錄因子基因的表達(dá)數(shù)據(jù)。下載安裝R軟件和RStudio軟件,利用RStudio軟件繪制各組織器官以及不同pH下根系的表達(dá)熱圖。
利用bZIP相關(guān)結(jié)構(gòu)域的HMM文件,通過HMMER軟件對藍(lán)莓基因組序列進(jìn)行比對搜索后,共得到131個含bZIP結(jié)構(gòu)域的bZIP轉(zhuǎn)錄因子。由序列ID可知,131個藍(lán)莓bZIP家族基因分散在藍(lán)莓的多條染色體上。因藍(lán)莓是四倍體植物,為方便之后與擬南芥轉(zhuǎn)錄因子一同構(gòu)建系統(tǒng)進(jìn)化樹,并進(jìn)行同源序列比對,對得到的131個藍(lán)莓bZIP轉(zhuǎn)錄因子基因進(jìn)行人工去冗余,最后得到31個bZIP轉(zhuǎn)錄因子基因,分別命名為VcbZIP1-VcbZIP31。根據(jù)序列ID對應(yīng)的染色體位置進(jìn)行分組編號,發(fā)現(xiàn)在2號染色體以及12號染色體上的基因序列最多,有6條,在5號、8號以及10號染色體上的基因序列最少,只有一條。
將藍(lán)莓中bZIP基因家族成員按照其所在的染色體位置進(jìn)行排序,將每條序列通過ExPASy處理進(jìn)行理化性質(zhì)分析,分析結(jié)果如表1。由理化參數(shù)分析結(jié)果可知,藍(lán)莓bZIP轉(zhuǎn)錄因子家族基因中最長的bZIP蛋白(VcbZIP10)有916個氨基酸,最短的bZIP蛋白(VcbZIP5)有197個氨基酸,分子量從22 325.03(VcbZIP5)到100 534.47(VcbZIP10)不等,等電點(diǎn)從5.19(VcbZIP28)到9.70(VcbZIP30)不等,脂肪指數(shù)從52.48(VcbZIP18)到90.83(VcbZIP24)不等,親水性的平均值在-0.941(VcbZIP20)到-0.199(VcbZIP10)不等。根據(jù)CELLO的預(yù)測顯示,藍(lán)莓bZIP基因大部分位于細(xì)胞外(extracellular)及細(xì)胞外膜(outer membrane),少部分定位于細(xì)胞質(zhì)(漿)(cytoplasmic)以及內(nèi)膜周質(zhì)(periplasmic)。由于ExPASy在線工具上的藍(lán)莓基因組數(shù)據(jù)并不完善,因此,目前尚存在一些轉(zhuǎn)錄因子(VcbZIP15)的相對分子質(zhì)量、等電點(diǎn)等基本參數(shù)信息還不明確。
表1 藍(lán)莓bZIP家族基因基本參數(shù)
藍(lán)莓bZIP轉(zhuǎn)錄因子家族成員的基因比對擬南芥基因組數(shù)據(jù)庫,得到擬南芥中同源性最高的基因和E值,這為研究藍(lán)莓bZIP基因家族提供了參考。為更深入地了解藍(lán)莓bZIP轉(zhuǎn)錄因子與擬南芥bZIP轉(zhuǎn)錄因子的同源進(jìn)化關(guān)系,構(gòu)建了藍(lán)莓與擬南芥的系統(tǒng)進(jìn)化樹。由圖1以及根據(jù)Jakoby等[15-16]對擬南芥bZIP基因家族的分類標(biāo)準(zhǔn),再依據(jù)基因的聚類特點(diǎn)及bZIP結(jié)構(gòu)域的一些特性,可以將藍(lán)莓bZIP基因家族分為A組(9個)、B組(3個)、C組(1個)、D組(6個)、E組(3個)、F組(0個)、G組(3個)、H組(0個)、I組(4個)、J組(0個)、K組(1個)、M組(0個)及S(1個),共13組。其中A組所含有的成員最多,有9個;C組、K組和S組成員中所含的藍(lán)莓bZIP基因成員數(shù)目最少,只有1個;F組、H組、J組、M組成員中雖然有擬南芥bZIP轉(zhuǎn)錄因子,但是沒有藍(lán)莓bZIP轉(zhuǎn)錄因子家族成員,因此,忽略這4組,只保留9個組(表2)。其余B組、D組、E組、G組、I組所含成員在3、4、6個數(shù)目不等。
表2 藍(lán)莓bZIP家族的分類
圖1 藍(lán)莓bZIP與擬南芥bZIP轉(zhuǎn)錄因子系統(tǒng)進(jìn)化樹比較
圖2所示,每個基因的基因結(jié)構(gòu)、氨基酸長度特別是內(nèi)含子、外顯子等的數(shù)量和分布,都與進(jìn)化有密切關(guān)系。VcbZIP25蛋白序列最長,一些蛋白序列很短,大部分基因都存在于5′-UTR和3′-UTR區(qū)域;另外,從圖中可知每條蛋白序列所含有的保守基序的數(shù)量以及類型都存在差異,其在分布上的差異,可能表明每個基序的功能有所差異。VcbZIP29保守域最多,有4個保守域,VcbZIP31、VcbZIP13、VcbZIP4、VcbZIP27有3個保守域,分別是motif1、motif2、motif3,這5個家族基因都屬于D組,其余序列都只含一個保守域(motif1)。motif1基序分布較廣泛,在植物的生長發(fā)育或者逆境脅迫下發(fā)揮著巨大的作用。總體而言,大部分保守域位于3′端,少部分位于5′端。
圖2 藍(lán)莓bZIP轉(zhuǎn)錄因子構(gòu)建樹、基因結(jié)構(gòu)和保守域三合一圖
由圖3可看出,大部分基因在植物各個組織在一天不同時間段以及果實(shí)發(fā)育的不同時期都有一定量的表達(dá),并且不同bZIP轉(zhuǎn)錄基因在同一組織中的表達(dá)量不同,同一轉(zhuǎn)錄基因在不同組織器官中的表達(dá)量也有所不同,位于系統(tǒng)進(jìn)化樹中同一組的不同轉(zhuǎn)錄基因其表達(dá)模式相似,這說明該組成員中的基因在藍(lán)莓的某個組織器官或者是在某個特定時期發(fā)揮著重要作用。VcbZIP27在藍(lán)莓根部發(fā)育過程或是根部受到鹽脅迫時其表達(dá)量明顯高于其他基因,說明該組基因有可能參與藍(lán)莓生長發(fā)育過程中根部的發(fā)育以及在非生物脅迫尤其是鹽脅迫中發(fā)揮巨大作用,能夠增強(qiáng)根部對鹽的耐受性;VcbZIP20在藍(lán)莓花期時的花、處于花瓣掉落期的花以及不同時期果實(shí)中表達(dá)量相對較高,而在根、葉等部位表達(dá)量相對較低;VcbZIP21、VcbZIP10、VcbZIP19在不同溫度處理下的藍(lán)莓、不同時間段的葉片、茉莉酸甲酯處理后1 h、茉莉酸處理后8 h表達(dá)量相對較高,而在根、葉、不同時期果實(shí)中表達(dá)量相對較少;VcbZIP28除了在根部表達(dá)量相對較低,在其他階段表達(dá)量都相對較高,說明這些基因在藍(lán)莓發(fā)育過程中參與多種生理生化的轉(zhuǎn)錄調(diào)控,發(fā)揮重要作用。VcbZIP6、VcbZIP30在茉莉酸甲酯處理后24 h的藍(lán)莓、花瓣掉落時期的花、不同時期的果實(shí)中表達(dá)量相對于其他時期較高,說明這些基因在果實(shí)生長發(fā)育方面發(fā)揮著一定的作用;VcbZIP1、VcbZIP24、VcbZIP22、VcbZIP25、VcbZIP7、VcbZIP5、VcbZIP31、VcbZIP17、VcbZIP14、VcbZIP16、VcbZIP15、VcbZIP13、VcbZIP18、VcbZIP11、VcbZIP26、VcbZIP23、VcbZIP8、VcbZIP29基因相對其他基因表達(dá)量較低,在藍(lán)莓全生長發(fā)育過程表達(dá)量相差不大;VcbZIP2、VcbZIP12、VcbZIP3基因在藍(lán)莓生長發(fā)育過程中幾乎不表達(dá),推測其在藍(lán)莓生長發(fā)育階段沒有參與一些生理生化過程,也可能是這些基因的轉(zhuǎn)錄活性太低;VcbZIP9、VcbZIP4在藍(lán)莓花芽期表達(dá)量相對較高,而在其他時期幾乎不表達(dá),說明這些基因?qū)λ{(lán)莓的開花具有一定的作用。
圖3 bZIP轉(zhuǎn)錄因子在藍(lán)莓不同組織的表達(dá)量
藍(lán)莓bZIP轉(zhuǎn)錄因子基因在根系pH 4.5和pH 6.5下表達(dá)量存在差異(圖4),VcbZIP10在pH 4.5和pH 6.5表達(dá)量都很高,說明藍(lán)莓根系在受到pH脅迫時,VcbZIP10的表達(dá)不受影響;VcbZIP27、VcbZIP31、VcbZIP1、VcbZIP19、VcbZIP28、VcbZIP13在受到pH 6.5的脅迫下相對于其他基因表達(dá)量較高;其余的bZIP轉(zhuǎn)錄因子基因在抗酸堿性過程中幾乎不表達(dá),可能是在抗逆過程中沒有參與相關(guān)的生理生化過程,也可能是因?yàn)槠浠钚暂^低。
圖4 藍(lán)莓bZIP轉(zhuǎn)錄因子基因在根系不同pH脅迫下的表達(dá)量
藍(lán)莓bZIP轉(zhuǎn)錄因子基因預(yù)測已經(jīng)完成,但關(guān)于藍(lán)莓轉(zhuǎn)錄因子的研究仍較少,本研究主要運(yùn)用生物信息學(xué)的方法,從藍(lán)莓中鑒定出131個bZIP轉(zhuǎn)錄因子基因,經(jīng)過人工去冗余得到31個轉(zhuǎn)錄因子基因,這些基因分布在10條染色體上。根據(jù)構(gòu)建藍(lán)莓與擬南芥bZIP轉(zhuǎn)錄因子基因的同源進(jìn)化關(guān)系,將31個轉(zhuǎn)錄因子基因分為9組,分別是A組(9個)、B組(3個)、C組(1個)、D組(6個)、E組(3個)、G組(3個)、I組(4個)、K組(1個)及S組(1個),不同組內(nèi)成員具有不同的功能。
據(jù)文獻(xiàn)報道,一些基因家族成員的功能特征已在擬南芥中得到驗(yàn)證,如:A組bZIP轉(zhuǎn)錄因子基因的信號傳遞主要是依賴于ABA信號,在非生物脅迫(如寒冷、鹽度或干旱等)下發(fā)揮激活作用,比如擬南芥A亞族中的ABA響應(yīng)元件ABRE(ABA response element)、脫落酸應(yīng)答元件結(jié)合因子ABFs(ABA-responsive element binding proteins)等;B組和K組成員主要是作為進(jìn)化保守內(nèi)質(zhì)網(wǎng)(ER)應(yīng)力響應(yīng)的重要調(diào)控因子,增強(qiáng)對鹽處理的耐受性;C組和S組成員形成一種C/S1-bZIP網(wǎng)絡(luò),作為信號中樞,以促進(jìn)能量、營養(yǎng)饑餓導(dǎo)致的新陳代謝適應(yīng)與生存;D組包括TGA因子(TGAs),受水楊酸(SA)誘導(dǎo),NPR1是其轉(zhuǎn)錄共激活因子,在遇到生物營養(yǎng)病原體時依賴于SA的防御,激素茉莉酸(JA)和乙烯(ET)則協(xié)調(diào)對壞死因子的防御。除了參與防御反應(yīng)外,也參與控制解毒陽離子過程,因此,大多數(shù)D組bZIP提高了植物存活病原體和異生物脅迫的能力;E組成員與花粉萌發(fā)和花粉管生長有一定的聯(lián)系;G組成員中GBF1是藍(lán)光依賴性下胚軸擴(kuò)張的負(fù)調(diào)節(jié)因子,對HY5和HYH具有拮抗作用,此外還能促進(jìn)側(cè)根發(fā)育和自然衰老;I組成員中VIP1作為T-DNA轉(zhuǎn)移的宿主因子,具有低硫耐受性、感受信號等功能。在bZIP轉(zhuǎn)錄因子基因家族中,A、B、H及S亞族bZIP基因主要參與植物非生物脅迫響應(yīng)及激素信號轉(zhuǎn)導(dǎo)過程,根據(jù)同源進(jìn)化關(guān)系,推測與擬南芥同一組的藍(lán)莓直系同源基因也可能參與藍(lán)莓生長發(fā)育的生理生化作用。
根據(jù)RStudio軟件制作熱圖,發(fā)現(xiàn)相同轉(zhuǎn)錄因子基因在藍(lán)莓不同組織器官中表達(dá)量有所差異,不同基因在藍(lán)莓同一部位表達(dá)量也存在差異。研究結(jié)果表明,bZIP轉(zhuǎn)錄因子在藍(lán)莓生長發(fā)育過程中表現(xiàn)出組織特異性表達(dá),但VcbZIP2、VcbZIP12、VcbZIP3等在藍(lán)莓生長發(fā)育過程中幾乎不表達(dá),其余基因在藍(lán)莓不同組織器官的表達(dá)量幾乎無差異。
研究發(fā)現(xiàn),在藍(lán)莓bZIP轉(zhuǎn)錄因子基因中,VcbZIP10、VcbZIP27、VcbZIP31、VcbZIP1、VcbZIP19、VcbZIP28、VcbZIP13、VcbZIP12在藍(lán)莓受到pH脅迫條件下的表達(dá)量相對于正常pH時較高,推測上述基因所在的B組、C組、D組、E組等基因在植物抗pH脅迫條件下參與調(diào)控作用。