楊 巍,唐 兵,譚國飛,付文苑,王青青,曾慶鴻,王洪亮,馬建云,張 睿,施紹斌,鄧 英*
(1. 貴州省農(nóng)業(yè)科學院園藝研究所,貴陽 550006;2. 貴州省園藝工程技術研究中心,貴陽 550006;3. 貴州省農(nóng)業(yè)科技發(fā)展中心,貴陽 550006;4. 威寧縣農(nóng)業(yè)農(nóng)村局,貴州 威寧 553100;5. 威寧縣大西北種養(yǎng)殖專業(yè)合作社,貴州 威寧 553100)
芥菜(Brassica juncea(L.) Czern. et Coss,2n=36,AABB)是一種重要的十字花科類經(jīng)濟作物,由白菜類(Brassica rapa,2n=20,AA)與黑芥類(Brassica nigra,2n=16,BB)雜交后加倍形成的異源四倍體,可用作油籽、蔬菜和調味品[1]。菜用芥菜可根據(jù)其食用器官分為葉用芥菜、莖用芥菜、薹用芥菜、根用芥菜和芽用芥菜等,芥菜具有喜冷涼溫潤、耐寒抗凍、抗旱耐熱以及耐貧瘠的特點,在我國長江流域及西南地區(qū)廣泛栽培[2]。
熱激轉錄因子(heat shock transcription factor,Hsf)是植物應激反應中重要的調控因子,通過識別并特異性結合熱休克蛋白(heat shock proteins,HSPs)基因啟動子的熱激元件(HSE)的保守基序來調控熱激蛋白表達,響應各種生物與非生物脅迫,并在植物生長發(fā)育中發(fā)揮重要作用[3-4]。Hsf蛋白進化出多個功能保守域,其中以N 端的DNA 結合域(DNA-binding domain,DBD)和寡聚化結構域(oligomerization domain,OD,或七肽疏水氨基酸殘基重復區(qū)域HR-A/B)最為保守,DBD結構域特異性識別并結合靶基因的熱激元件HSE 的回文保守基序(5'-AGAAnnTTCT-3'),激 活 抗 逆 基 因 的 表 達[5-6]。HR-A/B 具有卷曲螺旋結構的特征,通過可變長度柔性連接體連接到DBD,在轉錄因子活性中起作用[7],根據(jù)DBD 距離OD 的長度及HR-A 與HR-B 之間的氨基酸殘基數(shù)量將Hsf基因家族分為3類:A、B和C[8]。此外,Hsf 蛋白還包含核輸出信號(nuclear export signal,NES)、核定位信號(nuclear localization signal,NLS)以及C 端轉錄激活結構域(C-terminal activation domain,CTAD)[9]。
目前,人們已在擬南芥[8]、二穗短柄草[9]、水稻[10]、菜豆[11]、棉花[12]、矮牽牛[13]、黑麥[14]和玉米[15]等多種植物中對Hsf基因家族進行系統(tǒng)性鑒定與分析,Hsf基因家族在不同物種中數(shù)量存在顯著差異,且發(fā)揮多種生物學功能,如響應受熱[16-17]、氧化與干旱[18]、鹽[19]、低溫和重金屬[20-21]等逆境脅迫,參與生物合成[13,22]及生長發(fā)育[23]。隨著芥菜基因組測序工作的完成[24-25],本文利用生物信息學鑒定與分析芥菜Hsf基因家族成員的序列特征、進化關系、共線性關系以及表達模式分析,從而為研究芥菜Hsf 基因家族的生物學功能提供理論基礎。
從擬南芥基因組數(shù)據(jù)庫TAIR(https://www.arabidopsis.org/)獲取擬南芥基因組數(shù)據(jù)及Hsf基因家族蛋白序列,從十字花科植物基因組資源綜合數(shù)據(jù)庫BRAD(http://brassicadb.cn)下載莖瘤芥基因組數(shù)據(jù)Braju_tum_V2.0(B. junceacv. tumida T84-66 V2.0)、大白菜基因組數(shù)據(jù)Brara_Chiifu_V3.5(B.rapacv. Chiifu V3.5)[26],然后利用TBtools[27]軟件本地化Blast 獲取芥菜Hsf基因家族成員蛋白序列,運用NCBI 數(shù)據(jù)庫Blastp 與CCD 在線工具分析芥菜Hsf蛋白功能與保守結構域(pfam00447、smart00415 和cl12113,篩選閾值E<0.000 01 且氨基酸長度大于100 aa)進行初步篩選,以HEATSTER[28]數(shù)據(jù)平臺(https://applbio.biologie.uni-frankfurt.de/hsf/heatster/home.php)進行序列分析進一步篩選Hsf 基因家族成員與分類;利用Expasy數(shù)據(jù)庫在線工具protparam(https://web.expasy.org/protparam/)進行Hsf 蛋白序列的氨基酸序列長度、等電點和相對分子質量等理化性質分析。運用WoLF PSORT 在線工具(https://wolfpsort.hgc.jp/)預測Hsf蛋白的亞細胞定位。
利用TBtools對BjuHsf基因進行染色體定位。
利用TBtools分析BjuHsf基因結構,運用在線程序MEME Suit5.4.1(https://meme-suite. org/meme/tools/meme)分析BjuHsf基因家族成員保守基序(參數(shù)設置:最大基序數(shù)20;其他為默認參數(shù)),運用MEGA11 與TBtools 軟件繪制系統(tǒng)進化樹與保守基序組成圖。
使用MEGA11與Genedoc對BjuHsf蛋白的DBD與HR-A/B保守結構域進行聚類分析。
通過EggNOG5.0 數(shù)據(jù)庫(http://eggnog5.embl.de/#/app/home)進行GO 功能富集分析,根據(jù)與大白菜序列同源性,利用STRING11.5數(shù)據(jù)庫分析BjuHsf蛋白質-蛋白質相互作用網(wǎng)絡(protein-protein interaction,PPI),并使用Cytoscape3.9.1進行蛋白互作網(wǎng)絡可視化。
通過提取芥菜71 個Hsf 在基因組數(shù)據(jù)中上游2 000 bp的啟動子區(qū)域序列,基于在線數(shù)據(jù)庫Plantcare(https://bioinformatics. psb. ugent. be/webtools/plantcare/html/)預測BjuHsf基因啟動子的順式作用元件,并使用TBtools繪圖。
以71 個芥菜Hsf 蛋白、36 個大白菜Hsf 蛋白及21 個擬南芥Hsf 蛋白的氨基酸序列為研究對象,使用MEGA11(參數(shù)設置:最佳氨基酸替代模型JTT+G,最大似然法)構建系統(tǒng)進化樹,Bootstrap 值為1 000。運用Evolview在線軟件(https://www.evolgenius.info/evolview/#/)進行進化樹美化。
利用TBtools 對BjuHsf基因進行種內與種間的共線性分析,并計算BjuHsf重復基因對的Ka/Ks值。
基于本實驗室完成葉用芥菜‘黔青6’號在低溫脅迫(9 ℃,48 h)的試驗組與對照組(22 ℃,48 h)的葉片組織RNA-seq數(shù)據(jù),進行BjuHsf基因家族的表達分析,利用TBtools繪制基因表達熱圖。
通過本地Blast 檢索、NCBI-CCD 結構域及氨基酸保守序列分析驗證,最終獲得71個BjuHsf基因家族成員(表1)。并根據(jù)HEATSTER數(shù)據(jù)平臺的分類結果將各基因家族成員進行重新命名。71 個BjuHsf 蛋白的氨基酸長度在214~494 aa 之間,分子量在24.62~55.39 kDa 之間,蛋白等電點介于4.65~9.16 之間,其中64 個BjuHsf 蛋白為酸性蛋白,7 個BjuHsf 蛋白為堿性蛋白,不穩(wěn)定系數(shù)均大于40,表明BjuHsf 為不穩(wěn)定的蛋白。脂肪系數(shù)在57.51~79.37 之間,總平均親水性均為負值,表明BjuHsf 蛋白有較好的親水性。BjuHsf 蛋白亞細胞定位,除BjuHsfA8a(葉綠體)與BjuHsfB1b(細胞質)之外,其余均位于細胞核中。
表1 BjuHsf基因家族理化性質Table 1 Physical and chemical properties of BjuHsf gene family
(續(xù) 表 1)
除BjuHsfA1l、BjuHsfA1m、BjuHsfA1n和BjuHsfA7h組裝到scoffold 外,其余67 個基因家族成員均定位到染色體,且所有染色體上均有Hsf基因分布,特別是AA-Chr03分布基因的基因數(shù)量最多,多達10個Hsf基因,其次為BB-Chr02 與BB-Chr07 染色體,均含有6 個Hsf 基因,而AA-Chr05 與AA-Chr06 染色體最少,均僅有1個Hsf基因(圖1)。
圖1 BjuHsf基因家族成員基因染色體定位Figure 1 Chromosome location of BjuHsf gene family members
BjuHsf基因家族成員蛋白共鑒定出20個motif,其中motif1、motif2 和motif3 屬于DBD 結合域,所有的BjuHsf 蛋白均含有DBD 結合域的3 個motif。motif4、motif5 屬于HR-A/B 區(qū)域,motif14 屬于核定位序列(NLS),motif6 屬于AHAmotif,motif7 屬于核外運信號(NES)。在芥菜A、B 和C 三大類Hsf 家族成員中,蛋白質保守基序呈現(xiàn)出組間特異性,BjuHsf基因進化過程相對保守(圖2b)。
BjuHsf 基因結構分析表明,72%的BjuHsf 基因基因含有2 個外顯子和1 個內含子,BjuHsfA7a、BjuHsfA7c及BjuHsfA8a含有3個外顯子和2個內含子,BjuHsfC1c 與BjuHsfC1d 不含內含子,親緣關系相近的家族成員的基因結構相似,這表明親緣關系較近的基因的結構具有較強的保守性(圖2c)。
通過對BjuHsf 蛋白進行多序列比對發(fā)現(xiàn)DBD與HR-A/B 結構域極為保守,BDB 結構域由3 個α螺旋(α1、α2、α3)和4個β折疊組成(α1-β1-β2-α2-α3-β3-β4),包含93~94 個氨基酸,而BjuHsfA7a 和BjuHsfA7c 在α3-β3 之間多出16 個氨基酸,這可能與這些蛋白發(fā)揮的特異性功能有關(圖3a)。
HR-A/B與DBD的C端相鄰,包含2個疏水7肽重復區(qū)域,它在Hsf-Hsf 互作中起著至關重要的作用[28]。71個BjuHsf基因家族成員的HR-A/B 保守域序列比對,結果表明此保守域包含HR-A區(qū)域、HRB 區(qū)域及兩者之間的Insert 區(qū)域,通常將Insert 區(qū)域的氨基酸數(shù)量將Hsf 家族成員歸類為A、B、C 三大類[29],A類與C類Hsf相比B類Hsf分別多出了21個、7個氨基酸殘基。所有的BjuHsf蛋白的HR-A 區(qū)域顯示出3 處非常保守的疏水性氨基酸位點,其中第1、2 處位點為亮氨酸(L),第三處B 類仍為亮氨酸(L)、C類替換為甲硫氨酸(M),A類不同亞組替換為多個不同氨基酸,而在HR-B 區(qū)域不同亞組間的氨基酸種類差異相對較大(圖3b)。
圖3 BjuHsf蛋白序保守域序列比對Figure 3 Sequence alignment of BjuHsf protein conservative domain
BjuHsf基因GO功能分析結果表明,BjuHsf參與了含核堿基化合物代謝過程的調控,有機物生物合成過程、代謝過程的調控、有機環(huán)狀化合物代謝過程、細胞芳香化合物代謝過程、氮化合物代謝過程、初級代謝過程的調控、RNA 生物合成過程、溫度刺激響應和熱刺激反應等生物學過程。細胞成分主要位于細胞核、細胞內膜結合細胞器、膜結合細胞器和胞內細胞器等。主要分子功能涉及轉錄調控活性、DNA 結合轉錄因子活性、相同蛋白結合和蛋白質同源二聚化活性等(圖4a)。BjuHsf 家族成員蛋白互作分析表明BjuA3b、BjuA2b、BjuA5b、BjuA1d和BjuA2h 為關鍵核心蛋白與多個家族成員存在相互作用(見圖4b)。
圖4 BjuHsf基因GO功能富集及蛋白互作分析Figure 4 GO function enrichment and protein interaction analysis of BjuHsf gene
利用PlantCARE數(shù)據(jù)庫預測BjuHsf基因啟動子區(qū)順式元件,共發(fā)現(xiàn)109種順式作用元件,包含光響應元件、脫落酸響應元件、生長素響應元件、赤霉素響應元件、水楊酸響應元件、防御與壓力響應元件、干旱脅迫響應元件、茉莉酸甲酯響應元件、低溫響應元件、創(chuàng)傷響應元件、厭氧脅迫響應元件、類黃酮類合成元件、晝夜節(jié)律調控元件、分生組織表達相關順式元件和胚乳表達調控順式元件等,表明BjuHsf基因在芥菜應答逆境脅迫、生物合成等方面執(zhí)行多種生物學功能(圖5)。
圖5 BjuHsf基因家族成員啟動子-順式元件Figure 5 Promoter-cis element of BjuHsf gene family members
利用芥菜、大白菜和擬南芥Hsf 蛋白的全長序列構建了系統(tǒng)性進化樹(圖6),將BjuHsf 蛋白分為A、B、C3 個大類,其中A 類分為9 個亞組A1-A9,B類分為4個亞組B1-B4亞組,C類僅有1個C1亞組,上述進化樹聚類結果與HEATSTER 數(shù)據(jù)庫的分類結果相一致,同時,3個物種均缺失B5、C2亞組家族成員,這顯示出物種進化的特異性。此外,進化樹Hsf家族成員的A、C組與B組分別聚類成2個大組,C1亞組屬于A2、A7、A6、A1、A8和A3亞組聚類大分枝的外枝,不同亞組家族成員表現(xiàn)出差異的進化關系,如A2 與A7,A1 與A6、A6 與A7、B3 與B1、B2 與B4分別聚在一起,顯示出趨同與趨異的進化趨勢。
芥菜基因組共線性分析表明,67個BjuHsf基因共產(chǎn)生105個片段重復事件(圖7a)。BjuHsf旁系同源基因對Ka/Ks比值均小于1,表明BjuHsf基因受純化選擇壓力(圖7b)。進一步分析擬南芥、芥菜、大白菜Hsf基因的共線性關系,結果顯示芥菜與擬南芥之間共鑒定出68個直系同源基因對,而芥菜與大白菜之間共鑒定出133 個直系同源基因對(圖7c),這表明芥菜和大白菜的Hsf基因家族具有更近的同源性進化關系。
圖7 Hsf基因的共線性分析Figure 7 Collinearity analysis of Hsf gene
葉用芥菜葉片組織中的BjuHsf基因在低溫組(9 ℃,48 h)與對照組(22 ℃,48 h)表達模式如圖8所示。從RNA-seq 數(shù)據(jù)中獲取了43 個BjuHsf家族成員的基因表達量,另外28個BjuHsf基因表達數(shù)據(jù)未能獲取,這可能與基因的表達組織特異性,葉用芥菜與莖瘤芥的遺傳差異等因素有關。BjuHsf基因在低溫脅迫下的表達模式可分為3類,第一類:有8個BjuHsf基 因:BjuHsfA1a、BjuHsfA1i、BjuHsfA1m、BjuHsfA1n、BjuHsfA1o、BjuHsfA3b、BjuHsfA4g和BjuHsfA7f,在低溫脅迫下的表達量顯著上調表達,推測這些基因參與了芥菜低溫脅迫應答反應;第二類:有6 個BjuHsf基 因:BjuHsfA1e、BjuHsfA2a、BjuHsfB2b、BjuHsfB2c、BjuHsfB2e和BjuHsfB2h,在低溫脅迫下的表達量顯著下調表達,可能低溫脅迫在一定程度上抑制這6 個BjuHsf基因的表達;第三類為其他差異表達不顯著29 個BjuHsf基因。從顯著性差異表達的BjuHsf基因分布情況,可以看出A 類BjuHsf基因顯著上調的較多,而B類BjuHsf基因顯著下調的較多,說明A 類BjuHsf基因在應答低溫脅迫發(fā)揮重要作用,而低溫則會抑制B 類BjuHsf基因的表 達。 另 外,BjuHsfA1m、BjuHsfA1n、BjuHsfA1o、BjuHsfA4b、BjuHsfA4g、BjuHsfA8b和BjuHsfA8c等,這些基因的表達量顯著高于其他成員基因,推測這些基因在芥菜葉片組織中執(zhí)行了重要的生物學功能。
圖8 BjuHsf基因熱圖Figure 8 BjuHsf gene heatmap
芥菜是我國一種重要的蔬菜作物,在生長發(fā)育時期極易受到各種非生物脅迫(如熱、冷、干旱等)與生物脅迫(如真菌性、細菌性病害)的影響,造成經(jīng)濟損失。而Hsf基因作為植物最重要的轉錄因子家族之一,在植物生長發(fā)育調控、響應脅迫方面發(fā)揮著重要作用[30],研究BjuHsf基因家族的分子功能對于指導分子育種提高作物抗逆性具有重要意義。
本研究利用擬南芥Hsf基因家族序列對芥菜基因組進行同源序列比對獲取候選BjuHsf基因家族成員,并對候選基因進行理化性質分析、保守結構域和保守基序等分析,最終鑒定出71個BjuHsf基因家族成員。BjuHsf基因家族保守基序與基因結構分析表明同一亞組內家族成員的氨基酸保守基序與基因結構相似,特別是所有的BjuHsf 均發(fā)現(xiàn)DBD 與HR-A/B結構域,相鄰的HR-A/B結構域之間插入不同數(shù)量的氨基酸殘基而將BjuHsf 家族分為3 大類(A、B、C),這與貫葉連翹[31]、菠蘿[32]的研究結果相一致,同時也在HEATSTER數(shù)據(jù)庫與系統(tǒng)進化樹分析得到驗證。
熱激轉錄因子(Hsfs)作為熱激蛋白(HSP)的激活劑,在應對逆境脅迫和植物生長發(fā)育過程中發(fā)揮著重要作用。研究發(fā)現(xiàn)在擬南芥中AtHsfA2過表達能夠顯著熱脅迫與氧化應激的耐受性[33],ZmHsf08在玉米中對鹽脅迫與干旱脅迫起到負調控作用[34],菜豆PvHsfs在應對冷、熱、鹽及重金屬等非生物脅迫中發(fā)揮不同功能[11]。本文對BjuHsf 蛋白的GO 功能富集分析表明在芥菜中該基因家族成員參與有機物合成與代謝、RNA合成和受熱應激反應等生物學過程,而基因啟動子-順式作用元件分析發(fā)現(xiàn)BjuHsf基因參與生長發(fā)育、脅迫響應、生物合成和激素應答等生物學過程,這說明Hsf基因家族在不同物種中分化出多種復雜的生物學功能。BjuHsf 蛋白互作 分 析 表 明BjuA3b、BjuA2b、BjuA5b、BjuA1d 和BjuA2h 作為核心蛋白與多個家族成員存在互作關系,當植株受到外界刺激時,這些家族成員通過HR-A/B構成的蜷曲螺旋結構形成同源或異源多聚體,誘導下游熱激蛋白(heat shock protein,HSP)表達,發(fā)生應激反應。
系統(tǒng)性進化樹分析表明不同物種Hsf基因家族亞組間出現(xiàn)趨同與趨異的進化趨勢。BjuHsf基因家族成員不均勻分布于18對染色體,共線性分析發(fā)現(xiàn)105 個基因復制事件導致了BjuHsf發(fā)生了基因擴張,基因復制是產(chǎn)生新基因的來源,促使新功能基因的產(chǎn)生,有助于BjuHsf的進化。BjuHsf重復基因對的Ka/Ks比值均小于1,表明BjuHsf基因受到純化選擇壓力,強純化選擇壓力維持了BjuHsf基因家族的功能。芥菜與大白菜相比擬南芥具有更多的直系同源基因對,說明BjuHsf與大白菜Hsf具有更近的同源進化關系。
在低溫脅迫下,葉用芥菜8 個BjuHsf基因顯著上調表達,6個BjuHsf基因顯著下調表達,顯著上調表達的基因多為A 類BjuHsf,而顯著下調表達的基因多為B 類BjuHsf,C 類則無顯著變化,表明A 類BjuHsf基因在低溫脅迫應答反應中發(fā)揮重要的調控作用,而低溫脅迫更多抑制了B 類BjuHsf基因的表達,這將為后續(xù)研究芥菜低溫脅迫應答機制的研究提供了理論依據(jù)。
本文利用生物信息學系統(tǒng)性研究了BjuHsf基因家族的基因結構、保守基序、保守結構域、種系進化和順式作用元件以及表達模式。最終篩選出8 個BjuHsf基因與芥菜耐寒機制密切相關,可作為研究提高芥菜耐寒性的候選基因。本研究為研究芥菜Hsf基因家族提供了參考價值,為分子育種提高作物抗逆性提供科學依據(jù)。