付鴻博,李 杰,楊永超,袁盛勇
(紅河學院 生物科學與農(nóng)學學院,云南省高校滇南特色生物資源研究與利用重點實驗室,云南 蒙自 661199)
植物經(jīng)常遭受干旱、鹽堿、極端溫度、機械損傷、昆蟲和病原菌等各種非生物和生物脅迫,嚴重影響其生長發(fā)育、產(chǎn)量和品質(zhì)[1-2]。鋅指同源異形盒ZF-HD 基因在植物生長發(fā)育過程中的重要調(diào)控作用以及對多種生物和非生物脅迫的反應(yīng),受到人們的廣泛關(guān)注。ZF-HD 基因家族首次在C4 植物洋甘菊中被發(fā)現(xiàn)[3],許多研究表明,植物ZF-HD基因在葉片、種子和果實等組織的生長發(fā)育及脅迫響應(yīng)中發(fā)揮著重要作用。在擬南芥和水稻的研究中發(fā)現(xiàn),多個AtZF-HD基因參與了花、種子和芽的發(fā)育[4-6],過表達OsZHD1會影響水稻葉片的發(fā)育[7]。在有關(guān)脅迫響應(yīng)研究中發(fā)現(xiàn),大麥HvZFHD1的表達受到干旱、鹽和高溫脅迫后上調(diào)[8]。番茄SlZHD13的表達在干旱和鹽脅迫后上調(diào)[9],同時沉默該基因后番茄植株的耐旱和耐鹽性降低[10-11]。黃瓜ZF-HD基因?qū)Ω珊得{迫有響應(yīng)[12]。
石榴(Punica granatum)是一種集生態(tài)、觀賞和保健價值于一體的優(yōu)良果樹,深受世界各國人民喜愛。石榴為石榴科石榴屬小喬木,在熱帶地區(qū)為常綠果樹樹種,是已知的最早的可食用水果之一[13]。石榴一般被認為起源于伊朗,在地中海及中東地區(qū)已有幾千年的栽培歷史,現(xiàn)廣泛種植在地中海、熱帶和亞熱帶地區(qū)。石榴喜光,耐瘠薄,耐旱,易成活,有一定的耐寒能力,能在干燥地區(qū)生長[13]。石榴樹和石榴花優(yōu)雅美麗,是營造純林和觀賞混林的理想選擇。目前,對石榴的研究重視程度較低,總體水平較為落后,尤其是有關(guān)石榴分子生物學的研究更少,石榴全基因組的公布[14]為石榴分子層面的研究提供了重要的保障。ZF-HD 基因在應(yīng)對脅迫和生長發(fā)育過程中發(fā)揮了重要的作用,但目前有關(guān)石榴ZF-HD 基因家族的研究還未見報道。本研究通過石榴基因組數(shù)據(jù)鑒定ZF-HD基因家族成員,并對其進行生物信息學分析,為進一步研究石榴ZF-HD基因的生物學功能提供理論參考。
石榴基因組數(shù)據(jù)下載于NCBI 數(shù)據(jù)庫,ZF-HD結(jié)構(gòu)域序列(PF04770)下載于Pfam 數(shù)據(jù)庫(https://pfam.xfam.org/),并用來查詢序列以識別蛋白質(zhì),hmmer 3.0 軟件用于鑒定石榴ZF-HD 基因。對候選ZF-HD 基因的結(jié)構(gòu)域利用NCBI 數(shù)據(jù)庫進行驗證,最終確定石榴ZF-HD基因家族成員。
石榴ZF-HD 基因家族成員的理化性質(zhì)及二級結(jié)構(gòu)利用在線數(shù)據(jù)庫ProtParam、PSORT ⅡPrediction 和SOMPA 進行分析。擬南芥ZF-HD 蛋白序列從擬南芥TAIR 數(shù)據(jù)庫下載,利用PgZF-HD和AtZF-HD 蛋白序列構(gòu)建系統(tǒng)進化樹。根據(jù)石榴基因組注釋信息,利用TBtools 工具分析基因結(jié)構(gòu),將所鑒定到的PgZF-HD 家族成員定位到染色體上,利用MCScanX 分析基因復制事件,蛋白質(zhì)保守基序和啟動子元件利用在線數(shù)據(jù)庫MEME 和PlantCARE進行分析,利用TBtools工具實現(xiàn)可視化繪圖。
對所有鑒定的石榴ZF-HD 基因家族成員進行理化性質(zhì)和二級結(jié)構(gòu)分析后發(fā)現(xiàn)(表1),在15 個PgZF-HD 蛋白中,PgZF-HD15 為最小的蛋白質(zhì),由98個氨基酸組成,分子質(zhì)量為10.81 ku,PgZF-HD10為最大的蛋白質(zhì),由365個氨基酸組成,分子質(zhì)量為40.82 ku。等電點在6.49(PgZF-HD04)~9.33(PgZFHD10),其中只有PgZF-HD03 和PgZF-HD04 的等電點小于7,為酸性蛋白質(zhì),其余的家族成員均為堿性蛋白質(zhì)。不穩(wěn)定系數(shù)范圍在53.13(PgZF-HD05和PgZF-HD06)~83.72(PgZF-HD09),親水性范圍在-1.035(PgZF-HD07 和PgZF-HD08)~ -0.655(PgZF-HD10),表明所有家族成員均為不穩(wěn)定的親水性蛋白質(zhì)。蛋白質(zhì)亞細胞定位表明,11 個PgZFHD蛋白位于細胞核上,2個位于細胞質(zhì),2個位于線粒體,表明不同的PgZF-HD 家族成員可能在不同的環(huán)境中發(fā)揮不同的作用。對二級結(jié)構(gòu)預測后發(fā)現(xiàn),全部家族成員均有α-螺旋、延伸鏈、β-折疊和無規(guī)則卷曲構(gòu)成,其中β-折疊的比例最低,所有家族成員均低于10%,最低的只有2.82%(PgZF-HD05 和PgZF-HD06),無規(guī)則卷曲的比例最高,均超過40%,最高的達到70.90%(PgZF-HD05 和PgZFHD06),表明無規(guī)則卷曲可能行使主要功能。
表1 石榴ZF-HD基因家族成員的理化性質(zhì)及二級結(jié)構(gòu)Tab.1 The physicochemical properties and secondary structure of ZF-HD gene family members of Punica granatum
根據(jù)所有石榴和擬南芥ZF-HD 家族成員蛋白質(zhì)序列的比較結(jié)果構(gòu)建進化樹(圖1),將15 個石榴ZF-HD 基因分成了5 個類別,ZF-HDⅠ、ZF-HDⅡ、ZF-HDⅢ、ZF-HDⅤ和MIF,分別包括了2、2、7、3、1個家族成員。在ZF-HDⅣ類別中只有擬南芥ZFHD基因,沒有石榴ZF-HD基因被歸類到此別中。
圖1 石榴和擬南芥ZF-HD基因家族成員的系統(tǒng)進化樹分析Fig.1 Phylogenetic tree analysis of ZF-HD family members from Punica granatum and Arabidopsis thaliana
根據(jù)石榴ZF-HD 蛋白序列構(gòu)建的系統(tǒng)發(fā)育樹(圖2A),共分成了5 類,分別為MIF、ZF-HDⅠ、ZFHDⅡ、ZF-HDⅢ和ZF-HDⅤ。為了進一步研究蛋白質(zhì)的特征區(qū)域,通過MEME 在線數(shù)據(jù)庫,對15 個PgZF-HD 蛋白的氨基酸序列進行分析后將其可視化(圖2B),以10 個保守基序(motif)為標準進行鑒定,分析發(fā)現(xiàn),PgZF-HD 家族成員的motif2 和motif4高度保守,在15 個PgZF-HD 家族成員中均被鑒定到,其次為motif1 和motif3,這2 個保守基序只在MIF 類別下的PgZF-HD15 中沒被鑒定到。ZF-HDⅡ類別中鑒定到的motif 數(shù)量最多,共有9 個motif,只有motif8 沒有被鑒定到,ZF-HDⅠ類別中的所有基 因 均 鑒 定 到6 個motif(motif1、motif2、motif3、motif4、motif5和motif8),同時也發(fā)現(xiàn)motif8只在ZFHDⅠ類別的基因中被鑒定到。每一個類別下的保守基序有所差別,這些保守基序可能行使各自的功能而導致不同類別下的PgZF-HD基因的功能不同。根據(jù)石榴基因組注釋信息,比較15 個PgZFHD基因的外顯子-內(nèi)含子組成結(jié)構(gòu)并將其可視化(圖2C),結(jié)果表明,PgZF-HD基因結(jié)構(gòu)較為簡單,含有1~3 個外顯子,其中只有PgZF-HD06含有3個外顯子,1/2 以上的PgZF-HD基因均只有1 個外顯子,同一類別的基因具有相似的保守基序和基因結(jié)構(gòu)。將高度保守的基序組成進行圖譜繪制(圖2D),結(jié)果表明,motif1、motif2 和motif3 均由29 個氨基酸組成,motif4 由25 個氨基酸組成,這些motif 均含有多個保守的氨基酸位點,可能是行使功能的活性區(qū)域。
圖2 石榴ZF-HD基因家族的進化樹(A)、保守基序(B)、基因結(jié)構(gòu)(C)、基序組成(D)分析Fig.2 Analysis of phylogenetic relationships(A),conserved motif structure(B),gene structure(C),and motif composition(D)in PgZF-HD genes
為了從染色體水平對石榴ZF-HD 基因進行分析,通過MCScanX 對石榴ZF-HD 基因復制事件進行研究。從圖3 可以看出,石榴ZF-HD 存在一些基因復制事件,共有3 對基因(PgZF-HD02/PgZFHD08、PgZF-HD02/PgZF-HD14、PgZF-HD09/PgZFHD12)可能是由染色體的大片段復制而形成的。為了進一步了解石榴ZF-HD 基因在染色體上的分布情況,根據(jù)石榴基因注釋信息,將全部鑒定到的15個PgZF-HD基因定位到石榴的染色體上(圖3),發(fā)現(xiàn)石榴ZF-HD 基因不均勻地分布在8 條染色體上,4號染色體(Chr4)、6號染色體(Chr6)和7號染色體(Chr7)含有最多的PgZF-HD基因,均為4 個,2號染色體(Chr2)、3 號染色體(Chr3)和8 號染色體(Chr8)均只含有1 個PgZF-HD基因,PgZF-HD基因在1 號染色體(Chr1)和5 號染色體(Chr5)上沒有分布。一般情況下,在同一條染色體上的基因復制事件為串聯(lián)重復事件,分析后發(fā)現(xiàn),石榴ZF-HD 不存在基因重復事件。
圖3 石榴ZF-HD基因在染色體上的分布Fig.3 Chromosome location of PgZF-HD genes
通過在線網(wǎng)站PlantCARE 預測15 個PgZF-HD基因上游2 000 bp 序列的順式作用元件位點(圖4),除了TATA-box 和CAAT-box 2 個負責轉(zhuǎn)錄的關(guān)鍵轉(zhuǎn)錄因子以及光響應(yīng)的必要順式作用元件外,共發(fā)現(xiàn)有149 個關(guān)鍵的順式作用元件,其中包含生長素、赤霉素、脫落酸、茉莉酸甲酯、水楊酸等激素相關(guān)作用元件,以及生長發(fā)育相關(guān)和逆境脅迫相關(guān)的元件。其中,15 個PgZF-HD基因含有茉莉酸甲酯和脫落酸響應(yīng)元件數(shù)量最多,分別有32個茉莉酸甲酯響應(yīng)元件分布在7 個PgZF-HD基因中和26 個脫落酸響應(yīng)元件分布在11個PgZF-HD基因中。除了2 個水楊酸響應(yīng)元件只分布在PgZF-HD01和PgZF-HD02中外,大部分PgZF-HD基因均含有生長素和赤霉素響應(yīng)元件,且5 種激素響應(yīng)元件占關(guān)鍵順式作用元件總量的53%,表明PgZF-HD基因在響應(yīng)激素應(yīng)激方面可能具有重要作用。除此之外,PgZF-HD基因還含有響應(yīng)無氧、干旱和低溫等逆境相關(guān)作用元件共37個,占總數(shù)的24%。生長發(fā)育相關(guān)順式作用元件主要包括RY-element、GCN4-motif 和晝夜節(jié)律控制元件等,在15 個PgZF-HD基因中也均有不同數(shù)量的分布。每個PgZF-HD基因的啟動子區(qū)域均包含多個順式作用元件,表明PgZF-HD基因在植物激素響應(yīng)、生長發(fā)育和逆境脅迫響應(yīng)等方面均發(fā)揮重要作用。
圖4 石榴ZF-HD基因的啟動子分析Fig.4 Promoter analysis of PgZF-HD genes
目前由于植物基因組序列的可用性,對ZF-HD基因在許多植物物種中進行了全基因組研究。在黃瓜[12]、葡萄[15]、水稻[16]、番茄[9]、白菜[17]和蘋果[18]均已鑒定得到ZF-HD 基因家族成員,基因數(shù)量在黃瓜、葡萄和水稻中均為13 個,在番茄中有22 個,在白菜和蘋果中均有31 個。本研究共鑒定得到15 個石榴ZF-HD 基因,基因數(shù)量與前人研究的其他物種中ZF-HD 基因數(shù)量相比處于較少的水平。這可能與其基因復制事件較少有關(guān),石榴ZF-HD基因家族只存在3 對大片段復制事件,不存在串聯(lián)重復事件?;驈椭剖录腔蚣易宄蓡T擴張的主要因素。
ZF-HD 蛋白可以根據(jù)系統(tǒng)發(fā)育分為ZHD 和MIF 2 個亞家族,ZHD 可分成ZF-HDⅠ—Ⅴ5 個類別[16]。本研究根據(jù)這一分類標準,將15 個石榴ZFHD 基因分成ZHD 和MIF 2 個亞家族,但ZHD 亞家族中分成了4 類,ZF-HDⅣ中沒有石榴ZF-HD 基因。ZF-HD 蛋白具有保守的ZF-HD 結(jié)構(gòu)域(pf04770),由2 個高度保守的結(jié)構(gòu)域組成,包括C末端同源結(jié)構(gòu)域(HD)和N 末端C2H2 型ZF 結(jié)構(gòu)域[15]。本研究中鑒定了15 個石榴ZF-HD 基因的保守基序,發(fā)現(xiàn)motif2 和motif4 高度保守,構(gòu)成了ZFHD_dimer 結(jié)構(gòu)域,motif1 和motif3 在除PgZF-HD15基因外的基因中均存在,構(gòu)成了homeo_ZF_HD 結(jié)構(gòu)域,PgZF-HD15也正是由于缺失了homeo_ZF_HD結(jié)構(gòu)域被歸類于MIF 亞家族中。HD 結(jié)構(gòu)域包含一段高度保守的DNA 序列,編碼近60 個氨基酸,以及3 個α-螺旋,其中第一螺旋和第二螺旋形成環(huán)狀結(jié)構(gòu),經(jīng)過折疊和加工形成同源雜合盒結(jié)構(gòu)域[19];ZF結(jié)構(gòu)域包含2 對保守的半胱氨酸或組氨酸殘基,它們結(jié)合在一個Zn2+上形成穩(wěn)定的環(huán)狀結(jié)構(gòu),半胱氨酸促進了鋅結(jié)構(gòu)域中均相或異相二聚體的形成[20]。通過分析保守基序的組成發(fā)現(xiàn),構(gòu)成HD 結(jié)構(gòu)域的2個motif 所包括的氨基酸數(shù)量將近60 個,同時發(fā)現(xiàn)高度保守的4 個motif 均包含多個保守活性位點,這與前人的結(jié)果[15,17]一致。啟動子分析結(jié)果也表明,在PgZF-HD啟動子區(qū)域包含多個與激素、生長發(fā)育和脅迫響應(yīng)相關(guān)的順式作用元件,ZF-HD 基因在擬南芥[6]、水稻[7]和番茄[9]等物種中的相關(guān)功能均已被驗證,本研究結(jié)果結(jié)合前人的研究成果可為石榴ZF-HD基因的克隆及功能研究提供良好的保障。