姚 丹 倪曉鵬 侍 婷 倪照君 渠慎春 高志紅
(南京農(nóng)業(yè)大學(xué)園藝學(xué)院,江蘇 南京 210095)
NAC(NAM/ATAF/CUC)轉(zhuǎn)錄因子是近年來發(fā)現(xiàn)的一類植物特有的轉(zhuǎn)錄因子,其命名來源于矮牽牛NAM 基因、擬南芥ATAF1/2 和CUC1/2 基因首字母的縮寫,NAC 結(jié)構(gòu)中含有N-端高度保守的NAC 結(jié)構(gòu)域和C-端高度變異的轉(zhuǎn)錄激活域[1]。 Souer 等[2]于1996年首次在矮牽牛(Petunia hybrida Vilm.)中克隆得到NAM 基因,隨后越來越多的NAC 基因家族成員被鑒定出來, 目前已在擬南芥( Arabidopsis thaliana)[3]、水稻(Oryza sativa)[3]、毛果楊(Populus trichocarpa)[4]、 大 豆 ( Glycine max )[5]、 番 茄( Lycopersicon esculentum Mill.)[6]、 蘋 果 ( Malus pumila)[7]、 葡 萄(Vitis vinifera)[8]、 甘 藍(lán)(Brassica oleracea L.)[9]、 小 蘭 嶼 蝴 蝶 蘭 ( Phalaenopsis equestris)[10]等多種植物中分別鑒定出117、151、163、152、104、180、74、188、86 個(gè)NAC 基因。 大量研究表明,NAC 轉(zhuǎn)錄因子具有多種重要的生物學(xué)功能,如廣泛參與植物的分生組織發(fā)育[11]、花器官的發(fā)育[12]、側(cè)根發(fā)育[13]、次生細(xì)胞壁的形成[14]以及植物器官衰老[15]等,此外,NAC 轉(zhuǎn)錄因子還能對(duì)一些生物或非生物脅迫作出應(yīng)答,如病原菌[16-17]、干旱[18-19]、低溫[20]、高鹽[21-22]等。
果梅(Prunus mume Sieb.et Zucc)為薔薇科李屬植物,是我國(guó)重要的核果類樹種之一,我國(guó)果梅栽培歷史悠久,種質(zhì)資源豐富[23]。 果梅果實(shí)中富含多種維生素、有機(jī)酸及堿性礦物質(zhì)等,具有較高的保健作用及經(jīng)濟(jì)價(jià)值[24]。 隨著分子生物學(xué)及生物信息學(xué)的迅猛發(fā)展,越來越多的研究者在基因組水平上對(duì)植物中編碼重要功能的基因進(jìn)行了預(yù)測(cè)和功能分析[3,6,8]。 目前關(guān)于NAC 基因的研究報(bào)道很多,但在果梅上尚鮮見報(bào)道。 本研究利用多種生物信息學(xué)方法對(duì)果梅NAC 基因家族進(jìn)行鑒定及分析,并采用實(shí)時(shí)熒光定量PCR技術(shù)分析果梅NAC 基因的組織表達(dá)特異性,旨在為進(jìn)一步研究果梅NAC 基因的生物學(xué)功能奠定基礎(chǔ)。
以南京市浦口區(qū)南京農(nóng)業(yè)大學(xué)園藝實(shí)驗(yàn)站中國(guó)家果梅種質(zhì)資源圃的果梅品種龍眼為試驗(yàn)材料,采集其花芽、幼葉、嫩莖、果皮、果肉和果胚,液氮速凍后,-70℃保存?zhèn)溆谩?/p>
1.2.1 果梅NAC 基因家族的鑒定 從擬南芥轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)RARTF(http:/ /rarge.gsc.riken.jp/rartf/)下載擬南芥NAC 蛋白序列,利用Hmmer 3.0 軟件建立Profile HMM 模型, 并利用此模型檢索從 NCBI(https:/ /www.ncbi.nlm.nih.gov/)下載的果梅蛋白數(shù)據(jù)庫(kù),去除冗余序列,即得到候選蛋白序列[25]。 利用SMATR(http:/ /smart. embl-heidelberg.de/)在線平臺(tái)預(yù)測(cè)這些候選蛋白是否存在NAC 結(jié)構(gòu)域,存在NAC結(jié)構(gòu)域的屬于果梅NAC 蛋白家族。
1.2.2 染色體定位及亞細(xì)胞定位分析 根據(jù)果梅NAC 蛋白的基因注釋,得到每個(gè)PmNAC 基因的染色體位置及果梅各染色體長(zhǎng)度,然后利用MapInspect 軟件繪制PmNAC 基因在染色體上的定位分布。 利用在線工具Protcomp 9.0 和CELLO v2.5 進(jìn)行亞細(xì)胞定位分析。
1.2.3 系統(tǒng)發(fā)育分析 利用ClustalX 2.0 軟件將果梅NAC 家族蛋白序列與擬南芥NAC 家族蛋白序列進(jìn)行多序列比對(duì)分析,利用MEGA 5 軟件采用鄰接(neighbor-joining,NJ)法構(gòu)建NAC 蛋白家族的系統(tǒng)發(fā)育進(jìn)化樹,對(duì)構(gòu)建的進(jìn)化樹進(jìn)行自檢,bootstrap 值設(shè)為1 000[26]。
1.2.4 保守基序的鑒定及結(jié)構(gòu)預(yù)測(cè) 利用MEME 在線程序?qū)種AC 蛋白進(jìn)行保守基序(motif)分析,motif 最大檢索值設(shè)為10;利用ExPaSy 提供的在線平臺(tái)Protparam 對(duì)果梅NAC 蛋白進(jìn)行一級(jí)理化性質(zhì)分析;利用SOPMA 程序?qū)種AC 蛋白進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè);利用Swiss-Model 程序?qū)種AC 蛋白進(jìn)行三維結(jié)構(gòu)同源建模[27]。
1.2.5 實(shí)時(shí)熒光定量PCR 分析 采用改良的CTAB法[28]提取果梅不同組織的總RNA,并參照PrimeScriptⅡ1stStrand cDNA Synthesis Kit(TaKaRa,日本)操作說明書合成cDNA 第一鏈。 利用Oligo7 軟件設(shè)計(jì)熒光定量引物,引物序列詳見表1。 以6 個(gè)不同組織(花芽、幼葉、嫩莖、果皮、果肉和果胚)的cDNA 為模板,果梅actin-RP-Ⅱ基因?yàn)閮?nèi)參,采用7300 Real Time PCR System(ABI,美國(guó))對(duì)12 個(gè)PmNAC 基因進(jìn)行實(shí)時(shí)熒光定量PCR 分析。
實(shí)時(shí)熒光定量PCR 反應(yīng)體系:1 μL 稀釋10 倍的cDNA 模板,上下游引物各0.2 μL、SYBR Premix Ex TaqTM 熒光染料10 μL,ddH2O 8.6 μL。 反應(yīng)程序:95℃預(yù)變性4 min;95℃變性20 s,60℃退火20 s,72℃延伸40 s,40 次循環(huán)。 循環(huán)結(jié)束后95℃1 min,60℃30 s,40℃2 min 進(jìn)行溶解曲線分析。 每樣品設(shè)3 次生物學(xué)重復(fù),采用2-ΔΔCT法[29]分析基因表達(dá)量。
表1 PmNAC 基因?qū)崟r(shí)熒光定量PCR 引物序列Table 1 Real time fluorescence quantitative primer sequences of PmNAC genes
根據(jù)擬南芥NAC 基因的蛋白序列,通過對(duì)果梅蛋白數(shù)據(jù)庫(kù)的比對(duì)搜索,初步從果梅基因組中獲得129條蛋白序列。 去冗余后再用SMART 程序檢測(cè)NAC 結(jié)構(gòu)域,最終鑒定得到106 個(gè)果梅NAC 基因。 由表2 可知,NAC 蛋白在氨基酸數(shù)目、分子量、理論等電點(diǎn)等方面均存在差異,其中PmNAC12 和PmNAC30 這2 個(gè)基因由于序列中包含連續(xù)幾個(gè)不明確的氨基酸,導(dǎo)致其分子量和理論等電點(diǎn)無法確定。 PmNAC4 的氨基酸數(shù)目最少有 129 個(gè), 其分子量為 14 763.98 Da;PmNAC101 的氨基酸數(shù)目最多有832 個(gè),其分子量為88 815.51 Da。 蛋白質(zhì)理論等電點(diǎn)介于4.12 ~9.70 之間,但總體而言,果梅NAC 家族蛋白成員的理論等電點(diǎn)多在酸性范圍內(nèi),說明蛋白質(zhì)分子中富含酸性氨基酸。 蛋白質(zhì)疏水性介于-0.378 ~-1.037 之間,疏水性負(fù)值越大表示越親水,正值越大表示越疏水,疏水值介于-0.5~0.5 之間的為兩性氨基酸[30]。 預(yù)測(cè)結(jié)果顯示,果梅106 條NAC 蛋白序列中有101 條序列疏水值為負(fù)值且小于-0.5,表明大部分果梅NAC 蛋白是親水蛋白,其中,僅有PmNAC4(-0.493 )、PmNAC101(-0.487 )、PmNAC20(-0.440)、PmNAC46(-0.388 )、PmNAC68(-0.378 )為兩性氨基酸。
表2 果梅基因組中NAC 基因家族的鑒定Table 2 Identification of NAC gene family in the P. mume genome
表2(續(xù))
表2(續(xù))
利用MapInspect 軟件繪制果梅NAC 基因家族成員在染色體上的定位分布,并參照番茄NAC 基因的命名方法[31],按照染色體位置對(duì)所有PmNAC 基因進(jìn)行系統(tǒng)編號(hào)。 由圖1 可知,PmNAC 中有21 個(gè)基因(PmNAC86~PmNAC106)無匹配的染色體定位信息。染色體定位分析發(fā)現(xiàn),NAC 基因在果梅的8 條染色體上呈現(xiàn)不均勻分布,其中第3 號(hào)染色體上分布最多,為17 個(gè);其次是第2 號(hào)染色體,為14 個(gè);第8 號(hào)染色體分布最少,為6 個(gè)。 此外,NAC 基因在果梅染色體上的分布存在明顯的串聯(lián)重復(fù)現(xiàn)象,共發(fā)現(xiàn)14 個(gè)串聯(lián)重復(fù)的基因簇,包含33 個(gè)基因,占PmNAC 基因總數(shù)的31.13%。 亞細(xì)胞定位預(yù)測(cè)顯示,大部分的果梅NAC基因都能定位于細(xì)胞核中,屬于典型的核蛋白。
圖1 PmNAC 基因在果梅基因組染色體上的分布位置Fig.1 Chromosomal locations of PmNAC genes on P. mume chromosomes
由圖2 可知,果梅和擬南芥NAC 基因共被分成12個(gè)亞族。 其中,第12 亞族中的果梅NAC 基因數(shù)量最多,為25 個(gè);其次是第5 亞族,為21 個(gè);第7 和第10亞族中成員數(shù)量最少,均只有1 個(gè)。 在第7 亞族中擬南芥NAC 基因較為密集,但果梅NAC 基因只有1 個(gè)(PmNAC62),說明PmNAC62 與其他果梅NAC 基因進(jìn)化關(guān)系較遠(yuǎn)。 第9 亞族全部由PmNAC 基因組成,這可能是由于該亞族NAC 基因在果梅中獨(dú)自進(jìn)化,也可能是在擬南芥中發(fā)生了基因丟失的原因。 除第9 亞族外,每個(gè)亞族均同時(shí)含有果梅和擬南芥NAC 基因。
利用MEME 在線程序分析發(fā)現(xiàn),果梅NAC 蛋白具有10 個(gè)保守基序,主要分布于序列N 端(圖3),且在大多數(shù)果梅NAC 轉(zhuǎn)錄因子中都有分布,屬于高保守基序。 一般聚在同一亞族的蛋白會(huì)有相似的保守基序組成,第1~第9 亞族中果梅NAC 蛋白的保守基序大多相似,表明在這些亞族中NAC 基因家族成員的進(jìn)化關(guān)系較近;而第10、第11、第12 亞族中果梅NAC 蛋白的保守基序相差較大,表明這些亞族中NAC 成員進(jìn)化關(guān)系較遠(yuǎn)。 在InterPro 數(shù)據(jù)庫(kù)中對(duì)這些基序進(jìn)行注釋,發(fā)現(xiàn)基序1~6 屬于NAM 結(jié)構(gòu)域,在分子功能上均具有DNA 結(jié)合活性,在生物過程中,主要參與轉(zhuǎn)錄調(diào)控過程,其他基序均無顯著的數(shù)據(jù)庫(kù)記錄(表3)。
表3 果梅NAC 蛋白保守基序的氨基酸序列Table 3 Amino acid sequences of conserved motifs of NAC protein in P. mume
利用SOPMA 程序?qū)?06 個(gè)果梅NAC 蛋白進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè),結(jié)果顯示,果梅NAC 蛋白家族的二級(jí)結(jié)構(gòu)大多都以無規(guī)則卷曲為主要構(gòu)成元件,所占比例為27.1%~62.26%,而α-螺旋(10.09%-45.68%)、β-折疊(11.34% ~33.55%) 和 β - 轉(zhuǎn) 角(3.09% ~13.87%)則分散于整個(gè)蛋白質(zhì)中。
利用SWISS-MODEL 在線工具對(duì)106 個(gè)果梅NAC蛋白的氨基酸序列進(jìn)行三級(jí)結(jié)構(gòu)同源建模,發(fā)現(xiàn)它們的三維構(gòu)象基本類似。 每個(gè)亞族選出一個(gè)能代表該亞族三級(jí)結(jié)構(gòu)特征的NAC 蛋白,記錄其組成元件(圖4)。結(jié)果顯示,其中6 個(gè)蛋白質(zhì)(PmNAC54、PmNAC32、PmNAC62、PmNAC51、PmNAC48 和PmNAC2)的α-螺旋和β-折疊的個(gè)數(shù)都分別為5 和9;4 個(gè)蛋白質(zhì)(PmNAC71、PmNAC31、PmNAC68 和PmNAC60)的α-螺旋和β-折疊的個(gè)數(shù)都分別為4 和8;2 個(gè)蛋白質(zhì)(PmNAC61 和PmNAC95)的α-螺旋和β-折疊的個(gè)數(shù)都分別為6 和8。 雖然部分果梅NAC 蛋白的α-螺旋和β-折疊個(gè)數(shù)相同,但其三維構(gòu)象存在差異,這可能與α-螺旋、β-折疊及無規(guī)則卷曲的長(zhǎng)度、分布不同有關(guān),從而導(dǎo)致其功能上的差異。
圖3 果梅NAC 蛋白保守基序Fig.3 The NAC proteins conservative motif of P. mume
圖4 12 個(gè)代表性的果梅NAC 蛋白質(zhì)的三級(jí)結(jié)構(gòu)Fig.4 The tertiary structure of 12 representative NAC proteins in P. mume
由圖5 可知,12 個(gè)PmNAC 基因在不同組織中的表達(dá)差異明顯,其中3 個(gè)基因(PmNAC54、PmNAC32 和PmNAC68) 在果皮中的表達(dá)量最高, 4 個(gè)基因(PmNAC60、PmNAC95、PmNAC51 和PmNAC2)在果肉中的表達(dá)量最高,3 個(gè)基因(PmNAC31、PmNAC62 和PmNAC48)在嫩莖中的表達(dá)量最高,其他2 個(gè)基因PmNAC61 和PmNAC71 分別在果胚和花芽中的表達(dá)量最高。 此外,PmNAC54 在果胚和嫩莖中的表達(dá)相對(duì)較高,在花芽和果肉中表達(dá)量極低,在幼葉中幾乎不表達(dá);PmNAC61 在花芽中的表達(dá)量相對(duì)較高,在嫩莖中也有表達(dá);PmNAC71 在嫩莖、果肉、果胚中表達(dá)相對(duì)較高;PmNAC31 在花芽和果肉中的表達(dá)量也相對(duì)較高,其次在幼葉中也有表達(dá);PmNAC32 在果肉中的表達(dá)量較高,在其他組織中幾乎不表達(dá);PmNAC68 在花芽中的表達(dá)量較高,其次在果肉和果胚中也有表達(dá);PmNAC62 在果皮、果肉、果胚中的表達(dá)量較高,在幼葉中也有較高的表達(dá);PmNAC60 在嫩莖和果皮中也有表達(dá)相對(duì)較高,其次在花芽、幼葉中也有表達(dá);PmNAC95在果皮中表達(dá)相對(duì)較高,在其他組織中幾乎不表達(dá);PmNAC51 在果皮和嫩莖中的表達(dá)量較高;PmNAC48在嫩莖中表達(dá)量相對(duì)較高,其次在果肉、果胚、果皮也有表達(dá);PmNAC2 在果皮和果胚中的表達(dá)也相對(duì)較高,其次在花芽和嫩莖也有表達(dá)。 PmNAC 基因不同的表達(dá)特性表明它們?cè)谶M(jìn)化過程中出現(xiàn)了功能分化。 總體來看, PmNAC32 幾乎僅在果皮和果肉中表達(dá),PmNAC68 在果皮中也具有很高的表達(dá)水平,推測(cè)它們可能在果梅的果實(shí)發(fā)育和果皮著色方面發(fā)揮重要作用,但其具體分子機(jī)理仍需進(jìn)一步深入研究。
NAC 轉(zhuǎn)錄因子是植物基因組中最大的轉(zhuǎn)錄因子家族之一,且主要存在于陸生植物中[32]。 前人研究認(rèn)為植物體某一特定基因家族的多成員現(xiàn)象,是由于其在生物進(jìn)化過程中,基因組的廣泛復(fù)制和多樣化造成的[33]。 本研究利用生物信息學(xué)方法首次在果梅中鑒定得到106 個(gè)NAC 基因家族成員,低于擬南芥(117)、水稻(151)[3]、大豆(152)[5]等作物,可能是由于果梅基因組中沒有大規(guī)模的片段復(fù)制,且相對(duì)保守等原因造成的。 基因可以通過多種方式進(jìn)行擴(kuò)增,包括全基因組復(fù)制、串連復(fù)制、片段復(fù)制和逆轉(zhuǎn)座復(fù)制等[33]。通過染色體定位分析發(fā)現(xiàn),PmNAC 在果梅基因組中廣泛分布,且存在明顯的串聯(lián)重復(fù)現(xiàn)象,表明串聯(lián)重復(fù)是果梅NAC 基因擴(kuò)增的一種重要方式。 蛋白結(jié)構(gòu)分析發(fā)現(xiàn),果梅NAC 基因多編碼酸性氨基酸,且多數(shù)NAC蛋白為親水蛋白。 蛋白質(zhì)二級(jí)結(jié)構(gòu)中的α-螺旋、β-折疊、β-轉(zhuǎn)角和無規(guī)則卷曲,以及三級(jí)結(jié)構(gòu)中的蛋白質(zhì)折疊的空間構(gòu)象具有較高的保守性,與在其他植物的NAC 基因家族的研究結(jié)果一致[6,25,27]。 根據(jù)系統(tǒng)進(jìn)化樹將106 個(gè)果梅NAC 基因分為12 個(gè)亞族,除第9亞族外,每個(gè)亞族均同時(shí)含有果梅和擬南芥NAC 基因,在各個(gè)亞族中的數(shù)目不同可能是由基因復(fù)制或基因丟失導(dǎo)致的,且聚在同一亞族的基因,其親緣關(guān)系較近,預(yù)示它們可能具有相似的功能[10]。
前人針對(duì)不同作物的NAC 基因家族進(jìn)行了大量的研究,如韓芹芹[34]發(fā)現(xiàn)在番茄果實(shí)的綠熟期和破色期,SINAC3(JF701987)基因在果皮和果肉中的表達(dá)較高,在果實(shí)破色期達(dá)到最高值,干涉表達(dá)的轉(zhuǎn)基因番茄果實(shí)成熟時(shí)間明顯延遲,果實(shí)中番茄紅素的合成受到明顯抑制,說明該基因在果實(shí)的成熟轉(zhuǎn)變過程中發(fā)揮重要作用;Kou 等[35]研究發(fā)現(xiàn),番茄多個(gè)NAC 基因參與調(diào)控果實(shí)的發(fā)育成熟,其中SNAC5 基因在番茄果實(shí)粉紅期表達(dá)量較高,SNAC8 和SNAC9 基因在番茄破色期和紅熟期的外果皮大量表達(dá),粉紅期的表達(dá)量則較低。 本研究結(jié)果表明,PmNAC 基因在果梅不同組織中均有表達(dá),推測(cè)NAC 基因可能參與果梅的整個(gè)生長(zhǎng)發(fā)育過程,但不同亞族的NAC 基因表達(dá)差異明顯,且大部分的PmNAC 基因在果皮、果肉上都具有較高的表達(dá)量,其中PmNAC32 和PmNAC68 表達(dá)量最高,推測(cè)NAC 基因可能在果梅的果皮著色和果實(shí)發(fā)育過程中發(fā)揮重要的調(diào)控作用。
有研究還發(fā)現(xiàn),NAC 基因通過乙烯信號(hào)轉(zhuǎn)導(dǎo)途徑參與果實(shí)的發(fā)育成熟,表明NAC 協(xié)同乙烯共同調(diào)控果實(shí)的生長(zhǎng)發(fā)育過程,且可以通過改變NAC 基因的表達(dá)水平,從而達(dá)到調(diào)控果實(shí)發(fā)育成熟,延緩衰老,延長(zhǎng)采后貯藏保鮮的目的[36-37]。 本研究結(jié)果表明,PmNAC61基因在果胚的表達(dá)量最高,推測(cè)該基因可能與種子或胚的發(fā)育有關(guān)。 此外,PmNAC31 和PmNAC71 分別在莖和花芽中表達(dá)量最高,推測(cè)它們可能分別與莖和花器官的發(fā)育相關(guān),與Christianson 等[38]降低擬南芥AtNAC102 的表達(dá)水平,其種子萌發(fā)率顯著下降的研究結(jié)果一致。 本研究結(jié)果表明,果梅NAC 基因在不同組織中的多種表達(dá)模式可能是由于進(jìn)化過程中為了適應(yīng)環(huán)境而出現(xiàn)功能分化的結(jié)果,從而表現(xiàn)出功能的多效性。 隨著生物技術(shù)的發(fā)展,利用轉(zhuǎn)基因技術(shù)導(dǎo)入編碼重要功能的基因,對(duì)于改善作物品質(zhì)、提高抗逆性具有重要意義,因此,有關(guān)果梅NAC 蛋白的功能分析及其所參與的信號(hào)轉(zhuǎn)導(dǎo)途徑可采用該技術(shù)進(jìn)一步深入研究。
本研究首次在果梅基因組鑒定得到106 個(gè)NAC基因家族成員,分析表明,果梅NAC 基因多是編碼酸性氨基酸,大部分NAC 蛋白為親水蛋白,且為典型的核蛋白,根據(jù)系統(tǒng)發(fā)育特征可分為12 個(gè)亞族。 此外,通過實(shí)時(shí)熒光定量PCR 技術(shù)得到不同亞族的PmNAC基因在果梅各個(gè)組織的表達(dá)模式,NAC 基因在不同組織中均有表達(dá),但表達(dá)差異明顯,說明NAC 基因參與果梅的整個(gè)生長(zhǎng)發(fā)育過程。 其中 PmNAC32 和PmNAC68 表達(dá)特征明顯,在果皮和果肉中具有較高的表達(dá)量,可能對(duì)果梅的果實(shí)發(fā)育和果皮著色發(fā)揮重要的調(diào)控作用,但其分子機(jī)理仍需進(jìn)一步研究。 本研究結(jié)果為果梅NAC 蛋白的功能分析奠定了一定的理論基礎(chǔ)。
圖5 PmNAC 基因在不同組織中的相對(duì)表達(dá)水平Fig.5 Relative expression levels of PmNAC genes in different tissues of P. mume