張鵬飛,王 寧,周 蔓,李 萍
(西南交通大學(xué)生命科學(xué)與工程學(xué)院, 成都 610031)
?
牦牛兒基牻牛兒基焦磷酸合成酶(GGPS)的生物信息學(xué)分析
張鵬飛,王 寧,周 蔓,李 萍*
(西南交通大學(xué)生命科學(xué)與工程學(xué)院, 成都 610031)
GGPS是萜類(lèi)化合物合成的一個(gè)重要分支點(diǎn)酶,同時(shí)也是合成GGPP的催化酶。本課題共選擇了9個(gè)不同科的植物,對(duì)其GGPS核苷酸及氨基酸序列的理化性質(zhì)、蛋白質(zhì)結(jié)構(gòu)功能以及親緣進(jìn)化關(guān)系等進(jìn)行詳細(xì)的分析。結(jié)果表明,九個(gè)科植物GGPS核苷酸序列長(zhǎng)度均大于1 000 bp小于2 000 bp;GGPS氨基酸都不含有信號(hào)肽,不存在跨膜結(jié)構(gòu)域;GGPS蛋白的二級(jí)結(jié)構(gòu)中α螺旋和無(wú)規(guī)卷曲是主要結(jié)構(gòu),且無(wú)β-折疊結(jié)構(gòu),延伸鏈和β-轉(zhuǎn)角則分散于整個(gè)蛋白中。通過(guò)生物信息學(xué)方法進(jìn)行合理預(yù)測(cè),為進(jìn)一步研究GGPS的酶學(xué)特性提供了重要理論依據(jù)。
生物信息學(xué);GGPS;分子進(jìn)化
高等植物中類(lèi)胡蘿卜素的合成途徑理論已經(jīng)成熟,牻牛兒基牻牛兒基焦磷酸(GGPP)是類(lèi)胡蘿卜素最直接的前體物質(zhì)[1]。GGPS催化3,3-二甲烯丙基焦磷酸(DMAPP)與異戊烯基焦磷酸(IPP)合成GGPP,兩個(gè)GGPP分子通過(guò)八氫番茄紅素合成酶縮合形成八氫番茄紅素。GGPS基因最早從辣椒[2]中分離得出,之后又在番茄[3]、丹參[4]、煙草[5]、銀杏[6]等植物中分離得到。
近年來(lái),GGPS基因在功能研究上取得了一些進(jìn)展。在一些植物中發(fā)現(xiàn)GGPS對(duì)類(lèi)胡蘿卜素的合成積累具有極為重要的作用[3,7]。但在啤酒酵母中GGPS基因過(guò)表達(dá),會(huì)導(dǎo)致β-胡蘿卜素含量顯著增加[8]。在法夫酵母和卷枝毛霉中,GGPS過(guò)表達(dá)也能顯著提高類(lèi)胡蘿卜素產(chǎn)量[9-10]。在cDNA文庫(kù)中,通過(guò)使用該酶抗體完成篩選,從而得到GGPScDNA[11]。另外研究還發(fā)現(xiàn),GGPS對(duì)于調(diào)節(jié)碳流還有著重要的作用[12]。在植物體中,GGPS經(jīng)常是多基因家族化合物。其表達(dá)的蛋白質(zhì)存在于不同的亞細(xì)胞結(jié)構(gòu)中[13]。本課題共選擇了以下9種不同科且已知GGPS基因序列的物種:銀杏(銀杏科)、煙草(茄科)、長(zhǎng)春花(夾竹桃科)、丹參(唇形科)、薔薇(薔薇科)、萬(wàn)壽菊(菊科)、甘薯(薯蕷科)、茉莉(木犀科)、加拿大紅豆杉(紅豆杉科)。對(duì)GGPS的理化性質(zhì)、核酸序列、蛋白質(zhì)結(jié)構(gòu)功能等進(jìn)行詳細(xì)的分析,研究其進(jìn)化關(guān)系,進(jìn)而更深層次的了解GGPS的性質(zhì),為該基因?qū)χ参锏纳L(zhǎng)調(diào)控所產(chǎn)生的影響提供更可靠的理論依據(jù)。
1.1 實(shí)驗(yàn)材料
本實(shí)驗(yàn)數(shù)據(jù)來(lái)源于NCBI核酸和蛋白質(zhì)數(shù)據(jù)庫(kù)中已經(jīng)注冊(cè)的GGPS核酸及相應(yīng)的氨基酸序列,包括銀杏(Ginkgobiloba ,AAQ72786.1)、萬(wàn)壽菊(Tageteserecta,AAG10424.1)、甘薯(Ipomoea batatas,ACF37217.1)、茉莉(Jasminum sambac,AIY24421.1)、加拿大紅豆杉(Taxus canadensis,AAD16018.1)、煙草(Nicotiana tabacum,ADD49734.1)、長(zhǎng)春花(Catharanthus roseus,AGL91648.1)、丹參(Salvia miltiorrhiza,ACR19637.1)、薔薇(Cistus creticus,AAM21639.1)、甜菊(Stevia rebaudiana,ABD92926.2)、蓖麻(Ricinus communis,XP_002531191.1)、麻瘋樹(shù)(Jatropha curcas,ADD82422.1)、橡膠樹(shù)(Hevea brasiliensis,BAF98302.1)。
1.2 方法
GGPS氨基酸序列的理化性質(zhì)的分析使用Expasy軟件中的ProtParam在線(xiàn)工具;ORF的預(yù)測(cè)分析使用NCBI數(shù)據(jù)庫(kù)中ORF查詢(xún)工具;使用SignalP 4.1在線(xiàn)工具分析GGPS是否含有信號(hào)肽;通過(guò)NetPhos 2.0 和NetNGlyc 1.0在線(xiàn)工具分析糖基化和磷酸化位點(diǎn);通過(guò)NCBI數(shù)據(jù)庫(kù)中的CDD工具對(duì)GGPS的保守結(jié)構(gòu)域進(jìn)行預(yù)測(cè)分析;通過(guò)SOPMA軟件可以預(yù)測(cè)GGPS二級(jí)結(jié)構(gòu),通過(guò)SWISS-MODEL在線(xiàn)分析其三級(jí)結(jié)構(gòu);通過(guò)Clustal X采用漸進(jìn)比較算法進(jìn)行多序列比對(duì)[14];通過(guò)MEGA建樹(shù)工具構(gòu)建進(jìn)化樹(shù)。
2.1 GGPS氨基酸序列理化性質(zhì)分析
使用在線(xiàn)分析軟件ProtParam分析9種植物GGPS氨基酸序列的理化性質(zhì)(見(jiàn)表1)。
由表可知,所選植物GGPS序列在氨基酸數(shù)目、預(yù)測(cè)分子量、Ip都表現(xiàn)出一致性,他們的基因序列全長(zhǎng)在1 000 bp到2 000 bp之間;氨基酸數(shù)目除銀杏和加拿大紅豆杉在390左右外,其余的在365左右;Ip值除甘薯6.84以外,其余均小于6,不穩(wěn)定指數(shù)40左右,脂肪指數(shù)在94左右;Ala、Leu、Glu、Lys、Gly是所選植物GGPS序列中含量最為豐富的氨基酸,而Pyl和Sec為所選植物中都不存在的氨基酸。
2.2 GGPS核酸序列ORF分析
通過(guò)ORF Finder在線(xiàn)軟件分析9種植物GGPS核酸序列的開(kāi)放閱讀框(見(jiàn)表2)。
表2 不同植物GGPS核酸序列ORF分析
在線(xiàn)分析軟件ORF Finder提供了六組參考數(shù)據(jù),包含了不同閱讀順序可能出現(xiàn)的情況。由于GGPS氨基酸序列長(zhǎng)度已經(jīng)知道,所以每一個(gè)ORF基本都對(duì)應(yīng)著相應(yīng)編碼蛋白質(zhì)的大小,結(jié)果顯示除了丹參以外其余植物GGPS的開(kāi)放閱讀框大小均在1 100 bp左右,而丹參可能由于蛋白編輯剪切不同,所以稍有差異。從這些也可以看出,GGPS序列存在一定的保守性。
2.3 蛋白質(zhì)信號(hào)肽的預(yù)測(cè)分析
使用SignalP 4.1 Server在線(xiàn)工具以銀杏為研究對(duì)象對(duì)所選GGPS未知氨基酸序列中包含的信號(hào)肽進(jìn)行分析(見(jiàn)圖1)。
圖1 銀杏GGPS的信號(hào)肽分析結(jié)果Fig. 1 Signal peptide analysis result of Ginkgo GGPS
結(jié)果表明,銀杏的GGPS蛋白序列都不存在信號(hào)肽。且由圖可以看出,S值和Y值均比較低,因此可以推測(cè)以上植物的GGPS蛋白通過(guò)核糖體合成之后,生成的蛋白質(zhì)屬于非分泌蛋白。通過(guò)對(duì)另外8種植物分析可得到相近的結(jié)果。
2.4 糖基化和磷酸化位點(diǎn)分析
使用NetNGlyc 1.0以萬(wàn)壽菊為例對(duì)所選GGPS序列的糖基化位點(diǎn)進(jìn)行分析(見(jiàn)圖2)。
如圖所示,紅色橫線(xiàn)(Threshold)表示閾值,閾值設(shè)定為0.5,大于閾值的藍(lán)色豎線(xiàn)(Potential)表示此點(diǎn)有被糖基化的可能。萬(wàn)壽菊GGPS氨基酸序列糖基化分析結(jié)果顯示,在5和24位點(diǎn)的天冬酰胺處存在藍(lán)色豎線(xiàn),值分別為0.782 8和0.715 6,因此這兩處可能被糖基化。對(duì)其他植物GGPS氨基酸序列的糖基化預(yù)測(cè)分析得出,除銀杏、茉莉和紅豆杉沒(méi)有糖基化位點(diǎn)外,其余植物GGPS蛋白均存在不同程度的糖基化。
使用NetPhos 2.0在線(xiàn)工具以銀杏為研究對(duì)象分別預(yù)測(cè)了絲氨酸、蘇氨酸、酪氨酸3種不同的磷酸化位點(diǎn)(見(jiàn)圖3)。
圖2 萬(wàn)壽菊GGPS氨基酸序列的糖基化分析Fig. 2 Glycosylation prediction of ginkgo GGPS amino acid sequence
圖3 銀杏GGPS氨基酸序列的磷酸化位點(diǎn)預(yù)測(cè)*Fig. 3 Phosphorylation site prediction of ginkgo GGPS amino acid sequence
注:*彩圖見(jiàn)電子版(http://swxxx.alljournals.cn/ch/index.aspx)(2016年第3期doi:10.3969/j.issn.1672-5565.2016.03.01)。
結(jié)果表明,總共有24個(gè)位點(diǎn)被磷酸化,其中有13個(gè)絲氨酸磷酸化位點(diǎn)(分別是第24、33、66、84、109、222、224、229、258、295、326、339和369位)、9個(gè)蘇氨酸磷酸化位點(diǎn)(分別是第44、88、120、144、203、223、262、302和325位)以及2個(gè)酪氨酸磷酸化位點(diǎn)(分別是第53和370位),在以上24個(gè)磷酸化位點(diǎn)中S369、S258、S295預(yù)測(cè)分值最高,均在0.990以上。通過(guò)對(duì)另外8種植物GGPS氨基酸序列的分析,可以得到同樣的結(jié)果。
2.5 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)分析
以銀杏為研究對(duì)象,使用SOPMA在線(xiàn)工具分析GGPS氨基酸序列的二級(jí)結(jié)構(gòu)(見(jiàn)圖4)。
圖4 銀杏GGPS氨基酸序列的二級(jí)結(jié)構(gòu)預(yù)測(cè)* Fig. 4 Secondary structure prediction of ginkgo GGPS amino acid sequence
注:*彩圖見(jiàn)電子版(http://swxxx.alljournals.cn/ch/index.aspx)(2016年第3期doi:10.3969/j.issn.1672-5565.2016.03.01)。
由圖可知,在銀杏多肽鏈中二級(jí)結(jié)構(gòu)中α-螺旋(藍(lán)色線(xiàn)*)在鏈中出現(xiàn)的概率是51.92%、無(wú)規(guī)卷曲(紫色線(xiàn)*)在鏈中出現(xiàn)的概率是26.09%、延伸鏈(紅色線(xiàn)*)在鏈中出現(xiàn)的概率是12.02%、β-轉(zhuǎn)角(綠色線(xiàn)*)在鏈中出現(xiàn)的概率是9.97%,可以看出銀杏GGPS二級(jí)結(jié)構(gòu)中沒(méi)有β-折疊結(jié)構(gòu)??梢?jiàn)α-螺旋是GGPS多肽鏈中大量存在的結(jié)構(gòu)元件而散布于整個(gè)肽鏈中。另外8種植物的GGPS二級(jí)結(jié)構(gòu)中也有類(lèi)似的情況。
2.6 保守結(jié)構(gòu)域的預(yù)測(cè)和分析
使用NCBI中的CDD工具以銀杏為例進(jìn)行蛋白質(zhì)結(jié)構(gòu)域的預(yù)測(cè)分析(見(jiàn)圖5)。
圖5 銀杏GGPS保守結(jié)構(gòu)域分析Fig. 5 conserved domains analysis of Ginkgo GGPS
由NCBI中CDD工具中的詳細(xì)解釋可以得出,銀杏GGPS氨基酸序列有一個(gè)異戊二烯合酶C1超家族,總共有六個(gè)不同的保守結(jié)構(gòu)域,分別是底物結(jié)合保守結(jié)構(gòu)域,結(jié)合Mg2+的結(jié)構(gòu)域,活性位點(diǎn)殘基結(jié)合結(jié)構(gòu)域,決定鏈長(zhǎng)度的保守結(jié)構(gòu)域,催化殘基的保守結(jié)構(gòu)域和富含天冬氨酸的保守結(jié)構(gòu)域。
2.7 蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)分析
使用Swiss-Model對(duì)九個(gè)科植物GGPS氨基酸序列的三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)分析(見(jiàn)圖6)。
圖6 不同植物GGPS氨基酸序列的三級(jí)結(jié)構(gòu)預(yù)測(cè)Fig. 6 Tertiary structure prediction of GGPS in different plants
通過(guò)上面九個(gè)三級(jí)結(jié)構(gòu)圖可以看出,這些植物GGPS蛋白的三級(jí)結(jié)構(gòu)極為相似,這同它們核苷酸序列與氨基酸序列的相似性有很大關(guān)系,相似的空間結(jié)構(gòu)往往具有相似的功能,同時(shí)也可以看出GGPS在進(jìn)化過(guò)程中是相對(duì)保守的。
2.8 核苷酸多序列比對(duì)
從前面對(duì)九個(gè)不同科植物GGPS序列的分析可以看出,它們的序列相似性相對(duì)較高,理化性質(zhì)差異也不是很大,因此將進(jìn)一步從序列上分析它們的同源性,為這些植物構(gòu)建進(jìn)化樹(shù),從而較直觀的反映出它們之間的親緣關(guān)系。使用Clustal X軟件對(duì)九個(gè)不同科植物進(jìn)行多序列比對(duì)(見(jiàn)圖7)。
通過(guò)Clustal軟件對(duì)九個(gè)科植物GGPS氨基酸序列進(jìn)行比對(duì)的結(jié)果,可以明顯的看到這些序列在很大程度上都是相似的,只有少部分存在差異,因此可以得知GGPS在進(jìn)化過(guò)程中是相對(duì)保守的。
圖7 不同植物GGPS的氨基酸多序列對(duì)比分析*Fig. 7 Multiple sequence alignment of GGPS in different plants
注:*彩圖見(jiàn)電子版(http://swxxx.alljournals.cn/ch/index.aspx)(2016年第3期doi:10.3969/j.issn.1672-5565.2016.03.01)。
2.9 GGPS進(jìn)化樹(shù)的構(gòu)建
對(duì)九種植物的GGPS氨基酸序列和一些相同科的植物如甜菊、蓖麻、麻瘋樹(shù)、橡膠樹(shù)使用MEGA4.0軟件進(jìn)行分子系統(tǒng)演化分析,獲得GGPS核苷酸序列的分子進(jìn)化樹(shù),更進(jìn)一步地分析它們的親緣進(jìn)化關(guān)系(見(jiàn)圖8)。從圖中可看出13種植物GGPS氨基酸序列明顯被分為三大類(lèi),萬(wàn)壽菊和甜菊同屬于菊科因此親緣關(guān)系最近,蓖麻和麻瘋樹(shù)同是大戟科,親緣關(guān)系也很近,由于有九個(gè)不同的科所以進(jìn)化樹(shù)的小分支較多,而氨基酸序列和基因序列進(jìn)化樹(shù)在大體結(jié)構(gòu)上是相似的,但其分類(lèi)也有稍微差異,可能是由于在進(jìn)化過(guò)程中某些核苷酸的變異導(dǎo)致其氨基酸發(fā)生變化,但結(jié)合其序列比對(duì)結(jié)果發(fā)現(xiàn),總體上GGPS序列還是較為保守的。因此GPSS是牻牛兒基牻牛兒基焦磷酸生物合成途徑中一個(gè)相對(duì)保守的基因,可作為生物遺傳分化和分子進(jìn)化研究中的重要依據(jù)。
圖8 不同植物GGPS的氨基酸序列分子進(jìn)化分析Fig. 8 Phylogenetic tree analysis of GGPS in different plants
本研究使用生物信息學(xué)的方法對(duì)來(lái)源不同植物GGPS的氨基酸序列進(jìn)行了系統(tǒng)分析。試驗(yàn)結(jié)果表明,植物GPSS屬于大分子蛋白;氨基酸序列理化性質(zhì)分析顯示植物GGPS 富含Ala和Leu;通過(guò)植物GGPS氨基酸序列進(jìn)行比對(duì)的得知GGPS在進(jìn)化過(guò)程中是相對(duì)保守的;將13種植物的GGPS進(jìn)行分子進(jìn)化分析,結(jié)果表明萬(wàn)壽菊和甜菊同屬于菊科因此親緣關(guān)系最近,蓖麻和麻瘋樹(shù)同是大戟科,親緣關(guān)系也很近,由于有九個(gè)不同的科所以進(jìn)化樹(shù)的小分支較多,而氨基酸序列和基因序列進(jìn)化樹(shù)在大體結(jié)構(gòu)上是相似的,但其分類(lèi)也有稍微差異,可能是由于在進(jìn)化過(guò)程中某些核苷酸的變異導(dǎo)致其氨基酸發(fā)生變化,但結(jié)合其序列比對(duì)結(jié)果發(fā)現(xiàn),總體上GGPS序列還是較為保守的,因此可作為生物遺傳分化和分子進(jìn)化研究中的重要依據(jù);二級(jí)結(jié)構(gòu)分析推測(cè) α-螺旋是多肽鏈中的主要結(jié)構(gòu)元件。該研究結(jié)果可為深入開(kāi)展 GGPS 酶學(xué)特性的分子機(jī)理研究提供重要理論依據(jù)。
References)
[1]CAZZONELLI C I,POGSON B J. Source to sink: regulation of carotenoid biosynthesis in plants[J]. Trends Plant Science,2010,15(5):266-274.
[2]KUNTZ M,ROMER S,SUIRE C. Identification of a cDNA for the plastid-located geranylgeranyl pyrophosphate synthase from Capsicum annuum: correlative increase in enzyme activity and transcript level during fruit ripening[J]. The Plant Journal,1992,2(1):25-34.
[3]鐘秋月,國(guó)艷梅,梁燕,等.兩個(gè)不同來(lái)源的番茄GGPS基因克隆和序列分析[J].華北農(nóng)學(xué)報(bào),2009,24(3):15-22.
ZHONG Qiuyue,GUO Yanmei,LIANG Yan,et al. Cloning and sequence analysis of GGPS gene in two sources of tomato[J]. Acta Agriculturae Boreali-Sinica,2009, 24(3):15-22.
[4]張蕾,戴住波,崔光紅,等.丹參牻牛兒基牻牛兒基焦磷酸合酶基因的克隆與分析[J].中國(guó)中藥雜志,2009,34(21):2704-2708.
ZHANG Lei,DAI Zhubo,CUI Guanghong,et al. Cloning and characterization of geranylgeranyl diphosphate synthase gene of Salvia miltiorrrhia[J]. China Journal of Chinese Materia Medica,2009,34(21):2704-2708.
[5]李鋒,李明,金立鋒,等.煙草牻牛兒基牻牛兒基焦磷酸合成酶基因的克隆及分析[J].煙草科技,2012(5):60-64.
LI Feng,LI Ming,JIN Lifeng,et al. Cloning and characterization of a new gene encoding geranylgeranyl pyrophosphate synthase from Nicotiana tabacum[J]. Tobacoo Agronomy,2012(5):60-64.
[6]張洪娟,譚碧月,曹福亮.銀杏GbGGPS基因的克隆及序列分析[J].南京林業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2013,37(4):9-12.
ZHANG Hongjuan,TAN Biyue,CAO Fuliang. Cloning and characterization of the geranylgeranyl pyrophosphate synthase gene from Ginkgo biloba Linn[J]. Journal of Nanjing Forestry University :Natural Sciences Edition,2013, 37(4):9-12.
[7]ZHAO W E,LV P,GU H H.Studies on carotenoids in watermelon flesh[J].Agricultural Science,2013,4(7A):13-20.
[8]UKIBE K,HASHIDA K,YOSHIDA N,et al. Metabolic engineering of Saccharomyces cerevisiae for astaxanthin production and oxidative stress tolerance[J]. Applied Environmental Microbiology,2009,75(22):7205-7211.
[9]BREITENBACH J,VISSER H,VERDOES J C,et al. Engineering of geranylgeranyl pyrophosphate synthase levels and physiological conditions for enhanced carotenoid and astaxanthin synthesis in Xanthophyllomyces dendrorhous[J]. Biotechnology Letters,2011,33(4):755-761.
[10]CSERNETICS A,NAGY G,ITURRIAGA E A,et al. Expression of three isoprenoid biosynthesis genes and their effects on the carotenoid production of the zygomycete Mucor circinelloides[J]. Fungal Genetics and Biology,2011,48(7):696-703.
[11]KUNTZ M, ROMER S, SUIRE C, et al. Identification of a cDNA for the plastidlocated geranylgeranyl pyrophosphate synthase from Cap sicumannum: Correlative increase in enzyme activity and trGGPScript level during fruit ripening[J]. The Plant Journal, 2002 , 2(1)∶25-34.
[12]LASKARIS G, BOUNKHAY M, THEODORIDIS G, et al. Induction of ger Anylgeranyl diphosphate synthase activity and taxane accumulation inTaxus baccatacell cultures afterelicitation bymethyl jasmonate [J].Plant Science, 1999, 147(1):1-8.
[13]LUCKER J,BOUWMEESTER H J,SCHWAB W,et al. Expression of Clarkia S-linalool synthase in trGGPSgenic petunia plants results in the accumulation of Dglucopyranoside[J].The Plant Journal,2001,27(4):315-324.
[14]CHIZZOLA R. Regular monoterpenes and sesquiterpenes (Essential oils)[J]. In Natural Products, 2013, 2973-3008.DOI: 10.1007/978-3-642-22144-6_130.
Bioinformatics analysis of geranylgeranyl pyrophosphate synthase in plants
ZHANG Pengfei,WANG Ning,ZHOU Man,LI Ping*
(SchoolofLifeScienceandEngineering,SouthwestJiaotongUniversity,Chengdu610031,China)
GGPS is an important branch point enzyme for terpenoids systhesis, but also it’s catalyting enzyme of GGPS.This study select 9 different families of plants, implement a series of detailed analyses to the physicochemical properties of GGPS nucleotide and amino acid sequence,protein structure and function and phylogenetic and so on. The results indicate that full length of DNA sequence from 9 species is in the range from 1 000 bp to 2 000 bp. All the GGPS amino acid sequence dont contain signal peptide and trmenbrance structure; α-helix and random coil are the primary structure of GGPS secondary structure and don’t have any β-sheet structure, extension chain and β-corner are scattered throughout the protein.Reasonably prediction based on bioinformatics methods provide important theoretical basis for further research GGPS enzymatic properties.
Bioinformatics; GGPS; Molecular evolution
2016-03-07;
2016-05-07.
張鵬飛,男,碩士研究生,研究方向:生物化學(xué)與分子生物學(xué);E-mail:1913405585@qq.com.
*通信作者:李萍,女,教授,博士,研究方向:生物化學(xué)與分子生物學(xué);E-mail:wuping4535@sina.com.
10.3969/j.issn.1672-5565.2016.03.01
Q55
A
1672-5565(2016)03-127-07