付蘇宏,雷 鳴,張勇群,施 靜,郝豆豆
(西藏自治區(qū)人民政府駐成都辦事處醫(yī)院 分子醫(yī)學(xué)實(shí)驗(yàn)室,四川 成都 610041)
菊葉香藜(Dysphaniaschraderiana)為藜科1年生草本植物,具有強(qiáng)烈的刺激性氣味,廣泛生存于青藏高原草甸,此外也生長(zhǎng)于海拔2 700~4 500 m的山坡、村邊、河灘等[1]。菊葉香藜生長(zhǎng)于輻射強(qiáng)、溫差大的高原環(huán)境中,具有較好的極端環(huán)境耐受力,可用于改善生態(tài)環(huán)境[2]。此外,菊葉香藜具有廣泛的藥理活性,《藏藥志》記載菊葉香藜具有抗腫瘤活性[3],全草入藥可清熱解毒,用于治療感冒、頭疼、皮膚瘙癢等[4]。菊葉香藜因含有揮發(fā)油而具有強(qiáng)烈的氣味,因此對(duì)其精油的研究也日益增多。石夢(mèng)菲[5]研究發(fā)現(xiàn),菊葉香藜精油可抑制大腸桿菌和枯草芽孢桿菌的生長(zhǎng);雷鳴等[6]發(fā)現(xiàn),菊葉香藜精油可顯著抑制玉米象活力;劉志龍等[7]研究發(fā)現(xiàn),菊葉香藜精油在防治螨蟲(chóng)方面具有顯著效果,現(xiàn)已申請(qǐng)專(zhuān)利。石夢(mèng)菲等[5]利用氣相色譜-質(zhì)譜聯(lián)用(GC-MS)對(duì)菊葉香藜精油成分進(jìn)行分析,結(jié)果發(fā)現(xiàn),菊葉香藜精油的主要成分為脂肪族化合物(54.232%)、萜類(lèi)化合物及其含氧衍生物(31.945%),其中單萜類(lèi)化合物和倍半萜類(lèi)化合物含量較高,主要萜類(lèi)化合物有α-杜松醇(α-Cadinol,13.966%)、四甲基環(huán)癸二烯甲醇(Hedycaryol,11.164%)和δ-杜松烯(δ-Cadinene,7.292%),均為倍半萜類(lèi)化合物。
高等植物萜類(lèi)化合物的前體物質(zhì)異戊烯基焦磷酸(IPP)可通過(guò)發(fā)生在細(xì)胞質(zhì)中的甲羥戊酸(MVA)途徑和發(fā)生在質(zhì)體中的2-C-甲基-D-赤蘚糖醇-4-磷酸(MEP)途徑合成,IPP及其異構(gòu)體二甲基烯丙基焦磷酸(DMAPP)經(jīng)過(guò)下游多種酶的催化發(fā)生結(jié)合、縮合、修飾等方式生成結(jié)構(gòu)多樣的萜類(lèi)化合物[8-9]。3-羥基-3-甲基戊二酰輔酶A還原酶(3-Hydroxy-3-methyl glutaryl coenzyme A reductase,HMGR)是MVA途徑中的第一個(gè)限速酶,目前,小麥[10]、甘草[11]、擬南芥[12]、杜仲[13]、蘋(píng)果[14]、人參[15]等多個(gè)植物的HMGR基因已經(jīng)被克隆。本研究針對(duì)菊葉香藜萜類(lèi)化合物合成中的關(guān)鍵酶HMGR進(jìn)行深入剖析,利用生物信息學(xué)的方法對(duì)菊葉香藜HMGR基因編碼蛋白質(zhì)的理化性質(zhì)、親疏水性、二級(jí)結(jié)構(gòu)、信號(hào)肽、跨膜結(jié)構(gòu)、亞細(xì)胞定位、功能結(jié)構(gòu)域、三級(jí)空間結(jié)構(gòu)、系統(tǒng)進(jìn)化等多個(gè)方面進(jìn)行預(yù)測(cè)與分析,旨在為菊葉香藜精油生物合成的分子機(jī)制研究提供理論依據(jù)。
菊葉香藜HMGR基因序列來(lái)源于菊葉香藜轉(zhuǎn)錄組數(shù)據(jù)庫(kù)中經(jīng)過(guò)比對(duì)和功能注釋得到的候選基因序列(本實(shí)驗(yàn)室前期研究),命名為DsHMGR,已上傳至GenBank數(shù)據(jù)庫(kù)(序列號(hào):MG582592);試驗(yàn)中所涉及到的其他氨基酸序列均來(lái)源于NCBI(National center for biotechnology information)中已登錄的數(shù)據(jù)序列,相關(guān)信息如表1所示。
表1 物種信息匯總
運(yùn)用GenBank的在線軟件ORF Finder和本地軟件Jellyfish 2.0查找開(kāi)放閱讀框(ORF);利用在線軟件ProtParam分析蛋白質(zhì)的理化性質(zhì);運(yùn)用在線分析軟件ProtScale分析蛋白質(zhì)親/疏水性;運(yùn)用在線SOPMA軟件分析和預(yù)測(cè)蛋白質(zhì)氨基酸序列二級(jí)結(jié)構(gòu);運(yùn)用在線工具SignalP 4.1分析蛋白質(zhì)信號(hào)肽;利用在線程序TMHMM進(jìn)行蛋白質(zhì)跨膜結(jié)構(gòu)域的預(yù)測(cè);運(yùn)用在線軟件Cell-PLoc 2.0分析蛋白質(zhì)亞細(xì)胞定位;采用在線工具CDD(Conserved domain datebase)預(yù)測(cè)蛋白質(zhì)的保守結(jié)構(gòu)域;蛋白質(zhì)三維結(jié)構(gòu)以人類(lèi)HMGR蛋白(PDB ID:3CD0)為模板,利用Phyre2進(jìn)行三維結(jié)構(gòu)同源建模;利用本地軟件Clustalx進(jìn)行多條氨基酸序列比對(duì);利用本地軟件MEGA 5.0構(gòu)建Neighbor-joining系統(tǒng)進(jìn)化樹(shù),相關(guān)在線生物信息學(xué)分析軟件如表2所示[16]。
表2 生物信息學(xué)在線分析軟件匯總
DsHMGR基因序列全長(zhǎng)1 986 bp,GC含量為0.504,ORF Finder預(yù)測(cè)結(jié)果表明,DsHMGR包含一段157 bp的5′端非翻譯區(qū)、一段104 bp的3′端非翻譯區(qū)以及一段1 725 bp的開(kāi)放閱讀框,開(kāi)放閱讀框?yàn)?58—1882位,編碼574個(gè)氨基酸(圖1),與已報(bào)道的植物HMGR基因堿基數(shù)和編碼氨基酸殘基數(shù)基本一致。
圖1 菊葉香藜DsHMGR基因及所編碼蛋白質(zhì)序列
利用在線軟件ProtParam對(duì)DsHMGR蛋白和3種已公布的藜科植物HMGR蛋白進(jìn)行分析,并比較它們的理化性質(zhì)和氨基酸組成(表3)。4種HMGR蛋白的氨基酸長(zhǎng)度為574~581 aa,分子質(zhì)量61.68~62.51 ku,等電點(diǎn)(pI值)6.30~7.89,不穩(wěn)定系數(shù)均大于40,為不穩(wěn)定蛋白質(zhì),各類(lèi)氨基酸的組成基本一致,無(wú)明顯差別,非極性氨基酸為主要氨基酸,比例為44.6%~45.9%。其中DsHMGR分子質(zhì)量61.77 ku,pI值為7.46,不穩(wěn)定系數(shù)為49.25,大于40,為不穩(wěn)定蛋白質(zhì)。此外,DsHMGR蛋白中非極性氨基酸所占比例最大,其比例達(dá)到了45.8%;極性中性氨基酸的比例也較高,為32.4%;酸性氨基酸與堿性氨基酸的比例相當(dāng),分別為10.3%和11.5%。DsHMGR蛋白中含量最多的氨基酸依次為亮氨酸(Leu,9.9%)、絲氨酸(Ser,9.6%)、丙氨酸(Ala,9.1%)和纈氨酸(Val,8.5%),含量最低的為色氨酸(Trp,0.3%)。
表3 藜科植物HMGR蛋白的理化性質(zhì)及氨基酸組成
蛋白質(zhì)的疏水氨基酸殘基由于水的作用會(huì)相互靠近,形成一個(gè)疏水內(nèi)核和親水表面。蛋白質(zhì)的疏水作用是蛋白質(zhì)折疊的主要驅(qū)動(dòng)力,發(fā)揮著維持蛋白質(zhì)構(gòu)象的重要作用。利用在線軟件ProtScale對(duì)DsHMGR蛋白進(jìn)行親/疏水性預(yù)測(cè)。正值表示疏水,其絕對(duì)值越大表示越疏水;負(fù)值表示親水,其絕對(duì)值越大表示越親水;介于-0.5~+0.5主要表示為兩性氨基酸。DsHMGR蛋白預(yù)測(cè)結(jié)果如圖2所示,在N端具有2個(gè)明顯的疏水峰,分別位于40—58位和73—103位區(qū)域,提示在這2個(gè)位置可能有跨膜結(jié)構(gòu)。在DsHMGR蛋白多肽鏈的第51位處有最高分值 3.122,其疏水性水性較強(qiáng);第6位有最小分值-2.844,其親水性較強(qiáng)。
圖2 DsHMGR蛋白的親/疏水性分析
信號(hào)肽是一段含有15~30個(gè)氨基酸殘基的短肽,位于分泌蛋白的N端,主要包括3個(gè)區(qū)域:帶正電的N末端區(qū)域、疏水的主要功能區(qū)域以及較長(zhǎng)的帶負(fù)電的C末端區(qū)域。在分泌蛋白合成結(jié)束后,其N(xiāo)端的信號(hào)肽將被切除。利用在線軟件SignalP 4.1對(duì)DsHMGR蛋白的信號(hào)肽及其位置進(jìn)行分析,結(jié)果見(jiàn)圖3。典型的信號(hào)肽具有較高的S值,在剪切點(diǎn)位點(diǎn)處有最大的C值,Y值有最高峰。由圖3知,DsHMGR蛋白的S值較小,C值未出現(xiàn)一個(gè)明顯的最大值,Y值也未發(fā)現(xiàn)有最高峰,均不具有信號(hào)肽的特點(diǎn),由此可推斷DsHMGR蛋白不含有信號(hào)肽,為非分泌性蛋白。
圖3 DsHMGR蛋白的信號(hào)肽分析
在蛋白質(zhì)中,20個(gè)左右的氨基酸殘基所形成的α螺旋,與生物膜的脂質(zhì)雙分子層相互作用,將蛋白質(zhì)錨定在生物膜中,這樣的結(jié)構(gòu)即跨膜結(jié)構(gòu)域。利用在線軟件TMHMM分析DsHMGR蛋白的跨膜結(jié)構(gòu)域,如圖4示,在N端存在2個(gè)概率約為1的最大峰,即2個(gè)跨膜結(jié)構(gòu)域,分別位于氨基酸序列的37—59位和80—102位區(qū)域。同時(shí)運(yùn)用在線軟件Cell-PLoc 2.0對(duì)DsHMGR蛋白進(jìn)行蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè),結(jié)果發(fā)現(xiàn),DsHMGR蛋白定位到內(nèi)質(zhì)網(wǎng)上。此外,在DsHMGR蛋白的氨基酸序列的C端發(fā)現(xiàn)有內(nèi)質(zhì)網(wǎng)膜蛋白的定位信號(hào)序列KKVL基序(412—415位),進(jìn)一步確證DsHMGR蛋白是定位到內(nèi)質(zhì)網(wǎng)上的。因此推斷菊葉香藜的DsHMGR蛋白是內(nèi)質(zhì)網(wǎng)膜上的跨膜蛋白,通過(guò)N端的2個(gè)跨膜結(jié)構(gòu)將HMGR錨定到內(nèi)質(zhì)網(wǎng)上,C端則延伸至細(xì)胞質(zhì)中。
圖4 DsHMGR蛋白的跨膜結(jié)構(gòu)分析
蛋白質(zhì)的二級(jí)結(jié)構(gòu)是由肽鏈主鏈骨架原子所構(gòu)成的局部空間結(jié)構(gòu),不涉及氨基酸殘基側(cè)鏈的構(gòu)象。蛋白質(zhì)的二級(jí)結(jié)構(gòu)主要包括α-螺旋、β-折疊、β-轉(zhuǎn)角和無(wú)規(guī)則卷曲,空間上相鄰的二級(jí)結(jié)構(gòu)可協(xié)同完成特定的功能。利用SOPMA在線軟件對(duì)DsHMGR蛋白進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè),結(jié)果如圖5所示,在DsHMGR蛋白的整個(gè)肽鏈中均分布有α-螺旋,是DsHMGR蛋白主要的二級(jí)結(jié)構(gòu),散布于整個(gè)肽鏈中,所占比例41.64%;其次為無(wú)規(guī)則卷曲,所占比例35.89%;延伸鏈和β-轉(zhuǎn)角分別為15.85%和6.62%。
h代表α-螺旋; e代表延伸鏈; t代表β-轉(zhuǎn)角; c代表無(wú)規(guī)則卷曲圖5 DsHMGR蛋白的二級(jí)結(jié)構(gòu)分析
利用NCBI的CDD查找DsHMGR蛋白的保守結(jié)構(gòu)域,結(jié)果顯示,DsHMGR蛋白歸屬于HMGR家族,存在HMGR蛋白特征保守活性位點(diǎn):具有催化功能的4個(gè)氨基酸殘基Glu(253)、Lys(385)、Asp(461)、His(559);2個(gè)HMG-CoA結(jié)合位點(diǎn)EMPVGFIQIP(221—231位)和TTEGCLVA(251—258位);2個(gè)NAD(P)H結(jié)合位點(diǎn)DAMGMNM(347—353位)和GTVGGGT(496—502位)。在DsHMGR蛋白與其他物種HMGR蛋白的氨基酸序列比對(duì)(圖6)中,DsHMGR蛋白與其他植物HMGR蛋白在C端和中間區(qū)域氨基酸序列保守性較高,HMG-CoA結(jié)合位點(diǎn)和NAD(P)H結(jié)合位點(diǎn)作為植物HMGR重要的功能結(jié)構(gòu)域保守性也較高;而在HMGR蛋白的N端,除跨膜區(qū)域的保守性相對(duì)較高,其余區(qū)域的氨基酸序列則在數(shù)量和種類(lèi)上均存在較大差異,預(yù)示著DsHMGR蛋白與其他物種HMGR蛋白具有相同的催化功能,但細(xì)胞定位與調(diào)控可能不同。
蛋白質(zhì)的空間結(jié)構(gòu)決定蛋白質(zhì)功能,因此對(duì)其進(jìn)行深入研究具有重要指導(dǎo)意義。利用線串法,將DsHMGR基因所編碼的氨基酸序列提交在線三級(jí)結(jié)構(gòu)預(yù)測(cè)軟件Phyre2,結(jié)果顯示,DsHMGR蛋白與人類(lèi)HMGR蛋白(PDB ID:3CD0)具有56%的序列相似性,以該人類(lèi)HMGR蛋白為模板,通過(guò)同源建模構(gòu)建DsHMGR蛋白的三級(jí)結(jié)構(gòu),其結(jié)果如圖7所示。與大多數(shù)植物的HMGR蛋白三級(jí)結(jié)構(gòu)類(lèi)似,DsHMGR蛋白具有3個(gè)功能結(jié)構(gòu)域:N-結(jié)構(gòu)域、L-結(jié)構(gòu)域和S-結(jié)構(gòu)域,跨膜區(qū)位于N-結(jié)構(gòu)域內(nèi),HMG-CoA結(jié)合位點(diǎn)位于L-結(jié)構(gòu)域內(nèi),NAD(P)H結(jié)合位點(diǎn)位于S-結(jié)構(gòu)域內(nèi)。HMG-CoA、NAD(P)H與DsHMGR蛋白結(jié)合后,Glu(253)、Lys(385)、Asp(461)、His(559)4個(gè)氨基酸殘基發(fā)揮催化功能,首先由NAD(P)H和質(zhì)子化的Lys(385)提供兩分子H生成3-羥基-3-甲基-5-羧基戊醛輔酶A基單硫縮醛(Mevaldyl-CoA)和NAD(P)+,然后Mevaldyl-CoA脫去一分子HSCoA生成3-羥基-3-甲基-5-醛基戊酸(Mevaldehyde),最后NAD(P)H和質(zhì)子化的His(559)為Mevaldehyde提供兩分子H生成甲羥戊酸(Mevalonate)和NAD(P)+(圖8)。
圖6 HMGR蛋白多序列比對(duì)分析
選取14條來(lái)自GenBank數(shù)據(jù)庫(kù)的HMGR蛋白序列,其物種信息詳見(jiàn)表1,利用本地軟件MEGA 5.0對(duì)DsHMGR蛋白和這14條HMGR蛋白的氨基酸序列進(jìn)行系統(tǒng)進(jìn)化分析,采用Neighbor-joining法構(gòu)建HMGR分子系統(tǒng)進(jìn)化樹(shù),進(jìn)行聚類(lèi)關(guān)系分析,其結(jié)果如圖9所示。整個(gè)進(jìn)化樹(shù)聚為兩大支,真菌靈芝單獨(dú)聚為一支,植物聚為一支。在植物分支中,單子葉植物和雙子葉植物又各自聚為一支,雙子葉植物中大戟科、五加科、葫蘆科、菊科、藜科各自聚為一支,具有明顯的種族特異性。菊葉香藜與藜科植物位于同一分支中,說(shuō)明菊葉香藜與藜科植物的親緣關(guān)系最近。
圖7 DsHMGR蛋白三級(jí)結(jié)構(gòu)模型預(yù)測(cè)
圖8 DsHMGR蛋白的催化機(jī)制
圖9 HMGR蛋白系統(tǒng)進(jìn)化樹(shù)
植物的次生代謝產(chǎn)物在其生命活動(dòng)和環(huán)境適應(yīng)等諸多方面發(fā)揮著重要作用,除此以外,在植物次生代謝產(chǎn)物中發(fā)現(xiàn)了多種具有藥用價(jià)值的化合物,如紫杉醇、青蒿素等。目前,探索植物次生代謝產(chǎn)物的生物合成機(jī)制以及挖掘、分析相關(guān)的酶基因已成為植物次生代謝產(chǎn)物研究的重要內(nèi)容[15]。菊葉香藜精油表現(xiàn)出顯著的抑菌活性和殺蟲(chóng)活性,其主要成分為萜類(lèi)化合物。目前對(duì)菊葉香藜的研究?jī)H限于其提取方法的優(yōu)化和藥理活性,其分子生物學(xué)方面的研究還很缺乏,從轉(zhuǎn)錄組數(shù)據(jù)庫(kù)中挖掘、發(fā)現(xiàn)藥用植物次生代謝產(chǎn)物生物合成關(guān)鍵酶基因是闡明次生代謝途徑及調(diào)控機(jī)制的重要途徑[17]。
MVA途徑是植物合成萜類(lèi)化合物前體的兩大途徑之一,該途徑的第1個(gè)關(guān)鍵限速酶是HMGR,植物單萜、倍半萜、二萜、三萜類(lèi)等活性成分的生物合成均需該酶的參與,通過(guò)調(diào)節(jié)該酶的表達(dá)可以決定各種萜類(lèi)終產(chǎn)物的產(chǎn)量和比例,因此HMGR可作為萜類(lèi)化合物代謝的重要調(diào)控位點(diǎn),近年來(lái),HMGR的結(jié)構(gòu)及催化機(jī)制備受關(guān)注[16]。由此本研究對(duì)菊葉香藜轉(zhuǎn)錄組數(shù)據(jù)庫(kù)進(jìn)行挖掘,研究結(jié)論如下:(1)獲得了1條HMGR基因全長(zhǎng)序列,編碼574個(gè)氨基酸,與已報(bào)道的植物HMGR氨基酸殘基數(shù)相差不大,非極性氨基酸為主要氨基酸,亮氨酸(Leu,9.9%)為含量最多的氨基酸。(2)對(duì)菊葉香藜DsH-MGR蛋白進(jìn)行理化性質(zhì)分析,結(jié)果表明,DsHMGR蛋白不含信號(hào)肽,為不穩(wěn)定蛋白質(zhì),在N端具有 2個(gè)疏水區(qū)域,含2個(gè)跨膜結(jié)構(gòu)域,亞細(xì)胞定位預(yù)測(cè)與內(nèi)質(zhì)網(wǎng)膜蛋白的定位信號(hào)均顯示DsHMGR蛋白定位到內(nèi)質(zhì)網(wǎng)上,與大多數(shù)植物一致[18-19]。(3)DsHMGR蛋白主要的二級(jí)結(jié)構(gòu)為α-螺旋,β-折疊、β-轉(zhuǎn)角和無(wú)規(guī)則卷曲穿插其中,在空間結(jié)構(gòu)上則折疊為“V”形,具有N、L和S 3個(gè)催化活性中心結(jié)構(gòu)域,具有4個(gè)催化氨基酸殘基(253Glu、385Lys、461Asp、559His),以及2個(gè)HMG-CoA結(jié)合位點(diǎn)(EMPVGFIQIP和TTEGCLVA)和2個(gè)NADP(H)結(jié)合位點(diǎn)(DAMGMNM和GTVGGGT),與其他植物具有相同的催化活性[20-22]。(4)DsHMGR蛋白與其他植物HMGR蛋白氨基酸序列比對(duì)也顯示,HMGR蛋白在C端和連接區(qū)具有較高保守性,在N端的序列保守性較低。(5)系統(tǒng)進(jìn)化分析結(jié)果顯示,菊葉香藜與藜科植物聚為一支,表明其親緣關(guān)系較近。菊葉香藜萜類(lèi)化合物合成關(guān)鍵酶HMGR的生物信息學(xué)分析,為今后研究菊葉香藜HMGR蛋白的功能、構(gòu)建表達(dá)載體、萜類(lèi)化合物的生物合成分子機(jī)制研究與開(kāi)發(fā)應(yīng)用奠定了良好的基礎(chǔ)。