黃瓊林 何瑞 詹若挺
摘 要 甲羥戊酸途徑(mevalonic acid, MVA)是植物三萜類化合物生物合成的主要途徑,而甲羥戊酸激酶(mevalonate kinase, MVK)是MVA途徑中的關(guān)鍵限速酶之一。根據(jù)前期獲得的青天葵[Nervilia fordii(Hance)Schltr.]轉(zhuǎn)錄組數(shù)據(jù),采用生物信息學(xué)方法對青天葵MVK基因編碼蛋白的理化特性、功能結(jié)構(gòu)域、二級結(jié)構(gòu)、信號肽、跨膜結(jié)構(gòu)域等進(jìn)行預(yù)測,并采用RPKM法分析該基因在青天葵球莖和葉片的表達(dá)量。結(jié)果表明,NfMVK基因編碼含有383個氨基酸的穩(wěn)定型親水性、酸性蛋白質(zhì),與其他植物MVK蛋白同源性可達(dá)70%。NfMVK蛋白分子量為41.29 ku,含有甲羥戊酸激酶功能域,歸屬于GHMP_Kinase超級家族。該蛋白沒有任何信號肽、轉(zhuǎn)運(yùn)肽和跨膜結(jié)構(gòu)域,二級結(jié)構(gòu)為混合型結(jié)構(gòu)的蛋白質(zhì)。NfMVK基因在青天葵中的表達(dá)趨勢為:球莖>葉片。該結(jié)果可為后續(xù)利用MVK基因調(diào)控青天葵三萜類活性成分的合成提供理論依據(jù)。
關(guān)鍵詞 青天葵;甲羥戊酸激酶;生物信息學(xué);表達(dá)量
中圖分類號 R932 文獻(xiàn)標(biāo)識碼 A
Abstract Mevalonic acid(MVA)pathway is the dominant approach to fulfill the triterpenoids synthesis in plants, and mevalonate kinase(MVK)is one of key rate-limiting enzymes in MVA pathway. In this paper, one MVK gene was identified from the transcriptome data of Nervilia fordii(Hance)Schltr. and named as NfMVK using bioinformatics. NfMVK encoded 383 amino acids and the coding protein was a stable hydrophilic and acid protein with a molecular weight at 41.29 ku. NfMVK protein, belonged to GHMP_Kinase superfamily, contained a mevalonate kinase functional domain and none signal peptide, and transmembrane region. Secondary structure prediction revealed NfMVK was a hybrid protein. The expression level of NfMVK gene in corm was higher than in leaf. The study would provide a firm foundation for regulating the synthesis of effective triterpenoids by utilization of MVK gene in N. fordii.
Key words Nervilia fordii(Hance)Schltr.; Mevalonate kinase; Bioinformatics; Expression
青天葵是嶺南地區(qū)名貴中藥,為蘭科植物毛唇芋蘭[Nervilia fordii(Hance) Schltr.]的干燥全草或葉片,具有清熱、潤肺、散瘀、解毒等顯著功效[1-2]。由于自身萌發(fā)的苛刻條件和人類的過度開采,青天葵資源已經(jīng)面臨瀕危。植物化學(xué)研究結(jié)果表明,三萜類化合物是青天葵發(fā)揮抗腫瘤、抗炎等功效的物質(zhì)基礎(chǔ)之一[3-6]。因此,在青天葵藥效成分比較清楚的前提下,利用現(xiàn)代植物生物工程提高三萜類化合物的含量,是提高青天葵藥效,緩解青天葵資源緊缺的新思路。
甲羥戊酸(mevalonic acid, MVA)途徑是三萜類成分生物合成的主要途徑[7],以乙酰輔酶A為原料,經(jīng)過MVA這一關(guān)鍵前體和一系列酶促反應(yīng),生成重要中間體異戊烯基焦磷酸酯(isopentenyl diphosphate,IPP)及其雙鍵異構(gòu)體二甲丙烯二磷酸(dimethyallyl diphosphate, DMAPP)。IPP先與DMAPP結(jié)合生成牻牛兒基焦磷酸(geranyl diphosphate, GPP),再與GPP以頭尾方式連接合成法尼基焦磷酸(farnesyl diphosphate, FPP),最后FPP以尾尾方式連接形成三萜類化合物[8]。甲羥戊酸激酶(mevalonate kinase, MVK)是MVA途徑酶促反應(yīng)中第一個ATP依賴酶,能將三磷腺苷上的磷酸基團(tuán)轉(zhuǎn)移到MVA的5位羥基上而產(chǎn)生甲羥戊酸-5-磷酸(mevalonate-5-phosphate, MVAP),這一過程還伴隨著ADP的釋放并最終生成IPP[9]。因此,MVK被認(rèn)為是萜類生物合成MVA途徑的關(guān)鍵限速酶之一。MVK基因參與MVA途徑合成多種萜類及其衍生物,對植物萜類成分積累、生長發(fā)育具有重要的調(diào)控作用,目前已從杜仲[10]、三七[11]等藥用植物的轉(zhuǎn)錄組數(shù)據(jù)中鑒定獲得。本研究在前期青天葵轉(zhuǎn)錄組測序結(jié)果的基礎(chǔ)上,對青天葵MVK基因進(jìn)行生物信息學(xué)和表達(dá)量分析,為探討MVK基因調(diào)控青天葵萜類成分的生物合成機(jī)制提供理論依據(jù)。
1 材料與方法
1.1 材料
前期研究[12]中,本課題組以生長旺盛期的成熟青天葵葉片和球莖為材料,利用Illumina RNA-seq高通量測序平臺進(jìn)行全轉(zhuǎn)錄組測序,通過序列組裝、比對和注釋共獲得142 220條unigene。本研究以“mevalonate kinase”為搜索主題詞,以E<10為標(biāo)準(zhǔn),在獲得注釋的青天葵轉(zhuǎn)錄組基因數(shù)據(jù)庫中檢索編碼青天葵甲羥戊酸激酶的Unigene序列。并在NCBI的Genbank數(shù)據(jù)庫下載海棗、丹參等10種植物MVK基因的編碼區(qū)序列。
1.2 方法
1.2.1 生物信息學(xué)分析 采用OMIGA軟件將MVK基因編碼區(qū)翻譯成氨基酸序列,利用在線軟件Protparam(http://web.expasy.org/protparam/)分析氨基酸序列,計(jì)算基因編碼蛋白的基本理化參數(shù),并運(yùn)用Protscale在線工具(http://web.expasy.org/protscale/)分析蛋白的親水性/疏水性特征;分別使用ClustalX1.86和MEGA 4.0軟件完成氨基酸序列的多重比對和系統(tǒng)進(jìn)化樹的構(gòu)建;采用NCBI的Conserved Domains Database(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)預(yù)測青天葵MVK蛋白具有的保守功能域;通過SOPMA在線工具(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl? page=npsa_sopma.html)分析青天葵MVK蛋白的二級結(jié)構(gòu)分析;分別采用TargetP1.1(http://www.cbs.dtu.dk/services/TargetP/)和TMHMM (http://www.cbs.dtu.dk/ services/ TMHMM-2.0/)完成青天葵MVK蛋白的轉(zhuǎn)運(yùn)肽、信號肽和跨膜結(jié)構(gòu)域的預(yù)測。
1.2.2 青天葵MVK基因的表達(dá)量分析 采用RPKM法(Reads Per Kb per Million reads)計(jì)算青天葵MVK基因在葉片和球莖的表達(dá)量,其計(jì)算公式為:
RPKM(MVK)=
設(shè)RPKM(MVK)為編碼青天葵MVK基因的Unigene表達(dá)量,則C為唯一比對到編碼青天葵MVK基因的Unigene讀數(shù),N為唯一比對到所有Unigene的總讀數(shù),L為編碼青天葵MVK基因的Unigene的堿基數(shù)。
2 結(jié)果與分析
2.1 青天葵MVK基因檢索結(jié)果
在青天葵轉(zhuǎn)錄組基因數(shù)據(jù)庫里檢索到注釋為MVK基因的Unigene 16258,其長度為1 158 bp,包含MVK基因編碼區(qū)全長。因此,選擇Unigene 16258序列用于本研究分析,并命名為NfMVK。
2.2 MVK蛋白的基本理化特征分析
由表1可知,海棗等10種植物的MVK蛋白均含有380多個氨基酸,分子量在40~42 ku之間,說明不同植物來源的MVK蛋白在氨基酸個數(shù)和分子量上并無明顯的差異;理論等電點(diǎn)均小于7,表明這些MVK蛋白均屬于酸性蛋白質(zhì);不同植物MVK蛋白多肽鏈整體均顯示為親水性蛋白;不同來源的MVK蛋白的不穩(wěn)定系數(shù)均小于40,屬于穩(wěn)定類蛋白質(zhì)。NfMVK編碼蛋白包含383個氨基酸,分子量為41.29 ku,也為穩(wěn)定類親水性、酸性蛋白質(zhì),可見其與其他MVK蛋白具有相似的理化特征。
2.3 MVK蛋白序列多重比對和進(jìn)化分析
利用ClustalX 1.83軟件對NfMVK基因編碼蛋白與其余10種MVK蛋白進(jìn)行多重序列比對,結(jié)果見圖1。NfMVK編碼蛋白與其他MVK蛋白序列存在著多處保守區(qū)域,其中與海棗MVK蛋白的相似度最高,為70%,與黃芪MVK蛋白相似較低,也可達(dá)63%,說明NfMVK編碼蛋白與其他MVK蛋白有著較好的同源性,初步認(rèn)為NfMVK為編碼青天葵MVK蛋白的基因。
從系統(tǒng)進(jìn)化樹(圖2)也可看出,NfMVK編碼蛋白與同為單子葉植物來源的海棗、小果野蕉MVK蛋白首先聚成一支,而雙子葉植物來源的MVK蛋白則聚焦成另外一個分支,這與傳統(tǒng)植物進(jìn)化結(jié)果相一致。
2.4 NfMVK編碼蛋白的保守功能域預(yù)測
分析蛋白質(zhì)序列中含有的功能域,能夠推測蛋白質(zhì)的功能。本研究采用CDD在線工具預(yù)測NfMVK編碼蛋白的保守功能域,結(jié)果顯示(圖3),NfMVK編碼蛋白包含GHMP_Kinase N端和C端功能域,分別位于130~211和293~365個氨基酸之間,說明其歸屬于包括高絲氨酸激酶、半乳糖激酶和甲羥戊酸激酶的GHMP_Kinase超級家族。除此之外,NfMVK編碼蛋白還含有位于7~344個氨基酸之間的Mevalonate Kinase多域功能區(qū),表明其具有甲羥戊酸激酶的功能,因此,NfMVK確定為青天葵甲羥戊酸激酶基因,其編碼蛋白即青天葵甲羥戊酸激酶。將NfMVK核苷酸序列提交至Genbank,獲得的登記號為KP280082。
2.5 青天葵MVK蛋白的信號肽、轉(zhuǎn)運(yùn)肽和跨膜結(jié)構(gòu)分析
信號肽、轉(zhuǎn)運(yùn)肽位于蛋白的N端,前者指導(dǎo)分泌性蛋白到內(nèi)質(zhì)膜上合成,后者引蛋白質(zhì)在細(xì)胞質(zhì)基質(zhì)游離核糖體上合成的前體蛋白轉(zhuǎn)運(yùn)至葉綠體基質(zhì)中發(fā)揮作用。信號肽和轉(zhuǎn)運(yùn)肽的分析有利于對蛋白質(zhì)的細(xì)胞定位等特性的掌握[13]。采用TargetP1.1在線工具分析結(jié)果顯示,NfMVK蛋白均不含有信號肽和轉(zhuǎn)運(yùn)肽。
跨膜結(jié)構(gòu)是膜內(nèi)蛋白和膜脂層相結(jié)合、在細(xì)胞膜上發(fā)揮“錨定”作用的主要部位,可見預(yù)測蛋白質(zhì)的跨膜結(jié)構(gòu)域有助于對蛋白質(zhì)的結(jié)構(gòu)和定位等信息的理解。利用TMHMM軟件預(yù)測NfMVK蛋白序列的跨膜結(jié)構(gòu)域,結(jié)果如圖4所示,NfMVK蛋白不含跨膜結(jié)構(gòu)域,整條多肽鏈均處于細(xì)胞膜外。因此,NfMVK是一種在細(xì)胞質(zhì)基質(zhì)中合成并直接發(fā)揮功能的蛋白質(zhì)。
2.6 青天葵MVK蛋白的二級結(jié)構(gòu)預(yù)測
如圖5所示,NfMVK蛋白二級結(jié)構(gòu)由α-螺旋、不規(guī)則盤繞、β-轉(zhuǎn)角和延伸鏈等元件組成,各元件所占比例分別為43.86%、34.20%、5.48%和16.45%。從蛋白的整體結(jié)構(gòu)來看,α-螺旋和不規(guī)則盤繞是NfMVK最大量的結(jié)構(gòu)元件,而延伸鏈和β-轉(zhuǎn)角則相對分散于整條多肽鏈中。因此,NfMVK為混合型結(jié)構(gòu)的蛋白質(zhì)。
2.7 NfMVK基因的表達(dá)量分析
在對轉(zhuǎn)錄組高通量測序數(shù)據(jù)的處理中,RPKM法對測序長度和基因長度均作了歸一化,使得不同長度的基因在不同測序深度下得到的基因表達(dá)水平估計(jì)值具有可比性,是目前最常用的基因表達(dá)量計(jì)算方法[14]。結(jié)果見圖6所示,NfMVK在球莖中的RPKM表達(dá)量均高于在葉片中的RPKM表達(dá)量,提示青天葵甲羥戊酸激酶基因的表達(dá)趨勢為:球莖>葉片。
3 討論與結(jié)論
轉(zhuǎn)錄組分析已被公認(rèn)為發(fā)現(xiàn)功能基因的有力手段。轉(zhuǎn)錄組以高通量模式挖掘功能基因,有助于整體、快速地解讀藥用植物的基因組信息,在分子水平為藥用植物的功能基因的發(fā)現(xiàn)、活性成分的生物合成及其調(diào)控機(jī)制的闡明提供重要的科學(xué)依據(jù)[15]。因此比起傳統(tǒng)的基因研究模式,經(jīng)過簡并引物PCR、RACE技術(shù)等繁瑣步驟獲取藥用植物的功能基因,本研究通過轉(zhuǎn)錄組分析挖掘青天葵MVK基因具有明顯的優(yōu)勢。
本研究應(yīng)用生物信息學(xué)方法鑒定并分析了青天葵MVK的核苷酸和氨基酸序列,推測其為編碼383個氨基酸,以α-螺旋和不規(guī)則盤繞為主要結(jié)構(gòu)元件的酸性、親水性穩(wěn)定蛋白質(zhì),并與單子葉植物來源的MVK蛋白有著較高的同源性。青天葵MVK歸屬GHMP激酶超級家族中,含有甲羥戊酸激酶等3個保守功能域,表明其具有甲羥戊酸激酶的功能,如激酶活性、參與萜類代謝以及ATP結(jié)合細(xì)胞質(zhì)定位等。TMHMM跨膜結(jié)構(gòu)預(yù)測發(fā)現(xiàn)青天葵MVK蛋白不含跨膜結(jié)構(gòu)域,說明其為細(xì)胞質(zhì)酶,定位于細(xì)胞質(zhì)中發(fā)揮催化作用。這些結(jié)論可為青天葵甲羥戊酸激酶的功能鑒定、表達(dá)載體構(gòu)建、融合蛋白純化、基因工程調(diào)控等實(shí)驗(yàn)研究提供理論指導(dǎo)。
甲羥戊酸途徑在藥用植物中可生成三萜皂苷合成所需的IPP等前體物質(zhì),因此MVK基因的表達(dá)情況可能會影響藥用植物中三萜類物質(zhì)的含量。研究表明,MVK基因主要分布在根等地下器官[11,16-17]。本研究也發(fā)現(xiàn),NfMVK在地下組織球莖中的表達(dá)高于地上組織葉片,與在其他植物中的表達(dá)趨勢相符合,推測青天葵三萜類成分主要在球莖中合成。
本研究利用生物信息學(xué)全面分析了NfMVK的分子功能,并初步明確其在青天葵中的表達(dá)趨勢,可為后續(xù)利用融合蛋白表達(dá)和植物侵染表達(dá)等研究驗(yàn)證其生物學(xué)功能,為進(jìn)一步應(yīng)用NfMVK調(diào)控青天葵萜類成分合成奠定基礎(chǔ)。
參考文獻(xiàn)
[1] 陳蔚文. 嶺南本草(二)[M]. 廣州: 廣東科技出版社, 2010: 326-351.
[2] 梅全喜. 青天葵的化學(xué)成分藥理作用與臨床應(yīng)用研究進(jìn)展[J]. 中華中醫(yī)藥學(xué)刊, 2008, 26(10): 2 239-2 241.
[3] 邱 莉, 徐靈源, 繆建華, 等. 青天葵植物化學(xué)成分和藥理活性研究進(jìn)展[J]. 時珍國醫(yī)國藥, 2011, 22(9): 2 258-2 260.
[4] 梁英嬌, 楚桐麗, 丁 平. 赤芝中三萜類成分及其藥理作用研究進(jìn)展[J]. 2007, 18(2): 168-172.
[5] 金銀萍, 焉 石, 劉俊霞, 等. 五味子科植物中環(huán)阿屯烷型三萜類成分及其藥理作用研究進(jìn)展[J]. 中草藥, 2014, 45(4): 582-589.
[6] 金銀萍, 焉 石, 劉俊霞, 等. 五味子科植物中羊毛脂烷型三萜類成分及其藥理作用研究進(jìn)展[J]. 中草藥, 2014, 45(1): 137-143.
[7] 楊 鶴, 郜玉鋼, 王璠瑛, 等. 人參皂苷等萜類化合物生物合成途徑及HMGR的研究進(jìn)展[J]. 中國生物工程雜志, 2008, 28(10): 130-135.
[8] Mahmoud S S, Croteau R B. Metabolic engineering of essential oil yield and composition in mint by altering expression of deoxyxylulose phosphate reductoisomerase and menthofuran synthase[J]. Proc Natl Acad Sci USA, 2001, 98: 8 915-8 920.
[9] Lange B M,Croteau R. sopentenyl diphosphate biosynthesis via a mevalonate-independent pathway: isopentenyl monophosphate kinase catalyzes the terminal enzymatic step[J]. Proc Natl Acad Sci USA, 1999, 96(24): 13 714-13 719.
[10] 烏云塔娜, 王 淋, 葉生晶. 杜仲甲羥戊酸激酶(EuMK)基因鑒定及生物信息學(xué)分析[J]. 經(jīng)濟(jì)林研究, 2014, 32(1): 6-12.
[11] 郭 溆, 羅紅梅, 陳士林. 三七甲羥戊酸激酶PnMVK1基因的克隆和生物信息學(xué)分析[J]. 藥學(xué)學(xué)報(bào), 2012, 47(8): 1 092-1 097.
[12] 黃瓊林. 青天葵轉(zhuǎn)錄組特征研究[D]. 廣州:廣州中醫(yī)藥大學(xué), 2013.
[13] 黃瓊林, 蔡 春. 不同植物黃酮醇合成酶FLS的生物信息學(xué)分析[J]. 廣東農(nóng)業(yè)科學(xué), 2014, 41(13): 140-143, 151.
[14] 王 曦, 汪小我, 王立坤, 等. 新一代高通量RNA測序數(shù)據(jù)的處理與分析[J]. 生物化學(xué)與生物物理進(jìn)展, 2010, 37(8): 834-836.
[15] 吳 瓊, 孫 超, 陳士林, 等. 轉(zhuǎn)錄組學(xué)在藥用植物研究中的應(yīng)用[J]. 世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化, 2010, 12(3): 457-462.
[16] Lluch M A, Masferrer A, Arró M, et al. Molecular cloning and expression analysis of the mevalonate kinase gene from Arabidopsis thaliana[J]. Plant Mol Biol, 2000, 42: 365-376.
[17] Tang Wei, New ton R J. Mevalonate kinase activity during different stages of plant regeneration from nodular callus cultures in white pine(Pinus strobus)[J]. Tree Physiol, 2006, 26(2): 195-200.