賀望興,楊普香,李延升,石旭平,黎小萍,張賤根,蔡海蘭,蔡 翔
(江西省蠶桑茶葉研究所,江西 南昌 330203)
靈芝屬于擔(dān)子菌綱多孔菌屬靈芝科,是極其珍貴的藥用真菌。我國(guó)古代的名醫(yī)及其醫(yī)學(xué)巨著記載靈芝能夠治療多種疾病,具有滋補(bǔ)強(qiáng)身、扶正固本等重要功效。研究表明:靈芝主要的一類活性成分是靈芝多糖[1-2],它具有免疫調(diào)節(jié)抗腫瘤、抗輻射、抗衰老、抗氧化、調(diào)節(jié)血糖以及保肝等主要藥理學(xué)作用[3]。
1953年Kalckar等在酵母細(xì)胞中首次發(fā)現(xiàn)尿苷二磷酸葡萄糖焦磷酸化酶(UGPase)[4],目前在植物的許多組織細(xì)胞中都發(fā)現(xiàn)了它的存在。UGPase在植物的非光合作用組織,尤其是儲(chǔ)藏組織中含量較高,在植物組織細(xì)胞中的UGPase絕大多數(shù)分布在胞液里[5]。UGPase是調(diào)控合成植物多糖過(guò)程的關(guān)鍵酶,催化反應(yīng)Glc-1-P+UTP→UDPG+PPi發(fā)生,UDPG即尿苷二磷酸葡萄糖,它是植物活化糖的主要形式,在高等植物中為各類碳水化合物包括蔗糖、纖維素、果膠質(zhì)以及糖蛋白等的合成提供葡萄糖基[6]。
截至目前登陸GenBank沒(méi)有發(fā)現(xiàn)靈芝UGPase的cDNA序列,本研究基于靈芝EST數(shù)據(jù)庫(kù)和生物信息學(xué)手段,對(duì)靈芝UGPase酶基因進(jìn)行電子克隆和序列分析,然后利用生物信息學(xué)軟件對(duì)UGPase基因編碼蛋白的理化性質(zhì)、亞細(xì)胞定位、親疏水性、信號(hào)肽、蛋白結(jié)構(gòu)域、蛋白高級(jí)結(jié)構(gòu)以及系統(tǒng)進(jìn)化樹的構(gòu)建等方面進(jìn)行了預(yù)測(cè)和分析,以期豐富靈芝基因資源,為靈芝多糖生物合成的代謝機(jī)理提供理論基礎(chǔ)。
利用NCBI中的Blast軟件,以已知的草莖點(diǎn)霉(Phomaherbarum)UGPase基因(GenBank Accession: ABW96356.1)作為探針與靈芝較完整的表達(dá)序列標(biāo)簽(EST)數(shù)據(jù)庫(kù)進(jìn)行序列相似性搜索,選擇EST同源性比較高的序列進(jìn)行聚類、拼接、延伸,然后以新拼接的重疊群(Contig)為新探針,繼續(xù)搜索數(shù)據(jù)庫(kù),直到?jīng)]有新的靈芝EST序列可供拼接為止。最后將拼接完成的新基因序列確認(rèn)為靈芝UGPase基因序列。
按照RNA提取試劑盒的步驟提取靈芝細(xì)胞的RNA,用cDNA第一鏈合成試劑盒將mRNA反轉(zhuǎn)錄成cDNA。根據(jù)電子克隆得到的基因序列,用Primer 5.0程序設(shè)計(jì)正向引物F:5’-CCGAGAAACAGAGGAGCA-3’,反向引物R:5’-TGAGGACGAGAAGAAGCAC-3’,預(yù)計(jì)擴(kuò)增片段長(zhǎng)989 bp。以靈芝RNA的反轉(zhuǎn)錄成的cDNA作為模板,PCR擴(kuò)增程序?yàn)椋?4 ℃、5 min,(94℃、30 s, 58 ℃、30 s, 72 ℃、30 s)×30個(gè)循環(huán),72 ℃、10 min。PCR產(chǎn)物用1.0%瓊脂糖凝膠電泳,并將PCR產(chǎn)物交上海生工測(cè)序。
利用生物信息學(xué)相關(guān)軟件對(duì)UGPase基因編碼蛋白從氨基酸組成、理化性質(zhì)、保守結(jié)構(gòu)域、跨膜結(jié)構(gòu)域、親水性疏水性、亞細(xì)胞定位、信號(hào)肽、蛋白結(jié)構(gòu)、同源性分析及系統(tǒng)進(jìn)化樹的構(gòu)建等方面進(jìn)行了預(yù)測(cè)和分析。具體軟件信息如表1所示。
通過(guò)電子克隆方法獲得了一條全長(zhǎng)為1691 bp的靈芝UGPasecDNA基因。ORF在線軟件分析表明,該序列包含一個(gè)1515 bp的完整開放閱讀框,編碼504個(gè)氨基酸。圖1為電子克隆得到的靈芝UGPase基因序列及其推導(dǎo)的氨基酸序列。
根據(jù)電子克隆得到的靈芝UGPase基因序列,用Primer 5.0程序設(shè)計(jì)引物,經(jīng)PCR驗(yàn)證,得到一條大小約989 bp的電泳條帶。如圖2所示,PCR產(chǎn)物電泳分子量大小與基因電子克隆序列理論相吻合,可初步判斷該條帶是靈芝UGPase基因。該P(yáng)CR產(chǎn)物經(jīng)上海生工測(cè)序,測(cè)序結(jié)果與電子克隆的理論序列一致。
2.3.1 靈芝UGPase蛋白理化性質(zhì)分析 利用ExPASy-Protparam在線軟件對(duì)UGPase蛋白理化性質(zhì)進(jìn)行分析,結(jié)果如表2所示。靈芝UGPase基因編碼504個(gè)氨基酸,蛋白質(zhì)等電點(diǎn)為6.8、分子量大小為56830.1、不穩(wěn)定系數(shù)為30.63、平均疏水性為-0.320、脂肪系數(shù)為93.41。
根據(jù)Protparam算法,不穩(wěn)定系數(shù)數(shù)值小于40時(shí),預(yù)測(cè)的蛋白是比較穩(wěn)定,反之則較差[7]。分析結(jié)果表明UGPase蛋白較穩(wěn)定;平均疏水性為負(fù)值,表明UGPase蛋白很可能是一個(gè)親水性蛋白;脂肪系數(shù)是表征一個(gè)蛋白質(zhì)中脂肪側(cè)鏈所占的相對(duì)值,可作為球蛋白熱穩(wěn)定性增加的陽(yáng)性因素,脂肪系數(shù)越高蛋白質(zhì)越穩(wěn)定,預(yù)測(cè)結(jié)果再次證明了UGPase蛋白很可能是一種穩(wěn)定性蛋白。接著對(duì)UGPase基因所編碼的氨基酸組成進(jìn)行分析,結(jié)果如表3所示。UGPase蛋白由20種氨基酸組成,其中亮氨酸(Leu)含量最高,占10.7%;其次是賴氨酸(Lys),占7.1%;半胱氨酸(Cys)和色氨酸(Trp)的含量最低,均為0.6%。
圖1 電子克隆獲得的靈芝UGPase基因的cDNA序列及其推導(dǎo)的氨基酸序列
圖2 PCR電泳圖
表2 UGPase基因所編碼的氨基酸一級(jí)結(jié)構(gòu)
2.3.2 亞細(xì)胞定位 蛋白質(zhì)在細(xì)胞中的定位與該蛋白質(zhì)的功能密切有關(guān),利用ExPASy-Psort在線軟件對(duì)UGPase 蛋白在細(xì)胞內(nèi)的定位進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表4,UGPase 蛋白定位在細(xì)胞質(zhì)內(nèi)的概率最大為69.6%,這與報(bào)道的UGPase 蛋白主要參與植物糖類代謝調(diào)控以及纖維素合成等過(guò)程相符合[8]。
表3 UGPase基因所編碼蛋白質(zhì)的氨基酸組成
表4 靈芝UGPase蛋白亞細(xì)胞定位
2.3.3 靈芝UGPase蛋白跨膜結(jié)構(gòu)域預(yù)測(cè)分析 跨膜結(jié)構(gòu)域是膜內(nèi)在蛋白與膜脂相結(jié)合的主要部位,一般由20個(gè)左右的疏水氨基酸組成,形成α螺旋,它固著于細(xì)胞膜上起“錨定”作用[9]。利用TMHMM-2.0在線工具預(yù)測(cè)UGPase 蛋白的跨膜結(jié)構(gòu)域,結(jié)果如圖3所示,信號(hào)線平直沒(méi)有變化,可知UGPase 蛋白不是膜蛋白,不存在跨膜結(jié)構(gòu)域,該預(yù)測(cè)結(jié)果與該蛋白定位在細(xì)胞質(zhì)內(nèi)的預(yù)測(cè)結(jié)果相一致。
圖3 靈芝蛋白跨膜結(jié)構(gòu)域預(yù)測(cè)
圖4 靈芝UGPase蛋白氨基酸疏/親水性預(yù)測(cè)
2.3.5 UGPase 蛋白的信號(hào)肽結(jié)構(gòu)預(yù)測(cè) 信號(hào)肽是分泌蛋白新生肽鏈 N端的一段20~30個(gè)氨基酸殘基組成的肽段,它決定某些氨基酸殘基的修飾,常用于指導(dǎo)蛋白質(zhì)的跨膜轉(zhuǎn)移[11]。利用ExPASy-Signalp 4.1在線軟件對(duì)靈芝UGPase蛋白信號(hào)肽結(jié)構(gòu)進(jìn)行預(yù)測(cè),軟件預(yù)測(cè)結(jié)果如圖5和表5所示。UGPase蛋白的第23位氨基酸殘基具有最高的原始剪切位點(diǎn)分值0.116,第34位氨基酸殘基具有最高的信號(hào)肽分值為0.119,第1位到第 22位氨基酸殘基的信號(hào)肽分值為0.101,第23位氨基酸殘基具有最高綜合剪切位點(diǎn)分值為0.108。由于該氨基酸殘基的原始剪切位點(diǎn)和信號(hào)肽的分值均較小,所以推斷靈芝UGPase基因不存在信號(hào)肽,它是一種非分泌蛋白。
圖5 靈芝UGPase蛋白信號(hào)肽結(jié)構(gòu)預(yù)測(cè)
表5 靈芝UGPase蛋白信號(hào)肽預(yù)測(cè)結(jié)果
2.3.6 UGPase 蛋白結(jié)構(gòu)域分析 使用 NCBI的CDD (Conserved Domain Database )數(shù)據(jù)庫(kù),對(duì)UGPase基因編碼蛋白序列進(jìn)行保守結(jié)構(gòu)域分析,結(jié)果如圖6所示。UGPase蛋白具有Substrate binding site、UDPGP、UTP-1-磷酸葡萄糖轉(zhuǎn)移酶、UDP-葡萄糖焦磷酸化酶(UDPase)和UDPGlcNAc焦磷酸酶等結(jié)合位點(diǎn)和保守域,屬于Glyco _tranf _GTA_type超家族蛋白。
圖6 UGPase基因編碼蛋白的保守結(jié)構(gòu)域分析
2.3.7 UGPase 蛋白的二級(jí)結(jié)構(gòu)預(yù)測(cè) 利用ExPASy-SOPMA在線軟件對(duì)UGPase蛋白二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè),結(jié)果如圖 7所示。由表6可知,無(wú)規(guī)則卷曲的比例最高為37.30%,其次是α螺旋為34.52%,而延伸鏈和β折疊所占的比例低,分別只有20.04%和8.13%。由此可推測(cè),α螺旋結(jié)構(gòu)和無(wú)規(guī)則卷曲結(jié)構(gòu)散布于其整個(gè)蛋白質(zhì)中,是構(gòu)成靈芝UGPase蛋白質(zhì)二級(jí)結(jié)構(gòu)的主要骨架。
圖7 靈芝UGPase蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)
表6 靈芝UGPase蛋白二級(jí)結(jié)構(gòu)
2.3.8 UGPase蛋白的三級(jí)結(jié)構(gòu)預(yù)測(cè) 通過(guò)Expasy工具中的在線軟件SWISSS-MODEL對(duì)UGPase蛋白的三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè),從圖8可知,UGPase蛋白的空間構(gòu)象主要是由α螺旋結(jié)構(gòu)和無(wú)規(guī)則卷曲結(jié)構(gòu)所組成,延伸鏈數(shù)目也很多,而β折疊很少,這與前面得到的二級(jí)結(jié)構(gòu)的預(yù)測(cè)結(jié)果相一致。把UGPase蛋白空間構(gòu)象模擬圖與云芝、污叉絲孔菌、灰蓋鬼傘菌的空間構(gòu)象模擬圖進(jìn)行比較,發(fā)現(xiàn)其空間結(jié)構(gòu)特點(diǎn)非常相似,表明UGPase蛋白保守性很強(qiáng)。
圖8 靈芝、云芝、污叉絲孔菌、灰蓋鬼傘菌蛋白空間構(gòu)象模擬圖
2.3.9 UGPase蛋白同源性分析及系統(tǒng)進(jìn)化樹的構(gòu)建 把靈芝UGPase氨基酸序列與Dichomitussqualens(EJF65102.1)、Trametesversicolor(EIW63033.1)、Coprinopsiscinereaokayama(XP_001830101.1)、Stereumhirsutum(EIM79169.1)、Laccariabicolor(XP_001880115.1)、Coniophoraputeana(EIW80502.1)、Fomitiporiamediterranea(EJD03181.1)、Pucciniagraminis(XP_003336014.1)、Rhodosporidiumtoruloides(EMS18250.1)、Rhodotorulaglutinis(EGU10896.1)、Pseudozymahubeiensis(GAC95340.1)、Dacryopinax(EJU03952.1)、Cryptococcusneoformansvar(AFR93944.1)通過(guò)序列處理在線工具包(SMS)進(jìn)行同源比對(duì),結(jié)果如圖9顯示,靈芝UGPase與Dichomitussqualens同源性最高達(dá)到97%,與其他植物的同源性也比較高,表明UGPase蛋白在不同植物中具有比較高的保守性。
圖9 靈芝UGPase與其他植物基因編碼的氨基酸序列比較
通過(guò)MEGA 5.0軟件比對(duì)分析,構(gòu)建了靈芝UGPase氨基酸序列與上述物種的氨基酸序列的進(jìn)化樹,如圖10所示。靈芝與Dichomitussqualens親緣關(guān)系最近,其次是Trametesversicolor,而與其他物種的親緣關(guān)系相距較遠(yuǎn)。根據(jù)氨基酸序列分析的物種親緣關(guān)系與傳統(tǒng)進(jìn)化親緣關(guān)系相同。
圖10 靈芝UGPase與其他植物UGPase酶的氨基酸序列進(jìn)化樹
基因的電子克隆是隨著基因組計(jì)劃和EST計(jì)劃的發(fā)展而興起的,它主要利用不同物種的同類基因之間存在序列保守性這一原理[12-13],相對(duì)與傳統(tǒng)基因克隆的方法,電子克隆速度快、成本低、針對(duì)性強(qiáng)、技術(shù)要求低,可以將更多的精力放在克隆基因的功能研究上[14]。
本文利用草莖點(diǎn)霉葡萄糖焦磷酸化酶作為電子探針,通過(guò)電子克隆方法得到靈芝UGPase基因,利用生物信息學(xué)軟件對(duì)UGPase基因編碼蛋白的理化性質(zhì)、亞細(xì)胞定位、親疏水性、信號(hào)肽、蛋白結(jié)構(gòu)域、蛋白高級(jí)結(jié)構(gòu)以及系統(tǒng)進(jìn)化樹的構(gòu)建等方面進(jìn)行了預(yù)測(cè)和分析,結(jié)果表明:UGPase基因全長(zhǎng)1691 bp,編碼504個(gè)氨基酸,分子量為56830.1 Da,等電點(diǎn)為6.8。該蛋白不存在信號(hào)肽和跨膜結(jié)構(gòu)域,是定位于細(xì)胞質(zhì)內(nèi)的一種親水性穩(wěn)定蛋白酶。該蛋白的高級(jí)結(jié)構(gòu)主要是由α螺旋結(jié)構(gòu)和無(wú)規(guī)則卷曲結(jié)構(gòu)所組成,和其他植物的UGPase酶相比在序列組成、高級(jí)結(jié)構(gòu)方面具有一定的相似性,表明該蛋白在進(jìn)化上較保守。本研究采用電子克隆方法首次得到了靈芝UGPase基因的cDNA序列,為進(jìn)一步研究UGPase基因在靈芝中的生物學(xué)功能奠定了基礎(chǔ)。
江西農(nóng)業(yè)學(xué)報(bào)2019年9期