唐 乖, 楊 越, 朱家佳, 龍鼎新
(南華大學(xué) 公共衛(wèi)生學(xué)院, 衡陽(yáng) 421001)
核糖體蛋白S6激酶A3基因(ribosomal protein S6 kinase A3,RPS6KA3)又稱為RSK2、p90RSK2、S6K-α-3或MAPKAPK-1B,位于X染色體p22.12,編碼絲氨酸/蘇氨酸激酶RSK2[1-2]。核糖體S6激酶2(ribosomal S6 kinase2, RSK2)屬于Ras-MAPK信號(hào)通路下游的90 ku 核糖體S6激酶家族(ribosomal S6 kinase,RSK)[3-4]。RSKs家族包含 4 個(gè)亞型(RSK1-4)及 2 個(gè)結(jié)構(gòu)同系物(MSK1/2)[5],該家族成員具有高度的序列同源性[6](約75% ~ 80%的氨基酸序列是相同的),只有兩個(gè)功能不同的激酶結(jié)構(gòu)域[7-8]。RPS6KA3通過(guò)磷酸化細(xì)胞死亡相關(guān)蛋白激酶(Death associated protein kinase,DAPK)[9]、活化T細(xì)胞核因子3(Nuclear factor of activated T-cells,NFAT3)[10]、熱休克蛋白27(Heat shock protein,Hsp27)[11]等一系列細(xì)胞因子[3, 12],在細(xì)胞的增殖、遷移、侵襲、凋亡、自噬及細(xì)胞周期的調(diào)控等多項(xiàng)細(xì)胞生命活動(dòng)中起關(guān)鍵作用[8]。研究發(fā)現(xiàn)RPS6KA3在細(xì)胞增殖、轉(zhuǎn)化等過(guò)程中發(fā)揮重要作用,并與癌癥等多種疾病的發(fā)生發(fā)展過(guò)程密切相關(guān)[13]。已證實(shí),RPS6KA3基因的功能缺失突變會(huì)引起科-勒二氏綜合征(Coffin-Lowry syndrome,CLS)——一種罕見(jiàn)的神經(jīng)退行性疾病[12, 14-15]。
為了深入研究人RPS6KA3基因的性質(zhì)和功能,本研究擬采用生物信息學(xué)方法,對(duì)人RPS6KA3基因及其編碼蛋白的結(jié)構(gòu)特點(diǎn)以及與其潛在相互作用的基因和蛋白進(jìn)行預(yù)測(cè)分析,揭示其理化性質(zhì)及功能信息,有利于了解其在疾病發(fā)生發(fā)展中的生物學(xué)作用,可為該基因的生物學(xué)功能及作用機(jī)制的深入研究奠定了實(shí)驗(yàn)基礎(chǔ)。
從在線數(shù)據(jù)庫(kù)NCBI中(http://www.ncbi.nlm.nih.gov/protein/)獲取人RPS6KA3基因(Gene ID: 6197)相關(guān)序列和RPS6KA3蛋白質(zhì)的氨基酸序列信息(NP_004577)。
利用Neural Network Promoter Prediction(http://www.fruitfly.org/seq_tools/promoter.html)在線軟件預(yù)測(cè)潛在核心啟動(dòng)子;利用Ensembl[16]數(shù)據(jù)庫(kù)(http://asia.ensembl.org/Homo_sapiens/Gene/)獲得RPS6KA3的染色體圖譜。在NCBI數(shù)據(jù)庫(kù)中,使用BLAST(https://blast.ncbi.nlm.nih. gov/Blast.cgi)進(jìn)行同源搜索,獲得其它物種的RPS6KA3序列,采用最大似然法(maximum likelihood, ML)對(duì)不同物種RPS6KA3蛋白序列進(jìn)行分析,隨后利用MEGA6.06軟件構(gòu)建系統(tǒng)進(jìn)化樹(shù)。應(yīng)用NCBI的UniGene數(shù)據(jù)庫(kù)中EST(Expressed Sequence Tag)結(jié)果對(duì)RPS6KA3在正常組織及癌變組織中的表達(dá)情況進(jìn)行預(yù)測(cè)分析。應(yīng)用PSORT II Prediction[17](https://psort.hgc.jp/form2.html)在線數(shù)據(jù)庫(kù)對(duì)RPS6KA3進(jìn)行亞細(xì)胞定位。采用在線數(shù)據(jù)庫(kù)GeneMANIA[18-19](http://genemania.org)構(gòu)建RPS6KA3與其他基因之間的相互作用網(wǎng)絡(luò)圖。將人RPS6KA3蛋白質(zhì)序列(NP_004577)提交到Expert Protein Analysis System(ExPASy)[20]數(shù)據(jù)分析系統(tǒng)中,使用在線分析軟件ProParam[21](http://web.expasy.org/protparam/),對(duì)RPS6KA3蛋白質(zhì)的分子式、分子質(zhì)量、理論等電點(diǎn)、酸堿性及穩(wěn)定性等物理化學(xué)特性進(jìn)行預(yù)測(cè)分析。使用ProtScale(http://web.expasy.org/protscale/)在線預(yù)測(cè)軟件分析RPS6KA3蛋白質(zhì)的親水性/疏水性;利用在線軟件SignalP4.1 Server[22](http://www.cbs.dtu.dk/services/SignalP/)、核定位信號(hào)(nuclear localizationsequence, NLS)Mapper[23](http://nls-mapper.iab.keio.ac.jp/cgi-bin/NLS_Mapper_form.cgi)和TMHMM Server version 2.0[24](http://www.cbs.dtu.dk/services/TMHMM/)分析RPS6KA3有無(wú)切割位點(diǎn)和信號(hào)肽、核定位信號(hào)及跨膜區(qū)域。用在線分析軟件NetPhos 3.1 Server[25](http://www.cbs.dtu.dk/services/NetPhos/ )對(duì)人RPS6KA3蛋白磷酸化位點(diǎn)進(jìn)行分析。應(yīng)用NCBI的Conserved domain數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/Struct-ure/cdd/wrpsb.cgi)分析結(jié)構(gòu)域。使用SOPMA[26](http://npsa-pbil.ibcp.fr/)、Swiss-Model[27](http://swissmodel.expasy.org)和The Structure Analysis and Verification Server[28](http://services.mbi.ucla.edu/SAVES)對(duì)蛋白質(zhì)的二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)及拉曼圖進(jìn)行預(yù)測(cè)分析;采用String[29](http://string-db.org/)對(duì)相互作用蛋白質(zhì)進(jìn)行預(yù)測(cè)分析。各數(shù)據(jù)庫(kù)軟件參數(shù)如無(wú)特別說(shuō)明均取默認(rèn)值。
利用Neural Network Promoter Prediction對(duì)人RPS6KA3基因潛在核心啟動(dòng)子的位置進(jìn)行在線預(yù)測(cè)(表1),結(jié)果發(fā)現(xiàn)其在 2820~2870 bp 位置處的得分值最大(0.99),推測(cè)此處為潛在核心啟動(dòng)子位置的可能性最大。
人RPS6KA3基因位于X染色體上(Xp22.12),見(jiàn)圖1,大小為7723 bp,共有28個(gè)外顯子區(qū)域及27個(gè)內(nèi)含子,編碼740個(gè)氨基酸的蛋白質(zhì)[12]。其編碼蛋白核糖體S6激酶2(ribosomal S 6 Kinase 2,RSK2)是一種生長(zhǎng)因子調(diào)節(jié)的絲氨酸-蘇氨酸蛋白激酶,在Ras-MAPK信號(hào)通路中發(fā)揮重要作用[30-31]。
利用NCBI數(shù)據(jù)庫(kù)中的BLAST對(duì)RPS6KA3蛋白序列進(jìn)行BLASTp 搜索,獲得其他物種的RPS6KA3氨基酸序列,選取Identity較高的序列,隨后運(yùn)用MEGA6.06軟件構(gòu)建系統(tǒng)進(jìn)化樹(shù)(圖2)。利用NCBI 中的BLASTp對(duì)人RPS6KA3蛋白序列進(jìn)行分析發(fā)現(xiàn),食蟹猴 (Macaca fascicularis)的蛋白序列與人RPS6KA3的蛋白序列的相似性最好;從系統(tǒng)進(jìn)化樹(shù)中可以看到,物種被分為兩個(gè)大分支,其中人、食蟹猴及白頰長(zhǎng)臂猿聚在一個(gè)分支內(nèi),同源性最高。
表1 人RPS6KA3基因啟動(dòng)子預(yù)測(cè)結(jié)果
圖1人RPS6KA3基因位于染色體Xp22.12上
Figure 1 Human RPS6KA3 gene was located on chromosome Xp22.12
圖2 人RPS6KA3基因的系統(tǒng)進(jìn)化樹(shù)Figure 2 The phylogenefic tree of human RPS6KA3 gene
根據(jù)NCBI的UniGene數(shù)據(jù)庫(kù)中的EST預(yù)測(cè)結(jié)果,可知RPS6KA3在如下正常組織中均有表達(dá),拷貝數(shù)分別為:肌肉112、甲狀腺128、肝臟82、心臟22、肺47、乳腺59、胃62、食管49、膀胱33,其在甲狀腺中的拷貝數(shù)最高。由此推測(cè),RPS6KA3在多種組織中均有表達(dá),特異性較低。使用PSORT II 亞細(xì)胞定位分析發(fā)現(xiàn),RPS6KA3蛋白定位于細(xì)胞質(zhì)的可能性最大(65.2%),其次分別為細(xì)胞核(30.4%)和液泡(4.3%)。據(jù)此推測(cè),RPS6KA3主要存在于細(xì)胞質(zhì)中,也可能動(dòng)態(tài)存在其他亞細(xì)胞結(jié)構(gòu)中并發(fā)揮作用。
應(yīng)用GeneMANIA在線搜索與RPS6KA3基因存在相互作用的基因信息,構(gòu)建基因間相互作用網(wǎng)絡(luò)圖?;蚧プ黝A(yù)測(cè)分析顯示,與RPS6KA3相互作用的基因主要有MAPK1、RPS6KA1、MAPK7、HMGN1、SRF等(圖3)。
使用ProtParam分析發(fā)現(xiàn):RPS6KA3蛋白含有740個(gè)氨基酸殘基,總分子式為 C3763H5900N1012O1097S27,相對(duì)分子量為 83 735.98 u,總原子數(shù)為11 799,理論等電點(diǎn)(pI, isoelectric point)預(yù)測(cè)為6.41,表明該蛋白為酸性蛋白質(zhì)。在740個(gè)氨基酸殘基中帶正電荷的氨基酸殘基(Arg + Lys)和帶負(fù)電荷的氨基酸殘基(Asp + Glu)的總數(shù)分別是90和97,RPS6KA3基因CDS區(qū)氨基酸組成如圖4所示。消光系數(shù)(M-1cm-1γ=280 nm)為80 510,其不穩(wěn)定系數(shù)為42.80(>40考慮為不穩(wěn)定),屬于不穩(wěn)定類蛋白質(zhì),且其在哺乳動(dòng)物網(wǎng)織紅細(xì)胞內(nèi)的半衰期為30 h。脂肪系數(shù)為 85.65,總平均親水系數(shù)(Grand average of hydropathicity, GRAVY)為 -0.338,表明該蛋白是親水性蛋白。
圖4 人RPS6KA3基因CDS序列氨基酸
進(jìn)一步應(yīng)用ProtScale在線親/疏水性軟件,按其默認(rèn)的算法預(yù)測(cè),獲得 RPS6KA3 蛋白的親/疏水性序列分析圖譜(圖5)。正值越大表明該氨基酸的疏水性越強(qiáng),負(fù)值越大表明該氨基酸的親水性越強(qiáng),數(shù)值介于-0.5~0.5之間的主要為兩性氨基酸。由圖5可知,該蛋白質(zhì)存在兩個(gè)親水性最強(qiáng)的位點(diǎn),分別是位于第458位的精氨酸(Arg)和第459位的天冬氨酸(Asp),分值為-2.878;疏水性最強(qiáng)的位點(diǎn)是位于第608位的亮氨酸(Leu),分值為2.100。ProtScale分析的732個(gè)氨基酸(5~736)中有63.80%(467個(gè))分布在低分值區(qū),總得分為-418.046;35.38%(259個(gè))分布在score>0區(qū),總得分為160.194。這表明RPS6KA3存在大量親水域,屬于親水性蛋白質(zhì)。預(yù)測(cè)結(jié)果與理化性質(zhì)中的親/疏水性結(jié)果一致。
圖5 人RPS6KA3親水性/疏水性分析
利用信號(hào)肽預(yù)測(cè)軟件SignalP 4.1 Server在線分析RPS6KA3蛋白質(zhì)的氨基酸序列(圖6),Cut-off值設(shè)為0.450。其中C為剪切位點(diǎn)打分,最大值為0.110;Y為信號(hào)肽打分,最大值為0.110;S為綜合剪切點(diǎn)打分,最大值為0.119;S-mean和D-mean值分別為0.105、0.108,由以上數(shù)據(jù)可知,人RPS6KA3蛋白不存在切割位點(diǎn)及信號(hào)肽序列,提示該蛋白不是分泌蛋白。進(jìn)一步應(yīng)用cNLS Mapper分析其核定位序列發(fā)現(xiàn),在RPS6KA3蛋白質(zhì)中存在一段序列為“FGKVFLVKKISGSDARQLYAMK VLKKATLK(79-108)”的NLS,其得分值為5.1分,高于設(shè)定的閾值(5分)。
圖6 人RPS6KA3蛋白的信號(hào)肽分析
使用TMHMM Server. 2.0對(duì)人RPS6KA3蛋白質(zhì)的跨膜區(qū)進(jìn)行預(yù)測(cè)與分析,結(jié)果發(fā)現(xiàn)RPS6KA3不存在跨膜區(qū)域(圖7),屬于非跨膜蛋白。其中RPS6KA3蛋白定位于膜外(outside)的概率幾乎為100%,定位于膜內(nèi)(inside)及跨膜區(qū)域(transmembrane)的概率幾乎為0。多肽鏈中跨膜區(qū)域所在的位置用加粗的紫色線來(lái)標(biāo)識(shí),由于RPS6KA3蛋白無(wú)跨膜區(qū)域存在,所以在紫色粗線上并未顯示相應(yīng)標(biāo)記。
圖7 人RPS6KA3蛋白跨膜結(jié)構(gòu)分析
用NetPhos 3.1 Server對(duì)RPS6KA3翻譯后修飾情況進(jìn)行在線分析,發(fā)現(xiàn)RPS6KA3蛋白有多個(gè)潛在的磷酸化調(diào)節(jié)位點(diǎn)存在(圖8),這些磷酸化調(diào)節(jié)位點(diǎn)主要位于絲氨酸(Ser)、酪氨酸(Tyr)上,表明RPS6KA3通過(guò)被絲氨酸、酪氨酸及蘇氨酸激酶磷酸化來(lái)實(shí)現(xiàn)其功能調(diào)控作用。
圖8 人RPS6KA3蛋白磷酸化位點(diǎn)
h:α-螺旋;e:延伸鏈; t:β-轉(zhuǎn)角;c:無(wú)規(guī)卷曲
圖9人RPS6KA3二級(jí)結(jié)構(gòu)預(yù)測(cè)
Figure 9 Secondary structure prediction of human RPS6KA3
通過(guò)SOPMA對(duì)人RPS6KA3蛋白質(zhì)所形成的二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)分析(圖9),構(gòu)象狀態(tài)選擇3(Helix,Sheet,Coil),相似性閾值選擇8。在RPS6KA3蛋白質(zhì)的二級(jí)結(jié)構(gòu)中,α-螺旋(h所示區(qū)域)占41.62%(308/740),延伸鏈(e所示區(qū)域)占13.38%(99/740),β-轉(zhuǎn)角(t所示區(qū)域)占8.11%(60/740),無(wú)規(guī)則卷曲(c所示區(qū)域)占36.89%(273/740)。由此可知,RPS6KA3蛋白二級(jí)結(jié)構(gòu)最大量元件是α-螺旋,無(wú)規(guī)則卷曲、延伸鏈、β-轉(zhuǎn)角則散在分布于整個(gè)蛋白質(zhì)結(jié)構(gòu)中。
應(yīng)用NCBI的Conserved domain數(shù)據(jù)庫(kù)預(yù)測(cè)分析RPA6KA3蛋白,發(fā)現(xiàn)其屬于PKc_like超家族,含有2個(gè)功能不同的催化結(jié)構(gòu)域(STKc_RSK_N和STKc_RSK_C),它們可將ATP上的γ-磷酸基團(tuán)催化轉(zhuǎn)移到蛋白質(zhì)底物上的絲氨酸/蘇氨酸殘基上,從而使蛋白底物磷酸化(圖10)。
圖10人RPS6KA3蛋白保守結(jié)構(gòu)域
Figure 10 Conserved domain of human RPS6KA3
采用結(jié)構(gòu)預(yù)測(cè)軟件SWISS-MODEL預(yù)測(cè)RPS6KA3蛋白質(zhì)的三級(jí)結(jié)構(gòu)。首先將RPS6KA3的氨基酸序列提交至SWISS-MODEL,得到4個(gè)三級(jí)結(jié)構(gòu)的預(yù)測(cè)信息(表2);然后再利用The Structure Analysis and Verification Server 對(duì)預(yù)測(cè)獲得的模型進(jìn)行拉曼圖分析,進(jìn)一步驗(yàn)證獲得的預(yù)測(cè)模型的可靠性(圖11)。表2展示了4種預(yù)測(cè)結(jié)果所選用的模板(Model)、序列相似度(Sequence Similarity)、預(yù)測(cè)范圍(Range)、覆蓋度(Coverage)及拉曼圖分析中處于不合理區(qū)域氨基酸的比例(Residues in disallowed regions)等。圖9展示了預(yù)測(cè)獲得的4種蛋白質(zhì)模型的三級(jí)結(jié)構(gòu)、同源蛋白質(zhì)相似性波形圖及拉曼圖。在拉曼圖中區(qū)域由白到紅,顏色越深則表明該區(qū)域二面角越合理。
▲:甘氨酸;■:除甘氨酸外的其他氨基酸
圖11人RPS6KA3三級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果及拉曼圖分析
Figure 11 Tertiary structure prediction and Ramachandran
plot analysis of RPS6KA3 in human
應(yīng)用蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein, PPI)在線分析數(shù)據(jù)庫(kù)STRING,對(duì)人RPS6KA3蛋白質(zhì)間的相互作用進(jìn)行預(yù)測(cè)分析,設(shè)置為高置信度0.7,構(gòu)建RPS6KA3蛋白相互作用網(wǎng)絡(luò)(圖12)。得到10個(gè)與RPS6KA3相互作用緊密的蛋白信息及預(yù)測(cè)得分值(表3),這些蛋白質(zhì)彼此之間存在緊密的相互作用關(guān)系。
表2 RPS6KA3預(yù)測(cè)三級(jí)結(jié)構(gòu)信息
圖12 與人RPS6KA3蛋白質(zhì)相互作用的蛋白質(zhì)預(yù)測(cè)
表3 與人RPS6KA3相互作用可能性較大的10種蛋白質(zhì)
生物信息學(xué)(Bioinformatics)是一門由生物學(xué)、數(shù)學(xué)、信息科學(xué)以及計(jì)算機(jī)科學(xué)等多學(xué)科相結(jié)合,以計(jì)算機(jī)為工具對(duì)生物信息進(jìn)行加工、存儲(chǔ)、分配、分析解釋等,并綜合運(yùn)用計(jì)算機(jī)科學(xué)、數(shù)學(xué)和生物學(xué)等學(xué)科的各種工具來(lái)理解和闡明大量數(shù)據(jù)所包含的生物學(xué)意義的一門交叉性學(xué)科[32-33]。
本研究對(duì)人RPS6KA3基因及其蛋白進(jìn)行生物學(xué)分析,結(jié)果顯示其基因存在15個(gè)潛在啟動(dòng)子,其中在 2820~2870 bp 位置處得分值最大0.99,表明其為潛在核心啟動(dòng)子位置的可能性最大。人RPS6KA3基因定位于X染色體長(zhǎng)臂上,共編碼740個(gè)氨基酸組成的多肽;通過(guò)對(duì)不同物種間的序列進(jìn)行同源比對(duì)分析可知,不同物種間的序列相似度較高,提示其在進(jìn)化過(guò)程中相對(duì)保守,說(shuō)明其由于具有重要的功能作用而在進(jìn)化過(guò)程中得以保留?;蚧プ黝A(yù)測(cè)分析表明,與RPS6KA3相互作用的基因主要有MAPK1、RPS6KA1、MAPK7、HMGN1和SRF等;人RPS6KA3基因存在多個(gè)磷酸化位點(diǎn),其編碼的蛋白是一個(gè)不穩(wěn)定的水溶性蛋白,其分子量為83 735.98 u,等電點(diǎn)為6.41,蛋白質(zhì)結(jié)構(gòu)主要由α-螺旋和無(wú)規(guī)則卷曲組成,不含切割位點(diǎn),無(wú)明顯信號(hào)肽及跨膜結(jié)構(gòu),說(shuō)明RPS6KA3不參與物質(zhì)的跨膜運(yùn)輸。蛋白質(zhì)相互作用預(yù)測(cè)表明,與RPS6KA3相互作用的蛋白主要是MAPK1、MAPK3、MAPK7等MAPK信號(hào)通路相關(guān)蛋白,TSC1、TSC2等mTOR信號(hào)通路相關(guān)蛋白及蛋白合成相關(guān)蛋白等。
本研究針對(duì)人RPS6KA3基因及其編碼蛋白的生物學(xué)特性進(jìn)行系統(tǒng)分析,構(gòu)建了RPS6KA3的系統(tǒng)進(jìn)化樹(shù),分析了RPS6KA3蛋白的理化性質(zhì)、空間結(jié)構(gòu)特點(diǎn)、組織學(xué)特異性、亞細(xì)胞定位以及與其存在相互作用蛋白等,為全面認(rèn)識(shí)RPS6KA3和深入研究其生物學(xué)功能提供了一定的基礎(chǔ)。