麥秀英,李萍,徐柳
西南交通大學 生命科學與工程學院,四川 成都 610031
?
胰島素樣生長因子受體Ⅰ序列結(jié)構(gòu)的生物信息學分析
麥秀英,李萍,徐柳
西南交通大學 生命科學與工程學院,四川 成都 610031
麥秀英, 李萍, 徐柳. 胰島素樣生長因子受體Ⅰ序列結(jié)構(gòu)的生物信息學分析. 生物工程學報, 2016, 32(5): 693–701.
Mai XY, Li P, Xu L. Bioinformatics analysis of sequence and structure of insulin-like growth factor-I receptor. Chin J Biotech, 2016, 32(5): 693–701.
摘 要:胰島素樣生長因子受體Ⅰ的 3'UTR長度大于7 kb,結(jié)構(gòu)復雜,有多種miRNAs的結(jié)合位點,參與信號通路中MAPK及PI3K/AKT的調(diào)節(jié)和多種腫瘤的形成和發(fā)展,通過生物信息學分析知道其結(jié)構(gòu)特點,為后續(xù)研究提供思路。分析表明兒童神經(jīng)膠質(zhì)瘤中IGF1R的3'UTR與miRNAs結(jié)合位點突變率最高。分析IGF1R序列3'UTR的結(jié)構(gòu),miRNAs結(jié)合位點,氨基酸序列的理化性質(zhì),親疏水性,糖基化和磷酸化位點,二級結(jié)構(gòu)和三級結(jié)構(gòu)建模。IGF1R三級結(jié)構(gòu)與配體IGF1的三級結(jié)構(gòu)模擬分子對接,得到2種蛋白相互作用的氨基酸位置及名稱。因此,通過對IGF1R 3'UTR突變,降低與miRNAs的結(jié)合,IGF1R表達上調(diào),同時改變與IGF1的氨基酸結(jié)合位點,降低2種蛋白的相互作用,從而抑制IGF1R的作用。
關(guān)鍵詞:胰島素樣生長因子受體I,序列分析,三維建模,分子對接
Received: August 25, 2015; Accepted: October 19, 2015
Supported by: Scientific Research Foundation for the Returned Overseas Chinese Scholars, State Education Ministry (No. 2013S03008), National Natural Science Foundation of China (No. 31500276).
教育部留學回國人員科研啟動基金 (No. 2013S03008),國家自然科學基金 (No. 31500276) 資助。
胰島素樣生長因子受體Ⅰ (Insulin-like growth factor-I receptor,IGF1R) 是酪氨酸蛋白激酶類受體家族的主要成員之一,存在于多種細胞表面,它調(diào)控的Raf-MEK-ERK和AKT-mTOR-S6K信號通路對于腫瘤細胞的增殖、分化和轉(zhuǎn)移過程起著重要的作用[1]。大量流行病學和臨床病理學實驗結(jié)果表明,IGF1R在結(jié)腸癌、乳腺癌、肺癌、前列腺癌、惡性黑色素瘤、小細胞肺癌和膠質(zhì)瘤等多種實體腫瘤細胞中均存在過量的表達,其表達量和腫瘤發(fā)生的幾率之間高度相關(guān),因此,IGF1R已經(jīng)成為具有良好開發(fā)前景的腫瘤治療基因靶點,開發(fā)高效特異性的IGF1R抑制劑和抗IGF1R的抗體對多種腫瘤的治療具有重要的臨床意義和應(yīng)用前景[2]。
研究發(fā)現(xiàn),人IGF1R基因3'UTR端長7 082 bp,比一般的基因3'UTR端長很多,存在多個miRNAs結(jié)合位點,因此它的表達水平受到多種miRNAs的調(diào)控,IGF1R基因表達量異常與IGF1R基因3'UTR端miRNAs結(jié)合位點多容易發(fā)生突變的特點密切相關(guān)。如兒童神經(jīng)膠質(zhì)瘤是一種常見的兒童腦瘤,臨床中該病占兒童腫瘤的15%,存活率低于40%。在兒童神經(jīng)膠質(zhì)瘤患者中,IGF1R的3'UTR突變頻率高,IGF1R的表達上調(diào),這一現(xiàn)象預示IGR1R基因3'UTR端與miRNAs結(jié)合位點的突變導致IGF1R表達量上調(diào)與兒童神經(jīng)膠質(zhì)瘤的形成發(fā)展存在密切關(guān)系,因此認為該基因可以作為治療兒童神經(jīng)膠質(zhì)瘤的一個靶基因。
本文參考美國費城兒童醫(yī)院Andrei Thomas-Tikhonenko教授提供的數(shù)據(jù),對兒童神經(jīng)膠質(zhì)瘤96個原癌基因的3'UTR突變進行統(tǒng)計分析,同時對IGF1R的蛋白序列、結(jié)構(gòu)特征與配體的分子對接、3'UTR 與miRNAs結(jié)合位點預測等進行詳細分析,為開發(fā)利用小分子抑制劑和反義RNA抑制腫瘤細胞中IGF1R表達,從而達到有效控制腫瘤生長的研究提供理論依據(jù)。
1.1材料
NCBI網(wǎng)站上檢索人胰島素樣生長因子Ⅰ型受體 (IGF1R) 的核苷酸序列NM_000875 和氨基酸序列NP_000866。
兒童神經(jīng)膠質(zhì)瘤中96個原癌基因3'UTR突變體數(shù)據(jù)由美國費城兒童醫(yī)院Andrei Thomas-Tikhonenko教授提供。
1.2方法
兒童神經(jīng)膠質(zhì)瘤中96個基因3'UTR突變頻率數(shù)據(jù)進行統(tǒng)計分析。使用TargetScan[3]對其miRNAs結(jié)合位點預測,通過ProtParam[4]和ProtScale[4]軟件預測IGFIR氨基酸序列的理化性質(zhì)和親疏水性,NetNGlyc[5]和Netphos[6]分別分析序列中的糖基化和磷酸化位點。軟件SOPMA[7]和Swiss-Model[8]用來預測IGF1R的二級結(jié)構(gòu)和三級結(jié)構(gòu),對所得三級結(jié)構(gòu)進行合理性分析。AutoDock[9]對IGF1R受體蛋白與IGF1胰島素生長因子蛋白進行體外模擬偶聯(lián)。
2.1兒童神經(jīng)膠質(zhì)瘤患者96個原癌基因3'UTR突變頻率分析
美國費城兒童醫(yī)院通過對188例兒童神經(jīng)膠質(zhì)瘤患者腫瘤細胞中的96個原癌基因3'UTR進行了測序分析,發(fā)現(xiàn)6 851個3'UTR突變體,其中3 423個突變體突變位置在與miRNA結(jié)合位點。在3 423個突變體中,有459個3'UTR突變體突變位置發(fā)生與miRNA結(jié)合的種子序列50個堿基以內(nèi),這459個突變體分別來自于26個基因,突變的頻率最高的是IGF1R基因 (圖1),表明IGF1R基因3'UTR端的突變與兒童神經(jīng)膠質(zhì)瘤的形成和發(fā)展密切相關(guān)。
2.2IGF1R 3'UTR區(qū)研究及結(jié)合的miRNA預測
利用UCSC查找人類IGF1R序列的3'UTR端,并與人類IGF2R序列的3' UTR進行比較。圖2為3'UTR端結(jié)構(gòu)圖。
從結(jié)構(gòu)圖中可以看出,IGF1R的3'UTR的結(jié)構(gòu)明顯比IGF2R的3'UTR結(jié)構(gòu)復雜,表明IGF1R的3' UTR序列可能存在一些重要的功能,IGF1R的3'UTR (7 082 bp) 端比IGF2R (1 467 bp) 的序列長很多。對IGF1R 3'UTR區(qū)的miRNA結(jié)合位點預測,發(fā)現(xiàn)miRNA結(jié)合位點非常多,表1僅列出與IGF1R的3'UTR結(jié)合的miRNA部分預測結(jié)果。
圖1 兒童神經(jīng)膠質(zhì)瘤中26個基因3'UTR與miRNAs結(jié)合位點突變頻率分析Fig. 1 Mutation rate analysis of the sites that 26 genes 3'UTR combine with miRNAs in children with gliomas.
全序列預測顯示IGF1R的3' UTR的miRNA位點非常多,說明了IGF1R的表達受到多種miRNA的調(diào)控。如果IGF1R的3' UTR發(fā)生突變影響IGF1R與miRNA結(jié)合,會導致IGF1R表達上調(diào),細胞增殖加快。
圖2 人類IGF1R (A) 和IGF2R (B) 的3' UTR 結(jié)構(gòu)比較Fig. 2 The structure comparison of IGF1R (A) and IGF2R (B) in human.
表1 人IGF1R的3'UTR與miRNAs結(jié)合位點預測Table 1 The prediction of IGF1R 3'UTR and miRNAs binding sites of people
2.3IGF1R序列的理化性質(zhì)
用在線工具ProParam對IGFIR氨基酸序列的理化性質(zhì)進行預測分析,得到結(jié)果見表2。分子量為154 793,等電點為3.58,含量較高的氨基酸Glu(E) 8.3%,Leu(K) 8.5% Ser(S) 7.1%,Val(V) 6.4%,該蛋白不穩(wěn)定指數(shù)為48.02,為不穩(wěn)定蛋白。用ProtScale對IGF1R的氨基酸序列進行親疏水性分析,結(jié)果 (圖3) 表明親水性氨基酸占74.31%,疏水性氨基酸占25.69%,故IGF1R蛋白為親水性蛋白質(zhì)。
表2 IGF1R核苷酸序列理化性質(zhì)分析Table 2 The analysis of IGF1R physical and chemical properties
圖3 IGF1R親疏水性分析Fig. 3 The analysis of IGF1R hydrophilic-hydrophobic property.
2.4IGF1R蛋白磷酸化位點和糖基化位點預測及分析
分別用在線工具NetNGlyc和Netphos對IGF1R蛋白序列進行糖基化位點和磷酸化位點進行分析,分析結(jié)果見圖4和圖5。糖基化位點分析圖中,紅色線代表閾值,超過這條紅色線的綠色線越高即代表此位點糖基化的可能性更高,由圖4可看出有14處位點可能被糖基化,糖基化位點相對較少,糖基化對蛋白的穩(wěn)定性有一定的影響,糖基化位點較少進一步證明該蛋白為不穩(wěn)定蛋白。
圖4 IGF1R的糖基化位點分析Fig. 4 The analysis of IGF1R glycosylation sites.
圖5 IGF1R的磷酸化位點分析Fig. 5 The analysis of IGF1R phosphorylation sites.
磷酸化位點分析圖5中,紅色線同樣代表閾值,與糖基化位點分析圖中有相同的作用,綠色線代表絲氨酸,藍色線代表蘇氨酸,粉色線則代表酪氨酸,從圖中可以看出絲氨酸磷酸化位點最多,其次是酪氨酸,最后是蘇氨酸,磷酸化位點相比與糖基化位點多很多。IGF1R是酪氨酸激酶家族的重要成員,磷酸化作用是其發(fā)揮生物學功能的重要生物化學反應(yīng),表明IGF1R在細胞增殖調(diào)控通路中起著重要的作用。
2.5IGF1R蛋白二級結(jié)構(gòu)和結(jié)構(gòu)域預測
蛋白質(zhì)的二級結(jié)構(gòu)主要是通過2個氨基酸之間的氫鍵來形成有規(guī)則的卷曲與折疊。常見的二級結(jié)構(gòu)形成的構(gòu)件有α-螺旋 (α-helix)、β-轉(zhuǎn)角 (β-turn)、β-折疊 (β-sheet)、延伸鏈(Extended chain)、無規(guī)卷曲 (Random coil) 和各種基序 (Motif) 等[10]。
使用在線工具SOPMA (https://npsa-prabi. ibcp.fr/cgi-bin/secpred_sopma.pl) 對IGF1R蛋白二級結(jié)構(gòu)進行預測,預測結(jié)果如圖6所示。
分析結(jié)果顯示:在IGF1R蛋白二級結(jié)構(gòu)中,無規(guī)卷曲 (Random coil) 占據(jù)比例最高,約為41.7%,α-螺旋 (α-helix) 其次,占比約為26.55%,β-折疊 (β-sheet) 和延伸鏈 (Extended chain) 分別占23.34%和8.41%。
2.6IGF1R蛋白三級結(jié)構(gòu)域預測
運用SWISS-MODEL中的Automated mode(自動模型) 對IGF1R氨基酸序列建模,得到其三級結(jié)構(gòu)如圖7 (左) 所示,IGF1R三維結(jié)構(gòu)模型與模板序列相似度為61%,序列的覆蓋率為0.28,這符合建模要求。用AutoDock編輯通過SWISS-MODEL預測得到的三維結(jié)構(gòu)空間填充模型如圖7 (右) 所示。運用Ramachandran Plot[11]對模型進行評估,結(jié)果見圖8,其中83.85%的氨基酸位于完全允許區(qū),11.34%的氨基酸位于額外允許區(qū),3.44%的氨基酸位于大致允許區(qū),1.37%的氨基酸位于區(qū)域之外,說明預測所得結(jié)構(gòu)是可靠的。
圖6 IGF1R蛋白二級結(jié)構(gòu)預測分析Fig. 6 The analysis and prediction of IGF1R secondary structure.
圖7 Swiss-Model模擬IGF1R三級結(jié)構(gòu) (左) IGF1R空間填充模型 (右)Fig. 7 The simulated 3D-structure (Left) and spacefilling model of IGF1R (Right) from Swiss-Model.
圖8 IGF1R三級結(jié)構(gòu)可靠性分析Fig. 8 The reliability analysis of IGF1R 3D-structure.
2.7IGF1R蛋白與IGF1蛋白分子對接模擬
IGF1R作為受體分子為胰島素樣生長因子1 (IGF1) 的高親和配體,其可加強細胞存活率而抑制凋亡,它們形成的復合體常參與生理學和病理學上的多個過程[12],因此可以通過分子對接來研究IGF1R和IGF1兩種蛋白間的相互作用。
NCBI找到人IGF1 NP-001104754.1的蛋白序列,通過Blast序列比對,在PDB數(shù)據(jù)庫中找到與目的蛋白IGF1相似度最大0.97,且序列覆蓋率最高0.36的已知三維結(jié)構(gòu)的序列作為模板對IGF1進行三維建模 (圖9)。
將所得IGF1R和IGF1的蛋白三維結(jié)構(gòu)通過AutoDock模擬分子對接,如圖10所示。兩種蛋白的氨基酸相互穿插,圖11顯示IGF1與IGF1R相互作用的氨基酸位點,包括ARG1095,ARG1092,GLU1099,ARG1177,TRP1203,THR1207,ALA1209,GLU1210,GLN1211,PRO1212,TYR1213,GLN1214,GLY1215,LEU1216,VAL1221,PHE1224,LEU1231,ASP1232。IGF1通過以上氨基酸與其受體IGF1R結(jié)合在一起相互作用,激活信號通路PI3K及MAPK,調(diào)控細胞的增殖,分化和凋亡[13]。因此,通過分子對接模擬了解其結(jié)合氨基酸位點,為進一步通過定點突變等方法干擾IGF1R與IGF1的結(jié)合而阻斷其在信號通路的作用提供參考。
圖9 Swiss-Model模擬IGF1三級結(jié)構(gòu) (左) IGF1空間填充模型 (右)Fig. 9 The simulated 3D-structure (Left) and space-filling model of IGF1 (Right) from Swiss-Model.
圖10 IGF1R/IGF1相互作用位點Fig. 10 The interaction sites of IGF1R and IGF1.
圖11 IGF1R/IGF1 相互作用氨基酸位點Fig. 11 The amino acid sites of interaction between IGF1R and IGF1.
IGF1R家族是重要的酪氨酸激酶受體家族成員之一,目前認為它在腫瘤細胞中的超表達與腫瘤的形成和腫瘤對藥物抗性的獲得密切相關(guān)[14-15]。研究表明,超過50%的乳腺癌會表達活化形式的IGF1R,且IGF1R的表達與乳腺癌的亞型和治療獲得耐藥性有關(guān)[16],同時2型糖尿病乳腺癌患者的IGF1R表達量明顯高于只有乳腺癌的患者[17];在非小細胞肺癌中,IGF1R的表達對癌患者的無病生存期是一個不利因素,IGF1R的表達與患者的吸煙狀態(tài)和腫瘤大小有關(guān)[18]。
膠質(zhì)瘤是常見的原發(fā)性腦瘤,占大腦惡性腫瘤的80%。兒童神經(jīng)膠質(zhì)瘤存活率低于40%,是威脅兒童健康的一大惡性腫瘤。IGFIR的3′UTR相對其他基因要長很多,分析顯示其3′UTR區(qū)有多種miRNAs的結(jié)合位點,眾所周知,miRNA在腫瘤的發(fā)生發(fā)展中起著重要的作用。根據(jù)美國費城兒童醫(yī)院的研究數(shù)據(jù),在96個原癌基因中,IGF1R的3′UTR與多種miRNA結(jié)合位點的突變頻率最高,進一步證明IGF1R基因高表達是兒童神經(jīng)膠質(zhì)瘤形成的一個重要原因,因此可以尋找高效的GF1R小分子抑制劑和開發(fā)反義RNA來抑制IGF1R基因的表達來治療該類疾病。
IGF1R能激活MAPK和PI3K/AKT信號通路,而AKT (蛋白激酶B) 對細胞增殖、凋亡和細胞周期都起調(diào)控作用[19]。作為IGF1R配體的IGF1,可促進肝癌細胞的生長、增殖及侵襲[20]。IGF1可促進其受體IGF1R的磷酸化,并與之結(jié)合激活MAPK及PI3K/ATK信號通路,諸多研究表明這兩條信號通路與癌癥的發(fā)生發(fā)展相關(guān)。而IGF1/IGF1R的結(jié)合可激活這兩條通路,通過體外模擬兩種蛋白的結(jié)合,可知道其氨基酸結(jié)合位點,為進一步通過實驗對結(jié)合位點的氨基酸進行定點突變或敲低其表達,達到降低或阻斷MAPK及PI3K/AKT信號通路提供參考數(shù)據(jù)。
對IGF1R的各種生物學性質(zhì)分析,是為更好的在試驗中的操作提供理論基礎(chǔ)。本文的大多結(jié)果是來源于軟件預測,故結(jié)果的可信度有待實驗進一步驗證。
REFERENCES
[1] Zhou Q, Zhang JX, Cui QY, et al. GSK1904529A, an insulin-like growth factor-1 receptor inhibitor, inhibits glioma tumor growth, induces apoptosis and inhibits migration. Mol Med Rep, 2015, 12(3): 3381–3385, doi: 10.3892/mmr.2015.3869.
[2] Huang H, Chen Q, Ku X, et al. A series of α-heterocyclic carboxaldehyde thiosemicarbazones inhibit topoisomerase IIα catalytic activity. J Med Chem, 2010, 53(8): 3048–3064.
[3] Agarwal V, Bell GW, Nam JW, et al. Predicting effective microRNA target sites in mammalian mRNAs. eLife, 2015, 4: e05005.
[4] Madhusudhan MS, Marti-Renom MA, Eswar N, et al. Comparative protein structure modeling//Walker JM, ed. The Proteomics Protocols Handbook. Totowa, New Jersey: Humana Press, 2005: 831–860.
[5] Gupta R, Jung E, Brunak S. Predicition of N-glycosylation Sites in Human Proteins. New Jersey: Wiley, 2005: 163–192.
[6] Blom N, Gammeltoft S, Brunak S. Sequence and structure-based prediction of eukaryotic protein phosphorylation sites. J Mol Biol, 1999, 294(5): 1351–1362.
[7] Geourjon C, Deléage G. SOPMA: significantimprovements in protein secondary structure prediction by consensus prediction from multiple alignments. Comput Appl Biosci, 1995, 11(6): 681–684.
[8] Schwede T, Kopp J, Guex N, et al. SWISS-MODEL: an automated protein homology-modeling server. Nucleic Acids Res, 2003, 31(13): 3381–3385.
[9] Trott O, Olson AJ. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. J Comput Chem, 2010, 31(2): 455–461.
[10] Liu BY, Nie SH, Du QY, et al. The effects of insulin-like growth factor 1 on glucose metabolism. Chin J Diab, 1999, 7(4): 195–197 (in Chinese).劉寶英, 聶尚海, 杜清友, 等. 重組人胰島素樣生長因子1的促糖代謝作用研究. 中國糖尿病雜志, 1999, 7(4): 195–197.
[11] Gopalakrishnan K, Sowmiya G, Sheik SS, et al. Ramachandran plot on the web (2.0). Prot Pept Lett, 2007, 14(7): 669–671.
[12] Romaniuk D, Kimsa MW, Strzalka-Mrozik B, et al. Gene expression of IGF1, IGF1R, and IGFBP3 in epiretinal membranes of patients with proliferative diabetic retinopathy: preliminary study. Med Inflamm, 2013, 2013: Article ID 986217.
[13] Suman S, Kallakury BVS, Fornace Jr AJ, et al. Protracted upregulation of leptin and IGF1 is associated with activation of PI3K/Akt and JAK2 pathway in mouse intestine after ionizing radiation exposure. Int J Biol Sci, 2015, 11(3): 274–283.
[14] Osborne CK, Bolan G, Monaco ME, et al. Hormone responsive human breast cancer in long-term tissue culture: effect of insulin. Proc Nat Acad Sci USA, 1976, 73(12): 4536–4540.
[15] Pollak M. The insulin and insulin-like growth factor receptor family in neoplasia: an update. Nat Rev Cancer, 2012, 12(3): 159–169.
[16] Farabaugh SM, Boone DN, Lee AV. Role of IGF1R in breast cancer subtypes, stemness, and lineage differentiation. Front Endocrinol, 2015, 6: 59.
[17] Xin C, Jing D, Jie T, et al. The expression difference of insulin-like growth factor 1 receptor in breast cancers with or without diabetes. J Cancer Res Ther, 2015, 11(2): 295–299.
[18] Zhao S, Qiu ZX, He JL, et al. Insulin-like growth factor receptor 1 (IGF1R) expression and survival in non-small cell lung cancer patients: a meta-analysis. Int J Clin Exp Pathol, 2014, 7(10): 6694–6704.
[19] Liao YD, Zhou C, Zhao JP, et al. Expression and significance of IGF1, IGF1R and AKT, the components of IGF signaling pathway, in primary adenocarcinoma of the lung. J Pract Oncol, 2006, 21(1): 15–19 (in Chinese).廖永德, 周晟, 趙金平, 等. IGF信號通路關(guān)鍵蛋白IGF1、IGF1R和AKT在原發(fā)性肺腺癌中的表達及意義. 實用腫瘤雜志, 2006, 21(1): 15–19.
[20] E CY. The effects and mechanisms of IGF-1and inhibitor PPP on the growth and invasion of HCC[D]. Changchun: Jilin University, 2013 (in Chinese).鄂長勇. 類胰島素生長因子IGF-1及其受體抑制劑PPP對肝細胞肝癌生長和侵襲作用的影響及其機制研究[D]. 長春: 吉林大學, 2013.
(本文責編 陳宏宇)
Bioinformatics analysis of sequence and structure of insulin-like growth factor-I receptor
Xiuying Mai, Ping Li, and Liu Xu
School of Life Science and Engineering, Southwest Jiaotong University, Chengdu 610031, Sichuan, China
Abstract:The length of IGF1R 3’UTR is greater than 7 kb. The structure of IGF1R 3’UTR is complex, with multiple binding sites of miRNAs. IGF1R is involved in the regulation of MAPK and PI3K/AKT signaling pathways and the formation and development of tumors. Bioinformatics analysis can reveal the structure features of IGF1R, which provides ideas for further research. The analysis shows that the binding sites between IGF1R and miRNAs have the highest mutationrate in Neuroblastoma. We analyzed the structure of 3'UTR, miRNAs binding sites, physical and chemical properties, hydrophilic-hydrophobic property, glycosylation and phosphorylation sites, secondary structure and tertiary structure modeling of IGF1R. The locations and names of amino acids interacting in IGF1R and IGF1 were obtained by molecular docking. Therefore, if IGF1R 3'UTR is mutated, the capacity of IGF1R combined with miRNAs will reduce and the IGF1R expression will be up-regulated, and the function of miRNAs will be repressed. We can change the sites of IGF1R to combine with IGF1 to repress the function of IGF1R and IGF1. Then the function of IGF1R will be repressed.
Keywords:insulin-like growth factor-I receptor (IGF1R), sequence analysis, 3D-struture modeling, molecular docking
Corresponding author:Liu Xu. Tel: +86-28-85412805; E-mail: zxuliu@163.com