王淮 楊健康
摘要:目的 ?利用生物信息學(xué)方法對(duì)F13A1及其編碼蛋白質(zhì)進(jìn)行分析,為F13A1的實(shí)驗(yàn)研究提供理論基礎(chǔ)和新線索。方法 ?從UCSC(http://genome.ucsc.edu/index.html)數(shù)據(jù)庫(kù)檢索“F13A1”,下載F13A1蛋白序列,截取轉(zhuǎn)錄起始點(diǎn)上游2000 bp堿基序列作為啟動(dòng)子區(qū)域進(jìn)行分析,分析F13A1編碼蛋白的理化性質(zhì)、亞細(xì)胞定位、信號(hào)肽和跨膜區(qū)域、蛋白質(zhì)結(jié)構(gòu)、相互作用網(wǎng)絡(luò)及GO注釋。結(jié)果 ?F13A1包含多個(gè)啟動(dòng)區(qū)域,不存在CpG島,但存在SRF、Sp1和AP-1等轉(zhuǎn)錄因子結(jié)合位點(diǎn)。F13A1編碼蛋白是由732個(gè)氨基酸組成的無(wú)信號(hào)肽、無(wú)跨膜區(qū)域的親水蛋白,其主要定位于細(xì)胞核,二級(jí)結(jié)構(gòu)以隨機(jī)卷曲為主。另外蛋白F13B、FGA、FGG、F2、FGB、FN1、SERPINF2、VWF、VEGFA、F5可能與F13A1存在相互作用。結(jié)論 ?F13A1基因存在多個(gè)啟動(dòng)子區(qū)域,擁有多個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn);F13A1蛋白與F13B、FGA、FGG、F2等多個(gè)蛋白質(zhì)相互作用,其參與組成內(nèi)質(zhì)網(wǎng)腔、血小板α顆粒內(nèi)腔以及細(xì)胞內(nèi)細(xì)胞器腔等多種細(xì)胞成分,同時(shí)在血液凝固、纖維蛋白溶解和血小板活化等多種生理過(guò)程發(fā)揮重要作用。
關(guān)鍵詞:F13A1;啟動(dòng)子;蛋白質(zhì);生物信息學(xué)
中圖分類號(hào):R394.3 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2020.11.017
文章編號(hào):1006-1959(2020)11-0052-06
Abstract:Objective ?To analyze F13A1 and its encoded protein using bioinformatics methods, and provide theoretical basis and new clues for the experimental study of F13A1. Methods ?Search "F13A1" from the UCSC (http://genome.ucsc.edu/index.html) database, download the F13A1 protein sequence, and intercept the 2000 bp base sequence upstream of the transcription start point as a promoter region for analysis,the physicochemical properties, subcellular localization, signal peptide and transmembrane region, protein structure, interaction network and GO annotation of F13A1 encoded protein were analyzed.Results ?F13A1 contains multiple promoter regions, there is no CpG island, but there are transcription factor binding sites such as SRF, Sp1 and AP-1. The protein encoded by F13A1 is a hydrophilic protein composed of 732 amino acids with no signal peptide and no transmembrane region. It is mainly located in the nucleus, and the secondary structure is dominated by random coils. In addition, proteins F13B, FGA, FGG, F2, FGB, FN1, SERPINF2, VWF, VEGFA, F5 may interact with F13A1.Conclusion ?The F13A1 gene has multiple promoter regions with multiple transcription factor binding sites; the F13A1 protein interacts with multiple proteins such as F13B, FGA, FGG, and F2, and is involved in the formation of the endoplasmic reticulum cavity, platelet αparticle cavity, and cells Various cellular components such as the inner organelle cavity play an important role in various physiological processes such as blood coagulation, fibrinolysis and platelet activation.
Key words:F13A1;Promoter;Protein;Bioinformatics
人凝血因子XⅢ(CoagulationFactor XⅢ,F(xiàn)XⅢ)又稱纖維蛋白穩(wěn)定因子,主要功能是共價(jià)交聯(lián)纖維蛋白纖維,穩(wěn)定纖維蛋白凝塊[1]。F13A1基因編碼人凝血因子XⅢ的A鏈。遺傳性凝血因子XⅢ純合或復(fù)合雜合缺乏癥是一種罕見的嚴(yán)重出血性疾病,2016年Thomas A等[2]首次報(bào)道1例覆蓋整個(gè)外顯子12的新的純合子F13A1缺失的病例,通過(guò)實(shí)驗(yàn)確定是由內(nèi)含子11和內(nèi)含子12的6 bp微同源序列引起。研究表明[3],F(xiàn)13A1具有上調(diào)血漿IL-6水平的功能,在痤瘡發(fā)病過(guò)程中扮演重要角色;F13A1基因變異與血漿FXⅢA水平對(duì)急性心肌梗死的長(zhǎng)期預(yù)后具有顯著的作用[4]。本文通過(guò)生物信息學(xué)的方法對(duì)F13A1基因及其編碼蛋白質(zhì)進(jìn)行一系列預(yù)測(cè)分析,期望能為今后的研究提供線索及方向。
1材料與方法
1.1資料來(lái)源 ?F13A1基因及編碼蛋白的序列獲取登錄UCSC(http://genome.ucsc.edu/index.html)數(shù)據(jù)庫(kù),在GeneSorter中檢索“F13A1”,截取轉(zhuǎn)錄起始點(diǎn)上游2000 bp[5]堿基序列作為啟動(dòng)子區(qū)域進(jìn)行分析,同時(shí)下載F13A1蛋白序列。
1.2方法 ?本文運(yùn)用到的分析軟件見表1,所有軟件都應(yīng)用默認(rèn)參數(shù)分析F13A1編碼蛋白的理化性質(zhì)、亞細(xì)胞定位、信號(hào)肽和跨膜區(qū)域、蛋白質(zhì)結(jié)構(gòu)、相互作用網(wǎng)絡(luò)及GO注釋。
2結(jié)果
2.1 F13A1基因特征 ?人F13A1基因總長(zhǎng)為176750 bp,在染色體上的位置是chr6:6144085-6320834,包含15個(gè)外顯子和14個(gè)內(nèi)含子,該基因編碼的蛋白質(zhì)包含732個(gè)氨基酸殘基。
2.2 F13A1基因啟動(dòng)子分析 ?Promoter2.0分析結(jié)果顯示,F(xiàn)13A1基因上游存在3個(gè)啟動(dòng)子區(qū)域,分別位于200 bp,800 bp和1900 bp處,均為臨界性預(yù)測(cè)。NNPP分析結(jié)果顯示,F(xiàn)13A1基因上游存在5個(gè)啟動(dòng)子區(qū)域,見表2。推測(cè)F13A1基因至少包含3個(gè)啟動(dòng)子區(qū)域,其中以1585~1635 bp,420~470 bp和1785~1635 bp可能性最大。
2.3 F13A1基因CpG島預(yù)測(cè) ?在觀察值/預(yù)期值>0.6,G%+C%>50%,長(zhǎng)度>100 bp條件下,運(yùn)用在線軟件Cpgplot和MethPrime對(duì)F13A1基因進(jìn)行CpG島預(yù)測(cè),均未發(fā)現(xiàn)甲基化島,推測(cè)F13A1基因啟動(dòng)子區(qū)域不包含CpG島,見圖1、圖2。
2.4 F13A1基因轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè) ?AliBaba2.1的預(yù)測(cè)結(jié)果共有255個(gè),主要包含Sp1、Ap-1、SRF、NF-1、USF等。Cister預(yù)測(cè)F13A1基因共有27個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn),表3為概率最大的前5個(gè)。推測(cè)F13A1基因轉(zhuǎn)錄因子結(jié)合位點(diǎn)至少包含SRF、Sp1和AP-1,此為兩個(gè)軟件的共同預(yù)測(cè)結(jié)果,相對(duì)可靠。
2.5 F13A1蛋白質(zhì)的理化性質(zhì)分析 ?ProtParam分析結(jié)果顯示,人F13A1蛋白質(zhì)共有732個(gè)氨基酸殘基,分子質(zhì)量為83267.30 Da,理論等電點(diǎn)值為5.75,屬酸性蛋白質(zhì)。分子式為C3711H5743N1015O1110S29,原子總數(shù)為11608。在732個(gè)氨基酸殘基中帶負(fù)電荷的氨基酸殘基(Asp+Glu)的數(shù)量為95,帶正電荷的氨基酸殘基(Arg+Lys)的數(shù)量為83。F13A1蛋白質(zhì)的不穩(wěn)定系數(shù)為37.30,屬于穩(wěn)定蛋白質(zhì),脂肪系數(shù)為79.00,總的平均親水性為-0.391,屬于親水性蛋白。Protscale分析結(jié)果顯示,位于201位的谷氨酸(E)親水性最強(qiáng),分值為-3.411;位于631位的脯氨酸(P)疏水性最強(qiáng),分值為2.244??芍狥13A1蛋白的疏水區(qū)域少于親水區(qū)域,屬于親水蛋白,該結(jié)果與ProtParam結(jié)果一致,可信性高,見圖3。
2.6 F13A1蛋白的亞細(xì)胞定位、信號(hào)肽和跨膜結(jié)構(gòu)域預(yù)測(cè) ?PSORTII對(duì)F13A1蛋白的亞細(xì)胞定位的預(yù)測(cè)結(jié)果顯示,位于細(xì)胞核的可能性為34.8%,位于線粒體的可能性為26.1%,位于細(xì)胞質(zhì)的可能性為26.1%,位于分泌系統(tǒng)囊泡的可能性為13.0%。SignalP4.1的預(yù)測(cè)結(jié)果顯示,C、Y、S的最大值分別為0.109、0.108、0.125,S-mean的值為0.107,D值為0.108,可知F13A1蛋白不存在剪切位點(diǎn),不是分泌蛋白,見圖4。TMHMM預(yù)測(cè)F13A1蛋白的跨膜區(qū)域結(jié)果顯示,該蛋白不存在跨膜區(qū)域,不屬于膜蛋白,見圖5。
2.7 F13A1蛋白二級(jí)結(jié)構(gòu)與三級(jí)結(jié)構(gòu)預(yù)測(cè) ?SMOPA預(yù)測(cè)F13A1蛋白質(zhì)的二級(jí)結(jié)構(gòu)結(jié)果顯示,隨機(jī)卷曲共有358個(gè),占48.91%;延伸鏈共有204個(gè),占27.87%;α螺旋共有131個(gè),占17.90%;β轉(zhuǎn)角有39個(gè),占5.33%。其中大部分氨基酸處于隨機(jī)卷曲狀態(tài),F(xiàn)13A1蛋白整體處于比較松散的狀態(tài),見圖6。
蛋白質(zhì)的高級(jí)結(jié)構(gòu)決定其生理功能,采用同源建模法預(yù)測(cè)蛋白質(zhì)的三級(jí)結(jié)構(gòu),將F13A1蛋白序列提交至SWISS-MODEL,得到其高級(jí)結(jié)構(gòu)見圖7。其中預(yù)測(cè)模型A采用的模板為1f13.1.A,覆蓋率為100%,序列相似度為63%;預(yù)模型B采用的模板為3ohx.1.B,覆蓋率為15%,序列相似度為26%;預(yù)測(cè)模型C采用的模板為2ice.1.aA,覆蓋率為9%,序列相似度為30%。綜合比較,預(yù)測(cè)模型A的可信度最高
為驗(yàn)證模型A的可信度,通過(guò)蛋白質(zhì)拉曼圖在線分析軟件SAVES v5.0對(duì)預(yù)測(cè)模型的氨基酸的二面角進(jìn)行分析,判斷預(yù)測(cè)模型的可靠性,得到結(jié)果見圖8。預(yù)測(cè)結(jié)構(gòu)中所涉及的1279個(gè)氨基酸,其中1149個(gè)處于最佳區(qū)域,即紅色區(qū)域;126個(gè)處于允許區(qū)域,即黃色區(qū)域;另有4個(gè)處于允許區(qū)域范圍之外,說(shuō)明該預(yù)測(cè)模型中幾乎所有的氨基酸均形成合理的二面角,構(gòu)成的蛋白質(zhì)高級(jí)結(jié)構(gòu)穩(wěn)定可信。