任晨霞,麻麗霞,郭 萍,郭 穎,曹文君
(長治醫(yī)學院山西省高等學校血脂代謝與血液病重點實驗室,山西 長治 046000)
?
生物信息學分析人C型凝集素16 A的結構與功能
任晨霞,麻麗霞,郭萍,郭穎,曹文君*
(長治醫(yī)學院山西省高等學校血脂代謝與血液病重點實驗室,山西 長治 046000)
摘要:C型凝集素16 A基因(C-type lectin domain family 16A, Clec16a)是糖尿病、多發(fā)性硬化病等自身免疫性疾病的易感基因,但針對該基因功能的研究報道很少.通過生物信息學相關數(shù)據(jù)庫和在線軟件對CLEC16A蛋白分子的理化性質(zhì),亞細胞定位,跨膜區(qū)和信號肽,二級結構,結構域,磷酸化、泛素化、糖基化等蛋白翻譯后修飾,以及蛋白相互作用網(wǎng)絡等進行分析.結果表明,人Clec16a基因的共識編碼序列為1053個氨基酸組成的多肽,是酸性不穩(wěn)定的親水蛋白,無跨膜區(qū)和信號肽,定位于多個亞細胞結構,其主要二級結構元件為α螺旋和隨機卷曲,無已知的功能性結構域,存在磷酸化、泛素化、糖基化修飾位點.為深入研究CLEC16A功能及其參與的疾病分子機制提供一定的參考.
關鍵詞:C型凝集素16A;生物信息學;結構;功能
C型凝集素(C-type lectin)是依賴于鈣離子識別碳水化合物配體的蛋白家族,參與質(zhì)膜糖蛋白的更新、細胞間粘附及天然免疫的抗原識別等功能[1].C型凝集素域家族16的成員A(C-type lectin domain family 16, member A, Clec16a)基因內(nèi)含子的單核苷酸多態(tài)性與糖尿病[2]、多發(fā)性硬化病[3,4]、腎上腺功能障礙[5]、自身免疫性甲狀腺疾病[6]和類風濕性關節(jié)炎[7]等疾病密切相關.雖然已知Clec16a是上述疾病的易感基因,其在B-淋巴細胞、自然殺傷細胞和樹突細胞中高表達[4],但其在哺乳動物細胞中的功能尚未明確闡述.
目前,研究的比較清楚的是CLEC16A調(diào)控糖尿病線粒體自噬過程[8]以及調(diào)控白細胞抗原II(Human leukocyte antigen class II, HLA-II))信號通路[9]的功能.CLEC16A參與自噬體與溶酶體的融合過程,CLEC16A可以穩(wěn)定線粒體自噬關鍵調(diào)控蛋白NRDP1(Neuregulin receptor degradation protein 1),防止其被蛋白酶體降解.含有Clec16a致糖尿病SNPs位點病人的胰島細胞中,Clec16a表達量下降,分泌的胰島素減少,敲除小鼠胰島的Clec16a基因會引起線粒體中耗氧量和ATP濃度的降低.胰腺十二指腸同源框蛋白PDX1(Pancreatic and duodenal homeobox 1)作為轉(zhuǎn)錄因子調(diào)控胰腺細胞CLEC16A的表達量促進線粒體自噬的功能[10].HLA-II在內(nèi)質(zhì)網(wǎng)合成后,被運輸?shù)胶笃趦?nèi)涵體中,后期內(nèi)涵體轉(zhuǎn)移至核周區(qū)域成熟并被酸化激活蛋白水解酶,后者為HLA-II加載抗原呈遞所必需的多肽,HLA-II才能被正確定位于細胞膜上發(fā)揮作用.RNA干擾CLEC16A的表達后,后期內(nèi)涵體無法正常成熟,導致HLA-II在胞漿中積累和在細胞膜上的減少.這與果蠅的CLEC16A同源蛋白Ema參與內(nèi)涵體成熟的功能是一致的[11].Clec16a基因突變的致病機理以及CLEC16A蛋白參與的具體信號通路仍是未知的.
總之,深入研究Clec16a的功能,為了解糖尿病等自身免疫疾病的發(fā)病機制提供重要的線索,也為其作為新的治療靶點提供依據(jù).本文采用生物信息學方法預測與分析CLEC16A蛋白的結構與功能,為進一步實驗研究該蛋白的分子功能提供一定的參考.
1材料和方法
1.1材料
CLEC16A的氨基酸序列來源于NCBI的GenBank數(shù)據(jù)庫和Uniprot數(shù)據(jù)庫.
1.2方法
采用Expasy數(shù)據(jù)庫(Expert Protein Analysis System)的ProtParam Tool分析工具,對CLEC16A蛋白進行理化性質(zhì)分析, PrortScale Tool分析工具對CLEC16A蛋白進行親水性分析;采用SPORTⅡ軟件預測CLEC16A的亞細胞定位;分別采用SignalP 4.0 和TMHMM 2.0軟件分析預測CLEC16A的信號肽和跨膜區(qū)域; SOPMA工具分析CLEC16A的二級結構,通過NCBI的Conserved Domain數(shù)據(jù)庫分析CLEC16A的結構域;分別通過 NetPhosK 1.0和 PhosphoSitePlus分析CLEC16A的翻譯后修飾情況;通過STRING數(shù)據(jù)庫,構建CLEC16A蛋白的相互作用網(wǎng)絡.
2結果
2.1CLEC16A的理化性質(zhì)分析
Clec16a基因含有24個外顯子,編碼產(chǎn)物NP_056041.1為該基因的蛋白質(zhì)共識編碼序列,含有1053個氨基酸.通過蛋白質(zhì)在線分析工具ExPASy中的ProtParam分析得到凝集素16A蛋白分子式為C5200H8243N1419O1600S46,分子量為117714.9 Da,亮氨酸,絲氨酸和谷氨酸含量較豐富,分別占11.2 %,9.3 %和7.0 %.CLEC16A分子的理論等電點為5.54,屬酸性蛋白.在哺乳動物網(wǎng)織紅細胞內(nèi)的半衰期是30 h,不穩(wěn)定系數(shù)為 56.14,大于40分類為不穩(wěn)定蛋白質(zhì).脂肪系數(shù)為89.44,總的平均親水性為-0.263,ExPASy中的PrortScale預測CLEC16A親水性最強的位點是第245位的精氨酸,分值為-3.389;疏水性最強的位點是502和503位的亮氨酸和半胱氨酸,分值都是2.800.CLEC16A的整個氨基酸序列中親水區(qū)域多于疏水區(qū)域(圖1),因此屬于親水蛋白.
圖1 CLEC16A的親/疏水性分析
2.2CLEC16A的亞細胞定位、跨膜結構域與信號肽分析
PSORT通過蛋白的N端定位信號序列、氨基酸組成和排列順序以及含有的蛋白結構模體等綜合判斷預測,CLEC16A有34.8 %的可能性定位于細胞核,定位于線粒體、高爾基體、細胞漿、分泌系統(tǒng)囊泡、細胞骨架和細胞外的可能性分別為21.7 %、13.0 %、8.7 %、8.7 %、4.3 %、4.3 %和4.3 %,說明該蛋白存在于細胞核和線粒體的可能性比較大,也可能在細胞的各個亞細胞結構中是動態(tài)存在的.
使用在線工具 TMHMM Server v. 2.0 預測分析如圖 2所示,CLEC16A不存在跨膜結構域.通過 SignalP 4.1 在線工具對CLEC16A的信號肽進行分析,結果如圖 3 所示.原始剪切位點C 值最大切割點在第62位氨基酸,分值為 0.112;被結合的剪切點Y 值最高在第22位氨基酸,為 0.114;信號肽分值最大在第 13個氨基酸位置,分值為 0.153.綜合推斷CLEC16A無信號肽區(qū)域(圖3).
圖2 CLEC16A跨膜結構域分析
圖 3 CLEC16A的信號肽分析
2.3CLEC16A的二級結構與結構域分析
用在線軟件SOPMA對CLEC16A的二級結構分析,其結構中α螺旋結構占37.23 %,無規(guī)卷曲占36.66 %,延伸鏈占18.71 %,β轉(zhuǎn)角占7.41%(圖4);α螺旋和無規(guī)卷曲是主要二級結構.
NCBI的Conserved Domain數(shù)據(jù)庫預測CLEC16A的保守結構域,結果見圖5.CLEC16A屬于PFL蛋白超家族,在N端含有大約150個氨基酸殘基的保守序列,是功能未知的保守蛋白質(zhì)家族.
圖4 CLEC16A的二級結構預測
圖5 CLEC16A功能結構域分析
2.4CLEC16A轉(zhuǎn)錄后修飾分析
分別采用 NetPhosK 1. 0 和 PhosphoSitePlus 分析CLEC16A蛋白的磷酸化修飾位點,兩種方法同時預測的位點有: Ser7、Ser863、Ser982.泛素化修飾位點為第445位的賴氨酸.NetNGlyc 1.0在線預測到第36、64、107、155、459、771、956位天冬酰胺可被糖基化修飾(圖6).
圖6 CLEC16A糖基化位點分析
2.5CLEC16A蛋白質(zhì)相互作用分析
利用 STRING數(shù)據(jù)庫搜索CLEC16A的相互作用蛋白,所構建相互作用網(wǎng)絡如圖7,成分主要有白介素2受體(interleukin 2 receptor alpha, IL2RA)、泛素蛋白C(ubiquitin C, UBC)、蛋白質(zhì)酪氨酸磷酸酶22(protein tyrosine phosphatase, PTPN22)、類蘇氨酸合酶2(threonine synthase-like 2, THNSL2)和表皮生長因子樣結構域特定的O-GlcNAc糖基轉(zhuǎn)移酶(EGF domain-specific O-linked N-acetylglucosamine (GlcNAc) transferase, EOGT).
圖7 CLEC16A蛋白相互作用網(wǎng)絡
3討論
最先開始對Clec16a研究是全基因組測序發(fā)現(xiàn)Clec16a的單核苷酸多態(tài)性與糖尿病和多發(fā)性硬化病密切相關[12,13],隨后開啟了對該基因的研究.到目前為止,大部分研究聚焦于CLEC16A突變與疾病的相關性上,但該分子仍被歸類于功能未知的基因.CLEC16A屬于C型凝集素蛋白家族成員,典型的C型凝集素結含長約120個氨基酸的糖類識別功能結構域(Carbohydrate recognition domain,CRD).本文通過蛋白結構分析發(fā)現(xiàn),不同物種的CLEC16A含有進化保守的N端序列,預測屬于功能未知的PFL結構域,但是并無可識別CRD結構域序列,說明Clec16a基因的名字是有爭議的,并不是經(jīng)典的C型凝集素蛋白,可能具有更多新的功能.Clec16a基因致病作用最強的SNPs出現(xiàn)在非編碼區(qū)[14],其中的具體機制仍是未知的.
磷酸化和糖基化修飾是蛋白質(zhì)功能調(diào)節(jié)的主要途徑,本文預測到CLEC16A存在多個磷酸化位點和糖基化位點并預測到CLEC16A與磷酸酶PTPN22和糖基轉(zhuǎn)移酶EOGT相互作用,這些分子調(diào)控方式及其具體作用需要進一步驗證和探索.此外,泛素化修飾可介導蛋白質(zhì)特異性降解,影響蛋白質(zhì)的細胞定位和活性.本文分析發(fā)現(xiàn)CLEC16A蛋白存在多個潛在的泛素化位點,相互作用網(wǎng)絡中含有泛素蛋白C,提示CLEC16A通過泛素化修飾調(diào)節(jié)其活性形式和蛋白量.
CLEC16A蛋白質(zhì)相互作用網(wǎng)絡成員包括白介素2受體IL2RA,IL-2對T細胞免疫記憶和機體對自體與非自體物質(zhì)的識別中起重要作用,在多發(fā)性硬化病的T細胞免疫中起重要作用.IL2RA與CLEC16A都是多發(fā)性硬化病的易感基因[15,16], IL2RA單克隆抗體賽尼哌(Daclizumab)可明顯減輕多發(fā)性硬化病的癥狀[17],預示針對CLEC16A的新治療手段值得我們開發(fā).
此外,高等動物和低等動物,動物和植物中均含有CLEC16A同源蛋白,說明該分子在進化過程中高度保守,參與的生化過程也應是真核生物所共有的保守過程.Soleimanpour等人研究證實,CLEC16A參與調(diào)控線粒體自噬過程,該過程正是一個真核細胞共有的保守功能[8].
總之,本研究為今后更進一步揭示CLEC16A的功能與其作為治療靶點提供一定的理論依據(jù).
參考文獻:
[1]Davison L J, Wallace C,Cooper J D, et al. Long-range DNA looping and gene expression analyses identify DEXI as an autoimmune disease candidate gene[J]. Hum Mol Genet,2012,(2):322-333.
[2]Sang Y,Zong W, Yan J,et al. The correlation between the CLEC16A gene and genetic susceptibility to type 1 diabetes in Chinese children[J]. Int J Endocrinol,2012,(4):245384.
[3]Zoledziewska M, Costa G, Pitzalis M,et al. Variation within the CLEC16A gene shows consistent disease association with both multiple sclerosis and type 1 diabetes in Sardinia[J]. Genes Immun,2009,(1):15-17.
[4]International Multiple Sclerosis Genetics Consortium (IMSGC),Beecham A H,Patsopoulos N A,et al. Analysis of immune-related loci identifies 48 new susceptibility variants for multiple sclerosis[J]. Nat Genet,2013,(11):1353-1360.
[5]Skinningsrud B,Husebye E S,Pearce S H,et al. Polymorphisms in CLEC16A and CIITA at 16p13 are associated with primary adrenal insufficiency[J]. J Clin Endocrinol Metab,2008,(9):3310-3317.
[6]Muhali F S,Cai T T,Zhu J L,et al. Polymorphisms of CLEC16A region and autoimmune thyroid diseases[J]. Genes Genomes Genetics,2014,(6):973-977.
[7]Skinningsrud B,Lie B A,Husebye E S,et al. A CLEC16A variant confers risk for juvenile idiopathic arthritis and anti-cyclic citrullinated peptide antibody negative rheumatoid arthritis[J]. Ann Rheum Dis,2010,(8):1471-1474.
[8]Soleimanpour S A,Gupta A, Bakay M,et al. The diabetes susceptibility gene Clec16a regulates mitophagy[J]. Cell,2014,(7):1577-1590.
[9]van Luijn M M,Kreft K L,Jongsma M L,et al. Multiple sclerosis-associated CLEC16A controls HLA class II expression via late endosome biogenesis[J]. Brain,2015,(6):1531-1547.
[10]Soleimanpour S A,Ferrari A M,Raum J C,et al. Diabetes Susceptibility Genes Pdx1 and Clec16a Function in a Pathway Regulating Mitophagy in β-Cells[J]. Diabetes,2015,(10):3475-3484.
[11]Kim S,Wairkar Y P,Daniels R W,et al. The novel endosomal membrane protein Ema interacts with the class C Vps-HOPS complex to promote endosomal maturation[J]. J Cell Biol,2010,(5):717-734.
[12]Hakonarson H,Grant S F,Bradfield J P,et al. A genome-wide association study identifies KIAA0350 as a type 1 diabetes gene[J].Nature,2007,(7153): 591-594.
[13]International Multiple Sclerosis Genetics Consortium (IMSGC). Risk alleles for multiple sclerosis identified by a genomewide study[J]. N Engl J Med,2007,(9): 851-862.
[14]Mero I L,Ban M,Lorentzen R,et al. Exploring the CLEC16A gene reveals a MS-associated variant with correlation to the relative expression of CLEC16A isoforms in thymus[J]. Genes Immun,2011,(3):191-198.
[15]Hartmann F J,Khademi M,Aram J,et al. Multiple sclerosis-associated IL2RA polymorphism controls GM-CSF production in human TH cells[J]. Nat Commun,2014,(5):5056.
[16]Traboulsee A L,Bernales C Q,Ross J P,et al. Genetic variants in IL2RA and IL7R affect multiple sclerosis disease risk and progression[J]. Neurogenetics,2014,(3):165-169.
[17]Wiendl H,Gross C C. Modulation of IL-2Rα with daclizumab for treatment of multiple sclerosis[J].Nat Rev Neurol,2013,(7):394-404.
(責任編校:晴川)
Bioinformatic Analysis of C-type Lectin Domain Family 16A REN Chenxia, MA Lixia, GUO Ping, GUO Ying, CAO Wenjun*
(Key Laboratory of Lipid Metabolism and Haematology, Changzhi Medical College,
Changzhi Shanxi 046000, China)
Abstract:C-type lectin domain family 16 A is a susceptibility gene of autoimmune diseases such as diabetes and multiple sclerosis; however, its genetic function is rarely reported. In this article, we analyzed physical and chemical properties, the subcellular localization, transmembrane region and signal peptide, secondary structure, the conserved domains, protein modification after translation, and protein-protein interaction networks of CLEC16A through bioinformatics. Results showed that the consensus coding sequence of clec16a gene was a 1053 amino acids peptide. The hydrophilic protein was not stable, without transmembrane area and signal peptide, and located in multiple cellular structure. The main secondary structure elements were alpha helix and random curl, without known functional domains. Phosphorylation, ubiquitin, glycosylation modification sites existed. It provided certain reference for further research on molecular mechanism and functions of CLEC16A participating in diseases.
Key Words:C-type lectin domain family 16 A; bioinformatics; structure; function
中圖分類號:Q71
文獻標識碼:A
文章編號:1008-4681(2016)02-0013-04
*通訊作者
作者簡介:任晨霞(1987— ),女,山西長治人,長治醫(yī)學院山西省高等學校血脂代謝與血液病重點實驗室助教,碩士.研究方向:生物化學與分子生物學.
基金項目:長治醫(yī)學院科技創(chuàng)新團隊項目(批準號:CX201507);長治醫(yī)學院普及項目(批準號:QDZ201503).
收稿日期:2016-03-04