閆瑞娟 臧雯雯
(1.泰山醫(yī)學(xué)院,山東 泰安 271016; 2.山東省立第三醫(yī)院,山東 濟(jì)南 250000;3.泰山醫(yī)學(xué)院附屬聊城醫(yī)院,山東 聊城 252000)
糖尿病腎病是糖尿病的主要并發(fā)癥之一,最終會(huì)導(dǎo)致終末期腎病[1]。目前臨床上尚缺乏靈敏度高的診斷糖尿病腎病的早期標(biāo)志物。因此,通過(guò)篩選糖尿病腎病患者腎臟組織的差異表達(dá)基因來(lái)挖掘靈敏度高的標(biāo)志物,對(duì)于糖尿病腎病的診斷和治療具有重要意義。
隨著基因芯片技術(shù)的發(fā)展和應(yīng)用,產(chǎn)生了許多基因表達(dá)譜數(shù)據(jù),如何挖掘有價(jià)值的數(shù)據(jù)信息,已成為生物信息學(xué)的研究熱點(diǎn)[2-3]。生物信息學(xué)的發(fā)展也為糖尿病腎病的研究提供了新的思路,本研究對(duì)來(lái)自GEO數(shù)據(jù)庫(kù)的糖尿病腎病組織的基因芯片進(jìn)行分析,篩選出核心基因和重要的信號(hào)通路,構(gòu)建差異基因的互作網(wǎng)絡(luò),這些核心基因和信號(hào)通路可為糖尿病腎病的研究提供新思路。
在GEO數(shù)據(jù)庫(kù)中以“diabetic nephropathy”為檢索詞,可獲得多組與糖尿病腎病相關(guān)的表達(dá)譜數(shù)據(jù),本研究將GEO數(shù)據(jù)庫(kù)中編號(hào)為GSE30529的芯片表達(dá)譜數(shù)據(jù)納入研究對(duì)象。該芯片是含有22個(gè)樣本的人腎小管基因表達(dá)的數(shù)據(jù)集,包含正常腎小管組織12個(gè)樣本和糖尿病腎病腎小管組織10個(gè)樣本。在線GEO2R工具用于分析和查找差異基因,以|logFC|>2和P<0.05對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后篩選差異基因。
生物學(xué)信息注釋數(shù)據(jù)庫(kù)(DAVID)是一個(gè)在線生物信息學(xué)資源網(wǎng)站,可以為大規(guī)模基因或蛋白質(zhì)進(jìn)行系統(tǒng)綜合的生物功能注釋信息,找出最顯著富集的生物學(xué)注釋。本研究將篩選出的差異基因上傳至DAVID在線軟件后,確定對(duì)應(yīng)的種屬,選擇DAVID軟件中的基因功能注釋(functional annotation),即可得到差異基因分別參與的生物過(guò)程、分子功能,細(xì)胞組成和生物學(xué)信號(hào)通路分析(KEGG)。
蛋白質(zhì)互作關(guān)系數(shù)據(jù)庫(kù)(STRING)包含2031個(gè)組織的9643763種蛋白質(zhì),是最大的蛋白質(zhì)數(shù)據(jù)庫(kù)之一,通過(guò)數(shù)據(jù)庫(kù)我們可以直接或間接的預(yù)測(cè)蛋白質(zhì)間的相互關(guān)系。將篩選出的差異基因?qū)隨TRING在線軟件后,導(dǎo)出蛋白互作網(wǎng)絡(luò)的數(shù)據(jù)信息,cytoscape軟件可將導(dǎo)入的數(shù)據(jù)信息轉(zhuǎn)換為直觀的蛋白互作網(wǎng)絡(luò)圖,分析網(wǎng)絡(luò)內(nèi)每個(gè)差異蛋白的連通度,連通度高的即為核心基因。同時(shí),以degree cutoff = 2, node score cutoff = 0.2, k-core = 2, and max. depth = 100為標(biāo)準(zhǔn),利用cytoscape內(nèi)的MCODE軟件對(duì)互作網(wǎng)絡(luò)進(jìn)行評(píng)分,可得出評(píng)分表較高的蛋白互作網(wǎng)絡(luò),找出在關(guān)鍵點(diǎn)的蛋白質(zhì)。
GSE30529數(shù)據(jù)集中總的差異表達(dá)基因?yàn)?280個(gè),其中下調(diào)2620個(gè),上調(diào)1660個(gè)。對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后篩選出差異比較大的基因98個(gè),其中包含12個(gè)下調(diào)的基因和86個(gè)上調(diào)的基因,和9個(gè)核心基因(表1),其中包括CD44、PTPRC、EGF、FN1、SPARC、VIM、KNG1、TIMP1、CXCR4。
表1 連接度比較高的9個(gè)核心基因
用DAVID軟件對(duì)差異蛋白進(jìn)行GO富集分析和KEGG信號(hào)通路富集分析,GO富集分析顯示這些差異表達(dá)基因主要位于細(xì)胞外基質(zhì)區(qū)域和細(xì)胞質(zhì)膜的構(gòu)成,主要的分子功能是蛋白結(jié)合、膠原蛋白結(jié)合和受體結(jié)合等,主要參與炎癥反應(yīng)、細(xì)胞黏附反應(yīng)等生物過(guò)程(表2)。KEGG通路分析顯示這些差異基因主要參與PI3K/Akt信號(hào)通路、ECM受體相互作用、細(xì)胞黏附和趨化因子信號(hào)轉(zhuǎn)導(dǎo)通路等(表3)。
表2 差異基因的GO富集分析列表
表3 差異基因的KEGG通路分析列表
通過(guò)STRING在線工具和cytoscape軟件對(duì)98個(gè)差異基因進(jìn)行蛋白質(zhì)相互作用網(wǎng)絡(luò)分析(被STRING識(shí)別的基因有94個(gè))(圖1),在總的蛋白網(wǎng)絡(luò)中以degree cutoff = 2, node score cutoff = 0.2, k-core = 2, and max. depth = 100為標(biāo)準(zhǔn),利用cytoscape內(nèi)的MCODE軟件對(duì)互作網(wǎng)絡(luò)進(jìn)行評(píng)分,找出蛋白質(zhì)相互作用網(wǎng)絡(luò)中的主要節(jié)點(diǎn),其中核心基因PTPRC、EGF、FN1、SPARC、VIM、KNG1、TIMP1、CXCR4是這些節(jié)點(diǎn)的重要組成部分。
藍(lán)色:表達(dá)量下降的基因,紅色:表達(dá)量上升的基因
圖1 用STRING在線分析工具和cytoscape軟件對(duì)
98個(gè)差異基因進(jìn)行蛋白質(zhì)相互作用網(wǎng)絡(luò)分析
糖尿病腎病是糖尿病最常見(jiàn)的微血管并發(fā)癥,并且是全球終末期腎病的主要原因之一[4],糖尿病腎病的分子機(jī)制仍不清楚,臨床上亦缺乏有效的治療靶點(diǎn)。糖尿病腎病是多基因相互作用的結(jié)果,基因表達(dá)譜的大量應(yīng)用,為本研究提供了生物信息學(xué)方面研究糖尿病腎病發(fā)病機(jī)制的可能性,對(duì)基因芯片數(shù)據(jù)進(jìn)行進(jìn)一步的生物學(xué)分析,是對(duì)基因芯片數(shù)據(jù)挖掘的一個(gè)重要方向。本研究利用生物信息學(xué)軟件對(duì)芯片GSE30529進(jìn)行分析,共發(fā)現(xiàn)98個(gè)差異表達(dá)基因,并對(duì)這些差異基因進(jìn)行GO富集分析、KEGG信號(hào)通路分析和蛋白質(zhì)互作網(wǎng)絡(luò)分析,篩選出了9個(gè)與糖尿病腎病相關(guān)的蛋白,其中表達(dá)量下調(diào)的蛋白有EGF、KNG1,表達(dá)量上調(diào)的蛋白有PTPRC、FN1、SPARC、VIM、TIMP1、CXCR4。核心蛋白中PTPRC、EGF、FN1、SPARC、VIM、KNG1、TIMP1、CXCR4同時(shí)處于蛋白互作網(wǎng)絡(luò)的核心位點(diǎn),這些蛋白可能成為早期診斷糖尿病腎病的指標(biāo)。
對(duì)這些核心基因深入研究,表皮生長(zhǎng)因子(epidermal growth factor,EGF)通過(guò)與表皮生長(zhǎng)因子受體結(jié)合參與多種生物過(guò)程的調(diào)控,包括上皮細(xì)胞增殖、代謝、分化、存活和組織損傷與修復(fù)。越來(lái)越多證據(jù)表明,EGF參與多種腎損傷,腎衰竭患者中EGF明顯降低[5],腎臟慢性腎損傷時(shí),表皮生長(zhǎng)因子受體信號(hào)通路的激活可以誘導(dǎo)TGF-β信號(hào)通路,誘導(dǎo)上皮細(xì)胞細(xì)胞周期阻滯于G2/M期,同時(shí)產(chǎn)生促炎癥因子和趨化因子[6]。激肽原1(KNG1,kininogen 1)在激肽原酶的作用下釋放激肽,激活激肽系統(tǒng),改善腎臟微循環(huán),芯片結(jié)果顯示糖尿病腎病組中KNG1的表達(dá)明顯下降。尚未有文獻(xiàn)直接指出KNG1在糖尿病腎病中的作用機(jī)制,但是Nathalie Vionnet等人[7]指出KNG1參與血管并發(fā)癥的病理生理過(guò)程,亦可作為糖尿病腎病的潛在靶點(diǎn)。受體型酪氨酸蛋白磷酸酶C(receptor-type tyrosine-protein phosphatase C,PTPRC)參與自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性的反應(yīng)、趨化因子信號(hào)通路,白細(xì)胞遷移,T細(xì)胞受體信號(hào)轉(zhuǎn)導(dǎo)和細(xì)胞因子間受體相互作用等炎癥反應(yīng)[8]。SPARC是一種廣泛表達(dá)的促纖維化蛋白,通過(guò)調(diào)節(jié)系膜細(xì)胞轉(zhuǎn)化生長(zhǎng)因子(TGF-β1)和一型膠原的產(chǎn)生,抑制系膜細(xì)胞增殖和影響細(xì)胞外基質(zhì)的產(chǎn)生。Taneda S等[9]實(shí)驗(yàn)證明,糖尿病腎病小鼠模型中,SPARC在高糖狀態(tài)下通過(guò)促進(jìn)TGF-β1表達(dá)來(lái)導(dǎo)致腎小球硬化和腎小管間質(zhì)損傷。fibronectin 1 (FN1)和VIM是上皮間質(zhì)轉(zhuǎn)化的主要蛋白,具有間質(zhì)細(xì)胞的屬性,是腎小管上皮細(xì)胞向間質(zhì)轉(zhuǎn)化的代表性蛋白[10]。CXCR4是一種G蛋白偶聯(lián)受體,可以與趨化因子SDF-1結(jié)合,CXCR4/CXCR7/SDF-1信號(hào)通路參與調(diào)解腎臟生長(zhǎng)和腎臟固有細(xì)胞對(duì)外界刺激的病理反應(yīng)[11]。
篩選出來(lái)的9個(gè)核心蛋白質(zhì)主要是以PI3K-Akt信號(hào)通路為主線,通過(guò)調(diào)節(jié)細(xì)胞間黏附因子及趨化因子等因子的釋放和上皮間質(zhì)轉(zhuǎn)化等過(guò)程參與糖尿病腎病的發(fā)展。通過(guò)篩選出的蛋白功能可以看出,細(xì)胞黏附導(dǎo)致的微血管病變和細(xì)胞外基質(zhì)的沉積為糖尿病腎病的主要機(jī)制。
山東第一醫(yī)科大學(xué)(山東省醫(yī)學(xué)科學(xué)院)學(xué)報(bào)2019年1期