張青 王翔 鞠強(qiáng) 陳穎
(青島大學(xué)附屬醫(yī)院,山東 青島 266003 1 內(nèi)分泌與代謝病科; 2 輸血科)
糖尿病腎病(DN)在世界范圍內(nèi)的患病率逐漸增高[1-3],是終末期腎病(ESRD)的主要原因,約占中國所有ESRD患者的16.4%[4-5]。臨床上,DN患者的特點(diǎn)是蛋白尿和血清肌酐(SCR)水平增高,腎小球濾過率(GFR)降低[6]。病理上,DN的特征可分為腎小球病變和腎小管間質(zhì)改變[7],其中腎小球病變包括腎小球膜延伸、細(xì)胞外基質(zhì)改變、腎小管間質(zhì)纖維化及腎小球硬化[8]。腎小球病變與DN的進(jìn)展密切相關(guān)。然而對DN腎小球病變組織的基因表達(dá)譜的研究相對較少,臨床上缺乏早期診斷以及防治DN進(jìn)展的有效方法。因此,明確參與DN進(jìn)程的關(guān)鍵基因?qū)膊〉脑缙谠\斷和治療尤為重要。
近年來,生物信息學(xué)方法已被廣泛用于芯片數(shù)據(jù)的分析,以鑒定差異表達(dá)基因(DEG)并進(jìn)行各種分析。但是,單個芯片數(shù)據(jù)分析的樣本量小并且假陽性率高,難以獲得可靠的結(jié)果。GEO數(shù)據(jù)庫是一個公共基因組學(xué)數(shù)據(jù)庫,存儲了大量高通量基因表
達(dá)數(shù)據(jù)和相關(guān)信息[9]。本研究從GEO數(shù)據(jù)庫下載信使RNA(mRNA)芯片數(shù)據(jù)集,篩選DN患者的腎小球組織與正常人腎小球組織的DEG。將DEG進(jìn)行富集分析和蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)分析,識別出與DN緊密相關(guān)的候選基因,再將這些候選基因的表達(dá)水平與患者的臨床指標(biāo)進(jìn)行相關(guān)性分析,獲得DN前瞻性診斷生物標(biāo)志物和臨床治療靶點(diǎn)的關(guān)鍵基因。
于GEO數(shù)據(jù)庫的2個數(shù)據(jù)集(GSE30528和GSE96804)中下載所有與DN腎小球組織與正常人腎小球組織相關(guān)的所有基因,通過R軟件包進(jìn)行l(wèi)og2轉(zhuǎn)換后,通過Limma軟件包篩選DN腎小球組織與正常人腎小球組織DEG,使用RRA軟件包對DEG進(jìn)行交叉整合,以P<0.05且|log2FC|≥1作為篩選條件。
通過DAVID在線工具對篩選出的DEG進(jìn)行GO功能和KEGG通路富集分析。GO功能富集分析包含生物過程(BP)、細(xì)胞成分(CC)和分子功能(MF)3個方面;KEGG通路富集分析的篩選條件為基因計數(shù)>2和P<0.05。
通過預(yù)測蛋白質(zhì)之間相互作用的在線數(shù)據(jù)庫STRING 10.5進(jìn)行DEG的PPI分析,并采用Cytoscape軟件構(gòu)建可視化PPI網(wǎng)絡(luò)[10],通過Cytoscape軟件的插件MCODE識別PPI網(wǎng)絡(luò)中的候選基因。
通過Nephroseq v5在線平臺(http://v5.nephroseq.org/)對DN患者的候選基因的表達(dá)水平與GFR、SCR、血壓和體質(zhì)量指數(shù)(BMI)等臨床指標(biāo)進(jìn)行Pearson相關(guān)分析。以P<0.05為差異有統(tǒng)計學(xué)意義,將與DN患者臨床指標(biāo)具有顯著相關(guān)性的所有候選基因定義為關(guān)鍵基因。
通過Limma軟件包從GEO數(shù)據(jù)庫GSE30528數(shù)據(jù)集中篩選出661個DN腎小球組織與正常人腎小球組織DEG,其中上調(diào)基因244個,下調(diào)基因417個;從GSE96804數(shù)據(jù)集中篩選出DEG 610個,其中上調(diào)基因330個,下調(diào)基因280個。經(jīng)RRA軟件包對兩組結(jié)果進(jìn)行交叉整合以后,共獲得52個DEG,其中上調(diào)基因24個,下調(diào)基因28個。
GO功能富集分析結(jié)果顯示,DEG在BP方面主要富集于細(xì)胞外結(jié)構(gòu)組織、炎癥反應(yīng)的調(diào)節(jié)、蛋白激酶B信號傳導(dǎo)等過程,CC方面主要富集于細(xì)胞外基質(zhì)、膠原蛋白三聚物和基底膜成分,MF方面主要富集于細(xì)胞外基質(zhì)結(jié)構(gòu)組成成分、具有張力的細(xì)胞外基質(zhì)結(jié)構(gòu)和黏多糖結(jié)合作用等功能(圖1)。圖中圓點(diǎn)的大小代表DEG的數(shù)量,圓點(diǎn)越大DEG數(shù)量越多,圓點(diǎn)的顏色代表調(diào)整后的不同P值,從紅色到藍(lán)色表示P值從小到大。KEGG通路富集分析顯示,DN腎小球組織與正常人腎小球組織DEG主要富集于補(bǔ)體及凝血級聯(lián)反應(yīng)、蛋白質(zhì)的消化吸收和局部黏著斑3個通路。
圖1 DEG的GO功能富集分析結(jié)果
通過Cytoscape軟件構(gòu)建了52個DN腎小球組織與正常人腎小球組織DEG的可視化PPI網(wǎng)絡(luò)(圖2)。圖中綠色圓點(diǎn)代表下調(diào)的DEG,紅色圓點(diǎn)則代表上調(diào)的DEG,連線代表蛋白質(zhì)之間的相互作用。通過MCODE插件總共識別篩選出了14個候選基因,分別為C3、CCL19、COL1A2、COL6A3、COL15A1、LOX、LUM、SERPINF1、TGFBI、THBS2、VCAN、CCL21、CXCR2、SST。
圖2 DN腎小球組織與正常人腎小球組織DEG的PPI網(wǎng)絡(luò)
通過Nephroseq v5在線工具對14個候選基因與DN患者臨床指標(biāo)之間進(jìn)行Pearson相關(guān)性分析顯示,DN腎小球組織當(dāng)中C3、CCL19、COL1A2、COL6A3、COL15A1、LUM、SERPINF1、TGFBI、THBS2、VCANmRNA表達(dá)水平與DN患者的GFR呈負(fù)相關(guān),基因LOXmRNA表達(dá)水平與DN患者的GFR呈正相關(guān),CCL21、CXCR2、SSTmRNA的表達(dá)水平與DN患者的GFR無相關(guān)性;DN腎小球組織中CCL19、VCANmRNA表達(dá)水平與DN患者的SCR呈正相關(guān),LOXmRNA的表達(dá)水平與DN患者的SCR呈負(fù)相關(guān);DN腎小球組織中COL15A1 mRNA的表達(dá)水平與DN患者的血壓呈正相關(guān);DN腎小球組織中SERPINF1 mRNA的表達(dá)水平與DN患者的BMI呈正相關(guān)。因此,與DN患者臨床指標(biāo)顯著相關(guān)11個關(guān)鍵基因分別為C3、CCL19、COL1A2、COL6A3、COL15A1、LOX、LUM、SERPINF1、TGFBI、THBS2、VCAN。
DN是慢性腎臟病和ESRD的主要病因[11-13]。隨著DN患者數(shù)量的增加,DN引起的ESRD的發(fā)病率逐年上升[14]。目前,控制血糖、血壓仍然是管理DN的主要方法。由于缺乏早期診斷和有效治療的方法,DN患者預(yù)后較差。因此,闡明DN進(jìn)展的確切分子機(jī)制,制定有效的診療方案變得更為緊迫。DN患者早期腎臟改變主要為腎小球特征性增生肥大和腎小球基底膜增厚[15-16],腎小球病變在DN發(fā)展中起著關(guān)鍵作用[17],然而糖尿病腎小球病變的具體機(jī)制并不明確。本研究通過高通量芯片技術(shù)和生物信息學(xué)分析方法,篩選出DN的關(guān)鍵基因,為DN早期診斷和治療提供思路。
本研究通過生物信息學(xué)分析方法對2個數(shù)據(jù)集進(jìn)行分析,篩選出DN腎小球組織與正常人腎小球組織DEG 52個。通過GO功能和KEGG通路富集分析挖掘DEG之間的相互作用。DEG的GO功能富集分析結(jié)果顯示,DEG主要功能富集于細(xì)胞外基質(zhì)的組織、細(xì)胞外空間和細(xì)胞外基質(zhì)的結(jié)構(gòu)成分,與KANWAR等[18]的研究結(jié)果一致。DN的主要病理特征是彌漫性細(xì)胞外基質(zhì)累積,在DN的進(jìn)展過程中,腎小球由于腎小球系膜基質(zhì)的增加而變大,致DN纖維化,這也是目前公認(rèn)的ESRD的致病機(jī)理之一[19-20]。DEG的KEGG通路富集分析結(jié)果主要體現(xiàn)在補(bǔ)體及凝血級聯(lián)反應(yīng)、蛋白質(zhì)的消化吸收和局部黏著斑3個通路,這表明免疫和炎性反應(yīng)在DN發(fā)生發(fā)展中發(fā)揮重要作用。炎癥已經(jīng)被認(rèn)為是DN的關(guān)鍵發(fā)病機(jī)制,越來越多的證據(jù)表明活化的補(bǔ)體系統(tǒng)以及促凝血事件可能會導(dǎo)致DN的腎小球損傷[21]。
本研究通過對14個候選基因與DN患者臨床指標(biāo)之間進(jìn)行相關(guān)性分析,結(jié)果顯示11個關(guān)鍵基因(C3、CCL19、COL1A2、COL6A3、COL15A1、LOX、LUM、SERPINF1、TGFBI、THBS2、VCAN)與DN患者臨床指標(biāo)具有顯著相關(guān)性。研究發(fā)現(xiàn),部分腎功能受損的糖尿病患者腎組織中C3的轉(zhuǎn)錄組和蛋白質(zhì)水平均顯著增加[22],病理學(xué)檢查發(fā)現(xiàn)腎組織中C3陽性表達(dá)與腎組織的損傷程度密切相關(guān)[23],阻斷C3信號傳導(dǎo)可有效改善DN模型小鼠的預(yù)后[24]。COL1A2是形成Ⅰ型膠原蛋白的主要成分,腎組織中COL1A2基因表達(dá)上調(diào)提示腎纖維化程度更高[25]。TGFBI在正常腎組織中高表達(dá),敲除TGFBI后小鼠更容易發(fā)生鏈脲佐菌素誘導(dǎo)的糖尿病[26],因此,通過對尿液中TGFBI蛋白水平以及白蛋白排泄率的檢測可以預(yù)測DN的嚴(yán)重程度[27]。THBS2又稱血小板反應(yīng)蛋白,是存在于細(xì)胞外的一種糖蛋白,在體內(nèi)參與了細(xì)胞以及細(xì)胞間基質(zhì)的信號傳導(dǎo)[28],在DN患者的血清中顯著性升高[29],可能是通過凝血酶級聯(lián)反應(yīng)以及黏著斑通路促進(jìn)DN的進(jìn)展。
本研究結(jié)果當(dāng)中篩選出的CCL19、COL15A1、COL6A3、LOX、LUM、SERPINF1、VCAN關(guān)鍵基因與DN的相關(guān)性目前尚未見報道。目前研究發(fā)現(xiàn)CCL19與炎癥和免疫反應(yīng)密切相關(guān)[30];COL15A1基因編碼細(xì)胞骨架蛋白Restin,該蛋白可穩(wěn)定微血管和細(xì)胞并抑制血管生成[31];COL6A3主要參與信號轉(zhuǎn)導(dǎo),是多聚受體復(fù)合物的組成部分[32];LOX是分泌型的胺氧化酶,其主要功能是在細(xì)胞外基質(zhì)中催化膠原蛋白形成和參與彈性蛋白的共價交聯(lián)[33];LUM可調(diào)節(jié)纖維蛋白原的形成[34];SERPINF1是一種蛋白酶抑制劑,屬于Serpin家族;SERPINF1基因通過調(diào)節(jié)胰島素抵抗以及瘦素水平參與了脂代謝[35],同時還編碼色素上皮衍生因子(PEDF),PEDF作為一種分泌蛋白,積聚于細(xì)胞外基質(zhì)中,與Ⅰ型膠原蛋白結(jié)合[36],通過調(diào)節(jié)細(xì)胞外基質(zhì)與膠原蛋白的交聯(lián)參與DN進(jìn)展;VCAN基因編碼細(xì)胞外基質(zhì)中的硫酸軟骨素蛋白聚糖,主要作用是維持細(xì)胞外基質(zhì)的功能,通過與Ⅰ型膠原蛋白相互作用在細(xì)胞黏附中發(fā)揮重要作用[37]。
綜上所述,本研究通過生物信息學(xué)技術(shù)分析篩選出與DN密切相關(guān)的14個候選基因,并預(yù)測了這些候選基因可能參與的生物學(xué)途徑及具有的功能,通過與DN患者臨床指標(biāo)的相關(guān)性分析進(jìn)一步明確了與DN密切相關(guān)的11個關(guān)鍵基因。對于揭示DN的潛在發(fā)病機(jī)制具有重要意義,并為DN的治療提供了潛在靶點(diǎn)。本研究也存在一些局限性,如主要是基于mRNA轉(zhuǎn)錄本的分析,可能與蛋白質(zhì)水平的轉(zhuǎn)錄本分析結(jié)果有差異;而且僅僅是基于生物信息學(xué)分析的理論研究,還應(yīng)通過分子生物學(xué)實(shí)驗來進(jìn)一步驗證所篩選的基因在DN中具體機(jī)制和作用。