陳志敏 林丹華 (莆田市莆田學(xué)院附屬醫(yī)院腎內(nèi)科,莆田 351100)
慢性丙型肝炎病毒(hepatitis C virus,HCV)感染是導(dǎo)致慢性肝病的主要原因之一,HCV全球患病率約為1%~2%,HCV活動后若未及時治療,常進(jìn)展為慢性肝炎、肝硬化甚至肝細(xì)胞癌,并可能造成相應(yīng)的肝外并發(fā)癥[1]。其中,腎臟受累最為常見,可表現(xiàn)為蛋白尿、腎小球腎炎、冷球蛋白血癥(mixed cryoglobulinemia,MC)和慢性腎臟病(chronic kidney disease,CKD)等。目前認(rèn)為HCV感染能夠增加非透析CKD患者終末期腎病(end stage renal disease,ESRD)風(fēng)險和病死率及已經(jīng)進(jìn)入血液透析患者病死率,并可導(dǎo)致腎移植受者的移植腎損傷,進(jìn)而導(dǎo)致腎病患者的預(yù)后進(jìn)一步惡化,這些病變的發(fā)病機(jī)制可能與腎小球中免疫復(fù)合物的沉積有關(guān),然而現(xiàn)有研究仍未明確HCV相關(guān)性腎病的發(fā)病機(jī)制[2,3]。本研究利用生物信息學(xué)工具對GEO(gene expression omnibus)公共數(shù)據(jù)庫中的HCV基因表達(dá)譜芯片和CKD基因表達(dá)譜芯片進(jìn)行數(shù)據(jù)分析,篩選出各自的差異表達(dá)基因(differentially expressed genes,DEGs),并與人類基因綜合數(shù)據(jù)庫GeneCards中HCV和CKD疾病相關(guān)基因取交集,獲得共表達(dá)差異基因(co-expressed DEGs,co-DEGs)。隨后使用STRING數(shù)據(jù)庫、CTD數(shù)據(jù)庫及AMIGO數(shù)據(jù)庫進(jìn)行相關(guān)的生物信息學(xué)分析及注釋。最后通過mirDIP數(shù)據(jù)庫、miRDB數(shù)據(jù)庫及TargetScan數(shù)據(jù)庫預(yù)測co-DEGs的靶標(biāo)miRNA。為進(jìn)一步深入研究HCV和CKD相關(guān)基因的生物學(xué)功能及可能參與HCV相關(guān)腎病發(fā)生發(fā)展的分子機(jī)制奠定基礎(chǔ)。
1.1資料
1.1.1Affymetrix芯片數(shù)據(jù) NCBI-GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)[4]下載2個芯片數(shù)據(jù)集GSE20948和GSE15072。GSE20948采用的芯片平臺是 GPL570 (Affymetrix Human Genome U133 Plus 2.0 Array),包括 14 例HCV感染樣本和 14 例對照樣本。GSE15072采用的芯片平臺是GPL570和GPL96(Affymetrix Human Genome U133A Array),共包括8名健康對照者的血液樣本和26名CKD患者的血液樣本。選取GPL96平臺上的8名健康對照者的血液樣本為對照組,9例CKDⅡ~Ⅲ期患者的血液樣本和12例進(jìn)入血液透析的尿毒癥患者血液樣本為試驗(yàn)組,分析差異基因分析。
1.1.2GeneCards數(shù)據(jù)庫獲取CKD與HCV相關(guān)基因 在GeneCards數(shù)據(jù)庫(https://www.genecards.org/)中以“chronic kidney disease”、“chronic hepatitis c”為關(guān)鍵詞檢索,獲得CKD、HCV疾病相關(guān)基因。
1.2方法
1.2.1數(shù)據(jù)預(yù)處理及差異基因分析 利用R語言limma包對原始芯片數(shù)據(jù)進(jìn)行歸一化處理并篩選DEGs,應(yīng)用貝葉斯檢驗(yàn)方法進(jìn)行多重檢驗(yàn)校正,篩選符合條件的DEGs[5]。GSE20948數(shù)據(jù)集設(shè)置篩選條件為|log2 FC|>1,校正后P<0.05 的基因則為DEGs。GSE15072數(shù)據(jù)集設(shè)置篩選條件為|log2 FC|>1.5,校正后P<0.05,確定DEGs。對2個數(shù)據(jù)集篩選得到的DEGs與GeneCards數(shù)據(jù)庫中CKD與HCV疾病相關(guān)基因通過韋恩圖(Venn Diagram)取交集,獲得co-DEGs。
1.2.2差異表達(dá)基因的GO和KEGG富集分析 利用R語言clusterProfiler包對篩選得到的兩組DEGs行GO(gene notology)富集分析和KEGG(Kyoto encyclopedia of genes and genomes)通路分析,以P<0.05為顯著性基因富集臨界值,對差異顯著的基因進(jìn)行功能注釋,并分析兩組差異基因參與的生物學(xué)過程及通路。隨后單獨(dú)對co-DEGs行KEGG通路分析,獲得co-DEGs主要富集通路。
1.2.3差異表達(dá)基因蛋白互作網(wǎng)絡(luò)構(gòu)建及關(guān)鍵節(jié)點(diǎn)基因篩選 將篩選出的DEGs列表分別上傳至蛋白質(zhì)互作關(guān)系數(shù)據(jù)庫(STRING)通過對基因編碼蛋白之間相互作用的可能性打分,評價相互作用可能性的大小[6]。分別構(gòu)建DEGs編碼蛋白相互作用網(wǎng)絡(luò)(protein-protein interaction,PPI),篩選條件為代表中度相互作用的可能性閾值(結(jié)合分值>0.4)。將STRING數(shù)據(jù)庫構(gòu)建出的PPI互作網(wǎng)絡(luò)結(jié)果導(dǎo)入Cytoscape(3.2.1版本)軟件[7]中進(jìn)行可視化分析,運(yùn)用Cytoscape中cytoHubba插件和Degree算法繪制由前30個基因組成的PPI圖,并選取排名前5名的基因?yàn)殛P(guān)鍵節(jié)點(diǎn)基因(hub-gene)。
1.2.4Co-DEGs基因產(chǎn)物與疾病的聯(lián)系 利用比較毒理基因組學(xué)數(shù)據(jù)庫(the comparative toxicogenom-ics database,CTD,http://ctdbase.org/)分析co-DEGs的基因產(chǎn)物與消化系統(tǒng)和泌尿系統(tǒng)疾病之間的聯(lián)系[8]。取消化系統(tǒng)疾病中推斷分值(inference score)排名前3名的疾病和泌尿系統(tǒng)疾病中推斷分值排名前4的疾病為與基因產(chǎn)物可能有關(guān)聯(lián)的疾病。
1.2.5Co-DEGs在AmiGO中的功能注釋 在AmiGO(http://amigo.geneontology.org/amigo/)[9]數(shù)據(jù)庫中檢索co-DEGs,獲得4個DEGs各自排名前5位的功能注釋條目。
1.2.6Co-DEGs的靶標(biāo)miRNA預(yù)測及相關(guān)通路分析 在mirDIP數(shù)據(jù)庫(http://ophid.utoro nto.ca/mirDIP)、miRDB數(shù)據(jù)庫 (http://mirdb.org/)及TargetScan數(shù)據(jù)庫 (v7.1;http://www.targe tscan.org/vert_71/)中檢索GLRX、NFIL3、PFKFB3和KLF10,對獲得的miRNA取交集,得到在3個數(shù)據(jù)庫都預(yù)測到的miRNA。隨后將交叉miRNA輸入miEAA數(shù)據(jù)庫(https://ccb-compute2.cs.uni-saarland.de/mieaa_tool/),選用ORA(over-representation analysis)法,設(shè)定閾值為2、P<0.05,獲得miRNA的主要富集通路。
2.1DEGs的篩選 HCV數(shù)據(jù)集GSE20948共篩選出122個DEGs,其中包括77個下調(diào)基因和45個上調(diào)基因。CKD數(shù)據(jù)集GSE15072共篩選出235個差異基因,其中包括45個下調(diào)基因和190個上調(diào)基因。GeneCards數(shù)據(jù)庫中以“chronic kidney disease”為關(guān)鍵詞檢索,共得到11 797個CKD相關(guān)基因,以“chronic hepatitis c”為關(guān)鍵詞檢索,共得到6 597個HCV相關(guān)基因,用韋恩圖對四組基因取交集后,得到4個co-DEGs:GLRX、NFIL3、PFKFB3、KLF10(圖1)。
圖1 Genecards數(shù)據(jù)庫中CKD、HCV相關(guān)基因與HCV數(shù)據(jù)集(GSE20948)、CKD數(shù)據(jù)集(GSE15072)DEGs交集
2.2DEGs的GO富集分析和 KEGG 信號通路分析 GO富集分析顯示HCV相關(guān)DEGs主要參與的分子生物學(xué)過程包括胺代謝過程、內(nèi)源性細(xì)胞凋亡信號通路、氨基酸運(yùn)輸、氧化還原過程等;CKD相關(guān)DEGs主要參與的分子生物學(xué)過程包括核轉(zhuǎn)錄mRNA分解代謝過程、病毒轉(zhuǎn)錄、氫離子跨膜轉(zhuǎn)運(yùn)等。KEGG 通路分析顯示HCV的DEGs主要參與抗生素的生物合成通路、甘氨酸,絲氨酸和蘇氨酸代謝、氨基酸的生物合成及代謝途徑等;CKD的DEGs主要參與核糖體、氧化磷酸化、帕金森病、非酒精性脂肪性肝病(NAFLD)通路等(圖2)。Co-DEGs的KEGG通路分析顯示,共表達(dá)基因主要富集于果糖和甘露糖代謝通路、HIF-1信號通路、AMPK信號通路,本研究選取HIF-1信號通路進(jìn)行展示說明(圖3)。
圖2 DEGs的GO富集分析和KEGG-pathway富集分析
圖3 Co-DEGs富集的信號通路之HIF-1信號通路
2.3差異基因PPI網(wǎng)絡(luò)分析 通過STRING在線工具和Cytoscape軟件對HCV的112個DEGs和CKD的235個DEGs進(jìn)行PPI分析。在Cytoscape軟件中繪制cytoHubba插件中degree排名前30的基因的編碼蛋白互作網(wǎng)絡(luò)圖(圖4)。HCV數(shù)據(jù)集的關(guān)鍵節(jié)點(diǎn)基因有ASNS(asparagine synthetase,degree=16)、MYC(MYC proto-oncogene protein,degree=12)、PSAT1(phosphoserine aminotransferase 1,degree=11)、ATF3(activating transcription factor 3,degree=10)和PHGDH(phosphoglycerate dehydrogenase,degree=8)。CKD數(shù)據(jù)集的關(guān)鍵節(jié)點(diǎn)基因有SNRPG(small nuclear ribonucleoprotein polypeptide G,degree=49)、COX7C(cytochrome C oxidase subunit 7C,degree=45)、RPS15A(ribosomal protein S15a,degree=43)、RPS17(ribosomal protein S17,degree=42)、RPS24(ribosomal protein S24,degree=42),這些關(guān)鍵節(jié)點(diǎn)基因在各自的PPI互作網(wǎng)絡(luò)圖中處于關(guān)鍵位置,與多個基因互相聯(lián)系。
圖4 DEGs的蛋白互作網(wǎng)絡(luò)
2.4Co-DEGs基因產(chǎn)物與消化和泌尿系統(tǒng)疾病的聯(lián)系 CTD數(shù)據(jù)庫分析顯示co-DEGs的基因產(chǎn)物在消化系統(tǒng)中與化學(xué)和藥物誘導(dǎo)的肝損害疾病、肝腫大、脂肪肝、肝腫瘤等疾病有關(guān)。在泌尿系統(tǒng)中與急性腎損傷、蛋白尿、少精癥等疾病有關(guān)(圖5)。
圖5 CTD數(shù)據(jù)庫中共表達(dá)基因與消化和泌尿系統(tǒng)疾病的聯(lián)系
2.5Co-DEGs的AmiGO功能注釋 AmiGO數(shù)據(jù)庫對co-DEGs的功能注釋提示co-DEGs的主要功能與RNA聚合酶Ⅱ?qū)D(zhuǎn)錄的調(diào)控及糖代謝途徑有關(guān)(表1)。
表1 AmiGO數(shù)據(jù)庫中co-DEGs的功能注釋
2.6Co-DEGs的靶標(biāo)miRNA預(yù)測及相關(guān)通路分析 mirDIP數(shù)據(jù)庫共得到153個潛在miRNA靶標(biāo),miRDB數(shù)據(jù)庫共得到118個潛在miRNA靶標(biāo),TargetScan數(shù)據(jù)庫共得到15個潛在miRNA靶標(biāo),對3者取交集后共得到10個交叉miRNA:hsa-miR-489-3p、hsa-let-7f-5p、hsa-let-7c-5p、hsa-let-7g-5p、hsa-let-7b-5p、hsa-miR-98-5p、hsa-let-7i-5p、hsa-let-7a-5p、hsa-let-7d-5p、hsa-let-7e-5p。將10個miRNA輸入miEAA數(shù)據(jù)庫后將結(jié)果按P值排序,結(jié)果顯示其排名前10的主要富集的通路功能為細(xì)胞因子與炎癥反應(yīng)、哮喘、IL-5信號傳導(dǎo)途徑、IL-6信號傳導(dǎo)途徑、Jak STAT信號通路、催乳素信號通路、IL-2信號傳導(dǎo)途徑、嘧啶代謝、基礎(chǔ)轉(zhuǎn)錄因子和炎癥反應(yīng)途徑(表2)。
表2 miEAA數(shù)據(jù)庫中靶向miRNA通路功能
在HCV感染的自然病程中,40%~74%的患者會至少出現(xiàn)1種肝外表現(xiàn),常表現(xiàn)為混合型冷球蛋白血癥,累及腎臟,多表現(xiàn)出膜增生性腎小球腎炎(MPGN),其臨床表現(xiàn)為無癥狀性血尿、蛋白尿,約20%患者表現(xiàn)為腎病綜合征;20%~30%的患者表現(xiàn)為腎炎綜合征;約15%可逐漸進(jìn)展為終末期慢性腎衰竭,需要透析治療,其發(fā)病機(jī)制尚不完全明確[10-12]。有研究認(rèn)為Ⅱ型及Ⅲ型冷球蛋白血癥通過形成IgM-IgG 免疫復(fù)合物與補(bǔ)體C1q結(jié)合,C1q與內(nèi)皮細(xì)胞受體結(jié)合,可激活補(bǔ)體系統(tǒng)進(jìn)而導(dǎo)致血管炎,但具體機(jī)制及相關(guān)編碼基因尚未可知[13]。
在co-DEGs中GLRX基因編碼的蛋白質(zhì)是谷氧還蛋白家族成員,其對抗氧化防御系統(tǒng)有重要作用。研究表明,由GLRX控制的GSH加合物參與細(xì)胞生長、細(xì)胞凋亡、血管生成和炎癥等多種生物過程,GLRX缺乏會加速高脂肪誘導(dǎo)的非酒精性脂肪肝并進(jìn)展為脂肪性肝炎,表現(xiàn)為肝損傷和炎癥[14-16]。此外,Yang等[17]研究表明,GSH可為腎小管上皮細(xì)胞提供抗尿酸腎病的抗氧化保護(hù)。KLF10基因編碼的蛋白質(zhì)是轉(zhuǎn)錄抑制因子,大部分作用和基因靶向是通過TGF-β信號介導(dǎo)的,該蛋白在各種癌細(xì)胞(包括胰腺癌,白血病和骨質(zhì)疏松癥)中表現(xiàn)出抗增殖作用并誘導(dǎo)細(xì)胞凋亡[18]。肝臟具有顯著的再生能力,TGF-β/Smad通路也會參與肝臟再生[19]。特異性靶向髓樣TGF-β1可促進(jìn)急性腎損傷后腎纖維化進(jìn)展,是腎纖維化的主要驅(qū)動因素。但也有研究認(rèn)為,不加選擇地完全阻斷TGF-β功能不足以減少纖維化,并可能在某些病理環(huán)境中加重疾病[20]。 Kowalewska等[21]研究表明,HCV繼發(fā)冷球蛋白血癥后引起炎癥反應(yīng),可分泌血小板源生長因子PDGF及生長因子TGF-β等細(xì)胞因子以促腎小球固有細(xì)胞增殖及細(xì)胞外基質(zhì)分泌,此外,還可分泌趨化因子、趨化單核-巨噬細(xì)胞等炎癥細(xì)胞聚集于腎小球加重?fù)p害?;贙LF10基因的生物學(xué)功能,提示該基因可能涉及HCV相關(guān)腎病的發(fā)病機(jī)制。
NFIL3基因編碼的蛋白質(zhì)是轉(zhuǎn)錄調(diào)節(jié)因子,其參與的關(guān)鍵生物途徑中NF-κB通路是先天性和適應(yīng)性免疫的關(guān)鍵調(diào)節(jié)通路,目前研究表明,NF-κB 通路與AKI的發(fā)病密切相關(guān)。腎小管上皮細(xì)胞缺血后,NF-κB通路的活化會加劇腎小管損傷并加劇適應(yīng)不良狀態(tài)的炎癥反應(yīng)[22]。另外,單克隆IgMκ可與腎小球系膜中的纖連蛋白結(jié)合,形成更易于沉積在腎小球中的免疫復(fù)合物,這可能是HCV繼發(fā)的Ⅱ型冷球蛋白血癥導(dǎo)致腎炎的關(guān)鍵機(jī)制之一[14]。PFKFB3基因編碼的蛋白質(zhì)屬于雙功能蛋白質(zhì)家族,其參與果糖-2,6-二磷酸的合成和降解,是控制真核生物糖酵解的調(diào)節(jié)分子。該蛋白也是細(xì)胞周期進(jìn)展和預(yù)防細(xì)胞凋亡中的必需蛋白。Ding等[23]研究發(fā)現(xiàn),糖酵解抑制可減少TGF-β1誘導(dǎo)的肌成纖維細(xì)胞活化并延緩腎纖維化進(jìn)展。此外,本究顯示co-DEGs主要富集的通路中最顯著的是果糖和甘露糖代謝通路,提示HCV相關(guān)腎病可能與糖代謝有關(guān),PFKFB3可能是其發(fā)生發(fā)展的關(guān)鍵基因。
在對co-DEGs預(yù)測的靶標(biāo)miRNA富集的通路分析中發(fā)現(xiàn),其靶向的miRNA主要涉及的信號通路多與炎癥反應(yīng)有關(guān),說明co-DEGs介導(dǎo)的各種反應(yīng)最后引起導(dǎo)致了生物體慢性炎癥的發(fā)生從而影響多生理系統(tǒng)。
目前對于HCV相關(guān)腎病的研究尚有欠缺,本文通過篩選GEO數(shù)據(jù)庫中兩組不同疾病的芯片表達(dá)譜獲得各自的DEGs,并與大型基因數(shù)據(jù)庫中CKD和HCV疾病相關(guān)基因進(jìn)行交叉驗(yàn)證,并進(jìn)一步分析二者的共表達(dá)基因,找到了可能與HCV相關(guān)腎病致病相關(guān)的關(guān)鍵基因及重要通路,關(guān)鍵基因或可成為診斷該病的潛在生物標(biāo)志。但受條件所限,未能獲得相關(guān)樣本行進(jìn)一步實(shí)驗(yàn)驗(yàn)證。本研究從另一條思路探討在HCV相關(guān)腎炎發(fā)生過程中可能的作用機(jī)制,為臨床上繼發(fā)性疾病機(jī)制研究提供新思路,也為未來進(jìn)一步深入研究HCV相關(guān)腎病的發(fā)病機(jī)制提供了理論基礎(chǔ)。