汪偉,郭浩陽,陶夢(mèng)君,徐亮,袁慧*,彭輝*
(1. 皖南醫(yī)學(xué)院公共衛(wèi)生學(xué)院,安徽蕪湖 241002;2. 皖南醫(yī)學(xué)院弋磯山醫(yī)院)
系統(tǒng)性紅斑狼瘡(systemic lupus erythematosus,SLE)是一種常見的多發(fā)于中青年女性且累及多臟器的自身免疫炎癥性疾病,人群發(fā)病率為(30.13~70.41)/10萬人,其主要特征是各種自身抗體的產(chǎn)生、免疫復(fù)合物沉積、免疫系統(tǒng)浸潤(rùn)以及受損器官內(nèi)的炎癥反應(yīng)[1-2]。SLE 的病因和發(fā)病機(jī)制目前尚未完全清楚,認(rèn)為與遺傳因素、環(huán)境因素密切相關(guān)。研究表明,SLE 具有高度的遺傳傾向性及家族發(fā)病聚集性,遺傳因素在SLE 發(fā)病中發(fā)揮著重要作用[3]。因此研究與SLE 發(fā)生發(fā)展相關(guān)的遺傳分子機(jī)制對(duì)疾病的早期診斷、探索新的治療靶點(diǎn)以及評(píng)估和改善患者的預(yù)后具有重要意義。
人群流行病學(xué)、動(dòng)物模型和表觀遺傳學(xué)等研究表明,SLE 是一種復(fù)雜的多基因疾病,其遺傳易感性由多個(gè)基因共同作用決定的,僅研究某個(gè)特定基因或者位點(diǎn)可能并不能全面地了解該基因的功能及其在SLE 發(fā)病中的作用[4-5]。到目前為止,還沒有特定的基因被認(rèn)為是SLE 的潛在診斷標(biāo)志物。因此,本研究選擇GEO 數(shù)據(jù)庫(kù)中的GSE110174 和GSE154851 這2 個(gè)數(shù)據(jù)集,使用生物信息學(xué)的方法整合和分析數(shù)據(jù)集中所包含的數(shù)據(jù)信息,篩選出SLE 患者全血細(xì)胞中的差異表達(dá)基因(differently expressed genes,DEGs),再采用生物聚類、通路分析、關(guān)鍵基因的識(shí)別及可視化作圖等方式進(jìn)行數(shù)據(jù)挖掘,對(duì)疾病從分子水平進(jìn)行分析,解釋基因表達(dá)變化的生物學(xué)相關(guān)性,豐富對(duì)疾病進(jìn)展的認(rèn)識(shí)。
1.1 芯片數(shù)據(jù)的來源及篩選 在公共基因表達(dá)數(shù)據(jù)庫(kù)GEO (http://www.ncbi.nlm.nih.gov/geo)[6]中采用以下檢索式進(jìn)行檢索:(“SLE”[All Fields]OR“Systemic lupus erythematosus”[All Fields]) AND“Homo sapiens”[porgn] AND(“gse”[Filter]AND“Expression profiling by array”[Filter] ), 最終選擇了GSE110174 和GSE154851這2個(gè)數(shù)據(jù)集并對(duì)其表達(dá)矩陣數(shù)據(jù)以及平臺(tái)注釋信息進(jìn)行了下載。篩選標(biāo)準(zhǔn)如下:(1)試驗(yàn)組樣本只能是來源于SLE 患者的全血細(xì)胞,而非外周血單個(gè)核細(xì)胞;(2)健康對(duì)照組樣本例數(shù)不少于10 例,試驗(yàn)組樣本例數(shù)不少于30 例;(3)研究對(duì)象只能是人類,而不能是動(dòng)物模型;(4)數(shù)據(jù)只能是來源于基因表達(dá)芯片數(shù)據(jù),而非其他高通量測(cè)序數(shù)據(jù)。 GSE110174 是基于GPL13158 平臺(tái)(Affymetrix HT HG-U133+PM Array Plate)將SLE 患者與健康對(duì)照組進(jìn)行比較的基因芯片數(shù)據(jù)集,其中包含144 例SLE 患者和10 例健康對(duì)照組全血樣本的基因表達(dá)信息。GSE154851是基于GPL16699平臺(tái)(Agilent-039494 SurePrint G3 Human GE v2 8x60K Microarray 039381)將SLE 患者與健康對(duì)照組進(jìn)行比較的基因芯片數(shù)據(jù)集,其中包含38 例SLE 患者和32 例健康對(duì)照組全血樣本的基因表達(dá)信息。
1.2 數(shù)據(jù)的處理及DEGs 的篩選 在R 軟件(4.1.1 版本)中使用limma 包對(duì)下載好的基因表達(dá)矩陣數(shù)據(jù)進(jìn)行背景校正以及標(biāo)準(zhǔn)化處理后,再?gòu)闹泻Y選出差異表達(dá)基因,篩選標(biāo)準(zhǔn)為:(1)差異倍數(shù)(Fold Change) >1.5;(2) 校正后的P值<0.05[7],符合篩選條件的基因被認(rèn)為在SLE組和健康對(duì)照組中表達(dá)差異有統(tǒng)計(jì)學(xué)意義。通過R 軟件中的pheatmap 包和ggplot2 包來繪制出DEGs 的聚類熱圖和火山圖[8]。 最后對(duì)GSE110174 和GSE154851篩選出來的DEGs取交集作為SLE的共同差異表達(dá)基因,并通過VennDiagram包繪制出韋恩圖[9]。
1.3 DEGs 的GO 和KEGG 功能富集分析 通過DAVID 在線數(shù)據(jù)庫(kù)(https://david.ncifcrf.gov/)[10]對(duì)篩選出的DEGs 進(jìn)行GO 和KEGG 分析,利用R軟件ggplot2包對(duì)結(jié)果進(jìn)行可視化處理。
1.4 PPI 網(wǎng)絡(luò)的構(gòu)建以及關(guān)鍵基因的篩選 將篩選得到的共同差異表達(dá)基因?qū)隨tring在線數(shù)據(jù)庫(kù)中,選擇interaction score>0.7 則認(rèn)為蛋白之間相互作用明顯[11]。隨后將得到的蛋白質(zhì)相互作用結(jié)果導(dǎo)入Cytoscape(3.9.0 版本)軟件中繪制成網(wǎng)絡(luò)圖。利用分子復(fù)合檢測(cè)算法(MCODE)對(duì)PPI 網(wǎng)絡(luò)中可能與SLE 發(fā)病有關(guān)的候選基因模塊進(jìn)行了預(yù)測(cè),根據(jù)篩選條件(degree cutoff=2,node score cutoff=0.2,k-score=2)篩選出PPI 網(wǎng)絡(luò)中最為顯著的模塊[12]。最后,使用cytoHubba 插件對(duì)最顯著模塊中各基因的連通度進(jìn)行計(jì)算,采用degree 算法來獲取其重要程度排名前10 的關(guān)鍵基因[13]。
2.1 DEGs 的篩選 使用R 軟件中的limma 包分別對(duì)GSE110174 和GSE154851 這2 個(gè)數(shù)據(jù)集的基因表達(dá)數(shù)據(jù)進(jìn)行l(wèi)og 轉(zhuǎn)化、背景校正以及標(biāo)準(zhǔn)化等一系列處理后, 對(duì)其進(jìn)行差異分析。 對(duì)于GSE110174 數(shù)據(jù)集,共篩選出個(gè)754 個(gè)DEGs,包括表達(dá)上調(diào)基因471 個(gè),下調(diào)基因283 個(gè);對(duì)于GSE154851 數(shù)據(jù)集,共篩選出935 個(gè)DEGs,包括表達(dá)上調(diào)基因388 個(gè),下調(diào)基因547 個(gè)。使用R 軟件的ggplot2 包來分別繪制出2 組DEGs 的火山圖,見圖1。采用pheatmap包分別繪制2組中|log2FC|大小排名前50 的DEGs的聚類熱圖,見圖2。最后對(duì)2 組DEGs 取交集,應(yīng)用VennDiagram 包繪制出韋恩圖,見圖3。最終得到共同164 個(gè)共同差異表達(dá)基因,包括上調(diào)基因138 個(gè),下調(diào)基因26 個(gè),這些共同差異表達(dá)基因被確定作為進(jìn)行下一步分析的候選基因。
圖1 DEGs的火山圖
圖2 |log2FC|大小排名前50 DEGs的聚類熱圖
圖3 DEGs的韋恩圖
2.2 DEGs 的功能富集(GO) 和信號(hào)通路(KEGG)分析 通過DAVID 在線數(shù)據(jù)庫(kù)對(duì)上述篩選出的164 個(gè)共同DEGs 進(jìn)行GO 和KEGG 分析。GO 富集分析結(jié)果顯示,這些DEGs 主要參與Ⅰ型干擾素信號(hào)通路、對(duì)病毒的防御反應(yīng)、對(duì)病毒的應(yīng)答反應(yīng)、干擾素γ介導(dǎo)的信號(hào)通路、病毒基因組復(fù)制的負(fù)性調(diào)控、先天性免疫應(yīng)答等生物學(xué)過程;主要富集的細(xì)胞成分包括胞質(zhì)溶膠、胞質(zhì)核周區(qū)、膜筏、線粒體、外泌體等;主要分子功能與RNA合成、雙鏈DNA 合成、蛋白質(zhì)合成、ATP 合成、2'-5'寡腺苷酸合成酶活性、解旋酶活性、核苷酸轉(zhuǎn)移酶活性等有關(guān)。KEGG 通路分析結(jié)果顯示,這些DEGs主要參與甲型流感病毒、麻疹病毒、結(jié)核病、單純皰疹病毒感染、丙型肝炎病毒、RIG-I 樣受體信號(hào)通路、弓形蟲病、Toll 樣受體信號(hào)通路、乙型肝炎病毒等信號(hào)通路。具體結(jié)果見圖4。
圖4 2個(gè)數(shù)據(jù)集中共同DEGs的GO和KEGG分析
2.3 DEGs的PPI網(wǎng)絡(luò)構(gòu)建以及關(guān)鍵基因的篩選 通過STRING 在線數(shù)據(jù)庫(kù)和Cytoscape 軟件構(gòu)建PPI網(wǎng)絡(luò)圖,包含68 個(gè)基因節(jié)點(diǎn)和593 條相互作用關(guān)系,見圖5。利用分子復(fù)合檢測(cè)算法(MCODE)對(duì)基于PPI網(wǎng)絡(luò)中可能與SLE發(fā)病有關(guān)的候選基因模塊進(jìn)行了預(yù)測(cè),根據(jù)篩選條件(degree cutoff=2,node score cutoff=0.2,k-score=2)進(jìn)行篩選,最終得到了一個(gè)得分最高(score=28.067),包含31 個(gè)基因節(jié)點(diǎn),421 條相互作用關(guān)系的最顯著模塊,見圖6。最后,使用cytoHubba 插件對(duì)最顯著模塊中各基因的連接度進(jìn)行了計(jì)算,采用degree 算法來獲取其重要程度排名前10 的關(guān)鍵基因,分別是IRF7、IFI35、OAS3、RSAD2、ISG15、OAS2、MX1、IFIT3、IFIT1、IFIT2,見圖7。
圖5 DEGs的PPI網(wǎng)絡(luò)圖
圖6 PPI網(wǎng)絡(luò)中的最顯著模塊
圖7 Degree算法預(yù)測(cè)的10個(gè)關(guān)鍵基因
SLE 作為一種發(fā)病機(jī)制復(fù)雜、臨床異質(zhì)性大的自身免疫性疾病,其病因目前尚未完全清楚。為了闡明SLE 的潛在分子生物學(xué)機(jī)制,越來越多的研究人員對(duì)微陣列數(shù)據(jù)展開了一系列的研究。本研究通過對(duì)GSE110174 和GSE154851 這2 個(gè)基因芯片數(shù)據(jù)集的生物信息學(xué)分析,初步篩選得到了164 個(gè)共同DEGs。GO 分析結(jié)果顯示,這些DEGs主要參與的生物學(xué)過程有Ⅰ型干擾素(IFN)和干擾素γ信號(hào)通路、對(duì)病毒的防御反應(yīng)、對(duì)病毒的反應(yīng)、對(duì)干擾素α 和β 的反應(yīng)、病毒基因組復(fù)制和Ⅰ型IFN 產(chǎn)物的負(fù)性調(diào)控、免疫應(yīng)答等。有研究顯示,SLE 發(fā)病機(jī)制的一個(gè)重要標(biāo)志是產(chǎn)生針對(duì)核抗原的自身抗體,形成沉積在靶組織內(nèi)的免疫復(fù)合物,激活補(bǔ)體并使炎癥級(jí)聯(lián)反應(yīng)永久化[14]。除了適應(yīng)性免疫應(yīng)答中的異常外,失調(diào)的先天免疫信號(hào)傳導(dǎo)如Ⅰ型IFN 途徑在SLE 的免疫發(fā)病機(jī)制中起著關(guān)鍵作用,其中IFN-α已被確定為關(guān)鍵介質(zhì)[15]。感染作為SLE 常見的危險(xiǎn)因素,在SLE 的發(fā)生發(fā)展過程中發(fā)揮著重要的作用。在本研究中,KEGG 通路富集分析結(jié)果表明,這些DEGs 在與SLE 易感性相關(guān)的感染性疾病中顯著富集,包括甲型流感病毒、麻疹病毒、乙型肝炎、丙型肝炎、結(jié)核病、單純皰疹病毒感染、弓形蟲病以及利什曼原蟲病等。人類的流行病學(xué)研究和動(dòng)物實(shí)驗(yàn)研究表明,某些病毒如乙肝病毒、輪狀病毒、甲型流感病毒、皰疹病毒以及麻疹病毒等可以在自身免疫性疾病的發(fā)展中起著誘發(fā)作用[16]。另外,分子流行病學(xué)數(shù)據(jù)表明,由結(jié)核分支桿菌引起的結(jié)核病在SLE 患者中更為普遍,被認(rèn)為是SLE 發(fā)展的危險(xiǎn)因素[17]。另外有研究報(bào)道,利什曼原蟲病可在宿主體內(nèi)引發(fā)與SLE 自身免疫反應(yīng)相似的臨床征象,表現(xiàn)為發(fā)熱、脾腫大、全血細(xì)胞減少、高丙種球蛋白血癥和自身抗體生成[18]。RIG-I樣受體(RLR)是病毒RNA 傳感器,誘導(dǎo)促炎細(xì)胞因子的分泌并激活Ⅰ型IFN 介導(dǎo)的抗病毒免疫應(yīng)答[19]。在SLE 患者中,B 細(xì)胞對(duì)自身抗原耐受性的喪失是由細(xì)胞內(nèi)的Toll樣受體(TLRs)控制的,其中TLR7驅(qū)動(dòng)參與自身抗體產(chǎn)生和疾病發(fā)病機(jī)制的濾泡外B 細(xì)胞反應(yīng)和生發(fā)中心反應(yīng),TLR7 表達(dá)增加與SLE發(fā)生風(fēng)險(xiǎn)增加有關(guān)[20]。
本研究中采用Cytoscape 軟件中的MCODE 插件識(shí)別出了與SLE 相關(guān)的最顯著模塊,然后運(yùn)用Cytohubba識(shí)別出了10個(gè)關(guān)鍵基因,這些基因參與了SLE 發(fā)病中的重要生物學(xué)過程以及信號(hào)通路。在上述篩選出的關(guān)鍵基因中,IFIT1、IFIT2、IFIT3 屬于IFIT 家族,是受干擾素誘導(dǎo)產(chǎn)生的一類干擾素誘導(dǎo)基因,在抗病毒和免疫調(diào)節(jié)中起著重要作用[21]。有研究發(fā)現(xiàn),鳥苷酸交換因子(GEFs)在調(diào)節(jié)Rho蛋白活化和下游途徑方面發(fā)揮著重要作用,Rho 蛋白家族成員包括RhoA、RhoC、Rac1、Rac2、Rac3 等,是細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)的重要組成部分,參與細(xì)胞骨架重排、細(xì)胞周期調(diào)節(jié)、遷移、吞噬和應(yīng)激反應(yīng)。SLE 患者中IFIT1 mRNA 表達(dá)顯著高于健康對(duì)照組,其可能與Rho/Rac GEF 發(fā)生相互作用,從而參與SLE 免疫反應(yīng)[22-23]。OAS2、OAS3 屬于OAS 家族,是一類受干擾素誘導(dǎo)產(chǎn)生的抗病毒蛋白,在應(yīng)對(duì)病毒感染時(shí)合成次級(jí)信使誘導(dǎo)感染細(xì)胞內(nèi)的RNA 衰變,有效抑制病毒的進(jìn)一步復(fù)制[24]。一項(xiàng)研究顯示,OAS2、OAS3 在SLE 患者的所有CD4 T 細(xì)胞、CD19 B 細(xì)胞和CD33 骨髓細(xì)胞中表達(dá)上調(diào),它們通過介導(dǎo)IFN-α-2a 的促炎作用參與SLE 的發(fā)?。?5]。另外,Grammatikos 等[26]提出,聯(lián)合OAS2、CD70 和IL10 在T 細(xì)胞中的表達(dá)水平可用于診斷和監(jiān)測(cè)SLE 患者的疾病活動(dòng)度。Liu 等[27]將IRF7、ISG15、MX1 以及ISG20 等Ⅰ型IFN 誘導(dǎo)基因作為Ⅰ型IFN評(píng)分,他們發(fā)現(xiàn)與Ⅰ型IFN評(píng)分低的患者相比,Ⅰ型IFN評(píng)分高的患者Ⅱ型IFN評(píng)分和SLEDAI評(píng)分增加,Ⅱ型IFN 通路的上調(diào)導(dǎo)致了自身抗體的積累和隨后的IFN-α活性的增加。另外,在一項(xiàng)注射pristane 藥物誘導(dǎo)miR155 缺陷和野生型小鼠的研究中發(fā)現(xiàn),MX1、IRF7、ISG15 等基因在野生型小鼠中表達(dá)顯著上調(diào)[28]。RSAD2 是一種干擾素誘導(dǎo)基因,參與對(duì)病毒的先天免疫反應(yīng),與多種自身免疫性疾病相關(guān),Sezin 等[29]研究發(fā)現(xiàn),RSAD2 是SLE 發(fā)病機(jī)制中的中樞基因,在SLE 患者中高表達(dá)。IFI35 是一種干擾素誘導(dǎo)基因并且具有亮氨酸拉鏈結(jié)構(gòu)域,缺乏DNA 結(jié)合所必需的基本區(qū)域,但是可以通過N-myc 相互作用域與其結(jié)合伙伴同質(zhì)和異源二聚化[30]。Zhang等[31]發(fā)現(xiàn),在狼瘡性腎炎的腎組織中IFI35 表達(dá)顯著高于對(duì)照組,促進(jìn)了系膜細(xì)胞的增殖。IFI35在腎小球系膜細(xì)胞中表達(dá),激活TLR3的信號(hào)傳導(dǎo)后進(jìn)行Ⅰ型IFN 的表達(dá),從而參與狼瘡性腎炎的發(fā)病[31-32]。
目前國(guó)內(nèi)外也開展了諸多關(guān)于SLE 關(guān)鍵基因和信號(hào)通路方面的研究,如劉音等[33]、周穎等[34]以及Wu 等[35],與本研究不同,其分別針對(duì)GSE32591、GSE61635、GSE65391 數(shù)據(jù)集,通過生物信息學(xué)的方法篩選出了在SLE 發(fā)病中有著重要作用的基因以及信號(hào)通路。與以上3 項(xiàng)研究相比, 本研究篩選出的IRF7、OAS3、RSAD2、ISG15、OAS2、MX1、IFIT3、IFIT1、IFIT2 基因在以上研究中均有報(bào)道,僅IFI35 基因未見報(bào)道。另外,目前僅有少量文獻(xiàn)報(bào)道了IFI35 基因在腎小球系膜細(xì)胞中的相關(guān)機(jī)制,其在SLE 發(fā)病中的作用有待進(jìn)一步研究。
綜上所述,本研究通過對(duì)GEO 數(shù)據(jù)庫(kù)中SLE相關(guān)的2個(gè)基因表達(dá)數(shù)據(jù)集進(jìn)行挖掘,綜合運(yùn)用生物信息學(xué)方法篩選出SLE患者全血細(xì)胞的164個(gè)共同DEGs 以及10 個(gè)關(guān)鍵基因。另外,本研究得到的結(jié)果與其他相關(guān)研究相聯(lián)系,表明了篩選出的10 個(gè)關(guān)鍵基因可能作為SLE 潛在的生物標(biāo)志物,同時(shí)也突出了病毒感染以及Ⅰ型IFN、RIG-I 樣受體、TLRs 等信號(hào)通路在SLE 發(fā)病機(jī)制中的重要作用。本研究通過對(duì)以上基因數(shù)據(jù)的挖掘和分析,有助于對(duì)SLE 的發(fā)病及機(jī)制進(jìn)行更加深入的研究,進(jìn)一步明確SLE 的高靈敏性、高特異性的診斷標(biāo)志物,從而為SLE 的早期基因診斷和開發(fā)新靶點(diǎn)藥物治療提供一定的理論依據(jù)。
沈陽醫(yī)學(xué)院學(xué)報(bào)2023年3期