付 榮,林澤英
(廣州醫(yī)科大學附屬第二醫(yī)院風濕科,廣州 510260)
皮膚型紅斑狼瘡(cutaneous lupus erythematosus,CLE)是一種主要累及皮膚和黏膜組織的自身免疫性疾病。70%~80%系統(tǒng)性紅斑狼瘡(systemic lupus erythematosus,SLE)患者出現(xiàn)皮膚損傷,并常以CLE作為其首發(fā)癥狀[1]。多達23%的CLE患者會發(fā)展為SLE,并且病情在數(shù)年時間內(nèi)有明顯進展[2]。亞急性皮膚型紅斑狼瘡(subacute cutaneous lupus,SCLE)是CLE的一種亞型,其特征表現(xiàn)為排列成銀屑病狀(丘疹鱗狀)或環(huán)狀形態(tài)的鱗狀紅斑丘疹。約50%的SCLE患者符合SLE的診斷標準[3]。這些患者中嚴重中樞神經(jīng)系統(tǒng)疾病、腎臟疾病和嚴重全身性血管炎的發(fā)生率顯著高于無SCLE表現(xiàn)的SLE患者。目前針對SCLE的治療方案主要包括抗瘧藥、糖皮質(zhì)激素、免疫抑制劑和使用防曬劑等,雖然這些治療方案在一定程度上改善了SCLE的進展,但缺乏精準性,長期使用可能帶來嚴重的不良反應(yīng)。
隨著生命科學及信息科學的進展,生物信息學分析工具越來越廣泛地應(yīng)用于醫(yī)學領(lǐng)域。采用先進研究手段深入研究SCLE有助于探討SCLE的發(fā)病機制,尋找潛在治療靶點。本研究通過對美國國家生物技術(shù)信息中心(NCBI)的基因表達匯編(Gene Expression Omnibus,GEO)數(shù)據(jù)庫中SCLE的基因芯片數(shù)據(jù)(GSE81071和GSE109248)進行數(shù)據(jù)挖掘,結(jié)合微陣列技術(shù)和生物信息學分析,篩選出SCLE與正常對照組(NC)組間的差異表達基因(differential expressed genes,DEGs)。隨后進一步對DEGs進行功能富集、信號通路、Hub基因識別等分析,并利用CIBERSORT算法進行22種免疫細胞的分析,確定了SCLE皮膚活檢標本中的關(guān)鍵信號通路、基因及免疫細胞浸潤情況,為疾病認識、藥物開發(fā)等提供新的思路。
GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)中檢索數(shù)據(jù),選擇標準包括:(1)數(shù)據(jù)集包含正常皮膚活檢和SCLE皮膚活檢;(2)樣本種屬為Homo sapiens;(3)基因表達式矩陣。按照這些標準篩選出2個數(shù)據(jù)集(GSE81071和GSE109248)。從GEO網(wǎng)站下載基因表達矩陣和探針注釋文檔,然后根據(jù)提供的注釋文檔將特定探針轉(zhuǎn)換為相應(yīng)的基因名。GSE81071基于GLP19983平臺,包含正常皮膚組織7例,SCLE皮膚組織23例;GSE109248基于GLP10558平臺,包含正常皮膚組織14例,SCLE皮膚組織12例。
利用RStudio1.3.1093軟件通過“Limma”包進行基因表達矩陣的標準化和表達差異分析。篩選出|Log2FC|的差異閾值為1,調(diào)整后P<0.05的DEGs。利用“ggplot2”R包繪制火山圖。
GO分析由3個方面組成,即生物學過程(biology process,BP)、分子功能(molecular funtion,MF)和細胞成分(cellular component,CC),可幫助探討基因群的潛在聯(lián)系和相互作用[4]。KEGG是另一個生物信息數(shù)據(jù)庫,用作說明分子生物學意義和功能[5]。GO分析和KEGG通路富集分析利用“clusterProfiler”R包進行[6]。選取調(diào)節(jié)后P<0.05的通路,利用“ggplot2”R包進行可視化。
利用網(wǎng)站基因分析工具STRING(http://string-db.org)和Metascape(https://metascape.org/gp/index.html)構(gòu)建DEGs的PPI網(wǎng)絡(luò)[7]。利用分子復合物檢測(molecular complex detection,MCODE)[8]篩選出PPI中最顯著模塊。導出PPI分析數(shù)據(jù)至Cytoscape(版本3.8.2),按degree算法在Cytoscape的插件CytoHubba中計算出前10位節(jié)點作為樞紐基因[9]。
數(shù)據(jù)集GSE81071基因表達矩陣進行標準化后利用RStudio及CIBERSORT網(wǎng)站(http://cibersort.stanford.edu/)進行22種免疫細胞浸潤分析[10]。篩選P<0.05的樣本,利用“pheatmap”R包繪制熱圖,“vioplot”R包繪制小提琴圖。
對GSE81071和GSE109248數(shù)據(jù)集進行去批次化處理及標準化后,GSE81071數(shù)據(jù)集篩選出130個DEGs,其中90個上調(diào)基因,40個下調(diào)基因,見圖1A;GSE109248數(shù)據(jù)集篩選出1 516個DEGs,其中879個上調(diào)基因,637個下調(diào)基因,見圖1B。GSE81071上調(diào) |Log2FC|前10位 基因為:KRT6C、CXCL10、CXCL9、PI3、ISG15、OAS1、KRT16、MX1、PARP14和GBP1;下調(diào)基因為IGLV3-1、SCGB2A2、RPL21P28、SMR3A、PLEKHA8P1、RPRML、MT1H、IQCA1L、DAPL1和GMFB。GSE109248上調(diào) |Log2FC|前10位基因為APOBEC3A、CXCL10、OASL、IFIT3、TYMP、ISG15、RSAD2、KLHDC7B、HERC6和IFI44L;下調(diào)基因為UGT3A2、C9ORF127、MRAP、GSTM5、IL17D、ITGA10、MAOA、PPARGC1A、CLEC4GP1和ACP6。
A:GSE8107火山圖;B:GSE109248火山圖。
兩個數(shù)據(jù)集的DEGs取交集,得到34個DEGs(圖2A),進行GO分析(包含BP、MF和CC)及KEGG富集分析。GO分析顯示,BP主要包括對病毒的防御反應(yīng)、對病毒的反應(yīng)、Ⅰ型干擾素信號通路、對Ⅰ型干擾素的細胞反應(yīng)和對Ⅰ型干擾素的反應(yīng)。在CC中,質(zhì)膜外側(cè)組分較有意義。MF主要包括雙鏈RNA結(jié)合過程、腺苷酸轉(zhuǎn)移酶活性、CXCR趨化因子受體結(jié)合、核苷酸轉(zhuǎn)移酶活性及趨化因子活性。KEGG通路富集分析顯示DEGs主要在丙型肝炎、甲型流感、麻疹、EB病毒感染和NOD樣受體(NOD like receptor,NLR)信號通路等富集,見圖2B。GO分析和KEGG通路富集分析結(jié)果的前5位,見表1。
A:GSE8107與 GSE109248韋恩圖;B:GO分析與KEGG富集分析。
表1 DEGs的GO分析和KEGG通路富集分析結(jié)果
使用STRING構(gòu)建DEGs的PPI網(wǎng)絡(luò),除去不連貫的分子,有30個節(jié)點并形成171個連接邊。將DEGs導入Metascape網(wǎng)站并利用MCODE算法識別密集連接的網(wǎng)絡(luò)分子,按P值計算出前3個最有價值通路,見圖3、表2。利用Cytoscape中的CytoHubba選出10個Hub基因CXCL10、DDX58、RSAD2、OAS1、ISG15、OASL、OAS3、MX2、OAS2和GBP1,并繪制交匯網(wǎng)絡(luò),見圖4。在所有DEGs中,CXCL10、DDX58和RSAD2是基于degree算法的核心基因。
圖3 Metascape網(wǎng)站構(gòu)建的DEGs網(wǎng)絡(luò)
按照P<0.05過濾CIBERSORT分析結(jié)果后,GSE81071數(shù)據(jù)集的4例NC和34例SCLE被納入后續(xù)分析。22種免疫細胞表達情況繪制熱圖(圖5A),樣本中CD8+T淋巴細胞、CD4+靜息記憶T淋巴細胞、CD4+活化記憶T淋巴細胞、活化的自然殺傷細胞(NK細胞)、M1巨噬細胞和M2巨噬細胞表達水平較高。與NC組相比,SCLE組CD4+活化記憶T淋巴細胞比例明顯升高(P=0.007),而Tregs細胞比例明顯降低(P=0.001),見圖5B。
圖4 PPI網(wǎng)絡(luò)中的樞紐基因
A:NC與SCLE 22種免疫細胞熱圖;B:NC與SCLE 22種免疫細胞小提琴圖;B cells naive:初始B淋巴細胞;B cells memory:記憶B淋巴細胞;Plasma cells:漿細胞;T cells CD8:CD8+T淋巴細胞;T cells CD4 naive:初始CD4+T淋巴細胞;T cells CD4 memory resting:CD4+靜息記憶T淋巴細胞;T cells CD4 memory activated:CD4+活化記憶T淋巴細胞;T cells follicular helper:濾泡輔助性T淋巴細胞;T cells regulatory(Tregs):調(diào)節(jié)性T淋巴細胞;T cells gamma delta:γ-δT淋巴細胞;NK cells resting:靜息自然殺傷細胞;NK cells activated:活化自然殺傷細胞;Monocytes:單核細胞;Macrophages M0:M0巨噬細胞;Macrophages M1:M1巨噬細胞;Macrophages M2:M2巨噬細胞;Dendritic cells resting:靜息樹突狀細胞;Dendritic cells activated:活化樹突狀細胞;Mast cells resting:靜息肥大細胞;Mast cells activated:活化肥大細胞;Eosinophils:嗜酸性粒細胞;Neutrophils:中性粒細胞。
表2 基于MCODE算法的GO通路
生物信息學分析是一種目前廣泛使用的對基因芯片或高通量測序的大數(shù)據(jù)進行分析的方法。它可以通過比較不同樣本之間在基因組、轉(zhuǎn)錄組、蛋白組、代謝組等方面的差異,篩選出顯著變化的DEGs,通過富集分析篩選出DEGs及富集通路,進而通過數(shù)據(jù)平臺、網(wǎng)絡(luò)工具構(gòu)建分子互作網(wǎng)絡(luò),篩選網(wǎng)絡(luò)關(guān)鍵調(diào)控分子。本研究通過對GSE81071和GSE109248數(shù)據(jù)集的交集進行分析,共篩選出34個DEGs,通過GO分析和KEGG通路富集分析發(fā)現(xiàn):SCLE皮膚組織中Ⅰ型干擾素信號通路和對Ⅰ型干擾素的反應(yīng)通路明顯富集。對病毒的反應(yīng)和對病毒的防御反應(yīng)通路同樣明顯富集,其與Ⅰ型干擾素的釋放和功能也密切相關(guān)。這些證據(jù)提示Ⅰ型干擾素信號通路在SCLE發(fā)病過程中發(fā)揮重要作用。既往研究報道證實,SLE患者血清Ⅰ型干擾素明顯升高且與病情嚴重程度呈正相關(guān)[11-12]。對SLE患者免疫細胞功能紊亂的研究發(fā)現(xiàn),Ⅰ型干擾素信號通路通過促進SLE患者B淋巴細胞增殖、存活及功能的發(fā)揮參與SLE進展[13]。此外,Ⅰ型干擾素信號通路還可以抑制Treg細胞功能,從而增強紫外線照射導致的狼瘡模型小鼠T淋巴細胞的活化[14]。在SLE患者皮膚組織中,由凋亡細胞釋放的DNA和RNA顆??烧T導漿細胞樣樹突狀細胞產(chǎn)生Ⅰ型干擾素[15-16]。這些研究證據(jù)表明,Ⅰ型干擾素信號通路通過調(diào)控及募集免疫細胞至病變組織中促進SCLE發(fā)生、發(fā)展。
本研究進一步通過CIBERSORT探討了SCLE病變組織中免疫細胞浸潤情況。結(jié)果顯示,與NC組相比,SCLE組CD4+活化記憶T淋巴細胞比例明顯升高,而調(diào)節(jié)性T淋巴細胞(Treg)數(shù)目明顯降低。近年來Treg作為維持自身免疫耐受的主要免疫細胞類型受到廣泛關(guān)注。而一旦免疫反應(yīng)和耐受性的平衡被打破,則會發(fā)生包括紅斑狼瘡在內(nèi)的免疫紊亂[16-17]。研究表明,SCLE皮膚組織中Treg數(shù)目明顯減少,表明皮膚免疫耐受強度減弱,免疫反應(yīng)相應(yīng)增強,CD4+活化記憶T淋巴細胞比例明顯升高。有研究表明,在SCLE病變中,趨化因子CXCL9、CXCL10、CXCL11水平與表皮及真皮中CXCR3+CD3+T淋巴細胞分布呈正相關(guān)[18]。另一項研究表明,Ⅰ型干擾素誘導的CXCL10及IP10通過募集CXCR3+T淋巴細胞參與CLE皮膚病變的發(fā)生、發(fā)展[19]。以上證據(jù)提示,SCLE病變組織中免疫耐受被破壞,并且顯著升高的Ⅰ型干擾素可通過募集大量活化的T淋巴細胞參與SCLE皮膚病變進展。
本研究還探討了DEGs與疾病譜之間的關(guān)系,從側(cè)面進一步證明了Ⅰ型干擾素信號通路在SCLE病變發(fā)生、發(fā)展過程中的重要作用。但狼瘡患者α干擾素(IFN-α)水平較高目前原因尚不明確。外源性和內(nèi)源性誘導劑在SLE患者Ⅰ型干擾素誘導方面可能都發(fā)揮了重要作用,對于外源性誘導物,病毒和細菌病原體可能是罪魁禍首,但研究人員目前仍未確定能夠?qū)е耂LE高Ⅰ型干擾素的特定病原體。盡管如此,IFN-α或β干擾素(IFN-β)的產(chǎn)生可能是多種病原體感染或其他外源性Ⅰ型干擾素刺激物誘導或加劇易感個體的全身性自身免疫的常見途徑,如感染或紫外線照射后SLE中常見的情況[18]。NLR信號通路是先天免疫系統(tǒng)的重要組成部分,其屬于細胞內(nèi)模式識別受體,可通過與細胞內(nèi)病原微生物產(chǎn)物識別后激活核因子-κB(NF-κB)通路,促發(fā)炎癥反應(yīng)及免疫反應(yīng)。其中Nod樣受體蛋白3(NLRP3)是NLR亞家族的重要成員。既往研究發(fā)現(xiàn),NLRP3炎癥小體在狼瘡腎炎組織中明顯活化,并參與狼瘡腎炎的進展[19-20],提示靶向NLRP3炎癥小體通路可能成為狼瘡治療的新靶點。
本研究通過基于degree算法的核心基因篩選出CXCL10、DDX58和RSAD2。CXCL10由Ⅰ型干擾素刺激的內(nèi)皮細胞分泌,其通過與CXCR3受體結(jié)合募集炎癥細胞促進炎癥、感染和自身免疫性疾病發(fā)生、發(fā)展[20-22]。研究報道,在多種自身免疫性疾病中CXCL10水平明顯升高,如類風濕性關(guān)節(jié)炎(RA)、SLE、系統(tǒng)性硬化癥和冷球蛋白血癥等[23]。在SLE患者中,CXCL10水平與SLE疾病活動度指數(shù)(SLEDAI)和腎臟病變活動情況呈正相關(guān)[24]。DDX58也稱為RIG-Ⅰ,屬于RIG-Ⅰ樣受體家族,是一種具有925個殘基的細胞質(zhì)病毒RNA受體[25]。DDX58在樹突細胞、上皮細胞、巨噬細胞等多種細胞表達,并在病毒感染過程中表達增加,被認為是與甲流病毒識別相關(guān)的RLR家族中最重要的成員[26]。RSAD2是干擾素誘導基因,參與針對病毒的先天性免疫反應(yīng)[27-28],可激活免疫反應(yīng)并與多種自身免疫性疾病有關(guān),如RA和SLE[28-29]。以上證據(jù)提示CXCL10、DDX58和RSAD2可能是潛在的預測和治療SCLE的生物標志物。但是CXCL10、DDX58和RSAD2參與SCLE發(fā)病的機制目前尚不完全清楚,仍然需要深入、系統(tǒng)的基礎(chǔ)研究進一步探明。
綜上所述,本研究分析了GSE81071和GSE109248數(shù)據(jù)集NC和SCLE皮膚活檢標本的基因表達譜,篩選出34個DEGs,并進行了GO分析和KEGG通路富集分析,發(fā)現(xiàn)SCLE中Ⅰ型干擾素通路顯著活化。利用CIBERSORT進行免疫細胞浸潤分析,發(fā)現(xiàn)SCLE中CD4+活化記憶T淋巴細胞比例明顯升高,而Treg比例明顯下降。采用STRING構(gòu)建PPI網(wǎng)絡(luò),利用Cytoscape中的CytoHubba篩選出CXCL10、DDX58和RSAD2 3個核心基因。本研究為SCLE發(fā)病機制的探索提供了理論基礎(chǔ),并為SCLE的早期診斷和靶向藥物研發(fā)提供了新的思路。