張清泉, 吳春宇, 范勐慷, 潘海燕, 潘 閩
(南通大學(xué)附屬醫(yī)院心內(nèi)科,江蘇省南通市 226001)
擴(kuò)張型心肌病(dilated cardiomyopathy,DCM)是一種涉及遺傳等多種因素的原發(fā)性心臟病,其特點(diǎn)是心室腔擴(kuò)張和心肌收縮能力受損,是最常見的心肌病之一[1]。目前加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)是一種新興的生物信息學(xué)技術(shù)[2],該技術(shù)通過分析基因表達(dá)譜,構(gòu)建相應(yīng)模塊,將模塊與感興趣的臨床信息關(guān)聯(lián)起來。評估組織中免疫細(xì)胞浸潤情況的CIBERSORT算法已成為免疫學(xué)領(lǐng)域常用的技術(shù)方法[3],但目前在DCM組織中暫未使用。本研究通過分析GEO數(shù)據(jù)庫中相應(yīng)的數(shù)據(jù)集,探討與DCM發(fā)生相關(guān)的核心基因和免疫細(xì)胞浸潤情況。
從GEO基因表達(dá)綜合數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)[4]下載基因芯片數(shù)據(jù)集(GSE79962、GSE3585和GSE42955)。將3組數(shù)據(jù)集的DCM樣本以SVA程序包進(jìn)行批次矯正后合并,用于后續(xù)免疫細(xì)胞浸潤分析。GSE79962數(shù)據(jù)集包括11個(gè)健康對照樣本及7個(gè)DCM樣本;GSE3585數(shù)據(jù)集包括5個(gè)健康對照樣本及7個(gè)DCM樣本;GSE4295數(shù)據(jù)集包括5個(gè)健康對照樣本及12個(gè)DCM樣本。所有數(shù)據(jù)集以Affy程序包依據(jù)各自平臺(tái)文件,進(jìn)行背景消除,去除缺失、低表達(dá)、無對應(yīng)的基因探針,最終共注釋到21 632個(gè)基因。
采用Limma程序包在GSE79962數(shù)據(jù)集中,從21 632個(gè)基因中進(jìn)行差異表達(dá)基因的篩選,閾值設(shè)置為|log2fold change (FC)|≥1.5,矯正后P<0.05。采用WGCNA程序包[2]對GSE79962數(shù)據(jù)集中所有納入樣本及基因進(jìn)行聚類,以合適的剪切線剔除離群樣本。基因的相關(guān)矩陣由基因間的相關(guān)系數(shù)組成,根據(jù)適當(dāng)?shù)能涢撝?本研究軟閾值為8)將鄰接矩陣轉(zhuǎn)換為拓?fù)渲丿B矩陣,并將相似的基因放入同一個(gè)模塊(本研究每個(gè)模塊基因最小為50,切割高度為0.25)中。將臨床信息與基因模塊相結(jié)合,以分析基因顯著性(gene significance,GS)和模塊成員(module membership,MM)。
將核心模塊中的基因與差異表達(dá)基因進(jìn)行重疊,鑒定出共同基因。將共同基因輸入在線STRING數(shù)據(jù)庫(https://string-db.org)[5]預(yù)測蛋白質(zhì)水平的互作關(guān)系,然后輸入Cytoscape軟件,進(jìn)行PPI網(wǎng)絡(luò)的構(gòu)建。根據(jù)最大集團(tuán)中心(maximal clique centrality,MCC)的方法選擇核心樞紐基因。將上述核心基因在外部基因集中進(jìn)行驗(yàn)證,確定核心基因在DCM組織中的表達(dá)異常,并采用ROC曲線下面積(AUC)值對核心基因的診斷效能進(jìn)行判定。
利用R軟件中的相關(guān)程序包(Cluster profiler、GOplot以及ggplot2)對來自核心模塊基因進(jìn)行基因本體論(gene ontology,GO)和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)分析。
CIBERSORT是一種使用547個(gè)基因表達(dá)值來估算組織中22個(gè)免疫細(xì)胞含量的算法,可用于腫瘤、非腫瘤組織、血液樣本[6]。計(jì)算DCM組織中22個(gè)免疫細(xì)胞的比例,并與正常心肌進(jìn)行對比。
應(yīng)用R軟件v3.6.3版本對轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析。其中Fisher精確檢驗(yàn)計(jì)算GO及KEGG富集條目值,Pearson法進(jìn)行相關(guān)性分析,Wilcox檢驗(yàn)分析免疫細(xì)胞含量差異。P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
在GSE79962數(shù)據(jù)集中鑒定出35個(gè)差異表達(dá)基因(圖1)。其中相對于正常心肌組織的顯著上調(diào)基因共計(jì)21個(gè),下調(diào)基因共14個(gè)。
圖1 篩選GSE79962數(shù)據(jù)集中的差異表達(dá)基因
在GSE79962數(shù)據(jù)集中共富集出5個(gè)基因模塊(圖2A),藍(lán)色模塊與DCM發(fā)生的相關(guān)性最高(圖2B),相關(guān)系數(shù)為0.91,該模塊共包含114個(gè)基因。
圖2 加權(quán)共表達(dá)網(wǎng)絡(luò)中核心模塊的鑒定
核心模塊中的114個(gè)基因與35個(gè)差異表達(dá)基因有11個(gè)交集基因(圖3A),構(gòu)建PPI網(wǎng)絡(luò)(圖3B),篩選出5個(gè)核心基因F13A1、VSIG4、CD163、RNASE2及LYVE1(圖3C)。篩選數(shù)據(jù)集GSE79962中,核心基因在DCM心肌組織中顯著低表達(dá),外部數(shù)據(jù)集GSE42955和GSE3585同樣顯示核心基因在DCM心肌組織中表達(dá)下調(diào)(P<0.05),且核心基因均具有較好的診斷效能(AUC>0.7;圖3D)。
圖3 DCM中核心基因的鑒定與表達(dá)驗(yàn)證
核心模塊中的114個(gè)基因主要富集在急性炎癥反應(yīng)、炎癥反應(yīng)調(diào)節(jié)等生物學(xué)過程,并且與吞噬體、補(bǔ)體、凝血級聯(lián)等通路有關(guān)(圖4)。
圖4 核心模塊中的基因富集分析
DCM組織中漿細(xì)胞、Tregs細(xì)胞、中性粒細(xì)胞較健康心肌組織的含量更高(P<0.05),而記憶B細(xì)胞和M2型巨噬細(xì)胞的含量低于健康心肌組織(P<0.05;圖5)。
圖5 健康心肌組織及DCM心肌組織中的免疫細(xì)胞的浸潤差異
DCM是全球猝死和心力衰竭的主要原因之一[6],然而,導(dǎo)致DCM的病因尚不完全清楚,可能包括感染、非感染性炎癥、中毒、內(nèi)分泌代謝紊亂、遺傳、外傷等原因[7]。本文GO和KEGG富集分析結(jié)果顯示,與DCM發(fā)生有關(guān)的基因模塊顯著富集于吞噬體、補(bǔ)體系統(tǒng)等相關(guān)通路。這提示原發(fā)性DCM發(fā)生發(fā)展過程中,免疫也參與了主要環(huán)節(jié),相關(guān)文獻(xiàn)[8]也揭示了使用免疫吸附方法可改善DCM的左心室功能。CIBERSORT算法結(jié)果顯示DCM組織中漿細(xì)胞、Tregs細(xì)胞、活化NK細(xì)胞和中性粒細(xì)胞表現(xiàn)出較健康心肌組織更高的浸潤模式,而記憶B細(xì)胞和M2型巨噬細(xì)胞浸潤的程度較低。在一項(xiàng)163例DCM患者心肌組織的免疫組化研究中[9],多因素回歸分析中提示CD163與膠原面積顯著相關(guān),提示M2型巨噬細(xì)胞與膠原形成之間的關(guān)聯(lián),并表明巨噬細(xì)胞向M2型分化與CD163表達(dá)可能與DCM中的心室重構(gòu)有關(guān)。RNASE2基因作為一種RNA結(jié)合蛋白相關(guān)基因已參與包括胃癌[10]、腎透明細(xì)胞癌[11]的預(yù)后鑒定,該基因在所有入組的自身免疫性疾病患者中均較健康患者下調(diào)[12]。相關(guān)的生物信息學(xué)文章將該基因鑒定為M2型巨噬細(xì)胞共表達(dá)因子,并可參與調(diào)節(jié)腫瘤的免疫微環(huán)境[13]。與VSIG4基因類似,F(xiàn)13A1與IL-1Ra、IL-10和MMP9被鑒定為動(dòng)脈粥樣硬化中NOR1的潛在靶基因,并在人類替代性巨噬細(xì)胞極化時(shí)被誘導(dǎo),并刺激M2表型標(biāo)志物的表達(dá)[14]。
心肌組織微環(huán)境中的免疫細(xì)胞是免疫療法的核心,在DCM病理過程中,由單核細(xì)胞/巨噬細(xì)胞、中性粒細(xì)胞和嗜酸性粒細(xì)胞介導(dǎo)的先天反應(yīng)與適應(yīng)性反應(yīng)發(fā)揮最終效應(yīng)。另外Th17是導(dǎo)致DCM過程的主要驅(qū)動(dòng)因素[15]。本文結(jié)果僅CD163基因與活化的肥大細(xì)胞呈正相關(guān)性,可能由于CD163基因表達(dá)巨噬細(xì)胞特異性蛋白,提示在DCM免疫微環(huán)境中,被鑒定出的核心基因CD163與肥大細(xì)胞的增殖互為因果。
綜上所述,本研究基于生物信息學(xué)方法,針對DCM患者心肌組織的測序集,進(jìn)行靶向基因及免疫微環(huán)境的探究。但該研究有仍一些局限性。①必須要對核心基因進(jìn)行體外、體內(nèi)實(shí)驗(yàn)驗(yàn)證,來進(jìn)一步解釋DCM的潛在機(jī)制;②雖然CIBERSORT算法作為經(jīng)典的bulk-RNA反卷積工具,但也需要進(jìn)一步的實(shí)驗(yàn)來明確相關(guān)免疫細(xì)胞浸潤的豐度。③目前臨床上將DCM主要分為原發(fā)性和繼發(fā)性,本文納入的測序數(shù)據(jù)雖僅關(guān)注原發(fā)性DCM,但原發(fā)和繼發(fā)并不相互排斥。