周豪坤 丁興紅 陳俊利 黃惠蓮 錢俊華 (浙江中醫(yī)藥大學(xué),杭州 310053)
系統(tǒng)性紅斑狼瘡(systemic lupus erythematosus,SLE)是一種因免疫系統(tǒng)對自身抗原免疫耐受減弱或消失而導(dǎo)致的自身免疫性疾?。?]。狼瘡腎炎(lupus nephritis,LN)是SLE 的一種嚴(yán)重并發(fā)癥,多以免疫細(xì)胞和細(xì)胞因子浸潤、腎小球和腎小管間質(zhì)損失為特征[2]。10%的患者在發(fā)病后5 年內(nèi)會(huì)發(fā)展為終末期腎?。╡nd stage renal disease,ESRD),需要通過透析或腎臟移植來維持生命[3]。LN 具有復(fù)雜的病理過程和較長的病程。目前診斷和治療LN 的標(biāo)準(zhǔn)并不令人滿意,而且不可能準(zhǔn)確地預(yù)測患者對治療的反應(yīng)或個(gè)別患者的長期結(jié)果[4]。近年來,也許是因?yàn)楦婕?xì)致的狼瘡管理方法,歐洲LN 患者的嚴(yán)重程度有所下降,但在北美及我國由LN 導(dǎo)致的ESRD發(fā)生率一直居高不下[5]。
免疫介導(dǎo)的炎癥反應(yīng)是LN 的主要啟動(dòng)因素[3],但其導(dǎo)致ESRD 的具體機(jī)制卻不甚明確,目前還沒有針對LN的生物療法?,F(xiàn)有的有關(guān)LN臨床試驗(yàn)的設(shè)計(jì)中亦存在許多未解決的問題,從而影響了對試驗(yàn)結(jié)果的解釋。因此迫切需要更有效的診斷方法,識別新的生物標(biāo)志物和分子機(jī)制,以便早期發(fā)現(xiàn)和處理LN。
由于有效的診斷實(shí)驗(yàn)數(shù)量有限,一些研究通過高通量測序和生物信息學(xué)來研究與LN 相關(guān)的基因和/或分子特征,為識別LN 相關(guān)的關(guān)鍵基因、網(wǎng)絡(luò)和通路提供了策略[6-7]。基因表達(dá)譜作為同時(shí)檢測數(shù)千個(gè)基因的高通量數(shù)據(jù)可對其進(jìn)行分析,以篩選出與疾病分子機(jī)制相關(guān)的顯著差異表達(dá)基因(differen?tially expressed gene,DEG)。既往的高通量測序及基因芯片研究表明DEG 可通過不同信號通路、生物過程或分子機(jī)制參與LN 的發(fā)生發(fā)展[8-9]。然而,其下游分析鮮有涉及基因間的相關(guān)性以及基因與臨床特征間的關(guān)系。加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)廣泛應(yīng)用于描述微陣列或RNA-seq中基因表達(dá)和臨床特征之間復(fù)雜的相關(guān)性,并為疾病的診斷和治療尋找潛在的生物標(biāo)志物。其通過構(gòu)建基因與表型間的基因共表達(dá)網(wǎng)絡(luò),發(fā)現(xiàn)與臨床性狀高度相關(guān)的重要模塊,并篩選出樞紐基因,從而對探索疾病的分子機(jī)制提供思路[10]。與基因芯片和高通量測序分析相比,WGCNA 適合進(jìn)行多種統(tǒng)計(jì)學(xué)檢驗(yàn),通過分析基因之間的相關(guān)性,避免根據(jù)某固定閾值篩選而丟失基因的變化趨勢信息。
本研利用WGCNA 篩選與LN 高度相關(guān)的基因模塊。根據(jù)關(guān)鍵模塊和DEGs 的網(wǎng)絡(luò)拓?fù)渚C合分析,對候選基因進(jìn)行篩選,以發(fā)現(xiàn)新的候選生物標(biāo)志物和治療靶點(diǎn)。
1.1 數(shù)據(jù)的采集與預(yù)處理 本研究通過下載GEO數(shù)據(jù)庫數(shù)據(jù)集GSE86425(包含54 例LN 小鼠腎臟組織樣本和41 例正常小鼠組織樣本)。數(shù)據(jù)集基于GPL11180 Affymetrix HT MG-430 PM Array Plate 微陣平臺測序。應(yīng)用R 語言對原始數(shù)據(jù)進(jìn)行消除背景、標(biāo)準(zhǔn)化數(shù)據(jù)、基因注釋、構(gòu)建表達(dá)矩陣等預(yù)處理。去除缺失、重復(fù)及低表達(dá)的基因探針。
1.2 加權(quán)共表達(dá)網(wǎng)絡(luò)構(gòu)建 利用R 語言WGCNA包[10]構(gòu)建加權(quán)共表達(dá)網(wǎng)絡(luò)。使用pickSoftThreshold函數(shù)獲得相鄰函數(shù)加權(quán)參數(shù)的最優(yōu)值,將其作為軟閾值,用于后續(xù)網(wǎng)絡(luò)構(gòu)建[11]。然后構(gòu)建加權(quán)鄰接矩陣,并基于拓?fù)渲丿B矩陣(TOM)的相異度度量(1-TOM)的分層聚類來構(gòu)建相關(guān)基因模塊[12]。
1.3 重要模塊的識別和功能分析 為確定各模塊的生物學(xué)意義,以模塊特征基因(MEs)為主成分篩選基因與臨床性狀的潛在相關(guān)性,總結(jié)各模塊基因的表達(dá)模式。然后計(jì)算模塊顯著性(MS)與模塊內(nèi)的平均基因顯著性(GS),衡量與樣本性狀(包括造模時(shí)長和疾病有無)相關(guān)的模塊表達(dá)模式間的相關(guān)性[13]。一般來說,模塊的MS 值越高則越重要[14]。使用R 軟件的“clusterProfiler”包[15]對核心模塊中的基因進(jìn)行基因本體論(GO)和京都基因和基因組百科全書(KEGG)途徑富集分析,以確定LN 的潛在發(fā)病機(jī)制和生物學(xué)途徑。
1.4 DEGs 的鑒定與功能富集 利用R 語言的“LIMMA”軟件包[16]設(shè)定|Log2FC|>1 且P<0.05 篩選LN 和正常腎臟組織樣本間的DEGs。使用“cluster?Profiler”和“pathview”包[17]對差異基因進(jìn)行GO 功能富集分析和KEGG信號通路分析。
1.5 LN高風(fēng)險(xiǎn)關(guān)鍵基因的篩選 高風(fēng)險(xiǎn)差異表達(dá)基因?yàn)閃GCNA 篩選出的模塊中的基因與DEGs 中的共同致病基因。
1.6 LN 關(guān)鍵基因的篩選 將篩選出的高風(fēng)險(xiǎn)DEGs 導(dǎo)入STRING 數(shù)據(jù)庫構(gòu)建PPI 網(wǎng)絡(luò),使用Cyto?scape3.7.2[18]將LN 高風(fēng)險(xiǎn)基因可視化,并分別使用插件“Cytohubba”[19]和“CytoNCA”[20]獲取關(guān)鍵基因。
1.7 模型制備 雌性狼瘡易感(SNF1)裸鼠20 只,體質(zhì)量(18.0±0.7)g,購自北京維通利華實(shí)驗(yàn)動(dòng)物有限公司并飼養(yǎng)于天津中醫(yī)藥大學(xué)實(shí)驗(yàn)動(dòng)物中心[動(dòng)物合格證號:SYXK(京)2016-0001]。選擇體質(zhì)量相近的裸鼠用隨機(jī)數(shù)字表編號后,隨機(jī)均分為對照組和模型組(n=10),適應(yīng)性喂養(yǎng)1周后開始實(shí)驗(yàn)。采用單次腹腔注射0.5 ml降植烷的方法構(gòu)建SLE模型[21]。對照組以0.5 ml/只單次腹腔注射PBS 溶液。每周定期觀察裸鼠皮膚改變,3 個(gè)月后以裸鼠皮膚出現(xiàn)紅斑樣皮損、關(guān)節(jié)腫大及類風(fēng)濕關(guān)節(jié)炎癥狀,血清抗dsDNA 抗體、抗C1q 抗體顯著上升及補(bǔ)體C3、C4水平下降為造模成功[22]。
1.8 LN 腎臟組織總RNA 提取及RT-PCR 檢測 采用RT-PCR 驗(yàn)證上述小鼠腎臟組織的4 個(gè)Hub 基因的表達(dá)變化。按照說明書用TRIzol試劑從腎臟組織中提取總RNA,采用PrimerScript ⅡFirst Strand cDNA 合成試劑盒反轉(zhuǎn)錄成cDNA。采取反應(yīng)體系10 μl進(jìn)行PCR 擴(kuò)增,95 ℃5 min 預(yù)變性,95 ℃10 s,60 ℃30 s,45 個(gè)循環(huán)。熔解曲線65~95 ℃。利用美國國家生物信息中心(NCBI)Primer-BLAST 設(shè)計(jì)引物(序列見表1),由生工生物工程(上海)股份有限公司合成,以2-ΔΔCt法計(jì)算相對mRNA 表達(dá)量,并與對照組(β-actin mRNA表達(dá)量)進(jìn)行比較。
表1 PCR引物序列Tab.1 PCR primer sequences
1.9 統(tǒng)計(jì)學(xué)分析 使用GraphPad Prism8.0 進(jìn)行統(tǒng)計(jì)分析。對符合正態(tài)分布的兩組數(shù)據(jù)進(jìn)行t檢驗(yàn),P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
2.1 共表達(dá)網(wǎng)絡(luò)的構(gòu)建 從GEO 數(shù)據(jù)庫中下載GSE86425的原始數(shù)據(jù)集,使用R語言對原始數(shù)據(jù)進(jìn)行背景校正及歸一化等預(yù)處理,刪除重復(fù)和未識別的基因后,共得到43 481個(gè)基因(圖1A)。根據(jù)無尺度擬合指數(shù)R2首次為0.9 時(shí)確定了最佳軟閾值為β=16(圖1B),此時(shí),網(wǎng)絡(luò)的平均連接程度相對較高,能夠包含足夠的信息。將MEDissThres 設(shè)置為0.5以合并距離相近且相似的模塊,設(shè)置最小模塊的基因數(shù)目為30 個(gè),剪切高度為0.25,生成86 個(gè)模塊(圖2)。其中red 模塊中有3 902 個(gè)基因,darkred 模塊有3 055 個(gè)基因,blue 模塊有3 082 個(gè)基因,brown模塊有2 884 個(gè)基因,灰色代表未被納入任何模塊的基因,故該模塊被排除在進(jìn)一步分析之外。
圖1 樣本聚類樹及共表達(dá)網(wǎng)絡(luò)的構(gòu)建Fig.1 Construction of sample clustering trees and co-expres?sion networks
圖2 篩選LN的共同表達(dá)模塊Fig.2 Screening co-expression module of LN
2.2 模塊間的相關(guān)性與重要模塊的識別 為了尋找所有模塊的共表達(dá)相似性,根據(jù)模塊間的相關(guān)性計(jì)算特征基因,與其他模塊相比,brown 模塊與LN的有無呈正相關(guān)[0.44(P=0.000 01)](附圖1,www.immune99.com),提示此模塊中的基因可能在LN 的發(fā)生發(fā)展中起重要作用。圖3 顯示了棕色模塊基因顯著性(gene significance,GS)和模塊成員(module membership,MM)相 關(guān) 系 數(shù) 為0.86(P<1e-200),因此,brown 模塊被認(rèn)為是與LN 疾病狀態(tài)相關(guān)的重要模塊。
圖3 模塊成員和基因重要性之間的相關(guān)性Fig.3 Correlation between module membership and gene importance
2.3 重要模塊中基因的富集分析 使用cluster?Profiler 包對brown 模塊中的基因進(jìn)行GO 和KEGG富集分析,根據(jù)顯著性程度,GO 功能富集分析與KEGG 通路分析均以P≤0.05 表示差異具有統(tǒng)計(jì)學(xué)意義。GO 富集分析共獲得767 條GO 條目,結(jié)果顯示,brown 模塊中的蛋白主要通過T 細(xì)胞活化、細(xì)胞黏附的正向調(diào)節(jié)及細(xì)胞因子產(chǎn)生的正向調(diào)節(jié)等生物過程發(fā)揮作用。在細(xì)胞構(gòu)成方面主要與細(xì)胞外基質(zhì)和含膠原蛋白的細(xì)胞外基質(zhì)有關(guān);在分子功能方面主要涉及肌動(dòng)蛋白結(jié)合、細(xì)胞黏附分子結(jié)合及細(xì)胞外基質(zhì)結(jié)構(gòu)成分等。分別從生物過程(biologi?cal processes,BP)、細(xì)胞成分(cellular component,CC)、分子功能(molecular function,MF)3 個(gè)層面選取P值排名前10 的功能信息,結(jié)果見圖4A。KEGG通路注釋分析結(jié)果顯示,潛在靶點(diǎn)涉及319 條相關(guān)信息通路,經(jīng)調(diào)研發(fā)現(xiàn)其中與LN 密切相關(guān)的信號通路有5 條,包括細(xì)胞因子-細(xì)胞因子受體相互作用、TNF 信號通路、Th17 細(xì)胞分化、Toll 樣受體信號通路、NF-κB 信號通路、Th1 和Th2 細(xì)胞分化、NOD-類受體信號通路、T細(xì)胞受體信號通路、ECM 受體相互作用、IL-17 信號通路等。圖4B 為P值較小的前20條相關(guān)通路信息。
圖4 重要模塊中基因的富集分析Fig.4 Enrichment analysis of genes in important modules
2.4 LN DEGs的篩選功能富集 數(shù)據(jù)集GSE78851包括54 例LN 腎臟標(biāo)本和41 例正常小鼠腎臟標(biāo)本,用LIMMA 軟件包以P-value<0.05 和|logFC|≥1 為條件,共篩選出294 個(gè)DEGs,其中上調(diào)基因271 個(gè),下調(diào)基因23 個(gè)(圖5)。對294 個(gè)DEGs 進(jìn)行GO 分析,主要涉及白細(xì)胞遷移、中性粒細(xì)胞趨化作用、細(xì)胞因子介導(dǎo)的信號傳導(dǎo)途徑、對防御反應(yīng)的正向調(diào)節(jié)等生物過程(圖6)。
圖5 DEGs的篩選Fig.5 Screening of DEGs
圖6 DEGs的GO富集分析Fig.6 GO enrichment analysis of DEGs
2.5 重要模塊與DEGs 間關(guān)鍵基因的篩選 如圖7A 所示,將DEGs 和brown 模塊中的基因進(jìn)行映射,獲得了252 個(gè)LN 的相關(guān)基因,隨后,將225 個(gè)交集基因?qū)隨TRING 數(shù)據(jù)庫構(gòu)建PPI 網(wǎng)絡(luò)(圖7B)。利用Cytoscape軟件的CytoHubba插件MCC算法篩選出排名前20位的節(jié)點(diǎn)(圖7C)。此外,采用CytoNCA插件中的Degree 算法得到排名前20 位的節(jié)點(diǎn)(圖7D)。最終將兩種算法獲得的基因相互映射取交集,確定了4 個(gè)關(guān)鍵基因,即Hub 基因:Trim30a、Cxcl10、Irf7和Stat1(圖7E)。
圖7 Hub基因的篩選Fig.7 Screening of Hub genes
2.6 RT-PCR 驗(yàn) 證Hub 基 因 RT-PCR 分 別 驗(yàn) 證SNF1 裸鼠對照組和LN 組腎臟組織中的Hub 基因。結(jié)果表明,LN 小鼠腎臟Hub基因的mRNA 表達(dá)水平均顯著高于正常對照組(P<0.01,圖8)。
圖8 Hub基因mRNA表達(dá)水平Fig.8 mRNA expression levels of Hub genes
LN 是SLE 最常見的表現(xiàn)之一,直接影響SLE 的預(yù)后,約40%的SLE患者伴有LN[2]。LN的病情活動(dòng)及治療效果可能會(huì)影響其預(yù)后[23],因此早期對LN患者病情進(jìn)行準(zhǔn)確地診斷及評估,有助于指導(dǎo)其臨床治療,提高治療效果。本研究采用生物信息學(xué)方法,從LN 和正常腎臟組織中獲取LN 的生物標(biāo)志物及其病理過程。利用WGCNA 分析GSE86425 數(shù)據(jù)集,以探索與LN 臨床特征相關(guān)的重要模塊,結(jié)果獲得86個(gè)模塊,其中LN與brown模塊的相關(guān)性最為顯著。與其他生物信息學(xué)分析相比,WGCNA 可全面系統(tǒng)地計(jì)算出共表達(dá)模塊與疾病臨床特征間的關(guān)聯(lián),其篩選出的生物標(biāo)志物具有高可靠性和準(zhǔn)確性[24]。對brown 模塊進(jìn)行GO 功能注釋分析發(fā)現(xiàn),模塊中蛋白主要富集于T 細(xì)胞活化、細(xì)胞因子產(chǎn)生的正向調(diào)節(jié)、細(xì)胞外基質(zhì)結(jié)構(gòu)成分等生物過程;關(guān)鍵模塊蛋白的KEGG 通路分析也富集到了細(xì)胞因子-細(xì)胞因子受體相互作用、Th17 細(xì)胞分化、NF-κB 信號通路、Th1 和Th2 細(xì)胞分化及IL-17 信號通路,揭示機(jī)體內(nèi)T細(xì)胞狀態(tài)及炎癥因子等免疫相關(guān)過程的改變,可能是LN 發(fā)生的重要環(huán)節(jié)。有研究表明,CD4+T 輔助性細(xì)胞(Th)在LN 等自身免疫性疾病的發(fā)生發(fā)展中發(fā)揮重要作用。Th1、Th17 等Th 細(xì)胞亞群和Treg 可通過誘導(dǎo)抑制其他免疫細(xì)胞增殖、分化和活化調(diào)節(jié)相關(guān)免疫反應(yīng)[25]。LN 患者中Th1/Th2增高,高于健康對照組和無蛋白尿的SLE患者組,在有彌漫增殖性LN 的患者中這一傾向尤為明顯[26]。KOMIYAMA 等[27]認(rèn)為IL-17 表達(dá)量與LN 的嚴(yán)重程度密切相關(guān),在LN 患者腎小球和腎間質(zhì)浸潤T細(xì)胞中可檢測出大量IL-17[28]。IL-17 可通過刺激上皮細(xì)胞和成纖維細(xì)胞分泌趨化因子或炎癥介質(zhì),導(dǎo)致炎癥細(xì)胞浸潤,從而參與LN 的發(fā)生發(fā)展[29]?;诖耍琓 細(xì)胞水平及炎癥因子可能為LN 的治療提供潛在靶點(diǎn)。
此外,對LN 和正常腎臟組織進(jìn)行基因差異表達(dá)分析,篩選出294個(gè)DEGs?;贕O 富集分析,發(fā)現(xiàn)DEGs 參與白細(xì)胞遷移、中性粒細(xì)胞趨化作用、細(xì)胞因子介導(dǎo)的信號傳導(dǎo)途徑等。值得注意的是,白細(xì)胞表面標(biāo)志物整合素Mac-1 和CD16b 被認(rèn)為與LN的發(fā)病有關(guān)[30]。Mac-1包括一個(gè)獨(dú)特的α亞單位(CD11b)與一個(gè)共同的β2 亞單位復(fù)合,在包括LN在內(nèi)的炎癥條件下與CD16b 一起從特定的白細(xì)胞亞群中釋放出來[31]。KITAGAWA 等[32]發(fā)現(xiàn)體液中的CD11b 可能通過調(diào)節(jié)腎小球白細(xì)胞的積聚而參與LN的病理進(jìn)展。
通過對WGCNA 重要模塊的網(wǎng)絡(luò)拓?fù)浞治龊虳EGs 的綜合分析,確定了Trim30a、Cxcl10、Irf7 和Stat1 4 個(gè)Hub 基因,并通過RT-PCR 驗(yàn)證。Trim30a隸屬于TRIM 蛋白家族,是一種來自輔助性和誘導(dǎo)性T細(xì)胞的胞內(nèi)蛋白,在免疫應(yīng)答、代謝調(diào)控等方面均發(fā)揮重要作用,能夠調(diào)節(jié)特殊細(xì)胞因子的核酸表達(dá)[33-34]。LN 患者體內(nèi)免疫信號過度激活引發(fā)持續(xù)性炎癥反應(yīng),損害宿主細(xì)胞。而Trim30 等天然免疫應(yīng)答分子可通過相應(yīng)的負(fù)反饋調(diào)節(jié)因子嚴(yán)格控制相關(guān)免疫通路的激活,進(jìn)而保護(hù)機(jī)體不受損傷[35]。有研究人員發(fā)現(xiàn)Trim30a 可通過減少體內(nèi)ROS 的產(chǎn)生控制NLRP3 受體的激活,使Caspase-1 和IL-1β 減少,避免LN 等疾病導(dǎo)致的過度的炎癥反應(yīng)給機(jī)體帶來傷害[36]。CXCL10 為重要的免疫調(diào)節(jié)因子,可與受體結(jié)合后,激活CD4+的T 細(xì)胞、巨噬細(xì)胞及自然殺傷細(xì)胞,促使其向腎臟組織中積聚,誘發(fā)免疫相關(guān)炎癥反應(yīng)[37]。國內(nèi)研究人員發(fā)現(xiàn)LN 患者血清中CXCL10 表達(dá)升高,促進(jìn)病變進(jìn)展[38]。干擾素調(diào)控基因7(Irf7)是通路的轉(zhuǎn)錄調(diào)節(jié)因子,是Ⅰ-IFN 通路的主要調(diào)控者。研究表明干擾素刺激基因及趨化因子的表達(dá)水平在LN 患者機(jī)體內(nèi)顯著升高,并且與腎炎活動(dòng)性呈正相關(guān)[39]。腎臟的表達(dá)譜芯片亦提示LN 的腎臟組織中免疫細(xì)胞的活化等多條通路上調(diào),包括Irf7 的表達(dá)水平較正常腎臟及單純SLE 腎臟組織顯著增高[40]。陳潔[41]發(fā)現(xiàn)Irf7 在LN患者腎中的蛋白水平和mRNA水平均有高表達(dá),Irf7的腎小球表達(dá)積分與SLE 疾病的活動(dòng)度、抗ds-DNA抗體、LN 的活動(dòng)性評分呈現(xiàn)明顯的正相關(guān),而與血清C3、Ccr 呈負(fù)相關(guān)。以上均提示Irf7 分子可能是LN 發(fā)病的關(guān)鍵。Stat1 是信號轉(zhuǎn)導(dǎo)子和轉(zhuǎn)錄激活因子(Stat)家族成員,常以非活性的形式存在于細(xì)胞質(zhì),活化后的Stat1 參與調(diào)控細(xì)胞的分化和凋亡等[42-43]。研究人員用LN 患者的血清分別刺激人腎小球系膜細(xì)胞和人腎小球內(nèi)皮細(xì)胞,模擬LN 體內(nèi)環(huán)境,發(fā)現(xiàn)IL-10 及TNF-α 等炎癥因子表達(dá)增高,表明Stat1與LN 腎臟細(xì)胞釋放促炎癥因子的相關(guān)過程有關(guān)[44-45]。此外,臨床研究也提示,LN患者體內(nèi)T細(xì)胞中Stat1表達(dá)水平為單純SLE患者的2.04倍,患者腎小管上皮細(xì)胞及腎小球中Stat1表達(dá)水平越高,預(yù)后則越差[46-47]。
綜上所述,本文利用WGCNA、差異分析等多種生物信息學(xué)方法探討了LN 可能的發(fā)病機(jī)制,富集到多個(gè)有意義的生物學(xué)過程和通路。其中,T 細(xì)胞活化、細(xì)胞因子產(chǎn)生的正向調(diào)節(jié)及白細(xì)胞遷移等過程的改變可能是LN 發(fā)生的重要環(huán)節(jié)。篩選出的4 個(gè)Hub 基因雖經(jīng)過基礎(chǔ)實(shí)驗(yàn)驗(yàn)證,但樣本量較小,后續(xù)仍需大樣本進(jìn)行進(jìn)一步研究,以篩選出靈敏性和特異性高的診斷標(biāo)志物,為LN 的早期診斷和靶向藥物研究提供重要參考。