夏守兵,許春杰,蔣春暉,顧 磊,孫隆慈,徐 慶
上海交通大學(xué)醫(yī)學(xué)院附屬仁濟(jì)醫(yī)院胃腸外科,上海 200127
潰瘍性結(jié)腸炎(ulcerative colitis,UC),又稱特發(fā)性潰瘍性結(jié)腸炎,是一種起始于直腸的非特異性慢性腸道炎癥性疾病,目前發(fā)病原因尚不明確。UC可發(fā)病于任何年齡,但多見于青春末期和成年早期。臨床癥狀主要以持續(xù)或反復(fù)發(fā)作的腹瀉、黏液膿血便為主,可伴有不同程度的全身癥狀。遷延不愈的患者最后可發(fā)展為炎癥相關(guān)惡性腫瘤[1-2]。目前普遍認(rèn)為,UC的發(fā)病是環(huán)境、患者自身的易感基因、精神心理因素及腸道微生物等多種因素共同疊加的結(jié)果[3-4],但針對(duì)UC及其惡性并發(fā)癥的致病相關(guān)基因尚未得到充分研究。本研究旨在通過分析比較UC樣本與正常樣本,以及UC樣本與UC伴瘤變樣本的基因表達(dá)譜數(shù)據(jù),構(gòu)建關(guān)于差異表達(dá)基因編碼蛋白質(zhì)相互作用(proteinprotein interaction,PPI)網(wǎng)絡(luò),對(duì)UC及其惡性并發(fā)癥的致病相關(guān)基因進(jìn)行系統(tǒng)的生物信息學(xué)分析,從而為進(jìn)一步探究UC及其惡性并發(fā)癥的具體分子機(jī)制提供新的研究思路。
從美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)的基因表達(dá)數(shù)據(jù)庫(Gene Expression Omnibus,GEO)(https://www.ncbi.nlm.nih.gov/gds) 中 下 載 編 號(hào) 為 GSE13367、GSE9452、GSE36807、GSE37283的基因表達(dá)數(shù)據(jù)集及樣本臨床信息,其中GSE13367數(shù)據(jù)集包含16例UC樣本及20例對(duì)照樣本,GSE9452數(shù)據(jù)集包含8例UC樣本及18例對(duì)照樣本,GSE36807數(shù)據(jù)集包含15例UC樣本及7例對(duì)照樣本,GSE37283數(shù)據(jù)集包含5例健康人群對(duì)照樣本、4例靜止期UC樣本以及11例UC伴瘤變樣本。GSE13367、GSE9452、GSE36807基因表達(dá)數(shù)據(jù)集都是基于GPL570注釋平臺(tái)中Affymetrix(昂飛)Human Genome U133 Plus 2.0 Array [HG-U133_Plus_2]的人類全基因轉(zhuǎn)錄本生物信息,GSE37283基因表達(dá)數(shù)據(jù)集是基于GPL13158注釋平臺(tái)中Affymetrix(昂飛)HT HG-U133+ PM Array Plate的人類全基因轉(zhuǎn)錄本生物信息,故以GSE13367、GSE9452、GSE36807數(shù)據(jù)集作為UC組,GSE37283為UC伴腺瘤組(UCN組)。首先依據(jù)UC組的K均值聚類算法結(jié)果對(duì)該組的3個(gè)數(shù)據(jù)集樣本進(jìn)行無監(jiān)督聚類分析,剔除臨床表型與聚類分析結(jié)果不符的樣本。
基因表達(dá)譜數(shù)據(jù)經(jīng)注釋及聚類分析等預(yù)處理之后,利用R語言limma函數(shù)包分別對(duì)UC組與UCN組進(jìn)行差異基因分析,篩選出P<0.05且|log2FC|>1.5的基因作為顯著差異表達(dá)基因,并通過基于R語言的VennDiagram函數(shù)包對(duì)UC組中3個(gè)數(shù)據(jù)集進(jìn)行單獨(dú)分析以及聯(lián)合分析得到差異基因,繪制韋恩圖以分析差異基因的交并集,再利用ggplot2包繪制差異基因的火山圖。
基因集富集分析(Gene Set Enrichment Analysis,GSEA)可用來評(píng)估一個(gè)預(yù)先定義的基因集中的基因在以表型相關(guān)度排序的基因列表中的分布趨勢(shì),從而判斷其對(duì)表型的貢獻(xiàn)。為進(jìn)一步探究UC致病相關(guān)基因的生物學(xué)功能,將從MSigDB數(shù)據(jù)庫(http://software.broadinstitute.org/gsea/msigdb/)中獲得的KEGG功能基因集作為參照基因集[5],采用R語言GSEA函數(shù)包分析以上2組差異基因數(shù)據(jù) 在 KEGG(Kyoto Encyclopedia of Genes and Genomes)信號(hào)通路中的富集情況。通過定義|NES|>1,NOM P-value<0.05,F(xiàn)DR Q-value<0.25的通路下的基因集合是有意義的,篩選得到2組差異基因在KEGG信號(hào)通路中的富集情況及其所包含的具體基因集。
STRING數(shù)據(jù)庫(https://string-db.org/)主要通過實(shí)驗(yàn)數(shù)據(jù)、文獻(xiàn)報(bào)道摘要和來自其他數(shù)據(jù)庫的綜合數(shù)據(jù)實(shí)現(xiàn)預(yù)測(cè)PPI功能。在本研究中,根據(jù)顯著差異基因符合P<0.05且|log2FC|>1.5的篩選條件,使用STRING數(shù)據(jù)庫分析顯著差異表達(dá)基因的PPI網(wǎng)絡(luò),并利用Cytoscape 3.6.1軟件的CytoHubba插件[6]提供的12種算法對(duì)PPI網(wǎng)絡(luò)中的各個(gè)節(jié)點(diǎn)基因進(jìn)行評(píng)分分析以識(shí)別網(wǎng)絡(luò)中的核心基因,從而可以較為準(zhǔn)確地找出在UC及其惡性并發(fā)癥病程中起核心作用的致病相關(guān)基因。
TIMER數(shù)據(jù)庫(https://cistrome.shinyapps.io/timer/)是系統(tǒng)分析不同類型癌癥組織中的免疫細(xì)胞浸潤(rùn)情況的綜合數(shù)據(jù)庫。通過此數(shù)據(jù)庫可以查詢特定基因與不同腫瘤組織中6種免疫細(xì)胞(B細(xì)胞、CD4+T細(xì)胞、CD8+T細(xì)胞、中性粒細(xì)胞、巨噬細(xì)胞和樹突狀細(xì)胞)的浸潤(rùn)關(guān)系、基因表達(dá)量與腫瘤患者預(yù)后關(guān)系以及基因在多種腫瘤和正常組織中的差異表達(dá)情況。
LINCS L1000數(shù)據(jù)庫(https://clue.io/)是由博德研究所(Broad Institute)開發(fā)的基于小分子藥物、基因表現(xiàn)與疾病相互關(guān)聯(lián)的藥物篩選數(shù)據(jù)庫。目前該數(shù)據(jù)庫已收集7 000余個(gè)經(jīng)小分子藥物處理后的人類細(xì)胞基因表達(dá)譜數(shù)據(jù),廣泛應(yīng)用于探索藥物作用的機(jī)制以及研發(fā)新的治療藥物。通過利用該數(shù)據(jù)庫查詢特異性針對(duì)PPI網(wǎng)絡(luò)核心基因的小分子藥物,以發(fā)現(xiàn)具有潛在治療效果的藥物。
采用Graphpad prism 7.0統(tǒng)計(jì)學(xué)軟件對(duì)組間的基因表達(dá)量數(shù)據(jù)進(jìn)行單因素t檢驗(yàn)。通過Pearson相關(guān)系數(shù)分析評(píng)估基因表達(dá)量之間的相關(guān)性。P<0.05表示差異具有統(tǒng)計(jì)學(xué)意義。
剔除聚類分析結(jié)果中與臨床表型不符的樣本后(圖1),通過limma函數(shù)包分析UC組與UCN組的差異表達(dá)基因。以P<0.05且|log2FC|>1.5為標(biāo)準(zhǔn),針對(duì)23例UC樣本與33例正常樣本的差異基因分析共發(fā)現(xiàn)顯著差異基因86個(gè),其中43個(gè)為上調(diào)基因,43個(gè)為下調(diào)基因;而針對(duì)4例靜止期UC樣本與11例UC伴瘤變樣本的差異基因分析共得到253個(gè)顯著差異基因,其中160個(gè)為上調(diào)基因,93個(gè)為下調(diào)基因。從UC組的差異基因韋恩圖中可以發(fā)現(xiàn)該組3個(gè)數(shù)據(jù)集聯(lián)合分析得到的差異基因均處在與各數(shù)據(jù)集單獨(dú)分析結(jié)果的交集中,這表明多數(shù)據(jù)集聯(lián)合分析可以有效提高分析結(jié)果的可信度(圖2A)。利用ggplot2包繪制2組差異基因中上調(diào)基因和下調(diào)基因的火山圖,能夠直觀地顯示2組差異基因的表達(dá)情況(圖2B、2C)。
圖1 剔除與臨床表型不符的樣本前后的聚類分析結(jié)果Fig 1 Results of cluster analysis before and after excluding the samples inconsistent with clinical phenotype
圖2 UC組差異基因分析得到的韋恩圖及火山圖及UCN組差異基因分析得到的火山圖Fig 2 Venn diagram and volcano plot obtained from differential genetic analysis of UC group and volcanic map obtained by differential gene analysis of UCN group
通過GSEA軟件對(duì)2組基因全轉(zhuǎn)錄本進(jìn)行KEGG富集分析,以 |NES|>1,NOMP-value<0.05 且 FDRQ-value<0.25為篩選標(biāo)準(zhǔn),發(fā)現(xiàn)UC組差異基因的KEGG富集分析結(jié)果中顯著上調(diào)的通路為IL-17信號(hào)通路、Toll樣受體信號(hào)通路、NOD樣受體信號(hào)通路等多條信號(hào)通路,顯著下調(diào)的通路為檸檬酸循環(huán)(TCA循環(huán))、礦物質(zhì)吸收、丁酸代謝、氧化磷酸化、脂肪酸降解;UCN組的KEGG富集分析結(jié)果中顯著上調(diào)的通路為IL-17信號(hào)通路、TNF信號(hào)通路、Toll樣受體信號(hào)通路等,顯著下調(diào)的通路為TCA循環(huán)、類固醇激素生物合成、礦物質(zhì)吸收、膽汁分泌、近端小管碳酸氫鹽重吸收,富集分析得到的具體通路如圖3A、3B所示。此外,在2組KEGG富集分析的結(jié)果中都發(fā)現(xiàn)了炎癥性腸?。╥nflammatory bowel disease,IBD)信號(hào)通路和IL-17信號(hào)通路,利用R語言enrichplot函數(shù)包繪制的這2個(gè)信號(hào)通路的GSEA富集分析曲線圖如圖3D所示。基于基因表達(dá)量的變化對(duì)IBD信號(hào)通路及IL-17信號(hào)通路進(jìn)行KEGG信號(hào)通路注釋,從IL-17信號(hào)通路的KEGG通路注釋圖中可以發(fā)現(xiàn)CXCL8(C-X-C motif chemokine ligand 8)參與了對(duì)中性粒細(xì)胞的招募作用(圖3C、4B)。
圖3 2組差異基因KEGG富集分析及GSEA分析得到的部分結(jié)果Fig 3 Partial results of KEGG enrichment analysis and GSEA analysis of two groups of differential genes
基于STRING數(shù)據(jù)庫的PPI分析得到了UC組顯著差異基因的PPI網(wǎng)絡(luò)(圖4A)?;贑ytoscape的CytoHubba插件提供的12種拓?fù)浞治鏊惴▽?duì)PPI網(wǎng)絡(luò)各個(gè)節(jié)點(diǎn)基因進(jìn)行評(píng)分排序,得到網(wǎng)絡(luò)中的核心節(jié)點(diǎn)基因(表1)。評(píng)分分析發(fā)現(xiàn)CXCL8在10種算法評(píng)分排序中均位列第1。在UC組及UCN組的差異基因分析結(jié)果中均發(fā)現(xiàn)了上調(diào)基因CXCL8(圖2B、2C),這表明CXCL8可能是在UC及其惡性并發(fā)癥的發(fā)生發(fā)展過程中起核心作用的基因。
TIMER數(shù)據(jù)庫的分析顯示結(jié)直腸腺癌組織中CXCL8主要對(duì)中性粒細(xì)胞的浸潤(rùn)起到趨化作用(圖4C),相比于在正常組織中的表達(dá)量,CXCL8在多種腫瘤組織中呈高表達(dá)狀態(tài)(圖5A)?;趯?duì)患者的預(yù)后數(shù)據(jù)分析發(fā)現(xiàn)CXCL8呈高表達(dá)狀態(tài)的結(jié)直腸腺癌患者預(yù)后較差(圖5B)。基于Pearson相關(guān)性分析發(fā)現(xiàn)CXCL8的表達(dá)量與中性粒細(xì)胞的2種表面抗原以及程序性死亡配體1(programmed deathligand 1,PD-L1)的表達(dá)量呈正相關(guān)(圖4D~4G、5C、5D)。通過對(duì)UCN組的分析,發(fā)現(xiàn)CD206及PD-L1的表達(dá)量隨著UC病程的發(fā)展逐漸上調(diào)(圖5E、5F)。
基于LINCS L1000數(shù)據(jù)庫的查詢結(jié)果,共篩選出3種小分子藥物,分別為紫鉚因(butein)、左旋西替利嗪(levocetirizine)、偽麻黃素(pseudoephedrine)(圖5G)。
圖4 CXCL8參與對(duì)中性粒細(xì)胞招募作用的多種分析結(jié)果Fig 4 Multiple analysis results of CXCL8 involved in the recruitment of neutrophils
表1 利用CytoHubba提供的12種算法對(duì)UC組PPI網(wǎng)絡(luò)中的節(jié)點(diǎn)基因評(píng)分分析得到的排名前10位的節(jié)點(diǎn)基因Tab 1 Top 10 node genes obtained by using 12 algorithms of CytoHubba for scoring analysis of the node genes in PPI networks of UC group
圖5 UC患者體內(nèi)CXCL8與PD-L1表達(dá)量的相關(guān)性分析以及3種小分子藥物對(duì)CXCL8抑制效果的分析Fig 5 Correlation analysis of the expression of CXCL8 and PD-L1 in ulcerative colitis patients and analysis of the inhibitory effect of three small molecule drugs on CXCL8
本研究通過分析正常人群與UC患者以及UC患者與UC伴瘤變患者的2組差異基因,發(fā)現(xiàn)顯著上調(diào)的差異基因CXCL8,而后對(duì)于通過基于Cytoscape的網(wǎng)絡(luò)核心基因分析插件CytoHubba深入挖掘篩選到的顯著差異基因,CytoHubba的評(píng)分分析亦發(fā)現(xiàn)CXCL8在10種核心基因算法評(píng)分結(jié)果中均排名第1?;谝陨戏治鼋Y(jié)果,我們推測(cè)CXCL8可能在UC及其惡性并發(fā)癥的病程發(fā)展中發(fā)揮了重要作用。
CXCL8,又稱嗜中性粒細(xì)胞因子,屬于CXC趨化因子家族,主要由外周血中的淋巴細(xì)胞、單核細(xì)胞以及中性粒細(xì)胞等多種細(xì)胞產(chǎn)生,是炎癥反應(yīng)的重要介質(zhì),常與局部組織的炎癥細(xì)胞浸潤(rùn)相一致[7]。研究[8]發(fā)現(xiàn)慢性炎癥組織中的多種免疫細(xì)胞可持續(xù)性釋放CXCL8,CXCL8及其配體CXCR1/2主要負(fù)責(zé)中性粒細(xì)胞的激活過程和誘導(dǎo)中性粒細(xì)胞向炎癥部位遷移和著陸。本研究中2組差異基因的KEGG功能富集分析的結(jié)果也顯示了在IL-17信號(hào)通路中CXCL8等趨化因子對(duì)中性粒細(xì)胞有招募作用。CXCL8在腫瘤微環(huán)境中對(duì)中性粒細(xì)胞的招募功能已得到van den Steen等[9]的證實(shí),該研究結(jié)果發(fā)現(xiàn)CXCL8可以刺激中性粒細(xì)胞釋放基質(zhì)金屬蛋白酶9(matrix metalloproteinase-9,MMP-9),而MMP-9可以強(qiáng)化CXCL8的趨化能力,使得更多的中性粒細(xì)胞聚集在腫瘤組織周圍。
慢性炎癥長(zhǎng)期以來被認(rèn)為是促發(fā)癌癥,尤其是結(jié)腸癌的一個(gè)重要風(fēng)險(xiǎn)因子,超過20%的UC患者會(huì)在確診后的數(shù)十年內(nèi)轉(zhuǎn)化成結(jié)腸癌患者[10]。而結(jié)腸炎相關(guān)性癌變進(jìn)程緩慢,干預(yù)治療的效果非常差且死亡率高[11]。但長(zhǎng)久以來慢性炎癥如何抵御免疫反應(yīng)并最終導(dǎo)致癌癥發(fā)生與發(fā)展的確切機(jī)制尚不明確。作為人體固有免疫應(yīng)答系統(tǒng)的重要組成成分,中性粒細(xì)胞可通過多種方式在結(jié)腸炎相關(guān)性結(jié)腸癌的形成過程中發(fā)揮促瘤形成作用,例如促瘤型中性粒細(xì)胞(N2型)分泌的趨化因子CXCL8與腫瘤細(xì)胞表面的趨化因子受體結(jié)合后,既能招募更多的中性粒細(xì)胞進(jìn)入腫瘤微環(huán)境,又能促進(jìn)腫瘤血管生成[12-14]。而近年來針對(duì)中性粒細(xì)胞的深入研究[15-16]發(fā)現(xiàn),腫瘤微環(huán)境中N2型中性粒細(xì)胞還可通過PD-1/PD-L1信號(hào)轉(zhuǎn)導(dǎo)途徑抑制T細(xì)胞的正常功能,從而在多種癌癥中實(shí)現(xiàn)促瘤作用。
PD-L1是程序性死亡受體1(programmed death-1,PD-1)的主要配體,研究[17-18]顯示兩者在結(jié)合后可通過“耗竭”腫瘤效應(yīng)T細(xì)胞的方式起到對(duì)免疫應(yīng)答的負(fù)性調(diào)控作用,并使腫瘤細(xì)胞發(fā)生免疫逃逸現(xiàn)象。Nakazawa等[19]通過研究UC患者的手術(shù)切除標(biāo)本,發(fā)現(xiàn)患者結(jié)腸上皮細(xì)胞PD-L1表達(dá)水平明顯高于健康對(duì)照者。Lin等[20]通過研究胃癌腫瘤微環(huán)境發(fā)現(xiàn),CXCL8能夠通過誘導(dǎo)腫瘤相關(guān)巨噬細(xì)胞表達(dá)PD-L1從而抑制CD8+T細(xì)胞的功能活化,導(dǎo)致腫瘤細(xì)胞逃過免疫檢查。Wang等[15]發(fā)現(xiàn)胃癌腫瘤微環(huán)境中激活的中性粒細(xì)胞同樣可以通過PD-1/PD-L1通路抑制T細(xì)胞的功能,從而抑制其對(duì)腫瘤細(xì)胞的殺傷作用。以上這些研究結(jié)果表明腫瘤微環(huán)境對(duì)腫瘤相關(guān)免疫細(xì)胞的“馴化”作用有助于實(shí)現(xiàn)PD-L1在這些細(xì)胞中的表達(dá)上調(diào)。
本研究中,我們通過差異基因分析及CytoHubba核心基因算法分析的結(jié)果發(fā)現(xiàn)顯著差異基因PPI網(wǎng)絡(luò)的核心基因?yàn)镃XCL8;通過差異基因的KEGG富集分析發(fā)現(xiàn)顯著上調(diào)的CXCL8基因參與了IL17信號(hào)通路對(duì)中性粒細(xì)胞的招募作用;通過基因表達(dá)量之間的相關(guān)性分析則發(fā)現(xiàn)CXCL8與中性粒細(xì)胞表面特異性抗原以及PD-L1的表達(dá)量呈正相關(guān)。以上分析結(jié)果在一定程度上驗(yàn)證了TIMER數(shù)據(jù)庫及前述文獻(xiàn)報(bào)道中CXCL8可通過招募中性粒細(xì)胞的方式以實(shí)現(xiàn)對(duì)PD-L1表達(dá)量調(diào)控這一結(jié)論。同時(shí),有研究[21]發(fā)現(xiàn)調(diào)控PD-L1表達(dá)量的主要信號(hào)通路為JAK-STAT信號(hào)通路。此外,還有研究[22]發(fā)現(xiàn)N2型中性粒細(xì)胞表面特異性抗原CD206的表達(dá)量也會(huì)隨著病程的發(fā)展而逐漸升高。我們由此推測(cè)腸道炎癥組織中的中性粒細(xì)胞可能會(huì)在慢性炎癥組織中逐漸被“馴化”而演變發(fā)展為激活/抑制的“雙重”表型,并在CXCL8的作用下通過JAK-STAT信號(hào)通路上調(diào)PD-L1的表達(dá)量以實(shí)現(xiàn)負(fù)性調(diào)控T細(xì)胞功能,從而促使腸道炎癥惡性并發(fā)癥的發(fā)生。
此外,通過LINCS L1000數(shù)據(jù)庫查詢特異性針對(duì)CXCL8的小分子藥物,得到紫鉚因、左旋西替利嗪、偽麻黃素3種小分子藥物。查閱文獻(xiàn)[23]發(fā)現(xiàn)紫鉚因具有抗氧化、抗炎癥、誘導(dǎo)腫瘤細(xì)胞凋亡等多種藥理作用。紫鉚因可以顯著降低脂多糖(lipopolysaccharide,LPS)刺激小膠質(zhì)細(xì)胞后細(xì)胞內(nèi)多種炎癥因子mRNA的表達(dá)上調(diào),這說明紫鉚因可以抑制LPS誘導(dǎo)的小膠質(zhì)細(xì)胞的活化,從而明顯減少炎癥因子的產(chǎn)生[24]。而左旋西替利嗪、偽麻黃素作為在臨床上應(yīng)用已久的藥物也都可以通過不同的方式達(dá)到抑制炎癥的效果,其中第3代抗過敏藥物的代表左旋西替利嗪可以直接發(fā)揮抑制炎癥細(xì)胞聚集和浸潤(rùn)的功能,而偽麻黃堿則可通過發(fā)揮擬腎上腺素作用以減少中性粒細(xì)胞在呼吸道細(xì)胞內(nèi)的聚集、黏附。以上3種小分子藥物的藥理分析表明,抑制腸道黏膜組織內(nèi)中性粒細(xì)胞的長(zhǎng)期異常聚集可能是阻止UC及其惡性并發(fā)癥發(fā)生和發(fā)展的關(guān)鍵因素。
總而言之,本研究利用生物信息學(xué)方法建立的篩選分析流程為研究UC提供了一個(gè)新的思路:基于多種數(shù)據(jù)庫對(duì)UC的致病相關(guān)基因進(jìn)行全面分析,并對(duì)表達(dá)量發(fā)生變化的基因進(jìn)行KEGG信號(hào)通路分析,再通過PPI網(wǎng)絡(luò)分析對(duì)處于網(wǎng)絡(luò)中心節(jié)點(diǎn)的基因進(jìn)行深入挖掘,找出與疾病相關(guān)的核心基因,從而為研究提供新的突破點(diǎn)。通過綜合利用以上方法,本研究發(fā)現(xiàn)了一些可能在UC發(fā)展過程中發(fā)揮核心作用的基因(如CXCL8)。這為UC及惡性并發(fā)癥的研究提供了新的思路,為理解UC發(fā)生過程中的復(fù)雜分子機(jī)制提供了新的視角,也為進(jìn)一步推動(dòng)臨床藥物研發(fā)提供了依據(jù)。然而,考慮到本研究尚有一定的局限性,未來還需要進(jìn)一步開展更為深入的實(shí)驗(yàn)來驗(yàn)證本研究的結(jié)果。