徐 緣 蔣 益 林道潑
克羅恩病(Crohn′s disease, CD)是累及全消化道的慢性肉芽腫性透壁性炎癥。全基因組關(guān)聯(lián)研究已確定160多個(gè)炎癥性腸病(inflammatory bowel disease, IBD)易感基因位點(diǎn)。然而,臨床上僅7.5%的潰瘍性結(jié)腸炎(ulcerative colitis, UC)患者和13.6%的CD患者觀察到遺傳變異,提示非遺傳因素在疾病發(fā)病中發(fā)揮重要作用。表觀遺傳學(xué)是指基因的DNA序列未發(fā)生改變的情況下,基因功能發(fā)生了可遺傳的變化,并最終導(dǎo)致表型變化。越來(lái)越多的證據(jù)提示,表觀遺傳修飾是連接IBD易感基因與非遺傳因素(如腸道菌群、環(huán)境因素等)的重要橋梁,在IBD發(fā)病及疾病進(jìn)展中起重要作用。因此,探討CD患者表觀遺傳修飾狀態(tài)或許能為探討CD潛在發(fā)病機(jī)制提供新的思路。
DNA甲基化是最普遍的表觀遺傳學(xué)修飾方式,該過(guò)程是基因轉(zhuǎn)錄過(guò)程中的關(guān)鍵調(diào)控機(jī)制之一,通常情況下,DNA甲基化程度與基因表達(dá)活性之間呈負(fù)相關(guān)。研究發(fā)現(xiàn),多個(gè)基因的甲基化修飾異常與IBD的發(fā)病密切相關(guān)。采用全基因組DNA甲基化分析方法,對(duì)小兒初治IBD患者和幼年發(fā)病CD患者腸組織進(jìn)行研究發(fā)現(xiàn),IBD患者腸組織中多個(gè)基因位點(diǎn)出現(xiàn)DNA甲基化程度改變。另有研究發(fā)現(xiàn),與健康對(duì)照者比較,CD患者腸道纖維化組織中發(fā)現(xiàn)17個(gè)低甲基化修飾的基因,其中miR-1225、miR-661等可能在腸道纖維化過(guò)程中發(fā)揮關(guān)鍵作用。本研究擬聯(lián)合分析表達(dá)譜芯片和DNA甲基化芯片數(shù)據(jù),篩選與CD相關(guān)的異常甲基化修飾的差異表達(dá)基因及這些基因相關(guān)的信號(hào)通路,從而尋找CD疾病診斷和治療的潛在靶點(diǎn)。
1.數(shù)據(jù)來(lái)源:從 NCBI的公共基因表達(dá)數(shù)據(jù)庫(kù)(gene expression omnibus, GEO)中下載CD的表達(dá)譜芯片和DNA甲基化芯片。表達(dá)譜芯片下載編號(hào)為GSE102134、GSE75214和GSE186582、GSE102134共包含65例CD患者和12例健康對(duì)照者的人類腸組織標(biāo)本,測(cè)序平臺(tái)為GPL6244(Affymetrix Human Gene 1.0ST Array);GSE75214共包含59例CD患者和22例健康對(duì)照者的腸組織標(biāo)本,測(cè)序平臺(tái)為GPL6244(Affymetrix Human Gene 1.0ST Array);GSE186582共包含102例活動(dòng)期CD患者和25例健康對(duì)照者的腸組織標(biāo)本,測(cè)序平臺(tái)為GPL570。而DNA甲基化芯片(下載編號(hào):GSE105798)利用GPL13534(Illumina Human Methylation 450 Bead Chip)平臺(tái)檢測(cè)了8例CD患者腸組織和3例健康對(duì)照者腸組織樣本中基因組DNA的甲基化水平。
2.數(shù)據(jù)標(biāo)準(zhǔn)化及差異表達(dá)基因篩選:GEO2R是GEO數(shù)據(jù)庫(kù)中基于R語(yǔ)言的在線分析工具。本研究通過(guò)GEO2R分析數(shù)據(jù)集中的差異表達(dá)基因,差異表達(dá)基因檢測(cè)條件為假發(fā)現(xiàn)率(false discovery rate, FDR)<0.05且|log差異倍數(shù)(FC)|>0.5。
3.甲基化芯片數(shù)據(jù)分析:應(yīng)用R語(yǔ)言中的CHAMP包對(duì)DNA甲基化芯片數(shù)據(jù)進(jìn)行CpG位點(diǎn)水平上的差異甲基化分析,以|delta beta vale|>0.3和FDR<0.05為閾值,尋找CD腸組織樣本相比于正常腸組織的差異甲基化位點(diǎn)(DNA-methylation profiles, DMP);隨后利用注釋文件將差異甲基化位點(diǎn)映射到基因組上。
4.異常甲基化修飾差異表達(dá)基因的功能富集分析:使用VENNY在線軟件將差異表達(dá)的基因、異常甲基化修飾基因列表進(jìn)行對(duì)應(yīng)的交集分析。利用R語(yǔ)言的ClusterProfiler包對(duì)差異表達(dá)基因進(jìn)行富集,行基因本體(gene ontology, GO)分析和京都基因和基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析,選取<0.05 作為顯著富集相關(guān)的閾值。
5.蛋白-蛋白相互作用網(wǎng)絡(luò)(protein-protein interaction, PPI)和子模塊基因構(gòu)建分析:應(yīng)用STRING數(shù)據(jù)庫(kù)行PPI分析,并利用Cytoscape軟件進(jìn)行可視化,行MCODE分析,篩選提取子網(wǎng)絡(luò),篩選條件設(shè)置為degree cut off=2,node score cut off =0.2,k-core=2,以及max depth=100。進(jìn)入CytoHubba插件,根據(jù)其中的5種算法(MNC、MCC、Degree、EPC和Closeness),將每種算法獲得的前20個(gè)基因與MCODE篩選出的子網(wǎng)絡(luò)基因取交集后篩選出的共同基因即為核心基因。
6.核心基因驗(yàn)證:使用GEO2R工具,首先查找差異基因ID,隨后通過(guò)ID號(hào)查找到差異基因在腸組織中的表達(dá)量,最后分析數(shù)據(jù)集中的差異表達(dá)基因,所有數(shù)據(jù)均輸入GraphPad Prism 5.0軟件進(jìn)行繪圖,驗(yàn)證核心基因在芯片集中的表達(dá)量。
1.CD差異表達(dá)基因的篩選:如圖1A所示,對(duì)GSE102134數(shù)據(jù)進(jìn)行差異分析后,共得到1315個(gè)差異表達(dá)基因,其中780個(gè)基因表達(dá)上調(diào),535個(gè)基因表達(dá)下調(diào)。
2.DNA甲基化芯片分析:對(duì)于甲基化芯片的數(shù)據(jù)集GSE105798,以FDR<0.05,|delta beta vale|>0.3為閾值篩選差異甲基化位點(diǎn),如圖1B所示,一共篩選出11066個(gè)差異甲基化位點(diǎn),其中8542個(gè)高甲基化位點(diǎn),2524個(gè)低甲基化位點(diǎn)。隨后利用注釋文件將差異甲基化位點(diǎn)映射到基因組上,共獲得3364個(gè)甲基化修飾水平升高的基因和937個(gè)甲基化修飾水平降低的基因。
3.異常甲基化修飾的差異表達(dá)基因進(jìn)行GO功能和KEGG通路富集分析:將CD的差異表達(dá)基因和異常甲基化修飾的基因?qū)隫ENNY軟件取交集獲得異常甲基化修飾的差異表達(dá)基因。如圖2所示,共得到55個(gè)低甲基化修飾下表達(dá)上調(diào)的基因,和125個(gè)高甲基化修飾下表達(dá)上調(diào)的基因。利用R語(yǔ)言的ClusterProfiler包對(duì)180個(gè)異常甲基化修飾的差異表達(dá)基因進(jìn)行GO功能注釋和KEGG通路富集分析。表1和表2展示了前5個(gè)具有顯著意義的GO功能注釋結(jié)果,以及上述基因相關(guān)的KEGG通路富集結(jié)果。分析表明異常甲基化修飾的差異表達(dá)基因主要分子功能(molecular function, MF)與跨膜轉(zhuǎn)運(yùn)蛋白活性、次級(jí)活化跨膜轉(zhuǎn)運(yùn)蛋白活性和轉(zhuǎn)運(yùn)體活性等相關(guān);細(xì)胞組分(cellular component, CC)定位于細(xì)胞頂端、頂端質(zhì)膜和細(xì)胞前沿等;而其生物學(xué)過(guò)程(biological process, BP)主要為有機(jī)陰離子轉(zhuǎn)運(yùn)、有機(jī)羥基化合物代謝和細(xì)胞外基質(zhì)的組成等。KEGG信號(hào)通路主要為磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(phosphatei-dylinositol 3 kinase/serine-threonine kinase, PIK/Akt)信號(hào)通路、黏附斑和細(xì)胞外基質(zhì)(extracellular matrix, ECM)-受體相互作用等。
4.異常甲基化修飾的差異表達(dá)基因蛋白相互作用網(wǎng)絡(luò)分析:如圖3所示,在STRING數(shù)據(jù)庫(kù)中分析上述180個(gè)基因編碼蛋白間的相互作用關(guān)系,接著采用Cytoscape軟件中的MCODE法分析,發(fā)現(xiàn)1個(gè)子網(wǎng)絡(luò)處于核心位置,總共包含10個(gè)關(guān)鍵基因。再采用CytoHubba插件,根據(jù)其中的5種算法(MNC、MCC、Degree、EPC和Closeness),將每種算法獲得的前20個(gè)基因與MCODE篩選出的子網(wǎng)絡(luò)基因取交集后篩選出5個(gè)核心基因,分別為分別為淀粉樣前體蛋白(amyloid precursor protein, APP)、Ⅳ型膠原蛋白2(collagen Ⅳ alpha 2, COL4A2)、Ⅳ型膠原蛋白1(collagen Ⅳ alpha 2, COL4A1)、血小板源性生長(zhǎng)因子β受體(platelet-derived growth factor receptor beta, PDGFRB)、肽YY(peptide YY,PYY)。5個(gè)核心基因的甲基化程度詳見(jiàn)圖4。
5.GEO數(shù)據(jù)庫(kù)驗(yàn)證:如圖5和圖6所示,CD患者腸組織中PYY基因表達(dá)水平低于健康對(duì)照者(GSE75214:logFC=-0.76, FDR<0.001;GSE186582:logFC=-1.09, FDR<0.0001)。與健康對(duì)照者比較,CD患者腸組織中COL4A2、COL4A1、PDGFRB表達(dá)水平均顯著升高[(GSE75214:logFC=0.82, FDR<0.001; logFC=1.17, FDR<0.001; logFC=0.96, FDR<0.001)(GSE186582:logFC=0.59, FDR<0.01; logFC=1.27, FDR<0.0001; logFC=0.75, FDR<0.001)]。而腸組織中APP基因表達(dá)在CD患者和對(duì)照組中差異無(wú)統(tǒng)計(jì)學(xué)意義。
在臨床中由于IBD的診斷缺乏金標(biāo)準(zhǔn),易造成誤診和漏診。近年來(lái),越來(lái)越多的證據(jù)提示表觀遺傳學(xué)修飾如DNA甲基化、miRNA在IBD診斷中發(fā)揮關(guān)鍵作用。研究證實(shí)DNA甲基化在IBD診斷中具有較高的敏感度、特異性及準(zhǔn)確性。Howell等研究發(fā)現(xiàn),幼年IBD患者腸上皮細(xì)胞具有特異性的DNA甲基化模式,該模式診斷IBD的敏感度為75%,而特異性高達(dá)100%。此外,進(jìn)一步對(duì)UC和CD患者回腸組織進(jìn)行研究發(fā)現(xiàn),DNA甲基化標(biāo)志物有77%的準(zhǔn)確性對(duì)兩種疾病進(jìn)行區(qū)分。上述研究提示,尋找IBD特異度的DNA甲基化模式有巨大的臨床意義。
本研究通過(guò)生物信息學(xué)方法,篩選CD中異常甲基化修飾的差異表達(dá)基因,并進(jìn)行KEGG信號(hào)通路聚類分析。結(jié)果發(fā)現(xiàn),差異表達(dá)基因被顯著富集到PIK/Akt信號(hào)通路、黏附斑和ECM-受體相互作用等信號(hào)通路,這與其他CD機(jī)制相關(guān)性研究一致。PIK/Akt信號(hào)通路與細(xì)胞生長(zhǎng)和細(xì)胞程序性死亡等密切相關(guān)。研究證實(shí)PIK/Akt信號(hào)通路可能通過(guò)調(diào)控白細(xì)胞介素和免疫細(xì)胞,從而在炎癥性腸病中發(fā)揮關(guān)鍵作用。Long等研究發(fā)現(xiàn),與健康對(duì)照者比較,CD患者外周血CD4T細(xì)胞和腸組織淋巴細(xì)胞中PIK、Akt及mTOR的mRNA及蛋白表達(dá)水平均上調(diào)。使用PIK抑制劑和多不飽和脂肪酸均可下調(diào)PIK/Akt信號(hào)通路,從而誘導(dǎo)CD緩解。黏附斑激酶(focal adhesion kinase, FAK)可以調(diào)節(jié)細(xì)胞的生長(zhǎng)、錨定、遷移、惡變和凋亡等過(guò)程,與多種腫瘤的發(fā)生、發(fā)展相關(guān)。LEEB等研究發(fā)現(xiàn),與健康對(duì)照者比較,CD患者腸組織固有層成纖維細(xì)胞中FAK磷酸化水平降低,提示CD中成纖維細(xì)胞遷移能力減弱,腸道組織修復(fù)能力下降。腸道纖維化是CD特征性表現(xiàn)之一,逐漸進(jìn)展可形成腸道狹窄。CD發(fā)病過(guò)程中,腸道慢性透壁性炎癥及過(guò)度損傷修復(fù),ECM蛋白異常沉積、膠原蛋白分解、ECM形成和ECM受體相互作用,最終導(dǎo)致腸道狹窄。因此進(jìn)一步研究ECM受體相互作用可能有助于理解CD纖維化的分子機(jī)制。
本研究最終篩選出4個(gè)與CD發(fā)病密切相關(guān)的異常甲基化修飾的差異表達(dá)基因,分別為COL4A2、COL4A1、PDGFRB、PYY。PYY是一種胃腸道肽類激素,研究發(fā)現(xiàn)血漿PYY水平升高與多種胃腸道疾病如炎癥性腸病密切相關(guān)。在葡聚糖硫酸鈉誘導(dǎo)的大鼠結(jié)腸炎模型中,采用免疫組化方法對(duì)大鼠結(jié)腸組織進(jìn)行分析發(fā)現(xiàn),結(jié)腸炎組結(jié)腸組織中分泌PYY的內(nèi)分泌細(xì)胞密度顯著增高,且PYY水平與T淋巴細(xì)胞比例密切相關(guān),提示胃腸道激素可能與腸道免疫系統(tǒng)存在相互作用,通過(guò)靶向PYY等可能有助于緩解炎癥性腸病。血小板源性生長(zhǎng)因子受體(PDGFR)是生長(zhǎng)因子受體家族重要成員之一,對(duì)中性粒細(xì)胞、成纖維細(xì)胞具有趨化作用,并參與細(xì)胞凋亡過(guò)程。Tuller等對(duì)CD和潰瘍性結(jié)腸炎患者外周血單個(gè)核細(xì)胞進(jìn)行轉(zhuǎn)錄組分析發(fā)現(xiàn),血小板源性生長(zhǎng)因子(PDGF)信號(hào)通路參與炎癥性腸病的發(fā)生、發(fā)展。此外CD腸道纖維化是ECM、成纖維細(xì)胞、細(xì)胞因子等多種因素之間復(fù)雜作用的結(jié)果,目前研究證實(shí),PDGFR參與ECM及成纖維細(xì)胞的調(diào)控,因此PDGFR可能在CD腸道纖維化中發(fā)揮重要作用。但目前尚缺乏COL4A1、COL4A2與CD關(guān)系的研究。
綜上所述,本研究利用生物信息學(xué)分析對(duì)表達(dá)譜數(shù)據(jù)集和甲基化數(shù)據(jù)集進(jìn)行聯(lián)合分析,構(gòu)建PPI網(wǎng)絡(luò),推測(cè)信號(hào)通路可能影響CD的發(fā)生、發(fā)展,并篩選出可能與CD發(fā)病相關(guān)的4個(gè)核心基因,為探尋CD潛在的分子機(jī)制及致病基因研究提供必要理論依據(jù)。但仍需開(kāi)展體內(nèi)外分子生物學(xué)實(shí)驗(yàn)驗(yàn)證相關(guān)基因的功能和信號(hào)通路的作用。