宋 崟,張科
(天津醫(yī)科大學總醫(yī)院藥劑科,天津 300052)
潰瘍性結腸炎(ulcerative colitis,UC)是一種以結直腸黏膜連續(xù)性、彌漫性炎癥表現(xiàn)為特點的慢性非特異性疾病,其發(fā)病機制尚不明確,臨床很難根治。UC 主要癥狀為腹痛、腹瀉、黏液膿血便等,癥狀輕重不等,但多為反復發(fā)作的慢性病程,嚴重影響患者的心理、經(jīng)濟狀況和生活質量[1-3]。目前UC 以藥物治療為主,常用藥物有氨基水楊酸類、糖皮質激素、免疫抑制劑等,但這些藥物存在一定的不良反應,患者依從性低,治療效果也不理想[4,5]。因此,尋求新的藥物治療靶點,開發(fā)新的高效、低毒的UC 治療藥物成為研究熱點。近年來,隨著高通量測序平臺及研究方法在疾病基因表達分析的應用,各種疾病的相關機制逐漸從基因和分子層面被闡明[6]。本研究采用基于Affymetrix 芯片平臺的GSE42911 數(shù)據(jù)集,探究潰瘍性結腸炎(UC)的發(fā)病機制,為其早期診斷和治療藥物的開發(fā)提供新思路。
1.1 基因芯片數(shù)據(jù)獲取 以“Ulcerative Colitis”為關鍵詞,在Gene Expression Omnibus(GEO)數(shù)據(jù)庫中檢索與UC 相關的表達譜數(shù)據(jù)。選擇GSE42911 芯片數(shù)據(jù)進行挖掘,該研究是基于GPL15207 平臺(affymetrix human gene expression array)的芯片,由Kellermayer R 提交。由10 個樣本構成,分別為GSM1053271、GSM1053272、GSM1053273、GSM1053274、GSM1053277、GSM1053268、GSM1053269、GSM1053270、GSM1053275、GSM1053276。其中,前5 個樣本來自5 例潰瘍性結腸炎患者,后5 個樣本來自5 名正常人。
1.2 篩選差異基因 GEO2R 是GEO 數(shù)據(jù)庫中以R語言為基礎的交互式在線分析工具,借助R 語言及Limma 包對GEO 樣品數(shù)據(jù)行基因差異表達分析[7]。本研究利用該工具篩選UC 患者和正常人大腸組織的差異基因(DEGs)。以基因倍數(shù)改變(fold change,F(xiàn)C)大于1.5,即|logFC|>1.5 作為DEGs的篩選標準,以P<0.05 為差異有統(tǒng)計學意義,除去重復和無效基因,得到本芯片的DEGs[8]。采用R 語言繪制DEGs的熱圖和火山圖。
1.3 核心DEGs 篩選與生物學過程及信號通路分析將DEGs 導入STRING 數(shù)據(jù)庫,設置篩選標準:combined score>0.4,將分析數(shù)據(jù)以TSV 格式導出,再導入Cytoscape 3.2.1 軟件中,然后使用軟件的NetworkAnalyzer 進行分析。在網(wǎng)絡中,度值(Degree)表示某一節(jié)點與其他節(jié)點連接邊的數(shù)量[9];中介中心度(betweenness centrality,BC)表示一個節(jié)點擔任其它兩個結點之間最短路的橋梁的次數(shù)。BC 值越大,表示節(jié)點在網(wǎng)絡拓撲結構中的樞紐程度越重要[10]。目前,網(wǎng)絡分析的主要方法是選擇節(jié)點Degree 值及BC 值高的作為網(wǎng)絡的關鍵節(jié)點[9]。本研究也采用該分析方法,篩選BC>0.01,Degree>30的作為UC的核心DEGs。對大規(guī)?;蜻M行功能注釋,包括基因功能富集分析(GO 基因本體論)和基因通路富集分析(KEGG)。GO 分析包括分子功能(molecular function,MF)、細胞組分(cellular components,CC)和生物學過程(biological process,BP)[11,12]。接著將核心DEGs 導入DAVID 數(shù)據(jù)庫,并限定物種為人,進行基因功能注釋分析和功能富集分析,然后導出數(shù)據(jù),對生物過程(P<0.01)和信號通路(P<0.05)進行篩選,用R 語言對GO 和KEGG 富集分析結果進行可視化。
1.4 蛋白質相互作用網(wǎng)絡構建及分析 將得到的核心DEGs 導入STRING 數(shù)據(jù)庫繪制蛋白-蛋白互作網(wǎng)絡圖(protein-protein interaction,PPI),將分析數(shù)據(jù)以TSV 格式導出,導入Cytoscape 3.2.1 軟件,繪制PPI 網(wǎng)絡圖,并對網(wǎng)絡進行拓撲結構分析;再利用“Generate style from statistics”工具對網(wǎng)絡節(jié)點的大小和顏色進行設置。網(wǎng)絡圖中節(jié)點的大小、顏色及其深淺變化代表Degree 值的大小,邊的粗細反映了Combine Score的大小,從中篩選出Degree 值和接近中心度排名靠前的靶點。
2.1 差異基因篩選結果 共篩選出487 個差異基因,其中上調465 個,下調22 個。采用R 語言繪制火山圖,見圖1A;繪制前30 位上調基因和下調基因的熱圖,見圖1B。
圖1 差異基因篩選結果
2.2 核心DEGs 篩選與生物學過程及信號通路分析共得到36 個UC的核心DEGs,包括:UBB、CYCS、GNB2L1、APP、CDC42、SOD1、ACTG1、ISG15、RHOA、ACTR2、B2M、CANX、ATP5B、TXN、ATP5A1、CCT8、PFDN5、RAB11A、RAB7A、HNRNPA2B1、NEDD8、HSPD1、PARK7、TFRC、SDHB、RPL7、PSMA6、PCBP1、ATP5O、ANXA2、RPS27、GDI2、RAC1、CFL1、FAU、PTGES3。功能注釋結果顯示:36 個UC 核心DEGs共在53 個(P<0.01)GO term 上富集,其中BP18 個,CC24 個,MF11 個。BP 主要富集在Gtpase 介導的信號轉導、細胞或亞細胞成分的運動、線粒體ATP 合成耦合質子轉運、ATP 合成耦合質子運輸、線粒體膜電位的調節(jié)等;CC 主要富集在胞外外體、胞質溶膠、細胞外間質、局部粘連等;MF 主要富集在蛋白質結合、多聚RNA 結合、質子轉運ATP 合成酶活性、谷胱甘肽酶活性、跨膜轉運活性等,BP、CC、MF的COUNT 得分排名前5的結果見表1、圖2。KEGG 通路分析顯示:36 個UC 核心DEGs 共富集在25 條通路上,主要包括:吞噬體、黏著小帶、細菌侵襲上皮細胞、沙門氏菌感染、肌動蛋白細胞骨架調節(jié)、白細胞內皮移動等,見表2、圖3。
圖3 核心DEGs的KEGG 富集分析
表2 核心DEGs的KEGG 通路分析
圖2 核心DEGs的GO 富集分析圖
表1 核心DEGs的GO 富集分析結果
2.3 PPI 網(wǎng)絡分析結果 將核心DEGs 上傳至STRING 數(shù)據(jù)庫,PPI 網(wǎng)絡圖包含35 個節(jié)點和171條邊,平均節(jié)點Degree 值為9.77,富集P<1.0E-16。將網(wǎng)絡分析數(shù)據(jù)以TSV 格式從STRING 數(shù)據(jù)庫中導出,然后導入Cytoscape 3.2.1 軟件中,繪制PPI 網(wǎng)絡圖,Degree 排名前10的靶點包括RACK1、ACTG1、UBB、CCT8、HSPD1、SOD1、CDC42、PSMA6、CFL1、RPL7,見圖4。
圖4 核心DEGs的PPI 網(wǎng)絡圖
隨著高通量芯片技術發(fā)展,利用生物信息學方法可以更加快速、經(jīng)濟、高效地篩選出參與疾病發(fā)病機制的重要基因,為疾病的診斷、治療及藥物設計提供依據(jù)。本研究基于生物信息學分析篩選出UC的487 個DEGs,上調基因465 個,下調基因22 個,然后篩選得到36 個UC 核心DEGs。進一步探究了核心DEGs的生物學過程、分子功能和細胞組成,發(fā)現(xiàn)涉及的生物過程包括:GTP 酶介導的信號轉導、細胞或亞細胞成分的運動、線粒體ATP 合成耦合質子轉運、ATP 合成耦合質子運輸、線粒體膜電位的調節(jié)、胞外外體、胞質溶膠、細胞外間質、局部粘連、蛋白質結合、多聚RNA 結合、質子轉運ATP 合成酶活性、谷胱甘肽酶活性、跨膜轉運活性等,這些與UC的發(fā)生和發(fā)展都有一定的聯(lián)系。KEGG 通路分析顯示主要通路包括:吞噬體、黏著小帶、細菌侵襲上皮細胞、沙門氏菌感染、肌動蛋白細胞骨架調節(jié)、白細胞內皮移動等。
PPI 網(wǎng)絡分析結果顯示,RACK1、ACTG1、UBB、CCT8、HSPD1、SOD1、CDC42、PSMA6、CFL1、RPL7等靶點是網(wǎng)絡中的核心節(jié)點,推測它們是UC 發(fā)病的關鍵基因。目前研究顯示,RACK1 通過控制蛋白激酶C(protein kinase C,PKC)介導的信號通路將蛋白錨定在特定亞細胞位置并調節(jié)活性,導致下游激酶的激活或失活,從而控制細胞極性,從動力學角度調節(jié)細胞骨架的動力。此外,RACK1 基因的過表達,調節(jié)某些癌癥的上皮間質轉化,從而促進多種不同腫瘤細胞的侵襲和擴散[13]。研究顯示[14],UC 患者結腸黏膜中CDC42 水平較正常人顯著升高。CDC42是RhoGTP 酶蛋白家族中的一員,與GTP 結合后活化的CDC42 可以調控細胞黏附、細胞骨架重排、細胞運動和遷移、細胞膜蛋白物質運輸?shù)榷喾N生物學活動[15]。在T 細胞中,CDC42 過表達對細胞骨架的肌動蛋白和微管蛋白分極和遷移、分化均有影響[16]。CDC42 還會使癌細胞依附于血管壁上,從而使它們通過血液擴散到身體的其他部位。因此,理論上抑制CDC42 蛋白可以使癌細胞無法依附于血管內壁的內皮細胞上,從而減少其擴散的機會,這在未來極有可能成為新的預防癌細胞擴散和轉移的新靶點。
綜上所述,RACK1、ACTG1、UBB、CCT8 等基因可能通過調控吞噬體、黏著小帶、細菌侵襲上皮細胞、沙門氏菌感染、肌動蛋白細胞骨架調節(jié)、白細胞內皮移動等信號通路參與潰瘍性結腸炎的發(fā)生發(fā)展。