徐斐康,張毅,李偲媛,和申,喬穎
精神分裂癥是一類嚴(yán)重的精神疾病,在世界范圍內(nèi)患病率為1%,中國終身患病率為0.6%,給患者、家庭及社會造成了嚴(yán)重的疾病負(fù)擔(dān)[1]。迄今,病因仍不清楚,但研究發(fā)現(xiàn)遺傳及環(huán)境因素在精神分裂癥的發(fā)病機(jī)制中發(fā)揮重要作用。本研究從Gene Expression Omnibus(GEO)數(shù)據(jù)庫中下載與精神分裂癥前額葉皮質(zhì)(prefrontal cortex,PFC)腦區(qū)的基因表達(dá)譜芯片數(shù)據(jù)[2],旨在進(jìn)一步了解疾病的發(fā)生機(jī)制。
1.1 資料 從GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)中下載GSE17612數(shù)據(jù)集的基因表達(dá)數(shù)據(jù)和相關(guān)臨床信息。該芯片包括28例精神分裂癥患者(患者組)和23名健康對照(對照組),組織為PFC。該數(shù)據(jù)集為基于Affymetrix Human Genome U133 Plus 2.0 Array(GPL570)的微陣列平臺,包括54 675個(gè)探針。
1.2 方法
1.2.1 芯片數(shù)據(jù)預(yù)處理 將原始基因表達(dá)數(shù)值進(jìn)行l(wèi)og2轉(zhuǎn)化,使用clusterProfiler包將探針與相應(yīng)的基因進(jìn)行匹配。利用R語言中的Limma包篩選GSE17612數(shù)據(jù)集中精神分裂癥與健康樣本間的差異表達(dá)基因(differentially expressed genes,DEGs)。
1.2.2 基因本體論(GO)分析及京都基因組百科全書(KEGG)通路分析 為了更深入了解差異基因的生物學(xué)功能,即明確這些基因主要與哪些生物學(xué)過程有關(guān),以及顯著富集在哪些分子通路,對差異基因進(jìn)行GO分析和KEGG通路分析。GO和KEGG通路富集分析已被廣泛用于研究基因的潛在功能。生物學(xué)信息注釋及可視化和整合發(fā)現(xiàn)的數(shù)據(jù)庫(the database for annotation visualization and integrated discovery,DAVID) 是一套完整的在線功能注釋工具,可用來探索大量基因背后潛在的生物學(xué)意義。將DEGs上傳到DAVID在線數(shù)據(jù)庫中來進(jìn)行GO及 KEGG通路分析。P<0.05被認(rèn)為顯著富集。采用R語言中的ggplot包可視化GO富集分析結(jié)果。
1.2.3 蛋白-蛋白相互作用(PPI)網(wǎng)絡(luò)分析 蛋白質(zhì)相互作用數(shù)據(jù)庫(STRING,http://www.string-db.org/)是一個(gè)探索蛋白質(zhì)-蛋白質(zhì)間相互作用的在線軟件,包括直接的(物理)和間接的(功能)關(guān)聯(lián)。根據(jù)STRING數(shù)據(jù)庫構(gòu)建差異基因的PPI網(wǎng)絡(luò),并使用Cytoscape 3.6.0軟件進(jìn)行可視化。為了識別在PPI網(wǎng)絡(luò)中起關(guān)鍵作用的核心基因,采用Cytoscape的Cytohubba插件對差異基因以度(degree)來進(jìn)行評估,所得前10個(gè)基因則為關(guān)鍵基因。
1.2.4 統(tǒng)計(jì)學(xué)方法 采用R 4.1.2進(jìn)行生物信息學(xué)分析。采用SPSS 16.0進(jìn)行統(tǒng)計(jì)分析?;颊呓M和對照組年齡比較采用獨(dú)立樣本t檢驗(yàn),性別比較采用卡方檢驗(yàn)。P<0.05被認(rèn)為有統(tǒng)計(jì)學(xué)意義。
2.1 人口學(xué)資料 患者組:男19例,女9例;平均年齡(73.32±15.20)歲。對照組:男11例,女12例;平均年齡(69.04±21.55)歲。兩組性別(χ2=2.09,P=0.148)及年齡(t=0.80,P=0.427)分布差異無統(tǒng)計(jì)學(xué)意義。
2.2 差異基因篩選 經(jīng)過篩選后,GSE17612基因芯片數(shù)據(jù)集中符合條件的差異基因共有1 238個(gè),其中有603個(gè)顯著上調(diào)表達(dá)差異基因,635個(gè)顯著下調(diào)表達(dá)差異基因。按照P值,分別列出顯著上調(diào)和顯著下調(diào)的前5位差異基因。見表1。
表1 精神分裂癥前額皮層顯著差異表達(dá)基因
2.3 差異基因的GO及KEGG通路分析 為進(jìn)一步分析差異基因的功能,在DAVID數(shù)據(jù)庫中進(jìn)行了GO和KEGG通路分析。由于上調(diào)基因和下調(diào)差異表達(dá)基因的潛在功能可能存在不同,因此對上調(diào)基因和下調(diào)基因分別進(jìn)行分析。GO分析可見上調(diào)基因主要集中在免疫應(yīng)答、淋巴免疫細(xì)胞的激活和分化及免疫因子產(chǎn)生等生物過程(圖1);下調(diào)基因分析結(jié)果可見參與細(xì)胞組成,主要集中在細(xì)胞膜及細(xì)胞外基質(zhì)部分(圖2)。KEGG 通路分析顯示上調(diào)基因主要富集的信號通路包括MAPK、NF-κB及Rap1等信號通路,這些通路與免疫炎癥的調(diào)節(jié)及免疫細(xì)胞功能調(diào)控密切相關(guān)(圖3);提示免疫炎癥與精神分裂癥的發(fā)病機(jī)制有關(guān)。此外,下調(diào)基因富集的信號通路相對較少,主要富集在細(xì)胞外基質(zhì)受體交互作用以及蛋白消化與吸收等相關(guān)信號通路(圖3)。
圖1 上調(diào)差異基因的GO分析
圖2 下調(diào)差異基因的GO分析
圖3 上調(diào)基因和下調(diào)基因的KEGG通路富集分析
2.4 PPI網(wǎng)絡(luò)分析 將1 238個(gè)差異基因輸入STRING數(shù)據(jù)庫中進(jìn)行PPI網(wǎng)絡(luò)分析,共有1 043個(gè)節(jié)點(diǎn),3 733條邊,平均每個(gè)節(jié)點(diǎn)的度為7.16,平均局部聚類系數(shù)為0.338。將PPI網(wǎng)絡(luò)中的基因輸入Cytoscape軟件進(jìn)行可視化分析,用Ctyohubba插件計(jì)算最終得出排名前10的關(guān)鍵基因,分別為腫瘤壞死因子(tumor necrosis factor,TNF)、成纖維細(xì)胞生長因子2(FGF2)、Ⅰ型膠原基因(COL1A1)、結(jié)締組織生長因子(CTGF)、核心蛋白聚糖(DCN)、COL1A2、賴氨酰氧化酶(LOX)、轉(zhuǎn)化生長因子β受體1(TGFBR1)、血管內(nèi)皮生長因子A(VEGFA)及彈性蛋白(ELN)基因。見圖4。
圖4 Ctyohubba算法識別排名前10的關(guān)鍵基因
精神分裂癥是一類復(fù)雜的精神疾病,其發(fā)病機(jī)制未明。在涉及精神分裂癥病理生理學(xué)的區(qū)域中,由于神經(jīng)發(fā)育過程的變化、解剖學(xué)和功能的異常及其在精神分裂癥中受損的認(rèn)知功能中的作用,PFC一直是所關(guān)注的區(qū)域[3]。因此,本研究通過從GEO數(shù)據(jù)庫下載精神分裂癥尸腦PFC的芯片表達(dá)譜數(shù)據(jù)并進(jìn)行生物信息學(xué)分析,探討并發(fā)現(xiàn)可能參與精神分裂癥病理機(jī)制的信號通路及關(guān)鍵基因。
本研究共發(fā)現(xiàn)差異基因共有1 238個(gè),其中有603個(gè)顯著上調(diào)表達(dá)差異基因,635個(gè)顯著下調(diào)表達(dá)差異基因。GO分析表明上調(diào)基因的生物過程主要富集在免疫應(yīng)答、細(xì)胞因子及炎癥反應(yīng)等過程。越來越多的證據(jù)表明免疫系統(tǒng)可能在精神分裂癥的發(fā)病機(jī)制中起重要作用。Miller等[4]發(fā)現(xiàn)精神分裂癥患者存在免疫失衡,包括循環(huán)CD4+T免疫淋巴細(xì)胞的變化,而中樞神經(jīng)系統(tǒng)可能受到CD4+T細(xì)胞介導(dǎo)的神經(jīng)炎癥的影響。精神分裂癥患者還存在炎性細(xì)胞因子失衡,且細(xì)胞因子水平的異常與精神分裂癥癥狀的嚴(yán)重程度有關(guān)[5]。薈萃分析亦發(fā)現(xiàn)精神分裂癥患者的腦脊液及外周血中促炎因子水平增高,而抗炎細(xì)胞因子水平降低[6-7]。值得注意的是,本研究主要探究PFC中的差異基因改變,因此其主要富集的免疫炎癥的改變可能會主要反應(yīng)在腦及神經(jīng)的變化。神經(jīng)炎癥能引起多巴胺能、5-羥色胺能、去甲腎上腺素能和谷氨酸能神經(jīng)傳遞的典型改變,因此,這可能是精神分裂癥癥狀產(chǎn)生的關(guān)鍵因素[8]。而在神經(jīng)影像學(xué)研究中,中樞神經(jīng)系統(tǒng)體積的減少和小膠質(zhì)細(xì)胞的激活也進(jìn)一步支持了精神分裂癥中神經(jīng)炎癥過程的參與性[9]。
KEGG通路分析顯示上調(diào)基因主要富集在MAPK、NF-κB及Rap1等信號通路。這些信號通路之前也被報(bào)道與免疫炎癥調(diào)控密切相關(guān)。MAPKs的活性在免疫系統(tǒng)的正常功能中起著至關(guān)重要的作用。NF-κB信號通路的激活能夠誘導(dǎo)產(chǎn)生大量促炎細(xì)胞因子,介導(dǎo)炎癥發(fā)生。Rap1分子能夠作為T細(xì)胞和抗原提呈細(xì)胞相互作用的關(guān)鍵調(diào)控因子,調(diào)節(jié)T細(xì)胞反應(yīng)。其中MAPK和NF-κB信號通路先前已報(bào)道與精神分裂癥發(fā)病機(jī)制有關(guān)[10-11]。故本研究結(jié)果支持免疫炎癥在精神分裂癥發(fā)病機(jī)制中的重要作用,并且GO分析和KEGG分析提示上調(diào)基因和下調(diào)基因在疾病發(fā)生中的作用可能存在差異。
此外,本研究通過PPI網(wǎng)絡(luò)分析發(fā)現(xiàn)TNF、FGF2、CTGF、DCN、COL1A1、COL1A2、LOX、TGFBR1、VEGFA及ELN為精神分裂癥的關(guān)鍵基因。它們本身一些為免疫炎癥因子、神經(jīng)營養(yǎng)因子或生長因子受體蛋白,如TNF、FGF2、VEGFA及TGFBR1。并且TNF[12]、FGF2[13]、CTGF[14]、DCN[15]、COL1A1、COL1A2[16]、TGFBR1[17]與VEGFA 8個(gè)基因之前均被報(bào)道與精神分裂癥有關(guān)。例如,F(xiàn)GF-2 SNP與精神分裂癥患者海馬體積有關(guān),這可能和FGF-2減少會導(dǎo)致神經(jīng)元數(shù)量減少有關(guān)[13]。精神分裂癥患者中樞及外周TNF水平顯著升高,并且TNFα能夠抑制皮質(zhì)神經(jīng)元樹突發(fā)育,這可能與疾病發(fā)生有關(guān)[12]。未見有研究報(bào)道LOX及ELN基因與精神分裂癥的相關(guān)性。LOX是一個(gè)具有銅結(jié)合部位的胺氧化酶,能將伯胺氧化成醛,在細(xì)胞外基質(zhì)的形成和修復(fù)過程中起著十分重要的作用。類似的是,ELN基因編碼的蛋白質(zhì)是構(gòu)成細(xì)胞外基質(zhì)彈性纖維的主要部分,它們在精神分裂癥發(fā)病機(jī)制中的作用仍需更多研究予以確認(rèn)。通過生物信息學(xué)分析,不僅可以驗(yàn)證已有的精神分裂癥易感基因,還可以篩選出可能與精神分裂癥發(fā)病有關(guān)的候選新靶基因。
既往已有研究利用GEO數(shù)據(jù)庫尸腦組織研究精神分裂癥的發(fā)病機(jī)制[18-19],但這些研究樣本量相對較小,或者僅集中于研究精神分裂癥的某種特定亞型,如早發(fā)型精神分裂癥[20]。本研究中的樣本量相對較大,可以降低分析結(jié)果的假陽性概率。本研究結(jié)果和先前研究結(jié)論有相同之處,均支持免疫炎癥在精神分裂癥發(fā)病機(jī)制中的重要作用。此外,本研究還報(bào)道了一些可能與疾病發(fā)生相關(guān)的新信號通路如細(xì)胞外基質(zhì)受體交互作用通路以及潛在候選靶基因LOX及ELN。
綜上,本研究利用精神分裂癥尸腦組織樣本,通過R、DAVID工具、STRING 數(shù)據(jù)庫和Cytoscape軟件等多種生物信息方法探索精神分裂癥基因發(fā)病機(jī)制的相關(guān)基因及影響的信號通路。研究結(jié)果支持免疫炎癥在精神分裂癥發(fā)病中的重要作用,并且找到一些潛在的與疾病發(fā)生相關(guān)的新信號通路和候選新靶基因,為進(jìn)一步的生物學(xué)驗(yàn)證和基礎(chǔ)研究提供依據(jù)。當(dāng)然,本研究也存在一定缺陷,雖然本研究樣本量高于其他一些已經(jīng)發(fā)表的研究,但樣本量也相對偏小,后續(xù)若能對這些尸腦組織芯片或測序數(shù)據(jù)進(jìn)行薈萃分析,可為深入闡明精神分裂癥的發(fā)病機(jī)制提供一個(gè)新的研究思路。