王馨雅,王華峰,2,邊煜青,楊魯紅*
(1山西師范大學生命科學學院遺傳學教研室,臨汾 041004;2阿拉巴馬大學伯明翰分校醫(yī)學院神經系;*通訊作者,E-mail:ylh1010309@126.com)
自身免疫性疾病(autoimmune disease,AID)是指機體免疫系統(tǒng)中的免疫應答反應對自身抗原發(fā)生作用,造成組織細胞破壞或損害的一類疾病,其病因及其致病機制目前尚不完全清楚且仍未找到有效治療藥物[1,2]。通常可分為兩大類:器官特異性自身免疫性疾病和全身性自身免疫性疾病,其主要區(qū)別在于前者引起的機體病變主要發(fā)生于某些特定器官,而后者則引起機體多系統(tǒng)、多器官的免疫反應[3]。近幾年,自身免疫性疾病已經引起人們的廣泛關注,其中多發(fā)性硬化癥(multiple sclerosis,MS)的特征是中樞神經系統(tǒng)的病變,已有研究表明,該疾病是由免疫系統(tǒng)異常引起的一種自身免疫性疾病[4]。同時,Witoelar等[5]的研究表明帕金森病(Parkinson’s disease,PD)可能是一種自身免疫性疾病,帕金森病和自身免疫性疾病的表型之間有著共同的遺傳途徑[5]。故本文就多發(fā)性硬化癥和帕金森病兩種自身免疫性疾病進行研究,從基因表達方面探尋二者發(fā)病機制的相同點。
自Schena等[6]從事基因芯片的研究以后,基因芯片技術已經廣泛應用于生物科學的諸多領域,其發(fā)展和應用為探究疾病的發(fā)病機制創(chuàng)造了條件[7]?;蛐酒夹g又稱微陣列(microarray)技術,即在固相支持物上緊密放置諸多的DNA樣本或寡聚核苷酸,與模板進行雜交并獲取圖像,用計算機處理后獲得樣本信息[8]。由于基因芯片所具有高效穩(wěn)定的特性,因此用多發(fā)性硬化癥和帕金森病相關的基因芯片探究自身免疫性疾病的致病機制具有十分重要的意義,為其后續(xù)的治療和藥物研發(fā)提供了理論基礎[9,10]。
本研究采用生物信息學的方法篩選多發(fā)性硬化癥和帕金森病患者和正常人的差異表達基因,對其中共有的差異基因進行生物學功能(GO)和信號通路富集分析,從中找出多發(fā)性硬化癥和帕金森病共有的關鍵基因,為進一步探索自身免疫性疾病發(fā)病的分子機制提供參考。
本實驗采用的兩組基因芯片數據GSE83670和GSE22491均來源于美國國立生物技術信息中心(National Center for Biotechnology Information,NCBI)的共享數據庫GEO(https://www.ncbi.nlm.nih.gov/geo/)。多發(fā)性硬化癥GSE83670的芯片數據由Paul Roy Heath上傳,登錄號GSM2212224-GSM2212227為4個多發(fā)性硬化癥患者的白質星形膠質細胞轉錄組的基因表達譜樣本數據,登錄號GSM2212228-GSM2212230為3個神經正常的人體白質星形膠質細胞轉錄組基因表達譜樣本數據。帕金森病GSE22491的芯片數據由frédéricleprêtre上傳,登錄號GSM558679-GSM558686為8個健康老年人(對照組)外周血單核細胞的基因表達模式數據,登錄號GSM558687-GSM558696為10個帕金森病患者外周血單核細胞的基因表達模式數據。
下載多發(fā)性硬化癥組織芯片數據GSE83670的CEL數據壓縮包和探針文件后,通過RStudio軟件的affyPLM對芯片數據進行質量分析,以P<0.05和|logFC|>1為標準篩選多發(fā)性硬化癥患者和正常人的差異表達基因。打開帕金森病GSE22491的芯片數據,將帕金森病患者樣本和正常老年人樣本分為兩組,通過GEO2R在線分析工具獲取帕金森病患者和正常老年人的差異表達基因。最后,通過Venny 2.1.0在線分析網站(http://bioinfogp.cnb.csic.es/tools/venny/index.html)找出二者共同的差異基因。
DAVID數據庫(https://david.ncifcrf.gov/)是一個在線生物信息學網站,用于分析基因組數據集并將收集到的數據賦予生物學意義。本文利用DAVID在線分析工具,對篩選出來的共有差異基因進行GO分析和信號通路富集分析[11],利用Cytoscape軟件對GO功能富集的結果進行可視化分析。
通過對多發(fā)性硬化癥組織芯片GSE83670和帕金森病組織芯片GSE22491數據分析,分別篩選出737個多發(fā)性硬化癥和1 081個帕金森病中表達差異明顯的基因(見圖1),有36個基因在這兩種病中均存在有明顯的差異(見表1,圖2),分別為:CTAGE5、C14orf79、ASB9、PROS1、CCDC186、PLAA、GP1BA、LIG4、C2orf88、GABRP、ZNF85、EPB42、GCM2、RAB13、CAAP1、DYNC2LI1、SGCE、PCOLCE2、CCPG1、TRMT61B、C1QC、NLK、GPR78、UHRF1、DCBLD1、C1QB、IRX3、GUCY1B3、DMXL2、THAP9-AS1、ANGPT2、FAM19A2、TMEM17、CA2、CAV1和PARM1。
將得到的36個差異基因輸入到DAVID在線分析網站,通過對差異基因的生物過程(biological process)、細胞成分(cellular component)和分子功能(molecular function)的分析,發(fā)現(xiàn)差異基因參與了白細胞移行、肽酶活性的正調控、凝血調節(jié)、纖維蛋白溶解等生物過程;細胞成分分析顯示差異基因主要參與了質膜和血液微粒的組成;分子功能與肽酶的激活有關(見表2)。
利用Cytoscape軟件對差異基因GO功能富集進行的可視化分析結果表明,顏色越深富集到該功能上的差異基因越多,主要與5個功能關系程度最大,即免疫球蛋白介導的免疫應答、B細胞介導的免疫、淋巴細胞介導的免疫、基于免疫球蛋白超家族域構建的免疫受體體細胞重組的適應性免疫應答和適應性免疫反應(見圖3)。
A.多發(fā)性硬化癥的差異基因火山圖 B.帕金森病的差異基因火山圖圖1 多發(fā)性硬化癥和帕金森病的差異基因火山圖Figure 1 Valcano plot of differentially expressed genes in mRNA expression profiling dataset of MS and PD
表1 帕金森病和多發(fā)性硬化癥共有的36個差異基因
Table 1 Results of 36 differentially expressed genes in Parkinson’s disease and multiple sclerosis
基因名稱帕金森病的logFC多發(fā)性硬化癥的logFC基因名稱帕金森病的logFC多發(fā)性硬化癥的logFCCTAGE5C14orf79ASB9PROS1CCDC186PLAAGP1BALIG4C2orf88GABRPZNF85EPB42GCM2RAB13CAAP1DYNC2LI1SGCEPCOLCE2-1.6620-1.0975-1.0520-2.0972-1.0324-1.1981-1.4053-1.0165-1.3828-1.5305-1.0004-4.9199-1.0029-1.3522-1.0020-1.0493-1.3849-2.2095-1.1971-1.3444-1.2108-1.0032-1.5436-1.0326-1.3625-1.19761.4022-1.2205-1.1588-1.1595-1.00872.2605-1.3333-1.5165-1.28671.5961CCPG1TRMT61BC1QCNLKGPR78UHRF1DCBLD1C1QBIRX3GUCY1B3DMXL2THAP9-AS1ANGPT2FAM19A2TMEM17CA2CAV1PARM1-1.0909-1.1925-1.0244-1.01621.58241.6100-1.2058-1.30641.9081-1.1108-1.2103-1.14673.1958-1.4754-1.4463-1.0640-1.0356-1.0929-1.5210-1.70691.4257-1.3652-1.00681.3508-1.30821.24791.8110-1.1308-1.0766-1.43361.0837-1.5238-1.31811.43031.0076-1.1128
圖2 兩類疾病共有基因分析的Venny圖Figure 2 Venny diagram of common gene analysis for both diseases
通過DAVID在線分析網站對36個差異基因進行信號通路富集分析。結果顯示,符合P<0.05的信號通路只有一條,即補體和凝血級聯(lián)信號通路(has04610:補體和凝血級聯(lián))(P=0.007),富集在這條通路上的差異基因包括C1QB、PROS1和C1QC(見表3)。
表2 差異基因的富集分析
Table 2 Enrichment analysis of different genes
類型GO ID基因功能 數量P生物過程GO:0050900白細胞遷移(leukocyte migration)30.019生物過程GO:0010952肽酶活性的正調控(positive regulation of peptidase activity)20.022生物過程GO:0030193凝血調節(jié)(regulation of blood coagulation)20.029生物過程GO:0042730纖維蛋白溶解(fibrinolysis)20.036細胞成分GO:0005886質膜(plasma membrane)140.013細胞成分GO:0072562血液微粒(blood microparticle)30.027分子功能GO:0016504肽酶激活(peptidase activator activity)20.016
圖3 GO功能富集的可視化分析Figure 3 Visual analysis of GO functional enrichment
表3 差異表達基因所涉及的信號通路
Table 3 Differentially expressed genes involved in the signaling pathway
序列號名稱數量P基因hsa04610補體和凝血級聯(lián)30.007C1QB,PROS1,C1QC
自身免疫性疾病的發(fā)病機制十分復雜,且發(fā)病人數呈逐年上升趨勢,之前已有對于遺傳、環(huán)境和免疫等方面的相關研究,但尚且沒有特異性的生物標記和篩查診斷方法[12]。在本次研究中,我們借助了生物信息學的手段分析篩選出帕金森病和多發(fā)性硬化癥共有的差異表達基因,得到了36個差異表達顯著的基因。為了探討這些差異基因潛在的作用機制,我們通過DAVID在線生物學分析網站對這36個基因進行了GO和Pathway功能富集分析。
GO富集分析和可視化結果顯示,這些差異基因主要參與了免疫球蛋白介導的體液免疫應答過程。現(xiàn)有研究表明,免疫球蛋白、B細胞、淋巴細胞介導的免疫調節(jié)機制是自身反應性細胞免疫的關鍵機制之一,與固有免疫應答和適應性免疫應答的相互作用有關,在炎癥反應和自身免疫性疾病中發(fā)揮重要作用[13-16]。
Pathway信號通路富集結果為補體和凝血級聯(lián)信號通路(hsa04610:補體和凝血級聯(lián))。補體系統(tǒng)是先天免疫的主要系統(tǒng),凝血系統(tǒng)在止血功能中起到主要作用,補體和凝血級聯(lián)信號通路與血液介導的炎癥反應具有一定的關系[17,18]。分析富集于該信號通路上的差異基因發(fā)現(xiàn),C1QB和C1QC基因編碼的蛋白質均為補體C1q的亞成分,而補體C1q參與自身免疫和炎癥反應等過程,補體級聯(lián)的第一步就是補體C1q與抗體的結合[19],C1q在自身免疫性疾病如紅斑狼瘡、類風濕性關節(jié)炎等發(fā)病機制的研究上具有重要的臨床價值[20-24]。PROS1基因通過與酪氨酸激酶等受體相互作用共同調控TAM信號通路,在炎癥的消除過程中發(fā)揮著至關重要的作用[25];PROS1基因突變導致S蛋白缺乏[26],而S蛋白能夠激活凝血級聯(lián)通路[27],調節(jié)基因轉錄和炎癥細胞因子的表達[28],其抗凝功能能夠對類風濕關節(jié)炎這種自身免疫性疾病的治療產生積極作用。同時,PROS1基因還是與甲狀腺病變相關的7個關鍵基因之一[29]。
綜上所述,我們推測,自身免疫病的發(fā)病機制可能通過補體和凝血級聯(lián)反應信號通路實現(xiàn),該信號通路上的差異基因:C1QB、C1QC和PROS1通過對補體和凝血級聯(lián)信號通路的影響,可能在帕金森病和多發(fā)性硬化癥等自身免疫性疾病中起到關鍵作用,有望成為自身免疫性疾病的潛在治療靶點。