崔凱,趙斯奇,李欣,葛曉燕
(錦州醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,遼寧 錦州 121000)
阿爾茨海默病(alzheimer’s disease,AD)是最常見(jiàn)的神經(jīng)退行性疾病,約占癡呆患者的70%,也是老年人常見(jiàn)的致死性疾病之一[1]。AD的特征是由細(xì)胞外β淀粉肽形成斑塊、細(xì)胞內(nèi)神經(jīng)纖維纏結(jié)、微管蛋白及突觸和神經(jīng)元的丟失引起的快速進(jìn)展性認(rèn)知功能及行為障礙,伴有大腦記憶區(qū)結(jié)構(gòu)及功能改變[2]?;颊叱霈F(xiàn)生理功能紊亂伴隨記憶喪失、認(rèn)知功能受損、言語(yǔ)異常和其他身體癥狀。隨著全球人口老齡化加劇,AD對(duì)患者及其家庭乃至整個(gè)社會(huì)造成了巨大威脅[3]。AD患者不僅在發(fā)達(dá)國(guó)家數(shù)量龐大[4],據(jù)報(bào)道,我國(guó)大陸地區(qū)AD的患病率也達(dá)到2.44%(95%CI:2.06~2.89%)[5]。AD的發(fā)病機(jī)制復(fù)雜,與遺傳因素、環(huán)境因素、免疫因素、腦部外傷、抑郁和高血壓等均有關(guān),目前尚無(wú)治愈該病的方法,因此仍需探索新的相關(guān)基因和治療靶點(diǎn)。
生物信息學(xué)是應(yīng)用統(tǒng)計(jì)學(xué)和信息學(xué)方法與技術(shù)對(duì)生物數(shù)據(jù)進(jìn)行處理和分析,從中挖掘潛在的生物信息。其利用高通量基因芯片對(duì)基因表達(dá)數(shù)據(jù)進(jìn)行系統(tǒng)分析,進(jìn)而揭示復(fù)雜的生物學(xué)過(guò)程和疾病機(jī)制,從而為疾病的臨床治療提供相應(yīng)的線索和依據(jù)。自2000年,美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)發(fā)布了基因表達(dá)譜庫(kù)(GEO),儲(chǔ)存大量的高通量生物芯片數(shù)據(jù),以便于對(duì)表達(dá)數(shù)據(jù)進(jìn)行檢索和分析,為生物信息學(xué)研究提供數(shù)據(jù)來(lái)源。本研究即采用生物信息學(xué)方法,從GEO數(shù)據(jù)庫(kù)獲取AD患者和對(duì)照的腦內(nèi)皮(entorhinal cortex,EC)和海馬組織(hippocampus,HIP)基因表達(dá)數(shù)據(jù)集,利用GEO2R在線工具對(duì)共同差異表達(dá)基因(DEGs)進(jìn)行篩選,并進(jìn)行基因本體(GO)分析、KEGG通路富集分析和蛋白-蛋白相互作用(PPI)網(wǎng)絡(luò)分析,以期發(fā)現(xiàn)與AD發(fā)病的相關(guān)基因。本研究可為了解AD的發(fā)病機(jī)制提供線索,有助于發(fā)現(xiàn)AD新生物標(biāo)志物和治療靶點(diǎn)。
基因表達(dá)數(shù)據(jù)集從GOE數(shù)據(jù)庫(kù)(https://www.NCBI.nlm.nih.gov/GEO/)中檢索獲取。納入數(shù)據(jù)集的標(biāo)準(zhǔn)如下:(1)數(shù)據(jù)集為基因芯片表達(dá)數(shù)據(jù);(2)樣本來(lái)自與確診的AD患者和非癡呆對(duì)照組的腦組織;(3)數(shù)據(jù)集中病例和對(duì)照組的可用樣本數(shù)均≥10個(gè)。最終納入GSE5281和GSE48350兩個(gè)基因芯片數(shù)據(jù)集,均基于GPL570平臺(tái),采用美國(guó)Affymetrix公司Human Genome U133 Plus 2.0 Array陣列芯片檢測(cè)。選取兩個(gè)數(shù)據(jù)集中EC和HIP區(qū)的表達(dá)數(shù)據(jù)進(jìn)行分析。
采用GEO2R在線工具(https://www.ncbi.nlm.nih.gov/geo/GEO2R/)對(duì)DEGs進(jìn)行篩選。篩選條件為P<0.05,其中l(wèi)og2FC≥1.0為表達(dá)上調(diào),log2FC≤-1.0為下調(diào)(FC表示AD病例組受試芯片熒光信號(hào)強(qiáng)度與對(duì)照組的差異倍數(shù)),篩選兩個(gè)數(shù)據(jù)集共同的DEGs。采用DAVID6.7生物信息學(xué)資源數(shù)據(jù)庫(kù)(https://david.ncifcrf.gov)進(jìn)行GO分析和KEGG通路富集分析,以P<0.05為顯著富集。其中,GO分析用于描述及注釋基因功能,其將基因功能分為生物過(guò)程、細(xì)胞組分和分子功能三部分,可用于發(fā)現(xiàn)疾病形成及進(jìn)展的重要生物學(xué)過(guò)程;KEGG分析依據(jù)分子水平的生物系統(tǒng)和基因組功能信息資源分析基因相關(guān)代謝途徑。利用STRING數(shù)據(jù)庫(kù)(https://STRING-db.org/)構(gòu)建DEGs的PPI網(wǎng)絡(luò),以評(píng)估功能基因組數(shù)據(jù),進(jìn)而分析基因產(chǎn)物蛋白的相互作用及其影響的主要生物學(xué)功能。利用Cytoscape 3.7.2軟件對(duì)PPI網(wǎng)絡(luò)進(jìn)行可視化,選取節(jié)點(diǎn)度值最大的前10個(gè)相關(guān)基因。
共收集25例AD患者和52例對(duì)照的EC,29例AD患者和56例對(duì)照的HIP組織表達(dá)數(shù)據(jù)。EC中,GSE5281和GSE48350數(shù)據(jù)集中共有62個(gè)DEGs,包括33個(gè)上調(diào)基因和29個(gè)下調(diào)基因;HIP中有91個(gè)DEGs,其中上調(diào)基因20個(gè),下調(diào)基因71個(gè),見(jiàn)表1。
表1 EC和HIP組織中的DEGs結(jié)果
在EC組織中,上調(diào)的DEGs主要涉及細(xì)胞外分泌、突觸囊泡胞外分泌等生物學(xué)過(guò)程和細(xì)胞連接成分;下調(diào)的DEGs涉及細(xì)胞外基質(zhì)、創(chuàng)傷反應(yīng)等生物學(xué)功能,分布于細(xì)胞膜、細(xì)胞外隙、溶酶體等細(xì)胞組分,涉及整合素及肝素結(jié)合等分子功能。在HIP區(qū),GO分析發(fā)現(xiàn)上調(diào)DEGs并未明顯富集;而下調(diào)DEGs主要涉及化學(xué)突觸傳遞、神經(jīng)系統(tǒng)發(fā)育等生物學(xué)過(guò)程,分布于胞膜、突觸等細(xì)胞組分,涉及蛋白質(zhì)和蛋白激酶結(jié)合等分子功能。
KEGG通路分析顯示,EC和HIP組織中的上調(diào)DEGs均未顯著富集,而下調(diào)的DEGs基因顯著富集于γ氨基丁酸突觸、谷氨酸突觸、類風(fēng)濕性關(guān)節(jié)炎、突觸囊泡循環(huán)、D-谷氨酰胺和D-谷氨酸代謝等通路,見(jiàn)表2。
表2 KEGG分析中富集的途徑
對(duì)于EC組織,PPI網(wǎng)絡(luò)中包含56個(gè)節(jié)點(diǎn)和33條邊,其中節(jié)點(diǎn)表示蛋白,邊表示蛋白之間的相互聯(lián)系,見(jiàn)圖1。前10個(gè)高度相關(guān)的相關(guān)基因包括CXCR4、CCL2、GFAP、CD44、ANGPT1、MCHR1、ITPKB、aAPLNR、WIF1和ANG。在HIP中,有85個(gè)節(jié)點(diǎn)和163條邊,見(jiàn)圖2。前10位高度相關(guān)基因?yàn)镾NAP25、SNCB、GRIN1、ATP2B3、SNAP91、CA10、RBFOX1,SYN2、CCK和GABRD。
圖1 EC中DEGs的PPI網(wǎng)絡(luò)
圖2 HIP中DEGs的PPI網(wǎng)絡(luò)
AD是中樞神經(jīng)系統(tǒng)的退行性疾病,與包括遺傳在內(nèi)的多種因素有關(guān),其發(fā)病機(jī)制涉及多種基因?;蛐酒芡瑫r(shí)對(duì)大量基因轉(zhuǎn)錄體的表達(dá)水平進(jìn)行檢測(cè)和分析,在生物信息學(xué)中被廣泛地用于疾病潛在靶標(biāo)的挖掘。本研究采用生物信息學(xué)方法對(duì)AD患者的基因芯片數(shù)據(jù)進(jìn)行了整理和挖掘分析,以期發(fā)現(xiàn)潛在的治療靶點(diǎn)。為了減少批次效應(yīng)并獲得可靠的結(jié)果,本研究收集了基于同一芯片平臺(tái)的GSE5281和GSE48350數(shù)據(jù)集,二者均包含AD患者和正常人腦組織尸檢樣本的基因表達(dá)數(shù)據(jù)。從兩個(gè)數(shù)據(jù)集中選取共有的腦區(qū)域,EC和HIP,其在認(rèn)知和記憶功能中起著至關(guān)重要的作用,在AD進(jìn)展的早期階段即會(huì)受到影響[6]。
本研究中利用GEO2R在線工具對(duì)兩個(gè)數(shù)據(jù)庫(kù)中的共有DEGs進(jìn)行了篩選,并進(jìn)行了GO分析和KEGG通路富集分析。根據(jù)結(jié)果,相關(guān)基因主要集中在化學(xué)突觸傳遞、細(xì)胞外基質(zhì)組織和蛋白質(zhì)結(jié)合等生物學(xué)過(guò)程中。利用STRING在線數(shù)據(jù)庫(kù)分別從EC和HIP腦區(qū)獲得了與AD發(fā)病相關(guān)的基因。文獻(xiàn)資料顯示,這些相關(guān)基因中的大多數(shù)已被發(fā)現(xiàn)與AD相關(guān),如CCL2通過(guò)神經(jīng)炎癥途徑與AD相關(guān),CCL2的過(guò)表達(dá)能促使Tau蛋白沉積增加,同時(shí)促進(jìn)神經(jīng)膠質(zhì)的有害炎癥性改變[7-8];Liu等研究發(fā)現(xiàn),WIF1基因在AD患者中表達(dá)降低,WIF1在抑制Wnt信號(hào)傳導(dǎo)方面起作用,而Wnt信號(hào)傳導(dǎo)與AD中的低磷酸化水平有關(guān),進(jìn)而影響AD的發(fā)生[9];RBFOX1是一種RNA結(jié)合蛋白,在選擇性剪接、mRNA穩(wěn)定性和翻譯過(guò)程中發(fā)揮關(guān)鍵作用,可直接與Tau mRNA結(jié)合并影響其穩(wěn)定性和翻譯,同時(shí)促進(jìn)Tau蛋白的表達(dá)[10];SYN2在神經(jīng)遞質(zhì)釋放中起重要作用,研究表明其在AD大鼠和患者中均顯著降低,記憶受損增加而產(chǎn)生AD[11]。然而,本研究中也發(fā)現(xiàn)了4個(gè)少有報(bào)道的AD相關(guān)基因,包括ANGPT1、APLNR、MCHR1和ATP2B3。其中,ANGPT1編碼一種屬于血管生成素家族的糖蛋白,近期研究報(bào)道其可通過(guò)增加大鼠體內(nèi)β淀粉肽分泌進(jìn)而加速AD的進(jìn)展[12];APLNR和MCHR1屬于G蛋白偶聯(lián)受體基因家族;ATP2B3編碼離子轉(zhuǎn)運(yùn)ATP酶。這4個(gè)基因?qū)D的進(jìn)展可能存在影響,其機(jī)制尚待進(jìn)一步研究。
綜上所述,本研究中通過(guò)生物信息學(xué)方法分析發(fā)現(xiàn)ANGPT1、APLNR、MCHR1和ATP2B3基因可能與AD發(fā)病具有一定關(guān)聯(lián),這或許能為了解AD的發(fā)病機(jī)制和探索新的治療靶點(diǎn)提供科學(xué)依據(jù)。