殷曉莎 田肅巖
(吉林大學(xué)第一醫(yī)院臨床研究部,吉林 長(zhǎng)春 130021)
阿爾茨海默病(AD)是一種常見的神經(jīng)退行性疾病,多見于70歲以上人群,占癡呆癥患者的60%~80%〔1〕。食管癌(EC)的死亡率在癌癥相關(guān)死亡中排名第六,發(fā)病率在所有癌癥中排名第七〔2〕,是一種常見的惡性消化道癌癥。老年食管癌患者數(shù)量不斷增加,且食管癌在老年人群中預(yù)后更差〔3〕。
一些研究為AD和癌癥之間的關(guān)聯(lián)提供了流行病學(xué)、細(xì)胞水平及分子水平的證據(jù)。Ma等〔4〕的meta分析將隊(duì)列研究中人群的年齡、性別等干擾因素進(jìn)行調(diào)整后發(fā)現(xiàn),相較于未罹患AD的人群,罹患AD的人群癌癥風(fēng)險(xiǎn)降低42%;相較于未罹患癌癥的人群,罹患癌癥的人群發(fā)生AD風(fēng)險(xiǎn)降低37%。Yarchoan等〔5〕研究也表明,與未罹患癌癥人群相比,罹患癌癥人群AD的發(fā)生率顯著降低,并檢測(cè)了罹患癌癥與未罹患癌癥的人腦內(nèi)神經(jīng)原纖維纏結(jié)(NTF)和β-淀粉樣蛋白(Aβ)水平,結(jié)果顯示Aβ水平相似,但罹患癌癥的人腦內(nèi)NTF明顯低于未罹患癌癥的人群。AD和癌癥都隨著年齡增長(zhǎng),發(fā)病率快速增高〔6,7〕,AD和癌癥之間存在復(fù)雜的生物學(xué)關(guān)系。AD和癌癥可看作是衰老的不同表現(xiàn),AD中神經(jīng)元進(jìn)行性死亡標(biāo)志著神經(jīng)元變性,細(xì)胞不受控制的增殖是癌變的特征〔8〕。AD和癌癥中存在相同基因發(fā)生不同方向的失調(diào),如已知的腫瘤抑制基因P53在AD中上調(diào),在癌癥中下調(diào)〔9〕,死亡蛋白激酶(DAPK)1在AD中上調(diào),在癌癥中失活〔10〕。
通過查閱文獻(xiàn)發(fā)現(xiàn)AD和EC之間存在共享分子。氧化應(yīng)激標(biāo)志物4-羥基壬烯醛(4-HNE)可促進(jìn)AD中Aβ沉積、tau蛋白磷酸化〔11,12〕,它在EC上皮中的含量相較于正常食管上皮顯著增多,且隨癌癥進(jìn)展而增加〔13〕;miR-21可抑制AD中Aβ表達(dá)〔14〕,它在EC晚期顯著升高,能誘導(dǎo)癌癥細(xì)胞生長(zhǎng)和侵襲〔15〕。這些證據(jù)表明AD和EC之間可能存在關(guān)聯(lián),但仍需進(jìn)一步探索。隨著基因芯片和二代測(cè)序技術(shù)的發(fā)展,對(duì)高通量轉(zhuǎn)錄組學(xué)數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,能快速發(fā)現(xiàn)不同疾病共享的基因和通路,進(jìn)而探究不同疾病之間潛在的生物學(xué)關(guān)聯(lián)。本研究利用基因表達(dá)譜數(shù)據(jù),通過識(shí)別AD和EC共享的基因和通路來探索二者間關(guān)聯(lián)。
1.1數(shù)據(jù)來源和處理 AD數(shù)據(jù)集對(duì)應(yīng)基因表達(dá)綜合數(shù)據(jù)庫(GEO)(https://www.ncbi.nlm.nih.gov/gds/)中的GSE48350數(shù)據(jù)集,該數(shù)據(jù)集的檢測(cè)芯片為Affymetrix Human Genome U133 Plus 2.0 Array。該數(shù)據(jù)集包含58個(gè)健康人的173個(gè)腦組織和29例AD患者的80例AD腦組織,這些腦組織分別來自大腦的4個(gè)區(qū)域(海馬、內(nèi)嗅皮質(zhì)、上額葉皮層和中央后回)。EC數(shù)據(jù)集來自癌癥基因組圖譜(TCGA)中食道癌(ESCA)隊(duì)列的RNA-seq數(shù)據(jù),包括161例腫瘤組織和11例癌旁正常組織。
AD數(shù)據(jù)集(GSE48350)已經(jīng)魯棒多陣列平均(RMA)法背景校正和log2轉(zhuǎn)化。使用Affymetrix Human Genome U133 Plus 2.0 Array芯片對(duì)應(yīng)的注釋包hgu133plus2.db進(jìn)行探針集和基因名的轉(zhuǎn)化,如果有多個(gè)探針集對(duì)應(yīng)一個(gè)基因,則保留平均表達(dá)量最高的探針,EC數(shù)據(jù)集來自TCGA中的EC隊(duì)列。AD和EC數(shù)據(jù)集測(cè)序方法、平臺(tái)不一樣,所包含的基因不一樣,為保證AD和EC數(shù)據(jù)集中含有相同的基因,事先將兩個(gè)數(shù)據(jù)集內(nèi)的基因取交集得到重疊的16 379個(gè)基因。
采用邦弗羅尼-霍克伯格(BH)法〔16〕對(duì)P值進(jìn)行多重檢驗(yàn)校正,調(diào)整后P值為錯(cuò)誤發(fā)現(xiàn)率(FDR)。統(tǒng)計(jì)分析均在R語言(https://www.r-project.org/)3.6.1版本中進(jìn)行。
1.2統(tǒng)計(jì)方法
1.2.1篩選AD和EC的差異表達(dá)基因(DEGs) 在R語言環(huán)境下調(diào)用limma包,對(duì)大腦4個(gè)區(qū)(海馬、內(nèi)嗅皮質(zhì)、上額葉皮質(zhì)、中央后回)AD組與健康組基因表達(dá)值分別進(jìn)行穩(wěn)健t檢驗(yàn),設(shè)置差異表達(dá)基因的閾值為|log2FC|≥1,F(xiàn)DR<0.01,如果有基因在兩個(gè)及以上腦區(qū)差異表達(dá)則取最小的FDR;對(duì)EC的癌癥組和癌旁組的基因表達(dá)值進(jìn)行穩(wěn)健t檢驗(yàn),設(shè)置DEGs閾值為|log2FC|≥1,F(xiàn)DR<0.01獲得EC的DEGs。在線工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)繪制韋恩圖,使用ggplot2包繪制火山圖。
在R語言環(huán)境下調(diào)用tinyarray包選取基因表達(dá)值的最佳截?cái)帱c(diǎn),并利用最佳截?cái)帱c(diǎn)對(duì)共享基因的表達(dá)值分組(高、低表達(dá)組),對(duì)兩組生存曲線進(jìn)行l(wèi)og rank檢驗(yàn)。KM生存曲線圖使用survminer包和ggplot2包繪制。
1.2.2對(duì)AD和EC DEGs的富集分析 基因本體論(GO)功能注釋是進(jìn)行大規(guī)模功能富集研究的常用方法,GO數(shù)據(jù)庫對(duì)基因的描述包括3個(gè)方面,分別為生物學(xué)過程(BP),分子功能(MF)和細(xì)胞組分(CC)。 京都基因與基因組百科全書(KEGG)是一個(gè)廣泛使用的數(shù)據(jù)庫,它存儲(chǔ)和基因組、生物途徑、疾病、化學(xué)物質(zhì)和藥物有關(guān)的大量數(shù)據(jù)。富集分析是一種可以把GO和KEGG數(shù)據(jù)庫中的功能和通路等進(jìn)行整合計(jì)算的算法。將篩選出的AD和EC的DEGs分別在clusterProfiler〔17〕包中進(jìn)行GO〔18〕功能注釋和KEGG〔19〕通路富集,富集分析閾值為counts≥2,F(xiàn)DR<0.05。
2.1AD與EC的差異表達(dá)基因 AD和EC DEGs的重疊(AD 125個(gè),EC 2 395個(gè)),得到19個(gè)共享基因包括白細(xì)胞分化抗原(CD)44、生長(zhǎng)抑素(SS)T、CD86、泛素結(jié)合酶E2T(UBE2T)、著絲粒蛋白(CENP)W等。在AD中19個(gè)基因中有6個(gè)基因上調(diào),13個(gè)基因下調(diào);在EC中19個(gè)基因有11個(gè)基因上調(diào),8個(gè)基因下調(diào),見表1。AD和EC DEGs見圖1標(biāo)記出的19個(gè)共享基因。
表1 AD和EC 19個(gè)共享基因表達(dá)
2.2AD和EC DEGs富集分析 AD的DEGs富集分析得到165個(gè)GO注釋和6個(gè)KEGG通路;對(duì)EC的DEGs進(jìn)行富集分析得到1 371個(gè)GO注釋和38個(gè)KEGG通路。最終,AD和EC沒有重疊的KEGG通路,但有8個(gè)重疊的GO注釋,分別為內(nèi)吞作用的調(diào)節(jié)、肽基酪氨酸磷酸化的正調(diào)控、細(xì)胞器定位的建立、神經(jīng)元死亡、神經(jīng)元死亡的調(diào)節(jié)、腫瘤壞死因子超家族細(xì)胞因子產(chǎn)生的調(diào)控、受體復(fù)合體、谷氨酸能突觸,見表2。
2.3AD與EC相關(guān)聯(lián)基因CD44、CD86在AD與EC中均呈高表達(dá),通過繪制CD44與CD86高、低表達(dá)組的KM生存曲線,對(duì)預(yù)后進(jìn)行評(píng)估發(fā)現(xiàn)CD44表達(dá)值高的組預(yù)后差,而CD86高低表達(dá)組生存曲線無顯著差別,表明CD86不具有預(yù)后價(jià)值。見圖2。
圖1 AD和EC DEGs火山圖
表2 AD和EC共享的GO富集分析
圖2 CD44和CD86高、低表達(dá)組的KM生存曲線
目前還沒有研究利用轉(zhuǎn)錄組學(xué)數(shù)據(jù)探究AD和EC間的關(guān)聯(lián),本研究通過對(duì)基因表達(dá)譜數(shù)據(jù)分析,識(shí)別AD和EC之間共享的異常表達(dá)基因和通路,找出將兩種復(fù)雜疾病聯(lián)系在一起的共享機(jī)制,探索兩種疾病的關(guān)聯(lián)情況。本研究得到的共享基因中,有些炎癥相關(guān)基因已明確涉及AD和EC的發(fā)病,如CD44、CD86和CHGA,提示炎癥反應(yīng)可能是將兩種疾病關(guān)聯(lián)起來的共同機(jī)制之一。CD44有20個(gè)外顯子,僅含有組成型外顯子的CD44轉(zhuǎn)錄產(chǎn)物為標(biāo)準(zhǔn)CD44(CD44S),EC上皮中CD44S表達(dá)增高與E-鈣黏著蛋白在上皮-間質(zhì)轉(zhuǎn)化中缺失有關(guān)〔20,21〕,這種蛋白的缺失降低了組織內(nèi)細(xì)胞的黏附力,使EC細(xì)胞轉(zhuǎn)移和侵襲能力增強(qiáng);星形膠質(zhì)細(xì)胞可清除AD腦組織中的Aβ,CD44是星形膠質(zhì)細(xì)胞形成過程中的重要黏附分子,在AD腦內(nèi),CD44陽性的星形膠質(zhì)細(xì)胞彌漫性急劇增加〔22〕,可能Aβ的刺激動(dòng)員了星形膠質(zhì)細(xì)胞發(fā)生炎癥反應(yīng),CD44因此表達(dá)升高。上述研究均表明CD44在AD和EC中呈現(xiàn)高表達(dá),與本研究結(jié)果一致,通過對(duì)CD44在EC中的預(yù)后分析,發(fā)現(xiàn)CD44表達(dá)值高的組預(yù)后差,與Okamoto等〔23〕研究結(jié)果一致。
CD86是促炎性M1表型的標(biāo)志物,Aβ可促進(jìn)小膠質(zhì)細(xì)胞激活產(chǎn)生促炎性M1表型,促進(jìn)炎癥和組織損傷,AD中存在大量M1表型的小膠質(zhì)細(xì)胞,CD86也處于高表達(dá)狀態(tài)〔24〕,這支持本研究中CD86在AD中上調(diào)。CD86是樹突細(xì)胞表面分子,它的低表達(dá)使得樹突細(xì)胞呈遞抗原的功能下降,癌細(xì)胞更容易逃脫免疫監(jiān)視。楊文鋒〔25〕通過RT-PCR檢測(cè)了EC組織中CD86的mRNA水平,發(fā)現(xiàn)其相對(duì)于正常對(duì)照組表達(dá)降低,推測(cè)這可能是炎癥因子(轉(zhuǎn)化生長(zhǎng)因子和白細(xì)胞介素10)導(dǎo)致CD86表達(dá)降低。本研究中CD86顯示在EC中上調(diào),與楊文鋒等〔25〕的結(jié)果不一致,可能是由于測(cè)量人群的異質(zhì)性或基因多態(tài)性〔26〕導(dǎo)致,需要進(jìn)一步設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證。
嗜鉻粒蛋白(CHG)A是一種可溶性糖蛋白,與激素和神經(jīng)肽一起存儲(chǔ)在內(nèi)分泌細(xì)胞的分泌顆粒中,是神經(jīng)內(nèi)分泌腫瘤的分化標(biāo)志物,參與腫瘤血管生成和腫瘤生長(zhǎng)調(diào)節(jié)〔27,28〕。突觸障礙可能在AD的病理生理中起關(guān)鍵作用,Lechner等〔29〕通過免疫組化實(shí)驗(yàn)發(fā)現(xiàn),約40%的CHGA免疫陽性斑塊和細(xì)胞外沉積物彌漫著活化的小膠質(zhì)細(xì)胞,提示CHGA可能是AD中神經(jīng)元、神經(jīng)膠質(zhì)和炎性機(jī)制之間的介體。
本研究還發(fā)現(xiàn)在共享基因中SST與激素分泌有關(guān),提示激素分泌也可能是AD和EC中共享的潛在機(jī)制。SST廣泛存在于下丘腦、大腦皮層、胃腸道中,已知它通過與高親和力的G蛋白耦聯(lián)生長(zhǎng)抑素受體結(jié)合而抑制許多次要激素的釋放,在共享的GO注釋中可發(fā)現(xiàn),AD和EC的DEGs同時(shí)被富集在激素轉(zhuǎn)運(yùn)、激素分泌、調(diào)節(jié)介素分泌這幾個(gè)激素相關(guān)的生物學(xué)功能上,提示激素可能在AD和EC中有關(guān)鍵作用。SST是Aβ1-42選擇性最強(qiáng)的結(jié)合物,干擾Aβ原纖維化并促進(jìn)Aβ裝配體的形成〔30〕。Jin等〔31〕通過實(shí)時(shí)甲基化特異性聚合酶鏈反應(yīng)對(duì)EC患者中SST的超甲基化進(jìn)行檢測(cè),發(fā)現(xiàn)在食管腺癌中,天然未甲基化中的SST mRNA水平顯著高于天然甲基化中的SST mRNA水平,且在鱗癌和腺癌中,SST的甲基化頻率和標(biāo)準(zhǔn)化甲基化均顯著高于正常對(duì)照組,表明SST的高甲基化和EC發(fā)生有關(guān)。
綜上,AD和EC這兩種疾病共享相同的差異表達(dá)基因,但它們?cè)趦煞N疾病中的差異表達(dá)方向有的相同,有的相反,這些共享的基因和通路涉及的炎癥反應(yīng)(如CD44、CD86)、激素釋放(如SST、GO:0030100)等生物學(xué)過程可能是將AD和EC聯(lián)系在一起的機(jī)制。AD和EC之間可能存在關(guān)聯(lián),關(guān)于兩種疾病關(guān)聯(lián)研究的證據(jù)還不充分,需要大型實(shí)驗(yàn)進(jìn)行驗(yàn)證。本研究從轉(zhuǎn)錄組學(xué)水平,利用生物信息學(xué)的方法對(duì)AD和EC的關(guān)聯(lián)進(jìn)行探索,提供了兩種疾病關(guān)聯(lián)研究的新視角。