李 楠, 陳 蕾, 許天敏, 張 琨
(1.吉林大學(xué)第二醫(yī)院檢驗(yàn)科,吉林 長春 130041;2.吉林大學(xué)第二醫(yī)院婦產(chǎn)科,吉林 長春 130041;3.吉林大學(xué)第二醫(yī)院研究中心,吉林 長春 130041)
子宮內(nèi)膜異位癥(endometriosis,EMS) 是婦科常見的良性疾病,在育齡婦女中的發(fā)病率可達(dá)10%~15%,是育齡女性慢性盆腔痛和不育的常見病因[1]。研究[2-3]提示:EMS 雖為良性疾病卻有浸潤、復(fù)發(fā)和轉(zhuǎn)移的惡病質(zhì)傾向及惡變的可能,其發(fā)病率逐年增加。EMS 病因和發(fā)病機(jī)制尚未明確,目前臨床上基本通過出現(xiàn)明顯癥狀后的B 超檢查及最終進(jìn)行有創(chuàng)病理活檢確診,很難早期發(fā)現(xiàn)和診斷。因此,急需探索用于EMS 早期診斷和預(yù)后評估的生物學(xué)標(biāo)記物。近年來,基于基因分子水平進(jìn)行EMS 發(fā)生發(fā)展的研究較多,EMS 組織中已鑒定出多種失調(diào)基因參與細(xì)胞凋亡、細(xì)胞周期調(diào)控、血管形成、免疫系統(tǒng)調(diào)節(jié)和細(xì)胞黏附等功能[4-5]。隨著大數(shù)據(jù)時(shí)代的到來及生物信息學(xué)的發(fā)展,對數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)進(jìn)行分析可以快速發(fā)現(xiàn)病變組織中的差異表達(dá)基因(differentially expressed genes,DEGs),并可通過進(jìn)一步分析找到影響疾病發(fā)生發(fā)展的分子靶標(biāo)。本研究通過對基因表達(dá)匯編(Gene Expression Omnibus,GEO) 數(shù)據(jù)庫中EMS基因芯片進(jìn)行聯(lián)合分析,以期篩選出具有高可信度的DEGs 并分析其生物學(xué)功能,為揭示EMS 發(fā)生的分子機(jī)制提供理論依據(jù),并有助于開辟EMS 研究的新方向。
1.1 EMS 基因芯片數(shù)據(jù)信息獲取使用GEO 數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/),以“endometriosis” 為關(guān)鍵詞進(jìn)行檢索,采用GEO2R 在線工具篩選相關(guān)數(shù)據(jù)集。篩選條件:①mRNA 表達(dá)譜數(shù)據(jù)集;②以異位子宮內(nèi)膜組織為樣本;③以病變旁或正常子宮內(nèi)膜組織為對照。選擇基于GPL571 平臺的GSE25628 數(shù)據(jù)集,其中包括8 個(gè)EMS 樣本(含一個(gè)重復(fù)實(shí)驗(yàn)樣本) 和6 個(gè)正常子宮內(nèi)膜樣本; 基于GPL6102 平臺的GSE23339 數(shù)據(jù)集,包括10 個(gè)EMS 樣本(含4 個(gè)重復(fù)實(shí)驗(yàn)樣本) 和9 個(gè)正常子宮內(nèi)膜樣本; 基于GPL570 平臺的GSE7305 數(shù)據(jù)集,包括10 個(gè)EMS樣本和10 個(gè)正常子宮內(nèi)膜樣本。
1.2 DEGs 的提取和分析GEO2R (https://www.ncbi.nlm.nih.gov/geo/geo2r/) 可用于分析GEO 數(shù)據(jù)集中不同數(shù)據(jù)組的差異表達(dá)水平。以EMS 組織為實(shí)驗(yàn)組,以正常子宮內(nèi)膜組織樣本為對照組,使用GEO2R 在線分析工具分別分析并篩選出GSE25628、GSE23339 和GSE7305 數(shù)據(jù)集中的DEGs。篩選標(biāo)準(zhǔn)為P<0.05,且|logFC|≥1.5。以logFC≥1.5 為上調(diào)基因,logFC≤-1.5 為下調(diào)基因。然后,對每個(gè)數(shù)據(jù)集進(jìn)行統(tǒng)計(jì)分析,并使用Venn 圖網(wǎng)絡(luò)工具(bioinformatics.psb.ugent.be/webtools/Venn/) 確定3 個(gè)數(shù)據(jù)集公共的DEGs 用于進(jìn)一步分析。
1.3 DEGs 的基因本體功能注釋(Gene Ontology,GO)富集和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析使用富集分析數(shù)據(jù)庫6.8 版本(DAVID)(https://david.ncifcrf.gov/) 進(jìn)行DEGs 的GO 注釋分析和KEGG 通路富集分析。在GO 分析中P<0.01,在KEGG 分析中P<0.05,數(shù)據(jù)被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。最后獲得DEGs 的分子功能(molecular function,MF)、生物學(xué)過程(biological process,BP)和細(xì)胞成分(cellular component,CC) 等注釋分析和通路富集分析。
1.4 DEGs 蛋白- 蛋白互作(protein-proteininteraction,PPI)網(wǎng)絡(luò)構(gòu)建和核心基因篩選為了評估潛在的蛋白質(zhì)相互作用關(guān)系,將上述所得的70 個(gè)DEGs 映射到STRING 數(shù)據(jù)庫11.0 版本(http://string-db.org/) 進(jìn)行PPI 網(wǎng)絡(luò)構(gòu)建。隨后通過Cytoscape 軟件(www.cytoscape.org/) 將PPI 網(wǎng)絡(luò)可視化并去除游離蛋白質(zhì)節(jié)點(diǎn)。最后通過cytoscape 的一個(gè)插件CytoHubba 計(jì)算每個(gè)蛋白質(zhì)節(jié)點(diǎn)的連接度(Degree) 并按照降序排列,以排序前10 的DEGs 作為EMS 發(fā)病相關(guān)的核心基因。
2.1 EMS 患者DEGs 的篩選采用GEO2R 對3 個(gè)數(shù)據(jù)集進(jìn)行處理分析后,從GSE25628 數(shù)據(jù)集中鑒定出1 182 個(gè)DEGs,其中726 個(gè)基因上調(diào),456 個(gè)基因下調(diào); 從GSE23339 數(shù)據(jù)集中鑒定到386 個(gè)DEGs,其中186 個(gè)基因上調(diào),200 個(gè)基因下調(diào);從GSE7305 數(shù)據(jù)集中鑒定出801 個(gè)DEGs,其中372 個(gè)基因上調(diào),429 個(gè)基因下調(diào)。使用Venn 圖網(wǎng)絡(luò)工具將篩選出來的DEGs 進(jìn)行Venn 分析,結(jié)果顯示:在GSE25628、GSE23339 和GSE7305 數(shù)據(jù)集中同時(shí)存在的DEGs 共70 個(gè),其中發(fā)生上調(diào)的基因有27 個(gè),發(fā)生下調(diào)的基因有43 個(gè)(圖1)。
圖1 DEGs 的Venn 分析Fig.1 Venn analysis of DEGs
2.2 DEGs 的GO 富集和KEGG 通路分析使用DAVID 數(shù)據(jù)庫對共同上調(diào)或下調(diào)的DEGs 進(jìn)行GO富集分析和KEGG 通路分析。GO 富集分析結(jié)果顯示:在生物學(xué)功能方面,DEGs 主要富集在傷口愈合、單個(gè)生物細(xì)胞-細(xì)胞黏附、腎臟發(fā)展、解剖結(jié)構(gòu)形態(tài)發(fā)生、黏多糖代謝過程、細(xì)胞外基質(zhì)組織和細(xì)胞黏附等方面;在細(xì)胞成分上,DEGs 主要涉及細(xì)胞外基質(zhì)、細(xì)胞外空間、細(xì)胞外區(qū)域和蛋白質(zhì)的細(xì)胞外基質(zhì)等。見表1。KEGG 通路分析結(jié)果顯示: DEGs 富集于磷酸肌醇代謝通路中,包括PIP5K1B、 PLCH1 和PLCB1,P=0.042 693。
表1 DEGs 在GO 富集中的分布Tab.1 Distribution of DEGs in GO enrichment
2.3 DEGs 的PPI 網(wǎng)絡(luò)構(gòu)建和核心基因識別采用STRING 數(shù)據(jù)庫11.0 版本分析DEGs 之間的PPI 關(guān)系,網(wǎng)絡(luò)共涉及70 個(gè)節(jié)點(diǎn)和312 個(gè)連接。利用cytoscape 對PPI 網(wǎng)絡(luò)進(jìn)行可視化及分析(圖2),計(jì)算每個(gè)蛋白質(zhì)節(jié)點(diǎn)的連接度,選擇具有最高連接度的10 個(gè)節(jié)點(diǎn)DEGs 作為EMS 的核心基因(表2),結(jié)果顯示:排名前10 位的核心基因分別為核心蛋白聚糖(decorin,DCN)、 上皮細(xì)胞黏附分子(epithelial cell adhesion molecule,EPCAM)、雙鏈蛋白聚糖(biglycan,BGN)、 脂肪酸結(jié)合蛋白4(fatty acid binding protein 4,F(xiàn)ABP4)、神經(jīng)酪氨酸激酶受體2(neurotyrosine kinase receptor,NTRK2)、磷脂酰肌醇聚糖3(glypican-3 ,GPC-3)、 表皮生長因子受體3 (epidermal growth factor receptor 3,ERBB3)、 分化抗原簇蛋白24(cluster of differentiationprotein 24,CD24)、 巢蛋白2 (nidogen-2,NID2) 和血小板反應(yīng)蛋白2(thrombospondin-2,THBS2)。
表2 連接度排名前10 位核心基因Tab.2 Top 20 core genes in connectivities
圖2 DEGs 的PPI 分析Fig.2 PPI analysis of DEGs
子宮內(nèi)膜組織(腺體和間質(zhì)) 出現(xiàn)在子宮體以外的部位時(shí),稱為EMS,主要表現(xiàn)為下腹痛、痛經(jīng)、 不孕和性交不適,降低了患者的生活質(zhì)量。EMS 在某些方面類似于惡性腫瘤:呈漸進(jìn)性和浸潤性生長,有復(fù)發(fā)和轉(zhuǎn)移傾向。目前EMS 的病因仍不清楚,被廣泛接受的發(fā)生機(jī)制仍是逆行月經(jīng)學(xué)說。遺傳變異會增加EMS 的易感性,也有越來越多的指標(biāo)被鑒定出有希望成為EMS 早期診斷的生物標(biāo)志物,但尚無定論。
隨著生物信息學(xué)技術(shù)的飛速發(fā)展,通過基因芯片數(shù)據(jù)研究疾病發(fā)病機(jī)制成為了研究熱點(diǎn),也為研
究EMS 提供了新方法。本研究采用生物信息學(xué)方法分析從GEO 數(shù)據(jù)庫下載的基因表達(dá)譜數(shù)據(jù),篩選EMS 病變組織與健康組織之間的DEGs,對篩選出的DEGs 進(jìn)行GO 分析和KEGG 通路分析,最后通過建立PPI 網(wǎng)絡(luò)來識別與EMS 相關(guān)的核心基因。本研究共篩選出10 個(gè)EMS 的核心基因,包括DCN、 EPCAM、 BGN、 FABP4、 NTRK2、GPC3、 ERBB3、 CD24、 NID2 和THBS2,通過對比上述基因的GO 基因功能分析結(jié)果和KEGG 通路分析結(jié)果顯示: 有4 個(gè)基因(DCN、 BGN、NID2 和THBS2) 與細(xì)胞外基質(zhì)有密切關(guān)聯(lián),在EMS 患者中的表達(dá)均下調(diào),推測其可能通過異常的基質(zhì)重塑,參與異位子宮內(nèi)膜細(xì)胞的生長、侵襲和黏附等過程,促進(jìn)EMS 的發(fā)展。細(xì)胞外基質(zhì)分子表達(dá)和降解的調(diào)控不僅對維持組織或器官的完整結(jié)構(gòu)起作用,而且對其正常功能的維持也起著至關(guān)重要的作用。EMS 的發(fā)展涉及多個(gè)步驟的基質(zhì)重塑過程,包括異常組織生長、侵襲和黏連形成等。EMS 相關(guān)的異?;|(zhì)重塑過程受多種因素的影響,包括蛋白水解酶及其抑制劑,通過調(diào)節(jié)生殖道的組織更新來維持子宮內(nèi)膜的完整性以及雌、孕激素水平,均直接影響月經(jīng)周期中子宮內(nèi)膜的生長和脫落。
DCN 是富含亮氨酸的小蛋白聚糖家族的一員,是一種基質(zhì)蛋白聚糖,可以調(diào)節(jié)膠原纖維形成和維持組織完整性[6],在細(xì)胞外基質(zhì)中發(fā)揮重要作用。DCN 基因在多種腫瘤細(xì)胞中低表達(dá),參與腫瘤進(jìn)展。近年來,已有多項(xiàng)研究將DCN 定為潛在預(yù)測生物標(biāo)記物和治療靶點(diǎn),如肺腺癌、腎細(xì)胞癌和大腸癌[7-9]等。大腸癌的共表達(dá)網(wǎng)絡(luò)分析同時(shí)顯示:DCN mRNA 低表達(dá)與miR200c 高表達(dá)有關(guān),表明miR200c 可能是DCN 的一種內(nèi)源性抑制劑[10-11],而miR200 已在2015 年被鑒定為EMS 中有診斷價(jià)值的生物標(biāo)記物。但DCN 在EMS 中作用的研究還較少。DCN 可能通過誘導(dǎo)異位內(nèi)膜組織中p21 的合成來誘導(dǎo)細(xì)胞周期停滯,從而對人子宮內(nèi)膜異位上皮細(xì)胞和子宮內(nèi)膜間質(zhì)細(xì)胞具有明顯的抑制增殖作用,且孕酮誘導(dǎo)的DCN 表達(dá)在抑制EMS 發(fā)生中起重要的作用[12]。近期有研究[13]顯示:EMS 患者的顆粒細(xì)胞(壁細(xì)胞) 中DCN mRNA 表達(dá)水平異常降低,但目前尚不清楚DCN 是否也參與了EMS 的病理生理過程。
BGN 與DCN 具有結(jié)構(gòu)相似性,是一種富含亮氨酸的蛋白聚糖。BGN 在腫瘤細(xì)胞間質(zhì)中的上調(diào)與細(xì)胞增殖、 細(xì)胞遷移、 轉(zhuǎn)移和血管生成有關(guān)[14-16]。BGN 過表達(dá)的子宮內(nèi)膜細(xì)胞顯示出更強(qiáng)的侵襲性和遷移性[17]。研究[18]顯示:采用蛋白質(zhì)印跡和ELISA 法分別測定卵巢EMS 患者血清和腹腔液中BGN 水平,腹腔液中BGN 水平與良性囊腫患者和健康女性對照組比較明顯升高,但血清中BGN 水平差異無統(tǒng)計(jì)學(xué)意義。2011 年,一項(xiàng)尋找卵巢EMS 潛在生物標(biāo)志物的研究[19]已將BGN 預(yù)測為潛在的生物標(biāo)志物,并提出編碼分泌蛋白或細(xì)胞外基質(zhì)蛋白的基因,可能代表了一系列潛在的卵巢EMS 診斷和治療的生物標(biāo)志物和藥物靶點(diǎn),但仍需更進(jìn)一步研究來明確。
NID2 是一種巢蛋白(nidogen) 家族蛋白,與細(xì)胞外基質(zhì)中的層黏連蛋白和膠原蛋白協(xié)同發(fā)揮平衡基底膜完整性和穩(wěn)定性的作用[20-21]。NID2 高甲基化與癌癥的發(fā)生有關(guān),在幾種癌癥中NID2 表達(dá)下調(diào),提示NID2 具有抑癌活性[22-23]。NID2 的缺失有助于癌癥的發(fā)展,由于細(xì)胞間相互作用減弱,可能會刺激轉(zhuǎn)移和侵襲[24-25]。研究[26-27]顯示:NID 可作為診斷卵巢癌和肝細(xì)胞癌的生物標(biāo)記物。EMS與部分卵巢透明細(xì)胞癌、子宮內(nèi)膜樣癌和子宮內(nèi)膜癌的形成有關(guān)[28],但其惡變機(jī)制至今尚未明確。
THBS2 是凝血酶原蛋白家族中的一員。通常被認(rèn)為是腫瘤發(fā)生過程中血管生成的內(nèi)源性負(fù)性調(diào)節(jié)因子[29]。THBS2 是基質(zhì)細(xì)胞鈣離子(Ca2+) 結(jié)合糖蛋白家族的成員,已觀察到其可與多種細(xì)胞受體、生長因子和細(xì)胞外基質(zhì)蛋白相互作用,從而影響細(xì)胞黏附、 增殖和凋亡功能[30-31]。據(jù)報(bào)道,THBS2 可以分別通過基質(zhì)金屬蛋白酶(matrix metalloproteinases,MMPs) 中 的 MMP-2、MMP-9 和MMP-3 促進(jìn)不同腫瘤的發(fā)展[32-34]。而在異位子宮內(nèi)膜中MMP-2 和MMP-9 的表達(dá)均高于無EMS 患者[35]。病例對照研究顯示:MMP3 基因多態(tài)性與患EMS 的風(fēng)險(xiǎn)呈正相關(guān)關(guān)系,因此與MMPs 有密切關(guān)聯(lián)的THBS2 有待進(jìn)一步研究。
綜上所述,DCN、BGN、NID2 和THBS2 基因是參與EMS 發(fā)生進(jìn)展過程的核心基因,可能通過調(diào)節(jié)細(xì)胞外基質(zhì)參與EMS 的發(fā)生發(fā)展。異常基質(zhì)重塑與EMS 的發(fā)展有密切關(guān)聯(lián),了解參與子宮內(nèi)膜基質(zhì)重塑的基因及其調(diào)節(jié)因子,可能有助于闡明EMS 的病因,并進(jìn)一步改善EMS 診斷、治療和預(yù)后判斷的方法。經(jīng)后續(xù)大量樣本檢測驗(yàn)證,上述基因有望成為預(yù)測EMS 發(fā)生的生物標(biāo)志物和治療靶標(biāo)。
吉林大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2022年1期