楊嬋君,陳雯恬,劉 靜
(1.汕頭大學(xué)醫(yī)學(xué)院第二附屬醫(yī)院輸血科,廣東汕頭 515041;2.汕頭大學(xué)醫(yī)學(xué)院長江學(xué)者實驗室/廣東省乳腺癌診療重點實驗室/生理學(xué)教研室,廣東 汕頭 515041)
根據(jù)《2020年癌癥統(tǒng)計》的報告,惡性腫瘤是全球主要的公共衛(wèi)生問題之一,已成為僅次于心腦血管疾病的非傳染性疾病死亡原因。在各種惡性腫瘤中,胃癌是全球范圍內(nèi)癌癥死亡的第3大原因。每年約有72萬人死于胃癌,70%的確診病例發(fā)生在發(fā)展中國家,尤其是在東亞。目前,胃癌的診斷技術(shù)包括內(nèi)鏡檢查、影像學(xué)檢查、病理組織學(xué)檢查及腫瘤標(biāo)志物檢測等,手術(shù)聯(lián)合化療和放療是胃癌患者的主要治療方法。然而,由于缺乏特異性標(biāo)志物,胃癌的早期診斷率非常低,2/3的胃癌患者確診時已是晚期。更糟糕的是,有轉(zhuǎn)移的胃癌患者的5年生存率只有20%~30%。因此,迫切需要尋找特異性高的生物標(biāo)志物,用于胃癌的篩查、早期診斷和治療。本研究擬利用GEO數(shù)據(jù)庫篩選胃癌組織與正常組織的差異表達基因(differentially expressed genes,DEGs),并使用相關(guān)生物信息學(xué)軟件和方法識別出潛在的關(guān)鍵基因,以期發(fā)現(xiàn)可用于胃癌的診斷、預(yù)后判斷和治療的新的生物標(biāo)志物。
P
≤0.05。使用在線韋恩圖工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)對從每個數(shù)據(jù)集中獲得的結(jié)果進行計算和圖形重疊,得出胃癌中的DEGs。P
<0.05。為了探索胃癌的潛在分子機制,本研究利用STRING數(shù)據(jù)庫(http://string-db.org/)預(yù)測DEGs的蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interactions,PPIs),并用Cytoscape軟件及其cytoHubba插件計算了蛋白質(zhì)間的相互作用系數(shù)得分(hub score)。Hub score>1 000的基因被鑒定為胃癌中的核心基因,在PPIs網(wǎng)絡(luò)中具有高連通性。
miRNAs在胃癌中的功能因其調(diào)節(jié)通路的不同而不同。使用miRBD(http://mirdb.org)在線分析工具預(yù)測核心基因相關(guān)的miRNA,并用Cytoscape軟件繪制miRNA靶向調(diào)控網(wǎng)絡(luò)圖。
為了評價和驗證核心基因在胃癌中的生物學(xué)意義,本研究使用The Human Protein Atlas工具(https://www.proteinatlas.org)分析核心蛋白在胃癌組織和正常組織中的表達及定位情況;使用Oncomine數(shù)據(jù)庫(https://www.oncomine.org/resource/main.html)在 線 分 析工具對核心蛋白mRNA表達水平在正常組織和胃癌組織中的表達差異進行分析;使用UALCAN數(shù)據(jù)庫(http://ualcan.path.uab.edu)分析核心基因在不同種族胃癌患者中的表達情況。
為了評估核心基因在胃癌患者中的預(yù)后價值,使用Kaplan-Meier數(shù)據(jù)庫(http://kmplot.com/analysis)分析核心基因?qū)ξ赴┗颊呱娴挠绊憽?/p>
在GEO數(shù)據(jù)庫獲得GSE65801、GSE79973和GSE118916等3個胃癌基因表達數(shù)據(jù)集,火山圖(圖1A~C)顯示,大多數(shù)基因的表達無明顯改變,少數(shù)基因表達水平發(fā)生了顯著變化,這可能是胃癌發(fā)生發(fā)展的關(guān)鍵因素。圖1中D~F的聚類熱圖顯示出了核心基因表達的顯著變化,有助于區(qū)分胃癌組織和正常組織。
P
≤0.05且差異倍數(shù)|logFC|≥2進行篩選;分別篩選GSE65801、GSE79973和GSE118916的上調(diào)和下調(diào)基因,在線繪制韋恩圖,獲得了25個上調(diào)差異表達基因和85個下調(diào)差異表達基因(圖1G~I)。圖1 數(shù)據(jù)集的基因表達模式及胃癌組織中3個DEGs
生物過程功能富集分析發(fā)現(xiàn)DEGs主要富集于消化、骨骼系統(tǒng)發(fā)育和膠原纖維組織(圖2A);細胞組分功能富集分析主要涉及膠原蛋白、纖維膠原蛋白、胞外區(qū)、細胞外基質(zhì)部分,以及蛋白質(zhì)類細胞外基質(zhì)(圖2B);分子功能分析顯示其與細胞外基質(zhì)結(jié)構(gòu)成分顯著相關(guān)(圖2C);根據(jù)KEGG分析,DEGs主要富集于細胞外基質(zhì)受體相互作用和局部黏附(圖2D)。
圖2 通過GO和KEGG通路對DEGs的功能富集分析
為了進一步分析胃癌中DEGs之間的相關(guān)性,構(gòu)建了PPIs網(wǎng)絡(luò)并計算了蛋白與其他蛋白間相互作用分數(shù),揭示了所識別DEGs之間的密切關(guān)系。蛋白間相互作用分數(shù)高(hub score>1 000)的DEGs與其他DEGs具有較強的相關(guān)性,被認為是胃癌中的核心基因,即COL1A1、COL1A2、COL12A1、COL6A3、COL2A1和COL10A1。所有的核心基因都屬于膠原家族成員,與細胞外基質(zhì)的調(diào)控密切相關(guān)(圖3)。
圖3 蛋白-蛋白互作網(wǎng)絡(luò)(PPIs)與hub評分
在miRDB數(shù)據(jù)庫預(yù)測miRNAs調(diào)控核心基因的基礎(chǔ)上,進一步篩選出得分大于80的miRNA。通過Cytoscape軟件構(gòu)建了miRNA-mRNA網(wǎng)絡(luò),表明屬于miR-29s家族的hsa-miR-29a-3p、hsa-miR-29b-3p和hsa-miR-29c-3p可以同時調(diào)控多個核心基因(圖4)。
圖4 核心基因的miRNA-mRNA網(wǎng)絡(luò)
P
<0.05,見圖5)。圖5 核心基因在正常組織和胃癌組織中的表達差異
由于胃癌在不同種族人群中的發(fā)病率不同,我們進一步利用TCGA數(shù)據(jù)庫分析核心基因mRNA在胃癌組織中的表達情況,發(fā)現(xiàn)不同種族的胃癌患者中COL1A1、COL1A2和COL10A1的表達均高于正常胃組織(均為P
<0.05,圖6A、B和F)。除非洲裔美國人外,與正常胃組織相比,白種人和亞洲人胃癌患者COL12A1和COL6A3的表達增加(P
<0.05,圖6C和D)。在不同種族背景的胃癌患者中未發(fā)現(xiàn)COL2A1的異常表達(圖6E)。圖6 TCGA數(shù)據(jù)庫中不同民族胃癌患者hub基因表達的差異
除了核心基因的mRNA水平外,人類蛋白質(zhì)圖譜Human Atlas也提供了不同組織中相關(guān)蛋白的表達情況。典型圖片提示,與正常胃組織相比,胃癌組織中COL1A1和COL12A1的蛋白表達水平升高(圖7),而其他核心基因在胃癌和正常胃組織之間蛋白表達未見顯著差異。
圖7 胃癌和正常胃組織中核心基因的蛋白表達水平
P
<0.05)。相反,核心基因mRNA低表達的胃癌患者生存期較長(圖8)。圖8 核心基因表達情況對胃癌患者生存期的影響
胃癌作為臨床常見的惡性腫瘤,其發(fā)病具有明顯的地域差異性,我國東部沿海和西北部地區(qū)的發(fā)病率明顯高于南方地區(qū)。盡管在過去的一個世紀里發(fā)現(xiàn)胃癌的發(fā)病率有所下降,但在我國它仍居男性常見癌癥第2位,女性常見癌癥第5位。因此,揭示胃癌發(fā)生發(fā)展的機制,挖掘可用于胃癌診斷、治療和預(yù)后判斷的特異性生物標(biāo)志物尤為重要。隨著高通量技術(shù)的發(fā)展和普及,以及多種生物信息學(xué)工具的開發(fā),極大地促進了基因圖譜的研究,為胃癌患者的早期篩查和臨床治療提供了顯著的優(yōu)勢。
為了探索胃癌患者的潛在生物標(biāo)志物,本研究利用3個基因芯片數(shù)據(jù)集,建立了胃癌組織和正常組織的基因表達譜。GO功能富集分析和KEGG通路分析表明,COL1A1、COL1A2、COL12A1、COL6A3、COL2A1和COL10A1等膠原蛋白基因在細胞外基質(zhì)相關(guān)功能或通路中富集。人們普遍認為,細胞外基質(zhì)(extracellular matrix,ECM)重構(gòu)的穩(wěn)態(tài),即受損分子或舊分子在降解的同時被新分子替換,是維持組織穩(wěn)態(tài)的關(guān)鍵過程。ECM的組成和數(shù)量的改變對腫瘤和基質(zhì)細胞的性質(zhì)有很大的影響,這些改變會激活下游信號,從而調(diào)節(jié)細胞行為,促進腫瘤的進展。
據(jù)報道,相關(guān)研究發(fā)現(xiàn)ECM在惡性腫瘤中通常是失調(diào)的,并參與惡性細胞增殖、黏附、遷移、血管生成和藥物代謝。膠原蛋白基因參與腫瘤ECM與受體的相互作用和局灶性黏附途徑,在腫瘤的侵襲、轉(zhuǎn)移過程中擔(dān)任著重要的角色。大多數(shù)的研究表明,膠原蛋白基因的高表達促進了癌細胞的增殖和腫瘤的發(fā)生。Liu等發(fā)現(xiàn),COL1A1在宮頸癌組織中的表達水平顯著增加,并抑制了輻射誘導(dǎo)的宮頸癌細胞凋亡,而COL5A1的過度表達誘導(dǎo)了肺癌的轉(zhuǎn)移。COL1A1在結(jié)直腸癌中高表達,是一種潛在的診斷性生物標(biāo)志物和治療靶點。COL3A1和POSTN在食管癌中高表達,與病理分期呈正相關(guān),可能在食管癌的發(fā)生和發(fā)展中起重要作用。而COL12A1在結(jié)腸直腸癌中高表達,提示預(yù)后不良,可作為其預(yù)后的生物標(biāo)志物。COL1A2
、COL6A3
和THBS2
基因沉默可通過PI3K-Akt信號通路抑制胃癌細胞增殖、遷移和侵襲,同時促進細胞凋亡。I型膠原還破壞細胞間鈣黏蛋白,增加胰腺癌細胞的遷移,破壞PTHrP、IL-6和IL-8的表達。本研究發(fā)現(xiàn)COL1A1、COL1A2和COL6A3在胃癌組織中的表達顯著高于正常胃組織,而生存結(jié)果分析顯示COL1A1和COL6A3高表達與預(yù)后不良相關(guān)。對不同種族的基因表達分析和生存分析顯示,COL1A1、COL1A2和COL6A3在不同種族胃癌中表達均上調(diào)。盡管COL2A1在GEO數(shù)據(jù)集中顯著上調(diào),但在腫瘤數(shù)據(jù)庫中,COL2A1在胃癌和正常組織之間的表達無顯著差異。功能富集分析表明,COL2A1可能在腫瘤細胞外基質(zhì)與受體的相互作用和局灶性黏附過程中起作用。提示COL2A1可能是一個新的潛在診斷胃癌的生物標(biāo)志物和治療靶點。
如上文所述,膠原蛋白是腫瘤細胞外基質(zhì)的主要成分,因此在胃癌組織中發(fā)現(xiàn)了多種不同膠原蛋白類型。Sun證實了與正常組織相比,COL1A1在胃癌中表達上調(diào),表明其在胃癌細胞侵襲和轉(zhuǎn)移中發(fā)揮了重要作用。Guo等進一步發(fā)現(xiàn)COL1A1過表達可誘導(dǎo)TGF-β信號通路激活,促進胃癌細胞增殖和遷移。為了探討胃癌發(fā)生、發(fā)展和多樣性的潛在機制,Hippo等在22例原發(fā)性人類晚期胃癌組織和8例正常組織中進行了高密度寡核苷酸芯片研究,揭示了一些基因在癌組織中高表達,即與細胞周期、生長因子、細胞運動、細胞黏附和基質(zhì)重塑等相關(guān)的基因。在異常表達的基因中,發(fā)現(xiàn)胃癌組織中膠原降解增加,而膠原降解是腫瘤細胞侵襲周圍組織的重要步驟。Yasui等報道COL1A1和COL1A2是胃癌的新生標(biāo)記物,因為它們在胃癌中普遍過表達,與侵襲和轉(zhuǎn)移相關(guān)。此外,一項基于Oncomine數(shù)據(jù)庫的分析發(fā)現(xiàn),在mRNA轉(zhuǎn)錄水平上,與正常胃組織相比,COL1A2
基因在胃癌組織中高表達;進行在線生存分析發(fā)現(xiàn),與COL1A2
基因低表達組相比,高表達組的胃癌患者總體生存期降低;進一步分析發(fā)現(xiàn),COL1A2
基因高表達的腸型、彌漫型胃癌患者總體生存期降低。膠原蛋白家族的另一成員COL10A1受miR-26a-5p調(diào)控,并在胃癌細胞中高表達,以促進癌細胞的增殖、遷移和侵襲。Jiang等通過定量PCR和免疫組織化學(xué)檢測,發(fā)現(xiàn)COL12A1在胃癌組織中表達增加,與腫瘤侵襲、轉(zhuǎn)移和臨床晚期顯著相關(guān)。重要的是,COL12A1表達增加導(dǎo)致總生存率降低,多變量Cox分析表明COL12A1高表達是胃癌患者一個強有力的獨立預(yù)后指標(biāo)。敲低胃癌細胞SGC-7901中COL12A1的表達水平后,細胞的生長和增殖能力被顯著抑制,細胞的侵襲能力也顯著降低,表明COL12A1具有促進細胞生長和侵襲能力的效應(yīng),提示其可能在胃癌的生長和侵襲轉(zhuǎn)移中發(fā)揮了重要作用。另外,miR-29被認為是多種惡性腫瘤的抑 癌基因。Qi等通過Meta分析評估了miR-49在多種人類惡性腫瘤中的預(yù)后價值,并指出miR-29的低表達與惡性腫瘤的侵襲性和預(yù)后不良有關(guān),可能成為預(yù)測人類惡性腫瘤復(fù)發(fā)和進展的關(guān)鍵生物標(biāo)志物。Cushing等報道了miR-29通過抑制ECM,包括膠原蛋白,以及調(diào)節(jié)膠原合成、交聯(lián)和降解的酶發(fā)揮作用。為了證實miR-29a在癌細胞增殖和侵襲中的功能作用,Muniyappa等對人工改變miR-29a表達的細胞進行了2D-DIGE蛋白質(zhì)組學(xué)分析,發(fā)現(xiàn)了幾種候選蛋白,包括RAS癌基因家族成員RAN
,顯著降低了癌細胞的侵襲能力。核糖體蛋白S15a(RPS15A)被證實通過激活A(yù)kt/IKK-β/NF-κB信號通路促進胃癌的進展,并且通過沉默RPS15A抑制胃癌細胞的增殖和遷移。Zhang等發(fā)現(xiàn)miR-29s直接結(jié)合到RPS15A的3′-UTR,并通過抑制肝細胞中RPS15A的表達抑制細胞生長和細胞周期。An等發(fā)現(xiàn)miR-29a-3p可以結(jié)合到COL1A1并抑制其蛋白表達,并證實了circKRT7通過EMT途徑吸收miR-29a-3p,可促進卵巢癌細胞的增殖和轉(zhuǎn)移。在本研究中,miR-29s被認為是多種膠原基因的調(diào)節(jié)因子,可能在胃癌的發(fā)生發(fā)展中起到癌基因的作用。miR-29-3p在鼻咽癌細胞中直接結(jié)合和調(diào)節(jié)COL1A1,被證實介導(dǎo)癌細胞的放射敏感性。在結(jié)直腸癌中,干擾素-γ通過將干擾素調(diào)節(jié)因子1(interferon regulatory factor 1,IRF-1)吸引到miR-29b啟動子區(qū)域的結(jié)合位點來增加miR-29b的表達水平,并且miR-29b增加了IRF-1的表達,形成了一個正的IRF1/miR-29b反饋環(huán)。此外,IGF1被證實為miR-29b的靶點,而IGF1是PI3K/Akt信號通路的激活因子,miR-29b可通過阻斷PI3K/Akt信號通路從而抑制結(jié)直腸癌細胞生長和侵襲。Wang等證實了miR-29b對肺動脈平滑肌細胞膠原Ⅰ合成的調(diào)節(jié)作用,預(yù)測了miR-29s在ECM膠原沉積中的重要作用。此外,Yu等研究發(fā)現(xiàn),miR-29c在胃癌組織和細胞系中下調(diào),miR-29c過表達可抑制細胞增殖,促進細胞凋亡,阻滯G1/G0期細胞周期。van Rooij等發(fā)現(xiàn)miR-29是一群編碼纖維化相關(guān)蛋白(如膠原蛋白、纖維蛋白和彈性蛋白)的miRNAs,上調(diào)miR-29的表達可以降低體內(nèi)外膠原蛋白的表達。在腫瘤微環(huán)境中,miR-29可能通過不同的分子生物學(xué)過程參與膠原蛋白的調(diào)控。然而,目前miR-29家族的研究尚在初級階段,其在腫瘤學(xué)研究中的意義有待挖掘,miR-29家族與膠原蛋白家族的相互調(diào)控機制尚需進一步闡明。
綜上所述,本研究在胃癌組織中發(fā)現(xiàn)了一組膠原基因,其在胃癌組織中高表達,與胃癌患者的預(yù)后密切相關(guān),在胃癌中具有潛在診斷作用,可作為新的治療靶點,且其表達和相關(guān)生物學(xué)過程可能受miR-29s的調(diào)控。