周 荃 孫麗萍
中國(guó)醫(yī)科大學(xué)附屬第一醫(yī)院腫瘤病因與篩查研究室 遼寧省高校腫瘤病因與預(yù)防重點(diǎn)實(shí)驗(yàn)室(110001)
背景:MicroRNAs(miRNA)是多種真核生物基因表達(dá)的負(fù)調(diào)節(jié)因子,在RNA沉默和基因轉(zhuǎn)錄后調(diào)控中發(fā)揮作用。幾乎所有類(lèi)型的惡性腫瘤中均發(fā)生miRNA失調(diào),可影響多種基因表達(dá)。目的:構(gòu)建胃癌核心miRNA調(diào)控網(wǎng)絡(luò),為解析miRNA在胃癌發(fā)生、發(fā)展中的分子機(jī)制提供理論依據(jù)。方法:利用miRNA和mRNA表達(dá)譜芯片篩選差異表達(dá)miRNA和mRNA,應(yīng)用miRWalk 2.0預(yù)測(cè)miRNA相互作用的基因,并與表達(dá)譜芯片篩選出的基因進(jìn)行交叉匹配,確定核心差異表達(dá)miRNA,構(gòu)建miRNA-mRNA調(diào)控網(wǎng)絡(luò)。對(duì)靶基因進(jìn)行GO分析和KEGG分析。結(jié)果:表達(dá)譜芯片篩選出21個(gè)上調(diào)miRNA和36個(gè)下調(diào)miRNA,交叉匹配后發(fā)現(xiàn)1 042個(gè)低表達(dá)基因和711個(gè)高表達(dá)基因,最終確定10個(gè)核心miRNA-mRNA調(diào)控網(wǎng)絡(luò)。受核心miRNA調(diào)控的差異表達(dá)基因主要參與腫瘤相關(guān)通路,高表達(dá)基因主要富集于ECM-受體作用通路等9個(gè)信號(hào)通路,而低表達(dá)基因主要富集于神經(jīng)活性配體-受體相互作用等5個(gè)信號(hào)通路。GO分析結(jié)果顯示上調(diào)基因涉及315個(gè)功能、下調(diào)基因涉及88個(gè)功能,其中細(xì)胞外基質(zhì)組織的相關(guān)性最高。結(jié)論:基于生物信息學(xué)的miRNA-mRNA調(diào)控網(wǎng)絡(luò)分析為研究胃癌提供了新的視角,有助于系統(tǒng)性闡明miRNA在胃癌發(fā)生、發(fā)展中的分子作用機(jī)制,可為胃癌診斷標(biāo)志物的篩選和藥物治療精準(zhǔn)靶點(diǎn)的選擇提供理論基礎(chǔ)。
胃癌是全球五大高發(fā)腫瘤之一,死亡率居于惡性腫瘤前三位,東亞和東歐是胃癌最高發(fā)地區(qū)[1]。2012年統(tǒng)計(jì)數(shù)據(jù)顯示,我國(guó)胃癌新發(fā)病例約為42.4萬(wàn)例,死亡病例約為29.8萬(wàn)例[2]。對(duì)胃癌發(fā)生、發(fā)展過(guò)程中分子機(jī)制的研究,有助于揭示胃癌的發(fā)病機(jī)制、篩選胃癌診斷標(biāo)志物和選擇藥物治療精準(zhǔn)靶點(diǎn),從而降低胃癌死亡率。
MicroRNAs(miRNA)是一種存在植物、動(dòng)物和某些病毒中的非編碼RNA分子,由較大的轉(zhuǎn)錄物加工成發(fā)夾前體,再由RNase Ⅲ酶家族成員Drosha和Dicer依次發(fā)揮作用,產(chǎn)生成熟、大小為20~22個(gè)核苷酸的miRNA。MiRNA是多種真核生物基因表達(dá)的負(fù)調(diào)節(jié)因子,通過(guò)堿基配對(duì)與mRNA分子內(nèi)的互補(bǔ)序列相互作用,在RNA沉默和基因的轉(zhuǎn)錄后調(diào)控中發(fā)揮作用[3]。此外,miRNA在生物樣品中具有高穩(wěn)定性的特點(diǎn),因此有望成為未來(lái)生物學(xué)標(biāo)志物研究領(lǐng)域的熱點(diǎn)[4-5]。研究表明,幾乎所有類(lèi)型的惡性腫瘤中均可發(fā)生miRNA失調(diào)[6-7],可影響多種基因的表達(dá)。
近年來(lái),越來(lái)越多的研究涉及miRNA在胃癌中的調(diào)控作用,但尚缺乏從miRNA-mRNA調(diào)控網(wǎng)絡(luò)全局的角度分析miRNA功能的報(bào)道。對(duì)胃癌相關(guān)miRNA-mRNA網(wǎng)絡(luò)系統(tǒng)進(jìn)行整合分析,有助于全面解析miRNA在胃癌發(fā)生、發(fā)展中的生物學(xué)功能。本研究擬利用miRNA和mRNA表達(dá)譜芯片公共數(shù)據(jù)庫(kù),篩選在胃癌中存在差異表達(dá)的miRNA和mRNA;進(jìn)一步通過(guò)預(yù)測(cè)和交叉比對(duì)分析miRNA-mRNA內(nèi)在聯(lián)系,構(gòu)建胃癌核心miRNA的分子調(diào)控網(wǎng)絡(luò),并通過(guò)富集分析闡明miRNA調(diào)控途徑和預(yù)測(cè)其作用機(jī)制,進(jìn)而為解析胃癌發(fā)病機(jī)制提供有價(jià)值的理論依據(jù)。
一、微陣列數(shù)據(jù)
本研究所使用的miRNA芯片(GSE23739)和mRNA表達(dá)譜芯片(GSE13911)均來(lái)自于美國(guó)國(guó)立生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI)的基因表達(dá)數(shù)據(jù)庫(kù)(Gene Expression Omnibus, GEO)(https://www.ncbi.nlm.nih.gov/geo/)。其中,miRNA芯片包括40對(duì)胃癌組織及其配對(duì)的癌旁正常組織,mRNA表達(dá)譜芯片包括38例胃癌組織和31例癌旁正常組織。
二、數(shù)據(jù)處理
使用R語(yǔ)言進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)學(xué)分析。利用GEOquery包中g(shù)etGEO函數(shù)下載miRNA芯片(GSE23739)和mRNA表達(dá)譜芯片(GSE13911)的原始數(shù)據(jù),然后以exprs函數(shù)提取表達(dá)數(shù)據(jù)。使用normalizeBetweenArrays函數(shù)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。利用limma程序包中model.matrix函數(shù)定義分組,lmFit、contrasts.fit、eBayes等函數(shù)分析胃癌組織和正常胃黏膜組織中差異表達(dá)的miRNA和mRNA。以|logFC|>1且P<0.05作為閾值,篩選差異表達(dá)的miRNA和mRNA。ggplot2程序包中的ggplot和geompoint函數(shù)用于繪制表達(dá)火山圖。
三、miRNA調(diào)控網(wǎng)絡(luò)的構(gòu)建
應(yīng)用miRWalk 2.0數(shù)據(jù)庫(kù)(http://zmf.umm.uni-heidelberg.de/apps/zmf/mirwalk2/)預(yù)測(cè)差異miRNA的靶基因。考慮到miRNA對(duì)于基因的負(fù)向調(diào)控性,本研究將高表達(dá)miRNA預(yù)測(cè)到的靶基因與胃癌差異表達(dá)中的低表達(dá)基因進(jìn)行交叉匹配;反之,將低表達(dá)miRNA預(yù)測(cè)到的靶基因與高表達(dá)基因進(jìn)行交叉匹配。結(jié)果采用Cytoscape 3.6.0軟件進(jìn)行呈現(xiàn)。
四、功能注釋分析和富集分析
對(duì)胃癌中差異表達(dá)miRNA調(diào)控的靶基因行GO(Gene Ontology)分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析。使用R語(yǔ)言ClusterProfiler程序包中的enrichGO和enrichKEGG函數(shù),對(duì)差異表達(dá)基因進(jìn)行GO分析和KEGG富集分析,設(shè)定參數(shù)“pAdjustMethod=“BH”,pvalueCutoff=0.05,qvalueCutoff=0.2”。Z值的P<0.05為差異有統(tǒng)計(jì)學(xué)意義。利用ggplot2程序包對(duì)差異顯著的前12個(gè)結(jié)果進(jìn)行可視化。
一、差異表達(dá)miRNA和mRNA的篩選
MiRNA芯片(GSE23739)中篩選出56個(gè)胃癌差異表達(dá)miRNA(上調(diào)20個(gè),下調(diào)36個(gè)),mRNA表達(dá)譜芯片(GSE13911)中篩選出3 289個(gè)胃癌差異表達(dá)基因(上調(diào)994個(gè),下調(diào)2 295個(gè))(表1、圖1)。
表1 胃癌差異表達(dá)miRNA
圖1 胃癌差異表達(dá)miRNA和mRNA芯片篩選
二、核心miRNA調(diào)控網(wǎng)絡(luò)的構(gòu)建
通過(guò)miRWalk 2.0數(shù)據(jù)集篩選和交叉匹配,發(fā)現(xiàn)1 753個(gè)受胃癌差異表達(dá)miRNA調(diào)控的基因,包括1 042個(gè)低表達(dá)基因和711個(gè)高表達(dá)基因。將與差異基因相互作用數(shù)量位列前五位的miRNA定義為核心miRNA,高表達(dá)基因的核心miRNA分別為hsa-miR-17-5p(175個(gè))、hsa-miR-20a-5p(100個(gè))、hsa-miR-20b-5p(174個(gè))、hsa-miR-7-5p(97個(gè))、hsa-miR-96-3p(96個(gè))(圖2);低表達(dá)基因的核心miRNA分別為hsa-miR-650(82個(gè))、hsa-miR-513b-3p(81個(gè))、hsa-miR-603(74個(gè))、hsa-miR-494-3p(67個(gè))、hsa-miR-513c-3p(66個(gè))(圖3)。
三、miRNA調(diào)控基因的KEGG富集分析
對(duì)胃癌差異表達(dá)miRNA調(diào)控的差異基因進(jìn)行KEGG通路富集分析。1 753個(gè)差異基因被富集到多個(gè)腫瘤相關(guān)的通路,其中高表達(dá)基因主要富集于下列9個(gè)通路:ECM受體作用通路(ECM-receptor interaction)、細(xì)胞周期(cell cycle)、PI3K-Akt信號(hào)通路(PI3K-Akt signaling pathway)、p53信號(hào)通路(p53 signaling pathway)、糖尿病并發(fā)癥AGE-RAGE信號(hào)通路(AGE-RAGE signaling pathway in diabetic complications)、黏著斑(focal adhesion)、小細(xì)胞肺癌(small cell lung cancer)、人乳頭瘤病毒感染(human papilloma virus infection)和蛋白質(zhì)消化吸收(protein digestion and absorption)。而低表達(dá)基因主要富集在神經(jīng)活性配體-受體相互作用(neuroactive ligand-receptor interaction)、膽汁分泌(bile secretion)、鈣信號(hào)通路(calcium signaling pathway)、視黃醇代謝(retinol metabolism)、胃酸分泌(gastric acid secretion)等通路(表2)。
圖2 胃癌高表達(dá)基因的核心miRNA調(diào)控網(wǎng)絡(luò)
圖3 胃癌低表達(dá)基因的核心miRNA調(diào)控網(wǎng)絡(luò)
表2 胃癌差異miRNA調(diào)控基因的KEGG通路富集分析
上述通路中,與腫瘤細(xì)胞增殖相關(guān)的通路包括細(xì)胞周期和PI3K-Akt信號(hào)通路;參與腫瘤轉(zhuǎn)移和侵襲的通路包括ECM-受體相互作用、黏著斑和鈣信號(hào)通路;影響腫瘤細(xì)胞凋亡的通路為PI3K-Akt信號(hào)通路;p53信號(hào)通路涉及多種腫瘤細(xì)胞生物學(xué)行為。
四、miRNA調(diào)控基因的GO分析
對(duì)胃癌差異表達(dá)miRNA調(diào)控的差異基因進(jìn)行GO分析,上調(diào)基因涉及315個(gè)功能、下調(diào)基因涉及88個(gè)功能,按P值由小到大排序,依次為細(xì)胞外基質(zhì)組織(extracellular matrix organization)、細(xì)胞外結(jié)構(gòu)組織(extracellular structure organization)、染色體分離(chromosome segregation)、姐妹染色單體分離(sister chromatid segregation)、膠原分解代謝過(guò)程(collagen catabolic process)、核染色體分離(nuclear chromosome segregation)、核分裂(nuclear division)、細(xì)胞器裂變(organelle fission)、紡錘體(spindle)、染色體著絲粒區(qū)域(chromosome centromeric region),以及調(diào)節(jié)激素水平(regulation of hormone levels)、胰島素分泌(insulin secretion)、金屬離子跨膜轉(zhuǎn)運(yùn)蛋白活性(metal ion transmembrane transporter activity)、肽激素分泌(peptide hormone secretion)、調(diào)節(jié)肽激素分泌(regulation of peptide hormone secretion)、調(diào)節(jié)胰島素分泌(regulation of insulin secretion)、激素運(yùn)輸(hormone transport)、調(diào)節(jié)膜電位(regulation of mem-brane potential)、激素分泌(hormone secretion)、調(diào)節(jié)激素分泌(regulation of hormone secretion)(圖4)。
成熟的miRNA分子主要在細(xì)胞質(zhì)中與mRNA的3’-UTR結(jié)合,少數(shù)可與啟動(dòng)子區(qū)、編碼區(qū)或5’-UTR結(jié)合,通過(guò)募集AGO蛋白組裝成沉默復(fù)合體(RISC)后,經(jīng)由兩種途徑負(fù)向調(diào)控靶基因。其一,miRNA可與靶基因3’-UTR不完全互補(bǔ)結(jié)合,抑制靶基因mRNA翻譯,但不影響其穩(wěn)定性;其二,miRNA可與靶基因3’-UTR完全互補(bǔ)結(jié)合,引起靶基因mRNA的切割降解。本研究從miRNA作用機(jī)制入手,篩選以胃癌異常表達(dá)的miRNA為中心的mRNA調(diào)控網(wǎng)絡(luò),進(jìn)一步通過(guò)功能和通路富集分析探討miRNA在胃癌中的分子調(diào)控功能和信號(hào)通路,從而為解析miRNA在胃癌發(fā)生、發(fā)展中的分子機(jī)制提供有價(jià)值的理論基礎(chǔ)。
通過(guò)生物信息學(xué)篩選,本研究確定了10個(gè)核心miRNA,包括5個(gè)上調(diào)miRNA(hsa-miR-17-5p、hsa-miR-20a-5p、hsa-miR-20b-5p、hsa-miR-7-5p、hsa-miR-96-3p)和5個(gè)下調(diào)miRNA(hsa-miR-650、hsa-miR-513b-3p、hsa-miR-603、hsa-miR-494-3p、hsa-miR-513c-3p),其中hsa-miR-17-5p調(diào)控的靶基因最多。目前研究發(fā)現(xiàn),hsa-miR-17-5p、hsa-miR-20a-5p和hsa-miR-650與胃癌的發(fā)病風(fēng)險(xiǎn)相關(guān)[8-10],hsa-miR-17-5p和hsa-miR-20a-5p與胃癌的療效和預(yù)后相關(guān),而hsa-miR-20b-5p、hsa-miR-96-3p、hsa-miR-513b-3p,hsa-miR-603和hsa-miR-494-3p的作用尚不清楚,有待進(jìn)一步研究。
研究報(bào)道,hsa-miR-17-5p通過(guò)調(diào)節(jié)細(xì)胞周期相關(guān)基因(包括GAB1、MAPK9、MYCN、PKD1、PKD2、RBL1、TSG101、NCOA3等)影響腫瘤細(xì)胞的增殖過(guò)程[11]。胃癌患者血液和胃癌組織中hsa-miR-20a-5p表達(dá)顯著上調(diào)[9],血清hsa-miR-17-5p可作為胃癌的預(yù)警標(biāo)志物[8]。本研究結(jié)果提示,hsa-miR-17-5p為影響胃癌細(xì)胞增殖的關(guān)鍵miRNA,可調(diào)控靶基因MYCN表達(dá)。此外,hsa-miR-17-5p和hsa-miR-20a分別通過(guò)靶向p21和NFKBIB基因誘導(dǎo)胃癌細(xì)胞對(duì)DDP的耐藥性[12-13],hsa-miR-17-5p高表達(dá)的胃癌患者更易發(fā)生淋巴結(jié)轉(zhuǎn)移[14],總體存活率較差[8]。上述研究結(jié)果提示hsa-miR-17-5p和hsa-miR-20a-5p可作為胃癌預(yù)后和療效的靶點(diǎn)。
圖4 miRNA調(diào)控基因GO功能注釋
目前認(rèn)為hsa-miR-650的生物學(xué)效應(yīng)在多種腫瘤中的表現(xiàn)并不一致。非轉(zhuǎn)移性結(jié)直腸癌中,hsa-miR-650通過(guò)靶向AKT2抑制AKT途徑的激活,進(jìn)而抑制腫瘤增殖和侵襲[15]。hsa-miR-650在前列腺癌中高表達(dá),通過(guò)抑制CSR1促進(jìn)前列腺癌細(xì)胞增殖[16]。另有研究[10,17]發(fā)現(xiàn),hsa-miR-650通過(guò)靶向ING4促進(jìn)胃癌和肝癌細(xì)胞增殖。Lario等[18]的報(bào)道顯示,幽門(mén)螺桿菌(Hp)陽(yáng)性患者胃黏膜組織中hsa-miR-650高表達(dá),提示hsa-miR-650可能參與Hp感染導(dǎo)致的胃黏膜癌變過(guò)程。
研究發(fā)現(xiàn),hsa-miR-7-5p可能作為腫瘤抑制因子在乳腺癌[19]、膠質(zhì)瘤[20]、頭頸部腫瘤[21]、肝癌[22]、結(jié)腸癌[23]等多種腫瘤中發(fā)揮作用,可通過(guò)靶向IRS2基因激活A(yù)kt信號(hào)通路[24],或通過(guò)抑制RelA/NF-κB通路減少腫瘤細(xì)胞增殖和轉(zhuǎn)移[25]。但hsa-miR-7-5p在胃癌中的生物學(xué)功能尚不清楚。本研究結(jié)果顯示hsa-miR-7-5p是一個(gè)原癌基因,提示其在胃癌中的調(diào)控作用異于其他腫瘤,這可能是因?yàn)閙iRNA作為非編碼RNA,主要是通過(guò)調(diào)控不同的靶基因來(lái)影響腫瘤的發(fā)生、發(fā)展。
對(duì)于miRNA調(diào)控下游基因來(lái)影響胃癌發(fā)生的關(guān)鍵機(jī)制,目前尚不十分清楚,miRNA-mRNA調(diào)控網(wǎng)絡(luò)可為解析miRNA在胃癌中的作用提供可參考的研究方向。
KEGG通路富集分析結(jié)果表明,胃癌差異表達(dá)miRNA富集的信號(hào)通路涉及胃癌發(fā)生、發(fā)展的全過(guò)程。細(xì)胞周期是腫瘤發(fā)生的核心過(guò)程,包括細(xì)胞增殖和細(xì)胞分裂。細(xì)胞周期和PI3K-Akt信號(hào)通路與細(xì)胞增殖密切相關(guān),PI3K/AKT/mTOR通路可影響細(xì)胞周期,抑制多種原因引起的細(xì)胞凋亡,促進(jìn)血管形成,參與胃癌侵襲和轉(zhuǎn)移[26]。ECM-受體相互作用、黏著斑和鈣信號(hào)通路是影響腫瘤細(xì)胞轉(zhuǎn)移和侵襲的重要通路;腫瘤細(xì)胞與ECM組分,如層黏連蛋白、纖維連接蛋白和膠原蛋白的相互作用在腫瘤侵襲和轉(zhuǎn)移中起關(guān)鍵作用,且黏附受體能促進(jìn)這種相互作用[27]。P53信號(hào)通路與多種腫瘤細(xì)胞生物學(xué)行為相關(guān),不僅可與PI3K-Akt信號(hào)通路相互作用影響胃癌細(xì)胞增殖,還可調(diào)控黏附力通路促進(jìn)胃癌細(xì)胞轉(zhuǎn)移[28]。胃酸分泌與胃癌發(fā)生密切相關(guān),有文獻(xiàn)報(bào)道小鼠體內(nèi)低胃酸分泌會(huì)導(dǎo)致慢性炎癥、胃壁萎縮、壁細(xì)胞功能喪失以及促進(jìn)腫瘤生長(zhǎng)等一系列過(guò)程[29],而Hp感染相關(guān)的低胃酸分泌在Hp致胃癌中亦起有關(guān)鍵作用[30]。由此可見(jiàn),胃癌差異表達(dá)miRNA能通過(guò)調(diào)控多個(gè)信號(hào)通路的靶基因來(lái)影響胃癌的發(fā)生及其生物學(xué)行為。
GO功能注釋分析結(jié)果提示,miRNA調(diào)控的基因主要與染色體調(diào)控功能、激素分泌功能等相關(guān)。流行病學(xué)調(diào)查顯示男性胃癌的發(fā)病率為女性的兩倍[31]。一項(xiàng)關(guān)于性激素與胃癌發(fā)病風(fēng)險(xiǎn)的meta分析顯示雌激素可明顯降低胃癌的發(fā)病風(fēng)險(xiǎn)[32]。提示miRNA能通過(guò)影響細(xì)胞周期和細(xì)胞分裂來(lái)調(diào)節(jié)人體激素水平,進(jìn)而影響胃癌的發(fā)生。
綜上所述,本研究利用生物信息學(xué)分析方法對(duì)胃癌中差異表達(dá)的miRNA進(jìn)行系統(tǒng)篩選和歸納總結(jié),構(gòu)建了miRNA-mRNA共表達(dá)網(wǎng)絡(luò),并進(jìn)一步對(duì)下游調(diào)控mRNA進(jìn)行了功能分析和通路分析,全面解析了胃癌中miRNA的調(diào)控作用及其可能機(jī)制。本研究結(jié)果為闡明miRNA在胃癌發(fā)生、發(fā)展中的分子機(jī)制提供了有價(jià)值的參考,為胃癌診斷標(biāo)志物的篩選和藥物治療精準(zhǔn)靶點(diǎn)的選擇提供了理論基礎(chǔ)。