曹詩茹, 李 琰, 周榮秒, 黃 茜, 霍向然, 王 娜
(河北醫(yī)科大學第四醫(yī)院分子生物學研究室, 河北 石家莊 050011)
食管鱗狀細胞癌(Esophageal squamous cell carcinoma,ESCC)是食管癌的一種主要組織學類型,發(fā)病率和病死率均居我國惡性腫瘤前列。早期診斷率低和侵襲性強是食管癌高死亡率的主要原因。所以,需要進一步研究食管鱗癌的生物標志物和分子機制。MicroRNAs是一種單鏈非編碼RNA,約23個核苷酸。miRNAs的失調(diào)可導致惡性腫瘤,而miRNAs發(fā)揮致癌作用或抑癌作用因其靶向的mRNAs類型而異。隨著基因芯片和RNA測序技術的迅速發(fā)展,基因表達綜合數(shù)據(jù)庫在生物信息學分析中發(fā)揮著重要作用,它可以為我們發(fā)現(xiàn)功能性miRNA提供線索。本研究利用GEO數(shù)據(jù)庫中食管鱗癌miRNA表達譜芯片數(shù)據(jù)GSE114110,篩選食管鱗癌及正常食管上皮組織的差異表達miRNA(differentially expressed miRNAs, DE-miRNAs),并預測其靶基因,對靶基因進行聚類分析及功能富集分析,利用Cytoscape軟件構建蛋白相互作用(protein-protein interaction, PPI)網(wǎng)絡,篩選Hub基因并構建miRNA-Hub gene網(wǎng)絡,旨在進一步鑒定食管鱗癌發(fā)生發(fā)展中的關鍵miRNA及其靶基因,為食管鱗癌篩選分子標志物及進一步明確發(fā)病分子機制提供理論指導。
1.1研究工具和對象:通過對美國國立生物技術信息中心(National Center for Biotechnology Information, NCBI)GEO數(shù)據(jù)庫中食管鱗狀細胞癌miRNA表達譜數(shù)據(jù)進行篩選,選取GSE114110 miRNA表達譜芯片數(shù)據(jù)為研究對象,該芯片為Agilent-038169 human miRNA,安捷倫GPL24967平臺。GSE114110數(shù)據(jù)集包括30例食管鱗癌組織及10例正常食管上皮組織。
1.2差異miRNA分析:應用GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)對GSE114110數(shù)據(jù)集進行分析,對兩組實驗條件相同的樣品進行對比,篩選DE-miRNAs。本研究所設定的閾值為P<0.05,|logFC|≥2。
1.3篩選驗證數(shù)據(jù)集并對差異miRNA進行驗證:在GEO數(shù)據(jù)庫中輸入關鍵詞 “Esophageal squamous cell carcinoma”和“ESCC”進行搜索,設定非編碼RNA數(shù)據(jù)并設定物種為人類,確定32個數(shù)據(jù)集。納入標準:每個數(shù)據(jù)集包括ESCC樣本組和對照樣本組(健康食管組織、相鄰非癌組織)。排除標準:①僅有l(wèi)ncRNAs和circRNAs數(shù)據(jù),無miRNAs數(shù)據(jù);②缺乏正常對照組。最后納入GSE97049, GSE59973, GSE55856 和 GSE43732。
1.4預測靶基因:通過miRNet(https://www.mirnet.ca/miRNet/faces/home.xhtml)分別對前三位上調(diào)和下調(diào)的差異miRNAs進行靶基因預測。
1.5靶基因的功能富集:將篩選所得的6個DE-miRNAs預測的靶基因數(shù)據(jù)導入DAVID ( https://david.ncifcrf.gov/)進行功能注釋和通路富集分析,包括GO分析和KEGG通路分析。P<0.05差異有統(tǒng)計學意義。
1.6PPI網(wǎng)絡和miRNA-Hub gene網(wǎng)絡的構建:分別構建PPI網(wǎng)絡和miRNA-Hub gene網(wǎng)絡。首先將靶基因映射到STRING數(shù)據(jù)庫(http://string-db.org),以評估靶基因之間的功能關聯(lián),并選擇可信度評分>0.7的交互作用進行下一步研究。利用Cytoscape軟件分析PPI網(wǎng)絡的連通性,獲得Hub基因,建立miRNA-Hub gene網(wǎng)絡。
1.7Hub基因的表達驗證:starBase(http://starbase.sysu.edu.cn/panCancer.php)是一種包含了來源于TCGA數(shù)據(jù)庫中腫瘤組織表達數(shù)據(jù)的在線分析網(wǎng)站。本研究應用starBase數(shù)據(jù)分析工具對Hub基因進行表達水平的驗證。
1.8統(tǒng)計學處理:使用上述各種數(shù)據(jù)分析軟件,對所得的各種數(shù)據(jù)信息進行統(tǒng)計分析。
2.1食管鱗癌和正常食管上皮組織中DE-miRNAs的篩查及其靶基因的預測:使用GEO2R分析GSE114110數(shù)據(jù)集,結果顯示共篩查出159個差異倍數(shù)達4倍以上的DE-miRNAs,其中上調(diào)的miRNA86個,下調(diào)的miRNA73個,并繪制了這些DE-miRNAs的火山圖(圖1),列出了上調(diào)幅度最大的10個miRNA和下調(diào)幅度最大的10個miRNA(表1、表2)。根據(jù)fold change (FC), 上調(diào)幅度最大的3個miRNA分別是hsa-miR-196a-5p、hsa-miR-196b-5p和hsa-miR-34c-5p;下調(diào)幅度最大的3個miRNA分別是hsa-miR-133a、hsa-miR-1和hsa-miR-4770。將這6個DE-miRNAs在食管鱗狀細胞癌miRNA表達譜芯片數(shù)據(jù)集GSE97049, GSE59973, GSE55856 和 GSE43732中進行驗證,與前期分析一致(表3)。通過miRNet預測出3個上調(diào)miRNA的514個潛在靶基因及3個下調(diào)miRNA的1186個潛在靶基因(圖2)。
2.2靶基因的功能富集:利用DAVID對上述靶基因進行功能富集分析,包括生物學過程(BP)、細胞組成(CC)和分子功能(MF)三類GO功能注釋分析。如圖3a1-a3所示,三種上調(diào)miRNA的靶基因主要參與的生物學過程(BP)為調(diào)控細胞增殖、調(diào)節(jié)細胞周期、轉錄調(diào)控等;主要參與的細胞組成(CC)為膜結構、核質(zhì)等;主要參與的分子功能(MF)為蛋白的結合、轉錄因子的活性、DNA結合等。圖3b1-b3展示了三種下調(diào)miRNA的靶基因主要參與的生物學過程(BP)為蛋白質(zhì)的定位和運輸、肌動蛋白細胞骨架組織、細胞凋亡的調(diào)節(jié)等;主要參與的細胞組成(CC)為各種膜結構等;主要參與的分子功能(MF)為肌動蛋白結合、細胞骨架內(nèi)蛋白結合、轉運蛋白活性等。為了進一步分析這些靶基因的富集途徑,我們進行了KEGG通路富集分析。上調(diào)miRNA的靶基因富集到的KEGG通路包括癌癥通路、黏著斑、p53信號通路等(圖4a)。下調(diào)miRNA的靶基因富集到的KEGG通路包括癌癥通路、黏著斑等(圖4b)。重要的是,上調(diào)miRNA的靶基因和下調(diào)miRNA的靶基因都富集于黏著斑通路,黏著斑調(diào)節(jié)異常在細胞侵襲和遷移中起著重要作用。因此,上調(diào)miRNA的靶基因中與黏著斑通路相關的21個基因(ACTB, PIK3CG, CAV1, VAV3, MAP2K1, MET, ITGA11, ITGB3, FLNA, VCL, AKT1, MAPK1, IGF1R, CCND1, LAMB2, CCND2, ITGAV, BCL2, PDGFRA, PDGFRB, PTENP1)和下調(diào)miRNA的靶基因中與黏著斑通路相關的32個基因(PDGFB, XIAP, ERBB2, ITGB4, CDC42, IGF1R, SOS2, PIK3CA, THBS1, THBS2, PIK3R2, FN1, EGFR, ACTB, ACTN4, MET, ITGA1, ACTN1, IGF1, ITGA3, FLNC, FLNB, FLNA, VASP, MAPK1, CCND1, ITGA6, VEGFA, RAP1B, COL1A1, CRK, PARVA)和上述篩選出的6個miRNA相互作用,從而調(diào)節(jié)食管鱗狀細胞癌的侵襲和轉移。
2.3PPI網(wǎng)絡和miRNA-Hub基因網(wǎng)絡的分析:將篩選獲得的6個DE-miRNAs的靶基因輸入STRING網(wǎng)站,構建PPI網(wǎng)絡。進一步應用Cytoscape軟件分析靶基因之間的連通度,并篩選出前十名,為Hub基因(表4)。上調(diào)DE-miRNAs的hub基因為MAPK1、MYC、AKT1、HSP90AA1、POLR2D、CCND1、SMAD4、HIST1H2BB、HIST1H2BD、CDKN1B。下調(diào)DE-miRNAs的hub基因為MAPK1、EGFR、CDC42、POLR2K、PIK3CA、KRAS、POLR2I、HIST2H2AC、FN1、VEGFA。在這些基因中,MAPK1節(jié)點度最高。結果表明,MAPK1可能是食管鱗狀細胞癌的關鍵靶點。隨后,利用Cytoscape軟件構建miRNA-Hub gene網(wǎng)絡,如圖5所示。從圖5a中我們發(fā)現(xiàn),hsa-miR-196a-5p可能調(diào)控10個hub基因中的7個(MAPK1、MYC、POLR2D、CCND1、HIST1H2BB、HIST1H2BD、CDKN1B)。6個hub基因和5個hub基因可能分別被hsa-miR-196b-5p和hsa-miR-34c-5p調(diào)控。此外,hsa-miR-1可能調(diào)控10個hub基因中的9個(EGFR、CDC42、POLR2K、PIK3CA、KRAS、POLR2I、HIST2H2AC、FN1、VEGFA)。其中4個hub基因和1個hub基因可能被hsa-miR-133a和hsa-miR-4770調(diào)控(圖5b)。這些數(shù)據(jù)支持hsa-miR-196a-5p和hsa-miR-1可能是食管鱗狀細胞癌的兩個潛在調(diào)控因子。
2.4Hub基因的表達水平驗證:應用starBase數(shù)據(jù)庫進一步驗證hsa-miR-196a-5p和hsa-miR-1在ESCC中靶基因的表達情況,如圖6所示。分析結果表明,hsa-miR-196a-5p的7個靶基因中5個(MYC、POLR2D、CCND1、HIST1H2BB、HIST1H2BD)的表達在ESCC組織中較正常組織明顯上調(diào)。而hsa-miR-1的9個靶基因中7個(CDC42、POLR2K、PIK3CA、POLR2I、HIST2H2AC、FN1、VEGFA)的表達在ESCC組織中較正常組織明顯上調(diào), miRNA表達與靶基因表達之間存在著負相關關系,這一點已被廣泛認識,因此,顯著上調(diào)的7個基因可能是下調(diào)hsa-miR-1的靶點。
表2 正常上皮組織和ESCC組織中差異表達miRNA下調(diào)前10位
表3 DE-miRNAs在食管鱗狀細胞癌miRNA表達 譜芯片數(shù)據(jù)集GSE97049 GSE59973 GSE55856 GSE43732中的差異表達
圖1 火山圖(黑點代表30個ESCC樣品和10個NE樣品中無差異表達的miRNA,紅點和綠點分別代表ESCC樣品中上調(diào)和下調(diào)的miRNA)
圖2 前三位上調(diào)和前三位下調(diào)miRNA的靶基因(a前三個上調(diào)miRNA;b前三個下調(diào)miRNA)
圖3 前3位上調(diào)和前3位下調(diào)miRNA靶基因的GO功能
圖4 六個DE-miRNA靶基因的KEGG通路富集分析
表4 PPI網(wǎng)絡中連通度位列前十的Hub基因
圖5 前3位上調(diào)和前3位下調(diào)miRNA及其Hub基因的調(diào)控網(wǎng)絡
圖6 starbase工具驗證分析hsa-miR-196a-5p和hsa-miR-1靶基因的mRNA表達
隨著科技的進步,越來越多的新技術被應用于醫(yī)學領域,尤其是基因芯片和高通量測序技術。通過生物信息學方法分析腫瘤相關大數(shù)據(jù),為腫瘤研究提供了幫助。本研究通過從GEO數(shù)據(jù)庫下載食管鱗狀細胞癌miRNA表達譜芯片數(shù)據(jù)集GSE114110,分析差異表達miRNAs,得到6個與食管鱗癌相關的miRNA,預測其靶基因,并對靶基因進行GO和KEGG富集分析。結果顯示三種上調(diào)miRNA的靶基因主要參與了細胞增殖、細胞周期、轉錄調(diào)控等生物學過程,這些生物學過程的異常會造成細胞的過度增殖、低分化細胞的出現(xiàn)和蛋白的異常表達。三種下調(diào)miRNA的靶基因主要參與了肌動蛋白細胞骨架等細胞組成;蛋白質(zhì)的定位和運輸、細胞凋亡等生物學過程;肌動蛋白結合、細胞骨架內(nèi)蛋白結合、轉運蛋白活性等分子功能。這些都是調(diào)節(jié)細胞增殖、遷移、侵襲的生物學基礎。KEGG通路還發(fā)現(xiàn)上調(diào)miRNA的靶基因和下調(diào)miRNA的靶基因都富集于癌癥通路和黏著斑通路。因此,上調(diào)miRNA的靶基因中與黏著斑通路相關的21個基因與下調(diào)miRNA的靶基因中與黏著斑通路相關的32個基因和篩選出的6個miRNA相互作用,從而調(diào)節(jié)食管鱗狀細胞癌的侵襲和轉移。
篩選連通度最高的前十個靶基因為Hub基因,構建了miRNA-Hub gene網(wǎng)絡。我們發(fā)現(xiàn)hsa-miR-196a-5p和hsa-miR-1可調(diào)控大部分Hub基因。研究表明miR-196a在食管鱗狀細胞癌中表達上調(diào),通過靶向ANXA1調(diào)控食管癌細胞的增殖、侵襲和遷移,miR-196a/ANXA1軸可能是食管癌潛在的治療靶點[1]。Mona等指出miR-196a在ESCC患者唾液樣本中較健康組表達上調(diào),其靶基因多富集在黏著斑通路和p53信號通路,為研究食管癌非侵襲性檢測標志物指明了方向[2]。hsa-miR-1在許多惡性腫瘤中均低表達,是一種抑癌基因。研究顯示hsa-miR-1可以靶向Notch2基因調(diào)節(jié)EMT信號通路,抑制食管癌細胞遷移、侵襲[3]。杜彥艷等證實食管癌中hsa-miR-1的表達與淋巴結轉移、組織學分型和血管浸潤有關,并通過結合靶基因LASP1和TAGLN2抑制癌細胞的增殖、侵襲和轉移[4]。本文通過篩選和表達驗證,確定CDC42、POLR2K、PIK3CA、POLR2I、HIST2H2AC、FN1、VEGFA在ESCC組織中明顯上調(diào),與hsa-miR-1存在負相關關系,可能是其靶點。纖維連接蛋白FN主要在食管鱗癌間質(zhì)中高表達,并與患者預后不良密切相關。腫瘤間質(zhì)FN高表達改變食管鱗癌細胞的形態(tài)和遷移能力,促進腫瘤細胞的轉移[5]。hsa-miR-1可以靶向FN1基因抑制食管癌細胞增殖、侵襲,促進腫瘤細胞凋亡[6]。PI3K-Akt是細胞內(nèi)重要的信號傳導途徑,在細胞生長、增殖、凋亡、血管生成等過程中發(fā)揮重要的生物學功能。PIK3CA是PI3K-Akt信號通路中關鍵的原癌基因,PIK3CA突變可導致激酶活性增強,刺激下游AKT,增加細胞侵襲和轉移能力[7]。有研究證明miR-1高表達抑制了食管癌細胞的生長,使細胞周期阻滯在G1期,促進了細胞凋亡,同時降低了PIK3CA蛋白的表達水平。此外,miR-1過表達增加了食管癌細胞對抗癌藥物吉非替尼的敏感性,其機制可能是PIK3CA信號通路失活[8]。Chou等發(fā)現(xiàn)miR-1能與CDC42 3'UTR結合并抑制其表達,在誘導乳腺癌轉移中發(fā)揮重要作用;MALAT1也可通過競爭性結合miR-1影響CDC42的表達,MALALT1、miR-1和CDC42共同調(diào)節(jié)乳腺癌細胞的遷移、侵襲[9]。血管內(nèi)皮生長因子VEGF-A是血管生成的關鍵調(diào)控因子,通過抑制血管生成信號通路從而影響血管生成是許多實體腫瘤的重要治療方法。hsa-miR-1可通過抑制VEGFA和EDN1的表達,降低胃癌細胞的惡性度和血管內(nèi)皮的生成,從而發(fā)揮抑癌作用[10]。
綜上所述,通過分析miRNA表達譜芯片數(shù)據(jù)GSE114110獲得差異表達miRNA hsa-miR-1及與其表達呈負相關的靶基因CDC42、POLR2K、PIK3CA、POLR2I、HIST2H2AC、FN1、VEGFA,這些基因在某些腫瘤的發(fā)生發(fā)展過程中起著重要作用,可能成為ESCC基因治療的潛在靶點,為進一步研究提供理論指導。