唐懷慧 王忠?guī)? 邵茜茜
摘要:目的? 基于TCGA數(shù)據(jù)庫(kù)挖掘肺腺癌差異表達(dá)的RNAs,通過ceRNA網(wǎng)絡(luò)的綜合分析并預(yù)測(cè)其與患者預(yù)后的相關(guān)性。方法? 利用TCGA數(shù)據(jù)庫(kù)下載肺腺癌的表達(dá)數(shù)據(jù),使用R軟件“edgeR”包初步篩選差異表達(dá)的RNAs,進(jìn)一步構(gòu)建肺腺癌的lncRNA-miRNA -mRNA的ceRNA網(wǎng)絡(luò),對(duì)ceRNA網(wǎng)絡(luò)中的mRNAs進(jìn)行了K-M生存分析。結(jié)果? 篩選的差異表達(dá)的RNAs中有3個(gè)mRNA(ANLN、IGFBP1、TFAP2A)、4個(gè)lncRNA (AC015923.1、FGF12-AS2、LINC00211、MED4-AS1)、2個(gè)miRNA(hsa-mir-31、hsa-mir-490),均與預(yù)后相關(guān)。其中hsa-mir-31預(yù)后價(jià)值最高(P<0.001),LINC00461和has-mir-139為關(guān)鍵節(jié)點(diǎn)的ceRNA調(diào)控網(wǎng)絡(luò)。結(jié)論? 本次篩選出的3個(gè)mRNA、4個(gè)lncRNA和2個(gè)miRNA可作為肺腺癌的新候選預(yù)后因子,且LINC00461和has-mir-139是肺腺癌ceRNA 中兩個(gè)重要的調(diào)控網(wǎng)絡(luò)節(jié)點(diǎn)。
關(guān)鍵詞:TCGA;肺腺癌;ceRNA網(wǎng)絡(luò);預(yù)后
Abstract:Objective? To explore the differentially expressed RNAs of lung adenocarcinoma based on TCGA database, comprehensively analyze and predict the correlation with the prognosis of patients through ceRNA network.Methods? The TCGA database was used to download the expression data of lung adenocarcinoma, Use the R software "edgeR" package to preliminarily screen differentially expressed RNAs to further construct the ceRNA network of lncRNA-miRNA-mRNA of lung adenocarcinoma, K-M survival analysis was performed on the mRNAs in the ceRNA network. Results? The screened differentially expressed RNAs included 3 mRNA(ANLN, IGFBP1, TFAP2A), 4 lncRNA(AC015923.1, FGF12-AS2, LINC00211, MED4-AS1), and 2 miRNA(hsa-mir-31, hsa- mir-490), both related to prognosis. Among them, hsa-mir-31 has the highest prognostic value (P<0.001), and LINC00461 and has-mir-139 are key node ceRNA regulatory networks.Conclusion? The 3 mRNA, 4 lncRNA and 2 miRNA selected this time can be used as new prognostic factors for lung adenocarcinoma, and LINC00461 and has-mir-139 are two important regulatory network nodes in ceRNA of lung adenocarcinoma.
肺腺癌(lung adenocarcinoma)是癌癥死亡的重要原因,目前其發(fā)病率和死亡率仍在不斷加[1]。男性肺癌患者發(fā)病率和死亡率在所有惡性腫瘤中占第1位,女性占第2位[2]。非小細(xì)胞肺癌(NSCLC)是肺癌中最常見的類型,其中以腺癌和鱗癌最常見,并且腺癌已經(jīng)超過了鱗癌[3]。越來(lái)越多的研究證實(shí),lncRNA可以作為miRNA和mRNA的競(jìng)爭(zhēng)平臺(tái),在乳腺癌、胃癌、肝癌、肺癌及結(jié)直腸癌等多種惡性腫瘤的細(xì)胞周期和細(xì)胞死亡調(diào)控中起著重要的調(diào)節(jié)作用,影響腫瘤的侵襲和遷移,從而在腫瘤的發(fā)生、發(fā)展過程中發(fā)揮重要作用[4]。癌癥基因組圖譜(TCGA)是一個(gè)公共資助的項(xiàng)目,該項(xiàng)目可提供公開的癌癥數(shù)據(jù)集,以幫助改進(jìn)診斷方法、治療標(biāo)準(zhǔn),并最終預(yù)防癌癥[5]。本研究利用高通量測(cè)序技術(shù)和生物信息學(xué)分析方法對(duì)肺腺癌的表達(dá)數(shù)據(jù)進(jìn)行分析,為肺腺癌患者篩選新候選預(yù)后因子,以期為肺腺癌預(yù)后判斷提供新的思路。
1資料與方法
1.1資料來(lái)源? 利用TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)獲取594例肺腺癌患者的mRNAs、lncRNAs和miRNAs表達(dá)數(shù)據(jù)(包括癌組織535例,癌旁正常組織59例),并收集患者的臨床信息。基因表達(dá)量用于差異基因分析和構(gòu)建ceRNA網(wǎng)絡(luò),患者的臨床信息用于生存分析。
1.2方法
1.2.1篩選差異基因? 基于TCGA數(shù)據(jù)庫(kù),利用R軟件“TCGA biolinks”包獲取肺腺癌的表達(dá)數(shù)據(jù),perl語(yǔ)言提取Ensembl數(shù)據(jù)庫(kù)鑒定了的lncRNAs和mRNAs。利用R軟件“edgeR”包,除去所有表達(dá)量低的RNA(平均讀數(shù)≤2)。設(shè)置差異倍數(shù)(fold change,F(xiàn)C)≥2,差異的顯著性(fdr:調(diào)整P值)<0.01。將肺腺癌組織的表達(dá)數(shù)據(jù)與正常組織的表達(dá)數(shù)據(jù)進(jìn)行差異分析,并利用R軟件“gplots”包繪制火山圖。
1.2.2 構(gòu)建lncRNA-miRNA-mRNA的ceRNA網(wǎng)絡(luò)? 提取篩選出的差異表達(dá)RNAs,利用miRcode(http://www.mircode.org/)數(shù)據(jù)庫(kù)預(yù)測(cè)差異lncRNAs和差異miRNAs之間的相互作用。miRDB(http://mirdb.org/),mirTarBase(http://www.mirbase.org/),miRanda(http://www.microrna.org/ microrna/home.do)和Target Scan(http://www.targetscan.org)數(shù)據(jù)庫(kù)用于檢索差異miRNAs的靶基因mRNAs。利用R軟件“VennDiagram”包繪制Venny圖,并利用Cytoscape v3.7.1構(gòu)建肺腺癌 lncRNA-miRNA-mRNA的ceRNA網(wǎng)絡(luò)。
1.2.3 生存分析? 基于TCGA數(shù)據(jù)庫(kù)下載的肺腺癌患者的臨床信息,提取有效的生存狀態(tài)及生存時(shí)間,通過構(gòu)建Lasso回歸模型和Cox風(fēng)險(xiǎn)回歸分析,利用R軟件“survival”包進(jìn)行K-M生存分析,設(shè)置P<0.05。篩選出的差異RNAs認(rèn)為與預(yù)后具有相關(guān)性。
2結(jié)果
2.1差異表達(dá)的RNAs? 共篩選出了2551個(gè)差異表達(dá)的mRNA,其中高表達(dá)的2033個(gè),低表達(dá)518個(gè);1359個(gè)差異表達(dá)的lncRNA,高表達(dá)的1185個(gè),低表達(dá)的174個(gè);99個(gè)差異表達(dá)的miRNA,高表達(dá)的78個(gè),低表達(dá)21個(gè)。利用R軟件“gplots”包繪制火山圖,見圖1 。
2.2肺腺癌 lncRNA-miRNA-mRNA ceRNA網(wǎng)絡(luò)? ?通過miRcode數(shù)據(jù)庫(kù)查找與差異表達(dá)的miRNA相關(guān)的差異lncRNA有100個(gè),而與100個(gè)差異lncRNA對(duì)應(yīng)的差異miRNA有43個(gè),篩選出四個(gè)數(shù)據(jù)庫(kù)共有的基因有4045個(gè),見圖2A。并與提取出的差異表達(dá)mRNA取交集,最終獲得與肺腺癌有關(guān)的差異mRNA有294個(gè),見圖2B。對(duì)篩選出的100個(gè)lncRNA、43個(gè)miRNA和294個(gè)mRNA基因,利用Cytoscape v3.7.1繪制lncRNA-miRNA-mRNA的ceRNA網(wǎng)絡(luò),見3A、圖3B,并提取了以LINC00461和has-mir-139為關(guān)鍵節(jié)點(diǎn)的核心子網(wǎng)絡(luò),見圖3C、圖3D。
2.3生存分析? ①單因素Cox風(fēng)險(xiǎn)回歸分析共篩選出對(duì)肺腺癌預(yù)后可能具有影響作用的有144個(gè)mRNA,29個(gè)lncRNA,5個(gè)miRNA。②采用LASSO回歸鑒定預(yù)后相關(guān)的RNAs,Lasso回歸模型擬合共篩選出7個(gè)mRNA,18個(gè)lncRNA和5個(gè)miRNA。③多因素Cox風(fēng)險(xiǎn)回歸分析共發(fā)現(xiàn)3個(gè)mRNA:ANLN、IGFBP1、TFAP2A;7個(gè)lncRNA:AC015923.1、AC017048.3、FGF12-AS2、HOXA11-AS、LINC00211、LINC00319、MED4-AS1;3個(gè)miRNA:hsa-mir-142、hsa-mir-31、hsa-mir-490,可能與預(yù)后相關(guān),其中hsa-mir-31具有強(qiáng)的預(yù)后價(jià)值,見圖4。④Kaplan-Meier生存分析共發(fā)現(xiàn)3個(gè)mRNAs(ANLN,IGFBP1,TFAP2A),4個(gè)lncRNAs(AC015923.1,F(xiàn)GF12-AS2,LINC00211,MED4-AS1)和2個(gè)miRNAs(hsa-mir-31,hsa-mir-490)具有預(yù)后性,見圖5。
3討論
隨著醫(yī)療技術(shù)的不斷發(fā)展與創(chuàng)新,近年來(lái)對(duì)肺腺癌的治療已取得了較大進(jìn)展,肺癌患者的生存率有了一定的改善,但其治療的療效仍不盡如人意,肺腺癌患者的預(yù)后仍然很差,其5年總體生存率仍低于15%[6]。因此,尋找新的肺癌治療策略已成為當(dāng)前研究的熱點(diǎn)。近年來(lái)高通量測(cè)序技術(shù)和生物信息學(xué)分析方法的不斷完善,開辟了研究肺腺癌的新思路和新方法。TCGA是一個(gè)公共數(shù)據(jù)庫(kù),包含有關(guān)癌癥中癌基因表達(dá)的全面數(shù)據(jù)集。本研究從TCGA數(shù)據(jù)庫(kù)中獲取了肺腺癌的表達(dá)數(shù)據(jù),用以構(gòu)建lncRNA- miRNA-mRNA的ceRNA網(wǎng)絡(luò),并分析參與ceRNA網(wǎng)絡(luò)中的RNAs的預(yù)后相關(guān)性。
目前,越來(lái)越多的研究已經(jīng)證明ceRNA涉及多種的腫瘤發(fā)生發(fā)展過程,其在該過程中具有重要生物學(xué)功能。如ceRNA網(wǎng)絡(luò)的構(gòu)建揭示了直腸腺癌中潛在的lncRNA生物標(biāo)志物[7]。FOXO1 3'UTR通過調(diào)節(jié)miRNA活性在抑制乳腺癌細(xì)胞轉(zhuǎn)移中起ceRNA的作用[8]。長(zhǎng)的非編碼RNA Unigene56159通過在肝細(xì)胞癌中充當(dāng)miR-140-5p的ceRNA來(lái)促進(jìn)上皮-間質(zhì)轉(zhuǎn)化[9]。隨著對(duì)ceRNA網(wǎng)絡(luò)的不斷深入開發(fā)和挖掘,本研究前期發(fā)現(xiàn)已不能將miRNA,lncRNA或mRNA視為在腫瘤中的獨(dú)立影響元素。在對(duì)miRNA的表達(dá)進(jìn)行調(diào)控之后,由miRNA調(diào)節(jié)的靶基因mRNA的表達(dá)也隨之改變,最終導(dǎo)致了多種疾?。ò[瘤在內(nèi))的發(fā)生。由于癌癥的發(fā)生和發(fā)展機(jī)制過于錯(cuò)綜復(fù)雜,單基因或單一途徑的作用已非常有限。因此,系統(tǒng)構(gòu)建和分析ceRNA網(wǎng)絡(luò)可以提供更有針對(duì)性的研究領(lǐng)域和揭示癌癥潛在機(jī)制的新視角。
本研究共篩選出2551個(gè)差異表達(dá)的mRNA,1359個(gè)差異表達(dá)的lncRNA和99個(gè)差異表達(dá)的miRNA,通過生物信息學(xué)數(shù)據(jù)庫(kù)篩選出與差異表達(dá)的miRNA相關(guān)的差異lncRNA有100個(gè),而與100個(gè)差異lncRNA對(duì)應(yīng)的差異miRNA有43個(gè),檢索和提取出與43個(gè)差異miRNA相關(guān)的差異mRNAs有294個(gè),構(gòu)建了肺腺癌的ceRNA網(wǎng)絡(luò),發(fā)現(xiàn)了以LINC00461和has-mir-139為關(guān)鍵節(jié)點(diǎn)的ceRNA調(diào)控子網(wǎng)絡(luò)。通過對(duì)ceRNA網(wǎng)絡(luò)中涉及的差異RNAs進(jìn)行單因素Cox風(fēng)險(xiǎn)回歸分析、構(gòu)建LASSO回歸模型以及多因素Cox風(fēng)險(xiǎn)回歸分析,共發(fā)現(xiàn)3個(gè)mRNA,7個(gè)lncRNA和3個(gè)miRNA可能具有預(yù)后相關(guān)性,最終通過K-M生存分析繪制生存曲線發(fā)現(xiàn)3種mRNA ,4種lncRNA,2種miRNA具有預(yù)后相關(guān)性,且hsa-mir-31顯示出最大的預(yù)后價(jià)值。
總之,通過構(gòu)建肺腺癌的lncRNA-miRNA-mRNA的ceRNA網(wǎng)絡(luò),本次篩選出的3個(gè)mRNA、4個(gè)lncRNA和2個(gè)miRNA可作為肺腺癌的新候選預(yù)后因子,且LINC00461和has-mir-139是肺腺癌ceRNA 中兩個(gè)重要的調(diào)控網(wǎng)絡(luò)節(jié)點(diǎn)。
參考文獻(xiàn):
[1]Liu H,Zhou G,F(xiàn)u X,et al.Long noncoding RNA TUG1 is a diagnostic factor in lung adenocarcinoma and suppresses apoptosis via epigenetically silencing of BAX[J].Oncotarget,2017(8):101899-101910.
[2]Torre LA,Bray F,Siegel RL,et al.Global Cancer Statistics,2012[J].CA Cancer J Clin,2015,65(2):87-108.
[3]Yang J,Lin J,Liu T,et al.Analysis of lncRNA expression profiles in non-small cell lung cancers (NSCLC) and their clinical subtypes[J].Lung Cancer,2014,85(2):110-115.
[4]Chen X,Chen Z,Yu S,et al.Long noncoding RNA LINC01234 functions as a competing endogenous RNA to regulate CBFB expression by sponging miR-204-5p in gastric cancer[J].Clin Cancer Res,2018,24(8):2002-2014.
[5]Tomczak K,Czerwińska P,Wiznerowicz M.Review The Cancer Genome Atlas (TCGA): an immeasurable source of knowledge[J].Contemp Oncol(Pozn),2015,19(1A):A68-A77.
[6]Wakeam E,Acuna SA,Leighl NB,et al.Surgery Versus Chemotherapy and Radiotherapy For Early and Locally Advanced Small Cell Lung Cancer:A Propensity-Matched Analysis of Survival[J].Lung Cancer,2017(109):78-88.
[7]Zhang Z,Wang S,Ji D,et al.Construction of a ceRNA network reveals potential lncRNA biomarkers in rectal adenocarcinoma[J].Oncology Reports,2018,39(5):2101-2113.
[8]Yang J,Li T,Gao C,et al.FOXO1 3′UTR functions as a ceRNA in repressing the metastases of breast cancer cells via regulating miRNA activity[J].FEBS Letters,2014,588(17):3218-3224.
[9]Lv J,F(xiàn)an HX,Zhao XP,et al.Long non-coding RNA Unigene56159 promotes epithelial–mesenchymal transition by acting as a ceRNA of miR-140-5p in hepatocellular carcinoma cells[J].Cancer Letters,2016,382(2):166-175.
收稿日期:2019-12-05;修回日期:2019-12-16
編輯/成森