雷昌達(dá),張 靜*,朱云清,許紹嫻,李 妍
(1.延安大學(xué)醫(yī)學(xué)院,陜西 延安 716000;2.陜西省人民醫(yī)院,陜西 西安 710068;3.陜西省核工業(yè)二一五醫(yī)院,陜西 咸陽(yáng) 712000)
肝癌是世界范圍內(nèi)常見的惡性腫瘤,也是癌癥相關(guān)死亡的第二大原因,男性患者的發(fā)病率高于女性且預(yù)后較差,男女發(fā)病率比例約為3~8∶1[1-2]。肝癌在中國(guó)更為常見,一直是癌癥死亡的主要原因[3]。慢性乙型肝炎病毒(hepatitis B viral,HBV)和丙型肝炎病毒(hepatitis C viral,HCV)感染是肝癌的主要危險(xiǎn)因素[4]。隨著診斷技術(shù)的快速發(fā)展,肝癌的早期診斷方法也越來越多。目前,肝癌常用的治療方法有手術(shù)切除、放療、化療和靶向治療等,這些方法均與患者的良好預(yù)后、延長(zhǎng)復(fù)發(fā)時(shí)間相關(guān)[5]。然而,由于其高復(fù)發(fā)率、快速進(jìn)展和較短的總生存期(overall survival,OS),肝癌患者的預(yù)后并不令人滿意[6]。在臨床上,甲胎蛋白mRNA已被用作肝癌的潛在預(yù)后生物標(biāo)志物,但是其依賴于腫瘤負(fù)荷,臨床診斷應(yīng)用有一定的局限性,價(jià)值評(píng)估也不完整[7]。生物信息學(xué)分析已廣泛用于篩選有助于疾病進(jìn)展、治療反應(yīng)和預(yù)后的生物分子?;谖㈥嚵屑夹g(shù)的基因表達(dá)分析是一種應(yīng)用廣泛、高通量、功能強(qiáng)大的研究方法,可以在mRNA水平同時(shí)檢測(cè)數(shù)千個(gè)基因的表達(dá)變化。通過基因表達(dá)譜分析和微陣列技術(shù),一些研究發(fā)現(xiàn)在病灶表達(dá)有顯著差異的許多基因在肝癌的發(fā)生和發(fā)展中起著關(guān)鍵作用,可以被評(píng)估為潛在的分子靶點(diǎn)和診斷標(biāo)記物[5]。Li等人[8]通過基因表達(dá)分析證明CYP2C8是一種潛在的肝癌預(yù)后標(biāo)志物。Tang等[9]利用綜合生物信息學(xué)分析鑒定與乙型肝炎病毒相關(guān)性肝癌診斷和預(yù)后相關(guān)的樞紐基因,發(fā)現(xiàn)TOP2A和KIF11是HBV-HCC關(guān)鍵預(yù)后基因。面對(duì)肝癌發(fā)生發(fā)展的復(fù)雜分子機(jī)制及在男性高發(fā)的特點(diǎn),有必要進(jìn)一步發(fā)揮生物信息學(xué)優(yōu)勢(shì),篩選和識(shí)別新的肝癌預(yù)后標(biāo)志物。
本研究利用生物信息學(xué)方法篩選GEO數(shù)據(jù)庫(kù)中男性肝癌患者的差異表達(dá)基因,進(jìn)一步進(jìn)行GO和KEGG功能富集分析,利用Cytoscape軟件對(duì)蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)進(jìn)行關(guān)鍵基因的獲取,鑒定出男性肝癌患者中的關(guān)鍵基因,為肝癌患者的個(gè)性化診斷和治療提供新的思路。
男性肝癌患者和健康對(duì)照組的GSE19665和GSE84402組織基因表達(dá)譜在NCBI-GEO進(jìn)行下載(https://www.ncbi.nlm.nih.gov/geo)。GSE19665的RNA序列數(shù)據(jù)包含9名男性肝細(xì)胞癌患者和9名男性健康對(duì)照者。GSE84402的RNA序列數(shù)據(jù)包含9名男性肝細(xì)胞癌患者和9名男性健康對(duì)照者。納入標(biāo)準(zhǔn):①被診斷為男性肝癌患者;②數(shù)據(jù)類型為Expression profiling by array。
將樣本分為健康組和男性肝癌組,利用GEO2R在線工具對(duì)數(shù)據(jù)集進(jìn)行差異分析。差異表達(dá)基因的篩選標(biāo)準(zhǔn)為:|log2FC|>2且adjP<0.01。用火山圖對(duì)差異表達(dá)基因進(jìn)行可視化,Veen圖對(duì)兩個(gè)數(shù)據(jù)集共有的差異表達(dá)基因進(jìn)行取交集。
DAVID用于注釋、可視化和集成發(fā)現(xiàn)的數(shù)據(jù)庫(kù)(DAVID,http://david.abcc.ncifcrf.gov/)是一種經(jīng)常用于功能注釋和通路分析的公共生物資源[10]。為了充分了解DEGs的生物學(xué)功能,應(yīng)用DAVID數(shù)據(jù)庫(kù)進(jìn)行GO和KEGG途徑富集分析。P<0.05和count>5被認(rèn)為是顯著差異的閾值。
為了進(jìn)一步研究肝癌的潛在分子機(jī)制,利用STRING數(shù)據(jù)庫(kù)構(gòu)建了差異表達(dá)基因的PPI網(wǎng)絡(luò)(http://www.string-db.org/)(high confidence:0.900),然后由Cytoscape軟件(version 3.5.0)進(jìn)行可視化。默認(rèn)參數(shù)設(shè)置為:Degree cutoff ≥2, node score cutoff ≥2, Kcore ≥2 and maximum depth=100。
Cytoscape插件CytoHubba為探索生物網(wǎng)絡(luò)中的重要節(jié)點(diǎn)提供了一個(gè)用戶友好的界面。cytoHubba根據(jù)nodes在網(wǎng)絡(luò)中的屬性進(jìn)行排名,它提供了11種拓?fù)浞治龇椒?。此外,研究人員能夠?qū)ytoHubba和其他插件結(jié)合到一個(gè)新的分析方案中。這種拓?fù)浞治霾呗圆东@的網(wǎng)絡(luò)和子網(wǎng)絡(luò)將為實(shí)驗(yàn)生物學(xué)家?guī)黻P(guān)于基本調(diào)控網(wǎng)絡(luò)和蛋白質(zhì)藥物靶點(diǎn)的新見解[11]。然后通過Cytoscape插件CytoHubba計(jì)算所有節(jié)點(diǎn)的度,度>10的基因被認(rèn)為是關(guān)鍵基因。
GEPIA(http://gepia.cancer-pku.cn/)是一個(gè)開源癌癥大數(shù)據(jù)分析網(wǎng)站,其數(shù)據(jù)來源主要是癌癥基因組圖譜數(shù)據(jù)庫(kù)(TCGA)和基因型正常組織表達(dá)數(shù)據(jù)庫(kù)(GTEx)。網(wǎng)站可對(duì)369例肝癌組織和160例正常組織的差異表達(dá)進(jìn)行分析[12]。本研究使用GEPIA對(duì)關(guān)鍵基因在TCGA中進(jìn)行驗(yàn)證與分析。
Kaplan-Meierplotte(http://kmplot.com/analysis)是一個(gè)腫瘤預(yù)后分析網(wǎng)站,提供生存生物標(biāo)志物的在線驗(yàn)證,并分析某些基因高表達(dá)和低表達(dá)患者的總體生存率。在該研究中,對(duì)關(guān)鍵基因進(jìn)行生存曲線繪制,危險(xiǎn)比(hazardratio,HR)>1和LogrankP<0.05作為判斷標(biāo)準(zhǔn)。
本研究利用GEO2R分別對(duì)GSE19665和GSE84402兩個(gè)數(shù)據(jù)集中的18例男性肝細(xì)胞癌患者和18例健康對(duì)照者的測(cè)序數(shù)據(jù)進(jìn)行差異分析。在GSE19665中篩出701個(gè)差異基因,其中645個(gè)表達(dá)上調(diào),56個(gè)表達(dá)下調(diào);GSE19665中篩出321個(gè)差異基因,其中212個(gè)表達(dá)上調(diào),109個(gè)表達(dá)下調(diào);樣本信息以及差異表達(dá)基因結(jié)果如圖1A。對(duì)兩個(gè)數(shù)據(jù)集的差異基因取交集后,共得到162個(gè)差異基因,結(jié)果如圖1B。
圖1 男性肝癌患者的差異基因的篩選
在DAVID數(shù)據(jù)庫(kù)中對(duì)162個(gè)差異表達(dá)基因進(jìn)行GO和KEGG功能富集分析,結(jié)果如圖2所示。差異表達(dá)基因的GO功能富集主要從三個(gè)方面進(jìn)行(圖2A):在生物學(xué)過程(biological process,BP)分析中,差異表達(dá)基因主要參與有絲分裂核分裂(mitotic nuclear division)、細(xì)胞分裂(cell division)、有絲分裂細(xì)胞周期的G2/M轉(zhuǎn)換(G2/M transition of mitotic cell cycle)、氧化還原法(oxidation-reduction process)和姐妹染色單體內(nèi)聚性(sister chromatid cohesion);細(xì)胞成分(cellular component,CC)分析中,差異表達(dá)基因主要組成中間體(midbody)、胞外區(qū)(extracellular region)、著絲粒區(qū)染色體(chromosome, centromeric region)、細(xì)胞外間隙(extracellular space)和血液微粒(blood microparticle);分子功能(molecular function,MF)分析中,差異表達(dá)基因主要參與了氧化還原酶活性(oxidoreductase activity)、抗原結(jié)合(antigen binding)、鐵離子結(jié)合(iron ion binding)、免疫球蛋白受體結(jié)合(immunoglobulin receptor binding)和血紅素結(jié)合(heme binding)。差異表達(dá)基因的KEGG富集分析顯示(圖2B),這些基因主要參與了細(xì)胞周期(Cell cycle)、卵母細(xì)胞減數(shù)分裂(oocyte meiosis)、p53信號(hào)通路(p53 signaling pathway)、孕酮介導(dǎo)的卵母細(xì)胞成熟(progesterone-mediated oocyte maturation)和視黃醇代謝(retinol metabolism)。
圖2 差異表達(dá)基因的GO和KEGG富集分析結(jié)果
在STRING數(shù)據(jù)庫(kù)進(jìn)行差異表達(dá)基因之間的相互作用分析,應(yīng)用Cytoscape-MCODE插件進(jìn)行核心模塊的獲取,結(jié)果如圖3A所示;CytoHubba插件對(duì)核心模塊進(jìn)行分析獲取關(guān)鍵的候選差異表達(dá)基因,結(jié)果如圖3B所示。
圖3 差異表達(dá)基因的核心模塊和關(guān)鍵基因的鑒別
為了更加明確這些關(guān)鍵基因表達(dá)在男性肝癌患者中的意義,我們應(yīng)用GEPIA對(duì)關(guān)鍵基因的表達(dá)在TCGA數(shù)據(jù)庫(kù)中進(jìn)行驗(yàn)證(圖4)。結(jié)果顯示,與健康對(duì)照組相比,這些關(guān)鍵基因在男性肝癌患者中顯著高表達(dá)(與健康組比較“*”表示P<0.05)
圖4 關(guān)鍵基因在GEPIA數(shù)據(jù)庫(kù)中的表達(dá)情況
為了尋找表達(dá)高低僅影響男性患者預(yù)后,而不影響女性患者預(yù)后的基因,使用Kaplan-Meierplotter數(shù)據(jù)庫(kù)對(duì)10個(gè)核心基因分別進(jìn)行了男性患者和女性患者的整體OS分析。結(jié)果如圖5所示,僅有CCNB2和ASPM表達(dá)高低對(duì)男性患者的整體生存期有影響CCNB2(Logrankp=0.00029,HR=2.79),ASPM(Logrankp=0.00012,HR=2.49)),且對(duì)女性患者的整體生存期沒有影響CCNB2(Logrankp=0.25,HR=1.4)和ASPM(LogrankP=0.1,HR=1.64)。
圖5 CCNB2和ASPM表達(dá)對(duì)男性和女性肝細(xì)胞癌患者
臨床上,肝癌是一種高死亡率的惡性腫瘤,當(dāng)前的醫(yī)療手段仍不能較大程度地降低其死亡率。世界范圍內(nèi)男性肝癌發(fā)病率和死亡率均高于女性,且男性患者預(yù)后較女性患者差,這種差異一方面是由于肝癌的危險(xiǎn)因素,如病毒感染、致癌物作用、癌基因激活、抑癌基因失活、細(xì)胞信號(hào)通路失活或活化等導(dǎo)致,另一方面也可能是由于體內(nèi)性激素水平的差異而引起的發(fā)病率和預(yù)后的不同[13]。根據(jù)相關(guān)研究報(bào)道,在嚙齒動(dòng)物和人類中,生理性肝臟基因的表達(dá)具有顯著的性別差異[14]。然而,關(guān)于人類肝癌中性別依賴性基因表達(dá)的知識(shí)仍然很少。
本研究中,我們通過生物信息學(xué)方法對(duì)GEO數(shù)據(jù)庫(kù)中男性肝癌患者表達(dá)數(shù)據(jù)集進(jìn)行差異表達(dá)基因的篩選,并利用TCGA中肝癌患者的數(shù)據(jù)對(duì)男性關(guān)鍵基因驗(yàn)證。本次研究中共有162個(gè)差異表達(dá)基因被篩選出來,這些差異表達(dá)基因主要參與了細(xì)胞分化、細(xì)胞增殖、細(xì)胞周期、免疫反應(yīng)等多個(gè)重要的、與腫瘤發(fā)生發(fā)展關(guān)系密切的生物學(xué)過程。通過CytoHubba分析從MCODE得到關(guān)鍵網(wǎng)絡(luò)的核心基因,應(yīng)用GEPIA對(duì)關(guān)鍵基因的表達(dá)在TCGA數(shù)據(jù)庫(kù)中進(jìn)行驗(yàn)證,結(jié)果發(fā)現(xiàn),ASPM、BIRC5、BUB1、CCNB2、CDC20、CDCA8、CDK1、DLGAP5、KIF20A、TOP2A等關(guān)鍵基因在肝癌組織中均顯著高表達(dá),主要作為細(xì)胞增殖調(diào)節(jié)因子(ASPM、KIF20A),細(xì)胞周期調(diào)節(jié)因子(CCNB2、CDC20、CDCA8、CDK1),凋亡抑制因子(BIRC5),蛋白編碼基因(BUB1、DLGAP5、TOP2A)的作用調(diào)控肝癌細(xì)胞的生長(zhǎng)及轉(zhuǎn)移,繼而通過影響Rb信號(hào)通路[15]、p53信號(hào)通路[16]、經(jīng)典Wnt信號(hào)通路[17]等參與肝癌發(fā)生發(fā)展的進(jìn)程。為了尋找核心基因中,表達(dá)高低僅影響男性患者預(yù)后,且不影響女性患者預(yù)后的基因,我們使用Kaplan-Meierplotter數(shù)據(jù)庫(kù)對(duì)以上10個(gè)核心基因分別進(jìn)行了男性患者和女性患者的整體生存期分析,發(fā)現(xiàn)CCNB2和ASPM表達(dá)高低對(duì)男性患者的整體生存期有影響。最近的研究報(bào)道,CDK1、CCNB1和CCNB2的mRNA表達(dá)水平在幾種類型的癌癥中顯著升高,并與不良預(yù)后相關(guān)[18]。然而CCNB2在肝癌發(fā)生的性別差異研究尚未見報(bào)道,本次研究結(jié)果顯示,CCNB2是男性肝癌患者中的關(guān)鍵基因且與男性患者不良預(yù)后相關(guān)。因此,CCNB2可能通過調(diào)控細(xì)胞周期相關(guān)蛋白來參與男性肝癌的發(fā)生發(fā)展。在前列腺癌中,ASPM的表達(dá)逐漸上調(diào),并且ASPM表達(dá)的增加與腫瘤進(jìn)展和不良臨床預(yù)后相關(guān),而在肝癌中,shRNA介導(dǎo)的ASPM基因敲除抑制肝癌細(xì)胞增殖,體外遷移、侵襲和上皮-間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT),并在體內(nèi)抑制肝癌的生長(zhǎng)[19]。本研究中,ASPM的表達(dá)在肝癌患者的整體生存期中存在顯著的性別差異。
綜上所述,本研究應(yīng)用生物信息學(xué)方法獲取男性肝癌患者中的差異表達(dá)基因以及這些基因的生物學(xué)功能與信號(hào)通路。在TCGA肝癌數(shù)據(jù)庫(kù)中對(duì)CCNB2和ASPM進(jìn)行了驗(yàn)證,結(jié)果表明,CCNB2和ASPM的表達(dá)與男性和女性肝癌患者的不良預(yù)后有顯著的性別差異,可為男性肝癌患者日后的個(gè)性化診斷和治療提供新的思路。
延安大學(xué)學(xué)報(bào)(醫(yī)學(xué)科學(xué)版)2021年4期