李樹(shù)強(qiáng)
(中國(guó)醫(yī)科大學(xué)附屬盛京醫(yī)院普通外科,沈陽(yáng) 110004)
原發(fā)性肝癌是目前我國(guó)第四位常見(jiàn)的惡性腫瘤,在腫瘤致死疾病中排第三位,嚴(yán)重威脅人們的生命和健康。肝細(xì)胞癌 (hepatocellular carcinoma,HCC) 占原發(fā)性肝癌的80%以上,手術(shù)切除和肝移植是根治原發(fā)性HCC的主要手段,但是由于早期發(fā)現(xiàn)困難,放化療效果不佳,5年生存率僅為15%[1]。因此,更好地了解HCC發(fā)生的分子機(jī)制,發(fā)現(xiàn)影響HCC 5年生存期的關(guān)鍵基因,為HCC治療提供新的靶點(diǎn)已成當(dāng)務(wù)之急。
登陸TCGA數(shù)據(jù)庫(kù) (https://cancergenome.nih.gov)網(wǎng)站下載公開(kāi)的HCC轉(zhuǎn)錄組數(shù)據(jù)和腫瘤樣本臨床數(shù)據(jù)。其中,生存期>5年 (無(wú)論存活與否) 的癌癥樣本43例,生存期<5年 (已死亡) 的癌癥樣本107例。本研究旨在探討影響HCC 5年生存率的關(guān)鍵基因,故排除隨訪時(shí)間不到5年且存活的樣本。
使用轉(zhuǎn)錄組數(shù)據(jù)中的reads count評(píng)估基因表達(dá)水平,應(yīng)用R軟件 (3.5.1版本) 中的limma及edgeR軟件包[2]對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化及差異表達(dá)分析,gplots軟件包對(duì)數(shù)據(jù)進(jìn)行圖形可視化。篩選log FC絕對(duì)值 >2,F(xiàn)DR <0.01的基因?yàn)椴町惐磉_(dá)基因。
DAVID (The Database for Annotation,Visualization and Integrated Discovery) 是一個(gè)在線數(shù)據(jù)庫(kù)[3](https://david.ncifcrf.gov),為研究人員提供了一套全面的功能注釋工具,以便理解大量基因背后的生物學(xué)意義。應(yīng)用DAVID分別對(duì)上調(diào)和下調(diào)差異表達(dá)基因進(jìn)行GO (gene ontology) 和 KEGG (Kyoto encyclopedia of genes and genomes) 富集分析,P< 0.05為差異有統(tǒng)計(jì)學(xué)意義。
將差異基因上傳到STRING數(shù)據(jù)庫(kù)[4](https://string-db.org),選擇置信度> 0.4構(gòu)建蛋白-蛋白互作(PPI)網(wǎng)絡(luò)。基因在PPI網(wǎng)絡(luò)的連接度 (degree) ≥8且排名前10位的基因定義為候選關(guān)鍵基因。
應(yīng)用在線網(wǎng)站 http://kmplot.com/analysis[5],繪制Kaplan-Meier生存曲線,計(jì)算95%置信區(qū)間的危險(xiǎn)比和logrankP值,比較不同基因表達(dá)水平患者的生存期,篩選并驗(yàn)證候選關(guān)鍵基因是否為真正關(guān)鍵基因。
下載數(shù)據(jù)后進(jìn)行歸一化、對(duì)數(shù)化,去掉沒(méi)有對(duì)應(yīng)基因注釋信息的探針,如果同一個(gè)基因有多個(gè)探針表達(dá)值,取平均數(shù),去掉重復(fù)探針,最終得到包含19 754個(gè)基因,150個(gè)樣本的表達(dá)譜。通過(guò)R中edgeR包,log FC絕對(duì)值 >2,F(xiàn)DR<0.01為表達(dá)差異基因篩選條件,共得到383個(gè)差異基因。其中表達(dá)上調(diào)基因253個(gè),表達(dá)下調(diào)基因130個(gè),見(jiàn)圖1、2。
圖1 差異表達(dá)基因火山圖Fig.1 Volcano plots of differentially expressed genes
圖2 差異表達(dá)基因主成分分析Fig.2 Principal component analysis of differentially expressed genes
用DAVID分別對(duì)上調(diào)和下調(diào)差異表達(dá)基因進(jìn)行GO和 KEGG富集分析。得到了Biological process (BP)和KEGG pathway結(jié)果 (表1、2)。上調(diào)基因BP功能聚類(lèi)主要集中在“positive regulation of cAMP biosynthetic process”,“synaptic transmission,cholinergic”,“cation transmembrane transport”,“regulation of membrane potential”等。有3種典型的KEGG通路在上調(diào)基因中過(guò)表達(dá),包括“Neuroactive ligand-receptor interaction”,“Nicotine addiction” 和“GABAergic synapse”。下調(diào)基因BP功能主要富集在“potassium ion transport”,“energy reserve metabolic process”和“oxygen transport”等,下調(diào)基因在KEGG通路中主要富集在“Salivary secretion”,“cAMP signaling pathway”和“Cardiac muscle contraction”等。由此可見(jiàn),差異表達(dá)基因功能主要富集在與某些神經(jīng)內(nèi)分泌調(diào)節(jié)有關(guān)的生物學(xué)過(guò)程和通路中,通過(guò)膜電位改變,跨膜離子的轉(zhuǎn)運(yùn)和突觸傳遞等影響患者5年生存率。
表1 上調(diào)差異表達(dá)基因的BP及KEGG通路富集分析Tab.1 Enrichment analysis of BP and KEGG pathways of up-regulated differentially expressed genes
表2 下調(diào)差異表達(dá)基因的BP及KEGG通路富集分析Tab.2 Enrichment analysis of BP and KEGG pathways of down-regulated differentially expressed genes
差異表達(dá)基因在PPI網(wǎng)絡(luò)的連接度≥8且排名前10位的基因定義為候選關(guān)鍵基因,包括GCG、LEP、PTH、HTR5A、CRH、CRHR1、CALCA、ADCY2、GAST和CHGA(圖3)。除LEP為表達(dá)下調(diào)基因外,其余均為表達(dá)上調(diào)基因。
圖3 蛋白-蛋白互作網(wǎng)絡(luò) (PPI) 圖Fig.3 Protein-protein interaction network
圖4 肝細(xì)胞癌關(guān)鍵基因預(yù)后分析Fig.4 Prognostic analysis of key genes in hepatocellular carcinoma
繪制Kaplan-Meier生存曲線,結(jié)果 (圖4)顯示,除了LEP和CHGA,HCC患者中GCG、PTH、HTR5A、CRH、CRHR1、CALCA、ADCY2和GAST基因的高表達(dá),其總生存率明顯升高,故認(rèn)為這些差異表達(dá)基因可能為HCC患者長(zhǎng)期生存的關(guān)鍵基因。
HCC是全球第五大常見(jiàn)癌癥,每年約有85萬(wàn)新發(fā)病例[6],占肝癌的80%以上[7]。HCC通常發(fā)生在肝硬化患者中,越來(lái)越多的HCC病例伴有非酒精性脂肪肝,這是肥胖和胰島素抵抗的結(jié)果[8]。常用的治療方法有器官移植、手術(shù)切除、經(jīng)動(dòng)脈化療栓塞、局部射頻消融和局部微波消融等[9]。由于早期沒(méi)有臨床癥狀,大多數(shù)HCC病例發(fā)現(xiàn)即為晚期,治療療效差。索拉非尼作為不可切除HCC病例的臨床替代藥物,療效一般[10]。因此,從基因水平更好地了解HCC發(fā)生機(jī)制,發(fā)現(xiàn)新的治療靶點(diǎn)已成當(dāng)務(wù)之急。
本研究利用TCGA數(shù)據(jù)庫(kù)中HCC mRNA基因及臨床表型信息,通過(guò)一系列分析,確定了8個(gè)與HCC 5年生存期密切相關(guān)的關(guān)鍵基因,GCG在糖代謝和體內(nèi)平衡中起著重要作用[11],PTH通過(guò)溶解骨骼中的鹽分和防止腎臟排泄來(lái)提高血鈣水平,與前列腺癌侵襲程度相關(guān)[12]。HTR5A是一種生物激素,起神經(jīng)遞質(zhì)、激素和有絲分裂原的作用。這種受體的活性是由G蛋白介導(dǎo)的,可能通過(guò)調(diào)節(jié)細(xì)胞內(nèi)Ca2+水平而發(fā)揮作用。CRH所編碼的前蛋白經(jīng)蛋白水解處理后產(chǎn)生成熟的神經(jīng)肽激素。應(yīng)激反應(yīng)時(shí),這種激素由下丘腦室旁核分泌,與促腎上腺皮質(zhì)激素釋放受體結(jié)合,刺激垂體釋放促腎上腺皮質(zhì)激素。這種蛋白的顯著減少與阿爾茨海默病有關(guān)。CRHR1編碼一種G蛋白耦聯(lián)受體,對(duì)激活信號(hào)轉(zhuǎn)導(dǎo)通路至關(guān)重要,這些通路調(diào)節(jié)包括壓力、繁殖、免疫反應(yīng)和肥胖在內(nèi)的多種生理過(guò)程。最近研究[13]報(bào)道,CRH/CRHR1可通過(guò)IL-6/JAK2/STAT3信號(hào)通路和VEGF誘導(dǎo)的腫瘤血管生成,促進(jìn)結(jié)腸癌細(xì)胞增殖。CALCA表達(dá)水平與多種腫瘤有關(guān),如胃癌、肺癌和睪丸腫瘤等[14-16]。ADCY2是一種膜相關(guān)酶,催化二級(jí)信使環(huán)腺苷單磷酸的形成。GAST能刺激胃黏膜產(chǎn)生和分泌鹽酸,胰腺分泌其消化酶。還能刺激平滑肌收縮,促進(jìn)胃和腸的血液循環(huán)和水分分泌。
綜上所述,本研究應(yīng)用TCGA數(shù)據(jù)庫(kù),發(fā)現(xiàn)了8個(gè)與HCC 5年生存期有關(guān)的關(guān)鍵基因,為今后HCC的研究提供了新的方向。本研究?jī)H是通過(guò)數(shù)據(jù)分析初步得到可能有價(jià)值的關(guān)鍵基因,作用機(jī)制尚不清楚,需要后續(xù)實(shí)驗(yàn)加以驗(yàn)證。