李 強(qiáng),王 喻,黃東紅,余 剛,陳桂芳
(1.中山火炬開發(fā)區(qū)醫(yī)院泌尿外科,廣東 中山 538437; 2.中山大學(xué)附屬第三醫(yī)院泌尿外科,廣州 510630)
前列腺癌已成為全球癌癥死亡的主要原因之一[1-3],隨著人口老齡化及前列腺癌篩查的開展,前列腺癌的發(fā)病率將進(jìn)一步升高。目前對(duì)于前列腺癌的篩查主要依靠前列腺特異性抗原(prostate-specific antigen,PSA),但其特異性不高且無法早期預(yù)測(cè)腫瘤轉(zhuǎn)移[4]。另有研究表明PSA的篩查并不能明顯降低前列腺癌死亡率[5-6],因此急需探索一種新型的前列腺癌早期診斷及轉(zhuǎn)移預(yù)測(cè)標(biāo)志物,以給予早期、精準(zhǔn)的治療。
腫瘤的發(fā)生、發(fā)展常伴隨著成千上萬個(gè)信號(hào)通路的改變,基礎(chǔ)實(shí)驗(yàn)只能對(duì)其中有限的通路進(jìn)行研究,無法整體、全面揭示腫瘤的生物學(xué)行為,而生物信息學(xué)分析結(jié)合了分子生物學(xué)與信息技術(shù)的優(yōu)點(diǎn),對(duì)測(cè)序數(shù)據(jù)進(jìn)行全面、系統(tǒng)的分析,更好地詮釋了腫瘤發(fā)生、發(fā)展的分子機(jī)制。特別是在二代測(cè)序技術(shù)的支持下,生物信息學(xué)分析現(xiàn)已飛速發(fā)展[7]?;谝陨蟽?yōu)點(diǎn),本研究利用生物信息學(xué)分析對(duì)癌癥基因組圖譜數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA)和基因芯片公共數(shù)據(jù)庫(Gene Expression Omnibus,GEO)進(jìn)行分析,期望發(fā)現(xiàn)與前列腺癌轉(zhuǎn)移相關(guān)的基因,為前列腺癌轉(zhuǎn)移的早期診斷及治療提供新的治療靶點(diǎn)。
1.1測(cè)序數(shù)據(jù)及一般資料
1.1.1測(cè)序數(shù)據(jù) 前列腺癌轉(zhuǎn)移相關(guān)基因數(shù)據(jù)主要從GEO(www.ncbi.nlm.nih.gov/)數(shù)據(jù)庫中收錄的相關(guān)芯片數(shù)據(jù)中挖掘。經(jīng)過文獻(xiàn)復(fù)習(xí)后最終選擇GSE6919數(shù)據(jù)集作為前列腺癌轉(zhuǎn)移基因數(shù)據(jù)集進(jìn)行分析,該數(shù)據(jù)集包含GPL8300芯片平臺(tái)采集的65個(gè)原發(fā)性腫瘤樣本和25個(gè)轉(zhuǎn)移樣本。而前列腺癌差異分析數(shù)據(jù)則從TCGA(https://cancergenome.nih.gov/)中獲取,包含52個(gè)正常樣本和498個(gè)腫瘤樣本。
1.1.2一般資料 選擇2015年1月至2018年12月于中山火炬開發(fā)區(qū)醫(yī)院及中山大學(xué)附屬第三醫(yī)院手術(shù)的前列腺增生及前列腺癌患者組織標(biāo)本。前列腺增生癥患者均接受了經(jīng)尿道前列腺切除術(shù),前列腺癌患者均接受了前列腺癌根治術(shù)或姑息性經(jīng)尿道前列腺切除術(shù),手術(shù)標(biāo)本均經(jīng)過病理學(xué)確診。所有患者術(shù)前均未行內(nèi)分泌治療、化療或放療。
1.2方法
1.2.1數(shù)據(jù)預(yù)處理及差異表達(dá) 首先刪除存在數(shù)據(jù)注釋的樣本及基因表達(dá)平均值低于1的基因數(shù)據(jù),處理后的數(shù)據(jù)進(jìn)行基因篩選。從TCGA和GEO數(shù)據(jù)庫中獲取前列腺癌測(cè)序數(shù)據(jù),利用R 3.5.1軟件及DESeq、heatmap2、ggplot2、clusterProfiler等R軟件包進(jìn)行分析。根據(jù)數(shù)據(jù)庫信息將測(cè)序數(shù)據(jù)分為對(duì)照組(正常前列腺組織和前列腺增生組織),局限性前列腺癌組和轉(zhuǎn)移性前列腺癌組,對(duì)數(shù)據(jù)進(jìn)行過濾和標(biāo)準(zhǔn)化后進(jìn)行差異性分析,其中差異基因的篩選條件為P<0.05,且log2FC≥2。
1.2.2基因模塊的構(gòu)建與篩選 將TCGA數(shù)據(jù)集中的差異基因和GSE6919中的差異基因取交集,得到的結(jié)果放回兩個(gè)數(shù)據(jù)集中,分別使用corrplot軟件包進(jìn)行相關(guān)性分析,得出交集基因在兩個(gè)數(shù)據(jù)集中的基因共表達(dá)模塊,再將兩個(gè)數(shù)據(jù)中最大模塊的基因取交集,得出共表達(dá)系數(shù)最高的目的基因。
1.2.3差異表達(dá)基因的功能富集分析 利用R 3.5.1軟件中Cluster Profiler軟件包作基因本體論(Gene Ontology,GO)和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析。本研究主要針對(duì)GO富集分析中的分子功能、生物過程和細(xì)胞組分3個(gè)模塊以及KEGG通路進(jìn)行分析。
1.2.4蛋白互作網(wǎng)絡(luò)及關(guān)鍵基因篩選 使用String(https://string-db.org/)對(duì)目的基因進(jìn)行蛋白互作網(wǎng)絡(luò)分析,然后利用Cytoscape(http://www.cytoscape.org/)計(jì)算出關(guān)鍵基因并將其可視化。計(jì)算方法:使用MCC、MNC、Degree等進(jìn)行計(jì)算,在所有算法中得分位于前3的基因視為關(guān)鍵基因。
1.2.5ACTA2的免疫組織化學(xué)檢測(cè) 本研究收集前列腺增生患者30例,前列腺癌87例(局限性前列腺癌40例,轉(zhuǎn)移性前列腺癌47例)的組織樣本,使用免疫組織化學(xué)染色以明確ACTA2的表達(dá)情況。免疫組織化學(xué)操作參考說明書,首先使用ACTA2單抗(1∶1 000,Abcam lnc.,MA,ab220179)對(duì)切片進(jìn)行4 ℃ 孵育過夜,接著二抗37 ℃孵育30 min后顯色(Dako Diagnostics,Zug,Switzerland)。結(jié)果使用免疫組織化學(xué)染色評(píng)分(immunoreactive score,IRS)進(jìn)行評(píng)估,IRS評(píng)分=染色程度×著色細(xì)胞百分比。染色程度:陰性0分,輕度1分,中度2分,重度3分;著色細(xì)胞百分比:0% 0分,<10% 1分,11%~50% 2分,51%~80% 3分,>80% 4分。IRS≥6分為高表達(dá),<6分為低表達(dá)[8]。
2.1數(shù)據(jù)預(yù)處理及差異表達(dá) TCGA包含52個(gè)正常樣本,498個(gè)腫瘤樣本,去除有注釋樣本,剩余44個(gè)正常樣本,473個(gè)腫瘤樣本;去除表達(dá)值低的基因后對(duì)剩余的31 314個(gè)基因進(jìn)行分析。GSE6919用于分析的樣本數(shù)為65個(gè)原發(fā)性腫瘤樣本,25個(gè)轉(zhuǎn)移樣本,9 198個(gè)基因。對(duì)前列腺癌數(shù)據(jù)集進(jìn)行差異性分析,獲得前列腺癌中在轉(zhuǎn)移和原發(fā)癌中差異表達(dá)的基因。其中GSE6919中轉(zhuǎn)移和非轉(zhuǎn)移差異表達(dá)基因共758個(gè)(上調(diào)370個(gè),下調(diào)388個(gè))。而TCGA數(shù)據(jù)集中差異表達(dá)基因共3 336個(gè)(上調(diào)1 161個(gè),下調(diào)2 175個(gè))。
2.2基因模塊的構(gòu)建與篩選 將兩個(gè)數(shù)據(jù)集所獲得的差異表達(dá)基因進(jìn)行venny分析,結(jié)果顯示前列腺癌轉(zhuǎn)移的兩個(gè)不同的數(shù)據(jù)集中,包含206個(gè)共同差異基因,GSE6919獨(dú)有的基因552個(gè),TCGA獨(dú)有的基因3 130個(gè),見圖1。采用R 3.5.1軟件中corrplot 軟件包對(duì)上述206個(gè)基因進(jìn)行相關(guān)性分析,結(jié)果顯示在TCGA(圖2A)和GSE6919(圖2B)數(shù)據(jù)集中206個(gè)基因均主要構(gòu)成3個(gè)模塊,而TCGA最大模塊與GSE6919最大模塊存在14個(gè)共有基因,見表1。
圖1 TCGA與GSE6919交集基因韋恩圖
基因差異倍數(shù)-TCGAP值-TCGA差異倍數(shù)-GEOP值-GEOMYLK0.240<0.0010.140<0.001ACTA20.390<0.0010.190<0.001MYH110.290<0.0010.080<0.001TPM10.360<0.0010.260<0.001LMOD10.320<0.0010.220<0.001CALD10.400<0.0010.360<0.001FLNA0.360<0.0010.240<0.001RND30.390<0.0010.340<0.001PPP1R12B0.400<0.0010.350<0.001KCNMB10.340<0.0010.340<0.001CHRDL10.260<0.0010.160<0.001CSRP10.360<0.0010.130<0.001SPARCL10.460<0.0010.380<0.001SYNM0.280<0.0010.180<0.001
圖2 交集的差異基因在TCGA數(shù)據(jù)集(2A)和
2.3差異表達(dá)基因的富集分析 對(duì)TCGA和GSE6919數(shù)據(jù)集中的最大模塊基因進(jìn)行富集分析,見圖3,然后對(duì)14個(gè)交集基因進(jìn)行單獨(dú)的富集分析,結(jié)果提示這14個(gè)基因主要富集到血管平滑肌收縮、局部黏著、Apelin信號(hào)通路、催產(chǎn)素信號(hào)通路、環(huán)鳥苷酸蛋白激酶G信號(hào)通路中,見圖4。
3A和3D:分子功能; 3B和3E:生物過程; 3C和3F:細(xì)胞組分; 3G和3H:KEGG通路分析
4A:分子功能;4B:生物過程;4C:細(xì)胞組分;4D:KEGG通路分析
2.4蛋白互作網(wǎng)絡(luò)及關(guān)鍵基因篩選 對(duì)14個(gè)目的基因進(jìn)行蛋白互作網(wǎng)絡(luò)分析,結(jié)果顯示其中10個(gè)基因可能存在相互聯(lián)系:MYLK、ACTA2、MYH11、TPM1、LMOD1、CALD1、FLNA、RND3、PPP1R12B、KCNMB1。然后使用Cytoscape軟件對(duì)其進(jìn)行可視化和關(guān)鍵基因的篩選,結(jié)果提示MYH11、MYLK和ACTA2是這10個(gè)基因的關(guān)鍵基因,見表2,調(diào)控著大多數(shù)的蛋白見圖5。
表2 關(guān)鍵基因的計(jì)算結(jié)果
圖5 蛋白互作網(wǎng)絡(luò)分析
2.5免疫組織化學(xué) 在前列腺癌組織中,ACTA2的表達(dá)較前列腺增生明顯降低,ACTA2的表達(dá)隨前列腺癌的進(jìn)展逐漸下降,見圖6。前列腺增生組、局限性前列腺癌組、轉(zhuǎn)移性前列腺癌組的IRS分別為(7.43±0.49)分、(4.85±0.22)分、(2.66±0.27)分,各組比較差異有統(tǒng)計(jì)學(xué)意義(F=223.790,P<0.001),局限性前列腺癌組、轉(zhuǎn)移性前列腺癌組的IRS評(píng)分低于前列腺增生組,轉(zhuǎn)移性前列腺癌組低于局限性前列腺癌組(P<0.01)。Gleason評(píng)分≥7分的患者ACTA2低表達(dá)率高于Gleason評(píng)分<7分的患者(P<0.05);轉(zhuǎn)移性前列腺癌患者ACTA2低表達(dá)率高于局限性前列腺癌患者(P<0.05);不同年齡、PSA水平和病理分期患者的ACTA2低表達(dá)率比較差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。見表3。
6a:前列腺增生; 6b:局限性前列腺癌; 6c:轉(zhuǎn)移性前列腺癌
表3 前列腺癌患者各臨床指標(biāo)ACTA2表達(dá)水平比較 [例(%)]
PSA:前列腺特異性抗原
美國(guó)國(guó)家癌癥研究所公布的研究結(jié)果顯示,任何腫瘤的發(fā)生、發(fā)展都伴隨著一系列基因的高頻突變,并且相互間存在復(fù)雜的基因調(diào)控網(wǎng)絡(luò)[9]。傳統(tǒng)的分子生物學(xué)實(shí)驗(yàn)只能研究有限的基因功能及通路,而作為集合了分子生物和信息技術(shù)優(yōu)點(diǎn)的生物信息學(xué)分析可研究多基因調(diào)控事件在腫瘤發(fā)生、發(fā)展中的作用。
本研究從公共數(shù)據(jù)庫獲取前列腺癌相關(guān)數(shù)據(jù),經(jīng)過一系列的分析最終發(fā)現(xiàn)14個(gè)與前列腺癌轉(zhuǎn)移相關(guān)的基因,上述基因主要富集到血管平滑肌收縮、局部黏著、Apelin信號(hào)通路、催產(chǎn)素信號(hào)通路、環(huán)鳥苷酸蛋白激酶G信號(hào)通路中,提示上述基因可能通過這些通路促進(jìn)前列腺癌的發(fā)生、發(fā)展。使用String對(duì)這14個(gè)基因進(jìn)行蛋白互作網(wǎng)絡(luò)分析,結(jié)果提示其中10個(gè)基因存在相互作用,并且MYLK、ACTA2、MYH11可能發(fā)揮關(guān)鍵調(diào)控作用。MYH11廣泛存在于哺乳動(dòng)物中,對(duì)機(jī)體的信號(hào)轉(zhuǎn)導(dǎo)、肌肉收縮及細(xì)胞器運(yùn)動(dòng)起調(diào)控作用。Wang等[10]研究發(fā)現(xiàn),MYH11在結(jié)腸癌中低表達(dá),且表達(dá)水平與腫瘤分期相關(guān)。Lu等[11]研究證明MYH11在膀胱癌中表達(dá)降低,且表達(dá)水平與患者腫瘤侵襲程度呈負(fù)相關(guān)。MYLK是一種鈣調(diào)蛋白依賴性蘇氨酸-絲氨酸激酶,廣泛存在于各種真核細(xì)胞及非肌肉性細(xì)胞,屬于免疫球蛋白超家族[12]。MYLK主要通過增強(qiáng)肌球蛋白酶活性促進(jìn)肌球蛋白收縮和應(yīng)力纖維的形成、黏著,最終導(dǎo)致細(xì)胞的遷移和分裂[13-14]。Minamiya等[15]首次報(bào)道了在復(fù)發(fā)轉(zhuǎn)移的非小細(xì)胞肺癌患者中MYLK mRNA的表達(dá)水平高于無復(fù)發(fā)轉(zhuǎn)移患者。Chen等[16]研究結(jié)果顯示MYLK mRNA的表達(dá)上調(diào)可調(diào)控胃癌細(xì)胞增殖、凋亡、侵襲與轉(zhuǎn)移。而Lee等[17]報(bào)道在結(jié)腸癌中MYLK mRNA相對(duì)于正常組織下調(diào),本研究結(jié)果與Lee等[17]的研究結(jié)果一致。目前MYLK的下調(diào)機(jī)制仍不清楚,可能與DNA突變、MYLK假基因有關(guān)[18]。ACTA2主要分布于肌細(xì)胞,是收縮器的主要成分[19]。Jeon等[20]報(bào)道表皮生長(zhǎng)因子和人類表皮生長(zhǎng)因子受體2二聚體可調(diào)控ACTA2的表達(dá)進(jìn)而影響乳腺癌的侵襲和轉(zhuǎn)移。Lee等[21]報(bào)道ACTA2可調(diào)控c-MET和FAK進(jìn)而促進(jìn)肺腺癌的轉(zhuǎn)移??梢?,MYLK、MYH11和ACTA2均與平滑肌細(xì)胞功能相關(guān),可能通過影響細(xì)胞的黏附、侵襲能力,進(jìn)而導(dǎo)致前列腺癌的轉(zhuǎn)移。
為進(jìn)一步驗(yàn)證上述結(jié)果,本研究納入前列腺增生及前列腺癌患者共117例進(jìn)行ACTA2免疫組織化學(xué)分析,免疫組織化學(xué)與上述研究結(jié)果一致。隨著前列腺癌的進(jìn)展,ACTA2的表達(dá)也逐漸下降,當(dāng)患者出現(xiàn)轉(zhuǎn)移時(shí)ACTA2的表達(dá)明顯降低。本研究結(jié)果顯示,Gleason評(píng)分≥7分的患者ACTA2低表達(dá)率高于Gleason評(píng)分<7分的患者(P<0.05),轉(zhuǎn)移性前列腺癌患者ACTA2低表達(dá)率高于局限性前列腺癌患者(P<0.05),表明ACTA2的下調(diào)可導(dǎo)致前列腺癌的進(jìn)展。
綜上所述,MYLK、MYH11和ACTA2可能是導(dǎo)致前列腺癌轉(zhuǎn)移的關(guān)鍵基因,上述基因參與平滑肌細(xì)胞功能的調(diào)節(jié),具有調(diào)控細(xì)胞的黏附、侵襲等功能。另外,本研究還證實(shí)ACTA2的下調(diào)與前列腺癌進(jìn)展相關(guān),提示該基因可能成為新的前列腺癌診斷標(biāo)志物和治療靶點(diǎn)。