韓媛媛,李笑各,王書煥,劉戈力
腎上腺皮質(zhì)癌(adrenocortical tumor,ACT)是一種罕見的內(nèi)分泌腫瘤,發(fā)病率約5/10萬~20/10萬,ACT往往是致命的惡性腫瘤,5年生存率只有20%~35%[1]。ACT在兒童癌癥中的占比(1.3%)遠(yuǎn)高于在成年人(0.02%~0.20%)[2]。ACT可以分為4個(gè)分級(stage):stage 1和stage 2定義為腎上腺皮質(zhì)瘤,stage 3會浸潤到周圍組織或局部區(qū)域淋巴結(jié),stage 4則會表現(xiàn)出轉(zhuǎn)移性。在過去的10年中,通過DNA微陣列分析基因表達(dá)譜為許多實(shí)體瘤的分類和預(yù)后預(yù)測提供了一種新技術(shù)[3-4]。既往的基因表達(dá)譜研究發(fā)現(xiàn),基因L13RA2、HTR2B、CCNB2、RARRES2和SLC16A9可用于區(qū)分ACT的良惡性[5],且IGF-Ⅱ基因集的高表達(dá)和steroidogenesis基因集的低表達(dá)可作為惡性ACT的預(yù)測指標(biāo)[6]。兒童ACT的MicroRNA表達(dá)譜研究則揭示了miR-99a和miR-100表達(dá)下調(diào)使得胰島素樣生長因子-Ⅰ受體(IFG-1R)、雷帕霉素靶蛋白(MTOR)和mTOR復(fù)合體調(diào)控相關(guān)蛋白(RPTOR)的過表達(dá)[7]。另外,可以根據(jù)有絲分裂活性和細(xì)胞周期調(diào)節(jié)基因的表達(dá)水平幫助確定ACT的亞型[8]。對于ACT生存期相關(guān)基因的研究表明,DLG7和PINK1聯(lián)合表達(dá)水平可預(yù)測無病生存情況,而BUB1B和PINK1聯(lián)合表達(dá)水平則可用來預(yù)測總體存活率[9]。絲裂原活化蛋白激酶相關(guān)基因和生長因子受體信號通路相關(guān)基因在兒童ACT中的表達(dá)下調(diào),表明其可以一定程度上反映治療狀況[10]。雖然這些研究已經(jīng)推動了這一領(lǐng)域的發(fā)展,然而目前有關(guān)ACT的致病機(jī)制仍不明確,尤其對兒童ACT生存期相關(guān)研究更少。因此,本研究選取了兒童ACT相關(guān)的基因芯片數(shù)據(jù),對各個(gè)分級的兒童ACT進(jìn)行研究,以期對兒童ACT獲得更多了解。
1.1 材料 從Gene Expression Omnibus(https://www.ncbi.nlm.nih.gov/geo/)選取了兒童ACT相關(guān)RNA芯片數(shù)據(jù)集GSE75415,該數(shù)據(jù)集基于Affymetrix Human Genome U133A Array(GPL96)芯片平臺進(jìn)行信使RNA(mRNA)表達(dá)譜的測定。共包含31個(gè)樣本:5個(gè)腎上腺皮質(zhì)腺瘤組織樣本、18個(gè)ACT組織樣本、1個(gè)未確定樣本及7個(gè)正常腎上腺皮質(zhì)組織樣本。本研究只保留了18個(gè)ACT組織樣本(實(shí)驗(yàn)組)以及7個(gè)正常腎上腺皮質(zhì)組織樣本(對照組)。18個(gè)ACT樣本處于stage 1的樣本4個(gè)、stage 2的樣本6個(gè)、stage 3的樣本5個(gè)、stage 4的樣本3個(gè)。
1.2 方法
1.2.1 差異表達(dá)基因篩選 使用R語言Affy包中的RMA函數(shù)對各樣本表達(dá)量進(jìn)行去背景噪聲,標(biāo)準(zhǔn)化,得到標(biāo)準(zhǔn)化表達(dá)值矩陣。引入limma包進(jìn)行差異表達(dá)基因的篩選,以實(shí)驗(yàn)組相對于對照組變化倍數(shù)(Fold Change,F(xiàn)C)的對數(shù)值log2|Fold Change|>1以及校正值P<0.05(Benjamini&Hochberg方法)作為選取差異表達(dá)基因的閾值。分別將18個(gè)ACT樣本的各分期的表達(dá)情況與對照組的7個(gè)正常腎上腺組織樣本的表達(dá)情況進(jìn)行輪流比較,篩選各個(gè)分級相對于對照組的差異表達(dá)基因(DEGs),并取得各分級間DEGs的交疊部分作為重合差異基因(OLDEGs)。
1.2.2 功能富集分析 使用R語言的clusterProfile包對各分級的DEGs進(jìn)行KEGG通路分析以及GO功能富集分析。以假陽性率FDR<0.05作為選取富集功能項(xiàng)的閾值。此外,對各分級間的OLDEGs用DAVID(Database for Annotation,Visualization and Integrated Discovery,http://david.abcc.ncifcrf.gov)進(jìn)行GO生物過程(Biological Process)富集分析,使用cytoscape中的enrichment Map插件進(jìn)行OLDEGs的GO富集可視化結(jié)果以觀察各個(gè)生物過程之間的相互聯(lián)系。
1.2.3 中心基因篩選將各癌癥分級中的DEGs的log2(FC)值進(jìn)行可視化,選取癌癥4個(gè)階段中均有同樣差異表現(xiàn)的DEGs作為中心基因,這些中心基因在各個(gè)癌癥階段中皆具有表達(dá)共性,可以作為ACT的特異性基因?;虮磉_(dá)水平高低通過log2(FC)的符號來判斷,當(dāng)log2(FC)為正時(shí),表示在ACT中高表達(dá),log2(FC)為負(fù)時(shí),表示在ACT中低表達(dá)。
1.2.4 生存分析使用R語言的cgdsr包下載cbioportal(http://www.cbioportal.org/)中腎上腺癌的TCGA數(shù)據(jù)集,其中包括79個(gè)ACT樣本的二代測序數(shù)據(jù)。引入Survival包對OLDEGs進(jìn)行生存分析,檢驗(yàn)方法為Log-rankχ2檢驗(yàn),保留表達(dá)量與生存時(shí)間存在顯著相關(guān)性的生存結(jié)果,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 差異表達(dá)基因篩選 相對于對照組的7個(gè)正常樣本,stage1~4樣本組分別存在248、334、315和561個(gè)DEGs,如圖1所示??梢姼鞣旨墭颖窘M與對照組均聚類成獨(dú)立的2組,存在明顯差異表達(dá)。
4個(gè)分級樣本組存在73個(gè)OLDEGs,這73個(gè)OLDEGs在各分級樣本組表達(dá)量熱圖見圖2A;各個(gè)分級之間的差異表達(dá)基因重合情況見圖2B。可見各分級之間有明顯的表達(dá)差異,也有部分基因在各分級中表達(dá)情況一致。
2.2 功能富集分析 各分級間DEG的KEGG通路富集見圖3A,stage 1~4樣本組分別有2、7、6和7條通路富集。各分級間DEG的GO富集結(jié)果見圖3B,可見Stage 1~4樣本組分別在5、9、7和8個(gè)過程富集,其中molecular_function,protein binding和binding這3個(gè)過程在各個(gè)分級中均表現(xiàn)明顯富集。圖3C展示了各個(gè)分級間DEG的KEGG富集結(jié)果重合情況,其中各個(gè)分級均包含cell cycle這一通路。圖3D展示了各個(gè)分級間DEG的GO富集結(jié)果重合情況。
對73個(gè)OLDEGs的GO富集結(jié)果通路進(jìn)行串話分析見圖4,所有的通路大概分為4個(gè)主要的功能模塊:免疫相關(guān)功能、細(xì)胞周期相關(guān)功能、磷酸化相關(guān)功能以及凝血相關(guān)功能。另外,對73個(gè)OLDEGs進(jìn)行KEGG富集分析,得到46個(gè)富集通路,其中多條通路與代謝、感染和信號通路轉(zhuǎn)導(dǎo)有關(guān),見表1。
2.3 中心基因篩選 對各個(gè)分級中的DEGs進(jìn)行分析,篩選得到12個(gè)中心基因,其中HSPA13、GARS、STXBP1、AKIRIN1、TUBB3這5個(gè)基因在各分級中均上調(diào),ADH1B、DCN、RASSF2、PDGFRA、PLAT、C3、FOS這7個(gè)基因在各分級中均下調(diào),見表2。
2.4 生存分析 對TCGA數(shù)據(jù)集中79個(gè)ACT樣本的二代測序數(shù)據(jù)進(jìn)行73個(gè)OLDEGs生存分析發(fā)現(xiàn),9個(gè)基因與ACT的生存相關(guān),它們的生存曲線見圖5。其中基因XPO1、RACGAP1、PDGFD、NR4A2和MXRA5的高表達(dá)會導(dǎo)致ACT患者的生存時(shí)間縮短;而VPS51、TMED3、NDFIP1和CDKN1C高表達(dá)的ACT患者生存時(shí)間延長(P<0.05)。
Fig.3 Functional enrichment analysis圖3 功能富集
數(shù)據(jù)集GSE75415曾經(jīng)被用于兒童ACT的表達(dá)譜分析,以方便對兒童ACT診斷和預(yù)后的了解,但相關(guān)研究中缺乏相關(guān)DEGs的生存期分析[11]。不同于既往研究,本研究旨在通過對正常樣本和4個(gè)分級ACT的表達(dá)譜進(jìn)行分析與比較,探索ACT的發(fā)病機(jī)制,并通過對相關(guān)基因的生存期分析,篩選與ACT治療相關(guān)的靶點(diǎn)。
Fig.4 Crosstalk analysis of GO terms of 73 OLDEGs圖4 73個(gè)OLDEGs顯著富集通路之間的通路串化分析
Fig.5 Kaplan-Meier curve of ACT survival associated genes圖5 ACT生存相關(guān)基因的生存分析
3.1 DEG篩選及功能富集分析 與對照組正常樣本相比,在stage1~4的ACT樣本中,分別有248、334、315和561個(gè)基因發(fā)生了差異表達(dá)。對stage1~4樣本組的DEG進(jìn)行KEGG功能富集分析發(fā)現(xiàn),各個(gè)分級均包含cell cycle、molecular_function、protein binding和binding通路。4個(gè)分級樣本組間存在73個(gè)OLDEGs,12個(gè)中心基因中HSPA13、GARS、STXBP1、AKIRIN1、TUBB3在4個(gè)分級中均上調(diào),基因ADH1B、DCN、RASSF2、PDGFRA、PLAT、C3、FOS在4個(gè)分級中均下調(diào)。對73個(gè)OLDEGs進(jìn)行富集功能分析發(fā)現(xiàn),富集通路大多分布在免疫相關(guān)功能,細(xì)胞周期相關(guān)功能,磷酸化相關(guān)功能模塊以及凝血相關(guān)功能,且多條KEGG富集通路與代謝,感染和信號通路轉(zhuǎn)導(dǎo)有關(guān)。
Tab.1 Significantly enriched KEGG pathways of 73 OLDEGs表1 73個(gè)OLDEGs的KEGG通路富集結(jié)果
續(xù)表
Tab.2 The twelve core genes表2 12個(gè)中心基因
基因GARS、PLAT和C3與腫瘤免疫功能密切相關(guān)。GARS編碼的蛋白是人類自身免疫性疾病、多發(fā)性肌炎或皮肌炎的自身抗體的目標(biāo)。C3基因編碼的補(bǔ)體C3在補(bǔ)體系統(tǒng)的激活中起著決定性作用。PLAT和C3均參與Complement and coagulation cascades途徑。Anurag等[12]研究表明,Complement and coagulation cascades途徑在ACT中下調(diào),這可能與PLAT和C3的表達(dá)下調(diào)有關(guān)。因此,筆者推測GARS、PLAT和C3通過影響免疫相關(guān)功能影響ACT的發(fā)生與發(fā)展。
基因TUBB3、DCN、RASSF2和FOS與腫瘤細(xì)胞周期調(diào)控密不可分。TUBB3在腦腫瘤(85%~100%)、肺癌(35%~80%)、胰腺癌(50%)、腎細(xì)胞癌(15%~80%)和惡性黑色素瘤(77%)中均有高表達(dá)[13]。研究表明,TUBB3的過表達(dá)與侵襲性膀胱癌的遺傳不穩(wěn)定性增加有關(guān),而p53改變和細(xì)胞增殖迅速有關(guān)[14]。DCN低表達(dá)可促進(jìn)腎臟癌細(xì)胞的增殖和轉(zhuǎn)移[15]。RASSF2在賁門癌、乳腺癌、食管鱗狀細(xì)胞癌、上皮性卵巢癌,尤因肉瘤和宮頸癌中是一種新的抑癌基因[16-21]。研究表明,c-fos的表達(dá)缺失與卵巢癌的腫瘤進(jìn)展有關(guān)[22]。因此,筆者推測,ACT細(xì)胞周期相關(guān)功能的富集與TUBB3、DCN、RASSF2和FOS的差異表達(dá)有密切關(guān)系。另外,DCN蛋白還可通過與多種細(xì)胞表面受體結(jié)合,發(fā)揮抑制血管生成和腫瘤發(fā)生的作用。
基因PDGFRA下調(diào)可影響腫瘤細(xì)胞的磷酸化過程。癌細(xì)胞內(nèi)若有多條信號傳導(dǎo)途徑發(fā)生變化,則多與蛋白質(zhì)磷酸化有關(guān)。研究顯示,酪氨酸磷酸化是控制細(xì)胞增殖、凋亡、遷移和侵襲的幾個(gè)關(guān)鍵的致癌信號通路的一個(gè)精致開關(guān)[23]。PDGFRA編碼細(xì)胞表面酪氨酸激酶受體,在器官發(fā)育、傷口愈合和腫瘤進(jìn)展中起著重要作用。Pastor等[24]對6例無血緣關(guān)系的ACT患者進(jìn)行研究發(fā)現(xiàn),PDGFRA在患者中呈低表達(dá)。另外,HSPA13編碼熱休克蛋白70(HSP70)超級蛋白,可能通過影響蛋白分泌、清除變性或不正常折疊蛋白等過程,從而參與ACT的發(fā)生和發(fā)展[12]。ADH1B編碼的醇脫氫酶則可能通過影響各種底物代謝通路和藥物代謝參與ACT的發(fā)?。?4]。
綜上所述,Binding相關(guān)功能在各個(gè)分級中富集可能與STXBP1和AKIRIN1過度表達(dá)相關(guān)。NCBI數(shù)據(jù)庫關(guān)于STXBP1和AKIRIN1的介紹中提到,STXBP1編碼一種合成結(jié)合蛋白,與各種類型的binding密切相關(guān),而AKIRIN1的表達(dá)與protein binding密切相關(guān)。
3.2 生存分析 本研究生存分析顯示,XPO1、RACGAP1、PDGFD、NR4A2和MXRA5的高表達(dá),以及VPS51、TMED3、NDFIP1和CDKN1C的低表達(dá)與ACT患者的生存期密切相關(guān)。
XPO1編碼的細(xì)胞周期調(diào)控蛋白可通過控制cyclin B、MPAK和MAPKAP激酶2的表達(dá),參與部分細(xì)胞的生長過程。RACGAP1的高表達(dá)提示乳腺癌、胃癌和直腸癌的預(yù)后較差[25-27],本研究亦顯示RACGAP1高表達(dá)的ACT患者預(yù)后不良。PDGFD基因參與Gap junction通路,相比正常細(xì)胞和良性細(xì)胞,ACT細(xì)胞間的gap junction數(shù)量顯著降低[28]。在大約60%的ACT患者均呈現(xiàn)出腎上腺類固醇激素過量現(xiàn)象,這可能與NR4A2編碼的激素-維生素A表達(dá)增加有關(guān),且該受體參與Aldosterone synthesis and secretion通路[29]。另外有研究顯示,在腎小管細(xì)胞中MXRA5編碼蛋白表現(xiàn)出免疫活性[30]。而MXRA5編碼的蛋白包含12個(gè)免疫球蛋白樣的c2型域,因此筆者推測該基因可能通過影響免疫功能來發(fā)揮作用。
表達(dá)下調(diào)基因主要通過影響物質(zhì)運(yùn)輸與蛋白分泌影響預(yù)后。VPS51編碼的蛋白是高爾基體相關(guān)逆行蛋白復(fù)合物(GARP)的組成部分。TMED3編碼一種穿膜蛋白,參與從內(nèi)質(zhì)網(wǎng)到高爾基體的囊泡運(yùn)輸。DNFIP1編碼的蛋白屬于一組具有3個(gè)跨膜結(jié)構(gòu)域的進(jìn)化保守蛋白,這種蛋白質(zhì)被認(rèn)為是高爾基體膜蛋白家族的一部分。目前這3個(gè)基因的作用機(jī)制還不清楚,根據(jù)3個(gè)基因的功能推測,它們應(yīng)該與物質(zhì)的運(yùn)輸和蛋白分泌有關(guān)系。另外研究顯示,TMED3基因的敲除增加了直腸癌的轉(zhuǎn)移生長[31],本研究亦顯示,TMED3的低表達(dá)導(dǎo)致ACT的預(yù)后不良。CDKN1C編碼的蛋白對于幾種cyclin/CDK復(fù)合物有很強(qiáng)的抑制作用,并抑制細(xì)胞增殖,在成人ACT中也檢測到該基因的表達(dá)有所下調(diào)[32]。
綜上所述,通過ACT和正常組織樣本的表達(dá)譜分析,本研究篩選出了與ACT發(fā)生和發(fā)展相關(guān)的靶點(diǎn),并通過對重合差異基因的生存分析,確定了與ACT預(yù)后有密切關(guān)系的基因,這將有助于進(jìn)一步了解ACT的致病機(jī)制、治療和預(yù)后。
Fig.1 Heatmap of expression values of the DEGs圖1 差異表達(dá)基因的表達(dá)量熱圖
Fig.2 Analysis of the 73 OLDEGs圖2 73個(gè)OLDEGs的表達(dá)量分析