郭 婷, 劉新蘭
(1.寧夏醫(yī)科大學(xué)臨床醫(yī)學(xué)院,銀川 750004; 2.寧夏醫(yī)科大學(xué)總醫(yī)院,銀川 750004)
乳腺癌已成為全球最常見的女性惡性腫瘤,且呈不斷增長趨勢[1]。2015 年女性發(fā)病首位為乳腺癌,年發(fā)病人數(shù)約為30.4 萬,女性癌癥死因乳腺癌排第五位[2]。因此,尋找能提高乳腺癌早期診斷的腫瘤標志物至關(guān)重要。目前,單基因腱蛋白樣蛋白1(chordin like 1,CHRDL1)在乳腺癌中研究較少,通過癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫篩選乳腺癌Top100 差異表達基因(differentially expressed genes,DEGs)包括CHRDL1(Log FC 為-5.26,P=1.87×10-153,F(xiàn)DR=3.07×10-151)。此外,通過對Gene Expression Omnibus(GEO)數(shù)據(jù)集GES42568、GSE8977 及GSEA50428聯(lián)合分析后進行Hub 基因篩選,含CHRDL1。CHRDL1 是一種分泌性蛋白,是骨形態(tài)發(fā)生蛋白(BMP)的拮抗劑。BMP 作為BMP 受體Ⅱ(BMPRII)的激活劑,介導(dǎo)細胞外到細胞內(nèi)的信號傳遞,參與腫瘤的發(fā)生和轉(zhuǎn)移。Pei 等[3]研究證實CHRDL1 在胃癌組織中的表達下調(diào),且預(yù)后較差,CHRDL1 是一種抑癌基因。孫麗等[4]證實BMP抑制劑CHRDL1 可抑制小鼠乳腺增生。Mithani等[5]綜合遺傳學(xué)分析CHRDL1 等基因在惡性黑色素瘤呈低甲基化,抑制惡性黑色素瘤增殖。本研究主要以單基因CHRDL1 為研究對象,通過TCGA數(shù)據(jù)挖掘,利用生物信息學(xué)方法分析CHRDL1 在乳腺癌中的表達、臨床相關(guān)性及生存預(yù)后分析,使用基因富集分析(Gene Set Enrichment Analysis,GSEA)CHRDL1 可能參與的信號通路,揭示其參與乳腺癌發(fā)生發(fā)展的可能分子機制。
人乳腺癌患者的RNA-Seq 數(shù)據(jù)集和相應(yīng)的臨床資料來自TCGA(https://gdc.nci.nih.gov)[6]。在創(chuàng)建數(shù)據(jù)集的過程中,從TCGA 數(shù)據(jù)門戶網(wǎng)站下載總共1075 例非配對乳腺癌組織樣本和114 例正常樣本及配對樣本(乳腺癌組織樣本111例、正常組織樣本111 例)的原始RNA 測序讀數(shù)和相應(yīng)的臨床信息,所有樣本的RNA 表達水平均已在R 統(tǒng)計環(huán)境(V.3.6.0)中使用BioConductor軟件包進行處理和歸一化。根據(jù)樣本ID 匹配CHRDL1 mRNA 表達數(shù)據(jù)矩陣和臨床信息文件,CHRDL1 在乳腺癌甲基化水平,Beta 值表示DNA甲基化的水平,范圍從0(未甲基化)到1(完全甲基化);甲基化過高(Beta 值:0.7~0.5)或甲基化過低(Beta 值:0.3~0.25);PMID:29027401、23291739)。
采用R 3.6.0 軟件對TCGA 下載的數(shù)據(jù)進行處理,使用limma 包對芯片數(shù)據(jù)作差異分析,計算CHRDL1 在乳腺癌組織(114 例)和乳腺正常組織(1097 例)、乳腺癌組織和與其相匹配的癌旁正常組織(111 例)的差異表達,使用beeswarm包作圖。使用http://ualcan.path.uab.edu[7]網(wǎng)絡(luò)平臺與秩和檢驗分析CHRDL1 在乳腺癌中的表達及其與TNM 分期、分子分型的關(guān)系。
使用Kaplan-Meier Plotter 數(shù)據(jù)庫(https://kmplot.com/analysis)[8]對基因芯片中209763_at 探針數(shù)據(jù)進行生存和預(yù)后分析。按CHRDL1 在乳腺癌組織芯片中的表達均值進行分組,高于均值為高表達組,低于均值為低表達組。分別分析CHRDL1差異表達與乳腺癌患者總生存期(OS)和無遠處轉(zhuǎn)移生存(RFS)的關(guān)系。
使用KEGG 的基因集[Gene Sets Debates:C2.CP.KEGG.V6.2.Symbols.gmt(Curated)]進行GSEA富集分析[9]評估CHRDL1 可能參與的信號通路。根據(jù)CHRDL1 表達中位數(shù)將基因表達數(shù)據(jù)分為高、低兩組,每次分析進行1000 次基因集排列。在整個過程中,CHRDL1 的表達水平被認為是一個表型,根據(jù)標準化富集分數(shù)(NES)、標準化顯著性水平(NOM p-val)和矯正多重假設(shè)檢驗(FDR q-val)對每種表型的富集途徑進行分類,NES 絕對值≥1.0,NOM p-val≤0.05,F(xiàn)DR q-val≤0.25確認為有意義的基因集合。
通過在線分析網(wǎng)站String(https://string-db.org/)[10]得到已篩選有意義信號通路中差異表達基因(DEGs)的蛋白互作網(wǎng)絡(luò),以TSV 格式導(dǎo)出,將所得源文件導(dǎo)入Cytoscape 進行可視化分析,用插件cytoHubba 進行Hub 基因分析,篩選出潛在的關(guān)鍵基因。
通過在線分析網(wǎng)站CANCERTOOL[11](http://web.bioinformatics.cicbiogune.es/CANCERTOOL)分析CHRDL1 與GSEA 富集分析中篩選出來的關(guān)鍵基因CAV1 和FYN 的相關(guān)性。繪制的值對應(yīng)于指定數(shù)據(jù)集中每個患者的兩個基因(X 軸和Y軸)的log2歸一化基因表達值。黑線表示線性回歸,灰色區(qū)域表示置信區(qū)間的界限,r 和P 分別表示Pearson 相關(guān)系數(shù)和統(tǒng)計顯著性。
所有統(tǒng)計分析和繪圖均使用R(v.3.6.0)軟件。用Wilcoxon 秩和檢驗和Wilcoxon 符號秩和檢驗分析CHRDL1 在非配對樣本和配對樣本中的表達。采用秩和檢驗分析CHRDL1 表達與臨床病理特征的關(guān)系,使用Kaplan-Meier 法作生存分析,P≤0.05 為差異有統(tǒng)計學(xué)意義。兩基因間相關(guān)性分析使用Pearson 相關(guān)性分析,P≤0.05 并且|r|≥0.3 為差異有統(tǒng)計學(xué)意義。
基于TCGA 數(shù)據(jù)分析結(jié)果顯示CHRDL1 在90%以上腫瘤中呈現(xiàn)低表達狀態(tài),僅在肉瘤中表達增高。在非配對乳腺癌組織和正常組織及配對的乳腺癌組織與其癌旁正常組織中的差異表達分析顯示CHRDL1 在乳腺癌中的表達低于正常組織及癌旁組織(P=1.0×10-12、P=3.556×10-13)。通過Kaplan-Meier Plotter 數(shù)據(jù)庫分析CHRDL1的表達與乳腺癌患者預(yù)后的關(guān)系,結(jié)果顯示CHRDL1的高表達為乳腺癌不良預(yù)后因素,在OS 和RFS 分析中,CHRDL1 高表達者的OS 和RFS 均低于CHRDL1 低表達者(P=9.2×10-5、P=2.4×10-8)。見圖1。
圖1 CHRDL1 在乳腺癌中表達及生存分析
在乳腺癌組織大小即T 分期中,T3 期中CHRDL1 的表達均高于其他組(P 均<0.05),說明CHRDL1 在腫塊>5 cm 時表達程度較高;N 分期中,不同淋巴結(jié)轉(zhuǎn)移分級的CHRDL1 表達差異無統(tǒng)計學(xué)意義(P=0.165);M 分期中,無遠處轉(zhuǎn)移組CHRDL1 表達高于存在遠處轉(zhuǎn)移組(P=0.049);乳腺癌四種不同分子分型組的CHRDL1表達差異有統(tǒng)計學(xué)意義(P=1.48×10-12),HER2 過表達組、三陰性乳腺癌(TNBC)組、Luminal 組均低于正常組(P 均<0.05),CHRDL1 在HER2 過表達組中表達最低,在三陰性乳腺癌組中表達最高(P 均<0.05)。見圖2。
乳腺癌組織CHRDL1 啟動子與正常組織的甲基化均為過低,Beta 值處于0.3~0.25,但乳腺癌組織中CHRDL1 啟動子甲基化值高于正常組織(P=1.0×10-12)。不同的分子分型分析結(jié)果顯示,Luminal 組CHRDL1 啟動子區(qū)甲基化值高于正常組(P=1.62×10-12),Luminal 組和HER2 過表達組CHRDL1 啟動子區(qū)甲基化值均高于TNBC 組(P=2.53×10-7、P=0.034)。見圖3。
圖2 乳腺癌CHRDL1 的表達與臨床特征的關(guān)系
GSEA 富集分析結(jié)果顯示共有27 個信號通路和生物過程在CHRDL1 和乳腺癌之間具有不同程度的富集,篩選條件為同時滿足NOM p-val<0.05 且FDR q-val<0.05。與腫瘤相關(guān)的信號通路和生物過程有Jak- STAT 信號通路、MAPK 信號通路、細胞因子通路、凋亡、氧化磷酸化、糖代謝以及脂代謝相關(guān)的信號通路等。見表1、圖4。
GSEA 富集分析發(fā)現(xiàn)CHRDL1 在MAPK 信號通路中發(fā)揮重要作用。通過Cytoscape 軟件構(gòu)建CHRDL1 在乳腺癌侵襲及轉(zhuǎn)移相關(guān)的信號通路MAPK 通路中關(guān)鍵基因的蛋白互作網(wǎng)絡(luò),其中CAV1、FYN 與CHRDL1 具有直接互作關(guān)系。為進一步對篩選出的Hub 基因與CHRDL1 作相關(guān)性分析,發(fā)現(xiàn)其與CHRDL1 呈正相關(guān)性,相關(guān)系數(shù)分別為0.39 和0.39,P 值分別為2.2×10-16和1.45×10-12。見圖5。
圖3 乳腺癌易感基因CHRDL1 啟動子區(qū)甲基化水平
表1 GSEA KEGG 富集分析
圖4 GSEA 信號通路富集分析
CHRDL1 是一種骨形態(tài)發(fā)生蛋白BMP 抑制劑,參與調(diào)節(jié)BMP 信號通路活性,CHRDL1 蛋白可以競爭性結(jié)合BMP,并通過分泌到細胞外基質(zhì)來拮抗其功能[12]。BMPs 首先被確定為誘導(dǎo)異位骨形成,并在發(fā)育期間形態(tài)發(fā)生中起重要作用,它們是多功能生長因子,屬于轉(zhuǎn)化生長因子-β(TGFβ)的超家族[13]。Cyr-Depauw 等[14]證實,在降低的ShcA 信號傳導(dǎo)條件下,刺激TGF 后,CHRDL1 表達在大量乳腺癌細胞中上調(diào)。體外實驗[14]證實CHRDL1 作為BMP4 誘導(dǎo)遷移和侵襲的抑制劑,CHRDL1 表達是乳腺癌患者的有利預(yù)后因素。另一項研究[3]揭示了CHRDL1 在胃癌組織中表達下調(diào),且與低存活率相關(guān)。通過臨床和病理數(shù)據(jù)觀察到CHRDL1 的低表達與轉(zhuǎn)移之間密切相關(guān),CHRDL1 的表達下調(diào)通過BMP 受體II 促進腫瘤細胞的增殖和遷移。此外,CHRDL1 是抑制腫瘤增殖和轉(zhuǎn)移的抑癌基因[3]。以上研究表明,CHRDL1的表達缺失可能是腫瘤起始的分子病因。本文主要依賴于TCGA 數(shù)據(jù)庫獲得的高通量測序數(shù)據(jù),利用生物信息學(xué)工具證實CHRDL1 作為乳腺癌的抑癌因子在乳腺癌發(fā)生發(fā)展中的調(diào)控作用。
圖5 MAPK 信號通路中蛋白互作網(wǎng)絡(luò)及共表達基因篩選
本研究通過挖掘TCGA 數(shù)據(jù)明確CHRDL1在乳腺癌中的表達、臨床相關(guān)性及預(yù)后價值。首先利用Ualcan 網(wǎng)絡(luò)平臺分析CHRDL1 在大多數(shù)惡性實體腫瘤中呈現(xiàn)低表達,如膀胱癌、乳腺癌、結(jié)腸癌、食道癌、頭頸鱗狀細胞癌、肺癌、胰腺癌、前列腺癌、胸腺癌、胃癌、腦膠質(zhì)瘤、腎癌、肝癌、皮膚黑色素瘤和甲狀腺癌;僅在肉瘤呈高表達。本文結(jié)果顯示,CHRDL1 在乳腺癌組織的表達低于正常乳腺組織,在配對分析中得到了一致的結(jié)果。CHRDL1 在不同臨床分期中均呈低表達,T分期中結(jié)果顯示在T3 組中CHRDL1 表達最高,說明CHRDL1 在5 cm 以上乳腺癌腫塊組織中表達具有一定診斷意義,且存在遠處轉(zhuǎn)移的患者CHRDL1 表達低于未發(fā)生轉(zhuǎn)移者,證實CHRDL1為抑癌因子。而CHRDL1 啟動子甲基化不論是在正常組織還是癌組織均呈低甲基化,與正常組織相比,乳腺癌組織中CHRDL1 啟動子甲基化值高于正常組織;在不同分子分型組間,CHRDL1 啟動子區(qū)甲基化值在Luminal 組較高,Luminal 組和HER2 過表達組CHRDL1 啟動子區(qū)甲基化值均高于三陰性乳腺癌組。Kaplan-Meier Plotter 數(shù)據(jù)庫包含54675 個基因的10461 個癌癥樣本的生存數(shù)據(jù),其中包括3955 個乳腺癌樣本,可以進行乳腺癌有關(guān)基因的臨床預(yù)后相關(guān)數(shù)據(jù)的分析[15]。通過Kaplan-Meier Plotter 數(shù)據(jù)庫進行生存分析顯示,CHRDL1 高表達乳腺癌患者的OS 和RFS 均低于CHRDL1 低表達者,以上生物信息學(xué)數(shù)據(jù)分析結(jié)果顯示CHRDL1 有望成為乳腺癌抑癌基因,且其在乳腺癌中的高表達與患者OS 和RFS 較低相關(guān)。
為進一步研究CHRDL1 在乳腺癌中的功能及調(diào)控機制,基于TCGA 數(shù)據(jù)利用GSEA 軟件進行KEGG 基因集富集分析。結(jié)果顯示,在乳腺癌中共有27 個信號通路和功能在CHRDL1 的高表達表型中有富集,與腫瘤相關(guān)的信號通路和生物過程:Jak- STAT 信號通路、MAPK 信號通路、細胞因子通路、凋亡、氧化磷酸化、糖代謝以及脂代謝相關(guān)的信號通路等。MAPK 信號通路是眾多細胞因子信號通路的共同途徑,廣泛參與了細胞增殖、分化、凋亡及炎癥過程[16]。MAPK 通路的激活與逆轉(zhuǎn)腫瘤化療耐藥及增敏化療有關(guān),目前成為癌癥治療的熱點[16-17]。通過String 在線網(wǎng)站針對篩選出的MAPK 信號通路與CHRDL1 相關(guān)的基因進行蛋白互作PPI 網(wǎng)絡(luò)構(gòu)建,使用Cytoscape軟件再次篩選出與CHRDL1 具有直接互作關(guān)系的關(guān)鍵基因CAV1 和FYN。通過CANCERTOOL 在線網(wǎng)站,對CHRDL1/CAV1 及CHRDL1/FYN 的相關(guān)性進行了分析,分析結(jié)果顯示CHRDL1 與CAV1 及FYN 呈正相關(guān)。CAV1 是一種完整的膜蛋白,在乳腺癌中,CAV1 的突變增加了乳腺癌的患病風(fēng)險[18-19]。CAV1 的缺失可能導(dǎo)致腫瘤的增殖、進展和血管生成[20]。CAV1 調(diào)控多種癌癥相關(guān)過程,如細胞轉(zhuǎn)化、腫瘤生長、細胞死亡和存活、血管生成、細胞遷移、侵襲、凋亡和轉(zhuǎn)移[21]。在乳腺癌中,CAV1 基因促進了PI3K/AKT、EGFR-MAPK和MAPK 信號轉(zhuǎn)導(dǎo)[22]。Elias 等[23]的研究表明FYN在三苯氧胺耐藥中起重要作用,其在激素受體陽性乳腺癌細胞的表達可能是乳腺癌內(nèi)分泌治療效果評估的一個新的重要生物標志物。
綜上所述,通過挖掘TCGA 數(shù)據(jù)庫,應(yīng)用生物信息學(xué)技術(shù)推測CHRDL1 可能作為潛在的診斷乳腺癌和預(yù)測其預(yù)后的腫瘤標記物,其內(nèi)在的調(diào)控機制可能是通過調(diào)控CAV1 和(或)FYN 介導(dǎo)MAPK 信號通路影響乳腺癌細胞的增殖、侵襲和轉(zhuǎn)移,尚需要進行一系列的實驗來驗證本文的預(yù)測結(jié)果,為乳腺癌的早期診斷和療效評估提供新的靶點。