胡偉全 趙琴飛 朱龍玉 胡素萍 陳芳芳
(1 贛州市人民醫(yī)院關(guān)節(jié)外科,江西 贛州 341000; 2 贛南醫(yī)學(xué)院第一附屬醫(yī)院檢驗(yàn)科; 3 河北醫(yī)科大學(xué)第四醫(yī)院放療科;4 贛南醫(yī)學(xué)院第一附屬醫(yī)院急診科; 5 東部戰(zhàn)區(qū)總醫(yī)院檢驗(yàn)醫(yī)學(xué)研究所基礎(chǔ)醫(yī)學(xué)實(shí)驗(yàn)室)
肉瘤是一種間充質(zhì)來源的異質(zhì)性惡性腫瘤,比較罕見,約占所有兒童惡性腫瘤的21%,所有成人惡性腫瘤的1%[1]。目前已鑒定出100多種不同的肉瘤實(shí)體,大致分為軟組織肉瘤和骨肉瘤[2-3]。目前肉瘤的標(biāo)準(zhǔn)治療方案主要有手術(shù)切除、化學(xué)療法和放射療法,但近幾年來患者的療效和預(yù)后并沒有顯著提高[4]。Ⅵ型膠原A(COL6A)是蛋白質(zhì)超家族中的一員,由3條主要的多肽鏈(α1、α2和α3)組成,是主要的細(xì)胞外基質(zhì)之一[5]。研究發(fā)現(xiàn),在宮頸癌、前列腺癌、肺癌以及胰腺癌等腫瘤組織中COL6A1基因呈顯著高表達(dá),并且與腫瘤進(jìn)展密切相關(guān)[6-9],但COL6A1基因在肉瘤組織中的表達(dá)水平及其作用機(jī)制尚未見相關(guān)研究報(bào)道。本研究旨在通過生物信息學(xué)方法分析COL6A1基因在肉瘤發(fā)生發(fā)展及預(yù)后中的作用及其機(jī)制,為肉瘤患者的治療提供參考依據(jù)?,F(xiàn)將結(jié)果報(bào)告如下。
在GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)選取并下載骨肉瘤數(shù)據(jù)集GSE16088[10]、軟組織肉瘤數(shù)據(jù)集GSE21122[11]和腎透明細(xì)胞肉瘤數(shù)據(jù)集GSE49972[12]的原始測(cè)序數(shù)據(jù),用R軟件Limma軟件包對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化后,分析骨肉瘤、軟組織肉瘤和腎透明細(xì)胞肉瘤組織中COL6A1~3基因表達(dá)水平。肉瘤組織和正常組織中差異基因比較用Wilcoxon檢驗(yàn),以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
從TCGA數(shù)據(jù)庫(https://genome-cancer.ucsc.edu/)中下載肉瘤組織以及正常組織樣本的轉(zhuǎn)錄組RNAseq數(shù)據(jù)和患者的生存數(shù)據(jù)。采用R軟件的survival包分析肉瘤組織中COL6A1~3基因的表達(dá)水平與患者生存的相關(guān)性,并通過survminer包繪制患者的Kaplan-Meier(KM)生存曲線[13],并進(jìn)行Log-rank檢驗(yàn),以P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。采用GSVA包[14]對(duì)肉瘤組織中COL6A1基因的表達(dá)水平與24種免疫細(xì)胞[15]浸潤之間的相關(guān)性進(jìn)行Spearman相關(guān)性分析,以P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
通過LinkedOmics數(shù)據(jù)庫(http://www.linkedomics.org/login.php)[16]分析肉瘤組織當(dāng)中與COL6A1存在相關(guān)性的其他差異表達(dá)的基因,即COL6A1的共表達(dá)基因,分析結(jié)果以皮爾遜相關(guān)系數(shù)表示。通過R軟件的ggstatsplot包對(duì)肉瘤組織中COL6A1和COL6A2基因表達(dá)的相關(guān)性進(jìn)行Spearman分析,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
使用R軟件的clusterProfiler包對(duì)與COL6A1共表達(dá)基因進(jìn)行GO功能富集分析和KEGG通路分析[17]。
在分子特征數(shù)據(jù)庫當(dāng)中[18]使用GSEA分析COL6A1共表達(dá)基因的激酶、miRNA及轉(zhuǎn)錄因子靶標(biāo),等級(jí)標(biāo)準(zhǔn)參數(shù)即錯(cuò)誤檢測(cè)率(FDR)<0.05,且進(jìn)行了500次模擬。
GEO數(shù)據(jù)庫分析結(jié)果顯示,與正常組織相比,骨肉瘤和軟組織肉瘤組織中COL6A1~3基因的表達(dá)水平均顯著升高(t=2.68~7.98,P<0.05),腎透明細(xì)胞肉瘤組織當(dāng)中COL6A1以及COL6A2基因的表達(dá)水平亦顯著升高(t=2.95、2.80,P<0.05),COL6A3表達(dá)水平無顯著差異(P>0.05)。
KM生存曲線分析結(jié)果顯示,肉瘤組織當(dāng)中COL6A1基因表達(dá)水平與患者的總體生存率(OS)和疾病特異生存率(DSS)有關(guān)(χ2=6.37、4.57,P<0.05),詳見圖1A、B;肉瘤組織當(dāng)中COL6A2以及COL6A3的高表達(dá)與患者的OS和DSS無顯著相關(guān)性(P>0.05)。
A、B分別為肉瘤組織中COL6A1基因表達(dá)水平與患者的OS、DSS的KM生存曲線
GSVA包分析結(jié)果顯示,肉瘤組織中COL6A1基因的表達(dá)水平與中性粒細(xì)胞、輔助性T細(xì)胞2和成熟樹突狀細(xì)胞浸潤存在顯著正相關(guān)(r=0.240~0.280,P<0.05)。
在LinkedOmics數(shù)據(jù)庫中,分析肉瘤組織當(dāng)中與COL6A1共表達(dá)的基因情況,分析結(jié)果顯示,與COL6A1表達(dá)水平顯著正相關(guān)的基因2 444個(gè),與COL6A1表達(dá)水平顯著負(fù)相關(guān)的基因有3 711個(gè)(FDR<0.05),圖2A、B分別顯示了與COL6A1呈現(xiàn)顯著正相關(guān)和負(fù)相關(guān)的前50個(gè)基因,其中紅色表示了高表達(dá)基因,藍(lán)色表示低表達(dá)基因。R軟件的ggstatsplot包進(jìn)一步分析結(jié)果顯示,肉瘤組織當(dāng)中COL6A1和COL6A2的表達(dá)呈顯著正相關(guān)性(r=0.830,P<0.05)。
a:與COL6A1正相關(guān)的前50個(gè)基因熱圖,B:與COL6A1負(fù)相關(guān)的前50個(gè)基因熱圖
GO功能富集分析結(jié)果顯示,與COL6A1相關(guān)的共表達(dá)基因主要位于突觸前、神經(jīng)元細(xì)胞體和細(xì)胞-基質(zhì)連接等成分中,主要參與多細(xì)胞生物體內(nèi)平衡、中性粒細(xì)胞介導(dǎo)的免疫反應(yīng)、中性粒細(xì)胞參與的活化免疫反應(yīng)等生物學(xué)過程。KEGG通路分析結(jié)果顯示,這些基因主要在PI3K-Akt信號(hào)通路、人乳頭瘤病毒感染、神經(jīng)元活性配體-受體相互作用和MAPK信號(hào)通路中富集。
肉瘤組織中與COL6A1共表達(dá)基因的GSEA分析結(jié)果顯示,與COL6A1共表達(dá)基因相互作用的5個(gè)最重要的激酶靶標(biāo)是PRKCA、SRC、LYN、PRKAA1和PAK1; 重要的miRNA靶標(biāo)是miR-506、miR-200B、miR-200C、miR-429和miR-330;重要轉(zhuǎn)錄因子靶標(biāo)是V$ETS2_B、V$AP1_C、V$PU1_Q6、V$RORA1_01和V$AP1_Q2。
肉瘤是相對(duì)罕見的異質(zhì)性惡性腫瘤,患者死亡率極高[19],目前的治療方法主要還是手術(shù)切除、放療和化療,患者的預(yù)后很差[20]。因此迫切需要深入探討肉瘤發(fā)病的分子機(jī)制,挖掘其有效的預(yù)后和治療靶點(diǎn)。
COL6A1是脊椎動(dòng)物中的保守基因,幾乎存在于機(jī)體內(nèi)的所有結(jié)締組織當(dāng)中,以維持組織的完整性[21]。研究發(fā)現(xiàn),腫瘤組織中COL6A1的高表達(dá)與腫瘤進(jìn)展密切相關(guān)[22]。COL6A1還被發(fā)現(xiàn)參與多種腫瘤細(xì)胞的黏附、侵襲和轉(zhuǎn)移過程[9,23]。此外,前列腺癌細(xì)胞系中COL6A1基因敲減以后會(huì)通過JK-STAT途徑抑制前列腺癌細(xì)胞的增殖[7]。目前關(guān)于COL6A1在肉瘤組織中的表達(dá)情況及其作用機(jī)制尚不清楚。
本研究首先通過在GEO數(shù)據(jù)庫的GSE16088、GSE21122和GSE49972數(shù)據(jù)集中對(duì)肉瘤組織和正常組織中的COL6A1~3基因表達(dá)進(jìn)行差異分析,結(jié)果顯示,與正常組織相比,COL6A1基因在骨肉瘤、軟組織肉瘤和腎透明細(xì)胞肉瘤等組織中的表達(dá)水平均顯著升高。進(jìn)一步KM生存曲線分析顯示,肉瘤組織中COL6A1基因高表達(dá)的患者,預(yù)后更差。以上結(jié)果表明,COL6A1可能在肉瘤的發(fā)生發(fā)展中具有重要作用。
為進(jìn)一步了解COL6A1共表達(dá)基因在肉瘤中的作用機(jī)制,本研究對(duì)肉瘤組織中COL6A1共表達(dá)基因進(jìn)行了GO功能富集分析和KEGG通路分析。GO功能富集分析結(jié)果顯示,肉瘤組織中COL6A1共表達(dá)基因主要參與多細(xì)胞生物體內(nèi)平衡、中性粒細(xì)胞介導(dǎo)的免疫反應(yīng)和中性粒細(xì)胞參與的活化免疫反應(yīng)等生物學(xué)過程。免疫細(xì)胞浸潤相關(guān)性分析同樣表明,肉瘤組織中COL6A1基因的表達(dá)水平與中性粒細(xì)胞的細(xì)胞浸潤水平之間存在顯著相關(guān)性。這表明COL6A1表達(dá)可能主要通過影響腫瘤微環(huán)境中的免疫浸潤,尤其是中性粒細(xì)胞的細(xì)胞浸潤,進(jìn)而影響患者的預(yù)后和生存。在過去的幾年中,越來越多的證據(jù)表明免疫系統(tǒng)在腫瘤的控制和進(jìn)展中起著重要作用[24]。免疫療法在某些類型的腫瘤,例如非小細(xì)胞肺癌以及黑素瘤的治療當(dāng)中獲得了喜人的結(jié)果[25],本研究結(jié)果可能對(duì)肉瘤的免疫治療具有一定的意義。此外,本研究KEGG通路分析顯示,肉瘤組織中COL6A1共表達(dá)基因主要富集于PI3K-Akt信號(hào)通路、人乳頭瘤病毒感染、神經(jīng)元活性配體-受體相互作用以及MAPK信號(hào)通路中,因此這些基因表達(dá)水平的變化可能與肉瘤的發(fā)生發(fā)展具有重要的關(guān)系。
本研究通過GSEA分析肉瘤組織中COL6A1共表達(dá)基因的重要激酶、miRNA及轉(zhuǎn)錄因子靶標(biāo),以進(jìn)一步揭示COL6A1在肉瘤中的作用機(jī)制。本研究結(jié)果顯示,與COL6A1共表達(dá)基因相互作用的5個(gè)最重要的激酶靶標(biāo)是PRKCA、SRC、LYN、PRKAA1、和PAK1;重要的miRNA靶標(biāo)是miR-506、miR-200B、miR-200C、miR-429和miR-330;重要轉(zhuǎn)錄因子靶標(biāo)是V$ETS2_B、V$AP1_C、V$PU1_Q6、V$RORA1_01和V$AP1_Q2。然而這些激酶、miRNA及轉(zhuǎn)錄因子調(diào)控機(jī)制比較復(fù)雜,需要進(jìn)一步實(shí)驗(yàn)驗(yàn)證,以期為臨床治療提供重要指導(dǎo)。雖然LinkedOmics數(shù)據(jù)庫的共表達(dá)分析以及R軟件ggstatsplot包的相關(guān)性分析均表明COL6A1和COL6A2之間呈顯著正相關(guān),COL6A家族成員之間的相互作用及其具體的分子機(jī)制也仍有待進(jìn)一步研究。
綜上所述,本研究通過對(duì)多個(gè)數(shù)據(jù)庫當(dāng)中肉瘤患者的RNA測(cè)序數(shù)據(jù)進(jìn)行生物信息學(xué)分析提示,COL6A1基因在肉瘤組織中顯著高表達(dá),COL6A1基因的高表達(dá)也與肉瘤患者的不良預(yù)后密切相關(guān),COL6A1可能是肉瘤的一個(gè)有價(jià)值的預(yù)后指標(biāo)和潛在的治療靶點(diǎn)。本研究可為肉瘤患者的預(yù)后及治療提供新的思路和理論依據(jù)。
作者聲明:胡偉全、趙琴飛、陳芳芳參與了研究設(shè)計(jì);胡偉全、趙琴飛、朱龍玉、胡素萍、陳芳芳參與了論文的寫作和修改。所有作者均閱讀并同意發(fā)表該論文,且均聲明不存在利益沖突。