許 康,白 麗,2*
(1.大理大學(xué)基礎(chǔ)醫(yī)學(xué)院,云南 大理 671000;2.云南省昆蟲生物醫(yī)藥研發(fā)重點(diǎn)實(shí)驗(yàn)室,云南 大理 671000)
根據(jù)國際癌癥研究機(jī)構(gòu)編制的GLOBOCAN 2020統(tǒng)計,乳腺癌已超越肺癌成為全球第一大癌癥(占比11.7%)〔1〕。在乳腺癌的治療方法上,目前主要是手術(shù)治療結(jié)合化療,但對于轉(zhuǎn)移性乳腺癌來說仍需其他治療手段改善患者生存率,新的治療方法包括信號通路抑制劑、節(jié)律化療、抗體-藥物結(jié)合系統(tǒng)、納米顆粒等的研究都還處于起步階段〔2-3〕。乳腺癌重要的預(yù)后標(biāo)志物主要是腋窩淋巴結(jié)轉(zhuǎn)移數(shù)量、腫瘤大小和腫瘤分級,但這些標(biāo)志物不足以對現(xiàn)今提倡個性化治療的乳腺癌患者進(jìn)行有針對性的治療,特別是對于早期乳腺癌患者〔3〕。因此,篩選影響乳腺癌疾病進(jìn)展及預(yù)后的標(biāo)記分子對乳腺癌患者治療的多樣性和改善預(yù)后有重要臨床意義。S100鈣結(jié)合蛋白P(S100 calcium binding protein P,S100P)是S100鈣結(jié)合蛋白家族成員之一,除在胚胎發(fā)育過程中發(fā)揮作用外,還參與癌癥的發(fā)生發(fā)展、侵襲和轉(zhuǎn)移〔4〕。在乳腺癌早期通常有S100P的表達(dá),參與調(diào)節(jié)乳腺癌侵襲和轉(zhuǎn)移的Fos相關(guān)抗原2(Fosrelated antigen 2,F(xiàn)ra-2)可上調(diào)S100P的表達(dá),并增加乳腺癌的侵襲性〔5〕。乳腺癌分為原位癌(非浸潤癌)和浸潤癌,因原位癌易于治療、預(yù)后好,不是乳腺癌研究的重點(diǎn),且各數(shù)據(jù)庫只收錄浸潤癌相關(guān)數(shù)據(jù),故本研究通過生物信息學(xué)方法分析S100P在乳腺浸潤癌(breast invasive carcinoma,BRCA)中的表達(dá)及其共表達(dá)基因的生物學(xué)功能,探討S100P基因作為預(yù)后判斷的價值,為以S100P基因?yàn)榘悬c(diǎn)的臨床治療提供依據(jù)。
1.1 數(shù)據(jù)來源本研究數(shù)據(jù)來源于GEPIA數(shù)據(jù)庫(http://gepia.cancer-pku.cn)、UALCAN數(shù) 據(jù) 庫(http://ualcan.path.uab.edu)、KM Plotter數(shù) 據(jù) 庫(https://kmplot.com/analysis/)、LinkedOmics數(shù) 據(jù) 庫(http://www.linkedomics.org)和STRING數(shù) 據(jù) 庫(https://cn.string-db.org/)。
1.2 數(shù)據(jù)獲取
1.2.1 GEPIA數(shù)據(jù)庫GEPIA數(shù)據(jù)庫基于TCGA和GTEX的9 736個腫瘤樣本和8 587個正常樣本,可進(jìn)行泛癌分析、差異表達(dá)分析、相關(guān)性分析、患者生存分析等〔6〕。該數(shù)據(jù)庫在本研究中用于挖掘S100P基因的泛癌表達(dá)以及分析在BRCA和正常乳腺組織中的表達(dá)差異。泛癌分析篩選條件為:“概述”“基因:S100P”“數(shù)據(jù)集:全部”。S100P基因在BRCA與正常組織表達(dá)差異篩選條件為“箱式圖”“基因:S100P”“數(shù)據(jù)集:BRCA”。
1.2.2 UALCAN數(shù)據(jù)庫UALCAN數(shù)據(jù)庫基于TCGA 31種癌癥類型的RNA-seq和臨床數(shù)據(jù),可進(jìn)行TCGA數(shù)據(jù)深度分析〔7〕。利用UALCAN數(shù)據(jù)庫分析S100P與BRCA淋巴結(jié)轉(zhuǎn)移分期的關(guān)系。“輸入基因名稱:S100P”“TCGA數(shù)據(jù)集:BRCA”“分析鏈接:表達(dá)”。
1.2.3 KM Plotter數(shù)據(jù)庫KM Plotter數(shù)據(jù)庫能夠使用基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)或代謝組學(xué)數(shù)據(jù)進(jìn)行單變量和多變量COX回歸分析,并繪制KM生存曲線〔8〕。利用KM Plotter數(shù)據(jù)庫評估S100P在乳腺癌中的預(yù)后價值。篩選條件為:“乳腺癌”“開始乳腺癌KM繪圖”“輸入基因名稱:S100P”“患者分組依據(jù):自動選擇最佳值”“生存率:依次選擇無復(fù)發(fā)生存(relapse free survive,RFS)、總生存時間(overallsurvival,OS)、遠(yuǎn)端無轉(zhuǎn)移生存(distalmetastasisfree survival,DMFS)、進(jìn)展后生存(post-progression survival,PPS)”“繪制Kaplan-Meier曲線”。
1.2.4 LinkedOmics數(shù)據(jù)庫LinkedOmics數(shù)據(jù)庫包含TCGA和臨床蛋白質(zhì)組腫瘤分析協(xié)會的多組學(xué)數(shù)據(jù)和臨床數(shù)據(jù),是第一個多組學(xué)數(shù)據(jù)庫〔9〕。通過LinkedOmics數(shù)據(jù)庫分析S100P相關(guān)性基因,并進(jìn)行GO富集分析和KEGG通路注釋與富集分析。相關(guān)性分析:“選擇癌癥類型:BRCA”“選擇檢索數(shù)據(jù)集:根據(jù)數(shù)據(jù)類型選擇RNAseq”“選擇檢索數(shù)據(jù)集屬性:S100P”“選擇目標(biāo)數(shù)據(jù)集:根據(jù)數(shù)據(jù)類型選擇RNAseq”“選擇統(tǒng)計方法:皮爾遜相關(guān)檢驗(yàn)”。GO和KEGG富集分析:“鏈接釋義:基因集富集分析(GSEA)”“富集分析:依次選擇生物學(xué)過程、細(xì)胞成分、分子功能、KEGG通路”。
1.2.5 STRING數(shù)據(jù)庫STRING數(shù)據(jù)庫可整合蛋白質(zhì)之間物理相互作用和功能上的關(guān)聯(lián),創(chuàng)建清晰明了的蛋白質(zhì)相互作用關(guān)聯(lián)網(wǎng)絡(luò)〔10〕。利用STRING數(shù)據(jù)庫分析S100P與其他蛋白質(zhì)的相互作用。“蛋白名稱:S100P”“物種:智人”。
1.3 統(tǒng)計方法采用數(shù)據(jù)庫默認(rèn)統(tǒng)計方法。S100P泛癌分析以及在癌組織和正常組織差異表達(dá)分析采用單因素方差分析;皮爾遜相關(guān)法分析基因表達(dá)相關(guān)性;生存分析采用Log-rank檢驗(yàn)。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 S100P基因在常見腫瘤組織和正常組織中的表達(dá)利用GEPIA數(shù)據(jù)庫分析了S100P基因在腫瘤組織和正常組織中的表達(dá)情況,結(jié)果表明,S100P基因在14種腫瘤中存在差異表達(dá)。其中,在BRCA、宮頸鱗狀細(xì)胞癌和宮頸腺癌、結(jié)腸腺癌、肝細(xì)胞肝癌、肺腺癌、胰腺癌、直腸腺癌、子宮體子宮內(nèi)膜癌、子宮癌肉瘤中高表達(dá),差異有統(tǒng)計學(xué)意義(P<0.001);在彌漫性大B細(xì)胞淋巴瘤、前列腺癌、皮膚黑色素瘤、甲狀腺癌、胸腺癌中低表達(dá),差異有統(tǒng)計學(xué)意義(P<0.001)。
2.2 S100P基因在BRCA組織和正常乳腺組織中的表達(dá)差異對GEPIA數(shù)據(jù)庫中1 085例BRCA組織和291例正常乳腺組織S100P在mRNA水平的表達(dá)差異進(jìn)行分析,結(jié)果表明,S100P基因在BRCA組織中的表達(dá)高于正常乳腺組織,差異有統(tǒng)計學(xué)意義(P<0.05)。見圖1。
2.3 S100P表達(dá)水平與淋巴結(jié)轉(zhuǎn)移分期相關(guān)性S100P的表達(dá)水平在BRCA不同淋巴結(jié)轉(zhuǎn)移分期中存在差異,在N0、N1、N2、N3分期中的表達(dá)均高于正常組織,差異有統(tǒng)計學(xué)意義(P<0.01),且N0與N1,N1與N2,N2與N3之間差異均具有統(tǒng)計學(xué)意義(P<0.05)。見圖2。
2.4 S100P在乳腺癌預(yù)后判斷中的價值采用KM Plotter數(shù)據(jù)庫在線分析S100P在乳腺癌預(yù)后判斷中的價值。結(jié)果發(fā)現(xiàn)S100P低表達(dá)組OS為120.00月,明顯高于S100P高表達(dá)組的59.15月(P<0.001)。見圖3A。進(jìn)一步分析發(fā)現(xiàn),S100P低表達(dá)組RFS、DMFS、PPS均高于S100P高表達(dá)組(P<0.001)。見圖3B~D。
2.5 S100P共表達(dá)基因及GO功能富集分析、KEGG信號通路分析用LinkedOmics數(shù)據(jù)庫分析得到與S100P表達(dá)相關(guān)基因共6 485個,其中,正相關(guān)基因3 207個,負(fù)相關(guān)基因3 278個。(P<0.05,F(xiàn)DR<0.01)。與S100P正相關(guān)和負(fù)相關(guān)的前10個主要基因見表1。通過生物學(xué)過程富集分析發(fā)現(xiàn),S100P共表達(dá)基因主要參與粒細(xì)胞活化、線粒體基因表達(dá)、糖基化、白細(xì)胞遷移、前體代謝物和能量的產(chǎn)生、表皮發(fā)育、形成細(xì)胞外結(jié)構(gòu)組織等生物學(xué)過程,而形成纖毛組織、染色質(zhì)共價修飾等活動受抑制。見表2。細(xì)胞成分富集分析顯示,S100P共表達(dá)基因主要與囊泡腔、線粒體內(nèi)膜、分泌顆粒膜、內(nèi)質(zhì)網(wǎng)腔等細(xì)胞成分有關(guān),而在睫狀部、突觸膜等成分低表達(dá)。見表3。分子功能富集分析表明,與S100P共表達(dá)基因相關(guān)的分子功能包括電子轉(zhuǎn)移活性、作用于還原型煙酰胺腺嘌呤二核苷酸的氧化還原酶活性、細(xì)胞黏附分子結(jié)合、絲氨酸水解酶活性等,但組蛋白結(jié)合活性受抑制。見表4。KEGG信號通路分析發(fā)現(xiàn)S100P共表達(dá)基因主要參與蛋白酶體、溶酶體、代謝通路、白細(xì)胞介素17(interleukin-17,IL-17)信號通路以及一些自身免疫病,如系統(tǒng)性紅斑狼瘡、類風(fēng)濕性關(guān)節(jié)炎等的相關(guān)信號通路的調(diào)控。見表5。
表1 S100P前10個共表達(dá)正、負(fù)相關(guān)基因
表2 S100P共表達(dá)基因的生物學(xué)過程富集分析結(jié)果
表3 S100P共表達(dá)基因的細(xì)胞成分富集分析結(jié)果
表4 S100P共表達(dá)基因的分子功能富集分析結(jié)果
表5 S100P共表達(dá)基因的KEGG信號通路富集分析結(jié)果
2.6 S100P相互作用蛋白分析使用STRING數(shù)據(jù)庫構(gòu)建S100P相互作用蛋白網(wǎng)絡(luò),結(jié)果顯示共19個蛋白與S100P相關(guān),平均聚類系數(shù)為0.831(P<0.001),相互作用的蛋白分別是晚期糖基化終末產(chǎn)物受體(advanced glycation end product receptor,AGER)、鈣周期素結(jié)合蛋白(calcyclin-binding protein,CACYBP)、戴 帽 蛋 白α1(capping actin protein of muscle z-line alpha subunit 1,CAPZA1)、絨毛蛋白/埃茲蛋白(villin 2/ezrin,EZR)、含F(xiàn)XYD結(jié)構(gòu)域的離子通道調(diào)節(jié)蛋白3(FXYD domaincontaining ion transport regulator 3,F(xiàn)XYD3)、白細(xì)胞介素11(interleukin-11,IL-11)、含IQ基序的GTP酶激活蛋白1(IQ motif containing GTPase activating protein 1,IQGAP1)、肌球蛋白重鏈9(myosin heavy chain 9,MYH9)、核仁和紡錘體相關(guān)蛋白1(nucleolar and spindle-associated protein 1,NUSAP1)、鳥 氨 酸 脫 羧 酶 抗 酶1(ornithine decarboxylase antizyme 1,OAZ1)、核糖體蛋白S9(ribosomal protein S9,RPS9)、S100鈣結(jié)合蛋白A1(S100 calcium binding protein A1,S100A1)、S100鈣結(jié) 合 蛋 白B(S100 calcium binding protein B,S100B)、S100P結(jié)合蛋白(S100P binding protein,S100PBP)、S100鈣 結(jié) 合 蛋 白Z(S100 calcium binding protein Z,S100Z)、二 胺 乙 酰 轉(zhuǎn) 移 酶1(diamine acetyltransferase 1,SAT1)、小核核糖核蛋白F(small nuclear ribonucleoprotein F,SNRPF)、MIS12著絲粒合成裝配分子伴侶(SGT1 homolog,MIS12 kinetochore complex assembly cochaperone,SUGT1)、細(xì)胞腫瘤抗原p53(cellular tumor antigen p53,TP53)。
乳腺癌是一種異質(zhì)性疾病,惡性程度高,且發(fā)病率逐年增高,年輕女性患三陰性乳腺癌(triple negative breast cancer,TNBC)的風(fēng)險逐年增加〔11〕。乳腺癌預(yù)后普遍較差,惡性程度最高的TNBC患者OS為1年,而其他亞型的乳腺癌晚期患者OS約為5年〔2〕。近年來,許多研究致力于尋找和驗(yàn)證乳腺癌診斷和預(yù)后標(biāo)志物,成功應(yīng)用于臨床的包括Oncotype DX、MammaPrint和uPA/PAI-1等多基因檢測,但存在價格昂貴、缺乏長期隨訪驗(yàn)證等問題〔3〕。因此探尋新的標(biāo)志物,建立簡單廉價的檢測方法是乳腺癌預(yù)后監(jiān)測的一個重要目標(biāo)。
S100P是S100蛋白家族成員,是由95個氨基酸構(gòu)成的二聚體蛋白,氨基端和羧基端的EF-Hand結(jié)構(gòu)域?yàn)镃a2+結(jié)合位點(diǎn),已被證實(shí)在多種腫瘤中表達(dá)〔5〕。研究〔12〕表明,胰腺癌細(xì)胞分泌的細(xì)胞因子促進(jìn)S100P在瘤周淋巴管中淋巴管內(nèi)皮細(xì)胞(lymphatic endothelial cells,LECs)的表達(dá),通過S100P/RAGE信號通路促進(jìn)LECs的遷移和環(huán)狀化學(xué)排斥劑誘導(dǎo)的缺陷(circular chemorepellentinduced defects,CCID),其中CCID是球形癌細(xì)胞在LECs單層中形成的大的無細(xì)胞區(qū)域,結(jié)果說明S100P與胰腺癌淋巴結(jié)轉(zhuǎn)移密切相關(guān)。另一項(xiàng)研究〔13〕發(fā)現(xiàn),S100P參與E-鈣黏蛋白在胃癌中的黏附和腫瘤抑制功能,促進(jìn)E-鈣黏蛋白陰性的胃癌細(xì)胞存活,增強(qiáng)其侵襲能力,導(dǎo)致胃癌發(fā)生發(fā)展。
本研究通過GEPIA數(shù)據(jù)庫分析S100P基因在常見腫瘤組織與正常組織中的表達(dá)情況,結(jié)果顯示S100P基因在多種腫瘤中差異表達(dá),這與當(dāng)前S100P基因在各種腫瘤中的研究結(jié)果相同,表明S100P基因在腫瘤中差異表達(dá)的現(xiàn)象較普遍。進(jìn)一步分析乳腺癌中S100P mRNA水平的表達(dá)差異,腫瘤組織明顯高于正常組織。為了驗(yàn)證這種差異表達(dá)是否與疾病進(jìn)展有關(guān)聯(lián),本研究利用UALCAN數(shù)據(jù)庫分析S100P基因與不同淋巴結(jié)轉(zhuǎn)移分期的相關(guān)性,發(fā)現(xiàn)N0與N1,N1與N2,N2與N3之間表達(dá)存在差異,提示S100P基因可能與乳腺癌淋巴結(jié)轉(zhuǎn)移相關(guān)。在乳腺癌血清S100P的研究〔14〕中發(fā)現(xiàn),轉(zhuǎn)移性乳腺癌患者血清S100P水平升高,這與本研究結(jié)果一致。為了探討S100P在乳腺癌中的預(yù)后價值,本研究采用KM Plotter在線繪圖工具進(jìn)行生存分析,結(jié)果發(fā)現(xiàn)S100P低表達(dá)組OS、RFS、DMFS、PPS均明顯高于S100P高表達(dá)組,提示S100P在乳腺癌中的高表達(dá)與預(yù)后不良相關(guān)。
為了進(jìn)一步探究S100P參與的分子調(diào)控網(wǎng)絡(luò),本研究通過LinkedOmics數(shù)據(jù)庫分析S100P共表達(dá)基因及GO功能富集分析、KEGG信號通路分析,發(fā)現(xiàn)與S100P表達(dá)正相關(guān)基因有3 207個,負(fù)相關(guān)基因有3 278個。GO功能富集分析結(jié)果顯示S100P主要表達(dá)于線粒體內(nèi)膜、囊泡腔等結(jié)構(gòu),主要參與糖基化、線粒體基因表達(dá)、粒細(xì)胞活化等生物學(xué)活動,并調(diào)節(jié)一些酶的活性。KEGG信號通路分析發(fā)現(xiàn)S100P主要參與蛋白酶體、IL-17信號通路、溶酶體等信號通路以及一些自身免疫病相關(guān)信號通路。蛋白酶體是泛素-蛋白酶體系統(tǒng)(ubiquitin–proteasome system,UPS)的重要組成部分,腫瘤細(xì)胞可上調(diào)UPS,對腫瘤抑制蛋白進(jìn)行降解,避免自身凋亡〔15〕。在IL-17介導(dǎo)的炎癥反應(yīng)中,一些炎癥介質(zhì)能刺激功能失調(diào)的髓樣細(xì)胞募集,形成利于血管生成和免疫抑制的腫瘤環(huán)境,從而促進(jìn)腫瘤的生長和轉(zhuǎn)移,IL-17通過多種機(jī)制參與腫瘤的早期形成階段,尤其是炎癥驅(qū)動的腫瘤類型〔16〕。S100P可能是UPS和IL-17通路的潛在靶點(diǎn)。
本研究通過STRING數(shù)據(jù)庫分析構(gòu)建了S100P蛋白質(zhì)相互作用網(wǎng)絡(luò),發(fā)現(xiàn)有19個蛋白與S100P存在相互作用,包括AGER、CACYBP、CAPZA1、EZR、FXYD3、IL-11、IQGAP1、MYH9、NUSAP1、OAZ1、RPS9、S100A1、S100B、S100PBP、S100Z、SAT1、SNRPF、SUGT1、TP53。這些蛋白中絕大多數(shù)與腫瘤相關(guān),但是否與S100P共同影響乳腺癌生物學(xué)特性,還有待進(jìn)一步研究與驗(yàn)證。
本研究基于多種生物信息學(xué)分析工具探討S100P基因在乳腺癌中的表達(dá)及意義。S100P基因在乳腺癌中高表達(dá),與乳腺癌淋巴結(jié)轉(zhuǎn)移相關(guān),并影響患者預(yù)后,且S100P與多種蛋白質(zhì)共同作用影響乳腺癌的生物學(xué)特性。S100P基因可能作為乳腺癌的潛在靶點(diǎn),具有一定預(yù)后價值。