王世霞,楊艷芳,馬 寧,劉 君
(天津醫(yī)科大學腫瘤醫(yī)院乳腺腫瘤二科,國家腫瘤臨床醫(yī)學研究中心,乳腺癌防治教育部重點實驗室,天津市“腫瘤防治”重點實驗室,天津市惡性腫瘤臨床醫(yī)學研究中心,天津300060)
近年來,中國的乳腺癌發(fā)病率正在逐年增加[1]。在美國,乳腺癌是導致女性癌癥相關死亡的首要原因,也是最常見的腫瘤[2]。據文獻報道,乳腺癌中約有70%~80%表達雌激素受體(estrogen receptor,ER)[3-4]。內分泌治療是ER陽性乳腺癌的一線治療方案,能夠顯著降低ER陽性乳腺癌患者的死亡率及復發(fā)轉移風險。然而,臨床上發(fā)現約50%的ER陽性乳腺癌對內分泌治療表現出固有耐藥,而對他莫昔芬(Tamoxifen,TAM)治療有反應的患者中約30%~40%發(fā)展為獲得性耐藥。TAM耐藥的機制與許多因素有關,如原癌基因的激活,抑癌基因的失活,ER表達的改變,共調節(jié)蛋白的改變以及生長因子信號通路的影響等[5]。因此,TAM耐藥的現象依然是臨床診療中的難題。
隨著人類基因組計劃的啟動和開展,促進了生物信息學的興起和迅猛發(fā)展。目前生物信息學已廣泛應用于生命科學各個領域的研究,其在醫(yī)學研究領域的地位也越來越重要。它在疾病基因篩查和診斷、生物相關實驗設計和蛋白質組學等領域發(fā)揮了不可替代的作用,例如利用生物信息學工具已發(fā)現與肥胖、高血壓、糖尿病、腫瘤等疾病相關的致病基因,為疾病診斷及治療提供方向[6]。另外,在遺傳病監(jiān)測、腫瘤鑒別等領域,基因診斷技術得到廣泛應用;功能基因組學和蛋白質組學等為腫瘤發(fā)病機制的研究、靶向藥物的篩選和研發(fā)提供了新的思路和理論基礎。充分并有效地利用生物信息學工具,如數據庫、軟件等,無論是從分子水平的角度進行闡述病因,還是對疾病的診斷、治療、預防與藥物研發(fā)都將產生強大的推動作用。本研究中應用生物信息學技術及工具,利用共享數據資源分析TAM耐藥乳腺癌的基因表達譜并篩選TAM耐藥和TAM敏感乳腺癌之間的差異表達基因(differentially expressed genes,DEGs),同時構建DEGs編碼的蛋白質間的相互作用(protein-protein interaction,PPI)網絡,分析并發(fā)掘潛在的與TAM耐藥相關的基因,為進一步深入研究TAM耐藥的機制提供新的線索,尋找ER陽性乳腺癌TAM耐藥潛在的新的治療靶點。
1.1 材料 本研究使用GEO數據庫(Gene Expression Omnibus,http://www.ncbi.nlm.nih.gov/geo/)中由Elias D等提交的mRNA表達譜數據(登錄號GSE67916)[7],由 GPL570 芯片平臺產生(Affymetrix Human Genome U133 Plus 2.0 Array;Affymetrix,Inc.,Santa Clara,CA,USA)。該芯片平臺包含人類基因組47 000多個轉錄本,4 895個序列,138 052個樣本。其芯片數據庫來源于Gen Bank、db EST和Ref Seq。GSE67916中18例樣本均來自于ER陽性乳腺癌患者,包括 4株TAM耐藥細胞系TamR1、TamR4、TamR7、TamR8和1株TAM敏感的細胞系MCF7/S0.5,其中TamR1和TamR4各有3個生物學重復以及TamR7和TamR8各有兩個生物學重復;MCF7/S0.58個生物重復。經RNA提取、擴增和逆轉錄等步驟,最后與Affymetrix Human Genome U133 Plus 2.0芯片雜交、標準化處理等得到并上傳GEO數據庫。本研究采用10例TAM耐藥(登錄號GSM1658401~GSM1658410)和 8例TAM 敏感(登錄號GSM1658411~GSM1658418)乳腺癌樣本。
1.2 方法
1.2.1 數據處理及差異表達 利用GEO2R在線工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/)對 數 據進行處理和分析。按照差異表達倍數絕對值>1.5,P<0.01的標準篩選TAM耐藥和TAM敏感樣本之間的DEGs。
1.2.2 GO功能及KEGG通路富集分析 基因本體論(GO)由Gene Ontology聯(lián)合會系統(tǒng)地整理,是一套層次型的基因功能注釋和分類系統(tǒng),旨在方便地查詢和更新的基因功能注釋信息[8]。KEGG(Kyoto Encyclopedia of Genes and Genomes)數據庫可以快速的查找基因參與的信號通路[9]。使用在線軟件 DAVID(版本 6.8,http://david.abcc.ncifcrf.gov)中GO功能和KEGG通路富集分析模塊對篩選的DEGs進行分析,納入標準為P<0.05。
1.2.3 構建蛋白—蛋白相互作用網絡(PPI網絡) STRING在線工具收集了多種蛋白質-蛋白質間功能互作的信息[10],利用該工具對DEGs的蛋白—蛋白相互作用網絡進行構建并分析;使用Cytoscape軟件[11]對DEGs的PPI網絡進行繪制,篩選關鍵節(jié)點基因(degree>20);同時應用Cytoscape的MCODE插件鑒定及分析成員間顯著緊密連接的子網絡。
2.1 差異表達基因的篩選 根據設定的條件參數(差異表達倍數絕對值>1.5,P<0.01)共篩選出438個顯著差異基因,其中上調差異基因300個,下調差異基因138個。
2.2 差異表達基因的GO功能富集分析 利用DAVID對上調及下調差異基因所參與的分子功能、生物過程和細胞成分進行分析。其中上調基因參與的主要分子功能(MF)有:蛋白質結合、poly(A)RNA結合、轉錄因子結合等;生物過程(BP)有:蛋白質轉運、轉錄負調節(jié)、DNA模板化等;細胞成分(CC)有:細胞質、細胞質的核周區(qū)、細胞膜等。下調基因參與的主要分子功能(MF)有:蛋白質結合,激酶活性,細胞粘附的鈣粘蛋白結合等;生物過程(BP)有:細胞對雌二醇刺激的反應,轉錄的正調控,DNA模板化和干擾素γ介導的信號傳導途徑等;細胞成分(CC)有:質膜、胞外外泌體、細胞質等。
2.3 上調及下調差異基因的KEGG通路富集分析 通過DAVID分析,上調差異基因主要集中在白細胞跨內皮遷移,溶酶體和RIG-I樣受體信號傳導通路等,下調差異基因主要集中在:病毒致癌作用,甲狀腺激素信號通路,調節(jié)干細胞多能性信號通路和HIF-1信號通路等(圖1)。
圖1 上調及下調差異基因的KEGG通路富集分析Fig 1 KEGG pathway analysis for up-regulatedand downregulated genes
2.4 PPI網絡分析 基于STRING的數據分析共發(fā)現629組蛋白間的相互作用關系,PPI網絡由288個節(jié)點和 629個邊緣組成,其中 MAPK1、ESR1、SMARCA4、RANBP2、PRKCA 編碼的蛋白與其他超過20個蛋白之間存在相互作用關系(degree>20),是PPI網絡中的關鍵蛋白(圖2)。利用Scytoscape軟件的MCODE插件共分析出兩個子網(子網1和子網2)(圖3),關鍵節(jié)點蛋白同時包含在子網絡中。
圖2 差異表達基因的蛋白—蛋白相互作用網絡圖Fig2 Protein-protein interaction network of differentially expressed genes
2.5 子網絡的GO功能和KEGG通路富集分析 利用DAVID對兩個子網絡進行GO功能和KEGG通路富集分析發(fā)現,子網絡1主要與蛋白質結合、DNA結合、核質、免疫應答、轉錄正調節(jié)、DNA模板化相關,主要通路富集在病毒致癌作用等(圖4)。子網絡2主要與細胞核、細胞外外泌體、蛋白質和DNA的結合等功能有關(圖5)。此外,子網2中最主要的通路富集是MAPK信號通路(圖5)。
圖4子網絡1的GO功能和KEGG通路富集分析Fig 4 GO and KEGG pathway analysis for genes in sub-network 1
圖5 子網絡1的GO功能和KEGG通路富集分析Fig 5 GO and KEGG pathway analysis for genes in sub-network 1
隨著生物信息學的發(fā)展與應用,TAM耐藥機制在基因水平方面的研究已取得重大進展。許多基因已被證實與TAM耐藥相關,如乳腺癌擴增性抗原1(AIB1),50%以上的乳腺癌組織中存在AIB1的過表達。已有研究證明AIB1基因與TAM耐藥相關,在TAM耐藥細胞BT474中敲除AIB1基因,可恢復對TAM的敏感性[12]。作為一種分泌蛋白,前梯度蛋白2(AGR2)是蛋白質二硫鍵異構酶(PDI)家族的成員。TAM能刺激AGR2高表達,同時AGR2在TAM耐藥中也發(fā)揮重要作用[13]。人表皮生長因子受體2(HER2)和G蛋白偶聯(lián)型雌激素受體(GPER)被證明也與TAM耐藥相關[14-15]。另外,TAM耐藥的機制也與一些信號通路有關,如HER2酪氨酸激酶信號通路、PI3K信號通路[5]。
在ER陽性乳腺癌患者中,雖然TAM治療已成為一線治療方案,但其發(fā)生耐藥的現象也越來越普遍。目前對于TAM耐藥乳腺癌的發(fā)生和發(fā)展機制仍不清楚,因此TAM耐藥乳腺癌的治療不僅是目前臨床治療的難點,也是基礎與臨床研究的熱點。發(fā)掘TAM耐藥乳腺癌的新型治療靶點顯得尤為重要。本研究利用生物信息學技術,共挖掘出438個顯著差異基因,其中上調表達基因300個,下調表達基因138個。對這些差異基因進行GO功能及KEGG通路富集分析示這些差異基因主要參與蛋白質結合及免疫應答等功能,同時也參與MAPK信號通路和HIF-1信號通路等。利用生物信息學工具對PPI網絡分析結果顯示蛋白間的相互作用主要集中在 MAPK1、ESR1、SMARCA4、RANBP2 和 PRKCA等節(jié)點基因。
MAPK1突變與多種癌癥相關,如乳腺癌、前列腺癌和卵巢癌[16-18]。已有研究證明MAPK1超活化與TAM耐藥有關[19],如活化的MAPK1通過促進ERα(雌激素受體α)磷酸化使ERα的配體非依賴性轉錄增加,且過度活化的MAPK通過NF-κB依賴性途徑下調ERα的表達,從而引起TAM耐藥[20]。本研究結果顯示MAPK1位于PPI網絡中的關鍵節(jié)點,臨床中應用MAPK1抑制劑聯(lián)合TAM治療ER陽性乳腺癌可能會提高患者的治療效果。
SMARCA4又稱為BRG1,是編碼SWI/SNF染色質重塑復合物的核心蛋白。其控制許多細胞過程,如DNA修復、參與細胞周期等[21]。BRG1的表達與三陰性乳腺癌的增殖及預后相關,BRG1高表達者預后較差[22]。此外,有研究表明BRG1通過JNK1通路誘導在雌激素應答啟動子中聚集,參與雌激素拮抗劑介導的乳腺癌細胞生長停滯的過程[23]。然而,關于BRG1與TAM耐藥的關系卻鮮有報道。本研究結果表明SMARCA4基因在TAM耐藥乳腺癌中表達升高且在PPI網絡中屬于中心蛋白,顯示SMARCA4基因可能與TAM耐藥相關。因此對SMARCA4基因的進一步研究可能為治療TAM耐藥的ER陽性乳腺癌找到新的潛在靶點。
ESR1是編碼雌激素受體α(ERα)的基因,屬于核受體家族的配體依賴性轉錄因子,在內分泌治療中發(fā)揮關鍵作用[24]。研究表明ER表達下調或功能的喪失可能對TAM產生耐藥[25]。ER突變引起的配體非依賴性轉錄介導癌細胞的增殖并引起TAM耐藥[25]。本研究顯示ESR1在TAM耐藥樣本中表達下降,和KIM等[26]的報道相似,ESR1基因表達下降使TAM藥物缺乏結合靶點,導致部分ER陽性乳腺癌患者治療效果較差,成為臨床上的一大治療難點。進一步對ESR1基因表達下調機制的研究,將有助于改善TAM耐藥乳腺癌的治療。PRKCA(蛋白激酶Cα)在不同的細胞過程中發(fā)揮重要作用,如細胞增殖、凋亡及分化等[27]。Kim等[28]的研究表明PKC-α介導乳腺癌細胞的侵襲和遷移。另有研究顯示在TAM乳腺癌中PKC-α磷酸化水平顯著增加,PKC-α通過抑制c-Jun磷酸化來抑制ER-α的表達[26]。這些數據暗示PKC-α是TAM耐藥乳腺癌的潛在生物標志物。本研究結果顯示PRKCA是關鍵節(jié)點基因,以PRKCA為靶點治療TAM耐藥乳腺癌將有廣闊的臨床研究前景。
Ran結合蛋白2(RANBP2)是核漿-胞質運輸的調節(jié)因子[29],編碼具有358-kDa的在有絲分裂等功能中起作用的核孔蛋白[30]。該基因與一些致瘤通路有關,例如間接參與P53和PI3K/Akt信號通路[31-32]。PI3K/Akt信號通路的激活與TAM繼發(fā)性耐藥相關。RANBP2可能通過干擾PI3K/Akt信號通路引起乳腺癌細胞對TAM產生耐藥。目前關于RANBP2與TAM耐藥機制的相關研究鮮有報道。本研究顯示RANBP2在TAM耐藥乳腺癌中過度表達,RANBP2的過表達可能直接或間接參與TAM耐藥。進一步加深RANBP2在TAM耐藥機制中的研究,為TAM耐藥的ER陽性乳腺癌尋找更多的治療選擇。
通過生物信息學分析差異基因的GO功能及富集通路主要參與蛋白質結合、poly(A)RNA結合、轉錄因子結合、蛋白質轉運、轉錄負調節(jié)、DNA模板化、細胞粘附的鈣粘蛋白結合、轉錄的正調控、RIG-I樣受體信號傳導通路、HIF-1信號通路、MAPK信號通路等分子生物功能及信號通路。缺氧誘導因子(HIF-1)是腫瘤增殖及遷移等過程中的關鍵轉錄因子,HIF-1信號通路已被證實與多種癌癥相關,如肝癌、結直腸癌等。HIF-1與MAPK/ERK通路相互作用,促進腫瘤的生長及增殖。但尚未有關于HIF-1信號通路與TAM耐藥相關的研究和報道,進一步進行相關實驗研究HIF-1信號通路的作用將有助于揭示ER陽性乳腺癌TAM耐藥機制。
利用生物信息學方法有效發(fā)掘差異表達基因的相互作用信息,通過對差異基因的功能及參與的信號通路進一步研究,為TAM耐藥的ER陽性乳腺癌的早期診斷及治療靶點選擇提供了新的線索,也為后期繼續(xù)研究來驗證這些潛在的治療方法提供了方向。