蔣艷萍 秦 健 汪 璐 彭亞琴
乳腺癌是女性發(fā)生率最高的腫瘤,其發(fā)生率可達女性腫瘤總發(fā)生率的1/3[1]。近年來,由于社會大眾對疾病的警惕性提高,疾病早期診斷技術(shù)和治療技術(shù)的持續(xù)改進,乳腺癌的病死率已較20世紀(jì)末大大降低,且逐漸趨于平穩(wěn)[1]。乳腺癌早期被認(rèn)為是一種可以治愈的疾病,一旦發(fā)生轉(zhuǎn)移,患者的5年總生存率就會顯著下降[2]。骨組織是乳腺癌發(fā)生轉(zhuǎn)移最常見的部位,乳腺癌晚期骨轉(zhuǎn)移的發(fā)生率可高達65%~75%[3]。乳腺癌骨轉(zhuǎn)移通常伴有嚴(yán)重的并發(fā)癥,將引起患者骨痛、骨折及高鈣血癥等骨相關(guān)事件,嚴(yán)重影響患者的生活能力和質(zhì)量。骨轉(zhuǎn)移發(fā)生與否與乳腺癌的預(yù)后密切有關(guān),約有超過70%的乳腺癌患者死于骨轉(zhuǎn)移[4]。因此尋找乳腺癌骨轉(zhuǎn)移特異性的預(yù)測、治療靶標(biāo),對于乳腺癌骨轉(zhuǎn)移的早期診斷、預(yù)防及治療均有重要的意義。
本研究通過生物信息學(xué)方法探討乳腺癌復(fù)發(fā)骨轉(zhuǎn)移的相關(guān)基因和生物學(xué)信號通路,利用Gene Expression Omnibus (GEO)公共數(shù)據(jù)庫,篩選雌激素受體相關(guān)的乳腺癌復(fù)發(fā)骨轉(zhuǎn)移差異表達基因,并對其進行功能富集分析,并分析骨代謝相關(guān)基因的表達與雌激素受體表達和乳腺癌復(fù)發(fā)骨轉(zhuǎn)移的相關(guān)性,以進一步了解乳腺癌復(fù)發(fā)骨轉(zhuǎn)移的發(fā)生機制,以期為尋找乳腺癌骨轉(zhuǎn)移早期診斷指標(biāo)提供線索和依據(jù),促進乳腺癌骨轉(zhuǎn)移分子診斷、治療技術(shù)發(fā)展。
1.資料來源:在美國國立生物技術(shù)信息中心的GEO DataSets數(shù)據(jù)庫中以“breast cancer”和“bone metastasis”作為關(guān)鍵詞搜索,設(shè)置研究類型為“expression profiling by array”,設(shè)置種屬類型為“homo sapiens”。根據(jù)臨床信息及樣本量,選擇獲得具有雌激素受體表達臨床分型及骨復(fù)發(fā)轉(zhuǎn)移臨床信息,且含有286個乳腺癌樣本的乳腺癌數(shù)據(jù)集GSE2034[5]。根據(jù)GSE2034的臨床信息,該數(shù)據(jù)集共含107例乳腺癌復(fù)發(fā)樣本,其中ER臨床分子分型為陽性的80例,陰性的27例。
2.差異表達基因分析:利用R軟件GEOquery和limma軟件包下載GSE2034數(shù)據(jù)集并進行分析,對芯片數(shù)據(jù)進行l(wèi)og2均一化,并對差異表達分析結(jié)果進行FDR(false discovery rate)矯正。校正后的P值,即Padj.<0.05,表達水平相差的倍數(shù)>2為差異表達基因。
3.目的表達的獲得及相關(guān)性分析:本研究根據(jù)GSE2034芯片平臺信息,獲得ESR1(estrogen receptor 1)、SFRP1、TNFAIP3和NEK1相應(yīng)的探針信息。在GSE2034數(shù)據(jù)集中,ESR1的探針有217163_at、217190_x_at、205225_at、211233_x_at、211234_x_at、211235_s_at、215551_at和215552_s_at;SFRP1的探針有202035_s_at、202036_s_at和202037_s_at;TNFAIP3的探針有202643_s_at和202644_s_at;NEK1的探針有211086_x_at、213328_at和213331_s_at。對每個基因?qū)?yīng)的全部探針對應(yīng)的表達量值取平均值,代表該基因的表達水平進行復(fù)發(fā)骨轉(zhuǎn)移相關(guān)性、基因表達相關(guān)性分析。
4.基因富集分析(gene sets enrichment analysis,GSEA):采用 GSEA軟件對 GSE2034復(fù)發(fā)樣本進行了分析,按照ER的臨床分型分成ER陽性和ER陰性兩組,并在Molecular Signatures Database (MSigDB) 上下載基因集C5[6]:ontology gene sets作為參照基因集,此基因集共含15473種基因集,包括生物學(xué)過程、細(xì)胞組成成分和分子功能相關(guān)的基因集等。按default weighted enrichment statistics方法進行富集分析,隨機組合重復(fù)次數(shù)設(shè)置為1000次,FDR<25%且標(biāo)準(zhǔn)化的P<0.05的基因集定義為顯著富集的基因集。
1.雌激素受體的表達狀態(tài)與乳腺癌骨復(fù)發(fā)轉(zhuǎn)移有關(guān):乳腺癌數(shù)據(jù)集GSE2034,是共含有286例乳腺癌患者的腫瘤樣本的轉(zhuǎn)錄組芯片數(shù)據(jù),并含有雌激素受體(estrogen receptor,ER)表達的臨床分型、是否有復(fù)發(fā)以及是否為復(fù)發(fā)骨轉(zhuǎn)移等臨床信息。利用GSE2034數(shù)據(jù)集臨床信息,對乳腺癌樣本的ER臨床分型以及雌激素受體1(estrogen receptor 1,ESR1)的表達水平與復(fù)發(fā)骨轉(zhuǎn)移是否有關(guān)進行了χ2檢驗,結(jié)果顯示臨床分子分型為ER陽性的乳腺癌患者發(fā)生復(fù)發(fā)骨轉(zhuǎn)移的比例顯著高于ER陰性乳腺癌患者(P=0.0224)。此外,利用測序平臺的探針信息,筆者還對ESR1進行了分析,按其是否高于平均值分為高、低兩組,并對ESR1的表達水平與復(fù)發(fā)骨轉(zhuǎn)移進行了分析驗證,χ2檢驗的結(jié)果再次提示ESR1表達較高的乳腺癌患者發(fā)生復(fù)發(fā)骨轉(zhuǎn)移的比例顯著高于ESR1表達較低的患者(P=0.035,表1)。

表1 雌激素受體表達狀態(tài)與乳腺癌骨復(fù)發(fā)轉(zhuǎn)移的統(tǒng)計學(xué)分析(n)
2.ER有關(guān)的乳腺癌骨復(fù)發(fā)轉(zhuǎn)移相關(guān)差異表達基因的分析:利用R軟件limma軟件包,分別根據(jù)GSE2034數(shù)據(jù)集中復(fù)發(fā)樣本的ER臨床分子分型信息和復(fù)發(fā)骨轉(zhuǎn)移情況(骨復(fù)發(fā)轉(zhuǎn)移與非骨復(fù)發(fā)對比)的差異表達基因進行了分析。經(jīng)Benjamini &Hochberg矯正后,其表達差異有統(tǒng)計學(xué)意義(P<0.05),且表達水平的倍數(shù)差異>2的基因中,高表達于骨復(fù)發(fā)轉(zhuǎn)移樣本的基因共有30個(60%),也同時顯著高表達于ER陽性的復(fù)發(fā)樣本中。ER陽性復(fù)發(fā)樣本較ER陰性復(fù)發(fā)樣本高表達、骨復(fù)發(fā)轉(zhuǎn)移較非骨復(fù)發(fā)樣本差異表達基因的韋恩圖詳見圖1。同時顯著高或低表達于ER+復(fù)發(fā)樣本和骨復(fù)發(fā)轉(zhuǎn)移樣本的基因列表詳見表2。

圖1 復(fù)發(fā)乳腺癌ER表達狀態(tài)與骨復(fù)發(fā)轉(zhuǎn)移情況差異表達基因韋恩圖

表2 ER+復(fù)發(fā)樣本和骨復(fù)發(fā)轉(zhuǎn)移樣本的共有差異表達基因
3.GSEA分析:為了進一步探討雌激素受體與乳腺癌復(fù)發(fā)骨轉(zhuǎn)移的相關(guān)性及其可能的分子機制,筆者利用GSEA軟件對GSE2034數(shù)據(jù)集ER不同臨床分子分型的樣本進行了基因富集分析,以全面了解與乳腺癌復(fù)發(fā)樣本中與ER表達狀態(tài)相關(guān)的骨組織代謝相關(guān)的功能基因集。結(jié)果顯示,ER陰性乳腺癌復(fù)發(fā)樣本顯著富集了骨重構(gòu)負(fù)調(diào)節(jié)(negative regulation of bone remodeling)和骨吸收調(diào)控(regulation of bone resorption)相關(guān)的功能數(shù)據(jù)集;而ER陽性乳腺癌復(fù)發(fā)樣本顯著富集了脛骨發(fā)育不全(HP_Aplasia_Hypoplasia_of_the_Tibia)和四肢骨骼發(fā)育不全(aplasia involving bones of the extremities)相關(guān)的功能數(shù)據(jù)集(圖2和表3)。

圖2 GSEA分析顯示骨組織代謝有關(guān)的功能基因集

表3 骨組織代謝相關(guān)的功能基因集的GSEA分析結(jié)果
4.差異表達基因表達相關(guān)性:為了進一步探討ER相關(guān)的乳腺癌復(fù)發(fā)骨轉(zhuǎn)移的差異表達基因的表達特征,筆者對上述GSEA富集的骨發(fā)育、代謝相關(guān)通路中顯著富集基因的表達水平與乳腺癌復(fù)發(fā)骨轉(zhuǎn)移情況及與ESR1表達水平的相關(guān)性進行了分析。其中SFRP1和TNFAIP3均顯著富基于Negative_Regulation_of_Bone_Remodeling數(shù)據(jù)集,且其在骨復(fù)發(fā)組的表達水平顯著低于非骨復(fù)發(fā)組,其表達水平與ESR1的表達水平呈負(fù)相關(guān);NEK1顯著富集于Hp_Aplasia_Hypoplasia_of_the_Tibia數(shù)據(jù)集,且其在骨復(fù)發(fā)樣本的表達水平顯著高于非骨復(fù)發(fā)組,且其表達水平與ESR1的表達水平呈正相關(guān)(圖3)。

圖3 SFRP1、TNFAIP3和NEK1基因相對表達水平與乳腺癌骨復(fù)發(fā)轉(zhuǎn)移及ESR1表達水平的關(guān)聯(lián)A.SFRP1與骨復(fù)發(fā)轉(zhuǎn)移相關(guān)性;B.TNFAIP3與骨復(fù)發(fā)轉(zhuǎn)移相關(guān)性;C.NEK1與骨復(fù)發(fā)轉(zhuǎn)移相關(guān)性;D.SFRP1與ESR1表達水平的相關(guān)性;E.TNFAIP3與ESR1表達水平的相關(guān)性;F.NEK1與ESR1表達水平的相關(guān)性
乳腺癌是全球范圍最常見的腫瘤之一,也是女性致死率第2高的癌癥[7]。近年來,隨著人們對乳腺癌認(rèn)識的逐漸加深,早期診療技術(shù)的發(fā)展,促進了乳腺癌的診斷初篩和分子分型及治療,乳腺癌的病死率呈緩慢下降趨勢[1]。相較于乳腺癌本身,遠處轉(zhuǎn)移尤其是骨轉(zhuǎn)移是其更為重要的致死原因。因而尋找有助于預(yù)測乳腺癌骨轉(zhuǎn)移和判斷其預(yù)后的分子標(biāo)志物,對于乳腺癌的診斷和治療極具意義。
雌激素受體的表達水平與乳腺癌骨復(fù)發(fā)轉(zhuǎn)移有關(guān)。70%以上乳腺癌為雌激素受體陽性(ER+),即管腔型(luminal-like subtype)乳腺癌,其骨轉(zhuǎn)移的發(fā)生率是基底型(basal-like subtype)乳腺癌的2.5倍[8]。降低雌激素水平,或通過ER阻滯劑、ER調(diào)節(jié)劑等阻斷雌激素作用的內(nèi)分泌療法可以顯著降低乳腺癌復(fù)發(fā)[8]。根據(jù)數(shù)據(jù)集GSE2034的臨床資料,本研究首先對ER的臨床分子分型和芯片平臺中ESR1全部探針的表達情況與復(fù)發(fā)骨轉(zhuǎn)移進行了關(guān)聯(lián)分析。兩種分析結(jié)果均提示,ER表達水平較高的乳腺癌患者發(fā)生骨復(fù)發(fā)轉(zhuǎn)移的比例顯著高于ER表達水平較低的患者。與許多其他研究一致,本研究的這一結(jié)果進一步證實ER可能促進乳腺癌骨轉(zhuǎn)移,其表達水平的高低對乳腺癌患者是否發(fā)生骨復(fù)發(fā)轉(zhuǎn)移具有一定的提示作用。
GSEA可在基因組織水平根據(jù)數(shù)據(jù)分組,探尋其相關(guān)的生物功能、信號通路,展示相關(guān)基因在各組中的表達情況及其統(tǒng)計學(xué)意義,已被各種生物醫(yī)學(xué)大數(shù)據(jù)分析廣為應(yīng)用[6]。筆者利用GSEA軟件,根據(jù)ER的臨床分子分型對乳腺癌復(fù)發(fā)樣本進行了分析,結(jié)果顯示有4條與骨組織代謝、骨發(fā)育相關(guān)的基因功能集被顯著富集。GSEA結(jié)果提示ER的臨床分型與乳腺癌細(xì)胞中骨組織代謝相關(guān)基因的表達有關(guān)。
乳腺癌的骨轉(zhuǎn)移過程是乳腺癌細(xì)胞與骨微環(huán)境相互作用的一個復(fù)雜的演變過程。經(jīng)典的“種子與土壤”和“惡性循環(huán)”理論,形象地解釋了乳腺癌與骨微環(huán)境之間如何相互適應(yīng)、相互影響并共同完成乳腺癌在骨組織的定植、生長,形成骨轉(zhuǎn)移,并造成骨損傷的過程[9]。在這一過程中,除了人體骨組織微環(huán)境這個富含各種生長因子的“肥沃的土壤”外,乳腺癌細(xì)胞所合成并釋放的成骨分化、破骨分化相關(guān)的蛋白,可促進腫瘤細(xì)胞對骨穩(wěn)態(tài)的破壞,并最終導(dǎo)致骨損傷[10]。這些由乳腺癌細(xì)胞表達的骨相關(guān)蛋白對于乳腺癌骨轉(zhuǎn)移具有一定的指示作用。
為了尋找雌激素受體表達有關(guān)的乳腺癌復(fù)發(fā)骨轉(zhuǎn)移相關(guān)的基因,筆者對GSEA富集的數(shù)據(jù)集中顯著富集的基因的表達水平進行分析。其中SFRP1、TNFAIP3和NEK1均在骨復(fù)發(fā)和非骨復(fù)發(fā)乳腺癌樣本中差異表達,且其表達水平與雌激素受體的表達水平顯著相關(guān)。其中SFRP1和TNFAIP3顯著低表達于骨復(fù)發(fā)轉(zhuǎn)移組,且其表達水平與雌激素受體表達水平呈負(fù)相關(guān);NEK1顯著高表達于骨復(fù)發(fā)轉(zhuǎn)移組,且其表達水平與雌激素受體表達水平呈正相關(guān)。SFRP1(secreted frizzled-related protein 1)是Wnt信號通路的負(fù)向調(diào)控因子,在成骨細(xì)胞和骨髓間充質(zhì)肝細(xì)胞分化的過程中發(fā)揮重要的負(fù)向調(diào)控作用[11, 12]。TNFAIP3(tumor necrosis factor alpha-induced protein 3,A20)是NF-κB信號通路的負(fù)向調(diào)控因子,可通過負(fù)向調(diào)控該通路信號轉(zhuǎn)導(dǎo)抑制破骨細(xì)胞生成[13]。NEK1(NIMA-related kinases 1)是一種磷酸激酶,參與了初級纖毛的形成,其表達缺陷與骨組織發(fā)育障礙有關(guān)[14, 15]。GSE2034數(shù)據(jù)集的分析結(jié)果提示,SFRP1、TNFAIP3和NEK1是與雌激素受體表達水平相關(guān)的,可能參與了乳腺癌骨轉(zhuǎn)移復(fù)發(fā)的基因,可作為預(yù)測、治療乳腺癌骨轉(zhuǎn)移的分子標(biāo)志物。
尋找具有預(yù)測、診斷、治療價值的乳腺癌骨轉(zhuǎn)移分子標(biāo)志蛋白任重而道遠。本研究利用公用數(shù)據(jù)庫及多種生物信息學(xué)分析手段,對雌激素受體表達情況相關(guān)的乳腺癌復(fù)發(fā)骨轉(zhuǎn)移有關(guān)的生物學(xué)功能和基因進行了分析。乳腺癌具有高度異質(zhì)性,本研究分析所得的結(jié)果仍需大量的臨床樣本及生物實驗進行綜合驗證,旨在更準(zhǔn)確地了解乳腺癌骨轉(zhuǎn)移機制,并為預(yù)測和治療乳腺癌提供科學(xué)依據(jù)。