龔俊杰,王 平,徐子金
1)浙江工業(yè)大學(xué)藥學(xué)院,浙江杭州310014;2)義烏市中心醫(yī)院藥劑科,浙江義烏322099
世界衛(wèi)生組織國際癌癥研究機(jī)構(gòu)(international agency for research on cancer, IARC)發(fā)布的全球最新癌癥負(fù)擔(dān)數(shù)據(jù)表明,2020年全球乳腺癌新發(fā)病例高達(dá)226萬例,超過了肺癌(220萬例),成為全球第一大癌,發(fā)病形勢(shì)日趨嚴(yán)峻.三陰性乳腺癌(triple negative breast cancer, TNBC)約占所有乳腺癌的15%,轉(zhuǎn)移性TNBC患者的中位總生存期僅約為18個(gè)月.由于其病理學(xué)特征呈現(xiàn)雌激素受體(estrogen receptor, ER)、孕激素受體(progesterone receptor, PR)和人類表皮生長因子受體2(human epidermal growth factor receptor 2, HER-2)均為陰性,具有高度異質(zhì)性和侵襲性,是最致命的乳腺癌亞型[1].目前,對(duì)TNBC仍缺乏有效的治療手段,化學(xué)療法是主要的輔助治療方法,但易使患者產(chǎn)生耐藥性[2].對(duì)ER陽性的乳腺癌,西達(dá)本胺能夠逆轉(zhuǎn)內(nèi)分泌藥物治療的耐藥性,從而提高他莫昔芬等的抗乳腺癌活性,但是,TNBC患者因ER檢測(cè)結(jié)果為陰性,一般的化療藥物難以在此類乳腺癌中發(fā)揮作用[3],因此,TNBC的治療手段十分受限,且療效不佳.尋找與TNBC病變相關(guān)的生物標(biāo)志物,并由此挖掘新型的TNBC診療靶標(biāo)具有重要的臨床應(yīng)用意義.
轉(zhuǎn)錄組測(cè)序是了解特定條件下細(xì)胞中核糖核酸(ribonucleic acid, RNA)分子的類型和豐度的重要檢測(cè)手段[4],現(xiàn)已經(jīng)推廣應(yīng)用于多種RNA層面的基礎(chǔ)與臨床研究.比如,單細(xì)胞基因表達(dá)、RNA翻譯和RNA結(jié)構(gòu)組學(xué)等[5].基于轉(zhuǎn)錄組測(cè)序獲得的表達(dá)譜數(shù)據(jù)進(jìn)行生物信息學(xué)分析,旨在對(duì)復(fù)雜的高維數(shù)據(jù)進(jìn)行分析,進(jìn)而挖掘與疾病相關(guān)的關(guān)鍵基因和通路,揭示其在疾病發(fā)生和發(fā)展過程中基因的轉(zhuǎn)錄水平的變化規(guī)律,從而解析疾病所涉及的分子病理機(jī)制和診療靶標(biāo).
生物體系統(tǒng)的復(fù)雜性決定了轉(zhuǎn)錄組數(shù)據(jù)的高維性和龐大性.加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene coexpression network analysis, WGCNA)是除轉(zhuǎn)錄組常規(guī)分析外又一從復(fù)雜轉(zhuǎn)錄組數(shù)據(jù)中挖掘有效信息的重要方法,在疾病診斷和發(fā)病機(jī)制等生物醫(yī)學(xué)研究中有廣泛應(yīng)用[6].基于表達(dá)模式相似的基因在功能上可能是緊密相關(guān)的以及生物體內(nèi)蛋白質(zhì)互作網(wǎng)絡(luò)呈現(xiàn)無尺度化分布規(guī)律的兩大基本生物學(xué)原理,通過WGCNA分析可鑒定表達(dá)模式高度相關(guān)的基因簇,提取與表型性狀相關(guān)的基因共表達(dá)模塊,將基因的表達(dá)模式與生物表型進(jìn)行關(guān)聯(lián),有助于關(guān)注到與性狀相關(guān)性較大的基因模塊,構(gòu)建基因模塊的共表達(dá)網(wǎng)絡(luò),挖掘模塊內(nèi)關(guān)鍵基因.將該分析結(jié)果與轉(zhuǎn)錄組常規(guī)分析的結(jié)果進(jìn)行比較或結(jié)合,可為關(guān)鍵基因的確立提供證據(jù).
本研究利用公共基因表達(dá)譜(gene expression omnibus, GEO)數(shù)據(jù)庫的TNBC相關(guān)基因子集GSE76275和GSE61724,借助轉(zhuǎn)錄組學(xué)分析方法,探究TNBC新型病理標(biāo)志物,預(yù)測(cè)TNBC潛在的診療與干預(yù)靶標(biāo).
從GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi)檢索TNBC相關(guān)轉(zhuǎn)錄組表達(dá)譜基因集, 選擇標(biāo)準(zhǔn)為: ① TNBC和非TNBC基因集;② 入組分析的樣本未經(jīng)藥物干預(yù)和轉(zhuǎn)基因等處理;③ 基因集對(duì)應(yīng)的物種為智人(Homo sapiens);④ 基因集每組樣本數(shù)至少為15個(gè);⑤ 轉(zhuǎn)錄組數(shù)據(jù)分析集和驗(yàn)證集所使用芯片為同一家公司開發(fā)的芯片.最終選定GSE76275和GSE61724兩套基因表達(dá)數(shù)據(jù)集作為本次轉(zhuǎn)錄組分析研究的數(shù)據(jù).GSE76275數(shù)據(jù)集包含198個(gè)TNBC樣本和67個(gè)非TNBC樣本.非TNBC指除病理檢測(cè)表型為三陰性以外的其他類型乳腺癌,本研究作為TNBC的對(duì)照樣本.基因芯片型號(hào)是Affymetrix公司的人類基因組U133 plus 2.0芯片.另外,GSE61724數(shù)據(jù)集作為分析得到的關(guān)鍵基因的驗(yàn)證基因集,包含16個(gè)TNBC 樣本和48個(gè)非TNBC樣本.基因芯片型號(hào)是Affymetrix公司的人類基因組1.0 ST芯片.
利用R軟件(x64 4.0.2)中的FactoMineR包實(shí)現(xiàn)主成分分析(principal component analysis,PCA).文中提到的R包均來自于Bioconductor數(shù)據(jù)庫.
基因芯片數(shù)據(jù)運(yùn)用R軟件中的Limma包進(jìn)行差異基因分析,差異表達(dá)基因分析篩選標(biāo)準(zhǔn): lbF>1或lbF<-1,P′<0.05. 其中,F(xiàn)為差異倍數(shù)(fold change, FC),P′為校正后的P值. 本研究以TNBC為實(shí)驗(yàn)組(T),非TNBC為對(duì)照組(NT),比較實(shí)驗(yàn)組與對(duì)照組的基因表達(dá)水平的變化.
基因本體(gene ontology, GO)功能富集分析是一個(gè)在生物信息學(xué)領(lǐng)域中廣泛使用的研究方法, 京都基因和基因組百科全書(kyoto encyclopedia of genes and genomes, KEGG)是一個(gè)預(yù)測(cè)細(xì)胞中復(fù)雜信號(hào)通路的數(shù)據(jù)庫,通過GO功能富集和KEGG通路富集,可獲得與某一表型改變相關(guān)的病理生理功能的基因集合.因此,將差異基因與背景基因作比較,通過統(tǒng)計(jì)學(xué)方法識(shí)別顯著富集的基因集合,能夠在一定程度上了解是哪些基因功能或信號(hào)通路的改變可能涉及臨床表型的改變,從而為疾病發(fā)生機(jī)制的分子調(diào)控提供研究思路.通過對(duì)Bioconductor數(shù)據(jù)庫中的Clusterprofile包進(jìn)行GO功能富集和KEGG通路富集, 當(dāng)P<0.05時(shí),認(rèn)為富集具有顯著性.
Metascape數(shù)據(jù)庫(http://metascape.org)是一個(gè)功能強(qiáng)大的基因功能注釋工具,可同時(shí)對(duì)GO和KEGG進(jìn)行功能注釋[7].在對(duì)差異表達(dá)基因和WGNCA共表達(dá)基因模塊的交集基因的功能注釋中,本研究使用Metascape數(shù)據(jù)庫進(jìn)行富集.以柱狀圖形式展示富集顯著性排名前20的GO或KEGG條目,當(dāng)-lgP>1.3時(shí),認(rèn)為富集是顯著的.
利用STRING在線數(shù)據(jù)庫(https://string-db.org/)構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò)(protein-protein interaction,PPI),以預(yù)測(cè)蛋白質(zhì)之間的相互作用關(guān)系,置信度設(shè)置為0.70,并統(tǒng)計(jì)排名靠前的節(jié)點(diǎn)度值.
利用R軟件中的WGCNA包執(zhí)行該分析方法.通過Cytoscape3.7.2軟件構(gòu)建基因共表達(dá)網(wǎng)絡(luò).
利用PCA方法評(píng)價(jià)GSE76275數(shù)據(jù)集樣本組間和組內(nèi)的分布情況,結(jié)果如圖1.由圖1可見,兩組樣本具有組內(nèi)聚集,組間分散的分布特點(diǎn),樣本的辨識(shí)度較好,具有后續(xù)分析的價(jià)值.
圖1 三陰性和非三陰性樣本組主成分分析Fig.1 Principal component analysis of triple negative and non-triple negative sample groups
圖2 差異表達(dá)基因火山圖Fig.2 Volcano map of differentially expressed genes
通過差異基因篩選共得到與TNBC病變相關(guān)的差異表達(dá)基因306個(gè),如圖2.其中,123個(gè)是上調(diào)基因,183個(gè)是下調(diào)基因.請(qǐng)掃描文末右下角二維碼查看圖S1,圖S1給出了306個(gè)差異基因表達(dá)值熱圖的聚類分析,這些差異基因?qū)N和NTN兩種乳腺癌病理表型具有較高的辨識(shí)度,提示部分基因表達(dá)模式的改變與乳腺癌不同病理分型的形成具有相關(guān)性.通過對(duì)這部分差異基因的富集分析,可為研究介導(dǎo)乳腺癌亞型病理分型上差異的潛在分子機(jī)制提供線索.
對(duì)306個(gè)在TNBC和非TNBC中差異表達(dá)的基因進(jìn)行GO功能注釋, 富集結(jié)果如圖3, 圖內(nèi)顏色越深表示此GO 功能富集越顯著,圓圈越大表示此GO 功能富集到的基因數(shù)越多.由圖3可知,表皮細(xì)胞形成和分化、皮膚形成和皮膚角質(zhì)化等生物學(xué)過程顯著富集.頂端漿細(xì)胞膜、中間絲和著絲粒等相關(guān)細(xì)胞成分顯著富集.轉(zhuǎn)錄激活因子結(jié)合活性、芳香化酶活性、N-乙酰氨基半乳糖轉(zhuǎn)移酶活性、肌營養(yǎng)不良蛋白聚糖結(jié)合等分子功能富集顯著.KEGG通路富集結(jié)果如圖4,由圖4可知,雌激素信號(hào)通路和過氧化物酶體增殖物激活受體(peroxisome proliferators-activated receptors, PPARs)信號(hào)通路被顯著富集.以上的結(jié)果提示,這些功能或通路的改變可能和TNBC的快速增殖、侵襲轉(zhuǎn)移等腫瘤的生物學(xué)特性相關(guān).
圖3 GO功能注釋Fig.3 GO functional annotation
圖4 KEGG通路富集分析Fig.4 KEGG pathway enrichment analysis
2.4.1 樣本評(píng)價(jià)
基因芯片數(shù)據(jù)包含幾萬個(gè)探針對(duì)基因表達(dá)水平的檢測(cè)結(jié)果,而其中表達(dá)水平顯著變化的基因相比基因總數(shù)來說總是少數(shù),為減少運(yùn)算量和提高數(shù)據(jù)分析的效率,可以著重關(guān)注在所有基因中變異相對(duì)較大的基因[8],挑選GSE76275數(shù)據(jù)集中方差較大的前25%的基因(5 414個(gè))表達(dá)譜進(jìn)行后續(xù)的WGCNA分析.首先對(duì)265個(gè)樣本進(jìn)行初步層次聚類分析.剔除8個(gè)離群樣本,樣本的具體信息和樣本層次聚類樹結(jié)果請(qǐng)掃描文末右下角二維碼查看補(bǔ)充材料圖S2和圖S3.
2.4.2 軟閾值篩選
軟閾值的作用是將基因間的強(qiáng)弱相關(guān)性放大,使基因共表達(dá)網(wǎng)絡(luò)更符合無尺度化的分布規(guī)律,從而使其更貼近生物體系統(tǒng)的基因調(diào)控規(guī)律.最佳軟閾值的篩選應(yīng)同時(shí)滿足:① 無標(biāo)度拓樸模型擬合參數(shù)R2≥0.8; ② 不同模塊中基因的平均連接度應(yīng)比較高.綜合考慮,本研究采用程序執(zhí)行時(shí)自動(dòng)篩選的6作為最佳軟閾值(請(qǐng)掃描文末右下角二維碼查看補(bǔ)充材料圖S4),此時(shí)R2=0.87, 平均連通度為9.
2.4.3 基因模塊層次聚類樹
通過動(dòng)態(tài)剪切樹算法識(shí)別基因模塊,模塊內(nèi)最少的基因數(shù)目設(shè)置為30,共有5 414個(gè)基因被分成了19個(gè)顏色不同的模塊(請(qǐng)掃描文末右下角二維碼查看補(bǔ)充材料圖S5).將整個(gè)模塊的基因表達(dá)譜通過主成分降維的方法進(jìn)行特征提取,將表達(dá)譜的二維矩陣轉(zhuǎn)化為一維向量,后者類似于模塊內(nèi)基因表達(dá)譜矩陣降維后的第1主成分,用module eigengenes (ME)表示,以抽象方式提取了模塊內(nèi)基因整體上的表達(dá)特征,據(jù)此計(jì)算相關(guān)性并進(jìn)行聚類,合并相關(guān)性大于0.8的模塊(請(qǐng)掃描文末右下角二維碼查看補(bǔ)充材料圖S6).合并后模塊數(shù)減少至15個(gè),不同顏色代表不同的基因模塊,最大的模塊是包含1 565個(gè)基因的紫色模塊,最小的模塊是僅有32個(gè)基因的淺綠色模塊,如圖5.
圖5 相似基因模塊合并Fig.5 Similar gene module merging
2.4.4 模塊與表型關(guān)聯(lián)分析
樣本表型可轉(zhuǎn)化為連續(xù)的數(shù)值型變量.基因作為溝通模塊和表型的“橋梁”,計(jì)算模塊與基因、表型與基因的相關(guān)性,繼而得到模塊-表型相關(guān)性熱圖,識(shí)別與表型顯著相關(guān)的模塊(圖6).由圖6可見,棕色模塊與乳腺癌的三陰性表型相對(duì)有最顯著的相關(guān)性(P<0.05). 故后續(xù)對(duì)棕色模塊內(nèi)的基因做進(jìn)一步分析.
圖6 模塊-表型關(guān)聯(lián)(括號(hào)內(nèi)數(shù)值為P值)Fig.6 Module-phenotype association(The numbers in parentheses are P values.)
2.4.5 模塊基因特征值與基因顯著性的相關(guān)性分析
圖7 棕色模塊中MM-GS的相關(guān)性Fig.7 MM-GS correlation in brown module
模塊內(nèi)每一個(gè)基因與模塊特征建立的相關(guān)性由 MM(module membership)值表示,MM值越大,表示模塊內(nèi)的基因與模塊的相關(guān)性越大.GS(gene significance)值表示某基因與表型的相關(guān)性,該值越大的基因與表型越相關(guān),該基因反映的生物學(xué)意義越大.因此,通過基因作為“橋梁”可將模塊與表型的相關(guān)性聯(lián)系起來.圖7呈現(xiàn)的是棕色模塊內(nèi)所有基因?qū)?yīng)的MM值和|GS|值,1個(gè)圓圈表示1個(gè)基因.兩者呈較強(qiáng)的正相關(guān)性,相關(guān)系數(shù)達(dá)到0.78,一般地,圖中越靠近右上角的基因與表型和模塊的相關(guān)性越大,即這些基因在模塊特征提取時(shí)的貢獻(xiàn)度越大,提示這部分基因在乳腺癌的發(fā)生與發(fā)展過程中可能扮演更重要的角色.TANG等[8]把符合MM>0.8和|GS|>0.2的基因作為核心基因.基因與基因之間的表達(dá)具有相關(guān)性,即共表達(dá)關(guān)系,WGCNA通過取冪加權(quán)的方式更好的刻畫了這種關(guān)系.圖8是對(duì)棕色模塊內(nèi)權(quán)重相對(duì)較大的部分共表達(dá)基因?qū)M(jìn)行展示,網(wǎng)絡(luò)中節(jié)點(diǎn)連線代表兩基因間有共表達(dá)關(guān)系, 粗細(xì)代表權(quán)重的大小, 權(quán)重越大,基因間的相關(guān)性越大.模塊內(nèi)連接度(intramodular connectivity, IC)衡量給定基因相對(duì)于特定模塊的基因的連接或共表達(dá)程度,該值越大表示某基因在共表達(dá)網(wǎng)絡(luò)中的地位越重要,在網(wǎng)絡(luò)中可能協(xié)同多個(gè)基因表達(dá),并以此作為某一生物學(xué)功能或通路的關(guān)鍵調(diào)控基因. 圖8為棕色模塊的部分共表達(dá)網(wǎng)絡(luò),由圖8可知,AGR3、MLPH、TBC1D9、AGR2、FOXA1和TFF1等基因具有較大的模塊內(nèi)連通度.分析可知,這些基因與所在的模塊和所屬的表型均具有顯著相關(guān)性,其IC值、MM值和|GS| 值如表1,是WGCNA分析得到的重要基因.
表1 棕色模塊共表達(dá)基因的相關(guān)參數(shù)
圖8 棕色模塊的部分共表達(dá)網(wǎng)絡(luò)Fig.8 A part of co-expression network in brown module
2.4.6 棕色模塊的差異共表達(dá)基因分析
將棕色模塊內(nèi)的618個(gè)基因與306個(gè)差異基因取交集,得到141個(gè)差異的共表達(dá)基因,這些基因的表達(dá)特征不僅對(duì)乳腺癌的病理表型具有較好的辨識(shí)度,而且可能作為模塊的共表達(dá)基因協(xié)同介導(dǎo)某種生物學(xué)功能或通路執(zhí)行.通過Metascape數(shù)據(jù)庫的富集分析表明,顯著富集的基因本體是細(xì)胞內(nèi)雌激素受體的正向調(diào)節(jié)和乳腺上皮細(xì)胞的生長發(fā)育,相關(guān)信號(hào)通路與2.3節(jié)富集結(jié)果一定程度上吻合,進(jìn)一步提示乳腺癌的病理分型的形成可能涉及乳腺表皮或上皮細(xì)胞的增殖,以及性激素的相關(guān)調(diào)節(jié)等(圖9).通過STRING數(shù)據(jù)庫預(yù)測(cè)114個(gè)基因的蛋白相互作用關(guān)系網(wǎng)絡(luò),結(jié)果見圖10.網(wǎng)絡(luò)度值排名前12的節(jié)點(diǎn)見圖11.一般認(rèn)為,在蛋白互作網(wǎng)絡(luò)中具有較大網(wǎng)絡(luò)度值的基因?yàn)楹诵幕颍@些基因可能對(duì)某一生物學(xué)功能的執(zhí)行處于中心的調(diào)控地位.值得注意的是,結(jié)合前面的基因共表達(dá)網(wǎng)絡(luò)分析的結(jié)果,本研究發(fā)現(xiàn),三葉形因子1(trefoil factor1,TFF1)、叉頭盒 A1轉(zhuǎn)錄因子(forkhead box A1,F(xiàn)OXA1)、人前梯度蛋白2(anterior gradient protein 2,AGR2)和人前梯度蛋白3(anterior gradient protein 3, AGR3)這4個(gè)蛋白不僅在蛋白互作網(wǎng)絡(luò)度值較大而處于核心地位,而且在共表達(dá)網(wǎng)絡(luò)中的模塊內(nèi)連通度較高,它們與模塊、表型的相關(guān)性均較強(qiáng),故作為本次轉(zhuǎn)錄組學(xué)分析輸出的關(guān)鍵基因,后續(xù)作為重點(diǎn)分析和討論的對(duì)象.在基因表達(dá)譜中獲取它們?cè)赥NBC和非TNBC患者中的相對(duì)表達(dá)量,如圖12(a)—(d)所示,發(fā)現(xiàn)4個(gè)基因在TNBC患者中的表達(dá)均顯著地降低.并且,在另一個(gè)GEO數(shù)據(jù)庫的基因集GSE61724這4個(gè)基因的表達(dá)模式也得到進(jìn)一步確認(rèn),如圖12(e)—(h).YI等[9]通過TNBC相關(guān)基因集分析發(fā)現(xiàn),TNBC患者腫瘤組織中的TFF1表達(dá)比非TNBC患者腫瘤組織的表達(dá)低,病理學(xué)和血清學(xué)檢測(cè)結(jié)果相同.這一發(fā)現(xiàn)與本研究分析結(jié)果一致,且血清TFF1水平與乳腺癌ER、PR和HER2的組織學(xué)類型存在顯著關(guān)聯(lián).生存分析表明,TFF1的低表達(dá)與TNBC患者生存期減少顯著相關(guān).
圖9 交集基因富集分析Fig.9 Enrichment analysis of intersection genes
圖10 交集基因的蛋白互作網(wǎng)絡(luò)Fig.10 Intersection genes of protein-protein interaction network
圖11 蛋白互作網(wǎng)絡(luò)度值統(tǒng)計(jì)Fig.11 Degree values of protein-protein interaction network with statistics
綜上,TFF1的低表達(dá)可能與 TNBC的不良預(yù)后有一定相關(guān)性.因此,TFF1不僅可作為TNBC預(yù)后改善的潛在標(biāo)志物,而且調(diào)控TFF1對(duì)于實(shí)現(xiàn)基于TNBC的分子分型的精準(zhǔn)治療可能具有較重要的意義.鑒于乳腺癌是一種與性激素內(nèi)分泌水平高度相關(guān)的腫瘤,除了受到體內(nèi)雌孕激素水平的調(diào)節(jié)外,雄激素環(huán)境對(duì)乳腺癌的發(fā)生和發(fā)展的相關(guān)研究則相對(duì)較少,而絕經(jīng)女性體內(nèi)的雄激素水平比雌孕激素水平的變化幅度小,提示雄激素在腫瘤的發(fā)生和發(fā)展過程中可能扮演著重要的角色[10].有研究指出,在TNBC中FOXA1與AR存在共表達(dá)關(guān)系[11-12].本研究特意關(guān)注了GSE76275數(shù)據(jù)集中的雄激素受體(androgen receptor, AR)與轉(zhuǎn)錄因子FOXA1的表達(dá)相關(guān)性,發(fā)現(xiàn)兩者在表達(dá)水平上具有較強(qiáng)的正相關(guān)性,AR基因的表達(dá)隨著FOXA1表達(dá)水平的升高而升高,兩者存在一定的共表達(dá)關(guān)系,如圖13.GUIU等[12]開展的隊(duì)列研究發(fā)現(xiàn)有42%的非轉(zhuǎn)移性TNBC表現(xiàn)為FOXA1 和AR共表達(dá).AR 和 FOXA1陽性的TNBC其形態(tài)特征不同于其他亞型的TNBC,它是類似管腔腫瘤的TNBC亞型,該種亞型的TNBC預(yù)后結(jié)局較差,晚期復(fù)發(fā)風(fēng)險(xiǎn)較高.文獻(xiàn)[13]認(rèn)為,F(xiàn)OXA1發(fā)揮轉(zhuǎn)錄因子活性介導(dǎo)乳腺癌中AR驅(qū)動(dòng)的轉(zhuǎn)錄,它作為先驅(qū)的協(xié)同轉(zhuǎn)錄因子與DNA結(jié)合,同時(shí)引導(dǎo)AR至通常由ER占據(jù)的結(jié)合位點(diǎn),而AR通過依賴DNA結(jié)合的獨(dú)立機(jī)制調(diào)節(jié)不同基因的分子功能(如ER的轉(zhuǎn)錄),從而誘導(dǎo)刺激細(xì)胞增殖的類似雌激素的基因程序.然而,也有研究認(rèn)為,F(xiàn)OXA1是乳腺癌細(xì)胞的生長抑制劑和良好預(yù)后標(biāo)志物[14].WU等[15]研究發(fā)現(xiàn),F(xiàn)OXA1能夠抑制TNBC細(xì)胞的上皮間質(zhì)轉(zhuǎn)化過程(epithelial-mesenchymal transition,EMT),從而阻止癌細(xì)胞的轉(zhuǎn)移和侵襲.LIU等[16]發(fā)現(xiàn)FOXA1是促凋亡蛋白Bim的轉(zhuǎn)錄因子,抑制FOXA1的糖基化修飾,可增強(qiáng)FOXA1穩(wěn)定性,從而促進(jìn)乳腺癌細(xì)胞的調(diào)亡.另外,文獻(xiàn)[17-18]研究均認(rèn)為,F(xiàn)OXA1表達(dá)與乳腺癌良好預(yù)后和乳腺癌患者總體生存期延長相關(guān).因此,F(xiàn)OXA1可能是鑒別TNBC特殊亞型和預(yù)后評(píng)價(jià)的生物標(biāo)志物.GUO等[19]基于對(duì)公共數(shù)據(jù)庫的乳腺癌基因集的分析,以及基因和蛋白層面的驗(yàn)證,發(fā)現(xiàn)TNBC組織中的AGR2表達(dá)明顯低于非TNBC組織,與本研究結(jié)果一致.同時(shí),經(jīng)統(tǒng)計(jì)學(xué)檢驗(yàn)表明,AGR2 表達(dá)與組織學(xué)類型、組織學(xué)分級(jí)、ER 狀態(tài)和 PR 狀態(tài)顯著相關(guān).臨床病理變量的單變量分析表明,AGR2在乳腺癌中的高表達(dá)與總體生存期較短顯著相關(guān).Cox 多變量分析認(rèn)為,AGR2可以作為一個(gè)獨(dú)立的關(guān)于腫瘤不利結(jié)果的候選指示因子[19],因此,AGR2的表達(dá)水平對(duì)于乳腺癌的病理分型具有一定的區(qū)分能力,AGR2可能在乳腺癌診斷和預(yù)后中具有重要的價(jià)值.AGR3和AGR2均屬于二硫化物異構(gòu)酶家族,具有高度的序列同源性,因此它們可能介導(dǎo)了腫瘤生物學(xué)的相似方面.AGR2已被廣泛證明與腫瘤的進(jìn)展有關(guān),但對(duì)AGR3在腫瘤生物學(xué)中的作用卻了解較少[20].OBACZ等[21]評(píng)估了AGR3在乳腺癌患者中的臨床和預(yù)后意義,發(fā)現(xiàn)AGR3陽性細(xì)胞百分比與ER、PR狀態(tài)以及腫瘤低組織學(xué)分級(jí)顯著相關(guān),AGR3的表達(dá)與腫瘤增殖標(biāo)志物Ki-67表達(dá)水平呈顯著負(fù)相關(guān),AGR3 陽性亞組的低組織學(xué)分級(jí)腫瘤顯示出更長的無進(jìn)展生存期和總生存期,AGR3與乳腺癌患者有利的預(yù)后有關(guān).然而,一些研究也認(rèn)為AGR3具有致癌潛能,具體表現(xiàn)為它可能和乳腺癌細(xì)胞的增殖、遷移以及耐藥等腫瘤生物學(xué)特性相關(guān)[22-24].
圖12 基因相對(duì)表達(dá)量Fig.12 Relative expression of genes
圖13 FOXA1和AR表達(dá)量的相關(guān)性Fig.13 Correlation between FOXA1 and AR expression levels
TNBC的治療目前依然面臨著可干預(yù)靶點(diǎn)少和治療藥物選擇性小的困境.本研究基于轉(zhuǎn)錄組學(xué)方法對(duì)公共數(shù)據(jù)庫的基因集數(shù)據(jù)分析發(fā)現(xiàn),TNBC與非TNBC在基因表達(dá)、富集的生物功能和信號(hào)通路上存在著明顯的差異.TFF1、FOXA1、AGR2和AGR3基因有可能作為TNBC臨床表型輔助診斷與鑒別診斷,以及精準(zhǔn)治療與預(yù)后干預(yù)的關(guān)鍵分子靶標(biāo),值得深入研究和進(jìn)一步驗(yàn)證.