王智輝,鐘媚共,陳秋旋,孟子杰,伍婉婷,鄭焱,張鑫
乳腺癌是最常見的女性惡性腫瘤,近四十年間,全球乳腺癌發(fā)病率保持上升趨勢,嚴(yán)重威脅著女性健康[1-2]。乳腺癌是生物學(xué)高度異質(zhì)的惡性腫瘤,臨床最為常見且惡性程度較高的是浸潤性乳腺癌,根據(jù)組織形態(tài)進(jìn)一步分為浸潤性導(dǎo)管癌(invasive ductal carcinoma,IDC)和浸潤性小葉癌(invasive lobular carcinoma,ILC)等,并以IDC為臨床的主要病理類型[3]。然而,同樣的病理類型在臨床生物學(xué)特征及治療反應(yīng)性上常常截然不同,這是因?yàn)樘卣骰虻耐蛔兣c異常表達(dá)往往更能反映乳腺癌的治療反應(yīng)及患者預(yù)后[4],隨著高通量基因檢測技術(shù)的成熟應(yīng)用,乳腺癌基因特征與臨床特征的關(guān)系逐漸清晰,由此建立病理基因分型逐步被臨床所接受并廣泛應(yīng)用。
乳腺癌基因分型的方法有多種,主要通過基因的表達(dá)譜算法和免疫組織化學(xué)判讀等,雖然不同的分型方法在具體樣品的判斷中存在差異,但群體的分類重復(fù)性上基本相似[5]。臨床上公認(rèn)的四個(gè)基因亞型為管腔A型(Luminal A,LumA)、管腔B型(Luminal B,LumB)、人表皮生長因子受體2過表達(dá)型(HER2 overexpression,Her2)和基底細(xì)胞樣型(Basal-like,BasL),其中BasL型基本等同于免疫組織化學(xué)分型中的三陰乳腺癌(triple negative breast carcinoma,TNBC)[6]?,F(xiàn)已知Her2型乳腺癌的特征是人表皮生長因子受體2(human epidermal growth factor receptor 2,HER2)的過表達(dá)及下游通路的持續(xù)激活,而其編碼基因ERBB2(erb-B2 receptor tyrosine kinase 2)的擴(kuò)增是HER2蛋白過表達(dá)的主要原因[4],迄今未見系統(tǒng)性報(bào)道其余三個(gè)基因亞型的基因組拷貝數(shù)變異(copy number variations,CNV)特征,因此,本課題組通過全基因組CNV分析,在癌癥基因組圖譜數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA,https://gdc-portal.nci.nih.gov/)中挖掘出與基因分型相關(guān)的CNV并加以驗(yàn)證。
下載TCGA中乳腺癌的表達(dá)譜測序數(shù)據(jù)、基因組拷貝信息及對(duì)應(yīng)樣品的臨床信息,數(shù)據(jù)庫的更新下載日期為2020年1月31日。參考本課題組已發(fā)表文獻(xiàn)[5],在R語言(版本3.2.2)程序平臺(tái)上,使用AIMS程序包(版本1.2.0)對(duì)每個(gè)樣品的表達(dá)譜進(jìn)行基因分型,納入LumA、LumB、Her2和BasL四個(gè)基因亞型及臨床信息詳細(xì)的1 006例乳腺癌病例。參考本課題組已發(fā)表文獻(xiàn)[7],利用GISTIC 2.0軟件分析腫瘤組織的全基因組拷貝信息,運(yùn)行所得的關(guān)鍵數(shù)據(jù)有:(1)每個(gè)探針標(biāo)記位點(diǎn)的擴(kuò)增或缺失情況,即G評(píng)分(G-score)。G評(píng)分的高低能綜合反映該位點(diǎn)的擴(kuò)增或缺失的深度和頻率;(2)每個(gè)樣品中單個(gè)基因的拷貝數(shù)變異情況,包括深度缺失(Deep deletion)、淺度缺失(Shallow deletion)、二倍體(Diploid)、第三拷貝獲得(Gain)和顯著擴(kuò)增(Amplification)五個(gè)狀況;其中在分析缺失中,將深度缺失及淺度缺失均納入為缺失,而在擴(kuò)增分析中,僅將顯著擴(kuò)增定義為擴(kuò)增,并在R4.0.2軟件中對(duì)各基因在不同基因亞型的拷貝數(shù)分布進(jìn)行卡方檢驗(yàn)(Chi-square test函數(shù)),并采用Benjamin-Hochberg方法(p.adjust函數(shù))進(jìn)行P值校正,得到Q值。
收集整理2017年1月—2019年12月在江門市中心醫(yī)院就診的浸潤性乳腺癌324例,均為原發(fā)灶的手術(shù)或活檢檢查后的剩余標(biāo)本,取樣前均未行任何新輔助治療,保存在該院臨床生物資源庫中。TCGA與江門市中心醫(yī)院乳腺癌患者的一般信息見表1,兩組樣品在性別、年齡、病理類型、臨床分期和基因分型的分布差異均無統(tǒng)計(jì)學(xué)意義(均P>0.05)。本研究為回顧性研究,已申請(qǐng)并獲批免患者知情同意,且整個(gè)項(xiàng)目經(jīng)江門市中心醫(yī)院倫理委員會(huì)審查并批準(zhǔn)(2020-51號(hào))。
表1 TCGA及江門市中心醫(yī)院浸潤性乳腺癌患者的基本信息Table 1 General information of invasive breast carcinoma patients in TCGA and Jiangmen Central Hospital
參考本課題組已發(fā)表文獻(xiàn)[7],調(diào)取石蠟組織切片,利用GeneRead DNA FFPE Kit按操作說明書提取石蠟切片的DNA;利用Taq-Man Copy Number Assay的熒光定量PCR引物Hs00450668_cn檢測ERBB2基因拷貝數(shù),引物Hs03853983_cn檢測TFDP1基因拷貝數(shù),引物Hs06966674_cn檢測MIR148B基因拷貝數(shù),引物Hs01978234_cn檢測CCND1基因拷貝數(shù),引物Hs00738157_cn檢測MDM2基因拷貝數(shù),引物Hs06266734_cn檢測MIR139基因拷貝數(shù),其中內(nèi)參引物為TaqMan Copy Number Reference Assay RNase P,二倍體參考樣品為健康人血漿白膜層樣品,擴(kuò)增試劑盒為TaqMan Fast Advanced Master Mix,按說明書在CFX96熒光定量PCR儀中檢測。規(guī)定樣品中目標(biāo)基因的相對(duì)拷貝數(shù)檢測值小于0.75為缺失(Deletion),大于1.9為顯著擴(kuò)增(Amplification)。
計(jì)數(shù)資料用頻數(shù)表示,用R4.0.2、Excel 2016及GraphPad Prism7.0軟件處理數(shù)據(jù),各組間頻數(shù)數(shù)據(jù)統(tǒng)計(jì)使用卡方檢驗(yàn)(Chi-squared test)或Fisher’s精確檢驗(yàn)(Fisher’s exact test),檢驗(yàn)水準(zhǔn)α=0.05,組間頻數(shù)的兩兩比較使用rcompanion程序包的pairwiseNominalIndependence函數(shù),并采用函數(shù)內(nèi)默認(rèn)的Benjamin-Hochberg方法進(jìn)行P值校正,得到Q值。
除BasL型外,另外3種亞型乳腺癌的擴(kuò)增峰較為聚集,且熱點(diǎn)擴(kuò)增峰的G評(píng)分較高,可達(dá)0.8以上。以軟件默認(rèn)的FDR<0.25為顯著性擴(kuò)增的閾值,可發(fā)現(xiàn)BasL型的特征峰有1q43和13q34,LumB型的特征峰為12q15,Her2型的特征峰為17q12;而11q13.3在Her2型、LumA型及LumB型中擴(kuò)增,在BasL型中無擴(kuò)增,見圖1。
相對(duì)于全基因組的擴(kuò)增情況,各亞型缺失區(qū)段缺少明顯的規(guī)律,且G評(píng)分也普遍較低,在0.2左右。6q15在Her2型、LumA型及LumB型中缺失,11q13.4特異性在LumB型中缺失,12q13.13特異性在BasL型中缺失,21q21.1在Her2型和LumB型中缺失,見圖2。
圖1 TCGA中各亞型的擴(kuò)增區(qū)段分析Figure 1 Amplified chromosome regions of each subtype from TCGA
圖2 TCGA中各亞型的缺失區(qū)段分析Figure 2 Deleted chromosome regions of each subtype from TCGA
利用IGV軟件并結(jié)合相關(guān)文獻(xiàn)報(bào)道(見討論部分),確定各區(qū)段的擴(kuò)增或缺失關(guān)鍵基因:1q43為絲氨酸/蘇氨酸蛋白激酶Akt-3(AKT serine/threonine kinase 3,Akt3)、11q13.3為細(xì)胞周期蛋白D1(Cyclin D1,CCND1)、12q15為原癌基因MDM2(MDM2 proto-oncogene,MDM2)、13q34為轉(zhuǎn)錄因子Dp-1(transcription factor Dp-1,TFDP1)、17q12為Erb-B2受體酪氨酸激酶2(Erb-B2 receptor tyrosine kinase 2,ERBB2)、6q15為絲裂原活化蛋白激酶7(mitogen-activated protein kinase kinase kinase 7,MAP3K7)、11q13.4為微小RNA-139(microRNA 139,MIR139)、12q13.13為微小RNA-148B(microRNA 148B,MIR148B)及21q21.1為微小RNA Let-7c(microRNA Let-7c,MIRLET7C)。上述熱點(diǎn)基因的CNV在四種亞型的分布差異均有統(tǒng)計(jì)學(xué)意義(均P<0.05),其中,在BasL型中,TFDP1(13q34)的擴(kuò)增和MIR148B(12q13.13)的缺失占比高;在Her2型中,ERBB2(17q12)的擴(kuò)增是最顯著的特征;LumB型中,CCND1(11q13.3)和MDM2(12q15)的擴(kuò)增及MIR139(11q13.4)的缺失占比高;而未見LumA型的特異性CNV熱點(diǎn)基因,見表2。
將ERBB2的擴(kuò)增定義為陽性事件,比較發(fā)現(xiàn),在TCGA中Her2型陽性事件發(fā)生率為55.2%,BasL型和LumA型的陽性率均低于或等于4.4%,而LumB型較高,可達(dá)16.8%;在江門市中心醫(yī)院樣品中,Her2型陽性事件發(fā)生率為86.7%,BasL型和LumA型的陽性率均為0,而LumB型為2.0%,組間分布差異均有統(tǒng)計(jì)學(xué)意義(均P<0.05),見表3。
表2 TCGA中各拷貝數(shù)變異熱點(diǎn)基因在各亞型間的分布Table 2 Distribution of CNV hotspot genes among subtypes from TCGA
表3 ERBB2的拷貝數(shù)變異在各基因亞型間的分布Table 3 Distribution of CNV of ERBB2 among gene subtypes
將TFDP1的擴(kuò)增或MIR148B的缺失定義為陽性事件,分析發(fā)現(xiàn)57.8%的BasL型發(fā)生了TFDP1的擴(kuò)增或MIR148B的缺失,而其他亞型的陽性事件發(fā)生率均低于或等于15.2%,分布差異均有統(tǒng)計(jì)學(xué)意義(均P<0.05)。江門市中心醫(yī)院樣品中71.4%的BasL型發(fā)生了TFDP1的擴(kuò)增或MIR148B的缺失,而其他亞型的陽性事件發(fā)生率均低于或等于19.5%,組間分布均差異有統(tǒng)計(jì)學(xué)意義(均P<0.05),見表4。
表4 TFDP1/MIR148B的拷貝數(shù)變異在各基因亞型間的分布Table 4 Distribution of CNV of TFDP1/MIR148B among gene subtypes
將CCND1或MDM2的擴(kuò)增或MIR139的缺失定義為陽性事件,分析發(fā)現(xiàn),47.6%的LumB型發(fā)生了CCND1或MDM2的擴(kuò)增或MIR139的缺失,而其他亞型的陽性事件發(fā)生率均低于35%,分布差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。江門市中心醫(yī)院樣品中61.8%的LumB型發(fā)生了CCND1或MDM2的擴(kuò)增或MIR139的缺失,而其他亞型乳腺癌的陽性事件發(fā)生率均低于或等于20.0%,組間分布差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見表5。
表5 CCND1/MDM2/MIR139的拷貝數(shù)變異在各基因亞型間的分布Table 5 Distribution of CNV of CCND1/MDM2/MIR139 among gene subtypes
本研究首先利用AIMS分型軟件,將TCGA數(shù)據(jù)庫中的乳腺癌患者按表達(dá)譜進(jìn)行基因分型,再利用GISTIC2.0軟件分別對(duì)BasL型、Her2型、LumA型和LumB型患者的腫瘤組織進(jìn)行全基因組CNV分析,發(fā)現(xiàn):(1)相對(duì)于其他三種亞型,BasL型的擴(kuò)增峰較為雜亂,表明BasL型乳腺癌的發(fā)生過程中維持基因組穩(wěn)定及參與修復(fù)的功能受損,這與BasL型有高頻率的腫瘤相關(guān)蛋白53(tumor protein 53,TP53)和乳腺癌易感基因1(breast cancer 1,BRCA1)突變相一致[4];(2)相對(duì)于全基因組的擴(kuò)增情況,各亞型缺失區(qū)段缺少明顯的規(guī)律,且具體缺失區(qū)段的程度和頻率均較低,表明在各亞型中抑癌基因的功能失活只有小部分與缺失相關(guān),這與同行的研究[8]結(jié)論相似;(3)BasL型中有高比例的13q34擴(kuò)增和12q13.13缺失,Her2型有高比例的17q12擴(kuò)增,LumB型的特征為高比例的12q15擴(kuò)增和11q13.4缺失,而LumA型則無特異性擴(kuò)增或缺失的染色體區(qū)段,這部分發(fā)現(xiàn)值得進(jìn)一步討論。
位于17q12區(qū)段的關(guān)鍵癌基因ERBB2的擴(kuò)增是Her2型乳腺癌的重要分子特征,江門市中心醫(yī)院樣品結(jié)果顯示,ERBB2(17q12)在Her2型乳腺癌中顯著擴(kuò)增,雖然與其他亞型間的分布比例有顯著性差異,但無法做到100%的區(qū)分,其原因主要是:(1)相對(duì)于臨床常用的免疫組織化學(xué)及熒光原位雜交法[9],本研究采用的qPCR法和TCGA的高通量分析均無法完全排除腫瘤組織中的原位癌、壞死及間質(zhì)成分;(2)各種方法中,對(duì)于臨界值的爭議依然存在,無法完全做到客觀分析。不過,相比于TCGA,江門市中心醫(yī)院樣品的驗(yàn)證過程中,盡可能采用顯微切割的方法,剔除了大部分非目標(biāo)區(qū)域組織,其臨床一致性較高,可以作為TCGA分析結(jié)果的驗(yàn)證支持?jǐn)?shù)據(jù)。
隨后,用TFDP1(13q34)的擴(kuò)增或MIR148B(12q13.13)的缺失定義為BasL型乳腺癌的特征分子事件,通過對(duì)TCGA的分析及江門市中心醫(yī)院樣品的驗(yàn)證,可知該事件在BasL型的陽性率比其他各亞型高3.6~7.3倍,且差異具統(tǒng)計(jì)學(xué)意義,表明BasL型乳腺癌中有高比例的TFDP1/MIR148B拷貝數(shù)變異。已有研究報(bào)道,BasL型乳腺癌或TNBC存在較高比例的13q34區(qū)段擴(kuò)增[10],且該區(qū)段的擴(kuò)增能導(dǎo)致TFDP1蛋白水平的上調(diào),而TFDP1為細(xì)胞周期啟動(dòng)的關(guān)鍵轉(zhuǎn)錄因子家族E2Fs的共激活因子,體外實(shí)驗(yàn)證明,沉默TFDP1能有效抑制生長因子驅(qū)動(dòng)的乳腺癌細(xì)胞增殖[11],這表明TFDP1很可能參與了BasL型乳腺癌的惡性生物學(xué)行為,是潛在的特異性靶點(diǎn)。同樣,值得我們注意的是,有報(bào)道指出miR-148b具有抑制多種惡性腫瘤的轉(zhuǎn)移能力,過表達(dá)miR-148b能抑制乳腺癌細(xì)胞浸潤破壞血管內(nèi)皮層,抑制乳腺癌等多種惡性腫瘤的體內(nèi)轉(zhuǎn)移[12-13],這提示MIR148B的缺失可能與BasL型乳腺癌部分患者的高轉(zhuǎn)移臨床表型相關(guān),值得進(jìn)一步挖掘其臨床轉(zhuǎn)化價(jià)值。
在四個(gè)分子分型中,LumA型和LumB型的區(qū)分標(biāo)準(zhǔn)還存在一定的爭議,我們利用全基因組CNV分型也未能發(fā)現(xiàn)LumA型中較典型的擴(kuò)增或缺失峰,只觀察到CCND1(11q13.3)和MDM2(12q15)的擴(kuò)增及MIR139(11q13.4)的缺失在LumB型中的比例更高,其中,TCGA的LumA型和LumB型發(fā)生CCND1/MDM2/MIR139拷貝數(shù)變異情況的比例分別是25%和48%,江門市中心醫(yī)院樣品的比例分別是14%和62%,差異均有統(tǒng)計(jì)學(xué)意義。雖然未見MIR139在乳腺癌組織中缺失的報(bào)道,但已有大量文獻(xiàn)報(bào)道,CCND1和MDM2在LumB型乳腺癌中的顯著擴(kuò)增,其中CCND1的擴(kuò)增是細(xì)胞周期素依賴性激酶4/6(cyclin-dependent kinase 4/6,CDK4/6)抑制劑帕博西尼(Palbociclib)的伴隨診斷用藥指標(biāo)[14],而MDM2的擴(kuò)增能通過抑制p53蛋白的功能促進(jìn)乳腺癌化療抵抗,是潛在的治療靶點(diǎn)[15]。雖然本研究挖掘到了較新穎的乳腺癌分子分型標(biāo)志物,但具體的臨床價(jià)值還需要進(jìn)一步加以驗(yàn)證。