周夏婕,雷水芳,黎立喜,徐 天,顧萬建,馬 飛,楊蓉西
1南京醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)系,江蘇 南京 211166;2國家癌癥中心//國家腫瘤臨床醫(yī)學(xué)研究中心//中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院腫瘤醫(yī)院腫瘤內(nèi)科,北京 100021;3江蘇省中醫(yī)院檢驗(yàn)科,江蘇南京210029
2020年最新數(shù)據(jù)顯示,乳腺癌已超過肺癌成為全球發(fā)病率最高的癌癥,也是導(dǎo)致癌癥患者死亡的第5大原因。在女性群體中,乳腺癌約占所有癌癥新發(fā)病例的1/4,在440萬女性癌癥患者死亡病例中占比15.5%[1]。乳腺癌的早診斷早治療是決定其預(yù)后和生存的關(guān)鍵因素[2]。目前用于乳腺癌早診的技術(shù)有鉬靶X射線成像技術(shù)、超聲診斷技術(shù)、核磁共振成像技術(shù)等[3]。鉬靶X射線成像技術(shù)對于40歲以下或乳房密度較高的女性效果不佳[4]。而我國多數(shù)女性乳腺腺體致密并且發(fā)病人群年齡相對較低[5,6],因此該技術(shù)并不完全適用。超聲診斷技術(shù)則受影像質(zhì)量以及人為主觀判斷等因素影響較大[7]。核磁共振成像(MRI)在乳腺癌研究中被廣泛使用,但因其成本高、耐受性有限等,不適用于全人群篩查[8,9]。因此,尋找一種高效客觀且適用范圍廣的乳腺癌早診技術(shù)顯得尤為重要。
表觀遺傳學(xué)包括DNA甲基化、染色質(zhì)重塑、組蛋白修飾和非編碼RNA等,它能在不改變DNA序列的前提下產(chǎn)生可遺傳變異[10]。DNA甲基化作為一種重要的表觀遺傳機(jī)制,通常指在甲基轉(zhuǎn)移酶(DNMT)的作用下,將甲基基團(tuán)轉(zhuǎn)移到胞嘧啶的C5位置,形成5-甲基胞嘧啶[11]。DNA甲基化的改變與癌癥的發(fā)生發(fā)展相關(guān)[12,13]。對于組織樣本來說,抑癌基因的啟動子區(qū)高甲基化往往導(dǎo)致轉(zhuǎn)錄抑制和基因表達(dá)降低[14,15],而全基因組DNA低甲基化則可能通過增加染色體的不穩(wěn)定性來促進(jìn)腫瘤形成[16]。在癌癥早期,特異的DNA甲基化即有可能發(fā)生改變,如果可以通過特定技術(shù)檢測到,則可能是理想的癌癥早診生物標(biāo)志物[17,18]。
Xu等[19]使用Illumina 27K芯片在美國Sister Study前瞻性隊列的血液樣本中發(fā)現(xiàn)了250個跟乳腺癌相關(guān)的甲基化位點(diǎn)(FDR<0.05)。其中的5 個甲基化位點(diǎn)(cg03430067,cg03616357,cg07072643,cg08287471,cg19709625)在他們隨后的基于2776例外周血樣本的Illumina 450K 芯片數(shù)據(jù)中再次得到了驗(yàn)證(FDR<0.01),并且他們在歐洲EPIC-Italy前瞻性隊列數(shù)據(jù)庫中也驗(yàn)證了外周血中這5個甲基化位點(diǎn)與乳腺癌之間的相關(guān)性[20]。由于DNA甲基化會受不同遺傳背景及生活習(xí)慣、環(huán)境等其他因素所影響[21,22],因此有價值且有必要對這5個甲基化位點(diǎn)與乳腺癌的相關(guān)性在其他種族中進(jìn)行驗(yàn)證。Guan等[23]也強(qiáng)調(diào),在研究甲基化與疾病的相關(guān)性時,對研究結(jié)果進(jìn)行多輪獨(dú)立驗(yàn)證是有必要的。經(jīng)文獻(xiàn)檢索,目前尚未找到這5個甲基化位點(diǎn)相關(guān)基因(C19orf57、MAP9、EMR3、NEK6、PCOLCE2)的甲基化水平與乳腺癌相關(guān)的獨(dú)立研究。本研究通過病例對照設(shè)計來探討這些基因的甲基化水平與中國女性乳腺癌之間的相關(guān)性,從而評估這些基因甲基化作為中國女性乳腺癌早期檢測生物標(biāo)志物的可能性。
從中國醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院收集女性乳腺癌患者258例(中位年齡45.5歲)病例納入標(biāo)準(zhǔn):手術(shù)后病理診斷為乳腺癌、有完整的臨床數(shù)據(jù)記錄、尚未開始放療或化療、無其他癌癥病史且無來自其他器官的癌癥轉(zhuǎn)移。病例排除標(biāo)準(zhǔn):手術(shù)后病理診斷為乳腺良性腫瘤和乳腺腺病等。收集乳腺癌患者臨床資料包括:初診年齡、手術(shù)病理診斷結(jié)果、乳腺癌亞型分類、乳腺癌分期、雌激素受體情況(ER)、孕酮受體情況(PR)、人表皮生長因子受體-2情況(HER2)、Ki67水平等。臨床資料顯示,我們的患者多數(shù)處于早期,其中Ⅰ期43.8%,Ⅱ期36.9%,Ⅲ期18.9%,Ⅳ期0.4%。
272名女性對照來自江蘇省中醫(yī)院健康體檢中心(中位年齡45.0歲)。對照納入標(biāo)準(zhǔn):自述健康、無腫瘤史、無自身免疫病史、血液各項指標(biāo)正常。采集研究對象外周血全血,置于含乙二胺四乙酸(EDTA)的管中,防止血液凝固,并于-80 ℃保存。本研究的倫理經(jīng)南京醫(yī)科大學(xué)和中國醫(yī)學(xué)科學(xué)院倫理委員會討論通過。
我們將5 個CpG 位點(diǎn)分別輸入UCSC 網(wǎng)站中的“human GRch37/hg19”數(shù)據(jù)庫中,根據(jù)CpG位點(diǎn)位于某基因上或距離最近,確定其為相關(guān)基因。5個CpG位點(diǎn)與相關(guān)基因的各自關(guān)系如下:cg03430067 位于C19orf57基因的啟動子區(qū);cg03616357位于MAP9基因的第一外顯子區(qū);cg07072643位于EMR3基因的第一外顯子區(qū);cg08287471位于NEK6基因的第一內(nèi)含子區(qū);cg19709625位于PCOLCE2基因的第一外顯子區(qū)。
全基因組DNA按照南京騰辰公司的DNA提取試劑盒(TANTICA,China)說明書進(jìn)行提取。使用EZ-96 DNA Methylation Gold Kit(Zymo Research,USA)試劑盒按照說明書對上述提取好的DNA進(jìn)行亞硫酸氫鹽處理。
使用Yang等[24,25]描述的基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜(MALDI-TOF-MS,Agena Bioscience,USA)對基因甲基化水平進(jìn)行定量檢測。使用特異引物(GenScript,China)對亞硫酸氫鹽處理后的DNA進(jìn)行目標(biāo)序列擴(kuò)增。具體各引物的序列如表1所示。反應(yīng)條件如下:95 ℃預(yù)變性4 min;接下來45 次循環(huán),包括95 ℃下變性20 s,56 ℃下退火30 s,72 ℃下延伸2min;最后,在72 ℃下延伸5min。聚合酶鏈?zhǔn)椒磻?yīng)(PCR)產(chǎn)物按照Agena EpiTYPER Assay的標(biāo)準(zhǔn)程序處理,然后用Nanodispenser 點(diǎn)樣至硅基靶板上。數(shù)據(jù)由MassARRAY系統(tǒng)采集,使用EpiTYPER v1.2軟件進(jìn)行數(shù)據(jù)分析。該方法檢測到的大多數(shù)質(zhì)量峰只包含一個CpG 位點(diǎn),少數(shù)質(zhì)量峰包含兩個CpG 位點(diǎn)。例如:C19orf57_CpG_7和C19orf57_CpG_8經(jīng)過EpiTYPER處理后位于同一片段。因此,質(zhì)量峰代表的是C19orf57_CpG_7和C19orf57_CpG_8兩位點(diǎn)的平均甲基化水平(在表1中記為C19orf57_CpG_7,8)。實(shí)驗(yàn)操作中,對病例和對照樣本采取平行處理。
從Xu等[20]研究的5個CpG位點(diǎn)對應(yīng)的5個基因中選取了4個與腫瘤、免疫相關(guān)的基因(C19orf57、MAP9、EMR3、NEK6)。每個基因設(shè)計兩對引物,引物及擴(kuò)增片段區(qū)域內(nèi)的CpG位點(diǎn)均未與已知的單核苷酸多態(tài)性(SNP)重合。引物擴(kuò)增序列盡可能包含目的CpG位點(diǎn),但由于目的位點(diǎn)在CpG島或擴(kuò)增序列包含目的位點(diǎn)的引物無法設(shè)計的原因,C19orf57和NEK6的引物擴(kuò)增序列均未包含目的CpG位點(diǎn)(cg03430067、cg08287471),而嘗試了附近的區(qū)域。在預(yù)實(shí)驗(yàn)中,對8對引物(表1)進(jìn)行了PCR擴(kuò)增,隨后進(jìn)行質(zhì)譜甲基化水平檢測。質(zhì)譜檢測結(jié)果顯示其中6個擴(kuò)增片段的甲基化值低于質(zhì)譜穩(wěn)定檢測區(qū)間(小于0.1)。僅有2個擴(kuò)增片段(對應(yīng)基因:C19orf57和EMR3)滿足要求,可進(jìn)行進(jìn)一步的實(shí)驗(yàn)。C19orf57基因上的片段位于cg03430067 下游165 bp的位置,長度為217 bp。使用飛行時間質(zhì)譜定量檢測其9個CpG位點(diǎn)的甲基化水平。EMR3基因上的片段長度為269 bp,其上5個CpG位點(diǎn)(其中EMR3_CpG_1為目的CpG位點(diǎn):cg07072643)的甲基化水平得到檢測。對于C19orf57和EMR3兩個基因,我們先進(jìn)行了第一輪驗(yàn)證(病例:88;對照:94)隨后進(jìn)行數(shù)據(jù)分析。發(fā)現(xiàn)C19orf57基因的甲基化水平與乳腺癌不相關(guān),而EMR3基因的低甲基化與乳腺癌相關(guān)。因此,我們僅對EMR3基因進(jìn)行了獨(dú)立的第二輪驗(yàn)證(病例:170;對照:178;第二輪驗(yàn)證的樣本跟第一輪驗(yàn)證的樣本無重合)。隨后對EMR3基因的數(shù)據(jù)分析包括年齡相關(guān)、年齡分層以及臨床數(shù)據(jù)分析均為兩次驗(yàn)證的樣本量相加(病例:258;對照:272)的結(jié)果。
表1 基因引物序列Tab.1 Sequence of primers for amplification of the genes
所有的統(tǒng)計分析都在SPSS 25.0版中進(jìn)行。使用校正年齡和批間差的logistic回歸模型來比較病例組和對照組之間各位點(diǎn)的DNA 甲基化水平差異。使用Spearman秩相關(guān)分析甲基化與年齡的相關(guān)性。使用Kruskal-Wallis檢驗(yàn)或Mann-Whitney U檢驗(yàn)分析同一臨床特征不同分組后的甲基化水平是否有差異。所有統(tǒng)計分析均采用雙側(cè)檢驗(yàn),P<0.05被認(rèn)為差異具有統(tǒng)計學(xué)意義。
研究對象共包括88例早期乳腺癌患者以及94例對照的外周血。使用logistics回歸模型校正年齡后,分析結(jié)果顯示C19orf57基因上9個位點(diǎn)的甲基化水平在病例組與對照組間無統(tǒng)計學(xué)差異,提示外周血C19orf57的甲基化水平與中國女性的乳腺癌不相關(guān)(表2)。因此,并未對C19orf57基因進(jìn)行擴(kuò)大樣本的研究。
研究對象與上述C19orf57基因保持一致,為88例乳腺癌患者以及94例對照。Logistics回歸模型校正年齡后,結(jié)果顯示EMR3_CpG_2、EMR3_CpG_3、EMR3_CpG_4三個位點(diǎn)的低甲基化與乳腺癌相關(guān)(每減少10%的甲基化;EMR3_CpG_2:OR=1.96,95%CI:1.10~3.50,P=0.022;EMR3_CpG_3:OR=3.10,95%CI:1.51~6.34,P=0.002;EMR3_CpG_4:OR=1.51,95%CI:1.05~2.16,P=0.026,表2),其他的EMR3甲基化位點(diǎn)未觀察到與乳腺癌的相關(guān)關(guān)系。然而,在我們將樣本量擴(kuò)大至合計258例乳腺癌患者以及272例對照后,logistics回歸模型校正年齡與批間差的結(jié)果卻顯示5個位點(diǎn)的甲基化程度均與乳腺癌不相關(guān)(表3)。
表2 散發(fā)性乳腺癌患者與對照C19orf57和EMR3基因甲基化水平差異Tab.2 Comparison of methylation levels of C19orf57 and EMR3 genes between 88 sporadic BC patients and 94 control subjects
表3 散發(fā)性乳腺癌患者與對照EMR3基因甲基化水平差異Tab.3 Comparison of methylation levels of EMR3 gene between 258 sporadic BC cases and 272 control subjects
在乳腺癌病例中,EMR3_CpG_2和EMR3_CpG_4兩個位點(diǎn)的甲基化水平與年齡呈負(fù)相關(guān)(EMR3_CpG_2:Spearman rho=-0.189,P=0.002;EMR3_CpG_4:Spearman rho=-0.128,P=0.040,表4)。而在對照組中,EMR3_CpG_1、EMR3_CpG_3 和EMR3_CpG_4 三個位點(diǎn)的甲基化水平與年齡呈正相關(guān)(EMR3_CpG_1:Spearman rho=0.243,P=5.0E-05;EMR3_CpG_3:Spearman rho=0.201,P=0.001;EMR3_CpG_4:Spearman rho=0.153,P=0.012,表4)。
表4 EMR3甲基化與年齡相關(guān)性Tab.4 Correlation between EMR3 methylation and age
為進(jìn)一步探究EMR3甲基化水平與乳腺癌的相關(guān)性是否受年齡影響,我們以50歲為界對研究人群進(jìn)行年齡分層:<50歲組和≥50歲組。前者包括乳腺癌患者194例,健康女性167名;后者包括乳腺癌患者64例,健康女性105名。在<50歲組別中,5個位點(diǎn)均未顯示出EMR3甲基化與乳腺癌的相關(guān)性。而在≥50歲的人群中,EMR3_CpG_1、EMR3_CpG_2和EMR3_CpG_3的低甲基化與乳腺癌相關(guān),且相關(guān)性具有統(tǒng)計學(xué)意義(每減少10%的甲基化;EMR3_CpG_1:OR=1.40,95%CI:1.03~1.89,P=0.032;EMR3_CpG_2:OR=2.31,95%CI:1.17~4.55,P=0.016;EMR3_CpG_3:OR=2.76,95%CI:1.37~5.56,P=0.005,表5)。其他2個EMR3位點(diǎn)的甲基化水平尚未在≥50歲人群中觀察到與乳腺癌的相關(guān)性(表5)。
表5 258例散發(fā)性乳腺癌患者和272名健康女性EMR3甲基化年齡分層分析Tab.5 Methylation difference of EMR3 between 258 sporadic BC cases and 272 controls stratified by age
Stage Ⅰ,Stage Ⅱ與Stage Ⅲ&Ⅳ三組的乳腺癌患者在EMR3_CpG_2位點(diǎn)的甲基化水平存在顯著的遞減(P=0.022,表6)。但是其他的4個EMR3CpG位點(diǎn)并未顯示出這一趨勢。另外,我們的結(jié)果顯示EMR3的甲基化水平與腫瘤大小、淋巴轉(zhuǎn)移、ER、PR、HER2、Ki67沒有相關(guān)性(表6)。
表6 散發(fā)性乳腺癌患者臨床特征與EMR3甲基化的關(guān)聯(lián)分析Tab.6 Association between EMR3 methylation and clinical characteristics of sporadic BC cases
Xu 等[20]報道了血液中5個甲基化位點(diǎn)(cg03430067,cg03616357,cg07072643,cg08287471,cg19709625)的DNA甲基化水平與乳腺癌相關(guān)。本項目旨在中國人群中研究外周血中這5個位點(diǎn)相關(guān)基因(C19orf57、MAP9、EMR3、NEK6、PCOLCE2)的甲基化水平與乳腺癌的關(guān)聯(lián)。試圖說明以下幾個方面:(1)不同種族的甲基化水平與疾病之間的關(guān)聯(lián)可能不同;(2)Xu等[20]采用Illumina芯片技術(shù)篩選發(fā)現(xiàn)了乳腺癌相關(guān)的甲基化位點(diǎn),但并未對這些位點(diǎn)進(jìn)行逐一驗(yàn)證。我們通過飛行時間質(zhì)譜(MALDI-TOF)技術(shù)對其報道的甲基化位點(diǎn)以及周邊的位點(diǎn)都進(jìn)行了逐一的驗(yàn)證,從而提升了數(shù)據(jù)的可靠性和可重復(fù)性;(3)說明候選基因研究對于我國乳腺癌早期檢測潛在生物標(biāo)志物的發(fā)現(xiàn)具有重要意義。同時提示,用于檢測的分子標(biāo)志物不建議直接套用國外人群的研究結(jié)果,而需在本國人群中先進(jìn)行驗(yàn)證。本研究通過文獻(xiàn)檢索和因?yàn)榧谆档陀谫|(zhì)譜穩(wěn)定檢測區(qū)間排除了3 個基因(MAP9、NEK6、PCOLCE2,詳見研究材料和方法)。在小樣本研究的88例散發(fā)性乳腺癌患者和94 名健康對照中,發(fā)現(xiàn)C19orf57甲基化水平與乳腺癌不相關(guān)。在后續(xù)合計258例散發(fā)性乳腺癌患者和272名健康女性的研究中則顯示,EMR3基因的低甲基化與乳腺癌的相關(guān)性受年齡影響,該相關(guān)性僅存在于≥50歲的人群中。在Xu等[19,20]的研究中,910位參與者的Illumina 27K芯片數(shù)據(jù)顯示EMR3(cg07072643)在乳腺癌患者中的甲基化水平高于健康女性,其后的Illumina 450K芯片數(shù)據(jù)并未展示該位點(diǎn)的甲基化水平具體數(shù)值。但我們的研究卻發(fā)現(xiàn)EMR3的甲基化水平在大于等于50歲乳腺癌患者中是低于健康女性的。我們的結(jié)果和Xu等[20]的報道有明顯的差異,可能源于高加索人群和中國人群之間的種族差異[21]、也可能源于不同的生活方式[26]以及環(huán)境[22]等因素對甲基化水平的影響。
EMR3基因全稱adhesion G protein-coupled receptor E3(又名ADGRE3),編碼一種表皮生長因子,屬于粘附性G蛋白耦合受體,是G蛋白耦合受體大家族中的成員,該家族還包括CD97,EMR1,EMR2和EMR4。該基因在中性粒細(xì)胞、單核細(xì)胞和巨噬細(xì)胞中表達(dá)水平最高[27]。有研究發(fā)現(xiàn)相對于癌旁組織來說,EMR3在肝細(xì)胞癌組織中處于低甲基化狀態(tài)[28]。TCGA數(shù)據(jù)庫中肝癌的數(shù)據(jù)分析提示,EMR3的表達(dá)水平與免疫細(xì)胞滲透有關(guān)[29]。EMR3的基因敲除實(shí)驗(yàn)證明,該基因在膠質(zhì)母細(xì)胞瘤中的作用與細(xì)胞侵襲有關(guān)[30]。Singh等[31]通過全基因組甲基化測量發(fā)現(xiàn)食道癌組織中CD97的啟動子區(qū)處于低甲基化狀態(tài)且該基因呈高表達(dá)。Ward等[32]報道組織中CD97的表達(dá)上調(diào)與甲狀腺癌的發(fā)展以及侵襲性有關(guān)。類似的研究表明CD97是宮頸癌的獨(dú)立預(yù)后指標(biāo),與其不良預(yù)后以及侵襲性有關(guān)[33]。目前我們尚未找到EMR3基因的甲基化與乳腺癌相互作用的文章。我們推測與CD97同一家族的EMR3甲基化水平改變可能同樣通過增加侵襲性與腫瘤的發(fā)展相關(guān)??上覀儧]有新鮮外周血樣本以及RNA樣本,也沒有找到相關(guān)數(shù)據(jù)庫能提供乳腺癌患者外周血中EMR3基因甲基化與表達(dá)的關(guān)系。而且本研究的結(jié)果受限于樣本量較小與回顧性病例對照的研究設(shè)計。因此未來在前瞻性隊列中收集乳腺癌各項影響因素的數(shù)據(jù),并進(jìn)行相關(guān)研究是十分有必要的。
本研究發(fā)現(xiàn)EMR3基因甲基化水平與乳腺癌的相關(guān)性僅在50歲以上女性中存在(表5)。亞洲婦女平均絕經(jīng)年齡約為49周歲[34],圍絕經(jīng)期通常是指絕經(jīng)前3~4年[35],也就是45~49周歲。Key等[36]發(fā)現(xiàn)中國女性的雌激素水平隨年齡的增加而降低。遺憾的是,我們并沒有雌激素水平數(shù)據(jù)。因此暫定50作為年齡分層分析的界值。年齡是甲基化改變的重要因素[37]同時,雌激素水平也跟女性年齡密切相關(guān),尤其是青春期以及絕經(jīng)期的激素水平變化[38]。有研究表明DNA甲基化的改變與青春期過渡和生殖激素水平的變化亦極具相關(guān)性[39-41]。并且有關(guān)激素與乳腺癌的研究也指出,跟乳腺相關(guān)的激素(如雌二醇、睪酮、催乳素等)與乳腺癌患病風(fēng)險呈正相關(guān)關(guān)系[42,43]。根據(jù)以上證據(jù),我們推測50歲以上女性群體(絕大多數(shù)處于絕經(jīng)期)EMR3甲基化與乳腺癌的相關(guān)性可能與年齡及其自身雌激素水平有關(guān)。這與Yin等[44]發(fā)現(xiàn)的S100P和HYAL2基因甲基化水平與乳腺癌的相關(guān)關(guān)系受激素影響結(jié)果類似。然而EMR3基因甲基化與乳腺癌相關(guān)的具體機(jī)制還有待后續(xù)的功能實(shí)驗(yàn)研究。
在既往研究中,Xu等[19,20]并未比較不同臨床特征乳腺癌患者的EMR3甲基化水平差異。我們的研究還針對中國乳腺癌患者不同臨床特征的EMR3甲基化水平進(jìn)行了分組比較,結(jié)果顯示不同分期的乳腺癌患者EMR3甲基化水平在個別位點(diǎn)上存在差異。同時,EMR3的甲基化水平與腫瘤大小、淋巴轉(zhuǎn)移、ER、PR、HER2、Ki67也沒有相關(guān)性。由此可見,外周血DNA甲基化的改變是發(fā)生在腫瘤早期的,并且跟腫瘤的亞型關(guān)系不大。如果能夠找到高效特異的外周血甲基化信號,則有可能是潛在的腫瘤早篩早診標(biāo)志物。
綜上所述,本次研究在中國女性人群中發(fā)現(xiàn)外周血EMR3基因的低甲基化與早期乳腺癌之間存在相關(guān)性,尤其存在于年齡較大或者絕經(jīng)以后的女性中。我們的工作為進(jìn)一步探索EMR3基因甲基化與乳腺癌的作用機(jī)制提供了線索,同時也再次提示基因甲基化與疾病之間的相關(guān)性需在不同人種中進(jìn)行獨(dú)立驗(yàn)證。