王兆年,高文靜△,王碧琦,曹衛(wèi)華,呂 筠,余燦清,逄增昌,叢黎明,汪 華,吳先萍,劉 彧,李立明
(1. 北京大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系,北京 100191; 2. 青島市疾病預(yù)防控制中心,山東青島 266033; 3. 浙江省疾病預(yù)防控制中心,杭州 310051; 4. 江蘇省疾病預(yù)防控制中心,南京 210009; 5. 四川省疾病預(yù)防控制中心,成都 610041; 6. 黑龍江省農(nóng)墾總局疾病預(yù)防控制中心,哈爾濱 150090)
據(jù)世界糖尿病聯(lián)盟報(bào)告[1],2019年全球范圍內(nèi)成人糖尿病標(biāo)化患病率為9.3%,而有研究報(bào)道[2],2013年我國(guó)糖尿病患病率為10.9%,高于世界平均水平。糖尿病是一組以高血糖為特征的代謝性疾病,高血糖可對(duì)人體腎臟、心腦血管等多個(gè)器官系統(tǒng)造成損害[3]??崭寡羌疤腔t蛋白(glycated haemoglobin, HbA1c)均可反映機(jī)體糖代謝狀況,并作為糖尿病的診斷指標(biāo)。美國(guó)糖尿病協(xié)會(huì)建議[4],抽取靜脈血測(cè)量的空腹血糖≥7.0 mmol/L或HbA1c≥6.5%的患者應(yīng)被診斷為糖尿病??崭寡鞘亲钪苯臃从逞谴x狀況的指標(biāo),也是最早應(yīng)用于糖尿病診斷的指標(biāo)。HbA1c與空腹血糖相比,更能反映最近幾周內(nèi)中長(zhǎng)期血糖變化,2011年被世界衛(wèi)生組織推薦為糖尿病的診斷指標(biāo)之一[5]。另外,血糖升高即便沒(méi)達(dá)到糖尿病的診斷標(biāo)準(zhǔn),也可對(duì)心血管系統(tǒng)造成不利影響,提高心血管系統(tǒng)疾病的發(fā)病風(fēng)險(xiǎn)[6]。
DNA甲基化是指在DNA的胞嘧啶-磷酸-鳥(niǎo)嘌呤(cytidine-phosphate-guanosine site,CpG)二核苷酸的胞嘧啶5′端在酶催化作用下共價(jià)鍵結(jié)合一個(gè)甲基基團(tuán)。DNA甲基化可通過(guò)影響轉(zhuǎn)錄酶的結(jié)合強(qiáng)度調(diào)控基因的表達(dá)、細(xì)胞的蛋白質(zhì)合成等代謝過(guò)程,因此,DNA甲基化研究可以從組織和機(jī)體代謝改變層面探討疾病的致病機(jī)制和過(guò)程,為探索復(fù)雜疾病的病因及疾病間聯(lián)系提供線索??崭寡鞘且粋€(gè)短期的血糖代謝指標(biāo),可反映當(dāng)下時(shí)點(diǎn)的血糖水平;HbA1c代謝周期則較長(zhǎng),可反映患者機(jī)體的中長(zhǎng)期血糖代謝的平均水平,因此,空腹血糖與CpG位點(diǎn)甲基化的相關(guān)性研究可反映短期內(nèi)的血糖代謝水平和DNA甲基化間的相關(guān)性,HbA1c與CpG位點(diǎn)甲基化的相關(guān)性研究更能反映較長(zhǎng)時(shí)間的血糖代謝水平和DNA甲基化間的相關(guān)性。
雙生子是一類(lèi)特殊的人群,同卵雙生子可匹配遺傳和早期發(fā)育等環(huán)境因素[7],在相同樣本量的條件下,結(jié)論具有更高的準(zhǔn)確性[8],但目前尚缺乏基于中國(guó)等東亞雙生子人群的研究證據(jù)。利用雙生子人群進(jìn)行的2型糖尿病及血糖相關(guān)指標(biāo)也多在10~30對(duì)之間[9-11],納入的雙生子人群較少,難以發(fā)現(xiàn)更微小的關(guān)聯(lián),因此本研究以我國(guó)成年雙生子人群作為研究對(duì)象,探索與空腹血糖、HbA1c相關(guān)的DNA甲基化現(xiàn)象,比較我國(guó)與歐美人群間的差異,為糖尿病相關(guān)的表觀遺傳學(xué)機(jī)制提供進(jìn)一步證據(jù)。
雙生子研究對(duì)象來(lái)自中國(guó)雙生子登記系統(tǒng)(Chinese National Twin Registry,CNTR), 2013年6月至12月和2017年6月至2018年10月于山東青島、浙江、江蘇、四川及黑龍江五地募集。研究對(duì)象納入標(biāo)準(zhǔn):(1)年齡為30歲及以上;(2)雙生子兩成員均參與了現(xiàn)場(chǎng)體檢及問(wèn)卷調(diào)查;(3)問(wèn)卷初篩為同卵雙生子;(4)雙生子兩成員均可提供空腹血標(biāo)本。本研究經(jīng)過(guò)北京大學(xué)生物醫(yī)學(xué)倫理委員會(huì)審查并批準(zhǔn)(批準(zhǔn)號(hào):IRB00001052-13022和IRB00001052-14021),雙生子兩成員均簽署知情同意書(shū)。
利用問(wèn)卷收集一般人口學(xué)信息、疾病相關(guān)信息,以及研究中可能存在的吸煙、飲酒等混雜因素信息。問(wèn)卷信息由經(jīng)過(guò)培訓(xùn)的調(diào)查員面對(duì)面訪問(wèn)獲得,其中糖尿病患病情況及用藥史均為研究對(duì)象自報(bào),患病情況要求為區(qū)縣級(jí)及以上醫(yī)院診斷。體格檢查包括身高、體質(zhì)量、收縮壓、舒張壓等指標(biāo),由工作人員使用統(tǒng)一的身高測(cè)量?jī)x、體成分測(cè)量?jī)x和電子血壓計(jì)測(cè)量??崭寡呛虷bA1c利用現(xiàn)場(chǎng)抽取的空腹靜脈血,由指定的第三方實(shí)驗(yàn)室采用統(tǒng)一的方法檢測(cè),其中空腹血糖采用己糖激酶法檢測(cè),HbA1c采用高效液相色譜法檢測(cè)。
利用同一時(shí)期收集外周血標(biāo)本,進(jìn)行DNA甲基化檢測(cè)。全基因組DNA甲基化檢測(cè)均采用Illumina公司生產(chǎn)的芯片檢測(cè)。研究涉及兩種芯片,分別為Illumina Infinium HumanMethylation450 BeadChip(簡(jiǎn)稱(chēng)450K芯片)和Illumina Infinium MethylationEPIC BeadChip(簡(jiǎn)稱(chēng)850K芯片),采用minfi包[12]對(duì)數(shù)據(jù)進(jìn)行讀取,本研究重點(diǎn)分析兩種芯片重合的CpG位點(diǎn)。
正式分析前首先對(duì)DNA甲基化數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化及樣本和位點(diǎn)的質(zhì)量控制。利用 R軟件WateRmelon程序包[13],對(duì)甲基化數(shù)據(jù)利用數(shù)據(jù)驅(qū)動(dòng)的獨(dú)立標(biāo)準(zhǔn)化(data-driven separate normalization,DASEN)方法進(jìn)行標(biāo)準(zhǔn)化(控制Ⅰ型、Ⅱ型探針的測(cè)量偏倚、背景噪音偏倚和芯片間偏倚),并檢測(cè)每個(gè)樣本中的每個(gè)CpG位點(diǎn)是否存在缺失[若CpG位點(diǎn)所在Ⅰ、Ⅱ型探針信號(hào)與空白對(duì)照對(duì)比差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.01),則該位點(diǎn)缺失]。位點(diǎn)質(zhì)量控制包括:(1)剔除缺失率>0.01的位點(diǎn);(2)剔除本身為單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)位點(diǎn),且在亞洲人群中最小等位基因頻率(minor allele frequency, MAF)>0.05的CpG位點(diǎn);(3)所在基因探針與其他MAF>0.05的SNP位點(diǎn)存在交叉的CpG位點(diǎn)。樣本質(zhì)量控制包括:(1)剔除缺失率>0.01的樣本;(2)利用甲基化芯片上的59個(gè)SNP位點(diǎn)進(jìn)行雙生子的卵型鑒定,SNP位點(diǎn)相關(guān)系數(shù)<0.8即可能為異卵的雙生子,予以剔除[14];(3)同一對(duì)雙生子中一人被剔除,則該對(duì)雙生子被剔除。最終形成待分析的DNA甲基化數(shù)據(jù)集。
由于各個(gè)CpG位點(diǎn)的DNA甲基化水平在不同細(xì)胞中存在差異,不同個(gè)體血液中各個(gè)組分占比存在差異,所以需要調(diào)整血細(xì)胞成分。本研究利用已測(cè)得的450K及850K芯片上甲基化數(shù)據(jù),采用minfi包中estimateCellCounts函數(shù)[15]估計(jì)全血及血凝塊樣本中CD4+T細(xì)胞、CD8+T細(xì)胞、NK細(xì)胞、B細(xì)胞、單核細(xì)胞、巨噬細(xì)胞等有核細(xì)胞組分所占的百分比。
甲基化檢測(cè)時(shí),不同的檢測(cè)平板及實(shí)驗(yàn)批次會(huì)由于試劑、操作儀器等差異,使得DNA甲基化數(shù)據(jù)存在一定誤差。本研究使用代理變量分析方法(surrogate variable analysis, SVA)調(diào)整這些批次效應(yīng)及其他潛在的混雜因素,在代理變量調(diào)整時(shí)采用SVA包的sva函數(shù)[16]。
本研究所涉及統(tǒng)計(jì)分析及圖像(包括曼哈頓圖及Q-Q圖)繪制均使用R 3.5.3軟件進(jìn)行。連續(xù)變量采用均數(shù)±標(biāo)準(zhǔn)差描述;分類(lèi)變量采用頻數(shù)(百分比)描述。若無(wú)特殊說(shuō)明,顯著性水平設(shè)為P< 0.05。全基因組甲基化與空腹血糖或HbA1c間相關(guān)性分析采用混合效應(yīng)模型(linear mixed effect model,LME), 分析基于nlme包的lme函數(shù)[18],以空腹血糖或HbA1c分別作為主效應(yīng),甲基化水平(β值)作為因變量,將年齡、性別、體重指數(shù)(body mass index, BMI)、血壓、血細(xì)胞組成成分、用SVA包生成的代理變量等連續(xù)變量,吸煙、飲酒、是否服用降糖藥等分類(lèi)變量作為協(xié)變量納入固定效應(yīng)模型,將雙生子對(duì)編號(hào)納入隨機(jī)效應(yīng)模型,截距設(shè)置為隨機(jī),其他變量為默認(rèn)設(shè)置,進(jìn)行回歸分析,找出分別與空腹血糖或HbA1c相關(guān)的CpG位點(diǎn)。采用Bonferroni法對(duì)回歸結(jié)果中的P值進(jìn)行多重比較校正,顯著性水平設(shè)為錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,FDR)< 0.05。
本研究最終納入同卵雙生子338人(169對(duì)),CpG位點(diǎn)412 459個(gè),其中男性同卵雙生子114對(duì)、女性55對(duì),平均年齡(48.2±11.9)歲,其他相關(guān)變量基本描述如表1,雙生子對(duì)內(nèi)血糖及HbA1c水平差異均有統(tǒng)計(jì)學(xué)意義(P< 0.001),空腹血糖平均對(duì)內(nèi)差值(1.1±1.8) mmol/L,HbA1c平均對(duì)內(nèi)差值(0.6±0.9)%。
表1 雙生子人口學(xué)特征及相關(guān)變量基本信息
Diabetes mellitus and hypertension were diagnosed by hospitals at or above the county level and reported by patients themselves. The situation of taking hypoglycemic drugs was whether the subjects had taken hypoglycemic drugs within 30 days. FPG, fasting plasma glucose; HbA1c, glycated haemoglobin; BMI, body mass index; SBP, systolic blood pressure; DBP, diastolic blood pressure.
全基因組DNA甲基化與血糖或HbA1c間相關(guān)性分析將338人(169對(duì))同卵雙生子以空腹血糖、HbA1c等血糖相關(guān)指標(biāo)作為主效應(yīng),甲基化水平(β值)作為因變量,納入相關(guān)協(xié)變量用混合效應(yīng)模型進(jìn)行分析,找出與血糖相關(guān)的CpG位點(diǎn)。圖1展示了CpG位點(diǎn)及其顯著性(P值)與染色體之間的位置關(guān)系,在與空腹血糖相關(guān)分析中,在1、2、4、6、7、8號(hào)染色體上發(fā)現(xiàn)陽(yáng)性CpG位點(diǎn)(圖1A),在與HbA1c相關(guān)分析中,在1、4、6、7、17號(hào)染色體上發(fā)現(xiàn)陽(yáng)性CpG位點(diǎn)(圖1B)。
經(jīng)調(diào)整年齡、性別、BMI等因素及進(jìn)行多重比較校正后,發(fā)現(xiàn)與空腹血糖相關(guān)位點(diǎn)7個(gè),與HbA1c相關(guān)CpG位點(diǎn)10個(gè)(表2),其中cg19693031位點(diǎn)在與空腹血糖及HbA1c相關(guān)分析中均是P值最小的位點(diǎn);共有3個(gè)CpG位點(diǎn)在與空腹血糖、HbA1c相關(guān)分析中被重復(fù)發(fā)現(xiàn)(表3)。空腹血糖對(duì)應(yīng)的GCF為1.036,HbA1c對(duì)應(yīng)的GCF為1.014,均在1附近(GCF < 1.1),Q-Q圖(圖2)中多數(shù)CpG位點(diǎn)與參考線基本重合,僅在末端有較大偏離,顯示本研究較好地控制了人群分層。
目前,DNA甲基化是一個(gè)疾病機(jī)制研究中的新領(lǐng)域,目前已有基于歐美人群的研究發(fā)現(xiàn),DNA甲基化與空腹血糖或HbA1c之間存在相關(guān)性,發(fā)現(xiàn)多個(gè)CpG位點(diǎn)(如cg19693031-TXNIP、cg18881723-SLAMF1、cg05201300-ATP6V0E1、cg01676795-POR、cg00936728-FCRL6、cg00574958-CPT1A、cg07805383-未知基因、cg08309687-LINC0069、cg26262157-PFKFB3、cg12655112-EHD3等)的甲基化可能與空腹血糖或HbA1c水平相關(guān)[19-21],但研究結(jié)果之間的差異較大,就目前已知的研究結(jié)果而言,僅有位于TXNIP基因上的cg19693031 位點(diǎn)在兩篇不同研究中被重復(fù)發(fā)現(xiàn)[19-20]。
本研究利用收集到的338人(169對(duì))同卵雙生子進(jìn)行全基因組DNA甲基化與血糖指標(biāo)相關(guān)分析。經(jīng)多重校正后,發(fā)現(xiàn)與空腹血糖相關(guān)的CpG位點(diǎn)7個(gè), 其中4個(gè)CpG位點(diǎn)及其所在基因(cg19693031-TXNIP、cg01538969-DHX16、cg04816311-C7orf50、cg06721411-DQX16)與血糖代謝或2型糖尿病間的相關(guān)性已被其他文獻(xiàn)報(bào)道[20,22-24]。本研究新發(fā)現(xiàn)3個(gè)與空腹血糖存在相關(guān)性的位點(diǎn)(cg08501915、ch.8.1820050F、cg26608667),其中cg08501915位點(diǎn)雖然在以往的研究中沒(méi)有被發(fā)現(xiàn)與血糖之間有相關(guān)性,但有研究發(fā)現(xiàn)該位點(diǎn)所在PGRMC2基因和血糖代謝之間可能存在相關(guān)性[25],所以cg08501915位點(diǎn)的甲基化,可能和血糖存在實(shí)際的相關(guān)性;其余兩個(gè)CpG位點(diǎn)cg26608667、ch.8.1820050F,分別位于ZFAND2A基因和8號(hào)染色體的未知基因上,這些CpG位點(diǎn)與血糖代謝之間的關(guān)聯(lián)尚需進(jìn)一步探討。
表2 全基因組DNA甲基化與血糖指標(biāo)相關(guān)性分析
Correlation analysis of whole genome DNA methylation and blood glucose related indicators covariates such as age, gender, BMI, smoking, drinking, blood pressure, hypoglycemic drug use, blood cell composition and surrogate variables generated by SVA package were adjusted. SE, standard error; FDR, false discovery rate; FPG, fasting plasma glucose; 1st exon, first exon; Body, gene body; TSS1500, 200-1500 bases upstream of the transcriptional start site; 3′UTR, 3′ untranslated region; 5′UTR, 5′ untranslated region; -, represents the CpG sites does not target on known genes; Island, the CpG site is on CpG island; N_Shore, ≤2 kb far on the 5′ side; N_Shelf, ≤2 kb from CpG island on the 5′ side; OpenSea, ≥4 kb from any CpG island.
本研究發(fā)現(xiàn)與HbA1c相關(guān)的CpG位點(diǎn)10個(gè), 其中6個(gè)陽(yáng)性位點(diǎn)(cg19693031-TXNIP、cg04816311-C7orf50、cg01538969-DHX16、cg01676795-POR、cg09029192-TNRC6C、cg16097041-FLAD1)已在其他研究中發(fā)現(xiàn)與HbA1c、空腹血糖或糖尿病之間存在相關(guān)關(guān)系[19-20,22-24]; 4個(gè)位點(diǎn)(cg01339781-ZUFSP、cg24667115-BACH2、cg20697417-未知基因、ch.4.1528651F-FRAS1)在之前研究中未發(fā)現(xiàn)與糖尿病或血糖相關(guān)指標(biāo)間的相關(guān)性,不過(guò)BACH2基因上另一個(gè)CpG位點(diǎn)cg27644327曾被報(bào)道與2型糖尿病及BMI存在相關(guān)性[23],其余3個(gè)CpG位點(diǎn)cg01339781、ch.4.1528651F、cg20697417,分別位于ZUFSP、FRAS1基因和1號(hào)染色體的未知基因上,其功能尚需進(jìn)一步探討。此外,本研究發(fā)現(xiàn)的3個(gè)與空腹血糖及HbA1c均存在相關(guān)性的CpG位點(diǎn)(cg19693031-TXNIP、cg01538969-DHX16、cg04816311-C7orf50)與2型糖尿病及HbA1c等血糖指標(biāo)間相關(guān)性已在先前研究中被多次報(bào)道[22-23]。
表3 全基因組DNA甲基化與血糖指標(biāo)相關(guān)分析重疊位點(diǎn)
Correlation analysis of whole genome DNA methylation and blood glucose related indicators covariates such as age, gender, body mass index, smo-king, drinking, blood pressure, hypoglycemic drug use, blood cell composition and surrogate variables generated by SVA package were adjusted.FDR, false discovery rate; FPG, fasting plasma glucose; Body, gene body; 3′UTR, 3′ untranslated region.
本研究發(fā)現(xiàn)的TXNIP基因上的cg19693031位點(diǎn)與血糖之間的相關(guān)性已在多篇DNA甲基化研究中被報(bào)道,該基因表達(dá)的蛋白與硫氧還原蛋白相互作用并對(duì)其表達(dá)和功能起負(fù)調(diào)控作用[26],調(diào)節(jié)氧化還原過(guò)程。近年研究發(fā)現(xiàn),TXNIP是細(xì)胞內(nèi)糖轉(zhuǎn)運(yùn)信號(hào)通路的關(guān)鍵節(jié)點(diǎn),該基因的表達(dá)產(chǎn)物通過(guò)影響GLUT1和GLUT4調(diào)節(jié)葡萄糖進(jìn)入細(xì)胞[27]。DHX16基因表達(dá)產(chǎn)物參與mRNA剪接過(guò)程,是細(xì)胞代謝和基因表達(dá)的重要參與蛋白[28]。C7orf50為位于7號(hào)染色體上的開(kāi)放閱讀框,對(duì)于其功能的研究較少,尚不清楚該區(qū)域的生理功能及其與血糖代謝之間的作用機(jī)制。目前已發(fā)表的研究[22-23]僅發(fā)現(xiàn)DHX16基因及C7orf50區(qū)域上的部分CpG位點(diǎn)的甲基化與血糖水平可能存在相關(guān)性,但其與血糖轉(zhuǎn)運(yùn)、代謝之間的聯(lián)系尚無(wú)明確證據(jù)。
本研究的優(yōu)勢(shì)是相較其他的DNA甲基化相關(guān)性研究,研究對(duì)象為同卵雙生子,同卵雙生子共享了全部的遺傳物質(zhì)和早期發(fā)育環(huán)境,因此具有較高的匹配度。在樣本量相當(dāng)?shù)难芯恐?,雙生子研究具有更高的把握度[8]。在利用雙生子人群進(jìn)行的糖尿病及相關(guān)指標(biāo)與DNA甲基化的相關(guān)性研究中,本研究具有較大樣本量,因此也發(fā)現(xiàn)了多個(gè)前人研究當(dāng)中未發(fā)現(xiàn)的位點(diǎn),并且本研究采用更保守的Bonferroni檢驗(yàn),研究結(jié)果更具參考價(jià)值。
本研究也存在一定局限性:(1)僅對(duì)全血樣本進(jìn)行DNA甲基化檢測(cè),未對(duì)其他組織進(jìn)行檢測(cè)。DNA甲基化存在組織特異性,對(duì)于血糖相關(guān)指標(biāo)與其他組織中目標(biāo)位點(diǎn)之間的相關(guān)性需要進(jìn)一步驗(yàn)證。也有研究提示外周血與組織中DNA甲基化具有較高的一致性,由于采血更為便捷,使得外周血成為目前多數(shù)甲基化研究的首選材料。(2)僅分析了各個(gè)CpG位點(diǎn)的甲基化和空腹血糖、HbA1c等指標(biāo)間的聯(lián)系,這些基因轉(zhuǎn)錄、翻譯的產(chǎn)物的變化及其與人體內(nèi)血糖代謝狀況間的相關(guān)性還有待進(jìn)一步研究驗(yàn)證。(3)為橫斷面研究,無(wú)法確定甲基化與血糖變化在發(fā)生時(shí)間上先后順序,因此本研究只能發(fā)現(xiàn)CpG位點(diǎn)的甲基化與血糖相關(guān)指標(biāo)間的相關(guān)關(guān)系,不能研究因果關(guān)系。(4)僅分析了單個(gè)CpG位點(diǎn)的甲基化與血糖或HbA1c之間的相關(guān)性,未考慮多個(gè)連續(xù)CpG位點(diǎn)組成的區(qū)域(CpG島)的甲基化與HbA1c之間的相關(guān)性,可能忽略了多個(gè)位點(diǎn)的微小的甲基化與血糖代謝之間的效應(yīng)聯(lián)系。(5)僅考慮了單個(gè)CpG位點(diǎn)的甲基化和HbA1c及空腹血糖間的相關(guān)性,未考慮位點(diǎn)之間及表型之間的交互作用,在后續(xù)研究中,可進(jìn)一步考慮其他影響因素間的交互作用。
綜上所述,本研究利用中國(guó)雙生子人群,全基因組范圍內(nèi)探索與血糖相關(guān)指標(biāo)相關(guān)的DNA甲基化位點(diǎn),發(fā)現(xiàn)了與空腹血糖及HbA1c存在相關(guān)的DNA甲基化位點(diǎn)。本研究為國(guó)內(nèi)較早地利用雙生子人群進(jìn)行的血糖相關(guān)指標(biāo)與DNA甲基化之間的相關(guān)分析,能夠?yàn)楹罄m(xù)研究提供重要的參考,但是本研究所發(fā)現(xiàn)的陽(yáng)性CpG位點(diǎn)的甲基化與近期及遠(yuǎn)期血糖代謝水平間的相關(guān)性,還需要進(jìn)一步在更大樣本量的人群中驗(yàn)證。
北京大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2020年3期