蔣丹捷 葉丁 章曉聰 李其龍 金明娟 陳坤,2
作者單位:310058 杭州 1浙江大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系;310009 杭州 2浙江大學(xué)醫(yī)學(xué)院附屬第二醫(yī)院;314100 嘉興 3嘉善縣腫瘤防治所辦公室
據(jù)國(guó)際癌癥研究機(jī)構(gòu)統(tǒng)計(jì)報(bào)告,2018年結(jié)直腸癌(colorectal cancer,CRC)在世界范圍內(nèi)以超過180萬例新發(fā)病例居常見惡性腫瘤發(fā)病第三位,占惡性腫瘤總發(fā)病數(shù)比例為10.2%;死亡病例約86.2萬例,占惡性腫瘤總死亡病例數(shù)的9.2%[1]。CRC的發(fā)生是多步驟、多因素參與的復(fù)雜過程,且具有較長(zhǎng)的癌前病變過程和明顯的分子特征。
隨著分子生物學(xué)的發(fā)展,結(jié)直腸癌分子標(biāo)志物的研究越來越深入。自從1974年MORSON[2]提出結(jié)直腸腺瘤——癌癥演變序貫學(xué)說(the adenoma-carcinoma sequence)以來,許多測(cè)序研究追蹤了大多數(shù)結(jié)直腸息肉演變至結(jié)直腸癌的過程,其中主要包括2條途徑:染色體不穩(wěn)定性途徑和微衛(wèi)星不穩(wěn)定性途徑[3]。在這2條途徑中,大約有25個(gè)常見基因受到突變影響而成為大多數(shù)結(jié)直腸癌的主要驅(qū)動(dòng)因素。這些基因包括常見的抑癌基因,如APC和TP53等[4-5],以及常見的突變癌基因,如KRAS、PI3KCA、BRAF和NRAS等[6-8]。常見的分子改變包括DNA序列的改變,如單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)[9]、體細(xì)胞突變[10]等;表觀遺傳修飾,如 DNA 甲基化[11]、組蛋白修飾[12]等,以及 RNA 水平對(duì)基因的調(diào)控[13-14]等。其中,SNP指在基因組水平上由單個(gè)核苷酸的變異所引起的DNA序列多態(tài)性,它是人類可遺傳變異中最常見的一種。SNP數(shù)量分布密度高,具有較高的遺傳穩(wěn)定性,易于基因分型,是一種非常適于篩查的分子標(biāo)志物。
遺傳風(fēng)險(xiǎn)評(píng)分(genetic risk score,GRS)作為研究SNPs與復(fù)雜疾病之間關(guān)系的新興方法,綜合了若干SNPs的微弱效應(yīng),使基因多態(tài)對(duì)疾病的預(yù)測(cè)性大幅度提升。本文旨在總結(jié)國(guó)內(nèi)外學(xué)者對(duì)GRS在CRC風(fēng)險(xiǎn)評(píng)估中的最新研究進(jìn)展,為后續(xù)研究提供依據(jù)。
隨著“人類基因組計(jì)劃”和“人類基因組單體型圖計(jì)劃”相繼完成,以及全基因組關(guān)聯(lián)研究方法和高通量測(cè)序技術(shù)的日益成熟,人們已經(jīng)發(fā)現(xiàn)了許多與不同復(fù)雜疾病相關(guān)的易感基因和遺傳位點(diǎn)。為了更全面有效地探索遺傳因素在復(fù)雜疾病中的作用,人們構(gòu)建了一系列分析方法來探索遺傳序列變異與復(fù)雜疾病之間的關(guān)系。其中,GRS能整合多個(gè)SNPs的綜合信息來評(píng)價(jià)基因序列變異和疾病之間的聯(lián)系,且預(yù)測(cè)性和重復(fù)性較好,被應(yīng)用于許多復(fù)雜疾病的研究中,基于GRS建立相關(guān)疾病風(fēng)險(xiǎn)評(píng)估模型也表現(xiàn)出良好的效能[15-18]。
GRS用于評(píng)價(jià)遺傳易感位點(diǎn)在疾病風(fēng)險(xiǎn)預(yù)測(cè)模型中的效果,常用的評(píng)分方法主要有簡(jiǎn)單相加遺傳風(fēng)險(xiǎn)評(píng)分(simple count genetic risk score,SC-GRS)、以O(shè)R值作為權(quán)重的遺傳風(fēng)險(xiǎn)評(píng)分(odds ratio weighted genetic risk score,OR-GRS)和可釋方差遺傳風(fēng)險(xiǎn)評(píng)分(explained variance weighted genetic risk score,EVGRS)等。具體計(jì)算公式[19]如下:
i代表本研究中遺傳易感性位點(diǎn)的個(gè)數(shù);Gi代表危險(xiǎn)等位基因的個(gè)數(shù)(0,1,2);ORi代表遺傳易感性位點(diǎn)在本研究中的OR值;MAFi代表遺傳易感性位點(diǎn)在本研究中的MAF。
SC-GRS計(jì)算簡(jiǎn)便,通俗易懂,在現(xiàn)有研究中應(yīng)用較多,但是此方法假設(shè)各個(gè)SNP對(duì)疾病的遺傳效應(yīng)相同;而OR-GRS考慮不同易感位點(diǎn)對(duì)疾病的不同效應(yīng),往往依賴既往研究或本身研究,以對(duì)數(shù)轉(zhuǎn)換后的OR值作為權(quán)重,具有較大OR值的SNP對(duì)疾病的風(fēng)險(xiǎn)貢獻(xiàn)更大,其中OR-GRS的效應(yīng)量估計(jì)主要依賴實(shí)驗(yàn)數(shù)據(jù),因此應(yīng)盡量選用樣本量大、可靠性好的研究;EV-GRS在OR-GRS的基礎(chǔ)上,還納入了MAF這一變量,綜合考慮了基因突變頻率對(duì)疾病風(fēng)險(xiǎn)的影響。隨著更多易感位點(diǎn)的加入,模型的復(fù)雜性也隨之增大,新的構(gòu)建方法也有待后續(xù)開發(fā)和評(píng)估。
目前關(guān)于CRC的GRS研究大多集中在SC-GRS和OR-GRS,因此本文就這兩方面的研究進(jìn)展進(jìn)行綜述。
由SC-GRS構(gòu)成的CRC風(fēng)險(xiǎn)預(yù)測(cè)模型分別在中國(guó)[20-21]、日本[22]、韓國(guó)[23-24]、美國(guó)[25]、德國(guó)[26-27]等國(guó)家中得到了驗(yàn)證,研究者首先納入GWAS研究中與CRC易感性相關(guān)的位點(diǎn),再對(duì)顯著候選位點(diǎn)進(jìn)行SC-GRS構(gòu)建,其受試者工作特征曲線下面積(AUC)或C統(tǒng)計(jì)量均達(dá)0.60以上(表1)。在聯(lián)合年齡、性別、吸煙、飲酒、體育鍛煉、家族腸癌史等CRC相關(guān)危險(xiǎn)因素后,合并模型的風(fēng)險(xiǎn)預(yù)測(cè)水平得到了進(jìn)一步提升。
HSU等[25]在美國(guó)人群中建立的SC-GRS風(fēng)險(xiǎn)預(yù)測(cè)模型還發(fā)現(xiàn)了性別間的差異,此模型在男性樣本中的預(yù)測(cè)效能優(yōu)于女性。在韓國(guó)KCPS-Ⅱ病例隊(duì)列研究中建立的SC-GRS風(fēng)險(xiǎn)預(yù)測(cè)模型合并其他相關(guān)因素后的AUC可達(dá)到0.74[23],診斷效能較優(yōu)的可能原因是其構(gòu)建模型的樣本來源于CRC病例隊(duì)列,此模型對(duì)鑒別CRC病例和正常人的作用較強(qiáng),但對(duì)癌癥早期病變的篩查能力相對(duì)較弱。另外,來自德國(guó)的BLITZ研究還證實(shí)了與CRC相關(guān)的SC-GRS可能與結(jié)直腸腺瘤的發(fā)生風(fēng)險(xiǎn)相關(guān),此項(xiàng)研究的發(fā)現(xiàn)將有助于定義結(jié)直腸進(jìn)展期腺瘤的篩查年齡[27]。
由OR-GRS構(gòu)成的CRC風(fēng)險(xiǎn)預(yù)測(cè)模型也在不同研究中得到了驗(yàn)證[20-21,24,28-29]。其中,李嬌元等[20]在中國(guó)南方漢族人群的研究中對(duì)7個(gè)顯著候選位點(diǎn)分別建立SC-GRS和OR-GRS,研究結(jié)果顯示,OR-GRS聯(lián)合年齡、性別、吸煙、飲酒4項(xiàng)傳統(tǒng)風(fēng)險(xiǎn)因素的模型為最優(yōu)模型,其AUC為0.593,AUC相較于SC-GRS的合并模型有所提升。日本一項(xiàng)JPHC研究[28]對(duì)6個(gè)陽性位點(diǎn)進(jìn)行OR-GRS構(gòu)建,分別評(píng)估了遺傳模型、合并模型和其他模型的效應(yīng),研究結(jié)果顯示三者的C統(tǒng)計(jì)量分別為0.63、0.66和0.60。美國(guó)一項(xiàng)CPRU研究[29]同樣提示了由5個(gè)SNP構(gòu)建的OR-GRS模型優(yōu)于SCGRS模型,該研究還揭示了CRC相關(guān)遺傳易感位點(diǎn)在結(jié)直腸腺瘤中可能發(fā)揮作用,有助于探討CRC和結(jié)直腸腺瘤共有的遺傳易感位點(diǎn),以及尋找結(jié)直腸腺瘤癌變的關(guān)鍵基因或分子。在同一項(xiàng)研究中發(fā)現(xiàn)ORGRS較SC-GRS的診斷效能更優(yōu),提示考慮不同易感位點(diǎn)對(duì)疾病的效應(yīng)具有一定價(jià)值和意義。
表1 GRS在CRC及其相關(guān)疾病風(fēng)險(xiǎn)預(yù)測(cè)模型中的研究結(jié)果
構(gòu)建CRC相關(guān)的GRS不僅有利于更全面地解讀疾病遺傳病因和致病機(jī)制,也為構(gòu)建更有效的疾病風(fēng)險(xiǎn)預(yù)測(cè)模型提供新的線索和依據(jù)。同時(shí)已有學(xué)者提出CRC篩查工作的重心應(yīng)由CRC向癌前病變前移[30],探索CRC的易感位點(diǎn)在結(jié)直腸腺瘤中的作用能為CRC的早期預(yù)防和診療提供幫助。
在構(gòu)建CRC風(fēng)險(xiǎn)預(yù)測(cè)模型中,研究者們往往聯(lián)合其他CRC相關(guān)危險(xiǎn)因素作為非遺傳標(biāo)志物,如吸煙、飲酒、BMI、體育鍛煉、家族史等[31-36]。綜合現(xiàn)有的研究成果,聯(lián)合傳統(tǒng)危險(xiǎn)因素和GRS的風(fēng)險(xiǎn)預(yù)測(cè)模型與單純GRS風(fēng)險(xiǎn)模型或單純危險(xiǎn)因素模型相比,確實(shí)可以提高其預(yù)測(cè)能力,但提高的幅度仍有限。目前CRC相關(guān)的GRS研究還存在以下局限性:⑴由于CRC的遺傳易感因素尚未徹底闡明,單個(gè)GRS研究納入的易感位點(diǎn)不夠系統(tǒng)全面;⑵目前GRS納入位點(diǎn)通?;诩韧鵊WAS研究或Meta分析,這些研究存在人群異質(zhì)性等流行病學(xué)偏倚;⑶目前的GRS風(fēng)險(xiǎn)評(píng)估模型尚未充分考慮基因-基因交互作用與基因-環(huán)境交互作用。因此,構(gòu)建CRC的GRS機(jī)遇與挑戰(zhàn)并存,構(gòu)建具有轉(zhuǎn)化意義的疾病風(fēng)險(xiǎn)預(yù)測(cè)模型仍需努力和創(chuàng)新。