吐爾遜阿依·買買提 張 秦 鄭 宏 (新疆醫(yī)科大學(xué)第一附屬醫(yī)院麻醉科,烏魯木齊 830054)
過敏性疾病是多基因遺傳和多環(huán)境因素相互影響的結(jié)果[1-3]。根據(jù)最新的世界過敏組織的報(bào)告:過敏性疾病在全球的高發(fā)病率和高死亡率給健康預(yù)算帶來了巨大的負(fù)擔(dān)。闡明過敏性疾病的發(fā)病機(jī)制,和提出有針對(duì)性、有效的治療方案是迫切需要解決的問題。2001 年公布人類基因組序列草圖后,更多的目光聚焦在個(gè)體之間的基因組變異上,大量關(guān)于過敏性疾病易感基因的研究陸續(xù)展開。用于發(fā)現(xiàn)過敏基因的各種手段隨著時(shí)間的推移而演變,各種基因分型技術(shù)提供的數(shù)據(jù)越來越多,成本越來越低。當(dāng)我們開始采用21 世紀(jì)的新技術(shù)如下一代全基因組測序技術(shù),基因的發(fā)現(xiàn)將不再局限于基因分型技術(shù),而是依賴計(jì)算機(jī)和生物信息處理系統(tǒng),解釋這些龐大的數(shù)據(jù)成了新的需要解決的問題。這一節(jié)我們將回顧性地總結(jié)這些研究策略。
候選基因法就是將感興趣的基因定為候選基因,選擇候選基因中的多態(tài)性標(biāo)記,然后比較多態(tài)性標(biāo)記的基因型在病例組和合適的對(duì)照人群中的頻率分布差異,從而找出與疾病表型相關(guān)的基因變異。1990 年以來,在不同民族中用候選基因法進(jìn)行了過敏性疾病的相關(guān)研究,大量候選基因的啟動(dòng)區(qū)和編碼區(qū)的單核苷酸多態(tài)性已證實(shí)與過敏相關(guān)疾病的表型有關(guān)(見表1)。候選基因的選擇是基于大量的證據(jù)資料,比如所掌握的生物學(xué)功能、發(fā)現(xiàn)的疾病的差異性表達(dá)、與別的疾病共同的表型、或來源于動(dòng)物模型和相關(guān)的組織等。這種方法是假設(shè)驅(qū)動(dòng)的,且結(jié)果很容易解釋,多態(tài)位點(diǎn)選擇簡單,找到的候選基因有生物合理性,并且展示了對(duì)感興趣疾病有意義的功能序列、總費(fèi)用低、易于實(shí)施。缺點(diǎn)是限制已知或未知的可能參與疾病的基因,從而減少了發(fā)現(xiàn)新的可能影響疾病的基因的機(jī)會(huì)。并且缺乏統(tǒng)計(jì)支持和結(jié)果重復(fù)性差,基因多態(tài)性覆蓋率不足等。其中,結(jié)果重復(fù)困難受多因素的影響,主要與不好的研究設(shè)計(jì)、研究人群樣本量小,缺乏足夠的對(duì)照組人群,群體分層、篩查所選取多態(tài)性標(biāo)記不同,遺傳異質(zhì)性、不同種族間的連鎖不平衡模式、研究隊(duì)列間的不同環(huán)境暴露以及統(tǒng)計(jì)學(xué)分析的自限性等因素有關(guān)。
定位克隆的方法是一個(gè)假說獨(dú)立的、依靠對(duì)疾病遺傳家系的研究分析,最先用于家族調(diào)查研究。為找到與研究疾病相關(guān)的表型,標(biāo)記物隨機(jī)分布在整個(gè)基因組。如果發(fā)現(xiàn)特定標(biāo)記物與表型之間存在關(guān)聯(lián),則進(jìn)一步分型的遺傳標(biāo)記物將輔助更準(zhǔn)確地定義關(guān)鍵區(qū)域的致病基因。從此之后,被定位在此區(qū)域的基因可以用來檢測是否參與某種疾病發(fā)病過程及治病基因突變的出現(xiàn)。如果基因組中所有的基因都用這種方法檢測,這種方法就被稱作定位克隆或基因掃描。雖然這種方法不需要假設(shè)某種基因與疾病的易感性有關(guān),但它需要大量的分子遺傳研究,需要大量的時(shí)間和精力。不像許多候選基因的研究,通過定位克隆技術(shù)鑒定的易感基因,在一般情況下,在隨后的研究中更容易被重復(fù),盡管定位克隆的基因也可能被證明有時(shí)難以復(fù)制。
許多過敏性疾病和過敏性疾病易感基因的全基因組掃描已經(jīng)完成。過敏和過敏性疾病易感基因的全基因組畫面的結(jié)果反映了遺傳和環(huán)境異質(zhì)性,已觀察到的基因組的多個(gè)區(qū)域與不同的表型有關(guān),在相似或不同人群中的可重復(fù)性較差。這說明鑒定復(fù)雜性疾病易感基因的難度很大。不同的基因位點(diǎn)將說明不同的種族和不同環(huán)境中的人群之間的聯(lián)系。在復(fù)雜疾病的研究中,真正的挑戰(zhàn)不是確定有關(guān)的區(qū)域而是對(duì)所觀察到的有關(guān)區(qū)域中相關(guān)基因和遺傳變異的精確識(shí)別。過敏性疾病表型的連鎖分析是緩慢和昂貴的,大多數(shù)研究已經(jīng)證明,盡管收集幾百個(gè)家庭樣本,找出并證明復(fù)雜疾病的易感基因是非常困難的,不夠讓人信服。一項(xiàng)有關(guān)哮喘連鎖分析的Mata 分析表明:氣道高反應(yīng)性、過敏原皮膚點(diǎn)刺試驗(yàn)陽性、血清總IgE 水平的易感基因位點(diǎn),沒有一致的統(tǒng)計(jì)學(xué)上的顯著的易感基因位點(diǎn)與哮喘的表型有關(guān),說明了結(jié)果的異質(zhì)性。
迄今為止,通過定位克隆策略的全基因組掃描已認(rèn)定過敏性疾病表型的幾個(gè)易感基因,包括與哮喘有關(guān)的整合素和金屬蛋白酶33 (ADAM33)[4],幾丁質(zhì)酶3 樣蛋白-1 (CHI3L1)[5],二肽基肽酶(DPP10)[6],主要組織相容性復(fù)合物(MHC),HLAG[7],PHD 鋅指蛋白-11(PHF11)[8],前列腺素D2 受體(PTGDR)[9],血纖維蛋白溶酶原激活劑,尿激酶受體(PLUAR)[10];與氣管高反應(yīng)性(BHR)有關(guān)的PCDH1[11];與特應(yīng)性皮炎有關(guān)的COL29A1 基因[12]。詳見表2。
表1 通過候選基因研究確定的可以復(fù)制的基因Tab.1 Well-replicated loci identified through candidate-gene studies
表2 通過定位克隆技術(shù)確定的可以復(fù)制的基因Tab.2 Loci identified through linkage studies and positional cloning
全基因組關(guān)聯(lián)研究是新近出現(xiàn)的篩查復(fù)雜性疾病易感基因的有力工具。近些年來,基于SNP 基因分型技術(shù)的應(yīng)用,革新了復(fù)雜疾病的遺傳基礎(chǔ)研究。使得我們有機(jī)會(huì)識(shí)別巨大數(shù)量的SNP,以及通過基因組水平的連鎖不平衡,識(shí)別了不同種族人群的遺傳特征。全基因組關(guān)聯(lián)研究(GWAS 研究)現(xiàn)在已經(jīng)徹底改變了復(fù)雜的常見疾病遺傳因素的研究模式。自2005 年Science 雜志報(bào)道了首個(gè)與年齡有關(guān)的視網(wǎng)膜黃斑變性GWAS,隨后相繼報(bào)道了從生理測量如常見的疾病身高和身體質(zhì)量指數(shù)到生物測量如循環(huán)血脂水平和血液中嗜酸性粒細(xì)胞水平等超過150 個(gè)表型,GWAS 為人類基因組的不同位點(diǎn)提供了數(shù)百個(gè)強(qiáng)有力的、有意義的統(tǒng)計(jì)關(guān)聯(lián)[17]。全基因組假設(shè)獨(dú)立的關(guān)聯(lián)研究不像連鎖定位克隆法,不需要收集大型家庭為基礎(chǔ)的樣品和其表型;GWAS 可以分析人類基因組的所有基因,不受候選基因的限制。
最近的GWAS 研究已令人信服地檢測到大量的過敏性疾病相關(guān)的基因位點(diǎn),在過敏性疾病的研究中取得了很大的成功。第一個(gè)用GWAS 發(fā)現(xiàn)的哮喘易感基因位點(diǎn)是在染色體17q12-21.1 上的ORM1-like3 和Gasdermin like(GSDML)基因[18]。一項(xiàng)大規(guī)模哮喘的GWAS 研究,收集了10 365 個(gè)病例和16 110 個(gè)對(duì)照,確定了6 個(gè)易感基因位點(diǎn)IL1RL1 IL18R1,HLA-DQ,IL33,SMAD3,ORMDL3,GSDMB IL2RB[19]。IL1RL1 的配體是IL-33,這已被證明在Th2 細(xì)胞相關(guān)的疾病模型中有重要的作用[20]。IL-33 被認(rèn)為是重要的宿主防御線蟲的細(xì)胞因子,通過IL-33 受體誘導(dǎo)Th2 細(xì)胞產(chǎn)生,也是一個(gè)關(guān)鍵的誘導(dǎo)和激活固有淋巴細(xì)胞的細(xì)胞因子。這些研究結(jié)果意味著,參與IL-33 通路的遺傳因素在人類支氣管哮喘的病理生理機(jī)制中發(fā)揮了重要作用。
過敏性疾病的中間表型,如IgE 水平,皮膚點(diǎn)刺試驗(yàn)的反應(yīng),或連續(xù)測量肺功能措施對(duì)基因關(guān)聯(lián)研究有更強(qiáng)大的統(tǒng)計(jì)學(xué)意義。最近的一個(gè)全基因組關(guān)聯(lián)研究應(yīng)用于過敏中間表型的例子是研究冰島人口血液中嗜酸性粒細(xì)胞計(jì)數(shù);這項(xiàng)研究表明,基因的序列變異影響嗜酸性粒細(xì)胞數(shù),包括白細(xì)胞介素1 受體樣1 (IL1RL1),WD 重復(fù)結(jié)構(gòu)域36 (WDR36),白細(xì)胞介素33(IL33),和v-myb 基因的成髓細(xì)胞瘤病毒癌基因同系物(MYB),與哮喘和心肌梗死有關(guān)[21]。已經(jīng)提議將IL1RL1 作為濕疹和哮喘的候選基因。GWAS 的方法同樣被應(yīng)用到識(shí)別變種調(diào)節(jié)血清IgE 水平,這項(xiàng)研究確定在染色體1q23 的編碼IgE (FCER1A)的高親和力受體基因的功能變異與血清IgE 水平及過敏致敏有關(guān)。以及證實(shí)了以前的候選基因研究結(jié)果,即信號(hào)轉(zhuǎn)導(dǎo)和轉(zhuǎn)錄激活因子6(STAT6)基因有關(guān)變異調(diào)節(jié)了總IgE 水平和過敏。
最新用GEWASs 方法發(fā)現(xiàn)了哮喘伴花粉過敏的11 個(gè)易感基因:HLA-DQB 16p21、TLR14 p14、WDR36 5q22、IL1RL1 2q12、LRRC32 11q13、GSDMA 17q21、TSLP 5q22、IL33 9p24、ZBTB10 8q21、SMAD3 15q22、CLEC16A 16p13[22]。
若想最大限度地發(fā)現(xiàn)有影響力的等位基因,可以將GWASs 的結(jié)果做成薈萃分析。2011 年報(bào)道了種族多元化的北美人群中研究哮喘的薈萃分析,確定了5 個(gè)易感基因位點(diǎn)。其中4 個(gè)位點(diǎn),分別是17q21、IL1RL1 附近、TSLP 和IL33,已經(jīng)有報(bào)道,新發(fā)現(xiàn)了非洲裔人特有哮喘易感基因PYHIN1[23]。大規(guī)模的全基因組薈萃分析發(fā)現(xiàn)有過敏性鼻炎和過敏草相關(guān)的幾個(gè)基因位點(diǎn)[24]。在C11orf30 和LRRC32 附近的染色體11q13.5 發(fā)現(xiàn)與表型相關(guān),且在全基因組中有意義。LRRC32 是控制人類調(diào)節(jié)性T 細(xì)胞FOXP3 的關(guān)鍵受體,它與免疫耐受有關(guān)[25]。11q13.5 區(qū)域已經(jīng)報(bào)道是過敏性皮炎和哮喘的易感基因位點(diǎn)[26]。此薈萃分析發(fā)現(xiàn),HLA 區(qū)域也與草過敏有關(guān)聯(lián),且在全基因組水平上有意義。
在過去的五年里全基因組關(guān)聯(lián)研究在基因相關(guān)研究中占主導(dǎo)地位,然而測序研究將引領(lǐng)未來五年的發(fā)展方向。測序研究目前正在火熱進(jìn)行中,因高通量,大規(guī)模并行測序技術(shù)的形成而得到快速發(fā)展。這項(xiàng)研究的基本原理是:這些罕見的變異與普通的變異相比,對(duì)疾病風(fēng)險(xiǎn)影響更大,是解釋常見疾病的遺傳風(fēng)險(xiǎn)的一個(gè)重要部分。有趣的是,理論模型在十年前就建議低頻等位基因的多態(tài)位點(diǎn)與一個(gè)或更多的可能的常見等位基因相比更有助于常見疾病的風(fēng)險(xiǎn)[27]。這種等位基因的異質(zhì)性不能被運(yùn)用傳統(tǒng)的統(tǒng)計(jì)方法的關(guān)聯(lián)研究所發(fā)現(xiàn),包括全基因組關(guān)聯(lián)研究。此外,正如上面提到的,最常用的基因分型平臺(tái)幾乎專門用于普通的變異。相反,檢測該罕見的變異需要重新測序基因,外顯子,甚至掃描整個(gè)大樣本中的每個(gè)個(gè)體的基因組,去發(fā)現(xiàn)變異標(biāo)記基因分型平臺(tái)沒有檢測到的罕見的變異。目前正在進(jìn)行的研究在重新測序成百上千個(gè)個(gè)體的基因組,比較病例組和對(duì)照組來發(fā)現(xiàn)罕見變異。然而,顯而易見的是,測序基因組或外顯的成本下降的很快,這項(xiàng)技術(shù)可能在不久的將來取代SNP 分型技術(shù)。相比之下,對(duì)存儲(chǔ)、分析、解釋序列數(shù)據(jù)的需求大,要求高。生物信息學(xué)和計(jì)算機(jī)領(lǐng)域的發(fā)展沒有跟上這些數(shù)據(jù)的生成。
表3 各種方法比較Tab.3 Comparison of different methods
使以上研究揭示了過敏性疾病易感基因的位點(diǎn),提供了新見解,但對(duì)過敏性疾病的遺傳機(jī)制發(fā)現(xiàn)的少之又少,相關(guān)的變異對(duì)疾病整個(gè)發(fā)病過程起的作用較小。遺傳缺失的潛在來源包括稀有變異,拷貝數(shù)變異,表觀遺傳效應(yīng),基因-基因相互作用和基因與環(huán)境的相互作用[28]。近日,免疫芯片已經(jīng)發(fā)展到進(jìn)行主要自身免疫性疾病和炎癥性疾病的深層復(fù)制,對(duì)GWAS 研究已確定的位點(diǎn)進(jìn)行了精細(xì)定位[29]。免疫芯片是采用Infinium 技術(shù)的Illumina SNP 基因分型芯片,含有從千人基因組計(jì)劃和其他可用特定疾病的重測序數(shù)據(jù)中選擇的196 524 多態(tài)性自定義的高密度陣列[29,30]。該免疫芯片手段可能會(huì)提高我們對(duì)過敏性疾病的認(rèn)識(shí),但是,免疫芯片并不覆蓋整個(gè)基因組,專為歐洲白人使用。因此,它在應(yīng)用于亞洲人群時(shí)受到了限制。
GWASs 研究發(fā)現(xiàn)的易感位點(diǎn)上的候選基因提示上皮屏障功能、固有適應(yīng)性免疫、IL-1 家族信號(hào),調(diào)節(jié)性T 細(xì)胞和維生素D 通道在過敏性疾病病理生理中的重要作用。在免疫學(xué)中已證實(shí)所有免疫系統(tǒng)中細(xì)胞的分子成分在免疫反應(yīng)中的作用不容忽視。構(gòu)造一個(gè)模仿人類生理學(xué)的動(dòng)物模型,GWAS研究的結(jié)果將有助于突出參與人類過敏性疾病的基因。
過敏性疾病是由多種基因變異和多環(huán)境因素相互作用而引起的。先前的許多遺傳研究已經(jīng)使用定位克隆和候選基因關(guān)聯(lián)研究,以及最近應(yīng)用的全基因組關(guān)聯(lián)研究發(fā)現(xiàn)了許多與過敏性疾病相關(guān)的基因及其位點(diǎn),但上述三種方法始終沒有解決結(jié)果重復(fù)性差、結(jié)果難以解釋和很難就此下結(jié)論等問題,而且還有許多過敏性疾病的遺傳特性未被發(fā)現(xiàn),詳見表3。在未來幾年內(nèi),高通量測序?qū)⒊蔀檠芯窟^敏性疾病易感基因的新熱點(diǎn),這種方法將使龐大的新信息涌入,以及處理大量數(shù)據(jù)時(shí)將遇到更新的問題。目前面臨的挑戰(zhàn)是找到更好的發(fā)現(xiàn)易感基因的方法,降低成本,精確地找到過敏性疾病的易感基因,闡明相關(guān)的變化對(duì)基因調(diào)控和功能的影響。
[1]Vercelli D.Discovering susceptibility genes for asthma and allergy[J].Nat Rev Immunol,2008,8:169-182.
[2]Ober C,Hoffjan S.Asthma genetics,2006:the long and winding road to gene dis-covery[J].Genes Immune,2006,7:95-100.
[3]Cardon LR,Bell JI.Association study designs for complex disease[J].Nat Rev Genet,2001,2:91-99.
[4]Van Eerdewegh P,Little RD,Dupuis J,et al.Association of the ADAM33 gene with asthma and bronchial hyperresponsive-ness[J].Nature,2002,418:426-430.
[5]Ober C,Tan Z,Sun Y,et al.Effect of variation in CHI3L1 on serum YKL-40 level,risk of asthma,and lung function[J].N Engl J Med,2008,358:1682-1691.
[6]Allen M,Heinzmann A,Noguchi E,et al.Positional cloning of a novel gene influencing asthma from chromosome 2q14[J].Nat Genet,2003,35:258-263.
[7]Nicolae D,Cox NJ,Lester LA,et al.Fine map-ping and positional candidate studies identify HLA-G as an asthma susceptibility gene on chromosome 6p21[J].Am J Hum Genet,2005,76:349-357.
[8]Zhang Y,Leaves NI,Anderson GG,et al.Positional cloning of a quantitative trait locus on chromosome 13q14 that influences immunoglobulin E levels and asthma[J].Nat Genet,2003,34:181-186.
[9]Oguma T,Palmer LJ,Birben E,et al.Role of prosta-noid DP receptor variants in susceptibility to asthma[J].N Engl J Med,2004,351:1752-1763.
[10]Barton SJ,Koppelman GH,Vonk JM,et al.PLAUR polymorphisms are associated with asthma,PLAUR levels,and lung function decline[J].Allergy Clin Immunol,2009,123:1391-1400,e17.
[11]Koppelman GH,Meyers DA,Howard TD,et al.Identification of PCDH1 as a novel susceptibility gene for bronchial hy-perresponsiveness[J].Respir Crit Care Med,2009,180:929-935.
[12]Soderhall C,Marenholz I,Kerscher T,et al.Variants in a novel epidermal collagen gene(COL29A1)are associated with atopic dermatitis[J].PLoS Biol,2007,5:e242.
[13]Laitinen T,Polvi A,Rydman P,et al.Characterization of a common susceptibility locus for asthma-related traits[J].Science,2004,304(5668):300-304.
[14]Noguchi E,Yokouchi Y,Zhang J,et al.Positional identification of an asthma susceptibility gene on human chromosome 5q33[J].Respir Crit Care Med,2005,172(2):183-188.
[15]Balaci L,Spada MC,Olla N,et al.IRAK-M is involved in the pathogenesis of early-onset persistent asthma[J].Am J Hum Genet,2007,80(6):1103-1114.
[16]Sderhll C,Marenholz I,Kerscher T,et al.Variants in a novel epider-mal collagen gene(COL29A1)are associated with atopic dermatitis[J].PLoS Biol,2007,5(9):e242.
[17]White JH,Chiano M,Wigglesworth M,et al,Identification of a novel asthma susceptibility gene on chromosome 1qter and its functional evaluation[J].Hum Mol Genet,2008,17 (13):1890-1903.
[18]Moffatt MF,Kabesch M,Liang L,et al.Genetic variants regulating ORMDL3 expression contribute to the risk of childhood asthma[J].Nature,2007,448:470-473.
[19]Moffatt MF,Gut IG,Demenais F,et al.A large-scale,consortiumbased genome wide association study of asthma[J].N Engl J Med,2010,363 :1211-1221.
[20]Liew FY,Pitman NI,McInnes IB.Disease-associated functions of IL-33:the new kid in the IL-1 family[J].Nat Rev Immunol,2010,10:103-110.
[21]Gudbjartsson DF,Bjornsdottir US,Halapi E,et al.Sequence variants affecting eosinophil numbers associate with asthma and myocardial infarction[J].Nat Genet,2009,41:342-347.
[22]Ferreira MAR,Matheson MC,Tang CS,et al.Genome-wide association analysis identifies 11 risk variants associated with the asthma with hay fever phenotype[J].Allergy Clin Immunol,2013.pii:S0091-6749(13):1643-1646.
[23]Torgerson DG,Ampleford EJ,Chiu GY,et al.Meta-analysis of genome-wide association studies of asthma in ethnically diverse North American populations[J].Nat Genet,2011,43:887-892.
[24]Ramasamy A,Curjuric I,Coin LJ,et al.A genome-wide meta-analysis of genetic variants associated with allergic rhinitis and grass sensitization and their interaction with birth order[J].Allergy Clin Immunol,2011,128:996-1005.
[25]Probst-Kepper M,Geffers R,Krger A.GARP:a key receptor controlling FOXP3 in human regulatory T cells[J].Cell Mol Med,2009,13:3343-3357.
[26]Ferreira MA,Matheson MC,Duffy DL,et al.Identification of IL6R and chromosome 11q13.5 as risk loci for asthma[J].Lancet,2011,378:1006-1014.
[27]Pritchard JK.Are rare variants responsible for susceptibility to complex diseases?[J].Am J Hum Genet,2001,69:124-137.
[28]Trynka G,Hunt KA,Bockett NA,et al.Dense genotyping identifies and localizes multiple common and rare variant association signals in celiac disease[J].Nat Genet,2011,43:1193-1201.
[29]Cortes A,Brown MA.Promise and pitfalls of the Immunochip[J].Arthritis Res Ther,2011,13:101.
[30]Durbin RM,Abecasis GR,et al.A map of human genome variation from population-scale sequencing[J].Nature,2010,467:1061-1073.