王 兵,盛 海,盧 晨,程聯(lián)勝,龔慶國
干擾素(interferons,IFNs)是一類具有抗病毒、抗增殖和免疫調(diào)節(jié)活性的細(xì)胞因子家族[1],誘導(dǎo)同種細(xì)胞產(chǎn)生抗病毒蛋白,建立抗病毒應(yīng)答,限制病毒的進(jìn)一步復(fù)制和擴(kuò)散,是機(jī)體天然免疫系統(tǒng)的關(guān)鍵組成部分[2,3],臨床上廣泛用于治療各種病毒感染性疾病。α-干擾素是臨床上治療慢性乙型肝炎(CHB)和慢性丙型肝炎(CHC)的一線用藥,以往研究表明由于人體缺乏IFNα2a基因[4],導(dǎo)致這類人群在應(yīng)用IFNα2a后抗IFNα2a抗體產(chǎn)生率較高而影響藥物的治療療效[5,6]。由于缺少大樣本中國人群干擾素基因型分布的基礎(chǔ)研究以及僅我國批準(zhǔn)了IFNα1b上市,因此有學(xué)者認(rèn)為IFNα1b來源于中國人臍帶血白細(xì)胞,而IFNα2a和IFNα2b來源于西方白種人[7],從而錯(cuò)誤解讀為IFNα1b屬于中國人基因,IFNα2a和IFNα2b為外國人基因。為了徹底探明中國人群IFNα1和IFNα2基因的遺傳背景,為臨床用藥提供參考,我們檢索了千人基因組數(shù)據(jù)庫上收錄的中國人IFNα1和α2基因單核苷酸位點(diǎn)多態(tài)性(single nucleotide polymorphism,SNP),現(xiàn)將結(jié)果報(bào)道如下。
1.1 研究人群 選擇千人基因組數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/variation/tools/1000genomes/)公布的2535例全人類雙倍染色體基因組序列,其中有310例為中國人雙倍染色體基因組序列。在這310例中國人中,男性147例,女性163例。包括北京漢族人(Han Chinese in Bejing, China)103例,南方漢族人(Southern Han Chinese)108例,西雙版納傣族人(Chinese Dai in Xishuangbanna,China)99例。
1.2 研究基因 干擾素α1基因(IFNA1)和干擾素α2基因(IFNA2)基因位于人類第9號(hào)染色體短臂[8],基因IFNA1具體位置為Chr9: 21,440,453-21,441,315,全長863 bp,編碼區(qū)為567 bp;基因IFNA2具體位置為Chr9: 21,384,254-21,385,396,全長1142 bp,編碼區(qū)為564 bp。兩個(gè)基因均包含5’-端非編碼區(qū)(5’-UTR)、編碼區(qū)(coding)和3’-端非編碼區(qū)(3’-UTR)三個(gè)部分,其中編碼區(qū)還包含信號(hào)肽區(qū)和成熟蛋白區(qū)。編碼區(qū)突變的結(jié)果會(huì)造成起始缺失變異體(start_lost)、錯(cuò)義突變體(missense_variant)、同義突變體(synonymous_variant)、終止密碼子突變(stop_gained)和插入/缺失性移碼變異體(frame shift_variant)和終止子缺失變異體(stop_lost)等。本研究意在檢索千人基因組數(shù)據(jù)庫收錄的310例中國人IFNA1和IFNA2基因引起成熟蛋白編碼區(qū)出現(xiàn)錯(cuò)義突變體、移碼變異體、終止密碼子和和終止子缺失變異體的SNP位點(diǎn)。
1.3IFNA1/IFNA2等位基因 根據(jù)IFNA1和IFNA2基因成熟蛋白編碼區(qū)的差異,迄今為止的文獻(xiàn)報(bào)道,從人類細(xì)胞中克隆的IFNA1有三個(gè)等位基因,分別為IFNα1、IFNαD和IFNα1/158Val[9]。IFNα1是由Goeddel et al于1981年從人胎肝染色體基因文庫中分離得到的[10]。 IFNαD與IFNα1僅有一個(gè)氨基酸的差異,其成熟蛋白114位的氨基酸殘基由IFNα1的丙氨酸(Ala)突變?yōu)槔i氨酸(Val)。IFNαD基因是Nagata et al于1980年從急性髓性白血病細(xì)胞系(KG-1)cDNA中克隆的[11]。IFNα1/158Val基因由我國學(xué)者黎孟楓等人于1991年從中國漢族人胎肝染色體中克隆的[9],其成熟蛋白158位的氨基酸殘基由亮氨酸(Leu)突變?yōu)槔i氨酸。依據(jù)《中國藥典》三部注釋(2015年版)第212頁載明的IFNα1b蛋白一級(jí)氨基酸序列,IFNα1b與IFNα1存在三個(gè)氨基酸序列的差異,分別為成熟蛋白第58位谷氨酰胺(Gln)突變成組氨酸(His)、第100位的纈氨酸突變成丙氨酸和第149位的纈氨酸突變成甲硫氨酸(Met)。所以,編碼IFNα1b的基因也可以書寫為IFNα1 (Gln58His、Val100Ala、Val149Met)。同樣,報(bào)道顯示人類IFNA2也有三個(gè)等位基因,分別為IFNα2a、IFNα2b和IFNα2c。IFNα2b基因由美國學(xué)者Streuli et al于1980年從健康人外周血白細(xì)胞中克隆[12],IFNα2a基因由美國學(xué)者Goeddel于1980年在急性髓系白血病細(xì)胞系(KG-1)cDNA中克隆的[13],其成熟蛋白第23位的氨基酸殘基由IFNα2b的精氨酸(Arg)突變?yōu)橘嚢彼?Lys)。IFNα2c基因于1985年由美國學(xué)者BODO從Namalwa類淋巴母細(xì)胞系中克隆[14],其成熟蛋白第34位的氨基酸殘基由組氨酸突變?yōu)榫彼帷?/p>
1.4 研究方法 首先,在Pubvar網(wǎng)站(https://www.pubvar.com),在單核苷酸多態(tài)性數(shù)據(jù)庫(single nucleotide polymorphism database, dbSNP,)中,查詢IFNA1和IFNA2基因成熟蛋白編碼區(qū)形成錯(cuò)義突變體、移碼突變體、終止密碼子和終止子缺失變異體的單核苷酸多態(tài)性位點(diǎn)。然后,在千人基因組數(shù)據(jù)庫瀏覽器(1000 genome browser)查詢310例中國人這些單核苷酸多態(tài)性位點(diǎn)的突變情況。記錄各種SNP位點(diǎn)的發(fā)生人數(shù)并計(jì)算相應(yīng)等位基因頻率, 并將中國人群IFNA1和IFNA2優(yōu)勢等位基因頻率與日本、越南、非洲或非洲裔、南亞或南亞裔、歐洲或歐洲裔和美洲地區(qū)人群進(jìn)行比較分析。
2.1IFNA1和IFNA2非同義突變SNP位點(diǎn) 在千人基因組數(shù)據(jù)庫收錄的2535個(gè)人群中,IFNA1基因成熟蛋白編碼區(qū)有5個(gè)SNP位點(diǎn)出現(xiàn)錯(cuò)義突變,無移碼變異體、終止密碼子和和終止子缺失變異體的SNP位點(diǎn)。IFNA1錯(cuò)義突變體的基因頻率合計(jì)為11.2%;同樣,IFNA2基因有12個(gè)SNP位點(diǎn)出現(xiàn)錯(cuò)義突變,無移碼變異體、終止密碼子和和終止子缺失變異體的SNP位點(diǎn)。IFNA1錯(cuò)義突變體的基因頻率合計(jì)為2.7%(表1)。
表1 IFNA1和IFNA2基因成熟蛋白編碼區(qū)非同義突變SNP位點(diǎn)列表(n=2535)
2.2IFNA1基因突變體在不同人群中的分布情況 在千人基因組數(shù)據(jù)庫收錄的2535個(gè)人群中,IFNA1基因的優(yōu)勢等位基因主要是IFNα1基因,基因頻率為88.915%,IFNA1突變體基因頻率總計(jì)為11.085%,其中310例中國人含有308個(gè)IFNα1基因,僅有2人帶有雜合的IFNA1基因突變體,1例北京漢族人帶有IFNα1(Ala137Val)突變體,1例南方人帶有IFNα1(Arg148Gln)。IFNA1基因成熟蛋白編碼區(qū)的5個(gè)非同義突變體的SNP位點(diǎn),沒有2個(gè)或2個(gè)以上位點(diǎn)同時(shí)出現(xiàn)在同一個(gè)基因中,每個(gè)突變體只有1個(gè)氨基酸殘基與IFNα1蛋白不同。中國人群IFNA1基因突變體的比例明顯低于其它有色人種,與同為黃種人的日本人和越南人無顯著性差異(表2)。另外,45例其它有色人種含有純合的IFNA1基因突變體IFNα1(Ala163Gly)。
表2 不同人群IFNA1基因編碼區(qū)非同義突變體SNP位點(diǎn)分布[n(%)]比較
中國人群包括108例中國南方漢族人,103例北京漢族人和99例中國西雙版納傣族人;日本人群包括104例日本東京人(Japanese in Tokyo, Japan, JPT);越南人群包括101例胡志明市人京族人(Kinh in Ho Chi Minh City,Vietnam,KHV);非洲/非洲裔人群包括101例肯尼亞威布耶魯亞人(Luhya in Webuye, Kenya ,LWK)、96例肯尼亞巴巴多斯的非洲加勒比豆人(African Carribbeans in Barbados, ACB)、66例美國西南部的非洲裔美國人(Americans of African Ancestry in SW USA, ASW)、99例尼日尼亞埃桑人(Esan in Nigeria,ESN)、113例岡比亞西部的岡比亞人、85例塞拉利昂門德人(Mende in Sierra Leone,MSL)和109例尼日利亞伊巴丹的約魯巴人(Yoruba in Ibadan, Nigeria,YRI);南亞人群包括86例孟加拉人(Bengali from Bangladesh, BEB)、103例英國的印度泰盧古人(Indian Telugu from the UK,ITU)、96例巴基斯坦拉合爾的旁遮普人(Punjabi from Lahore, Pakistan, PJL)和103例英國的斯里蘭卡泰米爾人(Sri Lankan Tamil from the UK,STU);美洲人群包括94例麥德林的哥倫比亞人(Colombians from Medellin,Colombia, CLM)、106例德克薩斯州休斯頓的古吉拉特邦印第安人(Gujarati Indian from Houston,Texas, GIH)、67例美國洛杉磯墨西哥血統(tǒng)人(Mexican Ancestry from Los Angeles USA, MXL)、86例秘魯?shù)睦R人(Peruvians from Lima, Peru ,PEL)和105例波多黎各人(Puerto Ricans from Puerto Rico,PUR)
2.3 不同人群IFNA2基因突變體分布情況 在千人基因組數(shù)據(jù)庫收錄的2535個(gè)人群中,IFNA2基因的優(yōu)勢等位基因主要是IFNα2b基因,基因頻率為97.298%,IFNA2突變體基因頻率總計(jì)為2.702%, 所有人群均含有IFNα2b基因,沒有IFNA2突變基因純合個(gè)體。其中,310例中國人含有300個(gè)IFNα2b基因,中國人群IFNα2b基因頻率為98.39%, 僅有1例中國人帶有雜合的IFNα2b(Leu140Val)基因,9例中國人帶有IFNα2b(Ala120Thr)突變體。IFNA2基因成熟蛋白編碼區(qū)的12個(gè)非同義突變體的SNP位點(diǎn)沒有2個(gè)或2個(gè)以上位點(diǎn)同時(shí)出現(xiàn)在同一個(gè)基因中,每個(gè)突變體只有1個(gè)氨基酸殘基與IFNα2b蛋白不同。中國人群IFNα2b基因頻率顯著低于非洲人或非洲裔黑人,而與其他人群無顯著性差異(表3)。
表3 不同人群IFNA2基因編碼區(qū)非同義突變體SNP位點(diǎn)分布[n(%)]比較
α-干擾素系一種多樣化的細(xì)胞因子家族。盡管人體內(nèi)有很多種干擾素,但是批準(zhǔn)上市的α干擾素只有IFNα1和IFNα2兩種,包括IFNα1b、IFNα2a和IFNα2b三種α干擾素亞型[15-18]。千人基因組數(shù)據(jù)庫顯示310例中國人群均有IFNA1和IFNA2基因座,IFNα1基因是IFNA1基因座的優(yōu)勢等位基因,IFNα2b基因是IFNA2基因座的優(yōu)勢等位基因,兩者的基因頻率在中國人群中分別為99.6%和98.4%,結(jié)果與其它研究基本一致。我們曾測定了100例中國健康漢族人基因組干擾素α1和干擾素α2等位基因的組成,結(jié)果發(fā)現(xiàn)IFNA1和IFNA2基因座分別均為IFNα1和IFNα2b基因[19]。1994年英國倫敦醫(yī)院醫(yī)學(xué)系和香港瑪麗醫(yī)院合作檢測了16例中國CHB患者的IFNA2等位基因,結(jié)果均為IFNα2b基因[20]。
應(yīng)用IFNα1b后,患者產(chǎn)生抗α-干擾素中和抗體的比率高達(dá)33.7%,遠(yuǎn)遠(yuǎn)高于IFNα2a和IFNα2b。中和抗體的產(chǎn)生可能影響了藥物的抗病毒療效。