滑峰 萬海粟 梅朝蓉 鄭德杰 孫琳琳 陳軍 劉紅雨 周清華
單核苷酸多態(tài)性是新一代遺傳標記,其與人類疾病的關(guān)系是遺傳學(xué)研究的重要內(nèi)容[1-4]。細胞色素P450酶2A13(cytochrome P450 2A13, CYP2A13)是人呼吸系統(tǒng)中最常見的細胞色素P450酶,可代謝煙草中前致癌物,因此被認為與肺癌等腫瘤的發(fā)生有關(guān)[5,6]。近年有較多研究者探討了CYP2A13不同單核苷酸多態(tài)性位點與肺癌的關(guān)系,得出了有意義的結(jié)論,使得關(guān)于CYP2A13單核苷酸多態(tài)性的研究成為一個活躍的領(lǐng)域[7-10],從相關(guān)核酸序列數(shù)據(jù)庫中已經(jīng)可以查到大量不同研究者報道的SNP數(shù)據(jù)。我們在研究CYP2A13單核苷酸多態(tài)性與肺癌關(guān)聯(lián)性實驗中發(fā)現(xiàn)了同源序列的干擾,查閱比對了不同數(shù)據(jù)庫(dbSNP、EGPsnp、HAPMAP)中的信息,發(fā)現(xiàn)部分信息相互矛盾,于是進一步做了克隆測序,以觀察同源序列是否影響SNP研究,以期引起研究者的注意,并能正確參考應(yīng)用數(shù)據(jù)庫中的數(shù)據(jù)。
1.1 研究對象 原發(fā)性肺癌266例,正常體檢人群307例,來源于天津醫(yī)科大學(xué)總醫(yī)院,均為漢族人群。收集樣本人群外周靜脈血2 mL,采用Axygen外周血DNA提取試劑盒提取基因組DNA備用,檢測DNA濃度為40 μg/mL左右。
1.2 CYP2A13基因rs8192789位點(Arg257Cys)基因分型及序列比對 探針及引物由ABI公司設(shè)計合成,上游引物:GGAGGACTTCATCGCCAAGAA,下游引物:CGGATGAGAAAGGAGTCGATGA,VIC標記探針:AGCGTGCGCTGGTT,F(xiàn)AM標記探針:AGCGTGCACTGGTT。實時定量PCR反應(yīng)體系為10 μL,含探針0.25 μL,mix 5 μL,H2O 2.75 μL,基因組DNA 2 μL。反應(yīng)條件為:94oC預(yù)變性10 min,92oC、15 s,60oC、1 min,共40個循環(huán)。結(jié)果判斷:根據(jù)PCR曲線,如為VIC標記探針S形曲線,則基因型為CC型,如為FAM標記探針S形曲線,則基因型為TT型,如為雙重S形曲線則為CT型。檢測儀器為ABI 7500 Real Time PCR system,分析軟件為SDS V1.4。每個檢測單元均設(shè)立陰性對照及兩個以上重復(fù)樣本,選擇10%樣本復(fù)測以進行實驗質(zhì)量控制。根據(jù)ABI公司設(shè)計引物應(yīng)用BLAST進行序列比對。
1.3 CYP2A13基因序列測序分析及比對 設(shè)計上游引物:CGGACATGATGCCGTCAA,下游引物:GAGGCCACGATGAAGGGAG AT(由賽百盛公司合成),PCR擴增反應(yīng)體系:Taq(5 U/μL)0.2 μL,10×PCR Buffer 5 μL,dNTP 5 μL,模板DNA 2 μL,引物各1 μL,加滅菌蒸餾水至50 μL體系。PCR反應(yīng)條件:95oC預(yù)變性7 min,95oC變性45 s,58oC退火45 s,72oC延伸50 s,72oC再延伸7 min,共30個循環(huán)。采用TA克隆試劑盒p-EASY-T1 Cloning Kit(購自TransGen Biotech),將擴增產(chǎn)物克隆于p-EASY-T1載體中,轉(zhuǎn)染至大腸桿菌感受態(tài)細胞,利用藍白斑及抗生素雙重篩選,選擇30個白斑過夜搖菌后取菌液送測序。
2.1 rs8192789位點(Arg257Cys)基因分型結(jié)果 rs8192789位點在573例人群中只有3例為TT純合型(0.5%),其余均為CT雜合型(圖1)。復(fù)測結(jié)果完全一致,計算分型結(jié)果等位基因C 0.5,等位基因T 0.5。應(yīng)用BLAST比對了引物結(jié)和區(qū)序列,發(fā)現(xiàn)在CYP2A13基因3' 64 kb處有同源序列,同源性97%。
圖 1 CYP2A13基因rs8192789位點實時熒光PCR曲線Fig 1 The real time fluorescence PCR curve for the genotype of CYP2A13 rs8192789
圖 2 圖PC2 R擴PC增R擴 目增的目片的段片 段的的瓊瓊脂脂糖糖電電泳泳圖圖 ( 2692b4p7 bp)FiFgi g 2u r Ae2g a roAsgea groesl ee lgeeclt erolepchtroorpehsoisr eosfi sP oCf RP CpRro pdruocdtusc (t2s2 ,64 97b pbp)
圖 3 PCR產(chǎn)物測序圖Fig 3 Sequence of PCR products
2.2 CYP2A13基因序列分析結(jié)果 PCR擴增目的片段247 bp(圖2),60個樣本測序完全一致,有大量套峰,其中101氨基酸位點處沒有dbSNP數(shù)據(jù)庫中報道的SNP位點(圖3)。將目的片段克隆,隨機挑取30個白斑,搖菌后菌液送測序,結(jié)果示247 bp、235 bp兩個序列,經(jīng)BLAST分析分別為來源于CYP2A13、CYP2A6基因的序列(圖4A,B)。
CYP2A13是P450 II家族最新發(fā)現(xiàn)的一個酶,被認為是人呼吸系統(tǒng)中最常見的細胞色素P450酶,也是最主要的代謝煙草中前致癌物以及黃曲霉素的P450酶[5,11-14]。關(guān)于CYP2A13多態(tài)性與肺癌的關(guān)聯(lián)研究是當前一個活躍的領(lǐng)域,從報道的結(jié)果看,結(jié)論一致而且OR值達到2倍以上,這表明CYP2A13多態(tài)性在肺癌遺傳研究中非常值得關(guān)注[7-10]。CYP2A13基因位于人19號染色體長臂的CYP2A-T基因簇,全長7.3 kb,包括9個外顯子、8個內(nèi)含子,與CYP2A6、CYP2A7序列具有高度同源性,編碼蛋白均為494個氨基酸。由于色素氧化酶P450是一大類參與內(nèi)源性和外源性化合物代謝的酶,因此CYP2A13與其它P450酶也起碼具有40%以上的序列同源性[15]。關(guān)于CYP2A13單核苷酸公布的數(shù)據(jù),在dbSNP數(shù)據(jù)庫中上傳了139個SNP位點,Hapmap數(shù)據(jù)庫于2009年2月公布的最新數(shù)據(jù)報告了6個SNP位點,全部包括在dbSNP中,EGPSNP數(shù)據(jù)庫暫未收錄該基因數(shù)據(jù)。
圖 4 PCR產(chǎn)物克隆測序圖A:CYP2A13序列;B:CYP2A6序列。Fig 4 Sequence of cloned products A: CYP2A13 sequence; B: CYP2A6 sequence.
我們選擇rs8192789位點定制了Taqman探針,該位點位于257位氨基酸位點,密碼子的第一個堿基為T/C,對應(yīng)氨基酸分別為色氨酸、精氨酸。該位點在dbSNP數(shù)據(jù)庫中由Hapmap上傳的數(shù)據(jù)為單一的CT雜合子,而該位點在Hapmap數(shù)據(jù)庫2009年2月公布的最新數(shù)據(jù)中已經(jīng)刪除。Wang[9]利用限制性酶切的方法研究了791例中國漢族正常人群rs8192789位點的基因型頻率,其中CC、CT、TT頻率分別為82.4%、16.4%、1.2%。我們分型的結(jié)果是單一的CT雜合子,同dbSNP數(shù)據(jù)庫中的頻率是一致的,從遺傳的角度來講,這種基因型分布實際上是不可能的。利用引物結(jié)合區(qū)域序列進行了BLAST比對,發(fā)覺引物結(jié)合序列同位于該基因簇的一段假基因有97%同源性,我們認為是該同源序列導(dǎo)致的。雖然Hapmap更新的數(shù)據(jù)庫刪除了rs8192789位點,但我們認為這一位點SNP是應(yīng)該存在的。60例樣本人群的CYP2A13序列測序完全一致,有大量套峰集中分布,包括了dbSNP數(shù)據(jù)中的rs3826712位點,進一步將序列進行了克隆測序,結(jié)果表明為CYP2A6干擾所致,我們認為rs3826712位點可能是不存在的,另外dbSNP數(shù)據(jù)庫中也沒有發(fā)現(xiàn)rs72552266位點。
造成SNP假陽性的原因除了分型技術(shù)誤差外,另一個原因就是由于同源序列導(dǎo)致的干擾,這也可能是導(dǎo)致推斷人類SNP出現(xiàn)頻率差異的主要原因。通過對CYP2A13序列的初步分析,我們認為在dbSNP數(shù)據(jù)庫中的139個SNP位點部分是由于同源序列導(dǎo)致的假陽性的結(jié)果。Hapmap數(shù)據(jù)庫中包含了中國漢族人群的SNP分布,是研究SNP重點參考的數(shù)據(jù)庫[16],但由于工作量龐大,其發(fā)布的數(shù)據(jù)可能也會有疏漏,因此我們在參考這些相關(guān)數(shù)據(jù)時要重點考慮到同源序列導(dǎo)致的對結(jié)果的干擾,以便正確參考應(yīng)用相關(guān)數(shù)據(jù)。
致謝 天津醫(yī)科大學(xué)總醫(yī)院肺癌研究所白云、孫麗亞等對本研究給予的幫助,謹致謝意。