張立男 ,宋雨桐 ,姜磊 ,朱如心 ,李莉
(1.司法鑒定科學(xué)研究院 上海市法醫(yī)學(xué)重點實驗室 上海市司法鑒定專業(yè)技術(shù)服務(wù)平臺,上海 200063;2.華東政法大學(xué),上海 200063)
單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是指在基因組水平上由單個核苷酸變異引起的DNA序列多態(tài)性,是人類可遺傳變異中最常見的一種,占所有已知多態(tài)性的90%以上。SNP具有突變率低、可穩(wěn)定遺傳、部分位點與個體外觀表現(xiàn)有關(guān)[1]、有利于降解檢材分析[2]、便于高通量自動化分型檢測等優(yōu)點[3]。
Y染色體為男性特有的性染色體,除非發(fā)生突變,否則同一父系的男性后代均具有相同的單倍型,故可以用來揭示不同人群的起源、遷徙及親緣關(guān)系等。Y染色體上SNP位點(Y-SNP)分型檢測方法的建立,可以輔助現(xiàn)有的Y-STR檢測體系,協(xié)助進行疑難案件的鑒定。本研究采用多重PCR聯(lián)合基質(zhì)輔助激光解吸/電離-飛行時間質(zhì)譜(matrix-assisted laser desorption/ionization time-of-flight mass spectrometry,MALDI-TOF-MS)技術(shù)對西北漢族人群71個Y-SNP位點進行多態(tài)性調(diào)查,并結(jié)合前期研究所得,篩選同時適用于西北、華南和華東漢族群體的位點,旨在為法醫(yī)學(xué)應(yīng)用提供基礎(chǔ)數(shù)據(jù)。
在知情同意原則下,收集西北新疆地區(qū)漢族男性無關(guān)個體血樣202份,每份樣本取200μL。
DNA抽提試劑盒QIAamp DNA Blood Mini試劑盒(德國Qiagen公司),基因分型系統(tǒng)Complete iPLEX?Gold Genotyping Reagent Sets(96 Format,美國 Agena公司),9700型PCR儀(美國AB公司),MassARRAY?飛行時間質(zhì)譜儀、MassARRAY?納升點樣儀RS1000(美國Agena公司),MassARRAY Typer 4.0軟件(美國Agena公司)。
通過Y染色體系統(tǒng)樹、Hapmap數(shù)據(jù)庫[4]、美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)數(shù)據(jù)庫[5]進行檢索,結(jié)合《法醫(yī)SNP分型與應(yīng)用規(guī)范》(SF/Z JD0105003—2015)的要求,從Y染色體上篩選出在東亞人群中具有多態(tài)性的71個SNP位點,用Agena Bioscience公司的在線工具[6]設(shè)計用于PCR擴增的引物和單堿基延伸反應(yīng)的引物。
依據(jù)各個位點之間的距離并避免引物之間的相互干擾,將71個位點分成W1、W2、W3復(fù)合體系(表1)進行檢測,PCR擴增子的大小為80~120bp,單堿基延伸產(chǎn)物的相對分子質(zhì)量為4429~8710。
表1 3個復(fù)合擴增體系所包含的Y-SNP位點
用QIAamp DNA Blood Mini試劑盒進行DNA抽提。擴增體系為5 μL,含10×PCR緩沖液0.5 μL、25 mmol/L MgCl20.4 μL、PCR 引物混合液 0.5 μL、25mmol/L dNTP混合液0.1μL、5U/μL PCR酶0.1μL、純水 1.4 μL、模板DNA 溶液 2 μL。PCR 循環(huán)參數(shù):95℃ 2 min;95℃ 30 s,56℃ 30 s,72℃ 60 s,45個循環(huán);72℃ 5 min。PCR擴增結(jié)束后,加入1.7 U/μL蝦堿性磷酸酶(shrimp alkaline phosphatase,SAP)0.30 μL、SAP 緩沖液0.17 μL 和超純水 1.53 μL,按下述條件進行酶切反應(yīng):37℃ 40min,85℃ 5min。
在純化后的產(chǎn)物中加入10×iPLEX?緩沖液0.20μL、單堿基延伸引物混合液0.94μL、10×iPLEX?終止 混合物 0.20 μL、iPLEX?酶 0.04 μL、超純水0.62μL,按下列條件進行單堿基延伸反應(yīng):94℃ 5s;52℃ 5s,80℃ 5s,5次小循環(huán);40次大循環(huán)。
按參考文獻[7]中的方法對產(chǎn)物脫鹽后,使用Mass-ARRAY?納升點樣儀RS1000將反應(yīng)產(chǎn)物點樣至芯片上(點樣量控制在8~12nL),將點樣完畢的芯片放入MassARRAY?飛行時間質(zhì)譜儀進行質(zhì)譜檢測,用Mass-ARRAY Typer 4.0軟件查看分型結(jié)果。
用直接計數(shù)法計算各Y-SNP位點在西北漢族無關(guān)男性人群中的等位基因頻率,基因多樣性(gene di-versity,GD)計算公式:
式中,n為樣本數(shù),fi為第i個等位基因的分布頻率。單倍型多樣性(haplotype diversity,HD)[8]計算公式:
式中,n為單倍型數(shù),Pi為第i個單倍型的頻率。用Arlequin v3.5軟件[9]計算單倍型頻率、Fst值和P值,并進行群體遺傳學(xué)比較。Fst是種群分化和遺傳距離的一種衡量方法,WRIGHT[10]建議:Fst為 0~0.05,群體間遺傳分化可以不考慮;Fst為0.05~0.15,群體間存在中等程度的遺傳分化;Fst為0.15~0.25,群體間遺傳分化較大;Fst>0.25,則群體間有很大的遺傳分化。
經(jīng)過實驗和統(tǒng)計,得到西北地區(qū)漢族無關(guān)男性人群71個Y-SNP位點的等位基因頻率數(shù)據(jù)和GD值,有67個位點在西北漢族人群中呈多態(tài)性分布,詳見表2。
表2 西北漢族無關(guān)男性人群71個Y-SNP位點的等位基因頻率和GD值 (n=202)
表2顯示,在所選擇的位點中除M148、rs2032645、rs9306841、SRY8299外,其余67個位點都具有多態(tài)性,GD值在0.0100(rs11575897和rs9341278)~0.5022(rs17276358)。中度信息量(0.2≤GD<0.3)的位點有22個(M117、M119、rs2032631、rs2032652、rs2032678、rs2075181、 rs35284970、 rs16980391、 rs16980396、rs3900、rs4589047、rs52812045、rs7067458、rs17174528、rs17250121、rs9306845、rs9306848、rs9785908、rs17276777、rs9786502、rs9786707、rs17842387),高度信息量(GD≥0.3)的位點有25個(M122、M134、rs2032674、rs11096432、rs2196155、rs13447361、rs2267801、rs16980363、rs3853054、rs16980426、rs16980601、rs16980610、rs16980641、rs16981290、rs917759、rs17269396、rs17269816、rs17269928、rs17286338、rs17276358、rs9786394、rs17316007、rs17316543、rs17316592、rs17323322)。
使用Arlequin v3.5統(tǒng)計軟件分析71個Y-SNP位點的單倍型發(fā)現(xiàn),本群體共有170種單倍型,其中頻率最高的為0.034 8(7/202),頻率最低的只有0.005 0(1/202)。經(jīng)計算,HD為0.9930。
結(jié)合前期的實驗結(jié)果[7,11],用 Arlequin v3.5 軟件計算Fst值和P值,對華東、華南和西北漢族無關(guān)男性人群的等位基因分布進行比對分析(表3)。
表3 71個Y-SNP位點在華東、華南和西北漢族無關(guān)男性人群的等位基因分布差異
續(xù)表3
表3數(shù)據(jù)顯示:華東與西北漢族無關(guān)男性群體之間有7個位點存在中等程度以上的分化,華東與華南之間只有4個位點存在中等程度以上的分化,西北與華南之間有15個位點存在中等程度以上的分化。
71個位點中,分別有11個位點在華東與西北漢族群體的差異具有統(tǒng)計學(xué)意義(P<0.05)、8個位點在華東與華南漢族群體的差異具有統(tǒng)計學(xué)意義(P<0.05)、36個位點在華南與西北漢族群體的差異具有統(tǒng)計學(xué)意義(P<0.05)。
結(jié)合本實驗結(jié)果與前期研究取得的華南、華東漢族群體的遺傳學(xué)數(shù)據(jù)[7,11],通過評價GD值,篩選出在西北、華南和華東群體具有較高信息量的Y-SNP位點。統(tǒng)計結(jié)果表明,在西北、華東和華南3個地域群體均具有應(yīng)用價值的Y-SNP位點共有26個(表4)。
表4 在西北、華東和華南漢族群體中具有中、高度信息量的位點
續(xù)表4
觀察本實驗結(jié)果,分析檢測的71個Y-SNP位點在西北漢族無關(guān)男性人群的多態(tài)性及等位基因分布頻率,可知有67個Y-SNP在西北漢族男性人群中呈多態(tài)性分布,GD值在0.010 0~0.502 2,中度信息量(0.2≤GD<0.3)的位點有22個,高度信息量(GD≥0.3)的位點有25個。本課題組前期研究結(jié)果[7,11]顯示,華南和華東漢族人群中分別有66、67個位點存在遺傳多樣性,中度信息量的分別有18、31個,高度信息量的分別有13、18個,整合本研究結(jié)果可知,同時適用于西北、華南和華東群體的中高度信息量的位點有26個。他們在親權(quán)鑒定和個體識別中具有一定的應(yīng)用價值,可以作為STR、Y-STR檢測的補充。
經(jīng)比較分析P值,發(fā)現(xiàn)華南和西北漢族群體之間的差異最大,華東與西北漢族群體之間的差異次之,華東與華南漢族群體之間的差異最小。分析比較Fst值發(fā)現(xiàn),西北與華南之間分化的程度最高,華東與西北漢族無關(guān)男性群體之間分化程度居中,華東與華南之間分化程度最低。由此可見,Y染色體上SNP標記的等位基因分布具有一定的地域差異,用于法醫(yī)學(xué)鑒定時,需要使用相應(yīng)區(qū)域的群體遺傳學(xué)數(shù)據(jù)。
目前,SNP在法醫(yī)學(xué)中的研究主要有兩個方面:(1)對SNP位點進行篩選,獲得不同人群的分布頻率,建立數(shù)據(jù)庫,用于個體識別和親權(quán)鑒定;(2)對SNP位點的功能進行分析,通過對現(xiàn)場遺留的生物檢材的部分位點進行分型,提供嫌疑人的一些特征,如毛發(fā)顏色、眼睛顏色等[12]。
本研究對西北漢族男性無關(guān)個體的71個Y-SNP位點進行分析,共檢測出170種單倍型,其中頻率最高的為0.034 8(7/202),頻率最低的只有0.005 0(1/202)。HD為0.993 0,得到了較大的群體遺傳信息,可應(yīng)用于涉及男性的個體識別和親權(quán)鑒定的案例中。例如,在進行父系關(guān)系檢驗的時候,某些情況下僅僅憑借Y-STR分型的結(jié)果難以出具鑒定意見,不能因為幾個STR的分型結(jié)果不同而否定父系關(guān)系[13],針對這種案例,對高信息量的Y-SNP位點進行分型檢測可以視為一種補充鑒定的手段。
同時,本實驗也比對了華南、華東地區(qū)漢族男性Y-SNP位點的分布特點,篩選出26個在西北、華南和華東漢族具有普適性的位點,這將有助于完善法醫(yī)DNA檢驗手段。