何傳錦,張榮芳,鄒磊,鄭冰潔,宋丹璐,黃景峰,蘭江維
1.蚌埠市公安局,安徽 蚌埠 233040;2.寧波海爾施基因科技有限公司,浙江 寧波 315040;3.西安交通大學(xué)醫(yī)學(xué)部法醫(yī)學(xué)院,陜西 西安 710061;4.南方醫(yī)科大學(xué)法醫(yī)學(xué)院,廣東 廣州510515
Y 染色體的非重組區(qū)呈嚴(yán)格的父系遺傳,故在同一個父系家族中,其男性個體擁有完全相同的Y 染色體單倍型(除突變外)。由于父系遺傳的特性,在一些特定案例中,如與男性有關(guān)的性犯罪、家系排查及父系親緣關(guān)系鑒定實踐中,Y 染色體短串聯(lián)重復(fù)(YSTR)遺傳標(biāo)記分析具有重要作用。同時,Y-STR 重組率低、對遺傳漂變敏感,其等位基因多態(tài)性的分布具有明顯的群體差異,可為法醫(yī)遺傳學(xué)研究提供特有的群體遺傳學(xué)數(shù)據(jù),并可用于家族起源、人類進(jìn)化、遷徙等群體遺傳學(xué)研究[1-3]。
本研究選取安徽蚌埠地區(qū)漢族人群的41 個YSTR 基因座進(jìn)行群體遺傳學(xué)研究,并探討其與16 個群體間的遺傳結(jié)構(gòu)和群體遺傳學(xué)關(guān)系,為在法醫(yī)遺傳學(xué)方面的研究提供基礎(chǔ)數(shù)據(jù)支撐。
采集安徽蚌埠345 例健康無關(guān)的漢族志愿者的外周血樣本,血液保存在FTA 血卡上。在采樣之前,對每位志愿者進(jìn)行充分的告知,并獲取了每位志愿者親筆簽署的書面知情同意書。所有志愿者均聲稱其本人為漢族并且其家族在當(dāng)?shù)鼐幼×酥辽偃1狙芯康玫搅四戏结t(yī)科大學(xué)和西安交通大學(xué)醫(yī)學(xué)部倫理委員會的批準(zhǔn)(審批號:XJTULAC201)。
按照SureID?PathFinder Plus 試劑盒(寧波海爾施基因科技有限公司)說明書,對前述血樣直接進(jìn)行PCR 擴增。在9700 型PCR 儀(美國Thermo Fisher Scientific 公司)上進(jìn)行復(fù)合擴增,反應(yīng)體系為10 μL,其中PCR Master Mix 5 μL、Primer Mix 2.5 μL、一片直徑約為1.2 mm的血斑,最后加純水補足10 μL。熱循環(huán)參數(shù):95 ℃ 5 min;94 ℃ 10 s,60 ℃ 1 min,70 ℃30 s,共29 個循環(huán);60 ℃15min;4 ℃保溫。取1 μL 擴增產(chǎn)物與0.5 μL內(nèi)標(biāo)SIZE-580和8.5 μL HIDI 甲酰胺混合(美國Thermo Fisher Scientific 公司),95 ℃變性3 min 后,迅速放置于冰上冷卻3 min,使用3500xL 基因分析儀(美國Thermo Fisher Scientific 公司)進(jìn)行毛細(xì)管電泳分型檢測,GeneMapper?ID-X軟件(美國Thermo Fisher Scientific 公司)進(jìn)行分型。每批次的檢測均采用DNA 9948(寧波海爾施基因科技有限公司,5 ng/μL)和去離子水分別作為陽性對照和陰性對照。
通過直接計數(shù)法計算等位基因和單倍型頻率?;蚨鄳B(tài)性(gene diversity,GD)、單倍型多樣性(haplotype diversity,HD)、單倍型匹配概率(haplotype match probability,HMP)和分辨能力(discriminative capacity,DC)均按照既往文獻(xiàn)[4]報道的公式進(jìn)行計算。
為了評估不同Y-STR 基因座分型系統(tǒng)在蚌埠漢族中的法醫(yī)學(xué)效能,本研究進(jìn)一步對最小單倍型、常用的Y-STR 分型系統(tǒng)[AmpF?STRTMYfiler’ PCR 擴增試劑盒(美國Applied Biosystems 公司)、YfilerTMPlus PCR 擴增試劑盒(美國Thermo Fisher Scientific公司)、PowerPlex Y 試劑盒和PowerPlex Y23 試劑盒]、AmpF?STRTMYfilerTMPCR 擴增試劑盒中的YSTR位點+快速突變Y-STR(DYF387S1、DYS518、DYS449、DYS576、DYS570、DYS627和DYF404S1)、AmpF?STRTMYfilerTMPCR 擴增試劑盒中的Y-STR 位點+多拷貝Y-STR(DYF387S1、DYS527、DYF404S1)等多種Y-STR 基因座組合進(jìn)行HD 計算。
為了研究蚌埠地區(qū)漢族和中國其他民族之間的群體遺傳學(xué)關(guān)系,通過YHRD 數(shù)據(jù)庫獲得貴州布依族[5]、湖南侗族[6-7]、廣東漢族[8-9]、貴州漢族[10-11]、江蘇漢族[12-13]、江西漢族(登錄號YA004080、YA004388、YA004570)、上海漢族[14-15]、廣西玉林漢族(登錄號YA004624)、新疆蒙古族(登錄號YA004579)、北川地區(qū)羌族(登錄號YA004633)、青海撒拉族(登錄號YA003302)、四川阿壩地區(qū)藏族(登錄號YA004616)、四川藏族[16]、湖南土家族[6]、湖南瑤族[6]、貴陽地區(qū)彝族(登錄號YA004594)共16 個群體的Y-STR 基因座單倍型分布數(shù)據(jù)作為比對數(shù)據(jù)。利用YHRD 網(wǎng)站上的“AMOVA&MDS 工具”進(jìn)行分子方差分析(analysis of molecular variance,AMOVA)和多維尺度分析(multidimensional scaling,MDS)并計算群體間遺傳距離Rst及其P值,使用MEGA6.0 軟件(https://www.megasoftware.net/)采用鄰接(neighbor-joining,NJ)法構(gòu)建蚌埠地區(qū)漢族與16 個比對群體的系統(tǒng)發(fā)育樹。
345 例個體樣本中共檢出343 種單倍型,其中唯一單倍型共341 種,占總單倍型數(shù)的99.42%,HD 值為0.999 966 3。41 個Y-STR 基因座上共觀察到386 個等位基因,其中DYS385a/b、DYF387S1、DYS527、DYF404S1為多拷貝基因座(附表1),分別檢出50、39、34、25 種基因型,其余均為單拷貝基因座,各基因座分別檢出4~15 個等位基因,等位基因頻率分布在0.002 9~0.933 3,GD 值分布在0.126 7(DYS645)~0.963 8(DYS385a/b),詳見表1。
表1 蚌埠地區(qū)漢族人群41 個Y-STR 基因座的基因多態(tài)性Tab.1 Genetic diversities of 41 Y-STR in Bengbu Han population(n=345)
本研究計算得到了最小單倍型、AmpF?STRTMYfilerTMPCR 擴增試劑盒、YfilerTMPlus PCR 擴增試劑盒、PowerPlex Y、PowerPlex Y23、AmpF?STRTMYfilerTMPCR 擴增試劑盒+快速突變Y-STR、AmpF?STRTMYfilerTMPCR擴增試劑盒+多拷貝Y-STR 7種Y-STR分型系統(tǒng)的HD 值,分別為0.998 533 873、0.999 477 587、0.999 915 74、0.999056286、0.999764071、0.99991574 和0.999764071。
選取獲得的蚌埠地區(qū)漢族人群28 個Y-STR(DYS19、DYS389 Ⅰ、DYS389 Ⅱ、DYS390、DYS391、DYS392、DYS393、DYS385a/b、DYS438、DYS439、DYS437、DYS448、DYS456、DYS458、DYS635、YGATAH4、DYS481、DYS533、DYS549、DYS570、DYS576、DYS643、DYF387S1、DYS449、DYS460、DYS518和DYS627)基因座的分型結(jié)果,將其與貴州布依族、湖南侗族、廣東漢族、貴州漢族、江蘇漢族、江西漢族、上海漢族、廣西玉林漢族、新疆蒙古族、北川地區(qū)羌族、青海撒拉族、四川阿壩地區(qū)藏族、四川藏族、湖南土家族、湖南瑤族、貴陽地區(qū)彝族的分型數(shù)據(jù)進(jìn)行比較,通過AMOVA 得到17 個群體間的遺傳距離并繪制MDS 圖(圖1)。
圖1 基于Rst值的蚌埠地區(qū)漢族與其他16 個群體的多維尺度分析圖Fig.1 Multidimensional scaling plot of Bengbu Han and other 16 reference populations based on Rst values
MDS 結(jié)果顯示,蚌埠地區(qū)漢族與江蘇漢族、上海漢族等中國東部漢族群體聚類在一起,與其他民族的遺傳關(guān)系較遠(yuǎn),此外也發(fā)現(xiàn),湖南瑤族、湖南侗族、湖南土家族、北川地區(qū)羌族與南方漢族群體聚類在一起(圖1)。
遺傳距離的計算結(jié)果(表2)顯示,蚌埠地區(qū)漢族與江蘇漢族遺傳距離最?。≧st=0.006 7),與廣東漢族男性遺傳距離最大(Rst=0.035 5)。基于28 個Y-STR 基因座組合的17 個群體之間的Rst值,采用NJ 法得到系統(tǒng)發(fā)育樹(圖2)。系統(tǒng)發(fā)育樹中,不同的顏色代表不同群體的語系,系統(tǒng)發(fā)育分析的結(jié)果顯示:整個系統(tǒng)發(fā)育樹分為兩個大支,藏族的兩個群體聚類在一起,形成其中的一個分支,其余群體組成另一個分支。在第二個分支中,大部分漢藏語系的群體聚類在一起。本研究的蚌埠地區(qū)漢族首先與江蘇漢族、上海漢族和江西漢族聚類在一起,然后再與廣西玉林漢族聚類在一起。
表2 基于Maximal基因座組合28 個Y-STR 基因座計算蚌埠地區(qū)漢族與其他16 個群體的遺傳距離(Rst)Tab.2 Genetic distances(Rst)between Bengbu Han and 16 reference populations based on 27 Y-STR
圖2 基于群體配對Rst值構(gòu)建蚌埠地區(qū)漢族與其他16 個群體的系統(tǒng)發(fā)育樹Fig.2 Phylogenetic tree of the studied Bengbu Han and other 16 reference populations based on Rst values
本研究所使用的SureID?PathFinder Plus 試劑盒是由寧波海爾施基因科技有限公司研發(fā),包含41個Y-STR 基因座。該試劑盒采用六色熒光標(biāo)記系統(tǒng),除了包含YfilerTMPlus PCR 擴增試劑盒的基因座之外,還包含了其他12 個Y-STR 基因座(DYS645、DYS557、DYF387S1、DYS596、DYS518、DYS596、DYS518、DYS449、DYS593、DYS549、DYS576、DYS570、DYS627和DYF404S1)和3 個Y 染色體插入/缺失基因座(rs199815934、rs771783753 和rs759551978)。本研究中41 個Y-STR 基因座在345 例蚌埠地區(qū)漢族無關(guān)男性個體中共觀察到343 種單倍型,41 個Y-STR 基因座所組成的HD 值為0.999 966 3。41 個Y-STR 基因座上共觀察到386 個等位基因,等位基因頻率分布在0.002 9~0.933 3,GD 值為0.126 7~0.963 8,除DYS388、DYS645、DYS438、DYS3914 個基因座GD 值小于0.5外,其余基因座GD 值均大于0.5,表明這些基因座在蚌埠地區(qū)漢族人群中具有較好的遺傳多態(tài)性。此外,本研究對不同Y-STR 基因座組合的法醫(yī)學(xué)效能評估進(jìn)行了評估,結(jié)果表明,隨著Y-STR 位點的增加,Y-STR基因座組合的鑒別效能進(jìn)一步提升。同時,快速突變基因座及多拷貝基因座的引入進(jìn)一步增加了整個YSTR 系統(tǒng)的鑒別能力。4 個多拷貝基因座DYS385a/b、DYF387S1、DYS527、DYF404S1的遺傳多態(tài)性最高,分布在0.904 5(DYF404S1)~0.963 8(DYS385a/b)。DYS385a/b基因座GD 值最高與國內(nèi)相關(guān)文獻(xiàn)[17-19]報道的漢族遺傳數(shù)據(jù)結(jié)果具有一致性。
345 例樣本中,檢測到4 個稀有等位基因DYS518(36.2)、DYS627(19.2)、DYF387S1(37.2)、DYF404S1(13.2)。稀有等位基因一般是指出現(xiàn)在等位基因分型標(biāo)準(zhǔn)品之外的等位基因,這些等位基因在群體中的頻率較低。稀有等位基因?qū)儆谖⒆儺悾撟儺惖某霈F(xiàn)與等位基因的突變引起重復(fù)序列中核苷酸的缺失、插入、轉(zhuǎn)換或者顛換有關(guān)[20]。稀有等位基因的產(chǎn)生可以形成更多的單倍型,并且遵循孟德爾遺傳定律,可以遺傳給后代[21-22]。通過文獻(xiàn)檢索,發(fā)現(xiàn)4個稀有等位基因在金華地區(qū)漢族、山東漢族、廣西漢族、湖南苗族和湖南土家族等群體中均有報道[6,23-25]。這些稀有等位基因的出現(xiàn),在法醫(yī)學(xué)應(yīng)用實踐中可以發(fā)揮重要的作用,尤其是在對同一家系的不同個體進(jìn)行個體識別時有著重要的應(yīng)用價值。
為進(jìn)一步評估蚌埠地區(qū)漢族與中國其他地區(qū)民族的遺傳關(guān)系,本研究基于28 個Y-STR 基因座組合的Rst值,采用NJ 法構(gòu)建了系統(tǒng)發(fā)育樹。整個系統(tǒng)發(fā)育樹明顯分為兩支:兩個藏族群體聚類在一起成為一支,其他民族聚集在另一支。蚌埠地區(qū)漢族與中國大多數(shù)南方漢族群體聚類在一起,如江蘇漢族、上海漢族、廣西玉林漢族和江西漢族等群體,表明蚌埠漢族與大多數(shù)南方漢族群體具有較近的遺傳關(guān)系,這一結(jié)果與安徽人口的移民歷史是一致的。蚌埠位于安徽省北部,安徽的人口以外來漢族移民的后代為主,特別是江西人,以發(fā)生在明朝早期的洪武大移民為最大規(guī)模[26]。長期以來蚌埠漢族與南方其他地區(qū)漢族的混居、通婚可能導(dǎo)致蚌埠地區(qū)漢族與南方漢族有著較近的遺傳關(guān)系。
漢族是我國、也是世界上人口最多的民族,分布最廣,漢族的遺傳結(jié)構(gòu)對于研究大型民族的人口擴張有代表性意義。基于Rst矩陣構(gòu)建的MDS 圖顯示,湖南瑤族、湖南侗族、湖南土家族、北川地區(qū)羌族與南方漢族群體聚類在一起,這和漢文化擴張引起的近期基因交流是密切相關(guān)的[27-30]。
本研究的41 個Y-STR 基因座在蚌埠地區(qū)漢族群體中有著較高的遺傳多態(tài)性,適用于法醫(yī)學(xué)個體識別、親權(quán)關(guān)系鑒定,可以滿足家系排查的需求,研究獲得的數(shù)據(jù)可以為構(gòu)建該地區(qū)民族Y-STR 數(shù)據(jù)庫提供數(shù)據(jù)支撐。對蚌埠地區(qū)漢族及其他省份16 個群體的群體遺傳學(xué)研究表明,蚌埠地區(qū)漢族與南方漢族群體有著更近的遺傳關(guān)系。