錢(qián)恩芳 ,鄧盼 ,黃美莎 ,馬泉 ,趙慧 ,李彩霞 ,黃江 ,江麗
(1.貴州醫(yī)科大學(xué)法醫(yī)學(xué)院,貴州 貴陽(yáng) 550004;2.公安部物證鑒定中心 法醫(yī)遺傳學(xué)公安部重點(diǎn)實(shí)驗(yàn)室北京市現(xiàn)場(chǎng)物證檢驗(yàn)工程技術(shù)研究中心 現(xiàn)場(chǎng)物證溯源技術(shù)國(guó)家工程實(shí)驗(yàn)室,北京 100038;3.株洲市公安局,湖南 株洲 412007;4.山西醫(yī)科大學(xué)法醫(yī)學(xué)院,山西 太原 030001)
Y染色體為男性特有的性染色體,約95%區(qū)域?yàn)榉侵亟M區(qū),呈父系遺傳[1]。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)為二等位基因遺傳標(biāo)記,突變率較短串聯(lián)重復(fù)(short tandem repeat,STR)序列低,回復(fù)突變和二次突變少,具有較高的遺傳穩(wěn)定性。Y染色體SNP(Y-SNP)在族群地理中的分布具有特異性,在不同族群和不同地區(qū)范圍內(nèi)具有特有的譜系分布,是研究人類(lèi)父系遷移及進(jìn)化的理想遺傳標(biāo)記[2-4]。Y染色體D-M174單倍群是從非洲的YAP+位點(diǎn)分化出來(lái)的,主要分布在安達(dá)曼島、中國(guó)西藏和日本[5-8]。目前法醫(yī)學(xué)領(lǐng)域常用的祖先信息遺傳標(biāo)記大多位于常染色體上,可區(qū)分的族群為3~10個(gè),在東亞族群及混合族群中分辨力不足[9-14]。Y染色體單倍群的族群地理特異性可為男性生物樣本的族群地理來(lái)源推測(cè)提供更多生物信息[15-16]。本研究觀察了Y染色體D-M174單倍群及下游分支D1-CTS11577、D1a-F6251、D1a1-M15、D1a2-P99、D1b-M64.1 和 D2-L1378共7個(gè)Y染色體單倍群在東亞22個(gè)族群中的遺傳分布特點(diǎn),同時(shí)對(duì)共享單倍群內(nèi)個(gè)體的Y染色體STR(Y-STR)進(jìn)行檢測(cè)和分析。本研究將進(jìn)一步揭示Y染色體D單倍群及其下游分支在東亞人群中的分布特征,為法醫(yī)學(xué)應(yīng)用及群體遺傳學(xué)等提供基礎(chǔ)數(shù)據(jù)。
本研究的群體樣本包括22個(gè)東亞族群、1個(gè)歐洲族群、1個(gè)非洲族群,共1426例無(wú)關(guān)男性個(gè)體(表1)。所有樣本對(duì)象均簽署知情同意書(shū)。本研究已通過(guò)公安部物證鑒定中心倫理委員會(huì)的審查批準(zhǔn)。
1~20號(hào)群體樣本為靜脈血,DNA提取采用QIAamp?DNA Blood Mini試劑盒(德國(guó)Qiagen公司)。21~24號(hào)群體樣本為細(xì)胞系,提取后DNA使用NanoDrop 2000c分光光度計(jì)(美國(guó)Thermo Scientific公司)進(jìn)行定量。
表1 24個(gè)群體樣本信息
1.2.1 Y-SNP遺傳標(biāo)記
選取的位點(diǎn)為2017版Y染色體譜系樹(shù)(YCC:https://isogg.org/)上主要D單倍群及主要的下游分支,包括M174、CTS11577、F6251、M15、M64.1、P99、L1378。7個(gè)Y-SNP單倍群構(gòu)成的譜系樹(shù)見(jiàn)圖1。PCR擴(kuò)增引物和延伸引物用Primer Premier5.0軟件設(shè)計(jì),由生工生物工程(上海)股份有限公司合成。
圖1 D-M174單倍群譜系樹(shù)
采用Applied BiosystemsTMSNaPshotTMMultiplex試劑盒(美國(guó)AB公司)對(duì)樣本在7個(gè)Y-SNP位點(diǎn)上的分型進(jìn)行檢測(cè),檢測(cè)方法見(jiàn)文獻(xiàn)[17]。使用Mastercycler?Pro梯度PCR擴(kuò)增儀(德國(guó)Eppendorf公司)進(jìn)行PCR擴(kuò)增,使用3130xl基因分析儀(美國(guó)AB公司)進(jìn)行毛細(xì)管電泳檢測(cè)。利用GeneMapperIDv3.2軟件(美國(guó)Thermo Fisher Scientific公司)分析分型結(jié)果。
1.2.2 Y-STR遺傳標(biāo)記
采用DNATyperTMY26 PCR試劑盒[18](公安部物證鑒定中心)檢測(cè)樣本在22個(gè)Y-STR基因座(DYS19、DYS389Ⅰ、DYS389Ⅱ、DYS390、DYS391、DYS392、DYS393、DYS437、DYS438、DYS439、DYS444、DYS447、DYS448、DYS456、DYS458、DYS460、DYS508、DYS522、DYS533、DYS617、DYS635和GATA-H4)上的分型。使用Mastercycler?Pro梯度PCR擴(kuò)增儀進(jìn)行PCR擴(kuò)增,使用3130xl基因分析儀進(jìn)行毛細(xì)管電泳檢測(cè)。利用GeneMapperIDv3.2軟件(美國(guó)Thermo Fisher Scientific公司)分析分型結(jié)果。
基于圖1譜系樹(shù),根據(jù)各樣本在7個(gè)Y-SNP位點(diǎn)上的分型判斷其所屬單倍群類(lèi)別,用直接計(jì)數(shù)法統(tǒng)計(jì)各單倍群頻率。根據(jù)單倍群頻率分布,使用R v3.2.3軟件繪制熱圖,進(jìn)行聚類(lèi)分析。根據(jù)22個(gè)Y-STR基因座的等位基因頻率,使用PHYLIP v3.65構(gòu)建系統(tǒng)進(jìn)化樹(shù)。對(duì)共享Y-SNP單倍群的個(gè)體,使用Network v5.022軟件(英國(guó)Fluxus Technology公司)繪制網(wǎng)絡(luò)圖。
根據(jù)國(guó)際Y染色體協(xié)會(huì)的命名法則,7個(gè)Y-SNP位點(diǎn)共組成7種單倍群(圖1)。在24個(gè)族群中共檢測(cè)出5種單倍群,未見(jiàn)D1*和D2單倍群的分布(圖2)。在非洲黑人和歐洲白人中未發(fā)現(xiàn)D*及其下游單倍群的分布。在東亞族群中,單倍群D-M174在西藏藏族人中的頻率達(dá)到40.96%,在日本人中的頻率為35.71%,在四川西昌彝族人中有17.86%的分布,青海土族人中有11.86%的分布,而在余下的群體中分布頻率更低(均低于8%)。D單倍群的下游分支在東亞不同族群中的分布頻率有明顯差異。單倍群D1a1-M15散布于以藏族(10.26%)為主的東亞族群中。單倍群D1a2-P99在藏族中檢測(cè)頻率最高(26.92%),而在其他群體中零星分布。除了在藏族中檢測(cè)到1例,單倍群D1b-M64.1只分布在日本(28.57%)。
圖2 24個(gè)群體Y-SNP單倍群分布熱圖
從圖2左側(cè)的系譜樹(shù)可以看出:西藏藏族人和日本人在D單倍群上高頻分布而聚為一支,但是西藏藏族人在D1a2單倍群上高頻分布,日本人在D1b單倍群上高頻分布,因而各自聚為一小類(lèi)支;青海裕固族人、廣西京族人、青海土族人、四川西昌彝族人在D單倍群上有較高頻率分布而聚為一類(lèi)支;廣西侗族人、河南漢族人、新疆回族人、新疆維吾爾人、青海撒拉族人、新疆哈薩克族人、非洲黑人、韓國(guó)人、青海回族人、歐洲白人、廣西壯族人、廣西瑤族人、云南佤族人、新疆塔吉克族人、廣西苗族人、五峰漢族人、廣西漢族人、青海漢族人在D單倍群上低頻分布或無(wú)分布而聚為一大類(lèi)支。
基于24個(gè)族群在22個(gè)Y-STR基因座上的等位基因頻率構(gòu)建系統(tǒng)進(jìn)化樹(shù)(圖3),以非洲黑人為進(jìn)化樹(shù)的根節(jié)點(diǎn),24個(gè)族群主要分為兩類(lèi):一類(lèi)為新疆塔吉克族人、歐洲白人、新疆維吾爾族人、青海撒拉族人、新疆回族人;另一類(lèi)為余下18個(gè)族群聚為一大類(lèi),其中西藏藏族人和四川西昌彝族人聚為一小類(lèi),日本人和韓國(guó)人聚為一小類(lèi)。
圖3 24個(gè)族群系統(tǒng)進(jìn)化樹(shù)
應(yīng)用鄰接法對(duì)Y染色體單倍群D1-CTS11577、D1a-F6251、D1a1-M15、D1a2-P99、D1b-M64.1分別繪制網(wǎng)絡(luò)圖(圖4),進(jìn)一步分析D單倍群在東亞族群的遺傳關(guān)系。結(jié)果顯示,在D1-CTS11577單倍群下,西藏藏族人相對(duì)緊密聚類(lèi)位于網(wǎng)絡(luò)圖的中心,日本人緊密聚為一大類(lèi)。其他有D單倍群的族群散在分布于藏族族群周邊位置。在下游分支單倍群中,D1a2-P99單倍群西藏藏族人分布最多,D1b-M64.1單倍群基本上是日本人分布,僅有1例是西藏藏族人。D1a1單倍群則是各個(gè)不同族群所共享的單倍群,西藏藏族人和四川彝族人頻率較高,分別為10.26%和12.5%,其他民族頻率較低(<7%)。
圖4 Y染色體單倍群D1-CTS11577、D1a-F6251、D1a1-M15、D1a2-P99、D1b-M64.1的Y-STR網(wǎng)絡(luò)圖
單倍群D是從非洲YAP插入單倍群衍生出來(lái)的[19],在全球的分布具有明顯的地域特異性。D-M174單倍群高頻分布于東亞,主要分布于西藏藏族人和日本人(30%~40%),在東亞其他族群、東亞周邊(中亞、北亞、中東)族群等罕見(jiàn),分布頻率通常低于5%[20]。
本研究中D單倍群在藏族和日本高頻分布,分別為40.96%和35.71%。在東亞其他族群中有低頻分布或沒(méi)有分布,研究結(jié)果與以往文獻(xiàn)[6]報(bào)道一致。D單倍群的下游分支在不同族群中的分布頻率不同。D1-M15(現(xiàn)已更名為D1a1-M15)在青海藏族人、西藏藏族人、四川涼山彝族人、云南彝族人中廣泛分布,在東亞其他群體中也有低頻分布[21]。D1a1-M15廣泛分布于西藏藏族人、四川西昌彝族人、廣西京族人、青海裕固族人,低頻分布于河南漢族、青海土族、廣西侗族、新疆回族和日本族群中。本研究結(jié)果發(fā)現(xiàn),D1a2高頻分布于西藏藏族人,同時(shí)在其他東亞族群中低頻分布,印證了既往研究結(jié)果[22-23],即D1a2-P99下游分支P47位點(diǎn)突變僅在藏緬族群中出現(xiàn)。日本人主要是M55、M57、M64等突變位點(diǎn)界定的單倍群[22],是上古繩文人的主要成分[6]。本研究中,D1b-M64.1單倍群除了在西藏藏族人群中檢測(cè)到1例外,都分布在日本人中,頻率達(dá)到28.57%。但是,文獻(xiàn)報(bào)道[24]與M64.1平行的M57、M55、P37.1位點(diǎn)僅在日本人中檢測(cè)到,在日本人以外的地區(qū)非常罕見(jiàn),這可能是樣本量少或近期基因流動(dòng)所致。單倍群D1a2-P99和D1b-M64.1的分布具有較強(qiáng)的族群特異性。
Y-SNP突變率較低,遺傳穩(wěn)定性高,包含更多關(guān)于群體的歷史信息,可反映人類(lèi)父系的遺傳特征,并追溯久遠(yuǎn)的歷史進(jìn)化事件,而Y-STR突變率較高,可反映起源相同群體近期基因交流。例如,西藏藏族人與日本人的D單倍群頻率的族群聚類(lèi)結(jié)果(圖2)與Y-STR頻率數(shù)據(jù)的系統(tǒng)發(fā)育樹(shù)聚類(lèi)結(jié)果(圖3)基本一致,系統(tǒng)發(fā)育樹(shù)將亞族群進(jìn)一步細(xì)分和聚類(lèi)。西藏藏族人和四川西昌彝族人的D單倍型聚類(lèi)結(jié)果與YSTR系統(tǒng)發(fā)育樹(shù)聚類(lèi)結(jié)果不一致,D單倍群聚類(lèi)中西藏藏族人和四川西昌彝族人分別聚類(lèi),表明歷史上兩族群由于交通閉塞、不通婚等因素各自進(jìn)化;而在進(jìn)化樹(shù)中聚在一起,可能在人類(lèi)社會(huì)發(fā)展中,族群間遷徙、通婚等動(dòng)態(tài)變化過(guò)程可能會(huì)影響族群間遺傳成分。遺傳關(guān)系網(wǎng)絡(luò)圖聚類(lèi)結(jié)果也表明,各個(gè)單倍群下游的樣本間呈現(xiàn)以同一族群小范圍內(nèi)聚集的現(xiàn)象,表明在一定范圍內(nèi),同一族群內(nèi)的樣本間遺傳關(guān)系更為密切。遺傳關(guān)系較近的族群間,樣本分布呈現(xiàn)相互交叉的情況,表明可能在歷史上存在一定的基因交流。遺傳關(guān)系較遠(yuǎn)的族群間交叉的情況較少。
基于Y-SNP單倍群及其下游分支在世界人群中的地域分布特點(diǎn),通過(guò)檢測(cè)Y染色體單倍群可推測(cè)樣本的父系族群來(lái)源。BRIóN等[16]用Y-SNP分型方法預(yù)測(cè)男性地理來(lái)源,能區(qū)分世界范圍內(nèi)主要地區(qū)的人群,認(rèn)為推斷未知樣本的種族地域來(lái)源在刑事案件調(diào)查階段具有巨大的價(jià)值。Y-SNP單倍群的下游細(xì)小分支在小范圍內(nèi)具有明顯的地域差異性,可為法庭提供科學(xué)證據(jù)[25-26]。D單倍群在東亞族群中具有明顯的族群地域分布特征,高頻分布于西藏藏族人(40.96%)和日本人(35.71%),在平原漢族中分布低(<3%),其中26.92%藏族人主要為D1a2-P99亞單倍群,28.57%日本人主要為D1b-M64.1亞單倍群。目前,洲際人群推斷技術(shù)已非常成熟[12,14,27-28],D 單倍群的族群特異性分布特征為進(jìn)一步細(xì)分東亞亞人群提供了新的視角,可進(jìn)一步完善法醫(yī)SNP族群地域推斷體系,為刑事案件偵查提供科學(xué)依據(jù)。值得注意的是,O單倍群在東亞族群中均占相當(dāng)一部分比例[22,29],未來(lái)可采集更多不同地域典型族群樣本,并對(duì)該單倍群及其下游分支進(jìn)行更細(xì)分的研究。此外,Y-SNP只是從父系的遺傳上進(jìn)行族群地域的推斷,缺乏母系的遺傳信息。有學(xué)者[30]提出,將Y染色體、常染色體和線粒體進(jìn)行綜合分析,能夠獲得更加準(zhǔn)確的祖先地域推斷。下一步,我們將結(jié)合常染色體及線粒體DNA遺傳信息進(jìn)行相關(guān)研究,得到更為完善的推斷證據(jù),該技術(shù)方法在東亞人群及混合人群的族群地域推斷中具有潛在應(yīng)用價(jià)值。