劉媛媛, 陳靜, 張晗, 金珊珊, 劉頂浪, 羅雍蘭, 周林, 季晶焱
(貴州醫(yī)科大學(xué) 法醫(yī)學(xué)院, 貴州 貴陽(yáng) 550004)
貴州省是中國(guó)民族最多樣化的省份之一,由于境內(nèi)地形山脈眾多,使得各民族人群在空間上得以獨(dú)立存在,形成其獨(dú)特的基因類型。苗族素有“世界民族”之稱,不僅在中國(guó)境內(nèi)有廣泛的分布,在歐洲,美洲等地也有分布。作為貴州省內(nèi)人口數(shù)量最多的少數(shù)民族,其遺傳結(jié)構(gòu)以及與其他人群間的遺傳關(guān)系一直是研究熱點(diǎn)[1]。人類Y染色體為正常男性所特有,其約95%的區(qū)域?yàn)榉侵亟M區(qū),具有單倍型連鎖遺傳及父系遺傳等特點(diǎn);擬常染色體區(qū)約占5%,減數(shù)分裂時(shí)可以發(fā)生交換[2-3]。Y染色體上的遺傳標(biāo)記具有男性獨(dú)特遺傳、地域特異性等優(yōu)勢(shì),使其廣泛地運(yùn)用于復(fù)雜親緣關(guān)系識(shí)別、個(gè)體識(shí)別、群體遺傳學(xué)以及人類起源、遷徙和進(jìn)化的研究中[4],在法醫(yī)鑒定中用于父系家族關(guān)系鑒定、混合斑男性個(gè)體檢驗(yàn)等[5]。評(píng)估Y-STR鑒別能力的法醫(yī)學(xué)參數(shù)是遺傳差異度(genetic diversity, GD),對(duì)于連鎖的遺傳標(biāo)記,不能采用乘積定律,需先計(jì)算單倍型頻率,再計(jì)算個(gè)人識(shí)別率[6]。本研究使用Y filerTMPlus試劑盒,對(duì)貴州苗族的27個(gè)Y-STR基因座(DYS19,DYS385a/b,DYF387S1a/b,DYS389I/II,DYS390,DYS391,DYS392,DYS393,DYS437,DYS438,DYS439,DYS448,DYS449,DYS456,DYS458,DYS460,DYS481,DYS518,DYS533,DYS570,DYS576,DYS627,DYS635,Y_GATA_H4)進(jìn)行群體遺傳學(xué)調(diào)查,并結(jié)合已發(fā)表的其他17個(gè)人群數(shù)據(jù)分析貴州苗族與國(guó)內(nèi)不同地區(qū)的人群之間的遺傳距離和遺傳關(guān)系,為后續(xù)法醫(yī)父系鑒定建立法醫(yī)Y-STR數(shù)據(jù)庫(kù),以及后續(xù)的群體遺傳學(xué)研究提供科學(xué)的基礎(chǔ)數(shù)據(jù)。
本研究樣品收集于貴州醫(yī)科大學(xué)司法鑒定中心日常檢案,所有樣本采集均遵循知情同意原則。采集方式為采血卡采集,共收集貴州地區(qū)苗族418名健康無(wú)關(guān)男性個(gè)體血樣,所有樣本收集時(shí)已回溯三代內(nèi)父母皆為苗族。本文研究由貴州醫(yī)科大學(xué)倫理委員會(huì)審批并批準(zhǔn),倫理審批號(hào)為2020 倫審第(057)號(hào)。
根據(jù)Y filerTMPlus試劑盒(美國(guó)Applied Biosystems公司)說明書,用直接擴(kuò)增法(免提取)[7-8]對(duì)前述樣本進(jìn)行PCR擴(kuò)增,使用9700PCR儀(美國(guó)Applied Biosystems公司)進(jìn)行PCR擴(kuò)增。PCR反應(yīng)體系為10 μL,具體為:PCR Master Mix 5.0 μL、Primer Mix 2.5 μL、ddH2O 2.5 μL,1.5mm直徑血卡,PCR循環(huán)參數(shù)見表1,每次擴(kuò)增均加入2800 M Control DNA做陽(yáng)性對(duì)照和無(wú)菌雙蒸水做陰性對(duì)照。PCR擴(kuò)增產(chǎn)物均在ABI3500遺傳分析儀上進(jìn)行毛細(xì)管電泳檢測(cè),使用96孔板進(jìn)行上樣,每孔上樣體系為擴(kuò)增產(chǎn)物1μL、Hi-DiTM去離子甲酰胺10 μL、CC5IS500內(nèi)標(biāo)0.4 μL,每加入15個(gè)樣品后加入一個(gè)等位基因分型標(biāo)準(zhǔn)物Allelic(ladder)(美國(guó)Promega公司)。電泳結(jié)束后,使用GeneMapper?ID-X1.3軟件(美國(guó)Thermo Fisher Scientific公司)對(duì)STR反應(yīng)產(chǎn)物進(jìn)行等位基因片段分析和數(shù)據(jù)收集。
表1 Y filerTMPlusPCR擴(kuò)增循環(huán)參數(shù)Tab.1 Parameters of Y filerTM PlusPCR amplified cycle
貴州苗族27個(gè)Y-STR基因座的遺傳差異度(genetic diversity, GD)和單倍型多樣性(haplotype diversity, HD)按公式GD/HD=(n/n-1) (1-ΣPi2)(Pi為等位基因或單倍型頻率,n為樣本數(shù))計(jì)算,其中雙拷貝基因座DYS385a/b和DYF387S1a/b作為單倍型計(jì)算。Y-STR基因座單倍型結(jié)構(gòu)使用YHRD參考數(shù)據(jù)庫(kù)(Y-STR haplotype reference database,http://www.yhrd.org/search)進(jìn)行分析,應(yīng)用 YHRD 在線工具進(jìn)行分子方差分析(analysis of molecular variance,AMOVA),計(jì)算貴州苗族群體與其他17個(gè)民族(青海撒拉族[9]、克拉依瑪維吾爾族[10]、甘肅藏族[11]、內(nèi)蒙古達(dá)斡爾族[12]、湖南侗族[13-14]、海南黎族[15-16]、廣西壯族[17-18]、湖南瑤族[19]、貴州仡佬族[20-21]、貴州布依族[22]、四川回族[23]、貴州漢族[24-25]、吉林白山滿族[26]、北川羌族[27]、湖南苗族[13]、貴州土家族[28]、貴州貴陽(yáng)彝族[29])的遺傳距離RST值,分別采用MEGA 7.0[30-31](http://www.megasoftware.net/)軟件,使用NJ法(neighbor-joining)對(duì)貴州苗族和其他參考群體的系統(tǒng)發(fā)育樹,使用SPSSv18.0軟件進(jìn)行多維尺度分析(multi-dimensional scaling,MDS)。
貴州苗族群體的27個(gè)Y-STR基因座的等位基因頻率見表2。27個(gè)Y-STR基因座共觀察到240個(gè)等位基因,各基因座分別檢出3~12個(gè)等位基因。其中,本研究在DYS449基因座上檢測(cè)到微變異,等位基因?yàn)?0.2。在DYF387S1a/b上檢出了9種三等位基因情況,在雙拷貝基因座DYS385a/b共檢出12個(gè)等位基因,49種單倍型。27個(gè)Y-STR基因座共觀察到240個(gè)等位基因,等位基因頻率為0.002 4~0.892 4。貴州苗族群體的27個(gè)Y-STR基因座的GD值見表3。23個(gè)單拷貝的Y-STR基因座的GD值為0.195 0~0.879 1,除了DYS390、DYS391、DYS437、DYS438、Y_GATA_H4五個(gè)基因座以外,其余基因座的GD值>0.5。
表2 貴州苗族27個(gè)Y-STR基因座等位基因頻率(n=418)Tab.2 Allele frequencies of 27 Y-STR loci in Guizhou Miao group population(n=418)
續(xù)表2
續(xù)表2
表3 27個(gè)Y-STR基因座的GD值Tab.3 GD value of 27 Y-STR loci
基于27個(gè)Y-STR基因座,計(jì)算貴州苗族和其他參考群體的RST值見表4。基于RST值使用鄰接法構(gòu)建了貴州苗族與其他17個(gè)參考群體的系統(tǒng)發(fā)育樹,見圖1。根據(jù)遺傳距離對(duì)貴州苗族與其他17個(gè)參考群體的進(jìn)行MDS分析,見圖2。
本研究調(diào)查結(jié)果顯示,27個(gè)Y-STR 基因座在貴州苗族群體中的GD值為0.195 0~0.912 8,其中23個(gè)單拷貝的Y-STR基因座的GD值為0.195 0~0.879 1。除了DYS390、DYS391、DYS437、DYS438、YGATAH4這5個(gè)基因座以外,其余基因座的GD值均大于0.5,其中基因座DYS390的GD值是0.4615,基因座YGATAH4的GD值是0.473 4均比較接近0.5。本研究發(fā)現(xiàn)DYS391、DYS437、DYS438基因座的遺傳多態(tài)性較低,這與既往國(guó)內(nèi)關(guān)于不同人群的研究報(bào)道基本一致[32-34],考慮所用商業(yè)試劑盒位點(diǎn)參考數(shù)據(jù)以歐美人群為主這一原因。兩個(gè)多拷貝基因DYS385a/b和DYF387S1a/b的GD值分別是0.9128和0.9002。本次研究所得的27個(gè)Y-STR基因座GD值結(jié)果表明,Y filerTMPlus試劑盒中有24個(gè)Y-STR基因座在貴州苗族群體中顯示出較高多態(tài)性。本次研究的27個(gè)Y-STR基因座中,DYS385a/b、DYF387S1a/b為多拷貝基因座,此類基因座的一對(duì)引物在Y染色體上有多個(gè)結(jié)合位點(diǎn),因此會(huì)出現(xiàn)擴(kuò)增出多個(gè)片段長(zhǎng)度不同的PCR產(chǎn)物的情況,這可能和染色體結(jié)構(gòu)有關(guān)[35]。本研究的418個(gè)樣品中,在DYF387S1a/b基因座檢出三等位基因9例,在DYS385a/b基因座中沒有檢出三等位基因,說明在DYF387S1a/b基因座上出現(xiàn)特殊型的情況更多,這一現(xiàn)象在之前的研究中也有報(bào)道[36]。本研究在DYS449基因座上檢測(cè)到微變異,該等位基因?yàn)?0.2,提示后續(xù)可對(duì)該基因座是否存在貴州苗族特殊的等位基因進(jìn)行深入研究。
表4 貴州苗族和其他對(duì)比群體的遺傳距離RstTab.4 Genetic distance Rst values among Guizhou Miao group and other populations
遺傳距離是表示群體間或物種間遺傳差異或遺傳分化最重要的參數(shù),本次研究基于群體的RST值構(gòu)建了貴州苗族和其他民族群體的系統(tǒng)發(fā)育樹。從該發(fā)育樹上可以發(fā)現(xiàn),貴州苗族與內(nèi)蒙古達(dá)斡爾族、青海撒拉族、克拉依瑪維吾爾族、甘肅藏族之間的遺傳距離相對(duì)較遠(yuǎn),推測(cè)原因是這些人群主要居住的地方處于高原地帶,人群之間流動(dòng)比較少。本研究還通過建立MDS圖得到貴州苗族與其他人群更明顯的地理和種族聚集特征,從MDS的結(jié)果可以看出,包含貴州苗族在內(nèi)的18個(gè)人群大致可以劃分為6個(gè)類群:第一類群,青海撒拉族、克拉依瑪維吾爾族、甘肅藏族;第二類群,內(nèi)蒙古達(dá)斡爾族、湖南侗族;第三類群,海南黎族、廣西壯族、湖南瑤族、貴州仡佬族、貴州布依族;第四類群,四川回族、貴州漢族、吉林北山滿族、北川羌族、貴州苗族;第五類群,湖南苗族、貴州土家族;第六類群,貴州貴陽(yáng)彝族。貴州苗族與四川回族、北川羌族和吉林滿族的遺傳距離相對(duì)較近,與內(nèi)蒙古達(dá)斡爾族、湖南侗族、海南黎族、克拉瑪維吾爾族的遺傳距離相對(duì)較遠(yuǎn),這一結(jié)果與系統(tǒng)發(fā)育樹所得的結(jié)果基本一致。從MDS可以發(fā)現(xiàn),遺傳距離與地域和民族群體都有著密不可分的聯(lián)系。本研究中貴州苗族與地理位置相近的貴州其他人群也有一定的遺傳差異,由此推測(cè)即使地理位置相近,但是不同民族群體之間的差異因素也會(huì)對(duì)群體遺傳關(guān)系有較大的影響。從近期國(guó)內(nèi)外研究來(lái)看苗族在群體遺傳上是一個(gè)較為獨(dú)特的群體。在利用全基因組SNP對(duì)貴州苗族人群的相關(guān)研究中指出,苗瑤語(yǔ)系的人群起源于長(zhǎng)江流域中部的古百越,并經(jīng)歷了從四川和貴州向南遷移到越南和泰國(guó)的過程,在這個(gè)過程中苗族經(jīng)歷了非常復(fù)雜的人群混合歷史。研究發(fā)現(xiàn),作為國(guó)內(nèi)主要苗族分支之一的湖南苗族與福建的畬族及南方漢族群體有更多的遺傳同源性,而貴州苗族與壯侗語(yǔ)系的人群有更多的共享基因,更具遺傳親和力,且與東南亞的人群也有混合的歷史。因此對(duì)于貴州苗族的群體遺傳結(jié)構(gòu)需要使用更全面全基因組數(shù)據(jù)來(lái)進(jìn)行進(jìn)一步的研究與刻畫[1,37]。
綜上所述,本次研究中的27個(gè)Y-STR基因座組成的單倍型計(jì)算的遺傳距離結(jié)果與各參考群體地域分布基本一致,表明Y染色體遺傳標(biāo)記在群體間的遺傳距離和基因漂流的評(píng)價(jià)中起到了重要作用。該27個(gè)Y-STR基因座在貴州苗族人群中具有豐富的遺傳多態(tài)性,可為貴州苗族父系親緣關(guān)系的鑒定提供有價(jià)值的信息。同時(shí),本次研究的數(shù)據(jù)可以為父系譜系在法醫(yī)學(xué)應(yīng)用和群體遺傳學(xué)方面提供有用的信息。
貴州醫(yī)科大學(xué)學(xué)報(bào)2022年2期