張秀秀, 喻艷琴, 田 薇, 李 鳴, 王嬋娟, 張 婷, 單可人, 朱衛(wèi)芳, 何 燕*
(1.貴州醫(yī)科大學(xué) 地方病與少數(shù)民族疾病教育部重點(diǎn)實(shí)驗(yàn)室, 貴州 貴陽(yáng) 550004; 2.貴州醫(yī)科大學(xué) 貴州省醫(yī)學(xué)分子生物學(xué)重點(diǎn)實(shí)驗(yàn)室, 貴州 貴陽(yáng) 550004; 3.宿遷子淵司法鑒定所, 江蘇 宿遷 223800)
Y染色體具有遺傳非重組和直接由父到子傳遞的獨(dú)特特征,子代只能在父輩突變的基礎(chǔ)上發(fā)生新突變,而不會(huì)丟失祖先的突變特征[1],是重建男性譜系的有用標(biāo)記,因此廣泛用于人類學(xué)、法醫(yī)學(xué)和遺傳學(xué)等領(lǐng)域[2-5]。Y染色體上16個(gè)單核苷酸多態(tài)性(single nucleotide polymorphism,SNP) 在人口和地理區(qū)域中非隨機(jī)分布,能夠推斷個(gè)體的種族來源[6]或地理來源[7],在人類學(xué)的背景下,可推斷人群進(jìn)化、遷徙及相關(guān)歷史活動(dòng),能夠有效地評(píng)估群體的遺傳結(jié)構(gòu)[8]。自 1957 年土家族被正式確認(rèn)為單一民族[9]后,對(duì)于土家族的研究才從真正意義上開。土家族屬于漢藏語系藏緬語族,土家族的源流問題存在各種假說,比如巴人說、僰人說[10]、土著說、江西說、烏蠻說、氐羌說等[11], 但大部分支持巴人學(xué)說[12-13]。本課題對(duì)貴州土家族人群16個(gè)Y-SNP 位點(diǎn)進(jìn)行多態(tài)性研究,以期獲得貴州土家族人群16個(gè)Y-SNP 位點(diǎn)等位基因頻率、單倍型頻率與單倍群頻率頻率分布情況,并與南方8個(gè)少數(shù)民族群體進(jìn)行探討,從父系遺傳的角度為貴州土家族的起源提供遺傳學(xué)證據(jù)。
從課題組建立的貴州世居少數(shù)民族DNA樣本庫(kù)中,根據(jù)知情同意原則,篩選出68例無族外通婚史、3 代內(nèi)無親緣關(guān)系的貴州土家族健康男性樣本。每份DNA樣本用分光光度法(NanoDrop-Lite)標(biāo)化為20 mg/L后, -40 ℃保存?zhèn)溆谩?/p>
1.2.116個(gè)Y-SNP位點(diǎn)多重PCR擴(kuò)增及純化 依照國(guó)際遺傳譜系學(xué)會(huì)(international society of genetic genealogy,ISOGG)在網(wǎng)站 https://isogg.org/tree/index.html 上發(fā)布的Y單倍群系統(tǒng)進(jìn)化樹,以其基本分支C-O及其亞簇為主, 篩選出M145、RPS4Y711、M89、M9、M175、M119、M95、SRY465、M122、M324、M159、M7、M134、M217、M48及M407共16個(gè)Y-SNP為研究靶點(diǎn),參考文獻(xiàn)[14]分成4組(Ⅰ、Ⅱ、Ⅲ、Ⅳ組),按照不同的濃度比例混合各組引物進(jìn)行多重PCR擴(kuò)增(濃度、用量、分組情況及引物信息見表1)。PCR擴(kuò)增體系為25 μL,其中包括20 mg/L的模板DNA 1.5 μL、引物MIX 15 μL、10 nmol/L、dNTP 3.0 μL、10×Buffer 2.5 μL、Taq DNA 聚合酶0.5 μL、1 mmol/L甜菜堿1.0 μL(其作用在于富含GC模板的PCR擴(kuò)增和提高Taq DNA聚合酶的穩(wěn)定性)、5 mmol/L MgCl21.0 μL、500 μg/mL牛血清蛋白(BSA)0.5 μL。循環(huán)條件:95 ℃ 10 min; 95 ℃ 30 s、58 ℃ 30 s、72 ℃ 30 s,循環(huán) 35 次;72 ℃ 7 min,產(chǎn)物4 ℃保存。純化:第Ⅰ、Ⅱ組PCR產(chǎn)物各取 1 μL 混合、加入 1 000 U/L蝦堿酶 (shrimp alkaline phosphatase,SAP)1 μL 和 1 U/μL大腸桿菌核酸外切酶Ⅰ(exonucleaseⅠ,ExoⅠ)1 μL 進(jìn)行純化處理以去除多余的引物和dNTP,37 ℃ 70 min 、75 ℃15 min滅活酶,純化后的多重PCR產(chǎn)物于4 ℃保存、充當(dāng)單堿基延伸時(shí)A組的模板;第Ⅲ、Ⅳ組PCR產(chǎn)物也如法純化,充當(dāng)單堿基延伸時(shí) B 組的模板。
1.2.2SNapShot 單堿基延伸及純化 單堿基延伸引物:?jiǎn)螇A基延伸引物其3′ 端對(duì)應(yīng)待測(cè)Y-SNP位點(diǎn)的前一個(gè)堿基,確保PCR擴(kuò)增延伸的第一個(gè)堿基即對(duì)應(yīng)待測(cè)SNP位點(diǎn);單引物的5′端則加入不同長(zhǎng)度的核苷酸(不與基因組任何地方配對(duì))進(jìn)行修飾,使得不同 SNP 位點(diǎn)對(duì)應(yīng)的單引物的長(zhǎng)度不同,有利于根據(jù)大小區(qū)分不同Y-SNP位點(diǎn)的擴(kuò)增產(chǎn)物。按照不同的濃度比例混合各組單堿基延伸引物,分A、B兩組進(jìn)行復(fù)合引物單堿基延伸反應(yīng)(濃度、用量、分組情況及引物信息見表2)。使用SNaPshot試劑盒(ABI, 美國(guó))進(jìn)行單堿基延伸反應(yīng),體系包括經(jīng)ExoⅠ和SAP純化后PCR產(chǎn)物0.75 μL、SNapShot Mix 1.25 μL、單堿基擴(kuò)增引物MIX 0.5 μL,循環(huán)條件為96 ℃ 10 s、50 ℃ 5 s、60 ℃ 30 s循環(huán)28次,產(chǎn)物4 ℃保存。純化:?jiǎn)螇A基擴(kuò)增產(chǎn)物加入1 000 U/L的SAP0.5 μL,混勻、瞬時(shí)離心,37 ℃保溫70 min 后75 ℃ 15 min滅活酶,即得純化后的SNapShot單堿基延伸產(chǎn)物,4 ℃保存。
表1 篩選出的16個(gè)Y-SNP位點(diǎn)的多重 PCR 引物信息和分組Tab.1 Multiplex PCR primer sequences for 16 Y-SNP loci
表2 16個(gè)Y-SNP位點(diǎn)的SNapShot單堿基擴(kuò)增引物和分組Tab.2 The primer sequences for Single base amplification of 16 Y-SNPs using SNapSHot kit
注:F為上游引物,R為下游引物
1.2.3ABI 3130 毛細(xì)管電泳檢測(cè) 純化的單堿基延伸產(chǎn)物0.5 μL、GeneScan-120LIZ Size Standard 0.05 μL和Hi-DiTM甲酰胺9.45 μL,混勻后上樣于ABI 3130遺傳分析儀進(jìn)行毛細(xì)管電泳分析,ABI 3130 Genetic Analyzer Data Collection Software v 3.0 進(jìn)行數(shù)據(jù)收集。
用直接計(jì)數(shù)法計(jì)算16個(gè)Y-SNP位點(diǎn)等位基因頻率、單倍型頻率以及單倍群頻率,單倍型多樣性(haplotype diversity, HD)值和基因多樣性(gene diversity,GD)值根據(jù)公式 HD/GD=n(1-ΣPi2)/(n-1)計(jì)算(Pi為單倍型頻率或等位基因頻率,n為樣本數(shù))。將貴州土家族的單倍群分布頻率與已報(bào)道的國(guó)內(nèi)8個(gè)少數(shù)民族群體進(jìn)行比較分析,采用IBM SPSS Statistics 24軟件進(jìn)行主成分分析(principle component analysis, PCA),依據(jù)各群體“主成分1、2、3”,使用Surfer 12.0軟件繪制出等值線圖。
采用SNapShot法對(duì)貴州土家族68份樣本16個(gè)Y-SNP位點(diǎn)進(jìn)行基因分型,等位基因頻率和GD值見表3 ,單倍型頻率結(jié)果見表4,所分析的16個(gè)Y-SNP位點(diǎn)中,M48、M407、M119、SRY465、M159突變頻率均為0,無基因多樣性(GD=0),其余11個(gè)Y-SNP位點(diǎn)均具有遺傳多態(tài)性,GD值的范圍為0.029~0.497。16個(gè)Y-SNP位點(diǎn)的共檢測(cè)出11種單倍型,其中頻率最低為0.015, 最高為0.338;組成單倍型的Y-SNP的順序?yàn)镽PS4Y711、M217、M48、M407、M145、M89、M9、M175、M119、M95、SRY465、M122、M324、M159、M7、M134,經(jīng)計(jì)算HD值為0.792。
表3 貴州土家族人群16個(gè)Y-SNP的基因頻率和GDTab.3 GD values and frequencies of 16 Y-SNPs loci in Guizhou Tujia population
表4 貴州土家族人群16個(gè)Y-SNP組成的11種單倍型頻率分布(n=68)Tab.4 11 haplotype frequency distributions in the 16 Y-SNPs loci of Tujia population
依照國(guó)際遺傳譜系學(xué)會(huì)(ISOGG)在網(wǎng)站 https://isogg.org/tree/index.html上發(fā)布的Y單倍群系統(tǒng)進(jìn)化樹進(jìn)行單倍群劃分,通過Excel繪制貴州土家族與南方8個(gè)少數(shù)民族Y染色體單倍群頻率熱圖(見表5),對(duì)9個(gè)少數(shù)民族在不同位點(diǎn)的分布情況進(jìn)行直觀觀測(cè),綠色→黃色→紅色單倍群頻率逐漸增加。
表5 貴州土家族和其他民族Y染色體單倍群頻率
Tab.5 Y-SNP haplotype frequencies of Guizhou Tujia and eight minority populations in Southern China
2.2.1貴族土家族與南方8個(gè)少數(shù)民族的PCA 貴州土家族與已有文獻(xiàn)報(bào)道的8個(gè)人群?jiǎn)伪度?見表5)進(jìn)行PCA(見圖1),前3個(gè)成分解釋了67.808%的總方差。在PCA三維圖上可以看到貴州土家族與湖南土家族、云南彝族、云南景頗族、云南漢族聚為1簇,廣西仫佬族與貴州水族聚為1簇,云南佤族與云南納西族聚為1簇。
圖1 貴州土家族與南方8個(gè)民族Y染色體單倍群PCA二維圖 Fig.1 The principal component analysis of Y chromosome of Guizhou Tujia population and eight minority populations in Southern China
2.2.2貴州土家族與南方其他8個(gè)少數(shù)民族前3個(gè)主成分在等值線圖上的分布 根據(jù)各個(gè)群體單倍群分布頻率PCA分析結(jié)果中,提取主成分1、2、3作為依據(jù)指標(biāo)(見表6),采用 Surfer 12繪制出等值線圖(圖 2、3、4)。通過等值線圖,可以較清晰顯示分布在不同地域人群在發(fā)展過程中相互間的關(guān)系。主成分 1 等值線圖(圖2)貢獻(xiàn)率為 29.281%,可以看成是幾個(gè)民族的相互作用,從等值線顏色上觀察,貴州土家族受到的影響最小。主成分2等值線圖(圖 3)貢獻(xiàn)率為24.173%,出現(xiàn)2個(gè)高峰值,一個(gè)是以云南彝族為中心,另一個(gè)是以湖南土家族為中心,可以看成是湖南土家族與云南彝族的擴(kuò)張,在主成分2等值線顏色上看,貴州土家族受到了一定的影響,在云南納西族聚居的地方有所減弱,對(duì)貴州水族與廣西仫佬族的影響最弱。主成分3等值線圖(圖4)貢獻(xiàn)率為14.353%,可以理解為貴州土家族與貴州水族、湖南土家族之間的相互影響,從顏色上看,貴州土家族對(duì)貴州水族、湖南土家族的影響大于他們對(duì)貴州土家族影響。
本研究選擇了Y染色體16個(gè)SNP位點(diǎn)作為靶點(diǎn),對(duì)68例貴州土家族男性個(gè)體進(jìn)行基因分型,并對(duì)結(jié)果進(jìn)行相關(guān)統(tǒng)計(jì)分析。等位基因頻率、GD值見表2、 單倍型頻率見表3, GD值的范圍為 0.029~0.497,HD值為0.792,GD值和HD值均較低,說明該人群曾出現(xiàn)過較長(zhǎng)時(shí)間的建立者效應(yīng)和瓶頸期,出現(xiàn)這種現(xiàn)象的原因可能是長(zhǎng)期的戰(zhàn)亂導(dǎo)致人口多次急劇下降,例如公元前11世紀(jì),巴人參加武王伐紂戰(zhàn)爭(zhēng)[21],春秋戰(zhàn)國(guó)時(shí)期,巴楚相爭(zhēng),公元前661 年,巴人滅庸[22],公元前223年秦滅巴國(guó)[23]后,其少數(shù)后裔進(jìn)入貴州,在大山的阻隔下,減少了種群間的基因交流,使得遺傳多樣性非常低。通過 Excel 繪制貴州土家族與南方8個(gè)少數(shù)民族Y染色體單倍群頻率熱圖對(duì)各民族在不同位點(diǎn)的分布情況進(jìn)行直觀觀測(cè):(1)9個(gè)南方群體中,幾乎沒有遺傳結(jié)構(gòu)相似的群體,體現(xiàn)了南方民族內(nèi)部遺傳結(jié)構(gòu)的多樣性;(2)貴州土家族在單倍群C*(0.368)和單倍群 O(0.324)具有高頻分布,提示貴州土家族的起源并不單一。ZERJAL 等[24]提出單倍群C*是隨著蒙古人的擴(kuò)張將成吉思汗或者其親屬的Y染色體傳到中亞,發(fā)展至今在中亞,蒙古和中國(guó)北方的部分地區(qū)有大約8%的男性為該譜系的Y染色體,C*單倍群在北方的頻率高于南方,而本研究貴州土家族C*(0.368)具有高頻分布,提示貴州土家族可能與北方民族發(fā)生過基因交融;經(jīng)計(jì)算貴州土家族單倍群O*的分布頻率為0.588,與文獻(xiàn)報(bào)道南方民族群體的單倍群 O*頻率分布較高相符[25- 26]。
表6 9個(gè)群體的經(jīng)緯度分布及相應(yīng)的PCA前2主成分值Tab.6 Latitude and longitude of 9 populations and their PCA components
注:PC1、PC2、PC3表示 PCA 中提取信息量最高的主成分1、2、3
注:1~9對(duì)應(yīng)表6中民族地區(qū)及經(jīng)緯度位置圖2 主成分1在等值線圖上的分布Fig.2 The distribution of PCA component 1 on contour map
注:1~9對(duì)應(yīng)表6民族地區(qū)及經(jīng)緯度位置圖3 主成分2在等值線圖上的分布Fig.3 The distribution of PCA component 2 on contour map
注:1~9對(duì)應(yīng)表6民族地區(qū)及經(jīng)緯度位置圖4 主成分3在等值線圖上的分布Fig.4 The distribution of PCA component 3 on contour map
為了探討貴州土家族與南方其他少數(shù)民族間的關(guān)系,本研究選取了已有報(bào)道的中國(guó)南方 8個(gè)少數(shù)民族與貴州土家族的單倍群頻率進(jìn)行PCA。在主成分三維圖上貴州土家族與湖南土家族、云南彝族、云南景頗族、云南漢族為一簇;廣西仫佬族與貴州水族聚為一簇;云南佤族與云南納西族聚為一簇。有趣的是云南納西族與貴州土家族同為藏緬語族彝語支卻沒有聚在一起,這與謝選華等[27]對(duì)土家族源流的遺傳學(xué)初探結(jié)果相符,提示云南納西族與其他群體的分離時(shí)間較早。
依據(jù)PCA的3個(gè)主要成分作為指標(biāo),采用Surfer 12繪制出等值線圖,結(jié)果顯示,主成分 1 等值線圖(圖2)貢獻(xiàn)率為 29.281%,可以看成是幾個(gè)民族的相互作用,從等值線顏色上觀察,貴州土家族受到的影響最小,可能是因?yàn)橘F州土家族居住地多在山區(qū),較少與外民族交流,提示貴州土家族保留了其獨(dú)特的父系遺傳結(jié)構(gòu);主成分2等值線圖(圖 3)貢獻(xiàn)率為24.173%,出現(xiàn)2個(gè)高峰值,一個(gè)是以云南彝族為中心,另一個(gè)是以湖南土家族為中心,可以看成是湖南土家族與云南彝族的擴(kuò)張,在主成分2等值線顏色上看,貴州土家族受到了一定的影響,在云南納西族聚居的地方有所減弱,對(duì)貴州水族與廣西仫佬族的影響最弱,提示貴州土家族與湖南土家族、云南彝族可能發(fā)生了基因交流;主成分3等值線圖(圖4)貢獻(xiàn)率為14.353%,可以理解為貴州土家族與貴州水族、湖南土家族之間的相互影響,從顏色上看,貴州土家族對(duì)貴州水族、湖南土家族的影響大于他們對(duì)貴州土家族影響。從等值線坡度上看湖南土家族對(duì)貴州土家族的影響較大,可能是貴州土家族的采樣地點(diǎn)(經(jīng)緯度108.8°N 27.8°E)與湖南土家族的采樣地點(diǎn)(經(jīng)緯度109.7°N 28.3°E)離的特別近的緣故。
綜上所述,本文通過對(duì)貴州土家族與中國(guó)南方的8個(gè)少數(shù)民族遺傳關(guān)系的探討,貴州土家族可能與湖南土家族、云南彝族、云南景頗族、云南漢族、貴州水族發(fā)生了基因交融,但又保留了其大部分獨(dú)特的父系遺傳特征。
貴州醫(yī)科大學(xué)學(xué)報(bào)2019年4期