任 崢 劉玉波 張 晗 王啟燕 張紅玲 黃 江
貴州醫(yī)科大學(xué)法醫(yī)學(xué)院 貴州 貴陽(yáng) 550025
插入/缺失多態(tài)性(Insertion/deletion polymorphisms,InDels)是基于基因組中一個(gè)或多個(gè)核苷酸的插入或缺失的雙等位基因長(zhǎng)度多態(tài)性。InDels廣泛分布在整個(gè)人類基因組中,估計(jì)總數(shù)約為200萬(wàn)[1]。InDels被認(rèn)為是理想的法醫(yī)標(biāo)記物,具有減少的擴(kuò)增子大小和低突變率[2]。此外,可以通過(guò)簡(jiǎn)單的PCR擴(kuò)增和高通量電泳來(lái)分析InDels,這通常在法醫(yī)短串聯(lián)重復(fù)(short tandem repeat,STR)分析中使用。因此,人們?cè)絹?lái)越多地探索InDels并將其用于法醫(yī)遺傳學(xué)中[3-5]。
侗族是中國(guó)第十大少數(shù)民族,人口290萬(wàn),是貴州的原住民,主要集中在貴州東部的銅仁和玉屏侗族自治縣中,約為160萬(wàn)。侗族的語(yǔ)言屬于壯侗語(yǔ)族。南方侗族的祖先可能來(lái)自廣西梧州和廣東廣州。以前已經(jīng)報(bào)道了廣西侗族的30個(gè)常染色體InDels的人群數(shù)據(jù)[6],但沒(méi)有關(guān)于廣西侗族與貴州相關(guān)人群遺傳關(guān)系的信息。
東亞人口的遺傳結(jié)構(gòu)分析在了解全球現(xiàn)代人類的遷移模式和遺傳關(guān)系方面起著重要作用[7]。中國(guó)西南的貴州是一個(gè)多種族的省份,有18個(gè)少數(shù)民族,包括苗族,布依族,侗族,水族,仡佬族,滿族,蒙古族,回族,彝族,羌族和畬族。因此,貴州成為探索每個(gè)民族的法庭特征和綜合遺傳結(jié)構(gòu)的重要地區(qū)。但是,到目前為止,貴州群體的遺傳數(shù)據(jù)還很少。
我們?cè)谶@里使用第一個(gè)成熟的商業(yè)試劑盒(Investigator DIPplex kit)對(duì)從貴州省采集的148個(gè)侗族樣本中的30個(gè)InDel進(jìn)行了基因分型。我們的研究目的是首先探索30個(gè)InDel基因座在法醫(yī)個(gè)人識(shí)別中的系統(tǒng)效能,并推斷貴州侗族人群的群體遺傳結(jié)構(gòu)。
2.1 樣本 在知情同意下,從居住在貴州省的侗族群體中收集了149個(gè)無(wú)關(guān)個(gè)體的外周血樣本。貴州醫(yī)科大學(xué)倫理委員會(huì)批準(zhǔn)了與我們的研究目的,樣品收集,實(shí)驗(yàn)設(shè)計(jì)等有關(guān)的所有程序,倫理批準(zhǔn)號(hào)為(2021倫審第65號(hào))。
我們對(duì)所研究的這些無(wú)關(guān)個(gè)體有嚴(yán)格的篩選標(biāo)準(zhǔn):參與者必須是貴州的原住民,彼此之間沒(méi)有血緣關(guān)系,有超過(guò)三代人的非近親通婚。
2.2 方法
2.2.1 DNA的提取 使用Chelex-100法[8]提取血樣DNA,-20℃保存。
2.2.2 30個(gè)InDel基因分型 DNA模板以Investigator DIPplex試劑盒(Qiagen,Hilden,德國(guó)),12.5 ml體積的反應(yīng)體系,擴(kuò)增30個(gè)InDel基因座,其中DNA 9948和dd H2O作為陽(yáng)性對(duì)照和陰性對(duì)照。多重PCR在GeneAmp 9700熱循環(huán)儀(Applied Biosystems,Foster City,CA,美國(guó))上進(jìn)行。隨后在ABI 3500遺傳分析儀(Applied Biosystems,Foster City,CA,美國(guó))上使用毛細(xì)管電泳分離擴(kuò)增產(chǎn)物。使用GeneMapper v3.2軟件(Applied Biosystems,Foster City,CA,美國(guó))進(jìn)行基因分型。
2.2.3 統(tǒng)計(jì)學(xué)分析 通過(guò)STR Analysis for Forensics軟件[9]計(jì)算等位基因頻率和法醫(yī)統(tǒng)計(jì)參數(shù),例如匹配概率(PM),多態(tài)信息含量(PIC),非父排除概率(PE),個(gè)人識(shí)別能力(PD)和親權(quán)指數(shù)(TPI)。使用Arlequin v3.5軟件[10]估算Hardy-Weinberg平衡(HWE)的p值。通過(guò)MVSP v3.22軟件[11]和Genepop v4.0軟件[12]基于原始基因分型結(jié)果進(jìn)行貴州侗族和47個(gè)參考人群的主成分分析(PCA)和遺傳分化系數(shù)(Fst)的計(jì)算,并通過(guò)MEGA v5.0軟件[13]基于Fst值構(gòu)建系統(tǒng)發(fā)育樹(shù)。
2.1 等位基因頻率和法醫(yī)學(xué)參數(shù) 侗族148個(gè)樣本的30個(gè)InDel基因座等位基因頻率請(qǐng)見(jiàn)表1,插入(Insertion)等位基因的頻率最低的為0.0970(基因座HLD39),最高的為0.9440(基因座HLD118)。各基因座的法醫(yī)學(xué)參數(shù)和的Hardy-Weinberg平衡檢驗(yàn)的p值也請(qǐng)見(jiàn)表1。其中有部分基因座的p值小于0.05,如HLD40,HLD70和HLD81。但經(jīng)過(guò)Bonferroni校正后,所有基因座均符合Hardy-Weinberg平衡,說(shuō)明本研究所分析的樣本足以代表貴州省侗族群體。
表1 貴州侗族30個(gè)InDel等位基因頻率和法醫(yī)學(xué)參數(shù)
HLD136 0.516 0.484 0.49324 0.49984 0.3735 0.6265 0.1817 0.3741 0.9867 1 HLD39 0.097 0.903 0.18919 0.1935 0.6717 0.3283 0.0269 0.1742 0.6167 0.67635 HLD40 0.685 0.315 0.38514 0.46686 0.3721 0.6279 0.1051 0.357 0.8132 0.03585 HLD45 0.71 0.29 0.42568 0.4467 0.4009 0.5991 0.1303 0.3461 0.8706 0.58373 HLD48 0.339 0.661 0.4527 0.45934 0.3969 0.6031 0.1494 0.353 0.9136 0.85889 HLD56 0.524 0.476 0.47297 0.49427 0.37 0.63 0.1649 0.3713 0.9487 0.61929 HLD58 0.492 0.508 0.54054 0.50133 0.3981 0.6019 0.2255 0.3748 1.0882 0.40941 HLD6 0.46 0.54 0.48649 0.50087 0.3693 0.6307 0.1759 0.3746 0.9737 0.74236 HLD64 0.903 0.097 0.20946 0.21949 0.6376 0.3624 0.0324 0.1948 0.6325 0.70113 HLD67 0.726 0.274 0.34459 0.37286 0.4619 0.5381 0.0836 0.3026 0.7629 0.38076 HLD70 0.653 0.347 0.35811 0.48243 0.3535 0.6465 0.0904 0.3652 0.7789 0.00225 HLD77 0.468 0.532 0.52027 0.49343 0.394 0.606 0.2059 0.3708 1.0423 0.61737 HLD81 0.726 0.274 0.29054 0.37286 0.4645 0.5355 0.0597 0.3026 0.7048 0.01307 HLD83 0.427 0.573 0.50676 0.49892 0.3812 0.6188 0.1935 0.3736 1.0137 0.86927 HLD84 0.855 0.145 0.26351 0.27721 0.5644 0.4356 0.0496 0.2381 0.6789 0.55304 HLD88 0.532 0.468 0.55405 0.49583 0.4123 0.5877 0.2393 0.3721 1.1212 0.1849 HLD92 0.468 0.532 0.50676 0.49782 0.3823 0.6177 0.1935 0.3731 1.0137 0.86854 HLD93 0.653 0.347 0.48649 0.47824 0.3919 0.6081 0.1759 0.363 0.9737 0.86398 HLD97 0.331 0.669 0.42568 0.42197 0.4256 0.5744 0.1303 0.3321 0.8706 1 HLD99 0.887 0.113 0.16892 0.17735 0.6971 0.3029 0.0219 0.1611 0.6016 0.63085 CDP=0.9999999999660890 CPE=0.9841
可見(jiàn)不同基因座之間等位基因頻率的差距非常大,甚至接近一個(gè)數(shù)量級(jí)。對(duì)于二等位基因來(lái)說(shuō),
2.2 遺傳結(jié)構(gòu) 基于30個(gè)InDel原始基因分型結(jié)果的貴州侗族和47個(gè)參考人群的主成分分析(PCA)結(jié)果請(qǐng)見(jiàn)圖1。我們觀察到明顯的群體聚集和遺傳相似性。48個(gè)人群被標(biāo)記為10種不同的形狀和顏色:非洲人、歐洲人、北美人和南美人被定義為地理區(qū)域,東亞人被進(jìn)一步劃分為不同的語(yǔ)族群體,如漢語(yǔ)族、苗瑤語(yǔ)族、侗臺(tái)語(yǔ)族、藏緬語(yǔ)族、突厥語(yǔ)族等。所研究的侗族集中在中國(guó)少數(shù)民族中間,與福建畬族、湖北土家族、上海漢族、遵義苗族、遵義仡佬族、云南彝族、廣西壯族、貴州布依族等集中在一起。研究人群與東亞參照人群的遺傳相似性模式與地理來(lái)源和語(yǔ)言聯(lián)系基本一致。
圖1 貴州侗族與47個(gè)參考人群的PCA分析
基于30個(gè)InDel原始基因分型結(jié)果的貴州侗族和47個(gè)參考人群計(jì)算的Fst值所構(gòu)建的系統(tǒng)發(fā)育樹(shù)見(jiàn)圖2。三個(gè)主要分支與大陸地區(qū)很好地對(duì)應(yīng)。除新疆和西藏人群外,其余四組均為東亞人群。我們發(fā)現(xiàn)在說(shuō)苗瑤語(yǔ)和侗臺(tái)語(yǔ)的人群中,遺傳學(xué)和語(yǔ)言學(xué)之間有很強(qiáng)的相關(guān)性。所研究的貴州侗族與講侗臺(tái)語(yǔ)的人群聚集在一起,特別是廣西侗族、仡佬族和壯族。
圖2 貴州侗族與47個(gè)參考人群的Fst系統(tǒng)發(fā)育樹(shù)
本研究對(duì)貴州侗族的148個(gè)無(wú)親緣關(guān)系個(gè)體的30個(gè)InDel位點(diǎn)進(jìn)行了基因分型,報(bào)告了等位基因頻率并計(jì)算了法醫(yī)參數(shù)。我們發(fā)現(xiàn),這30個(gè)In-Del位點(diǎn)擁有較高的累計(jì)個(gè)人識(shí)別能力(>0.9999)滿足法醫(yī)個(gè)人鑒定的效率,但由于其累計(jì)非父排除概率較低,只能作為親子鑒定的補(bǔ)充工具。
在主成分分析和基于遺傳距離的NJ樹(shù)分析中,我們新研究的貴州侗族與講臺(tái)卡岱語(yǔ)的群體聚在一起,特別是廣西侗族、喀勞族和壯族。這一結(jié)果似乎支持了南方侗族祖先可能來(lái)自廣西梧州的假設(shè)。
綜上所述,本研究提供了貴州侗族148名個(gè)體的30個(gè)常染色體InDel位點(diǎn)的第一批等位基因數(shù)據(jù)和法醫(yī)學(xué)參數(shù)。法醫(yī)統(tǒng)計(jì)分析的結(jié)果表明,這30個(gè)InDel位點(diǎn)對(duì)法醫(yī)個(gè)人識(shí)別是強(qiáng)力的工具 。我們觀察到30個(gè)InDels所揭示的遺傳結(jié)構(gòu)與地理和語(yǔ)言分類基本一致。在未來(lái)的研究中,對(duì)具有代表性的大樣本群體進(jìn)行全基因組深度測(cè)序,有助于更好地了解貴州居群的遺傳結(jié)構(gòu)和居群歷史。