楊光遠,袁春艷,陶瑞旸,夏若成,王亞麗,董新宇,3,柴思雨,4,吳黎明,3,蔣志偉,5,蔣婷婷,6,陳開琴,4,李成濤,陳麗琴
1.內(nèi)蒙古醫(yī)科大學法醫(yī)學教研室,內(nèi)蒙古自治區(qū) 呼和浩特 010030;2.司法鑒定科學研究院 上海市法醫(yī)學重點實驗室 司法部司法鑒定重點實驗室 上海市司法鑒定專業(yè)技術服務平臺,上海 200063;3.山西醫(yī)科大學法醫(yī)學院,山西 太原 030001;4.遵義醫(yī)科大學基礎醫(yī)學院,貴州 遵義 563000;5.溫州醫(yī)科大學基礎醫(yī)學院法醫(yī)學系,浙江 溫州 325035;6.南方醫(yī)科大學法醫(yī)學院,廣東 廣州 510515
STR 具有靈敏度高、操作簡便、分型快速等優(yōu)勢,是目前法醫(yī)物證鑒定中最常使用的遺傳標記,被廣泛用于個體識別和親權鑒定[1]。然而,STR 也存在一定的局限性,其存在影子峰(stutter peak)、突變率較高、擴增片段長等缺點[2]。插入/缺失(insertion/deletion,InDel)和SNP 大多為二等位遺傳標記,突變率低于STR[3],且擴增片段相對較短[4-5],一定數(shù)量InDel 和SNP 的復合檢測可作為輔助工具彌補STR 檢測的不足。其中,SNP 的檢測方法復雜多樣,在實驗室間難以統(tǒng)一,不易于推廣應用。相比之下,InDel適用于復合熒光多重PCR 聯(lián)合毛細管電泳(capillary electrophoresis,CE)分型平臺,易于在法醫(yī)DNA 實驗室推廣應用。目前,已有研究針對不同群體設計了多重InDel 擴增體系并評估其法醫(yī)學應用價值[6-14],其中,Investigator DIPplex試劑盒(德國Qiagen 公司)是應用較為廣泛的商品化試劑盒,包含30 個常染色體InDel(autosomal-InDel,A-InDel)位點。然而,有研究[15-17]表明該體系中部分InDel 位點在我國人群中的多態(tài)性較低,如rs16438 和rs1305047 在我國漢族人群中的PIC 值分別為0.11 和0.14[15],低多態(tài)性位點的存在導致Investigator DIPplex試劑盒的應用受到限制。因此,為了建立一套適用于中國人群的高多態(tài)性InDel 擴增體系,本課題組前期研究[18]針對我國人群篩選出遺傳多態(tài)性較高且數(shù)量更多的InDel 位點,構建了SifaInDel 45plex 體系,其中包括27 個A-InDel、16 個X 染色體InDel(X-InDel)和2 個Y 染色體InDel(Y-InDel)位點。
漢族是我國的主體民族,在我國呈現(xiàn)東密西疏的分布特點。漢族的語言通稱漢語,屬漢藏語系,是世界上歷史最悠久、最豐富的語言之一。蒙古族則是我國傳統(tǒng)的游牧民族,主要分布于內(nèi)蒙古、新疆、甘肅等省份,其民族語言為蒙古語,屬阿爾泰語系。根據(jù)2020 年第七次全國人口普查數(shù)據(jù)[19],漢族人口超過12億,占全國總人口的91.11%,而蒙古族人口接近630萬人,相較于2010,其人口增加200 萬余,是我國人口較多的少數(shù)民族之一。本研究擬應用SifaInDel 45plex體系對我國江蘇漢族和內(nèi)蒙古蒙古族人群進行遺傳多態(tài)性調(diào)查,并評估該體系的法醫(yī)學應用效能,為其在法醫(yī)DNA領域的應用積累人群數(shù)據(jù)。同時基于gnomAD 數(shù)據(jù)庫[20]篩選獲得東亞人、非洲及美國非洲裔人、美洲拉丁裔人、阿米什人、芬蘭人、非芬蘭歐洲人、猶太人與中東人8個洲際人群數(shù)據(jù),探討不同人群間的遺傳關系。
實驗樣本:本研究共采集398 例健康無關個體的外周血樣本,其中,江蘇漢族200 例、內(nèi)蒙古蒙古族198 例。所有研究對象在采樣前均簽署知情同意書,該研究已獲得司法鑒定科學研究院倫理委員會批準。
參考人群樣本:東亞人、非洲及美國非洲裔人、美洲拉丁裔人、阿米什人、芬蘭人、非芬蘭歐洲人、猶太人與中東人8 個不同洲際人群數(shù)據(jù)選自gnomAD 數(shù)據(jù)庫。
使用QIAamp DNA Blood Mini 試劑盒(德國Qiagen公司)進行DNA提取,具體操作參照試劑盒說明書。使用NanoDrop 2000 分光光度計(美國Thermo Fisher Scientific 公司)檢測樣本DNA 的濃度及純度。
基于9700 型PCR 儀(美國Applied Biosystems 公司),使用SifaInDel 45plex 體系對DNA 樣本進行擴增。PCR 擴增體系為10 μL,包括:2 μL 反應預混液,2 μL 引物混合物,2 μL DNA 模板(1 ng/μL),4 μL 去離子水。擴增條件:95 ℃ 5 min;94 ℃ 30 s,58 ℃ 1 min,70 ℃ 1 min,30 個循環(huán);60 ℃ 60 min;4 ℃保存。
PCR產(chǎn)物在3130xl基因分析儀(美國Applied Biosystems 公司)上進行毛細管電泳,使用GeneMapperTMIDv3.2.1 軟件(美國Thermo Fisher Scientific 公司)對電泳原始數(shù)據(jù)進行分析。
使用Arlequin v3.5.2 軟件[21]檢驗Hardy-Weinberg平衡并進行連鎖不平衡分析。運用Microsoft Office Excel 軟件分別統(tǒng) 計27 個A-InDel 和16 個X-InDel 位點的等位基因頻率、Ho、He、DP、CDP、PIC、PE、CPE、MEC、CMEC等群體遺傳學參數(shù)。27個A-InDel位點在2 個研究人群中的群體遺傳學參數(shù)根據(jù)《親權鑒定技術規(guī)范》(GB/T 37223—2018)計算。16 個X-InDel 位點在2 個研究人群男性群體和女性群體中的群體遺傳學參數(shù)依據(jù)文獻[22-23]公式進行計算。使用Arlequin v3.5.2 軟件計算2 個研究人群和8 個參考人群間的Fst遺傳距離,根據(jù)遺傳距離矩陣分別應用MEGA 11軟件[24]和SPSS 25.0 軟件(美國IBM 公司)構建系統(tǒng)發(fā)育樹與多維尺度(multidimensional scaling,MDS)分析圖。
Hardy-Weinberg平衡檢驗結果顯示,經(jīng)Bonferroni校正后27 個A-InDel 位點在2 個研究人群中均符合Hardy-Weinberg 平衡(P>0.001 9),且16 個X-InDel 位點在2 個研究人群中均符合Hardy-Weinberg 平衡(P>0.003 1)。連鎖不平衡檢驗結果顯示,所有位點間均不存在連鎖不平衡現(xiàn)象,即27 個A-InDel 和16 個XInDel位點在2 個研究人群中可視為彼此獨立遺傳。
27 個A-InDel 位點在2 個研究人群中的缺失等位基因頻率:在江蘇漢族為0.240 0(rs2307783)~0.697 5(rs66850318),在內(nèi)蒙古蒙古族 為0.219 7(rs2308232)~0.669 2(rs2307805)。
16 個X-InDel 位點在2 個研究人群中的缺失等位基因頻率:在江蘇漢族為0.116 7(rs36208458)~0.896 7(rs200177947),在內(nèi)蒙古蒙古族為0.132 1(rs36208458)~0.906 1(rs200177947)。
27 個A-InDel 位點在江蘇漢族和內(nèi)蒙古蒙古族人群中的群體遺傳學參數(shù)見表1。其中,PIC 分別為0.298 3(rs2307783)~0.374 9(rs35248926)和0.284 1(rs2308232)~0.375 0(rs35248926、rs3837647),CDP分別為0.999 999 999 982 175和0.999 999 999 986 552,CPEtrio分別為0.991 449 541 和0.997 986 006,CPEduo為0.953 418 308 和0.955 381 659。
表1 27 個A-InDel位點在2 個研究人群中的群體遺傳學參數(shù)Tab.1 Population genetic parameters of 27 A-InDels in two studied populations
16 個X-InDel 位點在江蘇漢族和內(nèi)蒙古蒙古族人群中的群體遺傳學參數(shù)見表2。其中,PIC 分別 為0.168 1(rs200177947)~0.374 9(rs66554185)和0.155 7(rs200177947)~0.374 6(rs72513349),CMECtrio分別 為0.998 018 512 和0.998 243 638,CMECduo分 別為0.974 854 830 和0.976 907 303。在2 個研究人群的女性群體中,CDPfemale分別為0.999 997 962 和0.999 998 389;男性群體中,CDPmale為0.999 818 940和0.999 856 063。
表2 16 個X-InDel位點在2 個研究人群中的群體遺傳學參數(shù)Tab.2 Population genetic parameters of 16 X-InDels in two studied populations
此外,2 個Y-InDel 位點在所有男性群體中均被檢出,在所有女性群體中均未被檢出。
根據(jù)10 個人群27 個A-InDel 位點的等位基因頻率,使用Arlequin v3.5.2軟件計算得到Fst遺傳距離,結果顯示,江蘇漢族、內(nèi)蒙古蒙古族和東亞人群間Fst遺傳距離較近(0.000 06~0.000 27),以上3 個人群與其他7個洲際人群間Fst遺傳距離較遠(0.001 82~0.004 62)。
為了更加直觀地反映不同人群間的遺傳關系,基于人群間的遺傳距離矩陣構建了系統(tǒng)發(fā)育樹(圖1)與MDS 分析圖(圖2)。系統(tǒng)發(fā)育樹顯示:10 個人群共分為兩大主支;本研究中的漢族、蒙古族和東亞人群為一支,且漢族與蒙古族人群進一步聚為同一分支;7 個洲際人群聚為一支,其中3 個歐洲人群、2 個西亞人群、1 個美洲人群以及1 個非洲人群分別位于獨立分支。MDS 分析圖中,漢族、蒙古族和東亞人群聚集在右上方;除非洲外的6 個洲際人群分布在右下方,非洲人群則位于左下方。
圖1 10 個人群間的系統(tǒng)發(fā)育樹Fig.1 Phylogenetic tree of 10 populations
圖2 10 個人群間的MDS 分析圖Fig.2 MDS analysis diagram of 10 populations
InDel是一種二等位基因遺傳標記,廣泛存在于人類基因組中,兼具STR 與SNP 的優(yōu)點,可用于群體遺傳學領域,其中包括探尋祖先遺傳信息、分析群體的遺傳學結構等[25]。本研究使用自主研發(fā)的SifaInDel 45plex 體系對我國江蘇漢族和內(nèi)蒙古蒙古族共398 名無關個體進行遺傳多態(tài)性調(diào)查,并基于其27 個AInDel 位點分析上述2 個研究人群與其他8 個參考人群間的遺傳關系。
在江蘇漢族和內(nèi)蒙古蒙古族人群中,27個A-InDel和16 個X-InDel 位點的分布均符合Hardy-Weinberg平衡,位點間均不存在連鎖不平衡現(xiàn)象。CPE、MEC和CDP 是法醫(yī)學應用領域常用的評估指標,在本研究中,27 個A-InDel 位點的CDP 均高于0.999 999 999 9,說明該試劑盒可用于江蘇漢族與內(nèi)蒙古蒙古族人群的法醫(yī)學個體識別。但CPEtrio在2 個研究人群中均小于0.999 9,不建議單獨應用于親權鑒定,可作為常規(guī)STR 分型試劑盒的有效補充。相比于以往的檢測體系[10,26-28],SifaInDel 45plex體系同時包含了27個AInDel、16 個X-InDel 和2 個Y-InDel 位點,可獲得更多的遺傳信息,并能夠有效地提高性染色體的識別度,為復雜親緣關系鑒定提供有效的遺傳信息。該體系的不足之處在于CPE 值較低,無法獨立應用于親權鑒定,在后續(xù)優(yōu)化過程中,可將該體系中部分InDel 位點進行替換以提高該體系的系統(tǒng)效能。
不同民族人群的遺傳標記分布存在差異,這對全面了解各人群的遺傳多態(tài)性和相互遺傳關系具有重大意義。研究InDel 位點在不同人群間的遺傳學數(shù)據(jù),可促進其在法醫(yī)學實踐中的應用。本研究選取了10 個具有代表性的人群,包括1 個中國江蘇漢族人群、1 個中國內(nèi)蒙古蒙古族人群以及8 個洲際人群。其中,江蘇漢族人群主要分布在我國華東地區(qū),內(nèi)蒙古蒙古族人群主要分布在我國西北地區(qū),其他8 個參考人群則分布在不同洲際。江蘇漢族、內(nèi)蒙古蒙古族與東亞人群的地理位置分布較近,與其他7 個洲際人群地理距離較遠,將遺傳關系與地理分布信息相結合,有助于加深對不同地區(qū)、不同民族間遺傳關系和遺傳背景的理解?;?7 個A-InDel 位點的等位基因頻率計算得到10 個人群間的遺傳距離矩陣,其結果顯示,我國江蘇漢族、內(nèi)蒙古蒙古族以及東亞人群間遺傳距離較近,與其他7 個洲際人群間遺傳距離較遠。為了進一步明確人群間的遺傳關系,本研究根據(jù)遺傳距離矩陣構建了系統(tǒng)發(fā)育樹和MDS 分析圖。系統(tǒng)發(fā)育樹顯示,10 個人群分為2 個主支,第一主支由我國江蘇漢族、內(nèi)蒙古蒙古族以及東亞人群構成。本研究中東亞參考人群包含除我國外的其他東亞地區(qū)人群,如韓國人群、日本人群等,包含樣本數(shù)量多且分布范圍較廣。也就是說,第一主支中遺傳關系較近的3 個人群均分布在東亞地區(qū)。因此,本研究進一步從分子遺傳學角度證實,地理位置相近的民族可能會有更多的基因交流,從而具有較近的遺傳關系。第二主支由其他7 個洲際參考人群構成,其中3 個歐洲人群、2 個西亞人群、1 個美洲人群以及1 個非洲人群進一步形成各自分支。MDS 分析圖顯示,本研究中江蘇漢族、內(nèi)蒙古蒙古族與東亞人群聚在一起,遺傳關系較近,且與其他洲際人群的遺傳關系較遠。上述遺傳距離矩陣、系統(tǒng)發(fā)育樹和MDS 分析圖所反映的遺傳關系遠近與歷史文化背景及地域分布等較為吻合,江蘇漢族、內(nèi)蒙古蒙古族與地理位置分布近的東亞參考人群具有較近的遺傳關系,與地理位置相隔遠的其他洲際人群的遺傳關系較遠,這也間接表明地域隔離對人群間遺傳背景的影響,從而形成了獨特的地域遺傳差異。本研究結果與既往研究[29-30]結果基本一致。
綜上所述,本研究應用SifaInDel 45plex 體系對我國江蘇漢族和內(nèi)蒙古蒙古族共398 名無關個體進行了遺傳多態(tài)性調(diào)查,獲得了人群的等位基因頻率以及PIC、CDP、CPE 等群體遺傳學數(shù)據(jù),并與不同洲際人群進行了遺傳關系分析。結果表明,SifaInDel 45plex體系包含的InDel 位點在2 個研究人群中有較好的多態(tài)性和鑒別能力,并能夠區(qū)分不同洲際人群。本研究獲得了2 個研究人群45 個InDel 位點的基因分型數(shù)據(jù)及等位基因頻率等信息,豐富了中國人群InDel 數(shù)據(jù)庫,也為法醫(yī)學應用及群體遺傳研究提供了數(shù)據(jù)支持。