劉樹虎 王德萍 伊力哈木·乃扎木 多力坤·買買提玉素甫
(新疆大學(xué)生命科學(xué)與技術(shù)學(xué)院,烏魯木齊 830046)
克里雅人生活在塔克拉瑪干沙漠腹地的達里雅布依,地理位置偏遠、交通狀況不佳、生活環(huán)境惡劣,與鄰近地區(qū)人群來往較少,過著與世隔離的生活[1-2]。這一方面說明有關(guān)克里雅人在分子遺傳方面的研究很少,特別是利于人群族源追蹤的母系遺傳方面的研究;另一方面因克里雅人固守自己獨特的生活方式和文化傳統(tǒng),無異族通婚現(xiàn)象,其原有的遺傳性狀還未受到干擾破壞[3],這有利于研究族群的遺傳結(jié)構(gòu)、族源追蹤等,提高了研究的精準(zhǔn)度。關(guān)于克里雅人的研究多在歷史記載方面,線粒體DNA(mtDNA)方面只選取幾十個堿基位點或高變區(qū)進行研究[4-5],缺乏全序列、完整系統(tǒng)性的研究,得出的結(jié)論也不夠準(zhǔn)確。因此,本研究采用二代測序技術(shù)對mtDNA全序列進行測序,結(jié)合生物信息學(xué)技術(shù)對mtDNA測序結(jié)果進行分析和比較。旨在收集、保存特殊人群的基因資源,建立遺傳信息數(shù)據(jù)庫;闡明克里雅人母系遺傳結(jié)構(gòu)與多樣性;為克里雅人群的族源從分子遺傳學(xué)角度提供憑證,進而豐富、完善中華民族遺傳多樣性研究。
于田縣達里雅布依鄉(xiāng)采集70份克里雅人外周血樣本,要求:個體間無相關(guān)、年齡≥30歲、身體健康、3代以上生活在當(dāng)?shù)亍o異族通婚史,并簽署知情同意書。收集已報道人群單倍型頻率和HVS-Ⅰ突變序列數(shù)據(jù)進行比較研究。收集的族群有克里雅人(KA)、新疆維吾爾族(UXJ)、新疆哈薩克族(KazXJ)、新疆烏茲別克族(UzbXJ)、新疆回族(HuiXJ)、新疆蒙古族(MonXJ)、新疆漢族(HanXJ)、內(nèi)蒙古蒙古族(MonIM)、內(nèi)蒙古達斡爾族(DauIM)、內(nèi)蒙古鄂倫春族(OroIM)、內(nèi)蒙古朝鮮族(KorIM)、西藏藏族(TibXZ)、廣西壯族(ZhuangGX)、中亞人群(CA)。
外周血基因組DNA提取使用GENVIEW公司生產(chǎn)的離心柱法抽提試劑盒,嚴(yán)格按照操作說明進行。
委托上海明碼生物科技有限公司測序,方法和步驟同參考文獻[9]。
直接計數(shù)法統(tǒng)計變異位點和單倍型頻數(shù)及頻率;主成分分析使用SPSS 19.0軟件,Mega 7.0繪制鄰接系統(tǒng)樹;DNAsp軟件統(tǒng)計mtDNA多態(tài)性指標(biāo),包括N-個體數(shù)、H-單倍型數(shù)、Ps-多態(tài)性位點數(shù)、Pi-平均核苷酸配對差異數(shù)目、HD-單倍型多樣性、π-核苷酸多樣性、P-隨機匹配概率、DP-個體識別率等。
克里雅人mtDNA變異位點匯總?cè)绫?。 70個克里雅人共檢出256處變異位點,控制區(qū)變異位點71處占比為27.73%,編碼區(qū)變異位點185處占比為72.27%,其中245處多態(tài)性位點。A263G、A750G、A4769G、 A8860G、 A15326G 5處位點變異率為100%,高頻變異位點還有A73G、 A1438G、 T16519C等88處(本研究定義變異率≥10%的位點為高頻位點),高頻變異位點占總變異位點的34.38%.收集到人群前5處高頻變異位點如表2,表中263/A→G/1表示:mtDNA 263位點由A突變?yōu)镚突變率為1;D表示此位置堿基缺失;C→CC表示此處插入1個C。各人群高頻變異位點存在較大差異,克里雅人與新疆維吾爾族高頻變異位點最接近。
表1 線粒體全序列突變位點Tab 1 The mutation sites of complete sequence of mtDNA
(續(xù)表1)
表2 人群mtDNA 高頻變異位點比較Tab 2 The high frequency variation locis of mtDNA in population comparison
克里雅人mtDNA堿基變異類型有轉(zhuǎn)換、顛換、缺失、無插入,轉(zhuǎn)換明顯高于顛換和缺失;控制區(qū)的轉(zhuǎn)換和顛換率都明顯高于編碼區(qū),4種堿基轉(zhuǎn)換分別占總堿基變異的95.31%,T→C的變異率最高,占堿基總變異的26.95%;8種堿基顛換檢出5種占總堿基變異的3.9%,C→A的顛換最高;堿基缺失較低,占總堿基變異的0.78%,無9bp缺失現(xiàn)象(表3)。mtDNA平均核苷酸配對差異數(shù)目為30.2714,核苷酸多樣性為0.0018,劃分出20種不同單倍型,單倍型多樣性為0.9264,隨機抽取2個個體具有不同單倍型的概率為0.9132,個體識別率能為法醫(yī)遺傳學(xué)中個體識別、親子鑒定提供理論依據(jù)(表4)。
依據(jù)Yao等[6]構(gòu)建的單倍型框架,克里雅人在此基礎(chǔ)上構(gòu)建了20個單倍型(表5),所有單倍型都隸屬于M或N兩大聚類??死镅湃酥饕性贔、 M、 H主單倍型,單倍型頻率最高的分別為F1a1/15.7%、M8a2a1/12.9%、H1t/11.4%、M11a2/10.0%。 依據(jù)世界范圍內(nèi)人群mtDNA單倍型特異性分布(http: //www.phylotree.org),F(xiàn)、M及其亞單倍型為亞洲特異單倍型在克里雅人中貢獻率為58.6%,HV、 H、 J、 W、 R、T、 U、X及其亞單倍型為歐洲特異單倍型在克里雅人中貢獻率為41.4%,克里雅人含亞歐特異單倍型且亞洲特異單倍型高于歐洲特異單倍型,具有亞歐遺傳混合特征。
依據(jù)表6已報道人群單倍型頻率數(shù)據(jù)利用SPSS19.0軟件進行主成分分析。結(jié)果顯示(圖1)3個主成分總共解釋了81.60%的總方差,克里雅人與新疆維吾爾族相聚最近,來自新疆、中亞的各人群比較集中地聚在一起,它們都含有高頻的M、 H、 F、 U單倍型且不含或含有較低的Y、V、B、 K單倍型,說明克里雅人具有典型的中亞人群單倍型;來自內(nèi)蒙古各人群與新疆回族,新疆漢族,西藏藏族集中為第2簇,它們都含高頻的M、 D、 A、 B單倍型而不含或含低頻H、 V、K、 HV、 U、J單倍型;廣西壯族與其他各人群相聚最遠,因含高頻的M、D、F、B單倍型但不含或含低頻G、HV、V、 H、R、 J、K、 T單倍型。除西藏藏族,廣西壯族及內(nèi)蒙古各人群外,其他人群都地處中亞,他們之間相聚得較近,這與史上記載中亞人群在遷徙、融合方面聯(lián)系頻繁,是多宗教并存多民族聚居的地區(qū)相符[12]。但是所有人群又有一定的聯(lián)系都含有高頻M、 D單倍型和低頻V、K單倍型等。
表3 克里雅人線粒體DNA突變類型和頻率Tab 3 Mutation types and rates of mtDNA in Keriyan
表4 克里雅人線粒體DNA多態(tài)性指標(biāo)Tab 4 Polymorphism index of mtDNA in Keriyan
表5 克里雅人線粒體DNA單倍型分布(%)Tab 5 The mtDNA haplotype distribution map of Keriyan (%)
報道各人群缺少mtDNA全序列測序數(shù)據(jù),都只研究了HVS-Ⅰ的序列,因此本研究以克里雅人HVS-Ⅰ變異位點為基準(zhǔn),整理報道人群相同位點堿基序列(表7),運用Mega 7.0進行了堿基比對和鄰接系統(tǒng)樹分析如圖2。14個人群聚為3大支:克里雅人、中亞人群、新疆維吾爾族、內(nèi)蒙古達斡爾族、廣西壯族聚為第一大支,說明克里雅人具有典型中亞人群特征,與維吾爾族親緣關(guān)系最近;新疆哈薩克族、新疆烏茲別克族聚在一起成為第二大支,兩人群具有較近的親緣關(guān)系;新疆回族、新疆漢族、新疆蒙古族、內(nèi)蒙古蒙古族、內(nèi)蒙古鄂倫春族、內(nèi)蒙古朝鮮族、西藏藏族聚為第三大支,表明他們的親緣關(guān)系近。
主成分分析和鄰接系統(tǒng)樹分析結(jié)果總體相符,也存在差異:西藏藏族在主成分分析中與新疆漢族很近,與內(nèi)蒙古鄂倫春族較遠,但在鄰接系統(tǒng)樹分析中正好相反;內(nèi)蒙古朝鮮族在主成分分析中與內(nèi)蒙古蒙古族很近,而在鄰接系統(tǒng)樹分析中其與新疆蒙古族較近。依據(jù)已有相關(guān)人群的研究[7-9],使用變異堿基序列去分析人群比使用單倍型頻率去分析更具優(yōu)越性和準(zhǔn)確性。
表6 各人群線粒體DNA單倍型頻率分布(%)Tab 6 The frequency distribution of mtDNA haplotypes in different populations (%)
Note: ① The data of the reference population were taken from the literature 6-11;② Due to the different degrees of haplotype classification to each subtype of the reference population,the haplotype frequency data of all haplotypes were merged and the haplotypes of the same haplotype subclasses were merged.For example,haplotype M of some people were divided into M1a and M2al and others were divided into M1 and M2,while some people could only identify M,so all sub-branches were merged into a haplotype M class
表7 各人群線粒體DNA高變Ⅰ區(qū)突變位點分布Tab 7 The mutation sites of mit DNA HVS-Ⅰin different populations
(續(xù)表7)
Note: Position indicated the mutation base site in the hypervariable I region of mitochondrial DNA
圖1 線粒體DNA主成分分析Fig 1 The principal component analysis of mtDNA
圖2 人群系統(tǒng)進化樹Fig 2 Population phylogenetic tree
初次對達里雅布依鄉(xiāng)克里雅人mtDNA基因組進行全序列測序,mtDNA的遺傳結(jié)構(gòu)顯示:克里雅人共檢出256處堿基變異位點,其中多態(tài)性位點245處,占比為95.70%,變異頻率在0.01~1,A263G、A750G、A4769G、A8860G、A15326G 5個位點變異率為100%,高頻變異位點還有A73G、A1438G、T16519C等88個,高頻變異位點占總變異位點的34.38%,核苷酸多樣性為0.1827,這與布帕提瑪穆[13]研究的新疆維吾爾族人群的線粒體遺傳多樣性和阿布都熱合曼[12]研究的新疆不同地區(qū)維吾爾族人群mtDNA遺傳多樣性數(shù)據(jù)一致,說明克里雅人具有維吾爾族人群典型的變異位點;界定了20種單倍型,單倍型多樣性為0.9264,單倍型頻率在1.4%~15.7%,高頻單倍型有F1a1/15.7%、M8a2a1/12.9%、H1t/11.4%、M11a2/10.0%。隨機抽取2個個體具有相同單倍型概率為0.0868,個體識別率為0.9132,可用于克里雅人群體的個體識別、母系起源、親權(quán)鑒定等法醫(yī)學(xué)研究;再加上mtDNA本身的遺傳特征,使得利用mtDNA進行研究具有獨特的優(yōu)越性[14]。
遺傳結(jié)構(gòu)是研究種群中遺傳變異分布的總的概括,即遺傳多樣性和遺傳分化程度。遺傳多樣性的大小直接反映是種群內(nèi)、種群間遺傳變異的豐富性;遺傳分化程度的大小反映種群內(nèi)、種群間遺傳相似性的程度。
以人群單倍型類型和頻率比較顯示:克里雅人所有單倍型都在中亞人群單倍型范圍內(nèi),H、HV、U單倍型占比較高;克里雅人和藏族人群都含有高頻的M、F單倍型,但克里雅人H、HV、R單倍型占比很高而藏族人群不含這些單倍型,相反藏族人群A、C、D、G單倍型占比較高而克里雅人不含這些單倍型;新疆其他人群和內(nèi)蒙古各人群單倍型主要分布在A、C、D、G、N、Y、Z、B,而克里雅人和維吾爾族人群單倍型主要分布在M、H、HV、J、T、K、U、R;藏族人群和壯族人群單倍型類型占比與漢族人群和回族人群單倍型類型占比接近,而與中亞人群相差較遠。以克里雅人mtDNA HVS-Ⅰ發(fā)現(xiàn)的39個堿基變異位點為基礎(chǔ)比較各人群相同位點堿基顯示:克里雅人與中亞人群和新疆維吾爾族相同堿基位點差異最小,分別有6處和7處位點不同,而與其他人群相差較遠,特別與西藏藏族人群存在33處位點不同;16048位點只有克里雅人變異為A,其他人群變異為G,16093、16129、16223、16249、16298、16311位點只有藏族人群變異堿基不同,其他人群具有相同的變異堿基,16189位點所有人群均變異為C;新疆其他人群和內(nèi)蒙古各人群堿基變異差異沒有統(tǒng)計學(xué)意義;位點變異各人群主要是轉(zhuǎn)換,而藏族人群主要為顛換。
人群單倍型類型及占比、相同位點堿基變異比較與人群主成分分析和鄰接系統(tǒng)樹分析結(jié)果相符??死镅湃伺c新疆維吾爾族人群親緣關(guān)系最近,具有中亞人群典型特征;克里雅人與藏族、漢族、回族及內(nèi)蒙古各人群親緣關(guān)系較遠。
長期的自然選擇使得不同群體在母系遺傳結(jié)構(gòu)方面具有明顯的不同且具有地域特異性[15-17],A、 B、 C、 D、 F、G、 M7、N9、 Z及其亞單倍型為亞洲特異單倍型,HV、H、 V、 J、 K、 R、 T、U及其亞單倍型為歐洲特異單倍型。通過mtDNA全序列分析,克里雅人共劃分出20種單倍型,主要集中在M、F、H及下游單倍型占比為80.01%,M群支占30.01%,F群支占28.57%,H群支占21.43%為克里雅人特征單倍型,其中亞洲特異單倍型占60.01%,歐洲特異單倍型占39.99%,說明克里雅人mtDNA遺傳結(jié)構(gòu)含有亞歐典型單倍型,具有亞歐遺傳混合特征。隨著絲綢之路經(jīng)濟貿(mào)易興起-昌盛-衰落,人群交流頻繁,東亞人群自東向西遷徙,歐洲人群自西向東遷徙,經(jīng)過多次文化更替、民族融合、基因交流而形成了現(xiàn)今的人群遺傳結(jié)構(gòu)。
目前,克里雅人被我國政府規(guī)劃為維吾爾族的一支,關(guān)于克里雅人的族源有3種觀點:“西藏阿里古格后裔”說,“古樓蘭一支”說,“沙漠土著”說。
關(guān)于“西藏阿里古格后裔”說和“古樓蘭一支”說,在語言學(xué)、體質(zhì)人類學(xué)、分子人類學(xué)方面都予以否定。Chen 等[5]通過研究克里雅人的父系及母系遺傳從Y染色體和mtDNA遺傳結(jié)構(gòu)上雙重否定了這一觀點,并揭示克里雅人是東西歐混合的群體,可能起源于當(dāng)?shù)氐木S吾爾族群體;段然慧等[4]研究說明克里雅人群的核苷酸變異度和平均核苷酸差異介于所報道的東方人群和西方人群之間,系統(tǒng)發(fā)育樹也說明克里雅人與維吾爾族人親緣關(guān)系最近;姜濤等[18]研究的克里雅人體質(zhì)人類學(xué)表型特征揭示克里雅人具有典型的居住干旱荒漠族群特征,與于田維吾爾族體質(zhì)特征接近;樓蘭人操印歐語系,而克里雅人操維吾爾語屬阿爾泰語系,與其相矛盾;劉樹虎等[19]對克里雅人Y染色體的研究揭示克里雅人Y染色體單倍群構(gòu)成及頻率與維吾爾族最接近,主成分分析和系統(tǒng)進化樹分析顯示他們的親緣關(guān)系最近,推斷克里雅人是當(dāng)?shù)厣衬林用?,與維吾爾族族源有淵源。本研究得到完整的克里雅人mtDNA遺傳結(jié)構(gòu),通過比較克里雅人含有H、 HV、T、 R主單倍型及亞單倍型,而藏族不含有其,藏族含有的C、Z、G、 D、 A,克里雅人沒有檢測到;都含有的單倍型占比相差很大,如:克里雅人F及亞單倍型占比為28.6%,而藏族占比只有15.3%,克里雅人U及亞單倍型占比為8.6%,而藏族占比只有3.4%.同樣不支持克里雅人是西藏阿里古格王朝的后裔。
本研究結(jié)果支持“沙漠土著”說,這一觀點在體質(zhì)人類學(xué)、分子人類學(xué)等方面都得到了支持。對于“沙漠土著”說,筆者有2種推測:(1) 克里雅人一開始就生活在達里雅布依鄉(xiāng),隨著風(fēng)沙的不斷侵蝕,堵礙了與相鄰人群的聯(lián)系,日久天長形成了隔離的人群;(2) 克里雅人由別處沿著河流遷徙到達里雅布依,如從于田沿河北遷或隨絲綢之路的人群融合而留在了當(dāng)?shù)?,隨著絲路貿(mào)易的興衰、環(huán)境的惡化,逐漸形成了現(xiàn)今的克里雅人群。
通過運用不同方法從不同側(cè)面對克里雅人mtDNA的研究,初步得出以下結(jié)論:(1) 現(xiàn)代克里雅人mtDNA遺傳多樣性豐富,mtDNA遺傳結(jié)構(gòu)數(shù)據(jù)可為人群在遺傳結(jié)構(gòu)分析、法醫(yī)鑒定、疾病診斷等方面提供遺傳背景資料;(2) 現(xiàn)代克里雅人mtDNA遺傳結(jié)構(gòu)含有亞歐典型單倍型,具有亞歐遺傳混合特征;(3) 現(xiàn)代克里雅人是沙漠土著居民,起源于維吾爾族。
總之,民族的形成是一個復(fù)雜漫長的過程,加上人群的遷徙、融合事件以及各民族自身形成的民族風(fēng)俗、民族婚配等都將影響到群體的遺傳結(jié)構(gòu);族源問題僅從分子人類學(xué)、體質(zhì)人類學(xué)來探討是有局限性的,需要綜合其他學(xué)科的證據(jù)。另外,克里雅人源于何地的維吾爾族人群缺少分子人類學(xué)、體質(zhì)人類學(xué)、考古學(xué)等方面的證據(jù),這是一個值得研究探討的問題。