高超群,曹然然,杜文蘋,胡曉玉,雷艷茹,李文婷,康相濤
(1.河南農(nóng)業(yè)大學動物科技學院,鄭州 450046; 2.河南省雞種質(zhì)資源創(chuàng)新與利用重點實驗室, 鄭州 450046)
家雞是人類馴化較早的家禽,不僅是人類優(yōu)質(zhì)蛋白質(zhì)的主要來源,而且與人類文化生活也有著密切的聯(lián)系,從古至今被用于祭祀、娛樂或觀賞等[1-2]。中國作為可能的家雞起源地之一,地理和文化多樣性豐富且幅員遼闊[3-5],是世界上雞遺傳資源最豐富的國家之一[6]。2021年公布的《國家畜禽遺傳資源品種名錄》中地方雞品種達到115個。中國地方雞在經(jīng)歷幾千年的自然和人工選擇下已形成了紛繁、各具特色品種眾多的群體,積累了相當豐富的遺傳變異和表型多樣性[7]。清楚地研究和理解種群之間和種群內(nèi)部的多樣性及種群結(jié)構對于有效管理遺傳資源至關重要[8]。
此前,中國地方雞遺傳多樣性與種群結(jié)構的研究主要使用微衛(wèi)星標記[9-11],其在非洲[12]、孟加拉國[13]、印度尼西亞[14]等國的地方雞及商業(yè)品種[15-16]的遺傳多樣性研究中被廣泛使用,研究結(jié)果對地方品種的保護以及揭示品種起源、育種歷史提供了參考。但微衛(wèi)星標記對于新物種開發(fā)微衛(wèi)星位點時隨機性大,利用其檢測多態(tài)性耗時耗力,因此具有一定的局限性[17]。近年來,NGS測序及基因分型芯片的快速發(fā)展極大的推進了更加精細、快速、且低成本的全基因組SNP標記分析。Zhang等[18]利用全基因組SNP標記分析了中國地方雞的種群多樣性及斗雞的選擇特征;Cendron等[19]利用SNP標記對意大利地方雞品種多樣性以及種群結(jié)構進行了詳細的分析,在其他物種如羊[20]、牛[21]、豬[22]、馬[23]等的研究中基于全基因SNP標記對其遺傳多樣性、種群結(jié)構以及育種起源歷史進行了比較系統(tǒng)的研究。因此,本研究使用全基因組SNP標記,分析中國地方雞品種的遺傳多樣性、群體結(jié)構、親緣關系、ROH,為設計和實施遺傳資源保護策略提供參考。
本研究選取Synergistic Plant and Animal(SYNBREED, www.synbreed.tum.de)項目部分數(shù)據(jù)。SYNBREED 項目從全球范圍雞群體中廣泛收集了脫氧核糖核酸 (DNA) 樣本,本研究從中選取了18只白耳黃雞(Baier)、19只茶花雞(Chahua)、20只河南斗雞(Fighting)、20只固始雞(Gushi)、20只狼山雞(Langshan)、20只皖南三黃雞(WanTy)、20只泰和烏骨雞(Wugu)以及20只蕭山雞(Xiaoshan)等8個中國地方雞品種,共157只地方雞個體及80只白殼蛋雞系(WL)、73只褐色蛋雞系(BL)和80只肉雞系(BR)共233只商品雞個體構建新的數(shù)據(jù)集。
使用 Affymetrix?AxiomTM600 K全基因組雞基因分型芯片對 DNA 樣本進行基因分型,基因分型在慕尼黑工業(yè)大學 (Prof. R. Fries) 進行,Affymetrix?AxiomTM600 K全基因組雞基因分型芯片 包含超過580K個SNPs[24]。使用參考基因組Gallus_gallus-5.0[25]注釋了 579 621 個 SNPs。
首先刪除了重復、注釋不明確及性染色體的27 427個SNPs,之后使用PLINK 1.9[26]進行過濾:1) ≥95% 的個體檢出率;2) ≥99%的SNP 檢出率,共保留443 352個SNPs的數(shù)據(jù)進行后續(xù)分析。最后使用PLINK基于連鎖不平衡進行過濾,窗口大小、步長及r2的參數(shù)分別為“50、5、0.2”,通過過濾的157 968個SNPs用于種群結(jié)構的分析。
1.4.1 遺傳多樣性指數(shù) 使用PLINK 估計觀測雜合度(observed heterozygosity,Ho)和期望雜合度(expected heterozygosity,He)、次等位基因頻率(minor allele frequency, MAF)以及基于觀測和期望純合基因型數(shù)量之間的差異估計的基因組近交系數(shù)(FHOM)。每個品種中個體的He和Ho估計值是所有 SNPs 的平均值。使用VCFtools[27]進行種群核苷酸多樣性計算,以上多種指數(shù)可以反映種群的遺傳多樣性。
1.4.2 群體結(jié)構、親緣關系及ROH 使用PLINK基于Bayesian model用于主成分分析(principal component analysis, PCA)、地方雞和商品雞組合數(shù)據(jù)集多維尺度縮放(MDS)分析及構建遺傳距離矩陣和全基因組的狀態(tài)同源(identity by State, IBS)距離矩陣,使用MEGAX (https://www.megasoftware.net/) 鄰接法構建系統(tǒng)發(fā)育樹(phylogenetic tree),參數(shù)設置為引導復制1 000次,通過iTol(https://itol.embl.de/)注釋可視化。使用 ADMIXTURE 1.3[28]分析種群的相關性,設置了K=2~10的數(shù)據(jù)集。R語言Hierfstat包用于計算所有品種成對群體分化指數(shù)(Fst),估計種群間遺傳分化,根據(jù)Fst值將遺傳分化分為4個水平:低(<0.05)、中(0.05~0.15)、高(0.15~0.25)和極高(>0.25)[29]。使用PLINK檢測長純合片段(runs of Homogeneity,ROH),基因組近交系數(shù)(FROH)等于基因組中ROH片段的總長度占常基因組總長度(944 270 kb)的比例,每個ROH根據(jù)其物理長度分類如下:1~2、2~4、4~8、8~16和≥16 Mb[30-32]。
遺傳多樣性指標如表1所示,皖南三黃雞的期望雜合度(He, 0.314)、觀測雜合度(Ho, 0.321)及次等位基因頻率(MAF, 0.236)最高,斗雞的最低(He, 0.239;Ho, 0.260;MAF, 0.175),所有品種的Ho均高于He,表明各品種遺傳多樣性均較為豐富;斗雞的平均FHOM最高(0.205),其次是固始雞(0.184)與烏骨雞(0.180),狼山雞(0.018)與皖南三黃雞(0.017)的FHOM最低。核苷酸多樣性結(jié)果見圖1,其變化趨勢與MAF值基本一致,皖南三黃雞具有最高的核苷酸多樣性,斗雞最低。
表1 家雞品種遺傳多樣性指數(shù)
圖1 不同雞種的核苷酸多樣性
2.2.1 群體結(jié)構 本研究利用鄰接法構建了種群之間的系統(tǒng)發(fā)育樹,并對樣本和品種進行注釋(圖2A),不同品種分布在不同的分支上,充分展示了品種間的集群和關系。皖南三黃雞的分支最短,而茶花雞的分支最長,其中有一只離群的烏骨雞出現(xiàn)在了蕭山雞的分支旁。
主成分分析(PCA)顯示前兩個主成分的貢獻率: PC1(18.59%)和PC2(15.27%)。來自8個品種的個體清楚地分為5個亞群(圖2B),其中茶花雞、固始雞、斗雞以及狼山雞為獨立的種群。在PC1上斗雞、固始及狼山雞距離較近,與進化樹分析結(jié)果基本一致。進一步利用組合數(shù)據(jù)集進行MDS分析(圖2C),雖然地方雞種整體相對與商業(yè)肉雞品種(BR)更加接近,但也呈現(xiàn)出不同的分層,在地方品種中,茶花雞和蕭山雞更接近商業(yè)肉雞品種。
圖2 家雞群體系統(tǒng)發(fā)育樹(A)、PCA(B)及MDS(C)分析圖
通過Admixture分析(圖3)計算了從2到10個潛在集群(K)的范圍,由圖3A可知,總樣本中存在的最佳擬合種群數(shù)量是K=7。K=2(圖3B)時,茶花雞首先分離出來;K=3時,斗雞與固始雞分離出來;K=4時,狼山雞分離,K=5時白耳黃雞與烏骨雞分離出來;K=6時蕭山雞分離出來。有趣的是在最小誤差K=7時皖南三黃雞血統(tǒng)也是其他幾種品種之間的混合,直到K=8時,皖南三黃雞才分離出來。事實上,當K=8時也更符合現(xiàn)實的分群,其誤差也僅次于K=7(圖3A),表明皖南三黃雞的血統(tǒng)比較雜合,這與其上述遺傳多樣性研究結(jié)果相一致。
圖3 K值最佳路線圖(A) 和群體結(jié)構圖(B)
2.2.2 親緣關系 所有品種對之間的遺傳分化程度見圖4A,這些結(jié)果與 PCA分析結(jié)果一致。Fst值范圍從0.09(皖南三黃雞和狼山雞)到 0.22(茶花雞和狼山雞),皖南三黃雞與其他品種的Fst值最低在0.09~0.14之間,茶花雞的最高在0.14~0.22之間。
品種之間和品種內(nèi)部個體的IBS遺傳距離見圖4B,群體的IBS遺傳距離在0.092 9~0.319 9之間,平均為0.277 4。品種間的IBS遺傳距離較遠,但也存在一定程度的親緣關系(圖4B中顏色較淺的方格);其中茶花雞與其他品種之間遺傳距離較遠,這與PCA結(jié)果一致。部分斗雞個體間的IBS遺傳距離較近(圖4B中顏色較淺的方格),皖南三黃雞個體之間遺傳距離都較遠。
圖4 所有品種成對基因頻率分化指數(shù)Fst (A),IBS距離矩陣可視化熱圖(B)
ROH分析共得到524 2個ROH片段,長度分布在1~41.51 Mb之間。ROH的長度和數(shù)量被認為與物種的近交程度呈正相關,其中長的ROH片段被認為是近世代近交繁殖的結(jié)果,而較短的ROH可能表明更遠的祖先效應[33-34]。如圖5A表示,狼山雞1~2 Mb長度的ROH占比70.95%,未檢測到大于16 Mb長度的ROH;其次在皖南三黃雞1~2 Mb長度的ROH占群體的64.84%,同樣未檢測到大于16 Mb的ROH;茶花雞8~16 Mb與大于16 Mb的ROH分別占比5.14%、0.96%。基于每個個體內(nèi)ROH總數(shù)量與長度的分布(圖5B)可以清楚地看到,皖南三黃雞和狼山雞中ROH的數(shù)量和長度均低于其他品種。目前,基于ROH 的近交系數(shù)估(FROH) 被認為是檢測近親繁殖的最有效方法之一[35],茶花雞品種的近交平均值最高(圖5C最上方數(shù)字),其次是固始雞和斗雞。皖南三黃雞的近交平均值最低,其次為狼山雞,個體中FROH最高極值出現(xiàn)在斗雞群體中(FROH=0.277)。
圖5 各個品種中不同長度ROH統(tǒng)計(A), 各個品種個體ROH數(shù)量與總長度(B)及各個品種FROH (C)
在現(xiàn)代化的動物遺傳育種進程中,優(yōu)良畜禽品種經(jīng)歷了短期高強度的人工選擇,其在改善畜禽生產(chǎn)性能的同時不可避免造成群體的近交[36]。近交會造成近交衰退及群體遺傳多樣性降低等危害,因此評估畜牧群體遺傳多樣性[23],了解品種間的關系和種群結(jié)構對于保證農(nóng)牧業(yè)生產(chǎn)可持續(xù)發(fā)展具有重要意義[19]。本研究基于高密度全基因組 SNP 芯片使用多種方法估計了遺傳多樣性指數(shù)和基因組近交系數(shù),以此評估品種內(nèi)的遺傳多樣性水平。所研究的地方品種群體平均觀測雜合度均高于平均期望雜合度,表明地方雞遺傳多樣性較高,這與先前報道一致[18]。FHOM分析結(jié)果表明,家雞品種中皖南三黃雞和狼山雞近交程度較低,斗雞與茶花雞近交程度較高。同時觀察到皖南三黃雞和狼山雞品種的遺傳多樣性最為豐富,皖南三黃雞目前并未處于國家級保護計劃之中,這應與其原產(chǎn)地有關[37]。處于保護計劃之中的狼山雞遺傳多樣性高于其他3個保護品種,這也與Zhang 等[38]的研究結(jié)果一致。
基于 PCA、進化樹及Admixture對種群結(jié)構分析結(jié)果表明,每個品種的個體聚集在一起并表現(xiàn)出一致的遺傳背景,在地方雞與商品雞進行MDS分析的結(jié)果中,商業(yè)品種與中國地方品種明顯區(qū)分開來,但整體上地方雞與商業(yè)肉雞品種相對更加接近,這也符合肉雞系的育種歷史[39],表明了地方品種的肉用育種潛力。使用群體分化指數(shù)Fst和IBS遺傳距離評估種群間與種群內(nèi)的親緣關系,結(jié)果表明,不同方法評估 8個品種之間的相對關系也相一致,其中斗雞部分個體間的IBS遺傳距離較近,說明其存在較高的親緣關系以及較大的近交風險,可能需要改進選配措施,而皖南三黃雞個體之間遺傳距離都較遠,這與多樣性研究結(jié)果一致。
ROH 分析有利于實施品種保護計劃[23],全基因組SNP特別適合檢測雜合性降低的基因組區(qū)域[40],由此計算而來的FROH被認為是檢測近親繁殖的最有效方法之一,其準確性已在牛[41]、豬[42]和山羊[43]中得到證實。ROH的長度和數(shù)量與群體歷史信息的多個方面有關[18,44-45]。近交水平越高,基因組中ROH的數(shù)量和長度越大,因此根據(jù)結(jié)果,茶花雞、固始雞以及斗雞可能經(jīng)歷過較高強度近交繁殖。
本研究表明,地方雞遺傳資源多樣性整體較為豐富。斗雞和茶花雞品種的遺傳多樣性低于其他品種,狼山雞與皖南三黃雞的遺傳多樣性更加豐富,基因組近交系數(shù)和ROH分析表明茶花雞、固始雞以及斗雞近交程度相對過高,不同品種間出現(xiàn)了中高等群體分化且整體與商業(yè)肉雞品種更為接近。了解品種間分化程度與親緣關系是支持保護計劃工作的重要因素,幫助制定有針對性的交配計劃,以保護最瀕危的品種以及支持育種、遺傳資源開發(fā)與利用工作。