摘 要: 旨在對(duì)西門(mén)塔爾牛群體遺傳多樣性和遺傳結(jié)構(gòu)進(jìn)行分析,為配種方案和遺傳改良提供理論依據(jù)。本研究對(duì)149頭西門(mén)塔爾牛的全基因組進(jìn)行了重測(cè)序,并利用這些基因組數(shù)據(jù)獲取的高質(zhì)量單核苷酸多態(tài)性(single-nucleotide polymorphisms, SNPs)位點(diǎn),對(duì)其遺傳結(jié)構(gòu)、連續(xù)純合片段(runs of homozygosity, ROH)以及其親緣關(guān)系和家系構(gòu)建等方面進(jìn)行了深入的分析。結(jié)果顯示,149 頭西門(mén)塔爾牛平均測(cè)序深度為 5×,質(zhì)控后共鑒定到1 265 356 個(gè)SNPs位點(diǎn),平均最小等位基因頻率為0.067,平均多態(tài)信息含量為 0.083,平均觀察雜合度為0.121,平均期望雜合度為 0.157。親緣關(guān)系G矩陣與狀態(tài)同源(identical by state, IBS)遺傳距離矩陣具有相似的結(jié)果,大部分個(gè)體間的親緣關(guān)系呈中等水平。在 149 頭西門(mén)塔爾牛個(gè)體中,共檢測(cè)到70個(gè)基因組ROH,且ROH總長(zhǎng)度為 127 627.935 kb,其中有 98.57%的ROH是長(zhǎng)度介于在1~5 Mb之間?;赗OH計(jì)算得到的近交系數(shù)為 0.000 3,提示近親繁殖程度不高。此外,進(jìn)化樹(shù)分析將這149頭西門(mén)塔爾牛劃分成為 22 個(gè)不同的家系分支。綜上所述,西門(mén)塔爾牛群體表現(xiàn)出相對(duì)豐富的多樣性和適度的親緣關(guān)系。在少數(shù)個(gè)體中觀察到近親繁殖,但種群的整體近親繁殖水平仍然很低。
關(guān)鍵詞: 西門(mén)塔爾牛;低密度全基因組重測(cè)序;群體遺傳結(jié)構(gòu);遺傳多樣性;親緣關(guān)系
中圖分類(lèi)號(hào):
S823.2"""" 文獻(xiàn)標(biāo)志碼: A"""" 文章編號(hào): 0366-6964(2025)03-1189-14
收稿日期:2024-09-26
基金項(xiàng)目:泰山產(chǎn)業(yè)領(lǐng)軍人才工程專(zhuān)項(xiàng)經(jīng)費(fèi);煙臺(tái)市科技計(jì)劃項(xiàng)目(2023ZDCX024);現(xiàn)代農(nóng)業(yè)(肉牛牦牛)產(chǎn)業(yè)技術(shù)體系(CARS-37);山東省現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系牛產(chǎn)業(yè)創(chuàng)新團(tuán)隊(duì)(SDAIT-09-03);山東省農(nóng)業(yè)科學(xué)院創(chuàng)新工程(CXGC2024F10)
作者簡(jiǎn)介:胡 鑫(1989-),女,遼寧盤(pán)錦人,助理研究員,博士,主要從事肉牛遺傳育種的研究,Tel:0531-66655139,E-mail: huxin19890803@163.com
*通信作者:宋恩亮,主要從事肉牛遺傳育種與繁殖研究,E-mail: enliangs@126.com
Analysis of Genetic Diversity and Population Structure of Simmental Cattle Based on Whole
Genome Resequencing
HU" Xin "YOU" Wei "JIANG" Fugui "CHENG" Haijian "SUN" Zhigang3, SONG" Enliang1,2*
(1.Shandong Key Laboratory of Animal Disease Control and Breeding, Institute of Animal
Science and Veterinary Medicine, Shandong Academy of Agricultural Sciences, Jinan 250100,
China; 2.Key Laboratory of Livestock and Poultry Multi-omics of Ministry of Agriculture and
Rural Affairs, Jinan 250100," China; 3.Green Food Agriculture and Animal Husbandry
Technology Co., LTD., Yantai 265701," China)
Abstract:" The aim was to analyze the genetic diversity and genetic structure of Simmental cattle populations to provide a theoretical basis for breeding programs and genetic improvement. In this study, 149 Simmental cattle were subjected to whole genome resequencing, and genetic structure, runs of homozygosity (ROH), and kinship and lineage construction were analyzed based on high-quality single-nucleotide polymorphisms (SNPs) sites obtained from all the genomic data. The results showed that the average sequencing depth of 149 Simmental cattle was 5×, and a total of 1 265 356 SNPs loci were identified after quality control, with an average minimum allele frequency of 0.067, an average polymorphic information content of 0.083, an average observed heterozygosity of 0.121, and an average expected heterozygosity of 0.157. The G matrix of kinship and the IBS distance matrix had similar results, and most individuals had medium level of kinship. A total of 70 genomic ROH were detected in 149 Simmental cattle with a total ROH length of 127 627.935 kb, of which 98.57% were between 1 to 5 Mb in length. The inbreeding coefficient based on ROH was 0.000 3, suggesting a low degree of inbreeding. In addition, evolutionary tree analysis classified these 149 Simmental cattle into 22 different family branches. In summary, the Simmental cattle herd showed relatively rich diversity and moderate relatedness. Inbreeding was observed in a few individuals, but the overall level of inbreeding in the population remained low.
Keywords: Simmental cattle; low-density whole genome resequencing; population genetic structure; genetic diversity; kinship
*Corresponding author:SONG Enliang, E-mail: enliangs@126.com
全基因組遺傳變異在動(dòng)物馴化和人工選擇中起著至關(guān)重要的作用,保護(hù)全基因組遺傳變異可以提升種群適應(yīng)性和生存能力[1]。通過(guò)對(duì)基因組變異的鑒定挖掘,找出生物為適應(yīng)自然或人為因素造成的環(huán)境變化產(chǎn)生的新變異,對(duì)育種工作的順利進(jìn)行有著重要意義[2]。在生物體中,SNP是最小的變異且數(shù)量眾多,個(gè)體之間的多樣性、基因組進(jìn)化和群體的遺傳變異等都可能與SNP相關(guān)[3]。SNP適用于檢測(cè)群體間的變異,包括堿基的轉(zhuǎn)換和顛換兩種類(lèi)型。獲得的SNP數(shù)據(jù)在遺傳學(xué)中具有多種用途,如分析種群遺傳多樣性、構(gòu)建遺傳圖譜和進(jìn)行關(guān)聯(lián)分析等。同時(shí),利用變異注釋、群體起源進(jìn)化分析和選擇信號(hào)檢測(cè)等手段可探究群體進(jìn)化歷史、選擇、適應(yīng)性等問(wèn)題,提供分子標(biāo)記,鑒定與性狀相關(guān)的候選基因[4-5]。以SNP標(biāo)記為基礎(chǔ)的基因芯片技術(shù)成本低,已被用于各種基因組研究[6-7],包括種群歷史推斷、有效群體大小估計(jì)[8]、數(shù)量性狀定位[9]、全基因組關(guān)聯(lián)分析[10]和基因組選擇[11]等。在過(guò)去很長(zhǎng)一段時(shí)間的育種工作中,基因芯片都是鑒定各種性狀和表型差異的首選。然而,基因芯片中的SNPs位點(diǎn)是已知的、人為設(shè)定的,對(duì)新變異的發(fā)掘能力較弱。近年來(lái),全基因組重測(cè)序技術(shù)因測(cè)序成本降低,逐漸成為挖掘全基因組遺傳變異的主要方法[12]。全基因組重測(cè)序(whole genome sequencing, WGS)通過(guò)將測(cè)序數(shù)據(jù)比對(duì)到物種對(duì)應(yīng)的參考基因組,識(shí)別基因組范圍的遺傳變異,并基于這些遺傳變異進(jìn)一步獲得群體的遺傳特性,以探究物種的進(jìn)化規(guī)律和篩選功能基因?;赪GS的方法分析畜禽種群的生存能力和保存方面的應(yīng)用正變得越來(lái)越可行,對(duì)動(dòng)物生產(chǎn)、健康福利以及家畜物種和品種進(jìn)化研究具有重大影響[13]。
在畜禽研究領(lǐng)域中,基于重測(cè)序數(shù)據(jù)分析群體多樣性和群體結(jié)構(gòu)得到了廣泛的應(yīng)用?;谥販y(cè)序數(shù)據(jù),對(duì)羅坑雞[14]、大尾寒羊[15]、內(nèi)江豬[16]、大余鴨[17]等品種進(jìn)行的遺傳多樣性和群體結(jié)構(gòu)等研究可為更好地保護(hù)和利用這些畜禽品種資源并提供指導(dǎo)。在牛的研究領(lǐng)域中,研究人員通過(guò)對(duì)秦川牛保種群的全基因組重測(cè)序分析,發(fā)現(xiàn)其遺傳多樣性非常豐富,而且沒(méi)有出現(xiàn)明顯的近親現(xiàn)象。這一發(fā)現(xiàn)為秦川牛的保種選配工作提供了重要的科學(xué)依據(jù)[18]。Sun等[19]通過(guò)對(duì)西門(mén)塔爾牛的SNPs和拷貝數(shù)變異(copy number variation, CNV)進(jìn)行分析發(fā)現(xiàn)了一些與繁殖、免疫和肌肉發(fā)育相關(guān)的候選基因。Li等[20]利用全基因組測(cè)序技術(shù)探索了黑龍江雜交牛的種群結(jié)構(gòu),闡明了其遺傳多樣性,并通過(guò)ROH島和來(lái)自祖先的重要片段鑒定了與繁殖效率和牛肉品質(zhì)相關(guān)的基因。這些研究為肉牛品種遺傳資源的科學(xué)保護(hù)和遺傳改良提供了科學(xué)依據(jù)。
作為最重要且分布最廣泛的牛品種之一,西門(mén)塔爾牛主要用于牛奶和牛肉的生產(chǎn)。在過(guò)去的幾十年里,人類(lèi)在西門(mén)塔爾?;蚪M中進(jìn)行了強(qiáng)有力的選擇,這為提高其生產(chǎn)性能做出了巨大貢獻(xiàn)。Zhuang等[21]利用770K芯片對(duì)744頭中國(guó)西門(mén)塔爾牛進(jìn)行了加權(quán)一步法GWAS分析,結(jié)果發(fā)現(xiàn)候選基因微管蛋白折疊輔因子B和肌球蛋白重鏈10分別與初生重和1歲體重相關(guān)。Du等[22]利用基于隨機(jī)模型的GWAS分析了808頭中國(guó)西門(mén)塔爾肉牛,結(jié)果顯示,共有37個(gè)顯著SNPs與體重相關(guān),并注釋到成纖維細(xì)胞生長(zhǎng)因子4、血管生成素4、磷脂酶A2組IVA和整合素亞基5等與體重相關(guān)的候選基因。這些研究結(jié)果將為進(jìn)一步探究肉牛重要經(jīng)濟(jì)性狀相關(guān)的主效基因和遺傳變異提供依據(jù)。此外,Zhao等[23]利用高密度SNP芯片對(duì)中國(guó)肉用西門(mén)塔爾牛群體進(jìn)行ROH的檢測(cè)和分析,研究發(fā)現(xiàn)在42個(gè)區(qū)間內(nèi)共檢測(cè)到17個(gè)與體型、肉質(zhì)和繁殖性狀相關(guān)的候選基因。這為基于基因組純合度的遺傳評(píng)估、選擇預(yù)測(cè)、選種選配提供了重要理論基礎(chǔ)和技術(shù)保障。本研究利用全基因組重測(cè)序技術(shù)對(duì)149頭西門(mén)塔爾牛的遺傳多樣性和群體結(jié)構(gòu)進(jìn)行分析,為西門(mén)塔爾牛的可持續(xù)利用提供參考。
1 材料與方法
1.1 試驗(yàn)材料
本試驗(yàn)選擇山東省龍口市格潤(rùn)富德農(nóng)牧科技股份有限公司的150頭西門(mén)塔爾牛為研究對(duì)象,其中公牛100頭,母牛50頭。本研究對(duì)150頭牛進(jìn)行靜脈采血3~5 mL,并將其放入-20 ℃冰箱保存。
1.2 試驗(yàn)方法
1.2.1 DNA提取及測(cè)序
使用康為世紀(jì)的DNA提取試劑盒(中國(guó))提取DNA。利用1%瓊脂糖凝膠電泳技術(shù)對(duì)DNA的完整性進(jìn)行檢測(cè),并用NanoDrop2000(賽默飛,美國(guó))分光光度計(jì)對(duì)DNA純度進(jìn)行測(cè)定。DNA濃度用Qubit Flurometer(Life Technologies, CA,USA)進(jìn)行測(cè)量。得到高質(zhì)量的基因組DNA后,進(jìn)行文庫(kù)構(gòu)建。最終在康普森生物技術(shù)有限公司(北京)的DNBSEQ-T7平臺(tái)進(jìn)行測(cè)序。
1.2.2 樣本質(zhì)控
為了保證分析的準(zhǔn)確性,防止重復(fù)樣本對(duì)群體基因頻率的影響,分析之前,首先使用Plink(V1.90)軟件[24]檢查重復(fù)樣本,重復(fù)樣本判定的標(biāo)準(zhǔn)如下:當(dāng)DST的值大于或等于0.99時(shí),該結(jié)果被認(rèn)定為是重復(fù)樣本。本次分析未發(fā)現(xiàn)重復(fù)樣本,其次,對(duì)樣本的檢出率進(jìn)行質(zhì)控,發(fā)現(xiàn)樣本G231562的檢出率低于80%,將其剔除,質(zhì)控后剩余99頭公牛和50頭母牛進(jìn)行后續(xù)分析。
1.2.3 SNP位點(diǎn)質(zhì)控
通過(guò)Plink(V1.90)軟件對(duì)SNP位點(diǎn)進(jìn)行嚴(yán)格的質(zhì)控,以確保用于后續(xù)分析的每一個(gè)位點(diǎn)都能達(dá)到最佳的分型質(zhì)量。SNP根據(jù)Clean Reads在參考基因組(Bos taurus ARS-UCD2.0)的比對(duì)結(jié)果,使用軟件GATK 4.1.8.0 call SNP, 后采用VariantFiltration模塊對(duì)SNP進(jìn)行嚴(yán)格過(guò)濾。
1.2.4 遺傳多樣性分析遺傳多樣性可通過(guò)以下不同的參數(shù)來(lái)進(jìn)行評(píng)估:
(1)有效群體含量(effective population size, Ne)分析。Ne這一概念涉及理想群體的基因頻率變異及雜合度下降速度,它們需與實(shí)際群體保持一致[25]。常規(guī)情況下,群體的連鎖不平衡(LD)程度是評(píng)估Ne的一個(gè)重要指標(biāo)[26]。本研究采用了Herrero-Medrano與Sved [27]提出的相關(guān)技術(shù),并應(yīng)用于群體的計(jì)算與分析。公式如下:
Ne=(1/4c)×1r2-1
其中,r2代表SNP位點(diǎn)之間的連鎖強(qiáng)度,c代表SNP位點(diǎn)之間的摩爾根距離,其計(jì)量單位采用厘摩。
(2)多態(tài)標(biāo)記比例(proportion of polymorphic markers, PN)分析。PN值的具體計(jì)算遵循以下公式:
PN=MN
其中,M代表展現(xiàn)出多態(tài)特征的位點(diǎn)數(shù)目,N代表總共的位點(diǎn)數(shù)目。
(3)期望雜合度(expected heterozygosity, HE)分析和觀察雜合度(observed heterozygosity, HO)分析。HE衡量的是群體內(nèi)任意給定個(gè)體在任一基因座上呈現(xiàn)雜合狀態(tài)的概率;而HO則表示在特定基因座上展現(xiàn)出雜合度的個(gè)體數(shù)與群體中總個(gè)體數(shù)的比例[25]。本研究采納了孫浩等[25]提出的技術(shù)方法,旨在系統(tǒng)的探究觀察雜合度和期望雜合度,公式如下:
HO=1N∑Nk=1HKn
E(H)=2n2n-11N∑Nk=11-∑p2ki
其中,n代表群體中所有個(gè)體的總數(shù),N代表全部位點(diǎn)的總數(shù),Hk代表位點(diǎn)k上展現(xiàn)的雜合狀態(tài)的個(gè)體數(shù)量,Pki代表位點(diǎn)k上某特定等位基因i的出現(xiàn)頻率。
采用Plink (v1.90)軟件分析多態(tài)標(biāo)記He和Ho的比例。
(4)多態(tài)信息含量(polymorphism information content, PIC)分析。PIC作為一種評(píng)估基因變異豐富度的指標(biāo),體現(xiàn)了遺傳信息的多樣性。PIC可根據(jù)Bostein等[28]的公式計(jì)算:
PIC=1-∑ni=1P2i-∑n-1i=1∑nj=i+12Pi2Pj2
其中,Pi和Pj分別為第i個(gè)和第j個(gè)等位基因頻率,n為等位基因數(shù)。
(5)有效等位基因數(shù)(effective number of allele)是基因純合度的倒數(shù)。
(6)最小等位基因頻率(minimum allele frequency, MAF)分析。MAF通常表示在特定群體中含有的不常見(jiàn)等位基因的頻率。
1.2.5 親緣關(guān)系和遺傳距離分析
G矩陣是一種Van Raden提出的基于全基因組標(biāo)記的構(gòu)建方法[29]。它可以更精準(zhǔn)地反映個(gè)體之間的親緣關(guān)系,比單純根據(jù)系譜信息計(jì)算的親緣關(guān)系更加準(zhǔn)確且接近實(shí)際情況。通過(guò)GCTA(V1.94)軟件,本研究對(duì)個(gè)體之間的親緣關(guān)系系數(shù)進(jìn)行了研究。具體的數(shù)據(jù)質(zhì)控標(biāo)準(zhǔn)為:1) 使用常染色體上的位點(diǎn);2) SNP檢出率大于等于90%;3) 個(gè)體檢出率大于等于80%;4) 最小等位基因頻率大于等于0.01;5) 哈迪-溫伯格P值大于等于0.000 001;6) R2lt;0.2的標(biāo)記。具體計(jì)算公式如下:
G=ZZ′2∑pi(1-pi)
IBS指的是兩個(gè)生物個(gè)體在特定基因位置檢測(cè)到同一遺傳特征的可能性。這一概念側(cè)重于評(píng)估個(gè)體之間遺傳標(biāo)記及等位基因的配對(duì)水平,使得即便在缺乏詳細(xì)的種群譜系數(shù)據(jù)或祖先樣本的情況下,研究者仍能有效探究群體內(nèi)部的親緣關(guān)系。此外,遺傳距離(genetic distance, D)則是衡量?jī)蓚€(gè)個(gè)體基因組層面差異的一項(xiàng)指標(biāo),具體定義為兩者之間遺傳距離的量度:
D=1-DST。
1.2.6 ROH統(tǒng)計(jì)分析
ROH在大多數(shù)群體中都能被發(fā)現(xiàn)。ROH表現(xiàn)為連續(xù)且純合的基因型序列,通常是由親代向子代傳遞相同的單倍型遺傳信息。通過(guò)Plink(V1.90),本研究獲取每個(gè)樣本的ROH長(zhǎng)度和頻率,從而更好地了解群體的發(fā)展歷程。具體的數(shù)據(jù)質(zhì)控標(biāo)準(zhǔn)為:1) 使用常染色體上的位點(diǎn);2) SNP檢出率大于等于90%;3) 個(gè)體檢出率大于等于80%;4) R2lt;0.2的標(biāo)記。此外,基于ROH的近交系數(shù)公式如下[30]:
FROH=∑kLength(ROHk)L
其中,k代表個(gè)體中ROH的數(shù)量,L代表基因型數(shù)據(jù)覆蓋的常染色體基因組的長(zhǎng)度(牛,約為2 488 002.259 kb)。
1.2.7 家系構(gòu)建
為了了解群體的家系情況,本研究使用鄰接法(neighbor-joining, NJ)進(jìn)行家系構(gòu)建分析。NJ算法是一種基于距離的系統(tǒng)發(fā)育樹(shù)構(gòu)建方法。它是聚集性的,因此它通過(guò)每一步聚集最接近的類(lèi)群來(lái)構(gòu)建類(lèi)群之間的祖先關(guān)系,直到形成一個(gè)完整的發(fā)育系統(tǒng)。它把整個(gè)分類(lèi)系統(tǒng)化成一張系譜圖,用它把所有樣品間的親疏關(guān)系展示出來(lái)。本研究對(duì)西門(mén)塔爾牛群體的家系結(jié)構(gòu)劃分中,將親緣相關(guān)系數(shù)≥0.1的個(gè)體歸為同一家系。
2 結(jié) 果
2.1 遺傳多樣性分析
本研究對(duì)149頭西門(mén)塔爾牛進(jìn)行基因組重測(cè)序。并利用Plink(v1.90)軟件對(duì)試驗(yàn)樣本的SNP位點(diǎn)進(jìn)行了質(zhì)控,經(jīng)質(zhì)控檢測(cè)后SNPs總量為1 265 356個(gè)。結(jié)果表明,在所有常染色體中SNPs數(shù)量最高的是1號(hào)染色體,為71 919個(gè)。相反,SNPs數(shù)量最小的則是25號(hào)染色體,數(shù)目?jī)H為26 189個(gè)(圖1、表1)。
通過(guò)獲得的高質(zhì)量SNPs位點(diǎn)對(duì)群體的遺傳多樣性進(jìn)行分析。結(jié)果顯示,西門(mén)塔爾牛群體中最小等位基因頻率的范圍在0~0.1之間的比例最高,達(dá)到80.9%,而范圍在0.3~0.4之間的比例僅為2.7%,MAF的平均值為0.067(圖2A,表2)。如圖2B所示,可以看出基因組SNPs的多態(tài)信息含量分布情況。其中,多態(tài)信息含量在0~0.15之間的SNPs占79.4%;多態(tài)信息含量在0.15~0.3之間的SNPs占比11.4%;多態(tài)信息含量在0.3~0.45之間的SNPs占比9.2%。此外,群體遺傳多樣性的另2項(xiàng)重要指標(biāo)——平均觀察雜合度與平均期望雜合度,分別為0.121和0.157(表2)。盡管平均觀察雜合度相比平均期望雜合度稍顯偏低,但兩者之間的差異并不顯著,表明該群體遺傳結(jié)構(gòu)相對(duì)穩(wěn)定。
2.2 基因組ROH基本統(tǒng)計(jì)及近交系數(shù)結(jié)果
通過(guò)進(jìn)一步分析,在149頭西門(mén)塔爾牛群體中發(fā)現(xiàn)了70個(gè)ROH片段,ROH總長(zhǎng)度為127 627.935 kb。從圖3A中可以看出,大多數(shù)ROH的長(zhǎng)度低于5 Mb,其中長(zhǎng)度在1~5 Mb范圍內(nèi)的ROH比例高達(dá)98.57%,其次為占比僅為1.42%的5~10 Mb的ROH長(zhǎng)度。在149頭西門(mén)塔爾牛中,146頭牛的個(gè)體ROH長(zhǎng)度集中在0~10 Mb之間(圖3B)。此外,從染色體上的分布情況來(lái)看,西門(mén)塔爾牛的29條常染色體中,8號(hào)染色體上的ROH數(shù)量最多,達(dá)到9個(gè),而其余6、17、18、25、26、27和28號(hào)染色體上ROH數(shù)量均為0個(gè)(圖3C)?;?ROH的近交系數(shù)FROH分析結(jié)果顯示(圖3D),當(dāng)前群體的近交系數(shù)為0.000 3。
2.3 IBS距離矩陣分析
通過(guò)使用Plink(V1.9)軟件,本研究對(duì)西門(mén)塔爾牛群體的IBS遺傳距離進(jìn)行分析。觀察結(jié)果表明,大部分西門(mén)塔爾牛個(gè)體間IBS遺傳距離較遠(yuǎn),呈中等程度的親緣關(guān)系(圖4中深色方格);此外,部分個(gè)體間的IBS遺傳距離較近,可以觀測(cè)到西門(mén)塔爾牛群體之間具有較密切的親緣關(guān)系,此點(diǎn)可以由圖4中淺色方格得到直觀的體現(xiàn)。
2.4 G矩陣分析
通過(guò)GCTA(V1.94)軟件構(gòu)建的G矩陣,可以準(zhǔn)確地反映西門(mén)塔爾牛群體之間的親緣關(guān)系,它采用全基因組標(biāo)記技術(shù),具有較高的精確度和可靠性。
通過(guò)圖5的結(jié)果可以看出,由于顏色的增加,親緣關(guān)系將會(huì)越來(lái)越緊密。和IBS距離矩陣的結(jié)果基本一樣,大多數(shù)西門(mén)塔爾牛群個(gè)體間的親緣關(guān)系都處在中等水平(圖5中顏色較淺的方格),但也有一些牛群個(gè)體之間的親緣關(guān)系更加緊密(圖5中顏色較深的方格)。
2.5 主成分分析
為檢驗(yàn)樣本的遺傳背景,對(duì)149頭西門(mén)塔爾牛群體進(jìn)行PCA分析。圖6是基于PCA第一主成分和第二主成分繪制的散點(diǎn)圖,兩個(gè)主成分分別解釋了19.41%和11.77%的變異方差。PCA 結(jié)果也表明西門(mén)塔爾牛群體的個(gè)體有較好的分散。
2.6 聚類(lèi)分析與家系構(gòu)建
本研究運(yùn)用了鄰接法(neighbor-joining, NJ)對(duì)99頭公牛實(shí)施了聚類(lèi)分析,聚類(lèi)分析的標(biāo)準(zhǔn)為親緣關(guān)系大于等于0.1,結(jié)果顯示99頭公牛被劃分為22個(gè)家系(圖7A)。在聚類(lèi)分析中通過(guò)使用相同顏色將其劃分為同一家系。然而,有些個(gè)體會(huì)出現(xiàn)交叉的現(xiàn)象。比如,G23144個(gè)體與家系2和家系12的親緣關(guān)系都較近,因此可以同時(shí)并入到2個(gè)家系之中。
經(jīng)過(guò)G矩陣親緣關(guān)系分析,將與公牛親緣關(guān)系值gt;0.1的母牛同公牛劃分為同一家系,最終將西門(mén)塔爾牛群體分為22個(gè)含有公牛的家系。另外,也發(fā)現(xiàn)了有21頭母牛和被檢測(cè)的公牛血緣關(guān)系較遠(yuǎn),因此將21頭母牛歸入了“其他”分類(lèi)中(表3,圖7B)。
3 討 論
目前針對(duì)國(guó)內(nèi)地方肉牛品種的遺傳多樣和群體結(jié)構(gòu)的研究較多[28-33],但對(duì)于中國(guó)引入的西門(mén)塔爾牛遺傳多樣性及種群結(jié)構(gòu)的研究較少。本研究通過(guò)全基因組重測(cè)序技術(shù)檢測(cè)了149頭西門(mén)塔爾牛的SNP變異位點(diǎn),并運(yùn)用這些變異信息,對(duì)西門(mén)塔爾牛的群體遺傳多樣性、群體結(jié)構(gòu)以及親緣關(guān)系進(jìn)行了深入研究。
評(píng)估遺傳多樣性是物種保護(hù)的重要組成部分。雜合度(觀察雜合度和期望雜合度)是衡量遺傳多樣性的一個(gè)指標(biāo),對(duì)等位基因的頻率很敏感。觀察雜合度是觀察到的(某個(gè)基因座上的)雜合個(gè)體的發(fā)生率。另一方面,期望雜合度是在隨機(jī)交配條件下的期望雜合度水平[34]。在本研究中,西門(mén)塔爾牛的觀察雜合度為0.121,期望雜合度為0.157。而Zhang等[35]對(duì)秦川牛群體的研究顯示,秦川牛基因組的觀察雜合度和期望雜合度分別為為0.370和0.364。
秦川牛的雜合度遠(yuǎn)高于本研究中的西門(mén)塔爾牛群體,這可能與西門(mén)塔爾牛作為商用品種經(jīng)過(guò)高強(qiáng)度人工選擇有關(guān)。在遺傳多樣性的分析中,觀察雜合度小于期望雜合度時(shí),通常被認(rèn)為群體中可能出現(xiàn)了近交或者是受到了選擇[36]。觀察雜合度比期望雜合度低,表明群體遺傳多樣性較低,推測(cè)該群體可能作為商業(yè)乳肉兼用牛品種受到過(guò)較強(qiáng)的人工選擇。這與之前西門(mén)塔爾牛的統(tǒng)計(jì)數(shù)據(jù)相吻合[37]。
由于親代將相同的單倍型遺傳給后代,造成其基因組中具有連續(xù)的純合基因型區(qū)域,被稱(chēng)為長(zhǎng)純合片段ROH[38],而近交、人工選擇、遺傳漂變等因素會(huì)影響ROH的形成,因此對(duì)ROH的分析可以用于判斷群體的遺傳多樣性、分析近交程度及候選基因的篩選鑒定等方面[39]。基于ROH估計(jì)近交系數(shù)的方法被認(rèn)為是近交系數(shù)估計(jì)中最有效的方法,它能區(qū)別最近的近交事件和時(shí)間久遠(yuǎn)的近交事件[40]。ROH 的片段長(zhǎng)度通常能反映種群歷史和遺傳多樣性等,例如短片段ROH的出現(xiàn)通常是由于歷史久遠(yuǎn)單倍型的親緣相關(guān)引起的,因?yàn)槿旧w片段已被重復(fù)減數(shù)分裂破壞。而長(zhǎng)片段的ROH可能是由于群體中較近世代所發(fā)生近交導(dǎo)致的,尤其是最近時(shí)間發(fā)生的近交事件讓染色體片段幾乎沒(méi)有發(fā)生重組[41]。對(duì)ROH的分析中,本研究發(fā)現(xiàn)在149頭西門(mén)塔爾牛群體中共檢測(cè)到70個(gè)ROH片段,ROH總長(zhǎng)度為127 627.935 kb。長(zhǎng)度為1~5 Mb的ROH占比最多(98.57%),長(zhǎng)度為5~10 Mb的ROH占比很小,僅為1.42%,這與秦川牛保種群體的研究結(jié)果相一致[18]。Howrigan等[42]發(fā)現(xiàn)10、5 和2.5 Mb的ROH長(zhǎng)度分別與5代、10代和20代之前近交事件相關(guān)。此外,Cardoso等[43]發(fā)現(xiàn)長(zhǎng)度大于16 Mb的ROH形成于不到三代前,長(zhǎng)度小于8 Mb的ROH形成于超過(guò)六代前。本研究中西門(mén)塔爾牛群體在近期沒(méi)有發(fā)生較大程度的近交。
本研究使用NJ樹(shù)和聚類(lèi)分析將牛群分為22個(gè)家系。該群的平均近交系數(shù)為0.000 3。為了保持低近親繁殖率并確保該群體繼續(xù)繁殖的能力,應(yīng)優(yōu)先考慮家系間遺傳關(guān)系遠(yuǎn)的公牛和母牛的交配。相反,為減少近親繁殖的數(shù)量,本研究不建議在同一家系的公母牛中進(jìn)行配種。值得注意的是,群體家系構(gòu)建結(jié)果中“其他”的21頭母牛與所有的公牛親緣關(guān)系系數(shù)均小于0.1,因此,可與任何一頭公牛進(jìn)行配種。本研究還發(fā)現(xiàn),家系1和家系5的公牛數(shù)量較少,結(jié)構(gòu)不平衡。為了防止血統(tǒng)丟失,應(yīng)重視后代的選育,以免造成血統(tǒng)的流失。為了便于種群的遺傳管理和評(píng)估,利用大數(shù)據(jù)技術(shù)等現(xiàn)代科學(xué)技術(shù)實(shí)時(shí)監(jiān)測(cè)種牛健康狀況,建立準(zhǔn)確的種牛檔案和血統(tǒng)數(shù)據(jù)庫(kù),是實(shí)現(xiàn)西門(mén)塔爾牛可持續(xù)管理和生長(zhǎng)的重要步驟。
4 結(jié) 論
本研究基于全基因組重測(cè)序數(shù)據(jù)從遺傳多樣性、ROH 分布特征、親緣關(guān)系和家系結(jié)構(gòu)等方面對(duì)西門(mén)塔爾牛群體進(jìn)行綜合評(píng)估,發(fā)現(xiàn)該群體表現(xiàn)出相對(duì)豐富的多樣性和適度的親緣關(guān)系。在少數(shù)個(gè)體中觀察到近親繁殖,但種群的整體近親繁殖水平仍然很低。本研究結(jié)果可為該群體的選種選配工作提供一定的科學(xué)依據(jù)。
參考文獻(xiàn)(References):
[1] KARDOS M,ARMSTRONG E E,F(xiàn)ITZPATRICK S W,et al.The crucial role of genome-wide genetic variation in conservation[J]. Proc Natl Acad Sci U S A,2021,118(48):e2104642118.
[2] STANGE M,BARRETT R D H,HENDRY A P.The importance of genomic variation for biodiversity,ecosystems and people[J]. Nat Rev Genet,2021,22(2):89-105.
[3] SHASTRY B S.SNPs:impact on gene function and phenotype[M]//KOMAR A A.Single Nucleotide Polymorphisms.Totowa: Humana Press,2009:3-22.
[4] SCHUSTER S C.Next-generation sequencing transforms today’s biology[J].Nat Methods,2008,5(1):16-18.
[5] 石 蘭,馬梅蘭,木合塔帕·買(mǎi)買(mǎi)提江,等.基于全基因組重測(cè)序解析皮山紅羊群體遺傳結(jié)構(gòu)及產(chǎn)羔數(shù)候選基因研究[J].中國(guó)畜牧獸醫(yī), 2024,51(2):624-638.
SHI L,MA M L,MUHETAPA M,et al.Study on the genetic structure and litter size candidate genes of Pishan red sheep population based on whole genome resequencing[J].China Animal Husbandry amp; Veterinary Medicine,2024,51(2):624-638.(in Chinese)
[6] HU M Y,JIANG H,LAI W N,et al.Assessing genomic diversity and signatures of selection in Chinese red steppe cattle using high-density SNP array[J].Animals (Basel),2023,13(10):1717.
[7] PERINI F,CENDRON F,WU Z,et al.Genomics of dwarfism in Italian local chicken breeds[J].Genes (Basel),2023,14(3):633.
[8] SUDRAJAD P,KUSMINANTO R Y,VOLKANDARI S D,et al.Genomic structure of Bali cattle based on linkage disequilibrium and effective population size analyses using 50K single nucleotide polymorphisms data[J].Vet World,2022,15(2): 449-454.
[9] PALTI Y,VALLEJO R L,PURCELL M K,et al.Genome-wide association analysis of the resistance to infectious hematopoietic necrosis virus in two rainbow trout aquaculture lines confirms oligogenic architecture with several moderate effect quantitative trait loci[J].Front Genet,2024,15:1394656.
[10] HEIDARITABAR M,BINK M C A M,DERVISHI E,et al.Genome-wide association studies for additive and dominance effects for body composition traits in commercial crossbred Pitrain pigs[J].J Anim Breed Genet,2023,140(4):413-430.
[11] MASTRANGELO S,BEN-JEMAA S,PERINI F,et al.Genome-wide mapping of signatures of selection using a high-density array identified candidate genes for growth traits and local adaptation in chickens[J].Genet Sel Evol,2023,55(1):20.
[12] VAN DIJK E L,AUGER H,JASZCZYSZYN Y,et al.Ten years of next-generation sequencing technology[J].Trends Genet,2014,30(9):418-426.
[13] HARISH A,LOPES PINTO F A,ERIKSSON S,et al.Genetic diversity and recent ancestry based on whole-genome sequencing of endangered Swedish cattle breeds[J].BMC Genomics,2024,25(1):89.
[14] 嚴(yán) 霞,莫 玙,孔少芬,等.基于全基因組重測(cè)序的羅坑雞遺傳結(jié)構(gòu)分析及特征位點(diǎn)挖掘[J].中國(guó)畜牧雜志, 2024, 60(10):100-105.
YAN X,MO Y,KONG S F,et al.Genetic structure analysis and feature loci mining of Luokeng chickens based on whole genome resequencing[J].Chinese Journal of Animal Science,2024,60(10):100-105.(in Chinese)
[15] 梁慧麗,解玉靜,司博文,等.基于全基因組重測(cè)序分析大尾寒羊基因組變異特征和群體結(jié)構(gòu)[J].畜牧獸醫(yī)學(xué)報(bào), 2024, 55(11):4968-4979.
LIANG H L,XIE Y J,SI B W,et al.Analysis on genomic variation and population structure of large-tailed Han sheep based on whole genome resequencing[J].Acta Veterinaria et Zootechnica Sinica,2024,55(11):4968-4979.(in Chinese)
[16] 趙真堅(jiān),王書(shū)杰,陳 棟,等.基于低深度全基因組測(cè)序分析內(nèi)江豬群體結(jié)構(gòu)和遺傳多樣性[J].畜牧獸醫(yī)學(xué)報(bào),2023, 54(6):2297-2307.
ZHAO Z J,WANG S J,CHEN D,et al.Population structure and genetic diversity analysis of Neijiang pigs based on low-coverage whole genome sequencing[J].Acta Veterinaria et Zootechnica Sinica,2023,54(6):2297-2307.(in Chinese)
[17] 劉珍妮,成 笛,孔智偉,等.基于全基因組重測(cè)序?qū)Υ笥帏喌倪z傳進(jìn)化分析[J].中國(guó)畜牧雜志,2024,60(11):179-184.
LIU Z N,CHENG D,KONG Z W,et al.Genetic and evolutionary analysis of Dayu duck based on whole genome resequencing[J]. Chinese Journal of Animal Science,2024,60(11):179-184.(in Chinese)
[18] 馬 鈞,樊安平,王武生,等.全基因組重測(cè)序解析秦川牛保種群遺傳多樣性和遺傳結(jié)構(gòu)[J].遺傳,2023,45(7):602-616.
MA J,F(xiàn)AN P A,WANG W S,et al.Analysis of genetic diversity and genetic structure of Qinchuan cattle conservation population using whole-genome resequencing[J].Hereditas (Beijing),2023,45(7):602-616.(in Chinese)
[19] SUN T,PEI S W,LIU Y K,et al.Whole genome sequencing of simmental cattle for SNP and CNV discovery[J].BMC Genomics, 2023,24(1):179.
[20] LI S,LIU L,AHMED Z,et al.Identification of Heilongjiang crossbred beef cattle pedigrees and reveals functional genes related to economic traits based on whole-genome SNP data[J].Front Genet,2024,15:1435793.
[21] ZHUANG Z W,XU L Y,YANG J,et al.Weighted single-step genome-wide association study for growth traits in Chinese Simmental beef cattle[J].Genes (Basel),2020,11(2):189.
[22] DU L L,DUAN X H,AN B X,et al.Genome-wide association study based on random regression model reveals candidate genes associated with longitudinal data in Chinese Simmental beef cattle[J].Animals (Basel),2021,11(9):2524.
[23] ZHAO G Y,LIU Y Y,NIU Q H,et al.Runs of homozygosity analysis reveals consensus homozygous regions affecting production traits in Chinese Simmental beef cattle[J].BMC Genomics,2021,22(1):678.
[24] PURCELL S,NEALE B,TODD-BROWN K,et al.PLINK:a tool set for whole-genome association and population-based linkage analyses[J].Am J Hum Genet,2007,81(3):559-575.
[25] 孫 浩,王 振,張 哲,等.基于基因組測(cè)序數(shù)據(jù)的梅山豬保種現(xiàn)狀分析[J].上海交通大學(xué)學(xué)報(bào):農(nóng)業(yè)科學(xué)版,2017, 35(4):65-70.
SUN H,WANG Z,ZHANG Z,et al.Exploring the current situation of conservation of Meishan pigs based on genome sequencing data[J].Journal of Shanghai Jiaotong University:Agricultural Science,2017,35(4):65-70.(in Chinese)
[26] BARBATO M,OROZCO-TERWENGEL P,TAPIO M,et al.SNeP:a tool to estimate trends in recent effective population size trajectories using genome-wide SNP data[J].Front Genet,2015,6:109.
[27] SVED J A.Linkage disequilibrium and homozygosity of chromosome segments in finite populations[J].Theor Popul Biol,1971, 2(2): 125-141.
[28] BOTSTEIN D,WHITE R L,SKOLNICK M,et al.Construction of a genetic linkage map in man using restriction fragment length polymorphisms[J].Am J Hum Genet,1980,32(3):314-331.
[29] VANRADEN P M.Efficient methods to compute genomic predictions[J].J Dairy Sci,2008,91(11):4414-4423.
[30] SILI "L,RODR GUEZ M C,F(xiàn)ERNNDEZ A,et al.Measuring inbreeding and inbreeding depression on pig growth from pedigree or SNP-derived metrics[J].J Anim Breed Genet,2013,130(5):349-360.
[31] WANG X,MA Z,GAO L,et al.Genome-wide survey reveals the genetic background of Xinjiang Brown cattle in China[J].Front Genet,2024,14:1348329.
[32] YU H W,ZHANG K,CHENG G,et al.Genome-wide analysis reveals genomic diversity and signatures of selection in Qinchuan beef cattle[J].BMC Genomics,2024,25(1):558.
[33] 張 巖,魏稚彤,虎業(yè)浩,等.基于全基因組重測(cè)序評(píng)估郟縣紅牛保種群遺傳多樣性與群體結(jié)構(gòu)[J].中國(guó)畜牧獸醫(yī),2024, 51(7):2933-2942.
ZHANG Y,WEI Z T,HU Y H,et al.Genetic diversity and population structure analysis of Jiaxian red cattle based on whole genome sequencing[J].China Animal Husbandry amp; Veterinary Medicine,2024,51(7):2933-2942.(in Chinese)
[34] MELKA M G,SCHENKEL F S.Analysis of genetic diversity in Brown Swiss,Jersey and Holstein populations using genome-wide single nucleotide polymorphism markers[J].BMC Res Notes,2012,5(1):161.
[35] ZHANG W G,GAO X,ZHANG Y,et al.Genome-wide assessment of genetic diversity and population structure insights into admixture and introgression in Chinese indigenous cattle[J].BMC Genet,2018,19(1):114.
[36] HOFFMANN A A,WHITE V L,JASPER M,et al.An endangered flightless grasshopper with strong genetic structure maintains population genetic variation despite extensive habitat loss[J].Ecol Evol,2021,11(10):5364-5380.
[37] KELLEHER M M,BERRY D P,KEARNEY J F,et al.Inference of population structure of purebred dairy and beef cattle using high-density genotype data[J].Animal,2017,11(1):15-23.
[38] CEBALLOS F C,JOSHI P K,CLARK D W,et al.Runs of homozygosity:windows into population history and trait architecture[J]. Nat Rev Genet,2018,19(4):220-234.
[39] 張鵬飛,史良玉,劉家鑫,等.畜禽全基因組長(zhǎng)純合片段檢測(cè)的研究進(jìn)展[J].中國(guó)農(nóng)業(yè)科學(xué),2021,54(24):5316-5326.
ZHANG P F,SHI L Y,LIU J X,et al.Advance in genome-wide scan of runs of homozygosity in domestic animals[J].Scientia Agricultura Sinica,2021,54(24):5316-5326.(in Chinese)
[40] KELLER M C,VISSCHER P M,GODDARD M E.Quantification of inbreeding due to distant ancestors and its detection using dense single nucleotide polymorphism data[J].Genetics,2011,189(1):237-249.
[41] KIRIN M,MCQUILLAN R,F(xiàn)RANKLIN C S,et al.Genomic runs of homozygosity record population history and consanguinity[J]. PLoS One,2010,5(11):e13996.
[42] HOWRIGAN D P,SIMONSON M A,KELLER M C.Detecting autozygosity through runs of homozygosity:a comparison of three autozygosity detection algorithms[J].BMC Genomics,2011,12(1):460.
[43] CARDOSO D F,F(xiàn)ERNANDES JNIOR G A,SCALEZ D C B,et al.Uncovering sub-structure and genomic profiles in across-countries subpopulations of angus cattle[J].Sci Rep,2020,10(1):8770.
(編輯 郭云雁)