楊 凱,盧倬達,何 健,張瑞琪,王素青,李克標,趙云翔,2,3,朱曉萍*,郭金彪*
(1.佛山科學技術學院生命科學與工程學院,佛山 528231;2.廣西大學動物科學技術學院,南寧 530004;3.廣西揚翔股份有限公司,貴港 537100)
我國是養(yǎng)豬和豬肉消費大國。隨著近年來人們消費水平的提高,對豬肉的需求也逐漸從量的追求向質(zhì)的需求轉(zhuǎn)變,這也使得養(yǎng)豬業(yè)對豬肉品質(zhì)和風味的要求提高。豬的背膘厚和眼肌面積等胴體性狀與肉質(zhì)相關,與脂肪含量和瘦肉率也具有較強的相關性,且受遺傳因素的影響較大[1-3]。因此,對豬的胴體性狀進行選育是提高豬肉品質(zhì)的有效手段。傳統(tǒng)育種手段主要是利用表型值與基于系譜計算的樣本間親緣關系矩陣(A矩陣),通過最佳線性無偏估計(best linear unbiased predication,BLUP)估計相應性狀的個體育種值(estimated breeding value,EBV),從而進行選育[4]。隨著基因組研究的深入與分子數(shù)量遺傳學的發(fā)展,育種學家們開始利用標記輔助選擇(marker assisted selection, MAS)進行育種,利用已驗證的遺傳標記聯(lián)合BLUP計算育種值,從而進行選擇。標記輔助選擇的準確性高,但是已經(jīng)確定的遺傳標記較少,很難應用于實踐生產(chǎn)。隨著二代測序技術的發(fā)展,可以在全基因組范圍內(nèi)大量獲取高密度的單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)位點。Meuwissen 等[5]在2001年提出基因組選擇(genomic selection,GS),自此GS成為畜禽育種工作的研究焦點。GS是一種在全基因組范圍內(nèi)利用高密度遺傳標記進行育種的方法,可以在畜禽生命早期進行選擇以縮短世代間隔。通過估計基因組育種值(genomic estimated breeding value,GEBV)在畜禽的幼年期進行選擇,可以加快遺傳改良進展。GS也可以看作為全基因組范圍內(nèi)的標記輔助選擇,其原理是通過全基因組范圍內(nèi)的大量高密度的遺傳標記估計出不同染色體片段或者單個遺傳標記的效應值,然后累加所有的標記效應值,從而得到基因組估計育種值。GS對候選群體進行選擇時可以不加入表型信息,可以直接結(jié)合GEBV在種豬早期進行選擇,從而加快育種進程[6-9]。GS在畜禽育種業(yè)中應用以來,育種改良得到極大地提升,降低了育種成本、加快了遺傳進展、選育更精準等[10-11]。為提高GS準確性,多種改良GS手段的方法被提出,如機器學習、貝葉斯、模型優(yōu)化、多群體混合、整合先驗信息等方法[12-17]。Veroneze等[7]研究表明,跨群體選擇會導致選擇準確性降低,另有研究表明參考群體同樣會對選擇準確性產(chǎn)生影響[18]。Su等[19]研究表明在模型中加入顯性效應可以提高豬GS的準確性。不同的方法在不同的性狀中擁有不同的表現(xiàn)[20],探索更多提高豬胴體性狀選擇準確性的方法有助于加快相應性狀的遺傳改良。
本研究旨在探究顯性效應和群體合并對杜洛克豬胴體性狀GS準確性的影響,為提高杜洛克豬的GS準確性提供理論支撐。
本研究包括2 796頭杜洛克豬公豬和3 149頭杜長大商品豬(1 542頭公豬和1 607頭母豬)。杜長大公豬在出生后第6~7天被閹割。所有豬均來自廣西揚翔股份有限公司的豬場,自由飲水和采食,在相同的飼養(yǎng)管理條件下飼養(yǎng)。
在杜洛克與杜長大豬結(jié)束生長性能測定時測量背膘厚(backfat thickness, BF)和眼肌面積(lion eye area, LEA),同時記錄體重(結(jié)測體重)。測量方法:使用兩種B超Mylab Touch Vet(意大利)與 Exago(法國)在杜洛克豬和杜長大豬的倒數(shù)第三、四肋骨間距背中線5 cm處測量BF和LEA,同時記錄日齡作為結(jié)測日齡(age, AGE)。根據(jù)以下公式測定校正115 kg背膘厚(corrected backfat thickness at 115 kg, BF115)、校正115 kg眼肌面積(corrected lion eye area at 115 kg, LEA115)和校正115 kg體重日齡(corrected age at 115 kg, AGE115)。
杜長大豬BF115的校正公式[21]:
Measuredweight為結(jié)測體重(下同);b=30(公);b=5(母)。
杜長大豬AGE115的校正公式[21]如下:
a=50(公豬);a=40(母豬)。
杜長大豬LEA115的校正公式[22]如下:
杜洛克豬BF115、LEA115和AGE115的校正方法:使用KFNetsKing軟件根據(jù)杜洛克豬的BF、LEA和AGE數(shù)據(jù)校正出相對應的BF115、LEA115和AGE115。
所有表型數(shù)據(jù)均通過“平均值±3倍標準差”進行質(zhì)量控制。質(zhì)控后,有2 796頭杜洛克豬公豬和3 149頭杜長大豬(1 542頭公豬和1 607頭母豬)。
本試驗采集杜洛克與杜長大豬的耳組織,利用Gene Seek GGP 50K芯片(紐勤生物科技有限公司,中國上海)進行基因組分型,杜洛克與杜長大豬均分別得到50 697個SNPs。
質(zhì)控分為兩部分:一是對杜洛克豬的質(zhì)控,使用PLINKv1.9軟件[23]對基因分型結(jié)果進行質(zhì)量控制,質(zhì)控標準為剔除不滿足以下條件的個體或SNP位點:個體基因型檢出率(ndividual call rate)<0.95、SNP基因型檢出率(SNP call rate)<0.99、最小等位基因頻率(minor allele frequency, MAF)<0.05、哈代-溫伯格平衡檢驗(Hardy-Weinberg equilibrium, HWE)<10-6。然后利用Beagle軟件對缺失位點進行填充,填充完后再次質(zhì)控,質(zhì)控條件與第一次質(zhì)控相同。最后,2 796杜洛克公豬的39 428個SNPs位點和3 149頭杜長大豬的45 094個SNPs位點分別用于后續(xù)分析。
二是對合并后的杜洛克豬與杜長大豬的數(shù)據(jù)進行質(zhì)控,質(zhì)控條件:不進行哈代-溫伯格平衡檢驗,其余質(zhì)控條件同杜洛克豬的質(zhì)控標準,質(zhì)控后剩余5 945頭豬的45 451個SNPs位點。
本試驗中GS分析基于兩個數(shù)據(jù)集,其一為杜洛克公豬數(shù)據(jù)集,其二為杜洛克公豬與杜長大豬的合并數(shù)據(jù)集。
1.4.1 顯性效應對杜洛克公豬基因組選擇準確性的影響 使用Asreml4.1軟件基于GBLUP方法進行GS分析,估計GEBV,探究添加顯性效應、合并杜長大豬與杜洛克豬作為參考群對杜洛克豬GS準確性的影響。建立兩個分析模型:加性動物模型(additive animal model, AM);加顯動物模型(additive add dominant animal model, ADM)。分析模型如下:
加性動物模型(AM):
y=Xb+Za+Wp+e
其中y表示表型;b表示固定效應,包括測定結(jié)束時的場-年-季和性別;a表示隨機加性遺傳效應;p表示隨機欄位效應;e表示隨機殘差。X、Z和W分別代表b、a和p相應的矩陣。
加顯動物模型(ADM):
y=Xb+Za+Dd+Wp+e
模型中d為顯性效應,D為與顯性效應關聯(lián)的矩陣;模型中其余參數(shù)與AM中的參數(shù)一致。
1.4.2 群體合并對杜洛克豬GS準確性的影響 為探究杜長大豬的數(shù)據(jù)對于杜洛克豬基因組選擇準確性的作用,本研究共設置3個分組,組1(G1):杜洛克豬為參考群,杜洛克為候選群;組2(G2):杜長大豬為參考群,杜洛克豬為候選群;組3(G3):杜長大豬與杜洛克豬合并作為參考群,杜洛克豬為候選群。3個分組分別應用以上兩種模型進行分析。
基因組選擇準確性的計算方法:各性狀對應的育種值與表型值的皮爾遜相關,并利用五折交叉驗證取均值代表準確性。計算公式如下:
上述杜洛克豬與杜長大豬所有胴體性狀的描述性統(tǒng)計量見表1、圖1和圖2。杜洛克豬AGE115、BF115和LEA115的平均值分別為167.41 d、10.92 mm、39.15 cm2;杜長大豬AGE115、BF115和LEA115的平均值分別為169.66 d、13.06 mm、39.25 cm2;杜洛克豬AGE115、BF115和LEA115的變異系數(shù)分別為9.35%、17.25%、10.67%;杜長大豬AGE115、BF115和LEA115的變異系數(shù)分別為8.27%、20.60%、16.41%。
圖1 杜洛克豬胴體性狀的頻率分布直方圖Fig.1 Frequency distribution histogram of carcass traits in Duroc pigs
圖2 杜長大豬胴體性狀的頻率分布直方圖Fig.2 Frequency distribution histogram of carcass traits in DLY pigs
表1 杜洛克與杜長大豬胴體性狀的描述性統(tǒng)計Table 1 Descriptive statistics of carcass traits in Duroc and DLY pigs
由表2可知,加入顯性效應后,AGE115、BF115和LEA115的GS準確性均有所提高。AGE115在3個組中(組1、組2和組3)顯性效應都提升了GS的準確性,相對于加性動物模型,加入顯性效應后提升了2.84%~4.87%;BF115在組1與組3加入顯性效應后選擇準確性分別提升1.77%與2.08%;LEA115組1與組3加入顯性效應后選擇準確性分別提升16.18%與1.37%;從整體上來看,在加性效應模型的基礎上加入顯性效應能提升杜洛克豬背膘、眼肌面積和日齡等性狀GS的準確性。
表2 群體合并和顯性效應對基因組選擇準確性的影響(均值±標準差)Table 2 The impact of population merging and dominant effects on the accuracy of GS (Mean±Standard deviation)
由表2可知,杜洛克豬的胴體性狀在不同參考群下的GS準確性表現(xiàn)不同。LEA115的GS準確性在兩種模型下均為組2的選擇準確性最低,且在AM模型下組3>組1>組2;BF115的GS準確性在兩種模型下均為組3>組1>組2;AGE115的GS準確性在兩種模型下均為組1>組3>組2。在3個組中,AGE115在組1中GS準確性最高。組3與組1相比,組3中BF115的GS準確性兩個模型中均有所提高(AM準確性提高6.19%,ADM準確性提高6.52%);LEA115的GS準確性僅在AM中組3大于組1(準確性提高7.35%)。
背膘等與豬生長相關的數(shù)量性狀不僅受到加性遺傳效應的影響,同時也會受到顯性效應和上位效應的影響[24]。不同性狀受顯性效應與加性效應影響的程度各不相同,多數(shù)性狀主要受加性遺傳效應的影響,有的性狀受非加性遺傳的影響會較大,能夠在一定程度上影響其表型[25]。本研究中,添加顯性效應對不同性狀GS準確性的影響不同。有研究報道,豬的ADG在模型中加入顯性效應之后GS準確性從0.319提升到0.330[19],對選擇準確性有較大的提升。有研究報道[26],豬的ADG在加性動物模型的基礎上加入顯性效應并不能提高GS的準確性。說明即使是同一性狀在不同研究不同群體中存在差異。本研究中,在模型中加入顯性效應后BF115的GS準確性在組1中提高了1.77%,AGE115與LEA115的GS準確性分別提高了2.84%~4.87%與1.37%~16.18%。Mei等[26]研究報道,在加性動物模型中加入顯性效應模型對背膘厚與日齡的選擇準確性有小程度的提升,分別提升了0.30%與0.44%,對眼肌深度的GS準確性沒有影響。其中關于背膘與日齡的結(jié)果與本研究結(jié)果一致。本研究中BF115在組3中加入顯性效應后其GS準確性提高。Guo等[27]報道,顯性效應能夠較大程度地提高背膘與日增重的選擇準確性。然而,在模型中加入顯性效應不一定會提升選擇準確性,如Liu等[28]報道加入顯性效應之后導致GS準確性降低,與本研究中BF115和LEA115在組2中的表現(xiàn)一致。綜上可得,加入顯性效應基本能夠提高杜洛克豬BF115、AGE115和LEA115等性狀GS的準確性。顯性效應的影響在相同性狀不同群體和性狀中不具有一致性,因此在進行基因組選擇時,需要根據(jù)具體情況考慮是否添加顯性效應。
在家畜的選育中,利用密集SNP標記對表型與潛在遺傳價值的基因組預測可用于評估家畜的基因組育種值[29-30]。BF115的GS準確性都是組3的準確性最高,組1的準確性次之,組2的準確性最低。影響GS準確性的主要因素有:①相關性狀的遺傳力[31],遺傳力越高準確性越高,同時低遺傳力性狀可以通過增加參考群規(guī)模提高準確性[32];②參考群與候選群的動物數(shù)量,一定情況下參考群數(shù)量越多準確性越高[33];③參考群與候選群的親緣關系,親緣關系越高準確性越高[34-35]。Jiao等[36]以1 047頭杜洛克豬為參考群,516頭杜洛克豬為候選群,利用加性動物模型評估基因組育種值,得到背膘的選擇準確性為0.36,高于本研究結(jié)果(0.226)。其利用的研究動物與本研究一致,所使用的參考群與候選群體數(shù)量與本研究基本一致,但是本研究中杜洛克群體遺傳背景復雜,親緣關系復雜等原因都有可能是導致本研究中選擇準確性偏低的原因。組3的準確性最高的原因可能是擴大了參考群的規(guī)模,跨群體選擇準確性低的主要原因可能是參考群與候選群之間親緣關系系數(shù)較低。Veroneze等[7]研究表明跨群體選擇會導致選擇準確性降低,與本研究中組2的結(jié)果類似。
AGE115的GS準確性在組1內(nèi)最高,組3次之,組2最低。Lopez等[37]報道,在以24 828頭杜洛克豬日齡數(shù)據(jù)進行GS研究時發(fā)現(xiàn)其選擇準確性為0.28。GS的準確性還會受到等位基因影響和參考群規(guī)模的影響[38]。Christensen等[39]和Akanno等[40]研究表明,在預測準確性時基因型動物的選擇比基因型動物的總數(shù)更關鍵,研究也表明當純種候選群與雜種群的親緣關系較近時在純種參考群中加入雜種豬數(shù)據(jù)有助于提高GS準確性。本研究中,AGE115在組1的準確性高于組2和3的原因可能是受到等位基因與參考群的影響。LEA115的GS準確性在組3最大,組1次之,組2最小(0.04)。Jiao等[36]報道眼肌深度的GS準確性為0.298,Lopez等[37]以24 719頭杜洛克豬眼肌面積數(shù)據(jù)為基礎開展GS研究,其GS準確性為0.38,遠高于本研究中眼積面積的GS準確性。本研究中,LEA115的選擇準確性組3>組1>組2的原因可能是擴大了參考群規(guī)模。綜上所述,研究群體規(guī)模、群體的遺傳背景、性狀的遺傳力及模型等原因都有可能影響GS準確性,選擇合適的模型針對不同品種、性狀進行GS研究可以得到更好的選擇效果。
本試驗以杜洛克豬與杜長大豬為研究對象,研究顯性效應和杜長大商品豬群體對于杜洛克豬基因組選擇準確性的影響。研究發(fā)現(xiàn),模型中加入顯性效應可以提升杜洛克豬AGE115、BF115和LEA115的GS準確性,將杜洛克與杜長大豬合并作為杜洛克豬的參考群能夠提升杜洛克豬BF115和LEA115的GS準確性。因此,選擇合適的模型與將雜種豬納入純種豬基因組選擇的參考群可以作為提升豬胴體性狀基因組選擇準確性的方法。