摘 要:
旨在基于Illumina BovineHD 770K與Cattle 110K芯片在華西牛中的實際應(yīng)用情況,系統(tǒng)比較在不同標(biāo)記密度下基因組選擇預(yù)測準(zhǔn)確性的差異,探索兩款芯片在華西牛遺傳評估中結(jié)合使用方法。本試驗以課題組前期構(gòu)建的華西?;蚪M選擇參考群體為研究對象,利用重測序數(shù)據(jù)將3 948頭華西牛770K芯片填充至790K后,分別取90K(兩款芯片交集)、110K、770K、790K(兩款芯片并集)4種標(biāo)記密度,對華西牛遺傳評估所涉及的5個性狀(斷奶重、育肥期平均日增重、產(chǎn)犢難易度、胴體重、屠宰率)進(jìn)行遺傳力估計,并通過GBLUP模型利用五折交叉驗證對基因組評估準(zhǔn)確性進(jìn)行比較,篩選并確定華西牛遺傳評估中最適標(biāo)記密度。結(jié)果顯示:1)4種標(biāo)記密度下,估計的華西牛5個性狀遺傳力差異不顯著,斷奶重和平均日增重的遺傳力為0.47~0.50,屬于高遺傳力;胴體重為0.37~0.39,屬于中等遺傳力;產(chǎn)犢難易度和屠宰率性狀為0.14~0.21,屬于中低遺傳力。2)在GBLUP評估模型中,Cattle 110K在各個性狀上的預(yù)測準(zhǔn)確性均表現(xiàn)良好,并較Illumina BovineHD 770K芯片有顯著提升(Plt;0.05),其中胴體重、產(chǎn)犢難易度和屠宰率3個性狀提升較為明顯,分別提升了14.9%、13.8%和8.4%;斷奶重和育肥期平均日增重分別提升 2.8%和4.5%。3)各性狀預(yù)測準(zhǔn)確性隨著遺傳力的升高而增加,不同標(biāo)記密度的回歸系數(shù)分別為0.439 2(90K)、0.374 1(110K)、0.413 6(770K)、0.459 3(790K)。因此,在華西牛實際遺傳評估中,可直接使用Cattle 110K芯片進(jìn)行評估,在獲得較好評估準(zhǔn)確性的同時降低成本。
關(guān)鍵詞:
華西牛;基因組選擇;標(biāo)記密度;育種芯片;中國肉?;蚪M選擇指數(shù)
中圖分類號:
S823.2"""" 文獻(xiàn)標(biāo)志碼:A """"文章編號: 0366-6964(2025)02-0591-12
收稿日期:2024-08-09
基金項目:科技創(chuàng)新2030—重大項目(2023ZD04048;2023ZD0404801);呼和浩特科技創(chuàng)新人才項目(2022RC-IRI-5);重點研發(fā)計劃(2023YFD1300100;2022YFD1601203);農(nóng)業(yè)科學(xué)烏拉蓋觀測實驗站建設(shè)運行(2024-YWF-ZX-06)
作者簡介:王元清(2000-),男,山東棗莊人,碩士生,主要從事?;蚪M選擇及選配研究,E-mail:wangyuanqing811@126.com
*通信作者:李俊雅,主要從事肉牛育種技術(shù)研究和新品種培育,E-mail:lijunya@caas.cn;高 雪,主要從事肉牛分子育種及基因組學(xué)研究,E-mail:gaoxue@caas.cn
Comparison of Prediction Accuracy of Genomic Selection for Economically Important Traits in Huaxi Cattle Based on Different Chip Densities
WANG" Yuanqing, WANG" Zezhao, ZHU" Bo, CHEN" Yan, XU" Lingyang, ZHANG" Lupei, GAO" Huijiang, LI" Chao, LI" Junya*, GAO" Xue*
(Institute of Animal Science, Chinese Academy of Agricultural Sciences, Beijing 100193," China)
Abstract:
This study systematically compared the effects of different marker densities on the predictive accuracy and explored methods for combining these two chips of genetic evaluations in Huaxi cattle based on the practical application of the Illumina BovineHD 770K and Cattle 110K chips. In this study, a genomic selection reference population of 3 948 Huaxi cattle was used. The 770K chip data were imputed to 790K by using resequencing data. Then 4 marker densities were selected: 90K (intersection of the two chips), 110K, 770K, and 790K (union of the two chips). The heritability of 5 traits (weaning weight, daily weight gain during the fattening period, calving ease, carcass weight, and dressing percentage) were estimated, and the predictive accuracy of genomic evaluations was compared using the GBLUP model, identifying the optimal marker density for genetic evaluations in Huaxi cattle. The results showed that: 1) There were no significant differences in the estimated heritability of the 5 traits across the 4 marker densities. The heritability for weaning weight and daily weight gain during fattening period ranged from 0.47 to 0.50 (high heritability), carcass weight ranged from 0.37 to 0.39 (moderate heritability), and calving ease and dressing percentage ranged from 0.14 to 0.21 (low to moderate heritability). 2) The Cattle 110K chip demonstrated significantly better predictive accuracy for all traits compared to the Illumina BovineHD 770K chip (Plt;0.05) in the GBLUP model. The improvements were particularly notable for carcass weight, calving ease and dressing percentage, with increases of 14.9%, 13.8%, and 8.4%, respectively. For weaning weight and daily weight gain during fattening period, the improvements were 2.8% and 4.5%, respectively. 3) The predictive accuracy of traits increased with higher heritability under the 4 marker densities. The regression coefficients for the different marker densities were 0.439 2 (90K), 0.374 1 (110K), 0.413 6 (770K), and 0.459 3 (790K). Therefore, the Cattle 110K chip can be used directly, achieving good predictive accuracy while reducing costs in practical genetic evaluations of Huaxi cattle.
Key words:
Huaxi cattle; genomic selection; marker density; breeding chip; genomic China beef index
*Corresponding authors: LI Junya, E-mail:lijunya@caas.cn; GAO Xue, E-mail:gaoxue@caas.cn
基因組選擇(genomic selection,GS)在過去10年中徹底改變了動植物育種的策略[1-6],該方法是利用參考群體的表型和基因型數(shù)據(jù),估計全基因組范圍內(nèi)每個標(biāo)記的效應(yīng)值,獲得個體基因組育種值(genomic estimated breeding value,GEBV),從而對候選群體估計育種值進(jìn)行預(yù)測,實現(xiàn)早期選種的目標(biāo)[7]。而在基因組選擇的實施過程中,基因組預(yù)測準(zhǔn)確性和芯片成本是育種者關(guān)注的兩大重要因素。通常芯片標(biāo)記密度越高,基因組育種值估計準(zhǔn)確性也就越高,但成本也相對較高。Solberg等[8]使用模擬技術(shù)對基因組預(yù)測準(zhǔn)確性與標(biāo)記密度的相關(guān)性進(jìn)行研究,結(jié)果表明將SNPs的密度從每厘摩1個增加到8個,基因組選擇的準(zhǔn)確性提高了25%,繼續(xù)增加標(biāo)記密度,提高幅度有限。Heffner等[9]利用小麥數(shù)據(jù)集也開展了類似的研究,結(jié)果表明隨著標(biāo)記密度從192個增加到1 158個,預(yù)測準(zhǔn)確性提高了10%,但大部分的提升都發(fā)生在192~384的區(qū)間內(nèi),其余標(biāo)記的增加對準(zhǔn)確性幾乎沒有影響。這些研究結(jié)果表明,增加標(biāo)記密度雖然可提高復(fù)雜性狀的基因組預(yù)測準(zhǔn)確性,但當(dāng)標(biāo)記密度達(dá)到一定水平后將趨于穩(wěn)定。因此篩選或開發(fā)標(biāo)記密度合適的育種芯片,在保證基因組預(yù)測準(zhǔn)確性的同時降低成本顯得尤為重要。
近年來,Illumina、ThermoFisher和Neogen公司推出了BovineSNP50、BovineHD770K、Bovine GGP 100K等一系列牛育種芯片,并在國內(nèi)外廣泛應(yīng)用。最早是2009年,Illumina公司與美國農(nóng)業(yè)部、密蘇里大學(xué)和阿爾伯塔大學(xué)等單位合作,推出了第一款牛的育種芯片BovineSNP50,但由于該芯片的SNPs主要來源于海福特、安格斯、荷斯坦等7個品種,包含牛品種數(shù)量過少,存在品種間信息缺失的問題[10]。因此,2010年,Illumina公司緊接著推出了Illumina BovineHD 770K芯片,是目前為止密度最高的?;蚍中托酒?,包含777 962個SNPs,其位點信息主要來源于20多個西方主流的奶牛以及肉牛品種[11]。后來開發(fā)的其他幾款芯片,例如BovineLD、GGP Bovine F250等也都是針對西方主要牛品種進(jìn)行位點篩選,缺乏我國本土肉牛品種的基因組變異信息以及重要經(jīng)濟(jì)性狀相關(guān)聯(lián)的變異位點,并且分型成本較高,在我國本土肉牛品種育種和保種應(yīng)用中存在一定局限性。為解決這個問題,團(tuán)隊前期利用基因組、外顯子組、轉(zhuǎn)錄組、表觀組等多層面組學(xué)數(shù)據(jù)的優(yōu)化設(shè)計,研發(fā)了肉牛育種芯片“Cattle 110K”。該芯片共包含112 180個SNPs位點,與Illumina BovineHD 770K重疊的SNPs位點共有90 745個,剩余21 435個SNPs為110K特異性位點,是國外主流商業(yè)化芯片中不存在的新增位點[12]。與商業(yè)Illumina BovineHD 770K芯片相比,該芯片通量適中,既保證了育種值估計和相關(guān)研究的準(zhǔn)確性,又降低了成本,價格只有其1/5,適宜在我國肉牛育種中大規(guī)模推廣應(yīng)用。
華西牛是我國2021年新審定的專門化肉用新品種,具有生長速度快、屠宰率和凈肉率高、繁殖性能好、抗逆性強、經(jīng)濟(jì)效益高等特點。在華西牛選育過程中,基因組選擇的參考群體創(chuàng)建于2008年,由于當(dāng)時我國尚未擁有自主研發(fā)的肉牛育種芯片,參考群體的基因分型使用的是Illumina BovineHD 770K芯片。隨著Cattle 110K的研發(fā)成功,基因分型成本大幅降低,目前我國種公牛站、國家核心育種場等場站參與遺傳評估的華西牛均使用Cattle 110K分型。因此,在華西牛實際遺傳評估應(yīng)用中,如何將參考群Illumina BovineHD 770K和候選群Cattle 110K兩款芯片數(shù)據(jù)結(jié)合使用需要進(jìn)一步探討。
本試驗以華西牛參考群體為研究素材,利用重測序數(shù)據(jù)構(gòu)建參考面板,將用于參考群體基因分型的Illumina BovineHD 770K芯片填充至790K(包含Cattle 110K的新增21K位點),之后選取4種標(biāo)記密度:90K(兩款芯片交集)、110K、770K、790K(兩款芯片并集),根據(jù)參考群體5個GCBI(genomic china beef index)重要經(jīng)濟(jì)性狀的表型數(shù)據(jù),包括斷奶重(weaning weight, WWT)、育肥期平均日增重(daily weight gain during fattening period, ADG)、產(chǎn)犢難易度(calving ease, CE)、胴體重(carcass weight, CWT)、屠宰率(dressing percentage, DP),建立混合線性模型,通過GBLUP對5個性狀進(jìn)行遺傳參數(shù)和基因組育種值的估計,并采用五折交叉驗證法對不同標(biāo)記密度下的基因組選擇準(zhǔn)確性進(jìn)行評價,篩選并確定適用于華西牛GCBI計算和遺傳評估的標(biāo)記密度,為華西牛的基因組遺傳評估提供參考。
1 材料與方法
1.1 試驗動物及表型數(shù)據(jù)
本研究試驗動物來源于中國農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所牛遺傳育種科技創(chuàng)新團(tuán)隊于2008年創(chuàng)建于內(nèi)蒙古錫林郭勒盟烏拉蓋管理區(qū)的華西牛參考群體,共計3 948頭,其中有表型記錄個體為2 904頭,包含公牛2 179頭,母牛725頭。測定性狀為:GCBI指數(shù)涉及的5個性狀,斷奶重統(tǒng)一矯正為6月齡入欄時體重,飼養(yǎng)至18月齡時出欄,將6~18月齡體重增長作為育肥期平均日增重,出欄后分批屠宰,根據(jù)中華人民共和國國家標(biāo)準(zhǔn)(GB/T 27643-2011)測量收集胴體重、屠宰率性狀,共收集6 859條表型記錄。根據(jù)數(shù)據(jù)特征,利用Excel對表型數(shù)據(jù)進(jìn)行預(yù)處理,剔除在平均數(shù)加減3倍標(biāo)準(zhǔn)差范圍之外的數(shù)據(jù),對剩余數(shù)據(jù)進(jìn)行正態(tài)性檢驗再用于后續(xù)分析。
1.2 基因型數(shù)據(jù)的獲取與質(zhì)量控制
本研究試驗群體的所有牛只在育肥期間采集血樣,進(jìn)行抗凝處理后將達(dá)到標(biāo)準(zhǔn)的DNA樣品送至芯片服務(wù)商,采用Illumina BovineHD 770K芯片進(jìn)行基因分型。利用團(tuán)隊前期積累的44頭華西牛(來源于3 948的華西牛參考群體)基因組重測序數(shù)據(jù)(平均測序深度20×)以及千?;蚪M數(shù)據(jù)庫為參考[13],提取Cattle 110K特異性的21K SNP位點,通過Beagle v5.4軟件將3 948頭華西牛個體的基因型數(shù)據(jù)由770K位點填充至790K[14,15]。最終共選取了4種標(biāo)記密度的基因型數(shù)據(jù),分別為90K(兩款芯片交集)、110K、770K、790K(兩款芯片并集)。
使用PLINK v1.90軟件對基因型數(shù)據(jù)進(jìn)行質(zhì)量控制[16],質(zhì)控標(biāo)準(zhǔn)為:1)個體SNP檢出率大于90%;2)SNP位點檢出率大于95%;3)最小等位基因頻率大于1%;4)哈代溫伯格平衡Plt;1×10-6;5)只保留常染色體位點。各芯片密度質(zhì)控前后的詳細(xì)情況見表1。
1.3 遺傳參數(shù)及基因組育種值的估計
基于已獲得的基因型和表型數(shù)據(jù),同時結(jié)合固定效應(yīng)(出生年份:2008年~2020年;性別:公和母;場:1~24;季節(jié):春、夏、秋、冬;產(chǎn)犢年齡:25月齡~150月齡;后代性別:公和母),建立線性模型,利用GBLUP法對各經(jīng)濟(jì)性狀進(jìn)行遺傳參數(shù)和基因組育種值的估計,模型如下:
y=Xb+Za+e
其中,y代表表型觀察值向量;X是n×f維關(guān)聯(lián)矩陣;b是f維固定效應(yīng)向量,f是固定效應(yīng)個數(shù);Z是與a相關(guān)聯(lián)的結(jié)構(gòu)矩陣;a代表加性效應(yīng)向量,服從N (0, Gσ2g) 的正態(tài)分布;其中G為加性基因
組關(guān)系矩陣,σ2g 為加性遺傳方差;e為殘差向量,服從N (0, Iσ2e)的正態(tài)分布。各經(jīng)濟(jì)性狀具體使用的固定效應(yīng)及協(xié)變量見表2。
使用ASReml-R 4.1.0程序包通過約束最大似然法進(jìn)行方差組分的估計和遺傳力的計算,性狀遺傳力的計算公式如下:
h2=σ2aσ2p=σ2aσ2a+σ2e
其中,σ2p表示表型方差,σ2a 表示加性遺傳方差,σ2e表示環(huán)境方差。
基因組親緣關(guān)系矩陣(G矩陣)采用VanRaden方法通過R包rrBLUP的A.mat函數(shù)進(jìn)行構(gòu)建,GBLUP模型的計算使用ASReml-R 4.1.0程序包進(jìn)行[17]。
1.4 基因組育種值估計準(zhǔn)確性評價
本研究使用5折交叉驗證的方法來評價不同芯片密度下的GEBV估計準(zhǔn)確性,即將華西牛群體隨機(jī)分為5組,每一次取1組作為驗證群體(去除表型值),其余有表型值和基因型值的作為參考群體來預(yù)測驗證群體的GEBV,共重復(fù)循環(huán)5次。
1.4.1 準(zhǔn)確性" 通過計算校正后表型與GEBV之間的相關(guān)性來評價模型的預(yù)測能力,同時為了避免遺傳力對預(yù)測精度的影響,將校正后表型與GEBV之間的皮爾遜相關(guān)除以性狀遺傳力的算術(shù)平方根作為準(zhǔn)確性的評價指標(biāo)[18-21],計算模型如下:
r=Cor(GEBV,y*)h2
其中,y*表示性狀校正后的表型值,h2表示性狀遺傳力。對每個經(jīng)濟(jì)性狀的驗證進(jìn)行5次重復(fù),取相關(guān)性的平均值作為模型準(zhǔn)確性最終的評估指標(biāo)。
1.4.2 無偏性" 通過計算校正后的表型值對驗證群體的預(yù)測育種值之間的回歸系數(shù)來評價模型的無偏性,該值越接近1,表明預(yù)測育種值是對校正后表型值的無偏預(yù)測。
2 結(jié) 果
2.1 表型統(tǒng)計量分析
本研究共統(tǒng)計了2 905頭個體的表型記錄,對各性狀的最大值、最小值、平均值、標(biāo)準(zhǔn)差進(jìn)行描述性統(tǒng)計,結(jié)果見表3。由表可得,斷奶重、育肥期平均日增重、產(chǎn)犢難易度、胴體重、屠宰率的平均值分別為203.75 kg、0.96 kg、1.11、297.56 kg、53.86%,標(biāo)準(zhǔn)差分別為53.13 kg、0.21 kg、0.39、64.03 kg、4.21%。對斷奶重、育肥期平均日增重、胴體重、屠宰率4個性狀的表型數(shù)據(jù)進(jìn)行了正態(tài)性檢驗(圖1),結(jié)果表明,4個性狀的數(shù)據(jù)均服從正態(tài)分布(Plt;0.05)。
2.2 各性狀遺傳參數(shù)估計
利用全基因組SNP信息構(gòu)建加性親緣關(guān)系矩陣,建立混合線性模型,通過約束最大似然法對華西牛重要經(jīng)濟(jì)性狀的加性遺傳方差、殘差方差、表型方差、遺傳力進(jìn)行估計(表4)。如表4所示,隨著芯片密度的增加,各性狀估計遺傳力基本呈上升趨勢,但不同標(biāo)記密度下同一性狀的估計遺傳力差異不顯著。4種標(biāo)記密度下,華西牛斷奶重和育肥期平均日增重的遺傳力分別為0.492~0.503、0.473~0.491,屬于高遺傳力;胴體重為0.365~0.386,屬于中等遺傳力;產(chǎn)犢難易度和屠宰率性狀為0.142~0.161、0.195~0.209,屬于中低遺傳力。同時由表4可以看出,胴體重在110K芯片密度下,估計遺傳力高于其他標(biāo)記密度。
2.3 各性狀基因組選擇的預(yù)測準(zhǔn)確性與無偏性比較研究
通過5折交叉驗證,采用GBLUP模型在4種芯片密度下對華西牛重要經(jīng)濟(jì)性狀的預(yù)測準(zhǔn)確性進(jìn)行評價,將校正后表型與GEBV之間的皮爾遜相關(guān)系數(shù)除以性狀遺傳力的算術(shù)平方根作為GEBV準(zhǔn)確性的評價指標(biāo)。
2.3.1 準(zhǔn)確性
如圖2所示,除了在斷奶重性狀中,110K芯片預(yù)測準(zhǔn)確性略低于790K,其余4個性狀均高于790K,提升幅度為3.60%~15.07%,并且預(yù)測準(zhǔn)確性顯著大于770K(Plt;0.05)。尤其在胴體重、產(chǎn)犢難易度和屠宰率3個性狀中,110K的基因組預(yù)測準(zhǔn)確性提升較為明顯,相較于770K分別提升了14.9%、13.8%和8.4%。另外,利用90K和770K芯標(biāo)記密度的預(yù)測準(zhǔn)確性差異不顯著,浮動范圍為0.000~0.170,這說明利用770K芯片和110K共有的90K,即可達(dá)到比較穩(wěn)定的預(yù)測準(zhǔn)確性。
2.3.2 無偏性
如圖3和表5所示,各標(biāo)記密度下的無偏性為0.8510~1.0386;110K芯片基因組育種值預(yù)測的無偏性為0.8510~0.9942;770K芯片基因組育種值預(yù)測的無偏性為0.8773~1.0088。兩款芯片計算的無偏性結(jié)果相似,基因組育種值預(yù)測的無偏性都接近于1。該結(jié)果表明在4種芯片密度下,利用GBLUP方法計算的基因組育種值都接近于對真實育種值的無偏預(yù)測。
2.4 性狀遺傳力對基因組選擇預(yù)測準(zhǔn)確性的影響
本研究還探討了不同芯片密度估計的性狀遺傳力對預(yù)測準(zhǔn)確性的影響。如圖4和表6所示,各性狀基因組預(yù)測準(zhǔn)確性基本隨著遺傳力的升高而增加,雖然不同芯片密度下,兩者的回歸系數(shù)略有差異,但整體趨勢表現(xiàn)一致,相應(yīng)回歸系數(shù)分別為0.439 2(90K)、0.374 1(110K)、0.413 6(770K)、0.459 3(790K);其中790K芯片密度的回歸系數(shù)最高,這表明在790K標(biāo)記密度下,性狀遺傳力對預(yù)測準(zhǔn)確性的影響最大。對于110K而言,回歸系數(shù)雖較其他幾款芯片小,但在5個性狀上預(yù)測準(zhǔn)確性卻較高,尤其在胴體重性狀上的預(yù)測準(zhǔn)確性最高,達(dá)到0.532。
3 討 論
3.1 標(biāo)記密度對遺傳參數(shù)估計的影響
本研究在不同芯片密度下通過約束最大似然法對5個經(jīng)濟(jì)性狀的的方差組分進(jìn)行了估計,進(jìn)而計算了遺傳力。研究表明,隨著標(biāo)記密度的提高,估計的遺傳力也隨之提高,但整體差異不大。4種標(biāo)記密度下的計算結(jié)果具有高度的一致性:斷奶重和育肥期平均日增重為高遺傳力;胴體重屬于中等遺傳力;產(chǎn)犢難易度和屠宰率屬于中低遺傳力。牛紅等[22]利用系譜對中國西門塔爾牛通過BLUP模型計算得到的斷奶重、胴體重、屠宰率性狀遺傳力分別為0.44、0.38、0.31;Pritchard等[23]利用系譜結(jié)合大數(shù)據(jù)計算了西門塔爾、夏洛萊、海福特等14個牛品種的胴體重遺傳力,其中肉牛品種胴體重遺傳力均值為0.25~0.45;Srivastava等[24]利用Illumina Bovine SNP50K對韓牛的胴體重遺傳力估計為0.34;Winder等[25]對安格斯牛斷奶重的遺傳力估計為0.39;而在西門塔爾牛、日本和牛和南非本土肉牛群體中利用系譜估計的斷奶重遺傳力分別為0.34、0.39和0.47[26-28];周佩諾[29]利用Illumina BovineHD 770K對中國西門塔爾牛的胴體重、斷奶重和平均日增重性狀進(jìn)行了遺傳力估計,分別為0.38、0.33和0.38;Saatchi等[30]利用牛50K芯片估計2 703頭西門塔爾牛斷奶重的遺傳力為0.30;Bolormaa等[31]利用729 068個SNPs估計9個肉牛品種育肥期日增重的遺傳力為0.38;在屠宰率遺傳力估計的相關(guān)報道中,Morris等[32]對新西蘭肉牛的屠宰率遺傳力估計為0.31;李柯安寧等[33]利用Illumina BovineHD 770K芯片對華西牛胴體重和屠宰率的遺傳力估計為0.32和0.21;朱波等[34]估計中國肉用西門塔爾牛的斷奶重遺傳力為0.42??梢园l(fā)現(xiàn),由于群體大小和親緣關(guān)系矩陣的構(gòu)建方式不同導(dǎo)致同一性狀的遺傳力估計值均有差異。在本研究中,不同芯片密度下估計斷奶重的遺傳力為0.49~0.50,略高于以上報道,這可能是由于畜群結(jié)構(gòu)、飼養(yǎng)方式、使用模型等的差異對遺傳參數(shù)估計產(chǎn)生了影響,而本研究中胴體重、屠宰率的遺傳力分別為0.37~0.39、0.20~0.21,與以上的報道較為一致。
3.2 標(biāo)記密度對基因組預(yù)測準(zhǔn)確性的影響
本研究評估了在不同芯片密度下使用GBLUP模型對5個性狀進(jìn)行基因組選擇的預(yù)測準(zhǔn)確性,由于交叉驗證分組存在隨機(jī)性,單次交叉驗證不具有代表性,因此對各個性狀的驗證進(jìn)行了5次5折交叉驗證,以此來校正評估的準(zhǔn)確性[35-38]。研究表明,除了在斷奶重性狀中110K芯片預(yù)測準(zhǔn)確性略低于790K,其余4個性狀均高于790K,提升幅度為3.60%~15.07%,并且預(yù)測準(zhǔn)確性顯著大于770K(Plt;0.05)。尤其在胴體重、產(chǎn)犢難易度和屠宰率3個性狀中,110K的基因組預(yù)測準(zhǔn)確性提升較為明顯,相較于770K分別提升了14.9%、13.8%和8.4%。這可能是因為在Cattle 110K多策略篩選的過程中,重點針對這些屠宰性狀進(jìn)行了多組學(xué)來源的信息篩選,并加入了牛QTL數(shù)據(jù)庫中相關(guān)位點集合。對于斷奶重、育肥期平均日增重的提升為2.8%和4.5%,這可能是由于Cattle 110K位點篩選過程中并沒有針對這些性狀進(jìn)行位點篩選,但剔除了770K芯片中冗雜的位點,因此有一定的準(zhǔn)確性提升[39-43]。有研究表明,當(dāng)標(biāo)記密度達(dá)到一定水平后[44,45],繼續(xù)增加SNP密度對于基因組選擇的提升幅度十分有限[46,47]。Werner等[48]以半東油菜籽為模型,通過GWAS使用篩選與目標(biāo)性狀相關(guān)聯(lián)的顯著SNP位點和基于LD水平篩選代表型SNP兩種篩選方法得到兩個低密度的SNP集合,并與原始的24 335個標(biāo)記的SNPs集合的GEBV估計準(zhǔn)確性比較了差異,結(jié)果表明,僅1 000個SNP標(biāo)記就可以達(dá)到與24 335個SNPs標(biāo)記相同的預(yù)測精度。Gutierrez等[49]對太平洋牡蠣的生長相關(guān)性狀的基因組選擇研究表明,降低SNP密度對基因組預(yù)測的準(zhǔn)確性影響較低。王鈺等[50]從Porcine60K芯片中篩選一部分位點模擬低密度SNP芯片,具體策略為染色體上每105 bp的區(qū)域內(nèi)選擇目標(biāo)性狀SNP效應(yīng)最高的位點,形成低密度SNP集合,并與原始Porcine60K高密度芯片比較了全基因組選擇效果,結(jié)果表明,篩選得到的低密度SNP集合已經(jīng)可以達(dá)到與原始高密度芯片相當(dāng)水平的準(zhǔn)確性。VanRaden等[51]從奶牛的測序數(shù)據(jù)中通過GWAS方法挑選了17KSNP加入到原有的60K芯片中,發(fā)現(xiàn)預(yù)測準(zhǔn)確性相對60K芯片提高了5%。以上與本研究所得的結(jié)論一致,當(dāng)標(biāo)記密度達(dá)到90K時,預(yù)測能力與770K芯片差異不顯著,而新增的21K位點能夠進(jìn)一步提升預(yù)測的準(zhǔn)確性。
3.3 性狀遺傳力對基因組預(yù)測準(zhǔn)確性的影響
有研究表明,基因組選擇的預(yù)測準(zhǔn)確性與性狀遺傳力存在正相關(guān)關(guān)系[52-54]。為了進(jìn)一步研究不同芯片密度下性狀遺傳力與基因組預(yù)測準(zhǔn)確性之間的關(guān)系,對性狀遺傳力與基因組預(yù)測準(zhǔn)確性進(jìn)行了回歸分析。研究發(fā)現(xiàn),各性狀基因組預(yù)測準(zhǔn)確性基本隨著遺傳力的升高而增加,這與之前豬、梅花鹿等的研究結(jié)果相一致[55]。不同芯片密度下的回歸系數(shù)略有差異,但整體趨勢表現(xiàn)一致,相應(yīng)回歸系數(shù)分別為0.439 2(90K)、0.374 1(110K)、0.413 6(770K)、0.459 3(790K),110K芯片密度的回歸系數(shù)最低。這可能是由于110K芯片在優(yōu)化設(shè)計時考慮了大量與屠宰性狀相關(guān)聯(lián)的位點,特異性位點的選擇顯著提升了特定性狀的預(yù)測準(zhǔn)確性,所以胴體重、屠宰率性狀的遺傳力雖低于斷奶重,但其預(yù)測準(zhǔn)確性卻較高。
綜合來看,芯片密度是影響基因組選擇預(yù)測準(zhǔn)確性的重要因素,但并不是決定因素,基因組選擇的效果并不依賴于最大標(biāo)記密度的基因分型數(shù)據(jù),與性狀緊密相關(guān)的基因位點組成的低密度標(biāo)記集合在具有強LD的育種群體中基因組選擇預(yù)測準(zhǔn)確性可能會更高。因此,對于芯片密度的選擇可能沒有絕對的標(biāo)準(zhǔn),最適的標(biāo)記密度要考慮物種和目標(biāo)性狀的遺傳結(jié)構(gòu)來確定。
4 結(jié) 論
本研究利用90K(兩款芯片交集)、110K、770K、790K(兩款芯片并集)4種芯片密度,對華西牛斷奶重、育肥期平均日增重、產(chǎn)犢難易度、胴體重、屠宰率進(jìn)行遺傳參數(shù)估計和基因組預(yù)測準(zhǔn)確性比較。結(jié)果表明,4種標(biāo)記密度估計的華西牛5個性狀遺傳參數(shù)高度一致;Cattle 110K芯片基因組預(yù)測準(zhǔn)確性在各個性狀上的預(yù)測準(zhǔn)確性均表現(xiàn)良好,且高于其他標(biāo)記密度芯片。因此,在華西牛實際遺傳評估中,可直接使用Cattle 110K芯片進(jìn)行評估,獲得較好評估準(zhǔn)確性的同時還會降低成本。
參考文獻(xiàn)(References):
[1] MEUWISSEN T H E,HAYES B J,GODDARD M E.Prediction of total genetic value using genome-wide dense marker maps[J].Genetics,2001,157(4):1819-1829.
[2] 汪聰勇,朱 波,李俊雅.中國肉牛種業(yè)發(fā)展現(xiàn)狀、存在問題及建議[J].中國牛業(yè)科學(xué),2020,46(2):52-54.
WANG C Y,ZHU B,LI J Y.Development status,problems and suggestions of cattle seed industry in China[J].China Cattle Science, 2020,46(2):52-54.(in Chinese)
[3] 李 姣,秦雅婷.我國肉牛種業(yè)概況[J].中國畜牧業(yè),2020(7):34-35.
LI J,QIN Y T.General situation of beef cattle seed industry in China[J].China Animal Industry,2020(7):34-35. (in Chinese)
[4] GUINAN F L,WIGGANS G R,NORMAN H D,et al.Changes in genetic trends in US dairy cattle since the implementation of genomic selection[J].J Dairy Sci,2023,106(2):1110-1129.
[5] SMITH T P L,BICKHART D M,BOICHARD D,et al.The Bovine Pangenome Consortium:democratizing production and accessibility of genome assemblies for global cattle breeds and other bovine species[J].Genome Biol,2023,24(1):139.
[6] WANG H F,LI C L,LI J Y,et al.Genomic selection for weaning weight in alpine merino sheep based on GWAS prior marker information[J].Animals,2024,14(13):1904.
[7] HENDERSON C R.Best linear unbiased estimation and prediction under a selection model[J].Biometrics,1975,31(2):423-447.
[8] SOLBERG T R,SONESSON A K,WOOLLIAMS J A,et al.Genomic selection using different marker types and densities[J].J Anim Sci,2008,86(10):2447-2454.
[9] HEFFNER E L,JANNINK J L,IWATA H,et al.Genomic selection accuracy for grain quality traits in biparental wheat populations[J]. Crop Sci,2011,51(6):2597-2606.
[10] MATUKUMALLI L K,LAWLEY C T,SCHNABEL R D,et al.Development and characterization of a high density SNP genotyping assay for cattle[J].PLoS One,2009,4(4):e5350.
[11] ZHAO F P,ZHANG P F,WANG X Q,et al.Genetic gain and inbreeding from simulation of different genomic mating schemes for pig improvement[J].J Anim Sci Biotechnol,2023,14(1):87.
[12] CHEN Y,GUO Y W,GE F,et al.Developing a liquid capture chip to accelerate the genetic progress of cattle[J].Anim Res One Health,2024,2(2):204-216.
[13] HAYES B J,MACLEOD L M,DAETWYLER H D,et al.Genomic prediction from whole genome sequence in livestock:the 1000 bull genomes project[C]//Proceedings of the 10th World Congress on Genetics Applied to Livestock Production.Vancouver:American Society of Animal Science,2014.
[14] BROWNING B L,ZHOU Y,BROWNING S R.A one-penny imputed genome from next-generation reference panels[J].Am J Hum Genet,2018,103(3):338-348.
[15] BROWNING B L,TIAN X W,ZHOU Y,et al.Fast two-stage phasing of large-scale sequence data[J].Am J Hum Genet,2021, 108(10):1880-1890.
[16] PURCELL S,NEALE B,TODD-BROWN K,et al.PLINK:a tool set for whole-genome association and population-based linkage analyses[J].Am J Hum Genet,2007,81(3):559-575.
[17] GILMOUR A R,GOGEL B J,CULLIS B R,et al.ASReml user guide release 4.1 structural specification[R].Hemel Hempstead: VSN International Ltd.,2014:5.
[18] PRYCE J E,ARIAS J,BOWMAN P J,et al.Accuracy of genomic predictions of residual feed intake and 250-day body weight in growing heifers using 625,000 single nucleotide polymorphism markers[J].J Dairy Sci,2012,95(4):2108-2119.
[19] ZHANG M H,LUO H P,XU L,et al.Genomic selection for milk production traits in Xinjiang Brown cattle[J].Animals, 2022,12(2):136.
[20] YIN C,ZHOU P,WANG Y W,et al.Using genomic selection to improve the accuracy of genomic prediction for multi-populations in pigs[J].Animal,2024,18(2):101062.
[21] YAN X C,ZHANG T,LIU L C,et al.Accuracy of genomic selection for important economic traits of cashmere and meat goats assessed by simulation study[J].Front Vet Sci,2022,9:770539.
[22] 牛 紅,寶金山,吳 洋,等.中國西門塔爾牛肉用群體重要經(jīng)濟(jì)性狀遺傳參數(shù)估計[J].畜牧獸醫(yī)學(xué)報,2016,47(9):1817-1823.
NIU H,BAO J S,WU Y,et al.Estimation of genetic parameters for economic important traits in chinese simmental beef cattle[J].Acta Veterinaria et Zootechnica Sinica,2016,47(9):1817-1823.(in Chinese)
[23] PRITCHARD T C,WALL E,COFFEY M P.Genetic parameters for carcase measurements and age at slaughter in commercial cattle[J].Animal,2021,15(2):100090.
[24] SRIVASTAVA S,LOPEZ B I,DE LAS HERAS-SALDANA S,et al.Estimation of genetic parameters by single-trait and multi-trait models for carcass traits in Hanwoo cattle[J].Animals,2019,9(12):1061.
[25] WINDER J A,BRINKS J S,BOURDON R M,et al.Genetic analysis of absolute growth measurements,relative growth rate and restricted selection indices in red Angus cattle[J].J Anim Sci,1990,68(2):330-336.
[26] BAKER R L,MORRIS C A,JOHNSON D L,et al.Results of selection for yearling or 18-month weight in angus and Hereford cattle[J].Livest Prod Sci,1991,29(4):277-296.
[27] MUKAI F,OYAMA K,KOHNO S.Genetic relationships between performance test traits and field carcass traits in Japanese Black cattle[J].Livest Prod Sci,1995,44(3):199-205.
[28] NESENGANI L T,NEPHAWE K A,SEBEI J,et al.Genetic relationship between weaning weight and milk yield in Nguni cattle[J].Animal,2018,12(2):199-204.
[29] 周佩諾.中國肉用西門塔爾牛經(jīng)濟(jì)性狀相關(guān)SNP優(yōu)化篩選研究[D].北京:中國農(nóng)業(yè)科學(xué)院,2021.
ZHOU P N.Optimization selecting related SNPs for economic traits of Chinese simmental beef cattle[D].Beijing:Chinese Academy of Agricultural Sciences,2021.(in Chinese)
[30] SAATCHI M,SCHNABEL R D,ROLF M M,et al.Accuracy of direct genomic breeding values for nationally evaluated traits in US Limousin and Simmental beef cattle[J].Genet Sel Evol,2012,44(1):38.
[31] BOLORMAA S,HAILE-MARIAM M,MARETT L C,et al.Use of dry-matter intake recorded at multiple time periods during lactation increases the accuracy of genomic prediction for dry-matter intake and residual feed intake in dairy cattle[J].Anim Prod Sci,2023,63(11):1113-1125.
[32] MORRIS C A,CULLEN N G,MCCALL D G.Genetic and phenotypic relationships among carcass measurements in beef cattle[J].N Z J Agric Res,1999,42(4):415-421.
[33] 李柯安寧,杜麗麗,安炳星,等.華西牛胴體及原始分割肉塊重量性狀遺傳參數(shù)估計與全基因組關(guān)聯(lián)分析[J].畜牧獸醫(yī)學(xué)報,2023,54(9):3664-3676.
LI K A N,DU L L,AN B X,et al.Genetic parameter estimation and genome-wide association study for carcass traits and primal cuts weight traits in Huaxi cattle[J].Acta Veterinaria et Zootechnica Sinica,2023,54(9):3664-3676.(in Chinese)
[34] 朱 波,李 姣,汪聰勇,等.我國肉用西門塔爾牛群體生長發(fā)育性狀遺傳參數(shù)估計及其遺傳進(jìn)展[J].畜牧獸醫(yī)學(xué)報,2020, 51(8):1833-1844.
ZHU B,LI J,WANG C Y,et al.Genetic parameter and genetic gain estimation for growth and development traits in Chinese Simmental beef cattle[J].Acta Veterinaria et Zootechnica Sinica,2020,51(8):1833-1844.(in Chinese)
[35] GUO P,ZHU B,NIU H,et al.Fast genomic prediction of breeding values using parallel Markov chain Monte Carlo with convergence diagnosis[J].BMC Bioinformatics,2018,19(1):3.
[36] HAQUE A,IQBAL A,BAE H,et al.Assessment of genomic breeding values and their accuracies for carcass traits in Jeju Black cattle using whole-genome SNP chip panels[J].J Anim Breed Genet,2023,140(5):519-531.
[37] LI W J,LI W Q,SONG Z C,et al.Marker density and models to improve the accuracy of genomic selection for growth and slaughter traits in meat rabbits[J].Genes,2024,15(4):454.
[38] KIM E H,KANG H C,SUN D W,et al.Estimation of breeding value and accuracy using pedigree and genotype of Hanwoo cows (Korean cattle)[J].J Anim Breed Genet,2022,139(3):281-291.
[39] SCHAEFFER L R.Strategy for applying genome-wide selection in dairy cattle[J].J Anim Breed Genet,2006,123(4):218-223.
[40] WANG X,SHI S L,WANG G J,et al.Using machine learning to improve the accuracy of genomic prediction of reproduction traits in pigs[J].J Anim Sci Biotechnol,2022,13(1):60.
[41] SAATCHI M,MCCLURE M C,MCKAY S D,et al.Accuracies of genomic breeding values in American Angus beef cattle using K-means clustering for cross-validation[J].Genet Sel Evol,2011,43:40.
[42] BOLORMAA S,PRYCE J E,KEMPER K,et al.Accuracy of prediction of genomic breeding values for residual feed intake and carcass and meat quality traits in Bos taurus,Bos indicus,and composite beef cattle[J].J Anim Sci,2013,91(7):3088-3104.
[43] ONOGI A,OGINO A,KOMATSU T,et al.Genomic prediction in Japanese Black cattle:application of a single-step approach to beef cattle[J].J Anim Sci,2014,92(5):1931-1938.
[44] SPINDEL J,BEGUM H,AKDEMIR D,et al.Genomic selection and association mapping in rice (Oryza sativa):effect of trait genetic architecture,training population composition,marker number and statistical model on accuracy of rice genomic selection in elite,tropical rice breeding lines[J].PLoS Genet,2015,11(2):e1004982.
[45] ZHU S H,GUO T T,YUAN C,et al.Evaluation of Bayesian alphabet and GBLUP based on different marker density for genomic prediction in Alpine Merino sheep[J].G3 (Bethesda),2021,11(11):jkab206.
[46] ERBE M,HAYES B J,MATUKUMALLI L K,et al.Improving accuracy of genomic predictions within and between dairy cattle breeds with imputed high-density single nucleotide polymorphism panels[J].J Dairy Sci,2012,95(7):4114-4129.
[47] HEIDARITABAR M,CALUS M P L,MEGENS H J,et al.Accuracy of genomic prediction using imputed whole-genome sequence data in white layers[J].J Anim Breed Genet,2016,133(3):167-179.
[48] WERNER C R,VOSS-FELS K P,MILLER C N,et al.Effective genomic selection in a narrow-genepool crop with low-density markers:Asian rapeseed as an example[J].Plant Genome,2018,11(2):170084.
[49] GUTIERREZ A P,MATIKA O,BEAN T P,et al.Genomic selection for growth traits in Pacific oyster (Crassostrea gigas):potential of low-density marker panels for breeding value prediction[J].Front Genet,2018,9:391.
[50] 王 玨,劉成琨,劉德武,等.基于不同密度SNP芯片在杜洛克公豬中的全基因組選擇效果分析[J].中國畜牧雜志,2019,55(12):75-79.
WANG J,LIU C K,LIU D W,et al.Analysis of genomic selection based on SNP data of various density chips in duroc male pig population[J].Chinese Journal of Animal Science,2019,55(12):75-79.(in Chinese)
[51] VANRADEN P M,TOOKER M E,O’CONNELL J R,et al.Selecting sequence variants to improve genomic predictions for dairy cattle[J].Genet Sel Evol,2017,49(1):32.
[52] 彭 瀟,尹立林,梅全順,等.豬主要經(jīng)濟(jì)性狀的基因組選擇研究[J].畜牧獸醫(yī)學(xué)報,2019,50(2):439-445.
PENG X,YIN L L,MEI Q S,et al.A study of genome selection based on the porcine major economic traits[J].Acta Veterinaria et Zootechnica Sinica,2019,50(2):439-445.(in Chinese)
[53] GE F,JIA C J,BAO P J,et al.Accuracies of genomic prediction for growth traits at weaning and yearling ages in yak[J].Animals (Basel),2020,10(10):1793.
[54] JIA Y,JANNINK J L.Multiple-trait genomic selection methods increase genetic value prediction accuracy[J].Genetics,2012, 192(4):1513-1522.
[55] 李浩東,閔祥玉,周 雅,等.基于GBLUP等模型對梅花鹿(Cervus Nippon)生長相關(guān)性狀基因組選擇的預(yù)測準(zhǔn)確性比較[J].畜牧獸醫(yī)學(xué)報,2023,54(2):608-616.
LI H D,MIN X Y,ZHOU Y,et al.Comparison of prediction accuracy of genomic selection for growth-related traits in Sika Deer (Cervus Nippon) based on GBLUP and other models[J].Acta Veterinaria et Zootechnica Sinica,2023,54(2):608-616.(in Chinese)
(編輯 郭云雁)