郭軍,曲亮,竇套存,沈曼曼,胡玉萍,王克華
(江蘇省家禽科學研究所,江蘇省家禽遺傳育種重點實驗室,江蘇 揚州225125)
動物遺傳育種研究是一門開放的科學,對新涌現(xiàn)的方法和理論不斷地兼收并蓄、圓融貫通,尤其是計算技術[1-2]。遺傳選育是將家畜或家禽按照育種值大小排序,留選育種值高的個體的技術。育種值的準確性與計算策略緊密相關,常用算法主要包括限制最大似然法(restricted maximum likelihood method, REML)和貝葉斯法。PATTERSON 和THOMPSON 將REML 與最優(yōu)線性無偏估計(best linear unbiased predictor, BLUP)方法整合,用來分析非均衡育種數(shù)據(jù)的方差組分,并成為遺傳參數(shù)估計和育種值預測的標準程序[3-4]。隨著馬爾科夫鏈蒙特卡洛(Markov chain Monte Carlo,MCMC)方法和吉布斯抽樣技術的發(fā)展,通過條件分布采樣模擬聯(lián)合分布,再通過模擬的聯(lián)合分布直接推導出條件分布,貝葉斯法逐漸成為REML 的備選方法[5]。近年來,積分嵌套拉普拉斯逼近方法(integrated nested Laplace approximations,INLA)被引入貝葉斯分析,與MCMC方法相比較,INLA方法不僅縮減了計算量,還提高了計算準確度[6]。隨后,HOLAND等[7]和RUE 等[8]基于INLA 方法開發(fā)出遺傳評估R軟件包,促進了INLA 方法在畜禽遺傳育種及野生動物生態(tài)研究中的應用。
蛋雞體質量與飼料消耗有關,從節(jié)約飼料成本角度考慮,早期選育時可淘汰體質量過高的個體。據(jù)ANDERSON等統(tǒng)計,與隨機交配群體相比,商品蛋雞早期體質量持續(xù)下降[9]。管理水平、疾病狀況、季節(jié)變化及自身生理狀況等均是影響蛋雞體質量的重要因素。NORRIS等在分析文達雞4周齡體質量遺傳變異時,將批次和性別列入固定效應[10]。NAVARRO 等用REML 法估計了4 種肉用型雞6 周齡體質量遺傳參數(shù),將批次、性別及母本周齡納入固定效應[11]。MANIATIS等以REML方法對安偉捷育種公司肉雞5 周齡體質量進行了遺傳評估,遺傳模型固定效應包括性別、遺傳組、批次及父本、母本周齡[12]。總之,國外學者多以REML 算法評估雞早期體質量遺傳數(shù)據(jù),尚少見以貝葉斯算法進行評估,罕見以2 種或2 種以上算法評估同一組數(shù)據(jù)?;诖耍驹囼炓缘半uF2資源群體數(shù)據(jù)為基礎,采用REML、MCMC及INLA分析遺傳方差組分,旨在為地方雞種遺傳評估及選育提供支持。
蛋雞資源群體以東鄉(xiāng)綠殼蛋雞(DXBS)、白來航雞(WL)為親本,依據(jù)F2設計,經(jīng)正反交組建。其中,F(xiàn)1代雛雞1 581 只,包括正交群體(東鄉(xiāng)綠殼蛋雞×白來航雞)552 只、反交群體(白來航雞×東鄉(xiāng)綠殼蛋雞)1 029 只。F2代雛雞3 749 只,包括母雞1 744只、公雞2 005只。第1周雛雞進行24 h光照,熱風爐加溫;從第2周起,依據(jù)自然光照控制人工補光時間。試驗雞只單獨戴翅號,出雛時經(jīng)頸部皮下注射馬立克氏病疫苗。機械化喂料、清糞。
用MP6001 型電子天平稱量蛋雞每世代第5 周時體質量。蛋雞資源群體5周齡體質量原始數(shù)據(jù)共有5 405 條,其中親代數(shù)據(jù)640 條,F(xiàn)1代數(shù)據(jù)1 239條,F(xiàn)2代數(shù)據(jù)3 526 條。去除性別不明個體記錄63條(主要是F2代)、翅號重復的記錄18條和離群值記錄(3倍標準差之外)18條,剩余5 306條。系譜數(shù)據(jù)包含5 355 只雞。以SPSS 21.0 軟件分析世代、性別對體質量的影響,確定進入固定效應的因素。應用R軟件包ggplot2,以5周齡體質量為縱坐標、以世代為橫坐標、以分位數(shù)為邊界繪制箱線圖[13]。
資源群體遺傳組系數(shù)由R 軟件包nadiv 計算得出[14]。以加性遺傳效應為隨機效應,遺傳組系數(shù)、批次效應和性別效應為固定效應,蛋雞5 周齡體質量可寫作為:
式中:yi為第i只雞體質量,y=(y1,y2,…,ym);b0為斜率;b=(b1,b2,…,bn),為固定效應;ziT為指示矩陣;Zu為分子矩陣,其逆矩陣可以通過系譜直接計算得出;ui為加性遺傳效應;εi為殘差效應。
基于貝葉斯算法,蛋雞5周齡體質量可表達為:
WOMBAT:由澳大利亞新英格蘭大學學者Karin Meyer 負責開發(fā)維護,下載網(wǎng)址http://didgeridoo.une.edu.au/km/wmbdownload1.php,是著名軟件DFREML的繼任者。該軟件應用FORTRAN 語言編寫,專門用于估計高斯性狀遺傳參數(shù)及預測育種值[15]。WOMBAT 軟件采用REML 方法剖分方差組分,有多種算法供選擇,例如EM算法、AI算法、PX-EM算法。WOMBAT 軟件目前有windows 版本、linux 版本和MAC版本,其優(yōu)勢在于免費、運行速度快。本研究用WOMBAT軟件進行REML分析。
MCMCglmm:由英國愛丁堡大學Jarrod Hadfield基于R平臺開發(fā)的軟件包,于2009年供公眾免費使用[16]。從軟件名稱可以看出,該軟件應用馬爾科夫鏈-蒙特卡洛方法擬合廣義線性模型,多用于分析高斯性狀、泊松分布性狀,也可用于分析多項分布性狀和零膨脹泊松分布性狀。該軟件支持多性狀模型、隨機回歸模型以及Hurdle 模型,應用領域包括動物遺傳育種、系統(tǒng)進化以及薈萃分析。本研究用MCMCglmm軟件包進行貝葉斯MCMC分析。
AnimalINLA:由挪威科技大學Anna Marie Holand等基于R-INLA平臺開發(fā)的適用于動物模型的R 軟件包[7]。R-INLA 平臺是由挪威科技大學Rue、英國愛丁堡大學Lindgrey 等開發(fā)的應用積分嵌套拉普拉斯逼近方法進行貝葉斯計算的軟件包,用于流行病調查、動態(tài)性狀分析、基因表達雜合優(yōu)勢分析等[8]。AnimalINLA可用于分析高斯性狀,也可用于分析泊松分布性狀、二項分布性狀和零膨脹泊松分布性狀。本研究用AnimalINLA軟件包進行貝葉斯INLA分析。
白來航雞5 周齡公雞體質量平均值為268.08 g(變異系數(shù)為10.49%),母雞體質量平均值為236.76 g(變異系數(shù)為9.86%);東鄉(xiāng)綠殼蛋雞公雞體質量平均值為166.99 g(變異系數(shù)為16.38%),母雞體質量平均值為147.26 g(變異系數(shù)為16.34%);F1代公雞體質量平均值為272.52 g(變異系數(shù)為11.72%),母雞體質量平均值為241.89 g(變異系數(shù)為12.10%);F2代公雞體質量平均值為252.48 g(變異系數(shù)為13.56%),母雞體質量平均值為225.08 g(變異系數(shù)為12.62%)。白來航雞經(jīng)過系統(tǒng)選育,5周齡體質量均勻度好于同周齡的東鄉(xiāng)綠殼蛋雞。F2代蛋雞基因出現(xiàn)分離,而F1代蛋雞雖處于基因雜合狀態(tài),但基因不表現(xiàn)分離,因而F1代蛋雞體質量均勻度好于F2代蛋雞。各世代5 周齡體質量分位數(shù)分布見圖1。鑒于蛋雞資源群體親本、F1代與F2代5 周齡體質量平均值的差異有統(tǒng)計學意義(P<0.01),遺傳模型固定效應宜包含品種及批次效應。t檢驗結果表明,公雞體質量顯著高于同世代、同品種母雞(P<0.01),因此,動物模型固定效應宜包含性別因素。
圖1 東鄉(xiāng)綠殼蛋雞(DXBS)與白來航雞(WL)資源群體5周齡體質量箱線圖Fig.1 Boxplot on the body mass for Dongxiang blue-shelled layers (DXBS) crossbred with White Leghorn layers(WL)at the five-week-old age
蛋雞5 周齡體質量加性遺傳方差、殘差及遺傳力如表1 所示。為減少計算量,對數(shù)據(jù)標準化之后再進行方差組分剖分。3 種算法所得遺傳力相近,REML方法獲得的估計值置信度與貝葉斯方法的置信區(qū)間相符。蛋雞5周齡體質量遺傳力高于0.2,屬于中等偏高遺傳力。為進一步評價這3 種算法,用各軟件獲得的育種值進行Spearman 秩相關分析。由表2可知,INLA方法預測的育種值排序與REML方法預測的結果基本一致,而MCMC方法預測的育種值排序與其余2種方法預測的結果存在差異。
由于育種數(shù)據(jù)樣本量大,因而計算用時也是考量計算策略的重要指標。3種算法分別運行同一組數(shù)據(jù),計算機配置是Windows 7系統(tǒng)、英特爾i7處理器(3.50 GHz)、8G 內存。結果表明,REML 方法用時1 min,INLA方法用時8 min,MCMCglmm方法用時81 min。MCMCglmm 方法運行時間與迭代次數(shù)有關,為了完成蛋雞5 周齡體質量遺傳分析數(shù)據(jù)收斂,迭代次數(shù)設置為100萬次重復,每100次重復抽樣1 次,舍棄前5 萬次迭代重復。如圖2 所示:馬爾科夫鏈平均值為0.59,表明后驗分布達到穩(wěn)定狀態(tài),也表明數(shù)據(jù)分析已完成收斂;密度圖呈現(xiàn)單一光滑單峰,表明遺傳評估結果可靠。
表1 5周齡蛋雞體質量加性遺傳方差、殘差及遺傳力Table 1 Additive genetic variance, residual variance and heritability on body mass of the five-week-old layer
表2 REML、MCMC及INLA預測的育種值相關性分析Table 2 Correlation analysis on estimated breeding values with REML,MCMC and INLA approaches
圖2 5周齡蛋雞體質量遺傳力軌跡圖和密度圖Fig.2 Trace and density plots of heritability on body mass of the five-week-old layer
貝葉斯法由于數(shù)學性質優(yōu)越,在統(tǒng)計領域被廣泛應用。對于多層次模型,如畜禽遺傳評估中的動物模型,可選擇貝葉斯法或REML方法。先前已有學者比較了用這2 種方法處理動物模型的優(yōu)缺點[17]:REML方法優(yōu)勢在于計算用時短,貝葉斯法優(yōu)勢在于可以計算參數(shù)的誤差并且有校準點。本研究以真實的育種數(shù)據(jù)檢驗新近出現(xiàn)的INLA 方法、MCMC 方法及REML 方法,聚焦3 種算法在家禽遺傳評估中的應用性能。結果表明,蛋雞資源群體5周齡體質量遺傳力性狀屬于中等偏高遺傳力。INLA 方法與REML 方法獲得的遺傳參數(shù)相近,預測的育種值排序秩相關系數(shù)較高,表明這2 種方法等效。MANIATIS等在分析安偉捷公司肉雞體質量時得到近似結果,即INLA 和REML 方法準確度高于MCMC 方法[18]。然而,MATHEW 等應用REML、MCMC、INLA方法對春大麥、水稻農藝性狀進行遺傳評估時,未發(fā)現(xiàn)這3 種算法在準確度上存在明顯差異,只是MCMC方法計算用時較長[19]??紤]到數(shù)據(jù)結果及樣本量可能影響分析效率,幾組試驗結果不足以證明一種算法優(yōu)于另外一種算法。
雞早期體質量是家禽遺傳評估研究熱點。本研究表明,蛋雞5 周齡體質量遺傳力為0.49~0.59,表明該群體有足夠多的加性遺傳變異供早期體質量選擇。KAPELL等以動物模型對安偉捷公司4個肉雞品系5 周齡體質量的遺傳評估結果表明,其遺傳力分別為0.36、0.39、0.32、0.40,略低于本研究結果,但同屬于中等遺傳力[20]。GAYA 等以REML 算法評估了羅斯肉雞38日齡體質量,發(fā)現(xiàn)其遺傳力為0.40[21],本研究結果與此相近。前文提到的MANIATIS 等以ASReml 軟件評估5 周齡雞體質量時發(fā)現(xiàn),其遺傳力為0.21[12]。由于本研究所用試驗素材為F2分離群體,其基因庫蘊含豐富的遺傳變異資源,因而獲得的雞早期體質量遺傳力高于其他團隊研究結果。
本研究針對蛋雞資源群體5 周齡體質量性狀,應用REML、MCMC、INLA 3 種算法開展遺傳評估的結果表明:蛋雞早期體質量受世代、親代品種及遺傳組系數(shù)影響,動物模型宜考慮將這些因素納入固定效應,否則將影響遺傳力估值的準確性及育種值排序;蛋雞早期體質量屬于中等偏高遺傳力性狀,宜用個體選育獲取遺傳進展。3種算法相比較,MCMC方法雖然能給出遺傳參數(shù)估計值置信區(qū)間,但計算用時過長,結果準確性不如另外2 種算法;INLA方法與REML方法所得遺傳參數(shù)及育種值排序結果相近,但REML 方法計算用時較短??傊?,隨著計算機硬件發(fā)展及算法效率的提高,阻礙貝葉斯法在畜禽育種中應用的計算問題終將被克服,越來越多的畜禽遺傳評估工作將會使用貝葉斯法。