李旭靜,張配穎,錫建中,周 營,陳曉勇,王建濤,周榮艷*
(1.河北農(nóng)業(yè)大學(xué)動物科技學(xué)院,河北保定 071001;2.唐山市畜牧工作站,河北唐山 063000)
小尾寒羊是我國地方優(yōu)良品種,成年公羊體重為50~60 kg,成年母羊體重為24~35 kg,常年發(fā)情,全年均可配種,以雙羔為主,產(chǎn)羔率高達250%,是肥羔生產(chǎn)的理想母本品種。薩福克羊是肉用型綿羊培育品種,成年公羊體重為115~140 kg,成年母羊體重為70~96 kg,生長速度快,是世界肉羊生產(chǎn)中終端雜交的優(yōu)良父本。2個綿羊品種體形外貌和生產(chǎn)性能存在較大差異。在綿羊的馴化史上,自然選擇和人工選擇在對綿羊重要經(jīng)濟性狀表型進行選擇的同時,綿羊基因也受到了定向選擇,群體結(jié)構(gòu)發(fā)生了定向改變,經(jīng)長期選育形成了具有特定表型的品種。選擇信號是指在表型發(fā)生改變的同時基因組結(jié)構(gòu)也發(fā)生改變并留下選擇印記,對2個及以上群體進行選擇信號常用檢測方法為群體分化固定指數(shù)(Fst)法,F(xiàn)st值為與檢測群體所屬總?cè)后w相比亞群中雜合性的減少量,減少量越大,種群分化程度越大。Fst值能衡量多個群體之間的遺傳差異,其取值范圍為0~1,0表示種群間完全沒有分化,1則表示種群間完全隔離,F(xiàn)st值在0.25以上即表示群體間已經(jīng)產(chǎn)生極大的遺傳分化。Fst作為統(tǒng)計量最早由Wright提出,已廣泛用于畜禽方面的研究。本研究選擇9個小尾寒羊和9個薩??搜虻娜蚪M重測序數(shù)據(jù)進行選擇信號分析,利用群體分化指數(shù)Fst檢測2個群體間的遺傳分化程度,并結(jié)合基因功能和基因富集分析篩選與綿羊經(jīng)濟性狀相關(guān)的候選基因。
1.1 基因組比對與質(zhì)控 利用基因組比對軟件BWA的mem模式,將NCBI SRA數(shù)據(jù)庫中9個小尾寒羊樣本共156.603 Gb全基因組數(shù)據(jù)(SAAMN04306123、SAAMN04306124、SAAMN04306125、SAAMN043061 26、SAAMN04306127、SAAMN04306128、SAAMN0 4306129、SAAMN04306130、SAAMN04306131)和9個薩福克樣本共628.24 Gb全基因組數(shù)據(jù)(SAAMN052 16768、SAAMN05216769、SAAMN05216770、SAAM N05216771、SAAMN05216772、SAAMN05216773、S AAMN05216774、SAAMN05216775、SAAMN0521677 6)與參考綿羊基因組(Oar-v3.1)進行比對和質(zhì)量控制。
1.2 SNP變異檢測 在比對到參考基因組序列的基礎(chǔ)上,利用GATK中Haplotype Caller模式和joint calling方法進行群體SNP檢測。
1.3 群體遺傳分析 利用EIGENSOFT v6.0.1中的smartpca進行主成分分析(PCA),并作圖。利用PopLDdecay v1.29(https://github.com/BGI-shenzhen/PopLDdecay)計算連鎖不平衡(LD)平均系數(shù),并繪制LD衰減圖,進行連鎖不平衡分析。
1.4 群體固定指數(shù) 利用Weir等提出的方法計算群體固定指數(shù)(Fst)。利用Vcftools v0.1.14按100 KB窗口、50 KB步長進行劃窗,計算每個窗口內(nèi)的Fst,并 將Fst轉(zhuǎn) 化 為ZFst值,ZFst=(Fst-μFst)/Fst,結(jié)果用R v3.1.1(https://www.r-project.org/)繪圖。
1.5 受選擇基因分析 選取ZFst值top5%或ZFst值≥5為受選擇基因組區(qū)域,并進行基因注釋,結(jié)合GeneCards數(shù)據(jù)庫和參考文獻查閱基因功能,篩選與經(jīng)濟性狀相關(guān)的候選基因。
1.6 基因的富集分析 通過GO富集分析和KEGG通路分析對ZFst值top5%內(nèi)的目標(biāo)基因進行富集分析,KEGG通過超幾何檢驗找出目標(biāo)基因中與整個基因組背景相比顯著性富集的通路。
2.1 小尾寒羊和薩??搜蛉蚪M比對及SNP統(tǒng)計結(jié)果參考基因組的長度為2 534 335 866 bp,小尾寒羊過濾后的每個個體平均Reads數(shù)為138 098 147,平均比對堿基數(shù)為16 941 342 435 bp,平均比對率為97.358%,平均高質(zhì)量Reads率為92.328 %,平均測序深度為6.287,平均覆蓋度為98.071%;薩??搜蜻^濾后的每個個體平均Reads數(shù)為408 723 722,平均比對堿基數(shù)為56 583 284 595 bp,平均比對率為91.964%,平均高質(zhì)量Reads率為93.114%,平均測序深度為20.729,平均覆蓋度為99.286%。利用軟件GATK對2個群體樣本高質(zhì)量Reads進行分析,篩選出30 370 984個SNP變異位點,進行后續(xù)分析。
2.2 群體遺傳分析 主成分分析可將各亞群聚類,根據(jù)各亞群的差異程度推斷不同亞群間的進化關(guān)系。圖1為小尾寒羊和薩??搜驍?shù)據(jù)樣本的主成分分析圖,小尾寒羊和薩??搜虻臉颖靖髯跃奂谝黄穑o樣本間的交叉重疊,可進行下一步分析。連鎖不平衡分析可通過LD衰減(LD decay)速度推斷各亞群受選擇強度大小。LD衰減速度在2個不同亞群間有很大差異。薩??搜蛳鄬τ谛∥埠騆D衰減速度更慢(圖2),表明該群體遺傳多樣性較低。
圖1 主成分分析
圖2 LD衰減圖
2.3 選擇信號和富集分析結(jié)果 Fst代表一個種群內(nèi)亞群間的遺傳分化程度,F(xiàn)st值一般在0~1之間。Fst值越大,代表亞群間的遺傳分化越大。應(yīng)用軟件Vcftools v0.1.14對小尾寒羊和薩??搜騼扇后w的30 370 984個SNP變異位點進行Fst值計算,將Fst值轉(zhuǎn)化為ZFst,獲得全基因組選擇信號分析圖(圖3),并設(shè)置閾值線為ZFst值的top5%,共有391個受選擇區(qū)域大于此閾值,經(jīng)過GO富集進行基因功能注釋,只在分子功能顯著富集,所包含的基因為,這些基因與G蛋白偶聯(lián)嘌呤能核苷酸受體活性和G蛋白偶聯(lián)核苷酸受體活性有關(guān)(<0.01);KEGG通路分析顯示,受選擇基因顯著富集在嗅覺傳導(dǎo)、花生四烯酸代謝和系統(tǒng)性紅斑狼瘡?fù)罚?0.01)。另一方面,由于受選擇基因較多,提高篩選條件,篩選ZFst值大于5的選擇信號區(qū)域,共篩選出51個區(qū)域,包含89個基因,經(jīng)過數(shù)據(jù)庫和文獻查閱,其中46個基因與生長發(fā)育、疾病和抗病、適應(yīng)性、乳品質(zhì)、生殖、毛和被毛顏色性狀有關(guān)。和基因是與生長發(fā)育相關(guān)的候選基因,和基因是與綿羊乳腺炎有關(guān)的候選基因。和基因與家畜的多發(fā)性疾病有關(guān),和基因為免疫相關(guān)候選基因。和基因是適應(yīng)環(huán)境相關(guān)的候選基因。和基因是與乳品質(zhì)相關(guān)的候選基因。和基因與生殖有關(guān)。和基因與羊毛品質(zhì)和被毛顏色性狀相關(guān)。
圖3 小尾寒羊和薩??巳蚪M選擇信號分析圖
小尾寒羊和薩福克羊體形外貌和生產(chǎn)性狀存在明顯差異,常用于雜交利用以生產(chǎn)羔羊。本研究通過對小尾寒羊和薩??搜蜻M行選擇信號檢測,篩選小尾寒羊和薩??搜蚪?jīng)濟性狀有關(guān)的候選基因,對ZFst大于5的受選擇區(qū)域進行分析,篩選出46個基因與生長發(fā)育、疾病和抗病、適應(yīng)性、乳品質(zhì)、生殖、毛和被毛顏色性狀有關(guān)。
生長性狀是綿羊重要經(jīng)濟性狀,篩選出和基因是生長發(fā)育相關(guān)的候選基因?;虼嘏c肉羊體型、脂肪沉積、肌肉發(fā)育相關(guān)。c.343A>G SNP與豬肌肉緊實度顯著相關(guān)。rs42417924與牛飼料轉(zhuǎn)化效率相關(guān),并用于肉牛飼料效率的小型SNP芯片的開發(fā)和驗證標(biāo)記。1號染色體QTL與蘇格蘭黑臉羔羊胴體性狀顯著相關(guān),而為唯一位于此區(qū)域的候選基因,其與細(xì)胞的生長和分化有關(guān)?;虻牡鞍桩a(chǎn)物是的磷酸酶,可降解可通過CX43蛋白表達誘導(dǎo)成肌細(xì)胞分化,可通過調(diào)節(jié)在體內(nèi)的含量,調(diào)節(jié)成肌細(xì)胞分化。
乳腺炎的發(fā)生在很大程度上降低了奶品質(zhì)。和基因是與綿羊乳腺炎有關(guān)的候選基因。和為奶綿羊天然的乳腺炎免疫候選基因。在Lacaune綿羊群體中,3個與乳腺炎性狀顯著相關(guān)的SNP位于3號染色體上QTL的狹窄區(qū)域,2個最重要的突變位點位于基因(R96C非同義)和基因(內(nèi)含子),與乳腺炎的抵抗力降低有關(guān)。脂多糖誘導(dǎo)的和基因在綿羊的乳體細(xì)胞中差異表達。
疾病影響綿羊健康,造成畜產(chǎn)品低產(chǎn)。和基因與家畜多發(fā)性疾病有關(guān)。編碼一個110 kD的跨膜糖蛋白,在人類單核細(xì)胞和組織巨噬細(xì)胞中高表達,和與綿羊抗炎及炎癥反應(yīng)有關(guān)。的移碼突變與紅奶牛家族性多發(fā)性關(guān)節(jié)彎曲病有關(guān)。的等位基因變異決定了T淋巴細(xì)胞對馬動脈炎病毒感染的易感性。很有可能與綿羊藍舌病病毒感染有關(guān)。在NF-kappa B信號通路介導(dǎo)的布魯氏菌病中起保護作用,可作為治療布魯氏菌病的一個治療靶點??赡苁巧窖虻挚谷橄傺缀臀改c道寄生蟲感染的潛在遺傳標(biāo)記。此外,和與疾病相關(guān)。相關(guān)的疾病包括基底神經(jīng)節(jié)疾病和Wolf-Hirschhorn綜合征。是一種蛋白質(zhì)編碼基因,與相關(guān)的疾病包括猩紅熱。是定位在緊密連接處的細(xì)胞粘附分子,許多在腸道中表達。(-/-)小鼠顯示有嚴(yán)重的腸道缺陷,包括粘膜潰瘍、上皮細(xì)胞脫落和炎癥。
免疫是一種生理功能,能抵抗微生物或寄生物的感染,防止病原體的入侵,維持動物機體的健康。和基因為免疫相關(guān)候選基因。在抗原呈遞細(xì)胞中表達,并定位于免疫突觸,參與主要組織相容性復(fù)合體II類信號轉(zhuǎn)導(dǎo)和免疫突觸的形成?;虻南嚓P(guān)途徑包括先天免疫系統(tǒng)和I類MHC介導(dǎo)的抗原加工遞呈,基因與牛羊免疫應(yīng)答和免疫調(diào)節(jié)相關(guān)。損傷可導(dǎo)致多種疾病,包括單基因常染色體顯性超免疫球蛋白E綜合征,控制了的表達,從而調(diào)控免疫功能?;蛲ㄟ^調(diào)節(jié)核因子B的活化在自身免疫和組織穩(wěn)態(tài)中起作用?;蚴蔷幋a脂氧合酶家族的一種蛋白質(zhì),已被證明發(fā)揮調(diào)節(jié)炎癥和免疫的作用。
動物快速適應(yīng)環(huán)境變化能力對其生存及生產(chǎn)性能非常重要。和基因是適應(yīng)環(huán)境相關(guān)的候選基因。編碼一種完整的膜蛋白,負(fù)責(zé)建立和維持Na和K在細(xì)胞膜上的電化學(xué)梯度,當(dāng)動物暴露在環(huán)境壓力下時,ATP1B2蛋白質(zhì)會優(yōu)先表達。變異位點是中國荷斯坦奶牛耐熱性狀的遺傳標(biāo)記。EVI5為與環(huán)境適應(yīng)性有關(guān)的強信號候選基因。屬于谷胱甘肽過氧化物酶家族,負(fù)責(zé)過氧化氫的解毒,位于花生四烯酸代謝途徑,能將花生四烯酸轉(zhuǎn)化為,1有效地擴張了腎小球血管并刺激了水的重吸收。此外,綿羊和人體組織中在腎臟和腎皮質(zhì)中的表達水平顯著增高,意味著可能在沙漠環(huán)境適應(yīng)中發(fā)揮核心作用。與高原環(huán)境有關(guān),位于經(jīng)典的缺氧誘導(dǎo)因子(HIF-1)途徑,該途徑在調(diào)節(jié)細(xì)胞對缺氧的反應(yīng)中發(fā)揮核心作用。
和基因是乳品質(zhì)相關(guān)候選基因。乳脂小球膜蛋白(MFGM)的組成是衡量乳營養(yǎng)品質(zhì)的重要指標(biāo),屬于MFGM蛋白,研究發(fā)現(xiàn)包含在內(nèi)的一些MFGM蛋白在驢的成熟乳中均有高表達或特異表達,參與內(nèi)吞作用,與驢的乳品質(zhì)有關(guān)。位于基因下游19:26 780 952的SNP與牛奶中脂肪和蛋白質(zhì)顯著相關(guān)。與奶牛產(chǎn)奶量、脂肪和蛋白質(zhì)百分比顯著相關(guān)。與牛乳脂率相關(guān),基因與新西蘭山羊的奶產(chǎn)量、脂肪、蛋白質(zhì)和體細(xì)胞評分顯著相關(guān)。位于與北歐荷斯坦牛的產(chǎn)乳量和產(chǎn)脂量2個性狀的重疊QTL內(nèi),表明可能同時與奶牛的產(chǎn)乳量和乳脂量有關(guān)。
綿羊繁殖率的高低直接關(guān)系到養(yǎng)羊經(jīng)濟效益,是制約綿羊產(chǎn)業(yè)發(fā)展的重要因素。和基因與生殖有關(guān)。和在睪丸中廣泛表達?;蚺c俄羅斯綿羊繁殖性狀有關(guān)。SHBG是一種雄激素轉(zhuǎn)運體,通過控制血漿中類固醇激素濃度來發(fā)揮作用,缺乏的MH1單倍型與奶牛生育能力喪失可能存在聯(lián)系。是一種精子形成必需的蛋白質(zhì),由睪丸特異性基因編碼,僅在發(fā)育中的精子細(xì)胞中表達?;蜃儺惻c牛雄性生殖性能有關(guān)。和中的突變導(dǎo)致隱性無精子癥。作為轉(zhuǎn)錄因子協(xié)同激活雌激素受體反應(yīng)的基因轉(zhuǎn)錄,其表達由雌激素受體家族的2個成員調(diào)節(jié)。
羊毛品質(zhì)和被毛顏色是重要的經(jīng)濟性狀。和基因與羊毛和被毛顏色性狀相關(guān)。參與動物角化細(xì)胞終末分化過程中表皮脂質(zhì)重組中的鞘脂、甘油磷脂、膽固醇和脂肪酸的轉(zhuǎn)運,影響羊毛品質(zhì)。外根鞘過表達與過表達產(chǎn)生的短毛表型相似,支持了和可能通過同一途徑調(diào)控毛發(fā)生長的假設(shè)。和在信號系統(tǒng)中發(fā)揮作用,控制皮膚中的毛囊形態(tài)形成和干細(xì)胞分化,是羊駝纖維生長和纖維顏色的候選基因。是與巴基斯坦山羊毛色有關(guān)的候選基因。一項全基因組關(guān)聯(lián)分析中,伊朗Markhoz山羊13號染色體上的基因與黑色和棕色被毛的顏色顯著相關(guān),并且在基因中發(fā)現(xiàn)了僅存在于黑色動物中的SNP,基因的一個16 bp的重復(fù)區(qū)(g.1875_1890dup CCCCAGGTCAGAGTTT)是與巴塞特獵犬和彭布羅克威爾士柯基犬馬鞍棕色和黑底褐斑色表型相關(guān)。
本研究對小尾寒羊和薩??搜蚋?個全基因組數(shù)據(jù)進行全基因組選擇信號檢測,篩選到ZFst值大于5的選擇信號區(qū)域有51個,包含89個候選基因,其中46個基因與生長發(fā)育、疾病和抗病、適應(yīng)性、乳品質(zhì)、生殖、毛和被毛顏色等性狀有關(guān),也為綿羊經(jīng)濟性狀形成的遺傳基礎(chǔ)研究提供參考。