劉正喜,武 斌,胡明月,白春艷,趙中利,曹 陽,馬惠海*,閆守慶* (.吉林大學(xué) 動(dòng)物科學(xué)學(xué)院,吉林 長春 3006;.吉林省農(nóng)業(yè)科學(xué)院 畜牧獸醫(yī)研究所,吉林 公主嶺 3600)
單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是指在DNA水平上因單個(gè)核苷酸的替換、插入或缺失導(dǎo)致的核酸序列多態(tài)性[1]。插入/缺失多態(tài)性(insertion/deletion,InDel)是指基因組中某個(gè)等位基因座位上因插入或缺失了小片段 DNA所產(chǎn)生的多態(tài)性[2]。與其他種類的分子遺傳標(biāo)記相比,SNP和InDel標(biāo)記具有在基因組中分布廣泛、穩(wěn)定性好和檢測易自動(dòng)化和規(guī)?;葍?yōu)勢。隨著2代測序技術(shù)的快速發(fā)展和測序價(jià)格的下降,SNP和InDel分子標(biāo)記已在大量非模式生物中被廣泛挖掘,并廣泛應(yīng)用于遺傳圖譜構(gòu)建[3]、重要經(jīng)濟(jì)性狀主效基因定位[4-5]、種屬鑒定[6]、個(gè)體識(shí)別[7]、生物群體遺傳結(jié)構(gòu)以及系統(tǒng)發(fā)育分析等方面[8-9]。
綿羊?qū)俣唇强?Bovidae)綿羊?qū)?Ovis)動(dòng)物,是人類最早被馴化的家養(yǎng)動(dòng)物之一,可為人類提供食物和附屬品(肉、毛、皮和奶等)[10]。近年來,國內(nèi)羊肉產(chǎn)品消費(fèi)需求急劇增長,但是目前在我國肉羊產(chǎn)業(yè)發(fā)展中,引進(jìn)品種的繁殖力低和地方品種的生長速度慢是制約肉羊生產(chǎn)的兩個(gè)主要問題,因此生長速度快且繁殖力高的肉用綿羊新品種或品系的培育勢在必行[11]。
雙乾肉羊是吉林省農(nóng)業(yè)科學(xué)院利用杜泊羊?yàn)楦副?、吉林省本地綿羊?yàn)槟副?,通過雜交、回交以及橫交固定等常規(guī)育種手段結(jié)合分子標(biāo)記輔助選擇方法,選育出的具有采食性好、生長速度快和產(chǎn)仔數(shù)高等種質(zhì)特性的肉用羊新種群。雙乾肉羊群體中有黑頭、紅頭和白頭3種毛色類型,雜交試驗(yàn)表明不同毛色表型均可穩(wěn)定遺傳。
本研究以紅頭和黑頭雙乾肉羊?yàn)樵囼?yàn)動(dòng)物,基于基因組重測序技術(shù),檢測紅頭和黑頭雙乾肉用綿羊全基因組SNP/InDel標(biāo)記數(shù)量和染色體分布,然后基于SNP/InDel做選擇信號分析,鑒定影響雙乾肉羊毛色的候選基因及因果突變,研究結(jié)果可為解析雙乾肉羊種質(zhì)特性以及品種選育提供分子標(biāo)記和理論依據(jù)。
1.1 試驗(yàn)材料本試驗(yàn)中52只黑頭和60只紅頭雙乾肉羊抗凝血樣本采自吉林省乾安肉羊有限責(zé)任公司,使用EDTA-K2抗凝,搖勻后送至實(shí)驗(yàn)室-20℃ 保存?zhèn)溆谩?/p>
1.2 主要試劑血液基因組DNA提取試劑盒(EasyPure?Blood Genomic DNA Kit)購自北京全式金生物技術(shù)有限公司;2×Taq PCR Mastermix、DL2000 DNA Marker和瓊脂糖凝膠DNA回收試劑盒購自天根生化科技(北京)有限公司;其他試劑均為國產(chǎn)或進(jìn)口分析純。
1.3 DNA提取、文庫構(gòu)建及測序采用血液DNA提取試劑盒提取基因組DNA,1%瓊脂糖凝膠電泳檢測DNA的完整性,NanoDrop 2000超微量分光光度計(jì)檢測DNA的濃度和純度。將檢測合格樣品用于構(gòu)建DNA小片段文庫,文庫質(zhì)檢合格后,使用Illumina PE150測序平臺(tái)進(jìn)行高通量測序,測序深度約12倍。建庫及測序工作委托北京安諾優(yōu)達(dá)基因科技有限公司完成。
1.4 原始數(shù)據(jù)過濾測序原始圖像數(shù)據(jù)文件經(jīng) CASAVA堿基識(shí)別形成原始數(shù)據(jù)(Raw Data),對Raw Data進(jìn)行質(zhì)控分析、堿基質(zhì)量分布分析、測序數(shù)據(jù)過濾后獲得高質(zhì)量數(shù)據(jù)(Clean Data)。數(shù)據(jù)過濾主要包括去除接頭污染、低質(zhì)量以及N比例大于5%的reads。
1.5 全基因組SNP和InDel變異檢測采用BWA(v0.7.15)軟件將Clean Data比對到綿羊參考基因組上(Oar_rambouillet_v1.0)[12],然后通過Picard(v2.21.2)軟件進(jìn)行對比,對結(jié)果進(jìn)行排序和標(biāo)記重復(fù)處理,最后用GATK(v4.1.4.0)軟件進(jìn)行SNP和InDel檢測[13]。通過該軟件的SelectVariants功能篩選出高質(zhì)量的變異位點(diǎn),過濾標(biāo)準(zhǔn)參考其官網(wǎng)推薦閾值,并利用R軟件包CMplot繪制SNP密度分布圖。
1.6 選擇信號分析采用VCFtools[14]軟件,以50 kb 作為滑動(dòng)窗口,25 kb作為滑動(dòng)步長,計(jì)算紅頭和黑頭雙乾肉羊之間的群體分化指數(shù)FST;將分布在前1%窗口的FST值對應(yīng)的窗口定義為受選擇區(qū)域,使用SnpEff(v5.0)軟件對受選擇區(qū)域進(jìn)行基因注釋[15],從而篩選毛色相關(guān)基因,并利用重測序數(shù)據(jù)分析候選基因的多態(tài)性。
1.7 MC1R基因多態(tài)性與毛色的相關(guān)性分析根據(jù)NCBI數(shù)據(jù)庫中綿羊MC1R基因序列(NC_040265.1),采用Primer Primier 5.0軟件設(shè)計(jì)引物(MC1R-F:5′-AGGGCGGAAGAGCGACACTGC-3′;MC1R-R:5′-GATGGCACCCAGGAAGCAGA-3′),引物由生工生物工程(上海)股份有限公司合成。采用PCR產(chǎn)物直接測序的方法分別對46只黑頭和54只紅頭雙乾肉羊的MC1R基因編碼區(qū)內(nèi)2個(gè)錯(cuò)義突變位點(diǎn)進(jìn)行基因分型。PCR 擴(kuò)增反應(yīng)體系20 μL:2× PCR Master Mix 10 μL,DNA 模板1 μL,正向和反向引物(10 μmol/L)各0.5 μL, ddH2O 8 μL。PCR擴(kuò)增條件:95℃預(yù)變性2 min;94℃變性30 s,60℃退火30 s,72℃延伸90 s,共30個(gè)循環(huán);72℃延伸2 min。PCR產(chǎn)物送生工生物工程(上海)股份有限公司測序,采用Chromas和Haploview軟件確定樣品2個(gè)SNP位點(diǎn)的基因型和單倍型。
2.1 測序數(shù)據(jù)統(tǒng)計(jì)及比對通過對6只紅頭和6只黑頭雙乾肉羊進(jìn)行全基因組重測序,紅頭雙乾肉羊命名為RSQ-1~6,黑頭雙乾肉羊命名為BSQ-1~6,共獲得Raw Data 430.15 G,平均測序深度約為12倍,各樣本堿基數(shù)量在29.85~45.42 G,reads數(shù)在198.97~302.78 M;經(jīng)過過濾獲得Clean Data 424.73 G,占原始數(shù)據(jù)98.74%,所有樣品Q30均大于93.19%。將Clean Data同參考基因組進(jìn)行比對,結(jié)果表明,各樣本的比對率最低為99.88%,最高為99.91%,平均比對率為99.90%。
2.2 全基因組SNP和InDel變異檢測基于GATK軟件對12只雙乾肉羊全基因組范圍內(nèi)的SNP和長度小于或等于60 bp的InDel進(jìn)行檢測和過濾后,共鑒定了32 338 805個(gè)高質(zhì)量變異位點(diǎn),平均每kb的變異位點(diǎn)數(shù)量為11.51個(gè)。變異位點(diǎn)以SNP為主,共計(jì)27 877 089個(gè),其在基因組中的平均密度為9.92 SNP/kb(圖1),包含錯(cuò)義突變 120 895 個(gè),無義突變1 305個(gè);另外有同義突變206 743 個(gè);SNP主要以轉(zhuǎn)換為主,轉(zhuǎn)換類型以A/G型最多,顛換類型中以G/T型最多。堿基轉(zhuǎn)換的發(fā)生頻率是堿基顛換的2.45倍。本試驗(yàn)獲得InDel位點(diǎn)4 461 716個(gè), InDel長度以1 bp 和2 bp 為主,3~10 bp 的InDel 1 415 519個(gè)。不同染色體上的 SNP/InDel 出現(xiàn)頻率不同,20號染色體頻率最高,平均每kb包含13.95個(gè),X染色體頻率最低,平均每 kb僅為7.72個(gè)。
注:橫坐標(biāo)代表染色體的物理位置,窗口大小為1 Mbp;縱坐標(biāo)代表染色體;綠色代表SNP密度小的區(qū)域;紅色代表SNP密度高的區(qū)域圖1 各染色體SNP密度分布圖
2.3 全基因組選擇信號檢測按照Holsinger和Weir的統(tǒng)計(jì)方法檢測紅頭和黑頭雙乾肉羊全基因組變異序列的FST值[16],F(xiàn)ST值越大表明不同群體間遺傳分化程度越大。將1 124個(gè)分布在前1%的FST值對應(yīng)的窗口確定為受選擇區(qū)域(圖2),通過SnpEff軟件在受選擇區(qū)域內(nèi)共注釋到1 977個(gè)基因,其中在兩種毛色雙乾肉羊群體中分化程度最高的毛色相關(guān)基因?yàn)镸C1R。進(jìn)一步分析測序數(shù)據(jù),在MC1R基因編碼區(qū)發(fā)現(xiàn)了5個(gè)SNP,即c.218 T>A、c.361 G>A、c.429 C>T、c.600 T>G 和c.735C>T,其中c.218 T>A及c.361 G>A為錯(cuò)義突變,c.218T>A造成第73位氨基酸由蛋氨酸變?yōu)橘嚢彼?c.361G>A導(dǎo)致其翻譯的氨基酸由天冬氨酸變?yōu)樘於0?,其?個(gè)SNP位點(diǎn)均為同義突變。12個(gè)測序樣本的5個(gè)SNP位點(diǎn)基因型結(jié)果見表1。
注:橫坐標(biāo)為染色體號;縱坐標(biāo)為FST 值圖2 紅頭和黑頭雙乾肉羊全基因組水平上的FST選擇信號分布
表1 重測序個(gè)體MC1R基因5個(gè)SNP位點(diǎn)的基因型
2.4 群體基因分型與相關(guān)性分析以MC1R-F和MC1R-R為引物進(jìn)行PCR擴(kuò)增,獲得了與預(yù)期大小相符的584 bp目的條帶,對46只黑頭雙乾肉羊和54只紅頭雙乾肉羊進(jìn)行c.218 T>A和c.361 G>A 2個(gè)錯(cuò)義突變位點(diǎn)基因分型。PCR產(chǎn)物測序結(jié)果表明,2個(gè)SNP位點(diǎn)均存在3種基因型(圖3)。在c.218 T>A位點(diǎn),46只黑頭羊中,35只為AA基因型,11只為AT基因型,而所有的54只紅頭羊的基因型均為TT;在c.361 G>A位點(diǎn),46只黑頭羊中,35只為AA基因型,11只為AG基因型,而所有的54只紅頭羊均為GG基因型;單倍型分析結(jié)果表明2個(gè)錯(cuò)義突變位點(diǎn)完全連鎖,有TG和AA 2種單倍型,單倍型TG頻率為59.5%,單倍型AA頻率為40.5%。以上結(jié)果表明,2個(gè)錯(cuò)義突變與雙乾肉羊黑頭性狀完全相關(guān),且黑毛色表型對紅毛色表型為顯性。
圖3 MC1R基因c.218 T>A和c.361 G>A 多態(tài)性位點(diǎn)測序峰圖
畜禽重要經(jīng)濟(jì)性狀主效基因的精細(xì)定位以及因果突變的解析是當(dāng)代動(dòng)物遺傳育種的重要任務(wù)之一。在2代測序技術(shù)出現(xiàn)之前,主效基因定位主要采用RFLP、RAPD和SSR等分子標(biāo)記,但由于受到標(biāo)記數(shù)量的限制,主效基因定位耗時(shí)長、費(fèi)用高,且難以精細(xì)定位[17]。近年來,由于2代基因組測序技術(shù)具有高通量、快速和高效等特點(diǎn),已被廣泛應(yīng)用于動(dòng)物全基因組范圍內(nèi)SNP和InDel標(biāo)記的篩選與鑒定[18-19]。JIANG等[5]對8頭荷斯坦公牛進(jìn)行全基因組重測序,共獲得插入或缺失長度為1~49 bp 的InDel標(biāo)記912 302 個(gè),每個(gè)個(gè)體的標(biāo)記數(shù)量范圍為323 490~411 070。SABAHAT等[8]對2個(gè)巴基斯坦駱駝品種的103個(gè)個(gè)體進(jìn)行簡化基因組測序,篩選獲得了63 619個(gè)SNP,然后基于這些標(biāo)記對2個(gè)品種的群體遺傳結(jié)構(gòu)及品種間遺傳關(guān)系進(jìn)化了系統(tǒng)分析。雙乾肉羊是利用生長速度快且肉品質(zhì)好的杜泊羊與抗寒能力強(qiáng)且產(chǎn)仔數(shù)高的本地綿羊雜交選育而成的肉用綿羊新種群,目前其種群內(nèi)的遺傳結(jié)構(gòu)以及優(yōu)良種質(zhì)特性的遺傳基礎(chǔ)并不清楚。因此,本試驗(yàn)基于重測序技術(shù)對12只紅頭和黑頭雙乾肉羊全基因組水平上的SNP和InDel標(biāo)記進(jìn)行了篩選,分別獲得了27 877 089個(gè)SNP和4 461 716個(gè)InDel多態(tài)性標(biāo)記,為該種群遺傳多樣性以及選擇信號分析提供了豐富的遺傳標(biāo)記。
動(dòng)物毛色通常是一個(gè)品種或物種的重要特征,可作為形態(tài)學(xué)標(biāo)記進(jìn)行物種或品種純度的鑒別,同時(shí),毛色的差異也會(huì)對動(dòng)物的生長速度、生產(chǎn)性能以及疾病的抵抗力具有一定的影響,因此對動(dòng)物毛色多樣性的形成與調(diào)控機(jī)制的研究具有重要理論和實(shí)踐意義[20]。目前基于全基因組SNP/InDel的FST選擇信號檢測策略被廣泛應(yīng)用于家畜重要經(jīng)濟(jì)性狀相關(guān)候選基因和因果突變位點(diǎn)的篩選與鑒定。ZHOU等[21]基于76只有色羽鴨和30只北京鴨的基因組重測序數(shù)據(jù)做全基因組關(guān)聯(lián)分析,結(jié)果表明MITF基因所在染色體區(qū)域具有較強(qiáng)的選擇信號,通過比較北京鴨和鵝的基因組發(fā)現(xiàn)在MITF的外顯子1M和外顯子2之間存在約6.6 kb的缺失,該缺失與北京鴨的白毛色完全相關(guān)。HENKEl等[22]對1匹斑點(diǎn)馬的基因組進(jìn)行了約19倍深度的重測序,然后對5個(gè)斑點(diǎn)候選基因進(jìn)行結(jié)構(gòu)性變異檢測,結(jié)果表明MITF基因外顯子6~9區(qū)間約63 kb的大片段缺失與其斑點(diǎn)毛色以及聽力喪失有關(guān)。雙乾肉羊群體中有3種毛色類型,即紅頭、黑頭和白頭,紅頭和黑頭表型個(gè)體雜交試驗(yàn)表明黑色對紅色為顯性,毛色表型與生產(chǎn)性能的關(guān)系目前還并不清楚。本試驗(yàn)基于重測序獲得的雙乾肉羊SNP和InDel標(biāo)記,計(jì)算紅頭和黑頭2個(gè)群體之間的FST值,獲得了1 124個(gè)選擇區(qū)域,其中哺乳動(dòng)物毛色調(diào)控主效基因MC1R位于14號染色體的其中1個(gè)選擇區(qū)域內(nèi)。
MC1R基因編碼黑素皮質(zhì)激素受體1(melanocortin receptor 1),該受體是最小的G蛋白偶聯(lián)受體,具有7個(gè)跨膜結(jié)構(gòu)域[23]。黑素皮質(zhì)激素受體1與黑色素細(xì)胞刺激激素α(α-MSH)結(jié)合,然后激活膜上的腺苷酸環(huán)化酶系統(tǒng),通過環(huán)磷酸腺苷激活酪氨酸激酶催化細(xì)胞內(nèi)的黑色素合成[24]。黑素皮質(zhì)激素受體1在動(dòng)物毛色形成與調(diào)控中具有重要的作用,研究表明MC1R基因多態(tài)性與多種動(dòng)物毛色多樣性相關(guān)[25]。賴偉寧等[26]采用候選基因法對野生型和黃毛色豚鼠MC1R基因進(jìn)行PCR擴(kuò)增與測序,發(fā)現(xiàn)該基因存在2 760 bp缺失多態(tài)性,群體基因分型結(jié)果表明黃色豚鼠均為缺失純合子,而野生型豚鼠基因型為野生型純合子或缺失雜合子,從而推測該基因的缺失與豚鼠的隱性黃毛色有關(guān)。本試驗(yàn)基于FST值的選擇信號將與雙乾肉羊毛色相關(guān)的候選基因定位到MC1R基因上,依據(jù)重測序數(shù)據(jù)發(fā)現(xiàn)在該基因的編碼區(qū)內(nèi)存在5個(gè)SNP位點(diǎn),其中2個(gè)為錯(cuò)義突變,3個(gè)為同義突變。對2個(gè)錯(cuò)義突變位點(diǎn)進(jìn)行PCR擴(kuò)增,對產(chǎn)物直接測序并進(jìn)行群體基因分型,結(jié)果表明所有紅頭毛色個(gè)體2個(gè)位點(diǎn)均為野生型等位基因純合子,而黑頭個(gè)體為突變型等位基因純合子或雜合子,表明2個(gè)錯(cuò)義突變與黑頭雙乾肉羊毛色相關(guān),且黑色對紅色為完全顯性。
本研究利用高通量重測序技術(shù)在12只雙乾肉羊全基因組水平上共獲得了27 877 089個(gè)SNPs和4 461 716個(gè)InDel 多態(tài)性標(biāo)記;基于FST的選擇信號以及群體基因分型確定了MC1R為紅頭和黑頭雙乾肉羊毛色表型的候選基因以及該基因編碼區(qū)內(nèi)的2個(gè)錯(cuò)義突變與雙乾肉羊黑毛色完全相關(guān)。本研究為雙乾肉羊種質(zhì)特性的遺傳基礎(chǔ)研究以及分子標(biāo)記輔助選擇育種提供了科學(xué)依據(jù)。