劉繼強(qiáng),郝曉東,武麗娜,廖詩瑩,馮羿方,彌世榮,劉 燊,劉 建,張龍超
(1.北京康普森農(nóng)業(yè)科技有限公司,北京 102200;2.江西正邦養(yǎng)殖有限公司,南昌 330096; 3.中國(guó)農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所,北京 100193)
雖然我國(guó)畜禽品種資源非常豐富,但本土種質(zhì)資源的開發(fā)利用率一直偏低。因此,開展遺傳資源基因組水平上的開發(fā)和利用是現(xiàn)代畜禽遺傳改良的重要方向之一。分子標(biāo)記的相關(guān)研究持續(xù)發(fā)展,最初的研究主要集中于限制性片段長(zhǎng)度多態(tài)性(restriction fragment length polymorphism,RFLP)和短串聯(lián)重復(fù)序列(short tandem repeat,STR)兩種遺傳標(biāo)記。直到1996年,Lander[1]在科學(xué)雜志上正式提及到人類基因組中的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP),使得基因組學(xué)的研究發(fā)展到新的水平,SNP也被公認(rèn)為是第三代遺傳標(biāo)記。SNP分型技術(shù)歷經(jīng)了從低通量分型的凝膠電泳到目前應(yīng)用廣泛的高通量分型的發(fā)展過程。測(cè)序法是獲得SNP分型最直接的方法,Sanger測(cè)序是最早應(yīng)用的SNP分型檢測(cè)技術(shù),也是目前DNA測(cè)序的金標(biāo)準(zhǔn)。1991年Affymetrix合成了首張寡核苷酸的基因芯片,基因芯片成為SNP分型檢測(cè)的主要方法。到目前為止,SNP標(biāo)記的分型檢測(cè)已經(jīng)發(fā)展到高通量的第二代測(cè)序技術(shù)和第三代測(cè)序技術(shù)。隨著基因芯片、高通量測(cè)序和組學(xué)大數(shù)據(jù)技術(shù)的突飛猛進(jìn),SNP標(biāo)記的分型檢測(cè)成本已大幅降低,從而帶動(dòng)了畜禽育種由傳統(tǒng)的BLUP法向全基因組選擇育種發(fā)展的浪潮。全基因組SNP分型技術(shù)的出現(xiàn)是基因組選擇技術(shù)從理論研究到實(shí)際應(yīng)用的關(guān)鍵。當(dāng)前,基因組選擇技術(shù)為畜禽育種帶來了革命性的變化,不僅使育種效率大幅度提高,還能實(shí)現(xiàn)育種企業(yè)的早期選擇,提升企業(yè)的降本增效能力。所以該項(xiàng)技術(shù)已經(jīng)成為國(guó)際畜禽育種領(lǐng)域研究和競(jìng)爭(zhēng)的熱點(diǎn)[2]。
準(zhǔn)確高效的SNP分型是畜禽基因組研究和育種應(yīng)用的關(guān)鍵,SNP作為第三代分子標(biāo)記,具有數(shù)量多、分布廣、遺傳穩(wěn)定等特點(diǎn),在全基因組關(guān)聯(lián)分析、地方資源遺傳背景分析、基因組選擇信號(hào)等方向廣泛應(yīng)用。全基因組SNP分型技術(shù)以SNP芯片技術(shù)和基于二代測(cè)序的SNP分型技術(shù)為主。本文概述了全基因組SNP分型技術(shù)的原理、分型技術(shù)在全基因組關(guān)聯(lián)分析、選擇信號(hào)和畜禽遺傳資源背景分析等基礎(chǔ)研究和畜禽遺傳育種中的應(yīng)用,以期為畜禽基因組的研究和育種應(yīng)用提供借鑒和參考。
基因芯片(gene chip),又稱為DNA 芯片、生物芯片或DNA微陣列等,是將大量的探針分子(一般是指DNA片段)有規(guī)律地排列和固化于固相支持物上,構(gòu)成一個(gè)二維DNA探針陣列。根據(jù)研究方向不同,基因芯片可以分為SNP基因芯片、比較基因組雜交基因芯片、表達(dá)譜基因芯片、DNA甲基化基因芯片和染色質(zhì)免疫共沉淀芯片等[3]。在畜禽育種領(lǐng)域,50K以上的中高密度SNP基因芯片應(yīng)用較為廣泛,主要由Illumina公司的Infinium芯片技術(shù)平臺(tái)和Thermo Fisher 公司的Axiom芯片技術(shù)平臺(tái)定制生產(chǎn)。這兩大芯片平臺(tái)雖然在分型原理上相同,都是利用紅、綠熒光蛋白及激光發(fā)光基團(tuán)來進(jìn)行SNP的分型,但是在芯片的設(shè)計(jì)方面有很大的區(qū)別。Illumina芯片是光纖微珠技術(shù),其優(yōu)點(diǎn)是探針長(zhǎng)度50 bp,針對(duì)單個(gè)SNP有15~30次重復(fù)設(shè)計(jì),微珠能100%質(zhì)量控制,應(yīng)用上靈活性較高;Thermo Fisher芯片是原位光刻合成技術(shù),其優(yōu)點(diǎn)是基因芯片幾乎無批次效應(yīng),能夠兼容20 bp以上的SNP,且設(shè)計(jì)位點(diǎn)轉(zhuǎn)化率較高。
隨著我國(guó)企業(yè)自主育種意識(shí)的加強(qiáng),近年國(guó)內(nèi)出現(xiàn)了一批以我國(guó)育種需求為設(shè)計(jì)理念的國(guó)產(chǎn)基因芯片,大大降低了企業(yè)對(duì)于國(guó)外芯片產(chǎn)品的依賴?;蚍中统杀镜慕档鸵布ぐl(fā)了育種企業(yè)應(yīng)用高密度SNP芯片開展基因組育種的熱情。
隨著測(cè)序技術(shù)的迅猛發(fā)展和測(cè)序成本的超摩爾速度降低,基于二代測(cè)序的SNP分型技術(shù)在畜禽分子育種領(lǐng)域應(yīng)用與日俱增。從測(cè)序原理角度,通過測(cè)序不僅可以直接獲得待測(cè)群體的真實(shí)變異數(shù)據(jù)、不受物種是否具有參考基因組的限制,而且能夠獲得覆蓋低、中、高密度甚至全基因組范圍內(nèi)的所有變異信息,同時(shí)能夠通過提高測(cè)序的深度達(dá)到檢測(cè)稀有變異信息的目的。目前,基于二代測(cè)序技術(shù)開發(fā)的標(biāo)記檢測(cè)技術(shù)主要包括:全基因組重測(cè)序(whole genome resequencing,WGS)、簡(jiǎn)化基因組測(cè)序(reduced-representation genome sequencing,RRGS)、低深度重測(cè)序(low-depth resequencing)和靶向捕獲測(cè)序(target capture sequencing, TCS)等。
1.2.1 全基因組重測(cè)序 全基因組重測(cè)序(whole genome resequencing,WGS)是通過對(duì)基因組序列己知的物種進(jìn)行不同個(gè)體的基因組測(cè)序,在個(gè)體或群體水平上進(jìn)行差異化分析的測(cè)序方法。其基本流程是:首先通過基因組片段化、末端修復(fù)、連接測(cè)序接頭和擴(kuò)增富集獲得全基因組的測(cè)序文庫;然后利用基因測(cè)序平臺(tái)進(jìn)行全基因組文庫的掃描測(cè)序,經(jīng)全基因組重測(cè)序的序列比對(duì),可以得到大量的單核苷酸多態(tài)性位點(diǎn)(single nucleotide polymorphism, SNP)、插入缺失(insertion-deletion, InDel)、拷貝數(shù)變異(copy number variations, CNV)和結(jié)構(gòu)變異(structure variation, SV)等變異信息,進(jìn)一步通過生物信息學(xué)分析可以找到與疾病、經(jīng)濟(jì)性狀及功能相關(guān)的遺傳標(biāo)記。隨著測(cè)序成本的大幅度降低以及測(cè)序效率的數(shù)量級(jí)提升,再加上己知基因組序列的物種增多,全基因組重測(cè)序已經(jīng)成為動(dòng)植物遺傳差異研究、功能基因挖掘等最可靠且常用的方法。Tao等[4]利用WGS對(duì)云上黑山羊品種的兩個(gè)亞群(多胎組和單胎組)進(jìn)行重測(cè)序,通過GWAS分析發(fā)現(xiàn)了12個(gè)包含具有最小P值的OSBPL8等候選基因。Banos等[5]利用重測(cè)序技術(shù)對(duì)兩種不同的埃塞俄比亞本土雞生態(tài)型進(jìn)行了包括估計(jì)遺傳參數(shù)、GWAS分析、估算基因組育種值 (GEBV)、基因組預(yù)測(cè)等聯(lián)合分析,用于研究本土雞與重要健康和生產(chǎn)力特征相關(guān)的基因組結(jié)構(gòu),并探索進(jìn)行跨生態(tài)型基因組選擇的可行性。
1.2.2 簡(jiǎn)化基因組測(cè)序 簡(jiǎn)化基因組測(cè)序(reduced-representation genome sequencing, RRGS)是利用限制性內(nèi)切酶將基因組DNA進(jìn)行片段化,對(duì)篩選到的特定酶切片段進(jìn)行高通量測(cè)序以此獲得大量遺傳標(biāo)記的測(cè)序策略。酶切位點(diǎn)可以出現(xiàn)在基因組的任意位置,由于同一物種的不同個(gè)體或者近緣物種間的酶切位點(diǎn)位置相對(duì)保守,共享相同的酶切位點(diǎn),為簡(jiǎn)化測(cè)序提供了先決條件[6]。目前應(yīng)用較多的主要是GBS (genotyping by sequencing)、dd-RAD (double digest restriction associated sequencing, ddRAD-seq)[7]和RAD-seq (restriction associated DNA sequencing)[8],其主要區(qū)別在于在測(cè)序接頭連接后是否進(jìn)行片段大小的篩選和PCR富集后是否進(jìn)行片段選擇。與全基因組重測(cè)序相比,簡(jiǎn)化基因組測(cè)序因只對(duì)基因組上很少的一部分區(qū)域進(jìn)行測(cè)序,極大的簡(jiǎn)化了基因組,因此,該技術(shù)不僅能夠降低測(cè)序成本,而且能降低測(cè)序數(shù)據(jù)量和縮短生物信息分析的周期。
GBS分型技術(shù)利用限制性內(nèi)切酶對(duì)基因組DNA進(jìn)行片段化,通過篩選一定比例的酶切片段進(jìn)行高深度測(cè)序來獲得覆蓋全基因組的高密度遺傳標(biāo)記。一方面GBS分型技術(shù)因文庫構(gòu)建操作流程簡(jiǎn)單,具有高效率、低成本等優(yōu)勢(shì);另一方面,該技術(shù)所獲得的遺傳標(biāo)記大多是待測(cè)群體中多態(tài)性較高的SNP位點(diǎn),使得GBS分型技術(shù)比較適合在我國(guó)地方品種或高度純化的品系中進(jìn)行分型并獲得大量的遺傳標(biāo)記信息[9]。目前,簡(jiǎn)化基因組測(cè)序分型技術(shù)已經(jīng)廣泛應(yīng)用于牛、豬、羊、雞、鴨等畜禽物種研究中[10],其中GBS分型技術(shù)已經(jīng)被廣東溫氏公司應(yīng)用于杜洛克豬群體的基因組選擇育種研究,并取得了較為顯著的遺傳進(jìn)展[11]。
1.2.3 低深度重測(cè)序 全基因組低深度重測(cè)序是繼簡(jiǎn)化基因組測(cè)序技術(shù)之后的新一代低成本標(biāo)記檢測(cè)的方法,該技術(shù)首先對(duì)群體中所有的個(gè)體進(jìn)行全基因組低深度重測(cè)序和變異檢測(cè),然后根據(jù)變異位點(diǎn)間的連鎖不平衡對(duì)缺失基因型進(jìn)行填充,最終獲得大規(guī)模樣本的全基因組水平的高密度遺傳標(biāo)記[12]。由于測(cè)序深度與基因組變異信息的覆蓋度高度相關(guān),提高測(cè)序深度不僅能夠降低假陽性的比例,而且在稀有變異檢測(cè)上也有著顯著的優(yōu)勢(shì)。但是在畜禽育種領(lǐng)域,高深度的重測(cè)序需要較高的測(cè)序成本,限制了該技術(shù)在企業(yè)育種上的應(yīng)用。為了控制檢測(cè)成本,可以通過基因組文庫構(gòu)建方法的改進(jìn)來降低成本,如基于酶切法打斷建庫(包括非特異性外切酶和Tn5轉(zhuǎn)座酶等),還可以嘗試降低測(cè)序深度,開發(fā)低深度重測(cè)序方法,結(jié)合基因型填充流程實(shí)現(xiàn)全基因組水平的變異位點(diǎn)檢測(cè)。Nicod等[13]對(duì)1 887只遠(yuǎn)緣雜交系的小鼠個(gè)體進(jìn)行了0.15×的超低深度重測(cè)序后,通過GWAS定位到156個(gè)與92個(gè)性狀相關(guān)的獨(dú)立的遺傳標(biāo)記,該項(xiàng)報(bào)道為畜禽基因組研究中實(shí)施大規(guī)模群體的低深度SNP分型技術(shù)提供了新的思路。Yang等[12]用低深度重測(cè)序(平均測(cè)序深度0.73×)方法,對(duì)2 885頭杜洛克公豬進(jìn)行4個(gè)經(jīng)濟(jì)性狀全基因組關(guān)聯(lián)分析,關(guān)聯(lián)到2個(gè)QTLs可能與乳頭數(shù)量和背部脂肪厚度特征有關(guān)。
1.2.4 靶向捕獲測(cè)序 靶向捕獲測(cè)序是利用二代測(cè)序技術(shù)對(duì)基因組上目標(biāo)區(qū)域進(jìn)行捕獲后測(cè)序,目前主要有兩種技術(shù)體系,一種是基于多重PCR技術(shù),一種是基于探針雜交。這兩種技術(shù)體系均可以實(shí)現(xiàn)對(duì)基因組上的非高度重復(fù)區(qū)域進(jìn)行定向捕獲,可以同時(shí)檢測(cè)各種變異類型,如SSR、SNP和InDel等?;诙嘀豍CR的捕獲測(cè)序流程是:第一輪PCR對(duì)目標(biāo)位點(diǎn)進(jìn)行擴(kuò)增,第二輪PCR過程中引入測(cè)序接頭和Barcode,獲得可以上機(jī)測(cè)序的文庫,然后通過高通量測(cè)序儀進(jìn)行測(cè)序。與常規(guī)PCR不同在于,多重PCR捕獲技術(shù)能夠在一管反應(yīng)中實(shí)現(xiàn)上千位點(diǎn)的擴(kuò)增?;谔结橂s交的捕獲測(cè)序原理是基于目標(biāo)區(qū)域序列與液相探針的互補(bǔ)結(jié)合,對(duì)目標(biāo)位點(diǎn)捕獲并測(cè)序,其主要流程為:首先構(gòu)建全基因組文庫,然后利用生物素修飾的探針進(jìn)行捕獲,利用鏈霉親和素的磁珠對(duì)探針結(jié)合的分子進(jìn)行吸附,最后對(duì)捕獲序列進(jìn)行擴(kuò)增富集得到測(cè)序文庫(圖1)。與全基因組測(cè)序相比,靶向捕獲測(cè)序縮小了測(cè)序的區(qū)域,降低了樣品的測(cè)序成本。這項(xiàng)檢測(cè)方法中,探針合成的費(fèi)用是主要成本,檢測(cè)步驟較多,數(shù)據(jù)穩(wěn)定性依賴于測(cè)序深度以及對(duì)目標(biāo)區(qū)域的捕獲效率等因素??紤]成本和數(shù)據(jù)質(zhì)量等因素,靶向捕獲測(cè)序技術(shù)目前主要用在需求量不大、沒有商業(yè)化SNP基因芯片的物種上,集中于中低密度Panel的定制開發(fā)。Lippold等[14]利用多重液相捕獲方法研究了來自44個(gè)品種的59匹家養(yǎng)馬和1匹普氏野馬(Equusprzewalski)的整個(gè)線粒體基因組,并發(fā)現(xiàn)家馬中有473個(gè)可變位置,提供了一個(gè)很好解析的系統(tǒng)發(fā)育樹。Newman等[15]使用全外顯子組捕獲測(cè)序,研究了安格斯牛 EPAS1 氧降解域中 EPAS1 (HIF2a) 雙變體與高海拔肺動(dòng)脈高壓(HAPH)的高度關(guān)聯(lián)。
A.基于多重PCR的靶向捕獲測(cè)序技術(shù)原理;B.基于探針雜交的靶向捕獲測(cè)序技術(shù)原理A. Principle of the multiplex PCR-based target capture sequencing technology; B. Principle of the probe hybridization-based target capture sequencing technology圖1 基于多重PCR和探針雜交的靶向捕獲測(cè)序技術(shù)原理圖Fig.1 Schematic diagram of target capture sequencing technology based on multiplex PCR and probe hybridization
全基因組關(guān)聯(lián)分析(genome wide association analysis, GWAS)是基于全基因組上大量遺傳標(biāo)記的多態(tài)性,對(duì)每個(gè)多態(tài)性標(biāo)記(即基因型)與表型性狀進(jìn)行關(guān)聯(lián)分析,根據(jù)統(tǒng)計(jì)學(xué)閾值或P值篩選與目標(biāo)性狀關(guān)聯(lián)的分子標(biāo)記的分析策略,也是在畜禽研究中用來挖掘與經(jīng)濟(jì)性狀相關(guān)的分子標(biāo)記的最常用的方法[16]。目前,GWAS已成為畜禽重要性狀基因定位的常用方法,據(jù)Animal genome網(wǎng)站統(tǒng)計(jì),截至 2022 年4月,QTLdb上已發(fā)布并公開了192 925個(gè)牛性狀相關(guān)的 QTLs、16 637個(gè)雞性狀相關(guān)的QTLs、35 384個(gè)豬性狀相關(guān)的QTLs、4 207個(gè)綿羊性狀相關(guān)的QTLs。
基因芯片作為第一個(gè)用于全基因組關(guān)聯(lián)分析研究的高通量技術(shù)一直被廣泛應(yīng)用至今[17]。由于過低的SNP密度會(huì)影響性狀關(guān)聯(lián)標(biāo)記的挖掘效率,所以目前進(jìn)行畜禽重要性狀關(guān)鍵基因定位的基因芯片密度都在50K以上。在豬的體重性狀研究方面,Ji等[18]利用Illumina Procine SNP60K芯片在611個(gè)和79個(gè)與白杜洛克和二花臉豬雜交二代群體中篩選出與210 d體尺(體高、體長(zhǎng)、胸圍、胸深、胸寬、管圍、腹圍和臀圍)和體重關(guān)聯(lián)的SNPs標(biāo)記,并鑒定出7個(gè)新的QTLs和5個(gè)候選基因。在豬的骨性狀研究方面,邱恒清[19]利用Illumina Procine SNP60K芯片對(duì)300日齡巴馬香豬檢出的CNV進(jìn)行GWAS,挖掘到18個(gè)位于2、5和7號(hào)染色體上并顯著影響骨骼長(zhǎng)度的拷貝數(shù)變異區(qū)域。在雞體重研究方面,Lien等[20]使用60K Illumina SNPChip對(duì)844個(gè)個(gè)體的0、4、8、12和16周齡的體重、8周齡的小腿長(zhǎng)度、16周齡的梳區(qū)大小及11周齡(初次免疫后第7和14天)的紅細(xì)胞水平進(jìn)行GWAS分析,鑒定到與178個(gè)SNPs顯著關(guān)聯(lián)的47個(gè)QTLs和714個(gè)效應(yīng)位點(diǎn)。在牛的胸高和臀高研究方面,Zhang等[21]使用Bovine SNP50 v2 BeadChip對(duì)中國(guó)荷斯坦牛的4個(gè)生長(zhǎng)階段(6、12、18、24月齡)的胸圍和臀高進(jìn)行GWAS分析發(fā)現(xiàn)了66個(gè)候選基因在16個(gè)信號(hào)通路和互作網(wǎng)絡(luò)中發(fā)揮重要的生物學(xué)功能。在山羊體型研究方面,Rahmatalla等[22]利用Goat SNP52K BeadChip對(duì)蘇丹4個(gè)山羊品種的14個(gè)體型性狀進(jìn)行GWAS分析發(fā)現(xiàn),位于2號(hào)染色體上的CNTNAP5基因與胸寬顯著關(guān)聯(lián),位于3號(hào)染色體上的SNP位點(diǎn)56482-scaffold89-467312 與體長(zhǎng)顯著關(guān)聯(lián)。另外,Seroussi等[23]使用Illumina Ovine SNP50 BeadChip進(jìn)行GWAS分析挖掘到影響綿羊絨細(xì)度的候選基因AKT1和ALX4。
全基因組重測(cè)序技術(shù)的發(fā)展、各物種基因組序列的測(cè)序完成,為從基因組水平上研究目標(biāo)性狀提供了便利。張易[24]采用case-control設(shè)計(jì),對(duì)F2群體308只鴨子羽色性狀進(jìn)行全基因組關(guān)聯(lián)分析,結(jié)果顯示共關(guān)聯(lián)顯著水平相關(guān)的SNP位點(diǎn)8 423個(gè),通過參考基因組序列比對(duì)和GenBank功能注釋,結(jié)合KEGG富集、GO分析和CNV關(guān)聯(lián),預(yù)測(cè)MITF基因是鴨白羽性狀顯著相關(guān)基因。簡(jiǎn)化基因組測(cè)序相比于全基因組重測(cè)序,能降低測(cè)序成本和縮短數(shù)據(jù)分析所需的時(shí)間。談成[25]利用GBS測(cè)序?qū)? 757頭杜洛克公豬進(jìn)行測(cè)序分型和GWAS分析,鑒定到大量與一種或多種性狀相關(guān)聯(lián)的顯著性SNPs。靶向捕獲測(cè)序也是利用二代測(cè)序技術(shù)進(jìn)行分析的最有效方法之一,相比全基因組測(cè)序法,該方法大幅縮小了目標(biāo)區(qū)域的捕獲范圍,在保證檢測(cè)到目標(biāo)區(qū)段所有變異的前提下,能夠降低樣品測(cè)序成本。喬賢[26]使用絨山羊66K靶向捕獲panel,對(duì)432個(gè)個(gè)體羊絨進(jìn)行捕獲測(cè)序獲得目標(biāo)SNP位點(diǎn)分型,對(duì)羊絨細(xì)度性狀進(jìn)行了關(guān)聯(lián)分析。
基因組學(xué)技術(shù)的快速發(fā)展推動(dòng)了新一代測(cè)序技術(shù)的迅猛發(fā)展,測(cè)序成本也隨之呈現(xiàn)超摩爾速度降低,這為進(jìn)一步開發(fā)和應(yīng)用動(dòng)物高密度芯片的研究奠定了基礎(chǔ)。目前基于50K以上標(biāo)記密度為主的基因芯片在牛、豬、綿羊、山羊、雞等物種上得到了廣泛應(yīng)用,推動(dòng)了全基因組關(guān)聯(lián)分析在畜禽遺傳育種上的快速發(fā)展[27]。隨著各物種基因組測(cè)序的完成和測(cè)序成本的降低,全基因組重測(cè)序在挖掘和經(jīng)濟(jì)性狀相關(guān)的分子標(biāo)記上的應(yīng)用也越來越多,相對(duì)于基因芯片還可以挖掘到新的或者稀有的SNP標(biāo)記。因重測(cè)序一般要求測(cè)序深度大于10×,對(duì)于較大基因組的物種來說測(cè)序費(fèi)用較基因芯片高,所以如果有商業(yè)化的基因芯片建議直接應(yīng)用;如果是較大的群體檢測(cè),可以選取部分有代表性的個(gè)體進(jìn)行重測(cè)序,利用重測(cè)序的數(shù)據(jù)進(jìn)行高密度基因芯片的開發(fā),從而實(shí)現(xiàn)大群體的檢測(cè)和標(biāo)記的挖掘。
選擇信號(hào)(selection signature)是指在生物群體進(jìn)化過程中,由于人工選擇或自然選擇的作用使生物群體的表型特征發(fā)生變化并且在基因組上留下大量的痕跡,一般表現(xiàn)為基因型純合或者某些位點(diǎn)或DNA片段的多態(tài)性降低,這些信號(hào)通常與動(dòng)物的選育方向以及馴化適應(yīng)機(jī)制緊密相關(guān)。因此,對(duì)選擇信號(hào)進(jìn)行檢測(cè)有助于挖掘與動(dòng)物經(jīng)濟(jì)性狀相關(guān)的基因,了解性狀形成的潛在的遺傳學(xué)基礎(chǔ),對(duì)于畜禽遺傳改良具有重要意義[28]。
早期對(duì)于畜禽選擇信號(hào)的研究都是通過基因芯片實(shí)現(xiàn)的,如綿羊和山羊的基因組芯片分別于Kijas等[29]和Tosser-klopp[30]等的研究中問世。劉恩民[31]應(yīng)用Illumina Goat SNP 50K Beadchip對(duì)我國(guó)16個(gè)山羊品種(其中2個(gè)野生山羊群體)進(jìn)行了遺傳多樣性、群體結(jié)構(gòu)和選擇信號(hào)分析,發(fā)現(xiàn)在1、8和14號(hào)染色體上的強(qiáng)受選擇區(qū)域存在一些未知功能的基因,包括PLGRKT、LOC106502473、LOC1021856、XXYLT1等。Jin等[32]利用Illumina Caprine 50K BeadChip對(duì)53只內(nèi)蒙古絨山羊、遼寧絨山羊和黃淮山羊進(jìn)行基因分型,確定了一些積極選擇的SNPs。Edea等[33]利用Porcine SNP70K BeadChip對(duì)488頭杜洛克豬和155頭杜洛克×韓國(guó)本土豬 (DKNP) 進(jìn)行基因分型鑒定到了與生長(zhǎng)/身高、胴體和肉質(zhì)相關(guān)的定向選擇基因。李景[34]使用高密度SNP 基因芯片對(duì)來自5個(gè)藏區(qū)和28個(gè)低原地區(qū)群體的共593頭豬進(jìn)行基因分型,同時(shí)整合了來自Dryad 網(wǎng)站的6個(gè)中西方豬種共85頭豬的60K基因芯片分型數(shù)據(jù),發(fā)現(xiàn)5個(gè)藏豬群體在進(jìn)化和地理位置上有明顯的分化。Zhang等[35]使用雞60K SNP芯片在兩個(gè)經(jīng)過了11代腹部脂肪含量選擇的品系中進(jìn)行多種選擇信號(hào)分析,確定了多個(gè)受選擇的基因區(qū)域。
1989—1993年對(duì)路堤狀態(tài)進(jìn)行了專門的野外觀測(cè)。測(cè)量了土的溫度、水平位移、溢洪道側(cè)墻的水平位移以及溢洪道側(cè)墻的土壓力。在深度為2.5 m處各項(xiàng)指標(biāo)最大值為:溫度30 ℃,膨脹壓力-0.30 MPa,距墻15 cm處水平位移0.6 mm。在冬季壩頂深度為0.2 m處最大水平移動(dòng)距離為4.5 mm(即溢洪道側(cè)墻與土之間的裂縫張開的近似寬度)。
全基因組重測(cè)序技術(shù)由于其高通量的輸出基因組序列的特點(diǎn),速度和準(zhǔn)確性均較高,已經(jīng)廣泛應(yīng)用到選擇信號(hào)的研究中。陳建興等[36]對(duì)4個(gè)驢品種60個(gè)樣本進(jìn)行全基因組重測(cè)序和群體遺傳分化系數(shù)(Fst)、核苷酸多樣性比值(πratio)分析找到了39個(gè)落入選擇信號(hào)區(qū)域的候選基因,主要在免疫、生殖、細(xì)胞作用等通路中發(fā)揮重要的作用,說明山東小毛驢在免疫力和生殖能力等性狀上經(jīng)歷了人工選擇。Li等[37]對(duì)5個(gè)地方豬種(包括白眉豬、金華豬、榮昌豬、梅山豬、藏豬)與西方5個(gè)家豬的測(cè)序數(shù)據(jù)進(jìn)行選擇信號(hào)分析,發(fā)現(xiàn)中西方人工選擇方向的不同導(dǎo)致地方豬與西方豬存在較大的遺傳差異,中國(guó)地方豬的遺傳變異較高。金川牦牛作為獨(dú)立于其他牦牛的一個(gè)分支,其馴化程度和選擇強(qiáng)度均大于其他牦牛群體,Lan等[38]基于重測(cè)序?qū)λ拇ㄊ〗鸫h牦牛進(jìn)行全基因組分析發(fā)現(xiàn),與其他牦牛品種相比,金川牦牛有339個(gè)基因(包括與節(jié)律、神經(jīng)系統(tǒng)、突觸發(fā)育等相關(guān)基因)受到顯著的正向選擇。Guo等[39]分析了不同表型山羊的選擇特征,基因掃描發(fā)現(xiàn)藏山羊有4個(gè)起源,品種間遺傳分化較高,毛色上的選擇區(qū)域受體較多。Zhang等[40]對(duì)藏雞和低海拔雞研究發(fā)現(xiàn),藏雞中與適應(yīng)高海拔生活相關(guān)的差異表達(dá)基因參與了心肺系統(tǒng)發(fā)育、炎癥和免疫反應(yīng)以及輻射的反應(yīng)。
簡(jiǎn)化基因組測(cè)序,由于被測(cè)序的是基因組的一部分,在相同的測(cè)序通量和測(cè)序深度的情況下能夠測(cè)得更多的個(gè)體,這也為群體遺傳學(xué)中大量樣本的基因分型提供了可能[41]。Liu等[42]使用RAD-seq 從6個(gè)中國(guó)本土兔品種和2個(gè)進(jìn)口兔品種中獲得了1 006 496個(gè)SNPs 標(biāo)記,對(duì)具有對(duì)比毛色的兩個(gè)群體進(jìn)行選擇信號(hào)分析,發(fā)現(xiàn)了以四川白兔和新西蘭兔為參考群體,閩西南黑兔和萬仔兔為目標(biāo)群體的受選擇特征基因。馬士龍等[43]對(duì)麥洼牦牛3個(gè)保種群粉嘴群、全黑群和弗洛群進(jìn)行GBS簡(jiǎn)化基因組測(cè)序檢測(cè)到了126 122個(gè)SNPs標(biāo)記,利用Fst和π法對(duì)3個(gè)保種群進(jìn)行選擇信號(hào)分析,發(fā)現(xiàn)有104個(gè)受選擇基因廣泛參與生殖機(jī)能、免疫系統(tǒng)、胚胎發(fā)育等條目以及生殖激素、內(nèi)/外分泌、信號(hào)傳遞等通路,其中部分基因提示麥洼牦牛的繁殖、肉質(zhì)、毛色性狀以及應(yīng)激反應(yīng)得到了人工選擇。夏樹立等[44]利用簡(jiǎn)化基因組測(cè)序技術(shù)分析和比較天津猴雞群體與其他雞種群體的遺傳差異,并對(duì)進(jìn)化過程中受到選擇的基因進(jìn)行基因功能注釋。結(jié)果顯示,在天津猴雞群體中檢測(cè)出265 869個(gè)SNPs標(biāo)記,受選擇基因主要參與氨基酸生物合成、細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)以及神經(jīng)系統(tǒng)發(fā)育等通路或生物學(xué)過程;檢測(cè)到6個(gè)與種質(zhì)特性相關(guān)的受選擇基因,它們與神經(jīng)系統(tǒng)發(fā)育、激素調(diào)節(jié)和抗熱應(yīng)激等生理功能緊密相關(guān),研究結(jié)果揭示了天津猴雞的裸頸性狀形成機(jī)制和抗熱應(yīng)激特性,為天津猴雞的保護(hù)和種質(zhì)特性評(píng)價(jià)提供重要理論依據(jù)。
早期對(duì)畜禽選擇信號(hào)的研究是基于基因芯片,標(biāo)記密度一般在5萬個(gè)以上。隨著測(cè)序技術(shù)的發(fā)展、測(cè)序成本逐步降低,基于基因組重測(cè)序、簡(jiǎn)化基因組測(cè)序等技術(shù)的選擇信號(hào)分析同樣可以快速準(zhǔn)確地篩選出受選擇區(qū)域和定位經(jīng)濟(jì)性狀相關(guān)的候選基因。
遺傳背景分析可以揭示生物群體的遺傳結(jié)構(gòu)與進(jìn)化的歷史動(dòng)態(tài)。群體遺傳多樣性是指群體內(nèi)所有個(gè)體的遺傳變異信息的總和,自然選擇和群體間的基因交流均能影響群體遺傳的多樣性。近年來,全基因組基因分型技術(shù)迅猛發(fā)展,基因檢測(cè)效率大幅提高,為探討生物群體的遺傳結(jié)構(gòu)、追蹤不同群體經(jīng)歷的選擇提供了可能。
中高密度的基因芯片能夠從全基因組范圍內(nèi)對(duì)地方畜禽遺傳資源進(jìn)行遺傳結(jié)構(gòu)和長(zhǎng)純合片段檢測(cè)等分析,為地方遺傳資源保護(hù)和開發(fā)提供參考。胡亮等[45]利用600K基因芯片對(duì)20個(gè)藏系綿羊品種(西藏、青海、甘肅、云南和四川地區(qū))進(jìn)行藏系綿羊間的遺傳關(guān)系和遺傳多樣性分析發(fā)現(xiàn),西藏、云南地區(qū)藏系綿羊的近交系數(shù)明顯高于青海、甘肅和四川地區(qū)的藏系綿羊。戴麗荷等[46]利用Illumina CAUPorcine 50K SNP芯片檢測(cè)54頭淳安花豬的單核苷酸多態(tài)性(SNP),分析群體遺傳多樣性和群體結(jié)構(gòu),將群體劃分為6個(gè)家系,為保種和選配提供了依據(jù)。屠云潔等[47]為揭示廣西麻雞2個(gè)群體里當(dāng)雞和靈山香雞之間的遺傳距離和親緣關(guān)系,利用“京芯一號(hào)”芯片對(duì)2個(gè)群體的親緣關(guān)系進(jìn)行遺傳分析,結(jié)果顯示廣西麻雞2個(gè)群體個(gè)體間近交程度較低,個(gè)體間親緣關(guān)系相對(duì)較遠(yuǎn),為培育市場(chǎng)需求的優(yōu)質(zhì)麻雞配套系提供參考和幫助。
基于測(cè)序的分型技術(shù)在畜禽遺傳資源背景分析中的應(yīng)用也越來越多。在家雞的遺傳資源鑒定中,陳彬龍[48]利用WGS技術(shù)對(duì)來自不同地理位置的78只家雞進(jìn)行群體結(jié)構(gòu)分析發(fā)現(xiàn),6個(gè)具有地理代表性的藏雞群體至少存在3個(gè)明顯的分支,表明藏雞可能與其他家雞一樣是多起源的。Gebreselase[49]利用WGS對(duì)埃塞俄比亞和中國(guó)山羊群體進(jìn)行群體結(jié)構(gòu)和系統(tǒng)發(fā)育分析,將山羊品種按照其起源地分成了4個(gè)分支。張俸偉[50]對(duì)21頭隆林牛、18頭南丹牛和17頭潿洲牛進(jìn)行全基因組重測(cè)序、群體結(jié)構(gòu)分析、核苷酸多樣性分析、LD衰減分析、ROH計(jì)算、線粒體基因組分析,得到廣西的這3個(gè)黃牛品種全基因組遺傳變異非常豐富,主要為中國(guó)瘤牛起源,具有抵抗皰疹病毒基因、分子黏附相關(guān)基因(NCR3、FAT4)和6個(gè)參與補(bǔ)體激活的基因,具有獨(dú)特的瘤牛I1a亞單倍型組;對(duì)Y染色體雄性特異區(qū)SNP分析發(fā)現(xiàn)中國(guó)瘤牛Y3a亞單倍型組占絕對(duì)優(yōu)勢(shì)。相比于全基因組重測(cè)序,簡(jiǎn)化基因組測(cè)序只對(duì)很小一部分的基因組進(jìn)行測(cè)序,能降低測(cè)序成本和數(shù)據(jù)分析所需的時(shí)間。盛中華等[51]利用簡(jiǎn)化基因組測(cè)序技術(shù)構(gòu)建了上海白豬(上系)分子保種數(shù)據(jù)庫;通過基因組結(jié)構(gòu)特性分析,將上海白豬(上系)、西方豬種和太湖豬種分成3類,證實(shí)了上海白豬(上系)經(jīng)過長(zhǎng)期的選育,已形成獨(dú)特的遺傳結(jié)構(gòu),具有獨(dú)特的基因組結(jié)構(gòu)和群體結(jié)構(gòu)。蘭蓉等[52]采用簡(jiǎn)化基因組測(cè)序(GBS)技術(shù)對(duì)來自云南省種羊推廣中心的37只黃色波爾山羊公羊進(jìn)行測(cè)序,分析了群體的遺傳結(jié)構(gòu)并將群體劃分為11個(gè)家系,為波爾山羊黃色群體在云南黃山羊新品種培育中的合理利用提供了科學(xué)依據(jù),也為評(píng)估山羊個(gè)體近交水平、防止近交衰退、優(yōu)化選種選配方案提供了有力的技術(shù)手段。
基因組選擇(genomic selection, GS)是畜禽經(jīng)濟(jì)性狀選育改良的重要方法,利用覆蓋全基因組高密度遺傳標(biāo)記信息計(jì)算個(gè)體基因組估計(jì)育種值(genomic estimated breeding value, GEBV)[51]。與常規(guī)基于系譜及表型信息評(píng)估育種值(estimated breeding value, EBV)方法相比,GEBV通常能獲得更高的估計(jì)準(zhǔn)確性[53-55]。由于計(jì)算個(gè)體的GEBV可以不依賴系譜和表型信息,為實(shí)現(xiàn)早期選育提供了可能。基因組選擇的方法不僅可以提高遺傳進(jìn)展、縮短世代間隔、降低育種成本[56],而且對(duì)于低遺傳力性狀和難以測(cè)量的性狀也具有明顯的優(yōu)勢(shì)。
進(jìn)行全基因組選擇時(shí),首先需要組建參考群,參考群必須有準(zhǔn)確的表型記錄和基因型分型數(shù)據(jù)。特別需要說明的是,在SSGBLUP模型中有準(zhǔn)確系譜和表型的個(gè)體也被視為參考群[65];因此,SSGBLUP方法是利用參考群的表型數(shù)據(jù)、系譜數(shù)據(jù)及基因分型數(shù)據(jù)計(jì)算群體的方差組分,并優(yōu)化運(yùn)算模型因子構(gòu)成,完成參考群運(yùn)算模型構(gòu)建;然后通過候選群的基因分型數(shù)據(jù)和系譜數(shù)據(jù)對(duì)有基因型和無基因型數(shù)據(jù)的個(gè)體進(jìn)行GEBV估計(jì),按照綜合指數(shù)權(quán)重計(jì)算綜合育種值并根據(jù)排名進(jìn)行選留,如圖2所示。
圖2 基因組選擇流程圖Fig.2 Flowchart of genome selection
從2001年基因組選擇的概念首次提出至今,各個(gè)國(guó)家在畜禽育種方面已經(jīng)陸續(xù)使用。美國(guó)和加拿大在2009年率先向全球發(fā)布奶?;蚪M選擇的成果。2009—2015年基因組選擇使美國(guó)奶牛育種的世代間隔大幅度縮短,公牛父親世代間隔從原來的7年左右下降到2.5年,而公牛母親從4年降到了2.5年。某些中高遺傳力性狀(乳蛋白、產(chǎn)奶量、乳脂量等)的年遺傳進(jìn)展提升50%~100%,而低遺傳力性狀(體細(xì)胞評(píng)分等)提升的更加顯著,年遺傳進(jìn)展提升了3~4倍[66]。截至2017年,美國(guó)對(duì)奶牛利用基因組芯片的檢測(cè)量達(dá)到200萬頭。英國(guó)豬育種PIC公司從2010年起每年檢測(cè)量已達(dá)10萬頭。目前,全球主要的發(fā)達(dá)國(guó)家都在奶牛、肉牛、豬、羊、雞等物種上全面開展了基因組選擇育種,使選育進(jìn)展大幅度提升,選育成本進(jìn)一步降低[67]。在我國(guó)也已經(jīng)初步建立了豬、雞、鴨、肉牛、奶牛等物種的基因組選擇育種技術(shù)體系,相繼成立豬基因組選擇北京聯(lián)盟、肉雞基因組選擇育種聯(lián)盟、北京聯(lián)育肉牛育種科技有限公司等組織。奶牛方面,我國(guó)于2008 年開始啟動(dòng)奶?;蚪M育種(GS)研究,2012 年正式將GS 技術(shù)應(yīng)用于荷斯坦奶牛的遺傳評(píng)估中,主要評(píng)估了產(chǎn)奶量、體細(xì)胞計(jì)數(shù)、體型評(píng)分等14個(gè)性狀,其中產(chǎn)奶性狀基因組預(yù)測(cè)準(zhǔn)確性較常規(guī)BLUP方法提升了0.13~0.30,基因組預(yù)測(cè)準(zhǔn)確性為0.59~0.76。荷斯坦奶牛基因組選擇技術(shù)體系的建立,實(shí)現(xiàn)了大規(guī)模的產(chǎn)業(yè)化應(yīng)用,同時(shí)使我國(guó)奶牛育種技術(shù)躋身于國(guó)際先進(jìn)行列。
畜禽育種產(chǎn)品的開發(fā)需要大量遺傳變異信息。全基因組重測(cè)序技術(shù)可以檢測(cè)出個(gè)體或群體全基因組范圍的變異信息,從而可以用于全基因組選擇育種、目標(biāo)性狀的全基因組關(guān)聯(lián)分析、品種間差異分析等分子標(biāo)記和產(chǎn)品的開發(fā)。
Liu等[68]對(duì)8個(gè)中國(guó)地方雞品種128個(gè)個(gè)體進(jìn)行全基因組重測(cè)序和SNP 位點(diǎn)挖掘,結(jié)合GWAS分析,設(shè)計(jì)出一款包含21.41 K全新位點(diǎn)的55K雞育種基因芯片。以江西農(nóng)業(yè)大學(xué)研究成果為基礎(chǔ)集成了國(guó)內(nèi)十余所高校及科研單位研究成果開發(fā)的“中芯一號(hào)”基因芯片,囊括了多肋、肉色、肉質(zhì)和疾病等重要性狀因果基因位點(diǎn),該產(chǎn)品不僅適用于我國(guó)地方豬種,同時(shí)適用于商業(yè)化豬種的基因組檢測(cè)。Qi等[69]對(duì)427個(gè)太平洋牡蠣樣本(采集地點(diǎn)包括中國(guó)、日本、韓國(guó)、加拿大)進(jìn)行全基因組重測(cè)序,設(shè)計(jì)了一款200K的牡蠣基因組育種芯片,從而方便對(duì)牡蠣(動(dòng)物物種中基因組DNA變異水平最高物種之一)進(jìn)行現(xiàn)有全基因組關(guān)聯(lián)分析、精細(xì)連鎖圖譜和群體遺傳學(xué)研究。Yáez等[70]對(duì)來自3個(gè)群體的326個(gè)羅非魚樣本進(jìn)行全基因組重測(cè)序,對(duì)分析得到的SNP位點(diǎn)進(jìn)行篩選(包括基因型和位點(diǎn)質(zhì)量、孟德爾錯(cuò)誤率、非特異位點(diǎn))設(shè)計(jì)了一款50K高質(zhì)量SNP芯片,這些入選的SNPs位點(diǎn)在3個(gè)群體中表現(xiàn)出良好的多樣性,94%~99%的位點(diǎn)符合哈迪-溫博格平衡,76%~90%的SNPs位點(diǎn)MAF(minor allele frequency)大于0.05,這款芯片有助于分析羅非魚經(jīng)濟(jì)相關(guān)性狀、基因組選擇加強(qiáng)育種計(jì)劃以及羅非魚養(yǎng)殖群體的遺傳研究。喬賢[26]對(duì)我國(guó)著名地方品種內(nèi)蒙古絨山羊和遼寧絨山羊73個(gè)樣本進(jìn)行全基因組重測(cè)序,結(jié)合國(guó)內(nèi)外其他山羊品種基因組數(shù)據(jù)庫,采用疊瓦式探針設(shè)計(jì)方案,設(shè)計(jì)了一款66K位點(diǎn)的山羊捕獲測(cè)序產(chǎn)品,用于全基因組關(guān)聯(lián)分析研究和絨毛品質(zhì)的選育。
在品種鑒定產(chǎn)品開發(fā)方面,劉繼強(qiáng)[71]利用全基因組重測(cè)序技術(shù)開發(fā)了灘羊基因身份證檢測(cè)產(chǎn)品,該項(xiàng)目挑選性狀差異顯著的灘羊、烏珠穆沁羊、呼倫貝爾羊、蒙古羊、寧夏蒙古羊,進(jìn)行全基因組重測(cè)序分析,構(gòu)建二者單堿基多態(tài)性SNP和結(jié)構(gòu)變異SV等遺傳變異庫,采用機(jī)器學(xué)習(xí)的方法,通過對(duì)訓(xùn)練集的學(xué)習(xí),得到優(yōu)化的位點(diǎn)組合模型,通過盲測(cè)及模型優(yōu)化得到最終檢測(cè)位點(diǎn)集。范歡歡等[72]對(duì)249只梅花鹿、206只馬鹿、一代雜交鹿(F1)23只、二代雜交鹿(F2)20只和三代雜交鹿(F3)20只共518個(gè)個(gè)體進(jìn)行全基因組重測(cè)序,以染色體級(jí)別梅花鹿基因組為參考序列,對(duì)所有個(gè)體進(jìn)行變異檢測(cè),結(jié)合檢測(cè)個(gè)體的表型信息將梅花鹿和馬鹿參考進(jìn)行群體劃分,計(jì)算兩個(gè)參考群體SNP的遺傳分化指數(shù)(genetic differentiation index,Fst),根據(jù)定制算法和嚴(yán)格的位點(diǎn)篩選原則,最終選取1 000個(gè)梅花鹿特異性SNPs位點(diǎn)用于1K梅花鹿基因芯片的開發(fā)(鹿芯壹號(hào)),該芯片可以準(zhǔn)確對(duì)待測(cè)樣本(即梅花鹿純度)進(jìn)行鑒別(表1)。
在豬和雞的GS應(yīng)用過程中,系譜的準(zhǔn)確性往往對(duì)結(jié)果有較大的影響。但是根據(jù)現(xiàn)有的研究及實(shí)際應(yīng)用的經(jīng)驗(yàn),國(guó)內(nèi)大多數(shù)企業(yè)的系譜均有10%~20%的錯(cuò)誤[73]。這些錯(cuò)誤一般是由引種時(shí)系譜混亂、現(xiàn)場(chǎng)種畜耳標(biāo)脫落、人工授精操作不規(guī)范、人為記錄失誤等原因造成的。近年來隨著一些企業(yè)GS的開展,企業(yè)在進(jìn)行基因分型樣本的采集時(shí),個(gè)體ID的對(duì)應(yīng)關(guān)系及記錄也出現(xiàn)了一定概率的錯(cuò)誤,而且這種錯(cuò)誤極難通過育種企業(yè)內(nèi)部篩查進(jìn)行修正。因此,基于SNP數(shù)據(jù)的系譜糾偏對(duì)于育種企業(yè)來說非常有意義?;诿系聽栠z傳定律,即每個(gè)等位基因位點(diǎn)均以孟德爾遺傳方式由親本傳遞給后代[74]。在疑似親本和后代個(gè)體所構(gòu)成的待檢測(cè)親子對(duì)間,對(duì)每一個(gè)雙等位基因的遺傳位點(diǎn)進(jìn)行孟德爾錯(cuò)誤判定,理論上少量合適的標(biāo)記就能得到準(zhǔn)確率為99.99%以上的判斷[75]。郭立平[76]從SNP 標(biāo)記芯片(BovineSNP50 Genotyping Bead Chip)中篩選了50個(gè)多態(tài)性高的SNPs標(biāo)記位點(diǎn)作為西門塔爾牛親子鑒定的SNP標(biāo)記組合,用SNP 標(biāo)記組合對(duì)938頭西門塔爾牛進(jìn)行親子推斷,80%的置信度水平385頭找到最似父親,其中268頭置信度超過95%,117頭置信度介于95%~80%。張哲等[77]提出了一種基于全基因組高密度SNP標(biāo)記的親子鑒定新方法,命名為EasyPC,并利用191頭杜洛克豬的全基因組SNP數(shù)據(jù)和2 180頭中國(guó)荷斯坦牛的全基因組SNP芯片數(shù)據(jù)分別使用EasyPC和Cervus軟件進(jìn)行了對(duì)比,結(jié)果顯示豬的系譜錯(cuò)誤率為6%,牛的系譜錯(cuò)誤率為20%,但EasyPC運(yùn)行效率較Cervus更高。因此該方法可以快速、準(zhǔn)確地判別系譜的正確性,同時(shí)還能夠矯正錯(cuò)誤的系譜。
表1 畜禽分子育種產(chǎn)品開發(fā)案例
基因組檢測(cè)技術(shù)不斷發(fā)展,全基因組范圍內(nèi)的SNP分型技術(shù)也日漸豐富。不同的分型技術(shù)適用于不同的應(yīng)用場(chǎng)景,科研和育種工作者可以根據(jù)不同檢測(cè)技術(shù)的優(yōu)勢(shì)及自身的研究需求靈活選擇。
基因芯片具有檢測(cè)周期短、數(shù)據(jù)穩(wěn)定和分析流程容易等特點(diǎn),在畜禽基因組研究和育種上廣泛應(yīng)用。根據(jù)應(yīng)用方向的不同,基因芯片可以劃分為以科學(xué)研究為主的基因芯片和以產(chǎn)業(yè)應(yīng)用為主的基因芯片。科學(xué)研究用基因芯片的遺傳標(biāo)記數(shù)量占物種全基因組的比例較大,主要用于如QTL、全基因組關(guān)聯(lián)分析、基因定位和群體進(jìn)化分析等基礎(chǔ)研究中。產(chǎn)業(yè)應(yīng)用的基因芯片遺傳標(biāo)記數(shù)量占物種全基因組的比例較小,主要用于育種公司大量樣本的遺傳育種值和重要性狀分布的評(píng)估[78]。全基因組重測(cè)序技術(shù)能夠捕捉到個(gè)體全基因組上所有的變異信息,但對(duì)于基因組較大的物種基因分型成本高,目前主要應(yīng)用于科學(xué)研究中,在產(chǎn)業(yè)化育種上應(yīng)用較少(表2)。低深度重測(cè)序技術(shù)能夠通過降低測(cè)序深度來降低個(gè)體的檢測(cè)成本,但需要大量樣本的檢測(cè)和高計(jì)算量為基礎(chǔ)適用于大型育種群體研究。靶向捕獲測(cè)序技術(shù)針對(duì)特定的目標(biāo)區(qū)域設(shè)計(jì)探針,進(jìn)行目標(biāo)區(qū)域捕獲和測(cè)序,能夠提升目標(biāo)區(qū)域的測(cè)序深度,相對(duì)于重測(cè)序具有較高的測(cè)序效率,未來在畜禽基因組研究和基因組育種中具有一定的潛力。
在SNP分型技術(shù)選擇上,如果研究的對(duì)象有相應(yīng)的芯片產(chǎn)品,由于芯片檢測(cè)簡(jiǎn)單快速、數(shù)據(jù)更易存儲(chǔ)和處理,建議優(yōu)先使用基因芯片產(chǎn)品。如果沒有相應(yīng)的芯片產(chǎn)品,則可以選擇基于測(cè)序技術(shù)的相關(guān)分型策略,但測(cè)序后數(shù)據(jù)處理、存儲(chǔ)以及對(duì)分析人員的要求相對(duì)較高。當(dāng)然,若待檢測(cè)的群體很大,為了兼顧兩種技術(shù)的優(yōu)勢(shì),也可以選取群體中有代表性的少量個(gè)體進(jìn)行測(cè)序分型,根據(jù)測(cè)序的結(jié)果獲得具有一定代表性的標(biāo)記集合,進(jìn)一步定制基因芯片或者靶向捕獲測(cè)序芯片完成剩余個(gè)體的檢測(cè)和基因分型??傊?,在實(shí)際育種應(yīng)用中,育種工作者應(yīng)該根據(jù)具體的情況綜合考慮,包括檢測(cè)周期、數(shù)據(jù)情況和成本投入等因素,選擇最適合的全基因組SNP分型檢測(cè)技術(shù)。
表2 不同全基因組SNP分型技術(shù)在畜禽基因組研究中的比較
隨著基因芯片和重測(cè)序成本的不斷降低,畜禽基因組研究中SNP分型技術(shù)的選擇更加多元化。一方面利用基因芯片進(jìn)行SNP分型具有分型準(zhǔn)確性高、分析周期快的優(yōu)勢(shì),在科學(xué)研究和育種中仍具有較大的應(yīng)用空間;另一方面以測(cè)序?yàn)榛A(chǔ)的SNP分析技術(shù)能夠在全基因組范圍捕獲到更高密度的變異信息,為基礎(chǔ)研究提供了強(qiáng)大數(shù)據(jù)支持。但是基于二代測(cè)序的SNP分型技術(shù)在產(chǎn)業(yè)育種應(yīng)用上仍然存在分型準(zhǔn)確性和時(shí)效性問題,針對(duì)分型準(zhǔn)確性問題可以通過優(yōu)化測(cè)序策略和建立嚴(yán)格的數(shù)據(jù)質(zhì)控參數(shù)提高;針對(duì)時(shí)效性問題,可以借助于優(yōu)化文庫構(gòu)建流程、采用測(cè)序效率更高的測(cè)序儀器和建立標(biāo)準(zhǔn)化、智能化的數(shù)據(jù)分析流程來解決。隨著芯片和測(cè)序技術(shù)的發(fā)展,更低成本、更高準(zhǔn)確性的SNP分型策略勢(shì)必能夠加快畜禽基因組研究和遺傳育種的發(fā)展,為我國(guó)的畜禽種業(yè)振興提供技術(shù)支撐。