周茜 ,陳亞?wèn)| ,盧昇 ,劉洋 ,徐文騰 ,b,李仰真 ,王磊 ,王娜 ,b,楊英明 ,陳松林 ,b,*
a Key Laboratory for Sustainable Development of Marine Fisheries, Ministry of Agriculture, Yellow Sea Fisheries Research Institute, Chinese Academy of Fishery Sciences, Qingdao 266071, China
b Laboratory for Marine Fisheries Science and Food Production Processes, Pilot National Laboratory for Marine Science and Technology (Qingdao), Qingdao 266373, China
單核苷酸多態(tài)性(SNP)芯片是一種高質(zhì)量、便捷的基因分型平臺(tái)。使用SNP芯片,可同時(shí)檢測(cè)樣本中成千上萬(wàn)的SNP,從而實(shí)現(xiàn)高通量和高效率的基因組研究和良種選育。SNP芯片已被成功用于多種經(jīng)濟(jì)物種的種質(zhì)鑒定、復(fù)雜性狀解析、分子標(biāo)記輔助選育(MAS)和基因組選擇(GS)。基因組選擇利用全基因組范圍內(nèi)的遺傳標(biāo)記來(lái)預(yù)測(cè)基因組估計(jì)育種值(GEBV),并選擇具有高GEBV的個(gè)體進(jìn)行育種[1]。基因組選擇在育種中的應(yīng)用非常成功,例如,在許多國(guó)家,奶牛育種主要依賴基因組選擇和奶牛商業(yè)化SNP芯片[2,3]。
在過(guò)去幾年中,中國(guó)已經(jīng)完成了20多種魚類的全基因組測(cè)序[4]。全基因組序列的獲得,促進(jìn)了養(yǎng)殖魚類基因組選擇技術(shù)和SNP芯片的研究和發(fā)展。近年來(lái),研究人員研發(fā)了多種養(yǎng)殖魚類的SNP芯片,如大西洋鮭魚(Salmo salar)[5,6]、鯉魚(Cyprinus carpio)[7]、虹鱒(Oncorhynchus mykiss)[8]和鯰魚(Ictaluru spunctatus和Ictalurus furcatus)[9]。然而,目前尚無(wú)鲆鰈魚類SNP芯片及魚類抗病育種基因芯片的報(bào)道。在許多國(guó)家,包括中國(guó)、韓國(guó)和日本,牙鲆是一種重要的水產(chǎn)養(yǎng)殖品種,日本和中國(guó)分別于20世紀(jì)70年代初和20世紀(jì)90年代開始進(jìn)行牙鲆的良種選育。然而目前,牙鲆養(yǎng)殖的可持續(xù)發(fā)展面臨多種挑戰(zhàn),如種質(zhì)退化、傳染病頻發(fā)和缺乏優(yōu)良品種等。因此,迫切需要先進(jìn)的基因組育種技術(shù)培育優(yōu)良品種,以提高牙鲆養(yǎng)殖的產(chǎn)量和質(zhì)量。已有一些研究嘗試進(jìn)行牙鲆的良種選育和養(yǎng)殖,例如,鑒定一個(gè)抗淋巴囊腫病相關(guān)微衛(wèi)星標(biāo)記(Poli9-8TUF),并將其應(yīng)用于MAS[10];通過(guò)SNP遺傳連鎖圖譜定位了抗鰻弧菌(Vibrio anguillarum)病相關(guān)的數(shù)量性狀基因座(QTL)[11]等。這些研究有助于我們深化對(duì)抗病性狀遺傳結(jié)構(gòu)的認(rèn)識(shí)。但是,標(biāo)記數(shù)量少,限制了選擇育種的效果,而抗病性狀是由多個(gè)基因控制的復(fù)雜性狀,因此迫切需要采用基于全基因組范圍的SNP的基因組選擇進(jìn)行良種選育[12,13]。
我們使用新一代測(cè)序(NGS)技術(shù)完成了牙鲆的全基因組測(cè)序和組裝[14],并基于大規(guī)?;蚪M重測(cè)序數(shù)據(jù)建立了牙鲆抗細(xì)菌病基因組選擇技術(shù)[15]。本研究中,我們?cè)O(shè)計(jì)、研發(fā)了一款牙鲆50K SNP芯片“魚芯1號(hào)”,以1099個(gè)牙鲆個(gè)體的基因組重測(cè)序數(shù)據(jù)為基礎(chǔ),篩選了高質(zhì)量且信息豐富的SNP研制芯片,并驗(yàn)證了其基因分型效果。當(dāng)使用“魚芯1號(hào)”芯片作為分型工具開展牙鲆抗細(xì)菌病基因組選擇時(shí),獲得了較高的GEBV估計(jì)準(zhǔn)確性。因此,“魚芯1號(hào)”芯片在抗病及其他重要經(jīng)濟(jì)性狀的基因組育種計(jì)劃中具有應(yīng)用潛力。任何感興趣的各方都可以公開獲得“魚芯1號(hào)”芯片。
“魚芯1號(hào)”芯片的SNP位點(diǎn)來(lái)自1099個(gè)牙鲆個(gè)體的全基因組重測(cè)序數(shù)據(jù),其中包括Liu等[15]報(bào)道的931個(gè)個(gè)體和本研究測(cè)序的168個(gè)個(gè)體(NCBI SRA登錄號(hào)SRP253464)。簡(jiǎn)而言之,從鰭條組織中提取基因組DNA,根據(jù)標(biāo)準(zhǔn)方法(Illumina公司,美國(guó))構(gòu)建雙端測(cè)序文庫(kù)。重測(cè)序原始短序列在Illumina HiSeq 2000測(cè)序平臺(tái)上產(chǎn)生,然后使用QC-Chain工具進(jìn)行質(zhì)量過(guò)濾[16]以去除低質(zhì)量序列、接頭序列和不明核苷酸(N)等。使用Burrows-Wheeler aligner工具[17]將質(zhì)量控制后的序列比對(duì)到牙鲆參考基因組(NCBI登錄號(hào)GCA_001904815.2),然后使用GATK軟件(默認(rèn)參數(shù))[18]預(yù)測(cè)SNP,以最小比對(duì)質(zhì)量值20、SNP質(zhì)量得分20和堿基質(zhì)量得分30等參數(shù)進(jìn)行SNP質(zhì)量過(guò)濾,獲得初始SNP集。
通過(guò)多個(gè)步驟及參數(shù)對(duì)初始SNP集進(jìn)行篩選。首先,使用PLINK(v1.07)計(jì)算最小等位基因頻率(MAF)和缺失率[19],去除MAF≤0.05和缺失率≥0.1的SNP;使用VCFtools(v0.1.14)[20]-hwe參數(shù)檢測(cè)哈迪-溫伯格平衡(Hardy-Weinberg equilibrium, HWE),并刪除嚴(yán)重偏離HWE(p< 0.01)的SNP;將過(guò)濾后的SNP及其上下游35 bp側(cè)翼序列提交至Affymetrix Axiom?myDesign GW生物信息分析流程(Thermo Fisher Scientific Inc.,美國(guó))進(jìn)行探針設(shè)計(jì)。在該流程中,每個(gè)SNP被分配一個(gè)p-convert值(介于0和1之間),表示給定的SNP在Affymetrix Axiom芯片系統(tǒng)上轉(zhuǎn)換為可靠SNP位點(diǎn)的概率,該值綜合考慮了SNP序列、結(jié)合能、預(yù)期的非特異性結(jié)合程度以及與多個(gè)基因組區(qū)域的雜交情況等。根據(jù)流程中的p-convert值和其他一些質(zhì)量控制指標(biāo),SNP被分類為“recommended”[p-convert值大于0.6,無(wú)干擾多態(tài)性(wobble)和polycount = 0]、“not recommended”(p-convert值小于0.4,或者無(wú)wobble大于等于3,或者polycount > 0,或者重復(fù)計(jì)數(shù)大于0)、“not possible”(在給定的鏈上不能構(gòu)建探針來(lái)分型該方向上的SNP)和“neutral”(其他)。僅保留“recommended”或“neutral”類SNP的探針以供進(jìn)一步分析。同時(shí),要求候選SNP的側(cè)翼序列沒(méi)有其他變異或重復(fù)元件,側(cè)翼序列的GC含量為30%~70%。
在此基礎(chǔ)上進(jìn)行進(jìn)一步過(guò)濾,以確保SNP在整個(gè)基因組中分布均勻。我們排除了大多數(shù)A/T和C/G類型的SNP,因?yàn)檫@些標(biāo)記在Affymetrix Axiom芯片平臺(tái)上占據(jù)的空間是其他類型標(biāo)記的兩倍。將最終選擇的SNP探針與2000個(gè)DQC探針(陰性對(duì)照)錨定在芯片上。最后,我們使用SNPeff(v4.2)預(yù)測(cè)芯片上SNP對(duì)牙鲆基因功能的潛在影響[21]。
為了評(píng)估“魚芯1號(hào)”芯片的分型效果,我們對(duì)168個(gè)牙鲆個(gè)體進(jìn)行了基因分型,包括從基因組重測(cè)序樣品中隨機(jī)選擇的96個(gè)(用于初始SNP集發(fā)掘)和從基因組選擇參考群體中隨機(jī)選擇的72個(gè)[15]。
從每個(gè)樣品中提取基因組DNA,并根據(jù)Affymetrix Axiom?2.0檢測(cè)方案進(jìn)行標(biāo)記,最終DNA濃度為50 ng?μL?1,體積為10 μL。DNA雜交和芯片掃描在Affymetrix GeneTitan芯片系統(tǒng)(Thermo Fisher公司,美國(guó))上完成,生成原始數(shù)據(jù)CEL文件。這些文件被導(dǎo)入Axiom Analysis Suite軟件中進(jìn)行質(zhì)量控制和基因分型。樣品質(zhì)量控制參數(shù)為:DQC值≥0.82、檢出率≥0.97、合格樣品的百分?jǐn)?shù)≥95%、合格樣品的平均檢出率≥98.5%(遵循“最佳實(shí)踐工作流程”),并采用默認(rèn)的SNP質(zhì)量控制閾值過(guò)濾基因分型結(jié)果。
通過(guò)信號(hào)強(qiáng)度和聚類分析評(píng)估SNP的探針轉(zhuǎn)化質(zhì)量,并計(jì)算雜合/純合基因型的數(shù)量。根據(jù)這些指標(biāo),將SNP分為6類:“PolyHighResolution”(SNP具有良好的聚類分辨率,并且至少有兩個(gè)樣本具有最小等位基因)、“MonoHighResolution”(SNP具有良好的聚類分辨率,但是具有最小等位基因的樣本不到兩個(gè))、“NoMinorHom”(SNP具有良好的聚類分辨率,但沒(méi)有樣本具有最小等位基因)、“OffTargetVariation”(OTV,被稱為脫靶變異集群)、“CallRateBelowThreshold”(SNP的檢出率低于閾值,但是其他屬性高于閾值)和“Other”(一個(gè)以上聚類屬性低于閾值)[22]。
為了進(jìn)一步測(cè)試SNP芯片的基因分型質(zhì)量和準(zhǔn)確性,我們從基因組重測(cè)序樣本中隨機(jī)挑選了96個(gè)個(gè)體,并比較了由這兩種方法獲得的基因型的一致性。
葡萄作為一種喜光植物,所以在促成栽培的過(guò)程中進(jìn)行良好的光照調(diào)節(jié)是非常有必要的。為了更好的保證棚內(nèi)葡萄可以得到充分的光照,果農(nóng)每年都應(yīng)該為大棚更換新的無(wú)滴膜,在這個(gè)基礎(chǔ)上也可以通過(guò)在葡萄藤下設(shè)置反光膜和膜下滴灌技術(shù)來(lái)更好的保證葡萄的光合作用。
基于芯片分析獲得了168個(gè)個(gè)體的基因分型數(shù)據(jù),我們利用GCTA [23]工具進(jìn)行了主成分分析(PCA),并繪制了第一個(gè)和第二個(gè)成分的主成分分析圖。
我們?cè)谇捌诠ぷ髦?,利用全基因組重測(cè)序數(shù)據(jù),研究了基因組選擇技術(shù)在牙鲆抗遲緩愛德華氏菌(Edwardsiella tarda)選育中的應(yīng)用前景[15]。在本研究中,我們使用“魚芯1號(hào)”芯片對(duì)72個(gè)候選個(gè)體進(jìn)行了基因分型,其中27個(gè)個(gè)體(包括14尾雄魚和13尾雌魚)是16個(gè)家系的親本。使用加權(quán)基因組最佳線性無(wú)偏預(yù)測(cè)(wGBLUP)估算GEBV,將雙親GEBV均值作為相應(yīng)家系的GEBV。估計(jì)育種值(EBV)利用包含四代系譜數(shù)據(jù)的最佳線性無(wú)偏預(yù)測(cè)(ABLUP)進(jìn)行估算,(G)EBV估計(jì)的模型為:
式中,y是表型向量,其中包含個(gè)體表型值(0表示在感染實(shí)驗(yàn)中死亡,1表示存活);b是固定效應(yīng)向量(包括均值、不同的感染實(shí)驗(yàn)批次以及感染時(shí)的年齡);g是隨機(jī)效應(yīng)向量;e是隨機(jī)殘差。對(duì)于wGBLUP [24],假定隨機(jī)效應(yīng)向量服從N(0,G*σg2),其中G*為通過(guò)迭代算法得到的加權(quán)基因組關(guān)系矩陣[25]。對(duì)于ABLUP,假設(shè)g服從N(0,Aσg2),其中A是具有四代譜系的親緣關(guān)系矩陣;σg是加性遺傳方差;X和Z是構(gòu)造矩陣,分別用于聯(lián)系表型和固定效應(yīng)以及表型和個(gè)體隨機(jī)效應(yīng)。使用R腳本構(gòu)建加權(quán)G矩陣,并在R-ASReml中估算(G)EBV [26]。
由于已經(jīng)對(duì)16個(gè)子代牙鲆家系進(jìn)行了遲緩愛德華氏菌感染實(shí)驗(yàn),wGBLUP和ABLUP的預(yù)測(cè)準(zhǔn)確性可以通過(guò)家系GEBV和感染存活率進(jìn)行評(píng)估。將受試者工作特征曲線(AUC)下面積[27]用作衡量wGBLUP和ABLUP預(yù)測(cè)準(zhǔn)確性的指標(biāo)。為了估計(jì)AUC,將16個(gè)家系的平均感染存活率(44.33%)作為閾值,高于和低于平均值的家系分別記為1和0。使用R-pROC估算AUC [28]。
本研究旨在研發(fā)牙鲆高質(zhì)量和標(biāo)準(zhǔn)化的SNP芯片,并驗(yàn)證其在基因組選擇育種中的應(yīng)用效果。影響SNP芯片設(shè)計(jì)和質(zhì)量的因素很多,如初始SNP集的質(zhì)量、SNP過(guò)濾和篩選參數(shù)以及芯片生產(chǎn)技術(shù)等。Affymetrix公司和Illumina公司提供了兩種最常用的SNP芯片制作平臺(tái)。兩種平臺(tái)均使用靶標(biāo)雜交技術(shù)檢測(cè)位點(diǎn)特異性探針,并且探針強(qiáng)度反映了相應(yīng)等位基因的豐度[29]。在Affymetrix芯片中,指定位置的探針平鋪在芯片表面以獲得SNP信息,而Illumina芯片則使用微珠固定探針,這些SNP基因分型平臺(tái)已被廣泛應(yīng)用于遺傳學(xué)研究。高通量NGS是一種用于鑒定全基因組SNP的有效技術(shù),可用于為SNP芯片篩選SNP。
我們對(duì)168條牙鲆進(jìn)行全基因組重測(cè)序,在質(zhì)量控制后獲得了974.9 Gb的測(cè)序數(shù)據(jù)。將這些數(shù)據(jù)與來(lái)自90 個(gè)育種家系的931個(gè)個(gè)體的測(cè)序數(shù)據(jù)相結(jié)合,這931 個(gè)個(gè)體具有系譜信息并且具有不同的抗病表型[15]。最后,將1099個(gè)個(gè)體的3.54 Tb測(cè)序數(shù)據(jù)(見附錄A中的表S1)與參考基因組進(jìn)行比對(duì),鑒定了超過(guò)4220萬(wàn)個(gè)SNP。不同家系個(gè)體的大規(guī)?;蚪M重測(cè)序使我們能夠獲得高質(zhì)量的候選SNP集,這對(duì)于芯片的SNP篩選非常有利。
初步鑒定的SNP集使用以下篩選步驟:首先,我們過(guò)濾并保留了MAF≥0.05、缺失率小于0.1和未顯著偏離HWE(p< 0.01)的SNP。MAF過(guò)濾排除了變異頻率很低的SNP,缺失率高表明該基因型在群體中的數(shù)量有限,HWE過(guò)濾排除了由測(cè)序錯(cuò)誤和自然選擇引起的SNP。因此,這些過(guò)濾去除了可能影響結(jié)果的低質(zhì)量SNP。過(guò)濾后得到一個(gè)包含3 410 891個(gè)SNP的候選SNP集,這些SNP被提交到Affymetrixin silico探針設(shè)計(jì)流程,其中959 651個(gè)SNP通過(guò)了p-convert評(píng)估。最后,我們選擇了均勻分布于全基因組的48 697個(gè)SNP,這些SNP的平均p-convert值為0.684。
圖1.牙鲆“魚芯1號(hào)”SNP芯片中SNP位點(diǎn)的MAF。(a)MAF的比例;(b)MAF在24條染色體上的分布。
為了評(píng)估SNP在整個(gè)基因組中的分布,我們將芯片上的SNP位點(diǎn)與牙鲆參考基因組進(jìn)行比對(duì),計(jì)算了SNP位點(diǎn)間的距離。我們發(fā)現(xiàn),SNP廣泛分布于牙鲆基因組,且相鄰SNP位點(diǎn)間具有均勻的間隔,平均間隔距離為9.6 kb [圖2(a)]:5125個(gè)SNP間距小于6 kb、5175個(gè)(10.8%)SNP間距為6~7 kb、6315個(gè)(13.1%)SNP間距為7~8 kb、5471個(gè)(11.4%)SNP間距為8~9 kb、5546個(gè)(11.6%)SNP間距為9~10 kb、6017個(gè)(12.5%)SNP間距為10~11 kb、6557個(gè)(13.7%)SNP間距為11~12 kb、5964個(gè)(12.4%)SNP間距為12~13 kb;累計(jì)約96%相鄰SNP的間距大于13 kb。這些SNP均勻地分布在整個(gè)基因組中,在24條染色體中的平均間距的中位數(shù)為9.8 kb[圖2(b)]。對(duì)于SNP之間距離較大的區(qū)域,只有少數(shù)SNP符合篩選標(biāo)準(zhǔn)。
對(duì)芯片上的所有SNP進(jìn)行注釋,并根據(jù)預(yù)測(cè)效應(yīng)將其分為不同的類別(表1)。在48 697個(gè)SNP中,有26 274個(gè)SNP(53.9%)位于基因區(qū),包括外顯子、內(nèi)含子、剪接位點(diǎn)以及基因上游和下游序列的1 kb區(qū)域。基因區(qū)中兩個(gè)最豐富的類別是內(nèi)含子和同義突變,分別包含23 475個(gè)和1912個(gè)SNP。非基因區(qū)SNP包括1684個(gè)(3.46%)上游(距離起始密碼子1~5 kb)、1754個(gè)(3.60%)下游(距離終止密碼子1~5 kb)和18 985個(gè)(38.99%)基因間SNP。
表1 牙鲆“魚芯1號(hào)”SNP芯片上SNP位點(diǎn)的效應(yīng)類別
采用來(lái)自育種家系的168個(gè)DNA樣本評(píng)估了芯片的分型效果,其中166個(gè)樣本(98.2%)通過(guò)了樣本質(zhì)控,檢出率閾值為97%。針對(duì)基因型檢出率、聚類分離、多態(tài)性以及芯片與重測(cè)序分型的SNP的一致性,評(píng)估了“魚芯1號(hào)”芯片的基因分型效果。
圖2.牙鲆“魚芯1號(hào)”SNP芯片的位點(diǎn)間距分布。(a)24條染色體上的位點(diǎn)間距;(b)具有不同位點(diǎn)間距的SNP分布。
在“ 魚 芯1號(hào) ” 芯 片 的48 697個(gè)SNP中, 有36 383個(gè)SNP(74.71%)通過(guò)了所有的質(zhì)量標(biāo)準(zhǔn)。在這些SNP位點(diǎn)中,有41.07%被歸類為多態(tài)性的(“PolyHighResolution”和“NoMinorHom”),有33.64%被歸類為單態(tài)性的(“MonoHighResolution”)。其他位點(diǎn)的基因分型質(zhì)量較差,聚類效果不好,被分類為“OTV”“CallRateBelowThreshold”或“Others”。檢測(cè)到較高比例(33.64%)的單態(tài)SNP,其中一些可能是SNP發(fā)掘過(guò)程中的假陽(yáng)性,或者由于缺乏合適的檢測(cè)標(biāo)記而無(wú)法對(duì)SNP進(jìn)行有效鑒定。另外,我們使用的168 個(gè)個(gè)體與重測(cè)序進(jìn)行SNP發(fā)掘的群體屬于同一群體,因此基因型非常相似;如果對(duì)更多的群體進(jìn)行基因分型,則其中一些SNP可能是多態(tài)的。
我們比較了“魚芯1號(hào)”芯片獲得的基因型和重測(cè)序數(shù)據(jù)獲得的基因型。在包含96個(gè)樣本的測(cè)試中,應(yīng)用芯片成功對(duì)95個(gè)樣本實(shí)現(xiàn)基因分型。在分型成功的SNP位點(diǎn)中,14 899個(gè)(41.0%)位點(diǎn)與重測(cè)序數(shù)據(jù)獲得的結(jié)果一致,4002個(gè)(11.0%)、3421個(gè)(9.4%)和3162 個(gè)(8.7%)SNP的一致率分別為0.95~0.99、0.90~0.95和0.85~0.90。綜上所述,70%的SNP的一致率不低于85%,表明“魚芯1號(hào)”芯片和基因組重測(cè)序獲得的SNP分型結(jié)果能夠相互驗(yàn)證。
群體結(jié)構(gòu)分析是許多群體遺傳學(xué)研究的基礎(chǔ)。為了評(píng)估“魚芯1號(hào)”芯片是否可以檢測(cè)群體分離狀況,我們基于168個(gè)個(gè)體的SNP進(jìn)行了主成分分析。根據(jù)第一和第二主成分(PC),將所有樣本分為兩個(gè)組(圖3),分別對(duì)應(yīng)于我國(guó)河北省和山東省的起源/采樣地點(diǎn),證明了“魚芯1號(hào)”具有表征群體結(jié)構(gòu)的能力。
選擇育種可以對(duì)魚類的重要經(jīng)濟(jì)性狀進(jìn)行遺傳改良。我們基于不同的育種家系和遲緩愛德華氏菌人工感染,完成了牙鲆抗病基因組選擇技術(shù)的研究[15]。為了測(cè)試“魚芯1號(hào)”芯片在基因組選擇中的應(yīng)用效果,我們應(yīng)用芯片對(duì)16個(gè)隨機(jī)選擇的家系的親本(共27個(gè)個(gè)體)進(jìn)行基因分型,并利用參考群體估算了(G)EBV [15]。其中7個(gè)家系的平均存活率是61.13%(命名為抗病家系),其余9個(gè)家系的平均存活率為31.27%(命名為易感家系),抗病家系的平均GEBV(2.10)高于易感家系的平均GEBV(1.56)(表2)。由圖4可知,wGBLUP的預(yù)測(cè)準(zhǔn)確性高達(dá)80%,超過(guò)了ABLUP方法(66%),并且與ABLUP方法相比,將SNP芯片和wGBLUP相結(jié)合預(yù)測(cè)育種值的準(zhǔn)確性相對(duì)提高了21.21%。此外,GEBV與EBV之間中等強(qiáng)度相關(guān)(Pearson相關(guān)系數(shù)為0.70),表明基因組選擇方法和ABLUP方法預(yù)測(cè)育種值的準(zhǔn)確性具有差異。我們的結(jié)果與已報(bào)道的魚類抗病基因組選擇研究一致,即與ABLUP方法相比,基因組選擇方法在GEBV估計(jì)方面表現(xiàn)得更好,預(yù)測(cè)準(zhǔn)確性提高了13%~52% [30–32]。上述結(jié)果表明,“魚芯1號(hào)”芯片可用于牙鲆抗病基因組選擇育種。然而,本研究中用于估計(jì)GEBV的個(gè)體數(shù)有限,不能完全模擬牙鲆抗遲緩愛德華氏菌的基因組選擇,因此,需要增加個(gè)體數(shù)目以全面評(píng)估“魚芯1號(hào)”芯片用于基因組選擇的效果。目前,我們正在努力增加參考群體和候選群體的樣本數(shù)量,并使用SNP芯片完成基因分型。
表2 16個(gè)牙鲆家系感染遲緩愛德華氏菌后的存活率及估計(jì)育種值
圖3.使用牙鲆“魚芯1號(hào)”芯片獲得的基因分型結(jié)果開展種群結(jié)構(gòu)主成分分析。“Hebei”“Shandong”分別表示在我國(guó)河北省和山東省收集的個(gè)體。
圖4.使用受試者工作特征曲線評(píng)估wGBLUP和ABLUP對(duì)基因組選擇的預(yù)測(cè)準(zhǔn)確性。
本文報(bào)道了牙鲆50K“魚芯1號(hào)”SNP芯片的設(shè)計(jì)和研發(fā)。利用1099個(gè)個(gè)體的全基因組重測(cè)序數(shù)據(jù),鑒定了超過(guò)4220萬(wàn)個(gè)變異位點(diǎn)的起始SNP集;根據(jù)MAF、基因組位置和Thermo Fisher Axiom?技術(shù)的探針設(shè)計(jì)建議,選擇了48 697個(gè)SNP制作芯片。利用“魚芯1號(hào)”芯片,獲得了168個(gè)樣本的高質(zhì)量的基因分型數(shù)據(jù),這些數(shù)據(jù)用于抗病基因組選擇中的效果與已報(bào)道的研究一致,預(yù)測(cè)準(zhǔn)確性高于傳統(tǒng)基于系譜的BLUP方法。結(jié)果表明,“魚芯1號(hào)”芯片適用于重要經(jīng)濟(jì)性狀的基因組選擇,可以為牙鲆基因分型和良種選育提供一個(gè)重要的技術(shù)平臺(tái)。
致謝
本研究得到了山東省自然科學(xué)基金(ZR2016QZ003)、國(guó)家自然科學(xué)基金(31461163005)、中央級(jí)公益性科研院所基本科研業(yè)務(wù)費(fèi)(2020TD20和2016HY-ZD0201)、青島海洋科學(xué)技術(shù)國(guó)家實(shí)驗(yàn)室支持的鰲山科技人才培養(yǎng)計(jì)劃(2017ASTCP-OS15),以及山東省泰山學(xué)者攀登計(jì)劃項(xiàng)目的支持。
Authors’ contribution
Song-lin Chen obtained the funding, and conceived and instructed the study.Qian Zhou performed the SNP selection and probe design for the SNP array.Ya-dong Chen and Yang Liu prepared the DNA sample.Qian Zhou, Sheng Lu, and Yadong Chen performed the SNP array scanning and analyzed the genotyping data.Sheng Lu performed GEBV calculation.Yang-zhen Li, Lei Wang, and Yingming Yang performed the family construction and bacterial challenging experiment.Wen-teng Xu and Na Wang participated the project managements.Qian Zhou, Sheng Lu, and Song-lin Chen wrote the manuscript.All authors reviewed the manuscript.
Compliance with ethics guidelines
Qian Zhou, Ya-dong Chen, Sheng Lu, Yang Liu, Wenteng Xu, Yang-zhen Li, Lei Wang, Na Wang, Ying-ming Yang, and Song-lin Chen declare that they have no conflict of interest or financial conflicts to disclose.
Appendix A.Supplementary data
Supplementary data to this article can be found online at https://doi.org/10.1016/j.eng.2020.06.017.