崔晟頔,張力戈,張松源,詹鳳婷,李秀領(lǐng),喬瑞敏,韓雪蕾,李新建,王克君
(河南農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,河南鄭州 450046)
河南地方豬是我國寶貴的種質(zhì)資源。河南地方豬種具有許多優(yōu)良的種質(zhì)特征,如繁殖力高、耐粗飼、肉質(zhì)好等,是河南省養(yǎng)豬業(yè)發(fā)展的重要資源。藏豬是我國唯一的高原型豬種,也是我國寶貴的地方品種資源。藏豬長期生活于高寒地區(qū),具有適應(yīng)高寒惡劣條件、耐粗飼、瘦肉率高等特點(diǎn),但繁殖力較低。由于社會(huì)經(jīng)濟(jì)發(fā)展迅速和人民生活質(zhì)量提高,市場對(duì)瘦肉型豬的需求增加,因此在養(yǎng)豬生產(chǎn)中追求高產(chǎn)出和高收益,這使得國外豬種被大面積引進(jìn)與河南地方豬種進(jìn)行雜交,雖然提高了本地豬種的生產(chǎn)性能,但卻導(dǎo)致純種豬的數(shù)量急劇減少。而藏豬因?yàn)閲庳i種的引進(jìn),更是面臨種群滅絕的危險(xiǎn)。在我國豬肉產(chǎn)量已成為世界第一的今天,我國養(yǎng)豬生產(chǎn)也應(yīng)向優(yōu)質(zhì)化和可持續(xù)化發(fā)展。
隨著測序技術(shù)的發(fā)展,基于測序數(shù)據(jù)進(jìn)行選擇信號(hào)分析可以快速準(zhǔn)確地篩選出受選擇區(qū)域并定位到相關(guān)候選基因。通過對(duì)候選基因的功能注釋,利用基因敲除、敲低或過表達(dá)等方式驗(yàn)證基因的功能,能夠篩選確定關(guān)鍵功能基因,以應(yīng)用于遺傳改良或新品種培育的實(shí)踐中。目前對(duì)多個(gè)群體進(jìn)行選擇信號(hào)檢測常用的方法是群體分化指數(shù)(Fixation indices,F(xiàn)st)方法。群體遺傳分化是指物種群體間存在明顯的等位基因頻率差異,通常遺傳漂變和選擇過程均可造成群體間的遺傳分化。Fst 是檢測群體間遺傳分化的重要指標(biāo)之一,而對(duì)全基因組范圍內(nèi)的單個(gè)位點(diǎn)估算Fst 值,就能對(duì)每個(gè)位點(diǎn)分析其分化程度,最終實(shí)現(xiàn)選擇信號(hào)檢測。通過選擇信號(hào)分析鑒定豬重要經(jīng)濟(jì)性狀候選基因已有諸多報(bào)道,陶偉等鑒定出5 個(gè)影響豬肉滴水損失的候選基因。馮雪燕等挖掘出91 個(gè)與海南豬重要經(jīng)濟(jì)性狀相關(guān)的候選基因。李景研究過藏豬高原適應(yīng)性選擇信號(hào),而河南地方豬這方面的研究較少。
本研究利用全基因組重測序數(shù)據(jù)從基因組范圍內(nèi)對(duì)河南地方豬、藏豬和野豬進(jìn)行群體遺傳結(jié)構(gòu)分析和選擇信號(hào)分析,并對(duì)河南地方豬和藏豬進(jìn)行基因流分析,旨在探究河南地方豬和藏豬的遺傳分化和基因交流情況,發(fā)掘與重要經(jīng)濟(jì)性狀相關(guān)的候選基因,為河南地方豬和藏豬的種質(zhì)資源保護(hù)和開發(fā)利用提供參考。
1.1 實(shí)驗(yàn)動(dòng)物 本研究從NCBI 的Sequnence Read Archive(SRA)數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/sra)中下載了66 頭豬的全基因組重測序數(shù)據(jù)。其中,河南地方豬包括淮南豬(HN)9 頭、確山黑豬(QS)10 頭和南陽黑豬(NY)10 頭,共29 頭豬,藏豬(ZZ)共28 頭,野豬包括河南野豬(WHN)6 頭和中國野豬(WB)3 頭,共9 頭豬。
1.2 數(shù)據(jù)質(zhì)量控制 對(duì)全基因組重測序數(shù)據(jù)按照移除性染色體、保留常染色體、次要等位基因頻率<0.01 且檢出率>0.99 的標(biāo)準(zhǔn)進(jìn)行過濾后,共獲得6 884 804 個(gè)常染色體雙等位基因SNP 用于后續(xù)分析。
1.3 群體遺傳結(jié)構(gòu)分析 使用PLINK(https://www.cog-genomics.org/plink2/)進(jìn)行主成分分析(Principal Component Analysis,PCA)。并使用R(https://www.rproject.org/)繪制每個(gè)個(gè)體的散點(diǎn)分布圖。使用Admix ture(http://dalexander.github.io/admixture/)進(jìn)行群體結(jié)構(gòu)分析,最佳聚類數(shù)(K)由交叉驗(yàn)證誤差率的方法確定。使用IQ-TREE(http://www.iqtree.org/)生成系統(tǒng)進(jìn)化樹;并使用R 的ggtree(https://guangchuangyu.github.io/software/ggtree/)繪制系統(tǒng)進(jìn)化樹。
1.4 選擇信號(hào)分析 使用Vcftools(http://vcftools.sourc eforge.net/index.html)分別對(duì)河南地方豬、藏豬和野豬進(jìn)行Fst 分析(窗口大小為20 000,步長為5 000),計(jì)算公式如下:
其中,MSG 是未檢測的群體內(nèi)部位點(diǎn)的誤差均方,MSP 是檢測的群體之間位點(diǎn)的均方差,n指校正后群體間的平均樣本大小。
1.5 候選基因的檢測和注釋 以Fst 分析得到的前1%窗口作為各品種受選擇區(qū)域,將受選擇區(qū)域內(nèi)的基因使用Enesmbl 數(shù)據(jù)庫(https://asia.ensembl.org/index.html)的BioMart 功能進(jìn)行基因功能注釋,并利用GeneCards 網(wǎng)站(https://www.genecards.org/)和閱讀文獻(xiàn)查詢?nèi)炕虻墓δ堋?/p>
1.6 候選基因的富集分析 利用DAVID 數(shù)據(jù)庫(http://david.abcc.ncifcrf.gov/summary.jsp)對(duì)基因進(jìn)行GO(Gene Ontology)富集分析和KEGG(Kyoto Encyclo pedia of Genes and Genomes)富集分析,并分別生成富集分析圖。
1.7 基因流分析 使用TreeMix 軟件推斷分化和混合情況。使用R 的OptM(https://www.rdocumentation.org/packages/OptM/versions/0.1.6)判斷最優(yōu)m 值,使用最優(yōu)m 值進(jìn)行TreeMix 分析,并繪制最大似然樹。
2.1 群體遺傳結(jié)構(gòu)分析 對(duì)6 個(gè)豬種進(jìn)行PCA 分析、系統(tǒng)進(jìn)化樹分析和群體遺傳結(jié)構(gòu)分析。PCA 結(jié)果顯示,野豬在右下角,與其他豬種距離較遠(yuǎn);淮南豬、確山黑豬和南陽黑豬聚在一起,藏豬的分布比較分散,主要聚集成了3 個(gè)部分(圖1)。系統(tǒng)進(jìn)化樹分析結(jié)果顯示,3 個(gè)河南地方豬種在同一個(gè)大分支上,確山黑豬和南陽黑豬在一個(gè)分支上,南陽黑豬在另一個(gè)分支上;藏豬在一個(gè)大分支上,并分出3 個(gè)分支;中國野豬和河南野豬在一個(gè)大分支上,有2 個(gè)河南野豬個(gè)體并未和其他個(gè)體劃分在同一個(gè)分支上(圖2)。群體遺傳結(jié)構(gòu)分析結(jié)果顯示,當(dāng)K 為2 時(shí),交叉驗(yàn)證誤差最?。▓D3A),所以K 的最佳估計(jì)數(shù)為2。當(dāng)K=2 時(shí),淮南豬、南陽黑豬、確山黑豬和藏豬、野豬、河南野豬很明顯的分離出來;當(dāng)K=3 時(shí),淮南豬被分離出來,藏豬被分成2 個(gè)亞群;當(dāng)K=4 時(shí),確山黑豬、藏豬和野豬被分離出來;當(dāng)K=5 時(shí),南陽黑豬和淮南豬,野豬和河南野豬仍然混在一起;當(dāng)K=6 時(shí),南陽黑豬被分離出來(圖3B)。
圖1 PCA 分析結(jié)果
圖2 系統(tǒng)進(jìn)化樹
圖3 群體遺傳結(jié)構(gòu)分析
2.2 Fst 分析結(jié)果 使用Vcftools 對(duì)河南本地豬、藏豬和野豬進(jìn)行Fst 分析。結(jié)果顯示:河南地方豬和藏豬之間的前1% 窗口有446 個(gè)受選擇區(qū)域(圖4A),其中注釋出的基因有134 個(gè);河南地方豬和野豬之間前1%窗口有446 個(gè)受選擇區(qū)域(圖4B),注釋出的基因有179 個(gè);藏豬和野豬前1%窗口有446 個(gè)受選擇區(qū)域(圖4C),注釋出的基因有148 個(gè)。3 次比對(duì)獲得的全部基因共有369 個(gè)。
圖4 Fst 曼哈頓圖
2.3 功能富集分析 將3 次比對(duì)獲得的全部369 個(gè)基因進(jìn)行GO 富集分析和KEGG 富集分析。GO 富集分析顯示:基因顯著富集于細(xì)胞核(Nucleus)、胞質(zhì)溶膠(Cytosol)、RNA 聚合酶II 對(duì)轉(zhuǎn)錄的負(fù)調(diào)控(Negative Regulation of Transcription by RNA Polymerase II)和凋亡過程的正向調(diào)控(Positive Regulation of Apoptotic Process)等通路(圖5);KEGG 富集分析顯示:基因顯著富集于磷酸肌醇代謝(Inositol Phosphate Metabolism)、磷脂酰肌醇信號(hào)系統(tǒng)(Phosphatidylinositol Signaling System)、內(nèi)分泌和其他因子調(diào)節(jié)的鈣重吸收(Endocrine and Other Factor-Regulated Calcium Reabsorption)、代謝途徑(Metabolic Pathways)和內(nèi)吞作用(Endocyt osis)等通路(圖6)。
圖5 GO 富集分析圖
圖6 KEGG 富集分析圖
2.4 基因流分析 基因流指一個(gè)物種的一個(gè)種群向另一個(gè)種群的基因轉(zhuǎn)移,利用OptM 判斷最優(yōu)m 值為2,以m=2繪制最大似然樹(圖7)?;蛄鞣治鼋Y(jié)果顯示:藏豬和確山黑豬有少量的基因轉(zhuǎn)移,即發(fā)生了基因交流情況。
圖7 基因滲入圖
3.1 群體遺傳結(jié)構(gòu)分析與基因流分析 遺傳結(jié)構(gòu)分析顯示,3 個(gè)河南地方豬的親緣關(guān)系很近,2 個(gè)主成分并不能將3 個(gè)豬群體分離,3 個(gè)群體在進(jìn)化樹上的距離也很近,在同一個(gè)分支上。藏豬在PCA 分析中群體分布比較散亂,主要形成了3 個(gè)聚集;藏豬群體內(nèi)親緣關(guān)系較低,在進(jìn)化樹上也分成了3 個(gè)分支,可能是由于取材的藏豬來自不同的地區(qū),分布區(qū)域較為廣泛;遺傳結(jié)構(gòu)分析顯示藏豬內(nèi)部存在外源滲入和結(jié)構(gòu)分化現(xiàn)象,基因流分析也顯示藏豬與確山黑豬存在基因交流情況,這可能是藏豬與確山黑豬進(jìn)行過雜交改良所導(dǎo)致的。
3.2 選擇信號(hào)分析 基于Fst 方法對(duì)6 個(gè)豬種進(jìn)行選擇信號(hào)分析,并對(duì)前1%的窗口進(jìn)行基因功能注釋,共注釋出369 個(gè)基因,這些基因富集在GO 的1 401 個(gè)條目上和KEGG 的225 個(gè)條目上。
本研究發(fā)現(xiàn)和在細(xì)胞的生長和存活過程中發(fā)揮作用;和在細(xì)胞的增殖和分化中發(fā)揮作用。這些基因作用于細(xì)胞的生長、增殖和分化過程,可能會(huì)影響豬的生長發(fā)育。能介導(dǎo)音猬因子(SHH)信號(hào),通過其在SHH 信號(hào)傳導(dǎo)中的作用在細(xì)胞增殖和分化中發(fā)揮作用。則是胞質(zhì)分裂的關(guān)鍵調(diào)節(jié)因子??梢酝ㄟ^TRIP4 去甲基化調(diào)節(jié)細(xì)胞內(nèi)核受體的反式激活,從而調(diào)節(jié)細(xì)胞增殖和分化。能通過調(diào)節(jié)G1/S 期轉(zhuǎn)換在細(xì)胞增殖中發(fā)揮作用。
、、、和在精子生成中發(fā)揮作用。和在胚胎發(fā)育過程中發(fā)揮作用,和在精卵結(jié)合中發(fā)揮作用??赡軈⑴c卵子和早期胚胎中的細(xì)胞骨架重組。是卵裂溝的正常形成和雌性生殖細(xì)胞減數(shù)分裂過程中極體擠出所必需的??赡茉诰雍吐涯讣?xì)胞的分化中起作用。以上基因可能會(huì)影響豬的繁殖性能。
、和在心臟發(fā)育和血管生成中發(fā)揮作用,而、和可以調(diào)控缺氧中的基因表達(dá)。這些基因可能與藏豬心血管器官發(fā)達(dá)、能適應(yīng)高原環(huán)境有關(guān)。可作為轉(zhuǎn)錄因子,調(diào)節(jié)參與炎癥反應(yīng)、血管生成、脂肪生成和細(xì)胞凋亡的多個(gè)基因的表達(dá)。是抑制缺氧中的基因表達(dá)的關(guān)鍵因子,通過直接結(jié)合其啟動(dòng)子區(qū)域上的RE1/NRSE 位點(diǎn)來抑制缺氧中的基因表達(dá)。是參與誘導(dǎo)氧調(diào)節(jié)基因的轉(zhuǎn)錄因子。在對(duì)低氧張力的適應(yīng)性反應(yīng)中充當(dāng)轉(zhuǎn)錄調(diào)節(jié)劑,作為缺氧誘導(dǎo)基因表達(dá)的調(diào)節(jié)劑。
本研究發(fā)現(xiàn)3 個(gè)基因與脂肪的合成與代謝有關(guān),可能與豬的低瘦肉率有關(guān)??梢源碳ぐ咨窘M織(WAT)中的脂肪生成。能通過結(jié)合長鏈脂肪酸并促進(jìn)其轉(zhuǎn)運(yùn)到細(xì)胞中從而參與肌肉脂質(zhì)利用、脂肪能量儲(chǔ)存和腸道脂肪吸收。而在長鏈脂肪酸及其?;o酶A 酯的細(xì)胞內(nèi)轉(zhuǎn)運(yùn)中起作用。
共6 個(gè)基因與免疫功能相關(guān),可能與河南地方豬和藏豬的高抗病性有關(guān)。是適應(yīng)性免疫的關(guān)鍵調(diào)節(jié)劑,對(duì)于維持調(diào)節(jié)性T 細(xì)胞功能和B 細(xì)胞成熟至關(guān)重要。是配體激活的轉(zhuǎn)錄因子,在免疫過程中起重要作用。與kappa 免疫球蛋白基因增強(qiáng)子中的kappa-E2 位點(diǎn)結(jié)合。能激活免疫球蛋白基因表達(dá)。
本研究通過群體遺傳結(jié)構(gòu)分析結(jié)果顯示,3 個(gè)河南地方豬品種的親緣關(guān)系近,河南野豬因?yàn)榈乩砦恢玫脑蚺c河南地方豬的親緣關(guān)系相較中國野豬更近。利用6個(gè)豬品種的全基因組重測序數(shù)據(jù),應(yīng)用Fst 方法檢測豬基因組的選擇信號(hào),共篩選出47 個(gè)候選基因,其中14個(gè)基因與細(xì)胞生長、增殖和分化有關(guān),3 個(gè)基因與心血管發(fā)育有關(guān),3 個(gè)基因與氧調(diào)節(jié)有關(guān),18 個(gè)基因與繁殖性能有關(guān),3 個(gè)基因與脂肪的合成與代謝有關(guān)。此外基因流分析顯示,藏豬與確山黑豬之間有基因交流。這些研究結(jié)果為河南地方豬和藏豬的種質(zhì)資源保護(hù)與利用提供了參考。