韋怡林,張力戈,張松源,詹鳳婷,李秀領(lǐng),喬瑞敏,韓雪蕾,李新建,王克君
(河南農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,河南鄭州 450046)
我國(guó)是豬肉消費(fèi)大國(guó),豬肉產(chǎn)量和消費(fèi)量均占我國(guó)肉類總產(chǎn)量和居民肉類消費(fèi)量的60% 以上。豬肉具有豐富的蛋白質(zhì),可為人體提供必需脂肪酸,此外還可改善缺鐵性貧血,因此,生產(chǎn)低甘油三酯(TG)的優(yōu)質(zhì)豬肉是當(dāng)前養(yǎng)豬生產(chǎn)的現(xiàn)實(shí)要求。
TG 是由甘油的3 個(gè)脂肪酸分子和3 個(gè)羥基經(jīng)過酯化而形成的甘油酯,是機(jī)體內(nèi)儲(chǔ)存量最大以及產(chǎn)能最多的能源物質(zhì)。血漿TG 與動(dòng)脈粥樣硬化性心血管疾病(CVD)密切相關(guān)。一項(xiàng)多重回歸分析顯示TG 由于可以獨(dú)立預(yù)測(cè)高密度脂蛋白膽固醇(HDLC)、膽固醇酯轉(zhuǎn)運(yùn)蛋白(Cholesteryl Ester Transfer Protein,CETP)活性以及氧化性低密度脂蛋白(OX-LDL)水平,在合并胰島素抵抗的高甘油三酯血癥(HTG)患者中,高水平TG 是導(dǎo)致動(dòng)脈粥樣硬化(Atherosclerosis,AS)的決定性因素。另一項(xiàng)為期12 年的隨訪調(diào)查結(jié)果顯示,TG ≥138 mg/d L 的CVD 患者死亡率顯著上升。
近年來,多基因標(biāo)記篩選方法發(fā)展迅速,全基因組關(guān)聯(lián)分析(Genome-Wide Association Study,GWAS)已成為主流方法之一,GWAS 分析是指在全基因組層面上,開展多中心、大樣本、反復(fù)驗(yàn)證的基因與表型的關(guān)聯(lián)研究,可高效地將表型和基因型進(jìn)行關(guān)聯(lián)并用于搜尋相關(guān)性狀候選基因。由于GWAS 不再受預(yù)先設(shè)定的候選基因的限制,使得眾多功能不明的基因及大量基因間區(qū)域的SNP 都為復(fù)雜性狀的研究提供了線索。Meta 分析方法的使用可追溯到17 世紀(jì)的天文學(xué)研究,是一類可以綜合多項(xiàng)研究結(jié)果的統(tǒng)計(jì)分析方法,能夠得到一個(gè)新的、更為可靠的研究結(jié)論。此外,Meta 分析還可以對(duì)比不同的研究結(jié)果,發(fā)現(xiàn)它們之間的變異(差異)或者一些內(nèi)在規(guī)律,從而研究他們之間可能存在的關(guān)系。因此,Meta 分析又是對(duì)特定研究問題的系統(tǒng)性評(píng)估方法。本研究利用BeadChips 60K SNP芯片對(duì)1 256 頭豬的TG 含量進(jìn)行GWAS 分析和Meta-GWAS 分析,主要目的是挖掘影響豬TG 含量的候選基因,為豬后續(xù)的選育提供理論依據(jù)。
1.1 數(shù)據(jù)來源及實(shí)驗(yàn)群體 本實(shí)驗(yàn)下載了1 256 頭豬的Beadchips 60K SNP 芯片數(shù)據(jù)(https://datadryad.org/stash/dataset/doi:10.5061/0dryad.4gh70),包括萊蕪豬316 頭、二花臉豬333 頭和杜洛克×(長(zhǎng)白×約克郡)(DLY)607 頭。所有豬體質(zhì)健康,在標(biāo)準(zhǔn)室內(nèi)條件下飼養(yǎng),每天3 次喂食含16%粗蛋白、3 100 KJ 可消化能量和0.78%賴氨酸的飼料。萊蕪豬和二花臉豬在300±3 d屠宰。DLY 豬在相同條件下飼養(yǎng),并在180 d 左右屠宰。所有實(shí)驗(yàn)豬均在夜間禁食(約12 h),但在屠宰前可以自由飲水。從數(shù)據(jù)庫(kù)中調(diào)取這1 256 頭豬的信息,主要包括個(gè)體ID、3 個(gè)群體、TG 含量等數(shù)據(jù)。
1.2 表型數(shù)據(jù)測(cè)定及分析 本實(shí)驗(yàn)研究的表型性狀為TG 含量。從主動(dòng)脈收集血液樣本,血液在室溫下自然凝固10~20 min 之后,在4℃條件下,以3 000 rpm離心血凝塊20 min 以分離血清。仔細(xì)收集上清,在保存過程中如果出現(xiàn)沉淀,應(yīng)再次離心。血清樣品需要在-80℃條件下保存直到使用。然后使用Determiner-L TG 的檢測(cè)試劑盒,根據(jù)制造商的說明測(cè)量TG 水平。此外,使用Excel 對(duì)所有豬的表型數(shù)據(jù)進(jìn)行統(tǒng)計(jì)以及整理,并使用R 軟件進(jìn)行一般統(tǒng)計(jì)學(xué)分析,包括所有數(shù)據(jù)的平均數(shù)、標(biāo)準(zhǔn)差、最大值、最小值等。
1.3 基因型及表型數(shù)據(jù)質(zhì)量控制 使用Plink v1.90軟件對(duì)原始數(shù)據(jù)進(jìn)行質(zhì)量控制(QC),質(zhì)量控制的條件如下:刪除SNP 檢出率<99% 的位點(diǎn);刪除次要等位基因頻率(Minor Allelic Frequency,MAF)<0.01 的SNP 位點(diǎn)。
1.4 GWAS 分析 本研究是利用rMVP 軟件包,基于BeadChips 60K SNP 芯片針對(duì)1 256 頭豬體內(nèi)的TG 含量進(jìn)行的GWAS 分析。FarmCPU 模型為:
其中:表示表型觀測(cè)值向量;表示固定效應(yīng)的關(guān)聯(lián)矩陣;表示固定效應(yīng)向量,包括性別和批次;是SNP 替代效應(yīng);是的關(guān)聯(lián)矩陣;是服從分布N(0,G)的隨機(jī)加性遺傳效應(yīng)的向量,其中G 是從SNP標(biāo)記導(dǎo)出的親屬關(guān)系矩陣,是加性方差;是的單位矩陣;是殘差。
1.5 Meta-GWAS 分析 通過METAL對(duì)萊蕪豬、二花臉豬、DLY 豬這3 種豬的GWAS 分析結(jié)果進(jìn)行薈萃分析。
1.6 基因注釋及候選基因篩選 本實(shí)驗(yàn)根據(jù)顯著SNP 的物理位置,利用Ensembl 數(shù)據(jù)庫(kù)信息對(duì)顯著SNP 位點(diǎn)上下游0.5 Mb 范圍內(nèi)的基因進(jìn)行基因功能注釋,并通過注釋的基因功能以及相關(guān)研究,初步篩選出與豬TG含量可能有關(guān)的候選基因。
2.1 描述性統(tǒng)計(jì)分析 本研究對(duì)3 種豬體內(nèi)TG 含量這一表型性狀進(jìn)行描述性統(tǒng)計(jì)分析,分析內(nèi)容主要包括:最大值、最小值、平均值、標(biāo)準(zhǔn)差(表1)。
表1 表型性狀的描述性統(tǒng)計(jì)分析
由表1 可知,萊蕪豬和二花臉豬的TG 含量相當(dāng),DLY 豬的TG 含量較高。圖1 所示是3 種豬的TG 含量這一表型性狀的頻率分布圖,橫坐標(biāo)為表型值,縱坐標(biāo)為表型值分布的頻數(shù)。
圖1 頻率分布圖
2.2 基因型質(zhì)量控制 基因型數(shù)據(jù)經(jīng)過質(zhì)量控制后,剩余55 043 個(gè)SNP 位點(diǎn),因此在后續(xù)的關(guān)聯(lián)分析中共使用55 043 個(gè)SNP 位點(diǎn)。
2.3 GWAS 分析結(jié)果 圖2~7 是本實(shí)驗(yàn)所使用3 種豬(萊蕪豬、二花臉豬、DLY 豬)體內(nèi)TG 含量GWAS 分析研究所得結(jié)果的SNP 密度圖、曼哈頓圖和QQ 檢驗(yàn)。通過R 軟件中的rMVP 包來進(jìn)行曼哈頓圖和QQ 圖的繪制,在曼哈頓圖中x 軸表示染色體號(hào),并且每個(gè)基因組SNP 位點(diǎn)沿染色體序列排列,y 軸為SNP 位點(diǎn)對(duì)應(yīng)的值,可以理解為每個(gè)SNP 與表型的關(guān)聯(lián)程度。染色體水平閾值和基因組水平閾值分別為1.816761e-05 和9.083807e-07,應(yīng)用Bonferroni 校正來確定全基因組(<0.05/SNP 數(shù))顯著性閾值,所有檢驗(yàn)顯著的SNP 位點(diǎn)一共有32 個(gè),在萊蕪豬中發(fā)現(xiàn)與TG 存在顯著關(guān)聯(lián)的SNP 位點(diǎn)有6 個(gè),在二花臉豬中發(fā)現(xiàn)與TG存在顯著關(guān)聯(lián)的SNP 位點(diǎn)有8 個(gè),在DLY 豬中發(fā)現(xiàn)與TG 存在顯著關(guān)聯(lián)的SNP 位點(diǎn)有18 個(gè),不同豬相關(guān)的顯著SNP 和候選基因見表2~4。
圖2 萊蕪豬甘油三酯GWAS 分析的SNP 密度圖
圖3 二花臉豬甘油三酯GWAS 分析的SNP 密度圖
圖4 DLY 豬甘油三酯GWAS 分析的SNP 密度圖
圖5 萊蕪豬甘油三酯GWAS 分析的曼哈頓圖和QQ 檢驗(yàn)
圖6 二花臉豬GWAS 分析的曼哈頓圖和QQ 檢驗(yàn)
圖7 DLY 豬甘油三酯GWAS 分析的曼哈頓圖和QQ 檢驗(yàn)
表2 3 個(gè)豬群甘油三酯的全基因組水平和染色體水平顯著SNP 位點(diǎn)
表3 GWAS 顯著SNP 位點(diǎn)基因注釋
本研究利用Ensembl 數(shù)據(jù)庫(kù),通過生物信息學(xué)對(duì)GWAS 分析所篩選出來的顯著位點(diǎn)進(jìn)行對(duì)比、分析和查詢,最終確定該位點(diǎn)從開始到結(jié)束的物理信息、距離該位點(diǎn)最近的基因以及對(duì)該基因進(jìn)行功能注釋。
萊蕪豬、二花臉豬、DLY 豬的GWAS 顯著SNP 位點(diǎn)功能注釋信息見表5。由表5 可知,與萊蕪豬TG 顯著相關(guān)的6 個(gè)SNP 位點(diǎn)中,定位到1 個(gè)基因;與二花臉豬TG 顯著相關(guān)的8 個(gè)SNP 位點(diǎn)中,共定位到3 個(gè)基因;與DLY 豬TG 顯著相關(guān)的18 個(gè)SNP 位點(diǎn)中,定位到4 個(gè)距離SNP 位點(diǎn)最近的基因。
2.4 Meta-GWAS 分析 為了確定新的重要基因位點(diǎn),對(duì)1 256 頭豬進(jìn)行了Meta-GWAS 分析,Meta-GWAS 分析的染色體水平閾值和基因組水平閾值分別為1.915819e-05 和9.579095e-07,參與計(jì)算的SNP 個(gè)數(shù)為52 197。通過Meta-GWAS 分析發(fā)現(xiàn)了2 個(gè)新的位點(diǎn),分別位于1 號(hào)和10 號(hào)(48358200:49193112)染色體(圖8),并鑒定到1 個(gè)基因即,它可能通過與非受體酪氨酸激酶和/或相互作用,對(duì)細(xì)胞生長(zhǎng)和轉(zhuǎn)化起到負(fù)調(diào)控作用。
圖8 Meta-GWAS 分析的曼哈頓圖
2.5 GO 分析和KEGG 分析 為探究8 個(gè)候選基因的生物學(xué)功能,對(duì)其進(jìn)行了GO 和KEGG 富集分析,結(jié)果顯示:主要富集在平滑肌收縮(Smooth Muscle Contraction)和肌漿網(wǎng)對(duì)游離鈣離子向胞漿釋放的調(diào)節(jié)(Regulation of Release of Sequestered Calcium Ion into Cytosol by Sarcoplasmic Reticulum)等相關(guān)條目,參與代謝途徑(Metabolic Pathways)和過氧物酶體(Perox isome)等相關(guān)通路(圖9、10)。
圖9 候選基因GO 分析
圖10 候選基因KEGG 分析
TG 是人體內(nèi)儲(chǔ)存量及產(chǎn)能最多的能源物質(zhì),除了供給和儲(chǔ)存能源,還可固定和保護(hù)人體內(nèi)臟。雖然TG對(duì)人體有諸多好處,但是當(dāng)人體內(nèi)TG 水平過高時(shí),就會(huì)引發(fā)高甘油三酯血癥、糖尿病、胰腺炎以及動(dòng)脈粥樣硬化等疾病,當(dāng)TG>4.5 mmol/L(400 mg/dl)即可被診斷為高甘油三酯血癥。據(jù)報(bào)道,基因是TG 的致病基因?;蛭挥?4 號(hào)染色體附近的編碼區(qū)域,是一種蛋白質(zhì)編碼基因,可參與人類脂蛋白的代謝調(diào)控,并且基因的啟動(dòng)子區(qū)域甲基化的轉(zhuǎn)變將會(huì)影響基因表達(dá),使高密度脂蛋白膽固醇降低,TG 升高,從而引起脂質(zhì)代謝紊亂,促使動(dòng)脈粥樣硬化的形成與發(fā)展。
本實(shí)驗(yàn)使用BeadChips 60K SNP 芯片,共檢測(cè)到32 個(gè)全基因組顯著的SNP 位點(diǎn)。在本實(shí)驗(yàn)中萊蕪豬關(guān)于TG 的候選基因?yàn)榛?,該基因位?3 號(hào)染色體附近的候選區(qū)域。是一種蛋白質(zhì)編碼基因,它是完成細(xì)胞分裂所必需的,而且還可能在細(xì)胞凋亡和細(xì)胞增殖的調(diào)節(jié)中發(fā)揮作用,這表明它可能在脂肪生長(zhǎng)中起著重要作用,從而調(diào)控TG 水平。
本實(shí)驗(yàn)中二花臉豬關(guān)于TG 的候選基因?yàn)?、和基因,分別位于1 號(hào)、7 號(hào)和13 號(hào)染色體附近的候選區(qū)域。能夠調(diào)節(jié)B 細(xì)胞活化反應(yīng);促進(jìn)B 細(xì)胞的AG 依賴性增殖,并防止其末端分化為抗體形成細(xì)胞;此外,可在不同細(xì)胞類型的細(xì)胞分化中發(fā)揮作用,這表明它可能與脂肪生長(zhǎng)有關(guān),進(jìn)而調(diào)控TG 水平。是在肺表面活性劑穩(wěn)態(tài)中起關(guān)鍵作用的受體,可能在控制脂肪細(xì)胞功能方面發(fā)揮作用。是一種細(xì)胞外基質(zhì)(ECM)降解酶,對(duì)硫酸軟骨素蛋白聚糖(CSPG)的透明質(zhì)子組顯示蛋白水解活性,包括ACAN、VCAN、BCAN 和NCAN;并且,還可通過相似性參與棕色脂肪組織的發(fā)育和白色脂肪組織的褐變。
DLY 豬中關(guān)于TG 的候選基因?yàn)?、、以及基因,分別位于1 號(hào)、1 號(hào)、11 號(hào)和14 號(hào)染色體附近的候選區(qū)域?;蚺c冠狀動(dòng)脈粥樣硬化性心臟病有關(guān),而TG 含量過高則會(huì)導(dǎo)致此病的產(chǎn)生,因此推測(cè)基因可能與TG 調(diào)控有關(guān);也是一種細(xì)胞外基質(zhì)(ECM)降解酶,能夠?qū)α蛩彳浌撬氐鞍拙厶牵–SPG)的透明質(zhì)子組顯示蛋白水解活性,包括ACAN、VCAN、BCAN 和NCAN;并且,還可通過選擇性翻譯特定類別的mRNA,在細(xì)胞增殖過程中發(fā)揮重要作用;是一種胞質(zhì)三肽基肽酶,能從多肽中釋放N 端三肽,并且是泛素-蛋白酶體途徑中26S 蛋白酶體下游的蛋白水解級(jí)聯(lián)反應(yīng)的組分;能夠在細(xì)胞內(nèi)氨基酸穩(wěn)態(tài)中起重要作用,并可通過相似性刺激脂肪生成。與非酒精性脂肪肝、肝硬化有關(guān)。本實(shí)驗(yàn)結(jié)果表明,、、、、、、和等基因可能是影響豬TG 含量的候選基因,因此對(duì)以上基因的研究將會(huì)為研究TG 含量提供理論支持。
本研究收集了BeadChips 60K SNP 芯片分型豬場(chǎng)的1 256 頭豬的所有樣本數(shù)據(jù),并采用了FarmCPU 模型對(duì)3 種豬的TG 含量進(jìn)行了GWAS 和Meta-GWAS 分析,經(jīng)過一系列研究分析后,共檢測(cè)到32 個(gè)全基因組顯著的SNP 位點(diǎn)。、等基因可能參與了TG 水平的調(diào)控過程,本實(shí)驗(yàn)結(jié)果將會(huì)為調(diào)控TG 水平進(jìn)而為生產(chǎn)低甘油三酯的優(yōu)良豬肉選育工作提供候選分子標(biāo)記,為TG 水平的調(diào)控提供理論支持。