李完波,朱亞玲,艾華水,郭添福
(江西農(nóng)業(yè)大學(xué)省部共建豬遺傳改良與養(yǎng)殖技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,南昌 330045)
?
豬小體型相關(guān)受選擇基因位點(diǎn)的研究
李完波*#,朱亞玲#,艾華水,郭添福*
(江西農(nóng)業(yè)大學(xué)省部共建豬遺傳改良與養(yǎng)殖技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,南昌 330045)
旨在通過(guò)對(duì)比大、小體型兩組中國(guó)地方豬種在基因組上的遺傳分化,檢測(cè)出全基因組選擇信號(hào),以期能鑒別出影響豬體型大小的相關(guān)基因及可能的突變位點(diǎn),解析小體型豬種形成的分子機(jī)制。本研究選用小體型的五指山豬和巴馬香豬,以大體型的金華豬、二花臉、河套大耳豬為對(duì)照,基于全基因組重測(cè)序數(shù)據(jù),使用兩組豬群間的遺傳分化系數(shù)(Fst)和小體型豬組內(nèi)的雜合度(Heterozygosity) 檢測(cè)體型選擇信號(hào)。Fst值較大而雜合度小的染色體區(qū)段作為體型相關(guān)的受選擇候選區(qū)域。對(duì)這些候選區(qū)域所包含的基因進(jìn)行基因功能及通路的注釋分析、以及突變位點(diǎn)的搜尋,試圖揭示與豬體型大小相關(guān)的可能受選擇的基因和突變。結(jié)果,通過(guò)篩選全基因組重測(cè)序數(shù)據(jù),我們得到32 475 218個(gè)高質(zhì)量的SNPs,利用40 kb的滑動(dòng)窗口進(jìn)行Fst和雜合度的計(jì)算。Fst值經(jīng)Z轉(zhuǎn)換(Z(Fst))后大于5的區(qū)段有242個(gè)。取雜合度最小值的前200個(gè)區(qū)間與242個(gè)Z(Fst)>5的區(qū)間的交集,確定了13個(gè)受選擇候選區(qū)域,其中共包含28個(gè)基因。通過(guò)PANTHER進(jìn)行基因注釋,發(fā)現(xiàn)了17個(gè)與體型性狀相關(guān)的候選基因,包括IGF1R、GUCY1A3等功能候選基因。本研究基于高通量測(cè)序數(shù)據(jù),結(jié)合群體遺傳學(xué)分析手段,確定了與體型大小相關(guān)的受選擇區(qū)域,綜合分析推測(cè)五指山和巴馬香小體型豬的形成可能是由于處于非基因編碼區(qū)域的一個(gè)或者多個(gè)突變?cè)斐伞?/p>
小型豬;全基因組重測(cè)序;選擇信號(hào);體型大??;候選基因
豬是人類較早馴化的家養(yǎng)動(dòng)物之一。由于受到較強(qiáng)的人工選擇及對(duì)所處圈養(yǎng)環(huán)境的適應(yīng),家豬品種在體型外貌、生長(zhǎng)性能和行為習(xí)慣等重要性狀上與野豬有了明顯分化。中國(guó)南方地區(qū)有著豐富的小型豬豬種資源,如五指山豬、巴馬香豬、從江香豬、劍白香豬、環(huán)江香豬、滇南小耳豬等,其一般都具有體型小、生長(zhǎng)緩慢、肉質(zhì)細(xì)嫩和耐近交的特點(diǎn)[1]。小型豬的成年個(gè)體體重多在40 kg以下,而五指山豬成年個(gè)體體重更低于25 kg[2]。與小型豬相比,分布在中國(guó)南方和北方的大型豬的體型明顯要大,成年豬體重一般超過(guò)100 kg[3]。而豬的體型大小和生長(zhǎng)速度一直都是商業(yè)豬種選育的重點(diǎn),在遺傳上解析小型豬的形成機(jī)制,并定位相關(guān)的突變基因位點(diǎn),對(duì)豬種遺傳差異的探索及品種的選育都具有重要的指導(dǎo)意義。此外,豬在器官大小和生理特性等方面和人類接近,而小型豬體型小、飼養(yǎng)經(jīng)濟(jì)、便于管理的優(yōu)點(diǎn)可作為人類醫(yī)學(xué)模式動(dòng)物的理想材料。在弄清小型豬遺傳機(jī)制的基礎(chǔ)上,通過(guò)常規(guī)或基因工程育種方法進(jìn)一步縮小我國(guó)現(xiàn)存的小型豬豬種的體型,將有可能推動(dòng)小型醫(yī)學(xué)試驗(yàn)豬在更大范圍的應(yīng)用。
隨著第二代高通量測(cè)序技術(shù)成本的大幅下降,全基因組重測(cè)序的策略被大量應(yīng)用于遺傳學(xué)和基因組學(xué)研究中。近年來(lái),基于全基因組重測(cè)序數(shù)據(jù),通過(guò)檢測(cè)基因組范圍內(nèi)的選擇信號(hào)(Signatures of selection),大量與馴化、適應(yīng)性和重要性狀相關(guān)的受選擇區(qū)段被相繼報(bào)道。其中,涉及的研究對(duì)象有雞、牛、狗、豬、羊等[4-7]。對(duì)單一品種或群體進(jìn)行選擇信號(hào)檢測(cè)時(shí),很難確定該區(qū)段是真正的受選擇區(qū)域還是由于遺傳漂變?cè)斐傻摹1狙芯拷梃b前人的策略,將五指山豬和巴馬香豬合為小型豬組,將金華豬、二花臉豬和河套大耳豬合為大型豬組。同時(shí),在大、小體型豬組間應(yīng)用群體分化系數(shù)(Fst)初步確定兩組間的受選擇區(qū)域。Fst利用了群體間存在的較顯著的等位基因頻率差異來(lái)檢測(cè)選擇信號(hào),但它并不能說(shuō)明到底是哪個(gè)群體存在選擇,即選擇方向不明確。因此,結(jié)合小型豬群體的雜合度(Heterozygosity)分析,進(jìn)一步確定小型豬中特異受選擇的區(qū)段,并以Fst和雜合度分析結(jié)果的重疊區(qū)間做為小型豬中受選擇的候選區(qū)間,從而可以較為準(zhǔn)確的確定與體型大小相關(guān)的受選擇區(qū)間。
本研究利用公共數(shù)據(jù)庫(kù)和本試驗(yàn)新增的小型豬和大型豬的全基因組測(cè)序數(shù)據(jù),通過(guò)群體遺傳學(xué)方法檢測(cè)全基因組選擇信號(hào),以期解析中國(guó)小型豬形成的分子機(jī)理,為豬種遺傳改良及開(kāi)發(fā)實(shí)用的小型醫(yī)用模式豬提供理論基礎(chǔ)。
1.1試驗(yàn)材料
本研究選用小型豬五指山豬6頭、巴馬香豬12頭,大型豬金華豬6頭、二花臉豬6頭和河套大耳豬6頭作為試驗(yàn)材料(表1)。五指山豬、巴馬香豬、二花臉豬、河套大耳豬全基因組重測(cè)序數(shù)據(jù)從H.S.Ai等[8]發(fā)表的數(shù)據(jù)中獲得。金華豬重測(cè)序數(shù)據(jù)是基于Illumina公司Hiseq 4000平臺(tái)產(chǎn)生。
1.2全基因組重測(cè)序數(shù)據(jù)的處理
質(zhì)控過(guò)濾后的測(cè)序reads通過(guò)BWA軟件(http://bio-bwa.sourceforge.net/)比對(duì)到豬參考基因組susScr3版本(http://hgdownload.soe.ucsc.edu/goldenPath/susScr3/bigZips/)。 Picard軟件(http://picard.sourceforge.net)用來(lái)去除重復(fù)reads。其后,使用GATK(The Genome Analysis Toolkit)軟件[9],將比對(duì)后得到的bam文件在含有插入或缺失突變的區(qū)間進(jìn)行區(qū)域內(nèi)重新比對(duì),并進(jìn)行堿基測(cè)序質(zhì)量校正(Recalibration)。通過(guò)使用GATK HaplotypeCaller算法,針對(duì)每一個(gè)測(cè)序個(gè)體生成一個(gè)gVCF文件。最后,使用所有試驗(yàn)個(gè)體的gVCF文件產(chǎn)生了單核苷酸多態(tài)位點(diǎn)(SNP)和短插入缺失(INDEL)數(shù)據(jù)集。通過(guò)使用GATK的SelectVariants功能選擇出高質(zhì)量SNP位點(diǎn),并設(shè)定如下的SNP過(guò)濾標(biāo)準(zhǔn)“QD>2.0 && MQ>40.0 && FS<60.0 && ReadPosRankSum>-8.0 && MQRankSum>-12.5”,舍棄含3個(gè)以上等位基因的位點(diǎn),最終獲得了一套高質(zhì)量SNP數(shù)據(jù)集用于群體遺傳學(xué)分析。
表1試驗(yàn)豬樣本信息表
Table 1The summary information for sampled pigs
分組Group品種Breed個(gè)體數(shù)Numberofanimals測(cè)序深度Depthofcoverage金華豬6~26×大體型豬Large-size二花臉豬6~21×河套大耳豬6~20×小體型豬Small-size五指山豬6~21×巴馬香豬12~22×
1.3選擇信號(hào)檢測(cè)
本研究采用VCFtools (http://vcftools.sourceforge.net/),以40 kb染色體區(qū)間為滑動(dòng)窗口,每次滑動(dòng)20 kb來(lái)計(jì)算大、小體型豬之間的Fst。VCFtools采用C.C.Cockerham 和B.S.Weir于1984年發(fā)表的算法來(lái)計(jì)算Fst值[10]。同時(shí),以相同大小的滑動(dòng)窗口策略進(jìn)行小型豬組內(nèi)期望雜合度的計(jì)算?;瑒?dòng)窗口的期望雜合度為區(qū)間內(nèi)每個(gè)SNP位點(diǎn)期望雜合度的平均值,該計(jì)算使用Python代碼完成。因有些區(qū)間可能是調(diào)控序列受選擇,為盡可能囊括靶向基因,在候選受選擇區(qū)域上下游各加100 kb再繼續(xù)下游分析。
1.4受選擇區(qū)域的候選基因注釋、GO分析和通路分析
由于豬參考序列基因注釋不完善,豬中注釋的RefSeq轉(zhuǎn)錄本僅有5 305個(gè),相較于人和老鼠的基因數(shù)差距很大。為避免在后續(xù)分析中遺漏基因,通過(guò)利用UCSC Genome Browser (http://genome.ucsc.edu/)在受選擇區(qū)間選出豬中已注釋的RefSeq基因,同時(shí),將人和小鼠中同時(shí)注釋了的同源基因(豬中暫無(wú)注釋的)也納入后續(xù)分析。通過(guò)這種策略,大大擴(kuò)充了后續(xù)分析基因集,有效避免了遺漏未注釋的基因。其后,采用PANTHER (http://www.pantherdb.org/)和DAVID (https://david.ncifcrf.gov/)兩個(gè)軟件對(duì)候選基因的功能和通路進(jìn)行注釋分析。此外,還系統(tǒng)檢索了豬的QTL數(shù)據(jù)庫(kù)(http://www.animalgenome.org/cgi-bin/QTLdb/SS/index),分析與體重、體長(zhǎng)和生長(zhǎng)等性狀相關(guān)的QTL是否在受選擇區(qū)域富集。
1.5基因突變注釋
為找到可能影響小型豬體型形成的關(guān)鍵突變,本研究對(duì)13個(gè)候選區(qū)域里的變異進(jìn)行注釋。通過(guò)應(yīng)用本地版Variant Effect Predictor (VEP)(http://www.ensembl.org/info/docs/tools/vep/index.html)軟件,對(duì)候選基因所包含的所有SNP和插入缺失突變進(jìn)行注釋。同時(shí),對(duì)可能顯著影響基因功能、結(jié)構(gòu)的突變位點(diǎn),還進(jìn)行了多物種間的序列保守性分析。VEP軟件運(yùn)行代碼:
perl variant_effect_predictor.pl --database --coding_only --sift b --species sus_scrofa --input_file Input_selected.vcf --force_overwrite。
2.1候選受選擇區(qū)域
本試驗(yàn)利用常染色體40 kb滑動(dòng)窗口計(jì)算區(qū)間Fst值。所得Fst平均值為0.092,方差為0.049,接近正態(tài)分布,將Fst進(jìn)行標(biāo)準(zhǔn)化得到Z(Fst)。Z(Fst)越大表明群體間遺傳分化程度越大。以相同滑動(dòng)窗口策略計(jì)算五指山和巴馬香豬群體的雜合度(Heterozygosity),得到區(qū)間雜合度平均值為0.342,方差為0.043,符合正態(tài)分布,標(biāo)準(zhǔn)化后得到Z(H)。通過(guò)Z(Fst)值可以看出,大、小體型豬種在很多染色體區(qū)間存在遺傳分化,最顯著的區(qū)間出現(xiàn)在8號(hào)染色體上(圖1a,表2)。由于大、小體型豬種間可能存在除體型以外的差異,這些區(qū)間不一定都和體型大小相關(guān)。通過(guò)比較Z(H)較小區(qū)間和Z(Fst)較大區(qū)間之間的重疊區(qū)間來(lái)判定這些區(qū)間是否和體型大小相關(guān)(圖1b)。為選擇出極端候選受選擇區(qū)域,使用242個(gè)Z(Fst)≥5的區(qū)間與Z(H)負(fù)值端最小的200個(gè)區(qū)間的重疊區(qū)域,再經(jīng)合并得到13個(gè)候選區(qū)間(長(zhǎng)度為240~720 kb)。這些候選區(qū)間共覆蓋約4.2 Mb基因組區(qū)域,包含28個(gè)基因(圖1a)。
a.豬18條常染色體上Z(Fst)正值端的分布,虛線為Z(Fst)=5;b.豬18條常染色體Z(H)負(fù)值端的分布,虛線為取200個(gè)最小Z(H)的閾值a.The positive end of the Z(Fst) plotted on 18 pig autosomes.A dashed horizontal line indicates the cut-off Z(Fst)=5;b.The negative end of the Z(H) plotted on 18 pig autosomes.A dashed horizontal line indicates the cut-off for 200 smallest Z(H)圖1 常染色體上Z(Fst)和Z(H)的分布情況Fig.1 The distribution of Z(Fst) and Z(H) on autosomes
2.2相關(guān)性狀QTL 在候選受選擇區(qū)域的富集
為驗(yàn)證所得到的候選受選擇區(qū)域和豬的生長(zhǎng)、體重、體長(zhǎng)等性狀相關(guān),在pig QTLdb數(shù)據(jù)庫(kù)中搜索13個(gè)候選受選擇區(qū)域所包含的已知QTL(http://www.animalgenome.org)。共發(fā)現(xiàn)924個(gè)QTLs與候選區(qū)間重疊,其中407個(gè)(~44%)QTLs與體型大小直接或間接相關(guān)。與生長(zhǎng)、體型直接相關(guān)的QTLs為95個(gè),如與體重、胴體長(zhǎng)、胴體重、體長(zhǎng)、脊椎數(shù)、日增重等相關(guān)QTLs(表2)。同時(shí),大多數(shù)選擇區(qū)域至少對(duì)應(yīng)3個(gè)以上和生長(zhǎng)相關(guān)的QTLs。這些結(jié)果說(shuō)明和體型相關(guān)的QTL在候選區(qū)域富集,同時(shí)說(shuō)明本研究檢測(cè)選擇信號(hào)的方法可靠。
表213個(gè)選擇區(qū)域
Table 213 regions of selection
染色體Chromosome受選擇區(qū)間RegionZ(Fst)Z(H)相關(guān)數(shù)量性狀位點(diǎn)MappedQTL*1151180001~1514200007.040-3.940Bodyweight(20weeks)QTL(5)TeatnumberQTL(3)1153360001~1536200009.624-4.046Bodyweight(20weeks)QTL(5)DailyfeedintakeQTL(1)1256760001~2570600009.745-4.067AveragedailygainQTL(10)BodyweightQTL(4)1274500001~2747400007.415-3.940averagedailygainQTL(12)BodyweightQTL(7)278540001~787800005.298-3.452CarcassweightQTL(4)BodyweightQTL(2)846180001~469000008.442-3.919TeatnumberQTL(2)Bodyweight(birth)QTL(5)854900001~5532000010.247-4.088BodyweightQTL(5)FeetweightQTL(1)856080001~5642000011.768-4.322TeatnumberQTL(3)BodyweightQTL(5)865840001~660800009.667-4.025Bodyweight(birth)QTL(5)CarcasslengthQTL(1)891160001~914800005.325-3.322BodyweightQTL(3)FeetweightQTL(1)8102460001~1027000008.973-3.982Bodyweight(30weeks)QTL(2)HamweightQTL(1)13114200001~1144800007.284-4.004AveragedailygainQTL(4)VertebranumberQTL(1)1586720001~8706000010.779-4.088AveragedailygainQTL(2)Bodyweight(weaning)QTL(1)
* 括號(hào)中數(shù)字為相應(yīng)QTL出現(xiàn)的次數(shù)
* The number in bracket indicate occurrence of the corresponding QTL
2.3候選基因的GO富集分析和通路分析
利用在線UCSC genome browser工具對(duì)候選區(qū)域進(jìn)行基因注釋,共發(fā)現(xiàn)了28個(gè)基因(圖1a)。為闡明這28個(gè)基因的功能,使用PANTHER (Protein ANalysis THrough Evolutionary Relationships)對(duì)其進(jìn)行功能注釋及GO分析。結(jié)果表明,17個(gè)基因與機(jī)體生長(zhǎng)發(fā)育直接或間接相關(guān)(表3)。這17個(gè)基因大多參與細(xì)胞生長(zhǎng)發(fā)育的生物學(xué)過(guò)程或者重要基礎(chǔ)信號(hào)通路。比如,IGF1R、MCTS1、OBSCN、NPY5R、SMC2等基因參與細(xì)胞生長(zhǎng)、增殖、遷移、分化和凋亡[11];DNAJB6、NAF1、ZNF423等基因調(diào)節(jié)基礎(chǔ)轉(zhuǎn)錄、翻譯;IGF1R、CXXC4、ZNF423、TRIML1等基因參與調(diào)控動(dòng)物體型大小的重要基礎(chǔ)信號(hào)通路。
與動(dòng)物體型大小相關(guān)的信號(hào)通路有:胰島素信號(hào)通路、Wnt信號(hào)通路和Notch信號(hào)通路。胰島素信號(hào)通路(亦稱生長(zhǎng)信號(hào)通路),調(diào)控個(gè)體發(fā)育始于胰島素與胰島素受體的結(jié)合,并由此引發(fā)細(xì)胞內(nèi)一系列信號(hào)轉(zhuǎn)導(dǎo),最終到達(dá)各效應(yīng)器官發(fā)揮作用。IGF1R不僅與細(xì)胞生長(zhǎng)增殖直接相關(guān),同時(shí)在胰島素通路中起著關(guān)鍵調(diào)節(jié)作用,當(dāng)IGF1R受體因子失活時(shí),會(huì)抑制胰島素信號(hào)通路功能的發(fā)揮,從而影響細(xì)胞、器官乃至個(gè)體大小。Wnt信號(hào)通路在生物進(jìn)化過(guò)程中高度保守,該通路的開(kāi)啟或關(guān)閉控制著大量生長(zhǎng)和代謝相關(guān)基因的表達(dá)[12]。而Notch信號(hào)通路是通過(guò)相鄰細(xì)胞之間的相互作用來(lái)調(diào)節(jié)細(xì)胞、組織、器官的分化和發(fā)育,相鄰細(xì)胞借助Notch受體與配體結(jié)合傳遞Notch信號(hào),從而擴(kuò)大并固化細(xì)胞間的分子差異,最終決定細(xì)胞命運(yùn)。Notch信號(hào)通路影響器官形成和細(xì)胞正常形態(tài),同時(shí)在調(diào)節(jié)細(xì)胞生長(zhǎng)和維持組織體內(nèi)平衡的過(guò)程中也起著十分關(guān)鍵的作用[13]。采用DAVID 軟件對(duì)這些候選基因進(jìn)行KEGG通路分析,結(jié)果只富集到了“Long-term depression”信號(hào)通路。從文獻(xiàn)上看,該通路和神經(jīng)突觸的功能相關(guān),并不與生長(zhǎng)發(fā)育有直接聯(lián)系。
表3生長(zhǎng)發(fā)育相關(guān)基因的GO富集分析
Table 3GO term enrichment for genes related to growth and development
染色體Chromosome基因Gene生物學(xué)過(guò)程Biologicalprocess1MCTS1regulationoftranscription(GO:0006355);cellcycle(GO:0007049);positiveregulationofcellproliferation(GO:0008284);regulationofgrowth(GO:0040008);translation(GO:0006412);translationalinitiation(GO:0006413)1PGPEP1Lproteolysis(GO:0006508)1IGF1Rpositiveregulationofcellproliferation(GO:0008284);insulinreceptorsignalingpathway(GO:0008286);insulinreceptorsignalingpathway(GO:0008286);negativeregulationofap-optoticprocess(GO:0043066);organmorphogenesis(GO:0009887)1SMC2mitoticcellcycle(GO:0000278);cellcycle(GO:0007049)1VPS13AproteinretentioninGolgiapparatus(GO:0045053)2OBSCNpositiveregulationofGTPaseactivity(GO:0043547);multicellularorganismaldevelopment(GO:0007275);positiveregulationofapoptoticprocess(GO:0043065);apoptoticsignalingpathway(GO:0097190);celldifferentiation(GO:0030154)2DNAJB6negativeregulationoftranscription,DNA-templated(GO:0045892)4TRIML1multicellularorganismaldevelopment(GO:0007275);negativeregulationofWntsignalingpathway(GO:0030178)8GUCY1A3cGMPbiosyntheticprocess(GO:0006182);translationalinitiation(GO:0006413)8NPY1RG-proteincoupledreceptorsignalingpathway(GO:0007186);celldifferentiation(GO:0030154)8NAF1rRNAprocessing(GO:0006364);ribosomebiogenesis(GO:0042254)8CXXC4zygoticspecificationofdorsal/ventralaxis(GO:0007352);negativeregulationofapoptoticprocess(GO:0043066);negativeregulationofWntsignalingpathway(GO:0030178)8ZNF423Notchsignalingpathway(GO:0007219);celldifferentiation(GO:0030154);positiveregula-tionofBMPsignalingpathway(GO:0030513);regulationoftranscription,DNA-templated(GO:0006355);multicellularorganismaldevelopment(GO:0007275)8GUCY1B3cGMPbiosyntheticprocess(GO:0006182)8NPY5Rnegativeregulationofapoptoticprocess(GO:0043066);positiveregulationofsmoothmusclecellproliferation(GO:0048661)15METTL8methylation(GO:0032259)15DCAF17nucleolus(GO:0005730);integralcomponentofmembrane(GO:0016021);Cul4-RINGE3ubiquitinligasecomplex(GO:0080008)
綜上推測(cè),控制小型豬發(fā)育的基因很可能不局限在一個(gè)信號(hào)通路里,也可能不是由少量幾個(gè)突變?cè)斐傻模怯啥鄠€(gè)參與細(xì)胞生長(zhǎng)發(fā)育及生命基礎(chǔ)代謝的基因突變來(lái)協(xié)同完成。
2.4候選基因的突變注釋
對(duì)所有候選區(qū)間SNP和短插入缺失突變進(jìn)行注釋,共發(fā)現(xiàn)139個(gè)位于基因編碼區(qū)及剪切位點(diǎn)的突變。其中,55個(gè)突變可能影響相關(guān)候選基因的蛋白質(zhì)結(jié)構(gòu),包括50個(gè)錯(cuò)義突變,3個(gè)移碼突變,2個(gè)剪切位點(diǎn)突變,其余全部為同義突變。3個(gè)移碼突變都只出現(xiàn)在一個(gè)個(gè)體上,不太可能是影響小型豬的突變。兩個(gè)剪切突變分別在TDO2和HIGH基因,兩個(gè)突變?cè)诖笮⌒拓i群中都存在,且頻率類似。在50個(gè)錯(cuò)義突變中,有5個(gè)突變?cè)诖蟆⑿⌒拓i中有顯著的頻率差異,即大型豬以參考基因組(杜洛克豬)等位基因純合子為主,小型豬以突變型純合子為主(表4)。它們分別位于ENSSSCG00000027431、VPS13A、OBSCN、ENSSSCG00000027713和DCAF17基因。VPS13A調(diào)節(jié)蛋白等大分子的合成和運(yùn)輸,能夠促進(jìn)蛋白前體的吸收和轉(zhuǎn)化,從而促進(jìn)或抑制細(xì)胞增殖及其分化[14];OBSCN(Obscurins)編碼骨架蛋白,在橫紋肌中起著結(jié)構(gòu)和調(diào)節(jié)作用;DCAF17介入CUL4-DDB1泛素酶調(diào)控通路,泛素酶通過(guò)對(duì)一些特定調(diào)節(jié)子的泛素化來(lái)調(diào)控細(xì)胞的增殖、存活、DNA修復(fù)和基因組完整性[15]。而ENSSSCG00000027431和ENSSSCG00000027713兩個(gè)基因的功能未知。但這5個(gè)錯(cuò)義突變都處于基因的非保守區(qū),表明其不太可能為導(dǎo)致大、小體型豬差異的突變位點(diǎn)。而IGF1R基因?qū)Πl(fā)育過(guò)程中的細(xì)胞增殖、細(xì)胞遷移和器官形成等方面都起到重要的正向調(diào)控作用,同時(shí)參與調(diào)控動(dòng)物體型大小的胰島素信號(hào)通路,可作為本研究理想的候選基因,本研究在該基因上僅找到一個(gè)錯(cuò)義突變,但該突變等位基因僅在大體型豬群中以低頻存在。鑒于本研究的限制,我們不排除有大的結(jié)構(gòu)突變(CNV、大片段插入缺失等)或者調(diào)控序列突變,從而影響這些基因及候選區(qū)間內(nèi)其他基因的表達(dá),進(jìn)而影響體型發(fā)育。
表4候選錯(cuò)義突變位點(diǎn)
Table 4Candidate missense mutations
染色體Chromosome位置Position參考等位基因Referenceallele突變等位基因Alternativeallele基因Gene小型豬Small-sized*大型豬Large-sized*1153408833CTENSSSCG0000002743126/361/361256877225TGVPS13A33/3611/36278651109TCOBSCN31/363/368102608851ACENSSSCG0000002771333/360/361586982578AGDCAF1736/361/36
*. 突變等位基因在大、小體型豬群中的頻率
*. The alternative allele frequency in small-sized and large-sized pigs
近年來(lái),第二代高通量測(cè)序技術(shù)在基因組學(xué)和遺傳學(xué)中廣泛應(yīng)用,使得利用少量個(gè)體基因組測(cè)序信息檢測(cè)基因組范圍內(nèi)的選擇信號(hào)(Signature of selection)成為可能。大量與馴化、適應(yīng)性和重要性狀相關(guān)的受選擇區(qū)段被報(bào)道,其中,涉及的研究對(duì)象有雞、牛、狗、豬、羊等。本研究借鑒前人的策略,將五指山豬和巴馬香豬合為小型豬組,將金華豬、二花臉豬和河套大耳豬合為大型豬組,在大、小體型豬分組間應(yīng)用群體分化系數(shù)(Fst)初步確定兩個(gè)分組間受選擇區(qū)域??紤]到單個(gè)SNP的選擇信號(hào)在經(jīng)歷正向選擇時(shí),通常會(huì)受到種群歷史的隨機(jī)因素影響,很難精確區(qū)分真實(shí)信號(hào)和噪音信號(hào),故本研究結(jié)合40 kb 滑動(dòng)窗口(Sliding window)遺傳分化系數(shù)Fst和雜合度來(lái)確定體型相關(guān)的候選區(qū)域。
本研究共確定13個(gè)選擇區(qū)域,包含了大量影響豬體重、胴體重、腿重和脊椎數(shù)的QTLs,同時(shí),還包含了一系列影響豬采食量和平均日增重的QTLs[16]。此結(jié)果表明,小型豬的形成可能是從遺傳上控制其身體及各個(gè)臟器的生長(zhǎng)發(fā)育,同時(shí)導(dǎo)致其采食量的降低。此外,這13個(gè)區(qū)間共包含28個(gè)基因,通過(guò)PANTHER進(jìn)行基因注釋和富集分析,發(fā)現(xiàn)其中17個(gè)基因與機(jī)體的生長(zhǎng)發(fā)育存在直接或者間接的關(guān)聯(lián)。其中,IGF1R在哺乳動(dòng)物的生長(zhǎng)發(fā)育過(guò)程中起著重要作用。N.B.Sutter等鑒別出決定狗體型大小的關(guān)鍵基因IGF1[17],而IGF1主要是通過(guò)結(jié)合胰島素樣生長(zhǎng)因子受體IGF1R和IGF2R,介導(dǎo)生長(zhǎng)激素的促生長(zhǎng)作用,通過(guò)自身磷酸化激活PI3K以及MAPK信號(hào)通路,調(diào)控細(xì)胞的增殖、分化和凋亡。此外,有研究表明,IGF1R缺陷小鼠在一定程度上患有侏儒癥,同時(shí)會(huì)改變軟骨細(xì)胞增殖,導(dǎo)致骨延長(zhǎng)區(qū)生長(zhǎng)板過(guò)度肥大并凋亡[18],在老鼠中將IGF1R敲除,結(jié)果表明IGF1會(huì)影響骨細(xì)胞介導(dǎo)的骨礦化,而骨礦化則是骨骼形成的關(guān)鍵,因此IGF1R可能是影響豬體型大小的關(guān)鍵候選基因。此外,候選基因GUCY1A3是蛋白編碼基因,編碼可溶性鳥(niǎo)苷酸環(huán)化酶(sGC)α亞基,而sGC是一氧化氮(NO)的主要受體,它啟動(dòng)NO信號(hào)轉(zhuǎn)導(dǎo)通路,是NO-cGMP通路中的關(guān)鍵酶,它參與血管舒縮、抑制血小板凝集及細(xì)胞增殖和凋亡,是控制冠心病和動(dòng)脈粥樣硬化的重要因子,它在金屬離子輔助因子如Mg2+或Mn2+存在下,可轉(zhuǎn)換5在-三磷酸甘氨酸(三磷酸鳥(niǎo)苷)為3′,5′-磷酸鳥(niǎo)苷(cGMP)和焦磷酸。第二信使cGMP通過(guò)刺激蛋白激酶G可改變cGMP-gated離子通道和cGMP調(diào)節(jié)磷酸二酯酶活性,它的關(guān)鍵生理作用是調(diào)節(jié)細(xì)胞增生、細(xì)胞肥大、遷移、細(xì)胞外基質(zhì)生產(chǎn)和細(xì)胞分化等過(guò)程[19]。研究表明,GUCY1A3的敲除會(huì)大幅度影響cGMP調(diào)節(jié)磷酸二酯酶活性,從而影響體內(nèi)細(xì)胞的增殖分化。雖然目前有關(guān)GUCY1A3與動(dòng)物體型大小的研究還不多,但GUCY1A3具有調(diào)控細(xì)胞增殖和凋亡的功能,使其可以作為影響體型大小較為理想的候選基因。另外,DCAF17介入CUL4-DDB1泛素酶調(diào)控通路, 泛素酶通過(guò)對(duì)一些特定調(diào)節(jié)子的泛素化來(lái)調(diào)控細(xì)胞的增殖、存活、DNA修復(fù)和基因組完整性。DCAFs(DDB1和CUL4相關(guān)因子家族)作為DDB1和CUL4蛋白直接的橋梁而介入細(xì)胞泛素化過(guò)程,從而調(diào)控細(xì)胞的基礎(chǔ)功能[15],具有調(diào)控生長(zhǎng)的可能。
本研究在受選擇區(qū)域里富集的基因大多在生命體發(fā)育、基礎(chǔ)代謝中起著極為關(guān)鍵的作用,多個(gè)基因還參與到Wnt、Notch等重要信號(hào)通路。這些關(guān)鍵基因上如果出現(xiàn)較大的蛋白質(zhì)結(jié)構(gòu)突變,有可能會(huì)導(dǎo)致個(gè)體死亡,這也從側(cè)面解釋了為什么候選基因中出現(xiàn)的突變大多在非保守區(qū)。同時(shí)也表明,五指山豬和巴馬香豬小體型的形成不太可能是某個(gè)發(fā)育過(guò)程中關(guān)鍵基因的結(jié)構(gòu)突變?cè)斐桑赡苁怯捎谝粋€(gè)或者多個(gè)基因調(diào)節(jié)突變(比如位于啟動(dòng)子、增強(qiáng)子區(qū)域等)協(xié)同產(chǎn)生。類似的,M.Carneiro等研究發(fā)現(xiàn),野兔的馴化過(guò)程中,野兔和家兔之間的行為差異主要來(lái)源于基因調(diào)控區(qū)域突變(研究人員并未發(fā)現(xiàn)馴化過(guò)程中有基因失活或主效基因的突變,馴化帶來(lái)的改變主要發(fā)生在基因組的非編碼區(qū)域)[20]?;蛘{(diào)控區(qū)的注釋目前在人和小鼠的研究中依據(jù)其相應(yīng)ENCODE項(xiàng)目產(chǎn)生的數(shù)據(jù)來(lái)實(shí)現(xiàn)[21]。當(dāng)前,國(guó)際動(dòng)物遺傳學(xué)界開(kāi)展的FAANG(Functional Annotation of Animal Genomes)計(jì)劃將有類似ENCODE數(shù)據(jù)產(chǎn)生[22],該計(jì)劃將在多個(gè)動(dòng)物物種中系統(tǒng)進(jìn)行基因表達(dá)譜、染色質(zhì)開(kāi)放區(qū)、調(diào)控序列(啟動(dòng)子、增強(qiáng)子、絕緣子等)、甲基化位點(diǎn)和三維染色質(zhì)折疊調(diào)控的研究。屆時(shí),將有可能通過(guò)這些數(shù)據(jù)對(duì)豬的調(diào)控突變進(jìn)行注釋。此外,在本研究中,不能排除存在拷貝數(shù)變異或其他染色體結(jié)構(gòu)突變?cè)谛⌒拓i發(fā)育中起作用。
本研究基于全基因組重測(cè)序數(shù)據(jù),結(jié)合種群遺傳分化指數(shù)Fst和小型豬種內(nèi)雜合度,進(jìn)行系統(tǒng)選擇信號(hào)檢測(cè),共確定了13個(gè)選擇區(qū)域,包含28個(gè)基因。通過(guò)PANTHER進(jìn)行基因注釋和富集分析,發(fā)現(xiàn)其中17個(gè)基因與機(jī)體的生長(zhǎng)發(fā)育存在直接或者間接的關(guān)聯(lián)。GO基因富集分析鑒別到多個(gè)體型相關(guān)的基因,其中包含IGF1R、GUCY1A3等基因。受豬基因組注釋不完善的影響,尤其欠缺調(diào)控序列的注釋,本研究沒(méi)有揭示造成小型豬形成的分子機(jī)制。后續(xù)通過(guò)完善基因及其調(diào)控序列的注釋,將有助于解釋形成小型豬體型的遺傳變異。
致謝:感謝江西農(nóng)業(yè)大學(xué)黃路生院士在試驗(yàn)設(shè)計(jì)和文章修改上提供指導(dǎo)。
[1]商海濤,魏泓.我國(guó)小型豬品系資源狀況初淺分析[J].中國(guó)實(shí)驗(yàn)動(dòng)物學(xué)報(bào),2007,15(1):70-75.
SHANG H T,WEI H.Preliminary analysis of Chinese miniature pig strains and resources[J].ActaLaboratoriumAnimalisScientiaSinica,2007,15(1):70-75.(in Chinese)
[2]王峰,魏立民,鄭心力,等.海南五指山豬生長(zhǎng)發(fā)育性能測(cè)定試驗(yàn)[J].豬業(yè)科學(xué),2009,26(5):108-109.
WANG F,WEI L M,ZHENG X L,et al.The analysis of growth development in Wuzhishan pig in Hainan[J].SwineIndustryScience,2009,26(5):108-109.(in Chinese)
[3]朱榮生,王懷中,張印.杜洛克和大約克豬體重和體尺性狀間典型相關(guān)分析[J].家畜生態(tài)學(xué)報(bào),2009,30(2):26-28.
ZHU R S,WANG H Z,ZHANG Y.Canonical correlation analysis of body weight and body measurement traits in duroc and yorkshire[J].ActaEcologiaeAnimalisDomastici,2009,30(2):26-28.(in Chinese)
[4]RUBIN C J,ZODY M C,ERIKSSON J,et al.Whole-genome resequencing reveals loci under selection during chicken domestication[J].Nature,2010,464(7288):587-591.
[5]AXELSSON E,RATNAKUMAR A,ARENDT M L,et al.The genomic signature of dog domestication reveals adaptation to a starch-rich diet[J].Nature,2013,495(7441):360-364.
[6]MOON S,KIM T H,LEE K T,et al.A genome-wide scan for signatures of directional selection in domesticated pigs[J].BMCGenomics,2015,16:130.
[7]劉真,王慧華,劉瑞鑿,等.不同尾型綿羊全基因組選擇信號(hào)檢測(cè)[J].畜牧獸醫(yī)學(xué)報(bào),2015,46(10):1721-1732.
LIU Z,WANG H H,LIU R Z,et al.Genome-wide detection of selection signatures of distinct tail types in sheep populations[J].ActaVeterinariaetZootechnicaSinica,2015,46(10):1721-1732.(in Chinese)
[8]AI H S,F(xiàn)ANG X,YANG B,et al.Adaptation and possible ancient interspecies introgression in pigs identified by whole-genome sequencing[J].NatGenet,2015,47(3):217-225.
[9]MCKENNA A,HANNA M,BANKS E,et al.The genome analysis toolkit:a MapReduce framework for analyzing next-generation DNA sequencing data[J].GenomeRes,2010,20(9):1297-1303.
[10]COCKERHAM C C,WEIR B S.Covariances of relatives stemming from a population undergoing mixed self and random mating[J].Biometrics,1984,40(1):157-164.
[11]WANG Z,LU P,LIANG Z,et al.Increased insulin-like growth factor 1 receptor (IGF1R) expression in small cell lung cancer and the effect of inhibition of IGF1R expression by RNAi on growth of human small cell lung cancer NCI-H446 cell[J].GrowthFactors,2015,33(5-6):337-346.
[12]XU Y,YANG Z,YUAN H,et al.PCDH10 inhibits cell proliferation of multiple myeloma via the negative regulation of the Wnt/beta-catenin/BCL-9 signaling pathway[J].OncolRep,2015,34(2):747-754.
[13]KIDD S,LIEBER T.Mechanism of notch pathway activation and its role in the regulation of olfactory plasticity in drosophila melanogaster[J].PLoSOne,2016,11(3):e0151279.
[14]HONISH S,YU W,LIU G,et al.Chorein addiction in VPS13A overexpressing rhabdomyosarcoma cells[J].Oncotarget,2015,6(12):10309-10319.
[15]LEE J,ZHOU P.DCAFs,the missing link of the CUL4-DDB1 ubiquitin ligase[J].MolCell,2007,26(6):775-780.
[16]DOUMAYROU J,THEBAUD G,VUILLAUME F,et al.Mapping genetic determinants of viral traits with FST and quantitative trait locus (QTL) approaches[J].Virology,2015,484:346-353.
[17]SUTTER N B,BUSTAMANTE C D,CHASE K,et al.A single IGF1 allele is a major determinant of small size in dogs[J].Science,2007,316(5821):112-115.
[18]LEE Y,WANG Y,JAMES M,et al.Inhibition of IGF1R signaling abrogates resistance to afatinib (BIBW2992) in EGFR T790M mutant lung cancer cells[J].MolCarcinog,2016,55(5):991-1001.
[19]SAINO M,MARUYAMA T,SEKIYA T.Inhibition of angiogenesis in human glioma cell lines by antisense RNA from the soluble guanylate cyclase genes GUCY1A3 and GUCY1B3[J].OncolRep,2004,12(1):47-52.
[20]CARNEIRO M,RUBIN C J,DI PALMA F,et al.Rabbit genome analysis reveals a polygenic basis for phenotypic change during domestication[J].Science,2014,345(6200):1074-1079.
[21]CONSORTIUM E P.An integrated encyclopedia of DNA elements in the human genome[J].Nature,2012,489(7414):57-74.
[22]ANDERSSON L,ARCHIBALD A L,BOTTEMA C D,et al.Coordinated international action to accelerate genome-to-phenome with FAANG,the functional annotation of animal genomes project[J].GenomeBiol,2015,16:57.
(編輯郭云雁)
Identifying Signatures of Selection Related to Small Body Size in Pigs
LI Wan-bo*#,ZHU Ya-ling#,AI Hua-shui,GUO Tian-fu*
(StateKeyLaboratoryforPigGeneticImprovementandProductionTechnology,JiangxiAgriculturalUniversity,Nanchang330045,China)
In this study,we analyzed genetic differentiation between small- and large-sized Chinese indigenous pigs,aiming to detect signatures of selection and to identify candidate genes and mutations related to small body size.Fixation index (Fst) and heterozygosity were calculated based on whole-genome resequencing data from miniature pigs (Wuzhishan and Bamaxiang) and large-sized pigs (Jinhua,Erhualian and Hetao).The regions with largerFstvalues and lower heterozygosity were regarded as candidate regions of selection.Through further annotation on gene function,pathway and mutations of the genes located in the candidate regions,we sought to screen genes and mutations related to body size.In total,32 475 218 SNPs were obtained after stringent filtering from whole-genome resequencing data.Fstand heterozygosity were calculated using 40 kb sliding window strategy.And 242 putative selection regions were kept by applying a Z-transformedFst(Z(Fst))>5.There are 13 regions overlapped between these 242 regions and the 200 regions with lowest Z-transformed heterozygosity (Z(H)),encompassing 28 genes.Seventeen out of the 28 genes are found to be associated with growth or body size through PANTHER annotation.Among these genes,IGF1RandGUCY1A3 were the most promising candidate genes.Together,by applying population genetic methods,we can detect regions of signature of selection related to body size in pigs.And after comprehensive analysis in gene function and mutations,we proposed that mutation(s) associated with small-sized phenotype in Wuzhishan and Bamaxiang pigs might be located in the non-coding regions detected.
miniature pigs;whole-genome resequencing;signatures of selection;body size;candidate genes
10.11843/j.issn.0366-6964.2016.10.005
2016-01-11
國(guó)家自然科學(xué)基金(31402058);江西省自然科學(xué)基金(2010GQN0045)
李完波(1982-),男,湖南岳陽(yáng)人,助理研究員,博士生,主要從事生物信息學(xué)研究,Tel:0791-83813080,E-mail:li.wanbo.jxau@gmail.com;朱亞玲(1993-),女,江西上饒人,碩士生,主要從事動(dòng)物遺傳育種研究,Tel:0791-83813080,E-mail:yaling_zhu @qq.com。二者并列為第一作者
李完波,E-mail:li.wanbo.jxau@gmail.com;郭添福,E-mail:guotianfu2001@163.com
S828.2
A
0366-6964(2016)10-1977-09