張司龍 張小雪 宋其志 王維民
摘要:以綿羊RXRG基因?yàn)槟康幕?,利用生物信息學(xué)軟件預(yù)測其結(jié)構(gòu)和功能。結(jié)果表明,綿羊RXRG基因編碼463個氨基酸,開放閱讀框長度為1 392 bp,起始密碼子位于228 bp處,終止密碼子位于1 619 bp處。RXRG基因編碼蛋白的相對分子質(zhì)量為50 845.19 Da,等電點(diǎn)為7.55,在氨基酸組成中亮氨酸所占比率最高,色氨酸占比最低。亞細(xì)胞定位主要位于細(xì)胞核中,不屬于分泌蛋白;不存在信號肽序列;存在兩個保守結(jié)構(gòu)域,并且為疏水性蛋白,二級結(jié)構(gòu)主要以α螺旋和無規(guī)則卷曲為主,三級結(jié)構(gòu)主要由無規(guī)卷曲纏繞折疊形成。
關(guān)鍵詞:綿羊;RXRG基因;生物信息學(xué)分析
中圖分類號:S826? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? 文章編號:1001-1463(2020)02-0031-07
Abstract:In this study, with the sheep RXRG gene as the target gene, the structure and function of sheep RXRG gene were predicted by bioinformatics software. The RXRG gene of sheep encodes 463 amino acids, the length of open reading frame is 1 392 bp, the initial codon is 228 bp, and the termination codon is? ?1 619 bp. The relative molecular weight and isoelectric point of RXRG protein were 50 845.19 Da and 7.55 respectively. Leucine accounted for the highest proportion of amino acid composition and tryptophan accounted for the lowest proportion. Subcellular localization is mainly located in the nucleus, not in the secretory protein;there is no signal peptide sequence;there are two conservative domains, and they are hydrophobic proteins. The secondary structure is mainly αshelix and irregular curl, and the third structure is mainly formed by random curl winding and folding.
Key words:Sheep;RXRG gene;Bioinformatics analysis
視黃酸是一種脂溶性的小分子物質(zhì),在細(xì)胞分化、上皮細(xì)胞生長、視覺和組織維持、胎兒發(fā)育和繁殖等過程中發(fā)揮著重要作用[1 ]。視黃酸受體(Retinoic acid receptor,RAR)和視黃素X受體(Retinoid X receptor,RXR)是視黃酸受體家族的主要成員,RAR、RXR由3種不同的基因RXRA、RXRB和RXRG編碼,形成了RXRA、RXRB,RXRG等多種類型的受體[2 - 3 ]。RXRG基因作為配體激活的轉(zhuǎn)錄因子,結(jié)合到靶基因的特定應(yīng)答序列上,調(diào)節(jié)基因的轉(zhuǎn)錄表達(dá)[2 ],是細(xì)胞分化和組織形態(tài)發(fā)生的主要調(diào)節(jié)因子。RXRG基因的研究多在黑猩猩、獼猴、狗、奶牛、大鼠、雞、斑馬魚、青蛙等方面,而關(guān)于綿羊RXRG基因的研究較少。國內(nèi)外研究表明,RXRG基因不僅在動物妊娠的關(guān)鍵時期表達(dá),還對具有高產(chǎn)性能豬種的窩產(chǎn)仔數(shù)具有明顯的加性效應(yīng),對于高繁殖力的綿羊品種具有顯著影響[4 ]。因此,對RXRG基因進(jìn)行深入研究,利用生物信息學(xué)相關(guān)軟件和工具,對不同物種RXRG基因系統(tǒng)發(fā)育和綿羊RXRG基因CDS區(qū)序列蛋白質(zhì)的理化性質(zhì)、二級結(jié)構(gòu)及多參數(shù)預(yù)測、蛋白質(zhì)跨膜結(jié)構(gòu)、信號肽預(yù)測、亞細(xì)胞定位和三級結(jié)構(gòu)等進(jìn)行分析,旨在尋找與雙胎或者多胎性狀有關(guān)的遺傳標(biāo)記位點(diǎn),為培育高繁殖力綿羊品系提供理論依據(jù),為綿羊RXRG基因結(jié)構(gòu)與功能研究提供參考[5 ]。
1? ?材料與方法
1.1? ?序列來源
數(shù)據(jù)資料來源于NCBI網(wǎng)站的GenBank數(shù)據(jù)庫,包括綿羊(XM_012185408.2)、瘤牛(XM_019986703.1)、黑猩猩(XM_513962.5)、人(NM_006917.5)、家鼠(NM_009107.3)、豬(NM_001130213.1)、馬(XM_023640805.1)和雞(NM_205294.1)8個物種的mRNA序列(括號內(nèi)為Gen Bank登錄號)。
1.2? ?方法
綿羊RXRG基因開放閱讀框采用NCBI的開放閱讀框查找器程序分析;采用DNA生物編輯器(Bioedit及DNA Star)分析軟件預(yù)測RXRG基因編碼產(chǎn)物的理化性質(zhì);多序列比對及同源性分析采用分子生物學(xué)綜合應(yīng)用軟件(DNAMAN);采用蛋白質(zhì)亞細(xì)胞定位預(yù)測工具(PSORT)進(jìn)行亞細(xì)胞定位。在蛋白質(zhì)的分析預(yù)測方面采用信號肽預(yù)測工具(Signalp3.0軟件)進(jìn)行蛋白潛在信號肽剪切位點(diǎn)的預(yù)測,采用捆綁混合隱馬爾可夫模型[tied-mixture hidden Markov models(TMHMM)]程序進(jìn)行跨膜螺旋區(qū)域的預(yù)測,采用簡單模塊化架構(gòu)研究工具(SMART)軟件進(jìn)行蛋白保守結(jié)構(gòu)域分析;二級結(jié)構(gòu)采用蛋白質(zhì)二級結(jié)構(gòu)預(yù)測服務(wù)器(Jpred)分析預(yù)測;采用瑞士模型(Swiss-model)軟件分析蛋白三級結(jié)構(gòu);在蛋白親疏水性分析方面采用疏水性分析(ProtScale)程序[4 - 6 ]。
2? ?結(jié)果與分析
2.1? ?綿羊RXRG基因開放閱讀框
開放閱讀框的分析結(jié)果如圖1所示,綿羊RXRG基因推測編碼463個氨基酸殘基,其基因序列長度為1 392 bp,起始密碼子位于228 bp處,終止密碼子位于1 619 bp處。
2.2? ?綿羊RXRG編碼產(chǎn)物的理化性質(zhì)
蛋白質(zhì)的理化性質(zhì)分析包括對其相對分子質(zhì)量、氨基酸組成以及等電點(diǎn)的理化性質(zhì)分析[7 ]。綿羊RXRG基因編碼產(chǎn)物的理化性質(zhì)結(jié)果(圖2)表明,該基因共編碼463個氨基酸殘基,相對分子質(zhì)量為50 845.19 Da,其氨基酸殘基中亮氨酸所占比重最高,為9.9%;其次為絲氨酸,所占比例為9.5%,甘氨酸所占比例為7.3%;色氨酸占比最低,僅為0.4%。
2.3? ?綿羊RXRG基因蛋白亞細(xì)胞定位
從蛋白質(zhì)亞細(xì)胞定位預(yù)測工具程序預(yù)測得到的綿羊RXRG基因蛋白亞細(xì)胞定位結(jié)果(表1)可以看出,綿羊RXRG蛋白的亞細(xì)胞大多數(shù)分布在細(xì)胞核,其可能性為78.3%。而在其他位置分布的可能性所占概率較小。其中,分布于細(xì)胞質(zhì)的可能性為8.7%,分布于線粒體的可能性為4.3%,還有4.3%分布在過氧化物酶體。由此推斷,綿羊RXRG基因主要在細(xì)胞核中發(fā)揮生物學(xué)作用,其次在細(xì)胞質(zhì)中發(fā)揮作用。
2.4? ?綿羊RXRG編碼產(chǎn)物序列同源性
通過NCBI數(shù)據(jù)庫找到綿羊、瘤牛、豬、馬、黑猩猩、人、家鼠、雞八種動物DNA序列,并對其進(jìn)行同源性分析(圖3),可以看出,綿羊與他們之間的親源性分別為98%、93%、92%、91%、91%、86%、73%。由系統(tǒng)發(fā)育樹可看出在這8種動物中綿羊RXRG基因與瘤牛親緣關(guān)系較近,與雞的親緣關(guān)系最遠(yuǎn),RXRG基因在哺乳動物間的保守性較高(圖4)。
2.5? ?綿羊RXRG蛋白潛在信號肽剪切位點(diǎn)預(yù)測
通過分析預(yù)測綿羊RXRG蛋白潛在信號肽剪切位點(diǎn)的情況可以得知基因編碼的產(chǎn)物是否是分泌蛋白和跨膜蛋白,以及跨膜蛋白的基本信息。從圖5可以看出,信號肽序列是存在于分泌蛋白基因編碼序列中起始密碼子之后的一段富含疏水氨基酸多肽的序列,綿羊RXRG蛋白氨基酸在23的位置出現(xiàn)最大C值為0.119,截止點(diǎn)為0.32;在1的位置出現(xiàn)最大S值為0.824,截止點(diǎn)為0.87;在1-19的位置平均出現(xiàn)S值為0.560,截止點(diǎn)為0.48;在20的位置出現(xiàn)最大Y值為0.178,截止點(diǎn)為0.33;在1-19的位置出現(xiàn)D值為0.369,截止點(diǎn)為0.43因此推斷綿羊RXRG基因的編碼產(chǎn)物屬于分泌性蛋白。位置19和20之間最可能的裂解位為CGG-CT。
2.6? ?綿羊RXRG蛋白跨膜區(qū)域結(jié)構(gòu)預(yù)測
從圖6可以看出,通過使用TMHMM軟件對綿羊RXRG蛋白跨膜區(qū)域結(jié)構(gòu)進(jìn)行預(yù)測分析,發(fā)現(xiàn)該基因所編碼的蛋白沒有跨膜區(qū)域結(jié)構(gòu)。
2.7? ?綿羊RXRG蛋白保守結(jié)構(gòu)域分析
由Smart軟件分析結(jié)果得出,綿羊RXRG基因在第136~207位、第271~430位氨基酸殘基之間存在跨膜區(qū),在76~89的位置上出現(xiàn)了低復(fù)雜性區(qū)域(圖7)。
2.8? ?綿羊RXRG蛋白親疏水性分析
從圖8看出,蛋白質(zhì)親疏水性研究發(fā)現(xiàn)該基因編碼蛋白疏水性達(dá)到最大值的位點(diǎn)有很多,且最大值為4.000,其中Arg、Leu、Ser的單個值最高,達(dá)到了6.000。此外,親疏水性分析圖中最小值為1.667,分析其基因得到的結(jié)果全部為正值,可見其并無親水性,從而得出該基因編碼的蛋白屬于疏水性蛋白。
2.9? ?綿羊RXRG蛋白二級結(jié)構(gòu)的預(yù)測
通過Jpred軟件進(jìn)行蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測分析(圖9)可知,綿羊RXRG蛋白二級結(jié)構(gòu)中有大部分結(jié)構(gòu)為無規(guī)卷曲,其次為α螺旋,β折疊數(shù)量較少。其結(jié)果為10個α螺旋,4個β折疊,其余全是無規(guī)卷曲結(jié)構(gòu)。
2.10? ?綿羊RXRG蛋白三級結(jié)構(gòu)預(yù)測與分析
由圖10可知,RXRG基因編碼蛋白的三級結(jié)構(gòu)主要由無規(guī)卷曲折疊纏繞形成。
3? ?小結(jié)與討論
綿羊RXRG基因的ORF長度為1 392 bp,編碼463個氨基酸殘基,起始密碼子位于228 bp處,終止密碼子位于1 619 bp處。對其理化性質(zhì)分析發(fā)現(xiàn)組成最多的氨基酸是亮氨酸,所占比例為9.9%,其次,絲氨酸占比為9.5%,色氨酸組成所占比例最少,為0.4%。在系統(tǒng)發(fā)育樹中綿羊RXRG基因同源性與瘤牛關(guān)系最近,為98%,其次為豬和馬,在所分析的動物中綿羊與雞的親緣關(guān)系最遠(yuǎn)。RXRG基因編碼蛋白潛在信號肽剪切位點(diǎn)的預(yù)測最大C值為0.119,截止點(diǎn)為0.32;最大S值為0.824,截止點(diǎn)為0.87;最大Y值為0.178,截止點(diǎn)為0.33;在1-19的位置平均出現(xiàn)S值為0.560,截止點(diǎn)為0.48;在1-19的位置出現(xiàn)D值為0.369,截止點(diǎn)為0.43;位置19和20之間最可能的裂解位點(diǎn)是CGG-CT。綿羊RXRG基因編碼蛋白質(zhì)為疏水性蛋白,其疏水性最大值為4.000,最小值為1.667,該基因編碼的蛋白沒有跨膜螺旋結(jié)構(gòu),α螺旋為主,三級結(jié)構(gòu)主要為無規(guī)卷曲,綿羊RXRG蛋白的亞細(xì)胞分布在細(xì)胞核的可能性最大,為78.3%。
RXRG基因是調(diào)節(jié)細(xì)胞分化和組織形態(tài)發(fā)生的重要因子,在提高羊生產(chǎn)力方面有重要影響,李華振等[4,8 ]在綿羊繁殖軸相關(guān)組織RXRs基因的表達(dá)及RXRA基因多態(tài)性與季節(jié)性發(fā)情和綿羊基因多態(tài)性與產(chǎn)羔數(shù)方面進(jìn)行了研究,Shaoze Cheng等[9 ]在RXRG調(diào)節(jié)雞原始生殖細(xì)胞分化方面做過研究。此外,黃萌等[1 - 2,10 ]做過牛RXRG基因遺傳變異與雙胎性狀的關(guān)聯(lián)性分析方面已有研究。在國外還有關(guān)于RXRG基因在黑猩猩、斑馬魚以及其他不同功能方面的研究(全外顯子鑒定家族分離性催乳素瘤中的RXRG和TH種系變異)[11 ],以及生物信息學(xué)的處理理論研究方法等[12 - 13 ],這些研究都表明視黃素受體基因在提高繁殖力方面具有很大潛力。本研究顯示,RXRG基因?yàn)? 392 bp長度的基因序列,編碼463個氨基酸殘基,其主要的作用區(qū)域是細(xì)胞核,其理化性質(zhì)預(yù)測中氨基酸組成中亮氨酸所占比例最大,占比最少的氨基酸是色氨酸。通過系統(tǒng)發(fā)育樹可以知道綿羊、瘤牛、馬、豬在RXRG基因這一方面有比較近的親緣關(guān)系,和雞的親緣關(guān)系最遠(yuǎn),說明RXRG基因在哺乳動物間保守性較高。綿羊RXRG基因編碼產(chǎn)物屬于分泌蛋白,位置19和20之間最可能的裂解位點(diǎn)是:CGG-CT,該基因編碼的蛋白為疏水性蛋白,其保守結(jié)構(gòu)域有兩個功能區(qū)域,其二級結(jié)構(gòu)多為無規(guī)卷曲和α螺旋,其三級結(jié)構(gòu)主要以無規(guī)卷曲為主,并且沒有發(fā)現(xiàn)RXRG基因編碼蛋白質(zhì)產(chǎn)物的跨膜區(qū)域結(jié)構(gòu)。
參考文獻(xiàn):
[1] 黃? ?萌,許尚忠,昝林森,等.? 牛RXRG基因遺傳變異與雙胎性狀的關(guān)聯(lián)分析[J].? 遺傳,2008(2):190-194.
[2] 黃? ?萌,許尚忠,昝林森,等.? 牛RXRG基因cDNA的克隆及生物信息學(xué)分析[J].? 西北農(nóng)林科技大學(xué)學(xué)報(自然科學(xué)版),2008(11):1-5;10.
[3] ALEXANDRA TALLAFUSS,LAURA A. HALE,YI-LIN YAN,et al. Postlethwait. Characterization of retinoid-X receptor genes rxra,rxrba,rxrbb and rxrg during zebrafish development[J].? Gene Expression Patterns,2005, 6(5):556-565.
[4] 李華振,狄? ?冉,郭曉飛,等.? 綿羊繁殖軸相關(guān)組織RXRs基因的表達(dá)及RXRA基因多態(tài)性與季節(jié)性發(fā)情之間的關(guān)系[J].? 農(nóng)業(yè)生物技學(xué)報2019,27(8):1401-1409.
[5] 張小雪,李發(fā)弟,王維民.? 綿羊STMN2基因生物信息學(xué)分析[J].? 甘肅農(nóng)業(yè)科技,2016(7):58-61.
[6] 王? ?偉,楊巧麗,謝開會,等.? 合作豬HMOX1基因克隆及生物信息學(xué)分析[J/OL].? 基因組學(xué)與應(yīng)用生物學(xué),2019[2019-04-29]. http://kns.cnki.net/kcms/detail/45.1369.Q.2019 0426.1608.006.html.
[7] 張小雪,李發(fā)弟,王維民.? 綿羊ANXA10基因生物信息學(xué)分析[J].? 甘肅農(nóng)業(yè)科技,2016(6):1-4.
[8] 王? ?輝.? 中國美利奴羊RXRG基因多態(tài)性與產(chǎn)羔數(shù)的關(guān)聯(lián)性分析[C]//中國畜牧獸醫(yī)學(xué)會畜禽遺傳標(biāo)記分會.? 第十二次全國畜禽遺傳標(biāo)記研討會論文集.? 北京:中國畜牧獸醫(yī)學(xué)會,2010.
[9] SHAOZE CHENG,MAN WANG,YINGJIE WANG,et al. RXRG associated in PPAR signal regulated the differentiation of primordial germ cell[J]. Journal of Cellular Biochemistry,2018,119(8):6926-6934.
[10] 劉? ?宇,何向東,夏? ?憶,等.? 牦牛MSMB基因的克隆及其生物信息學(xué)分析[J].? 中國草食動物科學(xué),2019,39(5):1-5;22.
[11] FLAVIA M.? MELO,PATR?魱CIA P.? COUTO,ALLEN E.? BALE,et al.? Whole-exome identifies RXRG and TH germline variants in familial isolated prolactinoma[J].? Cancer Genetics,2016,209(6):251-257.
[12]ZHENG GAO,JONATHAN TERHORST,CRISTOPHER V. VAN HOUT,et al.? U-PASS:unified power analysis and forensics for qualitative traits in genetic association studies[J].? Bioinformatics,2020,36(3):974-975.
[13] GOH KELVIN G K,MORIEL DANILO G,HANCOCK STEVEN J,et al.? Bioinformatic and molecular analysis of inverse autotransporters from escherichia coli[J].? mSphere,2019,4(4):e00572-e00591.
(本文責(zé)編:陳? ? 偉)