楊陽,劉媛媛,付鴻博,申成丞
桃基因家族的鑒定與分析
楊陽1*,劉媛媛2,付鴻博2,申成丞2
1. 呂梁學(xué)院生命科學(xué)系, 山西 呂梁 033000 2. 山西農(nóng)業(yè)大學(xué)園藝學(xué)院, 晉中 太谷 030801
為了解桃基因家族成員的特征和功能,基于桃基因組,對桃基因家族成員進(jìn)行理化性質(zhì)、系統(tǒng)進(jìn)化樹、基因結(jié)構(gòu)和保守基序以及染色體定位和共線性分析。結(jié)果表明,桃中共鑒定到家族成員101個,氨基酸序列范圍在166~593個范圍內(nèi),亞細(xì)胞定位表明成員全部定位在細(xì)胞內(nèi)膜上;系統(tǒng)進(jìn)化樹分析顯示桃成員被分為8個亞家族;基因結(jié)構(gòu)和保守基序分析顯示,桃基因家族成員之間基因結(jié)構(gòu)和保守基序存在差異性,但亞家族成員內(nèi)基因結(jié)構(gòu)和保守基序存在相似性;染色體定位分析顯示桃家族成員不均勻的分布的8條染色體上,有53對基因存在串聯(lián)重復(fù),有3對基因存在共線性。本研究初步了解了桃家族成員的特征和功能,為后期在桃中該基因的功能研究在分子水平上提供了理論支撐。
桃;基因家族; 生物信息學(xué)
氨基酸主要以有機(jī)氮[1]元素的形式參與植物體內(nèi)蛋白質(zhì)合成、代謝過程、激素調(diào)控等多種生命過程[2],是多細(xì)胞生物體內(nèi)細(xì)胞和組織之間的通訊紐帶[3]。這些功能的實(shí)現(xiàn)需要氨基酸運(yùn)輸系統(tǒng),(Amino acid/suxin permease)家族是最大的氨基酸轉(zhuǎn)運(yùn)蛋白家族之一[1],可以轉(zhuǎn)運(yùn)生長素(吲哚-3-乙酸)、C氨基丁酸和單L-氨基酸以及多個氨基酸。根據(jù)序列間相似性和保守結(jié)構(gòu)域的特點(diǎn)可以將分為八個分支,即AAP(氨基酸滲透酶)、LHT(賴氨酸和組氨酸轉(zhuǎn)運(yùn)體)、GAT(γ-氨基丁酸轉(zhuǎn)運(yùn)體)、ProT(脯氨酸轉(zhuǎn)運(yùn)體)、AUX)生長素轉(zhuǎn)運(yùn)體)和ANT(芳香性以及中性氨基酸轉(zhuǎn)運(yùn)體)以及ATLa、ATLb(類氨基酸轉(zhuǎn)運(yùn)體)[4-6]。不同亞家族成員序列間相似性較低,但所有的AAAP蛋白都具有相同的保守結(jié)構(gòu)域,Aa_trans結(jié)構(gòu)域(PF01490)。
自從第一個AAAP蛋白在哺乳動物中被發(fā)現(xiàn)鑒定后,家族基因逐漸延伸到植物領(lǐng)域,如擬南芥中,參與賴氨酸、苯丙氨酸、天冬氨酸以及亮氨酸的轉(zhuǎn)運(yùn)[7],和將氨基酸從木質(zhì)部向韌皮部運(yùn)輸[8,9],參與孢子細(xì)胞的氨基酸運(yùn)輸來調(diào)控花粉的發(fā)育[10];在煙草中,參與天冬酰胺、天冬氨酸和谷氨酰胺以及谷氨酸的轉(zhuǎn)運(yùn)[11];在楊樹中,參與木質(zhì)部脯氨酸的轉(zhuǎn)運(yùn)[12];在水稻中,會影響種子發(fā)育早期階段氨基酸的分布情況[13]。
桃((L.) Batsch)薔薇科(Rosaceae)桃屬(),多年生木本植物,是世界上重要的經(jīng)濟(jì)果樹。桃基因組測序的完成和釋放[14]為桃重要基因功能的挖掘提供了可行性。本研究利用生物信息學(xué)方法對桃基因家族成員進(jìn)行了鑒定,并對其成員進(jìn)行理化性質(zhì)預(yù)測,基因結(jié)構(gòu),染色體定位和串聯(lián)重復(fù)以及系統(tǒng)進(jìn)化樹分析,以期進(jìn)一步對桃家族基因的功能研究提供基礎(chǔ)信息。
通過GDR(http://www.rosaceae.org)下載桃基因組(genome.v2.2.a1),通過TAIR(http://arabidopsis.org)下載擬南芥基因家族氨基酸序列。通過Pfam(http://pfam.xfam.org)搜索隱馬爾可夫模型(PF01490),利用Hmmer3.0構(gòu)建本地蛋白數(shù)據(jù)庫并進(jìn)行候選基因篩選。將所有候選基因在NCBI上對其保守結(jié)構(gòu)域進(jìn)行進(jìn)一步確認(rèn)。利用ExPASy(https://www.expasy.org)對家族成員進(jìn)行理化性質(zhì)分析,利用CELLO(http://cello.life.nctu.edu.tw/)進(jìn)行亞細(xì)胞定位預(yù)測。
利用擬南芥AAAP氨基酸序列和桃AAAP氨基酸序列構(gòu)建系統(tǒng)進(jìn)化樹:將所有氨基酸序列導(dǎo)入MEGA中,以Cluster W進(jìn)行序列比對,以Maxumum Likelihood構(gòu)建系統(tǒng)進(jìn)化樹。參數(shù)設(shè)置如下:Bootstrap Replications為1000,Mode/Method為Poisson model,Gaps/Missing Data Treatment為Partial deletion,Site Coverage Cutoff(%)為50,利用iTOL(https://itol.embl.de/)對進(jìn)化樹進(jìn)行優(yōu)化處理。
利用GSDS(http://gsds.gao-lab.org/)對桃進(jìn)行基因結(jié)構(gòu)分析,利用MEME(http://meme-suite.org/)和TBtools對桃進(jìn)行保守基序分析。
根據(jù)桃的位置信息,利用TBtools中MCScanX對桃基因進(jìn)行染色體定位及串聯(lián)重復(fù)事件和共線性。
根據(jù)HEMMER篩選和NCBI中保守結(jié)構(gòu)域的鑒定,共確認(rèn)桃中有101個基因家族成員,根據(jù)染色體位置將其命名為-(表1),對得到的所有家族成員進(jìn)行氨基酸長度、分子量、等電點(diǎn)、親水性、脂肪族氨基酸指數(shù)和亞細(xì)胞定位(表1)表明,氨基酸序列長度從166到593,編碼蛋白長度最小的是,由166個氨基酸組成,編碼蛋白最大的是,由593個氨基酸組成;分子量在19.17 kDa()~49.54 kDa()范圍內(nèi);等電點(diǎn)在5.41()~9.99();不穩(wěn)定系數(shù)在21.60()~61.56()范圍內(nèi);脂肪族氨基酸指數(shù)在86.22()~130.89()范圍內(nèi);親水性在0.240()~-0.942()范圍內(nèi);亞細(xì)胞定位表明,所有家族成員均定位在細(xì)胞內(nèi)膜上。
表1 桃PpAAAP家族成員生物信息學(xué)分析
Prupe.3G301100.1PpAAAP61Chr343949.033848.9434.72101.910.541InnerMembrane Prupe.4G137000.1PpAAAP62Chr446950.972249.3037.67113.110.524InnerMembrane Prupe.4G277700.1PpAAAP63Chr448052.820169.1139.35102.60.516InnerMembrane Prupe.5G115900.1PpAAAP64Chr545349.688698.8540.63107.840.602InnerMembrane Prupe.5G115900.2PpAAAP65Chr537941.913668.6841.29110.580.629InnerMembrane Prupe.5G115900.3PpAAAP66Chr545349.688698.8540.63107.840.602InnerMembrane Prupe.5G115900.4PpAAAP67Chr534337.446539.0234.58116.820.776InnerMembrane Prupe.5G155600.1PpAAAP68Chr546151.919.0942.78101.870.257InnerMembrane Prupe.5G155600.2PpAAAP69Chr542244.856.3230.58113.460.742InnerMembrane Prupe.5G162500.1PpAAAP70Chr544850.502239.4730.67105.740.421InnerMembrane Prupe.5G162500.2PpAAAP71Chr540145.308679.8528.65110.100.577InnerMembrane Prupe.5G162600.1PpAAAP72Chr521524.331217.8021.6095.670.240InnerMembrane Prupe.5G162700.1PpAAAP73Chr516619.169699.9923.59102.230.371InnerMembrane Prupe.6G032700.1PpAAAP74Chr644349.375189.0738.4792.440.414InnerMembrane Prupe.6G032700.2PpAAAP75Chr646050.888.6731.8586.220.441InnerMembrane Prupe.6G032700.3PpAAAP76Chr636039.791339.5830.74110.830.538InnerMembrane Prupe.6G032700.4PpAAAP77Chr646050.888.6731.8596.220.441InnerMembrane Prupe.6G032700.5PpAAAP78Chr646050.888.6731.8596.220.441InnerMembrane Prupe.6G032700.6PpAAAP79Chr646851.715278.3734.79100.640.438InnerMembrane Prupe.6G032700.7PpAAAP80Chr642346.151836.5231.55115.180.835InnerMembrane Prupe.6G118000.1PpAAAP81Chr643547.560118.8533.71113.860.625InnerMembrane Prupe.6G118000.2PpAAAP82Chr633036.023789.2530.52113.420.727InnerMembrane Prupe.6G118000.3PpAAAP83Chr619421.352369.2025.99120.050.858InnerMembrane Prupe.6G258200.1PpAAAP84Chr654559.233735.4138.27104.260.478InnerMembrane Prupe.6G273000.1PpAAAP85Chr637741.058779.1339.7197.000.341InnerMembrane Prupe.7G038500.1PpAAAP86Chr754058.374735.8334.16111.040.502InnerMembrane Prupe.7G088200.1PpAAAP87Chr748052.652569.2731.72104.810.503InnerMembrane Prupe.7G088200.2PpAAAP88Chr740443.804348.6332.67128.590.931InnerMembrane Prupe.7G177800.1PpAAAP89Chr754159.118689.1938.75102.940.447InnerMembrane Prupe.7G183800.1PpAAAP90Chr742346.151836.5231.55115.180.835InnerMembrane Prupe.7G183800.2PpAAAP91Chr742346.151836.5231.55115.180.835InnerMembrane Prupe.7G183800.3PpAAAP92Chr744949.938069.2834.4496.500.383InnerMembrane Prupe.8G163100.1PpAAAP93Chr834238.108648.8928.1996.930.493InnerMembrane Prupe.8G164200.1PpAAAP94Chr844950.334349.1340.91102.850.494InnerMembrane Prupe.8G164200.2PpAAAP95Chr837641.969.1335.3899.590.578InnerMembrane Prupe.8G173300.1PpAAAP96Chr850255.296028.8335.33104.740.464InnerMembrane Prupe.8G173400.1PpAAAP97Chr850154.437088.6131.64105.570.506InnerMembrane Prupe.8G173500.1PpAAAP98Chr849154.108.6536.44101.710.468InnerMembrane Prupe.8G173800.1PpAAAP99Chr853958.596319.3235.73102.800.487InnerMembrane Prupe.8G179700.1PpAAAP100Chr834939.004758.9028.8798.880.480InnerMembrane Prupe.8G230900.1PpAAAP101Chr842746.60136.5935.43111.150.704InnerMembrane
為分析桃基因在植物中的進(jìn)化模式,選取擬南芥和桃的AAAP蛋白的氨基酸序列使用MEGA構(gòu)建系統(tǒng)進(jìn)化樹(圖1),結(jié)果表明,該基因家族可以分為八個亞族,即為AAP(氨基酸滲透酶)、LHT(賴氨酸和組氨酸轉(zhuǎn)運(yùn)體)、GAT(γ-氨基丁酸轉(zhuǎn)運(yùn)體)、ProT(脯氨酸轉(zhuǎn)運(yùn)體)、AUX)生長素轉(zhuǎn)運(yùn)體)和ANT(芳香性以及中性氨基酸轉(zhuǎn)運(yùn)體)以及ATLa、ATLb(類氨基酸轉(zhuǎn)運(yùn)體)。亞族內(nèi)成員數(shù)量最多的為AAP亞族,含有23個成員;其次亞族成員數(shù)量加多的為ATLb、LHT、ATLa數(shù)量分別為18、18和12;亞族成員數(shù)量最少的是AUX亞族和ANT亞族,僅含有4個和6個。
對桃基因家族101個成員進(jìn)行基因結(jié)構(gòu)和保守基序分析(圖2、圖3、圖4),結(jié)果表明,桃基因家族成員內(nèi)皆因結(jié)構(gòu)相似性較低,家族成員內(nèi)部含有的外顯子個數(shù)不等。對桃家族中的10個保守基序進(jìn)行鑒定,發(fā)現(xiàn)在桃成員內(nèi)保守基序間存在差異,motif9高度保守,motif4、5相對保守。每個亞族內(nèi)成員具有相似的保守基序組成。
圖1 桃AAAP和擬南芥AAAP系統(tǒng)進(jìn)化樹
圖2 桃AAAP基因結(jié)構(gòu)
圖3 保守基序示例
圖4 桃AAAP保守基序分析
為了了解桃基因在染色體上的分布,利用TBtools將桃基因定位在染色體上,同時展示基因串聯(lián)重復(fù)事件和共線性分析。結(jié)果表明(圖5)桃基因不均勻的分布在桃8條染色體上。其中,1號染色體上含有桃基因數(shù)量最多,為27個,其次是2號和3號染色體,數(shù)量分別為16和18,而4號染色體上僅有兩個基因?;虻拇?lián)重復(fù)事件是指位于同一條染色體上的基因物理距離在200 kb內(nèi)且相似性大于70%的基因。由圖6可以看出,桃基因共有53對基因存在串聯(lián)重復(fù),其中,在1號染色體上有13對基因存在串聯(lián)重復(fù),2號染色體上9對基因存在串聯(lián)重復(fù),3號染色體上有13對基因存在串聯(lián)重復(fù),5號染色體上有5對基因基因存在串聯(lián)重重復(fù),6號染色體上有6對基因存在串聯(lián)重復(fù),7號染色體上存在3對基因有串聯(lián)重復(fù),8號染色體上存在4對基因有串聯(lián)重復(fù),而在4號染色體上未發(fā)現(xiàn)基因串聯(lián)重復(fù)事件。通過TBtools中MCScanX功能展示桃基因在染色體上共線性(圖6)發(fā)現(xiàn),在桃基因內(nèi)存在3對基因Prupe.8G173300.1)~(Prupe.1G356000.1)、(Prupe.1G233800.1)~(Prupe.3G300900.1)和(Prupe.1G275100.1)~(Prupe.3G267100.1)具有共線性,由此推測這3對基因可能是由于染色體的大片段復(fù)制而形成的。
圖5 桃AAAP基因在染色體上的分布
注:):代表串聯(lián)重復(fù)基因。
Note: ) Representative tandem repeat gene
圖6 桃AAAP基因在染色體上分布及共線性分布
大量跨膜氨基轉(zhuǎn)運(yùn)蛋白在生理和基因?qū)用嫔隙加需b定[15,16],作為一個重要的基因家族,基因在植物生長發(fā)育的各個方面發(fā)揮著重要作用,在玉米[17]、油菜[18]和模式植物擬南芥中均被鑒定到,Yong等[19]曾報道擬南芥中AAP1將氨基酸轉(zhuǎn)運(yùn)到擬南芥根部和Grallath等[20]曾報道過擬南芥ProT家族具有相似底物特異性,但表達(dá)模式不相同。
系統(tǒng)進(jìn)化樹根據(jù)蛋白序列的相似性以及保守結(jié)構(gòu)域可以揭示物種之間的親緣關(guān)系,進(jìn)而推測基因的功能。通過對桃和擬南芥基因構(gòu)建系統(tǒng)進(jìn)化樹發(fā)現(xiàn),桃中含有植物家族的所有亞族(共八個亞族)。AAP亞族的成員能運(yùn)輸中性條件下帶有正電荷以及堿性氨基酸,在擬南芥中AAP家族還能參與調(diào)控植物對根結(jié)線蟲的抵抗過程[21],由此推測桃AAP亞家族內(nèi)成員具有類似的功能,而此亞族也是桃家族最大的亞族;AUX亞族主要負(fù)責(zé)轉(zhuǎn)運(yùn)生長素物質(zhì),在擬南芥中主要轉(zhuǎn)運(yùn)吲哚-3-乙酸來促進(jìn)側(cè)根形成[22]由此推測桃AUX亞家族中的成員具有相同的功能;在擬南芥中可以調(diào)控根的表皮組織和皮層細(xì)胞β-葡萄糖醛酸酶的活性[19],由此推測桃ProT亞家族內(nèi)成員具有類似的功能,同樣地,其他亞家族內(nèi)的成員基因功能也與進(jìn)化樹上亞家族的擬南芥功能類似。
Motif是蛋白質(zhì)分子內(nèi)具有特定空間構(gòu)象、特定蛋白質(zhì)功能的結(jié)構(gòu)成分,是結(jié)構(gòu)域的亞單位,與特定功能聯(lián)系在一起[23],推測具有不同motif的家族成員在進(jìn)化和功能上存在差異。
文獻(xiàn)[24]曾報道,基因部分重復(fù)和串聯(lián)重復(fù)是植物中基因家族擴(kuò)增的兩個重要因素,根據(jù)桃基因家族內(nèi)的比對,我們檢索到53對基因存在串聯(lián)重復(fù)和3對基因存在共線性關(guān)系。這些研究結(jié)果表明桃基因間存在基因串聯(lián)重復(fù)和部分重復(fù),對桃家族基因的擴(kuò)張發(fā)揮了重要作用。
本研究通過對桃基因組內(nèi)基因家族的篩選,我們共確認(rèn)鑒定101個家族成員,氨基酸序列長度為166~593范圍內(nèi),跨度范圍較廣;等電點(diǎn)和其他理化性質(zhì)同樣跨度范圍較廣,說明桃基因成員相似性較低,同樣系統(tǒng)進(jìn)化樹發(fā)現(xiàn),將桃家族分為把八個亞族,與前人[18]研究結(jié)果一致。通過對桃家族成員進(jìn)行基因結(jié)構(gòu)和保守基序分析發(fā)現(xiàn),在桃家族成員內(nèi)基因結(jié)構(gòu)和保守基序存在差異性,但亞家族成員內(nèi)基因結(jié)構(gòu)和保守基序分布相對一致。染色體定位和串聯(lián)重復(fù)事件顯示,桃基因不均勻的分布在桃8條染色體上,同時可以發(fā)現(xiàn)桃基因以片段重復(fù)和串聯(lián)重復(fù)的方式擴(kuò)增。本文在分子水平上為桃基因的功能挖掘提供了一定的理論支持。
[1] Fischer WN, Kwart M, Hummel S,. Substrate specificity and expression profile of amino acid transporters (AAPs) in[J]. Biol Chem. 1995,270(27):16315-20
[2] 曲越.蒺藜苜蓿與鷹嘴豆基因家族的全基因組分析[D].哈爾濱:哈爾濱師范大學(xué),2019
[3] Clark JA, Amara SG. Amino acid neurotransmitter transporters: structure, function, and molecular diversity [J]. Bioessays, 1993,15(5):323-332
[4] Wolf N F, Bruno A, Doris R,. Amino acid transport in plants [J]. Trends in plant science, 1998,5(3):188-195
[5] Tegeder M, Ward JM. Molecular evolution of plantP andAmino Acid transporters [J]. Frontiers in Plant Science, 2012,3:1-21
[6] Saier MH, Reddy VS, Tsu BV,The transporter classification database (TCDB): recent advances [J]. Nucleic Acids Research, 2016;44(D1):D372-D379
[7] Hunt E, Gattolin S, Newbury HJ,. A mutation in amino acid permeasereduces the amino acid content of the Arabidopsis sieve elements but leaves aphid herbivores unaffected [J]. J Exp Bot. 2010,61(1):55-64
[8] Sakiko O, Roberto S, Mechthild T,High affinity Amino Acid transporters specifically expressed in xylem parenchyma and developing seeds of[J]. The Journal of Biological Chemistry, 2002,227(47):45338-45346
[9] Zhang L, Tan Q, Lee R,. Altered xylem-phloem transfer of amino acids affects metabolism and leads to increased seed yield and oil content in[J]. Plant Cell, 2010,22(11):3603-3620
[10] Hirner A, Ladwig F, Stransky H,. Arabidopsisis a high-affinity transporter for cellular amino acid uptake in both root epidermis and leaf mesophyll [J]. Plant Cell, 2006,18(8):1931-1946
[11] Zhao YY, Xu YL, Wang Z,. Genome-wide identification and characterization of an amino acid permease gene family in[J]. RSC Advances, 2017,7:38081-38090.
[12] Jérémy CE, Michael FD, Damien BM., a high affinity amino acid transporter specifically expressed in differentiating xylem cells of poplar [J]. Journal of Experimental Botany, 2010,61(6):1671–1682
[13] Peng B, Kong H, Li Y,.functions as an important regulator of grain protein content and nutritional quality in rice [J]. Natural Communications, 2014,11(5):484
[14] Ignazio V, Albert G, Francesco S,. The high quality draft genome of peach () identifies unique patterns of genetic diversity, domestication and genome evolution [J]. Nature Genetics, 2013,45(5):487-194
[15] Gregory B, Young DL, Jack DW,. The amino acid/auxin:proton symport permease family [J]. Biochimica et Biophysica Acta, 1999,1415:306-322
[16] Daniel W, Uwe L, Mechthild T,Conservation of amino acid transporters in fungi, plants and animals [J]. Trends in Biocheminical Science, 2002,27(3):139-147
[17] Lei S, Lin D, Han WY,. A genome-wide analysis of thegene family in Maize [J]. Journal of Proteomics & Bioinformatics, 2014,7(1):023-033
[18] Hu L, Yin W, Chen Y,. Functional divergence and evolutionary dynamics of the putativegene family in[J]. Plant Mol Biol Rep., 2014,32:517-530
[19] Yong HL, Justin F, Janet C,transports uncharged amino acids into roots of[J]. Plant Journal, 2007,50:305-319
[20] Grallath S, Weimar T, Meyer A,. Thefamily. Compatible solute transporters with similar substrate specificity but differential expression patterns [J]. Plant Physiol., 2005,137(1):117-126
[21] Marella HH, Nielsen E, Schachtman DP,. The amino acid permeasesandare involved in root-knot nematode parasitism of[J]. Mol Plant Microbe Interact., 2013,26(1):44-54
[22] Marchant A, Bhalerao R, Casimiro I,. AUX1 promotes lateral root formation by facilitating indole-3-acetic acid distribution between sink and source tissues in theseedling [J]. Plant Cell, 2002,14(3):589-597
[23] 趙晶,李旭彤,梁學(xué)忠,等.陸地棉漆酶基因家族鑒定及在黃萎病菌脅迫下的表達(dá)分析[J].作物學(xué)報,2019,45(12):1784-1795
[24] Cannon SB, Mitra A, Baumgarten A,. The roles of segmental and tandem gene duplication in the evolution of large gene family in[J]. BMC Plant Biology, 2004,4(10):1-21
Identification and Analysis ofgene family in(L.) Batsch
YANG Yang1, LIU Yuan-yuan2, FU Hong-bo2, SHEN Cheng-cheng2
1.033000,2.030801,
In order to understand the characteristics and functions offamily members inpeach, based on the peach genome, the physicochemical properties, phylogenetic tree, gene structure and conservative motifs, chromosome location and collinearity analysis ofgene family members were carried out. The results showed that there were 101 members of thefamily identified in(L.) Batsch, with amino acid sequences ranging from 166 to 593. The subcellular location indicated that allmembers were located on the cell membrane; phylogenetic tree analysis showed that the members of thewere divided into 8 Analysis of gene structure and conservative motifs shows that there are differences in gene structure and conservative motifs among members of thefamily in(L.) Batsch, but there are similarities in gene structure and conservative motifs among members of the subfamily; chromosome mapping analysis shows thaton the 8 chromosomes with uneven distribution of family members, 53 pairs of genes have tandem duplication, and 3 pairs of genes have collinearity. This study has a preliminary understanding of the characteristics and functions of the members of thefamily in(L.) Batsch, which provides theoretical support at the molecular level for the later functional research of this gene in(L.) Batsch.
(L.) Batsch;gene family; bioinformatics
A
1000-2324(2021)03-0408-08
2020-10-18
2020-11-25
楊陽(1983-),女,博士研究生,講師,主要從事園藝作物種質(zhì)資源開發(fā)及生物技術(shù)應(yīng)用. E-mail:147414658@ qq.com