劉 靜,徐珍珍,袁 娜,郭 月,張保龍,杜建廠
(1.江蘇省農(nóng)業(yè)科學(xué)院 農(nóng)業(yè)生物技術(shù)研究所,江蘇省農(nóng)業(yè)生物學(xué)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210014;2.江蘇省農(nóng)業(yè)科學(xué)院 經(jīng)濟(jì)作物研究所,農(nóng)業(yè)部長江下游棉花和油菜重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210014)
?
陸地棉NF-YB基因家族的全基因組分析
劉 靜1,徐珍珍2,袁 娜1,郭 月1,張保龍1,杜建廠1
(1.江蘇省農(nóng)業(yè)科學(xué)院 農(nóng)業(yè)生物技術(shù)研究所,江蘇省農(nóng)業(yè)生物學(xué)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210014;2.江蘇省農(nóng)業(yè)科學(xué)院 經(jīng)濟(jì)作物研究所,農(nóng)業(yè)部長江下游棉花和油菜重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210014)
為了進(jìn)一步了解NF-YB基因家族結(jié)構(gòu)的功能,利用生物信息學(xué)手段,系統(tǒng)研究了陸地棉標(biāo)準(zhǔn)系TM-1基因組中NF-YB基因家族的數(shù)目、亞細(xì)胞定位、染色體分布、進(jìn)化關(guān)系、基序以及組織表達(dá)情況。結(jié)果表明:TM-1基因組中共有41個(gè)NF-YB基因家族成員,它們含有相同的CBFD_NFYB_HMF結(jié)構(gòu)域,大部分定位到細(xì)胞核內(nèi);41個(gè)NF-YB基因家族成員分布在19條染色體上,其中有19組成員在A亞組和D亞組中表現(xiàn)為直系同源基因;進(jìn)化樹分為Ⅰ和Ⅱ 2個(gè)小組,每個(gè)小組成員間具有相似的基序類型和排列順序;組織表達(dá)分析則發(fā)現(xiàn),在這41個(gè)NF-YB基因家族成員中,至少有24個(gè)成員可以進(jìn)行表達(dá),且表現(xiàn)出一定的組織特異性。
NF-YB基因家族;陸地棉;生物信息
CCAAT-box是廣泛存在于真核生物中的一種順式作用元件。有數(shù)據(jù)顯示,約30%基因的啟動子中含有該元件,并在調(diào)控基因表達(dá)過程中起重要作用[1-4]。核因子Y(Nuclear factor-Y)簡稱NF-Y,是一個(gè)與CCAAT-box順式作用元件結(jié)合進(jìn)而調(diào)節(jié)靶基因表達(dá)的轉(zhuǎn)錄因子,普遍存在于酵母、植物、動物等真核生物中[5]。植物核轉(zhuǎn)錄因子由多個(gè)基因編碼構(gòu)成核轉(zhuǎn)錄因子A亞基家族(NF-YA)(CBF-B或HAP2),B亞基家族(NF-YB)(CBF-A或HAP3)和C亞基家族(NF-YC)(CBF-C或HAP5)[6]。在擬南芥和水稻中,NF-YA家族均包含10個(gè)成員,NF-YB家族分別包含13,11個(gè)成員,NF-YC家族分別包含13,14個(gè)成員[7-9],它們在調(diào)控胚發(fā)育、胚成熟、花發(fā)育過程以及非生物脅迫應(yīng)答中發(fā)揮著重要作用[10-13]。
棉屬包括大約46個(gè)二倍體種和5個(gè)四倍體種,是纖維產(chǎn)出及油料的重要來源。隨著二倍體D亞組雷蒙德氏棉[14](Gossypiumraimondii)和A亞組亞洲棉石系亞1號[15](Gossypiumarboreum)測序工作的完成,陸地棉遺傳標(biāo)準(zhǔn)系TM-1(GossypiumhirsutumL.)也完成了全基因組的測序工作[16]。但是,棉花全基因組水平上的NF-YB基因家族分析還未見報(bào)道。本研究利用公開發(fā)表的陸地棉遺傳標(biāo)準(zhǔn)系TM-1基因組信息,對NF-YB家族基因進(jìn)行了全基因組鑒定和生物信息分析,系統(tǒng)鑒定了棉花基因組中的NF-YB基因家族的數(shù)目、亞細(xì)胞定位、染色體分布、進(jìn)化關(guān)系、基序以及組織表達(dá)情況等,旨在為后續(xù)深入探索NF-YB基因家族的功能提供一定的基礎(chǔ)理論依據(jù)。
1.1 試驗(yàn)材料
擬南芥NF-YB基因家族的氨基酸序列來自TAIR(http://www.arabidopsis.org/)網(wǎng)站;陸地棉標(biāo)準(zhǔn)系TM-1(G.hirsutumL.)基因組氨基酸序列和CDS序列數(shù)據(jù)來自中國農(nóng)業(yè)科學(xué)院棉花研究所(http://cgp.genomics.org.cn/page/species/index.jsp);陸地棉EST數(shù)據(jù)庫來自NCBI(http://www.ncbi.nlm.nih.gov/)網(wǎng)站。
1.2 棉花NF-YB基因家族的鑒定及亞細(xì)胞定位
首先在SMART(http://smart.embl-heidelberg.de/)網(wǎng)站預(yù)測擬南芥NF-YB基因家族氨基酸序列的保守結(jié)構(gòu)域,然后在Pfam(http://pfam.janelia.org/)網(wǎng)站下載其種子文件,用其在棉花基因組氨基酸序列中搜索同源序列,來鑒定棉花的NF-YB家族成員。其中,搜索工具使用HMMER3.1b1程序;亞細(xì)胞定位使用在線軟件CELLO(http://cello.life.nctu.edu.tw/)預(yù)測。
1.3 棉花NF-YB基因家族的進(jìn)化分析
為了明確棉花基因組中鑒定到的NF-YB基因家族成員的進(jìn)化關(guān)系,將其與擬南芥NF-YB基因家族成員的氨基酸序列一起構(gòu)建進(jìn)化樹,參考擬南芥的分組標(biāo)準(zhǔn)。進(jìn)化樹構(gòu)建工具采用MEGA6,建樹方法使用鄰接法(Neighbor-Joining,NJ),并進(jìn)行1 000次Boot strap抽樣自檢。
1.4 棉花NF-YB基因家族的染色體定位
利用Perl語言編程,根據(jù)gff3文件中標(biāo)注的基因位置,將NF-YB基因家族成員在染色體上的位置進(jìn)行提取和整理,然后利用MapInspect軟件繪制NF-YB成員在染色體上的物理分布圖,并標(biāo)注相應(yīng)的直系同源基因。
1.5 棉花NF-YB基因家族成員基序分析
利用MEME在線軟件(http://meme-suite.org/tools/meme)對棉花NF-YB成員進(jìn)行在線分析,輸入其氨基酸序列,檢測各自基序數(shù)目和類型。設(shè)置參數(shù)如下:基序最多顯示10個(gè),其他參數(shù)為默認(rèn)值。
1.6 棉花NF-YB基因家族成員的組織表達(dá)分析
利用棉花NF-YB基因家族成員的Cds序列對搜集到的EST進(jìn)行比對,采用BlastN程序,e-value設(shè)置為1e-10,根據(jù)比對結(jié)果,明確棉花NF-YB基因家族成員的組織表達(dá)模式。
2.1 棉花NF-YB基因家族的鑒定及亞細(xì)胞定位
通過SMART網(wǎng)站結(jié)構(gòu)域預(yù)測,發(fā)現(xiàn)所有的擬南芥NF-YB轉(zhuǎn)錄因子家族成員都含有CBFD_NFYB_HMF結(jié)構(gòu)域,pfam號為PF00808。在pfam網(wǎng)站下載此結(jié)構(gòu)域的種子文件,用HMMER3.1b1程序在棉花基因組氨基酸序列搜索后,共鑒定出棉花41個(gè)NF-YB基因家族成員。根據(jù)一般蛋白的命名方法,對TM-1基因組中41條NF-YB基因家族成員進(jìn)行了命名,從GhNF-YB1到GhNF-YB41,并統(tǒng)計(jì)了其相應(yīng)的氨基酸ID號、長度以及對應(yīng)的亞基因組(表1)。結(jié)果表明:該家族的氨基酸序列長度在200個(gè)氨基酸左右(GhNF-YB39除外,長度為746個(gè)氨基酸)。
亞細(xì)胞定位結(jié)果表明:棉花基因組中41條NF-YB基因家族成員中,除了GhNF-YB9定位在細(xì)胞核和葉綠體中,GhNF-YB34定位在細(xì)胞核和線粒體中,GhNF-YB18定位在細(xì)胞核和細(xì)胞外,其他成員都只定位在細(xì)胞核中(表1)。
2.2 棉花NF-YB基因家族的系統(tǒng)進(jìn)化樹分析
將擬南芥和棉花NF-YB基因家族成員的氨基酸序列進(jìn)行多序列比對并構(gòu)建了系統(tǒng)進(jìn)化樹。結(jié)果表明:與擬南芥類似,棉花NF-YB基因家族成員也分為3個(gè)小組(Ⅰ~Ⅲ)(圖1)。小組Ⅰ中,棉花中有35個(gè)成員:GhNF-YB10、GhNF-YB31、GhNF-YB14、GhNF-YB35、GhNF-YB4、GhNF-YB25、GhNF-YB1、GhNF-YB22、GhNF-YB20、GhNF-YB41、GhNF-YB16、GhNF-YB37、GhNF-YB7、GhNF-YB28、GhNF-YB34、GhNF-YB13、GhNF-YB6、GhNF-YB27、GhNF-YB2、GhNF-YB23、GhNF-YB18、GhNF-YB39、GhNF-YB3、GhNF-YB24、GhNF-YB11、GhNF-YB32、GhNF-YB12、GhNF-YB33、GhNF-YB17、GhNF-YB38、GhNF-YB21、GhNF-YB9、GhNF-YB30、GhNF-YB15和GhNF-YB36,擬南芥有8個(gè)成員:AtNF-YB7、AtNF-YB3、AtNF-YB2、AtNF-YB1、AtNF-YB8、AtNF-YB10、AtNF-YB5和AtNF-YB4;小組Ⅱ中,棉花有6個(gè)成員:GhNF-YB8、GhNF-YB29、GhNF-YB19、GhNF-YB40、GhNF-YB5和
表1 陸地棉NF-YB家族基本信息
GhNF-YB26,擬南芥有2個(gè)成員:AtNF-YB9和AtNF-YB6;小組Ⅲ中,沒有棉花NF-YB基因家族成員,擬南芥有3個(gè)成員:AtNF-YB12、AtNF-YB13和AtNF-YB11(圖1)。
圖1 陸地棉中NF-YB基因家族的系統(tǒng)進(jìn)化樹
2.3 棉花NF-YB基因家族的染色體定位
染色體定位結(jié)果表明:棉花41個(gè)NF-YB基因家族成員分布在2個(gè)亞基因組的19條染色體上。其中A11和D11染色體上分布最多,有5個(gè)成員。其他染色體上分布較為較少,一般為2個(gè)成員;另外,在這41個(gè)成員中,有19對成員(GhNF-YB1與GhNF-YB22、GhNF-YB2與GhNF-YB23、GhNF-YB3與GhNF-YB24、GhNF-YB5與GhNF-YB26、GhNF-YB6與GhNF-YB27、GhNF-YB7與GhNF-YB28、GhNF-YB8與GhNF-YB29、GhNF-YB9與GhNF-YB30、GhNF-YB10與GhNF-YB31、GhNF-YB11與GhNF-YB32、GhNF-YB12與GhNF-YB33、GhNF-YB13與GhNF-YB34、GhNF-YB14與GhNF-YB35、GhNF-YB15與GhNF-YB36、GhNF-YB16與GhNF-YB37、GhNF-YB17與GhNF-YB38、GhNF-YB18與GhNF-YB39、GhNF-YB19與GhNF-YB40、GhNF-YB20與GhNF-YB41)為直系同源基因(圖2)。
灰線.直系同源基因。
2.4 棉花NF-YB基因家族的基序分析
基序分析結(jié)果表明:進(jìn)化樹上分支近的NF-YB基因家族成員具有相同或類似的基序類型和排列順序。進(jìn)化樹中,棉花NF-YB基因家族成員分為2個(gè)小組(Ⅰ~Ⅱ)。小組Ⅰ:GhNF-YB10、GhNF-YB31、GhNF-YB14和GhNF-YB35具有完全相同的5個(gè)基序,且排列順序完全相同。GhNF-YB4和GhNF-YB25具有完全相同的2個(gè)基序,且排列順序完全相同。GhNF-YB1、GhNF-YB22、GhNF-YB20和GhNF-YB41具有完全相同的6個(gè)基序,且排列順序完全相同。GhNF-YB16、GhNF-YB37、GhNF-YB7和GhNF-YB28具有相似的5~7個(gè)基序類型,排列順序也基本相同。GhNF-YB34、GhNF-YB13、GhNF-YB6和GhNF-YB27具有相似的5~6個(gè)基序類型,排列順序也基本相同。GhNF-YB2、GhNF-YB23、GhNF-YB18和GhNF-YB39具有相同的6個(gè)基序類型,排列順序完全相同。GhNF-YB3、GhNF-YB24、GhNF-YB11、GhNF-YB32、GhNF-YB12、GhNF-YB33、GhNF-YB17、GhNF-YB38、GhNF-YB21、GhNF-YB9、GhNF-YB30、GhNF-YB15和GhNF-YB36具有相似的3~4基序類型,排列順序也基本相同(圖3);小組Ⅱ:GhNF-YB8和GhNF-YB29具有完全相同的6個(gè)基序類型和排列順序。GhNF-YB19和GhNF-YB40具有6個(gè)相似的基序類型和排列順序。GhNF-YB5和GhNF-YB26具有6個(gè)完全相同的基序類型和排列順序(圖3)??傮w來說,小組Ⅰ的35個(gè)NF-YB成員具有相似的5~7個(gè)基序類型和排列順序,小組Ⅱ的6個(gè)NF-YB成員具有6個(gè)相似的基序類型和排列順序(圖3)。
圖3 陸地棉基因組中NF-YB基因家族的基序類型
2.5 棉花NF-YB基因家族的組織表達(dá)分析
組織表達(dá)分析發(fā)現(xiàn),棉花41個(gè)NF-YB基因家族成員中,有24個(gè)成員在根、莖、葉、花、蕾、胚珠、纖維、鈴、花藥、胚性愈傷組織和分生組織中廣泛表達(dá)(表2)。大部分基因在根、蕾、花、莖、纖維、胚珠和分生組織中表達(dá)。其中,在纖維組織中表達(dá)的NF-YB基因家族成員最多(20個(gè)基因),少數(shù)基因在葉、鈴、花藥和胚性愈傷組織中表達(dá)(表2)。
表2 陸地棉NF-YB基因家族成員的組織表達(dá)模式
注:Y.有表達(dá);N.無表達(dá)。
Note:Y.Expression;N.No expression.
四倍體陸地棉標(biāo)準(zhǔn)系TM-1基因組屬于AADD型,其A亞組和D亞組的基因之間存在較高的共線性[17]。本研究在陸地棉標(biāo)準(zhǔn)系TM-1基因組中共鑒定了41個(gè)NF-YB基因家族成員,其中有38個(gè)成員(19對)為直系同源基因,說明四倍體陸地棉在物種形成過程中沒有經(jīng)過基因組水平上大規(guī)模的基因重排現(xiàn)象。這與陸地棉基因組的研究結(jié)果相一致[16-18],也支持徐珍珍和倪萬潮等在YABBY、ZIP和EPSPS基因家族上的分析結(jié)果[19-21]。此外,進(jìn)一步研究發(fā)現(xiàn),每對直系同源基因具有相同或相似的亞細(xì)胞定位、基序類型和排列順序,在進(jìn)化樹上分布在1個(gè)小組,且具有相同或相似的組織表達(dá)類型,表明平行進(jìn)化同源基因具有相同或相似的基因功能。
系統(tǒng)進(jìn)化樹分析結(jié)果表明,在擬南芥中,NF-YB基因家族成員分為Ⅰ、Ⅱ和Ⅲ,共3個(gè)小組[22]。在棉花中,含有Ⅰ和Ⅱ2個(gè)小組,這種分布情況跟擬南芥、水稻、大豆[22]和胡楊樹[23]整體一致,可以作為NF-YB家族起源早于單、雙子葉植物分化的1個(gè)證據(jù)。而在棉花中,沒有小組Ⅲ的成員,推測在棉花中小組Ⅲ的成員可能在其進(jìn)化過程中丟失了。另外,在進(jìn)化上分支較近的NF-YB基因家族成員具有相似或相同的基序類型和排列順序以及組織表達(dá)類型,可以推測每個(gè)小組成員之間具有相似的功能。
在我們鑒定到的41個(gè)NF-YB基因家族成員,有24個(gè)成員在根、莖、葉、花、蕾、胚珠、纖維、鈴、花藥、胚性愈傷組織和分生組織中廣泛表達(dá),推測其在這些組織的發(fā)育過程中起著重要的作用。大部分基因在根、蕾、花、莖、纖維、胚珠和分生組織中表達(dá),其中在纖維組織中表達(dá)的NF-YB基因家族成員最多(20個(gè)),提示它們可能在纖維發(fā)育過程中發(fā)揮著重要的作用。由于棉花纖維是世界上重要的紡織原料之一,具有重要的經(jīng)濟(jì)價(jià)值,因此,本研究鑒定的在纖維組織表達(dá)的NF-YB基因家族成員將對深入了解棉纖維發(fā)生發(fā)育機(jī)制奠定一定的理論基礎(chǔ)。
[1] Gelinas R,Endlich B,Pfeiffer C,et al.G to a substitution in the distal CCAAT box of the a gamma-globin gene in Greek hereditary persistence of fetal haemoglobin[J].Nature,1985,313(6000):323-325.
[2] Buchere P,Frifonov E N.CCAAT box revisited:bidirectionality,location and context[J].Journal of Biomolecular Structure & Dynamics,1988,5(6):1231-1236.
[3] Bucher P.Weight matrix descriptions of four eukaryotic RNA polymerase Ⅱ promoter elements derived from 502 unrelated promoter sequences[J].Journal of Molecular Biology,1990,212(4):563-578.
[4] Mantovani R.A survey of 178 NF-Y binding CCAAT boxes[J].Nucleic Acids Research,1998,26(5):1135-1143.
[5] Testa A,Donati G,Yan P,et al.Chromatin immunoprecipitation(ChIP) on chip experiments uncover a widespread distribution of NF-Y binding CCAAT sites outside of core promoters[J].The Journal of Biological Chemistry,2005,280(14):13606-13615.
[6] Romier C,Cocchiarella F,Mantovani R,et al.The NF-YB/NF-YC structure gives insight into DNA binding and transcription regulation by CCAAT factor NF-Y[J].Journal of Biological Chemistry,2003,278(2):1336-1345.
[7] Riechmann J L,Heard J,Martin G,et al.Arabidopsistranscription factors:genome-wide comparative analysis among eukaryotes[J].Science,2000,290(5499):2105-2110.
[8] Miyoshi K,Ito Y,Serizawa A,et al.OsHAP3 genes regulate chloroplast biogenesis in rice[J].Plant Journal,2003,36(4):532-540.
[9] Thirumurugan T,Ito Y,Kubo T A,et al.Identification,characterization and interaction of HAP family genes in rice[J].Molecular Genetics and Genomics,2008,279(3):279-289.
[10] Cai X,Ballif J,Endo S,et al.A putative CCAAT-binding transcription factor is a regulator of flowering timing inArabidopsis[J].Plant Physiology,2007,145(1):98-105.
[11] Chen N Z,Zhang X Q,Wei P C,et al.AtHAP3b plays a crucial role in the regulation of flowering time inArabidopsisduring osmotic stress[J].Journal of Biochemistry and Molecular Biology,2007,40(6):1083-1089.
[12] Li C,Dubcovsky J.Wheat FT protein regulates VRN1 transcription through interactions with FDL2[J].Plant Journal,2008,55(4):543-554.
[13] Nelson D E,Repetti P P,Adams T R,et al.Plant nuclear factor Y(NF-Y) B subunits confer drought tolerance and lead to improved corn yields on water-limited acres[J].Proceedings of the National Academy of Sciences of the United States of America,2007,104(42):16450-16455.
[14] Wang K,Wang Z,Li F,et al.The draft genome of a diploid cottonGossypiumraimondii[J].Nature Genetics,2012,44(10):1098-1103.
[15] Li F,Fan G,Wang K,et al.Genome sequence of the cultivated cottonGossypiumarboreum[J].Nature Genetics,2014,46(6):567-572.
[16] Li F G,Fan G Y,Lu C R,et al.Genome sequence of cultivated Upland cotton(GossypiumhirsutumTM-1) provides insights into genome evolution[J].Nature Biotechnology,2015,33(5):524-530.
[17] Zhang T,Hu Y,Jiang W,et al.Sequencing of allotetraploid cotton(GossypiumhirsutumL.acc.TM-1) provides a resource for fiber improvement[J].Nature Biotechnology,2015,33(5):531-537.
[18] Paterson A H,Wendel J F,Gundlach H,et al.Repeated polyploidization ofGossypiumgenomes and the evolution of spinnable cotton fibres[J].Nature,2012,492(7429):423-427.
[19] 徐珍珍,倪萬潮,張香桂,等.棉花YABBY基因家族的全基因組分析[J].生物技術(shù)通報(bào),2015,31(11):146-152.
[20] 倪萬潮,鞏元勇,徐珍珍,等.陸地棉GhZIP基因家族全基因組分析[J].華北農(nóng)學(xué)報(bào),2015,30(6):8-16.
[21] 鞏元勇,徐珍珍,郭書巧,等.陸地棉EPSPS基因全基因組分析[J].華北農(nóng)學(xué)報(bào),2016,31(1):15-21.
[22] 徐兆師,鄭煒君,馮志娟,等.大豆NF-YB家族全基因組鑒定,分類和表達(dá)[J].作物學(xué)報(bào),2013,38(9):1570-1582.
[23] 嚴(yán)東輝.胡楊干旱響應(yīng)轉(zhuǎn)錄組及NF-YB基因表達(dá)譜[D].北京:北京林業(yè)大學(xué),2012.
Genome-wide Analysis ofNF-YBGene Family inGossypiumhirsutumL.
LIU Jing1,XU Zhenzhen2,YUAN Na1,GUO Yue1,ZHANG Baolong1,DU Jianchang1
(1.Institute of Biotechnology,Jiangsu Academy of Agricultural Sciences,Provincial Key Laboratory of Agrobiology,Nanjing 210014,China;2.Institute of Industrial Crops,Jiangsu Academy of Agricultural Sciences,Key Laboratory of Cotton and Rapeseed in the Lower Reaches of the Yangtze River,Ministry of Agriculture,Nanjing 210014,China)
In order to further understand the structure and function ofNF-YBgene family,we have systematically investigated the number,subcellular localization,chromosome distribution,evolutionary relationships,motif and tissue expression pattern of of family in the genome ofGossypiumhirsutumL.acc.TM-1 by bioinformatics method.41NF-YBgenes were identified in TM-1 genome;the 41NF-YBgenes contain the same CBFD_NFYB_HMF domain,and most of them were located in nucleus; they distributed on 19 chromosomes,and there were 19 pairs of the genes on the A subgroup and D subgroup were orthologous genes; 41NF-YBgenes can be divided into groupⅠand groupⅡ,and there were similar motif type and arrangement in each group;.24NF-YBgenes were expressed,but the expression pattern varied among different tissues.
NF-YBgene family;GossypiumhirsutumL.;Bioinformatics
2016-07-12
江蘇省“333”人才工程項(xiàng)目(BRA2013267);江蘇省農(nóng)業(yè)科技自主創(chuàng)新基金項(xiàng)目(CX13(3059));棉花生物學(xué)國家重點(diǎn)實(shí)驗(yàn)室開放課題(CB2016B03)
劉 靜(1986-),女,山東濟(jì)南人,助理研究員,碩士,主要從事生物信息學(xué)研究。
Q78;S562.03
A
1000-7091(2016)05-0021-07
10.7668/hbnxb.2016.05.004