穆彩琴,屈聰玲,張瑞娟,李燕,楊致榮
(1.山西農(nóng)業(yè)大學(xué)文理學(xué)院,山西太谷030801;2.山西農(nóng)業(yè)大學(xué)研究生院,山西太谷030801;3.山西農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,山西太谷030801)
谷子CO家族基因的全基因組鑒定與分析
穆彩琴1,2,屈聰玲2,3,張瑞娟2,3,李燕1,2,楊致榮1
(1.山西農(nóng)業(yè)大學(xué)文理學(xué)院,山西太谷030801;2.山西農(nóng)業(yè)大學(xué)研究生院,山西太谷030801;3.山西農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,山西太谷030801)
抽穗開花是高等植物從營(yíng)養(yǎng)生長(zhǎng)向生殖生長(zhǎng)轉(zhuǎn)變的過(guò)程,該過(guò)程受到眾多基因的調(diào)控。CONSTANS(CO)是光周期開花途徑中的一個(gè)關(guān)鍵基因,是生物節(jié)律鐘基因和開花基因之間的關(guān)鍵樞紐。利用生物信息學(xué)的方法,從谷子基因組中鑒定了34個(gè)CO基因;與擬南芥CO家族的17個(gè)成員進(jìn)行同源比對(duì),發(fā)現(xiàn)Seita.7G007800與Seita.9G020100相似性最高;在此基礎(chǔ)上,分析了谷子CO基因的啟動(dòng)子,發(fā)現(xiàn)啟動(dòng)子有光響應(yīng)元件Sp1、脫落酸響應(yīng)元件ABRE以及赤霉素響應(yīng)元件P-box等;RNA-Seq轉(zhuǎn)錄組測(cè)序發(fā)現(xiàn),這些CO基因在葉片中表達(dá)量存在顯著差異,其中,Seita.4G192300基因表達(dá)量最高,而Seita.1G304900,Seita.3G080700和Seita.4G001600這3個(gè)基因在葉片中不表達(dá)。這些結(jié)果不僅為深入研究CO基因與抽穗開花的關(guān)系提供依據(jù),而且為后續(xù)谷子抽穗開花途徑的研究奠定理論基礎(chǔ)。
谷子;全基因組;CONSTANS;光周期途徑;抽穗;開花
谷子(Setaria italica)是禾本科狗尾草屬植物,具有抗旱性強(qiáng)、耐貧瘠等優(yōu)點(diǎn),廣泛種植于干旱和半干旱地區(qū)。2012年,由美國(guó)國(guó)家能源部所屬的聯(lián)合基因組研究所和中國(guó)華大基因分別進(jìn)行的豫谷1號(hào)和張谷的全基因組測(cè)序工作相繼完成,從此谷子功能基因組學(xué)研究進(jìn)入了一個(gè)新的時(shí)代[1-2]。隨著我國(guó)和世界其他國(guó)家研究人員對(duì)谷子的高度重視,其逐漸發(fā)展為禾谷類重要的旱生C4模式作物[3]。
抽穗開花是植物生長(zhǎng)發(fā)育過(guò)程中的重要階段,受到光周期、溫度、激素和自身發(fā)育等眾多內(nèi)外因素的綜合調(diào)控,且不同植物間的調(diào)控機(jī)制也不盡相同。在眾多外界環(huán)境因素中,植物對(duì)光周期信號(hào)尤其敏感。CO基因在響應(yīng)光周期調(diào)節(jié)中起著重要作用[4-6],是調(diào)控植物開花的重要基因之一。Putterill等[7]最早報(bào)道了擬南芥中的CO基因。CO是一類鋅指蛋白轉(zhuǎn)錄因子,含有B-box和CCT結(jié)構(gòu)域兩類保守結(jié)構(gòu)域[8-9]。該基因是植物開花的正調(diào)控因子,其表達(dá)受到mRNA和蛋白水平的雙重調(diào)控。在短日照條件下,CO基因在黑夜會(huì)出現(xiàn)高表達(dá),而CO蛋白在黑暗條件下會(huì)被迅速降解,因此,不能促進(jìn)開花;而在長(zhǎng)日照條件下,CO基因在傍晚和黑夜都會(huì)出現(xiàn)高表達(dá),并且CO蛋白在光照下可以穩(wěn)定存在,從而促進(jìn)開花[5]。CO受到眾多基因的調(diào)控,包括CYCLING DOF FACTOR1(CDF1),F(xiàn)LAVIN-BINDING KELCH REPEAT F-BOX 1(FKF1),GIGANTEA(GI),CONSTITUTIVEPHOTOMORPHOGENESIS1(COP1)和EFL3等。在蛋白水平上,PHYTOCHROME B(PHYB)在上午能促進(jìn)CO蛋白泛素化,導(dǎo)致其降解,而PHYA,CRYPTOCHROME 1(CRY1)以及CRY2等能在傍晚穩(wěn)定CO蛋白[10]。最終,CO基因通過(guò)調(diào)控FLOWERING LOCUS T(FT)基因的表達(dá)進(jìn)而調(diào)控植物開花[5]。
目前關(guān)于擬南芥、水稻等模式作物的開花途徑研究的比較清楚,但關(guān)于谷子的開花研究目前較少,尤其對(duì)谷子一些重要的開花基因研究鮮有報(bào)道。本研究對(duì)谷子進(jìn)行了全基因組分析,從中間發(fā)現(xiàn)了34個(gè)CO基因,進(jìn)一步對(duì)這些基因進(jìn)行了生物信息學(xué)分析,并利用RNA-Seq高通量測(cè)序技術(shù)檢測(cè)了其在營(yíng)養(yǎng)生長(zhǎng)時(shí)期的表達(dá)情況,旨在為深入揭示谷子抽穗開花的調(diào)控機(jī)制提供依據(jù)。
1.1 供試材料
晉谷21號(hào)由山西農(nóng)業(yè)大學(xué)生物工程研究所提供。
1.2 試驗(yàn)方法
1.2.1 谷子CO基因的生物信息學(xué)分析利用Phytozome v11.0中豫谷1號(hào)基因組數(shù)據(jù)庫(kù)(https:// phytozome.jgi.doe.gov/pz/portal.html)進(jìn)行關(guān)鍵詞搜索,進(jìn)一步結(jié)合NCBI,GenBank等數(shù)據(jù)庫(kù)獲取谷子CO蛋白的信息,并下載整理。使用Phytozome v 11.0中JBrowse功能下載豫谷1號(hào)CO基因在染色體上的位置信息。使用MEGA 7.0軟件中的Neibor-joining算法對(duì)下載的谷子CO氨基酸序列構(gòu)建系統(tǒng)發(fā)育樹。通過(guò)PlantCARE網(wǎng)站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)在線分析啟動(dòng)子元件。
1.2.2 谷子CO基因的表達(dá)情況分析將晉谷21號(hào)播種在人工氣候箱培養(yǎng),光照時(shí)間為16 h光照/8 h黑暗,光照強(qiáng)度為50 000 lx,溫度為25℃(光照)/ 22℃(黑暗)。播種28 d,提取總RNA用于RNASeq測(cè)序。RNA提取采用植物總RNA提取試劑盒(天根生化科技(北京)有限公司,貨號(hào)DP432),操作方法按照試劑盒使用說(shuō)明進(jìn)行。利用Nanodrop和Agilent 2100檢測(cè)RNA的純度(OD260/OD280)、濃度和完整性,檢測(cè)合格的樣品用于測(cè)序文庫(kù)的構(gòu)建和RNA-Seq測(cè)序。文庫(kù)構(gòu)建和RNA-Seq測(cè)序參照王興春等[11]的方法進(jìn)行。
2.1 谷子CO基因的基本信息
利用擬南芥已知17個(gè)CO蛋白序列在豫谷1號(hào)基因組中進(jìn)行Blast分析,篩選到34個(gè)谷子CO基因(圖1),比擬南芥CO基因家族多出17個(gè)基因,但是否存在未被篩選出的CO-like基因依舊不清楚。比較它們的蛋白序列發(fā)現(xiàn),部分基因之間的相似性非常高,其中,Seita.7G007800與Seita.9G020100相似性最高,達(dá)到85.09%,Seita.1G301300與Seita. 2G175000,Seita.7G153500與Seita.1G228800以及Seita.4G192300與Seita.1G065300的相似性也較高。
2.2 谷子CO基因的理化性質(zhì)
從豫谷1號(hào)的CO基因的cDNA序列預(yù)測(cè)得到的氨基酸序列,比較發(fā)現(xiàn)CO蛋白的氨基酸序列長(zhǎng)度在174~1 033 aa,分子量處于10.65~113.86 kDa,理論等電點(diǎn)在4.74~11.8(表1)。
表1 谷子CO蛋白家族理化性質(zhì)
2.3 谷子CO基因家族啟動(dòng)子元件
表2 谷子CO基因家族啟動(dòng)子順式元件預(yù)測(cè)
根據(jù)豫谷1號(hào)全基因組序列,獲取谷子擴(kuò)展蛋白基因CDS區(qū)上游1 500 bp的核苷酸序列,用PlantCARE進(jìn)行啟動(dòng)子在線分析,發(fā)現(xiàn)除了基本啟動(dòng)子元件TATA-box和CAAT-box外,谷子CO基因還包含多種與脅迫響應(yīng)相關(guān)的順式作用元件,包括熱脅迫響應(yīng)元件HSE、低溫脅迫響應(yīng)元件LTR、植物激素響應(yīng)元件TGA-element、赤霉素響應(yīng)元件P-box以及光響應(yīng)元件Sp1等(表2)。
將豫谷1號(hào)CO家族基因的基本啟動(dòng)子元件進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)90%以上的基因含有光響應(yīng)元件Sp1,80%以上的基因含有脫落酸響應(yīng)元件ABRE,說(shuō)明谷子中的CO基因參與對(duì)光照和脅迫的響應(yīng)(表2)。
2.4 CO基因在營(yíng)養(yǎng)生長(zhǎng)期的表達(dá)分析
表3 葉片中CO基因的表達(dá)量
將播種28 d的晉谷21號(hào)提取RNA進(jìn)行轉(zhuǎn)錄組測(cè)序分析,對(duì)CO基因的表達(dá)進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)表達(dá)量較低(≤10)的基因?yàn)?0個(gè),占58.82%;高表達(dá)(>1 000)的基因?yàn)?個(gè),占2.94%(表3)。其中,Seita.4G192300的表達(dá)量最高(表3)。
CO是光周期途徑的一個(gè)重要基因,在植物的生物鐘與開花之間起重要的樞紐作用。通過(guò)對(duì)谷子CO基因組的分析,有利于了解CO基因特征及功能,對(duì)后續(xù)谷子開花途徑的研究具有重要意義。
目前已經(jīng)對(duì)擬南芥和水稻的開花途徑研究比較清楚,在擬南芥中發(fā)現(xiàn)CO家族有17個(gè)成員[12],水稻中有16個(gè)成員[13],然而在谷子中發(fā)現(xiàn)有34個(gè)成員。在同源性高的谷子家族成員中含有B-box和CCT兩類保守結(jié)構(gòu)域,其功能可能與擬南芥的CO基因類似。
谷子抽穗開花會(huì)受到內(nèi)外因素的綜合調(diào)控,通過(guò)對(duì)谷子CO基因上游約1 500 bp的啟動(dòng)子序列分析發(fā)現(xiàn),啟動(dòng)子中含有多個(gè)與逆境相關(guān)的順式作用元件,包括熱脅迫響應(yīng)元件HSE、低溫脅迫響應(yīng)元件LTR、植物激素響應(yīng)元件TGA-element、赤霉素響應(yīng)元件P-box、以及光響應(yīng)元件Sp1,其中,90%以上的基因含有光響應(yīng)元件Sp1,CO基因家族可能通過(guò)以上順式作用元件參與谷子對(duì)光照的響應(yīng)。
本研究通過(guò)對(duì)谷子CO基因進(jìn)行生物信息學(xué)分析,并對(duì)晉谷21號(hào)轉(zhuǎn)錄組測(cè)序結(jié)果統(tǒng)計(jì),發(fā)現(xiàn)CO家族成員的表達(dá)水平存在差異。初步了解了谷子CO基因與谷子開花途徑的關(guān)系,為進(jìn)一步理解CO基因在谷子抽穗開花過(guò)程中的作用提供了依據(jù),同時(shí)為后續(xù)深入研究谷子開花途徑奠定了理論基礎(chǔ)。
[1]Quan ZW,ChengSF,Xu X,et al.Genome sequence offoxtail millet(Setaria italica)provides insights into grass evolution and biofuel potential[J].Nat Biotechnol,2012,30(6):549-554.
[2]Bennetzen J L,Schmutz J,Wang H,et al.Reference genome sequence ofthe model plant Setaria[J].Nature biotechnology,2012,30(6):555-561.
[3]Doust A N,Kellogg E A,Devos K M,et al.Foxtail millet:a sequence-driven grass model system[J].Plant Physiol,2009,149(1):137-141.
[4]Samach A,Onouchi H,Gold S E,et al.Distinct roles of CONSTANS target genes in reproductive development of Arabidopsis[J].Science,2000,288:1613-1616.
[5]An H,Roussot C,Suarez-Lopez P,et al.CONSTANS acts in thephloem to regulate a systemic signal that induces photoperiodic flowering ofArabidopsis[J].Development,2004,131(15):3615-3626.
[6]Suarez-Lopez P,WheatleyK,Robson F,et al.CONSTANS mediates between the circadian clock and the control of flowering in Arabidopsis[J].Nature,2001,410:1116-1120.
[7]Putterill J,Robson F,Lee K,et al.The CONSTANS gene of Arabidopsis promotes floweringand encodes a protein showingsimilarities to zinc finger transcription factors[J].Cell,1995,80(6):847-857.
[8]Strayer C,Oyama T,Schultz T F,et al.Cloning of the Arabidopsis clock gene TOC1,an autoregulatory response regulator homolog[J]. Science,2000,289:768-771.
[9]Borden K L.RING fingers and B-boxes:zinc-binding protein-protein interaction domains[J].Biochem Cell Biol,1998,76(2/3):351-358.
[10]Endo M,Tanigawa Y,Murakami T,et al.hytochrome-dependent Late-flowering accelerates flowering through physical interactions with phytochrome B and CONSTANS[J].Proc Natl Acad Sci USA,2013,110(44):18017-18022.
[11]王興春,譚河林,陳釗,等.基于RNA-Seq技術(shù)的連翹轉(zhuǎn)錄組組裝與分析及SSR分子標(biāo)記的開發(fā)[J].中國(guó)科學(xué):生命科學(xué),2015,45(3):301-310.
[12]Robson F,Costa MM,Hepworth S R,et al.Functional importance of conserved domains in the flowering-time gene CONSTANS demonstrated byanalysis of mutant alleles and transgenic plants[J]. Plant J,2001,28(6):619-631.
[13]Griffiths S,Dunford R P,Coupland G,et al.The evolution of CONSTANS-like gene families in barley,rice,and Arabidopsis[J].Plant Physiol,2003,131(4):1855-1867.
Genome-wide Identification and Analysis of CO Family Genes in Foxtail Millet
MUCaiqin1,2,QUCongling2,3,ZHANGRuijuan2,3,LI Yan1,2,YANGZhirong1
(1.College ofArts and Sciences,Shanxi Agricultural University,Taigu 030801,China;2.College ofGraduate,Shanxi Agricultural University,Taigu 030801,China;3.College ofLife Sciences,Shanxi Agricultural University,Taigu 030801,China)
Heading and flowering is the transition stage from vegetative to reproductive growth in higher plants,which is regulated bymultiple genes.CONSTANS(CO)is a keygene in photoperiodic floweringpathwayand is a keyjunction between the circadian clock and flowering gene.In this study,34 CO genes were identified using bioinformatics in foxtail millet.The paper analyzed the relationship between these CO genes and the 17 CO genes in Arabidopsis thaliana,and founded that Seita.7G007800 and Seita.9G020100 had the highest similarity,further analyzed their promoter sequence,and identified light responsive element Sp1,ABA response element ABRE, gibberellin-responsive element P-box.RNA-Seq transcriptom sequencing revealed that the expression level of these CO genes was significantly different in leaves.Seita.4G192300 had the highest expression,while Seita.1G304900,Seita.3G080700 and Seita. 4G001600 were not expressed in leaves.These results not only provide a foundation for further study on the relationship between CO genes and flowering,but alsocontribute tofurther research on headingand floweringpathways in foxtail millet.
foxtail millet;genome-wide;CONSTANS;photoperiod pathway;heading;flowering
S515
A
1002-2481(2016)09-1243-05
10.3969/j.issn.1002-2481.2016.09.02
2016-06-26
山西省回國(guó)留學(xué)人員科研資助項(xiàng)目(2015-067);山西省留學(xué)回國(guó)人員科技活動(dòng)擇優(yōu)資助項(xiàng)目(2014-11)
穆彩琴(1990-),女,山西柳林人,在讀碩士,研究方向:谷子抽穗開花的調(diào)控機(jī)制。屈聰玲同為第一作者。楊致榮為通信作者。