謝 威,劉天奇,張雪晴,張時煜,高紅秀,金正勛,張忠臣,姜振峰
(東北農(nóng)業(yè)大學 農(nóng)學院,哈爾濱 150030)
水稻是最重要的糧食作物之一,是全國60%以上人口的主要食物來源[1]。水稻分蘗期是由秧田向本田過渡的生長關鍵期,這一時期的生長對水稻的總產(chǎn)量有重要影響[2-6]。張洪程等[7-9]研究表明,水稻從拔節(jié)一直到成熟期的干物質積累量對產(chǎn)量產(chǎn)生正向影響。另外,水稻分蘗期的栽培調控會導致稻米中直鏈淀粉含量下降,從而提高稻米品質[10]。
淀粉是稻米中最重要的能量儲存物質[1],其合成涉及一系列酶,包括顆粒結合淀粉合酶(GBSS)、可溶性淀粉合酶(SSS)、分支酶(SBE)、脫分支酶(DBE)、異淀粉酶(ISA)等,對應基因有20多個[1,11]。淀粉合酶已鑒定出5個亞家族,包括顆粒結合淀粉合酶(GBSS)、淀粉合酶Ⅰ(SSⅠ)、淀粉合酶Ⅱ(SSⅡ)、淀粉合酶Ⅲ(SSⅢ)和淀粉合酶Ⅳ(SSⅣ)。直鏈淀粉的合成必須經(jīng)過GBSS的催化,Dian等[12]研究水稻淀粉合成時發(fā)現(xiàn)基因GBSSⅡ。水稻儲藏器官中的直鏈淀粉含量主要由GBSSⅠ控制[13],水稻營養(yǎng)器官中的瞬時淀粉含量由GBSSⅡ調控[14]。SSⅠ與支鏈淀粉的極短鏈合成有關,SSⅢ與長B1和B2鏈合成有關[11]。Commuri等[15]在研究玉米時發(fā)現(xiàn),SSⅠ對支鏈淀粉親和力強,直鏈淀粉次之,對糖原的親和力最低。SSⅡa參與水稻A + B1鏈的合成[11],為一種主效基因,調控稻米的糊化溫度[16],Umemoto等[17]將SSⅡa定位在水稻的第6號染色體短臂上的ALK位點。有研究指出,GBSSⅠ除有催化直鏈淀粉合成的功能外,對支鏈淀粉的合成也有一定影響[1]。ISA1、ISA2和ISA3是水稻異淀粉酶(ISA)的3種同工型。ISA1在水稻的根莖葉中未發(fā)現(xiàn)表達,在水稻早期胚乳發(fā)育中進行表達[18],而ISA2在水稻葉片與胚乳中進行表達,ISA3則主要在水稻葉片中進行表達[19]。
有研究發(fā)現(xiàn)與水稻產(chǎn)量相關的因素對水稻的糖代謝有影響[20]。有報道稱,參與蔗糖代謝的基因有OsINV3和OsINV2等[21],在水稻中已鑒定出5個蔗糖共運體基因家族成員,分別為OsSUT1、OsSUT2、OsSUT3、OsSUT4和OsSUT5[22]。
盡管與淀粉合成相關基因的功能有諸多報道,但在水稻分蘗期葉片中行使功能的淀粉合成相關基因的報道還很少,且水稻淀粉合成相關基因的轉錄調控關系尚不清楚。本研究對分蘗期‘五優(yōu)稻4號’(‘WYD4’)的葉片進行轉錄組分析,為揭示淀粉合成相關基因的轉錄調控和水稻分蘗期的栽培調控提供分子水平的依據(jù)。
試驗在哈爾濱東北農(nóng)業(yè)大學盆栽場進行。首先將水稻品種‘五優(yōu)稻4號’(‘WYD4’)種子用30%次氯酸鈉滅菌30 min后放入錐形瓶中,然后用0.6%的硝酸在室溫下處理以打破休眠狀態(tài),移入30 ℃培養(yǎng)箱催芽,在溫室中播種。三葉一心期移栽至0.24 m2的白盆中,插秧規(guī)格為每穴3株苗,插秧方式為10 cm×10 cm。
盆栽土壤的pH為7.52,基礎肥力為全氮 1.51 g/kg、速效氮158.76 mg/kg、速效磷50.65 mg/kg、速效鉀177.68 mg/kg、有機質3.11%?;蕿榧兊?2 kg/hm2、純磷90 kg/hm2和純鉀72 kg/hm2,移栽后7 d施加分蘗肥,分蘗肥為純氮54 kg/hm2,水分管理為常規(guī)管理。在分蘗期氮素處理后第7天、第14天和第21天設置3次生物重復,以確保試驗的可靠性。
在分蘗期氮素處理后第7天、第14天和第21天拍照,分別收集每株苗頂部第一片完全展開的葉片并保存在已標記Nt7d,Nt14d,Nt21d的試管中,置于液氮中凍存0.5 h后在干冰保存下快遞至浙江安諾優(yōu)達生物科技有限公司,進行RNA提取和轉錄組分析。利用Qubit 3.0熒光儀(Life technologies,CA,USA)進行 RNA純度和濃度的測定,并用Agilent 2100 RNA Nano 6000檢測試劑盒(Agilent technologies,CA,USA)對 RNA樣品的完整性和濃度進行分析。聚類分析(Clustering)與測序使用 HiSeq PE Cluster Kit v4-cBot-HS(Illumia)試劑在 cBot 上完成。隨后利用 HiSeq 測序平臺獲得150 bp的雙端測序Reads數(shù)據(jù)。最后通過GffCompare將RNA-seq數(shù)據(jù)的轉錄組與參考轉錄組進行比對,結合HTSeqv 0.6.0 Reads計數(shù)(http://www-huber.embl.de/users/anders/HTSeq/doc/overview)計算FPKM(每千堿基每米的片段映射讀數(shù)),從而估計每個樣本中基因的表達水平。
利用DESeq2方法檢測在基因表達水平基礎上的差異表達基因,得到P值,然后根據(jù)Benjamini 和 Hochberg 方法校正控制假陽性。差異基因篩選主要參考差異倍數(shù)值(FoldChange)以及q值(padj值,矯正之后的P值)作為相關指標,通常選取|lb FoldChange|≥1和q< 0.05的差異基因作為顯著差異基因?;蚬δ苊枋鰠⒖糡he Rice Annotation Project Database(rapdb.dna.affrc.go.jp)。
首先,通過 GO(Gene ontology,http://geneontology.org/)功能顯著性富集分析確定差異表達基因行使的主要生物學功能。根據(jù)計算注釋到每個GO條目中的差異表達基因數(shù)目,應用超幾何檢驗,找出與整個基因組背景相比,差異表達基因顯著富集的GO 條目,其篩選標準為q≤ 0.05。其次,利用KEGG(Kyoto encyclopedia of genes and genomes,http://www.kegg.jp/)找出差異表達基因中顯著性富集的Pathway。對KEGG中每個Pathway應用超幾何檢驗進行富集分析,找出差異表達基因中顯著性富集的Pathway,并對每個比較組進行q值的KEGG條目分析和作圖。
利用 STRING 蛋白質互作數(shù)據(jù)庫(http://string-db.org/)將目標基因集直接映射到水稻的蛋白互作網(wǎng)絡。然后將蛋白互作網(wǎng)絡數(shù)據(jù)文件導入 Cytoscape 軟件,并根據(jù)目標基因集中的基因屬性進行互作網(wǎng)絡的可視化編輯。
表和圖的數(shù)據(jù)分析與處理利用WPS Office(11.1.0.9339)及Adobe Photoshop(13.0 20120315)完成。
從第7天、第14天和第21天WYD4的分蘗期表型可以看出,WYD4的群體長勢越來越旺盛,冠層覆蓋度越來越高(圖1)。這個結果為采集分蘗期WYD4葉片進行轉錄組分析提供了表型基礎。
通過對第7天、第14天和第21天的9個分蘗期WYD4葉片樣本進行轉錄組測序,將Raw data經(jīng)數(shù)據(jù)過濾后分別產(chǎn)生45 454 356、42 789 826、47 737 496、41 771 146、42 587 134、40 932 800、44 273 324、43 704 008和45 662 926個Clean reads,且Q30為92.67%~93.31%。將過濾后的測序序列進行基因組定位分析,9個樣本分別有 97.02%、96.94%、96.76%、96.83%、97.01%、96.90%、96.46%、96.61%和96.68%的Clean reads能夠比對到水稻基因組上(表1)。這些結果表明轉錄組測序數(shù)據(jù)產(chǎn)量及質量都比較高,可用于進一步分析。
表1 測序數(shù)據(jù)統(tǒng)計與質量檢測
WYD4葉片在分蘗期共產(chǎn)生12 815個差異表達基因(DEGs,Differential expression genes),通過第14天與第7天的對比,有3 962個上調差異表達基因,有3 246下調差異表達基因;通過第21天與第14天的對比,有3 374個上調差異表達基因,有5 198個下調差異表達基因;通過第21天與第7天的對比,有3 062個上調差異表達基因,有3 953個下調差異表達基因。在第21天時達到差異表達基因數(shù)目的一個高峰,且下調差異表達基因數(shù)目遠遠超過上調差異表達基因數(shù)目(圖2-A),這說明WYD4分蘗期的生長調控機制是動態(tài)變化的,且主要作用在后期。
為了展示不同時間下WYD4分蘗期DEGs表達模式的異同,進行層次聚類分析并繪制Venn圖和Volcano圖,層次聚類分析展示分蘗期WYD4的DEGs在不同的時間點的變化模式(圖2-B~2-D),韋恩圖分析顯示,有7 152基因在兩個時期差異表達,有1 414個基因在WYD4整個分蘗期都發(fā)生差異表達(圖2-H),從火山圖可以清晰地看出WYD4在不同時間點差異基因的表達倍數(shù)和顯著性變化情況(圖2-E~2-G)。這些結果展示分蘗期WYD4葉片差異基因的變化情況,為揭示水稻分蘗期的生長調控機制提供了轉錄組水平的參考。
為了分析分蘗期差異表達基因的功能,對WYD4分蘗期葉片進行GO注釋和GO富集分析。結合(Binding)和催化活性(Catalytic activity)是DEGs在分子功能(Molecular function)方面注釋最多的條目,細胞組分(Cellular component)是DEGs在細胞組分(Cell part)方面注釋最多的條目,代謝過程(Metabolic process)和細胞過程(Cellular process)是DEGs在生物過程(Biological process)方面注釋最多的條目(圖3)。通過對WYD4分蘗期葉片3個時間點的DEGs進行GO分析發(fā)現(xiàn),水稻分蘗中期(7~14 d)與前期(0~7 d)的DEGs主要富集在生物調節(jié)(Biological regulation)、胞質部分(Cytoplasmic part)和蛋白絲氨酸/蘇氨酸激酶活性(Protein serine/threonine kinase activity),水稻分蘗后期(14~21 d)與中期的DEGs主要富集在激酶活性(Kinase activity)、細胞組分(Cell part)和生物調節(jié)(Biological regulation),水稻分蘗后期與前期的DEGs主要富集在氧化還原酶(Oxidoreductase activity)、細胞組分(Cell part)和刺激反應(Response to stimulus)(圖4)。
這些結果表明細胞組分(Cellular component)是分蘗期 WYD4葉片中DEGs主要集中的部分,這可能是因為分蘗期屬于水稻營養(yǎng)生長最旺盛的階段,是株型構建的關鍵時期,參與該時期細胞形成的差異表達基因較多。
通過KEGG富集分析WYD4分蘗期葉片,發(fā)現(xiàn)不同時間點的DEGs主要集中在淀粉與蔗糖代謝(Starch and sucrose metabolism)、氨基糖與核苷酸糖代謝(Amino sugar and nucleotide sugar metabolism)、碳代謝(Carbon metabolism)和核糖體(Ribosome)等途徑(圖5)。其中淀粉與蔗糖代謝途徑在WYD4整個分蘗期都達到顯著富集水平,這說明淀粉與蔗糖代謝途徑在水稻的分蘗期尤為重要。
通過對淀粉與蔗糖的代謝途徑的差異表達基因在分蘗期WYD4水稻葉片中的表達情況進行分析發(fā)現(xiàn),有6個基因在3個時間點都差異表達,分別是PGI2(LOC_Os06g14510)、OsAGPS1(LOC_Os09g12660)、GBSS1(LOC_Os06g04200)、glgP(LOC_Os03g55090)、ISA2(LOC_Os05g32710)和ISA3(LOC_Os09g29404)(圖6)。
這些基因隨著時間推移,都呈先升高后降低的表達模式,表明這些關鍵基因在水稻的分蘗中期起到重要的調控作用。
為了詳細了解淀粉與蔗糖途徑在WYD4分蘗期轉錄表達,分析了WYD4分蘗期葉片差異表達超過2倍的轉錄因子。結果發(fā)現(xiàn),差異表達倍數(shù)超過2倍的轉錄因子共有24個,且全部為上調表達,分別來自ERF、NAC、HD-ZIP、FAR1、BES1、HB-other、C2H2、WRKY和MIKC等9個家族,其中ERF和NAC家族的轉錄因子在蔗糖與淀粉途徑中表達基因數(shù)目最多,都為6個。FAR1家族的SSⅠ(LOC_Os06g06560)差異表達倍數(shù)最大,在第14天時差異表達達到9.7倍(表2)。進一步分析差異表達超過2倍的轉錄因子在水稻分蘗期隨時間推移的變化情況,發(fā)現(xiàn)GN1_2_3(LOC_Os07g32600)、GN4(LOC_Os07g38930)、GN4(LOC_Os07g43940)、GN5_6(LOC_Os08g23720)、GN5_6(LOC_Os09g09980)、AMY2A(LOC_Os06g49970)、BGLU4(LOC_Os01g67220)、BGLU6(LOC_Os03g11420)、BGLU19(LOC_Os05g30250)、BGLU28(LOC_Os08g39870)、BGLU31(LOC_Os09g33680)BGLU1(LOC_Os01g32364)、malZ(LOC_Os06g46284)、SSⅠ(LOC_Os06g06560)、E3.2.1.2(LOC_Os03g04770)、RSUS1(LOC_Os03g28330)、BGLU16(LOC_Os04g43390)、GH9A3(LOC_Os03g52630)主要在水稻的分蘗前期起作用,E2.4.1.14(LOC_Os10g40324)、XK5(LOC_Os05g44760)、E2.4.1.14(LOC_Os06g42824)、E3.2.1.2(LOC_Os10g41550)主要在水稻分蘗中后期起作用,SSⅡC(LOC_Os10g30156)、scrK(LOC_Os01g66940)在水稻分蘗全期起作用。這說明在淀粉與蔗糖的代謝途徑中,大部分的轉錄因子都在水稻分蘗的前期起作用,這可能為水稻的栽培調控提供新思路。
鑒于轉錄因子分析結果,淀粉與蔗糖代謝途徑的轉錄因子多在分蘗前期起作用,因此對前期的轉錄因子進行互作蛋白的預測,發(fā)現(xiàn)ERF家族共有203個互作蛋白;NAC家族共有691個互作蛋白;FAR1家族共有103個互作蛋白;BES1家族共有36個互作蛋白;HB-other家族共有401個互作蛋白;C2H2共有98個互作蛋白;WRKY家族共有145個互作蛋白(表3),但是基于FAR1家族的SSⅠ(LOC_Os06g06560)在水稻分蘗前期差異表達倍數(shù)為9.7倍,所以對SSⅠ(LOC_Os06g06560)進行互作蛋白分析,結果發(fā)現(xiàn)64個蛋白與SSⅠ(LOC_Os06g06560)互作,這些蛋白大多數(shù)與淀粉與蔗糖代謝途徑相關,且都在前期差異表達,同時部分蛋白還在本試驗的整個分蘗期差異表達。這些結果說明SSⅠ(LOC_Os06g06560)在水稻分蘗期對淀粉與蔗糖代謝途徑起到極為重要的調控作用(表4)。
表3 轉錄因子的互作蛋白
表4 SSⅠ(LOC_Os06g06560)的互作蛋白
直鏈淀粉和支鏈淀粉含量構成水稻淀粉含量,淀粉含量明顯影響稻米RVA譜特征[23],GBSSⅠ是直鏈淀粉合成的關鍵基因,抑制GBSSⅠ的表達會導致直鏈淀粉含量的降低[24];ISA1能夠決定水稻籽粒中的淀粉結構[25-26];ISA3是控制淀粉顆粒降解的基因[27]。已有研究報道GBSSⅠ、ISA1和ISA3在灌漿期的表達呈先升高后降低的單峰曲線變化情況[19,28-32],本研究發(fā)現(xiàn),GBSSⅠ、ISA1和ISA3在分蘗期的水稻葉片也呈先升高后降低的單峰曲線變化趨勢;另外,本研究中PGI2(LOC_Os06g14510)、OsAGPS1(LOC_Os09g12660)和glgP(LOC_Os03g55090)在水稻葉片的整個分蘗期表達也達到顯著差異水平,并呈現(xiàn)單峰曲線變化趨勢,但這幾個基因在分蘗期淀粉蔗糖途徑中的分子功能還有待于進一步 完善。
在支鏈淀粉合成過程中,SSⅠ行使著重要的功能。SSⅠ是可溶性淀粉合酶(soluble starch synthase,SS)4個亞家族中唯一沒有同工型的酶[33],Yasunori等[34]發(fā)現(xiàn)SSⅠ和SSⅢ是水稻胚乳中主要的SS酶,且SSⅠ活性明顯高于SSⅢ活性,SSⅠ活性高達總SS活性的70%左右。SSⅠ位于水稻的6號染色體上,由15個外顯子和14個內含子構成[35]。吳洪愷等[36]用糯稻為背景構建近等基因系,發(fā)現(xiàn)SSⅠ對稻米的RVA譜有顯著影響。康翠芳等[37]通過裂區(qū)試驗發(fā)現(xiàn)SSⅠ基因和SSⅢ-1基因間存在互作效應,同時發(fā)現(xiàn)這兩個基因間的互作效應對GT產(chǎn)生極顯著影響,而對其他RVA譜特征值也產(chǎn)生顯著影響。楊博文等[38]通過回交重組自交系發(fā)現(xiàn)SSⅢ-1和SSⅠ、SSⅠ和PUL的基因互作效應在GT有極顯著的影響外,對于其他所有的RVA譜特征值都產(chǎn)生顯著影響,同時SSⅠ、SSⅢ-1和PUL間的3基因互作效應也對GT有極顯著影響。Nakamura等[39]在體外進行酶促反應時發(fā)現(xiàn)SS酶中的SSⅠ與BEs酶存在相互作用。Crofts等[40]進行淀粉合成相關酶分析時發(fā)現(xiàn)水稻胚乳中的蛋白復合物存在SSⅠ、SSⅡa、BEⅡb、ISA、PUL和Phol。Chen等[41]發(fā)現(xiàn)SSⅠ和PUL,SSⅠ和BEs間存在蛋白互作,且因水稻品種不同蛋白互作模式也不相同。陳雅玲等[1]通過STRING 網(wǎng)站預測SSs家族可能與BEs家族和DBEs家族存在互作關系,但沒有試驗進行證實。邱獻錕等[42]發(fā)現(xiàn)SS酶在水稻灌漿期活性表現(xiàn)的越早越高,越容易促進蔗糖與淀粉的轉化,從而使淀粉含量升高。本研究對分蘗期WYD4的葉片進行轉錄組分析,發(fā)現(xiàn)淀粉與蔗糖途徑在分蘗期就已經(jīng)呈現(xiàn)顯著的差異,而SSⅠ作為FAR1家族的轉錄因子在分蘗前期差異表達倍數(shù)極大,達到9.7倍。并預測與64個蛋白基因存在互作關系,其中包括BEs家族中的BEⅠ(LOC_Os06g51084)、ISA家族的ISA1(LOC_Os08g40930),這與前人結果相同,而SSⅢ-1(LOC_Os04g53310)、SSⅡa(LOC_Os06g12450)和BEⅡb(LOC_Os02g32660)并沒有在本研究的結果中出現(xiàn)。綜合本研究和前人的研究結果[1,37-44],繪出淀粉合成途徑關鍵酶互作網(wǎng)絡圖(圖7),這些結果對于解析參與淀粉合成的基因間的表達調控存在重要指導意義,對通過基因網(wǎng)絡調控改良稻米品質和定向水稻育種具有重要意義,并對用通過水稻精準栽培調控的方法提高水稻產(chǎn)量的同時改良稻米品質指明方向。
水稻分蘗期淀粉與蔗糖途徑的6個基因PGI2、OsAGPS1、GBSS1、glgP、ISA2、ISA3以及轉錄因子SSⅠ在分蘗期不同時間點的表達是有顯著差異的,這一點可以為水稻分蘗形成和群體構建提供時間上的能量來源,也為水稻栽培過程中精準調控提供轉錄組水平的參考依據(jù)。