趙長江,都夢翔,宋巨奇,徐尚緣, 賀 琳,徐晶宇,楊克軍,李佐同
(1.黑龍江八一農(nóng)墾大學(xué) 農(nóng)學(xué)院,黑龍江 大慶 163319;2.農(nóng)業(yè)農(nóng)村部東北平原農(nóng)業(yè)綠色低碳重點實驗室,黑龍江 大慶 163319; 3.黑龍江省秸稈資源化利用工程技術(shù)研究中心,黑龍江 大慶 163319;4.黑龍江省現(xiàn)代農(nóng)業(yè)栽培技術(shù) 與作物種質(zhì)改良重點實驗室,黑龍江 大慶 163319)
NRL(NPH3/RPT2-Like)是植物所特有一類的蛋白家族,一般包含3個典型結(jié)構(gòu)域:N端的BTB結(jié)構(gòu)域、C端的螺旋-螺旋結(jié)構(gòu)域和居中NPH3結(jié)構(gòu)域[1],所有成員都具有NPH3結(jié)構(gòu)域[2]。其中NPH3(NONPHOTOTROPIC HYPOCOTYL3)和 RPT2(ROOT PHOTOTROPISM2)于1999年首先被報道參與擬南芥(Arabidopsisthaliana)幼苗對藍光的向光性調(diào)節(jié)[3]。陸續(xù)有研究指出,NPH3在基于橫向生長素梯度產(chǎn)生的向光彎曲及葉片定位和伸展調(diào)控中發(fā)揮決定作用,RPT2作為向光反應(yīng)轉(zhuǎn)換器通過改變NPH3的定位和磷酸化狀態(tài)來調(diào)節(jié)向光反應(yīng)[4-5]。NRL家族成員可與向光素(Phototropin)藍光受體協(xié)調(diào)實現(xiàn)對植物向光性、葉綠體積累運動、葉片定位和伸展等生物學(xué)功能的調(diào)控[6-7]。根據(jù)NRL家族成員在向光素介導(dǎo)光調(diào)控生理活動的參與程度,可將其分為兩類:NRL依賴和NRL獨立的光信號途徑[6]。其中,向光性、葉綠體積累、葉柄定位和葉片伸展是NRL依賴的,而葉綠體回避運動和氣孔開放是NRL獨立的。上述研究表明,NRL家族蛋白作為向光素受體信號通路的重要組分,其作用功能應(yīng)該具有多樣性,或是具有明確分工。
通過對擬南芥NRL家族蛋白功能的研究發(fā)現(xiàn),該家族成員除參與的藍光生理調(diào)控外,還在植物生長發(fā)育調(diào)控、植物抗病性方面發(fā)揮重要作用[6]。其中,生長發(fā)育調(diào)控主要涉及花粉萌發(fā)、花粉管生長[8]、葉脈結(jié)構(gòu)圖案形成[9]以及根重力應(yīng)答[10]等。不同寄主植物中該家族成員免疫表現(xiàn)不同,例如AtNRL31與鈣信號通路轉(zhuǎn)錄因子AtSR1(SIGNAL RESPONSIVE1)互作導(dǎo)致其泛素化降解參與寄主防衛(wèi)反應(yīng)調(diào)控,其中nrl31突變體擬南芥對丁香假單胞菌(Pseudomonassyringae)敏感[11]。同時,馬鈴薯(Solanumtuberosum)StNRL1作為致病疫霉菌(Phytophthorainfestans)致病效應(yīng)子的靶標蛋白,該基因誘導(dǎo)沉默煙草降低了病菌定植及其引起的細胞死亡,增強了寄主的抗病性[12]。當然,NRL基因抗病表現(xiàn)的不同可能與植物或是植物-病原物特異系統(tǒng)不同有關(guān),或是與借助光反應(yīng)調(diào)節(jié)不同有關(guān),仍有待深入研究。
目前,NRL基因家族在擬南芥[6]、水稻(Oryzasativa)[13]和番茄(Lycopersiconesculentum)[14]等模式植物中被鑒定出來,但高光效作物玉米NRL基因家族的研究尚未見報道。玉米(Zeamays)作為世界上種植最多的谷物作物,其籽粒和秸稈都具有良好的經(jīng)濟價值[15]。對玉米NRL家族基因研究具有重要的理論和實踐意義。本研究采用生物信息學(xué)方法在玉米全基因組水平鑒定NRL家族成員并對其進化關(guān)系和組織表達進行分析,同時采用實時熒光定量PCR對其逆境表達進行分析,旨在為揭示玉米NRL基因功能提供理論依據(jù)。
選用玉米自交系B73為試驗材料,用10%次氯酸鈉對精選的種子消毒30 min,用蒸餾水清洗至無味,然后浸泡6~8 h,將種子放在22 ℃培養(yǎng)箱中暗培養(yǎng)24 h催芽,挑選萌發(fā)1.5 cm左右根的種子置于漂浮泡沫板孔洞中,使用1/2 Hoagland營養(yǎng)液培養(yǎng),并在人工氣候室(22 ℃,16 h光/8 h暗)中對培養(yǎng)至兩葉一心期的玉米幼苗進行處理。其中,200 mmol/L NaCl和20% PEG6000通過營養(yǎng)液添加實現(xiàn),35 ℃高溫通過光照培養(yǎng)箱調(diào)溫實現(xiàn),通過牙簽嵌入法實現(xiàn)立枯絲核菌AG1-IA(四川農(nóng)業(yè)大學(xué),鄭愛萍教授惠贈)接種處理。上述處理均于處理48 h取樣,液氮速凍后存放于-80 ℃冰箱。每個處理3次生物學(xué)重復(fù)。
從phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)中下載玉米fasta和gff3文件,使用TBtools[16]對fasta和gff3文件分別進行轉(zhuǎn)化,生成cds文件和pep文件。使用擬南芥和水稻的NRL家族基因[6,13]與玉米蛋白序列在TBtools上進行比對,用NCBI(https://blast.ncbi.nlm.nih.gov/Blast.cgi)、SMART[17](http://smart.embl-heidelberg.de/)以及Pfam[18-19]進行結(jié)構(gòu)域的確認,去除預(yù)測結(jié)構(gòu)域長度小于1/2個NPH3結(jié)構(gòu)域或 BTB 結(jié)構(gòu)域長度的基因。
利用在線工具ExPASy(https://web.expasy.org)分析蛋白質(zhì)的理化性質(zhì),利用WoLF PSORT(https://wolfpsort.hgc.jp/)進行亞細胞定位預(yù)測。分別從Tair(https://www.arabidopsis.org/)和RGAP(http://rice.plantbiology.msu.edu/)下載已知擬南芥和水稻的蛋白序列,從phytozome中下載高粱的蛋白序列,從茄科基因組庫(https://solgenomics.net/)中下載番茄的蛋白序列,用于構(gòu)建系統(tǒng)進化樹。使用MEGAX軟件[20]最大似然法(Maximum likelihood)建樹,選擇最適模型(JTT+G+I+F),Bootstrap 設(shè)置為1 000。
使用MEME(https://meme-suite.org/meme/tools/meme)分析蛋白保守Motif,供試參數(shù)分別為:最大Motif 數(shù)設(shè)置為10,位點分布選擇任何重復(fù)數(shù)分布,最佳Motif寬度設(shè)置為≥6 和≤50,并使用TBtools[16]繪制玉米基因結(jié)構(gòu)和保守基序圖。采用SWISS-MODEL(https://swissmodel.expasy.org/interactive)預(yù)測蛋白三級結(jié)構(gòu)。
利用TBtools[16]繪制基因在染色體上的分布圖,使用MCScanX軟件[21]對基因復(fù)制事件進行分析,使用Circle Gene View繪制出串聯(lián)重復(fù)基因圖,并利用Ka/Ks Calculator 功能計算基因的 Ka/Ks 值。使用TBtools軟件分析基因內(nèi)含子-外顯子結(jié)構(gòu),同時取編碼區(qū)上游2 000 bp的序列作為基因啟動子,并提交PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)鑒定順式作用元件,分析統(tǒng)計順式作用元件類型、數(shù)量和分布。
從GEO數(shù)據(jù)庫中下載GSE50191轉(zhuǎn)錄組表達譜數(shù)據(jù),選取23個組織部位的表達數(shù)據(jù),使用TBtools[16]的HeatMap功能進行熱圖繪制。使用OneStep WGCNA工具進行加權(quán)共表達網(wǎng)絡(luò)構(gòu)建,對樣本數(shù)據(jù)進行篩選,保留含有8個及以上樣本且FPKM值>1的基因數(shù)據(jù),計算合適的加權(quán)系數(shù)β值,構(gòu)建無尺度網(wǎng)絡(luò)與劃分相關(guān)模塊。使用Pannzer 2(http://ekhidna2.biocenter.helsinki.fi/sanspanz/)對玉米基因組進行GO注釋,使用TBtools對關(guān)鍵模塊進行GO富集分析,以玉米基因組為參考數(shù)據(jù)庫,并使用Enrichment Bar Plot對GO富集結(jié)果可視化。
稱取0.1 g玉米葉片,液氮研磨后用TRIzol試劑(Invitrogen)提取總RNA。使用1%瓊脂糖凝膠電泳進行驗證,同時使用NanoDrop one(Thermo ScientificTM)測定RNA濃度。使用反轉(zhuǎn)錄試劑盒 FSK-101(TOYOBO)對RNA進行反轉(zhuǎn)錄,使用Talent qPCR PreMix(SYBR Green)(天根)進行qRT-PCR反應(yīng)。使用β-Actin作為內(nèi)參基因,擴增基因引物序列信息見表1,基因引物由Invitrogen公司合成。使用CFX96熒光定量PCR儀(Bio-Rad)進行擴增,每個反應(yīng)重復(fù)3次,表達數(shù)據(jù)使用2-ΔΔCt方法[22]進行數(shù)據(jù)分析。
表1 qRT-PCR引物序列信息Tab.1 Primers for qRT-PCR
經(jīng)Pfam和Smart結(jié)構(gòu)域鑒定,在玉米全基因組水平上共鑒定31個ZmNRL基因(表2),不均勻地分布在9條染色體上,根據(jù)在染色體上的位置依次命名為ZmNRL1~ZmNRL31。其中,2號染色體分布最多,有7個基因。玉米NRL家族基因的CDS序列長度在1 395~2 250 bp,編碼的氨基酸序列長度在 464~749個,蛋白質(zhì)的相對分子質(zhì)量在48.64~80.02 ku,理論等電點在4.97~10.04。其中12個玉米NRL蛋白理論等電點小于7,為酸性蛋白。玉米NRL蛋白被預(yù)測具有葉綠體、細胞核和細胞質(zhì)等亞細胞定位。
表2 ZmNRL編碼蛋白序列理化性質(zhì)分析Tab.2 Physiochemical property of ZmNRLs gene and their coding protein
對包含玉米在內(nèi)的5個物種144個NRL基因進行系統(tǒng)進化分析(圖1),包括擬南芥33個、番茄27個、水稻27個和高粱26個基因。蛋白進化分析可將NRL家族成員劃分為4組(Ⅰ~Ⅳ),分別有23,29,30,62個成員。其中Ⅰ組4個(ZmNRL7、ZmNRL13、ZmNRL25、ZmNRL26)成員,Ⅱ組6個(ZmNRL4、ZmNRL6、 ZmNRL8、ZmNRL16、ZmNRL18、ZmNRL22)成員,Ⅲ組5個(ZmNRL1、ZmNRL11、ZmNRL28、ZmNRL30、ZmNRL31)成員,Ⅳ組16個(ZmNRL10、ZmNRL14、ZmNRL15、ZmNRL20、ZmNRL2、ZmNRL3、ZmNRL5、ZmNRL9、ZmNRL12、ZmNRL17、ZmNRL19、ZmNRL21、ZmNRL23、ZmNRL24、ZmNRL27、ZmNRL29)成員。在各個組中可以發(fā)現(xiàn)單子葉植物多聚合在同一個分支,而雙子葉植物常聚合在一起;而且4個亞組中都同時包含有單子葉植物和雙子葉植物,推斷在單子葉與雙子葉植物分離之前,就出現(xiàn)了NRL基因的共同祖先。
31個玉米NRL基因不均勻地分布在其9條染色體上(圖2)。玉米種內(nèi)有4對片段重復(fù)基因和1對串聯(lián)重復(fù)基因。4對重復(fù)基因分別為ZmNRL5—ZmNRL19、ZmNRL9—ZmNRL21、ZmNRL13—ZmNRL25和ZmNRL17—ZmNRL21,而且它們的Ka/Ks值均小于1,說明它們受到純化選擇;串聯(lián)基因為ZmNRL30—ZmNRL31。玉米與高粱、玉米與擬南芥之間分別存在36,5對共線性基因,而擬南芥與高粱之間也存在9對共線性基因。
Ⅰ~Ⅳ代表基因所屬亞族;玉米、高粱和水稻分別用圓形、菱形和正方形來表示;擬南芥和番茄分別用倒三角形和三角形表示。 Ⅰ—Ⅳ represents the gene subgroup;Zea mays,Sorghum bicolor,and Oryza sativa are represented by circles,diamonds, and squares;Arabidopsis thaliana and Lycopersicon esculentum are represented by inverted triangles and triangles.
玉米NRL家族基因結(jié)構(gòu)具有一定的保守性,屬于同一個進化分支的成員大多具有相似的基因結(jié)構(gòu)(圖3-A)。第Ⅰ和Ⅱ組多數(shù)成員(除ZmNRL10和ZmNRL20外)含有4個外顯子;第Ⅲ和Ⅳ組分別含有2~3和3~5個外顯子。除處在同一進化分支5個(ZmNRL7、ZmNRL13、ZmNRL14、ZmNRL15和ZmNRL25)成員有保守基序的缺失外,多數(shù)玉米NRL家族成員擁有10個保守基序(圖3-B)。其中,保守基序4、2、7、9和5組成BTB結(jié)構(gòu)域,而保守基序10、6、8、3、1則對應(yīng)的是NPH3結(jié)構(gòu)域,并對所有成員都具有的NPH3結(jié)構(gòu)域的5個保守基序進行展示(圖3-C)。而且,處于同一進化分支上的NRL蛋白三級結(jié)構(gòu)相似。
圖中Chr和chr以及數(shù)字1~5分別表示玉米、高粱和擬南芥的染色體;紅色線條為玉米物種內(nèi)的片段重復(fù)基因?qū)?;灰色線條為玉米和高粱的片段重復(fù)基因?qū)?;藍色線條為玉米和擬南芥物種間的片段重復(fù)基因?qū)Γ痪G色線條為擬南芥和高粱物種間的片段重復(fù)基因?qū)?;玉米物種內(nèi)的串聯(lián)重復(fù)基因用紅色菱形來標識。
玉米NRL基因(ZmNRL10除外)組織表達模式大致可以分為4類,分別為生育期高表達、中高表達、中低表達和低表達(圖4)。其中ZmNRL2、ZmNRL4、ZmNRL24和ZmNRL29在多數(shù)組織部位中高表達。而且多數(shù)基因在葉片生長、葉片氣孔以及葉片對稱等組織部位表達較高,說明玉米NRL基因可能參與葉片的生長發(fā)育等過程。進而,對生長發(fā)育組織部位相關(guān)10個樣本18 000個基因用于加權(quán)基因共表達網(wǎng)絡(luò)的構(gòu)建(圖5),共得到12個模塊,其中MEturquoise模塊基因數(shù)目最多,為9 118個,占總基因數(shù)的1/2以上。
通過質(zhì)量性狀與模塊關(guān)聯(lián)分析發(fā)現(xiàn)(圖6),18個玉米NRL基因可能參與共表達調(diào)控,其中MEbrown模塊中的NRL基因數(shù)目多達6個,分別為ZmNRL4、ZmNRL6、ZmNRL13、ZmNRL16、ZmNRL23和ZmNRL25,且該模塊與葉片生長性狀的相關(guān)性值為0.83。選擇含NRL基因數(shù)目最多且與葉片生長相關(guān)的關(guān)鍵模塊MEbrown模塊進行后續(xù)功能富集分析(圖7),圖中只顯示富集程度最多的前30個GO term。主要涉及質(zhì)體生物發(fā)生和組裝(GO:0009657)、葉綠體生物發(fā)生和組裝(GO:0009658)等生物過程,在葉綠體、質(zhì)體等細胞中發(fā)揮核糖體RNA結(jié)合(GO:0019843)分子功能參與對葉片生長發(fā)育的調(diào)控。
A中數(shù)字代表內(nèi)含子的數(shù)量,下方比例尺表示基因堿基數(shù);B下方比例尺表示蛋白長度,CDS為編碼區(qū),UTR為非編碼區(qū)。 The number in A represents intron number,and the lower scale represents gene bases the number;the lower scale of B represents the length of the protein,CDS is the coding region,and UTR is the non-coding region.
圖例表示標準化的FPKM值,紅色表示高表達水平,藍色表示低表達水平。 The legend shows the standardized FPKM value, the red shows the high expression level, and the blue shows the low expression level.
對玉米NRL基因啟動子區(qū)域的上游 2 000 bp的順式作用元件進行分析,結(jié)果顯示,基因啟動子主要存在22種已知功能的元件序列,涉及植物激素、脅迫、光響應(yīng)和生長發(fā)育相關(guān)的響應(yīng)元件(圖8-A)。其中茉莉酸甲酯響應(yīng)元件(CGTCA-motif)、脫落酸響應(yīng)元件(ABRE)、光響應(yīng)元件(G-box、Sp1)、抗氧化反應(yīng)元件(ARE)的數(shù)量較多,分別為142,115,112,60,54個。ZmNRL25啟動子元件數(shù)量最多,有41個,ZmNRL7的元件數(shù)量最少,僅有12個。結(jié)果表明,該家族基因除參與光調(diào)控外,可能受茉莉酸和脫落酸等激素調(diào)控,甚至與抗氧化等逆境調(diào)控密切相關(guān)。啟動子順式作用元件分析,推測家族基因可能與脫落酸介導(dǎo)的高溫、鹽和干旱等非生物脅迫以及茉莉酸介導(dǎo)的立枯絲核菌接種的生物脅迫密切相關(guān)。
權(quán)衡系統(tǒng)進化、組織表達和作用元件情況,選定同為第Ⅳ組組織中低表達的ZmNRL5和ZmNRL12,以及與ZmNRL5重復(fù)的組織中高表達ZmNRL19和第Ⅰ組中ZmNRL7(元件數(shù)量最少和組織中高表達)
圖5 WGCNA聚類樹狀圖Fig.5 WGCNA clustering dendrogram
圖6 WGCNA模塊-特征關(guān)系圖Fig.6 WGCNA module-feature relationship diagram
圖7 MEbrown模塊GO富集分析Fig.7 GO enrichment analysis of the MEbrown module
等4個代表基因進行逆境表達分析(圖8-B)。供試4個基因中,高溫處理下ZmNRL5、ZmNRL12和ZmNRL19上調(diào)表達, 同時ZmNRL12在鹽脅迫下也表現(xiàn)出上調(diào)趨勢。其余供試基因在鹽、干旱和立枯絲核菌接種均表現(xiàn)為下調(diào)。其中,干旱脅迫下供試基因全部下調(diào)表達,鹽脅迫下ZmNRL5、ZmNRL7和ZmNRL19下調(diào)表達,立枯絲核菌接種的生物脅迫下ZmNRL5、ZmNRL12和ZmNRL19下調(diào)近5倍,可能與病原物對葉片光合或葉綠體影響比較大有關(guān)。
A為順式作用元件分布圖;B為4種脅迫(高溫、NaCl、PEG干旱、AG1-IA立枯絲核菌)下基因表達譜。 圖中小寫字母表示基因在0.05水平差異顯著。 A is the distribution map of cis-acting elements;B is the gene expression profile under 4 stresses(high temperature, NaCl,PEG drought, Rhizoctonia solani AG1-IA).Lowercase letters present the significant difference at 0.05 level.
本研究通過生物信息學(xué)手段結(jié)合實時熒光定量PCR技術(shù),在玉米基因組水平鑒定出31個NRL基因,研究表明,該家族基因不僅具有明顯的組織表達特異性,而且可參與生物和非生物逆境應(yīng)答。本研究中,玉米NRL家族基因數(shù)介于擬南芥(33個)[6]和水稻(27個)[13]之間,三者數(shù)量較為接近,表明玉米NRL家族基因相比于前二者沒有發(fā)生較大的擴增。而且,種間基因共線性分析發(fā)現(xiàn),玉米與高粱和擬南芥之間分別存在36,5對共線性關(guān)系基因,說明同為C4作物的玉米與高粱之間的關(guān)系比擬南芥更近。基因復(fù)制是進化的驅(qū)動力之一,染色體片段復(fù)制和串聯(lián)復(fù)制事件可以擴大基因組中基因家族成員的數(shù)量,這些復(fù)制促進了新基因的形成和功能分化[23-24]。在共線性分析中,玉米種內(nèi)NRL家族基因存在4對片段重復(fù)基因,復(fù)制基因?qū)χg受到純化選擇,表明復(fù)制是早期發(fā)生的事件。其中,ZmNRL5和ZmNRL19這對片段重復(fù)基因在蛋白進化中二者為同一分支,它們的基因結(jié)構(gòu)和蛋白保守結(jié)構(gòu)基本相同,但是它們的生育期組織表達模式不盡相同,可能與復(fù)制時的片段位置有關(guān),因為它們的啟動子區(qū)順式作用元件也不同,或是與亞細胞定位不同有關(guān);同時這對基因在供試的逆境表達分析中,其表達模式基本一致,啟動子區(qū)順式作用元件無法解釋這種情況。推測該類基因在生長發(fā)育調(diào)控中進化基本成熟,逆境應(yīng)答仍處在早期未分化階段;或是基因啟動子順式作用元件對基因表達模式?jīng)Q定分析超出筆者的分析范疇,當然不能排除一對基因樣本量小代表性不好的原因。
盡管玉米NRL家族基因生育期表達模式類型不同,但是多數(shù)基因在葉片生長、葉片氣孔以及葉片對稱等組織部位表達較高,說明玉米NRL家族基因可能參與葉片的生長發(fā)育等過程。例如ZmNRL2、ZmNRL4、ZmNRL24和ZmNRL29為多數(shù)組織部位中高表達的一類,可能與它們(ZmNRL2、ZmNRL24和ZmNRL29)處于同一個進化分支有關(guān)。這4個基因預(yù)測為細胞質(zhì)或細胞核定位,而不是葉綠體定位。同時,基于生育期組織共表達數(shù)據(jù)及性狀模塊功能基因富集分析發(fā)現(xiàn),玉米NRL家族基因參與的葉片生長發(fā)育調(diào)控主要涉及質(zhì)體和葉綠體生物發(fā)生和組裝等生物學(xué)過程。推測可能與調(diào)控葉綠體積累、葉柄定位和葉片伸展功能的NRL依賴光信號途徑密切相關(guān)[6]。
通過對玉米NRL家族基因啟動子順式作用元件進行分析發(fā)現(xiàn),光響應(yīng)元件、茉莉酸和脫落酸反應(yīng)元件數(shù)量較多,推測該家族基因除參與光調(diào)控外,可能受茉莉酸和脫落酸等激素調(diào)控,或是參與兩類激素相關(guān)的生物和非生物逆境調(diào)控。啟動子區(qū)域的順式作用元件的類型、數(shù)量及分布基因表達產(chǎn)生不同的調(diào)節(jié)作用[25]。進而通過qRT-PCR分析ZmNRL5、ZmNRL7、ZmNRL12和ZmNRL19等4個基因在不同逆境下的表達,發(fā)現(xiàn)高溫處理下僅有1個基因下調(diào)表達,除ZmNRL12外,鹽、干旱和立枯絲核菌接種每個處理均引起供試3個基因的下調(diào)表達,可能與這3種逆境對葉片光合作用或葉綠體影響比較大有關(guān)。本研究發(fā)現(xiàn)的玉米NRL基因參與對死體營養(yǎng)型病原物的防衛(wèi)反應(yīng),與擬南芥[11]和馬鈴薯[12]中的研究結(jié)果一致,表明NRL基因不僅可參與對不同病原物的廣譜抗性反應(yīng),而且參與對不同逆境的廣譜抗/耐性調(diào)節(jié)。