薛 頌,尚 帥,2,臧 宇,陳 軍,王鴻睿,唐學璽??
(1.中國海洋大學海洋生命學院,山東 青島 266003; 2.濱州學院黃河三角洲生態(tài)環(huán)境研究中心,山東 濱州 256600;3.自然資源部第一海洋研究所,山東 青島 266061)
植物在長期進化過程中,形成了多種調控機制和復雜的信號網絡,能夠通過調控基因的表達來調節(jié)自身生長發(fā)育,并適應、抵抗和耐受各種生物和非生物脅迫[1]。轉錄因子(Transcription factor)通過在基因的啟動子區(qū)域與順式作用元件發(fā)生特異性相互作用,激活或抑制特定靶基因的轉錄速率,從而參與植物對環(huán)境脅迫的響應[2]。WRKY轉錄因子是高等植物中最重要的轉錄因子之一[3],其特征是N端具有高度保守的WRKYGQK氨基酸序列,可與(T)(T)TGAC(C/T)序列(通常稱為W-box)特異性結合,精確調控功能基因的表達。第一個WRKY轉錄因子(SPF1)由Ishiguro和Nakamura[4]從甘薯中鑒定出來。近年來,WRKY基因家族成員也在番茄(Solanumlycopersicum)[5]、棗(Ziziphusjujuba)[6]、鷹嘴豆(Cicerarietinum)[7]和黃瓜(Cucumissativus)[8]等植物中被鑒定出來。WRKY轉錄因子通過激活或抑制相關基因的表達,或者通過與其他蛋白相互作用,廣泛參與調節(jié)植物種子萌發(fā)[9]、葉片衰老[10]、花藥和胚胎發(fā)育[11]以及對生物和非生物脅迫的響應[9-11]等多種生理生化過程,增強植物對環(huán)境的適應性。目前,植物WRKY基因家族的研究主要集中在陸生作物中[12-14],在海洋高等植物中研究較少。
鰻草(ZosteramarinaL.)作為一種多年生海洋高等被子植物,是淺海生態(tài)系統(tǒng)重要的初級生產者[15]。此外,鰻草在穩(wěn)定沉積物、凈化水體方面也具有重要的生態(tài)功能[16-17]。目前的研究表明鰻草是由陸生植物再次進入海洋進化而來,能夠在陸海過渡地帶的潮間帶地區(qū)生存和繁殖,其獨特的進化歷程使其演化出與陸生高等植物和藻類所不同的海洋環(huán)境適應機制。
為了解WRKY轉錄因子在鰻草適應海洋環(huán)境過程中的轉錄調控作用,本研究利用生物信息學手段,深入研究了WRKY基因家族信息及其分子進化特征,包括鰻草WRKY基因家族的鑒定及特征分析、基因結構和蛋白保守序列分析、系統(tǒng)發(fā)育分析、啟動子區(qū)順式作用元件分析以及在不同器官中的表達分析。本研究將為研究WRKY基因家族的功能提供基礎,對于揭示高等被子植物適應海洋環(huán)境的內在機制具有重要意義。
從phytozome v12.1數據庫(https://phytozome.jgi.doe.gov)和NCBI網頁(https://www.ncbi.nlm.nih.gov)下載所需的鰻草基因組序列、cDNA序列以及蛋白質序列文件。以擬南芥(Arabidosisthaliana)WRKY基因家族的氨基酸作為種子序列,搜索鰻草基因組和蛋白質組數據庫,篩選獲取e值小于-20的序列作為ZmWRKY候選基因。為更好確定獲取基因的準確性,本研究結合Pfam蛋白結構域數據中WRKY基因家族的DNA結構域,利用HMMER軟件構建隱馬爾可夫模型,并以此作為種子序列檢索鰻草蛋白質序列,獲取ZmWRKYs的候選基因。綜合兩種篩選方式獲取候選基因,利用SMART軟件對該候選基因進行保守結構域的鑒定,最后篩選出ZmWRKY基因。此外,利用ExPASy生物信息學資源門戶網站(https://web.expasy.org/protparam/)對ZmWRKY蛋白進行理化性質的分析[18-19]。
使用基因結構顯示系統(tǒng)GSDS(http://gsds.cbi.pku.edu.cn/)構建ZmWRKYs基因的結構示意圖。使用MEME(http://meme-suite.org/doc/download.html)對選定的ZmWRKY蛋白進行保守序列分析,基序搜索數目為5,其他參數默認設置。
為了進一步分析鰻草WRKY基因家族的進化關系,以擬南芥WRKY基因(AtWRKY)保守結構域的氨基酸序列作為參考序列[3],使用MEGA 7.0軟件,利用鄰接法構建鰻草和擬南芥WRKY基因家族的系統(tǒng)發(fā)育樹。擬南芥WRKY蛋白來自TAIR數據庫(http://www.arabidopsis.org/)。自檢值設置為1 000,并使用iTOL在線軟件(http://itol2.embl.de)分析。
從鰻草基因組數據庫中獲得ZmWRKYs基因轉錄起始區(qū)上游2 000 bp的啟動子序列。利用PlantCARE在線數據(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)和MEME對鰻草WRKY基因啟動子區(qū)的順式作用元件進行分析。
為研究鰻草WRKY基因家族的表達模式,對ZmWRKYs在4個不同器官中的表達情況進行分析。WRKY基因家族在鰻草不同器官中的表達數據來源于NCBI數據庫(http://www.ncbi.nlm.nih.gov/sra)。利用TBtool程序分析ZmWRKY基因的表達數據并繪制基因表達熱圖。
在鰻草基因組序列中共鑒定出44個ZmWRKY基因。根據結構域數量和特定鋅指結構的特征,ZmWRKYs被分為Ⅰ組、Ⅱ組和Ⅲ組(見表1)。其中:Ⅰ組成員包含兩個帶有C2H2鋅指結構的WRKY結構域(除ZmWRKY41外);Ⅱ組成員包含一個帶有C2H2鋅指結構的WRKY結構域;Ⅲ組包含一個特定C2HC鋅指結構的WRKY結構域。Ⅱ組為最大的類群,共有30個成員,根據保守基序的差異及進化關系,Ⅱ組可進一步劃分為5個亞組(Ⅱa、Ⅱb、Ⅱc、Ⅱd和Ⅱe)。所有ZmWRKY蛋白均含有完整的WRKY結構域。亞細胞定位結果顯示,所有的WRKY蛋白均位于細胞核。在43種ZmWRKY蛋白中發(fā)現了高度保守的WRKYGQK結構域,而ZmWRKY5存在WRKYGKK結構域序列變異。
表1 鰻草WRKY基因家族成員及其理化性質
鰻草WRKY轉錄因子的理化特性分析表明,ZmWRKY轉錄因子的大小差異較大,其中,ZmWRKY43編碼的蛋白最短,僅有126個氨基酸,其分子量也最小(14.98 kDa);ZmWRKY37編碼的蛋白最長,有703個氨基酸,其分子量也最大(39.55 kDa)。ZmWRKYs等電點在5.10(ZmWRKY11)~10.07(ZmWRKY21)之間,平均pI值為7.53,表明該家族蛋白趨向于弱堿性。
基因結構分析表明,所有ZmWRKYs基因均含有內含子,并且內含子數量表現出多樣性,1~7個不等(見圖1)。在所有的ZmWRKYs基因中,ZmWRKY11包含7個內含子,內含子數量最多。同一ZmWRKYs亞組成員具有相似的基因結構。例如,Ⅰ組成員均包含3個內含子(ZmWRKY35和ZmWRKY36),Ⅱa、Ⅱd和Ⅲ組的成員均包含2個內含子(ZmWRKY17除外),具有4個內含子的ZmWRKYs基因成員僅在Ⅱb組中發(fā)現。
圖1 鰻草WRKY基因結構示意圖
鰻草WRKY蛋白保守基序分析結果表明,Motif 1、Motif 2和Motif 7在所有44個ZmWRKYs蛋白中表現為絕對保守(見圖2)。同一亞組的WRKY蛋白的保守基序較為相似,體現出WRKY基因家族進化的保守性。Motif 6和Motif 10只存在于Ⅰ組中,Motif 3在Ⅱa組中高度保守(ZmWRKY43除外),Motif 5在Ⅱc組中高度保守(ZmWRKY4除外)。Motif 4分布于Ⅰ組、Ⅱb組和Ⅱc組,Motif 9只分布于Ⅱd組和Ⅲ組。同一組的WRKY蛋白具有相似的基序組成,表明同一組的成員可能具有相似的功能。
圖2 鰻草WRKY蛋白保守基序分析
系統(tǒng)發(fā)育分析結果顯示,ZmWRKYs被劃分為7個亞組,這與鰻草WRKY基因分類結果一致(見圖3)。在各亞組內部,大部分ZmWRKY基因與AtWRKYs聚到一起。ZmWRKY3不能聚成任何類群。值得注意的是,ZmWRKY41只包含一個WRKY結構域,但在進化樹中與Ⅰ組成員更接近。
(Zm:鰻草;At:擬南芥。Zm: Z. marina; At: A. thaliana.)
ZmWRKYs的啟動子順式作用元件分析結果表明,所有的ZmWRKYs基因的啟動子區(qū)都含有多種與植物防御反應相關的順式作用元件(見表2)。ZmWRKYs均含有與非生物脅迫響應相關的MYB和MYC。大部分ZmWRKYs基因啟動子中都含有W-box,為WRKY結構域特異性結合的部位。參與激素調節(jié)的相關的調控元件,如ABRE、CGTCA-Motif、ERE、G-box、GARE-Motif、TCA-element、TGA-element和TGACG Motif,廣泛存在于ZmWRKYs中。此外,與低溫、干旱、鹽脅迫等非生物脅迫有關的LTR和MBS元件存在于多種ZmWRKYs中。
表2 鰻草WRKY基因啟動子順式作用元件核心序列與功能
鰻草WRKY基因在不同器官中的表達分析表明,鰻草WRKY基因在所有器官中均有表達(見圖4)。ZmWRKYs在根和營養(yǎng)枝中的表達量較高,在雌花和雄花中的表達量較低,其中ZmWRKY20僅在根中表達。此外,同一基因在不同器官中存在表達差異。相比于其他器官,ZmWRKY24在雄花中表達量較高,ZmWRKY4在雌花中表達量較高,ZmWRKY15和ZmWRKY36在根中具有較高表達量,ZmWRKY31和ZmWRKY39在營養(yǎng)枝中表達量相對較高。Ⅱd和Ⅲ組成員在營養(yǎng)枝中具有較高的表達量,而在其他器官中表達量較低。鰻草雌花發(fā)育前期和后期的表達結果表明,部分ZmWRKYs(如ZmWRKY22和ZmWRKY42等)在雌花發(fā)育前后的表達量存在差異,均表現為雌花發(fā)育前期表達量較低,雌花發(fā)育后期表達量較高。
圖4 鰻草WRKY基因在不同器官中的表達分析
WRKY轉錄因子作為關鍵調控因子參與調節(jié)植物的生長發(fā)育[20-22],在植物抵抗生物和非生物脅迫中具有重要作用[23-25]。WRKY基因家族的功能目前在多種高等植物中得到了廣泛的研究,但在海洋植物中,尤其是在對近岸海洋生態(tài)具有重要作用的海草中研究較少。
基因復制不僅可以增加基因的數量,還是產生新基因的途徑,在基因家族的擴展和進化中起著重要的作用[26]。為更好的探究陸地和海洋植物WRKY基因的數目規(guī)律,本研究匯總WRKY基因家族在22個物種中的數目特征(見表3)。結果表明,WRKY基因數目在不同物種中具有差異性。與陸生高等植物相比,WRKY基因在藻類、苔蘚和蕨類等低等植物中數目較少,說明WRKY基因數目與植物的進化程度有關[27]。鰻草WRKY基因家族有44個成員,少于大部分高等植物,多于藻類、苔蘚和蕨類等低等植物。已有研究表明,Ⅰ組WRKY基因起源最早,Ⅱ、Ⅲ組WRKY基因是隨著物種進化及基因復制擴大而來,從而幫助植物增強對環(huán)境的適應性[18]。植物中WRKY基因家族成員的數量隨著物種的進化而增加,這可能與基因組復制有關[26]。Ⅲ組作為一個最具活力的且具有許多重復事件的動態(tài)類群,其WRKY基因數目的差異是WRKY基因家族大小的主要原因[22]。鰻草Ⅲ組WRKY基因數量為5個,低于大多數單子葉植物和雙子葉植物[28-30]。除此之外,植物在進化過程中的選擇性壓力可能影響WRKY基因家族的數目。鰻草在進化過程中至少經歷了3次平行進化事件,適應陸地生活后又返回海洋環(huán)境中。因此本文作者推測,鰻草WRKY基因家族數量相比于其他陸生植物較低的原因是其在進化過程中二次進入海洋,導致部分WRKY基因丟失。研究表明,與陸生植物相比,漂浮水生植物少根紫萍(Landoltiapunctata)很少受到干旱脅迫、鹽脅迫和寒冷脅迫,因此少根紫萍會失去與這些應激相關的WRKY基因,并保留應對水生環(huán)境脅迫相關的基因,如抗病基因[31]。
表3 不同物種WRKY基因家族的數量特征
WRKY結構域的缺失通常發(fā)生在單子葉植物中[49],鰻草中ZmWRKY41也表現出一個N端WRKY域的丟失。WRKY結構域的WRKYGQK氨基酸序列高度保守,幾乎所有的ZmWRKY基因都具有WRKYGQK的特征序列。然而,ZmWRKY5存在WRKY域序列變異(WRKYGKK),這種輕微的變異也在水稻(O.sativa)和棗(Z.jujuba)中發(fā)現[6,50]。研究表明,WRKYGKK結構域可以特異性結合WK-box,這與WRKYGQK特異性結合的W-box有顯著差異[51],因此WRKY保守序列的變異可能會影響WRKY基因與下游靶基因的正常相互作用和結合特異性[52]。
基因結構多樣性是基因家族進化和多樣化的重要組成部分。在木薯(M.esculenta)[37]和小麥(Triticumaestivum)[53]中,WRKY基因內含子的數量分別為0~5和1~5。在本研究中,鰻草WRKY基因內含子數量從1~7個不等,基因結構顯示出較高的多樣性,表明鰻草基因組在長期進化過程中經歷了很大的選擇變異,這可能與鰻草從陸地回歸到海洋的進化過程有關。
植物體內具有復雜的防御信號通路來調節(jié)植物對外部環(huán)境脅迫的適應性[54]。環(huán)境脅迫條件下,WRKY轉錄因子可以通過與下游基因中相應的順式作用元件特異性結合,調控目的基因在特定時空的表達,參與多種代謝途徑和脅迫響應過程,從而增強植物對環(huán)境的適應性[55]。本研究中ZmWRKYs中均存在一系列與生長發(fā)育、生物脅迫、非生物脅迫和激素調節(jié)相關的順式元件,表明WRKY基因家族成員可能參與調節(jié)鰻草生長發(fā)育和激素誘導,并參與應答生物脅迫和非生物脅迫。所有ZmWRKYs均包含與干旱響應相關的MYB和MYC元件,這可能與鰻草周期性失水復水有關,因此WRKY基因家族在鰻草適應潮間帶生活中可能發(fā)揮重要作用。WRKY蛋白作為轉錄調控蛋白,可以特異性結合W-box調控防御相關基因的表達。近60%的ZmWRKY基因的啟動子區(qū)含有W-box元件,表明這些WRKY轉錄因子可能具有自我調節(jié)或交叉調節(jié)機制。
系統(tǒng)發(fā)育樹中同源性較高的基因通常具有相似的功能[56]。ZmWRKYs與AtWRKYs存在同源關系,且AtWRKYs的功能已被廣泛研究,因此利用比較系統(tǒng)發(fā)育樹可以推測ZmWRKYs的基因功能[57]。ZmWRKY3與擬南芥中發(fā)現的AtWRKY38、AtWRKY52相似[3],不能聚成任何類群。Ⅰ組WRKY基因被認為是植物中其他WRKY基因的祖先,更有可能在不同器官中存在特異性表達特征[58]。本研究Ⅰ組ZmWRKYs具有明顯的器官表達差異性,在根和營養(yǎng)枝中的表達量較高,在雌花和雄花中的表達量較低。ZmWRKY36與AtWRKY20親緣關系較近,且在根和營養(yǎng)枝中的表達量高于其他器官。AtWRKY20可以影響ADP-葡萄糖焦磷酸化酶(AGPase)的活性,該酶催化淀粉生物合成過程的第一個限速步驟,并參與擬南芥(A.thaliana)葉片淀粉合成過程[59],因此推測ZmWRKY36可能與鰻草葉片淀粉合成有關。鰻草作為潮間帶被子植物,隨著潮汐的變化,其營養(yǎng)枝周期性暴露于空氣中并伴隨著階段性失水和復水,其根部深入泥沙中吸收水分維持生物體對水分的需求。研究表明,AtWRKY20能夠增強擬南芥(A.thaliana)對水淹、失水和鹽脅迫的耐受性[60]。本文作者推測ZmWRKY36在低潮過程中能夠增強鰻草對失水和鹽度變化的耐受性,有助于鰻草在漫長的進化過程中適應潮間帶生活。
在Ⅱa組中,AtWRKY18作為信號途徑調控基因能正向調節(jié)抗病相關基因表達,幫助植物抵抗病原體丁香假單胞菌的侵染[61]。與AtWRKY18同源的ZmWRKY43和ZmWRKY44在根中表達量相對較高,表明鰻草的根部相對于其他器官可能易受病原體侵染,ZmWRKY43和ZmWRKY44可能在鰻草抵抗病原體侵染中發(fā)揮重要作用。前人研究表明Ⅱd組中AtWRKY11參與植物維管束發(fā)育過程[62]。鰻草WRKY基因家族中Ⅱd組成員在營養(yǎng)枝中的表達量普遍較高,表明Ⅱ組成員可能參與調控鰻草維管束的發(fā)育。除此之外,大多數參與開花調控的WRKY基因屬于Ⅱ組[60,63-68]。鰻草雄花中ZmWRKY24的表達量較高,雌花中ZmWRKY4的表達量較高,ZmWRKY7和ZmWRKY22在雌花開花后期的表達水平顯著高于前期,這些結果均表明鰻草Ⅱ組WRKY基因可能參與調節(jié)植物中花的發(fā)育過程。
Ⅲ組成員是WRKY基因家族中最活躍的類群,在植物抵抗非生物和生物脅迫、增強免疫防御方面發(fā)揮重要作用[69]。例如,擬南芥(A.thaliana)中Ⅲ組大多數成員對病原菌感染都有響應[58]。研究發(fā)現,在生物和非生物脅迫下,WRKY轉錄因子可以與絲裂原活化蛋白激酶(MAPK)相互作用,激活級聯(lián)反應,顯著影響植物免疫功能[70]。在本研究中Ⅲ組成員的啟動子區(qū)域具有MYB、MYC、TGACG-Motif、G-box、CGTCA-Motif等與光照、干旱、低溫及生物脅迫相關的作用元件,且Ⅲ組成員在根中的表達量高于其他器官的表達量,推測鰻草WRKY基因在根部參與調節(jié)植物對應答生物脅迫和非生物脅迫的響應。
本研究利用生物信息學方法,結合已發(fā)表的鰻草基因組信息,對鰻草WRKY基因家族進行鑒定與分析。研究表明,鰻草WRKY基因家族共有44個成員,包含Ⅰ組、Ⅱ組和Ⅲ組3個類群。鰻草WRKY基因家族數目明顯少于其他陸生高等植物,可能是由于二次入海導致鰻草WRKY基因數目丟失。鰻草基因結構的多樣性,表明鰻草基因組在長期進化過程中經歷了很大的選擇變異,這可能也與鰻草從陸地回歸到海洋的進化過程有關。ZmWRKYs的啟動子存在MYB、MYC、ABRE、CGTCA-Motif、TGACG Motif、LTR、MBS等順式作用元件,表明WRKY基因家族成員可能參與調節(jié)鰻草生長發(fā)育和激素誘導,并參與應答生物脅迫和非生物脅迫。轉錄表達分析表明,鰻草WRKY基因存在基因表達差異和器官表達差異,ZmWRKYs在根和營養(yǎng)枝中的表達量較高,在雌花和雄花中的表達量較低。