周恩強(qiáng), 周 瑤, 姚夢(mèng)楠, 王學(xué)軍, 趙 娜, 繆亞梅, 王永強(qiáng), 薛 冬, 李 波,汪凱華, 顧春燕, 魏利斌
(江蘇沿江地區(qū)農(nóng)業(yè)科學(xué)研究所,江蘇 南通 226012)
非生物脅迫,包括鹽脅迫、干旱脅迫和低溫脅迫等,限制了作物的生產(chǎn)力,并影響了植物中許多基因的表達(dá)[1],其中鹽脅迫是制約全球農(nóng)業(yè)發(fā)展和作物生產(chǎn)的最重要因素之一[2]。鹽脅迫使植物遭受離子毒性、滲透脅迫和氧化脅迫,從而破壞各種細(xì)胞和生理過(guò)程。為了適應(yīng)或抵抗鹽脅迫,植物進(jìn)化出幾種策略,包括滲透調(diào)節(jié)(如滲透保護(hù)劑積累)、離子平衡 (Na+/K+平衡)和抗氧化(抗氧化酶的積累和活性的增強(qiáng))[3]。植物對(duì)鹽脅迫的適應(yīng)性也可以通過(guò)復(fù)雜的信號(hào)通路改變?cè)S多基因的表達(dá)來(lái)實(shí)現(xiàn),研究發(fā)現(xiàn)bZIP、WRKY、MYB等家族的轉(zhuǎn)錄因子通過(guò)結(jié)合特定的順式作用元件形成一個(gè)復(fù)雜的調(diào)控網(wǎng)絡(luò),對(duì)植物的鹽脅迫反應(yīng)至關(guān)重要[4-6],這些轉(zhuǎn)錄因子過(guò)表達(dá)通常會(huì)增加植物對(duì)鹽脅迫的適應(yīng)性。
WRKY轉(zhuǎn)錄因子是植物中最大的轉(zhuǎn)錄因子家族之一,通過(guò)與保守的 DNA 結(jié)合位點(diǎn)W-box結(jié)合來(lái)調(diào)控基因的轉(zhuǎn)錄,在植物的生長(zhǎng)發(fā)育、生物與非生物脅迫響應(yīng)中發(fā)揮著多種作用[7]。所有的WRKY蛋白由1個(gè)或2個(gè)約60個(gè)氨基酸的WRKY保守結(jié)構(gòu)域組成,其 N 端具有高度保守的WRKYGQK七肽序列,C 端具有 C2H2基序或 C2HC基序的鋅指結(jié)構(gòu)[8]。根據(jù)WRKY結(jié)構(gòu)域的數(shù)量和類(lèi)鋅指基序的特征可將WRKY基因家族分為3組(I、II和III),第I組具有2個(gè)WRKY結(jié)構(gòu)域,第II組具有1個(gè)WRKY結(jié)構(gòu)域和C2H2基序,第III組具有1個(gè)WRKY結(jié)構(gòu)域和C2HC基序[9]。目前WRKY基因家族已在多種植物中被鑒定出,其中擬南芥鑒定出72個(gè)WRKY基因[8],水稻中包含102個(gè)WRKY基因[10],大豆基因組中鑒定出197個(gè)WRKY基因[11],油茶中鑒定出89個(gè)WRKY基因[12],綠豆中鑒定出79個(gè)WRKY基因[13]。同時(shí)研究結(jié)果表明,WRKY轉(zhuǎn)錄因子基因在多種植物的鹽脅迫響應(yīng)中發(fā)揮著重要作用,例如,在擬南芥中過(guò)表達(dá)陸地棉GhWRKY34增強(qiáng)了擬南芥轉(zhuǎn)基因植株的耐鹽性[14];在煙草中過(guò)表達(dá)NbWRKY79增強(qiáng)了植株鹽脅迫耐受性;在玉米中抑制ZmbZIP111的表達(dá)提高了玉米幼苗對(duì)鹽脅迫的敏感性[15]。
WRKY轉(zhuǎn)錄因子基因參與植物生長(zhǎng)發(fā)育的多個(gè)方面,在鹽脅迫的多種不同響應(yīng)途徑中發(fā)揮重要作用,在模式植物擬南芥中,已發(fā)現(xiàn)多個(gè)受鹽脅迫調(diào)控的WRKY基因。Babitha等[16]研究發(fā)現(xiàn)共表達(dá)AtbHLH17和AtWRKY28能夠增強(qiáng)擬南芥對(duì)氯化鈉、甘露醇脅迫和氧化脅迫的耐受性。在鹽脅迫和脫落酸(ABA)處理下,相比于野生型,Atwrky66突變體表現(xiàn)出對(duì)ABA和鹽脅迫更高的敏感性[17]。Atwrky25突變體與Atwrky33突變體的鹽脅迫敏感性與野生型沒(méi)有太大差異,但過(guò)表達(dá)AtWRKY25或AtWRKY33增加了擬南芥對(duì)氯化鈉脅迫的耐受性[18]。研究發(fā)現(xiàn)JMJ15通過(guò)調(diào)控AtWRKY46和AtWRKY70的表達(dá)水平來(lái)增強(qiáng)其耐鹽性,并證明AtWRKY46和AtWRKY70在鹽脅迫中起負(fù)調(diào)控作用[19]。在鹽脅迫下,AtWRKY1的表達(dá)被誘導(dǎo),且AtWRKY1功能缺失導(dǎo)致了突變體擬南芥的鹽敏感性增加[20]。Li等[21]利用基因編輯技術(shù)(CRISPR/Cas9)對(duì)AtWRKY3和AtWRKY4進(jìn)行了編輯,發(fā)現(xiàn)突變體對(duì)鹽和茉莉酸甲酯(MeJA)脅迫的耐受性降低。與野生型相比,過(guò)表達(dá)AtWRKY30的擬南芥植株對(duì)氧化脅迫和鹽脅迫表現(xiàn)出更強(qiáng)的耐受性[22]。AtWRKY9通過(guò)調(diào)控AtCYP94B3和AtCYP86B1來(lái)控制軟木脂的沉積,從而增加擬南芥的耐鹽性[23]。Chen等[24]通過(guò)對(duì)AtWRKY18、AtWRKY40和AtWRKY60進(jìn)行單突、雙突、三突和過(guò)表達(dá)分析發(fā)現(xiàn),AtWRKY18和AtWRKY60對(duì)抑制種子萌發(fā)和根系生長(zhǎng)有積極作用,同時(shí)2個(gè)WRKY基因也提高了擬南芥對(duì)鹽脅迫和滲透脅迫的敏感性。擬南芥AtWRKY8主要在根中表達(dá),并在鹽處理后顯著上調(diào)表達(dá),AtWRKY8的功能缺失使擬南芥在鹽脅迫環(huán)境下受到抑制作用,表現(xiàn)出萌發(fā)延遲,并且抑制萌發(fā)后的生長(zhǎng)發(fā)育[25]。在鹽脅迫條件下,與野生型相比,Atwrky11和Atwrky17突變體的萌發(fā)速度較慢,根系生長(zhǎng)受損,表現(xiàn)出鹽脅迫敏感性[26]。
蠶豆(ViciafabaL.)屬于豆科野豌豆屬一年生或越年生草本植物[27],因其較高的營(yíng)養(yǎng)價(jià)值和有效的生物固氮作用在作物生產(chǎn)中占據(jù)著重要地位。隨著人們生活質(zhì)量的不斷提高,市場(chǎng)對(duì)蠶豆的需求呈增加和多樣化趨勢(shì)[28],由于中國(guó)耕地資源有限,糧、菜、油爭(zhēng)地矛盾突出,現(xiàn)有的蠶豆種植面積已無(wú)法滿(mǎn)足蠶豆生產(chǎn)發(fā)展的需求,可以通過(guò)挖掘基因資源、培育適宜鹽堿地種植的蠶豆新品種,從而擴(kuò)大蠶豆種植面積來(lái)滿(mǎn)足市場(chǎng)需求。
本研究使用的蠶豆品種啟豆2號(hào)種植于江蘇沿江地區(qū)農(nóng)業(yè)科學(xué)研究所種植基地。采集根(盛花期)、莖葉(盛花期)、花(盛花期)、種子(開(kāi)花后20 d、30 d、40 d)、果皮(開(kāi)花后20 d、30 d、40 d)等樣本保存于液氮中備用。委托北京百邁客生物科技有限公司進(jìn)行二代轉(zhuǎn)錄組(9個(gè)樣本,3次重復(fù),27個(gè)樣品)和全長(zhǎng)轉(zhuǎn)錄組(9個(gè)樣本RNA等量混合)測(cè)序、檢測(cè)、分析等。
根據(jù)條件fullpasses(全票)≥3且序列準(zhǔn)確性大于0.9從原始序列提取CCS(Circular consensus sequencing read)序列,并對(duì)CCS序列進(jìn)行校正。檢測(cè)CCS序列中是否包含5′引物、3′引物及poly A尾,3個(gè)都包含的為全長(zhǎng)非嵌合序列(Full-length no chimera, FLNC)。使用SMRTLink軟件中的IsoSeq模塊將全長(zhǎng)非嵌合序列中相似的序列聚類(lèi)到一簇(Cluster),每個(gè)Cluster得到一個(gè)一致序列(Consensus isoform),通過(guò)minimap2將得到的校正后的一致序列與蠶豆Tiffany參考基因組(https://projects.au.dk/fabagenome/genomics-data)進(jìn)行序列比對(duì)(設(shè)置參數(shù)-ax splice -uf --secondary=no -C5),使用cDNA Cupcake軟件對(duì)比對(duì)結(jié)果去冗余,過(guò)濾Identity(一致性)小于0.9、Coverage(優(yōu)勢(shì)度)小于0.85的序列,合并僅5′端外顯子有差異的比對(duì),最終得到非冗余轉(zhuǎn)錄本。
本研究以蠶豆全長(zhǎng)轉(zhuǎn)錄組為研究對(duì)象。在 pfam 蛋白質(zhì)家族數(shù)據(jù)庫(kù)(http//pfam. xfam. org/)中查找獲取WRKY基因家族保守結(jié)構(gòu)域的序列號(hào)(PF03106),并下載其對(duì)應(yīng)的隱馬爾可夫模型文件[29],利用TBtools軟件在蠶豆全長(zhǎng)轉(zhuǎn)錄組蛋白質(zhì)序列中初步檢索具有WRKY保守結(jié)構(gòu)域的WRKY轉(zhuǎn)錄因子。分別從擬南芥(https://www.arabidopsis.org/index.jsp)和PlantTFDB v5.0(http://planttfdb.gao-lab.org/index.php)網(wǎng)站下載擬南芥和蒺藜苜蓿的WRKY家族基因序列,并將其比對(duì)到蠶豆全長(zhǎng)轉(zhuǎn)錄組中獲取序列相似性最高的基因。將獲取的WRKY蛋白質(zhì)序列提交到NCBI CDD(https://www. ncbi. nlm. nih. gov/cdd)數(shù)據(jù)庫(kù),明確是否含WRKY保守結(jié)構(gòu)域,并剔除重復(fù)、冗余和注釋不完整的序列,保留下來(lái)的轉(zhuǎn)錄因子即為蠶豆WRKY家族成員。
利用TBtools軟件計(jì)算蠶豆WRKY家族成員編碼蛋白質(zhì)的氨基酸大小、相對(duì)分子質(zhì)量、等電點(diǎn)、不穩(wěn)定指數(shù)、脂肪系數(shù)和親疏水性。利用在線網(wǎng)站Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)對(duì)WRKY家族成員進(jìn)行亞細(xì)胞定位預(yù)測(cè)。
提交擬南芥和蠶豆WRKY家族基因蛋白質(zhì)序列到MEGA 7. 0軟件中進(jìn)行多重比對(duì),將比對(duì)結(jié)果使用最大似然法(Maximum likelihood,ML)構(gòu)建進(jìn)化樹(shù)。提交進(jìn)化樹(shù)參數(shù)到網(wǎng)站Evolview(https://evolgenius.info//evolview-v2/#login)上美化進(jìn)化樹(shù)[30],并根據(jù)擬南芥WRKY基因家族分類(lèi)方法進(jìn)行分組[8]。單獨(dú)提交蠶豆WRKY家族基因蛋白質(zhì)序列到MEGA 7. 0軟件中進(jìn)行多重比對(duì),使用最大似然法構(gòu)建進(jìn)化樹(shù),將進(jìn)化樹(shù)參數(shù)和WRKY家族基因保守結(jié)構(gòu)域信息輸入到TBtools軟件中進(jìn)行數(shù)據(jù)可視化分析[31]。
將113個(gè)WRKY基因家族成員的基因編號(hào)提交到TBtools軟件中,即可將每個(gè)基因定位到相應(yīng)的染色體上。使用在線軟件MEME(https://meme-suite. org/meme/tools/meme)預(yù)測(cè)蠶豆WRKY基因的保守基序[32],Motif最大值設(shè)置為10。下載Motif分析文件與蠶豆進(jìn)化樹(shù)參數(shù)共同提交到TBtools軟件中進(jìn)行數(shù)據(jù)可視化分析。
利用BLAST比對(duì)工具,將蠶豆WRKY家族轉(zhuǎn)錄本與基因本體(Gene Ontology,GO)(http://www.geneontology.org/)和KEGG(https://www.kegg.jp/)公共數(shù)據(jù)庫(kù)進(jìn)行比對(duì),從而得到WRKY蛋白功能注釋信息,并將該注釋信息提交到百邁客云在線分析平臺(tái)(https://international.biocloud.net/zh/software/tools/)進(jìn)行可視化分析。
除了現(xiàn)有研究已經(jīng)涉及的高唐神女、觀音、阿尼瑪、魚(yú)、力、死亡與再生、大地母親與智慧老人等原型,沈從文的小說(shuō)中還存在許多值得探究的原型。比如,《媚金·豹子與那羊》《月下小景》等小說(shuō)是沈從文根據(jù)湘西神話故事改編而來(lái)的,其中涉及“難題求婚”的文學(xué)母題。又如,沈從文筆下有許多雄健俊美的男子,《漁》中的孿生兄弟、《邊城》中的天保、儺送兄弟等,這類(lèi)反復(fù)出現(xiàn)的男子形象,也可能蘊(yùn)藏著某種原型。所有這些都有待學(xué)者們的深入探討。
通過(guò)文獻(xiàn)查找模式植物擬南芥中與鹽脅迫相關(guān)的WRKY基因,下載其蛋白質(zhì)序列與蠶豆WRKY蛋白序列進(jìn)行同源比對(duì),從而獲得蠶豆鹽脅迫相關(guān)候選WRKY基因。利用全長(zhǎng)轉(zhuǎn)錄組表達(dá)量數(shù)據(jù)對(duì)鹽脅迫相關(guān)候選WRKY基因進(jìn)行表達(dá)模式分析。
通過(guò) PacBio高通量測(cè)序技術(shù)對(duì)啟豆2號(hào)的根、莖葉、花、種子、果皮等組織進(jìn)行全長(zhǎng)轉(zhuǎn)錄組測(cè)序,共獲得53.84 Gb原始數(shù)據(jù)。全長(zhǎng)轉(zhuǎn)錄組測(cè)序獲得474 220條環(huán)形一致性序列 (CCS),平均長(zhǎng)度1 936 bp,分布于1 000~1 499 bp的CCS數(shù)量最多,為121 790條(圖1a);全長(zhǎng)非嵌合序列(FLNC)有390 912條,平均長(zhǎng)度1 646 bp,分布于500~999 bp的FLNC數(shù)量最多,為100 818條(圖1b)。對(duì)全長(zhǎng)非嵌合序列進(jìn)行聚類(lèi)和去冗余分析,最終得到58 885條轉(zhuǎn)錄本序列,其中新轉(zhuǎn)錄本數(shù)量為42 019個(gè),平均長(zhǎng)度為2 209 bp,分布于81~9 800 bp,主要集中在500~2 499 bp區(qū)間內(nèi),1 000~1 499 bp數(shù)量最多,為6 696個(gè)轉(zhuǎn)錄本(圖1c);我們對(duì)新發(fā)現(xiàn)的42 019個(gè)轉(zhuǎn)錄本進(jìn)行序列結(jié)構(gòu)分析,預(yù)測(cè)出26 438條完整開(kāi)放閱讀框(Open reading frame,ORF)序列,平均長(zhǎng)度為1 038 bp,分布于500 bp以下的ORF數(shù)量最多,為9 257條(圖1d)。
a:環(huán)形一致性序列(CCS)長(zhǎng)度分布;b:全長(zhǎng)非嵌合序列(FLNC)長(zhǎng)度分布;c:新轉(zhuǎn)錄本長(zhǎng)度分布;d:開(kāi)放閱讀框(ORF)長(zhǎng)度分布。a1:<500;a2:500~999;a3:1 000~1 499;a4:1 500~1 999;a5:2 000~2 499;a6:2 500~2 999;a7:≥3 000;b1:<500;b2:500~999;b3:1 000~1 499;b4:1 500~1 999;b5:2 000~2 499;b6:2 500~2 999;b7:≥3 000;c1:<500;c2:500~999;c3:1 000~1 499;c4:1 500~1 999;c5:2 000~2 499;c6:2 500~2 999;c7:3 000~3 499;c8:≥3 500;d1:<500;d2:500~999;d3:1 000~1 499;d4:1 500~1 999;d5:2 000~2 499;d6:≥2 500。
基于蠶豆全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù),在TBtools軟件中使用pfam程序搜索出121個(gè)WRKY轉(zhuǎn)錄本,經(jīng)數(shù)據(jù)庫(kù)比對(duì)以及去除冗余和缺失序列的轉(zhuǎn)錄因子,最終鑒定篩選出113個(gè)WRKY轉(zhuǎn)錄本,并重新命名為VfWRKY1~VfWRKY113,其中相對(duì)蠶豆Tiffany參考基因組新發(fā)現(xiàn)WRKY轉(zhuǎn)錄本31個(gè)(以PB命名)。VfWRKY轉(zhuǎn)錄因子基因家族編碼的蛋白質(zhì)的理化性質(zhì)見(jiàn)表1,蠶豆113個(gè)WRKY轉(zhuǎn)錄因子編碼的氨基酸數(shù)目最小為VfWRKY61(153 aa),最大為VfWRKY36(737 aa);相對(duì)分子質(zhì)量為17 729.49~81 727.72;等電點(diǎn)為4.84~9.87,76個(gè)蛋白質(zhì)等電點(diǎn)小于7.00,為酸性蛋白質(zhì),37個(gè)蛋白質(zhì)等電點(diǎn)大于7.00,為堿性蛋白質(zhì);不穩(wěn)定指數(shù)為29.87~67.85,7個(gè)蛋白質(zhì)不穩(wěn)定指數(shù)小于40.00,為穩(wěn)定蛋白質(zhì),106個(gè)蛋白質(zhì)不穩(wěn)定指數(shù)大于40.00,為不穩(wěn)定蛋白質(zhì);脂肪系數(shù)為45.60~81.99;平均親疏水性為-1.42~-0.40,均小于 0,表明蠶豆113個(gè)WRKY家族蛋白質(zhì)均屬于疏水性蛋白質(zhì)。亞細(xì)胞定位預(yù)測(cè)發(fā)現(xiàn)113個(gè)WRKY家族蛋白質(zhì)均定位于細(xì)胞核中,間接證明113個(gè)WRKY基因作為轉(zhuǎn)錄因子調(diào)控下游基因的表達(dá)。
表1 蠶豆WRKY 轉(zhuǎn)錄因子家族成員信息
續(xù)表1 Continued 1
續(xù)表1 Continued 1
為更好地了解蠶豆WRKY基因家族系統(tǒng)發(fā)育關(guān)系,我們利用最大似然法構(gòu)建了71個(gè)擬南芥WRKY蛋白和113個(gè)蠶豆WRKY蛋白的系統(tǒng)發(fā)育樹(shù),并根據(jù)Eulgem等[8]的分類(lèi)方法將蠶豆WRKY家族成員分為group 1~group 3,group 1具有2個(gè)WRKY結(jié)構(gòu)域,group 2具有1個(gè)WRKY結(jié)構(gòu)域和C2H2基序,group 3具有1個(gè)WRKY結(jié)構(gòu)域和C2HC基序。系統(tǒng)發(fā)育樹(shù)分析結(jié)果顯示,group 1、group 2、group 3分別包含38個(gè)(VfWRKY1~VfWRKY38)、61個(gè)(VfWRKY39~VfWRKY99)和14個(gè)(VfWRKY100~VfWRKY113)VfWRKY基因,group 3包含的基因數(shù)目最少,且與擬南芥13個(gè)WRKY基因聚在同一亞家族中。同時(shí)我們發(fā)現(xiàn)除group 1中VfWRKY16~VfWRKY19與group 2中VfWRKY基因聚在同一分支上外,其他group 1和group 2WRKY家族成員與擬南芥該亞家族成員都能夠很好地聚在同一分支上(圖2)。
圖2 蠶豆和擬南芥WRKY基因系統(tǒng)發(fā)育分析
我們將VfWRKY16~VfWRKY19與VfWRKY29(5個(gè)基因同為Vfaba.Tiffany.R1.2g038280的轉(zhuǎn)錄本)進(jìn)行多序列比對(duì)發(fā)現(xiàn)5個(gè)基因的第一個(gè)WRKY結(jié)構(gòu)域都為WRKYGQK-C2-HDH(完整),但VfWRKY16、VfWRKY17、VfWRKY18和VfWRKY19的第二個(gè)WRKY結(jié)構(gòu)域只有WRKYGQK-(VfWRKY29的第二個(gè)WRKY結(jié)構(gòu)域具有完整的WRKYGQK-C2-H2結(jié)構(gòu)),所以這4個(gè)基因聚集在group 2分支是由于第二個(gè)結(jié)構(gòu)域缺少C2-H2序列(圖3)。
標(biāo)記處表示W(wǎng)RKY結(jié)構(gòu)域氨基酸序列。
由于所使用的軟件或數(shù)據(jù)本身具有局限性,導(dǎo)致所選參考基因組注釋往往不夠精確,這樣就有必要對(duì)原有注釋的基因結(jié)構(gòu)進(jìn)行優(yōu)化。我們通過(guò)gffcompare軟件與蠶豆Tiffany參考基因組注釋進(jìn)行比較,將已知基因和轉(zhuǎn)錄本保留原身份標(biāo)識(shí)號(hào)(ID),將新基因和新轉(zhuǎn)錄本保留PB格式的ID添加到注釋中,最終我們得到包含新基因和新轉(zhuǎn)錄本的優(yōu)化參考基因組注釋文件。利用優(yōu)化參考基因組注釋文件提取位置信息繪制WRKY家族成員在染色體上的物理分布(圖4)。蠶豆由12條染色體組成,每?jī)蓷l染色體為1對(duì),共6對(duì),其中染色體1包含染色體1L和染色體1S。113個(gè)WRKY轉(zhuǎn)錄本不均勻地分布在7條染色體上,染色體1擁有的WRKY家族成員最多,為38個(gè),其中染色體1L有29個(gè),染色體1S有9個(gè); 染色體2擁有WRKY家族成員 24個(gè),染色體5擁有WRKY家族成員19個(gè),染色體4擁有WRKY家族成員13個(gè),染色體6 擁有WRKY家族成員11個(gè),染色體3擁有WRKY家族成員數(shù)量最少,為8個(gè)。
113個(gè)VfWRKY蛋白包含3種保守結(jié)構(gòu)域,分別為WRKY、Plant_zn_clust、PTZ00265。其中VfWRKY54、VfWRKY64、VfWRKY67、VfWRKY72、VfWRKY77、VfWRKY78和VfWRKY82含有WRKY和Plant_zn_clust結(jié)構(gòu)域,并且7個(gè)基因聚在同一分支上;VfWRKY14、VfWRKY15、VfWRKY27和VfWRKY28含有WRKY和PTZ00265結(jié)構(gòu)域,其余102WRKY基因都只包含WRKY結(jié)構(gòu)域(圖5)。同時(shí)我們發(fā)現(xiàn)group 2和group 3中的61個(gè)和14個(gè)WRKY轉(zhuǎn)錄本都只含有1個(gè)WRKY保守結(jié)構(gòu)域,并且分別聚集在同一分支上;group 1的38個(gè)WRKY轉(zhuǎn)錄本都含有2個(gè)WRKY保守結(jié)構(gòu)域,但VfWRKY16、VfWRKY17、VfWRKY18和VfWRKY19的第二個(gè)WRKY結(jié)構(gòu)域長(zhǎng)度不完整(圖5)。
在一個(gè)基因家族中,基因的保守基序可以反映該基因家族成員之間的進(jìn)化關(guān)系和功能。我們利用在線網(wǎng)站MEME分析了VfWRKY基因家族的保守基序,并使用TBtools進(jìn)行了可視化分析(圖6)。VfWRKY基因家族共含有10個(gè)Motif,其中不同的WRKY基因含有Motif的數(shù)量為2~10個(gè),VfWRKY39和VfWRKY44只含有2個(gè)Motif,VfWRKY12、VfWRKY13、VfWRKY22、VfWRKY29、VfWRKY30和VfWRKY31含有的Motif最多,為10個(gè)。通過(guò)序列查詢(xún)發(fā)現(xiàn)Motif 1和Motif 3與WRKY結(jié)構(gòu)域相對(duì)應(yīng),group 2和group 3中有71個(gè)WRKY轉(zhuǎn)錄本含有Motif 1,只有VfWRKY39、VfWRKY43、VfWRKY44和VfWRKY46含有Motif 3;group 1中37個(gè)基因同時(shí)含有Motif 1和Motif 3,只有VfWRKY34含有2個(gè)Motif 1。每個(gè)WRKY亞家族都具有相對(duì)穩(wěn)定的Motif,其中g(shù)roup 1亞家族有33個(gè)基因(在group 1中占比86.8%)同時(shí)含有Motif 3、Motif 6、Motif 7、Motif 1、Motif 4、Motif 2和Motif 5;group 2亞家族被分為2個(gè)分支,分支1有29個(gè)基因(在group 2中占比47.5%)同時(shí)含有Motif 1、Motif 4、Motif 2和Motif 5,分支2有27個(gè)基因(在group 2中占比44.3%)同時(shí)含有Motif 7、Motif 1、Motif 4、Motif 2和Motif 5;group 3亞家族所有基因都含有Motif 1、Motif 4和Motif 2。VfWRKY16、VfWRKY17、VfWRKY18和VfWRKY19的Motif數(shù)量與保守結(jié)構(gòu)域長(zhǎng)度相對(duì)應(yīng),相對(duì)group 1亞家族成員缺少了Motif 4、Motif 2和Motif 5(圖6)。
圖4 蠶豆WRKY基因在染色體上的分布
圖5 蠶豆WRKY家族成員保守結(jié)構(gòu)域分析
圖中色塊上1~10表示motif序號(hào)。
將VfWRKY家族的113個(gè)WRKY轉(zhuǎn)錄本與GO 數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析,結(jié)果顯示,113個(gè)WRKY轉(zhuǎn)錄本都得到了注釋(圖7a)。按照GO功能分類(lèi)方式,將113個(gè)WRKY轉(zhuǎn)錄本分為生物過(guò)程(Biological process)、細(xì)胞組分(Cellular component)和分子功能(Molecular function)3大類(lèi)。3個(gè)大類(lèi)可細(xì)分為20個(gè)二級(jí)分類(lèi),其中生物過(guò)程包含的二級(jí)分類(lèi)最多,為16個(gè)不同的亞類(lèi),主要包括轉(zhuǎn)錄調(diào)控(DNA和RNA模板轉(zhuǎn)錄)、代謝過(guò)程的調(diào)控(大分子、細(xì)胞、化合物和RNA等)、生物合成過(guò)程的調(diào)控(細(xì)胞、大分子和RNA等);分子功能注釋基因占比最多,為112個(gè)WRKY轉(zhuǎn)錄本,主要包括DNA結(jié)合轉(zhuǎn)錄因子活性和序列特異性DNA結(jié)合2個(gè)功能;細(xì)胞組分包含的二級(jí)分類(lèi)最少,主要為細(xì)胞核(29個(gè)轉(zhuǎn)錄本)。
在KEGG 數(shù)據(jù)庫(kù)對(duì)VfWRKY家族的113個(gè)WRKY轉(zhuǎn)錄本進(jìn)行通路富集分析,結(jié)果顯示有98個(gè)VfWRKY轉(zhuǎn)錄本得到KEGG通路富集(圖7b)。VfWRKY基因主要富集在植物MAPK信號(hào)通路、植物與病原菌相互作用和剪接體3個(gè)通路中,其中植物與病原菌相互作用通路WRKY基因最多,為84個(gè)(占比85.71%),其次是植物MAPK信號(hào)通路,為40個(gè)(占比40.82%),剪接體通路最少,為13個(gè)(占比13.27%)。
P值、Q值表示差異顯著性檢驗(yàn)指標(biāo)。圖a中,柱長(zhǎng)度對(duì)應(yīng)P值的對(duì)數(shù),柱后的數(shù)字表示基因數(shù)。
為了探究蠶豆WRKY家族成員表達(dá)模式,我們利用WRKY基因在根、莖葉、花、種子(開(kāi)花后20 d、30 d、40 d)、果皮(開(kāi)花后20 d、30 d、40 d)中的表達(dá)信息,構(gòu)建了WRKY基因表達(dá)圖譜(圖8)。分析表達(dá)圖譜可知,WRKY基因家族在9個(gè)樣本中的表達(dá)模式可分為5組(Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ):Ⅰ組主要在果皮中高表達(dá);Ⅱ組主要在種子中高表達(dá);Ⅲ組在9個(gè)樣本中低表達(dá)或不表達(dá);Ⅳ組主要在根中表達(dá)且在其他組織中低表達(dá)或不表達(dá),并且在根中高表達(dá)的WRKY基因占比較高(46.0%);Ⅴ組在多個(gè)組織中均有表達(dá)。
R:根;L:莖葉;F:花;S20、S30、S40表示開(kāi)花后20 d、30 d、40 d的種子;P20、P30、P40表示開(kāi)花后20 d、30 d、40 d的果皮。
通過(guò)查閱已有的擬南芥WRKY基因家族報(bào)道,我們發(fā)現(xiàn)AtWRKY1、AtWRKY3、AtWRKY4、AtWRKY8、AtWRKY9等16個(gè)基因與鹽脅迫相關(guān),其中12個(gè)基因?yàn)槟望}基因,AtWRKY18、AtWRKY46、AtWRKY60、AtWRKY70為鹽敏感基因(表2)。將擬南芥中與鹽脅迫相關(guān)的16個(gè)WRKY基因比對(duì)到蠶豆WRKY基因家族中,在蠶豆中發(fā)現(xiàn)了14個(gè)候選同源基因,分別為Vfaba.Tiffany.R1.1g183400、Vfaba.Tiffany.R1.2g038280、Vfaba.Tiffany.R1.3g164760、Vfaba.Tiffany.R1.2g048240、Vfaba.Tiffany.R1.4g037840、Vfaba.Tiffany.R1.6g074800、Vfaba.Tiffany.R1.3g078920、Vfaba.Tiffany.R1.1g060200、Vfaba.Tiffany.R1.2g211440、Vfaba.Tiffany.R1.5g003240、Vfaba.Tiffany.R1.1g006440、Vfaba.Tiffany.R1.2g102760、Vfaba.Tiffany.R1.6g076880和Vfaba.Tiffany.R1.5g049280,其中AtWRKY3和AtWRKY4共同比對(duì)到Vfaba.Tiffany.R1.1g006440,AtWRKY11和AtWRKY17共同比對(duì)到Vfaba.Tiffany.R1.3g164760,且AtWRKY3、AtWRKY4、AtWRKY11和AtWRKY17都為耐鹽基因。
表2 蠶豆鹽脅迫候選WRKY基因
我們對(duì)啟豆2號(hào)的根、莖葉、花、種子(開(kāi)花后20 d、30 d、40 d)、果皮(開(kāi)花后20 d、30 d、40 d)的27個(gè)樣品進(jìn)行了轉(zhuǎn)錄組分析,利用轉(zhuǎn)錄組數(shù)據(jù)對(duì)蠶豆14個(gè)鹽脅迫相關(guān)候選WRKY基因進(jìn)行了表達(dá)模式分析(圖9)。Vfaba.Tiffany.R1.1g183400、Vfaba.Tiffany.R1.3g164760、Vfaba.Tiffany.R1.2g048240、Vfaba.Tiffany.R1.4g037840、Vfaba.Tiffany.R1.6g074800、Vfaba.Tiffany.R1.2g211440、Vfaba.Tiffany.R1.5g003240、Vfaba.Tiffany.R1.2g102760、Vfaba.Tiffany.R1.6g076880主要在根中高表達(dá),在其他組織的表達(dá)量較低或不表達(dá)。Vfaba.Tiffany.R1.1g006440在多個(gè)組織中均有表達(dá),并在開(kāi)花后40 d果皮中表達(dá)量最高;Vfaba.Tiffany.R1.1g060200在多個(gè)組織中表達(dá)量較低或不表達(dá);Vfaba.Tiffany.R1.5g049280在開(kāi)花后20 d果皮中表達(dá)量最高。Vfaba.Tiffany.R1.1g183400、Vfaba.Tiffany.R1.2g038280、Vfaba.Tiffany.R1.2g048240、Vfaba.Tiffany.R1.2g102760、Vfaba.Tiffany.R1.2g211440、Vfaba.Tiffany.R1.3g078920、Vfaba.Tiffany.R1.3g164760、Vfaba.Tiffany.R1.4g037840和Vfaba.Tiffany.R1.5g003240在果皮中的表達(dá)量均先升高后下降(圖9)。
R:根;L:莖葉;F:花;S20、S30、S40表示開(kāi)花后20 d、30 d、40 d的種子;P20、P30、P40表示開(kāi)花后20 d、30 d、40 d的果皮。
蠶豆是具有較高營(yíng)養(yǎng)價(jià)值和生物固氮作用的食用豆類(lèi),由于缺乏參考基因組序列,使得蠶豆的基礎(chǔ)研究進(jìn)展緩慢。2023年Jayakodi等[33]通過(guò)高通量測(cè)序,組裝了第一個(gè)蠶豆高質(zhì)量、染色體規(guī)模的基因組,并公布了37 065個(gè)基因的序列信息。全長(zhǎng)轉(zhuǎn)錄組測(cè)序(三代高通量測(cè)序技術(shù))能夠直接獲得高質(zhì)量全長(zhǎng)轉(zhuǎn)錄本,高質(zhì)量全長(zhǎng)轉(zhuǎn)錄本既可以為無(wú)參基因組的二代測(cè)序數(shù)據(jù)拼接提供參考,也可以完善基因組的基因數(shù)量。本研究首次對(duì)蠶豆的根、莖葉、花、種子(開(kāi)花后20 d、30 d、40 d)、果皮(開(kāi)花后20 d、30 d、40 d)等9個(gè)樣本進(jìn)行了三代轉(zhuǎn)錄組測(cè)序,獲得58 885 條轉(zhuǎn)錄本序列,與蠶豆基因組相比,發(fā)現(xiàn)新轉(zhuǎn)錄本42 019個(gè)。本研究構(gòu)建的全長(zhǎng)轉(zhuǎn)錄組為后續(xù)進(jìn)一步開(kāi)展蠶豆遺傳研究提供了豐富的數(shù)據(jù)基礎(chǔ)。
WRKY轉(zhuǎn)錄因子基因是植物特有的轉(zhuǎn)錄因子基因,已有研究結(jié)果表明,WRKY轉(zhuǎn)錄因子基因能夠調(diào)控植物生長(zhǎng)發(fā)育,例如,調(diào)控種子休眠、萌發(fā)[34],調(diào)控幼苗的形態(tài)發(fā)生[35],以及調(diào)節(jié)植物的開(kāi)花時(shí)間等[36]。除了這些功能外,WRKY基因在響應(yīng)非生物脅迫(干旱、高溫、高鹽等)[37]和生物脅迫(病原菌[38]和昆蟲(chóng)[39]等)方面也具有非常重要的作用。本研究首次利用全長(zhǎng)轉(zhuǎn)錄組測(cè)序?qū)πQ豆WRKY家族進(jìn)行研究,并鑒定出113個(gè)VfWRKY基因。不同物種間系統(tǒng)進(jìn)化樹(shù)的建立,有助于更加準(zhǔn)確地研究物種中未知家族成員的功能,我們根據(jù)進(jìn)化關(guān)系,將蠶豆113個(gè)WRKY基因分成3組,其中g(shù)roup 2成員最多,為61個(gè)。同時(shí)我們對(duì)VfWRKY家族進(jìn)行保守結(jié)構(gòu)域和保守基序分析發(fā)現(xiàn),group 1中的4個(gè)基因(VfWRKY16、VfWRKY17、VfWRKY18、VfWRKY19)具有2個(gè)WRKY保守結(jié)構(gòu)域,但卻與group 2亞家族聚集在同一分支,通過(guò)序列比對(duì),發(fā)現(xiàn)是由于第二個(gè)WRKY結(jié)構(gòu)域缺少C2-H2序列造成的,需要通過(guò)優(yōu)化蠶豆參考基因組后來(lái)完善其序列。
VfWRKY基因家族主要富集在植物MAPK信號(hào)通路、植物與病原菌相互作用和剪接體3個(gè)通路中。劉晨等[40]通過(guò)分析前人的研究發(fā)現(xiàn)MAPK信號(hào)通路能夠響應(yīng)干旱脅迫、鹽脅迫、極端溫度及營(yíng)養(yǎng)匱乏等非生物脅迫,并在植物抗逆過(guò)程中扮演重要角色,這與本研究的結(jié)果相符。同時(shí)WRKY基因在植物與病原菌相互作用通路中也具有多種功能,研究發(fā)現(xiàn)AtWRKY25和AtWRKY33既能調(diào)控植物與病原菌的相互作用[41-42],也能增強(qiáng)植物抵抗鹽脅迫的能力[24]。根據(jù)擬南芥WRKY基因家族已知基因功能,通過(guò)同源比對(duì),在VfWRKY基因家族中發(fā)現(xiàn)14個(gè)候選基因可能與鹽脅迫相關(guān),其中部分基因同時(shí)富集在植物與病原菌相互作用和植物MAPK信號(hào)通路中。本研究的下一步工作將對(duì)14個(gè)候選基因進(jìn)行功能驗(yàn)證,探索其與鹽脅迫的相關(guān)性。