張傳義,許艷超,蔡小彥,王星星,侯宇清,王玉紅,王坤波,劉方,周忠麗
(棉花生物學(xué)國家重點(diǎn)實(shí)驗室/ 中國農(nóng)業(yè)科學(xué)院棉花研究所,河南安陽455000)
植物在生理活動中經(jīng)過體內(nèi)氧化還原反應(yīng)會產(chǎn)生過氧化氫、超氧陰離子、羥自由基和單線態(tài)氧等活性氧物質(zhì)[1-2]。正常條件下,植物體內(nèi)產(chǎn)生的活性氧保持動態(tài)平衡狀態(tài)[3]。然而在干旱、高溫、鹽堿等非生物脅迫下,活性氧物質(zhì)的動態(tài)平衡被打破,植物會產(chǎn)生大量的活性氧物質(zhì),對植物造成氧化脅迫[4],進(jìn)而破壞細(xì)胞膜完整性、導(dǎo)致膜脂過氧化[5],改變蛋白活性[6],甚至導(dǎo)致細(xì)胞死亡,嚴(yán)重影響作物的生長發(fā)育[7-9]。
谷胱甘肽是含有巰基的抗氧化物質(zhì),具有儲存和轉(zhuǎn)運(yùn)還原態(tài)硫、調(diào)節(jié)酶活性[10]、傳導(dǎo)氧化還原信號的功能[11]。研究表明谷胱甘肽能夠有效地防止植物中活性氧 (Reactive oxygen species,ROS)積累,植物對非生物脅迫忍耐性與體內(nèi)谷胱甘肽的含量及其氧化還原狀態(tài)緊密相關(guān)[12]。谷胱甘肽還原酶(Glutathione reductase,GR)是 1 種黃素蛋白氧化還原酶,主要借助煙酰胺腺嘌呤二核苷酸磷酸酯 (Nicotinamide adenine dinucleotide phosphate,NADPH)提供電子進(jìn)而將氧化型谷胱甘肽(Glutathione oxidized,GSSG)還原為還原型谷胱甘肽(Glutathione,GSH),維持植物體 GSH/GSSG的比例,提高植物對非生物脅迫的耐受性[13-14]。GR 普遍存在于葉綠體中,少量存在于細(xì)胞質(zhì)、線粒體、過氧化物酶體中[15-16]。對其結(jié)構(gòu)研究發(fā)現(xiàn)GR 主要包括黃素腺嘌呤二核苷酸 (Flavin adenine dinucleotide,F(xiàn)AD) 結(jié)構(gòu)域和 NADPH 結(jié)構(gòu)域,其中以同型二聚體的形式存在為主,但在衣藻中卻以單體存在[17],在玉米中以異二聚體存在[18-19]。GR 具有多種由不同基因編碼的同工酶,對提高生物脅迫和非生物脅迫抗性具有重要的意義[20-21]。在鹽脅迫下,柑橘[22]、豌豆[23]、水稻[24]、大豆[25]、番茄[26]、小麥[27]、谷子[28]等物種的 GR 活性提高;同樣在干旱脅迫下,玉米[29]、小麥[30]、水稻[31-32]等物種的GR 活性也會提高。在低溫脅迫下,水稻幼苗胞質(zhì)GR基因的轉(zhuǎn)錄水平提高[33]。在強(qiáng)光下,對抑制GR表達(dá)的轉(zhuǎn)基因擬南芥研究發(fā)現(xiàn),光系統(tǒng)Ⅱ活性被抑制,植物體內(nèi)H2O2含量升高,植物生長發(fā)育受到影響[34]。在臭氧和百草枯引起的氧化脅迫下,過表達(dá)GR基因能夠提高煙草光合作用[35-36]。在低溫脅迫下,抑制番茄GR基因表達(dá),植物體內(nèi)H2O2含量升高,增強(qiáng)了對冷害脅迫的敏感性[37]。敲除水稻GR3 基因增加對鹽脅迫的敏感性[38]。過表達(dá)GR基因的棉花對短期低溫脅迫的耐受性提高[39];在低溫和強(qiáng)光照條件下,葉綠體中過表達(dá)GR基因的棉花與野生型比較,具有更高的光合速率[39-40];在鹽脅迫下,棉花的GR 活性提高,抗氧化性增強(qiáng)[41]。
目前雷蒙德氏棉 (Gossypium raimondii)、亞洲棉(G.arboreum)、陸地棉(G.hirsutum)、海島棉(G.barbadense)基因組序列已先后被解析。本研究通過生物信息學(xué)方法,對GR基因家族成員進(jìn)行鑒定,進(jìn)一步分析其理化性質(zhì)、序列特征、系統(tǒng)進(jìn)化關(guān)系、染色體位置,并對陸地棉中GR基因的表達(dá)模式進(jìn)行研究,進(jìn)而為后續(xù)研究GR基因功能提供基礎(chǔ)。
在 Cottongen 數(shù)據(jù)庫(https://www.cottongen.org/) 下載陸地棉 (AD1,HAU)、 海島棉(AD2,HAU)、雷蒙德氏棉 (D5,JGI_v2.1)和 亞洲棉(A2,CR1)基因組數(shù)據(jù)。通過蛋白質(zhì)家族比對和隱馬爾可夫模型 (Hidden Markov Model,HMM)數(shù)據(jù)庫 (Protein families database of alignments and HMM,Pfam 數(shù)據(jù)庫)網(wǎng)站(http://pfam.xfam.org/)下載GR基因的種子文件PF07992 和PF02852。使用HMMER 3.0 軟件和本地BLASTP 程序比對搜索含有GR 蛋白結(jié)構(gòu)域的序列。將篩選出的蛋白序列使用在線軟件Pfam、簡單模塊構(gòu)架搜索工具 (Simple modular architecture research tool,SMART,http://smart.embl-heidelberg.de) 和保守結(jié)構(gòu)域數(shù)據(jù)庫(Conserved domain database,CDD,http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進(jìn)行比對驗證。
利用ClustalW 軟件對鑒定得到的陸地棉、海島棉、雷蒙德氏棉、亞洲棉GR 蛋白序列進(jìn)行比對,使用Mapman 繪制棉花多序列比對結(jié)果。利用 MEGA 6.0 軟件對擬南芥(Arabidopsis)、可可(Theobroma cacao) 及3 個棉花基因組中提取的GR 家族成員進(jìn)行多序列比對,使用鄰接法(Neighbor-joining)構(gòu)建系統(tǒng)發(fā)育樹,Bootstrap 設(shè)置為1 000。利用在線工具ProtParam(http://web.expasy.org/protparam/)對GR 蛋白質(zhì)的理化性質(zhì)進(jìn)行分析。使用在線工具ProtComp9.0(http://www.softberry.com/berry.phtml?topic=protcomppl&group=programs&subgroup=proloc)預(yù)測 GR 家族成員的亞細(xì)胞定位。使用InParanoid 軟件預(yù)測陸地棉、海島棉、雷蒙德氏棉、亞洲棉GR基因家族成員同源基因?qū)ΑJ褂肒aKsCalculator 計算同義突變率(Ks)和非同義突變率(Ka)。
使用在線軟件 MEME(http://meme.sdsc.edu/meme/)對保守基序進(jìn)行分析,主要參數(shù)設(shè)置:number of unique motifs: 10;maximum and minimum search widths:50。在 4 個棉種(G.hirsutum、G.barbadense、G.raimondii、G.arboreum)的基因組 GFF(General feature format)注釋文件中提取GR基因家族成員位置及結(jié)構(gòu)信息,使用MapChart2.2 軟件進(jìn)行分析繪制染色體定位,利用基因結(jié)構(gòu)顯示系統(tǒng) (Gene Structure Display Server,GSDS,http://gsds.cbi.pku.edu.cn/)繪制GR基因家族基因結(jié)構(gòu)。
在 NCBI 的 SRA (Sequence read archive)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/sra)下載陸地棉的轉(zhuǎn)錄組數(shù)據(jù) (PRJNA248163)。使用 Tophat和Cufflink 軟件包處理數(shù)據(jù)并計算表達(dá)量,使用R 語言熱圖繪制包(Pheatmap)繪制陸地棉GR基因表達(dá)譜,表達(dá)量為FPKM(Expected number of fragments per kilobase of transcript sequence per millions base pairs sequenced,每百萬片段中來自某基因每千堿基長度的片段數(shù))。
使用本地 BLASTP 程序和 HMMER 3.0 軟件對種子文件進(jìn)行比對搜索后得到候選序列,并且利用Pfam、SMART、CDD 軟件驗證保守結(jié)構(gòu)域后,將不含完整GR 結(jié)構(gòu)域的序列舍棄,最終鑒定得到18 個GR基因,陸地棉、海島棉、亞洲棉、雷蒙德氏棉中分別有 6 個、6 個、3 個、3 個,分別 命 名 為GhGR1 ~GhGR6、GbGR1 ~GbGR6、GaGR1~GaGR3 和GrGR1~GrGR3(表 1)。GR蛋白質(zhì)長度為 421~577 個氨基酸殘基 (aa),相對分子質(zhì)量在 45.807~63.072 kDa,等電點(diǎn)為5.9~8.459。亞細(xì)胞定位預(yù)測結(jié)果表明,GR 在4個棉種的葉綠體和細(xì)胞質(zhì)均有分布,且主要定位于葉綠體(表1)。
GR基因家族系統(tǒng)發(fā)育分析發(fā)現(xiàn)GR基因主要分為2 個亞組,即Ⅰ組和Ⅱ組,分別包括12 和6 個成員。對GR基因的結(jié)構(gòu)分析,發(fā)現(xiàn)各組內(nèi)成員間具有相似的基因結(jié)構(gòu)并且編碼相似的結(jié)構(gòu)域。對GR基因的外顯子(Exon)數(shù)目統(tǒng)計發(fā)現(xiàn),2個亞組的外顯子數(shù)目具有明顯差異:Ⅰ組基因均具有 16 ~18 個外顯子;Ⅱ組除基因 Gbar_D11G013900 和 Gorai.007G142200 具 有 9 個 外顯子外,其余基因均具有11 個外顯子。GR基因序列比較發(fā)現(xiàn),Ⅰ組基因結(jié)構(gòu)序列較Ⅱ組明顯變長(圖1)。同一組內(nèi)具有相似的外顯子數(shù)目且具有相似的基因序列結(jié)構(gòu),表明系統(tǒng)進(jìn)化分類的可靠性。
利用MEME 軟件對GR基因家族編碼產(chǎn)物的保守基序進(jìn)行分析,發(fā)現(xiàn)除Ⅱ組基因Ghir_D11G013530、Ghir_A11G013490 和 Gbar_D11G013900 外,其他GR基因的編碼產(chǎn)物均含有8 個保守的模體(motif),表明 GR 蛋白結(jié)構(gòu)域高度保守(圖1 和圖2)。亞細(xì)胞定位分析發(fā)現(xiàn)在Ⅰ組中,6 個 GR 定位于葉綠體,6 個 GR 定位于細(xì)胞質(zhì);在Ⅱ組中,6 個 GR 均定位于葉綠體。GR 高度保守的結(jié)構(gòu)域表明,不同亞組間GR基因具有相似的功能,但其編碼產(chǎn)物作用的細(xì)胞位置不同。
對陸地棉、海島棉、雷蒙德氏棉、亞洲棉、擬南芥(包含2 個GR基因家族成員)和可可(包含2 個GR基因家族成員)GR基因家族編碼的蛋白序列構(gòu)建系統(tǒng)進(jìn)化樹,結(jié)果發(fā)現(xiàn),可將GR基因家族分為2 類(圖3),與棉花GR基因系統(tǒng)發(fā)育分析結(jié)果相同,表明在擬南芥、可可、棉花物種分化前,GR基因家族包含2 個亞組。此外發(fā)現(xiàn)可可基因Thecc1EG020353 和擬南芥基因AT3G24170 被歸類于亞組Ⅰ;Thecc1EG046980和AT3G54660 歸類于亞組Ⅱ,并且棉花GR基因與近緣種可可的親緣關(guān)系明顯高于與擬南芥。表明GR基因在近緣種中具有更高的相似度,基因的功能可能更相似。
表1 棉花GR基因家族及其編碼產(chǎn)物信息Table 1 The information of GR gene family and their products in cotton
圖3 棉花、可可和擬南芥GR 系統(tǒng)進(jìn)化分析(A)與同源關(guān)系分析(B)Fig.3 Phylogenetic analysis of GR in cotton, cocoa and Arabidopsis (A) and analysis of homology of GR gene family in cotton (B)
陸地棉的6 個GR基因定位在6 條染色上體,海島棉的 6 個GR基因定位在 6 條染色體上,雷蒙德氏棉3 個GR基因定位在3 條染色體上; 亞洲棉3 個GR基因定位在 3 條染色體上(圖4)。
通過InParanoid 軟件分析GR基因同源基因?qū)?,共發(fā)現(xiàn)15 對同源基因?qū)Γ▓D3)。同源基因的Ka/Ks值,主要分布于 0.001 0~0.784 9 (表2)。Ka/Ks值均小于1,表明陸地棉、海島棉、亞洲棉和雷蒙德氏棉中的GR基因家族成員在進(jìn)化過程中經(jīng)歷了較強(qiáng)的純化選擇過程。
對在低溫脅迫、高溫脅迫、PEG6000 模擬干旱脅迫、鹽脅迫處理條件下的陸地棉GR基因進(jìn)行表達(dá)譜分析,結(jié)果發(fā)現(xiàn)在干旱脅迫和鹽脅迫處理后,GR基因的表達(dá)模式相似 (圖 5)。其中Ghir_D02G012650、Ghir_A11G013490、Ghir_D11 G013530 在干旱脅迫和鹽脅迫處理后先上調(diào)表達(dá),在 3 h 后出現(xiàn)明顯下調(diào)表達(dá);而 Ghir_A03 G010510、Ghir_A10G012520、Ghir_D10G015270在干旱脅迫和鹽脅迫處理后上調(diào)表達(dá)。在低溫脅迫、 高溫脅迫處理后,GR基因表達(dá)模式較為一致:Ghir_A03G010510、Ghir_A10G012520、Ghir_D10G015270 先下調(diào)表達(dá),在處理12 h 后又上調(diào)表達(dá);Ghir_D02G012650、Ghir_A11G013490、Ghir_D11G013530 在低溫脅迫處理1 h 時上調(diào)表達(dá),而后下調(diào)表達(dá); 在高溫處理后,Ghir_D02G012650、Ghir_A11G013490、Ghir_D11G013530 隨 著 處 理時間的增加均出現(xiàn)下調(diào)表達(dá)。Ghir_A11G013490和Ghir_D11G013530 作為同源基因,一個來自于A 基因組,另一個來自于D 基因組,在不同的脅迫處理后均表現(xiàn)出最為相似的表達(dá)模式,表明該同源對在后續(xù)的棉花進(jìn)化中功能未發(fā)生變化。
圖4 GR 基因在染色體上的分布Fig.4 Chromosomal distribution of GR genes
表2 GR 基因家族同源基因?qū)a/Ks 值Table 2 The Ka/Ks ratio of homologous gene pairs of GR genes
圖5 陸地棉 GR 基因在低溫脅迫(A)、高溫脅迫(B)、PEG-6000 模擬干旱脅迫(C)、鹽脅迫(D)處理條件下的表達(dá)模式Fig.5 The expression patterns of upland cotton GR genes under cold stress (A), high temperature stress (B),PEG-6000 simulated drought stress (C) and salt stress (D)
GR 作為植物體重要的抗氧化酶[42],對提高生物脅迫和非生物脅迫抗性具有重要的作用[20-21]。大量的研究表明,在鹽堿、干旱、低溫等非生物脅迫下GR 活性增加,可明顯提高植物的抗性[22-32]。GR基因的過表達(dá)提高了轉(zhuǎn)基因植株對生物脅迫和非生物脅迫的抗性[33-37]。通過比對鑒定,本研究在陸地棉、海島棉、亞洲棉、雷蒙德氏棉中分別鑒定出 6 個、6 個、3 個、3 個GR基因。陸地棉和海島棉GR基因數(shù)目一致,亞洲棉和雷蒙德氏棉GR基因數(shù)目一致,且具有相似的基因結(jié)構(gòu),表明GR基因在陸地棉和海島棉、 雷蒙德氏棉和亞洲棉之間高度保守并且具有相似的功能,同時表明亞洲棉和雷蒙德氏棉二倍體棉種的共同祖先可能存在相似的GR基因成員分布。對棉花系統(tǒng)發(fā)育分析發(fā)現(xiàn),GR基因家族成員分為2 個亞組,各亞組的基因結(jié)構(gòu)、外顯子數(shù)目相似。異源四倍體陸地棉包含A、D 亞基因組,且棉花A 基因組的亞洲棉為A 亞組供體種,D 基因組的雷蒙德氏棉為 D 組的供體種[43]。本研究中陸地棉 6 個GR基因分別與亞洲棉和雷蒙德氏棉的3 個基因歸為6對直系同源基因,表明在進(jìn)化過程中異源四倍體陸地棉的GR基因沒有經(jīng)過單獨(dú)的復(fù)制或明顯的基因丟失事件,具有高度保守性。
系統(tǒng)進(jìn)化分析表明,GR基因家族在可可、擬南芥和棉屬分化的長期過程中保留了2 個亞組,也證明了這2 個亞組在植物生長發(fā)育與環(huán)境適應(yīng)過程中的重要性。其結(jié)果還表明GR基因家族亞組Ⅰ和亞組Ⅱ的分化可能早于棉花、 可可、擬南芥的物種分化。Ka/Ks值可以用來判斷是否有選擇壓力作用于基因。如果Ka/Ks>1,則認(rèn)為有正選擇效應(yīng);如果Ka/Ks=1,則認(rèn)為存在中性選擇;如果Ka/Ks<1,則認(rèn)為有純化選擇作用[44]。本研究同源基因?qū)Φ腒a/Ks均小于1,表明GR基因在進(jìn)化過程中高度保守,具有相似的功能。
在棉花中過表達(dá)GR基因可提高對短期低溫脅迫的耐受性[39],在鹽脅迫處理下,谷胱甘肽還原酶活性提高,增強(qiáng)棉花的抗氧化性[41]。對陸地棉葉片中GR基因的表達(dá)模式進(jìn)行分析,結(jié)果發(fā)現(xiàn)所有的GR基因在非生物脅迫下均積極響應(yīng)非生物脅迫,表明在非生物脅迫中GR 起到關(guān)鍵的作用,這與上述前人的研究結(jié)果一致。但對于不同的非生物脅迫,基因的表達(dá)模式有明顯差別。如:Ghir_A03G010510、Ghir_A10G012520、Ghir_D10G015270 在干旱脅迫和鹽脅迫處理后,上調(diào)表達(dá);而它們在低溫脅迫、高溫脅迫處理后先下調(diào)表達(dá),在處理后期又上調(diào)表達(dá)。這說明不同的脅迫處理下,基因的表達(dá)具有顯著差異性。對于GR基因在不同處理條件下的調(diào)控方式還需要進(jìn)一步研究。
在全基因組水平鑒定和分析了亞洲棉、雷蒙德氏棉、海島棉、陸地棉中GR基因家族成員特征及潛在功能。發(fā)現(xiàn)GR基因家族在棉屬分化前已存在2 種類型。在異源四倍體棉花中,隨著亞洲棉和雷蒙德氏棉的偶然雜交和隨后的全基因組加倍事件而發(fā)生家族擴(kuò)張。GR基因家族成員在進(jìn)化過程中自身和編碼產(chǎn)物的結(jié)構(gòu)保守,且受到純化選擇的作用。表達(dá)分析顯示GR基因家族成員均參與棉花非生物脅迫應(yīng)答,但其在不同類型的脅迫條件下表達(dá)模式略有差異。棉花GR基因家族的鑒定及分析可為深入解析GR基因功能提供參考,為棉花抗逆育種提供基因資源。