張?jiān)畦惸龋钚旅?,劉德榮,趙小英
(植物功能基因組學(xué)與發(fā)育調(diào)控湖南省重點(diǎn)實(shí)驗(yàn)室(湖南大學(xué) 生物學(xué)院),長沙410082)
植物激素脫落酸(Abscisic acid,ABA)屬于含有15個(gè)碳原子的萜類化合物,其作用貫穿于從種子萌發(fā)到生殖發(fā)育的植物生命周期的多種生理過程[1]:包括種子休眠的建立、胚胎成熟、種子萌發(fā)、根發(fā)育和葉片的衰老等[2]。ABA在干旱、冷、鹽和滲透等非生物脅迫[2],以及抵御病原菌侵害等生物脅迫生理過程中也發(fā)揮作用[3]。環(huán)境脅迫通常導(dǎo)致植物ABA水平的提高,進(jìn)而引起生理學(xué)水平的適應(yīng)性改變,包括氣孔關(guān)閉、生長抑制和基因響應(yīng)等[4-5]。
泛素(Ubiquitin)的主要功能是標(biāo)記需要分解的蛋白使其被水解。泛素介導(dǎo)的蛋白質(zhì)降解途徑是真核生物體內(nèi)最主要的蛋白水解途徑[6]。泛素-蛋白酶體系統(tǒng)(Ubiquitin-proteasome system,UPS)的組成主要包括,泛素活化酶E1、泛素耦聯(lián)酶E2、泛素連接酶E3和26S蛋白酶體[7]。泛素連接酶E3可歸為HECT、RING/U-box、SCF (Skp, Cullin, F-box)復(fù)合體和APC (Anaphase promoting complex)復(fù)合體 4種類型,其中SCF復(fù)合物是最大的一個(gè)家族[8]。SCF復(fù)合體由四個(gè)亞基組成,包括SKP1(擬南芥中為Arabidopsis SKP1-like[ASK])、CUL1、RBX1(RING-BOX1)和F-box蛋白[8]。F-box蛋白作為SCF復(fù)合體的組成部分,通過特異結(jié)合和識(shí)別而介導(dǎo)靶蛋白的降解[9]。
F-box蛋白在植物生長發(fā)育的多種信號(hào)途徑中起重要作用,包括植物激素ABA、赤霉素、乙烯和生長素信號(hào)途徑[10-11]。例如:F-box蛋白FBS1[12]、EDL3[13]和FOA2[14]被證明在ABA信號(hào)通路、擬南芥開花轉(zhuǎn)換過程中具有重要調(diào)控作用。擬南芥基因組中約含有700個(gè)F-box基因[15]。為了進(jìn)一步發(fā)掘ABA信號(hào)通路相關(guān)的F-box基因,本研究采用生物信息學(xué)方法,篩選了受ABA上調(diào)或下調(diào)的擬南芥候選F-box基因。在此基礎(chǔ)上,進(jìn)一步分析了候選基因啟動(dòng)子序列的順式作用元件、候選基因的表達(dá)譜,以及其互作蛋白,為深入研究ABA調(diào)節(jié)植物生長發(fā)育和抗逆的分子機(jī)制提供線索。
以“Abscisic acid”、“Arabidopsis”和“Wildtype”為關(guān)鍵詞,在NCBI(National Center for Biotechnology Information)網(wǎng)站提供的GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/gds/?term=)中進(jìn)行檢索,篩選了5組芯片[16]。其登錄號(hào)(Accession)分別是GSE3454、GSE7112、GSE8955、GSE19520和GSE28800。在挑選芯片數(shù)據(jù)時(shí),僅選取以野生型擬南芥為材料經(jīng)過ABA處理的數(shù)據(jù)。其中GSE19520包括生長5周的Col-0成熟葉片的保衛(wèi)細(xì)胞組織數(shù)據(jù)集(野生型 vs ABA處理),以及生長5周的Col-0葉片組織數(shù)據(jù)集(野生型 vs ABA處理)。GSE3454、GSE7112、GSE8955和GSE28800每組僅有一組數(shù)據(jù)集(野生型 vs ABA處理)。因此,5組芯片共獲取6組數(shù)據(jù)集。
在6組數(shù)據(jù)集中初步篩選受ABA上調(diào)或者下調(diào)的候選F-box基因,具體步驟如下:
(1)利用Excel提供的QUARTILE函數(shù)分別計(jì)算6組數(shù)據(jù)集中基因表達(dá)量的25分位值,排除小于25分位值的基因。
(2)利用GEO數(shù)據(jù)庫自帶的在線分析程序GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)分別求出6組數(shù)據(jù)集的P值和LogFC,篩選P<0.05的差異表達(dá)基因。
(3)分別將6組數(shù)據(jù)集(1)和(2)的篩選結(jié)果取交集;將各交集與所有F-box基因?qū)Ρ龋俅稳〗患?。獲得6組差異表達(dá)F-box基因初篩結(jié)果。
(4)對(duì)6組F-box基因粗篩結(jié)果兩兩取交集,獲得差異表達(dá)候選基因。
在Tair網(wǎng)站(https://www.arabidopsis.org/)檢索差異表達(dá)候選基因的啟動(dòng)子序列(起始密碼子上游1500bp),使用PlantCARE網(wǎng)站(http://bioinformatics.psd.ugent.be/webtools/plantcare/html/)提供的在線分析工具對(duì)啟動(dòng)子序列進(jìn)行分析,并統(tǒng)計(jì)候選基因中存在的相關(guān)順式作用元件,包括ABA、干旱、脅迫、分生組織表達(dá)和光照相關(guān)的順式作用元件[17]。
利用Genevestigator(https://genevestigator.com/gv/)分別分析候選F-box基因在不同組織器官中的表達(dá)情況,在激素(ABA、IAA)、冷、熱、干旱、鹽和不同光照處理?xiàng)l件下的表達(dá)情況,以及在種子萌發(fā)過程中的表達(dá)情況[18]。通過BioGrid數(shù)據(jù)庫(https://thebiogrid.org)搜索候選F-box基因的蛋白互作因子[19]。
將野生型擬南芥Col-0的種子在無菌條件下進(jìn)行表面消毒,即:用70% 的乙醇消毒30 s,然后加入15% bleach消毒3 min。用無菌水清洗5~6次后,播種于1/2MS培養(yǎng)基上,在4 ℃黑暗下低溫處理2 d,然后轉(zhuǎn)到持續(xù)白光下培養(yǎng)14 d。將幼苗取出,在100 μmol ABA溶液中分別浸泡0、1、2、3 h后收集材料(ABA處理前收集樣品的時(shí)間定為0 h)。將材料置于液氮中冷凍,然后保存于-80 ℃冰箱,用于RNA分析。
采用TRIGene試劑(Takara,Japan)抽提總RNA,然后用PrimeScript RT Reagent Kit with gDNA Eraser試劑盒(Takara,Japan)將RNA逆轉(zhuǎn)錄,獲得cDNA。隨后,用SYBR Premix Ex TaqTM試劑盒(Takara,Japan)進(jìn)行實(shí)時(shí)熒光定量PCR實(shí)驗(yàn)。實(shí)時(shí)熒光定量PCR實(shí)驗(yàn)在Mx3000 Real-time PCR系統(tǒng)(Stratagene,The Netherlands)進(jìn)行,反應(yīng)程序?yàn)椋?5 ℃ 5 min,95 ℃ 30 s,58 ℃ 20 s,72 ℃ 30 s,循環(huán)數(shù)為45個(gè)。
PCR的引物為:At1g26930(5’-ATTAATTGTATAATT-TTTTTGTCAGAG-3’和5’-TTACTAGGCAAGAAACA-GTCGGT-3’);At1g80110(5’-CAAAAAGCTGATCA-TATAAAAACAT-3’和5’-CCCTAATTGTATCCTACT-CCTAAA-3’);At2g18910(5’-TACAACAAACCAA-ATGACCAATG-3’和5’-CTTGAGGAAAGTTCTCTT-CAGATG-3’);At3g23880(5’-ATCTTGGATAGAAA-CATTAGGAACA-3’和5’-TACCCAGTTTCAAACAG-CATAAGT-3’);At4g14090(5’-AAGGCTGCTTTGTA-ATGTTAAT-3’和5’-ACGAGGATGAGTAGTGGGT-TT-3’);At5g04010(5’-TCAAGACATCGTCAACGA-ACAG-3’和5’-TGGTGGGAGAAGTCAAGCC-3’);Actin2(5’-CACTGTGCCAATCTACGAGGGT-3’和5’-ACAAACGAGGGCTGGAACAAG-3’)。其中,Actin2為擬南芥持家基因,其表達(dá)水平作為內(nèi)參,用來衡量待測基因的相對(duì)表達(dá)水平。每個(gè)實(shí)驗(yàn)重復(fù)3次。
擬南芥基因組中存在約700個(gè)F-box基因[15]。根據(jù)1.2芯片數(shù)據(jù)分析的方法,對(duì)GEO數(shù)據(jù)庫下載的5組基因芯片中的6組數(shù)據(jù)集進(jìn)行分析,初步篩選獲得38個(gè)受ABA上調(diào)或者下調(diào)的擬南芥候選F-box基因(見表1)。
表1 候選擬南芥F-box基因的統(tǒng)計(jì)Table 1 Statistics of selected Arabidopsis F-box genes
注:候選基因的P值至少在兩組數(shù)據(jù)集中小于0.05。* 為第二輪篩選的用于定量PCR鑒定的6個(gè)基因。這6個(gè)基因的P值至少在2組數(shù)據(jù)集中小于0.001;其LogFC至少在1組數(shù)據(jù)集中大于2.8。
利用PlantCARE分析候選基因的啟動(dòng)子序列,結(jié)果顯示,38個(gè)候選F-box基因的順式作用元件主要為ABA、干旱、脅迫、分生組織表達(dá)和光照相關(guān)的作用元件(見表2)。ABRE是響應(yīng)ABA的順式作用元件[20]。38個(gè)候選F-box基因中,具有不同數(shù)量ABRE元件的基因有13個(gè),其中At3g53000(PP2-A15)基因的啟動(dòng)子中含有5個(gè)ABRE元件。存在干旱響應(yīng)元件的基因有24個(gè);存在脅迫響應(yīng)元件的基因有19個(gè)。這進(jìn)一步說明了這38個(gè)候選基因與ABA的相關(guān)性。此外,存在分生組織表達(dá)響應(yīng)元件的基因有13個(gè);所有38個(gè)候選基因都帶有不同數(shù)量的光響應(yīng)元件。
表2 候選擬南芥F-box基因的響應(yīng)元件Table 2 Motifs of selected Arabidopsis F-box genes
注:* 為第二輪篩選的用于定量PCR鑒定的6個(gè)基因。
實(shí)時(shí)熒光定量PCR可用于鑒定基因的mRNA表達(dá)水平。從篩選到的38個(gè)候選基因中,選擇表達(dá)量改變倍數(shù)最大的6個(gè)F-box基因。在篩選這6個(gè)基因時(shí),選擇5組芯片(包含6組數(shù)據(jù))中改變倍數(shù)大于2的所有F-box基因,并在所有符合標(biāo)準(zhǔn)的基因中,選擇至少在一組芯片中改變倍數(shù)大于5,且在至少兩組芯片中上調(diào)或下調(diào)表現(xiàn)一致的基因。這6個(gè)基因分別是At1g26930,At1g80110,At2g18910,At3g23880,At4g14090和At5g04010。為了更直觀的展示這6個(gè)基因在各個(gè)數(shù)據(jù)集中的情況,通過折線圖列出了各數(shù)據(jù)集中基因的LogFC(見圖1)。
圖1 篩選到的6個(gè)基因在各數(shù)據(jù)集中的LogFCFig.1 LogFC of 6 selected genes in each dataset
為進(jìn)一步確定生物信息學(xué)分析結(jié)果的可靠性,我們采用實(shí)時(shí)熒光定量PCR鑒定了這6個(gè)F-box基因在ABA處理擬南芥中的表達(dá)量。結(jié)果顯示,這6個(gè)F-box基因?qū)ν庠碅BA處理均有響應(yīng)(見圖2),
且表達(dá)量變化趨勢與芯片結(jié)果大體一致。例如,隨ABA處理時(shí)間延長,At1g26930、At1g80110和At5g04010基因的表達(dá)量增加(見圖2(a)、2(b)和2(f)),符合芯片的上調(diào)結(jié)果。在ABA處理0、1、2 h時(shí),At2g18910和At3g23880基因的表達(dá)量表現(xiàn)出下降的趨勢(見圖2(c)、2(d)),符合芯片的下調(diào)結(jié)果。At4g14090在ABA處理后,表達(dá)量下降,但在1、2、3 h表現(xiàn)出表達(dá)量增加的趨勢(圖2 (e)),同樣可以解釋芯片結(jié)果。其中,At2g18910和At3g23880基因在ABA處理2 h時(shí)達(dá)到最低,然后再升高,而At4g14090基因則在ABA 處理1 h時(shí)達(dá)到最低,然后再升高。這可能是由于不同的基因受ABA調(diào)控的模式不完全一致。上述這些基因表達(dá)受ABA調(diào)節(jié)的分析結(jié)果,進(jìn)一步證實(shí)了篩選結(jié)果的可靠性。
利用BioGrid數(shù)據(jù)庫檢索38個(gè)候選F-box蛋白的蛋白互作因子,發(fā)現(xiàn)25個(gè)蛋白存在蛋白互作因子(見表3)。其中,有20個(gè)蛋白與SKP1相互作用,有18個(gè)蛋白與ASK2相互作用。此外,At1g80110編碼蛋白PP2-B11與ABI5相互作用,At5g49980編碼蛋白AFB5與IAA相關(guān)蛋白互作。對(duì)蛋白互作因子的探索可以為今后研究這些基因的功能提供思路。
2.4.1 不同組織器官中的表達(dá)譜分析
為進(jìn)一步了解候選F-box基因在植物特定部位的功能作用。我們利用Genevestigator對(duì)38個(gè)候選F-box基因,在擬南芥不同組織器官中的表達(dá)進(jìn)行了分析。從圖3中可看出,38個(gè)候選基因在保衛(wèi)細(xì)胞中都有表達(dá),其中At1g12710、At1g68050、At2g24540和At5g52120基因的表達(dá)量很高,可能與氣孔的開閉相關(guān)。部分基因如At1g23780、At1g26930、At2g02870、At2g36090和At4g10930基因在種皮中的表達(dá)量較高,包括外種皮、普通種皮、合點(diǎn)端種皮。部分基因如At1g13200、At1g53320、At2g17310、At2g44030、At3g53000和At5g42360在花粉和精子中高表達(dá)。所有38個(gè)候選基因在衰老的葉片中均有表達(dá),其中At1g15670、At2g02360、At2g25490和At4g14090表現(xiàn)為高表達(dá)。這表明了部分候選基因可能參與ABA信號(hào)通路影響植物的生長發(fā)育過程。
表3 候選F-box蛋白的蛋白互作因子Table 3 Interactors of selected F-box protein
2.4.2 不同激素、脅迫和光照條件下及種子萌發(fā)過程中的表達(dá)譜分析
激素之間通??梢孕纬蓮?fù)雜的調(diào)控網(wǎng)絡(luò),同時(shí)環(huán)境信號(hào)的作用,如溫度、脅迫、光等信號(hào)同樣與激素信號(hào)作用密不可分[21]。此外,ABA在促進(jìn)種子休眠的建立和維持、防止早熟種子萌發(fā)、增強(qiáng)干燥種子的耐受性等方面發(fā)揮作用[22]。因此,利用Genevestigator分析了38個(gè)候選F-box基因響應(yīng)激素(ABA、IAA)、脅迫(冷、熱、干旱和鹽)和光照,以及種子萌發(fā)過程中的表達(dá)譜。
從圖4可看出,大部分F-box基因?qū)Ψ治龅募に丶碍h(huán)境因子都有響應(yīng)。在ABA處理的多組實(shí)驗(yàn)中At1g26930、At1g80110和At2g24540基因表達(dá)明顯上調(diào),At1g15670、At2g18910和At3g23880基因表達(dá)則明顯下調(diào)。候選基因?qū)AA的響應(yīng)并不明顯。大多數(shù)基因?qū)囟取⒏珊岛望}脅迫有不同程度的響應(yīng)。除個(gè)別基因外,候選基因?qū)庹盏捻憫?yīng)并不強(qiáng)烈,且對(duì)于藍(lán)光、紅光和遠(yuǎn)紅光的響應(yīng)并無差別。但日照的長度對(duì)部分基因似乎有明顯的影響。在種子萌發(fā)過程中,有更多的基因表現(xiàn)出上調(diào)或下調(diào),且表現(xiàn)出下調(diào)的基因居多。在種子萌發(fā)過程中,如果以干燥種子中的表達(dá)量作為基準(zhǔn),則基因表達(dá)上調(diào)和下調(diào)明顯;如果以吸脹處理后種子中的表達(dá)量為基準(zhǔn),則基因的表達(dá)量變化很小。這說明大多數(shù)基因在種子的吸脹過程中,表達(dá)量發(fā)生巨大的改變。綜上分析結(jié)果,說明大部分候選基因可能通過ABA信號(hào)通路,參與植物種子萌發(fā)以及對(duì)環(huán)境脅迫的應(yīng)答。
圖3 候選F-box基因在擬南芥不同組織中的表達(dá)譜Fig.3 Expression profile of candidate F-box genes in different tissues of Arabidopsis
本研究利用GEO基因芯片數(shù)據(jù),篩選受ABA調(diào)節(jié)的擬南芥F-box基因,初步篩選到38個(gè)差異表達(dá)的F-box基因。通過分析38個(gè)F-box基因的上游啟動(dòng)子序列,發(fā)現(xiàn)候選基因主要存在ABA、干旱、脅迫、分生組織表達(dá)和光照響應(yīng)相關(guān)順式作用元件。其中,13個(gè)基因具有不同數(shù)量的ABA響應(yīng)元件(ABRE),24個(gè)基因存在干旱響應(yīng)元件,19個(gè)基因存在脅迫響應(yīng)元件,表明這些基因可能參與植物響應(yīng)ABA及脅迫信號(hào)。
從38個(gè)候選基因中,篩選表達(dá)量改變倍數(shù)最大的6個(gè)基因,進(jìn)行實(shí)時(shí)熒光定量PCR分析。結(jié)果顯示,在ABA處理?xiàng)l件下,At1g26930、At1g80110和At5g04010表現(xiàn)出明顯上調(diào)趨勢,At2g18910和At3g23880表現(xiàn)出明顯下調(diào)趨勢,與基因芯片中的上調(diào)和下調(diào)結(jié)果相一致。此外,At4g14090在基因芯片分析結(jié)果中,對(duì)ABA的響應(yīng)表現(xiàn)為上調(diào),而在本實(shí)驗(yàn)中則表現(xiàn)為先下調(diào)后上調(diào)。對(duì)此,我們將通過縮短ABA處理的時(shí)間間隔,進(jìn)一步探索該候選基因受ABA調(diào)節(jié)的模式。
本研究選擇的6個(gè)候選基因的啟動(dòng)子中,至少含有ABA、干旱和脅迫相關(guān)響應(yīng)元件中的一種。在擬南芥不同激素或環(huán)境因子的基因表達(dá)譜中,除At4g14090外,其他5個(gè)基因的表達(dá)均受ABA明顯調(diào)節(jié);除At1g26930外,其他5個(gè)基因的表達(dá)量在種子萌發(fā)過程中均顯著改變;并且這6個(gè)基因?qū)Ω珊稻幸欢ǔ潭鹊捻憫?yīng)(見圖4)。說明這6個(gè)基因可能通過ABA信號(hào)通路參與植物種子萌發(fā)和干旱脅迫響應(yīng)過程。
圖4 候選F-box基因在不同激素或環(huán)境因子處理下的表達(dá)譜Fig.4 Expression profile of candidate F-box genes under different hormones or environment factors
通過生物信息學(xué)方法,篩選到了受ABA調(diào)節(jié)的擬南芥F-box基因,并證明了其可靠性。這些基因可能通過ABA信號(hào)通路在植物種子萌發(fā)、生長發(fā)育、衰老以及抗逆境過程中起到重要作用。研究結(jié)果對(duì)探索ABA調(diào)控植物生長發(fā)育和抗逆的分子機(jī)制提供了重要的參考。