宋夢瑤, 趙 樂,2, 董誠明,2, 朱畇昊,2
(1.河南中醫(yī)藥大學(xué)藥學(xué)院,河南鄭州 450046; 2.呼吸疾病診療與新藥研發(fā)河南省協(xié)同創(chuàng)新中心,河南鄭州 450046)
轉(zhuǎn)錄因子是一類參與轉(zhuǎn)錄調(diào)控的蛋白,通過與DNA分子特異性結(jié)合激活或抑制靶基因的轉(zhuǎn)錄活性,從而使目的基因在特定的時間、空間轉(zhuǎn)錄及表達(dá)。SPL(SQUAMOSA promoter-binding protein-like)類轉(zhuǎn)錄因子為植物所特有,能識別并結(jié)合-基因啟動子的SQUAMOSA區(qū)域?;蚣易逅幋a的蛋白質(zhì)序列具有高度保守的SBP結(jié)構(gòu)域,該結(jié)構(gòu)域大約由78個氨基酸殘基組成,包含2個鋅指位點(Zinc finger motif,Zn-1/Zn-2)和1個核定位信號(nuclear localization signal,簡稱NLS)。目前,越來越多的基因家族研究被相繼報道,如擬南芥、水稻、丹參等。研究表明,基因參與植物生長和發(fā)育的調(diào)節(jié),包括植物花和植物表皮毛的發(fā)育、植物脅迫反應(yīng)和次生代謝物的合成等。
紅花(L.)為菊科紅花屬植物,其干燥的管狀花序入藥稱為紅花,廣泛應(yīng)用于中醫(yī)臨床,具有活血通經(jīng)、祛瘀止痛的功效。紅花的籽粒中富含多不飽和脂肪酸——亞油酸和油酸,在食品及中醫(yī)藥有廣泛應(yīng)用。紅花中分離出的羥基紅花黃色素A,是其特有的黃酮類化合物,對心血管類疾病具有顯著的治療效果。近年來,隨著紅花高質(zhì)量參考基因組的公布,利用基因組和生物信息學(xué)手段深入挖掘紅花生長發(fā)育、亞油酸和黃酮的調(diào)控機(jī)制、抵抗生物及非生物脅迫基因,將成為紅花功能基因組學(xué)研究的一個重要方向?;蚣易逶谥参锷L發(fā)育調(diào)控網(wǎng)絡(luò)中起著關(guān)鍵作用,對其進(jìn)行分析具有重要意義。本研究通過對紅花基因家族成員的鑒定以及系統(tǒng)進(jìn)化分析,結(jié)合其在不同組織器官中的表達(dá)模式以及在茉莉酸甲酯(methyl jasmonate,簡稱MeJA)和2,4-表油菜素內(nèi)酯(2,4-epibrassinolide,簡稱EBR)誘導(dǎo)過程中的表達(dá)差異分析,以期深入解析該基因家族的作用機(jī)制,為紅花功能基因組的研究提供候選基因資源。
從紅花基因組數(shù)據(jù)庫(http://safflower.scuec.edu.cn)下載紅花基因組、蛋白序列和注釋文件,從PFAM數(shù)據(jù)庫下載SBP結(jié)構(gòu)域的HMMER文件,從紅花基因組中提取具有SBP結(jié)構(gòu)域的蛋白序列。利用 NCBI CDD在線預(yù)測 SBP蛋白結(jié)構(gòu)域,除去無典型結(jié)構(gòu)域、結(jié)構(gòu)不完整和冗余序列。進(jìn)而利用ProtParam (http://us.expasy.org/tools/protparam.html)進(jìn)行紅花SPL蛋白理化性質(zhì)分析,利用SOPMA (https://prabi.ibcp.fr/htm/site/web/home)預(yù)測二級結(jié)構(gòu),用WoLF PSORT (https://wolfpsort.hgc.jp/)分析亞細(xì)胞定位。
使用DNAMAN9.0軟件對紅花SBP保守結(jié)構(gòu)域進(jìn)行多序列比對分析,并將21個紅花CtSPL蛋白序列和下載于TAIR數(shù)據(jù)庫(https://www.arabidopsis.org/)的擬南芥AtSPL蛋白序列以及下載于PlantTFDB數(shù)據(jù)庫(http://planttfdb.gao-lab.org/)的毛果楊PtSPL蛋白序列用于系統(tǒng)進(jìn)化分析。使用MEGA7采用鄰近法構(gòu)建系統(tǒng)發(fā)育樹,Bootstrap設(shè)置為10000,其余參數(shù)為默認(rèn)值。使用Evolview (https://www.evolgenius.info/evolview/)在線軟件進(jìn)行后期美化。
運(yùn)用MapChart2.32軟件根據(jù)紅花基因組注釋文件繪制紅花基因的染色體定位圖。從基因組注釋文件中獲取紅花的基因結(jié)構(gòu)注釋信息,同時通過MEME在線軟件(http://meme-suite.org/tools/meme)分析家族成員的保守序列。最后用TBtools軟件將結(jié)果可視化。
利用TBTools軟件,從紅花基因組數(shù)據(jù)庫中提取紅花基因起始密碼子上游1.5 kb作為啟動子區(qū)域,將所有紅花基因的啟動子序列提交到PlantCARE數(shù)據(jù)庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預(yù)測順式作用元件。使用 MCScanX軟件對紅花基因組內(nèi)的基因以及紅花與擬南芥、向日葵基因組之間的基因進(jìn)行共線性分析,用Circos 軟件(http://circos.ca)繪制基因組內(nèi)和基因組間的共線性圖譜。
在PmiREN數(shù)據(jù)庫(https://www.pmiren.com/)中下載紅花全部的miRNA成熟序列,使用psRNATarget (http://plantgrn.noble.org/)對紅花基因編碼區(qū)的miRNA結(jié)合位點進(jìn)行預(yù)測,利用Cytoscape軟件將預(yù)測結(jié)果可視化。
從NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov)分別下載紅花3個組織:種子、葉、花瓣(PRJNA76135)上傳于2011年10月29日以及茉莉酸甲酯處理(PRJNA561476) 上傳于2019年8月22日、表油菜素內(nèi)酯處理(PRJNA628030)上傳于2020年4月25日的高通量測序原始數(shù)據(jù),利用NCBI SRA Toolkit將測序數(shù)據(jù)sra文件轉(zhuǎn)換為fastq文件,利用轉(zhuǎn)錄組定量工具Kallisto計算TPM值,將其作為基因表達(dá)量。
根據(jù)紅花基因在11條染色體上的位置分布,將其分別命名為~。對21個CtSPL蛋白進(jìn)行理化性質(zhì)分析(表1),結(jié)果表明CtSPL蛋白序列長度介于147~1 078 aa之間;相對分子量范圍為16.58~118.74 ku;等電點為 6.43~10.74,其中有19個CtSPL蛋白的等電點大于7,為典型的堿性蛋白;亞細(xì)胞定位結(jié)果顯示,CtSPL蛋白大多定位于細(xì)胞核;二級結(jié)構(gòu)預(yù)測結(jié)果表明,CtSPL蛋白組成結(jié)構(gòu)相似,以無規(guī)則卷曲、α螺旋為主要組成部分。
使用DNAMAN軟件對21個CtSPL蛋白的保守結(jié)構(gòu)域進(jìn)行多序列比對分析,結(jié)果見圖1,大部分CtSPL蛋白均具有完整且保守的SBP結(jié)構(gòu)域,該結(jié)構(gòu)域一般具有2個鋅指結(jié)構(gòu)(Zn-1和Zn-2)和1個核定位信號(NLS),N端Zn-1結(jié)構(gòu)除CtSPL20蛋白外其他成員均為 Cys-Cys-Cys-His (C3H)型,CtSPL20蛋白Zn-1結(jié)構(gòu)為Cys-Cys-Cys-Cys (C4)型;C 端Zn-2結(jié)構(gòu)為 Cys-Cys-His-Cys (C2HC)型,CtSPL1、CtSPL8、CtSPL10、CtSPL19、CtSPL21蛋白Zn-2結(jié)構(gòu)有部分缺失或突變;核定位信號與Zn-2結(jié)構(gòu)有4個氨基酸殘基重合,CtSPL1、CtSPL16蛋白核定位信號末端變異。
為了解紅花基因家族各成員的進(jìn)化關(guān)系,選取紅花、擬南芥、毛果楊基因家族各蛋白序列進(jìn)行聚類分析,如圖2所示,62個SPL蛋白可分為6個亞家族。Ⅰ亞家族包含的SPL成員最多,為21個,其中CtSPL蛋白8個,其次是Ⅳ亞家族共有SPL成員12個,CtSPL蛋白2個,Ⅴ亞家族共有SPL成員9個,CtSPL蛋白3個,Ⅱ亞家族共有SPL成員8個,CtSPL蛋白2個, Ⅲ亞家族共有SPL成員8個,CtSPL蛋白5個,Ⅵ亞家族共有SPL成員4個,CtSPL蛋白1個。
表1 紅花CtSPL基因家族蛋白的理化性質(zhì)
根據(jù)紅花基因組信息,繪制基因在紅花染色體上的位置信息,由圖3可知,21個基因不均勻分布在11條染色體上,其中4號染色體上基因數(shù)目最多,為5個;其次是2、9號染色體均有3個;6、7、11號染色體均有2個;而1、5、10、12號染色體只有1個。
TBtools可視化結(jié)果顯示,親緣關(guān)系較為相近的成員具有相似的保守基序和基因結(jié)構(gòu)(圖4)?;蚣易宓谋J豐BP結(jié)構(gòu)域含有2個鋅指結(jié)構(gòu)、1個核定位信號,除CtSPL1、CtSPL8、CtSPL10、CtSPL16、CtSPL21外,其余成員均含有完整的SBP結(jié)構(gòu)域motif1 (Zn-1)、motif2 (Zn-2)、motif3 (NLS)且位置較為固定。紅花SPL蛋白還存在其他基序,如motif4、motif8、motif10僅存在于I亞家族,motif5僅存在于Ⅳ、Ⅴ亞家族,motif9僅存在于Ⅳ亞家族,motif6存在于Ⅰ亞家族的CtSPL2、CtSPL8、CtSPL10、CtSPL13、CtSPL17、CtSPL21,Ⅲ亞家族的CtSPL7以及V亞家族CtSPL11,motif7存在于Ⅱ、Ⅴ亞家族以及Ⅰ亞家族的CtSPL2、CtSPL8、CtSPL12、CtSPL13、CtSPL17、CtSPL21。
基因結(jié)構(gòu)圖顯示,所有基因都至少含有2個外顯子, 外顯子數(shù)目分布在2~12個之間,內(nèi)含子數(shù)目分布在1~12個之間。不同亞家族所含的外顯子數(shù)量差異較大,同一亞家族的外顯子數(shù)量較為穩(wěn)定。CtSPL4所具有的外顯子、內(nèi)含子數(shù)量最多,均為12個,、、、具有的外顯子、內(nèi)含子數(shù)量最少,具有2個外顯子和1個內(nèi)含子。
對基因啟動子區(qū)段順式作用元件進(jìn)行預(yù)測分析發(fā)現(xiàn),啟動子區(qū)順式作用元件主要可分為4個大類:光響應(yīng)元件、脅迫響應(yīng)元件、激素應(yīng)答元件、生長發(fā)育響應(yīng)元件(圖5)。其中光響應(yīng)元件最多,共有17種,包括G-Box、Box 4、GT1-motif、TCT-motif、I-box等。脅迫響應(yīng)元件主要有厭氧誘導(dǎo)(ARE)、防御與應(yīng)激(TC-rich repeats)、干旱誘導(dǎo)(MBS)、低溫響應(yīng)(LTR)、損傷響應(yīng)(WUN-motif)等6種。激素應(yīng)答元件有8種,其中脫落酸響應(yīng)元件(ABRE)共有75個,除、、、外均有分布,說明大部分基因可能響應(yīng)了紅花體內(nèi)的脫落酸信號。其他激素相關(guān)的順式作用元件,如茉莉酸甲酯(CGTCA-motif和TGACG-motif)、生長素(TGA-element)、水楊酸(TCA-element)等也廣泛分布。生長發(fā)育響應(yīng)元件有7種,包括分生組織表達(dá)調(diào)控(CAT-box)、晝夜節(jié)律調(diào)控(Circadian)、胚乳表達(dá)調(diào)控(GCN4-motif)等。
為了闡明紅花基因家族的潛在進(jìn)化機(jī)制,筆者所在課題組研究了它的復(fù)制事件,但沒有發(fā)現(xiàn)串聯(lián)重復(fù)和大片段復(fù)制(圖6-A)。
為了進(jìn)一步研究紅花基因家族的系統(tǒng)進(jìn)化機(jī)制,筆者所在課題組構(gòu)建了紅花與向日葵、擬南芥基因組之間基因的共線性圖譜(圖6-B),共鑒定出10個基因與向日葵存在共線性關(guān)系:、、、、、、、、、。5個基因與擬南芥存在共線性關(guān)系:、、、、。研究結(jié)果表明,紅花與擬南芥之間的直系同源基因?qū)h(yuǎn)小于紅花與向日葵之間,這可能與紅花與向日葵親緣關(guān)系更近有關(guān),基因在同科植物之間的保守性較高。通過共線性分析可以從已知擬南芥的基因功能,推斷紅花中相應(yīng)基因的功能。
利用psRNATarget在線軟件對下載的紅花miRNA成熟序列和的cDNA序列進(jìn)行分析,預(yù)測可能調(diào)控基因的miRNA, 期望值設(shè)置為3.5,其他為默認(rèn)參數(shù)(圖7)。中有15個基因受miRNA調(diào)控,參與調(diào)控的miRNA主要是miR156家族,其次是miR157家族,而miRN525、miRN560、miRN566分別只調(diào)控、、基因的表達(dá)。
利用NCBI公開的轉(zhuǎn)錄組數(shù)據(jù),分析基因在不同組織、不同激素誘導(dǎo)下的表達(dá)特性。如圖8-A所示,大多數(shù)基因均存在組織特異性表達(dá)差異。、的表達(dá)量在3個組織中均較高,在葉片中的表達(dá)量最高。部分基因僅在1個或2個組織中特異表達(dá),如、基因只在葉片中表達(dá);、、基因只在花瓣中表達(dá)。總之家族基因具有多樣化組織表達(dá)。
經(jīng)茉莉酸甲酯處理后(圖8-B),基因的表達(dá)被誘導(dǎo),其他還有11個基因的表達(dá)量上調(diào),其中、、、表達(dá)量的上調(diào)最為明顯,分別為對照組的101.71、45.20、19.19、15.25倍。共有9個基因在茉莉酸甲酯處理后表達(dá)量下調(diào),其中處理后的表達(dá)量僅為對照組的8.85%。
前人收集紅花種子在MS 培養(yǎng)基(對照)和包含1 μmol/L EBR處理的MS 培養(yǎng)基上生長2周后幼苗的葉,用于后續(xù)轉(zhuǎn)錄組測序。如圖8-C所示,表油菜素內(nèi)酯處理后大部分基因的表達(dá)量都呈現(xiàn)上升趨勢,其中4個基因的表達(dá)量均上調(diào)為對照組5倍以上,分別為、、、。然而,、在表油菜素內(nèi)酯處理后表達(dá)量均下調(diào)。
綜上所述,基因的組織特異性表達(dá)可能和各個基因在不同組織中發(fā)揮的功能有關(guān)。、、、、、、等基因可能參與茉莉酸甲酯、表油菜素內(nèi)酯等激素的調(diào)控,從而發(fā)揮多種生物學(xué)功能。
隨著高通量測序技術(shù)的飛速發(fā)展, 目前已完成了紅花基因組的全長測序,為紅花的分子生物學(xué)研究奠定了基礎(chǔ)。本研究從紅花基因組中鑒定出21個基因家族成員,比棉花(59個)、煙草(32個)、白菜(29個)數(shù)目少,比水稻(19個)、高粱(19個)、擬南芥(16個)等數(shù)目多,表明基因家族成員在不同的物種中具有一定的數(shù)目變異,從而導(dǎo)致了基因功能的多樣化。對CtSPL蛋白結(jié)構(gòu)域進(jìn)行分析,發(fā)現(xiàn)有部分CtSPL在進(jìn)化過程中發(fā)生變異或缺失,導(dǎo)致鋅指結(jié)構(gòu)或核定位信號保守性不高。筆者所在課題組將紅花與向日葵、擬南芥基因組進(jìn)行基因共線性分析,結(jié)果顯示,紅花基因與擬南芥、向日葵基因之間分別存在5、10個共線性基因?qū)?,、分別在與向日葵、擬南芥共線性組間均鏈鎖了2個基因?qū)Γ砻?、可能是家族中較為保守的基因,其在進(jìn)化過程中發(fā)揮著重要作用。通過共線性分析可以從已知擬南芥的基因功能,推斷紅花中相鏈鎖的基因的功能。
對家族成員的miRNA靶基因預(yù)測結(jié)果顯示,其主要受miR156家族的調(diào)控。miR156 是植物小RNA家族中表達(dá)豐度最大的家族,也是開花植物發(fā)育轉(zhuǎn)變的主要調(diào)節(jié)因子。在擬南芥中,miR156-SPL10通過介導(dǎo)細(xì)胞分裂素反應(yīng),控制根分生組織活性和根源新生芽再生。Ding等認(rèn)為,miR156-可以通過抑制下游相關(guān)熱響應(yīng)基因來適應(yīng)環(huán)境溫度變化。Zhang等發(fā)現(xiàn),茶樹中miR156的2個靶基因、對低溫敏感,可能參與低溫脅迫響應(yīng)過程。Kouhi等結(jié)果表明,miR156的表達(dá)量在干旱脅迫的植株葉片中降低,因此推測,紅花幼苗在長期受到輕度干旱脅迫時,miR156-可以使植株繼續(xù)存活并提高開花率。熱脅迫導(dǎo)致miR156表達(dá)增加,而葉片和根中基因下調(diào),表明miR156可通過加速基因的裂解,從而調(diào)節(jié)紅花中的應(yīng)激反應(yīng)。miR156-不僅參與植物的開花調(diào)控,同時具有介導(dǎo)植物生育階段轉(zhuǎn)變、調(diào)節(jié)植物次生代謝、參與植物光信號轉(zhuǎn)導(dǎo)和脅迫響應(yīng)等作用。本研究發(fā)現(xiàn),共有12個基因可能受到不同的miR156成員調(diào)控,這為進(jìn)一步探索miR156-SPL模塊在紅花中的功能提供了參考。
基因的組織表達(dá)模式可能與其功能特征相關(guān),而基因在不同植物組織中表達(dá)差異顯著。桃多數(shù)成員在幼果中表達(dá)量較高;不同龍眼成員在體胚發(fā)育不同階段表達(dá)量有明顯差異。本研究對基因在紅花不同組織表達(dá)特性進(jìn)行分析發(fā)現(xiàn),成員具有不同的表達(dá)特性,同一亞家族表達(dá)模式相似。其中Ⅳ亞家族的、的表達(dá)量在3個組織中均較高,且在花瓣中最高。Ⅰ亞家族的、基因只在花瓣中表達(dá),而同一亞家族的擬南芥和被證明參與擬南芥開花過程的調(diào)控,因此,推測紅花中的這些同源基因,可能參與了紅花花器官調(diào)控的相關(guān)功能。MeJA在植物脅迫響應(yīng)、生長發(fā)育以及次生代謝中發(fā)揮著重要的作用。本研究中,、、、等4個成員的表達(dá)量經(jīng)MeJA處理后均大幅度上調(diào),且在順式作用原件分析中發(fā)現(xiàn),、均含有MeJA的應(yīng)答元件,進(jìn)一步說明能夠應(yīng)答MeJA信號。表油菜素內(nèi)酯對提高植物的抗逆性:抗旱性、抗冷抗寒性、抗熱性、抗鹽性、抗藥性、抗毒性以及對植物衰老的調(diào)節(jié)具有重要的作用。本研究發(fā)現(xiàn),EBR處理后部分基因的表達(dá)量發(fā)生了顯著的變化,說明其能響應(yīng)油菜素內(nèi)酯信號途徑,從而參與EBR介導(dǎo)的植物抗逆性的調(diào)節(jié)等生理功能。