蔣正寧,劉大同,張 曉,江 偉,王 玲,李東升,程曉明, 高德榮
(江蘇里下河地區(qū)農(nóng)業(yè)科學(xué)研究所/農(nóng)業(yè)部長(zhǎng)江中下游小麥生物與遺傳改良重點(diǎn)實(shí)驗(yàn)室,江蘇揚(yáng)州 225007)
DNA甲基化是生物體內(nèi)一種重要的表觀遺傳修飾手段,在高等真核生物中,DNA 甲基化發(fā)生于胞嘧啶第五位碳原子上形成 5-甲基胞嘧啶(5-methylcytosine,5-meC)[1],DNA甲基化狀態(tài)是由甲基化建立、維持和主動(dòng)去甲基化動(dòng)態(tài)調(diào)節(jié)的結(jié)果[2],而DNA 去甲基化則是 DNA 甲基化的相反過(guò)程,即 5-甲基胞嘧啶被未修飾的胞嘧啶替代的過(guò)程[3]。在植物中,DNA 去甲基化包括 DNA 主動(dòng)去甲基化和被動(dòng)去甲基化2 種類型:被動(dòng)的去甲基化,是由于 DNA 復(fù)制過(guò)程中甲基轉(zhuǎn)移酶活性的喪失或甲基供體的缺乏導(dǎo)致甲基化無(wú)法維持,從而使整個(gè)基因組 DNA 甲基化水平降低;DNA 主動(dòng)去甲基化,則不依賴于DNA復(fù)制,即通過(guò)5-甲基胞嘧啶 DNA 糖基化酶作用,直接去除 DNA 中甲基化的胞嘧啶[4]。DNA去甲基化不僅對(duì)于全基因組表觀遺傳重編程至關(guān)重要,在植物發(fā)育過(guò)程中還介導(dǎo)轉(zhuǎn)錄因子或基因座特異性基因激活[4]。目前,普遍認(rèn)為DNA去甲基化的機(jī)制有 5 種:依賴DNA 去甲基化酶的堿基切除修復(fù)機(jī)制、堿基切除修復(fù)、甲基胞苷脫氨基耦合G/T 的錯(cuò)配切除修復(fù)、水解作用去甲基化以及氧化去甲基化[5]。在所有的機(jī)制中DNA的去甲基化是通過(guò)DNA去甲基化酶(dMTase)實(shí)現(xiàn)的,DNA去甲基化酶含有最保守的DNA 糖苷酶(HhH-GPD)結(jié)構(gòu)域,具有糖基化酶和脫嘌呤裂合酶活性的雙功能。
目前,在植物中已鑒定6種dMTase,包括轉(zhuǎn)葡萄糖基酶 DME ( demeter) 、 沉默抑制因子 ROS1 (repressor of silencing 1), 以及 類轉(zhuǎn)葡萄糖基酶蛋白 DML2(demeter-like protein 2) 、DML3、DML4和類轉(zhuǎn)葡萄糖基酶DML5[6]。研究表明ROS1和DML在所有的營(yíng)養(yǎng)組織中表達(dá),包括根和莖的組織,而DME主要在種子發(fā)育中表達(dá)[7]。在擬南芥中,DME是孢子體發(fā)育所必需,并在孢子體生命周期中維持干細(xì)胞活動(dòng)起著至關(guān)重要的作用[8]。此外,ROS1和DME也參與調(diào)控水稻[9]和大麥的種子發(fā)育[10]。最近,3個(gè)水稻dMTase基因(DNG702、DNG701和DNG704)被證實(shí)可以對(duì)配子體和合子細(xì)胞的DNA去甲基化,是合子基因表達(dá)和發(fā)育所必需[11];番茄DNA去甲基化酶基因SlDML2與其果實(shí)成熟過(guò)程中DNA甲基化水平普遍降低密切相關(guān)[12]。上述研究表明,dMTase對(duì)植物合子發(fā)育和果實(shí)成熟起到重要的調(diào)控作用。
此外,植物的生物或非生物應(yīng)激反應(yīng)也需要DNA主動(dòng)去甲基化的調(diào)控。例如,擬南芥可以通過(guò)ROS1對(duì)RMG1和RLP43基因啟動(dòng)子的去甲基化激活抗病反應(yīng)[13],而其DNA 去甲基酶三重突變體rdd(ros1/dml2/dml3)對(duì)鐮刀形孢菌表現(xiàn)高度敏感[14];在水稻中,鹽敏感品種IR29在鹽脅迫下誘導(dǎo)dMTase基因(DNG701和DNG710)表達(dá)[15];而在煙草中過(guò)表達(dá)AtROS1,則增加了類黃酮生物合成途徑相關(guān)基因和抗氧化途徑相關(guān)基因的去甲基化水平,激活了這類抗逆基因的表達(dá),從而導(dǎo)致鹽脅迫耐受性提高[16];此外,DNA去甲基化也在植物熱和干旱脅迫反應(yīng)的調(diào)控中發(fā)揮作用[17-18]??梢钥闯?DNA去甲基化酶基因在調(diào)節(jié)植物的各類生物學(xué)過(guò)程中發(fā)揮重要作用。
目前,DNA去甲基化酶(dMTase)基因在很多物種中被廣泛鑒定和分析,這些物種中dMTase 的數(shù)量、保守性、多態(tài)性和功能都存在很大差異。作為重要糧食作物的小麥dMTase基因家族成員尚未被鑒定。本研究基于小麥全基因組測(cè)序數(shù)據(jù),利用生物信息學(xué)方法對(duì)小麥dMTase基因家族進(jìn)行了全基因組鑒定,分析小麥dMTase基因核苷酸及編碼蛋白的特性及其組織特異性表達(dá)模式,并通過(guò)轉(zhuǎn)錄組測(cè)序及qRT-PCR方法分析小麥dMTase基因在籽粒發(fā)育中的表達(dá)特征,為進(jìn)一步解析小麥dMTase基因功能研究奠定基礎(chǔ)。
從Ensembl Plants數(shù)據(jù)庫(kù) (http://plants.ensembl.org/index thml )下載小麥蛋白序列數(shù)據(jù)、基因組序列和注釋文件,并建立本地?cái)?shù)據(jù)庫(kù)。以已知的擬南芥[14]和水稻[19]dMTase基因家族成員蛋白序列作為query 序列,與小麥的蛋白序列進(jìn)行本地BlastP比對(duì),篩選閾值設(shè)為E 利用ExPASy 網(wǎng)站(http://expasy.org/)對(duì)小麥dMTase氨基酸序列進(jìn)行等電點(diǎn)、分子量預(yù)測(cè)等理化性質(zhì)分析;利用Plant-mPLoc(http://www.csbio.sjtu.edu.cn),對(duì)小麥dMTase進(jìn)行亞細(xì)胞定位分析;根據(jù) CDD(https://www.ncbi.nlm.nih.gov/cdd/)所提供的家族成員所含結(jié)構(gòu)域起始位點(diǎn)整理結(jié)構(gòu)域氨基酸序列。利用MEME (http://meme-suite.org/tools/meme) 在線預(yù)測(cè)dMTase家族蛋白的保守motif,最大發(fā)現(xiàn)數(shù)設(shè)為12個(gè),其他參數(shù)設(shè)為默認(rèn)值。使用TBtools[20]軟件對(duì)結(jié)構(gòu)域及保守motif位點(diǎn)進(jìn)行可視化顯示。 從Ensembl Plants數(shù)據(jù)庫(kù)中下載擬南芥和水稻dMTase的氨基酸序列,使用Clustal W 軟件進(jìn)行dMTase同源蛋白的氨基酸序列比對(duì)。利用MEGA 11(https://www.megasoftware.net/)軟件構(gòu)建系統(tǒng)進(jìn)化樹,選擇鄰接法( Neighbor-joining ),bootstrap 方法重復(fù)采樣1 000次,其余參數(shù)默認(rèn),參考擬南芥和水稻 dMTase基因家族的亞族分類結(jié)果對(duì)小麥dMTase 基因家族進(jìn)行亞族分類,并依據(jù)小麥dMTase染色體位置進(jìn)行基因命名。利用ITOL(https://itol.embl.de)在線軟件對(duì)進(jìn)化樹進(jìn)行美化處理。 從Ensembl Plants數(shù)據(jù)庫(kù)中下載的小麥基因信息gff3文件中提取dMTase基因染色體位置和基因結(jié)構(gòu)信息,利用GSDS 2.0( http://gsds.cbi.pku.edu.cn )分析小麥 dMTase基因的外顯子和內(nèi)含子分布模式。從相同數(shù)據(jù)庫(kù)中下載小麥基因組(DNA)數(shù)據(jù),利用TBtools 軟件截取小麥dMTas基因起始密碼子上游2 000 bp的DNA序列,利用Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html)工具分析啟動(dòng)子順式作用元件種類、數(shù)目及功能,并使用 TBtools 軟件進(jìn)行可視化。 根據(jù)小麥基因組注釋gff3文件獲取dMTase基因家族成員的染色體位置信息,利用TBtools 軟件的MCScanX工具計(jì)算并獲取小麥dMTase共線性及基因的串聯(lián)重復(fù)信息,并進(jìn)行對(duì)小麥基因的染色體位置信息、共線性關(guān)系、串聯(lián)重復(fù)信息進(jìn)行可視化。利用TBtools軟件計(jì)算直系同源基因間的同義替換率(Ks) 和非同義替換率(Ka)。通過(guò)Ka/Ks 值來(lái)評(píng)估小麥dMTase 基因在進(jìn)化過(guò)程中受到的選擇壓力影響,Ka/Ks>1、<1或=1分別表示復(fù)制基因?qū)κ艿秸蜻x擇、純化選擇和中性進(jìn)化的影響。 從Wheat Exp數(shù)據(jù)庫(kù)(http://www.wheat-expression.com) 檢索小麥RNA-Seq數(shù)據(jù),用TPM(transcripts per million reads)值LogScale標(biāo)準(zhǔn)化后評(píng)估小麥基因的轉(zhuǎn)錄本豐度值。用TBtools軟件繪制小麥TadMTase基因表達(dá)熱圖。 表1 熒光定量分析引物Table 1 Primers used forreal-time PCR 以7個(gè)擬南芥和8個(gè)水稻dMTase蛋白為參考序列,結(jié)合BlastP和HMM 模型Pfam(PF00730)HMMER3.0兩種方法搜索小麥dMTase蛋白序列,之后進(jìn)行序列比對(duì),去除冗余序列后合并,利用Pfam和SMART結(jié)構(gòu)域搜索檢驗(yàn)候選基因是否含有ENCO3c結(jié)構(gòu)域(ENCO3c包含 HhH-GPD),最終在小麥基因組中共鑒定出18個(gè)候選基因,并根據(jù)系統(tǒng)進(jìn)化關(guān)系和其染色體位置進(jìn)行命名。在ExPASy數(shù)據(jù)庫(kù)中對(duì)小麥所有dMTase蛋白序列進(jìn)行理化性質(zhì)預(yù)測(cè)分析,結(jié)果(表2)表明,小麥dMTase基因家族蛋白氨基酸長(zhǎng)度為276 ~1 982個(gè)aa,分子量為30.7~ 218.4 kDa。蛋白等電點(diǎn)為6.0 ~ 9.7,均值為7.48,預(yù)測(cè)大部分為中性蛋白;小麥 dMTase蛋白不穩(wěn)定系數(shù)均大于 40,為不穩(wěn)定蛋白;蛋白親水性(GRAVY)分析顯示小麥所有 dMTase 蛋白都是親水性蛋白。亞細(xì)胞定位預(yù)測(cè)表明,小麥dMTase基因編碼蛋白均定位于細(xì)胞核中(表2)。 將檢索到的 18個(gè)小麥dMTase基因的蛋白序列,與已知的7個(gè)擬南芥dMTase基因[AtDML5b(AT1G05900.1)、AtDML5a(AT2G31450.1)、AtROS1(AT2G36490.1)、AtDML2(AT3G10010.1)、AtDML4(AT3G47830.1)、AtDML3(AT4G34060.3)、AtDME(AT5G04560.1)]和8 個(gè)水稻 dMTase 基因[OsROS1a(Os01g11900.1)、OsROS1d(Os02g29230.1)、OsDML3a(Os02g29380.1)、OsDML3b(Os04g28860.1)、OsROS1b(Os05g37350.1)、OsROS1c(Os05g37410.1)、OsDML4(Os06g13070.1)、OsDML5(Os11g16580.1)]共計(jì)33 個(gè)dMTase基因的蛋白序列進(jìn)行比對(duì),并構(gòu)建系統(tǒng)進(jìn)化樹?;谒綩sdMTase分類,將小麥18個(gè)dMTase歸屬于ROS1、DML3、DML4和DML5等 4個(gè)亞家族。其中ROS1最多,包含9個(gè)dMTase基因,其他亞家族各有3個(gè)(圖1A)。利用 CDD 對(duì)TadMTase進(jìn)行保守結(jié)構(gòu)域分析,結(jié)果(圖1B)表明,所有的TadMTase均含有ENCO3c保守結(jié)構(gòu)域,ENCO3c結(jié)構(gòu)域行使糖苷酶功能是dMTase 特異性結(jié)構(gòu)域。TadMTase不同亞族所包含的保守結(jié)構(gòu)域種類不同,ROS1和DML3亞族包含3 個(gè)共同保守結(jié)構(gòu)域:ENCO3c(包含 HhH-GPD domain)、FES以及RRM_DME結(jié)構(gòu)域。其中小麥TaROS1a-5A/B與擬南芥AtROS1、水稻OsROS1a的ROS1亞家族還包含了一個(gè)介導(dǎo) DNA 結(jié)合活性的Perm-CXXC 結(jié)構(gòu)域。而DML5包含ENCO3c和FES 2個(gè)結(jié)構(gòu)域和DML4僅包含1個(gè) ENCO3c結(jié)構(gòu)域。 圖1 TadMTase 進(jìn)化樹(A)和保守結(jié)構(gòu)域(B)分析 小麥18個(gè)DNA去甲基化酶的motif分析如圖2A所示,小麥DNA去甲基化酶基因包含了12個(gè)motif結(jié)構(gòu),但不同亞族的所擁有的Motif不同,與其保守結(jié)構(gòu)域一致。如ROS1亞家族的motif組成相同,包含motif 1、2、3、5、6、7、9 、10和11共9個(gè)保守motif,組成ENDO3c、FES、Perm-CXXC、RRM_DME 結(jié)構(gòu)域,其中motif1、6、7和9共同構(gòu)成一個(gè)保守的ENDO3c糖苷酶結(jié)構(gòu)域。而DML3亞家族包含7個(gè)motif,分別是motif 1、2、3、5、7、9和11,它們構(gòu)成了ENDO3c、FES和RRM_DME結(jié)構(gòu)域;DML4亞家族僅包含2個(gè)motif結(jié)構(gòu),分別是motif 1和7,它們構(gòu)成了ENDO3c結(jié)構(gòu)域;DML5亞家族包含4個(gè)motif結(jié)構(gòu),即motif1、2和9構(gòu)成了ENDO3c和FES結(jié)構(gòu)域。 圖2 TadMTase 基因家族保守基序(A)和基因結(jié)構(gòu)(B) 為進(jìn)一步闡明小麥TadMTase基因的結(jié)構(gòu)特征,利用 GSDS 2.0研究基因的外顯子-內(nèi)含子結(jié)構(gòu),分析顯示TadMTase亞組間基因結(jié)構(gòu)差異較大,其中ROS1包含18~22個(gè)外顯子(圖 2B),DML3包含17個(gè)外顯子,DML5包含13個(gè)外顯子,而DML4只包含4個(gè)外顯子。這與已報(bào)道的植物dMTase基因結(jié)構(gòu)相似,進(jìn)一步說(shuō)明雖不同物種在進(jìn)化過(guò)程中發(fā)生了分化事件,但其同源基因在分化后仍具有相似結(jié)構(gòu),進(jìn)一步說(shuō)明dMTase家族具有其保守性。 利用 Plant CARE 數(shù)據(jù)庫(kù)對(duì)18個(gè)TadMTase基因上游2 000 bp 順勢(shì)作用調(diào)控元件分析,共預(yù)測(cè)出34種CREs順式作用元件(圖3A)。這些CREs除了2 種傳統(tǒng)的啟動(dòng)子元件(TATA-box,CAAT-box)外,其余32種 CREs大致可以分為4組:植物生長(zhǎng)發(fā)育、植物激素響應(yīng)、光響應(yīng)以及脅迫響應(yīng)相關(guān)的作用元件(圖3B)。所有已鑒定的小麥TadMTase基因啟動(dòng)子CREs位點(diǎn)共有460個(gè),其中以光反應(yīng)因子最多163個(gè)(35.43%),其次是激素反應(yīng)因子144個(gè)(31.4%)、植物發(fā)育相關(guān)因子77個(gè)(16.74%)和脅迫反應(yīng)因子76個(gè)(16.52%)。在TadMTase啟動(dòng)子中發(fā)現(xiàn)了10種光響應(yīng)型CREs,其中,G-box 和sp1 CREs較多,普遍存在于TadMTase啟動(dòng)子,且拷貝數(shù)較多。參與激素信號(hào)轉(zhuǎn)導(dǎo)的CREs包括生長(zhǎng)素應(yīng)答(TGA-box)、脫落酸反應(yīng)(ABRE)、茉莉酸甲酯反應(yīng)(CGTCA-motif 和 TGACG-motif)、赤霉素反應(yīng)(GARE-motif 和 P-box)和水楊酸反應(yīng)(TCA-element)元件。在這些CREs中ABRE、CGTCA、TGACG和TGA基序最為普遍。 TadMTase啟動(dòng)子還具有多種應(yīng)激反應(yīng)調(diào)控元件,如參與低溫應(yīng)激的 LTR,參與干旱誘導(dǎo)的MBS,涉及防御和應(yīng)激反應(yīng)的 TC-rich repeats以及響應(yīng)厭氧誘導(dǎo)的 ARE 調(diào)控元件。另外,還確定了一些組織特異性的順式調(diào)控元件,例如參與胚乳特異性表達(dá)所需的 GCN4_motif 和胚乳負(fù)調(diào)控相關(guān)的AACA_motif,以及與分生組織特異性激活有關(guān)的 CAT-box。此外,還發(fā)現(xiàn)參與玉米蛋白代謝調(diào)控的O2-site??傊?小麥TadMTase啟動(dòng)子中最常見的順式調(diào)節(jié)元件主要與生理過(guò)程有關(guān),例如光信號(hào)、激素響應(yīng)和生長(zhǎng)發(fā)育。 利用小麥基因組注釋信息,對(duì)18個(gè)小麥TadMTase基因進(jìn)行染色體定位。 結(jié)果表明,TadMTas分布于小麥21條染色體上的15條上(圖4A),其中1A、1B和1D染色體上各有2個(gè),其余3A、3B、3D,4A、4B、4D、5A、5B、5D、7A、7B、7D染色體各有1個(gè)TadMTase基因。在小麥A、B 和 D 同源染色體組中,均含有6個(gè)基因,說(shuō)明TadMTase基因在小麥A、B 和 D 同源染色體進(jìn)化過(guò)程中比較保守,不同基因在同源染色體的丟失和保留沒有明顯的偏好現(xiàn)象。利用MSCcanX軟件對(duì)小麥全基因組產(chǎn)生的基因復(fù)制事件進(jìn)行分析,結(jié)果發(fā)現(xiàn)18個(gè)TadMTase基因都存在與其高度相似的同源序列,并構(gòu)成6個(gè)同源基因組,每組均由同源染色體組(A、B、D)上的同源基因組成,且這些同源基因組聚類分析均處于同一進(jìn)化分支,如:TaDML3a-3A、TaDML3a-3B和TaDML3a-3D(圖1)。同時(shí)分析了非同源染色體上的基因串聯(lián)重復(fù),其中在同一染色體上鑒定了3個(gè)基因串聯(lián)重復(fù),分別是TaROS1b-1A.1和TaROS1b-1A.2,TaROS1b-1B.1和TaROS1b-1B.2,TaROS1b-1D.1和TaROS1b-1D.2,而非同源的染色體上未發(fā)現(xiàn)基因串聯(lián)重復(fù)(圖4A)。 片段復(fù)制基因用彩色線條連接; 圓形代表AABBDD(Triticum aestivum)、菱形代表AA(Triticum urartu)、正方形代表DD(Aegilops tauschii)和 三角形代表AABB(Triticum dicoccoides)基因組中的dMTase 基因。 為進(jìn)一步明確dMTase基因在小麥多倍體形成過(guò)程中基因擴(kuò)張情況,利用TadMTase序列分別檢索了AA(Triticum urartu)二倍體、DD(Aegilops tauschii)二倍體和 AABB(Triticum dicoccoides)四倍體小麥祖先種基因組。結(jié)果表明在祖先種的 AA、DD和AABB 基因組中分別檢索到9、9和18個(gè)高度相似的dMTase同源基因,進(jìn)化樹顯示TadMTase基因在其祖先物種中均有同源基因并在各自的進(jìn)化分支,結(jié)果揭示在異源六倍體形成過(guò)程中存在部分dMTase基因丟失現(xiàn)象(圖4B)。 為了進(jìn)一步研究這些復(fù)制基因?qū)κ艿胶畏N選擇,對(duì)小麥TadMTase基因Ks、Ka以及Ka/Ks比值計(jì)算。結(jié)果發(fā)現(xiàn)所有小麥TadMTase基因Ka/Ks<1,表明在基因擴(kuò)張過(guò)程中經(jīng)歷了強(qiáng)烈的純化選擇,說(shuō)明這些基因在進(jìn)化過(guò)程中序列并未發(fā)生太大改變,相似性較高。 為了探討不同生長(zhǎng)發(fā)育階段TadMTase基因在小麥中的組織特異性表達(dá)模式,利用小麥基因轉(zhuǎn)錄組數(shù)據(jù)庫(kù)對(duì) 18個(gè)小麥TadMTase基因進(jìn)行檢索,分析了小麥花藥(anth)、第1葉(lea_1)、胚(emb)、胚乳(en)、旗葉(fls)、穎片(glu)、籽粒(grain)、根(root)、莖(stem)和穗(spike)組織的轉(zhuǎn)錄水平,結(jié)果表明(圖5A),小麥dMTase基因在不同組織或器官中的表達(dá)模式有明顯的差異,TaROS1a-5A/5B/5D在所有組織中表達(dá)活躍,在穗和籽粒中表達(dá)量最高,而TaROS1b-1A.1、1B.1在胚組織中表達(dá)量較高,在穗和籽粒中也有表達(dá)。同時(shí)分析了TadMTase基因在籽粒不同發(fā)育時(shí)期(花后15、25和35 d)及其胚乳(en)和糊粉層(al)組織不同時(shí)期(花后10、20和30 d)表達(dá)情況,結(jié)果表明(圖5B)小麥TadMTase基因的ROS1亞家族明顯高于DML亞家族。其中TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D在籽粒、糊粉層及胚乳中表達(dá)量較高。在籽粒發(fā)育階段,TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D表達(dá)量均在花后15 d最高,后逐漸下降。在糊粉層及胚乳發(fā)育階段這3個(gè)基因表達(dá)量也均是前期高于后期。 小麥組織:花藥、第1葉、胚、胚乳、旗葉、穎片、籽粒、根、莖和穗;dpa為籽粒、糊粉層、胚乳發(fā)育時(shí)期(花后天數(shù))。下同。 基于小麥轉(zhuǎn)錄組數(shù)據(jù)中TaROS1a、TaROS1b和TaDML3亞家族基因在小麥籽粒發(fā)育過(guò)程中的表達(dá)量較高特征,繼續(xù)在不同籽粒品質(zhì)的小麥品種揚(yáng)麥15(弱筋)和揚(yáng)麥16(中強(qiáng)筋)進(jìn)行了轉(zhuǎn)錄組測(cè)序分析,結(jié)果顯示(圖6),TaROS1a、TaROS1b和TaDML3亞家族基因在兩種小麥籽粒發(fā)育中表達(dá)模式相似,但不同基因間表達(dá)量則發(fā)生了明顯分化;TaROS1a-5A/B/D表達(dá)最為強(qiáng)烈,在弱筋小麥揚(yáng)麥15中TaROS1a-5A/B/D表達(dá)在15 d達(dá)峰值后下降較緩慢,并持續(xù)至25 d后再迅速下降,而在揚(yáng)麥16中TaROS1a-5A/B/D達(dá)峰值后則迅速下降,且TaROS1a-5A/B/D在弱筋小麥品種中表達(dá)量高于中強(qiáng)筋揚(yáng)麥16;TaROS1b亞家族基因表達(dá)發(fā)生分化,TaROS1b-1A/B/D.1表達(dá)量較高,而TaROS1b-1A/B/D.2幾乎不表達(dá),且TaROS1b-1A/B/D.1在揚(yáng)麥16中的表達(dá)則高于揚(yáng)麥15;TaDML3表達(dá)量較低,且3個(gè)同源基因也發(fā)生分化,TaDML3-3A/B有少量表達(dá),而TaDML3-3D則幾乎不表達(dá)。 圖6 TadMTase基因在揚(yáng)麥15(A)和揚(yáng)麥16(B)籽粒發(fā)育過(guò)程中的表達(dá)分析 基于TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D基因在小麥籽粒糊粉層和胚乳發(fā)育過(guò)程中的高表達(dá)量特征(圖5B),為了進(jìn)一步驗(yàn)證轉(zhuǎn)錄組的結(jié)果,根據(jù)獲得的TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D序列設(shè)計(jì)引物(表1),用實(shí)時(shí)熒光定量 PCR方法分析3個(gè)基因在花后10、20和30 d籽粒種皮和胚乳組織種的表達(dá)情況。結(jié)果顯示(圖7)在種皮發(fā)育20 d時(shí),TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D表達(dá)量均達(dá)最高,且TaROS1b-1A.1表達(dá)量高于TaROS1a-5A、TaROS1a-5D;在胚乳中,TaROS1b-1A.1和TaROS1a-5A兩基因在20 d時(shí)表達(dá)量達(dá)最高,但TaROS1b-1A.1表達(dá)量低于TaROS1a-5A和TaROS1a-5D;在花后10 和20 d,弱筋小麥揚(yáng)麥15籽粒種皮和胚乳中,3個(gè)基因表達(dá)量均顯著高于中強(qiáng)筋小麥揚(yáng)麥16。 字母代表同一時(shí)期不同品質(zhì)小麥顯著性差異比較(P<0.05)。 本研究從小麥全基因組數(shù)據(jù)庫(kù)中獲得了18 個(gè) dMTase 基因成員,高于其它已報(bào)導(dǎo)物種中的基因家族成員數(shù),結(jié)合系統(tǒng)發(fā)育分析,將TadMTases分為兩類(ROS1和DML),其中DML又分為DML3、DML4和DML5。在小麥中沒有發(fā)現(xiàn)DME亞族,這與其他研究發(fā)現(xiàn)的DME亞族基因只在擬南芥等雙子葉中,而在單子葉植物中沒有的結(jié)果一致[21-23]?;陔p子葉植物中DME基因與ROS1基因的高同源性,推測(cè)DME基因是在單、雙子葉植物分化后由雙子葉植物內(nèi)部ROS1基因復(fù)制產(chǎn)生的新基因[9]。 進(jìn)化及保守結(jié)構(gòu)域分析表明小麥dMTase與聚類關(guān)系較近的擬南芥和水稻dMTase具有相似的保守結(jié)構(gòu),如 ROS1 亞族的AtROS1、OsROS1a 和 TaROS1a-5A/B/D都含有 ENDO3c、FES、Perm-CXXC、RRM_DME 4個(gè)相同結(jié)構(gòu)域。然而不同亞族之間保守結(jié)構(gòu)域的個(gè)數(shù)和種類差異較大,這是可能是由于物種進(jìn)化過(guò)程中產(chǎn)生基因無(wú)功能化、新功能化和亞功能化所致,說(shuō)明dMTase基因在進(jìn)化過(guò)程中會(huì)更加傾向趨異進(jìn)化[24]。亞細(xì)胞定位研究還發(fā)現(xiàn)小麥dMTase均定位于細(xì)胞核,與其他植物物種,如擬南芥、水稻、番茄、花生、蓖麻豆、茄子、茶樹和蘭花也被證明位于細(xì)胞核內(nèi)的結(jié)果一致?;趤喖?xì)胞定位在確定蛋白質(zhì)功能中的重要性,植物dMTase基因的功能可能是保守的。 小麥dMTase在每個(gè)亞家族中具有相似的外顯子-內(nèi)含子組成,但ROS1和DML亞家族基因外顯子-內(nèi)含子數(shù)目變化有所差異,其中ROS1b亞家族基因的外顯子-內(nèi)含子數(shù)目為19~21個(gè),而3個(gè)DML亞家族(DML3、DML4和DML5)基因均有相同的外顯子-內(nèi)含子,基因結(jié)構(gòu)更為保守。 小麥dMTase基因上游 2 000 bp啟動(dòng)子序列的順式作用元件分析發(fā)現(xiàn),小麥dMTase的啟動(dòng)子具有光響應(yīng)、植物激素響應(yīng)、脅迫響應(yīng)和生長(zhǎng)發(fā)育 4 類CREs順式作用調(diào)控元件,類似CREs已在其他植物如花生[25]、獼猴桃[26]、山茶花[18]和鐵皮石斛[22]的dMTase基因啟動(dòng)子區(qū)也報(bào)道了ABRE、CGTCA-motif、TGA-element、G-box、sp1、A-box、ARE和CAT-box等元件,表明小麥dMTase基因可能參與了植物的發(fā)育和應(yīng)激反應(yīng)調(diào)控。其中TaROS1b-1D.2基因啟動(dòng)子中還發(fā)現(xiàn)了與種子特異性調(diào)控和胚乳特異性表達(dá)相關(guān)的CREs,表明TaROS1b-1D.2基因可能參與小麥胚乳發(fā)育的調(diào)控。 進(jìn)化分析表明小麥dMTase基因在A、B和D部分同源基因組中分布均勻,進(jìn)化一致。通過(guò)小麥與其祖先物種的dMTase基因進(jìn)化分析發(fā)現(xiàn),小麥dMTase與其祖先種在基因數(shù)量上存在差異,雖然基因總數(shù)可能在小麥異源六倍體形成進(jìn)化過(guò)程中經(jīng)歷了3個(gè)二倍體祖先種的兩輪自然加倍,使得基因組也經(jīng)歷了2次擴(kuò)張,造成dMTase基因數(shù)目增加,但并非3倍增加,存在部分dMTase基因的丟失,其原因可能是由于小麥形成進(jìn)化過(guò)程中染色體重組或基因功能冗余造成。共線分析表明小麥dMTase基因的ROS1b亞家族存在串聯(lián)復(fù)制,產(chǎn)生新的功能和亞功能化基因,這為進(jìn)一步研究不同DNA去甲基化酶基因的作用和機(jī)制提供了線索。 基因表達(dá)模式可以提供相關(guān)基因功能的重要信息,小麥dMTase在組織特異性表達(dá)模式分析中,發(fā)現(xiàn)TaROS1a亞家族基因在所有組織中都有較高的表達(dá),在其他植物物種中也發(fā)現(xiàn)了類似的結(jié)果,如花生中的ROS2[25]和DoDML3在鐵皮石斛[22]在所有組織中都有相對(duì)較高的表達(dá)。而TaROS1b亞家族基因表達(dá)存在基因分化和組織特異性,其中TaROS1b-1A.1基因在小麥胚和胚乳中有較高的表達(dá),與其啟動(dòng)子胚乳特異性表達(dá)元件相一致,而該基因的串聯(lián)復(fù)制基因TaROS1b-1A/B/D.2在各組織及發(fā)育時(shí)期幾乎不表達(dá),說(shuō)明不同小麥dMTase基因在植物生長(zhǎng)發(fā)育過(guò)程的在不同發(fā)育階段可能具有獨(dú)特的功能,也說(shuō)明DNA 去甲基化酶基因在進(jìn)化過(guò)程中會(huì)更加傾向趨異進(jìn)化。 研究表明水稻OsROS1aknock-in突變后導(dǎo)致胚乳早期發(fā)育失敗和胚發(fā)育不完全[12], 而OsROS1顯性負(fù)突變導(dǎo)致糊粉層增厚,其調(diào)控機(jī)制為OsROS1基因的突變,可導(dǎo)致調(diào)控糊粉層發(fā)育相關(guān)的轉(zhuǎn)錄因子RISBZ1和RPBF超甲基化,抑制其基因表達(dá),從而導(dǎo)致糊粉層細(xì)胞層數(shù)的增加[27]。小麥轉(zhuǎn)錄組數(shù)據(jù)分析表明小麥TaROS1a-5A/D和TaROS1b-1A.1在籽粒及其糊粉層和胚乳中高表達(dá),這也被我們采用qRT-PCR方法證實(shí)(如TaROS1b-1A.1和TaROS1a-5A/D)。同時(shí),qRT-PCR表達(dá)分析發(fā)現(xiàn)TaROS1b-1A.1和TaROS1a-5A/D在強(qiáng)筋和弱筋品質(zhì)小麥中表達(dá)水平也存在一定的差異,推測(cè)TaROS1基因可能對(duì)小麥胚乳品質(zhì)形成有一定影響。這些發(fā)現(xiàn)提示小麥ROS1基因可能在小麥胚乳和種皮糊粉層的發(fā)育發(fā)揮著和OsROS1同樣的調(diào)控作用。然而,這些基因是如何調(diào)控胚乳和糊粉層的發(fā)育及品質(zhì)形成,需要進(jìn)一步開展基因功能等相關(guān)研究來(lái)加以驗(yàn)證。1.2 小麥 dMTase蛋白理化性質(zhì)、結(jié)構(gòu)域及保守motif預(yù)測(cè)分析
1.3 系統(tǒng)發(fā)育樹的構(gòu)建、基因結(jié)構(gòu)分析
1.4 TadMTase基因染色體定位、共線性和基因復(fù)制事件分析
1.5 TadMTase基因組織表達(dá)分析
2 結(jié)果與分析
2.1 TadMTase基因家族成員的篩選及其蛋白理化性質(zhì)分析
2.2 TadMTase基因家族蛋白系統(tǒng)進(jìn)化樹構(gòu)建及保守結(jié)構(gòu)域分析
2.3 TadMTase基因家族基因結(jié)構(gòu)和啟動(dòng)子順式作用元件分析
2.4 TadMTase基因染色體定位和基因復(fù)制分析
2.5 TadMTase家族基因表達(dá)分析
3 討論
3.1 小麥dMTases 的蛋白質(zhì)結(jié)構(gòu)特征
3.2 小麥dMTase的基因結(jié)構(gòu)特征及進(jìn)化
3.3 小麥dMTase基因的表達(dá)與生長(zhǎng)發(fā)育的關(guān)系