李仰平, 張玲玲,2??, 李若佼, 劉 甜, 郭振義, 李婉茹, 包振民,2
(1. 中國海洋大學海洋生物遺傳學與育種教育部重點實驗室,山東 青島 266003;2. 青島海洋科學與技術試點國家實驗室 海洋漁業(yè)科學與食物產出過程功能實驗室,山東 青島 266237)
DNA 甲基化,即胞嘧啶的5號碳原子上連接的氫原子被替換成為一個甲基,是真核生物類群中的重要的表觀遺傳修飾,廣泛存在于植物,動物和真菌中。DNA甲基化在基因表達調控,基因組穩(wěn)定性維持,哺乳動物X染色體失活等生物學現象中起到十分重要的作用[1-2]。在生物的生長發(fā)育過程中,細胞的DNA甲基化水平并不是一成不變的,在哺乳動物生長發(fā)育中就存在兩次大規(guī)模的DNA甲基化的重編程過程[3]。第一次DNA甲基化的重編程發(fā)生在配子發(fā)生過程中,原始生殖細胞首先去除來源于外胚層的DNA甲基化模式,在形成精子和卵子的過程中,分別形成配子特異的DNA甲基化模式,這種DNA甲基化模式與配子內基因表達,精子DNA的包裝以及基因印跡有著密切關系[4-6]。第二次DNA甲基化的重編程發(fā)生在精卵結合之后,精子來源的DNA會迅速發(fā)生DNA去甲基化,在受精卵第一次分裂之前精子來源的DNA去甲基化就已經完成;在隨后的細胞分裂過程中,卵子來源的DNA會逐漸去甲基化,在囊胚時期達到DNA甲基化的最低水平。早期發(fā)育時期DNA的去甲基化對胚胎細胞的全能性具有重要意義[3]。
DNA甲基化的重編程包括DNA的去甲基化和重新甲基化,其中DNA的去甲基化過程分為兩種類型:第一種是DNA的被動去甲基化,在細胞分裂的過程中,隨著DNA的復制,如果不形成新的DNA甲基化,DNA的甲基化水平就會逐漸降低,如胚胎時期卵子來源DNA的去甲基化現象。第二種是DNA的主動去甲基化,即在不發(fā)生DNA復制的情況下,通過一系列反應脫去胞嘧啶五號碳原子上所連接的甲基基團的過程[7]。該過程主要由TET(ten-eleven translocation)蛋白催化,TET先將5甲基胞嘧啶5mC催化生成5羥甲基胞嘧啶5hmC[8],然后脫氫生成5甲?;奏?fC,并可進一步氧化形成5羧基胞嘧啶5caC[9]。5fC和5caC都可以被胸腺嘧啶DNA糖基化酶(TDG)識別并脫去對應的甲?;汪然箟A基恢復為沒有修飾的胞嘧啶,從而完成DNA的主動去甲基化過程[10]。在哺乳動物中,TET基因家族有三個成員TET1,TET2和TET3,它們分別在不同的生物學過程中發(fā)揮DNA去甲基化的功能。TET3基因在卵和受精卵中表達量較高,缺失TET3基因會導致早期胚胎中的5hmC含量下降,表明TET3蛋白可能參與受精卵中父本來源DNA的去甲基化[11-12]。TET1和TET2基因在小鼠的原始生殖細胞中檢測到表達[13],小鼠中的基因敲除實驗也表明這兩個基因對配子發(fā)生過程中基因印跡的擦除具有重要作用,并且TET1和TET2蛋白分別作用于不同的目標基因[14-15]。
蝦夷扇貝是中國重要的冷水性養(yǎng)殖貝類,開展對其科學、有效的育種和養(yǎng)殖工作是水產領域的重點工作之一。對蝦夷扇貝功能基因,包括生長[16]、生殖[17]和免疫[18]相關基因的研究是產業(yè)發(fā)展的基礎,并在近年來得到了一系列成果。特別最近蝦夷扇貝基因組的完成[19],更是大大推動了蝦夷扇貝功能基因的研究。蝦夷扇貝每年經歷一個生殖周期,包括休止期,增殖期,生長期和成熟期四個時期[20]。筆者近期結合DNA甲基化水平和DNMT基因家族的表達模式,分析了蝦夷扇貝配子發(fā)生和早期發(fā)育過程中DNA甲基化的產生和維持[21]。本研究將從DNA去甲基化酶TET的角度,進一步探討蝦夷扇貝配子發(fā)生和早期發(fā)育中DNA去甲基化過程的發(fā)生。
人(Hs),小鼠(Mm),野豬(Ss),牛(Bt),美洲河貍(Cc),單峰駝(Cd),原鴿(Cl),安氏蜂鳥(Ca),鬃獅蜥(Pv),海龜(Cm),非洲爪蟾(Xl),斑馬魚(Dr),青鳉(Nf),菜粉蝶(Pr),果蠅(Dm),太平洋牡蠣(Cg),美洲牡蠣(Cv),紫貽貝(Mg),帽貝(Lg)的TET蛋白序列下載自NCBI和Uniprot,其Accession Number見表1。用SMART在線軟件(http://smart.emblheidelberg.de/)預測這些蛋白的結構域。用blast軟件將這些TET蛋白的保守結構域序列比對到蝦夷扇貝的蛋白組數據庫(GenBank assembly accession: GCA_002113885.2),比對參數為“blastall -p blastp -a 16 -v 10 -b 20 -e 1e-6”,獲得蝦夷扇貝候選TET基因,并用SMART預測蝦夷扇貝TET蛋白的結構域。用ClustalX使用默認參數進行結構域的比對,確定蝦夷扇貝TET蛋白序列中的保守殘基。使用TET蛋白全長構建系統發(fā)生樹,先用Protest預測出合適的氨基酸替換模型和參數(-m JTT+I+G+F -v 0.034 -a 1.414),然后用PhyML軟件構建系統發(fā)生樹。
表1 各物種TET蛋白的序列信息
續(xù)表1
蛋白名稱Protein nameNCBI序列登記號Accession number物種(拉丁名)Species(Latin name)DrTET3A2CEA2斑馬魚(D. rerio)PyTETXP_021358783.1蝦夷扇貝(Patinopecten yessoensis)CgTETEKC18772.1太平洋牡蠣(Crassostrea gigas)CvTETXP_022313682.1美洲牡蠣(Crassostrea virginica)MgTETOPL33190.1紫貽貝(Mytilus galloprovincialis)LgTETXP_009060167.1帽貝(Lottia gigantea)DmTETNP_001246581.1果蠅(Drosophila melanogaster)NfTET1SBP47229.1青鳉(Nothobranchius furzeri)NfTET2SBP49038.1青鳉(N. furzeri)NfTET3SBP57161.1青鳉(N. furzeri)SsTET1AGI96745.1野豬(Sus scrofa)SsTET3AGI96747.1野豬(S. scrofa)BtTET2DAA28907.1牛(Bos taurus)PvTET1XP_020663651.1鬃獅蜥(Pogona vitticeps)PvTET2XP_020652070.1鬃獅蜥(P. vitticeps)PvTET3XP_020635782.1鬃獅蜥(P. vitticeps)CcTET1XP_020033190.1美洲河貍(Castor canadensis)CcTET2JAV39811.1美洲河貍(C. canadensis)CcTET3XP_020022002.1美洲河貍(C. canadensis)CdTET1XP_010984118.1單峰駝(Camelus dromedarius)CdTET2XP_010978962.1單峰駝(C. dromedarius)CdTET3XP_010987233.1單峰駝(C. dromedarius)CaTET1XP_008495875.1安氏蜂鳥(Calypte anna)CaTET2KFO97013.1安氏蜂鳥(C. anna)CaTET3XP_008498963.1安氏蜂鳥(C. anna)CmTET1XP_007054709.1海龜(Chelonia mydas)CmTET2XP_007054451.1海龜(C. mydas)CmTET3XP_007067519.1海龜(C. mydas)PrTETXP_022115477.1菜粉蝶(Pieris rapae)
本研究中蝦夷扇貝TET基因的表達量由RNA-Seq數據計算得到。其中,配子發(fā)生過程中的表達數據來自本實驗室前期工作[22]。首先通過石蠟切片鑒定獲得休止期、增殖期、生長期和成熟期的精巢和卵巢,用異硫氰酸胍法提取性腺組織總RNA,然后使用VAHTS stranded mRNA-seq library prep kit for Illumina試劑盒構建RNA-Seq文庫并測序。早期發(fā)育時期的表達數據來自蝦夷扇貝基因組文章[19],包括2~8細胞期、囊胚、原腸胚、擔輪幼蟲、D型幼蟲、早期殼頂幼蟲、中期殼頂幼蟲、后期殼頂幼蟲和稚貝的RNA-Seq數據。
表達量計算方法如下:先用STAR將RNA-Seq數據比對到蝦夷扇貝基因組[23],之后用HTSeq-count統計每個基因上覆蓋的reads數[24],基因的表達量(TPM)通過自行編寫的perl腳本計算獲得。
用單因素方差分析檢測各性腺發(fā)育時期之間TET基因的表達差異。用t檢驗進行同一時期兩種性別的基因差異表達分析。P值小于0.05視為差異顯著。
為探究蝦夷扇貝性腺中表達PyTET基因的細胞類型,本研究開展了原位雜交實驗。用含有Sp6啟動子序列的正向引物和含有T7啟動子序列的反向引物擴增cDNA片段,以純化后的PCR產物為模板,分別用Sp6和T7聚合酶合成地高辛標記的正義探針和反義探針。原位雜交引物序列見表2。
將性腺組織切片在PBST(磷酸鹽緩沖鹽水,0.1% Tween-20)中連續(xù)再水化,并用2 μg/mL蛋白酶K在37 ℃下消化15 min。60 ℃預雜交4 h后,再用含1 μg/mL變性RNA探針的雜交緩沖液(50%甲酰胺,5×SSC,100 μg/mL酵母tRNA,1.5%封閉試劑,0.1% Tween-20)在60 ℃條件下雜交16 h。然后洗去探針,并在含有地高辛抗體的封閉緩沖液(1∶2 000稀釋)中4 ℃孵育16 h。用馬來酸緩沖液(0.1 mol/L馬來酸,0.15 mol/L NaCl,0.1% Tween-20,pH=7.5)充分洗滌后,將切片置于NBT/BCIP顯色液中避光顯色,最后用1%中性紅溶液復染觀察。
表2 原位雜交引物序列
用其他物種TET蛋白的加氧酶結構域比對到蝦夷扇貝蛋白組,發(fā)現蝦夷扇貝中存在一個TET同源蛋白,命名為PyTET。該蛋白由1 591個氨基酸組成,分子量為175 668 Do,等電點為8.57。PyTET基因由10個外顯子組成,其基因結構見圖1。蛋白結構域的預測結果顯示PyTET包含一個完整的2OGFeDO超家族的加氧酶結構域(見圖1),該結構域與其他物種TET蛋白同源序列的相似度為46.59%~74.85%,并且和其他物種TET蛋白一樣,PyTET的保守結構域中包含鐵離子結合位點和2-氧代戊二酸結合殘基(見圖2)。TET蛋白序列的系統發(fā)生分析顯示,PyTET與軟體動物TET聚在一起,然后與節(jié)肢動物(果蠅和菜粉蝶)TET聚在一起,最后和脊椎動物的3個TET聚在一起(見圖3)。
(藍色表示編碼區(qū),灰色表示非翻譯區(qū),深綠色代表2OGFeDO超家族的加氧酶結構域。The blue and grey regions represent CDS and UTR, respectively. The oxygenase domain of the 2OGFeDO superfamily is highlighted in deep green. )
( 代表鐵離子結合位點,●代表2-氧代戊二酸結合殘基。 for iron ion binding site, ● for 2-oxoglutarate binding residues.)
圖3 TET蛋白的系統發(fā)生分析
PyTET在精巢和卵巢中的表達呈現不同的趨勢。如圖4所示,在精巢中,從休止期到成熟期,PyTET基因的表達量呈現逐步下降的趨勢,在休止期最高,成熟期最低,休止期和增殖期的表達量顯著高于成熟期。原位雜交結果表明,PyTET基因在精原細胞、精母細胞中均有表達(見圖5a)。在卵巢中,PyTET基因在增殖期表達量最高,在生長期的表達量顯著高于休止期。原位雜交結果表明,PyTET基因主要在卵母細胞中表達,在卵原細胞中有微弱表達(見圖5b)。
PyTET基因在早期發(fā)育過程中的表達量如圖6所示,在多細胞期PyTET基因的表達量接近0,隨后表達量急劇升高,在囊胚期達到峰值;從原腸胚到D型幼蟲期表達量較低且趨于穩(wěn)定;進入殼頂期后PyTET基因表達量又開始逐漸下降,直至中期殼頂幼蟲;之后表達無明顯變化,一直維持到稚貝。
(不同字母表示差異顯著(P<0.05)。Different letters indicate significant differences (P<0.05).)
(a) PyTET在精巢中的定位;(b) PyTET在卵巢中的定位。(Sg:精原細胞;Sc:精母細胞;Og:卵原細胞;Oc:卵母細胞。(a) Localization of PyTET with an anti-sense probe in testes; (b) Localization of PyTET with an anti-sense probe in ovaries. Sg, spermatogonium; Sc, spermatocyte; Og, oogonium; Oc, oocyte.)
(基因表達量采用衡量指標為TPM。The measure of gene expression level TPM.)
DNA甲基化現象廣泛存在于真核生物的各個類群,并在真核生物的生長發(fā)育過程中發(fā)揮重要的調控作用,因此DNA甲基化水平的調節(jié)對真核生物的生長發(fā)育十分關鍵。DNA甲基化水平的變化包括DNA去甲基化,DNA從頭甲基化,DNA甲基化的維持等過程,每個過程都有相應的酶發(fā)揮功能。在哺乳動物中,DNMT1/2/3[25-26]和TET/1/2/3[8, 11, 27]都已經被鑒定,對它們的功能也做了比較深入的研究。但在海洋軟體動物中,只有少數生物的DNMT基因被報道[28],還未見關于TET基因的研究報道。本研究發(fā)現蝦夷扇貝只存在一個TET的同源基因,與蛻皮動物和其它冠輪動物類似。而脊椎動物基因組大多含有3個TET基因,各成員間的功能有所不同,TET1和TET2參與配子發(fā)生過程中的DNA去甲基化[13],TET3參與胚胎發(fā)育過程中的DNA去甲基化[11-12]。PyTET基因在配子發(fā)生和胚胎發(fā)育過程中都有明顯的表達量變化,提示PyTET蛋白可能同時參與兩個發(fā)育過程中DNA的去甲基化。以上結果暗示,PyTET可能接近于TET基因家族的祖先形式,并同時具有脊椎動物不同TET蛋白的功能。
配子發(fā)生過程中DNA甲基化模式的重建包括DNA去甲基化和重新甲基化的兩個過程,在哺乳動物研究的比較深入,但在無脊椎動物,特別是海洋軟體動物中研究還比較欠缺。最近的研究報道了蝦夷扇貝配子發(fā)生過程中性腺整體DNA甲基化水平的變化和PyDNMT在該過程中的作用。但PyDNMT基因的表達僅能解釋DNA甲基化的形成和維持,對PyTET基因的表達分析有助于理解在蝦夷扇貝配子發(fā)生過程中DNA去甲基化的過程。在精子發(fā)生過程中,PyTET基因在休止期和增殖期的表達量較高,隨著精子的形成過程,其表達量逐步降低,在成熟期達到最低。由于休止期和增殖期的生殖細胞類型主要為精原細胞和精母細胞[20],原位雜交結果也表明PyTET基因在這兩種細胞中均有表達,表明在蝦夷扇貝精子發(fā)生過程中,DNA的主動去甲基化過程可能發(fā)生在精原細胞和精母細胞中。在卵子發(fā)生過程中,PyTET基因表達量在休止期最低,增殖期開始升高,并一直維持到成熟期。與原位雜交結果觀察到的PyTET基因在卵原細胞有微弱表達,而在卵母細胞中有大量表達的結果一致。這里可能涉及到兩個DNA去甲基化的過程,第一個過程是卵原細胞中的PyTET參與了卵子發(fā)生過程中的DNA主動去甲基化過程,第二個過程是在初級卵母細胞中的PyTET,在精卵結合后,與哺乳動物TET3的相似,發(fā)揮著受精卵中DNA主動去甲基化的功能[11-12]。
蝦夷扇貝受精卵的DNA來源于精子和成熟卵,其DNA甲基化模式也同時被繼承,初級卵母細胞中表達大量PyTET基因可能與受精卵時期的DNA去甲基化過程有關,這一過程在哺乳動物中已有報道[29-31]。由于PyTET基因在2~8細胞期的表達量接近于0,與哺乳動物中的情況相同,推測這一過程可能在受精卵分裂之前已經完成。但不同的是在囊胚期,PyTET基因的表達突然升高,在隨后的原腸胚時期又降低,使囊胚期形成了PyTET基因的表達量高峰,這一現象表明,蝦夷扇貝可能在囊胚期發(fā)生了與哺乳動物不同的DNA去甲基化過程,這或許是海洋軟體動物中特有的現象。前期研究顯示,PyDNMT3在囊胚期的表達量也突然升高,基因組整體DNA甲基化水平在囊胚期也突然升高然后降低[21]。綜合以上結果,本研究者推測在蝦夷扇貝囊胚期可能發(fā)生了劇烈的DNA甲基化的重建,既包括DNA從頭甲基化,也包括DNA去甲基化,PyDNMT3和PyTET在其中發(fā)揮著重要作用。