薛 雯,曹翠輝,2,眭維國,車文體,陳潔晶,郭 麗,戴 勇
(1.中國人民解放軍第181醫(yī)院 腎臟科 廣西代謝性疾病研究重點實驗室, 廣西 桂林 541002;2.廣西師范大學(xué)生命科學(xué)學(xué)院,廣西 桂林 541004; 3.深圳市人民醫(yī)院 暨南大學(xué) 第二臨床醫(yī)學(xué)院 臨床醫(yī)學(xué)研究中心, 廣東 深圳 518020)
ChIP-seq比較分析人體心臟和脾臟的H3K9三甲基化差異
薛 雯1,曹翠輝1,2,眭維國1,車文體1,陳潔晶1,郭 麗1,戴 勇3*
(1.中國人民解放軍第181醫(yī)院 腎臟科 廣西代謝性疾病研究重點實驗室, 廣西 桂林 541002;2.廣西師范大學(xué)生命科學(xué)學(xué)院,廣西 桂林 541004; 3.深圳市人民醫(yī)院 暨南大學(xué) 第二臨床醫(yī)學(xué)院 臨床醫(yī)學(xué)研究中心, 廣東 深圳 518020)
目的分析人體器官心臟和脾臟的H3K9me3的全基因圖譜,以期發(fā)現(xiàn)H3K9三甲基化的修飾與組織特異性的表達(dá)、功能和發(fā)育具有相關(guān)性。方法通過染色質(zhì)免疫共沉淀的方法獲取各標(biāo)本DNA,通過qPCR驗證ChIP結(jié)果,然后構(gòu)建ChIP Sequencing文庫,與目的基因組序列比對,獲取比對Reads,接著進(jìn)行全基因組的Peak分析,GO功能富集分析peak相關(guān)基因的生物學(xué)功能。結(jié)果心臟和脾臟間有169個基因有顯著地H3K9me3差異,其中心臟中H3K9me3的基因中有64個特殊基因,脾臟中H3K9me3的基因中有87個特殊基因。從這些基因中,挑選出8個表現(xiàn)H3K9me3 明顯的基因,然后再從這8個基因中挑選出兩個心臟和脾臟間表現(xiàn)H3K9me3差異最明顯的基因,分別是PTPN3和RBMS。結(jié)論H3K9me3差異可作為一個潛在的生物標(biāo)志物或是表觀遺傳疾病的治療靶點。
H3K9me3;ChIP-seq;表觀遺傳學(xué)
在哺乳動物基因組中,組蛋白則可以有很多修飾形式。包括組蛋白末端的乙酰化,甲基化,磷酸化,泛素化以及ADP核糖基化等等,這些修飾都會影響基因的轉(zhuǎn)錄活性。在不同的組織和生物中已廣泛研究并證實組蛋白H3K9三甲基化(H3K9me3)與異染色質(zhì)形成,基因的表達(dá)和轉(zhuǎn)錄伸長率具有關(guān)聯(lián)性[1]。在各種不同的組蛋白賴氨酸甲基化模式中,由于H3K9的甲基化和抑制的染色質(zhì)相關(guān)而備受關(guān)注[2]。H3K9三甲基化(H3K9me3)是一個翻譯后修飾并且與異染色質(zhì)的形成和轉(zhuǎn)錄抑制相關(guān)聯(lián)[3]。
ChIP-seq是染色質(zhì)免疫共沉淀后并結(jié)合高通量測序的方法,它能夠在全基因組中識別轉(zhuǎn)錄因子(TFs)和DNA結(jié)合蛋白的結(jié)合位點[4]。隨著高通量測序平臺如Illumina公司的基因組分析以及SOLiD和芯片級別的抗體出現(xiàn),ChIP-seq已成為用于確定基因組中的功能元件的最廣泛使用的方法[5]。與ChIP-chip相比,ChIP-seq具有更高的信噪比,更便宜以及更少量的樣本優(yōu)勢[6]。
目前,只有極少數(shù)研究比較分析哺乳動物或人體組織的H3K9me3。因此,本研究采用ChIP-seq技術(shù)比較分析人體器官心臟和脾臟之間在全基因組中H3K9me3的變化及差異情況,了解組織間的表觀遺傳差異,并且尋找潛在的生物標(biāo)志物或是表觀遺傳疾病的治療靶點。
1.1 樣本
采用兩組標(biāo)本,分別是兩個心臟和兩個脾臟,均來自中國廣西桂林第181醫(yī)院腦死亡患者自愿捐贈的器官。標(biāo)本放置于-80 ℃保存。標(biāo)本收集的方案與執(zhí)行均獲得廣西代謝性疾病重點實驗室和第181醫(yī)院倫理委員會的批準(zhǔn)。器官捐贈者均簽署了知情同意書。
1.2 染色質(zhì)免疫共沉淀
將組織樣本先研磨勻漿并用1%甲醛處理細(xì)胞,使 DNA-protein 的相互結(jié)合作用被交聯(lián)固定,然后裂解細(xì)胞,得到全細(xì)胞裂解液,超聲處理,將基因組 DNA 打斷至100~500 bp碎片,在細(xì)胞裂解液中加入特定的實驗所需的三甲基化賴氨酸9的抗體和beads,并進(jìn)行4℃孵育。采用合適的實驗條件進(jìn)行洗脫,并解交聯(lián),經(jīng)過交聯(lián)反轉(zhuǎn)和蛋白酶K處理后,DNA被沉淀提取出,再構(gòu)建DNA文庫前,先用QIA快速PCR純化試劑盒將DNA進(jìn)一步純化。通過qPCR 對ChIP結(jié)果進(jìn)行驗證,準(zhǔn)備好的ChIP后的DNA樣品可以用于 ChIP Sequencing 建庫。
1.3 ChIP Sequencing文庫構(gòu)建流程
DNA 片段末端修復(fù),3′端加A堿基,連接測序接頭(詳細(xì)步驟請參考Illumina公司Paired-End DNA Sample Prep kit)。PCR擴(kuò)增及DNA產(chǎn)物的片段大小選擇(一般為 100~300 bp,包括接頭序列在內(nèi)),合格的文庫用于上機測序。
1.4 ChIP-seq分析
ChIP DNA 末端修復(fù),接頭連接以及擴(kuò)增等均按之前的進(jìn)行[7]。從瓊脂糖凝膠中分離出大小約為49 bp的片段,用Solexa/Illumina 2G基因分析儀分析測序。與目的物種基因組序列(參考基因組版本為Hg19)進(jìn)行比對,比對軟件為SOAP 2.21[8]。采用軟件MACS 1.4.0全基因組Peak掃描,將基因組上的候選peak區(qū)延伸,得到一定長度的建模區(qū)域,根據(jù)此區(qū)域中所有唯一比對reads的情況,使用Poisson分布模型進(jìn)行檢驗,計算候選peak區(qū)域的P-value,若P-valuelt;1.00e-05,則認(rèn)為該區(qū)域是一個peak[9]。MACS的目的是從ChIP-seq的數(shù)據(jù)集中找出轉(zhuǎn)錄因子結(jié)合位點和組蛋白修飾富集區(qū)域,且不需要正常對照[10]。
Peak相關(guān)基因的GO分析,GO 是一種整合性、統(tǒng)一化、動態(tài)開放實時更新的分類系統(tǒng)。它包括3大獨立的本體(ontology):基因參與的生命過程(biological process),所處的細(xì)胞組份和元件(cellular component)及發(fā)揮的分子生物學(xué)功能(molecular function)。通過 GO 功能富集分析,可以知道peak相關(guān)基因涉及到哪些生物學(xué)功能的改變[11]。
2.1 統(tǒng)計
測序完成后,對原始數(shù)據(jù)進(jìn)行去污染,去接頭及去除低質(zhì)量數(shù)據(jù)處理, 統(tǒng)計clean data產(chǎn)量(表1)。
2.2ChIPSequencing結(jié)果與參考基因組序列進(jìn)行比對
將clean data與目的物種基因組序列進(jìn)行比對,允許不超過2個堿基的錯配,其中比對到基因組上唯一位置的reads(唯一比對reads)將用于后續(xù)的信息分析(表2)。
比對軟件: SOAP 2.21
參考基因組版本: Hg19
2.3 全基因組Peak掃描
基于一定的分析模型在全基因范圍進(jìn)行peak (ChIP Sequencing富集區(qū)域)掃描,得到Peak在基因組上的位置信息(表3)。
2.4 GO分析peaks與注釋基因的關(guān)聯(lián)
心臟器官組織中的104個注釋基因中,37個基因與細(xì)胞組分和元件相關(guān),37個基因發(fā)揮著分子生物學(xué)功能,30個基因參與生命過程。脾臟器官組織中的137個注釋基因中,52個基因與細(xì)胞組分和元件相關(guān),45個基因發(fā)揮著分子生物學(xué)功能,40個基因參與生命過程。從細(xì)胞的組分來看,心臟中,亞細(xì)胞定位的注釋基因中34個作為細(xì)胞部分,19個作為細(xì)胞器;脾臟中,亞細(xì)胞定位的注釋基因中46個作為細(xì)胞部分,21個作為細(xì)胞器。從分子生物學(xué)功能來看,心臟中,具有鏈接和催化活性的基因分別為33個和17個,而脾臟中,具有鏈接和催化活性的基因分別為36和16個。從參與生命過程來看,心臟中,27個基因參與了細(xì)胞過程,20個基因參與了生物的調(diào)節(jié)過程,而脾臟中,36個基因參與了細(xì)胞過程,25個基因參與了生物的調(diào)節(jié)過程。
2.5 心臟和脾臟中H3K9me3的比較
經(jīng)過對比分析心臟和脾臟組織樣本,可以得出樣本各自具有的特有的基因(表4)。經(jīng)過方差分析統(tǒng)計GO功能聚類,通過熱圖比較兩個樣本中所共同包含的峰值區(qū)域富集度(圖1)。
通過以上對測序結(jié)果的分析,可以得出心臟和脾臟間169個基因表現(xiàn)了顯著地H3K9me3差異,其中64個基因是心臟中的表現(xiàn)H3K9me3的特有基因,87個基因是脾臟中的表現(xiàn)H3K9me3的特有基因。從這些基因中,挑選出8個表現(xiàn)H3K9me3明顯的基因,然后再從這8個基因中挑選出兩個心臟和脾臟間表現(xiàn)H3K9me3差異最明顯的基因,分別是PTPN3和RBMS3。
表1 Clean data產(chǎn)量統(tǒng)計Table 1 Clean data production statistics
表2 序列比對結(jié)果統(tǒng)計Table 2 Sequence alignment result statistics
表3 Peak信息統(tǒng)計Table 3 Peak statistics
表4 樣本各自具有的特有的基因Table 4 The unique genes of each sample
續(xù)表4
圖1 兩個樣本中所共同包含的峰值區(qū)域富集度Fig 1 The common area of the peak enrichment between the two samples
新一代測序技術(shù)分析非小細(xì)胞肺癌(non-small-cell lung carcinoma, NSCLC)細(xì)胞系H2228的轉(zhuǎn)錄水平,發(fā)現(xiàn)了一個由多個外顯子組成的融合轉(zhuǎn)錄子間變性淋巴瘤受體酪氨酸激酶(anaplasticlymphoma kinase, ALK)和PTPN3?;蚪M結(jié)構(gòu)的詳細(xì)分析表明,ALK的部分基因區(qū)域的外顯子10和11 易位到了PTPN3的外顯子2和3之間[12]。
RNA結(jié)合模體,單鏈相互作用蛋白3(RNA binding motif, single stranded interacting protein, RBMS 3),最初被發(fā)現(xiàn)在RNA結(jié)合蛋白中,作用于DNA結(jié)合過程中,并且與DNA復(fù)制,基因轉(zhuǎn)錄,細(xì)胞周期進(jìn)程和細(xì)胞凋亡等多樣化的功能相關(guān)聯(lián)。RBMS3還能抑制微血管的形成,這可能是通過下調(diào)MMP2和β-catenin和滅活其下游的目標(biāo),包括細(xì)胞周期蛋白D1,c-Myc基因,MMP7和MMP9來實現(xiàn)的[13]。
綜上所述,本文系統(tǒng)地評估了心臟和脾臟中H3K9me3差異的狀態(tài),并且通過關(guān)鍵基因和組蛋白甲基化對于人體器官之間的關(guān)聯(lián)獲得了新的見解。研究也表明下一代測序用于研究DNA甲基化具有很好的實用性,并且具有疾病的鑒別診斷,預(yù)后和治療的重要性。這些新的研究結(jié)果表明,H3K9me3具有作為一個潛在的生物標(biāo)志物或表觀遺傳疾病治療靶點的意義。
感謝:所有捐獻(xiàn)血液的志愿者。
[1] Lessard JA, Crabtree GR. Chromatin regulatory mechanisms in pluripotency [J]. Annu Rev Cell Dev Biol, 2010, 26: 503- 532.
[2] Jin-Ah P, Ae-Jin K, Yoonsung K,etal. Deacetylation and methylation at Histone H3 Lysine 9 (H3K9) coordinate chromosome condensation during cell cycle progression [J]. Molecules and Cells, 2011, 31:343- 349.
[3] Yoichi S, Makoto T. H3K9 methyltransferase G9a and the related molecule GLP [J]. Genes Dev, 2011, 25:781- 788.
[4] Debasish R, Miyoung H, Michael S. ChIP-Seq: A method for global identification of regulatory elements in the genome [J]. Curr Protocols Mol Biol, 2010, 21:1- 14.
[5] Wacker DA, Kim TH. From sextant to GPS: Twenty-five years of mapping the genome with ChIP [J]. J. Cell. Biochem, 2009, 107:6- 10.
[6] Euskirchen GM, Rozowsky JS, Wie CL,etal. Mapping of transcription factor binding regions in mammalian cells by ChIP: Comparison of array-and sequencing-based technologies [J]. Genome Res, 2007, 17:898- 909.
[7] Lin B, Wang J, Hong X,etal. Integrated expression profiling and ChIP-seq analyses of the growth inhibition response program of the androgen receptor [J]. PLoS One, 2009, 4:e6589. doi: 10.1371/journal.pone.0006589.
[8] Langmead B, Schatz MC. Searching for SNPs with cloud computing [J]. Genome Biol, 2009, 10:R134. doi: 10.1186/gb-2009-10-11-r134.
[9] Feng J, Liu T. Using MACS to identify peaks from ChIP-Seq data [J]. Curr Protoc Bioinformatics, 2011, 2:14.
[10] Joo HS, Robert W Li, Yuan G,etal. Genome-wide ChIP-seq mapping and analysis reveal butyrate-induced acetylation of H3K9 and H3K27 correlated with transcription activity in bovine cells [J]. Funct Integr Genomics, 2012, 12:119- 130.
[11] Seth C, Amelia I, Christopher J,etal. AmiGO: online access to ontology and annotation data [J]. Bioinformatics, 2009, 25:288- 289.
[12] Jung Y, Kim P, Jung Y,etal. Discovery of ALK-PTPN3 gene fusion from human non-small cell lung carcinoma cell line using next generation RNA sequencing [J]. Gen Chromosome Cancer, 2012, 51:590- 597.
[13] Chen J, Kwong DL, Zhu CL,etal. RBMS3 at 3p24 inhibits nasopharyngeal carcinoma development via inhibiting cell proliferation, angiogenesis, and inducingapoptosis [J]. PloS One, 2012, 7:e44636. doi: 10.1371/journal.pone. 0044636.
Analysis of difference in histone H3K9 trimethylations in normal human heart and spleen by ChIP-seq
XUE Wen1, CAO Cui-hui1,2, SUI Wei-guo1, CHE Wen-ti1, CHEN Jie-jing1, GUO Li1, DAI Yong3*
(1.Guangxi Key Laboratory of Metabolic Diseases Research, Dept. of Nephrology, Guilin 181st Hospital, Guilin 541002;2.College of Life Science, Guangxi Normal University, Guilin 541004; 3.Clinical Medical Research Center, the Second Clinical Medical College of Jinan University, Shenzhen People’s Hospital, Shenzhen 518020, China)
ObjectiveThe modifications are closely-associated with tissue-specific expression, function and development by generating the genome-wide maps of H3K9me3 of human heart and spleen.MethodsThe DNA of samples was extracted by chromatin immunoprecipitation. The ChIP results were validated by qPCR.Then building the ChIP sequencing library, contrasting with the target genome sequence to obtain compared reads, and peak analysis of whole genome, GO enrichment analysis of the biological functions of the related genes of peak.Results169 genes displayed significant H3K9me3 differences between heart and spleen. Among these genes, 64 genes were the special genes in heart-H3K9me3; 87 genes were special genes in spleen-H3K9me3. From these genes, we selected eight genes of H3K9 which were of significantly expression. Then selecting two genes of H3K9 which were the most significant difference expression from the eight genes.They are PTPN3 and RBMS.ConclusionsH3K9me3 may be a potential biomarker or promising target for epigenetic-based disease treatment.
H3K9me3; ChIP-seq; epigenetic
2013- 09- 26
2014- 01- 13
廣西自然科學(xué)基金(2012GXNSFDA053017);廣西科技基礎(chǔ)設(shè)施建設(shè)項目(11-031-33);廣西重點實驗室建設(shè)項目(12-071-32)
*通信作者(correspondingauthor): daiyong2222@gmail.com
1001-6325(2014)07-0939-06
研究論文
Q593+.9
A