王欣 張旭東 陳清江 王冠男 胡俊霞 吳少璇 馬咪靜 尹美鳳 楊萬秋 董萌丁夢杰 張明智 朱利楠
NK/T細(xì)胞淋巴瘤(NK/T cell lymphoma,NKTCL)為一種高度侵襲性的非霍奇金淋巴瘤,其發(fā)病與EB病毒(Epstein-Barr virus,EBV)感染密切相關(guān)[1]。研究表明,約80%NKTCL患者血漿中可檢測到EBV DNA[2-3]。EBV為一種在全球范圍內(nèi)廣泛感染的皰疹病毒,主要有潛伏感染和裂解感染兩種形式,其中以潛伏感染最為多見[4]。潛伏狀態(tài)下,EBV在宿主細(xì)胞中僅編碼部分病毒產(chǎn)物,如EBV核抗原(EBV-determined nuclear antigen,EBNA)、EBV潛伏膜蛋白(latent membrane protein,LMP)、EBV編碼小RNA(EB-encoded small RNA,EBER)和終末蛋白(terminal protein,TP)。研究提示,上述蛋白及其相關(guān)通路是導(dǎo)致EBV相關(guān)腫瘤發(fā)生的主要機制[5]。然而,也有部分研究表明,EBV DNA在宿主基因組中的整合也有可能是其致瘤原因之一[6-9],其機制可能與病毒整合導(dǎo)致宿主基因組不穩(wěn)定,從而引起基因表達異常有關(guān)。目前,關(guān)于EBV致瘤性的研究多來自B細(xì)胞或鼻咽上皮細(xì)胞,在NK/T細(xì)胞中的研究較少,因此EBV相關(guān)NKTCL的發(fā)病機制尚未明確。本研究通過對5例EBV(+)NK/T樣本及4例EBV(-)NK/T樣本進行全基因組測序及生物信息學(xué)分析,初步探究EBV DNA在NKTCL中的整合情況,為進一步研究EBV在NKTCL發(fā)生發(fā)展中的作用機制提供理論基礎(chǔ)。
1.1.1 樣本 EBV(+)NKTCL細(xì)胞系SNK-6(樣本ID:EB_NK_pS)和 YTS(樣本 ID:EB_NK_pY)、EBV(+)鼻咽癌細(xì)胞系CNE1(樣本ID:EB_C_pC)、1例EBV(+)鼻腔NKTCL組織(EBV+Tissue-NKTCL)(樣本ID:EB_B_pR)、1例EBV(+)成人T/NK淋巴組織增殖性疾?。‥BV+T/NK-LPD)(2級)組織(樣本ID:EB_N_pZ)、EBV(-)NK細(xì)胞淋巴瘤細(xì)胞系NK92(樣本 ID:EB_NK_n92)和 NKL(樣本 ID:EB_NK_nL)、EBV(-)T細(xì)胞白血病/淋巴瘤細(xì)胞系Jurkat(樣本ID:EB_T_nJ)和健康人EBV(-)外周血正常NK細(xì)胞(樣本ID:EB_N_pF)共9例樣本,均由鄭州大學(xué)第一附屬醫(yī)院生物樣本庫提供。
1.1.2 試劑與儀器 DNA提取試劑盒購自美國Qiagen公司提供,TaqDNA聚合酶、dNTP和PCR引物購自上海生工生物工程公司,DNA marker購自北京康為世紀(jì)生物科技有限公司,EBER原位雜交檢測試劑盒購自北京中杉金橋生物技術(shù)有限公司。PCR儀購自賽默飛世爾科技(中國)公司,凝膠成像儀購自上海伯樂生命醫(yī)學(xué)產(chǎn)品有限公司,電熱恒溫培養(yǎng)箱(DNP-9052BS-m)購自上海新苗醫(yī)療器械制造有限公司,組織芯片機購自美國Beecher公司,TheraioBrite原位雜交儀購自美國StatSpin公司,石蠟切片機購自德國Leica公司,OLYMPUS BX51高級熒光顯微鏡購自日本Olympus公司。
1.2.1 PCR法擴增EBV DNA和原位雜交法檢測EBER表達 提取9例樣本全基因組DNA,具體操作方法參考DNA提取試劑盒說明書進行。根據(jù)EBNA-3C特異性編碼序列區(qū)設(shè)計引物5′-AGAAGGGGAGCGTGTGTTGT-3′進行PCR擴增,擴增片段為153 bp。按常規(guī)操作規(guī)程將模板DNA、引物、TaqDNA聚合酶、dNTP放入PCR儀中進行反應(yīng),經(jīng)變性、退火、延伸共進行35個循環(huán)得到產(chǎn)物。對擴增產(chǎn)物進行2%瓊脂糖凝膠電泳后取出凝膠,置于凝膠成像系統(tǒng),拍照并保存圖像。將常規(guī)石蠟包埋的EBV(+)鼻腔NKTCL組織(EBV+Tissue-NKTCL)和EBV(+)成人T/NK淋巴組織增殖性疾?。‥BV+T/NK-LPD)(2級)組織制成4 μm石蠟切片,經(jīng)56~60℃烤片2~16 h,具體操作方法參考EBER原位雜交試劑盒說明書進行。
1.2.2 全基因組測序及生物信息學(xué)分析 將9例樣本送至北京諾禾致源生物信息科技有限公司進行DNA樣本檢測、文庫構(gòu)建、庫檢、Illumina Hiseq平臺測序、基本生物信息學(xué)分析(測序原始數(shù)據(jù)、數(shù)據(jù)質(zhì)量評估獲取Clean Data、參考序列比對分析、SNV/Indel/CNV/SV)和高級生物信息學(xué)分析(突變位點篩選、顯隱性模式篩選、基于家系研究、基因功能注釋、新生突變、基因功能富集分析、蛋白互作網(wǎng)絡(luò)分析)。具體方法均為Illumina測序和生物信息學(xué)分析常規(guī)流程。
1.2.3 全基因組序列比對、捕獲并驗證EBV DNA整合序列 對9例樣本進行全基因組序列比對,使用BWA進行mapping,參考基因組為hg19。分析流程中,考慮到EBV的特性,將EBV的序列整合到參考基因組中進行序列比對。EBV整合信息捕獲示意圖(圖1)。對每個樣本構(gòu)建EBV的fasta文件,與構(gòu)建的EBV fasta庫進行Blast比對,從而確認(rèn)提取的序列是否是病毒序列。本研究從NCBI選取3個EBV genome序列來構(gòu)建fasta庫,3個EBV序列信息如下:1)Human herpesvirus 4 complete wild type genome(NC_007605);2)Epstein-Barr virus(EBV)genome,strain B95-8(V01555);3)HS4B958RAJ Epstein-Barr virus,artifactual joining of B95-8 complete genome and the sequences from Raji of the large deletion found in B95-8(M80517)。
圖1 EBV整合信息捕獲示意圖
1.2.4 過濾EBV DNA整合序列并對其進行染色體分布的統(tǒng)計 使用CREST軟件對bam文件進行softclip reads(一端比對到正常染色體,另一端比對到病毒序列的reads)提取,并抽取所有paired reads。對提取得到的paired reads進行過濾,步驟如下:1)去除部分未比對上的reads;2)去除部分比對到hs37d5的reads;3)去除 not primary alignment reads;4)去除未找到paired read的reads。對過濾后的reads進行染色體分布的統(tǒng)計。
1.2.5 對EBV DNA整合序列進行生物信息學(xué)分析及驗證 根據(jù)reads數(shù)在染色體上的分布情況,提取每個樣本bam文件中的EBV DNA高頻整合區(qū)域,使用IGV查看染色體部分區(qū)域比對情況,并設(shè)計PCR引物(p23.1F:5′-TTGGGGCTTTAAGTGGAAC-3′,P23.1R:5′-TCAGA GGGGAGCCAGGAC-3′)擴增EBV DNA在樣本基因組中的高頻整合區(qū)域,擴增片段進行sanger測序并與EBV基因序列進行比對。
經(jīng)PCR法及EBER原位雜交法檢測,5例EBV(+)樣本均可檢測出EBV DNA和EBER表達,4例EBV(-)樣本則未能檢出。PCR擴增結(jié)果(圖2),EBER原位雜交結(jié)果(圖3)。
圖2 樣本PCR擴增結(jié)果
經(jīng)北京諾禾致源生物信息科技有限公司進行參考序列比對分析,9例樣本的測序深度、覆蓋深度、覆蓋率和比對率均滿足后續(xù)研究要求。測序深度(圖4),覆蓋深度和覆蓋率(圖5),比對率和覆蓋度統(tǒng)計見表1。(本研究關(guān)注的為EBV DNA的整合信息,因此常規(guī)的SNP、INDEL、SV、CNV檢測等全基因組的生物信息學(xué)分析在此未列出。)
圖4 樣本測序深度
圖5 樣本每個染色體的覆蓋深度和覆蓋率
經(jīng)個體化EBV整合分析流程捕獲softclip reads,比對樣本EBV fasta文件與構(gòu)建的EBV fasta庫,結(jié)果顯示提取的reads可以比對到構(gòu)建的EBV fasta庫,從而確認(rèn)提取的序列是病毒序列。
對過濾后的reads進行染色體分布的統(tǒng)計。結(jié)果表明,相較EBV(-)樣本、EBV(+)鼻咽癌細(xì)胞系CNE1和EBV(+)T/NK淋巴組織增殖性疾病組織,EBV(+)NKTCL細(xì)胞系SNK、YTS和EBV(+)鼻腔NTKCL組織的EBV整合序列數(shù)目最多,2號染色體上的reads較其他染色體更多。統(tǒng)計結(jié)果見表2。
表1 比對率和覆蓋度統(tǒng)計
表2 EBV DNA整合序列的染色體分布統(tǒng)計
根據(jù)reads數(shù)在染色體上的分布情況,提取每個樣本bam文件中chr2:33140000-33149000區(qū)域,使用IGV進行展示。樣本EB_B_pR、EB_NK_pS、EB_NK_pY bam文件2號染色體部分區(qū)域的IGV圖(圖6)。3個EB陽性樣本在chr2:30234084-30234483400bp區(qū)域均存在大量的插入與刪除。在IGV形象化展示中,每個顏色代表mapping質(zhì)量值高低,其中灰白色背景表示比對越高,顏色越深,比對質(zhì)量越低。每個顏色條代表1條read,每個read中會有1個cigar,將3個樣本放在一起比對,可以觀察到每個樣本的區(qū)域大致相同。對樣本EB_B_pR、EB_NK_pS、EB_NK_pY、EB_NK_n92、EB_NK_nL包含chr2:30234084-30234483 400 bp區(qū)域進行擴增,其中EBV(+)樣本擴增730 bp條帶,EBV(-)樣本擴增711 bp條帶,擴增片段進行sanger測序,發(fā)現(xiàn)EBV(+)NKTCL細(xì)胞系SNK、YTS和EBV(+)鼻腔NTKCL組織均存在chr2p23.1位點的插入缺失,且均為EBV基因組來源。sanger測序結(jié)果(圖7),PCR擴增結(jié)果(圖8)。
圖6 樣本EB_B_pR、EB_NK_pS、EB_NK_pY 2號染色體部分區(qū)域IGV圖
圖7 擴增片段部分區(qū)域sanger測序結(jié)果
圖8 樣本chr2:30234084-30234483 400 bp區(qū)域PCR擴增結(jié)果
NKTCL為非霍奇金淋巴瘤的一種獨特亞型,84.8%NKTCL患者腫瘤組織中EBER陽性,亞洲人群中鼻型NKTCL的EBV陽性率幾乎達到100%,提示EBV在NKTCL的發(fā)生發(fā)展中發(fā)揮重要作用[10]。Kim等[11]研究提示,血漿EBV DNA水平可為EBV感染提供直接證據(jù),是監(jiān)測NK細(xì)胞淋巴瘤疾病進展和評估預(yù)后的重要指標(biāo)。Karaarslan等[12]研究表明,原位雜交法檢測EBER表達為目前判斷EBV感染的有效方法。本研究采用PCR法擴增EBV DNA和原位雜交法檢測EBER表達,5例EBV(+)樣本均可檢測出EBV DNA和EBER表達,4例EBV(-)樣本則未能檢出,與上述報道相一致。
EBV屬于人皰疹病毒γ亞科,是一種雙鏈DNA病毒,流行病學(xué)顯示多種惡性腫瘤與EBV感染有關(guān),其中包括NKTCL[13]。目前,關(guān)于EBV致瘤性的研究多來自B細(xì)胞或鼻咽上皮細(xì)胞,雖然成熟NK/T細(xì)胞也是EBV正常的宿主細(xì)胞,但與B細(xì)胞或鼻咽上皮細(xì)胞相比,成熟NK/T細(xì)胞具有完全不同的生物學(xué)特點,與EBV相互作用機制也有根本性不同。因此,EBV相關(guān)NKTCL的發(fā)病機制尚未明確。多項研究表明,EBV編碼病毒產(chǎn)物,激活相關(guān)通路從而促進腫瘤發(fā)生[5,14-16]。目前,已有關(guān)于致瘤性病毒DNA整合位點的研究報道,這些整合位點遍布在宿主細(xì)胞每條染色體上,多數(shù)表現(xiàn)為隨機性,但有部分高頻的整合位點。如Adey等[17]研究表明,宮頸癌Hela細(xì)胞系染色體8q24存在HPV DNA高頻整合位點,此位點位于原癌基因MYC上游約500 kb。研究顯示,Hela基因組中HPV整合片段可以激活原癌基因MYC的表達[18-19]。本研究共選取5例EBV(+)和4例EBV(-)NK/T樣本進行全基因組測序和生物信息學(xué)分析,考慮到樣本含量較少,獲取的大量生物學(xué)信息多為復(fù)雜冗余信息。因此,本研究重點放在明確和驗證EBV DNA在基因組中的整合上。為此,本研究經(jīng)全基因組序列比對捕獲EBV整合序列,發(fā)現(xiàn)相較EBV(-)樣本、EBV(+)鼻咽癌細(xì)胞系CNE1和EBV(+)T/NK淋巴組織增殖性疾病組織,EBV(+)NKTCL細(xì)胞系SNK、YTS和EBV(+)鼻腔NTKCL組織的基因組中EBV整合序列最多,且3個樣本在chr2:30234084-30234483 400 bp區(qū)域均存在大量的插入與刪除,將3個樣本放在一起進行IGV比對,觀察到每個樣本的區(qū)域大致相同。本研究推測,在EBV陽性樣本chr2p23.1區(qū)域可能存在EBV DNA的整合位點,亟需進一步分析。因此,本研究對包含chr2:30234084-30234483 400 bp區(qū)域在內(nèi)的片段進行擴增并sanger測序,發(fā)現(xiàn)EBV(+)NKTCL細(xì)胞系SNK、YTS和EBV(+)鼻腔NTKCL組織中均存在chr2p23.1位點的插入缺失,且均為EBV基因組序列來源。
綜上所述,利用NCBI BLAST和USCS BLAT檢索chr2p23.1區(qū)域可發(fā)現(xiàn),在chr2:29192774-29921611區(qū)域存在間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)基因序列,2007年Soda等[20-21]發(fā)現(xiàn)ALK基因重排,并表明棘皮動物微管相關(guān)類蛋白(echinoderm microtubule-associated protein-like 4,EML4)與ALK的融合(EML4-ALK)為非小細(xì)胞肺癌的驅(qū)動基因。此外,在chr2:30231531-30260033區(qū)域存在枝芽心臟基因(limb-bud and heart,LBH)。有研究發(fā)現(xiàn),LBH的過度表達可能與肝細(xì)胞癌的不良預(yù)后有關(guān)[22]。本研究在chr2p23.1區(qū)域也檢索出XDH、YPEL5等基因序列和一些未知序列,提示EBV DNA在chr2p23.1區(qū)域的高頻整合可能影響相關(guān)基因表達,從而促進NKTCL的發(fā)生發(fā)展。但僅依據(jù)生物信息學(xué)分析不能明確EBV DNA整合對宿主基因組功能的影響,本研究將在后續(xù)研究中針對這一區(qū)域的關(guān)鍵基因開展生物信息學(xué)分析和生物學(xué)功能研究。