李姝婧, 劉懷峰, 王香港, 王清晴, 陳玉欣, 石兵兵, 譚靜文, 王媛媛
(蚌埠醫(yī)學(xué)院 生命科學(xué)學(xué)院,安徽 蚌埠 233030)
原發(fā)性肝癌是一種高度惡性的腫瘤,在世界范圍內(nèi),肝癌居男性惡性腫瘤第7位,居女性第9位,在我國(guó)腫瘤發(fā)病率排名前3位。由于肝癌早期癥狀和臨床體征不顯著,其發(fā)病具有隱匿性并且病程進(jìn)展快速,造成大多數(shù)患者在確診時(shí)已是晚期,所以預(yù)后效果差,且患者生存率低[1-2]。因此,提高早期診斷率、開(kāi)展肝癌早期診斷和治療的關(guān)鍵分子機(jī)制的研究,對(duì)于降低肝癌死亡率和提高患者的預(yù)后水平具有重要意義。
基因組的穩(wěn)定性直接關(guān)聯(lián)到細(xì)胞是否發(fā)生癌變,其中DNA復(fù)制是最容易發(fā)生變化的過(guò)程,也是最容易致癌的過(guò)程。任何導(dǎo)致DNA損傷高水平發(fā)生的條件也都會(huì)引發(fā)復(fù)制應(yīng)激(Replication Stress),這是基因組不穩(wěn)定的來(lái)源之一,也是癌變前細(xì)胞和癌變細(xì)胞的一大標(biāo)志[3-4]。參與DNA復(fù)制穩(wěn)定性的因素是癌癥治療的潛在靶點(diǎn)。Timeless(TIM)及其伙伴T(mén)IM互作蛋白(TIM-interacting protein,TIPIN)是復(fù)制叉保護(hù)復(fù)合物(RFC)的組成成員,并參與正常DNA復(fù)制過(guò)程來(lái)維持基因組穩(wěn)定性[5-6]。TIM-TIPIN在協(xié)調(diào)復(fù)制解旋酶和聚合酶以調(diào)節(jié)單鏈DNA(ssDNA)聚合方面起著重要作用[7]。然而,關(guān)于TIPIN與腫瘤的聯(lián)系有限,通過(guò)生物信息學(xué)方法研究TIPIN在肝癌中的表達(dá)及其臨床病理特征和預(yù)后價(jià)值,初步揭示TIPIN潛在的分子作用機(jī)制,有望為臨床上肝癌的早期診斷和治療提供依據(jù)和關(guān)鍵技術(shù)支持。
進(jìn)入TCGA的repository界面(https://portal.gdc.cancer.gov/repository)中,先在Cases中選項(xiàng)欄中進(jìn)行選擇,其中Primary Site選項(xiàng)中選擇liver and intrahepatic bile ducts,在Project選項(xiàng)中選擇TCGA-LIHC。隨后在file的選項(xiàng)欄中再進(jìn)行選擇,在Data Category中選擇transcriptome profiling, Data Type中選擇Gene Expression Quantification,Experimental Strategy中選擇RNA-seq,Workflow Type中選擇HTSeq-FPKM。將查找符合條件的所有數(shù)據(jù)全部加入cart中,進(jìn)行數(shù)據(jù)的下載。
利用Rstudio軟件中l(wèi)imma和beeswarm包對(duì)TCGA中LIHC數(shù)據(jù)進(jìn)行歸一化處理,提取腫瘤組和正常組的TIPIN基因的表達(dá)量并繪圖。對(duì)424例病人樣本進(jìn)行篩選分析,將來(lái)自相同患者的癌常組與腫瘤組樣本進(jìn)行配對(duì)(共50對(duì)),并對(duì)TIPIN基因的表達(dá)量進(jìn)行提取,通過(guò)Rstudio軟件繪制配對(duì)圖。
采用Rstudio中survival包對(duì)376例TCGA-LIHC患者的TIPIN基因表達(dá)和總生存率(OS)進(jìn)行生存分析(去除無(wú)生存時(shí)間的病例1例)。利用Kaplan Meier網(wǎng)站(Http://kmplot.com/analysis)對(duì)TIPIN基因進(jìn)行生存曲線分析的驗(yàn)證。在KM-plotter主界面選擇mRNA(RNA-seq)中的Start KM Plotter for liver cancer,填入需要檢索的基因名,其它選項(xiàng)選取默認(rèn)值。
將得到的377例肝癌患者的臨床信息進(jìn)行整理,根據(jù)患者的年齡、性別、分級(jí)、TNM分期、浸潤(rùn)深度、淋巴結(jié)轉(zhuǎn)移和遠(yuǎn)處轉(zhuǎn)移等臨床病理特征,去除臨床信息不完整的患者數(shù)據(jù),最后,獲得235例患者,利用Rstudio軟件的survminer和survival包進(jìn)行COX分析,以評(píng)估臨床特征與基因的聯(lián)合作用。
使用ROC曲線來(lái)測(cè)定臨床的診斷價(jià)值,通過(guò)結(jié)合病人生存時(shí)間并按基因表達(dá)量的中位數(shù)進(jìn)行高、低風(fēng)險(xiǎn)劃分,使用Rstudio軟件中的survival ROC包進(jìn)行ROC曲線分析,并獲得曲線下面積(AUC)。
根據(jù)TIPIN基因mRNA表達(dá)量的中位數(shù)將TCGA-LIHC數(shù)據(jù)分為高表達(dá)組和低表達(dá)組。GSEA檢測(cè)2組中排名靠前的基因富集的通路。對(duì)于每個(gè)分析,基因集排列的數(shù)量被設(shè)置為1 000。用標(biāo)稱(NOM)P值、假發(fā)現(xiàn)率(FDR)來(lái)識(shí)別每種表型的富集途徑,NOM p-value<0.05和FDR q-value<0.25的基因集被認(rèn)為是重要的。
利用cBioportal 數(shù)據(jù)庫(kù) (Https://www.cbioportal.org) 對(duì)TIPIN的共表達(dá)基因進(jìn)行鑒定,以篩選與TIPIN相互作用的蛋白,選擇與TIPIN顯著相關(guān)的前10個(gè)基因進(jìn)行進(jìn)一步分析。并在TCGA數(shù)據(jù)庫(kù)中驗(yàn)證它們與TIPIN的相關(guān)性,利用Rstudio軟件對(duì)TCGA數(shù)據(jù)庫(kù)中的LIHC數(shù)據(jù)進(jìn)行FANCI基因的表達(dá)量以及生存分析的檢測(cè)。
使用Rstudio軟件進(jìn)行統(tǒng)計(jì)檢驗(yàn)。使用t檢驗(yàn)比較2組之間統(tǒng)計(jì)學(xué)意義。使用Schoenfeld個(gè)體檢驗(yàn)來(lái)評(píng)估COX回歸模型擬合的比例風(fēng)險(xiǎn)假設(shè)。使用單變量和多變量COX比例風(fēng)險(xiǎn)模型進(jìn)行生存期生存分析,將其分為最優(yōu)截?cái)嘀?該截?cái)嘀涤蒖包 survminer的survc-utpoint函數(shù)生成,將表達(dá)水平二分。P<0.05被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。
為了研究TIPIN的預(yù)后價(jià)值,通過(guò)結(jié)合TCGA中肝癌患者(N=377)的臨床數(shù)據(jù)并去除無(wú)生存時(shí)間的患者,繪制TIPIN基因的生存曲線圖。結(jié)果顯示,TIPIN低表達(dá)的患者生存率較高,而高表達(dá)患者生存率顯著降低,P值為0.001(圖1A)。隨后利用Kaplan Meier在線數(shù)據(jù)庫(kù)對(duì)TIPIN基因的生存分析進(jìn)行驗(yàn)證,與之前的結(jié)果一致,肝癌患者TIPIN基因的高表達(dá)不利于病人的生存,且P值為0.000 15(圖1B)。生存分析表明,TIPIN可以作為判斷肝癌患者病情進(jìn)展和預(yù)后的指標(biāo)。
圖1 TIPIN基因的生存分析
將TCGA中LIHC數(shù)據(jù)的424例病人樣本進(jìn)行歸一化處理,發(fā)現(xiàn)在肝癌中TIPIN的mRNA表達(dá)量顯著高于正常肝組織(圖2A)。進(jìn)一步對(duì)病人樣本進(jìn)行整理,將來(lái)自相同患者的50對(duì)癌常組樣本與腫瘤組樣本進(jìn)行配對(duì)分析,發(fā)現(xiàn)腫瘤組TIPIN的表達(dá)量明顯上調(diào)(圖2B)。此外,除了在肝癌組織中,TIPIN基因在乳腺癌(BRCA)、膽管癌(CHOL)、彌漫性大B細(xì)胞淋巴瘤(DLBC)和腦膠質(zhì)瘤(GBM)等癌組織中也是顯著高表達(dá)(圖2C)。以上結(jié)果表明,TIPIN基因與癌癥的發(fā)生發(fā)展密切相關(guān)。
圖2 TIPIN基因在癌組織中的表達(dá)水平
為了進(jìn)一步驗(yàn)證TIPIN的臨床相關(guān)性,基于TCGA數(shù)據(jù)庫(kù)中肝癌患者的臨床數(shù)據(jù),使用單因素COX進(jìn)行分析,研究TIPIN的表達(dá)與肝癌患者年齡、性別、分級(jí)、TIPIN分期、浸潤(rùn)深度、淋巴結(jié)轉(zhuǎn)移和遠(yuǎn)處轉(zhuǎn)移等臨床病例特征的關(guān)系。我們發(fā)現(xiàn)TIPIN的表達(dá)量與臨床分期顯著相關(guān)(圖3A),隨著臨床分期增加總體呈現(xiàn)上升趨勢(shì)(Ⅳ期可能由于病人樣本數(shù)少)。單因素COX分析結(jié)果顯示,TIPIN基因在肝癌患者中是一個(gè)高危因素(HR為1.39;95%CI為1.14~1.69),除此之外,原發(fā)腫瘤T (HR為1.80;95% CI為1.43~2.27)、腫瘤的遠(yuǎn)處轉(zhuǎn)移M (HR為3.85;95%CI為1.21~12.28)和分期stage (HR為1.86;95% CI為1.46~2.39也都是高危因素(表1)。隨后為了進(jìn)一步探討TIPIN基因在肝癌中的作用,我們進(jìn)行了多因素COX分析,分析結(jié)果表明,TIPIN(HR為1.33;95% CI為1.08~1.65;P=0.008)仍與總生存期獨(dú)立相關(guān)(圖3B和表1),TIPIN基因可以作為肝癌患者的獨(dú)立預(yù)后因素。
為了進(jìn)一步驗(yàn)證TIPIN基因在肝癌中的臨床診斷價(jià)值,對(duì)TCGA數(shù)據(jù)庫(kù)中肝癌患者的臨床數(shù)據(jù)進(jìn)行了整理,通過(guò)結(jié)合病人生存時(shí)間并按基因表達(dá)量的中位數(shù)進(jìn)行高低風(fēng)險(xiǎn)劃分,隨后利用Rstudio軟件進(jìn)行ROC曲線繪圖。結(jié)果表明,TIPIN基因3年的ROC曲線下面積AUC值為0.622(圖4),具有一定的臨床診斷價(jià)值。
圖3 TIPIN基因的臨床相關(guān)性
表1 肝癌患者預(yù)后因素COX回歸模型分析(TIPIN)
圖4 TIPIN基因的ROC曲線風(fēng)險(xiǎn)評(píng)分
為了研究TIPIN基因在肝癌發(fā)生中的潛在分子功能,對(duì)TIPIN低表達(dá)和高表達(dá)的樣本進(jìn)行GSEA分析,以預(yù)測(cè)TIPIN相關(guān)的信號(hào)通路。富集結(jié)果分析顯示,178條信號(hào)通路中有145條上調(diào),其中72條信號(hào)通路在NOMP<0.05和FDR<0.25條件下顯著富集。TIPIN高表達(dá)樣本中,多種腫瘤相關(guān)的KEGG通路顯著富集,如膀胱癌信號(hào)通路(圖5A)、DNA復(fù)制信號(hào)通路(圖5B)、非小細(xì)胞性肺癌信號(hào)通路(圖5C)、NOTCH信號(hào)通路(圖5D)、P53信號(hào)通路(圖5E)、WNT信號(hào)通路(圖5F)等。
圖5 TIPIN基因的綜合GSEA分析
為了進(jìn)一步研究TIPIN在肝癌發(fā)生發(fā)展中的作用機(jī)制,利用cBioportal數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘,篩選與TIPIN相互作用的基因。我們發(fā)現(xiàn)FANCI與TIPIN顯著正相關(guān)(圖6A)。進(jìn)一步對(duì)FANCI基因進(jìn)行臨床相關(guān)性分析,發(fā)現(xiàn)FANCI高表達(dá)患者生存率顯著降低 (圖6B),在肝癌組織中FANCI的表達(dá)水平明顯高于正常肝組織(圖6C),進(jìn)一步對(duì)病人樣本進(jìn)行整理,將來(lái)自相同患者的50對(duì)癌常組樣本與腫瘤組樣本進(jìn)行配對(duì)分析,發(fā)現(xiàn)腫瘤組TIPIN的表達(dá)量明顯上調(diào)(圖6D),這與TIPIN的分析結(jié)果一致。這些結(jié)果表明,TIPIN與及其共表達(dá)基因FANCI可能共同促進(jìn)了肝癌的發(fā)生與發(fā)展。
圖6 TIPIN基因的共表達(dá)分析
DNA損傷和修復(fù)反應(yīng)在癌癥發(fā)生與發(fā)展過(guò)程中作用已經(jīng)得到了廣泛的研究,對(duì)于癌癥的發(fā)生與發(fā)展是一把雙刃劍。一方面,DNA修復(fù)的破壞增加了基因組的不穩(wěn)定性和突變,導(dǎo)致致癌基因表達(dá)的導(dǎo)常,或腫瘤抑制基因發(fā)生功能喪失的突變,這兩種突變都可以驅(qū)動(dòng)腫瘤生長(zhǎng),這是癌癥的一個(gè)基本標(biāo)志。另一方面,由于關(guān)鍵基因的突變、復(fù)制叉的停止或凋亡的觸發(fā),基因組穩(wěn)定性的破壞和不受控制的突變可能對(duì)腫瘤細(xì)胞有害。參與DNA損傷和修復(fù)過(guò)程中的很多基因發(fā)生突變或異常表達(dá),會(huì)促進(jìn)腫瘤的發(fā)生與發(fā)展。例如,參與DNA修復(fù)過(guò)程中的BRCA1基因,其突變與乳腺癌和卵巢癌的發(fā)病有關(guān)[4,8-9]。核苷酸切除修復(fù)相關(guān)蛋白R(shí)AD23B可抑制乳腺癌的發(fā)生與發(fā)展[10]。起始DNA復(fù)制和延伸的GINS4復(fù)合物可以通過(guò)激活Rac1和CDC42促進(jìn)胃癌細(xì)胞生長(zhǎng)和進(jìn)展[11]。
利用生物信息學(xué)分析方法篩選出新的肝癌診斷和預(yù)后生物標(biāo)志物TIPIN。TIPIN參與正常DNA復(fù)制以維持基因組穩(wěn)定性。TIPIN和其互作蛋白TIM形成的復(fù)合物TIM-TIPIN在協(xié)調(diào)復(fù)制解旋酶和聚合酶以調(diào)節(jié)單鏈DNA(ssDNA)聚合方面起著重要作用。本研究結(jié)果表明,在肝癌組織中TIPIN基因的表達(dá)水平顯著高于正常的肝臟組織,經(jīng)生存曲線圖發(fā)現(xiàn)TIPIN基因低表達(dá)的患者生存率較好,而高表達(dá)患者生存率顯著降低。通過(guò)臨床相關(guān)性的探究表明TIPIN基因是肝癌患者的一個(gè)高危因素,且可作為肝癌患者的獨(dú)立預(yù)后因素。之后針對(duì)TIPIN基因繪制肝癌3年的ROC曲線,線下面積AUC分別為0.622,說(shuō)明TIPIN基因具有一定的臨床診斷價(jià)值。此外,TIPIN高表達(dá)與膀胱癌、非小細(xì)胞性肺癌信號(hào)通路、子宮內(nèi)膜癌、前列腺癌、腦膠質(zhì)瘤等癌癥密切相關(guān),且NOTCH信號(hào)通路、P53信號(hào)通路、WNT信號(hào)通路和MAPK信號(hào)通路是TIPIN高表達(dá)富集的主要KEGG信號(hào)通路。GSEA結(jié)果表明TIPIN可能通過(guò)細(xì)胞周期,DNA復(fù)制等生理過(guò)程參與肝癌的發(fā)生發(fā)展過(guò)程?;蚬脖磉_(dá)分析顯示TIPIN與其共表達(dá)基因FANCI可能共同促進(jìn)了肝癌的發(fā)生與發(fā)展。
本文報(bào)道了TIPIN與肝癌之間的聯(lián)系,研究TIPIN在肝癌中的表達(dá)及其與臨床病理特征和預(yù)后價(jià)值,并揭示了TIPIN潛在的分子作用靶點(diǎn)。然而,關(guān)于TIPIN對(duì)肝癌細(xì)胞增殖、遷移和侵襲能力的影響,以及在荷瘤動(dòng)物模型中TIPIN影響肝癌發(fā)生發(fā)展的功能還需進(jìn)一步實(shí)驗(yàn)研究。總之,TIPIN可以作為肝癌診斷和預(yù)后的標(biāo)志物之一,有望為臨床上肝癌的早期診斷和治療提供依據(jù)和關(guān)鍵技術(shù)支持。