王鵬宇, 胡圣晨, 陳浙南, 王 彥, 姜 瑩
(1.牡丹江醫(yī)學(xué)院,黑龍江省牡丹江市157000;2.南華大學(xué)附屬第一醫(yī)院,湖南省衡陽(yáng)市421000)
結(jié)直腸癌(colorectal cancer,CRC)是最常見(jiàn)的惡性腫瘤之一[1]。目前治療方式仍以手術(shù)及放化療為主,靶向治療逐漸進(jìn)入臨床并取得一定療效,但易出現(xiàn)耐藥現(xiàn)象,晚期CRC患者預(yù)后仍未得到明顯改善。因此尋找新的診斷及治療靶點(diǎn)尤為重要。對(duì)CRC相關(guān)基因的研究有利于對(duì)關(guān)鍵基因進(jìn)行鑒定或找到新的靶點(diǎn),以提高CRC的篩查效率、改善晚期CRC患者的預(yù)后。
TRIM(tripatite motif)蛋白家族是參與泛素化過(guò)程的E3連接酶,介導(dǎo)泛素從E2結(jié)合酶到特定靶點(diǎn)上的轉(zhuǎn)移[2]。TRIM44蛋白作為家族成員與細(xì)胞增殖、DNA修復(fù)、信號(hào)轉(zhuǎn)導(dǎo)以及轉(zhuǎn)錄等各種生理學(xué)過(guò)程密切相關(guān)[3]。最初研究發(fā)現(xiàn)TRIM44可能在神經(jīng)元細(xì)胞的分化和成熟過(guò)程中起作用,調(diào)節(jié)TRIM17的活動(dòng),是PAX6表達(dá)的負(fù)調(diào)控因子[4]。目前研究指出TRIM44蛋白在多種腫瘤的發(fā)病過(guò)程中起著重要作用,可通過(guò)Wnt/β-catenin[5]、Akt/p21/p27[6]、mTOR[7-10]、NF-κB[11-12]等信號(hào)通路在甲狀腺癌、神經(jīng)膠質(zhì)細(xì)胞癌、肺癌、肝癌等多種癌癥中發(fā)揮作用,使得TRIM44在腫瘤中的研究逐漸得到重視。
本研究對(duì)多個(gè)數(shù)據(jù)庫(kù)進(jìn)行挖掘,旨在闡明TRIM44在CRC中的表達(dá)及意義,為進(jìn)一步實(shí)驗(yàn)研究奠定理論基礎(chǔ)。
結(jié)直腸癌的原始數(shù)據(jù)從TCGA(https://portal.gdc.cancer.gov/)數(shù)據(jù)庫(kù)下載,檢索條件如下:文件數(shù)據(jù)類型:轉(zhuǎn)錄組分析;數(shù)據(jù)類型:基因表達(dá)定量;工作流程類型:HTSeq-FPKM;樣本主要位點(diǎn):Colon;方案:TCGA-COAD TCGA-READ(TCGA Project)。
免疫浸潤(rùn)的原始數(shù)據(jù)來(lái)源于GEO數(shù)據(jù)庫(kù)大腸癌基因表達(dá)譜研究(GSE113513)中的基于Affymetrix人類基因表達(dá)陣列平臺(tái)(GPL15207)的28個(gè)組織芯片。
利用Active Perl(5.28.1Build 2801)編寫(xiě)的腳本將count數(shù)據(jù)(正常樣本量32、腫瘤樣本量375)與人類基因組注釋文件(gtf)進(jìn)行合并生成單基因樣本的mRNA表達(dá)矩陣,然后利用R for Windows 4.0.3編寫(xiě)的腳本進(jìn)行結(jié)腸癌(COAD)與直腸癌(READ)的散點(diǎn)差異分析以及配對(duì)差異分析。
通過(guò)GEPIA數(shù)據(jù)庫(kù)中基于TCGA和GTEx的8 587個(gè)正常組織樣本,9 736個(gè)腫瘤組織樣本的RNA測(cè)序表達(dá)數(shù)據(jù),分析TRIM44在31種腫瘤中的差異表達(dá)。隨后,通過(guò)Oncomine數(shù)據(jù)庫(kù)顯示CRC臨床標(biāo)本中過(guò)度表達(dá)或DNA拷貝數(shù)量較多的基因,設(shè)置基因TRIM44[P=all,倍數(shù)變化=1.5,閾值(按基因排序)=all,數(shù)據(jù)類型=all],篩選出CRC數(shù)據(jù),并設(shè)置分析類型為癌-常分析、數(shù)據(jù)類型為mRNA,再加入限制條件生存狀態(tài),得到來(lái)自12個(gè)數(shù)據(jù)庫(kù)的675個(gè)正常樣本與53例腫瘤樣本,對(duì)其在不同腫瘤組織中的差異表達(dá)情況進(jìn)行排序。
利用Oncolnc交互式探索生存相關(guān)性并下載與mRNA表達(dá)數(shù)據(jù)耦合的臨床數(shù)據(jù)。以P<0.05判定差異有顯著性,進(jìn)行Kaplan-Meier分析并創(chuàng)建生存圖。
基于LinkedOmics數(shù)據(jù)庫(kù)中來(lái)自32種TCGA癌癥類型的數(shù)據(jù)與臨床蛋白質(zhì)組學(xué)腫瘤分析協(xié)會(huì)(CPTAC)生成的基于質(zhì)譜的蛋白質(zhì)組學(xué)數(shù)據(jù)。查看TRIM44在CRC中的基因共表達(dá)情況,選擇癌癥隊(duì)列為COADREAD,設(shè)置搜索數(shù)據(jù)庫(kù)與目標(biāo)數(shù)據(jù)均為樣本隊(duì)列TCGA_COADREAD(樣本隊(duì)列:TCGA_COADREAD,研究機(jī)構(gòu):UNC,數(shù)據(jù)類型:RNAseq,平臺(tái):HiSeq RNA,數(shù)據(jù)日期:01/28/2016,研究機(jī)構(gòu):BI,分析層面:Gene),進(jìn)行Spearman相關(guān)性檢驗(yàn)。
導(dǎo)出LinkedOmics數(shù)據(jù)庫(kù)中上述共表達(dá)數(shù)據(jù),分別篩選與TRIM44正相關(guān)或負(fù)相關(guān)的前50個(gè)基因,導(dǎo)入David進(jìn)行GO功能分析與KEGG通路富集分析,篩選最具代表性的前5個(gè)通路依次制表。
使用TIMER網(wǎng)絡(luò)分析工具,設(shè)置檢索基因TRIM44,限制癌癥類型為COAD與READ,探究TRIM44在CRC中B細(xì)胞、CD8+T細(xì)胞、CD+T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞與樹(shù)突狀細(xì)胞的免疫浸潤(rùn)情況,以P<0.05判定差異有顯著性。
利用GEO芯片數(shù)據(jù)庫(kù)篩選符合研究條件的樣本,并下載來(lái)自GSE113513的矩陣數(shù)據(jù)與平臺(tái)文件GPL15207。利用perl進(jìn)行ID轉(zhuǎn)換分類排序,利用Rlimma包將數(shù)據(jù)正?;\(yùn)行CIBERSORT輸出結(jié)果并利用perl對(duì)其進(jìn)行過(guò)濾(以P<0.05為標(biāo)準(zhǔn)篩選)。然后使用R pheatmap、corrplot、vioplot包與一些自定義函數(shù)進(jìn)行結(jié)果的可視化與再分析,并在GEPIA查看免疫細(xì)胞相關(guān)基因與TRIM44的共表達(dá)情況。
通過(guò)R軟件4.0.3版進(jìn)行分析。除非另有說(shuō)明,默認(rèn)P<0.05具有統(tǒng)計(jì)學(xué)意義。
通過(guò)GEPIA數(shù)據(jù)庫(kù)分析TRIM44在31項(xiàng)腫瘤中的表達(dá)水平,獲得所有腫瘤樣品和正常組織配對(duì)的基因表達(dá)譜,單基因分析結(jié)果顯示,TRIM44在腫瘤表達(dá)的差異性較大,其中在CRC組織中呈現(xiàn)高表達(dá)(圖1A),COAD組織較正常組織TRIM44表達(dá)高出約20%,READ組織較正常組織TRIM44表達(dá)高出約26%。隨后,通過(guò)Oncomine分析TRIM44在腫瘤中的表達(dá)情況,從癌-常對(duì)比中,可看出TRIM44在CRC中的表達(dá)較正常組織較高,并在癌-癌對(duì)比中和癌癥組織學(xué)與多癌癥對(duì)比中顯示出明顯差異(圖1B)。對(duì)TCGA數(shù)據(jù)庫(kù)提取的數(shù)據(jù)進(jìn)行R語(yǔ)言分析,結(jié)果顯示TRIM44在COAD的腫瘤組織與正常組織表達(dá)有明顯差異(P<0.001),配對(duì)差異分析顯示,COAD組織中TRIM44高表達(dá)(P<0.05)(圖1C)。READ樣本量少,癌-常差異表達(dá)(P=0.561)和配對(duì)差異分析(P=0.333)均無(wú)統(tǒng)計(jì)學(xué)意義(圖1D)。
圖1 TRIM44的差異表達(dá)情況A為GEPIA數(shù)據(jù)庫(kù);B為Oncomine數(shù)據(jù)庫(kù);C和D為T(mén)CGA數(shù)據(jù)庫(kù)。
通過(guò)使用Oncolnc工具分析TRIM44 mRNA表達(dá)與CRC患者預(yù)后的關(guān)系,從TRIM44 Cox回歸結(jié)果發(fā)現(xiàn),22例(5%)COAD腫瘤組織低表達(dá)與22例(5%)COAD組織高表達(dá)患者預(yù)后差異有顯著性(P<0.05)(圖2)。23例(15%)READ腫瘤組織低表達(dá)與23例(15%)READ腫瘤組織高表達(dá)患者預(yù)后差異有顯著性(P<0.05)(圖2)。TRIM44 mRNA高表達(dá)COAD患者其總體生存率要低于低表達(dá)COAD患者,而TRIM44 mRNA高表達(dá)READ患者其總體生存率要高于低表達(dá)READ患者。
基因的共表達(dá)反映了構(gòu)成功能關(guān)系的常見(jiàn)遺傳風(fēng)險(xiǎn)因素,因此本文研究了在結(jié)腸中TRIM44與其他基因表達(dá)的共存情況。利用LinkedOmics在CRC中檢查了其他基因與TRIM44的共表達(dá)情況(圖3A)。Spearman相關(guān)系數(shù)檢驗(yàn)結(jié)果顯示,19 828個(gè)基因條目中,ASXL2、TAOK1、REST、KIAA0754、FAM168A、TGFBRAP1、PARD3B、RAD54L2、STRN等基因與TRIM44表達(dá)呈正相關(guān),MRPL55、KRTCAP2、C9orf142、BLOC1S1、PSMG3、CHCHD1、FAM128B、NDUFC1、WIBG等基因與TRIM44表達(dá)呈負(fù)相關(guān)(圖3B)。
圖2 TRIM44表達(dá)與COAD和READ患者生存預(yù)后的相關(guān)性分析
圖3 TRIM44共表達(dá)基因的相關(guān)性分析A為T(mén)RIM44共表達(dá)基因差異分析;B為T(mén)RIM44共表達(dá)正相關(guān)和負(fù)相關(guān)基因。
選取與TRIM44正相關(guān)或負(fù)相關(guān)的前50個(gè)基因進(jìn)行GO分析,結(jié)果如表1所示,TRIM44相關(guān)基因主要富集于以DNA為模板的轉(zhuǎn)錄調(diào)控、RNA聚合酶Ⅱ啟動(dòng)子的轉(zhuǎn)錄、蛋白磷酸化、絲氨酸/蘇氨酸的活性等通路。KEGG通路富集分析顯示,TRIM44可能參與調(diào)節(jié)干細(xì)胞多能性信號(hào)通路并與病毒的致癌作用相關(guān)。
表1 GO功能和KEGG通路分析
從TIMER數(shù)據(jù)庫(kù)分析TRIM44表達(dá)是否與腫瘤免疫浸潤(rùn)水平相關(guān)。圖4結(jié)果顯示,TRIM44表達(dá)在COAD中與腫瘤純度無(wú)顯著相關(guān)性(P=0.489),與CD8+T細(xì)胞(P<0.001)、CD4+T細(xì)胞(P<0.001)、巨噬細(xì)胞(P<0.001)、中性粒細(xì)胞(P<0.001)和樹(shù)突狀細(xì)胞(P<0.001)的浸潤(rùn)水平顯著相關(guān),與B細(xì)胞(P<0.05)浸潤(rùn)水平相關(guān)。TRIM44表達(dá)在READ中與腫瘤純度無(wú)顯著相關(guān)性(P=0.306),與CD8+T細(xì)胞(P<0.001)、巨噬細(xì)胞(P<0.05)、中性粒細(xì)胞(P<0.001)和樹(shù)突狀細(xì)胞(P<0.001)的浸潤(rùn)水平顯著相關(guān),與B細(xì)胞(P<0.05)浸潤(rùn)水平相關(guān)。
圖4 基于TIMER數(shù)據(jù)庫(kù)的免疫浸潤(rùn)分析結(jié)果
GSE113513芯片樣本中免疫細(xì)胞比例顯示出單核細(xì)胞、M0細(xì)胞浸潤(rùn)較多(圖5A),結(jié)直腸癌及正常組織樣本中免疫細(xì)胞分布多集中在肥大細(xì)胞、M0細(xì)胞和M2細(xì)胞(圖5B)。結(jié)直腸癌組織樣本免疫細(xì)胞矩陣顯示M0與M2細(xì)胞之間相關(guān)性較高(圖5C)。
圖5 GSE113513芯片樣本中免疫組化分析結(jié)果A為GSE113513芯片樣本中免疫細(xì)胞比例;B為結(jié)直腸癌及正常樣本中免疫細(xì)胞分布;C為結(jié)直腸癌組織樣本免疫細(xì)胞相關(guān)性。
小提琴圖顯示M0細(xì)胞(P<0.05)與M2細(xì)胞(P<0.05)在CRC組織中差異有顯著性(圖6A)。GEPIA數(shù)據(jù)庫(kù)中TRIM44與M0相關(guān)基因CCL2(P<0.001)、CD68(P<0.001)、IL-10(P<0.001)以及M2相關(guān)基因CD163(P<0.001)、VSIG4(P<0.001)、MS4A4A(P<0.001)顯著相關(guān)(圖6B)。
圖6 GSE113513芯片樣本中免疫組化分析結(jié)果A為結(jié)直腸癌及正常組織中免疫細(xì)胞差異分析,其中藍(lán)色為正常組織,紅色為結(jié)直腸癌;B為T(mén)RIM44與M0相關(guān)基因(CCL2、CD68、IL-10)以及M2相關(guān)基因(CD163、VSIG4、MS4A4A)的相關(guān)性分析。
隨著生活水平的改善,居民飲食比例出現(xiàn)了很大改變,動(dòng)物蛋白及脂肪攝入的增加使得結(jié)直腸癌的發(fā)病率和死亡率逐漸上升。2020年,CRC死亡人數(shù)估計(jì)約5.3萬(wàn),其中50歲以下約3 640人,占7%[13]。近年來(lái),新確診患者年齡年輕化,超過(guò)50%患者可歸因于可改變風(fēng)險(xiǎn)因素,通過(guò)篩查和監(jiān)測(cè)來(lái)進(jìn)一步預(yù)防,并且在年輕患者中進(jìn)行更加及時(shí)的診斷,尤為重要。目前,篩查CRC最有效的手段包括高靈敏度糞便檢測(cè)或電子結(jié)直腸鏡檢查,但是目前受限于檢測(cè)條件與患者依從性,篩查效率與可行性不高,迫切需要尋找新的篩查與判斷預(yù)后的基因靶點(diǎn)。目前研究表明TRIM44在多腫瘤中有較高表達(dá),主要通過(guò)Akt/mTOR信號(hào)通路發(fā)揮作用[8]。REN等[14]研究表明ELFN1-AS1通過(guò)調(diào)節(jié)miR-4644/TRIM44軸促進(jìn)CRC的增殖、遷移,可作為CRC的預(yù)后指標(biāo)。Sun等[15]認(rèn)為L(zhǎng)INC00265通過(guò)調(diào)節(jié)miR-216b-5p/TRIM44軸促進(jìn)大腸癌的糖酵解和乳酸生成。TRIM44在CRC中相關(guān)機(jī)制漸呈體系,并已有學(xué)者利用靶向TRIM44來(lái)抑制上皮-間質(zhì)轉(zhuǎn)化減弱膠質(zhì)母細(xì)胞瘤的增殖和轉(zhuǎn)移[16]。因此通過(guò)多數(shù)據(jù)庫(kù)宏觀查看TRIM44在CRC中的表達(dá)可找到相關(guān)機(jī)制共性,也可進(jìn)一步證實(shí)相關(guān)結(jié)果的準(zhǔn)確性。
不同于既往體外培養(yǎng)和流式細(xì)胞術(shù)等技術(shù)分析腫瘤的模式,多數(shù)據(jù)庫(kù)的挖掘分析利于規(guī)避小樣本量與地理環(huán)境等差異導(dǎo)致的不可控變量的影響,可作為臨床實(shí)驗(yàn)的前瞻研究與重要補(bǔ)充。本研究首先分析TCGA數(shù)據(jù)庫(kù)中CRC,探究其癌-常差異表達(dá),并利用GEPIA、Oncomine數(shù)據(jù)查看TRIM44在CRC中的表達(dá)情況,發(fā)現(xiàn)TRIM44在CRC中高表達(dá)。TCGA數(shù)據(jù)分析中,READ由于入選TCGA數(shù)據(jù)中正常組織樣本較少,計(jì)算統(tǒng)計(jì)檢驗(yàn)量時(shí)偏倚較大,著重關(guān)注COAD與READ混合樣本產(chǎn)生的結(jié)果利于彌補(bǔ)樣本量少的問(wèn)題。Oncolnc結(jié)果顯示,CRC患者中TRIM44表達(dá)與預(yù)后相關(guān)。通過(guò)挖掘LinkedOmics數(shù)據(jù)庫(kù)得到CRC中19 828個(gè)基因與TRIM44的Spearman相關(guān)系數(shù),對(duì)正相關(guān)前50個(gè)基因與負(fù)相關(guān)前50個(gè)基因進(jìn)行了GO與KEGG通路富集分析,發(fā)現(xiàn)TRIM44相關(guān)基因主要富集于以DNA為模板的轉(zhuǎn)錄調(diào)控、RNA聚合酶Ⅱ啟動(dòng)子的轉(zhuǎn)錄、蛋白磷酸化、絲氨酸/蘇氨酸的活性等通路,顯示出TRIM44可能參與調(diào)節(jié)干細(xì)胞多能性的信號(hào)通路,并與病毒的致癌作用密切相關(guān)。TIMER數(shù)據(jù)庫(kù)分析結(jié)果顯示,TRIM44在CRC中與巨噬細(xì)胞顯著相關(guān)。GEO芯片結(jié)果顯示M0和M2細(xì)胞可能參與CRC細(xì)胞的增殖,利用GEPIA探究M0和M2基因與TRIM44的相關(guān)性,發(fā)現(xiàn)TRIM44與巨噬細(xì)胞在CRC中顯著相關(guān)。以往體外實(shí)驗(yàn)表明,腫瘤相關(guān)免疫細(xì)胞分泌的炎性因子如CCL2、IL-1α等和極化后的M2型巨噬細(xì)胞分泌的細(xì)胞因子,可促進(jìn)CRC細(xì)胞增殖和腫瘤生長(zhǎng)[17]。因?yàn)镚O分析中TRIM44還在轉(zhuǎn)錄調(diào)控、蛋白質(zhì)加工等方面發(fā)揮作用,推測(cè)TRIM44通過(guò)調(diào)控CRC細(xì)胞中某成分的表達(dá)或作用,募集巨噬細(xì)胞進(jìn)入腫瘤免疫微環(huán)境激活CCL2基因進(jìn)而促CRC腫瘤細(xì)胞增殖。
本研究通過(guò)生物信息學(xué)方法分析發(fā)現(xiàn),TRIM44高表達(dá)于結(jié)直腸癌組織,可作用于M0和M2巨噬細(xì)胞,影響轉(zhuǎn)錄調(diào)控、蛋白磷酸化及絲氨酸/蘇氨酸代謝活性,對(duì)結(jié)直腸癌的發(fā)病進(jìn)行調(diào)控,且與患者預(yù)后相關(guān),有望成為結(jié)直腸癌早期診斷與臨床治療的診斷標(biāo)志物與治療靶點(diǎn),為接下來(lái)的實(shí)驗(yàn)研究提供理論基礎(chǔ),但本研究基于生物信息學(xué)分析,有關(guān)結(jié)論仍需通過(guò)大樣本臨床研究加以驗(yàn)證。