徐 瑩,褚以忞,楊大明,李 吉,張海芹,彭海霞
上海交通大學(xué)醫(yī)學(xué)院附屬同仁醫(yī)院內(nèi)窺鏡室,上海 200336
結(jié)直腸癌是世界范圍內(nèi)發(fā)病率第四的惡性腫瘤,其死亡率位列第二[1]。在我國(guó),結(jié)直腸癌位于所有惡性腫瘤發(fā)病率的第三位,死亡率排名第五[2]。雖然伴隨早期腫瘤發(fā)現(xiàn)的增多及腫瘤篩查的推廣,結(jié)直腸癌患者的5 年生存率有所提高,但是仍有25%的患者確診時(shí)為Ⅳ期,并且有25%~50%的患者確診時(shí)為早期而后發(fā)展為轉(zhuǎn)移性疾?。?-6]。轉(zhuǎn)移性結(jié)腸癌患者的預(yù)后較差。一項(xiàng)基于美國(guó)人群的統(tǒng)計(jì)數(shù)據(jù)顯示,其5 年中位生存率僅有12.5%[4]。因此,尋找預(yù)判轉(zhuǎn)移的生物學(xué)標(biāo)志物有著重要的意義。
微衛(wèi)星指的是廣泛分布于原核和真核生物基因組中的短的串聯(lián)重復(fù)序列,約占人類基因的10%,核心序列長(zhǎng)度為1~6 bp;微衛(wèi)星不穩(wěn)定(microsatellite instability,MSI)指基因組中短串聯(lián)重復(fù)序列次數(shù)的增加或者減少[7-8]。MSI 狀態(tài)的檢測(cè)可以通過PCR 擴(kuò)增特定微衛(wèi)星標(biāo)志位點(diǎn)、定向二代測(cè)序(next-generation sequencing,NGS)或免疫組化檢測(cè)DNA 錯(cuò)配修復(fù)(mismatch repair,MMR)蛋白表達(dá)來確定,并可根據(jù)PCR 擴(kuò)增出的標(biāo)志位點(diǎn)不穩(wěn)定數(shù)或定向NGS 中的不穩(wěn)定位點(diǎn)累積得分將MSI 分為高度微衛(wèi)星不穩(wěn)定(microsatellite instabilityhigh,MSI-H) 和低度微衛(wèi)星不穩(wěn)定(microsatellite instability-low,MSI-L)[9-11]。MSI 為結(jié)直腸癌的特殊分子表型,在結(jié)直腸癌中占10%~20%[7-8]。既往研究[12-15]顯示,MSI 結(jié)直腸癌淋巴結(jié)轉(zhuǎn)移和遠(yuǎn)處轉(zhuǎn)移的發(fā)生率低于微衛(wèi)星穩(wěn)定(microsatellite stable,MSS)腫瘤。但是在轉(zhuǎn)移性結(jié)直腸癌中,MSI-H 患者的預(yù)后較差[16]。并且在早期結(jié)直腸癌中,MSI-H 的比例高達(dá)20%,而晚期轉(zhuǎn)移性結(jié)直腸癌中,該比例則顯著下降(4%~5%)[17-18],這提示在MSI-H 結(jié)直腸癌中存在一部分高轉(zhuǎn)移潛能的腫瘤。
本研究擬從轉(zhuǎn)錄組層面進(jìn)一步探索影響MSI-H 結(jié)直腸癌高轉(zhuǎn)移潛能的因素。從癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(kù)中篩選有無轉(zhuǎn)移的MSI-H結(jié)直腸癌患者中的差異表達(dá)基因(differentially expressed gene,DEG),選取其中的關(guān)鍵基因構(gòu)建轉(zhuǎn)移預(yù)測(cè)列線圖,以幫助結(jié)直腸癌臨床治療及隨訪策略的制定。
根據(jù)以下標(biāo)準(zhǔn),從TCGA 數(shù)據(jù)庫(kù)中篩選符合要求的患者:①確診結(jié)直腸癌。②分子分型為MSI-H(通過NGS 的全外顯子組測(cè)序數(shù)據(jù)得到)[19]。③患者標(biāo)注有轉(zhuǎn)移信息。
使用R 語言edgeR 軟件包[20]對(duì)收集到的轉(zhuǎn)移組及無轉(zhuǎn)移組中DEGs 進(jìn)行分析。將差異閾值設(shè)定為誤報(bào)率(false detective rate,F(xiàn)DR)<0.05、log2∣差異倍數(shù)(fold change,F(xiàn)C) ∣>1,其中FDR 為P值的多重校正值,log2FC為基因表達(dá)變化的數(shù)值和方向。
使用DAVID 數(shù)據(jù)庫(kù)(the Database for Annotation,Visualization and Integrated Discovery)對(duì)DEGs 進(jìn)行基因本體數(shù)據(jù)庫(kù)(Gene Ontology,GO)注釋與聚類,篩選條件定為P<0.05、基因數(shù)≥5。
使用在線分析工具WEB-based GEne SeT AnaLysis Toolkit,參照京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG) 和Reactome信號(hào)通路數(shù)據(jù)庫(kù),對(duì)DEGs進(jìn)行基因集富集分析(Gene Set Enrichment Analysis,GSEA),分析DEGs 涉及的信號(hào)通路。
使用STRING 在線工具,構(gòu)建上調(diào)基因(轉(zhuǎn)移組較無轉(zhuǎn)移組表達(dá)升高基因)的蛋白質(zhì)互作(protein-protein interaction,PPI)網(wǎng)絡(luò),通過Cytoscape 軟件[21]篩選出PPI網(wǎng)絡(luò)中高連接度等級(jí)前10位的樞紐基因(hub基因)。
選取DEGs 中調(diào)整后P值(adjustedPvalue,Padj)最小,且根據(jù)既往報(bào)道與腫瘤發(fā)生發(fā)展關(guān)聯(lián)性高的前10 個(gè)基因,通過R 語言的rms 包對(duì)DEGs 構(gòu)建Logistic 回歸模型,并通過R 語言的“Boot”函數(shù)[22],使用Bootstrap 方法,將收集的63個(gè)腫瘤樣本每次隨機(jī)抽取25個(gè),進(jìn)行15次檢驗(yàn),對(duì)構(gòu)建模型進(jìn)行交叉驗(yàn)證。使用一致性指數(shù)(concordance index,C-index)、受試者工作特征曲線(receiver operating characteristic curve,ROC 曲線)對(duì)模型預(yù)測(cè)效能進(jìn)行評(píng)價(jià)。使用R語言的rms包繪制可視化列線圖。
結(jié)合收集到的TCGA 數(shù)據(jù)庫(kù)中的臨床信息,使用Log-rank檢驗(yàn)并將基因中位表達(dá)值作為臨界值,采用R語言survminer 包行生存分析,分析列線圖中每個(gè)基因表達(dá)水平對(duì)MSI-H 結(jié)直腸癌無進(jìn)展生存期(progression-free survival,PFS)的影響。
轉(zhuǎn)移預(yù)測(cè)模型構(gòu)建使用Logistic 回歸模型。模型預(yù)測(cè)效能評(píng)價(jià)使用C-index、ROC曲線。其中C-index>0.7則證明預(yù)測(cè)模型有可靠性;ROC 曲線的曲線下面積(area under curve,AUC)用來預(yù)測(cè)準(zhǔn)確性,當(dāng)0.5<AUC<1 時(shí)提示優(yōu)于隨機(jī)猜測(cè),模型有預(yù)測(cè)價(jià)值。
基于篩選標(biāo)準(zhǔn),一共從TCGA 數(shù)據(jù)庫(kù)中納入63 例患者。納入患者的基本信息見表1。根據(jù)標(biāo)注的轉(zhuǎn)移信息將患者分為轉(zhuǎn)移組(21例)及無轉(zhuǎn)移組(42例),轉(zhuǎn)移組為存在淋巴結(jié)轉(zhuǎn)移或/和遠(yuǎn)端轉(zhuǎn)移,無轉(zhuǎn)移組為不存在淋巴結(jié)轉(zhuǎn)移和遠(yuǎn)端轉(zhuǎn)移。對(duì)2 組進(jìn)行轉(zhuǎn)錄組分析,共獲得245個(gè)DEGs,其中轉(zhuǎn)移組較無轉(zhuǎn)移組表達(dá)升高的有204 個(gè),轉(zhuǎn)移組較無轉(zhuǎn)移組表達(dá)降低的有41 個(gè)(圖1)。上調(diào)及下調(diào)前10位DEG的詳細(xì)信息見表2。
表1 63例納入患者基本信息Tab 1 Basic information of 63 included patients
表2 轉(zhuǎn)移組和無轉(zhuǎn)移組間上調(diào)及下調(diào)前10位DEGsTab 2 Top 10 up-regulated and down-regulated DEGs between metastasis and non-metastasis group
圖1 MSI-H結(jié)直腸癌轉(zhuǎn)移組和無轉(zhuǎn)移組間DEGs火山圖Fig 1 Volcano plot of DEGs between metastatic group and non-metastatic group of MSI-H colorectal cancer
對(duì)DEGs 進(jìn)行GO 注釋及富集分析,將篩選條件定為P<0.05,基因數(shù)≥5,在上調(diào)基因中得到8 項(xiàng)生物過程(biological process, BP)、 12 項(xiàng)細(xì)胞組分(cellular component,CC)、3 項(xiàng)分子功能(molecular function,MF)。上調(diào)基因的BP 主要為分泌、離子穿膜轉(zhuǎn)運(yùn)、神經(jīng)肽信號(hào)通路等,CC 主要為細(xì)胞外部分、質(zhì)膜的組成部分、細(xì)胞外空間等,MF 主要為激素活性、氯離子通道活性和生長(zhǎng)因子活性。在下調(diào)基因中得到1 項(xiàng)CC,為細(xì)胞外部分(圖2)。
圖2 GO分析上調(diào)與下調(diào)基因的BP、CC與MFFig 2 Relative BP,CC and MF of up-regulated and down-regulated genes
分別使用KEGG 和Reactome 信號(hào)通路數(shù)據(jù)庫(kù)對(duì)DEGs 進(jìn)行信號(hào)通路的GSEA,并選取上調(diào)及下調(diào)基因富集前10 位的信號(hào)通路;通過對(duì)2 個(gè)數(shù)據(jù)庫(kù)富集信號(hào)通路取交集發(fā)現(xiàn),上調(diào)基因中神經(jīng)活性物質(zhì)配體-受體相互作用、代謝信號(hào)通路在2 個(gè)數(shù)據(jù)庫(kù)中都得到了富集(圖3)。
圖3 DEG信號(hào)通路的GSEAFig 3 GSEA of DEG pathway
使用STRING 工具構(gòu)建了上調(diào)基因PPI 網(wǎng)絡(luò)(圖4A),并且通過Cytoscape 軟件篩選出其中高連接度等級(jí)前10 位的hub 基因,分別為胰高血糖素(glucagon,GCG)、生長(zhǎng)激素抑制素(somatostatin,SST)、神經(jīng)降壓素(neurotensin,NTS)、 α2-HS 糖蛋白(α2-HS glycoprotein,AHSG)、載脂蛋白B (apolipoprotein B,APOB)、嗜鉻粒蛋白B(chromogranin B,CHGB)、突觸素(synaptophysin,SYP)、胰島素樣生長(zhǎng)因子結(jié)合蛋白3(insulin like growth factor binding protein 3,IGFBP3)、精氨酸加壓素受體2 (arginine vasopressin receptor 2,AVPR2)、 分泌粒蛋白3 (secretogranin Ⅲ,SCG3)(圖4B)。
圖4 上調(diào)基因PPI網(wǎng)絡(luò)及等級(jí)前10位的hub基因Fig 4 PPI network of the up-regulated genes and the top 10 hub genes
將訓(xùn)練集AUC=0.975,驗(yàn)證集AUC=0.920,C-index=0.832(95%CI0.798~0.866)的預(yù)測(cè)模型使用R 語言的rms包繪制可視化列線圖,即MSI-H結(jié)直腸癌基因轉(zhuǎn)移預(yù)測(cè)列線圖模型(圖5)。其中,肌動(dòng)蛋白8(actin like 8,ACTL8)、鳥苷酸環(huán)化酶激活劑2B (guanylate cyclase activator 2B,GUCA2B)、 L 氧化戊二酸脫氫酶(oxoglutarate dehydrogenase L,OGDHL)及視黃醇結(jié)合蛋白4(retinol binding protein 4,RBP4)對(duì)結(jié)直腸癌轉(zhuǎn)移有較大影響。
圖5 MSI-H結(jié)直腸癌轉(zhuǎn)移風(fēng)險(xiǎn)列線圖模型Fig 5 Nomogram model of MSI-H colorectal cancer metastatic risk
將列線圖中各基因表達(dá)水平對(duì)MSI-H 結(jié)直腸癌PFS的影響進(jìn)行生存分析(圖6),發(fā)現(xiàn):AC078993.1和IGLJ2的表達(dá)水平與MSI-H 結(jié)直腸癌PFS 呈明顯負(fù)相關(guān)(P=0.011,P=0.005),二者均為上調(diào)基因;其他基因的表達(dá)水平對(duì)MSI-H 結(jié)直腸癌PFS 影響無統(tǒng)計(jì)學(xué)意義(均P>0.05)。
圖6 生存分析列線圖中10個(gè)基因?qū)SI-H結(jié)直腸癌PFS影響Fig 6 Survival analysis of the 10 genes in Nomogram model on PFS of MSI-H colorectal cancer
基因組不穩(wěn)定性的產(chǎn)生是結(jié)直腸癌發(fā)展過程中一個(gè)重要特征,而MSI 是造成基因組不穩(wěn)定性的重要途徑之一[23]。MSI 常常反映由于DNA 錯(cuò)配修復(fù)缺陷(deficient mismatch repair,dMMR)導(dǎo)致的DNA 復(fù)制錯(cuò)誤[7-8]。在Ⅱ期和Ⅲ期結(jié)直腸癌中,MSI 分別約占20%及12%,Ⅳ期中MSI 占4%~5%[17-18]。雖然在Ⅱ期的散發(fā)性結(jié)直腸癌中,MSI 為有益于預(yù)后的標(biāo)志物[24],但是在轉(zhuǎn)移性結(jié)直腸癌中dMMR-MSI-H 預(yù)后較差。這些現(xiàn)象提示,在MSIH結(jié)直腸癌中可能存在一類高轉(zhuǎn)移潛能亞型腫瘤,而目前尚無針對(duì)影響MSI-H 結(jié)直腸癌轉(zhuǎn)移轉(zhuǎn)錄組層面的研究。本研究希望從轉(zhuǎn)錄組層面探索影響MSI-H 結(jié)直腸癌轉(zhuǎn)移、產(chǎn)生高轉(zhuǎn)移潛能的可能因素。
首先從TCGA 數(shù)據(jù)庫(kù)中篩選出63 例MSI-H 結(jié)直腸癌患者的轉(zhuǎn)錄組數(shù)據(jù)。通過生物信息學(xué)方法分析了MSI-H結(jié)直腸癌有轉(zhuǎn)移和無轉(zhuǎn)移患者間的DEG,共獲得245 個(gè)DEGs。在轉(zhuǎn)移組上調(diào)的前10 位基因中,4 次跨膜結(jié)構(gòu)域A12 (membrane spanning 4-domains A12,MS4A12) 是結(jié)腸特異性的鈣池調(diào)控鈣離子內(nèi)流通道蛋白,在結(jié)腸癌細(xì)胞中MS4A12 蛋白表達(dá)降低會(huì)減弱癌細(xì)胞的增殖、運(yùn)動(dòng)性和趨化侵襲[25]。轉(zhuǎn)移組下調(diào)的前10 位基因中,F(xiàn)GL1編碼的蛋白為纖維蛋白原樣蛋白1(fibrinogen like 1,F(xiàn)GL1),屬于纖維蛋白原家族成員。FGL1在絲氨酸/蘇氨酸激酶11(serine/threonine kinase 11,LKB1)突變的肺腺癌中表達(dá)缺失會(huì)誘導(dǎo)上皮間質(zhì)轉(zhuǎn)化和血管形成[26]。在肝細(xì)胞癌中,F(xiàn)GL1的表達(dá)缺失與肝細(xì)胞癌的低分化表型有相關(guān)性,且FGL1通過絲氨酸-蘇氨酸激酶依賴機(jī)制在肝細(xì)胞癌中起到抑癌作用[27]。肽基精氨酸脫亞胺酶3(peptidyl arginine deiminase 3,PADI3)編碼的蛋白為肽基精氨酸脫亞胺酶家族成員,PADI3 蛋白在結(jié)腸癌組織中低表達(dá),并且PADI3 可通過熱休克蛋白90(heat shock protein,Hsp90)/ 細(xì)胞周期蛋白依賴性激酶調(diào)節(jié)亞基1(cyclin kinase subunit 1,CKS1)途徑或沉默信息調(diào)節(jié)因子2(silent information regulator2,Sirt2)/蛋白激酶B(protein kinase B,AKT)/p21 途徑發(fā)揮抑癌作用[28-29]?;贛S4A12、FGL1和PADI3既往在各種腫瘤中的功能報(bào)道,三者可能為MSI-H 結(jié)直腸癌轉(zhuǎn)移過程中較關(guān)鍵的基因,其具體作用機(jī)制值得進(jìn)一步探索。
進(jìn)一步通過GO分析,在BP及MF富集中發(fā)現(xiàn)MSI-H結(jié)直腸癌轉(zhuǎn)移組離子穿膜轉(zhuǎn)運(yùn)、氯離子穿膜轉(zhuǎn)運(yùn)及氯離子通道活性表現(xiàn)活躍。近年來,腫瘤組織中離子通道的改變?cè)桨l(fā)受到重視。離子通道改變會(huì)導(dǎo)致細(xì)胞內(nèi)離子穩(wěn)態(tài)失調(diào),從而影響細(xì)胞體積調(diào)節(jié)、細(xì)胞膜電位變化、細(xì)胞的機(jī)械傳導(dǎo)及腫瘤微環(huán)境等,而這些改變都會(huì)對(duì)腫瘤細(xì)胞的增殖、凋亡、遷移、血管生成造成重要影響[30]。例如,在肝細(xì)胞癌中,氯離子選擇性通道ClC-3通過調(diào)節(jié)氯離子流調(diào)控細(xì)胞形態(tài)和體積從而促進(jìn)細(xì)胞遷移[30];在膠質(zhì)瘤細(xì)胞突起中,氯離子通道ClC-3 與基質(zhì)金屬蛋白酶2聚集,共同調(diào)節(jié)膠質(zhì)瘤細(xì)胞的遷移和侵襲[31]等。本研究分析得到的基因富集結(jié)果提示,離子通道變化對(duì)MSI-H結(jié)直腸癌的轉(zhuǎn)移的影響值得關(guān)注。
而在CC 富集中發(fā)現(xiàn),MSI-H 結(jié)直腸癌轉(zhuǎn)移組中細(xì)胞外部分、細(xì)胞外空間表現(xiàn)活躍。而腫瘤微環(huán)境是腫瘤細(xì)胞外的重要部分,主要包括血管、與腫瘤相關(guān)的成纖維細(xì)胞、免疫細(xì)胞和免疫抑制細(xì)胞、信號(hào)分子、骨髓源性細(xì)胞、細(xì)胞外基質(zhì)等[32]。我們得到的在MSI-H 結(jié)直腸癌轉(zhuǎn)移組中細(xì)胞外成分的富集結(jié)果可能提示了腫瘤微環(huán)境對(duì)MSI-H結(jié)直腸癌轉(zhuǎn)移的發(fā)生和促進(jìn)存在重要影響。
對(duì)DEGs信號(hào)通路的富集分析發(fā)現(xiàn),代謝通路在上調(diào)基因中得到富集。既往研究[33]也提示細(xì)胞代謝失調(diào)為腫瘤重要標(biāo)志之一,這說明在MSI-H 結(jié)直腸癌轉(zhuǎn)移過程中代謝通路改變也有著重要的意義。而既往報(bào)道神經(jīng)系統(tǒng)異常,包括神經(jīng)遞質(zhì)、神經(jīng)營(yíng)養(yǎng)因子和其受體的異常,在結(jié)腸癌肝轉(zhuǎn)移中有重要作用[34]。我們?cè)谏险{(diào)基因中也富集到神經(jīng)活性物質(zhì)配體-受體相互作用通路,說明該方向在MSI-H 結(jié)直腸癌的轉(zhuǎn)移研究中也值得關(guān)注。通過PPI網(wǎng)絡(luò)及Cytoscape 軟件篩選出的hub 基因中,NTS 被報(bào)道其蛋白的表達(dá)水平與結(jié)腸癌的預(yù)后呈負(fù)相關(guān),并且NTS可以促進(jìn)多種結(jié)腸癌細(xì)胞的生長(zhǎng)[35];結(jié)腸癌組織中SYP蛋白表達(dá)水平與腫瘤預(yù)后呈負(fù)相關(guān)[36];IGFBP3的基因水平與結(jié)腸癌的預(yù)后呈負(fù)相關(guān)[37],且IGFBP3 可以促進(jìn)肺腺癌的腦轉(zhuǎn)移[38]。這些都提示發(fā)生轉(zhuǎn)移的MSI-H 結(jié)直腸癌相較于無轉(zhuǎn)移腫瘤,在轉(zhuǎn)錄組水平體現(xiàn)出更強(qiáng)的轉(zhuǎn)移潛能。
通過對(duì)篩選出的DEGs進(jìn)行列線圖模型構(gòu)建,得到了預(yù)測(cè)MSI-H 結(jié)直腸癌轉(zhuǎn)移的基因列線圖。該列線圖有較好的區(qū)分度和一定的預(yù)測(cè)效能。既往有研究[39]從轉(zhuǎn)錄組層面分析結(jié)直腸癌的基因標(biāo)簽,也有研究[40]提出一組可以用于預(yù)測(cè)結(jié)腸癌轉(zhuǎn)移及復(fù)發(fā)的基因標(biāo)簽。但是運(yùn)用這類基因標(biāo)簽進(jìn)行評(píng)分,其方式較復(fù)雜,需要專業(yè)繁瑣的統(tǒng)計(jì)學(xué)方法計(jì)算。本研究主要針對(duì)結(jié)直腸癌中的特定分子亞型——MSI-H 結(jié)直腸癌,特異性地構(gòu)建了預(yù)測(cè)MSIH 結(jié)直腸癌轉(zhuǎn)移風(fēng)險(xiǎn)的基因表達(dá)預(yù)測(cè)模型。該模型較直觀,計(jì)算MSI-H 結(jié)直腸癌發(fā)生轉(zhuǎn)移的風(fēng)險(xiǎn)預(yù)測(cè)值較方便。隨著基因測(cè)序技術(shù)的不斷發(fā)展及在臨床應(yīng)用中的推廣,對(duì)于結(jié)腸癌術(shù)后行腫瘤組織轉(zhuǎn)錄組測(cè)序的患者,可應(yīng)用此類預(yù)測(cè)模型評(píng)估其發(fā)生轉(zhuǎn)移的風(fēng)險(xiǎn),以協(xié)助術(shù)后治療及隨訪方案的制定。將列線圖中各基因表達(dá)水平對(duì)MSIH 結(jié)直腸癌PFS 影響情況進(jìn)行生存分析, 得到AC078993.1和IGLJ2與PFS呈負(fù)相關(guān),且兩者均為MSI-H轉(zhuǎn)移性結(jié)腸癌中上調(diào)基因。結(jié)合兩者的表達(dá)水平及對(duì)PFS的影響,提示其可能在MSI-H 結(jié)直腸癌發(fā)生轉(zhuǎn)移的過程中較重要。但其在腫瘤中均未有相關(guān)報(bào)道,在之后進(jìn)一步的研究中值得重點(diǎn)關(guān)注。
本列線圖模型僅使用了單個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行內(nèi)部驗(yàn)證,使結(jié)果有一定的局限性。而由于MSI 結(jié)直腸癌在總結(jié)直腸癌中占10%~20%[7-8],且MSI 結(jié)直腸癌轉(zhuǎn)移發(fā)生率較MSS 結(jié)直腸癌相對(duì)低等特點(diǎn)[12-15],在各數(shù)據(jù)庫(kù)及數(shù)據(jù)集中可得到的發(fā)生轉(zhuǎn)移的MSI 結(jié)直腸癌病例數(shù)相對(duì)較少,這使得之后的研究需進(jìn)一步收集臨床病例和其他數(shù)據(jù)庫(kù)、數(shù)據(jù)集中的相關(guān)數(shù)據(jù),以加強(qiáng)驗(yàn)證及優(yōu)化該列線圖模型。并且本研究使用的數(shù)據(jù)無法區(qū)分MSI 結(jié)直腸癌中林奇綜合征患者,之后的研究也需結(jié)合其他數(shù)據(jù)庫(kù)信息,區(qū)分出林奇綜合征及錯(cuò)配修復(fù)蛋白甲基化導(dǎo)致的MSI-H結(jié)直腸,進(jìn)行更細(xì)致的探討。
綜上,本研究從轉(zhuǎn)錄組層面探索了影響MSI-H 結(jié)直腸癌產(chǎn)生高轉(zhuǎn)移潛能的因素。通過對(duì)TCGA 數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)的生物信息學(xué)分析,獲得對(duì)MSI-H 結(jié)直腸癌發(fā)生轉(zhuǎn)移有影響的潛在關(guān)鍵基因;并且構(gòu)建了有一定預(yù)測(cè)效能的MSI-H 結(jié)直腸癌轉(zhuǎn)移基因預(yù)測(cè)模型。由于本研究局限于單一數(shù)據(jù)庫(kù)的數(shù)據(jù),未來還需通過擴(kuò)大數(shù)據(jù)的收集范圍、收集臨床樣本及生物學(xué)實(shí)驗(yàn)等多個(gè)方面驗(yàn)證及完善本研究的結(jié)果。
上海交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2021年9期