陳 國,田黎民,李曉平
(1.廣東省汕頭潮南民生醫(yī)院腫瘤綜合外科,汕頭 515154;2.湖北恩施土家族苗族自治州中心醫(yī)院病理科,恩施 445000;3.廣東省江門市中心醫(yī)院胃腸外科,江門 529000))
據(jù)統(tǒng)計,截至2020年美國每年結(jié)腸癌新發(fā)病例147 910例,死亡53 200例;我國結(jié)腸癌年新發(fā)病例約376 000例,死亡191 000例[1-2]。結(jié)腸癌已經(jīng)成為最常見的消化道惡性腫瘤,嚴重威脅著人類健康。腸癌一旦發(fā)生區(qū)域淋巴結(jié)轉(zhuǎn)移,則定義為Ⅲ期,而Ⅲ期腸癌的術(shù)后輔助治療是基于5-氟尿嘧啶和奧沙利鉑為基礎(chǔ)的化療方案??v使接受了標準療程的輔助治療,仍有40%以上的患者出現(xiàn)復(fù)發(fā)轉(zhuǎn)移[3-4]。分辨出Ⅲ期結(jié)腸癌患者中的高?;颊?、尋找潛在的治療靶點具有重要意義。但目前針對Ⅲ期結(jié)腸癌的研究非常有限,本研究擬根據(jù)生物信息學(xué)方法,通過大數(shù)據(jù)平臺篩選出影響Ⅲ期結(jié)腸癌患者預(yù)后的關(guān)鍵基因,以便為后續(xù)的實驗室研究提供相應(yīng)的靶基因。
下載并篩選Ⅲ期腸癌患者的轉(zhuǎn)錄組核糖核酸測序(RNA-seq)數(shù)據(jù)和臨床預(yù)后信息。從TCGA(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)數(shù)據(jù)庫中收集所有結(jié)腸癌患者RNA-seq數(shù)據(jù)和相關(guān)臨床數(shù)據(jù)信(腫瘤位置包括升結(jié)腸、橫結(jié)腸、降結(jié)腸和乙狀結(jié)腸)[5]。從中篩選出臨床分期為Ⅲ期的患者,共篩選出126例Ⅲ期結(jié)腸癌的患者,包含126例結(jié)腸癌的癌組織和8例癌旁組織。
NetworkAnalyst(https://www.networkanalyst.ca)是一個專門用于轉(zhuǎn)錄組基因表達數(shù)據(jù)分析的在線網(wǎng)站[6]。在該網(wǎng)站中,以P<0.01以及|logFC|≥1為條件篩選出Ⅲ期結(jié)腸癌患者的癌組織和癌旁組織的差異表達基因。通過該網(wǎng)站繪制出描述差異基因表達情況的火山圖。
對1.2中篩選出的差異基因進行功能富集分析和KEGG通路富集分析。具體步驟如下:首先,從NetworkAnalyst網(wǎng)站中得到差異表達基因的基因名稱,通過Ensembl數(shù)據(jù)庫,將所有差異表達基因的基因名裝換為Gene symbol形式。其次,通過可視化數(shù)據(jù)分析網(wǎng)站(the Database for annotation,visualization and integrated discovery,DAVID)對差異基因進行功能分析(https://david.ncifcrf.gov/)[7]。P<0.01表示富集分析差異有統(tǒng)計學(xué)意義?;虮倔w論(gene ontology,GO)功能富集分析結(jié)果主要包括生物學(xué)的分子功能(molecular function,MF)、生物過程(biology process,BP)和細胞成分(cellular component,CC),而KEGG通路富集分析則用于分析差異表達基因的信號通路。
首先,利用蛋白質(zhì)相互作用數(shù)據(jù)庫(https://www.string-db.org/)構(gòu)建之前篩選出的差異表達基因,并構(gòu)建PPI網(wǎng)絡(luò)圖,將可信度≥0.7作為篩選條件[8];其次,利用Cytoscape軟件將差異基因的蛋白質(zhì)相互作用網(wǎng)絡(luò)圖可視化;最后,利用Cytoscape軟件上篩選出PPI網(wǎng)絡(luò)圖上的核心模塊和核心基因。
在RNA序列表中找到所有Ⅲ期結(jié)腸癌患者核心基因的表達值,計算每個核心基因的中位值并以此為臨界值,把Ⅲ期結(jié)腸癌患者高表達組和低表達組,利用Graphpad軟件繪制患者每個基因的Kaplan-Meier生存曲線,P≤0.05提示該基因的高低表達組中對生存影響具有統(tǒng)計學(xué)意義。
利用cBioPortal數(shù)據(jù)庫(www.cbioportal.org)來顯示基因突變的頻率(基因的擴增、突變、拷貝數(shù)增加以及基因的缺失)[9],所有操作步驟均按照cBioPortal網(wǎng)站在線操作指南進行。
126例Ⅲ期結(jié)腸癌患者中,其中男性62例(49.21%),女性64例(50.79%);平均年齡為(65.32±13.88)歲;有淋巴脈管浸潤者95例(75.40%);T分期中T2、T3、T4分別為10例(7.94%)、100例(79.37%)、16例(12.70%);N分期中N1、N2分別為77例(61.11%)、49例(38.89%);腺癌104例(82.54%),黏液癌22例(17.46%);臨床分期中ⅢA、ⅢB、ⅢC期分別為31例(24.60%)、56例(44.44%)、39例(30.95%)。
通過篩選TCGA下載的結(jié)腸癌患者數(shù)據(jù),我們獲得了126例Ⅲ期結(jié)腸癌的RNA測序數(shù)據(jù)和相關(guān)臨床隨訪信息;我們利用NetworkAnalyst在線網(wǎng)站進行差異基因分析,比較了126個結(jié)腸癌組織與8個癌旁正常組織之間差異表達基因,共獲得991個差異表達基因(以P<0.01以及|logFC|≥1的篩選條件)。根據(jù)NetworkAnalyst網(wǎng)站這991個差異表達基因的表達情況以火山圖的形式進行呈現(xiàn),如圖1所示。
圖1 Ⅲ期結(jié)腸癌患者中差異表達基因
為更好地了解上述篩選出的991個差異表達基因的功能,利用David對991個差異表達基因進行了GO功能富集和KEGG通路富集分析。BP富集結(jié)果顯示差異基因主要富集于化學(xué)突觸傳遞、多巴胺能神經(jīng)元分化和離子跨膜轉(zhuǎn)運(圖2a);CC結(jié)果表明,差異基因在胞外區(qū)、胞外間隙和核周體這些部位成分較為豐富(圖2b);MF結(jié)果表明,差異基因主要富集于分子結(jié)構(gòu)活性、延遲鉀通道活動和絲氨酸肽鏈內(nèi)切酶活性(圖2c)。同時,KEGG通路富集分析表明,差異基因在環(huán)磷酸腺苷(cAMP)信號通路和神經(jīng)活性配體-受體相互作用相關(guān)通路中功能較為活躍(圖2d)。
圖2 差異表達基因的GO和KEGG通路富集分析
PPI蛋白質(zhì)相互作用網(wǎng)絡(luò)能夠用來說明蛋白質(zhì)之間的相互作用,本研究中,利用STRING數(shù)據(jù)庫來構(gòu)建991個差異表達基因的PPI蛋白相互作用網(wǎng)絡(luò)圖(圖3a),利用最小相互作用分數(shù)≥0.7的條件篩選出了532個候選基因;為了找到差異表達基因之間的相互關(guān)系,利用Cytoscape軟件以節(jié)點分數(shù)=0.2,K值=2.0作為篩選條件,篩選出了候選基因中相互作用最為密切的一個模塊(圖3b),通過篩選獲得20個核心的基因,包括NPY、CASR、NPY2R、PENK、CCL16、SST、HTR1D、CXCL5、CNR1、PYY、CXCR5、PPBP、INSL5、P2RY4、P2RY12、GALR1、GNG8、GNG13、CHRM2以及TAS1R1基因。
圖3 蛋白互助網(wǎng)絡(luò)圖
分別計算上述20個基因在126例患者中的中位表達量,并以此作為介值,高于中位表達量的患者認為是高表達組,低于中位表達量的患者被認為是低表達組;據(jù)此將我們篩選出來的126例患者分為高表達組和低表達組。如圖4所示,利用Kaplan-Meier生存曲線分析上述20個核心基因高表達組和低表達組的預(yù)后差異,P<0.05為差異有統(tǒng)計學(xué)意義。結(jié)果發(fā)現(xiàn)患者高表達CXCL5或GNG13基因的預(yù)后較差,提示這兩個基因可能是結(jié)腸癌的促癌基因。
圖4 關(guān)鍵預(yù)后基因生存曲線
通過cBioPortal數(shù)據(jù)庫分析CXCL5和GNG13基因發(fā)生錯義突變、深度缺失和擴增幾種突變情況的頻率。結(jié)果顯示CXCL5基因的突變率為1.7%,有7個突變位點,其中4個發(fā)生在IL-8結(jié)構(gòu)域;GNG13基因的突變率為0.8%,有1個突變位點,g-γ結(jié)構(gòu)域,見圖5。
圖5 在cBioPortal數(shù)據(jù)庫中檢測結(jié)腸癌患者CXCL5和GNG13基因的變化
近年來,結(jié)腸癌的發(fā)病率逐年升高[10]。然而,結(jié)腸癌起病隱匿、進展迅速、容易對化療藥物抵抗等因素導(dǎo)致結(jié)腸癌患者預(yù)后較差[11]。作為一種多因素疾病,結(jié)腸癌的發(fā)病機制復(fù)雜且尚未研究清楚,吸煙、飲酒、肥胖、缺乏鍛煉以及基因突變等因素均會導(dǎo)致疾病的發(fā)生[12]。臨床上,Ⅲ期腸癌被定義為存在區(qū)域淋巴結(jié)轉(zhuǎn)移而沒有合并遠處轉(zhuǎn)移的患者,此類患者的治療方案為根治手術(shù)聯(lián)合化療。根據(jù)患者的臨床病理因素可以將結(jié)腸癌分為高危組和低危組,選擇不同的治療方案,患者的預(yù)后情況也存在著明顯差異。André等[13]研究認為,高危型患者需要采取8個療程的化療方案治療,低危型患者則僅需要采取4個療程的XELOX化療方案進行治療。但是多種基因與結(jié)腸癌的發(fā)生有關(guān),單純采用臨床病理因素劃分結(jié)腸癌患者的危險性,忽略了基因因素對結(jié)腸癌患者發(fā)病的影響。研究[14]顯示,KRAS、NARS以及BRAF基因突變與患者預(yù)后有關(guān),且能夠指導(dǎo)患者的腫瘤靶向治療;BRAF V600E的突變狀態(tài)能夠?qū)︻A(yù)后進行分層,指導(dǎo)臨床治療;錯配修復(fù)蛋白(MMR)以及微衛(wèi)星不穩(wěn)定性(MSI)的檢測能夠用于篩選Lynch syndrome患者,指導(dǎo)患者的治療。也有關(guān)于人類表皮生長受體因子(HER2)與結(jié)腸癌患者關(guān)系的研究[15]。這些都說明基因在結(jié)腸癌患者的發(fā)病以及治療中的重要作用。
本研究利用大數(shù)據(jù)模式,采用生物信息學(xué)方法,通過TCGA數(shù)據(jù)庫篩選到126例Ⅲ期結(jié)腸癌患者,通過癌組織和癌旁組織的差異性分析,篩選出了991個差異基因,通過功能富集分析和KEGG通路富集分析,發(fā)現(xiàn)主要富集于cAMP信號通路和神經(jīng)活性配體-受體相互作用相關(guān)通路。劉明心等[16]認為,cAMP信號通路與機體的應(yīng)激、炎癥、免疫及腫瘤的發(fā)生發(fā)展密切相關(guān),通過靶向cAMP/PKA/CRE信號通路,有助于逆轉(zhuǎn)腫瘤的發(fā)生。瞿根義等[17]發(fā)現(xiàn)神經(jīng)活性配體-受體通路與前列腺癌的發(fā)生發(fā)展具有密切相關(guān)性。因而多個研究提示了cAMP信號通路與神經(jīng)活性配體-受體通路與腫瘤的發(fā)生發(fā)展具有相關(guān)性,但在Ⅲ期結(jié)腸癌中的作用上不明確,值得后續(xù)研究探討。
本研究通過蛋白質(zhì)相互作用網(wǎng)絡(luò)及MCODE分析法,篩選出20個關(guān)鍵的差異基因。通過生存分析發(fā)現(xiàn),高表達CXCL5和GNG13的Ⅲ期結(jié)腸癌患者預(yù)后較差,提示這兩個基因可能是促癌基因。CXCL5是趨化因子家族分泌的信號蛋白。CXCL5作為一種促炎癥和促癌分子,可以介導(dǎo)多種細胞行為,包括腫瘤細胞的遷移和侵襲以及中性粒細胞的轉(zhuǎn)運。CXCL5與多種腫瘤的發(fā)生發(fā)展有關(guān)[18]。Yu等[19]發(fā)現(xiàn)間充質(zhì)基質(zhì)細胞(MSCs)分泌的CXCL5可促進乳腺癌的轉(zhuǎn)移。Kawagoe等[20]發(fā)現(xiàn)血清CXCL5水平可作為結(jié)直腸癌患者的預(yù)后指標,CXCL5可促進結(jié)直腸癌轉(zhuǎn)移,高水平的CXCL5可導(dǎo)致腫瘤復(fù)發(fā)和預(yù)后不良。血管生成在惡性腫瘤的發(fā)生發(fā)展中起著非常重要的作用,但CXCL5在Ⅲ期腸癌中仍缺乏相應(yīng)研究,其內(nèi)在的信號通路仍值得我們后續(xù)的實驗室分析。GNG13是編碼G蛋白亞基γ13的7-跨膜-螺旋G蛋白偶聯(lián)受體的信號轉(zhuǎn)導(dǎo)子。GNG13是一種γ亞單位,在視網(wǎng)膜、味覺和神經(jīng)組織中均有表達,在味覺傳導(dǎo)中起著關(guān)鍵作用。Ren等[21]發(fā)現(xiàn),GNG13在多巴胺能突觸信號通路中起重要作用,與本文的研究一致。GNG13是鈣信號通路中的靶點與骨骼肌的發(fā)育有關(guān),有助于維持體內(nèi)平衡和再生。癌細胞的生長需要消耗大量的能量,鈣離子保證了能量的供應(yīng),可能在一定程度上會促進腫瘤的進展。Yi等[22]推測GNG13可能通過細胞毒的抗癌作用抑制乳腺癌細胞。Sun等[23]發(fā)現(xiàn)GNG13是前列腺癌的中樞基因。查閱相應(yīng)的中英文數(shù)據(jù)庫,暫沒有關(guān)于GNG13與結(jié)腸癌發(fā)生發(fā)展及預(yù)后的相關(guān)研究,提示了該基因是本研究首次發(fā)現(xiàn)并提出與Ⅲ期腸癌患者預(yù)后相關(guān),因而在后續(xù)實驗室研究中具有重要的研究價值。
當(dāng)然,本研究具有一定的局限性。本研究是從生物信息學(xué)的角度發(fā)現(xiàn)了影響Ⅲ期腸癌患者的相關(guān)基因,仍需后續(xù)的實驗研究進行功能驗證及通路分析。
本研究通過生物信息學(xué)方法分析了公共數(shù)據(jù)庫中Ⅲ期結(jié)腸癌患者轉(zhuǎn)錄組水平的mRNA表達情況及臨床隨訪信息,發(fā)現(xiàn)CXCL5和GNG13可能是影響Ⅲ期結(jié)腸癌患者預(yù)后的促癌基因。