劉娟 彭洪 吳洪 柏丹 舒子龍 屈艷 敬劍英 楊淑娟
(1. 南充市中心醫(yī)院肛腸外科,四川 南充 637000;2.南充市中心醫(yī)院胃腸外科, 四川 南充 637000;3.川北醫(yī)學(xué)院附屬醫(yī)院腎內(nèi)科, 四川 南充 6370004;4.南充市中心醫(yī)院產(chǎn)科,四川 南充 637000)
結(jié)直腸癌不僅是全球第三大最常見(jiàn)惡性腫瘤,也是全球第四大癌癥死亡原因,嚴(yán)重威脅著人類(lèi)健康[1]。盡管結(jié)直腸癌的治療取得了很多新進(jìn)展,但距患者期盼仍有很大差距,因此深入了解腫瘤發(fā)生的分子機(jī)制及尋找新的治療靶點(diǎn)已是目前臨床研究熱點(diǎn)。
RNA結(jié)合蛋白(RNA-binding proteins,RBP)是一類(lèi)重要的細(xì)胞蛋白,其可通過(guò)識(shí)別特異性的RNA結(jié)合域與RNA相互作用,廣泛參與多種轉(zhuǎn)錄后調(diào)控,如RNA剪切、轉(zhuǎn)運(yùn)、序列編輯、細(xì)胞內(nèi)定位和翻譯控制等[2-3]。RBP與多種人類(lèi)疾病相關(guān),并參與惡性腫瘤的發(fā)生、發(fā)展[4-7]。長(zhǎng)鏈非編碼RNA(Long non-coding RNA,IncRNA)是一類(lèi)長(zhǎng)度大于200核苷酸的RNA分子,占人類(lèi)基因組的70%[8]。過(guò)去IncRNA曾被認(rèn)為是基因組RNA中的轉(zhuǎn)錄噪聲,但是越來(lái)越多研究表明IncRNA在表觀遺傳、轉(zhuǎn)錄或轉(zhuǎn)錄后水平對(duì)基因表達(dá)具有調(diào)控作用[9-12],并且IncRNA在多種惡性腫瘤中表達(dá)異常,并參與腫瘤細(xì)胞增殖、凋亡、侵襲和轉(zhuǎn)移等多種生物學(xué)過(guò)程[13-15]。IncRNA的異常表達(dá)與腫瘤的進(jìn)展,包括臨床病理特征和生存率之間存在顯著相關(guān)性,這表明IncRNA可作為各種惡性腫瘤的分子標(biāo)志物[16]。
結(jié)直腸癌(Colorectal cancer,CRC)預(yù)后具有高度的異質(zhì)性,而既往研究表明RBP和IncRNA均可作為CRC診斷和預(yù)后的分子標(biāo)志物,因此可用于預(yù)測(cè)CRC患者的預(yù)后,并可以作為潛在的治療靶點(diǎn)。本研究擬構(gòu)建結(jié)直腸癌RBP相關(guān)IncRNA預(yù)后模型,旨在為改善CRC患者的預(yù)后及臨床治療提供新方向。
1.1 資料 從TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)獲取398例結(jié)直腸癌組織標(biāo)本與39例正常組織標(biāo)本(結(jié)直腸癌旁正常組織)轉(zhuǎn)錄組數(shù)據(jù)與臨床數(shù)據(jù)。從(https://ebiac.uk/GOA/)獲取RBP相關(guān)基因。本研究的所有數(shù)據(jù)都在網(wǎng)上公開(kāi),并且本研究不需要在人類(lèi)或動(dòng)物身上進(jìn)行實(shí)驗(yàn)。
1.2 差異表達(dá)基因的數(shù)據(jù)處理 通過(guò)R軟件分析結(jié)直腸癌組和正常組樣本之間的RBP基因,篩選出腫瘤和正常樣本中差異表達(dá)的RBP基因。
1.3 差異表達(dá)基因的GO富集分析 GO(Gene ontology)分析是大規(guī)?;蚬δ芨患治龅某S梅椒?,基因功能分為生物過(guò)程(Biological processes,BP)、細(xì)胞成分(Cellular components,CC)和分子功能(Molecular functions,MF)。利用R 4.0.3 clusterProfiler程序包進(jìn)行基因功能富集分析,并繪制條形圖和氣泡圖,P<0.05為結(jié)果有統(tǒng)計(jì)學(xué)意義。
1.4 RBP相關(guān)IncRNA的篩選 采用Pearson相關(guān)性分析篩選與RBP差異表達(dá)基因相關(guān)的IncRNA,滿(mǎn)足R2>0.4,P<0.001的IncRNA被認(rèn)為是RBP相關(guān)IncRNA。
1.5 數(shù)據(jù)初篩 刪除在CRC患者中生存時(shí)間少于30 d以及臨床數(shù)據(jù)缺失的患者,最后進(jìn)行生存分析的數(shù)據(jù)集包括355例CRC患者的RBP相關(guān)基因表達(dá)數(shù)據(jù)和臨床資料。再利用R軟件中caret程序包將用于預(yù)后分析的355例TCGA的HCC數(shù)據(jù)集樣本按50%與50%的比例分為訓(xùn)練集(n=178)和內(nèi)部驗(yàn)證集(n=177)。
1.6 預(yù)后RBP相關(guān)IncRNA的鑒定 應(yīng)用單因素回歸分析、Lasso分析和多元回歸分析等方法探討RBP相關(guān)IncRNA與患者OS的相關(guān)性。在單因素Cox回歸分析中,當(dāng)P<0.05時(shí)該IncRNA被視為候選預(yù)后RBP相關(guān)IncRNA,接下來(lái)再進(jìn)行Lasso分析和多元回歸分析以進(jìn)一步篩選。
1.7 風(fēng)險(xiǎn)評(píng)分公式的建立 將篩選后的三個(gè)RBP相關(guān)lncRNA用于構(gòu)建預(yù)后模型,使用風(fēng)險(xiǎn)評(píng)分公式計(jì)算風(fēng)險(xiǎn)評(píng)分,風(fēng)險(xiǎn)評(píng)分公式:Risk Score(patient) = Σi Coefficient(lncRNAi) ×Expression(lncRNAi)。coef值是通過(guò)多因素 Cox 回歸分析得到的回歸系數(shù);患者RBP相關(guān)lncRNA表達(dá)量定義為expr lncRNA。
1.8 預(yù)后模型有效性驗(yàn)證 根據(jù)三個(gè)RBP相關(guān)lncRNA表達(dá)水平分別計(jì)算訓(xùn)練集和測(cè)試集中每個(gè)患者的風(fēng)險(xiǎn)得分,按照風(fēng)險(xiǎn)評(píng)分的中位值將患者分為低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組,同時(shí)進(jìn)行ROC、Kaplan-Meier曲線和獨(dú)立預(yù)后分析,篩選獨(dú)立的預(yù)后因素,包括年齡、性別、分級(jí)、TNM分期和風(fēng)險(xiǎn)值高低。接下來(lái)納入所有的獨(dú)立預(yù)后因素,構(gòu)建建諾模圖預(yù)測(cè)結(jié)直腸癌患者1、2、3年生存率并繪制標(biāo)準(zhǔn)曲線。
2.1 差異表達(dá)的RBP基因的鑒定 從結(jié)直腸癌組和正常組樣本中共獲得493個(gè)差異表達(dá)的RBP基因,其中327個(gè)基因表達(dá)上調(diào),166個(gè)基因表達(dá)下調(diào),見(jiàn)圖1。
圖1 差異表達(dá)的RBP基因的熱圖和火山圖
2.2 RBP差異基因功能富集 GO富集分析的BP、CC和MF部分各選擇了前10個(gè)最相關(guān)的功能。對(duì)于上調(diào)表達(dá)的RBP差異基因,基因功能主要富集在lncRNA加工,核糖體合成,rRNA代謝過(guò)程,rRNA加工,核酸磷酸二酯鍵水解,RNA定位,前核糖體,細(xì)胞質(zhì)核糖核蛋白顆粒,RNA生物催化活性,核酸酶活性等。下調(diào)表達(dá)的RBP差異基因主要在細(xì)胞酰胺代謝過(guò)程調(diào)控,翻譯調(diào)控,RNA剪接,mRNA代謝過(guò)程調(diào)控,RNA分解代謝過(guò)程,mRNA分解代謝過(guò)程,細(xì)胞質(zhì)核糖核蛋白顆粒,核糖核蛋白顆粒,核斑點(diǎn),RNA生物催化活性,mRNA 3,-UTR結(jié)合等功能方面富集,見(jiàn)圖2~3。
圖2 上調(diào)表達(dá)RBP差異基因GO富集分析
圖3 下調(diào)表達(dá)RBP差異基因GO富集分析
2.3 RBP相關(guān)基因-IncRNA共表達(dá)網(wǎng)絡(luò)的構(gòu)建 差異表達(dá)的493個(gè)RBP相關(guān)基因與lncRNA進(jìn)行相關(guān)性分析,相關(guān)系數(shù)大于0.4的lncRNA被認(rèn)為是RBP相關(guān)lncRNA,共有994個(gè)lncRNA被鑒定為RBP相關(guān)lncRNA。
2.4 與預(yù)后相關(guān)的RBP相關(guān)lncRNA的確定 通過(guò)單因素回歸分析、Lasso回歸分析和多元回歸分析等方法對(duì)預(yù)后相關(guān)的RBP相關(guān)lncRNA進(jìn)行鑒定,最終有3個(gè)RBP相關(guān)lncRNA用于構(gòu)建預(yù)后模型,并構(gòu)建RBP相關(guān)差異基因-lncRNA交互網(wǎng)絡(luò),見(jiàn)圖4~5。
圖4 CRC中3個(gè)IncRNA與RBP差異表達(dá)基因共表達(dá)網(wǎng)絡(luò)圖
圖5 3個(gè)預(yù)后相關(guān)lncRNA的生存曲線圖
2.5 建立預(yù)后模型 使用多變量Cox風(fēng)險(xiǎn)回歸模型計(jì)算3個(gè)RBP相關(guān)lncRNA風(fēng)險(xiǎn)系數(shù)(表1),用于計(jì)算風(fēng)險(xiǎn)得分的風(fēng)險(xiǎn)公式如下:風(fēng)險(xiǎn)分?jǐn)?shù)=0.186822דNKILA”表達(dá)量+0.181553דLINC02474”表達(dá)量+0.660613דZEB1-AS1”表達(dá)量。
表1 3個(gè)RBP相關(guān)lncRNA多因素Cox回歸分析
2.6 預(yù)后模型分析 根據(jù)風(fēng)險(xiǎn)評(píng)分結(jié)果,3個(gè)RBP相關(guān)lncRNA在高分組和低分組的表達(dá)明顯不同,并且表達(dá)水平愈高風(fēng)險(xiǎn)得分愈高,致死率也愈高。KaplanMeier生存曲線顯示,高風(fēng)險(xiǎn)組的OS明顯差于低風(fēng)險(xiǎn)組。此外,ROC分析表明,該模型可以較為有效地預(yù)測(cè)患者1、2、3年的OS(1、2、3年AUC分別為0.730、0.712、0.772),見(jiàn)圖6。
圖6 訓(xùn)練集預(yù)后模型分析
2.7 預(yù)后模型與臨床特征的關(guān)系 使用單因素Cox回歸和多因素Cox回歸分析風(fēng)險(xiǎn)評(píng)分與臨床病理特征的關(guān)系。單因素Cox回歸分析表明腫瘤分級(jí)、TNM分期和風(fēng)險(xiǎn)評(píng)分與CRC患者OS顯著相關(guān),多因素Cox回歸分析表明年齡、腫瘤大小和風(fēng)險(xiǎn)評(píng)分是獨(dú)立預(yù)后因子,見(jiàn)圖7。
圖7 預(yù)后模型與臨床特征的關(guān)系
2.8 諾模圖的構(gòu)建 根據(jù)患者的臨床特征,將臨床性狀進(jìn)行二分類(lèi)(如年齡分為<65歲及≥65歲)構(gòu)建諾模圖,并繪制諾模圖的標(biāo)準(zhǔn)曲線。結(jié)果表明諾模圖預(yù)測(cè)1年和2年生存率優(yōu)于3年生存率,因?yàn)樵?年和2年生存率預(yù)測(cè)中,實(shí)際和預(yù)測(cè)的生存率相差較小。根據(jù)標(biāo)準(zhǔn)曲線表明這個(gè)模型對(duì)結(jié)直腸癌患者預(yù)后的預(yù)測(cè)具有比較大的優(yōu)勢(shì),見(jiàn)圖8。
圖8 諾模圖可預(yù)測(cè)患者生存率
2.9 內(nèi)部驗(yàn)證 內(nèi)部驗(yàn)證集中的177例CRC患者按照風(fēng)險(xiǎn)評(píng)分的中位值將患者分為低分組和高分組,結(jié)果表明3個(gè)RBP相關(guān)lncRNA表達(dá)水平在高分組中明顯高于低分組,表達(dá)水平愈高風(fēng)險(xiǎn)得分愈高。KaplanMeier生存曲線顯示,高風(fēng)險(xiǎn)組CRC患者的OS明顯差于低風(fēng)險(xiǎn)組。ROC分析結(jié)果表明,1、2和3年AUC分別為0.735、0.769、0.777,說(shuō)明該模型可以較為有效地預(yù)測(cè)患者1年、2年和3年的OS,同訓(xùn)練集中的預(yù)測(cè)結(jié)果相似,見(jiàn)圖9。
圖9 驗(yàn)證集預(yù)后模型分析
單因素Cox回歸分析表明腫瘤分級(jí)、腫瘤侵潤(rùn)程度、淋巴結(jié)轉(zhuǎn)移和風(fēng)險(xiǎn)評(píng)分與CRC患者OS顯著相關(guān),多因素Cox回歸分析表明風(fēng)險(xiǎn)評(píng)分是獨(dú)立預(yù)后因子,見(jiàn)圖10。
圖10 預(yù)后模型與臨床特征的關(guān)系
基因組的大部分被轉(zhuǎn)錄成非(蛋白質(zhì))編碼的RNA片段,其中l(wèi)ncRNAs在細(xì)胞中占轉(zhuǎn)錄產(chǎn)物的絕大多數(shù),它們控制著轉(zhuǎn)錄、剪接、RNA穩(wěn)定性和翻譯等細(xì)胞進(jìn)程[17]。RBP可動(dòng)態(tài)協(xié)調(diào)各種RNA的成熟、運(yùn)輸和穩(wěn)定性[18],如與68KDa有絲分裂相關(guān)的SRC(SAM68)是RNA結(jié)合蛋白STAR家族(Signal transduction and RNA metabolism activation)的一員,它參與mRNA代謝的幾個(gè)步驟如轉(zhuǎn)錄、選擇性剪接和核輸出。此外SAM68與細(xì)胞對(duì)刺激的反應(yīng)、細(xì)胞周期轉(zhuǎn)換和病毒感染所需的信號(hào)轉(zhuǎn)導(dǎo)通路相關(guān)[19-20]。TARBP2在轉(zhuǎn)移性乳腺癌患者中過(guò)表達(dá),其異常激活可通過(guò)影響靶mRNA的穩(wěn)定性而促進(jìn)乳腺癌的進(jìn)展,還可以增強(qiáng)乳腺癌患者對(duì)三苯氧胺的耐藥性[21-22]。因此RBP表達(dá)水平或功能的改變可產(chǎn)生重要的影響。然而到目前為止只有少數(shù)與癌癥相關(guān)的lncRNAs可與RBP相互作用參與腫瘤進(jìn)展。因此,本研究對(duì)RBP相關(guān)IncRNA與CRC預(yù)后的關(guān)系進(jìn)行了深入分析。對(duì)CRC中表達(dá)的RBP基因進(jìn)行綜合分析,共鑒定出503個(gè)差異表達(dá)的RBP基因,其中327個(gè)基因表達(dá)上調(diào),166個(gè)基因表達(dá)下調(diào)。對(duì)于上調(diào)表達(dá)的RBP差異基因,基因功能主要富集在ncRNA加工,核糖體合成,rRNA代謝過(guò)程,下調(diào)表達(dá)的RBP差異基因主要在細(xì)胞酰胺代謝過(guò)程調(diào)控,翻譯調(diào)控,RNA剪接,mRNA代謝過(guò)程調(diào)控,RNA分解代謝過(guò)程等功能方面富集。進(jìn)一步構(gòu)建了RBP相關(guān)基因-IncRNA共表達(dá)網(wǎng)絡(luò),發(fā)現(xiàn)994個(gè)lncRNA被鑒定為RBP相關(guān)lncRNA。通過(guò)單因素回歸分析、Lasso分析和多元回歸分析等方法最終選擇了LINC02474, NKILA,和ZEB1-AS1作為評(píng)估CRC預(yù)后的RBP相關(guān)lncRNA,并推算出風(fēng)險(xiǎn)公式(風(fēng)險(xiǎn)分?jǐn)?shù)=0.186822דNKILA”表達(dá)量+0.181553דLINC02474”表達(dá)量+0.660613דZEB1-AS1”表達(dá)量)。對(duì)TCGA數(shù)據(jù)集進(jìn)行篩選后根據(jù)數(shù)據(jù)集風(fēng)險(xiǎn)評(píng)分的中值將所有患者分為高風(fēng)險(xiǎn)組和低分險(xiǎn)組,訓(xùn)練集和驗(yàn)證集中低分險(xiǎn)組的OS均優(yōu)于高風(fēng)險(xiǎn)組。ROC分析顯示本風(fēng)險(xiǎn)模型預(yù)測(cè)訓(xùn)練集中CRC患者1、2、3年OS的AUC分別為0.730、0.712、0.772,驗(yàn)證集則分別為0.735、0.769、0.777。并且單因素和多因素Cox回歸分析證實(shí)風(fēng)險(xiǎn)評(píng)分與CRC患者的OS顯著相關(guān),表明風(fēng)險(xiǎn)評(píng)分是預(yù)測(cè)CRC患者預(yù)后的獨(dú)立指標(biāo)。這些結(jié)果表明基于LINC02474, NKILA,和ZEB1-AS1的風(fēng)險(xiǎn)評(píng)分可以準(zhǔn)確預(yù)測(cè)結(jié)直腸癌患者的預(yù)后。本研究中還建立了基于預(yù)后特征和臨床因素的諾模圖模型,結(jié)果表明諾模圖預(yù)測(cè)CRC患者1,2,3年生存率具有較好的性能,進(jìn)一步證明了風(fēng)險(xiǎn)評(píng)分在預(yù)測(cè)CRC患者長(zhǎng)期預(yù)后方面的可靠性。
本研究發(fā)現(xiàn)LINC02474, NKILA,和ZEB1-AS1這3個(gè)RBP相關(guān)IncRNA都與腫瘤有關(guān), ZEB1-AS1在CRC組織中高表達(dá),其表達(dá)水平與CRC患者OS和無(wú)復(fù)發(fā)生存率顯著相關(guān)。ZEB1-AS1可促進(jìn)CRC細(xì)胞增殖并抑制細(xì)胞凋亡,其可能是通過(guò)抑制細(xì)胞周期抑制蛋白p15發(fā)揮作用[23]。并且ZEB1-AS1在肝癌組織和細(xì)胞中表達(dá)上調(diào),其可通過(guò)靶向抑制miR-23c促進(jìn)肝癌細(xì)胞的增殖和侵襲[24]。對(duì)于NKILA的研究表明NKILA可通過(guò)使T細(xì)胞對(duì)活化誘導(dǎo)的細(xì)胞死亡敏感來(lái)促進(jìn)乳腺癌免疫逃逸,NKILA的過(guò)表達(dá)與細(xì)胞凋亡水平降低及患者生存期縮短相關(guān),提示NKILA可作為抗腫瘤免疫治療的作用靶點(diǎn)[25]。但是LINC02474在腫瘤方面的研究還不夠深入,只有Wang等[26]的研究報(bào)道LINC02474是CRC患者預(yù)后相關(guān)的lncRNA,但其具體作用機(jī)制尚需進(jìn)一步研究。
本研究成功構(gòu)建了結(jié)直腸癌RBP相關(guān)IncRNA預(yù)后模型,發(fā)現(xiàn)3個(gè)RBP相關(guān)IncRNA(LINC02474,NKILA,ZEB1-AS1) 可能是CRC的預(yù)測(cè)因子,并與CRC的發(fā)生、發(fā)展相關(guān),為CRC的治療開(kāi)辟了新的視角。LINC02474,NKILA,ZEB1-AS1等基因已被證實(shí)能影響腫瘤的進(jìn)展,并有可能用于靶向治療。但是LINC02474,NKILA和ZEB1-AS1在結(jié)直腸癌細(xì)胞和動(dòng)物中的研究較少,其具體作用機(jī)制也不明確,因此還需要更多的臨床數(shù)據(jù)及更深入的機(jī)制研究支持本研究的結(jié)論。