葛品序 羅晨銘 張中祺 袁騰飛 侯宇川 (吉林大學(xué)第一醫(yī)院,吉林 長(zhǎng)春 130021)
全球每年確診約有43萬(wàn)新發(fā)腎癌病例,死亡18萬(wàn)例〔1〕。腎癌起病隱匿,早期常無(wú)明顯癥狀或體征,進(jìn)展時(shí)期可能有腰痛和血尿的表現(xiàn)〔2〕。腎透明細(xì)胞癌(ccRCC)是最常見(jiàn)的腎癌類(lèi)型,占所有病例的60%和轉(zhuǎn)移性病例的75%~80%〔3〕。多種因素共同導(dǎo)致ccRCC患者的預(yù)后存在顯著差異,包括臨床分期、組織病理學(xué)和基因突變層面上的差異等等〔4〕。傳統(tǒng)的腫瘤淋巴結(jié)轉(zhuǎn)移(TNM)分期系統(tǒng)和患者的臨床病理特征預(yù)測(cè)風(fēng)險(xiǎn)分層與預(yù)后實(shí)際上并不令人滿(mǎn)意。因此,需要開(kāi)發(fā)新的預(yù)后模型用于更加準(zhǔn)確的預(yù)測(cè)患者預(yù)后狀態(tài)。
雙硫死亡是一種不同于鐵死亡〔5〕、銅死亡〔6〕及凋亡〔7〕等的新型死亡方式。其致使細(xì)胞內(nèi)過(guò)量胱氨酸積累導(dǎo)致的二硫化物應(yīng)激引起的快速死亡形式誘導(dǎo)腫瘤細(xì)胞雙硫死亡,可以抑制腫瘤細(xì)胞的生長(zhǎng)和疾病進(jìn)展〔8〕。LncRNA是長(zhǎng)度大于200個(gè)核苷酸的非編碼RNA,在腫瘤的發(fā)生和轉(zhuǎn)移中起著重要作用〔9〕。目前,雙硫死亡相關(guān)lncRNA(DR-lncRNA)對(duì)ccRCC患者預(yù)后影響尚未清楚。本研究全面分析了DR-lncRNA在ccRCC的預(yù)后和免疫景觀中的作用,并進(jìn)行了風(fēng)險(xiǎn)模型的構(gòu)建,該模型具有比傳統(tǒng)臨床變量更高的預(yù)測(cè)準(zhǔn)確性,并為促進(jìn)對(duì)ccRCC生物學(xué)的理解和開(kāi)發(fā)新興治療方法提供了觀點(diǎn)。
1.1數(shù)據(jù)下載與整理 從癌癥基因組圖譜(TCGA,https://portal.gdc.cancer.gov/)下載ccRCC患者542份腫瘤組織和72份正常組織腎臟樣本的轉(zhuǎn)錄本數(shù)據(jù)和臨床信息數(shù)據(jù)〔10〕,納入標(biāo)準(zhǔn)為患者均有完整的臨床信息(TNM分級(jí)、分期、性別、年齡和生存數(shù)據(jù))排除生存時(shí)間<30 d和臨床信息不全的樣本,最終得到506份腫瘤組織和72份正常組織的腎臟樣本。有研究〔11〕證明了15個(gè)雙硫死亡相關(guān)基因(DRGs),包括:FLNA、FLNB、MYH9、TLN1、ACTB、MYL6、MYH10、CAPZB、DSTN、IQGAP1、ACTN4、PDLIM1、CD2AP、INF2、SLC7A11。通過(guò)Perl軟件,本文對(duì)轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行整理,得到了轉(zhuǎn)錄組的lncRNAs和蛋白編碼mRNA,繼而從mRNA中提取DRGs。篩選與ccRCC顯著相關(guān)的lncRNA,采用R語(yǔ)言中“l(fā)imma”包行Pearson相關(guān)性分析,篩選標(biāo)準(zhǔn)為Pearson相關(guān)系數(shù)(PCC)>0.4且P<0.001,分析ccRCC患者腫瘤樣本中l(wèi)ncRNA和DRGs表達(dá)之間的相關(guān)性,篩選出與DRGs相關(guān)的lncRNA。
1.2DR-lncRNA預(yù)后模型的構(gòu)建 使用“caret”包將數(shù)據(jù)集按照1∶1隨機(jī)分為訓(xùn)練集和驗(yàn)證集。使用R語(yǔ)言中“survival”包,行單因素Cox回歸分析,挑選與總體生存率差異顯著的DR-lncRNA(P<0.05)。隨后采用“glmnet”包行LASSO回歸,在懲罰系數(shù)λ最小時(shí),選擇最合適的lncRNAs構(gòu)建預(yù)后模型。將LASSO回歸篩選出的lncRNAs行多因素Cox回歸,根據(jù)赤池信息量準(zhǔn)則(AIC),挑選AIC極小值當(dāng)作ccRCC患者最佳預(yù)后模型。根據(jù)公式計(jì)算,風(fēng)險(xiǎn)評(píng)分:(risk score)=Σcoef基因i×基因i表達(dá)量,通過(guò)加權(quán)l(xiāng)ncRNA回歸系數(shù)(coef)和表達(dá)水平得到風(fēng)險(xiǎn)值,依照風(fēng)險(xiǎn)評(píng)分的中位值,將ccRCC患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。
1.3預(yù)后模型的驗(yàn)證 采用R“survival”包繪制K-M生存曲線,比較高、低危組的總生存期(OS)和無(wú)進(jìn)展生存期(PFS),評(píng)估風(fēng)險(xiǎn)模型預(yù)測(cè)ccRCC生存率的準(zhǔn)確性,估計(jì)高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組間生存差異。對(duì)年齡、性別、分期(Stage)、分級(jí)(Grade)、風(fēng)險(xiǎn)評(píng)分進(jìn)行單因素和多因素Cox回歸分析,評(píng)估風(fēng)險(xiǎn)評(píng)分是否可做為ccRCC的獨(dú)立預(yù)后因素。利用受試者工作特征(ROC)曲線和C指數(shù)方法比較風(fēng)險(xiǎn)評(píng)分和不同臨床病理特征的預(yù)測(cè)能力。采用C指數(shù)方法對(duì)本研究構(gòu)建的預(yù)后模型進(jìn)行預(yù)測(cè)效能評(píng)估,獲得一致性指數(shù)(C指數(shù)),C指數(shù)取值范圍為0.5~1.0,越趨近于1證明模型預(yù)測(cè)準(zhǔn)確性越高。
1.4列線圖和校準(zhǔn)曲線 列線圖是建立在多因素Cox回歸分析的基礎(chǔ)上,采用多個(gè)臨床指標(biāo)來(lái)評(píng)估患者生存預(yù)后的常用工具。使用多因素Cox回歸中差異有統(tǒng)計(jì)學(xué)意義的因素來(lái)繪制列線圖,分析ccRCC患者1、3和5年的生存期。使用校準(zhǔn)曲線評(píng)估預(yù)測(cè)的生存率是否與實(shí)際生存情況一致,C指數(shù)來(lái)評(píng)估列線圖的識(shí)別和預(yù)測(cè)能力的可靠性。
1.5富集分析和免疫相關(guān)性分析使用 為探究風(fēng)險(xiǎn)評(píng)分與生物學(xué)過(guò)程的關(guān)系,使用R“l(fā)imma”包識(shí)別高危與低危組間差異基因,篩選條件為|log2 (fold change)|>1和FDR<0.05。使用京都基因與基因組百科全書(shū)(KEGG)來(lái)評(píng)估與差異表達(dá)基因(DEGs)相關(guān)的生物通路。基于基因本體論(GO)對(duì)DEGs調(diào)控的功能進(jìn)行分析。
1.6高、低風(fēng)險(xiǎn)組免疫微環(huán)境的差異 基于22種腫瘤富集的免疫細(xì)胞在每個(gè)基因的情況得出每個(gè)樣本的免疫細(xì)胞分布,根據(jù)高、低風(fēng)險(xiǎn)患者的分組,利用單樣本基因集富集分析(ssGSEA)得分計(jì)算所有樣品中的高、低風(fēng)險(xiǎn)組間免疫相關(guān)功能和細(xì)胞的富集水平差異。
1.7高、低風(fēng)險(xiǎn)組免疫治療敏感性差異預(yù)測(cè) 利用在線數(shù)據(jù)庫(kù)腫瘤免疫功能障礙和排斥(TIDE,http://tide.dfci.harvard.edu/)對(duì)所有樣品進(jìn)行打分,然后對(duì)高、低風(fēng)險(xiǎn)組間TIDE得分進(jìn)行差異分析。
1.8模型中DR-lncRNAs正常與腫瘤樣本的差異 分析構(gòu)建模型中l(wèi)ncRNAs的表達(dá)量與正常組織的差異,在72例正常樣本與505例腫瘤樣本數(shù)據(jù)中提取模型中l(wèi)ncRNAs的表達(dá)量,使用“pheatmap”包構(gòu)建表達(dá)熱圖。
1.9RNA提取及實(shí)時(shí)熒光定量聚合酶鏈反應(yīng)(RT-qPCR)檢測(cè)ccRCC組織和癌旁組織 本項(xiàng)目經(jīng)過(guò)吉林大學(xué)第一醫(yī)院醫(yī)學(xué)倫理委員會(huì)同意并實(shí)施,倫理審查號(hào)為2023-545。以下實(shí)驗(yàn)均嚴(yán)格按照說(shuō)明書(shū)進(jìn)行。使用Trizol法從10個(gè)ccRCC標(biāo)本和癌旁組織中提取總RNA。用超微量紫外分光光度計(jì)(Nanodrop 2000)檢查總RNA濃度和純度。然后,使用SweScript All-in-One RT SuperMix for qPCR (One-Step gDNA Remover)試劑將標(biāo)本逆轉(zhuǎn)錄成cDNA,在熒光PCR儀器上使用Universal Blue SYBR Green qPCR Master Mix對(duì)模型的7個(gè)基因進(jìn)行qPCR分析。使用2-ΔΔCt方法進(jìn)行數(shù)據(jù)分析,以磷酸甘油醛脫氫酶(GAPDH)為內(nèi)參,將基因表達(dá)量歸一化處理。引物均從武漢塞維爾有限公司處設(shè)計(jì)并購(gòu)買(mǎi),引物序列(5′→3′):AC106786.1上游引物:GTTTTGACTGGCGTCGTTATGA,下游:CGATGGAGTTGCTGGAGGTC;AC108673.3上游引物:AACTGCACCTGCTAAATCCCTT,下游:AGTGCCTCAAATGTTGTCCTCC;AL355835.1上游引物:AGATTTCTGCTGG-AGGATGGG,下游:TCTTACACGAGGGATCAGGC-AC;SPINT1-AS1上游引物:AGAAGCTGGTGCCCTTGGTG,下游:TCAAGGTTCAAGAGCAGGAGG;AL12-1944.1上游引物:GAAGCTGGTTCTACCTTTCTCCG,下游:CCTCCAAACATCCAGTCCCTC;AL590822.3上游引物:TAAAATGTCCCCGACCATCCTC,下游:GACGGGCTCCCATGACAAGA;AC008555.1上游引物:CAATTCTCCTGCCTCAGCCT,下游:CGAGGAG-GGTGGATCAACTG。
1.10統(tǒng)計(jì)學(xué)分析 使用Perl數(shù)據(jù)語(yǔ)言(http://www.perl.org/)、R軟件(版本4.2.3,https://www.r-project.org/)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)。連續(xù)資料采用Wilcoxon檢驗(yàn)或獨(dú)立t檢驗(yàn),分類(lèi)資料采用χ2檢驗(yàn)或Fisher精確檢驗(yàn)。Cox比例風(fēng)險(xiǎn)回歸模型用于計(jì)算單因素和多因素分析的風(fēng)險(xiǎn)比。不同組整體生存時(shí)間的比較使用Kaplan-Meier生存分析。
2.1構(gòu)建DR-lncRNA并構(gòu)建預(yù)后模型 15個(gè)DRGs來(lái)自之前的文獻(xiàn),經(jīng)過(guò)共表達(dá)分析后獲得397個(gè)DR-lncRNA。通過(guò)單因素Cox回歸分析進(jìn)一步篩選出161個(gè)具有預(yù)后作用的lncRNA,再將上述lncRNA進(jìn)行l(wèi)asso回歸和多因素Cox回歸分析,最終確定7個(gè)關(guān)鍵預(yù)后相關(guān)的lncRNA納入構(gòu)建預(yù)后模型,風(fēng)險(xiǎn)模型評(píng)分=(0.442 6×AL590822.3表達(dá)量)+(-0.734 5×AL355835.1表達(dá)量)+(-0.354 5×AC008555.1表達(dá)量)+(-0.415 8×SPINT1-AS1表達(dá)量)+(0.690 5×AC106786.1表達(dá)量)+(0.387 6×AC108673.3表達(dá)量)+(-1.106 9×AL121944.1表達(dá)量)。
2.2構(gòu)建模型效能的驗(yàn)證 將505例患者隨機(jī)分為訓(xùn)練組252例和驗(yàn)證組253例,訓(xùn)練組與驗(yàn)證組臨床資料比較差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。根據(jù)風(fēng)險(xiǎn)評(píng)分中位數(shù)分為高風(fēng)險(xiǎn)組、低風(fēng)險(xiǎn)組。生存分析結(jié)果表明,在訓(xùn)練組、驗(yàn)證組和整體組中,高風(fēng)險(xiǎn)組OS均短于低風(fēng)險(xiǎn)組,在整個(gè)數(shù)據(jù)集中高風(fēng)險(xiǎn)組PFS也顯著短于低風(fēng)險(xiǎn)組(P均<0.05);該風(fēng)險(xiǎn)模型預(yù)測(cè)1、3、5年生存率的曲線下面積(AUC)分別為0.729、0.750、0.772。DR-lncRNA在整體組的表達(dá)熱圖,可以看出AL355835.1、AC008555.1、SPINT1-AS1、AL121944.1在低風(fēng)險(xiǎn)患者中高表達(dá),AL590822.3、AC106786.1、AC108673.3在高風(fēng)險(xiǎn)風(fēng)險(xiǎn)的患者中高表達(dá)。見(jiàn)圖1。
圖1 驗(yàn)證DR-lncRNA預(yù)后特征
2.3列線圖構(gòu)建 繪制列線圖,C指數(shù)為0.792(95%CI:0.760~0.823),結(jié)合校準(zhǔn)曲線,表明預(yù)測(cè)與實(shí)際觀測(cè)的生存率基本一致。見(jiàn)圖2。
圖2 構(gòu)建和評(píng)估模型的預(yù)測(cè)能力
2.4富集分析 為了探究高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組ccRCC患者之間功能差異,使用高低風(fēng)險(xiǎn)組的差異基因進(jìn)行了GO和KEGG富集分析。GO富集分析顯示,在分子生物學(xué)過(guò)程(BP)、類(lèi)別中,基因主要富集在對(duì)細(xì)菌的防御反射、體液免疫反應(yīng)。在細(xì)胞成分(CC)類(lèi)別中,主要富集于質(zhì)膜外側(cè)和含膠原蛋白的細(xì)胞外基質(zhì)。在分子功能(MF)類(lèi)別中,富集于信號(hào)受體激活劑活性和受體配體活性(圖3)。KEGG富集分析中,其富集于細(xì)胞因子和細(xì)胞因子受體相互作用(圖4)。GSEA分析顯示,在高危組富集的途徑與原始免疫缺陷與亞油酸代謝等有關(guān),而在低危組中與一些代謝途徑相關(guān),如纈氨酸和異亮氨酸降解及過(guò)氧化物酶體(圖5)。
圖3 差異基因的GO富集分析
圖4 KEGG分析
圖5 GSEA分析
2.5高、低風(fēng)險(xiǎn)組中免疫治療效果 通過(guò)TIDE評(píng)分來(lái)判斷高、低風(fēng)險(xiǎn)組樣本對(duì)免疫治療的有效性。如圖6所示,高風(fēng)險(xiǎn)組樣品較低風(fēng)險(xiǎn)組樣品具有較高的TIDE評(píng)分,提示高風(fēng)險(xiǎn)組樣品在免疫治療中的效果較低風(fēng)險(xiǎn)組差。
圖6 腫瘤免疫功能障礙和排斥反應(yīng)(TIDE)
2.6高、低風(fēng)險(xiǎn)組中免疫細(xì)胞浸潤(rùn)分析和免疫功能的差異分析 使用CIBERSORT分析計(jì)算了患者的免疫細(xì)胞浸潤(rùn)分?jǐn)?shù),結(jié)果顯示,高風(fēng)險(xiǎn)組中CD8+T細(xì)胞、輔助性T細(xì)胞、調(diào)節(jié)T細(xì)胞、M0巨噬細(xì)胞浸潤(rùn)更高。低風(fēng)險(xiǎn)組中靜止的CD4+記憶T細(xì)胞、單核細(xì)胞、M1巨噬細(xì)胞、M2巨噬細(xì)胞及靜止的肥大細(xì)胞浸潤(rùn)更高。免疫發(fā)生和反應(yīng)過(guò)程中高低風(fēng)險(xiǎn)有差異的免疫功能為CD8+T細(xì)胞、未成熟的樹(shù)突細(xì)胞(IDCs) 、肥大細(xì)胞、中性粒細(xì)胞、T細(xì)胞共刺激、2型干擾素反應(yīng)。見(jiàn)圖7。
A.基于ssGSEA評(píng)分,16種免疫細(xì)胞在不同風(fēng)險(xiǎn)組中的比較;B.13種免疫相關(guān)功能的差異比較圖7 風(fēng)險(xiǎn)模型與腫瘤免疫微環(huán)境的關(guān)系
2.7模型中DR-lncRNAs正常與腫瘤樣本的差異表達(dá) 在505例ccRCC和72例正常組織中,構(gòu)建模型中l(wèi)ncRNAs的表達(dá)量與正常組織的差異顯著(表1)。為了驗(yàn)證模型的可靠性,在10例ccRCC標(biāo)本和癌旁中進(jìn)行qRT-PCR測(cè)定以驗(yàn)證7種DR-lncRNA的表達(dá)水平。結(jié)果顯示,與癌旁組織相比,AL355835.1、AC008555.1、SPINT1-AS1、AL1219-44.1表達(dá)水平在ccRCC細(xì)胞系中下調(diào),而AL590822.3、AC106786.1、AC108673.3在ccRCC中上調(diào)(表2)。這些結(jié)果證明了從DR-lncRNA構(gòu)建風(fēng)險(xiǎn)模型的可靠性。
表1 風(fēng)險(xiǎn)模型lncRNA在TCGA的正常組織與ccRCC組織中表達(dá)比較
表2 RT-qPCR驗(yàn)證雙硫死亡相關(guān)預(yù)后lncRNA在ccRCC與癌旁表達(dá)水平(n=10)
雙硫死亡〔11〕是一種新的細(xì)胞死亡方式,其機(jī)制可能被用于治療癌癥。硫是一種機(jī)體不可缺少的微量元素。細(xì)胞質(zhì)內(nèi)二硫鍵的積累可破壞細(xì)胞氧化還原狀態(tài)的平衡,進(jìn)而誘導(dǎo)雙硫應(yīng)激和細(xì)胞毒性〔12〕。
然而DR-lncRNA在ccRCC患者中的價(jià)值仍然未知。本研究建立了基于7個(gè)DR-lncRNA的模型,其中AL590822.3、AC106786.1及AC108673.3為風(fēng)險(xiǎn)基因,而AL355835.1、AC008555.1、SPINT1-AS1及AL121944.1為保護(hù)基因。在本文模型的7個(gè)DR-lncRNA中, SPINT1-AS1也稱(chēng)為HGF激活劑(HGFA)抑制劑1型(HAI-1),是一種Kunitz型絲氨酸蛋白酶抑制劑,在大多數(shù)上皮細(xì)胞表面表達(dá)。在乳腺癌中SPINT1-AS1有促進(jìn)乳腺癌細(xì)胞增殖和遷移的作用,其在乳腺癌患者和乳腺癌細(xì)胞系的血清中上調(diào),當(dāng)基因敲低后乳腺癌細(xì)胞的增殖和遷移能力明顯下降〔13〕。與乳腺癌類(lèi)似,其在前列腺癌〔14〕、胰腺導(dǎo)管腺癌〔15〕、結(jié)直腸癌〔16〕和甲狀腺癌〔17〕中高表達(dá),但是在食管鱗癌〔18〕、胃癌〔19〕和子宮內(nèi)膜癌〔20〕中低表達(dá)。因此,其結(jié)果說(shuō)明 SPINT1作用可能是器官特異性的。AC008555.1,AC106786.1,AC108673.3分別在 甲狀腺癌〔21〕、肺鱗狀細(xì)胞癌〔22〕與卵巢癌〔23〕的預(yù)測(cè)模型中作為關(guān)鍵基因。
本文GO結(jié)果表明,高低風(fēng)險(xiǎn)組中DR-lncRNA差異基因的MF主要富集于信號(hào)受體激活劑活性和受體配體活性。信號(hào)受體激活劑和受體配體的異?;罨虮磉_(dá)可能會(huì)導(dǎo)致癌癥。受體酪氨酸激酶 (RTKs) 是一類(lèi)細(xì)胞表面受體,對(duì)于細(xì)胞增殖、生存和遷移起到關(guān)鍵作用。多種RTKs,如血管內(nèi)皮生長(zhǎng)因子受體(VEGFR)、血小板衍生生長(zhǎng)因子受體(PDGFR)和肝細(xì)胞生長(zhǎng)因子受體(c-Met),在腎癌中的異常激活與疾病的進(jìn)展和預(yù)后有關(guān)〔24〕。本文KEGG結(jié)果表示,差異基因富集通路在細(xì)胞因子和細(xì)胞因子受體相互作用中。細(xì)胞通過(guò)分泌細(xì)胞因子和化學(xué)因子來(lái)相互通訊,從而影響腫瘤的生長(zhǎng)、侵襲和轉(zhuǎn)移。本文多種免疫和代謝途徑的GSEA預(yù)測(cè)顯示,DR-lncRNA可能在高危組中影響ccRCC中的原始免疫缺陷和亞油酸代謝。因此,干預(yù)這些代謝途徑可能有助于未來(lái)ccRCC治療。腎癌與腫瘤免疫微環(huán)境的關(guān)系是一個(gè)復(fù)雜且不斷發(fā)展的研究領(lǐng)域。
綜上,基于7個(gè)DR-lncRNA的預(yù)測(cè)模型展現(xiàn)了較高的精確度,本文模型揭示了高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)患者的免疫微環(huán)境并預(yù)測(cè)了患者的免疫治療狀態(tài)。然而本文的研究也存在局限性,該模型需要在更大的人群隊(duì)列中進(jìn)行驗(yàn)證。