雷媛娣,劉艷萍,孫站兵,鄧偉華,張朝暉
(南華大學(xué) 公共衛(wèi)生學(xué)院 預(yù)防醫(yī)學(xué)系,湖南 衡陽(yáng) 421001)
肺癌是近年來(lái)全球范圍內(nèi)發(fā)病率和死亡率最高的惡性疾病[1],其中85%以上為非小細(xì)胞肺癌(NSCLC)[2],包括肺腺癌(LUAD),肺鱗狀細(xì)胞癌(LUSC)和大細(xì)胞肺癌(LCLC),以及其他不常見(jiàn)的類型,其中肺腺癌最常見(jiàn)。目前,在肺腺癌的分子病理學(xué)、臨床腫瘤學(xué)、靶向治療等研究方面取得了較好進(jìn)展,但肺腺癌患者的死亡率沒(méi)有顯著降低[3-4]。因此,需要尋找肺腺癌的早期診斷生物標(biāo)志以提高患者的生存率。
近年,腫瘤與免疫的相關(guān)性受到越來(lái)越多的重視,腫瘤中免疫細(xì)胞浸潤(rùn)程度與腫瘤生長(zhǎng)、進(jìn)展和患者結(jié)局有關(guān),其不僅對(duì)患者的生存具有預(yù)測(cè)價(jià)值,還可影響腫瘤的治療效果[5-6]。肺癌、乳腺癌等實(shí)體腫瘤組織中存在免疫細(xì)胞浸潤(rùn),免疫細(xì)胞浸潤(rùn)類型與這些實(shí)體腫瘤的臨床特征有較強(qiáng)的相關(guān)性且免疫細(xì)胞浸潤(rùn)情況可用于腫瘤風(fēng)險(xiǎn)分層[7-9],免疫細(xì)胞包括B細(xì)胞,NK細(xì)胞、T細(xì)胞、DC細(xì)胞等等,而這些細(xì)胞通常會(huì)表達(dá)一些特定基因。
從TCGA和GEO數(shù)據(jù)庫(kù)中下載肺腺癌mRNA表達(dá)數(shù)據(jù),用生物信息學(xué)方法篩選肺腺癌差異表達(dá)基因,對(duì)差異基因進(jìn)行系統(tǒng)性分析,并利用Cibersort計(jì)算肺腺癌和正常肺組織樣本中不同種類免疫細(xì)胞的浸潤(rùn)程度,探討肺腺癌早期診斷的生物標(biāo)志物,為肺腺癌的靶向治療研究提供新思路。
通過(guò)GEO(https://www.ncbi.nlm.nih.gov/GEO31210)和TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)下載肺腺癌基因表達(dá)及臨床病理數(shù)據(jù)。包括mRNA和clinical;GSE31210數(shù)據(jù)集基于GPL570([HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array)平臺(tái),包括226例肺腺癌腫瘤樣本和20例正常肺組織樣本;TCGA數(shù)據(jù)集包括526例肺腺癌樣本和59例正常肺組織樣本。
利用R語(yǔ)言limma包,以P<0.05 及|log 2 FC|>2為條件,篩選正常組織以及肺腺癌樣本之間的差異表達(dá)基因[10],再將GEO和TCGA的差異基因取交集,得到234個(gè)差異基因,使用(http://PSB.ugent.be/web tools/Venn/)在線繪制Venn圖,然后用R語(yǔ)言ggscatter包繪制差異基因的火山圖。
利用DAVID網(wǎng)站(https://david.ncifcrf.gov/tools.jsp,對(duì)DEGs進(jìn)行GO注釋及KEGG富集分析,研究DEGs的生物功能,包括生物過(guò)程(BP)、分子功能(MF)和細(xì)胞成分(CC);KEGG用于通路富集分析,P<0.05和FDR<0.05被標(biāo)記為有效項(xiàng)。
通過(guò) STRING 數(shù)據(jù)庫(kù)(https://string-db.org/)構(gòu)建 PPI網(wǎng)絡(luò),Cytoscape 軟件 將 PPI 網(wǎng)絡(luò)可視化[11],并利用 cytoHubba 插件選擇前 20 個(gè)基因作為 hub 基因。
按照表達(dá)量高低將肺腺癌樣本分為:高表達(dá)和低表達(dá)兩組,利用R語(yǔ)言survival包在GSE31210和TCGA數(shù)據(jù)庫(kù)里分別做預(yù)后生存分析;并使用卡普蘭-邁耶(Kaplan-Meier)(http://kmplot.com/analysis/index.php)在線工具對(duì)20個(gè)關(guān)鍵基因進(jìn)行生存分析,并對(duì)有預(yù)后價(jià)值的基因用 GraphPad Prism 5軟件繪制生存圖。
用R語(yǔ)言pROC包繪制肺腺癌預(yù)后生存分析中有統(tǒng)計(jì)學(xué)意義的基因的ROC曲線[12],并根據(jù)AUC值對(duì)肺腺癌有診斷價(jià)值的hub基因進(jìn)行評(píng)估,按AUC>0.7篩選肺腺癌診斷生物標(biāo)志物。
為提高分析結(jié)果的準(zhǔn)確性,采用GSEA軟件(https://www.gsea-msigdb.org/gsea/index.jsp)分析已篩選的肺腺癌診斷生物標(biāo)志物等基因是否在所選數(shù)據(jù)集中富集分子通路[13-14],計(jì)算富集分?jǐn)?shù)并進(jìn)行顯著性檢驗(yàn)分析。
為了評(píng)估肺腺癌中免疫細(xì)胞浸潤(rùn)情況,以及篩選的肺腺癌診斷生物標(biāo)志物等基因表達(dá)與肺腺癌組織中免疫細(xì)胞浸潤(rùn)情況間的關(guān)系,用CIBERSORT算法(https://cibersort.stanford.edu/)對(duì)GSE31210數(shù)據(jù)進(jìn)行分析,根據(jù)P<0.05篩選合適的樣本并計(jì)算樣本中每種免疫細(xì)胞的百分比,用 ggplot2 包繪制22種免疫細(xì)胞浸潤(rùn)可視化小提琴圖,并分析其22種免疫細(xì)胞浸潤(rùn)的差異。
結(jié)果顯示:TCGA數(shù)據(jù)庫(kù)中肺腺癌差異基因有2 019個(gè),其中有1 195個(gè)表達(dá)上調(diào),824個(gè)表達(dá)下調(diào);GEO數(shù)據(jù)庫(kù)中肺腺癌差異基因?yàn)?15個(gè),129個(gè)上調(diào),186個(gè)下調(diào);由TCGA和GEO共得到234個(gè)肺腺癌差異表達(dá)基因DEGs(見(jiàn)圖1)。
圖1 TCGA和GEO數(shù)據(jù)庫(kù)中LUAD差異基因的篩選
GO分析發(fā)現(xiàn),DEGs在分子功能(MF)方面主要富集在:血清型內(nèi)肽酶活性、氧運(yùn)輸功能、肝素結(jié)合、金屬內(nèi)肽酶活性;在細(xì)胞組分(CC)方面主要富集在:質(zhì)膜的組成成分、質(zhì)膜、細(xì)胞外基質(zhì)、胞外、細(xì)胞黏附等;在生物過(guò)程(BP)方面主要富集在膠原代謝、蛋白水解、血小板脫粒、免疫反應(yīng)等(見(jiàn)圖2a)。KEGG富集分析發(fā)現(xiàn)DEGs主要涉及免疫、蛋白、膠原、細(xì)胞外成分等一系列與微環(huán)境相關(guān)的通路,如:PPAR信號(hào)通路、與瘧疾、補(bǔ)體和凝血級(jí)聯(lián)反應(yīng)、PI3K AKT信號(hào)通路、病毒蛋白與細(xì)胞因子和細(xì)胞因子受體的相互作用通路,以及蛋白質(zhì)消化和吸收相互作用通路、趨化因子信號(hào)通路及細(xì)胞周期信號(hào)通路(見(jiàn)圖2b)。
圖2 肺腺癌差異基因的功能富集分析
用STRING構(gòu)建的PPI網(wǎng)絡(luò)(見(jiàn)圖3a);利用cytoHubba 插件選擇的前20個(gè)hub基因分別是:SPP1、CLDN5、BDNF、TEK、IL6、PPBP、CXCL13、MMP9、CCNA2、EGF、CAV1、MMP7、CDH5、SELE、MMP3、MMP13、MMP1、HMMR、TOP2A、DLGAP5等基因(見(jiàn)圖3b)。
小兒急性支氣管炎西醫(yī)診斷標(biāo)準(zhǔn)參照《諸福棠實(shí)用兒科學(xué)》第8版制定[5]。小兒咳嗽痰熱壅肺證參照中華中醫(yī)藥學(xué)會(huì)《中醫(yī)兒科常見(jiàn)病診療指南》(2012)制定[6]。
圖3 PPI網(wǎng)絡(luò)構(gòu)建和Hub基因
采用卡普蘭-邁耶曲線和對(duì)數(shù)秩檢驗(yàn)分析了以上20個(gè)肺腺癌關(guān)鍵基因?qū)偵嫫诘挠绊?,結(jié)果顯示:CCNA2、DLGAP5、HMMR、MMP1、MMP9、MMP13、SPP1、TOP2A等8個(gè)基因?qū)Ψ蜗侔┥嫫谟杏绊?P<0.05),其中CCNA2、DLGAP5、HMMR、MMP1、SPP1、TOP2A等6個(gè)基因?qū)Ψ蜗侔┥嫫谟酗@著影響(P<0.01)(見(jiàn)圖4)。
圖4 肺腺癌關(guān)鍵基因的預(yù)后分析
對(duì)以上與肺腺癌預(yù)后生存相關(guān)的8個(gè)關(guān)鍵基因進(jìn)行ROC 分 析,結(jié) 果 顯 示:DLGAP5(AUC=0.703)、CCNA2(AUC=0.682)、TOP2A(AUC=0.634)、HMMR(AUC=0.689)、MMP1(AUC=0.636)、MMP13(AUC=0.603)、SPP1(AUC=0.706)、MMP9(AUC=0.616),其中DLGAP5、SPP1的AUC>0.7,提示它們具有較高的診斷價(jià)值(見(jiàn)圖5)。
圖5 肺腺癌預(yù)后生存相關(guān)的8個(gè)hub 基因的ROC曲線
通過(guò)上述分析,發(fā)現(xiàn)DLGAP5及SPP1與其它hub基因相比更具有作為診斷標(biāo)志物與預(yù)后標(biāo)志物的潛力,因此驗(yàn)證肺腺癌中DLGAP5、SPP1這2個(gè)關(guān)鍵基因的富集相關(guān)通路及其免疫相關(guān)功能,用GSEA根據(jù)DLGAP5、SPP1在肺腺癌組織表達(dá)的高低,驗(yàn)證其是否富集在列表的頂部或底部并進(jìn)行相關(guān)功能注釋[15],結(jié)果發(fā)現(xiàn)高表達(dá)DLGAP5、SPP1的肺腺癌樣本中富集了轉(zhuǎn)移、增殖、侵襲等通路,說(shuō)明DLGAP5、SPP1等基因在肺癌轉(zhuǎn)移、增殖、侵襲過(guò)程中起到促進(jìn)作用(見(jiàn)圖6,表1)。
圖6 GSEA分析DLGAP5、SPP1基因富集通路
表1 DLGAP5、SPP1基因在轉(zhuǎn)移、增殖、侵襲等通路的GSEA富集分析結(jié)果
利用GSE31210數(shù)據(jù)進(jìn)行分析,使用Cibersort軟件“反卷積算法”,分析了數(shù)據(jù)庫(kù)中所有肺腺癌樣本組織中免疫細(xì)胞構(gòu)成情況(見(jiàn)圖7);然后對(duì)正常肺組織與肺腺癌組織中免疫細(xì)胞浸潤(rùn)情況進(jìn)行分析,結(jié)果顯示:肺腺癌組織免疫細(xì)胞情況與正常肺組織存在明顯差異,且肺腺癌組織中免疫細(xì)胞數(shù)量較多的分別是未活化的CD4+記憶性T細(xì)胞、記憶性B細(xì)胞、濾泡輔助性T細(xì)胞、調(diào)節(jié)性T細(xì)胞、嗜酸性粒細(xì)胞、M0巨噬細(xì)胞(P<0.05)(見(jiàn)圖8)。
圖7 肺腺癌組織樣本中22種免疫細(xì)胞構(gòu)成圖
圖8 肺腺癌及正常組織中免疫細(xì)胞占比小提琴圖
使用Cibersort分析GSE31210數(shù)據(jù)庫(kù)中肺腺癌樣本的DLGAP5、SPP1基因表達(dá)與免疫細(xì)胞浸潤(rùn)的關(guān)系,結(jié)果(見(jiàn)圖9),肺腺癌組織中漿細(xì)胞、未活化的CD4+記憶細(xì)胞、調(diào)節(jié)T細(xì)胞、巨噬細(xì)胞(M0、M1、M2)及中性粒細(xì)胞等免疫細(xì)胞的數(shù)量與DLGAP5、SPP1基因表達(dá)水平顯著相關(guān)(P<0.05),肺腺癌組織中DLGAP5基因高表達(dá)時(shí)漿細(xì)胞、M0巨噬細(xì)胞、中性粒細(xì)胞等細(xì)胞數(shù)量較多(P<0.05),而DLGAP5低表達(dá)時(shí)記憶B細(xì)胞、未活化的記憶CD4+T細(xì)胞、濾泡輔助性T細(xì)胞、未活化肥大細(xì)胞分布較多。肺腺癌組織中SPP1基因高表達(dá)時(shí)巨噬細(xì)胞、靜息樹(shù)突細(xì)胞、中性粒細(xì)胞分布較多,而SPP1基因低表達(dá)時(shí)肺腺癌組織中漿細(xì)胞、未活化記憶CD4+T細(xì)胞、調(diào)節(jié)T細(xì)胞、M2巨噬細(xì)胞、肥大細(xì)胞分布高。以上結(jié)果表明DLGAP5、SPP1的表達(dá)水平與肺腺癌組織中漿細(xì)胞、未活化的CD4+T記憶細(xì)胞、調(diào)節(jié)T細(xì)胞、巨噬細(xì)胞、巨噬細(xì)胞M0、M1、中性粒細(xì)胞浸潤(rùn)密切相關(guān)。
圖9 DLGAP5、SPP1基因表達(dá)與肺腺癌組織免疫細(xì)胞浸潤(rùn)的關(guān)系
肺腺癌在世界各地發(fā)病率和死亡率都很高[16]。肺腺癌的高死亡率在很大程度上歸因于診斷不及時(shí),因此尋找特異性早期診斷生物標(biāo)志物對(duì)改善肺腺癌的預(yù)后至關(guān)重要。本研究利用生物信息學(xué)工具分析肺腺癌的mRNA表達(dá)譜及其肺腺癌中免疫細(xì)胞浸潤(rùn)情況。本研究共篩選出234個(gè)肺腺癌DEGs,通過(guò)構(gòu)建PPI網(wǎng)絡(luò)和富集分析及生存分析,共篩選出20個(gè)關(guān)鍵基因,其中CCNA2、DLGAP5、HMMR、MMP1、MMP9、MMP13、SPP1、TOP2A等8個(gè)基因?qū)Ψ蜗侔┯蓄A(yù)后價(jià)值。在生物過(guò)程方面,DEGs主要涉及膠原代謝、蛋白水解、免疫反應(yīng)等生物過(guò)程,介導(dǎo)血清型內(nèi)肽酶活性、金屬內(nèi)肽酶活性等分子功能,DEGs基因產(chǎn)物主要富集于細(xì)胞外基質(zhì)、胞外、細(xì)胞黏附。研究證明,細(xì)胞外基質(zhì)與受體相互作用參與細(xì)胞黏附、細(xì)胞周期以及細(xì)胞增殖,而這些是導(dǎo)致肺癌中腫瘤增殖和細(xì)胞凋亡的關(guān)鍵[17-18]。本研究中肺腺癌關(guān)鍵基因富集的通路主要與PPAR信號(hào)通路、PI3K-AKT信號(hào)通路、TGF-β信號(hào)通路及細(xì)胞周期信號(hào)通路密切相關(guān),該結(jié)果與Tang等人的研究結(jié)果相符[19]。
DLGAP5是細(xì)胞周期調(diào)控基因的表達(dá)產(chǎn)物[25],在肝細(xì)胞癌、腦膜瘤和腎上腺皮質(zhì)瘤等癌癥中的表達(dá)水平隨疾病侵襲性升高而升高[26],因此推測(cè)周期調(diào)控基因DLGAP5可能在肺癌的免疫浸潤(rùn)方面存在一定作用。另一方面,DLGAP5與視網(wǎng)膜母細(xì)胞瘤的發(fā)生、浸潤(rùn)有關(guān)[27],且已在肺腺癌中被證實(shí)為生物診斷標(biāo)志物。因此,DLGAP5和SPP1基因作為腫瘤微環(huán)境中浸潤(rùn)性免疫細(xì)胞重要組成部分,可有效預(yù)測(cè)患者預(yù)后[28]。
浸潤(rùn)性免疫細(xì)胞是腫瘤微環(huán)境的重要組成部分,可有效預(yù)測(cè)患者預(yù)后。本研究用“反卷積算法”分析了數(shù)據(jù)庫(kù)中肺腺癌樣本組織中免疫細(xì)胞構(gòu)成及正常肺組織與肺腺癌組織中免疫細(xì)胞浸潤(rùn)情況,發(fā)現(xiàn)肺腺癌組織免疫細(xì)胞構(gòu)成情況與在正常肺組織有明顯差異,肺腺癌組織中免疫細(xì)胞數(shù)量較多主要是未活化的CD4+記憶性T細(xì)胞、記憶性B細(xì)胞、濾泡輔助性T細(xì)胞、調(diào)節(jié)性T細(xì)胞、嗜酸性粒細(xì)胞、M0巨噬細(xì)胞,且巨噬細(xì)胞M0、中性粒細(xì)胞數(shù)量與肺腺癌浸潤(rùn)程度有關(guān),提示這些免疫細(xì)胞參與了肺腺癌的發(fā)生與發(fā)展。巨噬細(xì)胞是腫瘤中主要的免疫浸潤(rùn)細(xì)胞,是連接炎癥和癌癥的關(guān)鍵細(xì)胞類型[29],主要為巨噬細(xì)胞M1和巨噬細(xì)胞M2。巨噬細(xì)胞M1可激活細(xì)胞因子的產(chǎn)生,募集前免疫刺激白細(xì)胞TME,導(dǎo)致腫瘤細(xì)胞的吞噬作用,而M2型巨噬細(xì)胞可通過(guò)基底膜破裂、白細(xì)胞募集、血管生成和免疫促進(jìn)腫瘤的發(fā)展[30-31]。有研究表明,巨噬細(xì)胞M1水平的增加腫瘤患者預(yù)后較好[32],而巨噬細(xì)胞M2水平的增加預(yù)后較差[33]。在免疫細(xì)胞浸潤(rùn)分析中發(fā)現(xiàn),DLGAP5和SPP1低表達(dá)的樣品中M2巨噬細(xì)胞增多。M2巨噬細(xì)胞具有激活腫瘤細(xì)胞增殖的作用,更重要的是可釋放多種細(xì)胞因子抑制淋巴T 細(xì)胞功能,成為影響 T 淋巴細(xì)胞功能和促進(jìn)腫瘤細(xì)胞免疫逃逸的重要因素[34]。前期研究發(fā)現(xiàn),SPP1過(guò)表達(dá)可參與肺腺癌 A549 細(xì)胞誘導(dǎo)的巨噬細(xì)胞的 M2 極化,進(jìn)而減弱了 T 淋巴細(xì)胞活性,促進(jìn)A549 細(xì)胞增殖、遷移和侵襲[35]。在A549細(xì)胞上清液促進(jìn)了THP-1巨噬細(xì)胞向M2的極化,而敲除巨噬細(xì)胞中SPP1的可逆轉(zhuǎn)這一過(guò)程,以上均表明SPP1在A549細(xì)胞和腫瘤微環(huán)境中起重要作用[36]。
研究發(fā)現(xiàn)DLGAP5及SPP1與肺腺癌患者的預(yù)后生存相關(guān),DLGAP5、SPP1表達(dá)越高,則肺腺癌患者預(yù)后生存越差;同時(shí),DLGAP5、SPP1基因表達(dá)水平與肺腺癌組織免疫細(xì)胞浸潤(rùn)密切相關(guān)。因此,DLGAP5、SPP1有望成為肺腺癌潛在的診斷和預(yù)后生物標(biāo)志物以及免疫相關(guān)治療靶點(diǎn),尚需進(jìn)一步研究證實(shí)。