楊凱,楊明,蘇學(xué)會,溫輝,單娜
(秦皇島市第二醫(yī)院 呼吸科,河北 秦皇島 066600)
原發(fā)性肺癌(簡稱肺癌)是全世界發(fā)病率、死亡率最高的惡性腫瘤之一[1-2],占癌癥相關(guān)死亡人數(shù)近五分之一[3]。按照病理形態(tài)的不同,肺癌可以分為非小細胞肺癌(non-small Cell Lung Cancer,NSCLC)和小細胞肺癌,其中NSCLC最為常見,約占肺癌總發(fā)病率的80%,此類患者總體預(yù)后較差[4]。NSCLC的腫瘤標志物主要有癌胚抗原(carcino-embryonic antigen,CEA)、糖類抗原125、鱗狀上皮細胞癌抗原(squamous cell carcinoma antigen,SCC-Ag)等蛋白[5-6],但目前在臨床上僅對不到百分之一的腫瘤標志物進行了相關(guān)研究,絕大部分腫瘤標志物目前還未進行系統(tǒng)的臨床驗證。所以,進一步篩選出靈敏度高、特異性高的新型標志物,可以幫助醫(yī)生在第一時間掌握病人的病情,為盡早治療奠定良好基礎(chǔ)[7-10]。隨著大數(shù)據(jù)的快速發(fā)展,腫瘤相關(guān)的組學(xué)數(shù)據(jù)不斷累積、更新,為科研人員研究腫瘤發(fā)病機制、醫(yī)生臨床診治提供了數(shù)據(jù)支持[11-12]。本研究首選通過基因表達匯編(gene expression omnibus,GEO)數(shù)據(jù)庫和腫瘤基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫篩選出NSCLC中的差異表達基因,對100例NSCLC臨床樣本行進一步驗證分析,以期找到肺癌的新型預(yù)后標志物。
1.1.1數(shù)據(jù)收集及差異基因的篩選 在GEO數(shù)據(jù)庫中選擇GSE19804芯片數(shù)據(jù),分為NSCLC組織和癌旁組織,每組各60個樣本,該數(shù)據(jù)由Lu等[13]提供。利用R語言中“l(fā)imma”以及“impute”包對芯片數(shù)據(jù)進行處理分析,進行貝葉斯顯著性檢驗,以LogFC(Fold Change)絕對值>1且P<0.01作為顯著性差異表達,對差異基因進行聚類分析、制作熱圖。
1.1.2蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)構(gòu)建及核心基因篩選 利用STRING網(wǎng)站(http//string-db.org/),以medium confidence>0.4為條件構(gòu)建差異基因的蛋白互作網(wǎng)絡(luò),利用Cytoscape軟件中CentiScape和MCODE插件,對PPI網(wǎng)絡(luò)進行可視化處理,分析基因網(wǎng)絡(luò)節(jié)點的連接度,得到連接度較高的關(guān)鍵基因。
1.1.3核心基因與NSCLC患者預(yù)后的關(guān)系分析 利用TCGA數(shù)據(jù)庫,通過Firehose網(wǎng)站和cBioPortal腫瘤基因組網(wǎng)站下載數(shù)據(jù),保留其中含有完整臨床數(shù)據(jù)和生存數(shù)據(jù)的994例NSCLC患者腫瘤組織樣本和301例NSCLC患者癌旁組織樣本所對應(yīng)的臨床病理數(shù)據(jù)以及預(yù)后數(shù)據(jù),分析核心基因與臨床NSCLC患者生存期的關(guān)系,核心基因在男性NSCLC患者和女性NSCLC患者腫瘤組織中的表達水平差異,核心基因在NSCLC患者腫瘤組織與癌旁組織中的表達水平差異,以及核心基因與腫瘤增殖、轉(zhuǎn)移相關(guān)基因[增殖標志蛋白Ki-67基因(proliferation marker protein Ki-67 gene,MKI67)、轉(zhuǎn)移標志蛋白波形蛋白基因(vimentin gene,VIM)]表達水平的關(guān)系。
1.2.1材料、主要試劑與儀器 NSCLC患者腫瘤組織和相應(yīng)癌旁組織由課題組前期收集;CAV1蛋白抗體、二抗購于英國Abcam公司,石蠟包埋機、切片機為德國Leica公司產(chǎn)品,正置顯微鏡為日本Olympus公司產(chǎn)品。
1.2.2分組 收集100例NSCLC患者,分為NSCLC組織組和癌旁組織組,男53例、女47例,年齡31~75歲、平均(58.94±12.06)歲,肺腺癌64例、肺鱗癌36例。本研究獲得病人及家屬知情同意,且符合《世界醫(yī)學(xué)協(xié)會赫爾辛基宣言》相關(guān)要求。納入標準:(1)參照NSCLC的相關(guān)診斷標準;(2)首次確診;(3)經(jīng)細胞學(xué)或組織病理學(xué)證實為NSCLC;(4)預(yù)計生存時間超過3個月;(5)入院前未接受過相關(guān)抗腫瘤治療;(6)無其他重要臟器功能障礙。排除標準:(1)合并腦轉(zhuǎn)移;(2)病灶無法測量者;(3)妊娠期或哺乳期女性;(4)先前有或繼發(fā)性惡性腫瘤;(5)曾接受過放化療或免疫治療;(6)有精神病史;(7)合并血液系統(tǒng)疾病。
1.2.3檢測Caveolin1表達 取兩組組織標本,經(jīng)石蠟包埋、切片(厚度<5 μm,長度<10 μm)、固定、漂洗、脫水、透明、透蠟、包埋、整修、切片(厚度4 μm),利用免疫組織化學(xué)法檢測小窩蛋白1(Caveolin1)的表達。
利用R語言中“l(fā)imma”安裝包對芯片數(shù)據(jù)進行處理分析,以|LogFC|>1且P<0.01為篩選閾值,在NSCLC組織和癌旁組織中共篩選出256個差異基因,其中上調(diào)的基因有206個,下調(diào)的基因有50個,見圖1。
注:A為差異基因火山圖;B為差異基因聚類熱圖,紅色點代表高表達的基因、藍色點代表低表達的基因。圖1 NSCLC組織和癌旁組織的差異基因分析Fig.1 Differential gene analysis of normal tissues and lung cancer tissues
PPI圖中共有102個節(jié)點,連接線198個,見圖2。通過Cytoscape軟件中的CentiScape和MCODE插件進行分析,得到其中連通度最高的14個基因,分別是白細胞介素6基因(interleukin-6 gene,IL6)、α1-Ⅰ型膠原基因(alpha-1 type Ⅰ collagen gene,COL1A1)、鳥嘌呤核苷酸結(jié)合蛋白γ11基因(guanine nucleotide-binding protein gamma-11 gene,GNG11)、富亮氨酸重復(fù)激酶2基因(leucine-rich repeat kinase 2 gene,LRRK2)、DNA拓撲異構(gòu)酶2α基因(topoisomerase Ⅱ alpha gene,TOP2A)、鈣黏蛋白5基因(cadherin-5 gene,CDH5)、CXC受體2基因(CXC receptor 2 gene,CXCR2)、小窩蛋白1基因(caveolin1 gene,CAV1)、血小板堿性蛋白基因(platelet basic protein gene,PPBP)、金屬蛋白酶組織抑制因子1基因(metalloproteinase inhibitor 1 gene,TIMP1)、血小板反應(yīng)蛋白受體基因(thrombospondin receptor gene,CD36)、血小板反應(yīng)蛋白2基因(thrombospondin 2 gene,THBS2)、CXC配體2基因(CXC ligand 2 gene,CXCL2)、基質(zhì)金屬蛋白酶1(matrix metallopeptidase 1 gene,MMP1),見表1。選擇其中核心基因CAV1進行后續(xù)研究。
注:圖中面積越大連接度越高。圖2 差異基因的PPI分析Fig.2 PPI analysis of differential genes
表1 PPI網(wǎng)絡(luò)中前14的核心基因Tab.1 List of 14 genes with the highest degree of connectivity
TCGA數(shù)據(jù)庫數(shù)據(jù)分析顯示,NSCLC腫瘤組織中高表達CAV1的腫瘤患者生存期短于低表達CAV1的腫瘤患者(P<0.05),見圖3。NSCLC腫瘤組織中,不同性別間CAV1基因表達量比較,差異無統(tǒng)計學(xué)意義(P>0.05),見圖4A;與癌旁組織比較,NSCLC 腫瘤組織中CAV1表達量明顯升高,差異有統(tǒng)計學(xué)意義(P<0.01),見圖4B。CAV1與MKI67、VIM的表達均呈正相關(guān)(R=0.15,P<0.05;R=0.29,P<0.05),說明CAV1與NSCLC的增殖、轉(zhuǎn)移可能存在密切相關(guān),見圖5。
圖3 CAV1表達水平與NSCLC患者預(yù)后生存分析(TCGA數(shù)據(jù)庫數(shù)據(jù))Fig.3 Expression level of CAV1 and prognostic survival analysis of NSCLC patients(TCGA database)
注:A為不同性別間比較,B為不同組織間比較;(1)與癌旁組織組織比較,P<0.01。圖4 不同組織及不同性別間CAV1的表達(TCGA數(shù)據(jù)庫數(shù)據(jù))Fig.4 Expression of CAV1 in different human tissues and gender(TCGA database)
注:A為 CAV1與MKI67相關(guān)性分析;B為CAV1與VIM的相關(guān)性分析。圖5 CAV1與MKI67、VIM的相關(guān)分析(TCGA數(shù)據(jù)庫數(shù)據(jù))Fig.5 Correlation between CAV1 and MKI67,VIM(TCGA database)
結(jié)果顯示,NSCLC組中Caveolin1蛋白表達高于癌旁組織組,差異有統(tǒng)計學(xué)意義(P<0.05),見圖6。
圖6 NSCLC組與癌旁組織組中 Caveolin1蛋白的表達(SP法,×200)Fig.6 Expression of Caveolin1 protein in paracancerous tissues group and NSCLS group(SP,×200)
肺癌是呼吸系統(tǒng)最常見的腫瘤,因缺少用于早期診斷的指標且病情進展迅速,八成以上患者就診時已經(jīng)處于癌癥晚期,使得許多患者錯失最佳的治療時間,目前手術(shù)治療和放化療手段都難以從根本上解決腫瘤復(fù)發(fā)和轉(zhuǎn)移的問題[14-15]。雖然技術(shù)不斷進步,近年來又推出了如物理消融、介入和生物療法等一系列新的治療手段[16],但 NSCLC總5年生存率仍然只有約10%,其中八成患者在確診腫瘤時已經(jīng)錯失最佳手術(shù)時機,只有不到2%的肺癌在發(fā)現(xiàn)時處于早期[17-18]。早期肺癌手術(shù)切除腫瘤后的5年生存率達超過70%。因此,從基因水平對NSCLC的發(fā)生發(fā)展機制進行分析,篩選新型的腫瘤檢測標志物對NSCLC的早期診治具有重要意義。
本研究對GEO數(shù)據(jù)庫中60例肺癌組織和相應(yīng)的60例癌旁組織的表達譜芯片數(shù)據(jù)進行分析,通過對差異基因聚類、篩選、繪制互作網(wǎng)絡(luò)等方法篩選出14個核心基因。在14個基因中,CXCR2、CD36、CXCL2、MMP1等基因均為目前報道較多且與肺癌有較為明確關(guān)系的基因,而GNG11、LRRK2、PPBP、THBS2、CAV1五個基因與肺癌的關(guān)系目前報道較少,本研究重點對CAV1進行了研究[19-22]。本研究利用TCGA數(shù)據(jù)庫數(shù)據(jù)對CAV1在肺癌中的表達情況進行了分析,并對患者的生存期進行統(tǒng)計后,發(fā)現(xiàn)CAV1高表達的患者生存期低于低表達CAV1的患者。由于本研究分析的表達譜芯片數(shù)據(jù)均來自女性肺癌患者,為排除CAV1在不同性別人群中的表達差異,本研究利用TCGA數(shù)據(jù)庫數(shù)據(jù)對CAV1在男性和女性肺癌患者的表達情況進行了分析,結(jié)果顯示CAV1的表達與性別無顯著關(guān)系。本研究還比較了CAV1在 NSCLC癌組織和癌旁組織中的表達情況,結(jié)果顯示CAV1在 NSCLC腫瘤組織中的表達高于癌旁組織;進一步分析顯示,CAV1基因與參與肺癌增殖和轉(zhuǎn)移的MKI67和VIM基因表達呈正相關(guān)。這一系列結(jié)果與GEO數(shù)據(jù)庫中的表達譜芯片數(shù)據(jù)結(jié)果相一致。本研究檢測了100例NSCLC臨床樣本數(shù)據(jù),結(jié)果顯示,與相應(yīng)癌旁組織相比,Caveolin1在NSCLC組織中高表達。
CAV1基因所表達的蛋白Caveolin1為細胞膜窖體(Caveolae)的主要構(gòu)成蛋白,細胞膜窖體是細胞膜發(fā)揮功能的重要結(jié)構(gòu)基礎(chǔ)[23-24]。CAV1基因在細胞活動中發(fā)揮著多種重要作用,包括信號傳導(dǎo)、物質(zhì)運輸?shù)?,參與細胞的增殖、凋亡、分化等過程[25]。CAV1在腫瘤萌芽期的表達明顯增加,這顯示CAV1可能與腫瘤的轉(zhuǎn)移和預(yù)后密切相關(guān)[26-27]。但目前對CAV1在腫瘤發(fā)生、發(fā)展中的作用研究相對較少,特別是其在肺癌增殖轉(zhuǎn)移中的作用尚不清楚。本研究結(jié)果顯示,CAV1與NSCLC患者的生存期,肺癌增殖、轉(zhuǎn)移等方面可能有著密切的關(guān)系。
本研究主要利用現(xiàn)有數(shù)據(jù)庫的分析和本地臨床樣本進行分析,但暫時缺少在細胞水平、動物水平的機制研究和在臨床樣本上的機制驗證工作,未來將對CAV1基因和Caveolin1在NSCLC中作用機制展開進一步研究,以期為臨床上肺癌的早期診斷和治療提供新的思路。