楊夢(mèng)霞 郭宵飛 朱世杰 蘆殿榮 王寧軍
小細(xì)胞肺癌(small cell lung cancer,SCLC)在支氣管癌中占比15%,是一種神經(jīng)內(nèi)分泌癌,呈高度低分化,死亡率高達(dá)所有肺癌死亡率的25%[1,2]。盡管免疫療法在近幾年治療SCLC中取得了較好的療效,但仍存在許多挑戰(zhàn),如療效適中且僅限于一小部分患者[3,4]。此外,由于SCLC缺乏特異性癥狀和腫瘤生長(zhǎng)快速,其早期檢測(cè)具有一定挑戰(zhàn)性,這使目前的篩查方法在疾病早期診斷中無(wú)明顯效果[3],故我們需要探索一種新的生物標(biāo)志物來(lái)協(xié)助SCLC的早期診療。在本次研究中,從基因表達(dá)綜合數(shù)據(jù)庫(kù)(gene expression omnibus,GEO)下載SCLC患者的基因表達(dá)譜芯片,并使用GEO2R軟件將SCLC組織與正常肺組織進(jìn)行比較,以獲得差異表達(dá)基因(differentially expressed gene,DEG),并進(jìn)一步分析其生物功能、相關(guān)通路和臨床預(yù)后價(jià)值,旨在為深入研究SCLC發(fā)生機(jī)制及早期診療和預(yù)后判斷提供新的理論依據(jù)。
1.1 基因芯片數(shù)據(jù)來(lái)源 GEO(https://www.ncbi.nlm.nih.gov/geo/)是最大的國(guó)際公共芯片儲(chǔ)存數(shù)據(jù)庫(kù),收錄并整理了多種形式的高通量基因組數(shù)據(jù),如微陣列芯片和二代測(cè)序等。在該數(shù)據(jù)庫(kù)中,以“small cell lung cancer”、“normal”為檢索詞,條目類型和物種分別為“series”、“Homo sapiens”,篩選出數(shù)據(jù)集GSE149507(由GPL23270 平臺(tái)提供[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array),包含正常肺組織標(biāo)本和小細(xì)胞肺癌組織標(biāo)本各18例,患者平均年齡56歲。
1.2 DEG篩選 GEO2R(http://www.ncbi.nlm.nih.gov/geo/geO2r)是GEO數(shù)據(jù)庫(kù)提供的在線工具,可用于2組或多組樣本的比較,以獲得差異性表達(dá)基因。在該數(shù)據(jù)庫(kù)中,以“adj.P.Val<0.05”、“|log FC|>2(Fold Change,FC)”為條件,篩選DEG。
1.3 富集分析 DAVID(http://david.ncifcrf.gov)是一個(gè)關(guān)于生物信息學(xué)的數(shù)據(jù)庫(kù),為大規(guī)模基因或蛋白列表提供系統(tǒng)綜合的生物功能注釋信息,目前主要用于差異基因的功能和通路富集分析。在該數(shù)據(jù)庫(kù)中,上傳DEG列表,選擇物種為“Homo sapiens”,進(jìn)行生物功能和通路富集分析。
1.4 PPI構(gòu)建與模塊分析 STRING數(shù)據(jù)庫(kù) (http://string-db.org) 收集、評(píng)估和集成了所有公開(kāi)可用的蛋白-蛋白相互作用信息,并通過(guò)計(jì)算預(yù)測(cè)補(bǔ)充這些信息,構(gòu)建了蛋白-蛋白互作網(wǎng)絡(luò)(protein-protein interaction,PPI);Cytoscape是一個(gè)提供了分子網(wǎng)絡(luò)展示、布局、查詢等基本功能的軟件,可用于蛋白-蛋白、蛋白-DNA等相互作用的分析。本次研究,在STRING數(shù)據(jù)庫(kù)中上傳DEG列表,并以Interaction score=0.9為條件,分析PPI網(wǎng)絡(luò),然后將其結(jié)果導(dǎo)入Cytoscape軟件中進(jìn)行可視化分析,以“Degree cutoff=2”、 “Node score cutoff=0.2”、 “K-core=2”、“Max depth=100”為條件,運(yùn)用MCODE插件篩選出重要模塊基因。
1.5 關(guān)鍵基因篩選和預(yù)后分析 根據(jù)節(jié)點(diǎn)連接度(Degree),篩選出Degree≥40的關(guān)鍵基因,并使用Cytoscape中BiNGO插件對(duì)BP富集結(jié)果可視化。Kaplan-Meier Plotter(https://kmplot.com/analysis/)是一個(gè)腫瘤在線生存分析數(shù)據(jù)庫(kù),能夠針對(duì)54 000多個(gè)基因、21種癌癥展開(kāi)研究。在本研究中,使用該數(shù)據(jù)庫(kù)對(duì)關(guān)鍵基因進(jìn)行預(yù)后分析,并繪制生存曲線圖。
2.1 篩選出614個(gè)DEG 在GEO中篩選出GSE149507,包含36個(gè)合格樣本(正常肺組織和小細(xì)胞肺癌組織標(biāo)本各18例)。GEO2R分析后,得到上調(diào)和下調(diào)基因分別有328個(gè)、286個(gè),見(jiàn)圖1。
圖1 DEG聚類熱圖(A)和火山圖(B)
2.2 富集分析結(jié)果 在DAVID中,以P<0.05為條件,對(duì)DEG進(jìn)行生物功能和通路富集分析。GO生物富集得到BP 22項(xiàng)、CC 6項(xiàng)、MF 13項(xiàng),篩選出涉及BP、MF的前10條及CC的6條富集結(jié)果進(jìn)行分析。在BP方面,包含微管運(yùn)動(dòng)、DNA修復(fù)及合成和DNA雙鏈展開(kāi)等;在CC方面包含驅(qū)動(dòng)蛋白復(fù)合物、微管和細(xì)胞器膜等;在MF方面包括微管結(jié)合、ATP酶活性和趨化因子活性等。通路富集分析得到40條通路,選擇前30條做富集分析,相關(guān)通路主要有細(xì)胞循環(huán)、DNA修復(fù)和酪氨酸代謝等。見(jiàn)圖2。
圖2 DEG生物功能(A)和通路(B)富集分析
2.3 PPI網(wǎng)絡(luò)及重要模塊篩選 使用STRING和Cytoscape構(gòu)建PPI網(wǎng)絡(luò)并將其可視化,包含275個(gè)節(jié)點(diǎn),1 999條邊;后運(yùn)用MCODE插件篩選出重要模塊,得分為35.098,包含50個(gè)節(jié)點(diǎn),895條邊。見(jiàn)圖3。
圖3 DEG(A)和重要模塊(B)的PPI網(wǎng)絡(luò)圖
2.4 篩選出關(guān)鍵基因及預(yù)后分析 在重要模塊基因中,篩選出Degree≥40的關(guān)鍵基因,分別是KIF2C、CDK1、BUB1、CDC20、CCNB2、CCNB1和BUB1B,Degree均為49;AURKB、 CDCA8和NDC80,Degree均為48;CENPF和 BIRC5,Degree均為47;KIF20A,Degree為40。通過(guò)Kaplan-Meier Plotter數(shù)據(jù)庫(kù)對(duì)關(guān)鍵基因進(jìn)行預(yù)后OS分析,發(fā)現(xiàn)在肺癌基因芯片中未檢索到CDK1。結(jié)果顯示,上述關(guān)鍵基因的高表達(dá)水平與不良預(yù)后相關(guān),表明關(guān)鍵基因在小細(xì)胞肺癌整體生存時(shí)間上可能發(fā)揮一定作用。見(jiàn)圖4、5。
圖4 SCLC關(guān)鍵基因的BP可視化網(wǎng)絡(luò)圖
圖5 關(guān)鍵基因?qū)Ψ伟┗颊叩念A(yù)后影響分析
在過(guò)去十年中,肺癌患者的五年生存率雖略有提高,但仍保持在10%的低水平[5],其中SCLC仍是主要的全球癌癥死亡原因之一。雖然SCLC治療取得了很大突破,但其發(fā)病機(jī)制仍不清楚[6],因此我們需要深入探討 SCLC相關(guān)生物標(biāo)志物、信號(hào)通路和分子發(fā)生機(jī)制,以期能夠在SCLC診療方面提供新的參考依據(jù),改善患者預(yù)后。在本研究中,我們不僅發(fā)現(xiàn)了在既往研究中已被證實(shí)與SCLC發(fā)病機(jī)制相關(guān)的KIF2C、CDC20、BUB1B和NDC80基因[7],還發(fā)現(xiàn)CDK1、BUB1和CCNB2等與SCLC發(fā)病機(jī)制也有關(guān),為后續(xù)SCLC的深入研究提供了更多潛在靶點(diǎn)。
CDK1是細(xì)胞周期中G1/S和G2/M轉(zhuǎn)化所必需的重要驅(qū)動(dòng)因子[8],其表達(dá)水平異常不僅會(huì)導(dǎo)致腫瘤快速生長(zhǎng),還會(huì)導(dǎo)致癌細(xì)胞增殖[9]。有研究表明指出,抑制CDK1活性可以抑制結(jié)直腸癌細(xì)胞在體內(nèi)/外增殖,且CDK1高表達(dá)水平可刺激結(jié)直腸癌細(xì)胞的增殖和遷移,最終導(dǎo)致患者較差生存期[10]。BUB1可通過(guò)磷酸化形成BUB1-BUB3復(fù)合物以調(diào)控其他重要的紡錘體檢查點(diǎn)蛋白,改變細(xì)胞周期進(jìn)程[11]。研究認(rèn)為BUB1在非子宮內(nèi)膜樣癌中表達(dá)水平更高,但癌組織中低BUB1陽(yáng)性表達(dá)率,會(huì)出現(xiàn)低分化子宮內(nèi)膜癌和不良預(yù)后[12]。在本研究中,BUB1高表達(dá)水平與短O(píng)S密切相關(guān),這與上述研究中的結(jié)果一致,表明該基因在腫瘤的發(fā)生發(fā)展過(guò)程中有重要作用;但尚未查到有關(guān)CDK1表達(dá)水平對(duì)腫瘤患者預(yù)后影響,且由于目前關(guān)于CDK1表達(dá)水平對(duì)臨床預(yù)后的相關(guān)臨床報(bào)道較少,故其預(yù)后價(jià)值仍有待進(jìn)一步研究。
CCNB1、CCNB2和AURKB是有絲分裂中的監(jiān)測(cè)蛋白,在G2/M轉(zhuǎn)化中起關(guān)鍵作用。研究表明CCNB1在非小細(xì)胞肺癌等多種癌癥中過(guò)表達(dá),與不良預(yù)后密切相關(guān)[13]。此外,也有研究指出,CCNB1的mRNA水平和蛋白質(zhì)下調(diào)可減少細(xì)胞增殖[14]。而CCNB2在肝癌中表達(dá)水平較高,與不良預(yù)后相關(guān)[15];當(dāng)CCNB2表達(dá)水平降低時(shí),可使膀胱癌細(xì)胞的浸潤(rùn)和轉(zhuǎn)移受抑[16]。AURKB能夠通過(guò)介導(dǎo)CCND1基因啟動(dòng)子處的H3S10ph來(lái)激活CCND1的表達(dá),而CCND1是細(xì)胞周期中同源細(xì)胞周期蛋白依賴性激酶4/6(CDK4/6)的關(guān)鍵變構(gòu)激活劑,對(duì)于啟動(dòng)DNA復(fù)制至關(guān)重要[17],而高表達(dá)的AURKB和CCND1可促進(jìn)胃癌細(xì)胞的增殖,進(jìn)而導(dǎo)致較短的OS[18]。本次研究結(jié)果也表明,CCNB1、CCNB2和AURKB高表達(dá)水平也可致SCLC患者較差的預(yù)后,與上述研究結(jié)果一致。
CDCA8是有絲分裂的重要調(diào)節(jié)劑,在大多數(shù)癌癥中都可出現(xiàn)高表達(dá),而在正常組織中表達(dá)水平較低[19]。體外實(shí)驗(yàn)證明,敲除CDCA8表達(dá)可以導(dǎo)致膀胱癌細(xì)胞在S和G2/M期停滯,進(jìn)而使細(xì)胞增殖受抑和細(xì)胞凋亡加速[20]。CENPF是一種與細(xì)胞周期相關(guān)的核抗原,在G0/G1細(xì)胞中低水平表達(dá),并在S期積累在核基質(zhì)中,在G2/M細(xì)胞中表達(dá)最高,且經(jīng)體外實(shí)驗(yàn)證明,CENPF可激活PI3K-AKT-mTORC1信號(hào)轉(zhuǎn)導(dǎo)途徑,進(jìn)而使PTHrP分泌增加,修飾骨環(huán)境以促進(jìn)破骨細(xì)胞形成和骨定植,為乳腺癌細(xì)胞向骨骼的轉(zhuǎn)移創(chuàng)造了有利環(huán)境,最終導(dǎo)致不良預(yù)后[21]。BIRC5也稱為Survivin,可通過(guò)影響細(xì)胞分裂和增殖以及抑制細(xì)胞凋亡在癌變過(guò)程中發(fā)揮重要作用[22]。大量研究表明,在大多數(shù)惡性腫瘤中,BIRC5表達(dá)水平均較高,且高BIRC5表達(dá)可導(dǎo)致乳腺癌患者更差的總生存期及轉(zhuǎn)移復(fù)發(fā)風(fēng)險(xiǎn)增加[23]。KIF20A也稱為MKLP2和RAB6KIFL,位于染色體5q31.2上,主要聚集在有絲分裂細(xì)胞紡錘體的中央?yún)^(qū)域,可參與有絲分裂過(guò)程[24]。大量研究表明,KIF20A在膀胱癌和胃癌等多種癌癥中都出現(xiàn)過(guò)表達(dá),且高KIF20A表達(dá)水平可促進(jìn)膀胱癌細(xì)胞的增殖和轉(zhuǎn)移,導(dǎo)致較差預(yù)后;低表達(dá)時(shí)可誘導(dǎo)胃癌細(xì)胞的有絲分裂(G2/M期)停滯,增強(qiáng)化療藥物的敏感性[25,26]。在本次研究結(jié)果中,CDCA8、CENPF、BIRC5和 KIF20A表達(dá)水平對(duì)SCLC患者預(yù)后影響與上述報(bào)道結(jié)果一致。
綜上所述,本研究從生物信息學(xué)角度分析SCLC發(fā)生發(fā)展的關(guān)鍵基因及差異表達(dá)基因,并進(jìn)一步探討其生物學(xué)功能和預(yù)后價(jià)值,猜測(cè)SCLC關(guān)鍵基因CDK1、BUB1和CCNB2等可能通過(guò)微管運(yùn)動(dòng)、DNA修復(fù)、驅(qū)動(dòng)蛋白復(fù)合物及微管結(jié)合等多個(gè)生物學(xué)過(guò)程、細(xì)胞組分及分子功能,并調(diào)節(jié)細(xì)胞循環(huán)、DNA修復(fù)和酪氨酸代謝等多個(gè)通路,進(jìn)而影響影響腫瘤的發(fā)生發(fā)展,故可能成為潛在的預(yù)后生物標(biāo)志物。但目前有關(guān)這些關(guān)鍵基因在SCLC發(fā)生發(fā)展過(guò)程中作用的研究相對(duì)不足,故仍需后續(xù)研究進(jìn)一步驗(yàn)證。