李洪明,吳 凱,歐 銅,吳 松,
(1.牡丹江醫(yī)學(xué)院,黑龍江 牡丹江 157011;2.深圳大學(xué)泌尿外科研究所 深圳大學(xué)第三附屬醫(yī)院泌尿外科,廣東 深圳 518000)
膀胱癌是臨床上常見的腫瘤,年齡越高其發(fā)病率也越高[1],男性在發(fā)病率和死亡率方面是女性的數(shù)倍[2-3]。該疾病的主要治療手段是手術(shù)治療[4],放射治療、化學(xué)治療和免疫治療等在膀胱癌治療中也起到重要作用。相對傳統(tǒng)的治療,生物療法較新穎[5]。靶向療法是眾多生物療法之一,靶向療法重中之重是找到樞紐基因,樞紐基因可能與腫瘤的發(fā)生、復(fù)發(fā)和轉(zhuǎn)移有關(guān),可進(jìn)一步影響患者的預(yù)后。WGCNA是一種生物學(xué)研究方法[6],能在基因模塊與臨床性狀間構(gòu)建關(guān)聯(lián),確定候選生物標(biāo)記、治療靶標(biāo)和調(diào)控基因等[7-8]。本研究通過WGCNA構(gòu)建網(wǎng)絡(luò),將網(wǎng)絡(luò)劃分為模塊,篩選與NMIBC相關(guān)的樞紐基因并進(jìn)行一系列生物信息學(xué)分析,期望對臨床有所幫助。
1.1 數(shù)據(jù)獲取及處理基因芯片GSE13507數(shù)據(jù)及其臨床信息從GEO數(shù)據(jù)庫下載(https://www.ncbi.nlm.nih.gov/geo/),該數(shù)據(jù)集基于GPL6102(Illumina human-6v 2.0 expression beadchip)平臺。包含165例原發(fā)性膀胱癌樣本,其中NMIBC樣本103例(67例無復(fù)發(fā)歷史,36例有復(fù)發(fā)歷史),肌層浸潤性膀胱癌樣本62例;復(fù)發(fā)性NMIBC樣本23例;癌旁正常膀胱粘膜樣本58例和正常膀胱粘膜樣本10例。在本研究中,主要研究NMIBC相關(guān)的生物標(biāo)志物,因此刪除數(shù)量較少的10例正常樣本,刪除23例復(fù)發(fā)樣本,刪除62例肌層浸潤性膀胱癌樣本和36例治療后有復(fù)發(fā)史的樣本。將剩余的58例癌旁正常組織樣本與67例NMIBC樣本分為正常組和腫瘤組。篩選表達(dá)量最高的前5000個基因進(jìn)行WGCNA分析。
1.2 共表達(dá)網(wǎng)絡(luò)的構(gòu)建利用R語言“WGCNA”包構(gòu)建共表達(dá)網(wǎng)絡(luò)[9]。利用“cutreeStatic”函數(shù)處理離群值,經(jīng)處理后的矩陣數(shù)據(jù)用于后續(xù)分析。先獲取基因間的相關(guān)系數(shù),在明確基因一致性表達(dá)后生成鄰接矩陣,后通過鄰接矩陣變換成拓?fù)渲丿B矩陣(topologiacal overlap dissimilarity measure,TOM),在滿足無尺度網(wǎng)絡(luò)的前提下選擇適當(dāng)?shù)能涢撝郸聵?gòu)建基因網(wǎng)絡(luò),按照最小模塊基因數(shù)為30,將相似的基因分類到同一的基因模塊中。
1.3 樞紐模塊篩選引入臨床數(shù)據(jù),計(jì)算基因顯著性(gene significance,GS)和模塊顯著性(module significance,MS),根據(jù)MS值篩選樞紐模塊,本研究中選取最顯著的模塊進(jìn)行分析。
1.4 GO和KEGG功能富集分析使用DAVID6.8版本(http://david.abcc.ncifcrc.gov)在線分析工具對樞紐模塊基因進(jìn)行GO生物過程富集分析和KEGG通路富集分析。
1.5 樞紐基因篩選計(jì)算樞紐模塊中模塊基因隸屬度(module membership, MM),在樞紐模塊中符合|GS|>0.2且|MM|>0.8的基因篩選為備選樞紐基因。利用STRING數(shù)據(jù)庫(http://string-db.org/)構(gòu)建樞紐模塊基因的蛋白互作網(wǎng)絡(luò)[10],本研究以點(diǎn)度中心性(degree)≥30為條件篩選另一組備選樞紐基因,對兩備選樞紐基因集合取交集,最后確定樞紐基因。
1.6 樞紐基因驗(yàn)證基于GEPIA[11](http://gepia.cancer-pku.cn/index.html)在線分析工具對樞紐基因進(jìn)生存分析和結(jié)果驗(yàn)證。
1.7 統(tǒng)計(jì)學(xué)方法使用R語言軟件(3.6.1)調(diào)用Bioconductor處理數(shù)據(jù),利用WGCNA方法構(gòu)建并劃分網(wǎng)絡(luò),GEPIA在線分析工具應(yīng)用對數(shù)秩檢驗(yàn)計(jì)算患者的總體生存率,P<0.05為差異具有統(tǒng)計(jì)意義。
2.1 數(shù)據(jù)篩選GSE13507數(shù)據(jù)共包含256例樣本,經(jīng)篩選最終剩余58例癌旁正常組織樣本與67例NMIBC樣本用于后續(xù)分析。分析流程圖見圖1。
圖1 分析流程圖
2.2 WCGNA分析和模塊計(jì)算共納入125樣本用于構(gòu)建共表達(dá)網(wǎng)絡(luò),其中GSM340606樣本集群高度超過80被標(biāo)識為離群值(圖2A),刪除離群值后的124個樣本構(gòu)建特征熱圖(圖2B)。為確保無尺度獨(dú)立性(接近0.9)和低均值連通性(接近0),選取6為軟閾值構(gòu)建網(wǎng)絡(luò)(圖2C)。以最小模塊基因數(shù)為30的標(biāo)準(zhǔn)構(gòu)建分層聚類樹(圖3A),相似基因被歸類到同一模塊。共得到14個模塊(圖3B),通過比較模塊和臨床性狀相關(guān)性系數(shù)的大小,發(fā)現(xiàn)black模塊與腫瘤的關(guān)系最密切(cor=0.72,P=2.6e-82),用于進(jìn)一步分析(圖3C)。
圖2 樣本樹狀圖和軟閾值估計(jì)
圖3 基因聚類和模塊鑒定
2.3 Hub基因的鑒定在black模塊中,以|GS|>0.2且|MM|>0.8為篩選條件得到67個備選樞紐基因。利用STRING數(shù)據(jù)庫對black模塊基因創(chuàng)建蛋白質(zhì)與蛋白質(zhì)間相互作用網(wǎng)絡(luò),以degree大于等于30為條件獲得8個備選樞紐基因。利用R語言“VennDiagram包”對兩組備選樞紐基因取交集,最終確定PA2G4和PRPF19為樞紐基因(表1、圖4)。
圖4 樞紐基因韋恩圖
表1 模塊樞紐基因
2.4 功能富集分析對樞紐模塊(black)所包含的508個基因進(jìn)行GO生物過程富集分析及KEGG信號通路富集分析。以P<0.05為篩選條件,顯著富集的GO生物過程有27個條目,表2展示了排名靠前的10個功能;顯著富集的KEGG通路分析有20個,表3展示其中排名靠前的10個結(jié)果。
表2 black模塊基因的GO富集分析結(jié)果
表3 back模塊KEGG富集分析結(jié)果
2.5 樞紐基因驗(yàn)證通過GEPIA對得到樞紐基因進(jìn)于生存分析驗(yàn)證,PA2G4和PRPF192高表者均顯示具有較短的總生存期(P<0.05)(圖5A、5B);在腫瘤組織和正常組織對比中兩個基因均有表達(dá)差異的現(xiàn)象,在腫瘤組中呈高表達(dá)(圖5C、5D)。
圖5 生存分析及表達(dá)量
NMIBC手術(shù)治療有較高的局部復(fù)發(fā)率,約有1/10~1/5的患者治療后進(jìn)展為肌層浸潤性膀胱癌[12]。隨著治療技術(shù)進(jìn)步,精準(zhǔn)治療逐漸成為研究熱點(diǎn),精準(zhǔn)治療的前提是確定疾病相關(guān)的樞紐基因。本研究通過WGCNA將模塊與臨床特征相關(guān)聯(lián),篩選出與NMIBC相關(guān)顯著的模塊,進(jìn)一步分析模塊基因鑒定與NMIBC相關(guān)的樞紐基因。
鑒定樞紐基因的方法先前已有部分研究,Deng等[13]運(yùn)用同樣的方法,鑒定8個膀胱癌的樞紐基因;Zhang[14]等鑒定6個與膀胱鱗癌相關(guān)的樞紐基因。Yuan等[15]研究發(fā)現(xiàn)COL3A1過表達(dá)影響膀胱癌預(yù)后。
本研究最終獲得了2個與NMIBC相關(guān)的樞紐基因分別是PA2G4和PRPF19。PA2G4位于12號染色體,參與編碼ErbB3結(jié)合蛋白1(Ebp1) 的亞型(p42和p48)[16],兩亞型與多種蛋白質(zhì)或RNA相互作用,調(diào)解相應(yīng)蛋白質(zhì)的轉(zhuǎn)錄和調(diào)控,在人類多種癌組織中有重要作用[17-18],如在結(jié)直腸腫瘤中能夠促進(jìn)腫瘤其生長[19]。PA2G4作為一種輔助因子,其在神經(jīng)母細(xì)胞瘤中發(fā)揮了關(guān)鍵作用,通過競爭性抑制作用可以作為一種潛在的神經(jīng)母細(xì)胞瘤治療靶點(diǎn)[20],ErbB3可以調(diào)節(jié)細(xì)胞的生長和分化,如參與p53的腫瘤抑制活性[21]。PA2G4P4可促進(jìn)PA2G4的表達(dá)與核易位,對膠質(zhì)母細(xì)胞瘤細(xì)胞的活力和凋亡產(chǎn)生影響[22]。PA2G4P4在膀胱癌的發(fā)生發(fā)展中發(fā)揮著功能作用,通過敲除基因的方法驗(yàn)證了PA2G4P4缺失影響膀胱癌細(xì)胞的增殖、遷移和死亡,鑒定其為膀胱腫瘤的標(biāo)記基因[22]。
PRPF19是一種蛋白質(zhì)編碼基因,與泛素-蛋白轉(zhuǎn)移酶活性有關(guān),PRPF19泛素連接酶影響底物泛素化水平,在胰腺癌中影響腫瘤的發(fā)生和發(fā)展[23]。鄭雨薇[24]等在伯基特淋巴瘤的差異表達(dá)基因中也發(fā)現(xiàn)了PRPF19基因。有研究報(bào)道[25],PRPF19編碼的蛋白與甲型流感病毒感染細(xì)胞中的NS1蛋白有相互作用,能夠影響病毒在宿主細(xì)胞中的復(fù)制,在PRPF19減表達(dá)的情況下,相應(yīng)的病毒復(fù)制受到限制,在膀胱腫瘤中其高表達(dá)是否會影響腫瘤的進(jìn)展有待進(jìn)一步研究。在膠質(zhì)瘤相關(guān)研究中[26],DNA損傷反應(yīng)基因PRPF19的甲基化使得患者有生存降低。在DNA損傷反應(yīng)中PRPF19能夠發(fā)揮傳感器的作用,激活泛素連接酶驅(qū)動ATR進(jìn)一步影響損傷修復(fù)[27],許妍妍等[28]發(fā)現(xiàn),茶多酚影響PRPF19表達(dá),對微衛(wèi)星不穩(wěn)定性結(jié)直腸癌有抑制作用,也有相關(guān)研究表明PRPF19在卵巢癌的侵襲性中發(fā)揮作用[29]。在胃癌中PRPF19也發(fā)現(xiàn)表達(dá)上調(diào)[30]。以上的研究均發(fā)現(xiàn)在腫瘤組織中存在PRPF19基因高表達(dá)的現(xiàn)象,并且該基因在DNA修復(fù)及泛素相關(guān)調(diào)控中有重要作用,本研究中,通過GEPIA分析發(fā)現(xiàn)其不僅在膀胱腫瘤組織中高表達(dá),而且高表達(dá)患者的整體生存時間變短,但在膀胱癌中該基因具體發(fā)揮何種作用尚不清楚。
樞紐模塊基因KEGG分析主要富集在HTLV-I感染、神經(jīng)營養(yǎng)因子信號通路和醛固酮的合成和分泌等方面。模塊基因GO分析顯示,生物過程主要富集在RNA聚合酶II啟動子的轉(zhuǎn)錄、蛋白酶體介導(dǎo)的泛素依賴的蛋白質(zhì)分解過程、mRNA剪接體等方面。有研究證實(shí),mRNA剪接體模式的改變影響對膀胱腫瘤細(xì)胞的抑制作用[31],泛素結(jié)合酶是影響腫瘤微環(huán)境的重要因子,參與DNA修復(fù)和調(diào)控周期分布[32],江偉凡等[33]實(shí)驗(yàn)證明泛素在膀胱癌組織中高表達(dá),并通過與其他相關(guān)蛋白相互作用促進(jìn)膀胱癌的增值。PRPF19基因也影響泛素-蛋白轉(zhuǎn)移酶活性,進(jìn)一步說明本研究結(jié)果的可靠性。
綜上所述,通過WGCNA的生物學(xué)研究方法鑒定了PA2G4和PRPF19兩個樞紐基因,經(jīng)驗(yàn)證二者表達(dá)與NMIBC患者的預(yù)后相關(guān),有望成為該疾病的生物標(biāo)志物。