武寒 徐磊 王苗苗 崔忠澤 吳淑華
濱州醫(yī)學(xué)院附屬醫(yī)院病理科,濱州 256600
胃癌是第5 種常見的惡性腫瘤,也是世界癌癥病死率的第3 大原因[1]。2018 年,世界范圍內(nèi)有1 033 701 例新病例和782 685例死亡與胃癌相關(guān),其中多數(shù)在診斷時已處于局部晚期階段[2-3]。晚期胃癌的預(yù)后之所以較差,通常是因為早期診斷生物標(biāo)志物的不足和缺少有效的治療[4]。因此,胃癌的預(yù)防和控制已經(jīng)成為緊急的公共衛(wèi)生問題,迫切需要研究其發(fā)生發(fā)展的潛在機制,找出新的治療和診斷靶點,最終提高患者的生存率。加權(quán)基因共表達網(wǎng)絡(luò)分析法(weighted gene co-expression network analysis,WGCNA)于2005年提出,并在官方網(wǎng)站上提供R數(shù)據(jù)包,可用于構(gòu)建加權(quán)基因共表達網(wǎng)絡(luò),檢測基因模塊,將基因模塊與臨床特征相關(guān)聯(lián),來鑒定模塊內(nèi)中心基因[5-7]。2023年1月至4月,在本研究中,筆者利用WGCNA 共表達網(wǎng)絡(luò)、蛋白互作網(wǎng)絡(luò)和生存預(yù)后,最終篩選出5 個預(yù)后相關(guān)基因,為進一步發(fā)現(xiàn)新的生物標(biāo)志及胃癌診斷和治療的潛在靶點提供的理論依據(jù)。
基因表達譜數(shù)據(jù)GSE65801(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE65801)可從公開的基因表達綜合數(shù)據(jù)庫(Gene Expression Omnibus,GEO)中搜索并下載。GSE65801 是基于GPL14550 平臺的表達譜,共包含64 個樣本,其中32 個為組織黏膜樣本,32 個為組織腫瘤樣本。應(yīng)用R 軟件鑒定差異表達基因(differently expressed genes,DEGs),并以|log2 FC|≥2.0 和矯正后P<0.05 為差異有統(tǒng)計學(xué)意義。
使用“WGCNA”R 包構(gòu)建胃癌和正常樣本中所有基因的共表達網(wǎng)絡(luò)。首先對RNASeq 數(shù)據(jù)進行過濾,降低異常值,軟閾值(β)由函數(shù)pickSoftThreshold 確定,并將最佳的powers 值保存在sft$powerEstimate,使構(gòu)建出的網(wǎng)絡(luò)更符合無尺度網(wǎng)絡(luò)標(biāo)準(zhǔn)。利用該加權(quán)相關(guān)系數(shù),將相關(guān)矩陣變換為鄰接矩陣,進而變換為拓撲重疊矩陣(topological overlap matrix,TOM)[8-9]。根據(jù)之前選定的軟閾值,將全部基因劃分為不同模塊,其中每個模塊至少包含50 個基因,并應(yīng)用動態(tài)樹剪切法將相關(guān)性小于0.25 的模塊合并,將所有基因劃分為數(shù)個模塊。隨機選擇400個基因作為TOM 熱圖確定每個模塊中遺傳因子表示的相對獨立性和模塊之間的高度獨立性。最后,使用WGCNA 算法計算由每個模塊的基因和樣本組成的模塊特征基因(ME)的皮爾森相關(guān)系數(shù)和P值,選擇相關(guān)系數(shù)最高的模塊進行后續(xù)分析。
通過構(gòu)建維恩圖(http://bioinformatics.psb.ugent.be/webtools/Venn/)篩選最顯著共表達模塊的DEGs。使用R 包“org.Hs.eg.db”將基因名轉(zhuǎn)化為entrezlID,并使用R 包“clusterProfiler”“org.Hs.eg.db”“enrichplot”和“ggplot2”包進行GO、KEGG。KEGG 是一個從高通量實驗技術(shù)生成的大規(guī)模分子數(shù)據(jù)中了解高級功能和生物系統(tǒng)的數(shù)據(jù)庫資源,而GO是一個主要的生物信息學(xué)工具,用于注釋和分析基因的生物過程(BPs)、分子功能(MFs)和細胞成分(CCs),結(jié)果以前10位BPs、MFs、CCs和KEGG為基礎(chǔ)進行可視化分析。
利用STRING 在線數(shù)據(jù)庫(Version 11.0,http://string-db.org)在線將之前獲得的基因構(gòu)建成PPI 共表達網(wǎng)絡(luò)(minimum required interaction score>0.4),然后輸出PPI網(wǎng)絡(luò)。 使用Cytoscape 軟件(Version 3.8.2,http://www.cytoscape.org/)打開在STRING 構(gòu)建的PPI 網(wǎng)絡(luò),使用“MCODE”包篩選出PPI 網(wǎng)絡(luò)中的重要模塊,以其中最重要模塊的基因作為研究對象。在線分析網(wǎng)站GEPIA[12](http://gepia. cancer-pku. cn/)對最重要模塊中的基因采用Kaplan-Meier法進行總生存(OS)和無病生存(DFS)分析,并以log-rank 法檢驗。從結(jié)果中篩選出P<0.05 的基因,這些差異表達的基因被認為有統(tǒng)計學(xué)意義,篩選出兩種生存均有統(tǒng)計學(xué)意義的基因作為預(yù)后相關(guān)基因。
使用R 軟件(v.3.6.3)進行統(tǒng)計分析,以P<0.05 為差異有統(tǒng)計學(xué)意義。
在GSE65801 數(shù)據(jù)集中獲取到一個包含2 222 個DEGs的基因集(GSE65801_DIFF)。與正常組織相比,其中1 140 個基因在癌組織中表達下調(diào),1 082 個基因表達上調(diào)(圖1)。
圖1 胃癌和正常組織的差異表達基因。A:熱圖;B:火山圖
從GSE65801數(shù)據(jù)集中獲得核酸探針的矩陣,利用平臺文件GPL14550將探針名轉(zhuǎn)換為基因名,并對其基因表達量作標(biāo)準(zhǔn)化處理,最終得到的基因表達譜矩陣用于共表達網(wǎng)絡(luò)構(gòu)建。本研究將所有樣本均納入WGCNA。為了更符合無尺度特征,選取11 作為β 值構(gòu)建共表達網(wǎng)絡(luò)(圖2A)。將剪切高度設(shè)置為0.25,合并模塊,根據(jù)TOM 矩陣檢測GSE65801,共發(fā)現(xiàn)12 個基因模塊(圖2B),隨機選取400 個基因繪制TOM 熱圖,確定每個模塊以及每個模塊中基因獨立存在(圖2C)。從模塊和性狀的熱圖中可發(fā)現(xiàn),淡青色(lightcyan)模塊與GSE65801 中胃癌的相關(guān)性最高(圖2D)。計算淡青色模塊中基因MM 和GS 相關(guān)系數(shù)(cor=0.66,P=3.8e-115)以驗證結(jié)果的可信度(圖2E)。因此,選用GEO_lightcyan模塊進行后續(xù)研究。
通過構(gòu)建Venn 圖(GEO_DIFF 和GEO_lightcyan)得到375個基因作為最顯著模塊的差異基因,這些基因作為關(guān)鍵基因進行后續(xù)分析(圖3A)。使用R 軟件富集分析結(jié)果顯示,這些基因主要富集到糖胺聚糖代謝、血管發(fā)育、上皮細胞增殖、調(diào)節(jié)細胞對生長因子刺激的反應(yīng)、調(diào)節(jié)細胞生長、細胞粘附等功能,以及PI3K-Akt、MAPK、Ras 等關(guān)鍵信號通路(圖3B、C)。
構(gòu)建了375 個關(guān)鍵基因的PPI 網(wǎng)絡(luò)。使用Cytoscape 軟件得到最重要模塊有41 個基因(圖4)。通過預(yù)后分析,獲得了5 個預(yù)后相關(guān)基因:VCAN、SERPINE1、HGF、IGFBP7、FSTL3(圖5)。
圖4 對淡青色模塊基因進行蛋白質(zhì)相互作用分析(橙色區(qū)域為最重要功能模塊,綠色為其他基因)
圖5 GEPIA篩選預(yù)后相關(guān)基因。A、B、C、D、E:預(yù)后相關(guān)基因總生存分析;F、H、I、J:預(yù)后相關(guān)基因無病生存分析
胃癌是最常見的惡性腫瘤。近年來,雖然已有胃癌病因?qū)W的相關(guān)研究,但其發(fā)展的確切機制仍有待探索。本研究通過在GSE65801 數(shù)據(jù)集中進行WGCNA,獲得了12 個共表達模塊。選取出其中差異最顯著的共表達模塊進一步篩選差異基因,最終得到375個關(guān)鍵基因。
通過富集分析,筆者發(fā)現(xiàn)關(guān)鍵基因主要富集到糖胺聚糖代謝、血管發(fā)育、上皮細胞增殖、調(diào)節(jié)細胞對生長因子刺激的反應(yīng)、調(diào)節(jié)細胞生長、細胞粘附等功能上,除此以外,還富集在PI3K-Akt、MAPK、Ras 等關(guān)鍵信號通路上。已有研究表明,在胃癌中,糖胺聚糖可通過多種途徑影響腫瘤細胞的生物學(xué)行為,從而影響患者預(yù)后[13]。血管發(fā)育是腫瘤細胞生長的必要條件之一[14],而細胞的增殖與生長是促進腫瘤進展不可或缺的因素[15],二者可相互作用影響胃癌的進展。眾多學(xué)者也已證明,PI3K-Akt[16-17]、MAPK[18-19]、Ras[20]等信號通路對研究胃癌發(fā)生機制具有重要意義。除此之外,筆者還發(fā)現(xiàn)這些基因亦富集到許多新的功能與通路上,這可能為進一步探究胃癌發(fā)生發(fā)展規(guī)律、探索胃癌治療方法、改善患者生存提供新思路。
本研究將關(guān)鍵基因進行PPI分析,并將最重要模塊中的基因進行預(yù)后分析,最終鑒定出5 個預(yù)后相關(guān)基因:VCAN、SERPINE1、HGF、IGFBP7、FSTL3。通過在線網(wǎng)站GeneCsrds(https://www.genecards.org/)檢索可知,VCAN 又被稱為Versican,可能參與細胞運動、調(diào)節(jié)細胞生長和分化;SERPINE1作為尿激酶型纖溶酶原激活物抑制劑之一,可參與細胞粘附和擴散的調(diào)節(jié);HGF 可調(diào)節(jié)多種組織類型中的細胞生長、細胞運動性和形態(tài)的發(fā)生;IGFBP7 是胰島素超家族的生長促進肽成員,可與胰島素結(jié)合對細胞進行調(diào)控;FSTL3是編碼卵泡抑素模塊蛋白家族的一種分泌糖蛋白。
Li 等[21]研究發(fā)現(xiàn),VCAN 是影響胃癌預(yù)后的獨立危險因素。有研究表明,VCAN 的表達在胃癌中顯著增高,并與腫瘤的生長和發(fā)展密切相關(guān)[22]。在本研究中,VCAN 被富集到粘多醣代謝過程上,提示其可通過調(diào)節(jié)癌細胞生長分化促進胃癌進展。Xu 等[23]研究證實,SERPINE1 可通過調(diào)節(jié)葡萄糖代謝來促進乳腺癌的發(fā)生。研究發(fā)現(xiàn),分泌型SERPINE1 表達增加,可誘導(dǎo)基質(zhì)金屬蛋白酶1(MMP1)的表達并使結(jié)腸癌轉(zhuǎn)移風(fēng)險提高[24]。本研究發(fā)現(xiàn),SERPINE1 被富集到血管生成相關(guān)通路上,這與Teng 等[25]研究結(jié)果一致,該研究發(fā)現(xiàn)SERPINE1 表達上調(diào)和激活VEGFR-2 信號通路最終促進腫瘤血管生成,影響胃癌進展。Gao 等[26]研究發(fā)現(xiàn),HGF 表達可能與胃癌中血管生成和淋巴結(jié)轉(zhuǎn)移呈正相關(guān)。Ding 等[27]進一步證實,腫瘤相關(guān)成纖維細胞的HGF可通過PI3K/AKT和ERK1/2信號促進胃癌血管化。本研究結(jié)果顯示,HGF被富集到血管發(fā)生、間充質(zhì)細胞分化等重要功能以及PI3K-Akt 信號通路、MAPK 信號通路等通路上,說明HGF對腫瘤細胞生長發(fā)育、信號傳導(dǎo)等過程具有重要意義。最新研究發(fā)現(xiàn),IGFBP7 可作為膀胱癌的治療靶點[28]。IGFBP7 與肝細胞癌[29]、急性淋巴細胞白血病[30]、胃癌[31]等疾病均密切相關(guān)。腫瘤相關(guān)成纖維細胞分泌的IGFBP7 通過FGF2/FGFR1/PI3K/AKT 軸增強腫瘤相關(guān)巨噬細胞的浸潤,從而促進胃癌的發(fā)生[32]。本研究結(jié)果顯示,IGFBP7 被富集到細胞生長相關(guān)的功能上,表明調(diào)控IGFBP7有望成為胃癌調(diào)控的重要靶點。FSTL3在胃癌組織中高表達,并與總體無病生存期相關(guān)[33]。本研究結(jié)果顯示,F(xiàn)STL3 被富集到跨膜受體蛋白絲氨酸/蘇氨酸激酶信號通路、細胞粘附的正調(diào)控、調(diào)節(jié)細胞對生長因子刺激的反應(yīng)等功能上,說明其可通過多種途徑影響胃癌的發(fā)生。
綜上所述,本研究對GSE65801 數(shù)據(jù)集進行分析,發(fā)現(xiàn)了胃癌發(fā)生發(fā)展過程中重要的功能模塊,并在胃癌關(guān)鍵功能模塊中篩選出5 個可作為胃癌預(yù)后生物標(biāo)志物或潛在治療靶點的預(yù)后相關(guān)基因:VCAN、SERPINE1、HGF、IGFBP7、FSTL3。這些基因及其所富集到的通路及功能可能為臨床研究提供新方向。然而,本文只是從生信水平進行了初步分析,由于樣本量的限制、數(shù)據(jù)集來源存在一定的局限性,仍需擴大樣本量分析并從多層面開展分子機制、細胞實驗、動物實驗等更深入的探究,進行進一步驗證。
利益沖突所有作者均聲明不存在利益沖突
作者貢獻聲明武寒:醞釀和設(shè)計試驗,實施研究,采集數(shù)據(jù),分析/解釋數(shù)據(jù),起草文章,對文章的知識性內(nèi)容作批評性審閱,統(tǒng)計分析;徐磊:醞釀和設(shè)計試驗,實施研究,分析/解釋數(shù)據(jù),起草文章,對文章的知識性內(nèi)容作批評性審閱,統(tǒng)計分析;王苗苗:醞釀和設(shè)計實驗,實施研究,采集數(shù)據(jù),對文章的知識性內(nèi)容作批評性審閱,統(tǒng)計分析;崔忠澤:醞釀和設(shè)計試驗,實施研究,分析/解釋數(shù)據(jù),對文章的知識性內(nèi)容作批評性審閱,統(tǒng)計分析;吳淑華:醞釀和設(shè)計實驗,分析/解釋數(shù)據(jù),對文章的知識性內(nèi)容作批評性審閱,統(tǒng)計分析獲取研究經(jīng)費,行政、技術(shù)或材料支持,指導(dǎo),支持性貢獻