王加中,曹罡,劉陽,陳碩
西安交通大學第二附屬醫(yī)學普通外科,西安 710061
甲狀腺癌(thyroid carcinoma,TC)的發(fā)病率和病死率分別位居癌癥發(fā)病率和病死率的第7位和第22位[1]。甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)是最常見的分化型TC[2],近年發(fā)病率逐漸升高。PTC主要通過頸部淋巴結進行局部轉移,肺、骨等遠處轉移發(fā)生率較低[3],腦轉移發(fā)生率僅為0.1%~5.0%。PTC 腦轉移患者的預后較差,5 年生存率僅1.3%[4]。目前PTC 腦轉移的確切發(fā)病機制尚未闡明。隨著基因芯片和高通量測序技術的發(fā)展,以GEO(Gene Expression Omnibus)、癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)為代表的高通量基因表達數(shù)據庫成為了生物信息學分析基因芯片的主要研究對象,多項研究成功發(fā)現(xiàn)了多種對腫瘤診斷、治療有價值的基因[5-6]。本研究從GEO 數(shù)據庫下載PTC 腦轉移患者的微針列數(shù)據集,篩選PTC腦轉移相關的差異表達基因(differentially expressed genes,DEGs),分析DEGs 的生物學功能,進一步篩選PTC腦轉移的關鍵調控基因,現(xiàn)將結果報告如下。
1.1 PTC 腦轉移相關基因芯片的選取及預處理 以“papillary thyroid carcinoma”、“brain metastasis”為關鍵詞在GEO 數(shù)據庫中進行檢索,基因表達數(shù)據類型為Expression profiling by array,種屬為人,選取基因芯片GSE66463 為研究對象,該基因芯片依托于GPL6244 平臺,利用Affymetrix Human Gene 1.0 ST arrays 分析納入2 例PTC 腦轉移患者的轉移灶癌組織樣本、8 例PTC 患者的癌組織樣本、8 例腦膠質瘤患者組織樣本,含有23 739 個可供分析基因。由于樣本中原始數(shù)據受基因探針、測序深度、基因長度等諸多因素的影響,因此,分析前需對基因芯片數(shù)據進行背景校正和歸一化處理,GSE66463芯片質量控制的箱線圖中所有樣本中位數(shù)基本持平,樣本間歸一化程度高,說明芯片質量控制好,可用于下一步分析。
1.2 PTC 腦轉移灶癌組織差異表達基因的篩選 通過GEO 數(shù)據庫的在線分析工具GEO2R 分析并篩選差異表達基因,調用R 軟件中GEOquery、limma包,采用Benjamini&Hochberg檢驗,以Padj<0.05、|log2FC|≥2 作為差異表達基因的篩選標準,篩選PTC腦轉移患者與PTC患者癌組織中的差異表達基因。
1.3 PTC 腦轉移灶差異表達基因的生物學功能分析 基于基因本體聯(lián)合會(Gene Onotology Consortium)建立的數(shù)據庫進行的基因本體論(GO),GO 功能富集分析是對基因進行注釋和生物學功能分析的重要工具,GO 從生物學過程、分子功能和細胞組分描述基因產物可能行使的分子功能,所處的細胞環(huán)境,以及參與的生物學過程。京都基因和基因組數(shù)據 庫(Kyoto Encyclopedia of Genes and Genomes,KEGG)信號通路富集分析是用于從大規(guī)模分子數(shù)據集中了解基因的富集通路。利用Metascape(https://metascape. org/)對差異表達基因進行GO和KEGG 信號通路富集分析,對PTC 腦轉移的差異表達基因進行功能注釋和富集分析。
1.4 PTC 腦轉移的關鍵調控基因篩選 String 數(shù)據庫(https://string-db.org/)是目前數(shù)據量最豐富、應用最廣泛的研究蛋白質相互作用的數(shù)據庫,將差異表達基因集導入String 數(shù)據庫(https://string-db.org/)進行分析,種屬限定為人,combined score 設定為0.9,構建差異表達基因的蛋白質相互作用網絡(protein protein interaction network,PPI),PPI 中每個節(jié)點代表1個蛋白質,節(jié)點內為蛋白質的三維結構,節(jié)點間的連線代表蛋白質的相互作用,顏色越紅表明蛋白間連接度高。將PPI 輸出結果導入Cytoscape 3.9.1軟件,通過CytoHubba插件根據PPI網絡節(jié)點中的Degree 篩選排名前10 的Hub 基因,并利用“NetworkAnalyzer”工具進行可視化,即為可能參與PTC腦轉移的關鍵調控基因。
1.5 PTC 腦轉移的關鍵調控基因與PTC 患者預后的關系分析 ①PTC 腦轉移的關鍵調控基因與PTC患者預后的關系:GEPIA(http://gepia. cancer-pku.cn)數(shù)據庫(gene expression profiling and interactive analyses,GEPIA)是北京大學基于TCGA 和GTEx 基因表達數(shù)據庫開發(fā)的交互式網站,將篩選的關鍵調控基因導入GEPIA 數(shù)據庫,分析條件為Datasets selection(THCA)、Methods(Overall survival)、Group cutoff 為Media,繪 制Kaplan-Meier 生 存 曲 線,Log rank檢驗分析PTC 腦轉移的關鍵調控基因與PTC 患者預后的關系,P<0.05 為差異有統(tǒng)計學意義。②PTC 腦轉移的關鍵調控基因表達蛋白與PTC 患者預后的關系:人類蛋白質表達圖譜數(shù)據庫(The human protein atlas,HPA)是基于RNA 測序和蛋白免疫組化分析的轉錄組數(shù)據庫(https://www.proteinatlas.org),HPA 從染色、強度和數(shù) 量3 方面分 析多種腫瘤組織蛋白差異表達。利用HPA 數(shù)據庫分析關鍵調控基因的蛋白定位和表達,分析PTC 腦轉移的關鍵調控基因蛋白與PTC 預后關系,兩組 間 比 較 采 用Log rank 檢 驗,P<0.05 為 差 異 有統(tǒng)計學意義。
2.1 PTC 腦轉移灶癌組織差異表達基因及生物學功能 篩選出183個差異表達基因,其中上調82個,下調101 個。表達上調的有TRO、MAGEH1、PGK1、白 細 胞 介 素1α(IL1α)、IL1β、SLC6A14、ZCCHC12、LOC642980、PIM2、CSF2 等,表達下調的有有CDC20、PIFO、TARS2、CGN、S100A9、FLAD1、HSPA6、XPR1、ELF3、B3GNT7等。GO功能富集結果顯示,PTC 腦轉移患者癌組織差異表達基因主要富集在金屬離子動態(tài)平衡、小分子轉運、分子細胞間黏附、激素水平、細胞因子與炎癥反應等過程上。KEEG 信號通路富集分析結果發(fā)現(xiàn),與差異表達基因相關的排名前10位的信號通路包括:風濕性炎癥信號通路、NF-κB 信號通路、IL17 信號通路、軍團桿菌病信號通路、沙門氏菌感染信號通路、錯配修復信號通路、人T 細胞白血病病毒1 感染信號通路、TNF(tumor necrosis factor)信號通路、HIF-1(Hypoxia-inducible factor 1)信號通路、細胞因子受體間相互作用信號通路。
2.2 PTC 腦轉移關鍵調控基因 PTC 腦轉移患者癌組織差異表達基因編碼蛋白的PPI結構圖見圖1。PTC腦轉移患者癌組織差異表達基因差異表達基因中IL1A-IL1B-OSM 是PPI 蛋白與蛋白之間作用的關鍵網絡。β-1,3-N-乙酰氨基葡萄糖氨基轉移酶(B3GNT7)、絲氨酸/蘇氨酸激酶(BUB1)、細胞分裂周期蛋白20(CDC20)、集落刺激因子2(CSF2)、趨化因子CXC 配體2(CXCL2)、IL1A、IL1B、骨誘導因子(OGN)、骨調蛋白(OMD)、脯氨酸/精氨酸豐富端亮氨酸豐富重復蛋白(PRELP)可能是參與PTC腦轉移的關鍵調控基因。
圖1 PTC腦轉移患者癌組織差異表達基因編碼蛋白的PPI結構圖
2.3 PTC 腦轉移關鍵調控基因及其蛋白與PTC 預后的關系。 GEPIA 數(shù)據庫分析結果顯示,BUB1、CDC20、CSF2、CXCL2、IL1A、IL1B、OGN、OMD、PRELP 基因表達高低與PTC 患者的預后無關(P均>0.05)。與B3GNT7 低表達者比較,B3GNT7 高表達的PTC患者預后較好(P=0.044<0.05)。
HPA 數(shù)據庫分析結果顯示,B3GNT7 是一類代謝類蛋白質,主要定位于細胞內高爾基體。利用HPA 數(shù)據庫分析B3GNT7 基因表達蛋白高低對PTC預后的影響,數(shù)據庫中共收錄501 例PTC 患者的臨床資料,其中男135 例、女366 例,存活485 例、死亡16 例,TNM 分期為Ⅰ期281 例、Ⅱ期52 例、Ⅲ期111例、Ⅳ期57 例,生存分析結果顯示B3GNT7 蛋白高、低表達的PTC 患者5 年存活率分別為96%、80%(P<0.05)。免疫組化結果顯示B3GNT7 主要表達于甲狀腺濾泡上皮細胞內。
PTC 占甲狀腺癌的90%以上,腦轉移發(fā)生率較低,但致死率較高。PTC 腦轉移主要發(fā)生在腦實質內,癥狀表現(xiàn)為頭痛、顱內高壓癥狀以及顱神經壓迫癥狀、昏迷等[7-8]。目前對PTC 腦轉移的治療方法尚存爭議[9]。有學者[10]建議對孤立轉移灶建議手術切除,有學者[11-13]觀察了7 例PTC 腦轉移患者,7 例患者中大多伴有肺轉移,且能夠攝取I131,可行放射性I131治療,對無攝I131功能的病灶則需行放療或化療,但以上治療方案均可能增加患者腦水腫風險,病死率較高。因此需要進一步探索PTC腦轉移的發(fā)病機制,從而尋找最佳治療方案。
隨著基因芯片技術的發(fā)展,生物信息學成為我們從基因水平揭示腫瘤發(fā)生、發(fā)展的重要研究方法[14-16],新一代的基因測序技術包括單細胞測序、空間轉錄組測序等生物技術的發(fā)展使我們能從基因水平探索腫瘤的發(fā)生發(fā)展機制。本研究采用生物信息學方法分析GSE66463 數(shù)據集中的23 739 個基因,篩選出183 個差異表達基因。其中表達上調的有TRO、MAGEH1、PGK1、IL1A、IL1B、SLC6A14、ZCCHC12、LOC642980、PIM2、CSF2 等基因,表達下調的有CDC20、PIFO、TARS2、CGN、S100A9、FLAD1、HSPA6、XPR1、ELF3、B3GNT7 等基因,通過功能注釋和富集分析顯示這些差異表達基因主要的分子功能與金屬離子動態(tài)平衡、分子細胞間黏附等有關。
多種癌癥組織中金屬離子的含量與腫瘤細胞增殖、血管生成、凋亡有關,近些年來,已有多項研究證實鐵、銅死亡等金屬離子誘導的調節(jié)性凋亡的與腫瘤的發(fā)生發(fā)展有關。鐵死亡是以細胞內鐵超載和活性氧累積導致脂質過氧化為特征的一種調節(jié)性細胞死亡(regulatory cell death,RCD)過程,銅死亡也是一種金屬離子誘導的RCD 過程,正常情況下,細胞內金屬離子濃度通過主動穩(wěn)態(tài)機制保持在較低水平,當金屬離子動態(tài)平衡被打破后,過載的金屬離子會導致細胞的過度呼吸作用,產生細胞毒性,最終誘導其死亡,與腫瘤發(fā)生發(fā)展密切相關。細胞間黏附分子是介導細胞間或細胞與細胞外基質間相互接觸和結合的一類細胞表面跨膜糖蛋白統(tǒng)稱。分子以受體—配體結合的形式發(fā)揮作用,參與細胞的識別、細胞的活化和信號轉導、細胞的增殖與分化,細胞的伸展與移動,是腫瘤轉移的分子基礎,目前已發(fā)現(xiàn)黏附分子中的E-鈣黏蛋白、β-環(huán)連蛋白(β-catenin)以及上皮細胞黏附分子(EP-CAM)能夠促進乳腺癌、食管癌等多種腫瘤細胞轉移。KEEG 信號通路富集分析顯示風濕性炎癥信號通路、NF-κB信號通路、錯配修復信號通路、TNF信號通路、HIF-1信號通路、細胞因子受體間相互作用信號通路等參與PTC腦轉移的發(fā)病機制,錯配修復(MismatchRepair,MMR)基因的產物是錯配修復蛋白,通過修復DNA 復制過程中錯配的堿基使DNA 能精確復制,當MMR 基因發(fā)生突變,錯配修復蛋白的表達量下降、不表達或出現(xiàn)截短,對DNA 復制過程中發(fā)生的缺失和插入不能校正或糾錯,引起基因組DNA 不穩(wěn)定,導致腫瘤進展。差異表達基因中Hub 基因有B3GNT7、BUB1、CDC20、CSF2、CXCL2、IL1A、IL1B、OGN、OMD、PRELP,但PTC 預后生存分析結果顯示Hub 基因中的9 個基因僅有統(tǒng)計學差異,對PTC 預后無明顯影響,只有B3GNT7 不僅有統(tǒng)計學差異,同時在基因和蛋白水平均與PTC預后相關。
B3GNT7 屬于β3GlcNAcT 基因家族成員之一,B3GNT7 是糖基轉移酶β3GlcNAcT 家族8 個亞族成員之一,定位于19q13.2,基因序列有由3 個外顯子和2 個內含子組成,其主要功能是催化還原糖蛋白末端N-乙酰半乳糖胺與絲氨酸或蘇氨酸形成的α-糖苷鍵,在多種腫瘤和正常組織中均有差異表達。β3GlcNAcT是一種與組織惡變有關的Ⅱ型跨膜蛋白,其功能與細胞膜上糖蛋白的結構變化有關,參與細胞間黏附、細胞識別、免疫應答等,研究[17-20]報道其家族成員B3GNT1 低表達與胰腺癌預后差有關,B3GNT7 在卵巢癌組織和癌旁組織中呈差異表達,B3GNT7 在甲狀腺乳頭狀癌的中作用機制研究較少,本研究結果發(fā)現(xiàn)B3GNT7 基因高表達PTC 患者預后好于低表達患者,提示B3GNT7 對PTC 起抑癌基因作用,從PPI蛋白網絡中可見B3GNT7蛋白與CCL13、OMD、PRELP 蛋白在轉錄后相互作用緊密,但具體機制不詳,仍需進一步探索其基因和信號通路的具體調控機制。CARROLL 等[21]發(fā)現(xiàn),IL22 通過上調STAT3 信號通路,誘導B3GNT7 上調表達,進而誘導細胞發(fā)生糖蛋白巖藻糖基化,可能與抑制腫瘤發(fā)生發(fā)展有關。
綜上所述,與PTC 患者比較,PTC 腦轉移患者癌組織中有183 個差異表達基因,差異表達基因與金屬離子動態(tài)平衡、小分子轉運及分子細胞間黏附等有關。IL1A-IL1B-OSM 是PTC 腦轉移PPI 蛋白與蛋白之間作用的關鍵網絡蛋白,B3GNT7、BUB1、CDC20、CSF2、CXCL2、IL1A、IL1B、OGN、OMD、PRELP 可能是PTC 腦轉移的調控基因。B3GNT7 表達與PTC 患者的預后密切相關,可能是PTC 腦轉移的關鍵調控基因。