向曉輝 毛駿 李海
1天津市西青醫(yī)院消化內(nèi)科,天津 300380;2武警后勤學院研究生隊,天津 300309;3天津市肝臟胰腺纖維化與分子診療重點實驗室,天津 300162
胰腺癌是一種惡性程度很高、診斷和治療都很困難的消化腺惡性腫瘤,起病隱匿,早期癥狀不典型,出現(xiàn)癥狀時大多已屬中晚期[4],預(yù)后差[1]。著絲粒蛋白(centromere protein,CENP)是一組形成、介導著絲粒功能的蛋白[6-7],最早被發(fā)現(xiàn)的是CENP-A,由CENP-A基因編碼。CENP-A是一種組蛋白H3變體,對于著絲粒的組裝形成、染色體的正確分離以及細胞分裂的正常進行起到了不可替代的作用[8-10]。CENP-A在正常細胞中的轉(zhuǎn)錄、翻譯水平受嚴格調(diào)控,對確保有絲分裂過程中基因組的穩(wěn)定性發(fā)揮重要作用[7, 11]。研究發(fā)現(xiàn)CENP-A基因在多種惡性腫瘤中過表達,導致染色體非整倍體形成,而染色體非整倍體形成往往是腫瘤形成的重要原因之一[12]。本研究通過檢索高通量基因表達(Gene Expression Omnibus,GEO)數(shù)據(jù)庫和癌癥基因組圖集(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫,探討CENP-A在胰腺癌組織中的表達及其臨床意義。
自GEO數(shù)據(jù)庫(http:www.ncbi.nlm.nih.gov/geo)的1個微陣列數(shù)據(jù)集(GSE28735)下載45例具有完整臨床隨訪信息的胰腺癌患者癌組織和癌旁組織mRNA表達譜數(shù)據(jù);自TCGA數(shù)據(jù)庫(https://cancergenome.nih.gov/)下載178例胰腺癌患者癌組織的mRNA Seq數(shù)據(jù),其中177例患者具有匹配的mRNA表達譜、生存數(shù)據(jù)和完整的臨床病理數(shù)據(jù)。
下載edge R軟件包(http://www.bioconductor.org/packages/release/bioc/html/edgeR.html)對mRNA表達譜進行過濾、歸一化處理,并經(jīng)log2轉(zhuǎn)換后用于后續(xù)分析[13-14]?;赥CGA數(shù)據(jù)庫中177例胰腺癌樣本CENP-A mRNA表達譜和隨訪數(shù)據(jù),對樣本的表達量進行由高到低排序后,取中位數(shù)將其分為高表達、低表達2組。
使用基因集富集分析(gene set enrichment analysis,GSEA)軟件分析CENP-A mRNA表達水平與京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路基因集的相關(guān)性[15-17]。設(shè)置隨機組合次數(shù)為1 000次,計算標準化的富集系數(shù)(normallized enrichment score,NES),以標準化P值<0.01,且錯誤發(fā)現(xiàn)率(false discovery rates,F(xiàn)DR)<0.05為顯著性富集。
STRING(Search Tool for the Retrieval of Interacting genes/proteins)數(shù)據(jù)庫(https://string-db.org/cgi/input.pl)是一個研究分析蛋白之間相互作用的在線檢索生物數(shù)據(jù)庫,可用于尋找與CENP-A蛋白作用密切相關(guān)的多個蛋白,構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)。將STRING數(shù)據(jù)庫分析結(jié)果中的蛋白和本研究中的GSEA富集通路結(jié)果結(jié)合,篩選出與CENP-A相關(guān)的蛋白,分析兩者表達的相關(guān)性。
癌組織與癌旁組織表達量比較采用配對樣本t檢驗,臨床病理指標參數(shù)采用獨立樣本t檢驗。生存分析采用Kaplan-Meier法及Log-rank檢驗。對CENP-A表達與相關(guān)蛋白表達進行Spearman相關(guān)性分析,并用GraphPad Prism 8.0軟件對數(shù)據(jù)進行可視化處理。P<0.05為差異有統(tǒng)計學意義。
GEO數(shù)據(jù)庫下載的45例胰腺癌組織和相匹配的癌旁組織中CENP-A mRNA表達量分別為4.492±0.361和3.431±0.405,胰腺癌組織CENP-A mRNA表達量顯著高于癌旁組織,差異有統(tǒng)計學意義(t=14.531,P=0.001,圖1)。
注:CENP-A為著絲粒蛋白A圖1 胰腺癌組織與匹配癌旁組織的CENP-A表達量
TCGA數(shù)據(jù)庫下載的177例胰腺癌組織CENP-A基因表達量與TNM分期、腫瘤分級密切相關(guān),差異有統(tǒng)計學意義(P值分別為0.035、0.007),而與患者年齡、性別、飲酒史及腫瘤家族史均無明顯相關(guān)性(表1)。
CENP-A的表達水平與胰腺癌患者總體生存期顯著相關(guān)(P=0.001),高表達患者與低表達患者的生存率分別為36.4%和59.6%,中位生存期分別為511 d和913 d,高表達患者總體生存時間顯著短于低表達患者,提示CENP-A基因高表達是胰腺癌患者預(yù)后不良的因素(圖2)。
CENP-A高表達組織樣本富集到細胞周期(P<0.001,F(xiàn)DR=0.004)與DNA周期(P<0.001,F(xiàn)DR=0.043)兩個相關(guān)基因集,提示CENP-A可能通過上述兩條通路發(fā)揮促進腫瘤發(fā)生發(fā)展的作用(圖3)。
臨床指標例數(shù)CENP-A表達量t值P值年齡(歲)-0.9650.336 <65816.743±1.417 ≥65966.931±1.175性別0.4060.685 男976.888±1.202 女806.809±1.365腫瘤分級-2.7500.007 G1~G21256.663±1.349 G3~G4507.244±1.020 未知2TNM分期-2.2430.035 Ⅰ226.037±1.881 Ⅱ~Ⅳ1556.960±1.147飲酒史-0.6170.538 無706.771±1.019 有1076.893±1.443腫瘤家族史-0.6000.549 無896.787±1.444 有886.904±1.119
注:CENP-A為著絲粒蛋白A
注:CENP-A為著絲粒蛋白A圖2 CENP-A表達水平與胰腺癌患者生存時間的關(guān)系
使用STRING數(shù)據(jù)庫分析構(gòu)建CENP-A蛋白的PPI網(wǎng)絡(luò),發(fā)現(xiàn)周期蛋白依賴性激酶1(cyclin-dependent protein kinase, CDK1)、紡錘體檢測蛋白1(budding uninhibited by benzimidazoles 1, BUB1)、細胞周期調(diào)節(jié)激酶(aurora kinase A, AURKA)、AURKB等多個蛋白與CENP-A相互作用(圖4),結(jié)合GSEA富集的細胞周期與DNA復制相關(guān)通路結(jié)果篩選出CDK1和BUB1兩個關(guān)鍵蛋白。應(yīng)用Spearman相關(guān)性分析顯示胰腺癌組織CENP-A與CDK1、BUB1呈顯著相關(guān)性(r值分別為0.861、0.825,P值均<0.001,圖5)。
著絲粒是真核生物細胞在進行有絲分裂和減數(shù)分裂時染色體分離的調(diào)控裝置,由DNA和蛋白質(zhì)組成。CENP-A作為著絲點的標志性蛋白因子,在染色體精確分離過程中發(fā)揮著關(guān)鍵作用[18]。CENP-A功能失常將導致細胞分裂過程中發(fā)生染色體分離異常。在DNA復制過程中,染色質(zhì)可通過回收修飾舊的組蛋白和沉積新的組蛋白而重新組裝[19-20]。Nye等[21]研究發(fā)現(xiàn),在腫瘤細胞中CENP-A的異常定位可以募集著絲粒組件,并與G1期的有絲分裂缺陷和DNA損傷相關(guān)。Takada等[22]的研究結(jié)果揭示了通過CENP-A介導的著絲粒功能障礙,被激活的細胞周期蛋白E1/CDK2促進細胞染色體不穩(wěn)定性和腫瘤的進展。
注:CENP-A為著絲粒蛋白A
圖3 CENP-A基因高表達相關(guān)基因集的富集 3A:富集細胞周期基因集;3B:富集DNA復制基因集
注:CENP-A為著絲粒蛋白A;CDK1為周期蛋白依賴性激酶1;BUB1為紡錘體檢測蛋白1
圖4 CENP-A的PPI網(wǎng)絡(luò)
注:CENP-A為著絲粒蛋白A;CDK1為周期蛋白依賴性激酶1;BUB1為紡錘體檢測蛋白1
圖5 CENP-A與CDK1(5A)及BUB1(5B)的相關(guān)性分析
近年來研究發(fā)現(xiàn),CENP-A在多種惡性腫瘤中過表達,其過表達與腫瘤的發(fā)生、發(fā)展、侵襲、轉(zhuǎn)移及預(yù)后等密切相關(guān)[12]。最近一項基于生物信息學的研究顯示CENP-A在淋巴瘤、平滑肌肉瘤、膠質(zhì)母細胞瘤、鱗狀上皮細胞肺癌、小細胞肺癌、髓樣乳腺癌、乳腺導管癌、胃腸型腺癌、食管鱗狀細胞癌、肝細胞癌、胰腺癌、口咽癌、結(jié)腸癌、直腸癌、宮頸癌、卵巢漿液性囊腺癌、前列腺癌等20種不同類型的實體癌中表達升高[9]。越來越多的研究表明,CENP-A具有作為腫瘤診斷標志物和預(yù)后指標的潛在應(yīng)用價值[23]。CENP-A是雌激素受體陽性乳腺癌復發(fā)的預(yù)后標志物[24],CENP-A表達增加可能導致乳腺癌患者的無病生存期縮短[25]??谇击[狀細胞癌組織中CENP-A蛋白和mRNA的表達明顯高于正常組織,其表達水平與腫瘤大小、淋巴結(jié)轉(zhuǎn)移有關(guān),可能成為口腔鱗狀細胞癌發(fā)生、發(fā)展的生物標志物[26]。CENP-A在11種主要的人原發(fā)性結(jié)直腸癌組織中均過表達。CENP-A mRNA表達也上調(diào),表明CENP-A的過表達發(fā)生在轉(zhuǎn)錄水平,可能在結(jié)直腸癌的非整倍體形成中起重要作用[27]。
本研究借助GEO數(shù)據(jù)庫CENP-A基因表達譜證實胰腺癌組織CENP-A mRNA表達量較癌旁正常胰腺組織上調(diào),表明CENP-A基因具備作為胰腺癌病理診斷標志物的潛在價值。本研究基于TCGA數(shù)據(jù)庫177例胰腺癌患者的CENP-A mRNA表達譜和臨床數(shù)據(jù)進一步分析CENP-A表達量與胰腺癌臨床病理指標及預(yù)后的相關(guān)性,發(fā)現(xiàn)CENP-A表達水平與腫瘤分期和分級密切相關(guān),與患者生存時間呈負相關(guān),提示CENP-A基因有望成為胰腺癌患者預(yù)后判斷的新型分子標志物,并將有助于胰腺癌患者術(shù)后復發(fā)監(jiān)測策略的完善。借助基因集富集分析發(fā)現(xiàn)CENP-A高表達組顯著富集于細胞周期和DNA復制兩條KEGG通路,進一步結(jié)合與CENP-A相關(guān)蛋白的分析結(jié)果推測,CENP-A可能是通過與之相關(guān)的CDK1和BUB1協(xié)同在胰腺癌組織中發(fā)揮其生物學作用。
雖然本研究為深入探討CENP-A在胰腺癌中的作用提供了線索和依據(jù),但尚未明確CENP-A參與胰腺癌發(fā)生發(fā)展的具體作用機制和途徑,由于腫瘤的發(fā)生發(fā)展過程中存在多基因協(xié)同的復雜調(diào)控作用,因此其在胰腺癌形成過程中發(fā)揮的功能還有待后續(xù)實驗予以進一步闡明及豐富。
利益沖突所有作者均聲明不存在利益沖突