陳凱銳,童華生,周泉,孫朝暉*
1南部戰(zhàn)區(qū)總醫(yī)院檢驗(yàn)科,廣州 510010;2南部戰(zhàn)區(qū)總醫(yī)院急診科,廣州 510010
肺癌是全世界癌癥相關(guān)死亡人數(shù)最多的癌癥,根據(jù)2018年的全球癌癥統(tǒng)計(jì)數(shù)據(jù),肺癌的病死人數(shù)占癌癥總死亡人數(shù)的18.4%[1]。肺癌中約有85%被歸類為非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC),并可細(xì)分為鱗狀細(xì)胞癌、肺腺癌及大細(xì)胞癌[2-3]。肺腺癌是最常見的肺癌亞類,占NSCLC的65%,占所有肺癌的40%以上[4-5]。2015年,中國(guó)新發(fā)肺癌約有78.7萬(wàn)例[6]。肺癌的發(fā)生發(fā)展是一個(gè)復(fù)雜、多步驟的過程,與各種基因突變、細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)通路激活及異常新生血管形成密切相關(guān),但其分子機(jī)制仍不完全清楚[4]。通過篩選與腫瘤相關(guān)的基因網(wǎng)絡(luò),有可能確定肺腺癌新的藥物靶標(biāo)并發(fā)現(xiàn)用于治療及診斷的生物標(biāo)志物。糖蛋白發(fā)揮著多種生物學(xué)功能,如細(xì)胞間信息傳遞、細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)及維持蛋白質(zhì)穩(wěn)定性[7]。黏蛋白型或N-乙?;?D-半乳糖胺(GalNAc)型O-糖基化是由一大類多肽GalNAc-轉(zhuǎn)移酶(GALNT,也稱為GalNAc-T)同工酶催化的O-蛋白質(zhì)的糖基化。N-乙酰氨基半乳糖轉(zhuǎn)移酶2(GALNT2)是GALNT家族的第2個(gè)成員[8],廣泛分布于腎臟、胰腺、胃、腸等多種器官中[9]。
全基因組關(guān)聯(lián)研究(GWAS)確定GALNT2參與了人類脂蛋白的代謝調(diào)控[10],其催化底物包括脂蛋白脂肪酶抑制劑類血管生成素3(ANGPTL3)、載脂蛋白C-Ⅲ(apoC-Ⅲ)[11]及磷脂轉(zhuǎn)移蛋白(PLTP)等[12]。后續(xù)研究顯示,該基因在多種惡性腫瘤,如胃癌、膠質(zhì)瘤、肝細(xì)胞癌及口腔鱗狀細(xì)胞癌中表達(dá)失調(diào)[13-15]。然而,GALNT2在肺癌尤其是肺腺癌發(fā)生、發(fā)展中的作用仍不清楚。本研究基于Oncomine數(shù)據(jù)庫(kù)、UALCAN數(shù)據(jù)庫(kù)、cBioportal數(shù)據(jù)庫(kù)及String數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘,進(jìn)而分析GALNT2基因在肺腺癌中的表達(dá)情況及其預(yù)后意義,旨在為后續(xù)研究GALNT2基因在肺腺癌發(fā)生發(fā)展中的作用奠定基礎(chǔ)。
1.1 利用Oncomine數(shù)據(jù)庫(kù)分析GALNT2在肺腺癌中的表達(dá) 收集分析Oncomine數(shù)據(jù)庫(kù)腫瘤樣本的基因表達(dá)譜芯片數(shù)據(jù),同時(shí)提供轉(zhuǎn)錄組數(shù)據(jù),篩選條件如下。(1)Gene:GALNT2;(2)Analysis type:cancervs. normal analysis;(3)Cancer type:lung cancer;(4)Date type:mRNA and DNA;(5)Sample type:clinical specimen;(6)臨界值設(shè)定條件(P<0.05;gene rank:top 10%)。利用Oncomine數(shù)據(jù)庫(kù)對(duì)來自(The Cancer Genome Atlas,TCGA)和Gene Expression Omnibus(GEO)中評(píng)估了GALNT2轉(zhuǎn)錄水平的多個(gè)惡性腫瘤研究進(jìn)行分析。將所有結(jié)果匯總后進(jìn)行綜合分析比較。
1.2 利用UALCAN數(shù)據(jù)庫(kù)分析GALNT2表達(dá)量與臨床特征及預(yù)后的關(guān)系 通過基于TCGA搭建的數(shù)據(jù)可視化平臺(tái)UALCAN,在UALCAN數(shù)據(jù)庫(kù)中的TCGA及CPTAC(Clinical Proteomic Tumor Analysis Consortium)數(shù)據(jù)集中檢索GALNT2,于數(shù)據(jù)庫(kù)選項(xiàng)中選擇肺腺癌。分別對(duì)年齡、性別、TNM分期、淋巴結(jié)轉(zhuǎn)移等臨床特征分組及預(yù)后情況進(jìn)行分析。
1.3 利用cBiopor tal工具分析TCG A數(shù)據(jù)庫(kù)中G A L N T 2 基因在肺腺癌中的突變情況 利用cBioporta在線工具,在數(shù)據(jù)庫(kù)類型中選擇“TCGA databa se”,腫瘤類型選擇肺腺癌,基因選擇“GALNT2”,分析GALNT2在肺腺癌中的突變情況。應(yīng)用survival選項(xiàng)分析GALNT2變異與患者生存時(shí)間的Kaplan-Meier曲線。
1.4 利用String數(shù)據(jù)庫(kù)構(gòu)建GALNT2蛋白相互作用網(wǎng)絡(luò) String用于構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò),可生成有關(guān)基因功能的假設(shè),分析基因列表并進(jìn)行功能分析。本研究中設(shè)置蛋白相互作用網(wǎng)絡(luò)來源為:物理相互作用、基因共表達(dá)、基因共定位、基因富集分析及網(wǎng)站預(yù)測(cè)。
1.5 統(tǒng)計(jì)學(xué)處理 采用SPSS 26.0軟件進(jìn)行統(tǒng)計(jì)分析。正常組織與肺腺癌組織中GALNT2基因表達(dá)的差異采用兩獨(dú)立樣本非參數(shù)Mann-WhitneyU檢驗(yàn),定量資料的多組間兩兩比較采用P值BH校正法分析。GALNT2表達(dá)與患者預(yù)后的關(guān)系采用Kaplan-Meier模型進(jìn)行生存分析。在校正了相應(yīng)的協(xié)變量后,采用多因素Cox比例風(fēng)險(xiǎn)回歸模型分析GALNT2表達(dá)對(duì)總體生存率的影響。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 GALNT2在肺腺癌中的表達(dá)情況 Oncomine 4.5數(shù)據(jù)庫(kù)數(shù)據(jù)中共有420項(xiàng)腫瘤組織與正常組織的比較研究,其中GALNT2在腫瘤中高表達(dá)的研究有58項(xiàng),低表達(dá)的研究有13項(xiàng);肺癌研究共33項(xiàng),其中11項(xiàng)研究顯示GLANT2在肺癌組織中的表達(dá)明顯高于肺部正常組織,而無一項(xiàng)研究顯示GALNT2在肺癌中的表達(dá)低于正常組織(表達(dá)水平變化>1.5倍,P<0.05,Gene rank:Top 10%)(圖1A)。肺腺癌中GALNT2表達(dá)情況分析結(jié)果顯示,共有9項(xiàng)研究比較了肺腺癌與正常組織中GALNT2的表達(dá)差異,其中8項(xiàng)研究數(shù)據(jù)表明,GALNT2在肺腺癌組織中呈高表達(dá)(圖1B)。肺腺癌組織中GALNT2的mRNA表達(dá)及DNA拷貝數(shù)變異(CNV)明顯高于正常組織(P<0.01,圖2)。
圖1 Oncomine數(shù)據(jù)庫(kù)中GALNT2基因在所有主要腫瘤(A)及肺腺癌(B)中與相應(yīng)正常組織的差異表達(dá)情況Fig.1 Differential expression of GALNT2 in all major cancers (A) and lung adenocarcinomas (B) and their corresponding normal tissues in Oncomine database
圖2 Oncomine數(shù)據(jù)庫(kù)中GALNT2基因在肺腺癌與正常組織中的差異表達(dá)情況Fig.2 Differential expression of GALNT2 in lung adenocarcinoma and corresponding normal tissues in Oncomine database
2.2 GALNT2表達(dá)量與肺腺癌患者臨床特征的關(guān)系
利用UALCAN數(shù)據(jù)庫(kù)對(duì)TCGA中的574個(gè)肺腺癌樣本的多種臨床病理特征進(jìn)行亞組分析,結(jié)果顯示,肺腺癌中GALNT2 mRNA的表達(dá)水平明顯高于正常組織(P<0.001),但其表達(dá)水平與患者臨床病理特征如腫瘤分期、淋巴結(jié)轉(zhuǎn)移、性別、吸煙史及TP53突變均無明顯相關(guān)性(圖3)。利用UALCAN數(shù)據(jù)庫(kù)進(jìn)一步分析GALNT2蛋白表達(dá)水平與臨床特征的關(guān)系,結(jié)果顯示,GALNT2蛋白表達(dá)水平在肺腺癌組織中明顯升高(P<0.001),但與上述臨床特征仍無相關(guān)性(圖4)。
圖3 TCGA數(shù)據(jù)庫(kù)中根據(jù)不同臨床特征分組的GALNT2 mRNA表達(dá)水平(UALCAN)Fig.3 Expression levels of GALNT2 mRNA in TCGA database grouped according to different clinical characteristics (UALCAN)
圖4 CPTAC數(shù)據(jù)庫(kù)中根據(jù)不同臨床特征分組的GALNT2 蛋白表達(dá)水平(UALCAN)Fig.4 Expression levels of GALNT2 protein in CPTAC database grouped according to different clinical characteristics (UALCAN)
2.3 GALNT2表達(dá)水平與肺腺癌患者預(yù)后的關(guān)系
由于GALNT2在肺腺癌中表達(dá)水平明顯升高,為進(jìn)一步明確GALNT2表達(dá)與肺腺癌預(yù)后的關(guān)系,從KM-plotter數(shù)據(jù)庫(kù)中收集肺腺癌的臨床病理參數(shù),按GALNT2的表達(dá)水平分為高表達(dá)組與低表達(dá)組并進(jìn)行Kaplan-Meier生存分析。結(jié)果顯示,GALNT2表達(dá)水平與肺腺癌患者的總生存時(shí)間(o v e r a l l survival,OS)及首次進(jìn)展時(shí)間(fires progression,F(xiàn)P)均明顯相關(guān)(P<0.001,圖5)。
圖5 GALNT2表達(dá)水平與肺腺癌患者預(yù)后的關(guān)系(KM-plotter)Fig.5 Relationship between GALNT2 expression status and the prognosis of lung adenocarcinoma (KM-plotter)
本研究通過多因素Cox比例風(fēng)險(xiǎn)模型進(jìn)一步分析GALNT2表達(dá)水平與肺腺癌總生存時(shí)間的關(guān)系,并對(duì)患者的年齡、臨床分期、T分期、M分期和N分期進(jìn)行了協(xié)變量校正,結(jié)果顯示,GALNT2的表達(dá)狀態(tài)(分類變量)與總生存時(shí)間明顯相關(guān)(HR=1.48,95%CI 1.098~1.997,P=0.01)。
2.4 GALNT2基因在肺腺癌中的變異情況 采用cBioportal網(wǎng)站對(duì)TCGA中503例資料完整的肺腺癌樣本進(jìn)行分析,如圖6A所示,其中共有52例樣本發(fā)生GALNT2基因變異,變異率約為10%,這些變異包括擴(kuò)增15例(3%),mRNA上調(diào)31例(6.1%),突變9例(1.8%)。GALNT2基因共有10個(gè)突變位點(diǎn),均為Missense突變(圖6B)。比較GALNT2基因變異組與未變異組患者的總生存率,結(jié)果表明,GALNT2發(fā)生變異的患者總生存時(shí)間較短,同樣GALNT2高表達(dá)組的生存率明顯降低(圖6C、D)。然而基因擴(kuò)增的15例樣本中,僅2例出現(xiàn)了mRNA高表達(dá)現(xiàn)象(圖6A),表明GALNT2在轉(zhuǎn)錄層面的表達(dá)異常并非由基因組層面的擴(kuò)增變異引起。
圖6 肺腺癌中GALNT2基因變異與預(yù)后的關(guān)系(cBioportal)Fig.6 Relationship between GALNT2 gene alteration and the prognosis in lung adenocarcinoma (cBioportal)
2.5 與GALNT2蛋白相互作用的蛋白網(wǎng)絡(luò) 利用String構(gòu)建GALNT2蛋白相互作用網(wǎng)絡(luò),PPI富集P值(PPI enrichmentP-value)<0.001,其中節(jié)點(diǎn)數(shù)目為26個(gè),主要包括GALNT1、RAB6A、RAB6B、DYNC1H1、DYNC1LI1、DCTNs、CAPZAs及多種黏蛋白等,主要參與的生物學(xué)過程有蛋白質(zhì)絲氨酸/蘇氨酸O型糖基化、細(xì)胞器微管運(yùn)輸及白介素-17信號(hào)通路等(圖7)。
圖7 GALNT2在肺腺癌中的蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(String)Fig.7 The protein-protein interaction network of GALNT2 in lung adenocarcinoma (String)
肺腺癌是全球最常見的惡性腫瘤之一[1,16]。早期發(fā)現(xiàn)的肺腺癌患者經(jīng)過手術(shù)切除等治療后,預(yù)后較好,但大多數(shù)肺腺癌患者確診時(shí)已處于中晚期,且多發(fā)生了腫瘤轉(zhuǎn)移。雖然目前已經(jīng)開發(fā)出諸如靶向間變性淋巴瘤激酶(ALK)、表皮生長(zhǎng)因子受體-酪氨酸激酶抑制劑(EGFR-TKI)等藥物治療攜帶此類基因突變的肺腺癌患者,但是相當(dāng)一部分患者并未攜帶靶向藥物基因突變,或?qū)Π邢蛑委煯a(chǎn)生耐藥,預(yù)后較差[17-18]。同時(shí),肺腺癌發(fā)生發(fā)展的分子機(jī)制仍不完全明了,需要進(jìn)一步研究。相關(guān)研究表明,肺腺癌的發(fā)生和發(fā)展是受自身遺傳及環(huán)境因素共同影響的復(fù)雜過程,在病變過程中,有多種基因的參與及調(diào)控[19]。因此,進(jìn)一步研究肺腺癌發(fā)病的分子機(jī)制及其相應(yīng)的治療靶點(diǎn)及檢測(cè)標(biāo)志物,是目前亟需解決的問題。
糖基化是蛋白質(zhì)最常見的翻譯后修飾之一。黏蛋白型O-糖基化(Mucin-type O-糖基化)為O-糖基化的最常見類型。Mucin-type O-糖基化的起始步驟由多肽N-乙酰氨基半乳糖轉(zhuǎn)移酶催化,將GalNAc連接至糖蛋白的絲/蘇氨酸殘基上[20]。此修飾過程發(fā)生于高爾基復(fù)合體,受GALNT家族成員的調(diào)控[21]。大量研究表明,異常調(diào)節(jié)的Mucin-type O-糖基化蛋白在細(xì)胞增殖、分化、凋亡、遷移、侵襲及黏附等過程中發(fā)揮了重要的調(diào)節(jié)作用,進(jìn)而影響腫瘤的發(fā)生發(fā)展及復(fù)發(fā)轉(zhuǎn)移情況[22-24],且已有研究證實(shí),GALNTs的異常表達(dá)與多種惡性腫瘤的進(jìn)展程度及預(yù)后明顯相關(guān)[25-26]。
GALNT2是N-乙酰氨基半乳糖轉(zhuǎn)移酶家族的第2個(gè)成員。近年來,多個(gè)GWAS研究發(fā)現(xiàn)GALNT2基因多態(tài)性與高密度脂蛋白膽固醇(HDLC)及三酰甘油(TG)水平存在相關(guān)性,且為2型糖尿病及心血管疾病的潛在調(diào)控因子[10,27]。也有研究發(fā)現(xiàn),GALNT2基因啟動(dòng)子的甲基化與急性腦梗死密切相關(guān)[28]。GALNT2可能通過調(diào)節(jié)靶蛋白如APOC3、低密度脂蛋白受體及極低密度脂蛋白的O-糖基化,影響了機(jī)體內(nèi)脂質(zhì)的代謝調(diào)節(jié)功能。還有研究發(fā)現(xiàn),GALNT2還參與了胰島素信號(hào)與脂肪形成過程[29]。此外,GALNT2在惡性腫瘤中的作用研究同樣值得關(guān)注。GALNT2可通過降低胃癌患者EGFR、MET的磷酸化修飾活性抑制腫瘤的生長(zhǎng)及轉(zhuǎn)移[15]。肝細(xì)胞癌中GALNT2的mRNA表達(dá)下調(diào),且與腫瘤的血管浸潤(rùn)及復(fù)發(fā)相關(guān);在肝細(xì)胞癌細(xì)胞系中過表達(dá)GALNT2可抑制EGF誘導(dǎo)的腫瘤細(xì)胞生長(zhǎng)、遷移及侵襲,原因是GALNT2催化了EGFR的O-糖基化修飾,從而改變了EGF與EGFR的結(jié)合反應(yīng)[30]。然而在其他一些腫瘤中,GALNT2具有相反的生物學(xué)功能,即能夠促進(jìn)腫瘤的發(fā)生發(fā)展。在神經(jīng)膠質(zhì)瘤中GALNT2表達(dá)水平升高,且與預(yù)后不良及腫瘤分級(jí)升高有關(guān)[13];口腔鱗狀細(xì)胞癌中GALNT2呈過表達(dá),且同樣與高侵襲性及高腫瘤級(jí)別相關(guān),可通過修飾EFGR的O-糖基化調(diào)節(jié)受體活性,增強(qiáng)腫瘤細(xì)胞的侵襲能力[14]。有研究通過WGCNA和LASSO約束的Cox回歸模型進(jìn)行分析,結(jié)果顯示GALNT2可作為肺癌風(fēng)險(xiǎn)預(yù)測(cè)模型中的關(guān)鍵基因[31]。綜上所述,GALNT2在多種腫瘤中表達(dá)異常,功能各不相同,可作為潛在的腫瘤診斷標(biāo)志物,但是在肺癌中GALNT2的研究十分有限。
本研究首先利用Oncomine數(shù)據(jù)庫(kù)驗(yàn)證GALNT2是否在肺腺癌中有表達(dá)量和拷貝數(shù)的變化。Oncomine數(shù)據(jù)庫(kù)是目前世界上最大的基因芯片數(shù)據(jù)平臺(tái),主要針對(duì)大多數(shù)癌癥類型和相應(yīng)的正常組織及各種癌癥亞型進(jìn)行差異表達(dá)分析。利用Oncomine數(shù)據(jù)庫(kù)中多組數(shù)據(jù)集進(jìn)行分析,可以有效避免由于樣本量和取樣問題導(dǎo)致的誤差,增加結(jié)論的可信度。結(jié)果顯示,在多組肺腺癌的研究中,GALNT2在腫瘤組均有表達(dá)量上調(diào)和拷貝數(shù)變異,可能在肺腺癌的進(jìn)展中發(fā)揮重要作用。隨后的研究選取了TCGA作為數(shù)據(jù)來源,TCGA數(shù)據(jù)庫(kù)是最大的癌癥基因信息數(shù)據(jù)庫(kù),為腫瘤研究提供了大量的基因組數(shù)據(jù)及臨床相關(guān)數(shù)據(jù),可以使研究者進(jìn)行進(jìn)一步的數(shù)據(jù)挖掘和驗(yàn)證。本研究利用UALCAN和cBioportal平臺(tái)對(duì)TCGA數(shù)據(jù)進(jìn)行了可視化處理,結(jié)果發(fā)現(xiàn),GALNT2在肺腺癌中呈高表達(dá),但與腫瘤惡性程度及淋巴結(jié)轉(zhuǎn)移等臨床特征無相關(guān)性。在基因組層面,GALNT2基因變異率(10%)較高,但在基因擴(kuò)增的15例樣本中,僅2例出現(xiàn)了mRNA高表達(dá),說明GALNT2在轉(zhuǎn)錄層面的表達(dá)異常并非由基因組層面的擴(kuò)增變異引起的,其表達(dá)異常升高的原因仍需進(jìn)一步探究。此外,通過生存分析發(fā)現(xiàn),與GALNT2低表達(dá)組相比,GALNT2高表達(dá)組肺腺癌患者的OS和FP較短,差異有統(tǒng)計(jì)學(xué)意義,表明GALNT2的表達(dá)水平可以一定程度上預(yù)測(cè)肺腺癌患者的預(yù)后情況,且其高表達(dá)是潛在的危險(xiǎn)因素,同時(shí)通過多因素Cox比例風(fēng)險(xiǎn)模型進(jìn)行協(xié)變量校正后分析GALNT2表達(dá)水平與肺腺癌總生存時(shí)間的關(guān)系發(fā)現(xiàn),GALNT2的表達(dá)水平增高是肺腺癌患者預(yù)后不佳的危險(xiǎn)因素。此外,本研究根據(jù)GALNT2在肺腺癌中的相互作用蛋白分析了其可能影響的信號(hào)通路及生物學(xué)過程,結(jié)果發(fā)現(xiàn),GALNT2調(diào)控網(wǎng)絡(luò)參與的生物學(xué)過程有蛋白質(zhì)絲氨酸/蘇氨酸O型糖基化、細(xì)胞器微管運(yùn)輸及白介素-17信號(hào)通路等。多項(xiàng)研究結(jié)果表明,GALNT2可通過糖基化EGFR調(diào)控下游信號(hào)通路[13-15],但其在肺腺癌中的具體分子機(jī)制仍需進(jìn)一步驗(yàn)證。
綜上所述,本研究通過對(duì)多個(gè)數(shù)據(jù)庫(kù)中肺腺癌的數(shù)據(jù)進(jìn)行深入挖掘,發(fā)現(xiàn)GALNT2基因在肺腺癌組織中高表達(dá),且與肺腺癌的預(yù)后不良相關(guān),這為進(jìn)一步研究GALNT2基因在肺腺癌中的作用和分子機(jī)制提供了依據(jù)和線索,為肺腺癌的臨床基因治療及新型抗腫瘤藥物的研發(fā)提供了理論基礎(chǔ)。