余孝海 李艷玲 郭繼政
(安徽醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院 安徽合肥 230032)
乳腺癌是臨床上較為常見的惡性腫瘤之一[1],對(duì)女性健康構(gòu)成嚴(yán)重威脅,根據(jù)最新的美國(guó)癌癥統(tǒng)計(jì),乳腺癌被估計(jì)為女性中最常見的癌癥,也是癌癥相關(guān)死亡的第二大常見原因。隨著分子生物學(xué)的研究進(jìn)展,乳腺癌靶向藥物及激素治療取得了一些進(jìn)展,但乳腺癌潛在的病因尚未完全了解,需要進(jìn)一步的研究來闡明乳腺癌的發(fā)病機(jī)制。
泛素-4(UBQLN 4)是一個(gè)蛋白質(zhì)編碼基因,與UBQLN 4相關(guān)的疾病包括肌萎縮側(cè)索硬化癥1和腮腺炎,它的相關(guān)途徑包括:內(nèi)質(zhì)網(wǎng)蛋白質(zhì)加工,與此基因相關(guān)的基因本體(GO)注釋包括相同蛋白結(jié)合和損傷DNA結(jié)合[2],既往研究UBQLN 4通過抑制dna末端切除促進(jìn)非同源端連接[3]。最近研究表明,UBQLN 4在肝癌組織中高表達(dá),并且UBQLN 4的過表達(dá)與肝癌患者的整體生存率和無病生存率有關(guān)[4]。Ron D Jachimowicz等人發(fā)現(xiàn)UBQLN 4在侵襲性腫瘤中存在過度表達(dá)[5],到目前為止,沒有研究提到UBQLN4在乳腺癌中的作用,UBQLN4在乳腺癌中的作用仍不清楚。考慮到這一認(rèn)識(shí)空白,該研究旨在探討UBQLN4在多個(gè)數(shù)據(jù)庫中表達(dá)及其對(duì)乳腺癌的作用。
1.1數(shù)據(jù)庫選擇
分別對(duì)腫瘤芯片GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/),Oncomine數(shù)據(jù)庫(https://www.oncomine.org/),生存分析數(shù)據(jù)庫Kaplan-Meier Plotter(http://kmplot.com/analysis/)和蛋白-蛋白相互作用數(shù)據(jù)庫String(https://stringdb.org/cgi/input.pl)進(jìn)行乳腺癌UBQLN4基因表達(dá)情況數(shù)據(jù)挖掘。
1.2 GEO、Oncomine、Kaplan-Meier Plotter和String 數(shù)據(jù)平臺(tái)分析
首先,在GEO數(shù)據(jù)庫中下載3個(gè)數(shù)據(jù)集(GSE4107、GSE5563和GSE27447),GSE4107包含12個(gè)乳腺癌樣本,10個(gè)非癌組織樣本;GSE5563包含10個(gè)乳腺癌樣本,9個(gè)非癌組織樣本;GSE27447包含5個(gè)乳腺癌樣本,14個(gè)非癌組織樣本。其次,在Oncomine數(shù)據(jù)庫中對(duì)UBQLN4mRNA在乳腺癌組織與對(duì)應(yīng)的正常乳腺組織中的差異表達(dá)進(jìn)行分析,數(shù)據(jù)篩選條件為:①腫瘤類型:乳腺癌;②組織對(duì)比:乳腺癌VS正常乳腺組織;③數(shù)據(jù)類型,mRNA;④顯著性:p=1E-4;⑤差異表達(dá)級(jí)別:大于2倍;⑥基因排序:前10%。最后利用Kaplan-Meier Plotter數(shù)據(jù)庫挖掘UBQLN4mRNA表達(dá)的芯片數(shù)據(jù),并繪制UBQLN4高低表達(dá)生存曲線,分析UBQLN4基因與乳腺癌患者的預(yù)后關(guān)系。應(yīng)用蛋白-蛋白相互作用數(shù)據(jù)庫String分析UBQLN4相互作用蛋白網(wǎng)絡(luò),探討其可能的生物學(xué)功能。
1.3統(tǒng)計(jì)學(xué)處理
采用SPSS 22.0統(tǒng)計(jì)學(xué)軟件。計(jì)量資料用均數(shù)±標(biāo)準(zhǔn)差(x±s)表示。組間比較運(yùn)用t檢驗(yàn),計(jì)數(shù)用率表示,應(yīng)用chi-Square;生存分采用Log-rank檢驗(yàn),以p<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1乳腺癌中DEGS的鑒定
芯片結(jié)果標(biāo)準(zhǔn)化后,DEGS(GSE4107,GSE5563和GSE27447)鑒定。在mRNA表達(dá)譜集中選擇DGS,其變化幅度大于2,p<0.01。3個(gè)數(shù)據(jù)集之間的重疊包含10個(gè)基因,分別是PLA2G16、POU2AF1、SLC1A1、CAP2、CUEDC1、RRAS、RALGPS2、UBQLN4、TWF1、ENPP1,有7個(gè)高表達(dá)和3個(gè)低表達(dá)組成它們分別位于乳腺癌組織和非癌組織之間,如圖1所示。
圖1 維恩圖GSE4107,GSE5563和GSE27447,3個(gè)數(shù)據(jù)集顯示10個(gè)基因重疊。
2.2 UBQLN4基因于腫瘤表達(dá)
檢索Oncomine數(shù)據(jù)庫發(fā)現(xiàn),在乳腺癌中有3個(gè)數(shù)據(jù)集均顯示UBQLN4基因高表達(dá),如圖2所示。在導(dǎo)管內(nèi)篩狀乳腺腺癌、浸潤(rùn)性乳腺癌基質(zhì)、浸潤(rùn)性乳腺癌、浸潤(rùn)性導(dǎo)管和小葉癌、浸潤(rùn)性小葉性乳腺癌、男性乳腺癌、混合小葉和導(dǎo)管乳腺癌和正常對(duì)照組織中UBQLN4基因也是高表達(dá),見圖3。
圖2 乳腺癌中有3個(gè)數(shù)據(jù)集均顯示UBQLN4基因高表達(dá)
2.3 UBQLN4基因共表達(dá)聚類分析
Oncomine數(shù)據(jù)庫中對(duì)UBQLN4mRNA在乳腺癌中共表達(dá)基因進(jìn)行聚類分析顯示,UBQLN4mRNA與CDH11、LUM、DACT1、FNDC1等92個(gè)基因存在共表達(dá),提示上述基因在生物學(xué)功能上可能具有相關(guān)性,見圖4。
圖4 UBQLN4在乳腺癌組織中與其他基因共表達(dá)聚類分析
2.4 UBQLN4基因表達(dá)與乳腺癌預(yù)后的關(guān)系
檢索Kaplan-Meier Plotter數(shù)據(jù)庫,發(fā)現(xiàn)關(guān)于UBQLN4基因表達(dá)水平與乳腺癌患者預(yù)后相關(guān)的表達(dá)譜芯片數(shù)據(jù)有一項(xiàng)根據(jù)基因表達(dá)水平,中位數(shù)分為高表達(dá)組和低表達(dá)組,并繪制生存曲線。在導(dǎo)管乳腺癌及對(duì)照乳腺組織中表達(dá)中位生存期分別為553d和517d,差異比較無統(tǒng)計(jì)學(xué)意義(HR=1.132,95%CI:0.598-2.142,p=0.7037)。UBQLN4mRNA在浸潤(rùn)性導(dǎo)管乳腺癌及對(duì)照乳腺組織中表達(dá)中位生存期分別為1329天和1466天,差異無統(tǒng)計(jì)學(xué)意義(HR=0.6711,95%CI:0.3061-1.471,p=0.2866),見圖5。
圖5 高低表達(dá)組中位生存期生存曲線
2.5 UBQLN4相互作用蛋白網(wǎng)絡(luò)
應(yīng)用String數(shù)據(jù)庫富集基因相互作用的可能相關(guān)蛋白,富集條件為p=2E-15。節(jié)點(diǎn)共有16個(gè),其中蛋白網(wǎng)絡(luò)與基因相互作用蛋白有5個(gè),作用評(píng)分均大于0.904,5個(gè)關(guān)聯(lián)蛋白均屬于蛋白編碼基因,是核糖體結(jié)構(gòu)成份。且SSR2蛋白也被發(fā)現(xiàn)了在各種癌癥中存在高表達(dá),見圖6。
圖6 UBQLN4基于String數(shù)據(jù)庫的蛋白-蛋白Y相互作用網(wǎng)絡(luò)
2.6在乳腺癌和結(jié)腸癌中,紫杉醇對(duì)UBQLN4較為敏感
應(yīng)用Oncomine數(shù)據(jù)庫分析紫杉醇藥物后,乳腺癌(BC)、結(jié)腸癌(CC)、胃癌(GC)、胰腺癌(PC)中UBQLN4的表達(dá)量,在乳腺癌和結(jié)腸癌中表達(dá)量較胃癌和胰腺癌偏低。所以,在乳腺癌和結(jié)腸癌中,紫杉醇對(duì)UBQLN4較為敏感。見圖7。
圖7 UBQLN4基于Oncomine數(shù)據(jù)庫的紫杉醇敏感性
乳腺癌是中老年女性最常見的惡性腫瘤之一,據(jù)2014年美國(guó)癌癥協(xié)會(huì)統(tǒng)計(jì)女性新發(fā)乳腺癌患者病死率已居惡性腫瘤病死率的第二位[6]。有學(xué)者[7]研究發(fā)現(xiàn),中老年女性乳腺癌的惡性程度與年輕女性乳腺癌沒有很明顯的差別。當(dāng)前乳腺癌影像的研究主要集中在鉬靶、超聲、X射線和組織病理圖像分析[8-10]UBQLN4是泛素-蛋白酶體系統(tǒng)的一員,通常在許多腫瘤細(xì)胞中被上調(diào),它的過度表達(dá)與各種癌癥疾病的不良結(jié)果有關(guān)[4]。然而,UBQLN4在乳腺癌發(fā)生發(fā)展中的作用機(jī)制尚未闡明,大多數(shù)跨膜蛋白通過信號(hào)序列介導(dǎo)的共翻譯過程整合到內(nèi)質(zhì)網(wǎng)中。
該研究綜合利用腫瘤芯片數(shù)據(jù)庫腫瘤預(yù)后數(shù)據(jù)庫和蛋白相互作用數(shù)據(jù)庫,基因表達(dá)與乳腺癌的關(guān)系進(jìn)行了分析研究,認(rèn)為UBQLN4在乳腺癌組織中高表達(dá)。BQLN4mRNA在乳腺癌中高表達(dá),其蛋白與編碼蛋白家族可能共同參與了核糖體結(jié)構(gòu)的穩(wěn)定性,但UBQLN4mRNA的高低表達(dá)與乳腺癌患者的預(yù)后無關(guān);在乳腺癌和結(jié)腸癌中,紫杉醇對(duì)UBQLN4較為敏感。上述結(jié)論在基因芯片數(shù)據(jù)中得到很好的支持,為其在臨床的應(yīng)用包括靶向藥物研發(fā)腫瘤標(biāo)志物篩選選題共有提供了有力證據(jù)[5]。
該研究也有一定的局限性。首先,UBQLN4對(duì)乳腺癌的鑒別能力是中等的;其次,UBQLN4對(duì)乳腺癌中的作用有待于大規(guī)模臨床實(shí)踐的證實(shí);第三,UBQLN4在乳腺癌中的分子機(jī)制需要進(jìn)一步研究。