陳屹沖,馮浩杰,梅學(xué)鵬,王晶晶,周瀛,樊海寧
(青海大學(xué)附屬醫(yī)院肝膽胰外科,青海 西寧810000)
乳腺癌是全球女性所患最多的癌癥之一,根據(jù)世界癌癥研究基金會的報告,每年約200萬例新增病例[1]。其是女性所患癌癥死亡的主要原因,死亡率為11.6%,近年來略有上升0.3%[2],而在我國的乳腺癌患者中,約有70%的病理分型為浸潤性導(dǎo)管癌,其余類型的乳腺癌占比不超過5%[3]。
緊密連接是細(xì)胞三種特殊連接的一種,其不僅可以阻止細(xì)胞旁液的滲漏,還在保持細(xì)胞完整性上起關(guān)鍵作用[4]。據(jù)相關(guān)文獻(xiàn)報道,腫瘤的侵襲和轉(zhuǎn)移和緊密連接有著很密切的關(guān)系[5-6]。CLDN是一種跨膜蛋白,其在緊密連接中起關(guān)鍵作用,由27個成員組成,在細(xì)胞的極性、粘附和腺體分化中有著重要地位[7]。CLDN10是CLDN家族中的一員,是一種內(nèi)皮細(xì)胞特異性的緊密連接成分。
微陣列技術(shù)是一種可以同時確定數(shù)千個基因表達(dá)的準(zhǔn)確而全面的技術(shù),在各個領(lǐng)域中已經(jīng)有了廣泛的應(yīng)用,例如在癌癥中等[8]。在此我們?yōu)榱岁U明癌組織中常見或不同癌組織間的基因表達(dá)變化,我們分析了從GEO下載的乳腺癌患者樣本,對CLDN10進(jìn)行了表達(dá)、相關(guān)性及生存分析,發(fā)現(xiàn)CLDN10是一種潛在的乳腺癌治療靶點(diǎn)。
TCGA乳腺癌數(shù)據(jù)是從癌癥基因組學(xué)生物門戶網(wǎng)站(http://www.cbioportal.org/)下載的。TCGA數(shù)據(jù)集主要包括臨床特征、體細(xì)胞突變、生存狀態(tài)、DNA甲基化和mRNA表達(dá)等信息。我們還從GEO(https://www.ncbi.nlm.nih.gov/)中獲得了獨(dú)立的微陣列數(shù)據(jù)集(GSE9014和GSE3971),這兩個數(shù)據(jù)集主要包括了乳腺癌中mRNA表達(dá)信息。用Illumina HiSeq平臺檢測GEO數(shù)據(jù)集的基因表達(dá),并轉(zhuǎn)化為log2量表。
除此之外,我們還使用了Kaplan-Meier Plotter數(shù)據(jù)庫(http://kmplot.com),該數(shù)據(jù)庫在許多癌癥中,例如乳腺癌、卵巢癌、胃癌、肝癌、肺癌等可以分析相關(guān)基因的生存率。
使用t檢驗(yàn)分析正常組織和乳腺癌組織中CLDN10的表達(dá);采用Pearson相關(guān)分析比較CLDN10與MYC或PTPRO之間的線性關(guān)系;用Kaplan-Meier分析估計兩組的生存曲線,并用對數(shù)秩檢驗(yàn)(Mantel-Cox)進(jìn)行比較。所有統(tǒng)計圖表均由GraphPad Prism(8.3.0版)完成。R軟件用來將TCGA數(shù)據(jù)分為兩組。所有P值均為雙側(cè)。P值小于0.05被認(rèn)為具有統(tǒng)計學(xué)意義。
本研究中,為了比較乳腺癌樣本中CLDN10的表達(dá),從GEO下載了乳腺癌的原始文件GSE9014 Series Matrix.txt。如圖1A所示,我們可以看出乳腺癌中CLDN10mRNA的表達(dá)顯著高于正常乳腺癌。作為驗(yàn)證,我們還下載了GEO數(shù)據(jù)庫中與GSE9014獨(dú)立的GSE3971數(shù)據(jù),結(jié)果發(fā)現(xiàn)乳腺癌組織中CLDN10明顯升高,這與GSE9014的結(jié)果一致(圖1B)。
圖1 CLDN10在乳腺癌中的表達(dá)情況
圖2 GEO數(shù)據(jù)庫中GSE9014數(shù)據(jù)中MYC在乳腺癌中的表達(dá)情況(P≤0.05)
圖4 CLDN10和MYC的相關(guān)性分析(P≤0.05)
圖5 CLDN10和MYC的相關(guān)性分析(P≤0.05)
圖6 乳腺癌中CLDN10的表達(dá)和生存時間的關(guān)系。A圖來自于Kaplan-Meier Plotter(P≤0.05);B圖的數(shù)據(jù)來自于TCGA(P≤0.05)。
為了說明CLDN10在乳腺癌進(jìn)展中的作用,我們使用GEO數(shù)據(jù)庫對CLDN10和MYC/FH進(jìn)行了相關(guān)性分析。作為一種原癌基因,MYC已經(jīng)被證實(shí)與乳腺癌患者的生存率有關(guān)。與MYC相反,F(xiàn)H是一種乳腺癌中的抑癌基因。如圖2和3所示,與正常組織相比,乳腺癌中MYC的mRNA表達(dá)顯著增加,而FH的mRNA表達(dá)明顯降低。另外,我們分別分析了CLDN10與MYC和FH的相關(guān)性。如圖4圖5所示,CLDN10的表達(dá)與FH的表達(dá)呈正相關(guān)。另外,我們還發(fā)現(xiàn)CLDN3與MYC的表達(dá)呈負(fù)相關(guān)。
為探討CLDN10表達(dá)是否與患者預(yù)后相關(guān),采用Kaplan-Meier生存分析方法評估高表達(dá)CLDN10和低表達(dá)CLDN10的乳腺癌患者的生存率。圖6A表明,與高表達(dá)組相比,表達(dá)相對較低的CLDN10 mRNA水平預(yù)示著乳腺癌患者有較差的預(yù)后。為了進(jìn)一步驗(yàn)證上述結(jié)論,我們下載了TCGA乳腺癌數(shù)據(jù)集,我們使用了R軟件利用MaxStat方法,根據(jù)CLDN10的表達(dá)將乳腺癌患者分為CLDN10高表達(dá)組和CLDN10低表達(dá)組。結(jié)果如圖6B示,與低表達(dá)組相比,表達(dá)相對較高的CLDN10mRNA水平預(yù)示著乳腺癌患者有較好的預(yù)后。
近年來,高通量技術(shù)的引入使得能夠在一次實(shí)驗(yàn)中同時分析數(shù)千個基因,這可以作為一種很有前途的工具來篩選用于癌癥診斷和預(yù)后的有用的遺傳和表觀遺傳生物標(biāo)記物[9]。微陣列不僅使研究人員能夠?qū)虮磉_(dá)進(jìn)行大規(guī)模的定量評估,還定義了多種細(xì)胞類型和狀態(tài)的轉(zhuǎn)錄組[10]。國家生物技術(shù)信息中心(NCBI)的基因表達(dá)總覽(GEO)已經(jīng)成為領(lǐng)先的完全公開的基因表達(dá)數(shù)據(jù)存儲庫。
圖7 CLDN10(A)、MYC(B)、FH(C)在乳腺癌中的變異比例
因此,我們首先利用GEO數(shù)據(jù)庫中GSE9014數(shù)據(jù)集來研究CLDN10在乳腺癌中的表達(dá)水平,結(jié)果顯示在乳腺癌組織中,CLDN10顯著低表達(dá)。同時,為了驗(yàn)證這一結(jié)果,我們分析來了GSE3971中的數(shù)據(jù),結(jié)果與GSE9014一致。這提示,CLDN10在乳腺癌中高表達(dá),它可能作為一種抑癌基因來調(diào)控乳腺癌的發(fā)生、發(fā)展及預(yù)后。
MYC是一種原癌基因,它轉(zhuǎn)錄的蛋白產(chǎn)物含有一個基本的螺旋-環(huán)狀結(jié)構(gòu)域[11]。它是人類癌癥中最常發(fā)生變化的癌基因之一,同時,MYC也已被證明是與細(xì)胞的致瘤轉(zhuǎn)化有關(guān)[12,13]。另外,幾乎所有類型的人類惡性腫瘤,包括宮頸癌、結(jié)腸癌、乳腺癌、肺癌和胃癌,都有該基因的擴(kuò)增和過表達(dá)有關(guān)[14]。除此之外,乳腺癌中MYC癌基因擴(kuò)增和MYC蛋白過度表達(dá)的相關(guān)性已有報道,并且在腫瘤的發(fā)展過程中,它其是發(fā)揮促癌作用[13,15]。除此之外,在人類基因組中,F(xiàn)H的基因位于染色體1p43位點(diǎn),包含22229個堿基,是一種抑癌基因[16]。相關(guān)文獻(xiàn)報道在一些腫瘤中,例如腎上腺皮質(zhì)癌[17]、結(jié)直腸癌[18]、乳腺癌[19],F(xiàn)H的丟失在這些癌癥的發(fā)生中起到了關(guān)鍵作用[20]。
我們通過cBioPortal(www.cbioportal.org),發(fā)現(xiàn)CLDN10基因以擴(kuò)增為主(圖7A),并且我們篩選了同樣以擴(kuò)增為主的癌基因MYC(圖7B)和抑癌基因FH(圖7C)。為了進(jìn)一步說明CLDN10在乳腺癌中作用,我們首先發(fā)現(xiàn)GEO中乳腺癌MYC呈現(xiàn)高表達(dá),F(xiàn)H低表達(dá)。接著我們用CLDN10分別與MYC和FH進(jìn)行了相關(guān)性分析,結(jié)果發(fā)現(xiàn)CLDN10與MYC的表達(dá)成負(fù)相關(guān),而與FH呈正相關(guān),這說明CLDN10在乳腺癌中是一種抑癌基因,這與我們上述的推測一致,即CLDN10在乳腺癌中作為一種抑癌基因,這說明CLDN10在乳腺癌的發(fā)展中起抑制作用。
另外,我們使用網(wǎng)絡(luò)工具Kaplan-Meier Plotter,根據(jù)CLDN10的表達(dá)值的中位數(shù)將乳腺癌患者分為CLDN10低表達(dá)組和高表達(dá)組,同時制作了生存曲線圖,我們發(fā)現(xiàn)CLDN10高表達(dá)組的生存期較CLDN10低表達(dá)組的生存期長,這說明高表達(dá)CLDN10的乳腺癌患者預(yù)后更好,低表達(dá)的CLDN10乳腺癌患者預(yù)后不良。另外,我們使用TCGA數(shù)據(jù)庫,利用R軟件中的MaxStat包,將乳腺癌患者分為CLDN10高表達(dá)組和低表達(dá)組,發(fā)現(xiàn)CLDN10低表達(dá)組的生存期較CLDN10高表達(dá)組的生存期短,這與Kaplan-Meier Plotter的結(jié)論一致??偟膩碚f,進(jìn)一步證明了CLDN10在乳腺癌中抑制腫瘤的發(fā)生。
綜上所述,在本研究中,我們發(fā)現(xiàn)了CLDN10在乳腺癌中的表達(dá)較正常乳腺癌患者低,同時我們還證明了乳腺癌中CLDN10的表達(dá)與癌基因MYC呈負(fù)相關(guān),但與抑癌基因HF正相關(guān)。最后,我們還發(fā)現(xiàn)低表達(dá)的CLDN10乳腺癌患者預(yù)后不良??傊?,我們的研究認(rèn)為,CLDN10在乳腺癌中低表達(dá)并預(yù)測乳腺癌患者的低生存率。