蘇嘉慶,李智偉,萬召娟,王芳華,汪夢,張恒陽,張慧欣,周百靈
乳腺癌是危及女性健康最常見的一種惡性疾病[1]。在接受手術(shù)、化療等治療方式之后仍易復(fù)發(fā)轉(zhuǎn)移。而且,乳腺癌是高度異質(zhì)性癌癥,不同患者乳腺癌組織的免疫表型、組織形態(tài)、治療反應(yīng)和預(yù)后等均存在較大差異。乳腺癌現(xiàn)有的腫瘤標(biāo)志物還不能滿足臨床需求,亟需發(fā)現(xiàn)新的腫瘤標(biāo)志物,以實(shí)現(xiàn)乳腺癌的個體化精準(zhǔn)治療[2]。
研究發(fā)現(xiàn),長鏈非編碼RNA(LncRNA)的表達(dá)水平與乳腺癌的發(fā)生、發(fā)展甚至是診療、預(yù)后密切相關(guān)[3-4],這為我們治療乳腺癌提供了新的線索。近年來由于高通量技術(shù)的快速發(fā)展,腫瘤領(lǐng)域產(chǎn)生了大量的高通量測序數(shù)據(jù)和表達(dá)譜數(shù)據(jù),而且,研究人員已建立了諸多關(guān)于癌癥的重要數(shù)據(jù)庫,如:ONCOMINE[5]、TCGA[6]等。
通過數(shù)據(jù)庫[7-8]檢索LncRNA相關(guān)的文獻(xiàn),本文選取EGOT、MEG3、KCNQ1OT1和NEAT1四種與乳腺癌關(guān)系報(bào)道極少的LncRNA,通過UALCAN[9]網(wǎng)站挖掘TCGA數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)分析它們與不同乳腺癌患者的關(guān)系,通過Kaplan-Meier Plotter網(wǎng)站[10]分析它們與乳腺癌患者預(yù)后的關(guān)系,通過LinkedOmics網(wǎng)站[11]和ClueGO工具分析與它們表達(dá)相關(guān)的蛋白質(zhì)的主要功能,為乳腺癌的精準(zhǔn)治療、靶向治療以及預(yù)后評估提供線索。
通過UALCAN(http://ualcan.path.uab.edu/analysis.html)網(wǎng)站對四種LncRNA在乳腺癌組織與正常組織中的表達(dá)進(jìn)行分析。UALCAN網(wǎng)站可以在線對TCGA數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行深入挖掘,不僅可以對基因在癌癥組織和正常組織中的差異表達(dá)進(jìn)行分析,還可以比較不同臨床病理特征的患者之間的表達(dá)差異,比如年齡、種族、癌癥分期、亞型等,并給出統(tǒng)計(jì)學(xué)檢驗(yàn)結(jié)果。TCGA數(shù)據(jù)庫,即腫瘤基因組圖譜計(jì)劃,目前共收錄33種癌癥的高通量測序數(shù)據(jù)和患者的性別、年齡、腫瘤分期、復(fù)發(fā)及預(yù)后情況等臨床信息。
通過Kaplan-Meier Plotter(http://kmplot.com/analysis/)網(wǎng)站對四種LncRNA與乳腺癌預(yù)后的關(guān)系進(jìn)行分析,得到乳腺癌患者的無復(fù)發(fā)生存時間(relapse-free survival,RFS)與LncRNA表達(dá)量的Kaplan-Meier圖,并且圖中給出Log rank檢驗(yàn)的P值。若P<0.05,說明LncRNA表達(dá)量與乳腺癌患者的預(yù)后顯著相關(guān)。
通過LinkedOmics網(wǎng)站分析與LncRNA表達(dá)具有相關(guān)性的蛋白質(zhì),并獲得與LncRNA表達(dá)極顯著相關(guān)(P<0.01)的蛋白質(zhì)。然后,使用Cytoscape軟件中的ClueGO工具進(jìn)行GO功能注釋和KEGG通路富集分析,探尋LncRNA與乳腺癌發(fā)生相關(guān)的分子機(jī)制。
不同組間LncRNA的表達(dá)差異比較使用T檢驗(yàn)。Kaplan-Meier方法進(jìn)行生存分析,生存率的比較采用Log rank檢驗(yàn)。Pearson相關(guān)系數(shù)分析LncRNA和蛋白質(zhì)的表達(dá)相關(guān)性。使用超幾何富集分析方法對與LncRNA表達(dá)相關(guān)的蛋白質(zhì)進(jìn)行GO功能注釋和KEGG通路富集分析。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
UALCAN數(shù)據(jù)庫共有1 097個乳腺癌組織樣本及114個正常組織樣本。按患者的種族分類,白種人患者樣本748個,黑種人患者樣本179個,黃種人患者樣本61個。按患者的性別分類,男性患者僅有12例,女性患者為1 075例。按患者的年齡段分類,21~40歲97例,41~60歲505例,61~80歲431例,81~100歲54例。
結(jié)果表明,EGOT在乳腺癌組織中的表達(dá)顯著低于正常組織(P=0.0494),見圖1A。在對不同種族的乳腺癌患者進(jìn)行分析時,發(fā)現(xiàn)除白種人外,黑種人(P=0.0001)和黃種人(P=0.0003)乳腺癌組織中EGOT的表達(dá)水平顯著低于正常組織,見圖1B。女性患者癌組織中EGOT的表達(dá)水平顯著低于正常組織(P=0.0045),見圖1C。EGOT在21~40歲(P=0.0391)、81~100歲患者癌組織中的表達(dá)水平顯著低于正常組織(P=0.0313),而其他年齡段與正常組織沒有顯著差異,見圖1D。
MEG3 在乳腺癌組織中的表達(dá)顯著低于正常組織(P<1×1 0-12),見圖2 A。白種人(P=1.62×10-12)、黑種人(P=2.83×10-12)和黃種人(P=1.62×10-12)乳腺癌組織中MEG3的表達(dá)水平均顯著低于正常組織,見圖2B。男性(P=0.0001)與女性患者(P=1.62×10-12)中MEG3的表達(dá)水平均顯著低于正常組織,但男女患者之間沒有顯著差異,見圖2C。MEG3在所有年齡段患者癌組織中的表達(dá)水平均顯著低于正常組織(P<0.01),見圖2D。
雖然KCNQ1OT1在乳腺癌組織中的表達(dá)水平與正常組織無顯著差異,但是在黑種人癌組織中的表達(dá)水平顯著低于正常組織(P=4.19×10-5),見圖3A。女性患者KCNQ1OT1的表達(dá)水平與正常組織比較無顯著差異,但男性患者KCNQ1OT1的表達(dá)水平顯著低于正常組織(P=0.0230),見圖3B。KCNQ1OT1在不同年齡段的乳腺癌患者中的表達(dá)水平與正常組織中的無顯著差異。
雖然NEAT1在乳腺癌組織中的表達(dá)水平與正常組織中無顯著差異,但在黃種人患者中的表達(dá)水平顯著低于正常組織(P=3.63×10-6),見圖4A。在21~40歲患者(P=1.98×10-10)和41~60歲患者(P=0.0024)中的表達(dá)水平顯著低于正常組織,見圖4B。
由于UALCAN數(shù)據(jù)庫中部分患者的信息不完整,按臨床分期:Ⅰ期乳腺癌樣本有183個,Ⅱ期樣本有615個,Ⅲ期樣本有247個,Ⅳ期樣本有20個;按照分子分型:Luminal型、HER2陽性和三陰性乳腺癌分別有566、37和116個樣本;按照組織學(xué)分型:浸潤性導(dǎo)管癌有784個樣本,浸潤性小葉癌203個樣本,黏液癌17個樣本,化生性乳腺癌9個樣本,髓樣癌6個樣本。
EGOT的表達(dá)水平在Ⅲ期(P=0.0005)和Ⅳ期乳腺癌(P=0.0035)中的表達(dá)水平顯著低于正常組織,見圖5A。HER2陽性乳腺癌(P=1.62×10-12)和三陰性乳腺癌組織(P=1.02×10-11)中EGOT的表達(dá)水平顯著低于正常組織,也顯著低于Luminal型乳腺癌(ER、PR陽性)(P=4.20×10-12),見圖5B。此外,在不同組織學(xué)亞型中,EGOT在浸潤性導(dǎo)管癌(P=0.0318)、黏液癌(P=2.02×10-10)、化生性乳腺癌(P=1.62×10-12)、髓樣癌(P=0.0002)中的表達(dá)水平顯著低于正常組織,見圖5C。
MEG3的表達(dá)水平在不同分期、不同分子分型的乳腺癌組織中均顯著低于正常組織(P<0.05),見圖5D~5E。在不同組織學(xué)亞型中,MEG3在浸潤性導(dǎo)管癌(P<1×10-12)、浸潤性小葉癌(P=0.0002)、黏液癌(P<1×10-12)、髓樣癌(P=1.38×10-9)幾種亞型中的表達(dá)水平顯著低于正常組織,見圖5F。
KCNQ1OT1在不同分期乳腺癌組織中的表達(dá)水平與正常組織無顯著差異。在不同分子分型中,僅HER2陽性乳腺癌中KCNQ1OT1的表達(dá)水平顯著低于正常組織(P=0.0031),見圖6A。KCNQ1OT1在黏液癌(P=0.0367)和髓樣癌(P=0.0091)兩種組織學(xué)亞型中的表達(dá)水平顯著低于正常組織(P<0.05),見圖6B。
NEAT1在Ⅳ期乳腺癌患者中的表達(dá)水平顯著低于正常組織(P=0.0036),見圖6C。HER2陽性(P=1.89×10-12)和三陰性乳腺癌患者(P<1×10-12)NEAT1的表達(dá)水平顯著低于正常組織,見圖6D。NEAT1在浸潤性導(dǎo)管癌(P=0.0007)、浸潤性小葉癌(P=0.0110)和髓樣癌(P=3.81×10-8)三種組織學(xué)亞型中的表達(dá)水平顯著低于正常組織,見圖6E。
圖1 EGOT在乳腺癌及正常組織中的表達(dá)Figure 1 Expression of EGOT in breast cancer and normal samples
圖2 MEG3在乳腺癌及正常組織中的表達(dá)Figure 2 Expression of MEG3 in breast cancer and normal samples
圖3 KCNQ1OT1在乳腺癌及正常組織中的表達(dá)Figure 3 Expression of KCNQ1OT1 in breast cancer and normal samples
圖4 NEAT1在乳腺癌及正常組織中的表達(dá)Figure 4 Expression of NEAT1 in breast cancer and normal samples
圖5 EGOT和MEG3在不同臨床病理特征乳腺癌患者中的表達(dá)Figure 5 Expression of EGOT and MEG3 in breast cancer patients with different clinicopathological characteristics
Kaplan-Meier曲線顯示EGOT表達(dá)水平高的乳腺癌患者較EGOT表達(dá)水平低的患者有更好的RFS(P=0.037),即更好的預(yù)后,見圖7A。同樣,MEG3(P=1.3×10-8)、KCNQ1OT1(P=8.6×10-8)、NEAT1(P<1×10-16)的表達(dá)水平與乳腺癌患者的RFS均顯著相關(guān),而且這三種LncRNA高水平表達(dá)時,乳腺癌患者的RFS和預(yù)后相對較好,見圖7B~7D。
圖6 KCNQ1OT1和NEAT1在不同臨床病理特征乳腺癌患者中的表達(dá)Figure 6 Expression of KCNQ1OT1 and NEAT1 in breast cancer patients with different clinicopathological characteristics
與EGOT、MEG3、KCNQ1OT1和NEAT1表達(dá)相關(guān)性最大的前五個蛋白質(zhì),見表1。GO功能注釋和KEGG通路富集分析結(jié)果見圖8。
與EGOT表達(dá)相關(guān)的蛋白質(zhì)經(jīng)過功能富集分析后,共獲得71項(xiàng)極顯著(P<0.01)的GO term,其中50%與基因表達(dá)的轉(zhuǎn)錄后調(diào)控有關(guān),20.83%與翻譯有關(guān),見圖8A;獲得1條極顯著(P=0.009)的KEGG通路,與RNA運(yùn)輸相關(guān)的通路。與MEG3表達(dá)相關(guān)的蛋白質(zhì)經(jīng)過功能富集分析后,共獲得90項(xiàng)極顯著(P<0.01)的GO term,其中24.21%與細(xì)胞外基質(zhì)組織有關(guān),其次10.53%與細(xì)胞基質(zhì)黏附相關(guān),見圖8B;獲得5條極顯著(P<0.01)的KEGG通路,分別是與黏著斑、細(xì)胞外基質(zhì)與受體相互作用、DNA復(fù)制等相關(guān)的通路。與KCNQ1OT1表達(dá)相關(guān)的蛋白質(zhì)經(jīng)過功能富集分析后,共獲得13項(xiàng)極顯著(P<0.01)的GO term,其中30.77%與細(xì)胞器有關(guān),30.77%的與膜包圍的內(nèi)腔相關(guān),見圖8C。與NEAT1表達(dá)相關(guān)的蛋白質(zhì)經(jīng)過功能富集分析后,共獲得25項(xiàng)極顯著(P<0.01)的GO term,其中28%與肽運(yùn)輸有關(guān),其次16%與DNA幾何變化相關(guān),見圖8D。
表1 與LncRNA表達(dá)相關(guān)的蛋白質(zhì)Table 1 Proteins related to expression of four lncRNAs
圖7 LncRNA表達(dá)水平與乳腺癌患者的生存曲線Figure 7 LncRNA expression and Kaplan-Meier curve of breast cancer patients
乳腺癌是一種異質(zhì)性癌癥,同樣的治療方案用在不同患者身上,往往有不同的治療效果與預(yù)后,因此需要針對每種乳腺癌亞型開發(fā)特異的腫瘤標(biāo)志物,以便更精準(zhǔn)地個性化治療與預(yù)后評估。
本研究發(fā)現(xiàn)EGOT在乳腺癌組織中的表達(dá)顯著低于正常組織。同時,EGOT的表達(dá)水平在Ⅲ期和Ⅳ期、HER2陽性和三陰性乳腺癌、浸潤性導(dǎo)管癌、黏液癌、化生性乳腺癌、髓樣癌等乳腺癌亞型中顯著降低。Kaplan-Meier曲線顯示EGOT表達(dá)水平與患者預(yù)后顯著相關(guān),表達(dá)水平高的乳腺癌患者較EGOT表達(dá)水平低的患者有更好的預(yù)后。有報(bào)道發(fā)現(xiàn)EGOT在乳腺癌中表達(dá)下調(diào)[12]。與乳腺癌中低表達(dá)類似,有研究發(fā)現(xiàn)在腎細(xì)胞瘤中EGOT表達(dá)下調(diào)并起到腫瘤抑制因子的作用[13]。通過功能富集分析,發(fā)現(xiàn)與EGOT表達(dá)相關(guān)的蛋白質(zhì)主要與基因表達(dá)的轉(zhuǎn)錄后調(diào)控、翻譯和RNA運(yùn)輸?shù)认嚓P(guān),說明EGOT可能通過與相關(guān)蛋白質(zhì)相互作用來調(diào)控某些基因的表達(dá)。EGOT表達(dá)受抑制可能在乳腺癌的后期發(fā)展中發(fā)揮重要作用,并且EGOT可作為潛在的乳腺癌抑癌因子和預(yù)后標(biāo)志物。
本研究發(fā)現(xiàn)MEG3在不同種族、性別、年齡、分期、分子分型的乳腺癌組織中均顯著低于正常組織的,表明MEG3的低表達(dá)可能與乳腺癌的發(fā)生和發(fā)展相關(guān)。同樣,在食管癌中,MEG3表達(dá)水平也顯著降低,并且可以通過競爭性結(jié)合miR-9抑制腫瘤轉(zhuǎn)移[14]。一些學(xué)者通過研究發(fā)現(xiàn),在乳腺癌細(xì)胞等多種癌細(xì)胞中,MEG3是腫瘤抑制因子,其表達(dá)量很低甚至幾乎不表達(dá),造成這種情況的原因可能是其啟動子區(qū)高甲基化[15]。本研究還發(fā)現(xiàn)當(dāng)MEG3表達(dá)水平較低時,乳腺癌患者的預(yù)后也較差。通過功能富集分析,發(fā)現(xiàn)與MEG3表達(dá)相關(guān)的蛋白質(zhì)主要與細(xì)胞基質(zhì)黏附、細(xì)胞外基質(zhì)與受體相互作用等相關(guān),而這些通路主要影響細(xì)胞間的相互作用、突觸形成、血腦屏障完整性等[16],說明MEG3的異常表達(dá)可能會對以上生物過程產(chǎn)生影響。以上結(jié)果表明,MEG3在乳腺癌中發(fā)揮抑癌作用,其低表達(dá)影響乳腺癌的發(fā)生和發(fā)展,并有望成為判斷乳腺癌患者預(yù)后的生物學(xué)指標(biāo)。
經(jīng)分析,男性乳腺癌患者KCNQ1OT1的表達(dá)水平顯著低于正常組織和女性患者。此外,KCNQ1OT1僅在HER2陽性乳腺癌中的表達(dá)水平顯著降低。同樣,KCNQ1OT1表達(dá)水平較低時,乳腺癌患者的預(yù)后也較差。有研究發(fā)現(xiàn),KCNQ1OT1可以吸附miR-145,而miR-145抑制CCNE2基因的表達(dá),所以KCNQ1OT1通過調(diào)控下游miR-145/CCNE2基因的表達(dá)發(fā)揮作用[17]。通過功能富集分析,發(fā)現(xiàn)與KCNQ1OT1表達(dá)相關(guān)的蛋白質(zhì)主要與細(xì)胞器和膜包被的內(nèi)腔等細(xì)胞組分方面的功能相關(guān),表明KCNQ1OT1的異常表達(dá)可能會影響細(xì)胞的細(xì)胞器。KCNQ1OT1的低表達(dá)可能作為男性乳腺癌患者和HER2陽性乳腺癌特異性指標(biāo)和不良預(yù)后指標(biāo)。
圖8 與LncRNA表達(dá)相關(guān)蛋白質(zhì)的GO和KEGG功能富集分析結(jié)果Figure 8 GO and KEGG function enrichment analysis results of proteins related to expression of four lncRNAs
本研究還發(fā)現(xiàn),NEAT1亞洲患者中的表達(dá)水平顯著低于正常組織,同時20~60歲患者中表達(dá)水平顯著降低,表明NEAT1是潛在的黃種人乳腺癌患者特異性診斷指標(biāo),還可能作為年輕乳腺癌患者的生物學(xué)指標(biāo)。此外,Ⅳ期、HER2陽性和三陰性等預(yù)后較差的乳腺癌患者中的NEAT1表達(dá)水平較低,生存分析表明NEAT1表達(dá)水平降低的患者預(yù)后較差。但是,有研究發(fā)現(xiàn)三陰性乳腺癌中NEAT1表達(dá)上調(diào)[18],可能是分析樣本不同的原因,該文獻(xiàn)所使用的為黃種人樣本,而本文所使用的數(shù)據(jù)樣本多為白種人,分析結(jié)果也表明NEAT1在黃種人和白種人之間的表達(dá)水平具有顯著差異。通過功能富集分析,發(fā)現(xiàn)與NEAT1表達(dá)相關(guān)的蛋白質(zhì)主要與肽運(yùn)輸、DNA幾何變化等生物過程相關(guān),表明NEAT1異常表達(dá)可能會調(diào)控以上過程,進(jìn)而調(diào)控相關(guān)基因的表達(dá)。以上結(jié)果表明NEAT1在不同乳腺癌患者中具有不同的表達(dá)和功能,可以作為潛在的特異性乳腺癌診斷指標(biāo)和預(yù)后判斷標(biāo)志物。
綜上,四種LncRNA在乳腺癌或部分亞型中表達(dá)下調(diào),可能是乳腺癌中潛在的抑癌因子,且可能成為判斷乳腺癌患者預(yù)后的生物學(xué)指標(biāo)。本文還通過功能富集分析方法探討了與四種LncRNA表達(dá)相關(guān)的蛋白質(zhì)的主要功能,但它們影響乳腺癌發(fā)生和發(fā)展的作用機(jī)制還需要進(jìn)行更深入的研究。