【摘要】 目的 通過表達數(shù)量性狀位點(eQTL)定位篩選乳腺癌免疫相關(guān)分子標志物,旨在為乳腺癌的診斷和治療尋找潛在靶標。方法 對來自GEO數(shù)據(jù)庫的3個乳腺癌數(shù)據(jù)集進行系統(tǒng)分析,利用eQTL分析確定工具變量(IVs),利用公開的乳腺癌全基因組關(guān)聯(lián)(GWAS)數(shù)據(jù)進行孟德爾隨機化(MR)分析,得到與MR相關(guān)的基因并通過OR值確定基因的風險程度,與GEO數(shù)據(jù)集中識別的差異表達基因(DEGs)取交集得到疾病的關(guān)鍵基因。然后對關(guān)鍵基因進行GO、KEGG、GSEA富集分析和免疫細胞浸潤及基因免疫相關(guān)性分析,進一步分析關(guān)鍵基因在乳腺癌中的作用。最后使用獨立的GEO數(shù)據(jù)集和TCGA數(shù)據(jù)進行驗證。結(jié)果 通過差異分析得到307個上調(diào)基因,440個下調(diào)基因。利用MR分析和DEGs交叉共得到9個疾病的關(guān)鍵基因(PARP1、MUC1、LILRB2、TNNT1、CTNNAL1、DNASE1L3、HOXA9、PIK3R1、SLPI),這些基因參與了乳腺癌發(fā)生發(fā)展過程中的B細胞受體、細胞凋亡等信號通路。根據(jù)CIBERSORT分析得出,乳腺癌中CD4+ T細胞浸潤顯著下降,M0巨噬細胞浸潤顯著上升,且關(guān)鍵基因與nave B以及記憶B細胞之間存在負調(diào)控關(guān)系,與M0巨噬細胞及調(diào)節(jié)T細胞等存在正調(diào)控關(guān)系,表明關(guān)鍵基因與乳腺癌細胞免疫的關(guān)系密切。結(jié)論 篩選出來的關(guān)鍵基因尤其是DNASE1L3與乳腺癌的免疫進程密切關(guān)聯(lián),未來可能會成為乳腺癌免疫治療的理想靶標。
【關(guān)鍵詞】 表達數(shù)量性狀位點定位;乳腺癌;孟德爾隨機化;腫瘤免疫;生物標志物
中圖分類號:R734.2
文獻標志碼:A
DOI:10.3969/j.issn.1003-1383.2025.02.002
Identification of immune-related markers of breast cancer based on eQTL
localization: a Mendelian randomization and transcriptomics study
HE Yaling1, ZHANG Xin1, WU Zeyuan1, ZHANG Pingxi1, YE Yalin1, PAN Yun2, LI Yan1,2▲
(1. School of Basic Medical Sciences, Dali University, Dali 671000, Yunnan, China; 2. Department of
Pathology, the First Affiliated Hospital of Dali University, Dali 671000, Yunnan, China)
【Abstract】 Objective To screen breast cancer immune-related molecular markers through"" expression quantitative trait loci (eQTL) localization, so as to provide potential targets for the diagnosis and treatment of breast cancer. Methods Systematic analysis was conducted on three breast cancer datasets from GEO database. eQTL analysis was utilized to identify instrumental variables (IVs). Subsequently, Mendelian randomization (MR) analysis was performed using publicly available genome-wide association study (GWAS) data of breast cancer. Genes associated with MR were obtained, and their risk levels were determined through odds ratios (OR). The intersection of these genes with differentially expressed genes (DEGs) identified from the GEO datasets was then taken to obtain key genes for the disease. And then, gene ontology (GO) and Kyoto encyclopedia of genes and genomes (KEGG) enrichment analyses, gene set enrichment analysis (GSEA), and immune cell infiltration and gene-immune correlation analyses were conducted on key genes to further elucidate their roles in breast cancer. Finally, independent GEO datasets and the cancer genome atlas (TCGA) data were used for validation. Results A total of 307 upregulated genes and 440 downregulated genes were identified through differential expression analysis. A total of 9 disease-critical genes were identified through MR analysis and the intersection of DEGs: PARP1, MUC1, LILRB2, TNNT1, CTNNAL1, DNASE1L3, HOXA9, PIK3R1, and SLPI. These genes were involved in signaling pathways such as B-cell receptor signaling and apoptosis, which play important roles in the development and progression of breast cancer. According to CIBERSORT analysis, there was a significant decrease in CD4+T cell infiltration and a significant increase in M0 macrophage infiltration in breast cancer. Moreover, the key genes exhibited negative regulatory relationship with nave B cells and memory B cells, and positive regulatory relationship with M0 macrophages and regulatory T cells, which indicated that key genes were closely related to breast cancer cell immunity. Conclusion The key genes identified, particularly DNASE1L3, are closely related to the immune processes in breast cancer and may potentially serve as ideal targets for breast cancer immunotherapy in the future.
【Keywords】 expression quantitative trait loci (eQTL) localization; breast cancer; Mendelian randomization(MR); tumor immunity; biomarker
乳腺癌(breast cancer, BC)是女性最常見的惡性腫瘤之一,具有高度的異質(zhì)性,是導致目前全球女性癌癥死亡的主要原因,同時,由于其發(fā)病率和病死率均在不斷攀升,給臨床治療帶來了較大困難[1]。盡管針對BC的研究取得了重大的進展,但敏感性和有效靶點的確定仍然是難以解決的問題,這也是BC高死亡率的主要原因[2-3]。因此,對BC實施精準治療的難題仍存在,迫切需要找到關(guān)鍵的診斷、預后以及治療的有效靶標。表達數(shù)量性狀位點(expression quantitative trait loci,eQTL)是與特定單核苷酸多態(tài)性(SNP)基因表達水平之間具有統(tǒng)計相關(guān)性的遺傳變異[4]。eQTL通過檢測特定SNP與基因表達水平之間的關(guān)聯(lián),可揭示遺傳變異對復雜性狀和疾病之間的潛在影響機制[5]。其類似于隨機對照試驗,即遺傳變異遵循等位基因隨機分配給后代的原則,這使得其與觀察性的流行病學研究相比具有獨特的優(yōu)勢。孟德爾隨機化(Mendelian randomization, MR)是一種利用與暴露具有強相關(guān)的遺傳變異工具,對暴露因素與結(jié)局之間進行可靠因果關(guān)系預測的高效分析方法,能很大程度減小傳統(tǒng)的實驗研究操作不當引起的誤差[6]。
在本研究中,使用MR分析預測eQTL數(shù)據(jù)與BC之間的聯(lián)系,同時,通過轉(zhuǎn)錄組數(shù)據(jù)確定BC的關(guān)鍵基因,利用細胞免疫浸潤分析算法“CIBERSORT”分析BC的免疫浸潤情況,GSEA分析確定關(guān)鍵基因在BC發(fā)生發(fā)展中的病理生理機制。此外,還評估了9個關(guān)鍵基因與免疫細胞浸潤之間的聯(lián)系以及浸潤細胞之間的關(guān)聯(lián)性。希望通過以上鑒定的基因能作為診斷和治療BC的候選靶標,對它們潛在機制的研究可能是日后BC診斷試劑以及藥物研發(fā)的潛在靶標。研究流程見圖1。
1 材料與方法
1.1 數(shù)據(jù)收集與整理 從GEO(https://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫獲取4組BC患者的mRNA微陣列數(shù)據(jù)集,主要包含以下信息:GSE9309(包含98個乳腺癌樣本,8個正常樣本),GSE18672(包含64個乳腺癌樣本,79個正常樣本),GSE24124 (包含99個腫瘤樣本,20個正常樣本),GSE32641(包含95個腫瘤樣本,7個正常樣本)。GSE9309、GSE24124、GSE32641均基于GPL887平臺[7],GSE18672基于GPL6848平臺[8]。將GSE9309、GSE18672、GSE24124數(shù)據(jù)集合并為訓練集(其中乳腺癌樣本261個,正常樣本107個);將GSE32641作為驗證數(shù)據(jù)集。數(shù)據(jù)集詳細信息見表1。在TCGA(https://cancergenome.nih.gov/abouttcga/overview)數(shù)據(jù)庫下載BC的mRNA表達數(shù)據(jù)(TCGA-BRCA.htseq_fpkm)作為外部獨立驗證隊列。
1.2 基因表達差異分析 在R中使用“sva”和“l(fā)imma”包對GSE18672、GSE24124、GSE32641數(shù)據(jù)進行合并[9-10],并采用主要成分(PCA)分析進行批次校正。使用“l(fā)imma”包識別疾病與正常對照組之間的差異表達基因(differential expression genes, DEGs),顯著性閾值設為Plt;0.05,|Fold Change|gt;1。隨后,利用“ggplot2”軟件包繪制DEGs火山圖[11],“pheatmap”軟件包繪制DEGs熱圖。
1.3 孟德爾隨機化方法
1.3.1 孟德爾隨機化數(shù)據(jù)來源 使用全基因組關(guān)聯(lián)(GWAS)數(shù)據(jù)進行了孟德爾隨機化分析以研究基因與BC之間潛在的因果關(guān)系。暴露的GWAS數(shù)據(jù)來自OpenGWAS (https://gwas.mrcieu.ac.uk/)數(shù)據(jù)庫中的eQTL數(shù)據(jù)集,共收集了19 942個基因。結(jié)局的GWAS數(shù)據(jù)來自BCAC(https://bcac.ccge.medschl.cam.ac.uk/)數(shù)據(jù)庫,共包含了228 951個樣本,且暴露和結(jié)局的GWAS數(shù)據(jù)均來自具有歐洲血統(tǒng)的人群。由于本研究MR分析所使用的是公開的GWAS匯總數(shù)據(jù),因此,不需要額外的倫理批準或知情同意書。
1.3.2 工具變量(IVs)選擇 根據(jù)以下步驟篩選IVs:(1)設置Plt;5e-08后,使用“TwoSampleMR”軟件包分析每個基因的eQTL數(shù)據(jù)集,用于評估SNP與基因表達水平之間的關(guān)聯(lián)性[12];(2)設置連鎖不平衡條件,其中(R2lt;0.001,10 000個堿基對的物理距離閾值)用于得到高度相關(guān)的SNP并保留與基因表達水平具有最強烈關(guān)聯(lián)性的SNP用于后續(xù)分析;(3)計算暴露的F值用于估算弱變量偏差,F(xiàn)值lt;10的工具變量表明偏差較弱,應當舍棄[13]。
1.3.3 孟德爾隨機化分析 通過以上步驟篩選出符合條件的IVs后,使用“TwoSampleMR”和“VariantAnnotation”包對暴露和結(jié)局進行兩樣本MR分析[12-14]。采用5種分析方法[Inverse-variance weighted(IVW)、MR-Egger、weighted median、Weighted mode、Simple mode],其中IVW作為主要分析方法[15],但前提是用于分析的工具變量具有很強的因果關(guān)系檢測能力,且必須是有效的[16]。由于選定人群和實驗條件不同,樣本之間可能存在異質(zhì)性,使最后的結(jié)果產(chǎn)生偏差,因此使用Cochran's Q檢驗來檢測異質(zhì)性,當Pgt;0.05時認為所選的IVs不存在異質(zhì)性。而MR分析中的一個假設是:所選工具變量只能通過暴露來影響結(jié)局,因此,為使暴露與結(jié)局之間的結(jié)果更加穩(wěn)定、可信,測試水平多效性是必須的[17]。在本研究中使用MR-Egger截距檢驗來測試水平多效性。當MR-Egger截距偏離0時,認為此分析存在水平多效性,結(jié)果可信度是可疑的,這也表明SNP只與暴露有關(guān),與其他的混雜因素無關(guān)[18]。同時leave-one-out分析被用來檢測多效性檢驗結(jié)果的一致性[19]。
1.4 乳腺癌關(guān)鍵基因篩選與驗證 通過MR分析,根據(jù)OR值將基因分為高表達基因(ORgt;1)與低表達基因(ORlt;1),并利用“VennDiagram”軟件包將高低表達基因與差異分析上調(diào)和下調(diào)基因取交叉繪制Venn圖。同時,排除具有多效性以及IVW Pgt;0.05的基因。使用“forestplot”包讀取IVW、weighted median兩種分析方法得出的OR值以及OR值的波動范圍,以篩選出強相關(guān)性的關(guān)鍵基因。得到關(guān)鍵基因后,利用GSE32641數(shù)據(jù)集進行關(guān)鍵基因表達驗證。最后,為了展示出基因在染色體中的具體位置,使用“circlize”軟件包創(chuàng)建基因與染色體的基因組圈圖[20]。
1.5 疾病關(guān)鍵基因富集分析 使用“Cluster Profiler”軟件包(Plt;0.05,F(xiàn)DRlt;0.05)對其進行基因本體(GO)功能富集分析,以研究其在細胞成分(CC)、分子功能(MF)以及生物過程(BP)中的作用;KEGG富集分析用于研究差異基因相關(guān)的信號通路。
1.6 GSEA富集分析 為了研究疾病組中關(guān)鍵基因高表達組、低表達組之間富集基因集的差異,使用“clusterProfiler”軟件包以及MSigDB數(shù)據(jù)庫(https://www.gsea-msigdb.org/gsea/)中的“c2.cp.kegg.Hs.symbols.gmt”文件進行GSEA富集分析[21]。
1.7 免疫細胞以及免疫相關(guān)性分析 為了了解BC中免疫細胞的浸潤情況以及關(guān)鍵基因與免疫細胞浸潤的相關(guān)性?;凇癓M22”文件,使用“CIBERSORT”包分析對照組與實驗組中免疫細胞的浸潤水平[22](Plt;0.05),并采用箱型圖和柱狀圖觀察免疫細胞的差異水平。最后,使用“l(fā)inkET”和“ggplot2”包對疾病組浸潤性免疫細胞類型及其與疾病關(guān)鍵基因之間的關(guān)聯(lián)進行可視化分析[11]。
2 結(jié)果
2.1 差異基因分析 將數(shù)據(jù)去除批次效應后(圖2A、B)。通過將BC訓練集樣本進行基因表達差異分析,共得到了747個DEGs,其中包含了上調(diào)基因307個,下調(diào)基因440個,均顯示在火山圖(圖2C)和熱圖中(圖2D)。
2.2 IVs和MR分析 在去除連鎖不平衡后,通過計算F值,去除了F值lt;10的SNP,共得到了26 152個與基因有強相關(guān)性的SNP作為有效的IVs。采用雙樣本孟德爾隨機化分析評估每個效應SNP位點對BC的影響。對無多效性且IVW Plt;0.05的SNP進行了敏感性分析,共鑒定出400個疾病關(guān)聯(lián)性基因。為了進一步驗證基因的風險程度,將差異上調(diào)基因與MR分析得出的高表達基因取交集,將差異下調(diào)基因與MR分析得出的低表達基因取交集,共得到了9個疾病相關(guān)的共表達基因并將它們在染色體中的位置進行標注(圖3A-C)。其中,PARP1、MUC1、LILRB2、TNNT1基因與疾病高風險相關(guān),CTNNAL1、 DNASE1L3、HOXA9、PIK3R1、SLPI基因與疾病的低風險相關(guān)(圖4)。隨后,對篩選出的9個關(guān)鍵基因與BC的因果關(guān)系進行了MR分析,結(jié)果顯示上調(diào)的共表達基因與BC之間存在顯著的正調(diào)控關(guān)系,其中PARP1(OR=1.031;95% CI:1.006~1.056;P=0.016), MUC1(OR=1.047;95% CI:1.007~1.088;P=0.022),LILRB2(OR=1.047;95% CI: 1.005~1.090;P=0.027),TNNT1(OR=1.034;95% CI: 1.008~1.061;P=0.011);相反,下調(diào)的共表達基因則表現(xiàn)出與BC之間的負調(diào)控關(guān)系,主要包括CTNNAL1(OR=0.973;95% CI:0.951~0.994;P=0.014),DNASE1L3(OR=0.952;95% CI: 0.921~0.984;P=0.004),HOXA9(OR=0.964;95% CI:0.930~0.999;P=0.044),PIK3R1(OR=0.904;95% CI:0.836~0.977;P=0.011),SLPI(OR=0.954;95% CI:0.924~0.985;P=0.004)。
2.3 關(guān)鍵基因敏感性分析及驗證 為了驗證結(jié)果的可靠性,采用MR-Egger回歸和Cochran's Q檢驗對9個關(guān)鍵基因進行敏感性分析(見表2)。敏感性分析顯示,在整個分析中均沒有發(fā)現(xiàn)多效性和異質(zhì)性的證據(jù),表明分析結(jié)果是可靠的。同時,漏斗圖分析證明單個SNP不會對結(jié)局產(chǎn)生影響,表明單個的SNP未違反和偏倚估計不存在方向多效性,分析未發(fā)現(xiàn)存在水平多效性的證據(jù)。這表明我們的分析方法和結(jié)果都是可信的(圖5)。最后,對9個關(guān)鍵基因在GSE32641數(shù)據(jù)集以及TCGA數(shù)據(jù)庫中乳腺癌的基因表達數(shù)據(jù)集進行外部驗證。結(jié)果顯示,關(guān)鍵基因在BC中的表達具有差異,并與前期研究結(jié)果一致。這些結(jié)果更有力地證明了9個關(guān)鍵基因在BC中的顯著差異(圖6)。
2.4 疾病關(guān)鍵基因功能及通路富集分析 通過GO分析研究關(guān)鍵基因在BP、CC和MF方面的富集情況。結(jié)果顯示,在生物過程中,關(guān)鍵基因主要在內(nèi)在細胞凋亡途徑以及細胞器組織負調(diào)控等富集;在細胞成分中,未發(fā)現(xiàn)關(guān)鍵基因在分子功能上的富集具有差異性;而在分子功能方面,則是與蛋白磷酸酶結(jié)合最為顯著。此外,KEGG分析顯示,關(guān)鍵基因在B細胞受體信號通路、細胞凋亡、破骨細胞分化和糖尿病心肌病通路中富集(圖7)。
2.5 關(guān)鍵基因GSEA富集分析 為了探究高表達和低表達的關(guān)鍵基因在疾病組中富集基因的差異,對關(guān)鍵基因進行了GSEA富集分析。結(jié)果顯示,關(guān)鍵基因高表達組中,細胞因子-細胞因子受體相互作用通路富集程度最高,其次是嘧啶代謝和蛋白輸出(圖8)。在關(guān)鍵基因低表達組中,氧化磷酸化是共同富集最為顯著的,其次為細胞因子相互作用(圖9)??傮w來說,無論在高表達組還是低表達組中,細胞因子受體互相作用和氧化磷酸化通路都被大多數(shù)關(guān)鍵基因富集,這表明關(guān)鍵基因的變化可能對BC的免疫狀態(tài)以及能量代謝產(chǎn)生關(guān)鍵影響。
2.6 BC中免疫細胞浸潤分析以及關(guān)鍵基因免疫學特征 為了進一步研究正常組與疾病組之間免疫細胞浸潤情況,采用CIBERSORT算法測定BC與非BC之間免疫細胞浸潤的差異。結(jié)果顯示,兩組之間免疫細胞浸潤情況具有顯著差異(圖10A-B)。其中,在疾病組中靜息的CD4+記憶T細胞比例相較于正常組顯著減少,而M0巨噬細胞比例與正常組相比則顯著上升,這表明CD4+ T細胞與巨噬細胞可能在BC中發(fā)揮著關(guān)鍵作用。通過研究關(guān)鍵基因與免疫細胞浸潤之間的相關(guān)性以了解關(guān)鍵基因的免疫學特征,結(jié)果顯示,疾病關(guān)鍵基因與各免疫細胞浸潤之間存在顯著相關(guān)性(圖10C)。值得注意的是,naive B細胞與記憶B細胞之間呈現(xiàn)出顯著的負相關(guān),而M0巨噬細胞和調(diào)節(jié)性T細胞、中性粒細胞和激活的肥大細胞之間存在顯著的正相關(guān)。另外,研究發(fā)現(xiàn),靜息肥大細胞與CTNNAL1、DANSE1L3、HOXL9、PIK3R1之間呈正相關(guān)關(guān)系,與PARP1、SLPI之間呈負相關(guān)關(guān)系;調(diào)節(jié)T細胞與CTNNAL1、DANSE1L3、LILRB2、PIK3R1之間存在負調(diào)控關(guān)系,與MUC1、PARP1之間則是存在正調(diào)控關(guān)系。這些發(fā)現(xiàn)提示,疾病關(guān)鍵基因與BC中免疫細胞之間的相互作用具有重要聯(lián)系。此外,發(fā)現(xiàn)DANSE1L3與大多數(shù)免疫細胞之間存在著廣泛的聯(lián)系,說明其在BC中具有重要的免疫學特性。
3 討論
乳腺癌是全球女性腫瘤占比中最高的惡性腫瘤,以年輕女性居多[23]。而乳腺癌的耐藥性強,容易復發(fā)和轉(zhuǎn)移,是導致治療效果不佳的主要原因[24]。雖然目前雌激素受體(ER)、孕酮(PR)、人表皮生長受體因子2(HER2)以及Ki67能有效地指導臨床上對BC的治療,但是效果依舊欠佳[25-26]。由于BC的遺傳具有高度的復雜性,因此,對其生物標志物的開發(fā)一直都十分困難[27]。所以,針對這一難題,我們設計了本研究,以期望對乳腺癌的早期診斷和臨床診治提出新的見解。
在本研究中利用MR分析方法,系統(tǒng)分析了19 942個基因的eQTL數(shù)據(jù)與BC之間的因果關(guān)系,共得到了392個與疾病具有關(guān)聯(lián)的基因,并根據(jù)OR值將其分為高表達組與低表達組,隨后采用Veen圖將DEG_up與ORgt;1取交集,共得到4個高表達的疾病關(guān)鍵基因,將DEG_down與ORlt;1取交集,共得到5個低表達的疾病關(guān)鍵基因。這是我們團隊首次利用基因eQTL數(shù)據(jù)結(jié)合轉(zhuǎn)錄組學以及MR分析篩選出BC的關(guān)鍵基因,并分析了它們的免疫相關(guān)性。這一發(fā)現(xiàn)為乳腺癌的臨床診治提供了有意義的參考,并可能成為靶向治療BC的潛在靶標。
乳腺癌作為一種中度或弱免疫原性、低突變負荷的腫瘤,對其免疫治療的研究雖然起步較晚,但是卻十分迅速[28],這足以體現(xiàn)免疫環(huán)境在BC中有很重要的作用。在本研究中,正常組與疾病組之間免疫細胞浸潤的差異主要表現(xiàn)為靜息的CD4+記憶T細胞在BC中減少,而巨噬細胞M0在BC中升高。CD4+ T細胞在控制感染、調(diào)節(jié)組織穩(wěn)態(tài)以及修復或執(zhí)行免疫調(diào)節(jié)中發(fā)揮重要作用,而記憶CD4+ T細胞不僅可保護組織免受再感染,其對腫瘤的免疫作用也同樣重要[29]。記憶CD4+ T細胞在BC中減少說明了其在BC中發(fā)揮的防護作用是極其關(guān)鍵的,換句話說,機體記憶CD4+ T細胞的減少,導致機體對BC的防御減弱,從而促進BC的發(fā)生和發(fā)展。巨噬細胞是體內(nèi)重要的腫瘤組織特異性免疫細胞,早期認為巨噬細胞具有抑癌作用[30]。但是后續(xù)研究發(fā)現(xiàn)其在膠質(zhì)瘤、肝細胞癌中表現(xiàn)出促癌作用[31]。根據(jù)我們的研究結(jié)果,巨噬細胞M0在BC中顯著上升,表明其在BC中發(fā)揮促進作用,但目前尚未有研究揭示這種促進作用產(chǎn)生的機制。
聚腺苷二磷酸核糖聚合酶-1(PARP1)是一種在細胞的DNA損傷修復和細胞存活中具有關(guān)鍵作用的蛋白質(zhì),主要定位于細胞核。PARP1能夠抑制同源重組缺陷細胞的死亡,并參與許多的細胞功能[32]。此外,PARP1具有腫瘤促炎作用,參與上皮細胞間質(zhì)轉(zhuǎn)化、細胞壞死、細胞凋亡等過程[33]。因此,PARP1作為抗癌治療靶點的熱度持續(xù)上升。許多研究證實了其在BC中的關(guān)鍵作用。一項研究顯示PARP1可作為上游基因,參與BC的侵襲過程,PARP1與趨化因子2(CCL2)之間存在明顯的串擾關(guān)系,CCL2的表達水平及其細胞侵襲在BC細胞中具有重要作用[34]。黏蛋白1(MUC1)是一種異二聚體跨膜蛋白,呈極性分布并提供保護屏障的功能,目前廣泛認為其結(jié)構(gòu)中有潛在的致癌MUC1 C末端[35],因此MUC1在腫瘤中的機制研究逐漸受到重視。在正常的上皮細胞中,MUC1以高度糖基化的形式存在;而在惡性腫瘤細胞中,MUC1則以糖基脫落的形式特異性地過表達于多種癌細胞表面,從而減少細胞之間和細胞外基質(zhì)之間的相互作用,促進腫瘤轉(zhuǎn)移。研究表明,MUC1在超過90%的乳腺癌病例中呈現(xiàn)過表達[36],這一點與我們的研究結(jié)果一致。有學者對MUC1相關(guān)的lncRNA和MicroRNA進行系統(tǒng)的研究,發(fā)現(xiàn)circ_0009910/miR-145-5p/MUC1調(diào)節(jié)軸對BC的發(fā)生發(fā)展起著關(guān)鍵作用,具有成為治療BC有效靶點的潛力[37]。淋巴免疫球蛋白樣受體2(LILRB2)是一種Ⅰ型跨膜糖蛋白,包含細胞外Ig樣區(qū)、跨膜區(qū)和含有ITIM的細胞內(nèi)區(qū),被認為是一種免疫抑制分子,是癌癥免疫治療潛在的免疫檢查點[38-39]。最新研究表明,LILRB2與BC的免疫逃逸有關(guān),高表達的LILRB2與BC不良預后相關(guān),且作為上游基因,通過下調(diào)HLA-A促進BC的免疫逃逸發(fā)揮促癌作用[40]。骨骼慢肌鈣蛋白1(TNNT1)是肌鈣蛋白(TnT)的同源特異性亞型之一,參與維持肌肉收縮和松弛過程中的鈣調(diào)節(jié)[41]。近期研究發(fā)現(xiàn),TNNT1在幾種腫瘤組織中顯著上調(diào),并與腫瘤的分期密切相關(guān)。特別是在乳腺癌中,TNNT1通過促進G1/S期過渡,促進了BC細胞的增殖[42]。目前的研究表明,PARP1、MUC1、LILRB2和TNNT1 均是BC的高表達基因,促進了乳腺癌的發(fā)展,這與我們的研究結(jié)果高度一致。因此,針對這些高表達基因開發(fā)抑制劑,為治療BC提供了堅實的理論依據(jù)。
連環(huán)素(catenin)家族成員CTNNAL1(cation alpha-like1)是一種已知參與細胞黏附的蛋白,在細胞黏附和信號轉(zhuǎn)導中發(fā)揮作用,能夠調(diào)節(jié)細胞遷移和入侵能力。CTNNAL1在肺癌和膠質(zhì)瘤中高表達,且與不良預后有關(guān),被認為是癌癥驅(qū)動因子[43]。在乳腺癌中,CTNNAL1被報道為抑癌基因,但其具體作用機制仍需進一步研究[44]。DNA酶Ⅰ樣蛋白3(DNASE1L3)是一種Ca2+/Mg2+依賴性的核酸內(nèi)切酶,能夠消化細胞在惡性轉(zhuǎn)變或死亡時釋放的DNA,這一過程與腫瘤的發(fā)生和發(fā)展密切相關(guān)[45]。在腎癌細胞系中過表達DNASE1L3后,抑制了腫瘤細胞的增殖和侵襲能力。此外,在結(jié)腸癌中,DNASE1L3能增強抗腫瘤免疫并抑制結(jié)腸癌的進展[46]。研究還發(fā)現(xiàn),DNASE1L3的缺乏與人類自身免疫性疾病的發(fā)展相關(guān)。DNASE1L3可能與腫瘤微環(huán)境中的免疫浸潤相互作用,從而影響腫瘤患者的預后,并與多種腫瘤浸潤免疫細胞的基因標記相關(guān)[47]。DNASE1L3的功能恢復或其作為免疫治療靶點的調(diào)控,有望提升免疫系統(tǒng)對腫瘤的識別和清除,成為乳腺癌治療的新方向[48]。雖然目前研究仍處于初期階段,但其在免疫逃逸和腫瘤免疫微環(huán)境中的重要作用,使其成為未來乳腺癌免疫治療中值得關(guān)注的靶標。同源盒基因A9(HOXA9)是多種生物過程的調(diào)節(jié)因子,研究揭示HOXA9中發(fā)生了廣泛表觀遺傳學變異,這賦予了其在腫瘤中重要的生物學意義[49]。有研究表明,HOXA9在三陰性乳腺癌(TNBC)中出現(xiàn)低表達,增加HOXA9的表達可以顯著抑制癌細胞的增殖和遷移,同時促進癌細胞的凋亡[50]。磷脂酰肌醇-3激酶調(diào)節(jié)亞基1(PIK3R1)是PI3K的主要調(diào)節(jié)亞基,而PI3K與細胞存活、增殖、遷移密切相關(guān)[51]。低表達的PIK3R1與BC的不良預后有關(guān),使用miR-221-3p抑制劑靶向PIK3R1使其表達上升后,可以減弱細胞對阿霉素的耐藥性[52]。分泌性白細胞蛋白酶抑制因子(SLPI)是一種由黏膜上皮細胞等分泌的具有抗菌和抗炎功能的非糖基化陽離子蛋白[53]。研究發(fā)現(xiàn),SLPI在乳腺癌中下調(diào),并與SLPI共表達的基因具有重要的關(guān)系。利用生物信息學方法,系統(tǒng)揭示了SLPI在乳腺癌中的預后價值[54]。結(jié)合現(xiàn)有研究,本研究中所獲得的低表達基因在乳腺癌中具有潛在的應用前景。無論是我們的研究結(jié)果還是已有研究,都表明CTNNAL1、DNASE1L3、HOXA9、PIK3R1和SLPI屬于乳腺癌的低表達基因。
值得注意的是,不管是高表達還是低表達的基因,它們在BC中的機制作用都應該被重視,對于高表達基因設計合適的抑制劑降低基因的表達在目前看來是最可能對BC的臨床治療產(chǎn)生積極作用的方式。而低表達基因找到其激活劑尤為重要,現(xiàn)有研究發(fā)現(xiàn),絕大多數(shù)的低表達基因的表達水平降低代表著BC的不良預后,因此,增加低表達基因的表達對延長BC患者的生存率也許是有幫助的。無論如何,本研究所獲得的疾病關(guān)鍵基因均與腫瘤的免疫相關(guān),預示著它們成為BC免疫治療理想靶點的潛力,正確地開發(fā)它們的價值也許對未來BC的診治具有光明的應用前景。
然而,本研究存在著一些不可避免的局限性。首先,eQTL基因數(shù)據(jù)集的樣本量欠佳,因為IVs的準確性高度依賴于GWAS的樣本量。其次,MR分析所使用的GWAS數(shù)據(jù)均來自歐洲人群,這可能導致結(jié)果在其他人群中的適用是有限的。最后,本研究得出了一個包含9個基因的預測模型,為了提高預測精準性還應對基因進行分析和篩選出最適合的關(guān)鍵基因,并通過實驗驗證。
參 考 文 獻
[1] SIEGEL R L, MILLER K D, FUCHS H E, et al. Cancer statistics, 2022 [J]. CA Cancer J Clin, 2022, 72(1): 7-33.
[2] LI X, JIN Y, XUE J. Unveiling collagen's role in breast cancer:insights into expression patterns,functions and clinical implications[J]. Int J Gen Med,2024,17:1773-1787.
[3] LEE Y, NI J, BERETOV J, et al. Recent advances of small extracellular vesicle biomarkers in breast cancer diagnosis and prognosis[J]. Mol Cancer,2023,22(1):33.
[4] ZHU Z, ZHANG F, HU H, et al. Integration of summary data from GWAS and eQTL studies predicts complex trait gene targets[J]. Nat Genet,2016,48(5):481-487.
[5] RATNAPRIYA R, SOSINA O A, STAROSTIK M R, et al. Author Correction:Retinal transcriptome and eQTL analyses identify genes associated with age-related macular degeneration[J]. Nat Genet,2019,51:1067.
[6] EMDIN C A, KHERA A V, KATHIRESAN S. Mendelian randomization[J]. JAMA,2017,318(19):1925-1926.
[7] LIU L Y, CHANG L Y, KUO W H, et al. Major functional transcriptome of an inferred center regulator of an ER (-) breast cancer model system[J]. Cancer Inform,2012,11:87-111.
[8] HAAKENSEN V D, BIONG M, LINGJRDE O C, et al. Expression levels of uridine 5'-diphospho-glucuronosyltransferase genes in breast tissue from healthy women are associated with mammographic density[J]. Breast Cancer Res,2010,12(4):R65.
[9] CHEN C, GRENNAN K, BADNER J, et al. Removing batch effects in analysis of expression microarray data: an evaluation of six batch adjustment methods[J]. PLoS One,2011,6(2):e17238.
[10] RITCHIE M E, PHIPSON B, WU D, et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies[J]. Nucleic Acids Res,2015,43(7):e47.
[11] ITO K, MURPHY D. Application of ggplot2 to pharmacometric graphics[J]. CPT Pharmacometrics Syst Pharmacol,2013,2:e79.
[12] HEMANI G, ZHENG J, ELSWORTH B, et al. The MR-Base platform supports systematic causal inference across the human phenome[J]. Elife,2018,7:e34408.
[13] BURGESS S, THOMPSON S G. Bias in causal estimates from Mendelian randomization studies with weak instruments[J]. Stat Med,2011,30(11):1312-1323.
[14] OBENCHAIN V, LAWRENCE M, CAREY V, et al. Variant annotation: a bioconductor package for exploration and annotation of genetic variants[J]. Bioinformatics,2014,30(14):2076-2078.
[15] LIN Z, DENG Y, PAN W. Combining the strengths of inverse-variance weighting and Egger regression in Mendelian randomization using a mixture of regressions model[J]. PLoS Genet,2021,17(11):e1009922.
[16] YAVORSKA O O, BURGESS S. Mendelian Randomization:an R package for performing Mendelian randomization analyses using summarized data[J]. Int J Epidemiol,2017,46(6):1734-1739.
[17] VAN KIPPERSLUIS H, RIETVELD C A. Pleiotropy-robust mendelian randomization[J]. Int J Epidemiol,2018,47(4):1279-1288.
[18] BOWDEN J, DEL GRECO M F, MINELLI C, et al. Assessing the suitability of summary data for two-sample Mendelian randomization analyses using MR-Egger regression:the role of the I2 statistic[J]. Int J Epidemiol,2016,45(6):1961-1974.
[19] YIN K J, HUANG J X, WANG P, et al. No genetic causal association between periodontitis and arthritis:a bidirectional two-sample mendelian randomization analysis[J]. Front Immunol,2022,13:808832.
[20] GU Z G, GU L, EILS R, et al. Circlize implements and enhances circular visualization in R[J]. Bioinformatics,2014,30(19):2811-2812.
[21] LIBERZON A, SUBRAMANIAN A, PINCHBACK R, et al. Molecular signatures database (MSigDB) 3.0[J]. Bioinformatics,2011,27(12):1739-1740.
[22] NEWMAN A M, LIU C L, GREEN M R, et al. Robust enumeration of cell subsets from tissue expression profiles[J]. Nat Meth,2015,12:453-457.
[23] LI C J, TZENG Y T, CHIU Y H, et al. Pathogenesis and potential therapeutic targets for triple-negative breast cancer[J]. Cancers:Basel,2021,13(12):2978.
[24] SUPPAN C, BALIC M. Current standards and future outlooks in metastatic Her2-positive breast cancer[J]. Breast Care:Basel,2023,18(1):69-75.
[25] LI C J, CHU P Y, YIANG G T, et al. The molecular mechanism of epithelial-mesenchymal transition for breast carcinogenesis[J]. Biomolecules,2019,9(9):E476.
[26] TZENG Y T, TSUI K H, TSENG L M, et al. Integrated analysis of pivotal biomarker of LSM1,immune cell infiltration and therapeutic drugs in breast cancer[J]. J Cell Mol Med,2022,26(14):4007-4020.
[27] RAKHSHANINEJAD M, FATHIAN M, SHIRKOOHI R, et al. Refining breast cancer biomarker discovery and drug targeting through an advanced data-driven approach[J]. BMC Bioinformatics,2024,25(1):33.
[28] NANDA R, CHOW L Q, DEES E C, et al. Pembrolizumab in patients with advanced triple-negative breast cancer:phase ib KEYNOTE-012 study[J]. J Clin Oncol,2016,34(21):2460-2467.
[29] KüNZLI M, MASOPUST D. CD4+ T cell memory[J]. Nat Immunol,2023,24(6):903-914.
[30] MATSUI T, TANIGUCHI S, ISHII M. Function of alveolar macrophages in lung cancer microenvironment[J]. Inflamm Regen,2024,44(1):23.
[31] DE SIMONE G, ANDREATA F, BLERIOT C, et al. Identification of a Kupffer cell subset capable of reverting the T cell dysfunction induced by hepatocellular priming[J]. Immunity,2021,54(9):2089-2100.e8.
[32] BASTOS I M, REBELO S, SILVA V L M. A review of poly(ADP-ribose)polymerase-1 (PARP1) role and its inhibitors bearing pyrazole or indazole core for cancer therapy[J]. Biochem Pharmacol,2024,221:116045.
[33] DULANEY C, MARCROM S, STANLEY J, et al. Poly(ADP-ribose) polymerase activity and inhibition in cancer[J]. Semin Cell Dev Biol,2017,63:144-153.
[34] DUTTA P, PAICO K, GOMEZ G, et al. Transcriptional regulation of CCL2 by PARP1 is a driver for invasiveness in breast cancer[J]. Cancers:Basel,2020,12(5):E1317.
[35] SINGH R, BANDYOPADHYAY D. MUC1:a target molecule for cancer therapy[J]. Cancer Biol Ther,2007,6(4):481-486.
[36] RAJABI H, HIRAKI M, KUFE D. MUC1-C activates polycomb repressive complexes and downregulates tumor suppressor genes in human cancer cells[J]. Oncogene,2018,37:2079-2088.
[37] ABTIN M, NAFISI N, HOSSEINZADEH A, et al. Inhibition of breast cancer cell growth and migration through siRNA-mediated modulation of circ_0009910/miR-145-5p/MUC1 axis[J]. Non Coding RNA Res,2024,9(2):367-375.
[38] LI D P, HUANG L, KAN R R, et al. LILRB2/PirB mediates macrophage recruitment in fibrogenesis of nonalcoholic steatohepatitis[J]. Nat Commun,2023,14:4436.
[39] WANG Y, JOHNSON K C C, GATTI-MAYS M E, et al. Emerging strategies in targeting tumor-resident myeloid cells for cancer immunotherapy[J]. J Hematol Oncol,2022,15(1):118.
[40] JIANG Z Y, HUANG Q R, CHANG Y J, et al. LILRB2 promotes immune escape in breast cancer cells via enhanced HLA-a degradation[J]. Cell Oncol,2024,47(5):1679-1696.
[41] WEI B, JIN J P. TNNT1 TNNT2 and TNNT3 Isoform genes,regulation,and structure–function relationships[J]. Gene,2016,582(1):1-13.
[42] SHI Y W, ZHAO Y, ZHANG Y J, et al. TNNT1 facilitates proliferation of breast cancer cells by promoting G1/S phase transition[J]. Life Sci,2018,208:161-166.
[43] KAHM Y J, JUNG U, KIM R K. Regulation of cancer stem cells and epithelial-mesenchymal transition by CTNNAL1 in lung cancer and glioblastoma[J]. Biomedicines,2023,11(5):1462.
[44] T?KéS A M, SZáSZ A M, JUHáSZ E, et al. Expression of tight junction molecules in breast carcinomas analysed by array PCR and immunohistochemistry[J]. Pathol Oncol Res,2012,18(3):593-606.
[45] WILBER A, LU M, SCHNEIDER M C. Deoxyribonuclease I-like III is an inducible macrophage barrier to liposomal transfection[J]. Mol Ther,2002,6(1):35-42.
[46] LI W, NAKANO H, FAN W, et al. DNASE1L3 enhances antitumor immunity and suppresses tumor progression in colon cancer[J]. JCI Insight,2023,8(17):e168161.
[47] DENG Z, XIAO M, DU D, et al. DNASE1L3 as a prognostic biomarker associated with immune cell infiltration in cancer[J]. Onco Targets Ther,2021,14:2003-2017.
[48] SHENOY U S, ADIGA D, ALHEDYAN F, et al. HOXA9 transcription factor is a double-edged sword:from development to cancer progression[J]. Cancer Metastasis Rev,2024,43(2):709-728.
[49] WANG S M, PANG J, ZHANG K J, et al. LncRNA MIR503HG inhibits cell proliferation and promotes apoptosis in TNBC cells via the miR-224-5p/HOXA9 axis[J]. Mol Ther Oncolytics,2021,21:62-73.
[50] HIRSCH E, CIRAOLO E, FRANCO I, et al. PI3K in cancer-stroma interactions:bad in seed and ugly in soil[J]. Oncogene,2014,33(24):3083-3090.
[51] HONG X, PAN X. Exosome-derived microRNA-221-3p desensitizes breast cancer cells to adriamycin by regulating PIK3r1-mediated glycose metabolism[J]. Cancer Biother Radiopharm,2024,39(6):463-475.
[52] MAJCHRZAK-GORECKA M, MAJEWSKI P, GRYGIER B, et al. Secretory leukocyte protease inhibitor (SLPI),a multifunctional protein in the host defense response[J]. Cytokine Growth Factor Rev,2016,28:79-93.
[53] ZHONG Q Q, WANG X, LI Y F, et al. Secretory leukocyte protease inhibitor promising protective roles in obesity-associated atherosclerosis[J]. Exp Biol Med:Maywood,2017,242(3):250-257.
[54] XIE W, ZHANG H, QIN S, et al. The expression and clinical significance of secretory leukocyte proteinase inhibitor (SLPI) in mammary carcinoma using bioinformatics analysis[J]. Gene,2019,720:144088.
(收稿日期:2024-09-26 修回日期:2024-12-09)
(編輯:潘明志)