段凱旋,曹珊,祁祥,聶興源
河南中醫(yī)藥大學(xué),河南 鄭州 450046
動(dòng)脈粥樣硬化(atherosclerosis,AS)是一種由脂質(zhì)和纖維物質(zhì)過度積聚,導(dǎo)致動(dòng)脈變得狹窄和硬化的慢性炎癥性疾病,是許多致命性心血管疾病的病理基礎(chǔ)[1-2]。據(jù)世界衛(wèi)生組織(WHO)公布,全球每年約1 700萬人死于心血管疾病,其中AS是最主要的致死原因[3]。隨著藥物、手術(shù)和介入等療法的不斷發(fā)展,AS的病死率呈下降趨勢(shì)。盡管他汀類藥物在AS的治療方面取得了一些進(jìn)展,但單一化學(xué)成分藥物對(duì)多基因、多因素相關(guān)的AS疾病的療效并不理想[4]。AS的病因非常復(fù)雜,涉及家族性高膽固醇血癥(familial hypercholesterolemia,FH)、高脂血癥、高血壓、吸煙、糖尿病、肥胖、免疫損傷和遺傳因素等[5]。由于AS病因復(fù)雜,并發(fā)癥多,確定與AS相關(guān)生物標(biāo)志物,不僅可以改善患者的治療,降低發(fā)病風(fēng)險(xiǎn),還可以指導(dǎo)新療法的設(shè)計(jì)。
微陣列常用于進(jìn)行大規(guī)模生物信息學(xué)研究,闡明多個(gè)不同基因與特定疾病之間的關(guān)系[6]。自21世紀(jì)以來,生物信息學(xué)技術(shù)越來越多地用于挖掘疾病的潛在遺傳靶點(diǎn),助力研究人員鑒定與AS發(fā)生和發(fā)展相關(guān)的差異表達(dá)基因(differentially expressed genes,DEGs)及其潛在通路[7-8]。研究發(fā)現(xiàn),微陣列已被廣泛用于預(yù)測(cè)AS的潛在靶點(diǎn)[9]。例如,最近的一項(xiàng)綜合生物信息學(xué)分析強(qiáng)調(diào)了腫瘤壞死因子(tumor necrosis factor,TNF)信號(hào)通路在AS發(fā)展中的作用[10]。故本研究通過獲取GSE13985和GSE6088數(shù)據(jù)集,進(jìn)行樣本的GEO2R分析,得出DEGs分為上調(diào)基因和下調(diào)基因。進(jìn)一步利用生物信息學(xué)方法分析相關(guān)生物學(xué)過程,以期為中醫(yī)藥治療AS探索新的靶點(diǎn)。
1.1 數(shù)據(jù)集的獲取以“Atherosclerosis”為關(guān)鍵詞,在美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)創(chuàng)建并維護(hù)的GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo)[11]檢索篩選與AS研究相關(guān)的數(shù)據(jù)集GSE13985(平臺(tái)GPL570)和GSE6088(平臺(tái)GPL570)。
1.2 DEG的數(shù)據(jù)處理使用GEO2R工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/)識(shí)別AS樣本中DEGs,設(shè)置篩選標(biāo)準(zhǔn)|log2FC|>1且P<0.05,利用R(3.6.3版本)的“pheatmap”包和“ggplot2”包將表達(dá)數(shù)據(jù)以熱圖和火山圖呈現(xiàn),同時(shí)篩選出兩個(gè)數(shù)據(jù)集中共同表達(dá)的上調(diào)、下調(diào)DEGs以韋恩圖呈現(xiàn)。
1.3 DEGs的富集分析將“1.2”項(xiàng)獲取的共同DEGs導(dǎo)入DAVID(Database for Annotation,Visualization and Integrated Discovery;https://david.ncifcrf.gov/)數(shù)據(jù)庫[12],利用R的“ggplot2”包進(jìn)行基因本體(Gene Ontology,GO)功能富集分析、京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析(P<0.05)。根據(jù)P值選取最佳結(jié)果進(jìn)行可視化分析。
1.4 蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)和Hubba插件分析為了探究DEGs之間的相互作用,將上調(diào)、下調(diào)的DEGs導(dǎo)入到STRING(Search Tool for the Retrieval of Interacting Genes;https://string-db.org/)數(shù)據(jù)庫中構(gòu)建PPI網(wǎng)絡(luò),最高置信度大于0.900[12]。保存結(jié)果并下載TSV文件導(dǎo)入Cytoscape 3.9.1,基于cyto-Hubba插件根據(jù)度值進(jìn)行基因排名,獲取前10個(gè)最高程度值Hub基因及前4個(gè)關(guān)鍵基因。
1.5 核心基因中藥及成分預(yù)測(cè)將排名靠前的核心基因作為預(yù)測(cè)靶標(biāo),以P<0.05為標(biāo)準(zhǔn)將其導(dǎo)入醫(yī)學(xué)本體信息檢索數(shù)據(jù)庫(Coremine Medical)中,以藥物被《中華人民共和國藥典》收錄為條件,進(jìn)一步篩選對(duì)各預(yù)測(cè)靶標(biāo)具有生物學(xué)效應(yīng)的前10位中藥并統(tǒng)計(jì)頻數(shù)[13]。
2.1 DEGs分析使用PCA來驗(yàn)證數(shù)據(jù)集GSE13985和GSE6088的可重復(fù)性。根據(jù)PCA,數(shù)據(jù)集GSE13985和GSE6088的組內(nèi)可重復(fù)性是可靠的(圖1)。GSE13985包含5例FH組,5例對(duì)照健康組;GSE6088包含3例純合FH組,7例雜合FH組,13例健康組。在GSE13985數(shù)據(jù)集中總共鑒定出 2 135 個(gè)DEGs(744個(gè)上調(diào),1 391個(gè)下調(diào))(圖2),在GSE6088數(shù)據(jù)集中鑒定出1 725個(gè)DEGs(773個(gè)上調(diào),952個(gè)下調(diào))(圖3)。其中,兩個(gè)數(shù)據(jù)集共有186個(gè)上調(diào)的DEGs和220個(gè)下調(diào)的DEGs(圖4)。
圖1 GSE13985和GSE6088的PCA驗(yàn)證
注:A:GSE13985數(shù)據(jù)集中前40個(gè)DEGs的表達(dá)熱圖;B:GSE6088數(shù)據(jù)集中前40個(gè)DEGs的表達(dá)熱圖。
注:A:GSE13985數(shù)據(jù)集對(duì)應(yīng)的火山圖;B:GSE6088數(shù)據(jù)集對(duì)應(yīng)的火山圖。
注:A:GSE13985和GSE6088數(shù)據(jù)集中的上調(diào)DEGs;B:GSE13985和GSE6088數(shù)據(jù)集中的下調(diào)DEGs。
2.2 GO功能、KEGG通路富集分析GO功能富集分析顯示406個(gè)DEGs主要通過對(duì)核糖體RNA代謝過程、β-連環(huán)蛋白TCF復(fù)合物組裝、RNA剪接、RNA轉(zhuǎn)錄、RNA轉(zhuǎn)錄后加工、脂質(zhì)磷酸化、肽基賴氨酸修飾、酯交換反應(yīng)、組蛋白修飾等生物過程影響AS;其影響的分子功能主要定位在賴氨酸乙?;M蛋白結(jié)合、乙?;蕾囆缘鞍捉Y(jié)合、鈣黏蛋白結(jié)合、細(xì)胞黏附分子結(jié)合、甲狀腺激素受體結(jié)合、轉(zhuǎn)錄輔壓子活性、轉(zhuǎn)錄輔激活因子活性、核激素受體結(jié)合、組蛋白甲基轉(zhuǎn)移酶活性、激素受體結(jié)合、細(xì)胞-基質(zhì)-黏附物結(jié)、細(xì)胞皮層、剪接體復(fù)合體、黑素小體、色素顆粒等;細(xì)胞組分參與U2型催化前剪接體、U12型剪接體復(fù)合體、催化前剪接體、黏著斑、組蛋白甲基轉(zhuǎn)移酶復(fù)合物、甲基轉(zhuǎn)移酶復(fù)合物、液泡膜、溶酶體膜等(圖5)。
注:A:DEGs和前15個(gè)GO功能的富集結(jié)果,紅色表示上調(diào)基因,藍(lán)色表示下調(diào)基因;B:前12個(gè)GO功能富集的Z-score結(jié)果。
KEGG通路主要包括代謝途徑、缺氧誘導(dǎo)因子-1(hypoxia-inducible factor-1,HIF-1)信號(hào)通路、沙門菌感染、剪接體、卡波西肉瘤相關(guān)皰疹病毒感染、甲狀腺激素信號(hào)通路、RNA降解、腎細(xì)胞癌、前列腺癌、磷脂酰肌醇信號(hào)系統(tǒng)、癌癥中的膽堿代謝、急性髓系白血病、賴氨酸降解、粘合連接、乙型糖尿病等(圖6)。
注:A:DEGs與前10條KEGG通路之間的關(guān)系;B:對(duì)應(yīng)DEGs和前10條富含KEGG二級(jí)通路的關(guān)系。
2.3 PPI網(wǎng)絡(luò)構(gòu)建和Hub基因確定采用STRING數(shù)據(jù)庫構(gòu)建DEGs的PPI網(wǎng)絡(luò),確定DEGs相互之間作用關(guān)系,其中,主要涉及313個(gè)節(jié)點(diǎn),982條邊(圖7),將DEGs信息導(dǎo)入Cytoscape3.9.1,利用cyto-Hubba插件,構(gòu)建DEGs上調(diào)、下調(diào)基因PPI(圖8)。根據(jù)度值確定前10個(gè)Hub基因,分別為CTNNB1、POLR2A、CREBBP、BPTF、SMARCA4、KMT2D、KMT2A、POLR2F、SETD1A和HSPA5。其中,前4個(gè)關(guān)鍵基因?yàn)镃TNNB1、POLR2A、CREBBP和BPTF(圖9和表1)。
表1 Top模塊中前10個(gè)基因的程度
圖7 基于STRING數(shù)據(jù)庫構(gòu)建DEGs的PPI網(wǎng)絡(luò)圖
注:紅色為上調(diào)基因;藍(lán)色為下調(diào)基因。
圖9 使用cyto-Hubba根據(jù)度值確定前10個(gè)Hub基因及前4個(gè)關(guān)鍵基因(基因按照顏色從深到淺的程度降序排列)
2.4 抑制AS的中藥篩選最終得到與關(guān)鍵基因相關(guān)的中藥共122種,根據(jù)頻數(shù)統(tǒng)計(jì),黃芩、人參、三七、桑葉、藏紅花、冬蟲夏草、雷公藤可同時(shí)作用于3個(gè)靶基因,結(jié)果提示上述中藥具有多靶點(diǎn)多機(jī)制發(fā)揮治療AS的潛力,頻數(shù)統(tǒng)計(jì)結(jié)果見表2。
表2 抑制AS的中藥預(yù)測(cè)
AS作為一種慢性炎癥性疾病,其主要特征是膽固醇升高、血管壁增生、脂質(zhì)堆積等[14-15]。膽固醇是類固醇激素的前體,也是細(xì)胞膜的重要組成部分。膽固醇的合成、吸收及排泄改變的人群易患AS起源的心血管疾病[16]。過量的膽固醇可以加重AS,引起動(dòng)脈管壁狹窄,并在動(dòng)脈內(nèi)膜形成斑塊[17]。FH是常見的遺傳性代謝疾病之一,血液中異常高水平的低密度脂蛋白膽固醇(low density lipoprotein cholesterol,LDL-C)會(huì)導(dǎo)致AS過早發(fā)作。
本研究通過獲取GSE13985和GSE6088數(shù)據(jù)集,進(jìn)行樣本的GEO2R分析,得出DEGs分為上調(diào)基因和下調(diào)基因。其中分析GSE13985數(shù)據(jù)集,確定了744個(gè)上調(diào)和1 391個(gè)下調(diào)與AS相關(guān)的DEGs;分析GSE6088數(shù)據(jù)集,確定了773個(gè)上調(diào)和952個(gè)下調(diào)與AS相關(guān)的DEGs。GO功能和KEGG通路富集分析表明,AS中的DEGs主要參與核糖體RNA代謝過程、RNA剪接、酯交換反應(yīng)、組蛋白修飾、黏著斑、細(xì)胞-基底黏附結(jié)和代謝途徑,涉及HIF-1信號(hào)通路、甲狀腺激素信號(hào)通路等。抑制AS的中藥篩選結(jié)果表明,黃芩、藏紅花、冬蟲夏草等可以通過關(guān)鍵靶基因CTNNB1、POLR2A、CREBBP富集在代謝途徑和HIF-1信號(hào)通路發(fā)揮抗AS作用。
AS的早期階段,高膽固醇血癥會(huì)增加LDL的浸潤和滯留,釋放炎癥因子,激活炎癥細(xì)胞[18]。LDL與其受體(LDLR)的結(jié)合促進(jìn)其吸收和釋放游離膽固醇,LDL與肝臟分泌的游離失脂蛋白結(jié)合形成脂蛋白a,并與細(xì)胞外基質(zhì)結(jié)合沉積在血管中,在LDL過量的情況下導(dǎo)致AS發(fā)生[19]。HIF-1α主要通過轉(zhuǎn)錄激活、調(diào)節(jié)內(nèi)皮細(xì)胞、巨噬細(xì)胞和平滑肌細(xì)胞的反應(yīng),從而促進(jìn)AS的發(fā)展[20]。血管內(nèi)皮細(xì)胞的缺氧是加速AS過程的另一個(gè)重要因素,它會(huì)導(dǎo)致血管內(nèi)皮細(xì)胞中活性氧(reactive oxygen species,ROS)增加,加劇脂質(zhì)氧化,并在缺氧條件下引起蛋白質(zhì)和核酸變性[21]。HIF-1α可以促進(jìn)血管生成、AS斑塊中的炎癥細(xì)胞浸潤、平滑肌細(xì)胞的增殖和遷移以及促進(jìn)巨噬細(xì)胞泡沫化[22]。斑塊內(nèi)缺氧和血紅蛋白:結(jié)合珠蛋白復(fù)合物激活巨噬細(xì)胞中HIF-1α依賴性信號(hào),導(dǎo)致血管內(nèi)皮生長因子(vascular endothelial growth factor,VEGF)分泌增強(qiáng),進(jìn)而增加斑塊內(nèi)血管生成、血管通透性和白細(xì)胞募集[23]。
通過Cytoscape軟件插件分析,與AS相關(guān)的hub基因主要是CTNNB1、POLR2A和CREBBP。故CTNNB1、POLR2A和CREBBP有望成為新型治療AS藥物開發(fā)的生物標(biāo)志物。由于AS的發(fā)病機(jī)制與多基因遺傳相關(guān),表觀遺傳修飾對(duì)心血管疾病發(fā)病和防治起著重要作用[24]。表觀遺傳學(xué)是不斷發(fā)展的生物醫(yī)學(xué)研究領(lǐng)域。在AS中,多種血管細(xì)胞(主要包括內(nèi)皮細(xì)胞、血管平滑肌細(xì)胞和單核細(xì)胞/巨噬細(xì)胞)存在整體表觀遺傳改變,從而補(bǔ)充遺傳異常[25]。CTNNB1基因編碼的蛋白β-catenin是一種黏著連接蛋白,與鈣黏蛋白、α-catenin共同組成黏附連接復(fù)合體,調(diào)控細(xì)胞生長以及細(xì)胞間的黏附,對(duì)上皮細(xì)胞層的構(gòu)建與維持起著重要作用[26]。CTNNB1即WNT/β-catenin信號(hào)通路,經(jīng)典的WNT/β-catenin通路在心血管疾病的幾種病理生理機(jī)制中起著關(guān)鍵作用,例如炎癥、鈣化、纖維化和脂質(zhì)浸潤等[27]。WNT/β-catenin通路的激活增強(qiáng)了與炎癥、內(nèi)皮功能障礙、血管平滑肌細(xì)胞增殖和血管鈣化有關(guān)靶標(biāo)的轉(zhuǎn)錄[28]。POLR2A是細(xì)胞存活的必需基因,參與催化活性和轉(zhuǎn)移酶活性,對(duì)大多數(shù)蛋白質(zhì)編碼基因的轉(zhuǎn)錄至關(guān)重要,包括細(xì)胞增殖、遷移等[29]。POLR2A的丟失會(huì)觸發(fā)整體基因表達(dá)的失調(diào)并促進(jìn)衰老表型,最終造成細(xì)胞異常死亡[30]。CREBBP是一種多功能轉(zhuǎn)錄共激活因子,可與多種轉(zhuǎn)錄因子相互作用并充當(dāng)組蛋白乙酰轉(zhuǎn)移酶,同時(shí)也參與細(xì)胞轉(zhuǎn)錄、血管重塑、內(nèi)膜增生、細(xì)胞凋亡和信號(hào)傳導(dǎo)等生物學(xué)功能[31-32]。由于CREBBP受多種途徑調(diào)控,CREBBP缺陷型平滑肌細(xì)胞在體外表現(xiàn)出血清非依賴性增殖和肥大,并分泌可刺激外膜成纖維細(xì)胞增殖和表達(dá)細(xì)胞外基質(zhì)蛋白的可溶性因子促進(jìn)AS發(fā)生[33]。CREB蛋白不僅可以維持肝臟脂質(zhì)代謝,而且在脂質(zhì)合成、脂肪酸氧化和脂蛋白代謝的調(diào)節(jié)中,可以通過刺激Bnip3誘導(dǎo)的線粒體自噬來改善肝臟脂質(zhì)代謝和肝功能,從而減少線粒體依賴性細(xì)胞死亡并防止肝脂肪變性、纖維化[34]。隨著對(duì)表觀遺傳學(xué)的深入研究,染色質(zhì)調(diào)控因子在心肌缺血再灌注損傷、高血壓、AS等心血管疾病中發(fā)揮重要作用[35]。通過關(guān)鍵基因CTNNB1、POLR2A和CREBBP反向預(yù)測(cè)相關(guān)的中藥,獲得了黃芩等7種中藥。從中提煉出AS主要以活血化瘀、益氣滋陰為基本治法,為臨床運(yùn)用中醫(yī)藥治療AS提供有益參考。
FH對(duì)于AS的形成至關(guān)重要,遺傳變異可以調(diào)節(jié)LDL-C的水平促進(jìn)AS發(fā)展。借助生物信息學(xué)分析,發(fā)現(xiàn)中藥黃芩、人參、三七等7種中藥通過關(guān)鍵基因CTNNB1、POLR2A和CREBBP富集在代謝途徑和HIF-1信號(hào)通路上發(fā)揮抗AS作用。CTNNB1、POLR2A和CREBBP這3個(gè)基因有望成為診斷AS生物標(biāo)志物的關(guān)鍵Hub基因,為進(jìn)一步深入探索診斷AS提供靶點(diǎn),也為中醫(yī)藥治療AS的研究提供新的理論依據(jù)。