代華磊,胡成成,張桂敏,陶四明,陳建昆
(云南大學(xué)附屬醫(yī)院心血管病中心,云南 昆明 650021)
高血壓是心血管疾病共同的危險(xiǎn)因素,高血壓的長(zhǎng)期壓力超負(fù)荷必將引起心臟結(jié)構(gòu)和功能的改變,即心室重構(gòu)。心室重構(gòu)是心肌細(xì)胞凋亡、心臟肥大和心肌纖維化的復(fù)雜病理過(guò)程,主要表現(xiàn)為左室肥厚和慢性心力衰竭,其發(fā)生率會(huì)隨著高血壓的進(jìn)程逐漸上升,是人類健康的一大威脅[1]。心室重構(gòu)會(huì)進(jìn)一步損害心功能,最終引發(fā)心律失常、心衰、心肌梗死、猝死等嚴(yán)重并發(fā)癥[2]。
黃芪(Astragalus membranaceus)是一種傳統(tǒng)的中草藥,其主要成分為黃芪多糖、皂苷、黃酮類化合物等。研究表明,黃芪對(duì)心肌具有良好的保護(hù)作用,可在一定程度內(nèi)控制高血壓[3-4],但其作用的分子機(jī)制尚不明確。因此,借助網(wǎng)絡(luò)藥理學(xué)的方法挖掘黃芪治療高血壓心室重構(gòu)作用的靶點(diǎn)與通路,從微觀的角度科學(xué)論證黃芪治療高血壓心室重構(gòu)的作用機(jī)制具有重要意義。
網(wǎng)絡(luò)藥理學(xué)以生物學(xué)與藥理學(xué)的交叉學(xué)科理論為基礎(chǔ),從整體的角度探索藥物與疾病間的關(guān)聯(lián)性,運(yùn)用各組學(xué)、高通量篩選、網(wǎng)絡(luò)分析等多種前沿技術(shù),揭示 “疾病-基因-靶點(diǎn)-藥物”之間復(fù)雜的網(wǎng)絡(luò)關(guān)系,具備整體性和系統(tǒng)性的特點(diǎn)。與中藥及其方劑多組分、多靶點(diǎn)干預(yù)及系統(tǒng)調(diào)控的原理觀念基本一致,能夠多維度了解疾病的分子基礎(chǔ),預(yù)測(cè)藥物潛在的藥理作用機(jī)制[5-6]。本研究基于網(wǎng)絡(luò)藥理學(xué)原理,結(jié)合分子對(duì)接,全面分析黃芪治療高血壓心室重構(gòu)的分子機(jī)制,篩選出關(guān)鍵生物標(biāo)記物,為黃芪治療高血壓心室重構(gòu)提供更多潛在的生物標(biāo)記物以供后續(xù)的研究。
利用TCMSP(http://tcmspw.com/tcmsp.php)數(shù)據(jù)庫(kù)搜索關(guān)鍵詞黃芪的有效成分,共獲得87 個(gè)活性藥物。使用ETCM(http://www.tcmip.cn/ETCM/index.php/Home/)數(shù)據(jù)庫(kù)獲得黃芪的有效成分,共獲得20 個(gè)活性藥物。在TCMSP 數(shù)據(jù)庫(kù)及ETCM 數(shù)據(jù)庫(kù)中篩選每種藥物活性成分對(duì)應(yīng)的靶點(diǎn)。其中,TCMSP 數(shù)據(jù)庫(kù)共獲得藥物靶點(diǎn)181 個(gè),ETCM 數(shù)據(jù)庫(kù)共獲得藥物靶點(diǎn)254 個(gè)。對(duì)兩個(gè)數(shù)據(jù)庫(kù)獲得的藥物靶點(diǎn)取并集,共獲得390 個(gè)藥物靶點(diǎn)。利用Genecards(https://www.genecards.org/)數(shù)據(jù)庫(kù)獲取高血壓心室重構(gòu)的疾病靶點(diǎn),僅保留Category為Protein Coding 的基因,共獲得3 281 個(gè)相關(guān)靶點(diǎn)。利用GEO 數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)下載數(shù)據(jù)集GSE74144 的高血壓心室重構(gòu)及正常樣本全血的mRNA 測(cè)序數(shù)據(jù)及樣本信息。
將高血壓心室重構(gòu)作為WGCNA 的性狀數(shù)據(jù),使用R 包“WGCNA”篩選高血壓心室重構(gòu)相關(guān)的關(guān)鍵模塊及其基因。對(duì)樣本進(jìn)行聚類,軟閾值β=12,構(gòu)建共表達(dá)網(wǎng)絡(luò),并且使用動(dòng)態(tài)樹(shù)切割算法獲得模塊并分析各模塊與高血壓心室重構(gòu)的相關(guān)性,篩選出關(guān)鍵模塊。利用limma 包(version3.46.0)比較基因表達(dá)水平的差異性,使用R 語(yǔ)言ggplot2(version3.3.3)繪制火山圖來(lái)展示基因差異表達(dá)的情況。利用R 語(yǔ)言VennDiagram 包(version1.6.20)對(duì)差異表達(dá)基因及相關(guān)關(guān)鍵模塊基因取交集,獲得關(guān)鍵模塊基因[7-8]。
使用R 語(yǔ)言VennDiagram 包對(duì)藥物靶點(diǎn)、疾病靶點(diǎn)及差異的關(guān)鍵模塊基因取交集,并使用R語(yǔ)言ClusterProfiler 包進(jìn)行GO 功能/KEGG 通路富集分析[9]。利用Cytoscape(version3.8.2)軟件對(duì)關(guān)鍵靶點(diǎn)-功能、關(guān)鍵靶點(diǎn)-通路的調(diào)控網(wǎng)絡(luò)圖進(jìn)行可視化[10]。
針對(duì)關(guān)鍵靶點(diǎn)利用STRING(https://string-db.org)網(wǎng)站置信度為0.4(Confidence=0.4)繪制PPI網(wǎng)絡(luò),并采用cytoscape 進(jìn)行可視化。
利用LASSO[11]及RF 構(gòu)建高血壓心室重構(gòu)的診斷模型并進(jìn)行評(píng)估,并使用R 語(yǔ)言Venn-Diagram 包對(duì)模型基因取交集獲得生物標(biāo)記物。對(duì)生物標(biāo)記物進(jìn)行Pearson 相關(guān)性分析,并利用R 語(yǔ)言ggpubr 包繪制散點(diǎn)圖進(jìn)行可視化[12]。
對(duì)生物標(biāo)記物、藥物活性成分繪制中藥藥理調(diào)控網(wǎng)絡(luò),并使用Cytoscape 進(jìn)行可視化。
利用 PubChem(https://pubchem.ncbi.nlm.nih.gov/)數(shù)據(jù)庫(kù)下載藥物活性成分的3D 結(jié)構(gòu)。并從PDB(https://www1.rcsb.org/)數(shù)據(jù)庫(kù)得到關(guān)鍵靶點(diǎn)的蛋白結(jié)構(gòu),通過(guò)AutoDockTools(version1.5.6)完成蛋白質(zhì)加氫、計(jì)算電荷。從PubChem(https://pubchem.ncbi.nlm.nih.gov/)數(shù)據(jù)庫(kù)下載活性成分結(jié)構(gòu),使用AutoDockvina 進(jìn)行分子對(duì)接,最后利用PyMol(version2.5)軟件進(jìn)行可視化以及美化。
使用R 包“WGCNA”構(gòu)建共表達(dá)網(wǎng)絡(luò)(圖1),篩選高血壓心室重構(gòu)相關(guān)的關(guān)鍵模塊及基因。通過(guò)聚類分析篩選表達(dá)譜相似的基因模塊(圖1A,1B)。為保證基因間相互作用最大限度符合無(wú)尺度分布,選擇軟閾值β 為12(圖1C),以合并動(dòng)態(tài)剪切樹(shù)算法分析獲得11 個(gè)模塊(圖1D,1E)。通過(guò)模塊與性狀相關(guān)性分析(圖1F,1G),可以知道MEgrey60 模塊與高血壓心室重構(gòu)具有最高的基因顯著性(Cor=0.78,P=3e-4),且相關(guān)系數(shù)的絕對(duì)值最大,MEgrey60 基因與高血壓心室重構(gòu)性狀的相關(guān)系數(shù)為0.64(P< 0.05),MEgrey60 模塊共4 278 個(gè)基因,故我們選擇模塊MEgrey60 作為高血壓心室重構(gòu)的關(guān)鍵模塊進(jìn)行后續(xù)分析。
圖1 高血壓心室重構(gòu)關(guān)鍵模塊及其關(guān)鍵基因的篩選Fig.1 Screening of key modules of hypertensive ventricular remodeling and their key genes
通過(guò)R 語(yǔ)言ggplot2(version3.3.3)繪制火山圖來(lái)展示差異基因及其表達(dá)情況(圖1H)。共存在5 073 個(gè)差異表達(dá)的基因,其中3 132 個(gè)基因表達(dá)上調(diào),1941 個(gè)基因表達(dá)下調(diào)。
R 語(yǔ)言VennDiagram 包(version1.6.20)對(duì)高血壓心室重構(gòu)vs 對(duì)照組之間差異表達(dá)基因及WGCNA 獲得的高血壓心室重構(gòu)相關(guān)關(guān)鍵模塊基因取交集(圖1I),結(jié)果共獲得2 103 個(gè)差異表達(dá)的關(guān)鍵模塊基因。
使用R 語(yǔ)言VennDiagram 包對(duì)上述獲得的差異表達(dá)的關(guān)鍵模塊基因、藥物靶點(diǎn)及高血壓心室重構(gòu)疾病靶點(diǎn)取交集,共獲得24 個(gè)關(guān)鍵靶點(diǎn)(圖2A)。
圖2 關(guān)鍵靶點(diǎn)篩選及其調(diào)控網(wǎng)絡(luò)Fig.2 Screening of key targets and their regulatory networks
使用R 語(yǔ)言“enrichplot”(version1.10.2)對(duì)關(guān)鍵靶點(diǎn)基因進(jìn)行功能富集分析,繪制結(jié)果圖。GO 功能富集分析結(jié)果條形圖(圖2B)。在生物過(guò)程方面,共獲得288 個(gè)Terms,關(guān)鍵靶點(diǎn)基因與細(xì)胞對(duì)非生物刺激的反應(yīng)、細(xì)胞對(duì)化學(xué)應(yīng)激的反應(yīng)及對(duì)氧化應(yīng)激的反應(yīng)顯著相關(guān)。在分子功能方面,共獲得15 個(gè)Terms,關(guān)鍵靶點(diǎn)基因與異構(gòu)酶活性、轉(zhuǎn)氨酶活性、有機(jī)酸結(jié)合、激酶調(diào)節(jié)活性功能等顯著相關(guān)。在細(xì)胞組成方面,共獲得29個(gè)Terms,關(guān)鍵靶點(diǎn)基因與膜區(qū)、膜微區(qū)、質(zhì)膜結(jié)合細(xì)胞投射細(xì)胞質(zhì)等顯著相關(guān)。KEGG 通路富集分析結(jié)果氣泡圖(圖2C)。結(jié)果顯示,關(guān)鍵靶點(diǎn)基因與長(zhǎng)壽調(diào)節(jié)途徑、精氨酸生物合成、酪氨酸代謝、甲狀腺激素信號(hào)通路等顯著相關(guān)。
將GO_BP、GO_CC、GO_MF 的Terms 其 對(duì)應(yīng)的的關(guān)鍵靶點(diǎn)提出來(lái),構(gòu)建了關(guān)鍵靶點(diǎn)-功能的調(diào)控網(wǎng)絡(luò)圖,并進(jìn)行可視化(圖2D),圖中包含30 個(gè)Term,22 個(gè)關(guān)鍵靶點(diǎn),共131 個(gè)關(guān)系對(duì)。將KEGG TOP50 Pathways 及其對(duì)應(yīng)的的關(guān)鍵靶點(diǎn)提出來(lái),構(gòu)建關(guān)鍵靶點(diǎn)-通路的調(diào)控網(wǎng)絡(luò)圖,并進(jìn)行可視化(圖2E),網(wǎng)絡(luò)包含20 條KEGG Pathways,16 個(gè)關(guān)鍵靶點(diǎn),共73 個(gè)關(guān)系對(duì)。
利用STRING(https://string-db.org)網(wǎng)站對(duì)24個(gè)關(guān)鍵靶點(diǎn)進(jìn)行PPI 網(wǎng)絡(luò)構(gòu)建(圖2F)。置信度為0.4(Confidence=0.4),去除離散的蛋白,得到21個(gè)蛋白的互作網(wǎng)關(guān)系,包括21 個(gè)節(jié)點(diǎn),88 條邊。
合并后數(shù)據(jù)集的所有樣本(n=22)以5∶5 的比例隨機(jī)分為訓(xùn)練集(n=11)及驗(yàn)證集(n=11)用來(lái)進(jìn)行診斷模型的構(gòu)建及驗(yàn)證(圖3)。LASSO 分析工具為R 語(yǔ)言glmnet 包(version4.1-1),得到了LASSO 回歸常見(jiàn)的有兩個(gè)圖形(圖3A),一個(gè)是基因系數(shù)的圖形,一個(gè)是交叉驗(yàn)證的誤差圖。使用R 語(yǔ)言pROC(version1.17.0.1)繪制訓(xùn)練集及驗(yàn)證集的ROC(receiver operating characteristic curve)曲線,并計(jì)算AUC(Area Under Curve)值,一般AUC 值越大,說(shuō)明預(yù)測(cè)的越準(zhǔn)確(圖3B)。圖中訓(xùn)練集及驗(yàn)證集的AUC 均大于0.9,說(shuō)明該診斷模型對(duì)高血壓心室重構(gòu)具有較高的預(yù)測(cè)能力。
圖3 高血壓心室重構(gòu)最佳診斷模型Fig.3 Best diagnostic model for hypertensive ventricular remodeling
基于得到的24 個(gè)關(guān)鍵靶點(diǎn)在GSE74144 數(shù)據(jù)庫(kù)(高血壓心室重構(gòu)=14,Normal=8)中各個(gè)樣本的表達(dá)值,結(jié)合樣本的分組信息,其中以樣本分組作為響應(yīng)變量,24 個(gè)關(guān)鍵靶點(diǎn)作為解釋變量,我們采用R 語(yǔ)言“caret”包(version6.0-86)構(gòu)建RF 模型,并使用R 語(yǔ)言DALEX 包(version2.3.0)包的explain 函數(shù)對(duì)RF 模型進(jìn)行解釋性分析,并用plot 函數(shù)對(duì)模型表現(xiàn)分布進(jìn)行可視化,分別繪制累積殘差分布圖和箱線圖分布圖(圖3C,D),接著分析在RF 模型中,不同變量對(duì)于模型預(yù)測(cè)的相對(duì)重要性程度(圖3E),由表1 可知,在RF模型中,CSNK2B,MAPK1,GHR,MBL2,SELE,IL2 這6 個(gè)變量對(duì)響應(yīng)變量(group,score=0.136 6)的預(yù)測(cè)值有較大的影響(響應(yīng)變量以上的基因被選為特征基因),因此本研究將這6 個(gè)基因作為候選診斷標(biāo)志物用作下一步分析。本研究對(duì)RF 模型的診斷價(jià)值進(jìn)行了評(píng)估,結(jié)果RF 模型的AUC 為0.955,說(shuō)明RF 模型對(duì)高血壓心室重構(gòu)具有較高的預(yù)測(cè)能力(圖3F)。
表1 基因在RF 模型中的重要性排序Tab.1 Ranking of importance of genes in the RF model
使用R 語(yǔ)言VennDiagram 包(version1.6.20)對(duì)LASSO 及RF 算法獲得的基因取交集,結(jié)果共獲得4 個(gè)候選基因(MAPK1,IL2,CSNK2B,SELE)(圖4A),并且本研究對(duì)4 個(gè)基因繪制單基因ROC 曲線(圖4B),并計(jì)算AUC 值,所有交集基因的AUC 值均在0.8 以上。因此,本研究將MAPK1,IL2,CSNK2B,SELE 作為生物標(biāo)記物進(jìn)行后續(xù)分析。
圖4 關(guān)鍵基因的篩選及其表達(dá)分析Fig.4 Screening and expression analysis of key genes
對(duì)4 個(gè)生物標(biāo)記物在高血壓心室重構(gòu)樣本及正常樣本之間的表達(dá)情況進(jìn)行了研究,并使用R 語(yǔ)言ggpubr 包(version0.4.0)及ggplot2 包(version3.3.3)繪制散點(diǎn)圖進(jìn)行可視化(圖4C)。由圖可知,MAPK1 和CSNK2B 在高血壓心室重構(gòu)樣本中上調(diào)表達(dá);而IL2 和SELE 在高血壓心室重構(gòu)樣本中下調(diào)表達(dá)。同時(shí),本研究對(duì)生物標(biāo)記物之間進(jìn)行了Pearson 相關(guān)性分析,并繪制相關(guān)性熱圖(圖4D)??芍?,生物標(biāo)記物之間存在較強(qiáng)的相關(guān)性。
將上述獲得4 個(gè)生物標(biāo)記物對(duì)應(yīng)的活性成分提出來(lái),構(gòu)建了藥物-活性成分-關(guān)鍵靶點(diǎn)基因網(wǎng)絡(luò)關(guān)鍵,并用Cytoscape 進(jìn)行可視化(圖5),網(wǎng)絡(luò)包含1 個(gè)藥物(黃芪),3 個(gè)藥物活性成分,4 個(gè)生物標(biāo)記物,共12 個(gè)關(guān)系對(duì)。
圖5 生物標(biāo)記物的中藥藥理調(diào)控網(wǎng)絡(luò)Fig.5 TCM pharmacological regulatory network of biomarkers
提取了生物標(biāo)記物的靶向活性分子,分別進(jìn)行了分子對(duì)接(圖6)。SELE 與Kaempferol 進(jìn)行分子對(duì)接(圖6A),其中ASN-83、LYS-55、GLU-71 及LYS-74 殘基與Kaempferol 分子有氫鍵相互作用?;钚苑肿优c蛋白之間的對(duì)接親和力為-5.9 kcal/mol。MAPK1 與quercetin 進(jìn)行分子對(duì)接(圖6B),其中LYS-114、MET-108、ASP-167、LYS-54 及ILE-31 殘基與quercetin 分子有氫鍵相互作用?;钚苑肿优c蛋白之間的對(duì)接親和力為-8.3 kcal/mol。IL2 與quercetin 進(jìn)行分子對(duì)接(圖6C),其中GLU-52,SER-127 及GLN-126殘基與quercetin 分子有氫鍵相互作用?;钚苑肿优c蛋白之間的對(duì)接親和力為-6.8 kcal/mol。CSNK2B 與Kumatakenin 進(jìn)行分子對(duì)接(圖6D),其中 GLN-96,ARG-92 及 LYS-100 殘基與Kumatakenin 分子有疏水鍵相互作用?;钚苑肿优c蛋白之間的對(duì)接親和力為-6.2 kcal/mol。
圖6 分子對(duì)接結(jié)果圖Fig.6 Molecular docking result
高血壓是心血管疾病發(fā)生的基礎(chǔ),其與心血管疾病的發(fā)病率呈線性相關(guān),長(zhǎng)期的高血壓可誘導(dǎo)心室重構(gòu)發(fā)生,進(jìn)而增加患者死亡率[13]。特別在頑固性高血壓人群中,血壓往往難以控制,需使用的降壓藥物種類多,增加了藥物不良反應(yīng)[14]。黃芪能夠通過(guò)抑制通路的活化改善心臟的功能、減輕心室重構(gòu)[15],但大劑量使用會(huì)引起胃腸不適、腹瀉、惡心和嘔吐等癥狀。因此,探索黃芪治療高血壓心室重構(gòu)新的治療靶點(diǎn)和方法顯得尤為重要。
利用網(wǎng)絡(luò)藥理學(xué)原理篩選出黃芪治療高血壓心室重構(gòu)的關(guān)鍵生物標(biāo)記物主要為MAPK1、IL2、CSNK2B、SELE。絲裂原活化蛋白激酶(mitogenactivated protein kinase,MAPK)是一組絲氨酸-蘇氨酸蛋白激酶,其介導(dǎo)調(diào)節(jié)多種細(xì)胞過(guò)程的關(guān)鍵信號(hào)通路,與細(xì)胞的增值、分化、凋亡有關(guān)。MAPK 通路能夠促進(jìn)平滑肌增殖和膠原合成,改變細(xì)胞外基質(zhì)(extracellular matrix,ECM)的構(gòu)成,從而使血管重塑加重[16]。MAPK1(也稱為細(xì)胞外信號(hào)調(diào)節(jié)蛋白激酶2,ERK2)是MAPK 家族的成員,研究表明,ERK1/2 信號(hào)通路可調(diào)節(jié)心臟偏心性和向心性生長(zhǎng)之間的平衡[17]。MEK-ERK1/2信號(hào)傳導(dǎo)有促心室重構(gòu)的作用,可對(duì)大多數(shù)已知誘導(dǎo)肥厚生長(zhǎng)的壓力刺激作出反應(yīng),而抑制MEKERK1/2 信號(hào)通路對(duì)壓力超負(fù)荷所致的心臟肥大具有保護(hù)作用[18]。
炎癥與高血壓等心血管疾病的發(fā)展有關(guān)[19]。先天性和適應(yīng)性的免疫反應(yīng)都是通過(guò)與腎臟、血管和大腦相關(guān)的炎癥變化,從而促進(jìn)了高血壓的病理發(fā)展[20]。炎癥介質(zhì)通過(guò)增加血管通透性,釋放細(xì)胞因子、ROS、NO 和MMP 促進(jìn)高血壓的發(fā)生發(fā)展。細(xì)胞因子的釋放會(huì)導(dǎo)致阻力血管管腔直徑縮小,血管阻力和硬度進(jìn)而增加[21]。IL2 是一種多效細(xì)胞因子,對(duì)T 細(xì)胞增殖、效應(yīng)細(xì)胞和記憶細(xì)胞的產(chǎn)生有至關(guān)重要的作用[22]。有研究表明,由IL2 和抗IL2 mAb(JES2-6)組成的IL2 免疫復(fù)合物可抑制炎癥反應(yīng)并減輕心肌梗死后的心室重塑[23]。
CSNK2B 編碼絡(luò)蛋白激酶Ⅱ(casein kinase2,CK2)的β 亞基,可調(diào)節(jié)信號(hào)轉(zhuǎn)導(dǎo)、代謝途徑、復(fù)制、轉(zhuǎn)錄和翻譯[24]。CSNK2B 參與炎性細(xì)胞因子的表達(dá),促使內(nèi)質(zhì)網(wǎng)應(yīng)激[25]。內(nèi)質(zhì)網(wǎng)應(yīng)激在高血壓及其并發(fā)疾病中發(fā)揮重要作用,其通過(guò)損傷血管內(nèi)皮介導(dǎo)的血管舒張功能參與高血壓的形成[26-27],內(nèi)質(zhì)網(wǎng)應(yīng)激還參與了心室重構(gòu)過(guò)程,導(dǎo)致心肌細(xì)胞肥大和心臟纖維化[28-29]。
高血壓的發(fā)生還與內(nèi)皮細(xì)胞功能障礙有關(guān)[30]。SELE 編碼的E-選擇素,存在于細(xì)胞因子刺激的內(nèi)皮細(xì)胞中,是一種內(nèi)皮細(xì)胞粘附分子,對(duì)內(nèi)皮細(xì)胞活化具有特異性,被認(rèn)為是介導(dǎo)細(xì)胞與血管壁粘附從而導(dǎo)致白細(xì)胞在炎癥部位積聚的原因[31]。SELE 在mRNA 和蛋白質(zhì)水平表達(dá)的增加與高血壓有顯著的相關(guān)性[32]。而在中國(guó)人群中SELE 基因多態(tài)性(A561C)的C 等位基因攜帶者易患高血壓[33]。
綜上所述,結(jié)合我們的研究結(jié)果,所篩選出的4 個(gè)生物標(biāo)記物MAPK1、IL2、CSNK2B、SELE具有較高生物學(xué)活性,闡明了黃芪對(duì)高血壓心室重構(gòu)治療可能的分子機(jī)制,可以作為黃芪治療高血壓心室重構(gòu)的潛在生物標(biāo)志物和關(guān)鍵治療靶點(diǎn),為高血壓心室重構(gòu)治療提供了新的治療靶點(diǎn)和思路方法。