吳程,謝李華,鄭晨華,林任璽,林偉彬,張曉艷
肺癌(lung cancer,LC)是全球癌癥相關(guān)死亡的主要原因,每年約有200萬例確診病例[1]。LC主要分為小細胞肺癌(small-cell lung cancer,SCLC)和非小細胞肺癌(non-small-cell lung cancer,NSCLC),其中SCLC約占15%,NSCLC約占85%[2]?,F(xiàn)階段治療LC的主要方法包括手術(shù)、化療、放射治療、靶向治療和免疫治療等。然而這些治療方法不僅費用昂貴,且長期療效差、副作用明顯[3],存在易復(fù)發(fā)、不良反應(yīng)明顯等問題,LC患者的5 a生存率僅為4%~17%[4-8]。因此,繼續(xù)探索有效的LC治療策略,尋找與研發(fā)更有效的藥物至關(guān)重要。
天然產(chǎn)物在治療癌癥方面具有毒性低、副作用少的優(yōu)勢,目前已有許多從天然產(chǎn)品中提取出來的化合物被批準用于臨床[9]。槲皮素是一種天然的膳食生物黃酮類化合物,廣泛存在于自然界和人們的日常飲食中,主要來源包括蔬菜(洋蔥、蕎麥、甘藍、西紅柿等)、水果(葡萄、櫻桃、蘋果、芒果、柑橘等)、綠茶和紅酒等[10-11]。研究[12-15]表明,槲皮素具有多種藥理活性,如抗炎、抗氧化、抗動脈粥樣硬化、抗細胞凋亡、抗增殖活性和抗腫瘤等。近年來已有研究[16-19]報道,槲皮素能夠抑制LC細胞的增殖和生長、促進LC細胞凋亡及抑制LC細胞的侵襲和轉(zhuǎn)移。然而,槲皮素對LC的潛在作用靶點及分子作用機制仍有待進一步深入探討。
網(wǎng)絡(luò)藥理學(xué)是一門集高通量組學(xué)數(shù)據(jù)分析、虛擬計算機分析和網(wǎng)絡(luò)數(shù)據(jù)庫檢索于一體的系統(tǒng)生物學(xué)和多向藥理學(xué)相結(jié)合的學(xué)科,通過構(gòu)建“成分—靶點—通路—疾病”網(wǎng)絡(luò),系統(tǒng)、多方位地闡明藥物成分與疾病的靶點之間的相互作用關(guān)系及潛在的分子作用機制,對研究藥物的作用機制和新藥創(chuàng)新研發(fā)均具有重要的意義[20-21]。本研究擬采用網(wǎng)絡(luò)藥理學(xué)方法預(yù)測槲皮素治療LC的潛在作用靶點及信號通路,旨在揭示槲皮素在治療LC的分子作用機制,進而為臨床研究、應(yīng)用和新藥研發(fā)提供理論依據(jù)。
1.1 槲皮素相關(guān)作用靶點信息的獲取及篩選 TCMSP(http://tcmspw.com/)是一個系統(tǒng)藥理學(xué)平臺,包含有關(guān)中草藥的信息,如成分、靶點、相關(guān)疾病和ADME屬性等[22],以“quercetin”作為關(guān)鍵詞,口服生物利用度(oral bioavailability,OB)≥30%和藥物相似度 (drug-likeness,DL)≥0.18作為篩選依據(jù),進行潛在作用靶點預(yù)測[23-24]。根據(jù)pubchem(https://pubchem.ncbi.nlm.nih.gov/)數(shù)據(jù)庫,以“quercetin”作為關(guān)鍵詞,獲取槲皮素的Canonical SMILES,下載其2D結(jié)構(gòu),保存為sdf格式;將其2D-sdf格式導(dǎo)入SwissTargetPrediction數(shù)據(jù)庫,進行潛在靶點預(yù)測。對TCMSP和SwissTargetPrediction兩個數(shù)據(jù)庫的槲皮素相關(guān)作用靶點進行合并,剔除重復(fù)值,得到槲皮素的相關(guān)作用靶點信息。利用UniProt(https://www.uniprot.org)數(shù)據(jù)庫對相關(guān)作用靶點基因名稱進行標準化處理,留下經(jīng)過“審查”且屬于“人類”的基因以便進一步分析。
1.2 LC相關(guān)靶點信息的獲取及篩選 以“l(fā)ung cancer”作為關(guān)鍵詞,從GeneCards(http://www.meetGeneCards.org)數(shù)據(jù)庫[25]獲取LC的相關(guān)靶點,并篩選出“relevance score”≥20的靶點[26]。同時,以“l(fā)ung cancer”作為關(guān)鍵詞,在OMIM(https://omim.org/)數(shù)據(jù)庫[27]的“Gene Map”中獲取LC的相關(guān)作用靶點。對兩個數(shù)據(jù)庫的靶點信息進行合并,剔除重復(fù)值,得到LC相關(guān)靶點信息。
1.3 槲皮素治療LC潛在作用靶點的獲取及PPI網(wǎng)絡(luò)建立 使用Venn(http://bioinformatics.psb.ugent.be/webtools/Venn/)在線軟件,對槲皮素和LC的相關(guān)靶點信息進行交集分析,交集部分表示槲皮素治療LC的潛在作用靶點。將兩者的共同靶點導(dǎo)入STRING(https://cn.string-db.org/cgi/input.pl)數(shù)據(jù)庫[28]中建立PPI網(wǎng)絡(luò),物種設(shè)置為“homo sapiens”,選擇具有高置信度(high:>0.7),其余的參數(shù)保持為默認設(shè)置,以獲取相互作用關(guān)系信息表。
1.4 槲皮素治療LC潛在核心靶點的篩選 將String數(shù)據(jù)庫中槲皮素治療LC的相關(guān)靶點PPI網(wǎng)絡(luò)數(shù)據(jù)導(dǎo)出為TSV格式文件,再導(dǎo)入到Cystoscape 3.7.2軟件中進行PPI網(wǎng)絡(luò)的可視化分析。Degree和Betweenness能夠衡量一個節(jié)點在網(wǎng)絡(luò)拓撲結(jié)構(gòu)中的重要程度和關(guān)鍵性,值越高說明節(jié)點在PPI網(wǎng)絡(luò)中的拓撲地位越重要;Closeness反映在網(wǎng)絡(luò)中某一節(jié)點與其他節(jié)點之間的接近程度,值越大,表明該節(jié)點與其他節(jié)點的距離越接近[29]。篩選出“Degree”“Closeness”和“Betweenness”這3個指標均大于中位數(shù)的靶點,即為槲皮素治療LC的潛在核心靶點。
1.5 基因本體(gene ontology,GO)、京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)的富集分析 將槲皮素治療LC的潛在靶點導(dǎo)入DAVID(https://david.ncifcrf.gov/)數(shù)據(jù)庫中進行富集分析,得到GO生物學(xué)過程和KEGG信號通路富集分析。以P<0.001作為篩選條件,并依據(jù)富集通路涉及基因數(shù)的數(shù)量,從大到小進行排名,篩選出GO富集分析中排名前10的通路以及KEGG富集分析中排名前20的通路。將分析得到的數(shù)據(jù)上傳至微生信平臺(http://www.bioinformatics.com.cn/),結(jié)果以氣泡圖的形式呈現(xiàn)。
1.6 “成分—靶點—通路”網(wǎng)絡(luò)構(gòu)建 基于獲得的槲皮素治療LC的潛在靶點及DAVID數(shù)據(jù)庫富集分析得到槲皮素治療LC的潛在信號通路,用Cytoscape 3.7.2軟件建立槲皮素治療LC的“成分—靶點—通路”網(wǎng)絡(luò)圖。
2.1 槲皮素成藥性檢驗及其作用靶點 在TCMSP數(shù)據(jù)庫中得到槲皮素的ADME參數(shù),如MW=302.25,OB(%)=46.43,DL=0.28等。OB是一種衡量口服藥物運輸?shù)饺硌h(huán)和藥物作用部位的能力的指標,OB>30%的化合物被認為具有有效的吸收能力。DL是根據(jù)化學(xué)成分的生化和物理性質(zhì)來研究其藥效的指標,可獲得藥物的平均藥物相似度為0.18,因此在網(wǎng)絡(luò)藥理學(xué)分析中,藥物相似性高于這一平均值的化合物被認為具有藥物潛力。根據(jù)TCMSP查詢結(jié)果可知,槲皮素具有潛在的藥物性質(zhì)。在Pubchem數(shù)據(jù)庫中,得到槲皮素的結(jié)構(gòu)式(圖1),其Canonical SMILES結(jié)構(gòu)式為C1=CC(=C(C=C1C2=C(C(=O)C3=C(C=C(C=C3O2)O)O)O)O)O,將其2D-sdf格式導(dǎo)入SwissTargetPrediction數(shù)據(jù)庫中,獲得100個槲皮素的靶點。在TCMSP數(shù)據(jù)庫中得到槲皮素相關(guān)作用靶點并經(jīng)Uniprot數(shù)據(jù)庫標準化處理后,共有靶點143個;合并2個數(shù)據(jù)庫并剔除重復(fù)值后,得到槲皮素的相關(guān)作用靶點共226個。
圖1 槲皮素結(jié)構(gòu)式Fig.1 Quercetin structural formula
2.2 LC相關(guān)靶點及槲皮素治療LC潛在靶點的收集 從GeneCards數(shù)據(jù)庫中篩選出816個LC相關(guān)靶點,OMIM數(shù)據(jù)庫篩選出65個LC相關(guān)靶點,合并2個數(shù)據(jù)庫并剔除重復(fù)靶點后,得到861個LC相關(guān)靶點。使用Venn在線軟件將槲皮素作用靶點與LC疾病靶點相映射,篩選出槲皮素可能作用于LC的潛在靶點101個(圖2)。將篩選出來的101個潛在靶點導(dǎo)入到Cytoscape 3.7.2軟件中,構(gòu)建活性成分—潛在靶點網(wǎng)絡(luò)圖(圖3)。
圖2 槲皮素治療肺癌靶點維恩圖Fig.2 Venn diagram of target protein for the treatment of lung cancer by quercetin
2.3 潛在靶點PPI網(wǎng)絡(luò)的構(gòu)建與分析 將槲皮素治療LC的101個潛在靶點蛋白輸入STRING數(shù)據(jù)庫中,選擇高置信度PPI(high confidence:score>0.7,hide disconnected nodes in the network),構(gòu)建得到1個包括101個節(jié)點和791條邊的靶蛋白相互作用PPI網(wǎng)絡(luò)(圖4)。將101個共同作用靶點的PPI網(wǎng)絡(luò)獲得的“string_interactions.tsv”文件導(dǎo)入到Cytoscape 3.7.2軟件進行Network Analysis分析,其中“Degree”“Closeness”和“Betweenness”的中位數(shù)分別為15.663、0.005和115.228,靶點篩選條件為“3個指標均大于中位數(shù)”,獲得23個槲皮素治療LC潛在的核心靶點,包括TP53、AKT1、EGFR、CASP3、VEGFA、SRC、TNF、IL6、MAPK1、MYC、MMP9、IL1B、CCND1、PTEN、RELA、PIK3R1、HIF1α、ERBB2、CAV1、NFKBIα、AR、MMP2、PTGS2(表1)。
:藥物以及疾??;:靶點基因。圖3 槲皮素和肺癌共同作用靶點圖Fig.3 Co-action target map of quercetin and lung cancer
圓節(jié)點代表蛋白靶點,圓圈大小和顏色深淺代表靶點蛋白相互作用的緊密程度,圓圈越大表明靶點蛋白的緊密程度越高。圖4 槲皮素治療肺癌潛在靶點相互作用網(wǎng)絡(luò)Fig.4 Interaction network of potential targets for lung cancer treatment with quercetin
表1 槲皮素治療肺癌潛在核心蛋白靶點信息Tab.1 Information on potential core protein targets for lung cancer treatment with quercetin
2.4 GO功能富集分析 運用DAVID數(shù)據(jù)庫對槲皮素治療LC的潛在靶點進行GO功能富集分析,通過設(shè)定P<0.001的指標并根據(jù)富集基因數(shù)的數(shù)量,從大到小進行排序,篩選出排名前10項(圖5~7)。GO富集功能分析顯示涉及695個生物過程(biological process,BP),包括RNA聚合酶Ⅱ啟動子轉(zhuǎn)錄的正調(diào)控、凋亡過程的負調(diào)控、細胞因子介導(dǎo)的信號通路、信號傳導(dǎo)、基因表達的正調(diào)控等;64個細胞組分(cellular component,CC),包括細胞核、細胞質(zhì)、細胞溶質(zhì)、胞外間隙、外泌體、線粒體等;121個分子功能(molecular function,MF),包括蛋白質(zhì)結(jié)合、ATP結(jié)合、酶結(jié)合、蛋白激酶結(jié)合等。
2.5 KEGG功能富集分析 將槲皮素治療LC的潛在靶點導(dǎo)入到DAVID數(shù)據(jù)庫進行KEGG通路富集分析,共得到156條通路,以P<0.001作為篩選條件并且根據(jù)富集基因數(shù)的數(shù)量,由大到小進行排序,篩選出排名前20的通路(圖8)。這些潛在靶點主要富集在脂質(zhì)和動脈粥樣硬化、肝細胞癌、前列腺癌、乙型肝炎、丙型肝炎、麻疹等多種疾病之中,并參與了不同的信號通路,包括:癌癥相關(guān)通路、PI3K-AKT信號通路、細胞衰老、AGE-RAGE信號通路在糖尿病并發(fā)癥中的作用、MAPK信號通路以及microRNAs參與對LC的調(diào)控等。
2.6 “成分—靶點—通路”網(wǎng)絡(luò)的構(gòu)建 基于獲得的槲皮素治療LC的潛在靶點及DAVID數(shù)據(jù)庫富集分析得到的槲皮素治療LC潛在信號通路,用Cytoscape 3.7.2軟件建立槲皮素治療LC的“成分—靶點—通路”網(wǎng)絡(luò)圖(圖9),網(wǎng)絡(luò)圖包含105個節(jié)點,624條邊線,槲皮素治療LC與TP53、AKT1、EGFR、CASP3、VEGFA等84個靶標有關(guān),與PI3K-AKT、MAPK等信號通路以及microRNAs參與對LC的調(diào)控。
槲皮素是一種存在于天然產(chǎn)物中具有良好生物活性的植物化學(xué)物質(zhì),其在多種疾病的預(yù)防和治療方面發(fā)揮著重要作用。槲皮素對LC的潛在作用靶點及分子作用機制仍有待進一步深入探討。網(wǎng)絡(luò)藥理學(xué)以系統(tǒng)生物學(xué)理論為基礎(chǔ),整合了藥理學(xué)、高通量測序、基因組學(xué)等技術(shù),強調(diào)信號通路的多通道調(diào)控。本研究通過網(wǎng)絡(luò)藥理學(xué)方法建立了槲皮素、靶點、通路和LC之間的關(guān)聯(lián),以探討槲皮素在LC中的分子作用機制。
縱坐標表示生物過程,橫坐標表示富集因子,Rich Factor越大表明富集程度越大,氣泡顏色由綠變紅表示調(diào)整后的P值越小,氣泡越大表明富集到生物過程上的基因數(shù)越多。圖5 槲皮素治療肺癌潛在靶點的生物過程分析Fig.5 Biological process analysis of potential targets for lung cancer treatment with quercetin
縱坐標表示細胞組分,橫坐標表示富集因子,Rich Factor越大表明富集程度越大,氣泡顏色由綠變紅表示調(diào)整后的P值越小,氣泡越大表明富集到細胞組分上的基因數(shù)越多。圖6 槲皮素治療肺癌潛在靶點的細胞組分分析Fig.6 Cellular component analysis of potential targets for lung cancer treatment with quercetin
縱坐標表示分子功能,橫坐標表示富集因子,Rich Factor越大表明富集程度越大,氣泡顏色由綠變紅表示調(diào)整后的P值越小,氣泡越大表明富集到分子功能上的基因數(shù)越多。圖7 槲皮素治療肺癌潛在靶點的分子功能分析Fig.7 Molecular function analysis of potential targets for lung cancer treatment with quercetin
縱坐標表示信號通路,橫坐標表示富集因子,Rich Factor越大表明富集程度越大,氣泡顏色由綠變紅表示調(diào)整后的P值越小,氣泡越大表明富集到該信號通路上的基因數(shù)越多。KEGG:京都基因與基因組百科全書。圖8 槲皮素治療肺癌潛在靶點的KEGG信號通路富集分析Fig.8 Enrichment analysis of KEGG signal pathway of potential targets for lung cancer treatment with quercetin
:藥物;:靶點基因;:信號通路。圖9 槲皮素治療肺癌的“成分—靶點—通路”圖Fig.9 “Component-target-pathway”diagram of lung cancer treatment with quercetin
基于網(wǎng)絡(luò)藥理學(xué),將獲得的101個槲皮素和LC的共同靶點進行PPI核心網(wǎng)絡(luò)分析,篩選出23個核心靶點。其中排名前5的核心靶點分別為TP53、AKT1、EGFR、CASP3和VEGFA。
將槲皮素治療LC的潛在靶點進行KEGG通路富集分析,得到與LC密切相關(guān)的PI3K-AKT、MAPK信號通路及microRNAs對LC的調(diào)控。
PI3K-AKT信號通路是細胞內(nèi)最重要的信號通路之一,它能夠調(diào)節(jié)細胞的生存、生長、分化、代謝和細胞骨架重組[47]。大多數(shù)癌蛋白和腫瘤抑制因子參與細胞代謝/信號傳導(dǎo)調(diào)節(jié),它們在PI3K/AKT信號通路中以一種平衡狀態(tài)會聚,這種平衡在幾種人類癌癥中通過激活和失活機制而改變[48]。趙純等[49]的研究表明,槲皮素與順鉑聯(lián)用能夠通過PI3K/AKT信號通路抑制LC細胞A549/DDP增殖,誘導(dǎo)A549/DDP細胞的凋亡。MAPK級聯(lián)是細胞內(nèi)廣泛存在的絲-蘇氨酸蛋白激酶超家族,是將細胞表面的信號轉(zhuǎn)入細胞核內(nèi)并引起相應(yīng)變化的重要傳導(dǎo)通路。MAPK信號通路在惡性腫瘤細胞增殖、分化、遷移和耐藥發(fā)展中起著至關(guān)重要的作用,該信號通路主要包含四大途徑:細胞外信號調(diào)節(jié)激酶(extracellular signal-regulated protein kinases,ERK)途徑,c-Jun氨基末端激酶(c-Jun N-terminal kinase,JNK)途徑、大絲裂素活化蛋白激酶1(big MAP kinase 1,BMK1)途徑及p38 MAPK(p38 mitogen-activated protein kinase,p38 MAPK)途徑[50]。ZHU等[51]的研究表明,槲皮素通過改變LC細胞中Bcl-2家族蛋白的表達,激活MEK/ERK信號通路,抑制有絲分裂激酶Aurora B的活性,發(fā)揮抗肺癌作用。microRNAs是一類小的非編碼RNA,它們是基因表達的主要調(diào)控因子,調(diào)控特異性癌基因、腫瘤抑制因子、腫瘤干細胞和腫瘤轉(zhuǎn)移,是腫瘤的發(fā)生、發(fā)展過程中一個重要的生物標志物[52]?,F(xiàn)有的研究[16,53-54]表明,microRNAs參與了LC的發(fā)病機制:槲皮素通過上調(diào)miRNA-16的表達抑制緊密連接蛋白Claudin-2的表達水平,進而降低A549細胞的增殖和遷移;過表達miRNA-134 能夠抑制EGFR相關(guān)信號通路,通過誘導(dǎo)細胞周期阻滯或凋亡進而抑制NSCLC細胞的增殖;槲皮素通過上調(diào)miRNA-34a-5p的表達抑制NSCLC細胞的生存、增殖、遷移和侵襲,并促進細胞凋亡。
綜上所述,本研究通過網(wǎng)絡(luò)藥理方法探討槲皮素治療LC的潛在分子作用機制,確定槲皮素治療LC的關(guān)鍵靶點、主要生物學(xué)過程和主要信號通路,為其進一步的臨床研究、臨床應(yīng)用和新藥研發(fā)提供理論依據(jù)。但由于本研究僅是基于數(shù)據(jù)的挖掘和分析,槲皮素治療LC的分子作用機制仍需通過后期的基礎(chǔ)實驗和臨床研究進行驗證。