高原 李召水 李磊 孫展發(fā) 池一凡 生偉
[摘要]目的 通過生物信息學方法分析GEO數(shù)據(jù)庫中Stanford A型主動脈夾層(ATAAD)的差異表達基因(DEGs),探討主動脈夾層疾病發(fā)生的分子機制。方法 檢索GEO數(shù)據(jù)庫中有關ATAAD芯片測序大數(shù)據(jù),并通過生物信息學方法對其進行DEGs分析。應用基因本體論(GO)分析研究DEGs涉及的生物學過程,最后通過蛋白質(zhì)相互作用網(wǎng)絡(PPI)尋找核心DEGs。結(jié)果 在ATAAD發(fā)生過程中有1.3%~2.5%的基因表達水平發(fā)生明顯改變,而且DEGs主要涉及的生物學功能為心肌細胞的膜內(nèi)外轉(zhuǎn)運調(diào)控、平滑肌收縮異常調(diào)控以及心肌細胞疾病調(diào)控。其中關鍵基因為表達水平明顯下調(diào)的ACTG2、AGTR1、RYR2和MYOCD,以及表達水平明顯上調(diào)的ANGPTL4、RGS2、SLC16A3和SMOX。結(jié)論 ATAAD的發(fā)生與心肌細胞內(nèi)細胞通路調(diào)控異常及血管生成調(diào)控具有重要關系。
[關鍵詞]動脈瘤,夾層;數(shù)據(jù)庫,遺傳學;計算生物學;生物信息學;差異表達基因
[中圖分類號]R543.16;R-05
[文獻標志碼]A
[文章編號]2096-5532(2021)02-0265-06
[ABSTRACT]Objective To investigate the molecular mechanism of aortic dissection by analyzing the differentially expressed genes (DEGs) of Stanford type A aortic dissection (ATAAD) in GEO database based on the bioinformatics method. Methods Big data related to ATAAD microarray sequencing were retrieved from GEO database, and DEGs were analyzed using the bioinformatics method. Gene ontology (GO) analysis was performed to investigate the biological processes involving DEGs, and protein-protein interaction (PPI) network was used to identify core DEGs. ?Results During the development of ATAAD, there were changes in the expression of about 1.3%-2.5% of genes, and DEGs were mainly involved in the biological functions such as regulation of the transmembrane transport of cardiomyocytes, regulation of abnormal smooth muscle contraction, and regulation of cardiomyocyte diseases. Among these genes, the key genes were ACTG2, AGTR1, RYR2, and MYOCD with significant downre-gulation and ANGPTL4, RGS2, SLC16A3, and SMOX with significant upregulation. ?Conclusion The development of ATAAD is significantly associated with abnormal regulation of intracellular pathways and angiogenesis in cardiomyocytes.
[KEY WORDS]aneurysm, dissecting; databases, genetic; computational biology; bioinformatics; differentially expressed genes
Stanford A型主動脈夾層(ATAAD)為一種常見的嚴重威脅人類生命健康的主動脈災難性事件,主要發(fā)生在70~80歲年齡人群[1]。在過去的40年中,隨著診療技術及治療手段的進步,ATAAD不再是一種死亡后診斷疾病[2]。美國一項研究結(jié)果顯示,ATAAD發(fā)生的頻率幾乎為腹主動脈瘤破裂的3倍[3]。且三級護理中心記錄的ATAAD研究結(jié)果表明, ATAAD仍為通過區(qū)域快速運輸系統(tǒng)轉(zhuǎn)移的最頻繁的急診疾病[4-5]。因此,針對ATAAD發(fā)生風險的早期篩查尤為重要。
通過生物信息學手段進行生物大數(shù)據(jù)分析已經(jīng)在多種生物學領域被應用。由于實驗條件的限制性、樣本收集的可行性等,分析數(shù)據(jù)庫中已有數(shù)據(jù)可為研究疾病發(fā)生的分子機制提供便捷途徑[6-7]。研究顯示,ATAAD的發(fā)生與基因突變及表達異常具有密切關系,各種結(jié)締組織基因的突變使個體易發(fā)生主動脈夾層[8]。本研究通過分析GEO數(shù)據(jù)庫中ATAAD病人基因表達芯片測序大數(shù)據(jù),進一步深入研究ATAAD發(fā)病的基因水平調(diào)控機制?,F(xiàn)將結(jié)果報告如下。
1 資料和方法
1.1 基因微陣列數(shù)據(jù)檢索
ATAAD樣本的基因芯片來自于GEO(Gene Expression Omnibus)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)。將Aortic dissection輸入到GEO數(shù)據(jù)庫檢索域,結(jié)果顯示共有158項研究。去除77項小鼠樣本研究,對剩余81項人類樣本研究進行進一步篩選。由于本文目的為研究ATAAD病人基因表達整體模式,需要搜尋得到一個芯片或測序整體信息,因此根據(jù)數(shù)據(jù)庫條目類型,選擇了包含11項相關研究的數(shù)據(jù)集類型。隨后進一步篩選得到其中3項(GSE147026、GSE52093、GSE98770)研究為ATAAD病人mRNA相關的測序分析,由于GSE147026樣本標注不明確,本文最后選擇符合研究標準的2項即GSE52093與GSE98770進行ATAAD基因表達譜分析。相關芯片信息見表1。
1.2 原始數(shù)據(jù)預處理及差異表達基因(DEGs)鑒別
下載得到原始數(shù)據(jù)后,首先通過R語言的Bioconductor package (BiocGenerics, Biobase, Parallel)對其進行噪聲去除、分位數(shù)歸一化等。隨后,使用R語言(Limma包)于芯片數(shù)據(jù)中篩選ATAAD和正常樣本之間的DEGs。篩選DEGs的閾值設定為表達上調(diào)或下調(diào)2倍,且P值<0.05。
1.3 火山圖對DEGs進行可視化分析
將所得到的每一樣本中每一基因的代表表達水平的數(shù)值、每一基因在實驗樣本組中的相對表達值及P值,按照R語言中volcano要求制作對應矩陣列表,按照試驗需求設置閾值,隨后通過R語言進行DEGs可視化分析。
1.4 熱圖(heatmap)對DEGs進行可視化分析
首先將分析得到的DEGs、測序樣本及每一樣本中每一基因?qū)磉_水平的數(shù)值,按照R語言中pheatmap包要求制作對應矩陣列表,隨后通過R語言(pheatmap包)對基于mRNA表達水平的組樣本進行可視化層次聚類分析。
1.5 GSE52093和GSE98770中co-DEGs分析
GSE52093和GSE98770中的co-DEGs通過Draw Venn Diagram線上數(shù)據(jù)庫進行分析(http://bioinformatics.psb.ugent.be/webtools/Venn/)。將待分析基因列表上傳到數(shù)據(jù)庫,隨后即顯示韋恩圖及相關的共同基因列表。
1.6 基因本體論(GO)和基因通路富集分析
將基因列表上傳至DAVID生物信息學資源6.8數(shù)據(jù)庫(https://david.ncifcrf.gov/),隨后顯示GO(biological process, cell component, molecular function, KEGG)結(jié)果,將其下載為txt文件。最后通過R語言(ggplot2包)可視化GO結(jié)果。
1.7 蛋白質(zhì)間相互作用關系網(wǎng)絡分析
DEGs的蛋白質(zhì)間相互作用關系網(wǎng)絡分析通過STRING (https://string-db.org/)在線分析軟件完成。將基因列表上傳到多蛋白菜單欄,稍后即顯示蛋白質(zhì)間相互作用關系網(wǎng)絡結(jié)果。最后通過Cytoscape軟件將網(wǎng)絡圖可視化。
2 結(jié) 果
2.1 ATAAD病人基因表達變化分析
根據(jù)篩選條件在GSE98770數(shù)據(jù)集中得到的DEGs中包含上調(diào)基因239個(0.720%),下調(diào)基因575個(1.733%),無顯著性差異的基因32 254個(97.257%)(圖1A、B)。在GSE52093數(shù)據(jù)集中以相同的條件進行分析,最終得到上調(diào)基因315個(0.654%),下調(diào)基因308個(0.640%),無顯著性差異的基因47 384個(98.49%)(圖1C、D)。以上結(jié)果表明,在ATAAD疾病發(fā)展的過程中,有1.3%~2.5%基因表達水平發(fā)生改變。
隨后對 GSE98770與GSE52093數(shù)據(jù)集中共同的DEGs進行分析,結(jié)果顯示,共同上調(diào)2倍基因27個(圖2A),共同下調(diào)2倍基因67個(圖2B),為方便描述,后文將其命名為co-DEGs。
2.2 ATAAD病人中DEGs生物學功能
應用GO分析對前面得到的94個co-DEGs的生物學功能(biological process)、細胞內(nèi)成分(cellular components)、分子功能(molecular function)及KEGG進行分析,結(jié)果顯示,ATAAD病人樣本中DEGs主要涉及的生物學過程為調(diào)節(jié)血管收縮、細胞氯離子穩(wěn)態(tài)、心室心肌細胞動作電位、連環(huán)蛋白導入細胞核的正向調(diào)節(jié)、肌動蛋白絲聚合的負性調(diào)節(jié)、鈉離子跨膜轉(zhuǎn)運體活性的調(diào)控及平滑肌收縮的正向調(diào)節(jié)等(圖3A)。DEGs涉及的分子功能為鈣誘導的鈣釋放活性、ryanodine敏感的鈣釋放通道活性、肌酸激酶活性、泛素蛋白連接酶活性、鈣離子結(jié)合及鈉通道調(diào)節(jié)器活性等(圖3B)。DEGs所處的細胞成分為肌纖維膜、肌動蛋白骨架、細胞質(zhì)、肌肉神經(jīng)接點、光滑型內(nèi)質(zhì)網(wǎng)、黏著斑及肌漿網(wǎng)膜等(圖3C)。DEGs參與的KEGG包括血管平滑肌收縮、精氨酸和脯氨酸代謝、心肌細胞的腎上腺素能信號、縮宮素信號通路、cGMP-PKG信號通路、心律失常性右心室心肌病、PPAR信號通路、肥厚型心肌病、鈣信號通路以及擴張型心肌病等通路(圖3D)。GO分析結(jié)果表明,ATAAD疾病的發(fā)生可能與心肌細胞的膜內(nèi)外轉(zhuǎn)運調(diào)控、平滑肌收縮異常調(diào)控以及心肌細胞疾病有直接的關系。
2.3 蛋白質(zhì)互作網(wǎng)絡分析ATAAD中DEGs相互關系
對前面94個co-DEGs的蛋白質(zhì)相互作用關系進行分析,結(jié)果顯示,互作網(wǎng)絡為以RYANODINE受體2(RYR2)、心肌素(MYOCD)及平滑肌動蛋白2(ACTG2)等為核心的關系網(wǎng)絡,以及以血管緊張素Ⅱ受體Ⅰ型(AGTR1)和ASB2為核心的關系網(wǎng)絡(圖4)。此外,兩數(shù)據(jù)集中均分析得到共同上調(diào)較為顯著的類血管生成素4(ANGPTL4)、G蛋白信號轉(zhuǎn)導調(diào)節(jié)因子2(RGS2)以及溶質(zhì)載體家族16成員3(SLC16A3)等。
對蛋白互作網(wǎng)絡中心以及表達水平較為突出的基因ACTG2、AGTR1、RYR2、MYOCD、RGS2、ANGPTL4、SLC16A3、精胺氧化酶(SMOX)表達水平進行分析,結(jié)果顯示,GSE98770及GSE52093數(shù)據(jù)集中的ATAAD病人樣本中ACTG2、AGTR1、RYR2、MYOCD相對表達水平均低至0.4(圖5A),ANGPTL4、RGS2、SLC16A3、SMOX相對表達水平均最高可至12倍(圖5B),表明以上基因的異常表達與ATAAD疾病的發(fā)生具有重要關系。此外,關鍵基因所涉及的KEGG多為平滑肌收縮調(diào)控、肥厚型心肌病、心肌細胞的腎上腺素能信號、縮宮素信號通路、鈣離子代謝等(圖5C),提示ATAAD疾病的發(fā)生歸因于平滑肌收縮異常調(diào)控及心肌細胞膜運輸異常調(diào)控。
3 討 論
本文研究通過生物信息學的方法,對GEO數(shù)據(jù)庫GSE98770和GSE52093數(shù)據(jù)集中ATAAD病人體內(nèi)基因表達數(shù)據(jù)進行分析,結(jié)果顯示ATAAD病人中1.3%~2.5%的基因表達水平發(fā)生了改變。
GSE98770與GSE52093雖為ATAAD病人DEGs測序分析,但二者的不同之處在于GSE98770對病人升主動脈夾層中的內(nèi)膜層組織進行測序分析,而GSE52093對病人升主動脈夾層整體樣本進行測序分析。由于兩個數(shù)據(jù)集中病人來源于不同國家地區(qū),且測序平臺不同,取樣部位不同,因此通過對兩個數(shù)據(jù)集中分析得到的DEGs進行交集分析后共篩選得到94個co-DEGs,表明ATAAD的發(fā)生與基因表達模式的改變具有重大關聯(lián)。
GO分析通常用于研究DEGs生物學功能的富集情況,以研究疾病發(fā)生過程中所發(fā)生改變的生物學過程。本文GO結(jié)果顯示,co-DEGs生物學功能顯著富集于心肌細胞的膜內(nèi)外轉(zhuǎn)運調(diào)控、平滑肌收縮異常調(diào)控的生物學過程。本文蛋白互作關系分析篩選得到位于網(wǎng)絡核心的關鍵基因ANGPTL4、AGTR1、SLC16A3、MYOCD、ACTG2、RGS2、SMOX、以及RYR2,且這8個關鍵基因在ATAAD病人樣本中表達水平均發(fā)生改變,表明ACTG2、AGTR1、RYR2、MYOCD、ANGPTL4、RGS2、SLC16A3以及SMOX可能對于ATAAD的發(fā)生發(fā)展過程具有關鍵作用。ATAAD的發(fā)生與這些關鍵基因表達水平的改變或呈一定相關性。
已有研究顯示,ACTG2、AGTR1、ANGPTL4、MYOCD、RYR2、RGS2、SLC16A3以及SMOX均參與人類多種疾病的調(diào)控。ACTG2參與平滑肌細胞的調(diào)控[9],且該基因突變與多種腸道疾病的發(fā)生具有重要關系[10-12]。此外,AGTR1編碼1型受體,被認為介導了血管緊張素Ⅱ的主要心血管作用,并可能在缺血或梗死心肌血流恢復后再灌注性心律失常中發(fā)揮作用,以及介導低氧對早期胎盤血管生成的影響[13]。相關研究結(jié)果顯示,RYR2的突變與應力誘導的多型室性心動過速和心律失常性右心室發(fā)育不良有關,且該基因的異常表達參與兒茶酚胺敏感性室速的診斷與治療[14-15]。MYOCD參與人胸膜間皮細胞間充質(zhì)轉(zhuǎn)化、心肌細胞死亡及分化[16-17],基因ANGPTL4突變與代謝綜合征及腦動靜脈畸形風險顯著相關[18-19]。RGS2參與多種人類神經(jīng)性疾病的發(fā)生[20-22]。SLC16A3在細胞代謝和組織傳遞中發(fā)揮重要作用,并參與人類多種癌癥的調(diào)控[23-24]。SMOX在癌癥的發(fā)生中具有一定作用[25-26]。
本研究利用生物信息學技術及其方法探討了ATAAD病人樣本DEGs,分析可能與ATAAD疾病發(fā)生相關的DEGs以及相關生物學途徑。結(jié)果顯示,ATAAD的發(fā)生與生物體內(nèi)多種基因表達紊亂并造成相應調(diào)控途徑改變相關,研究DEGs可從基因水平解釋ATAAD的發(fā)病機制,并為ATAAD的臨床治療及診斷提供新的思路。后續(xù)的研究中將進行DEGs體外功能驗證以進一步研究相關基因與ATAAD發(fā)病機制的關系。
[參考文獻]
[1]MALVINDI P G, VOTANO D, ASHOUB A, et al. Age-related presentation of acute type A aortic dissection[J]. Asian Cardiovascular & Thoracic Annals, 2018,26(9):659-666.
[2]MUSSA F F, HORTON J D, MORIDZADEH R, et al. Acute aortic dissection and intramural hematoma[J]. JAMA, 2016,316(7):754-810.
[3]COADY M A, RIZZO J A, GOLDSTEIN L J, et al. Natural history, pathogenesis, and etiology of thoracic aortic aneurysms and dissections[J]. Cardiology Clinics, 1999,17(4):615-635.
[4]MANZUR M, HAN S M, DUNN J, et al. Management of patients with acute aortic syndrome through a regional rapid transport system[J]. Journal of Vascular Surgery, 2017,65(1):21-29.
[5]AGGARWAL B, RAYMOND C, JACOB J, et al. Transfer of patients with suspected acute aortic syndrome[J]. The American Journal of Cardiology, 2013,112(3):430-435.
[6]MIN K K, WON D D, SUN M P, et al., Effect of adjuvant chemotherapy on stage Ⅱ colon cancer: analysis of Korean national data[J]. Cancer Res Treat, 2018,50(4):1149-1163.
[7]RANA I, RIESWIJK L, STEINMAUS C, et al. Formaldehyde and brain disorders: a meta-analysis and bioinformatics approach[J]. Neurotox Res, 2021. doi:10.1007/s12640-020-00320-y.
[8]ZIGANSHIN B A, BAILEY A E, COONS C, et al. Routine genetic testing for thoracic aortic aneurysm and dissection in a clinical setting[J]. The Annals of Thoracic Surgery, 2015,100(5):1604-1611.
[9]KOHNEN G, CAMPBELL S,JEFFERS M D, et al. Spatially regulated differentiation of endometrial vascular smooth muscle cells[J]. Human Reproduction, 2000,15(2):284-292.
[10]AMBARTSUMYAN L, ADAM M P, ARDINGER H H, et al. Megacystis-microcolon-intestinal hypoperistalsis syndrome overview[M]//ADAM M P, ARDINGER H H, PAGON R A, et al. Gene Reviews. Seattle (WA): University of Wa-shington (Seattle), 1993.
[11]RAVENSCROFT G, PANNELL S, OGRADY G, et al. Variants in ACTG2 underlie a substantial number of Australasian patients with primary chronic intestinal pseudo-obstruction[J]. Neurogastroenterology & Motility, 2018,30(9): e13371.
[12]MILUNSKY A, BALDWIN C, ZHANG X Y, et al. Diagnosis of chronic intestinal pseudo-obstruction and megacystis by sequencing the ACTG2 gene[J]. Journal of Pediatric Gastroenterology and Nutrition, 2017,65(4):384-387.
[13]DELFORCE S J, LUMBERS E R, MOROSIN S K, et al. The Angiotensin Ⅱ type 1 receptor mediates the effects of low oxygen on early placental angiogenesis[J]. Placenta, 2019,75:54-61.
[14]ROSTON T M, CUNNINGHAM T C, SANATANI S. Advances in the diagnosis and treatment of catecholaminergic polymorphic ventricular tachycardia[J]. Cardiology in the Young, 2017,27(S1): S49-S56.
[15]BOSCH C, CAMPUZANO O, SARQUELLA-BRUGADA G, et al. A novel variant in RYR2 causes familiar catecholaminergic polymorphic ventricular tachycardia[J]. Forensic Science International, 2017,270:173-177.
[16]TUCKER T, TSUKASAKI Y, SAKAI T, et al. Myocardin is involved in mesothelial-mesenchymal transition of human pleural mesothelial cells[J]. American Journal of Respiratory Cell and Molecular Biology, 2019,61(1):86-96.
[17]GORDON J W. Regulation of cardiac myocyte cell death and differentiation by myocardin[J]. Molecular and Cellular Biochemistry, 2018,437(1-2):119-131.
[18]KHARAZMI-KHORASSANI S, KHARAZMI-KHORASSANI J, RASTEGAR-MOGHADAM A, et al. Association of a genetic variant in the angiopoietin-like protein 4 gene with metabolic syndrome[J]. BMC Medical Genetics, 2019,20(1):97.
[19]ERKINOVA S A, SOKOLOVA E A, ORLOV K Y, et al. Angiopoietin-like proteins 4 (ANGPTL4) gene polymorphisms and risk of brain arteriovenous malformation[J]. Journal of Stroke and Cerebrovascular Diseases, 2018,27(4):908-913.
[20]SEREDENINA T, GOKCE O, LUTHI-CARTER R. Decreased striatal RGS2 expression is neuroprotective in Huntingtons disease (HD) and exemplifies a compensatory aspect of HD-induced gene regulation[J]. PLoS One, 2011,6(7): e22231.
[21]HADAR A, MILANESI E, SQUASSINA A, et al. RGS2 expression predicts amyloid-β sensitivity, MCI and Alzheimers disease: genome-wide transcriptomic profiling and bioinformatics data mining[J]. Translational Psychiatry, 2016,6(10): e909.
[22]ASSELMANN E, HERTEL J, SCHMIDT C O, et al. Interplay between RGS2 and childhood adversities in predicting anxiety and depressive disorders: findings from a general po-pulation sample[J]. Depression and Anxiety, 2018,35(11):1104-1113.
[23]LONG Y P, GAO Z H, HU X, et al. Downregulation of MCT 4 for lactate exchange promotes the cytotoxicity of NK cells in breast carcinoma[J]. Cancer Medicine, 2018,7(9):4690-4700.
[24]HALESTRAP A P, PRICE N T. The proton-linked monocarboxylate transporter (MCT) family: structure, function and regulation[J]. Biochemical Journal, 1999,343(2):281.
[25]GOODWIN A C, JADALLAH S, TOUBAJI A, et al. Increased spermine oxidase expression in human prostate cancer and prostatic intraepithelial neoplasia tissues[J]. The Prostate, 2008,68(7):766-772.
[26]CHATURVEDI R, DE SABLET T, ASIM M, et al. Increased Helicobacter pylori-associated gastric cancer risk in the Andean region of Colombia is mediated by spermine oxidase[J]. Oncogene, 2015,34(26):3429-3440.
(本文編輯 黃建鄉(xiāng))