李淑娟,柯妍,劉旭東,賀茜,徐遙琴,田宇佳,盧冠軍,馬娟,朱澈,汪樂新,
作者單位:1.750004 寧夏回族自治區(qū)銀川市,寧夏醫(yī)科大學(xué)總醫(yī)院急診科 2.750003 寧夏回族自治區(qū)銀川市第一人民醫(yī)院全科醫(yī)學(xué)科 3.750004 寧夏回族自治區(qū)銀川市,寧夏醫(yī)科大學(xué)總醫(yī)院心胸外科 4.750004 寧夏回族自治區(qū)銀川市,寧夏醫(yī)科大學(xué) 5.750001 寧夏回族自治區(qū)銀川市婦幼保健院兒科
急性心肌梗死(acute myocardial infarction,AMI)指動(dòng)脈內(nèi)壁斑塊導(dǎo)致流向心臟的血液減少甚至中斷,進(jìn)而使心肌細(xì)胞發(fā)生缺血缺氧性損傷[1]。但心肌細(xì)胞是永久性細(xì)胞,其損傷后一般不能再生[2],故早期篩查AMI高風(fēng)險(xiǎn)人群具有重要的現(xiàn)實(shí)意義。近年來生物信息學(xué)技術(shù)在疾病診斷和預(yù)測方面應(yīng)用廣泛,而基因代謝組學(xué)作為生物信息學(xué)技術(shù),其主要探究基因與疾病的關(guān)系[3-4]。目前,基于基因代謝組學(xué)探究肝癌、胃癌等核心基因的文獻(xiàn)較多[5-6],但應(yīng)用該技術(shù)篩選AMI核心基因的報(bào)道較少。機(jī)器學(xué)習(xí)是基于數(shù)據(jù)構(gòu)建的計(jì)算模型。本研究旨在通過生物信息學(xué)技術(shù)和機(jī)器學(xué)習(xí)算法篩選AMI核心基因并進(jìn)行驗(yàn)證,現(xiàn)報(bào)道如下。
本實(shí)驗(yàn)時(shí)間為2021—2022年。
1.2.1 數(shù)據(jù)來源
從美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)的高通量基因表達(dá)(Gene Expression Omnibus,GEO)數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)下載與AMI相關(guān)的3個(gè)mRNA基因芯片數(shù)據(jù)集(GSE34198、GSE66360和GSE83500),其中GSE66360〔非AMI患者20例(對(duì)照組),AMI患者17例(AMI組)〕和GSE83500〔健康對(duì)照者46例(對(duì)照組),AMI患者49例(AMI組)〕為測試集,GSE34198〔健康對(duì)照者46例(對(duì)照組),AMI患者49例(AMI組)〕為驗(yàn)證集。
1.2.2 篩選差異表達(dá)基因
運(yùn)用R 4.2.0軟件中的“l(fā)imma包”,以|log2FC|>1、P<0.05為標(biāo)準(zhǔn),篩選GSE66360和GSE83500中差異表達(dá)基因。
1.2.3 GO功能富集分析、KEGG通路富集分析
應(yīng)用差異表達(dá)基因數(shù)據(jù)軟件對(duì)差異表達(dá)基因進(jìn)行GO功能富集分析,分析其主要富集的生物過程(biological process,BP)、細(xì)胞成分(cellular component,CC)、分子功能(molecular function,MF);通過Metascape官網(wǎng)(https://metascape.org)對(duì)差異表達(dá)基因進(jìn)行KEGG通路富集分析。
使用LASSO回歸方法縮小差異表達(dá)基因的范圍,然后使用支持向量機(jī)-遞歸特征消除(support vector machine-recursive feature elimination,SVM-RFE)方法在差異表達(dá)基因中尋找特征基因,取兩種機(jī)器學(xué)習(xí)算法的交集,即為核心基因。
比較測試集中AMI組和對(duì)照組核心基因表達(dá)水平,繪制ROC曲線以評(píng)估核心基因表達(dá)水平對(duì)測試集、驗(yàn)證集受試者發(fā)生AMI的預(yù)測價(jià)值,AUC為0.5~1.0,其值越大提示核心基因表達(dá)水平對(duì)AMI的預(yù)測價(jià)值越高。
1.5.1 實(shí)驗(yàn)細(xì)胞
大鼠心肌細(xì)胞株H9C2購自武漢普諾賽生物科技有限公司。
1.5.2 主要實(shí)驗(yàn)試劑與儀器
胎牛血清(Gibco,美國),DMEM 培養(yǎng)基(Gibco,美國),總RNA提取試劑盒(Axygen,美國),PrimeScript? RT reagent Kit(Takara,日本),TB Green? Premix Ex Taq? Ⅱ(Takara,日本),IL1R2、NR4A2、TREM1引物〔生工生物工程(上海)股份有限公司〕;微量臺(tái)式離心機(jī)(5810R)(Eppendorf,德國),熒光定量PCR儀(Applied Biosystems)(德國耶拿分析儀器股份公司),厭氧培養(yǎng)袋及厭氧產(chǎn)氣包(AnaeroPack-Anaero)(三菱公司,日本)。
1.5.3 細(xì)胞培養(yǎng)
采用含10%胎牛血清的DMEM培養(yǎng)液培養(yǎng)心肌細(xì)胞,將其置于37 ℃、95% O2、5% CO2培養(yǎng)箱中培養(yǎng),當(dāng)細(xì)胞匯合度達(dá)80%左右時(shí)進(jìn)行傳代。
1.5.4 構(gòu)建衰老心肌細(xì)胞模型及分組
采用D-半乳糖8 mg/ml刺激第2代心肌細(xì)胞9 d以制備衰老心肌細(xì)胞。將衰老心肌細(xì)胞按5×106個(gè)的數(shù)量接種到25T培養(yǎng)瓶中,然后隨機(jī)將其分為正常氧組和缺氧/復(fù)氧組,其中正常氧組心肌細(xì)胞常規(guī)培養(yǎng);缺氧/復(fù)氧組心肌細(xì)胞缺氧3 h后復(fù)氧2 h,以制備AMI細(xì)胞模型。
1.5.5 qPCR法檢測IL1R2、NR4A2、TREM1 mRNA相對(duì)表達(dá)量
在25T培養(yǎng)瓶中收集正常氧組和缺氧/復(fù)氧組心肌細(xì)胞,按照總RNA提取試劑盒說明書提取細(xì)胞總RNA,將RNA反轉(zhuǎn)錄成cDNA,采用2-ΔΔCt法計(jì)算IL1R2、NR4A2、TREM1 mRNA相對(duì)表達(dá)量。基因引物序列和產(chǎn)物長度見表1,擴(kuò)增條件見表2。實(shí)驗(yàn)獨(dú)立重復(fù)9次。
表1 基因引物序列和產(chǎn)物長度Table 1 Gene primer sequence and product length
表2 基因引物擴(kuò)增條件Table 2 Gene primer amplification conditions
采用GraphPad Prism 6.0統(tǒng)計(jì)學(xué)軟件進(jìn)行數(shù)據(jù)處理。計(jì)量資料以(±s)表示,兩組間比較采用成組t檢驗(yàn)。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
從GSE66360和GSE83500中篩選出145個(gè)AMI差異表達(dá)基因,其中上調(diào)差異表達(dá)基因125個(gè)、下調(diào)差異表達(dá)基因20個(gè),見圖1。
圖1 差異表達(dá)基因的火山圖Figure 1 Volcano map of differentially expressed genes
GO功能富集分析結(jié)果顯示,差異表達(dá)基因主要涉及的BP為細(xì)菌的防御反應(yīng)、中性粒細(xì)胞趨化性、粒細(xì)胞趨化性、中性粒細(xì)胞遷移、粒細(xì)胞遷移、骨髓白細(xì)胞遷移、白細(xì)胞趨化性、細(xì)胞對(duì)白介素1的反應(yīng)、白介素1介導(dǎo)的信號(hào)通路;主要涉及的CC為三級(jí)顆粒、特殊顆粒、分泌顆粒管腔、細(xì)胞質(zhì)小泡腔、富含纖維膠凝蛋白1的顆粒膜、特殊顆粒管腔、三級(jí)顆粒膜、液泡管腔;主要涉及的MF為碳水化合物的結(jié)合物、免疫受體活性、晚期糖基化終末產(chǎn)物受體結(jié)合物、IgG結(jié)合物、病毒顆粒結(jié)合物、細(xì)胞核糖皮質(zhì)激素受體結(jié)合物、肽聚糖溶血活性、核視黃醇X受體結(jié)合物、低聚糖結(jié)合物、調(diào)理素結(jié)合物。
KEGG通路富集分析結(jié)果顯示,差異表達(dá)基因主要涉及的信號(hào)通路為天然免疫反應(yīng)應(yīng)答、吞噬細(xì)胞殺傷的正性調(diào)節(jié)的信號(hào)通路。
在差異表達(dá)基因中,通過LASSO回歸分析篩選出10個(gè)特征基因,見圖2;通過SVM-RFE方法篩選出10個(gè)特征基因,見圖3;取交集得到9個(gè)核心基因,分別為NFIL3、IL1R2、NR4A2、IRAK3、VCAN、CCL20、TREM1、LYZ、ITLN1,見圖4。
圖2 差異表達(dá)基因的LASSO回歸分析結(jié)果Figure 2 LASSO regression analysis results of differentially expressed genes
圖3 差異表達(dá)基因的SVM-RFE方法分析結(jié)果Figure 3 SVM-RFE method analysis results of differentially expressed genes
圖4 差異表達(dá)基因的韋恩圖Figure 4 Venn diagram of differentially expressed genes
在測試集中,AMI組僅IL1R2、NR4A2、TREM1表達(dá)水平高于對(duì)照組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖5。ROC曲線分析結(jié)果顯示,IL1R2、NR4A2、TREM1 表達(dá)水平預(yù)測測試集受試者發(fā)生A M I 的AUC分別為0.648〔95%CI(0.534~0.756)〕、0.623〔95%CI(0.511~0.728)〕、0.622〔95%CI(0.502~0.730)〕,見圖6;IL1R2、NR4A2、TREM1 表達(dá)水平預(yù)測驗(yàn)證集受試者發(fā)生A M I 的AUC分別為0.834〔95%CI(0.761~0.898)〕、0.866〔95%CI(0.802~0.923)〕、0.808〔95%CI(0.729~0.880)〕,見圖7。
圖5 測試集中對(duì)照組與AMI組IL1R2、NR4A2、TREM1表達(dá)水平比較的箱式圖Figure 5 Box plot of comparison of IL1R2,NR4A2 and TREM1 expression levels between the control group and the AMI group
圖6 IL1R2、NR4A2、TREM1表達(dá)水平預(yù)測測試集受試者發(fā)生AMI的ROC曲線Figure 6 ROC curve of IL1R2,NR4A2 and TREM1 expression levels in predicting AMI in subjects in test set
圖7 IL1R2、NR4A2、TREM1表達(dá)水平預(yù)測驗(yàn)證集受試者發(fā)生AMI的ROC曲線Figure 7 ROC curve of IL1R2,NR4A2 and TREM1 expression levels in predicting AMI in subjects in validation set
缺氧/復(fù)氧組心肌細(xì)胞IL1R2、NR4A2、TREM1 mRNA相對(duì)表達(dá)量高于正常氧組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見表3。
表3 正常氧組與缺氧/復(fù)氧組心肌細(xì)胞IL1R2、NR4A2、TREM1 mRNA相對(duì)表達(dá)量比較(±s,n=9)Table 3 Comparison of relative expression levels of IL1R2,NR4A2 and TREM1 mRNA between normal oxygen group and hypoxia/reoxygenation group
表3 正常氧組與缺氧/復(fù)氧組心肌細(xì)胞IL1R2、NR4A2、TREM1 mRNA相對(duì)表達(dá)量比較(±s,n=9)Table 3 Comparison of relative expression levels of IL1R2,NR4A2 and TREM1 mRNA between normal oxygen group and hypoxia/reoxygenation group
組別IL1R2NR4A2TREM1正常氧組0.187±0.0430.127±0.0440.424±0.279缺氧/復(fù)氧組0.245±0.0290.257±0.0292.784±2.639 t值3.3157.3742.668 P值0.004<0.0010.028
AMI發(fā)病迅速且具有較高的死亡率[7-8]。目前,冠狀動(dòng)脈造影是診斷AMI的“金標(biāo)準(zhǔn)”,但其屬于有創(chuàng)檢查,故尋找AMI非創(chuàng)傷性診斷方法具有臨床價(jià)值。本研究通過生物信息學(xué)技術(shù)和機(jī)器學(xué)習(xí)算法篩選出9個(gè)AMI核心基因,且在測試集中,AMI組僅IL1R2、NR4A2、TREM1表達(dá)水平高于對(duì)照組;ROC曲線分析結(jié)果顯示,IL1R2、NR4A2、TREM1表達(dá)水平預(yù)測測試集受試者發(fā)生AMI的AUC分別為0.648、0.623、0.622,三者預(yù)測驗(yàn)證集受試者發(fā)生AMI的AUC分別為0.834、0.866、0.808;且缺氧/復(fù)氧組心肌細(xì)胞IL1R2、NR4A2、TREM1 mRNA相對(duì)表達(dá)量高于正常氧組,提示IL1R2、NR4A2、TREM1是AMI核心基因。
RONG 等[9]研究表明,IL1R2 基因多態(tài)性(rs11674595、rs4851527、rs2072472和rs3218977)可能與中國漢族人群骨質(zhì)疏松癥的發(fā)病有關(guān),但其在AMI中的作用有待深入挖掘。NR4A2屬于核受體4A亞家族,其編碼類固醇甲狀腺激素類維生素A受體,是核受體轉(zhuǎn)錄因子,而核受體轉(zhuǎn)錄因子在哺乳動(dòng)物神經(jīng)元發(fā)育、炎癥、記憶形成等方面具有調(diào)節(jié)作用。研究表明,NR4A2基因突變與癲癇發(fā)作、神經(jīng)發(fā)育異常和機(jī)體發(fā)育異常有關(guān)[10-13]。KARKI等[14]研究表明,NR4A2在膠質(zhì)母細(xì)胞瘤中是促癌基因,且其在心血管應(yīng)激反應(yīng)中具有重要作用。ASHRAF等[15]研究表明,在成年哺乳動(dòng)物心臟,特別是在心肌細(xì)胞中,在β-腎上腺素能刺激下NR4A2表達(dá)明顯上調(diào),其特異性過表達(dá)導(dǎo)致終末分化的心肌細(xì)胞重新進(jìn)入細(xì)胞周期和DNA復(fù)制增加,但不導(dǎo)致心肌細(xì)胞分裂。TREM1是髓樣細(xì)胞觸發(fā)性受體家族成員,屬于免疫球蛋白超家族受體,其主要功能是識(shí)別外源性抗原和毒性物質(zhì),從而調(diào)節(jié)炎癥反應(yīng)[16]。LIU等[17]研究表明,TREM1放大了腦源性和腸源性免疫原性成分的促炎反應(yīng),在TREM1上表達(dá)的觸發(fā)受體可在多種心血管疾病中驅(qū)動(dòng)炎癥反應(yīng)。VANDESTIENNE等[18]研究表明,TREM1可參與腹主動(dòng)脈瘤的病理生理過程。KIMMOUN等[19]研究表明,TREM1與心源性休克患者90 d死亡率和各種器官損傷有關(guān),但其在AMI中的具體分子機(jī)制尚不清楚。
綜上所述,IL1R2、NR4A2、TREM1是AMI核心基因,三者有望成為AMI潛在的生物標(biāo)志物。但本研究仍存在一定局限性:(1)無法闡明IL1R、NR4A2、TREM1導(dǎo)致AMI的具體機(jī)制;(2)無法明確IL1R、NR4A2、TREM1是否與其他組學(xué)有關(guān),如代謝組學(xué)、蛋白組學(xué)等。
作者貢獻(xiàn):李淑娟進(jìn)行文章的構(gòu)思與設(shè)計(jì),負(fù)責(zé)撰寫、修訂論文;柯妍進(jìn)行研究的實(shí)施與可行性分析;劉旭東、賀茜、徐遙琴進(jìn)行數(shù)據(jù)收集、整理、分析;田宇佳、盧冠軍、馬娟、朱澈進(jìn)行結(jié)果分析與解釋;汪樂新負(fù)責(zé)文章的質(zhì)量控制及審校,并對(duì)文章整體負(fù)責(zé)、監(jiān)督管理。
本文無利益沖突。