巴文強(qiáng),李 艷,李夢媛
(1.吉安市中心人民醫(yī)院藥劑科,江西 吉安 343000;2.吉安市第三人民醫(yī)院心理科,江西 吉安 343000;3.南京醫(yī)科大學(xué)第二附屬醫(yī)院藥學(xué)部,江蘇 南京 210011)
肥厚型心肌病(HCM)是以心肌肥厚為主要特點(diǎn),嚴(yán)重患者可能會并發(fā)房顫、心力衰竭及心源性猝死等。HCM的病因多種多樣,最常見的是肌節(jié)蛋白基因突變[1-2]。然而,其相關(guān)致病基因未完全闡明,且缺乏有效的治療方法。因此,鑒定HCM發(fā)生發(fā)展過程中的關(guān)鍵基因可能有助于揭示其致病機(jī)制和發(fā)現(xiàn)特異性治療靶點(diǎn),對其診斷和治療具有重要意義。此外,鐵死亡是一種非凋亡形式的細(xì)胞死亡,已被證實(shí)與多種類型心肌病的發(fā)生發(fā)展有關(guān),但其對于HCM的確切作用仍未明確[3]。因此,本研究旨在通過生物信息學(xué)方法,識別HCM的關(guān)鍵基因,探索其發(fā)病機(jī)制與鐵死亡機(jī)制,為該病的診斷和治療提供新思路。
1.1數(shù)據(jù)收集:以“hypertrophic cardiomyopathy”為關(guān)鍵詞在GEO(http://www.ncbi.nlm.nih.gov/geo)數(shù)據(jù)庫中檢索HCM樣本的基因表達(dá)芯片。納入標(biāo)準(zhǔn):①數(shù)據(jù)樣本來自人類心臟組織;②數(shù)據(jù)樣本應(yīng)包括HCM患者和健康對照;③HCM組和對照組數(shù)據(jù)樣本數(shù)均大于3例。排除標(biāo)準(zhǔn):患者參加過藥物或其他治療的臨床試驗(yàn)。經(jīng)過篩選,最終在507個相關(guān)數(shù)據(jù)集中選擇下載GSE36961和GSE32453數(shù)據(jù)集。其中GSE36961數(shù)據(jù)集,平臺號為GPL15389 Illumina HumanHT-12 V3.0 expression beadchip,包含HCM組患者106例,對照組39例;GSE32453數(shù)據(jù)集,平臺號為GPL6104 Illumina humanRef-8 v2.0 expression beadchip,包含HCM組患者8例,對照組5例。
1.2差異表達(dá)基因(DEGs)的篩選:GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)是一個基于GEOquery和Limma R包的交互式網(wǎng)絡(luò)工具,可以比較GEO系列中的兩組或多組樣本,以識別在不同實(shí)驗(yàn)條件下表達(dá)差異的基因。利用GEO2R篩選DEGs,篩選參數(shù)標(biāo)準(zhǔn)為P<0.05,|Log2(Fold change)|>0.6。利用Venny 2.1在線工具(http://bioinfogp.cnb.csic.es/tools/venny/)獲得GSE36961和GSE32453數(shù)據(jù)集的共同DEGs。
1.3富集分析:將共同DEGs上傳至Metascape數(shù)據(jù)庫(https://metascape.org/)進(jìn)行基因本體(GO)和京都基因與基因組百科全書(KEGG)通路富集分析?;蠫O富集包括生物過程(BP)、細(xì)胞組成(CC)及分子功能(MF)。物種設(shè)定為“Homo sapiens”,P<0.05。富集結(jié)果通過微生信網(wǎng)站(http://www.bioinformatics.com.cn/)進(jìn)行可視化。
1.4蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)的構(gòu)建:將共同DEGs上傳至STRING11.5平臺(https://string-db.org/),設(shè)定置信度大于0.9,選擇物種為“Homo sapiens”,獲得PPI數(shù)據(jù)。將數(shù)據(jù)導(dǎo)入Cytoscape 3.7.2軟件進(jìn)行可視化處理,使用CytoHubba插件的Degree、DMNC、MCC、MNC、Radiality算法篩選關(guān)鍵基因。
1.5驗(yàn)證關(guān)鍵基因在HCM中的表達(dá):使用GSE1145數(shù)據(jù)集(平臺號為GPL570 [HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array,包含HCM組患者5例,對照組11例)驗(yàn)證關(guān)鍵基因在HCM中的表達(dá)水平,兩組數(shù)據(jù)比較采用t檢驗(yàn),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.6受試者工作特征(ROC)曲線分析:繪制關(guān)鍵基因的ROC曲線,比較關(guān)鍵基因在HCM中的診斷效能。ROC曲線的曲線下面積(AUC)在0.5~1。AUC越接近于1,說明診斷效果越好。其中,AUC在0.9以上有較高的準(zhǔn)確性,在0.7~0.9區(qū)間有一定準(zhǔn)確性,在0.5~0.7區(qū)間有較低準(zhǔn)確性[4]。
1.7鐵死亡調(diào)控基因獲取及其與HCM共同DEGs綜合分析:以“ferroptosis”為關(guān)鍵詞,在Genecards(https://www.genecards.org/)和FerrDb(http://www.zhounan.org/ferrdb/current/)數(shù)據(jù)庫中查詢與鐵死亡相關(guān)的基因。其中FerrDb數(shù)據(jù)庫下載鐵死亡過程的標(biāo)記基因、驅(qū)動基因和抑制基因。利用Venny 2.1在線工具將鐵死亡相關(guān)基因與HCM共同DEGs進(jìn)行映射,得到鐵死亡調(diào)控HCM的基因。將這些基因上傳至Metascape數(shù)據(jù)庫進(jìn)行KEGG通路富集分析,并用STRING11.5平臺構(gòu)建PPI網(wǎng)絡(luò)。
2.1DEGs篩選:利用GEO2R工具篩選DEGs,GSE36961數(shù)據(jù)集中共鑒定出600個DEGs,其中上調(diào)基因228個,下調(diào)基因372個,見圖1(A);GSE32453數(shù)據(jù)集中共鑒定出987個DEGs,其中上調(diào)基因518個,下調(diào)基因469個,見圖1(B)。
2.2共同DEGs的獲取:將GSE36961和GSE32453數(shù)據(jù)集鑒定出的DEGs上傳至Venny 2.1網(wǎng)站,得到共同DEGs。其中得到共同上調(diào)基因67個及共同下調(diào)基因69個,共計(jì)136個共同DEGs。見圖2。
注:A:上調(diào)基因;B:下調(diào)基因
2.3富集分析:GO富集分析結(jié)果見圖3(A)。其中BP主要涉及系統(tǒng)過程的調(diào)節(jié)、細(xì)胞絲裂原活化蛋白激酶級聯(lián)調(diào)控、肌肉肥大等,CC主要是肌動蛋白細(xì)胞骨架、黏著斑、肌小節(jié)等,MF富集最多為G蛋白偶聯(lián)受體結(jié)合、鈣離子結(jié)合、磷脂酰肌醇3-激酶結(jié)合等。KEGG富集分析結(jié)果見圖3(B),得到的生物學(xué)信號主要為流體剪切應(yīng)力和動脈粥樣硬化、脂質(zhì)與動脈粥樣硬化和糖尿病并發(fā)癥中的晚期糖基化終產(chǎn)物及其受體信號通路等。
2.4PPI網(wǎng)絡(luò)的構(gòu)建及關(guān)鍵基因篩選:運(yùn)用STRING11.5數(shù)據(jù)庫構(gòu)建PPI網(wǎng)絡(luò),使用Cytoscape 3.7.2進(jìn)行可視化。PPI網(wǎng)絡(luò)及CytoHubba插件5種算法的可視化見圖4。將5種算法得到的前10位基因的交集作為關(guān)鍵基因,最終得到4個關(guān)鍵基因:Fos原癌基因(FOS)、趨化因子配體2(CCL2)、CCAAT增強(qiáng)子結(jié)合蛋白Delta(CEBPD)和Pim-1原癌基因(PIM1)見圖5。
圖4 PPI網(wǎng)絡(luò)圖
圖5 5種算法前10位基因交集韋恩圖
2.5驗(yàn)證關(guān)鍵基因在HCM中的表達(dá):提取4個關(guān)鍵基因在GSE1145數(shù)據(jù)集HCM組和對照組中的表達(dá)量并進(jìn)行可視化分析,見圖6,其中CCL2、CEBPD和PIM1在HCM中表達(dá)下調(diào)且具有統(tǒng)計(jì)學(xué)意義(均P<0.05),而FOS在HCM中的表達(dá)與對照相比較差異無統(tǒng)計(jì)學(xué)意義(P=0.27)。
圖6 4個關(guān)鍵基因在對照和HCM中的表達(dá)差異小提琴圖
2.6ROC曲線分析:用ROC曲線的AUC值比較4個關(guān)鍵基因在HCM中的診斷效能,結(jié)果見圖7。CCL2對HCM的診斷有較高的準(zhǔn)確性(AUC為0.982),CEBPD和PIM1對HCM的診斷有一定的準(zhǔn)確性(AUC在0.7~0.9區(qū)間)。
圖7 4個關(guān)鍵基因的ROC曲線
2.7鐵死亡調(diào)控基因獲取及其與HCM共同DEGs綜合分析:在FerrDb和Genecards數(shù)據(jù)庫中查詢得到鐵死亡相關(guān)基因共959個,將這959個基因與上述136個共同DEGs進(jìn)行映射,得到10個與HCM相關(guān)的鐵死亡調(diào)控基因(圖8)。對這10個基因繪制PPI網(wǎng)絡(luò)(圖9)并進(jìn)行KEGG通路富集分析,共得到流體剪切應(yīng)力和動脈粥樣硬化、鐵死亡等6條信號通路(圖10)。
圖8 鐵死亡調(diào)控基因與共同DEGs的韋恩圖
圖9 PPI網(wǎng)絡(luò)圖
圖10 HCM相關(guān)鐵死亡調(diào)控基因的KEGG富集分析
HCM是一種常染色體顯性遺傳病,是目前國內(nèi)外引起青少年及運(yùn)動員猝死的主要原因。HCM在全球普通人群中的患病率至少為0.2%,中國成年人HCM患病率為80/10萬[1,5],值得引起重視。引起HCM的病因多種多樣,過往研究證實(shí)有超過29個基因的1 500余種突變可導(dǎo)致HCM,其中40%~60%是由編碼肌小節(jié)結(jié)構(gòu)蛋白的基因突變所致[1-2]。然而,HCM的具體發(fā)病機(jī)制還有待進(jìn)一步確定。
利用生物信息學(xué)方法鑒定疾病突變的關(guān)鍵基因和探究發(fā)病機(jī)制是目前研究的熱點(diǎn)。本研究通過GEO數(shù)據(jù)庫下載與HCM相關(guān)的GSE36961和GSE32453數(shù)據(jù)集,篩選得到136個共同DEGs,KEGG富集分析顯示主要信號通路為:流體剪切應(yīng)力和動脈粥樣硬化、脂質(zhì)與動脈粥樣硬化和糖尿病并發(fā)癥中的晚期糖基化終產(chǎn)物及其受體信號通路等,PPI網(wǎng)絡(luò)共鑒定出4個關(guān)鍵基因:FOS、CCL2、CEBPD、PIM1,基中CCL2、CEBPD、PIM1基因表達(dá)量在GSE1145數(shù)據(jù)集中得到了驗(yàn)證。
CCL2又稱MCP-1,其主要功能是特異性趨化單核/巨噬細(xì)胞、T淋巴細(xì)胞,可引起心肌的纖維化及血管壁平滑肌細(xì)胞增殖,其通過趨化作用和對整合素的活化促進(jìn)炎性反應(yīng)細(xì)胞的遷移,參與機(jī)體炎性反應(yīng)的發(fā)生和維持[6-7]。在心臟損傷和肥厚性重構(gòu)的過程中,心肌炎性反應(yīng)的發(fā)生會誘導(dǎo)心肌病理性肥大和心肌纖維化,最終導(dǎo)致心肌細(xì)胞死亡的不良結(jié)局[8]。MCP-1作為促炎性因子,還會損傷血管內(nèi)皮細(xì)胞,降低一氧化氮活性,發(fā)生血管痙攣;同時發(fā)揮趨化作用,誘導(dǎo)循環(huán)和組織中的巨噬細(xì)胞在受損血管中浸潤,分泌細(xì)胞因子,促進(jìn)平滑肌細(xì)胞增殖和遷移,加快血管斑塊的形成[9]。本研究發(fā)現(xiàn)CCL2在HCM中表達(dá)下調(diào),且對HCM有較高的診斷效能,因此認(rèn)為CCL2可能是HCM發(fā)病機(jī)制中的關(guān)鍵基因。
CEBPD是一種無內(nèi)含子基因,編碼屬于CEBP家族的269個氨基酸的蛋白質(zhì),一種被認(rèn)為參與細(xì)胞分化、代謝和免疫應(yīng)答反應(yīng)的轉(zhuǎn)錄因子。過往研究表明,CEBPD在炎性反應(yīng)刺激反應(yīng)中起著關(guān)鍵作用[10],而心肌病理性肥大的發(fā)生與炎性反應(yīng)信號因子的釋放和免疫細(xì)胞的激活有關(guān)[11]。本研究發(fā)現(xiàn)CEBPD在HCM患者的心肌組織中表達(dá)下調(diào),且對HCM有一定的診斷效能,因此認(rèn)為CEBPD可能是HCM發(fā)展過程中的關(guān)鍵基因。
HCM患者與正?;颊呦啾妊鲃恿W(xué)會發(fā)生顯著變化,這導(dǎo)致層流切應(yīng)力也會相應(yīng)的改變。有研究發(fā)現(xiàn),層流切應(yīng)力會顯著上調(diào)PIM1的表達(dá),而PIM1對6-磷酸果糖激酶-2/果糖-2,6-二磷酸酶3(PFKFB3)存在負(fù)調(diào)控作用,同時PFKFB3作為內(nèi)皮細(xì)胞糖酵解途徑的關(guān)鍵酶,因此認(rèn)為PIM1可能通過PFKFB3信號分子在層流切應(yīng)力調(diào)節(jié)內(nèi)皮細(xì)胞糖酵解中發(fā)揮重要作用[12]。既往研究表明,在心肌病理性肥大的發(fā)展過程中,心肌細(xì)胞減少了葡萄糖的氧化,增加了糖酵解和其他形式的代謝[13],這種細(xì)胞代謝方式的轉(zhuǎn)變直接誘導(dǎo)或促進(jìn)了心肌病理性肥大的發(fā)生[14]。而線粒體功能障礙是這一過程公認(rèn)的潛在機(jī)制[15-16]。同時,PIM1在維持心肌細(xì)胞線粒體穩(wěn)態(tài)中也起著關(guān)鍵作用[17]。結(jié)合本研究發(fā)現(xiàn)PIM1在HCM患者的心肌組織中表達(dá)下調(diào),且對HCM有一定的診斷效能,因此認(rèn)為PIM1可能是HCM發(fā)展過程中的關(guān)鍵基因。
本研究進(jìn)一步分析了HCM可能的鐵死亡機(jī)制,得到活化轉(zhuǎn)錄因子 3(ATF3)、溶血磷脂酰膽堿?;D(zhuǎn)移酶3(LPCAT3)和PIM1等10個與HCM相關(guān)的鐵死亡調(diào)控基因,對這10個基因進(jìn)行KEGG通路富集分析,共得到流體剪切應(yīng)力和動脈粥樣硬化、鐵死亡等信號通路。ATF3是ATF/CREB轉(zhuǎn)錄因子家族中的一員,是一個已知的氧化應(yīng)激反應(yīng)基因。研究發(fā)現(xiàn),ATF3通過負(fù)調(diào)控MEK-ERK1/2和JNK通路在心肌肥厚的發(fā)生發(fā)展過程中發(fā)揮關(guān)鍵作用[18]??缒さ鞍邹D(zhuǎn)運(yùn)載體家族7成員11(SLC7A11)是鐵死亡通路中的關(guān)鍵基因,通過參與還原型谷胱甘肽合成、脂質(zhì)過氧化物的氧化還原調(diào)控鐵死亡[19]。內(nèi)源性谷胱甘肽的生物合成依賴于谷氨酸/胱氨酸反向轉(zhuǎn)運(yùn)體(system Xc-)系統(tǒng),其由SLC7A11和單通道跨膜調(diào)控蛋白家族3成員2(SLC3A2)組成,system Xc-系統(tǒng)可通過1∶1交換谷氨酸和胱氨酸來調(diào)節(jié)鐵死亡[20]。研究表明,ATF3可抑制system Xc-系統(tǒng),并通過抑制SLC7A11的表達(dá)使細(xì)胞更易發(fā)生鐵死亡[21]。多不飽和脂肪酸易受脂質(zhì)過氧化影響,是發(fā)生鐵死亡的必要條件。LPCAT3參與細(xì)胞膜中多不飽和脂肪酸的生物合成和重塑,在氧化應(yīng)激狀態(tài)下,細(xì)胞可激活LPCAT3誘導(dǎo)脂質(zhì)過氧化反應(yīng)。當(dāng)多不飽和脂肪酸被催化生成脂質(zhì)過氧化物,會進(jìn)一步破壞細(xì)胞形態(tài)及功能,如細(xì)胞膜缺陷及線粒體收縮功能障礙,最終誘發(fā)鐵死亡[22]。
鐵死亡是近年來發(fā)現(xiàn)的一種鐵依賴的、非凋亡形式的調(diào)節(jié)性細(xì)胞死亡,其在心肌病的發(fā)生發(fā)展中扮演著重要角色。目前對于心肌病狀態(tài)下鐵代謝紊亂及鐵死亡的探索和認(rèn)識仍處于起步階段。本研究篩選出了10個鐵死亡相關(guān)基因及信號通路,然而這些鐵死亡基因的確切機(jī)制和相關(guān)信號通路仍不明確,在后續(xù)研究中應(yīng)對鐵死亡基因在HCM發(fā)展過程中的生物學(xué)功能進(jìn)行細(xì)胞學(xué)實(shí)驗(yàn)驗(yàn)證。