湯娜娜 謝登海 楊國輝(貴州醫(yī)科大學附屬醫(yī)院內科ICU,貴陽550004)
急性呼吸窘迫綜合征(acute respiratory distress syndrome,ARDS)是多種原因導致的急性彌漫性炎癥性肺損傷,臨床表現(xiàn)為急性低氧血癥,進行性呼吸窘迫,在呼氣末正壓通氣(positive end expiratory pressure,PEEP)≥5 cm H2O條件下,氧合指數(shù)(PaO2/FiO2)≤300 mmHg,胸部影像學表現(xiàn)為不能完全用心衰解釋的累及雙肺滲出性病變[1]。自1967年首次提出該臨床綜合征已過50余年,盡管對ARDS發(fā)病機制的認識在不斷深入,治療方法在不斷改進,但ARDS患者住院死亡率仍高達40%以上,嚴重危害著人類健康[2]。根據(jù)致病因素不同,臨床上可將ARDS分為兩類:肺源性ARDS(ARDS induced by pulmonary causes,ARDSp)和 肺 外 源 性ARDS(ARDS induced by extra pulmonary causes,ARDSexp)。ARDSp常見于各種病因所致的肺炎、肺挫傷、胃內容物的誤吸、煙霧吸入等。ARDSexp常見病因有膿毒癥、重癥創(chuàng)傷、急性胰腺炎和大量輸血等。肺外組織器官感染所致的膿毒癥是ARDSexp的臨床常見病因,但肺外膿毒癥并發(fā)ARDSexp的比例并不高,在西方國家發(fā)生率約6%~7%[3-5]。為何僅有部分膿毒癥患者并發(fā)ARDSexp,相關機制尚未明確,也尚無理想的有助于早期診斷的生物學標志物?;颊咭坏┎l(fā)ARDS,病情進展迅速,預后極差,晚期干預措施非常有限。如何能早期識別這類高?;颊撸蔷戎纬晒Φ年P鍵,也仍是目前醫(yī)務工作者們面臨的難題。通過高通量基因測序,對ARDS患者的基因表達和信號通路的研究,有助于ARDS發(fā)病機制的探討和揭示。本研究擬通過生物信息學方法,對GEO數(shù)據(jù)庫中有關膿毒癥誘發(fā)的ARDSexp的基因表達譜芯片進行分析,獲得差異表達基因、生物學過程、信號通路及關鍵基因等重要信息,為探討ARDSexp發(fā)生、發(fā)展中基因的調控機制提供基礎。
1.1 材料從GEO數(shù)據(jù)庫中篩選后下載KANG ELARIS等[3]2015年提交的基因芯片數(shù)據(jù)GSE66890。該芯片的平臺信息:GPL6244[HuGene-1_0-st]Affymetrix Human Gene 1[transcript(gene)version](Affymetrix Inc.Santa Clara,California,USA)。芯片共包含57例膿毒癥患者(其中29例并發(fā)ARDS)的全血mRNA標本。血標本在患者被收入ICU 24 h內進行采集,使用相同材料和方法分兩個批次進行處理。本研究選取了其中的23例肺外膿毒癥患者的數(shù)據(jù)為研究對象,以并發(fā)ARDSexp的8例患者作為實驗組(Sepsis+ARDSexp),剩余的15例未并發(fā)ARDS的患者作為對照組(Sepsis Only)進行研究。
1.2 方法
1.2.1 兩組患者臨床特征比較比較兩組患者年齡、性別、檢測批次、血常規(guī)中白細胞計數(shù)等臨床特征有無差異。采用SPSS20.0軟件進行數(shù)據(jù)分析,符合正態(tài)分布的計量資料用±s表示,兩組比較采用t檢驗;不符合正態(tài)分布的計量資料用中位數(shù)[median]表示,兩組比較采用U檢驗;分類變量用百分比(%)表示。P<0.05認為差異具有統(tǒng)計學意義。
1.2.2 差異表達基因的篩選GEO2R(https://w ww.ncbi.nlm.nih.gov/geo/geo2r/)是基于R編程語言的開源軟件,通過使用來自Bioconductor的GEOquery和limma程序包來分析高通量基因組數(shù)據(jù),應用t檢驗篩選差異表達基因(differentially expressed gene,DEGs)。篩選條件為差異表達倍數(shù)(FC)≥1.5,即|log2FC|>0.585且P<0.05。
1.2.3 差異表達基因的GO富集分析和KEGG通路分析利用DAVID在線分析平臺(https://david.ncifcrf.gov/)對DEGs進行基因本體(gene ontology,GO)分析和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)通路分析。GO注釋包括分子功能(molecular function,MF),參與的生物學過程(biological process,BP)和細胞組成(cellular component,CC)。對富集的功能及信號通路進行可視化圖形展示。以P<0.05作為生物信息分析的閾值。
1.2.4 差異表達基因的蛋白互作網(wǎng)絡圖及關鍵基因的篩選通過STRING在線數(shù)據(jù)庫(http://www.string-db.org/)預測蛋白之間的相互關系。以綜合評分(combination score)>0.4為閾值條件,將STRING中所得的數(shù)據(jù)導入Cytoscape3.6.1軟件繪制蛋白互作網(wǎng)絡(protein-protein interaction,PPI)圖,PPI圖是由多個節(jié)點和多條邊組成,每個節(jié)點代表一個蛋白質,每條邊表示蛋白質之間的相互作用。通過Cytoscape中的插件Cytohubba[6]計算關鍵基因。
2.1 兩組患者臨床特征比較年齡、性別和標本處理批次差異無統(tǒng)計學意義,兩組一般情況均衡可比。白細胞計數(shù)差異無統(tǒng)計學意義,Sepsis+ARDSexp組所有病例均并發(fā)休克,顯著高于對照組(P=0.007,表1)。
表1 兩組臨床特征比較Tab.1 Clinical characteristics in two groups
2.2 差異表達基因的篩選Sepsis+ARDSexp組和對照組一共篩選出288個DEGs,其中上調基因128個,下調基因160個。DEGs火山圖見圖1,紅點表示上調的DEGs,藍點表示下調的DEGs。表2和表3分別列出了Sepsis+ARDSexp組與對照組比較,差異表達顯著上調和下調前10位的基因。
表2 上調的差異表達基因(前10位)Tab.2 Up-regulated DEGs(TOP 10)
表3 下調的差異表達基因(前10位)Tab.3 Down-regulated DEGs(Top 10)
圖1 差異表達基因火山圖Fig.1 Volcano map of DEGs
2.3 差異表達基因的GO和KEGG通路富集分析利用DAVID在線數(shù)據(jù)庫分析發(fā)現(xiàn),DEGs主要富集炎癥反應、細胞防御、平滑肌細胞增殖、IL-1分泌和細胞免疫反應等生物學過程(圖2A)。細胞組成主要富集于外泌體、細胞膜和細胞漿等(圖2B)。分子功能主要富集碳水化合物結合、蛋白同源二聚體活化、受體激活和蛋白結合等功能(圖2C)。而KEGG通路分析發(fā)現(xiàn),這些DEGs主要富集于吞噬體、cGMP-PKG信號通路、造血、味覺傳導和內質網(wǎng)蛋白加工等相關信號通路(圖2D)。
圖2 差異表達基因GO和KEGG通路富集分析Fig.2 GO and KEGG pathway enrichment analysis of DEGs
2.4 差異表達基因的蛋白互做分析及關鍵基因篩選將288個DEGs導入STRING在線數(shù)據(jù)庫,以綜合評分>0.4為有效篩選標準,將數(shù)據(jù)導入Cytoscape3.6.1軟件,構建由161個節(jié)點和296條邊組成的PPI網(wǎng)絡圖(圖3)。通過Cytohubba插件中的MCC計算法篩選出前8位關鍵基因:CCR2、CXCR2、TAS2R20、TAS2R39、TAS2R40、S1PR1、HCAR2和HCAR3(表4)。
表4 關鍵基因篩選結果Tab.4 Result of hub genes screening
圖3 PPI圖Fig.3 Protein-protein interaction network
近年來,隨著生物信息學的發(fā)展和各種高通量技術的興起,大量基因芯片表達譜數(shù)據(jù)及全基因組測序技術被廣泛應用,通過生物信息學分析技術,可以找出疾病發(fā)生、發(fā)展過程中起關鍵作用的基因,有助于揭示疾病的發(fā)病機制,為尋找疾病新的治療方法和預后的監(jiān)測提供新的方向[7]。本文通過在GEO下載基因芯片數(shù)據(jù)集GSE66890,將膿毒癥并發(fā)的ARDSexp患者全血標本和肺外膿毒癥對照患者全血標本的芯片數(shù)據(jù)對比,共篩選出288個DEGs,其中上調基因128個,下調基因160個。GO分析顯示,DEGs主要富集炎癥反應、細胞防御和免疫反應等生物學過程。KEGG分析顯示主要富集于吞噬體、cGMP-PKG信號通路、造血、味覺傳導和內質網(wǎng)蛋白加工相關信號通路。通過蛋白互做分析,篩選出8個關鍵基因,其中S1PR1表達水平上調,其余7種基因水平下調。
趨化因子是能使細胞發(fā)生趨化運動的小分子細胞因子。根據(jù)其N端半胱氨酸的位置分為四大類:CC、CXC、C和CX3C,相應的受體分別為CCR、CXCR、CR和CX3CR。趨化因子與其受體相互作用能誘導靶細胞趨化性遷移,增強靶細胞與內皮細胞的黏附能力等,廣泛參與多種生理病理過程。CCR2、CXCR2與配體結合后,在感染部位募集中性粒細胞,誘導中性粒細胞氧化爆發(fā)和顆粒釋放,減輕炎癥反應,增加細菌清除,從而在炎癥介導過程的發(fā)揮重要作用。CXCR2的異常調控已涉及腫瘤和多種炎癥介導疾?。?-9]。肺部的炎癥反應是ARDS發(fā)生、發(fā)展的重要原因,中性粒細胞大量聚集在肺微血管、間質和肺泡腔內是ARDS的重要特征,趨化因子在介導中性粒細胞進入肺部中發(fā)揮主要作用。通過對臨床ARDS患者的樣本和ARDS動物模型的研究發(fā)現(xiàn),調節(jié)肺中性粒細胞遷移的趨化因子網(wǎng)絡可能涉及多個趨化因子配體及受體家族[10-11]。有研究報道分析ARDS患者血液和肺泡灌洗液分離的中性粒細胞CXCR2的表達無顯著性差異,但血液中的中性粒細胞CCR2的表達水平明顯低于肺泡灌洗液[12]。本文分析發(fā)現(xiàn)與對照組相比,ARDSexp患者全血中CCR2和CXCR表達均下降,但還需進一步實驗來驗證。
苦味受體(bitter taste receptor,TAS2R)是與人體感受苦味物質密切相關的一類G蛋白偶聯(lián)受體,TAS2R不僅存在于舌的味蕾中,在其他組織也表達并發(fā)揮功能。2010年DEEPAK等[13]首次發(fā)現(xiàn),在人類氣道平滑肌上存在TAS2R。近年研究發(fā)現(xiàn),TAS2R激動劑可促進氣道平滑肌松弛和支氣管擴張,抑制絲裂原誘導的生長[14]。TAS2R激動劑如氯喹和苯甲地那銨可以抑制TNF-α,IL-13和MCP-1的釋放,氯喹還可以呈劑量依賴性抑制IL-1β,IL-2,IL-4,IL-5,IL-10等炎癥因子的產(chǎn)生,從而抑制氣道炎癥反應,提示TAS2R激動劑可作為一種新型有效的藥物用于支氣管哮喘、COPD等慢性炎癥性疾病治療[15-16]。2020年全球新型冠狀病毒肺炎(corona virus disease 2019,COVID-19)疫情暴發(fā),我國學者通過大數(shù)據(jù)分析發(fā)現(xiàn)TAS2R激動劑可通過TAS2R增強機體防御能力,抑制過度免疫炎癥反應,可能對治療COVID-19有效[17]。TAS2R是否也在ARDS等呼吸道急性炎癥性疾病中發(fā)揮作用尚未見研究報道。本研究首次發(fā)現(xiàn)TAS2R在ARDSexp患者全血中差異表達并可能作為關鍵基因影響ARDSexp的發(fā)生發(fā)展。
磷酸鞘氨醇(sphingosine-1-phosphate,S1P)是一種具有生物活性的鞘氨醇代謝產(chǎn)物,通過與細胞表面的1-磷酸鞘氨醇受體(sphingosine-1-phosphate receptor,S1PR)作用而發(fā)揮其廣泛的生物學效應。S1PR屬于G蛋白偶聯(lián)受體,目前S1PR已成為炎癥、腫瘤、動脈粥樣硬化、自身免疫性疾病、神經(jīng)系統(tǒng)疾病等多種疾病的研究熱點之一。有研究報道,S1PR激動劑可抑制樹突狀細胞的活化和T細胞的增殖,顯著降低細胞因子/趨化因子的產(chǎn)生,抑制細胞因子風暴,可抑制甲型H1N1流感病毒誘發(fā)的急性肺損傷[18]。S1P-S1PR信號通路通過抑制炎癥反應、維持血管屏障功能有望成為ARDS新的治療方法[19-20]。
羥基羧酸(hydroxy-carboxylic acids,HCA)包括乳酸、酮體3-羥基丁酸以及β-氧化中間體3-羥基辛酸。HCA既是能量代謝的中間產(chǎn)物也是一種信號分子,通過激活羥基羧酸受體(hydroxy-carboxylic acid HCA receptor,HCAR)參與機體代謝、免疫等功能調節(jié)[21]。HCAR也是G蛋白偶聯(lián)受體,其家族由3個成員組成,分別為HCAR1、HCAR2和HCAR3。HCAR2和HCAR3在人體內表達廣泛,近期研究發(fā)現(xiàn)HCAR2激動劑富馬酸單乙酯前體DMF,可降低中性粒細胞對內皮細胞黏附性和趨化性,對治療銀屑病、多發(fā)性硬化癥有積極作用[22]。HCAR在ARDS發(fā)病中是否也具有抗炎和免疫調節(jié)等功能,目前尚未見相關研究報道。本研究首次發(fā)現(xiàn)HCAR2和HCAR3在ARDSexp患者全血中表達下調且均為關鍵基因。
綜上所述,本文通過對GEO中ARDSexp相關的基因芯片進行生物信息學分析,篩選出206個差異表達基因和并從中獲得8個關鍵基因。其中TAS2R20、TAS2R39、TAS2R40、HCAR2和HCAR3關鍵基因是首次發(fā)現(xiàn)在ARDSexp患者全血中差異表達。通過文獻挖掘,推測這些關鍵基因可能通過影響全身和肺局部炎癥反應、免疫應答及血管屏障等功能在ARDSexp的發(fā)病機制中起重要作用,可為ARDSexp的早期臨床診斷和個體化治療提供潛在靶點。由于本研究是基于數(shù)據(jù)庫中相關基因芯片數(shù)據(jù)的生物信息學分析,存在病例少,相關臨床資料提供不全等缺陷,故上述關鍵基因在ARDSexp患者中的表達和具體作用還需要后續(xù)的臨床和基礎研究來進一步證實。