楊子云,蔣婷婷,葛春光,賈曉東,劉清發(fā) ,王 琪 ,彭蘭博,蘭 菲,齊 軍
(1.聊城市人民醫(yī)院 呼吸內(nèi)科,山東 聊城 252000;2.聊城市職業(yè)技術(shù)學(xué)院,山東 聊城 252000;3.聊城市人民醫(yī)院 轉(zhuǎn)化醫(yī)學(xué)實(shí)驗(yàn)室,山東 聊城 252000;4.聊城市人民醫(yī)院 內(nèi)分泌科,山東 聊城 252000;5.聊城市人民醫(yī)院 病案信息科,山東 聊城 252000)
肺動(dòng)脈高壓(PAH-Pulmonary Arterial Hypertension)是一種罕見、致命的心血管疾病[1,12-13],其預(yù)后較差,嚴(yán)重降低了患者的生存質(zhì)量。肺動(dòng)脈高壓是由遺傳、環(huán)境等多種病因共同作用導(dǎo)致的[12-13]。PAH臨床特征主要是內(nèi)皮功能障礙、血管細(xì)胞增殖、代謝紊亂和肺小動(dòng)脈炎癥等,肺動(dòng)脈壓升高和血管阻力增加,通常導(dǎo)致右心衰竭,嚴(yán)重者導(dǎo)致死亡[6-9]。PAH的血流動(dòng)力學(xué)診斷標(biāo)準(zhǔn)mPAP≥ 25 mmHg,同時(shí)肺小動(dòng)脈楔壓(Pulmonary Artery Wedge Pressure,PAWP)≤15 mmHg 及肺血管阻力 >3 Wood單位[14-15]。
肺動(dòng)脈高壓的發(fā)病機(jī)制較為復(fù)雜,目前尚不清楚,研究指出PAH涉及細(xì)胞功能異常、離子通道等多個(gè)生物過程,肺血管平滑肌細(xì)胞、內(nèi)皮細(xì)胞、成纖維細(xì)胞及血小板等多個(gè)種類細(xì)胞異常參與其形成及進(jìn)展,多種血管活性物質(zhì)功能失衡促進(jìn)其發(fā)生[6,8,14-15]。近年來已經(jīng)發(fā)現(xiàn)PAH與Notch3、BMPR2、PTEN、ALK1等基因參與的信號(hào)通絡(luò)和調(diào)節(jié)機(jī)制密切相關(guān)。但由于目前肺動(dòng)脈高壓樣本較難獲取,相關(guān)研究數(shù)據(jù)樣本量較小,其疾病機(jī)理尚未闡述清楚。
炎癥細(xì)胞侵潤是肺動(dòng)脈高壓血管重塑的典型特質(zhì),這提示PAH可能與人體免疫機(jī)制相關(guān)[9]。新型冠狀病毒肺炎(Corona Virus Disease 2019(COVID-19))是一種急性感染性肺炎,在全球范圍內(nèi)流行,其病原體是新型冠狀病毒,之前未在人類中發(fā)現(xiàn)[2-5],具有較強(qiáng)的傳染性。有研究指出COVID-19會(huì)通過多種機(jī)制影響患者的心血管系統(tǒng),同時(shí)具有心血管疾病的患者為新型冠狀病毒易感人群[16]。肺動(dòng)脈高壓作為心血管疾病的一種,其進(jìn)展較快,如果患者一旦合并肺部感染,會(huì)加快疾病進(jìn)程,使病情惡化,故COVID-19感染會(huì)加重PAH患者病情,為其治療提出更多挑戰(zhàn)。
為了更深入的探索PAH的發(fā)病機(jī)制,挖掘新型冠狀病毒感染對(duì)PAH患者的影響機(jī)制,合并了多個(gè)PAH表達(dá)譜數(shù)據(jù),并構(gòu)建了PAH差異基因和冠狀病毒相關(guān)免疫基因的互作網(wǎng)絡(luò),從而從系統(tǒng)生物學(xué)角度探索新型冠狀病毒對(duì)PAH致病機(jī)理的影響,挖掘潛在的基因靶點(diǎn),為肺動(dòng)脈高壓的研究和治療提供新思路。
表達(dá)譜數(shù)據(jù)來自Gene Expression Omnibus(GEO-https://www.ncbi.nlm.nih.gov/geo/),編號(hào)分別為GSE113439,GSE117261,GSE131793,GSE17400。使用R包GEOquery下載相應(yīng)數(shù)據(jù)集,并獲取對(duì)應(yīng)的芯片注釋信息。本次實(shí)驗(yàn)共獲得PAH表型及其對(duì)照數(shù)據(jù)129例,其中PAH數(shù)據(jù)81例,對(duì)照數(shù)據(jù)41例。蛋白質(zhì)互作網(wǎng)絡(luò)數(shù)據(jù)采用STRING[17]數(shù)據(jù)庫的最新版本(V11.0),本次不考慮互作關(guān)系的方向,網(wǎng)絡(luò)節(jié)點(diǎn)對(duì)應(yīng)為gene symbol,統(tǒng)計(jì)得到網(wǎng)絡(luò)中共包括16 073個(gè)基因,共500 111對(duì)互作關(guān)系。
本次實(shí)驗(yàn)合并了3套關(guān)于PAH的數(shù)據(jù),為了去除批次效應(yīng),提高后續(xù)分析數(shù)據(jù)的質(zhì)量,使用R包sva[18]的經(jīng)驗(yàn)貝葉斯模型ComBat對(duì)合并的數(shù)據(jù)進(jìn)行去除批次效應(yīng),然后使用芯片平臺(tái)注釋文件解析為Gene Symbol表達(dá)數(shù)據(jù),相同基因不同探針的表達(dá)數(shù)據(jù)使用均值進(jìn)行合并,表達(dá)譜數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。
使用GSEA[19]軟件(V4.0.3)對(duì)較正后的表達(dá)譜數(shù)據(jù)進(jìn)行功能富集分析,并使用limma[20]包,對(duì)表達(dá)數(shù)據(jù)進(jìn)行差異基因篩選,錯(cuò)誤發(fā)現(xiàn)率(False Discovery Rate, FDR)設(shè)定為FDR<0.01。
從蛋白質(zhì)互作網(wǎng)絡(luò)中提取出肺動(dòng)脈高壓差異表達(dá)基因相關(guān)的網(wǎng)絡(luò)做為PAH功能相關(guān)網(wǎng)絡(luò),為了能抓取和冠狀病毒毒性因子相關(guān)的基因互作關(guān)系,從PAH功能網(wǎng)絡(luò)中提取出與其功能直接相關(guān)基因構(gòu)成的網(wǎng)絡(luò),此背景網(wǎng)絡(luò)作為研究肺動(dòng)脈高壓和新冠狀病毒互作網(wǎng)絡(luò)的基礎(chǔ)背景。
有研究指出SARS-CoV-2的序列與SARS-CoV-1的序列具有較高的一致性[21],本研究通過全長的參考序列其核心蛋白質(zhì)的序列一致性來進(jìn)行驗(yàn)證。本次使用的數(shù)據(jù)包括SARS-CoV-2參考序列(NC_045512.2),SARS-CoV-1(NC_004718.3),MERS-COV(NC_019843.3),多序列比對(duì)使用Mega[22]和MAFFT[23](https://www.ebi.ac.uk/Tools/msa/mafft/)。
研究指出,SARS-CoV-2與SARS-CoV-1具有較高得基因組相似度,而且都通過ACE2基因影響人類的免疫基礎(chǔ)功能[24]。所以本次使用GSE17400數(shù)據(jù)集,提取其主要的差異功能基因,然后注釋其相關(guān)的功能通絡(luò)。通絡(luò)中主要的因子即為SARS-CoV-1病毒與人免疫互作的功能因子。這些功能因子作為新型冠狀病毒侵入人體后的免疫因子。
從GSEA MsigDB數(shù)據(jù)中提取與SARS-CoV-1病毒因子及免疫相關(guān)的基因集合,然后從背景網(wǎng)絡(luò)中挖掘二者互作的核心功能節(jié)點(diǎn)。使用軟件Cytoscape V3.6.0對(duì)構(gòu)建的網(wǎng)絡(luò)進(jìn)行可視化,網(wǎng)絡(luò)模塊分析采用cytoHubba[25]。
為了探索PAH發(fā)病機(jī)理,闡述其致病機(jī)理,文中使用經(jīng)過校正的表達(dá)譜數(shù)據(jù)進(jìn)行KEGG、BioCarta、PID、Reactome通路富集分析,并進(jìn)行GO Biological Processes功能注釋。篩選P<0.01,|NES|>1的顯著通路,結(jié)果顯示,血管平滑肌細(xì)胞、成纖細(xì)胞等細(xì)胞異常通路與PAH的進(jìn)展密切相關(guān);此外轉(zhuǎn)化生長因子-β信號(hào)通路、Wnt信號(hào)傳導(dǎo)途徑等信號(hào)轉(zhuǎn)導(dǎo)通路也與PAH密切相關(guān)。細(xì)胞增值、T/B細(xì)胞參與的免疫反應(yīng),炎癥反應(yīng)等重要生物過程也與PAH緊密相關(guān)。篩選的部分顯著通路,主要包括FOXP3 TARGETS IN THYMUS,TGFBETA1 IL6 IL23A CD4 TCELL,IFNA STIM STAT4 KO EFFECTOR CD8 TCELL,NFKB INHIBITOR TREATED HCMV INF MONOCYTE等通路(見圖1),這些通路涉及細(xì)胞信號(hào)調(diào)控,固有免疫反應(yīng),機(jī)體對(duì)外界刺激反應(yīng)等重要的免疫生物學(xué)過程,這提示PAH的過程與機(jī)體免疫密切關(guān)聯(lián)。
圖1 肺動(dòng)脈高壓功能相關(guān)部分顯著通路及生物過程
使用R的limma包中的貝葉斯方法對(duì)處理后的數(shù)據(jù)進(jìn)行差異表達(dá)基因篩選,顯著性P<0.01,通過篩選共得到179個(gè)差異表達(dá)基因,為了更好的闡述差異表達(dá)基因相關(guān)的功能機(jī)制以及相互作用,從STRING蛋白質(zhì)互作網(wǎng)絡(luò)中提取了差異表達(dá)基因相關(guān)的功能網(wǎng)絡(luò),共提取出與差異基因直接相關(guān)的18 087個(gè)基因,共138 807條互作關(guān)系對(duì),這些互作關(guān)系對(duì)是肺動(dòng)脈高壓功能進(jìn)展密切相關(guān)的,是肺動(dòng)脈高壓致病機(jī)理潛在的分子基礎(chǔ)。
通過全長參考基因組序列的比對(duì),發(fā)現(xiàn)與MERS-COV相比較,SARS-CoV-2的序列與SARS-CoV-1具有更高的相似性。為了驗(yàn)證是否在蛋白質(zhì)水平也存在類似的結(jié)論,整理出了全長參考基因組的結(jié)構(gòu)蛋白質(zhì)序列,然后進(jìn)行多序列比對(duì),結(jié)果發(fā)現(xiàn)SARS-CoV-2和SARS-CoV-1的M、N和E蛋白具有90%以上的遺傳相似性,而S蛋白的遺傳相似性略有降低,達(dá)77.54%。通過基因組序列和結(jié)構(gòu)蛋白序列比對(duì),發(fā)現(xiàn)SARS-CoV-2與SARS-CoV-1具有更高的相似性(見圖2)。
圖2 SARS-CoV-2與SARS-CoV-1、MERS-COV序列及結(jié)構(gòu)蛋白相似性比較
SARS-CoV-1與SARS-CoV-2的平均序列相似性高達(dá)70%,SARS-CoV-1是通過與人的ACE2蛋白互作結(jié)合進(jìn)入人體的[26]。新型冠狀病毒S-蛋白中與人體ACE2蛋白結(jié)合的關(guān)鍵氨基酸有部分改變,但依舊維持了SARS-CoV-1的S-蛋白與ACE2蛋白互作的結(jié)構(gòu)構(gòu)象,所以COVID-19很可能通過ACE2蛋白影響人體的免疫反應(yīng)[27]。有研究指出ACE2的表達(dá)主要與先天及后天免疫應(yīng)答相關(guān),與B細(xì)胞相關(guān)的免疫調(diào)節(jié)及相關(guān)細(xì)胞因子、IL8、IL16等密切相關(guān)[1,9]。為了弄清SARS-CoV在感染人后對(duì)體內(nèi)對(duì)生化過程的影響,我們使用GSE17400數(shù)據(jù)集的SARS-CoV-1感染12 h、24 h、48 h后的表達(dá)數(shù)據(jù),分析其進(jìn)展相關(guān)功能機(jī)制。發(fā)現(xiàn)SARS-CoV-1在侵入宿主后會(huì)激活機(jī)體的免疫反應(yīng),相關(guān)功能主要有病毒反應(yīng)、病毒復(fù)制機(jī)制調(diào)控,同時(shí)還會(huì)影響細(xì)胞周期控制、細(xì)胞分化等重要生物過程。顯著GO注釋結(jié)果(見圖3)。
圖3 SARS-CoV-1侵染人體差異基因GO功能富集顯著生物過程
上述注釋結(jié)果表明PAH差異表達(dá)基因與免疫應(yīng)答相關(guān)通路密切相關(guān),為了深入研究其具體的互作情況,整理出二者分別對(duì)應(yīng)的基因列表,并進(jìn)行統(tǒng)計(jì),PAH差異表達(dá)基因112個(gè),MSigDB中免疫應(yīng)答相關(guān)基因2 916個(gè),二者交集基因共328個(gè)(見圖4a)。PAH與正常組對(duì)比分析發(fā)現(xiàn)ACE2表達(dá)差異不顯著(P=0.053),但GSE17400數(shù)據(jù)分析發(fā)現(xiàn),感染前后,及感染后12 h、24 h、48 h,ACE2表達(dá)差異顯著(見圖4b,4c)。為了探索病毒入侵宿主后,相關(guān)差異表達(dá)基因情況,統(tǒng)計(jì)GSE17400數(shù)據(jù)集的表達(dá)差異基因,并分別與PAH差異表達(dá)基因和免疫應(yīng)答相關(guān)基因進(jìn)行分析,共有4個(gè)基因同時(shí)參與三類生物學(xué)過程,具體情況。4個(gè)基因分別為ITGAM,SHMT2,PLAC8,CCR1。從統(tǒng)計(jì)結(jié)果來看,三者的交集相對(duì)較小,不利于深入探索COVID-19對(duì)PAH的影響機(jī)制,接下來我們通過蛋白質(zhì)互作網(wǎng)絡(luò)的形式進(jìn)一步擴(kuò)展核心基因,并從系統(tǒng)學(xué)的角度闡述其可能的發(fā)病和進(jìn)展機(jī)理。
圖4 PAH和免疫相關(guān)基因以及SARS-CoV-1差異表達(dá)基因的分析
為了探索PAH的疾病進(jìn)展與新型冠狀病毒感染后的機(jī)體反應(yīng)重要過程,從Molecular Signatures Database(v7.1)的GO生物過程中提取與機(jī)體免疫相關(guān)的生物過程,并綜合免疫細(xì)胞因子、T/B細(xì)胞介導(dǎo)的免疫反應(yīng)等過程的重要基因,與PAH的差異基因相關(guān)互作網(wǎng)絡(luò)進(jìn)行網(wǎng)絡(luò)分析。本次構(gòu)建的互作網(wǎng)絡(luò)包含2 364個(gè)基因,共22 720條互作關(guān)系對(duì)。使用Cytoscape的cytoHubba插件進(jìn)行網(wǎng)絡(luò)分析,因?yàn)榫垲愊禂?shù)代表了網(wǎng)絡(luò)群體中“關(guān)系”重要的程度,故本次選擇聚類系數(shù)較高的30個(gè)基因,作為互作網(wǎng)絡(luò)中關(guān)鍵基因,進(jìn)行后續(xù)核心功能解釋和分析。
從網(wǎng)絡(luò)的統(tǒng)計(jì)特性可以得到,提取的核心網(wǎng)絡(luò)滿足無尺度特性,少數(shù)調(diào)控基因在網(wǎng)絡(luò)中起關(guān)鍵的調(diào)控作用。重要的基因如VCAM1,HBB,IL1R2,RNASE2,ITGAM,F(xiàn)GR等。在GeneCard數(shù)據(jù)庫中查詢相關(guān)基因的主要功能可知,這些基因參與信號(hào)調(diào)控,細(xì)胞免疫反應(yīng)等重要生物學(xué)過程,在機(jī)體響應(yīng)外界刺激,啟動(dòng)自身免疫及炎癥等反應(yīng)中起到重要的調(diào)控作用。核心網(wǎng)絡(luò)(見圖5)。
圖5 肺動(dòng)脈高壓差異基因與冠狀病毒感染后免疫基因蛋白質(zhì)互作網(wǎng)絡(luò)顯著模塊
肺動(dòng)脈高壓發(fā)病機(jī)制復(fù)雜,是由環(huán)境因素、遺傳因素等多種病因共同作用而導(dǎo)致的肺血管阻力增加,病理改變的一類致死性較高的心血管疾病。PAH的預(yù)后較差,嚴(yán)重影響患者的生存質(zhì)量。近幾年,隨著靶向用藥的不斷更新和普及,肺動(dòng)脈高壓的一年生存期提高了10%~20%,改善較為顯著,但整體而言,其治療效果仍不容樂觀,究其原因是PAH的致病機(jī)理尚未研究清楚,這主要是因?yàn)镻AH組織樣本較難獲取,樣本量較小,全基因組范圍內(nèi)的研究較少等導(dǎo)致的。本研究合并了來自GEO數(shù)據(jù)庫的三個(gè)同一平臺(tái)的表達(dá)數(shù)據(jù),深度挖掘PAH致病相關(guān)基因及信號(hào)通路。研究發(fā)現(xiàn)轉(zhuǎn)化生長因子-β信號(hào)通路、血管平滑肌細(xì)胞、成纖細(xì)胞、細(xì)胞增殖及分化以及T細(xì)胞或B細(xì)胞介導(dǎo)的免疫反應(yīng)與PAH的致病和發(fā)展緊密相關(guān)。
轉(zhuǎn)錄生長因子-β信號(hào)通路在炎癥反應(yīng)、細(xì)胞分化、固有免疫等生物過程中起到關(guān)鍵的作用,BMPR2基因編碼BMPR-II,是骨形態(tài)發(fā)生蛋白配體的細(xì)胞表面受體,在與配體結(jié)合時(shí),TGF-β II型受體磷酸化I型受體,導(dǎo)致調(diào)節(jié)SMAD的受體的磷酸化并被激活,然后與coSMAD復(fù)合并轉(zhuǎn)移到細(xì)胞核以激活特定的轉(zhuǎn)錄程序[28]。CAV1作為細(xì)胞膜內(nèi)的一種支架蛋白與CAV2形成穩(wěn)定的復(fù)合物,并驅(qū)動(dòng)caveolae的形成,CAV1參與T細(xì)胞受體介導(dǎo)的T細(xì)胞活化信號(hào)通路。KCNK3基因是編碼鉀通道蛋白超家族的成員,其編碼的蛋白質(zhì)是一個(gè)向外整流的通道,對(duì)細(xì)胞外pH值的變化較為敏感,并受到細(xì)胞外酸化的抑制。CAV1、KCNK3等基因變異是肺動(dòng)脈高壓相關(guān)的重要遺傳因素。
炎癥細(xì)胞浸潤是肺動(dòng)脈高壓患者血管重塑異常的一個(gè)顯著特征,這表明免疫效應(yīng)細(xì)胞參與PAH的進(jìn)展。通路富集分析發(fā)現(xiàn)PAH的進(jìn)展與T/B細(xì)胞參與的免疫過成,固有免疫相關(guān)過程。SARS-CoV-2感染人體后,會(huì)引起發(fā)熱、乏力、干咳呼吸困難等癥狀,這對(duì)PAH患者而言無疑是雪上加霜,所以探索PAH的免疫相關(guān)機(jī)制與人體內(nèi)免疫過程,可能提示有效的基因靶點(diǎn),從而有效的緩解和治療PAH的癥狀。通過蛋白質(zhì)互作網(wǎng)絡(luò)研究發(fā)現(xiàn)HBB、ITGAX、VCAM1、CLEC7A、TLR8等基因在網(wǎng)絡(luò)中發(fā)揮了重要的調(diào)控作用。
HBB參與固有免疫和紅細(xì)胞吸收二氧化碳釋放氧氣等重要調(diào)控通路,參與氧氣從肺部運(yùn)輸?shù)街車M織的重要功能[29];此外還有研究指出HBB還參與疼痛和炎癥反應(yīng)等相關(guān)生物過程。ITGAX基因編碼整合素αX鏈蛋白,該蛋白與β2鏈(ITGB2)結(jié)合形成白細(xì)胞特異性整合素,αXβ2復(fù)合物與αMβ2整合素在中性粒細(xì)胞和單核細(xì)胞與受刺激內(nèi)皮細(xì)胞粘附功能相關(guān)。VCAM1在細(xì)胞識(shí)別過程中很發(fā)揮重要作用,同時(shí)在白細(xì)胞與內(nèi)皮細(xì)胞粘附中起關(guān)鍵作用,與白細(xì)胞上的整合素α-4/β-1(ITGA4/ITGB1)相互作用,介導(dǎo)粘附和信號(hào)轉(zhuǎn)導(dǎo)。另外VCAM1基因在免疫應(yīng)答和白細(xì)胞遷移到炎癥部位中起重要作用。
這些基因在肺動(dòng)脈高壓的發(fā)病及進(jìn)展中起關(guān)鍵作用,并且這些基因在SARS-CoV-2侵染人體后的相關(guān)免疫中也發(fā)揮這重要的生物功能,這可能提示以這些基因?yàn)榘悬c(diǎn),可能發(fā)現(xiàn)新的治療藥物,這對(duì)PAH機(jī)理研究和治療有重要意義。
通過PAH表達(dá)譜數(shù)據(jù),深入探索了PAH相關(guān)的遺傳機(jī)制,同時(shí)通過蛋白互作網(wǎng)絡(luò),研究了冠狀病毒感染相關(guān)的免疫相關(guān)基因與PAH致病機(jī)理相關(guān)基因的互作關(guān)系,發(fā)現(xiàn)了一些潛在的基因靶點(diǎn),這對(duì)PAH遺傳研究和挖掘靶向藥物研究提供了新的研究思路。
1)互作網(wǎng)絡(luò)研究結(jié)果發(fā)現(xiàn)HBB、ITGAX、VCAM1、CLEC7A、TLR8等基因在PAH與機(jī)體免疫調(diào)控中發(fā)揮了重要作用,這可能是PAH合并冠狀病毒感染患者的治療提供了候選靶點(diǎn)。
2)轉(zhuǎn)化生長因子-β信號(hào)通路、T/B細(xì)胞介導(dǎo)的免疫通路等調(diào)控通路在PAH的發(fā)生和發(fā)展中發(fā)揮了重要的作用。