谷雨 王文俊 胡悅 王煒 孫英 黃克武
1首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院呼吸與危重癥醫(yī)學(xué)科 北京呼吸疾病研究所100020;2首都醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院免疫學(xué)系,北京100069
COPD是一種以進(jìn)行性、不可逆性氣道阻塞為主要特點(diǎn)的疾病,主要病理改變?yōu)榉尾啃獾雷枞?慢性阻塞性細(xì)支氣管炎)和肺實(shí)質(zhì)的破壞(肺氣腫)[1]。近年來,由于傳染病死亡率的降低和人均壽命的延長(zhǎng),COPD的患病率不斷上升。中國(guó)肺健康研究顯示,根據(jù)肺活量檢測(cè)定義的COPD的總體患病率為8.6%,在20歲以上的成年人中占9 990萬[2]。盡管目前認(rèn)為,吸煙是COPD的主要危險(xiǎn)因素,但COPD的發(fā)病機(jī)制尤其是細(xì)胞和分子機(jī)制,尚不十分明確,因此深入探索COPD的發(fā)病機(jī)制尤為重要。近年來,單細(xì)胞測(cè)序技術(shù)和生物信息學(xué)的發(fā)展為探究COPD發(fā)病的細(xì)胞和分子機(jī)制提供了更多的可能。但由于臨床標(biāo)本來源有限,利用生物信息學(xué)方法對(duì)COPD患者肺組織的基因表達(dá)及其功能的研究較少,且缺乏相關(guān)的免疫細(xì)胞類群分析。因此,本研究旨在通過分析COPD患者肺組織中的差異表達(dá)基因,篩選出與COPD疾病進(jìn)展有關(guān)的Hub基因,并結(jié)合免疫細(xì)胞類群分析,探究其在COPD疾病進(jìn)展中的作用。
1.1 數(shù)據(jù)來源 從美國(guó)國(guó)立生物技術(shù)信息中心(NCBI,https://www.ncbi.nlm.nih.gov/)的GEO(Gene Expression Omnibus)數(shù)據(jù)庫中下載表達(dá)譜芯片GSE106986,芯片數(shù)據(jù)是基于GPL13497平臺(tái)的Agilent-026652 Whole Human Genome Microarray 4x44K v2所獲得的轉(zhuǎn)錄本生物信息。該芯片數(shù)據(jù)分為2組樣本,共19個(gè)肺組織樣本,其中一組為14例COPD患者肺組織樣本(GSM2858891-GSM2858904),另一組為5名正常人肺組織樣本(GSM2858905-GSM2858909)。
1.2 數(shù)據(jù)預(yù)處理和差異表達(dá)分析 使用R的“GEOquery”包下載數(shù)據(jù)后,使用R的“l(fā)imma”包進(jìn)行數(shù)據(jù)預(yù)處理和差異表達(dá)分析:先對(duì)數(shù)據(jù)進(jìn)行歸一化處理,結(jié)合GPL13497平臺(tái)注釋文件的信息,將探針I(yè)D轉(zhuǎn)換成基因名稱,去除沒有對(duì)應(yīng)基因的探針,對(duì)于僅與一個(gè)基因名稱匹配的幾種探針,計(jì)算探針的平均表達(dá)值并將其視為最終基因表達(dá)值,通過t檢驗(yàn)計(jì)算P值,使用Benjamini&Hochberg方法對(duì)P值進(jìn)行校正。通過無監(jiān)督層次聚類分析觀察2組樣本之間是否存在表達(dá)差異,之后篩選差異基因,差異基因的篩選條件為差異倍數(shù)|log2FoldChange|>2且P<0.05,繪制火山圖來展示差異表達(dá)的基因。
1.3 功能富集分析 使用R的“ClusterProfiler”包對(duì)其差異表達(dá)基因分別進(jìn)行基因本體論生物學(xué)功能富集分析和京都基因與基因組大百科全書(Kyoto Encyclopedia for Genes and Genomes,KEGG)信號(hào)通路富集分析?;虮倔w論富集包括生物過程、細(xì)胞學(xué)組分與分子功能3個(gè)類別[3]。KEGG由系統(tǒng)信息、基因組信息、化學(xué)信息與健康信息4類數(shù)據(jù)庫組成,利用KEGG數(shù)據(jù)庫[4]對(duì)差異基因的轉(zhuǎn)錄本進(jìn)行通路分析。P<0.05為有統(tǒng)計(jì)學(xué)意義。
1.4 差異表達(dá)基因所調(diào)控蛋白質(zhì)互作網(wǎng)絡(luò)與Hub基因篩選 STRING(https://string-db.org/)數(shù)據(jù)庫是一個(gè)用來構(gòu)建蛋白互作網(wǎng)絡(luò)的在線工具。將差異表達(dá)的基因?qū)氲絊TRING數(shù)據(jù)庫中,設(shè)置最低相互作用分值為0.4,獲得差異基因之間的相互作用關(guān)系,之后下載數(shù)據(jù),通過Cytoscape及其相應(yīng)的插件進(jìn)行可視化分析并獲得Hub基因。
1.5 免疫細(xì)胞類群分析 使用CIBERSORT數(shù)據(jù)庫,對(duì)經(jīng)歸一化處理的2組樣本的基因表達(dá)進(jìn)行免疫細(xì)胞類群分析,得到了2組樣本之間肺組織中免疫細(xì)胞類群分析的結(jié)果。
2.1 COPD患者和正常人2組樣本的肺組織差異表達(dá)基因篩選 用R的“l(fā)imma”包對(duì)表達(dá)譜數(shù)據(jù)集GSE106986進(jìn)行處理,主成分分析(圖1)和無監(jiān)督層次聚類分析(圖2)結(jié)果表明,2組樣本的基因表達(dá)存在明顯差異。使用差異倍數(shù)|logFC|>2且P<0.05為篩選條件,共找到47個(gè)差異表達(dá)基因(圖3),其中上調(diào)基因有37個(gè),下調(diào)基因有10個(gè),表達(dá)差異前10位的基因見表1。
圖1 2組樣本肺組織中表達(dá)基因的主成分分析結(jié)果
圖2 2組樣本肺組織中表達(dá)基因的無監(jiān)督層次聚類分析結(jié)果
2.2 2組樣本肺組織差異表達(dá)基因的KEGG通路聚類分析結(jié)果 在篩選出差異表達(dá)基因后,對(duì)差異表達(dá)基因進(jìn)行了KEGG通路聚類分析(圖4)。如圖4的KEGG通路聚類分析所示,紅色代表上調(diào)基因的通路聚類結(jié)果,藍(lán)色代表下調(diào)基因的通路聚類結(jié)果,其中上調(diào)的基因主要參與瘧疾、氨基糖和核苷酸的糖代謝、果糖和甘露糖代謝以及補(bǔ)體和級(jí)聯(lián)凝血途徑,下調(diào)的基因主要參與脂肪酸生物合成過程。
圖3 2組樣本肺組織中差異表達(dá)基因的火山圖
表1 2組樣本肺組織的差異表達(dá)基因中下調(diào)與上調(diào)的前五位基因
圖4 2組樣本肺組織中差異表達(dá)基因的KEGG富集分析
2.3 2組樣本肺組織差異表達(dá)基因的基因本體論功能富集分析結(jié)果中的生物過程 基因本體論富集分析圖所示,圖中的顯著性變化以顏色表示,顏色從藍(lán)色到紅色表示差異越來越顯著,參與基因數(shù)目以圓形面積的大小表示,參與調(diào)控某一通路和功能的基因數(shù)目越多,圓形的面積越大?;虮倔w論富集包括生物過程、細(xì)胞學(xué)組分與分子功能3個(gè)類別(圖5~7)。結(jié)果表明,差異表達(dá)基因在生物過程中主要參與對(duì)細(xì)菌的防御反應(yīng)、細(xì)胞外基質(zhì)和結(jié)構(gòu)的形成、創(chuàng)傷反應(yīng)的調(diào)節(jié)和負(fù)性調(diào)節(jié)凝血過程等。見圖5。
圖5 2組樣本肺組織差異表達(dá)基因的基因本體論富集分析結(jié)果中的生物過程
2.4 2組樣本肺組織差異表達(dá)基因的基因本體論功能富集分析結(jié)果中的細(xì)胞學(xué)組分 在細(xì)胞學(xué)組分方面,差異表達(dá)基因主要參與內(nèi)質(zhì)網(wǎng)腔、血小板α顆粒和血小板α顆粒腔等。見圖6。
圖6 2組樣本肺組織差異表達(dá)基因的基因本體論富集分析結(jié)果中的細(xì)胞學(xué)組分
2.5 2組樣本肺組織差異表達(dá)基因的基因本體論功能富集分析結(jié)果中的分子功能 在分子功能方面,差異表達(dá)基因主要涉及與糖胺聚糖結(jié)合、肝素結(jié)合和雙加氧酶活性。見圖7。
圖7 2組樣本肺組織差異表達(dá)基因的基因本體論富集分析結(jié)果中的分子功能
2.6 2組樣本肺組織差異表達(dá)基因的蛋白質(zhì)互作網(wǎng)絡(luò)分析 為了獲得差異表達(dá)基因的蛋白質(zhì)互作調(diào)控網(wǎng)絡(luò),通過STRING數(shù)據(jù)庫分析了差異表達(dá)基因的蛋白互作網(wǎng)絡(luò),然后將互作數(shù)據(jù)在Cytoscape軟件中進(jìn)行可視化。結(jié)果顯示,差異表達(dá)基因的蛋白質(zhì)互作網(wǎng)絡(luò)包含21個(gè)節(jié)點(diǎn),紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因。靶點(diǎn)的度值表示相互作用的靶點(diǎn)個(gè)數(shù),靶點(diǎn)度值較大的靶點(diǎn)在蛋白質(zhì)互作網(wǎng)絡(luò)中發(fā)揮了關(guān)鍵作用,節(jié)點(diǎn)的大小與靶點(diǎn)度值呈正比。見圖8。
2.7 2組樣本肺組織差異表達(dá)基因中Hub基因的篩選 在得出蛋白質(zhì)互作網(wǎng)絡(luò)結(jié)果后,又進(jìn)行了Hub基因的篩選。以靶點(diǎn)度值≥5作為篩選標(biāo)準(zhǔn),共篩選出5個(gè)Hub基因:FGG、FGA、IL-6、SERPINE1和SPP1。見圖9。
2.8 2組樣本肺組織的免疫細(xì)胞類群分析 將下載的數(shù)據(jù)進(jìn)行歸一化處理后,使用CIBERSORT數(shù)據(jù)庫對(duì)2組樣本的肺組織基因表達(dá)情況進(jìn)行免疫細(xì)胞類群分析。結(jié)果示,與正常人的肺組織相比,COPD患者肺組織中適應(yīng)性免疫細(xì)胞如記憶B細(xì)胞、漿細(xì)胞、CD8+T細(xì)胞、靜息CD4+記憶T細(xì)胞、濾泡輔助性T細(xì)胞、調(diào)節(jié)性T細(xì)胞以及固有免疫細(xì)胞如單核細(xì)胞、M1型巨噬細(xì)胞、M2型巨噬細(xì)胞、靜息樹突狀細(xì)胞、活化的樹突狀細(xì)胞、活化的肥大細(xì)胞和嗜酸粒細(xì)胞都有顯著增加。見圖10。
COPD是一種病因不明的、以慢性氣道炎癥為主要病理改變、以不可逆性氣流受限為主要特征的慢性炎癥性疾病。雖然吸煙是COPD的主要危險(xiǎn)因素,但全球范圍內(nèi)仍有1/3的COPD患者沒有吸煙史[1]。且研究表明,空氣污染、生活燃料的燃燒、營(yíng)養(yǎng)不良和住房潮濕等也會(huì)導(dǎo)致COPD的發(fā)生[5-6]。因此,探索COPD的發(fā)病機(jī)制尤為重要。近年來,隨著RNA測(cè)序技術(shù)和生物信息分析的發(fā)展,應(yīng)用高通量測(cè)序和生物信息學(xué)方法為我們從細(xì)胞和分子水平揭示COPD的機(jī)制及其治療靶點(diǎn)提供了可能。
本研究通過GEO數(shù)據(jù)庫和差異表達(dá)基因所調(diào)控蛋白質(zhì)互作網(wǎng)絡(luò),共篩選出5個(gè)Hub基因:FGG、FGA、IL-6、SERPINE1和SPP1。這些基因在COPD患者的肺組織中都上調(diào),其中FGG上調(diào)4倍以上。FGG是纖維蛋白原γ鏈,屬于纖維蛋白原家族成員,是系統(tǒng)性炎癥的標(biāo)志物。以往有研究表明,外周血中FGG含量的增高與COPD患者疾病的嚴(yán)重程度及急性加重[7]、肺功能降低和COPD的發(fā)生風(fēng)險(xiǎn)增加有關(guān)[8-9]。但COPD患者增高FGG的來源及其在COPD發(fā)生、發(fā)展中的具體作用還有待進(jìn)一步研究。FGA同屬于纖維蛋白家族,是纖維蛋白原α鏈,目前尚未有研究報(bào)道FGA與COPD之間的關(guān)系。IL-6是一種促炎細(xì)胞因子,有研究表明,COPD患者外周血和痰液中IL-6的水平顯著升高且與肺功能呈負(fù)相關(guān)[10-12],IL-6基因的變異與COPD相關(guān)[13]。穩(wěn)定期COPD患者血清中IL-6的增高與急性加重密切相關(guān)[14]。有研究表明,吸煙與PAI-1水平升高有關(guān)[15],且與對(duì)照組相比,COPD患者痰中的SERPINE1增多[16]。但SERPINE1在COPD病理學(xué)中的作用以及靶向纖溶酶原激活物對(duì)減輕炎癥的療效目前尚不清楚。
圖8 2組樣本肺組織中差異表達(dá)基因的蛋白質(zhì)互作網(wǎng)絡(luò)結(jié)果
圖9 2組樣本肺組織的差異表達(dá)基因中Hub基因的篩選
SPP1蛋白是由多種細(xì)胞(如巨噬細(xì)胞、自然殺傷細(xì)胞和上皮細(xì)胞等)分泌的一種糖磷酸蛋白[17-18]。研究發(fā)現(xiàn),SPP1與多種疾病包括惡性腫瘤[19]、自身免疫性疾病和肺纖維化等的發(fā)病機(jī)制及不良預(yù)后有關(guān)[20-21]。已有證據(jù)表明,單核細(xì)胞衍生的SPP1能上調(diào)IL-12和IL-6的表達(dá),下調(diào)IL-10的表達(dá),并能作為巨噬細(xì)胞和中性粒細(xì)胞的趨化因子[22]。有研究發(fā)現(xiàn),吸煙者肺泡巨噬細(xì)胞SPP1的表達(dá)升高與氣道阻塞程度相關(guān)[23],提示COPD患者肺中SPP1的升高在肺氣腫的發(fā)展過程中發(fā)揮一定的作用[24]。已知SPP1與PI3K-Akt信號(hào)通路[25-26]、巨噬細(xì)胞和樹突狀細(xì)胞的Toll樣受體信號(hào)通路的活化[27-29]密切相關(guān),而這兩條通路活化所介導(dǎo)的慢性炎癥與COPD的發(fā)生、發(fā)展也密切相關(guān)[30-31]。本研究對(duì)2組樣本的肺組織進(jìn)行免疫細(xì)胞類群分析后發(fā)現(xiàn),COPD患者肺組織中增加的固有和適應(yīng)性免疫細(xì)胞主要為活化的T、B細(xì)胞、單核細(xì)胞、活化的巨噬細(xì)胞、樹突狀細(xì)胞、活化的肥大細(xì)胞和嗜酸粒細(xì)胞。這些免疫細(xì)胞都可能在COPD的發(fā)生、發(fā)展中發(fā)揮作用。有研究表明,活化的樹突狀細(xì)胞參與COPD的發(fā)病機(jī)制[32],且不同表型的巨噬細(xì)胞在COPD中也發(fā)揮重要作用[33]。有研究表明,SPP1能作為巨噬細(xì)胞的趨化因子存在,且能上調(diào)炎性細(xì)胞因子IL-6的表達(dá)[22]。此外,我們通過在Human Protein Atlas數(shù)據(jù)庫搜索發(fā)現(xiàn),肺組織中的SPP1主要來源為巨噬細(xì)胞。因此我們認(rèn)為,COPD患者肺組織中增多的SPP1可能來源于巨噬細(xì)胞,且它們可能通過作用于樹突狀細(xì)胞、單核細(xì)胞或巨噬細(xì)胞來參與COPD的發(fā)生、發(fā)展。因此,接下來我們將收集臨床標(biāo)本,進(jìn)一步研究SPP1在COPD中的作用。目前尚不清楚肥大細(xì)胞和嗜酸粒細(xì)胞在COPD中的作用,但已有證據(jù)表明,COPD患者肺組織中肥大細(xì)胞的數(shù)量增加[34-35],且隨疾病嚴(yán)重程度的不同,細(xì)胞的密度和表型不同[36]。此外,有研究表明,肺組織中嗜酸粒細(xì)胞增多已成為COPD的臨床表型之一[37-39],且可能與COPD急性加重有關(guān)[40]。本研究中所發(fā)現(xiàn)的肥大細(xì)胞和嗜酸粒細(xì)胞增高是否具有共性尚待進(jìn)一步研究。
圖10 2組樣本肺組織的免疫細(xì)胞類群分析
Hub基因是蛋白互作網(wǎng)絡(luò)中的核心基因,在疾病的發(fā)生、發(fā)展過程中可能發(fā)揮重要作用。因此,針對(duì)Hub基因的研究可能為COPD發(fā)病機(jī)制的研究提供新的方向。由于缺少在臨床樣本上的驗(yàn)證,本研究也存在一定的不足,之后我們將收集相關(guān)的臨床樣本,進(jìn)一步探討Hub基因SPP1在COPD中的作用和具體的機(jī)制。
綜上所述,COPD患者肺組織中增多的SPP1可能來源于巨噬細(xì)胞,且很可能通過作用于樹突狀細(xì)胞、單核細(xì)胞或巨噬細(xì)胞來參與COPD的發(fā)生、發(fā)展。這為進(jìn)一步在細(xì)胞和分子水平研究COPD發(fā)生、發(fā)展的相關(guān)機(jī)制提供了指導(dǎo),也為探索新的COPD治療靶點(diǎn)提供了依據(jù)。
利益沖突 所有作者均聲明不存在利益沖突