王士寧 程書(shū)平 楊麗潔 俞媛潔 吳鵬波 李 明 譚詩(shī)云
非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)最新命名為代謝相關(guān)脂肪性肝病(metabolic associated fatty liver disease,MAFLD),已成為全球范圍內(nèi)最常見(jiàn)的慢性肝病和健康體檢發(fā)現(xiàn)肝功能異常的首要原因[1,2]。NAFLD是一種與遺傳易感性和胰島素抵抗(insulin resistance,IR)密切相關(guān),非過(guò)量飲酒得獲得性代謝應(yīng)激性肝損傷。其病理學(xué)改變以彌漫性肝細(xì)胞大泡性脂肪變?yōu)橹?NAFLD疾病譜包括非酒精性脂肪肝(non-alcoholic fatty liver,NAFL)也稱(chēng)為單純性脂肪肝、非酒精性脂肪性肝炎(non-alcoholic steatohepatitis,NASH)及其相關(guān)肝硬化,甚至可能發(fā)展成肝細(xì)胞癌[3,4]。隨著NAFLD的患病率逐漸升高,連同伴發(fā)心腦血管疾病導(dǎo)致患者死亡風(fēng)險(xiǎn)增加[5]。目前尚無(wú)特異性的非侵入性診斷和預(yù)后生物學(xué)標(biāo)志物及根治手段。因此,有必要深入研究并明確NAFLD的發(fā)病機(jī)制,研發(fā)有效的預(yù)防和治療方法。本研究采用生物信息學(xué)方法對(duì)GEO數(shù)據(jù)庫(kù)下載的NAFLD相關(guān)兩個(gè)數(shù)據(jù)集GSE48452和GSE63067進(jìn)行挖掘和分析,篩選出共同的差異性表達(dá)關(guān)鍵基因,以期為進(jìn)一步探討NAFLD的發(fā)病機(jī)制和治療靶點(diǎn)提供理論依據(jù)。
1.數(shù)據(jù)來(lái)源:從GEO數(shù)據(jù)庫(kù)下載與NAFLD相關(guān)的表達(dá)矩陣。篩選標(biāo)準(zhǔn):①具有正常對(duì)照和NAFLD的樣本量;②樣本量總個(gè)數(shù)≥10。最終選取GSE48452和GSE63067用于本研究。GSE48452包含12個(gè)健康對(duì)照,12個(gè)NASH樣本量,GSE63067包含7個(gè)健康對(duì)照,7個(gè)NASH樣本量。
2.差異基因篩選與可視化:兩組原始數(shù)據(jù)集采用GEO2R在線(xiàn)分析工具分別對(duì)GSE48452、GSE63067數(shù)據(jù)集樣本進(jìn)行分組并分析差異表達(dá)基因,以|log2FC|(差異倍數(shù)fold change)>0.5,P<0.05,鑒定健康對(duì)照樣本和NASH樣本差異顯著的基因。并使用R包ggplot2和 ggrepel繪制火山圖,用Venn y2.1.0對(duì)上述2個(gè)數(shù)據(jù)集的差異基因繪制Venn圖取交集。
3.差異基因功能分析:使用DAVID在線(xiàn)分析對(duì)篩選出來(lái)的25個(gè)差異基因進(jìn)行GO富集分析,包括生物學(xué)過(guò)程(biological process,BP)、細(xì)胞組分和定位(cellular component,CC)以及分子功能(molecular function,MF),同時(shí)進(jìn)行KEGG信號(hào)通路分析,設(shè)置P<0.05。
4.蛋白質(zhì)互作網(wǎng)絡(luò)分析:使用String 11.5數(shù)據(jù)庫(kù)預(yù)測(cè)NAFLD差異基因編碼蛋白間的蛋白質(zhì)互相作用(protein-protein interaction,PPI)網(wǎng)絡(luò)圖。采用Cytoscape3.8.0進(jìn)一步進(jìn)行可視化展示。利用Cytoscape插件MCODE獲得有顯著相互作用的功能模塊,設(shè)置參數(shù)degree cutoff=2、node cutoff=0.2、k-score=2及max.depth=100。利用插件cytoHubba的MCC算法篩選得分最高的前8個(gè)基因作用關(guān)鍵基因。
1.差異表達(dá)基因篩選結(jié)果:經(jīng)GEO2R分析及R 4.1.0軟件分別篩選出差異表達(dá)上下調(diào)基因,分別從數(shù)據(jù)集GSE48452和GSE63067中提取到差異基因331個(gè)和791個(gè),繪制火山圖(圖1),其中藍(lán)色為下調(diào)基因、紅色為上調(diào)基因,分別繪制GSE48452和GSE63067的熱圖(圖2)。取2個(gè)數(shù)據(jù)集差異表達(dá)基因的交集,制作Venn圖(圖3),得到相同差異基因25個(gè),其中上調(diào)基因7個(gè),下調(diào)基因18個(gè)。
圖1 差異基因火山圖A.GSE48452差異基因火山圖;B.GSE63067差異基因火山圖
圖2 差異基因熱圖A.GSE63067差異基因的熱圖;B.GSE48452差異基因的熱圖
圖3 GSE48452和GSE63067相同差異基因的Venn圖A.上調(diào)基因;B.下調(diào)基因
2.差異基因GO分析和KEGG分析:GO富集分析結(jié)果顯示這些差異基因主要參與對(duì)ERK1和ERK2級(jí)聯(lián)的正向調(diào)節(jié)反應(yīng)、抗菌肽介導(dǎo)的抗菌體液免疫反應(yīng)、趨化作用、對(duì)T淋巴細(xì)胞遷移的正向調(diào)節(jié)、凋亡過(guò)程的負(fù)向調(diào)節(jié),并且參與炎性反應(yīng)、G-蛋白偶聯(lián)受體信號(hào)轉(zhuǎn)導(dǎo)途徑、對(duì)Ras蛋白信號(hào)轉(zhuǎn)導(dǎo)的積極調(diào)節(jié)等生物過(guò)程;主要細(xì)胞成分位于細(xì)胞外空間、細(xì)胞外區(qū)域;主要分子功能與受體結(jié)合及CCR6趨化因子受體結(jié)合等相關(guān)(表1)。KEGG信號(hào)通路分析顯示,DEGs富集于IL-17信號(hào)轉(zhuǎn)導(dǎo)途徑、前列腺癌、炎性介質(zhì)對(duì)TRP通道的調(diào)節(jié)、TNF信號(hào)轉(zhuǎn)導(dǎo)途徑及癌癥中的轉(zhuǎn)錄錯(cuò)誤調(diào)控等通路(表2)。
表1 NAFLD差異基因的GO富集分析
表2 NAFLD差異基因的KEGG信號(hào)通路分析
3.蛋白質(zhì)互作網(wǎng)絡(luò)分析:除去游離的蛋白節(jié)點(diǎn),共有14個(gè)蛋白質(zhì)節(jié)點(diǎn)連接形成17條復(fù)雜的PPI網(wǎng)絡(luò)。最顯著模塊由10個(gè)重要節(jié)點(diǎn)及12條邊的網(wǎng)絡(luò)構(gòu)成。利用cytoHubba的MCC算法篩選出8個(gè)關(guān)鍵基因,即MMP9、IGF1、CHI3L1、CXCL10、CDKN1A、CCL20、IGFBP2、NRG1(表3、圖4)。
圖4 NASH發(fā)展中構(gòu)建DEG的PPI網(wǎng)絡(luò)A.非酒精性脂肪性肝炎的DEG的PPI網(wǎng)絡(luò);B.中心基因的可視化
表3 關(guān)鍵基因
NAFLD全球患病率約為25%,現(xiàn)已成為全世界范圍內(nèi)慢性肝病的常見(jiàn)病因[5,6]。肝組織活檢是診斷NASH和確定預(yù)后的唯一可依賴(lài)的方法,但因其有創(chuàng)性并穿刺組織局限及可能出現(xiàn)并發(fā)癥,其價(jià)格昂貴,不易在臨床上廣泛開(kāi)展。近年來(lái),隨著生物信息學(xué)技術(shù)的快速發(fā)展,其在許多疾病的研究中發(fā)揮著重要作用。
本研究GO分析發(fā)現(xiàn),差異基因主要參與細(xì)胞對(duì)ERK1和ERK2級(jí)聯(lián)的正向調(diào)節(jié)反應(yīng)、抗菌肽介導(dǎo)的抗菌體液免疫反應(yīng)、細(xì)胞的趨化作用、對(duì)T淋巴細(xì)胞遷移的正向調(diào)節(jié)、凋亡過(guò)程的負(fù)向調(diào)節(jié),并且參與炎性反應(yīng)、G-蛋白偶聯(lián)受體信號(hào)轉(zhuǎn)導(dǎo)途徑、對(duì)Ras蛋白信號(hào)轉(zhuǎn)導(dǎo)的積極調(diào)節(jié)等生物過(guò)程;富集于細(xì)胞外空間、細(xì)胞外區(qū)域;主要分子功能與受體結(jié)合及CCR6趨化因子受體結(jié)合等相關(guān)(表1)。KEGG信號(hào)通路分析提示,差異基因主要參與IL-17信號(hào)轉(zhuǎn)導(dǎo)途徑、前列腺癌、炎性介質(zhì)對(duì)TRP通道的調(diào)節(jié)、TNF信號(hào)轉(zhuǎn)導(dǎo)途徑及癌癥中的轉(zhuǎn)錄錯(cuò)誤調(diào)控等通路。
經(jīng)Cytoscape軟件篩選出8個(gè)關(guān)鍵基因,分別是MMP9、IGF1、CHI3L1、CXCL10、CDKN1A、CCL20、IGFBP2和NRG1。MMP9是鋅依賴(lài)性中性蛋白酶家族的一員,可降解細(xì)胞外基質(zhì)和基膜,并與肝衰竭中的竇道損傷、肝臟重塑和壞死有關(guān)聯(lián)。相關(guān)研究證明,MMP9隨著纖維化程度的加深而減少[7]。與另一項(xiàng)研究證明一致,該研究顯示,晚期纖維化的丙型肝炎患者中MMP9的濃度降低[8]。本研究發(fā)現(xiàn),MMP9在NASH中明顯下調(diào),與上訴結(jié)果中文獻(xiàn)一致。因此,在NAFLD的發(fā)展中,這種蛋白酶在纖維化中參與了類(lèi)似的病理生理過(guò)程。此外,肝臟是胰島素介導(dǎo)的調(diào)節(jié)代謝的一個(gè)關(guān)鍵器官。它不僅具有糖代謝和脂肪代謝的作用,也是血漿蛋白和內(nèi)分泌因子(IGF1)及其結(jié)合蛋白(insulin-like growth factor binding protein,IGFBP)的主要合成場(chǎng)所,從而影響全身的代謝和生長(zhǎng)。IGF1是一種在分子結(jié)構(gòu)上與胰島素類(lèi)似得多肽蛋白物質(zhì)。有關(guān)研究發(fā)現(xiàn),IGF1系統(tǒng)可能在NAFLD/NASH的發(fā)病機(jī)制中的潛在作用[9~11]。因此,IGF1可能是一個(gè)潛在的治療靶點(diǎn)。CHI3L1,又稱(chēng)YKL-40是幾丁質(zhì)酶家族的成員,但缺乏幾丁質(zhì)酶活性。
CHI3L1在炎癥、組織重塑和癌癥中發(fā)揮重要作用。它在炎癥性肝病(NAFLD/NASH)中的作用還沒(méi)有確定。有關(guān)研究證明,巨噬細(xì)胞衍生的YKL-40是NAFLD患者肝臟纖維化的一個(gè)可行的生物學(xué)標(biāo)志物[12]。另有研究得出結(jié)論,CHI3L1通過(guò)抑制肝臟巨噬細(xì)胞的凋亡加劇了肝臟纖維化的進(jìn)展[13]。該途徑可能是一個(gè)有希望的治療靶點(diǎn)。CXCL10又稱(chēng)為干擾素誘導(dǎo)蛋白,是一種具有炎癥特征的趨化因子。有關(guān)研究證明,CXCL10基因缺失在飲食誘發(fā)的NASH小鼠模型中的保護(hù)作用。另有研究證實(shí),香葉木素通過(guò)STAT1/CXCL10的方式改調(diào)節(jié)脂肪生成和炎性反應(yīng)來(lái)改善NASH[14]??赡転镹ASH的治療提供一個(gè)有希望的候選者。
CDKN1A是衰老過(guò)程中的一個(gè)關(guān)鍵基因,也被稱(chēng)為細(xì)胞衰老的生物學(xué)標(biāo)志物,它可以通過(guò)減少Rb的磷酸化來(lái)促進(jìn)衰老相關(guān)分泌表型的產(chǎn)生。有關(guān)研究表明,CDKN1A是治療NASH的關(guān)鍵靶基因,但仍需大量實(shí)驗(yàn)研究進(jìn)一步驗(yàn)證[15]。CCL20也被稱(chēng)為巨噬細(xì)胞炎癥蛋白。相關(guān)研究發(fā)現(xiàn),肝星狀細(xì)胞是產(chǎn)生CCL20的主要細(xì)胞類(lèi)型,誘導(dǎo)出一種促纖維化和促炎癥的表達(dá)特征。CCL20代表了一個(gè)新的候選分子,可能參與了研究人群中NAFLD纖維化的發(fā)病機(jī)制。作為一種可溶性的炎性介質(zhì),CCL20也可能代表一種潛在的診斷和(或)治療靶點(diǎn)。仍需大量相關(guān)研究證實(shí)。IGFBP2是一種36kDa的蛋白質(zhì),屬于IGF1和IGF2結(jié)合的6個(gè)類(lèi)似蛋白質(zhì)之一。近年來(lái)有研究表明,循環(huán)IGFBP-2水平與NAFLD的發(fā)生率呈負(fù)相關(guān)[16]。另有研究發(fā)現(xiàn),IGFBP-2可能作為NAFLD進(jìn)展的生物學(xué)標(biāo)志物。神經(jīng)膠質(zhì)蛋白(NRG)是一組與表皮生長(zhǎng)因子(EGF)家族有關(guān)的蛋白。其作為配體激活酪氨酸激酶受體。近年來(lái)有研究證明,NRG1通過(guò)PI3K/Akt途徑與ErbB3相互作用,在NAFLD的發(fā)病機(jī)制中發(fā)揮保護(hù)作用[17]。NRG1可能成為NAFLD新的治療靶點(diǎn),仍需大量實(shí)驗(yàn)研究驗(yàn)證。
本研究的不足之處在于未能通過(guò)實(shí)驗(yàn)進(jìn)一步驗(yàn)證這些關(guān)鍵DEGs在NAFLD發(fā)生、發(fā)展過(guò)程中的表達(dá)變化及具體作用。因此未來(lái)筆者將通過(guò)后續(xù)的實(shí)驗(yàn)研究來(lái)驗(yàn)證這些關(guān)鍵DEGs的功能。
綜上所述,本研究通過(guò)生物信息學(xué)分析了NAFLD樣本差異基因,構(gòu)建PPI網(wǎng)絡(luò)病獲得8個(gè)Hub基因,其作為NAFLD進(jìn)展的潛在關(guān)鍵調(diào)節(jié)因素。該結(jié)果提供了NAFLD進(jìn)展過(guò)程中潛在的關(guān)鍵基因和臨床標(biāo)志物。