王晨峰,盧旭華
海軍軍醫(yī)大學長征醫(yī)院骨科,上海 200003
椎間盤退行性變(IDD)是指在多種病因作用下導致椎間盤生物力學和組織結構改變、髓核水分減少、纖維環(huán)破裂、壓迫脊髓和神經(jīng)根進而引起腰腿痛的疾病,近年來逐漸趨于年輕化[1-2]。IDD是脊柱外科的研究重點之一,但是其病因和發(fā)生機制尚不明確。有研究[3-7]報道,IDD主要與炎性反應、細胞衰老和細胞外基質(zhì)成分改變等有關。因此,深入探索IDD的發(fā)生機制、尋找其早期診斷標志物和治療靶點具有重要意義。近年來,隨著生物信息學技術的發(fā)展和普及,許多疾病相關的基因組測序成為研究熱點。本研究通過基因表達匯編(GEO)數(shù)據(jù)庫中IDD相關基因芯片數(shù)據(jù),分析篩選獲取差異表達基因(DEG),并對DEG進行功能富集和蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡分析,以挖掘IDD疾病的新型標志物,為IDD的早期診治提供新的思路。
從GEO中搜索脊柱IDD相關的芯片數(shù)據(jù)。下載GSE124272[8]和 GSE150408[9]數(shù)據(jù)集中的芯片數(shù)據(jù),平臺文件均為 GPL21185(Agilent-072363 SurePrint G3 Human GE v3 8x60K Microarray 039494)。GSE124272中包含健康志愿者和IDD患者外周全血樣本各8例,GSE150408中包含健康志愿者和IDD患者外周全血樣本各17例。下載GSE23130[10]數(shù)據(jù)集中的芯片數(shù)據(jù)作為驗證集,平臺文件為GPL1352[(U133_X3P)Affymetrix Human X3P Array],依 據(jù)Thompson退行性變等級[11]分類將23例總樣本分為正常纖維環(huán)樣本15例和IDD纖維環(huán)樣本8例。
將GSE124272和GSE150408芯片數(shù)據(jù)整合,并通過平臺文件中的基因名稱對芯片數(shù)據(jù)進行注釋。使用R 4.0軟件sva數(shù)據(jù)分析包對2個芯片數(shù)據(jù)進行校正,去除批次效應,達到聯(lián)合分析的目的。
通過R 4.0軟件limma數(shù)據(jù)分析包比較正常人和IDD患者外周血中的基因表達改變。DEG的篩選標準均設定為校正后P< 0.05 和 | log2 差異倍數(shù) |≥0.585,繪制火山圖。然后依據(jù)DEG在不同樣本中的表達情況進行聚類分析,觀察基因間和樣本間的分布關系。
基因本體(GO)是用于基因注釋和分析基因生物學過程的主要生物信息學工具,京都基因與基因組百科全書(KEGG)是用于了解高級功能和生物系統(tǒng)的大規(guī)模分子數(shù)據(jù)庫。使用在線數(shù)據(jù)庫DAVID(https://david.ncifcrf.gov/)對DEG進行GO和KEGG通路分析,設定P< 0.05為有統(tǒng)計學意義。
將DEG導入STRING(http://string-db.org/)在線分析網(wǎng)站,按照組合得分> 0.9的標準并隱藏未參與構建PPI網(wǎng)絡的蛋白,將輸出結果導入Cytoscape 3.7.1軟件進行可視化。利用Cytoscape 3.7.1軟件的MCODE插件篩選PPI網(wǎng)絡中最為顯著的蛋白模塊獲取關鍵基因,并觀察其在驗證數(shù)據(jù)集中的表達情況。
利用GSE124272、GSE150408數(shù)據(jù)集中的數(shù)據(jù),通過計算受試者工作特征(ROC)曲線評估關鍵基因在IDD中表達的診斷價值,曲線下面積即代表基因的診斷效能。
通過將GSE124272和GSE150408芯片數(shù)據(jù)聯(lián)合分析后,共篩選出DEG 597個,包含上調(diào)基因363個和下調(diào)基因234個(圖1)。聚類分析將表達量相近的基因聚集,結果顯示4組樣本質(zhì)量合格,并且無批次效應的影響。GSE23130數(shù)據(jù)集經(jīng)分析后,共篩選出DEG 1 017個。
圖1 DEG篩選Fig.1 Screening of DEG
GO功能分析分為生物過程、細胞組分和分子功能3個部分,分析結果顯示,DEG參與的生物過程主要為細胞黏附、生物黏附和細胞間黏附等,細胞組分主要為褶皺膜、細胞間連接和核質(zhì)等,而分子功能則以多聚RNA結合、蛋白酶體結合和蛋白復合物結合等為主(圖2a),提示DEG主要參與細胞黏附、細胞凋亡、趨化作用和細胞遷移等功能。KEGG信號通路分析結果顯示,DEG主要參與細胞外基質(zhì)受體相互作用和癌癥中的信號通路(圖2b)。
圖2 DEG的GO和KEGG分析Fig.2 GO and KEGG analysis of DEG
由圖3可見,PPI網(wǎng)絡共有171個節(jié)點(蛋白)和313條邊(蛋白之間的相互聯(lián)系)。利用MCODE插件進行蛋白模塊分析,獲得最為顯著的2個模塊和17個關鍵基因,模塊1由9個節(jié)點(LSM2、POLR2F、RBMX、POLR2C、HNRNPD、SUGP1、SRRT、SRSF7和PPIL4)和36條邊組成(圖4a),模塊2由8個節(jié)點(RPS3A、RPL15、SSR1、RPL23A、RPS29、EEF1A1、SMG1和RPL22)和25條邊構成(圖4b)。經(jīng)過GSE23130數(shù)據(jù)集驗證發(fā)現(xiàn),RBMX、EEF1A1、SSR1和POLR2C在外周血和椎間盤組織樣本中均為DEG(圖4c)。
圖3 PPI網(wǎng)絡分析Fig.3 PPI network analysis
圖4 模塊1、2的PPI網(wǎng)絡分析及關鍵基因驗證Fig.4 PPI network analysis and hub gene verification of modules 1,2
ROC曲線分析結果顯示,外周血中RBMX、EEF1A1、SSR1和POLR2C對IDD診斷均具有一定價值,曲線下面積分別為0.763、0.741、0.710、0.702(圖5a~d),4個基因構建的聯(lián)合診斷模型診斷價值進一步提高(曲線下面積為0.795,圖5e),提示這4個基因可作為IDD診斷的血液學標志物。
圖5 關鍵基因的診斷能力Fig.5 Diagnostic efficacy of hub genes
IDD是臨床常見病和多發(fā)病,嚴重影響患者生活質(zhì)量。因此,通過生物信息學技術探索IDD的發(fā)生機制,挖掘疾病相關的生物標志物,對IDD的早期診治具有重要意義。本研究結果表明,DEG主要參與細胞黏附、細胞凋亡、趨化作用和細胞遷移等功能。有研究[12]表明,在細胞和動物實驗中通過抑制凋亡表型,可防止椎間盤過早發(fā)生退行性變,使其繼續(xù)維持正常的生理功能,這或?qū)⒊蔀镮DD的治療方向之一。本研究的KEGG信號通路富集分析結果顯示,DEG主要富集于細胞外基質(zhì)受體相互作用和癌癥中的信號通路。并在分析過程中引入包含椎間盤組織樣本的GSE23130數(shù)據(jù)集來進一步佐證結果的科學性和準確性,篩選出RBMX、EEF1A1、SSR1和POLR2C 4個關鍵基因,通過PPI網(wǎng)絡分析和ROC曲線分析進一步明確了這4個關鍵基因可作為IDD的診斷標志物。
RBMX基因是著絲粒非編碼RNP復合體的一個組成部分,其表達與Caspase3相關,并參與損傷后神經(jīng)節(jié)細胞的凋亡過程[13]。EEF1A1負責將氨基酰tRNA酶解到核糖體,有研究[14-15]發(fā)現(xiàn),EEF1A1可有效保護帕金森疾病引起的腦神經(jīng)退行性變和死亡,與EEF1A2亞型共同參與神經(jīng)退行性變性的進展。SSR1是一種糖基化內(nèi)質(zhì)網(wǎng)膜受體,與通過內(nèi)質(zhì)網(wǎng)膜的蛋白易位有關,可作為多種癌癥的預后指標[16]。POLR2C編碼RNA聚合酶Ⅱ的第三大亞基;Zhu等[17]的研究發(fā)現(xiàn),POLR2C為腰椎IDD的關鍵基因,可作為IDD治療的重要靶點。上述研究結果進一步支持了本研究結果的可信度。
全血組織樣本獲取途徑極為便捷,篩選血液學診斷標志物可為疾病的早期診治提供方向。Kyritsis等[18]分析脊髓損傷患者急性期外周血整體基因表達,鑒別急性脊髓損傷后全血細胞中自然殺傷細胞和巨噬細胞等的變化,后構建損傷程度預測模型,依據(jù)預測效力篩選出對脊髓損傷嚴重程度具有診斷和預后價值的生物標志物。Grad等[19]首次發(fā)現(xiàn)血漿中CCL5和CXCL6的升高與IDD程度密切相關,并推測這些趨化因子可能是診斷和監(jiān)測IDD的血液學生物標志物。Qi等[20]證實,血清CTX-Ⅱ和COMP是診斷IDD的可靠指標,其濃度與IDD的發(fā)生過程呈正相關。本研究通過生物信息學分析方法篩選出IDD患者外周血診斷標志物RBMX、EEF1A1、SSR1和POLR2C,四者聯(lián)合應用可提高對IDD的診斷效力。通過生物信息學方法篩選診斷標志物對IDD的早期診治具有重大臨床意義,也為后期實驗提供了新的研究策略。
綜上所述,通過生物信息學技術聯(lián)合分析基因表達匯編數(shù)據(jù)芯片,探索IDD的診斷標志物,為進一步闡明IDD的發(fā)生機制及早期臨床診治提供理論參考,并為IDD靶向治療藥物的研發(fā)提供方向。