萬中元,宋芳,任大江,單建林,趙廣民,李放
(1.北京軍區(qū)總醫(yī)院骨科,北京 100700;2.第二炮兵總醫(yī)院口腔科,北京 100088)
椎間盤退變相關(guān)的基因芯片表達(dá)譜數(shù)據(jù)研究
萬中元1,宋芳2,任大江1,單建林1,趙廣民1,李放1
(1.北京軍區(qū)總醫(yī)院骨科,北京 100700;2.第二炮兵總醫(yī)院口腔科,北京 100088)
目的 通過對已公開基因芯片表達(dá)譜數(shù)據(jù)進(jìn)行研究,探究正常及退變椎間盤組織間的基因表達(dá)差異,并對差異表達(dá)基因所涉及的生物學(xué)過程進(jìn)行預(yù)測分析。方法經(jīng)GEO數(shù)據(jù)庫選取與椎間盤退變相關(guān)的基因芯片表達(dá)譜數(shù)據(jù)GSE23130,對GSE23130包含的樣本數(shù)據(jù)進(jìn)行質(zhì)量分析,選取GSM569833等10例樣本數(shù)據(jù)納入實(shí)驗(yàn)。采用GeneSpring 13.0軟件對正常及退變樣本間差異表達(dá)基因進(jìn)行篩選,針對差異表達(dá)基因構(gòu)建聚類分析樹及熱圖,并采用GO分析、KEGG PATHWAY分析及DAVID功能注釋簇集分析等方法對差異表達(dá)基因進(jìn)行生物信息學(xué)分析。結(jié)果篩選出差異表達(dá)基因3 182個,其中1 735個基因在退變椎間盤內(nèi)表達(dá)上調(diào),1 447個表達(dá)下調(diào)。針對差異表達(dá)基因進(jìn)行的生物信息學(xué)分析發(fā)現(xiàn)了VEGF信號通路、激活T細(xì)胞的核因子等數(shù)個存在研究價值的生物學(xué)過程。結(jié)論本研究結(jié)果顯示椎間盤退變過程中存在大量基因的異常表達(dá),這些差異表達(dá)基因相關(guān)的生物學(xué)過程也出現(xiàn)明顯異常,某些生物學(xué)過程的異常改變可能在椎間盤退變過程中扮演了重要角色。
椎間盤退變;纖維環(huán);基因芯片;生物信息學(xué)
頸椎病、腰椎間盤突出癥等脊柱退行性疾病是影響中老年人生活質(zhì)量的重要疾病,這些疾病不僅會帶來嚴(yán)重的軀體痛苦,還給患者及其家庭帶來了沉重的經(jīng)濟(jì)負(fù)擔(dān)。椎間盤退變是引起這些疾病的主要原因,盡管針對椎間盤退變的研究已進(jìn)行了多年,但到目前為止人們對椎間盤退變機(jī)制的認(rèn)識尚不全面。椎間盤退變的過程伴隨著細(xì)胞凋亡、胞外基質(zhì)降解、基質(zhì)生成異常等一系列改變[1],在這些改變的背后是相關(guān)蛋白編碼基因的表達(dá)異常[2]。
基因芯片是近十余年來興起的一項(xiàng)基因檢測技術(shù),利用基因芯片可以快速獲得樣本內(nèi)所有基因同一時間點(diǎn)的表達(dá)信息,這些尤其適用于差異表達(dá)基因的篩選[3]。隨著基因芯片的廣泛應(yīng)用,產(chǎn)生了海量的芯片數(shù)據(jù),這些數(shù)據(jù)被儲存于某些公共數(shù)據(jù)庫中,對這些數(shù)據(jù)進(jìn)行分析可以幫助我們揭示疾病背后隱藏的基因秘密。本研究以椎間盤退變相關(guān)基因芯片數(shù)據(jù)作為研究對象,通過統(tǒng)計學(xué)方法及生物信息學(xué)工具對椎間盤退變相關(guān)的差異表達(dá)基因進(jìn)行了研究。
1.1 材料 本研究中所用椎間盤退變相關(guān)基因芯片表達(dá)譜數(shù)據(jù)來源于美國國立生物技術(shù)信息中心(The National Center for Biotechnology Information)基因表達(dá)數(shù)據(jù)庫(Gene Expression Omnibus,GEO),基因系列號為GSE23130,所研究標(biāo)本來源于正常及退變椎間盤纖維環(huán)組織。采用GeneSpring 13.0(Agilent Technologies,Santa Clara,CA,US)對GSE23130樣本數(shù)據(jù)進(jìn)行質(zhì)量分析,最終10例樣本數(shù)據(jù)(GSM569833、GSM569839、GSM569840、GSM569841、GSM569842為正常纖維環(huán) 組織,GSM569848、GSM569849、GSM569850、GSM569851、GSM569852為退變纖維環(huán)組織)被納入實(shí)驗(yàn)。
1.2 方法 將樣本數(shù)據(jù)導(dǎo)入GeneSpring 13.0軟件,隨后對正常及退變纖維環(huán)組織間差異表達(dá)基因進(jìn)行篩選,差異表達(dá)篩選條件設(shè)置為成組Student′s t檢驗(yàn)P<0.05(雙尾),且基因表達(dá)水平相差超過兩倍[4]。采用GeneSpring13.0以篩選獲得的差異表達(dá)基因標(biāo)準(zhǔn)化數(shù)據(jù)為對象,進(jìn)行聚類分析并構(gòu)建熱圖。對差異表達(dá)上調(diào)及下調(diào)基因分別進(jìn)行GO分析,從分子功能、生物過程和細(xì)胞組分三個角度對其進(jìn)行富集分析及屬性歸屬。經(jīng)GO數(shù)據(jù)庫默認(rèn)的統(tǒng)計學(xué)算法計算得到與GO術(shù)語富集程度有關(guān)的P值,P值越小表示此生物學(xué)通路越重要,以P<0.05認(rèn)定為差異具有統(tǒng)計學(xué)意義。將差異表達(dá)上調(diào)及下調(diào)基因分別導(dǎo)入KEGG PATHWAY數(shù)據(jù)庫進(jìn)行生物學(xué)通路分析,經(jīng)數(shù)據(jù)庫默認(rèn)的統(tǒng)計學(xué)算法計算P值,P值小于0.05的生物學(xué)通路認(rèn)定為具有統(tǒng)計學(xué)意義。同時采用DAVID(The Database for Annotation,Visualization and Integrated Discovery,DAVID,version 6.7)數(shù)據(jù)庫對篩選出的差異表達(dá)上、下調(diào)基因分別進(jìn)行功能注釋簇集分析,分析時選擇DAVID數(shù)據(jù)庫默認(rèn)的注釋類別和“高”簇集分類標(biāo)準(zhǔn)選項(xiàng),簇集評分大于1.3的認(rèn)定為具有顯著性[5]。
2.1 針對差異表達(dá)基因進(jìn)行的GO分析結(jié)果 表達(dá)上調(diào)基因涉及173個GO生物過程條目、87個GO細(xì)胞組分條目、55個分子功能條目;表達(dá)下調(diào)基因涉及46個GO生物過程條目、14個GO細(xì)胞組分條目、17個分子功能條目,見表1。
表1 差異表達(dá)基因相關(guān)的GO分析條目(前5位條目)
2.2 差異表達(dá)基因相關(guān)的KEGG PATHWAY生物學(xué)通路差異和DAVID功能注釋富集分析簇集 GSE23130篩選出差異表達(dá)基因3 182個,表達(dá)上調(diào)的基因有1 735個,表達(dá)下調(diào)的有1 447個,其中116個基因表達(dá)上調(diào)超過10倍,28個表達(dá)下調(diào)超過10倍。圖1為根據(jù)差異表達(dá)基因數(shù)據(jù)構(gòu)建的聚類分析樹及熱圖,紅色條塊表示相關(guān)基因表達(dá)下調(diào),綠色條塊表示相關(guān)基因表達(dá)上調(diào)。針對上述兩個基因表達(dá)譜數(shù)據(jù)系列進(jìn)行的KEGG PATHWAY生物學(xué)通路分析發(fā)現(xiàn)了12個與上調(diào)表達(dá)基因相關(guān)的生物學(xué)通路,此外還發(fā)現(xiàn)了3個與下調(diào)表達(dá)基因相關(guān)的生物學(xué)通路(見表2)。針對GSE23130進(jìn)行的DAVID功能注釋富集分析發(fā)現(xiàn)與表達(dá)上調(diào)基因相關(guān)的簇集22個,此外還發(fā)現(xiàn)了12個與表達(dá)下調(diào)基因有關(guān)的簇集(見表3)。
表2 差異表達(dá)基因相關(guān)的KEGG PATHWAY生物學(xué)通路
表3 差異表達(dá)基因相關(guān)的DAVID功能注釋富集分析簇集
本研究通過對GSE23130基因表達(dá)譜數(shù)據(jù)進(jìn)行深入分析,發(fā)現(xiàn)了一批在退變和正常椎間盤組織間差異表達(dá)的蛋白編碼基因。與此類似,過去針對椎間盤退變進(jìn)行的基因表達(dá)譜芯片研究也發(fā)現(xiàn)椎間盤退變過程中存在大量基因的異常表達(dá)[6]。針對這些差異表達(dá)基因進(jìn)行功能注釋,能夠幫助我們了解這些基因所參與的生物學(xué)過程?;谶@一考慮,本研究采用GO、KEGG PATHWAY、DAVID功能注釋簇集等生物信息學(xué)工具對差異表達(dá)的基因進(jìn)行了分析。
結(jié)果顯示表達(dá)上調(diào)的基因參與了TGF-β信號通路,過去的研究指出TGF-β信號通路的激活在椎間盤細(xì)胞生長、增殖、基質(zhì)產(chǎn)生等方面發(fā)揮了重要作用[7],這些基因還參與了Wnt信號通路,椎間盤內(nèi)Wnt通路的激活被認(rèn)為與細(xì)胞外基質(zhì)破壞有關(guān)[8],而TGF-β具有對抗Wnt信號通路激活的作用[9]。由于椎間盤中TGF-β信號通路的異常改變,TGF-β對Wnt的拮抗作用消失,導(dǎo)致椎間盤損傷后難以進(jìn)行自我修復(fù),加速了退變的發(fā)生。
椎間盤退變時椎間盤內(nèi)細(xì)胞停止有絲分裂、提前進(jìn)入衰老狀態(tài)是造成椎間盤退變的因素之一。機(jī)械應(yīng)力、炎性因子均可引起椎間盤細(xì)胞的提前衰老,此外,氧自由基引起的損傷也是誘發(fā)細(xì)胞衰老的原因之一[10-11]。退變時經(jīng)由外周滲透入椎間盤內(nèi)的營養(yǎng)成分和氧氣減少,同時代謝廢物排出障礙,引起氧自由基堆積、細(xì)胞氧化應(yīng)激損傷,繼而導(dǎo)致細(xì)胞周期調(diào)節(jié)障礙,細(xì)胞提前衰老。這一過程在本研究中即有所體現(xiàn),結(jié)果顯示上調(diào)表達(dá)基因參與了氧化磷酸化、細(xì)胞周期通路,也與線粒體呼吸鏈復(fù)合體Ⅰ等簇集有關(guān),而下調(diào)表達(dá)基因在甘油三酯代謝過程、氧化還原酶活性等過程中發(fā)揮了作用。此外上調(diào)表達(dá)的基因還與凋亡調(diào)節(jié)簇集密切相關(guān),以前的研究指出營養(yǎng)缺乏、氧化應(yīng)激損傷不僅會引起細(xì)胞衰老,最終也會導(dǎo)致細(xì)胞的凋亡[12]。
自體免疫損傷是導(dǎo)致椎間盤退變的一個重要因素,本研究結(jié)果顯示表達(dá)上調(diào)的基因與通過Ⅰ型MHC進(jìn)行的肽類抗原處理和提呈、激活T細(xì)胞的核因子、Ⅰ型MHC蛋白復(fù)合體簇集有關(guān),提示T細(xì)胞在椎間盤免疫損傷的過程中發(fā)揮了關(guān)鍵作用。正常情況下椎間盤處于免疫赦免狀態(tài),當(dāng)椎間盤受損時其免疫赦免狀態(tài)被打破,椎間盤內(nèi)成分被機(jī)體免疫系統(tǒng)認(rèn)定為外源抗原,經(jīng)抗原提呈細(xì)胞處理后提呈給T細(xì)胞,從而激活T細(xì)胞針對椎間盤的免疫損傷。此外結(jié)果還顯示上調(diào)基因與免疫球蛋白C1組、B細(xì)胞受體信號通路有關(guān),表達(dá)下調(diào)的基因也參與了自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒作用,提示在椎間盤的自身免疫損傷過程中,不僅有T細(xì)胞的參與,B細(xì)胞及NK細(xì)胞均扮演了重要角色[13]。
除上述結(jié)果外,差異表達(dá)的基因還與剪接體、核糖體通路有關(guān),提示退變時基因轉(zhuǎn)錄及蛋白翻譯過程均出現(xiàn)很大改變。而黏合連接、黏著斑的異常提示退變時細(xì)胞同細(xì)胞間及細(xì)胞同基質(zhì)間的關(guān)系發(fā)生了異常,這些改變會影響細(xì)胞的遷移、增殖等過程。結(jié)果中還涉及到數(shù)個與椎間盤退變時神經(jīng)、血管侵入有關(guān)的生物學(xué)通路或簇集條目,例如VEGF信號通路、神經(jīng)發(fā)生、神經(jīng)生長調(diào)控。此外泛素介導(dǎo)的蛋白降解、修飾依賴的蛋白分解過程等生物學(xué)過程的異常變化提示背后的異常表達(dá)基因可能參與了退變椎間盤胞外基質(zhì)降解這一過程。
本研究通過對椎間盤退變相關(guān)的基因芯片表達(dá)譜數(shù)據(jù)進(jìn)行研究,發(fā)現(xiàn)了一系列和椎間盤退變相關(guān)的異常表達(dá)基因,這些基因相關(guān)的生物學(xué)過程也存在明顯異常,針對這些基因進(jìn)行深入研究將有助于我們加深對椎間盤退變機(jī)制的理解。
[1]Rahul J,Mike YC.Regenerative biology of the spine and spinal cord [M].Landes Bioscience and Springer Science+Business Media, 2012,CHAPTER 8:114-133.
[2]Chen K,Wu D,Zhu X,et al.Gene expression profile analysis of human intervertebral disc degeneration[J].Genet Mol Biol,2013,36 (3):448-454.
[3]Yan B,Wang ZH,Guo JT.The research strategies for probing the function of long noncoding RNAs[J].Genomics,2012,99(2):76-80.
[4]Ziats MN,Rennert OM.Aberrant expression of long noncoding RNAs in autistic brain[J].J Mol Neurosci.2013,49(3):589-593.
[5]Gillett A,Maratou K,Fewings C,et al.Alternative splicing and transcriptome profiling of experimental autoimmune encephalomyelitis using genome-wide exon arrays[J].PLoS One,2009,4(11):e7773.
[6]Gruber HE,Hoelscher GL,Ingram JA,et al.Genome-wide analysis of pain-,nerve-and neurotrophin-related gene expression in the degenerating human annulus[J].Mol Pain,2012,8:63.
[7]Jin H,Shen J,Wang B,et al.TGF-β signaling plays an essential role in the growth and maintenance of intervertebral disc tissue[J].FEBS Lett,2011,585(8):1209-1215.
[8]Hiyama A,Sakai D,Risbud MV,et al.Enhancement of intervertebral disc cell senescence by WNT/β-catenin signaling-induced matrix metalloproteinase expression[J].Arthritis Rheum,2010,62 (10):3036-3047.
[9]Hiyama A,Sakai D,Tanaka M,et al.The relationship between the Wnt/β-catenin and TGF-β/BMP signals in the intervertebral disc cell [J].J Cell Physiol,2011,226(5):1139-1148.
[10]Dai SM,Shan ZZ,Nakamura H,et al.Catabolic stress induces features of chondrocyte senescence through overexpression of caveolin 1:possible involvement of caveolin 1-induced down-regulation of articular chondrocytes in the pathogenesis of osteoarthritis[J].Arthritis Rheum,2006,54(3):818-831.
[11]Homma Y,Tsunoda M,Kasai H.Evidence for the accumulation of oxidative stress during cellular ageing of human diploid fibroblasts[J]. Biochem Biophys Res Commun,1994,203(2):1063-1068.
[12]Ahsan R,Tajima N,Chosa E,et al.Biochemical and morphological changes in herniated human intervertebral disc[J].J Orthop Sci, 2001,6(6):510-518.
[13]Sun Z,Zhang M,Zhao XH,et al.Immune cascades in human intervertebral disc:the pros and cons[J].Int J Clin Exp Pathol,2013,6 (6):1009-1014.
Study of gene expression profile of an intervertebral disc degeneration-related microarray.
WAN Zhong-yuan1, SONG Fang2,REN Da-jiang1,SHAN Jian-lin1,ZHAO Guang-min1,LI Fang1.1.Department of Orthopedics,General Hospital of Beijing Military Command,Beijing 100700,CHINA;2.Department of Stomatology,General Hospitalof Second Artillery Corps,Beijing 100088,CHINA
ObjectiveTo investigate the difference between gene expression profiles of normal and degenerated intervertebral disc by employing released microarray gene expression profile,and to predict and analyze the biological process related to the differentially expressed genes.MethodsAn intervertebral disc degeneration(IDD)related microarray dataset GSE23130 was selected from the Gene Expression Omnibus(GEO).Quality filtering were applied for the samples of GSE23130,and 10 samples such as GSM569833 were included.GeneSpring 13.0 software was applied to screen the differentially expressed genes between normal and degenerated samples.A hierarchical clustering tree and heat map was mapped for the differentially expressed genes.GO analysis,KEGG PATHWAY analysis and DAVID functional annotation clustering were performed for the genes.ResultsA total of 3 182 genes were found aberrantly expressing in the degenerated discs,of which 1 735 were up-regulated and 1 447 were down-regulated.Several interesting items,such as VEGF signaling pathway,nuclear factor of activated T cells(NFAT)were noted in the results of bioinformatics analysis.ConclusionThe current study shows a great number of genes are aberrantly expressed in IDD.Subsequent bioinformatics analysis indicates that biological process of these genes are abnormal.Some of these biological process might be the key links in IDD deserving further investigation.
Intervertebral disc degeneration;Annulus fibrous;Microarray;Bioinformatics
R681.5+3
A
1003—6350(2016)06—0870—04
10.3969/j.issn.1003-6350.2016.06.004
2015-10-15)
李放。E-mail:FANGL6722@sina.com