王文棟 常曉彤 杜華陽 (河北北方學(xué)院醫(yī)學(xué)檢驗(yàn)學(xué)院生物化學(xué)教研室,河北 張家口 075000)
動脈粥樣硬化易感基因挖掘與生物信息學(xué)分析
王文棟 常曉彤 杜華陽1(河北北方學(xué)院醫(yī)學(xué)檢驗(yàn)學(xué)院生物化學(xué)教研室,河北 張家口 075000)
目的挖掘動脈粥樣硬化(AS)易感基因,為尋找AS正確的診斷和治療方法提供線索和數(shù)據(jù)支撐。方法從PubMed、OMIM和GEO數(shù)據(jù)庫檢索AS相關(guān)數(shù)據(jù),利用SMD在線工具對AS易感基因進(jìn)行染色體定位,并通過DAVID和STRING10.0軟件進(jìn)行基因功能注釋和蛋白互作分析。結(jié)果共獲得AS易感基因454個,其染色體定位分布不均勻,以1、11、2和4號分布較多,Y染色體多于X染色體上的分布;AS易感基因富集在24個生物學(xué)功能注釋單元中,其中44個編碼蛋白存在互作關(guān)系,涉及多種生物學(xué)過程和分子功能。結(jié)論AS易感基因的控掘與生物信息分析為AS的分子水平機(jī)制研究提供了數(shù)據(jù)平臺,為多基因復(fù)雜疾病的基因挖掘提供了有效方法。
動脈粥樣硬化;易感基因;染色體定位;富集分析;蛋白質(zhì)互作網(wǎng)絡(luò)
動脈粥樣硬化(AS)也被稱為動脈硬化性血管病(ASVD),包括脂質(zhì)代謝紊亂、血管內(nèi)皮細(xì)胞受損、炎性細(xì)胞浸潤、斑塊破裂和血栓形成等慢性病理過程,是眾多心腦血管疾病共同的病理基礎(chǔ)〔1~5〕。AS患病早期無明顯癥狀,患者察覺時多因發(fā)現(xiàn)其他心腦血管并發(fā)癥,例如,腦卒中、心臟病等〔4〕。誘發(fā)AS的風(fēng)險(xiǎn)因素較多〔5〕,如糖尿病、血脂異常、吸煙、肥胖、維生素B缺乏、PM2.5空氣污染等〔6~8〕。研究表明男性AS發(fā)病率明顯高于女性,且男性發(fā)病年齡集中在40~50歲,女性發(fā)病年齡則集中在50~70歲〔9〕。AS是由遺傳與環(huán)境因素共同作用的多基因病,其病理過程復(fù)雜,分子水平機(jī)制尚不明確。近30年來,人類基因組計(jì)劃的完成、高通量芯片技術(shù)的誕生、生命科學(xué)和生物信息學(xué)領(lǐng)域的不斷更新與完善使人們在分子水平積累了大量的實(shí)驗(yàn)數(shù)據(jù)和研究成果。2000年7月,美國國立生物技術(shù)信息中心NCBI首次發(fā)布了GEO數(shù)據(jù)庫,它儲存了大量的基因表達(dá)、分子豐度信息,可上傳和儲存高通量生物芯片實(shí)驗(yàn)數(shù)據(jù),是目前最重要的對基因表達(dá)數(shù)據(jù)進(jìn)行瀏覽、查詢和檢索的在線資源〔10〕。目前權(quán)威的人類孟德爾遺傳在線數(shù)據(jù)庫是持續(xù)更新的關(guān)于人類基因和遺傳紊亂疾病的數(shù)據(jù)庫,為多基因復(fù)雜疾病的研究提供了數(shù)據(jù)支持〔11〕。miRNA水平的基因治療是探索治療AS的新途徑,但目前主要處于動物試驗(yàn)階段〔12〕。本研究擬挖掘AS易感基因、在系統(tǒng)和生物組學(xué)水平研究其功能及在疾病發(fā)生中的作用。
1.1數(shù)據(jù)來源 AS易感基因主要從PubMed、OMIM、GEO數(shù)據(jù)庫中進(jìn)行檢索和挖掘。以“Atherosclerosis AND human”為檢索詞在PubMed數(shù)據(jù)庫進(jìn)行檢索,獲得與AS相關(guān)的文獻(xiàn)共計(jì)86 364條,其中涉及AS相關(guān)基因共計(jì)209個;利用OMIM數(shù)據(jù)庫進(jìn)行檢索與挖掘,共獲得212條AS相關(guān)記錄,挖掘到189個AS相關(guān)基因,并根據(jù)OMIM號在NCBI上檢索到AS相關(guān)基因的Gene ID;在GEO DataSets中以“Atherosclerosis AND human〔organism〕”檢索人類有關(guān)的AS微陣列實(shí)驗(yàn)數(shù)據(jù),從GDS5083數(shù)據(jù)集中下載研究項(xiàng)目編號為GSE43292的芯片數(shù)據(jù)作為研究對象,利用NCBI提供的“up/down gene”篩選工具,獲得與AS相關(guān)的差異表達(dá)基因69個。
1.2方法 根據(jù)AS易感基因一一對應(yīng)的Gene ID,利用在線分析工具Stanford Microarray Database〔13〕,對AS易感基因進(jìn)行染色體定位,并作圖統(tǒng)計(jì)分析。利用DAVID數(shù)據(jù)庫〔14〕采用全新的模糊聚類算法,將AS易感基因列表關(guān)聯(lián)到生物學(xué)注釋上,進(jìn)而從統(tǒng)計(jì)層面,在數(shù)千個關(guān)聯(lián)注釋中,找出最顯著富集的生物學(xué)功能注釋,功能相關(guān)的基因聚到一個單元,在生物學(xué)網(wǎng)絡(luò)水平研究這些基因群。由于功能相似的基因其編碼的蛋白通常存在互作關(guān)系,所以利用STRING10.0在線分析工具〔15〕將AS易感基因富集結(jié)果所得基因編碼蛋白進(jìn)行互作網(wǎng)絡(luò)分析。
2.1AS易感基因的挖掘 從PubMed、OMIM、GEO數(shù)據(jù)庫對AS易感基因進(jìn)行挖掘,經(jīng)過篩選、統(tǒng)計(jì)和匯總,共得到AS易感基因454個。見表1。
2.2AS易感基因的染色體定位 454個AS易感基因染色體定位結(jié)果顯示見圖1,AS易感基因在染色體上的分布較廣,但不均勻,其中1號染色體上分布最多,其次為11、2、4號染色體,除此之外,AS易感基因在性染色體上也有分布,在Y染色體上分布的易感基因有RPS4Y1、UTY、KDM5D、USP9Y、DDX3Y、EIF1AY和TXLNGY,而X染色體上分布的易感基因有IL13RA2、TMEM255A和RPS26P11。
表1 AS易感基因
續(xù)表1 AS易感基因
2.3AS易感基因的富集分析 利用DAVID在線分析工具將AS易感基因關(guān)聯(lián)到24個注釋單元中,Cluster#1 26個包括LPL、GALNT2、HNF1A、LDLR、FADS1、APOC1、FADS3、FADS2、ABCA1、APOA4、ABCG8、APOB、GCKR、APOA1、APOE、LCAT、APOC3、APOA5、LIPG、PCSK9、SORT1、CETP、LIPC、ANGPTL3、PLTP、ANGPTL4;Cluster#2 17個:GALNT2、LPL、LDLR、APOC1、ABCA1、APOA4、APOB、GCKR、APOA1、APOE、LCAT、APOA5、APOC3、LIPG、SORT1、PCSK9、CETP;Cluster#3 18個:GALNT2、LPL、LDLR、APOC1、DOCK7、ABCA1、APOA4、APOB、GCKR、APOA1、APOE、APOA5、APOC3、LIPG、PCSK9、SORT1、CETP、ANGPTL3;Cluster#4 19個:LPL、LDLR、FADS3、FADS2、DOCK7、ABCA1、APOA4、APOB、GCKR、ABCG5、APOA1、APOE、APOC3、APOA5、LIPG、CETP、LIPC、ANGPTL3、LIPC;Cluster#5 14個:LPL、LDLR、FADS1、CRP、FADS2、G6PC2、APOB、GCKR、LCAT、MTNR1B、SORT1、CETP、LIPC、NR1H3;Cluster#6 5個:SLC2A9、GCKR、APOA1、APOA5、APOC3;Cluster#7 4個:ATHS、ESR1、ALOX5、SELE;Cluster#8 4個:NUMB、ABI2、LRRC18、DNAH5;Cluster#9 4個:LPA、KL、PON1、IRS1;Cluster#10 4個:APOA4、APOA1、APOA5、APOC3;Cluster#11 4個:GCKR、HNF1A、APOE、CRP;Cluster#12 3個:ICAM1、CD36、TNF;Cluster#13 3個:LPL、GCKR、CETP;Cluster#14 3個:WDFY4、TNFAIP3、ITGAM;Cluster#15 4個:ACE、TNFSF4、OLR1、ESR1;Cluster#16 4個:HLA-DRB1、HLA-DRB4、CD40、TNFAIP3;Cluster#17 4個:PPARG、CDKN2B、VEGFA、CDKN2A;Cluster#18 2個:LMNA、PPARG;Cluster#19 2個:ABCG8、ABCG5;Cluster#20 2個:TNFRSF11B、LRP5;Cluster#21 2個:CDKN2A、CDKN2B;Cluster#22 2個:ICAM1、ABO;Cluster#23 3個:HMOX1、SERPINA1、FGB;Cluster#24 2個FGB、FGA。主要涉及血脂異常位點(diǎn)、冠狀動脈疾病風(fēng)險(xiǎn)位點(diǎn)、心血管疾病標(biāo)記基因位點(diǎn)和主動脈粥樣硬化易感基因位點(diǎn)等。此外,發(fā)現(xiàn)有少數(shù)AS易感基因是一些非心腦血管疾病的關(guān)聯(lián)基因,例如:WDFY4、TNFAIP3、ITGAM與紅斑狼瘡有關(guān);HLA-DRB1、HLA-DRB4、CD40、TNFAIP3與風(fēng)濕性關(guān)節(jié)炎有關(guān);TNFRSF11B、LRP5與骨質(zhì)疏松有關(guān);HMOX1、SERPINA1、FGB與慢性肺炎相關(guān)。
圖1 AS易感基因的染色體定位
2.4AS富集基因編碼蛋白的互作關(guān)系 利用STRING10.0在線分析工具發(fā)現(xiàn)AS富集基因中有44個基因編碼的蛋白存在互作關(guān)系見圖2,其中APOC1、ABCG5、ABCG8、APOA4、APOC3、APOE、PCSK9、APOA1、CETP、LDLR、LPL、APOB、LPA、LCAT、ANGPTL3、LIPG、ABCA1、APOA5、NR1H3、PON1和PLTP蛋白與其他≥5個蛋白存在相互關(guān)系,為此蛋白互作網(wǎng)絡(luò)的中心節(jié)點(diǎn),刪除這些節(jié)點(diǎn)蛋白后,網(wǎng)絡(luò)結(jié)構(gòu)渙散。其中APOC1、APOC3;APOA1、APOA4、APOA5;APOB、APOE屬于載脂蛋白家族,與脂代謝疾病、高血壓、慢性心臟病等密切相關(guān),且APOC1、APOC3、APOE與老年癡呆認(rèn)知能力下降有關(guān);ABCG5、ABCG8和ABC屬于跨膜轉(zhuǎn)運(yùn)蛋白G家族;ABCA1基因與膽固醇逆轉(zhuǎn)運(yùn)和高密度脂蛋白生成有關(guān),具有抗AS的作用;PCSK9、CETP、LDLR、LIPG、LPA和LPL調(diào)節(jié)血漿膽固醇的代謝;ANGPTL3屬于血管生成素樣蛋白家族,能抑制脂蛋白酶活性從而調(diào)節(jié)脂蛋白代謝;PON1可以保護(hù)低密度脂蛋白,對抗AS形成;PLTP 為磷脂轉(zhuǎn)運(yùn)蛋白參與高密度脂蛋白的轉(zhuǎn)運(yùn)與修飾,調(diào)控脂蛋白代謝;NR1H3為核受體基因,但功能尚不明確。
圖2 富集基因的蛋白-蛋白相互作用
AS病理過程復(fù)雜,常伴有其他心腦血管并發(fā)癥,受遺傳和環(huán)境的共同影響,但其涉及致病基因較多,分子水平機(jī)制尚不明確,通過生物信息學(xué)方法盡可能全面地挖掘到AS易感基因共計(jì)454個,為AS發(fā)病機(jī)制的研究提供了數(shù)據(jù)平臺,富集分析獲得的基因可以找到44個互作蛋白,將成為后續(xù)研究的重要突破。染色體定位顯示,Y上的易感基因明顯多于X染色體上的易感基因,鎖定這些易感基因有助于解釋男女AS發(fā)病率及發(fā)病年齡的差別。了解AS易感基因在染色體上的定位,有助于進(jìn)一步進(jìn)行連鎖分析,尋找更多相關(guān)基因,確定分子水平作用機(jī)制。另外,這種生物信息學(xué)方法可用于其他多基因復(fù)雜疾病易感基因的挖掘工作中,為復(fù)雜疾病的診斷和治療提供線索和數(shù)據(jù)支撐。
1Ross R.Atherosclerosis-an inflammatory disease〔J〕.New Engl J Med,1999;340(2):115-26.
2王 蕾.動脈粥樣硬化治療研究新進(jìn)展〔J〕.現(xiàn)代醫(yī)藥衛(wèi)生,2013;29(20):3085-8.
3Wang-michelitsch J,Michelitsch T.Misrepair mechanism in the development of atherosclerotic plaques〔J〕.Bibcode,2015;8:49-59.
4Ross R.The pathogenesis of atherosclerosis:a perspective for the 1990s〔J〕.Nature,1993;362(6423):801-9.
5Blankenhorn DH,Hodis HN.Atherosclerosis--reversal with therapy〔J〕.Western J Med,1993;159(2):172-9.
6Mitchel RS,Kumar V,Abbas AK,etal.Robbins basic pathology:with student consult online access〔M〕.8th ed.Philadelphia:Saunders,2007:156-245.
7Gruberg ER,Raymond SA.Beyond cholesterol:vitamin B6,arteriosclerosis and your heart〔M〕.New York:St.Martin's Press,1981:200-65.
8Provost EB,Madhloum N,Int PL,etal.Carotid intima-media thickness,a marker of subclinical atherosclerosis,and particulate air pollution exposure:the meta-analytical evidence〔J〕.PLoS One,2015;10(5):e0127014.
9Flora G,Baker AB,Loewenson RB,etal.A comparative study of cerebral atherosclerosis in males and females〔J〕.Circulation,1968;38:859-69.
10Barrett T,Wilhite SE,Ledoux P,etal.NCBI GEO:archive for functional genomics data sets-update 〔J〕.Nucleic Acids Res,2013;41:D991-5.
11Mckusick VA.Mendelian inheritance in man:a catalog of human genes and genetic disorders baltimore〔M〕.12th ed.Baltimore,Maryland:Johns Hopkins University Press,1998:201-305.
12Rayner KJ,Sheedy FJ,Esau CC,etal.Antagonism of miR-33 in mice promotes reverse cholesterol transport and regression of atherosclerosis〔J〕.J Clin Invest,2011;121:2921-31.
13Demeter J,Beauheim C,Gollub J,etal.The stanford microarray database:implementation of new analysis tools and open source release of software〔J〕.Nucleic Acids Res,2007;35:D766-70.
14Jiao X,Sherman BT,Stephens R,etal.DAVID-WS:a stateful web service to facilitate gene/protein list analysis〔J〕.Bioinformatics,2012;28(13):1805-6.
15Szklarczyk D,Franceschini A.STRING v10:protein-protein interaction networks,integrated over the tree of life〔J〕.Nucleic Acids Res,2015;43:D447-52.
R34
A
1005-9202(2017)24-6071-05;
10.3969/j.issn.1005-9202.2017.24.028
1 河北北方學(xué)院基礎(chǔ)醫(yī)學(xué)院醫(yī)學(xué)影像學(xué)系
常曉彤(1968-),女,教授,碩士,碩士生導(dǎo)師,主要從事脂代謝相關(guān)疾病的分子機(jī)制及臨床應(yīng)用的研究。
王文棟(1985-),女,講師,碩士,主要從事動脈粥樣硬化易感基因的功能研究。
〔2016-11-17修回〕
(編輯 苑云杰/杜 娟)