吳星,袁定芬(上海交通大學附屬第六人民醫(yī)院,上海200233)
·論著·
黑色素瘤轉(zhuǎn)移相關(guān)基因的生物信息學分析
吳星,袁定芬
(上海交通大學附屬第六人民醫(yī)院,上海200233)
目的 通過對與黑色素瘤轉(zhuǎn)移相關(guān)的基因芯片進行生物信息學分析,為探索黑色素瘤轉(zhuǎn)移的分子機制提供理論依據(jù)。方法 從公共基因數(shù)據(jù)庫(GEO)中下載與黑色素瘤轉(zhuǎn)移相關(guān)的基因芯片數(shù)據(jù),經(jīng)數(shù)據(jù)預處理后,分別通過BRB-Array Tools軟件、DAVID在線分析軟件、STRING在線數(shù)據(jù)庫和Cytoscape軟件進行差異表達基因的篩選、功能注釋、通路分析、蛋白互作網(wǎng)絡分析并計算網(wǎng)絡及各個節(jié)點的拓撲特性。結(jié)果 BRB分析篩選出196個黑色素瘤轉(zhuǎn)移差異表達基因,其中上調(diào)133個,下調(diào)36個,DAVID分析發(fā)現(xiàn)其主要集中在角質(zhì)形成細胞分化、組織細胞間黏附、肥大細胞分化等生物學過程和Rap1信號通路、p53信號通路、谷胱甘肽代謝等通路。STRING分析發(fā)現(xiàn)了蛋白質(zhì)網(wǎng)絡互作圖中的9個關(guān)鍵基因,分別為KRT14、KRT16、KRT1、EGFR、KIT、DSP、DSG1、PKP1、KLK7。結(jié)論 通過生物信息學的方法對黑色素瘤轉(zhuǎn)移相關(guān)基因芯片數(shù)據(jù)進行2次挖掘,為進一步研究黑色素瘤轉(zhuǎn)移的相關(guān)機制提供了理論依據(jù)。
黑色素瘤;生物信息學;基因芯片;BRBArray Tools軟件
黑色素瘤是皮膚腫瘤中死亡率最高的惡性腫瘤之一,2010年全球黑色素瘤的死亡例數(shù)為46 372 例[1]。雖然黑色素瘤在中國的發(fā)病率較低,但由于我國人口基數(shù)巨大,黑色素瘤的發(fā)病在臨床上也并不少見。轉(zhuǎn)移是導致黑色素瘤預后不佳的重要因素,調(diào)查發(fā)現(xiàn)轉(zhuǎn)移性黑色素瘤的中位生存期不足6個月,5年生存率不足5%[2]。
基因芯片,又名DNA芯片或DNA微陣列,具有高通量、高集成、微型化、自動化等特點,能夠平行、快速地檢測成千上萬個基因轉(zhuǎn)錄體的表達水平,已廣泛應用于突變基因檢測、差異基因篩查、基因文庫作圖、藥物作用靶標、腫瘤分型、多態(tài)性檢測等多
個方面[3]。本研究通過對來源于基因芯片公共數(shù)據(jù)庫(GEO)的黑色素瘤轉(zhuǎn)移基因表達譜芯片數(shù)據(jù)進行分析,篩選出黑色素瘤轉(zhuǎn)移差異表達基因,并對其進行GO富集分析和KEGG通路分析,同時作出其蛋白互相作用網(wǎng)絡圖,為進一步了解黑色素瘤轉(zhuǎn)移的分子機制提供基礎(chǔ)。
1.1 材料 本研究采用的黑色素瘤轉(zhuǎn)移相關(guān)基因芯片數(shù)據(jù)(GSE8401)來源于美國國立生物信息技術(shù)中心(NCBI)的公共基因芯片數(shù)據(jù)庫(GEO),芯片平臺為GPL96[(HG-U133A)Affymetrix Human Genome U133AArray],其中原位黑色素瘤31例(GSM207929—GSM207959)、轉(zhuǎn)移性黑色素瘤52例(GSM207960—GSM208011)。
1.2 方法
1.2.1 數(shù)據(jù)處理及差異基因篩選 利用BRB-Array Tools 4.5.1 Beta軟件對從GEO中下載的黑色素瘤轉(zhuǎn)移相關(guān)基因芯片數(shù)據(jù)集進行統(tǒng)計學分析。首先將數(shù)據(jù)按照Import data-Data importwizard的步驟導入軟件,數(shù)據(jù)導入成功后,采用Just R MA算法和中位數(shù)法進行預處理、基因過濾及標準化,過濾的標準為:①兩類樣本的基因中位數(shù)至少發(fā)生3倍的改變,且這種改變不少于20%的樣本數(shù);②基因表達數(shù)據(jù)缺失數(shù)不超過50%;利用Class comparison工具對過濾標準的基因進行兩獨立樣本t檢驗,找出原位黑色素瘤與轉(zhuǎn)移性黑色素瘤的差異表達基因(P<0.001)。
1.2.2 差異基因生物信息學分析 利用DAVID在線分析軟件(http://david.a(chǎn)bcc.ncifcrf.gov/conversion.jsp)對黑色素瘤轉(zhuǎn)移相關(guān)的差異表達基因進行GO富集分析和KEGG通路分析。
1.2.3 差異基因相互作用網(wǎng)絡分析 利用STRING在線分析軟件(http://string-db.org/)研究黑色素瘤轉(zhuǎn)移相關(guān)的差異表達基因所編碼的蛋白質(zhì)之間的相互作用,繪制差異表達基因編碼蛋白質(zhì)的相互作用網(wǎng)絡圖。
2.1 黑色素瘤轉(zhuǎn)移差異表達基因篩選 根據(jù)預先設置的數(shù)據(jù)過濾標準以及中位數(shù)標準化處理后,BRB-Array Tools工具對原位黑色素瘤和轉(zhuǎn)移性黑色素瘤兩個樣本進行分類比較,共同篩選出差異表達基因169個(表達差異3倍以上),其中上調(diào)133個,下調(diào)36個,上調(diào)和下調(diào)表達差異前10個基因見表1、2。
表1 上調(diào)差異表達基因 (TOP10)
2.2 上調(diào)差異表達基因生物信息學分析 通過DAVID在線分析軟件對上調(diào)差異表達基因進行生物信息學分析。GO富集分析發(fā)現(xiàn)這些基因主要集中在表皮生長、角質(zhì)形成細胞分化、信號傳導、單個組織細胞間黏附、角化作用以及細胞骨架構(gòu)成等生物學過程見表3。KEGG通路分析也發(fā)現(xiàn)其主要集中在Rap1信號通路、黑素合成、酪氨酸代謝、腎素分泌、p53信號通路、細胞間隙連接等通路,見表4。
2.3 下調(diào)差異表達基因生物信息學分析 通過DAVID在線分析軟件對下調(diào)差異表達基因進行生物信息學分析。GO富集分析發(fā)現(xiàn)這些基因主要集中在肥大細胞分化、細胞間嗜同性黏附、交感神經(jīng)分化、胚胎造血、對雌激素的應答、角質(zhì)形成細胞分化等生物學過程見表5。KEGG通路分析也發(fā)現(xiàn)其主要集中在細胞外基質(zhì)受體作用、脂肪酸降解、谷胱甘肽代謝等通路,見表6。
2.4 黑色素瘤轉(zhuǎn)移差異表達基因相互作用網(wǎng)絡分析 通過STRING在線數(shù)據(jù)庫對169個黑色素瘤差異表達基因進行蛋白質(zhì)相互作用網(wǎng)絡分析并將其導入Cytoscape計算網(wǎng)絡及各個節(jié)點的拓撲特性。
表2 下調(diào)差異表達基因 (TOP10)
表3 上調(diào)差異表達基因GO分析
表4 上調(diào)差異表達基因KEGG分析
表5 下調(diào)差異表達基因GO分析
表6 下調(diào)差異表達基因KEGG分析
結(jié)果顯示,125個基因編碼的蛋白產(chǎn)物參與了蛋白質(zhì)相互作用網(wǎng)絡圖的構(gòu)建,其中大部分蛋白間都存在著相互作用,且有多個蛋白位于網(wǎng)絡的中心,與周圍蛋白關(guān)系密切。該蛋白質(zhì)相互作用網(wǎng)絡圖由125個節(jié)點310條邊組成,最大度值為16,最小度值為2,平均度值為(4.96±2.14)。本研究采用度數(shù)≥均數(shù)+ISD的蛋白所對應的基因為關(guān)鍵基因,他們共有9個,分別是KRT14、KRT16、KRT1、EGFR、KIT、DSP、DSG1、PKP1、KLK7見圖1,其對維持網(wǎng)絡結(jié)構(gòu)的穩(wěn)定至關(guān)重要。
黑色素瘤的死亡率長期以來都位居皮膚腫瘤的首位,而轉(zhuǎn)移是導致黑色素瘤患者死亡的主要原因之一。目前黑色素瘤轉(zhuǎn)移發(fā)生的具體機制尚未完全清楚,可能涉及多個方面,因此從分子水平揭示黑色素瘤轉(zhuǎn)移的本質(zhì),研究黑色素瘤轉(zhuǎn)移相關(guān)基因成為了黑色素瘤研究的熱點之一?;蛐酒夹g(shù)是一種高通量、大量、快速、準確分析基因表達的工具,能夠在不同條件、不同細胞類型、不同干預手段、不同細胞生長階段及狀態(tài)下對基因芯片做出相應的檢測并產(chǎn)生海量的數(shù)據(jù),使筆者能夠運用生物信息學的方法對其進行整合分析,同時挖掘潛在的隱藏信息,從而為探索黑色素瘤轉(zhuǎn)移的發(fā)生機制提供有利的線索。
本研究通過BRB-Array Tools軟件對GEO數(shù)據(jù)庫中的黑色素瘤轉(zhuǎn)移相關(guān)基因芯片數(shù)據(jù)(GSE8401)進行分類比較,共發(fā)現(xiàn)差異表達基因169個,其中上調(diào)133個,下調(diào)36個。為了了解這些差異表達基因的生物學功能,筆者應用了DAVID在線軟件對其進行了GO富集分析和KEGG通路分析,結(jié)果顯示上調(diào)差異表達基因主要集中在集中在表皮生長、角質(zhì)形成細胞分化、信號傳導、單個組織細胞間黏附、角化作用、細胞骨架構(gòu)成等生物學過程以及在Rap1信號通路、黑素合成、酪氨酸代謝、腎素分泌、p53信號通路、細胞間隙連接等通路,下調(diào)差異表基因主要集中在肥大細胞分化、細胞間嗜同性黏附、交感神經(jīng)分化、胚胎造血、對雌激素的應答、角質(zhì)形成細胞分化等生物學過程以及細胞外基質(zhì)受體作用、脂肪酸降解、谷胱甘肽代謝等通路。該分析結(jié)果提示這些生物學過程和信號通路的變化可能在黑色素瘤的轉(zhuǎn)移過程中發(fā)揮著重要的作用。對這些生物學過程及信號通路中涉及的基因進一步分析發(fā)現(xiàn),他們之間存在著交集基因如EGFR、CDH1、CALML5、DCT、SPP1等,意味著這些基因可能在黑色素瘤的轉(zhuǎn)移中起著協(xié)同作用,共同促進疾病的發(fā)生、發(fā)展。目前普遍認為黑色素瘤轉(zhuǎn)移是一個多基因參與、多因素作用、多階段發(fā)展的復雜過程,筆者的分析結(jié)果也證實這一觀點,而這些異常的基因可能是未來治療黑色素瘤轉(zhuǎn)移的潛在靶點。
圖1 差異表達基因蛋白質(zhì)相互作用網(wǎng)絡圖
基于STRING在線數(shù)據(jù)庫,筆者對黑色素瘤轉(zhuǎn)移差異表達基因進行了蛋白質(zhì)相互作用網(wǎng)絡分析,發(fā)現(xiàn)125個基因蛋白產(chǎn)物參與了蛋白質(zhì)相互作用網(wǎng)絡圖的構(gòu)建,他們之間以線連接,且部分作為中心節(jié)點與周圍的基因產(chǎn)物關(guān)系密切。本研究利用生物信息學工具篩選出了網(wǎng)絡中的關(guān)鍵基因,他們是KRT14、KRT16、KRT1、EGFR、KIT、DSP、DSG1、PKP1、KLK7。其中,EGFR和KIT與黑色素瘤的研究在現(xiàn)有的文獻報道中較多,而其他7個關(guān)鍵基因由于缺乏足夠多的文獻資料支持,有待以后更多的相關(guān)研究驗證。
EGFR是一種具有酪氨酸激酶活性的跨膜糖蛋白受體,在黑色素瘤中MAPK和P13K/AKT信號通路是其下游的2個最主要的信號通路[4]。當EGFR被配體或自身突變磷酸化激活后,啟動細胞內(nèi)的信號傳導,經(jīng)過細胞質(zhì)中的銜接蛋白和酶級聯(lián)反應,導致MAPK信號通路持續(xù)活化以及P13K/AKT信號通路的激活,從而促進了黑色素瘤的增殖、分化、遷移、黏附以及血管生成,進而加速了黑色素瘤的轉(zhuǎn)移。Huang等[5]發(fā)現(xiàn)在人黑色素瘤細胞系的裸鼠實驗中EGFR的過表達與黑色素瘤的自發(fā)性轉(zhuǎn)移存在一定的相關(guān)性。Slominski等[6]也發(fā)現(xiàn)EGFR在黑色素瘤中的表達增加會促進腫瘤的侵襲和轉(zhuǎn)移。此外,Udart等[7]同樣證實了EGFR活性隨黑素瘤的發(fā)生發(fā)展及轉(zhuǎn)移逐漸增強。以上均說明EGFR在黑色素瘤的轉(zhuǎn)移中發(fā)揮了重要的作用,與本研究分析所得到的結(jié)果一致。
KIT是是Ⅲ型酪氨酸激酶受體家族中的成員,在其配體干細胞因子(SCF)激活KIT的胞外區(qū)域后,受體發(fā)生二聚化,經(jīng)過特定的酪氨酸殘端自身磷酸化或細胞內(nèi)活化的酪氨酸激酶結(jié)構(gòu)域,激活下游信號從而加速黑素細胞的形成、血細胞的形成、生殖細胞的發(fā)生以及肥大細胞的功能[8]。Monsel等[9]在黑色素瘤細胞系的實驗中發(fā)現(xiàn),KIT中K642E和L576P點突變會導致Ras/Raf/Mek/Erk信號通路的激活,從而刺激了黑色素瘤細胞的增殖和遷移。Minor等[10]則發(fā)現(xiàn)在黑色素瘤從原發(fā)部位到遠處轉(zhuǎn)移的不同階段中,KIT的表達是逐漸下調(diào)的,表明這種下調(diào)可能致使黑色素瘤的預后不良。Kong等[11]同樣發(fā)現(xiàn)了存在KIT基因突變的黑色素瘤患者中位生存期(30個月)遠低于不存在此突變的患者的中位生存期(53個月)。這些都提示了KIT基因的突變與黑色素瘤的轉(zhuǎn)移與預后緊密相連,對于疾病的預測以及預后的判斷有一定的臨床意義。
綜上所述,本研究采用了生物信息學的方法對GEO數(shù)據(jù)庫中的黑色素瘤轉(zhuǎn)移相關(guān)基因芯片數(shù)據(jù)(GSE8401)進行了二次挖掘,成功篩選出196個差異表達基因,經(jīng)GO功能注釋和KEGG通路分析,為黑色素瘤轉(zhuǎn)移的實驗室研究提供了理論依據(jù)。此外,通過構(gòu)建蛋白質(zhì)互作網(wǎng)絡圖,得到了9個關(guān)鍵基因,其中EGFR和KIT的研究提示了其在黑色素瘤轉(zhuǎn)移過程中的重要地位,而其他7個關(guān)鍵基因在黑色素瘤轉(zhuǎn)移中的作用尚未明確,待人們進一步研究驗證和挖掘。
[1] Jemal A,Bray F,Center MM,et al.Global cancer statistics[J].CA Cancer JClin,2011,61:69-90.
[2] 陳文靜.惡性黑素瘤的治療新進展 [J].醫(yī)學綜述,2013,19:54-56.
[3] Villasenor-Park J,Ortega-Loayza AG.Microarray technique, analysis,and appliance in dermatology[J].JInvest Dermatol,2013, 133:e7.
[4] Boone B,Jacobs K,Ferdinande L,et al.EGFR in melanoma: clinical significance and potential therapeutic target[J].JCutan Pathol,2011,38:492-502.
[5] Huang TS,Rauth S,DasGupta TK.Overexpressian of EGF receptor isassociated with spontaneousmetastasesofahumanmelanoma cell line in nudemice[J].Anticancer Res,1996,16:3557-3563.
[6] Slominski A,Ross J,Mihm MC.Cutaneousmelanima:pathology, relevant prognostic indicators and progression[J].Br Med Bull, 1995,51:548-569.
[7] Udart M,Utikal J,Krahn GM,et al.Chromosome 7 aneusomy.A marker for metastatic melanoma?Expression of the epidermal growth factor receptor gene and chromosome 7 aneusomy in nevi, primarymalignantmelanoma andmetastases[J].Neoplaia,2001,3: 245-254.
[8] Roskoski R Jr.Signaling by Kit protein-tyrosine kinase-the stem cell factor receptor[J].Biochem Biophys Res Commun,2005,337: 1-13.
[9] Monsel G,Ortonne N,Bagot M,et al.c-Kit mutants require hypoxia-inducible factor1 alpha to transform melanocyte[J].Oncogene,2010,29:227-236.
[10]Minor DR,Kashani-SabetM,GarridoM,etal.Sunitinib therapy for melanoma patientswith KITmutations[J].Clin Cancer Res,2012, 18:1457-1463.
[11]Kong Y,Si L,Zhu Y,etal.Large-scale analysisof KIT aberrations in Chinese patientswith melanoma[J].Clin Cancer Res,2011,17: 1684-1691.(收稿日期:2016-11-09)
·消息·
Bioinformatic Analysisof Differentially Expressed Genes in M etastatic M elanoma
Wu Xing,Yuan Dingfen
ShanghaiSixth People's Hospital,Shanghai Jiaotong University,Shanghai200233,China
Objective In order to provide theoretical base for themechanism of the developmentofmelanoma by screening differential genes related to this tumor based on bioinformatics analysis.M ethods In this research,we chose melanoma microarray datasets from GEO.After pre-processing the data,we used unpaired t-test to screen differential genes.We used tools in DAVID Software for GO analysis and KEGG pathway analysis,imported STRING online database for protein-protein interaction network analysis,and computed the network topology through Cytoscape software.Results We found 169 differentially expressed genes in melanoma in which 133 were up-regulated and 36 were down-regulated.GO analysis indicated thatmost of genes were enriched in keratinocyte differentiation,cell adhesion,mast cell differentiation,Rap1 signaling pathway and p53 signaling pathway.STRING software screened nine key genes including KRT14,KRT16,KRT1, EGFR,KIT,DSP,DSG1,PKP1 and KLK7.Conclusion The internalbiological information inmelanoma can be revealed by bioinformaticmethods,providing direction for further research inmetastaticmelanoma.
Melanoma;Bioinformatics;Microarray;BRBArray Tools
R739.5
:A
:1672-0709(2017)03-0197-05