胡昕倩 余雅婕 方明
摘要:目的 ?應(yīng)用生物信息學(xué)技術(shù)篩選參與垂體瘤發(fā)生發(fā)展過程中的關(guān)鍵基因及通路,為垂體瘤治療提供新靶點(diǎn)。方法 ?基于基因表達(dá)微陣列芯片數(shù)據(jù)集GSE51618及GSE26966,使用在線分析工具GEO2R篩選差異表達(dá)基因,利用GeneOntology(GO)和Kyoto Encyclopedia of Genes and Genomes(KEGG)對(duì)差異基因的功能進(jìn)行富集分析,通過STRING及Cytoscape構(gòu)建蛋白-蛋白相互作用網(wǎng)絡(luò)并篩選出關(guān)鍵基因及預(yù)測(cè)關(guān)鍵轉(zhuǎn)錄因子。結(jié)果 ?共篩選到符合條件的差異表達(dá)基因354個(gè),其中共同上調(diào)基因296個(gè),共同下調(diào)基因58個(gè)。GO富集分析顯示其主要參與細(xì)胞表面受體信號(hào)通路、細(xì)胞增殖等生物學(xué)過程。KEGG富集通路分析發(fā)現(xiàn)其富集于PI3K-Akt信號(hào)通路、催乳素信號(hào)通路、MAPK信號(hào)通路、多巴胺能神經(jīng)突觸、細(xì)胞周期調(diào)控等信號(hào)通路上。共篩選出RIPK4、POMC、ESR1、EGR1、GNB3、FOS、TF7個(gè)可能為誘導(dǎo)垂體瘤發(fā)生發(fā)展的關(guān)鍵基因,并預(yù)測(cè)出SP1、LHX3等調(diào)控差異基因的關(guān)鍵轉(zhuǎn)錄因子。結(jié)論 ?通過生物信息學(xué)對(duì)差異基因和關(guān)鍵基因進(jìn)行分析,有助于揭示垂體瘤發(fā)生發(fā)展的重要分子機(jī)制,為其治療提供新靶點(diǎn)。
關(guān)鍵詞:垂體瘤;基因芯片;生物信息學(xué)
中圖分類號(hào):R736.4 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2020.06.026
文章編號(hào):1006-1959(2020)06-0090-03
Abstract:Objective ?To apply bioinformatics technology to screen key genes and pathways involved in the occurrence and development of pituitary tumors, and to provide new targets for the treatment of pituitary tumors. Methods ?Based on the gene expression microarray chip datasets GSE51618 and GSE26966, the online analysis tool GEO2R was used to screen differentially expressed genes. GeneOntology (GO) and Kyoto Encyclopedia of Genes and Genomes (KEGG) were used to enrich the function of the differential genes. Through STRING and Cytoscape constructs a protein-protein interaction network and screens out key genes and predicts key transcription factors.Results ?In this study, a total of 354 eligible differentially expressed genes were screened, of which 296 genes were up-regulated and 58 genes were down-regulated. GO enrichment analysis showed that it was mainly involved in biological processes such as cell surface receptor signaling pathways and cell proliferation. Analysis of the KEGG enrichment pathway found that it was significantly enriched in signal pathways such as the PI3K-Akt signaling pathway, prolactin signaling pathway, MAPK signaling pathway, dopaminergic synapses, and cell cycle regulation. A total of RIPK4, POMC, ESR1, EGR1, GNB3, FOS, and TF7 were screened as key genes for inducing the development of pituitary tumors, and key transcription factors such as SP1 and LHX3 that regulate differential genes were predicted.Conclusion ?The analysis of differential genes and key genes through bioinformatics can help reveal the important molecular mechanism of pituitary tumor development and provide new targets for its treatment.
Key words:Pituitary tumor;Gene chip;Bioinformatics
垂體瘤(pituitary tumor)是一組從垂體前葉和后葉及顱咽管上皮殘余細(xì)胞發(fā)生的腫瘤,是顱內(nèi)常見腫瘤之一,其發(fā)病率約占顱內(nèi)腫瘤的10%~15%,且發(fā)病率逐漸升高[1]。雖然垂體瘤大多為良性,但由于分泌過多的激素及局部壓迫周圍組織出現(xiàn)一系列臨床癥狀和體征,嚴(yán)重影響患者的生活。雖然許多研究者開展大量的基礎(chǔ)和臨床實(shí)驗(yàn)來揭示垂體瘤發(fā)病的相關(guān)分子機(jī)制,但大部分的垂體瘤的發(fā)病機(jī)制存在爭議,為了揭示垂體瘤發(fā)生發(fā)展過程中關(guān)鍵基因和通路,本研究擬通過生物信息學(xué)的方法,將垂體瘤和正常垂體組織所產(chǎn)生的基因表達(dá)進(jìn)行比較,篩查出兩者差異表達(dá)的基因,并進(jìn)一步研究其所涉及的影響垂體瘤發(fā)生發(fā)展的相關(guān)基因和關(guān)鍵通路,從而加深人們對(duì)垂體瘤發(fā)病機(jī)制的了解,并為今后該病的研究提供新的方向。
1材料與方法
1.1數(shù)據(jù)集獲取與篩選 ?以“pituitary tumors(垂體瘤)”作為檢索詞,從GEO 數(shù)據(jù)庫(http:www.ncbi.Nlm.Nih.gov/geo)中檢索已公布人來源的垂體瘤基因芯片數(shù)據(jù)集,獲取兩個(gè)數(shù)據(jù)集GSE51618及GSE26966。GSE51618來源于北京神經(jīng)外科研究所,該數(shù)據(jù)集采用Agilent-014850 Whole Human Genome Microarray 4x44K G4112F平臺(tái),包含10個(gè)數(shù)據(jù)樣本,其中7個(gè)垂體瘤組織,3個(gè)正常垂體組織。GSE51618來源于科羅拉多大學(xué)丹佛分校,采用[HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array平臺(tái),分析23個(gè)數(shù)據(jù)樣本,包括14個(gè)垂體瘤組織和9個(gè)正常垂體組織。
1.2差異表達(dá)基因的分析 ?將垂體瘤組織樣本作為實(shí)驗(yàn)組,正常垂體組織樣本作為對(duì)照組。使用GEO數(shù)據(jù)庫的GEO2R在線分析工具分別對(duì)兩個(gè)基因芯片數(shù)據(jù)進(jìn)行差異表達(dá)基因的分析。篩選差異倍數(shù)>2且P<0.05的基因作為差異基因。并利用在線Veen圖軟件(http://bioinformatics.psb.ugent.be/webtools/Venn/)找出共同差異基因進(jìn)行分析。
1.3基因功能注釋和通路富集分析 ?利用在線David軟件(https://david.ncifcrf.gov/)中的GO分析和KEGG分析將篩選出來的差異基因進(jìn)行基因功能注釋和通路富集分析。P<0.05認(rèn)為差異具有統(tǒng)計(jì)學(xué)意義。
1.4蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建以及關(guān)鍵基因的篩選 ?通過上傳篩選出來的差異基因至在線String9.1軟件(http://string-db.org),構(gòu)建差異基因表達(dá)產(chǎn)物蛋白質(zhì)相互作用網(wǎng)絡(luò)。并利用Cytoscape3.6.1軟件中的插件Centiscape2.2篩選關(guān)鍵候選基因。關(guān)鍵基因篩選基于節(jié)點(diǎn)的度和中介性。在本研究中,我們?cè)O(shè)定度大于20且中介性數(shù)值大于3000,此節(jié)點(diǎn)對(duì)應(yīng)的基因被認(rèn)為是關(guān)鍵候選基因。
1.5差異基因轉(zhuǎn)錄因子預(yù)測(cè) ?進(jìn)入Tfacts數(shù)據(jù)庫(http://www.tfacts.org/),上傳上調(diào)或下調(diào)差異表達(dá)基因進(jìn)行轉(zhuǎn)錄因子篩選,參考P值、Q值、E值和FDR 值等4個(gè)指標(biāo)來預(yù)測(cè)關(guān)鍵的轉(zhuǎn)錄因子,一般認(rèn)為P-value,E-value,Q-value和FDR均<0.05表示差異具有統(tǒng)計(jì)學(xué)意義。
2結(jié)果
2.1差異基因篩選 ?利用GEO2R在線軟件分析垂體瘤組織與正常垂體組織的差異基因,GSE51618數(shù)據(jù)庫共篩選出差異表達(dá)2倍及以上的基因959個(gè),其中718個(gè)為上調(diào)表達(dá)基因,241個(gè)為下調(diào)表達(dá)基因。GSE26966數(shù)據(jù)庫共篩選出差異表達(dá)2倍及以上的基因1211個(gè),其中869個(gè)為上調(diào)表達(dá)基因,342個(gè)為下調(diào)表達(dá)基因。通過Venn圖找出共同差異基因354個(gè),包括上調(diào)基因296個(gè),下調(diào)基因58個(gè),見圖1。
2.2差異表達(dá)基因基因注釋和通路分析 ?用David數(shù)據(jù)庫對(duì)354個(gè)差異基因進(jìn)行GO分析,在生物過程方面,其差異基因功能主要集中于細(xì)胞表面受體信號(hào)通路、細(xì)胞增殖等生物過程。通過KEGG通路分析,垂體瘤的發(fā)生發(fā)展與PI3K-Akt信號(hào)通路、催乳素信號(hào)通路、MAPK信號(hào)通路、多巴胺能神經(jīng)突觸、細(xì)胞周期調(diào)控等通路密切相關(guān)。
2.3差異表達(dá)基因蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建和關(guān)鍵基因的篩選 ?將354個(gè)差異基因上傳至在線String 9.1軟件,構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò),然后將在線軟件String 9.1輸出數(shù)據(jù)結(jié)果導(dǎo)入至Cytoscape 3.6.1軟件中。利用其插件Centiscape 2.1將其網(wǎng)絡(luò)可視化,見圖2。其中網(wǎng)絡(luò)由239個(gè)節(jié)點(diǎn),592條邊組成,節(jié)點(diǎn)中介性最大值為8274.3189,最小值為0,平均值為573.4477。網(wǎng)絡(luò)中節(jié)點(diǎn)度數(shù)大于20與中介性同時(shí)大于3000的節(jié)點(diǎn)有7個(gè)。根據(jù)中介性數(shù)值從大到小排序依次為RIPK4、POMC、ESR1、EGR1、GNB3、FOS、TF,這些關(guān)鍵基因可能在垂體瘤發(fā)生及發(fā)展中發(fā)揮關(guān)鍵的調(diào)控作用,見表1。
2.4差異基因轉(zhuǎn)錄因子預(yù)測(cè) ?將差異基因上傳到Tfacts數(shù)據(jù)庫,分析124個(gè)轉(zhuǎn)錄因子可調(diào)控差異基因的轉(zhuǎn)錄過程。其中,SP1、LHX3、CREB1這3個(gè)轉(zhuǎn)錄因子調(diào)控的靶基因數(shù)量最多,是重要的候選轉(zhuǎn)錄因子,它們可能通過調(diào)控關(guān)鍵基因的轉(zhuǎn)錄過程來發(fā)揮重要的作用。
3討論
垂體瘤的發(fā)生與環(huán)境、行為方式和遺傳等多種因素有關(guān),雖然許多研究者開展大量的基礎(chǔ)和臨床實(shí)驗(yàn)來揭示垂體瘤發(fā)病的相關(guān)分子機(jī)制,但仍有95%垂體瘤仍然不知道其發(fā)病的病因。尋找新的特異性靶向分子作為治療的靶點(diǎn)成為當(dāng)今垂體瘤研究的熱點(diǎn)。
本研究通過生物信息學(xué)的方法,重點(diǎn)分析了垂體瘤發(fā)生發(fā)展差異基因的GO功能分類和KEGG富集通路,發(fā)現(xiàn)細(xì)胞表面受體信號(hào)通路、PI3K-Akt信號(hào)通路、MAPK信號(hào)通路參與了垂體瘤的發(fā)生發(fā)展。同時(shí)利用蛋白質(zhì)相互作用網(wǎng)絡(luò)分析挑選出7個(gè)關(guān)鍵基因RIPK4、POMC、ESR1、EGR1、GNB3、FOS、TF,其中RIPK4和GNB3對(duì)細(xì)胞的增殖生長發(fā)揮重要的調(diào)控作用,但在垂體瘤的發(fā)生發(fā)展的機(jī)制中的作用尚未研究。而SP1、LHX3、CREB1等轉(zhuǎn)錄因子可通過調(diào)節(jié)關(guān)鍵基因的轉(zhuǎn)錄過程而調(diào)控垂體瘤的發(fā)生發(fā)展。
酵母雙雜交實(shí)驗(yàn)中,RIPK4作為蛋白激酶Cβ1 和Cδ相交互的一種蛋白首次被發(fā)現(xiàn),它的全稱為受體相互作用蛋白激酶4,屬于蘇/絲氨酸蛋白激酶家族之一?;蚨ㄎ挥?1q22.3,廣泛表達(dá)于腎、肝、肺、骨骼肌和心臟等組織中。RIPK4是RIPKs家族成員中研究較少的一類,在 N 端上有高度保守的激酶結(jié)構(gòu)域,在C 端則有11 個(gè)重復(fù)的錨蛋白(ankyrin repeats kinase,ANK),而中間區(qū)域可以被caspases裂解。RIPK4的激酶活性在NF-kB和JNK通路活化起到關(guān)鍵作用,也參與調(diào)控RAF/MEK/ERK和 Wnt/beta-cateni信號(hào)通路[2]。最近研究表明,RIPK4可能是垂體無功能腺瘤致病驅(qū)動(dòng)基因,但其致病機(jī)制尚未研究[3]。本研究再次篩選出RIPK4作為垂體瘤致病關(guān)鍵基因,為其相關(guān)性提供有力的證據(jù)。
GNB3基因全稱G蛋白β3亞單位基因,位于人類12p13染色體。GNB3基因主要編碼β亞單位。在細(xì)胞外血管活性多肽、生長因子及細(xì)胞因子等的作用下,激活血管平滑肌細(xì)胞膜上的G蛋白,調(diào)控血管平滑肌細(xì)胞的舒縮、合成、分泌、分化、遷移和增生等功能,促進(jìn)血管生成,從而可能為腫瘤的生長提供營養(yǎng)供應(yīng),促進(jìn)腫瘤細(xì)胞的生長。但尚未發(fā)現(xiàn)該基因與垂體瘤發(fā)生的相關(guān)研究。
SP1蛋白是Sp/KLF家族的一員,在體內(nèi)廣泛表達(dá),它通過3個(gè)C2H2鋅指結(jié)構(gòu)域與DNA相互作用,而機(jī)體對(duì)它的表達(dá)水平及活性有著嚴(yán)格的調(diào)控。調(diào)控的主要方式可以為對(duì)Sp1蛋白的不同氨基酸位點(diǎn)的磷酸化和去磷酸化、O-糖基化等修飾來改變與DNA的結(jié)合活性,從而調(diào)控基因的表達(dá)[4]。且Sp1在腫瘤組織中的表達(dá)水平明顯高于周圍正常組織,與腫瘤的分期和預(yù)后不良相關(guān)。
LHX3是一種LIM同源結(jié)構(gòu)域的神經(jīng)內(nèi)分泌轉(zhuǎn)錄因子,最初在胚胎發(fā)育中的整個(gè)神經(jīng)系統(tǒng)表達(dá),之后則局限于內(nèi)陷的 Rathke 囊和成熟的垂體中[5]。它能結(jié)合垂體基因啟動(dòng)子和增強(qiáng)子區(qū)域的調(diào)控元件 ,增強(qiáng)FSHβ、αGSU、PRL 、TSHβ、GRHR和 Pit1啟動(dòng)子轉(zhuǎn)錄,促進(jìn)垂體組織中促性腺激素細(xì)胞、TSH細(xì)胞、GH細(xì)胞和 PRL細(xì)胞的生長和增殖,有利于垂體瘤的發(fā)生發(fā)展[6]。
總之,本研究通過生物信息學(xué)的方法對(duì)垂體瘤差異基因進(jìn)行分析,篩選出垂體瘤發(fā)生發(fā)展關(guān)鍵基因及預(yù)測(cè)關(guān)鍵轉(zhuǎn)錄因子,分析其可能存在的垂體瘤發(fā)病機(jī)制,為臨床治療垂體瘤提供新思路。
參考文獻(xiàn):
[1]Lim CT,Márta Korbonits.Update on the clinicopathology of pituitary adenomas[J].Endocrine Practice,2018,24(5):473-488.
[2]Liu JY,Zeng QH,Cao PG,et al.RIPK4 promotes bladder urothelial carcinoma cell aggressiveness by upregulating VEGF-A through the NF-κB pathway[J].British Journal of Cancer,2018,118(12):1617-1627.
[3]彭羿達(dá),王新慧,葛琳娜,等.應(yīng)用生物信息學(xué)鑒定無功能型垂體瘤驅(qū)動(dòng)基因及特效藥物篩選[J].腦與神經(jīng)疾病雜志,2019,27(7):442-450.
[4]Vizcaíno C,Mansilla S,Portugal J.Sp1 transcription factor:A long-standing target in cancer chemotherapy[J]. Pharmacology & Therapeutics,2015(152):111-124.
[5]Nicolas J,Pauline R,Mélanie P,et al.Heterozygous LHX3 mutations may lead to a mild phenotype of combined pituitary hormone deficiency[J].Eur J Hum Genet,2019(27):216-225.
[6]Yoshida S,Kato T,Nishimura N,et al.Transcription of follicle-stimulating hormone subunit genes is modulated by porcine LIM homeobox transcription factors, LHX2 and LHX3[J].Journal of Reproduction and Development,2016,62(3):241-248.
收稿日期:2020-02-05;修回日期:2020-03-05
編輯/錢洪飛