胡躍兵,李彭平(.南京大學醫(yī)學院附屬金陵醫(yī)院神經(jīng)外科,江蘇南京 000;.南京大學生命科學院,江蘇南京 003)
基因表達是調(diào)控子共同作用使特定的mRNA維持在穩(wěn)定水平的過程。其中一類調(diào)控子是轉(zhuǎn)錄因子,它通過結(jié)合在其調(diào)控基因的啟動子區(qū),促進或抑制該基因的轉(zhuǎn)錄。它在調(diào)控細胞生長和凋亡中起到重要作用。很多轉(zhuǎn)錄因子還可作為疾病治療的靶標[1]。而microRNA(miRNA)則是通過抑制mRNA表達或促進mRNA降解,在轉(zhuǎn)錄后水平調(diào)解基因的表達[2]。由此,轉(zhuǎn)錄因子和miRNA分別通過在轉(zhuǎn)錄水平和轉(zhuǎn)錄后水平調(diào)控基因表達,從而在影響基因功能過程中發(fā)揮重要作用。而轉(zhuǎn)錄因子本身的表達在其轉(zhuǎn)錄后水平也受到miRNA的調(diào)控,而miRNA自身的轉(zhuǎn)錄也要接受轉(zhuǎn)錄因子的調(diào)控。因此,細胞內(nèi)基因的表達系統(tǒng)實際上是由轉(zhuǎn)錄因子、miRNA以及它們靶基因之間組成的一個復雜的調(diào)控網(wǎng)絡(luò)。許多研究表明,特定生物學功能的實現(xiàn)是由一個包含多種相似功能分子的功能模塊完成的。模塊內(nèi)部分子功能的相似度高于模塊之間分子功能的相似度,并且分子在模塊內(nèi)的連接度遠遠高于模塊間分子之間的連接度[3]。轉(zhuǎn)錄調(diào)控模塊是由不同調(diào)控子調(diào)控特定靶基因集或同一類調(diào)控子調(diào)控不同靶基因集而形成的一個調(diào)控子網(wǎng),是多個基因及其產(chǎn)物之間相互作用形成轉(zhuǎn)錄模塊的結(jié)果[4]。研究轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)模塊結(jié)構(gòu)有利于進一步了解細胞的轉(zhuǎn)錄調(diào)控、細胞分化及其功能。
組織特異性基因的表達在組織的發(fā)育、細胞類型、功能和轉(zhuǎn)錄調(diào)控中起到重要作用[5]。在已經(jīng)識別的miRNA中,有很多表現(xiàn)出了組織特異性或發(fā)育階段特異性的表達模式,并維持組織的特點和功能[6]。并且由轉(zhuǎn)錄因子形成的調(diào)控網(wǎng)絡(luò)會控制組織特異性基因的表達。組織特異性的轉(zhuǎn)錄因子和miRNA對于組織特異性的調(diào)控和功能極其重要?;蜣D(zhuǎn)錄表達過程實際上是調(diào)控子和靶基因之間形成功能模塊作用的結(jié)果。由單個基因的組織特異性的表達調(diào)控的研究上升到模塊的組織特異性調(diào)控模式的挖掘,可以進一步加深對基因組織特異性轉(zhuǎn)錄調(diào)控和組織功能的理解。為此,筆者從人體的7個組織調(diào)控網(wǎng)絡(luò)出發(fā),通過MCODE算法獲得各個組織的調(diào)控模塊,再通過計算模塊間共有的節(jié)點數(shù)目獲得組織間相似的模塊或組織特異性模塊,從而獲得組織特異性的調(diào)控模式。
1.1 各組織表達譜數(shù)據(jù)來源 從UniGene[7]和 CGAP[8]獲取人體的大腦、心臟、腎臟、肝臟、卵巢、脾和睪丸7個組織的蛋白質(zhì)編碼基因(包括TF和non-TF)的表達譜數(shù)據(jù),而miRNA的表達譜數(shù)據(jù)則取自Landgraf等[6]的研究。
1.2 網(wǎng)絡(luò)構(gòu)建 通過以下方式構(gòu)建包括人體大腦、心臟、腎臟、肝臟、卵巢、脾和睪丸7個組織的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)(TRN):首先在人基因組范圍內(nèi)預測TF、miRNA以及非蛋白質(zhì)編碼基因之間的調(diào)控關(guān)系,獲得人的參考網(wǎng)絡(luò),然后通過對應組織的表達譜數(shù)據(jù)得到在7個組織中表達的基因,并從參考網(wǎng)絡(luò)中獲取這些基因之間的調(diào)控關(guān)系從而構(gòu)建各個組織網(wǎng)絡(luò)。在參考網(wǎng)絡(luò)中,TF與靶基因之間的調(diào)控關(guān)系是先通過TRANSFAC數(shù)據(jù)庫[9]找到靶基因上游1 kb的序列,之后在該段序列內(nèi)尋找TF的靶點,該研究選取的是5個物種(人、狗、牛、小鼠和負鼠)保守的結(jié)果。而miRNA與靶基因之間的調(diào)控關(guān)系是通過取 Targetscan[10]、Pictar[11]和 Tarbase[12]3個預測結(jié)果的交集得到。
1.3 組織模塊挖掘 生物網(wǎng)絡(luò)可以直觀地看成一個圖形,圖形節(jié)點和邊分別表示生物分子和分子之間的關(guān)系。對于轉(zhuǎn)錄調(diào)控,則可以理解為一個有向的信號傳遞流,用有向圖表示。一般從圖中尋找子簇或局部緊密連接區(qū)域主要是依賴于網(wǎng)絡(luò)流最小割理論或譜聚類。MCODE[13]是用節(jié)點聚類系數(shù)大小作為節(jié)點權(quán)重的衡量,從網(wǎng)絡(luò)中獲取分子復合體的模塊挖掘方法。該算法主要分為節(jié)點權(quán)重計算、復合體預測、通過一定規(guī)則對復合體增加或減少節(jié)點3個階段。MCODE在挖掘模塊時會給每個模塊計算一個得分并按照該得分對模塊進行排序。模塊得分越高,則排位越靠前,該模塊內(nèi)部連接也更加緊密。
1.4 模塊相似性得分 用公式(1)計算模塊相似性,式中N1、N2分別表示模塊1和模塊2的節(jié)點數(shù),C表示2個模塊共有節(jié)點個數(shù)。當2個模塊節(jié)點大小和類型完全相同時,R等于1,表示2個模塊完全相同。當2個模塊之間的節(jié)點都不同時,共有節(jié)點數(shù)目C為0,此時R等于0。當R越接近1時,模塊越相似。
得到模塊相似得分后,以該得分作為模塊間的距離,對模塊進行系統(tǒng)聚類。聚類到一起的模塊就是組織間相似的模塊,而單個成簇的模塊就是組織特異性模塊。
2.1 組織模塊 通過MCODE算法對人體7個組織的調(diào)控網(wǎng)絡(luò)進行挖掘,得到大腦、心臟、腎臟、肝臟、卵巢、脾和睪丸的模塊數(shù)目分別是 20、11、15、12、16、16 和 15(表 1)。得到模塊后,統(tǒng)計模塊中調(diào)控子的組成情況,發(fā)現(xiàn)所有組織大部分模塊的調(diào)控子都包含轉(zhuǎn)錄因子和miRNA,只有少數(shù)模塊里面的調(diào)控子只是轉(zhuǎn)錄因子或miRNA(表2),說明模塊的作用模式主要是轉(zhuǎn)錄因子和miRNA協(xié)同調(diào)控,這與前人的研究結(jié)果“轉(zhuǎn)錄因子和miRNA在乳腺癌和前列腺癌中共同調(diào)控基因的表達”[14]是一致的。
表1 網(wǎng)絡(luò)邊的大小和模塊數(shù)目
表2 模塊的作用模式
計算每2個組織每2個模塊之間的相似性得分。例如,計算大腦和心臟模塊的相似性,則將大腦20個模塊分別和心臟的11個模塊一一進行計算。之后將組織相似性得分作為距離,對模塊進行系統(tǒng)聚類。105個模塊共聚為40類(圖1)。其中,卵巢的第14個模塊、腎臟的第14和第15個模塊、心臟的第10個模塊都各自聚類成一個簇,說明該4個模塊和其他模塊相似性很低,因此將其定義為組織特異性模塊。
2.2 腎臟組織特異性模塊 腎臟的第15個模塊(圖2)包含調(diào)控子 MTF1、hsa-miR-651、hsa-miR-708以及靶基因RAP1B和MTMR3。在該模塊中,hsa-miR-651和 hsa-miR-708共同調(diào)控RAP1B和MTMR3的表達,同時hsa-miR-651又調(diào)控轉(zhuǎn)錄因子MTF1的表達。RAP1B是RAS-like小GTP結(jié)合蛋白超家族成員之一,其主要功能是調(diào)控細胞粘附、生長、分化、遷移增殖以及整合素介導的細胞信號轉(zhuǎn)導[15]。有研究表明由RAP1B參與的cAMP/Rap1B/B-Raf通路可以調(diào)控結(jié)節(jié)性硬化癥腎細胞癌p27的表達和p27-cyclin D1的細胞質(zhì)的錯誤定位,從而影響腎細胞癌的發(fā)生和癌癥的預后[16]。KEGG通路分析顯示,RAP1家族與腎細胞癌通路密切相關(guān)[17]。RAP1家族主要通過細胞粘附、增殖和遷移而參與到腎細胞癌通路中(圖3)。Hsa-miR-708被發(fā)現(xiàn)在腎細胞癌中能夠誘導細胞凋亡并抑制腫瘤生長,是腎細胞癌中非常重要的腫瘤抑制子[18]。MTF1是一種核質(zhì)穿梭作為轉(zhuǎn)錄因子,聚集在細胞核內(nèi)并結(jié)合到含有金屬反應元件(MRE)啟動子上,主要是誘導金屬硫蛋白及其他維持金屬穩(wěn)態(tài)相關(guān)蛋白的表達。而金屬硫蛋白主要功能是抵抗重金屬、清除自由基,許多研究表明其表達異常與腫瘤密切相關(guān),已經(jīng)作為結(jié)腸直腸癌和前列腺癌診斷的分子標記物[19]。綜上所述,RAP1B和has-miR-708都與癌癥密切相關(guān),根據(jù)模塊中分子功能相似性特點推測 hsa-miR-651可能是和has-miR-708協(xié)同調(diào)控RAP1B和MTMR3的表達。而has-miR-651又調(diào)控轉(zhuǎn)錄因子MTF1的表達,該轉(zhuǎn)錄因子又進一步作用于金屬硫蛋白等相關(guān)蛋白,這些轉(zhuǎn)錄因子和miRNA形成的調(diào)控通路可能在腎細胞癌的形成發(fā)展中起重要作用。該模塊中的節(jié)點及其調(diào)控關(guān)系需要通過試驗進一步證實。
2.3 心臟組織特異性模塊 心臟的第10個模塊由GSK3B、CPEB3、hsa-miR-196b和轉(zhuǎn)錄因子HAND1組成(圖4),在系統(tǒng)聚類中獨自成簇,是心臟的一個組織特異性模塊。HAND1是心臟特異性轉(zhuǎn)錄因子,主要功能是參與血管生成、發(fā)育以及肌肉組織形成。并且在心室隔和心臟形態(tài)學形成中也起著重要作用。HAND1和其另外一個家族成員以互補的方式工作,調(diào)節(jié)右心室和主動脈弓動脈的形成,提示HAND1和其家族成員可能會介導為先天性心臟病。Hatemi等研究表明HAND1序列的變異在心房異構(gòu)的發(fā)生和發(fā)展中可能起重要作用[20]。而在先天性心臟病中也發(fā)現(xiàn)HAND1等基因的拷貝數(shù)變異,這些變異可能與心臟功能缺陷緊密相關(guān)[21]。
GSK3B是一種絲氨酸蘇氨酸激酶,屬于糖原合酶激酶亞家族,是為數(shù)不多的信號分子,調(diào)節(jié)關(guān)鍵的細胞內(nèi)信號轉(zhuǎn)導通路。在大鼠的胚胎發(fā)育過程中,GSK3B的缺失會導致胚胎干細胞中受損的心肌細胞的分化并促使心肌細胞顯著增生,從而使心室被心肌細胞填充[22]。研究表明,GSK3B是調(diào)節(jié)心肌纖維化的重要調(diào)控子,心臟成纖維細胞中GSK-3β特異性缺失會導致心臟纖維化、左心室功能障礙和在缺血性心臟中產(chǎn)生過多的疤痕[23]。
Hsa-miR-196b主要功能是參與粒細胞生成、脂質(zhì)代謝和造血功能[24]。而粒細胞升高會導致心內(nèi)膜炎和心肌病。CPEB3、hsa-miR-196b可能也與心室隔形成、心肌細胞功能相關(guān)。具體作用機制可能是hsa-miR-196b作用于轉(zhuǎn)錄因子HAND1,HAND1再作用于GSK3B,該調(diào)控通路在心室隔的形成、維持心肌細胞正常功能中發(fā)揮重要作用,需要通過試驗進一步證實。
通過構(gòu)建人體7個組織的調(diào)控網(wǎng)絡(luò),并對各調(diào)控網(wǎng)絡(luò)進行模塊挖掘與比較分析,得到了與腎癌密切相關(guān)的腎臟特異性功能模塊,以及和室間隔的形成有關(guān)并參與心肌細胞功能的心臟特異性模塊。這些模塊中的基因以及基因之間的調(diào)控關(guān)系對于相應組織疾病的治療可能有重要作用。
[1]WESTON V.Large scale screening for DNA damage-induced transcription factors as potential targets for treatment of CLL with p53 apoptotic defect[J].Blood,2009,114(22):1336.
[2]ERHARD F,HAAS J,LIEBER D,et al.Widespread context dependency of microRNA-mediated regulation[J].Genome Res,2014,24(6):906 -919.
[3]TORNOW S,MEWES H W.Functional modules by relating protein interaction networks and gene expression[J].Nucleic Acids Res,2003,31(21):6283-6289.
[4]SEGAL E,F(xiàn)RIEDMAN N,KOLLER D,et al.A module map showing conditional activity of expression modules in cancer[J].Nat Genet,2004,36(10):1090-1098.
[5]NIEHRS C,POLLET N.Synexpression groups in eukaryotes[J].Nature,1999,402(6761):483 -487.
[6]LANDGRAF P,RUSU M,SHERIDAN R,et al.A mammalian microRNA expression atlas based on small RNA library sequencing[J].Cell,2007,129(7):1401-1414.
[7]SAYERS E W,BARRETT T,BENSON D A,et al.Database resources of the national center for biotechnology information[J].Nucleic Acids Res,2012,36:13 -21.
[8]LASH A E,TOLSTOSHEV C M,WAGNER L,et al.SAGEmap:A public gene expression resource[J].Genome Res,2000,10(7):1051 -1060.
[9]WINGENDER E.The TRANSFAC project as an example of framework technology that supports the analysis of genomic regulation[J].Briefings in Bioinformatics,2008,9(4):326 -332.
[10]LEWIS B P,SHIH I H,JONES-RHOADES M,et al.Prediction of mammalian microRNA targets[J].Cell,2003,115(7):787 -798.
[11]KREK A,GRUN D,POY M N.Combinatorial microRNA target predictions[J].Nature Genetics,2005,37(5):495 -500.
[12]SETHUPATHY P,CORDA B,HATZIGEORGIOU A G.TarBase:A comprehensive database of experimentally supported animal microRNA targets[J].RNA,2006,12(2):192 -197.
[13]BADER G D,HOGUE C W.An automated method for finding molecular complexes in large protein interaction networks[J].BMC Bioinformatics,2003,4:2.
[14]WU J H,SUN Y J,HSIEH P H,et al.Inferring coregulation of transcription factors and microRNAs in breast cancer[J].Gene,2013,518(1):139-144.
[15]DUBE N,KOOISTRA M R,PANNEKOEK W J,et al.The RapGEF PDZGEF2 is required for maturation of cell-cell junctions[J].Cellular Signalling,2008,20(9):1608 -1615.
[16]COHEN J D,THAM K Y,MASTRANDREA N J,et al.cAMP-dependent cytosolic mislocalization of p27(kip)-cyclin D1 during quinol-thioetherinduced tuberous sclerosis renal ceu carcinoma[J].Toxicol Sci,2011,122(2):361-371.
[17]KANEHISA M,GOTO S,SATO Y,et al.Data,information,knowledge and principle:Back to metabolism in KEGG[J].Nucleic Acids Research,2014,42(D1):199 -205.
[18]BIRKHAUSER F D,KOYA R C,NEUFELD C,et al.Dendritic cell-based immunotherapy in prevention and treatment of renal cell carcinoma:Efficacy,safety,and activity of Ad-GM.CAIX in immunocompetent mouse models[J].J Immunother,2013,36(2):102 -111.
[19]ARRIAGA J M,BRAVO I A,BRUNO L,et al.Combined metallothioneins and p53 proteins expression as a prognostic marker in patients with Dukes stage B and C colorectal cancer[J].Human Pathology,2012,43(10):1695-1703.
[20]HATEMI A C,GULEC C C ,CINE N,et al.Sequence variations of NKX2-5 and HAND1 genes in patients with atrial isomerism[J].Anadolu Kardiyoloji Dergisi-the Anatolian Journal of Cardiology,2011,11(4):319-328.
[21]GOLDMUNTZ E,PALURU P,GLESSNER J,et al.Microdeletions and microduplications in patients with congenital heart disease and multiple congenital anomalies[J].Congenital Heart Disease,2011,6(6):592 -602.
[22]KERKELA R,KOCKERITZ L,MACAULAY K,et al.Deletion of GSK-3beta in mice leads to hypertrophic cardiomyopathy secondary to cardiomyoblast hyperproliferation[J].J Clin Invest,2008,118(11):3609 -3618.
[23]LAL H,AHMAD F,WOODGETT J,et al.The GSK-3 family as therapeutic target for myocardial diseases[J].Circulation Research,2015,116(1):138-149.
[24]LU M,ZHANG Q,DENG M,et al.An analysis of human microRNA and disease associations[J].PLoS One,2008,3(10):3420.