王 凡,徐世明,古同男,王宏娟
(首都醫(yī)科大學(xué)燕京醫(yī)學(xué)院生物化學(xué)與分子生物學(xué)教研室,北京 101300)
人血紅素加氧酶-1(hHO-1)是一種細(xì)胞保護(hù)酶,在內(nèi)體廣泛分布。血紅素可被hHO-1催化降解成膽綠素、CO和亞鐵離子[1]。研究表明,hHO-1與呼吸系統(tǒng)、消化系統(tǒng)、心血管系統(tǒng)、泌尿系統(tǒng)、神經(jīng)系統(tǒng)等疾病發(fā)生、發(fā)展密切相關(guān)[1-2]。有報(bào)道稱hHO-1啟動(dòng)子區(qū)(GT)n雙核苷酸重復(fù)多態(tài)性與腫瘤關(guān)系密切,較短的(GT)n雙核苷酸重復(fù)可能對(duì)食管鱗狀上皮細(xì)胞癌的發(fā)生起抑制作用,而較長(zhǎng)的(GT)n雙核苷酸重復(fù)可能會(huì)增加患食管鱗狀上皮細(xì)胞癌[2],口腔癌和心血管等疾病[3]的風(fēng)險(xiǎn)。本研究利用生物信息學(xué)方法,通過對(duì)hHO-1基因啟動(dòng)子轉(zhuǎn)錄因子結(jié)合位點(diǎn)及CpG島的預(yù)測(cè)分析,探討hHO-1啟動(dòng)子區(qū)與相關(guān)疾病的關(guān)系,旨在為今后研究hHO-1的生物學(xué)功能及調(diào)控機(jī)制提供有價(jià)值的信息。
hHO-1基因及啟動(dòng)子序列信息的獲?。好绹?guó)國(guó)立生物技術(shù)信息中心(NCBI)數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/)。TATA盒預(yù)測(cè)網(wǎng)站:Softberry(http://linux1.softberry.com/berry.phtml?topic=tssw & group=programs & subgroup=promoter)。轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)網(wǎng)站:PROMO(http://alggen.lsi.upc.es/cgi-bin/promo_v3/promo/promoinit.cgi?dirDB=TF_8.3),Gene regulation(http://gene-regulation.com/)。CpG島位置預(yù)測(cè)網(wǎng)站:CpGFinder(http://www.softberry.com/berry.phtml?topic=cpgfinder & group=programs & subgroup=promoter),MethPrimer(http://www.urogene.org/cgi-bin/methprimer/methprimer.cgi)。
1.2.1hHO-1基因及其啟動(dòng)子序列的獲取
在NCBI中搜索人HO-1基因,進(jìn)入GenBank獲取hHO-1基因序列。在Sequence text view中選取轉(zhuǎn)錄起始點(diǎn)上游3 000 bp的序列,將序列上傳至Nucleotide BLAST中進(jìn)行比對(duì),推測(cè)出啟動(dòng)子序列長(zhǎng)度。在Softberry中上傳啟動(dòng)子序列,預(yù)測(cè)TATA盒。
1.2.2hHO-1啟動(dòng)子轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)
登錄PROMO網(wǎng)站,在SelectSpecies選項(xiàng)中選擇Only human factors和Only human sites。點(diǎn)擊SearchSites按鈕,將啟動(dòng)子序列上傳至對(duì)話框中,設(shè)置Maximum matrix dissimilarity rate參數(shù)為5。登錄Gene regulation網(wǎng)站,選擇AliBaba2.1程序,設(shè)置Min mat.conservation參數(shù)為80%,上傳序列預(yù)測(cè)即可。
1.2.3hHO-1啟動(dòng)子CpG島預(yù)測(cè)
登錄MethPrimer網(wǎng)站,將Window值設(shè)置為200,其他數(shù)據(jù)為默認(rèn)值(Obp/Exp=0.6,GC%=50),上傳啟動(dòng)子和外顯子1及部分內(nèi)含子1序列進(jìn)行預(yù)測(cè)。用CpGFinder預(yù)測(cè)CpG島時(shí)使用默認(rèn)設(shè)置預(yù)測(cè)即可,具體數(shù)值設(shè)置同上。
Genbank中顯示hHO-1基因位于22q12.3,包含5個(gè)外顯子,登錄號(hào)為NC_000022,基因全長(zhǎng)13 112 bp,其轉(zhuǎn)錄出的mRNA全長(zhǎng)為1 554 nt,基因蛋白質(zhì)編碼區(qū)(CDS)編碼288個(gè)氨基酸。本研究選取轉(zhuǎn)錄起始點(diǎn)上游3 000 bp以內(nèi)的DNA序列進(jìn)行比對(duì)。Nucleotide BLAST比對(duì)結(jié)果顯示,所選取DNA序列的第1 006位脫氧核苷酸與信息庫(kù)中hHO-1基因啟動(dòng)子序列的第1位脫氧核苷酸比對(duì)上,可以確定hHO-1啟動(dòng)子區(qū)位于轉(zhuǎn)錄起始點(diǎn)上游1 995 bp以內(nèi),Genebank登錄號(hào)為AF145047.1(圖1)。Ⅱ類基因的啟動(dòng)子一般在轉(zhuǎn)錄起始位點(diǎn)上游-25~-30 bp附近存在TATA盒,富含AT序列,負(fù)責(zé)基因轉(zhuǎn)錄起始位點(diǎn)的定位,是RNA聚合酶的結(jié)合位點(diǎn)之一。Softberry預(yù)測(cè)結(jié)果顯示,在hHO-1啟動(dòng)子序列第1 963 bp處(即轉(zhuǎn)錄起始點(diǎn)上游33 bp處)存在TATA盒,見圖2。
圖1 hHO-1啟動(dòng)子區(qū)Nucleotide BLAST比對(duì)結(jié)果
圖2 hHO-1啟動(dòng)子區(qū)TATA盒
2.2.1PROMO預(yù)測(cè)結(jié)果
PROMO 3.0.2預(yù)測(cè)系統(tǒng)使用的是TRANSFAC數(shù)據(jù)庫(kù)8.3版本,經(jīng)預(yù)測(cè)并通過手工去重后得到57種轉(zhuǎn)錄因子結(jié)合位點(diǎn)(圖3),圖中顯示出各種轉(zhuǎn)錄因子及其與啟動(dòng)子的結(jié)合位置,其中GR-alpha、Pax-5、p53、GR-beta、TFII-I、FOXP3、RXR-alpha、C/EBPbeta、STAT4、TFIID、AP-2alphaA、WT1等轉(zhuǎn)錄因子結(jié)合位點(diǎn)的重復(fù)次數(shù)較高。
2.2.2AliBaba2.1預(yù)測(cè)結(jié)果
AliBaba2.1在線預(yù)測(cè)軟件使用的是TRANSFAC 4.0版本,經(jīng)預(yù)測(cè)并通過手工去重后得到31種轉(zhuǎn)錄因子結(jié)合位點(diǎn):AP-1、AP-2alpha、c-Myc、C/EBP、C/EBPalpha、C/EBPbeta、COUP、E1、ER、GATA-1、GLO、GCN4、Hb、HNF-1C、HNF-3、Id3、IRF-1、MEB-1、MyoD、NF-ATc3、NF-1、NF-kappaB、NF-muE1、Pit-1a、RAP1、RAR-alph、Sp1、T3R-alpha、TEC1、USF、YY1。將該結(jié)果與PROMO 3.0.2預(yù)測(cè)結(jié)果合并,經(jīng)去重后共得到79種轉(zhuǎn)錄因子結(jié)合位點(diǎn):AP-1、AP-2alph、AR、c-Ets-1、c-Ets-2、c-Fos、c-Jun、c-Myb、c-Myc、C/EBP、C/EBPalpha、C/EBPbeta、COUP、E1、E2F-1、Elk-1、ELF-1、ER、ER-alpha、FOXO4、FOXP3、GATA-1、GATA-2、GCN4、GCF、GLO、GR、GR-alpha、GR-betaHb、HNF-1C、HNF-3、HNF-3alpha、Id3、Ik-1、IRF-1、IRF-2、LEF-1、MEB-1、MyoD、NF-1、NF-AT1、NF-ATc3、NF-kappaB、NF-muE1、NF-Y、NFI/CTF、p53、Pax-5、PEA3、Pit-1a、PPAR-alpha∶RXR-alpha、PR-A、PR-B、PXR-1∶RXR-alpha、RAP1、RAR-alph、RAR-beta、RXR-alpha、Sp1、SRY、STAT1beta、STAT4、T3R-alpha、T3R-beta1、TBP、TEC1、TFII-I、TFIID、USF、USF1、USF2、VDR、WT1、WT1 I、WT1-KTS、WT1 I-KTS、WT1-del2、I-del2、YY1。預(yù)測(cè)結(jié)果中包括了兩大類反式作用因子的結(jié)合位點(diǎn)。一類是通用轉(zhuǎn)錄因子(TF),其中TFII作用因子又包含TFIIA、TFIIB、TFIID和TFIIE,這些轉(zhuǎn)錄因子涉及RNA聚合酶、順式作用元件和反式作用因子的相互作用,參與基因表達(dá)調(diào)控。第二類是特異轉(zhuǎn)錄因子,能對(duì)基本轉(zhuǎn)錄因子起增效作用,如SP1轉(zhuǎn)錄因子與啟動(dòng)子上GC盒結(jié)合后可使轉(zhuǎn)錄效率提高。
2.3.1MethPrimer預(yù)測(cè)結(jié)果
CpG島主要位于基因的啟動(dòng)子和第一外顯子區(qū)域,是富含CpG二核苷酸的一些區(qū)域,約有60%以上的基因啟動(dòng)子區(qū)含有CpG島。CpG島不僅是基因的一種標(biāo)志,而且還參與基因表達(dá)的調(diào)控。MethPrimer預(yù)測(cè)結(jié)果顯示hHO-1啟動(dòng)子區(qū)CpG島長(zhǎng)307 bp,位于1 857~2 163 bp;跨越啟動(dòng)子區(qū)末端,外顯子1及部分內(nèi)含子1上游序列,具體細(xì)節(jié)見圖4。
圖3 PROMO 3.0.2轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)結(jié)果
圖4 MethPrimer CpG島預(yù)測(cè)結(jié)果
2.3.2CpGFinder預(yù)測(cè)結(jié)果
在CpGFinder預(yù)測(cè)結(jié)果中同樣也預(yù)測(cè)到hHO-1存在CpG島,預(yù)測(cè)結(jié)果顯示hHO-1啟動(dòng)子區(qū)CpG島長(zhǎng)259 bp,位于1 870~2 128 bp(圖5);同樣跨越啟動(dòng)子區(qū)末端,外顯子1及部分內(nèi)含子1上游序列,長(zhǎng)度略短于MethPrimer的CpG島預(yù)測(cè)結(jié)果。
圖5 CpGFinder CpG島預(yù)測(cè)結(jié)果
hHO-1是一種具有免疫調(diào)節(jié)活性的防御酶,可被多種因素調(diào)控進(jìn)而影響表達(dá)結(jié)果[4]。其C端被裂解后,可轉(zhuǎn)移到細(xì)胞核內(nèi),參與由氧化應(yīng)激介導(dǎo)的轉(zhuǎn)錄調(diào)節(jié)作用[5]。此外血紅素經(jīng)hHO-1催化降解的產(chǎn)物分別具有抗炎[6]、抗增殖[7]和促血管舒張活性[8]等作用。目前,關(guān)于hHO-1啟動(dòng)子的研究主要在啟動(dòng)子多態(tài)性與疾病關(guān)系方面的研究較多。本研究從hHO-1啟動(dòng)子轉(zhuǎn)錄因子結(jié)合位點(diǎn)入手,探討其在抗逆方面的潛在作用。
通過在NCBI數(shù)據(jù)庫(kù)中進(jìn)行檢索比對(duì),獲得了hHO-1轉(zhuǎn)錄起始位點(diǎn)上游1 995 bp的啟動(dòng)子區(qū)域。Softberry的預(yù)測(cè)結(jié)果與理論情況相符。經(jīng)預(yù)測(cè)匯總后共得到79種轉(zhuǎn)錄因子結(jié)合位點(diǎn)。其中有多個(gè)轉(zhuǎn)錄因子已被證明與腫瘤、炎癥、熱應(yīng)激有關(guān),此外還有些轉(zhuǎn)錄因子是信號(hào)通路里的重要組分。如AP-1轉(zhuǎn)錄因子結(jié)合位點(diǎn),屬于激活蛋白家族成員結(jié)合位點(diǎn),在生長(zhǎng)因子、細(xì)胞因子、脅迫、病原菌等因素刺激下,AP-1被活化進(jìn)而調(diào)節(jié)基因表達(dá)[9]。AP-1在惡性腫瘤及自身免疫病當(dāng)中也有很重要的調(diào)控作用[10]。促氧化因子和促炎因子可刺激AP-1的表達(dá)上調(diào),各種損傷性刺激可使AP-1上游的信號(hào)分子JNK和ERK分別磷酸化c-Jun和c-Fos,c-Jun和c-Fos被磷酸化后進(jìn)入細(xì)胞核進(jìn)而形成二聚體,與AP-1轉(zhuǎn)錄因子結(jié)合位點(diǎn)結(jié)合啟動(dòng)HO-1基因表達(dá)[11]。因此,hHO-1表現(xiàn)出的多種抗逆作用,可以通過其啟動(dòng)子含有眾多轉(zhuǎn)錄因子結(jié)合位點(diǎn)來解釋。
NF-κB是二聚體轉(zhuǎn)錄因子,屬于Rel家族成員。當(dāng)機(jī)體受到損傷性刺激時(shí),NF-κB進(jìn)入細(xì)胞核,與HO-1啟動(dòng)子上的NF-κB轉(zhuǎn)錄因子結(jié)合位點(diǎn)結(jié)合,啟動(dòng)HO-1基因轉(zhuǎn)錄,以應(yīng)對(duì)損傷刺激[12]。E26轉(zhuǎn)錄因子1(ETS1)屬于外轉(zhuǎn)錄間隔區(qū)(ETS)家族成員,ETS主要參與細(xì)胞的生長(zhǎng)與分化及器官的形成,在人的血管生成過程中起到重要作用。ETS1可促進(jìn)血管內(nèi)皮細(xì)胞的遷移,在血管內(nèi)皮受損后修復(fù)時(shí)ETS1表達(dá)量有所上調(diào)[13]。轉(zhuǎn)錄因子ETS1、c-Jun和LEF1能協(xié)同作用于孕丸X 受體基因的啟動(dòng)子區(qū)域,并增強(qiáng)該基因的表達(dá)[14]。轉(zhuǎn)錄因子LEF1的功能與ETS1相似,LEF1可促進(jìn)血管內(nèi)皮細(xì)胞的增殖及其在基質(zhì)中的侵襲能力[15]。由此可見,一個(gè)基因可受到多種轉(zhuǎn)錄因子的調(diào)控,且轉(zhuǎn)錄因子之間存在協(xié)同作用。上述轉(zhuǎn)錄因子結(jié)合位點(diǎn)在hHO-1啟動(dòng)子區(qū)都已預(yù)測(cè)出來,但ETS1轉(zhuǎn)錄因子與hHO-1啟動(dòng)子之間的關(guān)系還未見報(bào)道,推測(cè)hHO-1可能與血管內(nèi)皮細(xì)胞再生有一定關(guān)系。此外,在hHO-1啟動(dòng)子區(qū)未證實(shí)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)還有多種,如c-Ets-2、c-Myb、ELF-1、GATA-1、Id3、LEF-1、MEB-1、NF-AT1等。在今后的研究中,可通過構(gòu)建熒光素報(bào)告載體的方法證實(shí)其他轉(zhuǎn)錄因子結(jié)合位點(diǎn),為更深入地了解hHO-1基因功能及轉(zhuǎn)錄調(diào)控機(jī)制奠定基礎(chǔ)。
DNA甲基化是一種表觀遺傳修飾,可在組織特異性基因表達(dá)、X染色體失活、基因組印記、細(xì)胞增殖及衰老、胚胎發(fā)育等生物學(xué)進(jìn)程中起重要作用。哺乳動(dòng)物的DNA甲基化主要發(fā)生在轉(zhuǎn)錄起始點(diǎn)附近的CpG二核苷酸胞嘧啶殘基上,即CpG島。一般情況下,正常細(xì)胞的CpG島由于被保護(hù)而處于非甲基化的狀態(tài)。在腫瘤細(xì)胞中,抑癌基因的CpG島表現(xiàn)為高甲基化,腫瘤抗原表達(dá)缺失,抑癌基因表達(dá)下調(diào),最終導(dǎo)致腫瘤發(fā)生[16-17]。本研究預(yù)測(cè)結(jié)果顯示,hHO-1基因的CpG島位于啟動(dòng)子區(qū)末端,外顯子1及部分內(nèi)含子1上游序列,hHO-1表現(xiàn)出的多種功能可能與其CpG島的甲基化狀態(tài)有一定關(guān)系。針對(duì)CpG島序列特點(diǎn)可以設(shè)計(jì)用于DNA甲基化分析的PCR引物,這還有待今后進(jìn)一步實(shí)驗(yàn)分析。隨著生物信息學(xué)的不斷發(fā)展,關(guān)于啟動(dòng)子功能元件的預(yù)測(cè)將更準(zhǔn)確可靠,可為研究基因的功能及轉(zhuǎn)錄調(diào)控提供更多有價(jià)值的信息。