曹 輝,許 鐘,陳燕平,張玲玲,魯 亮
肝核轉(zhuǎn)錄因子4(hepatocyte nuclear factor 4,HNF4)是細(xì)胞核激素受體家族中的核心成員之一,在調(diào)控肝細(xì)胞分化和維持其生物學(xué)功能上具有重要作用,其中HNF4α與肝臟特異基因的表達(dá)密切相關(guān)[1]。研究[2-3]表明HNF4α在肝細(xì)胞癌變中扮演著抑癌基因的角色,在肝硬化、肝癌中其表達(dá)明顯下調(diào)。作為肝細(xì)胞中的一個(gè)重要的轉(zhuǎn)錄因子,HNF4α與超過40%肝基因的啟動(dòng)子區(qū)相結(jié)合[4],其重要性可見一斑,由此不難理解近年來肝臟疾病研究中HNF4α受到國(guó)內(nèi)外學(xué)者的重視[5-7]。該研究擬應(yīng)用生物信息學(xué)方法對(duì)HNF4α基因啟動(dòng)子區(qū)進(jìn)行序列分析,預(yù)測(cè)該基因近端啟動(dòng)子區(qū)的轉(zhuǎn)錄因子結(jié)合位點(diǎn), 進(jìn)一步分析其在肝細(xì)胞癌中下調(diào)有關(guān)的轉(zhuǎn)錄因子,為研究其轉(zhuǎn)錄調(diào)控機(jī)制、探索肝癌治療新思路提供理論基礎(chǔ)。
1.1 基因啟動(dòng)子區(qū)序列的獲得從美國(guó)國(guó)家生物技術(shù)信息中心在線核苷酸數(shù)據(jù)庫(Gene Bank)獲得HNF4α基因序列,基于HNF4α的基因序列ID,下載NCBI網(wǎng)站上外鏈接GeneCopoeia Inc.所提供的啟動(dòng)子序列。
1.2 啟動(dòng)子區(qū)轉(zhuǎn)錄因子結(jié)合位點(diǎn)的預(yù)測(cè)分析通過在線啟動(dòng)子區(qū)域預(yù)測(cè)分析軟件PromotorScan(http://www-bimas.cit.nih.gov/molbio/proscan/)分析啟動(dòng)子序列,通過轉(zhuǎn)錄因子數(shù)據(jù)庫TRANSFAC中的在線轉(zhuǎn)錄因子預(yù)測(cè)軟件包括Patch、P-Match、AliBaba2(http://www.gene-regulation.com/pub/programs.html)預(yù)測(cè)HNF4α啟動(dòng)子序列順式作用元件,分析其可能轉(zhuǎn)錄因子結(jié)合位點(diǎn)。
1.3 肝癌組織中相關(guān)轉(zhuǎn)錄因子的篩選應(yīng)用在線肝臟基因數(shù)據(jù)庫liveratlas(http://liveratlas.hupo.org.cn/)[8]篩查肝癌組織中表達(dá)下調(diào)的基因,與預(yù)測(cè)的轉(zhuǎn)錄因子進(jìn)行對(duì)比,獲得目標(biāo)轉(zhuǎn)錄因子數(shù)據(jù)集。
1.4 相關(guān)性分析通過TCGA數(shù)據(jù)庫(https://cancergenome.nih.gov/)提取相關(guān)轉(zhuǎn)錄因子與HNF4α的肝癌組織芯片表達(dá)結(jié)果,進(jìn)行相關(guān)性分析。
1.5 統(tǒng)計(jì)學(xué)處理采用GraphPad Prism 5軟件進(jìn)行數(shù)據(jù)分析,相關(guān)性分析計(jì)算相關(guān)系數(shù)r,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 人HNF4α基因基本信息及啟動(dòng)子序列人HNF4α基因ID:3 172,定位于20號(hào)染色體正鏈(20q13.12),全長(zhǎng)77 045 bp,其mRNA ID包括:NM_000457.4、NM_001030003.2、NM_001030004.2、NM_001258355.1、NM_001287182.1、NM_001287 183.1、NM_001287184.1、NM_175914.4、NM_178849.2和NM_178850.2。
通過ACEVIEW(https://www.ncbi.nlm.nih.gov/IEB/Research/Acembly/)了解其轉(zhuǎn)錄本情況,選擇NM_000457.4,對(duì)應(yīng)的基因啟動(dòng)子克隆產(chǎn)品ID為HPRM20338,HPRM30433。
提取兩者序列,應(yīng)用NCBI Blast比對(duì),HPRM30433序列包含HPRM20338轉(zhuǎn)錄起始位點(diǎn)(TSS)上游的全部序列,故取HPRM30433序列來進(jìn)一步分析,其全長(zhǎng)1 471 bp,位于轉(zhuǎn)錄起始位點(diǎn)-1 371 bp至+99 bp之間。
2.2 人HNF4α基因啟動(dòng)子區(qū)轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)分析結(jié)果應(yīng)用PromotorScan分析啟動(dòng)子序列,分析結(jié)果共35個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn),其中Sp1結(jié)合位點(diǎn)共16個(gè)、AP-2共6個(gè)。去重后涵蓋AP-2、APRT-mouse_US、EARLY-SEQ1、GCF、HSV-tk-2nd_distal_si、JCV_repeated_sequenc、LF-A2、PuF、SDR_RS、Sp1、T-Ag、UCE.2共12個(gè)轉(zhuǎn)錄因子。
應(yīng)用Patch在線軟件分析,參數(shù)設(shè)置set of sites選擇“vertebrates”,Lower score boundary設(shè)為“90”,其它采用默認(rèn)設(shè)置,預(yù)測(cè)結(jié)果共1 567個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn),手工篩查物種為人的轉(zhuǎn)錄因子結(jié)合位點(diǎn)共785個(gè),經(jīng)匯總?cè)ブ?,共涵蓋了161個(gè)轉(zhuǎn)錄因子。
應(yīng)用P-Match在線軟件分析,當(dāng)Cut-offs使用參數(shù)為“to minimize the sum of both error rates”時(shí),預(yù)測(cè)到17個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn)(圖1),去除重復(fù)共涵蓋12個(gè)轉(zhuǎn)錄因子:AP-4、ARP-1、CDP CR3、COUP-TF、CREB、c-Rel、E47、HNF-4、NF-kappaB、NRF-2、Olf-1、ZID;當(dāng)使用參數(shù)為“to minimize false negative matches”,共預(yù)測(cè)到324個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn),經(jīng)匯總?cè)ブ?,共涵蓋27個(gè)轉(zhuǎn)錄因子:AP-4、AREB6、ARP-1、BSAP、CDP、CDP CR3、COUP-TF、CREB、c-Rel、E47、Elk-1、Evi-1、HFH-1、HLF、HNF-4、myogenin/NF-1、NF-E2、NF-kappaB、NF-kappaB(p50)、NF-kappaB(p65)、Nkx2-5、NRF-2、Olf-1、RREB-1、STATx、YY1、ZID。
圖1 P-Match預(yù)測(cè)轉(zhuǎn)錄因子結(jié)合位點(diǎn)結(jié)果圖
應(yīng)用AliBaba2在線軟件分析,取在線軟件默認(rèn)設(shè)置參數(shù),預(yù)測(cè)結(jié)果共164個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn),經(jīng)匯總?cè)ブ?,共涵蓋了61個(gè)轉(zhuǎn)錄因子。
以上軟件預(yù)測(cè)結(jié)果匯總后去除重復(fù),結(jié)果共涵蓋了225個(gè)轉(zhuǎn)錄因子。
2.3 篩查肝癌中人HNF4α啟動(dòng)子區(qū)可能轉(zhuǎn)錄因子應(yīng)用在線基因數(shù)據(jù)庫liveratlas檢索,選擇“Disease”,以“hepatocellular carcinoma”為檢索詞檢索,依次點(diǎn)擊“HuLDi00052”和“more...”,提取肝細(xì)胞癌中表達(dá)下調(diào)的基因共2 538個(gè),與上述預(yù)測(cè)的225個(gè)轉(zhuǎn)錄因子進(jìn)行對(duì)比,取交集獲得目標(biāo)轉(zhuǎn)錄因子。結(jié)果預(yù)測(cè)的轉(zhuǎn)錄因子中共有17個(gè)在肝細(xì)胞癌中表達(dá)下調(diào):Egr-1、GATA-3、HLF、IRF-1、MAZ、MyoD、Pax-5、POU1F1a、RelA、RREB-1、RXR-alpha、SMAD-3、Sp1、TBP、TCF-4、USF2、WT1。
2.4 表達(dá)相關(guān)性分析從TCGA數(shù)據(jù)庫中提取以上17個(gè)轉(zhuǎn)錄因子及HNF4α在癌旁組織及肝細(xì)胞癌中表達(dá)的數(shù)據(jù),用GraphPad Prism 5軟件進(jìn)行相關(guān)性分析及繪圖,結(jié)果顯示HLF、RREB1、RXRA等三個(gè)轉(zhuǎn)錄因子與HNF4α的表達(dá)成正相關(guān),計(jì)算的Pearson相關(guān)系數(shù)r分別為0.553 4、0.407 9、0.424 7,P<0.000 1,差異有統(tǒng)計(jì)學(xué)意義(圖2~4)。
圖2 轉(zhuǎn)錄因子HLF與HNF4α的相關(guān)性分析
圖3 轉(zhuǎn)錄因子RREB1與HNF4α的相關(guān)性分析
圖4 轉(zhuǎn)錄因子RXRA與HNF4α的相關(guān)性分析
研究抑癌基因表達(dá)調(diào)控機(jī)制既有助于揭開惡性腫瘤發(fā)生發(fā)展的分子機(jī)制,也可為探索癌癥治療新策略提供新的思路。肝癌是我國(guó)和世界上最常見的惡性腫瘤之一,基于臨床樣本檢測(cè)的研究越來越豐富[9],多種芯片的數(shù)據(jù)也通過在線數(shù)據(jù)庫公開報(bào)道。對(duì)這些數(shù)據(jù)進(jìn)行深度分析,結(jié)合啟動(dòng)子區(qū)序列轉(zhuǎn)錄因子的生物信息學(xué)分析,可為抑癌基因轉(zhuǎn)錄調(diào)控研究提供更精準(zhǔn)的方向。
HNF4α是肝癌發(fā)生中受關(guān)注的抑癌基因之一,相關(guān)的信號(hào)通路研究表明JNK/c-Jun、Notch和MAPK等信號(hào)通路可抑制HNF4α的功能或抑制其表達(dá)[10-12],PI3K/AKT信號(hào)通路可以促進(jìn)其表達(dá)[13]。而對(duì)HNF4α轉(zhuǎn)錄調(diào)控機(jī)制的進(jìn)一步解析,可在分子水平上更充分的闡明其表達(dá)調(diào)控機(jī)制,有助于深入認(rèn)識(shí)肝細(xì)胞癌變的機(jī)制。
HNF4α在肝癌發(fā)生中表達(dá)受抑制,與之相對(duì)應(yīng),調(diào)控其表達(dá)的轉(zhuǎn)錄因子在肝癌中的表達(dá)通常是下調(diào)的。本研究應(yīng)用北京蛋白質(zhì)組研究中心/蛋白質(zhì)組國(guó)家重點(diǎn)實(shí)驗(yàn)室建立的在線肝臟基因數(shù)據(jù)庫liveratlas[8],基于公開發(fā)表的芯片等數(shù)據(jù)提取到在肝細(xì)胞癌中表達(dá)下調(diào)的基因共2 538個(gè)。在NCBI的基因數(shù)據(jù)庫中獲得HNF4α的啟動(dòng)子序列后,應(yīng)用多種啟動(dòng)子序列分析軟件來預(yù)測(cè)其順式作用元件,合并多個(gè)軟件預(yù)測(cè)結(jié)果以減少遺漏的可能,預(yù)測(cè)結(jié)果共對(duì)應(yīng)225個(gè)轉(zhuǎn)錄因子。通過兩組數(shù)據(jù)的交集,有效縮小了在肝癌中研究HNF4α的轉(zhuǎn)錄調(diào)控蛋白的范圍。
隨后,通過TCGA數(shù)據(jù)庫,詳細(xì)地分析了潛在轉(zhuǎn)錄因子與HNF4α表達(dá)的相關(guān)性,很幸運(yùn)地從17個(gè)潛在目標(biāo)中找到3個(gè)轉(zhuǎn)錄因子與HNF4α表達(dá)成正相關(guān), 使進(jìn)一步的實(shí)驗(yàn)研究變得更加可行。通過文獻(xiàn)檢索,未見HLF、RREB1與HNF4α之間相互作用的報(bào)道;Tomaru et al[14]通過Matrix RNAi(結(jié)合siRNA敲除和QRT-PCR)在HepG2細(xì)胞系中的研究結(jié)果表明,RXRA可調(diào)控HNF4α的表達(dá),為本研究的分析結(jié)果提供了佐證,下一步將在此基礎(chǔ)上,通過小鼠肝癌模型等體內(nèi)實(shí)驗(yàn)來驗(yàn)證。
深度的數(shù)據(jù)發(fā)掘,可以借助于綜合利用公開的數(shù)據(jù)庫資源、結(jié)合生物信息學(xué)分析、充分應(yīng)用計(jì)算機(jī)和網(wǎng)絡(luò)資源來實(shí)現(xiàn)其價(jià)值。盡管預(yù)測(cè)分析結(jié)果的真
實(shí)情況有待體內(nèi)外實(shí)驗(yàn)的評(píng)價(jià),但通過對(duì)生物信息的獲取與加工、分析與闡釋,可有效縮小在肝癌發(fā)生中HNF4α轉(zhuǎn)錄調(diào)控機(jī)制探索的研究范圍,節(jié)約成本和資源,提高研究效率,是一行之有效的途徑,值得推廣應(yīng)用。