李璟波,周少華,夏 暉,李少軍,劉 陽
肺癌是一種常見的肺部惡性腫瘤,是目前對人類健康和生命威脅最嚴重的腫瘤之一。非小細胞肺癌(non-small cell lung carcinoma,NSCLC)約占肺癌總數(shù)的80%以上,是肺癌最常見的組織學(xué)類型[1]。miRNA是近年來發(fā)現(xiàn)的一類非編碼小分子RNA,其主要通過與靶基因3'UTR的完全或不完全配對,降解靶基因mRNA或抑制其翻譯,從而參與調(diào)控個體發(fā)育、細胞凋亡、增殖及分化等生命活動。余東虎等[2]運用生物信息學(xué)方法研究肺腺癌相關(guān)的靶基因,miRNA的異常表達與腫瘤的發(fā)生和發(fā)展也有重要聯(lián)系。多種miRNA包括miR-486、miR-30d、miR-499、miR-137、miR-375、miR-182*、miR-221和let-7a等的異常表達與NSCLC的發(fā)生和發(fā)展有關(guān)[3-6]。
hsa-miR-221最初從斑馬魚中克隆獲得并得到證實,其與多種腫瘤存在密切關(guān)系,包括肝癌、膠質(zhì)母細胞瘤、前列腺癌、甲狀腺乳頭狀癌和NSCLC等[7]。有研究表明,在肺癌組織中hsa-miR-221表達上調(diào),可以通過靶向抑制腫瘤抑制基因TIMP3的表達促進NSCLC的生長[8]。呂俊杰等[9]研究了117例NSCLC患者的hsa-miR-221表達情況,發(fā)現(xiàn)hsa-miR-221高表達的患者預(yù)后較差,可以作為一個潛在的肺癌預(yù)后預(yù)測的標志物。另外,在HBEC4肺癌細胞系中,hsa-miR-221能誘導(dǎo)上皮細胞間充質(zhì)細胞轉(zhuǎn)換(EMT)[10]。越來越多的證據(jù)表明hsa-miR-221在NSCLC的發(fā)生和發(fā)展中起重要作用,但其具體的調(diào)控機制尚不明確。本研究通過運用生物信息學(xué)的方法,研究hsa-miR-221上游轉(zhuǎn)錄因子、下游調(diào)控基因及其與長鏈非編碼RNA(long non-coding RNA,lncRNA)之間的調(diào)控關(guān)系,推測其在NSCLC的發(fā)生與發(fā)展中的分子調(diào)控網(wǎng)絡(luò),為進一步研究其調(diào)控NSCLC的分子機制提供線索。
1.1 材料 生物信息學(xué)預(yù)測工具軟件加州大學(xué)圣克魯斯分校(University of California,Santa Cruz,UCSC)基因組瀏覽器(http://genome.UCSC.edu/);人類miRNA疾病數(shù)據(jù)庫(http://202.38.125.151/hmdd/mima/md/);TF-miRNA調(diào)控數(shù)據(jù)庫(http://202.38.126.151/hmdd/mima/ttY);miRNA靶基因預(yù)測驗證數(shù)據(jù)(http://www.ulnm.uni-heidelberg.de/apps/zm/mirwalk/micronapredietedtarget.htm1);Genecards在線數(shù)據(jù)庫(http://www.geneeards.org/index.php?path=/HTML/page/gcPeople);肺癌相關(guān)因子整合數(shù)據(jù)庫IHLDB.rf(http://www.lungcancerdatabase.com/);ConSite數(shù)據(jù)庫(http://consite.genereg.net)。美國國立生物技術(shù)中心的基因表達譜(GEO)數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)。
1.2 方法
1.2.1 分析miR-221在人類基因組中的位置、保守性及相關(guān)疾病 UCSC基因組在線瀏覽工具包含有人類及動物的基因組相關(guān)數(shù)據(jù)。采用UCSC分析hsa-miR-221在人類基因組中的位置及保守性,在人類基因組hg19版本中得到hsa-miR-221的注釋信息。人類miRNA疾病數(shù)據(jù)庫(the Human microRNA Disease Database,HMDD)通過對遺傳學(xué)、表觀遺傳學(xué)、循環(huán)miRNA和miRNA與靶基因相互作用分析得到miRNA與疾病的關(guān)系,目前其版本為v3.2更新版,在其中查詢與has-miR-221相關(guān)的疾病。
1.2.2 預(yù)測hsa-miR-221轉(zhuǎn)錄因子 利用TransmiR在線預(yù)測hsa-miR-221的轉(zhuǎn)錄因子。
1.2.3 查詢hsa-miR-221靶基因 MiRwalk綜合了多種miRNA靶基因預(yù)測軟件的結(jié)果,提供來自人類、小鼠和大鼠的miRNA的預(yù)測信息,利用該預(yù)測軟件預(yù)測hsa-miR-221靶基因。
1.2.4 篩選與NSCLC相關(guān)的hsa-miR-221靶基因 在Genecards數(shù)據(jù)庫中查找已證實與NSCLC相關(guān)的基因,并與預(yù)測軟件預(yù)測得到的結(jié)果取交集篩選出與NSCLC相關(guān)的hsa-miR-221靶基因。
1.2.5 搜索與NSCLC相關(guān)的lncRNA 肺癌相關(guān)因子整合數(shù)據(jù)庫IHLDB.rf收錄了69種與肺癌相關(guān)的lncRNA,并提供了536對lncRNA與miRNA的相互作用。因此在該數(shù)據(jù)庫中找到與NSCLC相關(guān)的lncRNA并篩選出于hsa-miR-221相互作用的lncRNA。
1.2.6 預(yù)測lncRNA轉(zhuǎn)錄因子 ConSite是兩序列間保守區(qū)域轉(zhuǎn)錄因子結(jié)合部位預(yù)測軟件,運用ConSite軟件輸入前面預(yù)測所得lncRNA的啟動子序列,預(yù)測得該lncRNA的轉(zhuǎn)錄因子,匯總并查閱相關(guān)文獻,最后篩選出與NSCLC相關(guān)的lncRNA的轉(zhuǎn)錄因子。
1.2.7 推測hsa-miR-221在NSCLC中分子調(diào)控網(wǎng)絡(luò) 綜合上述結(jié)果,分析各基因間的關(guān)系,繪制hsa-miR-221在NSCLC中的分子調(diào)控網(wǎng)絡(luò)圖。
1.2.8 驗證hsa-miR-221在NSCLC中的作用 為了評估hsa-miR-221在肺癌中的作用,本研究研究了hsa-miR-221過表達對肺癌細胞系影響。通過R軟件及affy和ggplot2等軟件進行差異基因分析。選擇差異倍數(shù)2倍(|logFC|≥1)以上,P<0.05的差異基因找出差異基因,進而與推測hsa-miR-221在NSCLC中分子調(diào)控網(wǎng)絡(luò)中相關(guān)基因進行關(guān)聯(lián),進一步確認hsa-miR-221調(diào)控的主要基因,對這些主要基因進行GO及KEGG功能注釋。
2.1 hsa-miR-221在人類基因組中的位置、保守性及相關(guān)疾病 根據(jù)人類基因組hg19的結(jié)果發(fā)現(xiàn)has-miR-221定位于人類第X號染色體上,處在P11.3區(qū)域的染色體45 605 584~45 605 693 bp位置,長度共107 bp,其在人、大鼠、小鼠、大象、狗、雞和斑馬魚等動物中呈高度保守,圖1。
圖1 hsa-miR-122在人類基因組中的位置
對HMDD分析發(fā)現(xiàn),hsa-miR-221與多種疾病相關(guān),包括多種腫瘤、心血管疾病以及哮喘和禿頭癥等(表1)。在腫瘤疾病中包括NSCLC,暗示其可能與NSCLC的發(fā)病機制有關(guān)。
表1 HMDD中與hsa-miR-221相關(guān)的疾病
2.2 hsa-miR-221的轉(zhuǎn)錄因子 運用TransmiR軟件預(yù)測的hsa-miR-221的轉(zhuǎn)錄因子,發(fā)現(xiàn)其啟動子上游可以被多種轉(zhuǎn)錄因子如MYC、MYCN、PDGF、ERS1、SF2/ASF、p27和FOS1所識別。其中MYC、MYCN、PDGF、ERS1、SF2/ASF、p27被證實與NSCLC有關(guān)。例如,C-MYC被證實與NSCLC的轉(zhuǎn)移有重要聯(lián)系[11]。MYCN(V-myc avian myelocytomatosis viral oncogene neuroblastoma derived homolog)是一個癌基因,在多種惡性腫瘤中過表達,其過量表達也與NSCLC的增殖有關(guān)[12]。
2.3 hsa-miR-221的靶基因 用miRwalk軟件預(yù)測hsa-miR-221的靶基因為817個。在GeneCards數(shù)據(jù)庫中查找與NSCLC相關(guān)的基因共86個,對2個數(shù)據(jù)庫進行比較取交集,得到26個基因。其中包括調(diào)節(jié)細胞周期的相關(guān)酶類CDK2、CDK6、CDKN1B和CDKN2B等。同時包括轉(zhuǎn)錄因子E2F2和E2F3以及多種整合素基因。也包含磷酸肌醇3-激酶(phosphoinositide 3-kinase,PIK3)家族基因PIK3CD、PIK3CG和PIK3R1等。另外包含原癌基因BCL-2和抑癌基因PTEN和RB1等。
2.4 hsa-miR-221與lncRNA 利用肺癌整合因子數(shù)據(jù)庫IHLDB.rf查找與肺癌相關(guān)的lncRNAs,發(fā)現(xiàn)有GAS5、CCAT1、H19、HOTAIR、MALAT1、MEG3、PVT1、TP73-AS1、TUG1和XIST共10個lncRNAs與miRNA有相互作用的數(shù)據(jù),這10個lncRNA都與NSCLC有關(guān)。繼續(xù)在IHLDB.rf數(shù)據(jù)庫中查找發(fā)現(xiàn),GAS5、HOTAIR和TUG1預(yù)測的靶miRNA包含hsa-miR-221,推測這3個lncRNA與hsa-miR-221的相互調(diào)控在NSCLC發(fā)生發(fā)展中起著重要作用。
2.5 預(yù)測lncRNA的轉(zhuǎn)錄因子 運用ConSite軟件預(yù)測上游1 kb啟動子序列可能與lncRNAGAS5、HOTAIR和TUG1的結(jié)合的轉(zhuǎn)錄因子,采用cutoff值為95%。在GAS5中預(yù)測得到5個轉(zhuǎn)錄因子可以與之結(jié)合,HOTAIR中有5個轉(zhuǎn)錄因子可以與之結(jié)合,TUG1中有5個轉(zhuǎn)錄因子可以與之結(jié)合(圖2)。其中3個lncRNA都可以被SOX-5識別。全基因組芯片分析發(fā)現(xiàn),在NSCLC組織中SOX-5的基因組區(qū)域發(fā)生了較大改變[13]。E74A可以識別GAS5和TUG1,其與NSCLC的關(guān)系尚不清楚。其它轉(zhuǎn)錄因子如Snail、n-MYC、ARNT均與NSCLC相關(guān)[13]。
A.GAS5
2.6 hsa-miR-221在NSCLC中的分子作用機制網(wǎng)絡(luò)圖 根據(jù)以上結(jié)果,綜合識別hsa-miR-221啟動子的MYC、MYCN和PDGF等6個上游轉(zhuǎn)錄因子及其下游靶基因PTEN、RB1和BCL2等,和預(yù)測所得的與其相關(guān)的lncRNA GAS5、HOTAIR和TUG1及它們的轉(zhuǎn)錄因子Snail、n-MYC、ARNT和SOX5,這些因子均已證實與NSCLC相關(guān),最后可以推測得hsa-miR-221在NSCLC中的分子調(diào)控網(wǎng)絡(luò)圖。hsa-miR-221在表達過程中受到多種途徑的調(diào)控,在每個途徑中都有多種因子的參與,暗示其在調(diào)控NSCLC的發(fā)生和發(fā)展時處于一個十分復(fù)雜的分子調(diào)控網(wǎng)絡(luò)中,圖3。
圖3 hsa-miR-221在NSCLC組織中表達的分子調(diào)控網(wǎng)絡(luò)示意圖
2.7 hsa-miR-221過表達轉(zhuǎn)錄組差異基因分析 根據(jù)篩選標準篩選出364個差異基因,其中上調(diào)274個,下調(diào)90個,圖4A。
將差異基因與預(yù)測的hsa-miR-221在NSCLC組織中表達的分子調(diào)控網(wǎng)絡(luò)中的基因取交集,最終確定5個基因,這5個基因分別為APAF1、COL4A4、ITGA6、CCNE2、E2F2,圖4B。GO功能注釋發(fā)現(xiàn)這些基因主要調(diào)控DNA分解代謝過程、凋亡信號通路的調(diào)控、DNA復(fù)制起始及凋亡執(zhí)行階段的調(diào)控等功能。KEGG分析發(fā)現(xiàn)主要調(diào)控細胞周期信號通路、P53信號通路及PI3K-AKT信號通路等。
圖4 A:hsa-miR-221在NSCLC細胞系中過表達差異
隨著研究技術(shù)的發(fā)展,越來越多的數(shù)據(jù)表明miRNA在腫瘤的發(fā)生和發(fā)展中起重要作用。NSCLC是肺癌的主要類型,受多種miRNA的調(diào)控,因此研究NSCLC中miRNA的調(diào)控網(wǎng)絡(luò)對闡明癌癥發(fā)生和發(fā)展的分子機制具有十分重要的意義。應(yīng)用生物信息學(xué)手段,通過預(yù)測miRNA的調(diào)控因子、靶基因及其相互作用的lncRNA和相關(guān)的轉(zhuǎn)錄因子,張皓旻等[14]研究了kras基因突變對人肺腺癌轉(zhuǎn)錄組的影響,韓澤平等[15]繪制了hsa-miR-221在肝癌中的分子調(diào)控網(wǎng)絡(luò),呂燕妮等[16]繪制了hsa-miR-181a在腦卒中發(fā)病中的分子調(diào)控網(wǎng)絡(luò),明確了這些miRNA在疾病發(fā)生中的重要調(diào)控作用。
最近研究表明,hsa-miR-221在NSCLC中起重要作用,然而其具體機制并不清楚,因此本研究用生物信息學(xué)的方法預(yù)測其在NSCLC中的作用。hsa-miR-221在脊椎動物甚至斑馬魚中保守,暗示其有十分重要的意義。其與多種癌癥包括NSCLC的發(fā)生發(fā)展有關(guān)。通過預(yù)測啟動子的轉(zhuǎn)錄因子結(jié)合發(fā)現(xiàn),其可以被多種與NSCLC相關(guān)的轉(zhuǎn)錄因子所識別,其中MYC和MYCN都被證實與NSCLC的轉(zhuǎn)移和增殖有重要聯(lián)系。在受到與NSCLC相關(guān)的轉(zhuǎn)錄因子調(diào)節(jié)的同時,hsa-miR-221也可以結(jié)合到許多與NSCLC相關(guān)的基因上,調(diào)節(jié)它們的表達。結(jié)合miRWalk預(yù)測得到的靶基因及Genecards數(shù)據(jù)庫中與NSCLC相關(guān)的基因,發(fā)現(xiàn)其下游有26個基因與NSCLC有關(guān),包括PTEN、RB1和BCL2等。hsa-miR-221的升高能抑制PTEN的表達[8]。在NSCLC中,抑癌基因PTEN的表達受到抑制,PTEN表達的抑制與NSCLC患者的預(yù)后較差有很重要的聯(lián)系[17]。
同時,本研究還發(fā)現(xiàn)NSCLC中,hsa-miR-221的表達還受到lncRNA的調(diào)節(jié),這些lncRNA已被證實與NSCLC的發(fā)生和發(fā)展有重要關(guān)系,包括GAS5、HOTAIR和TUG1。這些lncRNA自己也受到多種與NSCLC相關(guān)的轉(zhuǎn)錄因子的調(diào)控。因此通過上游轉(zhuǎn)錄因子,lncRNA以及下游靶基因,構(gòu)成了NSCLC中以hsa-miR-221為核心的分子調(diào)控網(wǎng)絡(luò)。在每個步驟中都有多種分子的參與,暗示了該調(diào)控網(wǎng)絡(luò)十分復(fù)雜,hsa-miR-221可以通過多種途徑對NSCLC的發(fā)生和發(fā)展起調(diào)控作用。
通過以上生物信息學(xué)的分析,本研究繪制了hsa-miR-221調(diào)控NSCLC的分子調(diào)控網(wǎng)絡(luò),為以后進行相關(guān)的實驗研究提供了十分重要的線索,同時為闡明其在NSCLC中的發(fā)病機制提供了新的理論依據(jù)。