余詠暉 黃紅梅 匡新杰 盧文菊 呂嘉春 丘福滿
1 廣州醫(yī)科大學公共衛(wèi)生學院(廣東廣州 511436)2 廣州醫(yī)科大學,廣州呼吸健康研究院,呼吸疾病全國重點實驗室(廣東廣州 510180)
惡性腫瘤是一種由基因組不穩(wěn)定導致的細胞異常增殖和侵襲的復(fù)雜疾病,嚴重威脅人類的健康和生命[1]。其發(fā)生、發(fā)展涉及多種分子機制,其中嵌合基因是一種重要的致癌因素。已有多項研究針對大樣本腫瘤病例組織的高通量測序結(jié)果顯示,超過10%的患者可檢測出嵌合基因陽性[2-3]。目前,基因融合已被證實是惡性腫瘤的獨有特征,通過融合檢測最大化的匹配靶向用藥,已經(jīng)成為腫瘤精準治療的中流砥柱[4]。但是,人們對嵌合基因在腫瘤發(fā)生、發(fā)展中的確切功能和作用仍知之甚少。傳統(tǒng)觀點認為,嵌合基因是染色體重排導致的現(xiàn)象,近年來的研究發(fā)現(xiàn),基因間異常剪接等方式亦是嵌合基因產(chǎn)生的重要機制[5]。隨著高通量測序技術(shù)的發(fā)展,越來越多的嵌合基因被發(fā)現(xiàn)與不同類型的惡性腫瘤相關(guān)[6],其通過改變信號通路、誘導細胞增殖、抑制細胞凋亡、促進血管生成、增加腫瘤干細胞比例等方式影響惡性腫瘤的生物學特性[7]。嵌合基因不僅是惡性腫瘤的分子標志物,也是潛在的治療靶點,如靶向B細胞受體-ABL原癌基因1(B-cell receptor-ABL proto-oncogene 1,BCR-ABL1)嵌合基因的伊馬替尼等小分子抑制劑已經(jīng)成為慢性粒細胞白血病的一線治療藥物[8]。本文旨在綜述近年來關(guān)于嵌合基因與惡性腫瘤關(guān)系的研究進展,包括嵌合基因的發(fā)現(xiàn)、形成機制、檢測手段、在腫瘤中的調(diào)控機制及治療策略等方面,為深入理解惡性腫瘤的分子機制和開發(fā)新型治療手段提供理論線索。
嵌合基因是由兩個或多個不同基因的部分或全部序列連接而成的新型基因,它們可以在DNA水平或RNA水平上產(chǎn)生[6]。在基因組水平,嵌合基因通常是由染色體重排或易位導致的兩個或多個基因融合而成,在癌癥細胞中較為常見,尤其是在具有染色體易脆位點的細胞中[9]。在轉(zhuǎn)錄組水平,嵌合基因可能是由轉(zhuǎn)錄調(diào)控異?;蚣艚渝e誤造成的兩個或多個獨立基因的轉(zhuǎn)錄本連接而成,這種現(xiàn)象在正常細胞和癌癥細胞中都有發(fā)生,但癌癥細胞中更為頻繁[10]。嵌合基因在不同的組織和細胞中有不同的表達模式和功能,有些嵌合基因可以編碼具有新功能或調(diào)控作用的嵌合蛋白,有些嵌合基因則只是轉(zhuǎn)錄水平上的假基因或非編碼RNA。嵌合基因在癌癥中發(fā)揮著重要的作用,可作為癌癥的診斷標志物、預(yù)后指標或治療靶點[11]。近年來,高通量RNA測序技術(shù)的發(fā)展使得嵌合基因的發(fā)現(xiàn)和鑒定更加高效和準確,為深入揭示嵌合基因在正常生理和癌癥中的作用提供了新的途徑[12]
既往研究報道基因組由于各種結(jié)構(gòu)性染色體重排(chromatin rearrangement),如易位、缺失,或染色體倒位,產(chǎn)生基因融合(gene fusion)的新現(xiàn)象[13]。大多數(shù)情況下,嵌合基因(也稱融合基因)可以導致序列異常、基因表達失調(diào)及蛋白質(zhì)的功能異常。除了上述傳統(tǒng)觀點認為嵌合基因是染色體重排而引致的結(jié)果,近年來的研究發(fā)現(xiàn),不同基因間在轉(zhuǎn)錄或者轉(zhuǎn)錄后的加工過程也是產(chǎn)生嵌合基因的重要機制[5]。嵌合基因產(chǎn)生的常見機制見圖1。
基因組變異導致嵌合基因產(chǎn)生的主要方式包括以下幾種。
染色體易位(chromosome translocation):指兩條不同染色體之間或同一條染色體上不同部位之間發(fā)生斷裂并互換片段的過程。染色體易位可以導致原本不相鄰的兩個或多個基因片段連接在一起,形成嵌合基因。染色體易位是最早被發(fā)現(xiàn),也是最常見的嵌合基因形成機制。例如慢性粒細胞白血病的特征性嵌合基因BCR-ABL就是由第9號染色體的ABL1基因和第22號染色體的BCR基因發(fā)生易位而形成[14]。
染色體移位(chromosome inversion):染色體的一段序列發(fā)生180°翻轉(zhuǎn)稱為染色體移位,這會導致染色體斷裂并重新連接形成新的基因組合[15]。如棘皮動物微管相關(guān)蛋白樣4-間變性淋巴瘤激酶(echinoderm microtubule-associated protein-like 4-Anaplastic lymphoma kinase,EML4-ALK)嵌合基因在非小細胞肺癌樣本中就是由EML4基因發(fā)生移位反向插入ALK基因上產(chǎn)生的[16]。
基因擴增(amplification):是指某一特定基因或基因片段在染色體上的拷貝數(shù)異常增加的過程。基因擴增可以導致原本不同的兩個或多個基因或基因片段在同一條染色體上重復(fù)出現(xiàn),并且可能發(fā)生連接,形成嵌合基因。基因擴增是一種常見的腫瘤細胞遺傳變異方式,可以增加腫瘤細胞的生長優(yōu)勢和適應(yīng)性。成纖維細胞生長因子受體1(fibroblast growth factor receptor 1,F(xiàn)GFR1)基因已被報道在多種腫瘤中發(fā)生高頻擴增,其異常擴增時也可能與其他鄰近基因發(fā)生融合,如在骨髓增生異常綜合征和急性髓系白血病患者樣本中,檢測到由FGFR1基因發(fā)生擴增而與位于8號染色體上的鋅指蛋白198(zinc finger protein 198,ZNF198)基因融合形成FGFR1-ZNF198[17]。
基因缺失(deletion):指某一特定基因或基因片段在染色體上的拷貝數(shù)異常減少或缺失的過程?;蛉笔Э梢詫е略鞠噜彽膬蓚€或多個基因或基因片段之間的間隔縮短或消失,并且可能發(fā)生連接,形成嵌合基因?;蛉笔且环N常見的腫瘤細胞遺傳變異方式,可以導致腫瘤抑制基因的失活或功能障礙。例如,結(jié)直腸癌中經(jīng)常發(fā)生腺瘤樣息肉基因(adenomatous polyposis coli,APC)和結(jié)直腸癌突變基因(mutated in colorectal cancers,MCC)兩個腫瘤抑制基因之間的缺失,導致APC和MCC發(fā)生融合,形成APC-MCC嵌合基因[18]。
基因轉(zhuǎn)座(transposition):指某一特定基因或基因片段從一個染色體位置轉(zhuǎn)移到另一個染色體位置的過程?;蜣D(zhuǎn)座可以導致原本不同的兩個或多個基因或基因片段在同一條或不同條染色體上發(fā)生融合?;蜣D(zhuǎn)座可以導致腫瘤相關(guān)基因的表達調(diào)控異常。例如,前列腺癌中經(jīng)常發(fā)生跨膜絲氨酸蛋白酶2(transmembrane serine protease 2,TMPRSS2)和ETS相關(guān)基因(ETS-related gene,ERG)兩個原本不連續(xù)的基因發(fā)生轉(zhuǎn)座,導致TMPRSS2-ERG嵌合基因的形成[19]。
除了基因組層面的變異導致的嵌合基因外,還有一些嵌合基因是由轉(zhuǎn)錄層面的事件產(chǎn)生的,即轉(zhuǎn)錄誘導的嵌合基因(transcription-induced chimeric gene)。轉(zhuǎn)錄誘導的嵌合基因是由來自于不同基因的外顯子片段融合在一起組成的融合轉(zhuǎn)錄本[20]。轉(zhuǎn)錄誘導的嵌合基因的形成機制主要有以下幾種。
順式剪接(cis-splicing):是指同一條染色體上相鄰或不相鄰的兩個或多個前體RNA(premRNA)發(fā)生非經(jīng)典剪接,產(chǎn)生一個包含不同基因序列的嵌合轉(zhuǎn)錄本。順式剪接通常發(fā)生在相距較遠或位于不同染色體臂上的基因之間,這些基因可能處于同一方向或相反方向。有研究者發(fā)現(xiàn),由順式剪接產(chǎn)生的成纖維細胞生長因子受體3-轉(zhuǎn)化酸性卷曲蛋白質(zhì)3(fibroblast growth factor receptor 3-Transforming acidic coiled coil protein 3,F(xiàn)GFR3-TACC3)嵌合基因在膠質(zhì)母細胞瘤中高頻出現(xiàn),且具有致癌潛能[21]。
反式剪接(trans-splicing):是指不同染色體上或同一條染色體上相距很遠的兩個或多個前體RNA發(fā)生非經(jīng)典剪接,形成一個包含不同基因序列的新轉(zhuǎn)錄本。反式剪接通常發(fā)生在位于不同染色體上或相隔數(shù)百萬堿基對以上的基因之間[6]。
轉(zhuǎn)錄讀通(transcription read-through):指轉(zhuǎn)錄過程中RNA聚合酶沒有在正常的終止位點停止,而是繼續(xù)向下游延伸,從而將相鄰或不相鄰的兩個基因連接在一起,產(chǎn)生一個包含兩個基因或多個親本基因序列的嵌合基因[22],也稱為通讀基因融合子(read-through gene fusions)[23]、連體基因(conjoined gene)等[24]。
短同源序列(short homologous sequence,SHS)介導的轉(zhuǎn)錄滑動:是指在轉(zhuǎn)錄過程中,親本基因間以“短同源序列互補”的方式引起“模板轉(zhuǎn)換”,形成嵌合RNA[25]。
雙向轉(zhuǎn)錄(bidirectional transcription):國內(nèi)有學者通過對大規(guī)模RNA測序數(shù)據(jù)的深度挖掘與分析,發(fā)現(xiàn)一類新的RNA嵌合體,即在一段基因組區(qū)域內(nèi),分別以DNA雙鏈為模版的雙向轉(zhuǎn)錄產(chǎn)物RNA融合形成的異鏈嵌合RNA(cross-strand chimeric RNA,cscRNA)[26]。cscRNA主要來源于RNA水平的分子融合,在細胞中的表達水平差異較大,具有明顯的組織特異性。
嵌合基因的檢測方法可以分為傳統(tǒng)方法和高通量測序方法。傳統(tǒng)方法主要包括熒光原位雜交(fluorescence in situ hybridization,F(xiàn)ISH)、逆轉(zhuǎn)錄聚合酶鏈反應(yīng)(reverse transcription polymerase chain reaction,RT-PCR)和免疫組織化學(immunohistochemistry,IHC)染色等。這些方法具有靈敏度高、特異性強、成本低等優(yōu)點,但也存在局限性,如需要預(yù)先知道嵌合基因的類型和位置、不能檢測新發(fā)現(xiàn)的嵌合基因、不能覆蓋全基因組范圍等[27]。高通量測序方法主要包括全基因組測序(whole-genome sequencing,WGS)和轉(zhuǎn)錄組測序(RNA-seq)。目前基于高通量測序的檢測方法有FusionCatcher、SOAPfuse、EricScript等[28],這些方法具有高通量、高分辨率、高覆蓋度等優(yōu)點,能夠在全基因組范圍內(nèi)發(fā)現(xiàn)已知和未知的嵌合基因,并且能夠分析嵌合基因的表達水平和結(jié)構(gòu)變異。但這些方法也存在一些挑戰(zhàn),如需要大量的樣本和計算資源、需要有效的生物信息學分析流程和工具、排除假陽性結(jié)果等[27]。未來,第三代測序技術(shù)也為嵌合基因檢測帶來新機遇。PacBio、Nanopore等長讀長測序可以跨越轉(zhuǎn)錄本的整個長度,從而提高映射的準確性和融合鑒定,有利于發(fā)現(xiàn)復(fù)雜的基因重排事件[29]。此外,單分子實時成像測序也使得嵌合基因的全長結(jié)構(gòu)解析成為可能[30]。隨著技術(shù)的進一步成熟,長讀長測序在基因組結(jié)構(gòu)變異檢測及基因表達分析中有望發(fā)揮更大作用。
嵌合基因作為重要的腫瘤驅(qū)動基因,可以通過多種途徑改變腫瘤細胞的生物學行為,促進腫瘤的發(fā)生和進展[31-32]。根據(jù)分子機制的不同,可以將嵌合基因的功能歸納為以下幾類。
改變基因表達:嵌合基因可以通過改變原有基因或其他基因的表達水平或穩(wěn)定性,影響腫瘤細胞的增殖、分化、凋亡等。例如,剪接因子脯氨酸/谷氨酰胺豐富-轉(zhuǎn)錄因子結(jié)合IGHM增強子3(splicing factor proline/glutamine-rich-Transcription factor binding to IGHM enhancer 3,SFPQ-TFE3)是由染色體1上的SFPQ基因與染色體X上的TFE3基因發(fā)生反向誘導而產(chǎn)生的嵌合RNA,它可以與TFE3的mRNA形成雙鏈結(jié)構(gòu),抑制TFE3的表達,從而影響腎癌細胞的增殖和侵襲[33]。TMPRSS2-ERG融合蛋白能夠增加成骨細胞標記的表達,包括Ⅰ型膠原α1鏈和堿性磷酸酶以及內(nèi)皮素-1,促進前列腺癌的骨轉(zhuǎn)移進程[34]。t(8;21)(q22;q22)易位是急性髓系白血病(acute myeloid leukemia,AML)中最常見的染色體易位,可導致嵌合基因急性髓性白血病因子1-白血病易位基因(acute myeloid leukemia factor 1-Myeloid translocation gene,AML1-ETO)的形成。有證據(jù)顯示AML1-ETO聯(lián)合P300介導CD48的乙?;险{(diào)CD48的表達來抑制 AML免疫逃避自然殺傷細胞(natural killer cell,NK)的識別和殺傷,為AML1-ETO促癌基因陽性的AML患者具有更好的臨床預(yù)后提供新證據(jù)[35]。
編碼新蛋白:嵌合基因可以通過編碼新的蛋白質(zhì)或多肽,改變原有基因的編碼序列和結(jié)構(gòu)。譬如,BCR-ABL1嵌合基因是由22號染色體和9號染色體之間的易位導致,由BCR基因的N端與ABL1基因的C端拼接而成,產(chǎn)生了具有持續(xù)激活的酪氨酸激酶活性的融合蛋白。BCR-ABL1融合蛋白可以激活多種信號通路,如大鼠肉瘤(rat sarcoma,RAS)/絲裂原活化蛋白激酶(mitogenactivated protein kinase,MAPK)、磷脂酰肌醇3激酶(phosphatidylinositol 3 kinase,PI3K)/ 蛋白激酶B(protein kinase B,AKT)、Janus酪氨酸激酶(Janus-activated kinase,JAK)/信號轉(zhuǎn)導與轉(zhuǎn)錄激活因子(signal transducers and activators of transcription,STAT)等,促進慢性粒細胞白血?。╟hionic myeloid leukemia,CML)細胞增殖和抗凋亡[36]。t(11;22)(q24∶q12)的染色體易位導致Ewing肉瘤(內(nèi)皮細胞性骨髓肉瘤)斷裂點區(qū)1(Ewing sarcoma breakpoint region 1,EWSR1)蛋白的N端反激活結(jié)構(gòu)域和佛氏白血病病毒整合1(friend leukemia virus integration 1,F(xiàn)LI1)蛋白的C端DNA結(jié)合結(jié)構(gòu)域融合形成EWS-FLI1基因,其編碼的融合蛋白具有異常的轉(zhuǎn)錄激活能力,可調(diào)控多種基因的表達,如胰島素樣生長因子1(insulin-like growth factor 1,IGF1)、核受體亞家族0,B組成員1(nuclear receptor subfamily 0 group B member 1,NR0B1)、NK2同源框2(NK2 homeobox 2,NKX2.2)等,促進Ewing肉瘤細胞的增殖和侵襲[37]。早幼粒細胞白血病-視黃酸受體α(promyelocytic leukemia-Retinoic acid receptor alpha,PML-RARA)嵌合基因是由染色體15和17之間的易位而產(chǎn)生,其編碼的新融合蛋白可以干擾正常的細胞分化,導致急性早幼粒細胞白血?。╝cute promyelocytic leukemia,APL)細胞的增殖和堆積[38]。
激活信號通路:嵌合基因可以通過激活或抑制多種信號通路,影響腫瘤細胞的生長、存活、侵襲轉(zhuǎn)移等過程。例如,BCR-ABL1編碼為異常酪氨酸激酶活性的融合蛋白,是CML和部分急性淋巴細胞白血病的特征性分子標志物。BCR-ABL1可以激活多條信號通路,包括RAS/RAF/MEK/ERK、PI3K/AKT/mTOR、JAK/STAT等,從而促進腫瘤細胞的增殖、存活、抗凋亡和抗衰老[39-40]。EML4-ALK編碼一個具有異常酪氨酸激酶活性的融合蛋白,是非小細胞肺癌中約5%患者的驅(qū)動突變,可持續(xù)激活PI3K/AKT和Ras/MAPK信號通路,抑制腫瘤抑制因子p53和p16,促進腫瘤細胞增殖、轉(zhuǎn)移和耐藥[16,41]。PAX3-FOXO1是由染色體2上成對框基因3(paired box gene 3,PAX3)和叉頭框蛋白O1(forkhead box O1,F(xiàn)OXO1)基因融合產(chǎn)生的嵌合基因,編碼一個具有異常轉(zhuǎn)錄調(diào)控功能的融合蛋白,是橫紋肌肉瘤患者的特征性分子標志物[42]。PAX3-FOXO1可以調(diào)控多個信號通路,包括IGF1R/AKT/mTOR、FGFR4/RAS/ERK、WNT/β-catenin和Hedgehog等,從而促進腫瘤細胞的增殖、分化、遷移、侵襲和抗凋亡[43]。
影響表觀遺傳:嵌合基因可以招募表觀調(diào)控因子改變DNA甲基化或組蛋白修飾,從而影響基因表達。TMPRSS2-ERG是由21號染色體上的TMPRSS2基因與ERG基因發(fā)生順向倒位而產(chǎn)生的嵌合基因,它可以改變多種基因的甲基化狀態(tài),如性別決定區(qū)Y框9(sex determining region Y-box 9,SOX9)[44]、蝸牛同源物2(snail homolog 2,SNAI2)[45]等,從而影響前列腺細胞癌變和侵襲、轉(zhuǎn)移。有研究表明,AML1-ETO可與多種染色質(zhì)修飾酶如組蛋白甲基轉(zhuǎn)移酶、去乙酰化酶和聚合酶等相互作用,從而改變?nèi)旧|(zhì)標記、轉(zhuǎn)錄因子結(jié)合和基因表達。AML1-ETO通過招募組蛋白甲基轉(zhuǎn)移酶EZHZ2,直接調(diào)控DNA甲基化過程。AML1-ETO參與染色質(zhì)的可及性,導致關(guān)鍵的白血病相關(guān)基因如HoxA和Meis1的增強子區(qū)域的染色質(zhì)可及性增加[46]。
調(diào)節(jié)轉(zhuǎn)錄或剪切:嵌合基因可以通過形成新的調(diào)控元件,如啟動子、增強子、剪切位點等,影響原有基因或其他基因的轉(zhuǎn)錄或剪切。TMPRSS2-ERG可以利用TMPRSS2基因的雄激素響應(yīng)元(androgen response element,ARE)驅(qū)動ERG基因的過度表達,從而影響前列腺癌細胞的增殖、侵襲、轉(zhuǎn)移[47]。EWSR1-FLI1可以通過改變剪切位點和剪切因子結(jié)合位點,影響多個基因的可變剪切事件[48]。
嵌合基因與腫瘤的發(fā)生、進展和預(yù)后有著密切的關(guān)系,它們可以作為腫瘤的診斷標志物、預(yù)后指標和治療靶點。
診斷標志物:一些嵌合基因具有高度的特異性和敏感性,可作為惡性腫瘤的診斷標志物或分子分型依據(jù)。例如BCR-ABL1不僅是CML的驅(qū)動基因,還可作為CML特異性分子標志物應(yīng)用于診斷和分型[49];TMPRSS2-ERG嵌合基因在前列腺癌中表達頻率較高,可用于前列腺癌的篩查和鑒別[50]。EWS-FLI1和PML-RARA嵌合基因分別是Ewing肉瘤和APL的特征性標志,檢測這些嵌合基因可明確診斷上述腫瘤類型[51-52]。
預(yù)后標志物:一些嵌合基因與腫瘤的進展和預(yù)后密切相關(guān),可作為重要的預(yù)后標志物。如SFPQ-TFE3嵌合基因陽性與腎細胞癌患者的淋巴結(jié)轉(zhuǎn)移和不良預(yù)后相關(guān)[53]。Silvia等[54]研究了不同的ESR1融合轉(zhuǎn)錄物在原發(fā)性乳腺癌中的預(yù)后價值,發(fā)現(xiàn)雌激素受體1含卷曲螺旋域170(estrogen receptor 1-Coiled-coil domain containing 170,ESR1-CCDC170)融合轉(zhuǎn)錄本表達陽性能顯著縮短乳腺癌患者的無病生存時間和總生存時間。此外,亦有研究表明,攜帶TMPRSS2-ERG基因融合的前列腺癌患者復(fù)發(fā)風險較高[55]。
治療靶點:嵌合基因具有強大的致癌潛力和功能,可以作為惡性腫瘤的治療靶點。BCRABL1嵌合基因是CML的重要治療靶點,其產(chǎn)生的蛋白具有異常高的酪氨酸激酶活性,可以被伊馬替尼等酪氨酸激酶抑制劑有效抑制[36]。ALK基因重排能鑒別非小細胞肺癌的新分子亞型,已有臨床試驗證實ALK酪氨酸激酶抑制劑克唑替尼(crizotinib)在晚期 ALK陽性非小細胞肺癌患者中顯示出顯著的抗腫瘤活性,提高患者的緩解率和無進展生存期[56]。NPM1-ALK嵌合基因?qū)е碌膼盒粤馨土?,也表現(xiàn)出對ALK抑制劑的敏感性,應(yīng)用于NMP1-ALK陽性淋巴瘤患者中能獲得顯著療效[57]。
嵌合基因是一種常見的遺傳變異現(xiàn)象,在正常細胞和腫瘤細胞中均有發(fā)現(xiàn),但在腫瘤細胞中更為普遍和復(fù)雜,其形成機制主要包括基因組重排依賴的融合與基因組重排獨立的融合[58]。不同類型腫瘤中的嵌合基因表達模式和功能各有差異,它們?yōu)槟[瘤的分子機制、診斷方法和治療策略提供了新的視角。早期發(fā)現(xiàn)的嵌合基因主要來源于血液系統(tǒng)腫瘤,隨著測序技術(shù)的發(fā)展,發(fā)現(xiàn)各類實體瘤中也廣泛存在嵌合基因,但如何準確鑒定和注釋這些嵌合基因仍面臨挑戰(zhàn)[27]。嵌合基因具有癌細胞特異性,是理想的癌癥診斷標志物和治療靶點[59]。未來研究需開發(fā)更精準和高通量的嵌合基因檢測方法,提高檢測技術(shù)的靈敏度和特異度;針對嵌合基因產(chǎn)物開展系統(tǒng)化的靶向藥物研發(fā);深入研究非典型嵌合基因的功能和機制,推動嵌合基因在腫瘤精準診療中的科學應(yīng)用。