白少川,張樂超, 葛琳涵,郭艷麗,王德賀,李蘭會
(河北農(nóng)業(yè)大學動物科技學院,保定 071000)
內(nèi)源性逆轉(zhuǎn)錄病毒(endogenous retrovirus,ERVs)屬于長末端重復(LTR)逆轉(zhuǎn)座子中的一類,普遍存在于所有脊椎動物的基因組中,是外源性逆轉(zhuǎn)錄病毒整合在宿主基因組并按孟德爾規(guī)律遺傳的基因序列。脊椎動物基因組中ERVs已經(jīng)嵌入數(shù)百萬年,雞[1]、牛[2]、人[3]和鼠[4]基因組中ERVs分別占到1.3%、3.2%、8%和10%。
ERVs是古老病毒感染的“化石”,自侵入宿主生殖細胞后隨世代進化積累了大量突變,以阻止其組裝感染性病毒粒子,不能感染宿主細胞。雖然多數(shù)ERVs已經(jīng)失活,但是有些仍能在宿主基因組中轉(zhuǎn)座生成大量拷貝。新整合的ERVs對鄰近基因的表達產(chǎn)生調(diào)控作用,成為宿主進化的“發(fā)動機”,另外,其不受控制的擴展和表達也是對宿主生命的威脅。ERVs整合誘導宿主產(chǎn)生新的適應性遺傳變異和感染抗性,但也產(chǎn)生自發(fā)的免疫缺陷、癌變、神經(jīng)性退行性變化等負面效應[5]?,F(xiàn)代全基因測序和重測序技術積累了大量基因組數(shù)據(jù),有利推動了ERVs的進化、功能性、調(diào)控機制等研究。本文對ERVs的結(jié)構(gòu)、整合機制、在宿主的表達調(diào)控及其進化對宿主功能影響的研究進行綜述,為深入挖掘ERVs與宿主的共進化調(diào)控機制提供借鑒和參考。
侵入到宿主的外源病毒,用自身的逆轉(zhuǎn)錄酶將病毒基因組RNA轉(zhuǎn)錄為cDNA,利用整合酶將cDNA整合到宿主基因組中,完成自身基因組在宿主細胞的部署。之后,整合的原病毒轉(zhuǎn)錄為RNA,利用宿主的核糖體機制繁殖后代,產(chǎn)生更多的病毒形成對宿主的感染。一般情況下,逆轉(zhuǎn)錄病毒僅感染宿主體細胞,偶爾整合進入宿主生殖細胞,則以原病毒基因組形式永久地與宿主細胞DNA相結(jié)合,定位保持在染色體組上,并作為宿主基因組的一部分按孟德爾規(guī)律進行垂直傳遞遺傳,從而形成了ERVs[4]。ERVs隨宿主基因組世代遺傳,對宿主基因組進化具有重要作用。
ERVs全長7~11 kb,其典型結(jié)構(gòu)為5′ LTR-gag-pol-env-LTR 3′。LTR區(qū)在病毒RNA基因組逆轉(zhuǎn)錄過程中形成,是逆轉(zhuǎn)錄病毒表達的調(diào)控中心,包含有調(diào)控RNA轉(zhuǎn)錄的啟動子、增強子、聚腺苷酸化位點,以及多種轉(zhuǎn)錄因子結(jié)合位點;gag、pol和env是ERV的結(jié)構(gòu)基因,5′LTR區(qū)與gag基因間有引物結(jié)合位點(PBS),3′LTR區(qū)與env基因間有多嘌呤區(qū)(PPT)。PBS是逆轉(zhuǎn)錄過程中細胞tRNA的結(jié)合位點,PPT是正鏈DNA生成中引物結(jié)合的位點。由于LTR區(qū)的同源重組或非同源重組,大多數(shù)的ERVs內(nèi)部編碼區(qū)序列缺失,或者只剩下LTR區(qū)(solo-LTR),只有極少數(shù)整合較晚的ERVs仍保留有完整的基因組結(jié)構(gòu)。
由于ERVs與宿主具有相同的單堿基替換速率(10-9·年-1),比原外源病毒的進化速率(10-3·年-1)慢106,所以保留了外源病毒相似的基因組序列,使ERVs成為逆轉(zhuǎn)錄病毒基因組的“化石記錄”,從而由ERVs的基因組結(jié)構(gòu)變化可以推斷其與宿主的長期進化關系[6],利用ERVs的整合分析揭示了Kihnu綿羊的古老起源[7]。這些基因序列曾被認為是“冗余廢棄物”或“無用”DNA,不具備任何功能,但是,越來越多的研究發(fā)現(xiàn)ERVs參與早期的胚胎發(fā)育、腫瘤發(fā)生、免疫紊亂以及免疫系統(tǒng)正常功能等生理、病理活動。
雖然重組等變異造成ERVs序列的不完整,但宿主基因組仍有具備完整結(jié)構(gòu)和轉(zhuǎn)座轉(zhuǎn)錄活性的ERVs,宿主進化出多種機制嚴密調(diào)控成年體細胞和胚胎發(fā)育過程逆轉(zhuǎn)座和ERVs轉(zhuǎn)錄表達的發(fā)生[8]。
ERVs一般陷入在異染色質(zhì)內(nèi),被宿主的第一道防線表觀修飾機制沉默,哺乳動物5-甲基化胞嘧啶是典型的抑制性表觀修飾方式之一[9],DNA的甲基化通過胞嘧啶脫氨基酶家族誘導人ERV(HERV)基因組5-甲基化胞嘧啶脫氨基突變?yōu)樾叵汆奏ぃ瑢е洛e義突變或失活,從而抑制HERV的復制,保持宿主基因組的穩(wěn)定性[10]。甲基化水平低的2日齡雞法氏囊和心組織ALV-E1表達高于甲基化水平高的35日齡雞的表達,證明了甲基化對ERVs表達的調(diào)控作用[11]。Kuse等[12]發(fā)現(xiàn)LTR甲基化程度影響貓ERVs的復制能力,并且LTR區(qū)的A>T突變影響了啟動子活性,低活性的T型ERVs在貓基因組中生成了更多拷貝。Chung等[13]發(fā)現(xiàn)雙重miRNA抑制豬ERV-B的表達效率達到86%。
組蛋白修飾參與沉默早期胚胎干細胞的ERVs表達[14]。組蛋白去甲基化酶(KDM1A)、輔阻抑物(KAP1)和組蛋白去乙?;?HDAC)參與沉默過程,KDM1A沉默ERVs的啟動子,而組蛋白甲基轉(zhuǎn)移酶(ZFP42)與gag基因表達有關[15-17]。小鼠胚胎細胞的腦池病毒粒子(IAP)沉默是由組蛋白甲基轉(zhuǎn)移酶(SETDB1)和KAP1介導的,IAP的5′UTR區(qū)可能通過KRAB-ZFPs招募KAP1和SETDB1完成沉默[7,18-19]。
外源病毒傾向于整合在細胞的開放染色體,尤其是蛋白編碼基因附近,盡管內(nèi)源病毒可能具有相似的生物偏好,但人工或自然選擇可能剔除有害的內(nèi)源病毒元件。Lee等[1]發(fā)現(xiàn)雞全長GGERV10(Gallusgallusendogenous retrovirus 10)偏向定位于高AT含量(59.01%vs57.08%)的低基因密度區(qū)(3.83vs20.41個基因·Mb-1)。Mason等[20-21]利用obsERVer檢測地方雞基因組974種ALV-E整合,被發(fā)現(xiàn)的雞ALV-E增加到1 300種;但只有1.5%整合在基因編碼區(qū)外顯子中,顯著低于4.9%的隨機整合頻率。商業(yè)種雞群體中編碼區(qū)的ALV-E有顯著的剔除特征(26.7%vs51.8%的隨機整合),在蛋白編碼基因上下游10 kb范圍內(nèi)有8倍的富集特征(32.9%vs4.1%的隨機整合),地方雞群體中分別是40.7%和17.5%[21]。這反映了商品雞比地方雞更強的人工選擇,剔除了有害ALV-E整合,增強了有利效應。
基因組數(shù)據(jù)分析揭示ERVs一般反向整合于功能基因外部,與隨機整合理論矛盾,由于正向整合對典型剪切信號的潛在干擾,表明宿主自身強的凈化選擇效應[22]。禽EAV-HP反向整合在SLCO1B3基因5′UTR區(qū)形成綠殼蛋表型[23],TYR基因內(nèi)含子4的ALV反向整合造成雞的隱性白羽表型[24]。另外,整合位點側(cè)翼poly-A重復與ALV整合連鎖,有色羽不存在poly-A,但紅原雞存在[25]。Poly-A與隱性白羽雞ALV整合的連鎖,側(cè)面證明了負向選擇作用,poly-A缺失的ALV整合個體可能由于機體的嚴重危害而被凈化。
ERVs在宿主體內(nèi)的相對穩(wěn)定性,以及不同宿主同源序列的保守性表明ERVs和宿主間存在長期進化共生關系。ERVs表達參與哺乳動物的胎盤生成和胚胎發(fā)育是被研究最典型的宿主征用功能,其與宿主表型、胚胎發(fā)育和免疫調(diào)節(jié)的關系正被逐漸揭示。
被甲基化、乙?;纫种苹钚缘腅RVs在生殖細胞生成和受精卵發(fā)育的重編程時期,轉(zhuǎn)錄轉(zhuǎn)座活性失控,ERVs編碼蛋白合胞素就是被哺乳動物馴化為自身細胞功能的很好案例[26]。胎盤形成過程中HERV-W和HERV-FRD的env基因分別生成合胞素1和合胞素2,對胎盤合胞體的形成和維持滋養(yǎng)層細胞的融合起關鍵作用,合胞素發(fā)揮病毒編碼蛋白與宿主細胞膜融合的功能。這一功能被哺乳動物征用,使胎盤對母體子宮更具“侵略性”,并且使母體失去對胎兒的免疫排斥,從而為胚胎發(fā)育提供了進化優(yōu)勢[27]。
轉(zhuǎn)錄組學研究揭示了HERV表達與早期胚胎發(fā)育的復雜互作關系,LTR被征用為啟動子或增強子,提供如LBP9、NANOG、OCT4、GCM1、Sp1和GATA等轉(zhuǎn)錄因子家族的結(jié)合位點,調(diào)控附近胚胎發(fā)育和多潛能維持的功能基因[28]。人和小鼠ES細胞25%的NANOG和OCT4結(jié)合位點是由轉(zhuǎn)座子提供的,并且結(jié)合位點附近的基因是這些轉(zhuǎn)錄因子的功能靶標[6]。早期胚胎干細胞中ERVs轉(zhuǎn)錄生成lncRNA與OCT4(POU5F1)的反式激活互作,協(xié)同促進了特異ERVs表達[29-30],形成復雜的調(diào)控網(wǎng)絡精細調(diào)控早期胚胎發(fā)育。
ERVs的LTR被公認為宿主儲備的潛在順式調(diào)控元件,在進化過程被招募參與鄰近基因的轉(zhuǎn)錄調(diào)控。雞的隱性白羽、綠殼蛋、公雞henny性反轉(zhuǎn)羽毛等表型都是由于ERVs整合影響功能基因表達形成的。TYR基因內(nèi)含子4中7.5 kb的ALV反向插入引起雞隱性白羽,TYR轉(zhuǎn)錄產(chǎn)物有多種3′UTR區(qū)被截短的異常剪接體,外顯子5缺失,影響了跨膜域的翻譯??赡苄纬闪税麧{型而非跨膜型的TYR,不能正確定位至黑素小體,具有功能活性的黑色素催化合成受損[24]。Chang等[25]發(fā)現(xiàn)隱性白羽雞Tyr酶的表達水平明顯低于野生型,但在胚胎皮膚中表達差異不顯著,而10周齡皮膚表達差異極顯著,這說明ALV對宿主細胞基因的表達調(diào)控受到細胞環(huán)境的影響。長4 250 bp的EAV-HP反向整合在雞1號染色體SLCO1B3基因5′UTR區(qū),發(fā)揮增強子作用,SLCO1B3轉(zhuǎn)錄產(chǎn)物5′末端增加了EAV-HP的24 bp LTR序列[23],并且在雞卵巢和蛋殼腺中的表達量分別增加180和19倍[31],轉(zhuǎn)運更多的膽綠素到蛋殼,表現(xiàn)綠殼蛋表型。SLCO1B3基因啟動子區(qū)甲基化水平與其表達水平及蛋殼綠色深度呈顯著負相關,隨著甲基化水平的提高,CpG5和CpG8位點的甲基化會阻礙轉(zhuǎn)錄因子與啟動子的結(jié)合,從而在產(chǎn)蛋后期降低SLCO1B3的表達并導致蛋殼顏色更淺[32]。Li等[33]發(fā)現(xiàn)7 524 bp的ERV整合在雞10號染色體CYP19A1基因的5′UTR區(qū),3′LTR區(qū)的TATA box參與CYP19A1的轉(zhuǎn)錄,形成包含99 bp 3′LTR的CYP19A1轉(zhuǎn)錄本,并在皮膚組織異位表達,導致公雞性反轉(zhuǎn)產(chǎn)生henny羽毛特征。ev21整合在雞PRLR基因5′UTR區(qū),PRLR和SPEF2的重復基因與慢羽連鎖[34],但ev21是否與該重復區(qū)域的形成有關,是否影響PRLR的轉(zhuǎn)錄還有待挖掘。
ERVs整合引起其他脊椎動物表型變化。小鼠Agouti基因1C外顯子下游內(nèi)含子中反向整合5 357 bp 內(nèi)源逆轉(zhuǎn)錄病毒VL30,VL30內(nèi)部有另一種內(nèi)源逆轉(zhuǎn)錄病毒β4,兩種內(nèi)源逆轉(zhuǎn)錄病毒嵌套整合在Agouti基因的5′UTR區(qū),抑制Agouti基因的正常轉(zhuǎn)錄,形成純黑色被毛表型[35]。鼠內(nèi)源白血病毒Emv-3整合在肌球蛋白重鏈基因Myh內(nèi)含子區(qū),其轉(zhuǎn)錄剪切發(fā)生變化導致小鼠無被毛表型。逆轉(zhuǎn)錄轉(zhuǎn)座子插入到PMEL基因?qū)е掳拇罄麃喣裂蛉咨幻硇蚚36];7 125 bp的ERV插入KIT基因形成顯性白貓表型[37]。ERVs整合改變插入位點附近功能基因的正常表達,導致宿主表型發(fā)生變化。
ERVs進化出多種機制參與宿主免疫調(diào)節(jié)。人、貓、水貂、大鼠、小鼠等宿主胚胎發(fā)育以及生長發(fā)育階段ERVs編碼的env蛋白有抵抗外源逆轉(zhuǎn)錄病毒的感染功能[38-40]。env蛋白通過與外源病毒蛋白競爭細胞表面受體,阻止外源病毒的感染,也能有效塑造T細胞庫和體液反應的抗原[41],還具有超抗原誘發(fā)非特異T細胞激活功能[42];gag蛋白能干擾外源病毒侵入后的感染周期,影響病毒粒子的組裝或釋放從而發(fā)揮抗病毒感染作用,F(xiàn)v1蛋白通過與鼠ERVs衣殼結(jié)合,阻止衣殼分解和ERVs整合進入細胞染色質(zhì)[43]。
整合到宿主基因組的ERVs片段,尤其是LTR與誘導干擾素的轉(zhuǎn)錄調(diào)控因子結(jié)合,增強免疫基因的表達。整合在TP63基因上游的HERV-9的LTR起到增強子的作用,增強雄性生殖干細胞抗腫瘤能力,并保持生殖細胞的轉(zhuǎn)錄保真性[44-45]。TP53是重要的腫瘤抑制基因,其編碼的蛋白質(zhì)p53作為轉(zhuǎn)錄因子,在體細胞中參與DNA損傷的細胞凋亡過程,因此被視為“基因組的守護者”,人基因組中1/3以上的p53結(jié)合位點位于ERVs的LTR區(qū)域[46]。綜上表明,宿主招募ERVs的LTR豐富細胞轉(zhuǎn)錄因子的免疫調(diào)控網(wǎng)絡。
另外,ERVs產(chǎn)生的非編碼序列發(fā)揮抗病毒或抗感染基因的增強子作用,尤其是其雙向轉(zhuǎn)錄產(chǎn)物的生成,活化雙鏈RNA沉默途徑發(fā)動I型干擾和細胞凋亡。Chen等[47]發(fā)現(xiàn)去甲基化試劑處理雞CEF細胞后,ALV-E1轉(zhuǎn)錄激活,生成反義產(chǎn)物lncRNA釋放到細胞質(zhì)與TLR3結(jié)合并活化其信號途徑,誘導IFN-β相關基因表達發(fā)揮抗病毒效應。雞睪丸中有特異piRNA的表達,piRNA序列與ERV mRNA互補配對形成雙鏈,沉默ERVs轉(zhuǎn)錄后翻譯,因此逆轉(zhuǎn)座子誘發(fā)的病毒到宿主的基因流動可能產(chǎn)生RNA介導的、序列特異性反義免疫記憶,類似CRISPR/Cas系統(tǒng)[48-49]。piRNA生成是ERVs與宿主共進化的結(jié)果,家雞ERVs轉(zhuǎn)錄生成的一類piRNA在原雞中并無表達[50]。ERV轉(zhuǎn)錄的RNA增加,導致細胞溶質(zhì)中核酸的堆積,被核酸傳感器識別,誘導細胞產(chǎn)生抗病毒和炎癥反應的雙鏈RNA和cDNA[51]。Hu等[52]發(fā)現(xiàn)miR-155抑制了病毒感染過程中env的過表達,從而激發(fā)自然免疫。
ERVs主要定位于異染色質(zhì),被表觀遺傳沉默而保持穩(wěn)定狀態(tài),在人體正常組織中沒有轉(zhuǎn)錄活性,但在癌變細胞、神經(jīng)性病變組織中,有不正?;虿皇芸刂频腅RVs表達[53-55]。Montesion等[56]對8個HERVs的LTR區(qū)序列多態(tài)性及其腫瘤細胞轉(zhuǎn)錄活性進行比較分析,發(fā)現(xiàn)整合位點附近啟動子的通讀引發(fā)ERVs的轉(zhuǎn)錄,70%的乳腺腫瘤細胞中ERVs具有轉(zhuǎn)錄活性,并且其轉(zhuǎn)錄活性與LTR序列轉(zhuǎn)錄因子結(jié)合性的改變一致,特別是HOX-PBX、RFX3等轉(zhuǎn)錄因子結(jié)合位點的形成。說明整合位點、細胞環(huán)境對ERVs轉(zhuǎn)錄表達的重要性,LTR的序列結(jié)構(gòu)與宿主存在共進化關系。另外,外源病毒生成病毒蛋白增加轉(zhuǎn)錄因子與LTR的結(jié)合性,反式激活ERVs的表達,加重病變[41,57]。
家雞[58]、豬[59]ERVs整合較晚,仍具備轉(zhuǎn)錄活性和感染性,并能與宿主基因或外源病毒重組形成新的病毒。ALV-E與內(nèi)源逆轉(zhuǎn)錄病毒EAV-HP整合形成ALV-J亞型,導致肉雞骨髓性白血病、蛋雞廣譜性腫瘤[60]。MDV疫苗注射能誘導處于沉默狀態(tài)的ALV-E1、ALV-E21的表達,誘導淋巴瘤的較高發(fā)生率[61]。ALV-E的表達不僅能重組形成新的病毒,還引起家禽肌肉生長率和產(chǎn)蛋率等生產(chǎn)性能的下降。含有產(chǎn)生完整病毒粒子ALV-E10、ALV-E19或ALV-E12的來航雞造成年產(chǎn)蛋率降低8%~9%,蛋重降低2.2 g[62]。Ka等[63]對經(jīng)過45代選育的高體重和低體重白洛克雞cDNA芯片分析,發(fā)現(xiàn)低體重比高體重具有更多的ALV-E整合位點和表達,并且ALV-E高表達與母雞低體重存在保守的相關關系。Chen等[64]對18種ALVEs在我國地方雞、商品蛋雞、肉雞等8個品種中的群體分布檢測發(fā)現(xiàn),ALVEs的整合多態(tài)性與家雞的選育方向和選育程度存在關聯(lián)。ERVs在越南豬的拷貝數(shù)低于西方豬,并存在品種特異性[65]。Chiu和Vanderwoude[66]發(fā)現(xiàn)家貓ERVs通過直接或間接的基因調(diào)控對外源病毒感染具有宿主保護作用,表明內(nèi)源逆轉(zhuǎn)錄病毒的進化效應。
ERVs與宿主進化發(fā)育關系研究的難點之一在于:宿主基因組中存在高相似度的ERVs多拷貝序列。雖然測序技術的提高,增加了ERVs定位和序列檢測的準確度,但開展ERVs活性、與鄰近基因的表達關系、表觀調(diào)控和染色質(zhì)狀態(tài)等研究首先要明確ERVs的特異性。ERVs作為宿主基因組序列的整合成分,與宿主基因組的長期進化過程中被宿主征用為自身功能,參與免疫調(diào)節(jié)抑制外源病毒感染、對宿主的健康、疾病等多種生物過程發(fā)揮重要作用。探究ERVs在宿主基因組的進化及其調(diào)控表達對外源病毒的防控具有指導意義,通過PCR或RFLP技術對宿主ERVs進行檢測,利用基因敲除技術建立無ERVs的家雞或家豬,對轉(zhuǎn)基因雞、豬器官移植、雞胚疫苗或成纖維細胞制備具有重要意義。