劉賽賽,劉澤宇,蔣樸瑩,陸 維,張全啟,2,程 潔,2??
(1. 中國海洋大學(xué)海洋生物遺傳學(xué)與育種教育部重點實驗室,山東 青島 266003;2. 青島海洋科學(xué)與技術(shù)試點國家實驗室 海洋漁業(yè)科學(xué)與食物產(chǎn)出過程功能實驗室,山東 青島 266237)
RNA干擾(RNA interference,RNAi)是由雙鏈RNA誘導(dǎo),抑制內(nèi)源基因表達(dá)的一種調(diào)控機(jī)制,在mRNA降解、翻譯抑制、轉(zhuǎn)座子沉默和維持基因組完整性等方面有重要作用[1-3]。RNAi的主要參與成分是RNA誘導(dǎo)的沉默復(fù)合體(RNA-induced silencing complex,RISC),Argonaute蛋白作為RISC的重要組成部分,通過與RISC的裝配參與到RNAi過程中[4]。許多研究表明,RNAi作用方式的多樣性與Argonaute家族基因的分化有關(guān)[5]。Argonaute家族包含兩個亞家族:AGO亞家族和PIWI亞家族。AGO蛋白多在生物體各組織中廣泛表達(dá),主要與siRNA/miRNA結(jié)合裝配進(jìn)入RISC,從而介導(dǎo)靶mRNA的沉默;PIWI蛋白多在生殖細(xì)胞中表達(dá),與piRNA結(jié)合形成piRNA復(fù)合物(piRNA complex,piRC),在生殖系轉(zhuǎn)座子和基因沉默中發(fā)揮作用[6-7]。近年的研究表明,RNAi過程中與抗病毒(siRNA)和轉(zhuǎn)座子沉默(piRNA)相關(guān)的基因常表現(xiàn)出快速進(jìn)化的特征,例如siRNA和piRNA途徑相關(guān)基因的快速進(jìn)化可能與病毒或轉(zhuǎn)座子同宿主的協(xié)同進(jìn)化有關(guān)[5,8]。目前相關(guān)研究多報道于無脊椎動物中,特別是基于果蠅的研究最為詳細(xì)[8-9]。而在脊椎動物中,piRNA途徑可以通過對轉(zhuǎn)座子和基因的調(diào)控在維持生殖細(xì)胞基因組的穩(wěn)定性和完整性、調(diào)控生殖細(xì)胞增殖、減數(shù)分裂和精子發(fā)生等過程中發(fā)揮重要作用[10-13]。然而,目前對RNAi不同途徑在脊椎動物特別是硬骨魚譜系中的進(jìn)化模式和功能的報道還相對較少。
硬骨魚類作為低等脊椎動物,是脊椎動物門中最大的類群,其繁殖發(fā)育策略豐富多樣,有單性生殖的、也有雌雄異體和雌雄同體的。雌雄異體魚的性腺發(fā)育包括:
(1)未分化型:原始性腺先發(fā)育成類似卵巢的結(jié)構(gòu),隨后一半個體的性腺發(fā)育成精巢,另一半個體的性腺發(fā)育成卵巢,如斑馬魚[14]。
(2)分化型:原始性腺直接發(fā)育成精巢或卵巢,如鯉魚[15]。
雌雄同體的魚類又分為:
(1)同步雌雄同體:個體性成熟后,性腺中同時存在精巢和卵巢,但精子和卵子在不同時期成熟以避免自體受精,如烏鱧[16]。
(2)次序雌雄同體,又分為雌性先熟和雄性先熟型,前者在性成熟前均為雌性,性成熟產(chǎn)卵后,卵巢轉(zhuǎn)變?yōu)榫?,表現(xiàn)為雄性,如黃鱔[17];后者則相反,性成熟前為雄性,性成熟后轉(zhuǎn)變?yōu)榇菩?,如黑鯛[18]。此外,環(huán)境因素(溫度、鹽度等)對魚類的性別決定和性腺分化也有巨大影響[19-23]。
魚類生活的水生環(huán)境復(fù)雜多樣,天敵種類繁多,多數(shù)魚類的繁殖方式為體外受精,精卵暴露在復(fù)雜多變的水域環(huán)境中,長期進(jìn)化形成了懷卵量大等特點以保證受精率,這都為其繁殖發(fā)育、配子發(fā)生、受精、胚胎發(fā)育以及遺傳改良育種等研究提供了優(yōu)良的材料。另外相比較哺乳類,魚類基因組中轉(zhuǎn)座子種類更多且更加活躍,更易對基因組造成損傷[24]。越來越多的研究表明,作為RNAi中轉(zhuǎn)錄和轉(zhuǎn)錄后基因表達(dá)的重要調(diào)控因子,多種非編碼RNA(如miRNA和piRNA等)都在動物生殖細(xì)胞中表達(dá),對原始生殖細(xì)胞的干性維持、自我更新和分化、生殖細(xì)胞減數(shù)分裂和精卵發(fā)生過程具有重要的調(diào)控作用[4,25]。其中piRNA參與生殖系中轉(zhuǎn)座子沉默并維持基因組的穩(wěn)定,對魚類的繁殖發(fā)育至關(guān)重要。已有研究表明,在雌雄異體的斑馬魚中,兩種Piwi蛋白之一的Ziwi蛋白是維持生殖系所必需的,Ziwi蛋白的丟失會導(dǎo)致減數(shù)分裂前的生殖細(xì)胞凋亡[26];在雌雄同體的黃鱔中,piRNA途徑基因在三種類型的性腺(卵巢、卵精巢、精巢)中均呈現(xiàn)高表達(dá),表明piRNA途徑基因在性逆轉(zhuǎn)過程中發(fā)揮關(guān)鍵作用[27]?;|(Lateolabraxmaculatus)隸屬鱸形目、鮨科、花鱸屬,為廣鹽、廣溫性魚類,是中國傳統(tǒng)的經(jīng)濟(jì)養(yǎng)殖魚類,近年來其養(yǎng)殖產(chǎn)量連續(xù)位居中國海水養(yǎng)殖魚類前列。花鱸經(jīng)淡水化處理后也可在淡水中進(jìn)行養(yǎng)殖,但成魚必須在海水中才能完成性成熟及繁殖過程[28]。因此,本研究鑒定了花鱸Argonaute家族基因,對哺乳動物和硬骨魚類siRNA/miRNA與piRNA途徑基因進(jìn)行了系統(tǒng)的分子進(jìn)化分析,利用魚類轉(zhuǎn)錄組數(shù)據(jù)比較了siRNA/miRNA和piRNA基因的表達(dá)特征,為硬骨魚類,特別是花鱸的生殖發(fā)育研究提供重要理論依據(jù)。
為鑒定花鱸基因組中的Argonaute家族基因,本文首先檢索了NCBI(http://www.ncbi.nlm.nih.gov)和Ensembl(http://www.ensembl.org)數(shù)據(jù)庫,收集到14種硬骨魚(牙鲆(Paralichthysolivaceus)、半滑舌鰨(Cynoglossussemilaevis)、大菱鲆(Scophthalmusmaximus)、斑馬魚(Daniorerio)、墨西哥脂鯉(Astyanaxmexicanus)、大西洋鱈(Gadusmorhua)、三棘魚(Gasterosteusaculeatus)、紅鰭東方鲀(Takifugurubripes)、綠斑鲀(Tetraodonnigroviridis)、羅非魚(Oreochromisniloticus)、青鳉(Oryziaslatipes)、花鳉(Poeciliaformosa)、斑劍尾魚(Xiphophorusmaculatus)、亞洲鱸(Latescalcarifer)) 和12種哺乳類(人(Homosapiens)、小鼠(Musmusculus)、負(fù)鼠(Monodelphisdomestica)、大象(Loxodontaafricana)、馬(Equuscaballus)、狗(Canisfamiliaris)、豬(Susscrofa)、牛(Bostaurus)、獼猴(Macacamulatta)、兔(Oryctolaguscuniculus)、羊(Ovisaries)、大鼠(Rattusnorvegicus)),共26個物種Argonaute家族基因的核酸序列,通過本地 BLAST (e-value=1e-5)比對花鱸基因組(GCA_004023545.1)獲得花鱸Argonaute基因家族成員序列。隨后,根據(jù)比對得到的花鱸Argonaute家族成員的蛋白序列,利用 SMART 在線工具(http://smart.embl-heidelberg.de)預(yù)測花鱸Argonaute蛋白序列的結(jié)構(gòu)域。利用Gene Structure Display Server2.0網(wǎng)站(http://gsds.cbi.pku.edu.cn/)分析花鱸Argonaute家族基因的基因結(jié)構(gòu)。
根據(jù)從Ensembl和NCBI數(shù)據(jù)庫獲得的26個選定物種(12種哺乳動物和14種魚類)和本地BLAST鑒定得到的花鱸(共27個物種)的Argonaute基因(Piwil1、Piwil2、Piwil3、Piwil4、Ago1、Ago2、Ago3和Ago4)的編碼序列,本文利用Muscle軟件對這些核酸序列進(jìn)行多序列比對。隨后使用MEGA 7.0軟件構(gòu)建最大似然法(Maximum Likelihood, ML)系統(tǒng)發(fā)生樹,基于最優(yōu)模型(GTR+G+I模型),自舉值(Bootstrap)為1 000次。
共線性分析是基于對花鱸Argonaute家族基因和其它物種對應(yīng)基因間的臨近基因進(jìn)行比較建立起來的。本文利用花鱸Argonaute成員序列號從花鱸基因數(shù)據(jù)庫中檢索得到各成員上下游基因的核酸序列,利用NCBI中的BLAST功能確認(rèn)花鱸Argonaute家族各成員上下游基因的名稱、方向及其在染色體上的定位,利用Genomicus數(shù)據(jù)庫(https://www.genomicus.biologie.ens.fr/genomicus)查找其它物種Argonaute基因上下游基因的線性排列。
本文通過分析15種硬骨魚(包括花鱸)和12種哺乳動物的編碼序列,來檢測它們在siRNA/miRNA和piRNA途徑中的不同選擇壓力。每個基因的編碼序列通過多序列比對,使用MEGA 7.0生成ML樹,確定各基因的系統(tǒng)發(fā)生關(guān)系。分子進(jìn)化分析使用PAML v4.9的Codeml程序,通過ML方法分別進(jìn)行點模型(Site model,SM)、枝模型(Branch model,BM)和枝-點模型(Branch-site model,BSM)檢驗[29-30]。
點模型采用ML估計非同義替換與同義替換的比率(dN/dS,ω值)和似然率檢驗(Likelihood ratio tests,LRTs)。本研究共使用六個點模型測試各密碼子中的正選擇位點:M0(單一比率)假設(shè)所有位點具有相同的ω值;M3(離散)假設(shè)有3類ω值,所有位點ω值呈簡單的離散分布趨勢;M1a(近中性)假設(shè)僅有保守位點(0<ω<1)和中性位點(ω=1)而沒有正選擇位點(ω>1)存在;M2a(正選擇)在M1a基礎(chǔ)上增加了第三類ω值,即假設(shè)除了保守位點和中性位點外,還存在正選擇位點(ω>1);M7(beta)假設(shè)所有位點的ω值屬于矩陣(0,1)并呈beta分布;M8(beta&ω)在M7基礎(chǔ)上增加另一類ω值(ω>1)。通過卡方(χ2)檢驗計算配對模型(M0對M3;M1a對M2a;M7對M8)的ML值之間的兩倍差(2ΔlnL),自由度等于配對模型之間參數(shù)數(shù)量的差,判斷兩個模型的ω是否差異顯著(M3對M0),并確定是否存在正選擇位點(M2a對M1a和M8對M7)。貝葉斯經(jīng)驗(The Bayes empirical Bayes,BEB)[29]用于評估正選擇下點模型的貝葉斯后驗概率。使用點模型計算的ω值(dN/dS)用于比較各基因在哺乳動物和硬骨魚譜系中的進(jìn)化速率[29-30]。
為進(jìn)一步檢驗各基因在不同譜系分枝(哺乳動物和硬骨魚)中的選擇壓力,本文進(jìn)行了枝模型檢驗[30]。單比率模型(One-ratio model)是零假設(shè),即假設(shè)整個樹具有一個ω值。然后將雙比率模型(Two-ratio model,背景枝為ω0,前景枝為ω1)與單比率模型進(jìn)行配對比較,通過LRTs來確定不同分枝是否有不同的ω值。將硬骨魚譜系分枝設(shè)置為前景枝,哺乳類分枝設(shè)置為背景枝,比較硬骨魚和哺乳類的進(jìn)化速率。此外,將花鱸分枝設(shè)置為前景枝,其它硬骨魚分枝設(shè)置為背景枝,來比較花鱸和其它硬骨魚的進(jìn)化速率。通過χ2分析2ΔlnL,確定LRT的顯著性。
為進(jìn)一步檢驗各基因在特定譜系中是否存在正選擇位點,本文進(jìn)行了枝-點模型檢驗[30]。將硬骨魚分枝和花鱸分枝分別設(shè)置為前景枝,并將其它分枝設(shè)置為背景枝。在model A中,為前景枝設(shè)置了3個ω值(0<ω0<1,ω1=1,ω2>1),為背景枝設(shè)置了2個ω值(0<ω0<1和ω1=1)。null model除ω2=1外,其它參數(shù)與model A的參數(shù)相似。使用標(biāo)準(zhǔn)自由度,通過計算model A與null model之間的2ΔlnL來進(jìn)行χ2分析,確定LRT的顯著性,并根據(jù)BEB后驗概率分析正選擇位點。最后將這些正選擇位點與Pfam數(shù)據(jù)庫中的蛋白序列和功能域進(jìn)行比對。
為比較siRNA/miRNA與piRNA途徑基因在各物種中的表達(dá)模式,本文從NCBI分別下載花鱸和亞洲鱸轉(zhuǎn)錄組數(shù)據(jù)(花鱸:腮-SRR7528883、胃-SRR7528884、肝-SRR7528886、腦-SRR7528887、脾-SRR752888、精巢-SRR7528885、卵巢-SRR2937376;亞洲鱸:卵巢-SRR1791597.1、精巢-SRR1791598.1、腦-SRR1791593.1)。牙鲆和半滑舌鰨[31]的基因表達(dá)從課題組轉(zhuǎn)錄組數(shù)據(jù)獲得。首先用fastqc檢測質(zhì)量,使用trimmomatic去除接頭和低質(zhì)量序列,使用hisat將優(yōu)化后序列比對到各物種參考基因組,使用StringTie進(jìn)行拼接組裝和表達(dá)量分析。斑馬魚[32]、肺魚[33]、腔棘魚[33]、黃鱔[27]、羅非魚[34]各基因表達(dá)情況均從文獻(xiàn)中引用。得到花鱸各基因的FPKM值后,計算log2(FPKM+1)值,通過MeV 4.90軟件對花鱸各基因的表達(dá)情況繪制熱圖。
通過本地BLAST比對花鱸基因組序列(GCA_004023545.1),本文共鑒定得到7個花鱸Argonaute家族成員,分為2個亞家族:AGO亞家族和PIWI亞家族?;|PIWI亞家族包含Piwil1和Piwil2,AGO亞家族包含Ago1、Ago2、Ago3a、Ago3b和Ago4共5個成員,其中Ago3具有兩個拷貝,在系統(tǒng)發(fā)生分析后分別命名為Ago3a和Ago3b。本文對可獲得的脊椎動物基因組進(jìn)行了同源搜索,比較硬骨魚類與哺乳類Argonaute家族基因的拷貝數(shù)。如表1中,哺乳動物多有7~8個Argonaute家族成員,其中包含4個AGO亞家族成員(Ago1、Ago2、Ago3和Ago4)和4個PIWI亞家族成員(Piwil1、Piwil2、Piwil3和Piwil4),僅在小鼠、大鼠和大象中未發(fā)現(xiàn)Piwil3。硬骨魚多包含5~7個Argonaute家族基因成員,其中所有硬骨魚均含有Piwil1和Piwil2,但與哺乳類不同的是,硬骨魚中不存在Piwil3和Piwil4。斑馬魚、大西洋鱈、牙鲆、大菱鲆、三棘魚、花鳉、羅非魚與花鱸中均發(fā)現(xiàn)兩個Ago3,分別為Ago3a和Ago3b;半滑舌鰨、紅鰭東方鲀、青鳉、斑劍尾魚、墨西哥脂鯉、亞洲鱸中只有1個Ago3;綠斑鲀斑點雀鱔Ago3基因缺失,大西洋鱈缺失Ago1基因。拷貝數(shù)結(jié)果顯示,各物種Argonaute家族成員數(shù)量上有所差別,但組成情況基本相似,是高度保守的基因家族。在高等脊椎動物中,一般都含有4個Ago基因(Ago1、Ago2、Ago3和Ago4),但在硬骨魚中卻有5個Ago成員,這可能是由于大約350萬年前,在脊椎動物中發(fā)生了兩次全基因組復(fù)制事件后,在硬骨魚中又發(fā)生了一次其特有的第三次全基因組復(fù)制事件[35],產(chǎn)生了一個硬骨魚特有的全基因組復(fù)制起源的Ago3基因。
表1 脊椎動物Argonaute家族基因的拷貝數(shù)
花鱸Argonaute家族基因結(jié)構(gòu)見圖1A。其中Ago1含有18個外顯子和17個內(nèi)含子;Ago2含有18個外顯子和17個內(nèi)含子;Ago3a含21個外顯子和20個內(nèi)含子;Ago3b含19個外顯子和18個內(nèi)含子;Ago4含16個外顯子和15個內(nèi)含子;Piwil1含18個外顯子和17內(nèi)含子;Piwil2含有19個外顯子和18個內(nèi)含子。我們使用SMART在線工具預(yù)測了花鱸Argonaute家族蛋白質(zhì)序列的結(jié)構(gòu)域,如圖1B所示,花鱸Argonaute家族蛋白成員都有一個完整的PIWI結(jié)構(gòu)域,除Ago4外都有一個位于PIWI結(jié)構(gòu)域上游的PAZ結(jié)構(gòu)域。此外,AGO亞家族成員(Ago1、Ago2、Ago3a、Ago3b和Ago4)在PAZ結(jié)構(gòu)域上游都有一個DUF1785結(jié)構(gòu)域,且兩者距離很近??傮w而言,花鱸Argonaute家族蛋白質(zhì)的各結(jié)構(gòu)域均較保守,PIWI結(jié)構(gòu)域較PAZ結(jié)構(gòu)域的保守性更強(qiáng),PAZ結(jié)構(gòu)和DUF1785結(jié)構(gòu)相距很近,可能與其功能有關(guān)。其它脊椎動物Argonaute家族蛋白中也都含有PAZ結(jié)構(gòu)域和PIWI結(jié)構(gòu)域,二者分別可以特異性結(jié)合small RNA的3’端和5’端[36-37]。重要結(jié)構(gòu)域的保守性與物種的進(jìn)化有一定聯(lián)系,由于功能位點的特異性,這些結(jié)構(gòu)域在進(jìn)化過程中往往出現(xiàn)較少的變異位點。在真核生物中,PAZ結(jié)構(gòu)域是位于N端包含130個氨基酸的區(qū)域,可以形成一個口袋狀的結(jié)構(gòu)結(jié)合small RNA的3’端;PIWI結(jié)構(gòu)域是位于C端包含300個氨基酸的區(qū)域,類似于核糖核酸酶H的結(jié)構(gòu)域,具有核酸酶活性,可以結(jié)合small RNA的5’端并介導(dǎo)靶RNA的降解[38-39]。
(圖A中方框代表外顯子,斜線隔斷的直線代表內(nèi)含子(內(nèi)含子被設(shè)置為等長)?;蛎蟮木幪枮榛|數(shù)據(jù)庫里的基因號。In panel A, exons are shown by the rectangle box, the straight line separated by diagonal lines represents introns (the introns are set to be equal in length). The numbers behind the gene name represents the gene ID in the L. amaculatus genome database.)
本文使用MEGA7.0構(gòu)建了哺乳動物和硬骨魚類Argonaute家族基因的系統(tǒng)進(jìn)化樹。如圖2所示,脊椎動物Argonaute家族成員可分為2大枝,支持Argonaute家族基因的2個亞家族(PIWI亞家族和AGO亞家族)。各Argonaute基因分枝中,哺乳類與硬骨魚類各聚為一枝,花鱸與硬骨魚類聚成一枝,均符合物種進(jìn)化地位。在PIWI亞家族中,哺乳動物Piwil1先與Piwil3和Piwil4聚為一枝,隨后再與硬骨魚類的Piwil1聚類;而所有脊椎動物的Piwil2則聚為另一支。Ago亞家族主要包含4個分支:Ago1、Ago2、Ago3(Ago3a和Ago3b)和Ago4。Ago3基因可分為兩枝:哺乳類Ago3和硬骨魚類Ago3,其中硬骨魚類Ago3基因又分別聚類為Ago3a與Ago3b兩枝,進(jìn)一步證明這兩個基因起源于硬骨魚特有的第三次全基因組復(fù)制事件。
為比較Argonaute家族基因在哺乳類和硬骨魚類中的起源和進(jìn)化過程,本文分析了物種間Argonaute家族基因的共線性關(guān)系。本文選用人、鼠、狗和馬四種哺乳動物以及斑馬魚、花鱸、墨西哥脂鯉和斑點叉尾鮰四種硬骨魚(見圖3A)。哺乳動物中AGO亞家族的上下游基因在染色體上的排列順序比較保守,其中Ago4、Ago1和Ago3多串聯(lián)排列于同一條染色體,呈連鎖分布,Ago2單獨位于另一條染色體。以人為例,Ago4、Ago1和Ago3自上而下依次排列,其上游基因分別是CLAPN、C1orf216、PSMB2、PSMB2、TFAP2E,下游基因分別是TEKT2、ADPRHL2、COL8A2、TRAPPC3、AMAP7D1。在硬骨魚中,AGO亞家族基因的共線性與哺乳類存在較大差異(見圖3A),硬骨魚中Ago1和Ago3a呈連鎖分布于同一條染色體,Ago2和Ago4多位于另一條染色體且兩者間距離較遠(yuǎn)。Ago3b的分布有兩種類型:斑馬魚和花鱸中,Ago3b、Ago2和Ago4位于同一條染色體上,但三個基因在斑馬魚和花鱸中的分布順序不同,在斑馬魚中為Ago3b-Ago2-Ago4;而在花鱸中為Ago4-Ago3b-Ago2;另一種情況在墨西哥脂鯉和斑點叉尾鮰中,Ago3b既不與Ago2和Ago4共染色體,也不與Ago1和Ago3a共染色體,而是單獨位于另一條染色體上。
(花鱸Argonaute基因用黑點標(biāo)記。Hsa:人,Mdo:負(fù)鼠,Mmu:小鼠,Laf:大象,Eca:馬,Cfa:狗,Ssc:豬,Bta:牛,Mamu:獼猴, Ocu:兔, Oar:羊, Rno:大鼠,Dre:斑馬魚,Ame:墨西哥脂鯉,Gmo:大西洋鱈,Gac:三棘魚, Tru:紅鰭東方鲀,Tni:綠斑鲀,Oni:羅非魚,Ola:青鳉,Xma:斑劍尾魚,Pfo:花鳉,Pol:牙鲆,Cse:半滑舌鰨,Sma:大菱鲆,Lca:亞洲鱸,Lma:花鱸。 Argonaute genes in L. maculatus are marked with black dots. Hsa: Homo sapiens, Mdo: Monodelphis domestica, Mmu: Mus musculus, Laf: Loxodonta africana, Eca: Equus caballus, Cfa: Canis familiaris, Ssc: Sus scrofa, Bta: Bos taurus, Mamu: Macaca mulatta, Ocu: Oryctolagus cuniculus, Oar: Ovis aries, Rno: Rattus norvegicus, Dre: Danio rerio, Ame: Astyanax mexicanus, Gmo: Gadus morhua, Gac: Gasterosteus aculeatus, Tru: Takifugu rubripes, Tni: Tetraodon nigroviridis, Oni: Oreochromis niloticus, Ola: Oryzias latipes, Xma: Xiphophorus maculatus, Pfo: Poecilia formosa, Pol: Paralichthys olivaceus, Cse: Cynoglossus semilaevis, Sma: Scophthalmus maximus, Lca: Lates calcarifer, Lma: Lateolabrax maculatus.)
PIWI亞家族的共線性分析,本文選用人、鼠、狗和馬四種哺乳動物以及三棘魚、羅非魚、亞洲鱸和花鱸四種硬骨魚(見圖3B)。哺乳動物中Piwil1和Piwil2分布在不同的染色體上,以人為例,Piwil1的上游基因有FZD10、TMEM132D、GLT1D1、SLC15A4,下游基因有RIMBP2、STX2、RAN、ADGRD1;Piwil2的上游基因有POLR3D、PHYHIP、BMP1、SFPTC,下游基因有SLC39A14、PPP3CC、SORBS3、PDLIM2。其它哺乳動物中Piwil1和Piwil2的上下游排布方式與此類似,只存在個別基因缺失的現(xiàn)象。硬骨魚中Piwil1和Piwil2位于同一條染色體上,硬骨魚的Piwil1與Piwil2基因的上下游基因都較為保守,我們以三棘魚為例,Piwil1的上游基因依次為fzd10、tmem132d、glt1d1、slc15a4,下游基因有rimbp2、stx2b、adgrd1,類似于哺乳動物Piwil1上下游基因排布,而Piwil2上下游基因排布與哺乳類Piwil2上下游基因排布差異較大,沒有共線性。
(A.AGO亞家族共線性分析;B.PIWI亞家族共線性分析。不同顏色的框代表不同的基因,Argonaute基因為紅色字體。A. Synteny analysis of AGO subfamily; B. Synteny analysis of PIWI subfamily. Boxes with different colors indicate different genes, and Argonaute gene is in red font.)
為比較哺乳動物和硬骨魚類piRNA途徑基因(Piwil1,Piwil2,Vasa,Mov10l1和Henmt1)和miRNA/siRNA途徑基因(Ago1、Ago2、Ago3a、Ago3b和Ago4)的分子進(jìn)化模式,本文使用PAML v4.9中的codeML程序進(jìn)行了一系列模型檢驗,包括點模型、枝模型和枝-點模型檢驗。
2.5.1 點模型檢驗 哺乳動物和硬骨魚類Argonaute家族成員的dN/dS值由點模型可知(見圖4),piRNA途徑基因的dN/dS明顯高于miRNA/siRNA途徑基因,說明piRNA途徑基因的進(jìn)化速率比miRNA/siRNA途徑基因更快。比較哺乳動物和硬骨魚譜系間的dN/dS值,除Henmt1外,piRNA途徑基因在硬骨魚中的進(jìn)化速率均高于哺乳動物,而miRNA/siRNA途徑基因中只有硬骨魚的Ago2和Ago3b的dN/dS值高于哺乳動物(見圖4)。
2.5.2 枝模型檢驗 枝模型檢驗可比較基因在不同譜系分枝上所受選擇壓力的差異。本文分別對硬骨魚祖先枝和所有硬骨魚譜系進(jìn)行前景枝標(biāo)記。標(biāo)記硬骨魚祖先枝為前景枝的結(jié)果(見圖5A)與點模型結(jié)果相似,piRNA途徑基因的ω值明顯高于miRNA/siRNA途徑基因。但除Piwil1和Mov10l1外,所有哺乳動物siRNA/miRNA途徑基因和piRNA途徑基因的ω0均高于硬骨魚的ω1,其中Ago3b、Ago4、Vasa和Henmt1在哺乳動物中的進(jìn)化速率顯著高于硬骨魚(P<0.05)。標(biāo)記所有硬骨魚譜系為前景枝的結(jié)果(見圖5B)顯示,piRNA途徑基因的ω值仍明顯高于miRNA/siRNA途徑基因。除Ago2、Ago3a和Ago4外,哺乳類與硬骨魚的ω值均有顯著差異。其中除Henmt1外,硬骨魚piRNA途徑基因的ω1均極顯著高于哺乳動物的ω0(P<0.01)。枝模型檢驗的結(jié)果與點模型相似,進(jìn)一步證明除Henmt1外,piRNA途徑基因在硬骨魚中比在哺乳動物中進(jìn)化得更快。
(Ago1, Ago2, Ago3a, Ago3b和Ago4為miRNA/siRNA途徑相關(guān)基因,Piwil1, Piwil2, Vasa, Mov10l和Henmt1為piRNA途徑相關(guān)基因。Ago1, Ago2, Ago3a, Ago3b, and Ago4 are involved in miRNA/siRNA pathway, and Piwil1, Piwil2, Vasa, Mov10l1, and Henmt1 are involved in piRNA pathway.)
2.5.3 枝-點模型檢驗 本文進(jìn)一步通過枝-點模型檢驗篩選piRNA/miRNA途徑基因中可能存在的正選擇位點。本文分別標(biāo)記硬骨魚祖先枝和所有硬骨魚譜系為前景枝進(jìn)行分析。在標(biāo)記硬骨魚祖先枝時(見表2),除Henmt1外,piRNA途徑基因均檢測到正選擇位點(P<0.01),其中Mov10l1檢測到13個正選擇位點,Piwil1有8個正選擇位點,Piwil2有2個,Vasa只有1個。Ago亞家族中并沒有檢測到正選擇位點。圖6中展示了Piwil1和Piwil2中的部分正選擇位點,其中Piwil1有3個正選擇位點位于PAZ結(jié)構(gòu)域中,可能與piRNA誘導(dǎo)靶mRNA切割的RNAi過程相關(guān)。
(A.標(biāo)記硬骨魚祖先枝為前景枝ω1;B.標(biāo)記全部硬骨魚譜系為前景枝ω1。黑色柱表示硬骨魚中各基因的ω1值,灰色柱表示哺乳動物中各基因的ω0值。*表示似然比檢驗(LRT)P<0.05; **表示P<0.01。A. Lable the teleost ancestral lineage as the foreground branch ω1; B. Lable all teleost lineages as foreground branch ω1. Black column indicates ω1 value of each gene in teleost lineages, and gray column indicates ω0 value of the mammalian lineages.* indicates P<0.05 and ** indicates P<0.01via LRT.)
表2 枝-點模型檢驗miRNA/siRNA和piRNA途徑基因正選擇位點(標(biāo)記硬骨魚祖先枝為前景枝)
(左邊為4種硬骨魚和4種哺乳類基于核酸序列的Piwil1和Piwil2的系統(tǒng)進(jìn)化關(guān)系,右邊為這8個物種Piwil1和Piwil2部分氨基酸序列比對,箭頭所指是通過枝-點模型檢測到的正選擇位點。The left panel is the phylogenetic analysis Piwil1 and Piwil2 based on nuclear acid sequences of 4 teleost and 4 mammalian species, and the right panel is the partial aligned amino acid sequence of Piwil1 and Piwil2 of the 8 species. The arrow indicates the positively selected sites detected via branch-site model test.)
標(biāo)記所有硬骨魚譜系為前景枝的枝-點模型檢驗結(jié)果(見表3)表明,正選擇位點僅存在于Piwil1、Piwil2和Mov10l1中,且在Mov10l1中發(fā)現(xiàn)了多達(dá)75個的正選擇位點,在Piwil1中發(fā)現(xiàn)43個正選擇位點,Piwil2中僅發(fā)現(xiàn)9個正選擇位點,但這些正選擇位點的結(jié)果均不顯著(P>0.05)。
2.5.4 花鱸與其它硬骨魚Argonaute家族基因分子進(jìn)化分析 最后本文以花鱸為前景枝,其它硬骨魚為背景枝,對花鱸和其它硬骨魚類譜系的Argonaute家族基因進(jìn)行枝模型檢驗(見圖7)。piRNA途徑基因的ω值仍明顯高于miRNA/siRNA途徑基因。其中,花鱸和其它硬骨魚之間的ω值在Ago3a、Ago4、Piwil1和Mov10l1中有極顯著差異(P<0.01),說明相比于其它硬骨魚類,花鱸的Ago3a、Ago4、Piwil1和Mov10l1可能受到更大的選擇壓力。
表3 枝-點模型檢驗miRNA/siRNA和piRNA途徑基因正選擇位點(標(biāo)記所有硬骨魚譜系為前景枝)
續(xù)表3
(黑色柱表示花鱸各基因的ω值,灰色柱表示其它硬骨魚各基因的ω值。*表示似然比檢驗(LRT)P<0.05; **表示P<0.01。Black column indicates ω value of each gene in L. maculatus, and gray column indicates ω value of other teleost lineages. *indicates P<0.05 and **indicates P<0.01 via LRT.)
在花鱸與其它硬骨魚類的枝-點模型檢驗中,正選擇位點存在于Ago4、Piwil1、Piwil2、Vasa和Mov10l1基因中(見表4)。其中,在Ago4中得到了19個正選擇位點;Mov10l1中有5個正選擇位點;在Piwil1中僅發(fā)現(xiàn)3個正選擇位點;在Piwil2和Vasa中均只發(fā)現(xiàn)2個正選擇位點,其中Piwil2有一個正選擇位點位于PAZ結(jié)構(gòu)域中。
為比較花鱸miRNA/siRNA和piRNA途徑基因的表達(dá)模式,本文首先對花鱸7個成體組織(腦、腸、肝臟、脾臟、鰓、卵巢和精巢)的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行表達(dá)分析。如圖8所示,5個Ago基因(Ago1、Ago2、Ago3a、Ago3b和Ago4)在不同組織中呈現(xiàn)泛表達(dá)。其中Ago2主要在腦和脾中表達(dá)。Ago3a在各組織中低表達(dá),而Ago3b主要表達(dá)于脾和鰓,Ago4主要表達(dá)于腦、脾、鰓和精巢。此外,5個piRNA基因(Piwil1、Piwil2、Vasa、Mov10l1和Henmt1)均在花鱸性腺中特異高表達(dá)(見圖8),表明它們可能在花鱸的生殖發(fā)育中有重要作用。
此外,本文通過轉(zhuǎn)錄組分析比較了不同生殖類型魚類(花鱸、亞洲鱸、牙鲆和半滑舌鰨)miRNA/siRNA和piRNA基因在性腺和腦中的表達(dá)情況(見圖9)。在這四種硬骨魚中,miRNA/siRNA途徑基因的表達(dá)均低于piRNA途徑基因,piRNA基因在性腺中的表達(dá)普
表4 枝-點模型檢驗花鱸miRNA/siRNA和piRNA途徑基因正選擇位點
(標(biāo)尺中“0~9”表示log2(FPKM+1)值。The value of log2(FPKM+1) is represented by “0~9” on the scale.)
遍高于在腦中的表達(dá),且在性腺中Piwil1的表達(dá)多高于Piwil2。就piRNA途徑基因而言,在適應(yīng)廣溫廣鹽水域的花鱸中,Piwil1和Piwil2在精巢中的表達(dá)高于卵巢,而Vasa、Henmt1和Mov10l1的表達(dá)情況則相反,在卵巢中的表達(dá)高于精巢;在雌雄同體,先雄后雌的亞洲鱸中,Piwil1、Piwil2和Vasa在精巢中的表達(dá)高于卵巢,而Mov10l1在卵巢中的表達(dá)高于精巢,Henmt1在精卵巢中的表達(dá)沒有明顯差異;在存在XX性逆轉(zhuǎn)偽雄魚的牙鲆中,piRNA途徑基因在偽雄魚精巢中的表達(dá)均高于卵巢,表現(xiàn)出精巢高表達(dá)。除Mov10l1外,其它基因在精卵巢中的表達(dá)均有極顯著差異;在存在ZW性逆轉(zhuǎn)偽雄魚的半滑舌鰨中,Piwil1在精巢和卵巢中的表達(dá)沒有明顯差異,Piwil2、Vasa和Henmt1在精巢中的表達(dá)高于卵巢,而Mov10l1在卵巢中表現(xiàn)出高表達(dá)。性逆轉(zhuǎn)偽雄魚精巢中的表達(dá)多低于正常精卵巢中的表達(dá)。除Mov10l1在正常發(fā)育雌魚的卵巢和性逆轉(zhuǎn)偽雄魚精巢中的表達(dá)存在顯著差異外,其余基因在雌雄性腺中的差異并不顯著。
Argonaute基因家族幾乎存在于所有真核生物中,但不同物種中其成員數(shù)有所差別。本研究共鑒定得到7個花鱸Argonaute基因家族成員(Ago1、Ago2、Ago3a、Ago3b、Ago4、Piwil1和Piwil2),而Piwil3和Piwil4僅在哺乳動物中存在,在硬骨魚中卻未發(fā)現(xiàn),這種差異是在哺乳動物譜系中獨立獲得還是在魚類譜系中丟失需進(jìn)一步通過低等脊椎動物的比較分析進(jìn)行驗證。據(jù)報道,Piwil3位于基因組中一個不穩(wěn)定的區(qū)域,該區(qū)域在哺乳動物中經(jīng)歷了多次復(fù)雜的重排,這可能是導(dǎo)致小鼠、大鼠和大象缺失Piwil3基因的原因[40]。此外,硬骨魚中還出現(xiàn)了一個由全基因組復(fù)制產(chǎn)生的Ago3復(fù)制。有研究發(fā)現(xiàn)斑馬魚位于16號和19號染色體上的兩個Ago3基因與人類位于1號染色體上的Ago3基因在染色體上的位置具有保守性[32]。斑馬魚的16號和19號染色體均由硬骨魚特有的全基因組復(fù)制過程中硬骨魚原染色體b復(fù)制產(chǎn)生,因此硬骨魚中的Ago3a和Ago3b都是哺乳動物Ago3基因的同源基因,且是由全基因組復(fù)制產(chǎn)生的[41]?;驈?fù)制產(chǎn)生的同源基因在進(jìn)化過程中可能經(jīng)歷不同的命運(yùn),包括去功能化(Nonfunctionalization),亞功能化(Subfunctionalization)和新功能化(Neofunctionalization)[42]。點模型結(jié)果顯示,硬骨魚Ago3b的dN/dS高于哺乳動物Ago3,而Ago3a的dN/dS與哺乳動物Ago3無明顯差異。此外,在標(biāo)記硬骨魚祖先枝的枝模型中,硬骨魚Ago3b的ω值顯著低于哺乳動物Ago3;在標(biāo)記全部硬骨魚譜系的枝模型中,硬骨魚Ago3b的ω值顯著高于哺乳動物Ago3,而硬骨魚Ago3a與哺乳動物Ago3的ω值差異并不顯著。標(biāo)記全部硬骨魚譜系的枝模型結(jié)果與點模型結(jié)果更為相似,這可能是由于點模型是基于硬骨魚分枝的每個位點分析,這與標(biāo)記所有硬骨魚分枝的枝模型更相似。Ago3b在硬骨魚中的進(jìn)化速率顯著高于哺乳類,這種快速進(jìn)化可能導(dǎo)致基因的新功能化。例如在斑馬魚、黃鱔和羅非魚中均有研究顯示,Ago3b在卵巢的表達(dá)量明顯高于精巢,而Ago3a在精卵巢中的表達(dá)并無顯著差異[27,32,34]。另有研究顯示,腔棘魚Ago3在卵巢中的表達(dá)量比精巢高[33]。本研究在花鱸基因組中也鑒定到了兩個Ago3基因,表達(dá)分析顯示花鱸Ago3a和Ago3b均在性腺中表達(dá),其精巢表達(dá)均高于卵巢。分子進(jìn)化結(jié)果顯示花鱸Ago3a的進(jìn)化速率更高,并且與其他硬骨魚的Ago3a具有極顯著差異。因此花鱸Ago3a的快速進(jìn)化及表達(dá)模式可能反映其在生殖發(fā)育中的重要作用。
(miRNA/siRNA和piRNA途徑基因在花鱸(A);亞洲鱸(B);雌核發(fā)育牙鲆(C);半滑舌鰨雌、雄和偽雄魚(D)腦和性腺中的表達(dá)。對牙鲆和半滑舌鰨各基因在性腺中的表達(dá)量進(jìn)行顯著性分析,**表示P<0.01,*表示P<0.05。Brain:腦;Testis:精巢;Ovary:卵巢;Male brain:雄魚腦;Female brain:雌魚腦;Neo male brain:偽雄魚腦;Gynogenetic female brain:雌核發(fā)育雌魚腦;Neo male testis:偽雄魚精巢;Gynogenetic female ovary:雌核發(fā)育雌魚卵巢。The expression of miRNA/siRNA and piRNA pathway genes in brain and gonads of L.maculatus (A); L. calcarifer (B); gynogenetic P. olivaceus (C); C. semilaevis (D). The expression of each gene in the gonad of Pol and Cse was analyzed significantly. ** indicates P<0.01, * indicates P<0.05.)
RNAi過程中與抗病毒(siRNA)和轉(zhuǎn)座子沉默(piRNA)相關(guān)的基因常表現(xiàn)出快速進(jìn)化的特征,例如siRNA和piRNA途徑相關(guān)基因的快速進(jìn)化可能與病毒或轉(zhuǎn)座子與宿主RNAi途徑的協(xié)同進(jìn)化有關(guān)[5,8]。與哺乳動物基因組相比,硬骨魚的基因組更簡潔,但其轉(zhuǎn)座子類型卻更多樣,多數(shù)硬骨魚中含有豐富的DNA轉(zhuǎn)座子,所有在脊椎動物中發(fā)現(xiàn)的轉(zhuǎn)座子超家族(Gypsy,BEL/Pao,ERV和DIRS等)大多數(shù)都存在于硬骨魚中[43]。這些轉(zhuǎn)座子的活性可能會影響個體對環(huán)境的長期適應(yīng)和生殖細(xì)胞基因組的穩(wěn)定性[44]。由于硬骨魚類多為體外受精,必須形成更多配子以保證受精率和后代成活率,因此硬骨魚配子發(fā)生的過程更易受到轉(zhuǎn)座子等的影響,piRNA途徑基因作為調(diào)控轉(zhuǎn)座子沉默的關(guān)鍵基因也將面臨更大的選擇壓力。本文在點模型與枝模型檢驗中均得到piRNA途徑基因在硬骨魚中進(jìn)化速率更快的結(jié)論,進(jìn)一步證明在硬骨魚中piRNA基因面臨更大選擇壓力。牙鲆和黃鱔中也有研究顯示piRNA途徑基因的快速進(jìn)化[27,45]。在枝-點模型中,piRNA途徑基因有更多的正選擇位點,且部分正選擇位點位于PAZ和PIWI結(jié)構(gòu)域中,這些位點可以提供不同的piRNA結(jié)合位點,形成Piwi-piRNA復(fù)合體,并調(diào)控多種類型的轉(zhuǎn)座子來維持基因組穩(wěn)定。對花鱸Argonaute基因的進(jìn)化分析發(fā)現(xiàn),花鱸Piwil1基因比其它硬骨魚進(jìn)化更快,預(yù)示花鱸生殖系中也可能存在針對轉(zhuǎn)座子多樣性的適應(yīng)性進(jìn)化。
PIWI蛋白通常特異性地在動物生殖系細(xì)胞中表達(dá),可與piRNA結(jié)合形成PIWI/piRNA復(fù)合物,抑制生殖系中移動遺傳元件、抵御轉(zhuǎn)座元件對基因組的侵襲和破壞,同時還參與調(diào)控蛋白編碼基因的表達(dá),維持生殖細(xì)胞的發(fā)育分化及配子形成[6-7,46-48]。在模式生物線蟲、果蠅和小鼠中,Piwi基因突變會引起生殖細(xì)胞發(fā)育缺陷,如生殖系建立失敗,生殖干細(xì)胞減數(shù)分裂停滯,精子發(fā)生受阻,最后造成不育[8,11,46]。除了模式生物以外,Piwi基因的表達(dá)模式在硬骨魚中也有報道。斑馬魚中Piwi基因特異性在精巢和卵巢中表達(dá),Ziwi的突變會導(dǎo)致轉(zhuǎn)座子轉(zhuǎn)錄水平增加以及阻遏生殖細(xì)胞的分化,最終導(dǎo)致生殖細(xì)胞的凋亡[26]。中華鱘(Acipensersinensis)Piwil1在生殖細(xì)胞中特異表達(dá)[49];青鳉(Oryziaslatipes)Piwil1和Piwil2主要在性腺中表達(dá)[50];牙鲆Piwil1主要在性腺中表達(dá)且在精巢中的表達(dá)量高于卵巢[45]。本研究中,花鱸和亞洲鱸均為廣鹽性魚類,在淡水中可以生長但不能完成性腺發(fā)育和配子成熟[28,51]?;|和亞洲鱸Piwil1和Piwil2在精巢中的表達(dá)高于卵巢,且Piwil1的表達(dá)量明顯高于Piwil2,這表明Piwil1和Piwil2基因可能參與不同的piRNA加工過程,并在精子發(fā)生過程中起著更重要的調(diào)控作用。牙鲆和半滑舌鰨都存在性別分化關(guān)鍵期受環(huán)境影響而發(fā)生的遺傳雌性向雄性轉(zhuǎn)變的性逆轉(zhuǎn)現(xiàn)象,牙鲆Piwil1和Piwil2在精巢中的表達(dá)量高于卵巢,半滑舌鰨Piwil2在精巢中的表達(dá)量高于卵巢,兩者Piwil1在性腺的表達(dá)量明顯高于Piwil2,說明Piwil1可能在偽雄魚與正常雄魚的生精過程中發(fā)揮不同的調(diào)控作用。然而Piwi基因在硬骨魚配子發(fā)生中的調(diào)控作用還需要進(jìn)一步的功能實驗來進(jìn)行驗證。