牟巧,楊雨薇,陳璐,杜志強,楊彩俠※
(1.長江大學(xué)動物科學(xué)學(xué)院,湖北 荊州 434025;2.吉林大學(xué)動物科學(xué)學(xué)院,吉林 長春 130062;3.東北農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,黑龍江 哈爾濱 150030)
在真核生物中,基因的表達受到不同調(diào)控元件相互作用的復(fù)雜調(diào)控,從而影響個體的發(fā)育[1]。3'UTR 即基因的3'端非翻譯區(qū)(3' untranslated regions,3'UTR),是真核細胞生物機體內(nèi)一種非常重要的調(diào)控機制。真核生物mRNA 的3'UTR 區(qū)存在許多基因表達順式調(diào)控元件,例如microRNA、lncRNA 和RNA 結(jié)合蛋白(RNA binding protein,RBP)的結(jié)合位點,這些作用元件調(diào)控mRNA 的穩(wěn)定性、運輸、亞細胞定位和翻譯[2]。此外,3'UTR 還可形成反式作用因子從而識別和結(jié)合特定蛋白質(zhì)來調(diào)控基因的表達,影響個體的生長發(fā)育[3]。
mRNA 轉(zhuǎn)錄本成熟需要經(jīng)過切割和多聚腺苷酸化[4]。具體過程是在mRNA 的多聚腺苷酸信號(polyadenylation signal,PAS)下游15~30 核苷酸處切割,然后在裂解產(chǎn)物的3'端合成多聚(A)尾巴(Poly(A)tail)[5]。PAS 是一個可以被RNA 結(jié)合因子識別的高度保守基序,在mRNA 轉(zhuǎn)錄終止和高效的多腺苷酸化過程中必不可少。典型的PAS 信號為AAUAAA,另外還有超過10 個較弱的變體,其中主要的一個是AUUAAA[6],這些變體更多為近端PAS[7]。
選擇性多聚腺苷酸化(alternative cleavage and polyadenylation,APA)是促進轉(zhuǎn)錄組多樣性的重要機制之一[8]。其發(fā)生機理是當(dāng)3'UTR 中存在多個PAS 信號時,可能產(chǎn)生APA[9]。APA 在基因表達調(diào)控、發(fā)育、分化、轉(zhuǎn)化和增殖過程中具有重要作用,APA 異常會導(dǎo)致各種疾病[10]。大多數(shù)哺乳動物基因含有多個PAS,在細胞核中通過APA 產(chǎn)生3'UTR長短不同的RNA 亞型[10]。不同長度的3'UTR 與microRNA 或RNA 結(jié)合蛋白等順式作用元件結(jié)合并相互作用的可能性不同,從而對mRNA 穩(wěn)定性、細胞定位和翻譯能力產(chǎn)生不同影響。此外,休眠的、翻譯上不活躍的mRNA 可在細胞質(zhì)進行多聚腺苷酸化,通過延長其在細胞質(zhì)中的聚(A)尾巴而被激活,此過程需要3'UTR 中的兩個主要順式元件PAS和CPE(cytoplasmic polyadenylation element)分別與裂解和聚腺苷酸化特異因子(cleavage and polyadenylation specificity factor,CPSF)和CPEB 家族結(jié)合共同調(diào)控完成[11]。CPE 的數(shù)量和序列,CPE和PAS 之間的距離,以及其他順式作用元件(如富含AU 元件,Pumilio 結(jié)合元件),共同決定了多聚腺苷酸化的程度和翻譯激活水平的強弱[12]。綜上,3'UTR 序列長度和包含的元件對基因的表達調(diào)控具有重要作用。
最新研究表明,APA 是一種轉(zhuǎn)錄組多樣性和基因表達調(diào)控的關(guān)鍵機制。盡管RNA-Seq 提供了全轉(zhuǎn)錄組信息,但是卻很少集中對標(biāo)準RNA-seq 的3'UTR進行分析,然而通過新的計算方法來提取和量化這些轉(zhuǎn)錄組中的APA 動力學(xué)是非常有意義的[13]。DaPars(Dynamic analysis of Alternative PolyAdenylation from RNA-seq)是一種新的生物信息學(xué)算法,是一個通過比較標(biāo)準RNA 序列直接推斷出動態(tài)的APA 使用情況的工具。給定帶注釋的基因模型,DaPars 可以推斷從頭開始的近端APA 位點[14]。因此,本文利用公共數(shù)據(jù)庫中的RNA-seq 數(shù)據(jù)集合[15],采用DaPars 標(biāo)準RNA-seq 中從頭識別動態(tài)的APA,探究伊比利亞豬和大白豬睪丸組織中mRNA 3'UTR長度變化和包含的近端APA 位點,為進一步的功能研究提供必要的信息。
參見發(fā)表文章的材料和方法[15]。具體材料為:屠宰約3 月齡的1 頭大白豬(45.0 kg)和1 頭伊比利亞豬(30.1 kg),獲取睪丸樣本。
1.2.1 原始數(shù)據(jù)處理
1.2.1.1 原始數(shù)據(jù)質(zhì)控
根據(jù)SRP 編號SRP008516 從NCBI 序列閱讀檔案(Sequence Read Archive,SRA)中下載伊比利亞豬和大白豬的睪丸轉(zhuǎn)錄組測序文件,共2 個原始數(shù)據(jù)(rawdata):SRR350917.2 和SRR350918.2,數(shù)據(jù)大小均為3.5 Gb,將其分別命名為IP(Iberian pig)和LW(Large White pig)。用fastqc 對下載的原始數(shù)據(jù)進行評估,主要包括:序列的測序質(zhì)量、GC 含量、reads 的平均GC 含量分布、reads 每個位置N 的比率、reads的長度分布、重復(fù)的reads 數(shù)、Kmer 含量等。
1.2.1.2 原始數(shù)據(jù)過濾
用 Fastp 0.20.0(https://github.com/OpenGene/fastp)對原始數(shù)據(jù)進行過濾,去除較短、低質(zhì)量、含較多N 的序列后,兩豬種各獲得1.2 Gb Clean Data。后續(xù)分析都基于Clean Reads。
1.2.2 Dapars 和IGV 分析
DaPars 分析所用到的基因模型(gene.bed)、轉(zhuǎn)錄本(symbol_map.txt)和染色體大小文件(susScr2.chrom.sizes.txt)從UCSC(http://www.genome.ucsc.edu/)下載。
整合基因組瀏覽器(Integrative genomics viewer,IGV)是一種高性能、易于使用的交互式工具,用于對基因組數(shù)據(jù)進行可視化探索。在IGV 中導(dǎo)入準備好的參考基因組文件(FASTA 格式)和排序后的bam 文件,便可以展示和查看基因結(jié)構(gòu)、蛋白、基因表達、調(diào)控、突變、比較基因組等多種信息。參考基因組(Sus_scrofa.Sscrofa11.1.dna.toplevel.fa)和注釋文件(Sus_scrofa.Sscrofa11.1.97.gtf)從ENSEMBL 數(shù)據(jù)庫下載。
1.2.3 KEGG 和GO 分析
從DaPars 分析結(jié)果中篩選出矯正P 值小于0.05 的77 個差異基因,通過Rstudio 進行GO(Genes Ontology) 和KEGG (Kyoto Encyclopedia Genes and Genomes)分析,研究這些基因參與的生物學(xué)功能途徑與信號通路。
1.2.4 PAS 和CPE 元件預(yù)測
由在線程序(http://genome.crg.es/CPE/server.html)預(yù)測長度和短序列豐度變化明顯的3'UTR 上存在的PAS 和CPE 元件個數(shù)、序列和位置。
1.2.5 microRNA 結(jié)合位點預(yù)測
利用TargeScan 7.0 和miRanda 兩種軟件分別預(yù)測長度和短序列豐度變化明顯的3'UTR 差異區(qū)可能的microRNA 結(jié)合位點,取兩軟件預(yù)測結(jié)果的交集做為最終結(jié)果。
DaPars 軟件預(yù)測伊比利亞豬和大白豬睪丸組織中mRNA 的近端APA 位點以及3'UTR 長度,結(jié)果顯示3'UTR 長度顯著差異(Padj.<0.05)的mRNA有77 個。GO 富集分析顯示,這些基因顯著(P<0.05)參與79 個生物學(xué)過程(Bioplogical process),包括類固醇生物合成過程(steroid biosynthetic process)、糖皮質(zhì)激素代謝過程(glucocorticoid metabolic process)、氧化應(yīng)激應(yīng)答(response to oxidative stress)、膽固醇代謝過程(cholesterol metabolic process)和有絲分裂細胞周期(mitotic cell cycle)等;23 個細胞組分(Cellular component),包括核糖核蛋白復(fù)合體(ribonucleoprotein complex)、內(nèi)質(zhì)網(wǎng)部分(endoplasmic reticulum part)等;17 個分子功能(Molecular function), 包括蛋白復(fù)合體結(jié)合(protein-containing complex binding)、翻譯因子活性(translation factor activity)、氧化還原酶活性(oxidoreductase activity)等(圖1)。KEGG 富集顯示這些基因顯著(P<0.05)參與FoxO 信號通路(FoxO signaling pathway)、谷胱甘肽代謝(Glutathione metabolism)、 內(nèi)質(zhì)網(wǎng)中的蛋白加工(Protein processing in endoplasmic reticulum)等19 條通路(圖2)。
圖1 77 個3'UTR 差異mRNA 的GO 富集分析
圖2 77 個3'UTR 差異mRNA 的KEGG 富集分析
設(shè)定差異閾值條件(FDR ≤0.05;|△PDUI|=|PDUI伊比利亞豬-PDUI大白豬|≥0.25 和|log2(PDUI伊比利亞豬/PDUI大白豬)|≥0.59),從DaPars 分析結(jié)果中篩選出3'UTR 長短有顯著差異的23 個mRNA,3'UTR 位置以及長度信息見表1。PDUI 值越大,指示遠端的PolyA 位點使用越多,3'UTR 較長。 5 個mRNA(Eif1b、Mettl9、Prpf18、Spg21 和Ranbp1)的PDUI 值大白豬大于伊比利亞豬,表明其3'UTR 較長,而其它18 個mRNA 的3'UTR 在伊比利亞豬中比較長。
表1 23 個3'UTR 顯著差異的mRNA
利用可視化軟件IGV 對3'UTR 差異mRNA 的3'UTR 區(qū)進行分析發(fā)現(xiàn),23 個中有3 個mRNA(Cct3、Ranbp1 和Cat)的3'UTR 長度和短序列覆蓋度差異最明顯(圖3),其3'UTR 的位置和長度如表2 所示。大白豬睪丸組織中RANBP1 的3'UTR 更長(302nt vs. 209nt),CCT3 和Cat 的3'UTR 在伊比利亞豬更長(CCT3: 312nt vs. 150nt; CAT: 757nt vs.306nt)。因此,大白豬睪丸組織中的RANBP1,伊比利亞豬睪丸組織中的CCT3 和Cat mRNA 的3'UTR由于較長,可能包含更多的與microRNA 和/或其它的順式作用元件,從而在轉(zhuǎn)錄后水平影響mRNA的穩(wěn)定性、定位和翻譯表達。
表2 3 個3'UTR 長度差異的mRNA IGV 分析
圖3 3 個3'UTR 長度差異的mRNA IGV 分析
為進一步了解兩個豬種中Cct3、Ranbp1 和Cat的3'UTR 中順式元件個數(shù)和位置差異,對PAS 和CPE 元件進行了預(yù)測。結(jié)果顯示,伊比利亞豬和大白豬Ranbp1 的3'UTR 包含兩個相同的CPE 位點,不包含任何PAS 位點,兩個CPE 位點之間間距為25 nt,序列分別為TTTTAAAT,TTTTAT(圖4A)。伊比利亞豬CAT 的3'UTR 有5 個CPE 位點(包括TTTTAAGTG,TTTTAT,TTTTCAT 和TTTTAAGT 4種序列)和2 個PAS 位點(ATTAAA 和AATAAA),第一個PAS 位點到上下游的CPE 位點的距離均為104nt,第2 個PAS 位點與上下游的CPE 位點分別相距60nt 和34nt,但在大白豬CAT 的3'UTR 中未預(yù)測到任何CPE 或PAS 位點(圖4B)。而CCT3 3'UTR 在兩個豬種中均未預(yù)測到任何PAS 或CPE位點。因此,CPE 的數(shù)量和序列,以及CPE 和PAS之間的距離差異可能影響mRNA 的多聚腺苷酸化程度,從而影響翻譯激活水平的強弱。
圖4 RANBP1 和CAT 3'UTR 中PAS 和CPE 元件預(yù)測
mRNA 的3'UTR 可能包含多個microRNA 結(jié)合位點,而microRNA 通過與其靶基因mRNA 的3'UTR 結(jié)合抑制翻譯。進一步預(yù)測CCT3、RANBP1和CAT 的3'UTR 中可能存在的microRNA 結(jié)合位點顯示,大白豬和伊比利亞豬睪丸RANBP1 3'UTR有4 個相同的microRNA 結(jié)合位點:miR-9787-3p、miR-9835-3p、miR-423-5p 和miR-191(圖5A)。大白豬和伊比利亞豬CCT3 3'UTR 除了包含3 個共有的microRNA 結(jié)合位點(miR-210、miR-9812-3p和miR-1842)外,伊比利亞豬中還額外包含7 個microRNA 結(jié)合位點:miR-9847-3p、miR-24-3p、miR-149、miR-221-5p、miR-128、miR-365-5p 和miR-450b-5p(圖5B)。CAT 的3'UTR 僅在伊比利亞豬存在miR-450b-5p 的結(jié)合位點(圖5C)。具體microRNA 結(jié)合位點的序列見表3。因此,3'UTR 較長的mRNA 中可能存在更多的microRNA 結(jié)合位點,從而影響mRNA 的穩(wěn)定性和翻譯水平。
表3 3'UTR 有差異的3 個mRNA 的microRNA 結(jié)合位點統(tǒng)計
圖5 3 個mRNA 的3'UTR 中microRNA 結(jié)合位點預(yù)測
mRNA 的3'UTR 可以與相關(guān)因子相互作用調(diào)控mRNA 穩(wěn)定性、定位和翻譯。此外,3'UTR 還可以介導(dǎo)蛋白質(zhì)-蛋白質(zhì)間的相互作用(PPI),調(diào)節(jié)多種蛋白質(zhì)特征,包括蛋白質(zhì)復(fù)合物的形成或翻譯后修飾,也改變蛋白質(zhì)的構(gòu)象[16]。因此,3'UTR 是基因調(diào)節(jié)的主要參與者,其介導(dǎo)的信息傳遞可以調(diào)節(jié)非氨基酸序列編碼的蛋白質(zhì)特征,能夠?qū)崿F(xiàn)局部功能和協(xié)同作用,是調(diào)節(jié)高等生物表型多樣性的重要工具[17]。
人類基因中的60%以上有APA 發(fā)生,大多數(shù)哺乳動物蛋白質(zhì)編碼基因的3'UTR 中包含多個多聚腺苷酸位點。因此,APA 導(dǎo)致許多具有不同3'UTR 末端的轉(zhuǎn)錄本產(chǎn)生,不但大大擴展了源自單個基因的mRNA 和蛋白質(zhì)的多樣性,而且也通過改變3'UTR 長度在轉(zhuǎn)錄后水平顯著影響基因的表達,進而參與調(diào)控包括mRNA 成熟,mRNA 穩(wěn)定性,RNA 翻譯和蛋白質(zhì)多樣化等多種生物學(xué)過程。最新研究表明,APA 產(chǎn)生的獨特轉(zhuǎn)錄本也參與調(diào)節(jié)動物繁殖的各個方面[18,19]。例如,在精子細胞分化過程中APA 頻繁發(fā)生,相關(guān)基因3'UTR 的縮短調(diào)控精子細胞的正常分化[20]。在胚胎發(fā)育過程中,基因的3'UTR 傾向于延長[5,21]。APA 也參與調(diào)控顆粒細胞和及其分化的不同特性[22]。研究顯示,動物不同組織之間的APA 可能不同[23,24]。本文比較研究了不同品種豬睪丸組織中APA 導(dǎo)致的不同長度3'UTR 的mRNA 異構(gòu)體,進一步分析了同一mRNA 不同長度3'UTR 中的順式功能元件,如CPE,PAS 和microRNA 結(jié)合位點。
本研究顯示RANBP1、CCT3 和CAT mRNA 的3'UTR 長度和豐度在伊比利亞豬和大白豬睪丸中均存在差異。Ran 結(jié)合蛋白1(RANBP1)是一種核質(zhì)穿梭蛋白,在多個細胞過程中發(fā)揮重要作用,包括細胞核質(zhì)運輸、核膜重建、DNA 復(fù)制以及紡錘體的組裝等[25,26]。CCT3 是分子伴侶CCT/TRiC 復(fù)合體的一個亞基,參與癌癥細胞的增殖和遷移,在乳腺癌、甲狀腺癌、肝癌等多種癌癥中起重要作用[27-29]。CAT 是已知最古老的抗氧化酶,作為H2O2和活性氮物質(zhì)代謝的關(guān)鍵酶,在細胞防御H2O2氧化損傷中起重要作用[30]。鑒于報道的這三個mRNA 分別與機體生長發(fā)育、癌細胞的擴散遷移和氧化還原反應(yīng)密切相關(guān),暗示它們3'UTR 長度的變化可能調(diào)控其基因的表達,影響其功能,進而導(dǎo)致伊比利亞豬和大白豬睪丸組織在繁殖性能方面的差異。
與大白豬相比,伊比利亞豬睪丸CCT3 mRNA的3'UTR 包含額外7 個microRNA 結(jié)合位點(miR-9847-3p,miR-24-3p,miR-149,miR-221-5p,miR-128,miR-365-5p 和miR-450b-5p),提供了不同的調(diào)控通道。CAT mRNA 的3'UTR 在伊比利亞豬中較長,而且僅在該豬種中存在5 個CPE 位點和2個PAS 位點。報道表明CPE 的數(shù)量和序列,以及CPE 和PAS 之間的距離,影響基因的特異翻譯[12]。因此,伊比利亞豬睪丸CAT mRNA 3'UTR 中的CPE 和PAS 可能調(diào)控CAT 蛋白的翻譯。而伊比利亞豬睪丸CAT mRNA 的3'UTR 包含一個額外的microRNA 結(jié)合位點,提供了更復(fù)雜的轉(zhuǎn)錄后表達調(diào)控途徑。這些mRNA 3'UTR 長度的顯著變化可能是轉(zhuǎn)錄后調(diào)控基因差異表達的重要方式,由此可能造成兩個豬種雄性生殖性能的差異。至于這些差異3'UTR 對兩個豬種雄性生殖功能的影響仍需進一步的實驗驗證。
本文分析結(jié)果表明,伊比利亞豬和大白豬睪丸中mRNA 3'UTR 存在位置和長度變化,這些mRNA參與多個GO 和KEGG 通路,其中RANBP1、CCT3和CAT 的3'UTR 變化最明顯。CCT3 3'UTR 上的microRNA 結(jié)合位點和CAT 3'UTR 上的PAS/CPE順式元件以及microRNA 結(jié)合位點構(gòu)成不同。本文結(jié)果為進一步實驗研究這些mRNA 3'UTR 對伊比利亞豬和大白豬雄性生殖功能的差別影響提供了信息和依據(jù)。