許 靜,張 霞,劉志朋,王淑燕,李洪林,李小偉,王 配*,霍金龍*
(1.云南農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,昆明 650201;2.呂梁學(xué)院生命科學(xué)系,山西 呂梁 033001)
DAZL(Deleted in Azoospermia Like,類無精癥缺失)基因在雄性生殖細(xì)胞的增殖、發(fā)育、成熟以及精子發(fā)生中發(fā)揮重要功能[1],它是DAZ基因家族的重要成員,該家族基因編碼具有RNA結(jié)合基序和DAZ重復(fù)序列的蛋白質(zhì),且都在哺乳動物生殖細(xì)胞中特異性表達(dá)[2-3]。DAZL的表達(dá)是脊椎動物生殖細(xì)胞發(fā)育和分化的標(biāo)志[4],且在兩性配子發(fā)生中都必須[5]。DAZL幾乎在雄性動物精子發(fā)生整個過程均有表達(dá)[2],在原始生殖細(xì)胞的發(fā)育和遷移、精原細(xì)胞分化以及減數(shù)分裂的開始和進(jìn)行過程中都發(fā)揮重要作用[6]。DAZL 還是精子發(fā)生所必需的主要翻譯調(diào)節(jié)因子,可通過調(diào)節(jié)對精子發(fā)生各階段重要靶轉(zhuǎn)錄物蛋白的表達(dá)來促進(jìn)精子發(fā)生[4]。DAZL的缺失或突變會使雄性動物生殖細(xì)胞逐漸喪失、聯(lián)會失敗、減數(shù)分裂停滯等[4,7-8],從而導(dǎo)致不育。另外,有研究表明DAZL基因啟動子DNA甲基化模式的改變與雄性精子缺陷有關(guān)[9]。
版納微型豬近交系(Banna mini-pig inbred line,BMI)是具有高純合基因和明確遺傳背景的大型哺乳動物近交系,被廣泛應(yīng)用于生物醫(yī)學(xué)研究領(lǐng)域[10-11]。我們先前已證明DAZL在BMI 成年豬的睪丸組織中特異性表達(dá),并在豬睪丸細(xì)胞(ST)的細(xì)胞核中發(fā)揮重要功能[12]。本研究克隆獲得DAZL啟動子序列,獲悉其CpG 島、核心啟動子區(qū)域及轉(zhuǎn)錄因子結(jié)合位點,全轉(zhuǎn)錄組測序獲得DAZL在BMI 睪丸中的表達(dá)量,注釋DAZL基因并了解其重要功能,構(gòu)建DAZL的ceRNA 轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)并分析其表達(dá)調(diào)控;分析各物種DAZL及其相鄰基因獲悉保守同源性,構(gòu)建DAZL 的互作蛋白網(wǎng)絡(luò)并分析各蛋白的作用。研究結(jié)果可為深入探索DAZL在精子發(fā)生過程中的重要功能奠定基礎(chǔ)。
選用4頭來自版納微型豬近交系昆明原種豬場的12月齡成年BMI 公豬,活體去勢取睪丸組織樣品。
在NCBI 數(shù)據(jù)庫檢索豬DAZL基因5'端側(cè)翼區(qū)序列;使用Prime3 PLUS 篩選長度17~25 bp、GC 含量40%~60%、Tm值60~65 ℃、ATCG 分布均勻的一對引物(F:CCTGAGTTTCCGCACATGACAC;R:CTCCACTCACCATTACTGCGACA),由昆明擎科生物科技有限公司合成。以提取的BMI 基因組DNA為模板,PCR 擴(kuò)增DAZL啟動子序列。隨后瓊脂糖凝膠電泳檢測,并使用TaKaRa 膠回收試劑盒回收片段并送昆明擎科生物科技有限公司測序。利用BDGP 的Neural Network Promoter Prediction(https://fruitfly.org/seq_tools/promoter.html)工具查詢DAZL基因的核心啟動子區(qū),MethPrimer 工具(www.urogene.org/methprimer)查詢CpG 島,AliBaba2.1(generegulation.com/pub/programs/Alibaba2/index.html)工具查詢轉(zhuǎn)錄因子結(jié)合位點。
提取BMI 睪丸組織RNA 進(jìn)行建庫,使用Illumina Hiseq 4000 和Illumina novaseq 6000 平臺分別進(jìn)行RNA-seq和small RNA測序。利用Fastp軟件對獲得的測序數(shù)據(jù)進(jìn)行質(zhì)量分析,隨后采用bowtie2-2.1.0 軟件將處理后的RNA-seq 數(shù)據(jù)與豬核糖體數(shù)據(jù)庫以及豬參考基因組(Sus scrofa 11.1)比對。使用featureCounts[13]和salmon[14]計算DAZL基因的原始表達(dá)量和矯正表達(dá)量。使用bowtie2[15]軟件去除質(zhì)控后small RNA 數(shù)據(jù)中的rRNA、tRNA、snRNA 和snoRNA,將剩余數(shù)據(jù)與miRBase數(shù)據(jù)庫中每一個物種的miRNA序列比對,從而得到miRNA的表達(dá)量。
利用Uniprot 數(shù)據(jù)庫對豬DAZL進(jìn)行功能注釋,使用所測RNA-seq數(shù)據(jù)分析miRNA和lncRNA的表達(dá)量,用miRanda(hhttp://www.mirbase.org)和RNAhybrid2.1.2(https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid/submission.html)網(wǎng)站分析調(diào)控DAZL的miRNA 和lncRNA,使用Cytoscape 3.9.1[16]將高表達(dá)的miRNA和lncRNA可視化。
利用MegAlign軟件對多物種DAZL氨基酸序列進(jìn)行相似度分析并用R中的ggplot2包進(jìn)行可視化,利用WebLoge網(wǎng)站分析DAZL結(jié)構(gòu)域在各物種中的保守性,利用Genomicus-99.01 網(wǎng)站分析DAZL鄰近基因組區(qū)域的保守性及同源性。
利用String v11.0b 進(jìn)行互作蛋白分析,并用Cytoscape 3.9.1 可視化。利用R 中clusterProfiler 包將互作蛋白進(jìn)行GO和KEGG富集分析,并用ggplot2包可視化。利用轉(zhuǎn)錄組測序數(shù)據(jù)分析DAZL與這些蛋白編碼基因之間的表達(dá)量相關(guān)性,并用R 中circlize 包進(jìn)行結(jié)果可視化。
以BMI 基因組DNA 為模板,PCR 擴(kuò)增獲得DAZL基因5'側(cè)翼區(qū)長度為2 378 bp 的啟動子區(qū)域(圖1A)。利用MethPrimer 分析發(fā)現(xiàn),在DAZL基因5'側(cè)翼區(qū)-1 932~-2 272 bp 區(qū)存在一個長度為341 bp 的CpG 島(圖1B),其GC 百分比大于50%。核心啟動子分析發(fā)現(xiàn),序列中存在3 個核心啟動子(圖1C 紅色部分),其可信度分別為97%、98%和99%;轉(zhuǎn)錄因子結(jié)合位點預(yù)測結(jié)果顯示,啟動子區(qū)序列上存在Oct-1、HSE-bind、Pit-1a、GCN4、c-Rel、NF-kappa、Sp1、IRF-1、YY1和Krox-20等10種轉(zhuǎn)錄因子的潛在結(jié)合位點,其中Sp1結(jié)合位點有5個(圖1C藍(lán)色部分)。
圖1 DAZL啟動子序列克隆與分析Figure 1 Cloning and analysis of DAZL promoter sequence
轉(zhuǎn)錄組測序結(jié)果表明,DAZL基因在BMI睪丸組織樣品中的原始平均表達(dá)量為898.67,經(jīng)過進(jìn)一步矯正后的平均表達(dá)量(TPM)為653.50,其轉(zhuǎn)錄本與Ensembl數(shù)據(jù)庫中的DAZL轉(zhuǎn)錄本ENSSSCT00000078185相一致,定位在豬13 號染色體。DAZL基因在4 個BMI睪丸組織樣品中均具有較高的正表達(dá)(圖2)。
圖2 DAZL所處染色體位置,轉(zhuǎn)錄組測序的外顯子、內(nèi)含子豐度分析Figure 2 Chromosome location,abundance of exons and introns of DAZL based on transcriptome sequencing
功能注釋結(jié)果發(fā)現(xiàn),DAZL共參與15 個GO:其中生物學(xué)過程(Biological process)主要包括翻譯啟動的正向調(diào)控(GO:0045948-positive regulation of translational initiation)、3'-UTR 介導(dǎo)的mRNA 穩(wěn)定(GO:0070935-3'-UTR-mediated mRNA stabilization)、生殖細(xì)胞發(fā)育(GO:0007281-germ cell development)、細(xì)胞分化(GO:0030154-cell differentiation)、翻譯調(diào)控(GO:0006417-regulation of translation)和精子發(fā)生(GO:0007283-spermatogenesis)等6 個GO;細(xì)胞組分(Cellular component)主要包括細(xì)胞質(zhì)(GO:0005737-cytoplasm)、細(xì)胞核(GO:0005634-nucleus)和蛋白質(zhì)復(fù)合物(GO:0032991-protein-containing complex)等3 個GO;分子功能(Molecular function)主要包括翻譯激活活動(GO:0008494-translation activator activity)、mRNA 3'-UTR 結(jié)合(GO:0003730-mRNA 3'-UTR binding)、核酸結(jié)合(GO:0003676-nucleic acid binding)、RNA 結(jié)合(GO:0003723-RNA binding)、mRNA 結(jié)合(GO:0003729-mRNA binding)、蛋白結(jié)合(GO:0005515-protein binding)等6 個GO(圖3)。
圖3 DAZL的功能注釋及ceRNA調(diào)控網(wǎng)絡(luò)Figure 3 Functional annotation and ceRNA regulatory network of DAZL
ceRNA調(diào)控網(wǎng)絡(luò)圖顯示,BMIDAZL受ssc-miR-199a-5p、ssc-miR-199b-5p、ssc-miR-17-5p、sscmiR-103、ssc-miR-24-3p 和ssc-miR-107 等6 個miRNAs 靶向調(diào)控(圖3)。其中有多個lncRNA 與DAZL競爭性結(jié)合其對應(yīng)的miRNA。
BMI DAZL 與其他9 個哺乳動物的氨基酸序列比對發(fā)現(xiàn)它們的相似度均超過90%,其中與貓(XP_006936507)、狗(XP_025304761)、驢(XP_014697651)、馬(XP_005600968)的相似度高達(dá)到97%以上(圖4A),WebLoge 圖顯示結(jié)構(gòu)域RRM_DAZL 在各物種中較為保守(圖4B),說明DAZL 在各物種中具有較高的保守性和序列同源性。對各物種基因組中的DAZL相鄰基因進(jìn)行同基因分析(圖4C),結(jié)果表明雖然不同物種的DAZL位于不同染色體,但是豬與其他哺乳動物都具有較高保守的相鄰基因,尤其與偶蹄目動物(山羊、綿羊、駱駝)的相鄰基因以高度保守的方式分布。
圖4 DAZL氨基酸及其鄰近基因的保守性分析Figure 4 Conservation analysis of DAZL and its neighboring genes
蛋白互作分析顯示DAZL與多種蛋白相互作用(圖5A),互作緊密程度從高至低分別為PUM2、DAZAP2、SYCE1、SYCE2、PUM1、DDX4、NANOS3、DND1、STRA8 和PABPC1L 等。將這些蛋白進(jìn)行KEGG 富集分析發(fā)現(xiàn),主要參與細(xì)胞過程(cellular processes)、人類疾?。╤uman diseases)、有機(jī)系統(tǒng)(organismal systems)和環(huán)境信息處理(environmental information processing)等。其中包括調(diào)控干細(xì)胞多能性的信號通路(ssc04550:signaling pathways regulating pluripotency of stem cells)、卵母細(xì)胞減數(shù)分裂(ssc04114:oocyte meiosis)、脊髓小腦的共濟(jì)失調(diào)(ssc05017:spinocerebellar ataxia)、癌癥蛋白聚糖(ssc05205:proteoglycans in cancer)、細(xì)胞因子-細(xì)胞因子受體的相互作用(ssc04060:cytokine-cytokine receptor interaction)等通路(圖5B);GO 富集分析發(fā)現(xiàn)這些蛋白主要參與有性生殖(sexual reproduction)、精子發(fā)生(spermatogenesis)、卵子發(fā)生(oogenesis)、超分子復(fù)合物(supramolecular complex)、mRNA 結(jié)合(mRNA binding)和RNA 結(jié)合(RNA binding)等條目(圖5C)。利用轉(zhuǎn)錄組測序數(shù)據(jù)分析DAZL與這些蛋白編碼基因之間的表達(dá)量相關(guān)性,結(jié)果顯示在BMI 睪丸組織中,DAZL的表達(dá)量與SOHLH1顯著相關(guān)(圖5D)。
本研究以BMI基因組DNA為模板擴(kuò)增了DAZL基因5'側(cè)翼區(qū)長2 378 bp 的啟動子序列,包括3 個核心啟動子以及10 種轉(zhuǎn)錄因子結(jié)合位點。研究表明哺乳動物中大約60%的啟動子與CpG 島共定位[17],而CpG 二核苷酸上的胞嘧啶甲基化是真核生物中必不可少的表觀遺傳修飾[18]。DAZL基因5'端上游-1 932~-2 272 bp 啟動子序列存在一個CpG島,該CpG島可能參與了DAZL的表觀調(diào)控。
轉(zhuǎn)錄組測序獲得睪丸中DAZL基因原始及矯正后的平均表達(dá)量,DAZL基因的轉(zhuǎn)錄本與Ensembl數(shù)據(jù)庫中DAZL的ENSSSCT00000078185轉(zhuǎn)錄本一致,且DAZL在BMI睪丸組織樣品中高度表達(dá)。氨基酸序列相似性分析顯示豬DAZL 與其他9個物種的相似度均大于90%,保守結(jié)構(gòu)域分析發(fā)現(xiàn)該RRM_DAZL結(jié)構(gòu)域在各物種間十分保守,說明BMI DAZL在各物種世代演化的進(jìn)程中具有較高的保守性以及序列同源性。對各物種基因組中的DAZL相鄰基因分析表明,雖然不同物種的DAZL位于不同染色體,但是都具有較高保守的相鄰基因,尤其與山羊、綿羊及駱駝的相鄰基因以高度保守的方式分布。
功能注釋結(jié)果表明DAZL主要參與翻譯啟動的正向調(diào)控、蛋白結(jié)合、RNA 結(jié)合、mRNA 結(jié)合、細(xì)胞分化、翻譯調(diào)控和精子發(fā)生等。靶基因預(yù)測表明DAZL被ssc-miR-103、ssc-miR-107、ssc-miR-17-5p、ssc-miR-199a-5p、ssc-miR-199b-5p 和ssc-miR-24-3p靶向調(diào)控,這些miRNAs參與了豬精子發(fā)生、結(jié)構(gòu)完整性、運(yùn)動性和代謝等過程[19]。其中ssc-miR-103參與豬的多種生物學(xué)過程,包括大腦發(fā)育、脂質(zhì)代謝、脂肪細(xì)胞分化、造血和免疫[20]。ssc-miR-107 參與有性生殖、雄性配子生成、精子發(fā)生及GnRH、Wnt和MAPK信號通路[21]。miR-17-5p在睪丸早期精原細(xì)胞和精母細(xì)胞中表達(dá)最低,隨生殖細(xì)胞的成熟表達(dá)不斷增高,并在精子發(fā)生中起重要作用[22]。sscmiR-199a-5p 和ssc-miR-199b-5p 可影響豬的胚胎著床[23]。ssc-miR-24-3p 在豬精子和精漿中表達(dá)豐富,并在精子和精漿之間穿梭,與精子運(yùn)動功能有關(guān)[24]。這6個重要的miRNAs可為深入研究DAZL在豬生殖方面的調(diào)控機(jī)制提供依據(jù)和方向。
蛋白互作網(wǎng)絡(luò)分析顯示DAZL與PUM2、DAZAP2、SYCE1、SYCE2、PUM1、DDX4、NANOS3、DND1、STRA8 和PABPC1L 等多個蛋白相互作用。這些蛋白幾乎都在與精子發(fā)生相關(guān)的細(xì)胞中表達(dá),并在精子發(fā)生過程中發(fā)揮重要作用[25-34]。其中SYCE1 和SOHLH1 還與生育能力有關(guān),其突變導(dǎo)致兩性或雄性不育[35-36]。轉(zhuǎn)錄組測序數(shù)據(jù)和蛋白編碼基因的表達(dá)量相關(guān)性分析表明,在BMI 睪丸組織中,DAZL的表達(dá)量與SOHLH1顯著相關(guān),為SOHLH1和DAZL的進(jìn)一步互作研究指明了方向。上述互作蛋白的GO和KEGG 富集分析發(fā)現(xiàn),這些蛋白主要參與精子發(fā)生、卵子發(fā)生、有性生殖等重要生殖相關(guān)通路,為深入研究DAZL在BMI中的功能奠定了基礎(chǔ)。
綜上所述,本研究克隆了豬DAZL基因的啟動子序列并分析了其結(jié)構(gòu)特征;獲得DAZL在睪丸組織中的表達(dá)量;注釋基因功能,并構(gòu)建了ceRNA 轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò);比對各物種DAZL氨基酸序列及DAZL鄰近基因,解釋了其保守同源性;分析蛋白功能,并構(gòu)建了蛋白互作網(wǎng)絡(luò)。研究結(jié)果為后期深入研究DAZL在BMI 精子發(fā)生過程中的作用機(jī)制奠定了基礎(chǔ)。
四川農(nóng)業(yè)大學(xué)學(xué)報2023年6期