嚴(yán)璐琪,郭香,巫旗生,祁劍飛,寧岳,王曉清*,曾志南*
(1.湖南農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,湖南 長沙 410128;2.水產(chǎn)高效健康生產(chǎn)湖南省協(xié)同創(chuàng)新中心,湖南 常德415000;3.福建省水產(chǎn)研究所,福建 廈門 361000)
?
葡萄牙牡蠣外套膜轉(zhuǎn)錄組測序及殼色基因挖掘
嚴(yán)璐琪1,2,郭香3,巫旗生3,祁劍飛3,寧岳3,王曉清1,2*,曾志南3*
(1.湖南農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,湖南 長沙 410128;2.水產(chǎn)高效健康生產(chǎn)湖南省協(xié)同創(chuàng)新中心,湖南 常德415000;3.福建省水產(chǎn)研究所,福建 廈門 361000)
采用Illumina高通量測序平臺對黑殼與金殼葡萄牙牡蠣(Crassostrea angulata)外套膜組織開展轉(zhuǎn)錄組測序研究,其中黑殼組總計產(chǎn)出5 857 718 092 nt數(shù)據(jù),篩選后的干凈閱讀子58 004 560個;金殼組產(chǎn)出6 727 447 326 nt數(shù)據(jù),干凈閱讀子66 614 854個。將發(fā)掘的新基因與COG、GO、KEGG、Swiss-Prot、NR數(shù)據(jù)庫進(jìn)行序列比對,最終得到各數(shù)據(jù)庫注釋的新基因數(shù)量分別為147、397、203、567、1 347個。通過對差異表達(dá)基因的序列進(jìn)行生物學(xué)功能注釋和聚類分析以及利用已知貝殼基質(zhì)蛋白序列進(jìn)行搜索,鑒定出 14條可能與殼色表達(dá)有關(guān)的貝殼基質(zhì)蛋白基因,其中5條下調(diào)基因可能與金殼基因表達(dá)相關(guān)。
葡萄牙牡蠣;殼色;轉(zhuǎn)錄組
投稿網(wǎng)址:http://xb.ijournal.cn
葡萄牙牡蠣(Crassostrea angulata)屬軟體動物門(Mollusca),雙殼綱(Bivalvia),珍珠貝目(Pterioida),牡蠣科(Ostreidae),是廣泛分布于世界各地的重要經(jīng)濟(jì)貝類。2013年中國牡蠣的總產(chǎn)量為4 218 644 t,占全國貝類養(yǎng)殖總產(chǎn)量的33.1%[1]。為進(jìn)一步發(fā)展牡蠣生產(chǎn),目前已有關(guān)于葡萄牙牡蠣選育研究的報道[2]。牡蠣的視覺性狀越來越受到消費者和育種人員的關(guān)注[3]。貝類的殼色是受遺傳控制的。海產(chǎn)經(jīng)濟(jì)貝類殼色研究主要是針對濱螺、皺紋盤鮑、海灣扇貝、牡蠣和蛤類[4]等。通過殼色選育,已培育出“中科紅”海灣扇貝新品種[5]。太平洋牡蠣殼色在大多數(shù)情況下呈正態(tài)分布,具有數(shù)量性狀遺傳特征,但在個別家系中,其殼色僅僅受少數(shù)幾個主效基因的控制[6-7]。
目前,葡萄牙牡蠣研究主要集中在育種、養(yǎng)殖方面[8-10],關(guān)于分子生物學(xué)研究方面的尚少[11]。轉(zhuǎn)錄組測序(RNA-seq)是對某一物種的mRNA進(jìn)行高通量測序,具有高通量、低成本、高效率等特點,有助于快速獲得大量分子生物學(xué)信息。筆者應(yīng)用RNA-seq技術(shù)對金殼和黑殼葡萄牙牡蠣進(jìn)行高通量轉(zhuǎn)錄組測序分析,描繪葡萄牙牡蠣的轉(zhuǎn)錄組圖譜,篩選與葡萄牙牡蠣殼色相關(guān)的基因,旨在為葡萄牙牡蠣基因結(jié)構(gòu)信息的完善及潛在新基因的挖掘提供參考數(shù)據(jù)。
1.1樣品的采集
用黑殼和金黃殼色葡萄牙牡蠣親本各1個構(gòu)建全同胞家系,分別選取黑殼與金殼子代個體各3個,采集外套膜組織樣品,置于液氮中速凍,于-70 ℃保存,備用。
1.2RNA的提取
使用Trizol試劑分別提取黑殼與金殼葡萄牙牡蠣外套膜組織的總RNA[12],分別采用Nanodrop、Qubit 2.0、Aglient 2100方法檢測RNA樣品的純度、濃度和完整性等,樣品RIN≥9。
1.3RNA文庫的構(gòu)建及測序
取5 μg RNA,用帶有Oligo(dT)的磁珠富集其中的mRNA,加入Fragmentation Buffer將mRNA進(jìn)行隨機打斷。以mRNA為模板,用六堿基隨機引物(random hexamers)合成第1條cDNA鏈,然后加入緩沖液、dNTPs、RNase H和DNA polymerase I合成第2條cDNA鏈,利用AMPure XP beads純化cDNA。將純化的雙鏈cDNA進(jìn)行末端修復(fù),加A尾并連接測序接頭,然后用AMPure XP beads進(jìn)行片段大小選擇,最后通過PCR富集,得到cDNA文庫。
文庫構(gòu)建完成后,分別使用Qubit 2.0和Agilent 2100對文庫的濃度和插入片段大小進(jìn)行檢測,待檢測合格后,用Illumina HiSeq 2500進(jìn)行高通量測序,測序讀長為PE100。
1.4轉(zhuǎn)錄組數(shù)據(jù)分析
由Illumina HiSeq 2500測序所得的原始數(shù)據(jù)稱為原始測序序列(Raw Data)。對Raw Data進(jìn)行數(shù)據(jù)過濾,去除其中的接頭序列及低質(zhì)量 Reads,獲得高質(zhì)量的Clean Data。將Clean Data與太平洋牡蠣的參考基因組進(jìn)行序列比對,獲得Mapped Data。基于Mapped Data,進(jìn)行插入片段長度檢驗、隨機性檢驗等測序文庫質(zhì)量評估和表達(dá)量分析、可變剪接分析、新基因發(fā)掘和基因結(jié)構(gòu)優(yōu)化等。根據(jù)基因在不同樣品或不同樣品組中的表達(dá)量進(jìn)行差異表達(dá)分析、差異表達(dá)基因功能注釋和功能富集等。
將FPKM[13](fragments per kilobase of transcript per million fragments mapped)作為衡量轉(zhuǎn)錄本或基因表達(dá)水平的指標(biāo)。
基于太平洋牡蠣基因組序列,使用Cufflinks[13]軟件對Mapped Reads進(jìn)行拼接,并與原有的基因組注釋信息進(jìn)行比較,尋找原來未被注釋的轉(zhuǎn)錄區(qū),發(fā)掘葡萄牙牡蠣的新轉(zhuǎn)錄本和新基因,從而補充和完善原有的基因組注釋信息。
2.1測序數(shù)據(jù)分析及注釋
經(jīng)Illumina HiSeq 2500深度測序,得到原始序列數(shù)據(jù),其中黑殼組總計產(chǎn)出數(shù)據(jù)5 857 718 092 nt,去除接頭序列、空讀序列以及低質(zhì)量序列后,得到干凈閱讀子58 004 560個;金殼組產(chǎn)出數(shù)據(jù)6 727 447 326 nt,干凈閱讀子66 614 854個,總計12.59 Gb Clean Data。堿基組成和質(zhì)量分析結(jié)果表明,原始測序數(shù)據(jù)的堿基組成情況良好(圖 1),低質(zhì)量堿基測序序列(<30)的比例均低于10%(圖2)。此結(jié)果說明測序質(zhì)量良好。與太平洋牡蠣基因組的比對分析結(jié)果表明,黑殼色和金殼色葡萄牙牡蠣分別有38 090 056條(65.76%)和43 081 54條(64.67%)比對到參考基因組上。
圖1 黑殼色葡萄牙牡蠣(左)和金殼色葡萄牙牡蠣(右)原始數(shù)據(jù)的堿基組成Fig.1 Bases content distribution of black shell and golden shell Crassostrea angulata
圖2 黑殼色葡萄牙牡蠣(左)和金殼色葡萄牙牡蠣(右)原始數(shù)據(jù)堿基的質(zhì)量評分Fig.2 Base quality distribution of black shell and golden shell Crassostrea angulata
過濾掉編碼肽鏈過短(少于 50個氨基酸殘基)或只包含單個外顯子的序列,在葡萄牙牡蠣轉(zhuǎn)錄組中共發(fā)掘1 856個新基因。使用BLAST[14]軟件將發(fā)掘的新基因與COG、GO、KEGG、Swiss-Prot、NR數(shù)據(jù)庫進(jìn)行序列比對,獲得新基因的注釋信息,最終得到各數(shù)據(jù)庫注釋的新基因數(shù)量分別是 147、397、203、567、1 347個。
2.2基因差異表達(dá)分析
在差異表達(dá)基因檢測過程中,將Fold Change≥2 且FDR<0.01作為篩選標(biāo)準(zhǔn),結(jié)果表明,黑殼色葡萄牙牡蠣與金殼色葡萄牙牡蠣之間有 1 082個差異表達(dá)基因,分別有707個上調(diào)基因,375個下調(diào)基因。
將上述差異表達(dá)基因進(jìn)行功能注釋到 COG、GO、KEGG、Swiss-Prot、NR庫,成功獲得注釋的基因數(shù)分別為193、370、156、553、1 025個。葡萄牙牡蠣的差異基因在功能注釋過程中所匹配的基因序列主要來自有基因組數(shù)據(jù)的太平洋牡蠣(Crassostrea gigas),占太平洋牡蠣基因組數(shù)據(jù)的96.39%。
與COG數(shù)據(jù)庫進(jìn)行比對后的差異表達(dá)基因可歸屬于21個大類(圖3),數(shù)量最多的功能類為一般功能預(yù)測類(R),達(dá)56條,其余依次為未知功能類(S)、氨基酸轉(zhuǎn)運和代謝類(E)、次生代謝物生物合成、轉(zhuǎn)運和代謝類(Q)、信號轉(zhuǎn)導(dǎo)機制類(T)。
圖3 差異表達(dá)基因經(jīng)COG注釋后各功能分類基因的數(shù)目Fig.3 Functional classification of DEGs by COG
將葡萄牙牡蠣差異表達(dá)基因注釋到GO庫,共獲得370個注釋結(jié)果,包含3個主要分支,即細(xì)胞組分、分子功能和生物學(xué)過程。在細(xì)胞組分方面,包含差異表達(dá)基因最多的二級功能是細(xì)胞部分類、細(xì)胞類、細(xì)胞器類;在分子功能方面,包含差異表達(dá)基因最多的二級功能是結(jié)合活性、催化活性;在生物學(xué)過程方面,所包含差異表達(dá)基因最多的二級功能是單組織過程和細(xì)胞過程(圖4)。
圖4 差異表達(dá)基因GO二級節(jié)點的注釋統(tǒng)計結(jié)果Fig.4 Statistical map of DEGs on two level node annotation by GO
葡萄牙牡蠣外套膜轉(zhuǎn)錄組共 203個差異表達(dá)基因在KEGG數(shù)據(jù)庫獲得注釋,共涉及86種通路,其中,差異基因數(shù)量最多的通路分別是細(xì)胞外基質(zhì)受體相互作用通路、神經(jīng)信號傳遞通路、吞噬體通路、黏著斑通路等。按照KEGG中通路類型進(jìn)行分類的差異表達(dá)基因的注釋結(jié)果見圖5。
圖5 差異表達(dá)基因的KEGG分類結(jié)果Fig.5 Classification map of DEGs by KEGG
2.3殼色基因的挖掘
根據(jù)葡萄牙牡蠣外套膜轉(zhuǎn)錄組1 025個差異表達(dá)基因功能注釋的結(jié)果以及數(shù)據(jù)庫中已經(jīng)公布的代表性貝殼基質(zhì)蛋白的序列,篩選出與已知貝殼基質(zhì)蛋白具有高同源性的基因14條,其中5條下調(diào)基因可能與金殼基因表達(dá)相關(guān)(表1)。這5條基因分別為CGI_10014905、CGI_10005327、CGI_10024093、CGI_10013406和CGI_10016016。
表1 可能與金殼基因表達(dá)相關(guān)的基因Table 1 Genes related to the expression of the golden shell
根據(jù)數(shù)據(jù)庫中已公布的代表性貝殼基質(zhì)蛋白序列,在1 025個注釋到的差異表達(dá)基因中進(jìn)行篩選,共選出5條下調(diào)基因可能與金殼基因的表達(dá)相關(guān)。CGI_10014905、CGI_10005327、CGI_10024093注釋到Perlucin蛋白[15-16]。Perlucin蛋白同時存在于鮑屬和貽貝屬中,對鮑殼的生物結(jié)構(gòu)起著重要的作用,特別是對鮑殼礦物相的晶核生成、定性生長、表面形貌具有調(diào)控作用。CGI_10013406注釋到Prisilkin-39蛋白[17],Prisilkin-39富含甘氨酸、酪氨酸和絲氨酸,被認(rèn)為是一種雙功能貝殼基質(zhì)蛋白,即參與棱柱層的蛋白質(zhì)框架構(gòu)建,又可以抑制文石型碳酸鈣晶體的形成。CGI_10016016注釋到Protein Pif80。Pif蛋白[18]被認(rèn)為與貝殼內(nèi)的幾丁質(zhì)成分和文石型碳酸鈣晶體一起組成復(fù)合體,它參與了貝殼珍珠質(zhì)層的形成,并賦予了珍珠質(zhì)層優(yōu)異的力學(xué)性能。筆者將對這5條基因進(jìn)行分子實驗驗證,以便進(jìn)一步分析葡萄牙牡蠣殼色相關(guān)基因的表達(dá)模式,探討殼色基因與生長的調(diào)控關(guān)系,建立良好的分子基礎(chǔ)研究平臺。
本研究中采用Illumina高通量測序平臺,對黑殼與金殼葡萄牙牡蠣外套膜組織開展轉(zhuǎn)錄組測序研究,其中黑殼色組總計產(chǎn)出5 857 718 092 nt數(shù)據(jù),篩選后的干凈閱讀子共58 004 560個;金殼色組總計產(chǎn)出6 727 447 326 nt數(shù)據(jù),篩選后的干凈閱讀子共66 614 854個。堿基質(zhì)量值Q30均不小于90.64%,測序數(shù)據(jù)與太平洋牡蠣基因組的比對效率分別為65.67%和64.67%,表明數(shù)據(jù)正常,能夠滿足后續(xù)分析需求。通過差異表達(dá)基因分析,得到差異表達(dá)基因1 082個,其中94.73%成功獲得注釋。本研究中得到的大量數(shù)據(jù)可以為后續(xù)金殼基因挖掘提供參考依據(jù)。
[1] 農(nóng)業(yè)部漁業(yè)漁政管理局.2014中國漁業(yè)統(tǒng)計年鑒[M].北京:中國農(nóng)業(yè)出版社,2014.
[2] 鄭懷平,王迪文,林清,等.太平洋牡蠣與葡萄牙牡蠣兩近緣種間雜交及其早期階段生長與存活的雜種優(yōu)勢[J].水產(chǎn)學(xué)報,2012(2):210-215.
[3] Clydesdale F M.Color as a factor in food choice[J]. Critical Reviews in Food Science and Nutrition,1993,33 (1):83-101.
[4] 管云雁,何毛賢.海產(chǎn)經(jīng)濟(jì)貝類殼色多態(tài)性的研究進(jìn)展[J].海洋通報,2009(1):108-114.
[5] 李國江,盛紅祿,宋京輝,等.海洋貝類養(yǎng)殖新品種——‘中科紅’海灣扇貝[J].科學(xué)養(yǎng)魚,2005(2):22.
[6] Hedgecock D, Perry G M L, Voigt M L.Mapping heterosis QTL in the Pacific oyster Crassostrea gigas[J]. Aquaculture,2006,272:267-268.
[7] Jianlong Ge,Qi Li,Hong Yu,et al.Identification and mapping of a SCAR marker linked to a locus involved in shell pigmentation of the Pacific oyster (Crassostrea gigas)[J].Aquaculture,2014,434:249-253.
[8] 巫旗生,曾志南,寧岳,等.葡萄牙牡蠣工廠化人工育苗技術(shù)[J].福建水產(chǎn),2015,37(5):399-405.
[9] 於俊琦,陳琛,冀德偉,等.高效生態(tài)循環(huán)養(yǎng)殖系統(tǒng)中的葡萄牙牡蠣單體養(yǎng)殖試驗[J].科學(xué)養(yǎng)魚,2013(10):41-42.
[10] 王華青,張志楊,梁和平.單體葡萄牙牡蠣筏式籠養(yǎng)試驗[J].中國水產(chǎn),2014(2):70-71.
[11] 巫旗生.福建沿海主要養(yǎng)殖牡蠣種類及其遺傳多樣性研究[D].長沙:湖南農(nóng)業(yè)大學(xué),2012.
[12] 王桂玲,李家樂.淡水育珠蚌外套膜提取總RNA的改良方法[J].生物技術(shù)通報,2008(S1):356-361.
[13] Trapnell C,Williams B A,Pertea G,et al.Transcript assembly and quantification by RNA Seq reveals unannotated transcripts and isoform switching during cell differentiation[J].Nature Biotechnology,2010,28(5):511-515.
[14] Altschul S F,Madden T L,Schaffer A A,et al.Gapped BLAST and PSI BLAST:a new generation of protein database search programs[J].Nucleic Acids Research,1997,25(17):3389-3402.
[15] Weiss I M,Kaufmann S,Mann K,et al.Purification and characterization of perlucin and perlustrin,two new proteins from the shell of the mollusk Haliotis laevigata[J].Biochemical and Biophysical Research Communications,2000,267(1):17-21.
[16] Mann K,Weiss I M,André S,et al.The amino-acid sequence of the abalone(Haliotis laevigata) nacre protein perlucin:Detection of s functional C-type lectin domain with galactose/mannose sepecificity[J].The Federation of European Biochemical Societies Journal,2000,267(16):5257-5264.
[17] Kong Y M,Jing G,Yan Z G,et al.Cloning and characterization of Prisilkin-39,a novel matrix protein serving a dual role in the prismatic layer formation from the oyster Pinctada fucata[J].Journal of Biological Chemistry,2009,284(16):10841-10854.
[18] Suzuki M,Saruwatari K,Kogure T,et al.An acidic matrix protein,Pif,is a key macromolecule for nacre formation[J].Science,2009,325(5946):1388-1390.
責(zé)任編輯:王賽群
英文編輯:王 庫
Transcriptome analysis and shell gene mining on Crassostrea angulata
Yan Luqi1,2, Guo Xiang3, Wu Qisheng3, Qi Jianfei3, Ning Yue3, Wang Xiaoqing1,2*, Zeng Zhinan3*
(1.College of Animal Science and Technology, Hunan Agricultural University, Changsha 410128, China; 2.Collaborative Innovation Center for Efficient and Health Production of Fisheries in Hunan Province, Changde, Hunan 415000, China;3.Fisheries Research Institute of Fujian, Xiamen, Fujian 361000, China)
Shell coloration is one of important traits for genetic breeding, for improving genome structure and explore new potential gene and further determine the genetic structure of golden shell gene of oyster, the transcriptome sequencing of Crassostrea angulata with black shell and golden shell mantle were performed by Illumina platform. Data were obtained from black shell and golden shell transcriptome were 5 857 718 092 nt and 6 727 447 326 nt respectively,out of which 58 004 560 and 66 614 854 clean reads were remained after screening, respectively. To compare with the database from COG, GO, KEGG, Swiss-Prot and NR, new gene numbers corresponding to each database were 147, 397,203, 567, and 1 347 respectively. To further explore the shell color genes of oyster, functional annotation, clustering analysis and screening from the reported shell matrix proteins on the differential expression gene (DEGs), 14 genes related to shell color expression were identified out and 5 down-regulated genes out of them might be related to the expression of golden shell.
Crassostrea angulata; shell pigmentation; transcriptome
嚴(yán)璐琪(1991—),女,江蘇無錫人,碩士研究生,主要從事水產(chǎn)經(jīng)濟(jì)動物遺傳育種研究,825954514@qq.com;*通信作者,王曉清,博士,教授,主要從事水產(chǎn)動物育種研究,wangxiao8258@126.com;*通信作者,曾志南,博士,研究員,主要從事海水養(yǎng)殖和貝類遺傳育種研究,xmzzn@sina.com
Q915.817;S917.4
A
1007-1032(2016)04-0409-06
2015-12-21 修回日期:2016-01-20
現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(CARS-48);福建省種業(yè)工程項目(201451477-9);福建省屬公益類科研院所基本科研專項(2015R1003-8)