中圖分類號 S917.4 文獻標識碼A 文章編號 1007-7731(2025)12-0063-06
DOI號 10.16377/j.cnki.issn1007-7731.2025.12.016
Transcriptome sequencing and characteristic analysis of dorsal muscle tissue inSpinibarbushollandi
LI SixunLAI Jie DENG Binhua YE Shuzheng LIN Shengyue CHEN Weijian GUILin LI Qiang (School of Life Sciences, Guangzhou University, Guangzhou 51Ooo6, China)
AbstractToexplorethetranscriptomiccharacteristicsof Spinibarbus holandi,three femaleandthree maleindividuals ( 200g each) were used as experimental materials for highthroughput sequencing and subsequent analysis of the transcriptome. The results showedthata totalof95231190clean reads were obtained,which were assmbled into91467 Unigenes with atotallengthof73474804 nt.Among these,49O61Unigenes wereannotated inprotein databases,while48912 Unigenes wereannotated intheNRdatabase.The highest gene matching rates for Spinibarbus hollandi werewith Sinocyclocheilus rhinocerous (26%), Sinocyclocheilus anshuiensis (23 % ), and Sinocyclocheilus grahami (18 % ). A total of 17557 Unigenes were anotated inthe GOdatabase,covering 49 functional subcategoriesacross threemajor biological categories:biological processes,cellularcomponents,andmolecularfunctions.Aditionall,28503Unigens were classfedinto25KOGclustes, including signal transduction mechanisms and general function prediction.Among the 25927 Unigenes annotated in the KEGG database,enrichment analysis revealed 295 metabolic pathways,with higher proportions observed in pathways such asligand-receptor interactions inneuroactive stimulationandthe MAPK signalingpathway.Microsatelitecharacteristic analysisdetected936microsatelitelociwithdinucleotiderepeatsbeing thmostabundant (5204),followedbytriucleotide (2523)and tetranucleotiderepeats (965).Thetranscriptomicdataobtained inthis studyprovideavaluablereferencefor research on germplasm resources,genetic structure,molecular markerdevelopment,and genetic diversity exploration in Spinibarbushollandi.
Keywords Spinibarbus hollandi; transcriptome; gene annotation; characteristic analysis
光倒刺鮑(Spinibarbushollandi)屬鯉形目(Cypriniformes)鯉科(Cyprinidae)鮑亞科(Barbinae)倒刺鮑屬(Spinibarbus),廣泛分布于長江以南各水系,是重要的經(jīng)濟魚種之一,其抗病性較強,肉質(zhì)鮮美,營養(yǎng)價值較高[1-2]。近年來,有關(guān)光倒刺的研究大多集中在養(yǎng)殖技術(shù)[3]、性別標記[4、功能基因[5-6]和線粒體基因組等方面。
轉(zhuǎn)錄組測序是一種能全面快速獲得細胞或組織在某種狀態(tài)下所有轉(zhuǎn)錄本的序列信息和基因表達信息的技術(shù)8。通過分析轉(zhuǎn)錄組數(shù)據(jù),可以發(fā)掘未知和稀有基因,從而準確研究基因表達差異、基因組成變異、分子標記篩選等問題[9-12]。目前,轉(zhuǎn)錄組測序技術(shù)因其數(shù)量大、覆蓋率高、成本低、操作方便等特點,在魚類研究中廣泛應(yīng)用。Hao等3對草魚進行轉(zhuǎn)錄組測序分析,評估了草魚肌肉的肉質(zhì)和肌肉品質(zhì)相關(guān)基因的表達情況,發(fā)現(xiàn)氨基酸代謝途徑與魚肉品質(zhì)密切相關(guān);石立冬等14對紅鰭東方鲀肝臟轉(zhuǎn)錄組進行分析,篩選出與?;撬峥箲?yīng)激功能有關(guān)的基因;邵嘉棋等[15對大口黑鱸進行RNA-seq技術(shù)測序,獲得64個與馴食性狀相關(guān)的候選基因和1個單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)標記,為其食性馴化遺傳改良提供參考。
目前,光倒刺鮑基因組研究較少,本研究對該魚類進行轉(zhuǎn)錄組測序與分析,以構(gòu)建光倒刺鮑轉(zhuǎn)錄組文庫,探討其基因組結(jié)構(gòu),為解決光倒刺鈀基因進化、遺傳育種和資源恢復(fù)等問題提供參考,對揭示其生長機制、抗逆能力,選育優(yōu)勢養(yǎng)殖品種以及種質(zhì)資源保護具有重大意義。
1材料與方法
1.1試驗材料
試驗所用光倒刺樣品采自廣東省珠江水產(chǎn)研究所。選取約 200g 的雌雄個體各3尾,刮去表面鱗片,剪取各尾背部肌肉約 20mg 。
1.2RNA提取、文庫構(gòu)建與測序
利用Trizol試劑盒提取光倒刺鮑肌肉組織的RNA,采用ThermoNanodrop 2000c、Agilent2100分別測定RNA純度、濃度及完整性。用含有Oligo(dT)的磁珠富集mRNA,然后加入裂解緩沖劑將mRNA消化成小片段,再以片段化的mRNA為模板合成cDNA,合成的cDNA用試劑盒進行純化,在cDNA3末端加polyA,并連接測序接頭,利用Hieff NGS@圖2光倒刺鯤Unigene的NR注釋DNASelectionBeads磁珠進行純化目標片段,然后進行PCR文庫擴增,經(jīng)質(zhì)檢后用IluminaHiSeqTM2000測序儀對合格文庫進行測序。
1.3原始數(shù)據(jù)的組裝拼接
對原始序列進行處理,去除接頭序列和低質(zhì)量序列,以獲得CleanData。然后對CleanData進行統(tǒng)計,以評估數(shù)據(jù)的成分和質(zhì)量,包括產(chǎn)量、Q20、N含量、GC含量等。最后用組裝軟件Trinity[6將短reads組裝成Contig和Unigene,并統(tǒng)計組裝質(zhì)量。
1.4轉(zhuǎn)錄組注釋、分析
將拼接得到的Unigene與蛋白數(shù)據(jù)庫進行比對,并對所有注釋的Unigene數(shù)目進行統(tǒng)計。根據(jù)注釋信息進行功能分類和途徑注釋。使用BlastGO軟件[17對獲取的Unigene進行GO注釋,并用WEGO軟件[18對所有Unigene做GO功能分類統(tǒng)計。用Blastx將基因比對到KOG數(shù)據(jù)庫中,對基因及其產(chǎn)物進行同源分類。同時,將Unigene比對到KOG和KEGG數(shù)據(jù)庫中,分析Unigene的功能及其在細胞代謝中參與的途徑等。
1.5 微衛(wèi)星查找和SNP檢測
利用MicroSAtellite軟件對拼接得到的Unigene進行微衛(wèi)星定位。在MISA結(jié)果的基礎(chǔ)上,保留前后序列均不小于 150bp 的微衛(wèi)星,對微衛(wèi)星進行分型,用Primerprimier6.0軟件的默認設(shè)置設(shè)計引物。最后使用SOAPsnp檢測樣品的SNP。
2結(jié)果與分析
2.1 高通量測序產(chǎn)量統(tǒng)計
測序結(jié)果表明,總計產(chǎn)出13525001683nt數(shù)據(jù),過濾后得到的cleanreads數(shù)目為95231190個,Q20含量為 96.40% ,N含量為0,GC含量為 49.43% 。拼接后得到91467個Unigene,總長為73474804nt ,Unigene長度分布如圖1所示,其中序列長度均大于 200nt ,且大于 3 000nt 的有4163個,最大、最小長度分別為40474和 201nt ,平均長度為803nt ,N50達1568個。
2.2 Unigene功能注釋
利用Blast工具將91467個Unigene序列與NR、KEGG、KOG和GO數(shù)據(jù)庫(E-value lt;10-5 )進行比對,NR、GO、KOG、KEGG數(shù)據(jù)庫分別注釋了48912、17577、28503、25927個Unigene,共有490610 53.64% )個Unigene注釋到蛋白數(shù)據(jù)庫。
2.2.1 NR注釋 在NR注釋中,用E-value來表示
Unigene與NR庫的匹配程度。如圖2A所示,超過64% 的Unigene的E-value小于 e-50 ,可見光倒刺鯤基因的功能與NCBI的NR庫注釋結(jié)果相符度較高。對獲得的48912個Unigene進行物種分布匹配率統(tǒng)計(圖2B),與光倒刺鮑基因匹配率較高的是犀角金線鈀(Sinocyclocheilusrhinocerous)、安水金線(S.anshuiensis)和金線(S.grahami),匹配率分別為26%23% 和 18% 。
2.2.2GO功能注釋及分類 與GO數(shù)據(jù)庫進行比對注釋,共有17557個Unigene分別注釋到生物過程、細胞組分和分子功能3個主要生物類別的49個功能亞類中(圖3)。在生物過程中,最多的是與細胞過程相關(guān)的基因,共8793個,其次是與單生物過程相關(guān)基因,共有8508個;在細胞組分中,與細胞和細胞組分有關(guān)的
基因均有6071個;在分子功能中,主要是與結(jié)合和催2.2.3KOG功能分類將Unigene和KOG數(shù)據(jù)庫進行比對(圖4),結(jié)果顯示,28503個Unigene被分為25個KOG聚類。其中,排在前三的聚簇有信號轉(zhuǎn)導(dǎo)化活性功能相關(guān)的基因,分別有8880個和5758個。機制,一般功能預(yù)測和翻譯后修飾、蛋白質(zhì)轉(zhuǎn)化、分子伴侶,分別有14872,10 527和4846個Unigene,而Unigene數(shù)量最少的為細胞運動,僅181個。
2.2.4KEGG代謝通路分析 在KEGG數(shù)據(jù)庫注釋結(jié)果中,注釋到KEGG數(shù)據(jù)庫中的25927個Unigene富集到295條代謝通路上。如圖5所示,所占比例較高的前10條通路分別為刺激神經(jīng)組織的配體受體交互、MAPK信號傳導(dǎo)通路、鈣信號通路、黏著斑、內(nèi)吞作用、肌動蛋白細胞骨架調(diào)節(jié)、單純皰疹感染、細胞因子受體相互作用、緊密連接和心肌細胞腎上腺素能信號傳導(dǎo)。
2.3 微衛(wèi)星分析
由表1可知,使用MISA軟件共發(fā)現(xiàn)9036條微衛(wèi)星序列,含微衛(wèi)星的Unigenes序列共有7283條,占總Unigene(91467條)的 7.96% ,其中,復(fù)合型的微衛(wèi)星序列共有835條,其余為以不間斷重復(fù)方式組成的單一型微衛(wèi)星。由表2可知,在光倒刺轉(zhuǎn)錄組中,二核苷酸重復(fù)序列最多,有5204條,其次是三核苷酸重復(fù)序列和四核苷酸重復(fù)序列,分別有2523和965條,五、六核苷酸重復(fù)序列共344條;此外,不同微衛(wèi)星標記位點的重復(fù)次數(shù)也有差異,除了單堿基微衛(wèi)星位點,最豐富的重復(fù)次數(shù)為6次,有2718個位點,占總數(shù)的 30.08% ,其次是重復(fù)次數(shù)為5次,有1605個位點,占總數(shù)的 17.76% 。由圖6可知,在二核苷酸重復(fù)序列中,所占比例最高的是AC/GT,占總數(shù)的 36.8% ,其次是AG/CT和AT/AT,分別為 14.6% 和 5.9% ;在三核苷酸重復(fù)中,所占比例最高的是ATC/CTG,占總數(shù)的 5.6% ;四核苷酸重復(fù)序列中,比例最高的重復(fù)單元為AAAT/ATTT,占總數(shù)的 3% ;五、六核苷酸重復(fù)序列中,各重復(fù)序列所占比例均較低。
3結(jié)論與討論
高通量測序是一種高質(zhì)量、低成本、高效率的轉(zhuǎn)錄組測序分析法[20]。本研究對光倒刺轉(zhuǎn)錄組基因進行測序、組裝和拼接,再通過生物信息學(xué)方法分析得到光倒刺Unigene序列,對其進行注釋、功能分類和微衛(wèi)星分子標記開發(fā),結(jié)果表明,拼接得到91467個Unigene,基因序列平均長度為 803nt 。Franssen等21認為,較長的測序讀長可有效減少拼接錯誤,提高拼接重疊群長度,對于無參考基因組的物種來說具有重要意義。91467個Unigene共有49061( 53.64% )個Unigene可注釋到蛋白數(shù)據(jù)庫,有48912個Unigene可與NR數(shù)據(jù)庫匹配;未與任何已知蛋白匹配的Unigene,推斷其可能為新的基因。在這些匹配的Unigene中,與犀角金線鯤的Unigene匹配率最高,達到 26% ,其次是安水金線和金線,分別為 23% 和 18% ,說明在數(shù)據(jù)庫中,光倒刺鮑的基因序列信息較少,而本次獲得的光倒刺Unigene可以豐富數(shù)據(jù)庫中光倒刺的基因信息。
53.64% 的Unigene被注釋到KOG、GO和KEGG數(shù)據(jù)庫,接近 50% 基因未搜索到同源基因序列,說明目前基因數(shù)據(jù)庫中收錄的魚類基因豐富度有待進一步提高。這3個數(shù)據(jù)庫的注釋結(jié)果有助于進一步了解光倒刺鈀基因的分子功能、所處細胞位置、參與生物過程、代謝途徑和信號通路等,為光倒刺的功能基因、相關(guān)基因的信號通路、基因所處的位置及生理功能等的開發(fā)利用提供基礎(chǔ)信息。其中一些與細胞免疫功能相關(guān)的基因可以用來制作基因表達芯片,用于光倒刺鮑免疫水平檢測,還可作為光倒刺抗病品系選育的生化指標。
在光倒刺鮑轉(zhuǎn)錄組中,二核苷酸重復(fù)序列的微衛(wèi)星含量最高,其次是三核苷酸重復(fù)序列,這與大部分真核生物的研究結(jié)果一致;四、五、六核苷酸重復(fù)序列的微衛(wèi)星豐富度明顯低于二、三核昔酸,該結(jié)果也在其他真核生物中得到了驗證[22-23]。在光倒刺轉(zhuǎn)錄組的二核苷酸重復(fù)序列中,以AC/GT的數(shù)量最多,占 36.8% ,該結(jié)果與絕大多數(shù)脊椎動物的基因組序列研究結(jié)果相一致[24-26]。其次是AG/CT和AT/AT,而CG/CG的含量最少,極少的CG微衛(wèi)星重復(fù)單元數(shù)量可能是因為在基因組中胞嘧啶C容易被甲基化脫氨基轉(zhuǎn)化為胸腺嘧啶T。染色體間有頻繁的滑鏈錯配,具有較高的突變率。較高的突變率與高多態(tài)性相關(guān)聯(lián),序列越長,其在轉(zhuǎn)錄組中的多態(tài)率越高。本研究中,大多數(shù)的微衛(wèi)星序列屬于單一型,與大部分真核生物通過轉(zhuǎn)錄組檢測到的微衛(wèi)星序列結(jié)果相一致[27-28]。可能是因為轉(zhuǎn)錄組研究的是在RNA水平上的基因表達情況,其主要位于CDS區(qū),基因序列的保守度高,變異小,因此微衛(wèi)星重復(fù)數(shù)較少。
綜上,本研究對光倒刺鮑轉(zhuǎn)錄組進行高通量測序并對其結(jié)果進行分析,在光倒刺鮑轉(zhuǎn)錄組的高通量測序中,共得到91467個Unigene,其中49061個Unigene注釋到蛋白數(shù)據(jù)庫,NR、GO、KOG、KEGG數(shù)據(jù)庫分別注釋了48912、17577、28503、25927個Unigene;在光倒刺鈀轉(zhuǎn)錄組中,二核苷酸重復(fù)序列的微衛(wèi)星含量最高,有5204條,其次是三核昔酸重復(fù)序列,有2523條。研究結(jié)果為光倒刺鮑的功能基因、相關(guān)基因的信號通路及生理功能等的開發(fā)利用提供參考。
參考文獻
[1]中國水產(chǎn)科學(xué)研究院珠江水產(chǎn)研究所.廠東淡水魚類志[M].廣州:廣東科技出版社,1991.
[2]陳意明,黃鈞,蔡子德,等.光倒刺的含肉率和肌肉營養(yǎng)成分分析[J].水利漁業(yè),2001,22(2):22-24.
[3]方園,劉斌,劉德亭,等.淺談光倒刺鰓健康高效養(yǎng)殖技術(shù)[J].科學(xué)養(yǎng)魚,2020(8):43-44.
[4] HUANG W W,LAI J,LIANG WQ,et al. Identification ofsex-specific DNA markers in the army fish (Spinibarbushollandi) by whole genome re-sequencing method[J].Aquaculture,2024,583:740605.
[5]周惠強,陳凱棱,舒琥,等.光倒刺mc5r基因的克隆及對饑餓的響應(yīng)[J].南方水產(chǎn)科學(xué),2019,15(4):99-106.
[6]李文俊,李強,韓崇,等.基于COI基因的光倒刺鰓群體遺傳多樣性與遺傳分化研究[J].安徽農(nóng)業(yè)科學(xué),2021,49(22):125-128.
[7]CHENIS,BAI JC,HANCC,et al. The completemitochondrialgenomeofHolland’sspinibarbelSpinibarbus hollandi Oshima (Cypriniformes,Cyprinidae)[J].Mitochondrial DNA part A,2016,27(3):1721-173.
[8]崔凱,吳偉偉,刁其玉.轉(zhuǎn)錄組測序技術(shù)的研究和應(yīng)用進展[J].生物技術(shù)通報,2019,35(7):1-9.
[9]王剛.棉花幼苗鹽脅迫條件下Solexa轉(zhuǎn)錄組測序結(jié)果的分析及驗證[D].泰安:山東農(nóng)業(yè)大學(xué),2011.
[10]孫麗雪.高溫處理后尼羅羅非魚性逆轉(zhuǎn)雄魚與未逆轉(zhuǎn)雌魚的差異性腺轉(zhuǎn)錄組研究[D].泰安:山東農(nóng)業(yè)大學(xué),2017.
[11]何飛祥,江東能,楊尉,等.金錢魚性腺差異表達基因的比較轉(zhuǎn)錄組分析[C]//2018年中國水產(chǎn)學(xué)會學(xué)術(shù)年會論文摘要集.西安,2018:184.
[12]鄧素貞,韓兆方,陳小明,等.大黃魚高溫適應(yīng)的轉(zhuǎn)錄組學(xué)分析[J].水產(chǎn)學(xué)報,2018,42(11):1673-1683.
[13]HAOML,CHENGWJ,XIEYX,etal.Identificationofhub genesin meat quality of grasscarp (Ctenopharyngodonidellus) fed with faba bean bymuscletissuetranscriptomicanalysis[J].Italian journalof animalscience,2024,23(1):594-606.
[14]石立冬,翟浩杰,衛(wèi)力博,等.?;撬釋t鰭東方鲀熱應(yīng)激轉(zhuǎn)錄調(diào)控機制的影響[J].中國水產(chǎn)科學(xué),2020,27(10):1145-1155.
[15]邵嘉棋,杜金星,雷彩霞,等.基于轉(zhuǎn)錄組測序篩選大口黑鱸食性馴化相關(guān)基因和SNP標記[J].中國水產(chǎn)科學(xué),2022,29(3):421-434.
[16]GRABHERRMG,HAASBJ,YASSOURM,et al.Full-length transcriptome assembly from RNA-Seq datawithout a reference genome[J].Nature biotechnology,2011,29(7) :644-652.
[17] CONESA A,GOTZ S. Blast2GO: a comprehensive suitefor functional analysis in plant genomics[J]. Internationaljournal of plant genomics,2008(1) :619832.
[18] YE J,F(xiàn)ANG L,ZHENG H K,et al. WEGO:a web toolfor plotting GO annotations[J].Nucleic acids research,2006,34:W293-W297.
[19] ISELI C, JONGENEEL C V, BUCHER P. ESTScan: aprogram for detecting,evaluating,and reconstructingpotential coding regions in EST sequences[J]. Procedings.internationalconferenceonintelligentsystemsformolecular biology,1999:138-148.
[20]周衛(wèi)星,石海鶴.高通量測序中序列拼接算法的研究進展[J].計算機科學(xué),2019,46(5):36-43.
[21] FRANSSEN S U,SHRESTHA R P,BRAUTIGAM A,etal.Comprehensive transcriptome analysis of the highlycomplex Pisum sativum genome using next generationsequencing[J].BMC genomics,2011,12:227-242.
[22]欒生.日本囊對蝦基因組串聯(lián)重復(fù)序列分析及微衛(wèi)星標記的開發(fā)與應(yīng)用[D].青島:中國海洋大學(xué),2006.
[23]劉燾,陳冰潔,史會來,等.基于基因組survey的橫帶髭鯛(Hapalogenys analis)微衛(wèi)星位點篩選與特征分析[J].海洋與湖沼,2023,54(3):848-855.
[24]TUSKAN G A,GUNTER L E,YANG Z K,et al.Characterization of microsatelites revealed by genomicsequencing of Populus trichocarpa[J]. Canadian journalof forest research,2004,34(1):85-93.
[25]CHISTIAKOVD A,HELLEMANS B,VOLCKAERT FA M.Microsatellites and their genomic distribution,evolution,function and applications:a reviewwithspecial reference to fish genetics[J]. Aquaculture,2006,255(1/2/3/4):1-29.
[26] ZHU H,SENALIK D,MCCOWN B H,et al. Mining andvalidation of pyrosequenced simple sequence repeats (SSRs)from American cranberry(Vaccinium macrocarpon Ait.)[J].Theoretical and applied genetics,2012,124(1) :87-96.
[27]馬海濤,魯翠云,于冬梅,等.草魚基因組中微衛(wèi)星分子標記的制備及篩選[J].上海水產(chǎn)大學(xué)學(xué)報,2007,16(4):389-393.
[28]徐杰杰,畢宜慧,程景顥,等.中華絨螯蟹(Eriocheirsinensis)全基因組微衛(wèi)星分布特征研究[J].基因組學(xué)與應(yīng)用生物學(xué),2021,40(增刊2):2422-2429.
(責(zé)任編輯:胡立萍)
基金項目廣東省大學(xué)生創(chuàng)新創(chuàng)業(yè)省重點項目(S202411078013);國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)項目(202511078046)。
作者簡介李斯迅(2005—),男,廣東揭陽人,從事魚類育種研究;賴潔(2004—),女,廣東河源人,從事魚類育種研究。
通信作者桂林(1975—),男,湖北武漢人,博士,講師,從事魚類育種研究;李強(1983一),男,廣東韶關(guān)人,博士,實驗師,從事魚類育種研究。
收稿日期 2024-11-26