潘敏 于旭東 蔡澤坪 李佳佳 羅佳佳 周丹 楚文清 瞿倩
摘??要:菠蘿蜜(Artocarpus heterophyllus)是熱帶地區(qū)重要的木本植物,具有較高的經(jīng)濟(jì)價(jià)值。試驗(yàn)以菠蘿蜜正常及葉綠素合成缺失突變體幼苗為研究材料,在PacBio Sequel平臺(tái)上進(jìn)行莖葉全長(zhǎng)轉(zhuǎn)錄組測(cè)序,最終得到95?701個(gè)Isforms,在對(duì)轉(zhuǎn)錄本進(jìn)行聚類糾錯(cuò)后利用NR、NT、GO、KOG、KEGG、Swiss-Prot、InterPro?7個(gè)數(shù)據(jù)庫進(jìn)行功能注釋,共有93?367個(gè)轉(zhuǎn)錄本被注釋。七大數(shù)據(jù)庫中分別有92?187(NR)、90?326(NT)、74?548(Swiss-Prot)、75?396(KEGG)、77?022(KOG)、81?906(InterPro)和65?500(GO)個(gè)轉(zhuǎn)錄本獲得功能注釋。共檢測(cè)到85?091個(gè)CDS和55?608個(gè)SSR序列,并預(yù)測(cè)到了4?753個(gè)轉(zhuǎn)錄因子(Transcription Factors,TFs),1?667個(gè)轉(zhuǎn)錄調(diào)控子(Transcriptional Regulators,TRs)以及4?710個(gè)受體激酶(Receptor-like Kinases,RLKs)。
關(guān)鍵詞:菠蘿蜜;全長(zhǎng)轉(zhuǎn)錄組;功能注釋中圖分類號(hào):S718.43??????文獻(xiàn)標(biāo)識(shí)碼:A
Transcriptome Data Analysis of Artocarpus heterophyllus Stems and Leaves
PAN Min1, YU Xudong1, CAI Zeping1*, LI Jiajia1, LUO Jiajia2,3, ZHOU Dan1, CHU Wenqing1, QU Qian1
1. College of Forestry, Hainan University?/ Key Laboratory of Genetics and Germplasm Innovation of Tropical Special Forest Trees and Ornamental Plants, Ministry of Education, Haikou, Hainan 570228, China; 2. College of Tropical Crops, Hainan University, Haikou, Hainan 570228, China; 3. Tropical Crops Genetic Resources Institute, Chinese Academy of Tropical Agricultural Sciences / Key Laboratory of Crop Gene Resources and Germplasm Enhancement in Southern China, Ministry of Agriculture?and Rural Affatrs, Danzhou, Hainan 571737, China
Abstract: Artocarpus heterophyllusis an important woody plant in tropical regions withhigh economic value. This test used the normal and chlorophyll deficient mutant ofA. heterophyllusseedlings as the research materials. The transcriptome of the stems and leaves was sequenced by PacBio Sequel, 95?701 isoformswerefinally found. After cluster and polish, using NR, NT, GO, KOG, KEGG, Swiss-Prot and InterPro 7 databases for functional annotation, a total of 93?367 transcripts were annotated. There were 92?187 (NR), 90?326 (NT), 74 548 (Swiss-Prot), 75?396 (KEGG), 77?022 (KOG), 81?906 (InterPro) and 65 500 (GO) transcripts annotated in the seven databases respectively. In addition, a total of 85?091 CDS and 55 608 SSR sequences were detected, 4?753 transcription factors, 1?667 transcriptional regulators and 4?710 receptor-like kinases were predicted.
Keywords: Artocarpus heterophyllus; transcriptome; functional annotation
DOI: 10.3969/j.issn.1000-2561.2020.07.002
菠蘿蜜(Artocarpus heterophyllus)為??疲∕oraceae)木波羅屬(Artocarpus),在食用、藥用、園林、經(jīng)濟(jì)等方面都具有較高價(jià)值[1]。當(dāng)前,關(guān)于菠蘿蜜的研究大多集中在生長(zhǎng)發(fā)育、果實(shí)開發(fā)利用、病害防治等方面[2-4]。對(duì)于分子生物學(xué)方面研究較少。目前已有菠蘿蜜花被轉(zhuǎn)錄組分析報(bào)道,但有關(guān)莖葉的報(bào)道還未出現(xiàn)[5]。由于缺乏基因組序列,所以分子生物學(xué)方面的研討受到限制。
在果樹植物的研究領(lǐng)域中,葡萄(Vitis vinifera)是第一個(gè)完成全基因組測(cè)序的物種[6]。至今已有數(shù)十種果樹的基因組序列相繼問世,其中包含熱帶水果香蕉(Musa nana)和菠蘿(Ananas comosus)[7-8]。基因組測(cè)序的完成能夠加深對(duì)物種的了解并加快分子育種的速度[9]。目前桑科植物中只有川桑(Morus notabilis)完成了基因組測(cè)序[10]。因此,研究菠蘿蜜轉(zhuǎn)錄組測(cè)序可豐富其分子信息,為研究其他??浦参锾峁﹨⒖?sup>[11]。
第三代測(cè)序技術(shù)具有讀長(zhǎng)長(zhǎng)的優(yōu)點(diǎn),可快速簡(jiǎn)便地獲得大量轉(zhuǎn)錄本序列,實(shí)現(xiàn)更多新基因的挖掘[12]。近年來,三代測(cè)序是開發(fā)基因組資源以及分子標(biāo)記的一種重要途徑,此技術(shù)已經(jīng)在無參考基因組的條件下為多種植物建立了轉(zhuǎn)錄組數(shù)據(jù)庫[13]。本研究利用PacBio Sequel平臺(tái)對(duì)菠蘿蜜進(jìn)行全長(zhǎng)轉(zhuǎn)錄組測(cè)序,不僅為二代測(cè)序數(shù)據(jù)拼接提供模板,還為進(jìn)一步探索莖葉基因表達(dá)奠定基礎(chǔ)。
1.1材料
組織樣品采自生長(zhǎng)40 d的白化和正常菠蘿蜜幼苗[14],取其成熟葉、嫩莖和老莖節(jié)間進(jìn)行混樣后液氮中速凍和保存,用于RNA提取。
1.2方法
1.2.1 ?RNA提取和檢測(cè)??將樣品放入含有液氮的研缽中充分研磨成粉末,轉(zhuǎn)入放有裂解液的EP管中,采用CTAB法提取RNA[15]。取適量樣品進(jìn)行檢測(cè),于?80?℃保存。RNA提取流程與檢測(cè)均委托華大基因公司進(jìn)行。
1.2.2 ?文庫構(gòu)建和測(cè)序??在PacBio Sequel平臺(tái)上測(cè)序菠蘿蜜樣本并建立PacBio ISO-Seq文庫,得到原始聚合酶讀取序列。讀取序列去接頭,用SMRT analysis套件[16]進(jìn)行插入片段識(shí)別(reads of insert, ROI)、分類、聚類和校正,最終獲得高質(zhì)量的全長(zhǎng)一致性序列。將各個(gè)文庫的高質(zhì)量全長(zhǎng)序列合并到一起,在無參考基因組的情況下,使用cd-hit對(duì)聚類和糾錯(cuò)后的轉(zhuǎn)錄本去冗余。轉(zhuǎn)錄組測(cè)序委托華大基因公司進(jìn)行。
1.2.3 ?CDS預(yù)測(cè)和SSR檢測(cè)??使用TransDecoder. LongOrfs(https://transdecoder.github.io)對(duì)Unige ne.fa進(jìn)行開放閱讀框搜索,提取長(zhǎng)讀碼框序列。基于序列相似性用Diamond Blastp將Unigene.fa比對(duì)到Swiss-Prot數(shù)據(jù)庫中,利用Hmmscan對(duì)BLAST(http://blast.ncbi.nlm.nih.gov/Blast.cgi)結(jié)果在Pfam數(shù)據(jù)庫篩選。利用TransDecoder.Predict預(yù)測(cè)Unigene.fa的編碼序列。使用MISA[17]?(http://pgrc.?ipk-gatersleben.de/misa)對(duì)轉(zhuǎn)錄本進(jìn)行SSR檢測(cè)。
1.2.4 ?功能注釋??利用BLAST[18]對(duì)轉(zhuǎn)錄本進(jìn)行NR、NT、KOG、KEGG和Swiss-Prot注釋。使用Blast2GO[19]以及NR注釋結(jié)果進(jìn)行GO注釋,使用InterProScan5[20]進(jìn)行InterPro注釋。使用iTAK在線工具(http://itak.feilab.cn)鑒定轉(zhuǎn)錄因子(transcription factors,TFs)、轉(zhuǎn)錄調(diào)控子(transcriptional regulators,TRs)以及受體激酶(receptor-like kinases,RLKs)。
2.1 數(shù)據(jù)質(zhì)控
在PacBio Sequel平臺(tái)上,將菠蘿蜜正常及白化病的莖、葉混合樣品進(jìn)行全長(zhǎng)轉(zhuǎn)錄組測(cè)序,共建立一個(gè)PacBio ISO-Seq文庫,原始數(shù)據(jù)聚合酶讀?。╬olymerase reads)序列中,總讀取共有490?303個(gè)(13.58?GB)。其中,最大聚合酶讀?。╬olymerase reads)序列長(zhǎng)度為210?091?bp,N50為49?592?bp。最大聚合酶讀?。╬olymerase reads)經(jīng)過處理后得到的Subreads共有8?661?811個(gè)(12.80?GB),Subreads最大長(zhǎng)度為132?829?bp,N50為1835 bp。
通過插入片段的識(shí)別,將來自同一環(huán)狀分子的Subreads聚類在一起,在總共1個(gè)SMRT cell的測(cè)序中平均檢測(cè)13次后得到893?030?085?bp的CCS(circular consensus sequencing)數(shù)據(jù)量。reads測(cè)序平均長(zhǎng)度和平均質(zhì)量值分別為1882?bp和0.94,可充分體現(xiàn)試驗(yàn)數(shù)據(jù)的可靠性,插入片段(reads of insert,ROI)共有474 542個(gè)。
在所有的ROI中,全長(zhǎng)非嵌合序列(full-length?non-chimeric reads)共有319?878個(gè),占67.41%,其次是非全長(zhǎng)序列(non-full-length reads)占26.97%;嵌合體序列(chimeric)以及短序列(short reads)只占極少數(shù),分別為3.05%和2.57%,可以看出只有極少數(shù)reads為嵌合reads(圖1)。
全長(zhǎng)非嵌合序列被聚類成一致性序列共有189 629個(gè),后續(xù)分析只采用了high QV的一致性序列125 429個(gè)。每個(gè)文庫聚類和糾錯(cuò)后得到的高質(zhì)量序列最終合并到一起去冗余,得到轉(zhuǎn)錄本95 701個(gè)(表1、圖2)。轉(zhuǎn)錄組測(cè)序數(shù)據(jù)已經(jīng)上傳至NCBI的SRA數(shù)據(jù)庫,登錄號(hào)PRJNA579273。
2.2 ?CDS預(yù)測(cè)
對(duì)轉(zhuǎn)錄組進(jìn)行CDS(coding sequence)預(yù)測(cè),共獲得序列85?091個(gè)。片段大小297~6240 nt,總長(zhǎng)度為93?949?176?nt。其中,長(zhǎng)度在100~500?nt的片段有12?833個(gè),占15.0%;500~1000?nt的有29?699個(gè),占34.9%;1000~1500?nt的有23?147個(gè),占27.2%;1500~2000 nt的有12 381個(gè),占14.6%;長(zhǎng)度>2000 nt的有7031個(gè),占8.3%。序列片段大小大多數(shù)處于1000~2000?nt,說明菠蘿蜜莖葉轉(zhuǎn)錄組的質(zhì)量處于良好狀態(tài)(圖3A、表2)。
2.3 ?SSR檢測(cè)
對(duì)轉(zhuǎn)錄本進(jìn)行SSR檢測(cè),結(jié)果表明總共有55?608個(gè)序列。其中,最占優(yōu)勢(shì)的是單核苷酸重復(fù)(27?746),占比49.9%,其次是二核苷酸(13?734)占24.7%,三核苷酸(11?120)占20.0%,四核苷酸、五核苷酸以及六核苷酸占極少數(shù),分別為1.38%、1.71%和2.31%。
在檢測(cè)到的結(jié)果中,二核苷酸里AG/CT最多(9300),最少的是CG/CG(19)。在三核苷酸里AAG/CTT最多(3860),最少的是ACT/AGT(109)(圖3B)。
2.4功能注釋
將轉(zhuǎn)錄本與各大功能數(shù)據(jù)庫比對(duì),分別有92?187(NR)、90?326(NT)、74?548(Swiss-Prot)、75?396(KEGG)、77?022(KOG)、81?906(InterPro)和65?500(GO)個(gè)基因獲得功能注釋(表3)。
注:Intersection:被七大數(shù)據(jù)庫中所有數(shù)據(jù)庫注釋上的轉(zhuǎn)錄本總數(shù)及比例;Overrall:被七大數(shù)據(jù)庫中任意一個(gè)數(shù)據(jù)庫注釋上的轉(zhuǎn)錄本總數(shù)及比例。
Note: Intersection: Total number and proportion of transcripts annotated by all databases in seven databases; Overrall: Total number and proportion of transcripts annotated by any one of the seven databases.
2.4.1 ?NR注釋分類??NR注釋中相同轉(zhuǎn)錄本能比對(duì)上的較多相似物種有川桑(Morus notabilis)、棗樹(Ziziphus jujuba)、核桃(Juglans regia)和櫻桃(Prunus avium),且所占比例分別為71.26%、8.25%、1.53%和1.44%,另外比對(duì)到其他已知物種比例為17.52%(圖4A)。
轉(zhuǎn)錄組在與NR、InterPro、Swiss-Prot、KOG和KEGG 5個(gè)數(shù)據(jù)庫比對(duì)之后分別特有的轉(zhuǎn)錄本數(shù)為1998、30、9、9和15個(gè)。NR與InterPro的相同轉(zhuǎn)錄組最多有81 866個(gè),關(guān)系最為緊密。其中InterPro與KOG、InterPro與KEGG、KOG與KEGG共有的轉(zhuǎn)錄本為0(圖4B)。
2.4.2 ?KOG功能分布統(tǒng)計(jì)??KOG數(shù)據(jù)庫共有?77 022個(gè)轉(zhuǎn)錄本被注釋,根據(jù)功能大致可分為25類。功能種類比較全面,參與了較多的生命活動(dòng)。一般功能預(yù)測(cè)(general function prediction)占最多(17?987),其次是信號(hào)轉(zhuǎn)導(dǎo)機(jī)制(signal transdu ction mechanisms)(13 308)和翻譯后修飾蛋白質(zhì)翻轉(zhuǎn)折疊(posttranslational modification, protein turnover,chaperones)(9769),細(xì)胞運(yùn)動(dòng)(cell motility)數(shù)量最少(189)(圖5A)。
圖A中1:翻譯核糖體結(jié)構(gòu)和生物組成;2:轉(zhuǎn)錄;3:信號(hào)傳導(dǎo)機(jī)制;4:次級(jí)代謝產(chǎn)物的合成運(yùn)輸、分解;5:RNA加工與修飾;6:復(fù)制、重組與修復(fù);7:翻譯后修飾蛋白質(zhì)翻轉(zhuǎn)折疊;8:核算運(yùn)輸和代謝;9:核結(jié)構(gòu);10:脂質(zhì)運(yùn)輸和代謝;11:細(xì)胞外分泌物的運(yùn)輸;12:無機(jī)離子運(yùn)輸和代謝;13:大致預(yù)測(cè)一般功能;14:未知功能;15:胞外結(jié)構(gòu);16:能量的產(chǎn)生與轉(zhuǎn)換;17:防御機(jī)制;18:細(xì)胞骨架;19:輔酶的運(yùn)輸和代謝;20:染色質(zhì)結(jié)構(gòu)與運(yùn)動(dòng);21:細(xì)胞膜/包膜生物合成;22:細(xì)胞運(yùn)動(dòng);23:細(xì)胞周期調(diào)控;24:碳水化合物運(yùn)輸與代謝;25:氨基酸運(yùn)輸與代謝。圖B中,1:運(yùn)輸和代謝;2:信號(hào)傳導(dǎo);3:膜轉(zhuǎn)運(yùn);4:轉(zhuǎn)運(yùn);5:折疊、分選和降解;6:翻譯;7:復(fù)制折疊;8:全局和概覽圖;9:碳水化合物代謝;10:氨基酸代謝;11:類脂化合物代謝;12:能量代謝;13:輔助因子和維生素代謝;14:其他次級(jí)生物代謝;15:核苷酸代謝;16:其他氨基酸代謝;17:聚糖生物合成與代謝;18:萜類和酮類化合物代謝;19:環(huán)境適應(yīng);20:消化系統(tǒng)。圖C中,1:細(xì)胞過程;2:代謝進(jìn)程:3:生物調(diào)節(jié);4:生物進(jìn)程調(diào)控;5:應(yīng)激反應(yīng);6:定位;7:組織或生物起源細(xì)胞組件;8:信號(hào)傳導(dǎo);9:多細(xì)胞生物過程;10:發(fā)育進(jìn)程;11:繁殖;12:繁殖進(jìn)程;13:生物過程的負(fù)調(diào)控;14:多生物過程;15:生物進(jìn)程的正調(diào)控;16:生長(zhǎng);17:免疫系統(tǒng)過程;18:節(jié)律進(jìn)程;19:細(xì)胞增殖;20:碳利用;21:脫毒;22:生物粘附;23:氧素利用;24:移動(dòng);25:細(xì)胞;26:細(xì)胞部分;27:細(xì)胞膜;28:膜部分;29:細(xì)胞器;30:高分子配合物;31:細(xì)胞器的部分;32:膜包圍內(nèi)腔;33:胞外區(qū);34:病毒;35:病毒組分;36:超分子絡(luò)合物;37:細(xì)胞連接;38:共質(zhì)體;39:胞外區(qū)域部分;40:擬核;41:連接;42:催化活性;43:載體活性;44:轉(zhuǎn)錄調(diào)節(jié)活性;45:結(jié)構(gòu)分子活性;46:分子功能調(diào)節(jié)器;47:信號(hào)傳導(dǎo)活性;48:抗氧化活性;49:分子傳感器活性;50:養(yǎng)分貯液囊活性;51:分子載體活性;52:蛋白質(zhì)標(biāo)記物;53:翻譯調(diào)節(jié)活性。
A:?Functional distribution of KOG annotation; B: Functional distribution of KEGG annotation; C: Functional distribution of GO annotation.
In figure A, 1: Translation, ribosomal structure and biogenesis; 2: Transcription; 3: Signal transduction mechanisms; 4: Secondary metabolites biosynthesis, transport and catabolism; 5: RNA processing and modification; 6: Replication, recombination and repair; 7: Posttranslational modification, protein turnover, chaperones; 8: Nucleotide transport and metabolism; 9: Nuclear structureLipid transport and metabolism; 10: Lipid transport and metabolism; 11: Intracellular trafficking, secretion, and vesicular transport; 12: Inorganic ion transport and metabolism; 13: General function prediction only; 14: Function unknown; 15Extracellular?structures; 16: Energy production and conversion; 17 Defense mechanisms; 18 Cytoskeleton; 19: Coenzyme transport and metabolism; 20: Chromatin structure and dynamics; 21: Cell wall/membrane/ envelope biogenesis; 22: Cell motility; 23 Cell cycle control, cell division, chromosome partitioning; 24: Carbohydrate transport and metabolism; 25: Amino acid transport and metabolism. In figure B, 1: Transport and catabolism; 2: Signal transduction; 3: Membrane transport; 4: Translation; 5: Folding, sorting and degradation; 6: Transcription; 7: Replication and repair; 8: Global and overview maps; 9: Carbohydrate metabolism; 10: Amino acid metabolism; 11: Lipid metabolism; 12: Energy metabolism; 13: Metabolism of cofactors and vitamins; 14: Biosynthesis of other secondary metabolites; 15: Nucleotide metabolism; 16: Metabolism of other amino acids; 17: Glycan biosynthesis and metabolism; 18: Metabolism of terpenoids and polyketides; 19: Environmental adaptation; 20: Digestive system. In figure C, 1: Cellular process; 2: Metabolic process; 3: Biological regulation; 4:Regulation of biological process; 5: Response to stimulus; 6: Localization; 7: Cellular component organization or biogenesis; 8: Signaling; 9: Multicellular organismal process; 10: Developmental process; 11: Reproduction; 12:Reproductive process; 13: Negative regulation of biological process; 14: Multi- organism process; 15: Positive regulation of biological process; 16: Growth; 17: Immune system process; 18: Rrhythmic process; 19: Cell proliferation; 20: Carbon utilization; 21: Detoxification; 22: Biological adhesion; 23: Nitrogen utilization; 24: Locomotion; 25: Cell; 26: Cell part; 27: Membrane; 28: Membrane part; 29: Organelle; 30: Macromolecular complex; 31: Organelle part; 32: Membrane-enclosed lumen; 33: Extracellular region; 34: Virion; 35: Virion part; 36: Supramolecular complex; 37: Cell junction; 38: Symplast; 39: Extracellular region part; 40: Nucleoid; 41: Binding; 42: Catalytic activity; 43: Transporter activity; 44: Transcription regulator activity; 45: Structural molecule activity; 46: Molecular function regulator; 47: Signal transducer activity; 48: Antioxidant activity; 49: Molecular transducer activity; 50: Nutrient reservoir activity; 51: Molecular carrier activity; 52: Protein tag; 53: Translation regulator activity.
續(xù)圖5 功能注釋
Fig. 5 ?Function notes?(continued)
2.4.3 ?KEGG功能分布統(tǒng)計(jì)??KEGG數(shù)據(jù)庫共注釋到75 396個(gè)轉(zhuǎn)錄本。根據(jù)代謝途徑可分為5個(gè)分支,細(xì)胞加工(cell processing)(3215)、環(huán)境信息處理(environmental information processing)(4592)、遺傳信息處理(genetic information processing)(16 305)、代謝(metabolism)(41?632)和有機(jī)體系統(tǒng)(organist system)(2928)。參與代謝途徑中數(shù)量最多的通路是全局和概覽圖(global and overview maps)(16 331),其次為碳水化合物代謝(carbohydrate metabolism)(6758)(圖5B)。
2.4.4 ?GO功能分布統(tǒng)計(jì)??GO數(shù)據(jù)庫中共有65?500個(gè)轉(zhuǎn)錄本被注釋??煞譃樯镞^程(biological processes)(85 290)、細(xì)胞組成(cell composition)(117?187)和分子功能(molecular function)(75 861)3大類53分支。細(xì)胞組成中細(xì)胞(Cell)占最多(22?816),擬核(nucleoid)最少(30);生物過程中最多的是細(xì)胞過程(cellular process)(24?569),其次是代謝進(jìn)程(metabolic process)(23?323),移動(dòng)(locomotion)最少(8);執(zhí)行分子功能這一大類中連接(binding)(34?271)和催化活性(catalytic activity)(32?416)數(shù)量最多,翻譯調(diào)節(jié)活性(translation regulator activity)最少(3)(圖5C)。
2.5 預(yù)測(cè)TFs、TRs以及RLKs
95?701個(gè)序列共預(yù)測(cè)出TFs 4753個(gè),66個(gè)TF家族,其中GRAS家族最多(327),其次是bHLH(321);最少的家族是ULT(2)(圖6、表4)。
共預(yù)測(cè)出TRs?1667個(gè),共有23個(gè)TR家族,其他家族有360個(gè)。數(shù)量最多的是AUX/IAA家族(214),其次是家族TRAF(144),最少的家族是MED7(4)(圖7、表4)。
RLKs位于細(xì)胞膜上在植物信號(hào)傳導(dǎo)過程起重要作用。通過數(shù)據(jù)檢測(cè)到4710個(gè)RLKs,共分為72個(gè)家族。其中亮氨酸重復(fù)類受體激酶(leuc ine repeat receptor-like kinases,LRR-RLKs)和胞內(nèi)受體激酶(receptor-like cytoplasmic kinases,RLCKs)分別有961和572個(gè),分別含有23和17個(gè)亞家族(圖8、表4)。
3 ?討論
本研究采取第三代高通量測(cè)序技術(shù)結(jié)合生物信息學(xué)分析,得到菠蘿蜜全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)。通過聚類糾錯(cuò)去冗余得到最終高質(zhì)量序列9501個(gè)和N50為1949?bp,可看出三代測(cè)序讀長(zhǎng)長(zhǎng)且連續(xù)性較高[21]。對(duì)轉(zhuǎn)錄組序列進(jìn)行編碼區(qū)域預(yù)測(cè),根據(jù)結(jié)果顯示,N50大于1000 bp且GC含量穩(wěn)定說明序列組裝完整性較高,可以為后續(xù)SSR檢測(cè)及功能注釋分析提供保障。在本試驗(yàn)檢測(cè)到的SSR序列中,屬單核苷酸重復(fù)最多,接近總SSR的一半。另外,二核苷酸以及三核苷酸重復(fù)數(shù)量均在一萬以上,三者都可以為未來SSR分子標(biāo)記開發(fā)奠定基礎(chǔ)。
通過公共數(shù)據(jù)庫對(duì)轉(zhuǎn)錄組比對(duì)分析,共有93?367個(gè)序列成功注釋,占比97.56%,充分表明三代測(cè)序結(jié)果的較高精確性。推測(cè)剩余的2334條序列未被注釋的原因可能是由于本身是非編碼序列或者不完整序列[22]。根據(jù)NR注釋情況來看,注釋到川?;蜃疃啵w現(xiàn)了菠蘿蜜與其親緣性較高,也為將來二者基因表達(dá)詳細(xì)比較提供充分的數(shù)據(jù)基礎(chǔ)。比較KOG、KEGG、GO 3個(gè)數(shù)據(jù)庫功能統(tǒng)計(jì)情況,發(fā)現(xiàn)注釋到KOG的轉(zhuǎn)錄本數(shù)最多,其中以一般功能、信號(hào)轉(zhuǎn)導(dǎo)機(jī)制、核酸運(yùn)輸和代謝的相關(guān)基因最為豐富。
由于菠蘿蜜基因組還未被測(cè)序,限制其在分子生物學(xué)方面的研究。Hu等[5]對(duì)菠蘿蜜花被進(jìn)行轉(zhuǎn)錄組測(cè)序,得到32?495個(gè)高質(zhì)量序列。本試驗(yàn)所獲得的高質(zhì)量序列比花被多的原因也許是由于測(cè)序的組織混合樣品較多。花被高質(zhì)量序列在七大數(shù)據(jù)庫中獲得功能注釋的基因占比40%~80%,相對(duì)而言莖葉略比花被注釋到的基因多,出現(xiàn)此結(jié)果差異也許是因?yàn)槠鞴俳M織不同。
TFs調(diào)控眾多基因表達(dá),掌握其家族分類可對(duì)其功能有更深入的了解[23]。在TFs中,bHLH家族共有321個(gè),目前已有關(guān)于桑樹bHLH家族分析的報(bào)道[24]。本研究預(yù)測(cè)菠蘿蜜體內(nèi)的TFs、TRs、RLKs數(shù)量以及詳細(xì)的家族分類,為未來研究抗性基因表達(dá)以及詳細(xì)的家族分析提供數(shù)據(jù)。
本研究的轉(zhuǎn)錄組數(shù)據(jù)和各項(xiàng)結(jié)果豐富了菠蘿蜜的分子信息,可為未來二代測(cè)序差異表達(dá)基因提供模板,進(jìn)一步討論其關(guān)于分子生物學(xué)方面的研究。
參考文獻(xiàn)
[1]?Manjeshwar S B, Arnadi R S, Raghavendra H,et al. Nutritional and pharmacological properties ofArtocarpus heterophyllusLam.?(jackfruit): A review[J]. Food Research International, 2011, 44(7): 1800-1811.
[6]?Jaillon O, Aury J M, Noel B,et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla[J]. Nature, 2007, 449(7161): 463-467.
[7]?D'Hont A, Denoeud F, Aury J M,et al. The banana (Musa cuminata) genome and the evolution of monocotyledonous plants[J]. Nature, 2012, 488(7410): 213-217.
[8]?Ming R, VanBuren R, Wai C M,et al. The pineapple genome and the evolution of CAM photosynthesis[J]. Nature Genetics, 2015, 47(12): 1435-1442.
[9]?Barthelson R, McFarlin A J, Rounsley S D,et al. Plantagora: modeling whole genome sequencing and assembly of plant genomes[J]. PLoS One, 2011, 6(12): e28436.
[10]?桑樹基因組研究團(tuán)隊(duì). 桑樹(川桑Morus notabilis)全基因組測(cè)序[J]. 蠶學(xué)通訊, 2013, 33(4): 1-11.
[11]?張文秀, 張??麗, 寇一翾, 等. 中國(guó)瀕危植物金錢松轉(zhuǎn)錄組測(cè)序及生物信息學(xué)分析[J]. 江西農(nóng)業(yè)大學(xué)學(xué)報(bào), 2019, 41(4): 761-772.
[12]?張得芳, 馬秋月, 尹佟明, 等. 第三代測(cè)序技術(shù)及其應(yīng)用[J]. 中國(guó)生物工程雜志, 2013, 33(5): 125-131.
[13]?Franssen S U, Shrestha R P, Br?utigam A,et al. Comprehensive transcriptome analysis of the highly complexPisum sativumgenome using next generation sequencing[J]. BMC Genomics, 2011, 12(1): 227.
[14]?付??影, 于旭東, 蔡澤坪, 等. 菠蘿蜜白化突變體的性狀研究[J]. 熱帶作物學(xué)報(bào), 2018, 39(6): 1081-1086.