(閩江學院海洋研究院,福建 福州 350108)
多板綱(Polyplacophora)屬于軟體動物門,本綱動物統(tǒng)稱石鱉,是廣泛存在于潮間帶的海洋動物,從熱帶到極地的世界各大洋中均有分布,通常在巖石上營底棲附著生活,對潮間帶的生態(tài)平衡和能量流動起著重要作用[1]。石鱉背部通常有八片連續(xù)的殼板,殼板被文石鱗片或針狀體環(huán)帶包圍,俗稱“八節(jié)毛”“石鐵板”“鐵角”等。我國東南沿海石鱉種類較多,例如紅條毛膚石鱉(Acanthochitonarubrolineata)、日本花棘石鱉(Liolophuurajaponica)、日本寬板石鱉(Placiphorellajaponica)和平瀨錦石鱉(Onithochitonhirasei)等[2],其中紅條毛膚石鱉屬于毛膚石鱉科,屬于廣溫廣布性種類,數量較多,也有研究表明該物種對醫(yī)治淋巴結核和麻風病有一定的療效;日本花棘石鱉屬于石鱉科,是亞熱帶、熱帶暖水性種類,在福建分布較為廣泛,而且日本花棘石鱉個體相對更大,常被沿海居民采捕食用。此外,石鱉的齒舌因結構和磁性的特殊性受到廣泛關注,其磁性物質為納米顆粒結構,是有潛力的未來磁性納米材料來源之一[3]。
在軟體動物門中,多板綱獨特的殼板使其具有特殊的形態(tài)結構。研究表明Pax(Paired-box)基因家族與動物發(fā)育形態(tài)密切有關,編碼的蛋白是一組極為重要的轉錄調控因子,在胚胎發(fā)育的器官形成中扮演重要角色。Pax基因家族的主要特征是編碼含有128個氨基酸組成的成對域(paired domain,PD)[4],Pax蛋白通過成對域與DNA或其他蛋白相互作用,其主要功能包括:調控細胞增殖、促進細胞自我更新、誘導前體細胞定向轉移以及改變特異細胞系的分化方向等[5]。研究表明Pax因子的非正常表達會導致多種器官組織發(fā)育畸形[6]。根據結構域組成的差異將其分為不同的亞族:Pax1/9、Pax2/5/8、Pax3/7、Pax4/6、Poxneuro、Paxα/β和Paxeyg[7]。多板綱形態(tài)獨特,但目前軟體動物中關于Pax基因家族的研究較少,在多板綱動物中的研究幾乎為空白。
石鱉除了具有特殊的形態(tài)結構之外,在研究軟體動物的起源與進化中也有著重要的地位,是軟體動物門中的原始類群[8]。目前,關于多板綱動物的分子數據較少,僅有少量線粒體基因組及線粒體細胞色素c氧化酶亞基Ⅰ基因(COⅠ)數據[9-11],對其分類仍然主要依賴形態(tài)觀察,包括殼板、齒舌、外套膜的形態(tài)差異[12]。目前,通過分子生物學技術對多板綱進行進化分析是發(fā)展趨勢。豐富多板綱的分子數據有利于明確多板綱分類,加深對其進化地位的了解。因此,本文采用二代Illumina Hi-seq測序技術對紅條毛膚石鱉和日本花棘石鱉兩種石鱉種類進行了轉錄組測序,構建轉錄組數據庫,并對Unigene進行功能注釋,豐富基因數據庫,為以后明確多板綱動物分類積累數據,為解析多板綱進化地位奠定基礎。
在福建省廈門市淺灘采集兩種石鱉,依據形態(tài)特征和18S RNA鑒定物種分別是紅條毛膚石鱉和日本花棘石鱉[12],將整個個體組織迅速放入液氮中速凍,隨后放在-80℃冰箱中保存。每個物種選取3個個體,將其混合在一起組成一個轉錄組測序樣品,通過TRIzol法提取RNA,瓊脂糖凝膠電泳和Nanodrop分析樣品RNA濃度和完整性,用于轉錄組測序。
石鱉的轉錄組建庫、測序和拼接組裝委托北京諾禾致源生物信息科技有限公司完成。建庫使用的試劑盒為Illumina的NEBNext? UltraTM RNA Library Prep Kit,以mRNA為模板,構建cDNA雙鏈,庫檢合格后,通過Illumina Hi-seq進行測序。為了保證數據分析的質量及可靠性,對原始數據進行過濾,去除帶接頭、含N、低質量reads,同時對Clean data進行Q20、Q30和GC含量計算,后續(xù)所有分析均是基于Clean data。
鑒于石鱉無參考基因組,采用Trinity對Clean reads進行拼接,將拼接得到的轉錄本序列作為后續(xù)分析的參考序列,取每條基因中最長的轉錄本作為Unigene,進行后續(xù)的分析。對轉錄本及Unigene的長度分別進行統(tǒng)計。為獲得全面的基因功能信息,進行了7大數據庫的基因功能注釋,包括:Nr、Nt、Pfam、KOG/COG、Swiss-prot、KEGG和GO。對基因進行GO注釋之后,將注釋成功的基因按照GO的3個大類(生物學過程,細胞組分,分子功能)的下一層級進行分類。
簡單重復序列標記(simple sequence repeats,SSR)的搜索與篩選采用MISA軟件,對應的各個unit size(1-6)的最少重復次數分別為10、6、5、5、5、5,例如以二堿基重復單位計,最少重復數為6。對Unigene進行SSR檢測。根據SSR兩端序列,采用Primer 3進行SSR引物設計。
通過對石鱉轉錄組進行序列分析,得到部分或完整的Pax基因序列。通過預測蛋白結構域(http://smart.embl.de/),選擇具有Pax結構域的基因,同時下載已公布的軟體動物Pax序列(https://www.ncbi.nlm.nih.gov/gene),用MEGA 7.0自帶的ClustalW程序進行氨基酸的多序列比對,將兩端進行人工修齊后,采用NJ鄰接法構建系統(tǒng)發(fā)生樹,同時采用1 000次bootstrap進行檢驗。將系統(tǒng)發(fā)生樹導入iTOL網站(http://itol.embl.de/)進行圖片處理。
經過原始數據過濾、測序錯誤率檢查、GC含量分布檢查等,獲得后續(xù)分析使用的Clean reads,數據匯總如表1所示。紅條毛膚石鱉樣品(AP)測序后得到60 666 664條原始reads數,數據過濾后得到50 109 686條reads數,Q20值和Q30值為96.20%和90.35%,GC含量為47.41%。日本花棘石鱉樣品(LJ)測序后得到48 856 746條原始reads數,過濾后得到48 052 466條reads數,Q20值和Q30值為97.08%和92.25%,GC含量為45.13%。
表1 石鱉的轉錄組測序基本信息
組裝獲得Unigene后,將所有Unigene在NR、NT、KO、SwissProt、PFAM、GO和KOG 7大數據庫進行蛋白功能基本注釋,注釋結果見表2。紅條毛膚石鱉和日本花棘石鱉轉錄組共有121 892和83 776個Unigene。NR注釋到的Unigene所占比例最高,分別有30 299和22 827個Unigene被注釋;在NT數據庫中注釋的Unigene所占比例最低,分別是5.03%和5.96%;綜合7個數據庫的結果,分別有3 111個和2 682個Unigene在7個數據庫中均被注釋;39 908和29 528個Unigene至少在其中一個數據庫中有被注釋。
表2 在數據庫中基因注釋數目與注釋成功率
GO和KEGG富集分析發(fā)現,兩個石鱉轉錄組表達的基因富集的結果無顯著差異。富集最高的5個GO條目均是“生物學過程”的“Cellular process”“Metabolic process”“Single-organism process”和“分子功能”的“Binding”和“Catalytic activity”(圖1)。在KEGG分類中,富集到基因數目最多的5個類群依次是“Signal transduction”“Transport and catabolism”“Endocrine system”“Folding, sorting and degradation”和“Translation”(圖2)。
對紅條毛膚石鱉和日本花棘石鱉轉錄組的Unigene進行SSR檢測,分別篩選到14 602個和15 531個SSR,單堿基重復單位SSR的重復次數主要集中在9~12次,其次是13~16次,2~5堿基重復單位SSR的重復次數主要集中5~8次(圖3)。
在紅條毛膚石鱉轉錄本中鑒定到5條Pax基因,包含3條Pax2/5/8,1條Pax1/9和1條Pax6,在日本花棘石鱉轉錄本中鑒定到3條Pax基因,分別是Pax1、Pax2/5/8和Pax2(表3)。根據已發(fā)表的軟體動物Pax序列,整理歸納的Pax2/5/8基因及其剪切體有38條,Pax3/7基因及其剪切體有12條,Pax1/9基因及其剪切體有8條,Pax-α/β基因及其剪切體有2條,Pax6基因及其剪切體有20條(表4)。將以上公布的80條Pax基因和來自兩個石鱉轉錄組的8條Pax序列一起構建系統(tǒng)發(fā)生樹,結果顯示軟體動物Pax基因家族明顯聚為5類(圖4):Pax1/9、Pax2/5/8、Pax3/7、Pax-α/β和Pax6,石鱉的Pax基因與相同的基因亞族聚為一支,具有較高的同源性。
注:橫坐標為GO3個大類的下一層級的GO term,縱坐標為注釋term下的基因個數。 Biological Pathway:生物學過程;Molecular Function:分子功能;Cellular Component:細胞組分。圖1 紅條毛膚石鱉和日本花棘石鱉轉錄組表達基因的GO富集分類圖Fig.1 The enriched GO terms of expression genes in the transcriptome of A. rubrolineata and L. japonica
注:圖中縱坐標為KEGG代謝通路的名稱,橫坐標為注釋到該通路下的基因個數及其個數占被注釋上的基因總數的比例。將基因根據參與的KEGG代謝通路分為5個分支:細胞過程(A,Cellular Processes),環(huán)境信息處理(B,Environmental Information Processing),遺傳信息處理(C,Genetic Information Processing),代謝(D,Metabolism),有機系統(tǒng)(E,Organismal Systems)。圖2 紅條毛膚石鱉和日本花棘石鱉轉錄組表達基因的KEGG代謝通路富集統(tǒng)計圖Fig.2 Diagram of KEGG metabolic pathway enrichment of expression genes in the transcriptome of A. rubrolineata and L. japonica
圖3 SSR在紅條毛膚石鱉(a)和日本花棘石鱉(b)轉錄本中的密度分布Fig.3 Distribution of SSR in the transcriptome of A. rubrolineata(a) and L. japonica(b)
表3 紅條毛膚石鱉和日本花棘石鱉轉錄本中鑒定的Pax基因
表4 軟體動物的Pax蛋白結構域
續(xù)表
續(xù)表
續(xù)表
注:箭頭表示在紅條毛膚石鱉和日本花棘石鱉轉錄本中鑒定的Pax基因。圖4 軟體動物的Pax基因系統(tǒng)發(fā)生樹Fig.4 The neighbour-joining phylogenetic tree of Pax in mollusca
本研究通過RNA-seq技術對紅條毛膚石鱉和日本花棘石鱉進行了轉錄組測序,通過組裝分別獲得了個121 892和83 776個Unigene,豐富了多板綱分子數據庫,為生物學性狀的解析奠定了基礎;通過對Unigene進行SSR檢測,分別篩選到14 602個和15 531個SSR,可以用于開發(fā)SSR位點,為多板綱的遺傳標記開發(fā)提供資源。
Pax基因家族編碼一組發(fā)育調控相關轉錄因子,在胚胎發(fā)育過程中對組織和器官特化起關鍵的調控作用。Pax基因通過選擇性的剪切方式產生多種亞型,這些亞型的蛋白產物單獨或形成多聚體或與其他蛋白結合形成復合體參與細胞的調控。在本研究中,在2個轉錄本中共鑒定到8條Pax基因,包含5條Pax2/5/8,2條Pax1/9和1條Pax6。不同的Pax亞家族各司其職,例如,Pax1/9在動物的骨骼和胸腺發(fā)育過程中發(fā)揮重要作用[13];Pax2/5/8參與軟體動物中樞神經系統(tǒng)和排泄器官的發(fā)育過程[14];Pax6在頭足類的眼睛、腦、感覺器官和中樞神經系統(tǒng)的形態(tài)發(fā)育過程中發(fā)揮作用[15]。系統(tǒng)進化樹結果顯示,多板綱的Pax基因是非常保守的轉錄因子,在系統(tǒng)進化樹中均與相對應的軟體動物Pax基因亞族聚為一支,同時也驗證了基因注釋的準確性。本文篩選的Pax基因不僅補充了對多板綱Pax基因家族的研究,同時也有利于將來解析多板綱獨特的形態(tài)結構特性。
近年來,基于石鱉在生態(tài)學、古生物學、材料學、醫(yī)藥和食品等方面的研究和利用價值,多板綱這一重要海洋生物類群日益受到關注。無論是其食用、藥用價值,還是其齒舌磁性納米材料開發(fā)等方面,石鱉都是值得進一步深入研究和發(fā)展的水產增養(yǎng)殖品種[16]。然而目前,我國對石鱉的研究才剛剛起步,也尚未對其進行增養(yǎng)殖開發(fā)。相對于其他軟體動物,人們對石鱉知之甚少,今后應提高對該物種的重視,加強對該物種的理論基礎研究,豐富其綜合利用途徑。本研究獲得的轉錄組數據可為將來多板綱動物的進一步研究提供有用的基礎和資源。