孫 揚(yáng),郭寶英,祁鵬志,陳 宇,唐祖蓉,劉碩博
(浙江海洋大學(xué)海洋科學(xué)與技術(shù)學(xué)院,國(guó)家海洋設(shè)施養(yǎng)殖工程技術(shù)研究中心,浙江舟山 316022)
曼氏無針烏賊Sepiella japonica,俗稱墨魚、目魚,隸屬于軟體動(dòng)物門Mollusca、頭足綱Cephalopoda、十腕目Decapoda、烏賊科Sepiidae、無針烏賊屬Sepiella[1],主要分布于我國(guó)浙江、福建沿海,具有很高的食用、藥用及經(jīng)濟(jì)價(jià)值。浙江省歷史上最高年產(chǎn)量達(dá)6萬t,占當(dāng)時(shí)全省海洋捕撈量的9.3%[2],然而自1980年以后,由于人類活動(dòng)的愈發(fā)頻繁造成沿海海域污染,捕撈力度過大,超過其種群自我修復(fù)的范圍,捕撈產(chǎn)量急劇下降。近年來,為了恢復(fù)曼氏無針烏賊的資源,我國(guó)開啟了一系列人工養(yǎng)殖和增殖放流行動(dòng)。人工養(yǎng)殖的曼氏無針烏賊1 a可以繁殖2次,半年時(shí)間就能長(zhǎng)至200 g[3],是我國(guó)海水養(yǎng)殖中極具潛力的養(yǎng)殖品種之一。在增殖放流方面,浙江海洋大學(xué)研究團(tuán)隊(duì)已經(jīng)成功開展了一系列放流活動(dòng),據(jù)統(tǒng)計(jì),于2009-2012年累計(jì)放流烏賊幼體(卵)3 921.44 萬只(顆)[4],于 2013 年至 2017 年累計(jì)放流烏賊幼體(卵)4 900.67 萬只(顆)。目前對(duì)增殖放流成果的主要評(píng)估方式是對(duì)標(biāo)記個(gè)體的回捕率進(jìn)行分析。近年來新興的標(biāo)記方法有,對(duì)魚鰭魚尾注入編碼微型金屬標(biāo)記[5]、使用四環(huán)素處理幼魚耳石標(biāo)記[6]和分子標(biāo)記法。其中編碼微型金屬標(biāo)記法儀器費(fèi)用昂貴,耳石標(biāo)記法對(duì)魚仔生理發(fā)育有一定影響,分子標(biāo)記法操作簡(jiǎn)單,無需任何物理標(biāo)記,僅通過放流個(gè)體的基因組DNA獲取的遺傳信息便可以對(duì)其增殖放流效果、種質(zhì)資源、遺傳組成進(jìn)行科學(xué)合理有效的評(píng)估。如2012年,我國(guó)學(xué)者許凌雪[7]使用微衛(wèi)星標(biāo)記,對(duì)呼瑪河哲羅鮭Hucho taimen放流效果進(jìn)行了評(píng)估,近年來在草魚Ctenopharyngodon idellus[8]、三疣梭子蟹Portunus trituberculatus[9]、許氏平鮋Sebastes schlegelii[10]、魁蚶Scapharca broughtonii[11]和胭脂魚Myxocyprinus asiaticus[12]等諸多物種放流效果評(píng)估中得到了廣泛的應(yīng)用。
在各種分子標(biāo)記中,簡(jiǎn)單重復(fù)序列(simple sequence repeat,SSR)又稱作微衛(wèi)星和單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP),是當(dāng)今分子育種、遺傳多樣性分析中應(yīng)用最廣的兩種分子標(biāo)記[13]。SSR普遍存在于真核生物基因組,是由若干個(gè)堿基組成的簡(jiǎn)單串聯(lián)重復(fù)序列。然而傳統(tǒng)手段開發(fā)SSR標(biāo)記方法繁瑣且成功率低,如利用富集技術(shù)篩選SSR標(biāo)記,需要構(gòu)建篩選基因文庫,實(shí)驗(yàn)量大且耗費(fèi)頗高[14]。而由轉(zhuǎn)錄組來源的SSR(EST-SSR)具有數(shù)據(jù)量大,適用性廣等優(yōu)勢(shì),目前已在動(dòng)植物中廣泛應(yīng)用。在海洋生物中,已有達(dá)氏鱘Acipenser dabryanus[15]、凡納濱對(duì)蝦Litopenaeus vannamei[16]、白梭吻鱸Sander lucioperca[17]、青石斑魚Epinephelus awoara[18]等基于轉(zhuǎn)錄本數(shù)據(jù)或EST數(shù)據(jù)庫成功進(jìn)行SSR標(biāo)記開發(fā)的報(bào)道。SNP是由于單個(gè)核苷酸的變異而導(dǎo)致基因組層面DNA序列的多態(tài)性,通常表現(xiàn)為單個(gè)堿基的轉(zhuǎn)換或顛換、缺失或插入[19]。SNP以其在基因組上多態(tài)性豐富著稱,絕大多數(shù)SNP位點(diǎn)分布于基因組的非編碼區(qū),少部分分布于基因的編碼區(qū)的位點(diǎn)通常稱為編碼SNP,這一類SNP在遺傳學(xué)研究中具有重要意義[20]。SNP作為新興的第三代分子標(biāo)記,相比較于之前的分子標(biāo)記,具有位點(diǎn)數(shù)量多、基因組內(nèi)分布廣泛、遺傳穩(wěn)定性高、檢測(cè)手段簡(jiǎn)單且準(zhǔn)確率高、某些SNP與生物特定的性狀直接相關(guān)、某些SNP在不同群體中具有顯著差異等優(yōu)點(diǎn)[21]。目前SNP位點(diǎn)在水生生物中已被廣泛應(yīng)用,如對(duì)中國(guó)對(duì)蝦Fenneropenaeus chinensis[22]進(jìn)行放流效果評(píng)估,對(duì)青海湖裸鯉Gymnocypris przewalskii[23]、大口黑鱸Micropterus salmoides[24]進(jìn)行分子育種輔助等。
本文擬通過對(duì)曼氏無針烏賊轉(zhuǎn)錄組序列分析,分析其SSR位點(diǎn)和SNP位點(diǎn)的組成和特征,完善曼氏無針烏賊分子標(biāo)記,為今后曼氏無針烏賊的種質(zhì)資源評(píng)估、遺傳圖譜構(gòu)建和增殖放流效果評(píng)估工作提供有力的研究工具。
用于轉(zhuǎn)錄組高通量測(cè)序分析的曼氏無針烏賊組織樣品于2016年5月采自福建省寧德市蒼南縣苗種養(yǎng)殖示范基地,該海區(qū)水體污染少,繁育養(yǎng)殖技術(shù)成熟。選取健康烏賊活體解剖后取其視腺組織,使用液氮速凍保存?zhèn)溆谩?/p>
1.2.1 轉(zhuǎn)錄組EST微衛(wèi)星序列獲取
曼氏無針烏賊視腺樣品總RNA的提取,cDNA文庫的構(gòu)建由華大基因公司完成。構(gòu)建好的文庫質(zhì)檢合格后使用IlluminaHiSeq4000平臺(tái)進(jìn)行測(cè)序[25]。測(cè)序所得的raw reads經(jīng)過如下步驟篩選:去除包含接頭的reads;去除未知堿基N含量大于5%的reads;去除低質(zhì)量的reads。對(duì)過濾后得到的clean reads進(jìn)行De novo組裝。組裝后得到的轉(zhuǎn)錄本使用MISA[26]工具進(jìn)行微衛(wèi)星的搜索。SSR搜索參數(shù)設(shè)置以不同數(shù)量級(jí)堿基的重復(fù)次數(shù)區(qū)分,從單堿基到六堿基所需最少重復(fù)次數(shù)依次為:12、6、5、5、4、4。
1.2.2 SNP位點(diǎn)挖掘
我們使用HISAT[27]將clean reads對(duì)比到Unigene,然后使用GATK[28]檢測(cè)SNP并過濾低質(zhì)量SNP。
1.2.3 SSR引物設(shè)計(jì)
使用Primer premier 5對(duì)檢測(cè)到的SSR進(jìn)行引物設(shè)計(jì),篩選引物長(zhǎng)度介于18~28 bp,引物退火溫度介于 55~65 ℃產(chǎn)物長(zhǎng)度篩選范圍依次為 80~160 bp,80~240 bp,80~300 bp。
轉(zhuǎn)錄組數(shù)據(jù)量一共測(cè)得44.61 Gb數(shù)據(jù),組裝并去冗余后得到127 575個(gè)Unigene,總長(zhǎng)度為103 104 058 bp。共搜索到分布于50 626條序列中的各種SSR位點(diǎn)108 685個(gè),平均每949 bp就含有1個(gè)SSR位點(diǎn),SSR發(fā)生率39.68%(含有SSR的Unigene數(shù)目與總Unigene的數(shù)目之比),出現(xiàn)頻率(檢出SSR個(gè)數(shù)與總Unigene數(shù)目之比)[29]為85.19%。在50 626含有SSR的Unigene序列中,有25 548條unigene中,含有SSR位點(diǎn)數(shù)目在2個(gè)及以上。從SSR重復(fù)類型分析發(fā)現(xiàn),單堿基重復(fù)46 561(42.84%),二堿基重復(fù) 31 227(28.73%),三堿基重復(fù) 16 230(14.93%),四堿基重復(fù) 13 899(12.79%),五堿基重復(fù) 603(0.55%),六堿基重復(fù) 165(0.15%)(圖 1)。
圖1 曼氏無針烏賊轉(zhuǎn)錄組EST中1-6堿基類型微衛(wèi)星的組成各類型分布情況圖表Fig.1 The percentages of mono-,di-,tri-,quad-,penta-,and hexa-nucleotide repeats in SSR motif sequences in S.japonica transcriptome EST
從圖1可以看出,曼氏無針烏賊EST-SSR重復(fù)基元類型豐富,共觀察到124種重復(fù)基元,從單核苷酸至六核苷酸種類分別有2、4、10、28、45、35。在各堿基類型的微衛(wèi)星中,堿基重復(fù)基元的數(shù)量分布具有差異。在這124種重復(fù)基元中,各類型重復(fù)基元分布如下:?jiǎn)螇A基重復(fù)基元中以A/T為主,占總SSR的42.23%,C/G占總SSR的0.61%;二堿基重復(fù)基元中,AT/AT占比13.33%,AC/GT占比9.32%,AG/CT占比6.06%,剩余合計(jì)占比0.03%;三堿基重復(fù)基元中,占主體的有:AAT/ATT占比3.97%,AAG/CTT占比3.69%;在單堿基至三堿基中,重復(fù)基元 CG/CG(18),ACG/CGT(180),CCG/CGG(152),數(shù)量較少。四堿基重復(fù)基元中,AAAG/CTTT占比10.00%,AGAT/ATCT占比1.16%,其余26種類型總計(jì)占比1.63%。五堿基和六堿基SSR重復(fù)基元類型較多,但數(shù)目占總數(shù)的極少部分,出現(xiàn)頻率極低。
圖2 曼氏無針烏賊轉(zhuǎn)錄組EST中SSR重復(fù)基元類型與數(shù)目統(tǒng)計(jì)圖Fig.2 Observed counts of identified microsatellite loci for different repeat sequence motifs of di-,tri-,quad-,penta-and hexanucleotide repeats in S.japonica transcriptome EST
各數(shù)量級(jí)堿基的微衛(wèi)星重復(fù)次數(shù)的變異范圍也存在區(qū)別[30]。由表1可見,在二堿基中AC/GT,AG/CT,AT/AT重復(fù)次數(shù)變異范圍為6~62次,集中在6~12次,而CG/CG重復(fù)次數(shù)變異為6~8次。二堿基中6次重復(fù)的微衛(wèi)星最多,占總二堿基類型的22.03%。三堿基中數(shù)目占比較多的AAT/ATT,AAG/CTT重復(fù)次數(shù)變異范圍為5~49次,集中在5~8次,其余重復(fù)基元重復(fù)次數(shù)變異范圍為5~27次,集中于5~8次,三堿基中5次重復(fù)的微衛(wèi)星最多,占總?cè)龎A基類型的38.43%。四堿基中占比最多的AAAG/CTTT重復(fù)次數(shù)變異范圍為5~34次,集中于5~6次,其余重復(fù)基元重復(fù)次數(shù)變異范圍為5~33次,集中于5~6次,四堿基5次重復(fù)的微衛(wèi)星最多,占總四堿基類型的41.31%。五堿基中重復(fù)次數(shù)變異范圍為4~11次,集中于4~5次,重復(fù)次數(shù)為4的微衛(wèi)星最多,占總五堿基類型的79.27%。六堿基中重復(fù)次數(shù)變異范圍為4~11次,只有少數(shù)微衛(wèi)星重復(fù)次數(shù)不為4,重復(fù)次數(shù)為4的微衛(wèi)星占總六次重復(fù)微衛(wèi)星比87.27%。由此可見,曼氏無針烏賊中各堿基類型的微衛(wèi)星位點(diǎn)隨著堿基數(shù)目的增加,其中重復(fù)基元的變異逐漸減少;各堿基類型的微衛(wèi)星序列均以滿足最低重復(fù)次數(shù)篩選要求的序列最多;隨著重復(fù)次數(shù)要求的增加,相對(duì)應(yīng)的微衛(wèi)星的數(shù)量逐級(jí)減少;隨著微衛(wèi)星堿基數(shù)的增加,其最高重復(fù)次數(shù)占比也逐漸增多。重復(fù)次數(shù)的范圍也隨著堿基數(shù)量增加而減小,KELKAR,et al[31]研究認(rèn)為重復(fù)次數(shù)越高的微衛(wèi)星其多態(tài)性也越高,這說明在曼氏無針烏賊中,二堿基微衛(wèi)星多態(tài)性可能較高,隨著堿基數(shù)量增加多態(tài)性也隨之降低。
表1 曼氏無針烏賊各堿基重復(fù)次數(shù)分布表Tab.1 The repeating number of di-,tri-,quad-,penta-,and hexa-nucleotide repeats in SSR motif sequences in S.japonica transcriptome EST
SNP是基因組水平上單個(gè)堿基的變異,包括置換、顛換、缺失和插入[19]。SNP可在DNA、RNA和蛋白質(zhì)不同水平影響基因的功能,尤其是位于編碼區(qū)域內(nèi)的編碼SNP(cSNP)與基因的表達(dá)相關(guān),直接影響著功能基因的作用途徑[20],cSNP是對(duì)基因功能與表型性狀進(jìn)行分析研究的重要途徑,通過其分布情況以及功能分析可以得到許多與物種生長(zhǎng)發(fā)育性狀相關(guān)的重要資料。
在曼氏無針烏賊轉(zhuǎn)錄組中共有12 323條Unigene中,檢測(cè)到64 732個(gè)SNP位點(diǎn),每條Unigene平均含 5.25 個(gè) SNP 位點(diǎn)(表 2)。其中轉(zhuǎn)換 Transition 45 975 個(gè)(71.02%),顛換 Transversion 18 757 個(gè)(28.98%)。6種單核苷酸變異中,A/G和C/T發(fā)生的頻率最高,分別達(dá)到36.86%和34.16%。其他4種單核苷酸變異中A/C、A/T、C/G和G/T的頻率分別為7.85%、8.78%、4.46%和7.89%。該研究結(jié)果極大豐富了曼氏無針烏賊SNP位點(diǎn)信息,為其遺傳關(guān)聯(lián)分析、種質(zhì)資源評(píng)估奠定了基礎(chǔ)。
表2 曼氏無針烏賊SNP位點(diǎn)分布表Tab.2 Distribution table of SNP locus in S.japonica
將搜索到的SSR位點(diǎn)信息導(dǎo)入至Primer premier 5軟件設(shè)計(jì)引物,從結(jié)果中篩選引物長(zhǎng)度介于18~28 bp、引物退火溫度介于55~65℃、產(chǎn)物長(zhǎng)度篩選范圍依次為80~160 bp的引物,挑選部分引物如表3所示。
表3 曼氏無針烏賊EST-SSR引物表Tab.3 Primer of EST-SSR in S.japonica
在各種DNA分子標(biāo)記中,SSR與SNP標(biāo)記技術(shù)已被廣泛應(yīng)用于分子育種,遺傳分析,親緣鑒定等科學(xué)研究活動(dòng)中[32]。隨著二代高通量測(cè)序技術(shù)的發(fā)展,通過轉(zhuǎn)錄組數(shù)據(jù)庫來進(jìn)行分子標(biāo)記的發(fā)掘逐漸成為一種高速、有效的方法。在這之前通過DNA建庫或探針富集法所開發(fā)出的曼氏無針烏賊SSR引物約25對(duì)[33-34],而呂振明等[30]使用De novo高通量測(cè)序法獲得并驗(yàn)證了65對(duì)可用的SSR引物,說明該方法可靠、高效。本文對(duì)曼氏無針烏賊視腺組織轉(zhuǎn)錄組測(cè)序獲得的127 575條Unigene序列,共得到分布于50 626條序列中的各種SSR位點(diǎn)108 685個(gè),SSR發(fā)生率39.68%,出現(xiàn)頻率為85.19%。平均每949 bp就含有1個(gè)SSR位點(diǎn)。利用Primer premier 5軟件設(shè)計(jì)生成引物346 520對(duì)。本研究在搜索到的微衛(wèi)星位點(diǎn)中,以一、二、三、四堿基占微衛(wèi)星堿基類型的主體,而五、六堿基微衛(wèi)星數(shù)量極少。微衛(wèi)星數(shù)量隨著堿基數(shù)量增加而減少,隨著重復(fù)次數(shù)的增加而減少。本次研究搜索所得的微衛(wèi)星數(shù)量多、類型豐富,可為今后進(jìn)行曼氏無針烏賊微衛(wèi)星引物的開發(fā)豐富材料,為其增殖放流效果評(píng)估提供有力的研究工具。
SNP位點(diǎn)標(biāo)記作為第三代遺傳標(biāo)記技術(shù)具有位點(diǎn)出現(xiàn)頻次高、基因組分布廣、易于檢測(cè)等優(yōu)點(diǎn),在海洋動(dòng)物中可被應(yīng)用于遺傳圖譜構(gòu)建、QTL定位、關(guān)聯(lián)分析等方面研究[35]。本研究在12 323條Unigene中共檢索到64 732個(gè)SNP位點(diǎn),SNP位點(diǎn)數(shù)量豐富,每條Unigene平均含5.25個(gè)SNP位點(diǎn)。其中轉(zhuǎn)換Transition45 975個(gè)(71.02%),顛換Transversion18 757個(gè)(28.98%)。6種單核苷酸變異中,A/G和 C/T發(fā)生的頻率最高,分別達(dá)到36.86%和34.16%。其他4種單核苷酸變異中 A/C、A/T、G/T和 C/G的頻率分別為7.85%、8.78%、4.46%和7.89%。本研究首次報(bào)道了曼氏無針烏賊SNP位點(diǎn),為后續(xù)曼氏無針烏賊與其它烏賊的進(jìn)化關(guān)系、對(duì)其生長(zhǎng)發(fā)育性狀的分型研究等提供了重要的研究工具。
SSR標(biāo)記作為一種高效的分子標(biāo)記手段,其缺點(diǎn)是SSR標(biāo)記具有特異性,須使用PCR進(jìn)行驗(yàn)證[29]。本研究在后期還將會(huì)對(duì)已搜索得到的SSR位點(diǎn)的相應(yīng)引物進(jìn)行驗(yàn)證,以探索其多態(tài)性和穩(wěn)定性。SNP作為分子標(biāo)記常用檢測(cè)方法有Taqman法、芯片法、酶切法、質(zhì)譜法、測(cè)序法等[36],本研究后期擬選用可靠性高的限制性內(nèi)切酶酶切法來對(duì)SNP進(jìn)行檢測(cè)。本研究結(jié)果表明通過高通量測(cè)序技術(shù)聯(lián)合生物信息學(xué)方法開發(fā)SSR、SNP位點(diǎn)是一種高效、快速的方法。目前在曼氏無針烏賊中尚未有對(duì)SNP進(jìn)行相關(guān)研究的報(bào)道,本研究有望對(duì)曼氏無針烏賊SNP的開發(fā)提供可靠的指導(dǎo),同時(shí)對(duì)曼氏無針烏賊資源的種質(zhì)評(píng)估、遺傳分析、增殖放流效果評(píng)估等提供有力的研究工具。