孟 瑋,蔣艷琳,張 林,楊天燕,周劍光
(1.浙江省海洋水產(chǎn)研究所,浙江省海洋漁業(yè)資源可持續(xù)利用技術(shù)研究重點(diǎn)實(shí)驗(yàn)室, 農(nóng)業(yè)農(nóng)村部重點(diǎn)漁場漁業(yè)資源科學(xué)觀測實(shí)驗(yàn)站,浙江舟山 316021; 2.浙江海洋大學(xué)水產(chǎn)學(xué)院,浙江舟山 316022; 3.中國水產(chǎn)科學(xué)研究院長江水產(chǎn)研究所, 農(nóng)業(yè)農(nóng)村部水產(chǎn)品質(zhì)量安全風(fēng)險評估實(shí)驗(yàn)室(武漢),武漢 430223)
江鱈(Lotalota)隸屬于鱈形目(Gadiformes)鱈科(Gadidae)江鱈屬(Lota),是鱈科魚類中僅有的生活在淡水中的珍稀經(jīng)濟(jì)種,也是少數(shù)極地附近分布的魚類之一,具有較高的商業(yè)開發(fā)潛力和科學(xué)研究價值[1-2]。有關(guān)江鱈繁殖生物學(xué)領(lǐng)域的研究,目前國內(nèi)學(xué)者已開展了其精子保存、胚胎和幼體發(fā)育、苗種培育和病害防治等方面的工作[3-7],近年來江鱈人工繁殖和飼養(yǎng)馴化技術(shù)也相繼在黑龍江[8]、新疆[9]、河北[10]、貴州[11]、北京[12]等省市獲得重大突破,但有關(guān)江鱈種質(zhì)資源多樣性保護(hù)和良種選育方面的基礎(chǔ)性研究仍存在空白。
微衛(wèi)星DNA又稱為簡單重復(fù)序列(SSR)、簡單序列長度多態(tài)性(SSLP)或短串聯(lián)重復(fù)序列(STRs),通常由1-6個堿基組成基本單元,呈串聯(lián)重復(fù)狀散布于真核生物基因組中的重復(fù)序列[13-14]。作為一種共顯性分子遺傳標(biāo)記,微衛(wèi)星技術(shù)具有多態(tài)性信息容量高、在基因組內(nèi)分布廣泛且均勻、易于檢測等優(yōu)點(diǎn),已大量應(yīng)用于魚類遺傳連鎖圖譜構(gòu)建和QTL定位、個體識別和親本鑒定、種群遺傳多樣性分析和系統(tǒng)發(fā)育重建等領(lǐng)域[15-16]。關(guān)于江鱈SSR分子標(biāo)記技術(shù)的研究,Sanetra等[17]于2005年首次構(gòu)建了江鱈基因組富集文庫,并報道了21對多態(tài)性二核苷酸微衛(wèi)星位點(diǎn)(CA)15和(CT)15信息。上述研究為江鱈遺傳學(xué)背景和分子標(biāo)記開發(fā)提供了寶貴的基礎(chǔ)數(shù)據(jù)資料。然而,由于傳統(tǒng)方法開發(fā)SSR標(biāo)記的數(shù)量較少且程序復(fù)雜,所能揭示的江鱈遺傳多樣性水平有限。近年來,以RNA-seq為代表的二代測序技術(shù)因具有效率高、速度快和通量大的優(yōu)點(diǎn),成為解決制約傳統(tǒng)分子標(biāo)記開發(fā)方法瓶頸問題的有效手段,使得大規(guī)模開發(fā)微衛(wèi)星標(biāo)記成為現(xiàn)實(shí)。
本研究擬采用轉(zhuǎn)錄組測序RNA-seq方法,運(yùn)用生物信息學(xué)方法挖掘江鱈微衛(wèi)星標(biāo)記,并探討其分布規(guī)律和組成特征,研究結(jié)果以期為開展江鱈遺傳多樣性以及系統(tǒng)分化分析、開發(fā)有效分子標(biāo)記并進(jìn)行輔助育種等提供寶貴資料。
研究用10尾江鱈于2019年3月采自新疆維吾爾自治區(qū)額爾齊斯河流域的布爾津河,剪取肝臟、腎臟和腦組織充分浸泡于RNAhold(北京Transgen生物)保存液中備用。
取約100 mg組織,采用TRIzol法提取總RNA[18]。采用Nanodrop、Qubit 2.0、Aglient 2100方法分別檢測RNA樣品的純度、濃度和完整性符合要求后,將不同個體的組織樣品mRNA進(jìn)行等量混合。采用美國Clonetech公司的SMART(Switching Mechanism At 5' end of the RNA Transcript)試劑盒構(gòu)建cDNA文庫。文庫構(gòu)建完成后,分別使用Qubit2.0和Agilent 2100方法對文庫濃度和插入片段大小進(jìn)行檢測,使用Q-PCR方法對文庫的有效濃度進(jìn)行準(zhǔn)確定量,以保證文庫質(zhì)量。
基于Illumina Hiseq4000高通量測序平臺,測序讀長為PE150。對獲得的江鱈各組織混合樣本轉(zhuǎn)錄組Raw data進(jìn)行過濾,去除接頭序列及低質(zhì)量Reads后得到高質(zhì)量Clean data。使用Trinity軟件[19]對序列進(jìn)行組裝拼接得到轉(zhuǎn)錄本序列,所有測序讀段通過De novo組裝生成重疊群和單一序列。
使用MIcroSAtellite identification tool(http://pgrc.ipk-gatersleben.de/misa/misa.html)軟件對江鱈轉(zhuǎn)錄組中Unigene 進(jìn)行序列分析,搜索和鑒定簡單重復(fù)序列(SSR)。通過分析鑒定出6種類型的SSR:單堿基重復(fù)SSR、雙堿基重復(fù)SSR、三堿基重復(fù)SSR、四堿基重復(fù)SSR、五堿基重復(fù)SSR和六堿基重復(fù)SSR。按照Weber[20]提供方法將微衛(wèi)星DNA核心序列的差異將其分為完美型、非完美型和混合型三種類型。
經(jīng)過濾后的Reads片段進(jìn)行質(zhì)控,共得到20.78 Gb的Clean Data,平均GC含量為53.16%,且樣品Q30堿基百分比不小于87.91%。通過聚類、從頭組裝和拼接,獲得總長為7.49×107bp的Unigene共計106 084條,平均長度為706 bp。所有的Unigene中,共識別了17 619個SSR位點(diǎn),包含SSR位點(diǎn)的Unigene序列數(shù)量為10 893條,占總Unigene的10.27%。其中,含有超過1個SSR位點(diǎn)的Unigene序列數(shù)量為4 427個,以復(fù)合形式存在的SSR 數(shù)量為1 208個。利用MISA軟件對篩選得到的1 kb以上的Unigene做SSR分析,結(jié)果見表1所示。
江鱈轉(zhuǎn)錄組中SSR含量較為豐富,一至六核苷酸重復(fù)類型均存在。不同類型SSR的比例差異較大,單核苷酸、二核苷酸和三核苷酸重復(fù)占總SSR位點(diǎn)數(shù)的98.71%。其中,單核苷酸重復(fù)類型的數(shù)量最多(7 102個),占總SSR位點(diǎn)數(shù)的40.31%;其次是二核苷酸和三核苷酸重復(fù)類型,分別為6 749個和3 540個,占總SSR 位點(diǎn)數(shù)的38.31%和20.09%;四、五、六核苷酸重復(fù)類型的數(shù)量很少,累計僅占總SSR 位點(diǎn)數(shù)的1.29%。江鱈轉(zhuǎn)錄組SSR位點(diǎn)的序列總長達(dá)到270 630 bp,其中不同核苷酸重復(fù)類型的SSR位點(diǎn)的堿基總長表現(xiàn)為二核苷酸>單核苷酸>三核苷酸>四核苷酸>六核苷酸>五核苷酸。SSR 位點(diǎn)的平均長度是15.36 bp,各類型SSR 位點(diǎn)的平均長度分別是13.72、15.99、16.99、21.05、30.00和44.00 bp(表1)。從分布情況看,江鱈轉(zhuǎn)錄組中平均約每4.25 kb就出現(xiàn)1個SSR。
表1 江鱈轉(zhuǎn)錄組SSR位點(diǎn)分布情況
注:比例:各核苷酸SSR在總SSR中所占比例;頻率:含有SSR的位點(diǎn)數(shù)目與總Unigene數(shù)目的比值;平均距離:Unigene總長度與SSR數(shù)目的比值。
江鱈轉(zhuǎn)錄組中鑒定出的SSR序列中,完美單堿基重復(fù)(p1)、完美雙堿基重復(fù)(p2)、完美三堿基重復(fù)(p3)、完美四堿基重復(fù)(p4)、完美五堿基重復(fù)(p5)和完美六堿基重復(fù)(p6)分布數(shù)量分別為148.07、134.91、75.26、4.40、0.09、0.28 Mb,其中p1和p2數(shù)量較多,p3次之,p5數(shù)量最少,每Mb長度的Unigene序列上僅有0.09個。
江鱈轉(zhuǎn)錄組中共檢測到236種不同基序序列類型的SRR位點(diǎn),從單核苷酸重復(fù)到六核苷酸重復(fù)依次有4、16、60、124、8、24種類型。其中,單核苷酸A/T、G/C重復(fù)基序具有絕對優(yōu)勢,分別占總SSR位點(diǎn)數(shù)的22.45%和13.05%;二核苷以AC/GT重復(fù)基序?yàn)橹?,所占比例?0.82%;三核苷酸重復(fù)中GGA/TCC重復(fù)基序數(shù)量最多,占總位點(diǎn)數(shù)量的4.11%;剩余幾種重復(fù)基元類型所包含的重復(fù)基序類型比例均較低。江鱈SSR位點(diǎn)重復(fù)單元分布出現(xiàn)頻率最多的單元是A/T(3 956個,占22.45%), 其次是G/C(2 300個,占13.05%),而五核苷酸、六核苷酸重復(fù)累計所占頻率僅為0.02%和0.07%(表2)。
在江鱈轉(zhuǎn)錄組SSR位點(diǎn)中,以10次重復(fù)次數(shù)最多,達(dá)2 788個位點(diǎn),占總SSR位點(diǎn)的15.82%;其次為6次重復(fù),位點(diǎn)個數(shù)為2 457,占總位點(diǎn)數(shù)的13.95%。統(tǒng)計5~12 次重復(fù)的SSR 位點(diǎn)共有11 823個,占總SSR位點(diǎn)的67.10%,13~24 次重復(fù)的SSR位點(diǎn)共有2 888個,占16.39%(圖1)。
本研究基于高通量測序?qū)L轉(zhuǎn)錄組進(jìn)行測定,一次性可開發(fā)微衛(wèi)星位點(diǎn)高達(dá)17 000余個。通過統(tǒng)計分析發(fā)現(xiàn),江鱈混合組織轉(zhuǎn)錄組中含有SSR位點(diǎn)的Unigene占10.27%,這一比例高于銀鯧(Pampusargenteus)[21],低于黃姑魚(Nibeaalbiflora)[22]。SSR評價分布距離4.25 kb,低于大鱗副泥鰍(Paramisgurnusdabryanus)6.99 kb[23],高于巨魾(Bagariusyarrelli)2.07 kb[24]。SSR的密度可能由多種因素影響,如SSR檢測標(biāo)準(zhǔn),轉(zhuǎn)錄組結(jié)構(gòu)和測序數(shù)據(jù)大小等。在重復(fù)序列中,單核苷酸重復(fù)(占比35.5%)的SSR為主要類型,其次為二核苷酸重復(fù)(32.29%)和三核苷酸重復(fù)(6.35%)。這與銀鯧(P.argenteus)[21]、黃姑魚(N.albiflora)[22]、銀鲴(Xenocyprisargentea)[25]等魚類的結(jié)果類似,但不同于牙鲆(Paralichthysolivaceus)[26]等以二核苷酸重復(fù)為主的魚類,這可能與重復(fù)序列的種屬特異性有關(guān)。在單核苷酸重復(fù)中,以A/T為主,在二核苷酸重復(fù)中,以AC/GT為主,與其它魚類結(jié)果一致[21-25]。基序的重復(fù)次數(shù)是微衛(wèi)星多態(tài)性的重要指標(biāo),江鱈微衛(wèi)星的重復(fù)次數(shù)介于5~24之間,重復(fù)次數(shù)為10的微衛(wèi)星數(shù)量最多,隨著重復(fù)次數(shù)的增加,微衛(wèi)星的數(shù)量慢慢下降。微衛(wèi)星重復(fù)次數(shù)的變化,是微衛(wèi)星序列在復(fù)制過程中滑移使得原序列長度擴(kuò)增形成,可能在進(jìn)化過程中受選擇壓力影響[27-28]。在結(jié)構(gòu)基因中,這些重復(fù)次數(shù)的變化可能會引起基因的移碼突變,對基因的功能有重要影響,是進(jìn)化遺傳研究中的一個重要的關(guān)注點(diǎn)。
表3 SSR主要重復(fù)單元的類型及分布比例
圖1 江鱈轉(zhuǎn)錄組中SSR重復(fù)次數(shù)分布圖Fig.1 Distribution of the repeats number of SSR repeats in L.lota transcriptome
SSR標(biāo)記多態(tài)性的高低是判斷其可用性的重要依據(jù),而SSR長度是影響其多態(tài)性的重要因素。總體上來看,江鱈轉(zhuǎn)錄組SSR的片段長度從10~66 bp均有分布,大部分集中在10~24 bp,占SSR總數(shù)的87.24%。其中最大的片段長度為六核苷酸重復(fù)11次。根據(jù)Temnykh等[29]的研究,當(dāng)SSR長度≥20 bp時出現(xiàn)多態(tài)性較高,長度在12~19 bp的SSR多態(tài)性中等,而當(dāng)長度在12 bp以下時多態(tài)性極低。按照這一標(biāo)準(zhǔn),將小于12 bp的SSR過濾掉以后,獲得具有中等多態(tài)性的SSR位點(diǎn)10 079個(比例為57.21%),具有較高的多態(tài)性的SSR位點(diǎn)3090個(比例為17.55%)。根據(jù)以上結(jié)果,推測本研究中江鱈轉(zhuǎn)錄組SSR多態(tài)性在中等以上。這與Dreisigacker等[30]研究發(fā)現(xiàn)高級基元SSR多態(tài)性普遍比低級基元的低這一結(jié)論相似。本研究通過轉(zhuǎn)錄組測序開發(fā)了大量候選江鱈SSR標(biāo)記,種類豐富、可用性高、覆蓋整個基因組,研究結(jié)果可為這種珍稀冷水性魚類今后開展種質(zhì)資源的保護(hù)、遺傳圖譜構(gòu)建和人工輔助育種等研究提供理論基礎(chǔ)。