盧瑋筱,陳永霞,祁鵬志
(國家海洋設(shè)施養(yǎng)殖工程技術(shù)研究中心,浙江舟山 316022)
扁玉螺Neverita didyma,屬于軟體動物門Mollusca,腹足綱Gastropoda,玉螺科Naticidae,玉螺屬Neverita,俗稱“香螺”,“肚臍菠蘿”。其主要分布于我國的南北沿海地區(qū),比如渤海、東海等。扁玉螺具有低脂肪、高蛋白的特性,營養(yǎng)價值較高。食用扁玉螺還會有強身健體、美容養(yǎng)顏的功效[1]。但是隨著過度捕撈和棲息地喪失,扁玉螺的資源量日益減少,保護扁玉螺資源已經(jīng)成為重要的任務(wù)。所以分析扁玉螺的遺傳變異及其結(jié)構(gòu),發(fā)現(xiàn)其遺傳多樣性規(guī)律,這對于以后扁玉螺的繁殖發(fā)展具有重大意義[2]。目前尚缺乏扁玉螺基因組分析和遺傳多樣性的相關(guān)研究,其分子標(biāo)記分析研究僅見孫史威等[3]利用ISSR分子標(biāo)記技術(shù),用13對引物對90個扁玉螺進行了PCR擴增,同時研究建立了扁玉螺ISSR-PCR反應(yīng)體系[4]。
簡單序列重復(fù)分子標(biāo)記(Simple sequence repeat,SSR),也可以稱為微衛(wèi)星(Microsatellite),其存在于原核生物及其真核生物基因組[5]。它一般以1~6個堿基為重復(fù)單元,KALIA,et al[5]在研究中發(fā)現(xiàn)每50 kb中存在1個SSR。按照來源來分的話,SSR可以分為g-SSR(基因組)和EST-SSR(轉(zhuǎn)錄組SSR)[6]。相對于前者,后者的標(biāo)記方式更為方便,而且省時省力。同時EST-SSR標(biāo)記方法,由于其基因功能和其多態(tài)性相關(guān)性,可以在相近的物種之間達到一種良好的通用作用[7]。目前發(fā)現(xiàn),關(guān)于EST序列的SSR標(biāo)記分子大多研究報道的是植物,動物相對較少。呂振明等[8]對曼氏無針烏賊Sepiella japonica作出研究報道。對扁玉螺SSR的應(yīng)用很少,本文研究了扁玉螺轉(zhuǎn)錄組測序得到EST序列,發(fā)現(xiàn)扁玉螺的SSR位點,分析研究扁玉螺SSR位點的特點及其組成,以期為扁玉螺物種的遺傳多樣性及其標(biāo)記分子育種提供理基礎(chǔ)數(shù)據(jù)。
扁玉螺轉(zhuǎn)錄組數(shù)據(jù)來源于課題組2017年Illumina高通量深度測序結(jié)果,分析的組織是扁玉螺的肝臟。委托北京諾禾致源科技股份有限公司采用Illumina HiseqTM進行RNA-seq轉(zhuǎn)錄組測序利用Trrinity進行序列組裝,得到233 858條Unigenes,以此作為分析數(shù)據(jù)。
為檢測扁玉螺的SSR位點,利用MISA軟件[9]對其Unigene序列進行分析。SSR位點包含了單核苷酸、雙核苷酸、三核苷酸、四核苷酸、五核苷酸以及六核苷酸重復(fù)。判斷的標(biāo)準(zhǔn)為單核苷酸重復(fù)至少10次;雙核苷酸重復(fù)至少6次;三核苷酸重復(fù)至少5次、四核苷酸重復(fù)至少5次、五核苷酸重復(fù)至少5次、六核苷酸重復(fù)至少5次。
對識別出的SSR序列,采用Primer3軟件進行引物設(shè)計,引物的設(shè)計標(biāo)準(zhǔn)是:退火溫度(Tm)為58~60℃,上游引物和下游引物的Tm差值不能大于2℃;引物長度在11~20 bp;GC量在43%~45%。
結(jié)果中沒有引物的SSR,是因為Primmer 3無法對其設(shè)計出引物來。關(guān)于擴增是否會產(chǎn)生引物二聚體的問題,可從多對引物中挑選出最好的引物進行擴增。篩選原則:2個引物之間不發(fā)生互補,特別是引物3'端,即使無法避免,其3'端互補堿基也應(yīng)不大于2個堿基。隨機選擇引物,驗證SSR引物是否可用,進行PCR擴增。
通過對扁玉螺的轉(zhuǎn)錄組進行高通量測序,共獲得305 060 534條序列,其中中間未知堿基序列的片段N為0.02%,并且每個扁玉螺的Q20%和Q30%均不大于97%,平均每個樣品的GC含量占該樣品總堿基數(shù)的43%~45%,這些數(shù)量和質(zhì)量都比較高,這為下一步的分析組裝奠定基礎(chǔ)。最終被拼裝成N 50為2 131 bp,N 90為558 bp,平均長度為1 304 bp的233 858條Unigenes,具體序列長度分布(表1)并且我們可以發(fā)現(xiàn)序列長度與長度范圍成反比,這可以證明扁玉螺測序及組裝效果頗好,這為接下來的功能研究提供數(shù)據(jù)依據(jù)。
表1 扁玉螺Unigene數(shù)據(jù)組裝結(jié)果Tab.1 Results of assembled Unigene for N.didyma
利用MISA工具搜索扁玉螺轉(zhuǎn)錄組的233 853條Unigene中找到202 337個符合條件的SSRs,發(fā)生頻率(含SSR的Unigene數(shù)與總Unigene數(shù)之比)為45.34%。55 225條Unigene含有單個SSR位點,50 813條Unigene含有復(fù)合SSRs。SSR位點的出現(xiàn)頻率(SSR數(shù)目與總Unigene的數(shù)目比值)為:86.53%。平均每10 kb有1.91個SSR位點,見表2。
表2 扁玉螺轉(zhuǎn)錄組中的SSR搜索結(jié)果Tab.2 Searching results of SSR in transcriptome of N.didyma
扁玉螺EST-SSR類型豐富,從表3可以發(fā)現(xiàn),單核苷酸到三核苷酸重復(fù)最多,占總SSR位點數(shù)量的99.1%,其中單核苷酸重復(fù)率最高,占到63.44%;其次為雙核苷酸和三核苷酸,分別為24.12%和6.73%。四、五、六核苷酸重復(fù)率總計0.9%,數(shù)量很少,見表3。
以單核苷酸重復(fù)基元A/T最多,占總SSR的54.15%;其次為雙核苷酸AC/GT和單核苷酸C/G最多,分別為15.90%和9.3%;單核苷酸重復(fù)基元最多,共占63.45%。二核苷酸重復(fù)基元中以AC/GT、AG/CT、AT/AT為多,共占27.69%,CG/CG所占SSR比例非常少,僅有0.20%。在三核苷酸重復(fù)基元中,AAC/GTT、ACC/GGT、AGC/CTG所占比例多,分別為2.05%、1.81%、1%。其他四核苷酸、五核苷酸和六核苷酸重復(fù)基元類型較多,數(shù)量非常少,出現(xiàn)頻率很低,見表4。
表3 EST-SSR不同重復(fù)基元分布情況Tab.3 Distribution of different repeat motifs in N.didyma
表4 扁玉螺EST-SSR重復(fù)基元的類型Tab.4 EST-SSR repeat motifs in N.didyma
長度可以影響SSR的多態(tài)性,并且SSR重復(fù)次數(shù)可以決定重復(fù)片段的長度。扁玉螺SSR的堿基重復(fù)次數(shù)非常廣泛,整體波動在5~85次,多集中于5~30次。單核苷酸重復(fù)10~98次;雙核苷酸重復(fù)6~36次;三核苷酸重復(fù)5~21次;四核苷酸重復(fù)6~21次;五核苷酸重復(fù)6~17次;六核苷酸重復(fù)6~12次。重復(fù)10次的頻率最高,總共有43 049個,占總SSR總數(shù)的21.27%,其次是重復(fù)6次(12.84%)、11次(12.81%)、12次(8.7%)、7次(6.22%),30次以上共占7.46%??傮w上可以看出,扁玉螺轉(zhuǎn)錄組SSR的重復(fù)次數(shù)以5~10次最多,占總SSR總數(shù)的50.76%,11~20次次之,為40.53%;重復(fù)次數(shù)21~30次為4.45%;重復(fù)次數(shù)大于30的為4.26%。
雖然SSR在基因組上的位置不相同,但是由于其兩端的序列大多是保守的單拷貝序列,所以可以依據(jù)SSR兩端的互補序列設(shè)計出引物,并且通過PCR反應(yīng)體系擴增出含有SSR位點的片段。因為重復(fù)單位的串聯(lián)重復(fù)次數(shù)不同,所以采用PCR的方法擴增出不同長度的PCR產(chǎn)物,并且對其進行凝膠電泳,即可顯示SSR位點的長度多態(tài)性。我們采用Primer 3進行SSR引物設(shè)計,并針對預(yù)測到的每一個SSR位點分別設(shè)計了部分引物,見表5。
表5 PCR篩選引物Tab.5 Filtering primers with PCR
近些年以來,高通量技術(shù)不斷發(fā)展,測序的成本也非常低。其測序的數(shù)據(jù)也包含了特定的時期和組織的轉(zhuǎn)錄本,特別是基因組信息特別缺乏的物種,因此轉(zhuǎn)錄組學(xué)越來越受到重視[10]。因其SSR分子標(biāo)記含有豐富的多態(tài)性和等位差異,植物的遺傳多樣性多用此標(biāo)記方式[11-12],但是動物研究相對較少。
本文以扁玉螺轉(zhuǎn)錄組信息進行了扁玉螺EST-SSR的研究開發(fā),結(jié)果顯示表明扁玉螺轉(zhuǎn)錄組中含有豐富的SSR位點從扁玉螺轉(zhuǎn)錄組中共搜索出202 337個SSR,分布于233 858條Unigenes上。SSR的出現(xiàn)頻率為86.52%。物種的不同,SSR的搜索標(biāo)準(zhǔn)、數(shù)據(jù)庫的完整性都會影響SSR的出現(xiàn)頻率[13]。由于SSR標(biāo)記技術(shù),多用于植物,大多數(shù)的植物EST-SSR以二核苷酸和三核苷酸為主。扁玉螺SSR重復(fù)基元以單核苷酸最多,占到63.44%,其次為雙核苷酸和三核苷酸,分別為24.12%和6.73%。這與曼氏無針烏賊Sepiella maindroni[8]略微有所不同,單核苷酸(38.69%)、三核苷酸(31.14%)、二核苷酸(26.35%),同時本研究也發(fā)現(xiàn)扁玉螺轉(zhuǎn)錄組中,SSR位點最多的是單核苷酸的重復(fù)基元A/T最多,占總SSR的54.15%;其次為雙核苷酸的AC/GT,為 15.9%。
整體來說,扁玉螺轉(zhuǎn)錄組的SSR類型豐富,出現(xiàn)頻率很高,這些SSR在提高多態(tài)性潛能方面發(fā)揮著重要的作用。結(jié)果表明為更好的研發(fā)新的扁玉螺功能基因SSR分子標(biāo)記提供了基礎(chǔ)數(shù)據(jù)。這對于開展扁玉螺種質(zhì)資源研究和未來分子育種具有重要作用。