劉 凱,謝 楠,王宇希,劉新軼
(杭州市農(nóng)業(yè)科學(xué)研究院水產(chǎn)研究所,浙江 杭州 310024)
日本沼蝦(Macrobrachiumnipponense),又稱青蝦、河蝦,是一種重要的經(jīng)濟(jì)性甲殼類動(dòng)物,分類學(xué)上隸屬于長(zhǎng)臂蝦科(Palaemonidae)、沼蝦屬(Macrobrachium)。它們適應(yīng)性強(qiáng)、分布廣、食性雜、生長(zhǎng)快、養(yǎng)殖效益高,因此成為中國(guó)淡水蝦類養(yǎng)殖中的重要資源之一[1-2]。近年來,隨著人們對(duì)健康飲食需求的不斷增加,沼蝦的市場(chǎng)需求也在逐漸增長(zhǎng)。同時(shí),科學(xué)家們也在探索如何更好地利用沼蝦的營(yíng)養(yǎng)和藥用價(jià)值,為人類帶來更多的健康福利。微衛(wèi)星DNA(Microsatellite)是一種由少量核苷酸(1~6個(gè))為基本單位串聯(lián)重復(fù)形成的一段序列,也被稱為短串聯(lián)重復(fù)序列(Short tandem repeat,STR)或簡(jiǎn)單重復(fù)序列 (Simple sequence repeat,SSR)。SSR多態(tài)性分析技術(shù)已被廣泛應(yīng)用于種群遺傳結(jié)構(gòu)分析、種群遺傳多樣性檢測(cè)、遺傳圖譜的構(gòu)建以及生產(chǎn)性狀位點(diǎn)的連鎖分析和QTL分析等方面[2-6]。目前有關(guān)日本沼蝦SSR分子標(biāo)記開發(fā)的報(bào)道相對(duì)較少。本研究利用測(cè)序分型方法開發(fā)日本沼蝦的SSR分子標(biāo)記,以期為其種質(zhì)選育、遺傳多樣性的檢測(cè)等提供基礎(chǔ)。
試驗(yàn)所用日本沼蝦包括錢塘江群體(QT)、武義群體(WY)、高塘湖群體(GT)、肇慶群體(ZQ)和南寧群體(NN),均于2021年采自國(guó)內(nèi)5個(gè)日本沼蝦野生區(qū)域,分別采集樣本6尾進(jìn)行測(cè)序文庫構(gòu)建,取其尾部肌肉后,用無水乙醇保存?zhèn)溆谩;蚪MDNA的提取采用常規(guī)的酚氯法[7]。對(duì)基因組DNA進(jìn)行定量后,用Covaris M220超聲波儀將DNA剪切成片段,并通過以下步驟純化以制備測(cè)序文庫[8]:對(duì)DNA片段進(jìn)行末端過濾、加A,并與測(cè)序接頭連接,進(jìn)而進(jìn)行Illumina測(cè)序。最后,構(gòu)建的文庫通過雙末端測(cè)序過程進(jìn)行測(cè)序。上海派森諾生物科技有限公司完成了測(cè)序過程。對(duì)原始讀數(shù)的數(shù)據(jù)質(zhì)量控制采用Fastp ver.0.20.1預(yù)處理程序[9],使用默認(rèn)參數(shù)。
參照本實(shí)驗(yàn)室開發(fā)的無參考基因組SSR開發(fā)方法[10]篩選出含多態(tài)性SSR的序列。開發(fā)方法簡(jiǎn)述如下:利用WY_4和NN_5兩個(gè)樣本的測(cè)序數(shù)據(jù),通過ebwt2InDel軟件[11]從這兩個(gè)樣本的測(cè)序數(shù)據(jù)中尋找包含Insertion/Deletion (InDel)標(biāo)記的序列。基于包含InDel標(biāo)記的序列,利用SSR篩選軟件MISA[12]搜索包含SSR的序列并刪除非SSR型InDel標(biāo)記的序列,得到最終序列。最后基于得到的最終序列,利用Primer3 ver.2.5.0設(shè)計(jì)SSR引物[13],以滿足PCR驗(yàn)證的需要。MISA搜索設(shè)置:2個(gè)堿基重復(fù)6次及6次以上,3~6個(gè)堿基重復(fù)4次及4次以上。
利用SSRgenotyper軟件[14],對(duì)30尾日本沼蝦進(jìn)行了SSR的基因分型,對(duì)原程序的部分代碼進(jìn)行了改動(dòng),以直接讀取MISA搜索的結(jié)果,修改后的代碼可在https://github.com/zergger/SSRgenotyper地址中獲取。參數(shù)設(shè)置為Q=30、S=1、M=0.1、B=30、m=3,輸出格式設(shè)置為genepop格式,以自行篩選的含SSR的序列作為參考序列。分型之前,利用軟件BWA-MEM ver.1.0.5[15]將fastp過濾后獲得的clean reads比對(duì)到包含SSR的序列上,使用軟件SAMtools ver.1.6[16]刪除重復(fù)、低質(zhì)量的clean reads后,獲得用于基因分型的SAM文件?;讷@得的SAM文件,利用SSRgenotyper軟件獲得最終的SSR分型結(jié)果。采用TouchDown PCR,使用HotStart MasterMix(購(gòu)自康為世紀(jì)生物科技股份有限公司)及5~10個(gè)樣本對(duì)其中3對(duì)引物進(jìn)行了PCR驗(yàn)證。PCR擴(kuò)增條件:95 ℃預(yù)變性5 min;98 ℃10 s,退火5 s,72 ℃15 s,起始退火溫度60 ℃,每個(gè)循環(huán)降低1 ℃,共10個(gè)或12個(gè)循環(huán);98 ℃10 s,48 ℃或50 ℃退火5 s,72 ℃15 s,共30個(gè)循環(huán);72 ℃延伸5 min,4 ℃保存。采用3%瓊脂糖凝膠進(jìn)行常規(guī)電泳。
微衛(wèi)星的等位基因數(shù)、觀測(cè)雜合度、期望雜合度以及 Hardy-Weinberg平衡檢驗(yàn),利用GenAlEx ver.6.51b2進(jìn)行處理[17]。其中,多態(tài)性信息含量(Polymorphic information content,PIC)的計(jì)算采用Cervus ver.3.0.7進(jìn)行處理[18]。Hardy-Weinberg平衡利用PopGene ver.1.32軟件[19]進(jìn)行檢驗(yàn),采用Likelihood ratio方法,同時(shí)采用Bonferroni修正進(jìn)行顯著性判別[20]。
通過ebwt2InDel軟件從WY_4和NN_5兩個(gè)樣本的測(cè)序數(shù)據(jù)中尋找包含InDel標(biāo)記的序列779條。通過本實(shí)驗(yàn)室開發(fā)的無參考基因組SSR開發(fā)方法從779條含InDel標(biāo)記的序列中篩選出含多態(tài)性SSR的序列137條,去除包含復(fù)合型SSR的序列26條,最終得到包含完美型SSR的序列111條。以包含完美型SSR的111條序列為模板,利用SSRgenotyper軟件對(duì)5個(gè)群體共30個(gè)樣本進(jìn)行SSR分型。測(cè)序分型結(jié)果顯示,111條含SSR的序列中,共有19個(gè)SSR可以成功分型,分型成功率為17.12%。分型成功的19個(gè)SSR均為3堿基重復(fù)4~6次,其中以ATC/ATG為單位的重復(fù)序列占比最多,為6個(gè)(31.58%)。利用引物設(shè)計(jì)軟件Primer3針對(duì)分型成功的19個(gè)SSR序列設(shè)計(jì)了引物19對(duì)(表1)。采用TouchDown PCR對(duì)其中3對(duì)引物進(jìn)行了PCR驗(yàn)證。由于Cluster813下游引物的GC含量少,Tm值較低,因此PCR驗(yàn)證中將退火溫度降低至48 ℃。由圖1可見,3對(duì)引物均可擴(kuò)增,擴(kuò)增產(chǎn)物大小與預(yù)期大小基本一致。
表1 測(cè)序分型法獲得的日本沼蝦SSR多態(tài)性位點(diǎn)引物的基本信息Tab.1 Basic information of microsatellite primers of M.nipponense obtained by genotyping by sequencing
有關(guān)每個(gè)位點(diǎn)的遺傳多樣性,包括每個(gè)基因座的等位基因數(shù)(Na)、觀察到的雜合性(Ho)、期望雜合度(He)、香儂信息指數(shù)(SI)、多態(tài)性信息含量(PIC)和Hardy-Weinberg平衡檢驗(yàn)的概率(PHW)等分型數(shù)據(jù)如表2所示。Hardy-Weinberg平衡檢驗(yàn)表明,本研究篩選的19個(gè)SSR標(biāo)記中7個(gè)偏離了Hardy-Weinberg平衡,計(jì)算出的PHW值小于Bonferroni修正后的P值0.002 6。根據(jù)Botstein D等[21]基于PIC的分類,19個(gè)SSR分為低度信息含量的標(biāo)記2個(gè)、中度信息含量的標(biāo)記17個(gè)。
表2 測(cè)序分型法獲得的日本沼蝦SSR多態(tài)性位點(diǎn)的特征分析Tab.2 Characteristic of microsatellite primers of M.nipponense obtained by genotyping by sequencing
SSR在許多遺傳應(yīng)用中是首選的標(biāo)記類型,包括基因組作圖、保護(hù)遺傳學(xué)、多倍體親子鑒定、系統(tǒng)地理學(xué)和群體遺傳學(xué)[22]。作為分子標(biāo)記,SSR具有廣泛的優(yōu)勢(shì),包括高度多態(tài)性、共顯性遺傳以及在各種體外條件下的可重復(fù)性[23-24]。然而,傳統(tǒng)的基于PCR、凝膠電泳或毛細(xì)管電泳的SSR開發(fā)方法存在勞動(dòng)強(qiáng)度大、成本高、耗時(shí)長(zhǎng)且效率低等問題。隨著測(cè)序技術(shù)的進(jìn)步和成本的下降,對(duì)整個(gè)群體進(jìn)行SSR基因分型測(cè)序正在成為相對(duì)于傳統(tǒng)的基于PCR/電泳方法的一種具有吸引力的替代方案。本研究使用SSRgenotyper從自行開發(fā)的共111個(gè)微衛(wèi)星中鑒定出19個(gè)多態(tài)性SSR位點(diǎn),基因分型效率超過90%(超過90%的個(gè)體都獲得了分型結(jié)果)。
為驗(yàn)證SSR位點(diǎn)的多態(tài)性,本研究從5個(gè)地理群體中選擇了30個(gè)樣本,以確保驗(yàn)證樣本的多樣性;設(shè)計(jì)了19對(duì)引物來擴(kuò)增篩選出19個(gè)多態(tài)性SSR位點(diǎn),并對(duì)其中的3對(duì)引物進(jìn)行了PCR和電泳分析。電泳結(jié)果驗(yàn)證了基于測(cè)序方法進(jìn)行基因分型的準(zhǔn)確性,凝膠電泳得到的擴(kuò)增產(chǎn)物大小與預(yù)期大小基本一致。實(shí)際上,基于測(cè)序的SSR基因分型方法早已有之。在魚類驗(yàn)證中,基于測(cè)序的基因分型方法的準(zhǔn)確率超過90%[10]。Lewis D H等[14]將其應(yīng)用在植物上,驗(yàn)證結(jié)果顯示二核苷酸和四核苷酸SSR的不一致性最高(分別為5.7%和5.0%),重復(fù)次數(shù)超過15次的SSR最不一致(20.3%),但它們僅占總SSR數(shù)的不到0.4%。三核苷酸SSR是最常見的類型,占所有基因分型SSR位點(diǎn)的72.9%。Han J等[25]進(jìn)行了基因組測(cè)序分型中SNP和SSR的比較研究,結(jié)果表明在群體遺傳分析中,這兩種方法具有高度一致性。此外,基于SSR的遺傳分析還揭示了一些與SNP分析不同的結(jié)果[25]。
SSR核心序列的突變率相對(duì)較高(10-5~10-3),這會(huì)導(dǎo)致SSR長(zhǎng)度的變化,從而產(chǎn)生SSR多態(tài)性[26]。SSR寡核苷酸的重復(fù)數(shù)在同一物種的不同基因型間差別很大,一般很少用于多態(tài)性分析。根據(jù)Weber J L[27]的研究,只有當(dāng)雙堿基重復(fù)序列的重復(fù)次數(shù)大于10次時(shí),SSR標(biāo)記才有可能表現(xiàn)出較高的PIC值。當(dāng)重復(fù)次數(shù)大于16時(shí),可提供的PIC值在0.5以上。這也是本實(shí)驗(yàn)中設(shè)置MISA搜索條件的依據(jù):2個(gè)堿基重復(fù)6次及6次以上,3~6個(gè)堿基重復(fù)4次及4次以上?;跓o參考基因組SSR方法篩選并經(jīng)測(cè)序分型驗(yàn)證后獲得的SSR標(biāo)記都是三堿基重復(fù),其重復(fù)次數(shù)都在4~6次之間,沒有檢測(cè)到具有多態(tài)性的雙堿基重復(fù),這可能與分型方法有關(guān),也可能與樣本或物種有關(guān)。而Lewis D H等[14]在植物上驗(yàn)證的結(jié)果也表明,三核苷酸SSR是最常見的類型。此外,在日本沼蝦中,使用無參考基因組SSR篩選方法獲得的多態(tài)性SSR標(biāo)記的有效率較低,這也可能與物種有關(guān)。在三角魴(Megalobramaterminalis)中,采用無參考基因組SSR篩選方法篩選的SSR標(biāo)記中,多態(tài)性標(biāo)記的比例可以達(dá)到90%以上[10]。將驗(yàn)證多態(tài)性的樣本限定到WY和NN兩個(gè)群體上,篩選出的多態(tài)性SSR標(biāo)記數(shù)量可以提升到27個(gè)(文中未列出)。這表明作為參考的包含SSR的序列保守性不強(qiáng)造成比對(duì)率低,或者是由日本沼蝦樣本的序列多樣性較高造成比對(duì)率低。
一些研究表明,重復(fù)次數(shù)較少的SSR標(biāo)記往往難以檢測(cè)出多態(tài)性。Valdes A M等[28]的研究結(jié)果顯示,人類(Homosapiens)中重復(fù)次數(shù)低于5的SSR,幾乎檢測(cè)不出多態(tài)性。而Smulders M J M等[29]則認(rèn)為,重復(fù)次數(shù)多的SSR既能在種間又能在種內(nèi)產(chǎn)生多態(tài)性,但重復(fù)次數(shù)少的SSR僅能在種間產(chǎn)生多態(tài)性。Xu Z等[30]對(duì)斑節(jié)對(duì)蝦(Penaeusmonodon)進(jìn)行的研究也表明,核心序列重復(fù)次數(shù)較少的SSR標(biāo)記往往是單態(tài)性的,或等位基因數(shù)目非常少,PIC值也偏低。因此,傳統(tǒng)實(shí)驗(yàn)中設(shè)計(jì)SSR標(biāo)記往往需要仔細(xì)選擇重復(fù)次數(shù)較多的核心序列,以提高SSR標(biāo)記的多態(tài)性和可靠性。但隨著測(cè)序技術(shù)的發(fā)展,SSR基因分型測(cè)序正在成為相對(duì)于傳統(tǒng)的基于PCR/電泳方法的一種具有吸引力的替代方案。由于SSR基因分型測(cè)序的高分辨率,即使傳統(tǒng)實(shí)驗(yàn)中難以檢測(cè)到的低重復(fù)次數(shù)SSR標(biāo)記,其多態(tài)性也可檢測(cè)到。本實(shí)驗(yàn)所獲得的SSR序列重復(fù)數(shù)大部分在4~5次,但使用SSR基因分型測(cè)序依然可以檢測(cè)到多態(tài)性,PIC值大多達(dá)到了中度信息含量,這對(duì)遺傳多樣性分析也是有利的。