常 虹,高 燕,王思威,王瀟楠,劉艷萍,孫海濱
(廣東省農(nóng)業(yè)科學(xué)院植物保護(hù)研究所/廣東省植物保護(hù)新技術(shù)重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510640)
【研究意義】黃地老虎(Agrotis segetumDenis and Schiffermüller)是一種重要的世界性農(nóng)業(yè)害蟲,隸屬于鱗翅目(Lepidoptera)夜蛾科(Noctuidae),廣泛分布于亞洲、歐洲和非洲等地。黃地老虎主要為害棉花、馬鈴薯、玉米和十字花科蔬菜等作物,可對(duì)我國農(nóng)業(yè)和經(jīng)濟(jì)造成較大損失[1-2]。同時(shí),它也是一種重要的遷飛害蟲,已有研究表明其在我國進(jìn)行季節(jié)性遷飛[3-4]。遷飛可促進(jìn)種群間的基因交流,極大降低不同地理種群間遺傳分化的程度。對(duì)黃地老虎種群遺傳結(jié)構(gòu)進(jìn)行研究,有助于探討不同地理種群間的遺傳分化關(guān)系,揭示其遷飛路徑及起源,進(jìn)而為明確該蟲的種群發(fā)生動(dòng)態(tài)及成災(zāi)機(jī)制提供科學(xué)依據(jù)?!厩叭搜芯窟M(jìn)展】微衛(wèi)星又稱簡(jiǎn)單重復(fù)序列(simple sequence repeats,SSR),是一類由1~6 個(gè)核苷酸簡(jiǎn)單串聯(lián)重復(fù)組合而形成的核苷酸序列,一般由中心的重復(fù)序列和兩端的保守序列構(gòu)成。微衛(wèi)星具有共顯性遺傳、多態(tài)性信息含量高、具有很高的突變速率及穩(wěn)定性高、實(shí)驗(yàn)重復(fù)性好等優(yōu)點(diǎn),被廣泛應(yīng)用于種群遺傳結(jié)構(gòu)及遺傳分化等種群遺傳學(xué)的研究[5-8]。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)主要是指在基因組水平上由單個(gè)核苷酸變異引起的DNA 序列多態(tài)性,具有分布廣泛、數(shù)量豐富、遺傳穩(wěn)定性高、較高DNA 降解耐受性等特點(diǎn),被用于群體遺傳分析及品種鑒定等研究[9-12]。傳統(tǒng)的SSR 和SNP分子標(biāo)記的開發(fā)需要構(gòu)建基因組文庫進(jìn)行克隆測(cè)序,檢測(cè)過程繁瑣且費(fèi)時(shí)費(fèi)力。隨著高通量測(cè)序技術(shù)的快速發(fā)展,轉(zhuǎn)錄組測(cè)序技術(shù)為非模式生物SSR 和SNP 位點(diǎn)的挖掘提供了一種高效、快速、經(jīng)濟(jì)的途徑。因此,基于轉(zhuǎn)錄組數(shù)據(jù)篩選SSR 和SNP 位點(diǎn)被廣泛應(yīng)用于動(dòng)植物的研究中[13-16]。黎東海等[13]基于齒緣刺獵蝽Sclomina erinacea轉(zhuǎn)錄組數(shù)據(jù)篩選出的SSR 位點(diǎn)設(shè)計(jì)出54 對(duì)SSR引物,對(duì)其9 個(gè)不同地理種群進(jìn)行驗(yàn)證,有16 對(duì)引物能較好擴(kuò)增出目的片段。桑迪等[14]基于意大利蝗Calliptamus italicus轉(zhuǎn)錄組數(shù)據(jù)設(shè)計(jì)出6對(duì)可用于擴(kuò)增10 個(gè)不同地理種群目的片段的SSR引物。目前,有關(guān)黃地老虎的研究,主要集中在人工飼養(yǎng)、生物學(xué)特性、預(yù)測(cè)預(yù)報(bào)和防治技術(shù)等方面[17-19],而對(duì)其種群遺傳結(jié)構(gòu)方面的研究甚少。Wu 等[20]僅對(duì)黃地老虎線粒體基因組進(jìn)行簡(jiǎn)單分析,并未利用線粒體基因?qū)ζ湎到y(tǒng)發(fā)育和遺傳結(jié)構(gòu)進(jìn)行研究?!颈狙芯壳腥朦c(diǎn)】對(duì)害蟲種群遺傳結(jié)構(gòu)進(jìn)行研究,不僅能夠分析出害蟲在我國現(xiàn)有地理分布格局的形成機(jī)制,而且能夠了解該蟲在不同地理種群間的遺傳分化與基因流,結(jié)合該蟲在我國的遷飛與氣象資料,還能夠推測(cè)該蟲在我國的遷飛規(guī)律及各發(fā)生危害區(qū)間的蟲源關(guān)系。黃地老虎作為一種重要的遷飛性農(nóng)業(yè)害蟲,缺少對(duì)其種群遺傳結(jié)構(gòu)方面的研究,明確黃地老虎SSR和SNP 位點(diǎn)信息可為研究該蟲種群遺傳結(jié)構(gòu)提供數(shù)據(jù)支撐?!緮M解決的關(guān)鍵問題】本研究通過對(duì)黃地老虎轉(zhuǎn)錄組進(jìn)行分析,對(duì)其SSR 和SNP 位點(diǎn)的組成和特征進(jìn)行研究,初步建立黃地老虎的分子標(biāo)記,為今后研究黃地老虎的種群遺傳結(jié)構(gòu)奠定基礎(chǔ)。
黃地老虎成蟲采自山東省煙臺(tái)市蓬萊區(qū)北隍城鄉(xiāng)長島試驗(yàn)基地(站)(38°23.20′N,120°54.50′E)。選取鱗片完整且活力充沛的個(gè)體放在1.5 mL的離心管內(nèi),迅速置于液氮中致死,將樣品存放于-80 ℃超低溫冰箱內(nèi)直至使用。
在已滅菌的研缽中加入液氮預(yù)冷,將黃地老虎樣品倒入預(yù)冷的研缽中,迅速研磨直至研磨成粉末狀,期間不斷補(bǔ)充液氮。將約80 mg 粉末狀樣品轉(zhuǎn)移至1.5 mL的離心管內(nèi),加入1 mL TransZol Up(北京全式金公司)溶液后,采用RNA 提取試劑盒(TransZol Up Plus RNA Kit,北京全式金公司)提取總RNA。對(duì)總RNA 質(zhì)量采用1%瓊脂糖凝膠電泳進(jìn)行檢測(cè);Nanodrop 分光光度計(jì)(IMPLEN,CA,USA)對(duì)總RNA 濃度和純度進(jìn)行檢測(cè);利用Agilent 2 100(Agilent Technologies,CA,USA)檢測(cè)RNA的完整性。
將檢測(cè)質(zhì)量合格的總RNA,委托深圳市恒創(chuàng)基因科技有限公司用Illumina HiSeq 2500 進(jìn)行測(cè)序,共3 個(gè)生物學(xué)重復(fù),測(cè)序深度為10 Gb。對(duì)測(cè)序獲得的原始數(shù)據(jù)進(jìn)行過濾,去除包含接頭的序列及低質(zhì)量序列,使用Trinity 軟件對(duì)去重復(fù)的clean reads 進(jìn)行De novo 組裝,獲得Unigene 序列。
對(duì)測(cè)序獲得的黃地老虎轉(zhuǎn)錄組數(shù)據(jù),使用MicroSAtellite(MISA)軟件對(duì)Unigene 進(jìn)行檢測(cè),得到SSR 位點(diǎn)信息[21]。此外,利用GATK 軟件對(duì)黃地老虎SNP 信息進(jìn)行分析[22]。
黃地老虎轉(zhuǎn)錄組經(jīng)Illumina 測(cè)序后,共得到74 067 260 條原始數(shù)據(jù);數(shù)據(jù)過濾后,得到73 724 516 條clean reads,其中,Q20 為93.52%,Q30 為85.81%,表明測(cè)序質(zhì)量較好。組裝后共得到66 469 條Unigene 序列,序列長度主要分布于200~2 000 bp 之間,占總序列的89.88%,平均長度868 bp。隨著Unigene 序列長度的逐漸增加,所含序列數(shù)量呈階梯式下降(圖1),該結(jié)果同生物的序列長度分布規(guī)律相一致,說明該轉(zhuǎn)錄組組裝質(zhì)量較好。
圖1 Unigene 序列長度分布Fig.1 Unigene Distribution of length in Unigene distribution
對(duì)獲得的66 469 條Unigene 序列利用MISA軟件進(jìn)行搜索,共得到SSR 位點(diǎn)4 438 個(gè)。分布于4 048 條Unigene 序列上,占總序列的6.09%;其中包含多個(gè)微衛(wèi)星位點(diǎn)的序列有345 條,復(fù)合型SSR 有125 條。
對(duì)SSR 位點(diǎn)的核苷酸重復(fù)類型進(jìn)行分類,共得到6 種重復(fù)類型,各重復(fù)類型間所包含的SSR 位點(diǎn)的數(shù)目相差較大;其中,重復(fù)類型最多的是單核苷酸重復(fù)(2 429 個(gè)),占總位點(diǎn)的54.73%;六核苷酸重復(fù)類型的位點(diǎn)數(shù)最少,占比0.95%(表1)。黃地老虎SSR 總長度為67 966 bp,其中單核苷酸重復(fù)序列總長度最長,為37 215 bp,平均每1 552 bp 出現(xiàn)1 個(gè)單核苷酸重復(fù),其平均長度為15.32 bp;六核苷酸重復(fù)SSR 位點(diǎn)總長度最短,為1 056 bp,其平均長度為25.14 bp。6 種重復(fù)類型序列總長度為67 966 bp,平均每850 bp 出現(xiàn)1 個(gè)重復(fù)序列,其平均長度為15.31 bp(表1)。
表1 SSR 位點(diǎn)重復(fù)類型數(shù)量與分布Table 1 Number and distribution of SSR loci repeats
黃地老虎轉(zhuǎn)錄組SSR 位點(diǎn)信息中共發(fā)現(xiàn)82種重復(fù)基元,其中單核苷酸重復(fù)基元種類最少,為2 種;六核苷酸重復(fù)基元種類最多,為25 種。A/T 為單核苷酸重復(fù)基元中的優(yōu)勢(shì)基元,共有SSR 位點(diǎn)2 356 個(gè),分別占單核苷酸重復(fù)基元和總SSR 位點(diǎn)的96.99%和53.09%。二核苷酸重復(fù)基元中的優(yōu)勢(shì)基元為AC/GT 和CG/CG;三核苷酸重復(fù)基元中的優(yōu)勢(shì)基元是ATC/ATG 和CCG/CGG;四核苷酸重復(fù)基元中的優(yōu)勢(shì)基元是AAAT/ATTT 和AAAG/CTTT;五核苷酸重復(fù)基元中的優(yōu)勢(shì)基元是AAATC/ATTTG 和AATAG/ATTCT;六核苷酸重復(fù)基元中的優(yōu)勢(shì)基元是CCCGCG/CGCGGG(表2)。
表2 優(yōu)勢(shì)基元SSR 位點(diǎn)數(shù)量與分布Table 2 Number and distribution of SSR loci with dominant motifs
黃地老虎轉(zhuǎn)錄組中SSR 基元重復(fù)次數(shù)在不同基元類型間存在較大差異,包含4~24 次重復(fù);且重復(fù)次數(shù)隨著基元核苷酸數(shù)的增加而呈下降趨勢(shì)。單核苷酸重復(fù)基元的重復(fù)次數(shù)類型最多,共有13 種重復(fù)單元長度,為12~24,其中12 次重復(fù)所占比例最高,占單核苷酸SSR 位點(diǎn)的32.24%。六核苷酸重復(fù)基元形成3 種重復(fù)單元長度,其中4 次重復(fù)所占比例最高,占六核苷酸SSR 位點(diǎn)的88.10%(表3)。
表3 不同基元SSR 重復(fù)次數(shù)分布Table 3 Distribution of SSR repeats of different motifs
對(duì)黃地老虎轉(zhuǎn)錄組SSR 位點(diǎn)序列長度進(jìn)行分析,SSR 位點(diǎn)序列長度分布在12~127 bp 之間。SSR 位點(diǎn)序列長度在12~19 bp的SSR 位點(diǎn)有3 493 個(gè),其中,SSR 長度為12 bp的位點(diǎn)數(shù)量最多,占總位點(diǎn)的25.39%;長度為15 bp的SSR 位點(diǎn)數(shù)量次之,占總位點(diǎn)的22.49%。SSR 位點(diǎn)序列長度大于等于20 bp的SSR 位點(diǎn)有820 個(gè),占總位點(diǎn)的19.01%(圖2)。
圖2 SSR 位點(diǎn)序列長度分布Fig.2 Distribution of length in SSR loci sequences
黃地老虎轉(zhuǎn)錄組Unigene 序列共包含SNP 位點(diǎn)371 148 個(gè),包括237 619 個(gè)轉(zhuǎn)換類型和133 529 個(gè)顛換類型;轉(zhuǎn)換類型(64.02%)顯著大于顛換類型(35.98%)。C/T 在所有變異類型中所占比率最高,占總量的18.61%;G/A 位居其次(18.28%),且這兩種變異均屬于轉(zhuǎn)換類型。在顛換類型中,A/T 所占比例最高,占總量的6.93%;G/C 所占比例最低,占總量的3.29%(圖3)。
圖3 SNP 變異類型統(tǒng)計(jì)結(jié)果Fig.3 Statistical results of variation types of SNP
本研究基于黃地老虎轉(zhuǎn)錄組測(cè)序結(jié)果,對(duì)其SSR 及SNP 位點(diǎn)信息進(jìn)行分析。黃地老虎轉(zhuǎn)錄組數(shù)據(jù)共獲得66 469 條Unigene 序列,共搜索到SNP 位點(diǎn)371 148 個(gè),平均每155 bp 出現(xiàn)一個(gè)SNP 位點(diǎn)。黃地老虎轉(zhuǎn)錄組數(shù)據(jù)中SNP 變異的轉(zhuǎn)換位點(diǎn)有237 619 個(gè),顛換位點(diǎn)有133 529 個(gè),說明其SNP 變異類型以轉(zhuǎn)換類型為主,該結(jié)果與東方螻蛄Gryllotalpa orientialis[23]、椰心葉甲嚙小蜂Tetrastichus brontispae[24]的研究結(jié)果一致。本研究中轉(zhuǎn)換位點(diǎn)是顛換位點(diǎn)的1.78 倍,小于理論值(轉(zhuǎn)換/顛換=1 ∶2),說明堿基的突變可能不是隨機(jī)的,應(yīng)該與進(jìn)化過程中的選擇機(jī)制相關(guān)[25]。在轉(zhuǎn)換類型中,C/T 所占的比率最高,可能是由于甲基化的C 進(jìn)行脫氨后就可以變成T 有關(guān)[26]。
黃地老虎轉(zhuǎn)錄組數(shù)據(jù)庫中共搜索到SSR 位點(diǎn)4 438 個(gè),分布于4 048 條Unigene 序列上,發(fā)生頻率為6.09%,比已報(bào)道的部分昆蟲如扶桑綿粉蚧Phenacoccus solenopsis(5.79%)[27]、桔小實(shí)蠅Bactrocera dorsalis(4.23%)[28]、麥紅吸漿蟲Sitodiplosis mosellana(3.49%)[29]的發(fā)生頻率高;而比東方黏蟲Mythimna separate(9.85%)[30]、荔枝蒂蛀蟲Conopomorpha sinensis(15.25%)[31]、意大利蝗(17.58%)[14]和沙棘木蠹蛾Eogystia hippophaecolus(35.14%)[32]等昆蟲的發(fā)生頻率低,不同昆蟲間SSR 發(fā)生頻率差異較大,造成該結(jié)果的原因可能與物種自身進(jìn)化有關(guān),也可能同用于建庫的總RNA 質(zhì)量、測(cè)序深度以及數(shù)據(jù)分析時(shí)參數(shù)設(shè)置有關(guān)[15]。
黃地老虎轉(zhuǎn)錄組中的SSR 包括6 種重復(fù)類型,其中單堿基重復(fù)是含量最高的重復(fù)類型,該結(jié)果與東方黏蟲[30]、荔枝蒂蛀蟲[31]、椰心葉甲嚙小蜂[24]、梨小食心蟲Grapholitha molesta[16]等的研究結(jié)果相一致。其次,三堿基重復(fù)的含量也較高,在桔小實(shí)蠅[28]、二點(diǎn)委夜蛾Athetis lepigone[33]、黏蟲Mythimna separata[34]等昆蟲中,三堿基重復(fù)是含量最高的重復(fù)類型,導(dǎo)致三堿基重復(fù)含量較高的原因可能在于其較其他重復(fù)類型更加穩(wěn)定,每3 個(gè)核苷酸翻譯1 個(gè)氨基酸,為保證蛋白質(zhì)結(jié)構(gòu)與功能不產(chǎn)生變化,使得其極少產(chǎn)生移碼突變[35]。
前人研究表明,由于C 易于甲基化突變成T,推測(cè)在動(dòng)植物體內(nèi)GC/CG的含量會(huì)很低,有些甚至不含該重復(fù)基元[36-37]。然而,本研究中CG/CG 含量是除AC/GT 外含量最高的二堿基重復(fù),該結(jié)果同一些鱗翅目昆蟲如二點(diǎn)委夜蛾[33]、東方黏蟲[30]和細(xì)梢小卷蛾Rhyacionia leptotubula[38]的研究結(jié)果相一致,可能是由于鱗翅目昆蟲自身的進(jìn)化導(dǎo)致其含量較高,需要進(jìn)一步研究。
SSR 多態(tài)性是判斷序列能否作為分子標(biāo)記的重要依據(jù),而SSR 序列長度是影響SSR 多態(tài)性的主要因素,且序列長度與多態(tài)性成正比[36,39]。研究結(jié)果表明,SSR 多態(tài)性極低的序列其長度小于12 bp,SSR 多態(tài)性中等的序列其長度在12~20 bp 之間,而SSR 多態(tài)性較高的序列其長度大于等于20 bp[39]。本研究中,黃地老虎SSR 位點(diǎn)序列長度在12~19 bp的SSR 位點(diǎn)有3 493 個(gè),屬于SSR 中度多態(tài)性位點(diǎn);大于等于20 bp的SSR 位點(diǎn)有820 個(gè),屬于SSR 高度多態(tài)性位點(diǎn)??傮w來說,黃地老虎具有相對(duì)較高的遺傳多態(tài)性。
本研究基于黃地老虎轉(zhuǎn)錄組數(shù)據(jù)庫,對(duì)黃地老虎SSR 和SNP 位點(diǎn)信息進(jìn)行分析,結(jié)果顯示該蟲轉(zhuǎn)錄組中包含SNP 位點(diǎn)371 148 個(gè)和SSR 位點(diǎn)4 438 個(gè);SNP 以轉(zhuǎn)換類型(64.02%)為主;SSR位點(diǎn)共存在6 種重復(fù)類型,以5 次重復(fù)(21.67%)為主,其序列長度為12~127 bp,包含3 493 個(gè)中等多態(tài)性位點(diǎn)和820 個(gè)高度多態(tài)性位點(diǎn)。研究結(jié)果表明該蟲SNP 和SSR 位點(diǎn)數(shù)較多,SSR 重復(fù)類型豐富,且序列長度較長,具有較高的遺傳多態(tài)性,可為研究黃地老虎遺傳多樣性提供充分的遺傳信息,用于黃地老虎種群遺傳分化的研究。