杜炫星,牛敏敏,趙 清,蔡 波,盧運(yùn)運(yùn),魏久鋒*,張虎芳,2*
(1.山西農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,山西太谷030801;2.忻州師范學(xué)院生物系,山西忻州 034000;3. 海口海關(guān)熱帶植物隔離檢疫中心,???70311)
李白盾蚧Pseudaulacaspisprunicola(Maskell),隸屬于半翅目Hemiptera盾蚧科Diaspididae白盾蚧屬Pseudaulacaspis,與桑白盾蚧Pseudaulacaspispentagona在形態(tài)上非常相似。湯祊德先生在《中國園林主要蚧蟲·第三卷》中認(rèn)為李白盾蚧P.prunicola為桑白盾蚧P.pentagona的同種異名,但Miller和Davidson等人研究認(rèn)為P.prunicola和P.pentagona為兩個(gè)不同的物種,形態(tài)上主要區(qū)別點(diǎn)為雌成蟲臀末三個(gè)側(cè)葉間的腺刺,P.prunicola成雙而端尖,P.pentagona單一而端部分叉,2019年Normark等人通過多基因聯(lián)合分析表明P.prunicola和P.pentagona不是同一物種。李白盾蚧廣泛分布于日本、韓國、印度和美國,2014年首次被深圳出入境檢驗(yàn)檢疫局截獲,在我國的寧夏和臺(tái)灣局部分布,是一種重要的入侵生物(向才玉等,2015)。該蟲寄主植物范圍廣泛,主要危害李、桃、櫻桃等植物,同時(shí)對(duì)多種經(jīng)濟(jì)林木和觀賞植物都能造成嚴(yán)重危害。由于李白盾蚧與桑白盾蚧在我國經(jīng)常被認(rèn)為是一個(gè)物種,所以迄今為止其在我國沒有準(zhǔn)確的分布與危害情況,但經(jīng)筆者采集調(diào)查發(fā)現(xiàn)其在我國很多省份都已經(jīng)大量發(fā)生,嚴(yán)重危害我國果樹生產(chǎn)及園林綠化。
轉(zhuǎn)錄組測序是指利用第二代高通量測序技術(shù)進(jìn)行cDNA測序,能全面快速地獲取研究材料特定組織在某一狀態(tài)下全部轉(zhuǎn)錄本的序列信息和表達(dá)信息(胡俊杰等,2017)。Vera等(2008)利用羅氏454測序技術(shù)進(jìn)行慶網(wǎng)蛺蝶Melitaeacinxia的轉(zhuǎn)錄組測序,是首個(gè)采用從頭組裝的無參昆蟲轉(zhuǎn)錄組研究,由此拉開了昆蟲轉(zhuǎn)錄組研究的序幕。在蚧蟲中進(jìn)行轉(zhuǎn)錄組分析的物種也有很多,例如:中華紫膠蟲Kerriachinensis(Wangetal.,2019)、曼粉蚧Maconellicoccushirsutus(Kohlietal.,2021)、白蠟蟲Ericeruspela(Yangetal.,2015)、扶桑綿粉蚧Phenacoccussolenopsis(胡俊杰等,2016)及菠蘿潔粉蚧Dysmicoccusbrevipes(何衍彪等,2019)等。
簡單重復(fù)序列(simple sequence repeat, SSR),又被稱為微衛(wèi)星(microsatellite)DNA,廣泛分布于真核生物基因組中,由若干個(gè)堿基大小為1~6 bp的簡單重復(fù)單元串聯(lián)組成(孫荊濤等,2012;劉倩倩等,2021)。SSR標(biāo)記具有種類多、重復(fù)性高、共顯性遺傳、多態(tài)性信息豐富、操作簡易等特點(diǎn),被廣泛應(yīng)用于分子遺傳育種、種群遺傳多樣性分析、近緣物種鑒定、基因定位與克隆、遺傳連鎖圖譜構(gòu)建等各個(gè)領(lǐng)域(Zonneveldetal.,2012;Tangetal.,2015;Zhuetal.,2019)。但傳統(tǒng)的SSR分子標(biāo)記開發(fā)方法實(shí)驗(yàn)步驟復(fù)雜、效率低、重復(fù)性差(Roderetal.,1998;Uzunova and Ecke,1999)。高通量測序技術(shù)和生物信息學(xué)的快速發(fā)展,為SSR標(biāo)記的開發(fā)提供了更加高效、便捷的方法(Schoebeletal.,2013)。目前,基于轉(zhuǎn)錄組數(shù)據(jù)庫已成功挖掘出了印度谷螟Plodiainterpunctella(唐培安等,2016)、沙棘木蠹蛾Eogystiahippophaecolus(崔明明等,2017)、東方粘蟲Mythimnaseparata(Walker)(李微等,2017)、梨小食心蟲Grapholithamolesta(冷春蒙,2018)、星天牛Anoplophorachinensis(韓小紅等,2019)、椰心葉甲嚙小蜂Tetrastichusbrontispae(劉華偉等,2021)、灰茶尺蠖Ectropisgrisescens(王定鋒等,2021)、溫帶臭蟲Cimexlectularius(李敏等,2019)等多種昆蟲的SSR位點(diǎn),為其今后種群遺傳結(jié)構(gòu)、發(fā)生動(dòng)態(tài)及擴(kuò)散歷史研究提供依據(jù)。
迄今為止,對(duì)李白盾蚧的研究大多集中在其生物學(xué)習(xí)性以及化學(xué)防治等方面(Uchidaetal., 2021),而對(duì)其分子標(biāo)記的研究還處于空白狀態(tài)。本研究利用轉(zhuǎn)錄組測序技術(shù),結(jié)合生物信息學(xué)方法,對(duì)李白盾蚧的SSR位點(diǎn)進(jìn)行挖掘,并進(jìn)行序列特征的統(tǒng)計(jì)與分析,設(shè)計(jì)和篩選能夠穩(wěn)定擴(kuò)增的SSR引物,為李白盾蚧的分子鑒定與遺傳結(jié)構(gòu)分析奠定基礎(chǔ)。
本研究試蟲采集自山西省晉中市太谷區(qū)西山底村(37°20′59.4″N,112°32′54.5"E)。設(shè)3個(gè)重復(fù)組,每組30頭雌成蟲,經(jīng)液氮速凍后,在-80℃超低溫冰箱中保存。用于驗(yàn)證SSR引物的李白盾蚧雌成蟲采集信息見表1,所有樣本均浸泡于無水乙醇中,在-20℃低溫冰箱保存。使用Ezup柱式動(dòng)物基因組DNA抽提試劑盒(生工生物工程(上海)有限公司)進(jìn)行總DNA提取,-20℃保存。上述所有樣本均提取線粒體COI同NCBI數(shù)據(jù)庫比對(duì)進(jìn)行分子鑒定,結(jié)果為李白盾蚧。
表1 李白盾蚧6個(gè)地理種群樣本信息
委托北京諾禾致源科技股份有限公司進(jìn)行轉(zhuǎn)錄組測序。首先用Trizol法提取李白盾蚧的總RNA,RNA質(zhì)量以紫外分光光度計(jì)和瓊脂糖凝膠電泳檢測。樣品檢測合格后,通過Oligo(dT)磁珠富集帶有polyA尾的mRNA,隨后加入Fragmentation Buffer將得到的mRNA隨機(jī)打斷。以片段化的mRNA模板,隨機(jī)寡核苷酸為引物,在M-MuLV逆轉(zhuǎn)錄酶體系中合成cDNA第一條鏈,隨后RNaseH降解RNA鏈,并在DNApolymerase I體系下,以dNTPs為原料合成cDNA第二條鏈。純化后的雙鏈cDNA經(jīng)過末端修復(fù),加A尾并連接測序接頭,用AMPure XP beads篩選370~420 bp的cDNA,進(jìn)行PCR擴(kuò)增并再次使用AMPure XPbeads純化PCR產(chǎn)物,最終獲得文庫。文庫構(gòu)建完成后,使用Agilent 2100 bioanalyzer對(duì)文庫質(zhì)量進(jìn)行評(píng)估,合格后利用Illumina NovaSeq 6000(Illumina,USA)平臺(tái)進(jìn)行測序。
對(duì)李白盾蚧進(jìn)行轉(zhuǎn)錄組測序得到原始序列(Raw reads),通過去除帶接頭的讀數(shù)、去除含N(N表示無法確定堿基信息)的讀數(shù)、去除低質(zhì)量讀數(shù),得到高質(zhì)量序列(Clean reads)。同時(shí)對(duì)clean reads進(jìn)行Q20(堿基正確識(shí)別率達(dá)到99%以上的堿基占比)、Q30(堿基正確識(shí)別率達(dá)到99.9%以上的堿基占比)和GC含量的計(jì)算。利用Trinity v2.6.6(Grabherretal.,2011)軟件對(duì)clean reads進(jìn)行組裝拼接,獲得轉(zhuǎn)錄本序列。原始數(shù)據(jù)已上傳至NCBI數(shù)據(jù)庫中,登錄號(hào)為PRJNA863380。
在Trinity拼接的基礎(chǔ)上,使用Corset v4.6(Davidson and Oshlack,2014)軟件進(jìn)行轉(zhuǎn)錄本聚類,去除冗余轉(zhuǎn)錄本,得到非冗余unigenes。將所有unigenes使用(Diamond v0.8.22、blast2go v2.5等軟件,以及KAAS在線網(wǎng)站等)軟件同Nr、Nt、Swiss-prot、Pfam、KOG、KEGG和GO數(shù)據(jù)庫比對(duì),進(jìn)行基因功能注釋。
使用軟件MISA v1.0(Thieletal.,2003)對(duì)李白盾蚧unigenes進(jìn)行SSR位點(diǎn)搜索,搜索標(biāo)準(zhǔn)為:重復(fù)單元長度大小依次為1、2、3、4、5和6 bp,最小重復(fù)次數(shù)分別為10、6、5、5、5和5,SSR位點(diǎn)側(cè)翼序列長度大于100 bp。
根據(jù)MISA的輸出結(jié)果,使用Primer Primer 3 v2.3.5(Untergasseretal.,2012)軟件批量設(shè)計(jì)引物,遵循以下原則對(duì)所有引物進(jìn)行初步篩選:(1)GC含量為40%~60%;(2)退火溫度為50~60℃,正、反向引物退火溫度相差不超過5℃;(3)引物長度建議為17~28 bp,最好不要超過30 bp;(4)預(yù)期PCR產(chǎn)物大小為150~300 bp;(5)避免引物二聚體和發(fā)夾結(jié)構(gòu)。經(jīng)初步篩選后,隨機(jī)挑選50對(duì)引物,由生工生物工程(上海)有限公司進(jìn)行合成。以李白盾蚧總DNA為模板進(jìn)行PCR反應(yīng),反應(yīng)體系20 μL:DNA模板1 μL、2×Taq PCR Master Mix 10 μL、上下游引物(10 μmol/L)各1 μL、ddH2O補(bǔ)足至20 μL。反應(yīng)程序?yàn)?94℃預(yù)變性3 min、94℃變性30 s、Tm復(fù)性30 s,72℃延伸30 s,共35個(gè)循環(huán);72℃延伸5 min。PCR產(chǎn)物經(jīng)1%瓊脂糖凝膠電泳檢測。
篩選引物時(shí),首先使用寧夏銀川的1個(gè)樣本總DNA對(duì)所有的50對(duì)引物進(jìn)行PCR反應(yīng)和瓊脂糖凝膠電泳檢測,其中34對(duì)引物PCR擴(kuò)增電泳檢測的條帶單一、清晰可見,與目的片段大小基本一致,其余16對(duì)引物沒有片段,或者與目的片段大小不一致。將上述34對(duì)引物繼續(xù)用6個(gè)地理種群(表1)每個(gè)種群3個(gè)樣本的總DNA進(jìn)行PCR擴(kuò)增穩(wěn)定性檢測。上述所有樣本均為雌蚧蟲。
運(yùn)用Illumina NovaSeq 6000測序平臺(tái)對(duì)李白盾蚧轉(zhuǎn)錄組測序,平均獲得22 348 052條原始序列。經(jīng)數(shù)據(jù)過濾后,平均得到21 570 143條clean reads,堿基錯(cuò)誤率為0.03%,每組樣本均生成6 Gb以上的高質(zhì)量讀數(shù),Q20平均為97.01%,Q30平均為91.95%,GC含量平均為43.63%,測序質(zhì)量良好。共組裝到60 296條轉(zhuǎn)錄本,24 967條unigenes,總長度為41 668 408bp,最大長度為28 540 bp,平均長度為1 669 bp。N50和N90分別為2 816 bp和646 bp,拼接效果良好。組裝得到的24 967條unigenes全部用于后續(xù)SSR位點(diǎn)搜索。
通過Nr、Nt、Swiss-prot、Pfam、KOG、KEGG和GO七大數(shù)據(jù)庫對(duì)李白盾蚧24 967條unigenes進(jìn)行注釋,其中注釋到Nr數(shù)據(jù)庫的unigenes最多,為11 244(45.03%)條;2 172(8.69%)條unigenes注釋到NT數(shù)據(jù)庫;6 225(24.93%)條unigenes注釋到KO數(shù)據(jù)庫;9 417(37.71%)條unigenes注釋到Swiss-prot數(shù)據(jù)庫;11 122(44.54%)條unigenes注釋到Pfam數(shù)據(jù)庫;11 121(44.54%)條unigenes注釋到GO數(shù)據(jù)庫;5 805(23.25%)條unigenes注釋到KOG數(shù)據(jù)庫。所有數(shù)據(jù)庫都能注釋到的unigenes有1 290條,占5.16%;在至少一個(gè)數(shù)據(jù)庫中注釋到的unigenes有13 541條,占54.23%(表2)。
表2 李白盾蚧轉(zhuǎn)錄組unigenes在7個(gè)數(shù)據(jù)庫中的注釋結(jié)果統(tǒng)計(jì)
通過與Nr數(shù)據(jù)庫進(jìn)行同源性比對(duì)注釋,李白盾蚧轉(zhuǎn)錄組注釋到其他物種的unigenes共11 244條。其中與煙粉虱Bemisiatabaci的相似性序列最多,所占比例為13.3%;其次為塞古都斯白蟻Crytotermessecundus,所占比例為6.7%;內(nèi)華達(dá)白蟻Zootermopsisnevadensis、灰飛虱Laodelphaxstriatellus和褐飛虱Nilaparvatalugens所占比例分別為4.7%、4.5%和4.8%,其他物種所占比例為66.0%(圖1)。
圖1 李白盾蚧與其他物種Nr數(shù)據(jù)庫轉(zhuǎn)錄組數(shù)據(jù)比對(duì)相似度
利用Blast2go(G?tzetal.,2008)軟件對(duì)李白盾蚧轉(zhuǎn)錄組11 121條unigenes進(jìn)行GO注釋,得到49 745條功能注釋(圖2),分為三大類:生物學(xué)進(jìn)程(Biological process)、細(xì)胞組分(Cellular component)和分子功能(Molecular function)。生物學(xué)進(jìn)程中共注釋到24 822條序列,分為24個(gè)次級(jí)功能條目,其中細(xì)胞進(jìn)程(Cellular process)數(shù)量最多,為6 611條;其次為代謝進(jìn)程(Metabolic process)、生物調(diào)節(jié)(Biological regulation)、生物進(jìn)程調(diào)控(Regulation of biological process)和定位(Localization),數(shù)量分別為5 647條、2 580條、2 408條和2 138條。在細(xì)胞組分中共有10 962條功能注釋,其中細(xì)胞結(jié)構(gòu)體(Cellular anatomical entity)數(shù)量最多,為5 178條,其次為細(xì)胞內(nèi)(Intracellular),2 924條。分子功能分類中共注釋到13 961條序列,其中結(jié)合(Binding)6 365條、催化活性(Catalytic activity)4 675條。
圖2 李白盾蚧unigenes GO功能注釋
通過對(duì)李白盾蚧轉(zhuǎn)錄組24 967條unigenes進(jìn)行KOG直系同源分類,共得到5 805條基因注釋,分為25類,分類結(jié)果見圖3。其中,R類一般功能預(yù)測(General function prediction only)和T類信號(hào)轉(zhuǎn)導(dǎo)相關(guān)(Signal transduction mechanisms)的基因條數(shù)最多,分別為992條和748條;其次為O類翻譯后修飾(Posttranslational modification)、蛋白質(zhì)周轉(zhuǎn)(Protein turnover)和分子伴侶(Chaperones)相關(guān)共633條,K類轉(zhuǎn)錄相關(guān)(Transcription)417條。除有具體功能注釋外還有S類未知功能(Function unknown)419條。
圖3 李白盾蚧unigenes KOG分類注釋
通過對(duì)24 967條unigenes進(jìn)行KEGG代謝通路富集分析,結(jié)果如圖4所示,共有6 668條unigenes參與到細(xì)胞進(jìn)程(Cellular processes)、環(huán)境信息處理(Environmental information processing)、遺傳信息處理(Genetic information processing)、新陳代謝(Metabolism)和有機(jī)系統(tǒng)(Organismal systems)這五大類生物代謝途徑中。其中有機(jī)系統(tǒng)途徑中基因最多,為1 662條,主要參與內(nèi)分泌系統(tǒng)(Endocrine system)、免疫系統(tǒng)(Immune system)和神經(jīng)系統(tǒng)(Ervous system)等過程,數(shù)量分別為390條、283條和224條。在所有的34組次級(jí)代謝途徑中,信號(hào)轉(zhuǎn)導(dǎo)(Signal transduction)途徑的基因最多,為836條。這些與代謝途徑相關(guān)的基因分布于已知的280個(gè)代謝通路中,其中富集最多的10條通路分別是內(nèi)質(zhì)網(wǎng)中的蛋白質(zhì)加工(Protein processing in endoplasmic reticulum)、核糖體(Ribosome)、RNA運(yùn)輸(RNA transport)、剪接體(Spliceosome)、內(nèi)吞作用(Endocytosis)、碳代謝(Endocytosis)嘌呤代謝(Purine metabolism)、溶酶體(Lysosome)、cAMP信號(hào)傳導(dǎo)途徑(cAMP signaling pathway)和細(xì)胞周期(Cell cycle)。
圖4 李白盾蚧unigenes KEGG通路分析
從李白盾蚧24 967條unigenes數(shù)據(jù)中,共檢測出18 193個(gè)SSR位點(diǎn),分布在9 043條unigenes中,其中3 861條unigenes含有一個(gè)以上的SSR位點(diǎn),復(fù)合SSR位點(diǎn)1 704個(gè)。SSR位點(diǎn)在轉(zhuǎn)錄組數(shù)據(jù)中的出現(xiàn)頻率(含SSR位點(diǎn)的unigene數(shù)量/總unigene數(shù)量)為36.22%,SSR位點(diǎn)的分布頻率為(SSR位點(diǎn)個(gè)數(shù)/總unigene數(shù)量)72.87%,平均每2.29 Kb發(fā)現(xiàn)一個(gè)SSR位點(diǎn)。
SSR位點(diǎn)中,重復(fù)基序?yàn)閱魏塑账岬奈稽c(diǎn)所占比例最高,為72.03%,其次為二核苷酸、三核苷酸和四核苷酸,分別為8.48%、15.90%、3.10%(表3)。單核苷酸重復(fù)中,A/T為主要的重復(fù)基序,占SSR位點(diǎn)總數(shù)的71.16%;二核苷酸重復(fù)中,AG/CT和AC/GT為主要的重復(fù)類型,分別占總數(shù)的5.20%和1.83%;三核苷酸重復(fù)中,數(shù)量最多的重復(fù)基序?yàn)锳AT/ATT和ACG/CGT,所占比例分別為5.10%和3.22%;四核苷酸、五核苷酸和六核苷酸,共占SSR位點(diǎn)總數(shù)的7.55%(圖5)。
圖5 基于李白盾蚧轉(zhuǎn)錄組數(shù)據(jù)的不同SSR位點(diǎn)重復(fù)基序頻率分布圖
表3 基于李白盾蚧轉(zhuǎn)錄組數(shù)據(jù)的不同類型SSR位點(diǎn)數(shù)量統(tǒng)計(jì)
李白盾蚧轉(zhuǎn)錄組數(shù)據(jù)中,SSR位點(diǎn)的重復(fù)次數(shù)集中在5~15次,所占比例為83.96%;其余大于15次大多為單核苷酸和二核苷酸重復(fù),少部分為三核苷酸和四核苷酸重復(fù),共占總數(shù)16.04%。單核苷酸重復(fù)次數(shù)最多為10次,二核苷酸為6次,其余重復(fù)類型重復(fù)次數(shù)最多為5次(表3)。
由于部分SSR位點(diǎn)為復(fù)合型,所以長度分析中微衛(wèi)星的總數(shù)為16 087個(gè)。在所有的微衛(wèi)星中,長度為10~469 bp不等,平均長度為22.98 bp,序列長度為10~15 bp的共有9 603個(gè),占總SSR個(gè)數(shù)的59.69%,其中單核苷酸、二核苷酸、三核苷酸重復(fù)單元分別占85.29%、5.96%、8.76%;序列長度為16~20 bp的共有1 956個(gè),占總SSR個(gè)數(shù)的12.16%,其中單核苷酸占比最多(55.62%),其次為三核苷酸(22.34%);序列長度為21~25 bp的共有1 338個(gè),占SSR總數(shù)的8.32%,其中單核苷酸和三核苷酸占比相近,分別為38.57%和37.37%,復(fù)合型、二核苷酸和四核苷酸占比相近,五核苷酸最少為1.79%;序列長度大于25 bp的共有3 190個(gè),占總SSR個(gè)數(shù)的19.83%,其中1~6核苷酸重復(fù)和復(fù)合型都有,最多的為復(fù)合型(52.51%)(圖6)。
圖6 李白盾蚧轉(zhuǎn)錄組SSR的長度分布
基于已篩選出的李白盾蚧SSR位點(diǎn),利用Primer Primer 3軟件進(jìn)行引物批量設(shè)計(jì),共有12 538個(gè)位點(diǎn)設(shè)計(jì)出了引物。根據(jù)上述引物篩選原則,對(duì)所有的12 538對(duì)引物進(jìn)行篩選過后,共有305對(duì)符合條件,從中隨機(jī)挑選50對(duì)引物進(jìn)行合成。
首先利用寧夏銀川的單頭李白盾蚧DNA樣本對(duì)50對(duì)引物進(jìn)行PCR擴(kuò)增,共有34對(duì)引物成功擴(kuò)增出與預(yù)期片段大小一致的特異性片段,條帶清晰明亮(表4,圖7)。繼續(xù)用6個(gè)不同地理種群李白盾蚧DNA樣本對(duì)上述成功擴(kuò)增的34對(duì)引物進(jìn)行擴(kuò)增穩(wěn)定性驗(yàn)證,結(jié)果PP_4、PP_8、PP_31、PP_39在海南??诜N群中無擴(kuò)增條帶,或條帶模糊,引物PP_38在貴州雷山種群的擴(kuò)增條帶與目的條帶大小不一致(圖8),剩余29對(duì)引物可以穩(wěn)定擴(kuò)增出目的片段,且與預(yù)期目的片段大小一致,有效擴(kuò)增率達(dá)到58%。引物的擴(kuò)增多態(tài)性仍需進(jìn)一步驗(yàn)證。已成功擴(kuò)增的SSR引物可用于李白盾蚧進(jìn)一步的遺傳多樣性研究。
圖7 李白盾蚧寧夏銀川種群50個(gè)SSR位點(diǎn)擴(kuò)增電泳圖
圖8 李白盾蚧6個(gè)地理種群3個(gè)不同DNA樣本34個(gè)SSR位點(diǎn)擴(kuò)增電泳圖
表4 李白盾蚧SSR引物信息
隨著新一代高通量測序技術(shù)的發(fā)展,越來越多昆蟲的轉(zhuǎn)錄組數(shù)據(jù)以及全基因組序列被公布,但盾蚧科昆蟲迄今為止還沒有已公布的全基因組序列,轉(zhuǎn)錄組數(shù)據(jù)也少之又少,導(dǎo)致關(guān)于盾蚧科昆蟲的基因功能以及遺傳進(jìn)化相關(guān)研究存在一定局限。本研究對(duì)李白盾蚧轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行測序、組裝與分析,共得到60 296條轉(zhuǎn)錄本,24 967條unigenes,所有樣本的Q30比例均不低于91%,N50為2 816 bp。一般認(rèn)為Q30比例大于80%,則測序質(zhì)量可靠(王興春等,2015);N50長度大于800 bp,則說明組裝得到的序列完整性較高(胡俊杰等,2017)。由此可見本試驗(yàn)所獲得的轉(zhuǎn)錄組數(shù)據(jù)質(zhì)量較好,序列拼接的完整性較好,保證了后續(xù)轉(zhuǎn)錄組分析的準(zhǔn)確性。
通過與Nr和Swiss-prot蛋白質(zhì)數(shù)據(jù)庫進(jìn)行比對(duì),24 967條unigenes中共有11 244條(45.03%)注釋到Nr數(shù)據(jù)庫,9 417條(37.71%)注釋到Swiss-prot數(shù)據(jù)庫中,說明本次轉(zhuǎn)錄組測序獲得了大量在李白盾蚧中表達(dá)的不同基因。GO分類注釋是一套國際標(biāo)準(zhǔn)的基因功能分類系統(tǒng),分為生物學(xué)過程、分子功能和細(xì)胞組分三大類,分別用來描述基因編碼的產(chǎn)物所參與的生物過程、所具有的分子功能及所處的細(xì)胞環(huán)境。本研究GO分類注釋結(jié)果中,共得到49 745條注釋結(jié)果,其中生物學(xué)進(jìn)程數(shù)量最多占主導(dǎo)地位,其次為分子功能,細(xì)胞組分注釋結(jié)果最少(圖3),這與已報(bào)道的例如中華大仰蝽Notonectachinensi(李敏等,2022)、春尺蠖Apocheimacinerarius(陳龍等,2022)、花椒窄吉丁Agriluszanthoxylumi(鞏雪芳等,2020)、阿爾泰蝠蛾Hepialusaltaicola(孫濤等,2021)等生物學(xué)進(jìn)程最多,細(xì)胞組分次之,分子功能最少的昆蟲不同,這可能是由于不同昆蟲在長期進(jìn)化過程中所產(chǎn)生的差異。通過KOG直系同源分類注釋,李白盾蚧轉(zhuǎn)錄組中與一般功能預(yù)測和信號(hào)轉(zhuǎn)導(dǎo)相關(guān)的unigenes數(shù)目最多,KEGG代謝通路分類中共獲得280條代謝通路,其中與有機(jī)系統(tǒng)通路相關(guān)的基因數(shù)目最多。上述結(jié)果可以為后續(xù)大量挖掘李白盾蚧生長發(fā)育過程中的重要表達(dá)基因、基因克隆等提供可靠的分子依據(jù)。
本研究基于李白盾蚧轉(zhuǎn)錄組數(shù)據(jù)庫24 967條unigenes,成功挖掘出18 193個(gè)SSR位點(diǎn),分布在9 043條unigenes中,平均每2.29 Kb發(fā)現(xiàn)一個(gè)SSR位點(diǎn),發(fā)生頻率為36.22%,高于許多已報(bào)道的昆蟲包括意大利飛蝗Calliptamusitalicus(17.58%)(桑迪等,2020)、黃地老虎Agrotissegetum(6.09%)(常虹等,2022)、星天牛(18.85%)(韓小紅等,2019)、扶桑綿粉蚧(5.79%)(羅梅等,2014)、灰茶尺蠖(20.26%)(王定鋒等,2021)、窄足真蚋Simulium(Eusimulium)angustipes(36.05%)(郭歡等,2018),但低于梨網(wǎng)蝽Stephanitisnashi(40.37%)(謝瑾燕等,2019)、椰心葉甲嚙小蜂(39.96%)(劉華偉等,2021)等。由于本研究將單核苷酸重復(fù)類型計(jì)入SSR位點(diǎn)總數(shù),所以其發(fā)生頻率較高,但例如齒緣刺獵蝽Sclominaerinacea(4.99%)(黎東海和趙萍,2018)、中華大仰蝽(7.07%)(李敏等,2022)等并沒有將單核苷酸重復(fù)類型計(jì)入SSR位點(diǎn)總數(shù)中,所以其發(fā)生頻率相對(duì)較低。不同昆蟲間SSR位點(diǎn)的發(fā)生頻率不同,究其原因可能與物種本身的差異有關(guān),同時(shí),轉(zhuǎn)錄組數(shù)據(jù)庫大小、篩選SSR位點(diǎn)的標(biāo)準(zhǔn)、測序時(shí)RNA的質(zhì)量等都有可能是不同物種SSR發(fā)生頻率出現(xiàn)差異的原因。
本研究中,李白盾蚧轉(zhuǎn)錄組挖掘出的微衛(wèi)星位點(diǎn)種類豐富,1~6核苷酸重復(fù)類型均有出現(xiàn),其中數(shù)量最多的為單核苷酸重復(fù)類型,占總數(shù)的72.03%,其次為三核苷酸重復(fù)類型,占總數(shù)的15.90%,這一結(jié)果同許多已報(bào)道的昆蟲相似,例如沙蔥螢葉甲Galerucadaurica(張鵬飛等,2016)、窄足真蚋(郭歡等,2018)、黑腹胃蠅Gasterophiluspecorum(陳亙濃等,2018)等。而不同于溝眶象Eucryptorrhynchuschinensis(武政梅等,2016)、二點(diǎn)委夜蛾Athetislepigone(Lietal.,2013)、白背飛虱Sogatellafurcifera(Xuetal.,2012)、云南切梢小蠹Tomicusyunnanensis(袁遠(yuǎn)等,2014)等以三核苷酸重復(fù)類型為主的昆蟲,其原因可能是SSR位點(diǎn)的篩選標(biāo)準(zhǔn)不同,本研究中單核苷酸重復(fù)類型重復(fù)次數(shù)最少為10次,但上述以三核苷酸重復(fù)類型為主的昆蟲,其單核苷酸重復(fù)類型重復(fù)次數(shù)為12次或12次以上,所以其單核苷酸重復(fù)類型的數(shù)目相對(duì)較少,三核苷酸重復(fù)類型數(shù)目較多。符合遺傳編碼過程中,三聯(lián)體密碼子的重要性。
在李白盾蚧SSR所有核苷酸重復(fù)基序中,A/T所占比例為71.16%,數(shù)量最多,與已報(bào)道的大多數(shù)昆蟲分析結(jié)果一致,例如印度谷螟(唐培安等,2017)、褐飛虱(劉玉娣和侯茂林,2010)、扶桑綿粉蚧(羅梅等,2014)等。二核苷酸重復(fù)中GC/GC的數(shù)量最少,僅有21個(gè),占總數(shù)的0.21%,但在印度谷螟、二點(diǎn)委夜蛾、粘蟲Mythimnaseparate(Walker)(胡艷華等,2015)等鱗翅目昆蟲中則結(jié)果不同。據(jù)報(bào)道,動(dòng)物SSR中的GC/GC含量較低甚至沒有(Duanetal.,2017),但在昆蟲中情況并不相同,所以GC/GC含量在SSR中的差異具體有什么作用,還需進(jìn)一步驗(yàn)證。此外,有研究表明,SSR的多態(tài)性與其長度以及重復(fù)基序的重復(fù)次數(shù)相關(guān),長度越長、重復(fù)基序的重復(fù)次數(shù)越多,其多態(tài)性越高(Megleczetal.,2012),在李白盾蚧轉(zhuǎn)錄組中,SSR位點(diǎn)的長度集中在10~15 bp中,占SSR總數(shù)的59.69%,而且還有28.15%長度>20 bp的SSR位點(diǎn),由此推測李白盾蚧可能具有較高的遺傳多態(tài)性,而這也暗示了該蟲具有較強(qiáng)的入侵能力,能夠較為輕松的在入侵地定殖,并進(jìn)一步造成危害。
本研究中,基于轉(zhuǎn)錄組數(shù)據(jù)設(shè)計(jì)合成的引物多達(dá)12 538對(duì),隨機(jī)挑選50對(duì)引物后,首先利用寧夏銀川的單頭李白盾蚧DNA樣本進(jìn)行PCR擴(kuò)增,共有34對(duì)引物成功擴(kuò)增出與預(yù)期片段大小一致的特異性片段,后使用6個(gè)我國不同地理種群的李白盾蚧樣本進(jìn)行擴(kuò)增穩(wěn)定性驗(yàn)證,其中引物PP_4、PP_8、PP_31、PP_39在海南??诜N群中無擴(kuò)增條帶,或條帶模糊,表明這4對(duì)引物的擴(kuò)增穩(wěn)定性不高,在某些種群中不能成功擴(kuò)增出目的條帶,所以不能作為微衛(wèi)星位點(diǎn);引物PP_38在貴州雷山種群的擴(kuò)增條帶與目的條帶大小不一致,說明存在非特異擴(kuò)增,也不能作為微衛(wèi)星位點(diǎn)。綜上所述仍有29對(duì)引物可以穩(wěn)定擴(kuò)增,擴(kuò)增效率達(dá)到了58%,說明本研究基于轉(zhuǎn)錄組數(shù)據(jù)預(yù)測的SSR位點(diǎn)數(shù)目可觀,但其多態(tài)性還需進(jìn)一步驗(yàn)證,以滿足后續(xù)遺傳多樣性分析。
綜上所述,本研究通過對(duì)李白盾蚧轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析以及對(duì)SSR位點(diǎn)的挖掘,結(jié)果表明,利用轉(zhuǎn)錄組數(shù)據(jù)開發(fā)微衛(wèi)星位點(diǎn)高效可行,且為李白盾蚧之后的功能基因挖掘、種群遺傳等研究奠定了基礎(chǔ)。同時(shí)也有利于了解該蟲的入侵機(jī)制、入侵來源以及在我國的擴(kuò)散路線,對(duì)進(jìn)一步綜合防治該蟲提供了理論依據(jù),還可以對(duì)李白盾蚧的微衛(wèi)星位點(diǎn)進(jìn)行遷移,探索其在近緣物種桑白蚧中的擴(kuò)增能力,判斷這兩種物種的親緣關(guān)系。