施肖壟 蔡志欣 郭仲杰 盧園萍 陳美元 廖劍華
摘要:【目的】通過對雙孢蘑菇不同類型核心種質(zhì)的基因組重測序分析,探討雙孢蘑菇不同類型菌株間基因組存在的差異及開發(fā)相關(guān)分子標記?!痉椒ā繉﹄p孢蘑菇國內(nèi)外雜交菌株、野生菌株、高產(chǎn)型或優(yōu)質(zhì)型傳統(tǒng)菌株、棕色菌株、不育菌株等共18株核心種質(zhì)進行基因組重測序,應(yīng)用不同的生物信息學(xué)處理軟件,對測序得到的原始reads序列與雙孢蘑菇參考基因組H97序列進行比對,同時基于比對結(jié)果進行SNP、SV檢測,通過檢測結(jié)果對多態(tài)性標記分布進行統(tǒng)計并實現(xiàn)DNA水平差異基因挖掘和差異基因功能注釋等?!窘Y(jié)果】樣品測序共獲得21.63G數(shù)據(jù)量,Q30平均達到89.10%。樣品的reads與參考基因組H97的比對效率平均為82.50%,基因組覆蓋度為96.32%,平均深度分別在33X左右?;跍y序數(shù)據(jù)與參考基因組的比對結(jié)果,共檢測獲得約813768個SNP,53840個InDel,平均每個個體獲得924個SV變異?!窘Y(jié)論】國內(nèi)外菌株的親緣關(guān)系表明As2796系列與ul系列是世界上并列的兩大雙孢蘑菇雜交品系。
關(guān)鍵詞:食用菌;基因組;SNP;InDel;結(jié)構(gòu)變異
中圖分類號:S646.11文獻標志碼:A 文章編號:1008-0384(2019)10-1167-06
0引言
【研究意義】目前,多種食用菌已經(jīng)完成了全基因組測序,包括雙孢蘑菇(Agaricus bisporus)、草菇(Volvariellavolvacea)、香菇(Lentinusedodes)、黑木耳(AuricuLARIA Heimuer)等。在基因組測序完成并共享之后,利用新一代測序技術(shù)對基因組進行重測序變得簡單易行且成本低廉。全基因組重測序是對已知基因組序列的物種進行不同個體的基因組測序,并在此基礎(chǔ)上對個體或群體進行差異性分析。全基因組重測序的個體,通過序列比對,可以找到大量的單核苷酸多態(tài)性位點(Single NucleotidePolymorphisms,SNP)、插入缺失位點(Insertion/Dele.tion,InDel)、結(jié)構(gòu)變異位點(structureVariation,SV)位點等。通過生物信息學(xué)手段,可以分析不同個體基因組間的結(jié)構(gòu)差異,同時完成注釋?!厩叭搜芯窟M展】通過全基因組測序及重測序,許多作物重要的農(nóng)藝性狀,如產(chǎn)量、抗逆性等基因被鑒定、克隆,這對改良主要農(nóng)作物、提高產(chǎn)量、研究遺傳變異、開發(fā)新的分子標記用以輔助育種等具有深遠的意義。我國科學(xué)家對家蠶和水稻的重測序研究已經(jīng)獲得了重要的成果。福建農(nóng)林大學(xué)通過草菇基因組的測序及重測序,獲得基于SV位點的系列SCAR標記并用于構(gòu)建遺傳連鎖圖等。【本研究切入點】本研究從課題組所在單位保藏的400多個雙孢蘑菇栽培與野生菌株中挑選了18個不同類型的代表性核心種質(zhì)開展基因組重測序工作?!緮M解決的關(guān)鍵問題】結(jié)合生物信息學(xué)分析,以期發(fā)現(xiàn)它們在基因組水平上存在的差異,開發(fā)SNP、SV等分子標記,并發(fā)掘相關(guān)基因,為進一步的雙孢蘑菇遺傳育種工作提供相關(guān)的理論依據(jù)與分子工具。
1材料與方法
1.1供試菌株
雙孢蘑菇18個核心種質(zhì)由福建省農(nóng)業(yè)科學(xué)院食用菌研究所種質(zhì)資源與遺傳育種研究室保藏并提供,詳見表1。
1.2試驗方法
1.2.1菌株的培養(yǎng)將供試菌株從試管接入液體PDB培養(yǎng)基中,恒溫24℃、轉(zhuǎn)速220r·min振蕩培養(yǎng)2~3周。
1.2.2基因組DNA提取與檢測按OMEGA公司真菌基因組DNA提取試劑盒操作手冊進行。提取的基因組DNA樣品用0.8%瓊脂糖凝膠電泳(電壓5V·cm)檢測其帶型,用Nanodrop微量檢測設(shè)備檢測其濃度和雜質(zhì)污染程度。
1.2.3基因組DNA重測序在北京百邁客(Biomarker)公司進行。提取檢測合格的樣品基因組DNA,用機械打斷的方法(超聲波)將DNA片段化,QIAquickPCR試劑盒純化,末端修復(fù)、3’端加A、連接測序接頭,再用瓊脂糖凝膠電泳進行片段大小選擇,最后進行PCR擴增,建好的文庫用IlluminaHiSeqTM 2500進行測序。
1.2.4重測序數(shù)據(jù)分析應(yīng)用不同的生物信息學(xué)處理軟件,對測序得到的原始reads(雙端序列)進行數(shù)據(jù)評估,然后將reads序列與雙孢蘑菇參考基因組H97序列(https://genomejgi.doe.gov/Agabi_varbisH97_2/Agabi varbisH972.home.html)進行比對,并基于比對結(jié)果進行SNP、SV檢測,通過檢測結(jié)果對多態(tài)標記分布進行統(tǒng)計并實現(xiàn)DNA水平差異基因挖掘和差異基因功能注釋等。使用samtools進行去重復(fù)(Mark Duplicates),GATK進行局部重比對(LocalRealignment),堿基質(zhì)量值校正fBase Recalibration)等處理,再使用GATK進行SNP的檢測,過濾,并得到最終的SNP位點集。使用GATK檢測長度小于50bp的小片段InDel,使用snpEff軟件對SNP和InDel變異位點進行注釋。通過BreakDancer軟件檢測SV數(shù)據(jù)集,主要包含刪除(Deletion,DEL)、插入(Insertion,INS)、倒位(Inversion,INV)、染色體內(nèi)易位(Intra-chromosomal Translocation,ITX)、染色體間易位(Inter-chromosomal Translocation,CTX)。
2結(jié)果與分析
2.118個雙孢蘑菇菌株重測序數(shù)據(jù)分析
提取的基因組DNA質(zhì)量好,Nanodrop檢測主峰清晰,OD260/280及OD260/230數(shù)值顯示雜質(zhì)較少,符合重測序要求。對18個樣品進行重測序分析,共獲得21.63G數(shù)據(jù)量,Q30平均達到89.10%。通過bwa軟件對二代基因組測序得到的短序列與參考基因組進行比對,定位測序reads在參考基因組上的位置,統(tǒng)計得到樣品的測序深度、基因組覆蓋度等信息。結(jié)果表明,樣品的reads與參考基因組H97的比對效率平均為82.50%,基因組覆蓋度為96.32%,平均覆蓋深度約33X(表2)。染色體的覆蓋深度分布圖反映出樣品的測序隨機性較好。
2.2 18個雙孢蘑菇菌株與參考基因組的SNP和SV分析
基于測序數(shù)據(jù)與參考基因組H97的比對結(jié)果,共檢測獲得約813768個SNP,53840個InDel,平均每個個體獲得924個SV變異(表3)。從統(tǒng)計數(shù)據(jù)可以看出,國內(nèi)雜交菌株如As2796、W192、國內(nèi)野生菌株Ag78331、AgLH830等與H97比較的SNP、SV數(shù)量分別比國外雜交菌株如A15、u1、國外野生菌株ARPl59等大得多,表明國內(nèi)野生菌株與H97的親緣關(guān)系比國外野生菌株更遠,而國內(nèi)栽培菌株也與國外栽培菌株具有很大的差異。對這些變異進行了注釋,發(fā)現(xiàn)存在于同義編碼突變的SNP數(shù)量最多,其次是非同義編碼突變和內(nèi)含子區(qū)域。而InDel則主要存在于內(nèi)含子區(qū)域,其次是基因的上游和下游區(qū)。
2.318個雙孢蘑菇菌株DNA水平的差異基因挖掘
基因中堿基的差異就有可能造成其密碼子的不同,此項分析用于尋找測序單株與參考基因組之間在基因?qū)用娴牟町?,包括SNP、InDel、SV等。較為典型的差異基因有如下3種:基因中存在非同義突變而產(chǎn)生蛋白差異、基因中存在小的InDel而導(dǎo)致基因功能改變或者喪失、基因中發(fā)生了結(jié)構(gòu)變異而導(dǎo)致結(jié)構(gòu)和功能的改變。在本研究的18個樣品中,和參考基因組H97相比發(fā)生了以上3種變異的基因數(shù),統(tǒng)計如表4所示。相比國外栽培菌株u1、A15系列,國內(nèi)栽培菌株As2796、W192系列和參考基因組的差異基因數(shù)目較大,這與SNP、SV數(shù)量分析結(jié)果相似。從02分離的不育菌株02-$5與參考基因組有著明顯較少的差異基因,這與它和H97同樣是源自荷蘭的高產(chǎn)類型菌株的單核體有關(guān)。使用BLAST將差異基因與NR、Swiss-Prot、GO、COG、KEGG等數(shù)據(jù)庫比對,獲得了這些基因的注釋,可用于對差異基因功能作進一步的分析。
2.42個菌株之間比較的SNP和InDel數(shù)目
對部分菌株進行兩兩之間的SNP與InDel比較分析(表5),發(fā)現(xiàn)來源接近或農(nóng)藝性狀相近的菌株,其SNP和InDel數(shù)目就較少,比如As2796與其回交菌株W192、W192與其子代192-38、U1與其子代A15等。反過來說結(jié)果也是一致的,不同菌株間SNP和InDel數(shù)目較大的,其生物學(xué)特性和農(nóng)藝性狀差異就大,如國內(nèi)雜交菌株As2796和國外雜交菌株U1、U3、A15,國內(nèi)野生菌株AgLH830與國外野生菌株ARPl59,02,8213與其不育菌株等,其SNP和Indel的數(shù)目是相近菌株的數(shù)倍以上,其中SNP相差4~26倍,Indel相差4~24倍。
3討論與結(jié)論
以As2796為代表的國內(nèi)雜交菌株表現(xiàn)為較高產(chǎn),質(zhì)量優(yōu),耐粗放,適合農(nóng)業(yè)與中國式工廠化栽培模式,適合鮮銷與制罐,而以u1為代表的國外雜交菌株表現(xiàn)為高產(chǎn),產(chǎn)量集中,質(zhì)量一般,不耐粗放,適合歐美工廠化栽培模式,較適合鮮銷。從SNP、SV及差異基因數(shù)目可以看出,國內(nèi)外雜交菌株基因組差異很大。由于As2796的高產(chǎn)親本02與u1的高產(chǎn)親本Somycel9.2(其同核體H97即為參考基因組測序菌株)都是源自歐洲的高產(chǎn)傳統(tǒng)菌株,SNP、SV及差異基因數(shù)目比較也說明它們之間的親緣關(guān)系較為接近,所以可以推斷國內(nèi)外雜交菌株的差異主要源于另一個親本的不同。As2796的優(yōu)質(zhì)親本是老法國種8213,As2796很好地結(jié)合了02的高產(chǎn)與8213的優(yōu)質(zhì)特性,而u1的另一親本為偏高產(chǎn)的米色菌株Somycel53,U1仍主要表現(xiàn)高產(chǎn)的特性,質(zhì)量上不如As2796。因此,As2796系列與U1系列是世界上并列的兩大雙孢蘑菇雜交品系。
國內(nèi)外野生菌株與H97比較的SNP、SV數(shù)量相差也較大,表明它們可能源自較遠的分支,這對創(chuàng)新利用國內(nèi)野生種質(zhì)、育成具有自主知識產(chǎn)權(quán)的新品種意義重大。2個關(guān)系較近的菌株如As2796與W192、W192與192-38,它們之間的SNP、InDel標記可以開發(fā)成鑒別2個菌株的DNA標記,在菌株鑒別或菌種鑒定中比普通的DNA指紋標記更為適用。
本文對18個雙孢蘑菇核心種質(zhì)重測序數(shù)據(jù)進行了初步的統(tǒng)計和分析,獲得了與參考基因組間大量的SNP、InDel和SV位點,提取了18個菌株的一致性序列,并進行了不同菌株之間的分組差異比較,為這些菌株的進一步分析奠定了基礎(chǔ)。接下來將對部分感興趣的差異和標記進行篩選和驗證,以期為菌株鑒別、遺傳分析、雜交育種等篩選一批有用的基因和分子標記。