摘要 近年來,棉花黃萎病在新疆蔓延,已成為制約當地棉花生產的重要因素之一。運用高通量SNP芯片對344份具有代表性的棉花種質資源進行基因型分析,考察群體在4個環(huán)境(2年2個試驗點)中的黃萎病發(fā)病率表型,并利用混合線性模型(mixed linear model,MLM)進行全基因組關聯(lián)分析。結果表明,棉花黃萎病發(fā)病率與產量、纖維品質存在負相關性。該群體在4個環(huán)境中黃萎病發(fā)病率的廣義遺傳力為40.10%。群體結構分析表明,該群體可分為2個亞群。MLM模型檢測到18個顯著位點,分布在A03、A05、A10、A12、D02、D11和D13。研究結果有助于解析棉花黃萎病抗性的遺傳基礎,為研究棉花黃萎病的致病機制以及指導黃萎病抗性的遺傳改良提供理論參考。
關鍵詞 陸地棉;種質資源;黃萎病發(fā)病率;關聯(lián)分析
中圖分類號 S 562" 文獻標識碼 A
文章編號 0517-6611(2025)04-0001-04
doi:10.3969/j.issn.0517-6611.2025.04.001
開放科學(資源服務)標識碼(OSID):
Genomewide Association Analysis of Verticillium Wilt Mobidity in Upland Cotton Accessions (Gossypium hirsutum L.)
ZHOU Xiaofeng1,CAO Yang2,HE Liangrong3 et al
(1.Cotton Institute,Xinjiang Academy of Agricultural and Reclamation Science/Northwest Inland Region Key Laboratory of Cotton Biology and Genetic Breeding,Ministry of Agriculture and Rural Affairs,Shihezi,Xinjiang 832000;2.Institute of Agricultural Science,Fifth Division of Xinjiang Production and Construction Corps,Shuanghe,Xinjiang 833408;3.Tarim University,Ala'er,Xinjiang 843300)
Abstract In recent years,cotton verticillium wilt disease spread in Xinjiang,has become one of the important factors affecting local cotton production.In this study,a collection of 344 representative cotton accessions were genotyped by the highthroughput SNP array for investigating the phenotype of verticillium wilt at two locations and for two years.The genomewide association study(GWAS)" of disease percentage was performed via the mixed linear model(MLM).The results showed that there was a negative correlation between verticillium wilt incidence and yield and fiber quality.The broad sense heritability of verticillium wilt morbidity in 4 environments was 40.10%.Population structure analysis showed that the group can be divided into 2 subgroups.The MLM model detected 18 significant loci that were distributed on A03,A05,A10,A12,D02,D11,and D13.The present results help to analyze the genetic basis of cotton verticillium wilt resistance and lay the foundation for studying the pathogenic mechanism and guiding the genetic improvement of cotton verticillium wilt resistance.
Key words Upland cotton;Germplasm resources;Verticillium wilt mobidity;Association analysis
基金項目 兵團重點領域科技攻關項目(2024AB001);八師重點研發(fā)計劃項目(2021NY01)。
作者簡介 周小鳳(1975—),女,安徽廬江人,研究員,碩士,從事棉花遺傳育種研究。
收稿日期 2024-01-08
由大麗輪枝菌引起的棉花黃萎病,是影響棉花安全生產的世界性難題[1]。新疆是我國最大的棉花產區(qū),近年來,黃萎病在新疆棉區(qū)蔓延,給棉農造成較大經濟損失,嚴重影響當地棉花產業(yè)的可持續(xù)發(fā)展,提高棉花抗病性迫在眉睫。選育和種植抗黃萎病的棉花品種被認為是防治黃萎病的有效措施,抵抗黃萎病菌侵染已成為選育棉花新品種的重要目標性狀[2]。
目前,由于對棉花抗黃萎病遺傳模式及抗病機制等缺乏系統(tǒng)研究和科學認知,導致棉花抗黃萎病種質材料的篩選、創(chuàng)制和新品種選育受到制約[3]。研究發(fā)現,黃萎病菌分泌的毒素可能是其主要致病因素,其中細胞壁降解酶、脂多糖蛋白復合物以及核蛋白可能是重要的致病成分[4]。王龍等[5]研究發(fā)現,與棉花抗黃萎病性狀相關的22個SSR位點中,能同時在2個以上環(huán)境出現的位點有2個。棉花黃萎病的抗性受多基因協(xié)同控制,可以通過簡化基因組測序的全基因組關聯(lián)分析(GWAS)解析棉花黃萎病抗性的分子遺傳規(guī)律。全基因組關聯(lián)分析是一種基于連鎖不平衡的定位方法,是在全基因組水平上分析數量性狀遺傳構成的重要方法[7]。Li等[6]通過基于簡化基因組測序的棉花黃萎病抗性全基因組關聯(lián)分析,發(fā)現了14個抗病新位點。
與連鎖作圖相比,全基因組關聯(lián)分析具有精確度高、無需專門構建群體、能同時分析同一位點的多個等位基因等優(yōu)點[8-9]。目前,全基因組關聯(lián)分析主要用于研究棉花產量、品質等性狀的遺傳構成,而關于棉花抗病性關鍵位點和候選基因的研究較少[10-11]。該研究以我國不同棉區(qū)種質資源為研究對象,于2018—2019年在新疆博樂和阿拉爾2個黃萎病發(fā)生嚴重地區(qū)進行試驗,通過全基因組關聯(lián)分析,開發(fā)SNP標記,挖掘與抗黃萎病相關的特異性位點,從而為棉花抗黃萎病遺傳改良以及抗黃萎病性狀棉花新品種分子標記輔助選擇提供理論基礎和技術支撐。
1 材料與方法
1.1 試驗材料及田間試驗設計 該試驗采用的334份陸地棉種質資源均由新疆農墾科學院棉花研究所提供,于2018—2019年分別種植于第一師農科所(阿拉爾)和第五師農科所(博樂)黃萎病發(fā)生地。試驗地各點肥力均勻,采用隨機區(qū)組設計,每份材料設2次重復,采用1膜6行種植模式,小區(qū)面積2.3 m2,行距為寬行66.0 cm+窄行10.0 cm,株距9.5 cm,每份材料種植2小行,機械鋪膜打孔,膜上人工點播,膜下滴灌栽培,4個環(huán)境(2年2個試驗點)的田間管理方法同常規(guī)大田生產一致。
1.2 表型性狀調查 黃萎病抗性、產量性狀和纖維品質性狀的調查方法參照杜雄明等[12]的棉花種質資源描述規(guī)范和數據標準。
黃萎病抗性調查:在黃萎病發(fā)病高峰期調查發(fā)病率(DP)和發(fā)病指數(DI);黃萎病依照 DB51/T 1205—2011《棉花黃萎病抗性鑒定技術規(guī)程》進行鑒定[13]。
產量性狀調查:在棉花吐絮后期,每份材料每個重復分別收取中部10個棉鈴,于室內充分干燥后稱量10個棉鈴的籽棉質量,使用SY-50A棉花考種軋花機軋花后稱量皮棉質量(LW),測定單鈴質量(SBW)并計算衣分(LP)。根據試驗小區(qū)的實收籽棉產量計算實收皮棉產量(LAW),實收皮棉產量=實收籽棉產量×衣分。
纖維品質性狀測量:考種完成后,在新疆農墾科學院棉花研究所進行纖維品質性狀測定,棉花纖維檢測儀器為Premier HFT 9000半自動纖維測定儀,檢測溫度26 ℃,相對濕度65%。每份材料每個重復分別取約15 g皮棉樣品,檢測指標包括纖維上半部平均長度(FL)、纖維比強度(FS)、纖維整齊度(FU)、纖維伸長率(FE)和馬克隆值(MV)。
1.3 全基因組重測序檢測SNP及基因型分析 2018年夏天取334份棉花嫩葉樣品送往北京諾禾致源科技股份有限公司進行高通量全基因組重測序。步驟:提取棉花基因組DNA,檢測DNA濃度和質量,取5 μg質量濃度大于1.5 μg/μL且光密度值在1.8~2.0的DNA樣品,采用TruSeq DNA試劑盒(Illumina,圣地亞哥,加利福尼亞,美國)構建測序文庫,檢測合格后的DNA樣品使用Illumina NovaSeq測序平臺進行重測序,讀取長度為雙端150 bp,平均測序深度為6.1倍。
將測序獲得的Raw Reads通過Trimmomatic軟件(version 0.32)[14]除去接頭,經FASTP軟件進行質控后得到Clean Reads,再用BWA軟件[15]將Clean Reads與武漢大學參考基因組(Ghirsutum_TM-1_WHU_genome.standard.fa)比對,剔除堿基質量得分(Q值)小于20的堿基對。進一步用GATK軟件[16]的HaplotypeCaller模塊進行SNP檢測,使用 Plink 軟件從初步獲得的群體SNP中篩選出最小等位基因頻率(MAF)大于0.05、缺失率(MR)小于0.1的SNP用于后續(xù)分析。
2 結果與分析
2.1 表型性狀數據分析 通過BLUP分析,334份棉花種質資源表型發(fā)病率在4個環(huán)境中具有廣泛的變異,在重病地考察群體材料發(fā)病率,發(fā)病率的極差范圍為47.27%~82.48%,發(fā)病率的平均值為68.73%,發(fā)病率的廣義遺傳力為40.10%,其中標準差和變異系數分別為5.56和8.09%。
2.2 黃萎病抗病性及重要農藝性狀間的相關性分析 如圖1所示,10個性狀間的相關性分析產生108對相關系數,范圍為-0.67~0.88。發(fā)病率與發(fā)病指數存在極顯著正相關,而發(fā)病率與實收皮棉產量、單鈴質量、衣分、馬克隆值、纖維整齊度、纖維伸長率存在極顯著負相關,發(fā)病指數與實收皮棉產量、單鈴質量、衣分、纖維上半部平均長度、纖維比強度、馬克隆值、纖維整齊度、纖維伸長率存在極顯著負相關。
產量相關性狀之間,實收皮棉產量與單鈴質量、衣分均表現出極顯著的正相關。
5個纖維品質性狀之間,纖維上半部平均長度與纖維整齊度、纖維比強度、纖維伸長率均呈極顯著正相關;纖維比強度與纖維整齊度和纖維伸長率均表現出極顯著的正相關。
對10個表型性狀進行頻率分析,均比較符合正態(tài)分布,可以進行關聯(lián)分析。
2.3 基因型數據及群體結構分析 將334份陸地棉材料的測序數據與武漢大學參考基因組比對,共檢測到2 366 003個SNP和137 361個InDel, SNP平均密度為1.05/kb,InDel平均密度為0.06/kb,其中A08染色體上的SNP密度最大,A02染色體上的SNP密度最小(表1)。
使用Plink (v1.9)對334份陸地棉材料群體基因型數據進行PCA群體結構分析,結果顯示群體可以劃分為2個明顯的組,PCA的結果作為Q矩陣用于關聯(lián)分析。使用 tassel(v5)計算kinship得到K矩陣(圖2)。
2.4 黃萎病相關性全基因組關聯(lián)分析 使用Tassel(v5) 的MLM模型對發(fā)病率進行關聯(lián)分析,顯著性閾值為-lg (P) =6.28 時,共檢測到18個與黃萎病發(fā)病率顯著關聯(lián)的SNP顯著位點,分布在A03、A05、A10、A12、D02、D11和D13(表2)。
全基因組關聯(lián)分析檢測到的與棉花黃萎病發(fā)病率表型顯著關聯(lián)且穩(wěn)定的位點在A12染色體上鑒定到了顯著峰(圖3A),分別位于12_90567113_SNV、12_90797437_SNV、12_90797546_SNV、12_91032350_SNV、12_94484859_SNV 5個顯著SNP位點(圖3B和C)。
3 討論
3.1 表型數據分析 該研究對334份棉花種質資源發(fā)病率進行考察,分析其在4個環(huán)境下的發(fā)病率表型。結果顯示,中創(chuàng)83、新陸早24號、94052等發(fā)病率低且穩(wěn)定,可推薦作為改良黃萎病抗性的優(yōu)良親本。該研究關于黃萎病抗病性和農藝性狀的相關性分析顯示,棉花黃萎病不僅嚴重影響棉花的產量,對棉花品質也有負面影響,這與Gapare等[3]的研究一致。
3.2 關聯(lián)分析 傳統(tǒng)的棉花育種方法主要通過在黃萎病地的鑒定進行選擇,育種周期長,隨機性較大,而且棉花的黃萎病抗病性極易受環(huán)境的影響,因此利用分子標記的手段,找到與抗黃萎病密切相關的位點,可以加快育種進程。該研究利用多年多環(huán)境的表型數據進行關聯(lián)分析,顯著性閾值為-lg (P)=6.28 時,共檢測到18個與發(fā)病率關聯(lián)的顯著位點,將全基因組關聯(lián)分析檢測到的與棉花黃萎病發(fā)病率表型顯著關聯(lián)且穩(wěn)定的位點進行鑒定,在A12染色體上鑒定到了顯著峰,分別位于12_90567113_SNV、12_90797437_SNV、12_90797546_SNV、12_91032350_SNV、12_94484859_SNV 5個顯著SNP位點。
4 結論
該研究使用Tassel(v5)的MLM模型,利用 90K SNP 芯片對334份棉花種質資源發(fā)病率進行全基因組關聯(lián)分析,群體在4個環(huán)境中發(fā)病率的廣義遺傳力為40.10%,獲得18個顯著關聯(lián)的SNP標記位點,其中A12是攜帶棉花黃萎病抗性基因的熱點區(qū)域,包含12_90567113_SNV、12_90797437_SNV、12_90797546_SNV、12_91032350_SNV和12_94484859_SNV 5個突出位點,這些位點可能是與棉花黃萎病抗性相關的重要位點。
參考文獻
[1] LOCKE T.Compendium of potato diseases[J].Journal of agricultural science,2002,138(4):459-461.
[2]" 賈海紅,郭興啟.棉花GhMAPK7基因抵抗黃萎病菌的分子機理研究:華東六省一市生物化學與分子生物學會2015年學術交流會論文集[C].[出版地不詳]:[出版者不詳],2015:15-16.
[3] GAPARE W,CONATY W,ZHU Q H,et al.Genomewide association study of yield components and fibre quality traits in a cotton germplasm diversity panel[J].Euphytica,2017,213(3):1-22.
[4] 傅明川,李浩,陳義珍,等.利用WGCNA鑒定棉花抗黃萎病相關基因共表達網絡[J].作物學報,2020,46(5):668-679.
[5] 王龍,李黎貝,馬啟峰,等.陸地棉抗黃萎病性狀與SSR標記的關聯(lián)分析[J].新疆農業(yè)科學,2018,55(9):1569-1578.
[6] LI T G,MA X F,LI N Y,et al.Genomewide association study discovered candidate genes of Verticillium wilt resistance in upland cotton (Gossypium hirsutum L.)[J].Plant biotechnology journal,2017,15(12):1520-1532.
[7] 顧明亮,牛文全.全基因組關聯(lián)研究的策略及面臨的挑戰(zhàn)[J].國際遺傳學雜志,2012,35(2):70-81.
[8]" HUANG X,HAN B.Natural variations and genomewide association studies in crop plants[J].Annual review of plant biology,2014,65:531-551.
[9]" NUZHDIN S V,FRIESEN M L,MCINTYRE L M.Genotypephenotype mapping in a postGWAS world[J].Trends genet,2012,28(9):421-426.
[10] 韓貝,王旭文,李保奇,等.陸地棉種質資源抗旱性狀的關聯(lián)分析[J].作物學報,2021,47(3):438-450.
[11] 崔靜,王志城,張新雨,等.棉花 GbSTK 基因調控開花和黃萎病抗性的功能研究[J].作物學報,2021,47(1):30-41.
[12] 杜雄明, 周忠麗.棉花種質資源描述規(guī)范和數據標準[M].北京:中國農業(yè)出版社,2005.
[13] 四川省質量技術監(jiān)督局.棉花黃萎病抗性鑒定技術規(guī)程:DB51/T 1205—2011[S].四川省質量技術監(jiān)督局,2011.
[14] BOLGER A M,LOHSE M,USADEL B.Trimmomatic:A flexible trimmer for Illumina sequence data[J].Bioinformatics,2014,30(15):2114-2120.
[15] LI H,DURBIN R.Fast and accurate short read alignment with BurrowsWheeler transform[J].Bioinformatics,2009,25(14):1754-1760.
[16] MCKENNA A,HANNA M,BANKS E,et al.The Genome Analysis Toolkit: A MapReduce framework for analyzing nextgeneration DNA sequencing data[J].Genome research,2010,20(9):1297-1303.