吳玉珍,黃龍雨,周大云,黃義文,付守陽(yáng),彭軍,匡猛
中國(guó)棉花審定品種SSR指紋庫(kù)的構(gòu)建與綜合評(píng)價(jià)
吳玉珍1,2,黃龍雨1,2,周大云1,2,黃義文1,2,付守陽(yáng)1,2,彭軍1,2,匡猛
1中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所/棉花生物育種與綜合利用全國(guó)重點(diǎn)實(shí)驗(yàn)室,河南安陽(yáng) 455000;2三亞中國(guó)農(nóng)業(yè)科學(xué)院國(guó)家南繁研究院,海南三亞 572024
【目的】棉花是一種異源四倍體作物,基因組結(jié)構(gòu)復(fù)雜,常異花授粉的繁殖方式也導(dǎo)致棉花品種難以實(shí)現(xiàn)高度純合;棉種市場(chǎng)缺乏有效的監(jiān)管技術(shù)手段,品種多亂雜現(xiàn)象長(zhǎng)期存在,嚴(yán)重影響纖維品質(zhì)一致性。構(gòu)建中國(guó)近20年棉花審定品種標(biāo)準(zhǔn)樣品的DNA指紋庫(kù),探索棉花品種高通量SSR身份鑒定模式,為棉花品種真實(shí)性鑒定和新品種特異性鑒定提供依據(jù);分析審定品種的遺傳多樣性和群體分化,為棉花不同生態(tài)區(qū)的適應(yīng)性鑒定和培育適應(yīng)新環(huán)境的品種提供理論基礎(chǔ)?!痉椒ā炕诙嘀豍CR技術(shù)和毛細(xì)管電泳檢測(cè)方法,使用篩選得到的60個(gè)SSR標(biāo)記構(gòu)建1 015份棉花審定品種標(biāo)準(zhǔn)樣品的DNA指紋庫(kù),通過(guò)植物品種DNA指紋庫(kù)管理系統(tǒng)對(duì)審定品種SSR指紋進(jìn)行兩兩比對(duì),分析審定品種的遺傳差異,篩選用于品種鑒定的核心SSR位點(diǎn)。利用聚類(lèi)分析法和群體結(jié)構(gòu)分析法分析1 015份棉花審定品種的遺傳多樣性,并計(jì)算群體間遺傳分化指數(shù)?!窘Y(jié)果】60個(gè)SSR標(biāo)記在1 015個(gè)審定品種中共擴(kuò)增出216種等位變異,平均等位變異數(shù)為3.6,平均值為0.37。1 015個(gè)審定品種的SSR指紋進(jìn)行兩兩比較,共產(chǎn)生513 591組結(jié)果,樣品間最大差異位點(diǎn)數(shù)為58個(gè)。差異位點(diǎn)百分比主要集中在41%—70%,涉及428 115組,占83.36%;其中,差異位點(diǎn)百分比在51%—60%時(shí),涉及組數(shù)最多,為197 829組,占38.52%。品種間差異位點(diǎn)百分比大于20%時(shí),占所有品種兩兩比對(duì)組數(shù)的99%以上,差異位點(diǎn)百分比低于20%的比對(duì)結(jié)果只占0.58%?;诮M合鑒定法,篩選一套包含10個(gè)SSR位點(diǎn)的核心位點(diǎn)組合,在1 015個(gè)品種中鑒別能力達(dá)到99%。聚類(lèi)結(jié)果和群體結(jié)構(gòu)分析表明,1 015個(gè)品種被清晰地劃分為5個(gè)亞群,G1(n=240)為早熟棉亞群,主要分布于中國(guó)北部和西北內(nèi)陸地區(qū),該亞群品種遺傳多樣性最豐富,品種間平均遺傳距離為0.419。G2(n=277)亞群為中熟棉亞群,分布于長(zhǎng)江流域,該亞群雜交種較多,亞群內(nèi)平均遺傳距離為0.309。G3(n=109)亞群屬于早熟、中熟棉亞群,分布于河北黑龍港地區(qū),該亞群品種遺傳組分相對(duì)單一,亞群內(nèi)平均遺傳距離在陸地棉群體中最小,僅為0.150。G4(n=254)亞群屬于中早熟棉亞群,主要分布于黃河流域,群體內(nèi)平均遺傳距離為0.307。G5(n=37)亞群由37份海島棉組成,群體內(nèi)平均遺傳距離最小,為0.149。海島棉與陸地棉之間遺傳分化水平最高,平均ST值為0.503;陸地棉群體內(nèi),G3亞群與其他亞群之間遺傳分化水平最高,ST值為0.193—0.242。長(zhǎng)江流域與黃河流域相比,遺傳分化水平最低,ST值為0.112。【結(jié)論】構(gòu)建了1 015個(gè)中國(guó)近20年審定品種標(biāo)準(zhǔn)樣品DNA指紋庫(kù),篩選了一套包含10個(gè)SSR位點(diǎn)的核心標(biāo)記組合,可以清晰地鑒別99%以上的品種,創(chuàng)建了“核心位點(diǎn)+擴(kuò)展位點(diǎn)”的高通量棉花鑒定模式;1 015個(gè)品種被劃分為5個(gè)亞群,其中,陸地棉具有明顯的地理分布特征。
棉花;標(biāo)準(zhǔn)樣品;SSR標(biāo)記;DNA指紋庫(kù);綜合評(píng)價(jià)
【研究意義】我國(guó)是世界上主要植棉大國(guó),植棉歷史悠久、地域遼闊。近年來(lái),棉花審定品種的數(shù)量逐年增多。截至目前,我國(guó)通過(guò)國(guó)家審定和各省、自治區(qū)審定的棉花品種數(shù)量達(dá)到2 342個(gè)(中國(guó)種業(yè)大數(shù)據(jù)平臺(tái),http://202.127.42.47)。隨著棉花品種遺傳基礎(chǔ)日趨狹窄和骨干親本的集中使用,導(dǎo)致出現(xiàn)了一系列派生品種、近似品種、姐妹系。種子市場(chǎng)上不斷出現(xiàn)“一名多品”“一品多名”、名不符實(shí)的現(xiàn)象,嚴(yán)重打擊了育種者的積極性,侵害了農(nóng)民的利益,給農(nóng)業(yè)生產(chǎn)帶來(lái)不利影響。構(gòu)建棉花審定品種標(biāo)準(zhǔn)DNA指紋庫(kù)有助于凈化棉種市場(chǎng)、打擊套牌侵權(quán)、激發(fā)種業(yè)創(chuàng)新,為品種審定、品種保護(hù)、市場(chǎng)監(jiān)管提供技術(shù)支撐。標(biāo)準(zhǔn)化的DNA指紋圖譜可以為司法仲裁提供客觀的依據(jù)。當(dāng)涉及品種權(quán)益、品種保護(hù)或品種糾紛時(shí),可以通過(guò)比對(duì)DNA指紋圖譜來(lái)確定品種的真實(shí)性和獨(dú)特性,確保知識(shí)產(chǎn)權(quán)的合法保護(hù)。研究棉花審定品種進(jìn)行遺傳多樣性,可以明確現(xiàn)有品種的遺傳背景和系譜關(guān)系,有效指導(dǎo)常規(guī)育種的親本選擇及雜交組合選配,從而顯著提高傳統(tǒng)育種工作效率,支撐種業(yè)振興方案的實(shí)施,推動(dòng)棉花產(chǎn)業(yè)高質(zhì)量發(fā)展?!厩叭搜芯窟M(jìn)展】根據(jù)農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn),趙久然等[1]、王鳳格等[2-3]利用40對(duì)SSR核心引物構(gòu)建了包含3 998個(gè)玉米審定品種標(biāo)準(zhǔn)樣品的DNA指紋庫(kù);劉麗華等[4-6]、趙昌平等[7]利用21對(duì)SSR核心引物構(gòu)建了560個(gè)小麥區(qū)域試驗(yàn)品系的DNA指紋庫(kù),以及使用42對(duì)SSR引物構(gòu)建了75個(gè)小麥品種的DNA指紋庫(kù);林亦霞等[8]利用農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn)NY/T 1433-2014《水稻品種鑒定技術(shù)規(guī)程SSR標(biāo)記法》[9]中48對(duì)SSR核心引物構(gòu)建了94份雜交稻親本的DNA指紋庫(kù)。利用微衛(wèi)星標(biāo)記,程本義等[10]構(gòu)建了279個(gè)浙江省水稻品種的DNA指紋圖譜數(shù)據(jù)庫(kù)。此外,馬鈴薯[11]、黃瓜[12]、大豆[13]、茄子[14]、辣椒[15-16]、花椰菜[17]等多種農(nóng)作物均開(kāi)展了DNA指紋庫(kù)構(gòu)建工作。隨著棉花基因組測(cè)序工作的相繼完成[18-20],棉花品種DNA指紋庫(kù)構(gòu)建和遺傳多樣性研究的報(bào)道也越來(lái)越多??锩偷萚21]利用36對(duì)SSR引物構(gòu)建了32份棉花主栽品種DNA指紋庫(kù);WANG等[22]利用40對(duì)SSR引物構(gòu)建了1 242份棉花DUS測(cè)試樣品的DNA指紋庫(kù)。CHEN等[23]利用398對(duì)SSR引物,對(duì)不同親本來(lái)源、不同選育時(shí)期、不同種植生態(tài)區(qū)的43份陸地棉基礎(chǔ)種質(zhì)進(jìn)行了遺傳多樣性分析;賈子昉等[24]利用38對(duì)SSR引物分析了300份棉花種質(zhì)資源的遺傳背景;郭志軍等[25]采用74個(gè)SSR標(biāo)記對(duì)172份陸地棉自然群體的基因組變異進(jìn)行掃描。HE等[26]利用10 522個(gè)高質(zhì)量SNP位點(diǎn)分析了137個(gè)棉花登記品種的遺傳多樣性和群體結(jié)構(gòu);Hinze等[27]利用63K SNP芯片對(duì)395份棉花種質(zhì)材料進(jìn)行遺傳分析?!颈狙芯壳腥朦c(diǎn)】以往的研究對(duì)象往往是棉花核心種質(zhì)[27-28]、育種材料[29-30]或自然群體[25],很少涉及大量棉花審定品種標(biāo)準(zhǔn)樣品;構(gòu)建的棉花DNA指紋庫(kù)規(guī)模較小,主要用于科學(xué)研究;構(gòu)建指紋庫(kù)所使用的標(biāo)記和建庫(kù)方法不標(biāo)準(zhǔn),無(wú)法用于品種管理、市場(chǎng)監(jiān)管、執(zhí)法和司法仲裁?!緮M解決的關(guān)鍵問(wèn)題】本研究根據(jù)行業(yè)標(biāo)準(zhǔn)《棉花品種真實(shí)性鑒定SSR分子標(biāo)記法》(NY/T 2634—2022)[31],使用60個(gè)SSR標(biāo)記對(duì)來(lái)自官方登記備案的1 015份棉花審定品種標(biāo)準(zhǔn)樣品進(jìn)行了棉花標(biāo)準(zhǔn)DNA指紋庫(kù)構(gòu)建,從分子水平上揭示了審定品種的遺傳多樣性和群體分化,篩選了一套包含10個(gè)SSR位點(diǎn)的核心標(biāo)記組合,創(chuàng)建了“核心位點(diǎn)+擴(kuò)增位點(diǎn)”的高通量棉花鑒定模式,為棉花品種管理、執(zhí)法監(jiān)督和培育新品種提供基礎(chǔ),同時(shí),也為建立公平的品種市場(chǎng)競(jìng)爭(zhēng)環(huán)境提供了技術(shù)支持。
1 015份材料包括617份常規(guī)種和398份雜交種(附表1),品種由1996至2019年國(guó)家或各省、自治區(qū)審定,基本涵蓋了中國(guó)曾經(jīng)或正在推廣的棉花品種。所有樣品經(jīng)農(nóng)業(yè)農(nóng)村部種業(yè)管理司批準(zhǔn),由中國(guó)種質(zhì)資源庫(kù)(北京,中國(guó))提供,系國(guó)家和省級(jí)農(nóng)作物品種審定委員會(huì)向品種選育單位收集的中國(guó)棉花審定品種標(biāo)準(zhǔn)樣品。
60對(duì)SSR引物來(lái)自農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn)《棉花品種真實(shí)性鑒定SSR分子標(biāo)記法》(NY/T 2634—2022)[31],所用SSR引物由美國(guó)Thermofisher公司合成,每對(duì)SSR引物中,選擇在上游引物5′端使用一種熒光染料進(jìn)行標(biāo)記,共選用了PET、NED、VIC、FAM 4種熒光染料,引物序列和熒光標(biāo)記信息見(jiàn)附表2。
每份供試樣品隨機(jī)抽取70粒種子形成混合樣品,充分磨碎后,取100—200 mg粉末于2.0 mL離心管,采用匡猛等[32]棉花種子DNA快速提取法提取棉花基因組DNA。采用酶標(biāo)儀(EPOCH)進(jìn)行DNA質(zhì)量和濃度的測(cè)定,并使用超純水稀釋成40 ng·μl-1的DNA工作液。
采用農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn)《棉花品種真實(shí)性鑒定SSR分子標(biāo)記法》(NY/T 2634—2022)[31],分別使用60對(duì)SSR引物對(duì)1 015份棉花審定品種標(biāo)準(zhǔn)樣品進(jìn)行擴(kuò)增。PCR擴(kuò)增體系20 μL,包括10 μL 2×Taq Plus Master Mix(諾唯贊)、0.2 μmol·l-1SSR引物和120 ng DNA模板。PCR反應(yīng)程序?yàn)?4 ℃ 5 min;94 ℃ 45 s,60 ℃ 45 s,72 ℃ 45 s,32個(gè)循環(huán);72 ℃ 7 min。
按照攜帶不同熒光標(biāo)記的引物毛細(xì)管電泳時(shí)可以自由組合,攜帶相同熒光標(biāo)記的引物,PCR擴(kuò)增產(chǎn)物大小不同時(shí)毛細(xì)管電泳可以自由組合的原則,60個(gè)SSR標(biāo)記組成6個(gè)十重毛細(xì)管電泳組合(表1),等體積取同一組合中10對(duì)引物的擴(kuò)增產(chǎn)物,充分混勻。從混合液中吸取1 μL,加入DNA分析儀專(zhuān)用96孔上樣板上。每孔再分別加入0.15 μL Liz-500分子量?jī)?nèi)標(biāo)和8.85 μL去離子甲酰胺,95 ℃ 5 min,4 ℃冷卻10 min以上,于ABI 3130xl基因分析儀(賽默飛公司)上進(jìn)行電泳檢測(cè)。熒光毛細(xì)管電泳檢測(cè)程序?yàn)轭A(yù)電泳15 kV 3 min;2 kV進(jìn)樣2 s;電泳15 kV 20 min。
毛細(xì)管電泳結(jié)果采用植物品種DNA指紋管理系統(tǒng)(以下簡(jiǎn)稱(chēng)指紋庫(kù)管理系統(tǒng),登記號(hào):2015SR085905)進(jìn)行讀取、儲(chǔ)存與分析比對(duì)。
表1 多重引物組合信息
采用Power marker V3.25軟件[33]分析SSR分子標(biāo)記的等位基因數(shù)、雜合率、遺傳多樣性和多態(tài)性信息量(polymorphism information content,)等。采用類(lèi)平均法(unweighted pair-group methodwith arithmetic means,UPGMA)對(duì)相似系數(shù)矩陣和遺傳距離矩陣進(jìn)行聚類(lèi)分析。使用Structure 2.3.4軟件[34]評(píng)估1 015份棉花審定品種的群體結(jié)構(gòu),基于數(shù)學(xué)模型劃分類(lèi)群。設(shè)定亞群數(shù)K為1—10,每個(gè)K值運(yùn)行10次,參數(shù)Length of burn-in period設(shè)為1.0×104次,MCMC(markov chain monte carlo)設(shè)為1.0×105次;根據(jù)似然值最大原則,并結(jié)合Evanno等[35]的統(tǒng)計(jì)模型,確定最佳K值。使用VCFtools(v.4.0)軟件分析群體間遺傳差異[36],分別計(jì)算每個(gè)群體與其他群體在每個(gè)SSR位點(diǎn)的ST值。
根據(jù)1 015個(gè)審定品種的標(biāo)準(zhǔn)DNA指紋數(shù)據(jù),對(duì)60個(gè)SSR標(biāo)記的總體多態(tài)性情況進(jìn)行全面評(píng)估,對(duì)等位基因數(shù)、基因型數(shù)、遺傳多樣性、雜交種中引物雜合率、值和主要等位基因及頻率多個(gè)參數(shù)進(jìn)行分析(表2)。60個(gè)SSR引物總體多態(tài)性較高,共檢測(cè)到216種等位變異(附表3),平均等位變異數(shù)為3.6。其中,PC29引物的等位變異最豐富,有10種等位基因,27種基因型,說(shuō)明該引物最適合揭示該群體的遺傳多樣性。引物的值與等位基因數(shù)、遺傳多樣性、雜交種中雜合率基本呈正相關(guān),值越高,等位基因數(shù)、遺傳多樣性等指標(biāo)也越高。這套核心引物是使用代表中國(guó)棉花種質(zhì)資源庫(kù)7 362份棉花樣品的419份核心種質(zhì)篩選而來(lái)。棉花審定品種大規(guī)模建庫(kù)數(shù)據(jù),對(duì)引物的評(píng)估結(jié)果與以往的篩選評(píng)估結(jié)果基本一致[37]。
將1 015個(gè)棉花審定品種標(biāo)準(zhǔn)SSR指紋上傳植物品種DNA指紋管理系統(tǒng)(登記號(hào):2015SR085905),常規(guī)種在每個(gè)SSR標(biāo)記中只擴(kuò)增出單條帶,毛細(xì)管電泳對(duì)應(yīng)峰型為單峰(常規(guī)種中棉所64號(hào)SSR指紋圖譜見(jiàn)附圖1),雜交種在SSR標(biāo)記中可能擴(kuò)增出單條帶或2條帶,毛細(xì)管電泳對(duì)應(yīng)峰型為單峰或雙峰(雜交種中棉所72號(hào)SSR指紋圖譜見(jiàn)附圖2)。所有品種的SSR指紋進(jìn)行兩兩比對(duì),共產(chǎn)生513 591組比對(duì)結(jié)果。其中,新海38號(hào)與川雜棉10號(hào)、新海25與華雜棉H11兩組品種間差異位點(diǎn)數(shù)最大,為58個(gè);所有海島棉與陸地棉相比,差異位點(diǎn)均大于34個(gè)。差異位點(diǎn)百分比主要集中在41%—70%,涉及428 115組,占83.36%;其中,差異位點(diǎn)百分比在51%—60%時(shí),涉及組數(shù)最多,為197 829組,占38.52%。品種間差異位點(diǎn)百分比大于20%時(shí),占所有品種兩兩比對(duì)組數(shù)的99%以上;差異位點(diǎn)百分比低于20%的比對(duì)結(jié)果只占0.58%(表3)。
表2 60個(gè)SSR引物擴(kuò)增效果
續(xù)表2 Continued table 2
以等位變異擴(kuò)增片段大小代表變異類(lèi)型The allele amplification fragment size represents the variant type
在品種鑒定中,2個(gè)樣品差異位點(diǎn)百分比低于5%(小于3個(gè)差異位點(diǎn)),需要考慮2個(gè)樣品是近似品種或相同品種。1 015個(gè)樣品比對(duì)結(jié)果中差異位點(diǎn)在0—2共涉及152組,162個(gè)樣品,其中41組(58個(gè)樣品)比對(duì)結(jié)果顯示,2個(gè)樣品之間差異位點(diǎn)為0。該58份樣品已經(jīng)提交審定標(biāo)準(zhǔn)樣品管理機(jī)構(gòu),正在進(jìn)一步核實(shí)是否來(lái)自同一品種,如果來(lái)自同一品種,應(yīng)在標(biāo)準(zhǔn)樣品庫(kù)中將指紋相同的樣品保留一份,其他進(jìn)行合并或清理,如果來(lái)自不同品種,應(yīng)進(jìn)一步提供其他差異。
基于1 015個(gè)樣品60個(gè)SSR位點(diǎn)的基因型數(shù)據(jù),按照引物值從高到低的順序,使用植物品種DNA指紋管理系統(tǒng)分析,當(dāng)選擇表1中值最高的前5個(gè)引物PC29、PC12、PC15、PC13和PC03鑒定1 015個(gè)樣品時(shí),差異位點(diǎn)數(shù)在0—2的有46 446組,占9%。當(dāng)選擇表1中值最高的前10個(gè)引物鑒定1 015個(gè)樣品時(shí),差異位點(diǎn)數(shù)在0—2的有4 557組,占0.9%。當(dāng)選擇表1中值最高的前15個(gè)引物鑒定1 015個(gè)樣品時(shí),差異位點(diǎn)數(shù)在0—2的有1 353組,占0.26%。以此類(lèi)推,每次增加5個(gè)引物,1 015個(gè)樣品之間兩兩比對(duì),差異位點(diǎn)在0—2的組數(shù)不斷較少,其中,大于10個(gè)SSR位點(diǎn)時(shí),不能鑒別的組數(shù)趨于平緩(圖1)。因此,選擇最高的前10個(gè)SSR引物PC29、PC12、PC15、PC13、PC03、PC17、PC21、PC01、PC06和PC07作為核心引物首先用于品種鑒定,其鑒別能力為99.1%。
表3 棉花審定品種遺傳差異分析
圖1 SSR位點(diǎn)組合對(duì)1 015個(gè)樣品的鑒別能力
根據(jù)多重毛細(xì)管電泳組合原則,攜帶相同熒光基團(tuán)的引物,擴(kuò)增的等位變異片段不能重合;攜帶不同熒光基團(tuán)的引物,擴(kuò)增的等位變異片段可以重合。分析10個(gè)核心SSR引物攜帶熒光基團(tuán)類(lèi)型和擴(kuò)增的等位變異片段大小,10個(gè)核心SSR引物可以組成一個(gè)十重毛細(xì)管電泳組合進(jìn)行電泳。當(dāng)10個(gè)核心引物組合不能區(qū)分樣品時(shí),增加剩余的50個(gè)擴(kuò)展引物進(jìn)行鑒定。
使用Structure 2.3.4軟件對(duì)1 015個(gè)標(biāo)準(zhǔn)樣品進(jìn)行群體結(jié)構(gòu)分析,Ln(P(D))值隨假定亞群數(shù)K值的增大而持續(xù)增大(圖2-a),ΔK峰值出現(xiàn)在K為5時(shí)(圖2-b),由此判定,該群體可被分為5個(gè)亞群(G1—G5)(圖2-c)。分析各供試樣品的Q值(某樣品其基因組變異源于第K群體的概率),結(jié)果表明,917份樣品(占90.3%)在某一亞群內(nèi)Q值大于或等于0.5,說(shuō)明這些樣品遺傳組分相對(duì)單一,可以明確劃分到5個(gè)亞群內(nèi);98份樣品(占9.7%)在任一亞群內(nèi)Q值小于0.5,表明這些樣品遺傳組分比較復(fù)雜,無(wú)法明確歸類(lèi),單獨(dú)劃為一個(gè)混合群H。采用基于Nei(1973)遺傳距離的非加權(quán)組平均法(UPGMA)進(jìn)行聚類(lèi)分析(圖2-d),結(jié)果與群體結(jié)構(gòu)分析基本一致。1 015個(gè)棉花品種被清晰地劃為4個(gè)陸地棉亞群和1個(gè)海島棉亞群,不同亞群內(nèi)的品種表現(xiàn)出明顯的地理分布特征(表4)。
G1(n=240)亞群屬于特早熟、早熟棉亞群,主要分布于中國(guó)北部和西北內(nèi)陸地區(qū),包括遼寧南部、新疆大部和甘肅河西走廊一帶;品種主要以早熟的遼棉系列、酒棉系列、新陸早系列等棉花品種為主。該亞群材料間平均遺傳距離最大,為0.419,說(shuō)明此亞群遺傳基礎(chǔ)比較復(fù)雜,表現(xiàn)出較高的遺傳多樣性。G2(n=277)亞群屬于中熟棉亞群,主要分布于長(zhǎng)江流域,包括長(zhǎng)江上游四川盆地丘陵地帶、長(zhǎng)江中游沿江地區(qū)、長(zhǎng)江中游丘陵地區(qū)、長(zhǎng)江下游和南襄盆地。品種主要包含川棉、鄂棉、湘棉、皖棉和贛棉等。G2亞群雜交種較多,共191份,占該亞群的69%,群體內(nèi)平均遺傳距離為0.309。G3(n=109)亞群屬于早熟、中早熟棉亞群,主要分布于河北省黑龍港地區(qū),包括滄州、衡水、邢臺(tái)等地;品種主要包括冀棉、國(guó)欣棉、津棉等。品種遺傳組分相對(duì)單一,亞群內(nèi)平均遺傳距離在陸地棉群體中最小,僅為0.150。G4(n=254)亞群屬于中早熟棉亞群,主要分布于黃河流域,包括華北平原和黃淮平原地區(qū)。品種以魯棉、豫棉、中棉所系列等為主,群體內(nèi)平均遺傳距離為0.307。G5(n=37)亞群由37份海島棉組成,群體內(nèi)平均遺傳距離最小,為0.149。
表4 1 015個(gè)樣品群體結(jié)構(gòu)分析中亞群信息
a:Ln(P(D))與K值變化折線(xiàn)圖;b:利用ΔK估算亞群數(shù)目;c:K=5時(shí)的群體結(jié)構(gòu)圖;d:1 015個(gè)棉花品種聚類(lèi)圖
進(jìn)一步對(duì)群體間的分化程度分析,使用VCFtools(v.4.0)軟件分別計(jì)算每個(gè)群體與其他群體在每個(gè)等位變異位點(diǎn)的ST值,成對(duì)比較亞群間的平均ST值(圖3)。與陸地棉亞群相比,海島棉群體間遺傳分化最大,ST值為0.431—0.563。陸地棉亞群間遺傳分化較小,ST值為0.112—0.242,其中,來(lái)自河北黑龍港地區(qū)的G3亞群與長(zhǎng)江流域的G2亞群之間遺傳分化指數(shù)最大,為0.242,這與G3亞群的品種在地理分布上比較聚集,平均種植緯度相對(duì)較高,而G2亞群的品種平均種植緯度最低有關(guān)。G3亞群與G1(中國(guó)北部和西北內(nèi)陸)和G4(黃河流域)亞群相比,ST值相對(duì)較高,分別為0.198和0.193。G2(長(zhǎng)江流域)與G4(黃河流域)相比,遺傳分化最低,ST值為0.112;G2(長(zhǎng)江流域)與G1(中國(guó)北部和西北內(nèi)陸)相比,ST值為0.129;G1(中國(guó)北部和西北內(nèi)陸)與G4(黃河流域)相比,ST值相對(duì)較低,為0.124。G1、G2和G4之間兩兩比較,ST值都較低,原因可能是長(zhǎng)江流域亞群中雜交種較多,親本中可能含有來(lái)自黃河流域或西北內(nèi)陸的材料,遠(yuǎn)緣雜交提高品種的雜種優(yōu)勢(shì);G1亞群南疆地區(qū)與黃河流域緯度相似,品種在生態(tài)適應(yīng)性上差異較小,兩地區(qū)可以相互引種,所以遺傳分化較小。
圖3 成對(duì)比較亞群間的平均FST值
《中華人民共和國(guó)種子法》規(guī)定申請(qǐng)審定和新品種保護(hù)的品種應(yīng)當(dāng)符合特異性、穩(wěn)定性、一致性的要求(DUS測(cè)試)。隨著棉花骨干親本的集中使用和棉花品種數(shù)量的迅速增加,DUS測(cè)試和品種管理面臨諸多挑戰(zhàn),如周期長(zhǎng),一般要經(jīng)過(guò)2—3年的重復(fù)觀察;受季節(jié)限制,也易受自然災(zāi)害、病蟲(chóng)害等因素的影響;測(cè)試性狀多,工作量大,人工成本高;測(cè)試性狀多數(shù)為多基因控制的數(shù)量性狀,受環(huán)境等因素影響較大,表現(xiàn)為連續(xù)變異,使性狀分級(jí)不明顯。分子標(biāo)記在品種鑒定方面具有許多優(yōu)勢(shì),包括共顯性、高效性以及不受環(huán)境影響。目前,國(guó)內(nèi)外公認(rèn)的農(nóng)作物DNA指紋鑒定技術(shù)主要是SSR標(biāo)記技術(shù)[2, 5-6, 8]和SNP標(biāo)記技術(shù)[38-41]。其中,SSR標(biāo)記具有多態(tài)性高、共顯性遺傳、穩(wěn)定性好的優(yōu)點(diǎn),并且SSR檢測(cè)操作簡(jiǎn)便、對(duì)試驗(yàn)條件要求不高、檢測(cè)成本低,便于在實(shí)驗(yàn)室開(kāi)展工作,被國(guó)際植物新品種保護(hù)聯(lián)盟(International Union for The Protection of New Varieties of Plants,UPOV)推薦為農(nóng)作物品種鑒定優(yōu)選標(biāo)記[42]。我國(guó)建立了玉米[3]、小麥[7]、水稻[9]、向日葵[43]等15種作物SSR標(biāo)記鑒定技術(shù)的農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn),其中,《棉花品種真實(shí)性鑒定SSR分子標(biāo)記法》(NY/T 2634—2022)[31]于2023年3月1日實(shí)施。相比遺傳多樣性分析和遺傳定位研究,由于品種鑒定主要用于品種管理、市場(chǎng)監(jiān)督和司法仲裁,因此更看重SSR標(biāo)記的穩(wěn)定性、重復(fù)性、擴(kuò)增效率和易于判讀的特性。本研究使用60個(gè)SSR標(biāo)記以棉花全基因組測(cè)序數(shù)據(jù)為基礎(chǔ),以48份棉花基礎(chǔ)種質(zhì)10×重測(cè)序數(shù)據(jù)為來(lái)源,使用代表7 362份棉花材料的近400份棉花核心種質(zhì)作為篩選材料[44],通過(guò)變性聚丙烯酰胺凝膠電泳初篩和毛細(xì)管電泳復(fù)篩,自主開(kāi)發(fā)的在基因組上具有單拷貝特性的引物,實(shí)現(xiàn)了四倍體作物二倍化分型,即常規(guī)種在60個(gè)SSR位點(diǎn)全部為單條帶的純合型,雜交種在60個(gè)SSR位點(diǎn)中會(huì)出現(xiàn)單條帶的純合型或2條帶的雜合型,大大降低了數(shù)據(jù)統(tǒng)計(jì)與分析的難度[37]。
品種真實(shí)性是種子的主要質(zhì)量指標(biāo),影響作物的產(chǎn)量和品質(zhì)。劉峰等[45]利用來(lái)自Cotton Marker Database(CMD)數(shù)據(jù)庫(kù)中的11對(duì)首選核心SSR引物對(duì)25個(gè)區(qū)試樣品和32個(gè)審定品種進(jìn)行真實(shí)性鑒定,通過(guò)遺傳相似系數(shù)判定,在遺傳相似系數(shù)為0.984時(shí),參試品系被分為53系。匡猛等[46]利用36對(duì)SSR核心引物對(duì)138個(gè)棉花主栽品種進(jìn)行指紋庫(kù)構(gòu)建,每個(gè)品種檢測(cè)6個(gè)單粒種子DNA,并將3個(gè)差異位點(diǎn)作為判定閾值。王欣怡等[47]利用26對(duì)SSR引物對(duì)10份棉花常規(guī)種進(jìn)行真實(shí)性鑒定,采用非變性聚丙烯酰胺凝膠電泳法,每個(gè)樣品檢測(cè)15個(gè)單株。以往對(duì)棉花品種真實(shí)性鑒定的研究中,樣品量太少,無(wú)法評(píng)估SSR標(biāo)記對(duì)大批量樣品的鑒別能力;每個(gè)樣品檢測(cè)多個(gè)單株的DNA,工作量大,而且選擇的單株太少,統(tǒng)計(jì)學(xué)上沒(méi)有代表性;檢測(cè)方法多為聚丙烯酰胺凝膠電泳,不同批次,不同電泳板的結(jié)果無(wú)法比對(duì)。
本研究使用的60個(gè)SSR標(biāo)記來(lái)自《棉花品種真實(shí)性鑒定SSR分子標(biāo)記法》(NY/T 2634—2022)[31],標(biāo)記的鑒別能力經(jīng)過(guò)大量樣品的驗(yàn)證,標(biāo)記的檢測(cè)效果經(jīng)過(guò)多家單位驗(yàn)證。本文首次使用標(biāo)準(zhǔn)方法為1 015個(gè)棉花標(biāo)準(zhǔn)樣品建立了標(biāo)準(zhǔn)DNA指紋,每個(gè)樣品使用70?;鞓拥腄NA,可以代表樣品的真實(shí)基因型;使用熒光毛細(xì)管電泳法,指紋數(shù)據(jù)上傳到植物品種DNA指紋管理系統(tǒng)中(登記號(hào):2015SR085905),可以隨時(shí)進(jìn)行比對(duì)?;诮M合優(yōu)化算法,篩選了一套具有10個(gè)SSR位點(diǎn)的核心標(biāo)記組合,使用最少的SSR標(biāo)記可以有效區(qū)分99%以上的棉花品種,用于棉花品種的高通量鑒定。在實(shí)際品種鑒定過(guò)程中首先使用含較少標(biāo)記的核心組合對(duì)大量樣本進(jìn)行篩查,有效區(qū)分大多數(shù)品種;對(duì)于無(wú)法區(qū)分的樣品,繼續(xù)使用剩下的標(biāo)記進(jìn)行比對(duì)?!昂诵奈稽c(diǎn)+擴(kuò)展位點(diǎn)”分步鑒定的方法在極大提高檢測(cè)通量的同時(shí)有效節(jié)約了成本,對(duì)于確保棉花品種的真實(shí)性、品種審定以及未來(lái)植物新品種的保護(hù)具有重要意義。
在不同的生態(tài)環(huán)境(如年平均降水量、日照、太陽(yáng)輻射和溫度)下,品種產(chǎn)生趨異適應(yīng),成為遺傳上有差異的、適應(yīng)不同生態(tài)環(huán)境的類(lèi)群,被稱(chēng)為品種的“生態(tài)型”[26]。近年來(lái),我國(guó)植棉地區(qū)發(fā)生了很大的變化,棉區(qū)遷移加劇了研究陸地棉生態(tài)適應(yīng)性的緊迫性,如何快速育成適應(yīng)特定棉區(qū)的品種,是棉區(qū)變遷中亟需解決的問(wèn)題。而親本材料是育種工作的基礎(chǔ),對(duì)育種材料進(jìn)行類(lèi)群劃分,明確育種基礎(chǔ)材料遺傳多樣性、遺傳背景及遺傳結(jié)構(gòu),對(duì)選育新品種具有非常重要的作用。在棉花研究中利用SNP技術(shù)[26, 30, 44]對(duì)不同生態(tài)型進(jìn)行類(lèi)群劃分已有報(bào)道。然而,SNP技術(shù)具有成本高、對(duì)試驗(yàn)條件要求高,不易操作等缺點(diǎn)。本文構(gòu)建的1 015份棉花審定品種標(biāo)準(zhǔn)樣品DNA指紋數(shù)據(jù)庫(kù)首次揭示了中國(guó)近20年棉花審定品種的遺傳多樣性和群體結(jié)構(gòu),聚類(lèi)分析和群體結(jié)構(gòu)分析基本一致,1 015個(gè)棉花審定品種被清晰地劃為5個(gè)生態(tài)亞群,這與前人[26, 30]的研究結(jié)果基本一致。4個(gè)陸地棉群體具有明顯的地理分布特征,其中,西北內(nèi)陸地區(qū)的棉花遺傳多樣性最豐富,長(zhǎng)江流域的品種遺傳多樣性大于黃河流域,河北黑龍港地區(qū)的品種遺傳多樣性最小,研究結(jié)果與郭志軍等[25]、別墅等[48]、劉文欣等[49]的研究結(jié)論基本相似。近20年審定品種的遺傳多樣性低于棉花基礎(chǔ)種質(zhì)[23]和自然群體[25],說(shuō)明在品種選育過(guò)程中由于追求產(chǎn)量和品質(zhì),拋棄了許多遺傳變異,使棉花品種的遺傳多樣性進(jìn)一步降低。在今后的育種工作中,可以更有針對(duì)性地對(duì)材料加以選擇和利用,選擇親本時(shí),除考慮材料間的親緣關(guān)系外,還要考慮其復(fù)雜的遺傳組分,盡可能挑選親緣關(guān)系相對(duì)較遠(yuǎn),遺傳背景不同的材料作為父母本,不僅能夠避免盲目組配,而且省時(shí)省力,加快育種進(jìn)程,獲得可預(yù)見(jiàn)性的優(yōu)勢(shì)品種。
構(gòu)建了1 015份棉花審定品種標(biāo)準(zhǔn)樣品的DNA指紋數(shù)據(jù)庫(kù),并將其分為5個(gè)亞群:中國(guó)北部和西北內(nèi)陸亞群、河北黑龍港亞群、黃河流域亞群、長(zhǎng)江流域亞群和海島棉亞群。篩選了一套包含10個(gè)SSR位點(diǎn)的核心標(biāo)記組合,創(chuàng)建了棉花品種“核心位點(diǎn)+擴(kuò)展位點(diǎn)”的高通量棉花鑒定模式。
[1] 趙久然, 王鳳格, 易紅梅, 田紅麗, 楊揚(yáng). 我國(guó)玉米品種標(biāo)準(zhǔn)DNA指紋庫(kù)構(gòu)建研究及應(yīng)用進(jìn)展. 作物雜志, 2015(2): 1-6, 170.
ZHAO J R, WANG F G, YI H M, TIAN H L, YANG Y. Progress of construction of Chinese maize varieties standard DNA fingerprint database. Crops, 2015(2): 1-6, 170. (in Chinese)
[2] 王鳳格, 楊揚(yáng), 易紅梅, 趙久然, 任潔, 王璐, 葛建镕, 江彬, 張憲晨, 田紅麗, 侯振華. 中國(guó)玉米審定品種標(biāo)準(zhǔn)SSR指紋庫(kù)的構(gòu)建.中國(guó)農(nóng)業(yè)科學(xué), 2017, 50(1): 1-14. doi:10.3864/j.issn.0578-1752.2017. 01.001.
WANG F G, YANG Y, YI H M, ZHAO J R, REN J, WANG L, GE J R, JIANG B, ZHANG X C, TIAN H L, HOU Z H. Construction of an SSR-based standard fingerprint database for corn variety authorized in China. Scientia Agricultura Sinica, 2017, 50(1): 1-14. doi: 10.3864/j. issn.0578-1752.2017.01.001. (in Chinese)
[3] 王鳳格, 易紅梅, 趙久然, 劉平, 張新明, 田紅麗, 堵苑苑. 玉米品種鑒定技術(shù)規(guī)程SSR標(biāo)記法: NY/T 1432-2014. 北京: 中國(guó)農(nóng)業(yè)出版社, 2014.
WANG F G, YI H M, ZHAO J R, LIU P, ZHANG X M, TIAN H L, DU Y Y. Protocol for the Identification of Maize Varieties-SSR Marker Method: NY/T 1432-2014. Beijing: China Agriculture Press, 2014. (in Chinese)
[4] 劉麗華, 劉陽(yáng)娜, 張明明, 李宏博, 龐斌雙, 趙昌平. 我國(guó)75份小麥品種SNP和SSR指紋圖譜構(gòu)建與比較分析. 中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào), 2020, 22(5): 15-23.
LIU L H, LIU Y N, ZHANG M M, LI H B, PANG B S, ZHAO C P.Construction and comparative analysis of SNP and SSR fingerprints of 75 wheat cultivars in China. Journal of Agricultural Science and Technology, 2020, 22(5): 15-23. (in Chinese)
[5] 劉麗華, 龐斌雙, 劉陽(yáng)娜, 邱軍, 李宏博, 張欣, 王娜, 趙昌平. 2009-2014年國(guó)家冬小麥區(qū)域試驗(yàn)品系的遺傳多樣性及群體結(jié)構(gòu)分析. 麥類(lèi)作物學(xué)報(bào), 2016, 36(2): 165-171.
LIU L H, PANG B S, LIU Y N, QIU J, LI H B, ZHANG X, WANG N, ZHAO C P. Genetic diversity and population structure analysis of winter wheat lines from recent national regional trials in China. Journal of Triticeae Crops, 2016, 36(2): 165-171. (in Chinese)
[6] 劉麗華, 龐斌雙, 李宏博, 劉陽(yáng)娜, 福德平, 王娜, 趙昌平. 2009-2015年北京市冬小麥區(qū)域試驗(yàn)品系的DNA指紋分析. 作物雜志, 2016(5): 13-18.
LIU L H, PANG B S, LI H B, LIU Y N, FU D P, WANG N, ZHAO C P. DNA fingerprint analysis of winter wheat lines of Beijing regional trials from 2009 to 2015. Crops, 2016(5): 13-18. (in Chinese)
[7] 趙昌平, 支巨振, 邱軍, 龐斌雙, 劉麗華, 王立新. 主要農(nóng)作物品種真實(shí)性SSR分子標(biāo)記檢測(cè)普通小麥: NY/T 2859-2015. 北京: 中國(guó)農(nóng)業(yè)出版社, 2015.
ZHAO C P, ZHI J Z, QIU J, PANG BS, LIU LH, WANG LX. Variety genuineness testing of main crops with SSR markers-Wheat (L.): NY/T 2859-2015. Beijing: China Agriculture Press, 2015. (in Chinese)
[8] 林亦霞, 王梓辛, 劉歡, 王征, 梁滿(mǎn)中, 戴小軍, 陳良碧. 基于NYT 1433-2014中48對(duì)SSR引物的94份雜交稻親本DNA分子數(shù)字指紋庫(kù)研究. 中國(guó)水稻科學(xué), 2016, 30(6): 593-602.
LIN Y X, WANG Z X, LIU H, WANG Z, LIANG M Z, DAI X J, CHEN L B. Research on DNA molecular digital fingerprint database based on 48 pairs of SSR primers for 94 hybrid rice parents in NYT 1433-2014.Chinese journal of Rice Science, 2016, 30(6): 593-602. (in Chinese)
[9] 徐群, 魏興華, 莊杰云, 呂波, 袁筱萍, 劉平, 張新明, 余漢勇, 堵苑苑. 水稻品種鑒定技術(shù)規(guī)程SSR標(biāo)記法: NY/T 1433-2014. 北京: 中國(guó)農(nóng)業(yè)出版社, 2014.
XU Q, WEI X H, ZHUANG J Y, Lü B, YUAN X P, LIU P, ZHANG X M, YU H Y, DU Y Y. Protocol for the Identification of Rice Varieties-SSR Marker Method: NY/T 1433-2014. Beijing: China Agriculture Press, 2014. (in Chinese)
[10] 程本義, 吳偉, 夏俊輝, 劉鑫, 莊杰云, 楊仕華. 浙江省水稻品種DNA指紋數(shù)據(jù)庫(kù)的初步構(gòu)建及其應(yīng)用. 浙江農(nóng)業(yè)學(xué)報(bào), 2009, 21(6): 555-560.
CHENG B Y, WU W, XIA J H, LIU X, ZHUANG J Y, YANG S H. Construction and application of DNA fingerprint database of rice varieties in Zhejiang Province. Acta Agriculturae Zhejiangensis, 2009, 21(6): 555-560. (in Chinese)
[11] Ghislain M, Nú?EZ J, DEL ROSARIO HERRERA M, PIGNATARO J, GUZMAN F, BONIERBALE M, SPOONER D M. Robust and highly informative microsatellite-based genetic identity kit for potato. Molecular Breeding, 2009, 23(3): 377-388.
[12] ZHANG J, YANG J J, ZHANG L K, LUO J, ZHAO H, ZHANG J N, WEN C L. A new SNP genotyping technology Target SNP-seq and its application in genetic analysis of cucumber varieties.Scientific Reports, 2020, 10: 5623.
[13] WEI Z Y, LI H H, LI J, Yasir A G, QIU L J. Accurate identification of varieties by nucleotide polymorphisms and establishment of scannable variety IDs for soybean germplasm. Acta Agronomica Sinica,2018, 44(3): 315.
[14] LIU W L, QIAN Z W, ZHANG J, YANG J J, WU M S, BARCHI L, ZHAO H Y, SUN H H, CUI Y L, WEN C L. Impact of fruit shape selection on genetic structure and diversity uncovered from genome- wide perfect SNPs genotyping in eggplant. Molecular Breeding, 2019, 39(10): 140.
[15] DU H H, YANG J J, CHEN B, ZHANG X F, ZHANG J, YANG K, GENG S S, WEN C L. Target sequencing reveals genetic diversity, population structure, core-SNP markers, and fruit shape-associated loci in pepper varieties. BMC Plant Biology, 2019, 19(1): 578.
[16] JUNG J K, PARK S W, LIU W Y, KANG B C. Discovery of single nucleotide polymorphism in Capsicum and SNP markers for cultivar identification. Euphytica, 2010, 175(1): 91-107.
[17] YANG Y Y, LYU M J, LIU J, WU J J, WANG Q, XIE T Y, LI H C, CHEN R, SUN D L, YANG Y X, YAO X W.Construction of an SNP fingerprinting database and population genetic analysis of 329 cauliflower cultivars. BMC Plant Biology, 2022, 22(1): 522.
[18] WANG K B, WANG Z W, LI F G, LI F G, YE W W, WANG J Y, SONG G L, YUE Z, CONG L, SHANG H H, ZHU S L, ZHOU C S, LI Q, YUAN Y L, LU C R, WEI L L, GUANG C Y, ZHENG Z Q, YIN Y, ZHANG X Y. The draft genome of a diploid cotton. Nature Genetics, 2012, 44(10): 1098-1103.
[19] LI F G, FAN G Y, WANG K B, SUN F M, YUAN Y L, SONG G L, LI Q, MA Z Y, LU C R, ZHOU C S, CHEN W B, LIANG X M, SHANG H H, LIU W Q, SHI C C, XIAO G H, GOU C Y, YE WW, XU X, ZHANG X Y, WEI H L, LI Z F, ZHANG G Y, WANG J Y, KOHEL R J, PERCY R G, YU J Z, ZHU Y X, WANG J, YU S X, LIU K. Genome sequence of the cultivated cotton.Nature Genetics, 2014, 46(6): 567-572.
[20] ZHANG T Z, HU Y, JIANG W K, FANG L, GUAN X Y, CHEN J D, ZHANG J B, SASKI CA, SCHEFFLER B E, STELLY D M, HULSE-KEMP A M, WAN Q, LIU B L, LIU C X, WANG S, PAN M Q, WANG Y K, WANG D W, YE W X, CHANG L J, ZHANG W P, SONG Q X, KIRKBRIDE R C, CHEN X Y, DENNIS, J L, LLEWELLYN D J, PETERSON D G, THAXTON P, JONES D C, WANG Q, XU X Y, WU H T, ZHOU L, MEI G F, CHEN S Q, TIAN Y, XIANG D, LI X H, DING J, ZUO Q Y, TAO L N, LIU Y C, LI J, LIN Y, HUI Y Y, CAO Z S, CAI C P, ZHU X F, JIANG Z, ZHOU B L, GUO W Z, LI R Q, CHEN Z J, ZHANG H. Sequencing of allotetraploid cotton (L. acc. TM-1) provides a resource for fiber improvement. Nature Biotechnology, 2015, 33(5): 531-537.
[21] 匡猛, 楊偉華, 許紅霞, 王延琴, 周大云, 馮新愛(ài). 中國(guó)棉花主栽品種DNA指紋圖譜構(gòu)建及SSR標(biāo)記遺傳多樣性分析. 中國(guó)農(nóng)業(yè)科學(xué), 2011, 44(1): 20-27. doi: 10.3864/j.issn.0578-1752.2011. 01.003.
KUANG M, YANG W H, XU H X, WANG Y Q, ZHOU D Y, FENG X A. Construction of DNA fingerprinting and analysis of genetic diversity with SSR markers for cotton major cultivars in China.Scientia Agricultura Sinica,2011, 44(1): 20-27. doi: 10.3864/j.issn. 0578-1752.2011.01.003. (in Chinese)
[22] WANG L Y, ZHENG Y S, ZHANG H, WANG D J, WANG M M, WANG H, DUAN L L, LI H, WANG W, GENG H J, CHENG H M, AN C C, HAN R X, LI R Y. Genetic characterization of cotton varieties and genetic threshold value determination for similar variety selection in cotton DUS testing. Genetic Resourcesand Crop Evolution, 2023, 70(8): 2463-2477.
[23] CHEN G, DU X M. Genetic diversity of source germplasm of upland cotton in China as determined by SSR marker analysis. Acta Genetica Sinica, 2006, 33(8):733-745.
[24] 賈子昉,王清連,董娜. 陸地棉種質(zhì)資源的表型及SSR遺傳多樣性分析. 生物技術(shù)通訊, 2019, 30(5): 653-661.
JIA Z F, WANG Q L, DONG N. Phenotype and SSR genetic diversity of upland cotton germplasm resources. Letters in Biotechnology, 2019, 30(5): 653-661. (in Chinese)
[25] 郭志軍, 趙云雷, 陳偉, 李運(yùn)海, 王紅梅, 龔海燕, 桑曉慧. 陸地棉SSR標(biāo)記遺傳多樣性及其與農(nóng)藝性狀的關(guān)聯(lián)分析. 棉花學(xué)報(bào), 2014, 26(5): 420-430.
GUO Z J, ZHAO Y L, CHEN W, LI Y H, WANG H M, GONG H Y, SANG X H. Genetic diversity and association analysis of upland cotton based on SSR markers.Cotton Science, 2014, 26(5): 420-430.(in Chinese)
[26] HE S P, SUN G F, HUANG L Y,YANG D G, DAI P H, ZHOU D Y, WU Y Z, MA X F, DU X M, WEI S J, PENG J, KUANG M. Genomic divergence in cotton germplasm related to maturity and heterosis. Journal of Integrative Plant Biology, 2019, 61(8): 929-942.
[27] Hinze L L, Hulse-Kemp A M, Wilson I W, ZHU Q H, LLEWELLYN D J, TAYLOR J M, SPRIGGS A, FANG D D, ULLOA M, BURKE J J, GIBAND M, LACAPE J M, VAN DEYNZE A, UDALL J A, SCHEFFLER J A, HAGUE S, WENDEL J F, PEPPER A E, FRELICHOWSKI J, LAWLEY C T, JONES D C, PERCY R G, STELLY D M. Diversity analysis of cotton (L.) germplasm using the CottonSNP63K array. BMC Plant Biology, 2017, 17(1): 37.
[28] Campbell B T, Saha S, Percy R, Frelichowski J, JENKINS J N, PARK W, MAYEE C D, GOTMARE V, DESSAUW D, GIBAND M, DU X, JIA Y, CONSTABLE G, DILLON S, ABDURAKHMONOV I Y, ABDUKARIMOV A, RIZAEVA S M, ABDULLAEV A, BARROSO P A V, PáDUA J G, HOFFMANN L V, Podolnaya L. Status of the global cotton germplasm resources. Crop Science, 2010, 50(4): 1161-1179.
[29] FANG L, WANG Q, HU Y, JIA Y H, CHEN J D, LIU B L, ZHANG Z Y, GUAN X Y, CHEN S Q, ZHOU B L, MEI G F, SUN J L, PAN Z E, HE S P, XIAO S H, SHI W J, GONG W F, LIU J G, MA J, CAI C P, ZHU X F, GUO W Z, DU X M, ZHANG T Z. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits. Nature Genetics, 2017, 49(1): 1089-1098.
[30] HE S P, SUN G F, GENG X L, GONG W F, DAI P H, JIAY H, SHI W J, PAN Z E, WANG J D, WANG L Y, XIAO S H, CHEN B J, CUI S F, YOU C Y, XIE Z M, WANG F, SUN J, FU G Y, PENG Z, HU D W, WANG L R, PANG B Y, DU X M. The genomic basis of geographic differentiation and fiber improvement in cultivated cotton.Nature Genetics, 2021, 53(1): 916-924.
[31] 匡猛, 晉芳, 吳玉珍,金石橋, 彭軍, 黃龍雨, 何團(tuán)結(jié), 魏守軍, 周大云, 王延琴, 黃義文, 鄭曙峰.棉花品種真實(shí)性鑒定SSR分子標(biāo)記法: NY/T 2634-2022. 北京: 中國(guó)農(nóng)業(yè)出版社, 2023.
KUANG M, JIN F, WU Y Z, JIN S Q, PENG J, HUANG L Y, HE T J, WEI S J, ZHOU D Y, WANG Y Q, HUANG Y W, ZHENG S F. Cotton (spp. L.) Variety Genuineness Identification-SSR Based Methods: NY/T 2634-2022. Beijing: China Agriculture Press, 2023. (in Chinese)
[32] 匡猛, 楊偉華, 許紅霞, 王延琴, 周大云, 馮新愛(ài). 單粒棉花種子DNA快速提取方法. 分子植物育種, 2010, 8(4): 827-831.
KUANG M, YANG W H, XU H X, WANG Y Q, ZHOU D Y, FENG X A. A rapid method of DNA extraction from single cotton seed. Molecular Plant Breeding, 2010, 8(4): 827-831. (in Chinese)
[33] LIU K J, MUSE S V. PowerMarker: an integrated analysis environment for genetic marker analysis. Bioinformatics, 2005, 21(9): 2128-2129.
[34] Pritchard J K, WEN X, FALUSH D. Documentation for structure software: version 2.3. Chicago: University of Chicago, 2010.
[35] EVANNO G, REGNAUT S, GOUDET J. Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study. Molecular Ecology, 2005, 14(8): 2611-2620.
[36] DANECEK P, AUTON A, ABECASIS G, ALBERS C A, BANKS E, DEPRISTO M A, HANDSAKER R E, LUNTER G, MARTH G T, SHERRY S T, MCVEAN G, DURBIN R, GENOMES PROJECT ANALYSIS GROUP 1000. The variant call format and VCFtools. Bioinformatics, 2011, 27(15): 2156-2158.
[37] WU Y Z, HUANG L Y, ZhOU D Y, FU X Q, LI C, WEI S J, PENG J, KUANG M. Development and application of perfect SSR markers in cotton. Journal of Cotton Research, 2020, 3(1): 21.
[38] TIAN H L, WANG F G, ZHAO J R, YI H M, WANG L, WANG R, YANG Y, SONG W. Development of maizeSNP3072, a high-throughput compatible SNP array, for DNA fingerprinting identification of Chinese maize varieties. Molecular Breeding, 2015, 35(6): 136.
[39] 劉麗華, 龐斌雙, 劉陽(yáng)娜, 李宏博, 王娜, 王拯, 趙昌平. 基于SNP標(biāo)記的小麥高通量身份鑒定模式. 麥類(lèi)作物學(xué)報(bào), 2018, 38(5): 529-534.
LIU L H, PANG B S, LIU Y N, LI H B, WANG N, WANG Z, ZHAO C P. High-throughput identification mode for wheat varieties based on SNP markers. Journal of Triticeae Crops,2018, 38(5): 529-534. (in Chinese)
[40] GREWAL S, HUBBART-EDWARDS S, Yang C Y, DEVI U, BAKER L, HEATH J, ASHLING S, SCHOLEFIELD D, HOWELLS C, YARDE J, ISAAC P, KING I P, KING J. Rapid identification of homozygosity and site of wild relative introgressions in wheat through chromosome-specific KASP genotyping assays. Plant Biotechnology Journal, 2020, 18(3): 743-755.
[41] KUANG M, WEI S J, WANG Y Q, ZHOU D Y, MA L, FANG D, YANG W H, MA Z Y. Development of a core set of SNP markers for the identifcation of upland cotton cultivars in China. Journal of Integrative Agriculture, 2016, 15(5): 954-962.
[42] UPOV I V F T. Guidelines for DNA- profiling: Molecular Marker Selection and Database Construction ( "BMT guidelines"). Geneva: Switzerland: UPOV, 2010.
[43] 張曼, 支巨振, 牛慶杰, 趙建忠, 晉芳, 劉豐澤, 孫墨可, 李慧英, 任雪貞, 田娟, 董玉迪, 張雷, 于學(xué)鵬, 王祉諾, 譚麗萍, 黃緒堂, 于海峰, 劉勝利. 向日葵品種真實(shí)性鑒定SSR分子標(biāo)記法: NY/T 3752-2020. 北京: 中國(guó)農(nóng)業(yè)出版社, 2020.
ZHANG M, ZHI J Z, NIU Q J, ZHAO J Z, JIN F, LIU F Z, SUN M K, LI H Y, REN X Z, TIAN J, DONG Y D, ZHANG L, YU X P, WANG Z N, TAN L P, HUANG X T, YU H F, LIU S L. Sunflower (L.) Variety Genuineness Identification-SSR- Based Methods: NY/T 3752-2020. Beijing: China Agriculture Press, 2020. (in Chinese)
[44] MA Z Y, HE S P, WANG X F, SUN J L, ZHANG Y, ZHANG G Y, WU L Q, LI Z K, LIU Z H, SUN G F, YAN Y Y, JIA Y H, YANG J, PAN Z E, GU Q H, LI X Y, SUN Z W, DAI P H, LIU Z W, GONG W F, WU J H, WANG M, LIU H W, FENG K Y, KE H F, WANG J D, LAN H Y, WANG G N, PENG J, WANG N, WANG L R, PANG B Y, PENG Z, LI R Q, TIAN S L, DU X M. Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield. Nature Genetics, 2018, 50(6): 803-813.
[45] 劉峰, 馮雪梅, 鐘文, 劉玉棟, 陰祖軍, 韓秀蘭, 徐子初, 沈法富. 適合棉花品種鑒定的SSR核心引物的篩選. 分子植物育種, 2009, 7(6): 1160-1168.
LIU F, FENG X M, ZHONG W, LIU Y D, YING Z J, HAN X L, XU Z C, SHEN F F. Screening of SSR Core Primer Pairs for Identificating Cotton Cultivar. Molecular Plant Breeding, 2009, 7(6): 1160-1168.(in Chinese)
[46] 匡猛, 楊偉華, 許紅霞, 王延琴, 周大云, 馮新愛(ài), 張玉翠, 王飛, 蘇暢. 中國(guó)棉花主栽品種DNA指紋數(shù)據(jù)庫(kù)初步構(gòu)建研究. 棉花學(xué)報(bào), 2012, 24(3): 229-237.
KUANG M, YANG W H, XU H X, WANG Y Q, ZHOU D Y, FENG X A, ZHANG Y C, WANG F, SU C. Primary construction of a DNA fingerprint database of leading cotton varieties in China.Cotton Science, 2012, 24(3): 229-237.(in Chinese)
[47] 王欣怡, 艾先濤, 王俊鐸, 梁亞軍, 龔照龍, 鄭巨云, 郭江平, 買(mǎi)買(mǎi)提·莫明, 李雪源. 利用SSR快速鑒定棉花品種真實(shí)性和純度. 作物學(xué)報(bào), 2017, 43(10): 1565-1572.
WANG X Y, AI X T, WANG J D, LIANG Y J, GONG Z L, ZHENG J Y, GUO J P, MAIMAITI M M, LI X Y. Rapid identification system of purity and authenticity in cotton varieties by SSR markers. Acta Agronomica Sinica, 2017, 43(10): 1565-1572.(in Chinese)
[48] 別墅, 孔繁玲, 周有耀, 張光梅, 張群遠(yuǎn), 王孝綱. 中國(guó)3大主產(chǎn)棉區(qū)棉花品種遺傳多樣性的RAPD及其與農(nóng)藝性狀關(guān)系的研究. 中國(guó)農(nóng)業(yè)科學(xué), 2001, 34(6): 597-603.doi:10.3321/j.issn:0578-1752. 2001.06.004.
BIE S, KONG F L, ZHOU Y Y, ZHANG G M, ZHANG Q Y, WANG X G.Genetic diversity analysis of representative elite cotton varieties in three main cotton regions in China by RAPD and its relation with agronomic characteristics. Scientia Agricultura Sinica, 2001, 34(6): 597-603.doi: 10.3321/j.issn:0578-1752.2001.06.004. (in Chinese)
[49] 劉文欣, 孔繁玲, 郭志麗, 張群遠(yuǎn), 彭惠茹, 付小瓊, 楊付新. 建國(guó)以來(lái)我國(guó)棉花品種遺傳基礎(chǔ)的分子標(biāo)記分析. 遺傳學(xué)報(bào), 2003, 30(6): 560-570.
Liu W X, Kong F L, Guo Z L, ZHANG Q Y, PENG H R, FU X Q, YANG F X. An analysis about genetic basis of cotton cultivars in China since 1949 with molecular markers. Acta Genetica Sinica, 2003, 30(6): 560-570.(in Chinese)
Construction of SSR fingerprint library and comprehensive evaluation for approved cotton varieties in China
WU YuZhen1,2, HUANG LongYu1,2, ZHOU DaYun1,2, HUANG YiWen1,2, FU ShouYang1,2, PENG Jun1,2, KUANG Meng1,2
1Institute of Cotton Research, Chinese Academy of Agricultural Sciences/State Key Laboratory of Cotton Biology, Anyang 450001, Henan;2National Nanfan Research Institute (Sanya), Chinese Academy of Agricultural Sciences, Sanya 572024, Hainan
【Objective】Cotton, a heterotetraploid crop with a complex genome structure, faces challenges in achieving high homozygosity due to frequent cross-pollination. The absence of effective technical supervision in the cotton seed market and the persistence of disordered varieties have a negative impact on the consistency of fiber quality. The objectives of this study are threefold: to establish a DNA fingerprint database for approved cotton varieties in China over the past 20 years, to explore a high-throughput SSR identification model for cotton varieties, and to provide a basis for the authentication of existing varieties and the specific identification of new cotton varieties. Additionally, we aim to analyze the genetic diversity and population differentiation among approved varieties. Ultimately, our goal is to provide a theoretical framework for identifying cotton varieties that are well-suited to different ecological regions and for developing varieties that can adapt to new environments.【Method】Based on multiplex PCR technology and capillary electrophoresis detection method, using 60 SSR markers screened to construct a DNA fingerprint library of 1 015 standard samples of cotton approved varieties. Through the plant variety DNA fingerprint library management system, the SSR fingerprints of approved varieties were compared pairwise to analyze the genetic differences of approved varieties and screen the core SSR loci for variety identification. Cluster analysis and population structure analysis were used to analyze the genetic diversity of 1 015 cotton approved varieties and calculate the genetic differentiation index between populations.【Result】60 SSR markers amplified 216 allelic variations in 1 015 approved varieties, with an average of 3.6 allelic variations and a meanvalue of 0.37. When the SSR fingerprints of the 1 015 approved varieties were compared, a total of 513 591 pairwise results were generated, with a maximum of 58 different loci between samples. The percentage of different loci was mainly concentrated at 41%-70%, involving 428 115 groups, accounting for 83.36%. Among them, when the percentage of different loci was at 51%-60%, the largest number of groups was involved, accounting for 197 829 groups, accounting for 38.52%. When the percentage of different loci between varieties was greater than 20%, it accounted for more than 99% of all pairwise comparison groups, and the pairwise comparison results with a percentage of different loci lower than 20% only accounted for 0.58%. Based on the combination identification method, a set of cores SSR loci containing 10 SSR loci was selected, and the discrimination ability among the 1 015 varieties reached 99%. Clustering results and population structure analysis showed that the 1 015 varieties were clearly divided into five subpopulations. G1 (n=240) was an early-maturing cotton subpopulation, mainly distributed in northern and inland regions of China. This subpopulation had the most abundant genetic diversity among varieties, with an average genetic distance of 0.419 between varieties. G2 (n=277) was a medium-maturing cotton subpopulation, distributed in the Yangtze River Basin. This subpopulation had more hybrids, with an average genetic distance of 0.309 within the subpopulation. G3 (n=109) belonged to early-maturing and medium-maturing cotton subpopulations, distributed in Hebei'sHeilonggang region. This subpopulation had relatively simple genetic components, with the smallest average genetic distance among upland cotton subpopulations at only 0.150. G4 (n=254) belonged to a medium-early maturing cotton subpopulation, mainly distributed in the Yellow River Basin. The average genetic distance within this subpopulation was 0.307. G5 (n=37) consisted of 37 sea island cotton samples, with the smallest average genetic distance within the population at only 0.149. The genetic differentiation level between sea island cotton and upland cotton was the highest, with an averageSTvalue of 0.503. Among upland cotton populations, the genetic differentiation level between G3 and other subpopulations was the highest, withSTvalues ranging from 0.193 to 0.242. The genetic differentiation level between the Yangtze River Basin and the Yellow River Basin was the lowest, with anSTvalue of 0.112.【Conclusion】A DNA fingerprint library of standard samples of 1 015 approved varieties in China over the past 20 years was constructed. A set of cores SSR loci containing 10 SSR loci was selected to clearly identify more than 99% of the varieties. A high-throughput cotton identification model of "core loci + extended loci" was created. The 1 015 varieties were divided into five subpopulations, and upland cotton had obvious geographical distribution characteristics.
cotton; standard samples; SSR markers; DNA fingerprint database; comprehensive evaluation
10.3864/j.issn.0578-1752.2024.08.002
2023-11-09;
2024-01-08
三亞崖州灣科技城科技專(zhuān)項(xiàng)(SCKJ-JYRC-2022-62)、棉花生物育種與綜合利用全國(guó)重點(diǎn)實(shí)驗(yàn)室項(xiàng)目(CB2022C08)、農(nóng)業(yè)生物育種重大項(xiàng)目(2022ZD04019)、海南省自然科學(xué)基金聯(lián)合項(xiàng)目(SQ2021ZRLH0113)
吳玉珍,Tel:13629838042;E-mail:15959263920@163.com。通信作者彭軍,Tel:13937228796;E-mail:jun_peng@126.com。通信作者匡猛,Tel:15836313471;E-mail:kuangmeng007@163.com
(責(zé)任編輯 李莉)