張素君,唐麗媛,李興河,王海濤,劉存敬,張香云,張建宏
(河北省農(nóng)林科學(xué)院棉花研究所/農(nóng)業(yè)部黃淮海半干旱區(qū)棉花生物學(xué)與遺傳育種重點(diǎn)實(shí)驗(yàn)室/國(guó)家棉花改良中心河北分中心,石家莊050051)
棉花是我國(guó)重要的經(jīng)濟(jì)作物之一[1-2]。我國(guó)陸地棉(Gossypium hirsutumL.)品種遺傳背景較為狹窄,多樣性水平較低,開(kāi)展陸地棉品種資源的遺傳多樣性研究,對(duì)拓展棉花種質(zhì)資源遺傳基礎(chǔ)、指導(dǎo)常規(guī)育種的親本選擇及雜交組合選配、提高棉花育種水平具有重要意義[3]。
棉花產(chǎn)量及重要農(nóng)藝性狀比如株高、單株果枝數(shù)、單株鈴數(shù)、鈴重、衣分、抗病性均屬于數(shù)量性狀,是由復(fù)雜的數(shù)量性狀位點(diǎn)(Quantitative trait locus,QTL)控制的。目前,連鎖作圖法和關(guān)聯(lián)分析法均可用于解析植物數(shù)量性狀遺傳基礎(chǔ),通過(guò)篩選與目標(biāo)性狀緊密連鎖的分子標(biāo)記,將其應(yīng)用于分子標(biāo)記輔助選擇,可極大提高選擇效率,加快育種進(jìn)程[4]。全基因組關(guān)聯(lián)分析(Genome-wide association study,GWAS)較連鎖作圖具有精確度高、不需專(zhuān)門(mén)構(gòu)建群體、同時(shí)分析同一位點(diǎn)的多個(gè)等位基因等優(yōu)勢(shì)[5-6],已被廣泛用于水稻[7]、玉米[8]、大豆[9]、小麥[10]等作物的復(fù)雜表型性狀研究中。
近年來(lái),關(guān)聯(lián)分析方法在棉花相關(guān)性狀上的應(yīng)用越來(lái)越多[1-4,11-22],國(guó)內(nèi)外研究學(xué)者已利用該方法對(duì)棉花纖維品質(zhì)[1,11-13,20-21]、產(chǎn)量性狀[14]、農(nóng)藝性狀[3,14-15,21-22]、抗病性[3,16-17]和抗逆性[18-19]等進(jìn)行關(guān)聯(lián)定位,獲得了多個(gè)與研究性狀相關(guān)的QTLs,但由于產(chǎn)量性狀和重要農(nóng)藝性狀成因復(fù)雜,加之種植環(huán)境的影響,目前可用于輔助選擇的分子標(biāo)記數(shù)量較少,對(duì)控制產(chǎn)量和重要農(nóng)藝性狀的關(guān)鍵位點(diǎn)和主效基因的挖掘仍需繼續(xù)。
河北省是傳統(tǒng)的棉花生產(chǎn)大省,隨著我國(guó)城鎮(zhèn)化進(jìn)程的加快,棉花生產(chǎn)方式發(fā)生巨大變化,對(duì)棉花育種提出了更高的要求[23],而現(xiàn)有陸地棉資源遺傳基礎(chǔ)狹窄,嚴(yán)重制約河北棉花育種的突破。因此,需要在現(xiàn)有育種材料基礎(chǔ)上廣泛搜集陸地棉種質(zhì)資源,發(fā)掘與目標(biāo)性狀相關(guān)的標(biāo)記及主效基因,發(fā)掘優(yōu)異典型材料,為棉花育種擴(kuò)充資源,提高選擇效率。
本研究搜集了147份代表性陸地棉資源材料組成關(guān)聯(lián)群體,通過(guò)對(duì)其產(chǎn)量性狀和重要農(nóng)藝性狀(株高、單株果枝數(shù)、單株鈴數(shù)、鈴重和衣分)進(jìn)行多年多點(diǎn)的表型鑒定,構(gòu)建其表型數(shù)據(jù)庫(kù),選用在棉花基因組上均勻分布、多態(tài)性較好的237 對(duì)SSR標(biāo)記對(duì)供試群體進(jìn)行全基因組掃描,通過(guò)關(guān)聯(lián)分析挖掘與產(chǎn)量及重要農(nóng)藝性狀穩(wěn)定關(guān)聯(lián)的SSR標(biāo)記,以期為棉花分子標(biāo)記輔助選擇育種提供參考信息,同時(shí)為雜交組合選配、品種合理布局提供指導(dǎo)。
本課題搜集了147份陸地棉材料(見(jiàn)《棉花學(xué)報(bào)》網(wǎng)站附表1):包括我國(guó)陸地棉栽培品種69個(gè),按照第一育種單位所在地統(tǒng)計(jì),河北育成品種18個(gè)(育成單位:河北省農(nóng)林科學(xué)院棉花研究所、河北省農(nóng)林科學(xué)院糧油作物研究所、邯鄲市農(nóng)業(yè)科學(xué)院等地);新疆品種17個(gè)(育成單位:新疆石河子棉花研究所、新疆農(nóng)墾科學(xué)院棉花所、新疆富全新科種業(yè)公司等);河南15個(gè)(育成單位:中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所、河南省農(nóng)業(yè)科學(xué)院等地);山東13個(gè)(山東棉花研究中心等);江蘇2個(gè);美國(guó)岱字棉公司2個(gè);山西1個(gè);北京1個(gè)。來(lái)自于國(guó)內(nèi)外的各類(lèi)型資源50份,此外,還包含資源經(jīng)多年改良后形成的各類(lèi)型育種材料28個(gè)。
147份材料采用隨機(jī)區(qū)組試驗(yàn)設(shè)計(jì),每個(gè)材料設(shè)置3 行區(qū),每行25 株以上,設(shè)3個(gè)重復(fù),按常規(guī)田間管理。調(diào)查147份棉花材料在3個(gè)環(huán)境(石家莊、邢臺(tái)威縣、滄州海興)、2~3個(gè)播期(2013—2015、2014—2015、2014—2015)的產(chǎn)量及農(nóng)藝性狀,本文中3個(gè)地點(diǎn)分別用SJZ,WX 和HX 表示。
7—8月調(diào)查石家莊試點(diǎn)供試材料的株高(Plant height,PH)、單株果枝數(shù)(Fruit branch number,FBN)和單株鈴數(shù)(Boll number,BN),每個(gè)材料隨機(jī)取行中間20 株進(jìn)行調(diào)查,取3 次重復(fù)的平均值。9月25日左右選收3個(gè)試驗(yàn)點(diǎn)正常吐絮中部棉鈴30個(gè),考種獲得鈴重(Boll weight,BW)和衣分(Lint percentage,LP)數(shù)據(jù)。
取幼嫩棉花葉片按照改良的CTAB 法提取基因組DNA[24],選用612 對(duì)SSR 引物對(duì)表型差異較大的24份供試材料進(jìn)行多態(tài)引物篩選,篩選出237 對(duì)條帶差異清晰的SSR 引物,引物序列來(lái)自CottonGen(http://www.com.cottongen.org/)數(shù)據(jù)庫(kù),引物在陸地棉26條染色體均有分布,引物染色體上的位置參考Liang等[25]構(gòu)建的連鎖圖譜(見(jiàn)《棉花學(xué)報(bào)》網(wǎng)站附表2)。PCR(Polymerase chain reaction) 反應(yīng)體系為10 μL,模板DNA 濃度調(diào)至25~40 ng·μL-1,取1.0 μL,天根2×Taq RCR Master Mix 5 μL,將引物濃度調(diào)至10 μmol·L-1,上下游引物各取0.5 μL,ddH2O 3 μL。PCR 反應(yīng)程序?yàn)椋?5 ℃預(yù)變性4 min,94 ℃變性45 s,55~58 ℃退火45 s,72 ℃延伸1 min,30~33個(gè)循環(huán),72 ℃延伸10 min,利用8%聚丙烯酰胺凝膠電泳對(duì)RCR 產(chǎn)物進(jìn)行分離,參考張軍等[26]方法銀染,采用0、1 統(tǒng)計(jì)方法統(tǒng)計(jì)帶型。
各表型性狀描述統(tǒng)計(jì)和Boxplot 圖繪制采用SPSS19.0[27]軟件,引物的多態(tài)性信息(Polymor phism information content,PIC)計(jì)算利用Power-Marker 3.25[28]軟件,該群體遺傳結(jié)構(gòu)估測(cè)采用Structure 2.2 軟件[29],利用Evanno等[30]提出的ΔK值方法確定合適K值,具體參數(shù)參照張素君等[31]設(shè)置,關(guān)聯(lián)分析采用Tassel 2.1[32]軟件,選擇一般線性模型(General linear model,GLM)程序進(jìn)行分析。
對(duì)2013—2015年147份陸地棉材料的5 項(xiàng)產(chǎn)量及農(nóng)藝性狀進(jìn)行統(tǒng)計(jì)(表1),變異系數(shù)最大的性狀是單株鈴數(shù)(18.03%~23.32%),平均達(dá)21.06%;其他性狀變異系數(shù)較大的有株高(15.02%~16.50%)和鈴重(11.23%~14.58%),平均值分別為15.74%和13.11%;衣分變異系數(shù)最?。?.44%~8.16%),平均值為7.28%。5個(gè)性狀多環(huán)境下平均變異系數(shù)的變幅在7.28%~21.06%,平均值為13.47%,這表明供試群體具有較為豐富的表型多樣性。各性狀的平均偏度系數(shù)值在-1.42~0.64之間,除2013年單株果枝數(shù)外,其他年份各性狀的平均峰度系數(shù)值均在-0.34~2.11 之間,偏度系數(shù)和峰度系數(shù)絕對(duì)值均較小,說(shuō)明147份材料的5個(gè)性狀整體上符合正態(tài)分布,為關(guān)聯(lián)分析提供良好的表型數(shù)據(jù)基礎(chǔ)。利用Boxplot 圖描述各性狀不同環(huán)境下的穩(wěn)定性(圖1),同一個(gè)試驗(yàn)點(diǎn)不同年份變化趨勢(shì)較穩(wěn)定的為株高和鈴重,波動(dòng)幅度較大的為衣分和單株鈴數(shù)。同一年份不同試驗(yàn)點(diǎn)間波動(dòng)幅度較大的為鈴重。這些在不同環(huán)境中波動(dòng)較大的性狀可能更易受到水肥條件和氣候變化的影響。
對(duì)5 性狀與不同環(huán)境或播期進(jìn)行相關(guān)性分析(表2),鈴重、衣分、單株果枝數(shù)、單株鈴數(shù)和株高在不同環(huán)境或播期均呈極顯著相關(guān)(P<0.01),表明研究性狀在多個(gè)環(huán)境下重復(fù)性較好。對(duì)5個(gè)性狀之間相關(guān)性進(jìn)行分析:?jiǎn)沃旯?shù)、株高和單株鈴數(shù)三者之間在同一地點(diǎn)3個(gè)年份中均呈極顯著正相關(guān),株高和鈴重在不同環(huán)境中均呈極顯著正相關(guān)。其他性狀相關(guān)性未達(dá)到所有環(huán)境中均極顯著相關(guān)水平。
237 對(duì)標(biāo)記在147份陸地棉中共檢測(cè)到281個(gè)多態(tài)性位點(diǎn),各位點(diǎn)上等位基因數(shù)的范圍為2~6個(gè),涉及690個(gè)等位基因,平均每個(gè)位點(diǎn)2.455 0個(gè)(見(jiàn)《棉花學(xué)報(bào)》網(wǎng)站附表2)。其中檢測(cè)到2個(gè)以上等位變異位點(diǎn)的標(biāo)記93個(gè),占比33.10%。多態(tài)性信息含量(PIC)變幅為0.007 2(NAU3816)~0.594 3(NAU3967),平均值為0.216 5;基因多樣性指數(shù)變異范圍為0.007 2(NAU3816)~0.661 3(NAU3967),平均為0.259 2,基因多樣性指數(shù)和PIC 值均大于平均數(shù)占比為46.60%,表明本研究選用標(biāo)記基因多樣性偏低。
表1 陸地棉材料各性狀數(shù)據(jù)分析Table 1 Statistic analysis of cotton traits
利用Structure 2.2 軟件中的混合模型聚類(lèi)分析法進(jìn)行群體遺傳結(jié)構(gòu)分析,參照Evanno等[30]的方法,K值范圍1~10 計(jì)算Ln(P(D))和ΔK值(圖2),Ln(P(D))值曲線上升,在K=7時(shí)出現(xiàn)最大值,同時(shí)ΔK在K=7時(shí)出現(xiàn)拐點(diǎn),推斷供試群體中具有7個(gè)遺傳結(jié)構(gòu)不同的亞群(圖3),參考Yang等[33]的分類(lèi)方法,亞群中個(gè)體概率大于或等于0.6時(shí),被分配到相應(yīng)聚類(lèi)的亞群;亞群中個(gè)體概率小于0.6時(shí),個(gè)體被分到混合類(lèi)群。據(jù)此,73個(gè)個(gè)體被歸為7個(gè)亞群,這7個(gè)亞群分別命名為POP1 至POP7,POP1~POP7 占比分別為9.52%、4.76%、8.16%、8.84%、8.84%、0.68%、8.84%;其余74個(gè)個(gè)體被歸為混合類(lèi)群,占比50.34%。亞群分類(lèi)和材料的選育單位和來(lái)源無(wú)明顯對(duì)應(yīng)關(guān)系,各材料所屬亞群見(jiàn)《棉花學(xué)報(bào)》網(wǎng)站附表1。
2013—2015年對(duì)5個(gè)產(chǎn)量及農(nóng)藝相關(guān)性狀進(jìn)行全基因組關(guān)聯(lián)分析,GLM 分析結(jié)果顯示:能在3個(gè)環(huán)境/年份及以上檢測(cè)到的與產(chǎn)量性狀顯著關(guān)聯(lián)的標(biāo)記位點(diǎn)共有46個(gè)(P<0.01),其中與鈴重關(guān)聯(lián)的位點(diǎn)45個(gè),與衣分顯著關(guān)聯(lián)的位點(diǎn)1個(gè)。能在2個(gè)及以上環(huán)境檢測(cè)到與農(nóng)藝性狀顯著關(guān)聯(lián)的標(biāo)記位點(diǎn)共有9個(gè),與單株果枝數(shù)、單株鈴數(shù)和株高顯著關(guān)聯(lián)的分別有1、4 和4個(gè)(表3)。
表2 陸地棉各性狀相關(guān)系數(shù)Table 2 Correlation coefficients of cotton traits
圖1 2013—2015年鈴重(A)、衣分(B)、單株果枝數(shù)(C)、單株鈴數(shù)(D)和株高(E)性狀箱圖Fig. 1 The boxplot of boll weight(A), lint percentage(B), fruit branch number(C), boll number(D), and plant height(E)from 2013 to 2015
圖2 K 值與Ln(P(D))、ΔK的折線圖Fig. 2 Lines chart of with Ln(P(D)) and ΔK
圖3 147份陸地棉材料的群體結(jié)構(gòu)Fig. 3 The population structure of 147 upland cotton germplasm
在7個(gè)環(huán)境中均能檢測(cè)到與鈴重顯著關(guān)聯(lián)的標(biāo)記位點(diǎn)有4個(gè),分別為BNL226-1、BNL2440、BNL2651 和BNL2652,解釋表型變異率平均值分別為7.65%、9.89%、8.71%和8.45%。在6個(gè)環(huán)境中檢測(cè)到與鈴重顯著關(guān)聯(lián)的位點(diǎn)有8個(gè),其中DPL0492 解釋表型變異率平均值較高,達(dá)10.18%。在3個(gè)環(huán)境/年份及以上檢測(cè)到的與鈴重性狀顯著關(guān)聯(lián)的標(biāo)記位點(diǎn)中,JESPR153 在2014年威縣試點(diǎn)表型解釋率最高,達(dá)19.30%,其在3個(gè)環(huán)境/年份均重復(fù)檢測(cè)到,表型變異解釋率平均值達(dá)17.46%;與衣分顯著關(guān)聯(lián)的標(biāo)記僅有BNL193-2 在4個(gè)環(huán)境中重復(fù)檢測(cè)到,表型變異解釋率范圍為7.65 %~11.58 %,平均值為9.50%,其余位點(diǎn)在不同環(huán)境中重復(fù)檢出率較差。
2014年和2015年均檢測(cè)到標(biāo)記BNL2448與單株果枝數(shù)顯著關(guān)聯(lián),表型變異解釋率最高為9.96%;4個(gè)標(biāo)記位點(diǎn)在2個(gè)年份均被檢測(cè)到與單株鈴數(shù)顯著關(guān)聯(lián),表型變異解釋率最高達(dá)7.00 %;有4個(gè)標(biāo)記位點(diǎn)在2個(gè)年份均被檢測(cè)到與株高顯著關(guān)聯(lián),表型變異解釋率均較低,平均為4.88%。
在標(biāo)記BNL2448 附近同時(shí)檢測(cè)到與鈴重、單株果枝數(shù)和株高顯著關(guān)聯(lián)的位點(diǎn),在標(biāo)記JESPR220-1 附近同時(shí)檢測(cè)到與鈴重和單株鈴數(shù)顯著關(guān)聯(lián)的位點(diǎn)。
表3 與棉花各性狀在不同環(huán)境下顯著(P<0.01)SSR關(guān)聯(lián)的位點(diǎn)(GLM)Table 3 SSR loci detected significantly(P<0.01) associated with cotton traits in different environments(GLM)
表3 (續(xù))Table 3 (Contined)
表3 (續(xù))Table 3 (Contined)
關(guān)聯(lián)分析是以標(biāo)記位點(diǎn)間的連鎖不平衡(LD)為基礎(chǔ)的,棉花是常異花授粉作物,LD 水平較低,進(jìn)行有效的全基因組關(guān)聯(lián)分析需要約1 000個(gè)以上的多態(tài)性標(biāo)記[2]。本研究盡量在全基因組范圍內(nèi)篩選標(biāo)記,而由于SSR標(biāo)記具有低通量、耗時(shí)費(fèi)工的缺點(diǎn)[34],僅選取了分布于26條染色體上的237個(gè)SSR標(biāo)記進(jìn)行關(guān)聯(lián)分析,由于所選SSR 引物大部分來(lái)源于海陸圖譜,使得SSR引物在所選陸地棉中檢測(cè)的等位變異數(shù)目和基因多樣性平均值偏低,檢測(cè)效率較低。同時(shí)由于篩選的SSR 引物密度較低,導(dǎo)致標(biāo)記之間的遺傳區(qū)域較大,難以快速挖掘目標(biāo)位點(diǎn)和基因。但值得肯定的是,通過(guò)全基因組范圍內(nèi)的SSR標(biāo)記掃描,可以鎖定與性狀關(guān)聯(lián)的區(qū)域,為今后棉花產(chǎn)量和重要農(nóng)藝性狀的分子標(biāo)記輔助選擇及相關(guān)性狀精細(xì)定位提供指導(dǎo)。
群體結(jié)構(gòu)是影響關(guān)聯(lián)分析結(jié)果的重要因素,亞群的混合會(huì)導(dǎo)致假陽(yáng)性結(jié)果增加[34-35]。本研究中利用Structure 軟件將147份供試材料進(jìn)行分類(lèi)時(shí)發(fā)現(xiàn),ΔK在K=7時(shí)出現(xiàn)拐點(diǎn),推斷供試群體中具有7個(gè)遺傳結(jié)構(gòu)不同的亞群,POP1包含7個(gè)栽培品種(中棉所79、晉棉38、冀優(yōu)768、冀棉616、冀3927、創(chuàng)優(yōu)棉9號(hào)、126系9)、5份育種材料(冀選系120、冀棉18、冀選系258、冀1467系、冀1535系)和2份資源材料(朝鮮2號(hào)、邯鄲305);POP2包含4個(gè)栽培品種(柳棉2號(hào)、魯棉研36號(hào)、魯棉研28號(hào)、魯6269)和2份育種材料(冀3068系、JMX-3)和1份資源材料(中1010);POP3包含11個(gè)栽培品種(新陸早1號(hào)、新陸早12號(hào)、新陸早13號(hào)、冀棉11號(hào)、新陸早8號(hào)、新陸早22號(hào)、新陸中1號(hào)、新陸中18號(hào)、冀122、新陸中44號(hào)、新陸中35號(hào))和1份資源材料(中0102X-10-1),大部分為新疆棉區(qū)品種;POP4包含3個(gè)栽培品種(鑫秋1號(hào)、冀151 和中棉所69)、9份資源材料和1份育種材料;POP5包含6個(gè)栽培品種(中棉所36、徐州142、中棉所49、邯無(wú)198、中棉所45、中棉所16)、5份資源材料和2個(gè)育種材料;POP6 僅包含1份資源材料(石抗538);POP7包含5個(gè)栽培品種(新陸中8號(hào)、銀瑞361、錦科棉9號(hào)、冀228、冀豐107)、6份育種材和2份資源材料;其余50.34%材料被歸為混合類(lèi)群。上述分類(lèi)反映了棉花優(yōu)質(zhì)資源在不同棉區(qū)廣泛交流,選育單位與群體結(jié)構(gòu)劃分相關(guān)性不大。不同育種單位常常選取同一優(yōu)異品種(系)或其近緣品系作為親本材料選育品種,這可能是造成我國(guó)陸地棉遺傳基礎(chǔ)狹窄的一個(gè)重要原因。若品種選育過(guò)程中利用的優(yōu)異資源過(guò)于單一,將來(lái)育成品種將嚴(yán)重同質(zhì)化,且難以突破現(xiàn)有瓶頸,創(chuàng)制新型優(yōu)異資源將是解決問(wèn)題的一個(gè)途徑。
本研究為了盡量減少環(huán)境因素對(duì)關(guān)聯(lián)結(jié)果的影響,采取了多年多點(diǎn)試驗(yàn),保留在不同環(huán)境或者年份重復(fù)檢出率較高的位點(diǎn),將獲得的位點(diǎn)與前人關(guān)聯(lián)分析結(jié)果進(jìn)行比較[2-3,20-22],在JESPR153附近同時(shí)檢測(cè)到與鈴重關(guān)聯(lián)的QTL 位點(diǎn);而在此標(biāo)記附近同時(shí)檢測(cè)到與株高和衣分關(guān)聯(lián)的QTLs,雖然對(duì)應(yīng)性狀不完全一致,但均表明此位點(diǎn)和株高及產(chǎn)量性狀緊密連鎖[2,22]。本研究中的大多關(guān)聯(lián)位點(diǎn)未見(jiàn)報(bào)道,可能是由于標(biāo)記重合度較低,加之一些QTLs 受到環(huán)境和研究材料的影響較大,在不同分析條件下檢出結(jié)果不同。
本研究中發(fā)現(xiàn)2個(gè)標(biāo)記與多個(gè)性狀相關(guān),這可能是由于不同性狀存在內(nèi)在聯(lián)系,利用相關(guān)標(biāo)記有可能實(shí)現(xiàn)多個(gè)性狀協(xié)同改良。此外,本研究檢測(cè)出的多環(huán)境下與產(chǎn)量和重要農(nóng)藝性狀相關(guān)的穩(wěn)定位點(diǎn)值得進(jìn)一步研究。今后可根據(jù)結(jié)果劃定關(guān)聯(lián)區(qū)域,在關(guān)聯(lián)區(qū)域結(jié)合基因功能注釋開(kāi)發(fā)高密度的SNP標(biāo)記,獲得與目標(biāo)性狀緊密連鎖的標(biāo)記位點(diǎn),應(yīng)用到相關(guān)性狀的輔助選擇中,加快品種選育進(jìn)程,并為今后實(shí)現(xiàn)產(chǎn)量和重要農(nóng)藝性狀主效QTLs的精細(xì)定位及候選基因挖掘提供參考。
利用關(guān)聯(lián)分析可以對(duì)產(chǎn)量及農(nóng)藝性狀進(jìn)行相關(guān)標(biāo)記位點(diǎn)挖掘。本研究通過(guò)利用SSR標(biāo)記對(duì)多環(huán)境下陸地棉的鈴重、衣分、單株果枝數(shù)、單株鈴數(shù)和株高性狀進(jìn)行關(guān)聯(lián)分析,獲得了多環(huán)境重復(fù)檢測(cè)到的QTLs,其中穩(wěn)定存在的、對(duì)表型影響較大的QTLs 值得進(jìn)一步研究。為今后分子標(biāo)記輔助選擇提供依據(jù),為相關(guān)基因的精細(xì)定位提供參考。