盧鈺霞,張再君,田志宏*
(1.長江大學(xué)生命科學(xué)學(xué)院濕地生態(tài)與農(nóng)業(yè)利用教育部工程研究中心 澇漬災(zāi)害與濕地農(nóng)業(yè)湖北省重點實驗室,湖北 荊州 434025;2.湖北省農(nóng)業(yè)科學(xué)院糧食作物研究所 糧食作物種質(zhì)創(chuàng)新與遺傳改良湖北省重點實驗室,湖北 武漢 430064)
水稻是重要的糧食作物之一,是全球約一半人口的主食。為滿足隨人口增長及經(jīng)濟快速發(fā)展帶來的日益增加的糧食需求,迫切需要進一步提高水稻產(chǎn)量。在適宜的生長環(huán)境中,水稻產(chǎn)量主要由每穗粒數(shù)、粒重和單株有效穗數(shù)決定[1-2]。水稻產(chǎn)量性狀高度復(fù)雜,由多個子性狀決定。例如,每穗粒數(shù)主要由小穗結(jié)實率和穗型決定,其中穗型由分枝的數(shù)量、長度和小穗密度組成[3]。此外,小穗內(nèi)的小花數(shù)也是影響每穗粒數(shù)形成的一個重要因素[3-4]。水稻高產(chǎn)育種時,千粒重是決定產(chǎn)量的三要素之一,主要受粒型影響,粒型又取決于籽粒的長度、寬度及厚度3個子性狀[1]。每株有效穗數(shù)則取決于水稻的分蘗勢力[5]。
水稻產(chǎn)量屬于復(fù)雜的數(shù)量性狀,受多基因協(xié)調(diào)控制,同時也受環(huán)境因素影響[6]。從水稻品種中挖掘與水稻產(chǎn)量或產(chǎn)量相關(guān)子性狀的相關(guān)基因,了解其遺傳和分子機制,可為水稻產(chǎn)量性狀改良提供新策略。當前,QTL作圖(quantitative trait locus mapping)和關(guān)聯(lián)作圖(association mapping)是鑒定植物數(shù)量性狀相關(guān)基因及基因功能表征的有效手段[7-9]。近幾十年來,通過QTL作圖和關(guān)聯(lián)作圖,已成功鑒定得到許多與水稻重要農(nóng)藝性狀相關(guān)的位點或候選基因[10-12]。其中,關(guān)聯(lián)作圖又稱關(guān)聯(lián)分析(association analysis)或連鎖不平衡作圖(linkage disequilibrium mapping,LD mapping),是基于連鎖不平衡,根據(jù)遺傳標記和性狀之間的相關(guān)性強度來檢測和定位數(shù)量性狀位點的方法。與QTL作圖相比較,關(guān)聯(lián)作圖具有以下幾個優(yōu)勢:(1)關(guān)聯(lián)作圖具有更高的定位分辨率,可達到單基因水平;(2)關(guān)聯(lián)作圖研究對象一般為自然群體,可減少構(gòu)建定位群體的時間;(3)關(guān)聯(lián)作圖可同時對多個等位基因進行分析,增加等位基因數(shù)量[13-14]。基于以上優(yōu)勢及測序成本的降低,關(guān)聯(lián)分析成了植物遺傳研究的熱點手段之一,并在水稻遺傳研究中發(fā)揮了重要作用。
本文主要概述關(guān)聯(lián)分析的基本原理及分析策略,簡述關(guān)聯(lián)分析在水稻產(chǎn)量性狀遺傳研究中的進展,并探討關(guān)聯(lián)分析在水稻高產(chǎn)育種中的應(yīng)用前景。
關(guān)聯(lián)分析的理論基礎(chǔ)是連鎖不平衡(linkage disequilibrium,LD),連鎖不平衡又稱配子不平衡或配子相不平衡,是指不同基因座等位基因之間非隨機關(guān)聯(lián)。與連鎖(linkage)不同的是,LD是指群體中等位基因之間的相關(guān)性,而連鎖是指基因座通過染色體上的物理連接而產(chǎn)生的相關(guān)遺傳[15]。群體內(nèi)的LD是突變、重組和其他一些因素累積產(chǎn)生的結(jié)果,位點間緊密的連鎖可能會導(dǎo)致高程度的LD,同一染色體或者不同染色體的基因座之間均可出現(xiàn)連鎖不平衡狀態(tài)[14]。LD在關(guān)聯(lián)分析中起重要的作用,LD持續(xù)的距離將決定用于關(guān)聯(lián)分析的標記數(shù)量和密度[16-17]。
LD是指2個或2個以上基因座的等位基因的非隨機關(guān)聯(lián),統(tǒng)計的是不同位點間等位基因單倍型的實際觀測頻率與期望頻率之間的差值。假如有2個基因座A、B,其等位基因分別為A、a和B、b,構(gòu)成單倍型有AB、Ab、aB、ab。4個等位基因的頻率分別為PA、Pa、PB、Pb;4種單倍型的頻率表示為PAB、PAb、PaB、Pab。則LD的基本定義式為DAB=AB-PA·PB,其中AB表示單倍型(或配子)AB的實際觀測頻率,PA和PB分別表示等位基因A和B的頻率。D值的取值范圍高度依賴于等位基因頻率,因此,鮮少將D作為LD值的衡量指標。對于雙等位基因和多等位基因數(shù)據(jù),有幾種標準化的LD度量方法[18]。其中應(yīng)用最廣泛的是D′(個體LD值的標準化測量)和r2(雙等位基因的相關(guān)系數(shù)r)[19],其中D′是對僅衡量樣本的重組差異,r2則反映了樣本的重組史和突變史[18]。D′和r2的取值范圍均為0~1。當D′,r2=1,表示2位點間完全連鎖;當D′,r2=0時,則表示2位點間處于連鎖平衡狀態(tài)[20]。D′,r2取值越大,連鎖不平衡程度越高。當樣本容量較小時,4種低頻多態(tài)性等位基因組合概率降低,這將導(dǎo)致高度不穩(wěn)定的D′值,因此,D′不適用于小樣本容量的研究[21]。r2預(yù)示標記與候選的QTL間可能存在的相關(guān)性大小,所以在關(guān)聯(lián)分析中,通常r2是首選的LD衡量指標[15,18]。在鑒定與表型性狀變異顯著相關(guān)的SNP或單倍型時,r2是最合適的LD衡量指標[13]。
利用D′衡量群體的LD值,一般以D′=0.5或最大D′和最小D′的中間值來描述LD在染色體上的衰減距離;若以r2衡量群體的LD值,則一般以r2=0.1或r2=0.2來描述LD在染色體上的衰減距離[13,20]。如果LD在很短的距離內(nèi)衰減,預(yù)計映射分辨率較高,但需要大量的標記;相反,如果LD延伸的距離較長,則需要的標記數(shù)量相對較少,但映射分辨率較低[13]。有2種常見的方法用于可視化等位基因之間的LD程度:(1)LD衰減散點圖,用于可視化LD隨遺傳或物理距離衰減的速率;(2)LD矩陣,是某基因內(nèi)或某染色體上多態(tài)性位點間LD的線性排列[9,21]。
群體的LD程度受許多遺傳和非遺傳因素影響,如重組、遺傳漂變、選擇和交配模式等[17,22]。突變產(chǎn)生的多態(tài)性是LD形成的原因,多態(tài)性間的重組會削弱染色體內(nèi)部的LD程度,而多態(tài)性間的自由組合將會打破染色體內(nèi)部的LD程度[15]。種群交配模式對LD具有很強的影響,其對LD的影響主要取決于群體內(nèi)等位基因的有效重組率,自交物種個體趨于純和,所以在發(fā)生減數(shù)分裂時自交物種的有效重組率比異交物種的有效重組率低。因此,與異交物種相較而言,自交物種的LD程度較高,LD衰減速度較異交物種慢。LD也可以在經(jīng)歷種群大規(guī)模減少并伴隨極端遺傳漂變的種群中產(chǎn)生。種群再分及混合(即不同群體的個體間互交而導(dǎo)致種群間基因流動)將導(dǎo)致LD程度增加,但其影響取決于種群數(shù)量、種群間的交換率和重組率[22-23]。此外,選擇會導(dǎo)致群體遺傳多樣性降低,從而導(dǎo)致LD增加。
關(guān)聯(lián)分析利用自然群體中的祖先重組事件來產(chǎn)生標記-表型關(guān)聯(lián)[24]。目前關(guān)聯(lián)分析的應(yīng)用包括基因組關(guān)聯(lián)分析(genome wide association,GWAS)和候選基因關(guān)聯(lián)分析(candidate gene association analysis,CGAS),GWAS主要用于分析一定密度均勻覆蓋于全基因組的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)和目標性狀之間的相關(guān)性,而候選基因測試只對候選基因進行測序,通常用于分析特定基因的突變體,識別有助于作物改良的等位基因[7,25]。兩者都取決于研究群體的大小和LD程度,基于全基因組掃描的關(guān)聯(lián)分析在中度至重度LD的群體中最有效,而基于候選基因的關(guān)聯(lián)分析則更適用于低LD群體[24]。
基于LD的GWAS技術(shù)是近年來挖掘植物復(fù)雜性狀基因或數(shù)量性狀位點的一種有效方法[26],能夠最大限度地利用自然群體中不相關(guān)個體的遺傳變異來獲取更多與相關(guān)表型顯著關(guān)聯(lián)的位點,而不需要額外構(gòu)建定位群體[12]。水稻GWAS中關(guān)聯(lián)顯著性閾值的確定至關(guān)重要,對于不同群體和不同標記數(shù)量的水稻GWAS,沒有固定的閾值。通常有幾種方法用于確定P值的顯著性閾值,以控制全基因組關(guān)聯(lián)分析中發(fā)生的Ⅰ類錯誤,如最小貝葉斯系數(shù)(minimum Bayes factor,mBF)[27]、錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)[28-29]、Bonferonni校正(Bonferonni correction)[29-31]等。
多項研究證實,GWAS是揭示水稻復(fù)雜性狀遺傳變異和鑒定候選基因的有效手段[32-34]。例如,Huang等[35]對950份來自世界各地的水稻品種的抽穗期及籽粒相關(guān)性狀的表型進行GWAS分析,檢測到Waxy、ALK、Rc、OsC1及GS3基因的功能性突變與先前的報道一致,另外還發(fā)現(xiàn)了32個與抽穗期相關(guān)的新位點,10個與籽粒性狀相關(guān)的新位點。籽粒性狀是決定水稻產(chǎn)量和品質(zhì)的關(guān)鍵因素,了解水稻籽粒自然變異的遺傳基礎(chǔ)可以幫助育種家培育高產(chǎn)水稻品種。Feng等[26]利用5 291個單核苷酸多態(tài)性(SNPs)對全球469份不同水稻種質(zhì)進行了關(guān)聯(lián)定位,總共檢測到424個候選基因,除已知的基因外,還檢測到了11個新的關(guān)聯(lián)位點,另外還在3個不同環(huán)境中檢測到與粒長、粒寬、長寬比和千粒重相關(guān)的位點分別有3、18和2個,在2個不同環(huán)境中檢測到3、11、6和1個分別與粒長、粒寬、長寬比和千粒重相關(guān)的位點。這些位點對籽粒性狀的調(diào)節(jié)較穩(wěn)定,受環(huán)境因素影響較小,將有助于利用分子標記輔助選擇進行水稻粒型改良育種。通過GWAS和基因功能分析,Duan等[36]鑒定出1個調(diào)控水稻籽粒大小的新基因GSE5,研究表明,GSE5功能缺失將導(dǎo)致籽粒變寬,粒重增加,而過表達GSE5基因?qū)?dǎo)致籽粒寬度變小。利用996 722個SNPs標記對270份水稻種質(zhì)資源的粒長和粒寬進行了全基因組關(guān)聯(lián)分析,Ma等[37]鑒定出粒長和粒寬的數(shù)量性狀位點分別有5和4個,還鑒定出1個抗旱候選基因OsSNB同時負調(diào)控籽粒大小。通過候選基因分析發(fā)現(xiàn),OsSNB基因啟動子區(qū)225 bp的Indel與粒寬高度相關(guān),另外還設(shè)計了OsSNB_Indel2標記作為水稻粒寬改良的功能性標記。
分蘗數(shù)決定水稻的有效穗數(shù),有效穗數(shù)是決定水稻產(chǎn)量的重要因素之一,分蘗數(shù)過多會導(dǎo)致過多的無效分蘗,分蘗數(shù)過少則會導(dǎo)致過少的有效分蘗,因此,適量的分蘗數(shù)是水稻高產(chǎn)的重要條件之一。研究表明[38],水稻分蘗數(shù)主要受多基因調(diào)控,并且存在多條信號途徑共同影響水稻分蘗的發(fā)生,因此,為充分發(fā)揮水稻的產(chǎn)量潛力,必須挖掘更多有利用價值的水稻分蘗基因或有益突變體,并揭示其分子機制。利用GWAS已經(jīng)成功鑒定出與水稻分蘗數(shù)自然變異相關(guān)的基因座。張繼峰等[39]利用788 396個SNPs和295份粳稻品種進行GWAS分析,檢測與粳稻分蘗數(shù)顯著相關(guān)的SNP位點,篩選得到LOC_Os09g25090和LOC_Os09g25100影響粳稻分蘗數(shù)的候選基因。Zhao等[34]利用219份韓國水稻高質(zhì)量的SNPs數(shù)據(jù),和不同生長階段水稻的分蘗數(shù)及與分蘗數(shù)相關(guān)的抽穗期進行GWAS分析,在與水稻分蘗數(shù)顯著相關(guān)的位點上檢測到幾個候選基因,其中,候選基因OsRLCK57參與分蘗發(fā)育,與分蘗前期的分蘗數(shù)相關(guān);與發(fā)育階段轉(zhuǎn)換相關(guān)的OsHAM1、OsHAM2和OsTOC1與最大分蘗期的分蘗數(shù)相關(guān);HD1與水稻的有效分蘗率和抽穗日期同時相關(guān),說明光周期抽穗基因直接控制水稻的有效分蘗率。結(jié)果表明,參與發(fā)育階段轉(zhuǎn)換相關(guān)的基因,以及調(diào)控水稻分蘗發(fā)育的基因也可以決定水稻不同生育階段的分蘗模式。
每穗粒數(shù)作為水稻產(chǎn)量的主要組成因素,對水稻增產(chǎn)起著至關(guān)重要的作用。對不同環(huán)境條件下的自然優(yōu)勢變異進行識別,可促進水稻產(chǎn)量的可持續(xù)遺傳改良。Xie等[40]利用1個包含154份秈稻和119份粳稻的微核心種質(zhì),在7個不同環(huán)境下進行了每穗粒數(shù)的關(guān)聯(lián)研究,在秈稻中確定了20個有益基因型和24個負控基因型,在粳稻確定了24個有益基因型和16個負控基因型。對有益基因在秈粳稻中的累積效應(yīng)進行研究發(fā)現(xiàn),在秈稻中鑒定得到的有益基因的積累,可提高所有環(huán)境中秈稻和粳稻的每穗粒數(shù),而在粳稻中鑒定得到的有益基因的積累并無此明顯效應(yīng),特別是在短日照環(huán)境中表現(xiàn)明顯。每穗粒數(shù)取決于穗型結(jié)構(gòu),穗型結(jié)構(gòu)由一系列不同分枝組成:穗軸、一級分枝、二級分枝、三級分枝及小穗。每個小穗將產(chǎn)生一粒種子,因此,研究和分析水稻穗型遺傳機制將有助于提高水稻的每穗粒數(shù),進而提高水稻產(chǎn)量。Ta等[41]利用越南159個傳統(tǒng)水稻品種和3個參考水稻品種(Nipponbare、IR64和Azucena)組成的群體進行全基因組關(guān)聯(lián)分析,鑒定出29個穩(wěn)定的穗部性狀QTLs,為研究穗部結(jié)構(gòu)的遺傳決定因素提供了新的信息。
水稻增產(chǎn)可通過基因滲入或雜交改良重要農(nóng)藝性狀來實現(xiàn)。雜種優(yōu)勢是獲得水稻超高產(chǎn)育種的重要途徑之一,利用高密度標記對多親本群體進行遺傳作圖可以揭示雜種優(yōu)勢的遺傳基礎(chǔ)。Zhen等[42]利用14個雄性不育系和39個恢復(fù)系雜交得到約500份F1雜種材料,通過全基因組關(guān)聯(lián)分析確定了多個與F1雜種的產(chǎn)量性狀、父本雜種優(yōu)勢及配合力相關(guān)的QTL,其中Hd3a、qGL3、OsmiR156h和LAX2在這些QTLs中被確定為候選基因,進一步分析發(fā)現(xiàn),雄性不育系和恢復(fù)系對雜種F1代的優(yōu)勢等位基因貢獻不同,且對不同性狀的貢獻也不同。Huang等[43]開發(fā)了一種完整的基因組方法來構(gòu)建1 495個優(yōu)良雜交水稻品種及其自交系的基因組圖譜,與38個農(nóng)藝性狀進行關(guān)聯(lián)分析,確定了130個相關(guān)位點,對雜合基因型效應(yīng)的深入分析表明,雜種中只有少數(shù)幾個位點具有較強的超顯性效應(yīng),但產(chǎn)量與優(yōu)勢等位基因的數(shù)量有很強的相關(guān)性。
候選基因的關(guān)聯(lián)分析是基于基因水平將對目標性狀有很大貢獻的優(yōu)勢等位基因從自然群體中挖掘出來。對于多效基因,不同的多態(tài)性位點可能與不同性狀獨立關(guān)聯(lián),因此,候選關(guān)聯(lián)分析可以從基因水平剖析不同位點與性狀的相關(guān)性。Yu等[44]將504份栽培稻品種和約10萬個SNPs位點進行全基因組關(guān)聯(lián)研究,鑒定得到92個與粒長相關(guān)的新位點。在連鎖和關(guān)聯(lián)作圖的基礎(chǔ)上,掃描定位同一QTL的雙親雜交組合的Ho(觀察到的每個位點的雜合度)指數(shù)(即Ho-LAMap法),鑒定出2個新的粒長基因。隨后利用Ho-LAMap法克隆1個新的基因OsLG3,正向調(diào)控籽粒長度,該基因可以在不影響稻米品質(zhì)的情況下提高水稻產(chǎn)量。Xiong等[25]通過候選基因關(guān)聯(lián)分析,發(fā)現(xiàn)OsLG3啟動子的自然變異與水稻種子對滲透脅迫的耐受性有關(guān),過表達OsLG3顯著提高了水稻對模擬干旱的耐受性,而抑制OsLG3的表達則導(dǎo)致了更高的敏感性。含有OsLG3IRAT109優(yōu)良等位基因的導(dǎo)入系和轉(zhuǎn)基因系表現(xiàn)出較高的耐旱性,表明OsLG3的自然變異有助于水稻的耐旱性。以上結(jié)果表明,OsLG3是一個多效基因,它對水稻籽粒長度和耐旱性有共同的貢獻,是水稻抗旱性和產(chǎn)量改良的重要遺傳資源。Lu等[45]對104份栽培稻(O.sativa)和3份普通野生稻(O.rufipogon)的種質(zhì)資源進行了測序,利用候選基因關(guān)聯(lián)分析技術(shù),以鑒定Ghd7中影響株高、抽穗期、單穗粒數(shù)的不同等位基因/單倍型和關(guān)鍵SNP,除了先前報道的Ghd7的第一個外顯子過早終止突變導(dǎo)致多種性狀的表型改變外,還發(fā)現(xiàn)了位于ATG上游918 bp的C/T功能性突變,C/T突變可能通過改變基因表達調(diào)節(jié)株高。檢測到的與水稻重要農(nóng)藝性狀顯著關(guān)聯(lián)的變異,可直接設(shè)計作為水稻育種的分子標記。Vemireddy等[46]通過對200個水稻品種進行定向重測序,揭示影響產(chǎn)量的6個關(guān)鍵基因(DEP1、Ghd7、Gn1a、GS3、qSW5和sd1)中與產(chǎn)量性狀顯著相關(guān)的有益等位基因,鑒定出91個新的有益等位基因,進一步的單倍型分析表明,部分水稻基因型具有罕見的單倍型,特別是高產(chǎn)品種,具有有益等位基因和罕見單倍型的水稻品種,在水稻育種中具有巨大的應(yīng)用價值。鑒定出的優(yōu)良單倍型可通過單倍型輔助育種應(yīng)用于水稻育種研究中。此外,Abbai等[47]利用基因組測序數(shù)據(jù)及表型數(shù),對120個基因進行候選關(guān)聯(lián)研究和單倍型分析,篩選出21個調(diào)控10個籽粒產(chǎn)量和品質(zhì)性狀的強關(guān)聯(lián)基因,并報道了與水稻產(chǎn)量和品質(zhì)顯著相關(guān)的優(yōu)異單倍型。并進一步指出,利用目標基因的優(yōu)良單倍型組合,通過單倍型育種開發(fā)出適合未來食物和營養(yǎng)需求的下一代定制水稻是可行的。
眾所周知,群體結(jié)構(gòu)可能會導(dǎo)致虛假的相關(guān)性,致使假陽性率升高,種群結(jié)構(gòu)的影響可以通過在基因組中使用大量獨立的遺傳標記來修正[24]。此外,為了減輕并消除關(guān)聯(lián)分析中由群體分層引起的假陽性,前人提出了一系列方法[14]。其中,Q+K MLM模型和PCA+K MLM模型能夠較好避免由群體分層引起的假陽性[9]。研究者可根據(jù)研究需要選擇合適的統(tǒng)計方法。
水稻育種的本質(zhì)是優(yōu)良等位基因的選擇與聚合,許多基因及其不同的等位基因組合參與決定稻米的最終大小、形狀和重量[1]。等位基因在多個基因間的疊加性和上位性作用,使得一些有利等位基因的組合可以改良性狀,而其他組合無法改良性狀[48]。因此,為達到最佳的性狀改良目標,需考慮等位基因間相互作用。
單倍型育種是最近一種有希望開發(fā)定制作物品種的育種方法,它涉及到優(yōu)良單倍型的鑒定及其在育種計劃中的應(yīng)用[49]。關(guān)聯(lián)分析作為一種高效的QTL鑒定工具,可同時對多個等位基因進行鑒定,篩選到最優(yōu)等位基因的效率更高。利用候選基因關(guān)聯(lián)分析對目標基因和相關(guān)性狀進行關(guān)聯(lián)研究,并結(jié)合單倍型分析,可鑒定得到對表型有益的自然變異位點和優(yōu)異單倍型。所鑒定出的優(yōu)良單倍型和攜帶這些優(yōu)良單倍型的種質(zhì)資源,將為利用單倍型育種技術(shù)開發(fā)新水稻品種提供重要的科學(xué)依據(jù)。此外,還可對鑒定得到的功能性突變位點設(shè)計引物,這將有助于分子標記輔助選擇育種?;贑RISPR-Cas9的QTL多重編輯是一種新的育種策略,既簡單又經(jīng)濟高效[50]。研究者可利用CRISPR-Cas9的QTL多重編輯技術(shù)與關(guān)聯(lián)分析技術(shù)相結(jié)合,對于關(guān)聯(lián)分析鑒定得到的有益突變位點及優(yōu)異單倍型進行驗證,為定制水稻育種方案設(shè)計提供科學(xué)依據(jù),進一步提高育種效率。