蓋鈞鎰,賀建波
·導(dǎo)讀·
限制性兩階段多位點(diǎn)全基因組關(guān)聯(lián)分析法(RTM-GWAS)的特點(diǎn)、常見提問與應(yīng)用前景
蓋鈞鎰,賀建波
(南京農(nóng)業(yè)大學(xué)大豆研究所/國(guó)家大豆改良中心/農(nóng)業(yè)部大豆生物學(xué)與遺傳育種重點(diǎn)實(shí)驗(yàn)室/作物遺傳與種質(zhì)創(chuàng)新國(guó)家重點(diǎn)實(shí)驗(yàn)室/ 江蘇省現(xiàn)代作物生產(chǎn)協(xié)同創(chuàng)新中心,南京 210095)
限制性兩階段多位點(diǎn)全基因組關(guān)聯(lián)分析方法(RTM-GWAS)是新建立的一種可以全面檢測(cè)自然群體和雙(多)親衍生群體中具有不同復(fù)等位變異QTL體系的關(guān)聯(lián)分析方法。本文介紹了提出RTM-GWAS的出發(fā)點(diǎn)及其兩大主要特點(diǎn),包括建立適合自然群體和和雙(多)親衍生群體特點(diǎn)的復(fù)等位變異標(biāo)記和控制總體貢獻(xiàn)率的多位點(diǎn)關(guān)聯(lián)分析模型。一般讀者和編者對(duì)RTM-GWAS的方法、原理,對(duì)復(fù)等位標(biāo)記和多位點(diǎn)模型并無異議,提問與質(zhì)疑主要分為兩方面:一是RTM-GWAS檢測(cè)到的QTL數(shù)量較多,大大多于單位點(diǎn)MLM模型所檢出的QTL數(shù)目,懷疑增加的QTL是假陽性所致;另一是采用常規(guī)顯著水準(zhǔn)要求太低,不適于關(guān)聯(lián)分析。本文對(duì)此做了嚴(yán)密釋疑。最后介紹了關(guān)于RTM-GWAS的應(yīng)用前景,包括遺傳體系解析與重要基因克隆,雙(多)親雜交衍生群體遺傳解析,群體遺傳分化與進(jìn)化和設(shè)計(jì)育種等方面。
限制性兩階段多位點(diǎn)全基因關(guān)聯(lián)分析;SNP連鎖不平衡區(qū)段;復(fù)等位變異;多位點(diǎn)模型;QTL-allele矩陣;假陽性;模型顯著性
為克服全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)在遺傳育種研究中的局限性,HE等[1]提出了限制性兩階段多位點(diǎn)全基因關(guān)聯(lián)分析(restrictedtwo-stage multi-locus genome-wide association analysis,RTM-GWAS)方法以全面解析數(shù)量性狀QTL-等位變異構(gòu)成。目前,RTM-GWAS方法已應(yīng)用于多個(gè)群體遺傳研究[2-9]。受編輯部邀約,本課題組將以RTM- GWAS在大豆遺傳與種質(zhì)資源中的研究為例,用以說明該方法的應(yīng)用前景。該專題包括限制性兩階段多位點(diǎn)全基因組關(guān)聯(lián)分析法在遺傳育種中的應(yīng)用[10]、東北大豆種質(zhì)群體百粒重QTL-等位變異的全基因組解析[11]、RTM-GWAS方法應(yīng)用于大豆RIL群體百粒重QTL檢測(cè)的功效[12]、大豆巢式關(guān)聯(lián)作圖群體蛋白質(zhì)含量的遺傳解析[13]和大豆重組自交系群體異黃酮含量QTL連鎖定位與關(guān)聯(lián)定位的比較研究[14]等5篇應(yīng)用文章。除第一篇簡(jiǎn)單介紹RTM-GWAS的原理外,其余4篇介紹了在資源群體、雙(多)親衍生群體(RIL,NAM)QTL及其等位變異的定位與檢測(cè)以及所獲QTL-Allele數(shù)據(jù)在基因發(fā)掘和群體遺傳研究中的應(yīng)用。為便于讀者了解RTM-GWAS方法及其應(yīng)用,本文著重介紹提出RTM-GWAS的出發(fā)點(diǎn)及其兩大主要特點(diǎn)、編審過程中對(duì)RTM-GWAS的質(zhì)疑及辯解以及RTM-GWAS方法的應(yīng)用前景。
全基因組關(guān)聯(lián)分析利用自然群體廣泛存在的遺傳變異,通過測(cè)驗(yàn)分子標(biāo)記與表型間相關(guān)性來檢測(cè)數(shù)量性狀基因座(quantitative trait loci,QTL),為全面解析數(shù)量性狀遺傳體系提供了有效手段。GWAS通常基于單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)分子標(biāo)記,單個(gè)SNP標(biāo)記一般僅有2個(gè)等位變異,因此也只能完全擬合僅有2個(gè)等位變異的QTL。然而,自然群體(包括種質(zhì)資源群體)長(zhǎng)期經(jīng)歷多種環(huán)境的影響,同一基因座上會(huì)產(chǎn)生新的等位變異,形成復(fù)等位變異。多親衍生群體因親本間的異質(zhì)性,也會(huì)有復(fù)等位變異出現(xiàn)。這與雙親分離群體(例如重組自交系群體)中每個(gè)QTL僅有2個(gè)等位變異不同。因此,利用SNP標(biāo)記不能檢測(cè)自然群體和多親衍生群體中廣泛存在的復(fù)等位變異,這可能會(huì)降低GWAS的檢測(cè)功效。另外,植物常規(guī)育種是聚合優(yōu)異等位變異的遺傳操作過程[15],獲得每個(gè)QTL的復(fù)等位變異及其效應(yīng)估計(jì)是分子標(biāo)記輔助選擇的必要前提,因此,利用僅有2個(gè)等位變異的SNP標(biāo)記一定程度限制了GWAS在育種中的應(yīng)用。
常用的GWAS方法,例如混合線性模型(mixed linear model,MLM)方法[16],一般基于單位點(diǎn)模型檢測(cè)QTL,即每個(gè)標(biāo)記位點(diǎn)與表型的相關(guān)性測(cè)驗(yàn)彼此獨(dú)立進(jìn)行。然而實(shí)際上數(shù)量性狀受大量的QTL控制,單位點(diǎn)模型中位點(diǎn)效應(yīng)和貢獻(xiàn)率的估計(jì)必然受到相鄰QTL的影響,進(jìn)而使得GWAS受到干擾。單位點(diǎn)效應(yīng)(貢獻(xiàn))過高估計(jì)可能導(dǎo)致QTL總體表型變異解釋率超過性狀遺傳率或甚至超過100%[7]。為了控制這種膨脹,統(tǒng)計(jì)學(xué)家提出在個(gè)別位點(diǎn)測(cè)驗(yàn)的基礎(chǔ)上進(jìn)行全試驗(yàn)的總體測(cè)驗(yàn),例如Bonferroni方法將測(cè)驗(yàn)閾值設(shè)為顯著水平除以標(biāo)記數(shù)目。鑒于GWAS涉及全基因組高密度SNP分子標(biāo)記,要使全試驗(yàn)顯著閾值保持常規(guī)水準(zhǔn)(=0.05),Bonferroni方法就必然對(duì)每一個(gè)標(biāo)記的閾值設(shè)置很高(-lg值很大)。盡管嚴(yán)格的測(cè)驗(yàn)閾值有效降低了全試驗(yàn)錯(cuò)誤率,但同時(shí)也導(dǎo)致了較高的假陰性,以至于GWAS往往僅能檢測(cè)到少數(shù)QTL,只能解釋遺傳變異的很小部分,不能充分檢出性狀的全基因組QTL。
RTM-GWAS是新建立的一種可以全面檢測(cè)自然群體和雙(多)親衍生群體中具有不同復(fù)等位變異QTL體系的關(guān)聯(lián)分析方法。該方法采用了復(fù)等位變異標(biāo)記和多位點(diǎn)模型作為解決上述兩大問題的關(guān)鍵,形成RTM-GWAS的兩大主要特點(diǎn),目的在于全面解析群體數(shù)量性狀QTL-等位變異的遺傳構(gòu)成[1,17]。首先,RTM-GWAS通過構(gòu)建具有復(fù)等位變異的SNP連鎖不平衡區(qū)段(SNP linkage disequilibrium block,SNPLDB)標(biāo)記以檢測(cè)自然群體中的復(fù)等位變異。SNPLDB標(biāo)記復(fù)等位變異豐富,可以擬合QTL上多個(gè)等位變異,比僅有2個(gè)等位變異的SNP標(biāo)記更符合自然群體特征,從而提高了檢測(cè)功效。基于SNPLDB標(biāo)記的連鎖不平衡衰減距離比SNP標(biāo)記更短,因此,還可能提高檢測(cè)精度。其次,RTM-GWAS通過多位點(diǎn)復(fù)等位變異模型以檢測(cè)全基因組QTL及其復(fù)等位變異,以遺傳率值作為檢出QTL總貢獻(xiàn)率的上限,使假陽性事件得到合理的控制。為提高QTL檢測(cè)效率,RTM-GWAS還通過兩階段分析策略以降低多位點(diǎn)模型運(yùn)算量,并利用基于SNPLDB標(biāo)記的遺傳相似系矩陣控制群體結(jié)構(gòu)偏差導(dǎo)致的假陽性。鑒于多位點(diǎn)模型的顯著性測(cè)驗(yàn)代表了全模型測(cè)驗(yàn),不需要再做全試驗(yàn)多重測(cè)驗(yàn),無需對(duì)顯著水平進(jìn)行矯正,因而同樣采用常規(guī)顯著水平(例如0.01或0.05),實(shí)際的QTL檢出數(shù)大大提高,一定程度上避免了由于過嚴(yán)格顯著水平導(dǎo)致的假陰性問題。此外,RTM-GWAS還與表型鑒定試驗(yàn)設(shè)計(jì)緊密結(jié)合,可直接用試驗(yàn)設(shè)計(jì)原始數(shù)據(jù)(包括環(huán)境和區(qū)組)進(jìn)行分析,因而RTM-GWAS將試驗(yàn)設(shè)計(jì)嚴(yán)格的誤差控制和關(guān)聯(lián)分析緊密結(jié)合,降低了試驗(yàn)誤差,提高了QTL檢出能力。詳細(xì)說明請(qǐng)參考文獻(xiàn)[1-9,17]。
RTM-GWAS方法及其應(yīng)用文章發(fā)表過程中,審稿人對(duì)上述方法、原理以及對(duì)復(fù)等位標(biāo)記和多位點(diǎn)模型的2個(gè)主要特點(diǎn)一般并無異議,但有懷疑與質(zhì)疑。質(zhì)疑最多的問題,主要有兩方面:一是RTM-GWAS檢測(cè)到的QTL數(shù)量較多,大大多于傳統(tǒng)的單位點(diǎn)MLM模型所檢出的QTL數(shù)目,懷疑多出來的QTL是假陽性所致;二是采用常規(guī)顯著水準(zhǔn),閾值太低,不適于關(guān)聯(lián)分析。
與其他常用GWAS方法相比,RTM-GWAS方法通常能檢測(cè)更多的QTL,這符合設(shè)計(jì)RTM-GWAS方法的初衷。該方法的目的是要將遺傳率所反映的QTL遺傳變異盡可能多的挖掘出來,但總貢獻(xiàn)率不應(yīng)超過全試驗(yàn)的遺傳率值。這是通過多位點(diǎn)模型分析中檢測(cè)模型的顯著性實(shí)現(xiàn)的。只要模型的貢獻(xiàn)率不超過遺傳率值,所有檢測(cè)到的QTL都應(yīng)是合理的,非假陽性的。另一方面,如上所述,RTM-GWAS與精細(xì)試驗(yàn)設(shè)計(jì)緊密結(jié)合,降低了誤差,提高了檢出功效,這是其他GWAS方法沒有關(guān)注到的。此外,大豆基因組有4.5萬—5.0萬個(gè)基因,數(shù)量性狀屬于復(fù)雜性狀,其遺傳構(gòu)成是一套基因網(wǎng)絡(luò)體系,涉及大量效應(yīng)不等相互影響的遺傳位點(diǎn)。因此,檢測(cè)的QTL數(shù)量多并無錯(cuò)誤,這正好從側(cè)面反應(yīng)了數(shù)量性狀遺傳調(diào)控網(wǎng)絡(luò)體系的復(fù)雜性。實(shí)際試驗(yàn)中,QTL總貢獻(xiàn)率通常還達(dá)不到性狀遺傳率值,說明還有一部分QTL未被檢測(cè)出來,改進(jìn)試驗(yàn)精確度,增加標(biāo)記密度,還有可能多挖掘出一批小貢獻(xiàn)率的QTL。
為了平衡假設(shè)測(cè)驗(yàn)中的假陽性和假陰性,統(tǒng)計(jì)學(xué)上普遍采用0.01或0.05作為顯著水平,更嚴(yán)格的顯著性水平可用于滿足特定目的,這取決于重要性和成本。因此,RTM-GWAS也使用常規(guī)的顯著水平0.01或0.05測(cè)驗(yàn)?zāi)P偷娘@著性,控制全試驗(yàn)錯(cuò)誤率。如前所述,由于RTM-GWAS基于多位點(diǎn)模型,模型的顯著性本身就說明了模型的合理性和模型中所包括QTL的合理性,并不需要進(jìn)行額外的多重測(cè)驗(yàn)校正。這與單位點(diǎn)模型不同,單位點(diǎn)模型的顯著性僅說明該位點(diǎn)是顯著的合理的,并不說明全部檢測(cè)到的位點(diǎn)整體的顯著性和合理性,因而要加做全試驗(yàn)所檢測(cè)到位點(diǎn)整體的顯著性測(cè)驗(yàn),例如Bonferroni校正。簡(jiǎn)言之,多位點(diǎn)模型下,模型的顯著性已包含了全部入選的QTL,不需另作矯正,反之,單位點(diǎn)模型下,入選單個(gè)位點(diǎn)的全體須經(jīng)整體的顯著性測(cè)驗(yàn),要另做多重測(cè)驗(yàn)或Bonferroni校正。另外,RTM-GWAS同時(shí)還給出每個(gè)檢出QTL的統(tǒng)計(jì)測(cè)驗(yàn)值,研究者還可以選擇特定閾值進(jìn)一步篩選QTL,而無需重新計(jì)算。這是因?yàn)镽TM-GWAS檢測(cè)的QTL以值從小到大依次排列,值較小的往往貢獻(xiàn)率越大。如果實(shí)際研究有更嚴(yán)格的要求,例如克隆候選基因費(fèi)時(shí)費(fèi)事,可以使用嚴(yán)格的閾值來篩選相對(duì)更重要的位點(diǎn)。
以往研究者常將GWAS方法用于尋找個(gè)別基因,因而并不注重性狀遺傳體系中全部QTL的檢出。如上所述,建立RTM-GWAS方法著眼于解析自然群體或遺傳群體的遺傳體系或QTL-等位變異(QTL-allele)矩陣。該方法自建立以來已做了多方面的應(yīng)用嘗試,現(xiàn)歸納于后。更多的應(yīng)用還有待今后在使用中發(fā)展。
對(duì)多個(gè)大豆數(shù)量性狀的遺傳解析顯示,與以往GWAS方法相比,RTM-GWAS能檢測(cè)到較多的QTL和相應(yīng)的等位變異,QTL總貢獻(xiàn)率也更接近性狀的遺傳率值,為研究數(shù)量性狀完整的遺傳體系提供了途徑。RTM-GWAS除應(yīng)用在單環(huán)下解析群體QTL-等位變異體系外,還可對(duì)多環(huán)境試驗(yàn)表型數(shù)據(jù)做基因與環(huán)境互作效應(yīng)的解析。檢測(cè)到的QTL可以有主效應(yīng)有互作效應(yīng),有主效應(yīng)無互作效應(yīng),無主效應(yīng)有互作效應(yīng)等不同類型;分析的結(jié)果可以歸納成主效QTL-等位變異和互作效應(yīng)QTL-等位變異2個(gè)矩陣,為等位變異環(huán)境效應(yīng)的研究提供了通路。另外,RTM-GWAS分析結(jié)果中QTL按概率值(顯著程度)由小到大或貢獻(xiàn)率由大到小依次檢出,因此,除可以考察整個(gè)遺傳體系外,還可以按各個(gè)QTL的重要程度分別進(jìn)行研究,包括檢出重要位點(diǎn)做基因克隆研究等。
RTM-GWAS特別適合于雙(多)親雜交后代群體,例如重組自交系群體和巢式關(guān)聯(lián)作圖群體。與自然群體不同,由于雙親群體遺傳構(gòu)成規(guī)則,群體偏差干擾小,檢測(cè)功效更高。對(duì)大豆重組自交系群體的分析顯示,RTM-GWAS除了能檢測(cè)到傳統(tǒng)復(fù)合區(qū)間作圖法檢測(cè)的QTL,還能檢測(cè)更多的QTL,解釋更多的表型變異。另外,對(duì)4個(gè)重組自交系群體組成的大豆巢式關(guān)聯(lián)作圖群體的分析顯示,RTM-GWAS可以檢測(cè)到復(fù)等位變異數(shù)目不等的QTL,每個(gè)QTL包含2—5個(gè)等位變異。以往巢式關(guān)聯(lián)作圖群體分析方法盡管將多個(gè)重組自交系群體聯(lián)合分析,但仍將重組自交系群體相互獨(dú)立處理[18],因此,對(duì)多個(gè)親本的復(fù)等位變異估計(jì)不確切。而RTM-GWAS視多個(gè)重組自交系群體為一個(gè)整群體,利用SNPLDB標(biāo)記可以估計(jì)QTL上多個(gè)親本間不同的等位變異,更符合群體遺傳特征。
RTM-GWAS可以估計(jì)出所有QTL上每個(gè)等位變異的效應(yīng),據(jù)此可建立數(shù)量性狀的QTL-等位變異(QTL-allele)矩陣,即群體內(nèi)每個(gè)材料在每個(gè)QTL上的效應(yīng)矩陣。QTL-allele矩陣包括了性狀在群體中的全部遺傳組成,不僅能用于候選基因發(fā)掘,還特別適合于群體遺傳分化和進(jìn)化分析。例如,在對(duì)中國(guó)東北地區(qū)不同熟期組大豆主莖節(jié)數(shù)的遺傳研究中(Crop Science即將發(fā)表),大豆主莖節(jié)數(shù)從晚熟組(MGI,MGII)的17.89個(gè)減少到早熟組(MG0,MG00,MG000)的13.11個(gè)。在東北大豆種質(zhì)群體中,RTM-GWAS共檢測(cè)到76個(gè)主莖節(jié)數(shù)QTL,包括183個(gè)等位變異,共解釋了65.63%的表型變異。在晚熟組到早熟組的進(jìn)化過程中,有28.42%的等位變異產(chǎn)生變化,其中新生等位變異占6.56%,淘汰等位變異占21.86%,而71.58%的等位變異直接從晚熟組傳遞到早熟組。說明東北大豆主莖節(jié)數(shù)進(jìn)化過程中,遺傳是首要?jiǎng)恿?,其次是淘汰或選擇(淘汰正效等位變異),第三是新生或突變(新生負(fù)效等位變異),最后通過所剩QTL等位變異間的遺傳重組使群體產(chǎn)生遺傳分化和進(jìn)化。
親本組配和后代選擇是常規(guī)育種的2個(gè)主要步驟,對(duì)于復(fù)雜性狀的遺傳改良,背景選擇和前景選擇同等重要,僅通過少數(shù)幾個(gè)主效位點(diǎn)的重組選擇很可能無法創(chuàng)造出突破性新品種。由RTM-GWAS建立的QTL-allele矩陣為親本組配和后代選擇提供了遺傳依據(jù)?;赒TL-allele矩陣可以對(duì)所有親本組合的后代純合群體進(jìn)行預(yù)測(cè),從而篩選最優(yōu)親本組合。因此,基于QTL-allele矩陣的選擇是對(duì)目標(biāo)性狀位點(diǎn)進(jìn)行的直接選擇,更符合實(shí)際育種需求。同時(shí),根據(jù)QTL-allele矩陣還可以設(shè)計(jì)最佳基因型(各位點(diǎn)最佳等位變異的組合),根據(jù)相應(yīng)標(biāo)記對(duì)后代做標(biāo)記輔助選擇。這與Meuwissen的全基因組選擇方法(genome-wide selection)[19]有本質(zhì)不同。全基因組選擇首先基于參考子群體建立分子標(biāo)記與多個(gè)目標(biāo)性狀表型的綜合線性關(guān)系,這種關(guān)系對(duì)每個(gè)性狀來說是黑箱關(guān)系。然后利用個(gè)體的全基因組分子標(biāo)記信息預(yù)測(cè)候選個(gè)體的綜合育種值,憑綜合育種值對(duì)個(gè)體做選擇。鑒于作物育種通常涉及許多組合,一個(gè)組合涉及上千后代個(gè)體,采用全基因組選擇時(shí)大量全基因組分子標(biāo)記數(shù)據(jù)花費(fèi)高昂,而利用性狀的QTL-allele矩陣只涉及目標(biāo)性狀的標(biāo)記,即便有多個(gè)性狀,涉及的標(biāo)記總數(shù)也只是全基因組標(biāo)記的極小部分,因而QTL-allele矩陣除可用以進(jìn)行優(yōu)化組合設(shè)計(jì)外,對(duì)組合后代個(gè)體也可能是一種有效的標(biāo)記輔助設(shè)計(jì)和選擇的途徑,不過還有待于實(shí)踐的檢驗(yàn)。
[1] HE J, MENG S, ZHAO T, XING G, YANG S, LI Y, GUAN R, LU J, WANG Y, XIA Q, YANG B, GAI J. An innovative procedure of genome-wide association analysis fits studies on germplasm population and plant breeding, 2017, 130(11): 2327-2343.
[2] ZHANG Y, HE J, WANG Y, XING G, ZHAO J, LI Y, YANG S, PALMER R G, ZHAO T, GAI J. Establishment of a 100-seed weight quantitative trait locus-allele matrix of the germplasm population for optimal recombination design in soybean breeding programmes, 2015, 66(20): 6311-6325.
[3] MENG S, HE J, ZHAO T, XING G, LI Y, YANG S, LU J, WANG Y, GAI J. Detecting the QTL-allele system of seed isoflavone content in Chinese soybean landrace population for optimal cross design and gene system exploration, 2016, 129(8): 1557-1576.
[4] LI S, CAO Y, HE J, ZHAO T, GAI J. Detecting the QTL-allele system conferring flowering date in a nested association mapping population of soybean using a novel procedure, 2017, 130(11): 2297-2314.
[5] KHAN M A, TONG F, WANG W, HE J, ZHAO T, GAI J. Analysis of QTL-allele system conferring drought tolerance at seedling stage in a nested association mapping population of soybean [(L.) Merr.] using a novel GWAS procedure, 2018, 248(4): 947-962.
[6] PAN L, HE J, ZHAO T, XING G, WANG Y, YU D, CHEN S, GAI J. Efficient QTL detection of flowering date in a soybean RIL population using the novel restricted two-stage multi-locus GWAS procedure, 2018, 131(12): 2581-2599.
[7] ZHANG Y, HE J, WANG H, MENG S, XING G, LI Y, YANG S, ZHAO J, ZHAO T, GAI J. Detecting the QTL-allele system of seed oil traits using multi-locus genome-wide association analysis for population characterization and optimal cross prediction in soybean, 2018, 9: 1793.
[8] ZHANG Y H, HE J B, MENG S, LIU M F, XING G N, LI Y, YANG S P, YANG J Y, ZHAO T J, GAI J Y. Identifying QTL-allele system of seed protein content in Chinese soybean landraces for population differentiation studies and optimal cross predictions, 2018, 214(9): 157.
[9] KHAN M A, TONG F, WANG W, HE J, ZHAO T, GAI J, WILLENBORG C. Using the RTM-GWAS procedure to detect the drought tolerance QTL-allele system at the seedling stage under sand culture in a half-sib population of soybean [(L.) Merr.], 2019, 99(6): 801-814.
[10] 賀建波, 劉方東, 王吳彬, 邢光南, 管榮展, 蓋鈞鎰. 限制性兩階段多位點(diǎn)全基因組關(guān)聯(lián)分析方法的特點(diǎn)與計(jì)算程序中國(guó)農(nóng)業(yè)科學(xué), 2020, 53(9): 1699-1703.
HE J B, LIU F D, WANG W B, XING G N, GUAN R Z, GAI Y. Restricted two-stage multi-locus genome-wide association analysis and its applications to genetic and breeding studies., 2020, 53(9): 1699-1703. (in Chinese)
[11] 郝曉帥, 傅蒙蒙, 劉再東, 賀建波, 王燕平, 任海祥, 王德亮, 楊興勇, 程延喜, 杜維廣, 蓋鈞鎰. 東北大豆種質(zhì)群體百粒重QTL-等位變異的全基因組解析. 中國(guó)農(nóng)業(yè)科學(xué), 2020, 53(9): 1704-1729.
HAO X S, FU M M, LIU Z D, HE J B, WANG Y P, REN H X, WANG D L, YANG X Y, CHENG Y X, DU W G, GAI J Y. Genome-wide QTL-allele dissection of 100-seed weight in the northeast china soybean germplasm populationS, 2020, 53(9): 1704-1729. (in Chinese)
[12] 潘麗媛, 賀建波, 趙晉銘, 王吳彬, 邢光南, 喻德躍, 張小燕, 李春燕, 陳受宜, 蓋鈞鎰. RTM-GWAS方法應(yīng)用于大豆RIL群體百粒重QTL檢測(cè)的功效. 中國(guó)農(nóng)業(yè)科學(xué), 2020, 53(9): 1730-1742.
PAN L Y, HE J B, ZHAO J M, WANG W B, XING G N, YU D Y, ZHANG X Y, LI C Y, CHEN S Y, GAI J Y. Detection power of rtm-gwas applied to 100-seed weight qtl identification in a recombinant inbred lines population of soybean, 2020, 53(9): 1730-1742. (in Chinese)
[13] 李曙光, 曹永策, 賀建波, 王吳彬, 邢光南, 楊加銀, 趙團(tuán)結(jié), 蓋鈞鎰. 大豆巢式關(guān)聯(lián)作圖群體蛋白質(zhì)含量的遺傳解析. 中國(guó)農(nóng)業(yè)科學(xué), 2020, 53(9): 1743-1755.
LI S G, CAO Y C, HE J B, WANG W B, XING G N, YANG J Y, ZHAO T J, GAI J Y. Genetic dissection of protein content in a nested association mapping population of soybean., 2020, 53(9): 1743-1755. (in Chinese)
[14] 劉再東, 孟珊, 賀建波, 邢光南, 王吳彬, 趙團(tuán)結(jié), 蓋鈞鎰. 大豆重組自交系群體異黃酮含量QTL連鎖定位與關(guān)聯(lián)定位的比較研究. 中國(guó)農(nóng)業(yè)科學(xué), 2020, 53(9): 1756-1772.
LIU Z D, MENG S, HE J B, XING G N, WANG W B, ZHAO T J, GAI J Y. A comparative study on linkage and association qtl mapping for seed isoflavone contents in a recombinant inbred line population of soybean., 2020, 53(9): 1756-1772. (in Chinese)
[15] GAI J Y, CHEN L, ZHANG Y, ZHAO T J, XING G N, XING H. Genome-wide genetic dissection of germplasm resources and implications for breeding by design in soybean, 2012, 61(5): 495-510.
[16] SUL J H, MARTIN L S, ESKIN E. Population structure in genetic studies: Confounding factors and mixed models, 2018, 14(12): e1007309.
[17] 賀建波, 劉方東, 邢光南, 王吳彬, 趙團(tuán)結(jié), 管榮展, 蓋鈞鎰. 限制性兩階段多位點(diǎn)全基因組關(guān)聯(lián)分析方法的特點(diǎn)與計(jì)算程序作物學(xué)報(bào), 2018, 44(9): 1274-1289.
HE J B, LIU F D, XING G N, WANG W B, ZHAO T J, GUAN R Z, GAI J Y. Characterization and analytical programs of the restricted two-stage multi- locus genome-wide association analysis., 2018, 44(9): 1274-1289. (in Chinese)
[18] BUCKLER E S, HOLLAND J B, BRADBURY P J,. The genetic architecture of maize flowering time, 2009, 325(5941): 714-718.
[19] MEUWISSEN T H, HAYES B J, GODDARD M E. Prediction of total genetic value using genome-wide dense marker maps, 2001, 157(4): 1819-1829.
Major Characteristics, Often-Raised Queries and Potential Usefulness of the Restricted two-Stage multi-locus genome-Wide association analysis
GAI JunYi, He JianBo
()
Restricted two-stage multi-locus genome-wide association analysis (RTM-GWAS) is a novel GWAS procedure which provides a way to identify the QTL system with various multiple alleles in natural and bi- or multi-parental derived populations. The major purposes and its two major characteristics of the RTM-GWAS procedure were presented, including the establishment of the SNPLDB markers with multiple alleles fitting the property of the natural and bi- or multi-parental derived populations and the establishment of multi-locus model GWAS procedure with the total genetic contribution controlled within heritability value. Generally, the readers and editors do not doubt about the methods and principles, the multiple allele markers and the multi-locus model, but have questions and queries on the large amount of detected QTLs many more than those from single locus MLM-GWAS procedure and on the general significance level without correction used in RTM-GWAS. These doubts were carefully and seriously explained and relieved. Furthermore, the potential usefulness of the RTM-GWAS procedure in genetic and evolutionary studies were summarized, including usefulness in relatively thorough identification of the QTL-allele system in populations and major gene finding and cloning, usefulness in relatively thorough identification of the QTL-allele system in bi-and multi-parental derived populations, usefulness in studies on population genetic differentiation and evolution and usefulness in breeding by genetic design.
restricted two-stage multi-locus genome-wide association analysis (RTM-GWAS); SNP linkage disequilibrium block (SNPLDB); multiple alleles; multi-locus model; QTL-allele matrix; false positive; model significance
10.3864/j.issn.0578-1752.2020.09.001
2020-01-02;
2020-02-15
國(guó)家自然科學(xué)基金(31701447)、國(guó)家作物育種重點(diǎn)研發(fā)計(jì)劃(2017YFD0101500,2017YFD0102002)、長(zhǎng)江學(xué)者和創(chuàng)新團(tuán)隊(duì)發(fā)展計(jì)劃(PCSIRT_17R55)、教育部111項(xiàng)目(B08025)、中央高?;究蒲袠I(yè)務(wù)費(fèi)項(xiàng)目(KYT201801)、農(nóng)業(yè)部國(guó)家大豆產(chǎn)業(yè)技術(shù)體系CARS-04、江蘇省優(yōu)勢(shì)學(xué)科建設(shè)工程專項(xiàng)、江蘇省JCIC-MCP項(xiàng)目
蓋鈞鎰,E-mail:sri@njau.edu.cn
(責(zé)任編輯 李莉)