陳喜娜,袁澤科,杜彥修,李俊周,張靜,彭廷,趙全志,孫紅正
(河南農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,河南 鄭州 450046)
圖位克隆是迄今為止最為有效的克隆水稻未知基因的方法,水稻大多重要農(nóng)藝性狀基因都是通過圖位克隆獲得的[1-5]。秈稻和粳稻來自普通野生稻祖先,由于生殖隔離,秈稻與粳稻之間雜交不育或低育性一直是亞種間雜交的主要障礙[6-7]。另外,秈稻和粳稻間遺傳背景差異較大導(dǎo)致的后代群體偏分離等現(xiàn)象也對(duì)目標(biāo)表型鑒定造成較大的影響[8-9]。相對(duì)于亞種間雜交,亞種內(nèi)雜交則不存在雜交不育或偏分離的情況,因此,亞種內(nèi)雜交相對(duì)于亞種間雜交的優(yōu)勢不言而喻。得到足夠多的多態(tài)性標(biāo)記是基因圖位克隆的首要條件,由于亞種間的多態(tài)性高于亞種內(nèi)的多態(tài)性[10-11],因此,在大多數(shù)圖位克隆研究中,為了得到足夠多的多態(tài)性分子標(biāo)記,分離群體的構(gòu)建都是采用秈稻和粳稻亞種間雜交的方式構(gòu)建的。隨著DNA測序技術(shù)的發(fā)展,全基因組測序越來越普遍,從而極大地促進(jìn)了正向遺傳學(xué)的發(fā)展。在2014年, 超過3 000份水稻種質(zhì)資源被測序,并發(fā)現(xiàn)了超過2 000萬個(gè)SNP(Single nucleotide polymorphism)位點(diǎn)[12-13]。隨后的分析在3 010份種質(zhì)資源測序數(shù)據(jù)中鑒定出2 900萬個(gè)SNP位點(diǎn)、240萬個(gè)InDel(Insertion/Deletion)和9萬個(gè)基因組結(jié)構(gòu)變異[14]。為了研究全基因組范圍內(nèi)亞種內(nèi)和亞種間的多態(tài)性水平,本研究從水稻3K測序項(xiàng)目中選取了32份種質(zhì)資源,分別包含了秈稻和粳稻的5種主要類型,以評(píng)價(jià)亞種內(nèi)的多態(tài)性水平及其在染色體上的密度分布。
32份水稻種質(zhì)資源,選自3 000份水稻基因組重測序項(xiàng)目,包括16份秈稻和16份粳稻種質(zhì)資源(表1)。其中粳稻種質(zhì)資源包括4份中間類型、4份粳稻類型、4份溫帶粳稻類型和4份熱帶粳稻類型。所有種質(zhì)資源的測序深度均在10倍以上。
基因組測序數(shù)據(jù)下載自3KRG SNP & indel datasets release 1.0(http://oryzasnp.org/)。對(duì)亞種間和亞種內(nèi)種質(zhì)資源兩兩之間的SNP和InDel數(shù)量進(jìn)行統(tǒng)計(jì)。使用MEGA軟件對(duì)32份種質(zhì)資源的SNP序列數(shù)據(jù)采用Neighbour-joining方法構(gòu)建系統(tǒng)進(jìn)化樹,進(jìn)化樹的可靠性通過1 000次的Bootstrap進(jìn)行驗(yàn)證。亞種內(nèi)與亞種間的遺傳距離使用MEGA軟件中的最大復(fù)合似然方法進(jìn)行計(jì)算。SNP/InDel在染色體上的密度圖使用R軟件包CMplot(https://github.com/YinLiLin/R-CMplot)進(jìn)行繪制。
表1 本研究所用水稻種質(zhì)資源列表
續(xù)表1
為確定所選用水稻種質(zhì)資源的親緣關(guān)系,使用32份水稻種質(zhì)資源的SNP構(gòu)建系統(tǒng)進(jìn)化樹。不同種質(zhì)資源的測序深度不同(表1),雖然在32份水稻種質(zhì)資源中共檢測到5 280 807個(gè)SNP,但是,其中有些SNP并未在所有種質(zhì)資源中被檢測到,因此,經(jīng)過篩選共有在所有32份種質(zhì)資源都被檢測的913 117個(gè)SNP被用于構(gòu)建系統(tǒng)進(jìn)化樹。系統(tǒng)進(jìn)化樹顯示32份水稻種質(zhì)資源可以很好地被分成秈稻和粳稻兩大支(圖1)。其中,秈稻種質(zhì)資源可以很好地聚成1支,粳稻種質(zhì)資源中有4份熱帶種質(zhì)形成1個(gè)小分支,其他溫帶種質(zhì)、中間類型和其他類型的粳稻沒有聚成單一的小分支。4份中間類型的種質(zhì)資源中,粳7623(B141)和霸王鞭1(B084)位于秈稻和粳稻分支中間,但更傾向于粳稻分支。另外2份中間類型種質(zhì)資源粳87-304(B124)和越光(CX330)則混于粳稻分支中,因此,在后續(xù)分析中,4份中間類型的種質(zhì)資源被劃分到粳稻分支中分析。
在32份水稻種質(zhì)資源中共發(fā)現(xiàn)5 280 807個(gè)多態(tài)性SNP位點(diǎn)和478 996個(gè)InDel位點(diǎn),對(duì)每份種質(zhì)資源兩兩之間的差異SNP和InDel數(shù)量進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn),亞種間種質(zhì)資源兩兩之間的SNP數(shù)量平均值為1 744 498個(gè),InDel數(shù)量平均值為159 829個(gè)(圖2)。
在所選用的32份種質(zhì)資源中,亞種間兩兩種質(zhì)資源多態(tài)性InDel數(shù)最少的是粵香占和粳7623(CX17-B141),兩者之間有112 101個(gè)InDel。而InDel數(shù)量最多的是魔王谷內(nèi)雜和山酒谷(B095~B245),全基因組范圍內(nèi)共檢測到196 854個(gè)InDel。亞種間多態(tài)性SNP數(shù)量最多的組合是魔王谷內(nèi)雜和徐稻4號(hào)(B095~CX251),共有2 220 309個(gè)SNP,而SNP數(shù)量最少的組合是湘矮早10號(hào)和粳7623(B232~B141),共有919 316個(gè)SNP(圖3)。
秈稻亞種內(nèi)種質(zhì)資源之間平均有108 850 InDels和650 797 SNP,竹珍B和G珍汕97B(B248~B156)之間的InDel和SNP在所有秈稻組合中最少,分別為59 773和9 092。湘矮早10號(hào)與油黏(B232~B224)之間的InDel數(shù)量最多,InDel達(dá)到130 094個(gè)。明恢63與油黏之間SNP數(shù)量最多(CX145~B224),有934 526個(gè)SNP(圖3)。
粳稻亞種內(nèi)種質(zhì)資源兩兩之間平均有57 384個(gè)InDel和639 927個(gè)SNP,在所有粳稻兩兩組合之間,粳87-304和越光(B124~CX330)之間的InDel和SNP數(shù)量最少, SNP有153 109個(gè),InDel有16 298個(gè)。霸王鞭1和拉木加(B084~B241)之間的InDel數(shù)量最多,有103 825個(gè)InDel。粳7623和拉木加(B141~B241)之間的SNP數(shù)量最多,有1 309 253個(gè)SNP(圖3)。
遺傳距離反映種質(zhì)資源間親緣關(guān)系與InDel和SNP多態(tài)性相一致,均表現(xiàn)為亞種間遺傳距離較遠(yuǎn),秈稻亞種內(nèi)遺傳距離次之,粳稻亞種內(nèi)遺傳距離較近(表2)。在粳稻的4個(gè)小類群內(nèi),類群內(nèi)遺傳距離最大的是Japonica類型的種質(zhì),中間類型的種質(zhì)資源類群內(nèi)遺傳距離最小,而類群間遺傳距離均大于類群內(nèi)遺傳距離。因此,在選取亞種內(nèi)種質(zhì)資源構(gòu)建分離群體時(shí),宜選用粳稻不同類群的種質(zhì)以獲得更多的多態(tài)性標(biāo)記位點(diǎn)。
圖1 32份水稻種質(zhì)資源的親緣關(guān)系樹
為了研究粳稻與秈稻多態(tài)性SNP和InDel位點(diǎn)在染色體上的分布,對(duì)粳稻品種徐稻4號(hào)(CX251)和其他粳稻種質(zhì)資源之間的SNP/InDel在染色體上的密度進(jìn)行作圖。徐稻4號(hào)與其他粳稻種質(zhì)資源兩兩之間的InDel數(shù)目為19 833~77 765個(gè),SNP數(shù)目有185 943~1 182 934個(gè)。在粳稻亞種內(nèi)同一類型的種質(zhì)資源之間SNP/InDel的密度分布圖上可以看出,染色體上有較多的區(qū)域無多態(tài)性位點(diǎn),而同亞種內(nèi)不同類型種質(zhì)資源之間的SNP/InDel位點(diǎn)則幾乎覆蓋全基因組。徐稻4號(hào)與越光均是現(xiàn)代粳稻品種,兩者之間的多態(tài)性SNP/InDel位點(diǎn)中,約90%的多態(tài)性位點(diǎn)之間的物理距離在1 000 bp之內(nèi),最長的多態(tài)位點(diǎn)之間距離約1.4 Mb(圖4-A)。而徐稻4號(hào)與熱帶類型粳稻種質(zhì)資源毫馬克(K)之間的多態(tài)性位點(diǎn)幾乎覆蓋了整個(gè)基因組,無明顯的空白間隔區(qū)(圖4-B)。
秈稻亞種內(nèi)的G珍汕97B與其他秈稻種質(zhì)資源的SNP/InDel位點(diǎn)在染色體上的分布均無明顯的空白間隔區(qū)。亞種內(nèi)兩兩種質(zhì)資源之間多態(tài)性位點(diǎn)密度最低的是G珍汕97B和竹珍B組合(B156~B248)(圖4-C),G珍汕97B與現(xiàn)代秈稻品種明恢63之間的多態(tài)性位點(diǎn)密度同樣處于較密的水平(圖4-D)。
注:A為InDel數(shù)量;B為SNP數(shù)量。
注:上三角顯示兩兩之間的SNP數(shù)量;下三角顯示兩兩之間的InDel數(shù)量。
表2 秈稻和粳稻類群內(nèi)和類群間的遺傳距離
注:A:徐稻4號(hào)-越光;B:徐稻4號(hào)-毫馬克(K);C:G珍汕97B-竹珍B;D:G珍汕97B-明恢63。
獲得親本間有多態(tài)性的分子標(biāo)記是基因圖位克隆的必備先決條件,自從1988年使用RFLP構(gòu)建第1張水稻分子標(biāo)記遺傳圖譜以來,分子標(biāo)記的應(yīng)用不斷增多[15]。隨著分子標(biāo)記技術(shù)發(fā)展,操作煩瑣的RFLP標(biāo)記技術(shù)逐漸被其他基于PCR的檢測技術(shù)所取代,其中最具代表性的是SSR/InDel標(biāo)記檢測技術(shù)。隨著秈稻和粳稻亞種的基因組序列完成測序,水稻SSR/InDel標(biāo)記得到了極大豐富[16]。基于PCR的檢測技術(shù)方便易用性,這種分子標(biāo)記方法至今仍被廣泛應(yīng)用。隨后,新一代的SNP標(biāo)記方法的出現(xiàn)使SNP成為遺傳學(xué)研究的有力工具,SNP標(biāo)記在基因組內(nèi)極為豐富,可以通過DNA測序、DNA芯片和KASP等技術(shù)進(jìn)行檢測[17-20]。
雖然傳統(tǒng)的基因圖位克隆方法工作量極大且非常耗時(shí),但卻是揭示未知重要基因最為有效的方法[21-22]。隨著QTL-Seq方法的報(bào)道,通過高通量測序技術(shù)發(fā)現(xiàn)新基因的進(jìn)程得以極大加快[23],這種QTL-Seq定位克隆基因的方法在模式物種水稻、玉米和擬南芥中得到廣泛應(yīng)用[24-27]。WAMBUGU等[28]利用非洲稻和亞洲稻的分離群體通過QTL-seq方法定位了與淀粉含量相關(guān)位于GBSSI基因的SNP位點(diǎn)。ARIKIT等[29]也通過該方法定位了多個(gè)與米飯延伸率、淀粉含量、糊化溫度等多個(gè)QTL位點(diǎn)。LAHARI等[30]則通過QTL-seq方法利用F2分離群體定位了位于水稻第11染色體的水稻根結(jié)線蟲病抗性QTL位點(diǎn),KAMOLSUKYEUNYONG等[31]也利用該方法定位了水稻灰飛虱的抗性QTL位點(diǎn)。與傳統(tǒng)圖位克隆方法相比,QTL-Seq方法無需進(jìn)行大量的前期引物開發(fā)和群體檢測,只需要對(duì)分離群體中的極端個(gè)體混池進(jìn)行測序即可對(duì)QTL位點(diǎn)定位。近幾年來采用這種方法有大量水稻基因被克隆[32]。QTL-Seq方法另外一個(gè)較大的優(yōu)勢在于測序數(shù)據(jù)中可以發(fā)現(xiàn)大量的SNP位點(diǎn),這些SNP位點(diǎn)在之前的傳統(tǒng)基因定位研究中是無法高效利用的,而SNP位點(diǎn)在基因組中又極為豐富,即使之前被認(rèn)為多態(tài)性位點(diǎn)較少的親緣關(guān)系較近的種內(nèi)種質(zhì)資源之間也存在豐富的SNP差異位點(diǎn),這些SNP差異位點(diǎn)都可以被用于基因定位研究。除了測序方法鑒定SNP差異位點(diǎn),新的基于PCR方法也被開發(fā)出來用于SNP檢測,如競爭性等位基因特異性PCR技術(shù)(KASP,Kompetitive allele-specific PCR)[33-34]。
水稻基因圖位克隆研究中,使用秈稻和粳稻亞種間雜交構(gòu)建分離群體是比較常見的做法,之所以選擇亞種間雜交其目的就是為了更方便地篩選具有多態(tài)性的引物。從水稻全基因組重測序項(xiàng)目中發(fā)現(xiàn),水稻亞種內(nèi)的多態(tài)性也是非常豐富的。在本研究所選用的32份種質(zhì)資源中,秈稻兩兩之間的多態(tài)性標(biāo)記密度達(dá)到每Mb 280~2 614個(gè)SNP/InDel,粳稻兩兩之間的標(biāo)記密度達(dá)到每Mb 520~3 201個(gè)SNP/InDel,這樣的標(biāo)記密度對(duì)基因克隆來說足夠豐富。一般認(rèn)為粳稻的多態(tài)性低于秈稻,但是在本研究中溫帶類型的粳稻類群與中間類型粳稻類群的多態(tài)性要高于秈稻亞種內(nèi)多態(tài)性。因此,在基因圖位克隆時(shí),使用亞種內(nèi)種質(zhì)資源進(jìn)行雜交構(gòu)建分離群體也可能會(huì)得到足夠豐富的分子標(biāo)記,同時(shí)又可克服秈粳雜交帶來的不利影響。在選擇材料時(shí),應(yīng)盡量選用亞種內(nèi)不同類型的種質(zhì)資源材料以增加多態(tài)性位點(diǎn)。