劉淑娟 ,朱 艷 ,張曉軍 ,李 欣 ,郭慧娟 ,暢志堅(jiān) ,喬麟軼
(1.山西大學(xué)生物工程學(xué)院,山西太原 030006;2.山西省農(nóng)業(yè)科學(xué)院作物科學(xué)研究所,作物遺傳與分子改良山西省重點(diǎn)實(shí)驗(yàn)室,農(nóng)業(yè)部黃土高原作物基因資源與種質(zhì)創(chuàng)制重點(diǎn)實(shí)驗(yàn)室,山西太原 030031)
谷類作物提供了人體每天所需20%的熱量和25%的蛋白(www.fao.org/faostat)。其中,小麥?zhǔn)亲顬橹匾募Z食作物。異源六倍體小麥的全基因組是由來自3個(gè)不同祖先、親緣關(guān)系較近的基因組組成,因此,存在大量同源的3個(gè)等位基因(大于85%)。與模式植物擬南芥(基因組大小130~140 Mb)和禾谷類模式植物水稻(基因組大小400 Mb)相比,小麥的基因組較大,為17 Gb。除了在模式體系中需要較小基因組外,基因發(fā)現(xiàn)策略的一個(gè)重要組成部分依賴于植物的轉(zhuǎn)化效率,這2點(diǎn)使得其在基因組學(xué)的研究遠(yuǎn)落后于水稻和玉米等二倍體作物[1]。隨著近年來測(cè)序技術(shù)和功能基因組學(xué)的飛速發(fā)展,以及基因組學(xué)研究方法的不斷改進(jìn)和完善,為小麥基因組研究創(chuàng)造了機(jī)會(huì),因而,小麥基因組學(xué)迎來了新的時(shí)代。
多倍體小麥主要有2種類型:四倍體栽培小麥(硬粒小麥,Triticum durum,AABB)和六倍體面包小麥(Triticum aestivum,AABBDD),二者祖先均為四倍體野生二粒小麥。早期野生二粒小麥經(jīng)馴化成為四倍體栽培小麥,與二倍體粗山羊草(Aegilops tauschii)雜交形成普通小麥[2]。鑒于小麥多倍體物種的同源性,存在于四倍體和六倍體小麥中的基因大部分呈現(xiàn)2~3個(gè)功能拷貝,稱為“同源”,編碼序列間的相似性高達(dá)97%。
缺乏完整的參考基因組一直限制著小麥測(cè)序的研究進(jìn)展[3]。最初致力于用long-insert法構(gòu)建個(gè)體染色體BAC文庫。隨著第2代測(cè)序技術(shù)的出現(xiàn),可以對(duì)全基因組或單染色體臂進(jìn)行鳥槍法測(cè)序。盡管這是個(gè)階段性成果,但數(shù)百萬個(gè)contigs仍是高度片段化的。自2017年起,公共和私人領(lǐng)域的組裝技術(shù)有了質(zhì)的飛躍[4-5],使六倍體小麥“中國(guó)春”的參考基因組組裝到了其21條染色體上。
小麥的研究領(lǐng)域已進(jìn)入“后中國(guó)春”時(shí)代,即實(shí)現(xiàn)了對(duì)不同小麥品種進(jìn)行快速且低成本的完整測(cè)序和組裝。該技術(shù)已經(jīng)用于小麥祖先品種和栽培品種中,已新公布了5個(gè)小麥品種:Robigus,Paragon,Claire,Cadenza和Kronos。盡管與中國(guó)春相比,這些品種數(shù)據(jù)庫的組裝序列較少,但包含了大量的編碼蛋白質(zhì)序列,可對(duì)其進(jìn)行詳細(xì)的功能分析。2017年小麥基因組研究領(lǐng)域從擁有一個(gè)高度片段化的單一參考基因組到擁有一個(gè)麥族泛基因組,包括了大麥、小麥和多個(gè)祖先種的全基因組數(shù)據(jù)以及15個(gè)四倍體和六倍體小麥品種的重測(cè)序數(shù)據(jù)。
隨著小麥參考基因組序列的不斷改進(jìn),可以對(duì)這些序列進(jìn)行額外的注釋,在已測(cè)序完成的幾個(gè)小麥品種中,最初的基因注釋側(cè)重于描述小麥啟動(dòng)子區(qū)DNA的甲基化模式。這些模式在同源群間大都是保守的,只有少部分存在基因組特異性[6]。RNA測(cè)序分析結(jié)果也顯示,整體上不存在單個(gè)基因組優(yōu)勢(shì),盡管在某種細(xì)胞類型或某個(gè)特異階段確實(shí)觀察到一定程度的基因組特異現(xiàn)象。最近發(fā)布了一套基于PacBio cDNA reads技術(shù)改進(jìn)的編碼蛋白和長(zhǎng)非編碼RNA的基因注釋[4],這將有利于鑒定出那些具有重要農(nóng)藝性狀的完整基因家族。另外,這些注釋已被用于比對(duì)400多個(gè)公共RNA-seq樣本數(shù)據(jù),從而完善小麥的基因表達(dá)圖譜[7-8]。
此外,改進(jìn)的基因組和基因注釋[9]為研究選擇壓力在不同倍性水平下對(duì)同源基因的作用提供了可能。這將更好的理解編碼和非編碼序列(如啟動(dòng)子)的進(jìn)化過程、表觀遺傳變化[6]和開放染色質(zhì)結(jié)構(gòu)[10],進(jìn)而了解多倍體是如何將各自同源基因組的信息整合后呈現(xiàn)最終的表型。
中國(guó)春物理圖譜和多個(gè)品種重測(cè)序數(shù)據(jù)也為小麥育種提供了新的研究方法。例如,小麥科研人員和育種家已經(jīng)普遍將單核苷酸多態(tài)性標(biāo)記(SNP)芯片技術(shù)用于研究[11],但這些SNP只是基于拼接不完全的短序列開發(fā),并被粗略地定位在很大的基因區(qū)域中[12]。而新的物理圖譜和多品種重測(cè)序數(shù)據(jù)將使得建立長(zhǎng)序列的單倍型成為可能[13]。利用大規(guī)模的SNP數(shù)據(jù),可以鑒定出與重測(cè)序結(jié)果一致的基因組區(qū)段,而不一致的位點(diǎn)則可以用來預(yù)測(cè)新的單倍型。例如,2005—2018年英國(guó)推廣了118個(gè)小麥品種,其中69%的品種來源于1個(gè)親本,這個(gè)親本與已經(jīng)重測(cè)序的Cadenza,Robigus和Claire具有相關(guān)性。這類結(jié)果對(duì)于關(guān)聯(lián)分析[14]、圖位克隆、基因丟失和結(jié)構(gòu)重排診斷等研究都有很好的促進(jìn)作用,此外還能確定基因的拷貝數(shù)變異,這對(duì)于一些重要調(diào)節(jié)基因(如 VRN-A1,Ppd-B1,CBF等)的功能變異是非常關(guān)鍵的。更重要的是,通過鑒定出目前優(yōu)良品種中的單倍型,可以據(jù)此有針對(duì)性的從小麥祖先種和地方種中發(fā)掘變異類型。這使得對(duì)那些在馴化過程中或20世紀(jì)小麥育種早期丟失的單倍型進(jìn)行選擇和評(píng)估成為可能[15]。
在模式作物中,已經(jīng)可以用測(cè)序作圖的方法對(duì)控制質(zhì)量性狀或數(shù)量性狀的基因進(jìn)行克隆[16]。而在多倍體小麥中,龐大基因組的測(cè)序費(fèi)用高昂導(dǎo)致近幾年一直缺乏一個(gè)完整的參考基因組圖譜,使得在該領(lǐng)域落后于模式作物。而大部分精力都集中在簡(jiǎn)化基因組上,研究對(duì)象就是那些基于RNA-seq[17-18],DNA捕獲[19-20]或測(cè)序分型得到的特定序列。這些方法最初被用于自然變異定位,最近則擴(kuò)展到誘變突變?nèi)后w中的多態(tài)性鑒定。這些基于構(gòu)建突變?nèi)后w的方法被統(tǒng)稱為“突變基因組學(xué)”[21],為在小麥等龐大復(fù)雜的基因組中發(fā)現(xiàn)變異類型提供了一個(gè)新的思路。例如,最早為抗病基因[21-22]開發(fā)的外顯子捕獲平臺(tái)(主要是抗病基因)已被用于對(duì)大量突變體中的DNA進(jìn)行捕獲和測(cè)序,從而診斷出目標(biāo)基因的隱性等位基因。而為了避免那些無法預(yù)測(cè)的新基因類型還開發(fā)了基于染色體的研究方法。這些方法已經(jīng)在多倍體小麥被證實(shí)對(duì)那些由單基因控制的功能缺失表型非常有價(jià)值,但是對(duì)于大部分復(fù)雜性狀,NGS遺傳學(xué)可能不具有很高的效率。
與二倍體模式物種相比,小麥中一直缺乏反向遺傳中用于驗(yàn)證基因功能的材料。這是由于小麥同源群之間序列的高度相似性,隱性等位基因的效應(yīng)被其他同源群的等位變異所掩蓋,緩沖了小麥中正常的自然變異。當(dāng)然,這種掩蓋效應(yīng)也使小麥獲得了比二倍體物種更耐受高突變密度的能力[2]。然而,這種冗余也提供給多倍體小麥一種與二倍體物種相比的高突變密度的持續(xù)耐受力。高蘭英等[23-24]最近開發(fā)了一套用于小麥功能基因組學(xué)分析的新材料。他們對(duì)2 735份EMS誘導(dǎo)的四倍體小麥(Kronos)突變體和六倍體小麥(Cadenza)突變體材料進(jìn)行DNA外顯子捕獲測(cè)序,從編碼區(qū)鑒定出1 000多萬個(gè)高度可信(P>0.99)的突變位點(diǎn),平均每個(gè)四倍體和六倍體小麥中分別有2 705,5 351個(gè)突變位點(diǎn),然后將66%的突變位點(diǎn)進(jìn)行了定位。進(jìn)一步研究發(fā)現(xiàn),大約有3%的突變?cè)斐闪俗x碼框提前終止或轉(zhuǎn)錄本錯(cuò)誤剪接,而有38%的突變?yōu)殄e(cuò)義突變。
除了突變?nèi)后w以外,基因編輯技術(shù)的進(jìn)步同樣為多倍體小麥中基因的缺失驗(yàn)證提供了新途徑。WANG等[25]利用類轉(zhuǎn)錄激活因子效應(yīng)核酶技術(shù)(Transcription activator-like effector nucleases,TALENs)首次同時(shí)下調(diào)了小麥MLO的3個(gè)同源拷貝,從而使植株表現(xiàn)出對(duì)白粉病的抗性。隨后,他們又運(yùn)用最新的CRISPR/Cas9技術(shù)實(shí)現(xiàn)了同樣的實(shí)驗(yàn)結(jié)果。此外,病毒誘導(dǎo)基因沉默技術(shù)(virus induced gene silencing,VIGS)[26]和 RNA 干涉技術(shù)(RNA-interference,RNAi)也被充分應(yīng)用在小麥的功能驗(yàn)證中。
毫無疑問,目前取得的進(jìn)展將在未來幾年內(nèi)大大促進(jìn)小麥研究。目前人們已經(jīng)可以分離出定位圖譜區(qū)間內(nèi)的所有基因序列,并能通過分析數(shù)百個(gè)RNA-seq樣本來驗(yàn)證這些序列的表達(dá)模式,還能比對(duì)基因在不同品種間的序列差異來確定單倍型,甚至可以在幾天內(nèi)通過篩選突變體庫來驗(yàn)證功能。這些進(jìn)展有助于快速、準(zhǔn)確地檢測(cè)小麥品種資源所攜帶的基因,并將用于抗病、優(yōu)質(zhì)小麥品種和遺傳材料的選育,可大大加快育種步伐[11]。面對(duì)不斷更新的基因組數(shù)據(jù)和資源,需要科研人員和育種家加強(qiáng)學(xué)科交流,有效地將基因組學(xué)與大田育種相結(jié)合,從而更快更好的將小麥科研的最新成果盡快轉(zhuǎn)化為農(nóng)民和消費(fèi)者需要的優(yōu)良小麥品種。
[1]代君麗,李振岐.小麥的比較基因組學(xué)和功能基因組學(xué)[J].西北植物學(xué)報(bào),2004,24(5):949-953.
[2] DUBCOVSKY J,DVORAK J.Genome plasticity a key factor in the success of polyploid wheat under domestication [J].Science,2007,316:1862-1866.
[3]凌宏清.小麥及其近緣種基因組測(cè)序研究進(jìn)展與發(fā)展趨勢(shì)[J].麥類作物學(xué)報(bào),2016,36(4):397-403.
[4]CLAVIJO B J,VENTURINI L,SCHUDOMA C,et al.An improved assembly and annotation of the allohexaploid wheat genome identifies complete families of agronomic genes and provides genomic evidence for chromosomal translocations [J].Genome Research,2017,27(5):885.
[5]POZNIAK C.IWGSC whole genome shotgun sequencing of Chinese Spring:towards a reference sequence of wheat[C]//Plant and animal genome XXIV.San Diego:The International Wheat Genome SequencingConsortium,2016.
[6]GARDINER L J,QUINTON M,OLOHAN L,et al.A genome-wide survey of DNA methylation in hexaploid wheat[J].Genome Biol,2015,16:273.
[7] BORRILL P,RAMIREZ R,UAUY C.expVIP:a customizable RNA-seq data analysis and visualisation platform[J].Plant Physiol,2016,170:2172-2186.
[8] PEARCE S,VAZQUEZ H,HERIN S Y,et al.WheatExp:an RNA-seq expression database for polyploid wheat[J].BMC Plant Biol,2015,15:299.
[9]王長(zhǎng)彪,韓斌,劉江,等.小麥相關(guān)功能基因的全基因組電子定位及基因注釋[J].山西農(nóng)業(yè)科學(xué),2016,44(7):894-899.
[10] RODGERS E,VERA D L,BASS H W,et al.Open chromatin reveals the functional maize genome[J].Proc Natl Acad Sci USA,2016,113:3177-3184.
[11]韓斌,王長(zhǎng)彪,任永康,等.小麥分子育種研究進(jìn)展IV.小麥相關(guān)分子標(biāo)記[J].山西農(nóng)業(yè)科學(xué),2015,43(4):489-492.
[12] MASCHER M,MUEHLBAUER G J,ROKHSAR D S,et al.Anchoring and ordering NGS contig assemblies by population sequencing(POPSEQ)[J].Plant J,2013,76:718-727.
[13] JORDAN K W,WANG S,LUN Y,et al.A haplotype map of allohexaploid wheat reveals distinct patterns of selection on homoeologous genomes[J].Genome Biol,2015,16:48.
[14]HUANG X,HAN B.Natural variations and genome-wide association studies in crop plants[J].Annu Rev Plant Biol,2014,65:531-551.
[15]UAUY C,DISTELFELD A,F(xiàn)AHIMA T,et al.A NAC gene regulating senescence improves grain protein,zinc,andiron content in wheat[J].Science,2006,314:1298-1301.
[16]SCHNEEBERGER K.Using next-generation sequencing to isolate mutant genes from forward genetic screens[J].Nat Rev Genet,2014,15:662-676.
[17] RAMIREZ R H,SEGOVIA V,BIRD N,et al.RNA-Seq bulked segregant analysis enables the identification of high-resolution genetic markers for breedingin hexaploid wheat[J].Plant Biotechnol J,2015,13:613-624.
[18]TRICKM,ADAMSKI NM,MUGFORDSG,et al.CombiningSNP discoveryfromnext-generation sequencingdata with bulked segregant analysis(BSA)tofine-map genes in polyploid wheat[J].BMC Plant Biol,2012,12:14.
[19] GARDINERLJ,BANSEPTP,OLOHANL,etal.Map-ping-by-sequencing in complex polyploid genomes using genic sequence capture:a case study to map yellow rust resistance in hexaploid wheat[J].Plant J,2016,87:403-419.
[20]KING R,BIRD N,RAMIREZ R,et al.Mutation scanning in wheat by exon capture and next-generation sequencing[J].PLoS One,2015,10:e0137549.
[21] STEUERNAGEL B,PERIYANNAN S K,HERNANDEZ I,et al.Rapid cloning of disease-resistance genes in plants using mutagenesis and sequence capture [J].Nat Biotechnol,2016,34:652-655.
[22] JUPE F,WITEK K,VERWEIJ W,et al.Resistance gene enrichment sequencing(RenSeq)enables reannotation of the NB-LRR gene family from sequenced plant genomes and rapid mapping of resistance loci in segregating populations[J].Plant J,2013,76:530-544.
[23]高蘭英,馬慶.誘發(fā)突變技術(shù)在小麥育種研究中的應(yīng)用[J].山西農(nóng)業(yè)科學(xué),2009,37(6):7-12.
[24] KRASILEVA KV,VASQUEZ H,HOWELL T,et al.Uncovering hidden variation in polyploid wheat[J].Proc Natl Acad Sci USA,2017,114:912-913.
[25]WANGY,CHENGX,SHANQ,et al.Simultaneous editingofthree homoeoalleles in hexaploid bread wheat confers heritable resistance topowderymildew[J].Nat Biotechnol,2014,32:947-951.
[26]張鵬鈺,袁珍,王國(guó)瑞,等.普通小麥Trx59基因的克隆及功能驗(yàn)證[J].華北農(nóng)學(xué)報(bào),2017,32(5):1-6.