郝曉燕,張躍進(jìn),郭宏波,柯衛(wèi)東
(1.西北農(nóng)林科技大學(xué)生命科學(xué)學(xué)院,陜西楊凌,712100;2.國家種質(zhì)武漢水生蔬菜資源圃,武漢市蔬菜科學(xué)研究所)
水生蔬菜是在淡水中生長(zhǎng)、可供食用的特色蔬菜,在我國主要有蓮藕、芋頭、茭白、慈姑、荸薺、水芹、芡實(shí)、菱角、莼菜、蒲菜等12種類型。因多數(shù)水生蔬菜含膳食纖維,醫(yī)學(xué)及食品科學(xué)研究結(jié)果均表明膳食纖維對(duì)高血脂、高血壓等心血管系統(tǒng)疾病,以及便秘、腸癌等消化系統(tǒng)疾病具有良好的調(diào)理和輔助治療功能[1]。目前蓮藕、菱白、慈姑、芡實(shí)、荸薺、菱角等品種的加工產(chǎn)品均已銷售到國外市場(chǎng),出口量呈逐年增長(zhǎng)趨勢(shì),國際市場(chǎng)需求量也很大。隨著海外需求量的不斷增長(zhǎng)以及消費(fèi)需求的多樣化,借助日益更新的分子技術(shù)培育優(yōu)質(zhì)、抗病性強(qiáng)和適合加工的品種將是水生蔬菜今后育種的方向。
隨著分子生物學(xué)和生物技術(shù)的迅猛發(fā)展,分子標(biāo)記技術(shù)日新月異。單核苷酸多態(tài)性 (single nucleotide polymorphism-SNP)是繼第一代分子標(biāo)記限制性片斷長(zhǎng)度 多態(tài)性 (restricted fragments length polymorphism-RFLP)和第二代分子標(biāo)記微衛(wèi)星DNA之后第三代分子標(biāo)記技術(shù)。因其具有在基因組中數(shù)量多、分布密度高,在基因分型過程中不需要根據(jù)片段大小將DNA分帶,即可實(shí)現(xiàn)大規(guī)模、高度自動(dòng)化,從而更適合于大樣本量的檢測(cè)分析,因此SNP被認(rèn)為是很有應(yīng)用前景的分子標(biāo)記技術(shù)[2]。分子標(biāo)記是物種表現(xiàn)型在分子水平上遺傳多態(tài)性的直接映射,分子水平的遺傳多態(tài)性表現(xiàn)為DNA核苷酸序列的差異,因此檢測(cè)手段更直接、精確。隨著人類、擬南芥及水稻基因組測(cè)序的完成,越來越多的生物基因組計(jì)劃正在被闡明。目前利用SNP標(biāo)記已發(fā)現(xiàn)與人類一些重要疾?。ㄏ?、糖尿病、精神分裂癥、癌癥、鐮狀細(xì)胞貧血、血友病等)緊密連鎖的標(biāo)記基因[3]。同樣,SNP在植物多樣性、群體遺傳、系統(tǒng)進(jìn)化和功能基因組學(xué)等領(lǐng)域亦已顯示出廣泛的應(yīng)用價(jià)值[4]?;谒卟嗽谖覈奶厥庑院椭匾裕约癝NP技術(shù)的廣泛應(yīng)用前景,本文對(duì)單核苷酸多態(tài)性特點(diǎn)、檢測(cè)技術(shù)及其在其他作物上的應(yīng)用進(jìn)行了綜述,并對(duì)其在水生蔬菜遺傳育種上的借鑒作用進(jìn)行了探討。
單核苷酸多態(tài)性主要是指在基因組水平上由單個(gè)核苷酸變異所引起的DNA序列多態(tài)性,在群體中發(fā)生頻率不小于1%。它是人類可遺傳變異中最常見的一種,所表現(xiàn)的多態(tài)性只涉及到單個(gè)堿基的變異,這種變異可由單個(gè)堿基轉(zhuǎn)換或顛換所引起,也可由堿基插入或缺失所致,但通常所說SNP并不包含后兩種情況[5]。所謂轉(zhuǎn)換是指同型堿基之間的轉(zhuǎn)換,如嘌呤與嘌呤(GA)、嘧啶與嘧啶(T-C)間的替換;所謂顛換是指發(fā)生在嘌呤與嘧啶(A-T、A-C、C-G、G-T)之間的替換。 研究發(fā)現(xiàn),在變異中轉(zhuǎn)換發(fā)生頻率較高,而且以C-T轉(zhuǎn)換為主,其原因是CpG的C是甲基化的,容易自發(fā)脫氨基形成胸腺嘧啶T,CpG也因此變?yōu)橥蛔儫狳c(diǎn)[6~7]。Kanazin等[8]對(duì)5個(gè)大麥品系的54個(gè)基因分別進(jìn)行測(cè)序時(shí),發(fā)現(xiàn)3個(gè)基因的SNP共有112種多態(tài)性。Tenaillon等[9]測(cè)算出玉米1號(hào)染色體上平均每104 bp中就有一個(gè)SNP多態(tài)位點(diǎn)?;蜓芯恐行母鶕?jù)其完成的92%秈稻(Oryza sativaL.ssp.indica)基因組草圖,估算出其SNP豐度為0.43%,即170萬個(gè)左右[10]。由此可見,作物中SNP多態(tài)性非常豐富,且數(shù)量明顯高于其他分子標(biāo)記。
在基因組DNA中,任何堿基均有可能發(fā)生變異,所以SNP幾乎遍布于整個(gè)基因組中。研究表明,編碼區(qū)內(nèi)SNP(coding SNP,cSNP)比較少,這主要是由于外顯子內(nèi)堿基變異率僅有周圍序列的1/5[11~12],但它在研究遺傳性疾病時(shí)具有重要意義,因此cSNP的研究備受關(guān)注。在遺傳學(xué)分析中SNP作為一類遺傳標(biāo)記得以廣泛應(yīng)用,主要因其具有以下幾個(gè)特點(diǎn):①標(biāo)記遺傳穩(wěn)定性高。SNP是基于單核苷酸的突變,所以其突變率低;②分布密度高。在人類基因組中平均每1 900個(gè)堿基對(duì)出現(xiàn)1個(gè)SNP,在玉米一號(hào)染色體中平均每104個(gè)堿基就出現(xiàn)1個(gè)SNP位點(diǎn),幾乎可以在任何待測(cè)基因內(nèi)部或附近提供一系列標(biāo)記;③易于自動(dòng)化分析。SNP與傳統(tǒng)分子標(biāo)記方法存在明顯不同,不再以DNA長(zhǎng)度差異作為檢測(cè)手段,而是直接檢測(cè)序列變化,從而擺脫凝膠電泳的瓶頸限制,實(shí)現(xiàn)高效檢測(cè)[13]。
原則上任何能檢測(cè)單個(gè)堿基突變或多態(tài)的技術(shù)均可用于發(fā)現(xiàn)和識(shí)別SNP。近年來隨著生物技術(shù)的快速發(fā)展,SNP檢測(cè)技術(shù)日趨成熟,新的方法不斷涌現(xiàn),按研究對(duì)象不同主要分為兩類:①對(duì)未知SNP位點(diǎn)的檢測(cè)。傳統(tǒng)方法包括如單鏈構(gòu)象多態(tài)性(SSCP)、溫度梯度凝膠電泳(TGGE)、變性梯度凝膠電泳(DGGE)、限制性片段長(zhǎng)度多態(tài)性(RFLP)、隨機(jī)擴(kuò)增多態(tài)性 DNA(RAPD)等,這些方法只能檢測(cè)SNP位點(diǎn)的有或無,不能確知突變位置和堿基類別,且不能用于SNP的發(fā)掘。而SNP的發(fā)掘需要伴隨著測(cè)序工作的進(jìn)行,所以對(duì)SNP進(jìn)一步研究則需對(duì)含SNP的DNA鏈進(jìn)行測(cè)序。由于這些方法都需通過電泳進(jìn)行檢測(cè),因而難以實(shí)現(xiàn)高效、快速、自動(dòng)化的檢測(cè)目標(biāo)。
②對(duì)已知SNP位點(diǎn)的檢測(cè)。查找已知SNP的方法包括:以雜交為基礎(chǔ)的等位基因特異寡核苷酸片段分析(ASO)、突變錯(cuò)配擴(kuò)增檢驗(yàn) (MAMA)、基因芯片技術(shù)(gene chips)等。
目前興起的一些高通量、自動(dòng)化檢測(cè)SNP的方法,包括Taq Man探針技術(shù)、芯片技術(shù)陣列分析、變性高效液相色譜(DHPLC)、動(dòng)態(tài)等位基因特異的雜交、基質(zhì)輔助激光解析/電離-飛行時(shí)間質(zhì)譜 (MALDI-TOF MS)技術(shù)、毛細(xì)管電泳(CE)等[14],這些技術(shù)的出現(xiàn)使SNP位點(diǎn)的基因分型更易于實(shí)現(xiàn)。但是使用成本較高。其中最直接的檢測(cè)SNP位點(diǎn)的方法是通過對(duì)已定位的序列標(biāo)簽位點(diǎn) (sequence tagged sites,STS) 和表達(dá)序列標(biāo)簽(expressed sequence tag,EST)進(jìn)行再測(cè)序發(fā)現(xiàn)植物基因組SNP,其優(yōu)點(diǎn)是EST包含有許多表達(dá)基因的序列資料,其中一些可能會(huì)涉及作物的重要農(nóng)藝性狀,對(duì)其進(jìn)行關(guān)聯(lián)分析可以實(shí)現(xiàn)輔助遺傳育種,或者通過設(shè)計(jì)特異的PCR引物擴(kuò)增某個(gè)特定區(qū)域的DNA片段,通過測(cè)序和遺傳特征的比較來鑒定該DNA片段是否可以作為SNP標(biāo)記,但缺點(diǎn)是誤差較大。綜上所述,每種方法都有其優(yōu)缺點(diǎn),試驗(yàn)者可根據(jù)自身需求及試驗(yàn)設(shè)備等條件選擇適合自己的SNP檢測(cè)方法。
分子標(biāo)記已被廣泛用于人類、動(dòng)物和植物(或作物)的遺傳圖譜構(gòu)建、遺傳資源分類與系統(tǒng)進(jìn)化和功能基因組學(xué)等研究中。SNP以其特有的優(yōu)勢(shì)在人類遺傳學(xué)研究中已得到廣泛應(yīng)用,而其在作物中的應(yīng)用才剛剛起步,國內(nèi)外報(bào)道相對(duì)較少,從而顯示出其在作物應(yīng)用研究中具有廣闊前景。目前,在玉米、大豆、小麥中已有SNP報(bào)道,并表現(xiàn)出高度的種內(nèi)核苷酸多態(tài)性,但在功能基因組中的應(yīng)用尚處于起步階段[15]。而SNP在水生蔬菜的相關(guān)研究中尚未見報(bào)道。
隨著SNP標(biāo)記的發(fā)現(xiàn)和定位功能的提高,作物遺傳連鎖圖譜標(biāo)記密度日益升高,這為作物育種提供了前所未有的便利。隨著標(biāo)記密度的逐漸加大,基因組掃描就能將數(shù)量性狀基因位點(diǎn)(QTL)定位于染色體更細(xì)微的區(qū)域內(nèi),從而為新的主基因的發(fā)現(xiàn)和定位克隆打下良好的基礎(chǔ);高密度SNP遺傳圖譜的出現(xiàn)可使我們更精確地進(jìn)行標(biāo)記輔助選擇(MAS)和標(biāo)記輔助導(dǎo)入(MAI),降低或消除目的基因之外的遺傳背景對(duì)這些技術(shù)帶來的不良影響。Nasu等[16]建立了213個(gè)共顯性,遍布于整個(gè)水稻基因組的SNP分子標(biāo)記,并將94個(gè)SNP整合到已有的遺傳圖譜中。Davis等[17]用SNP進(jìn)行EST作圖成功獲得高分辨率的玉米B73×Mo17隨機(jī)交配4代后的群體遺傳圖譜。SNP作為一類遺傳標(biāo)記用于遺傳圖譜構(gòu)建,以此來定位和識(shí)別具有重要功能的基因。建立起完整的高密度分子圖譜,就可以定位相應(yīng)的基因,這將為水生蔬菜中農(nóng)藝性狀和重要經(jīng)濟(jì)性狀的基因定位,培育高產(chǎn)、抗逆性和抗病性強(qiáng)的品種,提供了重要的技術(shù)支撐。
生物體在漫長(zhǎng)的進(jìn)化過程中形成了自身特有的DNA堿基序列,比較物種間SNP差異,可以了解物種間親緣關(guān)系和進(jìn)化的生物學(xué)信息,從而對(duì)物種進(jìn)行精細(xì)鑒定和分類。
Wang等嘗試采用玉米中稱為“進(jìn)化位點(diǎn)”的tb1基因的SNP數(shù)據(jù)來回答栽培玉米的起源問題。他們從17個(gè)玉米基因型大約2.9 kb序列搜尋SNP,發(fā)現(xiàn)其中12個(gè)基因型屬于玉米的祖先,野生玉米在編碼tb1蛋白的基因部分序列僅有3%變異,而在啟動(dòng)子區(qū)域的變異卻非常高,但所有栽培玉米在該啟動(dòng)子區(qū)域的變異卻非常低,由此他們認(rèn)為玉米在長(zhǎng)期栽培過程中,影響啟動(dòng)子區(qū)域的選擇要比影響編碼區(qū)多得多,這些選擇導(dǎo)致了玉米表現(xiàn)型的變化[18]。Germano等[19]用核酸和葉綠體的2種特異性SNP標(biāo)記成功地對(duì)親緣關(guān)系較近、形態(tài)相似的云杉屬紅云杉和白云杉以及黑云杉進(jìn)行了區(qū)分,其中有2個(gè)SNP可將黑云杉與紅云杉和白云杉分開。比如,第410堿基位置存在SNP,在黑云杉中它編碼異亮氨酸,而在紅云杉和白云杉中卻編碼亮氨酸;有5個(gè)SNP將白云杉與紅云杉和黑云杉分開。Yamanaka等[20]對(duì)不同來源的糯稻品種進(jìn)行SNP分析,結(jié)果表明Waxy基因位點(diǎn)上兩個(gè)復(fù)等位基因Wxa和Wxb差別在于Wx基因中第一個(gè)內(nèi)含子的一個(gè)酶切位點(diǎn)單堿基發(fā)生替代 (由AGGT變?yōu)锳GTT)導(dǎo)致酶切位點(diǎn)改變而產(chǎn)生多態(tài)性,從而使Wx基因在該位點(diǎn)形成復(fù)等位基因Wxa和Wxb,同時(shí)在353個(gè)糯稻中發(fā)現(xiàn)11個(gè)是AGGT,由于認(rèn)為粳稻W(wǎng)x基因都AGTT,因此他們認(rèn)為糯稻來源于粳稻。
單個(gè)堿基的差異可能決定一個(gè)基因功能的改變,SNP用于研究基因功能具有重要意義。利用SNP探索作物基因功能組學(xué)的研究在小麥、水稻中報(bào)道較多。
水稻抗稻瘟病基因Pi-ta與等位感病基因的區(qū)別在于基因編碼區(qū)存在7個(gè)堿基替換,造成氨基酸鏈中有5個(gè)氨基酸差異,通過表型分析發(fā)現(xiàn),造成抗病基因與感病基因功能差異的關(guān)鍵因素是等位基因編碼的氨基酸鏈中第918個(gè)氨基酸的差異,抗病基因編碼丙氨酸,而感病基因則編碼為絲氨酸[21]。水稻淀粉酶IIa(SSIIa)基因位點(diǎn)存在5個(gè)SNP,其中一個(gè)SNP引起了氨基酸編碼的改變,并認(rèn)為靠近C末端的兩個(gè)SNP引起氨基酸的變化,可能是引起淀粉酶Ⅱa基因活性和淀粉粒群叢改變的關(guān)鍵因素[22]。水稻半矮稈基因sd21等位基因中大多數(shù)是由于基因組中編碼一種赤霉素氧化酶(GA20-ox)的基因編碼區(qū)一段核苷酸缺失造成GA20-ox基因功能喪失;另一種情況是在GA20-ox基因編碼區(qū)內(nèi)第798個(gè)堿基由C變?yōu)門,從而使氨基酸鏈第266個(gè)氨基酸由亮氨酸變?yōu)楸彼?,而亮氨酸在GA20-ox的氨基酸鏈中是高度保守的,由于單堿基的取代使基因編碼的氨基酸改變,導(dǎo)致了GA20-ox功能的喪失,使水稻由高稈突變?yōu)榘抂23]。Wang等[24]在研究了6個(gè)野生稻品種谷子中淀粉結(jié)構(gòu)和理化特性后發(fā)現(xiàn),與栽培稻的長(zhǎng)鏈淀粉相比,野生稻谷子具有更高的膨脹力、水溶性、較低的β-淀粉分解限制和粘性,并認(rèn)為因野生稻中直鏈淀粉含量和支鏈淀粉結(jié)構(gòu)的差異會(huì)造成加工以及品質(zhì)上的差異。在水稻中,直鏈淀粉的含量常常是決定烹調(diào)和米食加工質(zhì)量的一個(gè)重要指標(biāo),直鏈淀粉含量低的品質(zhì)優(yōu)。研究發(fā)現(xiàn),所有直鏈淀粉含量低于18%的品種其序列都是AATTATA,而直鏈淀粉含量在中等水平以上的26個(gè)品種在該位置的序列都是AAGTATA,這種TG轉(zhuǎn)換與直鏈淀粉含量的相關(guān)性在育種實(shí)踐中很有價(jià)值[25]。
SNP具有多態(tài)性豐富,在作物基因組中分布密度大等優(yōu)點(diǎn),在人類和重要作物上已顯示出其特有的優(yōu)勢(shì)和廣泛應(yīng)用前景,它在遺傳圖譜構(gòu)建、資源分類和遺傳進(jìn)化,以及功能基因組學(xué)方面的特長(zhǎng)將為其他經(jīng)濟(jì)作物提供良好的技術(shù)支撐。水生蔬菜是我國乃至世界蔬菜的特色種類,對(duì)其育種、遺傳學(xué)和基因組學(xué)方面的研究尚處于初級(jí)階段,盡快吸納新技術(shù)加速我國特色蔬菜的研究是當(dāng)務(wù)之急。
我國水生蔬菜資源豐富,其中以蓮藕資源最為豐富。盡管過去在形態(tài)學(xué)分類[26~27]、分子標(biāo)記技術(shù)[28]和品質(zhì)方面[29]做了一些工作,但無論是基礎(chǔ)研究還是應(yīng)用研究,都仍有許多工作需要開展?;A(chǔ)研究方面包括:美洲黃蓮作為中國蓮亞種的直接分子證據(jù);中國蓮3種類型的進(jìn)化機(jī)理及其時(shí)間次序;藕蓮不開花或少開花的分子調(diào)控機(jī)理;藕蓮和子蓮產(chǎn)量和品質(zhì)的調(diào)控機(jī)理;花蓮不同花型、花色的進(jìn)化與分子雜交機(jī)制;應(yīng)用研究包括:藕蓮和子蓮高產(chǎn)品種的選育;藕蓮加工品種的選育;花蓮品種各花色和花型形的選育。而其他水生蔬菜種類與蓮藕相比,則還有更多的工作需要開展。
[1]Tungland B C,Meyer D.Non digestible oligo-and Polysaccharides(dietary fiber):their physiology and role in human health and food [J].Comprehensive Reviews in Food Science and Food Safety,2002,3:73-92.
[2]劉傳光,張桂權(quán).水稻單核苷酸多態(tài)性及其應(yīng)用[J].遺傳,2006,28(6):737-744.
[3]Risch N,Merikangas K.The future of genetic studies of complex human diseases [J].Science,1996,273:1 516-1 517.
[4]杜春芳,劉惠民,李潤(rùn)植,等.單核苷酸多態(tài)性在作物遺傳及改良中的應(yīng)用[J].遺傳,2003,25(6):735-739.
[5]杜瑋南,孫紅霞,方福德.單核苷酸多態(tài)性的研究進(jìn)展[J].中國醫(yī)學(xué)科學(xué)院學(xué)報(bào),2000,8(22):392-394.
[6]Johnson G C L,Told J A.Strategies in complex disease mapping [J].Current Opinion Genetics&Development,2000,10(3):330-334.
[7]Mullikin J C,Hunt S E,Cole C G,et al.A single-nu-cleotide polymorphisms map of human chromosome 22[J].Nature,2000,407(6803):516-520.
[8]Kanazin V,Talbert H,See D,et al.Discovery and assay of single-nucleotide polymorphisms in barley (Hordeum vulgare)[J].Plant Molecular Biology,2002,48(5):529-537.
[9]Maud I,Tenaillon,Mark C,et al.Patterns of DNA sequence polymorphism along chromosom-e 1 of maize (Zea mays ssp.maysL.)[J].PNAS,2001,98(16):9 161-9 166.
[10]Yu J,Hu S N,Wang J,et al.A draft sequence of the rice genome (Oryza sativaL.ssp.indica)[J].Science,2002,296(13):79-92.
[11]Li W,Sadler L A.Low nucleotide diversity in Man[J].Genetics,1991,129:513-523.
[12]Nickerson D A,Taylor S L,Weiss K M,et al.DNA sequence diversity in a 917 kb region of the human lipoprotein lipase gene[J].Nature Genetics,1998,19:233-240.
[13]Mochida K,Yamazaki Y,Ogihara Y.Discrimination of homoelogous gene expression in hexaploid wheat by SNP analysis of contigs grouped from A large number of expressed sequence tags [J].Molecular Genetics and Genomics,2004,270:371-377.
[14]汪維鵬,倪坤儀,周國華.單核苷酸多態(tài)性檢測(cè)方法研究進(jìn)展[J].遺傳,2006,28(1):117-126.
[15]Rafalski A.Applications of Single Nucleotide Polymorphisms in Crop Genetics[J].Current Opinion in Plant Biology,2002(5):94-100.
[16]Nasu S,Suzuki J,Ohta R,et al.Search for and analysis of single nucleotide polymorphisms (SNPs)in rice(Oryza sativa,Oryza rufipogon)and establishment of SNP markers[J].DNA Research,2002,9(5):163-171.
[17]Davis G,Long M J,Lee M,et al.The Intermated B73 x Mo17 Genetic Map:a Community Resource 2001,(http://www.agron.missouri.edu)[EB//OL].
[18]Wang R L,Syeca A,Hey J,et al.The limits of selection during maize domestication[J].Nature,1999,398:236-239.
[19]Germano J,Klein A S.Species-specific nuclear and chloroplast single nucleotide polymorphisms to distinguish Picea glauca,P.mariana and P.rubens [J].Theoretical and Applied Genetics,1999,99:37-49.
[20]Yamanaka S,Nakamura I,Watanabe K N,et al.Identification of SNPs in the waxy gene among glutinous rice cultivars and their evolutionary significance during the domestication process of rice [J].Theoretical and Applied Genetics,2004,108(7):1 200-1 204.
[21]Bryan G T,Wu K S,Farrall L,et al.A single amino acid difference distinguishes resistant and susceptible alleles of the rice blast resistance genePi-ta [J].Plant Cell,2000,12(11):2 033-2 046.
[22]Umemoto T,Aoki N.Single-nucleotide polymorphisms in rice starch synthaseⅡa that alter starch gelatinisation and starch association of the enzyme [J].Functional Plant Biology,2005,32(9):763-768.
[23]Spielmeyer M,Ellis M H,Chandler P M.Semidwarf(sd21), “Green Revolution” Rice,contains a defective gibberellin 20-oxidase gene[J].Proceeding of the National Academy of Sciences of the United States of America,2002,99(13):9 043-9 048.
[24]Wang L F,Wang Y J,Porter R.Structure and physicochemical properties of six wild rice starch [J].Journal of Agricultural and Food Chemistry,2002,50:2 695-2 699.
[25]Ayres N M,McClung A M,Larkin P D,et al.Microsatellites and a single-nucleotide polymorphism in an extended pedigree of US rice germplasm [J].Theoretical and Applied Genetics,1997,94:773-781.
[26]倪學(xué)明.中國蓮 [M].北京:科學(xué)出版社,1987:1-163.
[27]王其超,張行言,胡春根.荷花分類新系統(tǒng)[J].武漢植物學(xué)研究,1997,15(1):19-26.
[28]Guo H B,Li S M,Peng J,et al.Genetic diversity of Nelumbo accessions revealed by RAPD [J].Genetic Resources and Crop Evolution,2007,54:741-748.
[29]柯衛(wèi)東,黃新芳,傅新發(fā).蓮藕主要營(yíng)養(yǎng)品質(zhì)和農(nóng)藝性狀的遺傳分析[J].武漢植物學(xué)研究,2000,18(6):519-522.