張朝陽(yáng), 程 瑞, 徐兵劃, 顧 妍, 黃大躍, 孫玉東
(江蘇徐淮地區(qū)淮陰農(nóng)業(yè)科學(xué)研究所/淮安市設(shè)施蔬菜重點(diǎn)實(shí)驗(yàn)室,江蘇 淮安 223001)
葉片是植物進(jìn)行光合作用最主要的器官,對(duì)植物的生存具有重要意義,葉片顏色在很大程度上決定了植物的光合效率[1]。植物葉色突變不僅是研究葉綠素相關(guān)基因功能及植物發(fā)育的重要材料[2],也是優(yōu)良的形態(tài)標(biāo)記性狀,在實(shí)際生產(chǎn)中常被用來(lái)進(jìn)行品種純度鑒定[3]。關(guān)于水稻、大麥、小麥、玉米、棉花、大豆、蠶豆、番茄、擬南芥等多種植物葉色突變的研究已有報(bào)道[4],葉色突變類型豐富多樣,包括白化、黃化、黃綠化等[5-6]。植株葉色的形成不僅受到葉綠體生物合成途徑、葉綠素降解途徑、血紅素代謝途徑、類胡蘿卜素代謝途徑等與光合色素代謝途徑相關(guān)基因的影響,受到與葉綠體發(fā)育相關(guān)基因的調(diào)控,還與光、溫度、植物激素、礦物元素和金屬離子等外界環(huán)境因素息息相關(guān)[6-9]。目前,關(guān)于水稻、玉米、擬南芥等模式植物中葉色的研究較為深入,水稻、玉米中已報(bào)道的葉色突變體均超200個(gè)[10-13],對(duì)擬南芥的研究發(fā)現(xiàn),葉色突變以隱性遺傳為主,目前已經(jīng)發(fā)現(xiàn)27個(gè)編碼15種葉綠素生物合成酶的核基因,它們的任何異常突變都會(huì)導(dǎo)致葉綠素缺乏,從而產(chǎn)生黃色突變[14]。近年來(lái),隨著高通量測(cè)序技術(shù)的應(yīng)用,關(guān)于辣椒、甜瓜和黃瓜等一些重要經(jīng)濟(jì)作物的葉色突變研究也逐漸展開(kāi)[15-19]。
西瓜是全球十大水果之一,中國(guó)西瓜栽培面積和消費(fèi)量均居世界首位。隨著雜交育種的發(fā)展,西瓜育種已基本實(shí)現(xiàn)雜種一代化,對(duì)制種純度提出了更大挑戰(zhàn),葉形、葉色雖是重要的形態(tài)標(biāo)記性狀,但尚未應(yīng)用于育種中。西瓜的遺傳基礎(chǔ)狹窄,自然突變率低,目前有關(guān)西瓜葉色突變的報(bào)道有斑駁突變類型[20]、白化突變類型[21-22]、不完全顯性黃葉突變類型[22]、后綠突變類型[23]、黃化突變類型[24-25]等,但研究主要集中于遺傳規(guī)律、生理特性[21-25]。西瓜基因組的公布和測(cè)序技術(shù)的快速發(fā)展為西瓜重要性狀定位、關(guān)鍵基因功能研究奠定了重要生物學(xué)基礎(chǔ)[26-29]。Kidanemariam[30]發(fā)現(xiàn),西瓜后綠突變體Houlv中的ClCG03G010030基因存在1個(gè)單核苷酸多態(tài)性(SNP)變異,導(dǎo)致該基因編碼的FtsH胞外蛋白酶序列中精氨酸突變?yōu)橘嚢彼?FtsH蛋白主要參與葉綠體早期發(fā)育,進(jìn)而影響西瓜葉片顏色。Zhu等[25]對(duì)葉片黃化突變西瓜材料w-yl進(jìn)行精細(xì)定位,認(rèn)為基因Cla97C02G036040、Cla97C02G036050和Cla97C02G036060可能是導(dǎo)致西瓜葉片黃化的主要基因。探索葉片顏色變異機(jī)制可為遺傳改良提供理論依據(jù),滿足人們?cè)谏a(chǎn)、選種和育種等方面的需求;開(kāi)發(fā)葉色形態(tài)標(biāo)記,能夠有效縮短育種周期,提高育種效率與制種純度。本研究擬以全生育期葉片黃化西瓜材料ly104和綠葉西瓜材料w3為試驗(yàn)材料,通過(guò)混合分組分析(BSA)測(cè)序初步定位葉片黃化基因在染色體中的位置,進(jìn)一步利用簡(jiǎn)化基因組(RAD)測(cè)序開(kāi)發(fā)全基因組SNP分子標(biāo)記,利用F2代群體構(gòu)建高密度遺傳圖譜進(jìn)行西瓜葉片黃化基因定位,結(jié)合轉(zhuǎn)錄組測(cè)序及基因功能注釋鎖定關(guān)鍵候選基因。本研究結(jié)果可為進(jìn)一步全面解析西瓜葉片黃化基因及其生物學(xué)功能奠定重要基礎(chǔ)。
2014年,利用甲基磺酸乙酯(EMS)誘變獲得的穩(wěn)定遺傳的葉片黃化西瓜材料,經(jīng)5代連續(xù)自交獲得相對(duì)純合的葉片黃化突變材料ly104。本研究以ly104為母本(P1),以正常綠葉西瓜材料w3為父本(P2)構(gòu)建F1代、F2代、BC1代群體,群體的構(gòu)建與表型調(diào)查試驗(yàn)均于淮安市農(nóng)業(yè)科學(xué)研究院科研創(chuàng)新基地進(jìn)行,群體配制過(guò)程嚴(yán)格自交、雜交,整個(gè)生育期采取商品化管理。
以第1張完全展開(kāi)的真葉進(jìn)行表型統(tǒng)計(jì)與分析,采用人工觀察和便攜式色差儀RM200QC(愛(ài)色麗X-Rite,美國(guó))對(duì)葉片顏色指數(shù)進(jìn)行測(cè)定,測(cè)定指標(biāo)為亮度值(L*)、紅綠值(a*)和黃藍(lán)值(b*)3個(gè)顏色參數(shù)。對(duì)F1代、F2代、BC1代群體分離表型進(jìn)行統(tǒng)計(jì),分析西瓜葉片黃化遺傳規(guī)律,并進(jìn)行卡方檢驗(yàn)。
BSA測(cè)序即混合分組分析法,是一種簡(jiǎn)單快速的目標(biāo)性狀定位方法,已被廣泛應(yīng)用于多種園藝作物重要性狀的基因定位[31]。本研究從F2代西瓜群體中選取黃葉、綠葉極端表型植株各20株,采用十六烷基三甲基溴化銨(CTAB)法[32]提取植株幼葉基因組DNA并檢測(cè)其濃度,通過(guò)等量混勻構(gòu)建2個(gè)極端混池,利用親本DNA構(gòu)建親本池進(jìn)行測(cè)序分析,送至上海凌恩生物科技有限公司,利用Illunima HiSeq 4000進(jìn)行測(cè)序,親本測(cè)序深度為10×,混池測(cè)序深度為20×,測(cè)序讀長(zhǎng)為150 bp。對(duì)原始序列(Read)進(jìn)行過(guò)濾,去除接頭,過(guò)濾掉包含未確定堿基(N)>15%和低質(zhì)量的read(質(zhì)量值≤20的堿基數(shù)占整個(gè)Read的10%以上),將獲得的干凈序列(Clean read)用于后續(xù)分析。使用BWA軟件[33]將高質(zhì)量的Clean read映射到西瓜基因組97103v2(http://cucurbitgenomics.org/organism/21)上。然后用GATK[34]、SnpEff[35]軟件對(duì)突變位點(diǎn)進(jìn)行檢測(cè)和注釋,用SNP-index算法進(jìn)行關(guān)聯(lián)分析,閾值為0.5。
為了更精確地定位獲得西瓜葉片黃化突變位點(diǎn),本研究根據(jù)F2代群體中黃葉、綠葉分離比選取共100份單株,分別提取基因組DNA,采用RAD建庫(kù)方式構(gòu)建長(zhǎng)度范圍在300~500 bp的雙端文庫(kù)。將產(chǎn)物送至上海凌恩生物科技有限公司,利用Illunima HiSeq進(jìn)行測(cè)序,測(cè)序讀長(zhǎng)為150 bp。對(duì)原始Read采用以下標(biāo)準(zhǔn)進(jìn)行質(zhì)控:(1)去除Read中的接頭序列;(2)修剪測(cè)序質(zhì)量較低的Read末端(測(cè)序質(zhì)量值小于Q20);(3)去除含N比例達(dá)到10%的Read;(4)舍棄接頭及質(zhì)量修剪后長(zhǎng)度小于100 bp的小片段。用BWA軟件將Clean read比對(duì)至參考基因組97103v2,并對(duì)映射結(jié)果進(jìn)行統(tǒng)計(jì)分析。用GATK軟件進(jìn)行變異位點(diǎn)檢測(cè)獲得SNP。對(duì)獲得的SNP按以下標(biāo)準(zhǔn)進(jìn)行過(guò)濾:(1)去除比對(duì)Read質(zhì)量值小于20的位點(diǎn),同時(shí)過(guò)濾掉缺失率大于50%的SNP;(2)刪除無(wú)義SNP位點(diǎn);(3)用joinmap 4.0軟件[36]對(duì)過(guò)濾后的SNP進(jìn)行卡方測(cè)驗(yàn),先后過(guò)濾掉P<0.01和缺失率30%以上的標(biāo)記,對(duì)于最終獲得的SNP,采用joinmap 4.0軟件進(jìn)行西瓜遺傳圖譜構(gòu)建,選用Kosamb’s參數(shù)。
從親本及其F2代群體中取ly04和w3單株各3份,當(dāng)?shù)?張真葉完全展開(kāi)后取樣進(jìn)行轉(zhuǎn)錄組分析。用Plant RNA Purification Reagent試劑盒(購(gòu)自上海凌恩生物科技有限公司)提取植物總RNA,并構(gòu)建轉(zhuǎn)錄組測(cè)序文庫(kù)。送至上海凌恩生物科技有限公司采用Illumina HiSeq進(jìn)行測(cè)序,Read長(zhǎng)度為150 bp。測(cè)序數(shù)據(jù)經(jīng)質(zhì)控過(guò)濾獲得Clean read,用Hisat2軟件[37]將其映射到西瓜基因組97103v2上。用每個(gè)基因在一個(gè)樣本中所對(duì)應(yīng)的基因轉(zhuǎn)錄本數(shù)(FPKM)計(jì)算基因表達(dá)水平?;贙EGG (http://www.genome.jp/kegg/)和GO(http://www.geneontology.org/)數(shù)據(jù)庫(kù)進(jìn)行基因注釋和功能分析。差異表達(dá)基因以差異倍數(shù)(Foldchange)≥1.5、P≤0.005為標(biāo)準(zhǔn)。
結(jié)合遺傳規(guī)律分析及BSA,利用RAD測(cè)序開(kāi)發(fā)全基因組SNP標(biāo)記,加入葉色表型標(biāo)記進(jìn)行西瓜2號(hào)染色體圖譜的構(gòu)建,對(duì)西瓜葉片黃化基因進(jìn)行定位。以97103v2為參考基因組對(duì)定位區(qū)間基因進(jìn)行注釋,通過(guò)基因序列分析及轉(zhuǎn)錄組測(cè)序差異表達(dá)情況分析進(jìn)一步篩選并確定候選基因。
經(jīng)EMS誘變獲得葉片黃化的西瓜材料,經(jīng)5代連續(xù)自交后,獲得遺傳穩(wěn)定的葉片黃化材料ly104,該材料從子葉期至果實(shí)收獲時(shí)的葉片均保持黃化狀態(tài)(圖1A)。通過(guò)對(duì)ly104、w3的葉片顏色指標(biāo)進(jìn)行測(cè)定,發(fā)現(xiàn)葉片黃化西瓜材料與綠葉西瓜材料在葉片顏色指標(biāo)上存在極顯著差異(圖1B)。
A:表型;B:顏色指數(shù)。L*:亮度(閾值0~100);a*:紅綠色范圍(閾值-128~+127);b*:黃藍(lán)色范圍(閾值-128~+127);MT:突變體葉片黃化材料;WT:野生型材料。**表示不同材料間差異極顯著(P<0.01)。
表1 F2代和BC群體中葉片黃化突變型與野生型的分離比
原始Read經(jīng)質(zhì)控過(guò)濾,2個(gè)混池共獲得12.4 Gb高質(zhì)量Clean read,Q30在93.0%以上,與參考基因組97103v2的平均比對(duì)率在98.0%以上。使用GATK軟件進(jìn)行變異檢測(cè),共獲得523 303個(gè)SNP,經(jīng)過(guò)濾后用SNP-Index算法對(duì)性狀相關(guān)侯選區(qū)域進(jìn)行選擇,作圖窗口大小為1 Mb,作圖步移為10 kb,閾值為0.5,結(jié)果表明,西瓜葉色黃化基因定位于2號(hào)染色體8 490 001~26 410 000 bp(大小約為17.92 Mb)(圖2A)。
根據(jù)分離比,從F2代群體中選取76株綠葉、24株黃葉西瓜單株進(jìn)行RAD測(cè)序,共獲得69.17 Gb高質(zhì)量Clean read,Q30在91.3%以上,與參考基因組的平均比對(duì)率在97.6%以上。使用GATK軟件進(jìn)行變異檢測(cè),共獲得229 704個(gè)SNP,經(jīng)過(guò)濾篩選,最終確定4 273個(gè)SNP用于西瓜高密度遺傳圖譜的構(gòu)建。西瓜遺傳圖譜總長(zhǎng)度為1 602.44 cM,平均遺傳距離為0.39 cM,最大間隔為7.38 cM(表2)。
表2 西瓜高密度遺傳圖譜構(gòu)建結(jié)果
為了進(jìn)一步精確定位西瓜葉片黃化基因,用RAD測(cè)序結(jié)果對(duì)西瓜2號(hào)染色體上的SNP標(biāo)記進(jìn)行過(guò)濾篩選,剔除檢測(cè)率低于40%的樣品單株和標(biāo)記,最終用91份單株(68份綠葉,23份黃葉)、286個(gè)SNP標(biāo)記進(jìn)行葉片黃化基因定位,葉片顏色標(biāo)記(Leafcolor)用綠葉(D)、黃葉(B)表示,用joinmap4進(jìn)行西瓜葉片黃化基因的定位。結(jié)果顯示,Leafcolor定位于Clas97Chr02-13950306與Clas97Chr02-15517591標(biāo)記之間(大小約為1.567 Mb)(圖2B),以西瓜97103v2為參考基因組,該區(qū)間包含24個(gè)注釋基因(圖2C、表3)。
表3 候選區(qū)間注釋基因
A:BSA定位結(jié)果。B:西瓜2號(hào)染色體遺傳圖譜及葉色黃化標(biāo)記定位。C:根據(jù)西瓜參考基因組97103v2注釋候選區(qū)域的基因。SNP index:單核苷酸多態(tài)性指數(shù)。
RNA-seq共檢測(cè)12個(gè)樣本,其中P1、P2分別選取3個(gè)樣本,F2代群體中葉片黃化類型、綠葉類型分別選取3個(gè)樣本,每個(gè)樣本平均獲得6.4 Gb高質(zhì)量Clean read數(shù)據(jù),Q30在92.0%以上,平均基因組比對(duì)率為91.4%。分別以P2G(親本綠葉)與P1Y(親本黃葉)和F2G(F2代綠葉)與F2Y(F2代黃葉)為對(duì)比組進(jìn)行獨(dú)立分析,其中P2G與P1Y對(duì)比組中共檢測(cè)到1 356個(gè)差異表達(dá)基因,其中上調(diào)表達(dá)的基因529個(gè),下調(diào)表達(dá)的基因827個(gè);F2G與F2Y對(duì)比組中共檢測(cè)到4 180個(gè)差異表達(dá)基因,其中上調(diào)表達(dá)的基因1 378個(gè),下調(diào)表達(dá)的基因2 802個(gè)(圖3A,圖3B)。P2G與P1Y對(duì)比組和F2G與F2Y對(duì)比組中均顯著下調(diào)表達(dá)的基因共有327個(gè)、均顯著上調(diào)表達(dá)的基因共有132個(gè)(圖3A)。以上結(jié)果表明,親本中黃葉和綠葉差異表達(dá)基因數(shù)量顯著小于F2代群體,說(shuō)明P1和P2已相對(duì)純合;GO和KEGG富集分析結(jié)果表明,差異表達(dá)基因富集通路多與光合、應(yīng)激反應(yīng)等有關(guān),說(shuō)明黃葉和綠葉西瓜植株在光合作用等方面存在較大差異。
對(duì)西瓜2號(hào)染色體13 950 306~15 517 591 bp(大小約為1.56 Mb)內(nèi)的24個(gè)注釋基因進(jìn)行功能分析和轉(zhuǎn)錄組表達(dá)差異分析,結(jié)果顯示,24個(gè)注釋基因中有17個(gè)在植株葉片中表達(dá),僅有基因Cla97C02G036060、Cla97C02G035950、Cla97C02G036010、Cla97C02G036020在葉片黃化植株與綠葉植株中的表達(dá)存在顯著差異,Cla97C02G036060在P2G和F2G中均顯著上調(diào)表達(dá)(圖3C),其注釋功能為Ycf2蛋白編碼基因,該編碼基因?yàn)楸蛔又参镏凶钪匾馁|(zhì)體基因,與植物光合作用有關(guān)。
A:P2G與P1Y對(duì)比組及F2G與F2Y對(duì)比組上調(diào)和下調(diào)基因數(shù)量Venn圖;B:P2G與P1Y對(duì)比組及F2G與F2Y對(duì)比組上調(diào)和下調(diào)基因數(shù)量柱形圖;C:F2G與F2Y對(duì)比組差異基因火山圖,標(biāo)注基因?yàn)楹蜻x區(qū)間基因。P1Y:親本黃葉;P2G:親本綠葉;F2G:F2代綠葉;F2Y:F2代黃葉。
化學(xué)EMS誘變是人工創(chuàng)造突變體最常用的處理方式之一,葉片黃化是最常見(jiàn)的誘變表型[22]。筆者所在課題組前期通過(guò)EMS誘變西瓜種子,獲得穩(wěn)定遺傳的西瓜葉片黃化材料,其整個(gè)生育期均可保持黃化狀態(tài)。植物葉片黃化突變,又稱葉綠素缺乏突變,通常是由葉綠素合成或降解途徑被破壞所致[38]。目前,研究者已經(jīng)在水稻[39]、番茄[40]、黃瓜[19]、擬南芥[41]等植物中發(fā)現(xiàn)了黃化突變體。有研究發(fā)現(xiàn),不同類型的葉色突變的遺傳規(guī)律差異較大,有些葉色突變可能是核遺傳,也可能是細(xì)胞質(zhì)遺傳,水稻[42]、玉米[43]、小麥[44]、黃瓜[45]、番茄[46]等都由1對(duì)或2對(duì)隱性核基因控制。Zhang等[21]研究證實(shí),西瓜葉片白化突變是由1對(duì)隱性等位基因(jaja)控制的。Provvidenti[20]發(fā)現(xiàn),西瓜葉色斑駁突變由1對(duì)隱性基因(slv)控制。Kidanemariam等[30,47]發(fā)現(xiàn),西瓜葉色后綠突變是由1個(gè)隱性基因(dgdg)控制的。Zhu等[25]研究發(fā)現(xiàn),西瓜黃化突變體w-yl由1對(duì)隱性核基因控制,與本研究結(jié)果一致。
西瓜作為重要的園藝經(jīng)濟(jì)作物[48-51],在中國(guó)的栽培面積和產(chǎn)量均居世界首位。經(jīng)長(zhǎng)期人工選擇,栽培西瓜遺傳背景狹窄,多態(tài)性分子標(biāo)記開(kāi)發(fā)受限,致使西瓜分子標(biāo)記輔助育種及品種改良進(jìn)展緩慢。高密度遺傳圖譜的構(gòu)建不僅是開(kāi)發(fā)西瓜重要農(nóng)藝性狀遺傳基因/QTL緊密連鎖分子標(biāo)記的重要手段,亦是深入挖掘和解析西瓜重要農(nóng)藝性狀基因的基礎(chǔ),通過(guò)遺傳圖譜構(gòu)建進(jìn)行基因/QTL定位研究已經(jīng)在西瓜多種性狀研究中得到成熟應(yīng)用[52-53]。本研究基于BSA定位,將西瓜葉片黃化基因定位于2號(hào)染色上,為了進(jìn)一步獲得可靠定位基因,本研究開(kāi)發(fā)了SNP標(biāo)記,用于構(gòu)建高密度西瓜遺傳圖譜,并將西瓜葉片黃化基因定位到2號(hào)染色體13 950 306~15 517 591 bp(大小約為1.56 Mb),比對(duì)西瓜參考基因組97103v2發(fā)現(xiàn),在候選區(qū)段內(nèi)包含24個(gè)注釋基因,17個(gè)基因在葉片中表達(dá),4個(gè)基因在黃葉與綠葉轉(zhuǎn)錄組分析中存在顯著差異表達(dá),其中基因Cla97C02G036060是Ycf2蛋白的編碼基因,Ycf2/FtsH調(diào)控的煙酰胺腺嘌呤二核苷酸-蘋果酸脫氫酶是葉綠體或非光合質(zhì)體在黑暗中產(chǎn)生腺嘌呤核苷三磷酸的關(guān)鍵酶[54],是光合生長(zhǎng)必需的酶[55]。目前,Ycf2基因已被證實(shí)是被子植物中最重要的質(zhì)體基因[56],它在高等植物中發(fā)揮著重要功能[57]。在本研究中,由于雙親重測(cè)序深度不高,候選區(qū)間注釋基因編碼區(qū)中未發(fā)現(xiàn)可靠突變,但轉(zhuǎn)錄組結(jié)果顯示,Ycf2在葉片黃化西瓜材料中的表達(dá)量顯著下調(diào),說(shuō)明葉片黃化西瓜材料的光合作用系統(tǒng)可能與正常綠葉植株光合系統(tǒng)存在顯著差異,相關(guān)機(jī)制需要進(jìn)一步研究。本研究結(jié)果可為進(jìn)一步挖掘葉片黃化植株光合作用機(jī)制奠定一定科學(xué)基礎(chǔ)。