胡盛,李陽陽,唐章林,李加納,曲存民,劉列釗
干旱脅迫下甘藍(lán)型油菜籽粒含油量和蛋白質(zhì)含量變化的全基因組關(guān)聯(lián)分析
胡盛,李陽陽,唐章林,李加納,曲存民,劉列釗
西南大學(xué)農(nóng)學(xué)與生物科技學(xué)院,重慶 400715
【】干旱是甘藍(lán)型油菜生長發(fā)育過程中一種常見的非生物脅迫,嚴(yán)重影響了其產(chǎn)量和品質(zhì)。聯(lián)合全基因組關(guān)聯(lián)分析和轉(zhuǎn)錄組差異表達(dá)分析,篩選干旱脅迫條件下影響甘藍(lán)型油菜籽粒含油量和蛋白質(zhì)含量變化的候選基因,為解釋干旱脅迫下甘藍(lán)型油菜籽粒含油量及蛋白質(zhì)含量的變化提供理論基礎(chǔ)。【】利用旱棚盆栽方式模擬干旱脅迫環(huán)境,使用183份甘藍(lán)型油菜構(gòu)成的自然群體,于2019和2020年在模擬干旱脅迫條件下收獲2年的籽粒,并進(jìn)行籽粒含油量以及蛋白質(zhì)含量的測定,將得到的表型數(shù)據(jù)與60K芯片的基因型數(shù)據(jù)(包含34 103個SNP)進(jìn)行全基因組關(guān)聯(lián)分析,同時,結(jié)合相同處理下花后不同干旱時間段(30、40和50 d)的籽粒轉(zhuǎn)錄組差異基因數(shù)據(jù),篩選共有基因,并利用甘藍(lán)型油菜和擬南芥數(shù)據(jù)庫注釋信息、已報道的相關(guān)文獻(xiàn)和轉(zhuǎn)錄組差異基因表達(dá)水平鑒定與干旱脅迫下甘藍(lán)型油菜籽粒含油量及蛋白質(zhì)含量變化相關(guān)的候選基因。【】通過對2年間籽粒含油量和蛋白質(zhì)含量的分析,發(fā)現(xiàn)材料重復(fù)性較好,干旱脅迫造成甘藍(lán)型油菜籽粒的含油量下降,蛋白質(zhì)含量上升;全基因組關(guān)聯(lián)分析得出的最佳模型主要為一般線性模型下的Q或na?ve模型,共檢測出38個顯著關(guān)聯(lián)位點(<1/31597或<1/31278),主要分布在A03(6個)、A04(8個)和C03(8個)染色體,各位點分別對含油量和蛋白質(zhì)含量變化的貢獻(xiàn)率均超過10%,其中含油量變化位點最大貢獻(xiàn)率為23.97%,蛋白質(zhì)含量變化位點最大貢獻(xiàn)率為22.21%。通過整合全基因組關(guān)聯(lián)分析和轉(zhuǎn)錄組分析,篩選出256個共有基因,根據(jù)基因注釋和文獻(xiàn)報道鑒定出與干旱脅迫下含油量及蛋白質(zhì)含量變化相關(guān)的25個候選基因,其中包含轉(zhuǎn)錄因子(如bZIP transcription factor GBF6、TALE transcription factor ATH1、MYB-like Domain transcription factor MYBD、NAC transcription factor ANAC029和ERF transcription factor ERF111)、相關(guān)激酶(如與油脂相關(guān)的蛋白激酶CIPK9、水分脅迫響應(yīng)激酶PIP5K1和代謝相關(guān)激酶PFK7)、相關(guān)蛋白(如與油脂相關(guān)轉(zhuǎn)運蛋白ABCA9、與蛋白相關(guān)的存儲蛋白CRU3、脅迫響應(yīng)蛋白HUP26和M10、葉綠體蛋白DG238和CP12)等,涉及生長發(fā)育、光合反應(yīng)、物質(zhì)運輸?shù)榷鄠€生物學(xué)過程?!尽胯b定出25個相關(guān)候選基因,可能響應(yīng)干旱脅迫,并影響油菜籽粒蛋白質(zhì)和含油量的積累。
甘藍(lán)型油菜;干旱脅迫;含油量;蛋白質(zhì)含量;候選基因
【研究意義】干旱缺水是陸生植物經(jīng)常遭受的一種環(huán)境脅迫,也是影響農(nóng)林業(yè)生產(chǎn)的重要因素之一,特別是在中國干旱和半干旱地區(qū)[1]。據(jù)估計,全球約有40%的地區(qū)受到干旱的影響,而且還會隨著氣候的變化而加劇[2]。干旱作為非生物脅迫的一種,對作物生長發(fā)育的各個時期均有不同程度的危害[3],如種子萌發(fā)期受旱,容易造成發(fā)芽率低,出苗不齊[4];苗期受旱,光合性能下降,生長減緩[5];特別是花期受旱,普遍造成花粉活力弱,降低結(jié)實率和產(chǎn)量水平,如Yang等[6]發(fā)現(xiàn)水稻在花期受到干旱后會明顯降低其籽粒產(chǎn)量,相關(guān)生理性狀也會顯著降低;Joshan等[7]發(fā)現(xiàn)油料作物紅花在花期受到干旱脅迫后,其種子油脂成分含量會發(fā)生改變,軟脂酸和硬脂酸等飽和脂肪酸顯著增加,亞油酸含量減少,從而降低了油料品質(zhì)。甘藍(lán)型油菜作為中國重要油料作物之一,是中國食用植物油的主要來源。中國植物油自給率嚴(yán)重不足,而干旱脅迫又嚴(yán)重影響菜籽油的產(chǎn)量和品質(zhì),對中國食用油供給安全造成重大影響[8-9]。因此,模擬干旱脅迫環(huán)境,篩選耐旱種質(zhì),鑒定相關(guān)候選基因,對保障菜籽油產(chǎn)量和品質(zhì)具有重要意義?!厩叭搜芯窟M(jìn)展】基于高通量測序和DNA芯片分析技術(shù)的完善以及成本的降低,全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)是目前研究復(fù)雜數(shù)量性狀的有效方法,已在棉花[10]、大豆[11]、水稻[12]等諸多作物中廣泛應(yīng)用。甘藍(lán)型油菜作為異源四倍體,遺傳背景復(fù)雜,目前,利用關(guān)聯(lián)分析挖掘出大量與產(chǎn)量、品質(zhì)、抗逆等復(fù)雜數(shù)量性狀相關(guān)的候選基因,為后續(xù)基因功能驗證及等位基因利用提供依據(jù)。Xiao等[13]基于高通量重測序技術(shù),對588份甘藍(lán)型油菜種質(zhì)的含油量進(jìn)行全基因組關(guān)聯(lián)分析,鑒定出17個顯著SNP位點,并結(jié)合轉(zhuǎn)錄組數(shù)據(jù),篩選出7個與含油量及蛋白質(zhì)含量相關(guān)的候選基因。Tang等[14]對370份油菜籽粒12個性狀進(jìn)行測定,結(jié)合60K芯片數(shù)據(jù)進(jìn)行全基因組關(guān)聯(lián)分析,檢測到7個與種子含油量和蛋白含質(zhì)量相關(guān)的SNP,并在其中篩選到5個相關(guān)候選基因。Khanzada等[15]利用15% PEG6000模擬干旱處理,獲得228份材料的耐逆指數(shù)和敏感指數(shù),利用關(guān)聯(lián)分析鑒定出與耐旱相關(guān)的85個候選基因。Zhang等[16]利用PEG6000模擬環(huán)境脅迫對140份甘藍(lán)型油菜種質(zhì)進(jìn)行處理,全基因組關(guān)聯(lián)分析鑒定出16個顯著位點,并結(jié)合RNA測序結(jié)果聯(lián)合篩選出79個候選基因,其中8個基因與擬南芥的抗旱基因同源相關(guān)?!颈狙芯壳腥朦c】鑒于甘藍(lán)型油菜異源四倍體復(fù)雜的遺傳背景和種子發(fā)育復(fù)雜的生物學(xué)過程,籽粒性狀的遺傳研究一直是油菜遺傳育種研究的重點和難點[14]。前期研究多數(shù)是對正常生長發(fā)育過程籽粒性狀的遺傳定位研究,而對干旱逆境脅迫下籽粒品質(zhì)性狀開展遺傳定位和候選基因篩選的鑒定工作較少?!緮M解決的關(guān)鍵問題】本研究以183份甘藍(lán)型油菜作為分析群體,利用包含34 103個SNP標(biāo)記的60K芯片數(shù)據(jù),以干旱脅迫條件下2年油菜籽粒含油量以及蛋白含量變化為切入點進(jìn)行全基因組關(guān)聯(lián)分析,同時,結(jié)合花后不同干旱時段籽粒轉(zhuǎn)錄組數(shù)據(jù),聯(lián)合篩選出與干旱脅迫下甘藍(lán)型油菜籽粒含油量及蛋白質(zhì)含量變化相關(guān)的候選基因,為甘藍(lán)型油菜耐旱育種研究提供依據(jù)。
從國內(nèi)外收集的183份甘藍(lán)型油菜種質(zhì),包括地方性品種、育成材料和高代材料,其中,國內(nèi)164份,主要來源于重慶、湖北、四川、江蘇等地區(qū),國外19份,來源于德國、加拿大、朝鮮等國家(電子附表1)。于2019年和2020年在重慶市西南大學(xué)油菜工程技術(shù)研究中心,以盆栽的方式種植在基地旱棚中,光周期同室外條件。每盆稱取約6 kg混勻土(田間土﹕腐殖土=3﹕1),幼苗前期采取定量澆水的辦法培養(yǎng)至四葉一心期,每個材料選擇大小、長勢一致的3盆進(jìn)行干旱處理(drought stress,DS),3盆進(jìn)行正常灌溉(well watering,WW),在抽薹、開花期間各補(bǔ)充一次水溶肥,等量施用。利用土壤水分測定儀(浙江托普儀器有限公司TZS-1K型)監(jiān)測含水量,DS組在6%—10%,WW組保持在20%—24%,其他條件與大田生產(chǎn)完全一致。
使用福斯(FOSS)近紅外分析儀(NIRS DS2500)對所收獲2年自交種籽粒進(jìn)行品質(zhì)測定,3次重復(fù),分析含油量和蛋白質(zhì)含量變化情況。利用IBM SPSS Statistics 25對表型數(shù)據(jù)進(jìn)行統(tǒng)計學(xué)分析。
將相對應(yīng)材料處理值與正常值(DS/WW)的比值作為該材料的耐旱指數(shù),使用耐旱指數(shù)作為表型數(shù)據(jù)的指標(biāo),用于后續(xù)的關(guān)聯(lián)分析。
利用Illumina公司開發(fā)的油菜60k芯片對國內(nèi)油菜育種單位收集的種質(zhì)資源分析獲得的基因型數(shù)據(jù)[17],按照Qu等[18]方法對標(biāo)記進(jìn)行質(zhì)控,篩選并刪除等位基因頻率(allele frequency,AF)小于0.05,大于1.0,且SNP得率(call frequency)小于80%的標(biāo)記,結(jié)合2年所獲得的可用材料,分別保留31 597個SNP標(biāo)記和31 278個SNP標(biāo)記用于后續(xù)分析。
利用Tassel 5.2.80軟件[19]對處理好的數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,分別在一般線性模型(general linear model,GLM)下進(jìn)行PCA(主成分)、Q、na?ve模型分析以及混合線性模型(mixed linear model,MLM)下的K、K+PCA、K+Q模型分析,利用R語言CMplot包對6個模型下的結(jié)果繪制Quantile-quantile(QQ)圖,并分析比較觀測值與期望值得出最佳模型,利用最佳模型繪制曼哈頓(Manhattan)圖,顯著性SNP位點篩選的閾值設(shè)定為“1/所使用的標(biāo)記”。
使用重慶市油菜工程技術(shù)中心提供的在花后不同時段干旱脅迫(30、40和50 d)的籽粒轉(zhuǎn)錄組數(shù)據(jù)[20]。轉(zhuǎn)錄組材料為油菜工程技術(shù)中心提供的重組自交系群體中6份含油量不同的株系,處理方式同1.1,取材時間定于花期后30、40和50 d,分別收取對照和處理植株的角果,于冰上小心剝?nèi)∽蚜?,將同一階段的材料籽粒等量混勻,置于-80℃保存,送至北京百邁克生物科技有限公司進(jìn)行測序。利用Cufflinks2.0.0軟件[21]將干旱處理組和正常灌溉組的數(shù)據(jù)進(jìn)行差異分析,篩選條件為差異倍數(shù)log2|(fold change)|≥1.7,錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.01,得到各個比較組的差異基因。
參考LD分析[22]的衰減距離(上下游500 kb),根據(jù)關(guān)聯(lián)分析得到的顯著SNP標(biāo)記篩選候選區(qū)間內(nèi)的所有基因,并聯(lián)合轉(zhuǎn)錄組數(shù)據(jù)整理得到的差異基因,將同時篩選得到的初步定位相關(guān)基因。根據(jù)已公布的甘藍(lán)型油菜基因組信息(“Darmor-Bzh”,BRAD (brassicadb.cn))以及擬南芥基因組信息(“Araport11”, TAIR-Home Page (arabidopsis.org)),進(jìn)一步進(jìn)行信息比對和功能注釋,尋找注釋信息中有關(guān)于干旱脅迫、含油量變化或蛋白質(zhì)含量變化相關(guān)的基因,并查詢相關(guān)已報道過的文獻(xiàn),最終確認(rèn)篩選的甘藍(lán)型油菜在干旱脅迫下響應(yīng)籽粒含油量及蛋白質(zhì)含量變化的候選基因。
通過對2019年收獲的162份可用材料和2020年收獲的128份可用材料進(jìn)行近紅外數(shù)據(jù)分析(表1),與正常灌溉組(WW)相比,干旱處理組(DS)的含油量水平顯著降低,蛋白質(zhì)含量水平顯著升高,2年的變化趨勢一致,同時,變異系數(shù)結(jié)果均小于10,說明群體數(shù)據(jù)分布較為集中,趨勢較好。相關(guān)性分析結(jié)果顯示(表2),同一年份的各處理間相關(guān)性顯著,而且含油量和蛋白質(zhì)含量之間呈顯著負(fù)相關(guān),而不同年份各性狀之間的相關(guān)性較弱。對耐旱指數(shù)分布作直方圖(圖1),發(fā)現(xiàn)2份低含油量高蛋白質(zhì)含量材料(編號129和編號74)和2份高含油量低蛋白質(zhì)材料(編號63和編號33)。
表1 2019及2020年干旱脅迫及正常處理下籽粒含油量和蛋白質(zhì)含量統(tǒng)計分析
WW:正常灌溉;DS1、DS2分別指同年份處理的2個重復(fù);**表示差異顯著(p<0.01)。下同
WW: well watering; DS1 and DS2 refer to two repeats in the same year; ** represents the significant difference (p<0.01). The same as below
表2 2年各處理間籽粒蛋白質(zhì)和含油量的相關(guān)性分析
根據(jù)不同算法,將6種模型(PCA、Q、na?ve、K、K+PCA、K+Q)下對含油量和蛋白質(zhì)含量響應(yīng)干旱脅迫變化關(guān)聯(lián)分析得到的結(jié)果繪制QQ圖,并對-log10()觀察值與期望值的相關(guān)程度來選擇對應(yīng)的最佳模型,在最佳模型下,利用CQ2019的31 597個和CQ2020的31 278個SNP標(biāo)記,進(jìn)行Manhattan圖的繪制,并以值小于定義閾值(1/31 597和1/31 278)的點作為顯著關(guān)聯(lián)SNP(圖2)。
對含油量變化進(jìn)行分析,在2019和2020年的4個處理中,共重復(fù)篩選出16個顯著性SNP標(biāo)記,蛋白質(zhì)含量變化在2年4個處理下共重復(fù)篩選出22個顯著性SNP標(biāo)記(表3)。其中,位于C03染色體上的Bn-scaff_16755_1-p1427195標(biāo)記在2019年處理二的含油量和蛋白質(zhì)含量變化中重復(fù)篩選到,A03染色體上的Bn-A03- p21505530與Bn-A03-p21505363間僅167 bp,其余部分標(biāo)記(Bn-scaff_18322_1-p2147199與Bn-scaff_18322_1-p2150739、Bn-A08-p18820218與Bn-A08-p18827698、Bn-A06-p5279490與Bn-A06- p5260549)之間距離為2—9 kb范圍內(nèi)。所有顯著性標(biāo)記對不同年份間的含油量以及蛋白質(zhì)含量變化的貢獻(xiàn)率均超過10%,部分達(dá)到20%以上,說明這些標(biāo)記都可以考慮作為可靠顯著性標(biāo)記。
A—H:2019年和2020年含油量和蛋白含量耐旱指數(shù)頻率分布圖;I—L:2019年和2020年含油量和蛋白含量變化共有極端材料,藍(lán)黃柱狀圖之間的數(shù)據(jù)表示該材料的耐旱指數(shù)
根據(jù)GWAS篩選得出的表3數(shù)據(jù),對應(yīng)油菜基因物理位置信息,共找到3 681個基因,聯(lián)合花后不同干旱時段籽粒轉(zhuǎn)錄組數(shù)據(jù)整理得出6 571個差異基因,篩選出256個共有相關(guān)基因(圖3),參照油菜和擬南芥的基因組注釋信息以及相關(guān)文獻(xiàn),從注釋信息以及報道的文獻(xiàn)中進(jìn)一步篩選與含油量變化、蛋白質(zhì)含量變化以及干旱脅迫相關(guān)的基因或擬南芥同源基因,參考轉(zhuǎn)錄組差異基因的表達(dá)水平變化,最終篩選出25個與干旱脅迫下甘藍(lán)型油菜籽粒含油量和蛋白含量變化相關(guān)的主要候選基因(表4),這些基因主要包括編碼一些與油脂以及蛋白相關(guān)的激酶和蛋白,功能涉及光合作用、物質(zhì)儲藏、脅迫響應(yīng)等多個方面,其中包含一些重要轉(zhuǎn)錄因子,如、、、等。同時,根據(jù)該25個候選基因在轉(zhuǎn)錄組中的表達(dá)水平熱圖(圖4),可以發(fā)現(xiàn)這些基因在不同時段的對照和處理中均有不同的表達(dá),且在某一階段內(nèi)出現(xiàn)顯著程度的表達(dá)差異,如、、等在干旱處理花后30 d就有顯著表達(dá)差異;、、等在干旱處理花后40 d出現(xiàn)顯著表達(dá)差異;、、等則在50 d出現(xiàn)顯著差異,說明這些基因可能在不同的時間點對干旱處理條件下籽粒含油量和蛋白質(zhì)含量變化起到一定的調(diào)控作用。
表3 干旱脅迫下油菜籽粒含油量和蛋白質(zhì)含量變化顯著關(guān)聯(lián)的SNP位點
DAF30、DAF40、DAF50:分別代表花后30、40和50 d的差異基因集
非生物脅迫影響作物的生長發(fā)育,特別是干旱脅迫,導(dǎo)致作物的產(chǎn)量和品質(zhì)大幅降低。甘藍(lán)型油菜作為中國主要的重要油料作物,有著不可或缺的價值地位[22-23]。隨著氣候的變化,干旱脅迫對甘藍(lán)型油菜的生產(chǎn)造成了嚴(yán)重的影響[24-25]。因此,開展干旱脅迫條件下甘藍(lán)型油菜含油量以及蛋白質(zhì)含量變化相關(guān)性狀的位點以及基因挖掘?qū)υ鰪?qiáng)甘藍(lán)型油菜在干旱環(huán)境下耐受性、提高籽粒產(chǎn)量和品質(zhì)具有重要意義。
CK30、CK40、CK50:對照組花后30、40和50 d候選基因表達(dá)水平;DS30、DS40、DS50:干旱處理組花后30、40和50 d候選基因表達(dá)水平
Choudhury等[26]利用90K芯片數(shù)據(jù)對335份小麥材料進(jìn)行抗病性全基因組關(guān)聯(lián)分析,并在一般線性模型下的K模型中鑒定出4個重復(fù)位點,為小麥抗病育種提供依據(jù);Zheng等[27]利用全基因組關(guān)聯(lián)分析對水稻籽粒寬度變異程度進(jìn)行研究,并在一般線性模型和混合線性模型下共同鑒定出7個候選位點,為候選基因篩選給出思路;Pace等[28]利用多態(tài)性標(biāo)記對玉米384個自交系進(jìn)行GWAS分析,分別在一般線性模型和混合線性模型下鑒定出263個和4個與根系發(fā)育性狀相關(guān)的顯著標(biāo)記,并說明結(jié)合一般線性與混合線性2種模型的計算方式才是關(guān)聯(lián)分析優(yōu)選的方案。這些研究均將全基因組關(guān)聯(lián)分析中的GLM和MLM的結(jié)果比較整合,并從中找出最相關(guān)的顯著位點,極大地控制了假陽性的情況。本研究也利用2種模型用于關(guān)聯(lián)分析,最終得到的最佳模型均在一般線性模型下產(chǎn)生,并得到了較多的顯著SNP標(biāo)記(38個)和較大的貢獻(xiàn)率(10.82%— 23.97%)。另外,Liu等[29]對521份油菜籽粒含油量的全基因組關(guān)聯(lián)分析中鑒定出50個顯著相關(guān)位點,其中,Bn-A03-p21298611、Bn-A04-p18354325、Bn-A05- p21491115、Bn-scaff_16888_1-p1561387等位點與本研究中Bn-A03-p21357849、Bn-A04-p18595858、Bn-A05- p21188442、Bn-scaff_16888_1-p1803454位點存在重疊區(qū)間,且Bn-A03-p21357849和Bn-A05-p21188442位點是基于蛋白質(zhì)含量變化檢測,其原因可能說明含油量和蛋白質(zhì)含量之間的協(xié)同變化可能通過相同位點實現(xiàn);Fletcher等[30]對甘藍(lán)型油菜的耐旱性進(jìn)行QTL分析,鑒定出5條染色體上多個QTL區(qū)間,其中,A03中2個顯著區(qū)間與本研究中Bn-A03-p15615278、Bn- A03-p21505530、Bn-A03-p21478889、Bn-A03-p21357849、Bn-A03-p21505363位點存在重疊區(qū)間。從抗旱性和含油量相關(guān)的分析中均可在本研究中鑒定出部分位點,為位點的可靠性提供了證據(jù)。除此之外,為了降低假陽性,研究還利用同等處理條件下的籽粒轉(zhuǎn)錄組數(shù)據(jù),參考了干旱條件下花后30、40和50 d的差異表達(dá)基因結(jié)果,進(jìn)一步了解候選基因的表達(dá)情況。通過整合GWAS和轉(zhuǎn)錄組差異分析結(jié)果,共找出256個共有基因,這大大縮小了篩選范圍,同時根據(jù)注釋信息和報道文獻(xiàn)進(jìn)一步從中篩選出25個可能與干旱脅迫下甘藍(lán)型油菜籽粒含油量以及蛋白質(zhì)含量變化相關(guān)的候選基因。
表4 候選基因鑒定
甘藍(lán)型油菜籽粒是由多成份構(gòu)成、多通路參與、多基因控制。在以前的一些研究中,Li等[20]對油菜籽粒油體的掃描電鏡觀察和含油量測定發(fā)現(xiàn)干旱脅迫會明顯降低油菜籽粒中的油脂含量;油菜籽粒油脂含量的下降是由于環(huán)境中干旱和鹽分的影響,這不僅會造成菜籽油的品質(zhì)下降,還會增加其本身硫代葡萄糖苷和硬脂酸的含量[31-33];另外,Mohammadi等[34]發(fā)現(xiàn)干旱缺水的條件對作物的負(fù)面影響還存在于代謝方面,因為合成油的碳水化合物的減少以及體內(nèi)油脂氧化反應(yīng)的增加,造成生物體內(nèi)的合成代謝活動減少,從而造成含油量方面的降低。本研究篩選出部分與含油量相關(guān)的基因,其中[35]負(fù)責(zé)編碼與糖相關(guān)的蛋白激酶,能被外傷應(yīng)激誘導(dǎo)表達(dá),擬南芥中負(fù)調(diào)控脂質(zhì)積累,油菜中該基因的過表達(dá)也會降低油脂的合成,并且在花后30 d的轉(zhuǎn)錄組的差異表達(dá)的基因中,該基因的表達(dá)顯著下降,符合分析的結(jié)果;另外,還有一種編碼ABC轉(zhuǎn)運蛋白的基因[36],其過表達(dá)會增加亞麻薺種子的油脂含量,目前,在油菜中是否也存在這種功能還未得到具體的研究證實,在轉(zhuǎn)錄水平中,該基因在干旱處理花后40和50 d的表達(dá)出現(xiàn)上調(diào),這說明該基因在協(xié)調(diào)含油量變化中起到一定的作用。除此之外,其他與環(huán)境脅迫(ERF111、M10、PIP5K1等)和氧化反應(yīng)(如HUP26、ACHT5、TRX1等)相關(guān)的蛋白在本研究中也有被鑒定,共同解釋干旱脅迫下油菜籽粒含油量降低的原因。
早期研究發(fā)現(xiàn),油料作物中油脂含量和蛋白含量之間存在著負(fù)相關(guān)關(guān)系[37-38],這與本研究考察的籽粒性狀一致。本研究鑒定出一種種子儲存蛋白CRU3[39],是油菜籽粒中一種重要的12S球蛋白,主要為籽粒積累氮源,為油菜萌發(fā)提供能量。在表達(dá)水平上,該基因干旱處理花后30 d的表達(dá)水平未表現(xiàn)出明顯變化,但在50 d表現(xiàn)出明顯上調(diào),說明種子的發(fā)育后期該基因可能對12S球蛋白的積累起到一定作用。這些也可以認(rèn)為是籽粒含油量下降的協(xié)同原因之一。
ABA作為植物脅迫響應(yīng)中常見的激素之一,參與調(diào)節(jié)植物生長發(fā)育的眾多方面[40]。本研究鑒定出的部分基因也參與ABA的調(diào)控,如ANAC029[41],一類葉片衰老相關(guān)的轉(zhuǎn)錄因子,能被ABA誘導(dǎo)表達(dá),加速衰老。除此之外,油脂生物合成也離不開光合產(chǎn)物的積累,Tang等[42]發(fā)現(xiàn)通過參與葉綠體的發(fā)育,調(diào)節(jié)光合作用,而且過表達(dá)該基因會增加種子含油量。轉(zhuǎn)錄組學(xué)[43]和蛋白質(zhì)組學(xué)[44]研究說明不少差異結(jié)果富集的通路與光合作用相關(guān),為其參與油脂的積累提供了證據(jù)。本研究中也有很多基因和蛋白涉及光合作用,參與葉綠體的發(fā)育或響應(yīng)光信號或與光系統(tǒng)有關(guān),如ATH1、PSB8、DG238、CP12等,這都為干旱脅迫下甘藍(lán)型油菜籽粒含油量下降,蛋白質(zhì)含量增加提供了一定的參考依據(jù)。
干旱脅迫造成甘藍(lán)型油菜含油量下降,蛋白質(zhì)含量上升,2年籽粒干旱表型數(shù)據(jù)的全基因組關(guān)聯(lián)分析鑒定出38個與干旱脅迫下甘藍(lán)型油菜籽粒含油量與蛋白質(zhì)含量變化顯著關(guān)聯(lián)的SNP位點,結(jié)合干旱處理下花后不同時段的籽粒轉(zhuǎn)錄組數(shù)據(jù),共篩選出256個相關(guān)基因,利用甘藍(lán)型油菜和擬南芥數(shù)據(jù)庫的基因功能注釋,參考已報道文獻(xiàn)和差異基因
表達(dá)水平,進(jìn)一步鑒定出可能在干旱脅迫條件下籽粒含油量及蛋白含量變化過程中起重要作用的25個候選基因。
[1] 王忠. 植物生理學(xué). 北京: 中國農(nóng)業(yè)出版社, 1999: 451-455.
Wang Z. Plant Physiology. BeiJing: China Agriculture Press, 1999: 451-455. (in chinese)
[2] Zhang X K, Lu G Y, Long W H, Zou X L, Li F, Nishio T. Recent progress in drought and salt tolerance studies incrops. Breeding Science, 2014, 64(1): 60-73.
[3] Dietz K J, Z?rb C, Geilfus C M. Drought and crop yield. Plant Biology, 2021, 23(6): 881-893.
[4] Wijewardana C, Reddy K R, Krutz L J, Gao W, Bellaloui N. Drought stress has transgenerational effects on soybean seed germination and seedling vigor. PLoS One, 2019, 14(9): e0214977.
[5] Zhang Y B, Yang S L, Dao J M, Deng J, Shahzad A N, Fan X, Li R D, Quan Y J, Bukhari S A H, Zeng Z H. Drought- induced alterations in photosynthetic, ultrastructural and biochemical traits of contrasting sugarcane genotypes. PLoS One, 2020, 15(7): e0235845.
[6] Yang X L, Wang B F, Chen L, Li P, Cao C G. The different influences of drought stress at the flowering stage on rice physiological traits, grain yield, and quality. Scientific Reports, 2019, 9: 3742.
[7] Joshan Y, Sani B, Jabbari H, Mozafari H, Moaveni P. Effect of drought stress on oil content and fatty acids composition of some safflower genotypes. Plant Soil and Environment2019, 65(11): 563-567.
[8] HATZIG S V, NUPPENAU J N, SNOWDON R J, SCHIE?L S V. Drought stress has transgenerational effects on seeds and seedlings in winter oilseed rape (L.). BMC Plant Biology, 2018, 18(1): 297.
[9] Hu Q, Hua W, Yin Y, Zhang X, Liu L, Shi J, Zhao Y, Qin L, Chen C, Wang H. Rapeseed research and production in China. The Crop Journal, 2017, 5(2): 127-135.
[10] Li B Q, Chen L, Sun W N, Wu D, Wang M J, Yu Y, Chen G X, Yang W N, Lin Z, Zhang X L, DUAN L F, YANG X Y. Phenomics-based GWAS analysis reveals the genetic architecture for drought resistance in cotton. Plant Biotechnology Journal, 2020, 18(12): 2533-2544.
[11] Wen L W, Chang H X, Brown P J, Domier L L, Hartman G L. Genome-wide association and genomic prediction identifies soybean cyst nematode resistance in common bean including a syntenic region to soybean Rhg1 locus. Horticulture Research, 2019, 6: 9.
[12] Huang X H, Wei X H, Sang T, Zhao Q, Feng Q, Zhao Y, Li C Y, Zhu C R, Lu T T, Zhang Z W, LI M, FAN D L, GUO Y L, WANG A H, WANG L, DENG L W, LI W J, LU Y Q, WENG Q J, LIU K Y, HUANG T, ZHOU T Y, JING Y F, LI W, LIN Z, BUCKLER E S, QIAN Q, ZHANG Q F, LI J Y, HAN B. Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics, 2010, 42(11): 961-967.
[13] Xiao Z C, Zhang C, Tang F, Yang B, Zhang L Y, Liu J S, Huo Q, Wang S F, Li S T, Wei L J, DU H, QU C M, LU K, LI J N, LI N N. Identification of candidate genes controlling oil content by combination of genome-wide association and transcriptome analysis in the oilseed crop. Biotechnology for Biofuels, 2019, 12: 216.
[14] Tang M Q, Zhang Y, Liu Y, Tong C, Cheng X, Zhu W, Li Z, Huang J, Liu S. Mapping loci controlling fatty acid profiles, oil and protein content by genome-wide association study in. The Crop Journal, 2019, 7(2): 217-226.
[15] Khanzada H, Wassan G M, He H, Mason A S, Keerio A A, Khanzada S, Faheem M, Solangi A M, Zhou Q, Fu D, HUANG Y, RASHEED A. Differentially evolved drought stress indices determine the genetic variation ofat seedling traits by genome-wide association mapping. Journal of Advanced Research, 2020, 24: 447-461.
[16] Zhang J, Mason A S, Wu J, Liu S, Zhang X C, Luo T, Redden R, Batley J, Hu L Y, Yan G J. Identification of putative candidate genes for water stress tolerance in canola (). Frontiers in Plant Science, 2015, 6: 1058.
[17] Xu L P, Hu K N, Zhang Z Q, Guan C Y, Chen S, Hua W, Li J N, Wen J, Yi B, Shen J X, MA C Z, TU J X, FU T D. Genome-wide association study reveals the genetic architecture of flowering time in rapeseed (L.). DNA Research, 2015, 23(1): 43-52.
[18] Qu C M, Li S M, Duan X J, Fan J H, Jia L D, Zhao H Y, Lu K, Li J N, Xu X F, Wang R. Identification of candidate genes for seed glucosinolate content using association mapping inL.. Genes (Basel), 2015, 6: 1215-1229.
[19] Bradbury P J, Zhang Z W, Kroon D E, Casstevens T M, Ramdoss Y, Buckler E S. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics, 2007, 23(19): 2633-2635.
[20] Li Y, Zhang L, Hu S, Zhang J, Wang L, Ping X, Wang J, Li J, Lu K, Tang Z, Liu L. Transcriptome and proteome analyses of the molecular mechanisms underlying changes in oil storage under drought stress inL.. GCB Bioenergy, 2021, 13: 1071-1086.
[21] Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley D R, Pimentel H, Salzberg S L, Rinn J L, Pachter L. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nature Protocols, 2012, 7(3): 562-578.
[22] Lu K, Wei L J, Li X L, Wang Y T, Wu J, Liu M, Zhang C, Chen Z Y, Xiao Z C, Jian H J, CHENG F, ZHANG K, DU H, CHENG X C, QU C M, QIAN W, LIU L Z, WANG R, ZOU Q Y, YING J M, XU X F, MEI J Q, LIANG Y, CHAI Y R, TANG Z L, WAN H F, NI Y, HE Y J, LIN N, FAN Y H, SUN W, LI N N, ZHOU G, ZHENG H K, WANG X W, PATERSON A H, LI J N. Whole-genome resequencing revealsorigin and genetic loci involved in its improvement. Nature Communications, 2019, 10: 1154.
[23] Raza A, Razzaq A, Mehmood S S, Hussain M A, SU W, HUANG H, Zaman Q U, ZHANG X K, CHENG Y, Hasanuzzaman M. Omics: The way forward to enhance abiotic stress tolerance inL.. GM Crops & Food, 2021, 12(1): 251-281.
[24] Batool M, El-Badri A M, Hassan M U, YANG H Y, WANG C Y, YAN Z K, KUAI J, BO W, Zhou G S. Drought stress in: Effects, tolerance mechanisms, and management strategies. Journal of Plant Growth Regulation, 2022: 1-25.
[25] Bianchetti G, Clouet V, Legeai F, Baron C, Gazengel K, Carrillo A, Manzanares-Dauleux M J, Buitink J, Nesi N. RNA sequencing data for responses to drought stress and/or clubroot infection in developing seeds of. Data in Brief, 2021, 38: 107392.
[26] Choudhury S, Larkin P, Xu R G, Hayden M, Forrest K, Meinke H, Hu H L, Zhou M X, Fan Y. Genome wide association study reveals novel QTL for barley yellow dwarf virus resistance in wheat. BMC Genomics, 2019, 20(1): 891.
[27] Zheng X M, Gong T, Ou H L, Xue D Y, Qiao W H, Wang J R, Liu S, Yang Q W, Olsen K M. Genome-wide association study of rice grain width variation. Genome, 2018, 61(4): 233-240.
[28] Pace J, Gardner C, Romay C, Ganapathysubramanian B, Lübberstedt T. Genome-wide association analysis of seedling root development in maize (L.). BMC Genomics, 2015, 16(1): 47.
[29] Liu S, Fan C C, Li J N, Cai G Q, Yang Q Y, Wu J, Yi X Q, Zhang C Y, Zhou Y M. A genome-wide association study reveals novel elite allelic variations in seed oil content of. Theoretical and Applied Genetics, 2016, 129(6): 1203-1215.
[30] Fletcher R S, Herrmann D, Mullen J L, Li Q F, Schrider D R, Price N, Lin J J, Grogan K, Kern A, McKay J K. Identification of polymorphisms associated with drought adaptation QTL inby resequencing. G3 (Bethesda), 2016, 6(4): 793-803.
[31] Sabagh E A, Hossain A, barut?ular C, Islam M S, Ratnasekera D, Kumar N, Meena R S, Gharib H, Saneoka H, Teixeira d S J. Drought and salinity stress management for higher and sustainable canola (L.) production: A critical review. Australian Journal of Crop Science, 2019, 13: 88-97.
[32] Zahedi H, Tohidi Moghadam H R. Effect of drought stress on antioxidant enzymes activities with zeolite and selenium application in canola cultivars. Research on Crops, 2011, 12: 388-392.
[33] Zamani S, Nezami M T, Habibi D, Khorshidi m. Effect of quantitative and qualitative performance of four canola cultivars (L.) to salinity conditions. Advances in Environmental Biology, 2010, 4: 422-427.
[34] Mohammadi M, Ghassemi-Golezani K, Chaichi M R, Safikhani S. Seed oil accumulation and yield of safflower affected by water supply and harvest time. Agronomy Journal, 2018, 110(2): 586-593.
[35] Guo Y L, Huang Y, Gao J, Pu Y Y, Wang N, Shen W Y, Wen J, Yi B, Ma C Z, Tu J X, FU T D, ZOU J T, SHEN J X. CIPK9 is involved in seed oil regulation inL. and(L.) Heynh. Biotechnology for Biofuels, 2018, 11: 124.
[36] Cai G Q, Wang G L, Kim S C, Li J W, Zhou Y M, Wang X M. Increased expression of fatty acid and ABC transporters enhances seed oil production in camelina. Biotechnology for Biofuels, 2021, 14(1): 49.
[37] GRAMI B, STEFANSSON B R, BAKER R J. Genetics of protein and oil content in summer rape: heritability, number of effective factors, and correlations. Canadian Journal of Plant Science, 1977, 57(3): 937-943.
[38] Goffman F D, Alonso A P, Schwender J, Shachar-Hill Y, Ohlrogge J B. Light enables a very high efficiency of carbon storage in developing embryos of rapeseed. Plant Physiology, 2005, 138(4): 2269-2279.
[39] Kwak J S, Kim S I, Park S W, Song J T, Seo H S. E3 SUMO ligase AtSIZ1 regulates the cruciferin content ofseeds. Biochemical and Biophysical Research Communications, 2019, 519(4): 761-766.
[40] Xiong J L, Dai L L, Ma N, Zhang C L. Transcriptome and physiological analyses reveal that AM1 as an ABA-mimicking ligand improves drought resistance in. Plant Growth Regulation, 2018, 85(1): 73-90.
[41] Koeslin-Findeklee F, Rizi V S, Becker M A, Parra- Londono S, Arif M, Balazadeh S, Mueller-Roeber B, Kunze R, Horst W J. Transcriptomic analysis of nitrogen starvation- and cultivar-specific leaf senescence in winter oilseed rape (L.). Plant Science, 2015, 233: 174-185.
[42] Tang S, Peng F, Tang Q, Xia H, Yao X, Lu S, Guo L. BnaPPT1 is essential for chloroplast development and seed oil accumulation in. Journal of Advanced Research, 2022, 42: 29-40.
[43] Huang K L, Zhang M L, Ma G J, Wu H, Wu X M, Ren F, Li X B. Transcriptome profiling analysis reveals the role of silique in controlling seed oil content in. PLoS One, 2017, 12(6): e0179027.
[44] Zhou Z J, Lin B G, Tan J J, Hao P F, Hua S J, Deng Z P. Tandem mass tag-based quantitative proteomics reveals implication of a late embryogenesis abundant protein (BnLEA57) in seed oil accumulation inL.. Frontiers in Plant Science, 2022, 13: 907244.
Genome-Wide association Analysis of the Changes in oil content and protein content under drought Stress inL.
HU Sheng, LI YangYang, TANG ZhangLin, LI JiaNa, QU CunMin, LIU LieZhao
College of Agronomy and Biotechnology, Southwest University, Chongqing 400715
【】 Drought is one of the most adverse abiotic stresses that hinder growth and development ofL., threatening its yield and quality. In this study, we identified the candidate genes that influence oil and protein content changes according to the results of the genome wide association mapping (GWAS) and differentially expressed genes (DEGs) under drought stress in. 【】 A natural population comprising 183lines under drought stress across two years was genotyped with a Brassica 60K Illumina Infinium SNP array to perform GWAS. Combined with drought stressed seed transcriptome data from different treatment periods, the candidate genes related to the changes in oil and protein contents under drought stress were identified. 【】 The analysis showed that the best model for phenotypic data analysis in 2 years was mainly the Q or na?ve model, and a total of 38 significant associated loci were detected (<1/31597 or<1/31278). By integrating GWAS and transcriptome results, 256 common genes were selected, and by comparing the database information ofand, 25 related candidate genes were identified. These genes, including transcription factors (e.g., bZIP transcription factor GBF6, TALE transcription factor ATH1, MYB-like Domain transcription factor MYBD, NAC transcription factorANAC029, ERF transcription factor ERF111), related kinases (e.g., PIP5K1, PFK7), related proteins (e.g., seed stores protein CRU3, chloroplast protein DG238 and CP12, stress-responsive proteins HUP26 and M10), are involved in multiple biological processes such as photosynthetic reaction, substance transport, and stress response. For instance, oil-related protein kinase CIPK9, ABCA9 transporter, storage-related protein CRU3, may provide basis for explaining the changes in oil and protein contents ofunder drought stress. 【】 The 25 identified candidate genes may affect the accumulation of protein and oil contents under drought stress during the seed development in.
L.; candidate genes; drought stress; oil content; protein content
2022-08-22;
2022-10-21
重慶市研究生科研創(chuàng)新項目(CYS21122)、國家自然科學(xué)基金(31971902,32001509)
胡盛,E-mail:916340758@qq.com。通信作者劉列釗,E-mail:liezhao@swu.edu.cn
(責(zé)任編輯 李莉)