陳 鎮(zhèn),何曉瑩,王敬喬,李根澤,束正齊,趙凱琴,程小毛,俎 峰
(1.云南省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所,昆明 650225;2.西南林業(yè)大學(xué)園林園藝學(xué)院∕國(guó)家林業(yè)與草原局西南風(fēng)景園林工程技術(shù)研究中心,昆明 650224)
甘藍(lán)型油菜(Brassica napusL.,2n=38,AACC)是中國(guó)重要的油料作物,菜子油是中國(guó)第一大食用油,占國(guó)產(chǎn)植物油的47%。隨著人均生活水平的進(jìn)一步提升,大眾對(duì)菜子油品質(zhì)有了更高的要求[1,2]。菜子油的高品質(zhì)主要由單不飽和油酸(C18∶1)和2種多不飽和亞油酸(C18∶2)、亞麻酸(C18∶3)組成的脂肪酸決定。高濃度的亞油酸、亞麻酸會(huì)影響油脂的穩(wěn)定性和營(yíng)養(yǎng)價(jià)值[3],而較高含量的油酸可提升種子與油的氧化穩(wěn)定性,延長(zhǎng)保質(zhì)期。此外,油酸是一種不飽和脂肪酸,其營(yíng)養(yǎng)價(jià)值高,對(duì)人體心血管健康有良好作用[4-6]。因而選育高油酸的雙低油菜品種是當(dāng)前油菜品質(zhì)改良的重要目標(biāo)之一。
在植物中,不飽和脂肪酸的形成需要復(fù)雜多酶復(fù)合體的催化,其合成主要分為兩個(gè)過(guò)程:初步合成以及進(jìn)一步去飽和。首先是在質(zhì)體中生成不同鏈長(zhǎng)的飽和脂肪酸,如十八碳飽和脂肪酸-硬脂酸(18∶0)在硬脂酰-ACP去飽和酶(Stearoyl-ACP desaturase,SAD)的催化作用下生成單不飽和脂肪酸-油酸(18∶1),隨后油酸在油酸脫氫酶(FattyAcid Desaturase 2,F(xiàn)AD2)的催化作用下生成多不飽和脂肪酸-亞油酸,這是產(chǎn)生多聚不飽和脂肪酸的關(guān)鍵步驟[7-9]。由此可見(jiàn)基因FAD2可能是調(diào)控油酸與亞油酸含量比例的關(guān)鍵因子。自1994年,Okuley等[10]在擬南芥中發(fā)現(xiàn)油酸脫氫酶主要由FAD2基因控制,隨后研究人員相繼在花生[11]、大豆[12]、油菜[13]和玉米[14,15]等油料作物以及油桐[16]、橄欖[17]等油料樹(shù)種中克隆到了FAD2基因。在對(duì)控制油菜油酸和亞油酸含量基因進(jìn)行定位的研究中,學(xué)者發(fā)現(xiàn)控制高油酸性狀的主要基因是FAD2基因的1個(gè)功能拷貝,位于N5連鎖群上,該基因的突變能影響脂肪酸含量[18];進(jìn)一步通過(guò)QTL定位以及分子克隆研究發(fā)現(xiàn),在甘藍(lán)型油菜中FAD2基因有4個(gè)拷貝,且該基因位于A5染色體上[19],C5染色體上也存在基因表達(dá)的調(diào)控區(qū)[20,21],這是控制油酸含量的主要因子。此外Zhao等[22]在甘藍(lán)型油菜A9染色體上鑒定出一個(gè)新的控制油酸含量的QTL位點(diǎn),結(jié)合FAD2突變等位基因能將油酸含量提高至80%左右。在花生中鑒定與含油量相關(guān)QTL中,發(fā)現(xiàn)FAD2基因?qū)φ{(diào)控油酸、亞油酸含量及油酸與亞油酸含量之比具有顯著作用,而對(duì)總含油量沒(méi)有影響[11]。隨著生物技術(shù)的發(fā)展,在不同種植物中FAD2基因功能也得到相應(yīng)驗(yàn)證,通過(guò)介導(dǎo)多個(gè)FAD2基因沉默,使大豆產(chǎn)生高達(dá)80%的油酸,在甘藍(lán)型油菜中對(duì)FAD2基因進(jìn)行反義抑制,可使油菜油酸含量最高提升至86%,且高油酸表型能穩(wěn)定遺傳[23,24]。
FAD2基因?qū)刂浦参镉退岷蛠営退岷科鸬斤@著作用,其編碼的油酸脫氫酶(FAD2)是脂肪酸代謝路徑的關(guān)鍵酶,能將油酸向亞油酸進(jìn)行生物轉(zhuǎn)化,但對(duì)甘藍(lán)型油菜FAD2基因生物信息學(xué)系統(tǒng)分析鮮有報(bào)道。因此,對(duì)甘藍(lán)型油菜及其二倍體祖先種FAD2基因進(jìn)行生物信息學(xué)分析具有重要意義。本研究應(yīng)用生物信息學(xué)方法,依據(jù)AtFAD2基因信息,在甘藍(lán)型油菜及其二倍體祖先種全基因數(shù)據(jù)庫(kù)中進(jìn)行同源比對(duì)篩選得到FAD2基因。從氨基酸序列的組成成分、蛋白質(zhì)基本理化性質(zhì)、亞細(xì)胞定位、蛋白序列保守結(jié)構(gòu)域、蛋白質(zhì)二級(jí)、三級(jí)結(jié)構(gòu)以及十字花科蕓薹家族遺傳進(jìn)化關(guān)系等方面,進(jìn)行初步預(yù)測(cè)分析,最后基于保守結(jié)構(gòu)域序列設(shè)計(jì)用于基因編輯靶點(diǎn)序列,并預(yù)期對(duì)這些靶點(diǎn)進(jìn)行基因編輯。期望能夠獲得FAD2基因功能缺失突變體,進(jìn)而提升子粒油酸含量和菜子油質(zhì)量,為甘藍(lán)型油菜FAD2基因的分子機(jī)理及分子標(biāo)記輔助選擇育種提供數(shù)據(jù)支持與參考。
在擬南芥數(shù)據(jù)庫(kù)TAIR(https:∕∕www.arabidopsis.org∕)中檢索獲取AtFAD2基因蛋白質(zhì)序列。將其作為參考序列,在蕓薹屬植物基因組數(shù)據(jù)庫(kù)BRAD(http:∕∕brassicadb.org∕brad∕)中執(zhí)行Blastp,設(shè)置篩選條件為相似度(Identities)>60%、E-value值<1e-80,獲取3個(gè)二倍體基本種白菜(B.rapa)、甘藍(lán)(B.oleracea)、黑芥(B.nigra)及其2個(gè)異源四倍體雜交種甘藍(lán)型油菜和芥菜型油菜(B.juncea)的同源蛋白質(zhì)序列。
利用在線分析工具ExPASyProteomics Server[25]中的ProtParam程序(https:∕∕web.expasy.org∕protparam∕)分析擬南芥、白菜、甘藍(lán)以及甘藍(lán)型油菜FAD2基因的蛋白質(zhì)基本理化性質(zhì),包含氨基酸組成、理論等電點(diǎn)(Theoretical pI)、分子質(zhì)量(Molecular mass)、不穩(wěn)定系數(shù)(Instability index)、脂肪酸含量系數(shù)(Aliphatic index)以及疏水性(GRAVY:Grand average of hydropathicity)(當(dāng)GRAVY值為正值時(shí),說(shuō)明該蛋白為親水蛋白,為負(fù)值時(shí)說(shuō)明為疏水蛋白);利用在線分析 工 具WoLF PSORT(https:∕∕wolfpsort.hgc.jp∕)和TargetP-2.0(http:∕∕www.cbs.dtu.dk∕services∕TargetP∕)對(duì)其進(jìn)行亞細(xì)胞定位預(yù)測(cè)分析。
利用在線分析程序SMART[26](http:∕∕smart.emblheidelberg.de∕)獲取擬南芥、白菜、甘藍(lán)以及甘藍(lán)型油菜FAD2蛋白質(zhì)的保守結(jié)構(gòu)域序列,運(yùn)用Clustal W[27]程序進(jìn)行多序列比對(duì)分析。使用在線分析程序MEME Version 5.1.1[28](http:∕∕meme-suite.org∕tools∕meme),設(shè)置最大基序檢索值為7,分析蛋白質(zhì)的保守基序信息。利用NCBI主頁(yè)中Domains&Structures里CD-Search(https:∕∕www.ncbi.nlm.nih.gov∕Structure∕cdd∕wrpsb.cgi)在線分析FAD2蛋白質(zhì)序列的保守結(jié)構(gòu)域。
利用SOPMA SECONDARY STRUCTURE PREDICTION METHOD(https:∕∕npsa-prabi.ibcp.fr∕)網(wǎng) 站在線預(yù)測(cè)分析其蛋白質(zhì)的二級(jí)結(jié)構(gòu),包括α-螺旋(Alpha helix)、β-轉(zhuǎn)角(Beta turn)、延伸鏈(Extended strand)以及無(wú)規(guī)則卷曲(Random coil)等;在線采用SWISS-MODEL分析網(wǎng)站(https:∕∕swissmodel.expasy.org∕interactive)預(yù)測(cè)分析蛋白質(zhì)三級(jí)結(jié)構(gòu)并繪圖。
使用軟件MEGA-X[29]中的Clustal W[27]程序?qū)λ@得的3個(gè)二倍體基本種及其2個(gè)異源四倍體雜交種FAD2基因的蛋白質(zhì)序列進(jìn)行多重序列比對(duì),生成MEGA格式文件,再使用MEGA-X分析比對(duì)結(jié)果,并采用鄰接法(Neighbor-Joining,NJ)∕UGPMA構(gòu)建系統(tǒng)進(jìn)化樹(shù),設(shè)定泊松校正法計(jì)算進(jìn)化距離和重復(fù)1 000次的自展法(bootstrap)檢驗(yàn),其余均設(shè)置為默認(rèn)參數(shù)。
提交擬南芥FAD2基因(AT3G12120,1)序列到在線sgRNA分析網(wǎng)站(http:∕∕chopchop.cbu.uib.no∕),尋找擬南芥AtFAD2與油菜BnFAD2基因靠近5′端序列作為基因編輯的靶點(diǎn),在靶點(diǎn)區(qū)域?qū)ふ揖哂蠵AM(NGG)特征序列的位點(diǎn)及其附近序列作為sgRNA序列。從蕓苔屬作物數(shù)據(jù)網(wǎng)站(http:∕∕brassicadb.org∕brad∕index.php)下載甘藍(lán)型油菜V4.1、甘藍(lán)V1.1與白菜V3.0 CDS序列;使用Blast+2.7.1軟件包Makeblastdb命令分別搭建甘藍(lán)型油菜、甘藍(lán)與白菜本地化CDS基因組Blastn分析數(shù)據(jù)庫(kù),參數(shù)設(shè)置為-hash_index、-parse_seqids、-dbtypenucl;使用Blastn命令提交sgRNA序列到本地化數(shù)據(jù)庫(kù)進(jìn)行Blast分析,用以判斷該序列是否具有同源拷貝間保守性,不同基因間的特異性,其參數(shù)設(shè)置為-task blastn-short、-qcov_hsp_perc 100、-evalue 6E-06-outfmt 6。
研究利用AtFAD2基因蛋白質(zhì)序列,通過(guò)Blastp分析,分別在白菜、甘藍(lán)和甘藍(lán)型油菜蛋白質(zhì)基因組數(shù)據(jù)庫(kù)中共獲得6條FAD2基因同源蛋白質(zhì)序列,其中白菜、甘藍(lán)與甘藍(lán)型油菜各有2條(表1)。
表1 FAD2蛋白的理化性質(zhì)和亞細(xì)胞定位
通過(guò)使用Protparam在線程序進(jìn)行理化性質(zhì)和亞細(xì)胞定位分析(表1)。結(jié)果表明,序列最長(zhǎng)的為458 aa(BnaC05g40970D),最短的為319 aa(BraA01-g039180.3C);分子質(zhì)量最大的為52.880 80 kDa(Bna-C05g40970D),最小的為35.737 83 kDa(BraA01g039-180.3C);理論等電點(diǎn)最高為10.24(BraA01g039-180.3C),最低為8.39(AT3G12120.1),說(shuō)明所有蛋白質(zhì)中堿性氨基酸所占的比例較大;不穩(wěn)定性系數(shù)值最 高 的 為56.76(BraA01g039180.3C),最 低 的 為35.69(Bol010322),其中有3種為穩(wěn)定蛋白質(zhì)(<40);脂肪族指數(shù)最高的為93.48(BraA01g039180.3C),最低的為79.80(Bol007285);疏水性指數(shù)最高的為-0.094(AT3G12120.1),最低的為-0.263(BnaA05g26-900D),均為疏水性蛋白(負(fù)值)。利用在線工具WoLF PSORT預(yù)測(cè)分析亞細(xì)胞定位,結(jié)果表明所有蛋白質(zhì)均定位在內(nèi)質(zhì)網(wǎng)上。
使用在線軟件MEME分析得到的7條FAD2基因的蛋白質(zhì)保守基序,發(fā)現(xiàn)FAD2基因的蛋白質(zhì)具有高度的序列保守性。保守性較高的7基序在7條FAD2蛋白質(zhì)序列中的分布情況見(jiàn)圖1。由圖1可知,各蛋白質(zhì)序列高度保守,但不同植物之間蛋白質(zhì)序列所包含的保守基序種類和數(shù)目有一定的差異,相同物種內(nèi)蛋白質(zhì)保守基序的組成模式更為相似。所有的FAD2蛋白質(zhì)序列都包含Motif1、Motif3和Motif5,說(shuō)明這些區(qū)域可能是具有重要功能的保守基 序 。AT3G12120.1、BraA05g034790.3C、BnaA05g 26900D和BnaC05g40970D的保守基序組成是完全一致,為Motif6-Motif3-Motif1-Motif5-Motif7-Motif4-Motif2,對(duì)比發(fā)現(xiàn)與另外兩組之間保守基序的組成較為相似,Bol010322缺少M(fèi)otif3,BraA01g039180.3C缺少M(fèi)otif2和Motif6,而B(niǎo)ol007285僅包含Motif1、Motif5和Motif6 3條基序,較其他基序組成明顯不同,這可能是其在基因家族構(gòu)建的進(jìn)化樹(shù)中單獨(dú)分為一支的主要原因。
甘藍(lán)型油菜FAD2蛋白質(zhì)保守結(jié)構(gòu)域分析結(jié)果顯示(圖1),該序列屬于Membrane-FADS-like超家族,含ω-6脂肪酸去飽和酶(PLN02505:omega-6 fatty acid desaturase)的功能性結(jié)構(gòu)域,且能結(jié)合細(xì)胞膜上的保守性結(jié)構(gòu)域。
圖1 FAD2蛋白質(zhì)保守基序與結(jié)構(gòu)域預(yù)測(cè)
蛋白質(zhì)的二級(jí)結(jié)構(gòu)將蛋白質(zhì)高級(jí)結(jié)構(gòu)與一級(jí)結(jié)構(gòu)連接,起橋梁和紐帶的作用,也為蛋白質(zhì)高級(jí)結(jié)構(gòu)的預(yù)測(cè)分析提供一定的基礎(chǔ);蛋白質(zhì)的三級(jí)結(jié)構(gòu)是蛋白質(zhì)發(fā)揮作用的主要形式。使用在線工具SOPMA對(duì)FAD2蛋白質(zhì)執(zhí)行二級(jí)結(jié)構(gòu)預(yù)測(cè),發(fā)現(xiàn)FAD2的整體結(jié)構(gòu)由α-螺旋、β-轉(zhuǎn)角、延伸鏈以及無(wú)規(guī)則卷曲這四部分元件組成(表2),其中α-螺旋、無(wú)規(guī)則卷曲這兩部分含量較多,為主要組成元件,β-轉(zhuǎn)角和延伸鏈含量較少。預(yù)測(cè)結(jié)果符合FAD2蛋白質(zhì)的基本結(jié)構(gòu)特征。
表2 FAD2蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè) (單位:%)
利用在線工具SWISS-MODEL對(duì)BnFAD2蛋白質(zhì)的三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)分析(圖2)。由圖2可知,BnFAD2蛋白質(zhì)的三級(jí)結(jié)構(gòu)主要由α-螺旋、無(wú)規(guī)則卷曲構(gòu)成,預(yù)測(cè)結(jié)果符合FAD2蛋白質(zhì)二級(jí)結(jié)構(gòu)。
圖2 BnFAD2蛋白質(zhì)的三級(jí)結(jié)構(gòu)預(yù)測(cè)
通過(guò)Blastp方法在蕓薹屬基因組數(shù)據(jù)庫(kù)中篩選獲取蕓薹屬物種FAD2基因的同源蛋白質(zhì)序列。使用MEGA-X軟件中的NJ法構(gòu)建擬南芥、甘藍(lán)、白菜、蘿卜、黑芥、芥菜型油菜以及甘藍(lán)型油菜的FAD2同源蛋白質(zhì)系統(tǒng)進(jìn)化樹(shù),整體上所有基因主要分為3個(gè)不同的類群(圖3)。在第一組中,BniB035019和BjuB006936、BjuA006128和BraA01g039180、BjuB02 3697和BniB010651分別聚集在1個(gè)分支上,其同源相似性分別為100%、100%和99%,說(shuō)明彼此之間的親緣關(guān)系最為接近;在第二組中,BnaC05g40970D、BraA05g034790、BnaA05g26900D和BjuA020389也聚集在一支上,說(shuō)明其親緣關(guān)系比較接近;而甘藍(lán)型油菜BnaA05g26900D和白菜BraA05g034790聚為一支,同源相似性為62%,進(jìn)一步說(shuō)明甘藍(lán)型油菜的A基因組可能起源于白菜的A基因組。在整個(gè)系統(tǒng)進(jìn)化樹(shù)構(gòu)建中,Bol007285單獨(dú)被聚為另一支,說(shuō)明親緣關(guān)系與其他蕓薹屬所有的親緣關(guān)系較遠(yuǎn)。
圖3 蕓薹屬FAD2蛋白質(zhì)的系統(tǒng)進(jìn)化樹(shù)
AtFAD2基因由2個(gè)外顯子和1個(gè)內(nèi)含子組成,利用在線預(yù)測(cè)網(wǎng)站在該基因外顯子序列上共設(shè)計(jì)出144條sgRNA,即144個(gè)位點(diǎn)可作為CRISPR-Cas9的靶點(diǎn),均位于第二外顯子上(圖4)。Blastn分析發(fā)現(xiàn),部分sgRNA序列在白菜、甘藍(lán)及甘藍(lán)型油菜CDS數(shù)據(jù)庫(kù)中完全一致,表明其在同源拷貝間具有高度保守性,這與蛋白質(zhì)序列的保守性分析結(jié)果保持一致。進(jìn)一步分析,在甘藍(lán)型油菜基因庫(kù)篩選得到sgRNA序列長(zhǎng)度為23 bp,共10條,且僅在FAD2基因中存在,而其他基因中不存在該序列,即CRISPR-Cas9的靶點(diǎn)必須也只能是FAD2基因的各個(gè)功能拷貝,不能是其他基因,這表明該序列在不同基因間具有特異性(表3)。
表3 FAD2基因目標(biāo)靶點(diǎn)的選擇分析
圖4 擬南芥FAD2基因的目標(biāo)靶點(diǎn)區(qū)域
脂肪酸去飽和酶的關(guān)鍵因子FAD2基因?qū)φ{(diào)控植物油酸含量起到重要作用,在不同植物中,深入研究該基因,提升油酸含量從而提高植物油品質(zhì),成為育種學(xué)家一直研究的方向。本研究基于生物信息學(xué),以擬南芥FAD2基因核苷酸和蛋白質(zhì)序列作參考,系統(tǒng)性地預(yù)測(cè)分析甘藍(lán)型油菜FAD2基因。研究表明,在甘藍(lán)型油菜基因組數(shù)據(jù)庫(kù)中,共篩選到2條蛋白質(zhì)序列BnaA05g26900D和BnaC05g40970D,其長(zhǎng)度均在450 aa左右,分子質(zhì)量在52 kDa左右,理論等電點(diǎn)在9.2左右,不穩(wěn)定系數(shù)在44~46,均定位在內(nèi)質(zhì)網(wǎng)上,推測(cè)這很可能是脂肪酸去飽和酶基因的主要特征。FAD2基因在擬南芥和蕓薹屬中的白菜、甘藍(lán)和甘藍(lán)型油菜具有高度的保守性,均包含Motif1、Motif3和Motif5 3個(gè)主要保守基序,這與前人結(jié)果保持一致[18]。進(jìn)一步預(yù)測(cè)分析發(fā)現(xiàn),該基因編碼的蛋白屬于Membrane-FADS-like超蛋白家族,且含脂肪酸去飽和酶的功能和保守結(jié)構(gòu)域,其二級(jí)、三級(jí)結(jié)構(gòu)基本相吻合,推測(cè)FAD2基因與油酸含量高度相關(guān),與此前研究人員相繼在紅花屬植物和豆科植物得到的結(jié)論相同[30,31]。
隨著研究深入,在設(shè)計(jì)FAD2基因靶點(diǎn)以及sgRNA序列保守性與特異性分析發(fā)現(xiàn),該序列呈高度保守,若對(duì)合適位點(diǎn)整合突變,將能提升子粒油酸含量,進(jìn)而提升菜子油的品質(zhì)。甘藍(lán)型油菜屬于異源四倍體,由兩個(gè)祖先種白菜和甘藍(lán)雜交產(chǎn)生,基因突變來(lái)源狹窄,難以獲取相關(guān)優(yōu)良性狀,因此挖掘新的FAD2基因突變材料來(lái)拓展種質(zhì)材料的遺傳多樣性是非常必要的。由RNA介導(dǎo)的CRISPR-Cas9系統(tǒng)是一種新型基因編輯的實(shí)用工具,在定點(diǎn)誘變中具有顯著優(yōu)勢(shì)。Yuan等[32]首次采用CRISPR的基因編輯方法誘導(dǎo)FAD2基因突變,從而開(kāi)發(fā)具有多種遺傳背景的高油酸系的花生品種;AI Amin等[33]利用CRISPR-Cas9系統(tǒng)對(duì)大豆中FAD2-2基因進(jìn)行特異性整合突變,獲得大豆油酸高含量。此外利用該系統(tǒng)對(duì)FAD2基因進(jìn)行編輯,已經(jīng)在茶樹(shù)[34]、煙草[35]和甘藍(lán)[36]等作物上成功應(yīng)用。采用新一代基因編輯CRISPR-Cas9技術(shù)對(duì)FAD2基因保守位點(diǎn)進(jìn)行編輯是可行與必要的。本研究在甘藍(lán)型油菜基因庫(kù)篩選得到10條sgRNA序列,長(zhǎng)度均為23 bp,同源相似度為100%,且該序列只可能在FAD2基因中存在,為CRISPR-Cas9系統(tǒng)在甘藍(lán)型油菜FAD2基因中應(yīng)用提供一定數(shù)據(jù)參考。
甘藍(lán)型油菜FAD2基因亞細(xì)胞均定位于內(nèi)質(zhì)網(wǎng)上,肽鏈表現(xiàn)為疏水性、較穩(wěn)定。蛋白質(zhì)二、三級(jí)結(jié)構(gòu)預(yù)測(cè)表明,F(xiàn)AD2基因蛋白質(zhì)結(jié)構(gòu)主要以α-螺旋和無(wú)規(guī)則卷曲為組成成分;蛋白質(zhì)保守結(jié)構(gòu)域顯示,F(xiàn)AD2基因的蛋白質(zhì)具有高度的序列保守性,屬于Membrane-FADS-like超家族,且含PLN02505保守結(jié)構(gòu)域。系統(tǒng)進(jìn)化樹(shù)構(gòu)建分析顯示,甘藍(lán)型油菜和白菜、甘藍(lán)以及芥菜型油菜具有較近的親緣關(guān)系。CRISPR-Cas9基因編輯靶點(diǎn)分析發(fā)現(xiàn),甘藍(lán)型油菜FAD2基因中存在10個(gè)高度序列保守性的靶點(diǎn)位點(diǎn),并設(shè)計(jì)出相應(yīng)的sgRNA。結(jié)果對(duì)后續(xù)深入研究FAD2基因的表達(dá)調(diào)控及作用機(jī)制及利用基因編輯技術(shù)定向突變FAD2基因進(jìn)而創(chuàng)制高油酸新種質(zhì)資源提供數(shù)據(jù)參考與理論支持。