張帥,林科運(yùn),侯純樸,方玉潔,王幼平
(揚(yáng)州大學(xué)生物科學(xué)與技術(shù)學(xué)院,江蘇 揚(yáng)州,225009)
質(zhì)體藍(lán)素(phytocyanin,PC)是一類植物特異性I型藍(lán)銅蛋白(blue copper proteins,BCP),包括plastocyanin 和PC 相關(guān)蛋白[1,2]。盡管PC 蛋白家族成員之間的序列一致性通常并不高,但該家族所有成員的蛋白質(zhì)序列均具有兩個(gè)保守的能形成二硫鍵的半胱氨酸(cysteine,Cys),其中部分成員具有4 個(gè)保守的銅離子結(jié)合位點(diǎn),由2 個(gè)組氨酸(histidine,His)、1個(gè)Cys和1個(gè)甲硫氨酸(methionine,Met)或谷氨酰胺(glutamine,Gln)組成[2,3]。PC 蛋白有4 個(gè)結(jié)構(gòu)域(IIV),包括1 個(gè)必要的類質(zhì)體藍(lán)素域(plastocyaninlike domain,PLCD)(結(jié)構(gòu)域II)和3 個(gè)可選結(jié)構(gòu)域(結(jié)構(gòu)域I、III和IV)[4]。
根據(jù)銅配體殘基的特性和蛋白結(jié)構(gòu)組分等特征,PC 家族可分為4 個(gè)亞家族:類質(zhì)體藍(lán)素蛋白(plantacyanin-like protein,PLCL)、類花青素苷蛋白(uclacyanin-like protein,UCL)、類漆樹(shù)藍(lán)蛋白(stellacyanin-like protein,SCL)和類早期結(jié)瘤素蛋白(early nodulin-like protein,ENODL)[5,6]。其中UCL與PLCL 的銅配體殘基相同,由2個(gè)His、1個(gè)Cys和1個(gè)Met 組成,而UCL 則屬于嵌合型糖蛋白,PLCL 為非糖蛋白[7]。與UCL 和PLCL 不同,SCL 銅配體殘基中的Gln被Met所取代,但SCL與作為嵌合型糖蛋白的UCL 相似,它們不僅包含銅結(jié)合結(jié)構(gòu)域,而且其蛋白質(zhì)骨架中還包含糖蛋白樣結(jié)構(gòu)域,SCL 和UCL通過(guò)Asn-X-Thr/Ser 中的Asn 殘基提供N-糖基化位點(diǎn),部分SCL 和UCL 通過(guò)Ser 和羥脯氨酸(Hyp)殘基提供O-糖基化位點(diǎn)[8]。與另外三個(gè)亞家族不同,ENODL 家族成員的蛋白骨架缺乏完整的銅離子結(jié)合位點(diǎn),銅配體中的4 個(gè)氨基酸殘基部分或全部被其它氨基酸殘基取代[9]。研究發(fā)現(xiàn),在擬南芥(Arabidopsis thaliana)和水稻(Oryza sativa)中,大部分PC中存在類阿拉伯半乳聚糖蛋白域(arabinogalactan protein-like region,ALR),因此PC基因家族也被歸為AGP超家族中的一個(gè)亞家族[9,10]。
在已有的研究報(bào)道中,PLCL、SCL、UCL 蛋白功能研究較少。在擬南芥中,過(guò)表達(dá)plantacyanin抑制花粉粒萌發(fā),破壞花粉管的定向生長(zhǎng),并導(dǎo)致種子結(jié)實(shí)率降低[11]。在辣椒中,SCL 參與了被野油菜黃單胞菌葉斑病無(wú)毒菌株感染的葉片的超敏反應(yīng)[12]。過(guò)表達(dá)OsUCL8導(dǎo)致花粉管的生長(zhǎng)和授粉出現(xiàn)明顯異常,影響水稻結(jié)實(shí)率;相反,敲除OsUCL8和過(guò)表達(dá)miR408 的植株花粉萌發(fā)率顯著提高[13]。與功能研究較少的PLCL、SCL、UCL 相比,ENODL 蛋白的功能研究更為廣泛和全面,且在根中的研究居多。豆科植物中的研究表明,大豆中的GmENODL55[14],豌豆中的VsENODL5、VsENODL12和VsENODL40[15],以及苜蓿中的MtENODL16和MtENODL20[16]在根瘤中高表達(dá),參與了豆科植物的結(jié)瘤過(guò)程。已有研究證實(shí),VsENOD5在受根瘤菌侵染前的根瘤原基中并不表達(dá),而在受侵染后攜帶侵染線的豌豆根皮層細(xì)胞和被侵染的根瘤細(xì)胞中表達(dá)[15,17]。大豆GmENOD55也顯示出相似的表達(dá)模式,僅在受慢生型大豆根瘤菌侵染后的大豆根瘤細(xì)胞中表達(dá)[14]。MtENOD20是一個(gè)在根皮層細(xì)胞激活過(guò)程中受結(jié)瘤因子誘導(dǎo)的標(biāo)志基因,該基因的轉(zhuǎn)錄激活起始于對(duì)應(yīng)根瘤原基形成位置處于分裂狀態(tài)的內(nèi)皮層細(xì)胞,隨后該基因在含有侵染線的根毛細(xì)胞中表達(dá)[18]。最近的研究顯示,蒺藜苜蓿MtENODL27和MtENODL28 在根瘤中特異表達(dá),且在被侵染的根中表達(dá)上調(diào);抑制MtENODL27和MtENODL28表達(dá)會(huì)阻礙根瘤菌的侵染和根瘤形成,說(shuō)明MtENODL27/28 是根瘤菌侵染和根瘤發(fā)育的必需因子[4]。除了在根系中表達(dá)之外,ENODL基因也被發(fā)現(xiàn)在水稻的高蛋白淀粉層中表達(dá)[19]。ENODL家族中的Pn14基因在牽?;ǎ≒harbitis nil)的分生組織、原形成層、莖尖周圍的葉原基表皮毛以及根尖的分生組織和原形成層中表達(dá),暗示其可能參與植物的細(xì)胞壁重建和器官分化[20]。此外,擬南芥中At3g20570編碼的ENODL 蛋白在篩管分子的細(xì)胞膜中積聚,并參與調(diào)控?cái)M南芥的生殖能力[21]。這些研究表明ENODL 不僅在根中發(fā)揮作用,而且可能在植物發(fā)育的其它階段發(fā)揮功能。
前人的研究表明,PC也參與植物對(duì)非生物脅迫的應(yīng)答過(guò)程。厚葉蛛毛苣薹(Boea crassifolia)中BcBCP1受干旱脅迫和鹽脅迫誘導(dǎo)上調(diào)表達(dá),在煙草中異源過(guò)表達(dá)BcBCP1使轉(zhuǎn)基因煙草的抗旱性增強(qiáng),在滲透脅迫下表現(xiàn)出更高的存活率和更高的光合速率[22]。玉米中的PC基因家族也參與對(duì)鹽脅迫和干旱脅迫的響應(yīng),在鹽處理?xiàng)l件下,玉米中9 個(gè)PC基因(ZmUC10、ZmUC16、ZmUC19、ZmSC2、ZmUC21、ZmENODL10、ZmUC22、ZmENODL13和ZmENODL15)表達(dá)下調(diào);在干旱處理?xiàng)l件下,5個(gè)PC基因(ZmUC19、ZmSC2、ZmENODL10、ZmUC22和ZmENODL13)的表達(dá)下調(diào),而ZmUC16表達(dá)顯著增強(qiáng)[23]。早期的研究證實(shí),擬南芥藍(lán)銅結(jié)合蛋白基因AtBCB的表達(dá)受光負(fù)調(diào)節(jié),其編碼的藍(lán)銅結(jié)合蛋白可能作為電子載體參與細(xì)胞膜區(qū)的電子傳遞反應(yīng)[24]。AtBCB/AtSC3受鋁脅迫和氧化脅迫誘導(dǎo)表達(dá)[25,26]。后續(xù)研究表明,AtBCB蛋白主要定位于細(xì)胞膜上,與野生型植株相比,過(guò)表達(dá)AtBCB的轉(zhuǎn)基因擬南芥在根中積累更多的木質(zhì)素,過(guò)表達(dá)AtBCB的酵母轉(zhuǎn)化子對(duì)鋁的抗性增強(qiáng),說(shuō)明AtBCB 能夠抑制鋁的吸收和鋁毒害造成的氧化脅迫[27]。
全基因組系統(tǒng)分析能夠?yàn)殍b定基因家族成員并闡明其生物學(xué)作用提供有效的途徑和依據(jù)。目前研究者們已經(jīng)對(duì)擬南芥[10]、水稻[9]、大白菜(Brassica rapa)[28]、玉米(Zea mays)[23]、蝴蝶蘭(Phalaenopsis equestris)[29]和蒺藜苜蓿(Medicago truncatula)[4]中的PC 家族基因進(jìn)行了全基因組鑒定和分析。甘藍(lán)型油菜(Brassica napus)是一種由白菜和甘藍(lán)自然雜交形成的異源四倍體植物[30],作為集食用、飼用和觀賞價(jià)值于一身的常見(jiàn)農(nóng)作物,該物種中PC基因家族的功能尚不明確。本研究對(duì)甘藍(lán)型油菜PC基因(BnPC)家族進(jìn)行了全基因組范圍內(nèi)的鑒定、生物信息學(xué)分析和表達(dá)分析,旨在了解BnPC基因家族成員的組成、分類和表達(dá)特征,為揭示該家族成員的生物學(xué)功能提供線索。
本研究利用HMMER 軟件和PLCD 的HMM 在甘藍(lán)型油菜全基因組范圍內(nèi)對(duì)PC 家族成員進(jìn)行鑒定,并進(jìn)一步利用SMART 和UniProt 數(shù)據(jù)庫(kù)對(duì)這些潛在的PC 蛋白進(jìn)行PLCD 結(jié)構(gòu)域的確認(rèn)。在Pfam 33.1 數(shù)據(jù)庫(kù)(http://pfam. xfam. org/)中利用關(guān)鍵詞“phytocyanin”和“plastocyanin”進(jìn)行搜索,并利用PLCD 的隱馬爾可夫模型(Hidden-Markov Model,HMM)PF02298(Plastocyanin-like domain)和HMMER 軟件對(duì)甘藍(lán)型油菜數(shù)據(jù)庫(kù)(http://www. genoscope.cns.fr/brassicanapus/)全基因組蛋白序列進(jìn)行檢索(E-value ≤1e-5),獲得潛在的BnPC 家族成員信息。進(jìn)一步利用SMART(http://smart. embl-heidelberg. de)和UniProt(http://www. uniprot. org/)數(shù)據(jù)庫(kù)對(duì)獲得的假定PC 成員的PLCD 結(jié)構(gòu)域進(jìn)行鑒定,篩選確認(rèn)具有完整PLCD 結(jié)構(gòu)域的序列,即為BnPC家族成員。
從甘藍(lán)型油菜數(shù)據(jù)庫(kù)獲取各BnPC基因相應(yīng)的染色體位置等信息,利用TBtools(https://github.com/CJ-Chen/TBtools/releases)軟件[31]中的基因可視化工具繪制BnPC基因在甘藍(lán)型油菜19條染色體上的定位圖。采用MCSCANX(http://chibba.pgml.uga.edu/mcscan2/)分析甘藍(lán)型油菜(B. napus)、擬南芥(A.thaliana)、白菜(B. rapa)和甘藍(lán)(B. oleracea)之間的基因復(fù)制事件和共線性關(guān)系[32]。為了確認(rèn)BnPC之間的同源關(guān)系,以及BnPC與其它物種PC之間的同源關(guān)系,分別用TBtools 軟件中的AmazingSuper-Circos 和Dual Systeny Plotter 進(jìn)行可視化[31]。用KaKs 計(jì)算器2.0 計(jì)算各基因?qū)Φ耐x替換率(Ks)、非同義替換率(Ka)和Ka/Ks比值[33]。
首先利用Clustal W 軟件對(duì)BnPC 的PLCD 結(jié)構(gòu)域序列進(jìn)行多序列比對(duì)分析,生成軟件MEGA 可識(shí)別的比對(duì)文件(默認(rèn)參數(shù)設(shè)置)[34],然后利用MEGA5.0 軟件(https://www. megasoftware. net/),采用鄰接法(Neighbor-joining Method)基于上述多序列比對(duì)文件進(jìn)行系統(tǒng)發(fā)生分析[35]。Bootstrap 設(shè)置為1000,選用p-distance 模型,Gap 設(shè)置為Partial deletion,Site Coverage Cutoff設(shè)置為95%,生成無(wú)根樹(shù)。
將存在PLCD 結(jié)構(gòu)域的BnPC 蛋白序列文件保存為FASTA 格式,利用SignalP 5.0(http://www.cbs.dtu.dk/services/signalP/)、Big-PI Plant Predictor(http://mendel. imp. ac. at/gpi/plant_server. html)和NetNGlyc 1.0 Server 軟件(http://www. cbs. dtu. dk/services/NetNGlyc/)分別預(yù)測(cè)其N-端信號(hào)肽(NSP)、GAS 和N-糖基化位點(diǎn)(默認(rèn)參數(shù)設(shè)置)。依據(jù)前人研究擬南芥AtPC 蛋白序列中潛在阿拉伯半乳聚糖蛋白樣域(Arabinogalactan protein-like region,ALR)的原則[10]:以非鄰接的脯氨酸(Pro)殘基基序([Ala/Ser/Thr/Gly]-Pro-X(0, 10)-[Ala/Ser/Thr/Gly]-Pro)和([Ala/Ser/Thr/Gly]-Pro3-4)為阿拉伯半乳聚糖(AG)糖模體;Ser-Pro2-4為假定的伸展蛋白糖模體;手動(dòng)分析BnPC 蛋白序列中潛在的ALR。利用軟件Clustal X 1.81(http://www. clustal. org/clustal2/)對(duì)BnPC 氨基酸序列進(jìn)行多重序列比對(duì)分析(使用默認(rèn)參數(shù))[34],手動(dòng)標(biāo)記結(jié)構(gòu)域特征位點(diǎn)。
從甘藍(lán)型油菜數(shù)據(jù)庫(kù)獲得油菜BnPC基因的基因組序列及CDS 序列,利用基因結(jié)構(gòu)預(yù)測(cè)的可視化工具TBtools 繪制BnPC的基因結(jié)構(gòu)圖[31]。利用在線軟件MEME Suite5.1.0(http://meme. nbcr. net/meme/cgi-bin/meme. cgi)分析BnPC 蛋白的氨基酸序列,預(yù)測(cè)其中的保守模體(motif),參數(shù)設(shè)定為軟件默認(rèn)值[36]。
從甘藍(lán)型油菜數(shù)據(jù)庫(kù)獲得BnPC基因的起始密碼子上游區(qū)域2000 bp 序列,利用在線網(wǎng)站Plant-Care(http://bioinformatics. psb. ugent. be/webtools/plantcare/html/)對(duì)上述區(qū)域進(jìn)行順式元件分析[37],利用TBtools軟件對(duì)該區(qū)域的順式元件進(jìn)行可視化[31]。
根據(jù)本實(shí)驗(yàn)室前期創(chuàng)建的甘藍(lán)型油菜不同發(fā)育階段各組織器官中以及不同逆境脅迫條件下的轉(zhuǎn)錄組數(shù)據(jù)(BioProject ID PRJNA687395),分析各BnPC基因的時(shí)空表達(dá)模式以及在不同逆境處理?xiàng)l件下的表達(dá)變化。對(duì)于時(shí)空表達(dá)模式,分別對(duì)各BnPC基因在甘藍(lán)型油菜子葉、根、莖、幼葉、莖頂端分生組織(shoot apical meristem,SAM)、成熟葉、花苞、子房以及受精后14 d、24 d、34 d、50 d 的種子和角果皮中的表達(dá)水平進(jìn)行分析。對(duì)于逆境表達(dá)模式分析,分別對(duì)各BnPC基因在干旱、鹽、冷和高溫脅迫條件下的表達(dá)變化情況進(jìn)行分析。將甘藍(lán)型油菜揚(yáng)油9 號(hào)種子在濕潤(rùn)濾紙上發(fā)芽后,選取生長(zhǎng)健康且長(zhǎng)勢(shì)一致的幼苗移栽至光照培養(yǎng)箱(22℃,16 h 光照/8 h 黑暗)進(jìn)行水培,待幼苗生長(zhǎng)至四葉期開(kāi)始脅迫處理。本研究采用15% PEG6000 模擬干旱脅迫(drought),利用150 mmol/L NaCl 處理進(jìn)行鹽脅迫(salt),分別在4℃和42℃培養(yǎng)箱中進(jìn)行冷脅迫(cold)和高溫脅迫(heat),以種植在正常條件下培養(yǎng)的植株作為對(duì)照。分別在干旱和鹽處理后24 h,冷處理后6 h,高溫處理后1 h采集處理材料的葉片,并在對(duì)應(yīng)的時(shí)間點(diǎn)同時(shí)采集對(duì)照植株的葉片,立即用液氮冷凍,在-80℃冰箱中保存至提取RNA。使用華中農(nóng)業(yè)大學(xué)(武漢)Illumina 測(cè)序平臺(tái)(HiSeq 3000)進(jìn)行RNA-Seq測(cè)序。
結(jié)果表明,甘藍(lán)型油菜中有183 個(gè)蛋白具有PLCD結(jié)構(gòu)域,其中10個(gè)蛋白由于保守PLCD結(jié)構(gòu)域中關(guān)鍵Cys 殘基缺失而被排除,因此,在甘藍(lán)型油菜中共鑒定得到173 個(gè)PC 蛋白(附表1,見(jiàn)首頁(yè)OSID二維碼),遠(yuǎn)多于前人在擬南芥中的發(fā)現(xiàn)PC 成員的數(shù)量(38個(gè))[28]。
對(duì)BnPC 家族成員的PLCD 結(jié)構(gòu)域進(jìn)行多重序列比對(duì)分析,結(jié)果表明:140 個(gè)成員的PLCD 結(jié)構(gòu)域中含有完整的2 個(gè)Cys 殘基,其余8 個(gè)BnPC 蛋白只含有一個(gè)Cys殘基,Cys在PLCD結(jié)構(gòu)域中高度保守;49個(gè)BnPC 蛋白中含有4個(gè)完整的銅結(jié)合配體(His、Cys、His、Met/Gln),其中28 個(gè)成員的銅配體為His、Cys、His、Met 類型,21 個(gè)成員的銅配體為His、Cys、His、Gln 類型(附表1,見(jiàn)首頁(yè)OSID 二維碼)。根據(jù)銅結(jié)合位點(diǎn)以及糖基化位點(diǎn)的差異,可以將BnPC蛋白劃分為4 個(gè)亞家族:其中25 個(gè)成員歸屬于類花青苷蛋白(BnUCL),21 個(gè)成員歸屬于類漆樹(shù)藍(lán)蛋白(BnSCL),3 個(gè)成員歸屬于類質(zhì)體藍(lán)素蛋白(Bn-PLCL);其余99 個(gè)不含銅結(jié)合位點(diǎn)的BnPC 歸屬于類早期結(jié)瘤素蛋白(BnENODL)亞家族。與以往的研究結(jié)果不同,甘藍(lán)型油菜中有5 個(gè)SCL(SCL5、SCL6、SCL13、SCL15 和SCL16)不具有N-糖基化位點(diǎn),這可能是由于進(jìn)化過(guò)程中蛋白序列的趨異造成的。此外,多重序列比對(duì)的結(jié)果顯示,在BnENODL亞家族成員的序列中,與其它亞家族成員銅結(jié)合位點(diǎn)相對(duì)應(yīng)的位置上有一些氨基酸取代His、Cys、His、Met/Gln從而形成了其它形式的保守模體,其功能可能與結(jié)合銅有關(guān)。
對(duì)BnPC基因在甘藍(lán)型油菜19條染色體上的分布進(jìn)行分析。如圖1 所示,在173 個(gè)BnPC基因中,有25個(gè)BnPC基因由于甘藍(lán)型油菜基因組組裝信息不全而未被定位到特定染色體上,其余148 個(gè)BnPC基因在19條染色體上分布不均。共有67個(gè)和81個(gè)BnPC基因分別位于A 和C 亞基因組上,每條染色體上的BnPC基因數(shù)目從4到15不等,C07染色體上包含的BnPC基因最多(15 個(gè)),其次是C03、A03 和C04 染色體,分別有13、12 和10 個(gè)BnPC。A08 和A07 染色體上的BnPC基因數(shù)目最少(分別有4 個(gè)),各條染色體上BnPC基因的數(shù)目與染色體長(zhǎng)度不存在明顯相關(guān)關(guān)系。
圖1 BnPC基因在甘藍(lán)型油菜染色體上的分布Fig.1 Distribution of BnPC genes on Brassica napus chromosomes
基因復(fù)制是物種進(jìn)化過(guò)程中產(chǎn)生新基因的一種重要途徑,主要是在多個(gè)基因非常接近的情況下通過(guò)串聯(lián)復(fù)制,或者通過(guò)片段復(fù)制來(lái)實(shí)現(xiàn)[38]。為了研究BnPC 家族基因在進(jìn)化過(guò)程中的擴(kuò)增情況,本研究對(duì)BnPC 家族中的基因復(fù)制事件進(jìn)行了分析。結(jié)果表明,137 個(gè)BnPC基因是復(fù)制事件的產(chǎn)物(附表2,見(jiàn)首頁(yè)OSID二維碼),其中123個(gè)BnPC來(lái)自全基因組復(fù)制(whole genome duplication,WGD)或片段復(fù)制(segmental duplication),另外14 個(gè)BnPC基因來(lái)自分散復(fù)制(dispersed duplication)。利用MCScanX 軟件在BnPC 家族中共鑒定出120 對(duì)基因具有共線性。為了解甘藍(lán)型油菜和擬南芥以及蕓薹屬植物BnPC基因家族間的進(jìn)化關(guān)系,本研究進(jìn)一步對(duì)甘藍(lán)型油菜與自身、擬南芥以及兩種二倍體祖先(白菜和甘藍(lán))基因之間的共線性關(guān)系進(jìn)行了分析。如圖2 和圖3 所示,甘藍(lán)型油菜與擬南芥、白菜、甘藍(lán)中存在大量的同源PC基因。在148 個(gè)BnPC中,有118 個(gè)(79.73%)與其它物種的PC具有共線性關(guān)系,其中92 個(gè)BnPC基因(87 個(gè)來(lái)源于WGD 或片段復(fù)制,占94.57%)與擬南芥PC基因具有共線性關(guān)系,118 個(gè)BnPC(112 個(gè)來(lái)源于WGD 或片段復(fù)制,占94.92%)與白菜PC基因具有共線性關(guān)系,96 個(gè)Bn-PC(86個(gè)來(lái)源于WGD 或片段復(fù)制,占89.58%)與甘藍(lán)PC基因具有共線性關(guān)系。上述結(jié)果表明,基因復(fù)制在很大程度上促進(jìn)了甘藍(lán)型油菜基因組中PC基因家族的擴(kuò)張,其中WGD 或片段復(fù)制事件起主要的驅(qū)動(dòng)作用。
圖2 甘藍(lán)型油菜基因組內(nèi)PC基因的共線性分析Fig.2 Syntenic relationship of PC genes in B.napus genome
圖3 甘藍(lán)型油菜與擬南芥、白菜和甘藍(lán)PC基因的共線性關(guān)系Fig.3 Syntenic relationship of PC genes in B.napus and three Cruciferae plants(Arabidopsis,B.rapa and B.oleracea)
為了評(píng)估在甘藍(lán)型油菜進(jìn)化過(guò)程中復(fù)制BnPC基因受到的選擇壓力,我們計(jì)算了甘藍(lán)型油菜中的同源基因?qū)Φ腒a、Ks和Ka/Ks比值。結(jié)果表明,大部分BnPC基因?qū)Φ腒a/Ks<0.5,表明BnPC基因家族在進(jìn)化過(guò)程中經(jīng)歷了強(qiáng)烈的純化選擇(附表3,見(jiàn)首頁(yè)OSID二維碼)。
為了闡明BnPC 蛋白之間的系統(tǒng)發(fā)生關(guān)系,我們利用PLCD 保守結(jié)構(gòu)域序列對(duì)BnPC 蛋白進(jìn)行無(wú)根樹(shù)的構(gòu)建。如圖4 所示,BnPC 蛋白可分為6 個(gè)進(jìn)化枝(Clade A-F)。與其它物種中的情況類似,Bn-PLCL 亞家族的成員最少,在甘藍(lán)型油菜中僅有3 個(gè)成員,3個(gè)PLCL成員在進(jìn)化關(guān)系上均與BnUCL亞家族比較接近,推測(cè)它們可能是由UCL 亞家族成員直接分化而來(lái)。有趣的是,與BnPLCL1、BnPLCL2 進(jìn)化關(guān)系上相近的BnUCL23 卻與UCL 亞家族其它成員相距較遠(yuǎn),推測(cè)BnUCL23 可能是由BnENODL 亞家族分化而來(lái),隨后在進(jìn)化過(guò)程中進(jìn)一步分化為BnPLCL1 和BnPLCL2。成員數(shù)量最多的BnENODL亞家族,主要分布于三個(gè)進(jìn)化枝,其中50 個(gè)BnENODL 占據(jù)了全部A 進(jìn)化枝,C 進(jìn)化枝中包含了32 個(gè)BnENODL,而剩余的BnENODL 幾乎全部分布于F進(jìn)化枝中,處于同一進(jìn)化枝中的BnENODL 成員序列差異較小,可能具有類似的功能。除了BnUCL23 位于F 進(jìn)化枝中,BnUCL 亞家族其它成員全部分布于B 進(jìn)化枝中。BnSCL 亞家族成員中有3 個(gè)成員位于C 進(jìn)化枝中,其余成員則主要存在于D 和E進(jìn)化枝中,BnSCL成員分布相對(duì)分散,暗示著該亞家族成員在功能上存在分化。
對(duì)BnPC 蛋白的其它三個(gè)功能域(SP、ALR、GAS)進(jìn)行分析(附表1,見(jiàn)首頁(yè)OSID 二維碼),根據(jù)四種結(jié)構(gòu)域在BnPC 蛋白中的組成,BnPC 蛋白可分為10 種類型(I~X)(圖5)。除VII、VIII、IX 和X 型成員外,共有133個(gè)BnPC 蛋白具有分泌蛋白所需要的N-端信號(hào)肽。V 型、VI 型和X 型成員具有兩個(gè)PLCD 結(jié)構(gòu)域,PLCD 結(jié)構(gòu)域的重復(fù)可能來(lái)源于甘藍(lán)型油菜進(jìn)化過(guò)程中PLCD 結(jié)構(gòu)域區(qū)段的復(fù)制。此外,屬于II、IV、VIX 型的77 個(gè)BnPC 具有GAS,暗示著這些蛋白質(zhì)可能定位于細(xì)胞膜上。除了I、II、VI和VII 型的BnPC 成員,其余95 個(gè)BnPC 具有一個(gè)ALR 域,在這些成員中,同時(shí)具有N-端信號(hào)肽的蛋白可歸屬于AGP 超家族。蛋白質(zhì)結(jié)構(gòu)域組成類似的PC 成員傾向于在系統(tǒng)發(fā)生樹(shù)上聚集在一起。例如,I 型BnPC 主要聚集在E 進(jìn)化枝中,IV 型BnPC 主要聚集在A進(jìn)化枝中(圖4)。
圖4 甘藍(lán)型油菜PC家族系統(tǒng)發(fā)生分析Fig.4 Phylogenetic analysis of the PC family in B.napus
圖5 基于結(jié)構(gòu)域組成的BnPC分類Fig.5 Classification of BnPC proteins based on domain composition
外顯子-內(nèi)含子結(jié)構(gòu)的差異對(duì)于基因功能起重要作用,特別是對(duì)于重復(fù)基因[39]。本研究對(duì)148 個(gè)BnPC家族基因成員編碼區(qū)序列進(jìn)行結(jié)構(gòu)分析的結(jié)果表明,BnPC基因的外顯子數(shù)目在1 個(gè)到6 個(gè)之間,其中100個(gè)BnPC基因包含2個(gè)外顯子,20個(gè)Bn-PC基因包含3 個(gè)外顯子,9 個(gè)BnPC基因包含3 個(gè)外顯子,18 個(gè)BnPC基因(BnENODL9/12/22/27/39/61/65/71/83/98、BnSCL4/5/6/7/8/12/13/15)只有1 個(gè)外顯子,沒(méi)有內(nèi)含子,僅BnENODL42基因含有多達(dá)6 個(gè)外顯子(圖6)。此外,同一亞家族的同一系統(tǒng)發(fā)育類群的基因的外顯子-內(nèi)含子結(jié)構(gòu)更相似,例如Clade A 中大多數(shù)成員有兩個(gè)外顯子,Clade D 中大多數(shù)基因沒(méi)有內(nèi)含子。屬于相同亞家族的一些成員外顯子長(zhǎng)度接近,而內(nèi)含子長(zhǎng)度差異較大(例如:BnENODL30 和BnENODL87、BnUCL13 和BnUCL22、BnPLCL1和BnPLCL2),這可能與重復(fù)基因的功能分化有關(guān)。
利用MEME 分析BnPC 蛋白的模體組成,共鑒定出10 個(gè)保守模體,其長(zhǎng)度在14~50 個(gè)氨基酸之間(圖6,附圖1,見(jiàn)首頁(yè)OSID二維碼),其中Motif 1/2/3/4/5/7/8 屬于PLCD 保守結(jié)構(gòu)域的一部分,Motif 6 出現(xiàn)在具有兩個(gè)PLCD 保守結(jié)構(gòu)域的蛋白中,位于兩個(gè)PLCD 結(jié)構(gòu)域之間,Motif 9/10 則是新發(fā)現(xiàn)的保守結(jié)構(gòu)域。結(jié)果表明,同一亞類中BnPC 的結(jié)構(gòu)相似。除了BnENODL58、BnENODL91 和BnSCL16 外,其他所有BnPC 都包含Motif 1,Motif 2/3/4/5 也存在于大部分BnPC 成員中,Motif 6/7/8/9 在Clade C 的成員中較為保守,部分PC成員的N端和C端包含Motif 10。
圖6 BnPC家族成員的模體組成和基因結(jié)構(gòu)分析Fig.6 Motif analysis and gene structure of the BnPC family members
順式作用元件在基因表達(dá)調(diào)控中起重要作用,基因啟動(dòng)子區(qū)域包含的不同類型的順式調(diào)控元件可能介導(dǎo)基因在不同條件下表達(dá)。本研究利用PlantCARE 軟件對(duì)148 個(gè)BnPC基因的啟動(dòng)子區(qū)域的順式元件進(jìn)行了分析,結(jié)果發(fā)現(xiàn)了10種順式作用元件,主要可分為以下4 類:與植物生長(zhǎng)發(fā)育、非生物脅迫應(yīng)答、激素應(yīng)答相關(guān)的元件,以及真核生物中的基本啟動(dòng)子元件(如CAAT 盒和TATA 盒)。與生長(zhǎng)發(fā)育相關(guān)的啟動(dòng)子元件主要包括參與胚乳表達(dá)的GCN4 元件和AACA 元件;與分生組織表達(dá)相關(guān)的CAT元件;以及大量的光響應(yīng)元件,如Box4、GBox 和TCT 元件(附表4,見(jiàn)首頁(yè)OSID 二維碼)。在BnPC啟動(dòng)子中,與光反應(yīng)有關(guān)的元件是最常見(jiàn)的元件,此外,本研究還鑒定到一些與赤霉素(gibberellin acid,GA)、生長(zhǎng)素(auxin)、脫落酸(abscisic acid,ABA)、MeJA 和水楊酸(salicylic acid,SA)應(yīng)答相關(guān)的順式元件,其中與ABA 應(yīng)答相關(guān)的元件最為豐富,其次是與MeJA 反應(yīng)相關(guān)的元件(表1,附表4,見(jiàn)首頁(yè)OSID 二維碼)。此外,在BnPC的啟動(dòng)子區(qū)域還發(fā)現(xiàn)了許多與脅迫答應(yīng)相關(guān)的元件,如低溫應(yīng)答相關(guān)的低溫應(yīng)答元件(low-temperature responsiveness,LTR)、干旱誘導(dǎo)的MYB 結(jié)合位點(diǎn)(MBS)、與創(chuàng)傷反應(yīng)相關(guān)的創(chuàng)傷應(yīng)答元件(wound-responsive element)和厭氧誘導(dǎo)所必需的厭氧調(diào)節(jié)元件(anaerobic induction)。這些結(jié)果表明BnPC可能在調(diào)節(jié)植物生長(zhǎng)發(fā)育、對(duì)非生物脅迫的應(yīng)答和激素應(yīng)答中發(fā)揮作用。大多數(shù)BnPC基因的啟動(dòng)子區(qū)具有不同類型順式元件,暗示這些BnPC基因可能參與多種生理過(guò)程和調(diào)控途徑。
表1 BnPC基因啟動(dòng)子順式元件分析Table 1 Cis-acting elements of the promoter regions of BnPC genes
基于甘藍(lán)型油菜不同發(fā)育階段各組織器官的轉(zhuǎn)錄組測(cè)序數(shù)據(jù)對(duì)BnPC基因的時(shí)空表達(dá)模式進(jìn)行分析(圖7A,各基因FPKM 值詳見(jiàn)附表5,首頁(yè)OSID二維碼),結(jié)果顯示,42 個(gè)BnPC基因在所有檢測(cè)的組織器官中均未表達(dá)或者表達(dá)水平極低(FPKM<0.5,圖7 中未顯示)。根據(jù)時(shí)空表達(dá)特點(diǎn),BnPC基因大致可以分為四種類型。第一種類型在所有組織器官中表達(dá)水平均較低或未表達(dá)。第二種類型在幾乎所有組織器官中均有表達(dá),且在各組織器官中的表達(dá)水平差別不明顯,如BnENODL32、BnENODL38、BnENODL42和BnENODL93。第三種類型在大多數(shù)組織中表達(dá),但在特定組織中高表達(dá),如BnUCL9、BnUCL13和BnUCL22。第四種類型基因的表達(dá)表現(xiàn)出很強(qiáng)的組織器官特異性:例如BnUCL6、BnUCL17和BnUCL20只在根(Root)中表達(dá),而B(niǎo)nENOD31、BnENODL48、BnENODL55、BnENODL97和BnUCL23只在受精后24 d 的種子(Seed-24 DAP)和角果皮(Silique wall-24 DAP)中表達(dá)。此外,幾乎所有的BnUCL基因均在根中具有高水平的表達(dá)(除了BnUCL23),暗示著B(niǎo)nUCL亞家族成員可能在根的發(fā)育中起著重要作用,而B(niǎo)nPLCL3與BnUCL亞家族成員表現(xiàn)出非常相似的表達(dá)模式,這與上述系統(tǒng)發(fā)生分析的結(jié)果相符,BnPLCL3是由BnUCL亞家族成員進(jìn)化而來(lái),BnPLCL3與BnUCL亞家族成員在功能上可能也極為相似;而B(niǎo)nPC家族中其余的2 個(gè)BnPLCL基因BnPCLC1和BnPCLC2在各個(gè)組織中均有一定程度的表達(dá)。BnENODL亞家族的成員在甘藍(lán)型油菜不同組織器官中的表達(dá)呈現(xiàn)一定程度的分化,9 個(gè)成員(例如BnENODL21/70/37/18/63/7/52/6/51)在受精后14 d 的種子(Seed-14 DAP)中特異表達(dá),9 個(gè)成員(例如BnENODL48/97/31/89/11/55/16/30/86)在受精后24 d 的種子(Seed-14 DAP)中表達(dá)水平較高,8 個(gè)成員(例如BnENODL28/73/59/3/5/14/20/69)在花苞(bud)中特異表達(dá),說(shuō)明BnENODL亞家族中的這些成員可能參與了甘藍(lán)型油菜花和幼嫩種子的發(fā)育過(guò)程。
為探究BnPC基因?qū)Ω鞣N非生物逆境脅迫的應(yīng)答模式,本研究利用轉(zhuǎn)錄組數(shù)據(jù)分析了在干旱、鹽、冷和高溫處理?xiàng)l件下各BnPC基因的表達(dá)水平(圖7B,附表6,見(jiàn)首頁(yè)OSID 二維碼)。結(jié)果表明,95 個(gè)BnPC基因的表達(dá)水平在至少一種逆境處理前后發(fā)生變化,53 個(gè)基因在脅迫處理前后的表達(dá)水平?jīng)]有明顯變化。與組織器官表達(dá)數(shù)據(jù)對(duì)比發(fā)現(xiàn),前文所述的在各組織器官中未表達(dá)和弱表達(dá)的42 個(gè)BnPC基因中,除了4 個(gè)基因(BnENODL9、BnENODL62、BnENODL71和BnENODL91)在逆境處理后表達(dá)明顯上調(diào),其余38 個(gè)基因仍檢測(cè)不到表達(dá),推測(cè)這38個(gè)基因可能在甘藍(lán)型油菜的進(jìn)化過(guò)程中因?yàn)楣δ軉适Ф槐磉_(dá),或由于表達(dá)部位非常特異而在本文使用的數(shù)據(jù)中沒(méi)有檢測(cè)到表達(dá)量。在95 個(gè)逆境處理?xiàng)l件下表達(dá)水平發(fā)生變化的基因中,在干旱處理?xiàng)l件下,有38個(gè)基因上調(diào)表達(dá),48個(gè)基因下調(diào)表達(dá);在鹽處理?xiàng)l件下,24 個(gè)基因表達(dá)量上升,59 個(gè)基因表達(dá)量下降;在冷處理?xiàng)l件下,25 個(gè)基因上調(diào)表達(dá),58 個(gè)基因下調(diào)表達(dá);在高溫處理?xiàng)l件下,40 個(gè)基因表達(dá)量上升,44 個(gè)基因表達(dá)量下降。這些結(jié)果表明,相當(dāng)一部分BnPC基因?qū)Ψ巧锩{迫表現(xiàn)出明顯的響應(yīng),暗示著B(niǎo)nPC可能也廣泛參與甘藍(lán)型油菜對(duì)不利環(huán)境條件的適應(yīng)。
圖7 BnPC基因的表達(dá)特征Fig.7 Expression profile of BnPC genes
PC基因作為古老的藍(lán)銅蛋白基因,可能與銅原子結(jié)合,在各種生物系統(tǒng)中起電子轉(zhuǎn)運(yùn)的作用,如銅的轉(zhuǎn)運(yùn)和植物光合作用,因此PC基因家族成員可能受到光誘導(dǎo)廣泛參與植物的生長(zhǎng)發(fā)育[28]。在BnPC基因啟動(dòng)子中,我們也發(fā)現(xiàn)了大量的光反應(yīng)元件,表明PC基因可能對(duì)甘藍(lán)型油菜的生長(zhǎng)發(fā)育有關(guān)鍵性作用。目前,植物中對(duì)PC基因家族的相關(guān)研究比較少,在油料作物甘藍(lán)型油菜中PC基因家族的綜合分析尚未見(jiàn)報(bào)道。本研究在甘藍(lán)型油菜中鑒定到173 個(gè)BnPC基因。根據(jù)銅配體殘基的特性、蛋白結(jié)構(gòu)組分的差異,將這些BnPC基因分為BnENOLD、BnUCL、BnSCL和BnPLCL4 個(gè)亞家族,其中BnENODL亞家族基因數(shù)量最多,BnUCL亞家族、BnSCL亞家族其次,BnPLCL亞家族基因數(shù)量最少,與之前在擬南芥[10]和水稻[9]中報(bào)道的結(jié)果類似。Bn-PC基因結(jié)構(gòu)的變化可能是由于在長(zhǎng)期進(jìn)化過(guò)程中內(nèi)含子/外顯子的增加或減少所致。基于BnPC 保守模體分析的結(jié)果,推測(cè)BnPC基因家族的功能分化可能是由類特異性和亞類特異性模體引起的。此外,在BnPC 的每個(gè)亞類中,相似的模體結(jié)構(gòu)、外顯子-內(nèi)含子結(jié)構(gòu)組成模式和氨基酸組成可能預(yù)示著進(jìn)化過(guò)程中的基因復(fù)制事件。
甘藍(lán)型油菜是一種由白菜和甘藍(lán)自然雜交形成的異源四倍體植物[30]?;驈?fù)制有兩種主要機(jī)制,WGD/片段復(fù)制和串聯(lián)復(fù)制[40]。WGD/片段復(fù)制在植物基因組中很常見(jiàn),許多植物在進(jìn)化過(guò)程中經(jīng)歷了多倍化事件,因此在它們的基因組中保留了許多重復(fù)的染色體片段[41,42]。前人在擬南芥[10]、水稻(O.sativa)[9]、大豆(Glycine max)[4]、大白菜[28]、玉米[23]、蝴蝶蘭[29]、蒺藜苜蓿[4]和鐵皮石斛[43]中分別鑒定到38、62、90、84、60、30、82 和38 個(gè)PC基因,甘藍(lán)型油菜中PC家族基因的數(shù)量(173 個(gè))遠(yuǎn)遠(yuǎn)多于上述植物物種中PC基因的數(shù)量,說(shuō)明在甘藍(lán)型油菜進(jìn)化過(guò)程中,基因組復(fù)制對(duì)BnPC基因的多樣性有很大貢獻(xiàn)。我們的結(jié)果表明,137 個(gè)BnPC基因是基因復(fù)制的結(jié)果,其中123 個(gè)來(lái)源于WGD 或片段復(fù)制,其余是分散復(fù)制的結(jié)果。串聯(lián)復(fù)制是另一種類型的基因復(fù)制,其特征是一個(gè)基因家族的多個(gè)成員存在于同一個(gè)或相鄰的基因間區(qū)域[40]。本研究發(fā)現(xiàn),4 個(gè)BnPC基因:BnSCL8、BnENODL81、BnENODL82和BnENODL83來(lái)源于這種復(fù)制方式。為了比較不同物種中PC基因家族擴(kuò)張機(jī)制的異同,我們也分析了其他物種中PC基因家族成員的復(fù)制類型。水稻中20 個(gè)OsPC來(lái)源于片段復(fù)制,18個(gè)來(lái)源于串聯(lián)復(fù)制[9];玉米中14 個(gè)ZmPC來(lái)源于片段復(fù)制,8 個(gè)來(lái)源于串聯(lián)復(fù)制[23];而在蒺藜苜蓿中,40 個(gè)MtPC來(lái)源于串聯(lián)復(fù)制,其余32 個(gè)來(lái)源于其他復(fù)制方式[4]。在這些物種中,片段復(fù)制和串聯(lián)復(fù)制在PC基因家族擴(kuò)張中均起著重要作用。有趣的是,擬南芥中有12 個(gè)AtPC來(lái)源于片段復(fù)制,僅有2個(gè)PC來(lái)源于串聯(lián)復(fù)制[10];白菜中63 個(gè)PC來(lái)源于片段復(fù)制,沒(méi)有PC基因來(lái)源于串聯(lián)復(fù)制[28]。與白菜和擬南芥中的情況類似,BnPC基因家族中僅有4個(gè)基因來(lái)源于串聯(lián)復(fù)制,這表明WGD/片段復(fù)制是BnPC基因家族擴(kuò)張的主要?jiǎng)恿?,該現(xiàn)象是否在蕓薹屬甚至十字花科植物中普遍存在,還有待進(jìn)一步研究。在人類基因組中,諸如轉(zhuǎn)座子插入和拷貝數(shù)變異等分散復(fù)制是非常常見(jiàn)的[44],但在植物中鮮有報(bào)道,已報(bào)道的植物物種中尚未發(fā)現(xiàn)有PC基因來(lái)源于這種復(fù)制方式。本研究發(fā)現(xiàn),有14 個(gè)BnPC基因來(lái)源于分散復(fù)制。在異源多倍體植物中,基因組的擴(kuò)張通常伴隨著轉(zhuǎn)座子因子的插入[45,46]。蕓薹屬植物的轉(zhuǎn)座子也很豐富[46,47],然而,這些轉(zhuǎn)座子是否是PC基因家族擴(kuò)張的原因之一還需要進(jìn)一步的研究。
PC 蛋白成員主要包含下列4 個(gè)結(jié)構(gòu)域,結(jié)構(gòu)域I 包含內(nèi)質(zhì)網(wǎng)靶向信號(hào)肽,介導(dǎo)PC 進(jìn)入分泌途徑。結(jié)構(gòu)域II 是一個(gè)保守的PLCD 結(jié)構(gòu)域,負(fù)責(zé)使PC 與銅氧化物結(jié)合,該結(jié)構(gòu)域包含天冬酰胺-X-蘇氨酸/絲氨酸(Asn-X-Thr/Ser)序列,提供潛在的N-糖基化位點(diǎn),并進(jìn)一步通過(guò)內(nèi)質(zhì)網(wǎng)分泌途徑促進(jìn)蛋白分揀,所有的PC 都至少有一個(gè)PLCD 域;結(jié)構(gòu)域Ⅲ是一個(gè)類阿拉伯半乳聚糖蛋白域(arabinogalactan protein-like region,ALR)[4]。含有ALR 結(jié)構(gòu)域的PC 被認(rèn)為是形成細(xì)胞壁的氧化還原活性成分,并參與防御反應(yīng)[5]。結(jié)構(gòu)域IV 具有GAS的特征,能夠?qū)C錨定在細(xì)胞膜上[5]。根據(jù)結(jié)構(gòu)域組成,我們將BnPC 蛋白分成10 類(圖5),而在蒺藜苜蓿[4]和大白菜[28]中,分為9類。在甘藍(lán)型油菜中,我們比蒺藜苜蓿[4]多鑒定到Type VI 和Type X 成員,但并未鑒定到SPPLCD-PLCD-ALR-GAS 結(jié)構(gòu)域形式組成的成員;與大白菜相比,我們多鑒定到Type VIII、Type IX 和Type X,但并未鑒定到PLCD-PLCD 和PLCD-GAS結(jié)構(gòu)域組成形式的成員。而甘藍(lán)型油菜由白菜和甘藍(lán)自然雜交形成[30],我們推測(cè)在甘藍(lán)型油菜起源過(guò)程中,PLCD-PLCD 和PLCD-GAS 結(jié)構(gòu)域組成的成員可能發(fā)生了丟失,而Type VIII、Type IX 和Type X 的成員可能在進(jìn)化過(guò)程中由Type III、Type IV 和Type V成員丟失結(jié)構(gòu)域I進(jìn)而演化而來(lái)。
BnPLCL是成員最少的亞家族,在甘藍(lán)型油菜中僅有3 個(gè)成員,其中BnPLCL3僅在根中微弱表達(dá)而B(niǎo)nPLCL1和BnPLCL2在所有組織中均表達(dá),推測(cè)這兩個(gè)基因?qū)χ仓甑恼0l(fā)育可能極為重要。幾乎所有的BnUCL基因均在根中具有較高水平的表達(dá)量(除了BnUCL23),特別是BnUCL3和BnUCL16在其它組織中微弱表達(dá)或者不表達(dá),但在根中的表達(dá)量非常高,暗示BnUCL亞家族成員可能在根的發(fā)育中起著重要作用;除此之外,BnUCL3/10/13/21/22在14 d、24 d和34 d角果皮中均高表達(dá),而在其它組織中幾乎不表達(dá),說(shuō)明這5 個(gè)基因可能在角果發(fā)育中發(fā)揮重要作用。SCL基因表達(dá)水平普遍較低,主要在根和莖中表達(dá),有趣的是,BnSCL2基因是BnPC基因中在花苞中表達(dá)水平最高的基因,遠(yuǎn)超其它基因,且這個(gè)基因的表達(dá)受非生物脅迫影響不明顯,推測(cè)這個(gè)基因在花苞中的功能可能非常重要且穩(wěn)定。前人的研究結(jié)果表明BnENODL基因在根中高表達(dá),參與了豆科植物的結(jié)瘤[4,14,15],與前人研究結(jié)果相似,我們發(fā)現(xiàn)大部分BnENODL基因也均在根中高表達(dá),表明BnENODL基因在根中的功能可能十分關(guān)鍵。某些BnENODL基因在部分組織器官中特異性高表達(dá),比如BnENODL21/37和BnENODL31/48/55/97分別在受精后14 d 和24 d 的種子中高表達(dá),這些基因可能在種子發(fā)育過(guò)程中發(fā)揮重要功能。
本研究結(jié)果對(duì)甘藍(lán)型油菜BnPC基因家族在全基因組水平上進(jìn)行了系統(tǒng)分析,鑒定出173 個(gè)BnPC成員,并對(duì)它們的染色體分布情況、序列特征、系統(tǒng)發(fā)生關(guān)系、啟動(dòng)子順式元件組成以及時(shí)空表達(dá)模式和逆境響應(yīng)情況進(jìn)行了分析,為深入研究甘藍(lán)型油菜BnPC 蛋白功能和挖掘該家族中有利于甘藍(lán)型油菜遺傳改良的基因資源提供了一定的理論依據(jù)。