董新玉,鄧 浪,張亞春,陳國發(fā),李樹鋒
(1.大理州農(nóng)業(yè)科學(xué)推廣研究院經(jīng)濟(jì)作物研究所,云南 大理 671000;2.云南農(nóng)業(yè)職業(yè)技術(shù)學(xué)院,昆明 650031)
【研究意義】大蒜(AlliumsativumL.)是百合科蔥屬植物,是一種重要的的蔬菜、香料和藥用作物,2018年全世界大蒜種植面積高達(dá)154.7萬hm2,產(chǎn)量達(dá)2849.4萬t[1]。近年來,隨著分子生物學(xué)技術(shù)的快速發(fā)展,越來越多的學(xué)者從傳統(tǒng)的栽培育種轉(zhuǎn)向從細(xì)胞分子層面研究大蒜的生長發(fā)育和遺傳進(jìn)化,并在大蒜遺傳多樣性分析、基因組學(xué)、轉(zhuǎn)錄組學(xué)和基因表達(dá)與功能驗證等方面獲得較多研究成果[2]。目前,大蒜全基因組數(shù)據(jù)已經(jīng)公布[3],為加快研究大蒜基因功能和進(jìn)化提供了更為有效的途徑。【前人研究進(jìn)展】WOX(WUSCHEL-related homeobox)轉(zhuǎn)錄因子屬于HB(Homeobox)轉(zhuǎn)錄因子超家族,是植物中廣泛存在的一類轉(zhuǎn)錄因子,也是植物所特有的一類轉(zhuǎn)錄因子[4]。WOX家族成員在擬南芥、棉花、水稻和番茄等植物中已得到鑒定[4]。其中,擬南芥WOX基因家族包含15個成員[5],棉花中有37個成員,水稻和番茄中分別有12和10個成員[6-8]。Graaff等對不同物種的WOX家族蛋白進(jìn)行進(jìn)化分析發(fā)現(xiàn),WOX家族蛋白被分為遠(yuǎn)古支(Ancient clade)、中間支(Intermediate clade)和WUS支(WUS clade)[5]。功能研究發(fā)現(xiàn),WOX家族蛋白在植物干細(xì)胞維持、器官發(fā)育、激素信號轉(zhuǎn)導(dǎo)、初生和次生物質(zhì)代謝及抗逆響應(yīng)等過程中發(fā)揮著重要的調(diào)節(jié)作用[5,9-11]。有研究指出,密碼子具有簡并性,在遺傳信息的傳遞過程中發(fā)揮著重要的作用[12]。在長期進(jìn)化過程中,不同物種會形成獨(dú)特的適應(yīng)自身基因組環(huán)境的密碼子使用偏性(Codon usage bias,CUB)[13]。密碼子使用偏性會隨著基因組中大部分基因或者特定基因的變化而改變[14]。研究表明,密碼子偏好性分析能為預(yù)測基因功能、基因的表達(dá)水平、選擇基因異源表達(dá)受體系統(tǒng)和優(yōu)化密碼子以提高異源表達(dá)效率等提供參考[13]?!颈狙芯壳腥朦c】本研究利用生物信息學(xué)分析方法,對大蒜WOX家族蛋白進(jìn)化關(guān)系、密碼子使用偏性及表達(dá)進(jìn)行分析?!緮M解決關(guān)鍵問題】以期進(jìn)一步為研究大蒜WOX基因在大蒜生長發(fā)育過程中的作用提供科學(xué)依據(jù)。
大蒜全基因組數(shù)據(jù)從https://doi.org/10.6084/m9.figshare.12570947.v1下載[3],擬南芥全基因組WOX基因家族信息從TAIR(http://www.arabidopsis.org/)中下載[15],水稻、番茄、辣椒和獼猴桃全基因組WOX基因家族信息從iTAK(http://itak.feilab.net/cgi-bin/itak/db_home.cgi)中下載。大腸桿菌、酵母菌和擬南芥的基因組密碼子使用偏性數(shù)據(jù)從Kazusa DNA研究所Codon Usage Database在線數(shù)據(jù)庫(http://www.kazusa.or.jp/codon/)下載[16]。
1.2.1 大蒜WOX基因家族的鑒定與分析 利用Sun等[3]2020年公布的大蒜全基因組數(shù)據(jù),以大蒜全基因組蛋白序列和核酸序列以及擬南芥WOX基因家族序列構(gòu)建FASTA文本,并利用BioEdit軟件構(gòu)建大蒜全基因組本地數(shù)據(jù)庫,同時以構(gòu)建的擬南芥WOX基因家族為探針,進(jìn)行本地BLAST,重復(fù)上述操作去冗余后,結(jié)合NCBI(National Center for Biotechnology Information)、SMART(http://smart.embl-heidelberg.de/)和MEGA 6.0軟件進(jìn)行結(jié)構(gòu)域和同源性分析,對大蒜WOX基因家族進(jìn)行鑒定篩選。同時利用MEGA 6.0和DNAMAN 6.0軟件對大蒜WOX基因家族進(jìn)行系譜進(jìn)化分析及保守結(jié)構(gòu)域分析[17]。
1.2.2 密碼子偏好性分析 利用CodonW軟件和EMBOSS(http://emboss.bioinformatics.nl/cgi-bin/emboss/cusp)在線軟件計算大蒜WOX基因家族編碼蛋白的密碼子偏性參數(shù),并用SPSS 19.0、Excel 2010和MEGA 6.0進(jìn)行大蒜WOX基因家族的密碼子堿基組成與GC偏好性(GC3s)的相關(guān)性、整體RSCU值、系統(tǒng)聚類及最佳外源受體表達(dá)系統(tǒng)選擇分析,并參照牛元[18]和Sueoka[19]等使用方法進(jìn)行最優(yōu)密碼子、ENC-Plot和PR2-plot分析,分析大蒜WOX基因家族的密碼子使用偏性強(qiáng)弱及受突變壓力或選擇壓力的影響,同時用Origin 2017、RStudio、MEGA 6.0和TBtools軟件作圖。
1.2.3 大蒜WOX家族表達(dá)譜分析 利用Sun等[3]上傳于GEO數(shù)據(jù)庫(登錄號:GSE145455)中的表達(dá)數(shù)據(jù),提取大蒜WOX基因家族在大蒜鱗莖膨大8個時期(鱗莖未膨大開始,每隔5 d取樣1次)、假莖、根、葉的表達(dá)數(shù)據(jù),并用TBtools軟件作圖。
通過本地BLAST去冗余后,最終從大蒜基因組數(shù)據(jù)庫中獲得16個WOX家族成員,根據(jù)NCBI同源比對及構(gòu)建進(jìn)化樹中與擬南芥WOX基因家族的同源關(guān)系(圖1-A),分別將這些成員命名為AsaWUS、AsaWOX3a、AsaWOX3b、AsaWOX3c、AsaWOX3d、AsaWOX3e、AsaWOX3f、AsaWOX3g、AsaWOX3h、AsaWOX3l、AsaWOX3j、AsaWOX3k、AsaWOX4、AsaWOX9、AsaWOX13a和AsaWOX13b。進(jìn)一步將大蒜、擬南芥、番茄、辣椒、水稻和獼猴桃WOX基因家族做進(jìn)化分析發(fā)現(xiàn)(圖1-B),5種不同植物的WOX家族成員被劃分為WUS支(WUS clade)、中間支(Intermediate clade)和遠(yuǎn)古支(Ancient clade)。5種植物均含有WUS支、中間支和遠(yuǎn)古支成員。大蒜WOX家族16個成員中,WUS支包含:AsaWUS、AsaWOX3a、AsaWOX3b、AsaWOX3c、AsaWOX3d、AsaWOX3e、AsaWOX3f、AsaWOX3g、AsaWOX3h、AsaWOX3l、AsaWOX3j、AsaWOX3k和AsaWOX4;中間支包含:AsaWOX9;遠(yuǎn)古支包含:AsaWOX13a和AsaWOX13b。5個物種的WOX家族成員在3個分支中均有分布,說明WOX家族的分化在大蒜、擬南芥、水稻、番茄、辣椒和獼猴桃物種分化之前。
A為大蒜與擬南芥WOX基因家族的進(jìn)化關(guān)系分析;B為大蒜、擬南芥、番茄、辣椒、水稻和獼猴桃WOX基因家族的進(jìn)化關(guān)系分析A is evolution analysis of WOX genes family between garlic and Arabidopsis;B is evolution analysis of WOX genes family among garlic, Arabidopsis, tomato, pepper, rice and kiwi fruit圖1 大蒜WOX基因家族鑒定及進(jìn)化分析Fig.1 Identification and evolution analysis of garlic WOX genes family
利用DNAMAN 6.0對大蒜WOX家族成員蛋白序列進(jìn)行多序列比對,結(jié)果表明,大蒜WOX家族成員大多含有68個氨基酸組成的“螺旋—環(huán)—螺旋—轉(zhuǎn)角—螺旋”HOX保守結(jié)構(gòu)域(圖2)。其中,AsaWOX3k保守結(jié)構(gòu)域不完整,AsaWOX13a、AsaWOX13b、AsaWOX9、AsaWOX3g、AsaWOX3h、AsaWOX3l和AsaWOX3j保守結(jié)構(gòu)域序列較其他成員有較大差異,預(yù)示它們可能在功能上存在較大差異。
圖2 大蒜WOX家族成員保守結(jié)構(gòu)域分析Fig.2 Analysis of conserved domains of garlic WOX family members
2.3.1 密碼子偏性相關(guān)參數(shù)分析 分析了大蒜WOX家族成員堿基組成及相關(guān)密碼子偏性參數(shù)(表1),其中平均AU含量和GC含量分別為58.02%和41.98%,密碼子第3位堿基平均含量A3s>T3s>G3s>C3s,GC1s、GC2s和GC3s平均含量分別為0.450、0.414、0.395,均小于0.5,揭示大蒜WOX家族成員編碼序列密碼子中AU使用頻率高于GC。CBI均值為-0.038,F(xiàn)op均值為0.407,ENC平均值為50.53,偏向61,CAI均值為0.186,遠(yuǎn)低于1.0,說明大蒜WOX家族成員密碼子使用偏性較弱。
表1 大蒜WOX家族成員堿基組成及相關(guān)密碼子偏性參數(shù)
2.3.2 大蒜WOX成員密碼子與GC(GC3s)偏好性的關(guān)系 分析大蒜WOX家族成員密碼子與GC(GC3s)偏好性的關(guān)系,結(jié)果(圖3)表明,以G/C結(jié)尾的密碼子與GC3s偏好性表現(xiàn)正相關(guān),多數(shù)以A/U結(jié)尾的密碼子與GC3s偏好性表現(xiàn)負(fù)相關(guān),但CUU、UUU、ACU、AGU、AAU、CCA、GCA、GGA、AUA與GC3s偏好性表現(xiàn)正相關(guān),表明它們受GC3s偏好性影響。
紅色代表正相關(guān),藍(lán)色代表負(fù)相關(guān),黑色表示終止密碼子(UAA、UAG、UGA)和起始密碼子(AUG、UGG)Red represents positive correlation, blue represents negative correlation, and black represents stop codons (UAA, UAG, UGA) and start codons (AUG, UGG)圖3 蒜WOX家族密碼子與GC3s相關(guān)性Fig.3 The correlation analysis between codons and GC3s of garlic WOX family
2.3.3 大蒜WOX基因家族整體RSCU值、最優(yōu)密碼子及聚類分析 大蒜WOX家族整體RSCU值分析發(fā)現(xiàn),大蒜WOX家族59個密碼子〔除終止密碼子(UAA、UAG、UGA)和起始密碼子(AUG、UGG)〕中,存在27個高頻密碼子(RSCU>1表示使用頻率較高的密碼子,表中以*表示)。其中,只有7個密碼子以G/C結(jié)尾(AGG、UGC、CAC、UUG、UUC、AGC和GUG),20個密碼子以A/U結(jié)尾,表明大蒜WOX家族成員偏好A/U結(jié)尾密碼子。
大蒜WOX家族成員RSCU值聚類分析顯示(圖4),大蒜WOX家族成員被劃分為2大分支,聚為同一支成員間對密碼子的使用偏性具有相似性,聚為同一支上的密碼子,在不同成員間,其RSCU值大小也基本相似,也說明成員之間對密碼子使用偏性基本一致。
表2 大蒜WOX基因家族整體RSCU值
圖4 大蒜WOX家族成員RSCU聚類分析Fig.4 RSCU cluster analysis of garlic WOX family members
RSCU>1的密碼子確定為高頻密碼子,△RSCU值大于0.08即為高表達(dá)密碼子,同時滿足高頻密碼子與高表達(dá)密碼子即為最優(yōu)密碼子[18]。最優(yōu)密碼子分析發(fā)現(xiàn)(圖5),大蒜WOX家族存在14個最優(yōu)密碼子,只有UUC和GUG以G/C結(jié)尾,其余12個最優(yōu)密碼子均以A/U結(jié)尾,進(jìn)一步表明大蒜WOX家族成員偏好A/U結(jié)尾密碼子。
△RSCU<0在圖中未顯示;*代表最優(yōu)密碼子△RSCU<0 is not shown in the figure; * represents the best codon圖5 大蒜WOX家族最優(yōu)密碼子分析Fig.5 Optimal codon analysis of garlic WOX family
2.3.4 ENC-Plot和PR2-plot分析 GC3s分布范圍反映了植物所受的選擇壓力,GC3s分布范圍越小,表明密碼子使用偏性受自然選擇壓力越大,同時當(dāng)4種堿基使用頻率一致時,密碼子偏性僅受突變壓力的影響[20]。此外,繪制理論ENC值標(biāo)準(zhǔn)曲線可反映密碼子受堿基突變或選擇壓力的影響,實際值在曲線上,表示密碼子僅受堿基突變的影響,在標(biāo)準(zhǔn)曲線下方,表示密碼子受選擇壓力的影響[18]。ENC和GC3s關(guān)聯(lián)分析顯示(圖6-A),大蒜WOX家族成員GC3s分布范圍在0.326~0.487,分布較為集中,說明該家族成員密碼子使用偏性受選擇壓力影響較大。此外,該家族成員基本分布在標(biāo)準(zhǔn)曲線下方,有2個成員分布在標(biāo)準(zhǔn)曲線上,說明該家族成員在進(jìn)化過程中大多受選擇壓力的影響,少數(shù)成員受堿基突變壓力的影響。PR2-plot分析顯示(圖6-B),大蒜WOX家族成員的A3/(A3+G3)或G3/(G3+C3)值基本都偏離0.5,進(jìn)一步表明該家族成員密碼子使用偏性主要受選擇壓力的影響。
標(biāo)準(zhǔn)曲線繪制公式為ENC=2+GC3s+29/(GC3s2+(1-GC3s)2)[18]The standard curve drawing formula is ENC=2+GC3s+29/ (GC3s2+ (1-GC3s) 2)[18]圖6 大蒜WOX家族成員ENC-Plot和PR2-plot分析Fig.6 ENC-Plot and PR2-plot analysis of garlic WOX family members
2.3.5 大蒜WOX家族成員RSCU值和CDS序列聚類分析 一般功能相似性高的基因,往往表現(xiàn)出類似的密碼子使用模式[21]。RSCU值和CDS序列聚類分析結(jié)果表明,基于RSCU值和CDS序列聚類均將大蒜WOX家族16個成員劃分為2大類,但是2種聚類存在較大差異。基于RSCU值聚類(圖7-A),表明同一分支上的成員間,具有類似的密碼子使用模式;而基于CDS序列聚類(圖7-B),表明同一分支上的成員間,同源性高、親緣關(guān)系更近。也說明基于CDS序列的聚類分析相比較基于RSCU值的聚類分析要更加準(zhǔn)確,更能說明WOX家族成員之間的進(jìn)化關(guān)系,而基于RSCU值的聚類分析可作為前者的補(bǔ)充。
A為RSCU值聚類;B為CDS序列聚類A is RSCU values cluster analysis; B is CDS sequences cluster analysis圖7 大蒜WOX家族成員RSCU值和CDS序列聚類分析Fig.7 RSCU values and CDS sequences cluster analysis of garlic WOX family members
2.3.6 大蒜WOX基因家族外源轉(zhuǎn)化受體系統(tǒng)選擇 選擇最佳受體表達(dá)系統(tǒng)可通過物種間密碼子使用偏性差異來表示。而物種間密碼子使用偏性差異則通過密碼子使用頻率比值來進(jìn)行衡量。2個物種密碼子使用偏性較一致,說明它們之間密碼子使用頻率比值介于0.5~2,相反,表示2個物種密碼子使用偏性差異較大[16,22]。大蒜WOX基因家族最佳外源轉(zhuǎn)化受體系統(tǒng)選擇分析顯示(表3),不同物種間密碼子使用偏好性差異不同(表中下劃線標(biāo)出)。大蒜與大腸桿菌存在密碼子使用偏好性差異較大的密碼子有17個,與酵母菌有11個,與擬南芥有6個。表明擬南芥較適用于大蒜WOX基因家族的外源表達(dá)系統(tǒng)。
表3 大蒜WOX基因家族最佳外源轉(zhuǎn)化受體系統(tǒng)選擇
從GEO數(shù)據(jù)庫中下載獲取大蒜全基因組的表達(dá)數(shù)據(jù),并抽取大蒜WOX基因家族在鱗莖發(fā)育8個時期(LJ-1~LJ-8,鱗莖發(fā)育8個時期分別為:從鱗莖未膨大至鱗莖未膨大完成,每個時期間隔5 d)、葉片(YP)、假莖(JJ)和根(G)中的表達(dá)數(shù)據(jù)做表達(dá)熱圖(AsaWUS、AsaWOX3a、AsaWOX3b、AsaWOX9、AsaWOX13a表達(dá)數(shù)據(jù)為0,未在圖中展示),結(jié)果(圖8)表明,AsaWOX13b在LJ-1、LJ-5、LJ-8和LJ-7中表達(dá),以LJ-5中表達(dá)量最高;AsaWOX4在LJ-1和葉片中表達(dá),以葉片中表達(dá)量最高;AsaWOX3c在LJ-7、葉片、假莖和根中表達(dá),以假莖中的表達(dá)量最高;AsaWOX3d在LJ-3和LJ-8中表達(dá),以LJ-8中表達(dá)量最高;AsaWOX3e和AsaWOX3f在葉片和假莖中表達(dá),以葉片中表達(dá)量最高;AsaWOX3g在LJ-2和根中表達(dá),以LJ-2中表達(dá)量最高;AsaWOX3h在LJ-6和假莖中表達(dá),以假莖中表達(dá)量最高;AsaWOX3l只在葉片中表達(dá);AsaWOX3j只在根中表達(dá);AsaWOX3k只在LJ-8表達(dá)。
LJ-1~LJ-8表示鱗莖發(fā)育8個時期;YP代表葉片;JJ代表假莖;G代表根LJ-1 to LJ-8 represent 8 stages of bulb development; YP represents leaf; JJ represents pseudostem; G represents root圖8 大蒜WOX家族成員在不同組織中的表達(dá)Fig.8 The expression of garlic WOX family members in different tissues
植物WOX家族在植物生長發(fā)育、干細(xì)胞維持、激素信號轉(zhuǎn)導(dǎo)、初生和次生物質(zhì)代謝及抗逆響應(yīng)等過程中發(fā)揮重要調(diào)節(jié)作用[5]。大蒜基因組數(shù)據(jù)的公布,為研究大蒜WOX家族提供了重要參考。通過研究從大蒜基因組數(shù)據(jù)中鑒定得到16個大蒜WOX家族成員,前人研究也表明不同物種間WOX家族成員個數(shù)存在差異[擬南芥(15個)、辣椒(11個)、番茄(10個)、獼猴桃(16個)、水稻(17個)和棉花(37個)[4-5,10]],這可能是不同物種在長期進(jìn)化過程中,為適應(yīng)生存環(huán)境的變化,形成適應(yīng)自身發(fā)展基因組而導(dǎo)致的。進(jìn)化分析進(jìn)一步發(fā)現(xiàn),大蒜和水稻親緣關(guān)系更近,擬南芥、番茄、辣椒和獼猴桃親緣關(guān)系更近,且不同植物WOX家族成員在3個分支中均有分布,說明WOX家族成員分化時間要早于這些物種的分化時間,這與在其他植物上的研究結(jié)果類似[11,23]。保守結(jié)構(gòu)域分析發(fā)現(xiàn),親緣關(guān)系近的序列,它們之間具有相似的保守結(jié)構(gòu)域,說明鑒定和進(jìn)化分析結(jié)果是可靠的。此外,大蒜WOX家族成員保守結(jié)構(gòu)域由68個氨基酸組成,而星油藤、獼猴桃由60個氨基酸組成[10-11],擬南芥、桂花和烏梅等則由61個氨基酸組成[24],存在這種差異,說明WOX家族在不同物種之間可能經(jīng)歷了不同的分化過程。
大蒜WOX家族成員密碼子偏性參數(shù)、整體RSCU值、最優(yōu)密碼子分析發(fā)現(xiàn),大蒜WOX家族成員偏好使用A/U結(jié)尾的密碼子,與GC含量偏性相關(guān)性分析發(fā)現(xiàn),該家族成員密碼子使用偏性與GC含量呈正相關(guān),而該家族成員GC含量低于AU含量,說明大蒜WOX家族成員密碼子使用偏性較弱,這與單子葉植物偏愛使用G/C結(jié)尾的密碼子,雙子葉植物偏愛使用A/U結(jié)尾的密碼子報道不符[25],但是與在菠蘿和馬尾松等單子葉植物上的研究結(jié)果類似[26-27],說明大蒜在進(jìn)化上可能較其他單子葉植物更接近雙子葉植物,進(jìn)化程度可能較其他單子葉植物高。此外,RSCU值聚類分析發(fā)現(xiàn),具有類似RSCU值的成員聚為一支,暗示它們在功能上可能存在一定的相似性。ENC-Plot和PR2-plot分析表明大蒜WOX家族成員多數(shù)受選擇壓力的影響,少數(shù)受突變壓力的影響,這與在谷子、月季上的研究結(jié)果類似[13,18];RSCU值和CDS序列聚類分析發(fā)現(xiàn),2種聚類存在差異,這與在其他物種上的研究結(jié)果類似[12,16,28];說明基于CDS序列聚類更能反應(yīng)基因間進(jìn)化,而基于RSCU值一定程度上可作為前者的補(bǔ)充。最佳外源表達(dá)系統(tǒng)分析發(fā)現(xiàn),擬南芥更適合作為大蒜WOX家族成員的外源表達(dá)系統(tǒng),這與在莧菜上的研究結(jié)果類似,和忍冬、大麥上的研究結(jié)果不同[12,28-29],說明不同物種密碼子使用偏性不同,在選擇外源表達(dá)系統(tǒng)時也存在差異,同時說明大蒜WOX家族成員在外源表達(dá)時,要高效率異源表達(dá),需對其部分密碼子進(jìn)行優(yōu)化改造。表達(dá)譜分析發(fā)現(xiàn),大蒜WOX家族成員在大蒜鱗莖發(fā)育過程、葉片、假莖和根中均有表達(dá),說明WOX家族成員可能參與鱗莖、葉片、假莖和根的生長發(fā)育調(diào)控, 建議后期進(jìn)行差異基因的克隆與遺傳轉(zhuǎn)化分析,以確定其在特定發(fā)育時期的功能作用。
利用生物信息學(xué)方法從大蒜基因組中鑒定獲得16個WOX基因家族,大部分WOX基因家族含68個氨基酸組成的保守結(jié)構(gòu)域,密碼子使用偏性均較弱,且擬南芥更適合用于該基因家族的外源表達(dá)受體。此外,大蒜WOX基因家族在大蒜鱗莖不同發(fā)育時期及其他組織中差異性表達(dá),這為進(jìn)一步研究大蒜WOX基因家族在大蒜生長發(fā)育過程中的功能奠定了基礎(chǔ)。