胡春嬌,梁雪楓,姜振峰
(東北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,哈爾濱 150030)
轉(zhuǎn)錄因子(Transcription factor,TF)可特異性識(shí)別并與靶基因上游啟動(dòng)因子區(qū)域特異DNA 序列模體結(jié)合,使其轉(zhuǎn)錄激活或抑制,從而調(diào)控植物生長(zhǎng)發(fā)育[1]。YABBY 基因家族屬鋅指蛋白超家族,是一類存在于植物體內(nèi)的轉(zhuǎn)錄因子,包含2 個(gè)高度保守的結(jié)構(gòu)域,其中一個(gè)為位于YABBY 蛋白N端的鋅指結(jié)構(gòu)域,另一個(gè)為位于C 端的“螺旋-環(huán)-螺旋”結(jié)構(gòu)域[2]。
雙子葉植物中YABBY 基因的研究較為深入。Bowma 等[2]研究發(fā)現(xiàn)YABBY 基因與植物生長(zhǎng)發(fā)育調(diào)控植物形態(tài)建成和器官發(fā)育有相關(guān)。YABBY 基因共有5 個(gè)亞族,分別為CRC、FLA/YAB3、INO、YAB2、YAB5[3]。其中CRC 基因在心皮和蜜腺中表達(dá),在蜜腺的生長(zhǎng)和成熟中發(fā)揮重要作用[4];FLA基因與花器官形成及葉發(fā)育有關(guān)[5-6];INO 基因調(diào)控外胚珠珠被發(fā)育[7];YAB2、YAB3、YAB5 在植物營(yíng)養(yǎng)組織中特異表達(dá)[8-9]。目前,在擬南芥[10]、水稻[11]、玉米[12]、紫花苜蓿[13]、棉花[14]中分別鑒定出6、8、13、8、23 個(gè)該基因家族成員?,F(xiàn)有研究發(fā)現(xiàn)棉花中所有YABBY 基因家族成員均可在花、蕾和莖端組織中表達(dá)[14];YAB7 基因在水稻維管發(fā)育中發(fā)揮重要作用[15];TaYAB1_5AL 基因在小麥葉原基發(fā)育與葉片近-遠(yuǎn)軸端極性的建立密切相關(guān)[16];PgINO 基因在石榴中參與花器官發(fā)育且對(duì)外種皮發(fā)育產(chǎn)生負(fù)調(diào)控作用[17]。
大豆為我國(guó)主要油料作物,在農(nóng)業(yè)生產(chǎn)中占有重要地位[18],其生長(zhǎng)發(fā)育過(guò)程存在復(fù)雜的遺傳控制機(jī)制。在完成大豆全基因組測(cè)序[19]和掌握分析大豆全基因組使用方法[20]后,大豆分子生物學(xué)實(shí)現(xiàn)了新跨越,眾多基因功能被闡釋。目前,YABBY 基因家族研究多集中在擬南芥、水稻、玉米、紫花苜蓿和棉花[10-14],在大豆生長(zhǎng)發(fā)育過(guò)程中的研究尚未見(jiàn)報(bào)道。為探究YABBY 基因家族在大豆生長(zhǎng)發(fā)育過(guò)程中的作用,本研究利用生物信息學(xué)手段對(duì)大豆YABBY 基因家族理化性質(zhì)、基因結(jié)構(gòu)、蛋白質(zhì)二級(jí)及三級(jí)結(jié)構(gòu)、保守基序分布、系統(tǒng)進(jìn)化樹構(gòu)建和大豆植株各組織基因表達(dá)模式進(jìn)行分析,旨在為深入研究大豆YABBY 基因家族功能提供理論基礎(chǔ)。
試驗(yàn)中的蛋白序列、基因序列、基因組注釋文件分別來(lái)自以下網(wǎng)站:Phytozome(https://phytozome-next.jgi.doe.gov/)、NCBI 數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/)、大豆基因組數(shù)據(jù)庫(kù)SoyBase(https://www.soybase.org/)。
1.2.1 大豆YABBY 基因家族成員鑒定
由于擬南芥LED 基因與大豆YABBY 基因在序列上存在相似性,因此將擬南芥LED 基因作為查詢對(duì)象。為獲取大豆基因組中包含的全部YABBY基因,通過(guò)Phytozom(https://phytozome-next.jgi.doe.gov/)基因組數(shù)據(jù)庫(kù),根據(jù)擬南芥YABBY 基因氨基酸序列進(jìn)行系統(tǒng)BLAST 檢索,獲得目的基因在大豆中的同源基因,刪去重復(fù)基因,篩選候選基因;通過(guò)Smart(http://smart.embl.de/)在線網(wǎng)站進(jìn)行結(jié)構(gòu)域預(yù)測(cè);利用Pfam(http://pfam.janelia.org/)在線網(wǎng)站下載YABBY 結(jié)構(gòu)域文件,再利用HMMER 3.0軟件構(gòu)建YABBY 基因家族隱馬爾可夫模型文件,將2 個(gè)文件比對(duì)搜索,最后獲得大豆YABBY 基因家族成員。
1.2.2 大豆YABBY 基因家族理化性質(zhì)分析
文中所有基因和蛋白序列來(lái)源均為Phytozome(https://phytozome-next.jgi.doe.gov/)基因組數(shù)據(jù)庫(kù)。利用Phytozome 基因組數(shù)據(jù)庫(kù)和Expasy(https://www.expasy.org/)在線網(wǎng)站對(duì)YABBY 基因家族成員進(jìn)行理化性質(zhì)分析,得到氨基酸長(zhǎng)度、分子質(zhì)量、等電點(diǎn)等信息。
1.2.3 基因編碼蛋白質(zhì)二級(jí)結(jié)構(gòu)與三級(jí)結(jié)構(gòu)預(yù)測(cè)
在Phytozome 數(shù)據(jù)庫(kù)下載得到大豆YABBY基因家族成員的蛋白序列,利用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl.page=npsa_sopma.html)在線網(wǎng)站預(yù)測(cè)大豆YABBY 蛋白質(zhì)二級(jí)結(jié)構(gòu);利用SWISS-MODEL 在線網(wǎng)站構(gòu)建基因編碼蛋白質(zhì)的三級(jí)結(jié)構(gòu)模型。
1.2.4 大豆YABBY 基因家族Motif 分析
利用MEME(https://meme-suite.org/meme/tools/meme)在線網(wǎng)站上傳大豆YABBY 基因家族蛋白序列,對(duì)Motif 進(jìn)行預(yù)測(cè)[21]。
1.2.5 構(gòu)建大豆YABBY 基因家族系統(tǒng)進(jìn)化樹
在Phytozome 數(shù)據(jù)庫(kù)中下載大豆、擬南芥基因蛋白序列,利用MEGA 11 比對(duì)分析基因蛋白序列,再使用MEGA 11 構(gòu)建系統(tǒng)進(jìn)化樹,同時(shí)利用chiplot 在線網(wǎng)站將nwk 格式文件作為基礎(chǔ)對(duì)進(jìn)化樹進(jìn)行美化。
1.2.6 大豆YABBY 基因家族共線性分析
在大豆基因組數(shù)據(jù)庫(kù)SoyBase 和擬南芥數(shù)據(jù)TAIR(https://www.Arabidopsis.org/)中下載大豆和擬南芥全基因組序列和基因結(jié)構(gòu)注釋文件,使用McScan 軟件進(jìn)行共線性分析預(yù)測(cè),利用TBtools v1.09857 軟件繪圖。
1.2.7 大豆YABBY 基因家族表達(dá)分析
通過(guò)數(shù)據(jù)庫(kù)SoyBase(https://www.soybase.org/)下載大豆YABBY 基因家族成員在6 個(gè)不同組織中的表達(dá)量轉(zhuǎn)錄組數(shù)據(jù),使用軟件TBtools v1.09857的Heat Map 功能繪制熱圖,以log scale(base=2 和log with=1)為基礎(chǔ),對(duì)數(shù)據(jù)進(jìn)行歸一化處理。
本研究利用擬南芥LED 基因保守結(jié)構(gòu)域及全長(zhǎng)蛋白,通過(guò)BLAST 對(duì)大豆基因組學(xué)數(shù)據(jù)庫(kù)進(jìn)行查詢,再利用Smart 網(wǎng)站進(jìn)一步確認(rèn)和人工校對(duì),最終獲得17 個(gè)大豆YABBY 基因家族成員,分別命名為GmYABBY1~GmYABBY17。
由表1 可知,大豆YABBY 基因家族成員的氨基酸數(shù)量為173~264 aa,分子質(zhì)量為18 908.42~29 605.55 Ku。等電點(diǎn)為5.30~9.34,除Glyma.01g029300、Glyma.04g094800、Glyma.06g096500、Glyma.08g285200、Glyma.18g140400 外,其余蛋白等電點(diǎn)均>7.00,表明大豆YABBY 基因家族蛋白大部分呈堿性。大豆YABBY 基因不穩(wěn)定系數(shù)均>40,且蛋白疏水性均<0,表明大豆YABBY基因家族成員蛋白均為穩(wěn)定的親水蛋白。
表1 大豆YABBY 基因家族成員蛋白信息及理化性質(zhì)
在二級(jí)結(jié)構(gòu)預(yù)測(cè)[22]過(guò)程中,YABBY 基因編碼的蛋白質(zhì)α-螺旋均大于0.160 0,其中GmYABBY1、GmYABBY6、 GmYABBY16,GmYABBY3 和GmYABBY10,GmYABBY4 和 GmYABBY7,GmYABBY8 和GmYABBY9 的α-螺旋相近。β-轉(zhuǎn)角中,GmYABBY3 和GmYABBY8,GmYABBY5、GmYABBY6 和 GmYABBY7,GmYABBY12 和GmYABBY15,GmYABBY13 和 GmYABBY14,GmYABBY16 和GmYABBY17 分別相近。β-轉(zhuǎn)角中最大的基因?yàn)镚mYABBY1,最小的基因?yàn)镚mYABBY9。無(wú)規(guī)則卷曲為0.473 5~0.622 3,其中GmYABBY3 和 GmYABBY4,GmYABBY7 和GmYABBY14 無(wú)規(guī)則卷曲度相近。延伸鏈為0.1152~0.2216,其 中 GmYABBY2 和 GmYABBY6,GmYABBY4 和 GmYABBY13,GmYABBY5 和GmYABBY10,GmYABBY7 和 GmYABBY15,GmYABBY9、GmYABBY11 和GmYABBY16 的延伸長(zhǎng)度分別相近(見(jiàn)表2)。
由圖1 可知,GmYABBY2 和GmYABBY4,GmYABBY3 和 GmYABBY5 三級(jí)結(jié)構(gòu)相似,GmYABBY6、 GmYABBY8、 GmYABBY10 和GmYABBY17 三級(jí)結(jié)構(gòu)表現(xiàn)一致,GmYABBY9 和GmYABBY11 三級(jí)結(jié)構(gòu)表現(xiàn)相同。結(jié)果表明,部分基因家族成員蛋白質(zhì)三級(jí)結(jié)構(gòu)相同。
圖1 大豆GmYABBY 蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)
通過(guò)MEME 在線工具對(duì)大豆YABBY 基因家族的17 個(gè)成員蛋白序列中的保守序列進(jìn)行預(yù)測(cè),結(jié)果表明在大豆YABBY 基因家族中共存在5 個(gè)保守基序,分別命名為Motif 1~Motif 5。
由圖2 可知,大豆GmYABBY 基因家族成員的保守Motif 數(shù)量為2~4 個(gè),其中Motif 1 與Motif 2出現(xiàn)頻率最高,為17 次;其次為Motif 3,出現(xiàn)頻率為14 次;Motif 5 出現(xiàn)頻率最低,僅為4 次。
GmYABBY1、GmYABBY8、GmYABBY10 和GmYABBY17 保守基序相似,GmYABBY3、GmYABBY5、GmYABBY7 和GmYABBY16 保守基序相似,GmYABBY9、GmYABBY11、GmYABBY13、GmYABBY14 和GmYABBY15 保守基序高度相似,GmYABBY2 和GmYABBY12 高度近似。Motif 1 與Motif 2 通常同時(shí)成對(duì)出現(xiàn)。根據(jù)大豆YABBY 基因家族進(jìn)化關(guān)系分析,進(jìn)化關(guān)系相近的同一亞族成員在保守基序組成上具有較高相似性,表明同一亞族成員在基因功能上也具有較高的相似性。
由圖3 可知,根據(jù)系統(tǒng)發(fā)育關(guān)系和序列相似性將大豆YABBY 基因家族分為4 個(gè)亞族(ClassⅠ、ClassⅡ、ClassⅢ、ClassⅣ),4 個(gè)亞族均包含擬南芥和大豆這2 個(gè)物種。其中,ClassⅠ包含5 個(gè)大豆基因(GmYABBY1、GmYABBY6、GmYABBY8、GmYABBY10、GmYABBY17)、1 個(gè)擬南芥基因(AT1G23420),目標(biāo)基因GmYABBY6 和GmYABBY8 高度同源;Class Ⅱ包含2 個(gè)大豆基因(GmYABBY2、GMYABBY4)、1 個(gè)擬南芥基因(AT1G69180),目標(biāo)基因GmYABBY2 和GmYABBY4 高度同源;Class Ⅲ包含4 個(gè)大豆基因(GmYABBY3、GmYABBY5、GmYABBY7、GmYABBY16)、2 個(gè)擬南芥基因(AT2G45190、AT4G00180),目標(biāo)基因 GmYABBY5 和 GmYABBY16,GmYABBY3 和GmYABBY7 均高度同源;ClassⅣ包含6 個(gè)大豆基因(GmYABBY9、GmYABBY11、GmYABBY12、 GmYABBY13、 GmYABBY14、GmYABBY15)、2 個(gè)擬南芥基因(AT1G08465、AT2G26580),目標(biāo)基因 GmYABBY11 和GmYABBY14,GmYABBY13 和GmYABBY15 均高度同源。
圖3 大豆、擬南芥YABBY 基因家族系統(tǒng)進(jìn)化樹
植物進(jìn)化階段常通過(guò)基因復(fù)制的方式達(dá)到擴(kuò)大基因組目的。為探究大豆YABBY 基因家族進(jìn)化關(guān)系,對(duì)大豆YABBY 基因家族進(jìn)行物種內(nèi)共線性分析。由圖4 可知,在大豆20 條染色體上共發(fā)生14 次復(fù)制事件。其中GmYABBY11、GmYABBY12發(fā)生3 次復(fù)制事件,GmYABBY1、GmYABBY10、GmYABBY14 和GmYABBY17 發(fā)生2 次復(fù)制事件,其余基因各發(fā)生1 次復(fù)制事件。結(jié)果表明,大豆YABBY 基因在進(jìn)化過(guò)程中出現(xiàn)了基因分化。
圖4 大豆GmYABBY 基因共線性關(guān)系
由圖5 可知,GmYABBY4 和GmYABBY6 在6 個(gè)組織中均未表達(dá),表明這2 個(gè)基因可能為誘導(dǎo)表達(dá)基因。GmYABBY11 除在根和根瘤中不表達(dá),在其他組織中均表達(dá),且表達(dá)量較高。GmYABBY3和GmYABBY5 在種子發(fā)育后期表達(dá)量較高,表明這2 個(gè)基因可能與種子發(fā)育有關(guān)。GmYABBY11 在葉和莢的發(fā)育期表達(dá)量較高,表明該基因可能與葉和莢的發(fā)育相關(guān)。17 個(gè)大豆GmYABBY 家族基因中大部分成員在花、葉中表達(dá)量較高,在根與根瘤中表達(dá)量較低甚至不表達(dá),表明GmYABBY基因可能參與花和葉的發(fā)育過(guò)程。
圖5 大豆YABBY 家族基因在不同組織中的表達(dá)圖譜
YABBY 基因家族是一種影響植物側(cè)生器官發(fā)育的轉(zhuǎn)錄因子[23],在植物花器官發(fā)育、激素響應(yīng)、逆境應(yīng)答等方面發(fā)揮關(guān)鍵作用[24]。本研究利用生物信息學(xué)方法在大豆中共鑒定出17 個(gè)YABBY 基因家族成員,其氨基酸數(shù)量為173~264 aa,分子質(zhì)量為18 908.42~29 605.55 Ku,等電點(diǎn)最?。℅mYABBY8)為5.30,最大(GmYABBY2 和GmYABBY4)為9.34。通過(guò)對(duì)其理化性質(zhì)分析可知,大豆YABBY 基因家族成員蛋白大部分呈堿性,表明該家族含有較多的堿性氨基酸,如組氨酸、精氨酸、賴氨酸。大豆YABBY 基因不穩(wěn)定系數(shù)均>40,且蛋白疏水性均<0,表明大豆YABBY 基因家族成員蛋白均為穩(wěn)定的親水蛋白。系統(tǒng)進(jìn)化樹分析表明,本研究中鑒定的17 個(gè)大豆YABBY 基因家族成員與擬南芥相同,分為4 個(gè)亞族,且每個(gè)亞族均包含與擬南芥同源的基因,由此推斷,大豆與擬南芥的YABBY 基因家族成員可能具有相似基因功能。
蛋白質(zhì)二級(jí)結(jié)構(gòu)主要由α-螺旋、β-折疊、無(wú)規(guī)則卷曲和延伸鏈這4 種空間結(jié)構(gòu)構(gòu)成。GmYABBY 基因家族的17 個(gè)基因的蛋白質(zhì)二級(jí)結(jié)構(gòu)主要由無(wú)規(guī)則卷曲形成。GmYABBY6、GmYABBY8、GmYABBY10 和GmYABBY17 的氨基酸序列高度相似,且這4 個(gè)基因的蛋白質(zhì)三級(jí)結(jié)構(gòu)相似。
物種內(nèi)共線性分析表明,在大豆20 條染色體上共發(fā)生14 次復(fù)制事件,表明大豆YABBY 基因在進(jìn)化過(guò)程中出現(xiàn)了基因分化。
李圣龍[25]等從石榴基因組中鑒定得到6 個(gè)YABBY 基因,發(fā)現(xiàn)Pg YABBY 基因家族在石榴的生長(zhǎng)發(fā)育和生理過(guò)程中起重要作用。本研究通過(guò)對(duì)GmYABBY 家族基因表達(dá)模式分析發(fā)現(xiàn)GmYABBY6 和GmYABBY10 基因在葉、花、莢3 個(gè)發(fā)育時(shí)期及根、根瘤、種子7 個(gè)不同發(fā)育時(shí)期的6 個(gè)組織中均未表達(dá),表明這2 個(gè)基因可能為誘導(dǎo)表達(dá)基因。GmYABBY 家族基因成員在花、葉中表達(dá)量較高,在根與根瘤中表達(dá)量較低甚至不表達(dá),表明GmYABBY 基因可能參與花和葉的發(fā)育。GmYABBY3 和GmYABBY5 在種子發(fā)育后期表達(dá)量較高,表明這2 個(gè)基因可能與種子的發(fā)育相關(guān)。
本研究對(duì)大豆YABBY 基因家族進(jìn)行初步鑒定,并進(jìn)行了生物信息學(xué)分析及組織表達(dá)模式研究,初步揭示大豆YABBY 基因可能參與花、葉及種子發(fā)育,為今后深入研究大豆YABBY 基因家族功能提供理論基礎(chǔ)。