劉 俊,李 龍,吳耀松,劉 燕,任閃閃,陳玉龍*
杜仲TCP轉(zhuǎn)錄因子鑒定及生物信息學(xué)分析
劉 俊1, 3, 4,李 龍2,吳耀松1,劉 燕1,任閃閃1,陳玉龍1*
1. 河南中醫(yī)藥大學(xué)中醫(yī)藥科學(xué)院 河南省中醫(yī)方證信號(hào)傳導(dǎo)重點(diǎn)實(shí)驗(yàn)室,河南 鄭州 450046 2. 西北農(nóng)林科技大學(xué)林學(xué)院,陜西 楊凌 712100 3. 國(guó)際竹藤中心 國(guó)家林業(yè)和草原局竹藤科學(xué)與技術(shù)重點(diǎn)開(kāi)放實(shí)驗(yàn)室,北京 100102 4. 國(guó)際竹藤中心 安徽太平試驗(yàn)中心,安徽 黃山 245716
對(duì)杜仲TCP(teosinte branched 1/cycloidea/proliferating)基因家族進(jìn)行篩選分析,以期為基因功能深入研究奠定基礎(chǔ)。以杜仲基因組數(shù)據(jù)庫(kù)為基礎(chǔ),通過(guò)生物信息學(xué)系統(tǒng)分析基因家族的理化性質(zhì)、系統(tǒng)進(jìn)化、基因結(jié)構(gòu)、啟動(dòng)子順式作用元件及其在杜仲葉片發(fā)育及膠形成中的表達(dá)水平。從杜仲基因組中共鑒定到14個(gè),氨基酸數(shù)目介于139~492,理論等電點(diǎn)分布在5.54~9.72,相對(duì)分子質(zhì)量區(qū)域?yàn)?8 880~53 620,亞細(xì)胞定位預(yù)測(cè)在細(xì)胞核中,均為親水性蛋白。系統(tǒng)進(jìn)化分為PCF、CIN和CYC/TB1 3個(gè)亞家族,分別包含5、6、3個(gè)EuTCPs蛋白。表達(dá)模式分析顯示,在杜仲葉片不同發(fā)育時(shí)期存在顯著差異,每個(gè)發(fā)育時(shí)期表達(dá)量各不相同,正調(diào)控杜仲膠的形成。杜仲中TCP家族包含14個(gè)成員,各成員的分子特征和組織表達(dá)特異性存在差異,可能參與杜仲葉片發(fā)育及杜仲膠的形成。
杜仲;TCP轉(zhuǎn)錄因子;亞細(xì)胞定位;系統(tǒng)進(jìn)化;表達(dá)分析
TCP(teosinte branched1,cycloidea,and proliferating cell factor family)蛋白一般由60個(gè)氨基酸組成,含有一個(gè)非典型的基本螺旋(basic helix-loop-helix,bHLH)結(jié)構(gòu)和R結(jié)構(gòu)域[1]。TCP基因家族分為Class I和Class II 2個(gè)亞家族,Class I又稱為PCF亞家族,Class II進(jìn)一步劃分為CIN和CYC/TB1亞家族[2]。TCP轉(zhuǎn)錄因子參與植物胚胎發(fā)育[3]、側(cè)枝形成[4-5]、開(kāi)花調(diào)控[6]、脅迫響應(yīng)[7]以及激素信號(hào)[5]等多種生物學(xué)過(guò)程。
TB1和TB1-like蛋白屬于CYC/TB1亞家族,抑制擬南芥分枝發(fā)育[8]。通過(guò)誘導(dǎo)脂肪氧化酶()基因表達(dá),促進(jìn)茉莉酸(jasmonic acid,JA)生物合成和成熟葉片衰老[9],在花器官中抑制基因表達(dá)[10]。通過(guò)靶向生長(zhǎng)素生物合成酶基因調(diào)控生長(zhǎng)素生物合成[11],是PCF亞家族成員,在種子萌發(fā)過(guò)程中發(fā)揮負(fù)調(diào)控作用[12]。毛竹通過(guò)脫落酸(abscisic acid,ABA)依賴信號(hào)在抗旱中發(fā)揮正調(diào)控作用,以茉莉酸甲酯(methyl jasmonate,Me-JA)介導(dǎo)途徑負(fù)調(diào)控側(cè)根生長(zhǎng)[13]。通過(guò)正調(diào)控影響水稻耐鹽性[14],和是microRNA319的靶基因,在冷脅迫中發(fā)揮正調(diào)控作用[15]。在擬南芥中超表達(dá)誘導(dǎo)、、上調(diào)表達(dá),下調(diào)表達(dá),導(dǎo)致側(cè)根數(shù)目減少,提高轉(zhuǎn)基因植株脅迫耐受性[16]。
杜仲Oliver是我國(guó)特有單科、單屬、單種的多年生第三紀(jì)孑遺樹(shù)種,雌雄異株,具有橡膠和藥材的雙重性質(zhì)[17]。廣泛分布于溫帶及亞熱帶地區(qū),適應(yīng)能力強(qiáng),在酸性或鹽堿性的貧瘠土壤中均能生長(zhǎng)良好[18]。其樹(shù)皮、葉片及種子均可入藥,富含多種活性成分,對(duì)多種疾病的預(yù)防及提高人體免疫力具有顯著的效果,是我國(guó)二級(jí)珍稀保護(hù)植物。目前,對(duì)杜仲的研究與利用多局限于資源收集、藥理學(xué)及形態(tài)學(xué)研究,分子遺傳學(xué)方面的報(bào)道相對(duì)較少,嚴(yán)重制約了杜仲分子育種及相關(guān)生物學(xué)特性研究。目前TCP轉(zhuǎn)錄因子已在多個(gè)物種中進(jìn)行了研究,然而杜仲TCP基因家族還未報(bào)道,本研究以杜仲基因組數(shù)據(jù)[19]為基礎(chǔ),從基因組水平對(duì)基因家族進(jìn)行鑒定、理化性質(zhì)、進(jìn)化關(guān)系、保守基序以及表達(dá)模式分析,以期為進(jìn)一步探索杜仲基因功能奠定基礎(chǔ)。
杜仲材料種植于西北農(nóng)林科技大學(xué)苗圃(陜西楊凌),經(jīng)西北農(nóng)林科技大學(xué)李龍博士鑒定為杜仲Oliver。取生長(zhǎng)正常、長(zhǎng)勢(shì)一致的2年生“秦仲1 號(hào)”(Qinzhong 1)杜仲幼苗的葉芽(莖尖)、生長(zhǎng)葉(長(zhǎng)葉片,3 cm)、幼葉(完全展開(kāi)的新葉)、老葉(完全展開(kāi)60 d葉片),每個(gè)樣品3個(gè)重復(fù),經(jīng)液氮處理后?80 ℃冰箱保存,用于RNA提取。
從杜仲基因組數(shù)據(jù)庫(kù)Genome Warehouse(https://bigd.big.ac.cn/gwh/Assembly/13/show)中下載TCP蛋白候選序列,利用NCBI的(Conserved Domain Search Service(CD Search))分析蛋白結(jié)構(gòu)域,保留含有完整bHLH結(jié)構(gòu)域的序列。通過(guò)在線軟件ProtParam (http://web.expasy. org/protparam/)分析蛋白理化性質(zhì),使用Plant-mPLoc (http:// www.csbio.sjtu.edu.cn/bioinf/ plant-multi/)預(yù)測(cè)EuTCPs蛋白亞細(xì)胞定位,利用在線工具ExPASY(https://www.expasy.org/tools)預(yù)測(cè)EuTCPs氨基酸數(shù)量、相對(duì)分子質(zhì)量(W)、理論等電點(diǎn)(PI),通過(guò)Expasy(https://web. expasy.org/protscale/)軟件分析蛋白的親疏水性,利用SOPMA(https://npsa- prabi.ibcp.fr/cgi-bin/npsa_automat.plpage=npsa_sopma.html)和Phyre 2(http://www.sbg.bio.ic.ac.uk/ phyre2/html/page. cgi?id= index)軟件分別預(yù)測(cè)蛋白的二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)。
通過(guò)Clustal X1.83軟件對(duì)杜仲、水稻、擬南芥和毛竹TCPs氨基酸序列進(jìn)行多序列比對(duì),利用MEGA 6.0的鄰接法(neighbor-joining,N-J)構(gòu)建系統(tǒng)發(fā)育樹(shù),重復(fù)次數(shù)設(shè)置為1000次,其他參數(shù)為默認(rèn)值[20]。
通過(guò)MEME(http://meme-suite.org/)在線軟件對(duì)EuTCP基因家族成員進(jìn)行基序分析(參數(shù)是:any number of Repetitions(anr),maximum number of Motifs=10,minimum width≥6,and maximum width ≤50)。為了解析啟動(dòng)子區(qū)域順式作用元件,對(duì)基因ATG上游2000 bp序列進(jìn)行查找分離,利用Plant CARE(http://bioinformatics. psb.ugent.be/webtools/plant care/htmL/)軟件進(jìn)行啟動(dòng)子順式作用元件分析。
從NCBI的Short Read Arshive(SRA)數(shù)據(jù)庫(kù)中下載杜仲葉片不同發(fā)育時(shí)期(葉芽、初生葉、幼葉、老葉)(版本號(hào)SRP218063)[21]及不同膠含量(低含量、高含量)(版本號(hào)SRP158357)[22]轉(zhuǎn)錄組數(shù)據(jù),基因相對(duì)表達(dá)豐度用FPKM值表示,對(duì)該數(shù)值取對(duì)數(shù)(log2)進(jìn)行統(tǒng)計(jì)分析,通過(guò)MeV4-9-0工具繪制基因表達(dá)圖譜,表達(dá)量最高的用綠色方框表示,表達(dá)量最低的用黃色方框表示。
利用STRING軟件(https://string-db.org/)上傳EuTCPs蛋白序列,選擇擬南芥數(shù)據(jù)庫(kù)進(jìn)行序列比對(duì),根據(jù)已知擬南芥蛋白互作關(guān)系,通過(guò)Blast比對(duì)杜仲同源蛋白,通過(guò)Cytoscape 3.7.0軟件對(duì)EuTCP基因家族蛋白互作信息進(jìn)行評(píng)估和預(yù)測(cè)[23]。
通過(guò)Genome Warehouse數(shù)據(jù)庫(kù),從杜仲基因組中共鑒定到14個(gè)基因(表1),利用Pfam和NCBI的Conserved Domain Search在線分析軟件對(duì)EuTCPs蛋白進(jìn)行結(jié)構(gòu)域驗(yàn)證。結(jié)果顯示:14個(gè)EuTCPs蛋白均含有非典型的bHLH(BASIC、HELIX I、LOOP和HELIX II)特征結(jié)構(gòu)域,分別命名為EuTCP1~EuTCP14。使用ExPASy工具,對(duì)EuTCP家族成員進(jìn)行蛋白質(zhì)理化性質(zhì)分析,EuTCP14蛋白最長(zhǎng),編碼492個(gè)氨基酸,EuTCP13蛋白最短,編碼139個(gè)氨基酸,相對(duì)分子質(zhì)量分布區(qū)域?yàn)?8 880~53 620,等電點(diǎn)范圍是5.54(EuTCP14)~9.72(EuTCP6)。亞細(xì)胞定位預(yù)測(cè)結(jié)果顯示,EuTCPs均定位在細(xì)胞核中(表1)。
表1 杜仲TCP蛋白序列特征及亞細(xì)胞定位預(yù)測(cè)
Table 1 Amino acid sequence characteristics and predicted subcellular location of E. ulmoides TCP proteins
基因ID基因名擬南芥同源基因染色體定位CDS長(zhǎng)度/bp蛋白質(zhì)大小/aaMWPI亞細(xì)胞定位 EUC12473-RAEuTCP1AT2G37000Super-Scaffold_57 62720822 441.518.85細(xì)胞核 EUC20760-RAEuTCP2AT2G31070scaffold865_obj 78025929 028.368.48細(xì)胞核 EUC13147-RAEuTCP3AT4G18390Super-Scaffold_67131143647 303.138.82細(xì)胞核 EUC03320-RAEuTCP4AT3G27010Super-Scaffold_177 93030932 689.328.99細(xì)胞核 EUC22153-RAEuTCP5AT3G02150scaffold1183_obj102934238 298.696.90細(xì)胞核 EUC10434-RAEuTCP6AT5G23280Super-Scaffold_46 79826527 785.139.72細(xì)胞核 EUC05665-RAEuTCP7AT1G68800Super-Scaffold_28108336041 030.627.75細(xì)胞核 EUC03513-RAEuTCP8AT3G02150Super-Scaffold_174 87629132 694.719.44細(xì)胞核 EUC15623-RAEuTCP9AT1G67260scaffold1436_obj 74724827 907.408.86細(xì)胞核 EUC12970-RAEuTCP10AT3G47620Super-Scaffold_113112537440 069.247.26細(xì)胞核 EUC06461-RAEuTCP11AT1G53230scaffold166_obj 87929232 398.815.65細(xì)胞核 EUC10433-RAEuTCP12AT5G23280Super-Scaffold_46 79826527 785.139.72細(xì)胞核 EUC15622-RAEuTCP13AT1G67260scaffold1436_obj 50716918 878.146.41細(xì)胞核 EUC07713-RAEuTCP14AT3G15030Super-Scaffold_600147949253 623.465.54細(xì)胞核
二級(jí)結(jié)構(gòu)分析顯示,EuTCPs蛋白主要由α螺旋、無(wú)規(guī)則卷曲、延伸鏈和β轉(zhuǎn)角組成,順序均是由無(wú)規(guī)則卷曲>α螺旋>延伸鏈>β轉(zhuǎn)角,具體數(shù)值見(jiàn)表2。α螺旋在DNA結(jié)合基序中發(fā)揮重要作用,無(wú)規(guī)則卷曲易受側(cè)鏈相互作用,構(gòu)成活性部位和功能部位。EuTCPs蛋白三級(jí)結(jié)構(gòu)非常相似,結(jié)果如圖1所示,無(wú)規(guī)則卷曲所占比例最大,蛋白空間結(jié)構(gòu)不同,決定功能的差異。
表2 杜仲TCP基因家族二級(jí)結(jié)構(gòu)分析
Table 2 Secondary structures analysis of E. ulmoides TCP gene family
基因名最低值位點(diǎn)最高值位點(diǎn)α螺旋(占比/%)延伸鏈(占比/%)β轉(zhuǎn)角(占比/%)無(wú)規(guī)則卷曲(占比/%) EuTCP1?2.733 122.056150 37(17.79) 27(12.98)15(7.21)129(62.02) EuTCP2?2.889 361.278232 39(15.06) 43(16.60)13(5.02)164(63.32) EuTCP3?3.400 351.700 340 71(16.28) 49(11.24) 9(2.06)307(70.41) EuTCP4?3.300 132.022 135 79(25.57) 31(10.03)14(4.53)185(59.87) EuTCP5?3.1443330.811 4827(7.89)27(7.89) 0(0.00)278(81.29) EuTCP6?2.944 191.778 57 72(27.17) 42(15.85)13(4.91)138(52.08) EuTCP7?3.789 2351.722 314129(35.83)25(6.94) 9(2.50)197(54.72) EuTCP8?2.522 1271.41122928(9.62) 34(11.68) 7(2.41)222(76.29) EuTCP9?2.756 841.200 166 84(33.87) 30(12.10)10(4.03)124(50.00) EuTCP10?3.533 2251.444 54 53(14.17) 46(12.30)17(4.55)258(68.98) EuTCP11?2.978 311.167 108 61(20.89) 40(13.70)10(3.42)181(61.99) EuTCP12?2.944 191.778 57 72(27.17) 42(15.85)13(4.91)138(52.08) EuTCP13?3.056 871.022 30 55(32.54) 17(10.06) 2(1.18) 95(56.21) EuTCP14?3.800 2261.300 452 87(17.68) 59(11.99)20(4.07)326(66.26)
圖1 杜仲TCPs三級(jí)結(jié)構(gòu)預(yù)測(cè)
利用MEGA 6.0分析軟件,對(duì)14個(gè)杜仲EuTCPs,22個(gè)水稻OsTCPs[24],24個(gè)擬南芥AtTCPs[25]和19個(gè)毛竹PheTCPs[26]蛋白進(jìn)行1000次重復(fù)搜索,構(gòu)建系統(tǒng)進(jìn)化樹(shù)。結(jié)果如圖2所示,79個(gè)TCPs蛋白分為Class I和Class II 2個(gè)大亞家族,其中Class I又稱為PCF亞家族;Class II亞家族進(jìn)一步劃分為CYC/TB1和CIN亞家族。PCF亞家族所包含TCPs成員數(shù)量最多,含有40個(gè)TCPs蛋白,5個(gè)EuTCPs,13個(gè)AtTCPs,10個(gè)OsTCPs和12個(gè)PtTCPs,其次是CIN亞家族,由29個(gè)TCPs蛋白組成,CYC/TB1亞家族所含蛋白數(shù)量最少,僅包含10個(gè)TCPs蛋白,3個(gè)AtTCPs,3個(gè)EuTCPs,3個(gè)OsTCPs,1個(gè)PheTCPs。
為了分析杜仲TCP轉(zhuǎn)錄因子家族保守結(jié)構(gòu)域序列特征,利用DNAMAN7.0工具對(duì)杜仲、擬南芥和水稻TCP家族成員氨基酸序列進(jìn)行比對(duì),結(jié)果如圖3所示,杜仲TCP結(jié)構(gòu)域氨基酸分布與擬南芥和水稻十分相似,14個(gè)杜仲TCP家族成員均含有完整的非典型性bHLH結(jié)構(gòu)域,暗示杜仲TCP結(jié)構(gòu)域高度保守性。BASIC區(qū)域由19個(gè)氨基酸組成,其中有9個(gè)氨基酸是高度保守的,HLH區(qū)域含有5個(gè)高度保守的氨基酸。杜仲TCP轉(zhuǎn)錄因子家族有5個(gè)蛋白(EuTCP1、EuTCP4、EuTCP6、EuTCP10和EuTCP12)BASIC區(qū)域缺少4個(gè)氨基酸,圖2系統(tǒng)進(jìn)化樹(shù)結(jié)果顯示,他們均屬于Class I亞家族,其余蛋白均屬于Class II亞家族,這與前人研究結(jié)果相一致[2],表明杜仲TCP轉(zhuǎn)錄因子家族進(jìn)化的保守性。
為了解析基因結(jié)構(gòu)多樣性和進(jìn)化關(guān)系,利用MEME在線軟件對(duì)EuTCPs轉(zhuǎn)錄因子家族進(jìn)行基序分析。結(jié)果如圖4所示,EuTCPs轉(zhuǎn)錄因子分為3個(gè)亞家族(PCF、CYC/TB1和CIN),進(jìn)化關(guān)系與圖2結(jié)果相一致,20個(gè)保守基序,分別命名為Motif 1~Motif 20,14條EuTCPs蛋白均含有Motif 1基序,表明均屬于TCP轉(zhuǎn)錄因子家族。同一亞家族EuTCPs蛋白基序具有高度相似性,CIN亞家族均含有Motif 1和Motif 2,PCF亞家族成員均含有Motif 1和Motif 19,表明同一亞家族EuTCPs可能具有相似的功能。不同亞家族基序存在顯著差異,有些Motifs只在特定亞家族中存在,例如,Motif 3~Motif 6只存在于PCF亞家族,只有CYC/TB1亞家族含有Motif 7和Motif 9,暗示某些基序在亞家族功能特異性方面發(fā)揮重要作用。
利用MEGA 6.0的鄰接法構(gòu)建系統(tǒng)進(jìn)化樹(shù),不同物種TCPs蛋白用不同顏色標(biāo)記,藍(lán)色三角形代表擬南芥,紅色圓形代表水稻,藍(lán)綠色菱形代表毛竹,杜仲TCPs蛋白由綠色菱形標(biāo)記
結(jié)構(gòu)域名稱在序列上方標(biāo)記,黑色橫線代表該區(qū)域的范圍。黑色表示氨基酸是保守的,紅色和藍(lán)綠色表示氨基酸是相似的,無(wú)顏色表示氨基酸保守性較低。
A-利用MEGA 6.0的鄰接法構(gòu)建EuTCP基因家族系統(tǒng)進(jìn)化樹(shù) B-EuTCPs基因結(jié)構(gòu)分析 C-保守基序氨基酸分布
為了探索基因功能和表達(dá)調(diào)控模式,利用Plant CARE在線分析軟件對(duì)起始密碼子(ATG)上游2000 bp序列進(jìn)行順式作用元件分析,結(jié)果如圖5所示,啟動(dòng)子中不僅含有基本順式作用元件,還存在4種類型元件:一、激素調(diào)控元件,如赤霉素響應(yīng)元件:ABRE;生長(zhǎng)素響應(yīng)元件:AuxRR-core;水楊酸響應(yīng)元件:CGTCA-motif;二、光響應(yīng)元件,如Box 4、G-box、G-Box、GT1-motif、GATA-motif等,三、脅迫響應(yīng)元件,如干旱脅迫響應(yīng)元件:MBS,低溫響應(yīng)元件:LTR和厭氧脅迫相關(guān)元件:ARE等;四、生理響應(yīng)元件,如O2-site、CAT-box等,推測(cè)可能在杜仲生長(zhǎng)發(fā)育、脅迫響應(yīng)、激素調(diào)節(jié)以及光周期調(diào)控中發(fā)揮重要作用?;蛑泄忭憫?yīng)元件數(shù)量最多,共有135個(gè),其中G-box元件有38個(gè),含有28個(gè)Box 4元件,暗示s基因的轉(zhuǎn)錄可能受光周期調(diào)控。啟動(dòng)子區(qū)域含有44個(gè)ABRE元件和25個(gè)ARE元件(圖5-B),表明可能參與ABA調(diào)節(jié)和厭氧調(diào)控。
為了解析基因在杜仲葉片不同發(fā)育時(shí)期及膠形成中的功能,根據(jù)轉(zhuǎn)錄組數(shù)據(jù),檢測(cè)基因的表達(dá)模式。結(jié)果如圖6、7所示,不同基因在杜仲葉片不同發(fā)育時(shí)期及膠含量中表達(dá)豐度存在顯著差異,大部分基因在杜仲葉片發(fā)育時(shí)期表達(dá)豐度較低,有2個(gè)基因(和)在杜仲葉片中未檢測(cè)到,推測(cè)和在杜仲葉片中不發(fā)揮作用。基因在杜仲葉片不同發(fā)育時(shí)期表達(dá)趨勢(shì)不盡相同,暗示在杜仲葉片發(fā)育中具有不同的功能,5個(gè)基因(、、、、)在杜仲葉芽中表達(dá)量最高,4個(gè)基因(、、、)在初生葉中表達(dá)豐度最高,3個(gè)基因(和)在老葉中轉(zhuǎn)錄水平最高。
為了預(yù)測(cè)在杜仲膠形成中的功能,利用不同膠含量的轉(zhuǎn)錄組數(shù)據(jù),檢測(cè)基因的轉(zhuǎn)錄水平。結(jié)果如圖7所示,大部分在杜仲不同膠含量中表達(dá)水平較低,并且低膠含量葉片中的轉(zhuǎn)錄水平低于高膠含量葉片,例如,在高膠含量葉片中的FPKM平均值是17.25,在低膠含量葉片中為7.26,在高膠含量中的轉(zhuǎn)錄水平是24.26,在低膠中為5.05,推測(cè)在杜仲膠形成過(guò)程中發(fā)揮正調(diào)控作用。
A-每個(gè)EuTCP基因啟動(dòng)子區(qū)域順式作用元件的數(shù)目 B-順式作用元件數(shù)量和含有順式作用元件EuTCPs基因數(shù)量
T01~T03-葉芽 T04~T06-初生葉 T3-1~T3-3-幼葉 T4-1~T4-3-老葉;熱圖右側(cè)為色標(biāo),藍(lán)色表示低表達(dá)豐度,紅色表示高轉(zhuǎn)錄水平
L-1~L-3-低膠含量葉片 H-1~H-3:高膠含量葉片。熱圖上方為色標(biāo),藍(lán)色表示低轉(zhuǎn)錄水平,紅色表示高轉(zhuǎn)錄水平
表達(dá)模式結(jié)果顯示,在杜仲葉片不同發(fā)育階段和膠含量中表達(dá)量均較高,特別在初生葉中,F(xiàn)PKM值為111,暗示在杜仲葉片發(fā)育和膠形成過(guò)程中發(fā)揮重要作用。為了檢測(cè)EuTCP3與其他蛋白的互作關(guān)系,利用STRING數(shù)據(jù)庫(kù),預(yù)測(cè)EuTCP3的互作蛋白。結(jié)果如圖8所示,EuTCP3可以與10個(gè)蛋白發(fā)生相互作用,其中7個(gè)屬于EuTCP基因家族,參與種子萌發(fā)、生物鐘調(diào)節(jié)、細(xì)胞周期以及蛋白轉(zhuǎn)錄調(diào)控。MYB-like轉(zhuǎn)錄因子,在發(fā)育種子的原花青素積累中發(fā)揮關(guān)鍵的決定性作用,LOB轉(zhuǎn)錄因子AS2,是葉片正面細(xì)胞增殖負(fù)調(diào)控因子,調(diào)節(jié)葉片對(duì)稱層的形成和脈絡(luò)的建立,AN1-like(SAP11)鋅指蛋白,參與植物非生物脅迫響應(yīng)[27],推測(cè)EuTCP3可能與其他蛋白相互作用共同參與杜仲葉片生長(zhǎng)發(fā)育以及脅迫響應(yīng)。
利用Cytoscape 3.7.0軟件,構(gòu)建EuTCP轉(zhuǎn)錄因子家族共表達(dá)調(diào)控網(wǎng)絡(luò)。結(jié)果如圖9所示,調(diào)控網(wǎng)絡(luò)中共有11個(gè)節(jié)點(diǎn)(代表EuTCPs蛋白)和35條邊(代表蛋白質(zhì)之間的相互作用),表明14個(gè)EuTCPs中有11個(gè)蛋白存在互作關(guān)系,其中EuTCP3、EuTCP5和EuTCP8蛋白互作數(shù)量最多,均與8個(gè)EuTCPs蛋白存在互作關(guān)系,暗示EuTCP3、EuTCP5、EuTCP8可能處于EuTCP基因家族核心位置,EuTCP1、EuTCP10、EuTCP11和EuTCP14與7個(gè)EuTCPs蛋白互作,EuTCP4和EuTCP6預(yù)測(cè)與5個(gè)EuTCPs蛋白互作,EuTCP7與4個(gè)EuTCPs蛋白互作,EuTCP9與2個(gè)EuTCPs蛋白發(fā)生互作關(guān)系。
圖8 EuTCP3蛋白互作網(wǎng)絡(luò)
杜仲是絞木目(Garryales)杜仲科(Eucommiaceae)杜仲屬L.中唯一現(xiàn)存的一個(gè)種,是我國(guó)主要天然橡膠樹(shù)種,也是重要的木本油料和名貴中藥材[28],主要分布于我國(guó)的陜西、湖南、貴州、云南、四川、江西等地區(qū)[29]。TCP蛋白是植物特有的參與生長(zhǎng)發(fā)育、非生物脅迫、葉片衰老、側(cè)枝形成、花粉發(fā)育等多種生物學(xué)過(guò)程的一類轉(zhuǎn)錄因子[13, 30]。目前為止,TCP基因家族已在多個(gè)物種中進(jìn)行了報(bào)道,擬南芥中有24個(gè)AtTCPs[25],水稻含有22個(gè)OsTCPs[24],玉米中存在29個(gè)ZmTCPs成員[31],棉花中包含38個(gè)GrTCPs[32],番茄中有30個(gè)SlTCPs[33],黃瓜中存在22個(gè)CsTCPs[34],柑橘中含有20個(gè)CsTCPs[35],西瓜中有27個(gè)ClTCPs[36],葡萄中包含18個(gè)VvTCPs[37],蘋(píng)果中52個(gè)MdTCPs[38],菠蘿中有9個(gè)[39]、毛竹中存在19個(gè)PheTCPs[26]等。本研究以杜仲基因組數(shù)據(jù)為基礎(chǔ),利用生物信息學(xué)方法,從杜仲基因組中共鑒定到14個(gè)基因,分為3個(gè)亞家族,這與前人研究結(jié)果相一致。PCF亞家族包含5個(gè)EuTCPs蛋白,CYC/TB1亞家族含有3個(gè),6個(gè)EuTCPs蛋白屬于CIN亞家族。序列比對(duì)結(jié)果顯示,14個(gè)EuTCPs與擬南芥、水稻TCP蛋白結(jié)構(gòu)域具有高度的相似性,N末端均含有非典型的basic-helix-loop-helix結(jié)構(gòu)域(圖3),基序分析發(fā)現(xiàn),Motif 1基序存在于所有EuTCPs轉(zhuǎn)錄因子(圖4),表明他們均屬于TCP轉(zhuǎn)錄因子家族,在基因進(jìn)化過(guò)程中具有較保守性。根據(jù)保守結(jié)構(gòu)域是否含有四種氨基酸殘基,將TCP基因家族分為2個(gè)亞家族,Class I亞家族保守結(jié)構(gòu)域含有16個(gè)氨基酸殘基,Class II亞家族TCP結(jié)構(gòu)域包含20個(gè)氨基酸,保守結(jié)構(gòu)域外含有促進(jìn)蛋白質(zhì)相互作用的精氨酸富集R結(jié)構(gòu)域[1],EuTCP3、EuTCP5、EuTCP7和EuTCP9均含有motif 8(R結(jié)構(gòu)域),與AtTCPs、OsTCPs[24]、BpTCPs[40]、VvTCPs[37]、PmTCPs[41]和FvTCPs[42]等具有相似性,推測(cè)EuTCP3、EuTCP5、EuTCP7和EuTCP9可能具有相似的功能。
圖9 EuTCP基因家族蛋白互作預(yù)測(cè)
聚類分析結(jié)果顯示,與聚為同一分支,參與調(diào)節(jié)擬南芥細(xì)胞擴(kuò)張、分裂和分化,在硝酸鹽誘導(dǎo)的系統(tǒng)信號(hào)通路中發(fā)揮重要作用[43],菊花為的同源基因,超表達(dá)增加轉(zhuǎn)基因菊花和擬南芥的側(cè)根數(shù)量和長(zhǎng)度[44]。是的同源基因,主要在胚胎維管組織中表達(dá),促進(jìn)幼嫩節(jié)間細(xì)胞增殖,抑制葉片細(xì)胞擴(kuò)增,突變體提高種子萌發(fā)對(duì)外源脫落酸和多效唑的敏感性,參與激活擬南芥胚胎生長(zhǎng)[45],異源轉(zhuǎn)化擬南芥導(dǎo)致細(xì)胞周期相關(guān)基因下調(diào)表達(dá),抑制器官大小,葉綠素和類胡蘿卜素含量升高,延長(zhǎng)花期,延緩葉片衰老[46]。和聚為同一分支的、、、和均在擬南芥幼嫩葉片中表達(dá),與野生型相比,突變體增加葉片面積,四重突變體和五重突變體蓮座葉數(shù)目減少,葉片增大[47]。為的同源基因,在幼苗子葉中表達(dá),激活和的光響應(yīng)表達(dá),通過(guò)光敏色素相互作用因子(PIFs)調(diào)節(jié)與、和啟動(dòng)子的結(jié)合,黑暗條件下抑制與上述啟動(dòng)子的結(jié)合[48]。與(CO)啟動(dòng)子結(jié)合,黃昏前后誘導(dǎo)基因表達(dá),與細(xì)胞核中另一個(gè)開(kāi)花調(diào)節(jié)因子A()結(jié)合,誘導(dǎo)以依賴方式表達(dá),調(diào)節(jié)發(fā)育和開(kāi)花調(diào)控[49]。與互為同源基因,超表達(dá)導(dǎo)致轉(zhuǎn)基因擬南芥在光依賴條件下下胚軸矮小,特別是藍(lán)光條件下,與隱花色素蛋白(CRY1)互作,正調(diào)控和基因表達(dá)[50]。與親緣關(guān)系最近,在陰暗條件下顯著積累,及其同源基因和通過(guò)PIF依賴和獨(dú)立途徑誘導(dǎo)生長(zhǎng)素生物合成,在介導(dǎo)陰暗誘導(dǎo)下胚軸伸長(zhǎng)中發(fā)揮重要作用。白光下,三重突變體()表現(xiàn)出下胚軸缺陷;陰暗條件顯著降低下胚軸伸長(zhǎng),與和的啟動(dòng)子結(jié)合,誘導(dǎo)生長(zhǎng)素表達(dá)[51],推測(cè)EuTCPs轉(zhuǎn)錄因子在杜仲生長(zhǎng)發(fā)育、激素調(diào)節(jié)和開(kāi)花調(diào)控中發(fā)揮重要作用。
綜上所述,本研究以杜仲全基因組數(shù)據(jù)為背景,對(duì)杜仲TCP轉(zhuǎn)錄因子家族進(jìn)行了全面的生物信息學(xué)分析,共鑒定出14個(gè),分為Class I與Class II 2大類,進(jìn)一步劃分為3個(gè)亞家族(PCF、CYC/TB1和CIN)。理化性質(zhì)分析顯示,EuTCPs編碼139~492個(gè)氨基酸,PI分布于5.54~9.72,w區(qū)域?yàn)?8 880~53 620,亞細(xì)胞定位于細(xì)胞核中,均為親水性蛋白,二級(jí)結(jié)構(gòu)以α-螺旋和無(wú)規(guī)則卷曲為主,均含非典型bHLH保守結(jié)構(gòu)域。表達(dá)模式分析顯示,EuTCPs基因家族在杜仲葉片發(fā)育中具有不同的表達(dá)模式,在高膠含量中的轉(zhuǎn)錄水平高于低膠含量,推測(cè)在杜仲膠形成中發(fā)揮正向調(diào)控作用,本研究為深入探索基因功能奠定理論基礎(chǔ)。
利益沖突 所有作者均聲明不存在利益沖突
[1] Cubas P, Lauter N, Doebley J,. The TCP domain: A motif found in proteins regulating plant growth and development [J]., 1999, 18(2): 215-222.
[2] Martín-Trillo M, Cubas P. TCP genes: A family snapshot ten years later [J]., 2010, 15(1): 31-39.
[3] Takeda T, Suwa Y, Suzuki M,. The OsTB1 gene negatively regulates lateral branching in rice [J]., 2003, 33(3): 513-520.
[4] Maurya J P, Singh R K, Miskolczi P C,. Branching regulator BRC1 mediates photoperiodic control of seasonal growth in hybrid aspen [J]., 2020, 30(1): 122-126.
[5] Wang M, le Moigne M A, Bertheloot J,. BRANCHED1: A key hub of shoot branching [J]., 2019, 10: 76.
[6] Yang X, Zhao X G, Li C Q,. Distinct regulatory changes underlying differential expression of teosinte branched1-cycloidea-proliferating cell factor genes associated with petal variations in zygomorphic flowers ofspp. of the family Gesneriaceae [J]., 2015, 169(3): 2138-2151.
[7] Guan P Z, Ripoll J J, Wang R H,. Interacting TCP and NLP transcription factors control plant responses to nitrate availability [J]., 2017, 114(9): 2419-2424.
[8] Finlayson S A.Teosinte Branched1-like 1 regulates axillary bud outgrowth and is homologous to monocot Teosinte Branched1 [J]., 2007, 48(5): 667-677.
[9] Danisman S, van der Wal F, Dhondt S,.class I and class II TCP transcription factors regulate jasmonic acid metabolism and leaf development antagonistically [J]., 2012, 159(4): 1511-1523.
[10] Rubio-Somoza I, Weigel D. Coordination of flower maturation by a regulatory circuit of three microRNAs [J]., 2013, 9(3): e1003374.
[11] Challa K R, Aggarwal P, Nath U. Activation of YUCCA5 by the transcription factor TCP4 integrates developmental and environmental signals to promote hypocotyl elongation in[J]., 2016, 28(9): 2117-2130.
[12] Rueda-Romero P, Barrero-Sicilia C, Gómez-Cadenas A,.DOF6negatively affects germination in non-after-ripened seeds and interacts with TCP14 [J]., 2012, 63(5): 1937-1949.
[13] Liu H L, Gao Y M, Wu M,. TCP10, a TCP transcription factor in moso bamboo (), confers drought tolerance to transgenic plants [J]., 2020, 172: 104002.
[14] Almeida D M, Gregorio G B, Oliveira M M,. Five novel transcription factors as potential regulators of OsNHX1 gene expression in a salt tolerant rice genotype [J]., 2017, 93(1/2): 61-77.
[15] Wang S T, Sun X L, Hoshino Y,. microRNA319 positively regulates cold tolerance by targeting OsPCF6and OsTCP21 in rice (L.) [J]., 2014, 9(3): e91357.
[16] Mukhopadhyay P, Tyagi A K. Erratum: OsTCP19 influences developmental and abiotic stress signaling by modulating ABI4-mediated pathways [J]., 2015, 5: 12381.
[17] 杜紅巖. 中國(guó)杜仲圖志 [M]. 北京: 中國(guó)林業(yè)出版社, 2014: 23.
[18] 劉建斌. 杜仲種子的化學(xué)成分研究 [D]. 西安: 西北大學(xué), 2006.
[19] Wuyun T N, Wang L, Liu H M,. The hardy rubber tree genome provides insights into the evolution of polyisoprene biosynthesis [J]., 2018, 11(3): 429-442.
[20] Tamura K, Stecher G, Peterson D,. MEGA6: molecular evolutionary genetics analysis version 6.0 [J]., 2013, 30(12): 2725-2729.
[21] Li L, Liu M H, Shi K,. Dynamic changes in metabolite accumulation and the transcriptome during leaf growth and development in[J]., 2019, 20(16): 4030.
[22] Ye J, Han W J, Fan R S,. Integration of transcriptomes, small RNAs, and degradome sequencing to identify putative miRNAs and their targets related to Eu-rubber biosynthesis in[J]., 2019, 10(8): 623.
[23] Liu J, Cheng Z C, Li X Y,. Expression analysis and regulation network identification of the-like gene family in moso bamboo () under photoperiod treatments [J]., 2019, 38(7): 607-626.
[24] Yao X, Ma H, Wang J,. Genome-wide comparative analysis and expression pattern ofgene families inand[J]., 2007, 49(6): 885-897.
[25] Cubas P.[M] // CRC Press:: 2002: 247-266.
[26] 劉俊, 黃容, 程占超, 等. 毛竹TCP基因家族全基因組鑒定與分析 [J]. 基因組學(xué)與應(yīng)用生物學(xué), 2018, 37(12): 5388-5397.
[27] Giri J, Vij S, Dansana P K,. Rice A20/AN1zinc-finger containing stress-associated proteins (SAP1/11) and a receptor-like cytoplasmic kinase (OsRLCK253) interact via A20 zinc-finger and confer abiotic stress tolerance in transgenicplants [J]., 2011, 191(3): 721-732.
[28] Wang L, Jing T, Li T Z,. Identification and expression analysis of thefarnesyl diphosphate synthase gene family to reveal the key gene involved in rubber biosynthesis [J]., 2017, 40(1): 1-5.
[29] 張榮榮. 土壤干旱下杜仲截干苗生長(zhǎng)和光合生理響應(yīng)及引種栽培研究 [D]. 太原: 山西農(nóng)業(yè)大學(xué), 2016.
[30] Manassero N G, Viola I L, Welchen E,. TCP transcription factors: Architectures of plant form [J]., 2013, 4(2): 111-127.
[31] Chai W B, Jiang P F, Huang G Y,. Identification and expression profiling analysis of TCP family genes involved in growth and development in maize [J]., 2017, 23(4): 779-791.
[32] Ma J, Wang Q L, Sun R R,. Genome-wide identification and expression analysis of TCP transcription factors in[J]., 2014, 4: 6645.
[33] Parapunova V, Busscher M, Busscher-Lange J,. Identification, cloning and characterization of the tomato TCP transcription factor family [J]., 2014, 14: 157.
[34] 袁偉, 顧掌根, 褚偉雄, 等. 黃瓜轉(zhuǎn)錄因子TCP基因家族的鑒定及結(jié)構(gòu)分析 [J]. 分子植物育種, 2014, 12(2): 287-295.
[35] 周延培, 張雅劍, 伊華林. 柑橘TCP家族生物信息學(xué)及表達(dá)譜分析 [J]. 果樹(shù)學(xué)報(bào), 2016, 33(5): 513-522.
[36] Shi P B, Guy K M, Wu W F,. Genome-wide identification and expression analysis of the ClTCP transcription factors in[J]., 2016, 16: 85.
[37] Leng X P, Wei H R, Xu X Z,. Genome-wide identification and transcript analysis of TCP transcription factors in grapevine [J]., 2019, 20(1): 786.
[38] 張士剛. 蘋(píng)果TCP轉(zhuǎn)錄因子家族生物信息學(xué)分析 [J]. 山東農(nóng)業(yè)科學(xué), 2014, 46(5): 12-17.
[39] 阮城城, 胡福初, 羅志文, 等. 菠蘿TCP基因家族的鑒定及成花誘導(dǎo)階段的表達(dá)譜分析 [J]. 果樹(shù)學(xué)報(bào), 2020, 37(11): 1623-1635.
[40] Zhao M L, Peng X J, Chen N Z,. Genome-wide identification of thegene family inand functional analysis of BpTCP8, 14 and 19 in shoot branching [J].(), 2020, 9(10): 1301.
[41] Zhou Y Z, Xu Z D, Zhao K,. Genome-wide identification, characterization and expression analysis of thegene family in[J]., 2016, 7: 1301.
[42] Wei W, Hu Y, Cui M Y,. Identification and transcript analysis of the TCP transcription factors in the diploid woodland strawberry[J]., 2016, 7: 1937.
[43] Guan P Z, Wang R C, Nacry P,. Nitrate foraging byroots is mediated by the transcription factor TCP20 through the systemic signaling pathway [J]., 2014, 111(42): 15267-15272.
[44] Fan H M, Sun C H, Wen L Z,. CmTCP20 plays a key role in nitrate and auxin signaling-regulated lateral root development in[J]., 2019, 60(7): 1581-1594.
[45] Tatematsu K, Nakabayashi K, Kamiya Y,. Transcription factor AtTCP14 regulates embryonic growth potential during seed germination in[J]., 2008, 53(1): 42-52.
[46] Zhang T, Qu Y X, Wang H B,. The heterologous expression of aTCP-P transcription factor CmTCP14 suppresses organ size and delays senescence in[J]., 2017, 115: 239-248.
[47] Aguilar-Martínez J A, Sinha N. Analysis of the role ofclass I TCP genes AtTCP7, AtTCP8, AtTCP22, and AtTCP23 in leaf development [J]., 2013, 4: 406.
[48] Dong J, Sun N, Yang J,. The transcription factors TCP4 and PIF3 antagonistically regulate organ-specific light induction of SAUR genes to modulateopening during de-etiolation in[J]., 2019, 31(5): 1155-1170.
[49] Kubota A, Ito S, Shim J S,. TCP4-dependent induction of constans transcription requiresin photoperiodic flowering in[J]., 2017, 13(6): e1006856.
[50] He Z M, Zhao X Y, Kong F N,. TCP2 positively regulates HY5/HYH and photomorphogenesis in[J]., 2016, 67(3): 775-785.
[51] Zhou Y, Zhang D Z, An J X,. TCP transcription factors regulate shade avoidance via directly mediating the expression of boths and auxin biosynthetic denes [J]., 2018, 176(2): 1850-1861.
Identification and bioinformatics analysis of TCP family genes in
LIU Jun1, 3, 4, LI Long2,WU Yao-song1, LIU Yan1, REN Shan-shan1, CHEN Yu-long1
1. Henan key Laboratory of TCM Prescription and Syndrome Signaling, Academy of Chinese Medicine, Henan University of Chinese Medicine, Zhengzhou 450046, China 2. College of Forestry, Northwest Agriculture and Forestry University, Yangling 712100, China 3. International Center for Bamboo and Rattan, Key Open Laboratory of Bamboo and Rattan Science and Technology, China National Forestry and Grassland Administration, Beijing 100102, China 4. Anhui Taiping Experimental Station of International Center for Bamboo and Rattan, Huangshan 245716, China
To screen and analyze TCP (Teosinte branched 1/Cycloidea/Proliferating) gene family of, so as to lay a foundation for further study ofgene function research.Based ongenome database, the physicochemical properties, phylogeny, gene structure, promoter-acting elements and their expression levels in the leaf development and eu-rubber formation of the TCP gene family were analyzed by bioinformatics system.A total of 14were identified fromgenome, EuTCPs encoded 139—492 amino acids, and theoretical isoelectric points distribution were 5.54—9.72, molecular weight was between 18 880 to 53 620 by physicochemical analysis, all of EuTCPsproteins were hydrophilic proteins and expressed in nucleus. EuTCP gene family was divided into three subfamilies: PCF, CIN and CYC/TB1, which contained five, six and three EuTCPs proteins, respectively. Expression pattern analysis showed thatwere significantly different at different developmental stages ofleaves, and the expression levels ofwere different at each developmental stage.positively regulated the formation of eu-rubber.There are 14 members of TCP family identified in, and their molecular characteristics and tissue expression specificity are different, which may be involved in the development of leaves and eu-rubber formation.
Oliver; TCP gene family; subcellular location; phylogeny evolution; expression analysis
R286.12
A
0253 - 2670(2022)18 - 5813 - 12
10.7501/j.issn.0253-2670.2022.18.024
2022-01-09
河南省高等學(xué)校重點(diǎn)科研項(xiàng)目(22A360005);國(guó)家林業(yè)和草原局/北京市共建竹藤科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金(ICBR-2020-05);國(guó)際竹藤中心安徽太平試驗(yàn)中心開(kāi)放課題基金(1632021006-4);河南中醫(yī)藥大學(xué)博士科研基金資助項(xiàng)目(RSBSJJ2019-04)
劉 ?。?990—),女,助理研究員,博士,主要從事藥用植物分子生物學(xué)研究。E-mail: liujun_0325@163.com
陳玉龍,男,教授,博士,主要從事中醫(yī)藥防治炎癥與免疫。E-mail: cyl72621@163.com
[責(zé)任編輯 時(shí)圣明]