摘要: 為了揭示玉米CDC48基因功能和機制, 采用生物信息學方法在玉米基因組水平鑒定CDC48基因家族成員, 并運用實時熒光定量聚合酶鏈式反應(yīng)方法分析家族基因逆境和組織表達模式。 結(jié)果表明: 在全基因組水平篩選鑒定出14個ZmCDC48基因; 染色體定位分析顯示ZmCDC48基因家族成員不均勻地分布在9條染色體上; 系統(tǒng)進化分析將14個ZmCDC48基因分為3組進化分支, 各組內(nèi)基因結(jié)構(gòu)和蛋白序列保守, 但各組間差異較大, 可能存在功能差異; 種內(nèi)和種間共線性分析結(jié)果顯示ZmCDC48基因共有7個重復(fù)事件, 與水稻Oryza sativa的OsCDC48有12個同源基因?qū)Γ?與擬南芥Arabidopsis thaliana的AtCDC48無同源基因?qū)?;順式作用元件、組織和逆境表達模式分析顯示ZmCDC48基因可能參與玉米生長發(fā)育和逆境響應(yīng)過程;互作蛋白預(yù)測的結(jié)果顯示ZmCDC48蛋白可能通過與核蛋白定位蛋白4(NPL4)家族、 泛素融合降解(UFD1)家族、 含泛素調(diào)節(jié)X(UBX)結(jié)構(gòu)域蛋白、 卵巢腫瘤(OTU)樣蛋白等互作,參與玉米生長發(fā)育、 蛋白質(zhì)降解和免疫過程。
關(guān)鍵詞: 玉米; 基因家族; 生物信息學; 表達分析
中圖分類號: Q945.78
文獻標志碼: A
開放科學識別碼(OSID碼):
Genome-wide Identification and Expression
Analysis of CDC48 Gene Family in Maize
GAO Xiaomei, LI Yanrong, TIAN Xiao, PEI Laming
(School of Biological Science and Technology, University of Jinan, Jinan 250022, Shandong, China)
Abstract: To reveal the function and mechanism of ZmCDC48 gene in maize,bioinformaticsmethodswereusedtoidentify CDC48 gene family members at the genome level of maize, and real-time fluorescence quantitative polymerase chain reaction was used to analyze the expression patterns of family genesresponsetostressesandtissue-specific.Theresults show that 14 ZmCDC48 genes are screened and identified at the genome-wide level. Chromosome mapping analysis shows that members of the ZmCDC48 gene familyareunevenlydistributedacross9chromosomes.Phylogeneticanalysisdivides 14 ZmCDC48 genes into 3 groups, with conserved gene structure and protein sequences within each group, but there are large differences between groups, suggesting that there may be functional differences. Intraspecific collinearity analysis suggests 12 ZmCDC48 duplicated gene pairs in maize. Maize has 12 orthologous gene pairs with Oryza sativa, and maize and Arabidopsis thaliana have no orthologous gene pairs, respectively. Analysis of cis-acting elements, tissues and stress expression patterns shows that ZmCDC48 gene may be involved in maize growth and stress response processes. The interactive protein prediction suggests that ZmCDC48 protein may participate in maize growth and development, protein degradation, and immune processes by interacting with nuclear protein localizationprotein4(NPL4)familyproteins,ubiquitin fusion degradation (UFD1) family proteins, ubiquitin regulatoryX-containing(UBX-containing)domainproteins,ovarian tumor-like (OTU-like) proteins, etc.
Keywords: maize; gene family; bioinformatics; expression analysis
CDC48(cell division cycle 48)基因最初是在釀酒酵母的溫度敏感細胞分裂周期突變體中分離得到的[1],其產(chǎn)物CDC48蛋白是真核生物中細胞周期調(diào)控研究比較成熟的一類蛋白。酵母CDC48是與多種細胞活性相關(guān)的ATPases(ATPase associated with various cellular activities,AAA+)超家族成員之一[2],其哺乳動物同源蛋白稱為p97[3],又名含纈氨酸蛋白質(zhì)(VCP)。從結(jié)構(gòu)上看,CDC48蛋白活性形式是一種具有中心通道的桶形六聚體復(fù)合物,利用三磷酸苷腺(ATP)水解的能量在其相關(guān)輔因子幫助下重塑底物蛋白[4]。典型的CDC48蛋白含有3個保守結(jié)構(gòu)域與1個保守基序:2個相鄰的ATPase結(jié)構(gòu)域D1和D2,一個氮末端的調(diào)節(jié)結(jié)構(gòu)域和一個位于碳末端尾部的HbYX(Hb為疏水酪氨酸,X為可變殘基)基序[5-6]。
1995年Feiler等[7]首次在植物擬南芥Arabidopsis thaliana中鑒定到AtCDC48基因, 可以功能互補酵母cdc48基因突變體, 表明高等植物的CDC48基因可在細胞分裂和生長過程中發(fā)揮作用。 基于前人的研究成果[8-9], 結(jié)合推導(dǎo)出的AtCDC48A基因氨基酸序列, 通過生物大分子序列比對搜索工具(BLAST)在美國國家生物技術(shù)信息中心(NCBI)數(shù)據(jù)庫中搜索同一性較高的同源基因, 最終確定并重命名了5個AtCDC48基因, 即AtCDC48A(AT3G09840)、 AtCDC48B(AT2G03670)、 AtCDC48C(AT5G03340)、 AtCDC48D(AT3G53230)、 AtCDC48E(AT3G01610)。擬南芥AtCDC48A T-DNA插入突變體導(dǎo)致細胞擴張缺陷, 種子發(fā)育停滯及幼苗致死性[10]。 在擬南芥中, AtCDC48E基因突變體與野生型相比, 表型存在差異, 表明該基因可能是植物正常生長和發(fā)育所必需的[8]。此外,AtCDC48B、 AtCDC48C、 AtCDC48D基因突變體表現(xiàn)為與野生型擬南芥無明顯差異的表型[8],表明擬南芥AtCDC48各同源基因可能在植株生長發(fā)育過程中發(fā)揮不同的功能。
CDC48基因在不同物種中被陸續(xù)鑒定, 如擬南芥、 煙草Nicotiana tabacum和水稻Oryza sativa等[8,11-12]。 目前, 對植物CDC48基因的功能研究主要集中在植物發(fā)育過程與細胞周期調(diào)控過程, 在擬南芥中的研究報道較多, 在煙草和水稻中也有部分研究。Rancour等[13]強調(diào)了AtCDC48A基因介導(dǎo)擬南芥細胞分裂過程中在膜融合途徑的作用。Yang等[9]通過對atcdc48b基因突變體的研究揭示了其在調(diào)節(jié)根周細胞分裂中的關(guān)鍵作用。在煙草中, 敲除NgCDC48基因能夠?qū)е聽I養(yǎng)和生殖器官的異常發(fā)育和早期停滯[12]。Shi等[14]發(fā)現(xiàn)OsCDC48基因與其同源基因OsCDC48E相互作用以控制水稻中的植物存活, OsCDC48E基因敲除植物表現(xiàn)出過早衰老和植株死亡現(xiàn)象, 去除OsCDC48的碳末端導(dǎo)致細胞周期相關(guān)基因的表達改變, 從而改變G1和G2/M期細胞的比例, 并且發(fā)現(xiàn)過表達OSCDC48可以促進水稻分蘗和糧食產(chǎn)量的增加。 CDC48基因在泛素-蛋白酶體系統(tǒng)(UPS)降解途徑中也發(fā)揮著重要的作用。 AtCDC48A蛋白通過與AtSERK1受體蛋白相互作用,去除泛素化的錯誤折疊蛋白來促進內(nèi)質(zhì)網(wǎng)中受體的正確折疊,并通過UPS途徑將錯誤折疊的蛋白質(zhì)降解[15]。Gallois等[16]證實AtPUX7通過泛素調(diào)節(jié)X(UBX)和泛素相關(guān)結(jié)構(gòu)域(UBA)連接AtCDC48A蛋白與泛素間的作用。在花粉營養(yǎng)細胞中,AtCDC48A蛋白在體外與泛素融合降解(UFD1)蛋白-核蛋白定位蛋白4(NPL4)發(fā)生互作,并且質(zhì)譜還捕獲26S和20S蛋白酶體亞基為AtCDC48A蛋白伴侶[17]。同時,對煙草中內(nèi)源性NtCDC48蛋白的伴侶研究發(fā)現(xiàn),26S蛋白酶體調(diào)節(jié)亞基蛋白、 泛素、 管腔結(jié)合蛋白BiP4和Bip5等一些UPS途徑中的參與者均與NtCDC48蛋白相互作用[18]。此外,CDC48基因也參與植物的免疫過程。在被油菜花葉病毒(ORMV)感染的擬南芥幼苗中,AtCDC48B(At3g53230)介導(dǎo)運動蛋白(MP)從內(nèi)質(zhì)網(wǎng)到細胞質(zhì)的靶向和反向易位而降解[19]。最近,Raja等[20]研究表明,CDC48B基因的激活有助于提高水稻受干旱和鹽堿脅迫時的耐受性,表明CDC48B基因可能參與水稻響應(yīng)非生物脅迫的過程。
玉米是我國第一大糧食作物,生產(chǎn)潛力大,經(jīng)濟效益高; 但是其產(chǎn)量和品質(zhì)長期受非生物逆境脅迫的不利影響,因此探究逆境相關(guān)基因的功能對提高玉米抗逆性具有重要意義。目前對玉米CDC48基因家族的研究尚未見報道。本文中對玉米CDC48基因家族成員進行基因組水平鑒定,并分析該基因家族的生物信息學、組織特異性表達和非生物脅迫表達模式,為后續(xù)闡明ZmCDC48基因功能提供理論依據(jù)。
1 材料與方法
1.1 CDC48基因家族成員基因組數(shù)據(jù)獲取
玉米CDC48基因家族成員的基因組、 編碼序列(CDS)和氨基酸序列數(shù)據(jù)均來源于MaizeGDB數(shù)據(jù)庫(https://maizegdb.org)[21]。擬南芥CDC48基因家族成員相關(guān)數(shù)據(jù)均來源于擬南芥信息資源(TAIR,https://www.arabidopsis.org)[22]。水稻CDC48基因家族成員相關(guān)數(shù)據(jù)均來源于植物比較基因組學Phytozome數(shù)據(jù)庫(https://phytozome.jgi.doe.gov/pz/portal.html)[23]。
1.2 CDC48基因家族成員鑒定與分析
首先,根據(jù)玉米CDC48基因的蛋白質(zhì)家族數(shù)據(jù)庫(Pfam)編號PF00004,通過蛋白質(zhì)BLAST[24]序列比對在NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov)和Phytozome網(wǎng)站上搜索玉米CDC48基因家族的候選蛋白序列,將置信度E值小于或等于10-5的序列確定為最初的候選蛋白;然后,利用NCBI的批量保守結(jié)構(gòu)域搜索(Batch CD-Search)工具和InterPro數(shù)據(jù)庫(https://www.ebi.ac.uk/interpro)[25]分析候選蛋白序列的結(jié)構(gòu)域,將包含CDC48基因特有結(jié)構(gòu)域的序列確定為最終的候選蛋白,以此鑒定出CDC48家族基因成員。水稻、 擬南芥的CDC48基因家族成員也用此方法獲取。
采用ExPASy網(wǎng)站預(yù)測ZmCDC48蛋白基本理化性質(zhì)。 利用Plant-mPLoc Server網(wǎng)站(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)[26]預(yù)測亞細胞定位。 使用蛋白跨膜結(jié)構(gòu)域預(yù)測TMHMM-2.0網(wǎng)站(https://services.healthtech.dtu.dk/services/TMHMM-2.0/)預(yù)測跨膜結(jié)構(gòu)域。
1.3 CDC48s基因家族系統(tǒng)進化分析
利用MEGA X軟件[27]的最大似然法(maximum likelihood,ML)構(gòu)建ZmCDC48、 OsCDC48、 AtCDC48蛋白家族的系統(tǒng)進化樹。其中,自展值Bootstrap設(shè)定為1 000,位點覆蓋截止值(site coverage cutoff)設(shè)定為95%。利用TBtools軟件[28]進行優(yōu)化。在分析植物的基因家族系統(tǒng)進化時,通常情況下進化樹的節(jié)點可信度大于50%時就可以被認為是可信的。
1.4 玉米ZmCDC48基因家族基因結(jié)構(gòu)分析
利用從Phytozome數(shù)據(jù)庫獲取的ZmCDC48基因家族成員的基因結(jié)構(gòu)(內(nèi)含子、 外顯子)信息,利用基因結(jié)構(gòu)可視化(GSDS)網(wǎng)站[29]進行可視化分析。
1.5 CDC48基因家族的蛋白質(zhì)保守基序與結(jié)構(gòu)域分析
1)保守基序(motif)分析。保守基序分析網(wǎng)站MEME(https://meme-suite.org/meme/tools/meme)[30]上傳氨基酸序列,分析CDC48基因家族的蛋白質(zhì)保守基序,保守基序個數(shù)設(shè)置為10。再利用TBtools軟件對xml文件進行可視化分析。
2)結(jié)構(gòu)域(domain)分析。 首先, 在NCBI的批量保守結(jié)構(gòu)域搜索程序中輸入玉米、 擬南芥、 水稻的CDC48蛋白的氨基酸序列; 然后,鑒定蛋白所含有的保守結(jié)構(gòu)域; 最后,用TBtools軟件進行可視化分析。
1.6 ZmCDC48家族成員染色體定位分析
利用TBtools軟件提取所有家族成員在染色體上的基因信息以及染色體基因密度信息,通過該軟件中的染色體定位進行可視化分析,標示每個基因在染色體上面的位置,得到各個基因在染色體上的分布。
1.7 CDC48基因家族成員共線性分析
為了分析CDC48基因家族成員的重復(fù)關(guān)系,從植物基因組數(shù)據(jù)庫Ensembl Plants(https://plants.ensembl.org/index.html)[31]中下載玉米、 擬南芥、 水稻的全基因組序列以及基因組注釋信息。
通過TBtools軟件中的共線性分析Advanced Circos程序分析玉米ZmCDC48基因家族成員物種內(nèi)的共線性, 通過TBtools軟件中的多物種共線性工具Multiple Synteny Plot程序分別分析玉米ZmCDC48基因家族成員與其他物種(擬南芥、 水稻)間的共線性。
1.8 ZmCDC48基因家族選擇壓力分析
從上述玉米物種內(nèi)共線性分析結(jié)果中選擇具有共線性的基因?qū)Γㄟ^TBtools軟件中相關(guān)程序計算非同義替換率Ka與同義替換率Ks之比來判斷是否有選擇壓力作用于重復(fù)基因。
1.9 玉米ZmCDC48基因家族啟動子中順式作用元件分析
在Phytozome數(shù)據(jù)庫獲取ZmCDC48基因家族各成員起始密碼子上游序列長度為2 000 bp的脫氧核苷酸的啟動子序列,使用植物順式作用調(diào)節(jié)元件數(shù)據(jù)庫PlantCARE(https://bioinformatics.psb.ugent.be/webtools/plantcare/html/)[32]預(yù)測和分析順式作用元件,并利用TBtools軟件進行可視化。
1.10 玉米ZmCDC48-03基因互作蛋白預(yù)測分析
在功能性蛋白質(zhì)關(guān)聯(lián)網(wǎng)絡(luò)STRING(https://cn.string-db.org)[33]網(wǎng)站分析預(yù)測ZmCDC48-03基因互作蛋白,并輸出ZmCDC48-03蛋白互作網(wǎng)絡(luò)圖。
1.11 ZmCDC48-03、 ZmCDC48-05、 ZmCDC48-11基因組織表達模式分析
為了鑒定玉米ZmCDC48基因在不同組織的表達,收集成熟玉米的根、 莖、 葉,授粉后7、 15、 20、 25 d的籽粒樣品。提取上述樣品核糖核酸(RNA),反轉(zhuǎn)錄成互補脫氧核糖核酸(cDNA),實驗方法見文獻[34]。利用NCBI設(shè)計ZmCDC48基因家族成員的實時熒光定量聚合酶鏈式反應(yīng)(qRT-PCR)引物,如表1所示, 測定3個ZmCDC48基因在這7個樣品中的表達,選用微管蛋白β鏈(β-TUB)作為內(nèi)參計算目的基因表達量。采用2-ΔΔCt方法[14]進行計算,每個樣品qRT-PCR反應(yīng)均重復(fù)3次。
1.12 ZmCDC48-03、 ZmCDC48-05、 ZmCDC48-11基因在滲透與高溫脅迫下表達分析
將玉米自交系B73用于基因表達實驗,對生長至兩葉一芯、 生長狀況良好且長勢一致的幼苗分別在聚乙二醇6000(PEG6000)的質(zhì)量分數(shù)為20%、 溫度為45 ℃的條件下處理,分別在處理0、 6、 12、 24 h采集葉片,每組處理均重復(fù)3次。
2 結(jié)果
2.1 玉米ZmCDC48基因家族成員鑒定及理化性質(zhì)分析
利用NCBI、 Phytozome數(shù)據(jù)庫得到BLASTP比對結(jié)果, 再通過InterPro和基于NCBI的批量保守結(jié)構(gòu)域搜索分析結(jié)構(gòu)域, 最終確定14個ZmCDC48基因家族成員。 根據(jù)14個玉米ZmCDC48基因編號從小到大原則依次命名為ZmCDC48-01、 ZmCDC48-02、 …、 ZmCDC48-14。
進一步對玉米ZmCDC48基因家族成員進行理化性質(zhì)分析, 結(jié)果見表2。 結(jié)果顯示: 14個玉米ZmCDC48基因編碼蛋白序列長度為262~811 aa;蛋白分子質(zhì)量為29.64~90.12 kDa,且均不存在跨膜結(jié)構(gòu)域與信號肽(未表征,從SignalP-6.0網(wǎng)站查詢); 等電點為5.06~9.43,其中等電點大于7的成員有7個,小于7的成員有7個; 不穩(wěn)定系數(shù)(小于40說明在體外能夠穩(wěn)定存在)為32.44~50.31,表明ZmCDC48蛋白穩(wěn)定性不同;脂肪系數(shù)(aliphatic index)也可以用來衡量蛋白的穩(wěn)定性, 數(shù)值越大, 蛋白相對越穩(wěn)定; 親水性均值(grand average of hydropathicity, GRAVY)均小于0, 說明ZmCDC48基因都編碼親水蛋白。 亞細胞定位預(yù)測結(jié)果表明,
ZmCDC48-01、 ZmCDC48-02、 ZmCDC48-04、 ZmCDC48-05、 ZmCDC48-10、 ZmCDC48-11這6個蛋白家族成員僅定位在細胞核,其余成員除定位在細胞核之外還定位在其他不同的細胞結(jié)構(gòu)中,如內(nèi)質(zhì)網(wǎng)、細胞質(zhì)、葉綠體, 說明ZmCDC48基因作用廣泛且復(fù)雜。
2.2 玉米ZmCDC48基因家族成員的染色體定位
使用TBtools軟件中GTF/GFF可視化基因定位程序?qū)mCDC48基因進行玉米染色體定位分析, 結(jié)果見圖1。 由圖可以看出:14個ZmCDC48基因分布在9條不同的染色體上, 整體分布較為分散, 大部分染色體上有1~2個基因, 其中1號染色體上基因數(shù)分布最多,有4個。同時,每條染色體兩端的基因密度大于中間部位的。
2.3 玉米ZmCDC48基因的進化分析
為了研究ZmCDC48基因的進化關(guān)系,利用玉米(14個,Zm)、擬南芥(5個,At)、水稻(6個,Os)共25個CDC48蛋白序列構(gòu)建系統(tǒng)進化樹,如圖2所示。根據(jù)進化樹結(jié)果分為3組進化分支:第1組是以AtCDC48E為首的進化分支;第2組是以AtCDC48B為首的進化分支;第3組是因AtCDC48A、 AtCDC48C、 AtCDC48D進化關(guān)系較近,未表征出明顯的進化分支,且后續(xù)保守motif基序一致而將剩余的12個CDC48蛋白成員歸于一個進化分支。第2組進化分支包含的成員最少,只有4個,且在擬南芥與玉米中僅存在一個CDC48基因家族成員,暗示該基因在進化上相對保守。
2.4 玉米ZmCDC48基因結(jié)構(gòu)分析
為了進一步解析玉米CDC48基因的功能, 對基因家族成員的基因結(jié)構(gòu)進行分析, 結(jié)果見圖3。 從圖可知:除ZmCDC48-13不含有內(nèi)含子外,其余13個ZmCDC48基因均含有多個內(nèi)含子,其中ZmCDC48-05基因所含的內(nèi)含子數(shù)目最多,為11個; 此外, 除ZmCDC48-02、 ZmCDC48-13基因外, 其余ZmCDC48基因包含非翻譯區(qū)(UTR)結(jié)構(gòu)。 在3組進化分支中,第1組中ZmCDC48基因結(jié)構(gòu)相對一致, 由2個明顯較長的外顯子加上數(shù)目不等的短外顯子組成; 第2組中ZmCDC48-05基因由12個短外顯子組成;第3組中除ZmCDC48-08、 ZmCDC48-13基因外,其余ZmCDC48基因表現(xiàn)出了相似的外顯子長度以及排列順序,但UTR與內(nèi)含子長度、 位置有明顯區(qū)別。
2.5 CDC48蛋白保守基序與結(jié)構(gòu)域分析
為了進一步鑒定CDC48蛋白保守性,利用MEME網(wǎng)站對ZmCDC48、 AtCDC48、 OsCDC48共25個蛋白序列保守基序(motif)進行預(yù)測,結(jié)果見圖4,保守基序序列見表3。結(jié)果顯示,從CDC48蛋白中共發(fā)現(xiàn)10個基序,其中基序2在14個ZmCDC48成員中均存在。結(jié)合CDC48蛋白進化結(jié)果發(fā)現(xiàn), 不同進化分支上CDC48蛋白的基序組成模式略有不同。 第1組進化分支均含有基序2、 6,AtCDC48E、ZmCDC48-04、ZmCDC48-10、ZmCDC48-11、OsCDC48-04這5個CDC48蛋白不含基序9、10,ZmCDC48-01、 ZmCDC48-02、 ZmCDC48-06、 ZmCDC48-14僅含有其中的4或5個基序。第2組進化分支均含有基序1、 2、 3、 6、 7。以上2組蛋白的基序組成表明,玉米與水稻2個物種間CDC48同源蛋白保守性更高,而擬南芥CDC48蛋白碳端總會重復(fù)出現(xiàn)某一基序,如AtCDC48E蛋白重復(fù)了基序7,AtCDC48B蛋白重復(fù)了基序3。第3組進化分支除ZmCDC48-08蛋白外,剩下的11個CDC48蛋白均含有10個基序。
此外,利用NCBI對保守結(jié)構(gòu)域分析,從圖4可以看出,CDC48家族蛋白至少含有1個AAA結(jié)構(gòu)域。同一進化分支的CDC48蛋白所含結(jié)構(gòu)域較相似,尤其是第3組,除ZmCDC48-08蛋白外,其他蛋白均含有CDC48-N、 CDC48-2、 AAA結(jié)構(gòu)域,有研究[35]發(fā)現(xiàn),CDC48-N是輔因子的結(jié)合位點,從而使CDC48行使功能。
由此可見,不同進化分支間基因基序和結(jié)構(gòu)域差異較大,但同一進化分支中基因基序和結(jié)構(gòu)域相似,暗示同一分支的基因進化相對保守,可能具有相似的機制與功能,不同進化分支的基因在功能或機制上可能存在差異。部分CDC48蛋白僅含有1個結(jié)構(gòu)域或部分基序,可能是由蛋白質(zhì)剪接過程或基因組組裝缺口(gap)所致。
2.6 玉米CDC48基因家族成員共線性分析
玉米ZmCDC48基因家族共線性分析結(jié)果見圖5。 從圖5(a)中共發(fā)現(xiàn)7對ZmCDC48基因存在共線性關(guān)系, 分別為ZmCDC48-03/ZmCDC48-12、 ZmCDC48-07/ZmCDC48-03、 ZmCDC48-07/ZmCDC48-09、ZmCDC48-07/ZmCDC48-12、ZmCDC48-09/ZmCDC48-03、ZmCDC48-09/ZmCDC48-12、ZmCDC48-10/ZmCDC48-11。 ZmCDC48共線性基因僅在玉米4條染色體中分布,包含6個染色體間共線性事件和1個染色體內(nèi)共線性事件(ZmCDC48-07/ZmCDC48-09)。同時分析發(fā)現(xiàn),ZmCDC48-03、 ZmCDC48-07和ZmCDC48-09為共線性事件發(fā)生的高頻基因。
為了評估玉米ZmCDC48共線性基因在進化過程中的選擇壓力, 計算分析Ka與Ks的比
例,結(jié)果見表4。2個蛋白編碼基因的Ka與Ks之比可以評估是否有選擇壓力作用于這個蛋白質(zhì)編碼基因。若Ka/Ks gt; 則ZmCDC48基因在進化過程中受到正選擇(positive selection)效應(yīng); 若Ka/Ks= 認為ZmCDC48基因中性進化(neutral evolution);若Ka/Kslt;1,則認為ZmCDC48基因受純化選擇[36]。表4中結(jié)果顯示,7個ZmCDC48基因共線性事件的Ka/Ks為0.016 171~0.176 279, 均遠小于 表明ZmCDC48共線性基因在進化過程中得到了純化選擇。
此外,為了研究CDC48基因家族在物種間的進化關(guān)系,選取模式生物擬南芥與水稻作為研究對象,通過TBtools軟件分別進行共線性分析。從圖5(b)可以看出:14個玉米ZmCDC48基因和5個擬南芥AtCDC48基因間無同源基因?qū)Γ?4個玉米ZmCDC48基因和6個水稻OsCDC48基因間有12個同源基因?qū)?。其中ZmCDC48-03、 ZmCDC48-07、 ZmCDC48-09、 ZmCDC48-12基因與OsCDC48-01或OsCDC48-06基因具有共線性,說明這些CDC48基因?qū)赡芫哂邢嗨频墓δ埽踔羴碜怨餐淖嫦取?/p>
2.7 玉米ZmCDC48基因啟動子順式作用元件分析
為了進一步分析玉米ZmCDC48基因的功能和調(diào)控機制,對14個ZmCDC48基因啟動子區(qū)域進行順式作用元件分析,結(jié)果如圖6所示。結(jié)果表明,這些基因的啟動子區(qū)域存在諸多與植物生長發(fā)育、 激素與環(huán)境脅迫響應(yīng)有關(guān)的順式作用元件,表明ZmCDC48基因家族功能強大且影響范圍廣,涉及植物的生長、 發(fā)育、 繁殖與響應(yīng)環(huán)境信號等過程。
在這些順式作用元件中,除基本核心元件TATA-box和CAAT-box外,根據(jù)功能特性分為4組,即光響應(yīng)相關(guān)元件、 激素相關(guān)元件、 非生物脅迫相關(guān)元件和發(fā)育相關(guān)元件。光響應(yīng)元件及其相關(guān)元件在每個家族成員啟動子區(qū)域均有所分布,共發(fā)現(xiàn)有165個元件。激素響應(yīng)元件共發(fā)現(xiàn)有205個,包括脫落酸響應(yīng)元件(80個)、 茉莉酸甲酯響應(yīng)元件(66個)、 水楊酸響應(yīng)元件(42個)、 生長素響應(yīng)元件(9個)、 赤霉素響應(yīng)元件(5個)、 乙烯響應(yīng)元件(3個)。與非生物脅迫相關(guān)的元件352個,包含MYB及其相關(guān)的元件(129個)、 MYC及其相關(guān)的元件(55個)、 缺氧特異性誘導(dǎo)元件(31個)、 低溫響應(yīng)元件(43個)、 干旱誘導(dǎo)元件(20個)、 防御和應(yīng)激響應(yīng)元件(72個)、 機械損傷相關(guān)響應(yīng)元件(2個)。此外,還有植物生長發(fā)育相關(guān)的元件有351個,如花藥特異表達元件(273個)、 分生組織表達元件(51個)、 種子特異性表達元件(14個)、 玉米醇溶蛋白代謝調(diào)節(jié)元件(7個)、 胚乳表達相關(guān)元件(2個)、 柵欄葉肉細胞分化元件(1個)、 細胞發(fā)育元件(1個)、 根特異性元件(1個)、 種子特異性調(diào)控元件(1個)??傊?,ZmCDC48基因既存在相同的順式作用元件,如光響應(yīng)元件、 MYB及其相關(guān)元件、 花藥特異表達元件,還存在不同的順式作用元件,如乙烯響應(yīng)元件僅存在于ZmCDC48-09、 ZmCDC48-12基因啟動子區(qū)域,胚乳表達元件存在于ZmCDC48-01、 ZmCDC48-05基因啟動子區(qū)域。上述結(jié)果表明,ZmCDC48基因彼此之間的功能既存在共性,又具有一定的獨立性。
2.8 玉米ZmCDC48-03互作蛋白分析
為了進一步分析玉米ZmCDC48蛋白的作用機制, 使用STRING數(shù)據(jù)庫預(yù)測分析ZmCDC48-03蛋白互作網(wǎng)絡(luò), 結(jié)果如圖7所示。 對ZmCDC48-03互作蛋白進行基本信息查詢, 結(jié)果見表5。 圖、 表中的互作蛋白信息顯示,ZmCDC48-03蛋白與NPL4家族蛋白、 植物含UBX結(jié)構(gòu)域蛋白、UFD1家族蛋白、 卵巢腫瘤(OTU)樣半胱氨酸蛋白酶家族蛋白等相互作用, 表明ZmCDC48-03蛋白可能參與植物生長發(fā)育、 泛素-蛋白酶體系統(tǒng)降解途徑與免疫過程。
2.9 玉米ZmCDC48-03、 ZmCDC48-05、 ZmCDC48-11基因組織表達模式分析
在植物不同的組織中, 不同基因發(fā)揮著不同的功能。 從3組進化分支中各選取1位家族成員, 對玉米根,莖,葉,授粉后7、15、20、25 d的籽粒樣品共7個組織檢測ZmCDC48基因表達,進一步研究ZmCDC48基因的功能, 結(jié)果如圖8所示。 結(jié)果表明, ZmCDC48基因在7個組織中均有不同程度的表達, 但不同成員之間表達量差異較大。 ZmCDC48-03基因在7個組織中無明顯高表達, ZmCDC48-05基因在授粉后7 d的籽粒中表達較高,ZmCDC48-11基因在成熟葉片中高表達且在授粉后7、 20 d的籽粒中表達略高。
2.10 玉米ZmCDC48-03、 ZmCDC48-05、 ZmCDC48-11基因在滲透與高溫誘導(dǎo)下表達模式分析
為了揭示ZmCDC48基因在脅迫響應(yīng)中的作用, 對玉米自交系B73分別進行滲透與高溫脅迫誘導(dǎo), 并從3個進化分支中分別選取1個家族成員進行表達量分析。 另外, 誘導(dǎo)脅迫表達結(jié)果也可與順式作用元件分析結(jié)果相互佐證, 結(jié)果如圖9所示。由圖可知: 在滲透(PEG6000的質(zhì)量分數(shù)為20%)脅迫中, ZmCDC48-03、 ZmCDC48-11基因的表達量整體保持上調(diào)趨勢, 尤其是ZmCDC48-11基因的表達量最高, 但是ZmCDC48-05基因僅在處理24 h時表達量明顯上調(diào)。 經(jīng)溫度為45 ℃的處理后, ZmCDC48-03基因表達量逐漸上調(diào), ZmCDC48-11基因明顯下調(diào),ZmCDC48-05基因表達量起初明顯下調(diào)后上調(diào),但最高也僅與未處理的表達量相似。
3 討論
CDC48基因參與植物的細胞增殖和分化[10]、" 胞質(zhì)分裂[7]、 UPS降解途徑[16,37]、細胞內(nèi)運輸[38]、膜融合[13]和免疫[18]等過程,在植物的生長發(fā)育、 蛋白質(zhì)降解和免疫過程中具有重要作用,并能夠參與植物非生物逆境脅迫響應(yīng)過程[20,39],因此對CDC48基因功能的研究,能夠為解析植物整體調(diào)控網(wǎng)絡(luò)提供一定的理論依據(jù)。 近年來, 對擬南芥[8]、 煙草[11]、水稻[12]等植物中CDC48基因的研究增多,但是對玉米CDC48基因的研究未見報道。 本文中對玉米CDC48基因家族成員進行基因組水平上的鑒定, 并分析該基因家族的生物信息學、 組織特異性和逆境表達模式, 生物信息學包括基本理化性質(zhì)、 系統(tǒng)進化、 基因結(jié)構(gòu)、 染色體定位、 保守結(jié)構(gòu)域、 順式作用元件等,為后續(xù)進一步闡明ZmCDC48s基因功能提供理論依據(jù)。本文中共鑒定出14個玉米CDC48基因,并根據(jù)基因序號順序分別命名為ZmCDC48-01、 ZmCDC48-02、 …、 ZmCDC48-14。 這些家族成員不均勻地分布在9條染色體上, 其中1號染色體最多, 包含4個成員。 亞細胞定位預(yù)測顯示, ZmCDC48-01、 ZmCDC48-02、 ZmCDC48-04、 ZmCDC48-05、 ZmCDC48-10、 ZmCDC48-11這6個家族成員僅定位在細胞核,其余成員除定位在細胞核之外還定位在其他不同的細胞結(jié)構(gòu)中,如內(nèi)質(zhì)網(wǎng)、 細胞質(zhì)、 葉綠體。系統(tǒng)進化分析結(jié)果表明,玉米和水稻同歸于禾本科, 同源關(guān)系更近, 而擬南芥是十字花科, 所以同源關(guān)系較水稻遠, 就目前鑒定出來的ZmCDC48家族基因來看, 玉米CDC48基因家族成員數(shù)目遠多于擬南芥的5個與水稻的6個,表明玉米CDC48基因可能存在功能冗余。同時基于系統(tǒng)進化結(jié)果,將玉米14個ZmCDC48、 擬南芥5個AtCDC48與水稻6個OsCDC48共25個基因分成3組進化分支,現(xiàn)有研究結(jié)果的大部分成員屬于第3組,第2組中擬南芥成員能夠調(diào)控根周細胞分裂[9], 水稻成員能夠參與對干旱與鹽堿的耐受過程[20], 但是每個進化分支中成員的功能是否具有完全獨立性或冗余, 還未被完全明確地表征。ZmCDC48基因結(jié)構(gòu)差異較大,相同進化分支上的ZmCDC48基因結(jié)構(gòu)相對一致。保守基序和結(jié)構(gòu)域分析結(jié)果也表明每個進化分支中的基因具有一定的保守性。 不同物種在進化中均存在基因復(fù)制[40], 通過對玉米ZmCDC48基因家族的14個成員的共線性分析得到了7個重復(fù)事件, 各重復(fù)事件Ka/Ks值均小于 說明ZmCDC48基因進化受純化選擇。 共線性分析結(jié)果顯示, 玉米與水稻之間包含12個共線性基因, 而玉米與擬南芥之間無共線性基因, 表明玉米和水稻CDC48家族成員間親緣關(guān)系較近, 同時還表明CDC48基因家族擴張可能出現(xiàn)在玉米和擬南芥的分化之前, 在擬南芥和玉米物種形成后,2個物種的基因成員各自演化, 因此不存在染色體線性關(guān)系。
根據(jù)玉米ZmCDC48基因啟動子區(qū)域的順式作用元件分析結(jié)果,每個家族成員均含有眾多的光響應(yīng)元件,表明成員們可能參與了玉米光響應(yīng)過程。此外,ZmCDC48基因啟動子區(qū)域還含有激素相關(guān)元件、 非生物脅迫相關(guān)元件和發(fā)育相關(guān)元件,表明ZmCDC48基因參與植物的生長、 發(fā)育、 繁殖與響應(yīng)環(huán)境信號等過程。 MYB及其相關(guān)元件、 花藥特異表達元件也都存在于每個成員啟動子區(qū)域, 表明ZmCDC48基因也參與了逆境響應(yīng)與花粉發(fā)育過程。ZmCDC48基因家族成員間也存在著不同的順式作用元件,如乙烯響應(yīng)元件僅存在于ZmCDC48-09、 ZmCDC48-12基因的啟動子區(qū)域,胚乳表達元件存在于ZmCDC48-01、 ZmCDC48-05基因啟動子區(qū)域。同時,在不同進化分支中各選取1個ZmCDC48基因家族成員(ZmCDC48-03、ZmCDC48-05、ZmCDC48-11)進行組織和非生物脅迫表達模式分析,結(jié)果顯示3個基因表達量均有不同程度地變化,表明ZmCDC48基因確實參與了植物生長發(fā)育與抵抗逆境脅迫過程,與順式作用元件分析結(jié)果及現(xiàn)有研究成果一致。STRING蛋白互作預(yù)測結(jié)果顯示,ZmCDC48-03蛋白與NPL4家族蛋白、 UFD1家族蛋白、 含UBX結(jié)構(gòu)域蛋白、 OTU樣半胱氨酸蛋白酶家族蛋白等互作。已有研究表明,AtCDC48A蛋白與NPL4-UFD1異二聚體互作,參與擬南芥細胞著絲粒分解、 發(fā)育、 UPS降解途徑[17]。PUXs是一類含UBX結(jié)構(gòu)域蛋白,AtPUX7蛋白可調(diào)控花粉管的發(fā)育,并在AtCDC48A蛋白和泛素互作時起橋梁作用[16]; AtPUX10蛋白定位在花粉管和種子內(nèi)的脂滴,并招募AtCDC48A蛋白以調(diào)控泛素化脂滴蛋白降解過程[41-42]; AtPUX2蛋白突變使白粉菌繁殖減少[43]。Keren等[44]證明OTU1功能的喪失會影響種子、 蓮座葉和莖的大小,同時AtOTU1可通過與AtCDC48A蛋白互作參與內(nèi)質(zhì)網(wǎng)相關(guān)降解過程[45]。綜上分析,ZmCDC48-03基因可能是玉米生長發(fā)育、 蛋白質(zhì)降解與免疫過程中的重要基因。
4 結(jié)論
本文中在全基因組水平共鑒定了14個玉米CDC48基因,并分析其序列長度、 分子質(zhì)量、 等電點、 亞細胞定位等基本信息,得到如下主要結(jié)論:
1)玉米CDC48基因家族成員不均勻地分布在9條染色體上,其中1號染色體分布最多,包含4個成員。
2)系統(tǒng)進化將14個玉米CDC48基因分為3組進化分支,且各組內(nèi)基因結(jié)構(gòu)和蛋白序列保守。
3)不同玉米CDC48基因啟動子區(qū)域包含不同數(shù)量和種類的順式作用元件,因此玉米CDC48基因家族成員在組織和非生物脅迫中表現(xiàn)出不同的表達模式。
4)蛋白調(diào)控網(wǎng)絡(luò)顯示玉米ZmCDC48蛋白與擬南芥AtCDC48蛋白極有可能具有相似的功能,為后續(xù)解析玉米ZmCDC48基因功能奠定理論基礎(chǔ)。
參考文獻:
[1] MOIR D, STEWART S E, OSMOND B C, et al. Cold-sensitive cell-division-cycle mutants of yeast: isolation, properties, and pseudoreversion studies[J]. Genetics, 1982, 100(4): 547.
[2] ERDMANN R, WIEBEL F F, FLESSAU A, et al. PAS1: a yeast gene required for peroxisome biogenesis, encodes a member of a novel family of putative ATPases[J]. Cell, 199 64(3): 499.
[3] KOLLER K J, BROWNSTEINMJ.UseofacDNAclonetoidentify asupposedprecursorproteincontainingvalosin[J]. Nature, 1987, 325(6104): 542.
[4] ERZBERGER J P, BERGER J M. Evolutionary relationships and structural mechanisms of AAA+ proteins[J]. Annual Review of Biophysics and Biomolecular Structure, 2006, 35(1): 93.
[5] STOLZ A, HILT W, BUCHBERGER A, et al. CDC48: a power machineinproteindegradation[J].TrendsinBiochemicalSciences, 201 36(10): 515.
[6] BARTHELME D, SAUER R T. Identification of the CDC48·20S proteasome as an ancient AAA+ proteolytic machine[J]. Science, 2012, 337(6096): 843.
[7] FEILER H S, DESPREZ T, SANTONI V, et al. The higher plant Arabidopsis thaliana encodes a functional CDC48 homologue which is highly expressed individingandexpandingcells[J].TheEMBO Journal, 1995, 14(22): 5626.
[8] COPELAND C, WOLOSHEN V, HUANG Y, et al. AtCDC48A is involved in the turnover of an NLR immune receptor[J]. The Plant Journal, 2016, 88(2): 294.
[9] YANG L H, ZHU M Y, YANG Y, et al. CDC48B facilitates the intercellular trafficking of SHORT-ROOT during radial patterning in roots[J]. Journal of Integrative Plant Biology, 2022, 64(4): 843.
[10] PARK S, RANCOUR D M, BEDNAREK S Y. In planta analysis of the cell cycle-dependent localization of AtCDC48Aanditscritical roles in cell division, expansion, and differentiation[J]. Plant Physiology, 2008, 148(1): 246.
[11] BAE H, CHOI S M, YANG S W, et al. Suppression of the ER-localizedAAAATPaseNgCDC48inhibitstobaccogrowth and development[J]. Molecules and Cells, 2009, 28(1): 57.
[12] HUANG Q N, SHI Y F, ZHANG X B, et al. Single base substitution in OsCDC48 is responsible for premature senescence and death phenotype in rice[J]. Journal of Integrative Plant Biology, 2016, 58(1): 12.
[13] RANCOUR D M, DICKEY C E, PARKS,etal.CharacterizationofAtCDC48:evidenceformultiplemembranefusionmechanisms at the plane of cell division in plants[J]. Plant Physiology, 2002, 130(3): 1241.
[14] SHI L, ZHANG X B, SHI Y F, et al. OsCDC48/48E complex is required for plant survival in rice (Oryza sativa L.)[J]. Plant Molecular Biology, 2019, 100(1/2): 163.
[15] RIENTIES I M, VINK J, BORST J W, et al. The Arabidopsis SERK1 protein interacts with the AAA-ATPase AtCDC48, the 14-3-3 protein GF14λ and the PP2C phosphatase KAPP[J]. Planta, 2005, 221(3): 394.
[16] GALLOIS J L, DROUAUD J, LCUREUIL A, et al. Functional characterizationoftheplantubiquitinregulatoryX(UBX)domain-containing protein AtPUX7 in Arabidopsis thaliana[J]. Gene, 2013, 526(2): 299.
[17] MRAI Z, CHUMAK N, GARCA-AGUILAR M, et al. The AAA-ATPasemolecularchaperoneCDC48/p97disassemblessumoylated centromeres, decondenses heterochromatin, and activatesribosomalRNAgenes[J].ProceedingsoftheNationalAcademy of Sciences of the United States of America, 2014, 111(45): 16166.
[18] ROSNOBLET C, BGUE H,BLANCHARDC,etal.Functional characterization of the chaperon-like protein CDC48 in cryptogein-inducedimmuneresponseintobacco[J].Plant,Cell amp; Environment, 2017, 40(4): 491.
[19] NIEHL A, AMARI K, GEREIGE D, et al. Control of Tobacco mosaic virus movement protein fate by CELL-DIVISION-CYCLE protein48[J]. Plant Physiology, 2012, 160(4): 2093.
[20] RAJAKV,SEKHARK M, REDDY V D,etal.ActivationofCDC48andacetyltransferaseencodinggenescontributestoenhanced abiotic stress tolerance and improved productivity traits in rice[J]. Plant Physiology and Biochemistry, 202 168: 329.
[21] WOODHOUSE M R, CANNON E K, PORTWOOD J L, et al. A pan-genomicapproachtogenomedatabasesusingmaizeasamodel system[J]. BMC Plant Biology, 202 21: 385.
[22] BERARDINITZ,REISERL,LID,etal.The Arabidopsis information resource:makingandminingthe“gold standard”annotated reference plant genome[J]. Genesis, 2015, 53(8): 477.
[23] GOODSTEIN D M, SHU S Q, HOWSON R, et al. Phytozome: a comparative platform for green plant genomics[J]. Nucleic Acids Research, 2012, 40(D1): D1178.
[24] ALTSCHUL S F, GISH W, MILLER W, et al. Basic local alignment search tool[J].JournalofMolecularBiology,1990,215(3): 403.
[25] PAYSAN-LAFOSSE T, BLUM M, CHUGURANSKY S, et al. InterPro in 2022[J]. Nucleic Acids Research, 2023, 51(D1): D418.
[26] CHOU K C, SHEN H B. Plant-mPLoc: a top-down strategy to augment the power for predicting plant protein subcellular localization[J]. PLoS One, 2010, 5(6): e11335.
[27] KUMAR S, STECHER G,LIM,etal.MEGAX:molecularevolutionary genetics analysis across computing platforms[J]. Molecular Biology and Evolution, 2018, 35(6): 1547.
[28] CHEN C J, CHEN H, ZHANG Y, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data[J]. Molecular Plant, 2020, 13(8): 1194.
[29] HU B, JIN J, GUO A Y, et al. GSDS 2.0: an upgraded gene feature visualization server[J]. Bioinformatics, 2015, 31(8): 1296.
[30] BAILEY T L, ELKAN C. Fitting a mixture model by expectation maximization to discover motifs in biopolymers[C]//Proceedings of the 2nd International Conference on Intelligent Systems for Molecular Biology, August 15-17, 1994, Stanford, CA, USA. Washington, D.C.: USDOE, 1994: 28.
[31] YATES A D, ALLEN J, AMODE R M, et al. Ensembl Genomes 2022: an expanding genome resource for non-vertebrates[J]. Nucleic Acids Research, 2022, 50(D1): D996.
[32] LESCOT M, DHAIS P, THIJS G, et al. PlantCARE, a database of plant cis-acting regulatory elements and a portal to tools for in silico analysis of promoter sequences[J]. Nucleic Acids Research, 2002, 30(1): 325.
[33] SZKLARCZYK D, KIRSCH R, KOUTROULI M, et al. The STRING database in 2023: protein-protein association networks and functional enrichment analyses for any sequenced genome of interest[J]. Nucleic Acids Research, 2023, 51(D1): D638.
[34] 劉超. 玉米分生組織發(fā)育中受體蛋白FEA3介導(dǎo)的信號通路及下游信號分子的鑒定[D]. 濟南: 山東大學, 2022: 13-14.
[35] YE Y H, TANG W K, ZHANG T,etal.Amighty“proteinextractor” of the cell: structure and function of the p97/CDC48 ATPase[J]. Frontiers in Molecular Biosciences, 2017, 4: 39.
[36] HURST L D. The Ka/Ks ratio: diagnosing the form of sequence evolution[J]. TRENDS in Genetics, 2002, 18(9): 486.
[37] MLLER J, PIFFANELLI P, DEVOTO A, et al. Conserved ERAD-like quality control of a plant polytopic membrane protein[J]. The Plant Cell, 2005, 17(1): 149.
[38] MARSHALL R S, JOLLIFFE N A, CERIOTTI A, et al. The role of CDC48intheretro-translocationofnon-ubiquitinatedtoxin substrates in plant cells[J]. Journal of Biological Chemistry, 2008, 283(23): 15869.
[39] LIJL,YUANJR,LIYH,et al. The CDC48 complex mediates ubiquitin-dependent degradation of intra-chloroplast proteins in plants[J]. Cell Reports, 2022, 39(2): 110664.
[40] XU G X, GUO C C, SHAN H Y, et al. Divergence of duplicate genes in exon-intron structure[J]. Proceedings of the National Academy of Sciences, 2012, 109(4): 1187.
[41] KRETZSCHMAR F K, MENGEL L A, MLLER A O, et al. PUX10 is a lipid droplet-localized scaffold protein that interacts with CELL DIVISION CYCLE48 and is involved in the degradation of lipid droplet proteins[J]. The Plant Cell, 2018, 30(9): 2137.
[42] DERUYFFELAERE C, PURKRTOVA Z, BOUCHEZ I, et al. PUX10 is a CDC48A adaptor protein that regulates the extraction of ubiquitinated oleosins from seed lipid droplets in Arabidopsis[J]. The Plant Cell, 2018, 30(9): 2116.
[43] CHANDRAN D, TAI Y C, HATHER G, et al. Temporal global expression data reveal known and novel salicylate-impacted processesandregulatorsmediatingpowderymildewgrowth and reproductiononArabidopsis[J].PlantPhysiology,2009,149(3): 1435.
[44] KEREN I, LACROIX B, KOHRMAN A, et al. Histone deubi-quitinase OTU1 epigenetically regulates DA1 and DA2, which controlArabidopsisseedandorgansize[J].iScience,2020,23(3):100948.
[45] ZANG Y P, GONG Y Y,WANGQ,et al. Arabidopsis OTU a linkage-specificdeubiquitinase,isrequiredforendoplasmic reticulum-associated protein degradation[J]. The Plant Journal, 2020, 101(1): 141.
(責任編輯:于海琴)