張東亮,吳筱林,田曉芹,褚 晶,郭善利,陳世華
(煙臺大學(xué)生命科學(xué)學(xué)院,山東 煙臺 264005)
KEA(K+/H+逆向轉(zhuǎn)運(yùn)蛋白,K+efflux antiporter)在植物細(xì)胞鉀離子的積累和平衡過程中發(fā)揮重要作用。KEA基因?qū)儆陉栯x子/質(zhì)子逆向轉(zhuǎn)運(yùn)體(Cation/proton antiporter,CPA) 的CPA2亞家族。目前對KEA的研究較少,已有研究主要集中在模式植物擬南芥。擬南芥中有6個AtKEA基因,與細(xì)菌K+/H+反向轉(zhuǎn)運(yùn)蛋白具有同源性,由此推測其在K+的積累和平衡過程中發(fā)揮功能[1-2]?,F(xiàn)有研究結(jié)果表明,AtKEA在花萼、保衛(wèi)細(xì)胞和維管組織等不同部位中均存在[3]。AtKEA1—AtKEA3對光合作用、pH和葉綠體滲透具有調(diào)節(jié)作用,同時會對多種脅迫產(chǎn)生響應(yīng)[2,4-7]。AtKEA4通過調(diào)節(jié)內(nèi)質(zhì)網(wǎng)的pH來調(diào)控蛋白運(yùn)輸?shù)冗^程[8]。
藜麥(ChenopodiumquinoaWilld., Cq)是一種起源于南美安第斯山脈的一年生作物,營養(yǎng)價值極高,被聯(lián)合國糧農(nóng)組織(FAO)認(rèn)定為唯一一種單體作物即可滿足人類所需全部營養(yǎng)的糧食[9],且藜麥對諸如鹽堿、干旱等非生物脅迫具有較強(qiáng)的耐受性[10]。2017年,藜麥高質(zhì)量參考基因組公布,促進(jìn)了藜麥基因組的研究[11]。本研究運(yùn)用生物信息學(xué)的方法,對藜麥CqKEA基因家族成員進(jìn)行鑒定,對其理化性質(zhì)、基因結(jié)構(gòu)、染色體定位和系統(tǒng)發(fā)育關(guān)系進(jìn)行分析,并根據(jù)RNA-seq數(shù)據(jù)對CqKEA基因組織特異性表達(dá)及非生物脅迫條件下的表達(dá)模式進(jìn)行探究,為進(jìn)一步研究藜麥抗逆的分子機(jī)理與藜麥遺傳改良提供理論基礎(chǔ)。
藜麥基因組數(shù)據(jù)來源于Chenopodium DB (https://www.cbrc.kaust.edu.sa/chenopodiumdb/download/dow-nload-auth.html)。使用CPA蛋白保守結(jié)構(gòu)域的HMM模型(PF00999)對藜麥所有蛋白質(zhì)序列進(jìn)行搜索,Evalue限定為1,獲得候選蛋白;使用NCBI的CDD工具(https://www.ncbi.nlm.nih.gov/cdd/)對候選蛋白的結(jié)構(gòu)域進(jìn)行鑒定,去除沒有保守結(jié)構(gòu)域的蛋白,從而得到所有CqCPA基因家族成員。從TAIR(https://www.arabidopsis.org/)和NCBI(https://www.ncbi.nlm.nih.gov/)下載擬南芥和水稻的KEA蛋白序列,將它們與CqCPA導(dǎo)入MEGA7.0軟件,采用鄰接法構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹,從而將CqKEA從中分出。根據(jù)其與擬南芥AtKEA的同源關(guān)系進(jìn)行重命名。使用ExPASy的Protparam工具(https://web.expasy.org/protparam/)對CqKEA蛋白序列進(jìn)行理化性質(zhì)分析。
根據(jù)藜麥、擬南芥和水稻KEA系統(tǒng)發(fā)育進(jìn)化樹,對其系統(tǒng)進(jìn)化關(guān)系進(jìn)行分析。同時將鑒定出的CqKEA基因家族成員蛋白序列提交到TMHMM Server v. 2.0(http://www.cbs.dtu.dk/services/TMHMM/#openne-wwindow)進(jìn)行跨膜結(jié)構(gòu)預(yù)測。
從參考基因組的基因注釋文件中提取所有CqKEA基因家族成員的基因結(jié)構(gòu)信息,提交到GSDS 2.0在線網(wǎng)站(http://gsds.gao-lab.org/index.php)進(jìn)行作圖分析;使用MEME 5.1在線網(wǎng)站(http://meme-suite.org/tools/meme)對CqKEA蛋白序列進(jìn)行motif搜索,可被搜索的motif數(shù)量設(shè)置為10。
從NCBI下載藜麥生長發(fā)育過程中各組織器官及非生物脅迫條件下地上和地下組織的RNA-Seq數(shù)據(jù)(SRP226463, SRP116149, SRS1538629),使用Kallisto計(jì)算表達(dá)水平[12]。使用TBtools[13]軟件繪制CqKEA基因家族的組織表達(dá)熱圖,使用Origin軟件繪制非生物脅迫條件下地上和地下組織的表達(dá)量柱狀圖,分析CqKEA基因的表達(dá)模式。
本研究共鑒定到10個CqKEA基因家族成員,根據(jù)其與AtKEA基因的同源關(guān)系將其命名為CqKEA1—CqKEA5c,它們的理化性質(zhì)如表1所示。蛋白長度從486(CqKEA4a)到1227(CqKEA1)個氨基酸殘基不等,等電點(diǎn)從5.01(CqKEA3b)到7.08(CqKEA4a,4b)不等,大多數(shù)蛋白偏酸性。
表1 CqKEA基因家族成員理化性質(zhì)
以藜麥、擬南芥與水稻的KEA蛋白序列為基礎(chǔ),使用MEGA7.0構(gòu)建NJ系統(tǒng)進(jìn)化樹(圖1)。結(jié)果表明,來自上述3個物種的KEA蛋白被分為三個亞組(Class Ⅰ,Class Ⅱ和Class Ⅲ)。Class Ⅰ中包括5個CqKEA蛋白,3個AtKEA蛋白和2個OsKEA蛋白;Class Ⅱ中包括2個CqKEA蛋白,1個AtKEA蛋白和1個OsKEA蛋白;Class Ⅲ中包括3個CqKEA蛋白,2個AtKEA蛋白和1個OsKEA蛋白。
圖1 CqKEA蛋白系統(tǒng)發(fā)育進(jìn)化樹
使用TMHMM對10個CqKEA進(jìn)行跨膜結(jié)構(gòu)分析,結(jié)果如表2所示。CqKEA2a、CqKEA2b和CqKEA4b含有12個跨膜結(jié)構(gòu)域,CqKEA4a和CqKEA5b含有11個跨膜結(jié)構(gòu)域,CqKEA1、CqKEA3a、CqKEA3b和CqKEA5a含有10個跨膜結(jié)構(gòu)域,而CqKEA5c僅有9個跨膜結(jié)構(gòu)域。
表2 CqKEA蛋白跨膜結(jié)構(gòu)數(shù)量
使用GSDS對CqKEA基因家族成員的基因結(jié)構(gòu)進(jìn)行作圖分析(圖2),結(jié)果表明,所有CqKEA基因均包含外顯子和內(nèi)含子,同一亞組基因的結(jié)構(gòu)相似,不同亞組基因結(jié)構(gòu)存在較大差異。外顯子數(shù)目在16~21之間,內(nèi)含子數(shù)目在15~20之間。CqKEA5c有16個外顯子和15個內(nèi)含子,外顯子和內(nèi)含子的數(shù)目最少,而CqKEA2b有21個外顯子和20個內(nèi)含子,外顯子和內(nèi)含子的數(shù)目最多。
圖2 CqKEA基因結(jié)構(gòu)
使用MEME對CqKEA基因家族成員蛋白序列進(jìn)行motif分析(圖3),結(jié)果表明,在同一亞組的蛋白質(zhì)所含有的motif種類和數(shù)量基本一致,表明CqKEA在進(jìn)化過程中變化不大,具有較為穩(wěn)定的功能。Class Ⅲ中3個CqKEA均含有9個motif;Class Ⅱ中CqKEA3a含有7個motif,CqKEA3b含有6個motif;Class Ⅰ中CqKEA4a和CqKEA4b均含有6個motif,而CqKEA5a、CqKEA5b和CqKEA5c均含有8個motif。
圖3 CqKEA蛋白motif分布
由圖4(a)的組織特異性表達(dá)分析結(jié)果可知,除CqKEA5a在葉柄中不表達(dá),其余基因在所有組織中均有表達(dá)。同一亞組的基因在13個組織中的表達(dá)趨勢大致相同,Class Ⅰ中的基因在所有組織中的表達(dá)都相對較低,而Class Ⅱ和Class Ⅲ中的基因表達(dá)則較高,尤其是CqKEA3a和CqKEA3b在幼苗中的表達(dá)最高;CqKEA2a在白甜藜種子和黃苦藜種子中的表達(dá)存在差異,這說明在同一物種不同品種之間CqKEA基因的表達(dá)模式也存在一定差異。
干旱、高溫和鹽脅迫下表達(dá)分析結(jié)果表明所有CqKEA基因都會對脅迫產(chǎn)生響應(yīng)。由圖4(b)可見,在地上部分中CqKEA1、CqKEA2a和CqKEA2b在所有脅迫下均表現(xiàn)上調(diào)的趨勢,而CqKEA3a和CqKEA3b在鹽脅迫下上調(diào)最明顯,CqKEA4a、CqKEA4b、CqKEA5a、CqKEA5b和CqKEA5c表達(dá)量較低,受三種脅迫影響不明顯。由圖4(c)可見,在地下部分中,大多數(shù)基因在脅迫條件下呈下調(diào)趨勢,只有CqKEA1和CqKEA2a在干旱和高溫脅迫下呈上調(diào)趨勢,CqKEA5c在高溫脅迫下呈上調(diào)趨勢。
圖4 CqKEA基因表達(dá)模式
隨著全基因組測序技術(shù)的不斷發(fā)展,越來越多的物種的基因組被測序完成,目前已被測序的植物已超過70個[14]。大量的基因組數(shù)據(jù)為植物基因家族的鑒定和基因功能的驗(yàn)證提供了極為有利的條件。目前對KEA的研究較少,主要集中在擬南芥。AtKEA1和AtKEA2存在于葉綠體內(nèi)壁上,AtKEA3存在于葉綠體類囊體膜上,它們通過維持pH和K+平衡來保證葉綠體正常的生物功能[7]。通過系統(tǒng)進(jìn)化分析表明CqKEA1、CqKEA2a和CqKEA2b與AtKEA1、AtKEA2歸為同一亞組,CqKEA3a和CqKEA3b與AtKEA3歸為同一亞組,由此推測它們具有相似的功能,對光合作用、pH和葉綠體滲透具有調(diào)節(jié)作用[2,4-7];CqKEA4a和CqKEA4b與AtKEA4歸為同一亞組,其可能參與蛋白運(yùn)輸、定位和膜微囊融合等過程[8]。
植物通過多種方式來抵抗逆境脅迫帶來的影響,但是在耐受干旱、鹽和高溫等脅迫的過程中,植物的基因作用機(jī)制表現(xiàn)出相似性[15]。本研究對10個CqKEA基因的組織特異性表達(dá)和非生物脅迫條件下的表達(dá)模式進(jìn)行了探究。絕大多數(shù)基因在所有組織中均有表達(dá),說明CqKEA基因可能是維持植物基本生命活動所必需的。CqKEA3a和CqKEA3b在幼苗中的表達(dá)量最高,推測其可能參與維持植株正常生命活動中的離子穩(wěn)態(tài)和K+利用。在地上部分中CqKEA4a、CqKEA4b、CqKEA5a、CqKEA5b和CqKEA5c的表達(dá)水平相對較低,而在地下部分中表達(dá)水平相對較高,推測這5個基因主要在地下部分發(fā)揮功能;CqKEA3a和CqKEA3b則主要在地上部分中發(fā)揮功能,同時當(dāng)植株受到鹽脅迫后這兩個基因表達(dá)水平上調(diào),推測其可以通過維持植株正常的離子穩(wěn)態(tài)來保證植株正常的生命活動。在CqKEA1、CqKEA2a和CqKEA2b中,除地下部分CqKEA2b對干旱和高溫脅迫不敏感,其余基因均對干旱和高溫脅迫有響應(yīng),推測其可能在這兩種脅迫下行使功能。綜上所述,本研究對CqKEA基因家族進(jìn)行了系統(tǒng)分析,為CqKEA基因功能研究奠定了理論基礎(chǔ),為研究藜麥耐逆機(jī)理和分子育種提供了基因資源。