李 暢,陳慧嬋,婁貴成,姜云爽,王政委,徐慶華,蒼 晶
(東北農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,黑龍江哈爾濱 150030)
在植物體內(nèi),鈣離子(Ca2+)作為一種普遍存在的第二信使,響應(yīng)很多逆境和發(fā)育過(guò)程。植物中有大量的鈣離子傳感-響應(yīng)器組件負(fù)責(zé)鈣離子的信號(hào)轉(zhuǎn)導(dǎo)[1]。鈣調(diào)神經(jīng)磷酸酶B亞蛋白(CBL)和與其相互作用的蛋白激酶(CIPKs)是鈣離子介導(dǎo)的信號(hào)轉(zhuǎn)導(dǎo)通路中的關(guān)鍵分子,參與響應(yīng)不同的外界應(yīng)激信號(hào)[2-3]。不同的CBL蛋白具有不同的EF-hand結(jié)構(gòu)域,CBL家族不同蛋白之間結(jié)構(gòu)域的差異可能與它們對(duì)鈣離子的不同結(jié)合能力有關(guān),這為CBL響應(yīng)不同的刺激信號(hào)引起的Ca2+濃度變化提供了基礎(chǔ)[4]。CBL基因在擬南芥中首次被發(fā)現(xiàn),目前在水稻[5]、番茄[6]、藜麥[7]、葡萄[8]等不同植物中也檢測(cè)出了多個(gè)CBL基因家族;部分CBL轉(zhuǎn)基因植株在不同非生物脅迫下的表達(dá)模式會(huì)發(fā)生不同的變化,從而調(diào)節(jié)植物的抗逆性[9]。CBL家族在植物生長(zhǎng)發(fā)育過(guò)程中發(fā)揮著關(guān)鍵作用,不僅能夠保持植物體內(nèi)離子濃度平衡與穩(wěn)定,在植物對(duì)環(huán)境適應(yīng)過(guò)程中也有著不可或缺的作用。擬南芥中,CBL家族基因AtCBL1、AtCBL2、AtCBL5、AtCBL9、AtCBL10均響應(yīng)非生物脅迫[10-14],其中,AtCBL1響應(yīng)低溫脅迫[15]。玉米中,ZmCBL3、ZmCBL4、ZmCBL5和ZmCBL8與ZmCIPK16互作響應(yīng)干旱、鹽等逆境脅迫[16]。在水稻中,過(guò)表達(dá)OsCBL8賦予了水稻對(duì)高溫和病原體的抵抗力[17],但OsCBL5對(duì)植物鹽脅迫負(fù)調(diào)控[18];低溫處理可提高豌豆的PsCBL轉(zhuǎn)錄水平,但干旱處理后,PsCBL的表達(dá)無(wú)顯著差異[19];在楊樹(shù)中,PeCBL1、PeCBL2、PeCBL4、PeCBL5和PeCBL9在鹽脅迫下表達(dá)量均上調(diào)[20]。但目前關(guān)于小麥CBLs的基因組學(xué)和參與非生物脅迫的研究尚未見(jiàn)報(bào)道。
為了探討小麥CBL的功能,本研究對(duì)小麥的CBL基因進(jìn)行了全基因組分析,探究小麥CBL基因特征,并對(duì)本課題組前期在轉(zhuǎn)錄組數(shù)據(jù)庫(kù)中篩選獲得的8個(gè)差異表達(dá)的小麥CBL基因(未發(fā)表)進(jìn)行表達(dá)模式分析,以期為深入研究小麥CBL基因的功能奠定基礎(chǔ)。
參考齊 越等[21]對(duì)小麥DEAD-box基因家族成員鑒定的方法。首先,從Ensembl Plants 數(shù)據(jù)庫(kù)(http://plants. ensembl.org/index.html)中下載小麥(中國(guó)春)全基因組數(shù)據(jù),包括全基因組序列及注釋文件,并且從水稻基因組數(shù)據(jù)庫(kù)(http://rice.plant biology.msu.edu/)下載水稻的CBL蛋白。利用水稻CBL家族蛋白質(zhì)序列作為query序列,以1∶5比例提取基因,并除去重復(fù)基因,檢索小麥CBL家族基因。利用Pfam(http://pfam.xfam.org/)及NCBI(http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)驗(yàn)證候選蛋白的結(jié)構(gòu)域,手動(dòng)逐一篩選錯(cuò)誤序列,排除冗余序列,以獲得目標(biāo)小麥CBL家族基因成員。使用在線軟件ExPASy(http://expasy.org/)預(yù)測(cè)小麥CBL蛋白氨基酸長(zhǎng)度、分子量、等電點(diǎn)和脂肪指數(shù)等理化性質(zhì)。在亞細(xì)胞定位預(yù)測(cè)網(wǎng)站(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)對(duì)CBL進(jìn)行亞細(xì)胞定位預(yù)測(cè)。
使用ClusterX V2.0(http://www.clustal.org/clustal2/)對(duì)小麥、水稻、擬南芥的CBL基因家族所編碼的蛋白質(zhì)進(jìn)行氨基酸序列對(duì)比分析。使用MEGA(https: //www.megasoftware.net/)軟件的最大似然法(ML)構(gòu)建系統(tǒng)發(fā)育樹(shù),設(shè)置bootstrap值為1 000。下載的序列已知染色體位置。
對(duì)小麥CBL家族蛋白保守基序的檢索分析采用MEME軟件(http://meme-suit.org/),檢索參數(shù)使用Zero or one occurrence per sequence(zoops),基序數(shù)值設(shè)為9。參考Pfam數(shù)據(jù)庫(kù),對(duì)小麥CBL基因家族進(jìn)行蛋白保守結(jié)構(gòu)域比對(duì)分析(E-value≤1.0)。使用在線軟件GSD2.0(http://gsds.gaolab.org/)分析基因結(jié)構(gòu),TaCBL基因組和CDS序列在EnSembl Plants數(shù)據(jù)庫(kù)中獲得,將序列導(dǎo)入到在線軟件GSD2.0中,對(duì)小麥CBL內(nèi)含子和外顯子結(jié)構(gòu)進(jìn)行分析。
應(yīng)用Phytozome數(shù)據(jù)庫(kù)(https://data.jgi.doe.gov/)獲得水稻和擬南芥的全基因組序列及其基因注釋文件。小麥基因組數(shù)據(jù)庫(kù)中,使用Circos軟件獲得位置信息,將所有小麥CBL基因定位到染色體上。使用小麥全基因組數(shù)據(jù)與水稻及擬南芥全基因組對(duì)照提取(每個(gè)基因提取數(shù)≤30)。使用MCScanX對(duì)小麥進(jìn)行共線性分析,參數(shù)設(shè)置取默認(rèn)值?;蛑g的進(jìn)化關(guān)系由同義替代率(Ks)和非同義替代率(Ka)表現(xiàn),使用KaKs_Calculator 2.0計(jì)算小麥的Ka/Ks比值,除了三對(duì)TaCBL基因的Ka/Ks比值大于1,其他TaCBL小麥基因的Ka/Ks比值均小于1,由此分別構(gòu)建出小麥種內(nèi)共線性圖譜及小麥與水稻、擬南芥種間共線性圖譜。所有TaCBL基因的位置和染色體長(zhǎng)度從EnSembl Plants數(shù)據(jù)庫(kù)注釋信息中獲得,并且用TB Tools進(jìn)行繪制。
對(duì)課題組先前建立的轉(zhuǎn)錄組數(shù)據(jù)庫(kù)進(jìn)行分析發(fā)現(xiàn),Dn1的分蘗節(jié)和葉片含有大量與低溫脅迫有關(guān)的CBL,篩選到8個(gè)低溫脅迫下表達(dá)量變化顯著的CBL,本研究對(duì)這8個(gè)CBL在低溫下的表達(dá)模式進(jìn)行分析。供試材料選用強(qiáng)抗寒性冬小麥品種東農(nóng)冬麥1號(hào)(Dn1)和東農(nóng)冬麥2號(hào)(Dn2),于2020年9月12日播種于東北農(nóng)業(yè)大學(xué)試驗(yàn)田,種植區(qū)行長(zhǎng)2 m,種植間距0.2 m,播種深度為5 cm,每行播種約200粒。覆土進(jìn)行自然萌發(fā)。大田自然降溫連續(xù)10 d平均的最低溫度分別達(dá)到5 ℃、0 ℃、-10 ℃和-25 ℃時(shí),取其葉片和分蘗節(jié)用于8個(gè)基因表達(dá)量測(cè)定。
使用康為世紀(jì)的Ultrapure RNA Kit試劑盒提取樣品的總RNA,使用諾唯贊HiScript III 1st Strand cDNA Synthesis Kit (+gDNA wiper)試劑盒對(duì)提取的總RNA合成cDNA。使用小麥多組學(xué)數(shù)據(jù)庫(kù)(http://202.194.139.32/)設(shè)計(jì)8個(gè)CBL基因的qRT-PCR 特異性引物(表1),并且利用2-△△CT方法計(jì)算其相對(duì)表達(dá)量。
表1 qRT-PCR 特異性引物Table1 qRT-PCR specific primers
參照水稻基因組數(shù)據(jù)庫(kù)中CBL蛋白序列,在EnsemblPlants小麥全基因組數(shù)據(jù)庫(kù)中共鑒定出68個(gè)CBL基因,并分別命名為T(mén)aCBL1~TaCBL68,基因長(zhǎng)度為444~4 679 bp,編碼的氨基酸在147~627 aa之間;對(duì)應(yīng)的蛋白相對(duì)分子質(zhì)量在16.42~68.9 kDa之間,理論等電點(diǎn)(pI)4.1~6.6,脂肪系數(shù)70.07~94.84;親水性指數(shù)-0.031~-0.602,親水性較好的。亞細(xì)胞定位分析顯示,34個(gè)CBL蛋白定位于細(xì)胞核,25個(gè)定位于細(xì)胞膜,9個(gè)定位于細(xì)胞質(zhì)及細(xì)胞膜(表2)。
表2 小麥TaCBL基因家族理化性質(zhì)Table 2 Physical and chemical properties of wheat TaCBL gene family
利用ML對(duì)小麥、水稻和擬南芥CBL基因進(jìn)行系統(tǒng)進(jìn)化分析。通過(guò)拓?fù)浣Y(jié)構(gòu)域分析,可將CBL基因分成8類(圖1),其中G類的CBL基因最多,共31個(gè),E類中的CBL基因最少,僅有2個(gè),且均為小麥CBL基因。A、B、C、D四類在所選三個(gè)物種間均存在;相比于擬南芥,小麥與水稻的CBL家族成員關(guān)系更近,推測(cè)二者中CBL基因的功能類似,這可能與水稻和小麥都屬于禾本科單子葉農(nóng)作物有關(guān)。
圖1 小麥、水稻和擬南芥CBL家族蛋白系統(tǒng)進(jìn)化樹(shù)Fig.1 Phylogenetic tree of the CBL family proteins in wheat, rice and Arabidopsis
基因的功能由其結(jié)構(gòu)決定,MEME建樹(shù)顯示,68個(gè)小麥TaCBL可歸為8大類,與系統(tǒng)進(jìn)化樹(shù)分類一致(圖2)。同類分支中各基因核心基序排列順序較統(tǒng)一,具體表現(xiàn)為:所有TaCBL基因均含有Motif4,絕大部分基因都含有Motif4和Motif5,推測(cè)其可能是CBL基因特有的保守序列;基序分析發(fā)現(xiàn),同一類群中的大多數(shù)成員具有相似的motif,推測(cè)其功能相似;個(gè)別核心基序與其他基序排列不同,如TaCBL9基因僅包含Motif5。通過(guò)結(jié)構(gòu)域分析發(fā)現(xiàn),所有的CBL蛋白均含EF-hand結(jié)構(gòu)域,其中F類中含有EF-hand結(jié)構(gòu)域最多,D類中最少。
圖2 小麥CBL蛋白的進(jìn)化樹(shù)(a)、核心基序(b)及蛋白結(jié)構(gòu)域(c)Fig.2 Phylogenetic tree(a),core motif(b) and protein domain(c) of wheat CBL proteins
通過(guò)在線軟件GSD2.0對(duì)小麥CBL蛋白結(jié)構(gòu)分析發(fā)現(xiàn),CBL基因家族成員的內(nèi)含子分布并不均勻,數(shù)量為 1~8個(gè)不等,但同類中大部分CBL基因內(nèi)含子與外顯子數(shù)量相近,如B類中的內(nèi)含子均為1個(gè),H類中的內(nèi)含子為7~8個(gè),而結(jié)構(gòu)域也均被內(nèi)含子分隔。同類中大部分小麥CBL基因具有相似結(jié)構(gòu),表明基因結(jié)構(gòu)可能與它們的遺傳進(jìn)化關(guān)系密切。
小麥68個(gè)TaCBL共分布在18條染色體上,每條染色體攜帶的基因數(shù)各不相同(圖3),其中第五同源群染色體攜帶的TaCBL數(shù)最多,5A染色體共有6個(gè)TaCBL,5B和5D染色體均有7個(gè)TaCBL;第六同源群染色體所攜帶的TaCBL數(shù)最少,6A、6B、6D三條染色體均只包含一個(gè)TaCBL。
圖3 小麥TaCBL基因在染色體上的分布Fig.3 Distribution of TaCBL genes on chromosomes in wheat
共線性分析表明,本研究所檢測(cè)基因組共含100個(gè)共線性基因?qū)?而分布在同基因組不同染色體的Ta-CBL也普遍表現(xiàn)出共線性,這表明小麥TaCBL多為同源染色體上的等位基因或旁系同源基因,映射了其在進(jìn)化上存在基因擴(kuò)張。例如,位于1A染色體上的TaCBL2與位于3B染色體上的TaCBL32具有共線性關(guān)系;1B染色體上的TaCBL5與5A染色體上的TaCBL51有共線性關(guān)系,位于1B上的TaCBL8分別與3A、3B和3D染色體上的TaCBL27、TaCBL31以及TaCBL34基因間存在共線性關(guān)系;位于2D染色體的TaCBL23分別與位于4A、4B和4D染色體上的TaCBL36、TaCBL42以及TaCBL45基因之間存在共線性關(guān)系(圖4)。綜合結(jié)果得出,小麥TaCBL可能由基因復(fù)制形成,其所編碼的蛋白在進(jìn)化過(guò)程中一定程度上受截?cái)鄰?fù)制影響。
圖4 小麥、水稻和擬南芥CBL基因的共線性關(guān)系Fig.4 Collinearity of CBL genes among wheat,rice and Arabidopsis
由圖4可見(jiàn),擬南芥與小麥基因的種間共線性關(guān)系相對(duì)較少,只有5種,分布在小麥1A、1B和2B染色體上;而小麥與水稻種間共有87組共線性關(guān)系,各個(gè)染色體上關(guān)聯(lián)的共線性基因?qū)幌嗤?其中4B和5D兩條染色體上的共線性基因?qū)?shù)量最多,各有8對(duì),6A、6B、6D存在的共線性最少,分別只有1對(duì);水稻1號(hào)染色體上的3個(gè)OsCBL同小麥6A、6B和6D染色體上的3個(gè)TaCBL間發(fā)生有序配對(duì),這表示水稻1號(hào)染色體和小麥6號(hào)染色體在CBL進(jìn)化的線性關(guān)系上存在高度的一致性。
Dn1的qRT-PCR分析結(jié)果(圖5A和圖5B)表明,在分蘗節(jié)中,隨溫度降低,TaCBL1的表達(dá)量呈“升-降-升”的趨勢(shì),在-25 ℃時(shí)表達(dá)量最高;TaCBL46和TaCBL59的表達(dá)量呈先升后降的趨勢(shì),均在-10 ℃時(shí)表達(dá)量最高;TaCBL17、TaCBL30、TaCBL38、TaCBL47和TaCBL55的表達(dá)量逐漸升高,-25 ℃時(shí)的表達(dá)量最高,達(dá)到了0 ℃的二倍。在葉片中,隨溫度降低,這8個(gè)TaCBL的表達(dá)量均呈先升高后降低的趨勢(shì),除了TaCBL47在0 ℃時(shí)的表達(dá)量最高,其他7個(gè)TaCBL均在-10 ℃時(shí)表達(dá)量最高,且均達(dá)到0 ℃時(shí)表達(dá)量的二倍以上?;蜷g比較,在Dn1分蘗節(jié)中,TaCBL30、TaCBL47和TaCBL55對(duì)低溫脅迫的響應(yīng)最為明顯,且均在-25 ℃時(shí)表達(dá)量顯著高于其他基因;在Dn1葉片中,TaCBL30和TaCBL55對(duì)低溫脅迫的響應(yīng)最為明顯,在-10 ℃時(shí)表達(dá)量顯著高于其他基因。
A:Dn1分蘗節(jié); B:Dn1葉片; C:Dn2分蘗節(jié); D:Dn2葉片; 圖柱上不同小寫(xiě)字母表示不同處理間差異顯著(P<0.05)。A:Dn1 tillering nodes; B:Dn1 leaves; C:Dn2 tillering nodes; D:Dn2 leaves; Different lowercase letters above columns indicate significant differences between different temperatures (P< 0.05).圖5 低溫脅迫下Dn1和Dn2葉片和分蘗節(jié)中8個(gè)TaCBL的表達(dá)Fig.5 Expression of 8 TaCBL genes in leaves and tillers of Dn1 and Dn2 under low temperature stress
Dn2的qRT-PCR分析結(jié)果(圖5C和圖5D)表明,在分蘗節(jié)中,隨溫度降低,TaCBL17的表達(dá)量呈“升-降-升”的趨勢(shì),在-25 ℃時(shí)表達(dá)量最高,達(dá)到了-10 ℃表達(dá)量的2倍;TaCBL46和TaCBL55的表達(dá)量呈現(xiàn)先升高后降低的趨勢(shì),其中TaCBL46在0 ℃時(shí)表達(dá)量最高,TaCBL55在-10 ℃時(shí)表達(dá)量最高;TaCBL1、TaCBL30、TaCBL38、TaCBL47和TaCBL59的表達(dá)量逐步升高,-25 ℃時(shí)的表達(dá)量達(dá)到5 ℃時(shí)表達(dá)量的二倍以上。在葉片中,TaCBL1和TaCBL17的表達(dá)量隨著溫度的降低而逐步升高;TaCBL30、TaCBL38、TaCBL46、TaCBL47、TaCBL55和TaCBL59的表達(dá)量呈先升高后降低的趨勢(shì),其中TaCBL46和TaCBL47在0 ℃時(shí)表達(dá)量最高,TaCBL30、TaCBL38、TaCBL55和TaCBL59在-10 ℃時(shí)表達(dá)量最高?;蜷g比較,在Dn2分蘗節(jié)中,TaCBL30、TaCBL47和TaCBL55對(duì)低溫脅迫的響應(yīng)最為明顯,最高表達(dá)量均達(dá)到了0 ℃時(shí)表達(dá)量的二倍以上;在Dn2葉片中,TaCBL30、TaCBL47和TaCBL55對(duì)低溫脅迫的響應(yīng)最為明顯,最高表達(dá)量均達(dá)到5 ℃時(shí)表達(dá)量的二倍以上。
目前,在多種單子葉和雙子葉植物中均發(fā)現(xiàn)了CBL家族成員,例如,在水稻中鑒定出了10個(gè)CBL家族成員[22],玉米中鑒定出了12個(gè)CBL家族成員[23],煙草和亞洲棉中各鑒定出了20個(gè)CBL家族成員[24- 25]。本研究基于生物信息學(xué)分析,共從小麥中鑒定出68個(gè)CBL,通過(guò)對(duì)TaCBL蛋白的理化性質(zhì)進(jìn)行分析,基因片段、編碼蛋白的氨基酸數(shù)及其分子質(zhì)量和等電點(diǎn)(pI)及亞細(xì)胞定位均有一定的差異,預(yù)示著該基因功能具有多樣性;該家族成員在染色體上呈不規(guī)則分布,但在在第一和第五同源群染色體上分布較多,推測(cè)小麥A、B、D不同基因組中的TaCBL之間可能存在功能冗余或多數(shù)TaCBL基因不具有功能。
植物中的Ca2+傳感蛋白的功能主要表現(xiàn)在參與特定的信號(hào)轉(zhuǎn)導(dǎo)、感受并響應(yīng)Ca2+濃度變化、參與植物對(duì)多種環(huán)境刺激(包括生物和非生物脅迫)的應(yīng)答等方面,在植物的多種生命活動(dòng)中發(fā)揮重要作用[26]。CBL蛋白作為小麥的Ca2+傳感蛋白,通過(guò)結(jié)合Ca2+并與特異的蛋白激酶互作后傳遞鈣信號(hào)[27]。結(jié)構(gòu)分析顯示,小麥全部TaCBL都含有內(nèi)含子和外顯子,根據(jù)其結(jié)構(gòu)特點(diǎn)可分為8類;同類中的核心基序間的排布表現(xiàn)出高度相似性,且所編碼的蛋白質(zhì)均攜帶數(shù)量不等,變異程度不均的EF-hand結(jié)構(gòu)域。EF-hand結(jié)構(gòu)域是植物中Ca2+傳感器活性調(diào)節(jié)的重要影響因素[28],其數(shù)量和位點(diǎn)差異可能導(dǎo)致其Ca2+結(jié)合能力不同,從而導(dǎo)致基因具有不同生物學(xué)功能[29-30]。8類小麥TaCBL蛋白中,A和B類所含EF-hand結(jié)構(gòu)域數(shù)量最多,推測(cè)這兩類蛋白與Ca2+的結(jié)合能力更強(qiáng),可能在響應(yīng)Ca2+介導(dǎo)的抗寒調(diào)控過(guò)程中起重要作用。CIPK作為一種絲氨酸-蘇氨酸蛋白激酶,通過(guò)激活磷酸化?;?jí)聯(lián)反應(yīng)對(duì)脅迫或抗應(yīng)激功能相關(guān)基因的表達(dá)加以調(diào)控;CBL家族成員在各類非生物脅迫中起著重要作用,調(diào)控方式包括CBL和CIPK之間的互作及靶蛋白磷酸化等[31-32]。植物中的CIPK和CBL家族都屬于多基因家族蛋白,二者在Ca2+信號(hào)傳遞過(guò)程中協(xié)同發(fā)揮作用,對(duì)于CBL-CIPK網(wǎng)絡(luò),其中的傳感器蛋白和效應(yīng)激酶會(huì)以復(fù)雜的排列方式相互作用,而對(duì)上述Ca2+調(diào)控過(guò)程的詳細(xì)分子機(jī)制仍沒(méi)有完善的解釋。
CBL在植物逆境應(yīng)激信號(hào)中發(fā)揮關(guān)鍵作用,我們根據(jù)轉(zhuǎn)錄組學(xué)分析選用了8個(gè)在低溫條件下差異表達(dá)最顯著的基因,分析其在強(qiáng)抗寒冬小麥的分蘗節(jié)和葉片中的表達(dá),結(jié)果顯示,這8個(gè)TaCBL在不同品種中的表達(dá)不盡相同,TaCBL在Dn2的分蘗節(jié)和葉片的表達(dá)量總體比Dn1中相應(yīng)部位高;而在不同組織之間TaCBL表達(dá)模式隨溫度變化也表現(xiàn)出顯著差異,例如,Dn1分蘗節(jié)中TaCBL30在-10 ℃時(shí)的相對(duì)表達(dá)量比5 ℃時(shí)提高了43%,而在葉片中TaCBL30在-10 ℃時(shí)較5 ℃時(shí)提高了60%,表明TaCBL在不同品系與組織間表達(dá)有差異。在Dn1和Dn2中,TaCBL在分蘗節(jié)中的表達(dá)量均高于葉片;分蘗節(jié)中TaCBL的表達(dá)量普遍在-25 ℃時(shí)最高,而在葉片中CBL的表達(dá)量普遍在-10 ℃時(shí)最高,說(shuō)明TaCBL對(duì)寒冷脅迫響應(yīng)速度不同,這可能會(huì)影響不同品系冬小麥抗寒能力,而出現(xiàn)這種現(xiàn)象的原因可能是由于葉片組織處于地上,分蘗節(jié)處于地下受到土壤保護(hù),導(dǎo)致二者對(duì)環(huán)境脅迫的響應(yīng)不同。
綜上,本研究對(duì)小麥CBL蛋白基因家族進(jìn)行了全基因組鑒定、生物信息學(xué)分析和表達(dá)模式分析,為深入解析小麥CBL基因家族的功能及其作用機(jī)制奠定了基礎(chǔ),對(duì)于進(jìn)一步挖掘小麥抗寒基因資源,培育抗寒作物新品種,具有重要的理論和實(shí)踐意義。