張 騰,尹夢嬌,郭紅媛,姜曉東,賈舉慶,王艷勝,溫 賀,梁月秀,趙立松,趙威軍,呂晉慧,李艷鋒,張春來,
(1.山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,國家功能雜糧技術(shù)創(chuàng)新中心,山西省旱作栽培與作物生態(tài)重點(diǎn)實(shí)驗(yàn)室,山西省黃土高原特色作物高效生產(chǎn)協(xié)同創(chuàng)新中心,山西太谷030801;2.山西省農(nóng)業(yè)科學(xué)院高粱研究所,山西晉中030600;3.山西農(nóng)業(yè)大學(xué)林學(xué)院,山西太谷030801)
高粱(Sorghum bicolor)是世界上第五大禾谷類作物,大多數(shù)品種具有抗旱、耐貧瘠和耐鹽堿等多重抗性[1-2]。其是我國非常重要的旱地糧食作物,在多個(gè)省份均有種植,且栽培面積較廣,其中以東北地區(qū)為最多。部分高粱基因組的測序工作已經(jīng)在2009 年前后順利完成,如高粱品種BTx623,這使得從基因組水平來揭示高粱重要基因家族的功能成為現(xiàn)實(shí)與可能[2-3]。
Dicer-like(DCL)基因在植物體內(nèi)表達(dá)的蛋白最終產(chǎn)物是一種核糖核酸內(nèi)切酶,該基因群是RNase III 家族中能夠特異識(shí)別雙鏈RNA 的一類基因[4]。由于DCL 基因的功能涉及到了多種起調(diào)控作用的小RNA 分子的產(chǎn)生,所以DCL 基因?qū)Υ蠖鄶?shù)植物的生長發(fā)育、抗性效應(yīng)和非生物脅迫等響應(yīng)過程起到了非常重要的作用[5]。
目前,DCL 基因在擬南芥(Arabidopsis thaliana)上研究比較透徹,擬南芥共有4 個(gè)DCL:AtDCL1,AtDCL2,AtDCL3 和AtDCL4。其中,AtDCL1 的primiRNA 被剪切2 次產(chǎn)生21 nt 雙鏈miRNA,并從核內(nèi)釋放,分別與雙鏈RNA 結(jié)合蛋白HYL1 和鋅蛋白SERRATE(SE)結(jié)合[6-8];當(dāng)植物被感染時(shí),AtDCL2負(fù)責(zé)22 nt 病毒衍生的siRNA[9];AtDCL3 產(chǎn)生24 nt ra-siRNA;AtDCL4 產(chǎn) 生21 nt ta-siRNA 和 一 些miRNA[10-12]。miRNA 和siRNA 的產(chǎn)生還需要ssRNA結(jié)合蛋白DAWDLE 和TOUGH[13-14]。
許多植物體DCL 基因的功能研究主要集中于siRNA 的產(chǎn)生及其功能方面,而在miRNA 的產(chǎn)生及功能研究卻相對較少[15],比如植物無融合生殖與miRNA 以及基因沉默的關(guān)系如何,所以DCL 基因的功能及作用機(jī)制研究還有很大的空間。
本研究對高粱DCL(SbDCLs)基因結(jié)構(gòu)、蛋白質(zhì)理化性質(zhì)與亞細(xì)胞定位、蛋白質(zhì)二三級(jí)結(jié)構(gòu)、系統(tǒng)進(jìn)化與基因差異表達(dá)進(jìn)行了分析,旨在為SbDCLs基因調(diào)控提供一定的試驗(yàn)依據(jù)與理論基礎(chǔ)。
供試高粱品系為2457B,R111,1383-2,5-27sugarB和SSA-1。葉、根、莖取自生長中期材料,胚珠、花藥取自抽穗但未散粉的穗子。幼嫩種子分別取自授粉后10,30 d 種子。用Trizol 試劑提取高質(zhì)量RNA,采用Hiseq4000 平臺(tái)進(jìn)行測序,各樣品產(chǎn)生Clean Data(去除污染、載體后序列)6~9 Gb,能完好地覆蓋高粱轉(zhuǎn)錄組。
1.2.1 基因檢索 以擬南芥(Arabidopsis thaliana)和水稻(Oryza sativa)的DCL 蛋白質(zhì)序列作為參考,將轉(zhuǎn)錄組測序檢測到SbDCLs 序列,在Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)和NCBI(https://www.ncbi.nlm.nih.gov/)數(shù)據(jù)庫中進(jìn)行Blast搜尋和比對,最終確定轉(zhuǎn)錄組測序檢測到的DCL,并獲得SbDCLs 家族的基因序列、CDS 序列、蛋白序列;玉米(Zea mays)、谷子(Setaria italica)、大豆(Glycine max)、藜麥(Chenopodium quinoa Willd)的DCL 蛋白質(zhì)序列來自Phytozome 數(shù)據(jù)庫;甜菜(Beta vulgaris)和小麥(Triticum aestivum)的DCL 蛋白質(zhì)序列來自NCBI。
1.2.2 生物信息學(xué)分析方法 采用Gene Structure Display Sever(http://gsds.cbi.pku.edu.cn/)分 析 基 因的結(jié)構(gòu);采用ExPASY-ProtParam tool(https://web.expasy.org/protparam/)對蛋白質(zhì)的基本理化性質(zhì)進(jìn)行分析;采用SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP)預(yù)測蛋白質(zhì)是否含有信號(hào)肽;采用MultiLoc(https://abi-services.informatik.uni-tuebingen.de/multiloc2/webloc.cgi)對蛋白質(zhì)進(jìn)行亞細(xì)胞定位預(yù)測。
采用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)對蛋白質(zhì)二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測;在Pfam(http://pfam.xfam.org/)數(shù)據(jù)庫預(yù)測SbDCLs 蛋白的功能結(jié)構(gòu)域;采用Raptor X(http://raptorx.uchicago.edu/)對蛋白質(zhì)的三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測,采用Ramachandran Plot Analysis(http://mordred.bioc.cam.ac.uk/)檢驗(yàn)蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測的準(zhǔn)確性。
利用MEGA7 軟件,對序列進(jìn)行Clustal W 比對,然后再使用NJ 鄰接法(Neighbor Joining)構(gòu)建系統(tǒng)進(jìn)化樹。利用已發(fā)表的高粱表達(dá)Atalas 數(shù)據(jù)[16-17],獲取目的基因在高粱各個(gè)生育期不同部位的FPKM值,再利用HemI 軟件作出表達(dá)量的熱圖。利用MEGA7 軟件對CDS 序列進(jìn)行比對,再利用DnaSP v5軟件計(jì)算出編碼基因的進(jìn)化選擇壓力。
查找高粱的轉(zhuǎn)錄組測序數(shù)據(jù),并利用數(shù)據(jù)庫篩選到SbDCLs 基因6 個(gè)(表1)。SbDCLs 基因長度為6 533~25 401 bp,分布在第SBI-01,SBI-03 和SBI-06 共3 條染色體上;其中,SbDCL2a,SbDCL2b,SbDCL3b 和SbDCL1 集中在SBI-01 上,而且SbDCL2a 和SbDCL2b 在SBI-01 上串聯(lián)重復(fù)排列。每個(gè)SbDCLs 基因都有1 個(gè)或多個(gè)轉(zhuǎn)錄本,本研究選用的為初級(jí)轉(zhuǎn)錄本蛋白,具體蛋白質(zhì)的編號(hào)如表1所示。
表1 SbDCLs 家族基因信息
SbDCLs 基因結(jié)構(gòu)分析顯示(圖1),所有SbDCL 均存在上下游非編碼區(qū),但其長度相對于基因長度均較短;SbDCL2a 基因CDS 數(shù)量最少,為10個(gè),其他5 個(gè)SbDCLs 基因的CDS 數(shù)量為19~26 個(gè);SbDCL4 基因的內(nèi)含子較長,由于外顯子與內(nèi)含子接頭區(qū)存在一段高度保守的一致序列,SbDCL4 相對于其他SbDCLs 存在更多的高度保守序列數(shù)量。
由表2 可知,SbDCLs 蛋白氨基酸數(shù)目為787~1 929 個(gè),分子量大小在87 491.22~215 272.04 u,平均分子量大小為171 154.23 u;理論等電點(diǎn)為6.17~6.84,所有高粱DCL 蛋白等電點(diǎn)均小于7;不穩(wěn)定性系數(shù)分析表明,SbDCL2a 蛋白的穩(wěn)定系數(shù)為36.38,為穩(wěn)定蛋白,其余DCL 蛋白均為不穩(wěn)定蛋白(不穩(wěn)定系數(shù)>40);親水疏水性分析表明,SbDCLs蛋白均為兩性蛋白[18]。
表2 SbDCLs 蛋白理化性質(zhì)
表3 SbDCLs 蛋白亞細(xì)胞定位預(yù)測
SbDCsL 蛋白質(zhì)的信號(hào)肽預(yù)測最大,C,Y,S 值均偏低,均<0.5,表明蛋白都不含信號(hào)肽,不是分泌型蛋白。蛋白質(zhì)亞細(xì)胞定位預(yù)測顯示(表3),SbDCLs 蛋白均定位在細(xì)胞核上,可能性為61.76%~99.99%,可能性都比較高;SbDCL1 置信度值為0.98,說明其可靠性非常高,但是其他SbDCLs 置信區(qū)間值都較低,并不可靠。
SbDCLs 蛋白家族的二級(jí)結(jié)構(gòu)主要由α- 螺旋、無規(guī)則卷曲構(gòu)成(二者在蛋白質(zhì)中所占氨基酸數(shù)量的比例大于70%),而延伸鏈(延伸鏈?zhǔn)铅? 折疊的組成結(jié)構(gòu))、β- 轉(zhuǎn)角比例較低(表4)。由此可推測,α- 螺旋和無規(guī)則卷曲是SbDCLs 蛋白的大量結(jié)構(gòu)元件,而延伸鏈和β- 轉(zhuǎn)角則散布于整個(gè)蛋白質(zhì)中。
表4 SbDCLs 蛋白二級(jí)結(jié)構(gòu)分析 %
由圖2 可知,SbDCLs 蛋白均含有2 個(gè)RNase III 基本結(jié)構(gòu)域;除了SbDCL2a 之外,其他SbDCLs均含有Helicase C,Dicer dimer 和PAZ 保守結(jié)構(gòu)域;SbDCL2a,SbDCL1 和SbDCL4 含有dsrm 模體;Sb-DCL2b,SbDCL3b 和SbDCL3a 都含有DEAD helicase;SbDCL1 和SbDCL4 都 含 有ResIII 和DND1 DSRM結(jié)構(gòu)域。
采用Raptor X 軟件預(yù)測高粱DCL 蛋白的三級(jí)結(jié)構(gòu)顯示(圖3),DCL 蛋白三級(jí)結(jié)構(gòu)主要由α- 螺旋、無規(guī)則卷曲構(gòu)成,與二級(jí)結(jié)構(gòu)預(yù)測結(jié)果一致。采用MPAGE 中的Ramachandran plot analysis 軟件評(píng)估建模模型,結(jié)果顯示(表5),氨基酸殘基所處的最佳區(qū)域比率為86.90%~88.20%,可接受區(qū)域比率為7.80%~9.20%,高粱DCL 蛋白三級(jí)結(jié)構(gòu)建模的可信度均大于95.50%。
表5 SbDCLs 蛋白質(zhì)三級(jí)結(jié)構(gòu)模型評(píng)估 %
SbDCLs 蛋白的系統(tǒng)進(jìn)化樹(圖4-A)分析,Sb-DCL2a 與SbDCL2b,SbDCL3b 與SbDCL3a 為旁系同源序列。DCL 蛋白系統(tǒng)進(jìn)化樹(圖4-B)分析可知,DCL 分為4 個(gè)分枝,分別是DCL1,DCL2,DCL3和 DCL4;SbDCL1 與 ZmDCL1/101,SbDCL2a 與ZmDCL2b,SbDCL2b 與ZmDCL2a/105,SbDCL3a 與ZmDCL3a/104,SbDCL3b 與ZmDCL3b/102,SbDCL4與ZmDCL4/103 互為直系同源基因,說明高粱與玉米的DCL 基因在進(jìn)化上同源關(guān)系更近;進(jìn)化樹中的單子葉植物(高粱、水稻、谷子、玉米和小麥)與雙子葉植物(擬南芥、大豆、甜菜和藜麥)不能聚到同一分枝下,說了DCL 基因在進(jìn)化過程中出現(xiàn)單雙子葉的分化。
在葉片、根、莖、不同生育時(shí)期的種子、花藥和胚珠轉(zhuǎn)錄組中,檢測到6 個(gè)SbDCLs 的轉(zhuǎn)錄活性(圖5),SbDCLs 表達(dá)水平分析發(fā)現(xiàn),除了SbDCL3b 幾乎不表達(dá)外,其他SbDCLs 均有相對較高的表達(dá)水平;同時(shí)發(fā)現(xiàn),SbDCLs 在種子、花藥和胚珠等生殖器官或組織的表達(dá)水平普遍高于葉、根、莖和芽等營養(yǎng)器官。
高粱R111 和SSA-1 不同時(shí)期的種子及SSA-1 花藥SbDCLs 表達(dá)水平分析結(jié)果顯示(圖5-A),SbDCL2a,SbDCL1 和SbDCL4 表達(dá)水平相對于SbDCL2b 更高,但是在胚珠和花粉中SbDCL2b和這些基因一樣有較高的表達(dá)水平;隨著種子的成熟,SbDCL2a,SbDCL2b 和SbDCL1 表達(dá)水平有上升的趨勢,但是SbDCL3a 和SbDCL4 表達(dá)水平卻隨著種子成熟出現(xiàn)下降的趨勢;SbDCL2a,SbDCL2b,Sb-DCL3b 和SbDCL1 在花粉中的表達(dá)水平明顯高于胚珠,而SbDCL3a 和SbDCL4 卻是在胚珠的表達(dá)水平明顯高于花粉。
高粱品種1383-2,2457B 和5-27sugerB 的葉片以及高粱5-27sugerB 的根、莖和高粱R111 莖、葉SbDCLs 表達(dá)分析結(jié)果表明(圖5-B),SbDCL2b和SbDCL4 在不同品種的高粱葉片表達(dá)水平有顯著差異,在1383-2 葉片中表達(dá)水平遠(yuǎn)高于高粱2457B,R111 和5-27sugerB;除了SbDCL3a 在高粱5-27sugerB 莖中表達(dá)水平低于高粱R111 莖外,其余SbDCLs 在高粱5-27sugerB 莖中表達(dá)水平遠(yuǎn)高于高粱R111 莖。
利用高粱表達(dá)Atalas 數(shù)據(jù)構(gòu)建高粱表達(dá)量熱圖(圖6),由圖6 可知,SbDCL2b,SbDCL3b 在整個(gè)高粱生育期幾乎不表達(dá),而SbDCL4 在整個(gè)生育期都只有低水平表達(dá);但是SbDCL2a,SbDCL1 和Sb-DCL3a 在生育期某個(gè)階段具有較高的表達(dá)水平。其中,SbDCL3a 和SbDCL1 在花蕾期的穗部表達(dá)水平較高;而SbDCL2a 在成熟期的莖中部節(jié)間、花期的莖中部節(jié)間、花期的旗葉1 節(jié)間和成熟期的旗葉1節(jié)間表達(dá)水平較高;SbDCL3a 花期的穗上部和花蕾期的花梗表達(dá)水平較高。表達(dá)水平由高到低依次為花蕾期的穗部、莖中部節(jié)間和花期的莖中部節(jié)間、花蕾期的花梗、花期的旗葉1 節(jié)間、成熟期的旗葉1節(jié)間、花期的穗上部。
遺傳學(xué)中常用非同義突變率(Ka)與同義突變率(Ks)的比值(Ka/Ks)來判斷是否有選擇壓力作用于這個(gè)蛋白質(zhì)編碼基因:如果Ka/Ks 遠(yuǎn)大于1,則認(rèn)為有正選擇效應(yīng);如果Ka/Ks=1,則認(rèn)為存在中性選擇;如果Ka/Ks 遠(yuǎn)小于1,則認(rèn)為有純化選擇作用。SbDCLs 編碼區(qū)基因的Ka/Ks 遠(yuǎn)小于1,說明SbDCLs蛋白的編碼基因受純化選擇作用(表6)。
表6 SbDCLs 進(jìn)化選擇參數(shù)
本研究結(jié)果表明,高粱全基因組范圍內(nèi)鑒定出SbDCLs 基因共有6 個(gè),分布在第SBI-01,SBI-03和SBI-06 共3 條染色體上;其中,SbDCL2a,SbDCL2b,SbDCL3b 和SbDCL1 集中在SBI-01 上,而且SbDCL2a 和SbDCL2b 在SBI-01 上串聯(lián)重復(fù)排列。SbDCL2a 與SbDCL2b 進(jìn)化樹上雖然是同源序列,但是SbDCL2a 功能結(jié)構(gòu)域上只有2 個(gè)RNase III 結(jié)構(gòu)域和1 個(gè)dsrm 模體,相比SbDCL2b 簡單許多,同時(shí)二者染色體位置上屬于串聯(lián)重復(fù),基因結(jié)構(gòu)相似,推測SbDCL2a 很可能是由SbDCL2b 小范圍復(fù)制所致。
SbDCLs 蛋白質(zhì)主要是兩性蛋白,且理論等電點(diǎn)小于7;除SbDCL2a 蛋白之外,其他SbDCLs 蛋白質(zhì)均不穩(wěn)定;所有SbDCLs 蛋白不存在信號(hào)肽,不是分泌型蛋白,這與SbDCLs 蛋白亞細(xì)胞定位均在細(xì)胞核上的結(jié)果表現(xiàn)一致。SbDCLs 蛋白質(zhì)的二級(jí)結(jié)構(gòu)主要是α- 螺旋、無規(guī)則卷曲;RNase III 結(jié)構(gòu)域是DCL 基本功能結(jié)構(gòu);DCL 蛋白質(zhì)的三級(jí)結(jié)構(gòu)比較復(fù)雜,但模型可信度大于95.50%。
系統(tǒng)進(jìn)化樹分析結(jié)果表明,SbDCLs 分為4 個(gè)亞家族,分別是DCL1,DCL2,DCL3 和DCL4,高粱與玉米的DCL 蛋白質(zhì)在進(jìn)化上同源關(guān)系更近。SbDCL2a,SbDCL1 和SbDCL3a 是高度表達(dá)基因,而且在生殖器官或組織中相對于營養(yǎng)器官具有更高的表達(dá)水平,說明SbDCLs 基因?qū)Ω吡粻I養(yǎng)生長和生殖發(fā)育具有調(diào)控作用。SbDCL2b 在高粱的整個(gè)生育期表達(dá)水平均較低,但是在胚珠和花粉中擁有較高的表達(dá)水平,這與OHNISHI 等[19]在水稻中OsDCL2 優(yōu)先在卵細(xì)胞中表達(dá)研究結(jié)論一致,說明Sb-DCL2b 在生殖發(fā)育過程中可能起調(diào)控作用。
目前,高粱等植物體的DCL 基因功能的研究主要是集中在小干擾RNA 的產(chǎn)生及其功能方面,而在微小RNA(miRNA)的產(chǎn)生及其功能方面的研究相對較少,就目前的研究與分析結(jié)果可以推測,這可能是因?yàn)楦吡坏戎参镏形⑿NA 的靶基因的表型不夠明顯[20]。DCL 基因的表達(dá)主要是通過RNA干擾機(jī)制來實(shí)現(xiàn)對高粱等植物的基因表達(dá)調(diào)控。通過目前的研究結(jié)果分析得知,DCL 基因具有將雙鏈RNA 切割成多個(gè)小干擾RNA 的功能,但是小干擾RNA 是通過什么途徑或方式來引起目的mRNA 的沉默,則還需進(jìn)一步研究;另外,DCL 基因表達(dá)過程中所涉及的相關(guān)酶和一些蛋白質(zhì)的確定也需要進(jìn)一步研究與分析。