黃小芳 畢楚韻 石媛媛 胡韻卓 周麗香 梁才曉 黃碧芳 許 明1, 林世強(qiáng)1,,* 陳選陽1,,5,*
甘薯基因組NBS-LRR類抗病家族基因挖掘與分析
黃小芳1,2,**畢楚韻1,2,**石媛媛2胡韻卓3周麗香4梁才曉4黃碧芳4許 明1,2林世強(qiáng)1,4,*陳選陽1,2,5,*
1福建農(nóng)林大學(xué)作物生物技術(shù)福建省高校重點(diǎn)實(shí)驗(yàn)室, 福建福州 350002;2福建農(nóng)林大學(xué)農(nóng)學(xué)院, 福建福州 350002;3福建農(nóng)林大學(xué)植物保護(hù)學(xué)院, 福建福州 350002;4福建農(nóng)林大學(xué)生命科學(xué)學(xué)院, 福建福州 350002;5福建農(nóng)林大學(xué)教育部作物遺傳育種與綜合利用重點(diǎn)實(shí)驗(yàn)室, 福建福州 350002
NBS-LRR類基因家族是植物抗病基因(Resistance gene)數(shù)量最多的一類, 具有NBS (Nucleotide-binding site)和LRR (Leucine-leucine-repeat)結(jié)構(gòu)域。甘薯()栽培種基因組已完成測序, 但尚未注釋, 本研究對甘薯基因組序列進(jìn)行外顯子預(yù)測, 得到甘薯染色體組全基因組蛋白序列, 在此基礎(chǔ)上進(jìn)一步對NBS-LRR家族基因鑒定和分析表明, 甘薯基因組中含有379個(gè)NBS-LRR家族基因, 占全基因組基因總數(shù)的0.212%, 其中N型亞家族120個(gè), NL型103個(gè), CNL型133個(gè), TNL型22個(gè), PN型1個(gè)。所有染色體上均有NBS-LRR家族基因分布, 但數(shù)量明顯不同, 其中有60.9%的NBS-LRR基因序列呈簇狀分布。NBS-LRR基因序列有15個(gè)保守結(jié)構(gòu)域, 在N端較為保守。研究結(jié)果為甘薯進(jìn)一步開展NBS-LRR家族基因的功能研究和抗性育種提供了參考。
甘薯; NBS-LRR;基因; 基因家族; 生物信息學(xué)
在植物育種過程中, 通常利用抗病基因(resistance gene)來控制植物病害[1-3]?;蚓幋a的抗性蛋白通過直接或間接的方式識別對應(yīng)的由病原微生物無毒基因Avr (Avirulence gene)編碼的無毒蛋白后, 啟動效應(yīng)因子觸發(fā)的免疫系統(tǒng)(effector- triggered immunity, ETI), 激活植物體內(nèi)抗病信號途徑, 在侵染部位產(chǎn)生局部的細(xì)胞和組織過敏性壞死(hypersensitive response, HR)反應(yīng), 最終抵御病原菌的侵染及進(jìn)一步擴(kuò)散[4-5]。
目前克隆的抗病R基因大多數(shù)都屬于NBS-LRR家族[6]。這類基因家族根據(jù)其N-末端是否含有TIR結(jié)構(gòu)可分為2個(gè)亞類, 一個(gè)亞類為TNL型, 含有TIR-NBS-LRR結(jié)構(gòu), 這個(gè)亞類R基因編碼的蛋白N-末端有一個(gè)白細(xì)胞介素受體(toll/interleukin-1 receptor, TIR)的同源結(jié)構(gòu)域; 另一個(gè)亞類為非TIR- NBS-LRR (non-TNL)結(jié)構(gòu), 這類基因編碼的蛋白N-末端不含有TIR結(jié)構(gòu), 但通常被編碼的CC (Coiled-Coil)替代, 稱為CC-NBS-LRR(CNL)型[7]。
我國是世界上甘薯種植面積最大的國家, 甘薯總產(chǎn)量穩(wěn)居世界首位。據(jù)聯(lián)合國糧食及農(nóng)業(yè)組織FAO (http://www.fao.org/faostat/zh/#data)統(tǒng)計(jì), 2018年中國甘薯栽培面積和總產(chǎn)分別占世界的30.0%和58.0%。盡管我國甘薯種植總面積和占薯類比重持續(xù)下降, 但種植效益仍十分可觀[8]。甘薯在種植過程中受到各種病害、蟲害和病毒病的威脅[9-10], 而選育和應(yīng)用抗病品種是減少病蟲害損失的最有效手段。近年來, 關(guān)于甘薯抗病基因的挖掘逐步得到重視, NBS類抗病基因的克隆也有了一些有限研究和報(bào)道[11], 但從甘薯全基因組中發(fā)掘NBS-LRR抗病基因的研究還未見報(bào)道。
2017年中國科學(xué)院上海辰山植物科學(xué)研究中心和植物生理生態(tài)研究所, 聯(lián)合德國馬克斯普朗克分子遺傳研究所和分子植物生理研究所, 利用Illumina測序技術(shù)完成對甘薯全基因組序列測序[12], 為甘薯的基礎(chǔ)和應(yīng)用研究建立了扎實(shí)的基礎(chǔ)。本研究通過生物信息學(xué)方法對甘薯全基因組序列進(jìn)行了CDS (Coding Domain Sequence)區(qū)預(yù)測, 檢索了NBS- LRR家族基因, 并對其進(jìn)行染色體定位、分類、結(jié)構(gòu)分析和系統(tǒng)進(jìn)化樹研究, 以期為甘薯抗病機(jī)制研究及甘薯抗病遺傳育種提供科學(xué)參考。
從NCBI (https://www.ncbi.nlm.nih.gov/genome/? term= Ipomoea+batatas)下載甘薯全基因組序列, 得到15條染色體的DNA序列。
通過snap程序應(yīng)用擬南芥(At.hmm)、線蟲(Ce.hmm)、水稻(Os.hmm)的HMM模型對甘薯染色體序列CDS進(jìn)行檢索[13], 分別得到3個(gè).zff文件, 分別從中隨機(jī)抽取500組合并, 作為訓(xùn)練甘薯特異HMM模型的序列文件。將甘薯特異的HMM模型文件(Ib.hmm)作為檢索工具, 通過snap程序檢索預(yù)測甘薯染色體CDS, 得到甘薯全基因組蛋白質(zhì)序列。
從Pfam網(wǎng)站[14-15](http://pfam.xfam.org/)下載NB-ARC(ID:PF00931)家族序列信息, 保存為NB- ARC.hmm文件。通過hmmsearch程序[16-17]用下載的NB-ARC.hmm文件對甘薯全基因組蛋白質(zhì)序列進(jìn)行NB-ARC結(jié)構(gòu)域預(yù)測。從中選取E-value值≤1E-60的序列, 利用Samtools程序[18-19]新建甘薯的NB-ARC蛋白質(zhì)序列文件(Ib-NBS.fasta)[20]。利用Clustal Omega[21]對Ib-NBS.fasta文件進(jìn)行多重序列比對, 得到Ib-NBS-clustalo.fasta文件。利用hmmbuild程序建立Ib-NBS-clustalo.fasta文件的HMM模型, 獲得甘薯特異的NB-ARC HMM模型(NB-ARC-specific.hmm)。利用甘薯特異的HMM模型再次檢索甘薯全基因組蛋白質(zhì)序列預(yù)測NB-ARC結(jié)構(gòu)域, 選取E-value<0.01的蛋白質(zhì)序列保存為甘薯高特異的NB-ARC序列信息(Ib-NBS-specific- aa.fasta)。去除甘薯高特異的NB-ARC序列信息中長度小于200的蛋白質(zhì)序列, 隨后將其導(dǎo)入NCBI Conserved Domains Tool[22-25]和Interproscan[26](http:// www.ebi.ac.uk/interpro/search/sequence/)進(jìn)行篩選, 去除結(jié)構(gòu)域缺失嚴(yán)重的序列, 最終得到甘薯NB-ARC基因家族蛋白質(zhì)序列數(shù)據(jù)庫。
NBS-LRR家族基因在其N-末端含有CC、TIR[7]、RPW8[27]等結(jié)構(gòu)域, 在C-末端通常含有LRR結(jié)構(gòu)域[28]。從Pfam數(shù)據(jù)庫[14-15](http://pfam.xfam.org/)中下載TIR HMMs (PF01582)、RPW8 HMMs (PF05659)和LRR HMMs (PF00560、PF07723、PF07725和PF12799)模型, 合并后用hmmpress程序建立TIR/RPW8/LRR HMM模型(TRL.hmm)。通過hmmscan程序用TRL.hmm文件對甘薯NBS-LRR家族基因信息庫進(jìn)行結(jié)構(gòu)域預(yù)測, 同時(shí)結(jié)合Interproscan得到結(jié)果鑒別出不同類型的TIR/ RPW8/LRR結(jié)構(gòu)域, 統(tǒng)計(jì)其類型和重復(fù)數(shù)。通過Pepcoil程序[29]預(yù)測甘薯NBS-LRR家族基因氨基酸序列信息中的CC結(jié)構(gòu)域(coiled-coil domain), 利用 Paircoil2 (值臨界值為0.03, 氨基酸長度臨界值為21)[30]檢測CC結(jié)構(gòu)域。
統(tǒng)計(jì)甘薯15條染色體上NBS-LRR家族基因的位置信息, 參考Jupe等[31]的方法繪制NBS-LRR家族基因在染色體上的位置。
將甘薯NBS-LRR家族基因分類整理后, 從中篩選出CC-NBS-LRR、TIR-NBS-LRR、RPW8-NBS三種NBS亞家族類型的90個(gè)氨基酸序列[32], 通過MEME程序[33]進(jìn)行motif分析和識別(設(shè)置搜索功能域數(shù)為15)。將MEME程序運(yùn)行后得到的.xml文件利用TBtools軟件[34]處理。
將篩選得到的CC-NBS-LRR、TIR-NBS-LRR、RPW8-NBS三種NBS-LRR亞家族類型的90個(gè)氨基酸序列利用Clustal Omega程序[21]進(jìn)行多序列比對后, 使用Gblocks[35-36]提取保守序列(允許序列保留50%的缺口數(shù)), 進(jìn)一步利用Jalview[37-38]手動矯正提取到的保守序列, 保存為.fa序列文件。根據(jù)比對結(jié)果為基礎(chǔ), 應(yīng)用MEGA X[39]軟件, 選擇Maximum Likehood法, 設(shè)置運(yùn)行參數(shù)模式WAG with Freqs.(+F)model, 校驗(yàn)參數(shù)Bootstrap=500, 生成甘薯NBS-LRR基因家族系統(tǒng)進(jìn)化樹。
采用snap程序?qū)Ω适砣蚪M序列進(jìn)行CDS區(qū)識別預(yù)測, 得到甘薯15條染色體CDS序列178,458個(gè)。利用hmmsearch程序篩選甘薯基因組中含有NB-ARC結(jié)構(gòu)域的序列, 以E-value≤0.01為標(biāo)準(zhǔn), 獲得相關(guān)蛋白序列432個(gè)。從中選取高特異蛋白質(zhì)序列(E-value≤1E-60)構(gòu)建甘薯特異的NB-ARC HMM模型, 利用甘薯特異的HMM模型再次預(yù)測甘薯全基因組序列的NB-ARC保守結(jié)構(gòu)域, 獲得甘薯含有NB-ARC結(jié)構(gòu)域的特異蛋白序列735個(gè)(E-value≤0.01)。去除氨基酸長度小于200以及結(jié)構(gòu)域缺失嚴(yán)重的序列, 最終得到379個(gè)甘薯NBS-LRR家族基因, 占甘薯全基因組基因數(shù)目(178,458)的0.212%。根據(jù)TIR/RPW8/LRR結(jié)構(gòu)域和CC結(jié)構(gòu)域分為N (NBS)、NL (NBS-LRR)、CNL (CC-NBS- LRR)、TNL (TIL-NBS-LRR)和PN (RPW8-NBS) 4個(gè)亞家族類型(表1), 其中N型120個(gè), NL型103個(gè), CNL型133個(gè), TNL型22個(gè), PN型1個(gè)。分析發(fā)現(xiàn), NBS/LRR結(jié)構(gòu)域重復(fù)數(shù)和位置存在差異, 在序列結(jié)構(gòu)域讀取文件中含有RX-CC_like結(jié)構(gòu)域, 此結(jié)構(gòu)域?yàn)轳R鈴薯抗X病毒和類似蛋白的Coiled-coil結(jié)構(gòu)域(Coiled coil domain of the potato virus X resistance protein and similar proteins)[40], 記為Cx結(jié)構(gòu)域, 以區(qū)分Pepcoil程序得到的CC結(jié)構(gòu)域。因此, 根據(jù)NBS/LRR結(jié)構(gòu)域重復(fù)數(shù)和位置差異、CC結(jié)構(gòu)域類型進(jìn)一步分為34個(gè)小類(表1)。
在NBS-LRR家族基因的N末端區(qū)域含有TIR (Toll/inter-leukin-1 receptor)保守結(jié)構(gòu)域的蛋白稱為TNL 蛋白, 其他的稱為非TNL蛋白。大部分非TNL蛋白的N末端有卷曲螺旋結(jié)構(gòu)(Coiled-coil), 稱為CNL蛋白[41]。目前已進(jìn)行NBS-LRR家族基因信息分析的植物有木薯[42]、水稻[43]、擬南芥[44]、烏拉爾圖小麥[45]等, 其中CNL亞家族數(shù)目占其NBS家族基因數(shù)比例分別為木薯(35.78%)[42]、水稻(32.71%)[43]、擬南芥(24.64%)[44]、烏拉爾圖小麥(19.18%)[45]。在甘薯NBS-LRR家族基因序列結(jié)構(gòu)域分類中, 同時(shí)含有CC、NBS、LRR結(jié)構(gòu)域的序列有77個(gè), 占NBS-LRR家族基因總數(shù)的20.32%; 同時(shí)含有TIR、NBS、LRR結(jié)構(gòu)域的序列有10個(gè), 占總基因家族信息數(shù)2.64%。
表1 甘薯編碼NBS-LRR蛋白的基因數(shù)量及其分類
(續(xù)表1)
a: 數(shù)據(jù)來源于[42]; b: 數(shù)據(jù)來源于[43]; c: 數(shù)據(jù)來源于[44]; d: 數(shù)據(jù)來源于[45]。
a: data were from [42]; b: data were from [43]; c: data were from [44]; d: data were from [45]. Ib:; Me:; Os:; At:; Tu:.
NBS-LRR家族基因有不同的亞家族, 包括N型(黑色)、NL型(紅色)、CNL型(綠色)、TNL型(藍(lán)色)、PN型(青色)(圖1)?;蛴姓溇幋a(圖1中染色體右側(cè))和負(fù)鏈編碼(圖1中染色體左側(cè))。NBS-LRR家族基因數(shù)量在甘薯15條染色體上分布并不均勻, 在11號染色體上僅有3個(gè), 而在13號染色體上則有54個(gè)。在不同染色體上的基因以單基因或基因簇的形式存在。基因簇是指在200 kb的核苷酸單位中含有的基因群[46-47], 甘薯NBS-LRR家族基因中共有231個(gè)基因是以基因簇的形式存在。這231個(gè)基因分布在81個(gè)基因簇中, 占NBS-LRR家族基因總數(shù)的60.9%, 平均每個(gè)基因簇含2.9個(gè)基因。在這些基因簇中含有2個(gè)基因的基因簇?cái)?shù)目最多, 有46個(gè), 占總基因簇?cái)?shù)的56.8%。其次是3~4個(gè)基因的基因簇, 有18個(gè), 12個(gè)基因簇含有4個(gè)基因。含5個(gè)、6個(gè)和8個(gè)基因的基因簇均只有1個(gè)。含有最大基因數(shù)的基因簇有2個(gè), 分別分布在9號和13號染色體上, 簇中含有9個(gè)基因。
(圖1)
甘薯基因組中, 單獨(dú)分布在染色體上的NBS- LRR家族基因有148個(gè), 占NBS-LRR基因總數(shù)39.1% (圖1和表2)。在14號染色體上的9個(gè)NBS- LRR家族基因均呈單基因分布, 其中含RPW8結(jié)構(gòu)域的NBS-LRR家族基因也分布于14號染色體。7號染色體基因簇最多達(dá)16個(gè), 據(jù)此推測7號染色體可能發(fā)生NBS-LRR家族抗病基因的大規(guī)模復(fù)制, 導(dǎo)致該染色體上NBS-LRR家族基因的高密度分布[46]。
分別將甘薯NBS-LRR家族基因中CNL和TNL亞家族序列信息利用MEME程序檢測, 篩選得到15個(gè)相似度較高的結(jié)構(gòu)域。77個(gè)CNL亞家族基因的結(jié)構(gòu)域分布(圖2)存在以下規(guī)律: motif 10-motif 11- motif 2(P-loop)-motif 4-(RNBS-A)-motif 1(Kinase 2)- motif 13(RNBS-B)-motif 5(GLPL)-motif 15-motif 9(RNBS-D)--motif 6(RNBS-D)-motif 12-motif 3(MHDV)-motif 8--motif 14-motif 7。其中motif 15(motif 5和motif 9之間)僅存在于21個(gè)序列中, 即位于GLPL結(jié)構(gòu)域和RNBS-D結(jié)構(gòu)域之間。其中RNBS-D保守基序?qū)?yīng)于2個(gè)結(jié)構(gòu)域, 分別為motif 9和motif 6, 共有70個(gè)序列含有motif 6, 其中有17個(gè)序列缺失motif 9。TNL亞家族結(jié)構(gòu)域分布(圖3)存在以下規(guī)律: motif 10(TIR-1)-motif 3-motif 1(TIR-2)-motif 5-(TIR-3)-motif 8(TIR-4)-motif 2(P- loop)-motif 9(Kinase 2)-motif 4(RNBS-B)-motif 13- (RNBS-C)-motif 7(GLPL)-motif 11-motif 15-motif6-(MHDV)-motif 12-motif 14或motif 10(TIR-1)- motif 3-motif 1(TIR-2)-motif 5-(TIR-3)-motif 8(TIR- 4)-motif 2(P-loop)-motif 9(Kinase 2)-motif 4(RNBS- B)-motif 13-(RNBS-C)-motif 7(GLPL)-motif 11-motif 6-(MHDV)-motif 12(LRR)-motif 14(LRR)-。大部分motif 15存在于motif 11和motif 6之間, 即MHDV結(jié)構(gòu)域之前, 僅有3個(gè)序列motif 15位于motif 14之后。
表2 甘薯NBS-LRR基因家族基因簇統(tǒng)計(jì)表
圖2 甘薯NBS-LRR家族中CNL亞家族保守結(jié)構(gòu)域分布
圖3 甘薯NBS-LRR家族中TNL亞家族保守結(jié)構(gòu)域分布
植物NBS-LRR家族基因中的NB-ARC區(qū)域相對保守, 通常有P-loop、RNBS-A、Kinase2、RNBS-B、RNBS-C、GLPL、RNBS-D和MHDV 8個(gè)保守基序[48]。對獲得的甘薯NBS-LRR家族中CNL和TNL亞家族序列利用Clustal Omega進(jìn)行多重比對發(fā)現(xiàn), 具有5個(gè)保守性較高的序列結(jié)構(gòu)域[44,49-50](圖4), 分別為P-loop (Kinase 1)、Kinase 2、RNBS-B、GLPL、MHDV。其中P-loop最可能氨基酸序列為SIVLA (畫橫線部分為氨基酸保守性較強(qiáng)序列), Kinase 2最可能氨基酸序列為YLIW, RNBS-B最可能的氨基酸序列為I+LLR, GLPL最可能的氨基酸序列為IVSY+VVVAKRL, MHDV最可能的氨基酸序列為K+TIRMLLRDMGR。
根據(jù)MEME結(jié)構(gòu)域搜索結(jié)果, 對CNL和TNL亞家族基因結(jié)構(gòu)域進(jìn)行基因定位和識別[51](圖5), 發(fā)現(xiàn)TNL亞家族和CNL亞家族中分別有10個(gè)和7個(gè)保守結(jié)構(gòu)域, 其中TNL亞家族NB-ARC結(jié)構(gòu)域中保守基序分別為P-loop、Kinase 2、RNBS-B、RNBS-C、GLPL和MHDV, 缺失RNBS-A以及RNBS-D保守基序; CNL亞家族NB-ARC結(jié)構(gòu)域保守基序分別為P-loop、RNBS-A、Kinase 2、RNBS-B、GLPL、RNBS-D和MHDV, 缺失RNBS-C保守基序。TNL亞家族和CNL亞家族中共有的保守基序分別為P-loop (Kinase 1)、Kinase 2、RNBS-B、GLPL以及MHDV, 與多重比對結(jié)果相同。此外, 在TNL亞家族中TIR結(jié)構(gòu)域檢測到4個(gè)保守基序(TIR1-4)[52]。其中9個(gè)NBS-LRR家族基因含有完整的TNL結(jié)構(gòu)域, 占總TNL亞家族基因數(shù)的75%, 有2個(gè)序列同時(shí)缺失TIR 3和TIR 4, 有一個(gè)序列缺失TIR 1。
將甘薯NBS-LRR家族基因中CC/TIR/RPW8/ NBS/LRR結(jié)構(gòu)域的序列提取后, 使用MEGA X構(gòu)建系統(tǒng)進(jìn)化樹。進(jìn)化樹結(jié)果中(圖6)有3個(gè)明顯的分支, 分別為CNL型(綠色)、TNL型(藍(lán)色)、PN型(青色)。3種NBS-LRR家族的亞家族存在于不同的進(jìn)化分支中, 但不存在單獨(dú)的分支, 說明這3類基因存在相同的進(jìn)化方式。進(jìn)化樹分支中有些基因分支路徑很長, 如CM008340.1-snap12256、CM008331.1- snap10568等, 推測這類基因的“祖先”基因在很早的時(shí)候就發(fā)生了分化, 相應(yīng)的基因序列也發(fā)生了較大的分化。有些基因序列的分支距離較近, 如CM008334.1-snap8062、CM008342.1-snap6760、CM008334.1-snap11470等, 推測這些基因在短期內(nèi)發(fā)生了復(fù)制[46]。在CNL亞家族分支CC結(jié)構(gòu)域中, 馬鈴薯X病毒類似蛋白[40]的CC結(jié)構(gòu)域(Coiled-coil domain of the potato virus X resistance protein and similar proteins)大致分布于同一小分支, 說明馬鈴薯X病毒類似蛋白的CC結(jié)構(gòu)域(表1中Cx)與普通CC結(jié)構(gòu)域(表1中C)存在進(jìn)化關(guān)系上的差異。
圖4 甘薯NB-ARC保守性分析
圖5 甘薯NBS-LRR家族基因保守結(jié)構(gòu)域及其氨基酸保守性分析
圖6 甘薯NBS-LRR家族基因系統(tǒng)進(jìn)化樹
生物信息學(xué)方法分析植物抗病基因已被廣泛運(yùn)用于許多作物, 甘薯是重要的糧食作物, 然而, 甘薯基因組尚未注釋, 無法直接查找與分析其基因組的基因。本研究應(yīng)用snap軟件對甘薯全基因組序列進(jìn)行了外顯子預(yù)測, 得到甘薯CDS區(qū)蛋白質(zhì)序列, 為甘薯基因的搜索及其他相關(guān)生物信息學(xué)分析提供了序列基礎(chǔ)。
本研究利用HMMER程序?qū)Ω适砣蚪M序列進(jìn)行NBS-LRR家族基因檢索, 得到735個(gè)甘薯NBS-LRR家族基因。經(jīng)過篩選、驗(yàn)證、剔除等步驟, 最終得到379個(gè)序列完整的NBS-LRR家族基因, 占甘薯全基因組數(shù)目0.2%, 但與木薯(1.1%)[42]、水稻(1.4%)[43]、擬南芥(0.8%)[44]、烏拉爾圖小麥(1.5%)[45]相比數(shù)量明顯偏少。此外, 甘薯NBS-LRR家族中TNL亞家族基因有22個(gè), 與其他作物有較大差別, 如水稻和烏拉爾圖小麥中NBS-LRR家族基因無TNL類型[43,45], 在其他禾本科和草本的單子葉植物中TNL亞家族基因很少[53-54]。本研究分析了甘薯NBS-LRR家族基因的NB-ARC結(jié)構(gòu)域保守性, 分別對CNL和TNL亞家族進(jìn)行比較, 發(fā)現(xiàn)兩者在P-loop、Kinase 2、RNBS-B、GLPL、MHDV具有較高的相似性。甘薯P-loop和GLPL基序保守性最高, 其基序分別為SIVLA 和IVSY+VVVAKRL, 且GMGGIGKTT區(qū)域保守性最高。其次為Kinase 2和RNBS-B, Kinase 2結(jié)構(gòu)域序列為YLI, 77個(gè)CNL類型中, 有70個(gè)Kinase 2序列末端氨基酸為W, TNL類型中末端氨基酸主要為E或D, 未發(fā)現(xiàn)W。研究表明, Kinase 2序列末端氨基酸W是區(qū)分CNL亞家族和TNL亞家族的關(guān)鍵因素[42,55]。同時(shí), TNL類型motif位置的分布比較保守, 為TIR(1-4)-P loop-Kinase 2-RNBS B- RNBS C-GLPL-motif 11。CNL類型motif之間位置的排布規(guī)律遵循motif 10-motif 11-P loop-RNBS C-Kinase 2-RNBS B-GLPL的順序。
值得注意的是, 本研究所分析的甘薯基因組是基于二代測序組裝的單倍體型基因組[12], 存在數(shù)據(jù)不完整和一些錯(cuò)誤組裝的局限性[56], 本研究結(jié)果可能難以完整覆蓋甘薯栽培種基因組中NBS-LRR家族的所有基因, 在對相關(guān)基因進(jìn)一步深入分析和研究應(yīng)用時(shí), 還可以結(jié)合三淺裂野牽牛()基因組。但是本研究的分析方法和結(jié)果, 可為甘薯NBS-LRR基因發(fā)掘、抗性相關(guān)機(jī)制研究和抗病育種提供參考。
預(yù)測了甘薯基因組序列的外顯子, 得到甘薯染色體組全基因組蛋白序列, 從中篩選了379個(gè)NBS-LRR家族基因, 并進(jìn)行了染色體定位, 發(fā)現(xiàn)NBS-LRR家族基因在不同染色體上的分布數(shù)量差異很大, 其中有60.9%的NBS-LRR基因序列呈簇狀分布。NBS-LRR基因序列有15個(gè)保守結(jié)構(gòu)域, 在N端較為保守, 根據(jù)對基因的結(jié)構(gòu)分析構(gòu)建了系統(tǒng)進(jìn)化樹。研究結(jié)果可為甘薯進(jìn)一步開展NBS-LRR家族基因的功能研究和抗性育種提供參考。
[1] Staskawicz B J, Ausubel F M, Baker B J, Ellis J G, Jones J D. Molecular genetics of plant disease resistance., 1995, 268: 661–667.
[2] 李楠洋. 棉花抗黃萎病基因篩選及NBS-LRR類抗病基因功能研究. 中國農(nóng)業(yè)科學(xué)院博士學(xué)位論文, 北京, 2017. Li N Y. Screening of Cotton Anti Verticillium Wilt Genes and Functional Study on NBS-LRR Resistance Gene. PhD Dissertation of Chinese Academy of Agricultural Sciences, Beijing, China, 2017 (in Chinese with English abstract).
[3] Changkwian A, Venkatesh J, Lee J H, Han J W, Kwon J K, Siddique M I, Solomon A M, Choi G J, Kim E, Seo Y, Kim Y H, Kang B C. Physical localization of the root-knot nematode () resistance locusin pepper ()., 2019, 10: 886.
[4] 房衛(wèi)平, 謝德意, 李志芳, 李武, 趙付安, 孫瑤, 段崢崢, 楊曉杰. NBS-LRR類抗病蛋白介導(dǎo)的植物抗病應(yīng)答分子機(jī)制. 分子植物育種, 2015, 13: 469–474. Fang W P, Xie D Y, Li Z F, Li W, Zhao F A, Sun Y, Duan Z Z. Yang X J. Molecular mechanism on NBS-LRR proteins-mediated plant disease response.2015, 13: 469–474 (in Chinese with English abstract).
[5] Jones J D G, Dangl J L. The plant immune system., 2006, 444: 323–329.
[6] Hammond-Kosack K E, Parker J E. Deciphering plant-pathogen communication: fresh perspectives for molecular resistance breeding., 2003, 14: 177–193.
[7] 尹玲, 方輝, 黃羽, 盧江, 曲俊杰. 植物TIR-NB-LRR類型抗病基因各結(jié)構(gòu)域的研究進(jìn)展. 廣西植物, 2017, 37: 186–190. Yin L, Fang H, Huang Y, Lu J, Qu J J. Research progress on domains of plant TIR-NB-LRR resistance genes., 2017, 37: 186–190 (in Chinese with English abstract).
[8] 陸建珍, 汪翔, 秦建軍, 戴起偉, 易中懿. 我國甘薯種植業(yè)發(fā)展?fàn)顩r調(diào)查報(bào)告(2017年)——基于國家甘薯產(chǎn)業(yè)技術(shù)體系產(chǎn)業(yè)經(jīng)濟(jì)固定觀察點(diǎn)數(shù)據(jù)的分析. 江蘇農(nóng)業(yè)科學(xué), 2018, 46(23): 393–398. Lu J Z, Wang X, Qin J J, Dai Q W, Yi Z Y. Investigation report on the development of sweet potato cultivation in China (2017): Analysis based on the data of industrial economy fixed observation point of the national sweet potato industry technology system., 2018, 46(23): 393–398 (in Chinese with English abstract).
[9] 趙永強(qiáng), 張成玲, 孫厚俊, 徐振, 陳曉宇, 謝逸萍. 甘薯病毒病復(fù)合體(SPVD)對甘薯產(chǎn)量的影響. 西南農(nóng)業(yè)學(xué)報(bào), 2012, 25: 909–911. Zhao Y Q, Zhang C L, Sun H J, Xu Z, Chen X Y, Xie Y P. Effects of viruses (SPVD) on yield of sweet potato., 2012, 25: 909–911 (in Chinese with English abstract).
[10] 趙冬蘭, 唐君, 張安, 周志林, 曹清河, 戴習(xí)彬. 甘薯病毒病對不同基因型甘薯產(chǎn)量和品質(zhì)的影響. 江西農(nóng)業(yè)學(xué)報(bào), 2018, 30(11): 62–65. Zhao D L, Tang J, Zhang A, Zhou Z L, Cao Q H, Dai X B. Effects of virus diseases on yield and quality of different sweet potato genotypes., 2018, 30(11): 62–65 (in Chinese with English abstract).
[11] 屈滿義, 查向東, 王鈺, 楊金環(huán), 蔣琳, 阮龍. 甘薯NBS-LRR類抗病基因同源序列的克隆、分析及數(shù)目研究. 熱帶作物學(xué)報(bào), 2008, 29: 610–617. Qu M Y, Zha X D, Wang Y, Yang J H, Jiang L, Ruan L. Study on cloning, analysis and number of NBS-LRR resistance genes of sweet potato., 2008, 29: 610–617 (in Chinese with English abstract).
[12] Yang J, Moeinzadeh M H, Kuhl H, Helmuth J, Xiao P, Haas S, Liu G, Zheng J, Sun Z, Fan W, Deng G, Wang H, Hu F, Zhao S, Fernie A R, Boerno S, Timmermann B, Zhang P, Vingron M. Haplotype-resolved sweet potato genome traces back its hexaploidization history., 2017, 3: 696–703.
[13] Ian K. Gene finding in novel genomes., 2004, 5: 59.
[14] Finn R D, Bateman A, Clements J, Coggill P, Eberhardt R Y, Eddy S R, Heger A, Hetherington K, Holm L, Mistry J, Sonnhammer E L, Tate J, Punta M. Pfam: the protein families database., 2014, 42: 222–230.
[15] Madeira F, Park Y M, Lee J, Buso N, Gur T, Madhusoodanan N, Basutkar P, Tivey A R N, Potter S C, Finn R D, Lopez R. The EMBL-EBI search and sequence analysis tools APIs in 2019., 2019, 47: 636–641.
[16] Eddy S R. Profile Hidden Markov Models., 1998, 14: 755–763.
[17] Pottter S C, Luciani A, Eddy S R, Park Y, Lopez R, Finn R D. Web server issue., 2018, 46: 200–204.
[18] Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R, Genome Project Data Processing, Subgroup. The sequence alignment/map format and SAMtools., 2009, 25: 2078–2079.
[19] Li H. A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data.. 2011, 27: 2987–2993.
[20] Brendolise C, Montefiori M, Dinis R, Peeters N, Storey R D, Rikkerink E H. A novel hairpin library-based approach to identify NBS–LRR genes required for effector-triggered hypersensitive response in Nicotiana benthamiana., 2017, 13: 32.
[21] Sievers F, Wilm A, Dineen D, Gibson T J, Karplus K, Li W Z, Lopez R, McWilliam H, Remmert M, S?ding J, Thompson J D, Higgins D G. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega., 2011, 7: 539.
[22] Marchler-Bauer A, Bryant S H. CD-search: protein domain annotations on the fly., 2004, 32: 327–331.
[23] Marchler-Bauer A, Lu S N, Anderson J B, Chitsaz F, Derbyshire M K, De Weese-Scott C, Fong J H, Geer L Y, Geer R C, Gonzales N R, Gwadz M, Hurwitz D I, Jackson J D, Ke Z, Lanczycki C J, Lu F, Marchler G H, Mullokandov M, Omelchenko M V, Robertson C L, Song J S, Thanki N, Yamashita R A, Zhang D C, Zhang N G, Zheng C J, Bryant S H. CDD: a conserved domain database for the functional annotation of proteins., 2011, 39: 225–229.
[24] Marchler-Bauer A, Derbyshire M K, Gonzales N R, Lu S N, Chitsaz F, Geer L Y, Geer R C, He J, Gwadz M, Hurwitz D I, Lanczycki C J, Lu F, Marchler G H, Song J S, Thanki N, Wang Z X, Yamashita R A, Zhang D C, Zheng C J, Bryant S H. CDD: NCBI’s conserved domain database., 2015, 43: 222–226.
[25] Marchler-Bauer A, Bo Y, Han L Y, He J N, Lanczycki C J, Lu S N, Chitsaz F, Derbyshire M K, Geer R C, Gonzales N R, Gwadz M, Hurwitz D I, Lu F, Marchler G H, Song J S, Thanki N, Wang Z X, Yamashita R A, Zhang D C, Zheng C J, Geer L Y, Bryant S H. CDD/SPARCLE: functional classification of proteins via subfamily domain architectures., 2017, 45: 200–203.
[26] Quevillon E, Silventoinen V, Pillai S, Harte N, Mulder N, Apweiler R, Lopez R. InterProScan: protein domains identifier., 2005, 33: 116–120.
[27] Barragan C A, Wu R, Kim S T, Xi W Y, Habring A, Hagmann J, Van de Weyer A L, Zaidem M, Ho W W H, Wang G, Bezrukov I, Weigel D, Chae E. RPW8/HR repeats control NLR activation in., 2019, 15: e1008313.
[28] 劉云飛, 萬紅建, 李志邈, 葉青靜, 王榮青, 阮美穎, 姚祝平, 周國治, 韋艷萍, 楊悅儉. 植物NBS-LRR抗病基因的結(jié)構(gòu)、功能、進(jìn)化起源及其應(yīng)用. 分子植物育種, 2014, 12: 377–389. Liu Y F, Wan H J, Li Z M, Ye Q J, Wang R Q, Ruan M Y, Yao Z P, Zhou G Z, Wei Y P, Yang Y J. The structure, function, evolutional origin and application of plant NBS-LRR resistance genes., 2014, 12: 377–389 (in Chinese with English abstract).
[29] Lupas A, Dyke M V, Stock J, Predicting coiled coils from protein sequences., 1991, 252: 1162–1164.
[30] McDonnell A V, Jiang T, Keating A E, Berger B. Paircoil2: improved prediction of coiled coils from sequence., 2006, 22: 356–358.
[31] Jupe F, Pritchard L, Etherington G J, MacKenzie K, Cock P J, Wright F, Sharma S K, Bolser D, Bryan G J, Jones J D, Hein I. Identification and localisation of the NB-LRR gene family within the potato genome., 2012, 13: 75.
[32] 蔣卉, 張晶, 符真珠, 董曉宇, 王慧娟, 李艷敏, 高杰, 王利民, 張和臣. 蝴蝶蘭NBS-LRR家族基因挖掘和生物信息學(xué)分析. 分子植物育種, 2018, 16: 2786–2794. Jiang H, Zhang J, Fu Z Z, Dong X Y, Wang H J, Li Y M, Gao J, Wang L M, Zhang H C. Mining and bioinformatics analysis of NBS-LRR gene family in phalaenopsis., 2018, 16: 2786–2794 (in Chinese with English abstract).
[33] Bailey T L, Williams N, Misleh C, Li W W. MEME: discovering and analyzing DNA and protein sequence motifs., 2006, 34: 369–373.
[34] Chen C J, Chen H, He Y H, Xia R. TBtools, a Toolkit for Biologists integrating various biological data handling tools with a user-friendly interface., 2018. doi: https://doi.org/10. 1101/289660.
[35] Castresana J. Selection of conserved blocks from multiple alignments for their use in phylogenetic analysis., 2000, 17: 540–552.
[36] Talavera G, Castresana J. Improvement of phylogenies after removing divergent and ambiguously aligned blocks from protein sequence alignments., 2007, 56: 564–577.
[37] Waterhouse A M, Procter J B, Martin D M A, Clamp M, Barton G J. Jalview Version 2: a multiple sequence alignment editor and analysis workbench., 2009, 25: 1189–1191.
[38] Troshin P V, Procter J B, Barton G J. Java bioinformatics analysis web services for multiple sequence alignment—JABAWS: MSA., 2011, 27: 2001–2002.
[39] Kumar S, Stecher G, Li M, Knyaz C, Tamura K. MEGA X: molecular evolutionary genetics analysis across computing platforms., 2018, 35: 1547–1549.
[40] Hao W, Collier S M, Moffett P, Chai J. Structural basis for the interaction between the potato virus X resistance protein (Rx) and its cofactor Ran GTPase-activating protein 2 (RanGAP2)., 2013, 288: 35868–35876.
[41] Tarr D E, Alexander H M. TIR-NBS-LRR genes are rare in monocots: evidence from diverse monocot orders., 2009, 2: 197.
[42] Lozano R, Hamblin M T, Prochnik S, Jannink J L. Identification and distribution of the NBS-LRR gene family in the Cassava genome., 2015, 16: 360.
[43] Zhou T, Wang Y, Chen J Q, Araki H, Jing Z, Jiang K, Shen J, Tian D. Genome-wide identification of NBS genes in japonica rice reveals significant expansion of divergent non-TIR NBS-LRR genes., 2004, 271: 402–415.
[44] Meyers B C, Kozik A, Griego A, Kuang H, Michelmore R W. Genome-wide analysis of NBS-LRR-encoding genes in., 2003, 15: 809–834.
[45] 劉小芳, 袁欣, 聶迎彬, 張晶. 烏拉爾圖小麥NBS-LRR家族生物信息學(xué)分析. 分子植物育種, 2018, 16: 7587–7597. Liu X F, Yuan X, Nie Y B, Zhang J. Bioinformatics Analysis of NBS-LRR gene family in., 2018, 16: 7587–7597 (in Chinese with English abstract).
[46] 王巖, 李兆陽, 唐心龍, 盧姍, 許鵬, 張靜, 方奎, 席景會. 擬南芥基因組NBS-LRR類基因家族的生物信息學(xué)分析. 中國農(nóng)學(xué)通報(bào), 2009, 25(15): 40–45. Wang Y, Li Z Y, Tang X L, Lu S, Xu P, Zhang J, Fang K, Xi J H. Bioinformatic analysis of the NBS-LRR gene family in., 2009, 25(15): 40–45 (in Chinese with English abstract).
[47] Holub E B. The arms race is ancient history in Arabidopsis, the wildflower., 2001, 2: 516–527.
[48] Liu Z C, Xie J M, Wang H P, Zhong X H, Li H L, Yu J H, Kang J G. Identification and expression profiling analysis of NBS-LRR genes involved inf. spconglutinans resistance in cabbage., 2019, 9: 202.
[49] Kohler A, Rinaldi C, Duplessis S, Baucher M, Geelen D, Duchaussoy F, Meyers B C, Boerjan W, Martin F. Genome-wide identification of NBS resistance genes in., 2008, 66: 619–636.
[50] Ahlenstiel G, Lozano R, Ponce O, Ramirez M, Mostajo N, Orjeda G. Genome-wide identification and mapping of NBS-encoding resistance genes ingroup phureja., 2012, 7: e34775.
[51] Li T G, Wang B L, Yin C M, Zhang D D, Wang D, Song J, Zhou L, Kong Z Q, Klosterman S J, Li, J J, Adamu S, Liu T L, Subbarao K V, Chen J Y, Dai X F. TheTIR-NBS-LRR genemediates resistance against verticillium wilt., 2019, 20: 857–876.
[52] Meyers B C, Morgante M, Michelmore R W. TIR-X and TIR-NBS proteins: two new families related to disease resistance TIR-NBS-LRR proteins encoded inand other plant genomes., 2002, 32: 77–92.
[53] Wu L, Hickson I D. The Bloom’s syndrome helicase suppresses crossing over during homologous recombination., 2003, 426: 870–874.
[54] Lakatos L, Csorba T, Pantaleo V, Chapman E J, Carrington J C, Liu Y P, Dolja V V, Calvino L F, López-Moya J J, Burgyán J. Small RNA binding is a common strategy to suppress RNA silencing by several viral suppressors., 2006, 25: 2768–2780.
[55] López C E, Zuluaga A P, Cooke R, Delseny M, Tohme J, Verdie V. Isolation of resistance gene candidates (RGCs) and characterization of an RGC cluster in cassava., 2003, 269: 658–671.
[56] Wu S, Lau K H, Cao Q H, Hamilton J P, Sun H H, Zhou C X, Eserman L A, Gemenet D C, Olukolu B A, Wang H Y, Crisovan E, Godden G T, Jiao C, Wang X, Kitavi M, anrique-Carpintero N, Vaillancourt B, Wiegert-Rininger K, Yang X S, Bao K, Schaff J, Wolfgang J K, Gruneberg A K, Ghislain M, Ma D, Jiang J M, Mwanga R O M, Leebens-Mack J, Lachlan J M, Coin G, Yencho G C, Buell C R, Fei Z J. Genome sequences of two diploid wild relatives of cultivated sweetpotato reveal targets for genetic improvement., 2018, 9: 4580.
Discovery and analysis of NBS-LRR gene family in sweet potato genome
HUANG Xiao-Fang1,2,**, BI Chu-Yun1,2,**, SHI Yuan-Yuan2, HU Yun-Zhuo3, ZHOU Li-Xiang4, LIANG Cai-Xiao4, HUANG Bi-Fang4, XU Ming1,2, LIN Shi-Qiang1,4,*, and CHEN Xuan-Yang1,2,5,*
1Key Laboratory of Crop Biotechnology, Fujian Agriculture and Forestry University, Fujian Province Universities, Fuzhou 350002, Fujian, China;2College of Agriculture, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China;3College of Plant Protection, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China;4College of Life Science, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China;5Key Laboratory of Genetics, Breeding and Multiple Application of Crops, Ministry of Education, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China
The NBS-LRR gene families possess the most abundant resistance genes in plants. Members of the NBS-LRR gene families contain nucleotide-binding site (NBS) and leucine-leucine repeat (LRR) domains. The genome of sweet potato () cultivar has been sequenced but the genes have not been annotated yet. In this study, we predicted the exons of sweet potato genome and obtained the proteins sequences, which were then used to identify and analyze genes of NBS-LRR family. There were 379 genes within NBS-LRR family, amounting to 0.212% of the total genes of sweet potato. The number of the N type, NL type, CNL type, TNL type and PN type was 120, 103, 133, 22, and 1, respectively. All of the chromosomes had NBS-LRR family genes but varied in number and 60.9% of them were clustered. NBS-LRR genes included 15 conservative domains and the genes were conservative within N terminal domain. The results provide references for further studies on the function of NBS-LRR family genes and resistance breeding of sweet potato.
; NBS-LRR;gene; gene family; bioinformatics
10.3724/SP.J.1006.2020.94163
本研究由福建省科技重大專項(xiàng)子專題(2017NZ0002-2)資助。
This study was supported by the Fujian Provincial Department of Science & Technology (CN)(2017NZ0002-2).
林世強(qiáng), E-mail: linshiqiang@fafu.edu.cn, Tel: 059183789367; 陳選陽, E-mail: cxy@fafu.edu.cn, Tel: 059183789483
**同等貢獻(xiàn)(Contributed equally to this work)
黃小芳, E-mail: 1102718600@qq.com, Tel: 059183789483; 畢楚韻, E-mail: 494028227@qq.com, Tel: 059183789483
2019-11-01;
2020-04-15;
2020-04-26.
URL: http://kns.cnki.net/kcms/detail/11.1809.S.20200426.1548.024.html