鹿志偉 侯曉婉 楊子平 張燕梅 李俊峰 周文釗
摘 ?要??生長素反應(yīng)因子(Auxin Response Factors, ARFs)是植物特有的多基因轉(zhuǎn)錄因子家族,參與植物生長發(fā)育過程的調(diào)節(jié)。本研究基于轉(zhuǎn)錄組數(shù)據(jù),通過生物信息學(xué)方法鑒定劍麻ARF基因家族成員,同時對其進行相關(guān)生物信息學(xué)分析。結(jié)果表明:在劍麻中共鑒定得到15個ARF基因,并依次命名為AhARF1~15。其編碼的蛋白質(zhì)含有409~1011個氨基酸,分子量約為45.17~112.13?ku,等電點為5.17~9.34。亞細胞定位預(yù)測結(jié)果顯示,13個AhARFs定位于細胞核,2個AhARFs定位于葉綠體。保守結(jié)構(gòu)域分析結(jié)果表明,AhARFs基因家族有8個成員同時含有B3、ARF和Aux/IAA這3個相對保守的結(jié)構(gòu)域,其他成員僅含有B3和ARF這2個結(jié)構(gòu)域。進化樹分析表明,劍麻AhARFs蛋白可分為5個亞家族。15個劍麻AhARFs基因在劍麻紫色卷葉病不同發(fā)病時期呈現(xiàn)不同的表達規(guī)律。本研究為進一步深入探索劍麻ARF基因家族的功能奠定了重要理論基礎(chǔ)。
關(guān)鍵詞 ?劍麻;ARF;基因家族;轉(zhuǎn)錄組中圖分類號??S563.8??????文獻標識碼??A
Transcriptome-wide Identification and Expression Profiling of the Auxin Response Factor (ARF) Gene Family in Agave.hybrid?No.11648
LU Zhiwei1,2,?HOU Xiaowan1,?YANG Ziping1,2,?ZHANG Yanmei1,2,?LI Junfeng1,2,?ZHOU Wenzhao1,2*
1.?South Subtropical Crops Research Institute, Chinese Academy of Tropical Agricultural Sciences, Zhanjiang, Guangdong?524091, China; 2.?Zhanjiang City Key Laboratory for Tropical Crops Genetic Improvement,?Zhanjiang, Guangdong?524091, China
Abstract ?Auxin response factors (ARFs) are plant-specific polygenic transcription factor families involved in the regulation of plant growth and development. In this study, the members of the agaveARF gene family were identified and analyzed by bioinformatics methods, based on transcriptome data. The results showed that 15ARFgenes were identified in agave and named fromAhARF1toAhARF 15in turn, its encoded protein varied from 409 to 1011 amino acid residues in length, the molecular weight ranged from 45.17 to 112.13 ku, and the isoelectric point varied from 5.17 to 9.34. Subcellular localization prediction showed that 13AhARFswere localized in the nucleus and 2AhARFswere located in the chloroplast. Conservative domain analysis results indicated that there were eight members among theAhARFsgene family which containing three relatively conserved domains, B3, ARF, and Aux/IAA. The other members contained only the two domains, B3 and ARF. Phylogenetic tree analysis indicated that the AhARFs protein could be divided into five subfamilies. The 15AhARFsgenes showed different expression patterns in different stages of agave purple leaf curl disease. This research would lay an important theoretical foundation for further study of the function of theAhARFsgene family.
Keywords ?agave;ARF;?gene family; transcriptome
DOI10.3969/j.issn.1000-2561.2019.10.09
生長素響應(yīng)因子(auxin response factor, ARF)是一種調(diào)控生長素響應(yīng)基因表達的轉(zhuǎn)錄因子,廣泛存在于植物中,在植物生長發(fā)育過程的各個階段中起著重要調(diào)控作用[1-2]。所有的ARF蛋白均含有一個保守的N端B3 domain,一個Auxin-resp domain(ARF)[3]。前者是DNA結(jié)合結(jié)構(gòu)域,負責與靶基因結(jié)合。后者是ARF的功能結(jié)構(gòu)域,能夠在外界信號刺激下特異性地與靶基因啟動子中的生長素響應(yīng)元件--TGTCTC結(jié)合,激活或者抑制靶基因的表達,進而行使對植物生長發(fā)育的調(diào)控功能[4-5]。此外,有些ARF蛋白質(zhì)C末端還含有Aux/IAA二聚化結(jié)構(gòu)域,能夠通過同源或異源二聚體的形成來調(diào)節(jié)ARF蛋白質(zhì)的活性[6-7]。由于ARF在細胞分裂和分化、果實發(fā)育、側(cè)根的形成、頂端優(yōu)勢、向性反應(yīng)等諸多植物生長發(fā)育過程中起著至關(guān)重要的作用,以及高通量測序和生物信息學(xué)分析技術(shù)的飛速發(fā)展,使得越來越多植物中的ARF基因家族被鑒定出來[8],如荔枝[9]、擬南芥[10]、煙草[2]、大豆[11]、水稻[12]、番茄[13]、玉米[14]、葡萄[15]、蘋果[1]、楊樹[16]和香蕉[17]等植物。但是在劍麻中目前尚未發(fā)現(xiàn)有關(guān)ARF基因的相關(guān)報道,嚴重制約著劍麻中ARF基因功能的深入研究。
本研究基于前期已完成的劍麻紫色卷葉病不同發(fā)病時期轉(zhuǎn)錄組數(shù)據(jù)庫,在轉(zhuǎn)錄組水平上對劍麻ARF基因家族進行鑒定與相關(guān)生物信息學(xué)分析,同時對ARF基因家族在劍麻紫色卷葉病高抗和高感植株不同發(fā)病階段中的表達特征進行分析,初步研究ARF基因家族在植物病害應(yīng)答過程中所充當?shù)慕巧?,為后期深入系統(tǒng)地研究ARF基因家族在劍麻中的功能提供前期基礎(chǔ)。
1.1材料
所選材料為劍麻H.11648紫色卷葉病高抗和高感植株,種植于中國熱帶農(nóng)業(yè)科學(xué)院南亞熱帶作物研究所劍麻種質(zhì)圃內(nèi),選擇大小和長勢一致的高抗和高感健康無蟲植株各3株,分別統(tǒng)一接種粉蚧后,在0、60、90?d 3個時期(接種60?d后高感植株葉片部位開始出現(xiàn)紫色卷葉病病狀特征)進行取樣用于轉(zhuǎn)錄組測序分析,設(shè)置3個生物學(xué)重復(fù)。
1.2方法
1.2.1ARF基因家族鑒定??劍麻轉(zhuǎn)錄組數(shù)據(jù)由本課題組測序獲得(相關(guān)數(shù)據(jù)未發(fā)表),共拼接組裝獲得66365個unigenes。利用植物轉(zhuǎn)錄因子數(shù)據(jù)庫(http://planttfdb.cbi.pku.edu.cn/)和Phytozome12基因組數(shù)據(jù)庫(https://phytozome.jgi.doe.gov/pz/?portal.html)下載模式植物擬南芥和水稻的ARF基因序列,將其作為探針序列,利用本地Blast軟件在劍麻轉(zhuǎn)錄組數(shù)據(jù)中進行blast搜索比對。同時,利用關(guān)鍵詞“auxinresponse factor”和“ARF”進行直接檢索,最后除去所得全部序列中的重復(fù)序列。利用NCBI的CCD數(shù)據(jù)庫對蛋白保守結(jié)構(gòu)域進行鑒定,并刪除不含ARF基因家族特征結(jié)構(gòu)域的基因。
1.2.2??基本理化性質(zhì)及保守結(jié)構(gòu)域分析 ?利用在線軟件ProtParam(http://web.expasy.org/protpara?m/)對劍麻ARF蛋白序列的分子量、等電點、不穩(wěn)定系數(shù)、脂肪指數(shù)和疏水性等基本的理化性質(zhì)進行預(yù)測分析。利用在線軟件Plant-mPLoc Server(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/#)對劍麻ARF蛋白進行亞細胞定位預(yù)測分析。
利用在線軟件MEME5.0.5(http://meme-suite.?org/tools/meme)和TBtools軟件對劍麻ARF家族蛋白的保守基序進行分析,基序的大數(shù)目設(shè)置為20,基序長度設(shè)置為6~200個氨基酸。運用在線軟件NCBI的CCD(https://www.ncbi.nlm.nih.?gov/Structure/bwrpsb/bwrpsb.cgi)和IBS 1.0.2軟件對得到的保守基序進行功能注釋,參照擬南芥和水稻的命名模式進行命名。
1.2.3 ?進化樹分析??利用Clustal X 2.1、MEGA5.20和Evolview在線軟件(http://www.evolgenius.info?/evolview)對劍麻、擬南芥和水稻的所有ARF蛋白序列進行進化樹構(gòu)建與優(yōu)化處理,其中系統(tǒng)發(fā)育進化樹構(gòu)建采用鄰接法(neighbor joining,NJ),參數(shù)設(shè)置選擇P-distance、pairwise deletion和Bootstrap method=1000,其他參數(shù)選擇默認值。
1.2.4??表達模式分析??利用劍麻轉(zhuǎn)錄組測序數(shù)據(jù)分析ARF基因的表達特征。轉(zhuǎn)錄組數(shù)據(jù)包括劍麻紫色卷葉病高抗和高感植株在0、60、90?d 三個不同發(fā)病時期的基因表達數(shù)據(jù)。以FPKM值表示轉(zhuǎn)錄本豐度,通過對數(shù)據(jù)均一化處理,利用TBtools工具做熱圖。
2.1劍麻ARF基因家族的鑒定
通過對轉(zhuǎn)錄組數(shù)據(jù)庫的本地Blast文庫進行檢索,共獲得16條ARF序列,經(jīng)CCD在線數(shù)據(jù)庫分析后最終獲得15個含有保守結(jié)構(gòu)域的ARF序列。按照基因在轉(zhuǎn)錄組中的ID大小為劍麻ARF編號,即AhARF1~AhARF15,見表1。從表中可以看出15個AhARF基因大小為1230~3036?bp,相應(yīng)的編碼氨基酸個數(shù)為409~1011個,編碼蛋白質(zhì)理論分子量大小為45.17~112.13 ku。編碼蛋白質(zhì)理論等電點大小為5.17~9.34,其中有5個大于7,平均大小為6.54,呈現(xiàn)弱酸性。不穩(wěn)定指數(shù)均大于40,均為不穩(wěn)定蛋白。平均親水系數(shù)均小于零,說明各蛋白均為親水性蛋白。亞細胞定位預(yù)測分析表明AhARF1和AhARF4定位于葉綠體,其他AhARFs則均定位在細胞核。
通過在線軟件NCBI的CCD(https://www.ncbi.?nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)數(shù)據(jù)庫對AhARF基因家族編碼蛋白的B3、Auxin-resp和AUX-IAA保守結(jié)構(gòu)域進行分析,結(jié)果表明AhARF5/7/8/9/11/12/13/15同時含有ARF家族的3個結(jié)構(gòu)域,占劍麻AhARF基因家族總數(shù)的53.33%,而其他成員僅含有B3和Auxin-resp這2個結(jié)構(gòu)域,相關(guān)信息見表1和圖1。
2.2AhARF蛋白的保守基序分析
通過在線軟件MEME和TBtools軟件對AhARFs蛋白中的保守motif進行分析,結(jié)果見圖2、圖3。預(yù)測AhARFs基因家族中含有20個保守motif,不同ARF基因家族成員之間所包含的motif不同,按照在AhARF基因家族中出現(xiàn)次數(shù)進行排序,其中motif 1/6/8/9/11出現(xiàn)15次,motif 2/4/5/7/13/18出現(xiàn)14次,motif 12出現(xiàn)13次,motif 10/14/16出現(xiàn)9次,motif 3出現(xiàn)8次,motif 15出現(xiàn)4次,motif 17出現(xiàn)2次,motif 19/20出現(xiàn)1次,Motif在ARF基因家族中出現(xiàn)頻率越高說明其越重要。
2.3ARF家族進化樹分析
為充分明確劍麻ARF基因家族各成員間進化關(guān)系與生物學(xué)功能的相關(guān)性,將15個AhARF基因家族成員與模式植物水稻、擬南芥的ARF基因家族成員進行進化關(guān)系分析,構(gòu)建相關(guān)進化樹,結(jié)果見圖4。從圖4中可以看出,整個進化樹共分為5個亞族,其中GroupⅠ中含有4個AhARF成員,GroupⅡ含有6個AhARF成員,GroupⅢ含有2個AhARF成員,GroupⅣ含有3個AhARF成員,而Ⅴ則沒有相關(guān)AhARF成員。進化關(guān)系上歸為一類的ARF基因在功能上可能較為相似,因此可以通過模式植物中已知功能的ARF基因推測劍麻中進化關(guān)系較近的AhARF基因功能。
Motif 1~20代表不同的保守氨基酸序列,每個motif中不同位置處出現(xiàn)的氨基酸種類越少,說明該位置處保守性越高。
Motif 1 to 20 represent different conserved amino acid sequences. The fewer amino acids species appearring at different positions in each motif, the higher the conservation at this position.
不同顏色方塊代表不同的保守基序,其中OsARF1~48代表水稻ARF基因家族,AtARF 1~37代表擬南芥ARF基因家族,AhARF 1~15代表劍麻ARF基因家族。
Different color squares represent different conservative motifs.OsARF1-48represent theARFgene family inOryza sativaL.AtARF1-37represent theARFgene family inArabidopsis thaliana.AhARF1-15represent theARFgene family inAgave.hybridNo.11648.
不同顏色代表不同聚類家族。不同的形狀表示不同的物種,五角星代表來自水稻的ARF蛋白,正方形代表來自擬南芥的ARF蛋白,圓形代表來自劍麻的ARF蛋白。
Different colors represent different cluster families. Different shapes represent different species,?the star represents the ARF protein from rice,the square represents the ARF protein from Arabidopsis and the circle represents the ARF protein from agave.
2.4劍麻ARF基因家族表達分析
根據(jù)已完成的劍麻紫色卷葉病高抗和高感植株的RNA-Seq數(shù)據(jù)庫(相關(guān)數(shù)據(jù)未發(fā)表),找出篩選出的15個AhARF基因相應(yīng)的RPKM值,經(jīng)均一化處理后,利用TBtools進行HeatMap熱圖制作,結(jié)果見圖5。從圖5可以看出,15個AhARF基因在高抗和高感植株中均有表達,但不同基因間有其獨特的表達模式,同時也有其表達共性,如粉蚧接種處理0 d時,大多數(shù)AhARF基因在高抗和高感植株中均呈現(xiàn)上調(diào)表達,隨著處理后時間的延長,多數(shù)基因均呈現(xiàn)下調(diào)表達趨勢。此外,隨著粉蚧接種處理后時間的延長,AhARF13/14基因在劍麻紫色卷葉病高抗植株中呈現(xiàn)先上調(diào)后下調(diào)的表達趨勢,AhARF10基因則在高感植株中呈現(xiàn)一直上調(diào)的表達趨勢,推測這3個基因可能直接或者間接的參與劍麻紫色卷葉病抗性的調(diào)節(jié)。
當前,隨著高通量測序和生物信息學(xué)技術(shù)的迅猛發(fā)展,越來越多植物ARF基因家族相繼被鑒定出來,ARF基因家族鑒定方式主要包括全基因組學(xué)水平的鑒定和轉(zhuǎn)錄組學(xué)水平的鑒定這2種方式[8]。基于全基因組學(xué)水平的鑒定方式,分別從擬南芥[10]、煙草[2]、大豆[11]、水稻[12]、番茄[13]、葡萄[15]、蘋果[1]、楊樹[16]、桃[18]、鐵皮石斛[19]等植物中鑒定得到了23、50、51、25、21、19、29、39、18、14個ARF基因。而基于轉(zhuǎn)錄組學(xué)水平的鑒定方式,分別從荔枝、黃芩、水仙等植物中鑒定得到了21、24、21個ARF基因。本研究通過轉(zhuǎn)錄組學(xué)水平的鑒定方式,從劍麻中鑒定得到了15個ARF基因家族。通過蛋白質(zhì)保守結(jié)構(gòu)域預(yù)測,結(jié)果發(fā)現(xiàn)除AhARF9和AhARF14外,其他AhARFs蛋白B3 domain均由102個氨基酸組成,這與水仙、柑橘的研究結(jié)果相似[8-20]。Tiwari等[21]和Ulmasov等[22]研究發(fā)現(xiàn),B3 domain與AUX-IAA domain之間的非保守區(qū)域如果富含甘氨酸(G)、絲氨酸(S)、亮氨酸(L)和脯氨酸(P)殘基則為轉(zhuǎn)錄抑制子,如果富含谷氨酰胺(Q)、絲氨酸(S)和亮氨酸(L)殘基則為轉(zhuǎn)錄激活子。本研究中發(fā)現(xiàn)劍麻AhARF蛋白中有8個AhARF蛋白同時含有B3 domain與AUX-IAA domain結(jié)構(gòu)域,其中AhARF 5/8/11/13富含Q、S、L,推測其為轉(zhuǎn)錄激活子,而AhARF 7/9/12/15則
紅色系列和綠色系列圓點代表其對應(yīng)基因相對表達量分別為正值和負值。圓點越大其對應(yīng)基因相對表達量的絕對值越大。相反,圓點越小其對應(yīng)基因相對表達量的絕對值越小。在列標題中,F(xiàn)代表高感植株;R代表高抗植株;0、60、90 d分別代表粉蚧接種后0、60、90 d。在行標題中,AhARF1~15分表代表不同劍麻ARF基因。
The red series and the green series dot represent the relative expression levels of the corresponding genes are positive and negative, respectively. The larger the dot, the larger the absolute value of the its corresponding gene relative expression levels. Conversely, the smaller the dot, the smaller the absolute value of its corresponding gene relative expression levels. In the column title, F represents disease-susceptible plant; R represents disease-resistant plant; 0 d, 60 d, 90 d represent 0 day, 60 day, 90 days?after inoculated with mealybug.In the row title,AhARF1–15represent different agave?ARFgenes.
富含G、S、L、P,推測其為轉(zhuǎn)錄抑制子。結(jié)合劍麻AhARF和擬南芥、水稻的進化樹分析結(jié)果,AhARF 5/8/11/13均分布在Group II中,而AhARF 7/9/12/15均分布在Group I,進一步驗證了該推測,與Tiwari等[21]和Ulmasov 等[22]的研究結(jié)果相吻合。
本研究基于轉(zhuǎn)錄組學(xué)水平的鑒定方式從劍麻中篩選獲得15個ARF基因,并對其進行相關(guān)生物信息學(xué)和表達特征分析,為深入研究ARF基因家族在劍麻中的相關(guān)功能奠定了堅實的基礎(chǔ)。
參考文獻
[1]?李慧峰, 冉 ?昆, 何 ?平, 等. 蘋果生長素響應(yīng)因子(ARF)基因家族全基因組鑒定及表達分析[J]. 植物生理學(xué)報, 2015, 51(7): 1045-1054.
[2]?孫亭亭, 張 ?磊, 陳 ?樂, 等. 普通煙草ARF基因家族序列的鑒定與表達分析[J]. 植物遺傳資源學(xué)報, 2016, 17(1): 162-168.
[3]?李洪有, 霍冬敖, 蔡 ?芳, 等. 蕎麥ARF基因家族的鑒定及生物信息學(xué)分析[J]. 浙江農(nóng)業(yè)學(xué)報, 2018, 30(1): 7-13.
[4]?Li S B, Xie Z Z, Hu C G,et al. A review of auxin response factors (ARFs) in plants[J]. Frontiers in Plant Science, 2016, 7: 47.
[5]?Guilfoyle T J, Hagen G. Auxin response factors[J]. Current Opinion in Plant Biology, 2007, 10(5): 453-460.
[6]?郭寶健, 李 ?贏, 袁澤宸, 等. 大麥ARF基因家族的全基因組分析[J]. 麥類作物學(xué)報, 2016, 36(11): 1426-1432.
[7]?楊 ?舟, 呂 ?可, 呂 ?珊, 等. 百子蓮2個ARF基因與2個Aux/IAA基因的全長克隆與序列分析[J]. 浙江農(nóng)業(yè)學(xué)報, 2019, 31(1): 86-97.
[8]?李全超, 劉 ?洋, 肖瑤宇, 等. 基于轉(zhuǎn)錄組的‘黃花2號水仙ARF 基因家族分析[J].應(yīng)用與環(huán)境生物學(xué)報, 2019,?25(3): 687-694.
[9]?董 ?晨, 魏永贊, 王 ?弋, 等. 基于轉(zhuǎn)錄組的荔枝ARF基因家族的鑒定及表達分析[J]. 熱帶作物學(xué)報, 2017, 38(8): 1485-1491.
[10]?Okushima Y, Overvoorde P J, Arima K,et al. Functional genomic analysis of the AUXIN RESPONSE FACTOR gene family members inArabidopsis thaliana: unique and overlapping functions of ARF7 and ARF19[J]. The Plant Cell, 2005, 17(2): 444-463.
[11]?Chien V H, Dung T L, Nishiyama R,et al. The auxin response factor transcription factor family in soybean: genome-wide identification and expression analyses during development and water stress[J]. DNA Research, 2013, 20(5): 511-524.
[12]?Wang D, Pei K, Fu Y,et al. Genome-wide analysis of the auxin response factors (ARF) gene family in rice (Oryzasativa) [J]. Gene, 2007, 394(1-2): 13-24.
[13]?Wu J, Wang F, Cheng L,et al. Identification, isolation and expression analysis of auxin response factor (ARF) genes inSolanum lycopersicum[J]. Plant Cell Report, 2011, 30(11): 2059-2073.
[14]?Xing H, Pudake R N, Guo G,et al. Genome-wide identification and expression profiling of auxin response factor (ARF) gene family in maize[J]. BMC Genomics, 2011, 12(1): 178.
[15]?Wan S, Li W, Zhu Y,et al. Genome-wide identification, characterization and expression analysis of the auxin response factor gene family inVitis vinifera[J]. Plant Cell Report, 2014, 33(8): 1365-1375.
[16]?Kalluri U C, Difazio S P, Brunner A M,et al. Genome-wide analysis of Aux/IAA and?ARFgene families in?Populus trichocarpa[J]. BMC Plant Biology, 2007, 7: 59.
[17]?Hu W, Jiao Z, Hou X,et al. The auxin response factor gene family in banana: genome-wide identification and expression analyses during development, ripening, and abiotic stress[J]. Frontiers in Plant Science, 2015, 6: 742.
[18]?Li H, Ran K, Sun Q. Genome-wide identification and expression analysis of peach auxin response factor gene families [J]. Journal of Plant Biochemistry Biotechnology, 2016, 25(4): 349-357.
[19]?Chen Z, Yuan Y, Fu D,et al. Identification and expression profiling of the auxin response factors inDendrobium officinaleunder abiotic stresses[J]. International Journal of Molecular Sciences, 2017, 18(5): 927.
[20]?李斯貝. 柑橘生長素響應(yīng)因子ARF基因家族的表達分析及功能驗證[D]. 武漢: 華中農(nóng)業(yè)大學(xué), 2016.
[21]?Tiwari S B, Hagen G, Guilfoyle T. The roles of auxin response factor domains in auxin-responsive transcription[J]. The Plant Cell, 2003, 15(2): 533-543.
[22]?Ulmasov T, Hagen G, Guilfoyle T J. Activation and repression of transcription by auxin-response factors[J]. Proceedings of the National Academy of Sciences USA, 1999, 96(10): 5844-5849.