解美霞,楊君,王國寧,李志坤,張艷,孟成生,馬峙英,王省芬
(教育部華北作物種質(zhì)資源研究與利用重點實驗室/ 河北省棉花產(chǎn)業(yè)協(xié)同創(chuàng)新中心/河北省作物種質(zhì)資源重點實驗室/ 河北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,河北保定071001)
在蛋白家族數(shù)據(jù)庫Pfam 中有3 700 多種未知功能域(Domains of unknown function,DUF)蛋白,占到所有已知結(jié)構(gòu)域蛋白的25%左右[1]?;蚪M學(xué)與蛋白質(zhì)組學(xué)的快速發(fā)展為系統(tǒng)研究DUF家族蛋白提供了重要的生物信息學(xué)數(shù)據(jù),更為揭示這些未知結(jié)構(gòu)域家族基因在調(diào)控植物生長發(fā)育以及響應(yīng)逆境脅迫方面的研究奠定了基礎(chǔ)[2]。
DUF642 家族蛋白包含1~2 個高度保守的DUF642 結(jié)構(gòu)域,是種子植物所特有的高度保守的細(xì)胞壁相關(guān)蛋白[3]。在水稻(Oryza sativa)和擬南芥(Arabidopsis thaliana)中分別有 12 個和 10個 DUF642 家族成員[4-6]。DUF642 在植物抵抗病原菌侵染和非生物逆境脅迫響應(yīng)過程中發(fā)揮重要作用。擬南芥DUF642 基因 At5g25460 和At3g08030 可受細(xì)菌侵染和害蟲取食誘導(dǎo)表達。在接種青枯雷爾氏菌(Ralstonia solanacearum)后At5g25460 下調(diào)表達[7],而 At3G08030 在接種帶化紅球菌(Rhodococcus fascians)后上調(diào)表達[8]。擬南芥 DUF642 家族蛋白 BIIDXI(BDX)參與調(diào)節(jié)不同組織中細(xì)胞壁果膠甲基酯化[9]。Xie 等[10]從中國葡萄(Vitis quinquangularis)丹鳳 2 號中克隆到VqDUF642,其過表達能夠使植株果膠甲酯酶(Pectin methylesterases,PME)活性增強,從而提高對灰葡萄孢菌(Botrytis cinerea)的抗性,表明VqDUF642 與漿果發(fā)育和抗病性有關(guān)。籽粒莧(Amaranthus hypochondriacus)AhDGR2 是 1 個編碼DUF642 蛋白的基因,在鹽和干旱等脅迫誘導(dǎo)下發(fā)生顯著表達變化[11]。玉米ZmDUF642 基因在干旱、鹽和鋁等脅迫誘導(dǎo)下也能發(fā)生顯著表達變化[12]。
目前,我國各大棉區(qū)都遭受不同程度的鹽堿、干旱、冷害、病害、蟲害的威脅[13-20]。不斷發(fā)掘和篩選具有抗逆功能的基因成為棉花研究領(lǐng)域的重要科學(xué)問題之一。陸地棉(Gossypium hirsutum)基因組測序工作取得明顯進展[21-22],使系統(tǒng)地鑒定和研究棉花基因家族成為可能。DUF642基因已經(jīng)顯示出參與植物抗逆反應(yīng)的潛在重要性,但目前尚未見其在棉花中的研究報道。本研究基于陸地棉全基因組數(shù)據(jù),對DUF642 基因家族進行了系統(tǒng)鑒定和生物信息學(xué)分析,特別是應(yīng)用轉(zhuǎn)錄組數(shù)據(jù)和實時定量聚合酶鏈?zhǔn)椒磻?yīng)(Real-time quantitative polymerase chain reaction,RT-qPCR)技術(shù)分析了DUF642 家族基因在不同組織和多種逆境脅迫下的表達規(guī)律,為后續(xù)解析其功能奠定基礎(chǔ)。
通過 TAIR(https://www.arabidopsis.org)網(wǎng)站下載擬南芥DUF642 家族基因序列,在陸地棉TM-1 基因組數(shù)據(jù) (NAU version 1.1) 中進行BLAST 分析,并利用Pfam 數(shù)據(jù)庫進一步鑒定。通過 ExPASy-ProtParam tool(http: //www.expasy.org/tools/protparam.html) 在線軟件分析 DUF642蛋白的氨基酸殘基數(shù)量、相對分子質(zhì)量、理論等電點及不穩(wěn)定指數(shù)等[23]。使用CELLO V.2.5(http://cello.life.nctu.edu.tw/) 在線工具進行蛋白亞細(xì)胞定位預(yù)測[24]。使用 SignalP 4.0(http://www.cbs.dtu.dk/services/SignalP/)預(yù)測信號肽[25]。
從 Cotton Functional Genomics Database(CottonFGD)(https://cottonfgd.org/)[26]提取陸地棉D(zhuǎn)UF642 基因家族的基本信息,包括基因序列、編碼序列(Coding sequence,CDS)、染色體位置等。利用TBtools 軟件分析基因的染色體定位[27]。通過 GSDS2.0(http://gsds.cbi.pku.edu.cn/)在線軟件分析基因結(jié)構(gòu)[28]。
利用軟件MEGA7.0 對陸地棉與擬南芥DUF642 基因編碼的蛋白進行多序列比對,使用相鄰連接法(Neighbor-Joining,NJ)構(gòu)建系統(tǒng)進化樹[29]。
截取陸地棉D(zhuǎn)UF642 基因上游1 500 bp DNA 序列,利用 PlantCARE 數(shù)據(jù)庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預(yù)測可能存在的順式作用元件。
從 NCBI SRA(Sequence Read Archive)數(shù)據(jù)庫下載陸地棉的7 種器官(根、莖、葉、雌蕊、雄蕊、花萼和花瓣)和4 種逆境脅迫(冷、熱、干旱和鹽)處理后的轉(zhuǎn)錄組數(shù)據(jù)(基因組測序計劃編號(Genome sequencing project accession):PRJNA 248163)。棉花材料處理和數(shù)據(jù)獲取過程詳見Zhang 等[21]的研究報道。以 FPKM(Fragments per kilobase of transcript per million fragments mapped)>1 作為基因表達的篩選標(biāo)準(zhǔn)。通過對數(shù)據(jù)進行l(wèi)og2(1+FPKM)標(biāo)準(zhǔn)化。以表達量倍數(shù)變化(Fold change,F(xiàn)C)>1.5 或<0.8 作為基因具有顯著表達差異標(biāo)準(zhǔn)。使用HemI(Heatmap Illustrator,version 1.0) 軟件繪制基因表達熱圖[30]。
供試棉花品種為抗病陸地棉農(nóng)大601(ND601),由河北農(nóng)業(yè)大學(xué)棉花品種創(chuàng)新與產(chǎn)業(yè)化團隊提供。棉種先用無菌水浸泡24 h,然后置于濕潤毛巾上于室溫催芽;大約1 d 后,挑選長勢一致(芽長0.5 cm)的發(fā)芽種子播種到六棱缽中,于16 h 光照/8 h 黑暗和25 ℃條件下的生長室中進行培養(yǎng)。棉苗生長約7 d 后用于接種黃萎病菌。參考Yang 等[31]的方法進行黃萎病菌孢子懸浮液的制備和棉苗接種處理。每棵棉苗接種懸浮液30 mL (孢子含量 107mL-1)。在接菌 0 h、6 h、12 h、24 h、48 h 時,取棉花根部,用蒸餾水清洗干凈,于液氮速凍后-80 ℃保存?zhèn)溆谩C總€時間點取3株棉苗,每次取3 個生物學(xué)重復(fù)。以蒸餾水代替菌液處理的棉苗作為對照(CK)。
按照EASYspin Plant RNA kit 試劑盒操作說明提取棉花根組織總RNA。經(jīng)1.5%(質(zhì)量分?jǐn)?shù))的瓊脂糖凝膠電泳和Nano Drop 2000 分光光度計檢測RNA 樣品的質(zhì)量和濃度后,使用Rever-Tra AceqPCR RT Master Mix with gDNA Remover(TOBOYO)反轉(zhuǎn)錄試劑盒合成 cDNA。采用 THUNDERBIRDSYBRqPCR Mix(TOBOYO) 定量試劑盒進行 RT-qPCR。反應(yīng)于7500 Real Time PCR System(Applied Biosystems)中進行,程序設(shè)置:95 ℃預(yù)變性 3 min;95 ℃變性 10 s,58 ℃退火 20 s,72 ℃延伸 34 s,40 次循環(huán)。所用引物詳見表1,其中GhHis3 作為內(nèi)參[32]。每個樣品進行 3 次重復(fù)檢測,采用 2-ΔΔCT法計算基因的相對表達量[33]。使用GraphPad Prism7 軟件對數(shù)據(jù)進行Tukey 多重比較測試和繪圖。
表1 本研究所用引物Table 1 Primers used in this study
基于陸地棉基因組數(shù)據(jù),通過BLAST 共鑒定到23 個DUF642 基因。根據(jù)它們在染色體上的位置依次命名為GhDUF642-01~GhDUF642-23(表2)。其中GhDUF642-18 基因序列不完整,故根據(jù)華中農(nóng)業(yè)大學(xué)公布的陸地棉基因組信息(HAU version 1.1) 對該基因序列進行了修正[22]。陸地棉D(zhuǎn)UF642 家族基因開放讀碼框(Open reading frame,ORF)長度為 612~1 245 bp,編碼的蛋白含有203~414 個氨基酸殘基,相對分子質(zhì)量介于 22.10 ~45.15 kDa,理論等電點在4.37~9.41,不穩(wěn)定指數(shù)為 27.85~41.13,結(jié)構(gòu)相對穩(wěn)定。除GhDUF642-11 外,家族其他成員都含有信號肽。除 GhDUF642-23 含有 1 個 DUF642結(jié)構(gòu)域外,其他家族成員都含有2 個結(jié)構(gòu)域。蛋白亞細(xì)胞定位預(yù)測顯示,GhDUF642 中有8 個定位在細(xì)胞膜,6 個定位在胞外,5 個定位在葉綠體,2 個定位在細(xì)胞質(zhì),2 個定位在線粒體。
表2 陸地棉D(zhuǎn)UF642 基因信息Table 2 The information of Gossypium hirsutum DUF642
23 個GhDUF642 基因分布在陸地棉的14條 染 色 體 (A02、A05、A06、A07、A08、A09、A10、D03、D05、D06、D07、D08、D09、D10)和 1 條 scaffold (scaffold3920_D03) 上。GhDUF642-06 與GhDUF642-07、GhDUF642-11 與GhDUF642-12、GhDUF642-22 與GhDUF642-23 分別串聯(lián)分布在A07、A10 和 D10 染色體(圖1)。
根據(jù)基因全長和CDS 序列對GhDUF642 進行基因結(jié)構(gòu)分析。如圖2 所示,GhDUF642 大多含有2~4 個外顯子。根據(jù)內(nèi)含子和外顯子的數(shù)量與位置,該家族基因可分為3 組,即Ⅰ、Ⅱ和Ⅲ,分別包括10 個、6 個和7 個基因。同組內(nèi)基因顯示出相似的結(jié)構(gòu)。
圖1 陸地棉D(zhuǎn)UF642 基因的染色體定位Fig.1 Chromosome location of Gossypium hirsutum DUF642 genes
圖2 GhDUF642 基因結(jié)構(gòu)Fig.2 Gene structure of GhDUF642
利用陸地棉與擬南芥DUF642 家族基因編碼的氨基酸序列構(gòu)建系統(tǒng)進化樹,結(jié)果(圖3)顯示,所有的DUF642 蛋白可分為4 個亞組。At2g41810與 GhDUF642-01、GhDUF642-09、Gh DUF642-13和 GhDUF642-20 這 4 個蛋白位于同一分支。At3g08030 與 GhDUF642-08 和 GhDUF642-19 位于同一分支。At5g11420、At5g25460 和At4g32460與 GhDUF642-02、GhDUF642-05、GhDUF642-14和GhDUF642-17 這4 個蛋白位于同一分支。每個亞組并沒有因為物種差異而單獨分成2 類,表明陸地棉與擬南芥DUF642 家族成員有較近的親緣關(guān)系,可能具有相似的生物學(xué)功能。
圖3 陸地棉與擬南芥DUF642 家族的系統(tǒng)進化分析Fig.3 Phylogenetic analysis of DUF642 from Gossypium hirsutum and Arabidopsis thaliana
如圖4 所示,陸地棉D(zhuǎn)UF642 家族基因上游1 500 bp 存在數(shù)量不等的響應(yīng)植物激素和環(huán)境脅迫相關(guān)順式作用元件。這些激素包括生長素(Indole-3-acetic acid,IAA)、脫落酸(Abscisic acid,ABA)、乙烯(Ethylene,ET)、水楊酸(Salicylic acid,SA)、赤霉素(Gibberellic acid,GA)和茉莉酸甲酯(Methyl jasmonate,MeJA)。環(huán)境脅迫相關(guān)的順式作用元件有3 種,包括干旱響應(yīng)元件(MBS)、防御和脅迫響應(yīng)元件(Defense and stress)和低溫響應(yīng)元件(LTR)。其中GhDUF642-08 和GhDUF642-21 各含有9 個順式作用元件,是具有調(diào)控元件最多的基因;GhDUF642 含有響應(yīng)ABA 的順式作用元件數(shù)量最多,如GhDUF642-01、Gh-DUF642-04 等 8 個基因各含有 3 個; 除了Gh-DUF642-01、GhDUF642-11 和GhDUF642-13 外,其余20 個DUF642 基因中都具有1 個響應(yīng)ET的順式作用元件。由此可見,每個GhDUF642 啟動子含有不同數(shù)量和種類的順式作用元件,表明它們可能通過不同的信號通路參與多種環(huán)境脅迫反應(yīng)。
圖4 GhDUF642 順式作用元件分析Fig.4 cis-acting elements analysis of GhDUF642 genes
對GhDUF642 基因在棉花根、莖、葉、雌蕊、雄蕊、花萼和花瓣7 個組織中的表達模式分析結(jié)果顯示,23 個GhDUF642 基因中有14 個具有組織表達特異性(圖5)??煞譃? 種組織表達模式:模式Ⅰ只包含1 個基因GhDUF642-02,其主要在副萼和根中表達;模式Ⅱ包括GhDUF642-03、Gh-DUF642-09 、GhDUF642-15 、GhDUF642-20 和GhDUF642-22,它們在7 種組織中都具有較低表達量;模式Ⅲ包括GhDUF642-08、GhDUF642-10、GhDUF642-19 和GhDUF642-21,它們在根、莖、葉和雌蕊中具有較高表達量; 模式Ⅳ包括Gh-DUF642-04、GhDUF642-14 和GhDUF642-16,它們除在莖和葉中低表達,在其余5 種組織中都高表達;模式Ⅴ只有GhDUF642-17,其主要在副萼、花瓣和根中表達。
圖5 GhDUF642 基因的組織表達特異性Fig.5 Tissue specificity expression of GhDUF642 genes
對陸地棉D(zhuǎn)UF642 家族基因在冷、熱、干旱和鹽4 種逆境脅迫處理后的表達分析結(jié)果顯示:冷脅迫處理后,14 個GhDUF642 基因的表達發(fā)生了顯著變化,其中GhDUF642-09 在處理1 h 時顯著上調(diào)表達,隨后轉(zhuǎn)為顯著下調(diào)表達; 而Gh-DUF642-18 在處理1 h 后顯著下調(diào)表達,但在處理12 h 時變?yōu)轱@著上調(diào)表達;GhDUF642-20 在處理6 h 時顯著上調(diào)表達;其余11 個GhDUF642在冷脅迫處理后均表現(xiàn)為顯著下調(diào)表達 (圖6A)。熱脅迫處理后,13 個GhDUF642 基因表達量發(fā)生顯著變化,其中GhDUF642-21 在處理1 h時顯著上調(diào)表達;GhDUF642-09 和GhDUF642-20在處理6 h 時顯著上調(diào)表達,隨后轉(zhuǎn)為顯著下調(diào)表達;GhDUF642-16 和GhDUF642-22 在處理 6 h時顯著下調(diào)表達;GhDUF642-02 和Gh-DUF642-14 在處理 12 h 時顯著下調(diào)表達 (圖6B)。通過聚乙二醇(Polyethylene glycol,PEG)模擬干旱脅迫效應(yīng),導(dǎo)致13 個GhDUF642 基因的表達發(fā)生顯著變化,其中GhDUF642-09 和Gh-DUF642-16 在處理1 h 時顯著上調(diào)表達,但Gh-DUF642-16 在處理12 h 時又顯著下調(diào)表達;Gh-DUF642-22 在處理1 h 后先顯著下調(diào)表達,而在處理12 h 時變?yōu)轱@著上調(diào)表達;GhDUF642-10和GhDUF642-20 在處理 3 h 和6 h 時分別發(fā)生顯著下調(diào)表達;GhDUF642-02、GhDUF642-14 和GhDUF642-17 在處理12 h 時顯著下調(diào)表達 (圖6C)。鹽脅迫處理后,12 個GhDUF642 基因的表達量發(fā)生了顯著變化,其中GhDUF642-09 和Gh-DUF642-16 在處理1 h 時顯著上調(diào)表達,隨后轉(zhuǎn)為顯著下調(diào)表達; 其余10 個基因在鹽脅迫處理后部分時間點表現(xiàn)為顯著下調(diào)表達(圖6D)。這些GhDUF642 對于不同脅迫處理表現(xiàn)出不同的表達變化,表明它們可能在棉花應(yīng)對不同的逆境脅迫時發(fā)揮不同的重要作用。
圖6 陸地棉 DUF642 基因在冷(A)、熱(B)、干旱(C)和鹽(D)等 4 種逆境脅迫下的表達Fig.6 Expression profiling of DUF642 genes from Gossypium hirsutum under four stresses, including cold (A), hot(B), drought (C) and salt (D)
根據(jù)本研究團隊已獲得的大麗輪枝菌脅迫處理后的棉花根組織轉(zhuǎn)錄組數(shù)據(jù)(尚未發(fā)表),選擇其中6 個具有潛在表達差異的GhDUF642 基因進行RT-qPCR 分析。結(jié)果顯示,在一段時期內(nèi),GhDUF642-04、GhDUF642-08、GhDUF642-16、GhDUF642-19 和GhDUF642-21 這 5 個基因受黃萎病菌誘導(dǎo)后顯著下調(diào)表達,而Gh-DUF642-10 顯著上調(diào)表達(圖7),表明這些基因參與棉花響應(yīng)黃萎病菌侵染過程。
圖7 黃萎病菌脅迫下陸地棉D(zhuǎn)UF642 基因表達分析Fig.7 The expression analysis of GhDUF642 genes from upland cotton induced with Verticillium dahliae
近年來,棉花基因組測序工作的不斷完成與更新,為從全基因組水平研究基因功能奠定了基礎(chǔ)。目前,關(guān)于棉花DUF642 基因家族的研究還未見報道。本研究首次在陸地棉基因組中鑒定到23 個GhDUF642 基因(表 1),多于擬南芥(10個)和水稻(12 個)中已鑒定的DUF642 基因數(shù)量[4-6],這可能是由于棉花基因組加倍的結(jié)果。Gh-DUF642-06 與GhDUF642-07、GhDUF642-11 與GhDUF642-12 以及GhDUF642-22 與GhDUF642-23 分別串聯(lián)于 A07、A10 和 D10 染色體 (圖1),可能是由于基因串聯(lián)復(fù)制導(dǎo)致該基因家族的擴張?;蚪Y(jié)構(gòu)分析顯示GhDUF642 家族基因可分為3 組,各組基因具有相似的基因結(jié)構(gòu),且內(nèi)含子長度、外顯子數(shù)目幾乎一致,但各組之間內(nèi)含子序列長度不同(圖2)。另外,通過氨基酸序列進行的聚類分析顯示,擬南芥與棉花的DUF642基因發(fā)生了聚集效應(yīng)(圖3)。GhDUF642-01、GhDUF642-09、GhDUF642-13、GhDUF642-20 與At2g41810 位于同一進化分支,而At2g41810 與擬南芥耐鹽相關(guān)[34],因此推測這4 個GhDUF642 基因可能參與棉花鹽脅迫響應(yīng)。轉(zhuǎn)錄水平上的變化進一步表明了GhDUF642-09 參與棉花抗鹽脅迫(圖6D)。GhDUF642-08、GhDUF642-19 與At3g08030 位于同一進化分支。目前,At3g08030被證明參與種子發(fā)育過程[35],尚未見其參與抗逆功能的報道。本研究發(fā)現(xiàn)GhDUF642-08 和Gh-DUF642-19 序列上游都有響應(yīng) SA、ABA、IAA、ET 和GA 的調(diào)控元件(圖4),并且它們在根中高表達(圖5),受黃萎病菌誘導(dǎo)后顯著下調(diào)表達(圖7),表明這2 個基因可能參與棉花抗黃萎病菌侵染過程,但具體的抗病信號通路還有待進一步確認(rèn)。At4g32460 和 At5g11420 編碼的 DUF642 蛋白在擬南芥發(fā)育過程中可能是PME 活性的陽性調(diào)控因子。在種子萌發(fā)過程中過表達這2 個基因,轉(zhuǎn)基因株系的PME 活性顯著增強,種子萌發(fā)性能改善[36]。At5g25460 對根與葉的伸展和生長具有重要的作用[4]。GhDUF642-02、GhDUF642-05、GhDUF642-14 、GhDUF642-17 與 At4g32460 、At5g11420 和At5g25460 位于同一進化分支 (圖3),推測這4 個GhDUF642 基因可能參與調(diào)節(jié)棉花生長發(fā)育過程。目前,關(guān)于植物DUF642 基因家族功能的研究還很有限。本研究通過生物信息學(xué)鑒定了陸地棉D(zhuǎn)UF642 基因家族,在轉(zhuǎn)錄水平上初步探討了它們可能具有的生長發(fā)育和抗逆功能,為進一步研究該家族基因奠定了重要的基礎(chǔ)。