吳翠翠 肖水平
(1.山西農(nóng)業(yè)大學(xué)棉花研究所,運城 044000;2.江西省經(jīng)濟作物研究所,南昌 330000;3.棉花生物育種與綜合利用全國重點實驗室,安陽 455000)
棉花作為我國主要經(jīng)濟作物和主要天然纖維來源,已成為我國除糧食以外不可缺少的戰(zhàn)略儲備物資,但部分地區(qū)土壤鹽堿化嚴重、極端高溫、干旱天氣和“倒春寒”現(xiàn)象限制了棉花產(chǎn)量和質(zhì)量。因此,解析棉花抗逆分子機制,將有助于通過遺傳育種的方式,培育高產(chǎn)優(yōu)質(zhì)抗逆的棉花新品種。近年來,隨著多個棉屬物種基因組測序工作的相繼完成[1-8],在基因組水平上揭示了棉花的進化機制和棉花資源遺傳多樣性的原因,為棉花產(chǎn)量、品質(zhì)和抗性的提高提供了豐富的基因組學(xué)資源。
HD-Zip 家族蛋白是植物特有的轉(zhuǎn)錄因子,編碼含有60 個保守氨基酸同源結(jié)構(gòu)域(HD)的同源異型盒(Homeobox)蛋白。在植物中,第一個含有HD 的基因在玉米(Zea mays)中被報道,發(fā)現(xiàn)了一個控制葉片分化機制的Knotted1[9]。目前,在擬南芥、水稻、小麥、玉米、馬鈴薯、大麥、番茄、向日葵和苜蓿中均發(fā)現(xiàn)了該基因[10-17]。HD-Zip 蛋白包括HD 結(jié)合結(jié)構(gòu)域和與HD 緊密相連的亮氨酸拉鏈(Zip)結(jié)構(gòu)域,并介導(dǎo)蛋白質(zhì)二聚體的形成[10]。根據(jù)HD-Zip 的結(jié)構(gòu)特點、序列保守性、理化功能等特征,將其分為4 個亞家族,即HD-ZipI-IV[10,18]。研究表明,HD-Zip 家族基因在許多植物中具有重要的功能。
HD-ZipI 亞家族主要在逆境脅迫、葉片發(fā)育和光信號轉(zhuǎn)導(dǎo)中發(fā)揮重要作用[19]。擬南芥HD-Zip I 亞家族中參與低溫和干旱脅迫的AtHB6、AtHB7、AtHB12通過關(guān)閉氣孔、增加水分的吸收和調(diào)節(jié)相應(yīng)的脅迫基因來抵抗脅迫的影響[20-22]。在水稻HD-ZipI 亞家族中,干旱處理下過表達Oshox4 可以減少節(jié)間伸長,延長營養(yǎng)生長期;Oshox4 還可以調(diào)節(jié)GA 的信號轉(zhuǎn)導(dǎo)[11]。此外,Oshox22 能夠通過ABA 介導(dǎo)的信號轉(zhuǎn)導(dǎo)途徑影響ABA 的生物合成,調(diào)節(jié)干旱和鹽分響應(yīng)[23]。
HD-ZipII 蛋白參與光響應(yīng)、避光和生長素信號傳導(dǎo)[24]。研究表明,AtHB2 參與光響應(yīng)信號和通過生長素途徑調(diào)節(jié)植物結(jié)構(gòu)[25-26]。此外,避蔭反應(yīng)的負調(diào)控因子HFR1/SICS1 調(diào)控AtHB2 的表達,使植物在被遮蔽時能保持各方面的穩(wěn)態(tài)[27]。HAT2、AtHB17 均參與生長素信號的傳導(dǎo)過程[28-29]。
HD-ZipIII 蛋白參與調(diào)控側(cè)向器官起始、胚胎發(fā)生、葉極性和分生組織等功能[24]。擬南芥HDZipIII 類中只 有5 個成員:AtHB8、PHAVOLUTA/AtHB9、PHABULOSA/AtHB14、CORONA/AtHB15 和REVOLUTA/IFL1[29]。REV、PHV 及PHB 在胚胎 發(fā)育過程中控制頂端形成的模式[30],此外,PHB 和PHV 通過抑制Kanadi 導(dǎo)致側(cè)器官的黃化以及木質(zhì)部的形成[31]。在誘導(dǎo)木質(zhì)部分化方面,AtHB8 也可能發(fā)揮作用[32]。
HD-ZipIV 蛋白在表皮細胞分化、毛狀體形成、花青素積累和根發(fā)育過程中發(fā)揮重要作用[24]。AtGL2 是最早被證明對表皮毛分化有重要作用的一個基因[33]。AtPDF2 和AtML1 也被證明參與表皮細胞分化過程[34]。研究表明,ANL2 在控制葉片花青素沉積、細胞壁機械特性調(diào)節(jié)中起作用[35]。此外,該亞家族在棉花纖維發(fā)育中研究較多。GhHD1 通過WRKY 轉(zhuǎn)錄因子和鈣信號通路基因來調(diào)節(jié)乙烯和ROS(活性氧)的水平,從而正調(diào)控棉花纖維的起始[36]。海島棉中的同源基因GbHD1 通過轉(zhuǎn)座子的插入導(dǎo)致莖毛數(shù)量的減少[37]。陸地棉中Tyl 類型的反轉(zhuǎn)錄轉(zhuǎn)座子優(yōu)先插入GhHD1 的A 亞組使棉花莖毛數(shù)量減少[38]。GaHOX1 在gl2 突變體擬南芥中過表達可以恢復(fù)其表皮毛缺失表型[39]。GhHOX3 與GhHD1 互作激活下游基因GhRDL1 和GhEXPA1 的表達進而促進纖維細胞的伸長[40]。
棉花中關(guān)于HD-Zip 家族基因在非生物脅迫中的研究鮮有報道。本研究從全基因組范圍系統(tǒng)鑒定陸地棉中HDZ 基因家族成員,對GhHDZ 家族進行系統(tǒng)的生物信息學(xué)分析,并基于已建立的陸地棉轉(zhuǎn)錄組數(shù)據(jù)分析該家族響應(yīng)冷、熱、鹽、干旱脅迫的表達特征,通過RT-qPCR 對部分GhHDZ 基因在4 種非生物脅迫處理下的表達模式進行鑒定,并對GhHDZ146 進行了功能分析,為陸地棉GhHDZ 家族基因在響應(yīng)逆境脅迫等方面的功能研究奠定基礎(chǔ)。
采用陸地棉品種TM-1 種植在培養(yǎng)箱中,條件是16 h 光照/8 h 黑暗,溫度26-28℃。在生長至三片真葉時進行非生物脅迫,分別是冷(4℃)、熱(40℃)、鹽(250 mmol/L NaCl)和 干旱(30%PEG6000),對照為水處理。在處理后的3、6、12和24 h 收集葉片冷凍在液氮中,-80℃保存,每個樣品取3 個獨立的生物學(xué)重復(fù)。
1.2.1 GhHDZ 基因家族的鑒定、理化性質(zhì)及亞細胞定位預(yù)測分析 使用CottonFGD(https://cottonfgd.net/)網(wǎng)站搜索并下載陸地棉的基因組、編碼序列和蛋白質(zhì)序列(ZJU,TM-1,version 2.1)。從PFAM 數(shù)據(jù)庫中下載HD(Homeodomain)的隱馬爾可夫模型(hidden Markov Models,HMM)文件PF00046 和PF02183,利用HMMER3.0 軟件(http://www.hmmer.org),e-value 值取1e-10,初步篩選出陸地棉HDZ家族基因。使用NCBI Web Batch CD-Search Tool[41](https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)進一步進行篩選并鑒定GhHDZ 基因。
利用在 線網(wǎng)站 ExPASy[42](https://web.expasy.org/compute_pi/)分析GhHDZ 家族蛋白的氨基酸數(shù)目、蛋白質(zhì)長度、等電點、分子量以及親水性等理化性質(zhì)。同時,利用WoLF-PSORT[43](https://wolfpso rt.hgc.jp/)和CELLO v2.5[44](http://cello.life.nctu.edu.tw/)網(wǎng)站預(yù)測GhHDZ 蛋白的亞細胞定位。
1.2.2 陸地棉GhHDZ 的系統(tǒng)進化樹、染色體定位和基因結(jié)構(gòu)分析 使用Clustal X[45]對所篩選的205 個GhHDZ 蛋白序列進行多序列比對,使用MEGA7.0 軟件的鄰接法[46]構(gòu)建GhHDZ 家族的系統(tǒng)發(fā)育樹。利用在線Evolview(https://www.omicsclass.com/article/671)修飾GhHDZ 的系統(tǒng)進化樹。
使用MapChart 軟件分析GhHDZ 在染色體上的分布。利用在線MEME 網(wǎng)站(http://memesuite.org/)用于識別保守的蛋白質(zhì)基序[47]。利用在線GSDS 2.0(http://gsds.gao-lab.org/)繪制陸地棉GhHDZ 家族基因外顯子-內(nèi)含子基因結(jié)構(gòu)圖[48]。并用TBtools 軟件[49]繪制系統(tǒng)發(fā)育樹、基因結(jié)構(gòu)和保守蛋白基序合圖,使用來自MEME 網(wǎng)站的XML 文件、來自系統(tǒng)發(fā)育樹分析的NWK 文件和陸地棉基因組的GFF3文件。
1.2.3 GhHDZ 家族基因順式元件、共線性分析及基因復(fù)制分析 從CottonFGD 下載陸地棉GhHDZ 家族基因起始密碼子上游2 kb 序列的啟動子區(qū)。使用在線PlantCARE 網(wǎng)站(http://bioinformatics.psb.ugent.be/webtools/plantcare/htmL/)[50]預(yù)測了GhHDZ 家族基因的順式作用元件。篩選并分析與植物生長發(fā)育、植物激素和非生物脅迫具有特定表達模式的順式作用元件。
利用MCScanX[51]程序進行GhHDZ 家族基因的共線性分析,采用TBtools 軟件繪制GhHDZ 家族同源基因?qū)﹂g的共線性Circos 圖,并利用KaKs_Calculator 2.0 軟件[52]計算同源基因?qū)χg的非同義替換(Ka)和同義替換(Ks)的Ka/Ks 值,對各基因?qū)χg的選擇壓進行分析[49]。
1.2.4 利用轉(zhuǎn)錄組數(shù)據(jù)分析GhHDZ 家族基因的表達模式 從NCBI 數(shù)據(jù)庫下載棉花TM-1 非生物脅迫(4℃低溫、37℃高溫、200 mmol/L NaCl 鹽脅迫、200 g/L PEG6000 溶液模擬干旱脅迫)轉(zhuǎn)錄組測序數(shù)據(jù)(登錄號:PRJNA248163)。通過TBtools 軟件生成表達熱圖,所有基因表達水平均通過log2(FPKM+1)標準化顯示[49]。
1.2.5 非生物脅迫處理陸地棉總RNA 的提取及實時熒光定量PCR 非生物脅迫處理葉片總RNA 的提取和反轉(zhuǎn)錄、實時熒光定量等試驗方法參照文獻[53]。內(nèi)參基因為GhHis3(GH_D03G0404),采用Primer3 軟件設(shè)計引物(表1)。采用2-ΔΔCt方法計算數(shù)據(jù)[54]。
表1 所用相關(guān)引物Table 1 Primers used in the study
1.2.6 GhHDZ146 的亞細胞定位 克隆GhHDZ146的全長CDS 序列,并與經(jīng)Sal I 和BamH I 雙酶切線性化的PRI101-35S-GFP 載體連接。將上述融合載體轉(zhuǎn)化到農(nóng)桿菌GV3101 中,通過農(nóng)桿菌介導(dǎo)的方法瞬時轉(zhuǎn)化煙草葉片,以空載體pRI101-35S-GFP 為對照[55]。注射煙草后避光培養(yǎng)36-48 h,用激光共聚焦顯微鏡SP8(萊卡,德國)觀察葉片中的GFP(green fluorescent protein)熒光。所用亞定位擴增引物詳見表1。
1.2.7 過表達GhHDZ146 擬南芥的轉(zhuǎn)化及鹽脅迫 將上述構(gòu)建的GhHDZ146 亞細胞定位載體作為過表達載體,轉(zhuǎn)化到根癌農(nóng)桿菌菌株 GV3101 后,使用浸花法浸染擬南芥(哥倫比亞生態(tài)型)[56]。浸染后暗處理24 h 后轉(zhuǎn)移至培養(yǎng)箱中,在20-22℃ 16 h 光照/8 h 黑暗下生長,7 d 后再浸染一次,直至T0代種子收獲。在含有Kan+(50 μg/mL)的1/2 MS 固體培養(yǎng)板進行T0、T1、T2、T3代種子的陽性株篩選。
選取3 個T3代過表達轉(zhuǎn)基因株系以及野生型材料,在無抗1/2 MS 培養(yǎng)基上長至5 d 時,將長勢均勻的幼苗移至新的含200 mmol/L NaCl 的1/2 MS 培養(yǎng)基的方皿板上,每個方皿中包含3 個過表達株系和1 個WT,3 個重復(fù),每重復(fù)每株系移入10 顆苗,進行脅迫試驗。于光照培養(yǎng)箱中垂直培養(yǎng)7 d 后,分別進行主根及根毛拍照。采用ImageJ 軟件進行根長和根毛長度的測量,其中,根毛長度測量方法參考付艷茹等[57]方法進行,根毛長度測量從根部成熟區(qū)根毛生長的起始位置開始,從下往上量取5 mm長度區(qū)域內(nèi)的根毛進行測量。
在陸地棉中共檢測到205 個GhHDZ 家族基因,根據(jù)基因在染色體上分布位置,依次命名為GhHDZ1-GhHDZ205(附表1)。
通過分析GhHDZ 基因的理化性質(zhì)(附表1),205 個GhHDZ 基因編碼的蛋白質(zhì)長度為95(GhHDZ88)-1 750 aa(GhHDZ43)。外顯子數(shù)目為1-19,變異范圍比較廣泛,其中,含有3 個外顯子的基因數(shù)目最多為75 個,而外顯子數(shù)目為5、7、14、16、17 和19 含有外顯子數(shù)目較少為1 或者2。等電點為4.40(GhHDZ68)-10.05(GhHDZ125),平均為6.86;GhHDZ 的親水性為-1.21(GhHDZ109)--0.083(Gh-HDZ102),平均親水性為-0.703,說明GhHDZ 為親水性蛋白。相對分子量為11.154(GhHDZ88)-197.851 kD(GhHDZ43),平均相對分子量為46.647 kD。亞細胞定位預(yù)測結(jié)果表明,186 個基因定位于細胞核,12 個基因定位于葉綠體,6 個定位于細胞骨架,只有1 個基因定位于液泡中。90%以上GhHDZ 定位于細胞核,表明這些蛋白可能作為轉(zhuǎn)錄因子調(diào)控陸地棉的生長發(fā)育。
為了揭示GhHDZ 蛋白之間的系統(tǒng)發(fā)育關(guān)系,建立一個無根的系統(tǒng)發(fā)育樹來評估陸地棉HDZ 之間的遺傳進化關(guān)系。結(jié)果(圖1)表明,GhHDZ 家族蛋白可劃分為4 個亞組,分別命名為HD-ZipI、HDZipII、HD-ZipIII、HD-ZipIV。陸地棉中,HD-ZipI 亞組中含有73 個GhHDZ 基因,是含基因數(shù)量最多的一組;HD-ZipII-IV 成員的數(shù)量分別為36、59 和37(圖1)。
圖1 陸地棉HDZ 蛋白的系統(tǒng)發(fā)育分析Fig.1 Phylogenetic analysis of HDZ proteins from G.hirsutum L.
為了更好地了解GhHDZ 家族的基因組分布機制,繪制GhHDZ 的染色體圖譜(圖2)。在At 亞基因組中分布有102 個基因,而Dt 亞基因組中分布有103 個基因,可見在At 亞基因組和Dt 亞基因組的GhHDZ 基因數(shù)目分布基本一致。分別對各染色體的基因進行分析,在Dt12 上分布了最多的GhHDZ基因(16 個),而在At12 上有14 個GhHDZ 基因;在At05 和At11 上都含 有13 個GhHDZ 基 因,以及Dt05 和Dt11 上分別含有11 和12 個GhHDZ 基因,以上是所有分布在10 個以上GhHDZ 基因的染色體。此外,在At01、Dt03、Dt10 染色體上各有9 個GhHDZ 基因;有4 個染色體上各分布有8 個GhHDZ 基因,分別是At03、At07、Dt01 和Dt08;而在At08、At10、Dt07 和Dt13 染色體上各有7 個GhHDZ 基 因;在At02、At13 和Dt06 上各有6 個GhHDZ 基因;有2 個染色體各有5 個GhHDZ 基因,分布是At06 和Dt02;在At04、At09、Dt04 上各分布3 個GhHDZ 基因,而只有Dt09 上有2 個GhHDZ基因(圖2)。上述結(jié)果表明,GhHDZ 基因在GhAt和GhDt 亞組上基本呈現(xiàn)均勻的分布模式。
圖2 GhHDZ 基因家族的染色體定位分布Fig.2 Chromosomal locations of GhHDZ gene family
通過分析GhHDZ 基因的共線性關(guān)系,并鑒定陸地棉中各GhHDZ 基因的旁系同源基因?qū)Γ▓D3)。共鑒定出377 對旁系同源基因,其中372 對為片段復(fù)制,占基因?qū)倲?shù)的98.7%。同時檢測到5 個GhHDZ 串聯(lián)重復(fù)基因?qū)Γ▓D3),分別是GhHDZ16和GhHDZ17、GhHDZ43 和GhHDZ44、GhHDZ123 和GhHDZ124、GhHDZ143 和GhHDZ144、GhHDZ165和GhHDZ166。綜上分析,發(fā)現(xiàn)片段復(fù)制對GhHDZ家族基因的進化占據(jù)主導(dǎo)地位。
圖3 GhHDZ 基因家族的共線性分析Fig.3 Syntenic relationship of GhHDZ gene family
此外,通過計算377 對GhHDZ 同源基因?qū)Φ腒a/Ks 值,并根據(jù)Ka/Ks 值推測了重復(fù)基因?qū)Φ倪x擇壓力。在所有377 對基因中,共有337 對有選擇壓力,其中,有318 個重復(fù)基因?qū)Φ腒a/Ks 值<0.5,占比94.4%;有16 個重復(fù)基因?qū)Φ腒a/Ks 值為0.5-1.0,占比4.7%,說明共有334 對同源基因?qū)樨撓蜻x擇,即功能同質(zhì)化(附表2)。此外,GhHDZ52/GhHDZ151 基因?qū)Φ腒a/Ks 值為2.0,遠大于1,而GhHDZ51/GhHDZ150、GhHDZ95/GhHDZ197 基因?qū)Φ腒a/Ks 值分別為1.45 和1.1,說明這些同源基因?qū)檎蜻x擇。上述結(jié)果說明,純化選擇對GhHDZ 的同源基因?qū)π纬芍陵P(guān)重要(附表2)。
為了解GhHDZ 基因家族不同成員之間的進化關(guān)系,分析GhHDZ 基因家族的保守蛋白質(zhì)基序(圖4)。結(jié)果表明,共發(fā)現(xiàn)10 個保守基序,命名為Motif 1-Motif 10,GhHDZ 家族基序種類從2-9 不等(圖4-b),同一亞組內(nèi)存在相似的基序分布。在HDZipIII 和HD-ZipIV 中基序種類的跨度范圍都比較大,從2-9 種不等,同時這兩個亞組也是含有基序數(shù)量最多的。在HD-ZipI 和HD-ZipII 中保守基序的分布比較均一,跨度從2-5 個不等。發(fā)現(xiàn)絕大多數(shù)GhHDZ 家族基因含有Motif 1、Motif 2 和Motif 8 基序,說明這3 個基序在GhHDZ 家族中高度保守。
圖4 GhHDZ 家族的系統(tǒng)發(fā)育、基因結(jié)構(gòu)和基序分析Fig.4 Phylogenetic,gene structure,and motif analyses of GhHDZ family
另外,通過分析GhHDZ 的基因結(jié)構(gòu),發(fā)現(xiàn)HDZipI 中GhHDZ 基因的外顯子數(shù)目為1-4 個;HDZipII 的外顯子數(shù)目多數(shù)是3 個,少數(shù)是4 個;HDZipIII 中外顯子數(shù)目跨度范圍最大,為2-18 個;HD-ZipIV 的外顯子從7-19 不等,平均值為11,是外顯子數(shù)目最多的一組(圖4-c)。其中,有13 個基因沒有內(nèi)含子,而包含16-19 個外顯子的GhHDZ 基因有22 個(圖4-c)。值得注意的是,同一亞組內(nèi)的基因具有相似的內(nèi)含子和外顯子排列,表明GhHDZ基因的外顯子-內(nèi)含子結(jié)構(gòu)與系統(tǒng)發(fā)育高度相關(guān)。
通過對GhHDZ 基因啟動子上游的順式元件進行分析,發(fā)現(xiàn)GhHDZ 基因的啟動子區(qū)包括結(jié)構(gòu)型和誘導(dǎo)型作用元件,可分為三大類共22 種功能元件(附表3,圖5)。其中,關(guān)于生長發(fā)育類順式元件包含了11 種功能元件,激素響應(yīng)類的順式元件只有3 種功能元件,非生物脅迫類的順式元件有8 種功能元件(圖5)。
在生長發(fā)育類別中,主要有11 個功能元件類型,包括41 種基序。其中,光反應(yīng)順式元件極其豐富,包括G-Box、ACE、MRE、GA-motif、TCT-motif等31 個基序類型,有204 個(占比99.5%)GhHDZ基因的啟動子區(qū)都含有該類元件。此外,有66 個(32.2%)GhHDZ 基因的啟動子區(qū)含有玉米醇溶蛋白代謝調(diào)節(jié)元件(O2-site),38 個(18.5%)含有分生組織表達元件(CAT-box),28 個(13.7%)含有晝夜節(jié)律調(diào)控元件(circadian),分別有23 個(11.2%)GhHDZ 基因的啟動子區(qū)含有MYBHv1 結(jié)合位點元件(CCAAT-box)和胚乳表達元件(GCN4),18 個(8.8%)含有種子特異調(diào)控元件(RY),各有11 個(4.9%)基因含有類黃酮生物合成基因調(diào)控元件(MBSI)和柵欄葉肉細胞分化元件(HD-ZipI),10 個(4.9%)含有細胞周期調(diào)節(jié)元件(MSA-like),另有6 個(2.9%)含有最大激發(fā)子介導(dǎo)的激活元件(富含AT 序列)(附表S3)。
GhHDZ 家族基因中與非生物脅迫響應(yīng)相關(guān)的一系列順式作用元件包含8 種功能元件,10 種元件基序。其中,有171 個(83.4%)GhHDZ 基因的啟動子區(qū)有厭氧誘導(dǎo)元件(ARE),有96 個(46.8%)有水楊酸應(yīng)答元件(TCA 和SARE),91 個(44.4%)有MeJA 應(yīng)答元件(CGTCA 和TGACG),77 個(37.6%)有干旱誘導(dǎo)功能(MBS),64 個(31.2%)有防御和脅迫應(yīng)答元件(富含TC 基序),51 個(24.9%)有低溫反應(yīng)元件(LTR 基序),缺氧特異誘導(dǎo)元件(GC)和創(chuàng)傷反應(yīng)元件(WUN)分別有18 個(8.8%)和12 個(5.9%)(附表3)。
與植物激素響應(yīng)相關(guān)的共鑒定出3 種功能元件,包含6 種基序。其中,有120 個(58.5%)GhHDZ基因的啟動子區(qū)含有脫落酸應(yīng)答元件(ABRE),91個(44.4%)含有赤霉素應(yīng)答元件(GARE、P-box和TATC-box),48 個(23.4%)含有生長素應(yīng)答元件(AuxRE 和TGA-box)(附表3)。
總之,GhHDZ 基因的大多數(shù)成員具有光反應(yīng)元件(99.5%)、厭氧誘導(dǎo)元件(83.4%)和脫落酸反應(yīng)元件(58.5%),水楊酸應(yīng)答元件(46.8%),表明這些相對豐富的元件在GhHDZ 基因家族中高度保守,在響應(yīng)生長發(fā)育、激素響應(yīng)和非生物脅迫反應(yīng)中發(fā)揮了關(guān)鍵作用。
利用從NCBI(登錄號:PRJNA248163)下載非生物脅迫的轉(zhuǎn)錄組數(shù)據(jù),研究GhHDZ 各基因的表達模式。根據(jù)進化樹劃分的4 個亞組GhHDZ 基因分別進行分析。
對陸地棉HD-ZipI 亞組基因冷脅迫處理的轉(zhuǎn)錄組分析,發(fā)現(xiàn)GhHDZ12、GhHDZ23、GhHDZ46、GhHDZ119、GhHDZ120、GhHDZ146 在1 h 或3 h 的表達量最高,在12 h 的表達量最低。在高溫脅迫下,GhHDZ12、GhHDZ46、GhHDZ66、GhHDZ92、GhHDZ119、GhHDZ146、GhHDZ169、GhHDZ193在1 h 的表達量最低,在3、6 和12 h 的表達量逐漸變大,在12 h 達到最高。在鹽脅迫下,GhHDZ46、GhHDZ66、GhHDZ119、GhHDZ146、GhHDZ169 在1 h 的表達量較高,在3 和6 h 降低,12 h 達到最高;GhHDZ12、GhHDZ92、GhHDZ177、GhHDZ193 在1 h 最低,12 h 達到最高。干旱脅迫下,GhHDZ12、GhHDZ66、GhHDZ119、GhHDZ169 在1 h 的表達量較高,在3 和6 h 表達量下降,24 h 表達量達到高峰;GhHDZ46、GhHDZ92、GhHDZ146、GhHDZ193 在1 h 的表達量最低,3、6 和12 h 逐漸升高,12 h 達到高峰(圖6)。
圖6 GhHDZ 家族基因非生物脅迫下的表達模式Fig.6 Expression patterns of GhHDZ family genes under abiotic stress
對陸地棉HD-ZipII 亞組基因在4 種非生物脅迫處理的轉(zhuǎn)錄組分析,發(fā)現(xiàn)有26 個GhHDZ 基因的FPKM 值幾乎為零,有6 個基因在各處理的表達量相對較高(圖6)。其中,GhHDZ81、GhHDZ84 在冷、熱、鹽、干旱脅迫中表現(xiàn)為正向響應(yīng)或者反向響應(yīng)。
對陸地棉HD-ZipIII 亞組基因在4 種非生物脅迫處理的轉(zhuǎn)錄組分析,發(fā)現(xiàn)有38 個GhHDZ 基因未檢測到轉(zhuǎn)錄本,其FPKM 值幾乎為零(圖6)。冷脅迫下,GhHDZ 基因表達量較低。熱脅迫下,GhHDZ15、GhHDZ116 隨著時間增長表達量越高,在12 h 達到高峰。GhHDZ15、GhHDZ116 在鹽脅迫和干旱脅迫下的表現(xiàn)較為一致,在1 h 的表達量高于3 h,12 h 達到高峰??梢姡珿hHDZ15、GhHDZ116 在非生物脅迫中表達量較高。
對陸地棉HD-ZipIV 亞組基因在4 種非生物脅迫處理的轉(zhuǎn)錄組分析,發(fā)現(xiàn)有11 個GhHDZ 基因的FPKM 值幾乎為零(圖6)。在冷脅迫下,Gh-HDZ50、GhHDZ76、GhHDZ176 在1 h 的表達量 最高,在3 和6 h 逐漸下降,在12 h 升高。在熱脅迫下,GhHDZ50、GhHDZ76、GhHDZ87、GhHDZ149、GhHDZ176、GhHDZ188 在1、3、6 和12 h 的表達量逐漸升高,12 h 達到峰值。在鹽脅迫下,GhHDZ50、GhHDZ76、GhHDZ87、GhHDZ149、GhHDZ176、GhHDZ188 在1 h 表達量較高,在3 h 表達量下降,在6 和12 h 逐漸升高,12 h 達到高峰。在干旱脅迫 下,GhHDZ50、GhHDZ76、GhHD188 在1、3、6和12 h 的表達量逐漸升高,12 h 表達量最高。GhHDZ50/76/176/188 在冷、熱、鹽和干旱脅迫的處理中表達量較高。
為了確定GhHDZ 在冷、熱、鹽和干旱脅迫下的表達水平,對陸地棉TM-1 幼苗進行非生物脅迫處理,并在0、3、6、12 和24 h 時間點取樣。根據(jù)前述轉(zhuǎn)錄組熱圖分析結(jié)果,從中篩選了10 個在非生物脅迫中高表達的基因進行RT-qPCR 鑒定(圖7)。
圖7 10 個GhHDZs 在不同時間對非生物脅迫的相對表達量Fig.7 Relative expressions of 10 GhHDZs to abiotic stress at different time
在冷脅迫下,GhHDZ15、GhHDZ50、GhHDZ146、GhHDZ176 的RT-qPCR 結(jié)果和轉(zhuǎn) 錄組表達數(shù)據(jù)較一致。從RT-qPCR 結(jié)果可知,GhHDZ15、GhHDZ188 在0 h 的表達量最高,之后逐步下降,說明2 個基因負向響應(yīng)冷脅迫;GhHDZ50、GhHDZ76、GhHDZ116、GhHDZ146、GhHDZ176 在3 h 的表達量最高,GhHDZ12、GhHDZ46、GhHDZ119 在24 h的表達量達到高峰,說明這些基因正向響應(yīng)冷害刺激。上述結(jié)果表明,大部分篩選的基因?qū)涿{迫處理較敏感,反應(yīng)迅速。
在熱脅迫下,GhHDZ12、GhHDZ119 的RTqPCR 分析和轉(zhuǎn)錄組表達模式結(jié)果較一致(圖7)。從RT-qPCR 結(jié)果可知,在0 和3 h 沒有GhHDZ 基因達到高峰,GhHDZ15、GhHDZ116 在6 h 的表達量較高,GhHDZ12、GhHDZ119 在12 h 的表達量較高,GhHDZ46、GhHDZ50、GhHDZ76、GhHDZ146、GhHDZ176、GhHDZ188 在24 h 的表達量最高,說明這些基因正向響應(yīng)熱脅迫。
在鹽脅迫下,GhHDZ12、GhHDZ46、GhHDZ116、GhHDZ119 的轉(zhuǎn)錄組表達模式和RT-qPCR分析結(jié)果較一致(圖7)。從RT-qPCR 結(jié)果可知,在0 和6 h 沒有GhHDZ 基因達到高 峰;GhHDZ46 基本不受鹽脅迫影響;GhHDZ12、GhHDZ15、GhHDZ116、GhHDZ119 在12 h 的表達量達到頂峰,但其中GhHDZ12 表達量提高不明顯,不到0 h 的1.5 倍;GhHDZ50、GhHDZ76、GhHDZ146、GhHDZ176、GhHDZ188 在24 h 的表達量最高,說明這些基因正向響應(yīng)鹽脅迫。
在干旱脅迫下,GhHDZ15、GhHDZ46、GhHDZ76、GhHDZ116、GhHDZ119、GhHDZ146、GhHDZ176、GhHDZ188 的轉(zhuǎn)錄組表達模式和RT-qPCR分析結(jié)果較一致(圖7)。從RT-qPCR 結(jié)果可知,在3 h 沒有GhHDZ 基因達到高峰;GhHDZ76 在0 h 的表達量較高,隨著時間的推移,基本呈下降趨勢,說明該基因負向響應(yīng)干旱脅迫;GhHDZ12 在6 h 的表達量較高;GhHDZ15、GhHDZ46、GhHDZ116、GhHDZ119、GhHDZ146、GhHDZ176、GhHDZ188在12 h 的表達量達到頂峰,其中GhHDZ46、Gh-HDZ146 表達量增加不明顯,不到0 h 的1.5 倍;GhHDZ50 在24 h 的表達量最高。上述結(jié)果說明,除GhHDZ46、GhHDZ76、GhHDZ146 外,其余基因正向響應(yīng)干旱脅迫。
蛋白質(zhì)的亞細胞定位與其功能密切相關(guān)。根據(jù)轉(zhuǎn)錄組和RT-qPCR 的結(jié)果表明,GhHDZ146 在低溫、高溫、鹽脅迫和干旱脅迫處理下,在0、3、6、12 和24 h 的表達量均有明顯不同,因此,選擇GhHDZ146 進行亞細胞定位分析。結(jié)果(圖8)表明,GhLTPG146-GFP 融合表達蛋白定位于細胞核中,表明GhLTPG146 可能作為轉(zhuǎn)錄因子在棉花的纖維發(fā)育中發(fā)揮作用。
圖8 GhHDZ146-GFP 融合蛋白在煙草葉片中的亞細胞定位(Bar=50 μm)Fig.8 Subcellular localizations of GhHDZ146 proteins in tobacco leaves (Bar=50 μm)
選擇3 個GhHDZ146 過表達擬南芥T3代株系進行鹽脅迫試驗。結(jié)果(圖9)表明,在200 mmol/L NaCl 脅迫處理下,OE5 和OE7 株系的主根長度分別為2.91 和2.82 cm,顯著長于WT 的主根長度(2.36 cm);另外,OE2 株系的主根長度為2.98 cm,極顯著長于WT 的根長。此外,進一步的根毛長度測量結(jié)果表明,OE2、OE5 和OE7 株系的根毛長度分別為91.3、94.5 和98.2 μm,均極顯著長于WT 的根毛長度(68.3 μm)。上述結(jié)果表明,GhHDZ146 過表達擬南芥的耐鹽性顯著增強,認為GhHDZ146 對棉花的耐鹽性有重要作用。
圖9 GhHDZ146 過表達擬南芥的鹽脅迫鑒定Fig.9 Salt stress identification of GhHDZ146 overexpression in Arabidopsis thaliana
進一步將GhHDZ146 與擬南芥、水稻等物種中已知功能的HD-Zip 家族基因進行了聚類分析,結(jié)果(圖10)表明,GhHDZ146 與擬南芥AtHB1、AtHB6、AtHB13 的親緣關(guān)系較近。
圖10 GhHDZ146 與其他物種已知功能基因的聚類Fig.10 Clustering of GhHDZ146 and known functional genes in other species
HD-Zip 家族是植物特有的轉(zhuǎn)錄因子家族之一,許多植物中HD-Zip 基因家族的成員被依次鑒定,例如擬南芥、水稻[10,58]、葡萄[59]、大豆[60-61]、木薯[62]、小麥[12]、茶樹[63]和馬鈴薯[14]等。在本研究中,從陸地棉TM-1 全基因組范圍內(nèi)中共鑒定出205 個成員。將陸地棉中HD-Zip 成員的數(shù)量與已報道的擬南芥[10](48 個)、水稻[58](49 個)、葡萄[59](33 個)、大豆[60](88 個)、木薯[62](57 個)、小麥(46 個)[12]、茶樹[63](33 個)、馬鈴薯[14](43 個)以及芝麻[64](45 個)等植物相比,其家族成員數(shù)最多,而且不同物種之間其家族成員數(shù)量與其基因組大小并無一定的相關(guān)性。此外研究表明,基因家族的擴展主要依賴于串聯(lián)、片段和全基因組等復(fù)制形式[65]。結(jié)合上述多個物種HD-Zip 基因家族成員分析,推測出現(xiàn)這種現(xiàn)象的原因可能是植物HD-Zip 家族基因在進化過程中不同物種間發(fā)生的片段復(fù)制和串聯(lián)復(fù)制頻率不同所致。
大量報道表明,植物HD-Zip 家族基因參與了對各種非生物脅迫的響應(yīng),如小麥[12]、馬鈴薯[14]、茶樹[63]和芝麻[64]等物種中的HD-Zip 成員。然而,在陸地棉中還沒有對冷、熱、鹽分或干旱做出反應(yīng)的HD-Zip 基因的報道,本研究首次對陸地棉HDZip 家族基因在冷、熱、鹽或干旱脅迫條件下的表達模式進行了系統(tǒng)分析。轉(zhuǎn)錄組數(shù)據(jù)分析表明約45%GhHDZ 家族成員的表達水平受到冷、熱、鹽分或干旱脅迫的影響,對其中表達量較高的10 個基因進行了4 種非生物脅迫處理下的RT-qPCR 鑒定,結(jié)果也進一步證實部分陸地棉HD-Zip 家族基因參與了非生物脅迫響應(yīng),且各基因響應(yīng)非生物脅迫的模式不同,本研究結(jié)果與其他植物中的HD-Zip 基因家族研究結(jié)果相似。
基因的進化樹分析有利于給定植物物種中基因功能的預(yù)測。作為一個植物特異的轉(zhuǎn)錄因子家族,HD-Zip 基因在多種植物種類中已進行了廣泛的研究。本研究中,GhHDZ146 與擬南芥AtHB1、AtHB6、AtHB13 的親緣關(guān)系較近。據(jù)報道,在擬南芥當(dāng)中AtHB1 在鹽脅迫和低溫脅迫下表達量下降[19],而本研究中轉(zhuǎn)錄組分析結(jié)合熒光定量驗證均表明,GhHDZ146 正向響應(yīng)熱、鹽和干旱脅迫,但在低溫脅迫下與AtHB1 處理結(jié)果相似,整體上呈下降趨勢,說明不同物種間同源基因的功能可能存在一些差異。另外,擬南芥AtHB6 在發(fā)育中的葉子、根和心皮中表達,但在遭受水分虧缺、滲透脅迫或用脫落酸(ABA)進行外源處理的幼苗中顯著上調(diào),表明該基因與逆境脅迫相關(guān)[66]。AtHB13 通過與JUNGBRUNNEN1(JUB1)啟動子結(jié)合,參與抵抗干旱、高鹽脅迫響應(yīng)過程[67]。上述研究表明與擬南芥AtHB1、AtHB6、AtHB13 近緣的GhHDZ146 可能參與了非生物脅迫響應(yīng)。本研究進一步通過分子遺傳試驗證實了GhHDZ146 在擬南芥中異源過表達可顯著增強對鹽脅迫的耐受性,且該基因定位于細胞核中,其可能作為轉(zhuǎn)錄因子發(fā)揮調(diào)控作用。然而,后續(xù)還需進一步通過棉花VIGS(病毒誘導(dǎo)的基因沉默)和棉花遺傳轉(zhuǎn)化等試驗來進一步驗證相關(guān)功能。本研究為陸地棉HD-Zip 基因參與非生物脅迫響應(yīng)提供了可靠的證據(jù),并為相關(guān)基因功能研究奠定了扎實的基礎(chǔ)
在全基因組范圍內(nèi)從陸地棉中系統(tǒng)鑒定了205個HD-Zip 家族成員。片段復(fù)制對GhHDZ 家族的擴展起主要作用,GhHDZ 家族基因具有潛在的生物學(xué)功能多樣性。不同基因?qū)Ω鞣N脅迫的響應(yīng)不一,且表達模式存在差異。GhHDZ146 定位于細胞核,異源過表達該基因可顯著增強轉(zhuǎn)基因擬南芥的耐鹽性。
文章所有附表數(shù)據(jù)請到本刊官網(wǎng)下載(http://biotech.aiijournal.com/CN/1002-5464/home.shtml)。