晁毛妮,董潔,胡根海,黃玲,張金寶,付遠(yuǎn)志,王清連*
(1. 河南科技學(xué)院/ 現(xiàn)代生物育種河南省協(xié)同創(chuàng)新中心/ 河南省棉麥分子生態(tài)與種質(zhì)創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,河南新鄉(xiāng) 453003;2. 山東農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,山東 泰安 271018)
淀粉是植物中碳水化合物的主要貯藏形式,廣泛存在于水稻、小麥等糧食作物的籽粒,是人類飲食中重要的碳水化合物和能量來(lái)源。 在植物中,淀粉的生物合成過(guò)程較為復(fù)雜,涉及腺苷二磷酸葡萄糖焦磷酸化酶(adenosine diphosphateglucose pyrophosphorylase,AGPase)、淀粉合成酶(starch synthase,SS)、淀粉分支酶(starch branching enzyme,SBE)和淀粉脫分支酶(starch de-branching enzyme,DBE)等多種酶[1-3]。 其中,AGPase 是淀粉生物合成途徑的限速酶,在調(diào)控植物生長(zhǎng)發(fā)育[4]、籽粒淀粉積累[5]以及植株對(duì)干旱[5]、鹽[6]和冷害[7]等環(huán)境脅迫的適應(yīng)性方面發(fā)揮著重要作用。
AGPase 主要負(fù)責(zé)淀粉生物合成途徑的第一個(gè)步驟,即催化葡萄糖-1- 磷酸(glucose-1-phosphate, G-1-P) 和ATP 生 成ADP- 葡 萄 糖(ADP-glucose,ADPG), 為淀粉的生物合成提供葡萄糖基供體[8]。 由于ADPG 不僅是淀粉生物合成過(guò)程的起始底物,也是形成直鏈淀粉和支鏈淀粉的骨架[9],其濃度直接影響淀粉生物合成的速率和效率, 因此AGPase 也被認(rèn)為是淀粉生物合成的限速酶。 研究發(fā)現(xiàn),AGPase 蛋白是由2 個(gè)大亞基(AGPL)和2 個(gè)小亞基(AGPS)組成的異源四聚體[10],其中小亞基具有催化和調(diào)控功能,大亞基主要負(fù)責(zé)調(diào)控功能[11]。近年來(lái),隨著生物信息學(xué)技術(shù)的快速發(fā)展,許多物種的基因組測(cè)序工作已經(jīng)完成, 并在多種植物中開(kāi)展了AGPase基因家族的系統(tǒng)鑒定工作, 如擬南芥(Arobidopsis thaliana)[12]、水稻(Oryza sativa)[13-14]、玉米[15-16]、木薯[17]、香 蕉[18]、蓮 子[19]和 芋[20]等。 盡 管 不 同 物 種AGPase基因家族成員數(shù)量存在差異, 但是它們的蛋白序列卻相對(duì)保守, 均含有植物AGPase 家族典型的NTP 轉(zhuǎn)移結(jié)構(gòu)域[1,16]。 研究發(fā)現(xiàn),植物AGPase基因的表達(dá)水平與組織器官中AGPase活性和淀粉積累密切相關(guān)[5,21]。 過(guò)表達(dá)AGPase基因還可增加粒重[22-23]。 此外,AGPase基因還參與調(diào)控植物對(duì)多種逆境脅迫的響應(yīng)。 例如,在木薯中,MeAGPL3基因的表達(dá)量在干旱脅迫條件下顯著增加[17];在香蕉中,63%的MaAGPase基因在低溫、 干旱和鹽脅迫條件下表達(dá)量發(fā)生變化,其中MaAGPS1受低溫、干旱和鹽等非生物脅迫誘導(dǎo)強(qiáng)烈上調(diào)表達(dá)[18];在低磷和低氮處理下,水稻AGPL1和AGPS1的表達(dá)量顯著升高[24]。因此,研究植物AGPase基因的表達(dá)調(diào)控與功能可為未來(lái)提高農(nóng)作物產(chǎn)量和抗逆性提供新思路。
棉花是我國(guó)重要的經(jīng)濟(jì)作物,纖維發(fā)育決定了棉花的產(chǎn)量和品質(zhì)。 已有研究表明,淀粉合成和蔗糖代謝等相關(guān)基因參與了棉纖維的發(fā)育過(guò)程[25-26]。 AGPase 是淀粉生物合成的限速酶,但其在棉花纖維發(fā)育中的功能尚不清楚,棉花中關(guān)于該基因家族的系統(tǒng)研究工作也尚未開(kāi)展。 本研究利用已公布的陸地棉(Gossypium hirsutum)標(biāo)準(zhǔn)系TM-1 的基因組數(shù)據(jù), 通過(guò)生物信息學(xué)方法對(duì)陸地棉AGPase家族基因(GhAGP)進(jìn)行全基因組鑒定,并對(duì)其基本特性、系統(tǒng)進(jìn)化關(guān)系、啟動(dòng)子區(qū)順式作用元件以及表達(dá)模式進(jìn)行了系統(tǒng)分析。相關(guān)結(jié)果可為今后深入研究棉花AGPase家族基因的功能奠定基礎(chǔ)。
從CottonGen 網(wǎng) 站(https://www.cottongen.org/)下載陸地棉基因組數(shù)據(jù)(TM-1_V2.1)[27]并建立本地BLAST 數(shù)據(jù)庫(kù)。 從TAIR 網(wǎng)站(http://www.arabidopsis.org) 調(diào)取擬南芥AGPase家族成員AT5G48300(AtAPS1)、AT1G05610(AtAPS2)、AT5G19220(AtAPL1)、AT1G27680(AtAPL2)、AT4G39210(AtAPL3)、AT2G21590(AtAPL4)的蛋白序列。 以擬南芥AGPase家族成員的蛋白序列作為查詢序列, 運(yùn)行本地BLASTp 檢索程序,設(shè)置篩選閾值為1×e-10, 初步篩選獲得陸地棉AGPase基因家族候選基因。 進(jìn)一步通過(guò)在線工具NCBICDD-Search(https://www.ncbi.nlm.nih.gov/cdd/)和Search Pfam(http://pfam.xfam.org/search)對(duì)這些候選基因進(jìn)行結(jié)構(gòu)域的驗(yàn)證,從而確定陸地棉AGPase基因家族成員。
利用在線網(wǎng)站ExPASy[28](https://www.expasy.org/)預(yù)測(cè)分析GhAGP 蛋白的氨基酸殘基數(shù)量、 分子質(zhì)量和等電點(diǎn)。 通過(guò)在線工具WoLF PSORT[29](https://www.genscript.com/wolf-psort.html?src=leftbar) 預(yù)測(cè)GhAGP 蛋白的亞細(xì)胞定位。 利用SMART[30]蛋白質(zhì)結(jié)構(gòu)域分析數(shù)據(jù)庫(kù)(http://smart.embl-heidelberg.de/)預(yù)測(cè)GhAGP 蛋白的功能結(jié)構(gòu)域及其位置。 采用BioEdit 軟件[31]分析GhAGP 蛋白序列間的一致性。
利用Clustal X 軟件對(duì)擬南芥、水稻[32]和陸地棉AGPase基因家族成員的蛋白序列進(jìn)行多序列比對(duì);利用MEGA 5.02 軟件中的鄰接法(neighborjoining,NJ)構(gòu)建系統(tǒng)進(jìn)化樹(shù)[33],主要參數(shù)設(shè)置如下:校驗(yàn)參數(shù)Bootstrap 值為1 000,距離模型為p-distance, 空位缺失數(shù)據(jù)處理為成對(duì)刪除(pairwise deletion)。
從已下載的陸地棉基因組數(shù)據(jù)中獲取GhAGP的編碼序列(coding sequence,CDS)和基因序列, 然后利用Gene Structure Display Server(GSDS)[34]在線工具(http://gsds.gao-lab.org/)繪制GhAGP的外顯子-內(nèi)含子結(jié)構(gòu)圖。利用MEME[35]在線網(wǎng)站(https://meme-suite.org/meme/tools/meme)分析GhAGP 蛋白的保守基序(motif),主要參數(shù)設(shè)置如下:基序最大發(fā)現(xiàn)數(shù)目為15,基序最長(zhǎng)長(zhǎng)度為50 個(gè)核苷酸(nucleotide,nt),最小長(zhǎng)度為6 nt。利用InterProScan[36]數(shù)據(jù)庫(kù)(http://www.ebi.ac.uk/interpro/)對(duì)預(yù)測(cè)的保守基序進(jìn)行功能結(jié)構(gòu)域注釋。
從CottonFGD 網(wǎng) 站[37](https://cottonfgd.org/)獲取GhAGP基因起始密碼子上游2 000 bp 序列,作為啟動(dòng)子分析序列。 利用PlantCARE 在線工具[38](http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) 對(duì)GhAGP基因啟動(dòng)子區(qū)的順式作用元件進(jìn)行預(yù)測(cè)分析。
從NCBI 網(wǎng)站SRA 數(shù)據(jù)庫(kù)(SRA: PRJNA-248163)獲取[27]陸地棉GhAGP在不同組織(根、莖、葉、花瓣和不同發(fā)育時(shí)期的胚珠、纖維)和低溫(4 ℃)、高溫(37 ℃)、鹽(0.4 mol·L-1NaCl)、干旱(200 g·L-1PEG 6000)4 種非生物脅迫條件下的轉(zhuǎn)錄組數(shù)據(jù)。利用SolexQA 軟件[39]對(duì)數(shù)據(jù)進(jìn)行質(zhì)量控制,Tophat 2 軟件[40]進(jìn)行有參比對(duì),Cufflinks[40]軟件計(jì)算表達(dá)量FPKM(fragments per kilobase of exon model per million mapped reads,每千個(gè)堿基的轉(zhuǎn)錄每百萬(wàn)映射讀取的片段)。 對(duì)獲取的組織表達(dá)數(shù)據(jù)和非生物脅迫表達(dá)數(shù)據(jù)分別進(jìn)行l(wèi)og2(FPKM+1)和log2[(Stress_FPKM+1)/(CK_FPKM+1)] 均一化處理后, 其中Stress_FPKM+1和Stress_FPKM+1 分別表示脅迫和對(duì)照處理下基因的FPKM,利用MeV 軟件[41]繪制基因表達(dá)的熱圖。
將陸地棉品種百棉1 號(hào)的種子播種于營(yíng)養(yǎng)土中,在生長(zhǎng)室內(nèi)(光照強(qiáng)度為450 μmol·m-2·s-1,光照/黑暗時(shí)間為14 h/10 h, 晝/夜溫度為30~33 ℃/23~26 ℃)培養(yǎng)至1 片真葉期,將其轉(zhuǎn)移至1/2 Hoagland's 營(yíng)養(yǎng)液中進(jìn)行培養(yǎng)。 生長(zhǎng)7 d 后,選取長(zhǎng)勢(shì)一致的幼苗分別在4 ℃、38 ℃、20%PEG 6000 和0.2 mol·L-1NaCl 條件下進(jìn)行處理;其中4 ℃和38 ℃處理均在光照培養(yǎng)箱內(nèi)進(jìn)行,培養(yǎng)箱條件為16 h 光照/8 h 黑暗、濕度70%。 在脅迫處理后的0 h、6 h、12 h、24 h、36 h 和48 h 取棉花幼苗葉片,然后迅速置于液氮中速凍,并保存于-80 ℃冰箱。
按照植物多糖多酚RNA 提取試劑盒(TIANGEN,DP441)說(shuō)明書(shū)中的操作方法對(duì)棉花不同組織進(jìn)行總RNA 的提取。 取2 μg 左右的RNA,利用反轉(zhuǎn)錄試劑盒[貨號(hào):6210A,寶日醫(yī)生物技術(shù)(北京)有限公司]進(jìn)行反轉(zhuǎn)錄,合成cDNA。 以陸地棉Actin作為內(nèi)參基因, 利用SYBR Green 染料法進(jìn)行實(shí)時(shí)熒光定量聚合酶鏈?zhǔn)椒磻?yīng)(real-time quantitative polymerase chain reaction,qRT-PCR)。 qRT-PCR 反應(yīng)體系包含10 μL 2×SYBR Premix Ex Taq[貨號(hào):RR820L,寶日醫(yī)生物技術(shù)(北京)有限公司],0.8 μL 10 mmol·L-1正向引 物,0.8 μL 10 mmol·L-1反 向 引 物,1.0 μL cDNA,7.4 μL ddH2O。 擴(kuò)增程序?yàn)?5 ℃30 s,循環(huán)1 次;95℃5 s,60℃20 s,循環(huán)40 次。每個(gè)樣品設(shè)置3 次重復(fù), 采用2-ΔΔCt 法計(jì)算基因的相對(duì)表達(dá)量。 所用的引物序列見(jiàn)表1。
表1 本研究所用引物序列Table 1 Primer sequences used in the study
在陸地棉基因組中共鑒定到20 個(gè)AGPase基因(GhAGP),包括12 個(gè)AGPase 大亞基基因(GhAGPL) 和8 個(gè)AGPase 小亞基基因(GhAGPS)。根據(jù)它們?cè)谌旧w上的位置信息,分別將其命名為GhAGPL1~GhAGPL12和GhAGPS1~GhAGPS8。 經(jīng)預(yù)測(cè),GhAGP基因長(zhǎng)度為2 668~3 803 bp,CDS 長(zhǎng)度為1 476~1 740 bp;GhAGP蛋白包含491~579 個(gè)氨基酸殘基, 分子質(zhì)量為54.65~64.60 ku,理論等電點(diǎn)為6.06~9.13,其中80%以上的GhAGP 蛋白的等電點(diǎn)大于7,表明陸地棉AGPase 蛋白主要呈弱堿性。 20 個(gè)GhAGP基因不均勻地分布在陸地棉的16 條染色體上(包括A 亞基因組的8 條染色體和D亞基因組的8 條染色體),GhAGP在不同染色體上的分布數(shù)量存在明顯差異, 其中A07 和D07 染色體均包含3 個(gè)GhAGP,其他14 條染色體均含有1 個(gè)GhAGP。亞細(xì)胞定位預(yù)測(cè)結(jié)果表明,AGPase 大亞基定位于葉綠體和細(xì)胞質(zhì), 而AGPase 小亞基均定位于葉綠體(表2)。
功能結(jié)構(gòu)域預(yù)測(cè)分析表明,GhAGP 蛋白均含有植物AGPase 家族特有的NTP_transferase保守結(jié)構(gòu)域(表2)。蛋白序列一致性分析表明,陸地棉AGPase 大亞基的氨基酸序列一致性為54.10%~99.20%,其中GhAGPL4 和GhAGPL10的序列一致性最高,GhAGPL3 和GhAGPL5 的序列一致性最低。 AGPase 小亞基AGPS 間的氨基酸序列一致性為42.60%~99.20%, 其中GhAGPS2 和GhAGPS6 的序列一致性最高,GhAGPS1和GhAGPS2 的序列一致性最低(附表1)。
為進(jìn)一步研究陸地棉AGPase 家族蛋白的系統(tǒng)進(jìn)化關(guān)系,選取陸地棉(20 個(gè))、擬南芥(6 個(gè))和水稻(7 個(gè))3 個(gè)物種共33 個(gè)AGPase 蛋白序列構(gòu)建系統(tǒng)進(jìn)化樹(shù)。 結(jié)果表明,33 個(gè)AGPase 蛋白在進(jìn)化上可明顯地聚為2 類: 一類是大亞基群組, 包括12 個(gè)陸地棉、4 個(gè)擬南芥、4 個(gè)水稻共20 個(gè)AGPase 蛋白; 另一類是小亞基群組,包括8 個(gè) 陸 地 棉、2 個(gè) 擬 南 芥、3 個(gè) 水 稻 共13 個(gè)AGPase 小亞基蛋白(圖1)。
在陸地棉AGPase 小亞基蛋白中,GhAGPS1、GhAGPS5 與擬南芥AtAPS2 親緣關(guān)系較近,聚在一 個(gè) 分 支;GhAGPS6、GhAGPS2、GhAGPS3、GhAGPS7、GhAGPS4、GhAGPS8 與AtAPS1 親緣關(guān)系較近,聚在另外一個(gè)分支。 在陸地棉大亞基蛋白中,GhAGPL4、GhAGPL10 與水稻OsAGPL4聚在一個(gè)分支;GhAGPL5、GhAGPL11 與擬南芥AtAPL1、 水 稻 OsAGPL1 聚 在 一 個(gè) 分 支;GhAGPL2、GhAGPL8、GhAGPL3、GhAGPL9 與 擬南 芥 AtAPL2 聚 在 一 個(gè) 分 支;GhAGPL1、GhAGPL7、GhAGPL6、GhAGPL12 與 擬 南 芥AtAPL3、AtAPL4 聚在一個(gè)分支; 表明它們之間親緣關(guān)系較近,可能具有相似的功能(圖1)。
圖1 陸地棉、擬南芥與水稻中AGPase 蛋白的系統(tǒng)進(jìn)化分析Fig. 1 Phylogenetic analysis of AGPase proteins in G. hirsutum, A. thaliana%and O. sativa%
表 陸地棉 基因的基本信息2AGPaseTable 2The basic information of AGPase genes in G. hirsutum
經(jīng)預(yù)測(cè)分析,陸地棉GhAGP 蛋白共包含15個(gè)保守基序(圖2A)。 基序1、基序3 和基序6 這3 個(gè)保守基序被注釋為NTP_transferase 結(jié)構(gòu)域,存在于所有的GhAGP 蛋白中?;? 和基序5 為GhAGPL 蛋白所特有的保守基序, 所有GhAGPL均 含 有 基 序11, 除GhAGPL4、GhAGPL10、GhAGPL11 和GhAGPL5 外的GhAGPL 均含有基序15?;?2 和基序13 是GhAGPS 特有的保守基序, 其中所有的GhAGPS 蛋白均含有基序13, 除GhAGPS1 和GhAGPS5 外的GhAGPS蛋白均含有基序12。 另外, 位于同一分支的GhAGP 蛋白具有相似的基序數(shù)目、類型和分布,暗示著它們可能具有相似的功能。
基因結(jié)構(gòu)分析發(fā)現(xiàn),GhAGP基因的外顯子數(shù)量均較多。GhAGPL基因外顯子數(shù)量為12~15 , 其 中GhAGPL2、GhAGPL8、GhAGPL12、GhAGPL6、GhAGPL1、GhAGPL7、GhAGPL5和GhAGPL11均 含 有14 個(gè) 外 顯 子,GhAGPL4和GhAGPL10均 含 有15 個(gè) 外 顯 子,GhAGPL3和GhAGPL9分別含有12 和13 個(gè)外顯子。GhAGPS基因均含有9 個(gè)外顯子。 另外,在進(jìn)化上親緣關(guān)系較近的GhAGP具有相似的外顯子-內(nèi)含子結(jié)構(gòu)(圖2B)。
圖2 陸地棉AGPase 基因家族成員的保守基序(A)和基因結(jié)構(gòu)(B)分析Fig. 2 Conserved motifs (A) and gene structure (B) analyses of AGPase genes family members in G. hirsutum
對(duì)陸地棉GhAGP基因啟動(dòng)子區(qū)的順式作用元件進(jìn)行預(yù)測(cè)分析,結(jié)果表明:6 個(gè)GhAGP含有低溫響應(yīng)元件LTR,7 個(gè)GhAGP含有防御和脅迫響應(yīng)元件TC-rich repeats,5 個(gè)GhAGP含有干旱誘導(dǎo)響應(yīng)元件MBS,6 個(gè)GhAGP含有水楊酸響應(yīng)元件TCA-element,12 個(gè)GhAGP含有茉莉酸 響 應(yīng) 元 件TGACG-motif/CGTCA-motif,14 個(gè)GhAGP含有脫落酸響應(yīng)元件ABRE,1 個(gè)GhAGP含有赤霉素響應(yīng)元件GARE-motif,4 個(gè)GhAGP含有赤霉素響應(yīng)元件P-box,1 個(gè)GhAGP含有生長(zhǎng)素響應(yīng)元件TATC-box,1 個(gè)GhAGP含有生長(zhǎng)素響應(yīng)元件AuxRR-core,4 個(gè)GhAGP含有生長(zhǎng)素響應(yīng)元件TGA-element (圖3 和附圖1)。 表明陸地棉AGPase基因家族成員可能參與植物對(duì)外界環(huán)境脅迫和植物激素的響應(yīng)。
圖3 陸地棉GhAGP 基因啟動(dòng)子區(qū)的順式作用元件分析Fig. 3 Cis-acting element analysis of the promoter region of%GhAGP genes in G. hirsutum
利用轉(zhuǎn)錄組數(shù)據(jù)對(duì)GhAGP基因在棉花不同組織中的表達(dá)情況進(jìn)行分析(圖4),發(fā)現(xiàn)GhAGP的表達(dá)具有組織特異性。 根據(jù)表達(dá)模式可將其聚為兩大類:I 類和II 類,其中I 類的基因主要是一些在各組織中均不表達(dá)的基因和一些僅在個(gè)別組織表達(dá)的基因;II 類主要是一些在多個(gè)組織中表達(dá)量均較高的基因和無(wú)組織特異性表達(dá)的基因。其中,GhAGPL5和GhAGPL11在葉片中特異性高表達(dá),在其他組織中表達(dá)量很低或者基本不表達(dá),表明它們?cè)诿藁ā霸础逼鞴佟~片的淀粉積累過(guò)程中可能起著重要作用。 多個(gè)GhAGP基因GhAGPL4、GhAGPL10、GhAGPL3、GhAGPS1、GhAGPS5、GhAGPS2、GhAGPL9和GhAGPS6在棉花根、莖、葉片、花瓣、胚珠和纖維組織中的表達(dá)量較低或者基本不表達(dá)。GhAGPL1、GhAGPL7和GhAGPS8在開(kāi)花后10 d (10 days post anthesis,10 DPA)的胚珠中表達(dá)量相對(duì)較高,表明這3 個(gè)基因在棉花種子淀粉合成與積累過(guò)程中可能發(fā)揮重要作用。
圖4 陸地棉GhAGP 基因的表達(dá)特性分析Fig. 4 Expression pattern analysis of GhAGP genes in G. hirsutum
分析不同脅迫條件下的陸地棉轉(zhuǎn)錄組數(shù)據(jù),發(fā)現(xiàn)GhAGP基因在低溫、高溫、鹽和干旱脅迫條件下的表達(dá)模式存在差異(圖5),其中GhAGPL1和GhAGPL7對(duì)低溫、高溫、鹽和干旱脅迫均表現(xiàn)出明顯地響應(yīng)。 在低溫脅迫條件下,GhAGPL1和GhAGPL7的表達(dá)量先下降,處理后24 h,其表達(dá)量又明顯升高。 在高溫脅迫條件下,GhAGP基因的表達(dá)呈現(xiàn)出不同的響應(yīng)模式, 其中GhAGPL7在高溫處理后1 h 表達(dá)量迅速上升, 隨著處理時(shí)間的延長(zhǎng)表達(dá)量下降; 其他對(duì)高溫脅迫響應(yīng)的GhAGP基因GhAGPL11、GhAGPL5、GhAGPS4、GhAGPS3、GhAGPS7和GhAGPS8在 高 溫 脅 迫后1 h 表達(dá)量迅速下降, 隨著處理時(shí)間的延長(zhǎng)表達(dá)量又有所升高。 鹽脅迫下,GhAGPL1和GhAGPL7先下調(diào)表達(dá)(處理后1 h)然后上調(diào)表達(dá)(處理后3 h 和6 h),處理后12 h 再次下調(diào)表達(dá),然后在處理后24 h 又上調(diào)表達(dá);而GhAGPL2在處理后1 h 先下調(diào)表達(dá), 然后隨著時(shí)間延長(zhǎng),表達(dá)量上升。 在干旱脅迫條件下,GhAGPL1和GhAGPL7的表達(dá)量呈現(xiàn)出先上升后下降的趨勢(shì),在處理前期(1~6 h)上調(diào)表達(dá),在處理后12 h下調(diào)表達(dá)。
圖5 陸地棉GhAGP 基因在不同脅迫處理下的表達(dá)模式分析Fig. 5 Expression pattern analysis of GhAGP genes under different stress treatments in G. hirsutum
實(shí)時(shí)定量表達(dá)分析結(jié)果(圖6)表明GhAGPL1和GhAGPL7基因響應(yīng)低溫、高溫、鹽和干旱脅迫誘導(dǎo)表達(dá)。 在低溫脅迫條件下, 脅迫處理后6 h時(shí),GhAGPL1和GhAGPL7基因的表達(dá)量有所上升,隨著處理時(shí)間的延長(zhǎng),其表達(dá)量顯著降低。 高溫脅迫處理6 h 后,GhAGPL1和GhAGPL7基因的表達(dá)量顯著升高至最高值, 隨著時(shí)間延長(zhǎng),表達(dá)量顯著降低。 在鹽脅迫處理?xiàng)l件下,GhAGPL1的表達(dá)量在6 h 和12 h 顯著降低,在脅迫處理后24 h 顯著上調(diào)至最高,隨后又開(kāi)始下降,并在脅迫處理48 h 表達(dá)量又出現(xiàn)顯著上調(diào);GhAGPL7基因在鹽脅迫處理6 h 和12 h 表達(dá)量顯著下降,在脅迫處理48 h 時(shí),表達(dá)量顯著上調(diào)至最高。 在干旱脅迫處理6 h 和12 h,GhAGPL1 和GhAGPL7 基因的表達(dá)量顯著降低,24 h 和48 h 表達(dá)量均顯著升高,并在脅迫處理后48 h 達(dá)到最高。 上述結(jié)果表明,GhAGPL1 和GhAGPL7 基因可對(duì)多種非生物脅迫產(chǎn)生應(yīng)答,它們可能參與了棉花對(duì)逆境脅迫的響應(yīng)過(guò)程。
圖6 不同非生物脅迫處理下GhAGPL1 和GhAGPL7 基因的表達(dá)模式分析Fig. 6 Expression pattern analysis of GhAGPL1 and GhAGPL7 under different abiotic stress
AGPase 是淀粉生物合成的限速酶, 由于其在淀粉生物合成中起關(guān)鍵作用[42],已成為研究者們關(guān)注的熱點(diǎn)。目前,關(guān)于棉花AGPase 基因的克隆與功能研究鮮有報(bào)道。 本研究基于最新公布的陸地棉TM-1 基因組數(shù)據(jù), 對(duì)陸地棉AGPase 基因家族進(jìn)行全基因組鑒定, 共鑒定出20 個(gè)GhAGP 基因,明顯多于擬南芥(6 個(gè))[12]和水稻(7個(gè))[13-14]等物種。陸地棉是異源四倍體,大約在100萬(wàn)~160 萬(wàn)年前由亞洲棉、 非洲棉共同的祖先與雷蒙德氏棉雜交、染色體加倍,隨后經(jīng)過(guò)馴化改良形成現(xiàn)在的異源四倍體[43]。 多倍體化會(huì)增加基因的拷貝數(shù), 因此陸地棉基因組中數(shù)量較多的GhAGP 基因可能與其進(jìn)化過(guò)程中經(jīng)歷的基因組加倍事件有關(guān)。
系統(tǒng)進(jìn)化分析表明, 陸地棉AGPase 蛋白可分為大亞基蛋白(AGPL)和小亞基蛋白(AGPS)2個(gè)亞群,這與木薯、香蕉中AGPase 蛋白的系統(tǒng)進(jìn)化分析結(jié)果相一致[17-18]。 目前普遍認(rèn)為,植物AGPase 可能主要定位于葉綠體和造粉體[32,42,44],負(fù)責(zé)葉片和貯藏器官(塊莖)的淀粉合成。 但是,越來(lái)越多的研究發(fā)現(xiàn),AGPase 不僅存在于質(zhì)體中,也存在于細(xì)胞質(zhì)中[45-46]。 本研究預(yù)測(cè)陸地棉AGPL 蛋白主要定位于葉綠體和細(xì)胞質(zhì)中, 表明陸地棉AGPase 蛋白可能與水稻中的AGPase 蛋白[36]一樣,也存在胞質(zhì)型和質(zhì)體型兩種類型,但是仍需進(jìn)一步通過(guò)亞細(xì)胞定位實(shí)驗(yàn)來(lái)驗(yàn)證。
植物中有些基因只在特定的組織、器官或發(fā)育階段表達(dá),對(duì)這類基因的研究有助于了解其功能,同時(shí)通過(guò)應(yīng)用組織特異性表達(dá)技術(shù),可以實(shí)現(xiàn)目標(biāo)基因在特定組織和器官中的靶向表達(dá)[47]。本研究發(fā)現(xiàn), 不同的GhAGP基因具有不同的組織表達(dá)模式,其中GhAGPL5和GhAGPL11在葉片中特異性高表達(dá), 多個(gè)GhAGP基因在被檢測(cè)的組織中表達(dá)量較低或者基本不表達(dá),GhAGPL1、GhAGPL7和GhAGPS8在10 DPA 胚珠中表達(dá)量較高,暗示這些基因在棉花生長(zhǎng)發(fā)育過(guò)程中可能具有不同的功能,這與木薯[17]、香蕉[18]和芋[20]中的相關(guān)研究結(jié)果較為一致。 另外,前期研究表明,籽粒灌漿過(guò)程合成的淀粉和儲(chǔ)藏蛋白可滿足種子發(fā)育對(duì)光合同化產(chǎn)物的需求[48]。 在棉花中,胚珠的發(fā)育與棉纖維和種子的發(fā)育之間存在緊密又復(fù)雜的關(guān)系, 胚珠發(fā)育形成棉花的種子,而在棉纖維發(fā)育階段,需要大量的光合同化物來(lái)滿足纖維素生物合成的需求;胚珠中淀粉的合成與積累不僅可滿足種子發(fā)育對(duì)光合同化物的需求,也可滿足纖維發(fā)育過(guò)程中對(duì)營(yíng)養(yǎng)物質(zhì)的需要[25]。 本研 究 中,GhAGPL1、GhAGPL7和GhAGPS8在10 DPA 胚珠中特異性高表達(dá), 表明其在棉花種子的淀粉積累、種子發(fā)育以及棉纖維的發(fā)育過(guò)程中可能起著重要作用。 因此,通過(guò)基因工程方法調(diào)控這些基因的表達(dá)可能是今后提高棉花籽指和改良纖維品質(zhì)的有效途徑之一,類似的研究策略已成功應(yīng)用于玉米和小麥等作物[22-23]。
受全球極端天氣頻繁出現(xiàn)、水資源短缺以及土壤鹽堿化日益嚴(yán)重等的威脅,對(duì)棉花品種的抗逆性也提出了更高的要求[49]。挖掘抗逆相關(guān)基因,培育抗逆棉花品種具有重要意義。 棉花在生長(zhǎng)發(fā)育過(guò)程中會(huì)遭遇干旱、低溫、高溫和鹽分等各種非生物脅迫, 會(huì)對(duì)棉花的產(chǎn)量和品質(zhì)造成不利影響[49-51]。與其他作物相比,棉花本身具有一定的耐 鹽 性。 本 研 究 中,GhAGPL1、GhAGPL7和GhAGPL2受鹽脅迫誘導(dǎo)表達(dá), 表明它們?cè)诰S持棉花對(duì)鹽脅迫的適應(yīng)性方面可能起著重要作用,但是其對(duì)鹽脅迫的響應(yīng)模式不盡相同,表明其發(fā)揮功能的時(shí)間可能有所不同。 先前研究發(fā)現(xiàn),AGPase 活性受高溫影響較大[52],在玉米中,高溫脅迫會(huì)導(dǎo)致AGPase 和SS 的活性分別降低約87%和57%,進(jìn)而導(dǎo)致淀粉合成受阻[53]。本研究發(fā)現(xiàn)較多的GhAGP基因參與棉花對(duì)高溫脅迫的響應(yīng), 這可能與AGPase 酶活性對(duì)高溫比較敏感有關(guān)。 總的來(lái)說(shuō),AGPase家族基因的表達(dá)受環(huán)境因素影響較大,這與前人的研究結(jié)果[6,17,54]一致。另外,實(shí)時(shí)定量表達(dá)分析發(fā)現(xiàn)在棉花苗期GhAGPL1和GhAGPL7明顯響應(yīng)多種非生物脅迫,但是實(shí)時(shí)定量表達(dá)分析結(jié)果與轉(zhuǎn)錄組結(jié)果存在一定差異,這可能是由于不同棉花品種對(duì)脅迫的響應(yīng)存在差異; 同時(shí)GhAGPL1和GhAGPL7啟動(dòng)子區(qū)存在與逆境脅迫響應(yīng)相關(guān)的順式作用元件,表明它們可能對(duì)于維持逆境條件下棉花體內(nèi)AGPase 活性和淀粉合成有重要作用。 綜上,本研究結(jié)果不僅有助于了解陸地棉AGPase基因的功能,也為棉花高產(chǎn)和抗逆育種提供了重要的候選基因資源。
在陸地棉基因組中共鑒定到20 個(gè)GhAGP基因, 包括12 個(gè)大亞基基因GhAGPL和8 個(gè)小亞基基因GhAGPS。 GhAGP 蛋白在進(jìn)化上可分為大亞基蛋白AGPL 和小亞基蛋白AGPS 。GhAGP啟動(dòng)子區(qū)含有多個(gè)與植物激素、 非生物脅迫響應(yīng)相關(guān)的順式作用元件。 轉(zhuǎn)錄組和實(shí)時(shí)定量分析表明,GhAGPL1和GhAGPL7基因參與棉花對(duì)低溫、高溫、鹽和干旱脅迫的響應(yīng)。 本研究為深入解析陸地棉AGPase家族基因的功能奠定了基礎(chǔ)。
附圖附表:
詳見(jiàn)本刊網(wǎng)站(http://journal.cricaas.com.cn/)本文網(wǎng)頁(yè)版。
附表1 陸地棉AGPase 蛋白序列一致性分析
Table S1 Sequence identityanalysis ofAGPase proteins inG.hirsutum
附圖1 陸地棉AGPase基因啟動(dòng)子區(qū)的順式作用元件
Fig.S1Cis-acting elements in the promoter ofAGPaseinG.hirsutum