張高原,丁 謙,魏兵強(qiáng)
(1.甘肅農(nóng)業(yè)大學(xué) 園藝學(xué)院,蘭州 730070;2.濰坊工程職業(yè)學(xué)院 花卉學(xué)院,山東青州 262500)
磷脂酰肌醇4-磷酸5-激酶(PIP5K)是磷脂酰肌醇(phosphatidylinositol,PI)信號轉(zhuǎn)導(dǎo)途徑中的關(guān)鍵酶,在多種細(xì)胞的功能發(fā)揮方面起著重要調(diào)控作用[1]。大多數(shù)PIP5K蛋白的N端具有多個MORN(Membrane Occupation and Recognition Nexus)結(jié)構(gòu)域,C端具有1個起催化功能的PIPKc結(jié)構(gòu)域,這些結(jié)構(gòu)域在真核生物中高度保守[2-3]。研究表明,PIP5K基因?qū)χ参锏亩鄠€組織器官的發(fā)育起調(diào)控作用,如氣孔[4]、根[5-7]、花[8-11]等;此外,還參與調(diào)控植物逆境脅迫響應(yīng),如鹽害[12]、水分脅迫[13]等。目前,在擬南芥(Arabidopsisthaliana)、水稻(Oryzasativa)、銀杏(Ginkgobiloba)和大豆(Glycinemax)中分別發(fā)現(xiàn)11、11、7和22個PIP5K基因[14],部分基因已被克隆。
雖然西瓜基因組數(shù)據(jù)已公布[15],但是關(guān)于西瓜PIP5K基因的鑒定及其在雄性不育花蕾中的表達(dá)分析未見相關(guān)報(bào)道。本試驗(yàn)擬利用生物信息學(xué)方法對西瓜PIP5K基因進(jìn)行篩選和鑒定,并對其蛋白理化性質(zhì)、結(jié)構(gòu)域、基因結(jié)構(gòu)、motif分布、染色體定位、進(jìn)化樹、共線性、順式作用元件等特征以及組織表達(dá)模式進(jìn)行分析,以期為進(jìn)一步研究其功能奠定前期基礎(chǔ)。
西瓜雄性兩用系中可育系‘MF-1’和不育系‘MS-1’種子均由甘肅農(nóng)業(yè)大學(xué)瓜類研究所提供。種子于2020年4月22日播種于蘭州市皋蘭縣忠和鎮(zhèn)實(shí)試驗(yàn)田,于7月8日分別采取雄性可育株和不育株的子蔓莖尖花蕾(長度為3~5 mm)和莖尖下方4~5節(jié)處花蕾(長度為7~9 mm),每種花蕾至少采集30個,儲存在液氮中保存,備用。
首先從西瓜基因組數(shù)據(jù)庫(ftp://cucurbitgenomics.org/pub/cucurbit/genome/ watermelon/97103/v1/)[15]下載蛋白組和基因組序列,其次利用Blast本地化軟件(Blast2.2.28)(https://blast.ncbi.nlm.nih.gov/Blast.cgi)構(gòu)建西瓜蛋白組和基因組數(shù)據(jù)庫,然后以Pfam數(shù)據(jù)庫(http://pfam.xfam.org)[16]中的PIP5K保守結(jié)構(gòu)域的隱馬爾可夫模型(Hidden Markov Model; HMM)文件(序列號為PF01504)為搜索序列,利用HMMER 3.2軟件(http://www.hmmer.org/)[17]在本地西瓜蛋白組數(shù)據(jù)庫中進(jìn)行BlastP搜索,閾值為E-value<10-10,獲取西瓜PIP5K候選成員。為確保候選成員中含有PIPKc結(jié)構(gòu)域,利用SMART (http://smart.embl.de/)在線軟件鑒定西瓜PIP5K候選成員。最后從本地西瓜蛋白組和基因組數(shù)據(jù)庫中下載鑒定后的西瓜PIP5K家族成員的蛋白和基因序列,作為后期分析的基礎(chǔ)。擬南芥PIP5K成員[14]的基因和蛋白序列來源于擬南芥數(shù)據(jù)庫(http://www.arabidopsis.org/)。
蛋白序列長度、分子量及等電點(diǎn)等理化特征利用ProtParam(http://web.expasy.org/protparam/)在線軟件進(jìn)行分析。亞細(xì)胞定位分別利用Euk-mPLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/)[18]和ProtComp version 9.0 server(http://www.softberry.com)進(jìn)行分析。根據(jù)基因序列起始位點(diǎn),利用MapChart 2.2軟件繪制西瓜PIP5K基因染色體分布圖。利用MCScanX軟件(http://chibba.pgml.uga.edu/mcscan2/)[19]進(jìn)行西瓜和擬南芥PIP5K基因的共線性分析,結(jié)果用circos軟件(http://circos.ca/)繪制[20]。進(jìn)化樹由MEGA-X軟件[21]構(gòu)建,序列比對方法均為ClustalW,Bootstrap的重復(fù)次數(shù)設(shè)置為1 000,其中西瓜PIP5K家族成員的蛋白和編碼序列進(jìn)化樹的構(gòu)建方法均為鄰接法(Neighbor-joining,NJ),執(zhí)行參數(shù)分別為p-distance和pairwise deletion[22-24],剩余設(shè)置選擇默認(rèn)選項(xiàng);擬南芥和西瓜PIP5K家族成員的蛋白和編碼序列系統(tǒng)進(jìn)化樹的構(gòu)建方法均為最大似然法(Maximum Likelihood,ML),執(zhí)行參數(shù)分別為Jones-Taylor-Thornton(JTT) model、Gamma Distributed (G)和Use all sites[24],剩余設(shè)置選擇默認(rèn)選項(xiàng)。利用OrthoFinder 2.3.11軟件[25](http://www.steve-kellylab.com/software/orthofinder)分析擬南芥和西瓜PIP5K基因家族之間的直系同源基因和旁系同源基因。利用MEME 5.1.1軟件[26](http://meme-suite.org/)對PIP5K蛋白序列進(jìn)行motif分析,其中motif基序長度范圍為6~50,數(shù)量最大為10,然后利用WebLogo 3.7.4(http://weblogo.threeplusone.com/)生成motif基序標(biāo)簽[27]。利用GSDS2.0(Gene Structure Display Server)(http://gsds.gao-lab.org/index.php)進(jìn)行基因結(jié)構(gòu)分析[28]。截取西瓜PIP5K編碼基因上游2 000 bp序列,利用PlantCARE軟件(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)進(jìn)行順式作用元件分析[29],結(jié)果用Evolview v2繪制[30]。
利用NCBI-SRA數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/sra/)下載西瓜栽培品種97103的生長點(diǎn)、果柄、果肉、下胚軸、葉和根相關(guān)的RNA-seq數(shù)據(jù)(SRP192188)[31],然后利用HISAT 2.2.0軟件[32](https://daehwankimlab.github.io/hisat2/)進(jìn)行RNA-seq分析,R語言的 Rsubread包的featureCounts進(jìn)行TPM(Transcripts Per Million)表達(dá)定量分析[33-34]。
利用TRNzol Universal總RNA提取試劑(TIANGEN,中國北京)提取西瓜雄性可育和不育花蕾總RNA。利用PrimeScriptTM RT試劑盒(TaKaRa,中國大連)合成cDNA。利用Primer 5.0設(shè)計(jì)西瓜PIP5K基因以及內(nèi)參基因 (β-actin; Cla007792)的特異性引物(表1)。采用羅氏 LightCycler96 實(shí)時熒光定量PCR儀(Roche,Basel,Switzerland)進(jìn)行基因表達(dá)量檢測。Quantitative real-time PCR (qRT-PCR)反應(yīng)體系如下:10 μL SYBR Green Master mix (2×),0.8 μL primer F(10 μmol/L),0.8 μL primer R(10 μmol/L),6.4 μL ddH2O和2 μL cDNA模板。PCR反應(yīng)程序如下:95 ℃預(yù)變性30 s,然后95 ℃ 5 s,60 ℃ 30 s 進(jìn)行50個循環(huán)。以雄性可育花蕾(長度為3~5 mm)為對照,計(jì)算其他花蕾中ClaPIP5K基因相對表達(dá)量,設(shè)置3次重復(fù),計(jì)算方法采用2-△△Ct方法[35]。采用SPSS17軟件中的t檢驗(yàn)對基因表達(dá)量進(jìn)行統(tǒng)計(jì)分析。
表1 西瓜 PIP5K基因的qRT-PCR引物Table 1 qRT-PCR primers of watermelon PIP5K genes
西瓜基因組中共鑒定出8個PIP5K家族成員,根據(jù)其在染色體上的位置進(jìn)行編號 (ClaPIP5K1~ClaPIP5K8)。結(jié)果如圖1-A所示,西瓜數(shù)據(jù)庫中將無法定位的染色體片段組合起來稱為0號染色體,除了ClaPIP5K1定位在0號染色體外,其余7個ClaPIP5K基因分布在其他6條染色體上,其中5號染色體分布2個ClaPIP5K基因,其他5條染色體分別分布1個ClaPIP5K基因。為了檢測ClaPIP5K和AtPIP5K基因間的進(jìn)化關(guān)系,利用MCScanX軟件進(jìn)行共線性分析。結(jié)果如圖1-B所示,4個ClaPIP5K基因與5個擬南芥AtPIP5K基因存在共線關(guān)系,如ClaPIP5K7分別與AtPIP5K6、AtPIP5K9和AtPIP5K10共線,ClaPIP5K8分別與AtPIP5K1和AtPIP5K2共線,ClaPIP5K3與AtPIP5K2共線;此外,1個ClaPIP5K基因?qū)?ClaPIP5K5~ClaPIP5K7)發(fā)生片段復(fù)制事件。
ClaPIP5K基因的CDS序列長度為606~ 2 499 bp,蛋白序列長度為201~832 aa,分子質(zhì)量為22.62~93.76 ku,等電點(diǎn)介于6.6~ 8.87,其中4個蛋白呈堿性(表2)。亞細(xì)胞定位分析顯示多數(shù)ClaPIP5K蛋白位于細(xì)胞質(zhì)或細(xì)胞膜上(表2)。蛋白結(jié)構(gòu)域分析顯示,所有的ClaPIP5K成員在C端都具有1個起催化功能的PIPKc結(jié)構(gòu)域,其中6個ClaPIP5K成員在N端還具有 7~8個MORN結(jié)構(gòu)域(圖2)。
表2 西瓜PIP5K家族成員的基本信息Table 2 Information of PIP5K family members in watermelon
為了檢測ClaPIP5K和AtPIP5K成員的蛋白序列進(jìn)化情況以及同源序列對(組)所包含的保守基序數(shù)量及種類,利用MEGA X軟件進(jìn)行進(jìn)化樹分析,Orthofinder軟件進(jìn)行同源序列分析,MEME軟件進(jìn)行保守基序分析。結(jié)果如圖3所示,蛋白序列進(jìn)化樹顯示ClaPIP5K和AtPIP5K成員被分成4個組(GroupⅠ~Ⅳ),其中 GroupⅠ所含成員最多,為6個,GroupⅡ和Ⅲ次之,分別為5個,GroupⅣ最少,為3個。蛋白保守基序分析顯示ClaPIP5K蛋白中含有10個保守基序,每個保守基序含有29~50個氨基酸,其中motif1、4、5和7所含氨基酸數(shù)量最多,平均為50個,motif10所含最少,為29個。此外,GroupⅠ~Ⅲ亞組中,除了ClaPIP5K1和AtPIP5K3外,其他PIP5K成員中均含有10個motif。同源序列分析發(fā)現(xiàn)ClaPIP5K和AtPIP5K之間存在5個同源序列對(組),其中4個同源序列對(組)(ClaPIP5K4/AtPIP5K4/AtPIP5K5、ClaPIP5K3/ClaPIP5K8/AtPIP5K1/AtPIP5K2、ClaPIP5K7/AtPIP5K9和ClaPIP5K2/ ClaPIP5K6)所含 motif數(shù)量和種類均相似。而ClaPIP5K1和ClaPIP5K5由于部分氨基酸的缺失,導(dǎo)致其motif種類和數(shù)量上與同組的AtPIP5K成員有所差異。
為了檢測ClaPIP5K和AtPIP5K成員的基因序列進(jìn)化情況以及同源序列的內(nèi)含子和外顯子分布情況,利用MEGA X軟件進(jìn)行進(jìn)化樹分析,Orthofinder軟件進(jìn)行同源序列分析,GSDS軟件進(jìn)行基因結(jié)構(gòu)分析。結(jié)果如圖4所示,基因序列的系統(tǒng)進(jìn)化樹和同源序列分析結(jié)果與蛋白序列的(圖3)基本一致;基因結(jié)構(gòu)分析顯示75%(6/8)ClaPIP5K基因含有7個內(nèi)含子(圖4),并且4個同源序列對(組) (ClaPIP5K4/AtPIP5K4/AtPIP5K5、ClaPIP5K3/ClaPIP5K8/AtPIP5K1/AtPIP5K2、ClaPIP5K7/AtPIP5K9和ClaPIP5K2/ClaPIP5K6)所含內(nèi)含子數(shù)量均為7個。另外,與AtPIP5K6相比,ClaPIP5K2和ClaPIP5K6的第一個內(nèi)含子發(fā)生了缺失現(xiàn)象,ClaPIP5K1和ClaPIP5K5出現(xiàn)了部分內(nèi)含子和外顯子的缺失現(xiàn)象,導(dǎo)致與同組的AtPIP5K基因在基因結(jié)構(gòu)上有所差異。
為了明確ClaPIP5K基因啟動子所含的順式作用元件種類及分布情況,利用PlantCARE軟件進(jìn)行分析。結(jié)果如圖5所示,ClaPIP5K基因啟動子處主要包含2大類順式作用元件:①激素響應(yīng)元件,如響應(yīng)生長素IAA的AuxRR-core(1/8;含元件基因數(shù)/總基因數(shù),下同),響應(yīng)赤霉素GA 的TATC-box(1/8)、GARE-motif(2/8)和P-box(4/8),響應(yīng)水楊酸SA 的TCA-element(5/8),響應(yīng)脫落酸ABA的ABRE(4/8)和響應(yīng)茉莉酸甲酯MeJA的CGTCA-motif(3/8)等元件;②脅迫響應(yīng)元件,如響應(yīng)干旱的MYB結(jié)合位點(diǎn)MBS(5/8),響應(yīng)低溫的LTR(4/8),響應(yīng)防御與脅迫的TC-richrepeats(5/8),厭氧誘導(dǎo)的ARE(7/8)和響應(yīng)損傷的WUN-motif(6/8)等元件。其中ClaPIP5K4基因所含順式作用元件種類和數(shù)量最多,共9種16個(1個AuxRR-core、1個GARE-motif、1個TCA-element、2個ABRE、1個CGTCA-motif、1個LTR、1個TC-richrepeats、7個ARE和1個WUN-motif),ClaPIP5K3所含順式作用元件種類和數(shù)量最少,共3種6個(1個MBS、4個ARE和1個WUN-motif)。另外,ClaPIP5K2和ClaPIP5K6所含順式作用元件種類和數(shù)量較相似。
為探索ClaPIP5K基因在西瓜生長發(fā)育過程中潛在的生物學(xué)功能,對已公布的西瓜栽培品種97103的生長點(diǎn)、果柄、果肉、下胚軸、葉和根的RNA-seq數(shù)據(jù)進(jìn)行組織表達(dá)模式分析。結(jié)果如表3所示,4個ClaPIP5K基因在6個組織的不同發(fā)育時期表現(xiàn)出較高的表達(dá)量(TPM>10),其中ClaPIP5K1基因在授粉34 d后的生長點(diǎn)中表達(dá)量最高,ClaPIP5K3基因在授粉18 d后的葉片中表達(dá)量最高,ClaPIP5K8和ClaPIP5K7基因分別在授粉10 d和26 d后的果肉中表達(dá)量最高。此外,ClaPIP5K5基因僅在生長點(diǎn)的4個時期表現(xiàn)出較高的表達(dá)量,具有明顯的組織表達(dá)特異性。另外,本試驗(yàn)利用qRT-PCR技術(shù)檢測了ClaPIP5K基因在西瓜雄性可育和雄性不育花蕾中的表達(dá)分析。結(jié)果如圖6所示,西瓜雄性可育植株花蕾和花藥發(fā)育正常、飽滿(圖6-A),而不育植株花蕾和花藥發(fā)育不正常、干癟(圖6-B);另外,基因表達(dá)分析中(圖6-C),除了ClaPIP5K5基因外,其他7個ClaPIP5K基因在西瓜雄性可育和不育花蕾中均檢測出不同程度的表達(dá)量。其中,與可育植株的7~9 mm長的花蕾對比后發(fā)現(xiàn),4個ClaPIP5K基因(ClaPIP5K1、ClaPIP5K3、ClaPIP5K7和ClaPIP5K8)在不育花蕾中具有明顯的較高表達(dá)量,然而ClaPIP5K2表現(xiàn)出明顯的較低表達(dá)量;此外,在3~5 mm和7~9 mm長的花蕾中,ClaPIP5K4基因在不育花蕾的表達(dá)量均明顯低于可育花蕾,然而ClaPIP5K6基因出現(xiàn)相反的表達(dá)趨勢。以上結(jié)果表明ClaPIP5K基因可能在西瓜生長點(diǎn)、葉片、果肉以及花蕾花藥等組織生長發(fā)育方面具有重要作用。
表3 ClaPIP5K基因在西瓜栽培品種‘97103’的不同組織中的表達(dá)分析Table 3 Expression analysis of ClaPIP5K genes in different tissues of watermelon cultivar ‘97103’
磷脂酰肌醇4-磷酸5-激酶(PIP5K)是植物內(nèi)一種磷酯類激酶,在不同植物中的成員數(shù)量有所不同。擬南芥中發(fā)現(xiàn)含有11個PIP5K成員,大致分成4組(Ⅰ~Ⅳ)。除了第Ⅳ組含有2個AtPIP5K成員外,其他組均含有3個。西瓜含有8個ClaPIP5K成員,除了第Ⅰ組所含ClaPIP5K成員數(shù)量與擬南芥一樣外,其他組的數(shù)量均比擬南芥的少1個,說明這3組(Ⅱ~Ⅳ)的ClaPIP5K成員在進(jìn)化過程中出現(xiàn)了缺失現(xiàn)象。除了C端具有起催化功能的PIPKc結(jié)構(gòu)域外,N端多MORN結(jié)構(gòu)域也是植物大多數(shù)PIP5K家族成員所特有的特征[2-3]。例如,擬南芥中有9個AtPIP5Ks具有7~8個MORN結(jié)構(gòu)域,水稻中有5個OsPIP5Ks 具有7~8個MORN結(jié)構(gòu)域[2],而西瓜中也發(fā)現(xiàn)6個ClaPIP5K成員具有7~8個MORN結(jié)構(gòu)域(圖1)。亞細(xì)胞定位預(yù)測顯示多數(shù)ClaPIP5K定位在細(xì)胞質(zhì)或細(xì)胞膜上,說明這些基因可能在細(xì)胞質(zhì)或細(xì)胞膜上行使其功能。以前的研究也證實(shí)了PIP5K基因作為一種細(xì)胞膜傳感器,在磷脂類代謝中發(fā)揮著重要作用[36]。
通過進(jìn)化樹、同源序列、保守基序和基因結(jié)構(gòu)等分析,發(fā)現(xiàn)位于同一組的擬南芥和西瓜PIP5K成員在保守基序種類和基因結(jié)構(gòu)上具有高度的相似性。例如4個同源序列對(組) (ClaPIP5K4/ AtPIP5K4/ AtPIP5K5、ClaPIP5K3/ ClaPIP5K8/ AtPIP5K1/ AtPIP5K2、 ClaPIP5K7/AtPIP5K9和 ClaPIP5K2/ ClaPIP5K6)都具有10個motifs和7個內(nèi)含子。但是也發(fā)現(xiàn)了一些差異,如AtPIP5K6與 ClaPIP5K2/ ClaPIP5K6的motif種類分布上相似,但由于AtPIP5K6在N端多了1個內(nèi)含子,其基因結(jié)構(gòu)與 ClaPIP5K2/ ClaPIP5K6有所不同; ClaPIP5K1和ClaPIP5K5由于大量序列的丟失,導(dǎo)致與同組的AtPIP5K在保守基序分布和基因結(jié)構(gòu)上差異較大。以上結(jié)果表明多數(shù)PIP5K成員在進(jìn)化過程中相對保守。
基因復(fù)制事件在基因家族成員數(shù)量擴(kuò)增、生物多樣性和物種形成等方面具有重要作用[14]。本研究發(fā)現(xiàn),4個ClaPIP5K基因與5個擬南芥AtPIP5K基因存在復(fù)制情況,1個ClaPIP5K基因?qū)?ClaPIP5K5-ClaPIP5K7)存在片段復(fù)制現(xiàn)象,說明全基因組復(fù)制或者片段復(fù)制在ClaPIP5K基因復(fù)制中扮演著重要作用。
啟動子分析顯示ClaPIP5K基因含有響應(yīng)IAA、GA、ABA、SA、MeJA等激素以及干旱、低溫等非生物脅迫等方面的順式作用元件,這與玉米PIP5K基因啟動子生信分析結(jié)果相似[37]。基于已公布的西瓜RNA-seq數(shù)據(jù),分析了ClaPIP5K基因在不同組織的不同發(fā)育時期的表達(dá)模式。結(jié)果顯示4個ClaPIP5K基因 (ClaPIP5K1、ClaPIP5K3、ClaPIP5K7和ClaPIP5K8)在生長點(diǎn)、果柄、果肉、下胚軸、葉和根的不同發(fā)育時期均表現(xiàn)出較高的表達(dá)量,而ClaPIP5K5只在生長點(diǎn)表現(xiàn)出較高的表達(dá)量,說明ClaPIP5K基因可能協(xié)同或者單獨(dú)地參與調(diào)控西瓜不同組織形態(tài)建成相關(guān)途徑。此外,以前研究表明擬南芥AtPIP5K4或AtPIP5K5缺失突變株的花藥和花粉發(fā)育受到嚴(yán)重抑制[9-10]。本研究發(fā)現(xiàn)ClaPIP5K4基因在雄性不育花蕾發(fā)育的 2個階段中一直維持著顯著的低表達(dá)量狀態(tài),并且ClaPIP5K4與AtPIP5K4和AtPIP5K5為同源基因,表明ClaPIP5K4基因可能參與調(diào)控西瓜花藥或花粉的生長發(fā)育??傊?,本研究首次利用生物信息學(xué)方法對西瓜PIP5K基因家族進(jìn)行了鑒定,包括蛋白理化性質(zhì)、結(jié)構(gòu)域、保守基序、基因結(jié)構(gòu)、進(jìn)化情況、啟動子以及組織表達(dá)模式等方面的分析,為后期研究其功能奠定了一定基礎(chǔ)。