喬少婷,代安娜爾,解 敏,孫思霖,聶佳瑩,丹 彤
(內(nèi)蒙古農(nóng)業(yè)大學(xué) 乳品生物技術(shù)與工程教育部重點(diǎn)實(shí)驗(yàn)室,內(nèi)蒙古 呼和浩特 010018)
嗜熱鏈球菌(Streptococcus thermophilus)作為唯一通過歐洲安全認(rèn)證的鏈球菌[1-2],因其活力強(qiáng)、產(chǎn)酸快、安全性高等特點(diǎn),已被廣泛應(yīng)用于發(fā)酵乳制品的生產(chǎn)中[3-5]。乳酸菌胞外多糖(exopolysaccharide,EPS)是由乳酸菌通過代謝碳源物質(zhì)得到的一種高分子聚合物,分子質(zhì)量一般在104~6×106Da之間[6-7],包括游離于細(xì)胞之外的黏液多糖和附著于細(xì)胞壁的莢膜多糖[8]。根據(jù)化學(xué)成分,EPS可分為同型多糖和異型多糖(heteropolysaccharide,HePS)兩種,就目前的研究成果而言,乳酸菌的EPS大多均為HePS[9]。EPS對(duì)微生物細(xì)胞機(jī)械損傷有一定的保護(hù)作用,可減緩微生物細(xì)胞水分流失,在惡劣的生存環(huán)境中也可作為微生物的營養(yǎng)[10],同時(shí)具有提高發(fā)酵乳制品黏度、持水性及穩(wěn)定性,改善產(chǎn)品口感的優(yōu)良特性[11-13]。
近年來,隨著乳酸菌基因組學(xué)研究的飛速發(fā)展,國內(nèi)外對(duì)于乳酸菌eps基因簇的研究也有了全新的理解。EPS的合成共包括兩個(gè)階段,分別為前體物質(zhì)糖核苷酸的合成和eps基因簇指導(dǎo)合成EPS[14-15]。糖核苷酸的合成主要依靠糖酵解途徑完成,而eps基因簇則負(fù)責(zé)參與EPS的重復(fù)單元合成,控制EPS鏈長、聚合以及將EPS運(yùn)輸?shù)郊?xì)胞外[16-17]。eps基因簇對(duì)于EPS的生物合成必不可少[18]。Dertli等[18]對(duì)約翰遜乳桿菌(Lactobacillus johnsonii)FI9785的EPS結(jié)構(gòu)和基因簇進(jìn)行分析,發(fā)現(xiàn)與野生菌株相比,缺失epsE的突變體只能產(chǎn)生EPS-1而無法產(chǎn)生EPS-2,而當(dāng)整個(gè)eps基因簇被敲除后,菌株則無法再產(chǎn)生EPS。Gankhuyag[19]通過研究德氏乳桿菌保加利亞亞種(Lactobacillus delbrueckiisubsp.bulgaricus)和副干酪乳桿菌(Lactobacillus paracasei)的eps基因簇后發(fā)現(xiàn)不同菌種的eps基因簇存在顯著差異,進(jìn)一步研究發(fā)現(xiàn),來自同一菌種的不同菌株eps基因簇也存在明顯差異,例如L. delbrueckiisubsp.bulgaricus2038和ATCC 11842具有翻轉(zhuǎn)酶基因,而其他L. delbrueckiisubsp.bulgaricus中未發(fā)現(xiàn)此基因。Dipti等[20]通過對(duì)比來自27個(gè)物種106個(gè)乳酸桿菌(Lactobacillus)的eps基因簇后發(fā)現(xiàn)糖基轉(zhuǎn)移酶(glycosyltransferase,GT)、翻轉(zhuǎn)酶(O-antigen flippase,Wzx)和聚合輸出酶(O-antigen polymerase,Wzy)的特異性較強(qiáng),且不同生長環(huán)境下菌株gt、wzx、wzy基因編碼的蛋白質(zhì)家族無法高度共享,這些結(jié)果表明菌株eps基因簇具有較高的可變性,可以適應(yīng)不同的生存環(huán)境。
S. thermophilusIMAU20551分離自蒙古國的傳統(tǒng)發(fā)酵乳,具有產(chǎn)酸速度快、遺傳性狀穩(wěn)定以及EPS產(chǎn)量高((268.25±5.36)mg/L,數(shù)據(jù)暫未發(fā)表)等特點(diǎn),是1 株特性優(yōu)良的發(fā)酵劑菌株。本實(shí)驗(yàn)以S. thermophilusIMAU20551為研究對(duì)象,采用Illumina HiSeq技術(shù)對(duì)該菌株進(jìn)行二代基因組重測(cè)序,找出和EPS生產(chǎn)相關(guān)的eps基因簇,并利用實(shí)時(shí)聚合酶鏈?zhǔn)椒磻?yīng)(real-time polymerase chain reaction,real-time PCR)技術(shù)對(duì)eps基因簇的表達(dá)進(jìn)行驗(yàn)證,旨在為S. thermophilusEPS的研究提供更多參考信息,為之后乳酸菌EPS的應(yīng)用奠定理論基礎(chǔ)。
S. thermophilusIMAU20551分離自蒙古國扎布汗省奧特跟蘇木的傳統(tǒng)酸牛奶,由內(nèi)蒙古農(nóng)業(yè)大學(xué)乳酸菌菌種資源庫提供,菌株保藏號(hào)MGB80-7,GenBank序列號(hào)HM058270。
M17肉湯培養(yǎng)基 青島海博生物技術(shù)有限公司;Wizard Genomic DNA Purification Kit(1120)、Invitrogen TRIzol RNA提取試劑盒 美國Promega公司;HiScript Q RT SuperMix for qPCR (+gDNA wiper)反轉(zhuǎn)錄試劑盒、2×ChamQ SYBR COLOR qPCR Master Mix 南京諾唯贊生物科技有限公司。
AR2202CN型電子天平 奧豪斯儀器上海有限公司;SX-700型全自動(dòng)高壓蒸汽滅菌器 日本HIRAYAMA公司;HWS28型電熱恒溫水浴鍋 上海一恒科技有限公司;DHP-9272型電熱恒溫培養(yǎng)箱 上海坤天試驗(yàn)儀器有限公司;SJ-CJ-2FDQ型超凈臺(tái) 上海智城分析儀器制造有限公司;BX 50型光學(xué)顯微鏡 日本奧林巴斯公司;Mix Max型旋渦振蕩器 合肥艾本森科學(xué)儀器有限公司;5810 R型高速控溫離心機(jī) 德國Eppendorf公司;Nano-Drop 2000型微量分光光度計(jì) 美國Thermo Scientific公司;ABI 7500型熒光定量PCR儀 美國Applied Biosystems公司。
1.3.1 菌株活化
參照陳海燕等[21]方法,將保藏于-80 ℃的S. thermophilusIMAU20551接種于脫脂乳培養(yǎng)基中,接種量為2%(m/m),37 ℃培養(yǎng)24 h后,以2%(V/V)的接種量接種于M17液體培養(yǎng)基中,37 ℃培養(yǎng)24 h,連續(xù)培養(yǎng)2 代,使菌株活力達(dá)到最大(活菌數(shù)>109CFU/mL)。
1.3.2 菌株DNA提取
將活化后的IMAU20551以2%(V/V)接種量擴(kuò)培至50 mL的M17液體培養(yǎng)基中,37 ℃培養(yǎng)24 h后,離心除去上清液,用磷酸鹽緩沖溶液清洗2 遍得到干凈菌體,利用Wizard Genomic DNA Purification Kit提取DNA,提取方法參考試劑盒說明書。提取出的DNA通過微型紫外分光光度計(jì)測(cè)定濃度,并利用1%(m/m)瓊脂糖凝膠電泳判斷其純度和完整度,選取出質(zhì)量合格的DNA進(jìn)行重測(cè)序。
1.3.3 基因組重測(cè)序
將通過1.3.2節(jié)得到的DNA采用Illumina HiSeq 4000進(jìn)行基因組二代重測(cè)序,構(gòu)建Illumna PE文庫。
1.3.4 基因組組裝
將原始數(shù)據(jù)raw data通過Illumina HiSeq 4000過濾得到clean data,利用SOPAdenovo軟件對(duì)重測(cè)序完成后的基因數(shù)據(jù)進(jìn)行組裝。選取合適的Kmer值組裝拼接基因組數(shù)據(jù),并對(duì)單堿基進(jìn)行矯正。以基因組大小、scaffold數(shù)量、GC含量、N50值、N90值為指標(biāo),篩選與參考值接近的基因組拼裝結(jié)果作為最終組裝結(jié)果進(jìn)行SOAP驗(yàn)證及校驗(yàn)。
1.3.5 基因組預(yù)測(cè)及注釋
利用prokka軟件預(yù)測(cè)基因組基因,獲得開放閱讀框信息。結(jié)合RAST(Rapid Annotation using Subsystem Technology)Server-RAST Annotation Server(http://rast.nmpdr.org/)網(wǎng)上在線工具、基因本體論(Gene Ontology,GO)(http://www.geneontology.org/)、直系同源集(Clusters of Orthologous Groups,COG)(http://www.ncbi.nlm. nih.gov/COG/)以及京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)(http://www.genome.jp/kegg/)等數(shù)據(jù)庫完成基因的預(yù)測(cè)及功能注釋。
1.3.6 生物信息分析
采用CGview(http://stothard.afns.ualberta.ca/cgview_server/)軟件繪制S. thermophilusIMAU20551基因組掃描圖,核酸序列相似性比對(duì)采用BLAST(http://www.ncbi.nlm.nih.gov)軟件在線分析。
1.3.7 總RNA提取
將活化后的S. thermophilusIMAU20551以2%(V/V)接種量接種于M17液體培養(yǎng)基中,37 ℃培養(yǎng),分別于0、6、12、18、24 h取出離心(4 000 r/min,10 min)收集菌體。利用Invitrogen TRIzol RNA提取試劑盒提取菌體RNA,提取方法參考試劑盒說明書。利用1%(m/m)瓊脂糖凝膠電泳對(duì)RNA提取質(zhì)量進(jìn)行檢測(cè)。
1.3.8 cDNA合成
根據(jù)HiScript Q RT SuperMix for qPCR (+gDNA wiper)反轉(zhuǎn)錄試劑盒說明書進(jìn)行DNA去除反應(yīng)及cDNA模版合成反應(yīng),方法參考試劑盒說明書,逆轉(zhuǎn)錄反應(yīng)條件為50 ℃,15 min;85 ℃,2 min。
1.3.9 real-time PCR引物設(shè)計(jì)及反應(yīng)體系
使用Primer 5軟件設(shè)計(jì)real-time PCR引物,引物由上海美吉生物公司合成。具體引物如表1所示。
表1 real-time PCR引物Table 1 Primer sequences used for real-time PCR in this study
以上述設(shè)計(jì)的引物為模版,采用gapdh部分序列作為內(nèi)參基因進(jìn)行real-time PCR。反應(yīng)體系為20 μL:10.0 μL 2× ChamQ SYBR Color qPCR Master Mix;Primer F(5 μmol/L)、Primer R(5 μmol/L)各0.8 μL;0.4 μL 50× ROX Reference Dye 2;cDNA模板2.0 μL;補(bǔ)水至20.0 μL。參照Livak等[22]的方法使用2-ΔΔCt法分析數(shù)據(jù),計(jì)算基因表達(dá)量并繪圖。
利用Origin 5、Excel、OMNIC等軟件對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行處理,所有實(shí)驗(yàn)均重復(fù)3次以減少誤差。
對(duì)S. thermophilusIMAU20551進(jìn)行DNA提取后采用Illumina HiSeq 4000測(cè)序平臺(tái)進(jìn)行測(cè)序,采用CGView軟件繪制菌株基因組掃描圖,結(jié)果如圖1所示。從外到內(nèi)第1圈和第4圈為正鏈、負(fù)鏈上的蛋白質(zhì)編碼區(qū)(coding sequence,CDS),以不同顏色表示不同的COG功能分類;第2圈和第3圈分別為正鏈、負(fù)鏈上的CDS、tRNA和rRNA;第5圈為GC含量,向外的部分表示該區(qū)域GC含量高于全基因組平均GC含量,反之則表示該區(qū)域GC含量低于全基因組的平均GC含量,峰值越高表示與平均GC含量差值越大;第6圈為GC偏移值,具體算法為(GC)/(G+C),可以輔助判斷前導(dǎo)鏈和后滯鏈,一般前導(dǎo)鏈GC偏移值>0(綠色部分),后滯鏈GC偏移值<0(紫色部分),也可以輔助判斷復(fù)制起點(diǎn)(累計(jì)偏移最小值)和終點(diǎn)(累計(jì)偏移最大值),尤其對(duì)環(huán)狀基因組最為重要;最內(nèi)一圈為基因組大小標(biāo)識(shí)。
基因組全長1 725 107 bp,無質(zhì)?;?,共56 條scaffold,GC含量為39.08%,N50長度為105 617 bp,N90長度為37 646 bp,包含33個(gè)tRNA、3個(gè)rRNA和26個(gè)重復(fù)單位?;蚪M共編碼1 884個(gè)基因,基因長度為1 432 380 bp,占總基因組長度的83.03%。各項(xiàng)數(shù)據(jù)均顯示符合S. thermophilus基本特征,表明基因組測(cè)序組裝結(jié)果良好,可進(jìn)行后續(xù)生物信息分析。
圖1 S. thermophilus IMAU20551基因組掃描圖Fig. 1 CGView results of S. thermophilus IMAU20551
如圖2所示,比對(duì)蛋白COG數(shù)據(jù)庫后發(fā)現(xiàn),在所有的1 884個(gè)基因中,有1 357個(gè)基因被分別注釋到19個(gè)COG類別中,占總基因數(shù)的81.58%。除去功能未知的345個(gè)基因外,被注釋到E類別(氨基酸運(yùn)輸與代謝)中的編碼基因占比最大,共有195個(gè),其次是J類別(翻譯、核糖體結(jié)構(gòu)和生物起源,144個(gè)基因)、L類別(復(fù)制、重組與修復(fù),127個(gè)基因)以及G類別(碳水化合物運(yùn)輸與代謝,94個(gè)基因)。另外,eps基因簇中大部分功能基因均被注釋到M類別(細(xì)胞壁/細(xì)胞膜/細(xì)胞被膜生物合成)中。
圖2 S. thermophilus IMAU20551基因組COG功能分類統(tǒng)計(jì)分析Fig. 2 COG function analysis of genomic DNA from S. thermophilus IMAU20551
圖3 S. thermophilus IMAU20551基因組GO功能注釋結(jié)果Fig. 3 GO function analysis of genomic DNA from S. thermophilus IMAU20551
將S. thermophilusIMAU20551基因組數(shù)據(jù)與GO數(shù)據(jù)庫比對(duì),結(jié)果如圖3所示。共有1 538個(gè)基因被分為3 類本體功能,分別為生物學(xué)過程、細(xì)胞組成和分子功能,進(jìn)一步可細(xì)分為42個(gè)二級(jí)功能類別。其中,在生物學(xué)過程中的14個(gè)二級(jí)類別中,有較大一部分基因被注釋到氧化還原過程中,另外被注釋到蛋白水解、轉(zhuǎn)錄調(diào)控、翻譯、轉(zhuǎn)運(yùn)和磷酸化中的編碼基因也數(shù)量較大;在細(xì)胞組成類別中又分為14個(gè)二級(jí)類別,有418個(gè)基因被注釋到細(xì)胞膜組分類別中,占GO總編碼基因的22.19%,其次為細(xì)胞質(zhì)和質(zhì)膜,分別注釋到239個(gè)基因和110個(gè)基因,有極少數(shù)的基因被注釋到胞外基質(zhì)、質(zhì)膜外在組分、信號(hào)識(shí)別粒子等類別;在分子功能下的14個(gè)類別中,有絕大部分的基因被注釋到ATP整合和DNA整合類別中,共397個(gè)編碼基因,占GO總編碼基因的21.07%,另外在水解酶、ATP酶和轉(zhuǎn)移酶等酶活性類別中也注釋到較多編碼基因。
將S. thermophilusIMAU20551基因組與KEGG數(shù)據(jù)庫比對(duì),結(jié)果如圖4所示。S. thermophilusIMAU20551基因組中共有1 170個(gè)基因在KEGG代謝通路中得到注釋,占到全部編碼基因的62.10%。其中大部分的基因被注釋到新陳代謝、遺傳信息傳遞和生物體系統(tǒng)這3個(gè)一級(jí)類別中,被注釋到基因數(shù)量分別為719、153個(gè)和143個(gè),占到所有被注釋到KEGG通路中的基因數(shù)量的61.45%、13.08%和12.22%。細(xì)胞過程、人類疾病以及環(huán)境信息加工這3個(gè)類別中注釋到的基因較少,其中,被注釋到有機(jī)系統(tǒng)的基因豐度最低,僅有16個(gè)。將6個(gè)一級(jí)分類細(xì)分為34個(gè)二級(jí)類別后發(fā)現(xiàn),被注釋到碳水化合物代謝、氨基酸代謝、膜轉(zhuǎn)運(yùn)以及翻譯中的基因占大多數(shù),僅有極少部分的基因被注釋到消化系統(tǒng)、免疫系統(tǒng)、神經(jīng)系統(tǒng)中。
圖4 S. thermophilus IMAU20551基因組KEGG pathway分類統(tǒng)計(jì)Fig. 4 KEGG pathway classification of genomic DNA from S. thermophilus IMAU20551
EPS的合成離不開前體物質(zhì)糖核苷酸的供應(yīng)。本實(shí)驗(yàn)也在KEGG通路中注釋到一些可以將游離糖利用并合成糖核苷酸的酶的相關(guān)基因,如表2所示。這些酶可以將不同的碳源物質(zhì)作為底物,經(jīng)過一系列反應(yīng)最終合成UDP-葡萄糖、dTDP-葡萄糖、UDP-半乳糖、dTDP-鼠李糖、UDP-N-乙酰葡萄糖胺以及UDP-N-乙酰半乳糖胺等前體糖核苷酸。由這些酶可以推測(cè)出S. thermophilusIMAU20551所產(chǎn)EPS可能是由葡萄糖、半乳糖、葡萄糖醛酸等多種單糖組分組成,為典型的HePS,這與前期測(cè)得的S. thermophilusIMAU20551 EPS單糖組成結(jié)果一致(數(shù)據(jù)暫未發(fā)表)。
表2 KEGG注釋S. thermophilus IMAU20551糖核苷酸合成部分過程中關(guān)鍵酶Table 2 Key enzymes in the synthesis of sugar nucleotides in S. thermophilus IMAU20551 annotated to the KEGG pathway
注釋基因組后發(fā)現(xiàn),S. thermophilusIMAU20551擁有較為完整的eps基因簇,長度為19 376 bp。從圖5可以看出,S. thermophilusIMAU20551的eps基因簇中,除假定蛋白外,與EPS有關(guān)的基因共有18個(gè),其中已確定的糖基轉(zhuǎn)移酶基因4個(gè),分別為epsE、eps1F、eps2F以及epsJ;同時(shí)還注釋得到負(fù)責(zé)調(diào)節(jié)EPS轉(zhuǎn)錄產(chǎn)生的基因epsA、epsB,控制EPS鏈長的基因epsC、epsD,控制磷酸化的epsP以及負(fù)責(zé)控制EPS輸出的基因wzx和epsX。另外還注釋到莢膜多糖生物合成蛋白、轉(zhuǎn)座酶、磷酸甘油酸變位酶以及磷酸酶等與EPS合成相關(guān)的功能基因。
圖5 S. thermophilus IMAU20551 eps基因簇Fig. 5 eps gene cluster of S. thermophilus IMAU20551
另外基因簇中還注釋出位于5'端的deo-D和位于3'端的orf 14.9,其中,orf 14.9與eps基因簇中其他基因轉(zhuǎn)錄方向相反。eps基因簇中大部分的功能基因都位于deo-D和orf 14.9之間,只有負(fù)責(zé)磷酸化的epsP和控制EPS輸出的epsX基因位于orf 14.9下游。多數(shù)S. thermophilus的eps基因簇均以orf 14.9結(jié)尾,但也有少部分菌株的eps基因簇結(jié)構(gòu)與本研究類似,例如S. thermophilusMR-1C的eps基因簇中,epsU、epsV以及epsX均位于orf 14.9之后[23]。
以S. thermophilusND 03、ASCC 1275以及IMAU20561作為對(duì)照,比較實(shí)驗(yàn)菌株與這3 株菌株eps基因簇的差異(圖6)。發(fā)現(xiàn)4 株S. thermophilus中的epsA、epsB、epsC、epsD以及epsE的位置和順序幾乎沒有改變,說明這幾個(gè)基因高度保守,穩(wěn)定出現(xiàn)在所有產(chǎn)eps的S. thermophilus基因組中。而注釋糖基轉(zhuǎn)移酶的基因在不同的菌株eps基因簇中分布的種類、數(shù)量、位置以及順序具有特異性。另外,與其他3 株S. thermophilus不同的是,ASCC 1275eps基因簇中出現(xiàn)了兩對(duì)epsC和epsD,這可能與該菌株同時(shí)產(chǎn)生黏液多糖和莢膜多糖有關(guān)[24]。
圖6 4 株S. thermophilus eps基因簇對(duì)比Fig. 6 Comparison of eps gene clusters from four S. thermophilus strains
通過NCBI BLAST比對(duì)S. thermophilusIMAU20551eps基因簇中功能性基因的同源性,結(jié)果如表3所示。
表3 S. thermophilus IMAU20551 eps基因簇功能Table 3 Functions of eps gene cluster from S. thermophilus IMAU20551
位于5'端的deo-D基因編碼嘌呤核苷酸化酶,參與糖核苷酸的合成與分解反應(yīng)[25],與S. thermophilusS9中的deo-D基因相似性極高,達(dá)99.58%。
epsA與epsB為eps基因簇中的保守基因,epsA編碼為LytR家族的轉(zhuǎn)錄調(diào)節(jié)因子,調(diào)控EPS產(chǎn)生,Dertli等[26]通過敲除L. johnsoniiFI9785中的epsA基因后發(fā)現(xiàn)細(xì)胞表面EPS-1和EPS-2完全缺失,表明epsA是EPS產(chǎn)生的積極調(diào)節(jié)因子。epsB編碼為酪氨酸蛋白磷酸酶,有研究發(fā)現(xiàn)乳酸乳球菌EPS合成受磷酸調(diào)節(jié)系統(tǒng)的控制,由epsB的非磷酸化形式驅(qū)動(dòng)[27]。本實(shí)驗(yàn)注釋得到的epsA和epsB與S. thermophilusACA-DC 2(GenBank:LT604076.1)的epsA和epsB的相似性較高,分別為98.39%和97.94%。
epsC和epsD負(fù)責(zé)控制EPS鏈長。epsC基因編碼酪氨酸蛋白激酶跨膜調(diào)節(jié)劑,有報(bào)告稱epsC可以與磷酸化激酶相互作用以控制EPS聚合物延伸鏈的長度[28]。本研究得到的epsC與S. thermophilusSTCH_20中的epsC具有較高的同源性;epsD編碼酪氨酸蛋白激酶,與S. thermophilusSTH_CIRM_30中epsD基因序列最為相似。有研究表明,epsD可以控制epsE的活性,從而影響EPS合成過程中一系列糖基轉(zhuǎn)移酶的表達(dá)[29]。
epsE、eps1F、eps2F以及epsJ均編碼糖基轉(zhuǎn)移酶,負(fù)責(zé)轉(zhuǎn)運(yùn)不同的糖核苷酸到脂質(zhì)攜帶體,在EPS合成過程中發(fā)揮重要功能。其中epsE編碼半乳糖基轉(zhuǎn)移酶,是S. thermophilusIMAU20551eps基因簇中第一個(gè)糖基轉(zhuǎn)移酶,稱為引發(fā)糖基轉(zhuǎn)移酶[30]。本實(shí)驗(yàn)中注釋出的epsE與S. thermophilusSTCH_15中引發(fā)糖基轉(zhuǎn)移酶的同源性最高,達(dá)到98.68%;eps1F編碼己糖基轉(zhuǎn)移酶,與S. thermophilusACA-DC 2中的epsF具有較高同源性(相似性98.93%);eps2F注釋得到編碼甘露糖基轉(zhuǎn)移酶,和基因epsJ均與L. plantarum中編碼糖基轉(zhuǎn)移酶的基因最為相似。Pandey等[31]發(fā)現(xiàn)糖基轉(zhuǎn)移酶可以具有廣泛的底物選擇范圍。因此,本實(shí)驗(yàn)中引發(fā)糖基轉(zhuǎn)移酶EpsE將UDP-半乳糖轉(zhuǎn)運(yùn)到與細(xì)胞膜相連的脂載體上,其他糖基轉(zhuǎn)移酶Eps1F、Eps2F、EpsJ負(fù)責(zé)將UDP-葡萄糖、dTDP-葡萄糖、dTDP-鼠李糖、UDP-N-乙酰葡萄糖胺和UDP-N-乙酰半乳糖胺等糖核苷酸轉(zhuǎn)按照一定的順序和規(guī)律運(yùn)到與脂載體相連的糖核苷酸上,不斷延伸形成脂載體焦磷酸化重復(fù)單元(Und-PP-糖重復(fù)單元)。
wzx編碼翻轉(zhuǎn)酶,負(fù)責(zé)將EPS的重復(fù)單元進(jìn)行易位,本實(shí)驗(yàn)中S. thermophilusIMAU20551基因組中注釋出的wzx基因序列與L. plantarumSHY 21-2中的寡糖翻轉(zhuǎn)酶家族所編碼的基因相似性較高(95.5%)。目前,已知的EPS生物合成模式有4種,分別為Wzx/Wzy-dependent途徑、ABC transporter-dependent途徑、Synthase-dependent途徑和使用單一蛋白酶進(jìn)行胞外合成途徑[32],除第四種途徑外,其他3種途徑均為HePS合成途徑。在IMAU20551的eps基因簇中注釋出Wzx翻轉(zhuǎn)酶,推測(cè)S. thermophilusIMAU20551合成EPS的模式為Wzx/Wzydependent途徑,與大多數(shù)乳酸菌HePS的合成模式相同。Wzx翻轉(zhuǎn)酶是O-抗原生物合成途徑的重要組成部分,負(fù)責(zé)寡糖O單元在革蘭氏陰性菌中跨膜轉(zhuǎn)運(yùn)[33]。Wzx/Wzydependent途徑是O-抗原生物合成途徑,同時(shí)也作為HePS合成模型。
orf 14.9注釋得到編碼VanZ家族蛋白,存在于大部分S. thermophilus eps基因簇的3'端,orf 14.9與富產(chǎn)EPS的S. thermophilusASCC 1275菌株中的orf 14.9基因同源性最高,為99.48%。Tyvaert等[34]對(duì)不含orf 14.9的S. thermophilusNST2280和A054進(jìn)行基因突變使之具有orf 14.9,對(duì)比后發(fā)現(xiàn)具有orf 14.9基因的突變體與原菌株的EPS產(chǎn)量差異不明顯,但生長參數(shù)有明顯區(qū)別,推測(cè)orf 14.9不影響S. thermophilusEPS的產(chǎn)量但與細(xì)胞生長有關(guān)。
epsP編碼組氨酸磷酸酶,負(fù)責(zé)EPS磷酸化,目前對(duì)epsP的相關(guān)研究較少,本實(shí)驗(yàn)中epsP與S. thermophilusASCC 1275中的epsP基因相似性較高,為96.49%。
epsX編碼蛋白為跨膜蛋白,負(fù)責(zé)將EPS轉(zhuǎn)運(yùn)至胞外。與S. thermophilusIMAU20551中epsX的基因序列最為接近的是S. thermophilusCNCM I-1630基因組中的epsX基因,相似性為99.65%。
通過實(shí)驗(yàn)所得結(jié)果,可以推測(cè)S. thermophilusIMAU20551 EPS的合成途徑(圖7)。果糖、蔗糖、纖維二糖以及甘露糖利用磷酸烯醇式丙酮酸-磷酸轉(zhuǎn)移酶系統(tǒng)轉(zhuǎn)變?yōu)榱姿峄癄顟B(tài)并進(jìn)入細(xì)胞,其中纖維二糖會(huì)轉(zhuǎn)化為6-磷酸纖維二糖,隨后在6-磷酸-β-葡萄糖苷酶的作用下轉(zhuǎn)換為6-磷酸葡萄糖,6-磷酸葡萄糖和6-磷酸果糖可以相互轉(zhuǎn)化,而6-磷酸蔗糖和6-磷酸甘露糖則可以單向轉(zhuǎn)化為6-磷酸果糖,6-磷酸果糖最終可以轉(zhuǎn)化為UDP-N-乙酰葡萄糖胺和UDP-N-乙酰半乳糖胺,6-磷酸葡萄糖則最終轉(zhuǎn)化為UDP-葡萄糖糖和dTDP-鼠李糖;乳糖、葡萄糖利用滲透酶進(jìn)入細(xì)胞內(nèi),乳糖被β-半乳糖苷酶分解為葡萄糖和半乳糖,一部分半乳糖會(huì)通過滲透酶的作用被排出細(xì)胞外,另一部分被醛糖1-差向異構(gòu)酶轉(zhuǎn)化為a-D-半乳糖,隨即進(jìn)行磷酸化成為1-磷酸半乳糖,1-磷酸半乳糖會(huì)通過Leloir途徑轉(zhuǎn)化為u1-磷酸-葡萄糖,也可以在UDP葡萄糖-半乳糖-1-磷酸尿苷酰轉(zhuǎn)移酶的作用下轉(zhuǎn)化為UDP-半乳糖,另外,UDP-半乳糖和UDP-葡萄糖也是可以相互轉(zhuǎn)化的。經(jīng)過轉(zhuǎn)化后的UDP-N-乙酰葡萄糖胺、UDP-N-乙酰半乳糖胺、dTDP-鼠李糖、dTDP-葡萄糖、UDP-葡萄糖以及UDP-半乳糖經(jīng)過糖基轉(zhuǎn)移酶的作用轉(zhuǎn)移到脂質(zhì)載體上成為Und-PP-糖重復(fù)單元,形成利用聚合酶將其聚合并形成特定的結(jié)構(gòu),再由翻轉(zhuǎn)酶和跨膜蛋白共同作用將EPS轉(zhuǎn)運(yùn)到細(xì)胞外。另外,根據(jù)圖7可以推測(cè)得出磷酸化作用是將糖分子轉(zhuǎn)化為核苷酸的基礎(chǔ)。
圖7 S. thermophilus IMAU20551 EPS合成途徑Fig. 7 Exopolysaccharide synthesis pathway of S. thermophilus IMAU20551
2.8.1 RNA提取結(jié)果
real-time PCR技術(shù)可以對(duì)基因的表達(dá)量進(jìn)行較為準(zhǔn)確的描述,已成為常用的基因表達(dá)檢測(cè)方法。S. thermophilusIMAU20551 RNA提取后質(zhì)檢結(jié)果如表4、圖8所示。所有樣品RNA條帶清晰明亮,無色素、蛋白、糖類等雜質(zhì)污染,無DNA污染,28/23S亮度大于18/16S,OD260/280≥1.8,OD260/230≥1.0,質(zhì)量濃度≥400 ng/μL,總量≥4 μg,可以進(jìn)行后續(xù)實(shí)驗(yàn)。
表4 S. thermophilus IMAU20551總RNA提取結(jié)果Table 4 Amount of total RNA extracted from S. thermophilus IMAU20551
圖8 S. thermophilus IMAU20551 RNA瓊脂糖凝膠電泳結(jié)果Fig. 8 Electrophoretogram of RNA from S. thermophilus IMAU20551
2.8.2 real-time PCR分析結(jié)果
對(duì)S. thermophilusIMAU20551eps基因簇中的epsA、epsB、epsE、eps1F、eps2F以及epsX的相對(duì)表達(dá)量進(jìn)行測(cè)定,結(jié)果如圖9所示??梢钥闯觯齟ps2F、epsJ外,其他被測(cè)基因均在6 h達(dá)到最大表達(dá)量,說明在菌株生長到6 h是菌株代謝EPS的關(guān)鍵階段;12 h時(shí),eps2F、epsJ的表達(dá)量有一定增長,eps2F的表達(dá)量達(dá)到最大(1.022),但其余基因的表達(dá)量均有不同程度的下降,說明這段時(shí)間內(nèi)菌株仍繼續(xù)生產(chǎn)EPS,但合成速率減緩;菌株培養(yǎng)18 h,epsE、eps1F和負(fù)責(zé)轉(zhuǎn)運(yùn)EPS的epsX相對(duì)表達(dá)量出現(xiàn)回升,基因epsJ表達(dá)量繼續(xù)增長,達(dá)到峰值(0.576),推測(cè)此時(shí)S. thermophilusIMAU20551正處于平臺(tái)期,在不間斷產(chǎn)出EPS的同時(shí)也產(chǎn)出其他豐富的次級(jí)代謝物;除epsA外,其他被測(cè)基因在菌株生長到24 h相對(duì)表達(dá)量繼續(xù)下降,說明24 hS. thermophilusIMAU20551已經(jīng)處于衰亡期,基因的表達(dá)能力下降,無法產(chǎn)生更多的EPS或其他代謝產(chǎn)物。
圖9 eps基因簇部分基因的相對(duì)表達(dá)量Fig. 9 Relative expression of key genes in the eps gene cluster
大部分S. thermophilus的基因組大小在1.85 Mbp左右,編碼大約2 000個(gè)基因,涉及菌株生長代謝等各個(gè)方面[4]。S. thermophilusEPS的生物合成是由eps基因簇調(diào)控的。王俊滬等[35]認(rèn)為S. thermophiluseps基因簇幾乎全部位于染色體DNA上,在傳代過程中eps基因簇丟失的概率較低,保證了菌株產(chǎn)EPS的穩(wěn)定性。而其他乳酸菌eps基因簇大多位于質(zhì)粒上,在傳代或進(jìn)化過程中容易出現(xiàn)質(zhì)粒丟失現(xiàn)象從而失去產(chǎn)EPS能力。通過基因組重測(cè)序和生物信息學(xué)分析,本實(shí)驗(yàn)在S. thermophilusIMAU20551染色體DNA上發(fā)現(xiàn)了完整的eps基因簇,該基因簇共有18個(gè)基因,全長19 376 bp,負(fù)責(zé)調(diào)控EPS生物合成、輸出以及聚合等過程。
本實(shí)驗(yàn)利用real-time PCR對(duì)S. thermophilusIMAU20551eps基因簇中關(guān)鍵基因的相對(duì)表達(dá)量進(jìn)行了檢測(cè)分析,之后將繼續(xù)利用基因敲除及回補(bǔ)實(shí)驗(yàn)驗(yàn)證eps基因簇表達(dá)能力的準(zhǔn)確性,以及基因之間的互作關(guān)系,另外,有部分研究認(rèn)為eps基因簇中編碼糖基轉(zhuǎn)移酶的基因數(shù)量會(huì)影響菌株的EPS產(chǎn)量,后續(xù)實(shí)驗(yàn)也將利用基因克隆或基因過表達(dá)實(shí)驗(yàn)等驗(yàn)證eps基因簇中糖基轉(zhuǎn)移酶數(shù)量以及與糖核苷酸代謝相關(guān)酶類與EPS產(chǎn)量之間的聯(lián)系。
利用Ilummina HiSeq、SOPAdenovo、prokka等對(duì)產(chǎn)EPS的S. thermophilusIMAU20551基因組進(jìn)行測(cè)序、組裝及注釋后發(fā)現(xiàn),S. thermophilusIMAU20551基因組中各代謝通路基因豐度較高,且擁有一條完整的eps基因簇,涵蓋負(fù)責(zé)調(diào)控、組裝、轉(zhuǎn)運(yùn)以及輸出EPS。real-time PCR結(jié)果顯示,S. thermophilusIMAU20551eps基因簇中的關(guān)鍵基因在菌株各個(gè)生長時(shí)段均可順利表達(dá),且在菌株培養(yǎng)6 h時(shí)eps基因簇中的部分基因表達(dá)量達(dá)到最高,是菌株代謝產(chǎn)生EPS的關(guān)鍵性階段。