何 苗,趙雨晴,李居行,葛佳琪,陳盼婷,應(yīng) 欣,張連慧,王昌祿,李貞景,郭慶彬,劉歡歡,*
(1.天津科技大學(xué)食品科學(xué)與工程學(xué)院,天津 300457;2.中糧營養(yǎng)健康研究院有限公司,北京 102209)
彎曲乳桿菌(Latilactobacillus curvatus)和清酒乳桿菌(L.sakei)同為厚壁菌門、乳桿菌目、乳桿菌科、乳桿菌屬中的兩種益生菌,近年來因其優(yōu)良的發(fā)酵性能和對人體健康的益處而備受關(guān)注。L.curvatus最初于1903年由Troili-Petersson[1]發(fā)現(xiàn)并命名為Bacterium curvatum;1965年由Abo-Elnaga等[2]更名為Lactobacillus curvatus;2020年,根據(jù)Zheng Jinshui等[3]的研究,通過對16S rRNA基因序列相似性、基因組間平均核苷酸同一性(average nucleotide identity,ANI)以及代謝、生態(tài)和功能特征的分析,將其更新為Latilactobacillus curvatus。而L.sakei于1934年由Katagiri等[4]從清酒中分離并命名為Lactobacillus sake;1996年Torriani等[5]根據(jù)十二烷基硫酸鈉-聚丙烯酰胺凝膠電泳顯示的蛋白質(zhì)分離模式,將其分為兩個亞群并總結(jié)了其生理生化特性的異同;2020年Zheng Jinshui等[3]將其名稱更新為Latilactobacillus sakei。形態(tài)學(xué)上,L.curvatus與L.sakei同為革蘭氏陽性菌,無芽孢,菌體桿狀,一般形成不透明乳白色凸起菌落。
在早期對菌株表型的研究中,L.curvatus和L.sakei通常被分為同一亞組[6]。在后續(xù)的研究中,L.curvatus與L.sakei又以耐鹽[7-8]、耐酸[9-10]以及耐低溫[8-9]聞名,同時因其優(yōu)異的細菌素生產(chǎn)能力而受到大量關(guān)注。除此之外,由于極其相似的生理生化特性及生存環(huán)境,二者在應(yīng)用方面也廣泛重合[11-12],在食品工業(yè)中常用于肉制品與蔬菜發(fā)酵[13],其抑菌性能也被應(yīng)用于食品包裝等領(lǐng)域[12,14]。L.curvatus與L.sakei還具有多種益生菌功能,如調(diào)節(jié)免疫[15]、緩解炎癥[16]、改善代謝綜合征[17]以及緩解肥胖[18]等。在代謝方面,L.curvatus與L.sakei也具有相似之處,例如,兩者均可發(fā)酵葡萄糖與蔗糖[19]、分解游離氨基酸并產(chǎn)生生物胺,以及對惡劣環(huán)境表現(xiàn)出類似的耐受性。為區(qū)分這兩類菌,Berthier等[20]通過隨機擴增多態(tài)性DNA標記分析以及生化分析,將精氨酸的水解與蜜二糖的發(fā)酵判定為區(qū)分L.curvatus與L.sakei的重要標準;而Petrick等[21]開發(fā)了一種DNA探針Lc45,其對L.curvatus具有一定的特異性,從而能夠?qū)删N區(qū)分。
隨著基因組測序水平的提高,基于基因組的系統(tǒng)發(fā)育分析及物種鑒定越來越受到重視[22]?;蚪M測序相較于傳統(tǒng)的單位點測序顯著降低了系統(tǒng)發(fā)育分析中位點突變帶來的隨機誤差,同時能夠使人們?nèi)娴乩斫馕⑸锏臓I養(yǎng)特征、致病性、宿主特異性、次級代謝產(chǎn)物合成等表型變異的內(nèi)在機制[23]。一個物種內(nèi)的基因組或一個分支內(nèi)的所有菌株通常具有一個核心/保守組分以及一組可變的遺傳物質(zhì),在個體或種群之間稱為“泛基因組”[24]。核心基因組包含存在于所有菌株中的序列,并且通常與物種的生物功能和關(guān)鍵表型特征相關(guān)??勺?附屬基因組包含一個菌株或菌株子集所特有的序列,且與物種對特定環(huán)境的適應(yīng)性或個體獨特的生物特征有關(guān)[25]。因此,構(gòu)建微生物泛基因組有助于更好地了解該物種的群體特征和個體遺傳變異之間的關(guān)系。
基于此,本研究將對NCBI中收錄的19 個L.curvatus及40 個L.sakei公開可用的基因組信息進行比較分析,通過ANI以及基因組共線性分析對菌株進行區(qū)分;并通過鑒定直系同源基因家族從而構(gòu)建兩株菌的泛基因組,最終在基因組水平上闡釋兩種菌株之間的代謝差異。通過比較基因組水平的差異,對二者表型中的異同進行解析,為這兩類菌的分類學(xué)研究、生理生化分子遺傳機制研究以及工業(yè)應(yīng)用方面奠定理論基礎(chǔ)。
本研究所采用的數(shù)據(jù)均來自NCBI基因組數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/datasets/genomes)。通過檢索Latilactobacillus curvatus和L.sakei,篩選并下載組裝完整且被標識為“reference”的基因組序列。
1.2.1 基因組的ANI計算及基因組共線性分析
ANI是在核苷酸水平比較兩個基因組親緣關(guān)系的指標。本研究采用FastANI[26]計算基因組間的ANI數(shù)值,其中,參數(shù)fragLen設(shè)定為500 bp。之后采用Chiplot在線工具繪制A N I 層級聚類樹及熱圖(https://www.chiplot.online)?;蚪M共線性分析采用Minimap2[27],參數(shù)選擇-c、-cx和asm5,之后使用R語言包pafr對結(jié)果進行可視化。
1.2.2 直系同源基因的識別與計算
直系同源基因為共同祖先基因進化后在不同物種中具有相同功能的一類同源基因。直系同源基因的識別流程:1)將菌株基因組序列文件以FASTA格式輸入Prokka[28],進行結(jié)構(gòu)注釋,選擇默認參數(shù);2)將獲得的gff文件輸入Roary[29]軟件,該軟件從基因組注釋文件中提取編碼區(qū),并將其轉(zhuǎn)換為蛋白質(zhì)序列,過濾去除部分不完整序列。同時,使用BLASTP(https://blast.ncbi.nlm.nih.gov/Blast.cgi)對其序列進行相似性(默認參數(shù)為95%)比對,并采用隱馬爾可夫算法將蛋白序列進行聚類,生成直系同源基因家族。
1.2.3 泛基因組分析
根據(jù)Heap’s Law(即隨著更多基因組的加入,物種群體的核心基因組縮小,而泛基因組增大)[30],本研究將基因家族總基因數(shù)設(shè)為y、基因組數(shù)設(shè)為x,采用Origin軟件對其關(guān)系進行擬合,公式如下:y=AxB+C;對于核心基因組部分的基因家族總數(shù),設(shè)基因組數(shù)為x,基因家族數(shù)為y,擬合公式如下:y=Aexp(Bx)+C。
1.2.4 核心基因組功能分析
利用ProCAST[31]管路對核心基因組蛋白序列,進行直系同源集(Clusters of Orthologous Groups,COG)、京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)、基因本體論(Gene Ontology,GO)、碳水化合物活性酶(Carbohydrate-Active Enzyme,CAZyme)等功能注釋、匯總及可視化分析,相似性閾值設(shè)定為40%。
1.2.5 次級代謝產(chǎn)物分析
采用antiSMASH[32]本地化軟件流程,對基因組注釋產(chǎn)生的gbk文件進行次級代謝產(chǎn)物基因簇挖掘,參數(shù)采用--cb-general、--cb-subclusters、--cb-knownclusters、--asf以及--pfam2go。
1.2.6 耐藥性分析
采用ABRicate流程(Seemann T,Abricate,https://github.com/tseemann/abricate),整合CARD、NCBI AMRFinderPlus數(shù)據(jù)庫,對基因組注釋產(chǎn)生的所有蛋白編碼序列進行抗生素耐藥性注釋。并采用IslandViewer 4(https://www.pathogenomics.sfu.ca/islandviewer)對抗生素耐受菌株的基因組進行基因組島分析,揭示耐藥性基因的來源。
選擇19 株L.curvatus和40 株L.sakei的完整組裝基因組序列。根據(jù)圖1結(jié)果,L.curvatus的基因組大小在1.849~2.176 Mb之間,平均大小為1.988 Mb,GC含量為41.7%~42.1%,編碼基因數(shù)為1 917~2 254 個。而L.sakei的基因組大小在1.825~2.119 Mb之間,平均大小為2.005 Mb,GC含量為41.3%~41.41%,編碼基因數(shù)為2 001~2 173 個。
圖1 L.curvatus與L.sakei基本信息及ANI熱圖Fig.1 Basic information and ANI heatmap of the genomes of L.curvatus and L.sakei
如圖1所示,19 株L.curvatus與40 株L.sakei被清晰地劃分為兩個獨立分支。分支內(nèi)基因組之間的ANI值大于95%,而分支之間的兩個基因組的ANI值小于85%。值得注意的是,L.sakeiDS4(編號GCF_002953655.1)與其他L.sakei基因組的ANI值明顯低于定義同一物種的95%分界值[33],表明該菌株可能被錯誤地分類,因此在后續(xù)分析中將剔除該菌株。
L.curvatus與L.sakei物種內(nèi)的基因組染色體有高度同源性(圖2A、B),但物種間的比對結(jié)果顯示(圖2C),大片段同源基因較少且位置重合度低。通過基因組共線性分析可清晰判斷L.curvatus與L.sakei在基因組的序列結(jié)構(gòu)上表現(xiàn)出巨大差異,染色體同源性較弱。
圖2 基因組共線性分析Fig.2 Genome collinearity analysis
綜上所述,ANI與基因組共線性分析可作為區(qū)分這兩類菌株的重要指標。
分別對L.curvatus與L.sakei兩個種群的基因組進行直系同源基因家族的識別,并構(gòu)建泛基因組。如圖3所示,泛基因組被定義為基因家族的總和,而核心基因家族被定義為存在于所有菌株個體中的保守序列基因家族。對于這兩個物種,隨著基因組數(shù)量的增加,泛基因組中包含的基因家族總數(shù)可以通過以下擬合公式描述:L.curvatus:y=822x0.6+1 174(R2=0.992)(圖3A);L.sakei:y=856x0.45+1 047(R2=0.969)(圖3C)。而核心基因家族的數(shù)量變化可以通過以下擬合公式描述:L.curvatus:y=1 496exp(-0.693 2x)+1 237(R2=0.956)(圖3A);L.sakei:y=859exp(-0.158x)+1 091(R2=0.953)(圖3C)。
圖3 L.curvatus與L.sakei種群的基因家族分布Fig.3 Gene family distribution of L.curvatus and L.sakei
根據(jù)擬合方程與圖3A、C可知,新基因組的加入導(dǎo)致L.curvatus與L.sakei總基因家族數(shù)呈指數(shù)型增長趨勢,泛基因組呈現(xiàn)開放性特征,而核心基因家族在不斷加入新的基因組后呈現(xiàn)平緩狀態(tài),數(shù)量穩(wěn)定在1 237 個及1 091 個。圖3B、D顯示,隨著基因組數(shù)目的增加,L.curvatus與L.sakei新基因家族的數(shù)目呈下降趨勢,但并未趨向零,且菌株獨有的基因家族數(shù)目呈持續(xù)上升趨勢,這可能是造成泛基因組開放性的原因。開放的泛基因組意味著該物種具有較強的獲得外源基因的能力,例如通過質(zhì)粒載體或基因的水平轉(zhuǎn)移等,實現(xiàn)較強的環(huán)境適應(yīng)性[34]。
種群核心基因組的序列保守性通常與基礎(chǔ)代謝和生物功能密切相關(guān),基于此,本研究對兩個物種的核心基因組部分進行COG、KEGG以及GO注釋,以揭示物種核心基因組的功能特征。
2.5.1 COG注釋
L.curvatus與L.sakei的分別注釋了619、613 個基因,占核心基因組的63.88%、71.78%。如圖4所示,除去一般功能預(yù)測(R)及未知功能(S),兩個物種的核心基因組在氨基酸轉(zhuǎn)運與代謝(E)、翻譯、核糖體結(jié)構(gòu)與生物合成(J)、轉(zhuǎn)錄(K)及復(fù)制、重組與修復(fù)(L)的保守基因家族較多。
圖4 L.curvatus與L.sakei COG功能注釋Fig.4 COG functional annotation of L.curvatus and L.sakei
2.5.2 KEGG功能注釋
L.curvatus與L.sakei分別注釋了277、271 個基因,占各自核心基因組的28.59%、31.73%。如圖5所示,氨?;?tRNA生物合成(A)、肽聚糖的生物合成(B)以及嘧啶代謝(C)等在維持菌體蛋白及核酸代謝、細胞壁合成等基礎(chǔ)代謝方面具有高度的保守性。而L.curvatus中的甘油酯代謝途徑(F)、苯丙氨酸、酪氨酸和色氨酸生物合成途徑(I)與丙氨酸、天冬氨酸和谷氨酸代謝途徑(J)以及L.sakei中的脂肪酸生物合成途徑(K)、磷酸戊糖途徑(L)、?;撬岷痛闻;撬岽x途徑(M)方面表現(xiàn)出物種特異性。
圖5 L.curvatus與L.sakei KEGG功能注釋Fig.5 KEGG functional annotation of L.curvatus and L.sakei
2.5.3 GO功能注釋分析
如圖6所示,L.curvatus與L.sakei分別注釋了636、608 個基因,占核心基因組的65.63%、71.19%。涉及生物過程的轉(zhuǎn)錄調(diào)控、跨膜運輸、氧化還原過程、蛋白水解作用等,在L.curvatus與L.sakei種群中均具有高度保守的基因序列。而L.curvatus種群在涉及硫胺生物合成的途徑中具備獨有的保守基因家族。在細胞組成中,L.curvatus與L.sakei在膜組分、膜、細胞質(zhì)、核糖體、DNA聚合酶III復(fù)合物、質(zhì)膜組分等方面均具有保守基因序列。在分子功能上,除共有的ATP結(jié)合、DNA結(jié)合、催化活性等保守基因外,L.curvatus擁有ATP酶活性、蛋白質(zhì)結(jié)合相關(guān)的保守基因,L.sakei具有甲基轉(zhuǎn)移酶活性以及核苷酸結(jié)合相關(guān)保守基因。
圖6 L.curvatus與L.sakei GO功能注釋Fig.6 GO functional annotation of L.curvatus and L.sakei
由上述COG、KEGG、GO功能注釋可知,核心基因組,即每個種群包含的保守基因序列,大部分涉及該物種的初級代謝途徑或模塊,少量涉及其他途徑。泛基因組的核心功能分析揭示了兩個種群保守序列的功能特征,而作為食品發(fā)酵劑與腸道益生菌,L.curvatus與L.sakei的個體分析,如碳水化合物利用相關(guān)酶類(CAZyme)、抗生素耐藥性及次級代謝產(chǎn)物等,則是體現(xiàn)菌株差異與工業(yè)應(yīng)用潛力的重要指標?;诖?,本研究鑒定了所有58 個菌株基因組中的直系同源基因家族,并對其進行了缺失-存在變異分析及功能挖掘,同時,也針對基因組中潛在的次級代謝產(chǎn)物基因簇等信息進行了匯總分析。
2.6.1 CAZyme編碼基因分析
如圖7所示,L.curvatus與L.sakei的基因組分別平均包含45、44 個不同的CAZymes基因,分布在糖苷水解酶(glycoside hydrolases,GH)、糖基轉(zhuǎn)移酶(glycoside transferases,GT)、糖結(jié)合模塊(carbohydrate binding modules,CBM)、碳水化合物酯酶(carbohydrate esterases,CE)以及輔助活性(auxiliary activities,AA)蛋白家族中(圖7A、B)。
圖7 CAZyme基因家族在L.curvatus(A)及L.sake(B)個體中的占比及分布匯總(C)Fig.7 CAZyme family distribution in L.curvatus (A) and L.sakei (B) and CAZyme encoding gene distribution (C)
GH是乳酸菌分解和代謝淀粉及膳食纖維類多糖的關(guān)鍵酶。其中,GH1、GH25及GH73家族在兩個物種中的基因拷貝數(shù)均較高(圖7C)。GH1家族中最常見的酶為可誘導(dǎo)降解纖維二糖的β-葡萄糖苷酶(EC 3.2.1.21),其屬于纖維素酶類,能夠水解結(jié)合于末端非還原性的β-D-葡萄糖鍵,同時釋放出β-D-葡萄糖和相應(yīng)的配基,在膳食纖維的降解中發(fā)揮重要作用,還可作為風(fēng)味酶抑制劑參與到果汁與果酒的生產(chǎn)[35];豆奶中存在該酶能夠轉(zhuǎn)化高活性的大豆異黃酮苷元,有預(yù)防癌癥的功效[36]。GH25及GH73家族都包含溶菌酶(EC 3.2.1.17),一類能水解細菌中黏多糖的堿性酶。溶菌酶可以通過水解肽聚糖導(dǎo)致細胞壁破裂,從而使細菌溶解,還可以與帶負電荷的病毒蛋白結(jié)合形成復(fù)合體使病毒失活。由于對肽聚糖的敏感性,溶菌酶對革蘭氏陽性菌如藤黃微球菌、枯草桿菌或溶壁微球菌等破壞力度更強[37]。這賦予了L.curvatus與L.sakei一定的抑菌潛力。
在GH2、GH32家族中,多數(shù)L.sakei比L.curvatus具有更高的基因拷貝數(shù)(圖7C)。GH2家族中最重要成員為β-半乳糖苷酶(EC 3.2.1.23),它是以母乳/奶粉為主要營養(yǎng)來源的嬰幼兒體內(nèi)最重要的消化酶,通過解決人體乳糖不耐受發(fā)揮益生活性[38],且在食品工業(yè)中可用于生產(chǎn)低聚半乳糖。而GH32家族中的蔗糖酶(EC 3.2.1.26)主要用于水解蔗糖生成果糖與葡萄糖,但該家族只存在于L.curvatus的部分菌株中。
在GH4及GH65家族中,L.curvatus比L.sakei具有更多基因拷貝(圖7C)。GH4家族中存在可降解木聚糖類半纖維素成分的α-葡萄糖醛酸酶(EC 3.2.1.139),這可能是其多用作蔬菜發(fā)酵的原因之一。GH65家族的麥芽糖磷酸化酶(EC 2.4.1.8)能夠分解代謝麥芽糖,表明L.curvatus對于麥芽糖代謝潛力更大。
2.6.2 抗生素耐藥性基因注釋
如表1所示,只有3 株菌株擁有抗生素耐藥性基因,表明大部分L.curvatus與L.sakei中抗生素耐藥性風(fēng)險較低。其中,L.curvatusZJUNIT8(GCF_003254785.1)基因組中存在lnuA基因。lnuA編碼一種質(zhì)粒介導(dǎo)的核苷酸轉(zhuǎn)移酶[39],可抑制林可酰胺在機體內(nèi)的作用。林可酰胺(如林可霉素、克林霉素)通過抑制轉(zhuǎn)肽酶反應(yīng)來抑制肽鏈的早期延伸,作用類似于大環(huán)內(nèi)酯類。此外,在L.sakeiC22G(GCF_022559165.1)及L.sakeiCBA3635(GCF_014081765.1)中發(fā)現(xiàn)了tetM基因,其編碼一種核糖體保護蛋白,使微生物對四環(huán)素、強力霉素及米諾環(huán)素產(chǎn)生耐藥性[40]。
表1 L.curvatus與L.sakei抗生素耐藥性基因分布Table 1 Distribution of antibiotic resistance genes in L.curvatus and L.sakei
對上述基因組進一步分析發(fā)現(xiàn),L.curvatusZJUNIT8中的lnuA基因與L.sakeiCBA3635中的tetM基因分別來自于質(zhì)粒pnunamed3(NCBI編號:CP029969.1)與質(zhì)粒pCBA3635;而L.sakeiC22G(GCF_022559165.1)菌株中的tetM基因則來自其基因組島(染色體位置1 829 586~1 862 258),且該基因組島存在接合轉(zhuǎn)移蛋白編碼基因TraG以及轉(zhuǎn)座子Tn552 DNA-轉(zhuǎn)化酶基因bin3等序列,表明tetM可能源于外源轉(zhuǎn)座子的接合轉(zhuǎn)移。
2.6.3 其他功能差異分析
在耐酸相關(guān)的基因中,乳酸菌中的arcA基因可編碼精氨酸脫亞胺酶(arginine deiminase,ADI),該酶通過降解L-精氨酸,生成L-瓜氨酸、NH3和ATP,從而提高胞內(nèi)pH值,使菌株產(chǎn)生耐酸性。該基因在39 株L.sakei中全部存在,并且為L.sakei菌株特有。ADI途徑不僅為乳酸菌在酸性環(huán)境下的生存提供了分子保障,也提供了將精氨酸轉(zhuǎn)化為能源的可能,使其在精氨酸含量高的基質(zhì)(如肉類)中更具備代謝優(yōu)勢,這可能也是L.sakei更多應(yīng)用于肉類發(fā)酵的機制之一。與之相比,19 株L.curvatus中均發(fā)現(xiàn)了L-絲氨酸脫水酶編碼基因sdhA和sdhB,其可將絲氨酸轉(zhuǎn)化為丙酮酸和NH3;其中17 個菌株含有鳥嘌呤脫氨酶基因guaD,可將鳥嘌呤轉(zhuǎn)化為黃嘌呤和NH3。上述基因的存在,使得L.curvatus在ADI途徑缺失的情況下同樣具備抗酸能力。事實上,已有研究證實ADI途徑為區(qū)分L.curvatus和L.sakei的重要標志[41]。
而在L.curvatusKG6(GCF_002224505.1)及L.sakeiWiKim0074(GCF_003288235.1)中也發(fā)現(xiàn)了基因gadB,其編碼的谷氨酸脫羧酶可裂解谷氨酸生成γ-氨基丁酸(γ-aminobutyric acid,GABA)。GABA是一種可以調(diào)節(jié)菌體酸性pH值的非蛋白質(zhì)氨基酸,也是一種重要的中樞神經(jīng)系統(tǒng)抑制性神經(jīng)遞質(zhì),具備改善機體睡眠質(zhì)量、降血壓等生理功效[41]。已有研究證實個別L.curvatus與L.sakei菌株能夠產(chǎn)生GABA,如L.curvatusK285[42]、L.sakeiA156[43]等,有學(xué)者分離出能將谷氨酸鈉100%轉(zhuǎn)化為GABA的菌株L.sakeiB2-16[44]。GABA的產(chǎn)生可賦予菌株更強的耐酸性和益生活性,在發(fā)酵食品中表現(xiàn)出較強的競爭力。
此外,本研究還發(fā)現(xiàn),冷休克蛋白相關(guān)基因CspA、CspB及CspC存在于全部L.curvatus與L.sakei菌株中。冷休克蛋白作為RNA分子伴侶與mRNA結(jié)合從而維持細胞活力,在菌體適應(yīng)低溫環(huán)境和增強抗凍能力方面發(fā)揮重要作用。其中,CspA蛋白可在短時間內(nèi)減輕細胞的冷凍損傷;CspB主要用于維持菌體生長、抵御低溫及冷凍傷害并且可以提高穩(wěn)定期菌體存活率;而CspC則可提高冷凍條件下菌體的生長恢復(fù)能力[45]。上述基因的存在能夠幫助L.curvatus與L.sakei在冷凍干燥相關(guān)的工藝過程中保持較高菌體活力。
如圖8所示,次級代謝基因簇的分布呈菌株特異性。其中,L.sakeiFLEC01(GCF_900234345.1)菌株中發(fā)現(xiàn)的RiPPs類型的基因簇序列與凝結(jié)素合成序列相似度為60%。凝結(jié)素作為一種對蛋白酶敏感的抗菌物質(zhì),對指示細胞表現(xiàn)出較高的殺菌和溶菌作用[46]。同時,在L.sakeiFAM18311(GCF_002224565.1)菌株中發(fā)現(xiàn)的基因簇與細菌素lactocin S合成序列相似度達78%。lactocin S是一種含有大量疏水氨基酸殘基的多肽,屬于I型細菌素,主要通過改變細胞膜通透性起到抑菌與緩慢殺菌作用[47]。其他基因簇,如亮氨酸氨基肽酶、環(huán)內(nèi)酯自身誘導(dǎo)肽和III型聚酮合成酶類產(chǎn)物基因簇,與李斯特溶血素S、胞外多糖類、抗菌肽CRL1328、雜多糖、S層聚糖以及卡奇霉素產(chǎn)物基因簇,在個別基因組中有發(fā)現(xiàn),但與參考序列一致性得分較低(≤40%)。
圖8 L.curvatus與L.sakei次級代謝產(chǎn)物基因簇分布Fig.8 Distribution of gene clusters encoding secondary metabolites in L.curvatus and L.sakei
本研究采用比較基因組學(xué)技術(shù)對L.curvatus和L.sakei基因組進行ANI和全基因組共線性分析,對這兩類菌株進行了物種區(qū)分。泛基因組構(gòu)建結(jié)果顯示,兩個物種的泛基因組呈現(xiàn)開放性特征,兩個種群的核心基因組主要涉及菌體基礎(chǔ)代謝功能。在次級代謝產(chǎn)物基因簇和耐藥性分析中,部分L.sakei基因組中發(fā)現(xiàn)了抑菌相關(guān)的lactocin S和凝結(jié)素基因簇,而抗生素耐藥性基因只存在于3 個菌株中,且來自橫向轉(zhuǎn)移。L.curvatus和L.sakei均含有廣泛的GH類編碼基因,可能在分解和代謝膳食纖維類多糖、乳糖和木質(zhì)纖維素中發(fā)揮重要作用。此外,L.sakei特有的ADI途徑和L.curvatus的絲氨酸脫水途徑以及鳥嘌呤脫氨酶途徑揭示了兩類菌不同的耐酸機制,而冷應(yīng)激蛋白相關(guān)基因的發(fā)現(xiàn)也賦予了兩類菌株良好的冷加工特性。本研究為這兩種重要乳酸菌的分類、生理生化分子遺傳機制研究以及工業(yè)應(yīng)用提供了基礎(chǔ)。