王珊珊,石繼春,杜宗利,石剛,龍新星,徐穎華,葉強(qiáng)
·論著·
乳酶生生產(chǎn)用菌種的全基因組序列分析研究
王珊珊*,石繼春*,杜宗利,石剛,龍新星,徐穎華,葉強(qiáng)
102629 北京,中國(guó)食品藥品檢定研究院衛(wèi)生部生物技術(shù)產(chǎn)品檢定方法及其標(biāo)準(zhǔn)化重點(diǎn)實(shí)驗(yàn)室
了解我國(guó)乳酶生的生產(chǎn)用菌種全基因組分子特征。
將乳酶生的生產(chǎn)用菌種屎腸球菌 CMCC32901 培養(yǎng)后,依次進(jìn)行形態(tài)觀(guān)察、生化鑒定與 16S rRNA基因序列測(cè)定,并應(yīng)用高通量測(cè)序技術(shù),對(duì)生產(chǎn)用菌種 CMCC32901 進(jìn)行全基因組序列測(cè)定,分析基因組基本特征、基因功能、同源性及致病性。
分析結(jié)果顯示,發(fā)現(xiàn) CMCC32901 菌株與 NCBI 數(shù)據(jù)庫(kù)中收錄的不同屎腸球菌菌株的 16S rRNA基因序列相似度大于 99.5%,與其他腸球菌菌株之間的 16S rRNA 基因序列相似度均大于 92.0%。屎腸球菌 CMCC32901 染色體全基因組序列全長(zhǎng)為 2 394 726 bp,平均 GC 含量為 39.1%,共含有 2718 個(gè)基因,其中具有 COG 功能 2059 個(gè),參與 KEGG 代謝通路 1402 個(gè)。同源性分析顯示其基因組中編碼 2589 個(gè)屎腸球菌特異性蛋白。細(xì)菌的致病性預(yù)測(cè)分析發(fā)現(xiàn)在 CMCC32901 菌株中發(fā)現(xiàn) 5 種對(duì)人潛在致病性相關(guān)蛋白。
首次獲得了我國(guó)乳酶生生產(chǎn)用菌種——屎腸球菌 CMCC32901 全基因組的基本特征,為后續(xù)乳酶生的生產(chǎn)工藝優(yōu)化和生產(chǎn)用菌種的質(zhì)量控制奠定了基礎(chǔ)。
乳酶生; 屎腸球菌; 生產(chǎn)用菌種; 全基因組序列; 質(zhì)量控制
乳酶生是一種含有屎腸球菌的傳統(tǒng)活菌制劑,主要利用其所含的活菌可在宿主腸道內(nèi)分解糖類(lèi)生產(chǎn)乳酸,使腸道內(nèi)酸度增高,從而抑制腸道內(nèi)其他一些菌群的生長(zhǎng)繁殖。在臨床上乳酶生作為助消化藥,廣泛用于腸內(nèi)異常發(fā)酵引起的腸脹氣,消化不良引起的腹瀉等癥狀[1]。在國(guó)家藥監(jiān)局?jǐn)?shù)據(jù)庫(kù)查詢(xún)發(fā)現(xiàn),當(dāng)前在全國(guó)范圍內(nèi)有近 20 家生產(chǎn)企業(yè)獲得批準(zhǔn)文號(hào) 36個(gè),生產(chǎn)不同劑型的乳酶生。
生產(chǎn)用菌種是藥品研究、生產(chǎn)和檢定的物質(zhì)基礎(chǔ),其質(zhì)量直接與藥物終產(chǎn)品安全和有效性密切相關(guān)[2]。目前在 2020 版《中國(guó)藥典》二部“乳酶生”專(zhuān)論和三部“微生態(tài)活菌制品總論”中對(duì)乳酶生的生產(chǎn)用菌種質(zhì)量控制主要包括形態(tài)觀(guān)察、培養(yǎng)特性、產(chǎn)酸活性和安全性等比較傳統(tǒng)的方法,缺乏菌株水平的分子特征方面的評(píng)價(jià)[3-4]。此外,我國(guó)乳酶生的生產(chǎn)用菌種 CMCC32901(原編號(hào):140623)自 20 世紀(jì) 50 年代用于生產(chǎn)以來(lái),隨著細(xì)菌鑒定水平提高以及命名規(guī)范化,從最初菌種名稱(chēng)——乳酸腸球菌,歷經(jīng)多次命名的變化,確定為屎腸球菌[5]。因此,基于藥品生產(chǎn)用菌種的菌株溯源、制劑工藝優(yōu)化以及檢定等方面考慮,進(jìn)一步加強(qiáng)藥品生產(chǎn)用菌種的質(zhì)量控制,了解該生產(chǎn)用菌種菌株的分子特征和遺傳背景就顯得尤為重要。本研究首次應(yīng)用高通量測(cè)序技術(shù),對(duì)乳酶生的生產(chǎn)用菌種 CMCC32901 進(jìn)行全基因組序列測(cè)定,分析其基因組基本特征、基因功能、同源性及致病性,為后續(xù)的藥物質(zhì)量控制研究奠定基礎(chǔ)。
1.1.1 菌株 屎腸球菌生產(chǎn)用菌種 CMCC32901 來(lái)源于中國(guó)食品藥品檢定研究院中國(guó)醫(yī)學(xué)細(xì)菌保藏管理中心。
1.1.2 主要試劑和儀器 2% 含糖牛肉及其瓊脂培養(yǎng)基與 10% 牛奶培養(yǎng)基均由中檢院三藥公司配制;其他試劑均為國(guó)產(chǎn)分析純;DNA 提取試劑盒購(gòu)自美國(guó) Qiagen 公司;細(xì)菌培養(yǎng)箱為中儀國(guó)科(北京)科技有限公司產(chǎn)品;VITEK 全自動(dòng)微生物鑒定儀為梅里埃診斷產(chǎn)品(上海)有限公司產(chǎn)品。
1.2.1 形態(tài)觀(guān)察與生化鑒定 將生產(chǎn)用菌株CMCC32901 接種于 2% 含糖牛肉培養(yǎng)基復(fù)蘇,然后再接種至 2% 含糖牛肉瓊脂平板與牛奶培養(yǎng)基,觀(guān)察菌落形態(tài)、染色鏡檢,分析其產(chǎn)酸特性,并使用 VITEK 全自動(dòng)微生物鑒定儀進(jìn)行鑒定。
1.2.2 16S rRNA 基因序列分析 取菌株過(guò)夜培養(yǎng)物,按照 DNA 提取試劑盒說(shuō)明書(shū)進(jìn)行細(xì)菌全基因組 DNA 提取,并使用通用引物 27F(5' AGAG TTTGATCMTGGCTCAG 3')和 1492R(5' GGYTA CCTTGTTACGACTT 3')進(jìn)行擴(kuò)增和測(cè)序,并將測(cè)序拼接結(jié)果提交 NCBI 數(shù)據(jù)庫(kù)中進(jìn)行 BLAST 比對(duì)分析。應(yīng)用 DNASTAR 軟件將其與 NCBI 數(shù)據(jù)庫(kù)中已發(fā)表腸球菌的 16S rRNA 序列進(jìn)行比較分析。序列比較和聚類(lèi)分析所引用的菌株及其在NCBI 數(shù)據(jù)庫(kù)中的序列號(hào)如下:(LT223664)、(AJ301832)、(AJ301827)、(NR041708)、(MF369829)、(MN055952)、(NR115765)、(NR115764)、(AJ420802)、(MN055932)、(AB362590)、(LC097068)、(AJ301836)、(DQ411809)、(AB932524)、(LC097072)和(AF061005)。
1.2.3 全基因組測(cè)序與生物信息學(xué)分析 將提取的細(xì)菌全基因組 DNA 送上海人類(lèi)基因組研究中心進(jìn)行測(cè)序。使用美國(guó) Illumina 公司的第二代solexa 測(cè)序技術(shù)進(jìn)行全基因組測(cè)序,即取 1 μg DNA 利用超聲儀打斷,切膠回收 300 bp 片段,隨后純化的 DNA 利用 TruSeqTMDNA Sample Prep Kit-Set A 制備文庫(kù),并利用 TruSeq PE Cluster Kit 進(jìn)行擴(kuò)增,最后在illumine 機(jī)器(X10)上進(jìn)行測(cè)序反應(yīng)。應(yīng)用 velvet V1.2.03 對(duì)數(shù)據(jù)進(jìn)行拼裝,結(jié)合軟件 glimmer 3.02 進(jìn)行基因預(yù)測(cè);搜尋 NCBI 的 nr 庫(kù),KEGG 蛋白數(shù)據(jù)庫(kù)以及 SEED 蛋白數(shù)據(jù)庫(kù)進(jìn)行基因功能注釋?zhuān)?CDD 數(shù)據(jù)庫(kù)進(jìn)行直系同源簇(COG)分類(lèi),通過(guò) KEGG 數(shù)據(jù)庫(kù)構(gòu)建代謝通路;并參考文獻(xiàn)[6]應(yīng)用 PathogenFinder 軟件對(duì) CMCC32901 基因組序列進(jìn)行細(xì)菌的致病性預(yù)測(cè)分析。
屎腸球菌 CMCC32901 在含糖牛肉瓊脂平板上生長(zhǎng)良好,菌落表面光滑,中間隆起,邊緣整齊。革蘭氏染色為陽(yáng)性球菌,接種牛奶培養(yǎng)基過(guò)夜后,明顯引起牛奶凝固。VITEK 全自動(dòng)微生物鑒定儀進(jìn)行生化鑒定為屎腸球菌。
將 CMCC32901 菌株 16S rRNA 基因測(cè)序拼接結(jié)果在 NCBI 網(wǎng)站進(jìn)行 Blast(https://blast.ncbi. nlm.nih.gov/Blast.cgi)分析,發(fā)現(xiàn)其與 NCBI 數(shù)據(jù)庫(kù)中收錄的不同屎腸球菌菌株的 16S rRNA 序列相似度大于 99.5%,而與其他腸球菌菌株之間的 16S rRNA 序列相似度均大于 92.0%。將其與NCBI 收錄其他 16 種腸球菌屬菌株進(jìn)行系統(tǒng)發(fā)育進(jìn)化分析,結(jié)果顯示 CMCC32901 與另一株屎腸球菌以及菌株共屬于一個(gè)亞分支,CMCC32901 與菌株 16S rRNA 基因序列同源性高達(dá) 99.4%,與糞腸球菌的進(jìn)化稍有不同(圖 1)。
圖 1 生產(chǎn)用菌株CMCC32901 與NCBI 數(shù)據(jù)庫(kù)中不同腸球菌屬菌株的16S rRNA 基因序列系統(tǒng)進(jìn)化分析
Figure 1 Phylogenetic analysis for 16S rRNA gene of production strain CMCC32901 and differentspecies strains from NCBI
應(yīng)用 Solexa 測(cè)序技術(shù)進(jìn)行全基因組測(cè)序分析,共獲得 4606666 個(gè)讀長(zhǎng)片段,測(cè)序深度達(dá)到待測(cè)細(xì)菌基因組大小的 500倍。采用 velvet V1.2.03 軟件對(duì)測(cè)序數(shù)據(jù)進(jìn)行拼裝,最終獲得40 個(gè)基因組 contig 片段,其中最大 contig 片段為 461121 bp,平均每個(gè) contig 片段大小為69 064 bp,N50 大小為 180 554 bp。經(jīng)拼接比對(duì)分析發(fā)現(xiàn)屎腸球菌 CMCC32901 染色體全基因組序列全長(zhǎng)為2394726 bp(表 1),同時(shí)通過(guò)軟件 glimmer 3.02 進(jìn)行基因預(yù)測(cè),最終在 CMCC32901 菌株中鑒定出 2718 個(gè)基因,平均長(zhǎng)度為 881 bp,編碼基因占整個(gè)基因組序列的 86.7%,其平均 GC 含量為 39.1%。基因組中非編碼基因間區(qū)域大小為
367 870 bp,在基因組序列中占比為 13.3%,在非編碼 RNA 中鑒定出40 個(gè) tRNA 與3 個(gè) rRNA 序列。
應(yīng)用 COG 數(shù)據(jù)庫(kù)注釋上述已獲得的全基因組序列,發(fā)現(xiàn)屎腸球菌 CMCC32901 菌株中共有 2064 個(gè)基因具有明確的生物學(xué)功能,COG 功能注釋的預(yù)測(cè)編碼蛋白有 2059 個(gè),其中與氨基酸運(yùn)輸、碳水化合物代謝相關(guān)的蛋白最多,數(shù)量高達(dá) 527 個(gè),占總注釋基因的25.6%,主要為氨基酸、碳水化合物、無(wú)機(jī)離子的轉(zhuǎn)運(yùn)與代謝(圖 2A、B 和 M),其次為負(fù)責(zé)轉(zhuǎn)錄的蛋白,為 184 個(gè)。此外,仍有 12.1%(250 個(gè))的未知功能蛋白無(wú)法獲得功能注釋?zhuān)▓D 2J),有待后續(xù)進(jìn)一步的分析。
表 1 屎腸球菌CMCC32901 菌株的全基因組特征
通過(guò) KEGG 數(shù)據(jù)庫(kù)構(gòu)建代謝通路,分析表明屎腸球菌 CMCC32901 菌株中 1402 個(gè)基因參與 KEGG 代謝通路的信息。KEGG 功能分類(lèi)主要包括對(duì)細(xì)胞內(nèi)過(guò)程、環(huán)境信息處理過(guò)程、遺傳信息處理過(guò)程、代謝和生物系統(tǒng)(圖 3)。其中代謝類(lèi)基因數(shù)量最多,占 KEGG注釋總基因數(shù)的 51.7%;其次為環(huán)境信息處理過(guò)程基因數(shù)量,具體包括膜轉(zhuǎn)運(yùn)和信號(hào)轉(zhuǎn)導(dǎo)通路,占比分別為 11.8% 和 4.6%。
圖 2 屎腸球菌CMCC32901 菌株基因組的COG 聚類(lèi)分析
Figure 2 COG clustering analysis of the genome ofCMCC32901
圖 3 屎腸球菌CMCC32901 菌株基因組的KEGG 代謝通路分類(lèi)
Figure 3 Classification of KEGG metabolic pathways in the genome ofCMCC32901
圖 4 生產(chǎn)用菌種CMCC32901 菌株與其他不同屎腸球菌菌株的同源蛋白分析
Figure 4 Homologous protein analysis of production strain CMCC32901 and other differentstrains
表 2 屎腸球菌CMCC32901 菌株致病性預(yù)測(cè)分析
同時(shí),將屎腸球菌 CMCC32901 菌株基因組的全部基因預(yù)測(cè)蛋白進(jìn)行 blast 同源蛋白分析匹配,發(fā)現(xiàn)同源蛋白來(lái)源于 73 個(gè)物種,但其中以屎腸球菌菌屬特異性同源蛋白最高,為 2589 個(gè),進(jìn)一步分析發(fā)現(xiàn) CMCC32901 菌株與屎腸球菌 TX1330 菌株比例同源性蛋白比率最高(達(dá) 27.5%),為 713 個(gè)(圖 4)。
應(yīng)用 PathogenFinder 軟件進(jìn)行細(xì)菌的致病性預(yù)測(cè)分析,在 CMCC32901菌株中發(fā)現(xiàn) 5 種對(duì)人致病性相關(guān)蛋白,獲得 5 種匹配蛋白詳細(xì)的種屬來(lái)源以及蛋白相似度(表 2),并提示屎腸球菌 CMCC32901 具有潛在的對(duì)人致病性。
乳酶生由于療效可靠、副作用小,使用方便,在臨床上廣泛用于調(diào)理胃腸道不適。但該藥品長(zhǎng)期以來(lái)都作為生化藥品管理,在其生產(chǎn)和質(zhì)量控制上也一直按照化學(xué)藥品的要求規(guī)定進(jìn)行[7]。但理論上,乳酶生作為活菌制劑,按照其產(chǎn)品特性應(yīng)屬于微生態(tài)活菌制品[5]。為了加強(qiáng)乳酶生質(zhì)量控制,在 2015 版《中國(guó)藥典》二部首次收錄乳酶生,并在制法要求中,明確規(guī)定生產(chǎn)過(guò)程不僅要遵守《藥品生產(chǎn)質(zhì)量管理規(guī)范》,而且還應(yīng)符合現(xiàn)行版《中國(guó)藥典》三部中微生態(tài)活菌制品總論的要求。因此,對(duì)于乳酶生的質(zhì)量控制,尤其生產(chǎn)用菌種的要求越來(lái)越高[3-4]。
隨著高通量測(cè)序技術(shù)的發(fā)展,已經(jīng)廣泛用在生產(chǎn)用菌種的全基因組水平研究及揭示其基因特征和功能,更為后續(xù)研究提供基礎(chǔ)[8]。本研究應(yīng)用高通量測(cè)序技術(shù)首次對(duì)我國(guó)乳酶生的生產(chǎn)用菌種屎腸球菌 CMCC32901 進(jìn)行分析,獲得該菌種的全基因組特征,并通過(guò)該菌基因組 COG 聚類(lèi)分析發(fā)現(xiàn),氨基酸、碳水化合物、無(wú)機(jī)離子的轉(zhuǎn)運(yùn)與代謝等都是高度富集的,推測(cè)可能與屎腸球菌能大量分解糖類(lèi)產(chǎn)酸的特性相關(guān)。分析菌株基因組 KEGG 通路注釋也證實(shí),其中與新陳代謝途徑相關(guān)的基因最多,進(jìn)一步支持 COG 數(shù)據(jù)庫(kù)注釋的分析結(jié)果。這些研究結(jié)果也為優(yōu)化乳酶生的生產(chǎn)工藝,提高其產(chǎn)量奠定基礎(chǔ)。
眾所周知,要成為一株生產(chǎn)用菌種,前期需要大量的有效性和安全性的驗(yàn)證試驗(yàn)[2],屎腸球菌 CMCC32901 自 20 世紀(jì) 50 年代起一直用于國(guó)內(nèi)乳酶生的生產(chǎn),中間也歷經(jīng)多次命名的變化,生產(chǎn)用菌種的質(zhì)量控制能達(dá)到菌株水平就顯得尤為重要[5]。由于傳統(tǒng)的質(zhì)控方法只能鑒定到屎腸球菌,而并不能提供每株屎腸球菌的特定信息。正如以前研究發(fā)現(xiàn),16S rRNA 基因序列分析也僅能鑒定屎腸球菌[5],本研究結(jié)果也發(fā)現(xiàn)不同屎腸球菌菌株之間16S rRNA 基因序列幾乎完全相同,與其他腸球菌之間的同源性較高,系統(tǒng)發(fā)育進(jìn)化分析也顯示各自的遺傳進(jìn)化關(guān)系。在此基礎(chǔ)之上,我們獲得該生產(chǎn)用菌種的全基因組信息,通過(guò)同源性分析發(fā)現(xiàn),絕對(duì)多數(shù)基因組中預(yù)測(cè)編碼蛋白僅與 NCBI 數(shù)據(jù)庫(kù)中收錄的屎腸球菌蛋白高度同源,并首次從全基因組水平進(jìn)一步證實(shí)乳酶生 CMCC32901 生產(chǎn)用菌種為屎腸球菌,獲得的屎腸球菌特異性同源蛋白為未來(lái)實(shí)現(xiàn)生產(chǎn)用菌種的菌株水平鑒定與質(zhì)量控制提供數(shù)據(jù)支持。同時(shí),從全基因組水平進(jìn)行生產(chǎn)用菌種基因特征分析,也為其他微生態(tài)類(lèi)藥品生產(chǎn)用菌種的研究提供范例。
多數(shù)腸球菌常棲居在宿主的腸道和女性生殖道,屬于人類(lèi)的正常菌群之一。但是近年來(lái),涉及致病腸球菌的院內(nèi)感染事件不斷增多,其安全性問(wèn)題引起了人們的關(guān)注。這些臨床分離的致病菌株大多數(shù)屬于糞腸球菌和屎腸球菌,主要引起尿路感染、腹腔感染、菌血癥和心內(nèi)膜炎等[9-10]。安全性是微生態(tài)活菌制品的最基本要求,在現(xiàn)行版《中國(guó)藥典》三部中微生態(tài)活菌制品總論中明確規(guī)定應(yīng)通過(guò)動(dòng)物試驗(yàn)檢測(cè)其生產(chǎn)用菌種是否存在不安全因素,以保證人體用藥安全[4]。盡管本研究所用屎腸球菌 CMCC32901 為批準(zhǔn)上市多年的乳酶生生產(chǎn)用菌種,安全性已在臨床上得到證實(shí)[1, 5],但隨著生物技術(shù)的發(fā)展,人們對(duì)微生態(tài)制劑有了更加全面的了解,為進(jìn)一步加強(qiáng)其生產(chǎn)用菌株的質(zhì)量控制,F(xiàn)AO/WHO 工作組專(zhuān)家推薦應(yīng)結(jié)合體內(nèi)和體外試驗(yàn),全面評(píng)估生產(chǎn)用菌株的安全性,包括菌株的耐藥譜分析、特定代謝產(chǎn)物與已知致病因子的檢測(cè)等[11]。本研究通過(guò)分析屎腸球菌CMCC32901 的全基因組序列,全面了解了該生產(chǎn)用菌種的編碼基因與代謝通路特征,并預(yù)測(cè)發(fā)現(xiàn)其基因組中存在5 種潛在致病相關(guān)蛋白,但這些預(yù)測(cè)蛋白是否能表達(dá),表達(dá)后是否會(huì)產(chǎn)生致病性等均有待于研究,這些研究結(jié)果將推動(dòng)微生態(tài)制劑生產(chǎn)用菌種安全性評(píng)價(jià)體外試驗(yàn)的研究。
綜上所述,本研究首次獲得了我國(guó)乳酶生生產(chǎn)用菌種——屎腸球菌 CMCC32901 全基因組的基本特征,并以此分析了基因功能、同源性及致病性,不僅為后續(xù)鑒定生產(chǎn)用菌種到菌株水平的質(zhì)量控制提供數(shù)據(jù)支持,也為未來(lái)乳酶生的生產(chǎn)工藝優(yōu)化奠定基礎(chǔ)。
志謝 感謝上海人類(lèi)基因組研究中心鄭華軍、朱永強(qiáng)和金磊給予的幫助。
[1] Zhao L, Zhu YJ, Zhao ZJ. Clinical effect of domperidone combined with lactase on functional dyspepsia in children. Clin Med, 2019, 39(11):95-97. (in Chinese)
趙亮, 朱永杰, 趙振江. 多潘立酮聯(lián)合乳酶生治療小兒功能性消化不良的臨床效果. 臨床醫(yī)學(xué), 2019, 39(11):95-97.
[2] Wang JZ. Vaccine quality control and evaluation. Beijing: People's Medical Publishing House, 2013:79-88. (in Chinese)
王軍志. 疫苗的質(zhì)量控制與評(píng)價(jià). 北京: 人民衛(wèi)生出版社, 2013: 79-88.
[3] Chinese Pharmacopoeia Commission. Pharmacopoeia of the People’s Republic of China. Volume 2, 2020. Beijing: China Medical Science Press, 2020:830-831. (in Chinese)
國(guó)家藥典委員會(huì). 中華人民共和國(guó)藥典. 2020年版二部. 北京: 中國(guó)醫(yī)藥科技出版社, 2020:830-831.
[4] Chinese Pharmacopoeia Commission. Pharmacopoeia of the People’s Republic of China. Volume 3, 2020. Beijing: China Medical Science Press, 2020:62-68. (in Chinese)
國(guó)家藥典委員會(huì). 中華人民共和國(guó)藥典. 2020年版三部. 北京: 中國(guó)醫(yī)藥科技出版社, 2020:62-68.
[5] Tian WH, Yu G, Zhao ZJ, et al. Identification and drug-resistance spectrum of a lactasin-producing strain. Chin J Biol, 2013, 26(9): 1285-1289. (in Chinese)
田萬(wàn)紅, 喻鋼, 趙志晶, 等. 乳酶生生產(chǎn)菌株的鑒定及耐藥譜的分析. 中國(guó)生物制品學(xué)雜志, 2013, 26(9):1285-1289.
[6] Cosentino S, Voldby Larsen M, M?ller Aarestrup F, et al. PathogenFinder--distinguishing friend from foe using bacterial whole genome sequence data. PLoS One, 2013, 8(10):e77302.
[7] Zhu B, Liu T, Wei T, et al. Revision on the quality standards of lactasin and its preparations. Drug Stand China, 2011, 12(2):167-168. (in Chinese)
朱斌, 劉濤, 韋濤, 等. 乳酶生及制劑質(zhì)量標(biāo)準(zhǔn)存在問(wèn)題及修訂建議. 中國(guó)藥品標(biāo)準(zhǔn), 2011, 12(2):167-168.
[8] Borgers K, Ou JY, Zheng PX, et al. Reference genome and comparative genome analysis for the WHO reference strain for Mycobacterium bovis BCG Danish, the present tuberculosis vaccine. BMC Genomics, 2019, 20(1):561.
[9] Arias CA, Murray BE. The rise of the Enterococcus: beyond vancomycin resistance. Nat Rev Microbiol, 2012, 10(4):266-278.
[10] Wang S, Guo Y, Lv J, et al. Characteristic of Enterococcus faecium clinical isolates with quinupristin/dalfopristin resistance in China. BMC Microbiol, 2016, 16(1):246.
[11] Food and Agriculture Organization of the United Nations, World Health Organization. Guidelines for the evaluation of the probiotics in food. London Ontario, Canada: 2002 [2020-08-11]. http://www.who. int/foodsafety/fs_management/en/probiotic_guidelines.pdf.
Whole genome sequence analysis for lactasin production strain
WANG Shan-shan, SHI Ji-chun, DU Zong-li, SHI Gang, LONG Xin-xing, XU Ying-hua, YE Qiang
To understand the molecular characteristics of the whole genome of production strain for lactasin in China.
After culturingCMCC32901 for the production of lactasin, the morphological observation, biochemical identification and 16S rRNA gene sequence analysis were performed. The high-throughput sequencing technology was used to determine the whole genome sequence of production strain CMCC32901. The basic characteristics, gene function, homology and pathogenicity of the genome were analyzed.
The 16S rRNA gene sequence of CMCC32901 had greater than 99.5% similarity with differentstrains included in the NCBI database, and greater than 92.0% similarity for otherstrains. The whole genome sequence ofCMCC32901 chromosome was 2 394 726 bp with an average GC content of 39.1%, and contained a total of 2718 genes including 2059 COG functions and 1402 KEGG metabolic pathways. Homology analysis showed that 2589 predicted coding proteins were specific for. Predictive analysis for the bacteria pathogenicity showed that five proteins related to human pathogenicity were found in the genome of CMCC32901 strain.
It is the first time for obtaining the basic characteristics of the whole genome of the lactasin production strainCMCC32901 in China, which lays the foundation for the subsequent optimization of the production process of lactasin production and the quality control of the production strains.
Lactasin;; Production strain; Whole genome; Quality control
s: YE Qiang, Email: qiangyee@nifdc.org.cn; XU Ying-hua, Email: xuyh@nifdc.org.cn
10.3969/j.issn.1673-713X.2020.06.004
Author Affiliation: Key Laboratory of the Ministry of Health for Research on Quality and Standardization of Biotech Products, National Institute for Food and Drug Control, Beijing 102629, China
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2018YFC1603900);醫(yī)學(xué)微生物資源子平臺(tái)運(yùn)行與服務(wù)(NIMR-2019)
葉強(qiáng),Email:qiangyee@nifdc.org.cn;徐穎華,Email:xuyh@nifdc.org.cn
2020-07-13
*同為第一作者