王玉霞,崔 霞,周海軍,穆 軍
(浙江海洋大學(xué)海洋科學(xué)與技術(shù)學(xué)院,浙江舟山 316022)
微生物絮凝劑作為一種綠色環(huán)保的水處理劑,往往因高生產(chǎn)成本和復(fù)雜的發(fā)酵、回收過(guò)程而限制了其工業(yè)化投入,因此越來(lái)越多的研究者投入到開發(fā)新的生物絮凝劑資源,菲律賓蛤仔黏附污泥(Ruditapes philippinarum conglutination mud,RPM)就是一種被報(bào)道的水產(chǎn)養(yǎng)殖廢物利用的天然生物絮凝劑資源,能克服其昂貴的成本和發(fā)酵過(guò)程,具有很好的前景[1-4]。研究表明RPM 無(wú)論是對(duì)高嶺土懸浮液的絮凝率還是不同染料的脫色率均高達(dá)90%以上,具有高效的絮凝活性,而RPM 的共附生細(xì)菌被報(bào)道為絮凝活性的主要承擔(dān)者,且從RPM 中已經(jīng)分離得到了17 株產(chǎn)生物絮凝劑菌株,胞外多糖被認(rèn)為是這些細(xì)菌代謝的絮凝活性物質(zhì)[1-8]。
本研究從RPM 中分離、篩選獲得1 株新的高絮凝活性菌株GHS18,先對(duì)其進(jìn)行16S rDNA 分型鑒定、生理生化特征測(cè)定將其鑒定到物種,然后基于基因組學(xué)水平對(duì)菌株GHS18 進(jìn)行全基因組的框架掃描測(cè)序,基因預(yù)測(cè)以及功能注釋來(lái)分析菌株GHS18 產(chǎn)絮凝活性物質(zhì)的分子水平依據(jù),為該菌株未來(lái)的深入研究奠定基礎(chǔ)。
從抗生素培養(yǎng)獲得的具有絮凝活性的RPM 中分離純化獲得產(chǎn)絮凝劑菌株。
菌株的絮凝率測(cè)定參照MU Jun,et al[1]使用的方法。取93 mL 4 g·L-1高嶺土懸浮液、5 mL 10 g·L-1氯化鈣溶液和2 mL 待測(cè)菌株GHS18 的菌懸液于250 mL 燒杯中,pH 調(diào)至7.5。200 r·min-1快速攪拌混合液1 min,然后80 r·min-1慢速攪拌2 min。靜置10 min 后,取液面下1 cm 處懸濁液于分光光度計(jì)測(cè)定OD值,吸光度為550 nm,測(cè)得值記為A0空白對(duì)照組以2 mL 去離子水代替待測(cè)菌液,測(cè)得OD 值記為A0。菌株的絮凝率(flocculation rate,F(xiàn)R)計(jì)算公式為:
A0和A 分別為空白對(duì)照組和待測(cè)樣品組的OD550值。
菌株GHS18 的形態(tài)特征、生理生化指標(biāo)、生長(zhǎng)溫度與鹽度范圍、胞外酶活性檢測(cè)、碳源的利用測(cè)定方法參照《伯杰氏細(xì)菌鑒定手冊(cè)》[9]、《常見細(xì)菌系統(tǒng)鑒定手冊(cè)》[10]以及BAUMANN,et al[11]。
將菌株GHS18 接種到液體培養(yǎng)基中恒溫25 ℃培養(yǎng)10 h 后使用TaKaRa 全基因組提取試劑盒(DNA Extraction Kit Ver.3.0)進(jìn)行核酸DNA 的抽提。擴(kuò)增引物為27F(5'-AGA GTTTGATCATGG CTC AG-3')和1492R(5'-TAC GGTTACCTGTTACGACTT-3')[12],反應(yīng)體系終體積為20 μL,包括2.0 μL 10×Ex Taq buffer、1.6 μL 2.5 mM dNTP mix、5p 引物、0.5 μL 模板、0.2 μL Ex Taq,加ddH2O 補(bǔ)至終體積。擴(kuò)增程序?yàn)椋?5 ℃,5 min;95 ℃,30 s,55 ℃,30 s,72 ℃,90 s,24 個(gè)循環(huán);72 ℃,10 min。擴(kuò)增結(jié)果以凝膠電泳進(jìn)行檢測(cè),檢測(cè)合格后使用ABI 3730XL 測(cè)序儀進(jìn)行測(cè)序。
將測(cè)序拼接后的序列于EzBioCloud(http://www.ezbiocloud.net)進(jìn)行blast 比對(duì),將菌株鑒定到種屬水平。菌株GHS18 的16S rDNA 序列上傳到NCBI 數(shù)據(jù)庫(kù),登錄號(hào)為KX702262。選取比對(duì)結(jié)果中相似度高的模式菌株及外間組模式菌株通過(guò)軟件MEGA7 進(jìn)行系統(tǒng)發(fā)育樹的構(gòu)建。
將菌株GHS18 純培養(yǎng)后提取基因組DNA,利用1%瓊脂凝膠電泳檢測(cè)并收集抽提的DNA。對(duì)質(zhì)檢后收集的DNA 進(jìn)行300~500 bp 片段化,然后使用TruSeqTMDNA Sample Prep Kit 進(jìn)行文庫(kù)構(gòu)建,TruSeq PE Cluster Kit 進(jìn)行橋式PCR,最后使用Truseq SBS Kit 利用Illumina 測(cè)序技術(shù)對(duì)DNA 進(jìn)行paired-end(PE)測(cè)序。將測(cè)序得到的原始數(shù)據(jù)進(jìn)行有效數(shù)據(jù)的統(tǒng)計(jì)、序列拼接(SOAPdenovo v2.04 軟件)、序列矯正(GapCloser v1.12 軟件),得到拼接后的序列,以便進(jìn)行下一步分析。
對(duì)拼接后的序列進(jìn)行rRNA/tRNA 的查找(RNAmmer-1.2 和tRNAscan-SE v1.3.1 軟件)、串聯(lián)重復(fù)序列預(yù)測(cè)(http://tandem.bu.edu/trf/trf.basic.submit.html)[13]、插入序列預(yù)測(cè)(https://www-is.biotoul.fr/)[14]、基因的功能預(yù)測(cè)(Glimmer 3.02 軟件),并將預(yù)測(cè)基因的蛋白序列與Nr、genes、string 和GO 數(shù)據(jù)庫(kù)進(jìn)行blastp 比對(duì)(BLAST 2.2.28+軟件),得到預(yù)測(cè)基因的功能注釋信息。
分離純化的單菌株GHS18 恒溫25 ℃純培養(yǎng)10 h,測(cè)得其絮凝率為75.1%。比對(duì)結(jié)果顯示菌株GHS18的16SrDNA 序列與Pseudoalteromonas paragorgicola KMM 3548T 和P.distincta ATCC 700518T 序列具有99.92%的相似性。菌株GHS18 的系統(tǒng)進(jìn)化發(fā)育樹如圖1,低于80%的值被隱藏,由圖1 可知,菌株GHS18與P.paragorgicola 和P.distincta 聚集在一個(gè)分支。
圖1 菌株GHS18 的系統(tǒng)進(jìn)化發(fā)育樹Fig.1 The phylogenic tree of strain GHS18
菌株的生理生化指標(biāo)測(cè)定結(jié)果見表1。由表1 可知,菌株GHS18 為桿狀菌,革蘭氏陰性菌,具有極性鞭毛,出現(xiàn)黃色色素沉著;生長(zhǎng)鹽度耐受范圍與模式菌株相比,由1%~6%提升到了10%;高溫不耐受,37 ℃無(wú)法生長(zhǎng);能產(chǎn)生淀粉酶;能利用葡萄糖、阿拉伯糖、半乳糖、麥芽糖、甘露醇、木糖,而蜜二糖、乳糖、山梨糖醇、檸檬酸鹽均無(wú)法利用。與模式菌株的理化特征比對(duì),結(jié)合16S 序列比對(duì)和系統(tǒng)發(fā)育樹結(jié)果,菌株GHS18 被鑒定為P.paragorgicola。
表1 菌株GHS18 的生理生化特征測(cè)定結(jié)果Tab.1 The results of biochemical tests of strains GHS18
為了深入研究產(chǎn)絮凝物質(zhì)的菌株GHS18 分子機(jī)制,本研究利用Illumina 技術(shù)對(duì)菌株GHS18 的基因組進(jìn)行了框架掃描測(cè)序,序列拼接為43 個(gè)大框架序列,總長(zhǎng)度為4 691 518 bp,其中43 個(gè)框架序列長(zhǎng)度均大于1 000 bp,最長(zhǎng)框架為536 748 bp,框架N50 為227 074 bp,N90 為68 684 bp,GC 含量為39.191 mol%。將菌株GHS18 拼接后的序列進(jìn)行與基因預(yù)測(cè),包含11 個(gè)rRNA、94 個(gè)tRNA 和4 342 個(gè)基因。
通過(guò)TRF(tandem repeat finder)對(duì)菌株GHS18 的基因組進(jìn)行串聯(lián)重復(fù)序列的在線預(yù)測(cè),共預(yù)測(cè)到142條串聯(lián)重復(fù)序列,57.7%的序列匹配分值為50~100,19.7%的序列匹配分值為101~500,其余匹配分值大于500,表明菌株GHS18 的基因組中多存在短串聯(lián)重復(fù)序列。通過(guò)IS Finder 對(duì)菌株GHS18 的插入序列進(jìn)行在線預(yù)測(cè),7 條潛在的插入序列被篩選出,篩選結(jié)果以E-value(0.001)為標(biāo)準(zhǔn),IS3 和IS110 序列家族各含有3 條,1 條屬于IS91 家族。
將注釋基因與COG 數(shù)據(jù)庫(kù)進(jìn)行比對(duì),結(jié)果表明2 608 個(gè)(60.1%)基因具有COG 編號(hào),即具有明確的生物學(xué)功能(見圖3)。其中,COG 功能一級(jí)分類中參與代謝的蛋白數(shù)最多,高達(dá)1 109 個(gè)(42.5%),其次是參與細(xì)胞內(nèi)進(jìn)程和信號(hào)傳導(dǎo)功能(31.3%),以及信息儲(chǔ)存和處理(21.0%)。COG 功能二級(jí)分類中,擁有最多功能基因的是E(氨基酸轉(zhuǎn)運(yùn)和代謝,9.7%)、類別J(翻譯、核糖體結(jié)構(gòu)和生物發(fā)生,9.2%)、T(信號(hào)轉(zhuǎn)導(dǎo)機(jī)制,7.5%)和C(能源生產(chǎn)和轉(zhuǎn)換,6.9%)。參與次生代謝產(chǎn)物的生物合成、轉(zhuǎn)運(yùn)和分解代謝功能的類別Q 僅占2.2%。
圖3 菌株GHS18 的COG 的功能分類Fig.3 The results of COG second level class in P.paragorgicola GHS18
圖2 菌株GHS18 的基因組CG 圖譜Fig.2 The CG view of P.paragorgicola GHS18
GO 功能注釋結(jié)果統(tǒng)計(jì)如圖4 所示,總共2 296 條列具有GO 數(shù)據(jù)庫(kù)的注釋信息,占預(yù)測(cè)總蛋白數(shù)目的52.9%。GO 功能分為生物學(xué)過(guò)程、細(xì)胞成分和分子功能三類。由圖可知,細(xì)胞內(nèi)過(guò)程、單生物過(guò)程和代謝過(guò)程在生物學(xué)過(guò)程中占優(yōu)勢(shì),細(xì)胞部位、細(xì)胞膜部位、細(xì)胞膜和細(xì)胞是細(xì)胞組分中的優(yōu)勢(shì)功能組,結(jié)合和催化活性在分子功能分類中占絕對(duì)優(yōu)勢(shì)。作為具有絮凝活性的功能菌株GHS18,其在表達(dá)過(guò)程中需要大量的代謝、生物調(diào)控、代謝產(chǎn)物轉(zhuǎn)運(yùn)等各種生物學(xué)過(guò)程互作,從而實(shí)現(xiàn)胞外多糖的產(chǎn)生,這些注釋功能占優(yōu)勢(shì)的也與它們的菌體繁殖和代謝活動(dòng)息息相關(guān),因此菌株GHS18 基因組在GO 數(shù)據(jù)庫(kù)中進(jìn)行功能注釋與這些生物過(guò)程相關(guān)的基因表達(dá)占優(yōu)勢(shì)。
圖4 菌株GHS18 的GO 功能分類圖Fig.4 Functional classification of GO annotation in P.paragorgicola GHS18
將菌株GHS18 基因組預(yù)測(cè)的基因序列與KEGG 數(shù)據(jù)庫(kù)進(jìn)行比對(duì),結(jié)果顯示在菌株GHS18 基因組中預(yù)測(cè)的4 342 個(gè)全長(zhǎng)基因中,有2 241 個(gè)基因(51.6%)匹配到KEGG 數(shù)據(jù)庫(kù)中的基因,且在其對(duì)應(yīng)的代謝途徑上均進(jìn)行了定位,共參與了193 條KEGG 的代謝途徑。其中參與代謝途徑的總共583 個(gè)基因,參與次生代謝產(chǎn)物的生物合成有256 個(gè)基因,參與不同環(huán)境的微生物代謝共有170 個(gè)基因。此外,參與碳代謝的有89 個(gè)基因,主要包含淀粉、蔗糖、氨基糖、核苷酸糖、果糖、甘露糖、肽聚糖、半乳糖、脂多糖的生物合成與代謝。
到目前為止,研究已經(jīng)明確了一些具有絮凝活性的多糖物質(zhì)的結(jié)構(gòu)以及生物合成途徑,如纖維素、幾丁質(zhì)、普魯蘭多糖、果膠、淀粉、海藻酸鈉和黃原膠[16-19]。合成途徑主要分為3 個(gè)步驟[20-21]:ⅰ)前體底物的合成;ⅱ)多糖的聚合和轉(zhuǎn)移;ⅲ)通過(guò)外膜分泌到胞外。其中報(bào)道的一些前體底物如UDP-Glucose、GDPmannose 和UDP-glucuronate 在菌株GHS18 中均能找到,這些前體的轉(zhuǎn)化為后續(xù)胞外多糖的聚合提供了基礎(chǔ)。而多糖聚合過(guò)程中的一些重復(fù)單元如UDP-Gal、dNTP-D-Glu、dNTP-L-Rham、UDP-3-O-(3-acetyl)-GlcNAc 也能在菌株GHS18 代謝中發(fā)現(xiàn)它們的生物合成,這些重復(fù)糖單元在對(duì)應(yīng)的聚合酶/糖基轉(zhuǎn)移酶作用下聚合成多糖,奇怪的是,本研究中并未發(fā)現(xiàn)將重復(fù)單元聚合成胞外多糖的eps 基因簇,但菌株代謝具有絮凝活性的胞外多糖是不爭(zhēng)的事實(shí),因此推測(cè)其具有與eps 基因簇相似的基因簇來(lái)代替行使其功能。由于國(guó)內(nèi)外研究者對(duì)于產(chǎn)絮凝劑菌株的研究多集中于高絮凝活性菌株的分離篩選,或優(yōu)化其培養(yǎng)的理化條件以期達(dá)到更高的產(chǎn)量,相較于其分子水平的研究存在很大的不足,因此對(duì)于菌株GHS18 的產(chǎn)絮凝劑依據(jù)按照當(dāng)前研究證據(jù)來(lái)看還需要未來(lái)更進(jìn)一步的研究。
將菌株GHS18 組裝后預(yù)測(cè)的基因注釋到NR 數(shù)據(jù)庫(kù),有96.4%(4 187)的基因在NR 數(shù)據(jù)庫(kù)中獲得了注釋結(jié)果。對(duì)注釋到NR 數(shù)據(jù)庫(kù)基因的E 值進(jìn)行統(tǒng)計(jì),4.2%基因的E 值位于1×10-30~1×10-5,5.0%位于1×10-50~1×10-30,14.0%位于1×10-100~1×10-50,23.9%位于1×10-180~1×10-100。63.1%的基因序列具有100%的相似性,34.3%的相似性集中在80%~99%。注釋結(jié)果的物種分布表明,97.7%的預(yù)測(cè)基因與Pseudoalteromonas sp.有相似的同源序列,其中62.4%(相對(duì)于注釋到Pseudoalteromonas sp.中相似基因的百分比,下同)的預(yù)測(cè)基因與P.haloplanktis 相似,11.2%的預(yù)測(cè)基因與P.arctica 相似。由于目前對(duì)于P.paragorgicola 物種的全基因組學(xué)研究尚未完善,因此菌株GHS18 的基因注釋功能偏向于進(jìn)化分類學(xué)分支相隔較近的物種也是合理的。
將菌株GHS18 的預(yù)測(cè)基因注釋到Swiss-Prot 數(shù)據(jù)庫(kù),2 818 個(gè)基因在該數(shù)據(jù)庫(kù)有注釋信息,占總基因數(shù)的64.9%。對(duì)E 值分布進(jìn)行統(tǒng)計(jì),5.3%基因的E 值處于1×10-10~1×10-5,25.0%位于1×10-30~1×10-5,13.9%位于1×10-50~1×10-30,24.2%位于1×10-100~1×10-50。1.9%的基因序列具有100%的相似性,23.3%的相似性集中在80%~99%,36.6%相似性為60%~79%,24.5%相似性為50%~59%。
通過(guò)antiSMASH 對(duì)菌株GHS18 的序列進(jìn)行次級(jí)代謝產(chǎn)物合成基因簇預(yù)測(cè),分別在GHS18_scaffold1、GHS18_scaffold9、GHS18_scaffold10、GHS18_scaffold16 和GHS18_scaffold22 序列中各預(yù)測(cè)到1 個(gè)基因簇,分別為細(xì)菌素、細(xì)菌素、間二苯酚和芳基多烯、細(xì)菌素和四氫嘧啶合成基因簇。
從RPM 中分離篩選的1 株新的高絮凝活性菌株GHS18 通過(guò)16S rDNA 序列比對(duì)和生理生化特征結(jié)果鑒定為P.paragorgicola,絮凝活性為75.1%。通過(guò)一系列的預(yù)測(cè)對(duì)菌株GHS18 的基因組進(jìn)行了初步分析,一共預(yù)測(cè)到了94 個(gè)tRNA,11 個(gè)rRNA,142 條串聯(lián)重復(fù)序列,7 條插入序列,4 342 個(gè)基因和5 個(gè)次級(jí)代謝產(chǎn)物合成基因簇。將預(yù)測(cè)的基因進(jìn)行數(shù)據(jù)庫(kù)的注釋,60.1%、52.9%、51.6%、96.4%、64.9%的基因分別在數(shù)據(jù)庫(kù)COG、GO、KEGG、NR 和Swiss-Prot 匹配到了相應(yīng)的注釋信息。在菌株GHS18 的功能注釋中發(fā)現(xiàn)了一些產(chǎn)絮凝活性多糖的代謝途徑中重要的前體底物、重復(fù)單元以及一些調(diào)控基因,然而未找到eps 基因簇,推測(cè)該菌株具有類似的基因簇來(lái)代替其行使相應(yīng)的功能,這也可能是目前這一類研究領(lǐng)域數(shù)據(jù)大量缺乏的原因,如果需要進(jìn)一步探索菌株的代謝通路,未來(lái)還需要更深入的分子水平研究。