曹然,羅曉霞,張利莉*
(1塔里木大學(xué)生命科學(xué)學(xué)院,新疆 阿拉爾 843300)
(2塔里木盆地生物資源保護(hù)利用兵團(tuán)重點(diǎn)實(shí)驗(yàn)室,新疆 阿拉爾 843300)
1943年,鏈霉菌首次由WAKSMAN S A等描述[1]。鏈霉菌是最大的放線菌屬,已知放線菌所產(chǎn)抗生素的90%由本屬產(chǎn)生。鏈霉菌能產(chǎn)生結(jié)構(gòu)新穎、豐富的次級(jí)代謝產(chǎn)物,是挖掘生物活性產(chǎn)物的寶貴資源[2-3]。近年來(lái),隨著國(guó)內(nèi)外研究學(xué)者對(duì)鏈霉菌活性產(chǎn)物挖掘的不斷深入,鏈霉菌新物種研究逐漸成為新方向。鏈霉菌新物種的分離源以特殊環(huán)境土壤為主,其他分離源還包括海洋、沙漠、動(dòng)植物體內(nèi)等多種特殊的環(huán)境[4-6]。隨著國(guó)內(nèi)外研究學(xué)者對(duì)鏈霉菌新物種的深入研究,鏈霉菌新物種發(fā)表數(shù)量呈現(xiàn)上升趨勢(shì)。目前,已有超過(guò)850個(gè)鏈霉菌新物種被發(fā)表。對(duì)于活性代謝產(chǎn)物和具有應(yīng)用價(jià)值的鏈霉菌新物種研究逐漸成為新物種發(fā)表的重要?jiǎng)?chuàng)新點(diǎn)。我國(guó)地廣物博,存在各種特殊環(huán)境,有待挖掘的鏈霉菌資源極為豐富,這也是近年來(lái)我國(guó)鏈霉菌新物種發(fā)表數(shù)量處于世界前列的重要原因。鏈霉菌新物種的挖掘?yàn)檠芯挎溍咕渭?jí)代謝產(chǎn)物奠定了良好的基礎(chǔ)。
近年來(lái),越來(lái)越多的方法和手段被國(guó)內(nèi)外研究學(xué)者用于微生物次級(jí)代謝產(chǎn)物的挖掘,且傳統(tǒng)的研究方法已經(jīng)難以得到滿意的結(jié)果,因此對(duì)微生物進(jìn)行基因水平的研究逐漸成為新的研究方向?;诨蛩降拇渭?jí)代謝產(chǎn)物的挖掘主要通過(guò)對(duì)微生物菌株進(jìn)行全基因組測(cè)序,將測(cè)序后的數(shù)據(jù)進(jìn)行基因組組裝和注釋后,運(yùn)用相關(guān)生物信息學(xué)軟件對(duì)其進(jìn)行分析。通過(guò)對(duì)次級(jí)代謝產(chǎn)物生物合成基因簇及相關(guān)的預(yù)測(cè)明確微生物菌株的次級(jí)代謝潛力,從而更有針對(duì)性地進(jìn)行深度挖掘,因此基于基因水平挖掘次級(jí)代謝產(chǎn)物已成為新藥挖掘的突破點(diǎn)。
TRM68367是本實(shí)驗(yàn)分離自新疆阿克蘇溫宿縣臺(tái)蘭河淤泥的鏈霉菌新物種,并對(duì)蠟狀芽孢桿菌具有抑菌活性。本研究基于Illumina Hiseq 2000測(cè)序平臺(tái)對(duì)菌株進(jìn)行全基因組測(cè)序及生物信息學(xué)分析,為豐富微生物物種資源庫(kù)、挖掘結(jié)構(gòu)新穎、生物活性較強(qiáng)、具有特殊作用機(jī)制的天然產(chǎn)物提供理論依據(jù)。
1.1.1 菌株及來(lái)源
Streptomyces wensuensisTRM68367菌株,分離自新疆阿克蘇溫宿縣臺(tái)蘭河淤泥,保藏于塔里木盆地生物資源保護(hù)利用兵團(tuán)重點(diǎn)實(shí)驗(yàn)室、中國(guó)典型培養(yǎng)物保藏中心和比利時(shí)LMG菌種保藏中心,菌株保藏編號(hào)為Streptomyces wensuensisTRM68367T=CCTCC AA 2020004T=LMG 31944T。
1.1.2 培養(yǎng)基
(1)高氏一號(hào)固體培養(yǎng)基
可溶性淀粉20.0 g、磷酸氫二鉀0.5 g、硝酸鉀1.0 g、七水硫酸鎂0.5 g、硫酸亞鐵0.1 g/L、瓊脂16.0 g、水1 L、pH 7.2~7.4。
(2)真菌:PDA培養(yǎng)基
土豆 200.0 g、葡萄糖 20.0 g、瓊脂 17.0 g、水 1 L、pH 7.0。
細(xì)菌:MHA培養(yǎng)基
牛肉提取物2.0 g、酪蛋白水解物17.5 g、淀粉2.0 g、瓊脂17.0 g、pH 7.3±0.1。
(3)TSB液體培養(yǎng)基
胰蛋白胨17.0 g、蛋白胨3.0 g、葡萄糖2.5 g、氯化鈉5.0 g、磷酸氫二鉀2.5 g、水1 L、pH 7.1~7.5。
1.1.3 主要試劑
10% SDS、5 mol/L NaCl、10% CTAB、3 mol/L 醋酸鈉用于基因組DNA的提取,dNTP、Easy Taq酶、Easy Taqbuffer、DMSO、16S rRNA擴(kuò)增引物27F(5’-GAGTTTGATCCTGGCTCAG-3’)和 1492R(5’-GGTTACCTTGTTACGACTT-3’)。
1.1.4 主要儀器
主要儀器設(shè)備見表1。
表1 主要儀器及設(shè)備
1.2.1 菌株抑菌活性實(shí)驗(yàn)
第一步:發(fā)酵液待測(cè)液制備:向三角瓶中裝入150 mL高氏一號(hào)液體發(fā)酵培養(yǎng)基,120℃,30 min滅菌,挑取三個(gè)菌餅接入發(fā)酵培養(yǎng)基,30℃,180 r/min培養(yǎng)5 d。發(fā)酵液經(jīng)8000 r/min,10 min離心后,上清液經(jīng)過(guò)0.22 μm濾膜除菌得到無(wú)菌發(fā)酵液。第二步:病原菌菌懸液的準(zhǔn)備:配制40%甘油,吸取甘油至培養(yǎng)好的病原菌平板中,用無(wú)菌竹簽刮取菌絲,用移液槍將菌懸液移入無(wú)菌玻璃瓶中。將孢子懸浮液搖勻,分裝至無(wú)菌甘油管中,-20℃保藏。第三步:真菌病原菌平板的制作:吸取200 μL病原菌菌懸液涂布于PDA培養(yǎng)基。采用濾紙片法檢測(cè)放線菌發(fā)酵液對(duì)病原菌的抑制作用。吸取200 μL發(fā)酵液滴加在濾紙片上,將濾紙片放在病原菌平板上,真菌放置28℃培養(yǎng)箱,細(xì)菌放置在37℃培養(yǎng)箱中培養(yǎng),測(cè)量抑菌圈大小。細(xì)菌病原菌平板的制作:吸取200 μL病原菌菌懸液涂布于MHA培養(yǎng)基。采用濾紙片法檢測(cè)放線菌發(fā)酵液對(duì)病原菌的抑制作用。吸取200 μL發(fā)酵液滴加在濾紙片上,將濾紙片放在病原菌平板上,真菌放置28℃培養(yǎng)箱,細(xì)菌放置在37℃培養(yǎng)箱中培養(yǎng),測(cè)量抑菌圈大小。
1.2.2 菌株培養(yǎng)及基因型特征鑒定
將TRM68367劃線接種到高氏一號(hào)固體培養(yǎng)基中,30℃活化5 d后,挑取三個(gè)菌餅將其轉(zhuǎn)接到TSB液體培養(yǎng)基中,30℃,180 r/min培養(yǎng)3 d后于50 mL離心管收集菌絲體,經(jīng)8000 r/min,10 min離心后棄去上清夜保留菌絲體進(jìn)行基因組DNA提取。菌株基因組 DNA采用10% CTAB法進(jìn)行提取[7]。 以TRM68367基因組DNA為模板,PCR擴(kuò)增菌株16S rRNA,通過(guò)克隆測(cè)序獲得菌株16S rRNA基因序列,經(jīng)EzBioCloud數(shù)據(jù)庫(kù)比對(duì),采用MEGA 7.0軟件[8]構(gòu)建系統(tǒng)進(jìn)化樹。
1.2.3 全基因組測(cè)序及基因組組裝
將提取好的TRM68367基因組DNA經(jīng)1%瓊脂糖凝膠電泳檢測(cè),并用KAIKO K5800超微量分光光度計(jì)檢測(cè)基因組DNA的濃度。將合格的樣品送往上海派森諾生物信息科技有限公司進(jìn)行全基因組測(cè)序。基于Illumina Hiseq 2000測(cè)序平臺(tái),利用第二代測(cè)序技術(shù)對(duì)其進(jìn)行全基因組測(cè)序,對(duì)基因組數(shù)據(jù)采用SOAP denovo 1.05軟件進(jìn)行拼接,AbySS 2.0軟件進(jìn)行注釋分析。
1.2.4 溫宿鏈霉菌TRM68367完整基因組注釋與分析
1.2.4.1 蛋白編碼基因預(yù)測(cè)
采用 GeneMarkS[9]和 Glimmer 3.0 軟件對(duì)全基因組序列進(jìn)行基因組ORFs預(yù)測(cè)。GeneMarkS用于細(xì)菌基因組的蛋白質(zhì)編碼基因預(yù)測(cè)。此軟件預(yù)測(cè)方法通過(guò)GeneMark.hmm建立相應(yīng)的統(tǒng)計(jì)模型,利用序列中核酸使用的頻率表矩陣作為基礎(chǔ),來(lái)預(yù)測(cè)序列中編碼區(qū)域。
1.2.4.2 非編碼RNA預(yù)測(cè)
使用 tRNAscan-SE 軟件[10]預(yù)測(cè) tRNA 區(qū)域和tRNA的二級(jí)結(jié)構(gòu)。原核生物的rRNA分為三類:5S rRNA、16S rRNA和23S rRNA,使用RNAmmer軟件[11]預(yù)測(cè)rRNA。
1.2.4.3 蛋白編碼基因功能注釋
蛋白編碼基因功能注釋的主要目的是對(duì)所有蛋白編碼基因進(jìn)行功能解析,從而在分子水平上對(duì)該物種進(jìn)行解析。目前常見的基因功能注釋數(shù)據(jù)庫(kù)主要有COG,KEGG[12],GO[13]等。
1.2.4.4 次級(jí)代謝產(chǎn)物生物合成基因簇預(yù)測(cè)
采用 antiSMASH 5.0[14]軟件預(yù)測(cè)溫宿鏈霉菌TRM68367次級(jí)代謝產(chǎn)物生物合成基因簇,并對(duì)次級(jí)代謝產(chǎn)物生物合成基因簇進(jìn)行分析。
由表2可知,菌株TRM68367對(duì)蠟狀芽孢桿菌具有顯著的抑菌作用,抑菌圈直徑達(dá)到12.92±0.20 mm。
表2 菌株抑菌活性結(jié)果
將TRM68367基因組DNA于1%瓊脂糖凝膠電泳檢測(cè),結(jié)果見圖1。基于16S rRNA基因序列構(gòu)建的菌株TRM68367與其相鄰菌株的Neighbour-Joining系統(tǒng)進(jìn)化樹見圖2。
圖1 TRM68367基因組DNA瓊脂糖凝膠電泳圖
圖2 基于16S rRNA基因序列構(gòu)建的菌株TRM68367與其相鄰菌株的Neighbour-Joining系統(tǒng)進(jìn)化樹
由圖1可知,TRM68367基因組DNA目的條帶單一,基因組DNA提取質(zhì)量較好。TRM68367基因組 DNA 濃度為 32.6 ng/μL,OD260/OD280值為 1.88,DNA無(wú)降解、無(wú)污染,達(dá)到基因組DNA測(cè)序要求,將合格的樣品送往上海派森諾生物信息科技有限公司進(jìn)行全基因組測(cè)序,并對(duì)測(cè)序數(shù)據(jù)進(jìn)行基因組拼接及注釋,對(duì)注釋后的基因組數(shù)據(jù)進(jìn)行生物信息學(xué)分析。
對(duì)菌株TRM68367的16S rRNA進(jìn)行比對(duì)分析,發(fā)現(xiàn)與Streptomyces hyderabadensisOU-40T菌株最相似,其相似性為97.93%,ANI值為83.62%,DNA-DNA雜交結(jié)果較低,其dDDH值為23.47%。對(duì)菌株TRM68367采用鄰近法Neighbour-Joining進(jìn)行系統(tǒng)進(jìn)化樹的構(gòu)建,發(fā)現(xiàn)菌株TRM68367呈現(xiàn)獨(dú)立的分支,推測(cè)其可能為鏈霉菌潛在新物種。
對(duì)基因組組裝結(jié)果采用GeneMarkS和Glimmer 3.0軟件預(yù)測(cè)TRM68367和S.hyderabadensisOU-40T基因組中的基因組ORFs。使用tRNAScan-SE和RNAmmer軟件預(yù)測(cè)TRM68367和S.hyderabadensisOU-40T基因中的存在的tRNA和rRNA,結(jié)果統(tǒng)計(jì)見表3。
表3 基因組基本特征
將預(yù)測(cè)得到的9186個(gè)基因的蛋白序列與COG、KEGG和GO數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析,獲得與各數(shù)據(jù)庫(kù)相對(duì)應(yīng)的基因功能信息。
KEGG代謝通路是代謝活動(dòng)潛能及物種生命活動(dòng)特征的重要工具。通過(guò)KEGG代謝通路分類,菌株TRM68367共有2825個(gè)基因得到注釋,占總基因的30.75%。
COG按照功能一共可以分為二十五類。TRM68367基因組COG功能注釋圖見3。結(jié)果表明,TRM68367共有5243個(gè)蛋白質(zhì)序列在COG數(shù)據(jù)庫(kù)中得到注釋,占總蛋白質(zhì)序列的57.07%。由圖3可知,TRM68367預(yù)測(cè)得到的蛋白質(zhì)序列注釋主要有:369個(gè)基因參與能量生產(chǎn)和轉(zhuǎn)換(energy production and conversion,C),蛋白占比為5.81%;615個(gè)基因參與氨基酸的運(yùn)輸和代謝(amino acid transport and metabolism,E),其蛋白占比為9.68%;605個(gè)基因參與碳水化合物的運(yùn)輸和代謝(carbohydrate transport and metabolism,G),占 9.53%;753個(gè)基因參與轉(zhuǎn)錄(transcription,K),蛋白占比為11.86%;362個(gè)基因參與復(fù)制、重組和修復(fù)(replication,recombination and repair,L),其蛋白占比為5.7%;343個(gè)基因參與無(wú)機(jī)離子的轉(zhuǎn)運(yùn)和代謝(inorganic ion transport and metabolism,P),占5.4%;934個(gè)基因參與一般功能預(yù)測(cè)(general function prediction only,R),其蛋白占比 14.71% 和318個(gè)基因參與信號(hào)轉(zhuǎn)導(dǎo)機(jī)制(signal transduction mechanisms,T),其蛋白占比為5.01%。
圖3 TRM68367的COG功能注釋分類圖
GO總共有三個(gè)ontology,分別描述基因的分子功能(molecular function)、細(xì)胞組分(cellular component)及生物學(xué)過(guò)程(biological process)。TRM68367基因組的GO功能注釋結(jié)果見圖4。由圖4可知,TRM68367的基因組中共有4649個(gè)蛋白質(zhì)序列在GO數(shù)據(jù)庫(kù)中得到注釋,占總蛋白質(zhì)序列的50.60%,在細(xì)胞組分方面,主要與膜(membrane)、細(xì)胞(cell)、細(xì)胞組分(cell part)單元有關(guān);在分子功能方面,主要與催化活性(catalytic activity)、結(jié)合(binding)、轉(zhuǎn)運(yùn)活性(transporter activity)、核酸結(jié)合轉(zhuǎn)錄因子活性(nucleic acid binding transcription factor activity)單元有關(guān);在生物學(xué)過(guò)程方面,主要與代謝過(guò)程(metabolic process)、細(xì)胞過(guò)程(cellular process)、組織過(guò)程(single-organism process)、生物調(diào)節(jié)(biological regulation)單元有關(guān),表明菌株活性多集中于酶類、分化及代謝等,該菌株中含有的酶類可能對(duì)蠟狀芽孢桿菌的活性產(chǎn)生抑制作用。
圖4 TRM68367的GO功能注釋分類圖
采用antiSMASH 5.0對(duì)TRM68367基因組中潛在的次級(jí)代謝產(chǎn)物生物合成基因簇進(jìn)行預(yù)測(cè),TRM68367基因組中的次級(jí)代謝產(chǎn)物生物合成基因簇主要類型統(tǒng)計(jì)見表4。
表4 TRM68367基因組中次級(jí)代謝產(chǎn)物生物合成基因簇類型統(tǒng)計(jì)
通過(guò)對(duì)菌株TRM68367的antiSMASH分析,共預(yù)測(cè)到33個(gè)潛在次級(jí)代謝產(chǎn)物生物合成基因簇,結(jié)果表明TRM68367具有豐富的次級(jí)代謝產(chǎn)物生物合成基因簇,菌株含有 NRPS、PKS、terpene、RIPP類基因簇,其中Cluster4、Cluster22、Cluster26和Cluster28為NRPS類基因簇,Cluster4和Cluster28與環(huán)肽類化合物基因簇相似性分別為26%和4%,Cluster22與極光霉素生物合成基因簇相似性為4%,Cluster26與遠(yuǎn)霉素生物合成基因簇的相似性為17%;Cluster12、Cluster16為PKS類基因簇,Cluster12與烷基間苯二酚相生物合成基因簇相似性為100%,Cluster16與孢子色素生物合成基因簇的相似性為75%;Cluster3、Cluster6和Cluster17為terpene類基因簇,Cluster3與hopene生物合成基因簇相似性為76%,Cluster6與versipelostatin生物合成基因簇相似性為5%及Cluster17與土臭素的生物合成基因簇相似性100%;Cluster5為RIPP類基因簇,與informatipeptin生物合成基因簇的相似性為46%;Cluster23為丁內(nèi)酯類抗生素,與新制癌菌素生物合成基因簇的相似性為4%。
通過(guò)進(jìn)一步比對(duì)分析發(fā)現(xiàn)Cluster1、Cluster7和Cluster27為二酮哌嗪類基因簇,基因簇類型為CDPS(環(huán)二肽合酶),研究表明,環(huán)二肽合酶參與二酮哌嗪類化合物的生物合成[15]。由于該菌株對(duì)蠟狀芽孢桿菌具有抑菌活性,且蠟狀芽孢桿菌是二酮哌嗪類化合物典型的拮抗菌之一,因此可以確定該基因簇是導(dǎo)致菌株對(duì)蠟狀芽孢桿菌產(chǎn)生抑菌活性的關(guān)鍵基因簇;Cluster4和Cluster28含有環(huán)肽類化合物生物合成相關(guān)基因,二酮哌嗪類化合物是環(huán)肽類化合物中的一類,發(fā)現(xiàn)該基因簇對(duì)蠟狀芽孢桿菌具有顯著的抑制作用,因此可以確定該基因簇對(duì)蠟狀芽孢桿菌的活性起到抑制作用;Cluster23含有新制癌菌素核心生物合成基因,新制癌菌素是雙烯二炔類抗生素,是臨床上廣泛應(yīng)用的抗腫瘤藥物,因此可以確定TRM68367是一株能夠產(chǎn)生二酮哌嗪類化合物、環(huán)肽類化合物、新制癌菌素的潛力菌株,值得對(duì)其次級(jí)代謝產(chǎn)物進(jìn)行深度挖掘。
通過(guò)基因型特征、形態(tài)特征、生理生化特征及化學(xué)特征鑒定菌株TRM68367的分類學(xué)地位[16],與其相似菌株比較存在顯著差異,根據(jù)物種鑒定結(jié)果確定TRM68367代表鏈霉菌屬新物種,將其命名為Streptomyces wensuensisTRM68367?;?6S rRNA基因序列對(duì)微生物物種進(jìn)行鑒定的方式并不能很好的區(qū)分相似種或種內(nèi)親緣關(guān)系,作為物種鑒定的標(biāo)準(zhǔn)不具備更細(xì)致的分辨能力,相關(guān)文獻(xiàn)報(bào)道,在細(xì)菌基因組中,物種的16S rRNA基因存在異質(zhì)性,特別是極端環(huán)境來(lái)源的微生物,差異更加顯著[17]。16S rRNA基因是細(xì)菌眾多保守基因中的的一個(gè),因此僅僅通過(guò)16S rRNA基因序列對(duì)物種進(jìn)行鑒定是不足以的,可以通過(guò)對(duì)多個(gè)管家基因的聯(lián)用和尋找分辨能力更高的物種鑒定標(biāo)準(zhǔn)在一定程度上可以減少偏差和誤導(dǎo),能夠更快速的對(duì)相似種或種內(nèi)親緣關(guān)系進(jìn)行鑒定,使更多物種資源都得以利用[18]。
TRM68367是一株分離自新疆阿克蘇溫宿縣臺(tái)蘭河淤泥的鏈霉菌新物種,對(duì)其進(jìn)行活性篩選發(fā)現(xiàn)該菌株對(duì)蠟狀芽孢桿菌具有抑菌活性,因此對(duì)該菌株進(jìn)行全基因組測(cè)序及生物信息學(xué)分析,通過(guò)對(duì)基因組次級(jí)代謝產(chǎn)物生物合成基因簇的預(yù)測(cè)發(fā)現(xiàn),菌株TRM68367具有生物活性廣泛的次級(jí)代謝產(chǎn)物生物合成基因簇,如:產(chǎn)二酮哌嗪類化合物,蠟狀芽孢桿菌是二酮哌嗪類化合物典型的拮抗菌之一,對(duì)蠟狀芽孢桿菌具有顯著的抑菌作用;抗腫瘤抗生素的新制癌菌素和抑制RNA轉(zhuǎn)錄的遠(yuǎn)霉素等,可以確定該菌株具有較強(qiáng)的次級(jí)代謝潛力,為該菌株次級(jí)代謝產(chǎn)物的深度挖掘奠定了良好的理論基礎(chǔ)。目前,通過(guò)對(duì)菌株進(jìn)行全基因組測(cè)序及生物信息學(xué)分析來(lái)解析菌株次級(jí)代謝已成為天然產(chǎn)物挖掘的新方向,在TRM68367基因組中含有與代謝相關(guān)的次級(jí)代謝產(chǎn)物合成相關(guān)基因,通過(guò)對(duì)GO、COG、KEGG功能注釋分析驗(yàn)證發(fā)現(xiàn)其結(jié)果具有較高的準(zhǔn)確性。
本研究相關(guān)實(shí)驗(yàn)結(jié)果為鏈霉菌新物種的鑒定提供參考數(shù)據(jù),同時(shí)豐富了物種資源庫(kù);通過(guò)全基因組測(cè)序分析和代謝組分分析為天然產(chǎn)物的深度挖掘提供理論指導(dǎo)。