劉興雨, 畢春霞, 辛?xí)阅荩?付恒霞, 周明艷, 王 斌, 閆志勇*
(1.青島大學(xué)醫(yī)學(xué)部 微生物學(xué)教研室,山東 青島 266071;2.青島市市立醫(yī)院,山東 青島 266071)
寡氧單胞菌中CRISPR位點(diǎn)的分析
劉興雨1, 畢春霞2, 辛?xí)阅?, 付恒霞1, 周明艷2, 王 斌1, 閆志勇1*
(1.青島大學(xué)醫(yī)學(xué)部 微生物學(xué)教研室,山東 青島 266071;2.青島市市立醫(yī)院,山東 青島 266071)
對(duì)寡氧單胞菌基因組中的CRISPR位點(diǎn)進(jìn)行生物信息學(xué)分析。CRISPRdb數(shù)據(jù)庫(kù)中公布的和NCBI上下載的共26株寡氧單胞菌的基因組序列,分析其CRISPR位點(diǎn)的分布情況、重復(fù)序列、間隔序列以及間隔序列和噬菌體序列數(shù)量之間的關(guān)系。共發(fā)現(xiàn)15個(gè)確定的CRISPR結(jié)構(gòu)和132個(gè)可疑的CRISPR,不同菌株CRISPR結(jié)構(gòu)中的重復(fù)序列具有較強(qiáng)的保守性。間隔序列的靶向基因主要來(lái)自細(xì)菌的基因組,說(shuō)明寡氧單胞菌CRISPR的的進(jìn)化與其他細(xì)菌基因有關(guān)。此外,間隔序列與前噬菌體數(shù)量之間的負(fù)相關(guān)關(guān)系,說(shuō)明CRISPR能阻止噬菌體的入侵。寡氧單胞菌CRISPR位點(diǎn)的分析為進(jìn)一步研究耐藥性及基因組穩(wěn)定性奠定了基礎(chǔ)。
寡氧單胞菌;CRISPR;重復(fù)序列;間隔序列
成簇的規(guī)律間隔的短回文重復(fù)序列(clustered regularly interspaced short palindromic repeat,CRISPR)是近年來(lái)在細(xì)菌中發(fā)現(xiàn)的一種特殊結(jié)構(gòu),廣泛分布在古生菌和大多數(shù)細(xì)菌中。CRISPR系統(tǒng)由前導(dǎo)序列(leader sequence, LS)、同向重復(fù)序列(DR)、間隔序列(spacer)以及一系列CAS(CRISPR-associated)蛋白組成[1]。根據(jù)cas基因結(jié)構(gòu),CRISPR系統(tǒng)可以分為3個(gè)類型:typeI、typeII和typeIII。CRISPR系統(tǒng)相當(dāng)于細(xì)菌的獲得性免疫系統(tǒng),能夠阻擋噬菌體、質(zhì)粒等外來(lái)DNA侵入細(xì)菌,避免外源DNA的干擾[2-3], CRISPR系統(tǒng)因其獨(dú)特的結(jié)構(gòu)和功能引起人們的廣泛關(guān)注。寡氧單胞菌屬(Stenotrophomonas)屬于黃單胞菌目黃單胞菌科,是一類革蘭陰性的非發(fā)酵菌,其中以嗜麥芽寡氧單胞菌最為常見(jiàn)[4]。該菌分布廣泛,于水、土壤等環(huán)境中及動(dòng)物體內(nèi)皆有發(fā)現(xiàn),能產(chǎn)生多種生物活性物質(zhì),且有很強(qiáng)的代謝活性和適應(yīng)能力[5]。此外,嗜麥芽寡養(yǎng)單胞菌還是引起醫(yī)院感染的常見(jiàn)條件致病菌,尤其是近年來(lái)因各種廣譜抗菌藥物的使用以及侵入性診療技術(shù)的廣泛應(yīng)用,其所致感染的發(fā)病率正在逐漸升高,并且對(duì)大部分抗菌藥物耐藥,已越來(lái)越引起國(guó)內(nèi)外相關(guān)領(lǐng)域研究人員的重視[6]。在利用基因工程技術(shù)對(duì)嗜麥芽寡養(yǎng)單胞菌進(jìn)行實(shí)驗(yàn)室研究時(shí)發(fā)現(xiàn),不同來(lái)源的該菌菌株的外源DNA轉(zhuǎn)入操作都較為困難,成功率相對(duì)較低,且轉(zhuǎn)入的重組質(zhì)粒穩(wěn)定性差,易丟失,據(jù)此推測(cè)其對(duì)外源質(zhì)粒等的抵御可能與CRISPR系統(tǒng)有關(guān),而目前對(duì)于CRISPR的研究主要集中在腸桿菌科、嗜熱鏈球菌以及奈瑟菌等菌[7],對(duì)于寡氧單胞菌屬CRISPR系統(tǒng)的研究還未見(jiàn)報(bào)道,因此,本文采用生物信息學(xué)的方法對(duì)寡氧單胞菌屬細(xì)菌的CRISPR系統(tǒng)基因組成等進(jìn)行了分析。
1.1材料
收集CRISPRs web server(http://crispr.u-psud.fr/) CRISPRdb數(shù)據(jù)庫(kù)中公布的14株寡氧單胞菌的CRISPR信息,另從美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中下載的12株寡氧單胞菌的群基因組序列自行分析,基因編號(hào)見(jiàn)表1。
表1 寡氧單胞菌基因組序列信息
1.2方法
1.2.1 寡氧單胞菌中CRISPR位點(diǎn)查找 寡氧單胞菌基因組中CRISPR位點(diǎn)的查找主要依據(jù)CRISPRs web server(http://crispr.u-psud.fr/)完成, CRISPRdb數(shù)據(jù)庫(kù)中已經(jīng)公布了14個(gè)菌株CRISPR位點(diǎn)的基本信息;其余從NCBI上下載的12株寡氧單胞菌基因組序列中CRISPR的查找主要通過(guò)CRISPRfinder完成。
1.2.2 CRISPR位點(diǎn)重復(fù)序列的分析 主要應(yīng)用了DNAStar的MegAlign軟件,通過(guò)ClustalW 比對(duì)方法,進(jìn)行同向重復(fù)序列的比對(duì)分析,并用軟件MEGA5.0做重復(fù)序列的系統(tǒng)發(fā)育樹(shù)分析。
1.2.3 CRISPR位點(diǎn)間隔序列的分析 主要是在NCBI上通過(guò)Blastn完成,分析間隔序列的靶向基因及來(lái)源。
1.2.4 CRISPR位點(diǎn)間隔序列與噬菌體序列統(tǒng)計(jì)分析 通過(guò)Prophinder(http://aclame.ulb.ac.be/)進(jìn)行寡氧單胞菌基因組中噬菌體序列的預(yù)測(cè),用Spearman秩相關(guān)性檢驗(yàn)進(jìn)行CRISPR間隔序列與噬菌體序列數(shù)量之間的相關(guān)性分析。
2.1CRISPR結(jié)構(gòu)位點(diǎn)的基因組分布概況
CRISPRdb數(shù)據(jù)庫(kù)中已有的14個(gè)菌株中有9個(gè)CRISPR位點(diǎn)和56個(gè)可疑的CRISPR位點(diǎn)(questionable structures);NCBI上下載的12株寡氧單胞菌中有6個(gè)CRISPR位點(diǎn)和76個(gè)可疑的CRISPR位點(diǎn),一共有15個(gè)確定的CRISPR位點(diǎn)。對(duì)于15個(gè)確定的CRISPR位點(diǎn),S.maltophiliaEPM1 (GCF_000344215)中個(gè)數(shù)最多,有4個(gè),其次是S.maltophilia(GCF_000742995)中,有3個(gè),其余都只有一個(gè)。 4株具有較完整CRISPR位點(diǎn)信息菌株的4個(gè)CRISPR位點(diǎn)結(jié)構(gòu)如圖1所示,S.acidaminiphilaJCM 13310、S.nitritireducensDSM 12575和Stenotrophomonassp. Leaf70中的CRISPR系統(tǒng)結(jié)構(gòu)相同,屬于I-F型,S.ginsengisoliDSM 24757中CRISPR系統(tǒng)結(jié)構(gòu)屬于I-C型,結(jié)構(gòu)如圖1所示。
圖1 寡養(yǎng)單胞菌CRISPR位點(diǎn)結(jié)構(gòu)示意圖 Fig.1 Structure diagram of CRISPR site structure in StenotrophomonasSac:S.acidaminiphila JCM 13310;Sni:S.nitritireducens DSM 12575;Sle:Stenotrophomonas sp. Leaf70;Sgi:S.ginsengisoli DSM 24757。不同顏色的箭頭代表不同的cas基因,豎線條代表重復(fù)序列(repeat)Different colors of the arrow represents different cas gene, vertical line represents the repeat
2.2CRISPR位點(diǎn)重復(fù)序列分析
本研究所用的26個(gè)菌株共含有147個(gè)CRISPR,其中確定位點(diǎn)有15個(gè),分布在10個(gè)菌株中,其余都是可疑位點(diǎn)。對(duì)15個(gè)確定的CRISPR位點(diǎn)的重復(fù)序列進(jìn)行對(duì)比分析發(fā)現(xiàn),重復(fù)序列數(shù)量以2個(gè)居多,其中最多的是Stenotrophomonassp. Leaf70,有107個(gè),其次是S.nitritireducensDSM 12575、S.ginsengisoliDSM 24757和S.acidaminiphilaJCM 13310,分別有101、84和34個(gè),重復(fù)序列的大小為25~32 bp。對(duì)重復(fù)序列進(jìn)行分析發(fā)現(xiàn),在同一個(gè)CRISPR排列中,同向重復(fù)序列是高度保守的,一般只有1~3 bp的差異;相同的重復(fù)序列在不同的菌株中分布且具有一定的保守性,但是在同種的菌株中重復(fù)序列也存在著差異性,這種差異性體現(xiàn)在部分堿基突變以及CRISPR結(jié)構(gòu)的不同(表2)。以重復(fù)序列構(gòu)建的系統(tǒng)進(jìn)化樹(shù)(圖2)表明不同的寡氧單胞菌互相混雜,不能彼此分開(kāi),因此不能利用該序列進(jìn)行分類鑒定。
圖2 利用寡養(yǎng)單胞菌重復(fù)序列構(gòu)建的系統(tǒng)發(fā)育樹(shù) Fig.2 Phylogenetic tree based on the repeat sequences of StenotrophomonasSa1:S. acidaminiphila (GCF_001314305);Sm1:S.maltophilia EP M1 (GCF_000344215);Sm2:S.maltophilia (GCF_0007429959);Sm3:S. maltophilia (GCF_001274595);Sa2:S.acidaminiphila JCM13310;Sn:S.nitritireducens DSM 12575;Ssp:Stenotrophomonas sp. Leaf70;Sa3:S.acidaminiphila ZAC14D2_NAIMI4_2;Sm4:S. maltophilia Ab55555;Sg:S. ginsengisoli DSM 24757
重復(fù)序列菌株重復(fù)序列大小/bp重復(fù)序列數(shù)量間區(qū)序列平均大小/bpTGCCGGCCGCTGGCCGGCACCCCTGS.maltophiliaEPM1(GCF_000344215)25430S.maltophilia(GCF_000742995)25337TTGCCGGCCAGCGGCCGGCACTACCS.maltophiliaEPM1(GCF_000344215)252602525525247S.maltophilia(GCF_000742995)26253S.maltophilia(GCF_001274595)26254TTTCTGAGCTGCCTACTCGGCAGCGAACS.nitritireducensDSM125752810132Stenotrophomonassp.Leaf702810732GCCGTTGACGGTTTCCACGCCGCCGS.a(chǎn)cidaminiphila(GCF_001314305)25630S.a(chǎn)cidaminiphilaZAC14D2_NAIMI4_225630GGTAGTGCCGGCCGCTGGCCGGCAACS.maltophilia(GCF_000742995)26250GTAGGTACCGACCGTTGGTCGGTS.maltophiliaAb5555523418GTTCCCTGCCGCATAGGCAGCTCAGAAAS.a(chǎn)cidaminiphilaJCM13310283432GTTTCAATCCACGCGCCCGCGTGGGGCGCGACS.ginsengisoliDSM24757328434
2.3CRISPR位點(diǎn)間隔序列分析
在15個(gè)確定的CRISPR位點(diǎn)中共有376個(gè)間隔序列,長(zhǎng)度在18~60 bp不等。雖然在同一物種中不同CRISPR中間隔序列不同,但是在S.acidaminiphilaJCM 13310、S.nitritireducensDSM 12575和Stenotrophomonassp. Leaf70中間隔序列幾乎都在32 bp,S.maltophiliaAb55555間隔序列最短,只有18 bp。對(duì)CRISPR間隔序列進(jìn)行BLAST比對(duì)分析發(fā)現(xiàn),寡氧單胞菌CRISPR位點(diǎn)間隔序列的靶向基因主要來(lái)源于其他細(xì)菌的基因組序列,只有部分來(lái)源于質(zhì)?;蛘卟《?表3),以質(zhì)粒最多見(jiàn)。
2.4間隔序列與前噬菌體數(shù)量相關(guān)性分析
對(duì)NCBI上下載的12株寡氧單胞菌以及3株具有完整基因組序列的嗜麥芽寡氧單胞菌(S.maltophiliaJV3、S.maltophiliaK279a、S.maltophiliaR551-3)通過(guò)Prophinder進(jìn)行前噬菌體序列預(yù)測(cè),發(fā)現(xiàn)并非每個(gè)寡氧單胞菌基因組中都含有前噬菌體序列,如S.maltophiliaAU12-09和S.maltophiliaAb55555、S.maltophiliaK279a和S.maltophilia13637中最多,有5個(gè)。用Spearman秩相關(guān)系數(shù)進(jìn)行檢驗(yàn),發(fā)現(xiàn)間隔序列數(shù)量與前噬菌體數(shù)量之間存在著負(fù)相關(guān)關(guān)系(rho=-0.538,P=0.039)(圖3)。間隔序列數(shù)量與前噬菌體數(shù)量之間的負(fù)相關(guān)關(guān)系,指隨著間隔序列數(shù)量的增多,前噬菌體數(shù)量逐漸減少。
表3 部分寡氧單胞菌CRISPR位點(diǎn)間隔序列的來(lái)源分析
續(xù)表3
圖3 噬菌體數(shù)量與CRISPR數(shù)量關(guān)系Fig.3 Relationship between the number of phages and CRISPR
CRISPR相當(dāng)于細(xì)菌和古生菌的一種獲得性免疫系統(tǒng),能有效地幫助細(xì)菌抵御噬菌體或質(zhì)粒等外源DNA的侵襲。CRISPR的作用過(guò)程分為三 步:首先,當(dāng)外源DNA入侵細(xì)菌時(shí),CRISPR系統(tǒng)通過(guò)cas蛋白識(shí)別并切割其基因組中短的原型間隔序列(protospacer),并將其插入到重復(fù)序列之間并形成一個(gè)新的間隔序列;然后,當(dāng)再次受到相同的DNA侵襲時(shí),細(xì)菌通過(guò)CRISPR轉(zhuǎn)錄、加工剪接形成成熟的crRNA;最后,成熟的crRNA和特定的cas蛋白結(jié)合,識(shí)別、結(jié)合并切割外源核酸序列,破壞其完整性。近年來(lái),以CRISPR為基礎(chǔ)構(gòu)建的基因編輯技術(shù)因其操作簡(jiǎn)單、效率高,在基因工程和遺傳疾病的治療等領(lǐng)域有很高的應(yīng)用前景,已成為新的研究熱點(diǎn)[8]。因此,研究和分析細(xì)菌的CRISPR位點(diǎn)結(jié)構(gòu)對(duì)于其功能的研究和基因編輯工具的開(kāi)發(fā)及應(yīng)用都具有重要意義。
CRISPR首先發(fā)現(xiàn)于大腸埃希菌中,之后的研究表明90%的古生菌及40%的細(xì)菌中均存在著該系統(tǒng)。寡養(yǎng)單胞菌既是常見(jiàn)的環(huán)境菌,又是醫(yī)院感染中重要的條件致病菌,近來(lái)因其耐藥性和致病率逐漸增高已引起人們的關(guān)注[9]。在利用基因工程的方法對(duì)該菌的研究過(guò)程中發(fā)現(xiàn),對(duì)該菌的質(zhì)粒轉(zhuǎn)化、同源重組、修飾等操作都相對(duì)于多數(shù)其他細(xì)菌成功率低,提示寡養(yǎng)單胞菌能抵御噬菌體和質(zhì)粒等外來(lái)DNA侵入,推測(cè)可能與CRISPR系統(tǒng)的免疫功能有關(guān),因此本研究利用生物信息學(xué)的方法對(duì)寡氧單胞菌中CRISPR系統(tǒng)的基因組成及結(jié)構(gòu)進(jìn)行了分析。
本研究通過(guò)對(duì)CRISPRdb數(shù)據(jù)庫(kù)公布的及NCBI下載的26株寡氧單胞菌的CRISPR位點(diǎn)分析,共發(fā)現(xiàn)15個(gè)確定的和132個(gè)可疑的CRISPR。就確定的CRISPR位點(diǎn)而言,寡氧單胞菌中的CRISPR位點(diǎn)數(shù)量比大腸埃希菌、沙門菌、醋酸菌中要少。26個(gè)菌株均存在該系統(tǒng),且某些相同的CRISPR可分布于不同的菌株中,具有一定的保守性,提示菌株在進(jìn)化的過(guò)程中因受到相同的外源DNA侵襲而進(jìn)化方向相同,發(fā)揮相同的免疫功能。另外,CRISPR結(jié)構(gòu)的差異性可能揭示了不同菌種對(duì)外源DNA干擾抵御能力的差異性,也提示外源DNA入侵的多樣性。對(duì)15個(gè)確定的CRISPR位點(diǎn)的重復(fù)序列進(jìn)行分析發(fā)現(xiàn)重復(fù)序列數(shù)量以兩個(gè)居多,大小在18~30 bp,重復(fù)序列在不同菌株中也有一定的保守性,說(shuō)明不同菌株在遺傳進(jìn)化過(guò)程中可能形成了相同的防御體系。寡氧單胞菌重復(fù)序列的進(jìn)化分析顯示相同的重復(fù)序列在不同菌株中混雜分布,提示CRISPR主要是通過(guò)水平轉(zhuǎn)移機(jī)制在菌株間傳遞并獨(dú)立進(jìn)化。
寡氧單胞菌CRISPR位點(diǎn)的間隔序列大小在30 bp左右,靶向基因主要指向其他細(xì)菌的基因組,只有部分指向質(zhì)?;虿《?,表明寡氧單胞菌CRISPR系統(tǒng)的免疫功能主要針對(duì)其他細(xì)菌的基因。間隔序列與前噬菌體數(shù)量相關(guān)性分析發(fā)現(xiàn)間隔序列數(shù)量與前噬菌體數(shù)量之間存在著負(fù)相關(guān)關(guān)系,這與Takashi等關(guān)于Streptococcuspyogenes的研究結(jié)論相符,即CRISPR位點(diǎn)間隔序列數(shù)量越多,基因組中前噬菌體數(shù)量越少[10],提示CRISPR 限制了噬菌體對(duì)寡氧單胞菌的侵入。
本研究對(duì)寡氧單胞菌中CRISPR結(jié)構(gòu)重復(fù)序列以及間隔序列的生物信息學(xué)分析,有助于其耐藥及致病性以及CRISPR介導(dǎo)的基因敲除技術(shù)的研究,為以后的研究發(fā)展奠定了基礎(chǔ)。由于GenBank等數(shù)據(jù)庫(kù)中已公布的可用于分析的寡養(yǎng)單胞菌全基因組序列還相對(duì)較少,且其中部分全基因注釋的信息也不全面,故尚無(wú)法對(duì)CRISPR系統(tǒng)中cas基因等進(jìn)行全面分析,因此本結(jié)果尚有待于進(jìn)一步完善。
[1] Grissa I, Vergnaud G, Pourcel C. The CRISPRdb database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J]. BMC Bioinformatics, 2007, 8(1): 172.
[2] Sorek R, Kunin V, Hugenholtz P. CRISPR-a widespread system that provides acquired resistance against phages in bacteria and archaea[J]. Nat Rev Microbiol, 2008, 6(3): 181-186.
[3] Nishimasu H,Nureki O.Structures and mechanisms of CRISPR RNA-guided effector nucleases[J].Current Opinion Structural Biology, 2016,(43):68-78.
[4] Alavi P, Starcher MR, Thallinger GG, et al.Stenotrophomonascomparative genomics reveals genes and functions that differentiate beneficial and pathogenic bacteria[J]. BMC Genomics, 2014,15(1): 482-496.
[5] 秦江楠, 畢春霞, 陳秀琴,等. 嗜麥芽寡養(yǎng)單胞菌D2株smp基因缺失株的構(gòu)建及鑒定[J]. 微生物學(xué)雜志, 2014,34(3):30-35.
[6] Brooke Js.Stenotrophomonasmaltophilia: an Emerging Global Opportunistic Pathogen[J]. Clin Microbiol Rev, 2012, 25(1): 2-42.
[7] 張璐璐,嚴(yán)興,趙勇. 1型CRISPR位點(diǎn)間區(qū)序列分析在嗜熱鏈球菌菌株分型中的應(yīng)用[J]. 微生物學(xué)雜志, 2016, 36(6):29-34.
[8] Reed FA. CRISPR/Cas9 Gene Drive: Growing Pains for a New Technology[J]. Genetics, 2017, 205(3): 1037-1039.
[9] 郭雙雙, 畢春霞, 楊麗,等.嗜麥芽寡養(yǎng)單胞菌SMP蛋白的胞外可調(diào)控分泌及序列分析[J]. 微生物學(xué)雜志,2016,36(6):82-87.
[10] Nozawa T, Furukawa N, Aikawa C, et al. CRISPR inhibition of prophage acquisition inStreptococcuspyogenes[J]. PLoS One, 2011,6(5): e19543.
AnalysisofCRISPRSiteinStenotrophomonas
LIU Xing-yu1, BI Chun-xia2, XIN Xiao-ni2, FU Heng-xia1, ZHOU Ming-yan2, WANG Bin1, YAN Zhi-yong1
(1.Teach. &Res.Div.ofMicrobiol,Med.Coll.,QingdaoUni.,Qingdao266071; 2.QingdaoMunicipalHosp.,Qingdao266071)
The CRISPR site inStenotrophomonasgenome was analyzed bioinformatically. The relations among the distribution of the CRISPR sites, the repeated sequences, the spaced sequence, and the numbers of phage sequence in 26 strainsStenotrophomonasissued by the CRISPRdb database and downloaded from NCBI were analyzed. Totally 15 CRISPR structures and 132 questionable CRISPRs were found, and the repeated sequences of CRISPR structures in different strains had higher conservativeness. The targeted gene of spaced sequences mainly were from genome of bacteria, suggested that the evolution of CRISPRs inStenotrophomonaswas relating to the gene of other bacteria. In addition, the negatively correlated to the spaced sequences with the numbers of ante-phage, suggested that CRISPR could block the phages to invade. The analyses of CRISPR sites inStenotrophomonasprovided the basis for further studies on the drug resistance and genome stability.
Stenotrophomonas; CRISPR; repeated sequence; spaced sequence
山東省優(yōu)秀中青年科學(xué)家科研獎(jiǎng)勵(lì)基金項(xiàng)目(BS2011SW0005);山東省科技攻關(guān)基金項(xiàng)目(2007GG3WZ05009)
劉興雨 女,碩士研究生。研究方向?yàn)椴≡⑸飳W(xué)。E-mail:18764209709@163.com
* 通訊作者。男,博士,副教授,碩士生導(dǎo)師。研究方向?yàn)椴≡⑸飳W(xué)。Tel:0532-83780059,E-mail:yanzhiyong@qdu.edu.cn
2017-03-22;
2017-04-21
Q78;Q933
A
1005-7021(2017)04-0010-06
10.3969/j.issn.1005-7021.2017.04.002
歡 迎 投 稿 歡 迎 訂 閱