王鵬飛,王穎芳,段廣才,3,王琳琳,郭向嬌,薛澤潤,郗園林,楊海燕
(1.鄭州大學公共衛(wèi)生學院流行病學教研室,河南 鄭州 450001;2.河南科技大學醫(yī)學院公共衛(wèi)生教研室,河南 洛陽 471003;3.新鄉(xiāng)醫(yī)學院分子診斷與醫(yī)學檢驗技術河南省協(xié)同創(chuàng)新中心,河南 新鄉(xiāng) 453003)
成簇的規(guī)律間隔短回文重復序列(clustered regularly interspaced short palindromic repeats,CRISPR)是近年發(fā)現的一種對外源核酸片段具有獲得性免疫能力的結構,主要由一段不連續(xù)的正向重復序列和插入其中的間隔序列組成[1]。重復序列相對保守,具有回文結構,體現細菌在進化中的保守性,間隔序列高度可變,研究[2]顯示間隔序列來源于外源可移動遺傳因子。重復序列與間隔序列構成的單元經常被整體刪除,使得CRISPR系統(tǒng)迅速進化,一定程度上也反映了細菌在進化中的保守性和包容性[3]。志賀菌引起的細菌性痢疾(簡稱菌?。┦且粋€全球性的公共衛(wèi)生問題,尤其對發(fā)展中國家造成了重大危害,其引起的感染性腹瀉給我國帶來了巨大的經濟和社會負擔[4-5]。隨著抗生素廣泛應用,志賀菌耐藥形勢越來越嚴重,且多耐藥菌株也越來越多,而外源性耐藥基因的獲得,即耐藥基因的水平轉移,是細菌增強耐藥性的主要方式之一[5-7]。CRISPR及其相關蛋白Cas組成的CRISPR/Cas系統(tǒng),能夠形成特異免疫機制來處理外來遺傳物質入侵,可能與致病菌耐藥性的變遷有密切關系。每個CRISPR元件的重復序列對應著一種潛在的CRISPR/Cas靶標,CRISPR/Cas系統(tǒng)獲得新的間隔序列后,能夠在未來識別相應的病原體而發(fā)揮作用,故間隔序列是CRISPR/Cas系統(tǒng)最終發(fā)揮功能作用的核心序列元件[8]。目前,國際上對細菌CRISPR研究逐漸增多,本研究針對實驗室保存的志賀菌株CRISPR序列進行檢測,同時對實驗室和數據庫中志賀菌的重復序列及間隔序列進行同源性分析,了解CRISPR的結構特征,探討間隔序列的可能來源及其與同源質?;蚴删w的關系,為進一步揭示CRISPR的結構特征及其作用機制提供依據。
志賀菌種(mel-ss2004103/sx、 melsf2007065/hn、S51203)均為河南省分子醫(yī)學重點實驗室購買、收集和保存,9株全基因組志賀菌,菌株基本信息均來自于NCBI(http://www.ncbi.nlm.nih.gov/)。見表1。
表1 志賀菌基本信息Tab.1 General informations of Shigella
細菌基因組提取試劑盒(購自上海萊楓生物科技有限公司),酵母浸粉和胰蛋白胨(購自英國Oxoid公司),瓊脂粉(購自美國Sigma公司),水解酪蛋白(Mueller-Hinten,MH)和瓊脂(購自上海化學試劑有限公司),pH精密試紙(購自天津市金達化學試劑廠),其他常規(guī)試劑均為國產分析純,液體培養(yǎng)基在本實驗室按配方配制。LabcyCler basic梯度PCR儀(購自德國SensoQuest公司),DYY-Ⅲ2型穩(wěn)壓穩(wěn)流定時電泳儀和DYC31B型水平電泳槽(購自北京六一儀器廠),Gene Genius Bio imaging System(購自美國Syngene公司),THZ-92C臺式恒溫振蕩器(購自上海躍進醫(yī)療器械廠),BP221S電子天平(購自德國Sartorius公司),HVE-50型自動電熱壓力蒸汽滅菌器(購自日本Hirayama公司)。本研究采用的本地軟件及網絡服務器包括:Primer premier 5、DNAMAN、ClustalX、Bioedit、CRISPR database (http://crispr.upsud.fr/crispr/)、RNAfoldwebserver(http://rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi ) 及 weblogo(http://weblogo.berkeley.edu/logo.cgi)。
根據Database公布的志賀菌的CRISPR信息,依據側翼序列進行分組比較,選取其中的3組進行CRISPR序列的引物設計,分別為:P1(正向:5′-ACCGCTGGCATCGTTGTTG-3′,反 向:5′-ATGAGCGTGGACGAAGTGC-3′)、P2(正 向:5′-AAGCACAAGGCGGAAGCAG-3′,反 向:5′-ATCCTGACGGGCGACAAAG-3′)和P7(正向:5′-CGCTGTATTATCAGAACACCCG-3′,反 向:5′-GGGCTACGACCCTGAATGGAAT-3′),引 物設計采用Primer premier 5軟件。
采用梯度PCR方法確定3對引物的退火溫度,采用小劑量擴增體系,以mel-sf2007065/hn菌株基因組DNA為模板,根據電泳結果確定最佳退火溫度T,利用該3對引物分別對菌株基因組進行CRISPR序列進行擴增。引物梯度擴增體系(12.5μL):10× PCR 反 應 緩 沖 液 1.25 μL,dNTPs 2μL,上下游引物各0.5μL,模板DNA 1μL,Taq 酶 0.18 μL,ddH2O 7.07 μL。CRISPR序列擴增體系(50μL):10×buffer(含Mg2+)5μL,dNTPs 8μL,上下游引物各2μL,模 板 DNA 4 μL,Taq 酶 0.5 μL,ddH2O 28.5μL。PCR 反應條件:94℃ 預變性 5min;94℃變性60s,退火60s,72℃ 延伸1min,共進行32個循環(huán);最后72℃延伸10min。
委托上海生物工程股份有限公司對擴增產物核酸序列進行純化、測序,獲得測序結果后,構建出該菌株的CRISPR序列結構以及重復序列和間隔序列信息。依據P1、P2和P73對引物序列,識別全基因組志賀菌CRISPR序列,獲得相應的重復序列及間隔序列,進行多序列比對,分析重復序列的堿基頻率并對其二級結構進行預測。分析間隔序列的特點,并用BLAST對間隔序列的同源質粒/噬菌體進行檢索,并對其進行分析。
分別用P1、P2和P73對引物對 melsf2007065/hn菌株基因組進行梯度擴增,退火溫度 梯 度 為 54.6℃、55.5℃、56.7℃、57.9℃、59.3℃、60.7℃、62.1℃、63.3℃、64.5℃和65.4℃。3對引物擴增產物的效率隨著溫度有遞增或遞減,其退火溫度范圍為54.6℃~55.5℃、60.7℃~63.3℃和60.7℃~63.3℃,故確定其最佳退火溫度分別為55℃、62℃和62℃。根據最佳退火溫度,分別用P1、P2和P7對3株志賀菌的CRISPR序列進行擴增,對PCR產物進行測序。經CRISPRs Finder及多序列比對進行CRISPR序列查找。菌株的CRISPR詳細信息見表2。
根據引物序列及實驗室菌株CRISPR信息,獲得12株全基因組志賀菌相應的重復序列及間隔序列模式圖(圖1)。在鮑氏和痢疾志賀菌中,P7-CRISPR序列中僅保存一個重復序列片段,P2-CRISPR中僅存在1個間隔序列。P1-CRISPR與P2-CRISPR廣泛分布在志賀菌的4個群,其間隔序列的數目有差異。
2.2.1 不同CRISPR間隔序列的特點 在88、ss046和ss53g的菌株中,P1-CRISPR序列幾乎一致,均存在4個間隔序列,且間隔序列具有很高的同源性;在其他菌株中,P1類型的間隔序列僅有1個。僅在P1-CRISPR-88間隔序列的首尾存在個別堿基的差別,而在P2-CRISPR中卻不存在該情況,2個間隔序列完全不同,此特點體現出間隔序列的多樣性,含P7-CRISPR的菌株,其間隔序列均相同。見圖2。
表2 志賀菌CRISPR信息Tab.2 CRISPR informations of Shigella
圖1 12株志賀菌CRISPR模式圖Fig.1 CRISPR pattern diagram of 12strains of Shigella
2.2.2 間隔序列與側翼序列的聯系 在P1-CRISPR中,第一個重復序列上游側翼序列20bp與spacer 4的末端序列一致,末端重復序列下游23bp與spacer 4的前端序列一致。在其他菌株的P1-CRISPR中,也存在相同的現象,說明此現象的普遍性,可能發(fā)揮著獨特的功能。在P7-CRISPR同樣存在相似的現象,第一個重復序列上游側翼序列25bp與間隔序列的末端序列一致,但在下游,僅12bp的序列在上游側翼序列中存在,而在P2-CRISPR中不存在該現象。
圖2 P1-CRISPR-88(A)和P7-CRISPR-88(B)間隔序列與側翼序列的多序列比對圖Fig.2 Comparison chart of multiple alignment between spacers and flanking sequences P1-CRISPR-88(A)and P7-CRISPR-88(B)
2.2.3 間隔序列的同源性 將間隔序列進行BLAST(數據庫包括1683個質粒和1429個噬菌體,E<1.0),在同源質粒/噬菌體中獲得該序列對應的編碼區(qū)序列,對其進行多序列比對。在間隔序列中并未發(fā)現完全匹配的序列,但個別間隔序列對應的編碼區(qū)的產物很豐富,猜測某些間隔序列可能是2個或多個外源序列的拼接融合。有的間隔序列并沒有對應的編碼區(qū),有的間隔序列則并未發(fā)現同源質粒/噬菌體。見表3。
P7-spacer對應的編碼產物有復制蛋白、TniQ蛋白和絡氨酸重組酶等,有的序列處于非編碼區(qū),因此推測此間隔序列是多個基因特殊序列的拼接重組,通過分析,這些基因與信息基因和操縱基因有關。兩類基因形成P7spacer后,當外源遺傳元素再次作用于P7spacer時,首先通過復制蛋白基因(信息基因)進行識別,然后結合其他基因或是非編碼的調控,來指導功能基因(操縱基因)發(fā)揮作用。見圖3。
表3 間隔序列的同源質粒/噬菌體Tab.3 Homologous plasmids or phages of spacers
圖3 間隔序列可能的形成及功能機制圖Fig.3 Diagram of possible forming and functional mechanism of spacers
2.3.1 重復序列的多序列比對 在宋內志賀菌菌株中,P1-CRISPR存在5個重復序列,其余均是2個重復序列。將P1-CRISPR的重復序列進行多序列比對,獲得相應的堿基頻率圖(圖4A),P1-CRISPR的重復序列差異主要集中在第20、21和34位。P2-CRISPR的重復序列形成2種堿基頻率圖,P2-DR-1(圖4B)和P2-DR-2(圖4C),其中P2-DR-2是 CRISPR最末端的重復序列。P2-DR-1的差異僅在第25位堿基,P2-DR-2的差異在第17和18位,兩者僅是3′端的堿基具有較大差異,5′端具有很好的一致性。P7-CRISPR的重復序列則比較保守,并不存在堿基的差異(圖4D)。
2.3.2 重復序列的二級結構預測 依據重復序列的堿基頻率,對重復序列做出相應的二級結構預測(圖5),并記錄形成結構的最小自由能。P1-CRISPR重復序列形成 “多莖”結構,其最小自由能為-14.90kcal·mol-1,第20和21位于環(huán)上,第34若由T變?yōu)镚,即GC相連,則該二級結構變的更為穩(wěn)定。P2-CRISPR重復序列形成的均為 “單莖”結構,P2-DR-1的最小自由能為-9.00kcal·mol-1,其差異位于游離部分,P2-DR-2的最小自由能為-1.10kcal·mol-1,其差異同樣位于游離部分,但兩者莖區(qū)長不同,前者為5堿基,后者為3堿基,故兩者最小自由能有較大的差異。P7-CRISPR重復序列形成的也為 “多莖”結構,其最小自由能為-20.70kcal·mol-1,其重復序列比較保守,形成的二級結構較穩(wěn)定。
圖4 重復序列的堿基頻率圖Fig.4 Frequency diagram of bases of repeats
2.3.3 重復序列的同源性 對不同CRISPR重復序列進行同源聚類分析,對其進化關系進行探索(圖6),P7-CRISPR的重復序列不存在堿基差異。P1-CRISPR不同位置的重復序列存在差異,鮑氏及痢疾志賀菌的重復序列與宋內或福氏志賀菌的末端重復序列一致,宋內志賀菌的DR2-DR4序列幾乎一致,DR1同樣如此;P2-CRISPR的末端重復序列與CRISPR的5′端重復序列存在較大差異,10號與88號菌株的末端重復序列一致,而CRISPR的5′端重復序列卻存在差異。CRISPR的5′端重復序列臨近的間隔序列是菌株新近得到的外源序列,CRISPR5′端重復序列會隨著間隔序列的改變而進化,從而影響CRISPR功能。依據P1-CRISPR 5′端重復序列(即DR1)聚類分析,可將10個菌株分為3類,同樣P2-CRISPR則為2類(共11個菌株),某些特殊的重復序列可能是該菌株新功能的體現。
圖5 重復序列的二級結構預測示意圖Fig.5 Schematic diagram of secondary structures of repeats
分別對3個重復序列進行BLAST(最大顯示數默認為100,E<0.1),此3個重復序列存在于大腸桿菌,這與其菌屬親緣關系具有一定的一致性。但在不同菌屬間也存在相應的重復序列,如P1中的Salmonella,P2中的Pectobacterium和P7中的Uncultured bacterium,說明志賀菌的CRISPR系統(tǒng)中存在同源不同種的現象。見圖7(插頁三)。
本研究結果表明:本室保存的志賀菌與數據庫中志賀菌的重復序列相同或是相似,將CRISPR序列與其進行多序列比對后發(fā)現其同源性較高,此為同一種CRISPR結構;同時,部分序列存在差異,可能是因為細菌為了適應不同的生存環(huán)境,而產生的分化或是進化[1,9]。
由重復序列的多序列比對及二級結構的預測可知,不同CRISPR的重復序列保守性并不相同,重復序列位點的差異或在莖,或在環(huán),或在游離部分。莖上的差異會影響RNA二級結構的穩(wěn)定性,P2-DR-1與P2-DR-2的莖區(qū)長相差2堿基,其最小自由能變化很大,后者二級結構的穩(wěn)定性降低;環(huán)上的差異同樣會影響其二級結構的穩(wěn)定性,P1-CRISPR重復序列中環(huán)內堿基不同,其結構的穩(wěn)定性存在差異;游離部分的差異有可能影響RNA與蛋白質等結合位點的變化。研究[10]顯示:重復序列的3′端是包含PAM motif的最后幾個堿基,而PAMs最后的堿基不保守,因此重復序列的3′端游離部分才會有位點的變化。
重復序列的莖區(qū)GC水平相對較高,G∶C堿基對之間是以3個氫鍵相連,分子相互作用力更強,能夠釋放更多的自由能,更為穩(wěn)定;同時增強了轉錄后RNA二級結構的保守性,也突出重復序列在 CRISPR結構及功能上的重要性[9,11]。P2-DR-2是 CRISPR 的末端重復序列,其3′端與P2-DR-1的3′端有較大變化,同時其穩(wěn)定性也較差,而P1-CRISPR重復序列和P3-CRISPR重復序列的莖區(qū)則未見此差異。由重復序列的同源聚類分析可知,隨著菌株的進化,CRISPR也會隨之進化,其5′端重復序列會有個別位點的突變來維持自身的生存,更好地適應外界環(huán)境。CRISPR 5′端重復序列進行的志賀菌聚類分析,為利用CRISPR來發(fā)現某些特殊類型的志賀菌提供了可能。
圖6 P1-CRISPR(A)和P2-CRISPR(B)重復序列的同源樹Fig.6 Homology tree of repeats of P1-CRISPR(A)and P2-CRISPR(B)
間隔序列可能來源于質粒或噬菌體,被作為外源遺傳物質入侵細菌留下的特異性標記,在此次研究中,并沒有顯示出100%匹配,且部分間隔序列并沒有同源噬菌體或質粒,其原因可能是由于質粒或噬菌體的進化導致該基因的缺失或是目前尚未獲得此類質?;蚴删w[10]。盡管如此,間隔序列的部分序列與質?;蚴删w存在同源性,且某些間隔序列可包含同源質粒或噬菌體的多個序列編碼產物,提示某些間隔序列可能是多個間隔序列或同源質?;蚴删w中特殊序列的整合。rep基因與質粒復制子(ori)間有密切聯系,rep基因編碼的Rep蛋白可結合ori內部多個位點發(fā)揮作用;P7spacer的部分序列與質粒的rep基因序列一致,因此某些間隔序列發(fā)揮作用時,質粒ori可能參與其中。據此推測,間隔序列在形成時,至少有2類基因的重組融合,一類是起到識別和調控的信息基因,另一類是起功能作用的操縱基因。在某些CRISPR中,間隔序列的部分序列與側翼序列存在同源性,說明CRISPR中普遍存在基因重組現象,其有利于CRISPR維持自身的生存及進化,保持自身基因組的穩(wěn)定性。在同一個CRISPR中,多個間隔序列具有很高的相似性,該現象在CRISPR中并不常見,其具體作用尚未明確,有可能作為一種增強機制來維護CRISPR功能。
不同CRISPR在不同種群中的分布不同,在不同親緣關系中的重復序列具有較高的同源性,說明CRISPR同源性與菌株親緣性之間的關系并不密切,可能與CRISPR序列的水平基因轉移有關,而這一現象已在多種菌種中發(fā)現[9,12-14]。研究[15]顯示:水平基因轉移是細菌抗生素抗藥的主要原因,并且在進化過程中發(fā)揮著重要的作用。多項研究[12,16-17]已經證實:在乳酸菌和金黃色葡萄球菌中,CRISPR與耐藥性之間有關聯。因此,通過CRISPR限制志賀菌中耐藥性基因在細菌間的傳播成為可能,從而為志賀菌耐藥問題提供研究思路。
本研究采用PCR法擴增出志賀菌中存在的CRISPR,雖然所用菌株數量少,但也說明PCR方法在檢測志賀菌CRISPR中的實用性。同時分析了志賀菌CRISPR的重復序列,間隔序列的特點及同源性,說明CRISPR系統(tǒng)的多樣性及復雜性,以及未來應用的可行性。目前廣泛應用的CRISPR/CAS9基因編輯技術僅是CRISPR應用的一個方面,如何利用CRISPR的特點來探索、控制或改善志賀菌耐藥需要更多的研究。
[1]鄧凱波,霍貴成.嗜熱鏈球菌中CRISPR序列的檢測與同源性分析 [J].食品科學,2013,34(3):153-157.
[2]王 建,邱少富,宋宏彬,等.CRISPR在細菌分型和進化中的研究進展 [J].生物技術通訊,2013,24(3):414-417.
[3]Biswas A,Gagnon JN,Brouns SJ,et al.CRISPR Target:bioinformatic prediction and analysis of crRNA targets [J].RNA Biol,2013,10(5):817-827.
[4]Wang Y,Song C,Duan G,et al.Transposition of ISEcp1 modulates blaCTX-M-55-mediated Shigellaflexneri resistance to cefalothin [J].Int J Antimicrob Agents,2013,42(6):507-512.
[5]楊海燕,段廣才,張衛(wèi)東,等.河南省睢縣2001-2008年志賀菌群分布及其耐藥分析 [J].中華流行病學雜志,2010,31(3):351-353.
[6]Yang H,Sun W,Duan G,et al.Serotype distribution and characteristics of antimicrobial resistance in Shigellaisolated from Henan province,China,2001-2008 [J].Epidemiol Infect,2013,141(9):1946-1952.
[7]Yang H,Duan G,Zhu J,et al.Prevalence and characterisation of plasmid-mediated quinolone resistance and mutations in the gyrase and topoisomeraseⅣgenes among Shigellaisolates from Henan,China,between 2001and 2008 [J].Int J Antimicrob Agents,2013,42(2):173-177.
[8]Staals RH,Agari Y,Maki-Yonekura S,et al.Structure and activity of the RNA-targeting TypeⅢ-B CRISPR-Cas complex of Thermus thermophilus [J].Mol Cell,2013,52(1):135-145.
[9]鄧凱波,霍貴成,柳國霞.CRISPRs在德氏乳桿菌中的檢測與同源性分析 [J].東北農業(yè)大學學報,2011,42(11):19-23.
[10]Richter C,Chang JT,Fineran PC.Function and regulation of clustered regularly interspaced short palindromic repeats(CRISPR)/CRISPR associated(Cas)systems [J].Viruses,2012,4(10):2291-2311.
[11]Kunin V,Sorek R,Hugenholtz P.Evolutionary conservation of sequence and secondary structures in CRISPR repeats [J].Genome Biol,2007,8(4):R61.
[12]Marraffini LA,Sontheimer EJ.CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA [J].Science,2008,322(5909):1843-1845.
[13]Nozawa T,Furukawa N,Aikawa C,et al.CRISPR inhibition of prophage acquisition in Streptococcus pyogenes [J].PLoS One,2011,6(5):e19543.
[14]薛澤潤,王穎芳,段廣才,等.志賀菌成簇規(guī)律間隔短回文重復序列相關蛋白基因cas1和cas2研究 [J].中華流行病學雜志,2014,35(5):581-584.
[15]Keen EC.Paradigms of pathogenesis:targeting the mobile genetic elements of disease [J].Front Cell Infect Microbiol,2012,2:161.
[16]Burley KM,Sedgley CM.CRISPR-Cas,aprokaryotic adaptive immune system,in endodontic,oral,and multidrug-resistant hospital-acquired Enterococcus faecalis [J].J Endod,2012,38(11):1511-1515.
[17]Palmer KL,Gilmore MS.Multidrug-resistant enterococci lack CRISPR-cas [J].Microbiology,2010,1(4).doi:10.1128/mBio.00227-10.