李艷君,顏焱鋒,崔玉軍,錢揚會,趙強元
基于海洋細菌基礎(chǔ)數(shù)據(jù)庫的軟件系統(tǒng)設(shè)計
李艷君,顏焱鋒,崔玉軍,錢揚會,趙強元
目的:建立海洋細菌基礎(chǔ)數(shù)據(jù)庫軟件系統(tǒng),以實現(xiàn)對醫(yī)院收集保存的大量海洋細菌的規(guī)范化、系統(tǒng)化管理。方法:完善菌株背景資料和部分16S rRNA序列信息,編寫軟件系統(tǒng),進行調(diào)試運行。結(jié)果:建立了基于海洋細菌基礎(chǔ)數(shù)據(jù)庫的軟件系統(tǒng),具備菌種信息管理、菌種鑒定和菌種保藏功能,能夠?qū)崿F(xiàn)菌株資料的查詢、基于16S rRNA序列的菌種鑒定和菌株保藏信息的管理。結(jié)論:數(shù)據(jù)庫軟件系統(tǒng)的建立方便了大量海洋菌株的管理,同時為菌種鑒定提供了有效工具。
海洋細菌;數(shù)據(jù)庫;軟件系統(tǒng)
海洋細菌在海洋環(huán)境中分布廣泛,容易引發(fā)海上作業(yè)人員的各類感染性疾病[1],值得深入研究。本科室在前期工作中分離保存了大量海洋細菌,獲得一系列研究數(shù)據(jù)[2-4],加強了菌株收集、保存和數(shù)據(jù)的系統(tǒng)化管理,將為后續(xù)研究提供寶貴資源。然而,由于數(shù)據(jù)庫的局限性,傳統(tǒng)生化方法不足以實現(xiàn)對海洋細菌的鑒定,16S rRNA序列是實現(xiàn)細菌分類鑒定的金靶標之一,16S rRNA核酸指紋數(shù)據(jù)庫和相關(guān)軟件系統(tǒng)將為海洋細菌鑒定提供有力工具。因此,本研究綜合應(yīng)用微生物學、分子生物學和生物信息學手段,建立了大規(guī)模的海洋細菌管理查詢系統(tǒng)和16S rRNA核酸指紋數(shù)據(jù)庫,從而實現(xiàn)對我院大量海洋菌株的規(guī)范化、信息化管理以及對未知海洋細菌進行基于16S rRNA的分類鑒定。
對我院保存的816株海洋細菌背景資料、鑒定結(jié)果進行完善和補充,保證數(shù)據(jù)信息的可靠。挑選432株代表性菌株進行16S rRNA測序,同時登錄美國國家生物技術(shù)信息中心(NationalCenterforBiotechnology Information,NCBI)網(wǎng)站收錄8 000余條已知種屬、背景信息清晰的16S rRNA序列。
2.1 數(shù)據(jù)庫軟件系統(tǒng)的整體結(jié)構(gòu)
本研究設(shè)計開發(fā)的軟件系統(tǒng)以海洋細菌基礎(chǔ)數(shù)據(jù)庫為核心,包含菌種信息管理查詢、菌種鑒定和菌種保藏3個功能模塊,其整體結(jié)構(gòu)如圖1所示?;A(chǔ)數(shù)據(jù)庫為3個模塊提供所需要的數(shù)據(jù),同時可以通過人機交互界面直接調(diào)用、維護數(shù)據(jù)庫中的內(nèi)容。用戶通過人機交互界面進行數(shù)據(jù)輸入、參數(shù)選擇等操作。根據(jù)運算結(jié)果的數(shù)據(jù)特點,得到xls、txt和jpg格式的輸出文件。單機版數(shù)據(jù)庫軟件可在Win9x/me/ xp/7等微軟操作系統(tǒng)下運行,主界面如圖2所示。
2.2 菌種信息管理模塊
2.2.1 菌株檢索
軟件系統(tǒng)可實現(xiàn)單獨或者組合查詢功能,用戶可以根據(jù)菌株的某一類特征對全庫進行查詢,獲得所需信息。點擊工具欄中的“菌種信息”按鈕,將啟動菌種信息管理模塊。進入“檢索”選項卡,用戶可以自行選擇時間范圍及其他各類背景參數(shù),通過“與、或、非”邏輯運算符進行細菌背景資料的組合查詢(如圖3所示)。
圖1 軟件系統(tǒng)整體結(jié)構(gòu)示意圖
圖2 基礎(chǔ)數(shù)據(jù)庫的主界面
圖3 菌株信息管理界面
2.2.2 菌株添加
在菌株添加功能中,為保證數(shù)據(jù)庫資料的準確性和保密性,系統(tǒng)禁止一般用戶進行修改,只有得到授權(quán)后才能對數(shù)據(jù)庫中的信息進行增減和修改。點擊進入“添加”選項卡,用戶可添加新錄入的菌株信息(如圖4所示)。其中,菌株編號、物種名稱、分離時間等用紅色“*”標注的字段為必填字段。為保證數(shù)據(jù)庫錄入菌株的唯一性,添加菌株前需先檢索并確認此菌株編號在數(shù)據(jù)庫中不存在。
圖4 菌株信息添加界面
圖5 16S rRNA序列文件導(dǎo)入界面
圖6 基于16S rRNA序列比對的菌株鑒定界面
2.3 菌種鑒定模塊
菌種鑒定模塊以16S rRNA序列比對為基礎(chǔ),除了本研究中新獲得的432條16S rRNA序列信息外,我們在數(shù)據(jù)庫中還收錄了8 000多條已知種屬16S rRNA序列,并將本地化比對程序與數(shù)據(jù)庫系統(tǒng)進行了整合和優(yōu)化。點擊工具欄中的“菌種鑒定”按鈕,將啟動菌種鑒定模塊。點擊“打開”按鈕,選擇待鑒定菌株的16S rRNA的Fasta序列文件(如圖5所示)。點擊“比對”按鈕,若干分鐘后,界面下方將出現(xiàn)待鑒定菌株與本地化16S rRNA數(shù)據(jù)庫的比對結(jié)果,系統(tǒng)通過序列的一致性參數(shù)及覆蓋比例計算相似性指數(shù)(similar index,SI),按照從高到低的順序顯示1~5條(用戶可選)序列在列表中(如圖6所示)。點擊“輸出結(jié)果至文件”按鈕,可以將鑒定結(jié)果輸出至本地Excel文件。
2.4 菌種保藏模塊
菌種保存模塊以海洋細菌基礎(chǔ)數(shù)據(jù)庫為核心,記錄菌種的保藏位置、保種數(shù)量、剩余數(shù)量等資料,并可根據(jù)菌種的使用情況進行實時更新;同時菌種的保藏資料與菌種的背景資料庫進行了關(guān)聯(lián),可方便調(diào)用其分離時間、地點、鑒定結(jié)果等信息,方便臨床及科研人員對海洋細菌分離株進行深入研究。點擊工具欄中的“菌種保藏”按鈕,將啟動菌種保藏模塊,用戶在“菌株編號”一欄中輸入菌株編號后,點擊“檢索”按鈕,菌種的背景信息及保藏信息將顯示在對應(yīng)的文本欄中。此時除“菌株編號”不能編輯外,保種數(shù)量、剩余數(shù)量及存儲位置等信息均可任意修改,編輯完成后點擊“修改”按鈕即可保存入庫。如果此菌株在庫中已不存在,用戶可點擊“刪除”按鈕對其進行刪除操作(如圖7所示)。
圖7 菌種保藏管理界面
3.1 數(shù)據(jù)庫的構(gòu)建
我們采用Microsoft Access 2007構(gòu)建底層的關(guān)系數(shù)據(jù)庫[5],數(shù)據(jù)庫主要由海洋細菌背景信息和NCBI 16S rRNA序列信息2個部分組成,在Access中分別以對應(yīng)名稱的二維表格實現(xiàn)。
海洋背景信息表為本底數(shù)據(jù)庫,是軟件系統(tǒng)管理和保藏模塊的直接操作對象,包含菌株編號、菌株來源、分離時間、分離地點、物種名稱、經(jīng)度、緯度、VETIK生化鑒定結(jié)果、16S rRNA鑒定結(jié)果、保種數(shù)量、存儲位置和剩余數(shù)量等12個特征屬性,分別以文本或數(shù)字形式存儲,其中“菌株編號”被設(shè)為主鍵。
NCBI 16S rRNA序列信息表的作用主要是為軟件系統(tǒng)的菌株鑒定功能提供16S rRNA序列及已知菌株的物種分類信息,是對NCBI數(shù)據(jù)庫中的16S rRNA序列和背景信息整合而成的規(guī)范化表格,包含菌株ID、物種分類和DNA序列3個屬性,以文本形式存儲,其中“菌株ID”被設(shè)為主鍵。
3.2 軟件系統(tǒng)的實現(xiàn)
我們選擇Visual Studio 2010設(shè)計前臺的應(yīng)用程序,所開發(fā)的人機交互界面采用Windows視窗模式,由標題欄、菜單欄、工作窗口構(gòu)成,用以處理數(shù)據(jù)錄入、瀏覽、查詢、更新等操作。系統(tǒng)以ADO技術(shù)來連接并訪問在后臺運行的Access數(shù)據(jù)庫,用SQL語言對后臺數(shù)據(jù)庫進行檢索、添加、刪除和編輯。
為實現(xiàn)系統(tǒng)的菌株鑒定功能,我們設(shè)計了基于序列相似性的物種判斷模塊。用戶提交未知菌株的16S rRNA序列后,系統(tǒng)后臺調(diào)用NCBI開發(fā)的短序列比對工具Blast[6],對所提交的序列與數(shù)據(jù)庫中已知菌株的16S rRNA進行相似性比對。比對完成后,后臺對Blast輸出的結(jié)果進行處理,計算數(shù)據(jù)庫中已知序列與未知菌株序列的相似性指數(shù),此參數(shù)由Blast輸出結(jié)果中序列的一致性和匹配序列的覆蓋度(匹配序列的長度除以未知菌株序列的長度)相乘所得[7-9]。系統(tǒng)按照相似性高低,挑選匹配上的10條已知菌株的物種信息輸出至圖形用戶界面。
為方便用戶對數(shù)據(jù)庫進行查詢和維護,我們在設(shè)計菌株管理模塊和保藏模塊時,所編寫的SQL語言支持用戶對數(shù)據(jù)庫的模糊查詢和不同檢索條件的任意組合。
數(shù)據(jù)庫在使用過程中可根據(jù)需求進行優(yōu)化,比如增加16S rRNA構(gòu)建發(fā)育樹的功能,可以更加直觀地表現(xiàn)不同海洋細菌菌屬之間的進化關(guān)系,從而進行菌株分型的研究。臨床菌株的分離和保存也是開展后續(xù)研究不可或缺的寶貴資源,加強臨床菌株的保存和規(guī)范化管理對于后續(xù)科學研究至關(guān)重要,將該數(shù)據(jù)庫進行改造,實現(xiàn)與檢驗信息系統(tǒng)的對接,將能夠?qū)崿F(xiàn)對臨床菌株更好的保存和管理。
綜上所述,本研究構(gòu)建的海洋細菌基礎(chǔ)數(shù)據(jù)庫相關(guān)軟件系統(tǒng)能夠?qū)崿F(xiàn)對大量海洋細菌的規(guī)范化、信息化管理以及對未知菌種的快速分類鑒定,為我軍海戰(zhàn)傷員救治的戰(zhàn)備工作提供了良好支撐,并為后續(xù)更深入研究海洋細菌的致病性、耐藥性及海洋細菌活性物質(zhì)的開發(fā)利用奠定基礎(chǔ)。
[1]Vignier N,Barreau M,Olive C,et al.Human infection with Shewanella putrefaciens and S.algae:report of 16 cases in Martinique and review of the literature[J].Am J Trop Med Hyg,2013,89(1):151-156.
(????)(????)
[2]馬聰,郝秀紅,馬學斌,等.中國海域海洋細菌抗生素敏感性分析[J].中國抗生素雜志,2013,38(1):53-57.
[3]馬聰,陳昌國,蔣學兵,等.中國海域海洋細菌分布特征分析[J].解放軍醫(yī)學雜志,2012,37(9):909-913.
[4]馬驄,郝秀紅,付凱飛,等.海洋中分離的河流弧菌致病能力的研究[J].中華醫(yī)院感染學雜志,2009,19(7):734-737.
[5]SilberschatzA,KorthHF,SudarshanS.Databasesystemconcepts[M]. New York:McGraw-Hill,2002.
[6]Tatusova T A,Madden T L.BLAST 2 Sequences,a new tool for comparing protein and nucleotide sequences[J].FEMS Microbiology Letters,1999,174(2):247-250.
[7]Shine J,Dalgarno L.Determinant of cistron specificity in bacterial ribosomes[J].Nature,1975,254(5 495):34-38.
[8]Brosius J,Palmer M L,Kennedy P J,et al.Complete nucleotide sequenceofa16SribosomalRNAgenefromEscherichiacoli[J].ProceedingsoftheNationalAcademyofSciences,1978,75(10):4801-4805.
[9]Kim O S,Cho Y J,Lee K,et al.Introducing EzTaxon-e:a prokaryotic 16S rRNA gene sequence database with phylotypes that represent uncultured species[J].International journal of systematic and evolutionary microbiology,2012,62(Pt 3):716-721.
(收稿:2013-12-22 修回:2014-03-25)
Design of software system based on marine bacteria basic database
LI Yan-jun1,YAN Yan-feng2,CUI Yu-jun2,QIAN Yang-hui1,ZHAO Qiang-yuan1
(1.Department of Laboratory,Navy General Hospital,Beijing 100048,China; 2.Institute of Microbiology and Epidemiology,Academy of Military Medical Sciences,Beijing 100071,China)
ObjectiveTo establish the software system of the marine bacteria database in order to regularly and systematically manage the marine bacteria in our hospital.MethodsThe background information of bacteria and part of 16S rRNA sequences were complemented,and the software were developed and debugged.ResultsThe software based on the database was established and possessed the bacteria management,identification,and conserve modules and could realize the functions of querying bacteria information,identifying species based on 16S rRNA sequence and managing the conserved bacteria.ConclusionThe software system of the database provided useful tools for conveniently managing and identifying the marine bacteria.[Chinese Medical Equipment Journal,2015,36(1):58-60,65]
marine bacteria;database;software system
R318;TP311.13
A
1003-8868(2015)01-0058-04
10.7687/J.ISSN1003-8868.2015.01.058
國家自然科學基金(31170008);海軍總醫(yī)院創(chuàng)新培育基金(CX201003)
李艷君(1976—),女,博士,副主任醫(yī)師,主要從事微生物檢驗、海洋細菌鑒定及基因組多態(tài)性方面的研究工作,E-mail:liyanjun1230@163.com。
100048北京,海軍總醫(yī)院檢驗科(李艷君,錢揚會,趙強元);100071北京,軍事醫(yī)學科學院微生物流行病研究所分析微生物實驗室(顏焱峰,崔玉軍)
趙強元,E-mail:zhaoqiangyuan001@163.com