劉偉+丁長松+梁楊
摘要:中藥種質資源信息系統(tǒng)是為了提高中藥種質資源的管理效率,整合并分析中藥種質資源數(shù)據,實現(xiàn)中藥種質資源的信息化管理,更好地為科研機構、政府、企業(yè)以及藥農等服務,系統(tǒng)包含信息庫、文獻庫、基因庫3個數(shù)據庫,13個功能模塊。該系統(tǒng)既有助于對中藥種質資源相關數(shù)據的管理,又便于數(shù)據的集成、分析和統(tǒng)計,進而挖掘數(shù)據中潛在的規(guī)律和模式,并提供靈活的數(shù)據比對和可視化等功能,具有重要的實用價值和研究價值。
關鍵詞:中藥;種質資源;信息系統(tǒng);數(shù)據庫
DOI:10.3969/j.issn.1005-5304.2017.05.002
中圖分類號:R2-05 文獻標識碼:A 文章編號:1005-5304(2017)05-0005-03
Design and Implementation of Germplasm Resources Information System for Chinese Medicines LIU Wei, DING Chang-song, LIANG Yang (School of Management and Information Engineering, Hunan University of Chinese Medicine, Changsha 410208, China)
Abstract: Germplasm Resources Information System for Chinese Medicines (GRIS-CM) is designed and realized for improving the management efficiency of the germplasm resources for Chinese materia medica. The system integrates and analyzes the germplasm resources data, realizes information management of the germplasm resources for Chinese materia medica, and provides better services for scientific research institutions, governments, enterprises and medicinal herb growers. It contains 3 databases and 13 function modules, including the basic information base, literature library and gene bank. GRIS-CM can help manage the related data of germplasm resources for Chinese materia medica, and is better for data integration, analysis and statistics to find the rules and patterns. GRIS-CM provides flexible data comparison and visualization functions, and has significant practical value and research value.
Key words: Chinese materia medica; germplasm resources; information system; database
種質資源又稱遺傳資源或基因資源,是生物資源的重要組成部分。中藥種質資源是中藥材引種栽培和資源保護的基礎,是實施“中藥材生產質量管理規(guī)范”(GAP)的保證,也是確保下游產品等效性與安全性以及促進中藥行業(yè)可持續(xù)發(fā)展的基石。中藥種質資源的基礎數(shù)據、文獻資料及基因數(shù)據等對于中藥行業(yè)的可持續(xù)發(fā)展具有重要意義。
由于中藥種質資源數(shù)據規(guī)模較為龐大,采用傳統(tǒng)人工管理方法查詢和處理信息的效率較低,難以實現(xiàn)對種質資源實體庫中數(shù)據的實時調查、統(tǒng)計分析和相關查詢,不能科學、高效、直觀地提取和呈現(xiàn)數(shù)據中存在的信息,也無法全面、真實地記錄中藥種質資源的生態(tài)環(huán)境及地理分布等信息;此外,文獻庫、信息庫和基因庫相互獨立,不利于信息的整合和關聯(lián)分析,也無法提供數(shù)據的可視化、數(shù)據比對、數(shù)據挖掘等功能。因此,建設功能完善、設計合理、操作簡便的中藥種質資源信息系統(tǒng)及相應的文獻庫、信息庫和基因庫的意義重大,一方面有利于中藥種質資源的管理,另一方面有利于相關數(shù)據的集成、分析和統(tǒng)計,進而挖掘潛在的規(guī)律和模式,并提供靈活的數(shù)據比對和可視化等功能。
中藥種質資源信息系統(tǒng)的建設,可實現(xiàn)對中藥種質資源信息的集中管理和資源數(shù)據的共享,為研究者和生產者全面了解中藥種質的特性、拓寬優(yōu)質資源和遺傳基因的使用范圍、培育優(yōu)質高產的中藥材提供新的手段,對中藥行業(yè)的發(fā)展大有裨益。作為第三批湖南省高等學?!?011協(xié)同創(chuàng)新中心”——湖湘中藥資源保護與利用協(xié)同創(chuàng)新中心之中藥種質資源實體庫相配套的信息系統(tǒng),是由湖南中醫(yī)藥大學藥學院中藥鑒定與資源實驗室和湖南中醫(yī)藥大學管理與信息工程學院信息系聯(lián)合開發(fā)的一套中藥種質資源信息系統(tǒng)(Germplasm Resources Information System for Chinese Medicines,GRIS-CM),該系統(tǒng)集中藥種質資源基礎信息、地理分布信息、數(shù)量與質量信息、專家信息、市場信息、商業(yè)信息、文獻數(shù)據、基因數(shù)據于一體,可為中藥種質資源提供專業(yè)、全面的信息服務,具有重要的科研價值和社會價值。茲就GRIS-CM相關情況介紹如下。
1 系統(tǒng)分析與設計endprint
1.1 系統(tǒng)核心功能分析
GRIS-CM主要用戶包括相關政府部門工作人員、種質資源研究人員、藥農和藥企。系統(tǒng)管理員可以為注冊用戶分配相應的功能權限,在默認情況下,所有用戶都能夠實現(xiàn)對中藥種質資源數(shù)據的查詢、瀏覽、統(tǒng)計和比較等操作。
GRIS-CM提供了包括中藥種質資源基礎數(shù)據查詢比對模塊(提供數(shù)據查詢、對比分析、照片及視頻顯示等功能)、中藥種質資源基礎數(shù)據統(tǒng)計分析模塊(提供數(shù)據統(tǒng)計分析、可視化顯示統(tǒng)計結果、種質資源地圖、種質資源Web GIS等功能)、中藥種質資源基礎數(shù)據管理模塊、中藥種質資源市場及商業(yè)信息應用模塊等13個基礎功能模塊。詳見圖1。
1.2 系統(tǒng)架構設計
GRIS-CM采用多層B/S(Browser/Server,瀏覽器/服務器)架構,系統(tǒng)整體架構包括5層,分別是數(shù)據層(包含3個具有關聯(lián)性的中藥種質資源數(shù)據庫,分別用于存儲中藥種質資源基礎數(shù)據、文獻數(shù)據及基因數(shù)據)、數(shù)據訪問層(實現(xiàn)對數(shù)據庫進行增、刪、改、查等基本操作)、數(shù)據處理層(基于數(shù)據挖掘、機器學習、統(tǒng)計分析等技術,提供數(shù)據分析和應用研究功能)、業(yè)務邏輯層(實現(xiàn)信息系統(tǒng)的業(yè)務功能)和用戶接口層(為用戶提供數(shù)據查詢、顯示、分析、統(tǒng)計等操作界面)。詳見圖2。
另以圖2中的分層架構作為基礎,對每一層進行詳細設計。數(shù)據庫設計中每一個關系均滿足第三范式的要求,盡量減少冗余的數(shù)據。由于不同的中藥需使用不同屬性描述其種質資源,因此,在設計中藥種質資源基礎數(shù)據庫時,針對每一種中藥都創(chuàng)建了相應的關系表,不同中藥種質資源基礎數(shù)據表中的字段有所異同,用于完整地保存每一種中藥的種質資源數(shù)據。
2 系統(tǒng)實現(xiàn)
2.1 技術實現(xiàn)方案
GRIS-CM基于Oracle公司的主流軟件開發(fā)平臺Java EE,以及Microsoft公司的主流數(shù)據庫管理系統(tǒng)Microsoft SQL Server。采用主流面向對象編程語言Java實現(xiàn)系統(tǒng)功能,以JSP+Servlet+JavaBean實現(xiàn)系統(tǒng)的表示層(View)、控制層(Controller)和模型層(Model);Web應用的服務器端部署在Linux操作系統(tǒng)上,服務器中間件采用Apache Tomcat;數(shù)據庫部署在Windows操作系統(tǒng);Web應用系統(tǒng)通過JDBC與數(shù)據庫互聯(lián);用戶界面層主要采用JSP、HTML、CSS實現(xiàn),部分富客戶端功能使用了HTML5&CSS3及JavaScript(jQuery+JSON)等技術。詳見圖3。
2.2 系統(tǒng)物理結構
GRIS-CM物理架構(部署結構)分為3層:數(shù)據庫服務器負責數(shù)據的存儲和管理,獨立數(shù)據庫服務器可提高系統(tǒng)整體運行性能、安全性和可靠性,數(shù)據庫服務器需要較大的物理存儲空間,配備較大存儲容量硬盤;應用服務器負責業(yè)務功能程序的執(zhí)行、數(shù)據分析及挖掘相關程序,應用服務器需要具有較強的計算能力,需要配備較大的內存和主頻高的處理器;客戶端瀏覽器負責數(shù)據的輸入和呈現(xiàn),瀏覽器端負責Web頁面的顯示和JavaScript程序的執(zhí)行,在實現(xiàn)過程中需要考慮客戶端瀏覽器的兼容性和客戶端PC機的分辨率,表示層支持常用瀏覽器的各個版本。
2.3 功能界面示例
GRIS-CM集中藥種質資源數(shù)據管理、查詢、分析、挖掘等功能于一體,為中藥種質資源提供全面的、專業(yè)的信息服務,并整合Web GIS、文獻庫、基因庫,更好地為各類用戶提供服務,系統(tǒng)操作簡單,使用方便,界面人性化程度高。GRIS-CM為用戶提供了功能強大、內容豐富的種質資源查詢功能,如圖4所示杜仲種質資源查詢界面。
3 小結
GRIS-CM整合了中藥種質資源基礎信息庫、文獻庫和基因庫,提供中藥種質資源基礎信息、地理分布信息、數(shù)量與質量信息、專家信息、市場信息、商業(yè)信息、文獻數(shù)據、基因數(shù)據等的研究與應用平臺。該系統(tǒng)目前尚處于中藥種質資源整理和數(shù)據收集錄入階段,主要用戶為中藥種質資源研究人員,待數(shù)據量達到一定規(guī)模后,即可面向藥企、藥農等相關單位和個人用戶開放。該系統(tǒng)現(xiàn)有湖南省中藥種質資源數(shù)據共600多條,包括山銀花、杜仲、夏枯草、魚腥草、茯苓、玉竹、丹參、枸杞子8種中藥的種質資源數(shù)據。
在后續(xù)工作中,將進一步對中藥種質資源數(shù)據進行數(shù)據分析和挖掘研究,對中藥種質資源數(shù)據進行聚類、分類、關聯(lián)分析和異常數(shù)據檢測,進而挖掘潛在的規(guī)律和模式,建立相應的種質資源的評價及性狀篩選等模型,為中藥種質資源提供更加完整有效的信息支撐服務。此外,還將進一步對系統(tǒng)中的數(shù)據進行擴充,增加新種類的中藥以及相關種質資源數(shù)據,擬在5年內,配合在建的中藥種質資源實體庫,存儲中藥種質資源數(shù)據10 000份以上。同時,將針對不同類型的中藥,制定相應的種質資源數(shù)字化標準,為中藥種質資源信息提供更為形象的富媒體形式的存儲和呈現(xiàn),充分利用圖片、視頻等格式來形象、直觀地表達和描述種質資源信息。
總之,功能完善、設計合理、易于使用的GRIS-CM將有助于提升中藥種質資源管理和研究的效率,進而實現(xiàn)中藥種質資源數(shù)據存儲的標準化、管理的數(shù)字化和分析的智能化。endprint