亓?xí)苑?楊凌燕
醫(yī)療檔案作為記錄患者從出生到死亡的所有生命體征的變化,以及自身所從事過(guò)的與健康相關(guān)的一切行為與事件的檔案,其內(nèi)容主要包括患者生活習(xí)慣、既往病史、診治情況、家族病史、現(xiàn)病史、體檢結(jié)果及疾病過(guò)程記錄等。醫(yī)療檔案具有即時(shí)性、碎片化、非結(jié)構(gòu)化、數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜、來(lái)源多樣等特點(diǎn)。隨著信息化、物聯(lián)網(wǎng)技術(shù)的發(fā)展,特別是自動(dòng)化采集技術(shù)在臨床的廣泛采用,醫(yī)療檔案數(shù)據(jù)呈現(xiàn)暴增趨勢(shì),且來(lái)源于不同的業(yè)務(wù)系統(tǒng)。傳統(tǒng)的檢索技術(shù)難以滿足海量數(shù)據(jù)實(shí)時(shí)檢索的功能需求,醫(yī)療檔案大數(shù)據(jù)檢索技術(shù)研究具有較大的現(xiàn)實(shí)需求。
隨著分布式存儲(chǔ)、內(nèi)存計(jì)算、云計(jì)算等大數(shù)據(jù)管理技術(shù)的發(fā)展及應(yīng)用,基于分布式檢索技術(shù)構(gòu)建海量數(shù)據(jù)管理系統(tǒng)逐漸成為研究及應(yīng)用的熱點(diǎn),目前已應(yīng)用于圖書(shū)管理、科研管理等領(lǐng)域。本研究基于構(gòu)建醫(yī)療檔案檢索系統(tǒng),著力解決當(dāng)前存在的海量醫(yī)療檔案數(shù)據(jù)檢索效率低下的技術(shù)問(wèn)題,完善數(shù)據(jù)管理功能,進(jìn)而為數(shù)據(jù)應(yīng)用及挖掘分析提供支持,實(shí)現(xiàn)醫(yī)療檔案數(shù)據(jù)管理標(biāo)準(zhǔn)化、自動(dòng)化[1-2]。
大數(shù)據(jù)歷史醫(yī)療檔案檢索系統(tǒng)能夠整合不同業(yè)務(wù)系統(tǒng)存儲(chǔ)及組織管理形式,構(gòu)建海量數(shù)據(jù)存儲(chǔ),實(shí)現(xiàn)數(shù)據(jù)采集、整理及存儲(chǔ)等基礎(chǔ)功能,降低檔案數(shù)據(jù)采集的復(fù)雜性,增強(qiáng)系統(tǒng)可擴(kuò)展性,并在此基礎(chǔ)上構(gòu)建醫(yī)療檔案檢索系統(tǒng),實(shí)現(xiàn)跨業(yè)務(wù)系統(tǒng)檔案數(shù)據(jù)關(guān)聯(lián)檢索、數(shù)據(jù)挖掘等功能,提高數(shù)據(jù)利用效率[3]。實(shí)現(xiàn)檔案數(shù)據(jù)價(jià)值從檔案數(shù)據(jù)本身變?yōu)闄n案數(shù)據(jù)深層挖掘以及數(shù)據(jù)組合;檔案采集從被動(dòng)的數(shù)據(jù)收集變?yōu)橹鲃?dòng)檔案數(shù)據(jù)抽??;檔案管理從檔案記錄管理變?yōu)楹A繑?shù)據(jù)集合管理;檔案服務(wù)從被動(dòng)式滿足臨床查詢(xún)需求變?yōu)橹鲃?dòng)式服務(wù)提供,內(nèi)容從查詢(xún)擴(kuò)展到統(tǒng)計(jì)、建模等多項(xiàng)內(nèi)容。
(1)數(shù)據(jù)采集。數(shù)據(jù)資源采集技術(shù)是實(shí)現(xiàn)醫(yī)療檔案數(shù)據(jù)管理的基礎(chǔ),建立數(shù)據(jù)采集機(jī)制是構(gòu)建檔案數(shù)據(jù)采集組織模式的重要前提,實(shí)現(xiàn)多接口數(shù)據(jù)對(duì)接、檔案數(shù)據(jù)抽取、清洗轉(zhuǎn)換及數(shù)據(jù)加載過(guò)程,即從各個(gè)不同的數(shù)據(jù)源抽取到數(shù)據(jù)存儲(chǔ)(operational data store,ODS)中,完成數(shù)據(jù)采集過(guò)程[4]。
(2)數(shù)據(jù)集成。大數(shù)據(jù)環(huán)境下,數(shù)據(jù)集成是醫(yī)療檔案數(shù)據(jù)管理需要解決的首要問(wèn)題。由于各個(gè)業(yè)務(wù)系統(tǒng)間缺乏直接數(shù)據(jù)關(guān)聯(lián),無(wú)法構(gòu)建數(shù)據(jù)集合,從而限制了數(shù)據(jù)規(guī)模的增長(zhǎng)[5]。同時(shí),醫(yī)療機(jī)構(gòu)內(nèi)業(yè)務(wù)系統(tǒng)間無(wú)法形成數(shù)據(jù)交換。
在大數(shù)據(jù)環(huán)境下,醫(yī)療業(yè)務(wù)系統(tǒng)間實(shí)現(xiàn)了數(shù)據(jù)連接及共享,為更高層次的數(shù)據(jù)應(yīng)用創(chuàng)造了條件。醫(yī)療檔案信息從提供檔案數(shù)據(jù)本身變?yōu)闄n案數(shù)據(jù)深層挖掘以及數(shù)據(jù)組合,即轉(zhuǎn)變?cè)泄芾砟J?,將直接?shù)據(jù)查詢(xún)轉(zhuǎn)變?yōu)閿?shù)據(jù)關(guān)聯(lián)分析,加速檔案信息一體化進(jìn)程[2]。
在大數(shù)據(jù)時(shí)代,醫(yī)療檔案數(shù)據(jù)急劇增長(zhǎng),既包括結(jié)構(gòu)化記錄又包括了大量非結(jié)構(gòu)數(shù)據(jù)。如何遷移業(yè)務(wù)系統(tǒng)數(shù)據(jù),實(shí)現(xiàn)海量數(shù)據(jù)的集中存儲(chǔ),動(dòng)態(tài)分配存儲(chǔ)資源,降低數(shù)據(jù)管理的復(fù)雜性,提高存儲(chǔ)資源的利用率,并增強(qiáng)各業(yè)務(wù)系統(tǒng)的可擴(kuò)展性,保障各業(yè)務(wù)工作的連續(xù)性和數(shù)據(jù)安全性,成為當(dāng)前面臨的重要問(wèn)題[4]。
隨著業(yè)務(wù)系統(tǒng)的整合,醫(yī)療檔案數(shù)據(jù)量急劇增長(zhǎng),原有的醫(yī)療檔案信息檢索方法已經(jīng)無(wú)法適應(yīng)當(dāng)前需求,需要提升檢索算法效率,提升數(shù)據(jù)檢索的響應(yīng)速度[4]。
醫(yī)療檔案數(shù)據(jù)不僅數(shù)據(jù)量劇增,信息復(fù)雜度也逐漸提高,既增加了檔案存儲(chǔ)的難度,又帶來(lái)了數(shù)據(jù)分析的新需求。采用大數(shù)據(jù)技術(shù),可針對(duì)海量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分類(lèi)、聚類(lèi)、回歸以及協(xié)同過(guò)濾等操作,分析數(shù)據(jù)特征,挖掘應(yīng)用價(jià)值,達(dá)到提高數(shù)據(jù)集的利用率的目的。
大數(shù)據(jù)歷史醫(yī)療檔案檢索系統(tǒng)將不同業(yè)務(wù)系統(tǒng)中結(jié)構(gòu)化數(shù)據(jù)經(jīng)抽取轉(zhuǎn)換加載(extract transform load,ETL)過(guò)程關(guān)聯(lián)裝配后存儲(chǔ)到關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng),獨(dú)立文檔等存儲(chǔ)入Hadoop分布式文件系統(tǒng)(Hadoop distributed file system,HDFS)后經(jīng)分詞處理后生成關(guān)鍵詞庫(kù),并在此基礎(chǔ)上建立索引。當(dāng)用戶發(fā)出請(qǐng)求后,系統(tǒng)根據(jù)用戶需求判斷應(yīng)用類(lèi)型,調(diào)用對(duì)應(yīng)功能。其中,采用ETL工具Kettle實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)數(shù)據(jù)抽取、轉(zhuǎn)換及載入功能,采用HDFS技術(shù)實(shí)現(xiàn)檔案數(shù)據(jù)的分布式存儲(chǔ)[5];采用Elasticsearch分布式的關(guān)聯(lián)檢索技術(shù)實(shí)現(xiàn)檢索應(yīng)用,數(shù)據(jù)挖掘及分析功能由Apache Spark實(shí)現(xiàn)。系統(tǒng)結(jié)構(gòu)如圖1所示。
數(shù)據(jù)抽取采用開(kāi)源工具Kettle實(shí)現(xiàn),該工具可以在Window、Linux及Unix上運(yùn)行,綠色無(wú)需安裝,數(shù)據(jù)抽取高效穩(wěn)定??赏ㄟ^(guò)圖形化的用戶環(huán)境,實(shí)現(xiàn)管理來(lái)自不同數(shù)據(jù)庫(kù)的數(shù)據(jù)。通過(guò)編制transformation和job腳本實(shí)現(xiàn)抽取過(guò)程,其中通過(guò)transformation完成數(shù)據(jù)轉(zhuǎn)換,job則完成整個(gè)工作流的控制[6-7]??蓪?shí)現(xiàn)在應(yīng)用程序或數(shù)據(jù)庫(kù)之間進(jìn)行數(shù)據(jù)遷移、從數(shù)據(jù)庫(kù)導(dǎo)出數(shù)據(jù)到文件、導(dǎo)入大規(guī)模數(shù)據(jù)到數(shù)據(jù)庫(kù)以及數(shù)據(jù)清洗并集成入應(yīng)用程序等功能。并使用job作業(yè)方式或操作系統(tǒng)調(diào)度,來(lái)執(zhí)行一個(gè)轉(zhuǎn)換文件或作業(yè)文件,通過(guò)集群的方式在多臺(tái)機(jī)器上部署,實(shí)現(xiàn)分布式檢索功能[6]。
建立字段映射表,將業(yè)務(wù)系統(tǒng)數(shù)據(jù)與抽取數(shù)據(jù)建立對(duì)應(yīng)關(guān)系。按照數(shù)據(jù)過(guò)濾條件,過(guò)濾并轉(zhuǎn)換數(shù)據(jù)后載入存儲(chǔ)結(jié)構(gòu)(如圖2所示)。
建立大數(shù)據(jù)存儲(chǔ)是實(shí)施醫(yī)療檔案應(yīng)用的首要問(wèn)題。面對(duì)海量數(shù)據(jù),首先需要解決存儲(chǔ)空間不足的狀況,空間不足無(wú)法確保數(shù)據(jù)集的完整性。同時(shí),還需要解決容量擴(kuò)充、容災(zāi)備份等現(xiàn)實(shí)需求。
圖1 大數(shù)據(jù)歷史醫(yī)療檔案檢索系統(tǒng)結(jié)構(gòu)圖
圖2 大數(shù)據(jù)歷史醫(yī)療檔案檢索系統(tǒng)數(shù)據(jù)ETL流程圖
圖3 大數(shù)據(jù)歷史醫(yī)療檔案檢索系統(tǒng)數(shù)據(jù)分析流程圖
系統(tǒng)存儲(chǔ)采用Hadoop HDFS實(shí)現(xiàn),作為高度容錯(cuò)性的系統(tǒng),HDFS能提供高吞吐量的數(shù)據(jù)訪問(wèn),適合大規(guī)模數(shù)據(jù)集上的應(yīng)用[4]??蓪?shí)現(xiàn)流式讀取文件系統(tǒng)數(shù)據(jù)的目的,該系統(tǒng)有著高容錯(cuò)性的特點(diǎn),并且適合部署在低廉的硬件上??商峁└咄掏铝吭L問(wèn)應(yīng)用程序的數(shù)據(jù),適合醫(yī)療檔案大數(shù)據(jù)集的應(yīng)用系統(tǒng)。與此同時(shí),HDFS支持大文件存儲(chǔ),同時(shí)滿足文本信息以及圖片、視頻等媒體信息的存儲(chǔ)需求[5]。
系統(tǒng)數(shù)據(jù)分析功能包括:統(tǒng)計(jì)分析及部分機(jī)器學(xué)習(xí)功能。用戶選取需要分析的邏輯字段名,設(shè)置字段間關(guān)聯(lián),系統(tǒng)根據(jù)字段間連接建立邏輯組合。系統(tǒng)執(zhí)行操作校驗(yàn),針對(duì)字段類(lèi)型、字段數(shù)量以及記錄數(shù)進(jìn)行核驗(yàn),核驗(yàn)無(wú)誤后用戶選取分析方法,選擇對(duì)應(yīng)參數(shù)。系統(tǒng)生成查詢(xún)記錄請(qǐng)求并執(zhí)行分析算法,生成結(jié)果后存儲(chǔ)模型并顯示報(bào)告。系統(tǒng)操作流程如圖3所示。
在傳統(tǒng)的機(jī)器學(xué)習(xí)算法訓(xùn)練及應(yīng)用中,由于技術(shù)和單機(jī)存儲(chǔ)的限制,只能在少量數(shù)據(jù)上使用。即傳統(tǒng)統(tǒng)計(jì)和(或)機(jī)器學(xué)習(xí)依賴(lài)于數(shù)據(jù)抽樣,而實(shí)際中樣本難以實(shí)現(xiàn)隨機(jī),導(dǎo)致學(xué)習(xí)模型及測(cè)試精準(zhǔn)度不足。系統(tǒng)采用HDFS等分布式文件系統(tǒng),存儲(chǔ)海量數(shù)據(jù)成為可能[8-9]。通過(guò)建立分布式數(shù)據(jù)分析工具,從根本上解決了統(tǒng)計(jì)隨機(jī)性的問(wèn)題。然而,由于Hadoop分布式機(jī)器學(xué)習(xí)過(guò)程資源迭代消耗巨大,特別是持久化過(guò)程,成為多次迭代的算法性能瓶頸[9]。Spark采用的內(nèi)存計(jì)算模式以及實(shí)時(shí)批計(jì)算功能,克服了Hadoop MapReduce模式的瓶頸。同時(shí),Mlib囊括了常用的機(jī)器學(xué)習(xí)算法和工具,包括分類(lèi)、回歸、聚類(lèi)、協(xié)同過(guò)濾、降維等,同時(shí)還包括底層的優(yōu)化原語(yǔ)和高層的管道API等功能。
以構(gòu)建Spark Mlib支持向量機(jī)(support vector machine,SVM)為例描述算法流程:
數(shù)據(jù)可視化工具采用Echarts2.0實(shí)現(xiàn),該工具具有可視化類(lèi)型豐富、刷新速度快的優(yōu)點(diǎn),可直接支持二維數(shù)據(jù)表、鍵值對(duì)、TypedArray等數(shù)據(jù)類(lèi)型,兼容性高,支持IE、Chrome、Firefox等多種瀏覽器類(lèi)型。當(dāng)用戶發(fā)出可視化請(qǐng)求時(shí),前端頁(yè)面向后端發(fā)出數(shù)據(jù)請(qǐng)求,完成檢索后將查詢(xún)結(jié)果組裝后輸出到可視化組件,向用戶呈現(xiàn)檢索結(jié)果。
Hadoop Web UI作為HadoopHDFS分布式數(shù)據(jù)管理工具,但其功能及操作習(xí)慣難以符合醫(yī)療機(jī)構(gòu)管理人員的要求。本研究基于HDFS java API接口開(kāi)發(fā)了基于HDFS的醫(yī)療檔案數(shù)據(jù)管理工具,實(shí)現(xiàn)HDFS下容災(zāi)備份、文件系統(tǒng)訪問(wèn)、文件創(chuàng)建、刪除文件、條件檢索文件、文件上傳、文件下載、文件重命名等方法,便于數(shù)據(jù)管理。同時(shí),提供了采用HDFS JAVA API功能接口實(shí)現(xiàn)針對(duì)HDFS操作的二次開(kāi)發(fā)。
如下所示,以實(shí)現(xiàn)文件系統(tǒng)訪問(wèn)功能為例描述開(kāi)發(fā)流程:
圖4 大數(shù)據(jù)歷史醫(yī)療檔案檢索系統(tǒng)數(shù)據(jù)檢索流程圖
系統(tǒng)數(shù)據(jù)檢索采用結(jié)構(gòu)化數(shù)據(jù)多維數(shù)據(jù)查詢(xún),結(jié)合全文數(shù)據(jù)庫(kù)關(guān)聯(lián)檢索實(shí)現(xiàn)。其中:①Elasticsearch實(shí)現(xiàn),Elasticsearch基于Lucene實(shí)現(xiàn),可提供分布式搜索、分布式索引功能;②無(wú)需配置即可實(shí)現(xiàn)分布式功能,可根據(jù)預(yù)先設(shè)置的分片數(shù)、冗余,對(duì)索引文件進(jìn)行分片;③根據(jù)當(dāng)前節(jié)點(diǎn)數(shù)量以及節(jié)點(diǎn)上索引分片數(shù),實(shí)現(xiàn)自動(dòng)負(fù)載均衡;④提供restful接口并支持多種持久化策略。
當(dāng)用戶發(fā)出檢索請(qǐng)求時(shí),系統(tǒng)判斷請(qǐng)求任務(wù)類(lèi)型,為統(tǒng)計(jì)查詢(xún)?nèi)蝿?wù)時(shí),可選用數(shù)據(jù)倉(cāng)庫(kù)查詢(xún)方法或Spark mlib統(tǒng)計(jì)查詢(xún)算法;當(dāng)為普通查詢(xún)?nèi)蝿?wù)時(shí),對(duì)照索引在數(shù)據(jù)集合中分別實(shí)施查詢(xún)。在結(jié)構(gòu)化數(shù)據(jù)集中,采用Spark SQL直接執(zhí)行對(duì)應(yīng)查詢(xún)?nèi)蝿?wù);在非結(jié)構(gòu)數(shù)據(jù)集合中,采用Elasticsearch完成檢索,兩部分檢索結(jié)果經(jīng)組合后呈現(xiàn)至用戶。系統(tǒng)流程如圖4所示。
Spark SQL作為Spark數(shù)據(jù)查詢(xún)組件,能夠兼容常規(guī)數(shù)據(jù)庫(kù)查詢(xún),同時(shí)也能夠符合大數(shù)據(jù)條件下多種數(shù)據(jù)訪問(wèn)要求,其語(yǔ)法接近SQL語(yǔ)句,因此,系統(tǒng)通過(guò)該組件開(kāi)發(fā)實(shí)現(xiàn)了關(guān)系數(shù)據(jù)庫(kù)、HDFS及HIVE等數(shù)據(jù)源訪問(wèn)功能。Elasticsearch檢索通過(guò)構(gòu)建個(gè)性化詞典、建立數(shù)據(jù)索引、開(kāi)發(fā)數(shù)據(jù)檢索算法等步驟實(shí)現(xiàn)[10-11]。分詞采用Ansj分詞組件實(shí)現(xiàn),詞典基于分詞比對(duì)及發(fā)現(xiàn)機(jī)制構(gòu)建,繼而通過(guò)分詞詞元倒排后構(gòu)建索引[11-12]。系統(tǒng)采用分布式搜索及詞元關(guān)聯(lián)機(jī)制構(gòu)建檢索算法,將用戶輸入分詞后,通過(guò)檢索算法實(shí)現(xiàn)檢索功能[13]。
傳統(tǒng)檔案數(shù)據(jù)管理通過(guò)檔案文件收集、整理、存儲(chǔ)、統(tǒng)計(jì)等操作,實(shí)現(xiàn)檔案的集中化管理。基于大數(shù)據(jù)技術(shù)構(gòu)建的歷史醫(yī)療檔案管理模式采用面向用戶需求提供信息服務(wù)的應(yīng)用平臺(tái)。采用大數(shù)據(jù)醫(yī)療檔案信息化管理可實(shí)現(xiàn)醫(yī)療檔案數(shù)據(jù)抽取、整合、檢索及分析工作,改變了傳統(tǒng)應(yīng)用模式,將原有的被動(dòng)式數(shù)據(jù)服務(wù)模式轉(zhuǎn)換為主動(dòng)式服務(wù)提供模式。而在醫(yī)療檔案信息化進(jìn)程中,隨著眾多業(yè)務(wù)系統(tǒng)廣泛使用,數(shù)據(jù)呈現(xiàn)豐富和動(dòng)態(tài)化,在大數(shù)據(jù)技術(shù)的支撐下,實(shí)現(xiàn)數(shù)據(jù)接口統(tǒng)一規(guī)范、統(tǒng)一標(biāo)準(zhǔn),檔案信息資源可有效地實(shí)現(xiàn)采集、整合,構(gòu)建大數(shù)據(jù)集合。系統(tǒng)功能界面如圖5所示。
圖5 大數(shù)據(jù)歷史醫(yī)療檔案檢索系統(tǒng)界面圖
系統(tǒng)在關(guān)聯(lián)檢索技術(shù)的應(yīng)用下,實(shí)現(xiàn)對(duì)檔案信息的全文查詢(xún)、組合查詢(xún)、分類(lèi)查詢(xún)等,優(yōu)化檢索過(guò)程,較之傳統(tǒng)查詢(xún)方法,在單表查詢(xún)、復(fù)合查詢(xún)、跨庫(kù)查詢(xún)以及多維數(shù)據(jù)表檢索性能均有所提高,同時(shí)彌補(bǔ)了傳統(tǒng)方法難以實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)檢索的狀況[14]。此外,先進(jìn)的大數(shù)據(jù)存儲(chǔ)技術(shù)克服了檔案持久化的問(wèn)題,最大限度地提高了存儲(chǔ)空間的利用率,解決了傳統(tǒng)檔案完整性受限于存儲(chǔ)空間的難題。大數(shù)據(jù)背景下的復(fù)合醫(yī)療檔案數(shù)據(jù)集分析難度加大,原有的檔案信息分析方法和模式已經(jīng)無(wú)法適應(yīng)大數(shù)據(jù)時(shí)代的需要,系統(tǒng)采用Spark Mlib算法工具包提升了分布式環(huán)境下檔案信息的挖掘和分析利用效率,提升對(duì)用戶需求的響應(yīng)速度[15]。由此可見(jiàn),基于大數(shù)據(jù)的檔案信息化建設(shè)極大地拓展了醫(yī)療檔案數(shù)據(jù)來(lái)源,提升了應(yīng)用范圍和醫(yī)療機(jī)構(gòu)整體的應(yīng)用管理水平。查詢(xún)功能測(cè)試如圖6所示。
圖6 大數(shù)據(jù)歷史醫(yī)療檔案檢索系統(tǒng)查詢(xún)功能測(cè)試界面圖
隨著信息技術(shù)的發(fā)展,醫(yī)療檔案管理中數(shù)據(jù)資源如何獲取及高效應(yīng)用逐漸成為研究的焦點(diǎn),隨之而來(lái)的業(yè)務(wù)數(shù)據(jù)關(guān)聯(lián)、信息檢索、數(shù)據(jù)資源挖掘分析、數(shù)據(jù)檢索以及數(shù)據(jù)服務(wù)提供均面臨新的挑戰(zhàn)。隨著大數(shù)據(jù)技術(shù)發(fā)展,尤其是在圖書(shū)檔案、科研平臺(tái)等領(lǐng)域的成功應(yīng)用,引發(fā)了相關(guān)學(xué)科管理模式的變革,并以高效、全面、快捷及安全的特點(diǎn),印證了其在海量數(shù)據(jù)管理及應(yīng)用的巨大優(yōu)勢(shì)[12,16]。針對(duì)醫(yī)療檔案數(shù)據(jù)集采集、海量存儲(chǔ)、關(guān)聯(lián)查詢(xún)、分析應(yīng)用等現(xiàn)實(shí)需求,本研究以大數(shù)據(jù)領(lǐng)域技術(shù)為手段,構(gòu)建基于大數(shù)據(jù)檢索系統(tǒng)構(gòu)建的歷史醫(yī)療檔案管理系統(tǒng)。經(jīng)測(cè)試運(yùn)行,該系統(tǒng)可有效提高醫(yī)療檔案數(shù)據(jù)集數(shù)據(jù)處理效率,在滿足原有業(yè)務(wù)的基礎(chǔ)上,擴(kuò)展信息服務(wù)能力,在醫(yī)療檔案信息化建設(shè)過(guò)程中,加強(qiáng)了業(yè)務(wù)系統(tǒng)中信息共享及數(shù)據(jù)集成,減少信息孤島的現(xiàn)象。同時(shí),采用大數(shù)據(jù)方法構(gòu)建數(shù)據(jù)檢索及分析工具,能夠降低數(shù)據(jù)利用難度,提高查詢(xún)效率。同時(shí),該系統(tǒng)對(duì)于其他相關(guān)領(lǐng)域的海量數(shù)據(jù)管理具有一定的借鑒作用,有待在后續(xù)研究中逐漸擴(kuò)展應(yīng)用,助力學(xué)科發(fā)展。