史淳樵,侯佳音
(同濟(jì)大學(xué)附屬第十人民醫(yī)院上海200072)
數(shù)字化醫(yī)院建構(gòu)中的數(shù)據(jù)利用研究
史淳樵,侯佳音
(同濟(jì)大學(xué)附屬第十人民醫(yī)院上海200072)
文章通過對(duì)數(shù)字化醫(yī)院的建構(gòu)和數(shù)據(jù)利用問題的分析,對(duì)數(shù)字化醫(yī)院系統(tǒng)建設(shè)中的數(shù)據(jù)大量浪費(fèi)問題進(jìn)行了研究,通過數(shù)據(jù)挖掘和關(guān)聯(lián)算法的方法,構(gòu)建了系統(tǒng)中的數(shù)據(jù)分析和統(tǒng)計(jì)模塊,通過這一模塊,可以使數(shù)據(jù)轉(zhuǎn)化為有用的信息,成為數(shù)字化醫(yī)院中決策支持系統(tǒng)中的關(guān)鍵點(diǎn)。
數(shù)字化醫(yī)院;信息化平臺(tái);架構(gòu);技術(shù)
結(jié)合我國實(shí)際情況來看,醫(yī)院信息化建設(shè)工作始于上世紀(jì)80年代,發(fā)展至今已經(jīng)形成了建立在面向管理基礎(chǔ)之上的醫(yī)院信息系統(tǒng),同時(shí),也形成了綜合各個(gè)專業(yè),各個(gè)科室,各個(gè)部門基礎(chǔ)之上的臨床信息系統(tǒng),通過數(shù)字化信息系統(tǒng)的建設(shè),使得醫(yī)院日常業(yè)務(wù)的開展與運(yùn)轉(zhuǎn)都能夠通過信息技術(shù)支持的方式所實(shí)現(xiàn)。但當(dāng)前已有的信息化平臺(tái)仍然存在一定的局限性,例如平臺(tái)集成度不夠,平臺(tái)功能不夠全面,系統(tǒng)數(shù)據(jù)利用程度不夠等問題。本文即從數(shù)據(jù)利用這一角度出發(fā),對(duì)圍繞信息化平臺(tái)下數(shù)字化醫(yī)院架構(gòu)方面的數(shù)據(jù)庫架構(gòu)問題展開分析與探討。
在當(dāng)前數(shù)字化醫(yī)院的建設(shè)過程當(dāng)中,很多醫(yī)院都投入了大量的資金以及人力資源展開數(shù)字化建設(shè)工作,但在建設(shè)初期,受到設(shè)計(jì)理念,設(shè)計(jì)手段等因素的影響,一定程度上對(duì)醫(yī)院數(shù)字化水平的發(fā)展造成了限制,數(shù)字化醫(yī)院建設(shè)方面的一系列問題也凸顯出來:1)從系統(tǒng)架構(gòu)的角度上來說,由于當(dāng)前絕大部分醫(yī)院的數(shù)字化建設(shè)是以現(xiàn)有信息化系統(tǒng)為基礎(chǔ)所實(shí)現(xiàn)的,沒有對(duì)數(shù)字化系統(tǒng)進(jìn)行遠(yuǎn)期規(guī)劃,雖然引入了多個(gè)應(yīng)用系統(tǒng),但信息孤島的問題仍然存在;2)從信息基礎(chǔ)的角度上來說,早期數(shù)字化醫(yī)院系統(tǒng)主要以Power Builder作為開發(fā)工具,開發(fā)結(jié)構(gòu)為C/S結(jié)構(gòu),以上技術(shù)工具發(fā)展至今,已經(jīng)無法滿足數(shù)字化醫(yī)院快速發(fā)展的需求;3)部分信息系統(tǒng)設(shè)計(jì)年代較早,不支持目前國內(nèi)外廣泛采用的醫(yī)療健康信息集成規(guī)范(integratinghealthcareenterprise,IHE)、醫(yī)療信息交換標(biāo)準(zhǔn)(health 1evel seven,HL7)等標(biāo)準(zhǔn),和其他醫(yī)療系統(tǒng)互聯(lián)性比較差,各系統(tǒng)間的集成基本上是界面集成,而不是基于工作流中的數(shù)據(jù)集成,缺乏整體設(shè)計(jì)。同時(shí),因未建立全院級(jí)別的臨床數(shù)據(jù)中心(Clinical Data Re—pository,CDR),臨床數(shù)據(jù)未進(jìn)行整合和統(tǒng)一管理,不能實(shí)現(xiàn)所有醫(yī)療數(shù)據(jù)的一元化管理和全院高度共享。
2.1電子病歷系統(tǒng)
在數(shù)字化醫(yī)院中,架構(gòu)電子病歷系統(tǒng)的主要目的是以病患為中心,形成一個(gè)以全醫(yī)療過程為中心的數(shù)據(jù)記錄以及數(shù)字化管理系統(tǒng),其目的是為數(shù)據(jù)的嵌入式訪問以及異構(gòu)系統(tǒng)的交互式操作提供技術(shù)支持。關(guān)鍵性的架構(gòu)技術(shù)包括以下幾個(gè)方面:第一,在計(jì)算機(jī)醫(yī)囑錄入系統(tǒng)的建設(shè)中,可以嘗試引入CPOE系統(tǒng),在信息技術(shù)平臺(tái)支持下,通過全圖形化界面,將醫(yī)囑錄入數(shù)據(jù)作為系統(tǒng)基礎(chǔ)字典,實(shí)現(xiàn)原有手工書寫醫(yī)囑的計(jì)算機(jī)化;第二,在電子臨床路徑系統(tǒng)的建設(shè)中,可以以臨床路徑術(shù)語庫以及臨床路徑模板庫為基礎(chǔ),構(gòu)建專用數(shù)據(jù)庫層,在此基礎(chǔ)之上,通過綁定路徑,執(zhí)行項(xiàng)目,以及變異監(jiān)控等一系列路徑執(zhí)行相關(guān)數(shù)據(jù)服務(wù),配合客戶端功能界面,支持臨床路徑執(zhí)行系統(tǒng)的合理運(yùn)轉(zhuǎn),與之相對(duì)應(yīng)的臨床路徑系統(tǒng)結(jié)構(gòu)如下圖所示(如圖1)。
圖1 臨床路徑系統(tǒng)結(jié)構(gòu)示意圖Fig.1Clinical path diagram of the system structure
2.2臨床數(shù)據(jù)中心建設(shè)
在數(shù)字化醫(yī)院中,臨床數(shù)據(jù)中心最主要的價(jià)值是通過對(duì)各種系統(tǒng)的綜合應(yīng)用,面向患者的診療提供一個(gè)以信息為中心的數(shù)據(jù)視圖,對(duì)這一系統(tǒng)的建設(shè)也是數(shù)字化醫(yī)院實(shí)現(xiàn)電子病歷系統(tǒng)運(yùn)行的基礎(chǔ)與前提條件。本數(shù)據(jù)中心基本流程如下圖所示(如圖2),數(shù)據(jù)中心建立在ISO/TS 18308國際標(biāo)準(zhǔn)基礎(chǔ)之上,通過對(duì)HL7標(biāo)準(zhǔn)組織參考模型的應(yīng)用,建設(shè)基礎(chǔ)數(shù)據(jù)模型,支持對(duì)信息組織結(jié)構(gòu),醫(yī)療術(shù)語,以及數(shù)據(jù)類型的標(biāo)準(zhǔn)化訪問,同時(shí)也支持不同系統(tǒng)相互之間的語義交互性操作,其目的是形成一個(gè)具有整體性特點(diǎn)的醫(yī)療信息環(huán)境。
圖2 臨床數(shù)據(jù)中心基本流程示意圖Fig.2Clinical data center basic flow diagram
2.3系統(tǒng)集成平臺(tái)建設(shè)
從信息化平臺(tái)構(gòu)成以及后續(xù)運(yùn)行的角度上來說,集成平臺(tái)所需要實(shí)現(xiàn)的是包括應(yīng)用,數(shù)據(jù),以及界面集成在內(nèi)的綜合集成。在建設(shè)期間需要關(guān)注的內(nèi)容有以下幾個(gè)方面:第一,應(yīng)用集成。其主要是指以應(yīng)用程序?yàn)閷?duì)象,在實(shí)時(shí)或異步條件下的信息相互交換以及調(diào)用功能。這一功能能夠以HL7、RPC、以及Web Service為基礎(chǔ),通過引入消息以及BPM中間件的方式實(shí)現(xiàn);第二是數(shù)據(jù)集成。其主要是指在醫(yī)院相關(guān)業(yè)務(wù)的應(yīng)用實(shí)踐中,通過對(duì)數(shù)據(jù)裝載工具的應(yīng)用,將HIS數(shù)據(jù)庫與ERMS數(shù)據(jù)庫交互,在高頻條件下實(shí)現(xiàn)數(shù)據(jù)庫數(shù)據(jù)的交換共享,同時(shí)也支持對(duì)數(shù)據(jù)的映射變化;第三是界面集成。其主要是指通過對(duì)Active X插件的合理應(yīng)用,實(shí)現(xiàn)應(yīng)用程序界面相互之間的關(guān)聯(lián)性引用與合成,達(dá)到集成專業(yè)瀏覽器插件的目的。
在數(shù)據(jù)倉庫基礎(chǔ)之上,數(shù)據(jù)倉庫能夠自元數(shù)據(jù)庫中按照一定的標(biāo)準(zhǔn)抽取數(shù)據(jù),在聯(lián)機(jī)基礎(chǔ)之上,對(duì)數(shù)據(jù)進(jìn)行綜合處理以及集成轉(zhuǎn)換,通過形成多維數(shù)據(jù)模型的方式,實(shí)現(xiàn)信息的交互性,一致性存取,根據(jù)這種方式構(gòu)建一個(gè)直接面向全局的數(shù)據(jù)視圖,從而達(dá)到對(duì)數(shù)據(jù)進(jìn)行自動(dòng)挖掘以及綜合分析的目的。在這一背景之下,決策支持系統(tǒng)的建設(shè)結(jié)構(gòu)主要包括以下幾個(gè)方面:第一,數(shù)據(jù)層。在這一層面當(dāng)中,主要是提供可供數(shù)據(jù)分析以及數(shù)據(jù)報(bào)告的原始性數(shù)據(jù)集合,同時(shí)對(duì)包括辦公自動(dòng)化系統(tǒng),數(shù)據(jù)管理系統(tǒng),收費(fèi)系統(tǒng),以及業(yè)務(wù)系統(tǒng)中所形成的原始數(shù)據(jù)進(jìn)行整理集合;第二,服務(wù)層。在這一層面當(dāng)中,主要面向數(shù)據(jù)層所提供的原始數(shù)據(jù)支持集成服務(wù),訪問服務(wù),以及儲(chǔ)存服務(wù)。本層次中,可以以ETL為工具,對(duì)待處理的數(shù)據(jù)進(jìn)行抽取,轉(zhuǎn)換,以及整合等一系列處理,同時(shí)按照標(biāo)準(zhǔn)將其加載至數(shù)據(jù)儲(chǔ)存區(qū)域當(dāng)中,為整個(gè)系統(tǒng)提供具有層次性特點(diǎn)的儲(chǔ)存格局;第三,分析模型層。本層次的主要功能是面向系統(tǒng)終端客戶,以一種最優(yōu)化的方式展示數(shù)據(jù),同時(shí)也支持終端用戶以一種多視角以及多維度的方式對(duì)數(shù)據(jù)進(jìn)行綜合分析。
在整個(gè)系統(tǒng)中,數(shù)據(jù)主要以藥物和病患的基本情況和數(shù)據(jù)為主,對(duì)各類藥品的使用、費(fèi)用、一般療效、副作用情況等信息的記錄,對(duì)患者的基本情況和數(shù)據(jù)的記錄存儲(chǔ)等,如表1為藥品信息表。
表1 藥品信息數(shù)據(jù)表Tab.1 Drug information data sheet
用戶信息如表2所示。
表2 用戶健康體質(zhì)信息表Tab.2Users healthy physique information table
除此以外,數(shù)據(jù)庫表中還包含了大量的繳費(fèi)數(shù)據(jù)表格,如下表3所示。
表3 繳費(fèi)數(shù)據(jù)信息表Tab.3Payment data table
如何利用數(shù)字化醫(yī)院系統(tǒng)的這些數(shù)據(jù),對(duì)其進(jìn)行分析,然后成為醫(yī)院決策系統(tǒng)的關(guān)鍵部分,這就需要設(shè)計(jì)出數(shù)據(jù)統(tǒng)計(jì)分析的模塊。對(duì)于不同的個(gè)人和體質(zhì),疾病種類,以及臨床用藥等情況進(jìn)行記錄和存儲(chǔ),設(shè)計(jì)一個(gè)模塊可以進(jìn)行這些數(shù)據(jù)的統(tǒng)計(jì)和分析,能夠給用戶提供各自所需的統(tǒng)計(jì)分析功能。系統(tǒng)通過對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析可以以圖文形式展示繳費(fèi)情況,并與市民卡或是醫(yī)院卡連接,給出了基本的費(fèi)用情況。對(duì)于這些繳費(fèi)信息和數(shù)據(jù)的分析統(tǒng)計(jì),可以引入數(shù)據(jù)挖掘技術(shù),能夠?qū)Υ鎯?chǔ)的海量數(shù)據(jù)就行科學(xué)分析,并與一卡通對(duì)接,建立起兩者之間的聯(lián)系,實(shí)現(xiàn)患者、病情、繳費(fèi)以及臨床用藥之間的關(guān)聯(lián)性分析。
在本研究中,利用關(guān)聯(lián)算法編程來實(shí)現(xiàn)這一數(shù)據(jù)挖掘的過程,采用的算法是Apriori算法,算法的核心就是首先進(jìn)行描述性的集合統(tǒng)計(jì),然后根據(jù)其在數(shù)據(jù)庫中的頻繁度來刪除非頻繁的候選,逐步刪選后最后得到系統(tǒng)所需要的數(shù)據(jù),并且對(duì)這些數(shù)據(jù)還可以進(jìn)行一般分析。
此算法的核心部分如下所示:
L1=find_frequent_1-itemsets(D);
for(k=2;Lk-1≠Φ;k++){
Ck=apriori_gen(Lk-1);
for each事務(wù)t∈D{//描述D用于計(jì)數(shù)
for each候選c∈Ct
c.count++;
}
Lk={c∈Ck|c.count≥min_sup}
}
(11)return L=UkLk;
procedure apriori_gen(Lk-1:frequent(k-1)-itemsets)
for each項(xiàng)集f1∈Lk-1
for each項(xiàng)集l2∈Lk-1
c=f1Жf2;//連接步:產(chǎn)生候選
if has_infrequent_subset(c,Lk-1)then
delete c;//刪除非頻繁的候選
reture Ck;
return TRUE;
return FALSE;
}
Lk={c∈Ck|c.count≥min_sup}
}
利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)集合關(guān)聯(lián),要分兩個(gè)階段進(jìn)行關(guān)聯(lián)規(guī)則操作:首先就是數(shù)據(jù)挖掘找出數(shù)據(jù)庫中高頻項(xiàng)目組。以以往的健康數(shù)據(jù)與體檢數(shù)據(jù)為基礎(chǔ),進(jìn)行數(shù)據(jù)挖掘,可以找到一些同步的頻繁數(shù)據(jù)集合。其次,從找到的這些數(shù)據(jù)項(xiàng)目集合中明確出他們的關(guān)聯(lián)性,這就依賴于關(guān)聯(lián)規(guī)則,通過滿足最小支持度與最小置信度來對(duì)其置信度進(jìn)行數(shù)值化計(jì)算,置信度可以用式(1)來計(jì)算。
公式(1)中,包含項(xiàng)目集的事務(wù)集合用support count(A∪B)表示。其中包含項(xiàng)目集A的事務(wù)數(shù)就用support count(A)表示,根據(jù)這個(gè)公式得到的關(guān)聯(lián)規(guī)則為,對(duì)于每個(gè)頻繁項(xiàng)目集都可以產(chǎn)生非空的子集;對(duì)于l的每個(gè)非空子集s,如果≥min_conf,那么輸出規(guī)則“s?(l-s)”。其中,min_conf是最小置信度閾值。
系統(tǒng)會(huì)調(diào)用Admin_refAction中的select_all()方法。該方法將查找出全部部門的信息,并傳入dmin/admin_ref.Jsp頁面之中Admin_regAction中的select_all()方法,在頁面右側(cè)的主框架中會(huì)顯示admin/admin_ref.Jsp頁面。這樣,就能夠?qū)芏鄶?shù)據(jù)進(jìn)行分析,例如對(duì)常規(guī)體檢數(shù)據(jù)的分析和統(tǒng)計(jì),其界面如圖3所示。
圖3 常規(guī)體檢高血壓統(tǒng)計(jì)分析圖Fig.3Statistical analysis chart routine physical hypertension
在信息化平臺(tái)基礎(chǔ)之上,通過展開數(shù)字化醫(yī)院系統(tǒng)建設(shè)的方式,一方面能夠使已有的投入得到最大限度的保護(hù),另一方面能夠?yàn)閿?shù)字化醫(yī)院建設(shè)進(jìn)程的發(fā)展提供推動(dòng)力?;谛畔⒒脚_(tái),通過數(shù)據(jù)統(tǒng)計(jì)和分析的方式,能夠達(dá)到數(shù)字化醫(yī)院的新功能——病患體質(zhì)分析和決策功能。對(duì)已有的數(shù)據(jù)進(jìn)行合理整合,也可以實(shí)現(xiàn)一系列數(shù)據(jù)的集成共享,對(duì)操作過程進(jìn)行動(dòng)態(tài)監(jiān)控,促進(jìn)醫(yī)療資源的最優(yōu)化應(yīng)用,形成一個(gè)具有更高效率的數(shù)字化平臺(tái)。
[1]王潔.數(shù)字化醫(yī)院的建設(shè)與發(fā)展趨勢(shì)的探究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2011(20):33.
[2]嚴(yán)彬.數(shù)字化醫(yī)院的發(fā)展方向及實(shí)踐[J].管理工程師,2013(2):36-38.
[3]馬錫坤,王大勇,韓雄,等.基于云計(jì)算的數(shù)字化醫(yī)院建設(shè)模式的研究[J].中國醫(yī)學(xué)裝備,2014(11):27-30.
[4]胡曉捷.數(shù)字化醫(yī)院系統(tǒng)集成方案選擇研究——以上海中醫(yī)藥大學(xué)附屬普陀醫(yī)院為例[J].網(wǎng)絡(luò)與信息,2011,25(8):36-37.
[5]王忠慶,何苗,柯艷,等.數(shù)字化醫(yī)院檢驗(yàn)信息系統(tǒng)(LIS)設(shè)計(jì)與應(yīng)用[J].實(shí)驗(yàn)室研究與探索,2013,32(7):104-106.
[6]朱甬倩,劉云,王忠民,等.數(shù)字化醫(yī)院信息門戶集成的設(shè)計(jì)與實(shí)現(xiàn)[J].中國數(shù)字醫(yī)學(xué),2013(11):31-33.
[7]余元龍,蘇韶生,程敏婷,等.數(shù)字化醫(yī)院數(shù)據(jù)資源開發(fā)研究和實(shí)踐[J].中國數(shù)字醫(yī)學(xué),2012,7(8):108-110.
[8]王海林,陳金雄,鮮榮華,等.創(chuàng)建以電子病歷為核心的智能型數(shù)字化醫(yī)院[J].中國數(shù)字醫(yī)學(xué),2010,5(7):14-16.
Study on utilization of digital hospital construction data
SHI Chun-qiao,HOU Jia-yin
(Tenth People's Hospital Affiliated to Tongji University,Shanghai 200072,China)
Through the construction and data utilization digital hospital analysis of data digital hospital system construction in wasting a lot of issues have been studied through data mining and correlation algorithm method to construct the system data analysis and statistics module through this module,you can make the data into useful information has become digitized hospital decision support system key points.
digital hospital;information platform;architecture;technology
TN99
A
1674-6236(2015)24-0022-03
2015-03-10稿件編號(hào):201503127
史淳樵(1986—),男,天津人,助理工程師。研究方向:網(wǎng)絡(luò)信息安全。