張志琪
嘉興市第二醫(yī)院 (浙江嘉興 314001)
聯(lián)機(jī)分析處理(on-line analysis progressing, OLAP)和數(shù)據(jù)倉庫(data warehouse,DW)是兩種典型的決策支持技術(shù)。OLAP是最近發(fā)展的數(shù)據(jù)庫系統(tǒng)的一種重要應(yīng)用[1]。它是共享多維信息、針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析的快速軟件技術(shù)。DW是面向主題的、集成的、時變的、非易失的數(shù)據(jù)集合[2]。DW是一種數(shù)據(jù)管理技術(shù),為決策分析提供有效的數(shù)據(jù)支持;而OLAP側(cè)重于DW中的數(shù)據(jù)分析,為制定決策提供信息支持[3]。OLAP模型建立在DW之上,與從大量的數(shù)據(jù)中提取或者挖掘知識密不可分。這就需要應(yīng)用數(shù)據(jù)挖掘(data mining,DM)技術(shù),它是建立在DW之上,從大量的、不完全的、模糊的、隨機(jī)的實際數(shù)據(jù)中提取隱含在其中的潛在有用信息和知識的技術(shù)。
OLAP包含一些基本的術(shù)語:變量、維(dimension)、維的層次(level)、維的成員(member)、指標(biāo)、度量(measure)、粒度;也包括一些基本多維分析操作:切片(slice)、切塊(dice)、鉆?。╠rill-up,drill-down)、聚合和旋轉(zhuǎn)(pivot)等,用以對數(shù)據(jù)進(jìn)行多維多角度分析,找出數(shù)據(jù)中蘊(yùn)含的價值。OLAP的特點是仿造用戶的多角度思考方式,提前建立多維數(shù)據(jù)模型,它使得用戶可方便快速靈活地在各個數(shù)據(jù)角度之間獲取或者綜合分析數(shù)據(jù),因此該技術(shù)才得以廣泛的研究。
20世紀(jì)60年代末,關(guān)系型數(shù)據(jù)庫之父E.F.Codd提出了關(guān)系模型,促進(jìn)了關(guān)系數(shù)據(jù)庫與聯(lián)機(jī)事務(wù)處理(on-line transaction processing,OLTP)的發(fā)展[4]。OLTP一般以快速的事務(wù)響應(yīng)和頻繁的數(shù)據(jù)修改為特征,每次事務(wù)僅僅對少量的記錄進(jìn)行操作,復(fù)雜的表連接一般不會影響系統(tǒng)的查詢性能[5],如鐵路售票系統(tǒng)和自動存款機(jī)。但當(dāng)數(shù)據(jù)庫技術(shù)逐漸廣泛的應(yīng)用于社會的各個層面,導(dǎo)致膨脹的大數(shù)據(jù)時代到來,數(shù)據(jù)量產(chǎn)生了巨大的飛躍,到現(xiàn)在的TB,甚至PB級別,出現(xiàn)了各種各樣的數(shù)據(jù)庫組織形式,人們對數(shù)據(jù)分析處理的需求已經(jīng)逐漸的豐富并且變得多樣化、復(fù)雜化。傳統(tǒng)的OLTP已經(jīng)不能滿足終端用戶、管理決策人員從如此龐大的數(shù)據(jù)量中查詢、分析并提取有用知識的要求。因此人們開始試著對基于OLTP的數(shù)據(jù)庫進(jìn)行改革,以得到一個更好的決策支持系統(tǒng)。于是,E.F.Codd在1993年提出OLAP的概念,OLAP是一種分析人員、管理人員或執(zhí)行人員可從多種角度提取原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、真實反映企業(yè)特性的信息,并可進(jìn)行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的軟件技術(shù)[6]。
DM和OLAP相結(jié)合用于醫(yī)療衛(wèi)生領(lǐng)域已經(jīng)成為時下的研究熱點。目前OLAP及DM技術(shù)在醫(yī)院醫(yī)療管理領(lǐng)域主要在分析不同病種發(fā)病趨勢、影響因素、治療方法為臨床專家提供決策支持以及通過對歷史數(shù)據(jù)的分析找出某種規(guī)律為決策者提供決策支持這兩個方面有著較為綜合的應(yīng)用。隨著我國醫(yī)療衛(wèi)生事業(yè)的不斷數(shù)字化、信息化,OLAP技術(shù)將會不斷地拓寬其在醫(yī)療衛(wèi)生行業(yè)的應(yīng)用領(lǐng)域。
將DW、OLAP以及DM聯(lián)合起來進(jìn)行數(shù)據(jù)分析,形成基于DM的OLAP,可以凸顯OLAP獨特的優(yōu)勢。目前在生物醫(yī)學(xué)領(lǐng)域OLAP主要有以下幾個應(yīng)用。
醫(yī)院的經(jīng)營管理是指對醫(yī)院運營過程的計劃、組織、實施和控制,是幫助醫(yī)院對財務(wù)、人力、物品進(jìn)行的管理,在醫(yī)院的運作過程中尤其重要。王螢和徐琛[7]采用SAP BW數(shù)據(jù)抽取機(jī)制采集醫(yī)院財務(wù)信息數(shù)據(jù),對DW進(jìn)行建模,利用OLAP和DM技術(shù)對其進(jìn)行整合并進(jìn)行多維度分析,采用分組序號聚焦算法,大幅縮短了醫(yī)院財務(wù)分析系統(tǒng)的查詢時間,提高了查詢效率,更好地將權(quán)威性的數(shù)據(jù)提供給領(lǐng)導(dǎo)層以供其決策。在醫(yī)院的費用管理方面,曹淑真[8]討論了單種病費用分析,提出了基于醫(yī)院數(shù)據(jù)庫中利用OLAP技術(shù)的基本操作,以記錄較為完整的單純性闌尾炎為例,對單病種費用進(jìn)行多維度、多角度的分析和探索,并挖掘出患者社會特征、疾病特征與費用構(gòu)成等因素對醫(yī)療費用的影響模式,進(jìn)而為改進(jìn)單病種分級付費制度提供依據(jù),并對比了OLAP和DM在分析醫(yī)院信息系統(tǒng)數(shù)據(jù)庫中數(shù)據(jù)的異同點。得出了OLAP和DM相互補(bǔ)充結(jié)合,從而提供更加完善的決策支持的觀點。此外,將DM技術(shù)和OLAP技術(shù)相結(jié)合,融入醫(yī)院管理信息系統(tǒng)(hospital information system,HIS)[9],以提供高效的管理;以DW技術(shù)為主結(jié)合OLAP技術(shù)和DM技術(shù)構(gòu)建的商業(yè)智能的醫(yī)院決策支持系統(tǒng)(intelligence decision supporting system,IDSS)為醫(yī)院管理層提供有效的決策支持[10]。這些都展現(xiàn)了OLAP技術(shù)在醫(yī)院經(jīng)營管理及醫(yī)院費用管理領(lǐng)域的廣泛應(yīng)用。
隨著醫(yī)院HIS系統(tǒng)運作時間的積累,傳統(tǒng)的醫(yī)院數(shù)據(jù)庫中累積了大量的醫(yī)療信息,而這些信息通常沒有被很好地利用,因此如何利用好這些信息就顯得尤為重要。李斌[11]提出了一種新型的基于C/S+B/S架構(gòu)的醫(yī)療資源管理決策支持系統(tǒng),該系統(tǒng)由醫(yī)療資源DW、DM模塊、聯(lián)機(jī)分析模塊和規(guī)劃生成系統(tǒng)4部分構(gòu)成,可為決策部門提供充分的決策信息以及最優(yōu)化方案,減少決策失誤,改善城市衛(wèi)生管理。
醫(yī)用耗材是醫(yī)院在醫(yī)療過程中所消耗的配件類材料及產(chǎn)品,主要包括耗材和醫(yī)用器械。隨著我國醫(yī)療改革的不斷推進(jìn),以及高價值的醫(yī)療器械逐漸推廣,傳統(tǒng)的藥品消耗量所占的比例在不斷下降,而醫(yī)用耗材的使用量卻在逐步提升。因此醫(yī)用耗材的管理、數(shù)據(jù)分析以及知識挖掘就顯得更加重要。有研究利用Microsoft SQL Server Analysis Service中的OLAP與多維分析技術(shù)對醫(yī)院HIS系統(tǒng)及物資系統(tǒng)進(jìn)行整合集成,對醫(yī)用耗材使用和患者身份之間的關(guān)系、醫(yī)用耗材使用的時間趨勢以及科室醫(yī)用耗材使用分析等主題,實現(xiàn)了多維分析展現(xiàn)[7]。從而使得用戶可以快速得到耗材的統(tǒng)計報表,方便從多維度觀察耗材的使用情況,準(zhǔn)確地展現(xiàn)耗材的使用規(guī)律以及時間趨勢,科學(xué)地購置耗材。
無論是在西醫(yī)還是中醫(yī)的病案系統(tǒng),OLAP都有其應(yīng)用價值。陳濤[12]開發(fā)了中醫(yī)病案OLAP系統(tǒng)軟件,其特點是針對中醫(yī)病案的脈象、舌象、病證等相互關(guān)系研究的實際應(yīng)用需求,采用三層B/S模式,基于互聯(lián)網(wǎng)技術(shù),利用OLAP工具對其所構(gòu)建的當(dāng)代名醫(yī)舌脈診醫(yī)案進(jìn)行統(tǒng)計分析,并對舌脈診醫(yī)案進(jìn)行大樣本數(shù)據(jù)分析處理,實現(xiàn)了涉及舌脈診的中醫(yī)病案管理系統(tǒng)。它將病案存檔管理以供醫(yī)院研究,為中醫(yī)臨床診斷提供參考并有助于科研教學(xué)工作,將中醫(yī)醫(yī)案進(jìn)一步推向現(xiàn)代化。同樣OLAP也可以用于醫(yī)療和疾病預(yù)警系統(tǒng)中,于彥哲[13]針對高校教育工作者和在校大學(xué)生提出了高校醫(yī)院管理及疾病預(yù)警系統(tǒng),對這兩類人群的健康統(tǒng)計數(shù)據(jù)進(jìn)行OLAP分析,從而統(tǒng)計亞健康狀態(tài)人員,進(jìn)而有效減少其數(shù)量。還有研究者對于腰椎神經(jīng)根損害患者的臨床相關(guān)數(shù)據(jù)進(jìn)行OLAP分析,將大宗的腰椎神經(jīng)根損傷患者的臨床資料進(jìn)行數(shù)據(jù)處理與分析,對于指導(dǎo)臨床手術(shù)方案、指導(dǎo)治療、準(zhǔn)確判斷預(yù)后、提高疾病治療預(yù)防水平有著重要的意義[14],體現(xiàn)了OLAP在疾病診斷領(lǐng)域的先進(jìn)性和應(yīng)用價值。
OLAP技術(shù)在生物醫(yī)學(xué)領(lǐng)域的發(fā)展目標(biāo)主要是將聯(lián)機(jī)分析和DM集中到一起,主要表現(xiàn)在:從OLAP到聯(lián)機(jī)分析挖掘(OLAM/OLAP挖掘);將OLAP與DM以及在多維數(shù)據(jù)庫中發(fā)現(xiàn)知識集成在一起。聯(lián)機(jī)分析挖掘是在不同的數(shù)據(jù)子集和不同的抽象層上進(jìn)行數(shù)據(jù)挖掘的工具,成為用戶選擇所期望的數(shù)據(jù)挖掘功能,為動態(tài)修改挖掘任務(wù)提供了靈活性,是超立方體計算與傳統(tǒng)挖掘算法的結(jié)合。另外,OLAP技術(shù)的其他幾個發(fā)展目標(biāo)是:OLAP與Web相結(jié)合,形成基于Web的OLAP;面向?qū)ο蟮腛LAP——03LAP(objectoriented OLAP);對象關(guān)系的OLAP——OROLAP (object relational OLAP);分布式OLAP——DOLAP (distributed OLAP);時態(tài)OLAP——TOLAP (temporal OLAP)。成熟的OLAP技術(shù)將極大地促進(jìn)生物醫(yī)學(xué)的發(fā)展,如利用OLAP研究基因表達(dá)數(shù)據(jù)庫的數(shù)據(jù)挖掘[15]、基于Web的監(jiān)測與氣候相關(guān)的健康隱患的空間OLAP[16]以及保健決策和研究等。
(1)OLAP技術(shù)在生物醫(yī)學(xué)領(lǐng)域擁有光明的前途,其在醫(yī)院經(jīng)營管理及醫(yī)院費用管理、醫(yī)療信息、醫(yī)療耗材管理以及疾病診斷方面等都有非常重要的應(yīng)用。(2)將DW、OLAP以及DM結(jié)合形成基于DM的OLAP,是使OLAP更好地提供決策支持的必然趨勢;與其他的技術(shù)聯(lián)合,可以改進(jìn)OLAP,最大限度實現(xiàn)其在生物醫(yī)學(xué)領(lǐng)域的多維在線統(tǒng)計分析的作用。(3)隨著DW、OLAP、DM技術(shù)的不斷推廣,相信OLAP技術(shù)在生物醫(yī)學(xué)領(lǐng)域會有較好的發(fā)展。