周合永 戚莉莉(通訊作者)
(山東大學(xué)第二醫(yī)院 山東 濟(jì)南 250033)
2015 年,國(guó)務(wù)院辦公廳出臺(tái)《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見(jiàn)》,文中指出健康醫(yī)療大數(shù)據(jù)是國(guó)家重要的基礎(chǔ)性戰(zhàn)略資源,提出推進(jìn)數(shù)據(jù)互聯(lián)融合、開(kāi)放應(yīng)用。隨著醫(yī)院信息化業(yè)務(wù)的不斷深化,業(yè)務(wù)系統(tǒng)的不斷拓展,臨床數(shù)據(jù)越來(lái)越龐大,形成孤立的、碎片化、異構(gòu)的、分布式數(shù)據(jù)。臨床數(shù)據(jù)中心就是將分散在HIS、LIS、PACS、EMR 等各類(lèi)系統(tǒng)的數(shù)據(jù)進(jìn)行獲取、存儲(chǔ)、更新、流通及挖掘的信息系統(tǒng)共享數(shù)據(jù)平臺(tái)。目前臨床數(shù)據(jù)中心已在各級(jí)醫(yī)院逐步實(shí)施,是這幾年來(lái)醫(yī)院信息化建設(shè)的熱點(diǎn)和應(yīng)用難點(diǎn)。
一般來(lái)說(shuō),臨床數(shù)據(jù)中心在行業(yè)內(nèi)有完全集中式、邏輯集中式、歸檔集中式三種方法。完全集中式就是將整個(gè)醫(yī)院信息系統(tǒng)的數(shù)據(jù)集中存儲(chǔ),每個(gè)業(yè)務(wù)系統(tǒng)負(fù)責(zé)自身數(shù)據(jù)的錄入和輸出,數(shù)據(jù)中心集中進(jìn)行數(shù)據(jù)存儲(chǔ)與控制處理,此種方法為理想狀態(tài),無(wú)異構(gòu)系統(tǒng),標(biāo)準(zhǔn)統(tǒng)一,數(shù)據(jù)一致。邏輯集中式就是保持原有各個(gè)業(yè)務(wù)系統(tǒng)的物理分布特性,各種類(lèi)型業(yè)務(wù)數(shù)據(jù)仍由原系統(tǒng)負(fù)責(zé)管理和維護(hù),從邏輯上將這些分布式存儲(chǔ)的數(shù)據(jù)集中起來(lái),為各種上層應(yīng)用提供統(tǒng)一數(shù)據(jù)訪問(wèn)接口,實(shí)現(xiàn)數(shù)據(jù)的邏輯集中展示分析功能。歸檔集中式就是各種類(lèi)型的數(shù)據(jù)仍由相應(yīng)的臨床信息系統(tǒng)負(fù)責(zé)管理和維護(hù),依然保持原有的物理分布特性,采用技術(shù)手段將這些分散存儲(chǔ)的數(shù)據(jù)經(jīng)過(guò)提取清洗歸檔,集中于物理上的臨床數(shù)據(jù)中心,為各種應(yīng)用提供統(tǒng)一的的數(shù)據(jù)訪問(wèn)接口。
通過(guò)對(duì)以上三種臨床數(shù)據(jù)中心構(gòu)建方法的分析,完全集中式適用于新建醫(yī)院數(shù)據(jù)中心的構(gòu)建,對(duì)于已建立了各種信息系統(tǒng)的醫(yī)院,完全集中式意味著推倒重建,資金投入大,開(kāi)發(fā)周期長(zhǎng)。邏輯集中式是一種松散的數(shù)據(jù)中心構(gòu)建思路,數(shù)據(jù)運(yùn)行效率低。歸檔集中式在完全集中式與邏輯集中式中找到了一個(gè)平衡點(diǎn),從技術(shù)角度和經(jīng)濟(jì)角度上實(shí)現(xiàn)了最優(yōu),既保證了舊系統(tǒng)的連續(xù)性,又提高了數(shù)據(jù)運(yùn)行效率。
數(shù)據(jù)接口是實(shí)現(xiàn)數(shù)據(jù)傳輸、信息交流的通道。只有需要傳輸交流的系統(tǒng)共同遵循接口規(guī)定的標(biāo)準(zhǔn)規(guī)范,才能進(jìn)行正常通信,進(jìn)而實(shí)現(xiàn)信息的開(kāi)放與共享。臨床數(shù)據(jù)中心的數(shù)據(jù)交換接口應(yīng)遵循系統(tǒng)性、實(shí)用性、可擴(kuò)展性和科學(xué)性的原則。
臨床數(shù)據(jù)中心建設(shè)遵循的數(shù)據(jù)接口標(biāo)準(zhǔn)一般為HL7V3 標(biāo)準(zhǔn)、HL7CDA 標(biāo)準(zhǔn)及受控詞匯表等。HL7V3 標(biāo)準(zhǔn)是醫(yī)療領(lǐng)域不同應(yīng)用之間電子傳輸?shù)膮f(xié)議,它匯集了不同廠商用來(lái)設(shè)計(jì)應(yīng)用軟件之間接口的標(biāo)準(zhǔn)格式,允許各個(gè)醫(yī)療機(jī)構(gòu)在異構(gòu)系統(tǒng)之間,進(jìn)行數(shù)據(jù)交互,在設(shè)計(jì)臨床數(shù)據(jù)中心的過(guò)程中,要嚴(yán)格遵守HL7V3標(biāo)準(zhǔn),充分考慮臨床業(yè)務(wù)的多樣性和可擴(kuò)展性,以及與其他業(yè)務(wù)系統(tǒng)的整合及數(shù)據(jù)共享等。HL7CDA 標(biāo)準(zhǔn)是實(shí)現(xiàn)臨床醫(yī)療文檔跨系統(tǒng)交互的標(biāo)準(zhǔn),因此要結(jié)合CDA 文檔架構(gòu)對(duì)臨床文檔的結(jié)構(gòu)和語(yǔ)義進(jìn)行標(biāo)準(zhǔn)化和本地定義。受控詞匯表要參考相關(guān)術(shù)語(yǔ)編碼規(guī)范,如ICD9、ICD10 以及衛(wèi)生部電子病歷數(shù)據(jù)元及數(shù)據(jù)集標(biāo)準(zhǔn),在數(shù)據(jù)層次上定義數(shù)據(jù)的編碼、規(guī)范、組成、內(nèi)容等。
臨床數(shù)據(jù)中心總體架構(gòu)分為數(shù)據(jù)資源層、數(shù)據(jù)處理層、數(shù)據(jù)中心層、分析展現(xiàn)層四個(gè)層次。在數(shù)據(jù)資源層,通過(guò)歸檔集中方式將醫(yī)院各業(yè)務(wù)信息系統(tǒng)的數(shù)據(jù)從業(yè)務(wù)庫(kù)實(shí)時(shí)或準(zhǔn)實(shí)時(shí)采集到復(fù)制庫(kù),在復(fù)制庫(kù)上處理數(shù)據(jù);數(shù)據(jù)處理層面,將ETL 工具kettle 封裝到中心管理系統(tǒng)中,對(duì)數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換及加載處理并采集到數(shù)據(jù)中心,使整個(gè)采集過(guò)程及數(shù)據(jù)校驗(yàn)可視化;在數(shù)據(jù)中心層進(jìn)行標(biāo)準(zhǔn)化管理,數(shù)據(jù)中心自由構(gòu)建,將采集方式、數(shù)據(jù)模型等進(jìn)行統(tǒng)一管理,建立智能化數(shù)據(jù)管理平臺(tái);在分析展現(xiàn)層,深入分析不同數(shù)據(jù)應(yīng)用需求,建立不同應(yīng)用的數(shù)據(jù)產(chǎn)品,以臨床全息視圖、輔助決策、智能報(bào)表等形式進(jìn)行數(shù)據(jù)展現(xiàn)。
總體功能架構(gòu)詳見(jiàn)下圖:
3.2.1 業(yè)務(wù)數(shù)據(jù)捕獲 臨床數(shù)據(jù)中心需要實(shí)時(shí)或準(zhǔn)實(shí)時(shí)的從業(yè)務(wù)系統(tǒng)抽取數(shù)據(jù)。如果采取完全數(shù)據(jù)源抽取,則效率較低。為減少對(duì)運(yùn)行的業(yè)務(wù)系統(tǒng)的影響,先對(duì)業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行復(fù)制,然后在復(fù)制庫(kù)上捕獲變化數(shù)據(jù)源抽取。
具體實(shí)現(xiàn)架構(gòu)圖如下:
3.2.2 增量數(shù)據(jù)加載 通過(guò)C D C 技術(shù)捕獲業(yè)務(wù)系統(tǒng)的數(shù)據(jù)變化集后,需要實(shí)時(shí)高效的智能化加載工具加載數(shù)據(jù)變化集到C D R 中。通過(guò)智能化數(shù)據(jù)載入工具,從應(yīng)用業(yè)務(wù)系統(tǒng)到C D R 的數(shù)據(jù)載入可以達(dá)到分鐘級(jí)別,報(bào)表系統(tǒng)數(shù)據(jù)最大延遲一小時(shí)左右,對(duì)于實(shí)時(shí)監(jiān)控?cái)?shù)據(jù),技術(shù)上可以做到秒級(jí)左右。
數(shù)據(jù)質(zhì)量是數(shù)據(jù)應(yīng)用的基礎(chǔ)。這就要求在數(shù)據(jù)匯集過(guò)程中,確保數(shù)據(jù)質(zhì)量。完整性、一致性、準(zhǔn)確性、及時(shí)性是優(yōu)質(zhì)數(shù)據(jù)的標(biāo)準(zhǔn)。從業(yè)務(wù)數(shù)據(jù)到C DR 的數(shù)據(jù)導(dǎo)入過(guò)程中,做到實(shí)時(shí)顯示,定期對(duì)數(shù)據(jù)所有維度表進(jìn)行完整性校驗(yàn),對(duì)數(shù)據(jù)源和目標(biāo)數(shù)據(jù)表之間的數(shù)據(jù)分組聚合進(jìn)行驗(yàn)證。
隨著臨床數(shù)據(jù)整合的不斷深入,基于臨床數(shù)據(jù)中心的精細(xì)化、過(guò)程性、相關(guān)性的分析等的數(shù)據(jù)挖掘應(yīng)用成為可能。臨床數(shù)據(jù)中心存儲(chǔ)的大量臨床數(shù)據(jù)可支持很多領(lǐng)域的研究,包括以臨床業(yè)務(wù)、教學(xué)工作、科學(xué)研究為核心開(kāi)展的患者全息視圖、臨床輔助決策、教學(xué)服務(wù)支持、科研服務(wù)支持、醫(yī)院運(yùn)營(yíng)決策等臨床數(shù)據(jù)中心應(yīng)用項(xiàng)目。
臨床數(shù)據(jù)中心建設(shè)是數(shù)據(jù)應(yīng)用的前提,只有夯實(shí)數(shù)據(jù)共享交換融合平臺(tái),才能深化數(shù)據(jù)應(yīng)用。海量醫(yī)療數(shù)據(jù)的存儲(chǔ)、清洗、標(biāo)準(zhǔn)化、分析挖掘、安全隱私保護(hù)是臨床醫(yī)療數(shù)據(jù)中心建設(shè)的關(guān)鍵技術(shù)。數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范、數(shù)據(jù)安全法律法規(guī)的健全、信息化人才的培養(yǎng)是臨床數(shù)據(jù)中心建設(shè)的保障。