成靜
(南京醫(yī)科大學(xué)附屬淮安第一醫(yī)院,江蘇淮安 223300)
癌癥是威脅全球健康的主要公共問題之一,近年來癌癥治療負(fù)擔(dān)在全球呈持續(xù)增長趨勢。我國癌癥發(fā)病率和死亡率均居首位,對人民健康構(gòu)成巨大威脅。我國癌癥死亡人數(shù)呈逐年上升趨勢,治療費(fèi)用遠(yuǎn)高于其他疾病,嚴(yán)重影響國民經(jīng)濟(jì)、社會發(fā)展和人民健康。在癌癥診治整體邁向個體化和精準(zhǔn)化的多學(xué)科綜合治療新時代的過程中,癌癥規(guī)范化診療的推進(jìn)已成為提升我國整體癌癥治療水平與治療效果的關(guān)鍵[1]。
為貫徹落實(shí)《中共中央國務(wù)院關(guān)于深化醫(yī)療保障制度改革的意見》《國務(wù)院辦公廳關(guān)于印發(fā)深化醫(yī)藥衛(wèi)生體制改革2021年重點(diǎn)工作任務(wù)的通知》(國辦發(fā)〔2021〕20號)等文件要求,堅持以人民健康為中心,強(qiáng)化醫(yī)療、醫(yī)保、醫(yī)藥三醫(yī)聯(lián)動,國家癌癥中心在國家衛(wèi)生健康委及國家醫(yī)療保障局指導(dǎo)下,開展各級醫(yī)院抗腫瘤藥物上報工作,依據(jù)非常寶貴的腫瘤大數(shù)據(jù)資源,可以充分利用真實(shí)世界證據(jù),推動規(guī)范診療再上新臺階,共同促進(jìn)我國癌癥診療的同質(zhì)化、均質(zhì)化發(fā)展。全面提高癌癥診療質(zhì)量,規(guī)范癌癥診療合理用藥,保障癌癥診療安全,提高癌癥治愈率,改善癌癥患者的生存質(zhì)量具有深遠(yuǎn)意義[2]。
Kettle 中文名叫水壺,意指將不同類型數(shù)據(jù)放到一個壺里[3],最后能按需要的格式流出。Kettle是一個ETL工具集(Extract-Transform-Load,數(shù)據(jù)抽取、轉(zhuǎn)換、裝載),允許用戶管理來自不同數(shù)據(jù)庫的數(shù)據(jù)。Kettle中主要包含兩部分:Transformation(轉(zhuǎn)換)和Job(作業(yè)),Transformation 完成數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,Job 實(shí)現(xiàn)對工作流的控制。通過圖形界面設(shè)計實(shí)現(xiàn)做什么業(yè)務(wù),并在Job 下的start 模塊,有一個定時功能,可以每日、每周等計劃方式進(jìn)行定時執(zhí)行。在開發(fā)、測試和調(diào)試階段,作業(yè)和轉(zhuǎn)換可以在圖形界面里執(zhí)行,部署生產(chǎn)階段一般需要通過命令行執(zhí)行,需要把命令行放到Shell 腳本中,并定時調(diào)度這個腳本。在開發(fā)完成后,Kitchen 和Pan 命令行工具用于實(shí)際的生產(chǎn)環(huán)境。Kitchen和Pan工具是Kettle的命令行執(zhí)行程序,Kitchen用于執(zhí)行作業(yè),Pan用于執(zhí)行轉(zhuǎn)換。采用拖拽組件、連線、配置的方式來構(gòu)建數(shù)據(jù)管道,通過超過200個不同的組件,用戶可以在不編寫一句代碼就能輕松完成對數(shù)據(jù)源讀取,對多源數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換、關(guān)聯(lián)、建模、統(tǒng)計、計算,并輸出數(shù)據(jù)結(jié)果。極大程度地降低開發(fā)技術(shù)門檻和有效降低開發(fā)和維護(hù)成本。
由于上報數(shù)據(jù)涉及多個業(yè)務(wù)系統(tǒng),如醫(yī)院信息系統(tǒng)、電子病歷系統(tǒng)、實(shí)驗(yàn)室信息系統(tǒng)、醫(yī)學(xué)圖像信息系統(tǒng)、病理標(biāo)本管理系統(tǒng)、病案信息系統(tǒng)等,各個業(yè)務(wù)系統(tǒng)又來自不同生產(chǎn)廠商,每個生產(chǎn)廠商又使用的是不同類型的數(shù)據(jù)庫,就需要將數(shù)據(jù)統(tǒng)一抽取的前置服務(wù)器,再統(tǒng)一上傳國家抗腫瘤藥物臨床應(yīng)用監(jiān)測網(wǎng)。
前置服務(wù)器部署包括環(huán)境部署:安裝JDK--Java語言的軟件開發(fā)工具包,設(shè)置環(huán)境變量。以及資源庫配置:配置資源庫信息,包括數(shù)據(jù)庫、主機(jī)名稱、數(shù)據(jù)庫名稱、端口號、賬號、密碼等。
Kettle 主要包含兩大部分:轉(zhuǎn)換transform:完全針對數(shù)據(jù)的基礎(chǔ)進(jìn)行轉(zhuǎn)換、作業(yè)job:整個工作流的控制(如圖1所示)。
圖1 transform工作流
1)創(chuàng)建轉(zhuǎn)換transform
先新建轉(zhuǎn)換,更改轉(zhuǎn)換名稱,選擇轉(zhuǎn)換歸屬。再建立表輸入輸出:在組件組-輸入中找到組件-表輸入,選擇數(shù)據(jù)庫連接(數(shù)據(jù)源),填入相應(yīng)SQL 語句。接著建立表輸出:在組件組-輸出中找到組件-表輸出,建立表輸入和表輸出的連接,選擇數(shù)據(jù)庫連接(數(shù)據(jù)倉庫),錄入目標(biāo)表名,指定數(shù)據(jù)庫字段,獲取相應(yīng)字段,最后執(zhí)行SQL即完成建表。建立清理SQL:在組件組-腳本中找到組件-執(zhí)行SQL腳本,選擇數(shù)據(jù)庫連接(數(shù)據(jù)倉庫),填寫相應(yīng)SQL 語句,建立與表輸入的關(guān)系即可。最后測試轉(zhuǎn)換是否能正常工作[4]。
2)創(chuàng)建作業(yè)job
一個轉(zhuǎn)換就是一個ETL 的過程,而作業(yè)則是多個轉(zhuǎn)換、作業(yè)的集合,在作業(yè)中可以對轉(zhuǎn)換或作業(yè)進(jìn)行調(diào)度、定時任務(wù)等。當(dāng)數(shù)據(jù)抽取需要多步驟時,需要分成多個轉(zhuǎn)換,再集成到一個作業(yè)里順序擺放,然后執(zhí)行即可。作業(yè)job 是對整個工作流的控制,可以定時,一個作業(yè)可以包含多個作業(yè)項,轉(zhuǎn)換transform 只是其中一個作業(yè)項。
本次設(shè)計需要將HIS 系統(tǒng)中病人基本信息數(shù)據(jù)、費(fèi)用數(shù)據(jù)、結(jié)算數(shù)據(jù)等,醫(yī)生站系統(tǒng)中醫(yī)囑數(shù)據(jù)、病歷數(shù)據(jù)、診斷數(shù)據(jù)等,實(shí)驗(yàn)室信息系統(tǒng)中檢驗(yàn)結(jié)果數(shù)據(jù),醫(yī)學(xué)影像系統(tǒng)中檢查結(jié)果數(shù)據(jù),病理系統(tǒng)中病理檢查結(jié)果,病案管理系統(tǒng)中病案首頁相關(guān)數(shù)據(jù)等各系統(tǒng)中數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換再上傳至全國抗腫瘤藥物臨床應(yīng)用監(jiān)測網(wǎng)。共涉及SQL Server、Oracle Database、MySQL三種類型數(shù)據(jù)庫,21張表(如圖2所示)。
圖2 最終實(shí)現(xiàn)效果
1)上報患者范圍:根據(jù)患者診斷來判斷是否屬于上報范圍。通過門(急)診診斷和住院診斷中的診斷信息篩選出惡性腫瘤患者相關(guān)數(shù)據(jù)進(jìn)行上報。
2)上報時間范圍:醫(yī)院需要每月上報門診患者、住院患者的醫(yī)療數(shù)據(jù)。住院患者數(shù)據(jù)按出院時間進(jìn)行篩選后上報、門(急)診患者數(shù)據(jù)按就診時間進(jìn)行篩選后上報(如圖3所示)。
圖3 上報時間范圍
3)上報內(nèi)容范圍:患者的門診、住院、診斷、治療、檢查、檢驗(yàn)、隨訪等相關(guān)數(shù)據(jù)。
1)數(shù)據(jù)關(guān)聯(lián)關(guān)系
醫(yī)院上報數(shù)據(jù)實(shí)現(xiàn)2個維度的關(guān)聯(lián):患者維度、單次就診維度?;颊呔S度:住院患者信息表、門診患者信息表,以“患者ID”與患者就診基本信息表關(guān)聯(lián)。患者ID 是患者在本院信息系統(tǒng)內(nèi)的唯一標(biāo)識,其他上報數(shù)據(jù)表中患者ID 均應(yīng)與本表患者ID 一致。單次就診維度:住院信息相關(guān)表,以“單次就診唯一標(biāo)識號”與住院患者信息表關(guān)聯(lián)。單次就診唯一標(biāo)識號是患者在本院的單次就診唯一標(biāo)識。除了單次就診唯一標(biāo)識號,還可以通過病案號、住院號、住院次數(shù)等字段實(shí)現(xiàn)關(guān)聯(lián)[5]。
2)數(shù)據(jù)質(zhì)量
通過數(shù)據(jù)量、關(guān)聯(lián)性、數(shù)據(jù)內(nèi)容正確性,分別驗(yàn)證上報患者數(shù)據(jù)。包括:字段級檢查如時間類型字段是不是合法的時間范圍檢查、非空校驗(yàn)等、單表級檢查如患者存在手術(shù)記錄,則手術(shù)日期為必須項等、跨表級檢查如:HIS 系統(tǒng)唯一號在門診、住院表格中的關(guān)聯(lián)度,檢查病人的唯一號在基礎(chǔ)信息表中必須存在等,確保數(shù)據(jù)評估的有效性。
傳統(tǒng)的數(shù)據(jù)上報方法,是通過醫(yī)院HIS、LIS、PACS等業(yè)務(wù)系統(tǒng)報表查詢功能或者使用SQL數(shù)據(jù)庫軟件等方法將數(shù)據(jù)查詢、導(dǎo)出,整理匯總后上報至國家抗腫瘤藥物臨床應(yīng)用監(jiān)測網(wǎng),由于各業(yè)務(wù)系統(tǒng)相互獨(dú)立,人工查詢統(tǒng)計匯總,發(fā)生差錯不可避免,必須仔細(xì)核對,并經(jīng)業(yè)務(wù)部門確認(rèn)數(shù)據(jù),浪費(fèi)人力資源[6]。抗腫瘤藥物應(yīng)用監(jiān)測數(shù)據(jù)上報系統(tǒng)應(yīng)用實(shí)施后,解決了上述難題。該系統(tǒng)通過自動采集數(shù)據(jù)、統(tǒng)計匯總形成報表,最終完成上報,全過程均由計算機(jī)完成,無須人工參與,降低了人力資源成本。同時,避免了人工統(tǒng)計所不可避免的差錯,有效防止誤報、漏報,被國家抗腫瘤藥物臨床應(yīng)用監(jiān)測網(wǎng)評定為A級。
持續(xù)上報抗腫瘤藥物在我院臨床應(yīng)用監(jiān)測情況,加強(qiáng)腫瘤病人用藥管理,規(guī)范醫(yī)院抗腫瘤藥物在臨床的應(yīng)用,積極探索醫(yī)院重點(diǎn)監(jiān)控項目,建立預(yù)警制度,借助國家抗腫瘤藥物臨床應(yīng)用監(jiān)測網(wǎng)的數(shù)據(jù)分析功能,實(shí)現(xiàn)診療過程中抗腫瘤藥物的全流程管理。依托國家癌癥中心腫瘤信息數(shù)據(jù)庫,進(jìn)行腫瘤規(guī)范化診療行為綜合評價,分析不合理診療行為,規(guī)范患者全周期治療過程中的檢驗(yàn)檢查[5]。在腫瘤診療服務(wù)領(lǐng)域加強(qiáng)“互聯(lián)網(wǎng)+醫(yī)療健康”建設(shè),增強(qiáng)優(yōu)質(zhì)服務(wù)的可及性。為腫瘤規(guī)范化診療管理相關(guān)工作提供科學(xué)數(shù)據(jù)依據(jù),積極推行“單病種,多學(xué)科”綜合治療理念,制定MDT診療標(biāo)準(zhǔn)化操作流程,提升參與MDT 腫瘤患者比例,持續(xù)優(yōu)化腫瘤診療模式,提高科學(xué)決策水平。