趙丹陽(yáng)/遼寧大學(xué)歷史學(xué)院
姚 健/沈陽(yáng)醫(yī)學(xué)院附屬第二醫(yī)院心血管中心
病案是我國(guó)檔案資源的重要組成部分,是進(jìn)行醫(yī)療、教學(xué)和科研的第一手材料。隨著電子病案的普及和大數(shù)據(jù)時(shí)代的來(lái)臨,如何打破病案存儲(chǔ)條塊分割的現(xiàn)狀,實(shí)現(xiàn)資源的廣泛整合,使病案大數(shù)據(jù)成為推動(dòng)醫(yī)學(xué)進(jìn)步的不竭信息源,為檔案學(xué)大數(shù)據(jù)研究提供扎實(shí)的落腳點(diǎn),成為檔案界和醫(yī)學(xué)界共同面對(duì)的重要課題。構(gòu)建病案大數(shù)據(jù)信息共享平臺(tái),是實(shí)現(xiàn)這一目標(biāo)的有效途徑。
病案大數(shù)據(jù)這一概念有廣義和狹義之分,廣義上的概念指大數(shù)據(jù)中的病案數(shù)據(jù),即大數(shù)據(jù)中具有病案屬性的全部數(shù)據(jù),如住院患者每日費(fèi)用清單等;狹義上的概念指病案中的大數(shù)據(jù),即一定時(shí)空范圍內(nèi)所有(不論其來(lái)源、保管期限、載體、結(jié)構(gòu)等的差異)病案數(shù)據(jù)的集合,如同一患者在不同醫(yī)院生成的病案集合或有關(guān)某種疾病的全部病案集合。病案大數(shù)據(jù)的概念與新來(lái)源觀“將某種職能、目的、活動(dòng)、形成過(guò)程視為來(lái)源”[1]的思想具有一致性,也符合大數(shù)據(jù)時(shí)代將某主題相關(guān)信息資源最大化整合的要求。對(duì)這一概念的理解,有助于打破原先條塊分割式的病案管理體系,也為病案大數(shù)據(jù)資源共享平臺(tái)的建設(shè)奠定理論基礎(chǔ)。
傳統(tǒng)的病案指“關(guān)于患者在接受醫(yī)療期間所有過(guò)程情節(jié)的書面記錄與文件”[2],如門診記錄、護(hù)理記錄、檢驗(yàn)記錄、復(fù)健記錄等。而病案大數(shù)據(jù)的概念豐富了傳統(tǒng)病案的內(nèi)涵、擴(kuò)大了傳統(tǒng)病案的外延,也使得病案大數(shù)據(jù)的資源類型得到了拓展。首先是病案數(shù)據(jù)。包括傳統(tǒng)病案所包含的各種數(shù)據(jù)和信息,此外還要求在大數(shù)據(jù)環(huán)境下對(duì)這些信息按照主題(如某種病癥)或來(lái)源(如某位病患或某個(gè)地區(qū))進(jìn)行聚類,而非分散孤立地存儲(chǔ)。此類數(shù)據(jù)構(gòu)成了病案大數(shù)據(jù)的主體部分和關(guān)鍵內(nèi)容。
其次是病案利用與管理數(shù)據(jù)。除了傳統(tǒng)的病案數(shù)據(jù)外,病案大數(shù)據(jù)同樣關(guān)注醫(yī)護(hù)人員、醫(yī)院管理者、患者、研究人員等利用主體展開病案利用活動(dòng)或病案管理者在各種管理活動(dòng)中形成、積累的新數(shù)據(jù)或信息,此類數(shù)據(jù)對(duì)于病案大數(shù)據(jù)的科學(xué)管理、安全存儲(chǔ)和利用服務(wù)至關(guān)重要。
再次是病患背景數(shù)據(jù)。指記錄病患入院前的生活習(xí)慣、飲食習(xí)慣的數(shù)據(jù)和治療結(jié)束后跟蹤獲取的反映病患健康情況的數(shù)據(jù)等,對(duì)臨床診療、醫(yī)學(xué)研究極具參考價(jià)值。雖然傳統(tǒng)環(huán)境下對(duì)此類數(shù)據(jù)的重視程度比較低,但大數(shù)據(jù)及其相關(guān)技術(shù)的出現(xiàn),使得獲取和利用此類數(shù)據(jù)成為可能,能夠?yàn)獒t(yī)療實(shí)踐和醫(yī)學(xué)研究提供更加精準(zhǔn)和全面的信息保障。
平臺(tái)的建設(shè)必須以需求為導(dǎo)向,才能保證其實(shí)踐應(yīng)用價(jià)值。為此,筆者對(duì)沈陽(yáng)醫(yī)學(xué)院附屬第二醫(yī)院的醫(yī)護(hù)人員、管理人員、病案管理人員等進(jìn)行了問(wèn)卷調(diào)查與深度訪談,將他們對(duì)平臺(tái)功能的需求加以匯總,發(fā)現(xiàn)需求度最高的為安全存儲(chǔ)(90.2%)、虛擬整合(84.8%)、深度挖掘(81.3%)和無(wú)縫互聯(lián)(77.6%)。為滿足這些功能需求,大數(shù)據(jù)資源共享平臺(tái)建設(shè)可采用如下體系架構(gòu)(如圖1)。
圖1:大數(shù)據(jù)資源共享平臺(tái)體系架構(gòu)
本層重點(diǎn)關(guān)注病案大數(shù)據(jù)真實(shí)性、保密性和長(zhǎng)期可讀性的維持。一是病案大數(shù)據(jù)的真實(shí)性與保密性。保障真實(shí)性是檔案管理的普遍要求,由于病案數(shù)據(jù)包含的個(gè)人隱私類信息密度更高,又具有對(duì)保密性的重點(diǎn)要求,所以平臺(tái)作為可信賴的病案資源管理系統(tǒng)必須綜合運(yùn)用先進(jìn)的技術(shù)手段,建立分級(jí)管理與訪問(wèn)控制機(jī)制,確保病案大數(shù)據(jù)在進(jìn)入系統(tǒng)后不被篡改、竊取或遺失。
二是病案大數(shù)據(jù)的長(zhǎng)期可用性。資源的長(zhǎng)期可用是共享及開發(fā)利用的基礎(chǔ)保障。為了實(shí)現(xiàn)長(zhǎng)期可用的目標(biāo),在物理層面上平臺(tái)需制定完備的遷移或仿真策略,防止軟硬件環(huán)境發(fā)生變化對(duì)病案大數(shù)據(jù)可用性帶來(lái)負(fù)面影響;在語(yǔ)義層面上需要成熟的封裝策略,使病案大數(shù)據(jù)信息能夠被正確理解。
對(duì)相關(guān)資源進(jìn)行廣泛整合是平臺(tái)的首要任務(wù)。本層負(fù)責(zé)對(duì)病案大數(shù)據(jù)的各類異構(gòu)資源進(jìn)行虛擬化,以屏蔽底層資源的異構(gòu)性,并將病案大數(shù)據(jù)資源進(jìn)一步抽象為各類服務(wù),從而為用戶利用提供支持。一是病案大數(shù)據(jù)信息資源的整合。進(jìn)行臨床診療或是醫(yī)學(xué)研究都需要病案信息作為支撐和保障,為了將病案的信息保障力度發(fā)揮到最大化,需要打破不同醫(yī)院的界限,盡可能廣泛地整合醫(yī)療活動(dòng)過(guò)程中形成的文字、符號(hào)、圖表、影像、切片等資料。
二是高性能設(shè)施的整合。隨著醫(yī)療信息化、電子化進(jìn)程的推進(jìn),遠(yuǎn)程診療已成為可能。共享平臺(tái)在整合病案大數(shù)據(jù)信息資源之外,也需要注重對(duì)高性能診療設(shè)施進(jìn)行虛擬整合,如將需檢查的樣本進(jìn)行數(shù)字化加工后發(fā)送給擁有專門診察設(shè)備的機(jī)構(gòu)進(jìn)行檢測(cè),以彌合因醫(yī)院規(guī)模和經(jīng)濟(jì)實(shí)力不同造成的診斷能力和治療水平上的差異。
本研究利用OAI-PMH協(xié)議完成整合功能[3]。由數(shù)據(jù)提供者利用元數(shù)據(jù)整合各類資源,并通過(guò)OAI-PMH協(xié)議與服務(wù)提供者交互,同時(shí)注冊(cè)資源;再由服務(wù)提供者結(jié)合資源注冊(cè)建立索引分類,通過(guò)各類通信協(xié)議供本層利用。
病案大數(shù)據(jù)資源共享平臺(tái)可提供有針對(duì)性的特色服務(wù),以突出核心競(jìng)爭(zhēng)力。一是服務(wù)醫(yī)學(xué)研究創(chuàng)新。通過(guò)文獻(xiàn)分析完成知識(shí)發(fā)現(xiàn)與創(chuàng)新,這在醫(yī)學(xué)界有著傳統(tǒng)和成功經(jīng)驗(yàn),如食用魚油會(huì)對(duì)雷諾氏癥患者有益、鎂缺乏可引起偏頭痛等結(jié)論,都是先通過(guò)文獻(xiàn)分析進(jìn)行假設(shè),再通過(guò)臨床試驗(yàn)加以驗(yàn)證的[4]。因此在大數(shù)據(jù)環(huán)境下,充分利用數(shù)據(jù)挖掘軟件,從相關(guān)病案信息中挖掘新的醫(yī)學(xué)知識(shí)或診療方法等,無(wú)疑是平臺(tái)的基礎(chǔ)和核心功能。
二是服務(wù)醫(yī)院管理決策。服務(wù)醫(yī)院管理決策是管理人員對(duì)平臺(tái)的核心訴求,真實(shí)準(zhǔn)確的一手?jǐn)?shù)據(jù)是醫(yī)院制定管理決策的基礎(chǔ)。應(yīng)用可視化軟件對(duì)病案大數(shù)據(jù)進(jìn)行深度挖掘,可以掌握患者就診的時(shí)間分布規(guī)律、藥品的庫(kù)存與流通情況、床位的利用率、設(shè)備的使用率和投入產(chǎn)出比等,從而幫助醫(yī)院管理層實(shí)時(shí)掌控醫(yī)院運(yùn)營(yíng)情況,并及時(shí)做出正確決策。
三是拓展商業(yè)應(yīng)用服務(wù)。醫(yī)院可利用廣泛集成的病案數(shù)據(jù)向患者提供增值性、個(gè)性化的服務(wù),如在日常保健、起居飲食、健身鍛煉、康復(fù)訓(xùn)練等方面提供有償指導(dǎo),這樣一方面用醫(yī)療知識(shí)服務(wù)社會(huì)公眾獲得社會(huì)效益,另一方面能為醫(yī)院創(chuàng)造經(jīng)濟(jì)效益。在技術(shù)實(shí)現(xiàn)方面,本研究擬使用傳統(tǒng)設(shè)計(jì)模式中的服務(wù)工廠模式[5],由其負(fù)責(zé)服務(wù)的注冊(cè)、公開各項(xiàng)服務(wù)接口以為用戶訪問(wèn)提供方便,并根據(jù)用戶利用需求查找與調(diào)用各項(xiàng)服務(wù)。需要建立服務(wù)工廠利用Web service技術(shù),將平臺(tái)內(nèi)的所有服務(wù)分別封裝并設(shè)計(jì)接口,經(jīng)描述后注冊(cè)到服務(wù)目錄中,再對(duì)外發(fā)布。利用中先查詢服務(wù)目錄,確定后通過(guò)服務(wù)接口獲取服務(wù)。
本層主要負(fù)責(zé)平臺(tái)與外界之間或平臺(tái)內(nèi)部的互聯(lián)互通。一方面,平臺(tái)的最終目的是實(shí)現(xiàn)分散異構(gòu)的病案大數(shù)據(jù)資源的共享與開發(fā),為此平臺(tái)建設(shè)不應(yīng)摒棄現(xiàn)有成果,需要在廣泛匯集各機(jī)構(gòu)電子病案數(shù)據(jù)庫(kù)、醫(yī)院管理系統(tǒng)、醫(yī)學(xué)信息網(wǎng)站、醫(yī)學(xué)論壇等基礎(chǔ)上,對(duì)全社會(huì)范圍內(nèi)的信息資源平臺(tái)、信息發(fā)布平臺(tái)、社交媒體平臺(tái)及信息服務(wù)平臺(tái)等加以擇優(yōu)整合,充分發(fā)揮不同來(lái)源的病案信息價(jià)值以及不同功能平臺(tái)的相對(duì)優(yōu)勢(shì),實(shí)現(xiàn)分工協(xié)作、無(wú)縫互通,達(dá)到最優(yōu)的整體效果。
另一方面,醫(yī)療人員所具備的隱性知識(shí),如經(jīng)驗(yàn)、直覺(jué)等,具有非凡價(jià)值,而這種隱性知識(shí)必須通過(guò)人與人的交流才能轉(zhuǎn)化為顯性知識(shí),進(jìn)而實(shí)現(xiàn)知識(shí)的創(chuàng)新。所以,平臺(tái)應(yīng)為用戶提供一個(gè)無(wú)縫溝通的虛擬空間,鼓勵(lì)用戶就病案利用中的具體問(wèn)題進(jìn)行充分溝通交流,激發(fā)創(chuàng)新火花。
第一,關(guān)注病案大數(shù)據(jù)間的業(yè)務(wù)背景聯(lián)系。大數(shù)據(jù)的核心理念之一是通過(guò)大量數(shù)據(jù)間的聯(lián)系發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的規(guī)律,因此在平臺(tái)建設(shè)過(guò)程中應(yīng)該摒棄以往按照不同醫(yī)院或科室整合病案信息的做法,著重獲取并保存病案大數(shù)據(jù)信息間的業(yè)務(wù)聯(lián)系??梢詰?yīng)用元數(shù)據(jù)對(duì)來(lái)源于同一患者的病案、相同醫(yī)生的病案、采用同一療法的病案或同種疾病的病案加以標(biāo)注,并保證這些元數(shù)據(jù)與其對(duì)應(yīng)病案間的聯(lián)系得到長(zhǎng)期妥善保存,以適應(yīng)大數(shù)據(jù)知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘的要求。
第二,關(guān)注病案大數(shù)據(jù)的全面性。大數(shù)據(jù)的價(jià)值取向并不在于盲目地追求數(shù)據(jù)擁有量的龐大,而是掌握某一主題下的全部相關(guān)數(shù)據(jù)。所以大數(shù)據(jù)的本質(zhì)并不是“大”,而是“全”[6]。因此,實(shí)踐中應(yīng)該借助病案大數(shù)據(jù)間的業(yè)務(wù)背景聯(lián)系全面收集相關(guān)病案數(shù)據(jù),以充分發(fā)揮大數(shù)據(jù)的價(jià)值,為提供更精確、更準(zhǔn)確的信息服務(wù)打好基礎(chǔ)。
第三,關(guān)注核心病案大數(shù)據(jù)資源。一般來(lái)說(shuō),大數(shù)據(jù)的數(shù)據(jù)總量大,核心的、真正具有重要價(jià)值的數(shù)據(jù)少,因此具有“價(jià)值密度低”的特點(diǎn)。在平臺(tái)建設(shè)過(guò)程中,應(yīng)優(yōu)先收集重點(diǎn)的、核心的信息數(shù)據(jù),如關(guān)鍵人物或典型病例的病案信息、大規(guī)模流行性疾病的病案信息等,并重點(diǎn)提供利用,從而在最短時(shí)間內(nèi)最大限度地發(fā)揮平臺(tái)價(jià)值。
平臺(tái)的建設(shè)和有效運(yùn)行需要大數(shù)據(jù)、SOA、云計(jì)算、物聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)等技術(shù)的綜合應(yīng)用。在底層,憑借云存儲(chǔ)技術(shù)實(shí)現(xiàn)病案大數(shù)據(jù)的分布式存儲(chǔ)與互聯(lián)互通,完成資源的虛擬化整合,同時(shí)以PaaS打造公共應(yīng)用支撐平臺(tái)。在數(shù)據(jù)采集端,以物聯(lián)網(wǎng)技術(shù)實(shí)時(shí)感知患者關(guān)鍵體征變化,自動(dòng)完成數(shù)據(jù)采集。在中間層,以SOA架構(gòu)構(gòu)造靈活、動(dòng)態(tài)、隨需應(yīng)變的服務(wù)組配與創(chuàng)建機(jī)制。在服務(wù)層,以大數(shù)據(jù)技術(shù)作為實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)、疫情預(yù)警等核心功能的保證;以移動(dòng)互聯(lián)網(wǎng)技術(shù)提高平臺(tái)服務(wù)的便捷性,并促進(jìn)其普及與推廣。在加強(qiáng)技術(shù)應(yīng)用的同時(shí),不能忽視技術(shù)管理能力的培養(yǎng)。應(yīng)建立完備的數(shù)據(jù)存儲(chǔ)政策、訪問(wèn)控制制度等安全保障策略,切實(shí)防止技術(shù)濫用等給平臺(tái)帶來(lái)的危害。
一方面,電子病案的長(zhǎng)期形成和積累為病案大數(shù)據(jù)資源共享平臺(tái)的建設(shè)提供了有力保障,因此平臺(tái)無(wú)需“另起爐灶”完成從無(wú)到有的過(guò)程,只需在現(xiàn)有基礎(chǔ)上依照病案大數(shù)據(jù)涵蓋的內(nèi)容,進(jìn)一步擴(kuò)大資源的收集與存儲(chǔ)范圍,實(shí)現(xiàn)資源建設(shè)的全面性。另一方面,可借助醫(yī)院網(wǎng)站、報(bào)紙、廣播電視等傳統(tǒng)媒體宣傳平臺(tái)的功能及建設(shè)成就,擴(kuò)大影響力;還可利用新媒體吸引更多關(guān)注,以及提供泛在化、個(gè)性化的信息服務(wù)。
目前,病案大多存儲(chǔ)在生成機(jī)構(gòu),格式不一、管理質(zhì)量參差不齊、利用限制過(guò)多等問(wèn)題嚴(yán)重制約了病案信息在大數(shù)據(jù)時(shí)代的價(jià)值實(shí)現(xiàn)。因此,平臺(tái)建設(shè)亟需完善當(dāng)前的病案管理體制,變各自為政的分散管理為集中控制、統(tǒng)一管理,這樣既能掃清病案大數(shù)據(jù)資源整合的障礙,也有利于實(shí)現(xiàn)平臺(tái)建設(shè)的標(biāo)準(zhǔn)化。具體管理和存儲(chǔ)的職責(zé)可由疾控中心承擔(dān),或者在衛(wèi)生部領(lǐng)導(dǎo)下設(shè)置第三方機(jī)構(gòu)負(fù)責(zé)。在實(shí)踐運(yùn)營(yíng)過(guò)程中,可采取特許經(jīng)營(yíng)或外包的方式引入社會(huì)力量,既能保證政府掌控敏感數(shù)據(jù),又能彌補(bǔ)技術(shù)或人員的不足,達(dá)到建設(shè)效果最優(yōu)化。
病案大數(shù)據(jù)的概念相較于傳統(tǒng)病案的概念,其外延得以擴(kuò)大、內(nèi)涵更加豐富,所涵蓋的資源類型也更加多樣。關(guān)于病案大數(shù)據(jù)資源共享平臺(tái)存儲(chǔ)、整合、挖掘和溝通方面的需求來(lái)源于實(shí)踐,充分反映了平臺(tái)各方參與者的迫切需要。以數(shù)據(jù)存儲(chǔ)層、資源整合層、應(yīng)用服務(wù)層和交流溝通層4級(jí)體系為架構(gòu)建立病案大數(shù)據(jù)資源共享平臺(tái),能夠較好地滿足以上需求;而采用轉(zhuǎn)變理念、應(yīng)用技術(shù)、借助現(xiàn)有基礎(chǔ)和完善保障制度等策略,能夠確保平臺(tái)的建設(shè)符合大數(shù)據(jù)的核心理念,保障建設(shè)過(guò)程中少走彎路,以最小的投入獲取最大的效果。
本文是國(guó)家社會(huì)科學(xué)基金項(xiàng)目“非結(jié)構(gòu)化電子文件管理研究”(16BTQ089)的研究成果。
注釋與參考文獻(xiàn):
[1]祭鴻雁.“新來(lái)源觀”:實(shí)質(zhì)與意義探析[J].檔案學(xué)通訊,2003(1):21-25.
[2]劉宏渭,柳硯濤.病歷檔案管理與保護(hù)患者隱私權(quán)[J].檔案學(xué)通訊,2004(4):69-71.
[3]馬海兵.應(yīng)用OAI-PMH和OAI-ORE進(jìn)行數(shù)據(jù)交換的原理與實(shí)現(xiàn)[J].情報(bào)雜志,2011(8):113-116+119.
[4]榮毅虹,梁戰(zhàn)平.基于文獻(xiàn)的發(fā)現(xiàn)[J].情報(bào)學(xué)報(bào),2002(8):386-390.
[5]趙丹陽(yáng).?dāng)?shù)字環(huán)境下科技文獻(xiàn)信息開發(fā)利用與服務(wù)模式研究[M].遼寧:遼寧大學(xué)出版社,2016:167.
[6]涂子沛.?dāng)?shù)據(jù)之巔[M].北京:中信出版社,2014:258.