賀曉松 胡川麗
1.重慶工程學(xué)院大數(shù)據(jù)與人工智能研究所;2.陸軍軍醫(yī)大學(xué)第二附屬醫(yī)院
隨著經(jīng)濟(jì)的迅速發(fā)展和信息技術(shù)的變革,大數(shù)據(jù)正在改變?nèi)蚪^大部分行業(yè),醫(yī)療領(lǐng)域也不例外。本文概述了大數(shù)據(jù)概念、特征和醫(yī)療大數(shù)據(jù)的發(fā)展,總結(jié)了大數(shù)據(jù)在醫(yī)療領(lǐng)域的應(yīng)用現(xiàn)狀,并對大數(shù)據(jù)應(yīng)用于醫(yī)療領(lǐng)域的挑戰(zhàn)和展望作了深入探討,旨在為我國醫(yī)療大數(shù)據(jù)的發(fā)展提供參考和借鑒。
隨著信息化進(jìn)程的不斷加快,醫(yī)療健康領(lǐng)域逐漸進(jìn)入大數(shù)據(jù)時(shí)代。大規(guī)模、多渠道、多樣的數(shù)據(jù)可為醫(yī)療護(hù)理實(shí)踐提供新的方法和思路,在提高醫(yī)療實(shí)踐水平、醫(yī)療數(shù)字化管理、臨床決策支持和養(yǎng)老服務(wù)等多個(gè)領(lǐng)域具有應(yīng)用價(jià)值。然而,目前由于區(qū)域經(jīng)濟(jì)發(fā)展不平衡等原因?qū)е碌尼t(yī)療資源分布不均,通過更加有效地利用醫(yī)療大數(shù)據(jù),推進(jìn)跨區(qū)域、跨機(jī)構(gòu)、跨部門的健康醫(yī)療數(shù)據(jù)共享,充分發(fā)揮數(shù)據(jù)資源潛力、激活數(shù)據(jù)資源價(jià)值成為新的關(guān)注點(diǎn)[1]。另外,醫(yī)療大數(shù)據(jù)也面臨著醫(yī)療信息數(shù)據(jù)安全和隱私保護(hù)不當(dāng)、數(shù)據(jù)質(zhì)量參差不齊的挑戰(zhàn),本文將深入探討這些問題。
大數(shù)據(jù)(Big Data)是指使用傳統(tǒng)軟件或基于互聯(lián)網(wǎng)的平臺無法管理的大量數(shù)據(jù),它超越了傳統(tǒng)使用量的存儲、處理和分析能力[2]。國際數(shù)據(jù)中心(International Data Center,IDC)將大數(shù)據(jù)歸結(jié)為“4V”特點(diǎn)的數(shù)據(jù)資料[3]:容量(Volume)、多樣性(Variety)、速度(Velocity)、準(zhǔn)確性(Veracity)和價(jià)值(Value)。醫(yī)療大數(shù)據(jù)保留了大數(shù)據(jù)的特點(diǎn)外,額外兼具有鮮明的醫(yī)療行業(yè)特征,即時(shí)效性、冗余性、不完整性、隱私性的特點(diǎn)[4]。
醫(yī)療大數(shù)據(jù)是人類與醫(yī)療及生命健康相關(guān)的活動(dòng)過程產(chǎn)生的與健康醫(yī)療相關(guān)的數(shù)據(jù)集合。早期,醫(yī)療相關(guān)的大部分?jǐn)?shù)據(jù)都以紙質(zhì)印刷形式而非電子信息化方式存儲,但隨著強(qiáng)大的數(shù)據(jù)存儲,計(jì)算平臺,及移動(dòng)互聯(lián)網(wǎng)的發(fā)展,醫(yī)療數(shù)據(jù)也向數(shù)字化方向快速發(fā)展。
我國醫(yī)療大數(shù)據(jù)伴隨著國家政策的推動(dòng)也迎來了快速發(fā)展的階段,2015 年8 月國務(wù)院發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,指出鼓勵(lì)和規(guī)范有關(guān)企事業(yè)單位開展醫(yī)療健康大數(shù)據(jù)創(chuàng)新應(yīng)用研究,構(gòu)建綜合健康服務(wù)應(yīng)用[5]。2016 年6月,國務(wù)院辦公廳印發(fā)了《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》,指出要大力推進(jìn)不同醫(yī)療系統(tǒng)數(shù)據(jù)的融合和共享,促進(jìn)醫(yī)療大數(shù)據(jù)安全規(guī)范和創(chuàng)新應(yīng)用[6]。2016 年8 月國務(wù)院印發(fā)《“健康中國2030”規(guī)劃綱要》,提出將大數(shù)據(jù)醫(yī)療及其產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展成“十三五”時(shí)期醫(yī)療體系及醫(yī)療服務(wù)最高戰(zhàn)略[7]。2018 年國家衛(wèi)健委發(fā)布《國家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》,就加強(qiáng)標(biāo)準(zhǔn)管理、安全管理、服務(wù)管理,為醫(yī)療大數(shù)據(jù)的實(shí)施提供了政策指導(dǎo)。
醫(yī)療大數(shù)據(jù)主要來源分為如下4類[8]:(1)醫(yī)療機(jī)構(gòu)的患者就醫(yī)數(shù)據(jù)和運(yùn)營系統(tǒng)數(shù)據(jù),如病種治療和成本數(shù)據(jù)、醫(yī)藥、耗材、采購管理數(shù)據(jù)等,醫(yī)院信息系統(tǒng)(HIS)、電子病歷系統(tǒng)(EMRS)、醫(yī)學(xué)影像存檔與通信系統(tǒng)(PACS)等;(2)臨床醫(yī)療研究和實(shí)驗(yàn)數(shù)據(jù),主要是實(shí)驗(yàn)中產(chǎn)生的數(shù)據(jù),也包含患者產(chǎn)生的數(shù)據(jù),沒有嚴(yán)格的邊界區(qū)分;(3)制藥企業(yè)研發(fā)數(shù)據(jù),藥物研發(fā)是一個(gè)復(fù)雜漫長的過程,臨床試驗(yàn)是驗(yàn)證一個(gè)藥物有效性和安全性的最佳方式,大量臨床試驗(yàn)過程產(chǎn)生的數(shù)據(jù);(4)可穿戴設(shè)備產(chǎn)生的數(shù)據(jù),隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展和穿戴設(shè)備核心硬件技術(shù)的成熟,各種健康設(shè)備通過云端上傳方式收集用戶生命體征數(shù)據(jù),如血壓、體溫、心電、脈搏等。
醫(yī)療大數(shù)據(jù)的研究和應(yīng)用有如下幾方面的現(xiàn)實(shí)意義[9]:(1)提高診斷準(zhǔn)確性。醫(yī)生利用醫(yī)院共享的大數(shù)據(jù)系統(tǒng),能夠分析醫(yī)院積累的大量臨床數(shù)據(jù),結(jié)合目標(biāo)患者信息,能夠及時(shí)、有效地為患者選擇治療方案;(2)減少醫(yī)患矛盾。通過建立移動(dòng)護(hù)理信息系統(tǒng),實(shí)現(xiàn)病人護(hù)理文檔的電子化,將醫(yī)生、護(hù)士、其他醫(yī)務(wù)人員工作閉環(huán)執(zhí)行,使患者得到有效治療;(3)節(jié)約醫(yī)療資源。通過云計(jì)算技術(shù),將信息資源集成和共享,降低成本的同時(shí)提高效率;(4)個(gè)性化醫(yī)療。通過大數(shù)據(jù)挖掘技術(shù),對個(gè)體差異性特征在普遍特征數(shù)據(jù)分析的基礎(chǔ)上進(jìn)行優(yōu)化分析,進(jìn)而輔助以醫(yī)療服務(wù)子單元,滿足個(gè)性化醫(yī)療服務(wù)要求。
在醫(yī)療健康大數(shù)據(jù)越來越多樣化的背景下,大數(shù)據(jù)技術(shù)也逐步從前沿技術(shù)轉(zhuǎn)變?yōu)楝F(xiàn)實(shí)應(yīng)用。無論是生產(chǎn)生活還是醫(yī)療健康行業(yè),大數(shù)據(jù)的應(yīng)用場景也越來越豐富。
醫(yī)療信息化即醫(yī)療服務(wù)的數(shù)字化、網(wǎng)絡(luò)化、信息化[10]。早期的醫(yī)療記錄的常見做法是以手寫筆記或打印報(bào)告的形式,隨著計(jì)算機(jī)系統(tǒng)的出現(xiàn)及其潛力,醫(yī)療保健系統(tǒng)中所有臨床檢查和病歷的數(shù)字化已成為當(dāng)今的標(biāo)準(zhǔn)和廣泛采用的做法。由Murphy、Hanken、Waters 定義的電子健康記錄(Electronic Health Records,EHR)是用于患者過去、現(xiàn)在或未來的身體/心理健康或狀況有關(guān)的任何信息的計(jì)算機(jī)化醫(yī)療記錄系統(tǒng),方便醫(yī)療人員訪問患者的醫(yī)學(xué)診斷、處方、與已知過敏相關(guān)的數(shù)據(jù),提高醫(yī)療識別和治療效率[11]。與之類似,電子病歷(EMR)、個(gè)人健康記錄(PHR)、醫(yī)療實(shí)踐管理軟件(MPM)和許多其他醫(yī)療數(shù)據(jù)系統(tǒng)共同為提高醫(yī)療質(zhì)量、服務(wù)效率和降低成本以及減少醫(yī)療錯(cuò)誤提供有力保障。
在傳統(tǒng)的醫(yī)療診斷主要依靠醫(yī)生個(gè)人經(jīng)驗(yàn)和目標(biāo)患者的信息,局限性很大,由于患者的個(gè)體差異,同樣診斷治理方式應(yīng)用在不同患者身上的效果也可能不同。為此,可借助大數(shù)據(jù)建立一個(gè)智能診斷系統(tǒng),如果將所有患者的就診信息整合,運(yùn)用數(shù)據(jù)挖掘技術(shù)分析患者信息,提高診斷準(zhǔn)確率[4]。另外,可利用自然語言處理技術(shù)對電子病歷文本進(jìn)行分析,圖像智能識別技術(shù)對醫(yī)學(xué)影響建模,實(shí)現(xiàn)智能診斷。這能促進(jìn)診斷更加科學(xué)化、合理化,提高診斷準(zhǔn)確率,有效降低誤診率。
在醫(yī)療科研領(lǐng)域,包括治療方案的療效判斷、新藥研發(fā)、器械研制、疾病危險(xiǎn)因素分析等各類臨床科研[4]。運(yùn)用大數(shù)據(jù)技術(shù)對各種數(shù)據(jù)進(jìn)行篩選、分析,可以為科研工作提供強(qiáng)有力的數(shù)據(jù)分析支持。如:(1)探索疾病關(guān)聯(lián)關(guān)系。將離散數(shù)據(jù)進(jìn)行整合與規(guī)范化,對大量、關(guān)聯(lián)性的疾病數(shù)據(jù)進(jìn)行分析整理,構(gòu)建醫(yī)療知識圖譜,可以探索疾病的關(guān)聯(lián)關(guān)系;(2)進(jìn)行臨床預(yù)測。通過數(shù)據(jù)挖掘技術(shù)對各類疾病的癥狀,監(jiān)控疾病治療效果數(shù)據(jù)進(jìn)行建模,預(yù)測處于早期癥狀的疾病的發(fā)展趨勢[12]。
大型醫(yī)院已經(jīng)基本實(shí)施了信息化建設(shè),但相應(yīng)的數(shù)據(jù)資源仍然分散在不同的數(shù)據(jù)池中,互不相連,形成信息孤島,導(dǎo)致醫(yī)院之間無法共享護(hù)理數(shù)據(jù),全社會衛(wèi)生系統(tǒng)的相關(guān)數(shù)據(jù)無法共享和有效整合,進(jìn)而影響醫(yī)療資源數(shù)據(jù)池的形成。
掣肘健康醫(yī)療數(shù)據(jù)共享的關(guān)鍵問題主要體現(xiàn)在管理機(jī)制和技術(shù)標(biāo)準(zhǔn)兩個(gè)方面,因此亟需解決以下2 個(gè)問題:(1)由于我國經(jīng)濟(jì)發(fā)展的地區(qū)性差異,不同地區(qū)和級別的醫(yī)療機(jī)構(gòu)自成體系、自建標(biāo)準(zhǔn),不同類型醫(yī)療機(jī)構(gòu)間缺乏充分的跨業(yè)務(wù)數(shù)據(jù)共享,因此應(yīng)該健全協(xié)作機(jī)制,調(diào)整利益沖突并通過管理手段達(dá)成共識;(2)醫(yī)療大數(shù)據(jù)本身多源異構(gòu)性的特點(diǎn),存在大量結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),信息標(biāo)準(zhǔn)并不統(tǒng)一,按照標(biāo)準(zhǔn)規(guī)范建立起跨機(jī)構(gòu)甚至跨區(qū)域的數(shù)據(jù)共享平臺及數(shù)據(jù)交換機(jī)制[12]。
大數(shù)據(jù)在促進(jìn)數(shù)據(jù)傳輸和共享的同時(shí),也帶來了新的挑戰(zhàn),數(shù)據(jù)隱私保護(hù)就是其中之一[12]。我國對于醫(yī)療領(lǐng)域隱私保護(hù)的立法及政策法規(guī)的制定處于起步和發(fā)展中,盡管已有相關(guān)法律法規(guī)對保護(hù)患者隱私提出了相應(yīng)的要求和規(guī)定,但是大部分規(guī)定缺乏可操作性,僅規(guī)定了對患者的保密醫(yī)務(wù),而沒有規(guī)定違反該義務(wù)的后果,不利于具體司法實(shí)踐操作,而且大多數(shù)條款對患者信息權(quán)利的具體內(nèi)容、權(quán)利保護(hù)的方式等都沒有規(guī)定。大數(shù)據(jù)時(shí)代,要搞數(shù)據(jù)共享,這在很大程度上受到嚴(yán)格的數(shù)據(jù)保護(hù)的限制;只有保障大數(shù)據(jù)的共享和保護(hù),才能最大限度地發(fā)揮醫(yī)療大數(shù)據(jù)的潛在價(jià)值。
為了能夠最大程度上保護(hù)公民的隱私安全,需要加強(qiáng)對數(shù)據(jù)的保護(hù)工作。首先在法律的內(nèi)容上,應(yīng)盡快制定相關(guān)政策法規(guī);除完善相關(guān)配套法規(guī)標(biāo)準(zhǔn)外,也要在執(zhí)法和司法過程中強(qiáng)化保護(hù)患者隱私與個(gè)人信息,嚴(yán)格要求數(shù)據(jù)安全保障義務(wù)與責(zé)任,堅(jiān)持知情同意原則,數(shù)據(jù)的收集、存儲、使用、分析等行為應(yīng)獲得數(shù)據(jù)主體的知情同意,原則上應(yīng)獲得明示同意;其次在治理手段上,在強(qiáng)化隱私保護(hù)技術(shù)對個(gè)人隱私保護(hù)效果支撐作用的同時(shí),致力提升數(shù)據(jù)加工者合法合規(guī)使用數(shù)據(jù)的自覺意識,形成注重?cái)?shù)據(jù)倫理安全的良性氛圍,倡導(dǎo)公民形成正確的個(gè)人隱私觀。
醫(yī)療數(shù)據(jù)在大部分應(yīng)用場景中,對數(shù)據(jù)的質(zhì)量都有比較高的要求。醫(yī)療數(shù)據(jù)質(zhì)量風(fēng)險(xiǎn)可能導(dǎo)致一系列問題:(1)即時(shí)接受診療的患者因?yàn)獒t(yī)生收到了錯(cuò)誤的基本疾病信息受到不合理的治療甚至承擔(dān)安全風(fēng)險(xiǎn);(2)醫(yī)療科研有可能因?yàn)槌霈F(xiàn)的錯(cuò)誤數(shù)據(jù)而得到錯(cuò)誤的結(jié)論,輕者會導(dǎo)致整個(gè)科研過程失敗,耗費(fèi)人力財(cái)力,重者可能會錯(cuò)誤引導(dǎo)醫(yī)學(xué)理論發(fā)展方向,影響整體醫(yī)學(xué)發(fā)展進(jìn)程。
為了提高醫(yī)療數(shù)據(jù)的準(zhǔn)確性、真實(shí)性、適用性,須建立一套標(biāo)準(zhǔn)化數(shù)據(jù)治理模式,各級醫(yī)療機(jī)構(gòu)在開展醫(yī)療數(shù)據(jù)采集、存儲、整合、分析等工作的時(shí)候,以相同或相近的標(biāo)準(zhǔn),確保內(nèi)容準(zhǔn)確、術(shù)語規(guī)范、信息數(shù)據(jù)接口一致等[13]。此外人工智能技術(shù)也正在應(yīng)用于醫(yī)療數(shù)據(jù)的提取和識別過程中,通過自然語言處理、人工智能、OCR 等技術(shù)直接識別電子病歷系統(tǒng)并完成有效數(shù)據(jù)的提取,這一過程的實(shí)現(xiàn)將有效減少醫(yī)療數(shù)據(jù)提取過程的人力耗費(fèi)且有可能通過機(jī)器學(xué)習(xí)提高數(shù)據(jù)的準(zhǔn)確性。這些醫(yī)療數(shù)據(jù)提取的自動(dòng)化策略必然是醫(yī)療數(shù)據(jù)提取的重要未來方案,對于解決當(dāng)下的醫(yī)療數(shù)據(jù)準(zhǔn)確性安全性風(fēng)險(xiǎn)意義重大。
引用
[1] 石晶金,于廣軍.健康醫(yī)療大數(shù)據(jù)共享關(guān)鍵問題及對策[J].中國衛(wèi)生資源,2021,24(3): 223-227+237.
[2] 侯黎莉.護(hù)理信息化的發(fā)展及臨床應(yīng)用[J].上海護(hù)理,2022,22(5):72-75.
[3] 大數(shù)據(jù)戰(zhàn)略重點(diǎn)實(shí)驗(yàn)室.大數(shù)據(jù)概念與發(fā)展[J].中國科技術(shù)語,2017,19(4):43-50.
[4] 戴明鋒,孟群.醫(yī)療健康大數(shù)據(jù)挖掘和分析面臨的機(jī)遇與挑戰(zhàn)[J].中國衛(wèi)生信息管理雜志,2017,14(2):126-130.
[5] 中華人民共和國國務(wù)院.促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要[J].成組技術(shù)與生產(chǎn)現(xiàn)代化,2015(3):51-58.
[6] 國務(wù)院辦公廳.國務(wù)院辦公廳關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見[EB/OL].(2016-01-21)[2021-02-20].http://www.gov.cn/gongbao/content/2016/content_5088769.htm.
[7] 中共中央國務(wù)院印發(fā)《“健康中國2030”規(guī)劃綱要》[EB/OL].(2016-10-25)[2018-03-22].http://www.gov.cn/zhengce/2016-10/ 25/content_5124174.htm.
[8] 楊朝暉,王心,徐香蘭.醫(yī)療健康大數(shù)據(jù)分類及問題探討[J].衛(wèi)生經(jīng)濟(jì)研究,2019,36(3):29-31.
[9] 李宜瑾,崔豫然.醫(yī)療大數(shù)據(jù)研究面臨的機(jī)遇與發(fā)展趨勢[J].信息與電腦(理論版),2019,31(19):29-31.
[10] 汪萌.醫(yī)療信息化助力醫(yī)院發(fā)展[D].南京:南京郵電大學(xué),2017.
[11] Miriam Reisman.EHRs:The Challenge of Making Electronic Data Usable and Interoperable[J].Pharmacy and Therapeutics,2017,42(9):572-575.
[12] 王海星,張靚,楊志清,等.醫(yī)療大數(shù)據(jù)在臨床科研中的應(yīng)用探討[J].中國醫(yī)院,2020,24(7):63-64.
[13] 葉清,劉迅,周曉梅,等.健康醫(yī)療大數(shù)據(jù)應(yīng)用存在的問題及對策探討[J].中國醫(yī)院管理,2022,42(1):83-85.
數(shù)字技術(shù)與應(yīng)用2023年1期