李果慶 李昭慧 金珂 劉紫微 桑藝格
【摘 ?要】本文在介紹了大數(shù)據(jù)相關(guān)概念與特征后,分析了大數(shù)據(jù)在公共衛(wèi)生管理(下文皆寫為“公衛(wèi)管理”)中數(shù)據(jù)量大、應(yīng)用范圍廣等優(yōu)勢,也探討了其相關(guān)技術(shù)不完善與應(yīng)用人才少、不易管理等劣勢,以及數(shù)據(jù)挖掘與數(shù)據(jù)整合難度大、醫(yī)療信息平臺尚未聯(lián)通等問題,提出了其需要注意的數(shù)據(jù)泄露風(fēng)險。研究目的是為了探討讓大數(shù)據(jù)技術(shù)更好地與公衛(wèi)管理相結(jié)合的可能性。本次研究參考了許多相關(guān)文獻(xiàn),在前人的基礎(chǔ)上我們稍作發(fā)展寫就此文。并在文末提出深度挖掘醫(yī)療大數(shù)據(jù)、提高其真實性和安全性等建議。以此讓大數(shù)據(jù)在公衛(wèi)管理中更好地發(fā)揮出它的優(yōu)勢,降低突發(fā)性公衛(wèi)事件對社會經(jīng)濟(jì)的影響。
【關(guān)鍵詞】大數(shù)據(jù);公共衛(wèi)生事件;應(yīng)急管理
引言
隨著信息多元化的發(fā)展和醫(yī)療技術(shù)的不斷改革,公共衛(wèi)生管理日益成為世界各國關(guān)注的焦點。同時,大數(shù)據(jù)技術(shù)的形成和不斷完善讓眾多專家、學(xué)者們意識到將其運用于公衛(wèi)管理中的重要性。目前,在大數(shù)據(jù)背景下我國公衛(wèi)應(yīng)急管理制度由于數(shù)據(jù)過于龐大、數(shù)據(jù)挖掘技術(shù)不夠完善、醫(yī)療信息平臺尚未完全聯(lián)通等方面依舊存在許多不足,而大數(shù)據(jù)技術(shù)的運用也給公衛(wèi)應(yīng)急管理帶來了新的挑戰(zhàn)和風(fēng)險。因此,如何解決這些新的挑戰(zhàn)和風(fēng)險,是本文所研究的主要內(nèi)容。參考文獻(xiàn)主要來自中國知網(wǎng)。
1.大數(shù)據(jù)的定義和特征
1.1 大數(shù)據(jù)的定義
大數(shù)據(jù)的定義歷來解釋不一,現(xiàn)引用以下幾種觀點來幫助我們理解大數(shù)據(jù)這一概念:美國國家標(biāo)準(zhǔn)與技術(shù)研究院認(rèn)為大數(shù)據(jù)是用來描述在我們網(wǎng)絡(luò)的、數(shù)字的、遍布傳感器的、信息驅(qū)動的世界中呈現(xiàn)出的數(shù)據(jù)泛濫的常用詞語;麥肯錫全球研究所認(rèn)為大數(shù)據(jù)通常指的是大小超越傳統(tǒng)數(shù)據(jù)庫軟件工具抓取、存儲、管理和分析能力的數(shù)據(jù)群;國內(nèi)學(xué)者在進(jìn)行大數(shù)據(jù)研究時多引用以上和其他大數(shù)據(jù)在國外的概念,此外國內(nèi)對“海量數(shù)據(jù)”這一說法認(rèn)同度較高,習(xí)慣稱大數(shù)據(jù)為海量數(shù)據(jù)。從上面對大數(shù)據(jù)的定義中我們可以總結(jié)出大數(shù)據(jù)的幾個主要特征。
1.2大數(shù)據(jù)的特征
大數(shù)據(jù)具有4“V”特征:即volume(數(shù)據(jù)量大)、velocity(速度)、variety(數(shù)據(jù)類型多樣)、value(價值)。
(1)為什么叫“大”數(shù)據(jù)(volume)?Facebook每天更新超過1,000萬張照片,YouTube平均每月有8億訪問者,平均每秒上傳超過一小時的視頻,Twitter上的信息量每年幾乎翻一番,互聯(lián)網(wǎng)時代,人人都是大數(shù)據(jù)的制造者。
(2)大數(shù)據(jù)的產(chǎn)生速度非??欤╲elocity)。例如,歐洲核子研究中心的大型強(qiáng)子對撞機(jī)在工作狀態(tài)下能每秒產(chǎn)生PB級的數(shù)據(jù)。在日常生活中,由于用戶群過于龐大,在極短的時間里就可以產(chǎn)生更加龐大的數(shù)據(jù)量,比如國內(nèi)每日產(chǎn)生的GPS位置信息。
(3)大數(shù)據(jù)的類型是多種多樣的(variety)。按產(chǎn)生數(shù)據(jù)的主體劃分,有感知設(shè)備對現(xiàn)實世界進(jìn)行測量而獲得的數(shù)據(jù),有移動設(shè)備的傳感器收集的用戶行為數(shù)據(jù);按數(shù)據(jù)格式劃分,可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。此外還有其他分類標(biāo)準(zhǔn)。
(4)利用好大數(shù)據(jù),可以以低成本創(chuàng)造高價值(value)。大數(shù)據(jù)最大的價值在于通過從大量不相關(guān)的各種類型的海量數(shù)據(jù)中,挖掘出對模式預(yù)測有價值的數(shù)據(jù),并通過AI或數(shù)據(jù)挖掘進(jìn)行深度分析,從而發(fā)現(xiàn)新規(guī)律和新知識。如果有了全國幾萬感染者的數(shù)據(jù),對這些數(shù)據(jù)進(jìn)行分析就能預(yù)測疫情的發(fā)展態(tài)勢,從而在公共衛(wèi)生應(yīng)急管理中做出更有針對性的決策,最終達(dá)到控制疫情的效果。
2.大數(shù)據(jù)在公共衛(wèi)生管理中的優(yōu)勢分析
2.1數(shù)據(jù)挖掘是大數(shù)據(jù)在公衛(wèi)管理里發(fā)揮優(yōu)勢的前提
在這里首先引出兩個概念:數(shù)據(jù)挖掘和醫(yī)學(xué)數(shù)據(jù)挖掘。
(1)數(shù)據(jù)挖掘是指在不完全的、大量且隨機(jī)的數(shù)據(jù)中通過某種算法找出數(shù)據(jù)中所隱藏的、人們未知的、具有潛在價值的知識和信息的過程。數(shù)據(jù)挖掘具有自身獨有的理念,給人們解決問題提供了一種新的思路和方法。
(2)基于大數(shù)據(jù)的醫(yī)學(xué)數(shù)據(jù)挖掘是一門覆蓋面廣、技術(shù)難度大的新興交叉學(xué)科。它是計算機(jī)技術(shù)、人工智能和現(xiàn)代醫(yī)學(xué)相結(jié)合的產(chǎn)物,需要從事計算機(jī)和統(tǒng)計學(xué)的研究人員與醫(yī)務(wù)工作者之間的充分合作。隨著理論研究的深入和進(jìn)一步的實踐探索,醫(yī)學(xué)數(shù)據(jù)挖掘在疾病的診療、醫(yī)學(xué)科研以及公衛(wèi)管理等方面發(fā)揮了強(qiáng)有力的作用,而這也是大數(shù)據(jù)在公衛(wèi)應(yīng)急管理里發(fā)揮其優(yōu)勢的前提。
2.2大數(shù)據(jù)應(yīng)用在公共衛(wèi)生應(yīng)急管理中的優(yōu)勢
(1)大數(shù)據(jù)應(yīng)用范圍十分廣,這意味著,在進(jìn)行公衛(wèi)管理時能靠大數(shù)據(jù)獲得幾乎所有需要的信息。從交通出行數(shù)據(jù)到醫(yī)院確診數(shù)據(jù)到醫(yī)療物資數(shù)據(jù),從多樣的數(shù)據(jù)里可以得到全面的信息。新冠疫情防控前期,電信企業(yè)利用大數(shù)據(jù)分析技術(shù)聚焦重點地區(qū)、省份,特別是在關(guān)鍵時間節(jié)點,提供了人員的流動信息以及疫情的態(tài)勢;中國電子科技集團(tuán)建立了風(fēng)險人群感知大數(shù)據(jù)平臺,在這個基礎(chǔ)上還研發(fā)了密切接觸者測量儀,每個人只要輸入自己的姓名、身份證,就能知道自己是不是密切接觸者;中國信息通訊研究院研發(fā)了重點醫(yī)療物資的調(diào)度和保障平臺,極好地實現(xiàn)了調(diào)度和保障的有效性。
(2)大數(shù)據(jù)數(shù)據(jù)量十分大,對海量數(shù)據(jù)進(jìn)行挖掘分析可以讓相關(guān)部門在進(jìn)行公衛(wèi)管理時結(jié)合數(shù)據(jù)庫中提煉出大量的潛在有效信息對特定人群進(jìn)行分析診斷并得出診斷結(jié)論;也可以通過分析處理一些歷史數(shù)據(jù)挖掘出與疾病相關(guān)的重要信息并形成結(jié)論。例如在對抗新冠肺炎疫情中,通過追蹤感染者與疑似感染人群的歷史出行數(shù)據(jù)、消費數(shù)據(jù),摸清這些人過去的出現(xiàn)狀況來預(yù)測相關(guān)地區(qū)的疫情發(fā)展趨勢,對傳染病進(jìn)行有效遏制;疾病的分布通常隨人口的年齡,性別,職業(yè)等而變化,也與人群的日常行為和生活環(huán)境有關(guān)。對醫(yī)院病例數(shù)據(jù)庫中的病人群體的相關(guān)信息進(jìn)行整合分析,可以從中得出各類社會群體與疾病間的相互關(guān)聯(lián)性,判斷出易感染易發(fā)病人群與潛在傳染源,降低疾病的蔓延程度與負(fù)面影響。這些都是大數(shù)據(jù)在應(yīng)急管理中的優(yōu)勢所在。
3.目前運用大數(shù)據(jù)進(jìn)行公共衛(wèi)生管理時存在的劣勢、問題與風(fēng)險
3.1運用大數(shù)據(jù)進(jìn)行公衛(wèi)管理的劣勢
(1)與傳統(tǒng)管理手段相比,大數(shù)據(jù)式的管理顯然對技術(shù)的要求更高。比如數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)挖掘本身就是一種新的數(shù)據(jù)處理技術(shù),它融合了數(shù)據(jù)庫、機(jī)器學(xué)習(xí)、人工智能等領(lǐng)域的理論和技術(shù)。因此醫(yī)療數(shù)據(jù)挖掘?qū)夹g(shù)的要求極其嚴(yán)苛。而目前,中國的數(shù)據(jù)挖掘技術(shù)還處于起步階段,相關(guān)可應(yīng)用人才還不足以滿足社會需要。在不斷增長的海量數(shù)據(jù)群中挖掘出有價值的數(shù)據(jù)進(jìn)行分析,仍是一大挑戰(zhàn)。
(2)大數(shù)據(jù)加大了管理的難度。醫(yī)學(xué)人才與技術(shù)人才彼此獨立,兩者間存在著專業(yè)壁壘不能輕易打破,而運用大數(shù)據(jù)進(jìn)行公衛(wèi)管理時是需要雙方甚至更多方密切合作的。如果不能對各主體進(jìn)行有效的管理,在進(jìn)行數(shù)據(jù)分析時數(shù)據(jù)與醫(yī)學(xué)間的知識轉(zhuǎn)化過程會極大地拉低工作效率,這在以高速高效為應(yīng)急防控關(guān)鍵的重大突發(fā)性公衛(wèi)事件中是相當(dāng)不利的。
3.2運用大數(shù)據(jù)進(jìn)行公衛(wèi)管理存在的問題
(1)數(shù)據(jù)挖掘與數(shù)據(jù)整合難度大。一方面是前文提到的數(shù)據(jù)挖掘本身就是一種新技術(shù),其發(fā)展并不充分,國內(nèi)相關(guān)技術(shù)還不完善;一方面是數(shù)據(jù)太過龐大太過多樣,且數(shù)據(jù)增長速度正在不斷加快,在進(jìn)行數(shù)據(jù)挖掘與整合時對技術(shù)和管理的要求都在不斷提高。
(2)醫(yī)療信息平臺尚未完全聯(lián)通。國內(nèi)的醫(yī)療衛(wèi)生信息化還處于一種各自開發(fā)、各自建設(shè)的狀態(tài),區(qū)域醫(yī)療衛(wèi)生信息數(shù)據(jù)中心還在建設(shè)當(dāng)中,區(qū)域內(nèi)醫(yī)療機(jī)構(gòu)信息互聯(lián)互通還未實現(xiàn),各醫(yī)療信息平臺位于“信息孤島”仍是還未充分解決的現(xiàn)實問題。
3.3使用大數(shù)據(jù)技術(shù)進(jìn)行公衛(wèi)管理的潛在風(fēng)險
(1)假數(shù)據(jù)的風(fēng)險。大數(shù)據(jù)環(huán)境下的數(shù)據(jù)具有較高的信噪比,在龐大的數(shù)據(jù)海洋里也容納了“假”數(shù)據(jù)、“臟數(shù)據(jù)”,如果不能過濾掉那些非真實數(shù)據(jù),則會不同程度地影響到數(shù)據(jù)分析結(jié)果的真實性,甚至可能帶來“矯枉過正”的后果。
(2)數(shù)據(jù)泄露的風(fēng)險。云計算等大數(shù)據(jù)技術(shù)、醫(yī)療保健信息的集中化收集和一些大型數(shù)據(jù)庫的建立,不僅使私人醫(yī)療數(shù)據(jù)遭受個人或不良團(tuán)體攻擊竊取的風(fēng)險加大了,也為第三方出于商業(yè)目的在未經(jīng)授權(quán)的情況下濫用患者的健康信息提供了便利。醫(yī)療大數(shù)據(jù)與其他類型的大數(shù)據(jù)相比要更加敏感,患者數(shù)據(jù)泄漏可能會給其個人帶來被孤立、傷害等后果,而數(shù)據(jù)隱私保護(hù)問題尚無完美的解決方案。
4.建立大數(shù)據(jù)的相關(guān)建議
4.1建立建全數(shù)據(jù)挖掘、篩選體制,將應(yīng)急管理與現(xiàn)代化信息技術(shù)充分結(jié)合
(1)在數(shù)據(jù)準(zhǔn)備階段要確保途徑準(zhǔn)確、提供數(shù)據(jù)人員真實可靠,從源頭上遏制數(shù)據(jù)的不真實性。
(2)在數(shù)據(jù)儲存階段,面對數(shù)量大、病例和數(shù)據(jù)類型復(fù)雜、數(shù)據(jù)變化快的醫(yī)學(xué)數(shù)據(jù)時,需要進(jìn)行分類和模式化整理。還要注重數(shù)據(jù)更新,需要完善多級聯(lián)動的數(shù)字化信息采集系統(tǒng)來提高數(shù)據(jù)采集的及時性,以便在第一時間采集到新的數(shù)據(jù),這樣在重大突發(fā)性公共衛(wèi)生事件發(fā)生時,可以第一時間地獲取到多源的數(shù)據(jù)來進(jìn)行風(fēng)險評價、疾病防控,為醫(yī)院和相關(guān)政府部門應(yīng)對風(fēng)險提供全面的數(shù)據(jù)支持。
(3)在篩選階段,建立或選取成熟有效的大數(shù)據(jù)模型,比如通過已有的傳染病模型(SI,SIR等模型)來提供一定的理論數(shù)據(jù)基礎(chǔ),作為大數(shù)據(jù)篩選的類比模本。要在突發(fā)性公共衛(wèi)生事件發(fā)生時快速構(gòu)建應(yīng)急管理數(shù)據(jù)庫和數(shù)據(jù)庫分類檢索系統(tǒng),這樣在需要各類不同數(shù)據(jù)時就可以通過檢索快速準(zhǔn)確地提取出相關(guān)數(shù)據(jù)。
4.2增強(qiáng)數(shù)據(jù)互用性,促進(jìn)信息共享
公共衛(wèi)生領(lǐng)域需要全面實現(xiàn)信息的標(biāo)準(zhǔn)化,建立有效的數(shù)據(jù)分析、管理系統(tǒng),搭建基于云計算的大數(shù)據(jù)研究技術(shù)平臺,形成系統(tǒng)、成熟的大數(shù)據(jù)分析方法和模型,實現(xiàn)公共衛(wèi)生數(shù)據(jù)收集、整理、共享、挖掘、分析、決策一體化。
4.3提高數(shù)據(jù)的安全性
(1)完善數(shù)據(jù)保密與隱私保護(hù)的相關(guān)的法律法規(guī),確定由具有保密資質(zhì)的國家公共安全信息維護(hù)部門來組織相關(guān)部門獲得私人信息以外的時空活動信息。
(2)病例數(shù)據(jù)庫在系統(tǒng)后臺運行時,讓公眾只能查看自身及其周邊整體情況,無權(quán)限調(diào)查、獲取他人具體的數(shù)據(jù)資料,從而進(jìn)一步保障數(shù)據(jù)安全問題。
(3)最重要的是在技術(shù)上提高數(shù)據(jù)的安全性,做好數(shù)據(jù)加密,牢固數(shù)據(jù)防火墻,對醫(yī)療數(shù)據(jù)進(jìn)行集中儲存管理,確定好有權(quán)限獲取數(shù)據(jù)資料的管理層與相關(guān)工作人員,建立追責(zé)問責(zé)機(jī)制。
5.結(jié)束語
在應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行公衛(wèi)管理上中國已經(jīng)具備了一定的基礎(chǔ),而2020年中國對新冠疫情的防控也說明了大數(shù)據(jù)應(yīng)用在公衛(wèi)管理上的卓有成效。然而,公共衛(wèi)生領(lǐng)域需要的大數(shù)據(jù)十分龐雜,醫(yī)療數(shù)據(jù)具備一定的敏感性,目前國內(nèi)的大數(shù)據(jù)技術(shù)仍處于起步階段,在應(yīng)用大數(shù)據(jù)時存在的數(shù)據(jù)泄露風(fēng)險,這些都制約著用運用大數(shù)據(jù)進(jìn)行公衛(wèi)管理。同時也說明,大數(shù)據(jù)在公衛(wèi)管理上還有十分寬廣的發(fā)展空間。國內(nèi)應(yīng)該在已有技術(shù)基礎(chǔ)上,加強(qiáng)對相關(guān)技術(shù)人才、復(fù)合型人才的培養(yǎng)力度,注重技術(shù)創(chuàng)新,完善關(guān)于數(shù)據(jù)隱私保護(hù)的相關(guān)法律法規(guī),將應(yīng)急管理與現(xiàn)代化信息技術(shù)充分結(jié)合,早日建立完善的數(shù)字化公衛(wèi)管理體系。
參考文獻(xiàn)
[1]彭宗超,黃昊,吳洪濤,謝起慧. 新冠肺炎疫情前期應(yīng)急防控的“五情”大數(shù)據(jù)分析[J].治理研究.2020(2):6-20
[2]秦文哲,陳進(jìn),董力.大數(shù)據(jù)背景下醫(yī)學(xué)數(shù)據(jù)挖掘的研究進(jìn)展及應(yīng)用[J].中國胸心血管外科臨床雜志.2016 (1):55-60.
[3]劉彥培, 劉恩順. 醫(yī)學(xué)數(shù)據(jù)挖掘綜述[J]. 光明中醫(yī).2018 (12): 1714-1716.
[4]張世紅,徐國桓,劉會霞,龔文濤.數(shù)據(jù)挖掘在醫(yī)學(xué)上的應(yīng)用[J].醫(yī)學(xué)信息學(xué)雜志.2004(06):408-410.