李儒銀,李 洋,羅志宏△
(1.重慶醫(yī)科大學(xué)附屬第一醫(yī)院 400016;2.成都體育學(xué)院,成都 610041)
突發(fā)公共衛(wèi)生事件是指突然發(fā)生,造成或可能造成社會(huì)公眾健康嚴(yán)重?fù)p害的重大傳染病疫情、群體性不明原因疾病、重大食物和職業(yè)中毒及其他嚴(yán)重影響公眾健康的事件[1]。近年來(lái),國(guó)內(nèi)外突發(fā)公共衛(wèi)生事件頻發(fā),如2003年的非典型肺炎、2009年的甲型流感、2014年西非的埃博拉病毒及2019年的新型冠狀病毒肺炎(簡(jiǎn)稱(chēng)新冠肺炎),都給國(guó)家建設(shè)、人民利益、社會(huì)經(jīng)濟(jì)造成了巨大損失,甚至一度引發(fā)公眾恐慌情緒。而歷次突發(fā)公共衛(wèi)生事件均會(huì)產(chǎn)生大量的疫情相關(guān)數(shù)據(jù),要充分了解疫情數(shù)據(jù)信息,才能做到“心中有數(shù),手中有策”[2]。所以,如何有效管控突發(fā)公共衛(wèi)生事件中產(chǎn)生的數(shù)據(jù),協(xié)調(diào)突發(fā)公共衛(wèi)生事件數(shù)據(jù)的有效開(kāi)放和利用,有利于各級(jí)政府部門(mén)對(duì)疫情整體發(fā)展情況做出客觀判斷,部署防控措施;有利于執(zhí)行部門(mén)制訂科學(xué)防控方案,把握重點(diǎn)工作方向;有利于衛(wèi)生部門(mén)合理配置資源,提高工作效率;還有利于疫情防控的國(guó)際合作和民眾安撫。
“關(guān)聯(lián)數(shù)據(jù)(Linked Data)”的概念由TIM于2006年提出,是“互聯(lián)網(wǎng)+”時(shí)代,進(jìn)行大數(shù)據(jù)管理、發(fā)布和服務(wù)的核心技術(shù)之一。目前,關(guān)聯(lián)數(shù)據(jù)已經(jīng)在藥物知識(shí)發(fā)現(xiàn)、智慧醫(yī)療建設(shè)、醫(yī)學(xué)資源共享和醫(yī)學(xué)信息學(xué)知識(shí)體系構(gòu)建等領(lǐng)域有諸多應(yīng)用實(shí)踐[3]。為了充分發(fā)揮關(guān)聯(lián)數(shù)據(jù)在突發(fā)公共衛(wèi)生事件數(shù)據(jù)管控中的價(jià)值,筆者論述了關(guān)聯(lián)數(shù)據(jù)應(yīng)用于突發(fā)公共衛(wèi)生事件數(shù)據(jù)開(kāi)放平臺(tái)的必要性和技術(shù)實(shí)現(xiàn)路徑,并以新冠肺炎疫情數(shù)據(jù)為例,設(shè)計(jì)了基于關(guān)聯(lián)數(shù)據(jù)的疫情數(shù)據(jù)開(kāi)放平臺(tái)。同時(shí),也分析了平臺(tái)建設(shè)過(guò)程中可能存在的一些問(wèn)題。
利用關(guān)聯(lián)數(shù)據(jù)技術(shù),將公共衛(wèi)生領(lǐng)域的結(jié)構(gòu)化數(shù)據(jù)通過(guò)網(wǎng)絡(luò)進(jìn)行關(guān)聯(lián)和共享,充分挖掘信息價(jià)值,實(shí)現(xiàn)信息高效利用、提升信息協(xié)同效率,能夠給予數(shù)據(jù)更大的附加價(jià)值[4]。以新冠肺炎為例,筆者發(fā)現(xiàn):有關(guān)新冠肺炎疫情的數(shù)據(jù)類(lèi)型多樣、渠道豐富,有政府部門(mén)官方網(wǎng)站的數(shù)據(jù),有醫(yī)藥衛(wèi)生行業(yè)的主流媒體數(shù)據(jù),有社交網(wǎng)絡(luò)的數(shù)據(jù),有第三方支付平臺(tái)的數(shù)據(jù)等。這些信息的全方位、深層次、多渠道傳播,使公眾對(duì)新冠肺炎有了全面的認(rèn)識(shí)和了解,增強(qiáng)了民眾的防護(hù)意識(shí)。但這些數(shù)據(jù)之間存在內(nèi)容重復(fù)、真?zhèn)坞y辨等現(xiàn)象,且數(shù)據(jù)平臺(tái)之間的數(shù)據(jù)缺乏統(tǒng)一標(biāo)準(zhǔn)、管理混亂、共享性差、內(nèi)容深度挖掘不足等問(wèn)題。
由此可見(jiàn),突發(fā)公共衛(wèi)生事件數(shù)據(jù)的管理中還存在諸多問(wèn)題,不利于公共衛(wèi)生部門(mén)做出科學(xué)決策,也增加了疫情管控、醫(yī)療資源協(xié)調(diào)的難度,使得許多具體工作難以有效落實(shí)和開(kāi)展;同時(shí),突發(fā)公共衛(wèi)生事件數(shù)據(jù)的不規(guī)范發(fā)布還容易引發(fā)大眾的信息焦慮和心理恐慌。所以,建立行之有效的突發(fā)公共衛(wèi)生事件數(shù)據(jù)開(kāi)放平臺(tái)勢(shì)在必行。
將關(guān)聯(lián)數(shù)據(jù)技術(shù)嵌入到突發(fā)公共衛(wèi)生事件數(shù)據(jù)開(kāi)放平臺(tái)建設(shè)中,由公共衛(wèi)生部門(mén)進(jìn)行統(tǒng)一規(guī)劃、統(tǒng)一建設(shè)、統(tǒng)一協(xié)調(diào)、統(tǒng)一管理,能夠有效推動(dòng)公共衛(wèi)生突發(fā)事件數(shù)據(jù)管理。
突發(fā)公共衛(wèi)生事件具有生命周期,其演變階段可分為疫情潛伏期、疫情暴發(fā)期和疫情恢復(fù)期[5],在疫情發(fā)展的不同階段,數(shù)據(jù)信息存在較為明顯的差異,但也會(huì)有交叉重復(fù)。疫情潛伏期的數(shù)據(jù)包含疫情監(jiān)測(cè)監(jiān)控、趨勢(shì)預(yù)測(cè)、風(fēng)險(xiǎn)評(píng)估、防護(hù)指南、輿情防控等;疫情暴發(fā)期的數(shù)據(jù)包括病毒檢測(cè)、疫苗研制、醫(yī)療救助、物資調(diào)用、人員流動(dòng)、患者上報(bào)、虛假謠言等;疫情恢復(fù)期的數(shù)據(jù)包括整理疫情起因、爆發(fā)過(guò)程、損失評(píng)估、事后分析等。根據(jù)疫情發(fā)展的不同階段,研究者構(gòu)建了突發(fā)公共衛(wèi)生事件數(shù)據(jù)整合框架,見(jiàn)圖1。
圖1 突發(fā)公共衛(wèi)生事件數(shù)據(jù)整合框架
根據(jù)關(guān)聯(lián)數(shù)據(jù)語(yǔ)義描述的步驟,筆者認(rèn)為突發(fā)公共衛(wèi)生事件疫情數(shù)據(jù)的語(yǔ)義描述步驟為,(1)疫情數(shù)據(jù)標(biāo)識(shí):采用統(tǒng)一格式進(jìn)行標(biāo)識(shí),便于疫情數(shù)據(jù)的規(guī)范化處理和集中管理;(2)疫情數(shù)據(jù)集選擇:參考MeSH主題詞表、醫(yī)學(xué)標(biāo)準(zhǔn)術(shù)語(yǔ)和通用語(yǔ),或自定義新的術(shù)語(yǔ)為數(shù)據(jù)集命名;(3)疫情數(shù)據(jù)資源描述框架的描述:使用固定格式的計(jì)算機(jī)語(yǔ)言描述不同數(shù)據(jù),創(chuàng)建訪問(wèn)入口,通過(guò)搜索引擎檢索數(shù)據(jù);(4)疫情數(shù)據(jù)鏈接:在規(guī)范化的數(shù)據(jù)描述之后,建立疫情數(shù)據(jù)的網(wǎng)絡(luò)鏈接;(5)疫情數(shù)據(jù)語(yǔ)義發(fā)布:將不同來(lái)源、不同類(lèi)型的疫情數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)類(lèi)型,嵌入數(shù)據(jù)的版本號(hào)或標(biāo)識(shí)符,進(jìn)行數(shù)據(jù)發(fā)布;(6)疫情數(shù)據(jù)平臺(tái)維護(hù)與運(yùn)營(yíng):及時(shí)更新平臺(tái)數(shù)據(jù),關(guān)注疫情數(shù)據(jù)的維護(hù)和實(shí)時(shí)更新。
采用關(guān)聯(lián)數(shù)據(jù)技術(shù)實(shí)現(xiàn)了后臺(tái)數(shù)據(jù)的規(guī)范、統(tǒng)一管理,便于各類(lèi)用戶(hù)的訪問(wèn)、瀏覽與檢索。針對(duì)用戶(hù)的操作需求,選擇專(zhuān)門(mén)的關(guān)聯(lián)數(shù)據(jù)搜索引擎,或嵌入關(guān)聯(lián)數(shù)據(jù)瀏覽器。同時(shí),對(duì)疫情數(shù)據(jù)進(jìn)行分類(lèi)導(dǎo)航,根據(jù)疫情發(fā)展態(tài)勢(shì),適時(shí)更新不同階段的數(shù)據(jù)類(lèi)型。
新冠肺炎是新中國(guó)成立以來(lái)在我國(guó)發(fā)生的傳播速度最快、感染范圍最廣、防控難度最大的一次重大突發(fā)公共衛(wèi)生事件[6]。本平臺(tái)依托關(guān)聯(lián)數(shù)據(jù)技術(shù),構(gòu)建新冠肺炎數(shù)據(jù)開(kāi)放平臺(tái)框架[7],見(jiàn)圖2。通過(guò)整合各種類(lèi)型、不同來(lái)源的新冠肺炎疫情數(shù)據(jù),進(jìn)行統(tǒng)一標(biāo)引,數(shù)據(jù)解析、提取與合并,利用資源描述框架機(jī)制進(jìn)行描述,建立計(jì)算機(jī)可識(shí)別的鏈接和語(yǔ)言,在Web頁(yè)面上發(fā)布數(shù)據(jù),提供訪問(wèn)接口,嵌入用戶(hù)導(dǎo)航界面,使用戶(hù)通過(guò)互聯(lián)網(wǎng)進(jìn)行瀏覽和檢索,促進(jìn)新冠疫情數(shù)據(jù)互聯(lián)互通和深度應(yīng)用。
圖2 新冠肺炎數(shù)據(jù)開(kāi)放平臺(tái)
數(shù)據(jù)標(biāo)準(zhǔn)化是實(shí)現(xiàn)數(shù)據(jù)開(kāi)放共享的基礎(chǔ)。突發(fā)公共衛(wèi)生事件數(shù)據(jù)開(kāi)放平臺(tái)的建設(shè)會(huì)涉及不同類(lèi)型、非結(jié)構(gòu)化數(shù)據(jù),如疫情監(jiān)測(cè)數(shù)據(jù)、病毒檢測(cè)工具、疫苗研制信息、物資調(diào)用信息、防護(hù)指南信息、患者就診信息等,以及各種醫(yī)學(xué)專(zhuān)業(yè)術(shù)語(yǔ)等。所以,面對(duì)龐雜的突發(fā)公共衛(wèi)生事件數(shù)據(jù),需要全面收集、分類(lèi)、整理和組織,制訂科學(xué)的數(shù)據(jù)規(guī)范標(biāo)準(zhǔn),實(shí)現(xiàn)語(yǔ)義上的互操作。
突發(fā)公共衛(wèi)生事件數(shù)據(jù)的收集過(guò)程中,通常會(huì)涉及患者隱私信息,如個(gè)人背景信息、健康狀況、病歷信息等,一旦被泄露,會(huì)對(duì)患者的日常生活帶來(lái)很大困擾。所以,數(shù)據(jù)開(kāi)放的過(guò)程中,需要設(shè)定專(zhuān)門(mén)的隱私保護(hù)屏蔽技術(shù),保障患者隱私權(quán)。此外,需要把握病毒檢測(cè)和疫苗研發(fā)中科學(xué)數(shù)據(jù)開(kāi)放與保護(hù)的平衡點(diǎn),同時(shí)對(duì)涉及的臨床試驗(yàn)、科研倫理問(wèn)題,成立專(zhuān)門(mén)的倫理評(píng)估系統(tǒng)和審查機(jī)制,保證科學(xué)研究順利開(kāi)展[8]。
明確數(shù)據(jù)權(quán)利,保護(hù)數(shù)據(jù)主體、數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)控制者和參與者、數(shù)據(jù)客體的利益平衡,才能促進(jìn)數(shù)據(jù)的合理開(kāi)發(fā)和使用。突發(fā)公共衛(wèi)生事件中產(chǎn)生的數(shù)據(jù),按照來(lái)源可分為個(gè)人數(shù)據(jù)、商業(yè)數(shù)據(jù)、政府?dāng)?shù)據(jù)、醫(yī)療機(jī)構(gòu)數(shù)據(jù),這些數(shù)據(jù)由哪個(gè)部門(mén)主張收集、如何兼顧公共利益和個(gè)人信息保護(hù),以及所收集到數(shù)據(jù)的權(quán)利界定與歸屬問(wèn)題均關(guān)系到數(shù)據(jù)的合法利用。所以,有必要主張數(shù)據(jù)權(quán)利,采取技術(shù)措施降低風(fēng)險(xiǎn),避免因個(gè)人信息泄露、濫用而引發(fā)人身?yè)p害、財(cái)產(chǎn)損失,甚至是公眾恐慌和政府信任減損[9]。
數(shù)據(jù)開(kāi)放在突發(fā)公共衛(wèi)生事件數(shù)據(jù)監(jiān)測(cè)、分析和利用等方面起到了積極作用,如歐盟創(chuàng)建的新冠肺炎數(shù)據(jù)共享平臺(tái)。但科學(xué)界定數(shù)據(jù)開(kāi)放范圍、審批數(shù)據(jù)開(kāi)放對(duì)象,需要成立專(zhuān)門(mén)的審查機(jī)構(gòu)進(jìn)行嚴(yán)密審核,依法確定完全公開(kāi)、適度公開(kāi)、申請(qǐng)公開(kāi)、保密等權(quán)限;申請(qǐng)者依托機(jī)構(gòu)認(rèn)證,簽署保密協(xié)議和合理使用協(xié)議等證書(shū)。同時(shí),還需要關(guān)注數(shù)據(jù)保護(hù)問(wèn)題,必要的時(shí)候限定數(shù)據(jù)分析的用途。
由于突發(fā)公共衛(wèi)生事件具有不確定性、群發(fā)性、演變復(fù)雜性、高危害性等特點(diǎn),需要快速、準(zhǔn)確地獲取并有效地收集、利用相關(guān)數(shù)據(jù),以提高應(yīng)急響應(yīng)的科學(xué)性和效率,降低疫情帶來(lái)的危害和負(fù)面影響。本研究基于關(guān)聯(lián)數(shù)據(jù)技術(shù),提出突發(fā)公共衛(wèi)生事件數(shù)據(jù)開(kāi)放平臺(tái)的建設(shè)方案,展現(xiàn)了數(shù)據(jù)開(kāi)放平臺(tái)在疫情防控工作中的廣闊應(yīng)用前景。未來(lái)研究可以依托數(shù)據(jù)開(kāi)放平臺(tái),針對(duì)疫情防控中產(chǎn)生的科學(xué)知識(shí)、科研成果、政府決策、醫(yī)療救治等數(shù)據(jù)信息,形成專(zhuān)題資源數(shù)據(jù)庫(kù),強(qiáng)化突發(fā)公共衛(wèi)生事件大數(shù)據(jù)分析和智庫(kù)建設(shè)。