• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      醫(yī)療健康大數(shù)據(jù):概念、特點、平臺及數(shù)據(jù)集成問題研究

      2018-12-06 09:27:16邢丹姚俊明
      物聯(lián)網(wǎng)技術(shù) 2018年8期
      關(guān)鍵詞:數(shù)據(jù)集成大數(shù)據(jù)平臺分布式計算

      邢丹 姚俊明

      摘 要:從狹義和廣義角度定義了醫(yī)療健康大數(shù)據(jù),分析并總結(jié)了醫(yī)療健康大數(shù)據(jù)區(qū)別于傳統(tǒng)大數(shù)據(jù)的海量性、復(fù)雜性、精確性、安全性、異構(gòu)性及封閉性的特點。同時探討了構(gòu)建醫(yī)療健康大數(shù)據(jù)平臺的相關(guān)問題,架構(gòu)技術(shù)及其關(guān)鍵問題、平臺構(gòu)建的兼容問題及其技術(shù)路線問題,最后分析了醫(yī)療大數(shù)據(jù)的數(shù)據(jù)集成所考慮的問題、難點及現(xiàn)有的集成方法。

      關(guān)鍵詞:醫(yī)療健康;大數(shù)據(jù);大數(shù)據(jù)平臺;數(shù)據(jù)集成;分布式計算

      中圖分類號:TP274 文獻標(biāo)識碼:A 文章編號:2095-1302(2018)08-0-03

      0 引 言

      目前,我國雖已具有多年醫(yī)療信息化建設(shè)的歷史,但是這些數(shù)據(jù)庫信息孤立、分散、多元、異構(gòu)、類型、標(biāo)準不一,大多應(yīng)用于單獨醫(yī)院或較小范圍內(nèi)的醫(yī)院,沒有形成大范圍多學(xué)科、多標(biāo)準、多類型、多模式的協(xié)同系統(tǒng)。與此同時,近年來國家提出打造以醫(yī)院、社區(qū)、平臺為主的“三位一體、相互協(xié)同”的綜合服務(wù)新模式,醫(yī)療數(shù)據(jù)的產(chǎn)生,從醫(yī)院管理系統(tǒng)的關(guān)系型數(shù)據(jù)轉(zhuǎn)變?yōu)橛蒖FID及無線傳感組成的半結(jié)構(gòu)化、非結(jié)構(gòu)化大數(shù)據(jù)。如何完成多數(shù)據(jù)源醫(yī)療健康大數(shù)據(jù)的無縫集成和融合,構(gòu)建全國范圍內(nèi)的醫(yī)療協(xié)同系統(tǒng),是未來面向醫(yī)療行業(yè)所采取的必經(jīng)之路。

      這項工作需在充分掌握醫(yī)療健康大數(shù)據(jù)特點的基礎(chǔ)上,通過構(gòu)建醫(yī)療健康大數(shù)據(jù)平臺,從數(shù)據(jù)集成問題著手,本文從不同角度探討了醫(yī)療大數(shù)據(jù)相關(guān)問題。

      1 醫(yī)療健康大數(shù)據(jù)概念及其特點

      1.1 醫(yī)療健康大數(shù)據(jù)概念

      狹義上的醫(yī)療健康大數(shù)據(jù)指的是醫(yī)院的醫(yī)療機構(gòu)產(chǎn)生的大數(shù)據(jù),這是最主要的醫(yī)療健康大數(shù)據(jù),產(chǎn)生于醫(yī)院常規(guī)臨床診治、科研和管理過程,包括各種門急診記錄、住院記錄、影像記錄、實驗室記錄、用藥記錄、手術(shù)記錄、隨訪記錄和醫(yī)保數(shù)據(jù)等[1]。

      廣義上的醫(yī)療健康大數(shù)據(jù)涵蓋來自于區(qū)域衛(wèi)生服務(wù)平臺大數(shù)據(jù)、醫(yī)學(xué)研究或疾病監(jiān)測大數(shù)據(jù)、自我量化大數(shù)據(jù)、互聯(lián)網(wǎng)上與醫(yī)學(xué)相關(guān)的網(wǎng)絡(luò)大數(shù)據(jù)、生物標(biāo)本和基因測序的生物信息大數(shù)據(jù)。

      1.2 醫(yī)療大數(shù)據(jù)的特點

      醫(yī)療健康大數(shù)據(jù)除了具有傳統(tǒng)大數(shù)據(jù)的大量性、多樣性、快速性[1]之外,由于醫(yī)療行業(yè)的特殊性,使其還具有海量性、復(fù)雜性、精確性及安全性,同時由于醫(yī)療信息化建設(shè)的歷史導(dǎo)致了異構(gòu)性和封閉性。

      (1)海量性。2011年,美國的醫(yī)療健康系統(tǒng)數(shù)據(jù)量就達到了150 EB。醫(yī)療衛(wèi)生機構(gòu)除了傳統(tǒng)臨床和檢驗中產(chǎn)生的數(shù)據(jù)之外,隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,能夠?qū)崿F(xiàn)所有物物相連,比如便攜式醫(yī)療設(shè)備上二維碼標(biāo)簽所產(chǎn)生的數(shù)據(jù),這些物品的數(shù)據(jù)相比傳統(tǒng)的數(shù)據(jù)量要大的多。加之各種健身、健康可穿戴設(shè)備的出現(xiàn),使得血壓、心率、體重、血糖、心電圖(EKG)等的監(jiān)測都變?yōu)楝F(xiàn)實和可能,信息獲取和分析的速度已從原來的按“天”計算,發(fā)展到按“小時”,按“秒”計算。此外,基因數(shù)據(jù)也是龐大的存在,一次全面的基因測序,產(chǎn)生的個人數(shù)據(jù)達到300 GB。平臺數(shù)據(jù)量巨大,通常要包含1 000萬以上個人用戶的各種醫(yī)療健康數(shù)據(jù)。

      (2)復(fù)雜性。一方面醫(yī)療領(lǐng)域包含了大量的醫(yī)學(xué)專業(yè)用語,僅疾病名稱就包括3萬多種,另外還有數(shù)以萬計的診斷、手術(shù)和藥物名稱,以及大量影像、醫(yī)囑等非結(jié)構(gòu)化數(shù)據(jù)[2]。由于醫(yī)療數(shù)據(jù)是不同臨床診療服務(wù)過程中的產(chǎn)物,因此數(shù)據(jù)之間關(guān)系復(fù)雜,且易受到不同因素的影響,致使某些數(shù)據(jù)帶有偏倚性。醫(yī)院之間也存在諸多差別,如病人的個體特性和疾病程度、醫(yī)院的診斷和治療水平、醫(yī)療數(shù)據(jù)的記錄和編碼水平等。即使是同一個描述形式,其語法和語義上也不盡相同,更加導(dǎo)致了數(shù)據(jù)的復(fù)雜性。

      (3)精確性。醫(yī)療行業(yè)數(shù)據(jù)與人的健康、疾病和生命息息相關(guān),任何失誤都可能導(dǎo)致錯誤結(jié)論,并進一步誤導(dǎo)臨床診治工作,對臨床實踐造成巨大損害。因此在數(shù)據(jù)處理時必須保證數(shù)據(jù)完整性和約束完整性。數(shù)據(jù)完整性指數(shù)據(jù)的正確性、一致性和相容性;約束完整性指數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,是表征數(shù)據(jù)間邏輯的唯一特征。保證約束完整性是數(shù)據(jù)發(fā)布和數(shù)據(jù)交換的前提,可方便數(shù)據(jù)處理過程,提高效率。

      (4)安全性。醫(yī)療數(shù)據(jù)除了包含病人隱私信息,也包含了大量關(guān)于醫(yī)院運轉(zhuǎn)、診療方法、藥物療效等信息。這些信息一般都較敏感,某些可能會涉及商業(yè)利益,因此目前存在的問題主要是醫(yī)療機構(gòu)不愿意公開數(shù)據(jù),而某些可進行數(shù)據(jù)處理的部門沒有數(shù)據(jù)。

      (5)異構(gòu)性(多樣性)。由異構(gòu)問題導(dǎo)致了數(shù)據(jù)的多樣。主要包括數(shù)據(jù)源的異構(gòu)、管理系統(tǒng)的異構(gòu)及所采用標(biāo)準的異構(gòu)。綜合健康服務(wù)平臺數(shù)據(jù)來源廣泛,包括醫(yī)院、獨立體檢機構(gòu)、社區(qū)衛(wèi)生服務(wù)機構(gòu)、區(qū)域醫(yī)療信息平臺、第三方檢測機構(gòu)、新農(nóng)合、醫(yī)保社保、個人用戶和網(wǎng)絡(luò)等,且主要產(chǎn)生自制藥企業(yè)/生命科學(xué),臨床醫(yī)療/實驗室數(shù)據(jù),費用報銷/利用率,健康管理/社交網(wǎng)絡(luò)中;平臺數(shù)據(jù)內(nèi)容多樣,包括病史、體格檢查、理化檢查、居民基本健康檔案、各類個人信息和網(wǎng)頁等,涉及到的數(shù)據(jù)源的類型多樣,有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);管理系統(tǒng)的異構(gòu)既有管理系統(tǒng)所運行的操作系統(tǒng)、采取的數(shù)據(jù)庫的不同,還有不同的管理系統(tǒng)采用不同技術(shù)實現(xiàn)的異構(gòu);所采用的標(biāo)準目前主要有CDA,HL7,DCOM接口等。

      (6)封閉性。由各獨立的自治系統(tǒng)導(dǎo)致了信息孤島,進而所產(chǎn)生出的數(shù)據(jù)只適合在該系統(tǒng)內(nèi)部,每個不同的醫(yī)療機構(gòu)都自成一個體系,是一個獨立運行的實體,導(dǎo)致數(shù)據(jù)無法共享。今后的工作需要制定統(tǒng)一的數(shù)據(jù)表示方式或是采用某種統(tǒng)一的方法對其進行封裝,才能實現(xiàn)統(tǒng)一的處理,最終實現(xiàn)全國范圍內(nèi)系統(tǒng)之間的互聯(lián)互通。所有這些特性使得醫(yī)療大數(shù)據(jù)工作者在具體實踐中面臨巨大的挑戰(zhàn)。

      2 構(gòu)建醫(yī)療大數(shù)據(jù)平臺相關(guān)問題分析

      2.1 醫(yī)療大數(shù)據(jù)平臺架構(gòu)的技術(shù)及其關(guān)鍵問題

      未來將建立一個“以人為中心”的綜合健康服務(wù)生態(tài)系統(tǒng),系統(tǒng)與區(qū)域醫(yī)療信息平臺、醫(yī)療保險機構(gòu)、體檢中心、第三方檢驗/影像、主動醫(yī)療服務(wù)以及醫(yī)保新農(nóng)合等已有醫(yī)療服務(wù)資源進行規(guī)范化、標(biāo)準化地整合與協(xié)同。其技術(shù)支撐層中完成對大數(shù)據(jù)的集成、存儲、處理等功能,該層對大數(shù)據(jù)的處理選用開源的分布式計算平臺,目前醫(yī)療健康大數(shù)據(jù)平臺一般基于Hadoop框架來構(gòu)建。該平臺的技術(shù)體系理論上能夠處理醫(yī)療綜合健康服務(wù)生態(tài)系統(tǒng)中各種類型的數(shù)據(jù)存儲和海量信息處理。而Hadoop能夠為用戶提供系統(tǒng)底層細節(jié)透明的分布式基礎(chǔ)架構(gòu),并且以可靠、高效、可伸縮的方式處理海量數(shù)據(jù)的分布式軟件架構(gòu),采用該技術(shù)必將節(jié)省平臺整合的時間和金錢上的效率。

      現(xiàn)有Hadoop與行業(yè)應(yīng)用還存在一定差距。對于醫(yī)療應(yīng)用而言主要是兩個方面:其一缺乏面向醫(yī)療領(lǐng)域的分析和挖掘算法庫、模型庫;其二缺乏醫(yī)療知識庫支撐。在臨床決策支持等基于醫(yī)療健康大數(shù)據(jù)的應(yīng)用中,需要基于對醫(yī)生輸入數(shù)據(jù)內(nèi)容的理解,才能做出必要的決策支持。對于數(shù)據(jù)內(nèi)容的語義處理,必須基于醫(yī)療健康知識庫[3]。

      醫(yī)療大數(shù)據(jù)平臺需解決的關(guān)鍵技術(shù):醫(yī)療健康語義知識庫構(gòu)建、非結(jié)構(gòu)化數(shù)據(jù)的語義處理及傳統(tǒng)分析和挖掘技術(shù)的并行化。

      2.2 醫(yī)療大數(shù)據(jù)平臺構(gòu)建的兼容性及其技術(shù)路線問題

      醫(yī)療大數(shù)據(jù)平臺的構(gòu)建需要考慮如何利用現(xiàn)有數(shù)據(jù)及需要收集哪些數(shù)據(jù)[4-5]。同時要考慮原有的關(guān)系型數(shù)據(jù)和Hadoop [6]中非關(guān)系型數(shù)據(jù)的存儲,還有兼容業(yè)務(wù)數(shù)據(jù)和外部數(shù)據(jù)。

      在技術(shù)路線上,首先研究醫(yī)療大數(shù)據(jù)應(yīng)用需求;其次研究面向醫(yī)療的大數(shù)據(jù)整合與融合技術(shù)、數(shù)據(jù)語義化處理技術(shù)和大數(shù)據(jù)分析和挖掘并行化處理技術(shù)等關(guān)鍵技術(shù);以醫(yī)療健康業(yè)務(wù)數(shù)據(jù)為核心,融合互聯(lián)網(wǎng)數(shù)據(jù)、政府相關(guān)行業(yè)數(shù)據(jù)、第三方健康數(shù)據(jù)(PHR)、個體基因數(shù)據(jù)以及生物樣本數(shù)據(jù),完成醫(yī)療大數(shù)據(jù)中心建設(shè);在此基礎(chǔ)上,構(gòu)建醫(yī)療大數(shù)據(jù)平臺,開展醫(yī)療研究分析,實現(xiàn)基于大數(shù)據(jù)的健康服務(wù)應(yīng)用。

      如此龐大的系統(tǒng)工程中,可采取先以某個業(yè)務(wù)為試點突破(如醫(yī)院),逐步完善方法,并以面向醫(yī)療健康領(lǐng)域的分析和挖掘算法庫、模型庫和缺乏醫(yī)療健康知識庫支撐作為技術(shù)突破口。

      3 醫(yī)療大數(shù)據(jù)的數(shù)據(jù)集成問題分析

      3.1 醫(yī)療大數(shù)據(jù)集成需考慮的問題

      醫(yī)療大數(shù)據(jù)平臺構(gòu)建問題中的技術(shù)難點之一是首先要實現(xiàn)醫(yī)療大數(shù)據(jù)系統(tǒng)集成[7-8]問題,筆者認為主要有以下幾個方面的問題。

      (1)醫(yī)療大數(shù)據(jù)系統(tǒng)集成的范圍問題。系統(tǒng)的集成首要解決所覆蓋的范圍,是以醫(yī)院為單位、以城市為中心的區(qū)域醫(yī)療[9]還是全國范圍內(nèi)的醫(yī)療衛(wèi)生領(lǐng)域[10]的集成,這個問題決定了分布式計算中的問題規(guī)模、需要采取的技術(shù)及標(biāo)準化的建設(shè)問題,同時也決定了未來我國衛(wèi)生信息化建設(shè)的水平。根據(jù)國務(wù)院“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見,未來在“十三五”期間鼓勵健康服務(wù)機構(gòu)利用云計算、大數(shù)據(jù)等技術(shù)搭建公共信息平臺,提供長期跟蹤、預(yù)測預(yù)警的個性化健康管理服務(wù)的目標(biāo),構(gòu)建的醫(yī)療大數(shù)據(jù)系統(tǒng)集成應(yīng)是著眼于全國范圍的醫(yī)療衛(wèi)生領(lǐng)域,這就區(qū)別于以往單純的全院級的系統(tǒng)集成和區(qū)域性的集成。

      (2)醫(yī)療大數(shù)據(jù)系統(tǒng)集成的架構(gòu)設(shè)計問題。系統(tǒng)的架構(gòu)應(yīng)充分利用原有的基礎(chǔ)設(shè)施,通過建立虛擬的集成系統(tǒng),采取標(biāo)準化和可實現(xiàn)互操作的技術(shù)來完成大范圍內(nèi)的信息交換和共享。

      (3)醫(yī)療大數(shù)據(jù)的系統(tǒng)集成問題實質(zhì)上是一個在原有的醫(yī)療衛(wèi)生行業(yè)信息化基礎(chǔ)設(shè)施上搭建的一個大規(guī)模的分布式計算平臺。該分布式平臺的計算模式針對不同的醫(yī)療業(yè)務(wù)部門和機構(gòu)所采用的計算模式也不盡相同,應(yīng)包括解決醫(yī)療大規(guī)模數(shù)據(jù)的批量處理能力,也是我們?nèi)粘?shù)據(jù)分析工作中常見的一類數(shù)據(jù)處理需求[11];具備處理在時間分布和數(shù)量上無限的一系列動態(tài)數(shù)據(jù)集合體,即流數(shù)據(jù),該類數(shù)據(jù)必須采用實時計算的方式給出秒級響應(yīng);此外,還應(yīng)具有針對公共衛(wèi)生領(lǐng)域的傳染病途徑的處理之類的圖計算模式。該分布式計算平臺中應(yīng)能夠海量數(shù)據(jù)的高效存儲問題,如采用HDFS,Hbase,NewSQL,云數(shù)據(jù)庫等技術(shù)。

      3.2 數(shù)據(jù)集成的難點

      數(shù)據(jù)集成的難點可歸納為異構(gòu)性、分布性和自治性。現(xiàn)有構(gòu)建數(shù)據(jù)集成系統(tǒng)的方法有多層體系結(jié)構(gòu)和基于其中間層的實現(xiàn)方法。數(shù)據(jù)集成系統(tǒng)可劃分為兩類,即物化(Materialized)集成系統(tǒng)和虛擬(Virtual)集成系統(tǒng)。不斷提高數(shù)據(jù)集成系統(tǒng)的性能、可伸縮性、靈活性和適應(yīng)性,將是數(shù)據(jù)集成系統(tǒng)健壯發(fā)展的總趨勢。而融入了數(shù)據(jù)倉庫技術(shù)、移動 Agent技術(shù)、XML 技術(shù)、語義 Web 技術(shù)和 AI 技術(shù)的虛擬數(shù)據(jù)集成方案,將重新煥發(fā)生命力,并向具有分布式體系結(jié)構(gòu)、形式語義的智能知識型軟件方向發(fā)展。

      3.3 數(shù)據(jù)集成

      目前已有的幾種典型數(shù)據(jù)集成方法有模式集成方法、數(shù)據(jù)復(fù)制方法及在這兩種方法基礎(chǔ)上的綜合方法[12]。數(shù)據(jù)集成的數(shù)據(jù)源異構(gòu)性問題,是數(shù)據(jù)集成問題的難點,異構(gòu)性的難點主要表現(xiàn)在語法異構(gòu)和語義異構(gòu)上。

      為構(gòu)建具有全國范圍內(nèi)的大數(shù)據(jù)醫(yī)療系統(tǒng),需采用該兩種方法基礎(chǔ)上的綜合方法,想辦法采用“云計算”中的虛擬化方法,提高基于中間件系統(tǒng)的性能,同時能夠?qū)?shù)據(jù)源間常用的數(shù)據(jù)進行復(fù)制。

      4 結(jié) 語

      醫(yī)療大數(shù)據(jù)平臺的建設(shè)事關(guān)國計民生,需要醫(yī)療衛(wèi)生機構(gòu)、政府、科研人員通力合作,針對醫(yī)療行業(yè)的特點解決標(biāo)準、數(shù)據(jù)來源、數(shù)據(jù)處理的關(guān)鍵技術(shù)問題,才能真正發(fā)揮醫(yī)療健康大數(shù)據(jù)的價值。

      參考文獻

      [1] JAVIER A P. Big data for health. IEEE Journal of biomedical and health informatics,2015,19(4):1193-1194.

      [2]俞國培,包小源,黃新霆,等.醫(yī)療健康大數(shù)據(jù)的種類、性質(zhì)及有關(guān)問題[J].醫(yī)學(xué)信息學(xué)雜志,2014,35(6):10-12.

      [3]馮東雷.醫(yī)療健康大數(shù)據(jù)技術(shù)路線和方法論初探[J].中國信息

      界,2014(6):44-45.

      [4] MEZGHANI E,EXPOSITO E,DRIRA K,et al. A semantic big data platform for integrating heterogeneous wearable data in healthcare[J]. Med syst,2015,39(2):182-183.

      [5] SANGWHAN C,ASHRAF A,SYED S A. Towards a ‘Big health data analytics platform[C]. Washington,DC,USA:IEEE computer society,2015. 233-234.

      [6] SARA D R,VICTORIA L,JOS? M B,et al. A mapreduce approach to address big data classification problems based on the fusion of linguistic fuzzy rules[J]. International journal of computational intelligence systems,2015,8(3):422-437.

      [7] SRIVIDYA K,BANSAL,SEBASTIAN K. Integrating big data:A semantic extract-transform-load framework[J]. Computer,2015,48(3):44-45.

      [8] XIN L D,DIVESH S. Big data integration[J]. Synthesis lectures on data management,2015,6(11):198-199.

      [9] DASWIN D S,F(xiàn)RADA B,HERBERT F J,et al. Addressing the complexities of big data analytics in healthcare:The diabetes screening case[J]. Australasian journal of information systems,2015,19:102-104.

      [10] CHRIS A. Translational research 2.0:a framework for accelerating collaborative discovery[J]. Personalized medicine,2014,11(3):351-353.

      [11] LAURENT S,MARC V B. Structured data fusion[J]. IEEE Journal of selected topics in signal processing,2015,9(4):586-600.

      [12]陳躍國,王京春. 數(shù)據(jù)集成綜述[J].計算機科學(xué),2004,31(5):48-50.

      猜你喜歡
      數(shù)據(jù)集成大數(shù)據(jù)平臺分布式計算
      基于大數(shù)據(jù)的智能停車場管理系統(tǒng)設(shè)計
      淺談電力大數(shù)據(jù)平臺關(guān)鍵技術(shù)研究與應(yīng)用
      基于云計算的移動學(xué)習(xí)平臺設(shè)計與實現(xiàn)
      基于大數(shù)據(jù)分析的智慧倉儲運營支撐平臺設(shè)計
      云計算中MapReduce分布式并行處理框架的研究與搭建
      襪業(yè)行業(yè)大數(shù)據(jù)平臺的應(yīng)用研究
      成本與制造數(shù)據(jù)集成分析
      基于Biztalk的異構(gòu)醫(yī)療信息系統(tǒng)數(shù)據(jù)集成研究
      面向異構(gòu)分布式計算環(huán)境的并行任務(wù)調(diào)度優(yōu)化方法
      信息系統(tǒng)集成與數(shù)據(jù)集成策略研究
      太和县| 会泽县| 额尔古纳市| 孝感市| 惠州市| 达孜县| 漳浦县| 攀枝花市| 安新县| 蒙山县| 五台县| 河西区| 常德市| 会同县| 上林县| 禄丰县| 博湖县| 磐石市| 宣城市| 民县| 亳州市| 分宜县| 龙岩市| 景德镇市| 黄冈市| 辽阳县| 高邑县| 武强县| 晋城| 北京市| 台中市| 武定县| 增城市| 曲周县| 黄大仙区| 万载县| 淮南市| 新民市| 和静县| 迁安市| 滨海县|