李靜 單既楨
北京市衛(wèi)生健康委信息中心 北京 100034
隨著云計算、大數(shù)據(jù)、互聯(lián)網(wǎng)+、人工智能等技術的發(fā)展,人類社會已逐步邁入大數(shù)據(jù)時代。大數(shù)據(jù)將改變以往任何行業(yè)管理、分析、利用數(shù)據(jù)的方式,而醫(yī)療保健是大數(shù)據(jù)應用最有可能帶來革命性變革的領域之一。醫(yī)療健康大數(shù)據(jù)是國家重要的基礎性戰(zhàn)略資源[1],其在醫(yī)療、公共衛(wèi)生、慢病管理、領導決策、科研等方面有巨大的應用價值,對醫(yī)療健康的工作模式帶來了深刻的影響,為深化醫(yī)改、醫(yī)療服務提升、擴大醫(yī)療健康資源供給、滿足人民日益多元化的健康服務需求具有重要的意義。
醫(yī)療健康大數(shù)據(jù)數(shù)據(jù)集分類是醫(yī)療健康大數(shù)據(jù)資源整合、共享和利用的基礎,醫(yī)療健康大數(shù)據(jù)信息資源的類目分為新型數(shù)態(tài)、基礎信息、公共衛(wèi)生、計劃生育、醫(yī)療服務、醫(yī)療保障、藥品管理和綜合管理等 8 個類型。
醫(yī)療健康大數(shù)據(jù)分析主要涉及醫(yī)療健康大數(shù)據(jù)和大數(shù)據(jù)分析方法,即將先進的分析技術(大數(shù)據(jù)分析架構和大數(shù)據(jù)挖掘分析軟件)應用于醫(yī)療健康大數(shù)據(jù)集。數(shù)據(jù)分析是大數(shù)據(jù)價值鏈中的最終和最重要的階段,目的是提取有價值的信息,為決策者提供技術支撐。大數(shù)據(jù)分析主要關系兩個方面內容:大數(shù)據(jù)和分析技術,如何把二者有機地結合挖掘數(shù)據(jù)中潛在的價值加以運用服務于業(yè)務部門是智能研究的重要趨勢之一[2]。大數(shù)據(jù)分析方法包括預測分析、聚類分析、統(tǒng)計分析、因子分析、相關分析、回歸分析、A/B Testing(水桶測試)、數(shù)據(jù)挖掘算法等。大數(shù)據(jù)集可通過不同類型的分析工具(包括基于SQL 查詢、數(shù)據(jù)挖掘、統(tǒng)計分析、事實聚類、數(shù)據(jù)可視化、自然語言處理、文本分析、人工智能等)實現(xiàn)對大數(shù)據(jù)的分析發(fā)掘[3-4]。
(1)跨域就診分析。四川省通過動態(tài)流向圖、熱點圖等方式展示區(qū)域內各市、區(qū)或縣之間患者流向,以及分析特定疾病特定區(qū)域的患者流向情況,從而反映區(qū)域各地區(qū)醫(yī)療資源分配和疾病流行情況。通過分析患者就診區(qū)域分布特征,對不同區(qū)域患者進行畫像,挖掘不同區(qū)域患者就診特征。通過數(shù)據(jù)關聯(lián)分析和聚類分析,精準定位跨域跨級就診的集中病種和人群特征。
(2)影像數(shù)據(jù)分析。上海申康以其管轄的34家三級醫(yī)院的影像檢查數(shù)據(jù)為基礎,建立了區(qū)域醫(yī)療多病種的影像特征庫,從中抽取五項符合規(guī)則的病例進行樣本庫制定,后期醫(yī)生完成影像診斷報告書寫的同時將有價值的數(shù)據(jù)錄入對應疾病分類中。運用病種影像特征庫進行大數(shù)據(jù)量分析,用于常見疾病陽性診斷。
(3)數(shù)據(jù)質量分析。四川省對區(qū)域內居民病案首頁和新農(nóng)合數(shù)據(jù)利用大數(shù)據(jù)技術關聯(lián)分析,發(fā)現(xiàn)數(shù)據(jù)異常情況,如患者同一時間重復住院的問題,從而識別虛報業(yè)務量或騙保行為。
(1)區(qū)域健康管理。從上文案例可推出,國內針對大數(shù)據(jù)的應用側重從疾病診療、醫(yī)療保險、疾病監(jiān)測分析等方面著手進行研究和分析,但隨著大健康理念的不斷深入,醫(yī)療模式正在由有病治病向無病保健方向發(fā)展,形成由單一的藥物治療轉為藥物治療與非藥物治療相結合、被動治療轉為被動治療與主動預防保健相結合,最終形成以預防為主的健康管理模式。如何通過大數(shù)據(jù)技術實現(xiàn)個體或區(qū)域群體全生命周期健康狀況的監(jiān)測、分析和評估[5],例如對引起疾病的諸如遺傳、飲食起居習慣、外界環(huán)境等因素進行分析及預測,從而改善存在問題形成健康閉環(huán)管理,達到疾病預防和控制的目的。
研究區(qū)域內亞健康與疾病間的相互關系,分析各種體征參數(shù)與理化指標在亞健康辨識中的作用及權重;應用聚類分析、關聯(lián)分析、時間序列、回歸分析等手段研究亞健康指標之間的關聯(lián)性;通過對亞健康人群的數(shù)據(jù)進行挖掘,分析導致疾病的影響因素,建立評估和預測模型,預測疾病發(fā)生危險度[5]。
(2)建立區(qū)域身體健康評估標準。通過大數(shù)據(jù)技術實現(xiàn)區(qū)域健康評估標準,為居民制定有個體針對性的預防、診治和預后規(guī)范;同時,關注精神心理健康,運用大數(shù)據(jù)技術對居民進行精神防護相關的數(shù)據(jù)采集、分析。
(3)區(qū)域慢性非傳染病分析。運用大數(shù)據(jù)、數(shù)據(jù)挖掘技術對區(qū)域內居民的高血壓、糖尿病、心血管疾病等慢性非傳染性疾病的個案數(shù)據(jù)進行匯總、分析,形成區(qū)域熱力圖和趨勢分析圖,并結合個體的地域特點、人文環(huán)境、遺傳因素及飲食習慣等因素評分統(tǒng)計,對發(fā)病規(guī)律、病因進行挖掘,在此基礎上,建立慢病預測模型,引導預防慢性病的發(fā)生。
(4)區(qū)域傳染病分析。運用大數(shù)據(jù)分析、挖掘技術對常見的傳染性疾病,如結核病、艾滋病、流感等個案數(shù)據(jù)開展大數(shù)據(jù)匯總、分析,生成區(qū)域分布圖,動態(tài)感知傳染趨勢,協(xié)助區(qū)域公共衛(wèi)生管理部門阻斷傳染源。
隨著醫(yī)療健康領域需求的不斷轉變,健康管理理念正在日益滲透,醫(yī)療健康大數(shù)據(jù)的分析和挖掘技術具有巨大的應用前景??v觀國內醫(yī)療健康大數(shù)據(jù)分析業(yè)務發(fā)展歷程,目前主要面臨著數(shù)據(jù)標準難以統(tǒng)一、數(shù)據(jù)整合及共享困難、大數(shù)據(jù)技術手段缺乏、數(shù)據(jù)安全防護不足和數(shù)據(jù)挖掘分析人才匱乏等方面的問題。
(1)數(shù)據(jù)整合及共享難度大。醫(yī)療健康相關信息系統(tǒng)建設時往往因購置渠道不一、接口設計復雜、沒有統(tǒng)一標準等歷史原因,形成眾多“信息孤島”,造成各系統(tǒng)的數(shù)據(jù)字典差異較大,影響了大數(shù)據(jù)在收集、傳輸、儲存、內部共享和使用中的一致性和準確性,對大數(shù)據(jù)的挖掘、分析帶來了難度。因此行業(yè)內應進一步推進建立統(tǒng)一規(guī)范的、可互聯(lián)互通的、可推廣應用的數(shù)據(jù)集和數(shù)據(jù)元,作為臨床診療、疾病管理和科學研究的基礎,從而更加有利于挖掘數(shù)據(jù)存在的價值。
同時,醫(yī)療、公共衛(wèi)生、疾控、婦幼等各業(yè)務條線數(shù)據(jù)分散存儲,基于帶寬和系統(tǒng)性能因素,大量業(yè)務數(shù)據(jù)的傳輸效率低下,對數(shù)據(jù)有效的整合共享帶來了瓶頸。
(2)大數(shù)據(jù)技術手段缺乏。隨著醫(yī)療健康與信息化技術的長期融合,產(chǎn)生了種類繁多、數(shù)量眾多的醫(yī)療健康數(shù)據(jù)。但醫(yī)療健康大數(shù)據(jù)挖掘和分析技術的引入和應用尚處在初級階段,究其原因在于大數(shù)據(jù)深度分析、挖掘技術還在理論研究中,在大數(shù)據(jù)的查詢、快速加載、處理、分析等方面與業(yè)務需求尚有差距。
(3)技術人員短缺。與大數(shù)據(jù)技術手段缺乏類似,我國大數(shù)據(jù)分析、挖掘技術起步較晚,研究和應用型人才欠缺,且國內高校沒有設立專門的大數(shù)據(jù)挖掘、分析專業(yè),且醫(yī)療健康和大數(shù)據(jù)分析、挖掘復合型人才更是鳳毛麟角,相關學者和科研人員大都在摸索國外的先進技術,因此,醫(yī)療健康大數(shù)據(jù)挖掘、分析人才的培養(yǎng)任重而道遠。
(4)數(shù)據(jù)安全和隱私保護薄弱。在健康醫(yī)療數(shù)據(jù)共享與開放的過程中,傳統(tǒng)的安全防護手段無法跟上數(shù)據(jù)量非線性增長的部分,數(shù)據(jù)安全防護會暴露眾多漏洞,容易造成網(wǎng)絡攻擊、數(shù)據(jù)泄露、病毒攻擊等一系列問題,信息安全將面臨更大的挑戰(zhàn)。另外,在對個人健康數(shù)據(jù)進行采集、存儲、使用和共享的過程中,個人健康數(shù)據(jù)會與一些網(wǎng)絡行為、社交信息整合在一起,這時常規(guī)隱私保護手段會顯得比較薄弱,容易造成隱私泄露,從而對個人的生活造成不良影響甚至帶來更加嚴重的危害。
為落實“健康強國”的政策號召,進一步維護區(qū)域內居民的健康權益,需加快建設區(qū)域醫(yī)療健康大數(shù)據(jù)中心,加強區(qū)域醫(yī)療健康數(shù)據(jù)資源管理,建立大數(shù)據(jù)應用體系,尤其需根據(jù)現(xiàn)有數(shù)據(jù)資源挖掘與健康管理和評估、疾病預防可改變每個居民就醫(yī)方式和健康維護的方式,從而提高區(qū)域整體健康水平,真正實現(xiàn)醫(yī)療健康大數(shù)據(jù)應用的最終目標。為盡快實現(xiàn)終極目標,提高大數(shù)據(jù)挖掘、分析技術的應用成效,作為區(qū)域醫(yī)療健康信息化工作者,下一步需致力于研究建設信息共享模式及標準規(guī)范、數(shù)據(jù)安全和隱私保護機制等課題,為區(qū)域醫(yī)療健康大數(shù)據(jù)的精準、深入應用夯實基礎。