• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    醫(yī)療數(shù)據(jù)治理綜述

    2021-06-11 10:55:08葉琳羅鐵清
    計(jì)算機(jī)時(shí)代 2021年5期
    關(guān)鍵詞:數(shù)據(jù)治理

    葉琳 羅鐵清

    摘? 要: 為提高臨床智能輔助決策系統(tǒng)輔助醫(yī)生決策的能力,從醫(yī)療數(shù)據(jù)治理方向入手,采用文獻(xiàn)檢索和網(wǎng)絡(luò)調(diào)查相結(jié)合的方法深入探析醫(yī)療數(shù)據(jù)的治理、研究動(dòng)態(tài)、相關(guān)技術(shù)及應(yīng)用等內(nèi)容。結(jié)合已有研究,從醫(yī)療數(shù)據(jù)治理的關(guān)鍵問(wèn)題出發(fā),重點(diǎn)闡述醫(yī)療數(shù)據(jù)治理技術(shù),包括數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)脫敏、數(shù)據(jù)清洗和數(shù)據(jù)結(jié)構(gòu)化的具體方法,及其在臨床智能輔助決策系統(tǒng)的數(shù)據(jù)治理方案中的應(yīng)用。

    關(guān)鍵詞: 數(shù)據(jù)治理; 數(shù)據(jù)標(biāo)準(zhǔn)化; 數(shù)據(jù)脫敏; 數(shù)據(jù)清洗; 數(shù)據(jù)結(jié)構(gòu)化

    中圖分類號(hào):R-05? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1006-8228(2021)05-10-03

    Overview of medical data governance

    Ye Lin, Luo Tieqing

    (School of Informatics, Hunan University of Chinese Medicine, Changsha, Hunan 410208, China)

    Abstract: In order to improve the ability of clinical intelligent decision-making system to assist doctors' decision-making, this paper analyzes the management, research trends, relevant technologies and applications of medical data with the method of combining literature retrieval and network investigation. Combined with the existing research, focusing on the key issues of medical data governance, the medical data governance technologies, including the specific methods of data standardization, data desensitization, data cleaning and data structuring, are described, as well as their application in the data governance scheme of clinical intelligent decision-making system.

    Key words: data governance; data standardization; data desensitization; data cleaning; data structuring

    0 引言

    醫(yī)療衛(wèi)生行業(yè)要想從信息化到智能化轉(zhuǎn)變,助力實(shí)現(xiàn)“健康中國(guó)2030”,其發(fā)展模式需從規(guī)模驅(qū)動(dòng)模式轉(zhuǎn)變?yōu)橐葬t(yī)療質(zhì)量和服務(wù)效率為核心的新模式,醫(yī)療數(shù)據(jù)是模式轉(zhuǎn)變的基礎(chǔ)性資源。當(dāng)前,醫(yī)生需要利用臨床智能輔助決策系統(tǒng)為患者進(jìn)行診斷和治療,該系統(tǒng)主要承擔(dān)數(shù)據(jù)采集與分析、臨床知識(shí)庫(kù)檢索、患者信息管理、輔助決策等服務(wù),這些工作都依靠大量醫(yī)療數(shù)據(jù)才能完成。如果醫(yī)療數(shù)據(jù)存在問(wèn)題且缺乏有效的治理方法,最終就會(huì)導(dǎo)致系統(tǒng)決策失誤。因此,醫(yī)療數(shù)據(jù)治理工作勢(shì)在必行。

    1 醫(yī)療數(shù)據(jù)治理概述

    借鑒文獻(xiàn)[1]中對(duì)數(shù)據(jù)治理本質(zhì)的闡述,我們可以理解醫(yī)療數(shù)據(jù)治理工作是在國(guó)家衛(wèi)生健康委員會(huì)的指導(dǎo)下,對(duì)醫(yī)院、體檢、互聯(lián)網(wǎng)健康等機(jī)構(gòu)中醫(yī)療數(shù)據(jù)收集、分析、應(yīng)用的過(guò)程進(jìn)行監(jiān)督和管理,通過(guò)不斷創(chuàng)新和完善治理技術(shù)來(lái)提高醫(yī)療數(shù)據(jù)質(zhì)量,為醫(yī)療行業(yè)創(chuàng)造更大的價(jià)值。

    2 醫(yī)療數(shù)據(jù)治理研究動(dòng)態(tài)

    通過(guò)檢索相關(guān)文獻(xiàn),跟蹤學(xué)術(shù)動(dòng)態(tài)可知,加拿大頒布的《個(gè)人健康信息保護(hù)法》[2]、美國(guó)發(fā)布的《大數(shù)據(jù)研究和發(fā)展計(jì)劃》[3]和《美國(guó)聯(lián)邦政府醫(yī)療信息化戰(zhàn)略規(guī)劃(2015-2020)》[4],推動(dòng)了國(guó)外醫(yī)療數(shù)據(jù)治理的發(fā)展。我國(guó)國(guó)家衛(wèi)生健康委員會(huì)發(fā)布《全國(guó)醫(yī)院信息化建設(shè)標(biāo)準(zhǔn)與規(guī)范(試行)》[5]指出,醫(yī)療信息化建設(shè)過(guò)程中要依據(jù)數(shù)據(jù)標(biāo)準(zhǔn)和相關(guān)技術(shù)規(guī)范。我國(guó)國(guó)務(wù)院印發(fā)的《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》[6]提出要提升健康醫(yī)療服務(wù)效率和質(zhì)量,擴(kuò)大資源供給、《“健康中國(guó)2030”規(guī)劃綱要》[7]和《關(guān)于促進(jìn)“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展的意見》[7]為醫(yī)療數(shù)據(jù)治理工作部署方案。

    綜上所述,“數(shù)據(jù)治理”理念已經(jīng)涉及醫(yī)療領(lǐng)域,國(guó)內(nèi)外目前還只是對(duì)其政策方面展開大量的研究,應(yīng)用方面如數(shù)據(jù)治理技術(shù)用于提高臨床智能輔助決策系統(tǒng)中數(shù)據(jù)質(zhì)量的研究少之又少,這便是我們接下來(lái)所要研究的重點(diǎn)。

    3 醫(yī)療數(shù)據(jù)治理的關(guān)鍵問(wèn)題與技術(shù)

    3.1 醫(yī)療數(shù)據(jù)標(biāo)準(zhǔn)化

    數(shù)據(jù)標(biāo)準(zhǔn)化是實(shí)現(xiàn)醫(yī)療行業(yè)智能化工作的前提條件。目前醫(yī)院內(nèi)部各信息平臺(tái)中數(shù)據(jù)的標(biāo)準(zhǔn)化程度較低,很大程度上會(huì)影響臨床智能輔助決策系統(tǒng)輔助醫(yī)生決策的能力。醫(yī)療數(shù)據(jù)標(biāo)準(zhǔn)化對(duì)象包括診斷名稱、手術(shù)名稱、藥品名稱、檢查名稱、檢驗(yàn)名稱等,這些醫(yī)療術(shù)語(yǔ)的表達(dá)應(yīng)參照一些規(guī)范標(biāo)準(zhǔn),如《電子病歷應(yīng)用管理規(guī)范(試行)》[8]、《GB/T 14396-2016疾病分類與代碼》[9]、《病歷書寫基本規(guī)范(2010年版)》[10]等。醫(yī)務(wù)人員只有按照上述規(guī)范標(biāo)準(zhǔn)來(lái)記錄數(shù)據(jù),臨床智能輔助決策系統(tǒng)才能獲得標(biāo)準(zhǔn)化程度較高的醫(yī)療數(shù)據(jù)。

    3.2 醫(yī)療數(shù)據(jù)脫敏

    醫(yī)療衛(wèi)生智能化建設(shè)高速發(fā)展的同時(shí)臨床智能輔助決策系統(tǒng)的安全隱患日益突出。從醫(yī)院內(nèi)部各信息平臺(tái)中獲取的大量文本數(shù)據(jù)可能涉及患者隱私信息,這些信息對(duì)醫(yī)藥公司、廣告、中介、保險(xiǎn)等行業(yè)具有商業(yè)價(jià)值,那么醫(yī)藥公司、廣告、中介、保險(xiǎn)從業(yè)人員可能收買臨床智能輔助決策系統(tǒng)的使用者、系統(tǒng)維護(hù)或開發(fā)人員獲取患者隱私數(shù)據(jù)。因此,臨床智能輔助決策系統(tǒng)需要利用數(shù)據(jù)脫敏技術(shù)對(duì)醫(yī)療數(shù)據(jù)進(jìn)行脫敏,使能夠接觸到數(shù)據(jù)的人員無(wú)法盜取數(shù)據(jù)進(jìn)行非法斂財(cái)。系統(tǒng)需要重點(diǎn)脫敏患者信息,包括患者姓名、身份證號(hào)、手機(jī)號(hào)碼、家庭地址等。王卓[11]等人將所有數(shù)據(jù)脫敏技術(shù)歸為靜態(tài)和動(dòng)態(tài)兩類。佟玲玲[12]等人提出K-匿名、L-多樣性、T-保密等不可恢復(fù)脫敏算法以及對(duì)稱加密、非對(duì)稱加密、保形加密等可恢復(fù)脫敏算法。吳克河[13]等人提出一種基于敏感數(shù)據(jù)度量的改良版數(shù)據(jù)脫敏技術(shù)。葉水勇[14]提出基于Flume和Sqoop數(shù)據(jù)采集方式的智能化脫敏技術(shù)同時(shí)與K-Anonymity、L-Diversity、T-Closeness等脫敏算法[15]復(fù)用來(lái)實(shí)現(xiàn)最優(yōu)化脫敏。

    文獻(xiàn)[12]中提出自動(dòng)化數(shù)據(jù)脫敏算法,其雖是目前主流脫敏技術(shù),但沒(méi)有對(duì)數(shù)據(jù)語(yǔ)義予以考慮,為了更好地保護(hù)復(fù)雜語(yǔ)義下高敏感度的敏感屬性值,可以借鑒文獻(xiàn)[13]提出對(duì)敏感屬性值進(jìn)行分類加權(quán)后,使用等價(jià)類分裂算法思想實(shí)現(xiàn)基于敏感信息度量的脫敏技術(shù)來(lái)解決此缺陷。文獻(xiàn)[14,15]闡述的機(jī)器學(xué)習(xí)技術(shù)與算法結(jié)合使用可以更好的實(shí)現(xiàn)系統(tǒng)自動(dòng)化脫敏。未來(lái),臨床智能輔助決策系統(tǒng)的開發(fā)可以借鑒這些算法實(shí)現(xiàn)數(shù)據(jù)自動(dòng)脫敏。

    3.3 醫(yī)療數(shù)據(jù)清洗

    醫(yī)療數(shù)據(jù)蘊(yùn)含巨大的價(jià)值,其在實(shí)際利用過(guò)程中有時(shí)卻很難體現(xiàn)出來(lái),究其原因是醫(yī)院各信息平臺(tái)內(nèi)部數(shù)據(jù)質(zhì)量不高,比如醫(yī)生數(shù)據(jù)輸入過(guò)程中會(huì)出現(xiàn)缺錄、同一數(shù)據(jù)在不同信息平臺(tái)中存在不同的表達(dá)形式、醫(yī)生在診療過(guò)程中采用復(fù)制粘貼的方式進(jìn)行不同維度的數(shù)據(jù)錄入等情況,那么平臺(tái)中就可能存在很多“臟”數(shù)據(jù)。這些“臟”數(shù)據(jù)在臨床智能輔助決策系統(tǒng)中利用率不高,此時(shí)數(shù)據(jù)清洗的工作就變得越發(fā)重要了??讱J[16]等人指出利用缺失值填充算法進(jìn)行挖掘來(lái)填補(bǔ)缺失值。林予松[17]等人提出壓縮方法減少無(wú)關(guān)數(shù)據(jù)、分詞和權(quán)值的字段匹配算法來(lái)刪除重復(fù)數(shù)據(jù),其中分詞和權(quán)值的字段匹配算法核心思想是將重心詞后移進(jìn)行清洗,不適用于重心詞前移的情況,因此該算法數(shù)據(jù)清洗準(zhǔn)確度較低需要改進(jìn)。

    臨床智能輔助決策系統(tǒng)可以參考上述方法對(duì)不完整、不相關(guān)、重復(fù)數(shù)據(jù)進(jìn)行清洗。系統(tǒng)可以采用特殊值或者算法模型進(jìn)行缺失值填補(bǔ),該方法是系統(tǒng)將從醫(yī)院各信息平臺(tái)中獲取的數(shù)據(jù)進(jìn)行建模展示出具有缺失值的屬性列,對(duì)于屬性列中數(shù)值數(shù)據(jù),使用者可以在系統(tǒng)中選擇均值、平均值、眾數(shù)等特殊值選項(xiàng)進(jìn)行自動(dòng)填補(bǔ),對(duì)于屬性列中非數(shù)值數(shù)據(jù)系統(tǒng)設(shè)置EM(Expectation-Maximization)或MI(Multiple Imputation)或KNN(K-NearestNeighbor)等算法[16]選項(xiàng)進(jìn)行建模實(shí)現(xiàn)自動(dòng)化填補(bǔ)。系統(tǒng)采用壓縮方法[17]將數(shù)據(jù)庫(kù)表中與研究結(jié)果無(wú)關(guān)的表、屬性、記錄刪除并保留能夠幫助醫(yī)生輔助決策的數(shù)據(jù)表,該方法很好的減少無(wú)關(guān)數(shù)據(jù)和降低數(shù)據(jù)復(fù)雜度。系統(tǒng)可以采用基于分詞和權(quán)值的字段匹配算法[17]計(jì)算兩個(gè)字段之間相似度來(lái)判斷是否為重復(fù)數(shù)據(jù),首先利用分詞器對(duì)兩個(gè)字段分別進(jìn)行分詞處理,將字符串變成分詞串并計(jì)算分詞相似度,其次分別按照重心詞前移規(guī)律匹配法和重心詞后移規(guī)律匹配法求權(quán)值相似度并將兩次計(jì)算的權(quán)值相似度加權(quán)平均,得出最終的權(quán)值相似度,最后觀察兩個(gè)字段的分詞相似度和權(quán)值相似度是否大于某一閾值來(lái)判斷是否是重復(fù)數(shù)據(jù)并將重復(fù)數(shù)據(jù)自動(dòng)刪除。

    3.4 醫(yī)療數(shù)據(jù)結(jié)構(gòu)化

    目前全國(guó)多家醫(yī)院使用支持全結(jié)構(gòu)化錄入的醫(yī)療數(shù)據(jù)采集系統(tǒng),但系統(tǒng)中仍然存在大量計(jì)算機(jī)無(wú)法識(shí)別的數(shù)據(jù)。這些數(shù)據(jù)中最典型代表是電子病歷中的文本數(shù)據(jù),其產(chǎn)生的主要原因是系統(tǒng)的模板限制了醫(yī)生的思維,醫(yī)生仍習(xí)慣采用自由文本或半結(jié)構(gòu)化錄入的方式來(lái)完成日常病歷書寫工作。因此需要利用結(jié)構(gòu)化技術(shù)將非結(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)化成計(jì)算機(jī)能夠識(shí)別的語(yǔ)言供決策系統(tǒng)使用,最終系統(tǒng)才能產(chǎn)出精準(zhǔn)的決策。

    文獻(xiàn)[18]中基于規(guī)則的模式匹配信息提取方法核心是利用正則表達(dá)式匹配提取結(jié)構(gòu)化數(shù)據(jù),此方法雖然簡(jiǎn)單易實(shí)現(xiàn),但前期字段配置依賴臨床經(jīng)驗(yàn)進(jìn)行歸納總結(jié)并且配置效果直接影響提取結(jié)果,因此該方法通用程度不高。文獻(xiàn)[20]中基于層疊條件隨機(jī)場(chǎng)模型方法的信息抽取技術(shù)雖然也能準(zhǔn)確、快速識(shí)別多種文本信息,但其面臨識(shí)別詞語(yǔ)的流程較為混亂導(dǎo)致識(shí)別率較低、復(fù)雜的醫(yī)學(xué)報(bào)告信息的識(shí)別率較低以及語(yǔ)法規(guī)則定義需要有豐富臨床診療經(jīng)驗(yàn)的醫(yī)生進(jìn)行指導(dǎo)等問(wèn)題,因此該方法也無(wú)法通用。文獻(xiàn)[19]中構(gòu)建的結(jié)構(gòu)化抽取模型在切口數(shù)量抽取上對(duì)醫(yī)療文本信息抽取有效,但該模型無(wú)法驗(yàn)證其應(yīng)用在其他類型數(shù)據(jù)抽取上對(duì)醫(yī)療文本信息抽取是否同樣有效,因此該方法是否通用還有待進(jìn)一步驗(yàn)證。

    由此可見,即使目前研究出許多文本數(shù)據(jù)結(jié)構(gòu)化方法,由于醫(yī)療文本信息的復(fù)雜性和高難度,現(xiàn)有的結(jié)構(gòu)化技術(shù)大多不夠成熟和有效,無(wú)法進(jìn)行廣泛的使用,未來(lái)需要研究出標(biāo)桿技術(shù)應(yīng)用到臨床智能輔助決策系統(tǒng)數(shù)據(jù)結(jié)構(gòu)化處理中去。

    4 結(jié)束語(yǔ)

    本文對(duì)醫(yī)療數(shù)據(jù)治理概述、研究動(dòng)態(tài)、關(guān)鍵問(wèn)題、相關(guān)技術(shù)及應(yīng)用做了詳細(xì)的介紹并對(duì)目前醫(yī)療數(shù)據(jù)治理技術(shù)提出了改進(jìn)意見。目前,市面上雖然已開發(fā)出一些輔助決策系統(tǒng),但由于醫(yī)療數(shù)據(jù)不完整、不正確、重復(fù)率較高等問(wèn)題,數(shù)據(jù)放入系統(tǒng)中常常導(dǎo)致結(jié)果與人工給出的診斷結(jié)果和治療方案出入較大,醫(yī)生使用系統(tǒng)給出的決策方案可能會(huì)造成很嚴(yán)重的醫(yī)療事故。因此,未來(lái)將標(biāo)準(zhǔn)化、脫敏、清洗和結(jié)構(gòu)化等數(shù)據(jù)治理技術(shù)應(yīng)用到臨床智能輔助決策系統(tǒng)的研究具有重要的意義。

    參考文獻(xiàn)(References):

    [1] 吳信東,董丙冰,堵新政等.數(shù)據(jù)治理技術(shù)[J].軟件學(xué)報(bào),2019.30(9):2830-2856

    [2] 郭珉江,代濤,萬(wàn)艷麗等.加拿大衛(wèi)生信息化建設(shè)經(jīng)驗(yàn)及啟示[J].中國(guó)數(shù)字醫(yī)學(xué),2015.10(7):15-19

    [3] 代濤.健康醫(yī)療大數(shù)據(jù)發(fā)展應(yīng)用的思考[J].醫(yī)學(xué)信息學(xué)雜志,2016.37(2):2-8

    [4] 于琦,景勝潔,邰楊芳等.我國(guó)健康醫(yī)療大數(shù)據(jù)政策文獻(xiàn)的多維分析[J].中國(guó)全科醫(yī)學(xué),2019.22(26):3209-3216

    [5] 明確醫(yī)院信息化建設(shè)內(nèi)容和建設(shè)要求[J].醫(yī)學(xué)信息學(xué)雜志,2018.39(4):94

    [6] 何毅,王曙光,劉文浩.健康醫(yī)療大數(shù)據(jù)的探索與實(shí)踐[J].中華骨與關(guān)節(jié)外科雜志,2017.10(6):482-487

    [7] 吳浩,劉新穎,張世紅等.“互聯(lián)網(wǎng)+社區(qū)衛(wèi)生健康管理服務(wù)”標(biāo)準(zhǔn)化建設(shè)指南(二期)[J].中國(guó)全科醫(yī)學(xué),2018.21(16).

    [8] 孫慧子,董曉明,張淑英等.《電子病歷應(yīng)用管理規(guī)范(試行)》對(duì)電子病歷法律效力影響[J].中國(guó)醫(yī)院管理,2018.38(4).

    [9] 謝雨杉,王利亞,李莘等.基于語(yǔ)義相似度的ICD-10編碼歸一化[J].中國(guó)病案,2018.19(9):18-21

    [10] 阮鶴瑞,劉曉明,金疆山等.病案首頁(yè)填寫缺陷分析及對(duì)策建議[J].中國(guó)病案,2015.16(2):20-24

    [11] 王卓,劉國(guó)偉,王巖等.數(shù)據(jù)脫敏技術(shù)發(fā)展現(xiàn)狀及趨勢(shì)研究[J].信息通信技術(shù)與政策,2020.4:18-22

    [12] 佟玲玲,李鵬霄,段東圣等.面向異構(gòu)大數(shù)據(jù)環(huán)境的數(shù)據(jù)脫敏模型[J].北京航空航天大學(xué)學(xué)報(bào),2020.12:1-12

    [13] 吳克河,朱海,李為等.基于敏感信息度量的t-保密脫敏技術(shù)改良[J].信息技術(shù),2019.43(11):5-9

    [14] 葉水勇.數(shù)據(jù)脫敏技術(shù)的探究與實(shí)現(xiàn)[J].電力信息與通信技術(shù),2019.17(4):23-27

    [15] 葉水勇.數(shù)據(jù)脫敏系統(tǒng)的研究與實(shí)現(xiàn)[J].電力信息與通信技術(shù),2019.17(6):31-36

    [16] 孔欽,葉長(zhǎng)青,孫赟.大數(shù)據(jù)下數(shù)據(jù)預(yù)處理方法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2018.28(5):1-4

    [17] 林予松,王培培,劉煒等.醫(yī)療體檢數(shù)據(jù)預(yù)處理方法研究[J].計(jì)算機(jī)應(yīng)用研究,2017.34(4):1089-1092

    [18] 吳歡,應(yīng)俊,王逸飛等.乳腺癌病理文本的結(jié)構(gòu)化信息提取[J].解放軍醫(yī)學(xué)院學(xué)報(bào),2020.41(7):746-751

    [19] 盧淑祺,竇志成,文繼榮.手術(shù)病例中結(jié)構(gòu)化數(shù)據(jù)抽取研究[J].計(jì)算機(jī)學(xué)報(bào),2019.42(12):2754-2768

    [20] 梁立榮,李長(zhǎng)偉,沈曄等.基于層疊條件隨機(jī)場(chǎng)模型的電子病歷文本信息抽取[J].計(jì)算機(jī)應(yīng)用與軟件,2019.36(10):47-54,112

    猜你喜歡
    數(shù)據(jù)治理
    云端數(shù)據(jù)治理定義解析
    營(yíng)配貫通臺(tái)區(qū)線損異常數(shù)據(jù)治理分析
    基于oracle12c+oda數(shù)據(jù)治理方案探討
    智慧城市建設(shè)項(xiàng)目風(fēng)險(xiǎn)挑戰(zhàn)與解決經(jīng)驗(yàn)
    基于本體的企業(yè)運(yùn)營(yíng)數(shù)據(jù)治理
    云端數(shù)據(jù)治理初探
    運(yùn)用流程化手段提升資產(chǎn)管理水平
    大數(shù)據(jù)治理模型與治理成熟度評(píng)估研究
    大數(shù)據(jù)時(shí)代城市治理:數(shù)據(jù)異化與數(shù)據(jù)治理
    于田县| 抚松县| 南昌县| 胶州市| 潼关县| 南川市| 思南县| 任丘市| 太原市| 五原县| 太仆寺旗| 乐清市| 上高县| 奉贤区| 平陆县| 广西| 吐鲁番市| 城步| 曲松县| 保德县| 韩城市| 绥芬河市| 安溪县| 达尔| 新丰县| 庐江县| 金秀| 江山市| 交城县| 平塘县| 建宁县| 康平县| 乐至县| 宜丰县| 千阳县| 上高县| 南宁市| 望奎县| 唐河县| 锦州市| 河南省|