安明揚(yáng) 趙增仁 譚友文 潘習(xí)龍 王培玉 安 鵬
(北京大學(xué)公共衛(wèi)生學(xué)院社會(huì)醫(yī)學(xué)與健康教育系 北京 100191) (河北醫(yī)科大學(xué)第一醫(yī)院石家莊 050030) (江西省人民醫(yī)院 南昌 330006)(北京大學(xué)公共衛(wèi)生學(xué)院社會(huì)醫(yī)學(xué)與健康教育系北京 100191) (北京京東叁佰陸拾度電子商務(wù)有限公司北京 100176)
呼吸道傳染性疾病的產(chǎn)生、傳播、影響與防范等環(huán)節(jié)都具有很強(qiáng)的社會(huì)學(xué)特性。在傳染性疾病管理過程中,常常在病例出現(xiàn)之后相關(guān)部門才通過傳染病申報(bào)系統(tǒng)逐級(jí)上報(bào),很難做到防患于未然。在人工智能[1-2]、大數(shù)據(jù)[3]和云計(jì)算[4]等互聯(lián)網(wǎng)技術(shù)飛速發(fā)展的背景下,管理部門可以改變高投入、低效率、遲響應(yīng)的傳染性疾病管理現(xiàn)狀。為了消除或緩解呼吸道傳染性疾病給人民健康、生命財(cái)產(chǎn)、國(guó)家經(jīng)濟(jì)帶來的巨大損失,可以運(yùn)用大數(shù)據(jù)與人工智能技術(shù),根據(jù)氣候、環(huán)境、病原學(xué)、人群等要素提前做出預(yù)警;當(dāng)病例出現(xiàn)后,根據(jù)患者體征、傳播速度、傳播途徑、影響范圍等要素,即刻啟動(dòng)相應(yīng)防控級(jí)別,將損失控制在最小范圍。因此本項(xiàng)研究具有重要現(xiàn)實(shí)意義。
人工智能(Artificial Intelligence,AI)技術(shù)是指深入研究、發(fā)展并用于模擬、擴(kuò)充和拓展人的智慧的理論、方式、技能和運(yùn)用體系的一種新興技術(shù)。隨著“人工智能+X”上升為國(guó)家戰(zhàn)略,我國(guó)開始全力推進(jìn)人工智能在各個(gè)領(lǐng)域的創(chuàng)新融合。人工智能技術(shù)在健康保健、精準(zhǔn)醫(yī)療、患者治療、新藥開發(fā)等領(lǐng)域發(fā)揮著顯著作用。1999年1月研制的“達(dá)芬奇”智能機(jī)器人手術(shù)系統(tǒng),是世界上第1套真正在手術(shù)室中應(yīng)用的人工智能機(jī)器人手術(shù)控制系統(tǒng)。在微創(chuàng)、無(wú)創(chuàng)手術(shù)治療領(lǐng)域獲得巨大成功,在某種程度上代表著世界范圍內(nèi)智能醫(yī)療手術(shù)機(jī)器人的最高水平。國(guó)內(nèi)研究者將人工智能技術(shù)運(yùn)用到傳染性疾病監(jiān)控領(lǐng)域,取得了一些理論和實(shí)踐方面的成果[5-6]。
云計(jì)算作為計(jì)算機(jī)領(lǐng)域的一種新興科技,受到商業(yè)界和學(xué)術(shù)界的關(guān)注。2008年谷歌集團(tuán)通過云計(jì)算平臺(tái)發(fā)布谷歌健康(Google Health)服務(wù),其目的是將海量醫(yī)療數(shù)據(jù)存儲(chǔ)于云端,通過云服務(wù)供患者查看。微軟公司也研發(fā)過類似的健康管理服務(wù)(HealthVault)。在醫(yī)療大數(shù)據(jù)應(yīng)用領(lǐng)域,許多研發(fā)機(jī)構(gòu)和人員已經(jīng)開始利用Hadoop大數(shù)據(jù)框架開展醫(yī)療服務(wù)與醫(yī)療臨床項(xiàng)目管理研發(fā)工作[7-8]。Taylor R C[9]詳盡闡述Hadoop在生物信息學(xué)中的廣泛應(yīng)用,Schatz M C[10]研發(fā)一款名為CloudBurst的開源軟件包,為生物醫(yī)學(xué)信息分析提出一種采用Hadoop MapReduce技術(shù)的并行算法。
國(guó)內(nèi)學(xué)者對(duì)醫(yī)療大數(shù)據(jù)的學(xué)術(shù)研究與應(yīng)用探討也非常廣泛。中國(guó)工程院院士鄔賀銓[11]在2012年中國(guó)科技論壇上提岀,智慧醫(yī)療應(yīng)該是大數(shù)據(jù)應(yīng)用研究的前沿領(lǐng)域,重點(diǎn)應(yīng)用領(lǐng)域?yàn)榕R床決策支持、藥品分析、誤診分析等多個(gè)方面。姚志洪[12]提出醫(yī)療信息化發(fā)展的10大重點(diǎn),包括電子健康檔案標(biāo)準(zhǔn)化、大數(shù)據(jù)與NoSQL、健康物聯(lián)網(wǎng)、健康云和個(gè)性化醫(yī)療等方面。周光華、辛英和張雅潔等[13]在綜合論述我國(guó)醫(yī)療數(shù)據(jù)資源現(xiàn)狀的基礎(chǔ)上,詳細(xì)分析大數(shù)據(jù)在醫(yī)藥研發(fā)、公共衛(wèi)生、疾病管理和健康管理4個(gè)方面的應(yīng)用。陳鶴群[14]提出醫(yī)療大數(shù)據(jù)面臨的兩大挑戰(zhàn):一方面患者隱私數(shù)據(jù)保護(hù)應(yīng)細(xì)化到標(biāo)識(shí)隱私匿名保護(hù)、位置隱私保護(hù)、關(guān)系匿名保護(hù)等方面; 另一方面應(yīng)促進(jìn)醫(yī)療數(shù)據(jù)標(biāo)準(zhǔn)化,做好醫(yī)療大數(shù)據(jù)共享和開放。張振、周毅和杜守洪等[15]論述醫(yī)療大數(shù)據(jù)帶給醫(yī)藥研究、智慧醫(yī)療和商業(yè)智能的發(fā)展機(jī)遇,提出醫(yī)療大數(shù)據(jù)實(shí)施過程中面臨信息孤島、醫(yī)療數(shù)據(jù)標(biāo)準(zhǔn)化和醫(yī)務(wù)人員信息意識(shí)缺乏等難題,同時(shí)在技術(shù)應(yīng)用上存在數(shù)據(jù)集成、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)檢索和數(shù)據(jù)分析利用等方面的挑戰(zhàn)。
基于大數(shù)據(jù)和人工智能算法,預(yù)計(jì)部署22個(gè)模塊及3萬(wàn)個(gè)感染類疾病監(jiān)控預(yù)警節(jié)點(diǎn),實(shí)現(xiàn)全過程實(shí)時(shí)閉環(huán)監(jiān)控,結(jié)合大數(shù)據(jù)與人工智能技術(shù)對(duì)傳染性疾病的計(jì)算,構(gòu)建事前異常狀態(tài)預(yù)警體系。融合信息技術(shù)、臨床醫(yī)學(xué)與重大公共衛(wèi)生事件相關(guān)知識(shí),實(shí)現(xiàn)云部署、跨平臺(tái)、多醫(yī)院、多區(qū)域的數(shù)據(jù)同步,達(dá)到系統(tǒng)云端一體化、線上線下一體化,建立標(biāo)準(zhǔn)化、智能化、云服務(wù)化的呼吸道傳染性疾病防范與管理體系。
3.2.1 建立質(zhì)控云平臺(tái) 根據(jù)呼吸道傳染病SAFECARE體系設(shè)置,結(jié)醫(yī)院個(gè)性化管理需求,以敏感事件、敏感癥狀及敏感體征為切入點(diǎn)定義相關(guān)數(shù)據(jù)源,觸發(fā)數(shù)據(jù)采集監(jiān)聽模塊,形成符合傳染性疾病特點(diǎn)的質(zhì)控云平臺(tái)。實(shí)時(shí)監(jiān)測(cè)所有影響傳染性疾病事件的重要節(jié)點(diǎn)與重要過程,記錄所有事件從啟動(dòng)到終止的全過程,保存可跟蹤的歷史數(shù)據(jù),做到有據(jù)可查。AI在控制各個(gè)環(huán)節(jié)時(shí)并非按照一個(gè)質(zhì)量控制點(diǎn)進(jìn)行管控而是按照功能模塊,各個(gè)模塊均可對(duì)應(yīng)多個(gè)質(zhì)量監(jiān)控點(diǎn)。
3.2.2 建立事前提醒和預(yù)警、事中監(jiān)護(hù)、事后評(píng)價(jià)管理體系 除已實(shí)現(xiàn)的質(zhì)控預(yù)警平臺(tái)以及部分監(jiān)控點(diǎn)之外,還計(jì)劃開發(fā)危急值立體閉環(huán)監(jiān)控、發(fā)熱門診管控、傳染病管理、重大公共衛(wèi)生事件地區(qū)化管控等模型。這套體系將有助于地區(qū)疾病預(yù)防控制中心、綜合性醫(yī)療機(jī)構(gòu)、門診急診醫(yī)生和臨床醫(yī)務(wù)人員全面掌握對(duì)呼吸道等感染性疾病的篩查,在管理工作中把握主動(dòng)權(quán),將傳統(tǒng)事后申報(bào)轉(zhuǎn)為建立事前提醒和預(yù)警、事中監(jiān)護(hù)、事后評(píng)價(jià)的管理體系。
3.3.1 建立標(biāo)準(zhǔn)化、智能化、云服務(wù)的傳染性疾病預(yù)警、防控與管理系統(tǒng) 從業(yè)務(wù)層面梳理,按行為活動(dòng)劃分,融合了豐富完備的臨床知識(shí)庫(kù)、質(zhì)控系統(tǒng)、管理監(jiān)控、輔助策略等。醫(yī)院管理系統(tǒng)將整體拆分成對(duì)接層、大數(shù)據(jù)管理層、決策層、多功能中臺(tái)業(yè)務(wù)層、應(yīng)用層5個(gè)層面,實(shí)現(xiàn)醫(yī)療系統(tǒng)平臺(tái)即服務(wù)(Platform as a Service,PaaS),完成服務(wù)平臺(tái)化設(shè)計(jì),支持業(yè)務(wù)云端部署,支持多院區(qū)、多平臺(tái)、多機(jī)構(gòu)大數(shù)據(jù)同步、即時(shí)管控。實(shí)現(xiàn)系統(tǒng)云端一體化、線上線下一體化、臨床管理一體化,見圖1。
圖1 預(yù)警、醫(yī)療、管理運(yùn)作框架
3.3.2 數(shù)據(jù)對(duì)接及數(shù)據(jù)標(biāo)準(zhǔn)化 為解決多源異構(gòu)造成的診療數(shù)據(jù)分散、難以共享等問題,采用創(chuàng)建主數(shù)據(jù)管理(Master Data Management,MDM)中心、建立臨床數(shù)據(jù)中心(Clinical Data Repository,CDR)的方法,進(jìn)行數(shù)據(jù)治理、清洗和集成。采用大數(shù)據(jù)分析技術(shù)和人工輔助的形式,形成標(biāo)準(zhǔn)化、結(jié)構(gòu)化的醫(yī)院系統(tǒng)底層數(shù)據(jù)結(jié)構(gòu),通過CDR、運(yùn)營(yíng)數(shù)據(jù)中心(Operational Data Repository,ODR),支持中臺(tái)服務(wù)層的深度學(xué)習(xí)策略模型調(diào)用。中臺(tái)服務(wù)通過先拆分、抽離等方式拆分為單獨(dú)的支持點(diǎn),然后對(duì)不同業(yè)務(wù)場(chǎng)景梳理運(yùn)算、聚合成為中臺(tái)服務(wù)點(diǎn),以支持WAP、H5、APP等不同應(yīng)用層展示,支持不同場(chǎng)景獨(dú)立運(yùn)行。
3.3.3 遵循系統(tǒng)獨(dú)立性、數(shù)據(jù)低冗余和資源剝離的原則建立醫(yī)院監(jiān)控系統(tǒng) 運(yùn)用Hadoop體系架構(gòu)進(jìn)行分布式數(shù)據(jù)存儲(chǔ)、運(yùn)算,底層通過Hdfs搭建分布式存儲(chǔ);運(yùn)用MapReduce映射和化簡(jiǎn)編程模型提高數(shù)據(jù)處理效率,解決單機(jī)性能瓶頸限制。通過Hive建立數(shù)據(jù)倉(cāng)庫(kù)。策略層引入深度學(xué)習(xí)中TensorFlow框架自然語(yǔ)言處理算法,以及部分受限波爾茲曼機(jī)(Restricted Boltzmann Machine,RBN)算法,提供策略模型算法支持,通過Hue算法工具支持?jǐn)?shù)據(jù)可視化展示。使用“大數(shù)據(jù)+AI+知識(shí)圖譜+語(yǔ)言識(shí)別”等技術(shù)手段,使機(jī)器可以讀懂大量病例從而實(shí)現(xiàn)信息標(biāo)準(zhǔn)化,同時(shí)通過數(shù)據(jù)邏輯判斷,將更多信息自動(dòng)轉(zhuǎn)換為可分析、可計(jì)算、可利用的數(shù)據(jù),見圖2。
圖2 醫(yī)院監(jiān)控微服務(wù)架構(gòu)
3.3.4 實(shí)現(xiàn)消息系統(tǒng)與策略系統(tǒng)無(wú)縫對(duì)接以及管理結(jié)果快速提醒 服務(wù)于患者,構(gòu)建簡(jiǎn)潔、易用、方便的醫(yī)療監(jiān)測(cè)體系;服務(wù)于醫(yī)務(wù)人員,設(shè)置便于應(yīng)用、高效管理、少差錯(cuò)的信息平臺(tái)功能;服務(wù)于管理人員,提供信息監(jiān)控、工作流程管控、決策過程綜合分析的管理工具。從部分應(yīng)用到全部應(yīng)用,從信息分散到大數(shù)據(jù)融合,從事務(wù)處理到智能控制,提供完整、安全、可靠、實(shí)時(shí)的患者信息訪問和檔案管理系統(tǒng),進(jìn)一步優(yōu)化內(nèi)部工作流程,有效減少醫(yī)療差錯(cuò),見圖3。
圖3 實(shí)時(shí)消息系統(tǒng)架構(gòu)
本研究基于大數(shù)據(jù)和AI算法,預(yù)計(jì)部署22個(gè)模塊及3萬(wàn)個(gè)感染類疾病監(jiān)控預(yù)警節(jié)點(diǎn),實(shí)現(xiàn)全過程實(shí)時(shí)閉環(huán)監(jiān)控,結(jié)合大數(shù)據(jù)與人工智能技術(shù)對(duì)傳染性疾病進(jìn)行計(jì)算,構(gòu)建事前異常狀態(tài)預(yù)警體系。自2015年起課題組聯(lián)合國(guó)內(nèi)多所大中型公立醫(yī)院的臨床專家,按照我國(guó)醫(yī)院質(zhì)量監(jiān)督管理有關(guān)文件精神初步建立了醫(yī)療質(zhì)量監(jiān)控平臺(tái)。該平臺(tái)融合信息技術(shù)、臨床醫(yī)學(xué)與重大公共衛(wèi)生事件相關(guān)知識(shí),實(shí)現(xiàn)云部署、跨平臺(tái)、多醫(yī)院、多區(qū)域數(shù)據(jù)同步,達(dá)到系統(tǒng)云端一體化、線上線下一體化,實(shí)現(xiàn)標(biāo)準(zhǔn)化、智能化、云服務(wù)的呼吸道傳染性疾病防范與管理。該平臺(tái)有效打通醫(yī)院各信息系統(tǒng),實(shí)現(xiàn)各功能系統(tǒng)的數(shù)據(jù)整合與清洗并對(duì)收集到的數(shù)據(jù)進(jìn)行監(jiān)聽和預(yù)警。目前已在中南大學(xué)湘雅二院、廣東省第二人民醫(yī)院、山東棗莊市立醫(yī)院、山西省長(zhǎng)治人民醫(yī)院、鄭州市第六人民醫(yī)院5家醫(yī)院建立疫情應(yīng)急醫(yī)院合作研究基地。該系統(tǒng)監(jiān)控點(diǎn)更多側(cè)重于醫(yī)療質(zhì)量,在呼吸性傳染病的數(shù)據(jù)監(jiān)控精準(zhǔn)性、信息共享延時(shí)性等方面有待完善。為此課題組將聯(lián)合傳染病學(xué)專家與人工智能專家,從理論與實(shí)踐方面進(jìn)一步完善,提出傳染性疾病監(jiān)控點(diǎn)標(biāo)準(zhǔn)體系,部署傳染性疾病監(jiān)控關(guān)鍵節(jié)點(diǎn),優(yōu)化架構(gòu),研究人工智能深度學(xué)習(xí)功能,搭建更廣泛、智能化的傳染性疾病監(jiān)控系統(tǒng)。