張萍 趙向梅 任志宏 李娜
(西安歐亞學院 陜西省西安市 710000)
2020年爆發(fā)的傳染性疾病不僅威脅全世界人類的生命健康,還造成全球經(jīng)濟萎縮。目前,我國各級政府出臺了各種監(jiān)控監(jiān)測措施以應(yīng)對傳染性疾病蔓延。監(jiān)控措施本應(yīng)與地理空間信息具有強相關(guān)性,即監(jiān)測手段措施應(yīng)具有明顯且充分的空間屬性和空間指向性,監(jiān)測預(yù)警信息的可視化在時間和空間維度上應(yīng)具有充分的信息易讀性,并能達到直觀的視覺沖擊,則后續(xù)各種調(diào)控手段才能有效發(fā)揮作用,有利于決策機構(gòu)制定合理的防控政策,衛(wèi)生系統(tǒng)支持人員才能更好地貫徹執(zhí)行防控措施,廣大民眾亦能更好地配合參與抗疫。
本文基于WebGIS 技術(shù),以傳染性疾病數(shù)據(jù)為例,將丁香醫(yī)生實時傳染性疾病地圖數(shù)據(jù)和國內(nèi)傳染性疾病數(shù)據(jù)進行整合,通過MyBatis(SSM)框架集獲取數(shù)據(jù)并解析到瀏覽器頁面,利用VUE 開源框架和JavaScript 語言,結(jié)合Echarts 圖表庫等可視化工具,搭建了全國傳染性疾病模擬模塊的傳染性疾病視化系統(tǒng)。為決策部門提供分布式的遙感影像、文字說明等多種信息,涵蓋地理空間數(shù)據(jù)特點的傳染性疾病數(shù)據(jù)分布,并進行地理空間分析、查詢,達到發(fā)布和預(yù)警的目標。
丁香醫(yī)生“實時傳染性疾病”的推出受到公眾的廣泛關(guān)注和轉(zhuǎn)發(fā),并一度成為公眾討論傳染性疾病的重要信息參考[1]。運用Python 爬蟲技術(shù)是當前一個有效獲取網(wǎng)絡(luò)數(shù)據(jù)的方法,網(wǎng)絡(luò)爬蟲主要是以模擬瀏覽器行為的方式實現(xiàn)目標網(wǎng)絡(luò)數(shù)據(jù)的獲取,爬蟲架構(gòu)的運行流程見圖1。將丁香醫(yī)生網(wǎng)站的 URL 確定下來后,接下來我們就要對網(wǎng)站中爬蟲內(nèi)容所處的位置進行分析。當前的目標信息包括傳染性疾病所在的地區(qū)、昨日本土新增、現(xiàn)存確診、風險地區(qū)和傳染性疾病詳情等。通過通用瀏覽器進入丁香醫(yī)生頁面,隨后對頁面的源代碼進行分析,就能將所需信息的CSS 代碼找出。本論文中我們模擬2021年1月1日到2021年8月1日期間數(shù)據(jù)為查找目標,結(jié)合瀏覽器給到的傳染性疾病信息,與 CSS 關(guān)鍵代碼相互對應(yīng)。使用Python 中requests 庫的requests.get(url)方法向指定網(wǎng)站服務(wù)器發(fā)送HTTP 請求,得到相應(yīng)的數(shù)據(jù)響應(yīng),并通過對返回的數(shù)據(jù)進行分析和解析,提取傳染性疾病的相關(guān)信息,建立傳染性疾病信息數(shù)據(jù)庫,最后結(jié)合GIS 衛(wèi)星影像圖形成具有時空信息特點的傳染性疾病時空數(shù)據(jù)庫[2]。
圖1:網(wǎng)絡(luò)爬蟲架構(gòu)運行流程圖
WebGIS 具有強大的空間數(shù)據(jù)處理能力,可以將各種空間信息資源整合在一起,為多時態(tài)、多存儲格式、多語義、非結(jié)構(gòu)化的數(shù)據(jù)提供不同維度的存儲和展現(xiàn)形式。WebGIS 空間分析和信息查詢能夠作為醫(yī)療信息資源有效集成的模式,通過對疾病感染人員的地理位置分布、交通、人文等因素,從而建立基于空間地理信息的傳染性疾病的發(fā)布和預(yù)警平臺[3]。
在面向平臺建設(shè)時,通盤考慮到從采集處理到分析挖掘以及應(yīng)用的整體架構(gòu)體系,初步構(gòu)建了傳染性疾病數(shù)據(jù)應(yīng)用服務(wù)系統(tǒng),其總體技術(shù)架構(gòu)見圖2。
圖2:基于WebGIS的傳染性疾病發(fā)布和預(yù)警系統(tǒng)平臺架構(gòu)
基于WebGIS的傳染性疾病發(fā)布和預(yù)警系統(tǒng)平臺采用瀏覽器/Web 服務(wù)器/數(shù)據(jù)庫服務(wù)器三層J2EE 體系結(jié)構(gòu),由基礎(chǔ)支持層、邏輯分析層、應(yīng)用服務(wù)層三部分組成。其中,基礎(chǔ)支持層對不同來源的傳染性疾病數(shù)據(jù)進行數(shù)據(jù)抽取、轉(zhuǎn)換、空間屬性分析,借助分層技術(shù),將這些屬性在GIS 中進行定位,通過共同處理圖形與數(shù)據(jù)庫信息,對平臺進行數(shù)據(jù)及平臺的基礎(chǔ)支持;邏輯分析層采用組件技術(shù)進行數(shù)據(jù)標準化建模、數(shù)據(jù)融合、場景關(guān)聯(lián),研究單個或多個因素在空間上的分布性和關(guān)聯(lián)性、有無聚集性或變動性等;應(yīng)用服務(wù)層以一個嶄新的視角提供數(shù)據(jù)服務(wù)和可視化輸出的應(yīng)用場景[4]。
基礎(chǔ)支持層包括傳染性疾病數(shù)據(jù)源的采集和GIS 的底層支持兩部分,主要完成數(shù)據(jù)采集和地理信息基礎(chǔ)支持。通過虛擬化平臺中部署的Oracle BIEE 工具進行數(shù)據(jù)的管理、抽取及轉(zhuǎn)換分析,為邏輯分析層提供數(shù)據(jù)輸入?;A(chǔ)的地理信息支持包括電子底圖數(shù)據(jù)、遙感影像資料、專用圖像數(shù)據(jù)等,提供邏輯分析層GIS 組件的輸入。
邏輯分析層主要進行數(shù)據(jù)標準化建模、數(shù)據(jù)融合、數(shù)據(jù)可視化分析、數(shù)據(jù)分層管理、數(shù)據(jù)安全控制等功能。將基礎(chǔ)支持層提交各類傳染性疾病數(shù)據(jù)進行空間屬性分析,分為若干數(shù)據(jù)集,結(jié)合空間數(shù)據(jù)庫管理方式,設(shè)計并建立基于SuperMap SDX+的空間數(shù)據(jù)庫。在此基礎(chǔ)上,利用J2EE 平臺進行Super MapObjects 全組件式GIS模塊的二次開發(fā)。以地理空間數(shù)據(jù)庫為基礎(chǔ)數(shù)據(jù),在計算機軟、硬件的支持下,對傳染性疾病數(shù)據(jù)進行坐標運算和分析,將多個屬性層級進行疊加,能夠大規(guī)模、綜合性地分析傳染性疾病數(shù)據(jù)的各種應(yīng)用場景。
應(yīng)用服務(wù)層主要是在邏輯分析層業(yè)務(wù)處理的基礎(chǔ)上,提供數(shù)據(jù)服務(wù)和可視化輸出。為了更好地為其他應(yīng)用模塊提供基于GIS 的醫(yī)療信息服務(wù),平臺采用了Web Service + XML 和REST + JSON 兩種標準化的接口服務(wù)形式,可以為醫(yī)療資源優(yōu)化配置、傳染性疾病預(yù)警等各種應(yīng)用提供支持。
基于WebGIS的傳染性疾病發(fā)布和預(yù)警系統(tǒng)平臺,可及時發(fā)布及預(yù)警大規(guī)模傳染性感染人員的綜合狀況、優(yōu)化醫(yī)療保障資源配置、提高醫(yī)療保障預(yù)警能力、改進醫(yī)療服務(wù)水平、提升應(yīng)急醫(yī)療保障能力等。
開展面向醫(yī)療部門、基層衛(wèi)生醫(yī)療機構(gòu)、醫(yī)療人員等的一系列醫(yī)療應(yīng)用服務(wù)。通過醫(yī)療數(shù)據(jù)資源采集、存儲處理、分析以及應(yīng)用管理能力的支撐,設(shè)計健康預(yù)警、輔助決策支持、傳染性疾病模式分析、傳染性疾病防控等分析應(yīng)用服務(wù)框架[5]。
通過對所獲取的數(shù)據(jù)進行歸納整理,并結(jié)合相關(guān)使用者的需求,設(shè)計了一個較為直觀的傳染性疾病可視化系統(tǒng),該系統(tǒng)主要由發(fā)布及預(yù)警模塊、分析模塊、決策支持模塊構(gòu)成。
包括的功能有:傳染性疾病發(fā)布、傳染性疾病監(jiān)控、傳染性疾病預(yù)警。實現(xiàn)傳染性疾病信息的統(tǒng)一結(jié)構(gòu)化管理,通過與各業(yè)務(wù)系統(tǒng)的集成,構(gòu)建統(tǒng)一數(shù)字化傳染性疾病監(jiān)測平臺,統(tǒng)一更新,保證信息的權(quán)威性和準確性,以提升衛(wèi)生領(lǐng)域精益化數(shù)字管理水平,并能夠?qū)崟r的反應(yīng)當前傳染性疾病狀況。
包括的功能有:空間查詢、傳染性疾病時空發(fā)展趨勢分析、空間聚焦性分析、傳染性疾病感染熱點分析、影響因素分析。本模塊完成數(shù)據(jù)統(tǒng)計查詢,各地傳染性疾病信息、歷史傳染性疾病信息、各時間段傳染性疾病信息在地圖上的顯示,地域顆粒度可到縣級。
包括的功能有:傳染性疾病管理、衛(wèi)勤應(yīng)急管理、醫(yī)療衛(wèi)生部門資源配置。本模塊中將系統(tǒng)中的公用信息進行標準化管理,以便系統(tǒng)維護和擴展,并保持系統(tǒng)一致性。這些標準信息包括:區(qū)劃標準、疾病編碼標準、檢測點信息管理、臨床表征等。同時還包括跨部門的信息集成:衛(wèi)健委、應(yīng)急響應(yīng)、疾控中心等部門的信息集成。
數(shù)據(jù)庫是空間數(shù)據(jù)和屬性數(shù)據(jù)存放的一個集合。建立數(shù)據(jù)庫不僅僅是為了保存數(shù)據(jù),更主要的是為了幫助人們管理和控制與這些數(shù)據(jù)相關(guān)聯(lián)的事物。本系統(tǒng)的數(shù)據(jù)庫設(shè)計包含兩個部分:空間數(shù)據(jù)庫設(shè)計、屬性數(shù)據(jù)庫設(shè)計和傳染性疾病數(shù)據(jù)庫設(shè)計。
空間數(shù)據(jù)庫用Oracle 11g + SuperMapSDX+5 的配置,設(shè)計充分考慮到其開放性、安全性和可擴展性。SuperMapSDX+5 能支持多種數(shù)據(jù)庫,同時支持矢量和柵格數(shù)據(jù)。在圖形數(shù)據(jù)和屬性數(shù)據(jù)的處理上,采取圖形數(shù)據(jù)和屬性數(shù)據(jù)統(tǒng)一存放和管理,圖形數(shù)據(jù)通過數(shù)據(jù)引擎連接,屬性數(shù)據(jù)通過JDBC 連接的方式[6]。
空間數(shù)據(jù)主要包括三部分,即基礎(chǔ)圖、專題圖和預(yù)警圖?;A(chǔ)圖包括政區(qū)圖、道路、河流、高程等,直接由數(shù)字化產(chǎn)生。專題圖是按照一定的目的,由基礎(chǔ)地圖歸納或模擬生成。預(yù)警圖建立在專題地圖和模型分析結(jié)果的基礎(chǔ)上,通過空間分析綜合生成。空間數(shù)據(jù)以數(shù)據(jù)表的形式存儲在數(shù)據(jù)庫中。為了有效地利用衛(wèi)星遙感資源迅速繪制出各種專題地圖,本文采用的是采用SuperMapDeskpros 5.0和SuperMap SDX 來存儲各地的地理數(shù)據(jù),包括各個區(qū)域的經(jīng)緯度,地名,區(qū)域面積等等,因此通用性很強。
屬性數(shù)據(jù)庫是最常見的類型,它含有描述空間特征性質(zhì)或特點的數(shù)據(jù)。在此系統(tǒng)中包括與傳染性疾病發(fā)生和流行有關(guān)的衛(wèi)健委管理、水源、交通、人口、經(jīng)濟等情況,以及當?shù)貍魅拘约膊∈罩魏退劳銮闆r的病例和診治信息庫。業(yè)務(wù)數(shù)據(jù)主要來源于疾控中心的每日發(fā)布以及一些醫(yī)療部門等的業(yè)務(wù)數(shù)據(jù)庫。
為了及時準確地獲取相關(guān)的業(yè)務(wù)數(shù)據(jù),可以通過數(shù)據(jù)交換平臺如中間件、聯(lián)機分析處理等技術(shù)跨庫來獲取數(shù)據(jù),這就涉及到數(shù)據(jù)格式等的統(tǒng)一及其他行政方面的協(xié)調(diào)等問題,這里只是一個實現(xiàn)數(shù)據(jù)的想法,要實現(xiàn)需要投入更多的人力物力[7]。
本文以傳染性疾病數(shù)據(jù)為例,利用Spring MVC + Spring+MyBatis(SSM)開發(fā)框架進行業(yè)務(wù)數(shù)據(jù)的訪問,在前端可視化表達方面采用Cesium 二、三維開源地圖框架,結(jié)合Echarts 圖表庫和Bootstrap 前端框架將數(shù)據(jù)以不同的可視化方式展示,系統(tǒng)主要功能論述如下。
全國傳染性疾病界面主要是對傳染性疾病情況進行分析,中間部分采用Cesium 二、三維開源地圖框架將全國感染人數(shù)展示在衛(wèi)星影像圖上,顏色深淺代表不同區(qū)域感染人數(shù)的數(shù)量,顏色越深感染人數(shù)越多。該模塊可以按天查詢每日各省感染人數(shù)情況,以及按時段動態(tài)展示各省感染人數(shù)的變化,當點擊某一個省份還可定位到此省份或自治區(qū)并查看其相關(guān)傳染性疾病信息以及交通人文經(jīng)濟等相關(guān)情況,如圖3所示。
圖3:某行政區(qū)交通人文、地形地貌等的信息展示
界面右側(cè)包括每日傳染性疾病確診趨勢折線圖以及年齡段分布情況,右下角是治愈及死亡人數(shù)餅狀圖。通過以上不同的可視化表達可以多維度非常直觀地展示全國傳染性疾病情況,如圖4所示。
圖4:傳染性疾病統(tǒng)計與展示系統(tǒng)主界面
年齡分段目錄可根據(jù)年齡分四組來記錄病情的情況,季節(jié)分組分為春夏秋冬來記錄每個季節(jié)出現(xiàn)病情的狀況,其他大型的傳染病情都可以依靠此系統(tǒng)來進行記錄監(jiān)控,如圖5所示。疾病分類目錄是以年度為單位展示每年的患病情況以及控制程度,如果患病情況嚴重,上方描述會提示“要及時治療,必要時呼吸內(nèi)科就診”,所有的建議診斷描述提取的數(shù)據(jù)均為某三甲醫(yī)院HIS 數(shù)據(jù)庫中的建議診斷描述。
圖5:年齡分段信息和季節(jié)分組目錄信息
傳染性疾病是近年來影響我國乃至全世界的一次重大的突發(fā)公共衛(wèi)生事件,對我國公共衛(wèi)生應(yīng)急管理提出了巨大的挑戰(zhàn)。本文探討了基于WebGIS的傳染性疾病發(fā)布和預(yù)警的應(yīng)用,研究利用WebGIS 直觀展現(xiàn)傳染性疾病感染人員的地理位置等,建立預(yù)測模型,預(yù)測傳染性疾病的蔓延趨勢,以可視化的方式顯示各類醫(yī)療衛(wèi)生機構(gòu)分布,便于各級衛(wèi)生主管部門指揮調(diào)度,完成應(yīng)急醫(yī)療力量的人員派遣、規(guī)劃、緊急調(diào)度和路徑優(yōu)化等任務(wù),為主管部門提供醫(yī)療信息服務(wù),為醫(yī)療保障研究提供有效的信息化工具和科學決策支持手段都具有重大的意義。
但目前的研究還處于初級階段,還有一些問題亟待解決,例如醫(yī)療機構(gòu)數(shù)據(jù)共享,醫(yī)療資源配置調(diào)度的協(xié)調(diào)性等問題,這也是下一步研究的方向和思路。