王維笑 賈露榮 陶 焜 李 艷 閭海榮*
流行病學調(diào)查作為新型冠狀病毒肺炎(COVID-19)疫情防控的重要手段,對于鎖定感染者、搜索密切接觸者以及梳理傳播鏈條發(fā)揮著不可替代的作用[1-5]。疫情期間全國多個地區(qū)先后啟動重大突發(fā)公共衛(wèi)生事件一級響應機制時,各地疾病預防控制機構(gòu)派出流行病學專業(yè)人員,深入現(xiàn)場展開調(diào)查和疫情分析,與患者面對面交流,詢問患者發(fā)病前后的暴露情況、接觸情況、活動軌跡以及就醫(yī)情況,尋找與傳染源以及傳播途徑有關的蛛絲馬跡,為判定密切接觸者并采取隔離措施、劃定消毒范圍提供依據(jù)[6-7]。然而,隨著確診病例不斷增多,疫情進入暴發(fā)期后,持續(xù)及多點位的流行病學調(diào)查工作使得流行病學調(diào)查人員的工作量極大增加[8]。傳統(tǒng)的人工問卷調(diào)查方式暴露出效率低、準確性差、數(shù)據(jù)傳輸不及時和利用率低等諸多問題。此外,COVID-19以呼吸道飛沫傳播和密切接觸傳播[9]為主要傳播途徑,傳統(tǒng)的信息采集方式無法避免與被調(diào)查者的大量交流與接觸,增加了現(xiàn)場流行病學調(diào)查人員交叉感染的風險。因此,開發(fā)一種針對COVID-19的流行病學智能采集系統(tǒng),將現(xiàn)場流行病學調(diào)查工作中的信息收集流程智能化、標準化,幫助流行病學調(diào)查人員及時收集完備信息的同時最大限度地減少人員之間的交流與接觸,將極大地提升流行病學調(diào)查工作效率,避免交叉感染,遏制疫情蔓延。
近年來,隨著人工智能(artificial intelligence,AI)技術的飛速發(fā)展,越來越多的醫(yī)療場景中出現(xiàn)了智能化應用。人機對話系統(tǒng)作為AI領域的核心技術之一,也被廣泛地應用在居家自診、分診導診及病史采集等醫(yī)療場景中。人機對話系統(tǒng)通過自然語言處理相關技術來模仿學習人與人之間對話的方式和內(nèi)容,讓機器通過自然語言與人進行信息交互[10]。語音識別、自然語言理解、對話狀態(tài)跟蹤及策略優(yōu)化、自然語言生成以及語音合成是人機自然語言交互的關鍵組成部分[11]。本研究針對此次疫情傳播速度快、傳播途徑多及傳播范圍廣等特點,利用多模態(tài)的移動端智能人機交互技術,構(gòu)建智能信息采集系統(tǒng),輔助現(xiàn)場流行病學調(diào)查人員進行便捷高效的信息采集,將有效降低交叉感染風險,緩解調(diào)查人員工作壓力,提升數(shù)據(jù)質(zhì)量與安全性,并為后續(xù)的數(shù)據(jù)挖掘與共享提供基礎。
COVID-19流行病學智能采集系統(tǒng)利用智能人機交互技術,根據(jù)《新型冠狀病毒感染的肺炎防控方案》《中華人民共和國傳染病防治法》以及《突發(fā)公共衛(wèi)生應急條例》等文件要求,并結(jié)合現(xiàn)場實踐建立標準化的流行病學信息收集模板,構(gòu)建文字與圖片智能識別平臺,并實現(xiàn)結(jié)構(gòu)化信息與預設模板的自動映射與分析,為流行病學現(xiàn)場調(diào)查提供更加智能高效的信息采集模式。
智能人機交互系統(tǒng)的核心是人機對話服務引擎,其主要由對話管理系統(tǒng)、知識庫管理系統(tǒng)及AI技術管理系統(tǒng)三部分組成。前端可根據(jù)現(xiàn)場需要采用智能手機APP、智能平板APP等為載體。系統(tǒng)技術架構(gòu)見圖1;手機APP應用界面見圖2。
圖1 流行病學智能采集系統(tǒng)技術架構(gòu)
圖2 流行病學智能采集系統(tǒng)手機APP應用界面
對話邏輯模塊負責生成問題,通過與后臺知識庫管理系統(tǒng)交互獲得新的問題。對話交互模塊負責展示問題并回收答案,同時負責與AI技術管理系統(tǒng)進行交互,調(diào)用對應的接口獲得識別結(jié)果。健康報告模塊負責將所有對話內(nèi)容轉(zhuǎn)換為符合相關文件規(guī)范的調(diào)查報告或表單。
知識庫管理系統(tǒng)以服務器的形式供前端訪問。知識庫維護系統(tǒng)負責流行病學知識庫的創(chuàng)建、讀取、更新和刪除操作。知識庫推理引擎負責返回問題結(jié)構(gòu)體,供移動端對話邏輯模塊調(diào)用。知識庫模型訓練系統(tǒng)利用機器學習算法,基于知識庫結(jié)構(gòu),訓練高效的推理算法,以最簡潔的問題得到最完善的調(diào)查信息,該過程在服務器端自行完成訓練。
圖像識別、語音識別與合成調(diào)用相應的語音和(或)圖像服務應用程序編程接口(application programming interface,API)完成。語義抽取接口負責識別患者表述中的癥狀、體征、暴露史等相關內(nèi)容,轉(zhuǎn)換為語義結(jié)構(gòu)體。
COVID-19流行病學智能采集系統(tǒng)集流行病學信息采集、化驗單拍照識別、調(diào)查報告和(或)表單自動生成以及疫情資料智能歸檔等功能于一體,支持語音輸入、點選、普通輸入法輸入及手寫識別等多模態(tài)交互方式。
系統(tǒng)模仿流行病學調(diào)查人員以自然對話的形式進行多輪友好的引導式問答,根據(jù)每個問題的性質(zhì)(單選題、多選題及開放式等)提供相對應的最便捷的交互方式(點選、語音輸入等),快速和全面收集患者發(fā)病與就診情況、暴露史、危險因素以及密切接觸者等重要信息,并進行結(jié)構(gòu)化存儲,為尋找傳染源、梳理傳播鏈條、鎖定密切接觸者、控制疫情傳播范圍等工作提供有力的數(shù)據(jù)支持。智能人機交互模式不僅可以最大限度地減少流行病學調(diào)查人員與被調(diào)查者不必要的接觸,降低交叉感染風險,還可以提高數(shù)據(jù)準確性與規(guī)范性,提高個案調(diào)查質(zhì)量。
對于已完成的實驗室檢測,被調(diào)查者可以通過拍照上傳檢測結(jié)果。系統(tǒng)利用圖像處理和文字識別技術,對用戶上傳的化驗單進行自動識別和結(jié)構(gòu)化轉(zhuǎn)換,通過圖像增強和自動校準技術,對用戶拍攝的照片清晰度和幾何畸變進行智能優(yōu)化。通過光學字符識別(optical character recognition,OCR)技術和版式智能分析技術自動分析化驗單表格相關字段,并將識別結(jié)果映射到結(jié)構(gòu)化表格中進行保存。
根據(jù)所采集的患者基本信息、發(fā)病與就診以及危險因素與暴露史等內(nèi)容,自動進行結(jié)構(gòu)化映射,生成規(guī)范的COVID-19病例個案調(diào)查表或流行病學調(diào)查報告。采集的所有數(shù)據(jù)可與調(diào)查信息系統(tǒng)對接,并同步至電腦端,流行病學調(diào)查人員可以在電腦端進行調(diào)閱、審核與修訂,無需重復錄入,優(yōu)化采集流程,提高工作效率。
按相關要求對所采集數(shù)據(jù)進行自動化歸檔,實現(xiàn)對海量數(shù)據(jù)的存儲管理。疫情資料具備重要的醫(yī)學研究價值,通過對疫情資料的分析、查證,有助于探究突發(fā)公共衛(wèi)生事件的發(fā)生預兆和成因,規(guī)范突發(fā)公共衛(wèi)生事件的處置方法,為科學防范和控制突發(fā)公共衛(wèi)生事件提供科學依據(jù)[12]。
COVID-19流行病學智能采集系統(tǒng)打破傳統(tǒng)的單一信息采集模式,將多模態(tài)的移動端智能人機交互方式應用到現(xiàn)場流行病學調(diào)查的實際場景中,解決當前流行病學調(diào)查工作中信息采集效率低、準確性差、數(shù)據(jù)利用率與安全性不足以及交叉感染風險高等問題,讓戰(zhàn)“疫”時期的信息采集變得更加智能、高效、安全且便捷。系統(tǒng)所開發(fā)的人機對話與信息結(jié)構(gòu)化算法引擎,可以準確理解患者描述的病情信息,引導患者以自然對話的形式完成信息采集,并進行結(jié)構(gòu)化映射,不僅可以在疫情期間的流行病學調(diào)查工作中發(fā)揮重要作用,在日常的導診、預問診、隨訪及滿意度調(diào)查等諸多醫(yī)療場景中也可發(fā)揮重要的應用價值。