許芳芳,胡江,陳維仁,周敏
(1.杭州脈興醫(yī)療科技有限公司,浙江 杭州;2.浙江大學醫(yī)學院附屬第一醫(yī)院信息中心,浙江 杭州)
重癥患者或重大手術后的患者在重癥監(jiān)護室(ICU)內(nèi)通過多種生命支持系統(tǒng)以維持生理功能[1]?;颊咴贗CU內(nèi)會被頻繁持續(xù)的記錄生命體征和實驗室測量等多種數(shù)據(jù)。由于高頻次的數(shù)據(jù)采集,數(shù)十年來ICU內(nèi)已經(jīng)形成了一個巨大的臨床醫(yī)療數(shù)據(jù)信息庫,這儼然是一種重要的、可被利用的醫(yī)療資源。
近年來,人工智能在醫(yī)學領域的發(fā)展非???,特別是在精準醫(yī)學方面,隨著人工智能在理論研究和實際應用方面取得重大進展,大數(shù)據(jù)人工智能將在精準醫(yī)學領域發(fā)揮核心作用。
其實,現(xiàn)今已經(jīng)有許多標準化數(shù)據(jù)庫被開發(fā)出來供公眾訪問和使用。例如重癥監(jiān)護醫(yī)療信息中心(Medical Information Mart for Intensive Care-Ⅲ,MIMIC-Ⅲ),由麻省理工學院計算生理學研究所,Beth Israel Deaconess醫(yī)學中心(BIDMC)和飛利浦醫(yī)學建立。MIMIC-Ⅲ數(shù)據(jù)庫包含了與2001年至2012年期間入住重癥監(jiān)護病房的成年(16歲或以上)患者的53,423例住院記錄相關的數(shù)據(jù)[2]。此外,它還包含2001年至2008年間收治的7870名新生兒的數(shù)據(jù)[2]。具體而言,MIMIC-Ⅲ數(shù)據(jù)庫包括來自38,597名成人和7,870名新生兒的人口統(tǒng)計信息、實驗室測試數(shù)據(jù)和生命體征數(shù)據(jù)庫以及他們的臨床診斷和治療數(shù)據(jù)等。
在國內(nèi),浙江大學第一附屬醫(yī)院(First Affiliated Hospital of Zhejiang University,F(xiàn)AHZU)從本世紀初開始,在總結(jié)與分析了眾多醫(yī)院信息化建設的基礎上,提煉出醫(yī)院的管理理論,開發(fā)了全新的以患者醫(yī)療信息為中心,加強醫(yī)院管理為核心的新一代的HIS系統(tǒng),從而優(yōu)化了醫(yī)院的信息存儲與業(yè)務流程[3]。在醫(yī)院的發(fā)展過程中,持續(xù)開發(fā)了基于HIS的信息系統(tǒng)來存儲電子病歷,護理信息以及醫(yī)囑信息。到目前為止,已經(jīng)建立了六個診斷和治療平臺,包括分診平臺,藥代動力學平臺和遠程醫(yī)療[4]。在FAHZU全面建設醫(yī)療信息化的基礎上我們類比MIMIC-Ⅲ 建立了FAHZU的ICU??茢?shù)據(jù)庫,稱之為FAHZU-ICU。2017年11月29日,F(xiàn)AHZU正式通過了HIMSS EMRAM(住院)六級現(xiàn)場評估。
機器學習已廣泛應用于臨床研究。Weng等人基于常規(guī)臨床數(shù)據(jù),使用多種機器學習技術,如隨機森林、邏輯回歸、梯度增強機器以及神經(jīng)網(wǎng)絡預測心血管風險[5]。Celi等人應用機器學習方法來預測ICU中的液體需求[6]。此外,Wen等人使用隨機森林建立造影劑誘發(fā)腎病的術前預測模型[7]。也有Bera、Vairavan等學者使用邏輯回歸評估MIMIC-Ⅲ數(shù)據(jù)庫中ICU患者的死亡風險[8-9]。
本文旨在從MIMIC-Ⅲ和FAHZU-ICU數(shù)據(jù)庫出發(fā),預測ICU患者的死亡風險,比較它們的模型預測效果并評估特征的重要性。
基于MIMIC-Ⅲ v1.4和FAHZU-ICU數(shù)據(jù)庫數(shù)據(jù)建立預測模型。MIMIC-Ⅲ 數(shù)據(jù)庫共包含61,532個具有出院狀態(tài)標記的樣本,其中存活54323例,死亡6,609例。FAHZU-ICU數(shù)據(jù)庫中的原始數(shù)據(jù)包含5670個具有出院狀態(tài)標記的樣本,包括101個死亡樣本和5569個存活樣本。
根據(jù)臨床醫(yī)生權威性梳理和實際可用性原則來選擇兩個數(shù)據(jù)集中的候選變量。其中包括人口統(tǒng)計學變量、生命體征變量、實驗室生理檢查變量、各類評分信息變量等。如果患者在一天內(nèi)多次進行測量,則使用平均值、最大值和最小值來產(chǎn)生衍生特征。在刪除了數(shù)據(jù)缺失嚴重的變量后,MIMIC-Ⅲ 數(shù)據(jù)集中的166個特征和FAHZU-ICU數(shù)據(jù)集中的106個特征用于預測。
由于兩個數(shù)據(jù)集中幸存者數(shù)量和患者死亡人數(shù)之間存在嚴重的不均衡問題,根據(jù)模型效果進行優(yōu)化調(diào)整,最終使用每個數(shù)據(jù)集中的所有死亡樣本,并隨機選擇兩倍于死亡樣本的生存樣本,采用基于隨機森林(Random Forest)的分類預測算法來建立預測模型,并使用5折交叉驗證下的受試者工作特征曲線(ROC)內(nèi)的區(qū)域面積(AUC)、特異性(Specificity)、靈敏度(Sensitivity)對模型性能進行評估。
模型預測效果如表1所示。在MIMIC-Ⅲ 數(shù)據(jù)集中,5折交叉驗證下的平均靈敏度和特異性分別為0.76和0.88,AUC和準確度分別為0.82和0.83。在FAHZU-ICU數(shù)據(jù)集中,5折交叉驗證下的平均靈敏度和特異性分別為0.631579和0.838027,AUC和準確度分別為0.73和0.79。顯然,使用MIMIC-Ⅲ 數(shù)據(jù)集的預測性能比使用FAHZU-ICU數(shù)據(jù)的預測性能要好得多。
表1 使用MIMIC-Ⅲ和FAHZU-ICU數(shù)據(jù)集預測ICU死亡率的表現(xiàn)
接下來,我們研究了各種特征如何影響兩個數(shù)據(jù)集中的死亡率預測結(jié)果。表2顯示了兩個數(shù)據(jù)集中各自對模型預測效果最重要的15個特征。在FAHZU-ICU數(shù)據(jù)集中,排名靠前的特征是相關酶,例如羥基丁酸脫氫酶和乳酸脫氫酶。兩種酶都與心肌損傷有關,屬于兩類心肌酶。當心肌細胞發(fā)炎和壞死時,心肌細胞中含有的酶可以進入血液,血液中這些酶的活性(含量)會增加。血液中酶的含量將反映患者心臟和腎臟的狀態(tài)。排名靠前的重要特征還包括蛋白質(zhì),鈉,心率和其他生理指標,這都是反應患者生存狀態(tài)的重要標志。
在MIMIC-Ⅲ 數(shù)據(jù)集中,重要性排名最靠前的為評分特征,但在FAHZU-ICU數(shù)據(jù)集中沒有此類評分指標。而FAHZU-ICU模型中排名靠前的酶在MIMIC-Ⅲ 數(shù)據(jù)集中特嚴重缺失,因此并未參與MIMIC-Ⅲ 數(shù)據(jù)集的模型進行預測。
表2 MIMIC-Ⅲ和FAHZU-ICU數(shù)據(jù)集中最重要的15個特征
*評分特征:簡化的急性生理學評分II (Simplified Acute Physiology Score II,SAPSII);急 性 生 理 學 評 分III (Acute Physiology Score III,APSIII);牛津急性疾病嚴重程度評分(Oxford Acute Severity of Illness Score,OASIS);簡化的急性生理學評分(Simplified Acute Physiology Score ,SAPS);Logistic器 官 功 能 障礙 評 分(Logistic Organ Dysfunction Score,LODS);改 良Logistic臟器功能障礙系統(tǒng)(Modified Logistic organ dysfunction system ,MOLDS);格拉斯哥昏迷評分(Glasgow coma scale,GCS);序貫器官衰竭估計(Sequential Organ Failure Assessment,SOFA)
表2的最后一列給出了去掉評分特征(SAPSII,APSIII,OASIS,SAPS,LODS,MOLDS,GCS,SOFA)后MIMIC-Ⅲ 數(shù)據(jù)集中的前15個實驗室檢測指標。這些非評分特征中的某些特征也出現(xiàn)在FAHZU-ICU數(shù)據(jù)集中的前15個特征。比如凝血酶原時間(PT),國際標準化比率(inr),心率和碳酸氫鹽,表明兩個不同ICU數(shù)據(jù)集在模型表現(xiàn)上存在一些共同點。
在本文中,基于FAHZU-ICU數(shù)據(jù)集和已發(fā)布的MIMIC-Ⅲ數(shù)據(jù)集,采用隨機森林的分類算法來預測兩個ICU數(shù)據(jù)集中患者的死亡風險。在MIMIC-Ⅲ 數(shù)據(jù)集中,我們獲得了AUC 0.815,準確度0.825,敏感度0.761和特異性0.876的模型效果。FAHZU-ICU數(shù)據(jù)集性能相較較差,AUC為0.732,準確度為0.79,靈敏度為0.631,不過0.838的特異性優(yōu)于MIMIC-Ⅲ 數(shù)據(jù)集。
這項研究的一大挑戰(zhàn)是生存和死亡樣本數(shù)量嚴重不均衡。這種不均衡使得隨機森林模型在決策過程中偏向生存群。為了解決這個問題,我們對生存樣本采用了欠采樣方法,以確保生存樣本和死亡樣本的合理比例。
盡管FAHZU-ICU數(shù)據(jù)庫較小且功能較少,但它包括患者住院期間一些獨有的生理監(jiān)測數(shù)據(jù),例如羥基丁酸脫氫酶和乳酸脫氫酶等酶類數(shù)據(jù),與MIMIC-Ⅲ數(shù)據(jù)庫相比患者基本檢測信息更全面一些。但是SAPSII,APSIII,OASIS,SAPS,LODS,MOLDS和SOFA等在MIMIC-Ⅲ數(shù)據(jù)集的死亡風險預測模型中表現(xiàn)良好的評分指標尚未包含在FAHZU-ICU數(shù)據(jù)庫中。
FAHZU是中國領先的信息數(shù)字化醫(yī)院,每年大約有一千例ICU診療記錄,到目前為止已經(jīng)收集了大量數(shù)據(jù)。但目前的醫(yī)院信息系統(tǒng)功能主要是滿足醫(yī)院管理和存貯需求。而且醫(yī)院的各類型數(shù)據(jù)分布在多個系統(tǒng)中,采集頻次也不一致,數(shù)據(jù)多源異構的缺陷明顯,導致海量的臨床數(shù)據(jù)沒有得到充分發(fā)掘和有效利用??偠灾袊尼t(yī)療數(shù)據(jù)庫采集和存儲系統(tǒng)還不夠成熟,有待完善,在這方面,已經(jīng)比較成熟的MIMIC-Ⅲ 數(shù)據(jù)庫或許能為國內(nèi)醫(yī)院建立標準數(shù)據(jù)庫時,在內(nèi)容和結(jié)構上提供一些參考。
此外,目前中國的醫(yī)療數(shù)據(jù)整體呈現(xiàn)分散存儲和低開放性的特點。每家醫(yī)院都是一座“信息孤島”,醫(yī)療數(shù)據(jù)很難真正實現(xiàn)臨床應用和科研轉(zhuǎn)化。這就要求醫(yī)療機構必須加強自身的EMR建設,進行數(shù)據(jù)標準化的宏觀管理,規(guī)范信息存儲,整理數(shù)據(jù)的內(nèi)部環(huán)節(jié)。加強醫(yī)院信息化建設,建立專業(yè)化數(shù)據(jù)庫,是醫(yī)療人工智能快速的重要基礎。在未來,我們也將納入不同地域醫(yī)療機構的數(shù)據(jù),打破“信息孤島”,開展死亡風險預測的多中心研究,進一步提高預測模型的魯棒性,增加臨床可用性。