魏曉蕾 沈晨 麻盛淼 胡宇樂 梁濤
以國務院辦公廳2016年6月頒布的《關于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見》[1]為綱領,近年來醫(yī)療大數(shù)據(jù)已逐漸成為我國一項基礎性戰(zhàn)略資源[1]。通過先進的數(shù)據(jù)挖掘技術對大量數(shù)據(jù)進行整合分析,能更好地識別危險因素與疾病的相關性,準確地進行風險預測,從而改善疾病的治療和預后[2-3],有利于節(jié)約醫(yī)療成本、提升醫(yī)療水平、促進醫(yī)療健康管理,將對我國經(jīng)濟社會發(fā)展、人民生活質(zhì)量提高等各方面產(chǎn)生積極影響[4]。衰弱是一項常見的老年綜合征,在目前人口老齡化加速的背景下,將成為最嚴重的全球公共衛(wèi)生挑戰(zhàn)之一[5-6]。但衰弱具有可逆性,通過科學方法準確識別和評估衰弱及其風險,及時提供準確的干預,能夠改善此類老年人的臨床結(jié)局[7-9],有助于實現(xiàn)健康老齡化。本文綜述醫(yī)療大數(shù)據(jù)的特征和優(yōu)勢,分析國內(nèi)外醫(yī)療大數(shù)據(jù)在電子化衰弱評估工具中的應用,對電子化衰弱評估工具的優(yōu)勢和問題進行探討,進而展望其未來發(fā)展方向。
醫(yī)療大數(shù)據(jù)是一種多平臺、跨機構的全生命周期數(shù)據(jù)的集合,具有數(shù)據(jù)量大、種類豐富、來源復雜多樣、數(shù)據(jù)產(chǎn)生及更新迅速等特點,具有極大的潛在利用價值,應用前景廣闊[10-11]。醫(yī)療大數(shù)據(jù)的主要來源包括醫(yī)院采集的患者電子健康檔案、實驗室檢查、可穿戴設備存儲的健康信息以及各類醫(yī)療衛(wèi)生機構的運營信息等結(jié)構化、半結(jié)構化或非結(jié)構化數(shù)據(jù)[10],與醫(yī)療健康服務的目的、過程、結(jié)果密切相關[12]。醫(yī)療大數(shù)據(jù)具有數(shù)據(jù)量大、來源豐富、種類復雜且更新速度快等特點,故不適合采用傳統(tǒng)的數(shù)據(jù)處理技術進行處理,近年來,機器學習、數(shù)據(jù)挖掘、神經(jīng)網(wǎng)絡等逐漸成為分析醫(yī)療大數(shù)據(jù)的主要手段[13-15]。來自患者電子健康檔案、實驗室數(shù)據(jù)、臨床試驗報告和保險信息等的數(shù)據(jù)經(jīng)過采集、存儲、整合、分析,患者個體的特征信息得以充分利用和挖掘,可以改進風險分層,協(xié)助醫(yī)療和護理決策,更好地對患者進行干預[16-17]?,F(xiàn)階段,我國醫(yī)療大數(shù)據(jù)主要用于輔助臨床疾病診斷、風險預測、基礎醫(yī)學研究、個體健康管理等方面,尤其是在精準醫(yī)療領域潛力巨大。合理利用醫(yī)療大數(shù)據(jù)有利于優(yōu)化醫(yī)療資源配置,在降低醫(yī)療護理成本的同時,提升醫(yī)療護理服務的效率和質(zhì)量,最終提高全民健康水平[18]。
基于目前醫(yī)療大數(shù)據(jù)的發(fā)展和傳統(tǒng)衰弱評估工具存在的不足[19-20],使用電子健康工具記錄或管理數(shù)據(jù)集來進行大數(shù)據(jù)挖掘分析并推導出預測模型,進而準確地進行衰弱風險評估和不良預后預測,成為目前衰弱評估工具改進和研發(fā)的熱點。
近年來,各種基于醫(yī)療大數(shù)據(jù)的電子化衰弱評估工具被開發(fā)和應用,這些新型評估工具基于傳統(tǒng)衰弱評估工具的基本原理,結(jié)合機器學習等方法,為在多種環(huán)境和人群中更有效地識別和評估老年人衰弱及其風險提供了可能[21]。
電子衰弱指數(shù)(electronic Frailty Index,eFI)是首個基于醫(yī)療大數(shù)據(jù)開發(fā)的電子化衰弱評估工具,它以衰弱的缺陷積累模型為框架。工具開發(fā)的訓練集來源于一個包含約600萬名患者電子健康記錄的衛(wèi)生保健研究數(shù)據(jù)庫。通過兩次機器檢索和一次雙人手工檢索,以“能夠反映健康狀況,患病率和嚴重程度隨年齡的增長而增加,流行率飽和發(fā)生在達到老年人年齡標準之后”為標準,提取出與衰弱相關的、以文字或數(shù)字代表的缺陷特征,經(jīng)過分類和統(tǒng)一編碼,再由衰弱專家小組進行新一輪篩選,最終確定納入訓練集的36項缺陷代碼[22]。在大規(guī)模內(nèi)部和外部驗證中,研究者根據(jù)eFI四分位數(shù)確定健康、輕度、中度和重度衰弱的分段標準,即0~0.12為健康,>0.12~0.24為輕度衰弱,>0.24~0.36為中度衰弱,>0.36為重度衰弱,并分別預測了不同程度衰弱的老年人在1年、3年和5年時死亡、住院和入住養(yǎng)老院風險增加的情況,兩次驗證結(jié)果相似[22]。之后的多項研究表明,eFI能整合利用電子健康記錄中豐富的患者信息,與常用的Fried衰弱表型、衰弱指數(shù)(Frailty Index,F(xiàn)I)等傳統(tǒng)工具具有較好的一致性,使用eFI得出的衰弱患病率與實際衰弱患病率接近,但評估過程更為簡便快捷,節(jié)省了大量人工評估和測算的時間,且在風險預測方面具有更高的準確性[23-25]。
基于eFI的成功實踐,改良5項衰弱指數(shù)(modified Frailty Index-5,mFI-5)、術前衰弱指數(shù)(preoperative Frailty Index,pFI)等類似的電子化衰弱評估工具被開發(fā)出來,通過對醫(yī)療數(shù)據(jù)庫中結(jié)構化的健康信息進行自動分析并進行術前衰弱評估,以預測術后死亡率和并發(fā)癥的發(fā)生情況[26-27]。
急診護理環(huán)境具有時間緊迫、病情緊急的特點,大部分人工評估較為復雜且耗時長,不能滿足急診快速準確完成評估的要求。Gilbert等[28]使用國際疾病及相關健康問題統(tǒng)計分類第10版(International Statistical Classification of Diseases and Related Health Problems,Tenth Revision,ICD-10)編碼系統(tǒng)開發(fā)了醫(yī)院衰弱風險評分(Hospital Frailty Risk Score,HFRS),該電子化工具的開發(fā)和驗證分為以下3個步驟。首先,根據(jù)患者在ICD-10診斷、住院時間、住院費用的相似性進行聚類分析,以檢驗能否可以利用ICD-10編碼和醫(yī)療資源利用情況來識別衰弱患者,進而確定了在衰弱組反復出現(xiàn)、可用于識別衰弱的109項ICD-10代碼。其次,采用Gower[29]的方法結(jié)合分類變量(ICD-10診斷)和連續(xù)變量(臥床天數(shù)和住院費用)組成醫(yī)院衰弱風險評分,總分>15分為高風險,5~15分為中風險,<5分為低風險。最后,在兩個獨立的隊列中驗證了HFRS對急診入院患者不良結(jié)局的預測能力,以及它與其他臨床衰弱工具的一致性。結(jié)果表明,利用醫(yī)院管理系統(tǒng)中的ICD-10編碼進行自動化衰弱評估具備與傳統(tǒng)的Fried表型量表和臨床衰弱量表(Clinical Frailty Scale,CFS)具有相似的準確性,且HFRS不僅節(jié)省了人工和時間成本,而且具有更好的評分者信度,在超過100萬名患者的驗證隊列中,HFRS識別出的高衰弱風險患者,其30天死亡率、住院時間延長和30天再入院的風險更高。由于其快速、準確的獨特性能,HFRS也被用于預測有創(chuàng)機械通氣和重癥監(jiān)護使用概率,從而協(xié)助臨床決策,使醫(yī)療護理資源的分配更具成本效益。在Ramos等[30-31]研究中,HFRS被用于識別需要早期進行重癥監(jiān)護的高危新型冠狀病毒感染患者,較好地預測了不良結(jié)局風險,從而改善了風險分層和預后評估。
我國研究者通過分析2016年來自美國國家急診科樣本(National Emergency Department Sample,NEDS)的141267名住院老年創(chuàng)傷患者(年齡≥65歲)的醫(yī)療記錄,根據(jù)Gilbert等構建HFRS的3個步驟開發(fā)驗證了專門用于該人群的衰弱評估工具,即老年創(chuàng)傷衰弱指數(shù)(Geriatric Trauma Frailty Index,GTFI)[32]。該工具可以使用醫(yī)院的電子病歷系統(tǒng)的常規(guī)數(shù)據(jù),系統(tǒng)地整合老年創(chuàng)傷患者個人的疾病特征,無需手動計算評分,對預后的預測效果良好,尤其適合病情緊迫的老年創(chuàng)傷患者。在來自NEDS的國際驗證隊列和來自上海創(chuàng)傷急診醫(yī)學會(Shanghai Trauma Emergency Medical Association,STEMA)本土驗證隊列中,均有良好表現(xiàn),能準確識別衰弱的創(chuàng)傷老年患者,在本土驗證隊列中ROC曲線的結(jié)果顯示,GTFI能有效地預測我國老年創(chuàng)傷人群的預后,對于死亡率預測曲線下面積可達0.903,能準確識別衰弱的創(chuàng)傷老年患者,有效預測我國老年創(chuàng)傷人群的預后情況[32]。
除了驗證較為充分的eFI和HFRS外,還有其他經(jīng)過了初步驗證和試用的電子化衰弱評估工具。例如,Hall等[33]從美國退伍軍人事務部/美國外科醫(yī)生學會國家手術質(zhì)量改善項目數(shù)據(jù)庫(VASQIP/ACSNSQIP),通過數(shù)據(jù)連接技術捕獲了11項衰弱相關變量,構建了術前衰弱風險評分(RAI-A),變量根據(jù)各自的權重賦分,總分在0~81之間。由于參考了完整的患者電子病歷信息,在識別術前衰弱上,RAI-A相較于問卷型工具有更高的特異性,對術后死亡率和并發(fā)癥的預測能力有明顯提高[34]。福斯特全球衰弱評分(Forster Global Frailty Score,F(xiàn)GFS)是由來自9個國家的34家醫(yī)院合作開發(fā)的一種新型電子化衰弱評估工具,該電子化工具包含7組衰弱綜合征相關的ICD-10代碼,利用常規(guī)收集的管理數(shù)據(jù)對有衰弱風險的老年人進行風險預測建模,實現(xiàn)了衰弱綜合征的臨床概念與醫(yī)療數(shù)據(jù)集的結(jié)合,不僅可以進行衰弱評估,還可預測住院死亡率、長期住院時間和30天非計劃再入院率[35]。
將衰弱的研究成果應用到臨床實踐中是未來面臨的主要挑戰(zhàn)之一。對于臨床一線的醫(yī)護人員或者社區(qū)衛(wèi)生服務人員來說,評估工具的臨床實用性是非常重要的,一個簡單且快捷的衰弱評估工具有助于為評估對象實施精準的干預、合理分配醫(yī)療護理資源[36]?;卺t(yī)療大數(shù)據(jù)開發(fā)的電子化衰弱評估工具,不僅評估過程簡便高效,節(jié)省了大量的時間和人力資源成本,還能更好地預測病死率及其他不良事件,在臨床、社區(qū)等環(huán)境中有著較大的應用潛力。例如,eFI可以從初級醫(yī)療保健機構的電子病歷中生成患者健康缺陷的數(shù)量,無需醫(yī)護人員額外收集衰弱的相關數(shù)據(jù),明顯提高了評估的效率,從而可以快速識別衰弱人群并進行有針對性的干預與管理。
電子化衰弱評估工具能夠自動整合醫(yī)療大數(shù)據(jù)中全面的健康和醫(yī)療信息,相較于傳統(tǒng)衰弱評估工具而言,更能客觀準確地反映老年人的衰弱狀況及健康功能狀況。同時,可以利用信息技術開發(fā)適用于手機、平板電腦等終端操作的版本,方便醫(yī)護人員進行高效的數(shù)據(jù)收集和分析,提高衰弱評估的數(shù)字化和信息化水平。此外,利用電子化衰弱評估工具發(fā)揮其風險預測方面的獨特優(yōu)勢,能夠完善衛(wèi)生服務資源分配,為衰弱老年人提供以目標為導向的護理計劃,制定有針對性的循證干預措施,有助于改善老年衰弱患者的疾病預后和生存質(zhì)量。
首先,衰弱評估工具對臨床的重要意義是能夠?qū)崿F(xiàn)在一級或二級預防中發(fā)現(xiàn)衰弱的風險,而目前電子化衰弱評估工具對臨床不良結(jié)局等的預測作用主要用于三級預防,即預防衰弱狀態(tài)持續(xù)惡化而導致的臨床不良結(jié)局。其次,大多數(shù)電子化衰弱評估工具主要是利用單一來源和類型數(shù)據(jù)開發(fā)的,雖然樣本量可觀,但目前只有一部分衰弱相關變量可以完全從此類醫(yī)療大數(shù)據(jù)中提取出來,因此,仍然有可能缺少某些關鍵的信息,尤其是社會心理方面的變量,從而可能影響評估的質(zhì)量和預測效果[37]。再次,一些電子化衰弱評估工具缺乏獨立驗證或驗證結(jié)果不理想,工具的性能受數(shù)據(jù)來源的影響較大,穩(wěn)健性尚不能達標。目前各國醫(yī)療衛(wèi)生系統(tǒng)中存在著大量非結(jié)構化、未經(jīng)編碼的數(shù)據(jù),而現(xiàn)階段的電子化衰弱評估工具對此類數(shù)據(jù)的提取和分析能力普遍不足,在真實環(huán)境中的臨床應用時常受限。
每種電子化衰弱評估工具也存在各自不同的問題。例如,eFI識別衰弱和預測風險的能力目前僅在人群水平得到驗證,在個體水平上的評估和預測效果有待進一步研究。而對于HFRS的預測功能,存在許多不一致的研究結(jié)果,如在1項全關節(jié)置換術患者的研究中,HFRS不能準確預測其治療成本[38],也有學者認為HFRS預測較長住院時間和非計劃再入院的能力并無明顯提高[39]。此外,由于mFI-5僅包含5項變量,已有研究者對其科學性和合理性質(zhì)疑,但目前尚缺乏相關證據(jù)[40]。
當前全球的醫(yī)療數(shù)據(jù)已累積有數(shù)百艾字節(jié)(Exabytes,EB),且仍將呈指數(shù)級增長。從大規(guī)模研究隊列的快速建立和識別,到人工智能輔助的臨床決策支持系統(tǒng),醫(yī)療大數(shù)據(jù)正深刻地改變著醫(yī)學研究與實踐[41]?!丁敖】抵袊?030”規(guī)劃綱要》提出了實現(xiàn)“全民健康”的目標,而大力發(fā)展醫(yī)療大數(shù)據(jù)是實現(xiàn)“全民健康”的基礎工程[42]。目前,建立電子健康檔案、電子病歷數(shù)據(jù)庫、大數(shù)據(jù)中心等大數(shù)據(jù)基礎建設工作,加強健康醫(yī)療大數(shù)據(jù)及公共衛(wèi)生大數(shù)據(jù)的應用,從而實現(xiàn)數(shù)據(jù)的聯(lián)通融合與開放共享,是我國醫(yī)療大數(shù)據(jù)戰(zhàn)略的主要聚焦點[4]。當前我國的醫(yī)療大數(shù)據(jù)尚處于發(fā)展階段,基于醫(yī)療大數(shù)據(jù)的電子化衰弱評估工具應用前景廣闊。
但目前我國醫(yī)療資源地區(qū)、機構間分布差異大,相關人才短缺,技術推廣存在困難;醫(yī)療大數(shù)據(jù)在國內(nèi)仍主要是由自由文本構成的非結(jié)構化數(shù)據(jù),且各家醫(yī)療機構的信息化程度參差不齊,難以建立統(tǒng)一的數(shù)據(jù)平臺實現(xiàn)數(shù)據(jù)信息共享。部分基層醫(yī)療機構使用的信息系統(tǒng)普遍比較簡單,缺乏必要的、結(jié)構化的患者臨床信息進行電子化衰弱評估,若患者電子健康記錄的更新不及時,難以實現(xiàn)對患者近期健康狀況變化的判斷。另外,電子病歷、醫(yī)院信息系統(tǒng)等數(shù)據(jù)庫中包含大量患者的個人信息,數(shù)據(jù)挖掘帶來的隱私和倫理問題也亟待解決[43-44]。同時,我國本土化的電子化衰弱評估工具較少,可逐步將現(xiàn)有國外工具進行漢化改良并驗證其在我國的適用性。最后,機器和數(shù)據(jù)始終不能完全替代人工,需要探索如何將此類工具與量表式衰弱評估工具結(jié)合應用,充分發(fā)揮醫(yī)療大數(shù)據(jù)與醫(yī)護人員臨床經(jīng)驗的多種優(yōu)勢,最大程度改善衰弱評估質(zhì)量。
未來應對基于醫(yī)療大數(shù)據(jù)的衰弱評估工具進行更多的前瞻性研究,進一步驗證并評價其識別衰弱和對臨床不良結(jié)局事件與風險的預測能力。同時,對于衰弱及其風險的評估與準確識別只是衰弱管理與連續(xù)性護理過程的第一步,如何在衰弱導致的實質(zhì)性功能衰退之前,通過衰弱評估制定針對性干預措施,對預防或延緩衰弱的進展至關重要,而這一方面尚缺乏可靠、全面、系統(tǒng)性的研究證據(jù),需要進一步探索,以助力健康老齡化和健康中國進程。