馬浩鳴,周佩如
1.暨南大學護理學院,廣東510632;2.暨南大學附屬第一醫(yī)院
糖尿病(diabetes mellitus,DM)作為困擾全人類的一種非傳染性慢性疾病,是遺傳和環(huán)境相互作用引起的一組以血糖升高為主要特征的臨床綜合征[1]。目前,全球每11位成年人中就有1位患有糖尿病,其中約90%的病人屬于2型糖尿病(type 2 diabetes mellitus,T2DM)[2]。2型糖尿病又被稱為非胰島素依賴型糖尿病,其患病率高,發(fā)病隱匿,早期癥狀不明顯,導致未確診的糖尿病病例大量增加,加上2型糖尿病治療技術的進步,意味著病人普遍老齡化,導致2型糖尿病并發(fā)癥的發(fā)病率大幅上升,代價高昂[3]。據(jù)國際糖尿病組織的數(shù)據(jù)估計,2017年全球約有4.51億例糖尿病病人,預計在2045年將增加到6.93億例;2017年全球糖尿病病人醫(yī)療保健支出約為8 500億美元[4]。根據(jù)國內(nèi)糖尿病流調(diào)數(shù)據(jù)顯示,我國成年人的糖尿病患病率已高達11.6%,約1.14億例[5],位居糖尿病第一大國。
2型糖尿病最主要的危害在于其伴隨而來的急性、慢性并發(fā)癥,是導致病人死亡以及醫(yī)療成本加重的最主要原因[6]。2型糖尿病并發(fā)癥患病率非常高,在一項亞洲、非洲、南美和歐洲28個國家的觀察研究中,2型糖尿病病人中有一半的病人患有微血管并發(fā)癥,有27%的病人患有大血管并發(fā)癥[7]。一項納入多國數(shù)據(jù)的研究表明,沒有并發(fā)癥的糖尿病住院病人的費用占人均收入的11%~75%,其中有并發(fā)癥的病人住院費用是沒有并發(fā)癥的住院病人的3倍[8]。
隨著社會對衛(wèi)生保健服務需求的日益增加,且基于對成本效益的考量,各國都相繼在2型糖尿病的管理指南中強調(diào)了對并發(fā)癥風險評估及早期預防的重要性,美國糖尿病協(xié)會(American Diabetes Association,ADA)[9]、英國國家衛(wèi)生和臨床技術優(yōu)化研究所(National Institute for Health and Care Excellence,NICE)[10]都在2型糖尿病指南中建議定期進行糖尿病并發(fā)癥風險評估和多學科管理。Wan等[11]在我國香港2018年的一項大型基于真實世界的前瞻性研究表明,通過糖尿病5年并發(fā)癥預測模型的篩選,將糖尿病并發(fā)癥高危病人進行多學科分層干預管理,與對照組相比,試驗組患心血管風險降低了56.6%,死亡率降低了66.1%,顯示通過糖尿病并發(fā)癥預測模型進行風險分層和早期多學科糖尿病控制和危險因素管理對延緩疾病進展和預防并發(fā)癥的重要性。因此,積極開發(fā)面向病人、醫(yī)護人員以及衛(wèi)生政策系統(tǒng)的2型糖尿病并發(fā)癥風險預測模型并構建實用性評估工具,對2型糖尿病管理具有重大意義。現(xiàn)將2型糖尿病并發(fā)癥預測模型的發(fā)展和應用進展綜述如下。
疾病預測模型在疾病診斷及管理領域扮演著越來越重要的角色,對于一些發(fā)病隱匿、進展緩慢的疾病來說,預測模型可以很好地協(xié)助臨床進行診斷和管理[12]。預測模型通常按方法學分為2種,第一種是最為經(jīng)典的,即建立在大量的病人數(shù)據(jù)上,經(jīng)過數(shù)學模型的擬合回歸,如Cox回歸模型和Weibull回歸模型等可以篩選出健康相關的危險因素,預測個體未來某一特定時間內(nèi)的發(fā)病概率,并進行相關風險的評分。模型可以進一步以概率切點來進行危險分層,可以提高臨床的實用性,如心血管領域中最著名的弗明翰心臟研究(Framingham heart study),此模型將人群按并發(fā)心血管事件的概率分為最低危風險、低風險、中度風險、高度風險和最高危風險,是最早的,也是運用最廣的預測模型[13]。另一種是通過對現(xiàn)有的、散在的研究進行二次研究合成,如Meta分析、合成分析(synthesis analysis)等,通過對現(xiàn)有研究的嚴格評價和納入,在無法進行嚴格大規(guī)模的隊列研究的前提下,也是一種建立預測模型的可靠方式,基于循證的原理獲得綜合性的模型,從而更好地為醫(yī)療資源的合理配置、衛(wèi)生服務的合理開展以及衛(wèi)生政策的合理制定等提供依據(jù)?,F(xiàn)有糖尿病并發(fā)癥風險預測模型通常指上文提及的第一種,其科學性較大依賴于研究的設計是否嚴謹,大多建立在前瞻性或回顧性隊列研究中,前者指在糖尿病并發(fā)癥發(fā)生之前,獲取并發(fā)癥相關危險因素的信息,通過隨訪獲得發(fā)病信息;后者指通過病歷回顧,尋找對照組和試驗組的危險因素與是否發(fā)生并發(fā)癥之間的關系,根據(jù)臨床數(shù)據(jù)建立相關并發(fā)癥的風險預測模型。以此為基礎,也可以開發(fā)出相關的風險評估工具,如列線圖和計算軟件等[14]。
2型糖尿病并發(fā)癥模型最早起源于英國著名的糖尿病前瞻性隊列研究(UKPDS),是糖尿病研究領域內(nèi)一項具有里程碑意義的隨機對照試驗[15]。該研究歷時14年(1977年—1991年),共納入5 102例糖尿病病人,平均隨訪時間為10.7年。此研究表明,嚴格的血糖控制和血壓管理可以大幅降低新診斷2型糖尿病病人未來發(fā)生糖尿病相關并發(fā)癥的風險。而基于此研究所得的數(shù)據(jù),從2001年起,學者們逐步開啟了對2型糖尿病相關并發(fā)癥預測模型的探索。首個糖尿病并發(fā)癥預測模型由Stevens等[16]率先開發(fā),模型納入了年齡、性別、種族、吸煙史、糖化血紅蛋白、收縮期血液壓力和總膽固醇/高密度脂蛋白膽固醇比率作為預測因子,并著重預測2型糖尿病病人心血管并發(fā)癥的風險。第2個基于UKPDS數(shù)據(jù)的模型在2004年由Clarke[17]等開發(fā)并驗證,該模型運用Weibull回歸發(fā)展了7個數(shù)學方程來預測與糖尿病相關的并發(fā)癥風險,包括腦卒中、心力衰竭、致命或非致命心肌梗死、糖尿病腎臟病、截肢以及失明。第2個模型除納入第1個模型所使用的預測因子之外,也納入了病人的既往史,如既往糖尿病相關不良事件的發(fā)生和體質(zhì)指數(shù)(BMI)。最新一版UKPDS模型由Hayes等[18]在2013年發(fā)表并對之前的版本進行了修改,加入了關于微量或大量蛋白尿、腎小球濾過濾、心率、白細胞計數(shù)和血紅蛋白等詳細的生化指標信息,使模型更敏感,具有更高預測效應。隨著越來越多糖尿病并發(fā)癥模型的開發(fā),一些基于模型的評估軟件也逐漸形成,但其推廣性有待進一步提高。其中較為著名的是Hippisley-Cox等[19]在1998年—2014年開展的一項前瞻性隊列研究,研究通過英國Qresearch數(shù)據(jù)庫收集納入了454 575例糖尿病病人的病例信息,構建并驗證了糖尿病病人10年內(nèi)失明和截肢風險的模型,并以此模型開發(fā)了Qdiabetes網(wǎng)頁。糖尿病病人通過在該網(wǎng)頁輸入各項數(shù)據(jù)指標即可得出未來10年內(nèi)失明和截肢的絕對風險值。但該模型僅給出了罹患并發(fā)癥的絕對值而并沒有劃分出高危人群和低危人群的界限,不利于臨床的使用推廣。Eddy等[20]開發(fā)了Archimedes大型糖尿病模型,該模型較為復雜,可以理解為一項由計算機模擬測試人體自然生理學、疾病干預和衛(wèi)生保健的多個過程,現(xiàn)多用于臨床研究與衛(wèi)生系統(tǒng)決策,臨床推廣有限。
由于種族、社會及文化環(huán)境的差異,越來越多的證據(jù)表明,不同國家、地區(qū)和種族糖尿病病人并發(fā)癥風險不盡相同,如與發(fā)達國家相比,發(fā)展中國家糖尿病病人發(fā)生腎臟并發(fā)癥和腦卒中的風險更高,但是發(fā)生心血管疾病的風險較低,照搬其他國家及地區(qū)的2型糖尿病并發(fā)癥預測模型顯然會存在較大偏移[21]。在這種背景下,我國學者們逐步開始探究適合我國病人的糖尿病并發(fā)癥預測模型,并取得一定進展。2006年,李戈等[22]運用人工神經(jīng)網(wǎng)絡的方法,對現(xiàn)有病例進行數(shù)據(jù)挖掘,構建了5種糖尿病并發(fā)癥發(fā)病風險預測模型,可以分別對糖尿病病人的心血管病變、下肢動脈病變、腎臟病變、神經(jīng)病變以及視網(wǎng)膜病變進行風險預測,預測準確率為64.71%~82.35%,其中除糖尿病神經(jīng)病變的預測靈敏度和特異度欠佳,其余并發(fā)癥的風險預測效果良好。這項研究模型具有對數(shù)據(jù)容錯率高、便于操作等優(yōu)點,但研究數(shù)據(jù)體量較小,且僅做了病例資料回顧研究。因此,有可能一定程度上造成預測結果的偏倚。利用大型臨床數(shù)據(jù)進行隨訪追蹤可以得到偏倚較小的模型。香港大學學者Wan等[23]回顧了香港醫(yī)管局2010年137 935例糖尿病病人的病歷資料,通過5年的隨訪,構建了我國2型糖尿病病人心血管疾病的風險預測模型,并顯示出較好的準確度(一致性指數(shù)為0.705)。Miao等[24]使用2013年江蘇省疾病預防控制中心在社區(qū)開展的“糖尿病預防控制綜合研究”項目的數(shù)據(jù),納入了11 771例符合條件的糖尿病病人,通過4年隨訪,使用Cox回歸模型建立了我國糖尿病病人腎病預測模型,經(jīng)檢驗準確度較好。
基于近年來國內(nèi)外對于2型糖尿病并發(fā)癥相關危險因素已有較多的數(shù)據(jù)積累,許多學者嘗試通過二次研究進行模型構建。劉小鈺[25]通過文獻評價搜集截止2016年有關糖尿病并發(fā)癥的相關文獻,對符合條件的文獻進行二次分析,提取2次數(shù)據(jù)并進行危險因素比值比(OR值)的合并,運用Logistic回歸模型建立了糖尿病3種并發(fā)癥的預測模型,并進行了低、中、高風險層次的分級,臨床使用價值較好。但文獻中納入的高質(zhì)量文獻較少,且文獻二次歸納分析中容易造成信息丟失,最終形成模型的可靠性也有待進一步檢驗。隨著大數(shù)據(jù)(big data)時代的來臨以及人工智能(AI)領域的不斷發(fā)展,基于人工智能的數(shù)據(jù)挖掘技術逐漸被運用于糖尿病并發(fā)癥的管理中。我國學者王潔等[26]通過對國家人口與健康科學數(shù)據(jù)共享服務平臺上糖尿病病人的較大真實數(shù)據(jù)集進行基于機器學習的數(shù)據(jù)挖掘,使用Logistic回歸和多層神經(jīng)網(wǎng)絡模型,對2型糖尿病并發(fā)癥進行預測分析。模型采用Python語言編寫,經(jīng)過多次修改訓練參數(shù)及調(diào)整試驗數(shù)據(jù),最終得出訓練模型的最優(yōu)結果,并顯示出較高的準確率。但該研究由于缺乏醫(yī)療團隊的加入,在并發(fā)癥納入的定義上以及納入數(shù)據(jù)的代表性上有所不足,最終導致模型的實用性較低,沒有被臨床投入使用。為了更好地利用大數(shù)據(jù)輔助臨床對糖尿病并發(fā)癥的診斷,崔純純[27]利用機器學習方法,對北京市某醫(yī)院的信息系統(tǒng)進行數(shù)據(jù)處理和挖掘,構建了基于BP神經(jīng)網(wǎng)絡的糖尿病并發(fā)癥預測模型,并將其運用于北京市某醫(yī)院信息管理系統(tǒng)中,完成了對系統(tǒng)的測試,真正實現(xiàn)了運用預測模型在臨床決策中輔助醫(yī)生進行糖尿病并發(fā)癥的診斷和管理。由此可見,通過醫(yī)療、人工智能與大數(shù)據(jù)領域的結合實現(xiàn)糖尿病并發(fā)癥預測是未來發(fā)展的重要趨勢。
綜上所述,目前2型糖尿病并發(fā)癥風險評估模型一般通過前瞻性隊列研究設計或大型臨床數(shù)據(jù)集,隨訪收集臨床數(shù)據(jù),選取合適的數(shù)學統(tǒng)計模型,構建不同并發(fā)癥的預測模型,以此評定2型糖尿病病人各種潛在的并發(fā)癥風險,不僅為病人和家屬提供了客觀的數(shù)據(jù)指標,提升其自我管理的內(nèi)在動力,也為醫(yī)護人員在2型糖尿病病人中發(fā)現(xiàn)高危人群,并開展有針對性的干預提供了依據(jù)。隨著越來越多的研究發(fā)表,基于循證和研究合成的預測模型也開始出現(xiàn),為開發(fā)更具綜合性以及實用性的模型提供了思路。而與大數(shù)據(jù)和人工智能領域的結合無疑是未來糖尿病并發(fā)癥預測模型發(fā)展的熱門方向之一,如何利用大數(shù)據(jù)和人工智能在海量的醫(yī)療數(shù)據(jù)中找到最有診斷價值的信息以及如何在預測模型的實用性與精確度尋求平衡,是亟待學者們解決的問題。
由于各國、各民族文化、習慣和社會環(huán)境等差異的存在,不同國家或地區(qū)在引進或者發(fā)展2型糖尿病預測模型時,首先都應該對其適用性進行驗證,或根據(jù)本地區(qū)人群的特點進行調(diào)整,以建立本土化的2型糖尿病并發(fā)癥風險預測模型。我國糖尿病并發(fā)癥預測模型雖然已有大樣本的回顧分析,但大樣本的前瞻性隊列研究仍然缺乏,涉及2型糖尿病預測模型在臨床的應用較少,且主要集中于臨床的輔助診斷,鮮少用于疾病的早期管理和預警。此外,現(xiàn)有的2型糖尿病并發(fā)癥模型納入的危險和保護因子仍不夠全面,模型的預測準確度和臨床實用性有待進一步發(fā)展。綜上所述,目前我國仍未建立起涵蓋全面、預測效應良好且實用性強的2型糖尿病并發(fā)癥風險預測模型,且模型的應用與推廣較為缺乏,2型糖尿病并發(fā)癥預測模型應加強在疾病早期階段的應用。未來仍需在模型的發(fā)展與應用領域做進一步的研究。