施亞男,施羽,樊春筍,姚紅玉
南通大學附屬啟東醫(yī)院/啟東市人民醫(yī)院內(nèi)分泌科1、科研科/病因室2,江蘇 南通 226200
20 世紀70 年代末以后的歷次大規(guī)模糖尿病流行病學調(diào)查顯示,我國糖尿病患病率呈現(xiàn)持續(xù)上升趨勢,從1980 年的0.67%上升到2013 年的10.9%[1]。目前、高血糖和糖尿病在我國構(gòu)成了巨大的疾病負擔,糖尿病防控工作任重而道遠[2]。根據(jù)最新一版的中國2型糖尿病防治指南(2017版),在糖尿病患者的血糖監(jiān)測指標中,糖化血紅蛋白(hemoglobin A1c,HbA1c)是評估血糖長期控制狀況的金標準,也是臨床實踐中決定是否需要調(diào)整降糖藥的重要依據(jù)[3]。在實際臨床工作中,糖尿病作為主診斷或其他診斷的患者群體分布在綜合性醫(yī)院的各個科室,這個龐大而混雜的糖尿患者群在住院期間無疑有可能發(fā)生降糖藥治療方案的調(diào)整,調(diào)整必然伴隨著住院日的增加和住院費用的上漲。目前對于因任何疾病住院的糖尿患者群降糖藥調(diào)整關(guān)聯(lián)因素的研究較少,本研究利用既往用作研究糖尿病患者30 d 內(nèi)再入院相關(guān)因素的住院病案大數(shù)據(jù),采用Logistic 回歸分析評估住院期間降糖藥調(diào)整的相關(guān)因素,報道如下:
1.1 一般資料 自UCI的機器學習資源庫(https://archive.ics.uci.edu/ml/datasets.php)下載美國130 家醫(yī)院糖尿病患者的1999—2008年數(shù)據(jù)集,該數(shù)據(jù)集記錄的均是住院患者,住院第一診斷可為任何疾病,但均明確診斷患有糖尿病,住院時間為1~14 d,住院期間均進行了臨床檢驗、藥物治療和(或)手術(shù)治療。該數(shù)據(jù)集共101 766 條記錄,剔除HbA1c 為“None”即HbA1c未檢測的對象共84 748例,剩余具備HbA1c結(jié)果記錄的患者共17 018例。針對研究對象的重復住院記錄,僅保留第一次記錄,剔除后續(xù)住院記錄,剩余研究對象15 388 例。進一步剔除出院狀態(tài)(discharge disposition id)顯示為死亡、臨終關(guān)懷或無記錄的研究對象,最終共有14 339例研究對象進入本次分析。本研究采用的是公共開放數(shù)據(jù),所有研究對象已行去識別化處理,已向啟東市人民醫(yī)院倫理委員會申請倫理豁免并審核通過。
1.2 研究結(jié)局 研究結(jié)局為患者住院期間是否發(fā)生降糖藥治療的調(diào)整改變,對應的研究結(jié)局變量名為“change”,該變量無缺失。在“change”變量基礎(chǔ)上新建結(jié)局變量“outcome”,賦值=0 表示未發(fā)生研究結(jié)局即住院期間降糖藥無調(diào)整,賦值=1表示發(fā)生研究結(jié)局即住院期間降糖藥有調(diào)整,由此形成一個二分類的研究結(jié)局。
1.3 臨床指標 納入分析的臨床指標共14 項,其中屬于離散型數(shù)值變量的有八個,變量中文含義及原始英文名如下:入院診斷數(shù)為number diagnoses,入院化驗項目數(shù)為num lab procedures,入院藥物治療數(shù)為num medication,入院手術(shù)治療數(shù)為num procedure,一年內(nèi)急診就診數(shù)為number emergency,一年內(nèi)門診就診數(shù)為number outpatient,一年內(nèi)住院次數(shù)為number patient,本次住院天數(shù)為time in hospital;屬于連續(xù)型數(shù)值變量或分類變量的有6 個,變量中文含義及原始英文名如下:性別為gender,年齡為age,種族為race,入院來源為admission type id,入院診斷為diag 1、diag 2、diag 3,糖化血紅蛋白為A1Cresult。
1.4 統(tǒng)計學方法 數(shù)據(jù)清理和統(tǒng)計分析全部在SAS 軟件(版本9.4)進行,研究結(jié)局和臨床指標通過Proc Logistic 進入Logistic 回歸模型進行分析。首先是8 個離散型數(shù)值形式的臨床指標單個和一并進入Logistic回歸模型,隨后將8個離散型數(shù)值臨床指標變換成兩分類變量,14個兩分類臨床指標分別單個和一并進入Logistic回歸模型,一并進入Logistic回歸模型時,分別采用向前、向后和逐步法篩選變量并比較結(jié)果。數(shù)值變量用均數(shù)±標準差(±s)和中位數(shù)(四分位數(shù)間距)表示,分類變量用頻數(shù)(構(gòu)成比)表示,用比值比(odds ratio,OR)評估關(guān)聯(lián)強度并計算OR 值點估計的95%置信區(qū)間(confidence interval,CI),P 值=0.05 設(shè)為關(guān)聯(lián)是否有統(tǒng)計學意義的界值。
2.1 離散型數(shù)值臨床特征與降糖藥調(diào)整關(guān)聯(lián)的Logistic 回歸分析 14 339 例住院患者中,共8 067 例(56.26%)在該次住院過程中經(jīng)歷了降糖藥調(diào)整,6 272例(43.74%)則未發(fā)生降糖藥調(diào)整。全部14 個臨床指標中,屬于離散型數(shù)值變量的指標有8個。8個離散型數(shù)值變量指標逐個進入單因素Logistic 回歸模型,除住院次數(shù)外,其余7個指標的OR(95%CI)均大于1,且P值均<0.05,差異有統(tǒng)計學意義;住院次數(shù)的OR點估計大于1,但95%CI經(jīng)過1,P值=0.7516,差異無統(tǒng)計學意義。8 個離散型數(shù)值變量指標一起進入多因素Logistic 回歸模型,向前、向后和逐步篩選模式的結(jié)果相同,其中3 個指標是降糖藥調(diào)整的危險因素,即化驗項目數(shù)、治療藥物數(shù)和急診就診數(shù),2 個指標是降糖藥調(diào)整的保護因素,即手術(shù)治療數(shù)和住院次數(shù);其余3 項指標(入院診斷數(shù)、門診就診數(shù)和住院天數(shù))在進入多因素Logistic 回歸模型后,OR 的95%CI 經(jīng)過1,P 值>0.05,差異無統(tǒng)計學意義。具體OR 值及95%CI 見表1。
表1 臨床特征為離散型數(shù)值變量的住院糖尿病患者控制血糖藥物調(diào)整相關(guān)因素的Logistic回歸分析(n=14 339)
2.2 兩分類臨床變量特征與降糖藥調(diào)整相關(guān)的Logistic回歸分析 將表1中的八個離散型數(shù)值變量轉(zhuǎn)換成兩分類變量后,共有14個兩分類臨床特征進入第二階段的Logistic回歸分析。男性、年齡<60歲、非急診入院、主診斷非心血管疾病、入院診斷數(shù)>6項、入院化驗指標數(shù)>49項、入院藥物使用>14種、既往曾急診就診、住院天數(shù)>7 d、糖化血紅蛋白>7%,在單因素和多因素Logistic回歸中,相對于各自的參考組均為危險因素,即OR值點估計>1,95%CI不經(jīng)過1,P值均<0.05。其中OR值點估計>2 的有入院藥物試用數(shù)和HbA1c。入院藥物使用數(shù)>14 的OR (95%CI)為2.245 (2.075~2.428),HbA1c>7%的OR (95%CI)為2.118 (1.965~2.283)。單因素Logistic回歸中,非白人發(fā)生降糖藥調(diào)整的OR值的95%CI 經(jīng)過1,差異無統(tǒng)計學意義,而在多因素Logistic回歸中,OR值>1,95%CI不經(jīng)過1,差異有統(tǒng)計學意義。而既往有住院史在單因素Logistic回歸中,OR值點估計為危險因素,但差異無統(tǒng)計學意義;而在多因素Logistic回歸中,既往有住院的OR值點估計為保護因素,并差異有統(tǒng)計學意義。有手術(shù)治療史,在單因素Logistic回歸為危險因素,而在多因素Logistic回歸為保護因素,差異均有統(tǒng)計學意義。既往有門診就診史,在單因素Logistic回歸為危險因素,差異有統(tǒng)計學意義,而在多因素Logistic回歸中作為危險因素則差異無統(tǒng)計學意義。上述結(jié)果的具體OR值及95%CI見表2。
表2 臨床特征為兩分類變量的住院糖尿病患者控制血糖藥物調(diào)整相關(guān)因素的Logistic回歸分析(n=14 339)
本研究利用基于醫(yī)院常規(guī)收集病案大數(shù)據(jù)對糖尿患者群因任何疾病住院期間發(fā)生降糖藥調(diào)整的相關(guān)因素進行分析,結(jié)果發(fā)現(xiàn)患者的人口學信息如性別、年齡、種族,入院時及入院期間特征如是否急診入院、主診斷類別、入院診斷數(shù)、化驗數(shù)、藥物數(shù)、手術(shù)數(shù)、住院天數(shù)、入院HbA1c水平以及既往史信息如一年內(nèi)急診就診次數(shù)、住院次數(shù)均與研究結(jié)局即住院期間發(fā)生降糖藥調(diào)整相關(guān)。本研究使用的大數(shù)據(jù)為機器學習領(lǐng)域常用的開放數(shù)據(jù)庫,既往主要用來研究糖尿患者群因任何疾病住院后30 d內(nèi)再入院的相關(guān)因素,因該數(shù)據(jù)集具備完整無缺失的降糖藥調(diào)整信息,故適合用作本次降糖藥調(diào)整相關(guān)因素的分析[4]。
住院糖尿病患者因任何原因住院后,血糖控制不佳無疑是平均住院日增加的一大原因。如能明確糖尿患者群住院期間發(fā)生降糖藥調(diào)整的相關(guān)因素,有利于針對相應的危險因素或保護因素采取個性化的住院前預防或干預措施,進而能夠降低平均住院日及總費用。在本研究確定的降糖藥調(diào)整危險因素中,OR值>2的有藥物使用數(shù)和HbA1c,兩者中更有臨床應用價值的無疑是HbA1c。根據(jù)中國2型糖尿病防治指南(2017 年版)[3],已經(jīng)寫明將HbA1c≥7%作為治療方案調(diào)整的判定標準,并將HbA1c作為評價長期血糖控制情況的金標準。而HbA1c 的檢測往往在非內(nèi)分泌科室被忽視,并且在科室間存在差異[5-6]。在本次分析中主診斷為非心血管疾病是降糖藥調(diào)整的危險因素,或說明入住心血管科的患者有更好的血糖控制方案[7]。本次分析還確認了兩個降糖藥調(diào)整的保護因素,即手術(shù)和既往住院,提示糖尿患者群中的擇期手術(shù)患者和既往住院患者有更好的血糖控制。
原始數(shù)據(jù)集中包含了其他和糖尿病及降糖藥調(diào)整相關(guān)的臨床指標,例如研究對象體質(zhì)量,但體質(zhì)量指標的缺失值過多,故未能納入Logistic回歸模型。在17 018條記錄的數(shù)據(jù)集中,高達97.97%的體質(zhì)量指標缺失,提示筆者在未來的前瞻研究中,需要特別重視身體測量指標的獲得,身高、體質(zhì)量、腰圍、臀圍等指標均需按標準測量。本次分析的一個優(yōu)勢是數(shù)據(jù)集樣本量較大,因此Logistic 回歸結(jié)果受樣本量的影響很小。筆者計算了離散型數(shù)值變量的回歸結(jié)果,后續(xù)全部轉(zhuǎn)換為兩分類變量,主要是出于方便結(jié)果進行臨床解釋的需要,而離散型數(shù)值變量如何兼顧統(tǒng)計學指標和實際臨床應用轉(zhuǎn)換成兩分類變量,值得進行進一步的探索和驗證[8]。
盡管HbA1c的檢測精度、控制標準等方面還存在不足和爭議[9-11],本次分析得出的高HbA1c 是住院期間降糖藥調(diào)整的獨立危險因素,提示入院前患者的HbA1c檢測率需進一步提高,以確保糖尿病患者的入院前確診,并利用已建成的基于門診的糖尿病標準化管理中心等平臺,將糖尿患者群的血糖在入院前便控制到較為理想的狀態(tài),減少住院期間降糖藥調(diào)整,利于患者主要疾病的診治和康復,并有望降低平均住院日,提升醫(yī)療機構(gòu)的運行效率。