王洪濤 余文華 盛燕
(1天津醫(yī)科大學(xué)腫瘤醫(yī)院醫(yī)務(wù)處 國家腫瘤臨床醫(yī)學(xué)研究中心 天津市腫瘤防治重點(diǎn)實(shí)驗(yàn)室,天津 300000;2 School of Public Health & Preventive Medicine, Monash University;3天津醫(yī)科大學(xué)總醫(yī)院婦產(chǎn)科)
臨床上已經(jīng)試圖通過心電圖(ECG)的 ST-T 異常改變,靜息時(shí)最大心率及血壓、總膽固醇、心絞痛類型等危險(xiǎn)因素進(jìn)行綜合冠心病(CHD)診斷,在提高疾病診斷效率的同時(shí)為病人減少花費(fèi),減輕痛苦〔1〕。ECG 出現(xiàn)持續(xù)性或動(dòng)態(tài) ST-T 改變一直被認(rèn)為是慢性冠狀動(dòng)脈供血不足的重要診斷依據(jù),并作為以往診斷 CHD 的常用依據(jù),但臨床實(shí)際應(yīng)用中以 ECG的ST-T改變?yōu)橐罁?jù)診斷CHD的假陰性率及假陽性率都相對較高,近年有學(xué)者對此提出質(zhì)疑〔2,3〕。眾多前瞻性流行病學(xué)研究證實(shí)靜息心率與CHD的發(fā)病率和死亡率相關(guān)〔4~7〕。本文通過探討靜息心電圖 ST-T 改變及靜息時(shí)心率與CHD嚴(yán)重程度的關(guān)系,并采用數(shù)據(jù)挖掘技術(shù)中的決策樹方法與傳統(tǒng)Logistic回歸方法做比較,尋找影響冠狀動(dòng)脈疾病嚴(yán)重程度的相關(guān)因素為醫(yī)院開展相關(guān)衛(wèi)生技術(shù)評估提供理論依據(jù)。
1.1研究對象 2007年1月至2014年6月在①Cleveland Clinic Foundation(Cleveland.data),②Hungarian Institute of Cardiology, Budapest (Hungarian.data),③V.A. Medical Center, Long Beach, CA (long-beach-va.data),④University Hospital, Zurich, Switzerland (Switzerland.data)醫(yī)院心內(nèi)科住院疑似診斷為CHD并初次進(jìn)行CAG診斷患者,男725例〔年齡(53.79±9.40)歲〕,女193例〔年齡(52.50±9.52)歲〕;CAG陽性508例(CHD組),陰性410例(非CHD組),見表1。
1.2診斷標(biāo)準(zhǔn) 高血壓的診斷采用最新的《中國高血壓指南》,把血壓值分為正常、高血壓1級、2級和3級。同時(shí)檢測患者總膽固醇(TC)、餐后8 h空腹血糖及疼痛發(fā)作時(shí)的臨床表現(xiàn)。心電圖檢測:心電圖儀器為美國GE公司所產(chǎn)出的15導(dǎo)聯(lián)心電圖機(jī),患者在靜息狀態(tài)之下采取平臥姿勢,記錄患者ST段下移及抬高幅度及最高、最低導(dǎo)聯(lián),T波異常狀況,Q 波時(shí)間和幅度及最寬最深的導(dǎo)聯(lián),V1 及 V5 導(dǎo)聯(lián)的電壓變化幅度,心律、心率、電軸傳導(dǎo)阻滯類型及有無左室肥厚等情況。冠狀動(dòng)脈造影:由心內(nèi)科專業(yè)醫(yī)師操作完成,入路途徑為常規(guī)經(jīng)股動(dòng)脈或橈動(dòng)脈途徑。左冠狀動(dòng)脈至少投照4個(gè)體位,右冠狀動(dòng)脈至少投照2個(gè)體位,必要時(shí)加其他體位至冠狀動(dòng)脈各段能夠充分顯示。冠狀動(dòng)脈狹窄直徑≥50%病變累及主要冠狀動(dòng)脈支數(shù)為病變支數(shù),分為0、1、2、3支病變,累及左主干時(shí)以同時(shí)累及左前降支和左回旋支計(jì)算。診斷標(biāo)準(zhǔn)以≥50%狹窄病變累及主要冠狀動(dòng)脈即診斷為CHD。
1.3統(tǒng)計(jì)方法 利用SPSS17.0軟件進(jìn)行t檢驗(yàn)或方差分析,運(yùn)用SAS 9.2企業(yè)數(shù)據(jù)挖掘模塊對數(shù)據(jù)進(jìn)行預(yù)處理,隨機(jī)選取樣本量的67%作為訓(xùn)練集,分別構(gòu)建多因素Logistic回歸(逐步法)分析及CHAID決策樹,其他選項(xiàng)均選擇為默認(rèn)設(shè)置,其余樣本作為驗(yàn)證集驗(yàn)證模型的優(yōu)劣。并通過繪制受試者工作特征(ROC)曲線,比較不同模型ROC曲線下面積(AUC),探討影響CHD的因素并比較2種分類模型的預(yù)測效果。
表1 CHD與非CHD組臨床資料比較(n)
1)數(shù)據(jù)例數(shù)有缺失
2.1靜息心電圖ST-T改變與CHD嚴(yán)重程度的關(guān)系 靜息心電圖ST-T改變診斷CHD的敏感性為65.4%,特異性為44.5%,陽性預(yù)測值為 48.7%,陰性預(yù)測值為61.4%,一致性檢驗(yàn)Kappa值為0.093(P<0.05)。心電圖ST-T改變與CAG(44.66%)診斷的陽性率差異有統(tǒng)計(jì)學(xué)意義(P<0.000 1)。通過病變血管數(shù)量進(jìn)行分層衡量CHD嚴(yán)重程度,探討靜息心電圖ST-T改變與CHD嚴(yán)重程度的關(guān)系,如表2所示,不同CHD嚴(yán)重程度在靜息心電圖ST-T改變率上有統(tǒng)計(jì)學(xué)差異(P=0.028),血管病變數(shù)量越多,出現(xiàn)靜息心電圖ST-T改變的可能性越大。
表2 靜息心電圖狀態(tài)與CHD嚴(yán)重程度關(guān)系(n)
2.2靜息時(shí)最大心率與CHD嚴(yán)重程度的關(guān)系 由表1可以看出,靜息時(shí)最大心率與有無患CHD疾病的差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。0、1、2、3支病變血管CHD患者靜息時(shí)最大心率分別為(140.250 0±22.349 73)、(136.717 4±24.537 19)、(142.151 5±22.803 67)、(130.882 4±16.799 86)次/min,可以看出最大心率在不同CHD血管病變嚴(yán)重程度之間,尚不能發(fā)現(xiàn)差異有統(tǒng)計(jì)學(xué)意義(P=0.205)。
2.3CHD多因素Logistic回歸分析 把所有患者納入分析,以是否患CHD為因變量,以年齡、性別、心絞痛類型、休息時(shí)血壓、總膽固醇等為自變量構(gòu)建Logistic回歸模型,采用逐步回歸法,并對方程式作假設(shè)檢驗(yàn),似然比檢驗(yàn)χ2=361.092,P<0.001,回歸方程成立。表3可見年齡、性別、心絞痛類型、心電圖ST-T改變、最大心率、運(yùn)動(dòng)型心絞痛、ST斜率和病變血管數(shù)量為患CHD的影響因素(P<0.05)。
2.4CHD影響因素決策樹分析 本研究把所有自變量納入后選出對CHD診斷有意義的變量,并按照變量的重要性(Importance)大小排序。結(jié)果發(fā)現(xiàn)決策樹葉子數(shù)為3時(shí)訓(xùn)練集和驗(yàn)證集的錯(cuò)分率迅速下降,當(dāng)葉子數(shù)為8時(shí),訓(xùn)練集錯(cuò)分率達(dá)到最低。決策樹分析顯示,CHD影響因素主要為心絞痛類型(Importance值=1),ST段斜率(Importance值=0.412 7),病變血管數(shù)量(Importance值),運(yùn)動(dòng)型心絞痛(Importance值=0.309 6)和最大心率(Iwfhg=0.161 6)。
2.5兩種判別模型的比較 在通過兩種模型探索CHD影響因素的基礎(chǔ)上,對Logistic回歸模型與CHAID決策樹兩種模型的模擬結(jié)果做比較。如表4和表5所示,兩模型均較好地?cái)M合了數(shù)據(jù)模型,其中以決策樹和回歸模型的錯(cuò)分率分別為:0.209 8和0.245 5。比較模型受試者工作特征(ROC)曲線,回歸模型的ROC曲線下面積(AUC)為0.78,決策樹的AUC為0.82,二者差異有統(tǒng)計(jì)學(xué)意義(t=5.695,P<0.05),說明決策樹模型判別效果比Logistic回歸模型要優(yōu)。
表3 多因素非條件Logistic回歸模型結(jié)果
表4 模型擬合結(jié)果比較
表5 兩種判別模型對訓(xùn)練集和驗(yàn)證集的分類結(jié)果
冠心病發(fā)生多決定于兩個(gè)或兩上以上的危險(xiǎn)因素的協(xié)同作用。鄭凌飛等〔8〕認(rèn)為,CHD的危險(xiǎn)因素主要包括:性別﹑年齡、高血壓、糖尿病、吸煙史及血清、三酰甘油(TG)、總膽固醇(TC)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)等。本研究Logistic回歸顯示,年齡、性別、心絞痛類型、靜息心電圖ST-T改變、靜息時(shí)最大心率、運(yùn)動(dòng)型心絞痛、ST斜率和病變血管數(shù)量為是否患CHD的主要影響因素;決策樹分析也顯示,CHD影響因素主要為心絞痛類型,ST段斜率、病變血管數(shù)量、運(yùn)動(dòng)型心絞痛和靜息時(shí)最大心率。
近年來通過靜息心電圖 ST-T 的改變?yōu)橐罁?jù)診斷CHD一直存在較大的爭議。林繼華等〔9〕認(rèn)為在老年CHD的診斷中,如果用常規(guī)靜息心電圖 ST-T 的改變作為診斷標(biāo)準(zhǔn),其診斷可能會(huì)出現(xiàn)較大偏差。王曉雅等〔10〕發(fā)現(xiàn)對于臨床有典型心絞痛癥狀的患者心電圖持續(xù)性ST-T改變的診斷價(jià)值較高;而當(dāng)患者不具有典型心絞痛的癥狀時(shí),心電圖持續(xù)性 ST-T改變的診斷價(jià)值非常低。本研究也顯示心電圖ST-T的改變與冠狀動(dòng)脈造影在CHD中的診斷陽性率差異顯著,心電圖診斷的敏感性為65.4%,特異性為44.5%,陽性預(yù)測值為 48.7%,陰性預(yù)測值為61.4%。這可能與心電圖記錄的是患者瞬間心電變化情況,獲得的心電信息較少,診斷冠心病敏感性及特異性均較低有關(guān)〔11〕。但本研究也發(fā)現(xiàn)不同CHD嚴(yán)重程度在心電圖ST-T改變率上有統(tǒng)計(jì)學(xué)差異,說明血管病變數(shù)量越多,出現(xiàn)心電圖ST-T改變的可能性越大。因此心電圖在一定程度上是排除CHD診斷的手段,雖然假陽性率比較高,但可以起到一定的指示作用,確診CHD還需要結(jié)合其他檢測結(jié)果和臨床特征進(jìn)行綜合分析。
靜息心率加快不僅與CHD相關(guān),而且還與糖尿病、心力衰竭及高血壓等心血管疾病有關(guān),既是心血管疾病的原因,又是心血管疾病的結(jié)果,但其影響仍然在被臨床醫(yī)生忽視。我們通過分析靜息時(shí)最大心率與CHD嚴(yán)重程度的關(guān)系,認(rèn)為在有無患CHD疾病組間,靜息時(shí)最大心率差異有統(tǒng)計(jì)學(xué)意義,但靜息時(shí)最大心率在不同CHD血管病變嚴(yán)重程度之間,尚不能發(fā)現(xiàn)有統(tǒng)計(jì)學(xué)差異。通過Logistic回歸分析及決策樹分析也顯示靜息時(shí)最大心率是CHD的主要危險(xiǎn)因素之一,這與BRH、Framingham、NHANES及CASS等研究〔5~7〕認(rèn)為心率增快是CHD及心力衰竭的獨(dú)立危險(xiǎn)因素的結(jié)論相吻合。
決策樹是一種經(jīng)典的數(shù)據(jù)挖掘方法之一,對原始數(shù)據(jù)類型要求較低,可以同時(shí)處理分類和連續(xù)變量,且其模型的分類結(jié)果靈敏度、特異度較高,越來越得到臨床分析的認(rèn)可和應(yīng)用。在分類判別分析中,與傳統(tǒng)Logistic回歸相比,決策樹模型的生成過程是通過對大量數(shù)據(jù)進(jìn)行特征抽取處理,對訓(xùn)練集反復(fù)訓(xùn)練分組,據(jù)其規(guī)律建立初始樹,進(jìn)行適當(dāng)?shù)募糁κ怪蔀榉诸愵A(yù)測新的參數(shù)的最佳模型〔12〕。本文結(jié)果認(rèn)為多因素Logistic回歸分析及決策樹方法分析影響冠狀動(dòng)脈疾病嚴(yán)重程度的因素,均較好地?cái)M合了數(shù)據(jù)模型,其中決策樹方法與Logistic回歸方法相比,各項(xiàng)評價(jià)指標(biāo)均優(yōu)于Logistic回歸分析,與相關(guān)報(bào)道一致〔13〕,體現(xiàn)了數(shù)據(jù)挖掘方法相對傳統(tǒng)回歸分析方法的優(yōu)勢。